KR20080036577A - 코드된 라이브러리를 합성하는 방법 - Google Patents
코드된 라이브러리를 합성하는 방법 Download PDFInfo
- Publication number
- KR20080036577A KR20080036577A KR1020087000511A KR20087000511A KR20080036577A KR 20080036577 A KR20080036577 A KR 20080036577A KR 1020087000511 A KR1020087000511 A KR 1020087000511A KR 20087000511 A KR20087000511 A KR 20087000511A KR 20080036577 A KR20080036577 A KR 20080036577A
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- artificial sequence
- synthetic construct
- group
- oligonucleotide
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07B—GENERAL METHODS OF ORGANIC CHEMISTRY; APPARATUS THEREFOR
- C07B61/00—Other general methods
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Steroid Compounds (AREA)
- Low-Molecular Organic Synthesis Reactions Using Catalysts (AREA)
- Saccharide Compounds (AREA)
- Compounds Of Unknown Constitution (AREA)
- Polyurethanes Or Polyureas (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
- Nitrogen Condensed Heterocyclic Rings (AREA)
Abstract
Description
관련 출원
본 출원은 2003 년 12 월 17 일 출원된 미국 예비 특허 출원 일련 번호 제 60/530,854 호 ; 2004 년 1 월 30 일 출원된 미국 예비 특허 출원 일련 번호 제 60/540,681 호 ; 2004 년 3 월 15 일 출원된 미국 예비 특허 출원 일련 번호 제 60/553,715 호 ; 및 2004 년 7 월 16 일 출원된 미국 예비 특허 출원 일련 번호 제 60/588,672 호와 관련있는 현재 계류중인 2004 년 12 월 17 일 출원된 미국 특허 출원 제 11/015,458 호의 부분 연속 출원이다. 본 출원은 또한 2005 년 6 월 9 일 출원된 미국 예비 특허 출원 일련 번호 제 60/689,466 호 및 2005 년 10 월 28 일 출원된 미국 예비 특허 출원 일련 번호 제 60/731,041 호에 대해 우선권을 주장한다. 상기 출원들의 전체 내용이 참고문헌으로 인용되었다.
유용한 생물학적 활성을 갖는 화합물을 규명하는 보다 효과적인 방법에 대한 연구가 진행되어 엄청난 수의 개별 화합물들을 선별하는 방법 들이 개발되었으며, 조합 라이브러리(combinational library)로 불리는 컬렉션으로 제공되어 있다. 이러한 라이브러리들은 105 이상의 개별 화합물들을 포함한다. 조합 라이브러리를 생성하는 다양한 방법들이 있으며 펩티드, 펩티드 유사체(peptidomimetic) 및 작은 유기 분자들의 조합적인 합성법이 보고되고 있다.
신약 개발에 조합적인 접근을 이용함에 있어서 두 가지 주요한 문제는 충분한 복잡성을 갖는 라이브러리의 합성과 사용된 스크린에서 활성을 보이는 분자의 확인이다. 일반적으로, 라이브러리의 복잡성이 클수록, 즉, 라이브러리 내 존재하는 개별 구조의 수가 많을수록, 해당 라이브러리가 중요한 활성을 갖는 분자를 가질 확률이 커진다. 따라서, 라이브러리 합성에 관여한 화학작용은 적당한 시간 프레임 안에 많은 수의 화합물을 생성할 수 있을 것이다. 그러나, 주어진 규정 또는 전체 농도의 경우, 라이브러리 내의 개별 구성요소를 증가시키는 것은 임의의 특정 라이브러리 구성요소의 농도를 저하시킨다. 이는 복잡성이 큰 라이브러리로부터 활성 분자를 확인하는 것을 어렵게 만든다.
이러한 단점을 극복하려는 시도로서, 코드된 라이브러리, 특히 각각의 화합물이 증폭된 표지를 갖는 라이브러리를 개발하였다. 이들 라이브러리는 DNA 코드된 라이브러리를 가지며, 이때, 라이브러리 구성요소를 확인하는 DNA 표지는 폴리머라제 연쇄 반응과 같은 분자 생물학 기술을 이용하여 증폭시킬 수 있다. 그러나, 이처럼 거대한 라이브러리를 생성하는 방법을 사용하는 것은 논증이 필요하며, 신약 개발을 위한 이러한 시도의 가능성을 현실화하기 위해서는 이들 라이브러리의 생성 방법이 반드시 개선되어야 한다.
발명의 요약
본 발명은 코드된 올리고누클레오티드 표지를 갖는 분자들의 라이브러리를 합성하는 방법을 제공한다. 본 발명의 방법은 코드된 올리고누클레오티드에 결합된 제 1 빌딩 블록을 갖는 개시제를 포함하는 용액이 여러 분획으로 분할되는 (스플릿) 및 풀(split and pool) 전략을 이용한다. 각각의 분획에서, 개시제는 제 2 의 특정 빌딩 블록 및 상기 제 2 특정 빌딩 블록을 확인하는 제 2 의 특정 올리고누클레오티드와 반응한다. 이러한 반응들은 동시 또는 순차적으로 진행되며, 순차적일 경우에는 하나의 반응이 다른 반응을 앞설 수 있다. 각각의 분획에서 생성된 이합체 분자들은 합쳐지고(풀), 다시 여러 분획으로 분할된다. 이어서, 각각의 분획들은 제 3 의 특정 (분획 특이성) 빌딩 블록 및 상기 빌딩 블록을 코드하는 제 3 특정 올리고누클레오티드와 반응한다. 생성물 라이브러리 내 존재하는 특정 분자의 수는 (1) 합성 각 단계에 사용되는 서로 다른 빌딩 블록의 수 및 (2) 합하고 분할시키는 과정이 반복되는 횟수의 함수이다.
한 실시 양태에서, 본 발명은 코드된 올리고누클레오티드에 효과적으로 결합된 작용 성분을 포함하는 또는 상기 작용 성분으로 이루어진 분자를 합성하는 방법을 제공한다. 본 발명의 방법은 (1) n 개의 빌딩 블록을 포함하고, 하나 이상의 반응성 기를 포함하며 개시 올리고누클레오티드에 효과적으로 결합된 작용 성분으로 이루어진 개시 화합물(상기에서 n 은 1 이상의 정수이다)을 제공하는 단계 ; (2) 상기 개시 화합물과 단계 (1) 의 반응성 기에 상보적인 하나 이상의 상보적 반응성 기를 포함하는 빌딩 블록을 상기 반응성 기와 상기 상보적 반응성 기의 반응에 적합한 조건 하에 반응시키는 단계 ; (3) 상기 개시 올리고누클레오티드와 단계 (b) 의 빌딩 블록을 확인하는 도입(incoming) 올리고누클레오티드를 상기 개시 올리고누클레오티드와 도입 올리고누클레오티드의 결합을 촉매하는 효소 존재 하에 올리고누클레오티드와 개시 올리고누클레오티드의 결합에 적합한 조건에서 반응시켜 코드된 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분을 포함하는 또는 상기 작용 성분으로 이루어진 분자를 생성하는 단계를 포함한다. 만일 단계 (3) 의 작용 성분이 반응성 기를 포함한다면, 1-3 단계를 1 회 이상 반복하여 고리 1 내지 i 를 형성하며(상기에서 i 는 2 이상의 정수이다), 사이 클 s 의 단계 (3) 의 생성물은 사이클 s+1 의 개시 화합물이 된다(상기에서 s 는 i-1 또는 그 미만의 정수이다).
한 실시 양태에서, 본 발명은 작용 성분 구조를 확인하는 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록을 포함하는 작용 성분을 포함하는 화합물의 라이브러리를 합성하는 방법을 제공한다. 본 발명의 방법은 (1) n 개의 빌딩 블록을 포함하고(상기에서 n 은 1 이상의 정수이다) 상기 n 개의 빌딩 블록을 확인하는 개시 올리고누클레오티드에 효과적으로 결합된 작용 성분으로 이루어진 m 개의 개시 화합물(상기에서 m 은 1 이상의 정수이다)을 포함하는 용액을 제공하는 단계 ; (2) 단계 (1) 의 용액을 r 개의 분획으로 분할하는 단계(상기에서 r 은 2 이상의 정수이다) ; (3) 상기 각 분획 내 개시 올리고누클레오티드와 r 개의 빌딩 블록 중 하나를 반응시켜 개시 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분으로 이루어진 화합물을 포함하는 r 개의 분획을 생성하는 단계 ; (4) 상기 각 분획 내 개시 올리고누클레오티드와 r 개의 특정 도입 올리고누클레오티드 세트 중 하나를 상기 도입 올리고누클레오티드와 개시 올리고누클레오티드의 결합을 촉매하는 효소 존재 하에 상기 도입 올리고누클레오티드와 상기 개시 올리고누클레오티드의 효소적 결합에 적합한 조건에서 반응시켜 n+1 개의 빌딩 블록을 코드하는 연장된 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분으로 이루어진 분자를 포함하는 r 개의 분획을 생성하는 단계를 포함한다. 임의로, 상기 방법은 단계 (4) 에서 생성된 r 개의 분획을 재조합시키는 단계 (5) 를 더 포함할 수 있다. 단계 (1) 에서 (5) 를 1 회 이상 수행하여 고리 1 내지 i 를 만들 수 있다(i 는 2 이상의 정수이다). 사이클 s+1 에서(상기에서 i 는 2 이상의 정수이다), 단계 (1) 의 m 개 개시 화합물을 포함하는 용액이 사이클 s 의 단계 (5) 의 용액이다. 마찬가지로, 사이클 s+1 의 단계 (1) 의 개시 화합물은 사이클 s 의 단계 (5) 의 화합물이다.
바람직한 실시 양태에서, 빌딩 블록은 통상적인 화학 반응을 이용하여 각 단계에서 결합시킨다. 빌딩 블록을 결합시키면 펩티드 유사체 및 펩토이드와 같은 선형 또는 분지형 중합체 또는 올리고머, 또는 하나 이상의 부가적 화학 잔기가 결합된 스캐폴드 구조를 포함하는 분자와 같은 비올리고머 분자를 생성할 수 있다. 예를 들면, 빌딩 블록이 아미노산 잔기일 경우, 빌딩 블록은 해당 분야에 공지된 적합한 보호/탈보호 전략을 이용하는 용액상 또는 고체상 합성법과 같은 표준 펩티드 합성법을 이용하여 결합시킬 수 있다. 바람직한 것은 용액상 화학반응을 이용하여 결합시키는 것이다. 코드된 올리고누클레오티드는 단일 가닥(single stranded) 또는 이중 가닥(double stranded) 올리고누클레오티드이며, 이중 가닥 올리고누클레오티드가 바람직하다. 코드 된 올리고누클레오티드는 빌딩 블록 당 4 내지 12 개의 염기들 또는 염기쌍을 갖는 올리고누클레오티드가 바람직하며, 코드된 올리고누클레오티드는 표준 용액상 또는 고체상 올리고누클레오티드 합성 방법을 이용하여 결합시킬 수 있지만 용액상 효소 방법을 이용하여 결합시키는 것이 바람직하다. 예를 들면, 올리고누클레오티드는 토포아이소머라제 (topoisomerase), 리가제(ligase) 또는 DNA 폴리머라제를 이용하여 결합시킬 수 있는데, 이때 코드된 올리고누클레오티드의 서열은 이들 효소 중 하나에 의한 결합에 적합한 개시 서열을 포함해야 한다. 코드된 올리고누클레오티드의 효소적 결합은 (1) 표준 합성(비효소) 결합에 비해 첨가반응이 보다 정확하고 (2) 간단한 보호/탈보호 전략을 사용하는 이점을 제공한다.
다른 양태에서, 본 발명은 하기 화학식 I 의 화합물을 제공한다 :
이 식에서, X 는 하나 이상의 빌딩 블록을 포함하는 작용 성분이고 ; Z 는 B 의 3' 말단에 결합된 올리고누클레오티드이고 ; Y 는 C 의 5' 말단에 결합된 올리고누클레오티드이고 ; A 는 X 와 공유결합을 형성하는 작용 성분이고 ; B 는 Z 의 3' 말단과 결합을 형성하는 작용 성분이고 ; C 는 Y 의 5' 말단과 결합을 형성하는 작용 성분이고 ; D, F 및 E 는 각각 독립적으로 이작용기성 결합기(bifunctional linking group)이며 ; S 는 원자 또는 분자 스캐폴드이다. 이러한 화합물은 본 발명의 방법을 사용하여 합성된 화합물을 포함한다.
본 발명은 또한 작용 성분의 구조를 코드하는 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록을 포함하는 작용 성분을 포함하는 화합물을 포함하는 화합물 라이브러리에 관한 것이다. 이 라이브러리는 약 102 내지 약 1012 이상의 특정 구성요소, 예를 들면 102, 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012 이상의 개별 구성요소 즉, 개별 분자 구조를 포함할 수 있다.
한 실시 양태에서, 본 발명의 화합물 라이브러리는 각각 독립적으로 하기 화학식 I 인 화합물들을 포함한다 : 화학식 I 이 식에서, X 는 하나 이상의 빌딩 블록을 포함하는 작용 성분이고 ; Z 는 B 의 3' 말단에 결합된 올리고누클레오티드이고 ; Y 는 C 의 5' 말단에 결합된 올리고누클레오티드이고 ; A 는 X 와 공유결합을 형성하는 작용 성분이고 ; B 는 Z 의 3' 말단과 결합을 형성하는 작용 성분이고 ; C 는 Y 의 5' 말단과 결합을 형성하는 작용 성분이고 ; D, F 및 E 는 각각 독립적으로 이작용기성 결합기이며 ; S 는 원자 또는 분자 스캐폴드이다. 이러한 화합물은 본 발명의 방법을 사용하여 합성된 화합물을 포함한다.
다른 양태에서, 본 발명은 (a) 생물학적 표적과, 작용 성분의 구조를 코드하는 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록을 포함하는 작용 성분을 갖는 화합물들을 포함하는 본 발명의 화합물 라이브러리를 접촉시키는 단계를 포함하는 생물학적 표적에 결합된 화합물을 확인하는 방법을 제공한다. 이 단계는 화합물 라이브러리의 하나 이상의 구성요소를 표적에 결합시키는데 적합한 조건 하에서 수행하고 ; 본 발명의 방법은 또한 (2) 표적에 결합되지 않은 라이브러리 구성요소를 제공하는 단계 ; (3) 표적에 결합된 화합물 라이브러리의 하나 이상의 구성요소의 코드된 올리고누클레오티드를 증폭시키는 단계 ; (4) 단계 (3) 의 코드된 올리고누클레오티드의 서열을 결정하는 단계 ; 및 (5) 단계 (4) 에서 결정된 서열을 이용하여 생물학적 표적에 결합된 화합물 라이브러리의 구성요소의 작용 성분 구조를 측정하는 단계를 포함한다.
본 발명은 원하는 특성을 갖는 분자를 확인하는데 몇가지 장점을 제공한다. 예를 들면, 본 발명의 방법은 올리고누클레오티드 표지 존재 하에 분자를 구성할 때 일정 범위의 화학 반응을 사용가능하게 한다. 본 발명의 방법은 또한 그렇게 생성된 화학 구조에 올리고누클레오티드 표지를 혼입함에 있어서 높은 충실도를 제공한다. 그 밖에도, 본 발명의 방법에 의하면 각각의 구성요소에 대해 많은 수의 복제물을 갖는 라이브러리를 합성할 수 있으며, 따라서 마지막으로 올리고누 클레오티드 표지를 증폭시키고 서열을 결정한 후에도 충분한 수의 분자를 남기면서 생물학적 표적에 대해 여러 번 선택할 수 있다.
도 1 은 도입 올리고누클레오티드의 돌출부(overhang)에 상보적인 돌출부를 갖는 이중 가닥 개시 올리고누클레오티드의 결합을 개략적으로 도시한 것이다. 개시 올리고누클레오티드 가닥은 유리된 상태이거나, 아미노헥실 링커에 결합되어 있거나 아미노헥실 링커를 통해 페닐알라닌 잔기에 결합된 상태로 도시되어 있다.
도 2 는 스플린트(splint) 가닥을 이용하는 올리고누클레오티드 결합을 개략적으로 도시한 것이다. 이 실시 양태에서, 스플린트는 단일 가닥 개시 올리고누클레오티드 및 단일 가닥 도입 올리고누클레오티드에 상보적인 서열을 갖는 12 합체(12-mer) 올리고누클레오티드이다.
도 3 은 개시 올리고누클레오티드가 가닥들이 공유결합으로 연결된 이중 가닥이고, 도입 올리고누클레오티드가 이중 가닥일 때 개시 올리고누클레오티드와 도입 올리고누클레오티드의 결합을 개략적으로 도시한 것이다.
도 4 는 폴리머라제를 이용한 올리고누클레오티드 연장법을 개략적으로 도시한 것이다. 개시 가닥은 유리된 상태이거나, 아미노헥실 링커에 결합되어 있거나, 아미노헥실 링커를 통해 페닐알라닌 잔기에 결합된 상태로 도시되어 있다.
도 5 는 본 발명의 한 실시 양태의 합성을 개략적으로 도시한 것이다.
도 6 은 본 발명의 라이브러리를 사용하여 여러번 선택하는 방법을 개략적으로 도시한 것이다.
도 7 은 실시예 1 에 기재된 사이클 1 에서 5 의 각각의 생성물과 폐쇄 프라이머의 결합 후 겔 전기영동을 실시하여 얻은 결과를 도시한 것이다. 분자량 표준이 1 레인에 도시되어 있고, DNA 정량을 위한 하이퍼래더(hyper-ladder)의 지시량은 9 에서 12 레인에 도시되어 있다.
도 8 은 아지드-알킨 고리화첨가반응(cycloaddition)을 이용한 빌딩 블록의 결합을 개략적으로 도시한 것이다.
도 9 및 도 10 은 염소 첨가 트리아진에 친핵성 방향족 치환반응을 통해 빌딩 블록을 결합시키는 예를 도시한 것이다.
도 11 은 작용 성분의 합성에 사용하기 적합한 대표적인 염소 첨가 헤테로방향족 구조를 도시한 것이다.
도 12 는 아지드/알킨 고리화첨가반응을 이용하는 선형 펩티드의 고리화 반응을 예시한 것이다.
도 13A 는 사이클 4 이후 실시예 2 에 기재된 바와 같이 생성된 라이브러리의 크로마토그램을 도시한 것이다.
도 13B 는 사이클 4 이후 실시예 2 에 기재된 바와 같이 생성된 라이브러리의 질량 스펙트럼을 도시한 것이다.
본 발명은 화합물 및 조합 화합물 라이브러리를 생성하는 방법, 상기 방법에 의해 생성된 화합물 및 상기 라이브러리를 사용하여 원하는 생물학적 활성과 같이 원하는 특성을 갖는 화합물을 확인하는 방법에 관한 것이다. 본 발명은 또한 상기 방법을 이용하여 확인된 화합물에 관한 것이다.
조합 화합물 라이브러리를 생성하고 선별하기 위해 다양한 접근을 시도하였다. 예로 단일 화합물을 여러 반응 용기 각각에서 합성했을 때와 같이, 라이브러리의 개개의 구성요소들을 서로 물리적으로 분리하는 방법을 포함한다. 그러나, 이들 라이브러리들은 일반적으로 한번에 1 개 화합물을 선별하거나, 대체로 1 회에 몇몇 화합물만을 선별하며, 따라서 가장 효율적인 선별 방법은 아니다. 다른 방법으로, 화합물들을 고체 지지체 상에서 합성한다. 이러한 고체 지지체로는 칩이 있으며, 특정 화합물이 칩 또는 막의 특정 영역을 차지한다("위치를 지정 할 수 있다"). 또다른 방법으로, 화합물을 비드 상에서 합성할 수 있으며, 각각의 비드는 서로 다른 화학 구조를 갖는다.
대형 라이브러리를 선별함에 있어서, 두 가지 어려움이 있는데 (1) 선별할 수 있는 개별 화합물의 수와 (2) 스크린에서 활성을 보이는 화합물을 확인하는 것이다. 한가지 방법으로는, 최초의 라이브러리를 보다 작은 분획 및 하위 분획으로 좁혀 스크린에서 활성을 보이는 화합물을 확인하는 것으로, 각각의 경우, 활성 화합물을 함유한 분획 또는 하위 분획을 선택하고 추가로 하위 세트의 모든 구성요소가 개별적으로 합성될 수 있고 원하는 활성을 가질 수 있을 만큼 충분히 작은 화합물 세트를 함유한 활성 하위 분획을 얻을 때까지 분할한다. 이는 비효율적이며 시간을 소비하는 것이다.
조합 라이브러리 선별 결과를 해석하는 다른 방법은 라이브러리를 사용하는 것으로, 라이브러리 구성요소를 확인 라벨로 표지하는데, 즉, 라이브러리 내에 존재하는 각각의 라벨이 라이브러리 내에 존재하는 개별 화합물 구조와 관련이 있어서, 라벨을 확인하면 표지된 분자의 구조를 알 수 있다. 표지된 라이브러리를 이용한 것들 중 기재한 바와 같이 올리고누클레오티드 표지를 사용한 것에는 예를 들면, 미국 특허 제 5,573,905 호 ; 제 5,708,153 호, 제 5,723,598 호, 제 6,060,596 호, PCT 출원 공개 제 WO 93/06121 호, 제 WO 93/20242 호, 제 WO 94/13623 호, 제 WO 00/23458 호, 제 WO 02/074929 호 및 제 WO 02/103008 호, 및 Brenner 및 Lerner 의 문헌 Proc. Natl. Acad. Sci. USA 89, 5381-5383 (1992) ; Nielsen 및 Janda 의 문헌 Methods : A companion to Methods in Enzymology 6, 361-371 (1994) ; 및 Nielsen, Brenner 및 Janda 의 문헌 J. Am. Chem. Soc. 115, 9812-9813 (1993) 이 있으며, 상기 문헌들 각각은 그 전문이 본원에 참고문헌으로 인용되었다. 예를 들면, 폴리머라제 연쇄 반응을 사용하여 표지를 증폭시킴으로써 많은 표지의 복사본을 생성하고 서열화하여 표지를 확인할 수 있다. 표지의 서열은 순수 형태로 합성할 수 있고 검사할 수 있는 결합 분자의 구조를 확인시켜준다. 본 발명은 작용 성분을 용액상 합성 방법을 사용하여 합성하는 DNA-코드된 분자의 대형 라이브러리(구성요소 105 이상)의 첫 번째 예 뿐만 아니라 DNA-코드된 라이브러리를 생성하는 방법에 있어서 개선점을 제공한다.
본 발명은 올리고누클레오티드-코드된 조합 라이브러리의 합성을 용이하게 하고, 올리고누클레오티드 표지를 엄청난 수의 분자 각각에 결합시키는 효율적이고 높은 신뢰도를 부여하는 방법을 제공한다.
본 발명의 방법은 빌딩 블록으로 이루어진 제 1 성분("작용 성분") 및 상기 제 1 성분에 효과적으로 결합되며, 제 1 잔기의 구조를 확인하는 올리고누클레오티드 표지, 즉 빌딩 블록이 연결된 순서 뿐만 아니라, 어느 빌딩 블록이 제 1 성분의 구성에 사용되는지를 나타내는 올리고누클레오티드 표지를 포함하는 제 2 성분을 포함하는 이작용기성 분자를 합성하는 방법을 포함한다. 일반적으로, 올리고누클레오티드 표지에 의해 제공되는 정보는 활성 잔기를 구성하는 데 사용되는 빌딩 블록을 결정하기에 충분하다. 펩티드 잔기, 아미노산 서열과 같이, 특정 실시 양태에서는, 올리고누클레오티드 표지의 서열이 작용 성분 내 빌딩 블록의 배치를 결정하는데 충분하다.
본원에 사용된 용어 "작용 성분(functional moiety)" 은 하나 이상의 빌딩 블록을 포함하는 화학적 성분을 나타낸다. 작용 성분의 빌딩 블록은 핵산이 아닌 것이 바람직하다. 작용 성분은 선형 또는 분지형 또는 고리형 중합체 또는 올리고머 또는 작은 유기 분자일 수 있다.
본원에 사용된 용어 "빌딩 블록(building block)"은 다른 화학 구조 단위에 연결되거나 그런 다른 단위에 연결될 수 있는 화학 구조 단위이다. 작용 성분이 중합체거나 올리고머일 경우, 빌딩 블록은 중합체 또는 올리고머의 단량체 단위이다. 빌딩 블록은 또한 하나 이상의 추가 구조 주변 빌딩 블록("peripheral building block")이 결합된 또는 결합될 수 있는 스캐폴드 구조["스캐폴드 구성 블록 (scaffold building block)"]를 포함할 수 있다.
본원에 사용된 용어 "빌딩 블록" 은 작용 성분 및 작용 성분의 합성에 사용되는 반응성 형태에 존재하는 화학 구조 자체를 나타내는 것으로 이해해야 한다. 작용 성분 내에서, 빌딩 블록은 빌딩 블록을 작용 성분에 결합시킨 결과 손실되는 특정 부분없이 존재할 것이다. 예를 들면, 결합 형성 반응으로 작은 분자가 생성된 경우(아래 참조), 작용 성분에 존재하는 빌딩 블록은 "빌딩 블록 잔기", 즉, 이탈된 분자에 기여한 원자를 유실한 후 합성에 사용된 빌딩 블록의 나머지 잔기이다.
빌딩 블록은 임의의 상보적인 화학적 화합물일 수 있으며, 따라서, 빌딩 블록은 서로 반응하여 2 개 이상의 빌딩 블록을 포함하는 구조를 형성할 수 있어야 한다. 일반적으로, 사용된 빌딩 블록들은 모두 2 개 이상의 반응성 기를 갖는다. 그러나 몇몇 빌딩 블록(예를 들면, 올리고머 작용 성분의 마지막 빌딩 블록)은 오직 하나의 반응성 기만을 가질 수도 있다. 2 개의 서로 다른 빌딩 블록 상의 반응성 기들은 상보적이어야 하며, 즉, 서로 반응하여 공유결합을 형성할 수 있어야 하며, 이때 물, HCl, HF 등과 같은 작은 분자의 유실이 수반될 수 있다.
현 목적 하에, 서로 반응하여 공유 결합을 형성할 수 있다면, 2 개의 반응성 기는 상보적이다. 바람직한 양태에서는, 주변 조건 하에서 결합 형성 반응이 실질적인 부산물의 형성 없이 빠르게 일어난다. 주어진 반응성 기가 주어진 상보적 반응성 기와 정확히 한 번 반응하는 것이 바람직하다. 한 실시 양태에서는, 한 쌍의 상보적 반응성 기 중 하나가 친전자성 기이고, 다른 하나가 친핵성 기이다.
상보적 친전자성 및 친핵성 기는 적합한 조건 하에서 친핵성 치환반응을 하여 공유 결합을 형성하는 2 개의 기를 포함한다. 여러가지 적합한 결합 형성 반응이 당 분야에 공지되어 있다. 예를 들면, March 의 문헌 Advanced Organic Chemistry, fourth edition, New York : John Wiley and Sons (1992), Chapters 10-16 ; Carey 및 Sundberg 의 문헌, Advanced Organic Chemistry, Part B Plenum (1990), Chapters 1-11 ; 및 Collman 등의 문헌, Principles and Applications of Organotransition metal Chemistry, University Science Books, Mill Valley, Calif. (1987), Chapters 13-20 이 있다. 상기 문헌은 각각 그 전문이 본원의 참고문헌으로 인용되었다. 적합한 친전자성 기의 예로는 아실 클로라이드기, 카르보닐 펜타플루오로페닐 에스테르 및 숙신이미드 에스테르기를 비롯한 에스테르기, 케톤기 및 알데히드기와 같은 반응성 카르보닐기 ; 술포닐 클로라이드기와 같은 반응성 술포닐기 및 반응성 포스포닐기가 있다. 다른 친전자성 기는 에폭시드기, 이소시아네이트기 및 알킬 할라이드기가 포함된다. 적합한 친핵성 기는 1 차 및 2 차 아미노기 히드록실기 및 카르복실기를 포함한다.
적합한 상보적 반응성 기는 이후에 기재할 것이다. 당 분야의 숙련자라면 본 발명의 방법에 사용될 수 있는 다른 반응성 기를 쉽게 결정할 수 있을 것이며, 본원에 제공된 예들에 제한되지 않음을 이해할 것이다.
제 1 실시 양태에 따르면, 상보적 반응성 기는 활성화 카르복실기, 반응성 술포닐기 또는 반응성 포스포닐기 또는 이들의 혼합물 및 1 차 또는 2 차 아미노기를 포함한다. 이 실시 양태에서는, 상보적 반응성 기를 적합한 조건 하에 반응시켜 아미드, 술폰아미드 또는 포스폰아미데이트 결합을 형성한다.
제 2 실시 양태에 따르면, 상보적 반응성 기는 에폭시드기 및 1 차 또는 2 차 아미노기를 포함한다. 에폭시드-함유 빌딩 블록은 아민-함유 빌딩 블록과 적합한 조건 하에 반응하여 탄소-질소 결합을 형성함으로써 베타-아미노 알콜을 생성한다.
다른 실시 양태에서는, 상보적 반응성 기가 아지리딘기 및 1 차 또는 2 차 아미노기를 포함한다. 적합한 조건 하에 아지리딘-함유 빌딩 블록과 아민-함유 빌딩 블록을 반응시켜 탄소-질소 결합을 형성함으로써 12-디아민을 생성한다. 제 3 실시 양태에서는, 상보적 반응성 기가 이소시아네이트기 및 1 차 또는 2 차 아미노기를 포함한다. 이소시아네이트-함유 빌딩 블록이 아미노-함유 빌딩 블록과 적합한 조건 하에 반응하여 탄소-질소 결합을 형성함으로써 우레아기를 생성한다.
제 4 실시 양태에서는, 상보적 반응성 기가 이소시아네이트기 및 히드록실기를 포함한다. 이소시아네이트-함유 빌딩 블록이 히드록실-함유 빌딩 블록과 적합한 조건 하에 반응하여 탄소-산소 결합을 형성함으로써 카르바메이트기를 생성한다.
제 5 실시 양태에서는, 상보적 반응성 기가 아미노기 및 알데히드 또는 케톤기와 같은 카르보닐-함유기를 포함한다. 아민이 환원아민화반응을 통해 상기 기와 반응함으로써 새로운 탄소-질소 결합을 형성한다.
제 6 실시 양태에서는, 상보적 반응성 기가 3 가 인 일리드기 및 알데히드 또는 케톤기를 포함한다. 3 가 인 일리드 함유 빌딩 블록이 적합한 조건 하에 알데히드 또는 케톤-함유 빌딩 블록과 반응하여 탄소-탄소 이중 결합을 형성함으로써 알켄을 생성한다.
제 7 실시 양태에서는, 상보적 반응성 기들이 고리화첨가반응에 의해 반응하여 고리 구조를 형성한다. 이러한 상보적 반응성 기의 예로는 알킨 및 유기 아지드가 있으며, 이들은 적합한 조건 하에 반응하여 트리아졸 고리 구조를 형성한다. 이 반응을 이용하여 두 개의 빌딩 블록을 연결시키는 예가 도 8 에 도시되어 있다. 이들 반응에 적합한 조건은 당 분야에 공지되어 있으며, 제 WO 03/101972 호에 개시된 것을 포함한다(상기 문헌은 전문이 본원에 참고문헌으로 인용되었다).
제 8 실시 양태에서, 상보적 반응성 기는 알킬할라이드 및 아미노기, 히드록실기 또는 카르복실기와 같은 친핵성 기이다. 이러한 기들은 적합한 조건 하에 반응하여 탄소-질소(알킬 할라이드 + 아민) 또는 탄소-산소(알킬 할라이드 + 카르복실기)를 형성한다.
제 9 실시 양태에서는, 상보적 작용기는 할로겐화 헤테로방향족기 및 친핵성 기이며, 빌딩 블록들은 적합한 조건 하에 방향족 친핵성 치환반응에 의해 결합된다. 적합한 할로겐화 헤테로방향족기로는 염소화 피리미딘, 트리아진 및 퓨린이 있으며, 이들은 아민과 같은 친핵성 기와 온화한 조건 하에 수용액 중에서 반응한다. 올리고누클레오티드 표지 트리클로로트리아진과 아민의 반응의 대표적인 예가 도 9 및 도 10 에 도시되어 있다. 적합한 염소화 헤테로방향족기의 예가 도 11 에 도시되어 있다.
본 발명의 분자 및 라이브러리의 합성에서 빌딩 블록을 연결시키는 데 사용될 수 있는 부가적인 결합-형성 반응으로 이후 도시되는 것들이 있다. 이후 도시된 반응들은 반응성 작용 성분을 강조하였다. 다양한 치환체가 반응물에 존재할 수 있으며, 이들은 R1, R2, R3 및 R4 로 표시하였다. 치환될 수 있는 가능한 위치들이 R1, R2, R3 및 R4 로 표시된 것들이지만 이에 제한되지 않는다. 이들 치환체들은 임의의 적합한 화학 성분을 포함하지만, 제시된 반응을 저해하거나 현저히 억제하지 않는 것들로 제한하는 것이 바람직하며, 달리 명시하지 않는다면, 수소, 알킬, 치환 알킬, 아릴, 치환 아릴, 헤테로아릴, 치환 헤테로아릴, 알콕시, 아릴옥시, 아릴알킬, 치환 아릴알킬, 아미노, 치환 아미노 및 기타 당 분야에 공지된 것들이 포함될 수 있다. 명시된 경우, 적합한 전자-철회기는 니트로, 카르복실, 트리플루오로메틸과 같은 할로알킬 및 당 분야에 공지된 것들을 포함한다. 적합한 전자-공여기로는 알킬, 알콕시, 히드록실, 아미노, 할로겐, 아세트아미도 및 기타 당 분야에 공지된 것들이 포함된다. 1 차 아민의 알켄에 대한 첨가 반응 : 친핵성 치환 반응 : 아민의 환원성 알킬화 반응 : 팔라듐 촉매화 탄소-탄소 결합형성 반응 : 유기( Ugi ) 축합 반응 : 친전자성 방향족 치환반응 : 이민/ 이미늄 / 엔아민 형성 반응 : 고리화첨가반응 : 친핵성 방향족 치환 반응 : 헥크( Heck ) 반응 : 아세탈 형성 반응 : 알돌( Aldol ) 반응 :
본 발명의 분자 및 라이브러리를 형성하는데 사용될 수 있는 스캐폴드 빌딩 블록은 예를 들면 앞서 논의한 결합 형성 반응 중 하나 이상을 이용하여 주변 빌딩 블록 전구체와 함께 결합 형성 반응에 참여할 수 있는 2 개 이상의 작용 성분을 갖는 것들이 포함된다. 스캐폴드 성분은 또한 예를 들어, 특정 방법으로 반응하여 주변 관능기가 결합된 중심 분자 잔기를 포함하는 분자를 형성할 수 있는 빌딩 블록 전구체를 이용하여 본 발명의 라이브러리 및 분자를 구성하는 중에 합성될 수 있다. 한 실시 양태에서, 본 발명의 라이브러리는 일정한 스캐폴드 성분을 갖는 분자를 포함하지만 주변 잔기가 다르거나 주변 잔기의 배치가 다를 수 있다. 특정 라이브러리에서는, 모든 라이브러리 구성요소가 일정한 스캐폴드 성분을 포함하며 ; 다른 라이브러리는 2 개 이상의 다른 스캐폴드 성분을 갖는 분자를 포함할 수 있다. 본 발명의 분자 및 라이브러리를 구성하는 데 사용될 수 있는 스캐폴드 성분-형성 반응의 예가 표 8 에 기재되어 있다. 표에 명시된 문헌들은 그 전문이 본원에 참고문헌으로 인용되었다. 치환기 R1, R2, R3 및 R4 는 기재된 반응을 저해하거나 현저히 억제하지 않는 것들로 제한되며, 수소, 알킬, 치환 알킬, 헤테로알킬, 치환 헤테로알킬, 시클로알킬, 헤테로시클로알킬, 치환 시클로알킬, 치환 헤테로시클로알킬, 아릴, 치환 아릴, 아릴알킬, 헤테로아릴알킬, 치환 아릴알킬, 치환 헤테로아릴알킬, 헤테로아릴, 치환 헤테로아릴, 할로겐, 알콕시, 아릴옥시, 아미노, 치환 아미노 및 기타 당 분야에 공지된 것들이 포함된다. 적합한 치환체는 알킬, 알콕시, 티오알콕시, 니트로, 히드록실, 설프히드릴, 아릴옥시, 아릴-S-, 할로겐, 카르복시, 아미노, 알킬아미노, 디알킬아미노, 아릴아미노, 시아노, 시아네이트, 니트릴, 이소시아네이트, 티오시아네이트, 카르바밀 및 치환 카르바밀을 포함하지만 이에 제한되지 않는다.
작용 성분의 합성은 이에 제한되지는 않지만, 앞서 논의한 반응들 중 하나와 같은 결합 반응의 유형을 통해, 또는 앞서 논의한 결합 반응들 중 2 개 이상과 같은 둘 이상의 결합 반응의 조합을 통해 진행시킬 수 있다. 예를 들면, 한 실시 양태에서는, 아미드 결합 형성 반응 (아미노 및 카르복실산 상보적 반응성 기) 및 환원성 아민화 반응 (아미노 및 알데히드 또는 케톤 상보적 반응성 기)에 의해 빌딩 블록을 연결한다. 임의의 결합 화학을 사용할 수 있지만, 올리고누클레오티드의 존재에 대해 양립할 수 있어야 한다. 본 발명의 특정 실시 양태에 사용된 것과 같은 이중 (duplex) 올리고누클레오티드 표지는 단일 가닥 표지보다 화학적으로 보다 강하며, 따라서 보다 넓은 범위의 반응을 조건을 견딜 수 있고, 단일 가닥 표지와는 불가능한 결합-형성 반응을 사용할 수 있다.
빌딩 블록은 작용 성분을 형성하는데 사용된 반응성 기 또는 반응성 기들 이외에 하나 이상의 작용 성분을 포함할 수 있다. 이들 하나 이상의 추가 작용 성분들은 보호되어 원치 않는 반응을 예방할 수 있다. 적합한 보호기는 다양한 작용 성분에 대해 당 분야에 공지되어 있다 (Green 및 Wuts 의 문헌, Protective Groups in Organic Synthesis, second edition, New York: John Wiley and Sons (1991), 상기 문헌은 본원에 참고문헌으로 인용되었다). 특히 유용한 보호기는 t-부틸 에스테르 및 에테르, 아세탈, 트리틸 에테르 및 아민, 아세틸 에스테르, 트리메틸실릴 에테르, 트리클로로에틸 에테르 및 에스테르 및 카르바메이트를 포함한다.
한 실시 양태에서, 각각의 빌딩 블록은 2 개 이상의 반응성 기를 포함하며, 이들은 서로 같거나 다를 수 있다. 예를 들면, 고리에 첨가되는 각각의 빌딩 블록은 2 개의 반응성 기를 포함할 수 있는데, 이들은 서로 같으며, 모두 단계 s-1 및 s+1 에서 첨가된 빌딩 블록의 반응성 기에 상보적이어야 한다. 다른 실시 양태에서는, 각각의 빌딩 블록이 스스로에 대해 상보적인 2 개의 반응성 기를 포함한다. 예를 들면, 폴리아미드 분자를 포함하는 라이브러리는 1 차 아미노기를 포함하는 빌딩 블록과 활성 카르복실기를 포함하는 빌딩 블록 간의 반응을 통해 생성할 수 있다. 결과적으로 형성된 화합물에는 교대로 나타나는 아미드기들이 반대되는 방향성을 갖기 때문에 N- 또는 C- 말단이 없다. 또한, 폴리아미드 라이브러리는 각각이 아미노기와 활성 카르복실기를 포함하는 빌딩 블록을 사용하여 생성할 수 있다. 이 실시 양태에서는, 사이클의 n 단계에서 첨가되는 빌딩 블록이 유리 반응성 기를 갖는데, 이는 n-1 구성 블록 상의 유효 반응성 기에 상보적이며, n 번째 빌딩 블록 상의 다른 반응성 기는 보호된 것이 바람직하다. 예를 들어, 라이브러리의 구성요소가 C 에서 N 방향으로 합성된다면, 첨가되는 빌딩 블록은 활성 카르복실기와 보호된 아미노기를 포함할 것이다.
작용 성분은 펩티드, 펩티드 유사체, 펩티드 핵산 또는 펩토이드와 같은 중합체 또는 올리고머 잔기일 수 있으며 또는 작은 비중합체 분자, 예를 들면, 중심 스캐폴드를 포함하는 구조와 스캐폴드 주변에 배치된 구조들을 갖는 분자일 수 있다. 선형 중합체 또는 올리고머 라이브러리는 2 개 반응성 기를 갖는 빌딩 블록을 사용했을 때 얻어지며, 분지형 중합체 또는 올리고머 라이브러리는 임의로 2 개 반응성 기만을 갖는 빌딩 블록과 혼합하여, 3 개 이상의 반응성 기를 갖는 빌딩 블록을 사용했을 때 얻어질 것이다. 이러한 분자들은 일반식 X1X2...Xm 으로 표현할 수 있으며, 상기에서 각각의 X 는 n 개 단량체 단위를 포함하는 중합체의 단량체 단위이고, n 은 1 이상의 정수이다. 올리고머 또는 중합체 화합물의 경우, 말단 빌딩 블록은 2 개 작용 성분을 포함하지 않아도 된다. 예를 들어, 폴리아미드 라이브러리의 경우, C-말단 빌딩 블록은 아미노기를 포함할 수 있지만, 카르복실기의 존재는 선택사항이다. 마찬가지로, N-말단의 빌딩 블록은 카르복실기를 포함할 수 있지만 특정 아미노기를 포함하지 않아도 된다.
분지형 올리고머 또는 중합체 화합물 또한 합성할 수 있으며, 적어도 하나의 빌딩 블록이 다른 빌딩 블록과 반응하는 3 개 작용 성분을 포함해야 한다. 본 발명의 라이브러리는 선형 분자, 분지형 분자 또는 이들의 혼합물을 포함할 수 있다.
라이브러리는 또한 2 개 이상의 반응성 기를 갖는 스캐폴드 빌딩 블록을 오직 하나의 유효 반응성 기만을 갖는 다른 빌딩 블록과 혼합하여 (예를 들면, 임의의 추가 반응성 기가 보호되어 있거나 스캐폴드 빌딩 블록에 존재하는 다른 반응성 기와 반응하지 않는 경우) 구성할 수 있다. 한 실시 양태에서는, 예를 들어, 합성된 분자들을 일반식 X(Yn) 으로 표현할 수 있으며, 상기에서 X 는 스캐폴드 빌딩 블록이고 ; 각각의 Y 는 X 에 연결된 빌딩 블록이고, n 은 2 이상의 정수, 바람직하게는 2 내지 6 의 정수이다. 한 바람직한 실시 양태에서는, 사이클 1 의 초기 빌딩 블록이 스캐폴드 빌딩 블록이다. 일반식 X(Y)n 의 분자에서, 각각의 Y 는 같거나 다를 수 있으나, 일반적인 라이브러리의 대부분의 구성요소들의 경우, 각각의 Y 는 서로 다르다.
한 실시 양태에서, 본 발명의 라이브러리는 폴리아미드 화합물을 포함한다. 폴리아미드 화합물은 알라닌 (Ala; A), 글리신 (Gly; G), 아스파라긴 (Asn; N), 아스파라긴산 (Asp; D), 글루탐산 (Glu; E), 히스티딘 (His; H), 루이신 (Leu; L), 리신 (Lys; K), 페닐알라닌 (Phe; F), 티로신 (Tyr; Y), 트레오닌 (Thr; T), 세린 (Ser; S), 아르기닌 (Arg; R), 발린 (Val; V), 글루타민 (Gln; Q), 이소루이신 (Ile; I), 시스테인 (Cys; C), 메티오닌 (Met; M), 프롤린 (Pro; P) 및 트립토판 (Trp; W) (상기에서 각각의 아미노산에 대해 3 글자와 1 글자 코드로 나타내었다)과 같은 자연적으로 존재하는 20 개의 α-아미노산을 비롯하여 임의의 아미노산으로부터 유래된 빌딩 블록으로 이루어질 수 있다. 이들 자연적으로 존재하는 형태에서, 각각의 아미노산들은 L-구조로 존재하며, 본원에 달리 명시되지 않으며 그렇게 추정한다. 그러나, 본 발명의 방법에서 이들 아미노산의 D-구조 또한 사용할 수 있다. 이들 D-아미노산들은 소문자 3-글자 또는 1-글자 코드, 즉 ala (a), gly (g), leu (1), gln (q), thr (t), ser (s) 등으로 나타내었다. 빌딩 블록들은 또한 나프틸알라닌과 같은 3-아릴알라닌, 4-플루오로-, 4-클로로, 4-브르모 및 4-메틸페닐알라닌과 같은 페닐-치환 페닐알라닌 ; 3-피리딜알라닌, 3-티에닐알라닌, 3-퀴놀릴알라닌 및 3-이미다졸릴알라닌과 같은 3-헤테로아릴알라닌 ; 오르니틴 ; 시트룰린 ; 호모시트룰린 ; 사르코신 ; 호모프롤린 ; 호모시스테인 ; 히드록시프롤린 및 플루오로프롤린과 같은 ; 디히드록시프롤린 ; 노르루이신 ; O-메틸티로신 ; O-메틸세린 ; O-메틸트레오닌 및 3-시클로헥실알라닌을 포함하지만 이에 제한되지 않는 α-아미노산으로부터 유래될 수 있다. 앞서 언급한 아미노산은 각각 D- 또는 L-구조로 사용할 수 있다.
빌딩 블록은 또한 α-아자아미노산과 같이 α-아미노산이 아닌 아미노산; β, γ, δ, ε-아미노산 및 N-치환 글리신과 같은 N-치환 아미노산 (상기에서 N-치환체는 예를 들면, 치환 또는 비치환 알킬, 아릴, 헤테로아릴, 아릴알킬 또는 헤테로아릴알킬기일 수 있다)일 수 있다. 한 실시 양태에서, N-치환체는 자연 발생적인 또는 비자연발생적인 α-아미노산이다.
빌딩 블록은 또한 디펩티드, 트리펩티드, 테트라펩티드 또는 펜타펩티드 유사체와 같은 펩티드 유사체 구조일 수 있다. 이러한 펩티드 유사체 빌딩 블록은 아미노 아실 화합물로부터 유도되어 이들 빌딩 블록을 성장하는 폴리(아미노아실)기에 첨가시키는 화학 반응이 다른 빌딩 블록에 사용되는 화학 반응과 같거나 유사한 것이 바람직하다. 구성 블록은 또한 펩티드 결합과 등입체성인 결합을 형성하여 ψ[CH2S], ψ[CH2NH], ψ[CSNH2], ψ[NHCO], ψ[COCH2], 및 ψ[(E) 또는 (Z)CH=CH]와 같은 펩티드 골격 변형을 포함하는 펩티드 유사체 작용 성분을 형성할 수 있는 분자일 수 있다. 위에서 사용된 명명법에서, ψ 는 아미드 결합이 부재함을 나타낸다. 아미드기를 대체한 구조는 대괄호 안에 나타내었다.
한 실시 양태에서, 본 발명은 코드된 올리고누클레오티드에 효과적으로 결합된 작용 성분을 포함하거나 작용 성분으로 이루어진 화합물을 합성하는 방법을 제공한다. 본 발명의 방법은 (1) n 개의 구성 블록을 포함하고, 하나 이상의 반응성 기를 포함하며, n 개의 빌딩 블록을 코드하는 개시 올리고누클레오티드에 효과적으로 결합된 개시 작용 성분으로 이루어진 개시 화합물을 제공하는 단계 ; (2) 상기 개시 화합물과 단계 (1) 의 반응성 기에 상보적인 하나 이상의 상보적 반응성 기를 포함하는 빌딩 블록을 반응성 기와 상보적 반응성 기가 반응하여 공유 결합을 형성하기에 적합한 조건 하에서 반응시키는 단계 ; (3) 개시 올리고누클레오티드와 도입 올리고누클레오티드를 개시 올리고누클레오티드와 도입 올리고누클레오티드의 결합을 촉매하는 효소 존재 하에 도입 올리고노클레오티드와 개시 올리고누클레오티드의 결합에 적합한 조건에서 반응시켜 코드된 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분을 포함하거나 이로 이루어진 분자를 생성하는 단계를 포함한다. 단계 (3) 의 작용 성분이 반응성 기를 포함할 경우, 단계 (1) 에서 (3) 을 1 회 이상 반복하여 사이클 1 내지 i 를 형성할 수 있으며 (상기에서 i 는 2 이상의 정수이다), 사이클 s-1 의 단계 (3) 의 생성물은 사이클 s 의 단계 (1) 의 개시 화합물이 된다(상기에서 s 는 i 보다 작은 정수이다). 각각의 고리에서 하나의 빌딩 블록이 성장하는 작용 성분에 첨가되고, 새로운 빌딩 블록을 코드하는 하나의 올리고누클레오티드 서열이 성장하는 코드된 올리고누클레오티드에 첨가된다.
한 실시 양태에서, 초기 개시 화합물(들)은 제 1 빌딩 블록과 올리고누클레오티드 (예를 들면, PCR 프라이머 서열을 포함하는 올리고누클레오티드 개시 올리고누클레오티드) 또는 이러한 올리고누클레오티드가 결합된 링커를 반응시켜 형성한다. 도 5 에 예시된 실시 양태에서는 링커가 제 1 빌딩 블록의 결합을 위한 반응성 기를 포함하고 개시 올리고누클레오티드에 결합되어 있다. 이 실시 양태에서, 빌딩 블록, 또는 여러 분액들 각각에서 빌딩 블록 집합체 중 하나와 결합기의 반응성 기를 반응시키고 빌딩 블록을 코드하는 올리고누클레오티드를 개시 올리고누클레오티드에 첨가시킴으로써 상기 기재한 방법에서 하나 이상의 초기 개시 화합물을 생성한다.
바람직한 실시 양태에서, 각각의 개별 빌딩 블록은 개별 올리고누클레오티드와 관련이 있으며, 따라서 주어진 고리에 첨가된 올리고누클레오티드의 누클레오티드 서열은 동일한 고리에 첨가된 빌딩 블록을 확인한다.
빌딩 블록들의 결합과 올리고누클레오티드들의 결합은 일반적으로 출발 물질 및 시약이 유사한 농도에서 일어난다. 예를 들면, 반응물의 농도가 마이크로몰 내지 밀리몰, 예를 들면 약 10 μM 내지 약 10 mM 농도일 경우, 효과적인 빌딩 블록의 결합에 바람직하다.
특정 실시 양태에서, 본 발명의 방법은 단계 (2) 이후, 임의의 반응하지 않은 개시 작용 성분을 제거하는 단계를 추가로 포함한다. 특정 고리에서 임의의 반응하지 않은 개시 작용 성분은 고리의 개시 작용 성분이 이후 고리에 첨가되는 빌딩 블록과 반응하는 것을 방해한다. 이러한 반응은 어쩌면 특정 올리고누클레오티드 서열에 대응하는 일정 범위의 작용 성분을 생성할지도 모를 하나 이상의 빌딩 블록이 없는 작용 성분을 형성할 수 있다. 이러한 제거 반응은 임의의 남아있는 개시 작용 성분을 단계 (2) 의 반응성 기와 반응하는 화합물과 반응시켜 수행한다. 스캐빈저(scavenger) 화합물은 단계 (2) 의 반응성 기와 빠르게 반응하는 것이 바람직하며, 이후 고리에 첨가되는 빌딩 블록과 반응할 수 있는 추가 반응성 기를 포함하지 않는 것이 바람직하다. 예를 들면, 단계 (2) 의 반응성 기가 아미노기인 화합물의 합성의 경우, 적합한 스캐빈저 화합물은 아세트산 N-히드록시숙신이미드 에스테르와 같은 N-히드록시숙신이미드 에스테르이다.
다른 실시 양태에서, 본 발명의 방법은 화합물 라이브러리를 생성하는 방법을 제공하는데 상기 각각의 화합물은 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록 잔기를 포함하는 작용 성분을 포함한다. 바람직한 실시 양태에서, 각각의 분자에 존재하는 올리고누클레오티드는 분자내 빌딩 블록을 확인하기에 충분한 정보 및 임의로, 빌딩 블록의 첨가 순서를 제공한다. 이 실시 양태에서, 본 발명의 방법은 화합물 라이브러리를 합성하는 방법을 포함하며, 상기 화합물은 작용 성분의 구조를 확인하는 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록을 포함하는 작용 성분을 포함한다. 본 발명의 방법은 (1) n 개의 빌딩 블록을 포함하고 (상기에서 n 은 1 이상의 정수이다) 상기 n 개의 빌딩 블록을 확인하는 개시 올리고누클레오티드에 효과적으로 결합된 작용 성분으로 이루어진 m 개의 개시 화합물 (상기에서 m 은 1 이상의 정수이다)을 포함하는 용액을 제공하는 단계 ; (2) 단계 (1) 의 용액을 r 개의 분획으로 분할하는 단계 (상기에서 r 은 2 이상의 정수이다) ; (3) 상기 각 분획 내 개시 올리고누클레오티드와 r 개의 구성 블록 중 하나를 반응시켜 개시 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분으로 이루어진 화합물을 포함하는 r 개의 분획을 생성하는 단계 ; (4) 상기 각 분획내 개시 올리고누클레오티드와 r 개의 특정 도입 올리고누클레오티드 세트 중 하나를 상기 도입 올리고누클레오티드와 상기 개시 올리고누클레오티드의 효소적 결합에 적합한 조건에서 반응시켜 n+1 개의 빌딩 블록을 코드하는 연장된 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분으로 이루어진 분자를 포함하는 r 개의 분액을 생성하는 단계를 포함한다. 임의로, 상기 방법은 단계 (4) 에서 생성된 r 개의 분획을 재조합시키는 단계 (5) 를 더 포함할 수 있다. 단계 (1) 에서 (5) 를 1 회 이상 수행하여 사이클 1 내지 i 를 만들 수 있다 (i 는 2 이상의 정수이다). 사이클 s+1 의 경우는 (상기에서 s 는 i-1 이하의 정수이다), 단계 (1) 의 m 개 개시 화합물을 포함하는 용액이 사이클 s 의 단계 (5) 의 용액이다. 마찬가지로, 사이클 s+1 의 단계 (1) 의 개시 화합물은 사이클 s 의 단계 (5) 의 화합물이다.
단계 (2) 의 용액은 라이브러리 합성 중 각 사이클에서 r 개 분획으로 분할시키는 것이 바람직하다. 이 실시 양태에서, 각각의 분획은 특정 빌딩 블록과 반응한다.
본 발명의 방법에 빌딩 블록과 도입 올리고누클레오티드를 첨가하는 순서는 중요하지 않으며, 분자를 합성하는 단계 (2) 및 (3), 그리고 라이브러리를 합성하는 단계 (3) 및 (4) 는 바꿀 수 있다. 즉, 도입 올리고누클레오티드를 개시 올리고누클레오티드에 결합한 후 새로운 빌딩 블록을 첨가할 수 있다. 특정 실시 양태에서는, 이들 두 단계를 동시에 수행하는 것도 가능할 수 있다.
특정 실시 양태에서, 본 발명의 방법은 단계 (2) 이후, 임의의 반응하지 않은 개시 작용 성분을 제거하는 단계를 더 포함한다. 특정 사이클에서 임의의 반응하지 않은 개시 작용 성분이 사이클의 개시 작용 성분이 이후 사이클에 첨가되는 빌딩 블록과 반응하는 것을 방해한다. 이러한 반응은 어쩌면 특정 올리고누클레오티드 서열에 대응하는 일정 범위의 작용 성분을 생성할지도 모를 하나 이상의 빌딩 블록이 없는 작용 성분을 형성할 수 있다. 이러한 제거 반응은 임의의 남아있는 개시 작용 성분을 단계 (2) 의 반응성 기와 반응하는 화합물과 반응시켜 수행한다. 스캐빈저 화합물은 단계 (2) 의 반응성 기와 빠르게 반응하는 것이 바람직하며, 이후 사이클에 첨가되는 빌딩 블록과 반응할 수 있는 추가 반응성 기를 포함하지 않는 것이 바람직하다. 예를 들면, 단계 (2) 의 반응성 기가 아미노기인 화합물의 합성의 경우, 적합한 스캐빈저 화합물은 아세트산 N-히드록시숙신이미드 에스테르와 같은 N-히드록시숙신이미드 에스테르이다.
하나의 실시 양태에서, 라이브러리 합성에 사용되는 빌딩 블록은 후보 빌딩 블록이 라이브러리 합성에 사용되는 조건 하에서 적합한 상보적 작용 성분과 반응하는 능력을 평가하여 일련의 후보 빌딩 블록 세트로부터 선택한다. 이러한 조건에 적합한 반응성을 보이는 빌딩 블록을 선택하여 라이브러리 내로 혼합할 수 있다. 주어진 사이클 생성물은 임의로 정제할 수 있다. 사이클이 중간 사이클일 경우, 즉 최종 사이클 이전의 임의의 사이클일 경우, 이들 생성물은 중간체이며 다음 사이클을 개시하기전 정제할 수 있다. 만일 고리가 최종 사이클이면, 사이클 생성물은 최종 생성물이며, 화합물을 임의로 사용하기 전에 정제할 수 있다. 이 정제 단계는 예를 들면, 반응하지 않았거나 과다한 반응물 및 올리고누클레오티드 결합에 사용된 효소를 제거할 수 있다. 생성물을 용액 내 다른 종들로부터 제거하기 적합한 임의의 방법이 사용될 수 있으며, 고성능 액체 크로마토그래피 (HPLC)와 같은 액체 크로마토그래피 및 에탄올과 같은 적합한 보조 용매를 사용한 침전법 등이 있다. 정제에 적합한 방법은 생성물의 본성 및 합성에 사용되는 용매 시스템에 좌우될 것이다.
완충 수용액과 같은 수용액 내에서 반응을 수행하는 것이 바람직하지만, 빌딩 블록, 올리고누클레오티드, 중간체 및 생성물과 올리고누클레오티드 결합을 촉매하는데 사용된 효소의 용해 특성과 일치하는 혼합 수성/유기 매질에서 수행할 수도 있다.
앞서 기재한 방법에서 주어진 사이클에 의해 생성되는 화합물의 이론적 수는 사이클에 사용되는 서로 다른 개시 화합물의 수 m 과 고리에 첨가되는 개별 빌딩 블록의 수 r 의 곱이다. 사이클에 의해 생성되는 개별 화합물의 실질적인 수는 r 과 m 의 곱 (r×m)한 만큼 많지만, 특정 빌딩 블록의 특정 다른 빌딩 블록과의 반응성 차이에 따라 낮아질 수도 있다. 예를 들면, 특정 빌딩 블록을 특정 개시 화합물 동력학이 합성 사이클의 시간 범위 상 반응 생성물이 거의 내지 전혀 생성되지 않을 수도 있다.
특정 실시 양태에서는, 통상적인 빌딩 블록이 사이클 1 회, 마지막 사이클 이후 또는 임의의 두 사이클 사이에 첨가한다. 예를 들면, 작용 부분이 폴리아미드인 경우, 공동 N-말단 캡핑 빌딩 블록을 마지막 사이클 이후 첨가할 수 있다. 또한, 공동 빌딩 블록을 임의의 두 사이클 사이에 혼입하여, 라이브러리 합성 이후 고리화에 의해 작용 성분을 변형할 수 있는, 예를 들면, 알킨 또는 아지드기와 같은 작용 성분을 첨가할 수 있다.
본원에 사용된 용어 "효과적으로 결합된(operatively linked)" 이란 것은 두 개의 화학 구조가 서로 연결되어 이후 거치게 될 것으로 예상되는 다양한 조작 중에도 연결된 채로 남아있는 것을 의미한다. 대체로, 작용 성분 및 코드된 올리고누클레오티드는 적합한 결합기를 통해 공유결합에 의해 결합된다. 결합기는 올리고누클레오티드를 위한 결합 부위 및 작용 성분을 위한 결합 부위를 갖는 2 가 잔기이다. 예를 들면, 작용 성분이 폴리아미드 화합물일 경우, 이 폴리아미드 화합물은 N-말단의 결합기에 또는 측쇄 중 하나의 작용 성분을 통해 부착될 수 있다. 결합기는 폴리아미드 화합물과 올리고누클레오티드를 하나 이상의 원자, 바람직하게는 2 개 이상, 3 개 이상, 4 개 이상, 5 개 이상 또는 6 개 이상과 같이 하나 보다 많은 원자에 의해 분리하기에 충분하다. 결합기는 충분한 가요성을 갖기 때문에 폴리아미드 화합물을 올리고누클레오티드와는 무관하게 표적 분자에 결합시킬 수 있다.
한 실시 양태에서, 결합기는 폴리아미드 화합물이 N-말단 및 올리고누클레오티드의 5' 포스페이트기에 부착된다. 예를 들면, 결합기는 한 말단에 활성 카르복실기를 다른 말단에는 활성 에스테르를 갖는 결합기 전구체로부터 유도될 수 있다. 결합기 전구체와 N-말단 질소 원자의 반응으로 결합기를 폴리아미드 화합물 또는 N-말단 빌딩 블록에 연결시키는 아미드 결합이 형성되며, 결합기 전구체와 올리고누클레오티의 5-히드록시기의 반응에 의해 올리고누클레오티드가 에스테르 연결을 통해 결합기에 부착된다. 결합기는 예를 들면, -(CH2)n- 사슬과 같은 폴리메틸렌 사슬 또는 -(CH2CH2O)n 사슬과 같은 폴리(에틸렌 글리콜) 사슬을 포함할 수 있다 (상기에서 n 은 1 내지 약 20 의 정수이다). n 이 2 내지 약 12 인 것이 바람직하고, 약 4 내지 약 10 인 것이 더 바람직하다. 한 실시 양태에서, 결합기는 헥사메틸렌 (-(CH2)6-)기를 포함한다.
빌딩 블록이 아미노산 잔기일 경우, 생성되는 작용 성분은 폴리아미드이다. 아미노산은 아미드 결합을 형성하는데 적합한 임의의 화학반응을 이용하여 결합시킬 수 있다. 아미노산 빌딩 블록의 결합은 올리고누클레오티드의 효소적 결합에 적합한 조건, 예를 들면, 중성 또는 거의 중성인 pH 의 수용액 중에서 수행한다. 한 실시 양태에서는, 폴리아미드 화합물을 C-말단에서 N-말단 방향으로 합성한다. 이 실시 양태에서, 제 1 또는 C-말단 빌딩 블록은 그의 카르복실기가 적합한 결합기에 의해 올리고누클레오티드에 결합된다. 제 1 구성 블록은 제 2 빌딩 블록과 반응하며, 상기 제 2 빌딩 블록은 활성 카르복실기 및 보호된 아미노기를 갖는 것이 바람직하다. 용액상 아미드 결합 형성에 적합한 임의의 활성화/보호기를 사용할 수 있다. 예를 들면, 적합한 활성 카르복실 종으로는 아실 플루오라이드 (미국 특허 제 5,360,928 호, 상기 전문이 본원에 참고문헌으로 인용되었다), 대칭 무수물 및 N-히드록시숙신이미드 에스테르가 있다. 아실기는 또한 당 분야에 공지된 바와 같이, 현장에서 적합한 활성화 화합물과의 반응에 의해 활성화될 수 있다. 적합한 활성화 화합물은 디시클로헥실카르보디이미드 (DCC), 디이소프로필카르보디이미드 (DIC), 1-에톡시카르보닐-2-에톡시-1,2-디히드로퀴놀린 (EEDQ), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 염화수소 (EDC), n-프로판-인산 무수물 (PPA), N,N-비스 (2-옥소-3-옥사졸리디닐)이미도포스포릴 클로라이드 (BOP-Cl), 브로모-트리스-피롤리디노포스포늄 헥사플루오로포스페이트 (PyBrop), 디페닐포스포릴 아지드 (DPPA), 카스트로 (Castro) 시약 (BOP, PyBop), O-벤조트리아조릴-N,N,N', N'-테트라메틸우로늄 염 (HBTU), 디에틸포스포릴 시아나이드 (DEPCN), 2,5-디페닐-2,3-히드로-3-옥소-4-히드록시티오펜 디옥사이드 (Steglich's eagent; HOTDO), l,l'-카르보닐-디이미다졸 (CDI), 및 4-(4,6-디메톡시-l,3,5-트리아진-2-일)-4-메틸몰포리늄 클로라이드 (DMT-MM)를 포함한다. 결합 시약은 단독으로 또는 N,N-디메틸-4-아미노피리딘 (DMAP), N-히드록시-벤조트리아졸 (HOBt), N--히드록시벤조트리아진 (HOOBt), N-히드록시숙신이미드 (HOSu), N--히드록시아자벤조트리아졸 (HOAt), 아자벤조트리아졸릴-테트라메틸우로늄 염 (HATU, HAPyU) 또는 2-히드록시피리딘과 같은 첨가물과 혼합하여 사용할 수 있다. 특정 실시 양태에서, 라이브러리의 합성은 2 개 이상의 활성화 전략을 사용하여 구조적으로 다양한 빌딩 블록을 사용할 수 있게 하였다. 각각의 빌딩 블록은 당분야의 숙련자가 적합한 활성화 방법을 결정할 수 있을 것이다.
N-말단 보호기는 예를 들면, 용액상 합성 조건에 적합한 기를 보호하는 방법 조건에 알맞은 보호기일 수 있다. 바람직한 보호기는 플루오레닐메톡시카르보닐 ("Fmoc")기이다. 아미노아실 빌딩 블록의 측쇄에서 임의의 잠정적으로 반응성인 작용기는 또한 적합하게 보호될 필요가 있다. 바람직한 측쇄 보호기는 N-말단 보호기에 직각인 것이 바람직하며, 즉 측쇄 보호기는 N-보호기를 제거하는데 요구되는 것과 다른 조건 하에서 제거한다. 적합한 측쇄 보호기로는 니트로베라트릴기로 상기는 측쇄 카르복실기와 측쇄 아미노기를 모두 보호하는데 사용될 수 있다. 다른 적합한 측쇄 아민 보호기는 N-펜트-4-에노일기(N-pent-4-enoyl group)이다.
빌딩 블록은 작용 성분에 혼입한 후, 예를 들면, 하나 이상의 빌딩 블록 상의 작용 성분을 포함하는 적합한 반응에 의해 변형시킬 수 있다. 빌딩 블록의 변형은 최종 빌딩 블록의 첨가 반응 이후 또는 작용 성분의 합성 중 중간 시점에, 예를 들면, 합성 과정의 임의의 이후에 일어날 수 있다. 본 발명의 이작용기성 분자의 라이브러리를 합성할 경우, 빌딩 블록의 변형은 전체 라이브러리에 대해 또는 라이브러리 일부에 대해 수행할 수 있으며 따라서 라이브러리의 복잡도를 증가시킬 수 있다. 적합한 빌딩 블록 변형 반응은 작용 성분 및 코드된 올리고누클레오티드에 적용할 수 있는 조건 하에 수행할 수 있다. 이러한 반응의 예로는 아미노기 또는 히드록실기의 아실화 및 술폰화, 아미노기의 알킬화 카르복실기의 에스테르화 또는 티오에스테르화, 카르복실기의 아미드화, 알켄의 에폭시드화 및 당분야에 공지된 기타 반응들이 있다. 작용 성분이 알킨 또는 아지드 작용 성분을 갖는 빌딩 블록을 포함할 경우, 아지드/알킨 고리화첨가반응을 이용하여 빌딩 블록의 유도체를 생성할 수 있다. 예를 들면, 알킨을 포함하는 빌딩 블록은 유기 아지드와 반응시킬 수 있고, 아지드를 포함하는 빌딩 블록은 알킨과 반응시킬 수 있으며, 두 경우 모두에서 트리아졸이 생성된다. 빌딩 블록 변형 반응은 최종 빌딩 블록의 첨가 반응 이후 또는 합성 과정의 중간 시점에서 일어날 수 있으며 다양한 화학 구조를 탄화수소를 포함하는 작용 성분, 금속 결합 잔기 및 특정 생체 분자 또는 조직유형을 표적으로 하는 구조에 결합시키는데 사용할 수 있다.
다른 실시 양태에서, 작용 선분은 선형 빌딩 블록을 포함하며, 이들 선형 블록들은 적합한 반응을 이용하여 고리화할 수 있다. 예를 들면, 선형 어레이 내 2 개 이상의 빌딩 블록이 설프히드릴기를 포함할 경우, 설프히드릴기를 산화시켜 디설파이드 결합을 형성함으로써 선형 어레이를 고리화할 수 있다. 예를 들어, 작용 성분은 2 개 이상의 L 또는 D-시스테인 및/또는 L 또는 D-호모시스테인 잔기를 포함하는 올리고펩티드일 수 있다. 빌딩 블록은 또한 예를 들면, 카르복실기 및 아미노 또는 히드록실기와 같이 서로 반응하여 선형 어레이를 고리화할 수 있는 다른 작용 성분을 포함할 수 있다.
바람직한 실시 양태에서, 선형 어레이 내 빌딩 블록 중 하나는 알킨기를 포함하고, 선형 어레이 내 다른 빌딩 블록은 아지드기를 포함한다. 아지드기와 알킨기는 고리화첨가반응에 의해 반응시킬 수 있으며 거대 고리 구조를 형성한다. 도 9 에 도시된 실시예에서, 작용 성분은 C-말단에 프로파르길글리신 빌딩 블록 및 N-말단에 아지도아세틸기를 포함하는 폴리펩티드이다. 적합한 조건 하에 알킨과 아지드기를 반응시키면 고리 화합물이 형성되며, 이 고리는 거대 고리 내에 트리아졸 구조를 포함한다. 라이브러리의 경우, 한 실시 양태에서는, 라이브러리의 각 구성요소가 알킨 및 아지드-함유 빌딩 블록을 포함하며 이처럼 고리화될 수 있다. 제 2 실시 양태에서는 모든 라이브러리 구성요소가 알킬- 및 아지드-함유 빌딩 블록을 포함하지만 라이브러리의 일부만이 고리화된다. 제 3 실시 양태에서는 오직 특정 작용 성분만이 알킨- 및 아지드-함유 빌딩 블록을 포함하며, 오직 이들 분자만이 고리화된다. 상기 제 2 및 제 3 실시 양태에서, 고리화 첨가 반응 이후, 라이브러리는 고리형 및 선형 작용 성분을 모두 포함할 것이다.
동일한 작용 성분, 예를 들면, 트리아진이 특정 합성 단계 중에 라이브러리의 각 분획 및 모든 분획에 첨가되는 본 발명의 몇몇 실시 양태에서는 상기 작용 성분을 코드하는 올리고누클레오티드 표지를 첨가하지 않아도 된다.
올리고누클레오티드는 화학적 또는 효소적 방법에 의해 결합시킬 수 있다. 한 실시 양태에서는, 올리고누클레오티드를 화학적 수단에 의해 결합시킨다. DNA 및 RNA 의 화학적 결합은 예를 들면, Shabarova 등의 문헌 (1991) Nucleic Acids Research, 19, 4247-4251, federova 등의 문헌 (1996) Nucleosides and Nucleotides, 15, 1137-1147 및 Carriero 및 Damha (2003) journal of Organic Chemistry, 68, 8328-8338 에 제시된 바와 같이 수용성 카르보디이미드 및 시아노겐 브로마이드와 같은 반응물을 사용하여 수행할 수 있다. 한 실시 양태에서, 화학적 결합은 pH 7.6 의 완충제(1M MES+20 mM MgCl2) 중에서 5' 포스포릴화 올리고누클레오티드와 1:10 v/v 비율로 아세토니트릴 내 5 M 의 시아노겐 브로마이드를 사용하여 0 ℃ 에서 1 내지 5 분 동안 수행한다. 다른 실시 양태에서는, 효소적 방법을 이용하여 올리고누클레오티드를 결합시킨다. 어느 실시 양태에서는 올리고누클레오티드는 이중 가닥일 수 있으며 약 5 내지 약 14 개 염기의 돌출 부분을 갖는 것이 바람직하다. 올리고누클레오티드는 또한 단일 가닥일 수 있으며, 결합되는 각각의 올리고누클레오티드와 약 6 개의 염기가 중복된 스플린트를 사용하여 반응성 5 및 3 잔기를 서로 아주 근접하게 위치시킨다.
한 실시 양태에서, 개시 빌딩 블록은 개시 올리고누클레오티드에 효과적으로 결합되어 있다. 제 2 빌딩 블록을 개시 빌딩 블록에 결합시키기 전이나 그 후에, 제 2 빌딩 블록을 확인하는 제 2 올리고누클레오티드 서열을 개시 올리고누클레오티드에 결합시킨다. 개시 올리고누클레오티드 서열 및 도입 올리고누클레오티드 서열을 결합시키는 방법은 도 1 및 도 2 에 기재되어 있다. 도 1 에서, 개시 올리고누클레오티드는 이중 가닥이며, 한 가닥은 제 2 올리고누클레오티드의 한 말단에 상보적인 돌출 서열을 포함하고, 제 2 올리고누클레오티드가 개시 올리고누클레오티드와 접촉하게 한다. 개시 올리고누클레오티드의 돌출 서열 및 제 2 올리고누클레오티드의 상보적 서열은 모두 약 4 개 이상의 염기를 갖는 것이 바람직하며, 보다 바람직한 것은 두 서열 모두 같은 길이인 것이다. 개시 올리고누클레오티드 및 제 2 올리고누클레오티드는 적합한 효소를 사용하여 결합시킬 수 있다. 만일 올리고누클레오티드가 한 가닥 (상부 가닥)의 5' 말단에서 제 1 빌딩 블록과 연결되면, 상부 가닥에 상보적인 가닥 (하부 가닥)은 5' 말단의 돌출 서열을 포함하고, 제 2 올리고누클레오티드는 5' 말단의 상보적 서열을 포함할 것이다. 제 2 올리고누클레오티드의 결합 이후, 돌출된 상복적 서열에 대해 3' 인 제 2 올리고누클레오티드 서열에 상보적이고 추가 돌출 서열을 포함하는 가닥을 첨가할 수 있다.
한 실시 양태에서, 올리고누클레오티드는 도 2 에 도시된 바와 같이 연장시킨다. 성장하는 작용 성분에 결합된 올리고누클레오티드 및 도입 올리고누클레오티드를 개시 올리고누클레오티드의 3' 말단에 상보적인 영역 및 개시 올리고누클레오티드의 5' 말단에 상보적인 영역을 포함하는 "스플린트" 서열을 사용하여 배치한 후 결합시킨다. 스플린트는 올리고누클레오티드의 5' 말단을 도입 올리고의 3' 말단에 아주 근접하게 배치시키며, 결합은 효소적 결합을 이용하여 수행한다. 도 2 에 도시된 실시예에서, 개시 올리고누클레오티드는 16 개의 누클레오염기로 이루어졌으며, 스플린트는 3' 말단에서 6 개의 염기에 상보적이다. 도입 올리고누클레오티드는 12 개의 누클레오염기로 이루어졌으며, 스플린트는 5' 말단에서 6 개 염기에 상보적이다. 스플린트의 길이 및 상보적 영역의 길이는 중요하지 않다. 그러나, 상보적 영역은 결합 조건 하에서 안정한 이합체를 형성하도록 충분히 길어야 하지만 너무 길어서 최종 분자 내에 지나치게 큰 코드된 누클레오티드를 형성해서는 안된다. 상보적 영역은 길이가 약 4 염기에서 12 염기인 것이 바람직하며, 약 5 염기 내지 10 염기가 보다 바람직하고 약 5 염기 내지 8 염기인 것이 가장 바람직하다.
본원에 기재된 라이브러리 합성을 위한 방법에 사용되는 스플릿 및 풀 방법은 각각의 독특한 작용 성분이 상기 작용 성분을 입증하는 하나 이상의 독특한 올리고누클레오티드 서열에 효과적으로 결합되어 있음을 입증한다. 만일 하나 이상의 합성에서 하나 이상의 빌딩 블록을 위해 2 개 이상의 서로 다른 올리고누클레오티드를 사용한다면, 상기 빌딩 블록을 포함하는 각각의 개별 작용 성분은 여러 올리고누클레오티드로 코드해야할 것이다. 예를 들면, 4 사이클 라이브러리의 합성 중에 각각의 빌딩 블록을 위해 2 개의 올리고누클레오티드 표지를 사용한다면, 각각의 특정 작용 성분을 코드하는 16 개 DNA 서열 (24) 이 존재할 것이다. 여러 개의 서열로 각각의 작용 성분을 코드하는 데는 몇 가지 장점이 있다. 먼저, 동일한 작용 성분을 코드하는 표지 서열의 서로 다른 조합을 선택하면, 분자들이 독립적으로 선택되는 것을 보장할 수 있다. 두번째로는, 동일한 작용 성분을 코드하는 표지 서열의 서로 다른 조합을 선택하는 것은 올리고누클레오티드의 서열에 기초한다. 세번째로, 만일 서열 분석 결과 특정 작용 성분이 매우 풍부하지만 많은 가능성 중 오직 하나의 서열 조합이 나타나는 것으로 나타나면, 인위적인 기술적 구조를 인정할 수 있다. 여러 번의 표지 표지는 빌딩 블록은 같지만 올리고누클레오티드 표지가 다른 독립적인 스플릿 반응에 의해 수행할 수 있다. 또는, 단일 표지 표지 반응에서 각 표지를 개별 빌딩 블록과 적절한 비율로 혼합하여 수행할 수 있다.
한 실시 양태에서는, 개시 올리고누클레오티드가 이중 가닥이고 2 개의 가닥이 공유 결합으로 연결되어 있다. 2 개의 가닥을 공유 결합으로 연결하는 방법이 도 3 에 도시되어 있는, 상기에서는, 연결 잔기, 예를 들면, 링커를 사용하여 2 개의 가닥과 작용 성분을 연결한다. 연결 잔기는 빌딩 블록과 반응하도록 개조된 제 1 작용 성분, 올리고누클레오티드의 3'-말단과 반응하도록 개조된 제 2 작용 성분 및 올리고누클레오티드의 5' 말단과 반응하도록 개조된 제 3 작용 성분을 포함하는 임의의 화학 구조일 수 있다. 제 2 및 제 3 작용 성분은 두 개의 올리고누클레오티드 가닥을 두 가닥의 혼성화를 허용하는 상대적인 배향으로 위치시킬 수 있도록 배향시키는 것이 바람직하다. 예를 들면, 연결 잔기, 예를 들면, 링커는 하기 구조를 갖는다 : 이 식에서, A 는 빌딩 블록과 공유결합을 형성하는 작용 성분이고 ; B 는 올리고누클레오티드의 5' 말단과 결합을 형성할 수 있는 작용 성분이고 ; C 는 올리고누클레오티드의 3' 말단과 결합을 형성할 수 있는 작용 성분이며 ; D, F 및 E 는 작용 성분 A, C 및 B 내지 S 를 연결하는 화학기이며, S 는 코어 원자 또는 스캐폴드이다. D, E 및 F 는 각각 독립적으로 알킬렌 사슬 또는 올리고 (에틸렌 글리콜) 사슬과 같은 원자들의 사슬인 것이 바람직하며, D, E 및 F 는 같거나 다를 수 있으며, 두 올리고누클레오티드의 혼성화와 작용 성분의 합성을 수행하는 데 효과적인 것이 바람직하다. 한 실시 양태에서 3 가 연결 잔기는 하기 구조식을 갖는 링커이다 : . 이 실시 양태에서, NH 기는 빌딩 블록에 결합시키는데 유용한 반면, 말단 인산기는 올리고누클레오티드에 결합시키는데 유용하다.
개시 올리고누클레오티드가 이중 가닥인 경우, 도입 올리고누클레오티드가 이중 가닥이다. 도 3 에 도시된 바와 같이, 개시 올리고누클레오티드가 나머지 하나보다 긴 길이를 갖는 가닥을 갖는다. 이 실시 양태에서, 도입 올리고누클레오티드는 개시 올리고누믈레오티드의 돌출 서열에 상보적인 돌출 서열을 포함한다. 2 개의 상보적인 돌출 서열을 혼성화하면, 도입 올리고누클레오티드가 개시 올리고누클레오티드로의 결합을 위한 위치에 가게된다. 결합은 DNA 또는 RNA 리가제를 사용하여 효소적으로 수행할 수 있다. 도입 오리고누클레오티드의 돌출 서열과 개시 올리고누클레오티드의 돌출 서열은 동일한 길이를 갖는 것이 바람직하며 2 개 이상의 누클레오티드, 바람직하게는 2 내지 약 10 개의 누클레오티드, 보다 바람직하게는 약 2 내지 약 6 개의 누클레오티드로 이루어진 것이 바람직하다. 한 바람직한 실시 양태에서, 도입 올리고누클레오티드는 각 말단에 돌출 서열을 갖는 이중 가닥 올리고누클레오티드이다. 한 말단의 돌출 서열은 개시 올리고누클레오티드의 돌출 서열에 대해 상보성을 가지며, 도입 올리고누클레오티드와 개시 올리고누클레오티드의 결합 후, 다른 말단의 돌출 서열은 다음의 개시 올리고누클레오티드의 돌출 서열이 된다. 한 실시 양태에서, 3 개의 돌추 서열은 길이가 모두 2 내지 6 개의 누클레오티드이고, 도입 올리고누클레오티드의 코드된 서열은 길이가 3 내지 10 개의 누클레오티드, 바람직하게는 길이가 3 내지 6 개의 누클레오티드이다. 특정 실시 양태에서, 돌출 서열은 모두 길이가 2 개 누클레오티드이며, 코드된 서열은 길이가 5 개의 누클레오티드이다.
도 4 에 도시된 실시 양태에 따르면, 도입 가닥은 개시 올리고누클레오티드의 3' 말단에 상보성인 영역을 3' 말단에 가지며 두 가닥 모두의 5' 말단에는 돌출부를 갖는다. 5' 말단은 예를 들면 벤트(vent) 폴리머라제와 같은 DNA 폴리머라제를 사용하여 채우면 이중 가닥 연장 올리고누클레오티드가 생성된다. 올리고누클레오티드의 하부 가닥을 제거할 수 있으며, 상부 가닥의 3' 말단에 첨가된 추가 서열은 동일한 방법을 사용하여 제거할 수 있다.
코드된 올리고누클레오티드 표지는 각각의 연속 빌딩 블록을 확인하는 올리고누클레오티드의 연속 첨가반응의 결과로 형성된다. 본 발명의 방법의 한 실시 양태에서는, 연속적인 올리고누클레오티드 표지를 효소적 결합에 의해 결합시켜 코드된 올리고누클레오티드를 형성한다.
올리고누클레오티드의 효소 - 촉매 결합은 핵산 단편을 결합시킬 수 있는 임의의 효소를 사용하여 수행할 수 있다. 효소의 예로는 리가제, 폴리머라제 및 토포아이소머라제가 있다. 본 발명의 특정 실시 양태에서는, DNA 리가제(EC 6.5.1.1), DNA 폴리머라제(EC 2.7.7.7), RNA 폴리머라제(EC2.7.7.6) 또는 토포아이소머라제(EC5.99.1.2)를 사용하여 올리고누클레오티드를 결합시킨다. 각각의 EC 클래스에 함유된 효소는 예를 들면 문헌 Bairoch (2000) Nucleic acid research 28:304-5 에 기재된 대로 확인할 수 있다.
바람직한 실시 양태에서, 본 발명의 방법에 사용된 올리고누클레오티드는 올리고데옥시누클레오티드이고, 올리고누클레오티드를 촉매화하는데 사용된 효소는 DNA 리가제이다. 리가제 내에서 결합이 일어나도록, 즉 2 개 올리고누클레오티드 사이에서 포스포디에스테르 결합이 발견되도록 하기 위해, 올리고누클레오티드는 유리된 3 히드록실기를 가져야만 한다. 본 발명의 방법에 사용될 수 있는 DNA 리가제의 예로는 T4 DNA 리가제, Taq DNA 리가제, T4 RNA 리가제, DNA 리가제(E. coli)가 있다(모두 매사추세츠 New England Biolabs 로부터 얻을 수 있다).
당 분야의 숙련자라면 결합에 사용되는 각각의 효소는 특정 조건, 예를 들면, 온도, 완충제 농도, pH 및 시간에서 최적의 활성을 가짐을 이해할 것이다. 이들 조건 각각은 예를 들면, 제조자의 지시에 따라 조정하여 올리고누클레오티드 표지의 최적의 결합을 얻을 수 있다.
도입 올리고누클레오티드는 임의의 원하는 길이를 가질 수 있지만 길이가 적어도 3 개 이상의 핵염기인 것이 바람직하다. 보다 바람직한 것은 도입 올리고누클레오티드의 길이가 4 개 이상의 핵염기인 것이다. 한 실시 양태에서, 도입 올리고누클레오티드는 길이가 3 내지 약 12 개 핵염기이다. 본 발명의 라이브러리 내 분자의 올리고누클레오티드는 당 분야에 알려진 바와 같이 PCR 을 위한 프라이머로 작용할 수 있는 공동의 말단 서열을 갖는 것이 바람직하다. 이러한 공동의 말단 서열은 라이브러리 합성의 최종에 첨가되는 도입 올리고누클레오티드의 말단으로 혼입될 수 있고 또는 본원에 개시된 효소적 결합 방법을 이용하여 라이브러리 합성 후 첨가될 수 있다.
본 발명의 방법의 바람직한 실시 양태가 도 5 에 도시되어 있다. 방법은 아미노기로 끝나는 링커에 5' 말단이 결합된 합성 DNA 서열로 시작한다. 단계 1 에서, 이 출발 DNA 서열은 Tris 완충제 내 스플린트 DNA 가닥, DNA 리가제 및 디티오트레이톨 존재 하에 도입 DNA 서열에 결합된다. 이로써 표지 표지된 DNA 서열이 형성되며, 이는 바로 다음 단계에 사용되거나, 다음 단계 이전에, 예를 들면 HPLC 또는 에탄올 침전법을 이용하여 정제할 수 있다. 단계 2 에서는 표지 표지된 DNA 를 보호된 활성화 아미노산, 이 실시예에서는 Fmoc - 보호 아미노산 플루오라이드와 반응시켜 보호된 아미노산 - DNA 결합체를 형성한다. 단계 3 에서는, 보호된 아미노산 - DNA 결합체를 예를 들면 피페리딘의 존재 하에 탈보호시키고, 결과된 탈보호 결합체를 임의로 HPLC 또는 에탄올 침전법에 의해 정제한다. 탈보호 결합체는 제 1 합성 사이클의 생성물이며, 제 2 아미노산 잔기를 탈보호 결합체의 유리 아미노기에 첨가시키는 제 2 사이클의 출발 물질이다.
PCR 이 선택된 분자의 코드된 올리고누클레오티드를 증폭시키고/거나 서열을 결정하는데 사용되는 실시 양태에서는, 코드된 올리고누클레오티드는 예를 들면, PCR 프라이머 서열 및/또는 서열화 프라이머(예를 들면, 3' GACTACCGCGCTCCCTCCG-5' 및 3' GACTCGCCCGACCGTTCCG-5') 를 포함한다. PCR 프라이머 서열은 예를 들면, 합성의 제 1 사이클 전에 개시 올리고누클레오티드에 포함될 수 있고/포함될 수 있거나 제 1 도입 올리고누클레오티드와 함께 포함될 수 있고/포함될 수 있거나 라이브러리 합성의 최종 이후 코드된 올리고누클레오티드에 결합될 수 있고/결합될 수 있거나 최종의 도입 올리고누클레오티드에 포함될 수 있다. 라이브러리 합성의 최종 이후에 첨가되고/첨가되거나 최종의 도입 올리고누클레오티드에 첨가되는 PCR 프라이머 서열을 본원에서는 "캡핑 서열(capping sequence)" 이라 부른다.
한 실시 양태에서, PCR 프라이머 서열은 코드된 올리고누클레오티드 표지 내로 설계한다. 예를 들면, PCR 프라이머 서열을 개시 올리고누클레오티드 표지 내로 혼입하고/혼입하거나 최종 올리고누클레오티드 표지 내로 혼입할 수 있다. 한 실시 양태에서, 동일한 PCR 프라이머 서열을 개시 및 최종 올리고누클레오티드 표지 내로 혼입시킨다. 다른 실시 양태에서는 제 1 PCR 프라이머 서열을 개시 올리고누클레오티드의 표지에 혼입하고 제 2 PCR 프라이머 서열을 최종 올리고누클레오티드 표지 내로 혼입시킨다. 또는 제 2 PCR 프라이머 서열을 본원에 기재된 바와 같이 보호 서열내로 혼입시킬 수 있다. 바람직한 실시 양태에서는, PCR 프라이머 서열의 길이가 적어도 약 5, 7, 10, 13, 15, 17, 20, 22 또는 25 개 이상의 누클레오티드이다.
본 발명의 라이브러리에 사용하기 적합한 PCR 프라이머 서열은 당 분야에 공지되어 있다. 적합한 프라이머 및 방법은 Innis 등의 문헌, PCR Protocols: A Guide to Methods and Applications, San Diego: Academic Press (1990) 에 기재되어 있으며, 상기 문헌은 그 전문의 내용이 본원에 참고문헌으로 인용되었다. 본원에 기재된 라이브러리의 구성에 사용하기 적합한 다른 프라이머는 PCT 출원 제 WO 2004/069849 호 및 제 WO 2005/003375 호에 기재된 프라이머이며, 상기 문헌들은 그 전문이 참고문헌으로 본원에 인용되었다.
프라이머, 프로브 및 프라이머 연장에 의해 합성되는 핵산 단편 또는 세그먼트와 관련하여, 본원에 사용된 용어 "폴리누클레오티드" 는 2 개 이상의 데옥시리보누클레오티드, 바람직하게는 3 개 이상의 데옥시리보누클레오티드로 이루어진 분자를 나타낸다.
본원에 사용된 용어 "프라이머" 는 핵산 제한 소화에 의해 정제되거나 합성에 의해 생성되고, 핵산 가닥에 상보적인 프라이머 연장 생성물의 합성이 유도되는 조건, 즉 누클레오티드 및 DNA 폴리머라제, 역전사효소 등과 같은 반응물 존재 하에 적합한 온도 및 pH 에 놓였을 때 핵산 합성의 개시점으로 작용할 수 있는 폴리누클레오티드를 이른다. 프라이머는 최대 효율을 위해 단일 가닥인 것이 바람직하지만, 이중 가닥 형태일 수도 있다. 만일 이중 가닥이라면, 먼저 프라이머를 처리하여 그의 상보적 가닥으로부터 분리한 후 연장 생성물을 제조하는데 사용한다. 프라이머는 폴리도엑소리보누클레오티드인 것이 바람직하다. 프라이머는 중합체화 시약의 존재 하에 연장 생성물의 합성을 프라이밍하기에 충분히 길어야 한다. 프라이머의 정확한 길이는 온도 및 프라이머 출처를 비롯한 많은 요인에 좌우된다.
본원에 사용된 프라이머는 "실질적으로" 증폭될 각각의 특정 서열의 다른 가닥들에 상보적이도록 선택한다. 이것은 프라이머가 충분히 상보적이어서 그의 각각의 주형 가닥과 비무작위로 혼성화해야한다는 것을 의미한다. 따라서, 프라이머 서열은 주형의 정확한 서열을 나타낼 수도 나타내지 않을 수도 있다.
폴리누클레오티드 프라이머는 임의의 적합한 방법, 예를 들면, Narang 등의 문헌 (1979) Meth. Enzymol., 68:90 ; 미국 특허 제 4,356,270 호, 미국 특허 제 4,458,066 호, 미국 특허 제 4,416,988 호, 미국 특허 제 4,293,652 호 및 Brown 등의 문헌 (1979) Meth. Enzymol., 68:109 에 기재된 포스포트리에스테르 또는 포스포디에스테르 방법을 사용하여 제조할 수 있다. 상기 문헌들은 모두 그 전문이 본원에 참고문헌으로 인용되었다.
PCR 프라이머 서열이 도입 올리고누클레오티드에 혼입된 경우, 이들 도입 올리고누클레오티드는 다른데서 첨가되는 도입 올리고누클레오티드 보다 훨씬 긴 것이 바람직한데, 이는 코드된 서열과 PCR 프라이머 서열을 모두 포함하기 때문이다.
한 실시 양태에서는, 최종 빌딩 블록과 최종 도입 올리고누클레오티드를 첨가한 후, 캡핑 서열을 첨가하고, 본원에 기재된 라이브러리의 합성은 이 캡핑 서열을 코드된 올리고누클레오티드에 결합시키는 단계를 포함하여 실질적으로 모든 라이브러리 구성요소의 올리고누클레오티드 부분이 PCR 프라이머 서열을 포함하는 서열로 끝나도록 한다. 캡핑 서열은 최종 합성의 생성물이 모인 분획에 결합시켜 첨가한다. 캡핑 서열은 라이브러리 구성에 사용된 효소적 방법을 사용하여 첨가할 수 있다.
한 실시 양태에서는, 동일한 캡핑 서열을 라이브러리의 모든 구성요소에 결합시킨다. 다른 실시 양태에서는 여러 개의 캡핑 서열을 사용한다. 이 실시 양태에서, 가변성 염기를 갖는 올리고누클레오티드 캡핑 서열은 예를 들면 최종 합성 사이클 이후 라이브러리 구성요소에 결합시킨다. 한 실시 양태에서는, 최종 합성 사이클 이후, 분획들을 모으고, 다시 분획들로 분할하는데, 각각의 분획에는 서로 다른 캡핑 서열이 첨가되어 있다. 또는 최종 합성 사이클 이후, 여러 캡핑 서열을 모은 라이브러리에 첨가할 수 있다. 두 실시 양태 모두, 최종 라이브러리 구성요소는 2 개 이상의 서로 다른 캡핑 서열을 포함하는 확인 올리고누클레오티드에 연결된 특정 작용 성분을 포함하는 분자를 갖는다.
한 실시 양태에서는, 캡핑 프라이머가 가변성, 즉 변성 누클레오티드를 갖는 올리고누클레오티드를 포함한다. 캡핑 프라이머 내의 이러한 변성 염기들은 빌딩 블록 조합이 PCR 복제의 결과 (동일한 서열) 인지 또는 분자의 독립적인 발현 (다른 서열) 인지를 결정함으로써 해당 라이브러리 분자를 확인한다. 예를 들면, 이러한 변성 염기는 코드된 라이브러리를 생물학적으로 선별하는 중에 확인된 거짓 양성의 잠정적인 수를 줄일 수 있다.
다른 실시 양태에서, 캡핑 프라이머는 하기 서열을 포함하거나 갖는다 : 이 프라이머에서 변성 영역의 설계는 DNA 서열 분석을 개선하며, 변성 B 염기 옆에서 이를 중단하는 A 염기는 3 개 이상의 염기가 단일 중합체로 연장되는 것을 방지하고 서열 정렬을 용이하게 한다.
한 실시 양태에서, 변성 캡핑 올리고누클레오티드는 적합한 효소를 사용하여 라이브러리의 구성요소에 결합되며, 변성 캡핑 올리고누클레오티드의 상부 가닥은 결과적으로 DNA 폴리머라제와 같은 적합한 효소를 이용하여 중합시킨다.
다른 실시 양태에서는, PCR 프라이밍 서열이 "만능 어댑터(universal adaptor)" 또는 "만능 프라이머(universal primer)" 이다. 본원에 사용된 바와 같이 "만능 어댑터" 또는 "만능 프라이머" 는 독특한 PCR 프라이밍 영역, 즉 예를 들면, 길이가 약 5, 7, 10, 13, 15, 17, 20, 22 또는 25 개 누클레오티드를 함유하는 올리고누클레오티드이고 독특한 서열 프라이밍 영역, 예를 들면, 길이가 약 5, 7, 10, 13, 15, 17, 20 22 또는 25 개 누클레오티드에 인접하게 위치하고 있으며, 임의로 4 개의 데옥시리보누클레오티드(즉, A, C, G, T) 중 하나 이상으로 이루어진 독특한 식별용 주요 서열(또는 샘플 확인 서열)이 뒤따를 수 있다.
본원에 사용된 용어 "식별용 주요 서열(discriminating key sequence)" 또는 "샘플 확인 서열(sample identifier sequence)" 은 샘플로부터 분자 개체에 특이하게 표지하는 데 사용될 수 있는 서열을 나타낸다. 각각이 독특한 샘플 확인 서열을 갖는 여러 샘플을, 개별 샘플의 분석을 위한 DNA 서열화 후, 혼합하고, 서열을 결정하고, 다시 분류할 수 있다. 동일한 식별용 서열을 전체 라이브러리에 사용할 수 있으며, 또는 서로 다른 식별용 주요 서열을 다른 라이브러리를 추적하는데 사용할 수 있다. 한 실시 양태에서, 식별용 주요 서열은 5' PCR 프라이머, 3' PCR 프라이머 또는 두 프라이머 모두에 존재할 수 있다. 만일 PCR 프라이머가 모두 샘플 확인 서열을 갖는다면, 독특한 샘플 확인 서열과 함께 혼합된 다른 샘플의 수는 각 프라이머에 대한 샘플 확인 서열의 갯수의 곱이다. 따라서, 10 개의 다른 5' 샘플 확인 서열 프라이머는 10 개의 다른 3' 샘플 확인 서열 프라이머와 혼합되어 100 개 다른 샘플 확인 서열 조합을 생성할 수 있다.
한 실시 양태에서, 식별용 주요 서열은 길이가 약 4, 5, 6, 7, 8, 9 또는 10 개의 누클레오티드로 이루어진다. 다른 실시 양태에서는, 식별용 주요 서열이 약 1-4 개의 누클레오티드의 조합물이다. 또다른 실시 양태에서는, 각각의 만능 어댑터의 길이는 약 44 개의 누클레오티드이다. 한 실시 양태에서 만능 어댑터는 T4 DNA 리가제를 이용하여 코드된 올리고누클레오티드의 말단에 결합시킨다. 서로 다른 만능 어댑터는 특별히 각각 라이브러리 제조법에 따라 설계할 수 있으며, 따라서 각각의 라이브러리에 독특한 확인체를 제공할 것이다. 만능 어댑터의 크기 및 서열은 당 분야의 숙련자에 의해 필요에 따라 변형시킬 수 있다.
앞서 지적한 바와 같이 본 발명의 방법의 일부인 올리고누클레오티드 표지의 핵 서열은 폴리머라제 서열 반응(PCR)을 사용하여 결정할 수 있다.
올리고누클레오티드 표지는 본원에 기재된 작용 성분을 구성하는 빌딩 블록을 확인하는 폴리누클레오티드로 이루어져 있다. 올리고누클레오티드 표지의 핵산 서열은 다음과 같이 올리고누클레오티드 표지를 PCR 반응에 적용하여 결정한다. 적합한 샘플을 PCR 프라이머 쌍과 접촉시키는데, 쌍의 각각의 구성요소는 사전에 선택된 누클레오티드 서열을 갖는다. PCR 프라이머 쌍은 코드된 올리고누클레오티드 표지 상의 PCR 프라이머 결합 부위에 혼성화시켜 프라이머 연장 반응을 개시할 수 있다. PCR 프라이머 결합 부위는 코드된 올리고누클레오티드 표지 내로 설계하는 것이 바람직하다. 예를 들면, PCR 프라이머 결합 부위는 개시 올리고누클레오티드 표지내로 혼입할 수 있으며, 제 2 PCR 프라이머 결합 부위는 최종 올리고누클레오티드 표지일 수 있다. 또한, 제 2 PCR 프라이머 결합 부위는 본원에 기재된 바와 같이 캡핑 서열내로 혼입시킬 수 있다. 바람직한 실시 양태에서는, PCR 프라이머 결합 부위의 길이가 약 5, 7, 10, 13, 15, 17, 20, 22 또는 25 개 이상의 누클레오티드이다.
PCR 반응은 바람직하게는 예정된 양의 PCR 프라이머쌍을 바람직하게는 예정된 양의 코드된 올리고누클레오티드의 핵산과 PCR 완충제 중에서 혼합하여 PCR 반응 혼합물을 형성하여 수행한다. 이 혼합물을 대개 PCR 반응 생성물을 형성하는 데 충분하도록 사전에 결정된 사이클의 수만큼 열순환시킨다. 충분한 양의 생성물을 충분한 양으로 분리하여 DNA 서열을 결정할 수 있다.
PCR 은 대체로 열순환에 의해 수행하는데, 즉, PCR 반응 혼합물의 온도를 상한선이 약 30 ℃ 내지 약 55 ℃ 이고 하한선이 약 90 ℃ 내지 약 100 ℃ 인 온도 범위 내에서 올렸다 내렸다를 반복하여 수행한다. 온도를 올리고 내리는 것은 연속적일 수 있으며, 폴리누클레오티드 합성, 변성 및 혼성화에 호의적인 온도에서 상대적인 온도 안정도를 기간에 따라 단계적일 수 있다.
PCR 반응은 임의의 적합한 방법을 사용하여 수행한다. 일반적으로 완충 수용액, 즉 바람직하게는 pH 가 7 내지 9 인 PCR 완충제에서 수행한다. 프라이머가 몰과량 존재하는 것이 바람직하다. 많은 양이 과잉되어 방법의 효율을 개선하는 것이 바람직하다.
PCR 완충제는 또한 데옥시리보누클레오티드 트리포스페이트(폴리누클레오티드 합성 치환체) dATP, dCTP, dGTP 및 dTTP 및 대체로 열에 안정한 폴리머라제를 모두 프라이머 연장(폴리누클레오티드 합성) 반응에 적합한 양으로 함유한다. 생성된 용액(PCR 혼합물) 을 약 90 ℃ 내지 100 ℃ 로 약 1 내지 10 분, 바람직하게는 1 내지 4 분 동안 가열한다. 이 가열 기간 후, 용액을 54 ℃ 로 냉각시키는데, 상기 온도는 프라이머 혼성화에 바람직하다. 합성 반응은 실온 내지 폴리머라제(유도제)가 더 이상 효과적으로 작용하지 않는 온도 범위 내에서 일어날 수 있다. 따라서, 예를 들어, DNA 폴리머라제를 사용한다면, 온도는 일반적으로 약 40 ℃ 이하이다. 열순환은 원하는 양의 PCR 생성물이 생성될 때까지 반복한다. PCR 완충제의 일예로 하기의 시약을 포함한다 : 50 mM KCl ; 10 mM Tris-HCL(pH 8.3) ; 1.5 mM MgCl2 ; 0.001 %(wt/vol) 젤라틴, 200 μM dATP ; 200 μM dTTP ; 200 μM dCTP ; 200 μM dGTP ; 및 완충제 100 ㎕ 당 2.5 유닛 호열성 세균(Thermus aquaticus, Taq) DNA 폴리머라제 I.
프라이머 서열을 연장하는데 적합한 효소는 예를 들면, E. coli DNA 폴리머라제 I, Taq DNA 폴리머라제, E. Coli DNA 폴리머라제 I 의 클레나우 단편(Klenow fragment), T4 DNA 폴리머라제, 기타 유효한 DNA 폴리머라제, 역전사 효소 및 열안정성 효소를 비롯한 기타 효소를 포함하며, 이들은 적절한 방식으로 누클레오티드의 조합을 용이하게 하여 각각의 핵산 가닥에 상보적인 프라이머 연장 생성물을 형성할 것이다. 일반적으로 합성은 각 프라이머의 3' 말단에서 개시되며, 합성이 종결될 때까지 주형 가닥을 따라 5' 방향으로 진행되어, 다른 길이를 갖는 분자들을 생성할 것이다.
새로 합성된 DNA 가닥과 그에 상보적인 가닥은 이중 가닥 분자를 형성하며, 이는 이후의 분석 방법의 다음 단계들에서 사용될 수 있다.
PCR 증폭 방법은 미국 특허 제 4,683,192 호, 제 4,683,202 호, 제 4,800,159 호 및 제 4,965,188 호에 상세히 기재되어 있으며, 적어도 PCR 기술에 개시되어 있다 : Principles and Applications for DNA Amplification, H. Erlich, ed., Stockton Press, New York (1989) ; 및 PCR protocols : A Guide to Methods and Applications, Innis et al., eds., Academic Press, San Diego, Calif. (1990). 상기 문헌들의 내용은 본원에 참고문헌으로 인용되었다.
일단, 코드된 올리고누클레오티드 표지가 증폭되면, 누클레오티드 서열들의 서열을 결정하는 공지된 방법인 핵산 서열 분석법을 이용하여 표지의 서열 및 궁극적으로는 선택된 분자의 조성을 결정할 수 있다. 핵산 서열 분석법은 (a) 프로브 가닥 및 그의 상보성 표적의 혼성화 또는 변성에 기초한 물리화학적 기술, 및 (b) 폴리머라제와의 효소적 반응을 조합하여 접근한다.
본 발명은 또한 본 발명의 방법을 이용하여 생성할 수 있는 화합물 및 화학 구조들의 라이브러리를 형성하는 분리되거나 또는 혼합된 상기 화합물의 집합에 관한 것이다. 본 발명의 화합물은 하기 화학식 I 의 화합물을 포함한다 : 화학식 I 이 식에서, X 는 하나 이상의 빌딩 블록을 포함하는 작용 성분이고 ; Z 는 B 의 3' 말단에 결합된 올리고누클레오티드이고 ; Y 는 C 의 5' 말단에 결합된 올리고누클레오티드이고 ; A 는 X 와 공유결합을 형성하는 작용 성분이고 ; B 는 Z 의 3' 말단과 결합을 형성하는 작용 성분이고 ; C 는 Y 의 5' 말단과 결합을 형성하는 작용 성분이며 ; D, F 및 E 는 작용 성분 A, C 및 B 내지 S 를 연결하는 화학기이며 ; S 는 원자 또는 분자 스캐폴드이다. D, E 및 F 는 각각 독립적으로 알킬렌 사슬 또는 올리고(에틸렌 글리콜) 사슬과 같은 원자들의 사슬인 것이 바람직하며, D, E 및 F 는 같거나 다를 수 있으며, 두 올리고누클레오티드의 혼성화와 작용 성분의 합성을 수행하는 데 효과적인 것이 바람직하다.
Y 및 Z 는 실질적으로 상보적이며, 적합한 조건 하에 왓슨 - 크릭 (Watson-Crick) 염기쌍 및 이합체를 형성할 수 있도록 화합물 내에 배치되어 있는 것이 바람직하다. Y 및 Z 는 같은 길이 또는 다른 길이를 갖는다. Y 및 Z 가 같은 길이를 갖거나 Y 및 Z 중 하나가 다른 하나 보다 1 내지 10 개 염기만큼 더 긴 것이 바람직하다. 바람직한 실시 양태에서, Y 및 Z 는 각각 10 개 이상의 염기를 갖고 10 개 이상의 염기쌍이 상보적인 영역을 갖는다. 보다 바람직한 것은 Y 및 Z 가 실질적으로 전체 길이에 있어서 상보적인 것, 즉 10 개 염기쌍마다 하나의 염기가 다른 것이다. 가장 바람직한 것은 Y 및 Z 가 전체 길이에 있어서 상보적인 것, 즉, Y 또는 Z 의 돌출 영역을 제외하고 상보적인 것이며, 가닥들이 전체 길이 동안 어긋나지 않고 일치하는 왓슨 - 크릭 염기쌍으로 혼성화된 것이다.
S 는 단일 원자이거나 분자 스캐폴드일 수 있다. 예를 들면, S 는 탄소 원자, 붕소 원자, 질소 원자 또는 인 원자 또는 인산기와 같은 다원자 스캐폴드 또는 시클로알킬, 시클로알케닐, 헤테로시클로알킬, 헤테로시클로알케닐, 아릴 또는 헤테로아릴기와 같은 고리형기일 수 있다. 한 실시 양태에서, 링커는 하기 구조식의 기이다 : 이 식에서, n, m 및 p 각각은 독립적으로 1 내지 약 20 의 정수, 바람직하게는 2 내지 8 의 정수, 보다 바람직하게는 3 내지 6 의 정수이다. 한 특정 실시 양태에서, 링커는 하기 도시된 구조를 갖는다 : .
한 실시 양태에서, 본 발명의 라이브러리는 빌딩 블록으로 이루어진 작용 성분으로 이루어진 분자를 포함하며, 각각의 작용 성분은 코드된 올리고누클레오티드에 효과적으로 결합되어 있다. 코드된 올리고누클레오티드의 누클레오티드 서열은 작용 성분 내 존재하는 빌딩 블록의 지표이며, 몇몇 실시 양태에서는 빌딩 블록의 연결 또는 배치를 나타낸다. 본 발명은 작용 성분을 구성하는데 사용되는 방법 및 올리고누클레오티드 표지를 구성하는데 사용되는 방법이 동일한 반응 매질, 바람직하게는 수성 매질에서 수행할 수 있어, 종래의 기술의 방법에 비해 라이브러리를 제조하는 방법을 단순화할 수 있다. 올리고누클레오티드 결합 단계 및 빌딩 블록 첨가 단계를 모두 수성 매질에서 수행할 수 있는 특정 실시 양태에서, 각각의 반응은 서로 다른 최적의 pH 를 갖는다. 이들 실시 양태에서, 빌딩 블록 첨가 반응은 적합한 수성 완충제 중에서 적합한 pH 및 온도에서 수행할 수 있다. 이어서, 완충제를 올리고누클레오티드 결합에 적합한 pH 를 제공하는 수성 완충제로 교환할 수 있다.
다른 실시 양태에서, 본 발명은 하기 화학식 II 의 화합물 및 이러한 화합물을 포함하는 라이브러리를 제공한다 :
이 식에서, X 는 분자 스캐폴드이고 ; 각각의 Y 는 독립적으로 주변 잔이기고 ; n 은 1 내지 6 의 정수이고 ; 각각의 A 는 독립적으로 빌딩 블록이고 ; n 은 0 내지 약 5 의 정수이고 ; L 은 연결 잔기이며 ; Z 는 구조 뺀 -X(Y)n 을 확인하는 단일 가닥 또는 이중 가닥 올리고누클레오티드이다. 구조 X(Y)n 는 예를 들면 표 8 (이하 참조)에 기재된 스캐폴드 구조 중 하나일 수 있다. 한 실시 양태에서, 본 발명은 하기 화학식 III 의 화합물 및 이러한 화합물을 포함하는 라이브러리를 제공한다 :
이 식에서, t 는 0 내지 약 5 의 정수, 바람직하게는 0 내지 3 의 정수이고 ; 각각의 A 는 독립적으로 빌딩 블록이고 ; L 은 결합 성분이고 ; Z 는 A 및 R1, R2, R3 및 R4 를 확인하는 단일 가닥 또는 이중 가닥 올리고누클레오티드이고 ; R1, R2, R3 및 R4 은 각각 독립적으로 수소, 알킬, 치환 알킬, 헤테로알킬, 치환 헤테로알킬, 시클로알킬, 헤테로시클로알킬, 치환 시클로알킬, 치환 헤테로시클로알킬, 아릴, 치환 아릴, 아릴알킬, 헤테로아릴알킬, 치환 아릴알킬, 치환 헤테로아릴알킬, 헤테로아릴, 치환 헤테로아릴, 알콕시, 아릴옥시, 아미노 및 치환 아미노로부터 선택된 치환체이다. 한 실시 양태에서, A 각각은 아미노산 잔기이다.
화학식 II 또는 화학식 III 의 화합물을 포함하는 라이브러리는 화학식 II 또는 화학식 III 의 화합물을 적어도 약 100 ; 1,000 ; 10,000 ; 100,000 ; 1,000,000 또는 10,000,000 개 포함할 수 있다. 한 실시 양태에서, 라이브러리는 화학식 II 또는 화학식 III 의 화합물을 적어도 약 100 ; 1,000 ; 10,000 ; 100,000 ; 1,000,000 또는 10,000,000 개 포함하는 라이브러리를 생성하도록 설계된 방법을 통해 제조된다.
본 발명의 장점 중 하나는 엄청난 수의 화합물을 포함하는 라이브러리를 제조하는 데 사용될 수 있다는 것이다. 폴리머라제 연쇄 반응(PCR)과 같은 공지된 방법들을 사용하여 코드된 올리고누클레오티드 서열을 증폭할 수 있다는 것은 비교적 적은 복제물이 회수된다 할지라도 선택된 분자를 확인할 수 있음을 의미한다. 이로써 고도의 복잡성으로 인해 임의의 주어진 라이브러리 구성요소에 대해 비교적 적은 수의 복제물만을 갖거나 대용량으로 사용해야 하는 대형 라이브러리의 실질적인 사용이 가능하다. 예를 들면, 108 개의 개별 구조로 이루어졌으며, 각각의 구조는 1 x 1012 개의 복제물(약 1 피코몰)을 갖는 라이브러리는 1 μM 유효 농도의 용액 100 L 가 필요하다. 같은 라이브러리의 경우, 각 구성요소가 1,000,000 개의 복제물로 표현되다면, 필요한 용적은 1 μM 유효 농도에서 100 ㎕ 이다.
한 바람직한 실시 양태에 따르면, 라이브러리가 각 라이브러리 구성요소의 약 103 내지 약 1015 개 복제물을 포함한다. 라이브러리 구성요소들 중 합성 효율에 차이가 있다면, 서로 다른 라이브러리 구성요소는 임의의 주어진 라이브러리에서 다른 수의 복제물을 가질 것이다. 따라서, 라이브러리 내 이론적으로 존재하는 각 구성요소의 복제물의 수가 동일할 수는 있지만 임의의 주어진 라이브러리 구성요소의 복제물의 실질적인 수는 임의의 다른 구성요소의 복제물의 수와 무관한다. 본 발명의 화합물 라이브러리는 각 라이브러리 구성요소 또는 실질적으로 모든 라이브러리 구성요소의 약 105, 106 또는 107 개의 복제물을 포함하는 것이 바람직하다. "실질적으로 모든" 라이브러리 구성요소란 약 85 % 이상의 라이브러리 구성요소, 바람직하게는 약 90 % 이상의 라이브러리 구성요소, 보다 바람직하게는 약 95 % 이상의 라이브러리 구성요소를 의미한다.
라이브러리는 생물학적 표적에 대해 여러 번(즉, 2 회 이상) 선택할 수 있도록 충분한 수의 각 구성요소의 복제물을 포함하며, 최종 선택 후 남은 결합 분자의 양이 충분하여 남아 있는 분자의 올리고누클레오티드 표지의 증폭이 가능하며, 따라서, 결합 분자의 작용 성분을 확인할 수 있는 것이 바람직하다. 이러한 선택 과정이 도 6 에 개략적으로 예시되어 있으며, 도면에서, 1 및 2 는 라이브러리 구성요소를 나타내고, B 는 표적 분자를 나타내고, X 는 B 에 효과적으로 결합되어 선택 매질로부터 B 를 제거할 수 있는 잔기를 나타낸다. 이 실시예에서, 화합물 1 은 B 에 결합되지만, 화합물 2 는 B 에 결합되지 않는다. 라운드 1 로 표시된 선택 과정은 (I) 화합물 1 및 2 를 포함하는 라이브러리와 B - X 를 화합물 1 과 B 를 결합시키기에 적합한 조건 하에 접촉시키고 ; (II) 결합되지 않은 화합물 2 를 제거하고 ; (III) 화합물 1 을 B 로부터 분리하고 반응 매질로부터 BX 를 제거하는 것을 포함한다. 라운드 1 의 결과 화합물 2 에 비해 화합물 1 이 풍부한 분자 집합이 얻어진다. I - III 단계를 적용한 후속 라운드를 통해 화합물 2 에 비해 화합물 1 이 더욱 풍부하게 된다. 도 6 에는 3 라운드의 선택 과정만이 도시되었지만, 실제로는 1 라운드에서 10 라운드에 이르는 임의의 수의 라운드를 이용하여 비결합 분자에 비해 결합 분자가 원하는 만큼 풍부하게 할 수 있다.
도 6 에 도시된 실시 양태에서는, 임의의 라운드 수만큼 선택과정을 수행한 후 남은 화합물의 증폭(보다 많은 복제물의 합성)이 없었다. 이러한 증폭은 선택 과정 후 남은 화합물의 상대적인 양과 일치하지 않는 화합물 혼합물을 초래할 수 있다. 이러한 불일치는 특정 화합물이 다른 화합물보다 쉽게 합성될 수 있기 때문이며, 따라서 선택 과정 후 그들의 존재에 비례하지 않으면서 증폭될 수 있기 때문이다. 예를 들면, 화합물 2 가 화합물 1 보다 쉽게 합성될 경우, 라운드 2 이후 남겨진 분자의 증폭으로 화합물 1 에 대한 화합물 2 의 불균형적인 증폭이 초래되며, 생성된 화합물의 혼합물은 화합물 2 에 비해 화합물 1 이 훨씬 적은 비율일 것이다.
한 실시 양태에서는, 표적을 임의의 공지된 고정 기법으로 고체 지지체 상에 고정시킨다. 고체 지지체는 예를 들면, 크로마토그래피 컬럼 또는 멤브레인 내에 함유된 불수용성 매트릭스일 수 있다. 코드된 라이브러리를 크로마토그래피 컬럼 내 불수용성 매트릭스에 도포할 수 있다. 이어서, 컬럼을 세척하여 비특이적 결합제를 제거한다. pH, 염 농도, 유기 용매 농도를 변화시키거나 또는 표적에 대한 공지된 리간드와의 경쟁과 같은 다른 방법에 의해 표적 결합 화합물을 해리시킬 수 있다.
다른 실시 양태에서는 표적을 용액 내에 유리시키고 코드된 라이브러리와 함께 항온처리시킨다. 표적(본원에서는 "리간드" 로도 부름) 에 결합된 화합물을 겔 여과법 또는 미세여과법과 같은 크기 분리 단계를 통해 선택적으로 분리한다. 한 실시예에서는 코드된 화합물과 표적 생체 분자의 혼합물을 크기 배제 크로마토그래피 컬럼을 통과시키는데(겔 여과법), 상기는 결합되지 않은 화합물로부터 리간드 - 표적 복합체를 분리한다. 리간드 - 표적 복합체를 역상 크로마토그래피 컬럼으로 옮기는데, 상기 컬럼은 표적으로부터 리간드를 분리시킨다. 이어서, 분리된 리간드를 PCR 증폭 및 코드된 올리고누클레오티드의 서열 분석법에 의해 분석한다. 이러한 접근은 특히 표적의 고정이 활성의 손실을 야기할 수 있는 경우에 유리하다.
본 발명의 몇몇 실시 양태에서는 선택 방법이 서열결정에 앞서 표적에 결합되는 화합물 라이브러리의 하나 이상의 구성요소의 코드된 올리고누클레오티드를 증폭하는 것을 포함할 수 있다.
한 실시 양태에서는, 선택된 라이브러리 혼합형태에 존재하는 DNA 분자의 개체 분포에 있어서 가능한 임의의 왜곡을 최소화하기 위해 서열 분석에 앞서 코드된 올리고누클레오티드를 포함하는 화합물의 라이브러리를 증폭시킨다. 예를 들면, 선택 단계 후 소량의 라이브러리만이 회수되며 일반적으로 서열 분석에 앞서 PCR 을 이용하여 증폭시킨다. PCR 은 선택된 라이브러리 혼합형태에 존재하는 DNA 분자의 개체 분포에 있어서 왜곡을 초래할 가능성이 있다. 이는 특히 유입 분자의 수가 작고 유입 분자가 PCR 주형으로 불량할 때 문제가 된다. 초기 순환에서 생성되는 PCR 생성물은 공유 결합 이합체 라이브러리 보다 효과적인 주형이며, 따라서, 이들 분자의 최종 증폭 개체군에서의 빈도는 최초 유입된 주형 보다 높을 수 있다.
따라서, 가능한 PCR 왜곡을 최소화하기 위해, 본 발명의 한 실시 양태에서는 개개의 라이브러리 구성요소에 해당하는 단일 가닥 올리고누클레오티드의 개체군을 예를 들면, 반응 중에 하나의 프라이머를 사용하여 생성한 후 2 개의 프라이머를 이용하여 PCR 증폭시킨다. 이렇게 함으로써 PCR 을 이용한 지수적 증폭에 앞서 단일 가닥 프라이머 - 연장 생성물의 1 차 직선상의 축적이 있으며, 지수적 증폭 단계가 오직 많은 초기 분자 다양성이 프라이머 - 연장 반응 중에 생성된 분자의 개체군에 나타난 후에만 발생하기 때문에, 축적된 프라이머 - 연장 생성물 내 분자의 분포는 초기유입 주형내 존재하는 분자의 다양성과 분포를 보다 정확히 반영한다.
일단 단일 리간드를 앞서 기재한 방법으로 확인한 후, 다양한 수준의 분석을 적용하여 구조 - 활성 관계 정보를 얻고, 리간드의 친화성, 특이성 및 생체활성을 보다 최적화할 수 있다. 같은 스캐폴드로부터 유도된 리간드의 경우, 3 차원적 분자 모델링을 이용하여 리간드들에 공통되는 현저한 구조적 특성을 확인할 수 있으며, 그 결과 표적 생체 분자상의 공통 부위에 결합된 것으로 추정되는 소형 분자 리간드의 집합체를 형성할 수 있다.
다양한 선별 접근법을 이용하여 하나의 표적에 대해 높은 친화도를 갖지만 다른 밀접하게 관련된 표적에 대해서는 현저하게 약한 친화도를 보이는 리간드를 얻을 수 있다. 한가지 선별 방법은 병렬 실험으로 두 생체 분자 모두에 대한 리간드를 확인한 후, 교차 참조 비교를 통해 공통 리간드를 제거하는 것이다. 이 방법에 따르면, 각각의 생체 분자의 리간드를 앞서 기재한 바와 같이 따로따로 확인할 수 있다. 이 방법은 고정된 표적 생체 분자와 용액 중에 유리된 표적 생체 분자 모두에 대해 적용할 수 있다.
고정된 표적 생체 분자의 경우, 다른 전략은 비표적 생체 분자에 결합된 모든 리간드를 라이브러리로부터 제거하는 예비선택 단계를 추가하는 것이다. 예를 들면, 제 1 생체 분자를 앞서 기재한 바와 같이 코드된 라이브러리와 접촉시킬 수 있다. 이어서, 제 1 생체 분자에 결합하지 않은 화합물을 형성된 임의의 제 1 생체 분자 - 리간드 복합체로부터 분리한다. 제 2 생체 분자를 제 1 생체 분자에 결합하지 않은 화합물과 접촉시킨다. 제 2 생체 분자에 결합한 화합물은 앞서 기재한 바와 같이 확인할 수 있으며 제 1 생체 분자에 비해 제 2 생체 분자에 현저히 큰 친화도를 보인다.
또한, 앞서 기재한 방법으로 확인된 알려지지 않은 작용을 갖는 생체 분자의 리간드를 사용하여 생체 분자의 생물학적 작용을 결정할 수 있다. 이는 새로운 유전자 서열이 계속해서 확인된다 해도, 이들 서열에 의해 코드된 단백질의 작용 및 이들 단백질의 새로운 약물 발견 및 개발을 위한 표적으로서의 유효성을 결정하기 어려우며 어쩌면 게놈 정보를 질병의 치료에 사용함에 있어서 가장 현저한 장애물일 수 있다. 본 발명에 기재한 방법에 의해 얻어진 표적 - 특이 리간드는 표적 단백질의 기능 및 치료학적 개입에 있어서, 표적 단백질의 유효성을 이해하기 위한 전세포 생물학적 분석에 또는 적절한 동물 모델에 효과적으로 사용될 수 있다. 이러한 접근은 또한 표적이 특히 소형 분자 약물 발견에 유효한지를 확인할 수 있다.
한 실시 양태에서는, 본 발명의 라이브러리 내에 포함되는 하나 이상의 화합물을 특정 생체 분자를 위한 리간드로 확인한다. 이어서, 이들 화합물을 생체 분자에 대한 결합 능력을 알아보는 생체외 분석법으로 평가할 수 있다. 결합 화합물의 작용 성분은 올리고누클레오티드 표지 또는 링커 성분 없이 합성하는 것이 바람직하며, 이들 작용 성분은 생체 분자에 결합하는 능력을 알아보기 위해 평가한다.
또한, 생체외 무세포 또는 세포 기초 분석법을 이용하여, 세포 생체 분자에 대한 작용 성분의 결합이 생체 분자의 기능에 미치는 효과를 평가할 수 있다. 공지된 작용을 갖는 생체 분자의 경우, 분석법에는 효소 활성과 같은 활성의 직접적인 측정 또는 생체 분자에 영향을 받는 세포 기능과 같은 비간접적 측정에 의해 리간드가 존재할 경우와 부재할 경우의 생체 분자의 활성 비교를 포함할 수 있다. 만일 생체 분자가 알려지지 않은 작용을 보인다면, 그 생체 분자를 발현시키는 세포를 리간드와 접촉시킬 수 있으며, 세포의 유효성, 작용, 표현형 및/또는 유전자 발현에 대한 리간드의 효과를 평가한다. 생체외 분석법은 예를 들면, 세포 사멸 분석, 세포 증식 분석 또는 바이러스성 복제 분석일 수 있다. 예를 들면, 생체 분자가 바이러스에 의해 발현된 단백질인 경우, 바이러스에 감염된 세포를 단백질을 위한 리간드와 접촉시킬 수 있다. 이어서, 단백질에 리간드를 결합시킨 것이 바이러스의 생존력에 미치는 효과를 평가할 수 있다.
본 발명의 방법에 의해 확인된 리간드는 또한 생체내 모델 또는 사람에게서 평가할 수 있다. 예를 들면, 리간드를 생체 분자를 생성하는 동물 또는 생명체에서 평가할 수 있다. 동물 또는 생명체의 건강 상태에 있어서의 임의의 변화(예, 질병 진전)를 결정할 수 있다.
단백질 또는 핵산 분자와 같은 알려지지 않은 작용을 보이는 생체 분자의 경우, 생체 분자를 생성하는 세포 또는 유기체에 대한 생체 분자에 결합된 리간드의 효과가 생체 분자의 생물학적 작용에 관한 정보를 제공할 수 있다. 예를 들어, 특정 세포 과정이 리간드의 존재에 의해 억제되는 것이 관찰되면, 이는 상기 방법이 적어도 부분적으로 생체 분자의 작용에 의존함을 나타낸다.
본 발명의 방법을 이용하여 확인한 리간드는 또한 결합된 생체 분자에 대해 친화성 시약으로 사용될 수 있다. 한 실시 양태에서는 하나 이상의 리간드가 부착된 고체상을 사용하는 생체 분자를 포함하는 용액의 크로마토그래피를 통해 생체 분자의 친화도 정제를 수행하기 위해 이러한 리간드를 사용한다.
본 발명의 방법을 하기 실시예를 통해 추가로 예시하며, 하기 실시예는 본 발명을 제한하는 것으로 해석되어서는 안될 것이다. 도면 및 서열목록 뿐만 아니라 본 출원 전체에 걸쳐 언급된 문헌들, 특허들 및 공개된 특허 출원서들은 본원에 참고문헌으로 인용되었다.
실시예
1 : 10
5
개의 구성요소에 속하는 라이브러리의 합성 및 특성
105 개의 특정 구성요소를 포함하는 라이브러리의 합성을 다음의 시약을 사용하여 수행하였다 :
올리고누클레오티드 표지 : 1 X 리가제 완충용액 : 50 mM Tris, pH 7.5 ; 10 mM 디치오트레이톨 ; 10 mM MgCl2 ; 2.5 mM ATP ; 50 mM NaCl. 10 X 리가제 완충용액 : 500 mM Tris, pH 7.5 ; 100 mM 디치오트레이톨 ; 100 mM MgCl2 ; 25 mM ATP ; 500 mM NaCl.
사이클 1
12 개의 각각의 PCR 튜브에 물에 용해시킨 화합물 1 의 1 mM 용액의 50 μL ; 표지 1.1-1.12 중 하나의 0.80 mM 용액의 75 μL ; 10X 리가제 완충용액의 15 μL 및 10 μL 의 탈이온수를 첨가하였다. 튜브를 1 분 동안 95 ℃ 까지 가열한 다음에 10 분 동안 16 ℃ 까지 냉각시켰다. 50 μL 의 1X 리가제 완충용액에 용해시킨 5,000 유닛의 T4 DNA 리가제[2.5 μL 의 2,000,000 유닛/mL 용액(뉴 잉글랜드에 소재하는 Biolabs 에서 입수, 카달로그 번호 제 M0202 호)]를 각각의 튜브에 첨가하고 결과적으로 생성된 용액을 16 시간 동안 16 ℃ 에서 항온하였다.
결합시킨 후에, 시료를 1.5 ml Eppendorf 튜브에 옮기고 20 μL 의 5 M 수성 NaCl 및 500 μL 의 냉각(- 20 ℃)시킨 에탄올로 처리하고 1 시간 동안 - 20 ℃ 에 두었다. 원심분리한 후에, 상청액을 제거하고 펠 렛을 - 20 ℃ 에서 70 % 수성 에탄올로 세척하였다. 그런 다음 각각의 펠렛을 pH 9.4, 150 μL 의 150 mM 붕산나트륨 완충용액에 용해시켰다.
각각 0.25 M 의 농도로 빌딩 블록 전구체 BB1 내지 BB12 중 하나, N,N-디이소프로필에탄올아민 및 0-(7-아자벤조트리아졸-1-일)-1,1,3,3-테트라메틸우로늄 헥사플루오르포스페이트를 포함하는 원액을 DMF 에서 제조하였고 20 분 동안 실온에서 교반시켰다. 빌딩 블록 전구체 용액을 링커에 대한 10 배 초과량의 빌딩 블럭 전구체를 제공하기 위해 상기한 각각의 펠렛 용액에 첨가하였다. 결과적으로 생성된 용액을 교반시켰다. 추가적인 10 당량의 빌딩 블록 전구체를 20 분 후에 반응 혼합물에 첨가하고 40 분 후에 또다른 10 당량을 첨가하였다. 반응 혼합물에 용해시킨 DMF 의 최종 농도는 22 % 이다. 그런 다음 반응 용액을 4 ℃ 에서 밤새 교반시켰다. 반응 과정을 50 mM 수성 테트라에틸암모늄 아세테이트(pH = 7.5) 및 아세토니트릴, 및 2-46 % 아세토니트릴의 기울기를 사용하여 14 분 동안 RP-HPLC 로 모니터하였다. ~95 % 의 출발물질(링커)이 아실화되었을 때 반응을 중단하였다. 아실화시킨 다음, 반응 혼합물을 풀링시키고 건조시키기 위해 동결건조시켰다. 그런 다음 동결건조시킨 물질을 HPLC 로 정제하고 라이브러리(아실화시킨 산물)에 대응하는 분획을 풀링시키고 동결건조시켰다.
라이브러리를 2.5 ml 의 0.01 M 인산나트륨 완충용액(pH = 8.2)에 용해시키고 0.1 ml 의 피페리딘(4 % v/v)을 이에 첨가하였다. 피페리딘의 첨가는 혼합으로 용해되지 않는 혼탁도를 결과로서 나타나게 하였다. 반응 혼합물을 실온에서 50 분 동안 교반시킨 다음 혼탁한 용액을 원심분리(14,000 rpm)하고, 상청액을 200 μl 피펫트를 사용하여 제거하고 펠렛을 0.1 ml 의 물에서 재현탁시켰다. 수성 세척액을 상청액과 결합시키고 펠렛을 제거하였다. 반응물에서 메탄올의 최종 농도가 70 % v/v 이 되게 하기 위해 초과량의 얼음-냉각시킨 에탄올을 첨가하여 용액으로부터 탈보호시킨 라이브러리를 침전시켰다. 수성 에탄올 혼합물을 원심분리하여 라이브러리를 포함하는 백색의 펠렛을 수득하였다. 펠렛을 냉각시킨 70 % 수성 에탄올로 한 번 세척하였다. 용매를 제거한 후에, 펠렛을 공기 중에서 건조(~ 5 분)시켜 미량의 에탄올을 제거한 다음 사이클 2 에서 사용하였다. 1 회에서 사용된 표지 및 이에 대응하는 빌딩 블록 전구체를 다음의 표 1 에 기재하였다.
사이클 2-5
각각의 이러한 사이클에서, 상기의 사이클로부터 생성된 혼합된 용액을 각각 50 ul 의 12 동량의 분할량으로 나누고 PCR 튜브에 넣어 두었다. 상이한 표지를 포함하는 용액을 각각의 튜브에 첨가하고, 사이클 1 에 기재한 HPLC 정제 단계를 생략하는 점을 제외하고 사이클 1 에 기재한 바와 같이 결합, 정제 및 아실화를 사이클 3-5 에서 수행하였다. 사이클 2-5 에 대한 표지 및 빌딩 블록 전구체 사이의 대응을 표 2 에 나타내었다.
결과 :
상기한 합성 방법으로 125(약 249,000) 개의 상이한 구조를 포함하는 라이브러리를 생산할 수 있다. 라이브러리의 합성은 각각의 사이클의 산물을 겔 전기영동하여 모니터하였다. 각각의 5 번의 사이클 및 종결 프라이머의 결합 후의 최종 라이브러리의 결과를 도 7 에 나타내었다. "헤드 피스(head piece)" 를 표지한 화합물은 화합물 1 이다. 도면은 각각의 사이클이 예측된 분자량의 증가를 나타내고 각각의 사이클의 산물의 분자량이 실질적으로 균질함을 나타낸다.
실시예
2 : 10
8
개의 구성요소에 속하는 라이브러리의 합성 및 특성
108 개의 특정 구성요소를 포함하는 라이브러리의 합성을 다음의 시약을 사용하여 수행하였다 :
1X 리가제 완충용액 : 50 mM 트리스, pH 7.5 ; 10 mM 디티오트레이톨 ; 10 mM MgCl2 ; 2 mM ATP ; 50 mM NaCl. 10X 리가제 완충용액 : 500 mM 트리스, pH 7.5 ; 100 mM 디티오트레이톨 ; 100 mM MgCl2 ; 20 mM ATP ; 500 mM NaCl.
화합물 2 에 대한 물 용해성
스페이서의
부착
4 ℃ 로 냉각시킨 붕산나트륨 완충용액(150 mM, pH 9.4)에 용해시킨 화합물 2 의 용액(60 mL, 1 mM)에 N,N-디메틸포름아미드(DMF)(16 mL, 0.15 M)에 용해시킨 40 당량의 N-Fmoc-15-아미노-4,7,10,13-테트라옥사옥타데카노익 산(S-Ado)을 첨가한 다음에 물(9.6 mL, 0.25 M)에 용해시킨 40 당량의 4-(4,6-디메톡시[1.3.5]트리아진-2-일)-4-메틸모르폴리늄 염화 수화물(DMTMM)을 첨가하였다. 혼합물을 추가적인 40 당량의 S-Ado 및 DMTMM 을 첨가하기 전에 4 ℃ 에서 2 시간 동안 서서히 진탕시키고 추가로 4 ℃ 에서 16 시간 동안 진탕시켰다.
아실화시킨 후에, 0.1X 부피의 5 M 수성 NaCl 및 2.5X 부피의 냉각(- 20 ℃)시킨 에탄올을 첨가하고 혼합물을 적어도 1 시간 동안 - 20 ℃ 에 두었다. 그런 다음 혼합물을 4 ℃ 원심기에서 14,000 rpm 으로 15 분 동안 원심분리하여 백색의 펠렛을 수득하였으며, 상기 펠렛은 냉각시킨 EtOH 로 세척한 다음 30 분 동안 실온에서 동결건조기로 건조시켰다. 고형물을 40 mL 의 물에 용해시키고 Waters Xterra RP18 컬럼을 사용하여 역상 HPLC 로 정제하였다. pH 7.5 에서 50 mM 의 수성 트리에틸암모늄 아세테이트 완충용액 및 99 % 아세토니트릴/1 % 물의 용액을 사용하여 산물을 용출하기 위해 이원의 이동상 기울기 프로필(binary mobile phase gradient profile)을 사용하였다. 정제한 물질을 동결건조하여 농축시키고 결과적으로 생성된 잔류물을 5 mL 의 물에 용해시켰다. 0.1X 부피의 피페리딘을 용액에 첨가하고 혼합물을 실온에서 45 분 동안 서서히 진탕시켰다. 그런 다음 산물을 상기에 기재한 바와 같이 에탄올 침전하여 정제하고 원심분리하여 분리하였다. 정제한 화합물 3 을 수득하기 위해 결과적으로 생성된 펠렛을 냉각시킨 EtOH 로 두 번 세척하고 동결건조하여 건조시켰다.
사이클 1
96 웰 플레이트의 각각의 웰에 표 3 에 나타낸 바와 같이 물에 용해시킨 화합물 3 의 4 mM 용액 12.5 μL ; 올리고누클레오티드 표지 1.1 내지 1.96 중 하나의 1 mM 용액 100 μL(화합물 3 대 표지의 몰비는 1:2 임)를 첨가하였다. 플레이트를 1 분 동안 95 ℃ 로 가열한 다음 10 분 동안 16 ℃ 로 냉각시켰다. 각각의 웰에 10 μL 의 10X 리가제 완충용액, 30 유닛의 T4 DNA 리가제[1 μL 의 30 유닛/μL 용액 (Fermentas Life Science 에서 입수, 카달로그 번호 제 EL0013 호)] 및 76.5 μL 의 물을 첨가하고, 결과적으로 생성된 용액을 16 시간 동안 16 ℃ 에서 항온하였다.
결합 반응 후에, 20 μL 의 5 M 수성 NaCl 을 각각의 웰에 직접적으로 첨가한 다음 500 μL 의 냉각(- 20 ℃)시킨 에탄올을 첨가하고 1 시간 동안 - 20 ℃ 에 두었다. 플레이트를 Beckman Microplus Carriers 를 사용하여 Beckman Coulter Allegra 6R 원심분리기에서 3200 g 로 1 시간 동안 원심분리하였다. 플레이트를 거꾸로하여 상청액을 조심스럽게 제거하고 펠렛을 - 20 ℃ 에서 70 % 수성의 냉각시킨 에탄올로 세척하였다. 그런 다음 각각의 펠렛을 붕산나트륨 완충용액(50 μL, 150 mM, pH 9.4)에 용해시켜 1 mM 의 농도가 되게하고 4 ℃ 로 냉각시켰다.
각각의 용액에 DMF(13 μL, 0.15 M)에 용해시킨 40 당량의 96 개의 빌딩 블록 전구체 중 하나를 첨가한 다음 물(8 μL, 0.25 M)에 용해시킨 40 당량의 DMT-MM 을 첨가하였고, 용액을 4 ℃ 에서 서서히 진탕시켰다. 2 시간 후에, 추가적인 40 당량의 각각의 빌딩 블록 전구체 중 하나 및 DMTMM 을 첨가하고 용액을 4 ℃ 에서 16 시간 동안 서서히 진탕시켰다. 아실화시킨 후에, DMF(2 μL, 0.25 M)에 용해시킨 10 당량의 아세트산-N-히드록시-숙신이미드 에스테르를 각각의 용액에 첨가하고 10 분 동안 서서히 진탕시켰다.
아실화시킨 후에, 96 개의 반응 혼합물을 풀링시키고 0.1 부피의 5 M 수성 NaCl 및 2.5 부피의 냉각시킨 무수 에탄올을 첨가하고 용액을 적어도 1 시간 동안 - 20 ℃ 에 두었다. 그런 다음 혼합물을 원심분리하였다. 원심분리한 후에, 마이크로피펫트으로 가능한 한 많은 상청액을 제거하고 펠렛을 냉각시킨 에탄올로 세척하고 또다시 원심분리하였다. 상청액을 200 μL 피펫트로 제거하였다. 냉각시킨 70 % 에탄올을 튜브에 첨가하고 결과적으로 생성된 혼합물을 4 ℃ 에서 5 분 동안 원심분리하였다.
상청액을 제거하고 잔여 에탄올을 10 분 동안 실온에서 동결건조하여 제거하였다. 펠렛을 2 mL 의 물에 용해시킨 다음에 Waters Xterra RP18 컬럼을 갖는 역상 HPLC 로 정제하였다. pH 7.5 의 50 mM 수성 트리에틸암모늄 아세테이트 완충용액 및 99 % 아세토니트릴/1 % 물의 용액을 사용하여 라이브러리를 용출시키기 위해 이원의 이동상 기울기 프로필을 사용하였다. 라이브러리를 함유하는 분획을 수집하고 풀링시킨 다음에 동결건조하였다. 결과적으로 생성된 잔류물을 2.5 mL 의 물에 용해시키고 250 μL 의 피페리딘을 첨가하였다. 용액을 45 분 동안 서서히 진탕시킨 다음 상기한 바와 같이 에탄올로 침전시켰다. 결과적으로 생성된 펠렛을 동결건조하여 건조시킨 다음 1 mM 의 농도가 되도록 붕산나트륨 완충용액(4.8 mL, 150 mM, pH 9.4)에 용해시켰다.
용액을 4 ℃ 로 냉각시키고, DMF(1.2 mL, 0.15 M)에 용해시킨 40 당량의 N-Fmoc-프로파르길글리신 및 물(7.7 mL, 0.25 M)에 용해시킨 40 당량의 DMT-MM 을 첨가하였다. 추가적인 40 당량의 N-Fmoc-프로파르길글리신 및 DMT-MM 을 첨가하기 전에 혼합물을 4 ℃ 에서 2 시간 동안 서서히 진탕시키고 용액을 추가로 16 시간 동안 진탕시켰다. 혼합물을 상기한 바와 같이 EtOH 침전 및 역상 HPLC 로 정제한 후에 N-Fmoc 기를 상기한 바와 같이 피페리딘으로 처리하여 제거하였다. EtOH 침전에 의한 최종 정제에서 결과적으로 생성된 펠렛을 동결건조하여 건조시키고 합성의 다음 사이클을 수행하였다.
사이클 2-4
이러한 각각의 사이클에서, 이전의 사이클에서 건조시킨 펠렛을 물에 용해시키고, 라이브러리의 DNA 성분의 흡광계수를 기초로 하여 분광광도계로 라이브러리의 농도를 측정하였으며, 여기에서 화합물 2 의 초기 흡광계수는 131,500 L/(몰.cm)이다. 연속적인 결합 반응에서의 최종 농도가 0.25 mM 이 되도록 물로 라이브러리의 농도를 조절하였다. 그런 다음 라이브러리를 96 웰 플레이트에 96 동량의 분할량으로 나누었다. 각각의 웰에 상이한 표지(라이브러리 대 표지의 몰비가 1:2 임)를 포함하는 용액을 첨가하고, 사이클 1 에 기재한 바와 같이 결합을 수행하였다. 사이클 2, 3 및 4 에서 사용한 올리고누클레오티드 표지를 각각 표 4, 5 및 6 에 나타내었다. 각각의 사이클 1 내지 4 에서의 표지 및 빌딩 블록 전구체 사이의 대응을 표 7 에 나타내었다. 라이브러리를 사이클 1 에 대해 상기한 바와 같이 에탄올을 첨가하여 침전시키고 1 mM 의 농도가 되도록 붕산나트륨 완충용액(150 mM, pH 9.4)에 용해시켰다. 사이클 3 과정에서 HPLC 정제를 생략하는 점을 제외하고는 사이클 1 에 기재한 바와 같이 연속적인 아실화 및 정제를 수행하였다.
결과 :
상기한 합성 방법으로 964(약 108) 개의 상이한 구조를 포함하는 라이브러리를 생산할 수 있다. 라이브러리의 합성은 각각의 사이클의 산물을 겔 전기영동 및 LC/MS 하여 모니터하였다. 종결시 라이브러리를 몇몇의 기술을 사용하여 분석하였다. 도 13A 는 종결 프라이머를 결합하기 전이지만 사이클 4 를 수행한 다음의 라이브러리의 크로마토그램이고 ; 도 13B 는 동일한 합성 단계에서의 라이브러리의 질량 스펙트럼이다. 평균 분자량을 음이온 LC/MS 분석하여 측정하였다. 이온 신호를 ProMass 소프트웨어를 사용하여 풀었다(deconvoluted). 이러한 결과는 라이브러리의 예측된 평균 질량과 일치한다.
라이브러리의 DNA 성분을 아가로스겔 전기영동으로 분석하였고, 이는 대다수의 라이브러리 물질이 정확한 크기의 결합된 산물에 해당함을 보여준다. 라이브러리의 시료채취로부터 유도된 PCR 산물의 분자 클론의 DNA 서열 분석은 종결 직전에 DNA 결합이 높은 정확도로 일어남을 보여준다.
라이브러리 고리화(
cyclization
)
사이클 4 의 종결에서, 라이브러리의 부분을 일반적인 아실화 조건 하에서, 아지도아세트산을 사용하여 N-말단에 캡핑시켰다. EtOH 침전으로 정제한 후에, 산물을 1 mM 의 농도가 되도록 인산나트륨 완충용액(150 mM, pH 8)에 용해시키고, 물(200 mL)에 용해시킨 4 당량의 CuSO4, 물(200 mM)에 용해시킨 4 당량의 아스코르빈산 및 DMF(200 mM)에 용해시킨 용액으로서 다음에 나타낸 화합물의 촉매량을 첨가하였다. 그런 다음 반응 혼합물을 실온에서 2 시간 동안 서서히 진탕시켰다.
고리화의 정도를 평가하기 위해, 라이브러리의 고리화 반응으로부터 5 μL 의 분할량을 제거하고 실시예 4 에 기재한 바와 같이 제조한 형광성으로 표지한 아지드 또는 알킨(1 μl 의 100 mM DMF 원료)으로 처리하였다. 16 시간 후에, 500 nm 에서의 HPLC 분석시 알킨 또는 아지드 표지 중 어떤 것도 라이브러리에 결합되지 않았다. 이러한 결과는 라이브러리가 고리화첨가반응의 능력이 있는 아지드 또는 알킨기를 더 이상 함유하지 않음을 나타내고, 따라서 라이브러리는 고리화 또는 분자간 반응을 통해 라이브러리 자체와 반응해야함을 나타낸다. 고리화시킨 라이브러리를 상기한 바와 같이 역상 HPLC 로 정제하였다. 고리화시키지 않은 라이브러리를 사용한 대조 실험은 상기한 형광 표지의 완전한 결합을 보여준다.
실시예
4 : 고리화 검정에서 형광 표지의 제조
각각의 튜브에서 프로파르길 글리신 또는 2-아미노-3-페닐프로필아지드(각각 8 μmol)를 pH 9.4 의 붕산염 완충용액(250 μL)에 용해시킨 FAM-OSu(Molecular Probes Inc. 에서 입수)(1.2 당량)와 결합시켰다. 반응을 실온에서 3 시간 동안 진행시킨 다음 밤새 동결건조시켰다. HPLC 로 정제하여 정량의 수득량으로 바람직한 형광 알킨 및 아지드를 수득하였다.
실시예
5 :
아지드
/
알킨의
고리화첨가반응을 사용한 각각의 화합물의 고리화
아지도아세틸
-
Gly
-
Pro
-
Phe
-
Pra
-
NH
2
의
제조방법 :
0.3 mmol 의 Rink-아미드 수지를 사용하여, 활성화 제제(Pra=C-프로파르길글리신)로서 Fmoc-보호된 아미노산 및 HATU 를 사용하는 표준 고체상 합성 기술로 나타낸 서열을 합성하였다. 아지도아세트산을 테트라펩티드를 캡핑시키기 위해 사용하였다. 4 시간 동안 20 % TFA/DCM 으로 수지로부터 펩티드를 절단하였다. RP HPLC 로 정제하여 백색 고형(75 ㎎, 51 %)의 산물을 수득하였다.
아지도아세틸
-
Gly
-
Pro
-
Phe
-
Pra
-
NH
2
의
고리화 :
아지도아세틸 펩티드(31 ㎎, 0.62 mmol)을 MeCN(30 mL)에 용해시켰다. 디이소프로필에틸아민(DIEA, 1 mL) 및 Cu(MeCN)4PF6(1 ㎎)을 첨가하였다. 1.5 시간 동안 교반시킨 후에, 용액을 증발시키고 결과적으로 생성된 잔류물을 20 % MeCN/H2O 에 흡수시켰다. 불용성 염을 제거하기 위해 원심분리한 후에, 용액을 예비의 역상 HPLC 하였다. 백색 고형(10 ㎎, 32 %)의 바람직한 시클로 펩티드를 분리하였다.
아지도아세틸
-
Gly
-
Pro
-
Phe
-
Pra
-
Gly
-
OH 의
제조방법 :
0.3 mmol 의 글리신-왕 수지를 사용하고, 활성화 제제로서 Fmoc-보호된 아미노산 및 HATU 를 사용하여 나타낸 서열을 합성하였다. 펜타펩티드를 캡핑시키기 위해 마지막 결합 단계에서 아지도아세트산을 사용하였다. 펩티드의 절단을 2 시간 동안 50 % TFA/DCM 을 사용하여 성취하였다. RP HPLC 로 정제하여 백색 고형(83 ㎎ ; 50 %)의 펩티드를 수득하였다.
아지도아세틸
-
Gly
-
Pro
-
Phe
-
Pra
-
Gly
-
OH 의
고리화 :
MeCN(60 mL)에 펩티드(32 ㎎, 0.058 mmol)를 용해시켰다. 디이소프로필에틸아민(1 mL) 및 Cu(MeCN)4PF6(1 ㎎)을 첨가하고 용액을 2 시간 동안 교반시켰다. 용매를 증발시키고 이량체 및 삼량체를 제거하기 위해 조산물(crude product)을 RP HPLC 하였다. 무색 유리(6 ㎎, 20 %)의 시클로 단량체를 분리하였다.
DNA
에 대한 선형 펩티드의 접합 :
화합물 2(45 nmol)를 45 μL 붕산나트륨 완충용액(pH 9.4 ; 150 mM)에 용해시켰다. 4 ℃ 에서, 선형 펩티드(DMF 에 용해시킨 18 μL 의 100 mM 원료 ; 180 nmol ; 40 당량)를 첨가한 다음 DMT-MM(물에 용해시킨 3.6 μL 의 500 mM 원료 ; 180 nmol ; 40 당량)을 첨가하였다. 2 시간 동안 교반시킨 후에, LCMS 는 완전 반응을 나타내었고 산물을 에탄올 침전시켜 분리하였다.
DNA
에 대한
시클로
펩티드의 접합 :
화합물 2(20 nmol)를 20 μL 붕산나트륨 완충용액(pH 9.4, 150 mM)에 용해시켰다. 4 ℃ 에서, 선형 펩티드(DMF 에 용해시킨 8 μL 의 100 mM 원료 ; 80 nmol ; 40 당량)를 첨가한 다음 DMT-MM(물에 용해시킨 1.6 μL 의 500 mM 의 원료 ; 80 nmol ; 40 당량)을 첨가하였다. 2 시간 동안 교반시킨 후에, LCMS 은 완전 반응을 나타내었고 산물을 에탄올 침전시켜 분리하였다.
DNA
-
결합된
펩티드의 고리화 :
선형 펩티드-DNA 접합물(10 nmol)을 pH 8 의 인산나트륨 완충용액(10 μL, 150 mm)에 용해시켰다. 실온에서, 4 당량의 각각의 CuSO4, 아스코르빈산 및 Sharpless 리간드 모두를 첨가하였다(0.2 μL 의 200 mM 원료). 반응물을 밤새 반응시켰다. RP HPLC 는 선형 펩티드-DNA 가 존재하지 않음을 보여주고, 산물이 표준의 시클로 펩티드-DNA 와 함께 공동으로 용출되었음을 보여준다. 미량의 이량체 또는 그밖의 올리고머가 관찰되지 않았다.
실시예
6 : 작동 성분의 합성에 대한 방향족
친핵성
치환반응의 적용
염화시아닌을
사용한 화합물
3 의
아실화를
위한 일반적인 방법 :
화합물 2 를 1 mM 의 농도에서 pH 9.4 의 붕산나트륨 완충용액에 용해시켰다. 용액을 4 ℃ 로 냉각시킨 다음 20 당량의 염화시아닌을 MeCN 에 용해시킨 500 mM 용액으로 첨가하였다. 2 시간 후에, 종결 반응을 LCMS 하여 확인하였고, 결과적으로 생성된 디클로로트리아진-DNA 접합물을 에탄올 침전시켜 분리하였다.
디클로로트리아진
-
DNA 의
아민 치환을 위한 방법 :
디클로로트리아진-DNA 접합물을 1 mM 의 농도에서 pH 9.5 의 붕산염 완충용액에 용해시켰다. 실온에서, 40 당량의 지방족 아민을 DMF 용액으로 첨가하였다. LCMS 한 다음에 반응은 2 시간 후에 일반적으로 종결되었다. 결과적으로 생성된 알킬아미노-모노클로로트리아진-DNA 접합물을 에탄올 침전시켜 분리하였다.
모노클로로트라이진
-
DNA 의
아민 치환을 위한 방법 :
알킬아미노-모노클로로트리아진-DNA 접합물을 1 mM 의 농도에서 pH 9.5 의 붕산염 완충용액에 용해시켰다. 42 ℃ 에서, 40 당량의 제 2 의 지방족 아민을 DMF 용액으로 첨가하였다. LCMS 한 다음에 반응은 2 시간 후에 일반적으로 종결되었다. 결과적으로 생성된 디아미노트리아진-DNA 접합물을 에탄올 침전시켜 분리하였다.
실시예
7 : 작동 성분의 합성에 대한 환원성
아미노화
반응의 적용
알데히드 빌딩 블록과 함께 제
2 급
아민을
포함하는
DNA
-링커의 환원성
아미노화
반응을 위한 일반적인 방법 :
화합물 2 를 N-말단 프롤린 잔기에 결합시켰다. 결과적으로 생성된 화합물을 1 mM 의 농도에서 인산나트륨 완충용액(50 μL, 150 mM, pH 5.5)에 용해시켰다. 이러한 용액에 DMF(8 μL, 0.25 M)에 용해시킨 40 당량의 알데히드 빌딩 블록 및 DMF(8 μL, 0.25 M)에 용해시킨 40 당량의 소듐 시아노보로하이드라이드를 첨가하고, 용액을 2 시간 동안 80 ℃ 에서 가열하였다. 아실화시킨 후에, 용액을 에탄올 침전시켜 정제하였다.
아민 빌딩 블록과 함께 알데히드를 포함하는
DNA
-링커의 환원성
아
미노화를 위한 일반적인 방법 :
알데히드기를 포함하는 빌딩 블록에 결합한 화합물 2 를 1 mM 의 농도에서 인산나트륨 완충용액(50 μL, 250 mM, pH 5.5)에 용해시켰다. 이러한 용액에 DMF(8 μL, 0.25 M)에 용해시킨 40 당량의 아민 빌딩 블록 및 DMF(8 μL, 0.25 M)에 용해시킨 40 당량의 소듐 시아노보로하이드라이드를 첨가하고, 용액을 2 시간 동안 80 ℃ 에서 가열하였다. 아실화시킨 후에, 용액을 에탄올 침전시켜 정제하였다.
실시예
8 : 작동 성분의 합성에 대한
펩토이드
빌딩 반응의 적용
DNA
-링커에 대한
펩토이드
합성에 대한 일반적인 절차 :
화합물 2 를 1 mM 의 농도에서 붕산나트륨 완충용액(50 μL, 150 mM, pH 9.4)에 용해시키고 4 ℃ 로 냉각시켰다. 이러한 용액에 DMF(13 μL, 0.15 M)에 용해시킨 40 당량의 N-히드록시숙신이미딜 브로모아세테이트를 첨가하고 용액을 2 시간 동안 4 ℃ 에서 서서히 진탕시켰다. 아실화시킨 후에, DNA-링커를 에탄올 침전시켜 정제하고 1 mM 의 농도에서 붕산나트륨 완충용액(50 μL, 150 mM, pH 9.4)에 재용해시키고 4 ℃ 로 냉각시켰다. 이러한 용액에 DMF(13 μL, 0.15 M)에 용해시킨 40 당량의 아민 빌딩 블록을 첨가하고 용액을 16 시간 동안 4 ℃ 에서 서서히 진탕시켰다. 아킬화시킨 후에, DNA-링커를 에탄올 침전시켜 정제하고 1 mM 의 농도에서 붕산나트륨 완충용액(50 μL, 150 mM, pH 9.4)에 재용해시키고 4 ℃ 로 냉각시켰다. N-히드록시숙신이미딜 브로모아세테이트을 서서히 첨가한 다음에 아민 빌딩 블록을 첨가하여 펩토이드 합성을 계속하였다.
실시예
9 : 작용 성분의 합성에 대한
아지드
-
알킨
고리화첨가반응의 적용
일반적인 방법 :
알킨-함유 DNA 접합물을 약 1 mM 의 농도에서 pH 8.0 의 인산염 완충용액에 용해시켰다. 실온에서, 이러한 혼합물에 10 당량의 유기 아지드 및 5 당량의 각각의 황산구리(Ⅱ), 아스코르빈산 및 리간드 (트리스-((1-벤질트리아졸-4-일)메틸)아민을 첨가하였다. LCMS 한 다음에 반응은 1-2 시간 후에 일반적으로 종결되었다. 결과적으로 생성된 트리아졸-DNA 접합물을 에탄올 침전시켜 분리하였다.
실시예
10 :
코드된
라이브러리 내로부터
Abl
키나제에
대한
리간드의
확인
바람직하지 않은 라이브러리 구성요소에서 DNA-코드된 라이브러리에 흥미로운 분자를 풍부하게 하는 능력은 흥미로운 치료학적 표적에 대한 한정된 성질을 갖는 단일 화합물을 확인하는데 중요하다. 이러한 풍부하게 하는 능력을 증명하기 위해, rhAbl 키나제(GenBank 제 U07563 호)에 대한 공지된 결합 분자[본원에 참고문헌으로 인용되어 있는 Shah 등의 Science 305, 399-401(2004) 참조]를 합성하였다. 실시예 1 및 2 에 기재한 방법을 통해 생산된 이러한 분자와 유사한 분자(올리고누클레오티드에 결합된 작용 성분)를 생산하기 위해 표준 화학 방법을 사용하여 상기의 실시예에서 기재한 링커를 통해 이러한 화합물을 이중가닥 DNA 올리고누클레오티드에 부착시켰다. 실시예 2 에서 기재한 바와 같이 일반적으로 생산된 라이브러리 및 DNA-결합된 Abl 키나제 결합제를 두 종류의 qPCR 분석을 가능하게 하는 특정 DNA 서열로 설계하였다. DNA-결합된 Abl 키나제 결합제를 1:1000 의 비율로 라이브러리와 혼합하였다. 이러한 혼합물을 rhAble 키나제로 평형시키고, 효소를 고체상에 포획시키고 비-결합 라이브러리 구성요소를 제거하기 위해 세척한 다음 결합 분자를 용출시켰다. 용출액에서 라이브러리 분자 대 DNA-결합된 Abl 키나제 저해제의 비율은 1:1 이며, 이는 1000 배 초과량의 라이브러리 분자에서 DNA-결합된 Abl-키나제 결합제가 500 배 보다 더 풍부함을 나타낸다.
등가물
본 분야의 숙련자는 본원에 기재된 본 발명의 특정한 실시형태에 대한 많은 등가물을 인지하거나 단지 일반적인 실험을 사용하여 확인할 수 있다. 이러한 등가물이 다음의 청구의 범위에 의해 포함되도록 의도하였다.
SEQUENCE LISTING
<110> Praecis Pharmaceuticals, Inc.
<120> METHODS FOR SYNTHESIS OF ENCODED
LIBRARIES
<130> PPI-156CPPC
<150> 11/015458
<151> 2004-12-17
<150> 60/530854
<151> 2003-12-17
<150> 60/540681
<151> 2004-01-30
<150> 60/553715
<151> 2004-03-15
<150> 60/588672
<151> 2004-07-16
<150> 60/689466
<151> 2005-06-09
<150> 60/731041
<151> 2005-10-28
<160> 890
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 1
gcaacgaag 9
<210> 2
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 2
tcgttgcca 9
<210> 3
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 3
gcgtacaag 9
<210> 4
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 4
tgtacgcca 9
<210> 5
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 5
gctctgtag 9
<210> 6
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 6
acagagcca 9
<210> 7
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 7
gtgccatag 9
<210> 8
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 8
atggcacca 9
<210> 9
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 9
gttgaccag 9
<210> 10
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 10
ggtcaacca 9
<210> 11
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 11
cgacttgac 9
<210> 12
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 12
acgctgaac 9
<210> 13
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 13
cgtagtcag 9
<210> 14
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 14
gactacgca 9
<210> 15
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 15
ccagcatag 9
<210> 16
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 16
atgctggca 9
<210> 17
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 17
cctacagag 9
<210> 18
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 18
ctgtaggca 9
<210> 19
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 19
ctgaacgag 9
<210> 20
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 20
acgacttgc 9
<210> 21
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 21
ctccagtag 9
<210> 22
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 22
actggagca 9
<210> 23
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 23
taggtccag 9
<210> 24
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 24
ggacctaca 9
<210> 25
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 25
gcgtgttgt 9
<210> 26
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 26
aacacgcct 9
<210> 27
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 27
gcttggagt 9
<210> 28
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 28
tccaagcct 9
<210> 29
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 29
gtcaagcgt 9
<210> 30
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 30
gcttgacct 9
<210> 31
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 31
caagagcgt 9
<210> 32
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 32
gctcttgct 9
<210> 33
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 33
cagttcggt 9
<210> 34
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 34
cgaactgct 9
<210> 35
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 35
cgaaggagt 9
<210> 36
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 36
tccttcgct 9
<210> 37
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 37
cggtgttgt 9
<210> 38
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 38
aacaccgct 9
<210> 39
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 39
cgttgctgt 9
<210> 40
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 40
agcaacgct 9
<210> 41
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 41
ccgatctgt 9
<210> 42
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 42
agatcggct 9
<210> 43
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 43
ccttctcgt 9
<210> 44
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 44
gagaaggct 9
<210> 45
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 45
tgagtccgt 9
<210> 46
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 46
ggactcact 9
<210> 47
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 47
tgctacggt 9
<210> 48
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 48
cgttagact 9
<210> 49
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 49
gtgcgttga 9
<210> 50
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 50
aacgcacac 9
<210> 51
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 51
gttggcaga 9
<210> 52
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 52
tgccaacac 9
<210> 53
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 53
cctgtagga 9
<210> 54
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 54
ctacaggac 9
<210> 55
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 55
ctgcgtaga 9
<210> 56
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 56
tacgcagac 9
<210> 57
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 57
cttacgcga 9
<210> 58
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 58
gcgtaagac 9
<210> 59
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 59
tggtcacga 9
<210> 60
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 60
gtgaccaac 9
<210> 61
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 61
tcagagcga 9
<210> 62
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 62
gctctgaac 9
<210> 63
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 63
ttgctcgga 9
<210> 64
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 64
cgagcaaac 9
<210> 65
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 65
gcagttgga 9
<210> 66
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 66
caactgcac 9
<210> 67
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 67
gcctgaaga 9
<210> 68
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 68
ttcaggcac 9
<210> 69
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 69
gtagccaga 9
<210> 70
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 70
tggctacac 9
<210> 71
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 71
gtcgcttga 9
<210> 72
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 72
aagcgacac 9
<210> 73
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 73
gcctaagtt 9
<210> 74
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 74
cttaggctc 9
<210> 75
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 75
gtagtgctt 9
<210> 76
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 76
gcactactc 9
<210> 77
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 77
gtcgaagtt 9
<210> 78
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 78
cttcgactc 9
<210> 79
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 79
gtttcggtt 9
<210> 80
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 80
ccgaaactc 9
<210> 81
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 81
cagcgtttt 9
<210> 82
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 82
aacgctgtc 9
<210> 83
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 83
catacgctt 9
<210> 84
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 84
gcgtatgtc 9
<210> 85
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 85
cgatctgtt 9
<210> 86
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 86
cagatcgtc 9
<210> 87
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 87
cgctttgtt 9
<210> 88
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 88
caaagcgtc 9
<210> 89
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 89
ccacagttt 9
<210> 90
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 90
actgtggtc 9
<210> 91
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 91
cctgaagtt 9
<210> 92
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 92
cttcaggtc 9
<210> 93
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 93
ctgacgatt 9
<210> 94
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 94
tcgtcagtc 9
<210> 95
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 95
ctccacttt 9
<210> 96
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 96
agtggagtc 9
<210> 97
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 97
accagagcc 9
<210> 98
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 98
ctctggtaa 9
<210> 99
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 99
atccgcacc 9
<210> 100
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 100
tgcggataa 9
<210> 101
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 101
gacgacacc 9
<210> 102
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 102
tgtcgtcaa 9
<210> 103
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 103
ggatggacc 9
<210> 104
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 104
tccatccaa 9
<210> 105
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 105
gcagaagcc 9
<210> 106
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 106
cttctgcaa 9
<210> 107
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 107
gccatgtcc 9
<210> 108
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 108
acatggcaa 9
<210> 109
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 109
gtctgctcc 9
<210> 110
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 110
agcagacaa 9
<210> 111
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 111
cgacagacc 9
<210> 112
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 112
tctgtcgaa 9
<210> 113
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 113
cgctactcc 9
<210> 114
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 114
agtagcgaa 9
<210> 115
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 115
ccacagacc 9
<210> 116
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 116
tctgtggaa 9
<210> 117
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 117
cctctctcc 9
<210> 118
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 118
agagaggaa 9
<210> 119
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 119
ctcgtagcc 9
<210> 120
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 120
ctacgagaa 9
<210> 121
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 121
aaatcgatgt ggtcactcag 20
<210> 122
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 122
gagtgaccac atcgatttgg 20
<210> 123
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 123
aaatcgatgt ggactaggag 20
<210> 124
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 124
cctagtccac atcgatttgg 20
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 125
aaatcgatgt gccgtatgag 20
<210> 126
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 126
catacggcac atcgatttgg 20
<210> 127
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 127
aaatcgatgt gctgaaggag 20
<210> 128
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 128
ccttcagcac atcgatttgg 20
<210> 129
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 129
aaatcgatgt ggactagcag 20
<210> 130
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 130
gctagtccac atcgatttgg 20
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 131
aaatcgatgt gcgctaagag 20
<210> 132
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 132
cttagcgcac atcgatttgg 20
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 133
aaatcgatgt gagccgagag 20
<210> 134
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 134
ctcggctcac atcgatttgg 20
<210> 135
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 135
aaatcgatgt gccgtatcag 20
<210> 136
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 136
gatacggcac atcgatttgg 20
<210> 137
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 137
aaatcgatgt gctgaagcag 20
<210> 138
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 138
gcttcagcac atcgatttgg 20
<210> 139
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 139
aaatcgatgt gtgcgagtag 20
<210> 140
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 140
actcgcacac atcgatttgg 20
<210> 141
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 141
aaatcgatgt gtttggcgag 20
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 142
cgccaaacac atcgatttgg 20
<210> 143
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 143
aaatcgatgt gcgctaacag 20
<210> 144
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 144
gttagcgcac atcgatttgg 20
<210> 145
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 145
aaatcgatgt gagccgacag 20
<210> 146
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 146
gtcggctcac atcgatttgg 20
<210> 147
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 147
aaatcgatgt gagccgaaag 20
<210> 148
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 148
ttcggctcac atcgatttgg 20
<210> 149
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 149
aaatcgatgt gtcggtagag 20
<210> 150
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 150
ctaccgacac atcgatttgg 20
<210> 151
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 151
aaatcgatgt ggttgccgag 20
<210> 152
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 152
cggcaaccac atcgatttgg 20
<210> 153
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 153
aaatcgatgt gagtgcgtag 20
<210> 154
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 154
acgcactcac atcgatttgg 20
<210> 155
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 155
aaatcgatgt ggttgccaag 20
<210> 156
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 156
tggcaaccac atcgatttgg 20
<210> 157
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 157
aaatcgatgt gtgcgaggag 20
<210> 158
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 158
cctcgcacac atcgatttgg 20
<210> 159
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 159
aaatcgatgt ggaacacgag 20
<210> 160
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 160
cgtgttccac atcgatttgg 20
<210> 161
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 161
aaatcgatgt gcttgtcgag 20
<210> 162
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 162
cgacaagcac atcgatttgg 20
<210> 163
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 163
aaatcgatgt gttccggtag 20
<210> 164
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 164
accggaacac atcgatttgg 20
<210> 165
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 165
aaatcgatgt gtgcgagcag 20
<210> 166
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 166
gctcgcacac atcgatttgg 20
<210> 167
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 167
aaatcgatgt ggtcaggtag 20
<210> 168
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 168
acctgaccac atcgatttgg 20
<210> 169
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 169
aaatcgatgt ggcctgttag 20
<210> 170
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 170
aacaggccac atcgatttgg 20
<210> 171
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 171
aaatcgatgt ggaacaccag 20
<210> 172
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 172
ggtgttccac atcgatttgg 20
<210> 173
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 173
aaatcgatgt gcttgtccag 20
<210> 174
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 174
ggacaagcac atcgatttgg 20
<210> 175
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 175
aaatcgatgt gtgcgagaag 20
<210> 176
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 176
tctcgcacac atcgatttgg 20
<210> 177
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 177
aaatcgatgt gagtgcggag 20
<210> 178
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 178
ccgcactcac atcgatttgg 20
<210> 179
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 179
aaatcgatgt gttgtccgag 20
<210> 180
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 180
cggacaacac atcgatttgg 20
<210> 181
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 181
aaatcgatgt gtggaacgag 20
<210> 182
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 182
cgttccacac atcgatttgg 20
<210> 183
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 183
aaatcgatgt gagtgcgaag 20
<210> 184
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 184
tcgcactcac atcgatttgg 20
<210> 185
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 185
aaatcgatgt gtggaaccag 20
<210> 186
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 186
ggttccacac atcgatttgg 20
<210> 187
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 187
aaatcgatgt gttaggcgag 20
<210> 188
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 188
cgcctaacac atcgatttgg 20
<210> 189
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 189
aaatcgatgt ggcctgtgag 20
<210> 190
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 190
cacaggccac atcgatttgg 20
<210> 191
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 191
aaatcgatgt gctcctgtag 20
<210> 192
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 192
acaggagcac atcgatttgg 20
<210> 193
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 193
aaatcgatgt ggtcaggcag 20
<210> 194
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 194
gcctgaccac atcgatttgg 20
<210> 195
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 195
aaatcgatgt ggtcaggaag 20
<210> 196
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 196
tcctgaccac atcgatttgg 20
<210> 197
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 197
aaatcgatgt ggtagccgag 20
<210> 198
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 198
cggctaccac atcgatttgg 20
<210> 199
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 199
aaatcgatgt ggcctgtaag 20
<210> 200
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 200
tacaggccac atcgatttgg 20
<210> 201
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 201
aaatcgatgt gctttcggag 20
<210> 202
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 202
ccgaaagcac atcgatttgg 20
<210> 203
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 203
aaatcgatgt gcgtaaggag 20
<210> 204
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 204
ccttacgcac atcgatttgg 20
<210> 205
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 205
aaatcgatgt gagagcgtag 20
<210> 206
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 206
acgctctcac atcgatttgg 20
<210> 207
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 207
aaatcgatgt ggacggcaag 20
<210> 208
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 208
tgccgtccac atcgatttgg 20
<210> 209
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 209
aaatcgatgt gctttcgcag 20
<210> 210
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 210
gcgaaagcac atcgatttgg 20
<210> 211
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 211
aaatcgatgt gcgtaagcag 20
<210> 212
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 212
gcttacgcac atcgatttgg 20
<210> 213
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 213
aaatcgatgt ggctatggag 20
<210> 214
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 214
ccatagccac atcgatttgg 20
<210> 215
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 215
aaatcgatgt gactctggag 20
<210> 216
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 216
ccagagtcac atcgatttgg 20
<210> 217
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 217
aaatcgatgt gctggaaag 19
<210> 218
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 218
ttccagcaca tcgatttgg 19
<210> 219
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 219
aaatcgatgt gccgaagtag 20
<210> 220
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 220
acttcggcac atcgatttgg 20
<210> 221
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 221
aaatcgatgt gctcctgaag 20
<210> 222
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 222
tcaggagcac atcgatttgg 20
<210> 223
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 223
aaatcgatgt gtccagtcag 20
<210> 224
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 224
gactggacac atcgatttgg 20
<210> 225
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 225
aaatcgatgt gagagcggag 20
<210> 226
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 226
ccgctctcac atcgatttgg 20
<210> 227
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 227
aaatcgatgt gagagcgaag 20
<210> 228
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 228
tcgctctcac atcgatttgg 20
<210> 229
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 229
aaatcgatgt gccgaaggag 20
<210> 230
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 230
ccttcggcac atcgatttgg 20
<210> 231
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 231
aaatcgatgt gccgaagcag 20
<210> 232
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 232
gcttcggcac atcgatttgg 20
<210> 233
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 233
aaatcgatgt gtgttccgag 20
<210> 234
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 234
cggaacacac atcgatttgg 20
<210> 235
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 235
aaatcgatgt gtctggcgag 20
<210> 236
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 236
cgccagacac atcgatttgg 20
<210> 237
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 237
aaatcgatgt gctatcggag 20
<210> 238
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 238
ccgatagcac atcgatttgg 20
<210> 239
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 239
aaatcgatgt gcgaaaggag 20
<210> 240
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 240
cctttcgcac atcgatttgg 20
<210> 241
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 241
aaatcgatgt gccgaagaag 20
<210> 242
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 242
tcttcggcac atcgatttgg 20
<210> 243
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 243
aaatcgatgt ggttgcagag 20
<210> 244
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 244
ctgcaaccac atcgatttgg 20
<210> 245
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 245
aaatcgatgt ggatggtgag 20
<210> 246
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 246
caccatccac atcgatttgg 20
<210> 247
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 247
aaatcgatgt gctatcgcag 20
<210> 248
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 248
gcgatagcac atcgatttgg 20
<210> 249
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 249
aaatcgatgt gcgaaagcag 20
<210> 250
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 250
gctttcgcac atcgatttgg 20
<210> 251
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 251
aaatcgatgt gacactggag 20
<210> 252
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 252
ccagtgtcac atcgatttgg 20
<210> 253
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 253
aaatcgatgt gtctggcaag 20
<210> 254
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 254
tgccagacac atcgatttgg 20
<210> 255
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 255
aaatcgatgt ggatggtcag 20
<210> 256
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 256
gaccatccac atcgatttgg 20
<210> 257
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 257
aaatcgatgt ggttgcacag 20
<210> 258
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 258
gtgcaaccac atcgatttgg 20
<210> 259
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 259
aaatcgatgt gggcatcgag 20
<210> 260
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 260
cgatgcccca tccgatttgg 20
<210> 261
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 261
aaatcgatgt gtgcctccag 20
<210> 262
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 262
ggaggcacac atcgatttgg 20
<210> 263
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 263
aaatcgatgt gtgcctcaag 20
<210> 264
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 264
tgaggcacac atcgatttgg 20
<210> 265
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 265
aaatcgatgt gggcatccag 20
<210> 266
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 266
ggatgcccac atcgatttgg 20
<210> 267
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 267
aaatcgatgt gggcatcaag 20
<210> 268
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 268
tgatgcccac atcgatttgg 20
<210> 269
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 269
aaatcgatgt gcctgtcgag 20
<210> 270
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 270
cgacaggcac atcgatttgg 20
<210> 271
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 271
aaatcgatgt ggacggatag 20
<210> 272
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 272
atccgtccac atcgatttgg 20
<210> 273
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 273
aaatcgatgt gcctgtccag 20
<210> 274
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 274
ggacaggcac atcgatttgg 20
<210> 275
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 275
aaatcgatgt gaagcacgag 20
<210> 276
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 276
cgtgcttcac atcgatttgg 20
<210> 277
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 277
aaatcgatgt gcctgtcaag 20
<210> 278
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 278
tgacaggcac atcgatttgg 20
<210> 279
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 279
aaatcgatgt gaagcaccag 20
<210> 280
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 280
ggtgcttcac atcgatttgg 20
<210> 281
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 281
aaatcgatgt gccttcgtag 20
<210> 282
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 282
acgaaggcac atcgatttgg 20
<210> 283
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 283
aaatcgatgt gtcgtccgag 20
<210> 284
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 284
cggacgacac atcgatttgg 20
<210> 285
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 285
aaatcgatgt ggagtctgag 20
<210> 286
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 286
cagactccac atcgatttgg 20
<210> 287
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 287
aaatcgatgt gtgatccgag 20
<210> 288
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 288
cggatcacac atcgatttgg 20
<210> 289
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 289
aaatcgatgt gtcaggcgag 20
<210> 290
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 290
cgcctgacac atcgatttgg 20
<210> 291
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 291
aaatcgatgt gtcgtccaag 20
<210> 292
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 292
tggacgacac atcgatttgg 20
<210> 293
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 293
aaatcgatgt ggacggagag 20
<210> 294
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 294
ctccgtccac atcgatttgg 20
<210> 295
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 295
aaatcgatgt ggtagcagag 20
<210> 296
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 296
ctgctaccac atcgatttgg 20
<210> 297
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 297
aaatcgatgt ggctgtgtag 20
<210> 298
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 298
acacagccac atcgatttgg 20
<210> 299
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 299
aaatcgatgt ggacggacag 20
<210> 300
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 300
gtccgtccac atcgatttgg 20
<210> 301
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 301
aaatcgatgt gtcaggcaag 20
<210> 302
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 302
tgcctgacac atcgatttgg 20
<210> 303
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 303
aaatcgatgt ggctcgaaag 20
<210> 304
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 304
ttcgagccac atcgatttgg 20
<210> 305
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 305
aaatcgatgt gccttcggag 20
<210> 306
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 306
ccgaaggcac atcgatttgg 20
<210> 307
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 307
aaatcgatgt ggtagcacag 20
<210> 308
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 308
gtgctaccac atcgatttgg 20
<210> 309
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 309
aaatcgatgt ggaaggtcag 20
<210> 310
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 310
gaccttccac atcgatttgg 20
<210> 311
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 311
aaatcgatgt ggtgctgtag 20
<210> 312
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 312
acagcaccac atcgatttgg 20
<210> 313
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 313
gttgcctgt 9
<210> 314
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 314
aggcaacct 9
<210> 315
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 315
caggacggt 9
<210> 316
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 316
cgtcctgct 9
<210> 317
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 317
agacgtggt 9
<210> 318
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 318
cacgtctct 9
<210> 319
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 319
caggaccgt 9
<210> 320
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 320
ggtcctgct 9
<210> 321
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 321
caggacagt 9
<210> 322
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 322
tgtcctgct 9
<210> 323
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 323
cactctggt 9
<210> 324
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 324
cagagtgct 9
<210> 325
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 325
gacggctgt 9
<210> 326
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 326
agccgtcct 9
<210> 327
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 327
cactctcgt 9
<210> 328
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 328
gagagtgct 9
<210> 329
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 329
gtagcctgt 9
<210> 330
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 330
aggctacct 9
<210> 331
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 331
gccacttgt 9
<210> 332
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 332
aagtggcct 9
<210> 333
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 333
catcgctgt 9
<210> 334
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 334
agcgatgct 9
<210> 335
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 335
cactggtgt 9
<210> 336
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 336
accagtgct 9
<210> 337
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 337
gccactggt 9
<210> 338
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 338
cagtggcct 9
<210> 339
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 339
tctggctgt 9
<210> 340
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 340
agccagact 9
<210> 341
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 341
gccactcgt 9
<210> 342
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 342
gagtggcct 9
<210> 343
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 343
tgcctctgt 9
<210> 344
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 344
agaggcact 9
<210> 345
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 345
catcgcagt 9
<210> 346
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 346
tgcgatgct 9
<210> 347
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 347
caggaaggt 9
<210> 348
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 348
cttcctgct 9
<210> 349
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 349
ggcatctgt 9
<210> 350
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 350
agatgccct 9
<210> 351
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 351
cggtgctgt 9
<210> 352
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 352
agcaccgct 9
<210> 353
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 353
cactggcgt 9
<210> 354
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 354
gccagtgct 9
<210> 355
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 355
tctcctcgt 9
<210> 356
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 356
gaggagact 9
<210> 357
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 357
cctgtctgt 9
<210> 358
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 358
agacaggct 9
<210> 359
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 359
caacgctgt 9
<210> 360
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 360
agcgttgct 9
<210> 361
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 361
tgcctcggt 9
<210> 362
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 362
cgaggcact 9
<210> 363
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 363
acactgcgt 9
<210> 364
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 364
gcagtgtct 9
<210> 365
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 365
tcgtcctgt 9
<210> 366
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 366
aggacgact 9
<210> 367
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 367
gctgccagt 9
<210> 368
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 368
tggcagcct 9
<210> 369
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 369
tcaggctgt 9
<210> 370
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 370
agcctgact 9
<210> 371
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 371
gccaggtgt 9
<210> 372
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 372
acctggcct 9
<210> 373
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 373
cggacctgt 9
<210> 374
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 374
aggtccgct 9
<210> 375
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 375
caacgcagt 9
<210> 376
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 376
tgcgttgct 9
<210> 377
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 377
cacacgagt 9
<210> 378
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 378
tcgtgtgct 9
<210> 379
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 379
atggcctgt 9
<210> 380
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 380
aggccatct 9
<210> 381
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 381
ccagtctgt 9
<210> 382
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 382
agactggct 9
<210> 383
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 383
gccaggagt 9
<210> 384
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 384
tcctggcct 9
<210> 385
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 385
cggaccagt 9
<210> 386
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 386
tggtccgct 9
<210> 387
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 387
ccttcgcgt 9
<210> 388
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 388
gcgaaggct 9
<210> 389
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 389
gcagccagt 9
<210> 390
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 390
tggctgcct 9
<210> 391
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 391
ccagtcggt 9
<210> 392
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 392
cgactggct 9
<210> 393
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 393
actgagcgt 9
<210> 394
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 394
gctcagtct 9
<210> 395
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 395
ccagtccgt 9
<210> 396
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 396
ggactggct 9
<210> 397
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 397
ccagtcagt 9
<210> 398
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 398
tgactggct 9
<210> 399
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 399
catcgaggt 9
<210> 400
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 400
ctcgatgct 9
<210> 401
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 401
ccatcgtgt 9
<210> 402
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 402
acgatggct 9
<210> 403
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 403
gtgctgcgt 9
<210> 404
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 404
gcagcacct 9
<210> 405
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 405
gactacggt 9
<210> 406
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 406
cgtagtcct 9
<210> 407
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 407
gtgctgagt 9
<210> 408
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 408
tcagcacct 9
<210> 409
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 409
gctgcatgt 9
<210> 410
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 410
atgcagcct 9
<210> 411
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 411
gagtggtgt 9
<210> 412
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 412
accactcct 9
<210> 413
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 413
gactaccgt 9
<210> 414
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 414
ggtagtcct 9
<210> 415
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 415
cggtgatgt 9
<210> 416
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 416
atcaccgct 9
<210> 417
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 417
tgcgactgt 9
<210> 418
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 418
agtcgcact 9
<210> 419
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 419
tctggaggt 9
<210> 420
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 420
ctccagact 9
<210> 421
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 421
agcactggt 9
<210> 422
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 422
cagtgctct 9
<210> 423
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 423
tcgcttggt 9
<210> 424
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 424
caagcgact 9
<210> 425
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 425
agcactcgt 9
<210> 426
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 426
gagtgctct 9
<210> 427
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 427
gcgattggt 9
<210> 428
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 428
caatcgcct 9
<210> 429
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 429
ccatcgcgt 9
<210> 430
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 430
gcgatggct 9
<210> 431
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 431
tcgcttcgt 9
<210> 432
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 432
gaagcgact 9
<210> 433
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 433
agtgcctgt 9
<210> 434
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 434
aggcactct 9
<210> 435
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 435
ggcataggt 9
<210> 436
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 436
ctatgccct 9
<210> 437
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 437
gcgattcgt 9
<210> 438
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 438
gaatcgcct 9
<210> 439
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 439
tgcgacggt 9
<210> 440
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 440
cgtcgcact 9
<210> 441
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 441
gagtggcgt 9
<210> 442
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 442
gccactcct 9
<210> 443
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 443
cggtgaggt 9
<210> 444
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 444
ctcaccgct 9
<210> 445
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 445
gctgcaagt 9
<210> 446
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 446
ttgcagcct 9
<210> 447
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 447
ttccgctgt 9
<210> 448
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 448
agcggaact 9
<210> 449
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 449
gagtggagt 9
<210> 450
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 450
tccactcct 9
<210> 451
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 451
acagagcgt 9
<210> 452
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 452
gctctgtct 9
<210> 453
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 453
tgcgaccgt 9
<210> 454
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 454
ggtcgcact 9
<210> 455
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 455
cctgtaggt 9
<210> 456
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 456
ctacaggct 9
<210> 457
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 457
tagccgtgt 9
<210> 458
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 458
acggctact 9
<210> 459
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 459
tgcgacagt 9
<210> 460
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 460
tgtcgcact 9
<210> 461
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 461
ggtctgtgt 9
<210> 462
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 462
acagaccct 9
<210> 463
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 463
cggtgaagt 9
<210> 464
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 464
ttcaccgct 9
<210> 465
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 465
caacgaggt 9
<210> 466
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 466
ctcgttgct 9
<210> 467
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 467
gcagcatgt 9
<210> 468
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 468
atgctgcct 9
<210> 469
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 469
tcgtcaggt 9
<210> 470
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 470
ctgacgact 9
<210> 471
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 471
agtgccagt 9
<210> 472
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 472
tggcactct 9
<210> 473
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 473
tagaggcgt 9
<210> 474
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 474
gcctctact 9
<210> 475
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 475
gtcagcggt 9
<210> 476
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 476
cgctgacct 9
<210> 477
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 477
tcaggaggt 9
<210> 478
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 478
ctcctgact 9
<210> 479
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 479
agcaggtgt 9
<210> 480
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 480
acctgctct 9
<210> 481
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 481
ttccgcagt 9
<210> 482
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 482
tgcggaact 9
<210> 483
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 483
gtcagccgt 9
<210> 484
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 484
ggctgacct 9
<210> 485
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 485
ggtctgcgt 9
<210> 486
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 486
gcagaccct 9
<210> 487
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 487
tagccgagt 9
<210> 488
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 488
tcggctact 9
<210> 489
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 489
gtcagcagt 9
<210> 490
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 490
tgctgacct 9
<210> 491
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 491
ggtctgagt 9
<210> 492
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 492
tcagaccct 9
<210> 493
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 493
cggacaggt 9
<210> 494
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 494
ctgtccgct 9
<210> 495
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 495
ttagccggt 9
<210> 496
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 496
cggctaact 9
<210> 497
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 497
gagacgagt 9
<210> 498
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 498
tcgtctcct 9
<210> 499
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 499
cgtaaccgt 9
<210> 500
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 500
ggttacgct 9
<210> 501
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 501
ttggcgtgt 9
<210> 502
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 502
acgccaact 9
<210> 503
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 503
atggcaggt 9
<210> 504
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 504
ctgccatct 9
<210> 505
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 505
cagctacga 9
<210> 506
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 506
gtagctgac 9
<210> 507
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 507
ctcctgcga 9
<210> 508
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 508
gcaggagac 9
<210> 509
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 509
gctgcctga 9
<210> 510
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 510
aggcagcac 9
<210> 511
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 511
caggaacga 9
<210> 512
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 512
gttcctgac 9
<210> 513
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 513
cacacgcga 9
<210> 514
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 514
gcgtgtgac 9
<210> 515
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 515
gcagcctga 9
<210> 516
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 516
aggctgcac 9
<210> 517
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 517
ctgaacgga 9
<210> 518
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 518
cgttcagac 9
<210> 519
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 519
ctgaaccga 9
<210> 520
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 520
ggttcagac 9
<210> 521
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 521
tctggacga 9
<210> 522
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 522
gtccagaac 9
<210> 523
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 523
tgcctacga 9
<210> 524
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 524
gtaggcaac 9
<210> 525
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 525
ggcatacga 9
<210> 526
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 526
gtatgccac 9
<210> 527
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 527
cggtgacga 9
<210> 528
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 528
gtcaccgac 9
<210> 529
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 529
caacgacga 9
<210> 530
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 530
gtcgttgac 9
<210> 531
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 531
ctcctctga 9
<210> 532
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 532
agaggagac 9
<210> 533
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 533
tcaggacga 9
<210> 534
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 534
gtcctgaac 9
<210> 535
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 535
aaaggcgga 9
<210> 536
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 536
cgcctttac 9
<210> 537
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 537
ctcctcgga 9
<210> 538
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 538
cgaggagac 9
<210> 539
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 539
cagatgcga 9
<210> 540
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 540
gcatctgac 9
<210> 541
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 541
gcagcaaga 9
<210> 542
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 542
ttgctgcac 9
<210> 543
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 543
gtggagtga 9
<210> 544
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 544
actccacac 9
<210> 545
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 545
ccagtagga 9
<210> 546
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 546
ctactggac 9
<210> 547
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 547
atggcacga 9
<210> 548
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 548
gtgccatac 9
<210> 549
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 549
ggactgtga 9
<210> 550
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 550
acagtccac 9
<210> 551
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 551
ccgaactga 9
<210> 552
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 552
agttcggac 9
<210> 553
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 553
ctcctcaga 9
<210> 554
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 554
tgaggagac 9
<210> 555
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 555
cactgctga 9
<210> 556
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 556
agcagtgac 9
<210> 557
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 557
agcaggcga 9
<210> 558
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 558
gcctgctac 9
<210> 559
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 559
agcaggaga 9
<210> 560
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 560
tcctgctac 9
<210> 561
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 561
agagccaga 9
<210> 562
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 562
tggctctac 9
<210> 563
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 563
gtcgttgga 9
<210> 564
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 564
caacgacac 9
<210> 565
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 565
ccgaacgga 9
<210> 566
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 566
cgttcggac 9
<210> 567
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 567
cactgcgga 9
<210> 568
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 568
cgcagtgac 9
<210> 569
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 569
gtggagcga 9
<210> 570
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 570
gctccacac 9
<210> 571
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 571
gtggagaga 9
<210> 572
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 572
tctccacac 9
<210> 573
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 573
ggactgcga 9
<210> 574
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 574
gcagtccac 9
<210> 575
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 575
ccgaaccga 9
<210> 576
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 576
ggttcggac 9
<210> 577
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 577
cactgccga 9
<210> 578
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 578
ggcagtgac 9
<210> 579
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 579
cgaaacgga 9
<210> 580
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 580
cgtttcgac 9
<210> 581
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 581
ggactgaga 9
<210> 582
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 582
tcagtccac 9
<210> 583
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 583
ccgaacaga 9
<210> 584
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 584
tgttcggac 9
<210> 585
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 585
cgaaaccga 9
<210> 586
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 586
ggtttcgac 9
<210> 587
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 587
ctggcttga 9
<210> 588
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 588
aagccagac 9
<210> 589
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 589
cacacctga 9
<210> 590
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 590
aggtgtgac 9
<210> 591
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 591
aacgaccga 9
<210> 592
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 592
ggtcgttac 9
<210> 593
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 593
atccagcga 9
<210> 594
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 594
gctggatac 9
<210> 595
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 595
tgcgaagga 9
<210> 596
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 596
cttcgcaac 9
<210> 597
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 597
tgcgaacga 9
<210> 598
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 598
gttcgcaac 9
<210> 599
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 599
ctggctgga 9
<210> 600
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 600
cagccagac 9
<210> 601
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 601
cacaccgga 9
<210> 602
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 602
cggtgtgac 9
<210> 603
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 603
agtgcagga 9
<210> 604
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 604
ctgcactac 9
<210> 605
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 605
gaccgttga 9
<210> 606
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 606
aacggtcac 9
<210> 607
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 607
ggtgagtga 9
<210> 608
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 608
actcaccac 9
<210> 609
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 609
ccttcctga 9
<210> 610
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 610
aggaaggac 9
<210> 611
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 611
ctggctaga 9
<210> 612
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 612
tagccagac 9
<210> 613
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 613
cacaccaga 9
<210> 614
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 614
tggtgtgac 9
<210> 615
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 615
agcggtaga 9
<210> 616
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 616
taccgctac 9
<210> 617
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 617
gtcagagga 9
<210> 618
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 618
ctctgacac 9
<210> 619
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 619
ttccgacga 9
<210> 620
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 620
gtcggaaac 9
<210> 621
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 621
aggcgtaga 9
<210> 622
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 622
tacgcctac 9
<210> 623
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 623
ctcgactga 9
<210> 624
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 624
agtcgagac 9
<210> 625
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 625
tacgctgga 9
<210> 626
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 626
cagcgtaac 9
<210> 627
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 627
gttcggtga 9
<210> 628
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 628
accgaacac 9
<210> 629
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 629
gccagcaga 9
<210> 630
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 630
tgctggcac 9
<210> 631
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 631
gaccgtaga 9
<210> 632
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 632
tacggtcac 9
<210> 633
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 633
gtgctctga 9
<210> 634
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 634
agagcacac 9
<210> 635
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 635
ggtgagcga 9
<210> 636
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 636
gctcaccac 9
<210> 637
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 637
ggtgagaga 9
<210> 638
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 638
tctcaccac 9
<210> 639
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 639
ccttccaga 9
<210> 640
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 640
tggaaggac 9
<210> 641
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 641
ctcctacga 9
<210> 642
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 642
gtaggagac 9
<210> 643
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 643
ctcgacgga 9
<210> 644
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 644
cgtcgagac 9
<210> 645
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 645
gccgtttga 9
<210> 646
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 646
aaacggcac 9
<210> 647
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 647
gcggagtga 9
<210> 648
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 648
actccgcac 9
<210> 649
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 649
cgtgcttga 9
<210> 650
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 650
aagcacgac 9
<210> 651
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 651
ctcgaccga 9
<210> 652
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 652
ggtcgagac 9
<210> 653
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 653
agagcagga 9
<210> 654
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 654
ctgctctac 9
<210> 655
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 655
gtgctcgga 9
<210> 656
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 656
cgagcacac 9
<210> 657
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 657
ctcgacaga 9
<210> 658
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 658
tgtcgagac 9
<210> 659
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 659
ggagagtga 9
<210> 660
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 660
actctccac 9
<210> 661
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 661
aggctgtga 9
<210> 662
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 662
acagcctac 9
<210> 663
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 663
agagcacga 9
<210> 664
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 664
gtgctctac 9
<210> 665
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 665
ccatcctga 9
<210> 666
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 666
aggatggac 9
<210> 667
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 667
gttcggaga 9
<210> 668
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 668
tccgaacac 9
<210> 669
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 669
tggtagcga 9
<210> 670
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 670
gctaccaac 9
<210> 671
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 671
gtgctccga 9
<210> 672
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 672
ggagcacac 9
<210> 673
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 673
gtgctcaga 9
<210> 674
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 674
tgagcacac 9
<210> 675
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 675
gccgttgga 9
<210> 676
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 676
caacggcac 9
<210> 677
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 677
gagtgctga 9
<210> 678
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 678
agcactcac 9
<210> 679
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 679
gctccttga 9
<210> 680
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 680
aaggagcac 9
<210> 681
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 681
ccgaaagga 9
<210> 682
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 682
ctttcggac 9
<210> 683
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 683
cactgagga 9
<210> 684
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 684
ctcagtgac 9
<210> 685
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 685
cgtgctgga 9
<210> 686
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 686
cagcacgac 9
<210> 687
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 687
ccgaaacga 9
<210> 688
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 688
gtttcggac 9
<210> 689
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 689
gcggagaga 9
<210> 690
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 690
tctccgcac 9
<210> 691
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 691
gccgttaga 9
<210> 692
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 692
taacggcac 9
<210> 693
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 693
tctcgtgga 9
<210> 694
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 694
cacgagaac 9
<210> 695
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 695
cgtgctaga 9
<210> 696
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 696
tagcacgac 9
<210> 697
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 697
gcctgtctt 9
<210> 698
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 698
gacaggctc 9
<210> 699
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 699
ctcctggtt 9
<210> 700
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 700
ccaggagtc 9
<210> 701
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 701
actctgctt 9
<210> 702
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 702
gcagagttc 9
<210> 703
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 703
catcgcctt 9
<210> 704
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 704
ggcgatgtc 9
<210> 705
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 705
gccactatt 9
<210> 706
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 706
tagtggctc 9
<210> 707
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 707
cacacggtt 9
<210> 708
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 708
ccgtgtgtc 9
<210> 709
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 709
caacgcctt 9
<210> 710
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 710
ggcgttgtc 9
<210> 711
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 711
actgaggtt 9
<210> 712
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 712
cctcagttc 9
<210> 713
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 713
gtgctggtt 9
<210> 714
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 714
ccagcactc 9
<210> 715
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 715
catcgactt 9
<210> 716
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 716
gtcgatgtc 9
<210> 717
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 717
ccatcggtt 9
<210> 718
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 718
ccgatggtc 9
<210> 719
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 719
gctgcactt 9
<210> 720
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 720
gtgcagctc 9
<210> 721
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 721
acagaggtt 9
<210> 722
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 722
cctctgttc 9
<210> 723
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 723
agtgccgtt 9
<210> 724
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 724
cggcacttc 9
<210> 725
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 725
cggacattt 9
<210> 726
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 726
atgtccgtc 9
<210> 727
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 727
ggtctggtt 9
<210> 728
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 728
ccagacctc 9
<210> 729
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 729
gagacggtt 9
<210> 730
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 730
ccgtctctc 9
<210> 731
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 731
ctttccgtt 9
<210> 732
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 732
cggaaagtc 9
<210> 733
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 733
cagatggtt 9
<210> 734
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 734
ccatctgtc 9
<210> 735
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 735
cggacactt 9
<210> 736
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 736
gtgtccgtc 9
<210> 737
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 737
actctcgtt 9
<210> 738
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 738
cgagagttc 9
<210> 739
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 739
gcagcactt 9
<210> 740
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 740
gtgctgctc 9
<210> 741
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 741
actctcctt 9
<210> 742
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 742
ggagagttc 9
<210> 743
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 743
accttggtt 9
<210> 744
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 744
ccaaggttc 9
<210> 745
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 745
agagccgtt 9
<210> 746
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 746
cggctcttc 9
<210> 747
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 747
accttgctt 9
<210> 748
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 748
gcaaggttc 9
<210> 749
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 749
aagtccgtt 9
<210> 750
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 750
cggactttc 9
<210> 751
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 751
ggactggtt 9
<210> 752
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 752
ccagtcctc 9
<210> 753
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 753
gtcgttctt 9
<210> 754
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 754
gaacgactc 9
<210> 755
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 755
cagcatctt 9
<210> 756
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 756
gatgctgtc 9
<210> 757
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 757
ctatccgtt 9
<210> 758
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 758
cggatagtc 9
<210> 759
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 759
acactcgtt 9
<210> 760
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 760
cgagtgttc 9
<210> 761
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 761
atccaggtt 9
<210> 762
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 762
cctggattc 9
<210> 763
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 763
gttcctgtt 9
<210> 764
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 764
caggaactc 9
<210> 765
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 765
acactcctt 9
<210> 766
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 766
ggagtgttc 9
<210> 767
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 767
gttcctctt 9
<210> 768
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 768
gaggaactc 9
<210> 769
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 769
ctggctctt 9
<210> 770
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 770
gagccagtc 9
<210> 771
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 771
acggcattt 9
<210> 772
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 772
atgccgttc 9
<210> 773
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 773
ggtgaggtt 9
<210> 774
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 774
cctcacctc 9
<210> 775
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 775
ccttccgtt 9
<210> 776
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 776
cggaaggtc 9
<210> 777
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 777
tacgctctt 9
<210> 778
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 778
gagcgtatc 9
<210> 779
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 779
acggcagtt 9
<210> 780
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 780
ctgccgttc 9
<210> 781
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 781
actgacgtt 9
<210> 782
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 782
cgtcagttc 9
<210> 783
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 783
acggcactt 9
<210> 784
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 784
gtgccgttc 9
<210> 785
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 785
actgacctt 9
<210> 786
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 786
ggtcagttc 9
<210> 787
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 787
tttgcggtt 9
<210> 788
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 788
ccgcaaatc 9
<210> 789
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 789
tggtaggtt 9
<210> 790
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 790
cctaccatc 9
<210> 791
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 791
gttcggctt 9
<210> 792
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 792
gccgaactc 9
<210> 793
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 793
gccgttctt 9
<210> 794
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 794
gaacggctc 9
<210> 795
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 795
ggagaggtt 9
<210> 796
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 796
cctctcctc 9
<210> 797
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 797
cactgactt 9
<210> 798
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 798
gtcagtgtc 9
<210> 799
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 799
cgtgctctt 9
<210> 800
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 800
gagcacgtc 9
<210> 801
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 801
aatccgctt 9
<210> 802
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 802
gcggatttc 9
<210> 803
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 803
aggctggtt 9
<210> 804
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 804
ccagccttc 9
<210> 805
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 805
gctagtgtt 9
<210> 806
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 806
cactagctc 9
<210> 807
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 807
ggagagctt 9
<210> 808
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 808
gctctcctc 9
<210> 809
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 809
ggagagatt 9
<210> 810
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 810
tctctcctc 9
<210> 811
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 811
aggctgctt 9
<210> 812
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 812
gcagccttc 9
<210> 813
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 813
gagtgcgtt 9
<210> 814
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 814
cgcactctc 9
<210> 815
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 815
ccatccatt 9
<210> 816
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 816
tggatggtc 9
<210> 817
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 817
gctagtctt 9
<210> 818
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 818
gactagctc 9
<210> 819
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 819
aggctgatt 9
<210> 820
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 820
tcagccttc 9
<210> 821
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 821
acagacgtt 9
<210> 822
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 822
cgtctgttc 9
<210> 823
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 823
gagtgcctt 9
<210> 824
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 824
ggcactctc 9
<210> 825
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 825
acagacctt 9
<210> 826
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 826
ggtctgttc 9
<210> 827
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 827
cgagctttt 9
<210> 828
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 828
aagctcgtc 9
<210> 829
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 829
ttagcggtt 9
<210> 830
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 830
ccgctaatc 9
<210> 831
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 831
cctcttgtt 9
<210> 832
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 832
caagaggtc 9
<210> 833
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 833
ggtctcttt 9
<210> 834
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 834
agagacctc 9
<210> 835
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 835
gccagattt 9
<210> 836
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 836
atctggctc 9
<210> 837
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 837
gagaccttt 9
<210> 838
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 838
aggtctctc 9
<210> 839
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 839
cacacagtt 9
<210> 840
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 840
ctgtgtgtc 9
<210> 841
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 841
cctcttctt 9
<210> 842
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 842
gaagaggtc 9
<210> 843
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 843
tagagcgtt 9
<210> 844
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 844
cgctctatc 9
<210> 845
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 845
gcacctttt 9
<210> 846
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 846
aaggtgctc 9
<210> 847
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 847
ggcttgttt 9
<210> 848
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 848
acaagcctc 9
<210> 849
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 849
gacgcgatt 9
<210> 850
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 850
tcgcgtctc 9
<210> 851
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 851
cgagctgtt 9
<210> 852
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 852
cagctcgtc 9
<210> 853
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 853
tagagcctt 9
<210> 854
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 854
ggctctatc 9
<210> 855
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 855
catccgttt 9
<210> 856
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 856
acggatgtc 9
<210> 857
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 857
ggtctcgtt 9
<210> 858
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 858
cgagacctc 9
<210> 859
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 859
gccagagtt 9
<210> 860
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 860
ctctggctc 9
<210> 861
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 861
gagaccgtt 9
<210> 862
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 862
cggtctctc 9
<210> 863
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 863
cgagctatt 9
<210> 864
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 864
tagctcgtc 9
<210> 865
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 865
gcaagtgtt 9
<210> 866
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 866
cacttgctc 9
<210> 867
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 867
ggtctcctt 9
<210> 868
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 868
ggagacctc 9
<210> 869
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 869
gccagactt 9
<210> 870
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 870
gtctggctc 9
<210> 871
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 871
ggtctcatt 9
<210> 872
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 872
tgagacctc 9
<210> 873
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 873
gagaccatt 9
<210> 874
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 874
tggtctctc 9
<210> 875
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 875
ccttcagtt 9
<210> 876
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 876
ctgaaggtc 9
<210> 877
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 877
gcacctgtt 9
<210> 878
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 878
caggtgctc 9
<210> 879
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 879
aaaggcgtt 9
<210> 880
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 880
cgccttttc 9
<210> 881
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 881
cagatcgtt 9
<210> 882
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 882
cgatctgtc 9
<210> 883
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 883
cataggctt 9
<210> 884
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 884
gcctatgtc 9
<210> 885
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 885
ccttcactt 9
<210> 886
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 886
gtgaaggtc 9
<210> 887
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 887
gcacctctt 9
<210> 888
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 888
gaggtgctc 9
<210> 889
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 889
cagaagacag acaagcttca cctgc 25
<210> 890
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 890
gcaggtgaag cttgtctgtc ttctgaa 27
PPI-156CP
2
Claims (129)
- 다음 단계를 포함하는, 코딩 올리고누클레오티드에 효과적으로 결합하는 작용 성분(functional moiety)을 포함하는 분자의 합성 방법(a) n 빌딩 블록을 포함하는 개시 작용 성분으로 이루어진 개시 화합물을 제공하는 단계(여기에서, n 은 1 또는 그 보다 큰 정수이고, 상기 개시 작용 성분은 적어도 하나의 반응성 기를 포함하며, 개시 올리고누클레오티드에 효과적으로 결합한다) ;(b) 적어도 하나의 상보적 반응성 기를 포함하는 빌딩 블록과 개시 화합물을 반응시키는 단계(여기에서, 공유 결합을 형성하기 위해 상보적 반응성 기의 반응에 적합한 조건 하에서, 적어도 하나의 상보적 반응성 기는 단계 (a) 의 반응성 기에 대하여 상보적이다) ;(c) 코딩 올리고누클레오티드를 형성하기 위해 도입(incoming) 올리고누클레오티드 및 개시 올리고누클레오티드를 결합시키기 위한 적합한 조건 하에서, 상기 개시 올리고누클레오티드 및 도입 올리고누클레오티드의 결합을 촉진시키는 효소의 존재 하에 단계 (b) 의 빌딩 블록을 확인하는 도입 올리고누클레오티드와 개시 올리고누클레오티드를 반응시키는 단계에 의해 n + 1 빌딩 블록을 포함하는, 코딩 올리고누클레오티드에 효과적으로 결합하는 작용 성분을 포함하는 분자를 생성한다.
- 제 1 항에 있어서, 단계 (c) 의 작용 성분은 반응성 기(reactive group)를 포함하며, 단계 (a) 내지 (c) 를 1 회 또는 그 이상으로 반복시켜서 사이클 1 내지 i(여기에서, i 는 2 또는 그 보다 큰 정수이다)를 형성하며, 여기에서 사이클 s 의 단계 (c) 의 산물(여기에서, s 는 i - 1 또는 그 보다 작은 정수이다)은 사이클 s + 1 의 개시 화합물임을 특징으로 하는 방법.
- 제 1 항에 있어서, 단계 (c) 가 단계 (b) 보다 앞서 일어나거나 또는 단계 (b) 가 단계 (c) 보다 앞서 일어남을 특징으로 하는 방법.
- 제 1 항에 있어서, 빌딩 블록 중 적어도 하나는 아미노산 또는 활성화된 아미노산임을 특징으로 하는 방법.
- 제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 아미노기 ; 카르복시기 ; 술포닐기 ; 포스포닐기 ; 에폭시드기 ; 아지리딘기 ; 및 이소시안에이트기 중에서 선택한 것임을 특징으로 하는 방법.
- 제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 히드록시기 ; 카르복시기 ; 술포닐기 ; 포스포닐기 ; 에폭시드기 ; 아지리딘기 ; 및 이소시안에이트기 중에서 선택한 것임을 특징으로 하는 방법.
- 제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 아미노기 및 알데히드 또는 케톤기 중에서 선택한 것임을 특징으로 하는 방법.
- 제 7 항에 있어서, 반응성 기와 상보적 반응성 기 사이의 반응은 환원(reducing) 조건 하에서 시행함을 특징으로 하는 방법.
- 제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 인 일리드기(phosphorous ylide group) 및 알데히드 또는 케톤기 중에서 선택한 것임을 특징으로 하는 방법.
- 제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 고리화첨가반응을 통해서 반응하여 고리형 구조를 형성함을 특징으로 하는 방법.
- 제 10 항에 있어서, 반응성 기 및 상보적 반응성 기는 알킨 및 아지드 중에서 선택한 것임을 특징으로 하는 방법.
- 제 10 항에 있어서, 반응성 기 및 상보적 반응성 기는 할로겐화 헤테로방향족기 및 친핵체(nucleophile) 중에서 선택한 것임을 특징으로 하는 방법.
- 제 12 항에 있어서, 할로겐화 헤테로방향족기는 염소화 피리미딘, 염소화 트리아진 및 염소화 푸린 중에서 선택한 것임을 특징으로 하는 방법.
- 제 12 항에 있어서, 친핵체는 아미노기임을 특징으로 하는 방법.
- 제 1 항에 있어서, 효소는 DNA 리가제, RNA 리가제, DNA 폴리머라제, RNA 폴리머라제 및 토포아이소머라제(topoisomerase) 중에서 선택한 것임을 특징으로 하는 방법.
- 제 1 항에 있어서, 개시 올리고누클레오티드는 이중-가닥 또는 단일-가닥임을 특징으로 하는 방법.
- 제 16 항에 있어서, 개시 올리고누클레오티드는 PCR 프라이머 서열을 포함함을 특징으로 하는 방법.
- 제 16 항에 있어서, 개시 올리고누클레오티드는 단일-가닥이고, 도입 올리고누클레오티드는 단일-가닥이거나 ; 또는 개시 올리고누클레오티드는 이중-가닥이고 도입 올리고누클레오티드가 이중-가닥임을 특징으로 하는 방법.
- 제 18 항에 있어서, 개시 작용 성분과 개시 올리고누클레오티드는 결합 성분에 의해 결합됨을 특징으로 하는 방법.
- 제 19 항에 있어서, 개시 올리고누클레오티드는 이중-가닥이고, 결합 성분은 개시 작용 성분 및 개시 올리고누클레오티드의 두 가닥에 공유 결합됨을 특징으로 하는 방법.
- 제 1 항에 있어서, 도입 올리고누클레오티드는 3 내지 10 개의 누클레오티드의 길이를 가짐을 특징으로 하는 방법.
- 제 2 항에 있어서, 사이클 i 의 도입 올리고누클레오티드는 PCR 종결 (closing) 프라이머를 포함함을 특징으로 하는 방법.
- 제 2 항에 있어서, 종결 PCR 프라이머 서열을 포함하는 올리고누클레오티드를 코딩 올리고누클레오티드에 결합시키는 단계 (d) 를 사이클 i 에 추가로 포함시킴을 특징으로 하는 방법.
- 제 23 항에 있어서, 결합을 촉진시키는 효소의 존재 하에, 종결 PCR 프라이머 서열을 포함하는 올리고누클레오티드를 코딩 올리고누클레오티드에 결합시킴을 특징으로 하는 방법.
- 제 2 항에 있어서, 작용 성분을 고리화시키는 단계 (e) 를 사이클 i 후에 추가로 포함함을 특징으로 하는 방법.
- 제 25 항에 있어서, 작용 성분은 알킨일기 및 아지도기를 포함하며, 트리아졸기를 형성하기 위해 알킨일기와 아지도기의 고리화첨가반응에 적합한 조건에서 화합물을 시행하여 상기 작용 성분을 고리화시킴을 특징으로 하는 방법.
- 다음 단계를 포함하는, 둘 또는 그 이상의 빌딩 블록을 포함하는 작용 성분의 구조를 확인하는 개시 올리고누클레오티드에 효과적으로 결합하는 상기 작용 성분을 포함하는 화합물의 라이브러리를 합성하는 방법(a) m 개시 화합물을 포함하는 용액을 제공하는 단계(여기에서, m 은 1 또는 그 보다 큰 정수이고, 상기 개시 화합물은 n 빌딩 블록을 포함하는 작용 성분으로 이루어졌으며, 이 작용 성분은 n 빌딩 블록을 확인하는 개시 올리고누클레오티드에 효과적으로 결합하고, 여기에서, n 은 1 또는 그 보다 큰 정수이다) ;(b) 단계 (a) 의 용액을 r 반응 용기 내로 분할하여 용액의 r 분할량 (r aliquots)을 생성하는 단계(여기에서, r 은 2 또는 그 보다 큰 정수이다) ;(c) r 빌딩 블록 중 하나와 각 반응 용기에서의 개시 화합물을 반응시켜서 개시 올리고누클레오티드에 효과적으로 결합하는 n + 1 빌딩 블록을 포함하는 작용 성분으로 이루어진 화합물을 포함하는 r 분할량을 생성하는 단계 ;(d) 도입 올리고누클레오티드 및 개시 올리고누클레오티드의 효소적 결합에 적합한 조건 하에서, 도입 올리고누클레오티드 및 개시 올리고누클레오티드의 결합을 촉진시키는 효소의 존재 하에 특정 r 도입 올리고누클레오티드 세트 중 하나와 각 분할량에서의 개시 올리고누클레오티드와 반응시키는 단계에 의해 n + 1 빌딩 블록을 코드하는 신장시킨 올리고누클레오티드에 효과적으로 결합하는 n + 1 빌딩 블록을 포함하는 작용 성분으로 이루어진 분자를 포함하는 r 분할량을 생성한다.
- 제 27 항에 있어서, 둘 또는 그 이상의 r 분할량을 조합하여, n + 1 빌딩 블록을 포함하는, 상기 n + 1 빌딩 블록을 코드하는 신장시킨 올리고누클레오티드에 효과적으로 결합하는 작용 성분으로 이루어진 분자를 포함하는 용액을 생성하는 단계 (e) 를 추가로 포함함을 특징으로 하는 방법.
- 제 28 항에 있어서, r 분할량은 조합된 것임을 특징으로 하는 방법.
- 제 28 항에 있어서, 사이클 1 내지 i 를 수득하기 위해 단계 (a) 내지 (e) 를 1 또는 그 이상의 횟수로 시행하고, 여기에서, i 는 2 또는 그 보다 큰 정수이고, 사이클 s + 1 에서, s 는 i - 1 또는 그 보다 작은 정수이고, 단계 (a) 의 m 개시 화합물을 포함하는 용액은 사이클 s 의 단계 (e) 의 용액임을 특징으로 하는 방법.
- 제 7 항 또는 제 8 항에 있어서, 사이클 1 내지 i 중 적어도 하나에서, 단계 (d) 가 단계 (c) 보다 앞서 일어남을 특징으로 하는 방법.
- 제 28 항에 있어서, 빌딩 블록 중 적어도 하나가 아미노산임을 특징으로 하는 방법.
- 제 7 항에 있어서, 효소는 DNA 리가제, RNA 리가제, DNA 폴리머라제, RNA 폴리머라제 또는 토포아이소머라제임을 특징으로 하는 방법.
- 제 28 항에 있어서, 개시 올리고누클레오티드는 이중-가닥의 올리고누클레오티드임을 특징으로 하는 방법.
- 제 34 항에 있어서, 도입 올리고누클레오티드는 이중-가닥의 올리고누클레오티드임을 특징으로 하는 방법.
- 제 28 항에 있어서, 개시 화합물은 빌딩 블록과 함께 결합하는데 적합한 제 1 작용기, 올리고누클레오티드의 5' 말단에 결합하는데 적합한 제 2 작용기, 및 올리고누클레오티드의 3' 말단에 결합하는데 적합한 제 3 작용기를 포함하는 링커 성분을 포함함을 특징으로 하는 방법.
- 제 37 항에 있어서,A 는 아미노기이고 ;B 는 인산염기이며 ;C 는 인산염기임을 특징으로 하는 방법.
- 제 37 항에 있어서, D, E 및 F 는 각각 독립적으로 알킬렌기 또는 올리고(에틸렌 글리콜)기임을 특징으로 하는 방법.
- 제 37 항에 있어서, S 는 탄소 원자, 질소 원자, 인 원자, 붕소 원자, 인산염기, 시클로기 또는 폴리시클로기임을 특징으로 하는 방법.
- 제 41 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 2 내지 8 임을 특징으로 하는 방법.
- 제 42 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 3 내지 6 임을 특징으로 하는 방법.
- 제 27 항에 있어서, 각각의 개시 화합물은 반응성 기를 포함하고, 각각의 r 빌딩 블록은 상기 반응성 기에 상보적인 상보적 반응성 기를 포함함을 특징으로 하는 방법.
- 제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 아미노기 ; 카르복시기 ; 술포닐기 ; 포스포닐기 ; 에폭시드기 ; 아지리딘기 ; 및 이소시안에이트기 중에서 선택한 것임을 특징으로 하는 방법.
- 제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 히드록시기 ; 카르복시기 ; 술포닐기 ; 포스포닐기 ; 에폭시드기 ; 아지리딘기 ; 및 이소시안에이트기 중에서 선택한 것임을 특징으로 하는 방법.
- 제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 아미노기 및 알데히드 또는 케톤기 중에서 선택한 것임을 특징으로 하는 방법.
- 제 45 항에 있어서, 반응성 기와 상보적 반응성 기 사이의 반응은 환원(reducing) 조건 하에서 시행함을 특징으로 하는 방법.
- 제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 인 일리드기 및 알데히드 또는 케톤기 중에서 선택한 것임을 특징으로 하는 방법.
- 제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 고리화첨가반응을 통해서 반응하여 고리형 구조를 형성함을 특징으로 하는 방법.
- 제 51 항에 있어서, 반응성 기 및 상보적 반응성 기는 알킨 및 아지드 중에서 선택한 것임을 특징으로 하는 방법.
- 제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 할로겐화 헤테로방향족기 및 친핵체(nucleophile) 중에서 선택한 것임을 특징으로 하는 방법.
- 제 53 항에 있어서, 할로겐화 헤테로방향족기는 염소화 피리미딘, 염소화 트리아진 및 염소화 푸린 중에서 선택한 것임을 특징으로 하는 방법.
- 제 53 항에 있어서, 친핵체는 아미노기임을 특징으로 하는 방법.
- 제 28 항에 있어서, 사이클 i 후에, 하나 또는 그 이상의 작용 성분을 고리화반응시키는 단계 (f) 를 추가로 포함함을 특징으로 하는 방법.
- 제 56 항에 있어서, 단계 (f) 의 작용 성분은 아지도기 및 알킨일기를 포함함을 특징으로 하는 방법.
- 제 57 항에 있어서, 트리아졸기를 형성하기 위해 아지도기와 알킨일기가 고리화첨가반응하기에 적합한 조건 하에서 작용 성분을 유지하여 시클로 작용 성분을 형성함을 특징으로 하는 방법.
- 제 58 항에 있어서, 고리화첨가반응은 구리 촉매의 존재 하에 시행함을 특징으로 하는 방법.
- 제 59 항에 있어서, 단계 (f) 의 하나 또는 그 이상의 작용 성분 중 적어도 하나는 적어도 2 개의 술프히드릴기를 포함하고, 디설파이드기를 형성하기 위해, 상기 작용 성분을 2 개의 술프히드릴기의 반응에 적합한 조건 하에서 유지하여 작용 성분을 고리화반응시킴을 특징으로 하는 방법.
- 제 27 항에 있어서, 개시 올리고누클레오티드는 PCR 프라이머 서열을 포함함을 특징으로 하는 방법.
- 제 28 항에 있어서, 사이클 i 의 도입 올리고누클레오티드는 PCR 종결 (closing) 프라이머를 포함함을 특징으로 하는 방법.
- 제 28 항에 있어서, 사이클 i 후에, 종결(closing) PCR 프라이머 서열을 포함하는 올리고누클레오티드를 코딩 올리고누클레오티드에 결합시키는 단계 (d) 를 추가로 포함함을 특징으로 하는 방법.
- 제 63 항에 있어서, 종결 PCR 프라이머 서열을 포함하는 올리고누클레오티드를, 결합을 촉진시키는 효소의 존재 하에 코딩 올리고누클레오티드에 결합시킴을 특징으로 하는 방법.
- 다음 화학식 Ⅰ 의 화합물화학식 Ⅰ이 식에서,X 는 하나 또는 그 이상의 빌딩 블록을 포함하는 작용 성분이고 ;Z 는 3' 말단에서 B 에 결합된 올리고누클레오티드이고 ;Y 는 5' 말단에서 C 에 결합된 올리고누클레오티드이고 ;A 는 X 와 공유결합을 형성하는 작용기이고 ;B 는 Z 의 3'-말단과 결합을 형성하는 작용기이고 ;C 는 Y 의 5'-말단과 결합을 형성하는 작용기이고 ;D, F 및 E 각각은 독립적으로 이작용기성 결합기(bifunctional linking group)이며 ;S 는 원자 또는 분자 스캐폴드(molecular scaffold)이다.
- 제 65 항에 있어서, D, E 및 F 는 각각 독립적으로 알킬렌쇄 또는 올리고(에틸렌 글리콜)쇄임을 특징으로 하는 화합물.
- 제 65 항에 있어서, Y 및 Z 는 실질적으로 상보적이며, 적절한 조건 하에서 왓슨-크릭 염기쌍(Watson-Crick base pairing) 및 이중가닥 형성이 가능해지도록 화합물에서 방향이 정해져 있음(oriented)을 특징으로 하는 화합물.
- 제 65 항에 있어서, Y 및 Z 는 길이가 동일하거나 상이함을 특징으로 하는 화합물.
- 제 68 항에 있어서, Y 및 Z 는 길이가 동일함을 특징으로 하는 화합물.
- 제 65 항에 있어서, Y 및 Z 는 각각 10 또는 그 이상의 염기 길이를 가지며, 10 또는 그 이상의 염기쌍의 상보적 영역을 가짐을 특징으로 하는 화합물.
- 제 65 항에 있어서, S 는 탄소 원자, 붕소 원자, 질소 원자, 인 원자, 또는 다원자 스캐폴드(polyatomic scaffold)임을 특징으로 하는 화합물.
- 제 71 항에 있어서, S 는 인산염기 또는 시클로기임을 특징으로 하는 화합물.
- 제 72 항에 있어서, S 는 시클로알킬, 시클로알켄일, 헤테로시클로알킬, 헤테로시클로알켄일, 아릴 또는 헤테로아릴기임을 특징으로 하는 화합물.
- 제 74 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 2 내지 8 임을 특징으로 하는 화합물.
- 제 75 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 3 내지 6 임을 특징으로 하는 화합물.
- 제 65 항에 있어서, X 및 Y 는 PCR 프라이머 서열을 포함함을 특징으로 하는 화합물.
- 적어도 약 102 개의 특정 화합물을 포함하는 화합물 라이브러리이되, 상기 특정 화합물은 둘 또는 그 이상의 빌딩 블록을 포함하는 작용 성분을 포함하며, 상기 작용 성분의 구조를 확인하는 올리고누클레오티드에 효과적으로 결합하는 상기 작용 성분을 포함하는 화합물 라이브러리.
- 제 79 항에 있어서, 라이브러리는 각각의 특정 화합물의 적어도 약 105 개의 복사물을 포함함을 특징으로 하는 화합물 라이브러리.
- 제 79 항에 있어서, 라이브러리는 각각의 특정 화합물의 적어도 약 106 개의 복사물을 포함함을 특징으로 하는 화합물 라이브러리.
- 제 79 항에 있어서, 적어도 약 104 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
- 제 79 항에 있어서, 적어도 약 106 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
- 제 79 항에 있어서, 적어도 약 108 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
- 제 79 항에 있어서, 적어도 약 1010 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
- 제 79 항에 있어서, 적어도 약 1012 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
- 제 79 항에 있어서, 상기 라이브러리는 독립적으로 다음 화학식 Ⅰ을 갖는 다수의 화합물을 포함함을 특징으로 하는 화합물 라이브러리화학식 Ⅰ이 식에서,X 는 하나 또는 그 이상의 빌딩 블록을 포함하는 작용 성분이고 ;Z 는 3' 말단에서 B 에 결합된 올리고누클레오티드이고 ;Y 는 5' 말단에서 C 에 결합된 올리고누클레오티드이고 ;A 는 X 와 공유결합을 형성하는 작용기이고 ;B 는 Z 의 3'-말단과 결합을 형성하는 작용기이고 ;C 는 Y 의 5'-말단과 결합을 형성하는 작용기이고 ;D, F 및 E 각각은 독립적으로 이작용기성 결합기이며 ;S 는 원자 또는 분자 스캐폴드(molecular scaffold)이다.
- 제 87 항에 있어서, A, B, C, D, E, F 및 S 각각은 화학식 Ⅰ 의 각각의 화합물과 동일한 동일성(identity)을 가짐을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, 라이브러리는 화학식 Ⅰ을 갖는 다수의 화합물을 필수적으로 함유함을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, D, E 및 F 는 각각 독립적으로 알킬렌쇄 또는 올리고(에틸렌 글리콜)쇄임을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, Y 및 Z 는 실질적으로 상보적이며, 적절한 조건 하에서 왓슨-크릭 염기쌍(Watson-Crick base pairing) 및 이중가닥 형성이 가능해지도록 화합물에서 방향이 정해져 있음을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, Y 및 Z 는 길이가 동일하거나 상이함을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, Y 및 Z 는 길이가 동일함을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, Y 및 Z 는 각각 10 또는 그 이상의 염기 길이를 가지며, 10 또는 그 이상의 염기쌍의 상보적 영역을 가짐을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, S 는 탄소 원자, 붕소 원자, 질소 원자, 인 원자, 또는 다원자 스캐폴드(polyatomic scaffold)임을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, S 는 인산염기 또는 시클로기임을 특징으로 하는 화합물 라이브러리.
- 제 96 항에 있어서, S 는 시클로알킬, 시클로알켄일, 헤테로시클로알킬, 헤테로시클로알켄일, 아릴 또는 헤테로아릴기임을 특징으로 하는 화합물 라이브러리.
- 제 98 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 2 내지 8 임을 특징으로 하는 화합물 라이브러리.
- 제 99 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 3 내지 6 임을 특징으로 하는 화합물 라이브러리.
- 제 87 항에 있어서, X 및 Z 는 PCR 프라이머 서열을 포함함을 특징으로 하는 화합물 라이브러리.
- 제 1 항의 방법으로 제조된 화합물.
- 제 27 항의 방법으로 제조된 화합물 라이브러리.
- 다음 단계를 포함하는, 생물학적 표적에 결합하는 하나 또는 그 이상의 화합물을 확인하는 방법(a) 화합물 라이브러리 중 적어도 하나의 구성요소(member)가 생물학적 표적에 결합하는데 적합한 조건 하에서, 제 27 항의 방법으로 제조된 화합물 라이브러리와 상기 생물학적 표적을 접촉시키는 단계 ;(b) 생물학적 표적에 결합하지 않은 라이브러리 구성요소를 제거하는 단계 ;(c) 생물학적 표적에 결합하는 화합물 라이브러리 중 적어도 하나의 구성요소의 코딩 올리고누클레오티드를 증폭시키는 단계 ;(d) 단계 (c) 의 코딩 올리고누클레오티드의 서열을 결정하는 단계 ; 및(e) 생물학적 표적에 결합하는 화합물 라이브러리 중 구성요소의 작용 성분의 구조를 측정하기 위해 단계 (d) 에서 결정된 서열을 사용하는 단계에 의해 상기 생물학적 표적에 결합하는 하나 또는 그 이상의 화합물을 확인한다.
- 다음 단계를 포함하는, 생물학적 표적에 결합하는 화합물을 확인하는 방법(a) 적어도 약 102 개의 특정 화합물을 포함하는 화합물 라이브러리와 생물학적 표적을 접촉시키는 단계로서, 상기 특정 화합물은 화합물 라이브러리 중 적어도 하나의 구성요소(member)가 상기 생물학적 표적에 결합하는데 적합한 조건 하에서 작용 성분의 구조를 확인하는 올리고누클레오티드에 효과적으로 결합하는, 둘 또는 그 이상의 빌딩 블록을 포함하는 작용 성분을 포함하며 ;(b) 생물학적 표적에 결합하지 않은 라이브러리 구성요소를 제거하는 단계 ;(c) 생물학적 표적에 결합한 화합물 라이브러리 중 적어도 하나의 구성요소의 코딩 올리고누클레오티드를 증폭시키는 단계 ;(d) 단계 (c) 의 코딩 올리고누클레오티드의 서열을 결정하는 단계 ; 및(e) 생물학적 표적에 결합하는 화합물 라이브러리 중 구성요소의 작용 성분의 구조를 측정하기 위해, 단계 (d) 에서 결정된 서열을 사용하는 단계에 의해 상기 생물학적 표적에 결합하는 하나 또는 그 이상의 화합물을 확인한다.
- 제 106 항에 있어서, 라이브러리는 각각의 특정 화합물의 적어도 약 105 개의 복사물을 포함함을 특징으로 하는 방법.
- 제 106 항에 있어서, 라이브러리는 각각의 특정 화합물의 적어도 약 106 개의 복사물을 포함함을 특징으로 하는 방법.
- 제 106 항에 있어서, 라이브러리는 적어도 약 104 개의 특정 화합물을 포함함을 특징으로 하는 방법.
- 제 106 항에 있어서, 라이브러리는 적어도 약 106 개의 특정 화합물을 포함함을 특징으로 하는 방법.
- 제 106 항에 있어서, 라이브러리는 적어도 약 108 개의 특정 화합물을 포함함을 특징으로 하는 방법.
- 제 106 항에 있어서, 라이브러리는 적어도 약 1010 개의 특정 화합물 을 포함함을 특징으로 하는 방법.
- 제 106 항에 있어서, 화합물 라이브러리는 적어도 약 1012 개의 특정 화합물을 포함함을 특징으로 하는 방법.
- 제 106 항에 있어서, 화합물 라이브러리는 독립적으로 다음 화학식 Ⅰ 을 갖는 다수의 화합물을 포함함을 특징으로 하는 방법화학식 Ⅰ이 식에서,X 는 하나 또는 그 이상의 빌딩 블록을 포함하는 작용 성분이고 ;Z 는 3' 말단에서 B 에 결합된 올리고누클레오티드이고 ;Y 는 5' 말단에서 C 에 결합된 올리고누클레오티드이고 ;A 는 X 와 공유결합을 형성하는 작용기이고 ;B 는 Z 의 3'-말단과 결합을 형성하는 작용기이고 ;C 는 Y 의 5'-말단과 결합을 형성하는 작용기이고 ;D, F 및 E 각각은 독립적으로 이작용기성 결합기이며 ;S 는 원자 또는 분자 스캐폴드(molecular scaffold)이다.
- 제 114 항에 있어서, A, B, C, D, E, F 및 S 각각은 화학식 Ⅰ 의 각각의 화합물과 동일한 동일성(identity)을 가짐을 특징으로 하는 방법.
- 제 114 항에 있어서, 화합물 라이브러리는 화학식 Ⅰ을 갖는 다수의 화합물을 필수적으로 함유함을 특징으로 하는 방법.
- 제 114 항에 있어서, D, E 및 F 는 각각 독립적으로 알킬렌쇄 또는 올리고(에틸렌 글리콜)쇄임을 특징으로 하는 방법.
- 제 114 항에 있어서, Y 및 Z 는 실질적으로 상보적이며, 적절한 조건 하에서 왓슨-크릭 염기쌍(Watson-Crick base pairing) 및 이중가닥 형성이 가능해지도록 화합물에서 방향이 정해져 있음을 특징으로 하는 방법.
- 제 114 항에 있어서, Y 및 Z 는 길이가 동일하거나 상이함을 특징으로 하는 방법.
- 제 119 항에 있어서, Y 및 Z 는 길이가 동일함을 특징으로 하는 방 법.
- 제 114 항에 있어서, Y 및 Z 는 각각 10 또는 그 이상의 염기 길이를 가지며, 10 또는 그 이상의 염기쌍의 상보적 영역을 가짐을 특징으로 하는 방법.
- 제 114 항에 있어서, S 는 탄소 원자, 붕소 원자, 질소 원자, 인 원자, 또는 다원자 스캐폴드(polyatomic scaffold)임을 특징으로 하는 방법.
- 제 114 항에 있어서, S 는 인산염기 또는 시클로기임을 특징으로 하는 방법.
- 제 123 항에 있어서, S 는 시클로알킬, 시클로알켄일, 헤테로시클로알킬, 헤테로시클로알켄일, 아릴 또는 헤테로아릴기임을 특징으로 하는 방법.
- 제 125 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 2 내지 8 임을 특징으로 하는 방법.
- 제 126 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 3 내지 6 임을 특징으로 하는 방법.
- 제 114 항에 있어서, X 및 Z 는 PCR 프라이머 서열을 포함함을 특징으로 하는 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US68946605P | 2005-06-09 | 2005-06-09 | |
US60/689,466 | 2005-06-09 | ||
US73104105P | 2005-10-28 | 2005-10-28 | |
US60/731,041 | 2005-10-28 | ||
PCT/US2006/022555 WO2006135786A2 (en) | 2005-06-09 | 2006-06-09 | Methods for synthesis of encoded libraries |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080036577A true KR20080036577A (ko) | 2008-04-28 |
KR101346432B1 KR101346432B1 (ko) | 2014-02-14 |
Family
ID=36930432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087000511A KR101346432B1 (ko) | 2005-06-09 | 2006-06-09 | 코드된 라이브러리를 합성하는 방법 |
Country Status (24)
Country | Link |
---|---|
EP (4) | EP1910538B1 (ko) |
JP (2) | JP5508711B2 (ko) |
KR (1) | KR101346432B1 (ko) |
CN (2) | CN102392014A (ko) |
AT (1) | ATE507292T1 (ko) |
AU (1) | AU2006257915B2 (ko) |
BR (1) | BRPI0613566B1 (ko) |
CA (1) | CA2611512C (ko) |
CY (1) | CY1112036T1 (ko) |
DE (1) | DE602006021580D1 (ko) |
DK (4) | DK2258870T3 (ko) |
ES (2) | ES2365534T3 (ko) |
HK (2) | HK1120546A1 (ko) |
HR (1) | HRP20110528T1 (ko) |
IL (1) | IL187977A (ko) |
NO (1) | NO343698B1 (ko) |
NZ (1) | NZ564545A (ko) |
PL (2) | PL2258870T3 (ko) |
PT (2) | PT1910538E (ko) |
RS (1) | RS51868B (ko) |
RU (2) | RU2459869C2 (ko) |
SI (1) | SI1910538T1 (ko) |
WO (1) | WO2006135786A2 (ko) |
ZA (2) | ZA200800190B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190113879A (ko) * | 2017-03-17 | 2019-10-08 | 히트젠 주식회사 | 코드 라이브러리 합성방법 및 조성물 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002102820A1 (en) | 2001-06-20 | 2002-12-27 | Nuevolution A/S | Nucleoside derivatives for library preparation |
IL163822A0 (en) | 2002-03-15 | 2005-12-18 | Nuevolution As | An improved method for synthesising templated molecules |
US10730906B2 (en) | 2002-08-01 | 2020-08-04 | Nuevolutions A/S | Multi-step synthesis of templated molecules |
PT1558744E (pt) | 2002-10-30 | 2011-09-22 | Nuevolution As | Codificação enzimática |
ATE450609T1 (de) | 2002-12-19 | 2009-12-15 | Nuevolution As | Durch quasizufallsstrukturen und funktionen geführte synthesemethode |
US20070026397A1 (en) | 2003-02-21 | 2007-02-01 | Nuevolution A/S | Method for producing second-generation library |
ATE447626T1 (de) | 2003-09-18 | 2009-11-15 | Nuevolution As | Methode zur gewinnung struktureller informationen kodierter moleküle und zur selektion von verbindungen |
SI1910538T1 (sl) | 2005-06-09 | 2011-09-30 | Praecis Pharm Inc | POSTOPKI ZA SINTEZO KODIRANIH KNJIĹľNIC |
DK3305900T3 (da) * | 2005-12-01 | 2021-10-25 | Nuevolution As | Enzymatic encoding methods for efficient synthesis of large libraries |
ES2638324T3 (es) * | 2009-02-13 | 2017-10-19 | X-Chem, Inc. | Métodos de creación y examen de bibliotecas codificadas por ADN |
LT2558577T (lt) | 2010-04-16 | 2019-03-12 | Nuevolution A/S | Bifunkciniai kompleksai ir tokių kompleksų gamybos ir naudojimo būdai |
AU2012304387B2 (en) * | 2011-09-07 | 2017-03-16 | X-Chem, Inc. | Methods for tagging DNA-encoded libraries |
NZ739931A (en) | 2012-07-13 | 2019-08-30 | X Chem Inc | Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases |
WO2019149198A1 (zh) * | 2018-01-31 | 2019-08-08 | 成都先导药物开发股份有限公司 | 一种dna编码化合物库及化合物筛选方法 |
GB201821109D0 (en) * | 2018-12-21 | 2019-02-06 | Philochem Ag | Nucleic acid encoded chemical libraries |
CN110041390B (zh) * | 2019-04-26 | 2022-05-27 | 上海药明康德新药开发有限公司 | DNA编码化合物库中On-DNA的1,2,3-三氮唑化合物的合成方法 |
CN112779606A (zh) * | 2019-11-06 | 2021-05-11 | 成都先导药物开发股份有限公司 | 一种On-DNA曼尼希反应的方法 |
CN113089104B (zh) * | 2019-12-23 | 2023-03-28 | 成都先导药物开发股份有限公司 | 一种On-DNA二胺化合物关环反应的合成方法 |
CN115506036B (zh) * | 2021-06-22 | 2024-07-02 | 中国科学院上海药物研究所 | Dna编码化合物文库起始片段及其制备和应用 |
DK4201951T3 (da) * | 2021-12-21 | 2024-01-15 | Bachem Holding Ag | Fremgangsmåde til syntese af et peptid |
CN114920791B (zh) * | 2022-04-28 | 2024-06-18 | 康龙化成(宁波)科技发展有限公司 | 一种寡聚核酸-琥珀酰亚胺化合物的合成方法 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1545804A (en) | 1924-12-26 | 1925-07-14 | Warmerdam Nicholas | Sash fastener |
US4356270A (en) | 1977-11-08 | 1982-10-26 | Genentech, Inc. | Recombinant DNA cloning vehicle |
US4293652A (en) | 1979-05-25 | 1981-10-06 | Cetus Corporation | Method for synthesizing DNA sequentially |
US4458066A (en) | 1980-02-29 | 1984-07-03 | University Patents, Inc. | Process for preparing polynucleotides |
US4416988A (en) | 1980-12-23 | 1983-11-22 | Harvey Rubin | Detection and isolation of enkephalin mRNA using a synthetic oligodeoxynucleotide |
JPS60222842A (ja) | 1984-04-19 | 1985-11-07 | Fuji Photo Film Co Ltd | ハロゲン化銀写真乳剤およびその製造方法 |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4965188A (en) | 1986-08-22 | 1990-10-23 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme |
US4800159A (en) | 1986-02-07 | 1989-01-24 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences |
US5360928A (en) | 1989-10-23 | 1994-11-01 | Research Corporation Technologies, Inc. | Synthesis and use of amino acid fluorides as peptide coupling reagents |
AU669489B2 (en) | 1991-09-18 | 1996-06-13 | Affymax Technologies N.V. | Method of synthesizing diverse collections of oligomers |
US5573905A (en) | 1992-03-30 | 1996-11-12 | The Scripps Research Institute | Encoded combinatorial chemical libraries |
US5565324A (en) * | 1992-10-01 | 1996-10-15 | The Trustees Of Columbia University In The City Of New York | Complex combinatorial chemical libraries encoded with tags |
JPH08504444A (ja) | 1992-12-11 | 1996-05-14 | カイロン コーポレイション | コードされるポリマーの合成 |
US6537776B1 (en) * | 1999-06-14 | 2003-03-25 | Diversa Corporation | Synthetic ligation reassembly in directed evolution |
AU1318400A (en) | 1998-10-19 | 2000-05-08 | Board Of Trustees Of The Leland Stanford Junior University | Dna-templated combinatorial library chemistry |
DK1423400T4 (da) | 2001-03-19 | 2013-09-02 | Harvard College | Evolution af hidtil ukendt molekylfunktion |
CN1539014A (zh) | 2001-06-20 | 2004-10-20 | ŦΤ¬ɭ��˾ | 模控分子和使用这种分子的方法 |
KR101138643B1 (ko) | 2002-05-30 | 2012-04-26 | 더 스크립스 리서치 인스티튜트 | 구리 촉매 작용하에서의 아지드와 아세틸렌과의 리게이션 |
WO2004016767A2 (en) * | 2002-08-19 | 2004-02-26 | The President And Fellows Of Harvard College | Evolving new molecular function |
PT1558744E (pt) * | 2002-10-30 | 2011-09-22 | Nuevolution As | Codificação enzimática |
DE602004036672C5 (de) | 2003-01-29 | 2012-11-29 | 454 Life Sciences Corporation | Nukleinsäureamplifikation auf Basis von Kügelchenemulsion |
GB0304433D0 (en) * | 2003-02-27 | 2003-04-02 | Xceleron Ltd | Improvements relating to chemical libraries |
ATE424455T1 (de) * | 2003-03-20 | 2009-03-15 | Nuevolution As | Ligationsvermittelnde codierung von kleinen molekülen |
ATE447626T1 (de) * | 2003-09-18 | 2009-11-15 | Nuevolution As | Methode zur gewinnung struktureller informationen kodierter moleküle und zur selektion von verbindungen |
CA2549386C (en) * | 2003-12-17 | 2014-07-29 | Praecis Pharmaceuticals, Inc. | Methods for synthesis of encoded libraries |
US7116036B2 (en) | 2004-08-02 | 2006-10-03 | General Electric Company | Energy harvesting system, apparatus and method |
WO2006053571A2 (en) * | 2004-11-22 | 2006-05-26 | Peter Birk Rasmussen | Template directed split and mix systhesis of small molecule libraries |
SI1910538T1 (sl) | 2005-06-09 | 2011-09-30 | Praecis Pharm Inc | POSTOPKI ZA SINTEZO KODIRANIH KNJIĹľNIC |
-
2006
- 2006-06-09 SI SI200631057T patent/SI1910538T1/sl unknown
- 2006-06-09 AT AT06784718T patent/ATE507292T1/de active
- 2006-06-09 PT PT06784718T patent/PT1910538E/pt unknown
- 2006-06-09 PT PT100752955T patent/PT2258870E/pt unknown
- 2006-06-09 EP EP06784718A patent/EP1910538B1/en active Active
- 2006-06-09 RS RS20110327A patent/RS51868B/en unknown
- 2006-06-09 CN CN2011102198704A patent/CN102392014A/zh active Pending
- 2006-06-09 EP EP10012326A patent/EP2338990A3/en not_active Withdrawn
- 2006-06-09 DE DE602006021580T patent/DE602006021580D1/de active Active
- 2006-06-09 JP JP2008515983A patent/JP5508711B2/ja active Active
- 2006-06-09 ES ES06784718T patent/ES2365534T3/es active Active
- 2006-06-09 DK DK10075295.5T patent/DK2258870T3/da active
- 2006-06-09 DK DK06784718.6T patent/DK1910538T3/da active
- 2006-06-09 WO PCT/US2006/022555 patent/WO2006135786A2/en active Application Filing
- 2006-06-09 BR BRPI0613566-8A patent/BRPI0613566B1/pt active IP Right Grant
- 2006-06-09 PL PL10075295T patent/PL2258870T3/pl unknown
- 2006-06-09 AU AU2006257915A patent/AU2006257915B2/en active Active
- 2006-06-09 CN CN2006800276157A patent/CN101233235B/zh active Active
- 2006-06-09 PL PL06784718T patent/PL1910538T3/pl unknown
- 2006-06-09 NZ NZ564545A patent/NZ564545A/en unknown
- 2006-06-09 KR KR1020087000511A patent/KR101346432B1/ko active IP Right Grant
- 2006-06-09 CA CA2611512A patent/CA2611512C/en active Active
- 2006-06-09 ES ES10075295T patent/ES2401485T3/es active Active
- 2006-06-09 EP EP10075296.3A patent/EP2311786A3/en not_active Withdrawn
- 2006-06-09 RU RU2008100035/10A patent/RU2459869C2/ru active
- 2006-06-09 EP EP10075295A patent/EP2258870B1/en active Active
-
2007
- 2007-12-06 IL IL187977A patent/IL187977A/en active IP Right Grant
- 2007-12-12 NO NO20076362A patent/NO343698B1/no unknown
-
2008
- 2008-01-03 DK DKPA200800005A patent/DK177345B1/da active
- 2008-01-08 ZA ZA2008/00190A patent/ZA200800190B/en unknown
- 2008-09-26 HK HK08110780.5A patent/HK1120546A1/xx unknown
-
2010
- 2010-07-07 ZA ZA2010/04791A patent/ZA201004791B/en unknown
-
2011
- 2011-01-19 RU RU2011101778/10A patent/RU2011101778A/ru not_active Application Discontinuation
- 2011-05-05 HK HK11104502.0A patent/HK1150454A1/xx unknown
- 2011-07-13 HR HR20110528T patent/HRP20110528T1/hr unknown
- 2011-07-14 CY CY20111100688T patent/CY1112036T1/el unknown
- 2011-12-20 DK DKPA201170734A patent/DK179064B1/da active
-
2013
- 2013-09-19 JP JP2013194319A patent/JP2014039550A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190113879A (ko) * | 2017-03-17 | 2019-10-08 | 히트젠 주식회사 | 코드 라이브러리 합성방법 및 조성물 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101346432B1 (ko) | 코드된 라이브러리를 합성하는 방법 | |
KR101300315B1 (ko) | 코드된 라이브러리의 합성 방법 | |
US8410028B2 (en) | Methods for synthesis of encoded libraries | |
AU2011205057B2 (en) | Methods for synthesis of encoded libraries | |
AU2011205058A1 (en) | Methods for synthesis of encoded libraries | |
MX2007015543A (en) | Methods for synthesis of encoded libraries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20161125 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170929 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180928 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190924 Year of fee payment: 7 |