KR20080036577A

KR20080036577A - 코드된 라이브러리를 합성하는 방법

Info

Publication number: KR20080036577A
Application number: KR1020087000511A
Authority: KR
Inventors: 배리 모건; 스티븐 헤일; 크리스토퍼 시 아리코-뮌델; 매튜 클라크; 리처드 와그너; 맬컴 제이 카바라나; 스테판 필립 크리저; 조지 제이 프랭클린; 파올로 에이 센트렐라; 데이비드 아이 이스라엘; 맬컴 엘 게프터; 데니스 벤저민; 닐스 야콥 베스트 한센; 락샤 에이 아카리아
Original assignee: 프래시스 파마슈티컬즈 인코포레이티드
Priority date: 2005-06-09
Filing date: 2006-06-09
Publication date: 2008-04-28
Also published as: ES2365534T3; BRPI0613566B1; DK201170734A; DK177345B1; IL187977A0; JP2008543289A; ZA201004791B; DK1910538T3; CN102392014A; CY1112036T1; RU2008100035A; EP2311786A3; AU2006257915A1; HK1120546A1; RU2011101778A; HRP20110528T1; JP2014039550A; HK1150454A1; EP2258870A3; BRPI0613566A2

Abstract

본 발명은 코딩 올리고누클레오티드 표지를 함유하는 분자의 라이브러리를 합성하는 방법을 제공한다.

코딩 올리고누클레오티드, 화합물 라이브러리, 라이브러리 합성, 빌딩 블록(building block)

Description

코드된 라이브러리를 합성하는 방법{METHODS FOR SYNTHESIS OF ENCODED LIBRARIES}

관련 출원

본 출원은 2003 년 12 월 17 일 출원된 미국 예비 특허 출원 일련 번호 제 60/530,854 호 ; 2004 년 1 월 30 일 출원된 미국 예비 특허 출원 일련 번호 제 60/540,681 호 ; 2004 년 3 월 15 일 출원된 미국 예비 특허 출원 일련 번호 제 60/553,715 호 ; 및 2004 년 7 월 16 일 출원된 미국 예비 특허 출원 일련 번호 제 60/588,672 호와 관련있는 현재 계류중인 2004 년 12 월 17 일 출원된 미국 특허 출원 제 11/015,458 호의 부분 연속 출원이다. 본 출원은 또한 2005 년 6 월 9 일 출원된 미국 예비 특허 출원 일련 번호 제 60/689,466 호 및 2005 년 10 월 28 일 출원된 미국 예비 특허 출원 일련 번호 제 60/731,041 호에 대해 우선권을 주장한다. 상기 출원들의 전체 내용이 참고문헌으로 인용되었다.

유용한 생물학적 활성을 갖는 화합물을 규명하는 보다 효과적인 방법에 대한 연구가 진행되어 엄청난 수의 개별 화합물들을 선별하는 방법 들이 개발되었으며, 조합 라이브러리(combinational library)로 불리는 컬렉션으로 제공되어 있다. 이러한 라이브러리들은 10⁵ 이상의 개별 화합물들을 포함한다. 조합 라이브러리를 생성하는 다양한 방법들이 있으며 펩티드, 펩티드 유사체(peptidomimetic) 및 작은 유기 분자들의 조합적인 합성법이 보고되고 있다.

신약 개발에 조합적인 접근을 이용함에 있어서 두 가지 주요한 문제는 충분한 복잡성을 갖는 라이브러리의 합성과 사용된 스크린에서 활성을 보이는 분자의 확인이다. 일반적으로, 라이브러리의 복잡성이 클수록, 즉, 라이브러리 내 존재하는 개별 구조의 수가 많을수록, 해당 라이브러리가 중요한 활성을 갖는 분자를 가질 확률이 커진다. 따라서, 라이브러리 합성에 관여한 화학작용은 적당한 시간 프레임 안에 많은 수의 화합물을 생성할 수 있을 것이다. 그러나, 주어진 규정 또는 전체 농도의 경우, 라이브러리 내의 개별 구성요소를 증가시키는 것은 임의의 특정 라이브러리 구성요소의 농도를 저하시킨다. 이는 복잡성이 큰 라이브러리로부터 활성 분자를 확인하는 것을 어렵게 만든다.

이러한 단점을 극복하려는 시도로서, 코드된 라이브러리, 특히 각각의 화합물이 증폭된 표지를 갖는 라이브러리를 개발하였다. 이들 라이브러리는 DNA 코드된 라이브러리를 가지며, 이때, 라이브러리 구성요소를 확인하는 DNA 표지는 폴리머라제 연쇄 반응과 같은 분자 생물학 기술을 이용하여 증폭시킬 수 있다. 그러나, 이처럼 거대한 라이브러리를 생성하는 방법을 사용하는 것은 논증이 필요하며, 신약 개발을 위한 이러한 시도의 가능성을 현실화하기 위해서는 이들 라이브러리의 생성 방법이 반드시 개선되어야 한다.

발명의 요약

본 발명은 코드된 올리고누클레오티드 표지를 갖는 분자들의 라이브러리를 합성하는 방법을 제공한다. 본 발명의 방법은 코드된 올리고누클레오티드에 결합된 제 1 빌딩 블록을 갖는 개시제를 포함하는 용액이 여러 분획으로 분할되는 (스플릿) 및 풀(split and pool) 전략을 이용한다. 각각의 분획에서, 개시제는 제 2 의 특정 빌딩 블록 및 상기 제 2 특정 빌딩 블록을 확인하는 제 2 의 특정 올리고누클레오티드와 반응한다. 이러한 반응들은 동시 또는 순차적으로 진행되며, 순차적일 경우에는 하나의 반응이 다른 반응을 앞설 수 있다. 각각의 분획에서 생성된 이합체 분자들은 합쳐지고(풀), 다시 여러 분획으로 분할된다. 이어서, 각각의 분획들은 제 3 의 특정 (분획 특이성) 빌딩 블록 및 상기 빌딩 블록을 코드하는 제 3 특정 올리고누클레오티드와 반응한다. 생성물 라이브러리 내 존재하는 특정 분자의 수는 (1) 합성 각 단계에 사용되는 서로 다른 빌딩 블록의 수 및 (2) 합하고 분할시키는 과정이 반복되는 횟수의 함수이다.

한 실시 양태에서, 본 발명은 코드된 올리고누클레오티드에 효과적으로 결합된 작용 성분을 포함하는 또는 상기 작용 성분으로 이루어진 분자를 합성하는 방법을 제공한다. 본 발명의 방법은 (1) n 개의 빌딩 블록을 포함하고, 하나 이상의 반응성 기를 포함하며 개시 올리고누클레오티드에 효과적으로 결합된 작용 성분으로 이루어진 개시 화합물(상기에서 n 은 1 이상의 정수이다)을 제공하는 단계 ; (2) 상기 개시 화합물과 단계 (1) 의 반응성 기에 상보적인 하나 이상의 상보적 반응성 기를 포함하는 빌딩 블록을 상기 반응성 기와 상기 상보적 반응성 기의 반응에 적합한 조건 하에 반응시키는 단계 ; (3) 상기 개시 올리고누클레오티드와 단계 (b) 의 빌딩 블록을 확인하는 도입(incoming) 올리고누클레오티드를 상기 개시 올리고누클레오티드와 도입 올리고누클레오티드의 결합을 촉매하는 효소 존재 하에 올리고누클레오티드와 개시 올리고누클레오티드의 결합에 적합한 조건에서 반응시켜 코드된 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분을 포함하는 또는 상기 작용 성분으로 이루어진 분자를 생성하는 단계를 포함한다. 만일 단계 (3) 의 작용 성분이 반응성 기를 포함한다면, 1-3 단계를 1 회 이상 반복하여 고리 1 내지 i 를 형성하며(상기에서 i 는 2 이상의 정수이다), 사이 클 s 의 단계 (3) 의 생성물은 사이클 s+1 의 개시 화합물이 된다(상기에서 s 는 i-1 또는 그 미만의 정수이다).

한 실시 양태에서, 본 발명은 작용 성분 구조를 확인하는 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록을 포함하는 작용 성분을 포함하는 화합물의 라이브러리를 합성하는 방법을 제공한다. 본 발명의 방법은 (1) n 개의 빌딩 블록을 포함하고(상기에서 n 은 1 이상의 정수이다) 상기 n 개의 빌딩 블록을 확인하는 개시 올리고누클레오티드에 효과적으로 결합된 작용 성분으로 이루어진 m 개의 개시 화합물(상기에서 m 은 1 이상의 정수이다)을 포함하는 용액을 제공하는 단계 ; (2) 단계 (1) 의 용액을 r 개의 분획으로 분할하는 단계(상기에서 r 은 2 이상의 정수이다) ; (3) 상기 각 분획 내 개시 올리고누클레오티드와 r 개의 빌딩 블록 중 하나를 반응시켜 개시 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분으로 이루어진 화합물을 포함하는 r 개의 분획을 생성하는 단계 ; (4) 상기 각 분획 내 개시 올리고누클레오티드와 r 개의 특정 도입 올리고누클레오티드 세트 중 하나를 상기 도입 올리고누클레오티드와 개시 올리고누클레오티드의 결합을 촉매하는 효소 존재 하에 상기 도입 올리고누클레오티드와 상기 개시 올리고누클레오티드의 효소적 결합에 적합한 조건에서 반응시켜 n+1 개의 빌딩 블록을 코드하는 연장된 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분으로 이루어진 분자를 포함하는 r 개의 분획을 생성하는 단계를 포함한다. 임의로, 상기 방법은 단계 (4) 에서 생성된 r 개의 분획을 재조합시키는 단계 (5) 를 더 포함할 수 있다. 단계 (1) 에서 (5) 를 1 회 이상 수행하여 고리 1 내지 i 를 만들 수 있다(i 는 2 이상의 정수이다). 사이클 s+1 에서(상기에서 i 는 2 이상의 정수이다), 단계 (1) 의 m 개 개시 화합물을 포함하는 용액이 사이클 s 의 단계 (5) 의 용액이다. 마찬가지로, 사이클 s+1 의 단계 (1) 의 개시 화합물은 사이클 s 의 단계 (5) 의 화합물이다.

바람직한 실시 양태에서, 빌딩 블록은 통상적인 화학 반응을 이용하여 각 단계에서 결합시킨다. 빌딩 블록을 결합시키면 펩티드 유사체 및 펩토이드와 같은 선형 또는 분지형 중합체 또는 올리고머, 또는 하나 이상의 부가적 화학 잔기가 결합된 스캐폴드 구조를 포함하는 분자와 같은 비올리고머 분자를 생성할 수 있다. 예를 들면, 빌딩 블록이 아미노산 잔기일 경우, 빌딩 블록은 해당 분야에 공지된 적합한 보호/탈보호 전략을 이용하는 용액상 또는 고체상 합성법과 같은 표준 펩티드 합성법을 이용하여 결합시킬 수 있다. 바람직한 것은 용액상 화학반응을 이용하여 결합시키는 것이다. 코드된 올리고누클레오티드는 단일 가닥(single stranded) 또는 이중 가닥(double stranded) 올리고누클레오티드이며, 이중 가닥 올리고누클레오티드가 바람직하다. 코드 된 올리고누클레오티드는 빌딩 블록 당 4 내지 12 개의 염기들 또는 염기쌍을 갖는 올리고누클레오티드가 바람직하며, 코드된 올리고누클레오티드는 표준 용액상 또는 고체상 올리고누클레오티드 합성 방법을 이용하여 결합시킬 수 있지만 용액상 효소 방법을 이용하여 결합시키는 것이 바람직하다. 예를 들면, 올리고누클레오티드는 토포아이소머라제 (topoisomerase), 리가제(ligase) 또는 DNA 폴리머라제를 이용하여 결합시킬 수 있는데, 이때 코드된 올리고누클레오티드의 서열은 이들 효소 중 하나에 의한 결합에 적합한 개시 서열을 포함해야 한다. 코드된 올리고누클레오티드의 효소적 결합은 (1) 표준 합성(비효소) 결합에 비해 첨가반응이 보다 정확하고 (2) 간단한 보호/탈보호 전략을 사용하는 이점을 제공한다.

다른 양태에서, 본 발명은 하기 화학식 I 의 화합물을 제공한다 :

이 식에서, X 는 하나 이상의 빌딩 블록을 포함하는 작용 성분이고 ; Z 는 B 의 3' 말단에 결합된 올리고누클레오티드이고 ; Y 는 C 의 5' 말단에 결합된 올리고누클레오티드이고 ; A 는 X 와 공유결합을 형성하는 작용 성분이고 ; B 는 Z 의 3' 말단과 결합을 형성하는 작용 성분이고 ; C 는 Y 의 5' 말단과 결합을 형성하는 작용 성분이고 ; D, F 및 E 는 각각 독립적으로 이작용기성 결합기(bifunctional linking group)이며 ; S 는 원자 또는 분자 스캐폴드이다. 이러한 화합물은 본 발명의 방법을 사용하여 합성된 화합물을 포함한다.

본 발명은 또한 작용 성분의 구조를 코드하는 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록을 포함하는 작용 성분을 포함하는 화합물을 포함하는 화합물 라이브러리에 관한 것이다. 이 라이브러리는 약 10² 내지 약 10¹² 이상의 특정 구성요소, 예를 들면 10², 10³, 10⁴, 10⁵, 10⁶, 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹² 이상의 개별 구성요소 즉, 개별 분자 구조를 포함할 수 있다.

한 실시 양태에서, 본 발명의 화합물 라이브러리는 각각 독립적으로 하기 화학식 I 인 화합물들을 포함한다 : 화학식 I

이 식에서, X 는 하나 이상의 빌딩 블록을 포함하는 작용 성분이고 ; Z 는 B 의 3' 말단에 결합된 올리고누클레오티드이고 ; Y 는 C 의 5' 말단에 결합된 올리고누클레오티드이고 ; A 는 X 와 공유결합을 형성하는 작용 성분이고 ; B 는 Z 의 3' 말단과 결합을 형성하는 작용 성분이고 ; C 는 Y 의 5' 말단과 결합을 형성하는 작용 성분이고 ; D, F 및 E 는 각각 독립적으로 이작용기성 결합기이며 ; S 는 원자 또는 분자 스캐폴드이다. 이러한 화합물은 본 발명의 방법을 사용하여 합성된 화합물을 포함한다.

다른 양태에서, 본 발명은 (a) 생물학적 표적과, 작용 성분의 구조를 코드하는 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록을 포함하는 작용 성분을 갖는 화합물들을 포함하는 본 발명의 화합물 라이브러리를 접촉시키는 단계를 포함하는 생물학적 표적에 결합된 화합물을 확인하는 방법을 제공한다. 이 단계는 화합물 라이브러리의 하나 이상의 구성요소를 표적에 결합시키는데 적합한 조건 하에서 수행하고 ; 본 발명의 방법은 또한 (2) 표적에 결합되지 않은 라이브러리 구성요소를 제공하는 단계 ; (3) 표적에 결합된 화합물 라이브러리의 하나 이상의 구성요소의 코드된 올리고누클레오티드를 증폭시키는 단계 ; (4) 단계 (3) 의 코드된 올리고누클레오티드의 서열을 결정하는 단계 ; 및 (5) 단계 (4) 에서 결정된 서열을 이용하여 생물학적 표적에 결합된 화합물 라이브러리의 구성요소의 작용 성분 구조를 측정하는 단계를 포함한다.

본 발명은 원하는 특성을 갖는 분자를 확인하는데 몇가지 장점을 제공한다. 예를 들면, 본 발명의 방법은 올리고누클레오티드 표지 존재 하에 분자를 구성할 때 일정 범위의 화학 반응을 사용가능하게 한다. 본 발명의 방법은 또한 그렇게 생성된 화학 구조에 올리고누클레오티드 표지를 혼입함에 있어서 높은 충실도를 제공한다. 그 밖에도, 본 발명의 방법에 의하면 각각의 구성요소에 대해 많은 수의 복제물을 갖는 라이브러리를 합성할 수 있으며, 따라서 마지막으로 올리고누 클레오티드 표지를 증폭시키고 서열을 결정한 후에도 충분한 수의 분자를 남기면서 생물학적 표적에 대해 여러 번 선택할 수 있다.

도 1 은 도입 올리고누클레오티드의 돌출부(overhang)에 상보적인 돌출부를 갖는 이중 가닥 개시 올리고누클레오티드의 결합을 개략적으로 도시한 것이다. 개시 올리고누클레오티드 가닥은 유리된 상태이거나, 아미노헥실 링커에 결합되어 있거나 아미노헥실 링커를 통해 페닐알라닌 잔기에 결합된 상태로 도시되어 있다.

도 2 는 스플린트(splint) 가닥을 이용하는 올리고누클레오티드 결합을 개략적으로 도시한 것이다. 이 실시 양태에서, 스플린트는 단일 가닥 개시 올리고누클레오티드 및 단일 가닥 도입 올리고누클레오티드에 상보적인 서열을 갖는 12 합체(12-mer) 올리고누클레오티드이다.

도 3 은 개시 올리고누클레오티드가 가닥들이 공유결합으로 연결된 이중 가닥이고, 도입 올리고누클레오티드가 이중 가닥일 때 개시 올리고누클레오티드와 도입 올리고누클레오티드의 결합을 개략적으로 도시한 것이다.

도 4 는 폴리머라제를 이용한 올리고누클레오티드 연장법을 개략적으로 도시한 것이다. 개시 가닥은 유리된 상태이거나, 아미노헥실 링커에 결합되어 있거나, 아미노헥실 링커를 통해 페닐알라닌 잔기에 결합된 상태로 도시되어 있다.

도 5 는 본 발명의 한 실시 양태의 합성을 개략적으로 도시한 것이다.

도 6 은 본 발명의 라이브러리를 사용하여 여러번 선택하는 방법을 개략적으로 도시한 것이다.

도 7 은 실시예 1 에 기재된 사이클 1 에서 5 의 각각의 생성물과 폐쇄 프라이머의 결합 후 겔 전기영동을 실시하여 얻은 결과를 도시한 것이다. 분자량 표준이 1 레인에 도시되어 있고, DNA 정량을 위한 하이퍼래더(hyper-ladder)의 지시량은 9 에서 12 레인에 도시되어 있다.

도 8 은 아지드-알킨 고리화첨가반응(cycloaddition)을 이용한 빌딩 블록의 결합을 개략적으로 도시한 것이다.

도 9 및 도 10 은 염소 첨가 트리아진에 친핵성 방향족 치환반응을 통해 빌딩 블록을 결합시키는 예를 도시한 것이다.

도 11 은 작용 성분의 합성에 사용하기 적합한 대표적인 염소 첨가 헤테로방향족 구조를 도시한 것이다.

도 12 는 아지드/알킨 고리화첨가반응을 이용하는 선형 펩티드의 고리화 반응을 예시한 것이다.

도 13A 는 사이클 4 이후 실시예 2 에 기재된 바와 같이 생성된 라이브러리의 크로마토그램을 도시한 것이다.

도 13B 는 사이클 4 이후 실시예 2 에 기재된 바와 같이 생성된 라이브러리의 질량 스펙트럼을 도시한 것이다.

본 발명은 화합물 및 조합 화합물 라이브러리를 생성하는 방법, 상기 방법에 의해 생성된 화합물 및 상기 라이브러리를 사용하여 원하는 생물학적 활성과 같이 원하는 특성을 갖는 화합물을 확인하는 방법에 관한 것이다. 본 발명은 또한 상기 방법을 이용하여 확인된 화합물에 관한 것이다.

조합 화합물 라이브러리를 생성하고 선별하기 위해 다양한 접근을 시도하였다. 예로 단일 화합물을 여러 반응 용기 각각에서 합성했을 때와 같이, 라이브러리의 개개의 구성요소들을 서로 물리적으로 분리하는 방법을 포함한다. 그러나, 이들 라이브러리들은 일반적으로 한번에 1 개 화합물을 선별하거나, 대체로 1 회에 몇몇 화합물만을 선별하며, 따라서 가장 효율적인 선별 방법은 아니다. 다른 방법으로, 화합물들을 고체 지지체 상에서 합성한다. 이러한 고체 지지체로는 칩이 있으며, 특정 화합물이 칩 또는 막의 특정 영역을 차지한다("위치를 지정 할 수 있다"). 또다른 방법으로, 화합물을 비드 상에서 합성할 수 있으며, 각각의 비드는 서로 다른 화학 구조를 갖는다.

대형 라이브러리를 선별함에 있어서, 두 가지 어려움이 있는데 (1) 선별할 수 있는 개별 화합물의 수와 (2) 스크린에서 활성을 보이는 화합물을 확인하는 것이다. 한가지 방법으로는, 최초의 라이브러리를 보다 작은 분획 및 하위 분획으로 좁혀 스크린에서 활성을 보이는 화합물을 확인하는 것으로, 각각의 경우, 활성 화합물을 함유한 분획 또는 하위 분획을 선택하고 추가로 하위 세트의 모든 구성요소가 개별적으로 합성될 수 있고 원하는 활성을 가질 수 있을 만큼 충분히 작은 화합물 세트를 함유한 활성 하위 분획을 얻을 때까지 분할한다. 이는 비효율적이며 시간을 소비하는 것이다.

조합 라이브러리 선별 결과를 해석하는 다른 방법은 라이브러리를 사용하는 것으로, 라이브러리 구성요소를 확인 라벨로 표지하는데, 즉, 라이브러리 내에 존재하는 각각의 라벨이 라이브러리 내에 존재하는 개별 화합물 구조와 관련이 있어서, 라벨을 확인하면 표지된 분자의 구조를 알 수 있다. 표지된 라이브러리를 이용한 것들 중 기재한 바와 같이 올리고누클레오티드 표지를 사용한 것에는 예를 들면, 미국 특허 제 5,573,905 호 ; 제 5,708,153 호, 제 5,723,598 호, 제 6,060,596 호, PCT 출원 공개 제 WO 93/06121 호, 제 WO 93/20242 호, 제 WO 94/13623 호, 제 WO 00/23458 호, 제 WO 02/074929 호 및 제 WO 02/103008 호, 및 Brenner 및 Lerner 의 문헌 Proc. Natl. Acad. Sci. USA 89, 5381-5383 (1992) ; Nielsen 및 Janda 의 문헌 Methods : A companion to Methods in Enzymology 6, 361-371 (1994) ; 및 Nielsen, Brenner 및 Janda 의 문헌 J. Am. Chem. Soc. 115, 9812-9813 (1993) 이 있으며, 상기 문헌들 각각은 그 전문이 본원에 참고문헌으로 인용되었다. 예를 들면, 폴리머라제 연쇄 반응을 사용하여 표지를 증폭시킴으로써 많은 표지의 복사본을 생성하고 서열화하여 표지를 확인할 수 있다. 표지의 서열은 순수 형태로 합성할 수 있고 검사할 수 있는 결합 분자의 구조를 확인시켜준다. 본 발명은 작용 성분을 용액상 합성 방법을 사용하여 합성하는 DNA-코드된 분자의 대형 라이브러리(구성요소 10⁵ 이상)의 첫 번째 예 뿐만 아니라 DNA-코드된 라이브러리를 생성하는 방법에 있어서 개선점을 제공한다.

본 발명은 올리고누클레오티드-코드된 조합 라이브러리의 합성을 용이하게 하고, 올리고누클레오티드 표지를 엄청난 수의 분자 각각에 결합시키는 효율적이고 높은 신뢰도를 부여하는 방법을 제공한다.

본 발명의 방법은 빌딩 블록으로 이루어진 제 1 성분("작용 성분") 및 상기 제 1 성분에 효과적으로 결합되며, 제 1 잔기의 구조를 확인하는 올리고누클레오티드 표지, 즉 빌딩 블록이 연결된 순서 뿐만 아니라, 어느 빌딩 블록이 제 1 성분의 구성에 사용되는지를 나타내는 올리고누클레오티드 표지를 포함하는 제 2 성분을 포함하는 이작용기성 분자를 합성하는 방법을 포함한다. 일반적으로, 올리고누클레오티드 표지에 의해 제공되는 정보는 활성 잔기를 구성하는 데 사용되는 빌딩 블록을 결정하기에 충분하다. 펩티드 잔기, 아미노산 서열과 같이, 특정 실시 양태에서는, 올리고누클레오티드 표지의 서열이 작용 성분 내 빌딩 블록의 배치를 결정하는데 충분하다.

본원에 사용된 용어 "작용 성분(functional moiety)" 은 하나 이상의 빌딩 블록을 포함하는 화학적 성분을 나타낸다. 작용 성분의 빌딩 블록은 핵산이 아닌 것이 바람직하다. 작용 성분은 선형 또는 분지형 또는 고리형 중합체 또는 올리고머 또는 작은 유기 분자일 수 있다.

본원에 사용된 용어 "빌딩 블록(building block)"은 다른 화학 구조 단위에 연결되거나 그런 다른 단위에 연결될 수 있는 화학 구조 단위이다. 작용 성분이 중합체거나 올리고머일 경우, 빌딩 블록은 중합체 또는 올리고머의 단량체 단위이다. 빌딩 블록은 또한 하나 이상의 추가 구조 주변 빌딩 블록("peripheral building block")이 결합된 또는 결합될 수 있는 스캐폴드 구조["스캐폴드 구성 블록 (scaffold building block)"]를 포함할 수 있다.

본원에 사용된 용어 "빌딩 블록" 은 작용 성분 및 작용 성분의 합성에 사용되는 반응성 형태에 존재하는 화학 구조 자체를 나타내는 것으로 이해해야 한다. 작용 성분 내에서, 빌딩 블록은 빌딩 블록을 작용 성분에 결합시킨 결과 손실되는 특정 부분없이 존재할 것이다. 예를 들면, 결합 형성 반응으로 작은 분자가 생성된 경우(아래 참조), 작용 성분에 존재하는 빌딩 블록은 "빌딩 블록 잔기", 즉, 이탈된 분자에 기여한 원자를 유실한 후 합성에 사용된 빌딩 블록의 나머지 잔기이다.

빌딩 블록은 임의의 상보적인 화학적 화합물일 수 있으며, 따라서, 빌딩 블록은 서로 반응하여 2 개 이상의 빌딩 블록을 포함하는 구조를 형성할 수 있어야 한다. 일반적으로, 사용된 빌딩 블록들은 모두 2 개 이상의 반응성 기를 갖는다. 그러나 몇몇 빌딩 블록(예를 들면, 올리고머 작용 성분의 마지막 빌딩 블록)은 오직 하나의 반응성 기만을 가질 수도 있다. 2 개의 서로 다른 빌딩 블록 상의 반응성 기들은 상보적이어야 하며, 즉, 서로 반응하여 공유결합을 형성할 수 있어야 하며, 이때 물, HCl, HF 등과 같은 작은 분자의 유실이 수반될 수 있다.

현 목적 하에, 서로 반응하여 공유 결합을 형성할 수 있다면, 2 개의 반응성 기는 상보적이다. 바람직한 양태에서는, 주변 조건 하에서 결합 형성 반응이 실질적인 부산물의 형성 없이 빠르게 일어난다. 주어진 반응성 기가 주어진 상보적 반응성 기와 정확히 한 번 반응하는 것이 바람직하다. 한 실시 양태에서는, 한 쌍의 상보적 반응성 기 중 하나가 친전자성 기이고, 다른 하나가 친핵성 기이다.

상보적 친전자성 및 친핵성 기는 적합한 조건 하에서 친핵성 치환반응을 하여 공유 결합을 형성하는 2 개의 기를 포함한다. 여러가지 적합한 결합 형성 반응이 당 분야에 공지되어 있다. 예를 들면, March 의 문헌 Advanced Organic Chemistry, fourth edition, New York : John Wiley and Sons (1992), Chapters 10-16 ; Carey 및 Sundberg 의 문헌, Advanced Organic Chemistry, Part B Plenum (1990), Chapters 1-11 ; 및 Collman 등의 문헌, Principles and Applications of Organotransition metal Chemistry, University Science Books, Mill Valley, Calif. (1987), Chapters 13-20 이 있다. 상기 문헌은 각각 그 전문이 본원의 참고문헌으로 인용되었다. 적합한 친전자성 기의 예로는 아실 클로라이드기, 카르보닐 펜타플루오로페닐 에스테르 및 숙신이미드 에스테르기를 비롯한 에스테르기, 케톤기 및 알데히드기와 같은 반응성 카르보닐기 ; 술포닐 클로라이드기와 같은 반응성 술포닐기 및 반응성 포스포닐기가 있다. 다른 친전자성 기는 에폭시드기, 이소시아네이트기 및 알킬 할라이드기가 포함된다. 적합한 친핵성 기는 1 차 및 2 차 아미노기 히드록실기 및 카르복실기를 포함한다.

적합한 상보적 반응성 기는 이후에 기재할 것이다. 당 분야의 숙련자라면 본 발명의 방법에 사용될 수 있는 다른 반응성 기를 쉽게 결정할 수 있을 것이며, 본원에 제공된 예들에 제한되지 않음을 이해할 것이다.

제 1 실시 양태에 따르면, 상보적 반응성 기는 활성화 카르복실기, 반응성 술포닐기 또는 반응성 포스포닐기 또는 이들의 혼합물 및 1 차 또는 2 차 아미노기를 포함한다. 이 실시 양태에서는, 상보적 반응성 기를 적합한 조건 하에 반응시켜 아미드, 술폰아미드 또는 포스폰아미데이트 결합을 형성한다.

제 2 실시 양태에 따르면, 상보적 반응성 기는 에폭시드기 및 1 차 또는 2 차 아미노기를 포함한다. 에폭시드-함유 빌딩 블록은 아민-함유 빌딩 블록과 적합한 조건 하에 반응하여 탄소-질소 결합을 형성함으로써 베타-아미노 알콜을 생성한다.

다른 실시 양태에서는, 상보적 반응성 기가 아지리딘기 및 1 차 또는 2 차 아미노기를 포함한다. 적합한 조건 하에 아지리딘-함유 빌딩 블록과 아민-함유 빌딩 블록을 반응시켜 탄소-질소 결합을 형성함으로써 12-디아민을 생성한다. 제 3 실시 양태에서는, 상보적 반응성 기가 이소시아네이트기 및 1 차 또는 2 차 아미노기를 포함한다. 이소시아네이트-함유 빌딩 블록이 아미노-함유 빌딩 블록과 적합한 조건 하에 반응하여 탄소-질소 결합을 형성함으로써 우레아기를 생성한다.

제 4 실시 양태에서는, 상보적 반응성 기가 이소시아네이트기 및 히드록실기를 포함한다. 이소시아네이트-함유 빌딩 블록이 히드록실-함유 빌딩 블록과 적합한 조건 하에 반응하여 탄소-산소 결합을 형성함으로써 카르바메이트기를 생성한다.

제 5 실시 양태에서는, 상보적 반응성 기가 아미노기 및 알데히드 또는 케톤기와 같은 카르보닐-함유기를 포함한다. 아민이 환원아민화반응을 통해 상기 기와 반응함으로써 새로운 탄소-질소 결합을 형성한다.

제 6 실시 양태에서는, 상보적 반응성 기가 3 가 인 일리드기 및 알데히드 또는 케톤기를 포함한다. 3 가 인 일리드 함유 빌딩 블록이 적합한 조건 하에 알데히드 또는 케톤-함유 빌딩 블록과 반응하여 탄소-탄소 이중 결합을 형성함으로써 알켄을 생성한다.

제 7 실시 양태에서는, 상보적 반응성 기들이 고리화첨가반응에 의해 반응하여 고리 구조를 형성한다. 이러한 상보적 반응성 기의 예로는 알킨 및 유기 아지드가 있으며, 이들은 적합한 조건 하에 반응하여 트리아졸 고리 구조를 형성한다. 이 반응을 이용하여 두 개의 빌딩 블록을 연결시키는 예가 도 8 에 도시되어 있다. 이들 반응에 적합한 조건은 당 분야에 공지되어 있으며, 제 WO 03/101972 호에 개시된 것을 포함한다(상기 문헌은 전문이 본원에 참고문헌으로 인용되었다).

제 8 실시 양태에서, 상보적 반응성 기는 알킬할라이드 및 아미노기, 히드록실기 또는 카르복실기와 같은 친핵성 기이다. 이러한 기들은 적합한 조건 하에 반응하여 탄소-질소(알킬 할라이드 + 아민) 또는 탄소-산소(알킬 할라이드 + 카르복실기)를 형성한다.

제 9 실시 양태에서는, 상보적 작용기는 할로겐화 헤테로방향족기 및 친핵성 기이며, 빌딩 블록들은 적합한 조건 하에 방향족 친핵성 치환반응에 의해 결합된다. 적합한 할로겐화 헤테로방향족기로는 염소화 피리미딘, 트리아진 및 퓨린이 있으며, 이들은 아민과 같은 친핵성 기와 온화한 조건 하에 수용액 중에서 반응한다. 올리고누클레오티드 표지 트리클로로트리아진과 아민의 반응의 대표적인 예가 도 9 및 도 10 에 도시되어 있다. 적합한 염소화 헤테로방향족기의 예가 도 11 에 도시되어 있다.

본 발명의 분자 및 라이브러리의 합성에서 빌딩 블록을 연결시키는 데 사용될 수 있는 부가적인 결합-형성 반응으로 이후 도시되는 것들이 있다. 이후 도시된 반응들은 반응성 작용 성분을 강조하였다. 다양한 치환체가 반응물에 존재할 수 있으며, 이들은 R₁, R₂, R₃ 및 R₄ 로 표시하였다. 치환될 수 있는 가능한 위치들이 R₁, R₂, R₃ 및 R₄ 로 표시된 것들이지만 이에 제한되지 않는다. 이들 치환체들은 임의의 적합한 화학 성분을 포함하지만, 제시된 반응을 저해하거나 현저히 억제하지 않는 것들로 제한하는 것이 바람직하며, 달리 명시하지 않는다면, 수소, 알킬, 치환 알킬, 아릴, 치환 아릴, 헤테로아릴, 치환 헤테로아릴, 알콕시, 아릴옥시, 아릴알킬, 치환 아릴알킬, 아미노, 치환 아미노 및 기타 당 분야에 공지된 것들이 포함될 수 있다. 명시된 경우, 적합한 전자-철회기는 니트로, 카르복실, 트리플루오로메틸과 같은 할로알킬 및 당 분야에 공지된 것들을 포함한다. 적합한 전자-공여기로는 알킬, 알콕시, 히드록실, 아미노, 할로겐, 아세트아미도 및 기타 당 분야에 공지된 것들이 포함된다. 1 차 아민의 알켄에 대한 첨가 반응 :

친핵성 치환 반응 :

아민의 환원성 알킬화 반응 :

팔라듐 촉매화 탄소-탄소 결합형성 반응 :

유기( Ugi ) 축합 반응 :

친전자성 방향족 치환반응 :

이민/ 이미늄 / 엔아민 형성 반응 :

고리화첨가반응 :

친핵성 방향족 치환 반응 :

헥크( Heck ) 반응 :

아세탈 형성 반응 :

알돌( Aldol ) 반응 :

본 발명의 분자 및 라이브러리를 형성하는데 사용될 수 있는 스캐폴드 빌딩 블록은 예를 들면 앞서 논의한 결합 형성 반응 중 하나 이상을 이용하여 주변 빌딩 블록 전구체와 함께 결합 형성 반응에 참여할 수 있는 2 개 이상의 작용 성분을 갖는 것들이 포함된다. 스캐폴드 성분은 또한 예를 들어, 특정 방법으로 반응하여 주변 관능기가 결합된 중심 분자 잔기를 포함하는 분자를 형성할 수 있는 빌딩 블록 전구체를 이용하여 본 발명의 라이브러리 및 분자를 구성하는 중에 합성될 수 있다. 한 실시 양태에서, 본 발명의 라이브러리는 일정한 스캐폴드 성분을 갖는 분자를 포함하지만 주변 잔기가 다르거나 주변 잔기의 배치가 다를 수 있다. 특정 라이브러리에서는, 모든 라이브러리 구성요소가 일정한 스캐폴드 성분을 포함하며 ; 다른 라이브러리는 2 개 이상의 다른 스캐폴드 성분을 갖는 분자를 포함할 수 있다. 본 발명의 분자 및 라이브러리를 구성하는 데 사용될 수 있는 스캐폴드 성분-형성 반응의 예가 표 8 에 기재되어 있다. 표에 명시된 문헌들은 그 전문이 본원에 참고문헌으로 인용되었다. 치환기 R₁, R₂, R₃ 및 R₄ 는 기재된 반응을 저해하거나 현저히 억제하지 않는 것들로 제한되며, 수소, 알킬, 치환 알킬, 헤테로알킬, 치환 헤테로알킬, 시클로알킬, 헤테로시클로알킬, 치환 시클로알킬, 치환 헤테로시클로알킬, 아릴, 치환 아릴, 아릴알킬, 헤테로아릴알킬, 치환 아릴알킬, 치환 헤테로아릴알킬, 헤테로아릴, 치환 헤테로아릴, 할로겐, 알콕시, 아릴옥시, 아미노, 치환 아미노 및 기타 당 분야에 공지된 것들이 포함된다. 적합한 치환체는 알킬, 알콕시, 티오알콕시, 니트로, 히드록실, 설프히드릴, 아릴옥시, 아릴-S-, 할로겐, 카르복시, 아미노, 알킬아미노, 디알킬아미노, 아릴아미노, 시아노, 시아네이트, 니트릴, 이소시아네이트, 티오시아네이트, 카르바밀 및 치환 카르바밀을 포함하지만 이에 제한되지 않는다.

작용 성분의 합성은 이에 제한되지는 않지만, 앞서 논의한 반응들 중 하나와 같은 결합 반응의 유형을 통해, 또는 앞서 논의한 결합 반응들 중 2 개 이상과 같은 둘 이상의 결합 반응의 조합을 통해 진행시킬 수 있다. 예를 들면, 한 실시 양태에서는, 아미드 결합 형성 반응 (아미노 및 카르복실산 상보적 반응성 기) 및 환원성 아민화 반응 (아미노 및 알데히드 또는 케톤 상보적 반응성 기)에 의해 빌딩 블록을 연결한다. 임의의 결합 화학을 사용할 수 있지만, 올리고누클레오티드의 존재에 대해 양립할 수 있어야 한다. 본 발명의 특정 실시 양태에 사용된 것과 같은 이중 (duplex) 올리고누클레오티드 표지는 단일 가닥 표지보다 화학적으로 보다 강하며, 따라서 보다 넓은 범위의 반응을 조건을 견딜 수 있고, 단일 가닥 표지와는 불가능한 결합-형성 반응을 사용할 수 있다.

빌딩 블록은 작용 성분을 형성하는데 사용된 반응성 기 또는 반응성 기들 이외에 하나 이상의 작용 성분을 포함할 수 있다. 이들 하나 이상의 추가 작용 성분들은 보호되어 원치 않는 반응을 예방할 수 있다. 적합한 보호기는 다양한 작용 성분에 대해 당 분야에 공지되어 있다 (Green 및 Wuts 의 문헌, Protective Groups in Organic Synthesis, second edition, New York: John Wiley and Sons (1991), 상기 문헌은 본원에 참고문헌으로 인용되었다). 특히 유용한 보호기는 t-부틸 에스테르 및 에테르, 아세탈, 트리틸 에테르 및 아민, 아세틸 에스테르, 트리메틸실릴 에테르, 트리클로로에틸 에테르 및 에스테르 및 카르바메이트를 포함한다.

한 실시 양태에서, 각각의 빌딩 블록은 2 개 이상의 반응성 기를 포함하며, 이들은 서로 같거나 다를 수 있다. 예를 들면, 고리에 첨가되는 각각의 빌딩 블록은 2 개의 반응성 기를 포함할 수 있는데, 이들은 서로 같으며, 모두 단계 s-1 및 s+1 에서 첨가된 빌딩 블록의 반응성 기에 상보적이어야 한다. 다른 실시 양태에서는, 각각의 빌딩 블록이 스스로에 대해 상보적인 2 개의 반응성 기를 포함한다. 예를 들면, 폴리아미드 분자를 포함하는 라이브러리는 1 차 아미노기를 포함하는 빌딩 블록과 활성 카르복실기를 포함하는 빌딩 블록 간의 반응을 통해 생성할 수 있다. 결과적으로 형성된 화합물에는 교대로 나타나는 아미드기들이 반대되는 방향성을 갖기 때문에 N- 또는 C- 말단이 없다. 또한, 폴리아미드 라이브러리는 각각이 아미노기와 활성 카르복실기를 포함하는 빌딩 블록을 사용하여 생성할 수 있다. 이 실시 양태에서는, 사이클의 n 단계에서 첨가되는 빌딩 블록이 유리 반응성 기를 갖는데, 이는 n-1 구성 블록 상의 유효 반응성 기에 상보적이며, n 번째 빌딩 블록 상의 다른 반응성 기는 보호된 것이 바람직하다. 예를 들어, 라이브러리의 구성요소가 C 에서 N 방향으로 합성된다면, 첨가되는 빌딩 블록은 활성 카르복실기와 보호된 아미노기를 포함할 것이다.

작용 성분은 펩티드, 펩티드 유사체, 펩티드 핵산 또는 펩토이드와 같은 중합체 또는 올리고머 잔기일 수 있으며 또는 작은 비중합체 분자, 예를 들면, 중심 스캐폴드를 포함하는 구조와 스캐폴드 주변에 배치된 구조들을 갖는 분자일 수 있다. 선형 중합체 또는 올리고머 라이브러리는 2 개 반응성 기를 갖는 빌딩 블록을 사용했을 때 얻어지며, 분지형 중합체 또는 올리고머 라이브러리는 임의로 2 개 반응성 기만을 갖는 빌딩 블록과 혼합하여, 3 개 이상의 반응성 기를 갖는 빌딩 블록을 사용했을 때 얻어질 것이다. 이러한 분자들은 일반식 X₁X₂...X_m 으로 표현할 수 있으며, 상기에서 각각의 X 는 n 개 단량체 단위를 포함하는 중합체의 단량체 단위이고, n 은 1 이상의 정수이다. 올리고머 또는 중합체 화합물의 경우, 말단 빌딩 블록은 2 개 작용 성분을 포함하지 않아도 된다. 예를 들어, 폴리아미드 라이브러리의 경우, C-말단 빌딩 블록은 아미노기를 포함할 수 있지만, 카르복실기의 존재는 선택사항이다. 마찬가지로, N-말단의 빌딩 블록은 카르복실기를 포함할 수 있지만 특정 아미노기를 포함하지 않아도 된다.

분지형 올리고머 또는 중합체 화합물 또한 합성할 수 있으며, 적어도 하나의 빌딩 블록이 다른 빌딩 블록과 반응하는 3 개 작용 성분을 포함해야 한다. 본 발명의 라이브러리는 선형 분자, 분지형 분자 또는 이들의 혼합물을 포함할 수 있다.

라이브러리는 또한 2 개 이상의 반응성 기를 갖는 스캐폴드 빌딩 블록을 오직 하나의 유효 반응성 기만을 갖는 다른 빌딩 블록과 혼합하여 (예를 들면, 임의의 추가 반응성 기가 보호되어 있거나 스캐폴드 빌딩 블록에 존재하는 다른 반응성 기와 반응하지 않는 경우) 구성할 수 있다. 한 실시 양태에서는, 예를 들어, 합성된 분자들을 일반식 X(Y_n) 으로 표현할 수 있으며, 상기에서 X 는 스캐폴드 빌딩 블록이고 ; 각각의 Y 는 X 에 연결된 빌딩 블록이고, n 은 2 이상의 정수, 바람직하게는 2 내지 6 의 정수이다. 한 바람직한 실시 양태에서는, 사이클 1 의 초기 빌딩 블록이 스캐폴드 빌딩 블록이다. 일반식 X(Y)_n 의 분자에서, 각각의 Y 는 같거나 다를 수 있으나, 일반적인 라이브러리의 대부분의 구성요소들의 경우, 각각의 Y 는 서로 다르다.

한 실시 양태에서, 본 발명의 라이브러리는 폴리아미드 화합물을 포함한다. 폴리아미드 화합물은 알라닌 (Ala; A), 글리신 (Gly; G), 아스파라긴 (Asn; N), 아스파라긴산 (Asp; D), 글루탐산 (Glu; E), 히스티딘 (His; H), 루이신 (Leu; L), 리신 (Lys; K), 페닐알라닌 (Phe; F), 티로신 (Tyr; Y), 트레오닌 (Thr; T), 세린 (Ser; S), 아르기닌 (Arg; R), 발린 (Val; V), 글루타민 (Gln; Q), 이소루이신 (Ile; I), 시스테인 (Cys; C), 메티오닌 (Met; M), 프롤린 (Pro; P) 및 트립토판 (Trp; W) (상기에서 각각의 아미노산에 대해 3 글자와 1 글자 코드로 나타내었다)과 같은 자연적으로 존재하는 20 개의 α-아미노산을 비롯하여 임의의 아미노산으로부터 유래된 빌딩 블록으로 이루어질 수 있다. 이들 자연적으로 존재하는 형태에서, 각각의 아미노산들은 L-구조로 존재하며, 본원에 달리 명시되지 않으며 그렇게 추정한다. 그러나, 본 발명의 방법에서 이들 아미노산의 D-구조 또한 사용할 수 있다. 이들 D-아미노산들은 소문자 3-글자 또는 1-글자 코드, 즉 ala (a), gly (g), leu (1), gln (q), thr (t), ser (s) 등으로 나타내었다. 빌딩 블록들은 또한 나프틸알라닌과 같은 3-아릴알라닌, 4-플루오로-, 4-클로로, 4-브르모 및 4-메틸페닐알라닌과 같은 페닐-치환 페닐알라닌 ; 3-피리딜알라닌, 3-티에닐알라닌, 3-퀴놀릴알라닌 및 3-이미다졸릴알라닌과 같은 3-헤테로아릴알라닌 ; 오르니틴 ; 시트룰린 ; 호모시트룰린 ; 사르코신 ; 호모프롤린 ; 호모시스테인 ; 히드록시프롤린 및 플루오로프롤린과 같은 ; 디히드록시프롤린 ; 노르루이신 ; O-메틸티로신 ; O-메틸세린 ; O-메틸트레오닌 및 3-시클로헥실알라닌을 포함하지만 이에 제한되지 않는 α-아미노산으로부터 유래될 수 있다. 앞서 언급한 아미노산은 각각 D- 또는 L-구조로 사용할 수 있다.

빌딩 블록은 또한 α-아자아미노산과 같이 α-아미노산이 아닌 아미노산; β, γ, δ, ε-아미노산 및 N-치환 글리신과 같은 N-치환 아미노산 (상기에서 N-치환체는 예를 들면, 치환 또는 비치환 알킬, 아릴, 헤테로아릴, 아릴알킬 또는 헤테로아릴알킬기일 수 있다)일 수 있다. 한 실시 양태에서, N-치환체는 자연 발생적인 또는 비자연발생적인 α-아미노산이다.

빌딩 블록은 또한 디펩티드, 트리펩티드, 테트라펩티드 또는 펜타펩티드 유사체와 같은 펩티드 유사체 구조일 수 있다. 이러한 펩티드 유사체 빌딩 블록은 아미노 아실 화합물로부터 유도되어 이들 빌딩 블록을 성장하는 폴리(아미노아실)기에 첨가시키는 화학 반응이 다른 빌딩 블록에 사용되는 화학 반응과 같거나 유사한 것이 바람직하다. 구성 블록은 또한 펩티드 결합과 등입체성인 결합을 형성하여 ψ[CH₂S], ψ[CH₂NH], ψ[CSNH₂], ψ[NHCO], ψ[COCH₂], 및 ψ[(E) 또는 (Z)CH=CH]와 같은 펩티드 골격 변형을 포함하는 펩티드 유사체 작용 성분을 형성할 수 있는 분자일 수 있다. 위에서 사용된 명명법에서, ψ 는 아미드 결합이 부재함을 나타낸다. 아미드기를 대체한 구조는 대괄호 안에 나타내었다.

한 실시 양태에서, 본 발명은 코드된 올리고누클레오티드에 효과적으로 결합된 작용 성분을 포함하거나 작용 성분으로 이루어진 화합물을 합성하는 방법을 제공한다. 본 발명의 방법은 (1) n 개의 구성 블록을 포함하고, 하나 이상의 반응성 기를 포함하며, n 개의 빌딩 블록을 코드하는 개시 올리고누클레오티드에 효과적으로 결합된 개시 작용 성분으로 이루어진 개시 화합물을 제공하는 단계 ; (2) 상기 개시 화합물과 단계 (1) 의 반응성 기에 상보적인 하나 이상의 상보적 반응성 기를 포함하는 빌딩 블록을 반응성 기와 상보적 반응성 기가 반응하여 공유 결합을 형성하기에 적합한 조건 하에서 반응시키는 단계 ; (3) 개시 올리고누클레오티드와 도입 올리고누클레오티드를 개시 올리고누클레오티드와 도입 올리고누클레오티드의 결합을 촉매하는 효소 존재 하에 도입 올리고노클레오티드와 개시 올리고누클레오티드의 결합에 적합한 조건에서 반응시켜 코드된 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분을 포함하거나 이로 이루어진 분자를 생성하는 단계를 포함한다. 단계 (3) 의 작용 성분이 반응성 기를 포함할 경우, 단계 (1) 에서 (3) 을 1 회 이상 반복하여 사이클 1 내지 i 를 형성할 수 있으며 (상기에서 i 는 2 이상의 정수이다), 사이클 s-1 의 단계 (3) 의 생성물은 사이클 s 의 단계 (1) 의 개시 화합물이 된다(상기에서 s 는 i 보다 작은 정수이다). 각각의 고리에서 하나의 빌딩 블록이 성장하는 작용 성분에 첨가되고, 새로운 빌딩 블록을 코드하는 하나의 올리고누클레오티드 서열이 성장하는 코드된 올리고누클레오티드에 첨가된다.

한 실시 양태에서, 초기 개시 화합물(들)은 제 1 빌딩 블록과 올리고누클레오티드 (예를 들면, PCR 프라이머 서열을 포함하는 올리고누클레오티드 개시 올리고누클레오티드) 또는 이러한 올리고누클레오티드가 결합된 링커를 반응시켜 형성한다. 도 5 에 예시된 실시 양태에서는 링커가 제 1 빌딩 블록의 결합을 위한 반응성 기를 포함하고 개시 올리고누클레오티드에 결합되어 있다. 이 실시 양태에서, 빌딩 블록, 또는 여러 분액들 각각에서 빌딩 블록 집합체 중 하나와 결합기의 반응성 기를 반응시키고 빌딩 블록을 코드하는 올리고누클레오티드를 개시 올리고누클레오티드에 첨가시킴으로써 상기 기재한 방법에서 하나 이상의 초기 개시 화합물을 생성한다.

바람직한 실시 양태에서, 각각의 개별 빌딩 블록은 개별 올리고누클레오티드와 관련이 있으며, 따라서 주어진 고리에 첨가된 올리고누클레오티드의 누클레오티드 서열은 동일한 고리에 첨가된 빌딩 블록을 확인한다.

빌딩 블록들의 결합과 올리고누클레오티드들의 결합은 일반적으로 출발 물질 및 시약이 유사한 농도에서 일어난다. 예를 들면, 반응물의 농도가 마이크로몰 내지 밀리몰, 예를 들면 약 10 μM 내지 약 10 mM 농도일 경우, 효과적인 빌딩 블록의 결합에 바람직하다.

특정 실시 양태에서, 본 발명의 방법은 단계 (2) 이후, 임의의 반응하지 않은 개시 작용 성분을 제거하는 단계를 추가로 포함한다. 특정 고리에서 임의의 반응하지 않은 개시 작용 성분은 고리의 개시 작용 성분이 이후 고리에 첨가되는 빌딩 블록과 반응하는 것을 방해한다. 이러한 반응은 어쩌면 특정 올리고누클레오티드 서열에 대응하는 일정 범위의 작용 성분을 생성할지도 모를 하나 이상의 빌딩 블록이 없는 작용 성분을 형성할 수 있다. 이러한 제거 반응은 임의의 남아있는 개시 작용 성분을 단계 (2) 의 반응성 기와 반응하는 화합물과 반응시켜 수행한다. 스캐빈저(scavenger) 화합물은 단계 (2) 의 반응성 기와 빠르게 반응하는 것이 바람직하며, 이후 고리에 첨가되는 빌딩 블록과 반응할 수 있는 추가 반응성 기를 포함하지 않는 것이 바람직하다. 예를 들면, 단계 (2) 의 반응성 기가 아미노기인 화합물의 합성의 경우, 적합한 스캐빈저 화합물은 아세트산 N-히드록시숙신이미드 에스테르와 같은 N-히드록시숙신이미드 에스테르이다.

다른 실시 양태에서, 본 발명의 방법은 화합물 라이브러리를 생성하는 방법을 제공하는데 상기 각각의 화합물은 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록 잔기를 포함하는 작용 성분을 포함한다. 바람직한 실시 양태에서, 각각의 분자에 존재하는 올리고누클레오티드는 분자내 빌딩 블록을 확인하기에 충분한 정보 및 임의로, 빌딩 블록의 첨가 순서를 제공한다. 이 실시 양태에서, 본 발명의 방법은 화합물 라이브러리를 합성하는 방법을 포함하며, 상기 화합물은 작용 성분의 구조를 확인하는 올리고누클레오티드에 효과적으로 결합된 2 개 이상의 빌딩 블록을 포함하는 작용 성분을 포함한다. 본 발명의 방법은 (1) n 개의 빌딩 블록을 포함하고 (상기에서 n 은 1 이상의 정수이다) 상기 n 개의 빌딩 블록을 확인하는 개시 올리고누클레오티드에 효과적으로 결합된 작용 성분으로 이루어진 m 개의 개시 화합물 (상기에서 m 은 1 이상의 정수이다)을 포함하는 용액을 제공하는 단계 ; (2) 단계 (1) 의 용액을 r 개의 분획으로 분할하는 단계 (상기에서 r 은 2 이상의 정수이다) ; (3) 상기 각 분획 내 개시 올리고누클레오티드와 r 개의 구성 블록 중 하나를 반응시켜 개시 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분으로 이루어진 화합물을 포함하는 r 개의 분획을 생성하는 단계 ; (4) 상기 각 분획내 개시 올리고누클레오티드와 r 개의 특정 도입 올리고누클레오티드 세트 중 하나를 상기 도입 올리고누클레오티드와 상기 개시 올리고누클레오티드의 효소적 결합에 적합한 조건에서 반응시켜 n+1 개의 빌딩 블록을 코드하는 연장된 올리고누클레오티드에 효과적으로 결합된 n+1 개의 빌딩 블록을 포함하는 작용 성분으로 이루어진 분자를 포함하는 r 개의 분액을 생성하는 단계를 포함한다. 임의로, 상기 방법은 단계 (4) 에서 생성된 r 개의 분획을 재조합시키는 단계 (5) 를 더 포함할 수 있다. 단계 (1) 에서 (5) 를 1 회 이상 수행하여 사이클 1 내지 i 를 만들 수 있다 (i 는 2 이상의 정수이다). 사이클 s+1 의 경우는 (상기에서 s 는 i-1 이하의 정수이다), 단계 (1) 의 m 개 개시 화합물을 포함하는 용액이 사이클 s 의 단계 (5) 의 용액이다. 마찬가지로, 사이클 s+1 의 단계 (1) 의 개시 화합물은 사이클 s 의 단계 (5) 의 화합물이다.

단계 (2) 의 용액은 라이브러리 합성 중 각 사이클에서 r 개 분획으로 분할시키는 것이 바람직하다. 이 실시 양태에서, 각각의 분획은 특정 빌딩 블록과 반응한다.

본 발명의 방법에 빌딩 블록과 도입 올리고누클레오티드를 첨가하는 순서는 중요하지 않으며, 분자를 합성하는 단계 (2) 및 (3), 그리고 라이브러리를 합성하는 단계 (3) 및 (4) 는 바꿀 수 있다. 즉, 도입 올리고누클레오티드를 개시 올리고누클레오티드에 결합한 후 새로운 빌딩 블록을 첨가할 수 있다. 특정 실시 양태에서는, 이들 두 단계를 동시에 수행하는 것도 가능할 수 있다.

특정 실시 양태에서, 본 발명의 방법은 단계 (2) 이후, 임의의 반응하지 않은 개시 작용 성분을 제거하는 단계를 더 포함한다. 특정 사이클에서 임의의 반응하지 않은 개시 작용 성분이 사이클의 개시 작용 성분이 이후 사이클에 첨가되는 빌딩 블록과 반응하는 것을 방해한다. 이러한 반응은 어쩌면 특정 올리고누클레오티드 서열에 대응하는 일정 범위의 작용 성분을 생성할지도 모를 하나 이상의 빌딩 블록이 없는 작용 성분을 형성할 수 있다. 이러한 제거 반응은 임의의 남아있는 개시 작용 성분을 단계 (2) 의 반응성 기와 반응하는 화합물과 반응시켜 수행한다. 스캐빈저 화합물은 단계 (2) 의 반응성 기와 빠르게 반응하는 것이 바람직하며, 이후 사이클에 첨가되는 빌딩 블록과 반응할 수 있는 추가 반응성 기를 포함하지 않는 것이 바람직하다. 예를 들면, 단계 (2) 의 반응성 기가 아미노기인 화합물의 합성의 경우, 적합한 스캐빈저 화합물은 아세트산 N-히드록시숙신이미드 에스테르와 같은 N-히드록시숙신이미드 에스테르이다.

하나의 실시 양태에서, 라이브러리 합성에 사용되는 빌딩 블록은 후보 빌딩 블록이 라이브러리 합성에 사용되는 조건 하에서 적합한 상보적 작용 성분과 반응하는 능력을 평가하여 일련의 후보 빌딩 블록 세트로부터 선택한다. 이러한 조건에 적합한 반응성을 보이는 빌딩 블록을 선택하여 라이브러리 내로 혼합할 수 있다. 주어진 사이클 생성물은 임의로 정제할 수 있다. 사이클이 중간 사이클일 경우, 즉 최종 사이클 이전의 임의의 사이클일 경우, 이들 생성물은 중간체이며 다음 사이클을 개시하기전 정제할 수 있다. 만일 고리가 최종 사이클이면, 사이클 생성물은 최종 생성물이며, 화합물을 임의로 사용하기 전에 정제할 수 있다. 이 정제 단계는 예를 들면, 반응하지 않았거나 과다한 반응물 및 올리고누클레오티드 결합에 사용된 효소를 제거할 수 있다. 생성물을 용액 내 다른 종들로부터 제거하기 적합한 임의의 방법이 사용될 수 있으며, 고성능 액체 크로마토그래피 (HPLC)와 같은 액체 크로마토그래피 및 에탄올과 같은 적합한 보조 용매를 사용한 침전법 등이 있다. 정제에 적합한 방법은 생성물의 본성 및 합성에 사용되는 용매 시스템에 좌우될 것이다.

완충 수용액과 같은 수용액 내에서 반응을 수행하는 것이 바람직하지만, 빌딩 블록, 올리고누클레오티드, 중간체 및 생성물과 올리고누클레오티드 결합을 촉매하는데 사용된 효소의 용해 특성과 일치하는 혼합 수성/유기 매질에서 수행할 수도 있다.

앞서 기재한 방법에서 주어진 사이클에 의해 생성되는 화합물의 이론적 수는 사이클에 사용되는 서로 다른 개시 화합물의 수 m 과 고리에 첨가되는 개별 빌딩 블록의 수 r 의 곱이다. 사이클에 의해 생성되는 개별 화합물의 실질적인 수는 r 과 m 의 곱 (r×m)한 만큼 많지만, 특정 빌딩 블록의 특정 다른 빌딩 블록과의 반응성 차이에 따라 낮아질 수도 있다. 예를 들면, 특정 빌딩 블록을 특정 개시 화합물 동력학이 합성 사이클의 시간 범위 상 반응 생성물이 거의 내지 전혀 생성되지 않을 수도 있다.

특정 실시 양태에서는, 통상적인 빌딩 블록이 사이클 1 회, 마지막 사이클 이후 또는 임의의 두 사이클 사이에 첨가한다. 예를 들면, 작용 부분이 폴리아미드인 경우, 공동 N-말단 캡핑 빌딩 블록을 마지막 사이클 이후 첨가할 수 있다. 또한, 공동 빌딩 블록을 임의의 두 사이클 사이에 혼입하여, 라이브러리 합성 이후 고리화에 의해 작용 성분을 변형할 수 있는, 예를 들면, 알킨 또는 아지드기와 같은 작용 성분을 첨가할 수 있다.

본원에 사용된 용어 "효과적으로 결합된(operatively linked)" 이란 것은 두 개의 화학 구조가 서로 연결되어 이후 거치게 될 것으로 예상되는 다양한 조작 중에도 연결된 채로 남아있는 것을 의미한다. 대체로, 작용 성분 및 코드된 올리고누클레오티드는 적합한 결합기를 통해 공유결합에 의해 결합된다. 결합기는 올리고누클레오티드를 위한 결합 부위 및 작용 성분을 위한 결합 부위를 갖는 2 가 잔기이다. 예를 들면, 작용 성분이 폴리아미드 화합물일 경우, 이 폴리아미드 화합물은 N-말단의 결합기에 또는 측쇄 중 하나의 작용 성분을 통해 부착될 수 있다. 결합기는 폴리아미드 화합물과 올리고누클레오티드를 하나 이상의 원자, 바람직하게는 2 개 이상, 3 개 이상, 4 개 이상, 5 개 이상 또는 6 개 이상과 같이 하나 보다 많은 원자에 의해 분리하기에 충분하다. 결합기는 충분한 가요성을 갖기 때문에 폴리아미드 화합물을 올리고누클레오티드와는 무관하게 표적 분자에 결합시킬 수 있다.

한 실시 양태에서, 결합기는 폴리아미드 화합물이 N-말단 및 올리고누클레오티드의 5' 포스페이트기에 부착된다. 예를 들면, 결합기는 한 말단에 활성 카르복실기를 다른 말단에는 활성 에스테르를 갖는 결합기 전구체로부터 유도될 수 있다. 결합기 전구체와 N-말단 질소 원자의 반응으로 결합기를 폴리아미드 화합물 또는 N-말단 빌딩 블록에 연결시키는 아미드 결합이 형성되며, 결합기 전구체와 올리고누클레오티의 5-히드록시기의 반응에 의해 올리고누클레오티드가 에스테르 연결을 통해 결합기에 부착된다. 결합기는 예를 들면, -(CH₂)_n- 사슬과 같은 폴리메틸렌 사슬 또는 -(CH₂CH₂O)_n 사슬과 같은 폴리(에틸렌 글리콜) 사슬을 포함할 수 있다 (상기에서 n 은 1 내지 약 20 의 정수이다). n 이 2 내지 약 12 인 것이 바람직하고, 약 4 내지 약 10 인 것이 더 바람직하다. 한 실시 양태에서, 결합기는 헥사메틸렌 (-(CH₂)₆-)기를 포함한다.

빌딩 블록이 아미노산 잔기일 경우, 생성되는 작용 성분은 폴리아미드이다. 아미노산은 아미드 결합을 형성하는데 적합한 임의의 화학반응을 이용하여 결합시킬 수 있다. 아미노산 빌딩 블록의 결합은 올리고누클레오티드의 효소적 결합에 적합한 조건, 예를 들면, 중성 또는 거의 중성인 pH 의 수용액 중에서 수행한다. 한 실시 양태에서는, 폴리아미드 화합물을 C-말단에서 N-말단 방향으로 합성한다. 이 실시 양태에서, 제 1 또는 C-말단 빌딩 블록은 그의 카르복실기가 적합한 결합기에 의해 올리고누클레오티드에 결합된다. 제 1 구성 블록은 제 2 빌딩 블록과 반응하며, 상기 제 2 빌딩 블록은 활성 카르복실기 및 보호된 아미노기를 갖는 것이 바람직하다. 용액상 아미드 결합 형성에 적합한 임의의 활성화/보호기를 사용할 수 있다. 예를 들면, 적합한 활성 카르복실 종으로는 아실 플루오라이드 (미국 특허 제 5,360,928 호, 상기 전문이 본원에 참고문헌으로 인용되었다), 대칭 무수물 및 N-히드록시숙신이미드 에스테르가 있다. 아실기는 또한 당 분야에 공지된 바와 같이, 현장에서 적합한 활성화 화합물과의 반응에 의해 활성화될 수 있다. 적합한 활성화 화합물은 디시클로헥실카르보디이미드 (DCC), 디이소프로필카르보디이미드 (DIC), 1-에톡시카르보닐-2-에톡시-1,2-디히드로퀴놀린 (EEDQ), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 염화수소 (EDC), n-프로판-인산 무수물 (PPA), N,N-비스 (2-옥소-3-옥사졸리디닐)이미도포스포릴 클로라이드 (BOP-Cl), 브로모-트리스-피롤리디노포스포늄 헥사플루오로포스페이트 (PyBrop), 디페닐포스포릴 아지드 (DPPA), 카스트로 (Castro) 시약 (BOP, PyBop), O-벤조트리아조릴-N,N,N', N'-테트라메틸우로늄 염 (HBTU), 디에틸포스포릴 시아나이드 (DEPCN), 2,5-디페닐-2,3-히드로-3-옥소-4-히드록시티오펜 디옥사이드 (Steglich's eagent; HOTDO), l,l'-카르보닐-디이미다졸 (CDI), 및 4-(4,6-디메톡시-l,3,5-트리아진-2-일)-4-메틸몰포리늄 클로라이드 (DMT-MM)를 포함한다. 결합 시약은 단독으로 또는 N,N-디메틸-4-아미노피리딘 (DMAP), N-히드록시-벤조트리아졸 (HOBt), N--히드록시벤조트리아진 (HOOBt), N-히드록시숙신이미드 (HOSu), N--히드록시아자벤조트리아졸 (HOAt), 아자벤조트리아졸릴-테트라메틸우로늄 염 (HATU, HAPyU) 또는 2-히드록시피리딘과 같은 첨가물과 혼합하여 사용할 수 있다. 특정 실시 양태에서, 라이브러리의 합성은 2 개 이상의 활성화 전략을 사용하여 구조적으로 다양한 빌딩 블록을 사용할 수 있게 하였다. 각각의 빌딩 블록은 당분야의 숙련자가 적합한 활성화 방법을 결정할 수 있을 것이다.

N-말단 보호기는 예를 들면, 용액상 합성 조건에 적합한 기를 보호하는 방법 조건에 알맞은 보호기일 수 있다. 바람직한 보호기는 플루오레닐메톡시카르보닐 ("Fmoc")기이다. 아미노아실 빌딩 블록의 측쇄에서 임의의 잠정적으로 반응성인 작용기는 또한 적합하게 보호될 필요가 있다. 바람직한 측쇄 보호기는 N-말단 보호기에 직각인 것이 바람직하며, 즉 측쇄 보호기는 N-보호기를 제거하는데 요구되는 것과 다른 조건 하에서 제거한다. 적합한 측쇄 보호기로는 니트로베라트릴기로 상기는 측쇄 카르복실기와 측쇄 아미노기를 모두 보호하는데 사용될 수 있다. 다른 적합한 측쇄 아민 보호기는 N-펜트-4-에노일기(N-pent-4-enoyl group)이다.

빌딩 블록은 작용 성분에 혼입한 후, 예를 들면, 하나 이상의 빌딩 블록 상의 작용 성분을 포함하는 적합한 반응에 의해 변형시킬 수 있다. 빌딩 블록의 변형은 최종 빌딩 블록의 첨가 반응 이후 또는 작용 성분의 합성 중 중간 시점에, 예를 들면, 합성 과정의 임의의 이후에 일어날 수 있다. 본 발명의 이작용기성 분자의 라이브러리를 합성할 경우, 빌딩 블록의 변형은 전체 라이브러리에 대해 또는 라이브러리 일부에 대해 수행할 수 있으며 따라서 라이브러리의 복잡도를 증가시킬 수 있다. 적합한 빌딩 블록 변형 반응은 작용 성분 및 코드된 올리고누클레오티드에 적용할 수 있는 조건 하에 수행할 수 있다. 이러한 반응의 예로는 아미노기 또는 히드록실기의 아실화 및 술폰화, 아미노기의 알킬화 카르복실기의 에스테르화 또는 티오에스테르화, 카르복실기의 아미드화, 알켄의 에폭시드화 및 당분야에 공지된 기타 반응들이 있다. 작용 성분이 알킨 또는 아지드 작용 성분을 갖는 빌딩 블록을 포함할 경우, 아지드/알킨 고리화첨가반응을 이용하여 빌딩 블록의 유도체를 생성할 수 있다. 예를 들면, 알킨을 포함하는 빌딩 블록은 유기 아지드와 반응시킬 수 있고, 아지드를 포함하는 빌딩 블록은 알킨과 반응시킬 수 있으며, 두 경우 모두에서 트리아졸이 생성된다. 빌딩 블록 변형 반응은 최종 빌딩 블록의 첨가 반응 이후 또는 합성 과정의 중간 시점에서 일어날 수 있으며 다양한 화학 구조를 탄화수소를 포함하는 작용 성분, 금속 결합 잔기 및 특정 생체 분자 또는 조직유형을 표적으로 하는 구조에 결합시키는데 사용할 수 있다.

다른 실시 양태에서, 작용 선분은 선형 빌딩 블록을 포함하며, 이들 선형 블록들은 적합한 반응을 이용하여 고리화할 수 있다. 예를 들면, 선형 어레이 내 2 개 이상의 빌딩 블록이 설프히드릴기를 포함할 경우, 설프히드릴기를 산화시켜 디설파이드 결합을 형성함으로써 선형 어레이를 고리화할 수 있다. 예를 들어, 작용 성분은 2 개 이상의 L 또는 D-시스테인 및/또는 L 또는 D-호모시스테인 잔기를 포함하는 올리고펩티드일 수 있다. 빌딩 블록은 또한 예를 들면, 카르복실기 및 아미노 또는 히드록실기와 같이 서로 반응하여 선형 어레이를 고리화할 수 있는 다른 작용 성분을 포함할 수 있다.

바람직한 실시 양태에서, 선형 어레이 내 빌딩 블록 중 하나는 알킨기를 포함하고, 선형 어레이 내 다른 빌딩 블록은 아지드기를 포함한다. 아지드기와 알킨기는 고리화첨가반응에 의해 반응시킬 수 있으며 거대 고리 구조를 형성한다. 도 9 에 도시된 실시예에서, 작용 성분은 C-말단에 프로파르길글리신 빌딩 블록 및 N-말단에 아지도아세틸기를 포함하는 폴리펩티드이다. 적합한 조건 하에 알킨과 아지드기를 반응시키면 고리 화합물이 형성되며, 이 고리는 거대 고리 내에 트리아졸 구조를 포함한다. 라이브러리의 경우, 한 실시 양태에서는, 라이브러리의 각 구성요소가 알킨 및 아지드-함유 빌딩 블록을 포함하며 이처럼 고리화될 수 있다. 제 2 실시 양태에서는 모든 라이브러리 구성요소가 알킬- 및 아지드-함유 빌딩 블록을 포함하지만 라이브러리의 일부만이 고리화된다. 제 3 실시 양태에서는 오직 특정 작용 성분만이 알킨- 및 아지드-함유 빌딩 블록을 포함하며, 오직 이들 분자만이 고리화된다. 상기 제 2 및 제 3 실시 양태에서, 고리화 첨가 반응 이후, 라이브러리는 고리형 및 선형 작용 성분을 모두 포함할 것이다.

동일한 작용 성분, 예를 들면, 트리아진이 특정 합성 단계 중에 라이브러리의 각 분획 및 모든 분획에 첨가되는 본 발명의 몇몇 실시 양태에서는 상기 작용 성분을 코드하는 올리고누클레오티드 표지를 첨가하지 않아도 된다.

올리고누클레오티드는 화학적 또는 효소적 방법에 의해 결합시킬 수 있다. 한 실시 양태에서는, 올리고누클레오티드를 화학적 수단에 의해 결합시킨다. DNA 및 RNA 의 화학적 결합은 예를 들면, Shabarova 등의 문헌 (1991) Nucleic Acids Research, 19, 4247-4251, federova 등의 문헌 (1996) Nucleosides and Nucleotides, 15, 1137-1147 및 Carriero 및 Damha (2003) journal of Organic Chemistry, 68, 8328-8338 에 제시된 바와 같이 수용성 카르보디이미드 및 시아노겐 브로마이드와 같은 반응물을 사용하여 수행할 수 있다. 한 실시 양태에서, 화학적 결합은 pH 7.6 의 완충제(1M MES+20 mM MgCl₂) 중에서 5' 포스포릴화 올리고누클레오티드와 1:10 v/v 비율로 아세토니트릴 내 5 M 의 시아노겐 브로마이드를 사용하여 0 ℃ 에서 1 내지 5 분 동안 수행한다. 다른 실시 양태에서는, 효소적 방법을 이용하여 올리고누클레오티드를 결합시킨다. 어느 실시 양태에서는 올리고누클레오티드는 이중 가닥일 수 있으며 약 5 내지 약 14 개 염기의 돌출 부분을 갖는 것이 바람직하다. 올리고누클레오티드는 또한 단일 가닥일 수 있으며, 결합되는 각각의 올리고누클레오티드와 약 6 개의 염기가 중복된 스플린트를 사용하여 반응성 5 및 3 잔기를 서로 아주 근접하게 위치시킨다.

한 실시 양태에서, 개시 빌딩 블록은 개시 올리고누클레오티드에 효과적으로 결합되어 있다. 제 2 빌딩 블록을 개시 빌딩 블록에 결합시키기 전이나 그 후에, 제 2 빌딩 블록을 확인하는 제 2 올리고누클레오티드 서열을 개시 올리고누클레오티드에 결합시킨다. 개시 올리고누클레오티드 서열 및 도입 올리고누클레오티드 서열을 결합시키는 방법은 도 1 및 도 2 에 기재되어 있다. 도 1 에서, 개시 올리고누클레오티드는 이중 가닥이며, 한 가닥은 제 2 올리고누클레오티드의 한 말단에 상보적인 돌출 서열을 포함하고, 제 2 올리고누클레오티드가 개시 올리고누클레오티드와 접촉하게 한다. 개시 올리고누클레오티드의 돌출 서열 및 제 2 올리고누클레오티드의 상보적 서열은 모두 약 4 개 이상의 염기를 갖는 것이 바람직하며, 보다 바람직한 것은 두 서열 모두 같은 길이인 것이다. 개시 올리고누클레오티드 및 제 2 올리고누클레오티드는 적합한 효소를 사용하여 결합시킬 수 있다. 만일 올리고누클레오티드가 한 가닥 (상부 가닥)의 5' 말단에서 제 1 빌딩 블록과 연결되면, 상부 가닥에 상보적인 가닥 (하부 가닥)은 5' 말단의 돌출 서열을 포함하고, 제 2 올리고누클레오티드는 5' 말단의 상보적 서열을 포함할 것이다. 제 2 올리고누클레오티드의 결합 이후, 돌출된 상복적 서열에 대해 3' 인 제 2 올리고누클레오티드 서열에 상보적이고 추가 돌출 서열을 포함하는 가닥을 첨가할 수 있다.

한 실시 양태에서, 올리고누클레오티드는 도 2 에 도시된 바와 같이 연장시킨다. 성장하는 작용 성분에 결합된 올리고누클레오티드 및 도입 올리고누클레오티드를 개시 올리고누클레오티드의 3' 말단에 상보적인 영역 및 개시 올리고누클레오티드의 5' 말단에 상보적인 영역을 포함하는 "스플린트" 서열을 사용하여 배치한 후 결합시킨다. 스플린트는 올리고누클레오티드의 5' 말단을 도입 올리고의 3' 말단에 아주 근접하게 배치시키며, 결합은 효소적 결합을 이용하여 수행한다. 도 2 에 도시된 실시예에서, 개시 올리고누클레오티드는 16 개의 누클레오염기로 이루어졌으며, 스플린트는 3' 말단에서 6 개의 염기에 상보적이다. 도입 올리고누클레오티드는 12 개의 누클레오염기로 이루어졌으며, 스플린트는 5' 말단에서 6 개 염기에 상보적이다. 스플린트의 길이 및 상보적 영역의 길이는 중요하지 않다. 그러나, 상보적 영역은 결합 조건 하에서 안정한 이합체를 형성하도록 충분히 길어야 하지만 너무 길어서 최종 분자 내에 지나치게 큰 코드된 누클레오티드를 형성해서는 안된다. 상보적 영역은 길이가 약 4 염기에서 12 염기인 것이 바람직하며, 약 5 염기 내지 10 염기가 보다 바람직하고 약 5 염기 내지 8 염기인 것이 가장 바람직하다.

본원에 기재된 라이브러리 합성을 위한 방법에 사용되는 스플릿 및 풀 방법은 각각의 독특한 작용 성분이 상기 작용 성분을 입증하는 하나 이상의 독특한 올리고누클레오티드 서열에 효과적으로 결합되어 있음을 입증한다. 만일 하나 이상의 합성에서 하나 이상의 빌딩 블록을 위해 2 개 이상의 서로 다른 올리고누클레오티드를 사용한다면, 상기 빌딩 블록을 포함하는 각각의 개별 작용 성분은 여러 올리고누클레오티드로 코드해야할 것이다. 예를 들면, 4 사이클 라이브러리의 합성 중에 각각의 빌딩 블록을 위해 2 개의 올리고누클레오티드 표지를 사용한다면, 각각의 특정 작용 성분을 코드하는 16 개 DNA 서열 (2⁴) 이 존재할 것이다. 여러 개의 서열로 각각의 작용 성분을 코드하는 데는 몇 가지 장점이 있다. 먼저, 동일한 작용 성분을 코드하는 표지 서열의 서로 다른 조합을 선택하면, 분자들이 독립적으로 선택되는 것을 보장할 수 있다. 두번째로는, 동일한 작용 성분을 코드하는 표지 서열의 서로 다른 조합을 선택하는 것은 올리고누클레오티드의 서열에 기초한다. 세번째로, 만일 서열 분석 결과 특정 작용 성분이 매우 풍부하지만 많은 가능성 중 오직 하나의 서열 조합이 나타나는 것으로 나타나면, 인위적인 기술적 구조를 인정할 수 있다. 여러 번의 표지 표지는 빌딩 블록은 같지만 올리고누클레오티드 표지가 다른 독립적인 스플릿 반응에 의해 수행할 수 있다. 또는, 단일 표지 표지 반응에서 각 표지를 개별 빌딩 블록과 적절한 비율로 혼합하여 수행할 수 있다.

한 실시 양태에서는, 개시 올리고누클레오티드가 이중 가닥이고 2 개의 가닥이 공유 결합으로 연결되어 있다. 2 개의 가닥을 공유 결합으로 연결하는 방법이 도 3 에 도시되어 있는, 상기에서는, 연결 잔기, 예를 들면, 링커를 사용하여 2 개의 가닥과 작용 성분을 연결한다. 연결 잔기는 빌딩 블록과 반응하도록 개조된 제 1 작용 성분, 올리고누클레오티드의 3'-말단과 반응하도록 개조된 제 2 작용 성분 및 올리고누클레오티드의 5' 말단과 반응하도록 개조된 제 3 작용 성분을 포함하는 임의의 화학 구조일 수 있다. 제 2 및 제 3 작용 성분은 두 개의 올리고누클레오티드 가닥을 두 가닥의 혼성화를 허용하는 상대적인 배향으로 위치시킬 수 있도록 배향시키는 것이 바람직하다. 예를 들면, 연결 잔기, 예를 들면, 링커는 하기 구조를 갖는다 :

이 식에서, A 는 빌딩 블록과 공유결합을 형성하는 작용 성분이고 ; B 는 올리고누클레오티드의 5' 말단과 결합을 형성할 수 있는 작용 성분이고 ; C 는 올리고누클레오티드의 3' 말단과 결합을 형성할 수 있는 작용 성분이며 ; D, F 및 E 는 작용 성분 A, C 및 B 내지 S 를 연결하는 화학기이며, S 는 코어 원자 또는 스캐폴드이다. D, E 및 F 는 각각 독립적으로 알킬렌 사슬 또는 올리고 (에틸렌 글리콜) 사슬과 같은 원자들의 사슬인 것이 바람직하며, D, E 및 F 는 같거나 다를 수 있으며, 두 올리고누클레오티드의 혼성화와 작용 성분의 합성을 수행하는 데 효과적인 것이 바람직하다. 한 실시 양태에서 3 가 연결 잔기는 하기 구조식을 갖는 링커이다 :

. 이 실시 양태에서, NH 기는 빌딩 블록에 결합시키는데 유용한 반면, 말단 인산기는 올리고누클레오티드에 결합시키는데 유용하다.

개시 올리고누클레오티드가 이중 가닥인 경우, 도입 올리고누클레오티드가 이중 가닥이다. 도 3 에 도시된 바와 같이, 개시 올리고누클레오티드가 나머지 하나보다 긴 길이를 갖는 가닥을 갖는다. 이 실시 양태에서, 도입 올리고누클레오티드는 개시 올리고누믈레오티드의 돌출 서열에 상보적인 돌출 서열을 포함한다. 2 개의 상보적인 돌출 서열을 혼성화하면, 도입 올리고누클레오티드가 개시 올리고누클레오티드로의 결합을 위한 위치에 가게된다. 결합은 DNA 또는 RNA 리가제를 사용하여 효소적으로 수행할 수 있다. 도입 오리고누클레오티드의 돌출 서열과 개시 올리고누클레오티드의 돌출 서열은 동일한 길이를 갖는 것이 바람직하며 2 개 이상의 누클레오티드, 바람직하게는 2 내지 약 10 개의 누클레오티드, 보다 바람직하게는 약 2 내지 약 6 개의 누클레오티드로 이루어진 것이 바람직하다. 한 바람직한 실시 양태에서, 도입 올리고누클레오티드는 각 말단에 돌출 서열을 갖는 이중 가닥 올리고누클레오티드이다. 한 말단의 돌출 서열은 개시 올리고누클레오티드의 돌출 서열에 대해 상보성을 가지며, 도입 올리고누클레오티드와 개시 올리고누클레오티드의 결합 후, 다른 말단의 돌출 서열은 다음의 개시 올리고누클레오티드의 돌출 서열이 된다. 한 실시 양태에서, 3 개의 돌추 서열은 길이가 모두 2 내지 6 개의 누클레오티드이고, 도입 올리고누클레오티드의 코드된 서열은 길이가 3 내지 10 개의 누클레오티드, 바람직하게는 길이가 3 내지 6 개의 누클레오티드이다. 특정 실시 양태에서, 돌출 서열은 모두 길이가 2 개 누클레오티드이며, 코드된 서열은 길이가 5 개의 누클레오티드이다.

도 4 에 도시된 실시 양태에 따르면, 도입 가닥은 개시 올리고누클레오티드의 3' 말단에 상보성인 영역을 3' 말단에 가지며 두 가닥 모두의 5' 말단에는 돌출부를 갖는다. 5' 말단은 예를 들면 벤트(vent) 폴리머라제와 같은 DNA 폴리머라제를 사용하여 채우면 이중 가닥 연장 올리고누클레오티드가 생성된다. 올리고누클레오티드의 하부 가닥을 제거할 수 있으며, 상부 가닥의 3' 말단에 첨가된 추가 서열은 동일한 방법을 사용하여 제거할 수 있다.

코드된 올리고누클레오티드 표지는 각각의 연속 빌딩 블록을 확인하는 올리고누클레오티드의 연속 첨가반응의 결과로 형성된다. 본 발명의 방법의 한 실시 양태에서는, 연속적인 올리고누클레오티드 표지를 효소적 결합에 의해 결합시켜 코드된 올리고누클레오티드를 형성한다.

올리고누클레오티드의 효소 - 촉매 결합은 핵산 단편을 결합시킬 수 있는 임의의 효소를 사용하여 수행할 수 있다. 효소의 예로는 리가제, 폴리머라제 및 토포아이소머라제가 있다. 본 발명의 특정 실시 양태에서는, DNA 리가제(EC 6.5.1.1), DNA 폴리머라제(EC 2.7.7.7), RNA 폴리머라제(EC2.7.7.6) 또는 토포아이소머라제(EC5.99.1.2)를 사용하여 올리고누클레오티드를 결합시킨다. 각각의 EC 클래스에 함유된 효소는 예를 들면 문헌 Bairoch (2000) Nucleic acid research 28:304-5 에 기재된 대로 확인할 수 있다.

바람직한 실시 양태에서, 본 발명의 방법에 사용된 올리고누클레오티드는 올리고데옥시누클레오티드이고, 올리고누클레오티드를 촉매화하는데 사용된 효소는 DNA 리가제이다. 리가제 내에서 결합이 일어나도록, 즉 2 개 올리고누클레오티드 사이에서 포스포디에스테르 결합이 발견되도록 하기 위해, 올리고누클레오티드는 유리된 3 히드록실기를 가져야만 한다. 본 발명의 방법에 사용될 수 있는 DNA 리가제의 예로는 T4 DNA 리가제, Taq DNA 리가제, T₄ RNA 리가제, DNA 리가제(E. coli)가 있다(모두 매사추세츠 New England Biolabs 로부터 얻을 수 있다).

당 분야의 숙련자라면 결합에 사용되는 각각의 효소는 특정 조건, 예를 들면, 온도, 완충제 농도, pH 및 시간에서 최적의 활성을 가짐을 이해할 것이다. 이들 조건 각각은 예를 들면, 제조자의 지시에 따라 조정하여 올리고누클레오티드 표지의 최적의 결합을 얻을 수 있다.

도입 올리고누클레오티드는 임의의 원하는 길이를 가질 수 있지만 길이가 적어도 3 개 이상의 핵염기인 것이 바람직하다. 보다 바람직한 것은 도입 올리고누클레오티드의 길이가 4 개 이상의 핵염기인 것이다. 한 실시 양태에서, 도입 올리고누클레오티드는 길이가 3 내지 약 12 개 핵염기이다. 본 발명의 라이브러리 내 분자의 올리고누클레오티드는 당 분야에 알려진 바와 같이 PCR 을 위한 프라이머로 작용할 수 있는 공동의 말단 서열을 갖는 것이 바람직하다. 이러한 공동의 말단 서열은 라이브러리 합성의 최종에 첨가되는 도입 올리고누클레오티드의 말단으로 혼입될 수 있고 또는 본원에 개시된 효소적 결합 방법을 이용하여 라이브러리 합성 후 첨가될 수 있다.

본 발명의 방법의 바람직한 실시 양태가 도 5 에 도시되어 있다. 방법은 아미노기로 끝나는 링커에 5' 말단이 결합된 합성 DNA 서열로 시작한다. 단계 1 에서, 이 출발 DNA 서열은 Tris 완충제 내 스플린트 DNA 가닥, DNA 리가제 및 디티오트레이톨 존재 하에 도입 DNA 서열에 결합된다. 이로써 표지 표지된 DNA 서열이 형성되며, 이는 바로 다음 단계에 사용되거나, 다음 단계 이전에, 예를 들면 HPLC 또는 에탄올 침전법을 이용하여 정제할 수 있다. 단계 2 에서는 표지 표지된 DNA 를 보호된 활성화 아미노산, 이 실시예에서는 Fmoc - 보호 아미노산 플루오라이드와 반응시켜 보호된 아미노산 - DNA 결합체를 형성한다. 단계 3 에서는, 보호된 아미노산 - DNA 결합체를 예를 들면 피페리딘의 존재 하에 탈보호시키고, 결과된 탈보호 결합체를 임의로 HPLC 또는 에탄올 침전법에 의해 정제한다. 탈보호 결합체는 제 1 합성 사이클의 생성물이며, 제 2 아미노산 잔기를 탈보호 결합체의 유리 아미노기에 첨가시키는 제 2 사이클의 출발 물질이다.

PCR 이 선택된 분자의 코드된 올리고누클레오티드를 증폭시키고/거나 서열을 결정하는데 사용되는 실시 양태에서는, 코드된 올리고누클레오티드는 예를 들면, PCR 프라이머 서열 및/또는 서열화 프라이머(예를 들면, 3' GACTACCGCGCTCCCTCCG-5' 및 3' GACTCGCCCGACCGTTCCG-5') 를 포함한다. PCR 프라이머 서열은 예를 들면, 합성의 제 1 사이클 전에 개시 올리고누클레오티드에 포함될 수 있고/포함될 수 있거나 제 1 도입 올리고누클레오티드와 함께 포함될 수 있고/포함될 수 있거나 라이브러리 합성의 최종 이후 코드된 올리고누클레오티드에 결합될 수 있고/결합될 수 있거나 최종의 도입 올리고누클레오티드에 포함될 수 있다. 라이브러리 합성의 최종 이후에 첨가되고/첨가되거나 최종의 도입 올리고누클레오티드에 첨가되는 PCR 프라이머 서열을 본원에서는 "캡핑 서열(capping sequence)" 이라 부른다.

한 실시 양태에서, PCR 프라이머 서열은 코드된 올리고누클레오티드 표지 내로 설계한다. 예를 들면, PCR 프라이머 서열을 개시 올리고누클레오티드 표지 내로 혼입하고/혼입하거나 최종 올리고누클레오티드 표지 내로 혼입할 수 있다. 한 실시 양태에서, 동일한 PCR 프라이머 서열을 개시 및 최종 올리고누클레오티드 표지 내로 혼입시킨다. 다른 실시 양태에서는 제 1 PCR 프라이머 서열을 개시 올리고누클레오티드의 표지에 혼입하고 제 2 PCR 프라이머 서열을 최종 올리고누클레오티드 표지 내로 혼입시킨다. 또는 제 2 PCR 프라이머 서열을 본원에 기재된 바와 같이 보호 서열내로 혼입시킬 수 있다. 바람직한 실시 양태에서는, PCR 프라이머 서열의 길이가 적어도 약 5, 7, 10, 13, 15, 17, 20, 22 또는 25 개 이상의 누클레오티드이다.

본 발명의 라이브러리에 사용하기 적합한 PCR 프라이머 서열은 당 분야에 공지되어 있다. 적합한 프라이머 및 방법은 Innis 등의 문헌, PCR Protocols: A Guide to Methods and Applications, San Diego: Academic Press (1990) 에 기재되어 있으며, 상기 문헌은 그 전문의 내용이 본원에 참고문헌으로 인용되었다. 본원에 기재된 라이브러리의 구성에 사용하기 적합한 다른 프라이머는 PCT 출원 제 WO 2004/069849 호 및 제 WO 2005/003375 호에 기재된 프라이머이며, 상기 문헌들은 그 전문이 참고문헌으로 본원에 인용되었다.

프라이머, 프로브 및 프라이머 연장에 의해 합성되는 핵산 단편 또는 세그먼트와 관련하여, 본원에 사용된 용어 "폴리누클레오티드" 는 2 개 이상의 데옥시리보누클레오티드, 바람직하게는 3 개 이상의 데옥시리보누클레오티드로 이루어진 분자를 나타낸다.

본원에 사용된 용어 "프라이머" 는 핵산 제한 소화에 의해 정제되거나 합성에 의해 생성되고, 핵산 가닥에 상보적인 프라이머 연장 생성물의 합성이 유도되는 조건, 즉 누클레오티드 및 DNA 폴리머라제, 역전사효소 등과 같은 반응물 존재 하에 적합한 온도 및 pH 에 놓였을 때 핵산 합성의 개시점으로 작용할 수 있는 폴리누클레오티드를 이른다. 프라이머는 최대 효율을 위해 단일 가닥인 것이 바람직하지만, 이중 가닥 형태일 수도 있다. 만일 이중 가닥이라면, 먼저 프라이머를 처리하여 그의 상보적 가닥으로부터 분리한 후 연장 생성물을 제조하는데 사용한다. 프라이머는 폴리도엑소리보누클레오티드인 것이 바람직하다. 프라이머는 중합체화 시약의 존재 하에 연장 생성물의 합성을 프라이밍하기에 충분히 길어야 한다. 프라이머의 정확한 길이는 온도 및 프라이머 출처를 비롯한 많은 요인에 좌우된다.

본원에 사용된 프라이머는 "실질적으로" 증폭될 각각의 특정 서열의 다른 가닥들에 상보적이도록 선택한다. 이것은 프라이머가 충분히 상보적이어서 그의 각각의 주형 가닥과 비무작위로 혼성화해야한다는 것을 의미한다. 따라서, 프라이머 서열은 주형의 정확한 서열을 나타낼 수도 나타내지 않을 수도 있다.

폴리누클레오티드 프라이머는 임의의 적합한 방법, 예를 들면, Narang 등의 문헌 (1979) Meth. Enzymol., 68:90 ; 미국 특허 제 4,356,270 호, 미국 특허 제 4,458,066 호, 미국 특허 제 4,416,988 호, 미국 특허 제 4,293,652 호 및 Brown 등의 문헌 (1979) Meth. Enzymol., 68:109 에 기재된 포스포트리에스테르 또는 포스포디에스테르 방법을 사용하여 제조할 수 있다. 상기 문헌들은 모두 그 전문이 본원에 참고문헌으로 인용되었다.

PCR 프라이머 서열이 도입 올리고누클레오티드에 혼입된 경우, 이들 도입 올리고누클레오티드는 다른데서 첨가되는 도입 올리고누클레오티드 보다 훨씬 긴 것이 바람직한데, 이는 코드된 서열과 PCR 프라이머 서열을 모두 포함하기 때문이다.

한 실시 양태에서는, 최종 빌딩 블록과 최종 도입 올리고누클레오티드를 첨가한 후, 캡핑 서열을 첨가하고, 본원에 기재된 라이브러리의 합성은 이 캡핑 서열을 코드된 올리고누클레오티드에 결합시키는 단계를 포함하여 실질적으로 모든 라이브러리 구성요소의 올리고누클레오티드 부분이 PCR 프라이머 서열을 포함하는 서열로 끝나도록 한다. 캡핑 서열은 최종 합성의 생성물이 모인 분획에 결합시켜 첨가한다. 캡핑 서열은 라이브러리 구성에 사용된 효소적 방법을 사용하여 첨가할 수 있다.

한 실시 양태에서는, 동일한 캡핑 서열을 라이브러리의 모든 구성요소에 결합시킨다. 다른 실시 양태에서는 여러 개의 캡핑 서열을 사용한다. 이 실시 양태에서, 가변성 염기를 갖는 올리고누클레오티드 캡핑 서열은 예를 들면 최종 합성 사이클 이후 라이브러리 구성요소에 결합시킨다. 한 실시 양태에서는, 최종 합성 사이클 이후, 분획들을 모으고, 다시 분획들로 분할하는데, 각각의 분획에는 서로 다른 캡핑 서열이 첨가되어 있다. 또는 최종 합성 사이클 이후, 여러 캡핑 서열을 모은 라이브러리에 첨가할 수 있다. 두 실시 양태 모두, 최종 라이브러리 구성요소는 2 개 이상의 서로 다른 캡핑 서열을 포함하는 확인 올리고누클레오티드에 연결된 특정 작용 성분을 포함하는 분자를 갖는다.

한 실시 양태에서는, 캡핑 프라이머가 가변성, 즉 변성 누클레오티드를 갖는 올리고누클레오티드를 포함한다. 캡핑 프라이머 내의 이러한 변성 염기들은 빌딩 블록 조합이 PCR 복제의 결과 (동일한 서열) 인지 또는 분자의 독립적인 발현 (다른 서열) 인지를 결정함으로써 해당 라이브러리 분자를 확인한다. 예를 들면, 이러한 변성 염기는 코드된 라이브러리를 생물학적으로 선별하는 중에 확인된 거짓 양성의 잠정적인 수를 줄일 수 있다.

한 실시 양태에서, 변성 캡핑 프라이머는 하기 서열을 포함하거나 갖는다 :

프라이머는 라이브러리에 대한 결합 및 프라이머 - 연장 이후 하기 서열을 갖는다 :

.

다른 실시 양태에서, 캡핑 프라이머는 하기 서열을 포함하거나 갖는다 :

이 프라이머에서 변성 영역의 설계는 DNA 서열 분석을 개선하며, 변성 B 염기 옆에서 이를 중단하는 A 염기는 3 개 이상의 염기가 단일 중합체로 연장되는 것을 방지하고 서열 정렬을 용이하게 한다.

한 실시 양태에서, 변성 캡핑 올리고누클레오티드는 적합한 효소를 사용하여 라이브러리의 구성요소에 결합되며, 변성 캡핑 올리고누클레오티드의 상부 가닥은 결과적으로 DNA 폴리머라제와 같은 적합한 효소를 이용하여 중합시킨다.

다른 실시 양태에서는, PCR 프라이밍 서열이 "만능 어댑터(universal adaptor)" 또는 "만능 프라이머(universal primer)" 이다. 본원에 사용된 바와 같이 "만능 어댑터" 또는 "만능 프라이머" 는 독특한 PCR 프라이밍 영역, 즉 예를 들면, 길이가 약 5, 7, 10, 13, 15, 17, 20, 22 또는 25 개 누클레오티드를 함유하는 올리고누클레오티드이고 독특한 서열 프라이밍 영역, 예를 들면, 길이가 약 5, 7, 10, 13, 15, 17, 20 22 또는 25 개 누클레오티드에 인접하게 위치하고 있으며, 임의로 4 개의 데옥시리보누클레오티드(즉, A, C, G, T) 중 하나 이상으로 이루어진 독특한 식별용 주요 서열(또는 샘플 확인 서열)이 뒤따를 수 있다.

본원에 사용된 용어 "식별용 주요 서열(discriminating key sequence)" 또는 "샘플 확인 서열(sample identifier sequence)" 은 샘플로부터 분자 개체에 특이하게 표지하는 데 사용될 수 있는 서열을 나타낸다. 각각이 독특한 샘플 확인 서열을 갖는 여러 샘플을, 개별 샘플의 분석을 위한 DNA 서열화 후, 혼합하고, 서열을 결정하고, 다시 분류할 수 있다. 동일한 식별용 서열을 전체 라이브러리에 사용할 수 있으며, 또는 서로 다른 식별용 주요 서열을 다른 라이브러리를 추적하는데 사용할 수 있다. 한 실시 양태에서, 식별용 주요 서열은 5' PCR 프라이머, 3' PCR 프라이머 또는 두 프라이머 모두에 존재할 수 있다. 만일 PCR 프라이머가 모두 샘플 확인 서열을 갖는다면, 독특한 샘플 확인 서열과 함께 혼합된 다른 샘플의 수는 각 프라이머에 대한 샘플 확인 서열의 갯수의 곱이다. 따라서, 10 개의 다른 5' 샘플 확인 서열 프라이머는 10 개의 다른 3' 샘플 확인 서열 프라이머와 혼합되어 100 개 다른 샘플 확인 서열 조합을 생성할 수 있다.

식별용 주요 서열을 갖는 5' 및 3' PCR 프라이머의 비제한 예는 하기를 포함한다 :

한 실시 양태에서, 식별용 주요 서열은 길이가 약 4, 5, 6, 7, 8, 9 또는 10 개의 누클레오티드로 이루어진다. 다른 실시 양태에서는, 식별용 주요 서열이 약 1-4 개의 누클레오티드의 조합물이다. 또다른 실시 양태에서는, 각각의 만능 어댑터의 길이는 약 44 개의 누클레오티드이다. 한 실시 양태에서 만능 어댑터는 T4 DNA 리가제를 이용하여 코드된 올리고누클레오티드의 말단에 결합시킨다. 서로 다른 만능 어댑터는 특별히 각각 라이브러리 제조법에 따라 설계할 수 있으며, 따라서 각각의 라이브러리에 독특한 확인체를 제공할 것이다. 만능 어댑터의 크기 및 서열은 당 분야의 숙련자에 의해 필요에 따라 변형시킬 수 있다.

앞서 지적한 바와 같이 본 발명의 방법의 일부인 올리고누클레오티드 표지의 핵 서열은 폴리머라제 서열 반응(PCR)을 사용하여 결정할 수 있다.

올리고누클레오티드 표지는 본원에 기재된 작용 성분을 구성하는 빌딩 블록을 확인하는 폴리누클레오티드로 이루어져 있다. 올리고누클레오티드 표지의 핵산 서열은 다음과 같이 올리고누클레오티드 표지를 PCR 반응에 적용하여 결정한다. 적합한 샘플을 PCR 프라이머 쌍과 접촉시키는데, 쌍의 각각의 구성요소는 사전에 선택된 누클레오티드 서열을 갖는다. PCR 프라이머 쌍은 코드된 올리고누클레오티드 표지 상의 PCR 프라이머 결합 부위에 혼성화시켜 프라이머 연장 반응을 개시할 수 있다. PCR 프라이머 결합 부위는 코드된 올리고누클레오티드 표지 내로 설계하는 것이 바람직하다. 예를 들면, PCR 프라이머 결합 부위는 개시 올리고누클레오티드 표지내로 혼입할 수 있으며, 제 2 PCR 프라이머 결합 부위는 최종 올리고누클레오티드 표지일 수 있다. 또한, 제 2 PCR 프라이머 결합 부위는 본원에 기재된 바와 같이 캡핑 서열내로 혼입시킬 수 있다. 바람직한 실시 양태에서는, PCR 프라이머 결합 부위의 길이가 약 5, 7, 10, 13, 15, 17, 20, 22 또는 25 개 이상의 누클레오티드이다.

PCR 반응은 바람직하게는 예정된 양의 PCR 프라이머쌍을 바람직하게는 예정된 양의 코드된 올리고누클레오티드의 핵산과 PCR 완충제 중에서 혼합하여 PCR 반응 혼합물을 형성하여 수행한다. 이 혼합물을 대개 PCR 반응 생성물을 형성하는 데 충분하도록 사전에 결정된 사이클의 수만큼 열순환시킨다. 충분한 양의 생성물을 충분한 양으로 분리하여 DNA 서열을 결정할 수 있다.

PCR 은 대체로 열순환에 의해 수행하는데, 즉, PCR 반응 혼합물의 온도를 상한선이 약 30 ℃ 내지 약 55 ℃ 이고 하한선이 약 90 ℃ 내지 약 100 ℃ 인 온도 범위 내에서 올렸다 내렸다를 반복하여 수행한다. 온도를 올리고 내리는 것은 연속적일 수 있으며, 폴리누클레오티드 합성, 변성 및 혼성화에 호의적인 온도에서 상대적인 온도 안정도를 기간에 따라 단계적일 수 있다.

PCR 반응은 임의의 적합한 방법을 사용하여 수행한다. 일반적으로 완충 수용액, 즉 바람직하게는 pH 가 7 내지 9 인 PCR 완충제에서 수행한다. 프라이머가 몰과량 존재하는 것이 바람직하다. 많은 양이 과잉되어 방법의 효율을 개선하는 것이 바람직하다.

PCR 완충제는 또한 데옥시리보누클레오티드 트리포스페이트(폴리누클레오티드 합성 치환체) dATP, dCTP, dGTP 및 dTTP 및 대체로 열에 안정한 폴리머라제를 모두 프라이머 연장(폴리누클레오티드 합성) 반응에 적합한 양으로 함유한다. 생성된 용액(PCR 혼합물) 을 약 90 ℃ 내지 100 ℃ 로 약 1 내지 10 분, 바람직하게는 1 내지 4 분 동안 가열한다. 이 가열 기간 후, 용액을 54 ℃ 로 냉각시키는데, 상기 온도는 프라이머 혼성화에 바람직하다. 합성 반응은 실온 내지 폴리머라제(유도제)가 더 이상 효과적으로 작용하지 않는 온도 범위 내에서 일어날 수 있다. 따라서, 예를 들어, DNA 폴리머라제를 사용한다면, 온도는 일반적으로 약 40 ℃ 이하이다. 열순환은 원하는 양의 PCR 생성물이 생성될 때까지 반복한다. PCR 완충제의 일예로 하기의 시약을 포함한다 : 50 mM KCl ; 10 mM Tris-HCL(pH 8.3) ; 1.5 mM MgCl₂ ; 0.001 %(wt/vol) 젤라틴, 200 μM dATP ; 200 μM dTTP ; 200 μM dCTP ; 200 μM dGTP ; 및 완충제 100 ㎕ 당 2.5 유닛 호열성 세균(Thermus aquaticus, Taq) DNA 폴리머라제 I.

프라이머 서열을 연장하는데 적합한 효소는 예를 들면, E. coli DNA 폴리머라제 I, Taq DNA 폴리머라제, E. Coli DNA 폴리머라제 I 의 클레나우 단편(Klenow fragment), T4 DNA 폴리머라제, 기타 유효한 DNA 폴리머라제, 역전사 효소 및 열안정성 효소를 비롯한 기타 효소를 포함하며, 이들은 적절한 방식으로 누클레오티드의 조합을 용이하게 하여 각각의 핵산 가닥에 상보적인 프라이머 연장 생성물을 형성할 것이다. 일반적으로 합성은 각 프라이머의 3' 말단에서 개시되며, 합성이 종결될 때까지 주형 가닥을 따라 5' 방향으로 진행되어, 다른 길이를 갖는 분자들을 생성할 것이다.

새로 합성된 DNA 가닥과 그에 상보적인 가닥은 이중 가닥 분자를 형성하며, 이는 이후의 분석 방법의 다음 단계들에서 사용될 수 있다.

PCR 증폭 방법은 미국 특허 제 4,683,192 호, 제 4,683,202 호, 제 4,800,159 호 및 제 4,965,188 호에 상세히 기재되어 있으며, 적어도 PCR 기술에 개시되어 있다 : Principles and Applications for DNA Amplification, H. Erlich, ed., Stockton Press, New York (1989) ; 및 PCR protocols : A Guide to Methods and Applications, Innis et al., eds., Academic Press, San Diego, Calif. (1990). 상기 문헌들의 내용은 본원에 참고문헌으로 인용되었다.

일단, 코드된 올리고누클레오티드 표지가 증폭되면, 누클레오티드 서열들의 서열을 결정하는 공지된 방법인 핵산 서열 분석법을 이용하여 표지의 서열 및 궁극적으로는 선택된 분자의 조성을 결정할 수 있다. 핵산 서열 분석법은 (a) 프로브 가닥 및 그의 상보성 표적의 혼성화 또는 변성에 기초한 물리화학적 기술, 및 (b) 폴리머라제와의 효소적 반응을 조합하여 접근한다.

본 발명은 또한 본 발명의 방법을 이용하여 생성할 수 있는 화합물 및 화학 구조들의 라이브러리를 형성하는 분리되거나 또는 혼합된 상기 화합물의 집합에 관한 것이다. 본 발명의 화합물은 하기 화학식 I 의 화합물을 포함한다 : 화학식 I

이 식에서, X 는 하나 이상의 빌딩 블록을 포함하는 작용 성분이고 ; Z 는 B 의 3' 말단에 결합된 올리고누클레오티드이고 ; Y 는 C 의 5' 말단에 결합된 올리고누클레오티드이고 ; A 는 X 와 공유결합을 형성하는 작용 성분이고 ; B 는 Z 의 3' 말단과 결합을 형성하는 작용 성분이고 ; C 는 Y 의 5' 말단과 결합을 형성하는 작용 성분이며 ; D, F 및 E 는 작용 성분 A, C 및 B 내지 S 를 연결하는 화학기이며 ; S 는 원자 또는 분자 스캐폴드이다. D, E 및 F 는 각각 독립적으로 알킬렌 사슬 또는 올리고(에틸렌 글리콜) 사슬과 같은 원자들의 사슬인 것이 바람직하며, D, E 및 F 는 같거나 다를 수 있으며, 두 올리고누클레오티드의 혼성화와 작용 성분의 합성을 수행하는 데 효과적인 것이 바람직하다.

Y 및 Z 는 실질적으로 상보적이며, 적합한 조건 하에 왓슨 - 크릭 (Watson-Crick) 염기쌍 및 이합체를 형성할 수 있도록 화합물 내에 배치되어 있는 것이 바람직하다. Y 및 Z 는 같은 길이 또는 다른 길이를 갖는다. Y 및 Z 가 같은 길이를 갖거나 Y 및 Z 중 하나가 다른 하나 보다 1 내지 10 개 염기만큼 더 긴 것이 바람직하다. 바람직한 실시 양태에서, Y 및 Z 는 각각 10 개 이상의 염기를 갖고 10 개 이상의 염기쌍이 상보적인 영역을 갖는다. 보다 바람직한 것은 Y 및 Z 가 실질적으로 전체 길이에 있어서 상보적인 것, 즉 10 개 염기쌍마다 하나의 염기가 다른 것이다. 가장 바람직한 것은 Y 및 Z 가 전체 길이에 있어서 상보적인 것, 즉, Y 또는 Z 의 돌출 영역을 제외하고 상보적인 것이며, 가닥들이 전체 길이 동안 어긋나지 않고 일치하는 왓슨 - 크릭 염기쌍으로 혼성화된 것이다.

S 는 단일 원자이거나 분자 스캐폴드일 수 있다. 예를 들면, S 는 탄소 원자, 붕소 원자, 질소 원자 또는 인 원자 또는 인산기와 같은 다원자 스캐폴드 또는 시클로알킬, 시클로알케닐, 헤테로시클로알킬, 헤테로시클로알케닐, 아릴 또는 헤테로아릴기와 같은 고리형기일 수 있다. 한 실시 양태에서, 링커는 하기 구조식의 기이다 :

이 식에서, n, m 및 p 각각은 독립적으로 1 내지 약 20 의 정수, 바람직하게는 2 내지 8 의 정수, 보다 바람직하게는 3 내지 6 의 정수이다. 한 특정 실시 양태에서, 링커는 하기 도시된 구조를 갖는다 :

.

한 실시 양태에서, 본 발명의 라이브러리는 빌딩 블록으로 이루어진 작용 성분으로 이루어진 분자를 포함하며, 각각의 작용 성분은 코드된 올리고누클레오티드에 효과적으로 결합되어 있다. 코드된 올리고누클레오티드의 누클레오티드 서열은 작용 성분 내 존재하는 빌딩 블록의 지표이며, 몇몇 실시 양태에서는 빌딩 블록의 연결 또는 배치를 나타낸다. 본 발명은 작용 성분을 구성하는데 사용되는 방법 및 올리고누클레오티드 표지를 구성하는데 사용되는 방법이 동일한 반응 매질, 바람직하게는 수성 매질에서 수행할 수 있어, 종래의 기술의 방법에 비해 라이브러리를 제조하는 방법을 단순화할 수 있다. 올리고누클레오티드 결합 단계 및 빌딩 블록 첨가 단계를 모두 수성 매질에서 수행할 수 있는 특정 실시 양태에서, 각각의 반응은 서로 다른 최적의 pH 를 갖는다. 이들 실시 양태에서, 빌딩 블록 첨가 반응은 적합한 수성 완충제 중에서 적합한 pH 및 온도에서 수행할 수 있다. 이어서, 완충제를 올리고누클레오티드 결합에 적합한 pH 를 제공하는 수성 완충제로 교환할 수 있다.

다른 실시 양태에서, 본 발명은 하기 화학식 II 의 화합물 및 이러한 화합물을 포함하는 라이브러리를 제공한다 :

이 식에서, X 는 분자 스캐폴드이고 ; 각각의 Y 는 독립적으로 주변 잔이기고 ; n 은 1 내지 6 의 정수이고 ; 각각의 A 는 독립적으로 빌딩 블록이고 ; n 은 0 내지 약 5 의 정수이고 ; L 은 연결 잔기이며 ; Z 는 구조 뺀 -X(Y)_n 을 확인하는 단일 가닥 또는 이중 가닥 올리고누클레오티드이다. 구조 X(Y)_n 는 예를 들면 표 8 (이하 참조)에 기재된 스캐폴드 구조 중 하나일 수 있다. 한 실시 양태에서, 본 발명은 하기 화학식 III 의 화합물 및 이러한 화합물을 포함하는 라이브러리를 제공한다 :

이 식에서, t 는 0 내지 약 5 의 정수, 바람직하게는 0 내지 3 의 정수이고 ; 각각의 A 는 독립적으로 빌딩 블록이고 ; L 은 결합 성분이고 ; Z 는 A 및 R₁, R₂, R₃ 및 R₄ 를 확인하는 단일 가닥 또는 이중 가닥 올리고누클레오티드이고 ; R₁, R₂, R₃ 및 R₄ 은 각각 독립적으로 수소, 알킬, 치환 알킬, 헤테로알킬, 치환 헤테로알킬, 시클로알킬, 헤테로시클로알킬, 치환 시클로알킬, 치환 헤테로시클로알킬, 아릴, 치환 아릴, 아릴알킬, 헤테로아릴알킬, 치환 아릴알킬, 치환 헤테로아릴알킬, 헤테로아릴, 치환 헤테로아릴, 알콕시, 아릴옥시, 아미노 및 치환 아미노로부터 선택된 치환체이다. 한 실시 양태에서, A 각각은 아미노산 잔기이다.

화학식 II 또는 화학식 III 의 화합물을 포함하는 라이브러리는 화학식 II 또는 화학식 III 의 화합물을 적어도 약 100 ; 1,000 ; 10,000 ; 100,000 ; 1,000,000 또는 10,000,000 개 포함할 수 있다. 한 실시 양태에서, 라이브러리는 화학식 II 또는 화학식 III 의 화합물을 적어도 약 100 ; 1,000 ; 10,000 ; 100,000 ; 1,000,000 또는 10,000,000 개 포함하는 라이브러리를 생성하도록 설계된 방법을 통해 제조된다.

본 발명의 장점 중 하나는 엄청난 수의 화합물을 포함하는 라이브러리를 제조하는 데 사용될 수 있다는 것이다. 폴리머라제 연쇄 반응(PCR)과 같은 공지된 방법들을 사용하여 코드된 올리고누클레오티드 서열을 증폭할 수 있다는 것은 비교적 적은 복제물이 회수된다 할지라도 선택된 분자를 확인할 수 있음을 의미한다. 이로써 고도의 복잡성으로 인해 임의의 주어진 라이브러리 구성요소에 대해 비교적 적은 수의 복제물만을 갖거나 대용량으로 사용해야 하는 대형 라이브러리의 실질적인 사용이 가능하다. 예를 들면, 10⁸개의 개별 구조로 이루어졌으며, 각각의 구조는 1 x 10¹² 개의 복제물(약 1 피코몰)을 갖는 라이브러리는 1 μM 유효 농도의 용액 100 L 가 필요하다. 같은 라이브러리의 경우, 각 구성요소가 1,000,000 개의 복제물로 표현되다면, 필요한 용적은 1 μM 유효 농도에서 100 ㎕ 이다.

한 바람직한 실시 양태에 따르면, 라이브러리가 각 라이브러리 구성요소의 약 10³ 내지 약 10¹⁵ 개 복제물을 포함한다. 라이브러리 구성요소들 중 합성 효율에 차이가 있다면, 서로 다른 라이브러리 구성요소는 임의의 주어진 라이브러리에서 다른 수의 복제물을 가질 것이다. 따라서, 라이브러리 내 이론적으로 존재하는 각 구성요소의 복제물의 수가 동일할 수는 있지만 임의의 주어진 라이브러리 구성요소의 복제물의 실질적인 수는 임의의 다른 구성요소의 복제물의 수와 무관한다. 본 발명의 화합물 라이브러리는 각 라이브러리 구성요소 또는 실질적으로 모든 라이브러리 구성요소의 약 10⁵, 10⁶ 또는 10⁷ 개의 복제물을 포함하는 것이 바람직하다. "실질적으로 모든" 라이브러리 구성요소란 약 85 % 이상의 라이브러리 구성요소, 바람직하게는 약 90 % 이상의 라이브러리 구성요소, 보다 바람직하게는 약 95 % 이상의 라이브러리 구성요소를 의미한다.

라이브러리는 생물학적 표적에 대해 여러 번(즉, 2 회 이상) 선택할 수 있도록 충분한 수의 각 구성요소의 복제물을 포함하며, 최종 선택 후 남은 결합 분자의 양이 충분하여 남아 있는 분자의 올리고누클레오티드 표지의 증폭이 가능하며, 따라서, 결합 분자의 작용 성분을 확인할 수 있는 것이 바람직하다. 이러한 선택 과정이 도 6 에 개략적으로 예시되어 있으며, 도면에서, 1 및 2 는 라이브러리 구성요소를 나타내고, B 는 표적 분자를 나타내고, X 는 B 에 효과적으로 결합되어 선택 매질로부터 B 를 제거할 수 있는 잔기를 나타낸다. 이 실시예에서, 화합물 1 은 B 에 결합되지만, 화합물 2 는 B 에 결합되지 않는다. 라운드 1 로 표시된 선택 과정은 (I) 화합물 1 및 2 를 포함하는 라이브러리와 B - X 를 화합물 1 과 B 를 결합시키기에 적합한 조건 하에 접촉시키고 ; (II) 결합되지 않은 화합물 2 를 제거하고 ; (III) 화합물 1 을 B 로부터 분리하고 반응 매질로부터 BX 를 제거하는 것을 포함한다. 라운드 1 의 결과 화합물 2 에 비해 화합물 1 이 풍부한 분자 집합이 얻어진다. I - III 단계를 적용한 후속 라운드를 통해 화합물 2 에 비해 화합물 1 이 더욱 풍부하게 된다. 도 6 에는 3 라운드의 선택 과정만이 도시되었지만, 실제로는 1 라운드에서 10 라운드에 이르는 임의의 수의 라운드를 이용하여 비결합 분자에 비해 결합 분자가 원하는 만큼 풍부하게 할 수 있다.

도 6 에 도시된 실시 양태에서는, 임의의 라운드 수만큼 선택과정을 수행한 후 남은 화합물의 증폭(보다 많은 복제물의 합성)이 없었다. 이러한 증폭은 선택 과정 후 남은 화합물의 상대적인 양과 일치하지 않는 화합물 혼합물을 초래할 수 있다. 이러한 불일치는 특정 화합물이 다른 화합물보다 쉽게 합성될 수 있기 때문이며, 따라서 선택 과정 후 그들의 존재에 비례하지 않으면서 증폭될 수 있기 때문이다. 예를 들면, 화합물 2 가 화합물 1 보다 쉽게 합성될 경우, 라운드 2 이후 남겨진 분자의 증폭으로 화합물 1 에 대한 화합물 2 의 불균형적인 증폭이 초래되며, 생성된 화합물의 혼합물은 화합물 2 에 비해 화합물 1 이 훨씬 적은 비율일 것이다.

한 실시 양태에서는, 표적을 임의의 공지된 고정 기법으로 고체 지지체 상에 고정시킨다. 고체 지지체는 예를 들면, 크로마토그래피 컬럼 또는 멤브레인 내에 함유된 불수용성 매트릭스일 수 있다. 코드된 라이브러리를 크로마토그래피 컬럼 내 불수용성 매트릭스에 도포할 수 있다. 이어서, 컬럼을 세척하여 비특이적 결합제를 제거한다. pH, 염 농도, 유기 용매 농도를 변화시키거나 또는 표적에 대한 공지된 리간드와의 경쟁과 같은 다른 방법에 의해 표적 결합 화합물을 해리시킬 수 있다.

다른 실시 양태에서는 표적을 용액 내에 유리시키고 코드된 라이브러리와 함께 항온처리시킨다. 표적(본원에서는 "리간드" 로도 부름) 에 결합된 화합물을 겔 여과법 또는 미세여과법과 같은 크기 분리 단계를 통해 선택적으로 분리한다. 한 실시예에서는 코드된 화합물과 표적 생체 분자의 혼합물을 크기 배제 크로마토그래피 컬럼을 통과시키는데(겔 여과법), 상기는 결합되지 않은 화합물로부터 리간드 - 표적 복합체를 분리한다. 리간드 - 표적 복합체를 역상 크로마토그래피 컬럼으로 옮기는데, 상기 컬럼은 표적으로부터 리간드를 분리시킨다. 이어서, 분리된 리간드를 PCR 증폭 및 코드된 올리고누클레오티드의 서열 분석법에 의해 분석한다. 이러한 접근은 특히 표적의 고정이 활성의 손실을 야기할 수 있는 경우에 유리하다.

본 발명의 몇몇 실시 양태에서는 선택 방법이 서열결정에 앞서 표적에 결합되는 화합물 라이브러리의 하나 이상의 구성요소의 코드된 올리고누클레오티드를 증폭하는 것을 포함할 수 있다.

한 실시 양태에서는, 선택된 라이브러리 혼합형태에 존재하는 DNA 분자의 개체 분포에 있어서 가능한 임의의 왜곡을 최소화하기 위해 서열 분석에 앞서 코드된 올리고누클레오티드를 포함하는 화합물의 라이브러리를 증폭시킨다. 예를 들면, 선택 단계 후 소량의 라이브러리만이 회수되며 일반적으로 서열 분석에 앞서 PCR 을 이용하여 증폭시킨다. PCR 은 선택된 라이브러리 혼합형태에 존재하는 DNA 분자의 개체 분포에 있어서 왜곡을 초래할 가능성이 있다. 이는 특히 유입 분자의 수가 작고 유입 분자가 PCR 주형으로 불량할 때 문제가 된다. 초기 순환에서 생성되는 PCR 생성물은 공유 결합 이합체 라이브러리 보다 효과적인 주형이며, 따라서, 이들 분자의 최종 증폭 개체군에서의 빈도는 최초 유입된 주형 보다 높을 수 있다.

따라서, 가능한 PCR 왜곡을 최소화하기 위해, 본 발명의 한 실시 양태에서는 개개의 라이브러리 구성요소에 해당하는 단일 가닥 올리고누클레오티드의 개체군을 예를 들면, 반응 중에 하나의 프라이머를 사용하여 생성한 후 2 개의 프라이머를 이용하여 PCR 증폭시킨다. 이렇게 함으로써 PCR 을 이용한 지수적 증폭에 앞서 단일 가닥 프라이머 - 연장 생성물의 1 차 직선상의 축적이 있으며, 지수적 증폭 단계가 오직 많은 초기 분자 다양성이 프라이머 - 연장 반응 중에 생성된 분자의 개체군에 나타난 후에만 발생하기 때문에, 축적된 프라이머 - 연장 생성물 내 분자의 분포는 초기유입 주형내 존재하는 분자의 다양성과 분포를 보다 정확히 반영한다.

일단 단일 리간드를 앞서 기재한 방법으로 확인한 후, 다양한 수준의 분석을 적용하여 구조 - 활성 관계 정보를 얻고, 리간드의 친화성, 특이성 및 생체활성을 보다 최적화할 수 있다. 같은 스캐폴드로부터 유도된 리간드의 경우, 3 차원적 분자 모델링을 이용하여 리간드들에 공통되는 현저한 구조적 특성을 확인할 수 있으며, 그 결과 표적 생체 분자상의 공통 부위에 결합된 것으로 추정되는 소형 분자 리간드의 집합체를 형성할 수 있다.

다양한 선별 접근법을 이용하여 하나의 표적에 대해 높은 친화도를 갖지만 다른 밀접하게 관련된 표적에 대해서는 현저하게 약한 친화도를 보이는 리간드를 얻을 수 있다. 한가지 선별 방법은 병렬 실험으로 두 생체 분자 모두에 대한 리간드를 확인한 후, 교차 참조 비교를 통해 공통 리간드를 제거하는 것이다. 이 방법에 따르면, 각각의 생체 분자의 리간드를 앞서 기재한 바와 같이 따로따로 확인할 수 있다. 이 방법은 고정된 표적 생체 분자와 용액 중에 유리된 표적 생체 분자 모두에 대해 적용할 수 있다.

고정된 표적 생체 분자의 경우, 다른 전략은 비표적 생체 분자에 결합된 모든 리간드를 라이브러리로부터 제거하는 예비선택 단계를 추가하는 것이다. 예를 들면, 제 1 생체 분자를 앞서 기재한 바와 같이 코드된 라이브러리와 접촉시킬 수 있다. 이어서, 제 1 생체 분자에 결합하지 않은 화합물을 형성된 임의의 제 1 생체 분자 - 리간드 복합체로부터 분리한다. 제 2 생체 분자를 제 1 생체 분자에 결합하지 않은 화합물과 접촉시킨다. 제 2 생체 분자에 결합한 화합물은 앞서 기재한 바와 같이 확인할 수 있으며 제 1 생체 분자에 비해 제 2 생체 분자에 현저히 큰 친화도를 보인다.

또한, 앞서 기재한 방법으로 확인된 알려지지 않은 작용을 갖는 생체 분자의 리간드를 사용하여 생체 분자의 생물학적 작용을 결정할 수 있다. 이는 새로운 유전자 서열이 계속해서 확인된다 해도, 이들 서열에 의해 코드된 단백질의 작용 및 이들 단백질의 새로운 약물 발견 및 개발을 위한 표적으로서의 유효성을 결정하기 어려우며 어쩌면 게놈 정보를 질병의 치료에 사용함에 있어서 가장 현저한 장애물일 수 있다. 본 발명에 기재한 방법에 의해 얻어진 표적 - 특이 리간드는 표적 단백질의 기능 및 치료학적 개입에 있어서, 표적 단백질의 유효성을 이해하기 위한 전세포 생물학적 분석에 또는 적절한 동물 모델에 효과적으로 사용될 수 있다. 이러한 접근은 또한 표적이 특히 소형 분자 약물 발견에 유효한지를 확인할 수 있다.

한 실시 양태에서는, 본 발명의 라이브러리 내에 포함되는 하나 이상의 화합물을 특정 생체 분자를 위한 리간드로 확인한다. 이어서, 이들 화합물을 생체 분자에 대한 결합 능력을 알아보는 생체외 분석법으로 평가할 수 있다. 결합 화합물의 작용 성분은 올리고누클레오티드 표지 또는 링커 성분 없이 합성하는 것이 바람직하며, 이들 작용 성분은 생체 분자에 결합하는 능력을 알아보기 위해 평가한다.

또한, 생체외 무세포 또는 세포 기초 분석법을 이용하여, 세포 생체 분자에 대한 작용 성분의 결합이 생체 분자의 기능에 미치는 효과를 평가할 수 있다. 공지된 작용을 갖는 생체 분자의 경우, 분석법에는 효소 활성과 같은 활성의 직접적인 측정 또는 생체 분자에 영향을 받는 세포 기능과 같은 비간접적 측정에 의해 리간드가 존재할 경우와 부재할 경우의 생체 분자의 활성 비교를 포함할 수 있다. 만일 생체 분자가 알려지지 않은 작용을 보인다면, 그 생체 분자를 발현시키는 세포를 리간드와 접촉시킬 수 있으며, 세포의 유효성, 작용, 표현형 및/또는 유전자 발현에 대한 리간드의 효과를 평가한다. 생체외 분석법은 예를 들면, 세포 사멸 분석, 세포 증식 분석 또는 바이러스성 복제 분석일 수 있다. 예를 들면, 생체 분자가 바이러스에 의해 발현된 단백질인 경우, 바이러스에 감염된 세포를 단백질을 위한 리간드와 접촉시킬 수 있다. 이어서, 단백질에 리간드를 결합시킨 것이 바이러스의 생존력에 미치는 효과를 평가할 수 있다.

본 발명의 방법에 의해 확인된 리간드는 또한 생체내 모델 또는 사람에게서 평가할 수 있다. 예를 들면, 리간드를 생체 분자를 생성하는 동물 또는 생명체에서 평가할 수 있다. 동물 또는 생명체의 건강 상태에 있어서의 임의의 변화(예, 질병 진전)를 결정할 수 있다.

단백질 또는 핵산 분자와 같은 알려지지 않은 작용을 보이는 생체 분자의 경우, 생체 분자를 생성하는 세포 또는 유기체에 대한 생체 분자에 결합된 리간드의 효과가 생체 분자의 생물학적 작용에 관한 정보를 제공할 수 있다. 예를 들어, 특정 세포 과정이 리간드의 존재에 의해 억제되는 것이 관찰되면, 이는 상기 방법이 적어도 부분적으로 생체 분자의 작용에 의존함을 나타낸다.

본 발명의 방법을 이용하여 확인한 리간드는 또한 결합된 생체 분자에 대해 친화성 시약으로 사용될 수 있다. 한 실시 양태에서는 하나 이상의 리간드가 부착된 고체상을 사용하는 생체 분자를 포함하는 용액의 크로마토그래피를 통해 생체 분자의 친화도 정제를 수행하기 위해 이러한 리간드를 사용한다.

본 발명의 방법을 하기 실시예를 통해 추가로 예시하며, 하기 실시예는 본 발명을 제한하는 것으로 해석되어서는 안될 것이다. 도면 및 서열목록 뿐만 아니라 본 출원 전체에 걸쳐 언급된 문헌들, 특허들 및 공개된 특허 출원서들은 본원에 참고문헌으로 인용되었다.

실시예 1 : 10 ⁵ 개의 구성요소에 속하는 라이브러리의 합성 및 특성

10⁵ 개의 특정 구성요소를 포함하는 라이브러리의 합성을 다음의 시약을 사용하여 수행하였다 :

화합물 1 :

데옥시리보누클레오티드에 대한 단일 문자 코드 : A = 아데노신 C = 시티딘 G = 구아노신 T = 티미딘

빌딩 블록 전구체 :

올리고누클레오티드 표지 :

1 X 리가제 완충용액 : 50 mM Tris, pH 7.5 ; 10 mM 디치오트레이톨 ; 10 mM MgCl₂ ; 2.5 mM ATP ; 50 mM NaCl. 10 X 리가제 완충용액 : 500 mM Tris, pH 7.5 ; 100 mM 디치오트레이톨 ; 100 mM MgCl₂ ; 25 mM ATP ; 500 mM NaCl.

사이클 1

12 개의 각각의 PCR 튜브에 물에 용해시킨 화합물 1 의 1 mM 용액의 50 μL ; 표지 1.1-1.12 중 하나의 0.80 mM 용액의 75 μL ; 10X 리가제 완충용액의 15 μL 및 10 μL 의 탈이온수를 첨가하였다. 튜브를 1 분 동안 95 ℃ 까지 가열한 다음에 10 분 동안 16 ℃ 까지 냉각시켰다. 50 μL 의 1X 리가제 완충용액에 용해시킨 5,000 유닛의 T4 DNA 리가제[2.5 μL 의 2,000,000 유닛/mL 용액(뉴 잉글랜드에 소재하는 Biolabs 에서 입수, 카달로그 번호 제 M0202 호)]를 각각의 튜브에 첨가하고 결과적으로 생성된 용액을 16 시간 동안 16 ℃ 에서 항온하였다.

결합시킨 후에, 시료를 1.5 ml Eppendorf 튜브에 옮기고 20 μL 의 5 M 수성 NaCl 및 500 μL 의 냉각(- 20 ℃)시킨 에탄올로 처리하고 1 시간 동안 - 20 ℃ 에 두었다. 원심분리한 후에, 상청액을 제거하고 펠 렛을 - 20 ℃ 에서 70 % 수성 에탄올로 세척하였다. 그런 다음 각각의 펠렛을 pH 9.4, 150 μL 의 150 mM 붕산나트륨 완충용액에 용해시켰다.

각각 0.25 M 의 농도로 빌딩 블록 전구체 BB1 내지 BB12 중 하나, N,N-디이소프로필에탄올아민 및 0-(7-아자벤조트리아졸-1-일)-1,1,3,3-테트라메틸우로늄 헥사플루오르포스페이트를 포함하는 원액을 DMF 에서 제조하였고 20 분 동안 실온에서 교반시켰다. 빌딩 블록 전구체 용액을 링커에 대한 10 배 초과량의 빌딩 블럭 전구체를 제공하기 위해 상기한 각각의 펠렛 용액에 첨가하였다. 결과적으로 생성된 용액을 교반시켰다. 추가적인 10 당량의 빌딩 블록 전구체를 20 분 후에 반응 혼합물에 첨가하고 40 분 후에 또다른 10 당량을 첨가하였다. 반응 혼합물에 용해시킨 DMF 의 최종 농도는 22 % 이다. 그런 다음 반응 용액을 4 ℃ 에서 밤새 교반시켰다. 반응 과정을 50 mM 수성 테트라에틸암모늄 아세테이트(pH = 7.5) 및 아세토니트릴, 및 2-46 % 아세토니트릴의 기울기를 사용하여 14 분 동안 RP-HPLC 로 모니터하였다. ~95 % 의 출발물질(링커)이 아실화되었을 때 반응을 중단하였다. 아실화시킨 다음, 반응 혼합물을 풀링시키고 건조시키기 위해 동결건조시켰다. 그런 다음 동결건조시킨 물질을 HPLC 로 정제하고 라이브러리(아실화시킨 산물)에 대응하는 분획을 풀링시키고 동결건조시켰다.

라이브러리를 2.5 ml 의 0.01 M 인산나트륨 완충용액(pH = 8.2)에 용해시키고 0.1 ml 의 피페리딘(4 % v/v)을 이에 첨가하였다. 피페리딘의 첨가는 혼합으로 용해되지 않는 혼탁도를 결과로서 나타나게 하였다. 반응 혼합물을 실온에서 50 분 동안 교반시킨 다음 혼탁한 용액을 원심분리(14,000 rpm)하고, 상청액을 200 μl 피펫트를 사용하여 제거하고 펠렛을 0.1 ml 의 물에서 재현탁시켰다. 수성 세척액을 상청액과 결합시키고 펠렛을 제거하였다. 반응물에서 메탄올의 최종 농도가 70 % v/v 이 되게 하기 위해 초과량의 얼음-냉각시킨 에탄올을 첨가하여 용액으로부터 탈보호시킨 라이브러리를 침전시켰다. 수성 에탄올 혼합물을 원심분리하여 라이브러리를 포함하는 백색의 펠렛을 수득하였다. 펠렛을 냉각시킨 70 % 수성 에탄올로 한 번 세척하였다. 용매를 제거한 후에, 펠렛을 공기 중에서 건조(~ 5 분)시켜 미량의 에탄올을 제거한 다음 사이클 2 에서 사용하였다. 1 회에서 사용된 표지 및 이에 대응하는 빌딩 블록 전구체를 다음의 표 1 에 기재하였다.

사이클 2-5

각각의 이러한 사이클에서, 상기의 사이클로부터 생성된 혼합된 용액을 각각 50 ul 의 12 동량의 분할량으로 나누고 PCR 튜브에 넣어 두었다. 상이한 표지를 포함하는 용액을 각각의 튜브에 첨가하고, 사이클 1 에 기재한 HPLC 정제 단계를 생략하는 점을 제외하고 사이클 1 에 기재한 바와 같이 결합, 정제 및 아실화를 사이클 3-5 에서 수행하였다. 사이클 2-5 에 대한 표지 및 빌딩 블록 전구체 사이의 대응을 표 2 에 나타내었다.

사이클 5 의 산물을 표지의 결합에 대해 상기한 방법을 사용하여 다음에 나타낸 종결 프라이머와 결합시켰다 :

결과 :

상기한 합성 방법으로 12⁵(약 249,000) 개의 상이한 구조를 포함하는 라이브러리를 생산할 수 있다. 라이브러리의 합성은 각각의 사이클의 산물을 겔 전기영동하여 모니터하였다. 각각의 5 번의 사이클 및 종결 프라이머의 결합 후의 최종 라이브러리의 결과를 도 7 에 나타내었다. "헤드 피스(head piece)" 를 표지한 화합물은 화합물 1 이다. 도면은 각각의 사이클이 예측된 분자량의 증가를 나타내고 각각의 사이클의 산물의 분자량이 실질적으로 균질함을 나타낸다.

실시예 2 : 10 ⁸ 개의 구성요소에 속하는 라이브러리의 합성 및 특성

10⁸ 개의 특정 구성요소를 포함하는 라이브러리의 합성을 다음의 시약을 사용하여 수행하였다 :

화합물 2 :

빌딩 블록 전구체 :

1X 리가제 완충용액 : 50 mM 트리스, pH 7.5 ; 10 mM 디티오트레이톨 ; 10 mM MgCl₂ ; 2 mM ATP ; 50 mM NaCl. 10X 리가제 완충용액 : 500 mM 트리스, pH 7.5 ; 100 mM 디티오트레이톨 ; 100 mM MgCl₂ ; 20 mM ATP ; 500 mM NaCl.

화합물 2 에 대한 물 용해성 스페이서의 부착

4 ℃ 로 냉각시킨 붕산나트륨 완충용액(150 mM, pH 9.4)에 용해시킨 화합물 2 의 용액(60 mL, 1 mM)에 N,N-디메틸포름아미드(DMF)(16 mL, 0.15 M)에 용해시킨 40 당량의 N-Fmoc-15-아미노-4,7,10,13-테트라옥사옥타데카노익 산(S-Ado)을 첨가한 다음에 물(9.6 mL, 0.25 M)에 용해시킨 40 당량의 4-(4,6-디메톡시[1.3.5]트리아진-2-일)-4-메틸모르폴리늄 염화 수화물(DMTMM)을 첨가하였다. 혼합물을 추가적인 40 당량의 S-Ado 및 DMTMM 을 첨가하기 전에 4 ℃ 에서 2 시간 동안 서서히 진탕시키고 추가로 4 ℃ 에서 16 시간 동안 진탕시켰다.

아실화시킨 후에, 0.1X 부피의 5 M 수성 NaCl 및 2.5X 부피의 냉각(- 20 ℃)시킨 에탄올을 첨가하고 혼합물을 적어도 1 시간 동안 - 20 ℃ 에 두었다. 그런 다음 혼합물을 4 ℃ 원심기에서 14,000 rpm 으로 15 분 동안 원심분리하여 백색의 펠렛을 수득하였으며, 상기 펠렛은 냉각시킨 EtOH 로 세척한 다음 30 분 동안 실온에서 동결건조기로 건조시켰다. 고형물을 40 mL 의 물에 용해시키고 Waters Xterra RP₁₈ 컬럼을 사용하여 역상 HPLC 로 정제하였다. pH 7.5 에서 50 mM 의 수성 트리에틸암모늄 아세테이트 완충용액 및 99 % 아세토니트릴/1 % 물의 용액을 사용하여 산물을 용출하기 위해 이원의 이동상 기울기 프로필(binary mobile phase gradient profile)을 사용하였다. 정제한 물질을 동결건조하여 농축시키고 결과적으로 생성된 잔류물을 5 mL 의 물에 용해시켰다. 0.1X 부피의 피페리딘을 용액에 첨가하고 혼합물을 실온에서 45 분 동안 서서히 진탕시켰다. 그런 다음 산물을 상기에 기재한 바와 같이 에탄올 침전하여 정제하고 원심분리하여 분리하였다. 정제한 화합물 3 을 수득하기 위해 결과적으로 생성된 펠렛을 냉각시킨 EtOH 로 두 번 세척하고 동결건조하여 건조시켰다.

사이클 1

96 웰 플레이트의 각각의 웰에 표 3 에 나타낸 바와 같이 물에 용해시킨 화합물 3 의 4 mM 용액 12.5 μL ; 올리고누클레오티드 표지 1.1 내지 1.96 중 하나의 1 mM 용액 100 μL(화합물 3 대 표지의 몰비는 1:2 임)를 첨가하였다. 플레이트를 1 분 동안 95 ℃ 로 가열한 다음 10 분 동안 16 ℃ 로 냉각시켰다. 각각의 웰에 10 μL 의 10X 리가제 완충용액, 30 유닛의 T4 DNA 리가제[1 μL 의 30 유닛/μL 용액 (Fermentas Life Science 에서 입수, 카달로그 번호 제 EL0013 호)] 및 76.5 μL 의 물을 첨가하고, 결과적으로 생성된 용액을 16 시간 동안 16 ℃ 에서 항온하였다.

결합 반응 후에, 20 μL 의 5 M 수성 NaCl 을 각각의 웰에 직접적으로 첨가한 다음 500 μL 의 냉각(- 20 ℃)시킨 에탄올을 첨가하고 1 시간 동안 - 20 ℃ 에 두었다. 플레이트를 Beckman Microplus Carriers 를 사용하여 Beckman Coulter Allegra 6R 원심분리기에서 3200 g 로 1 시간 동안 원심분리하였다. 플레이트를 거꾸로하여 상청액을 조심스럽게 제거하고 펠렛을 - 20 ℃ 에서 70 % 수성의 냉각시킨 에탄올로 세척하였다. 그런 다음 각각의 펠렛을 붕산나트륨 완충용액(50 μL, 150 mM, pH 9.4)에 용해시켜 1 mM 의 농도가 되게하고 4 ℃ 로 냉각시켰다.

각각의 용액에 DMF(13 μL, 0.15 M)에 용해시킨 40 당량의 96 개의 빌딩 블록 전구체 중 하나를 첨가한 다음 물(8 μL, 0.25 M)에 용해시킨 40 당량의 DMT-MM 을 첨가하였고, 용액을 4 ℃ 에서 서서히 진탕시켰다. 2 시간 후에, 추가적인 40 당량의 각각의 빌딩 블록 전구체 중 하나 및 DMTMM 을 첨가하고 용액을 4 ℃ 에서 16 시간 동안 서서히 진탕시켰다. 아실화시킨 후에, DMF(2 μL, 0.25 M)에 용해시킨 10 당량의 아세트산-N-히드록시-숙신이미드 에스테르를 각각의 용액에 첨가하고 10 분 동안 서서히 진탕시켰다.

아실화시킨 후에, 96 개의 반응 혼합물을 풀링시키고 0.1 부피의 5 M 수성 NaCl 및 2.5 부피의 냉각시킨 무수 에탄올을 첨가하고 용액을 적어도 1 시간 동안 - 20 ℃ 에 두었다. 그런 다음 혼합물을 원심분리하였다. 원심분리한 후에, 마이크로피펫트으로 가능한 한 많은 상청액을 제거하고 펠렛을 냉각시킨 에탄올로 세척하고 또다시 원심분리하였다. 상청액을 200 μL 피펫트로 제거하였다. 냉각시킨 70 % 에탄올을 튜브에 첨가하고 결과적으로 생성된 혼합물을 4 ℃ 에서 5 분 동안 원심분리하였다.

상청액을 제거하고 잔여 에탄올을 10 분 동안 실온에서 동결건조하여 제거하였다. 펠렛을 2 mL 의 물에 용해시킨 다음에 Waters Xterra RP₁₈ 컬럼을 갖는 역상 HPLC 로 정제하였다. pH 7.5 의 50 mM 수성 트리에틸암모늄 아세테이트 완충용액 및 99 % 아세토니트릴/1 % 물의 용액을 사용하여 라이브러리를 용출시키기 위해 이원의 이동상 기울기 프로필을 사용하였다. 라이브러리를 함유하는 분획을 수집하고 풀링시킨 다음에 동결건조하였다. 결과적으로 생성된 잔류물을 2.5 mL 의 물에 용해시키고 250 μL 의 피페리딘을 첨가하였다. 용액을 45 분 동안 서서히 진탕시킨 다음 상기한 바와 같이 에탄올로 침전시켰다. 결과적으로 생성된 펠렛을 동결건조하여 건조시킨 다음 1 mM 의 농도가 되도록 붕산나트륨 완충용액(4.8 mL, 150 mM, pH 9.4)에 용해시켰다.

용액을 4 ℃ 로 냉각시키고, DMF(1.2 mL, 0.15 M)에 용해시킨 40 당량의 N-Fmoc-프로파르길글리신 및 물(7.7 mL, 0.25 M)에 용해시킨 40 당량의 DMT-MM 을 첨가하였다. 추가적인 40 당량의 N-Fmoc-프로파르길글리신 및 DMT-MM 을 첨가하기 전에 혼합물을 4 ℃ 에서 2 시간 동안 서서히 진탕시키고 용액을 추가로 16 시간 동안 진탕시켰다. 혼합물을 상기한 바와 같이 EtOH 침전 및 역상 HPLC 로 정제한 후에 N-Fmoc 기를 상기한 바와 같이 피페리딘으로 처리하여 제거하였다. EtOH 침전에 의한 최종 정제에서 결과적으로 생성된 펠렛을 동결건조하여 건조시키고 합성의 다음 사이클을 수행하였다.

사이클 2-4

이러한 각각의 사이클에서, 이전의 사이클에서 건조시킨 펠렛을 물에 용해시키고, 라이브러리의 DNA 성분의 흡광계수를 기초로 하여 분광광도계로 라이브러리의 농도를 측정하였으며, 여기에서 화합물 2 의 초기 흡광계수는 131,500 L/(몰.cm)이다. 연속적인 결합 반응에서의 최종 농도가 0.25 mM 이 되도록 물로 라이브러리의 농도를 조절하였다. 그런 다음 라이브러리를 96 웰 플레이트에 96 동량의 분할량으로 나누었다. 각각의 웰에 상이한 표지(라이브러리 대 표지의 몰비가 1:2 임)를 포함하는 용액을 첨가하고, 사이클 1 에 기재한 바와 같이 결합을 수행하였다. 사이클 2, 3 및 4 에서 사용한 올리고누클레오티드 표지를 각각 표 4, 5 및 6 에 나타내었다. 각각의 사이클 1 내지 4 에서의 표지 및 빌딩 블록 전구체 사이의 대응을 표 7 에 나타내었다. 라이브러리를 사이클 1 에 대해 상기한 바와 같이 에탄올을 첨가하여 침전시키고 1 mM 의 농도가 되도록 붕산나트륨 완충용액(150 mM, pH 9.4)에 용해시켰다. 사이클 3 과정에서 HPLC 정제를 생략하는 점을 제외하고는 사이클 1 에 기재한 바와 같이 연속적인 아실화 및 정제를 수행하였다.

사이클 4 의 산물을 표지의 결합에 대해 상기한 바와 같은 방법을 사용하여 다음에 나타낸 종결 프라이머와 결합시켰다 :

.

결과 :

상기한 합성 방법으로 96⁴(약 10⁸) 개의 상이한 구조를 포함하는 라이브러리를 생산할 수 있다. 라이브러리의 합성은 각각의 사이클의 산물을 겔 전기영동 및 LC/MS 하여 모니터하였다. 종결시 라이브러리를 몇몇의 기술을 사용하여 분석하였다. 도 13A 는 종결 프라이머를 결합하기 전이지만 사이클 4 를 수행한 다음의 라이브러리의 크로마토그램이고 ; 도 13B 는 동일한 합성 단계에서의 라이브러리의 질량 스펙트럼이다. 평균 분자량을 음이온 LC/MS 분석하여 측정하였다. 이온 신호를 ProMass 소프트웨어를 사용하여 풀었다(deconvoluted). 이러한 결과는 라이브러리의 예측된 평균 질량과 일치한다.

라이브러리의 DNA 성분을 아가로스겔 전기영동으로 분석하였고, 이는 대다수의 라이브러리 물질이 정확한 크기의 결합된 산물에 해당함을 보여준다. 라이브러리의 시료채취로부터 유도된 PCR 산물의 분자 클론의 DNA 서열 분석은 종결 직전에 DNA 결합이 높은 정확도로 일어남을 보여준다.

라이브러리 고리화( cyclization )

사이클 4 의 종결에서, 라이브러리의 부분을 일반적인 아실화 조건 하에서, 아지도아세트산을 사용하여 N-말단에 캡핑시켰다. EtOH 침전으로 정제한 후에, 산물을 1 mM 의 농도가 되도록 인산나트륨 완충용액(150 mM, pH 8)에 용해시키고, 물(200 mL)에 용해시킨 4 당량의 CuSO₄, 물(200 mM)에 용해시킨 4 당량의 아스코르빈산 및 DMF(200 mM)에 용해시킨 용액으로서 다음에 나타낸 화합물의 촉매량을 첨가하였다. 그런 다음 반응 혼합물을 실온에서 2 시간 동안 서서히 진탕시켰다.

고리화의 정도를 평가하기 위해, 라이브러리의 고리화 반응으로부터 5 μL 의 분할량을 제거하고 실시예 4 에 기재한 바와 같이 제조한 형광성으로 표지한 아지드 또는 알킨(1 μl 의 100 mM DMF 원료)으로 처리하였다. 16 시간 후에, 500 nm 에서의 HPLC 분석시 알킨 또는 아지드 표지 중 어떤 것도 라이브러리에 결합되지 않았다. 이러한 결과는 라이브러리가 고리화첨가반응의 능력이 있는 아지드 또는 알킨기를 더 이상 함유하지 않음을 나타내고, 따라서 라이브러리는 고리화 또는 분자간 반응을 통해 라이브러리 자체와 반응해야함을 나타낸다. 고리화시킨 라이브러리를 상기한 바와 같이 역상 HPLC 로 정제하였다. 고리화시키지 않은 라이브러리를 사용한 대조 실험은 상기한 형광 표지의 완전한 결합을 보여준다.

실시예 4 : 고리화 검정에서 형광 표지의 제조

각각의 튜브에서 프로파르길 글리신 또는 2-아미노-3-페닐프로필아지드(각각 8 μmol)를 pH 9.4 의 붕산염 완충용액(250 μL)에 용해시킨 FAM-OSu(Molecular Probes Inc. 에서 입수)(1.2 당량)와 결합시켰다. 반응을 실온에서 3 시간 동안 진행시킨 다음 밤새 동결건조시켰다. HPLC 로 정제하여 정량의 수득량으로 바람직한 형광 알킨 및 아지드를 수득하였다.

실시예 5 : 아지드 / 알킨의 고리화첨가반응을 사용한 각각의 화합물의 고리화

아지도아세틸 - Gly - Pro - Phe - Pra - NH ₂ 의 제조방법 :

0.3 mmol 의 Rink-아미드 수지를 사용하여, 활성화 제제(Pra=C-프로파르길글리신)로서 Fmoc-보호된 아미노산 및 HATU 를 사용하는 표준 고체상 합성 기술로 나타낸 서열을 합성하였다. 아지도아세트산을 테트라펩티드를 캡핑시키기 위해 사용하였다. 4 시간 동안 20 % TFA/DCM 으로 수지로부터 펩티드를 절단하였다. RP HPLC 로 정제하여 백색 고형(75 ㎎, 51 %)의 산물을 수득하였다.

아지도아세틸 - Gly - Pro - Phe - Pra - NH ₂ 의 고리화 :

아지도아세틸 펩티드(31 ㎎, 0.62 mmol)을 MeCN(30 mL)에 용해시켰다. 디이소프로필에틸아민(DIEA, 1 mL) 및 Cu(MeCN)₄PF₆(1 ㎎)을 첨가하였다. 1.5 시간 동안 교반시킨 후에, 용액을 증발시키고 결과적으로 생성된 잔류물을 20 % MeCN/H₂O 에 흡수시켰다. 불용성 염을 제거하기 위해 원심분리한 후에, 용액을 예비의 역상 HPLC 하였다. 백색 고형(10 ㎎, 32 %)의 바람직한 시클로 펩티드를 분리하였다.

아지도아세틸 - Gly - Pro - Phe - Pra - Gly - OH 의 제조방법 :

0.3 mmol 의 글리신-왕 수지를 사용하고, 활성화 제제로서 Fmoc-보호된 아미노산 및 HATU 를 사용하여 나타낸 서열을 합성하였다. 펜타펩티드를 캡핑시키기 위해 마지막 결합 단계에서 아지도아세트산을 사용하였다. 펩티드의 절단을 2 시간 동안 50 % TFA/DCM 을 사용하여 성취하였다. RP HPLC 로 정제하여 백색 고형(83 ㎎ ; 50 %)의 펩티드를 수득하였다.

아지도아세틸 - Gly - Pro - Phe - Pra - Gly - OH 의 고리화 :

MeCN(60 mL)에 펩티드(32 ㎎, 0.058 mmol)를 용해시켰다. 디이소프로필에틸아민(1 mL) 및 Cu(MeCN)₄PF₆(1 ㎎)을 첨가하고 용액을 2 시간 동안 교반시켰다. 용매를 증발시키고 이량체 및 삼량체를 제거하기 위해 조산물(crude product)을 RP HPLC 하였다. 무색 유리(6 ㎎, 20 %)의 시클로 단량체를 분리하였다.

DNA 에 대한 선형 펩티드의 접합 :

화합물 2(45 nmol)를 45 μL 붕산나트륨 완충용액(pH 9.4 ; 150 mM)에 용해시켰다. 4 ℃ 에서, 선형 펩티드(DMF 에 용해시킨 18 μL 의 100 mM 원료 ; 180 nmol ; 40 당량)를 첨가한 다음 DMT-MM(물에 용해시킨 3.6 μL 의 500 mM 원료 ; 180 nmol ; 40 당량)을 첨가하였다. 2 시간 동안 교반시킨 후에, LCMS 는 완전 반응을 나타내었고 산물을 에탄올 침전시켜 분리하였다.

DNA 에 대한 시클로 펩티드의 접합 :

화합물 2(20 nmol)를 20 μL 붕산나트륨 완충용액(pH 9.4, 150 mM)에 용해시켰다. 4 ℃ 에서, 선형 펩티드(DMF 에 용해시킨 8 μL 의 100 mM 원료 ; 80 nmol ; 40 당량)를 첨가한 다음 DMT-MM(물에 용해시킨 1.6 μL 의 500 mM 의 원료 ; 80 nmol ; 40 당량)을 첨가하였다. 2 시간 동안 교반시킨 후에, LCMS 은 완전 반응을 나타내었고 산물을 에탄올 침전시켜 분리하였다.

DNA - 결합된 펩티드의 고리화 :

선형 펩티드-DNA 접합물(10 nmol)을 pH 8 의 인산나트륨 완충용액(10 μL, 150 mm)에 용해시켰다. 실온에서, 4 당량의 각각의 CuSO₄, 아스코르빈산 및 Sharpless 리간드 모두를 첨가하였다(0.2 μL 의 200 mM 원료). 반응물을 밤새 반응시켰다. RP HPLC 는 선형 펩티드-DNA 가 존재하지 않음을 보여주고, 산물이 표준의 시클로 펩티드-DNA 와 함께 공동으로 용출되었음을 보여준다. 미량의 이량체 또는 그밖의 올리고머가 관찰되지 않았다.

실시예 6 : 작동 성분의 합성에 대한 방향족 친핵성 치환반응의 적용

염화시아닌을 사용한 화합물 3 의 아실화를 위한 일반적인 방법 :

화합물 2 를 1 mM 의 농도에서 pH 9.4 의 붕산나트륨 완충용액에 용해시켰다. 용액을 4 ℃ 로 냉각시킨 다음 20 당량의 염화시아닌을 MeCN 에 용해시킨 500 mM 용액으로 첨가하였다. 2 시간 후에, 종결 반응을 LCMS 하여 확인하였고, 결과적으로 생성된 디클로로트리아진-DNA 접합물을 에탄올 침전시켜 분리하였다.

디클로로트리아진 - DNA 의 아민 치환을 위한 방법 :

디클로로트리아진-DNA 접합물을 1 mM 의 농도에서 pH 9.5 의 붕산염 완충용액에 용해시켰다. 실온에서, 40 당량의 지방족 아민을 DMF 용액으로 첨가하였다. LCMS 한 다음에 반응은 2 시간 후에 일반적으로 종결되었다. 결과적으로 생성된 알킬아미노-모노클로로트리아진-DNA 접합물을 에탄올 침전시켜 분리하였다.

모노클로로트라이진 - DNA 의 아민 치환을 위한 방법 :

알킬아미노-모노클로로트리아진-DNA 접합물을 1 mM 의 농도에서 pH 9.5 의 붕산염 완충용액에 용해시켰다. 42 ℃ 에서, 40 당량의 제 2 의 지방족 아민을 DMF 용액으로 첨가하였다. LCMS 한 다음에 반응은 2 시간 후에 일반적으로 종결되었다. 결과적으로 생성된 디아미노트리아진-DNA 접합물을 에탄올 침전시켜 분리하였다.

실시예 7 : 작동 성분의 합성에 대한 환원성 아미노화 반응의 적용

알데히드 빌딩 블록과 함께 제 2 급 아민을 포함하는 DNA -링커의 환원성 아미노화 반응을 위한 일반적인 방법 :

화합물 2 를 N-말단 프롤린 잔기에 결합시켰다. 결과적으로 생성된 화합물을 1 mM 의 농도에서 인산나트륨 완충용액(50 μL, 150 mM, pH 5.5)에 용해시켰다. 이러한 용액에 DMF(8 μL, 0.25 M)에 용해시킨 40 당량의 알데히드 빌딩 블록 및 DMF(8 μL, 0.25 M)에 용해시킨 40 당량의 소듐 시아노보로하이드라이드를 첨가하고, 용액을 2 시간 동안 80 ℃ 에서 가열하였다. 아실화시킨 후에, 용액을 에탄올 침전시켜 정제하였다.

아민 빌딩 블록과 함께 알데히드를 포함하는 DNA -링커의 환원성 아 미노화를 위한 일반적인 방법 :

알데히드기를 포함하는 빌딩 블록에 결합한 화합물 2 를 1 mM 의 농도에서 인산나트륨 완충용액(50 μL, 250 mM, pH 5.5)에 용해시켰다. 이러한 용액에 DMF(8 μL, 0.25 M)에 용해시킨 40 당량의 아민 빌딩 블록 및 DMF(8 μL, 0.25 M)에 용해시킨 40 당량의 소듐 시아노보로하이드라이드를 첨가하고, 용액을 2 시간 동안 80 ℃ 에서 가열하였다. 아실화시킨 후에, 용액을 에탄올 침전시켜 정제하였다.

실시예 8 : 작동 성분의 합성에 대한 펩토이드 빌딩 반응의 적용

DNA -링커에 대한 펩토이드 합성에 대한 일반적인 절차 :

화합물 2 를 1 mM 의 농도에서 붕산나트륨 완충용액(50 μL, 150 mM, pH 9.4)에 용해시키고 4 ℃ 로 냉각시켰다. 이러한 용액에 DMF(13 μL, 0.15 M)에 용해시킨 40 당량의 N-히드록시숙신이미딜 브로모아세테이트를 첨가하고 용액을 2 시간 동안 4 ℃ 에서 서서히 진탕시켰다. 아실화시킨 후에, DNA-링커를 에탄올 침전시켜 정제하고 1 mM 의 농도에서 붕산나트륨 완충용액(50 μL, 150 mM, pH 9.4)에 재용해시키고 4 ℃ 로 냉각시켰다. 이러한 용액에 DMF(13 μL, 0.15 M)에 용해시킨 40 당량의 아민 빌딩 블록을 첨가하고 용액을 16 시간 동안 4 ℃ 에서 서서히 진탕시켰다. 아킬화시킨 후에, DNA-링커를 에탄올 침전시켜 정제하고 1 mM 의 농도에서 붕산나트륨 완충용액(50 μL, 150 mM, pH 9.4)에 재용해시키고 4 ℃ 로 냉각시켰다. N-히드록시숙신이미딜 브로모아세테이트을 서서히 첨가한 다음에 아민 빌딩 블록을 첨가하여 펩토이드 합성을 계속하였다.

실시예 9 : 작용 성분의 합성에 대한 아지드 - 알킨 고리화첨가반응의 적용

일반적인 방법 :

알킨-함유 DNA 접합물을 약 1 mM 의 농도에서 pH 8.0 의 인산염 완충용액에 용해시켰다. 실온에서, 이러한 혼합물에 10 당량의 유기 아지드 및 5 당량의 각각의 황산구리(Ⅱ), 아스코르빈산 및 리간드 (트리스-((1-벤질트리아졸-4-일)메틸)아민을 첨가하였다. LCMS 한 다음에 반응은 1-2 시간 후에 일반적으로 종결되었다. 결과적으로 생성된 트리아졸-DNA 접합물을 에탄올 침전시켜 분리하였다.

실시예 10 : 코드된 라이브러리 내로부터 Abl 키나제에 대한 리간드의 확인

바람직하지 않은 라이브러리 구성요소에서 DNA-코드된 라이브러리에 흥미로운 분자를 풍부하게 하는 능력은 흥미로운 치료학적 표적에 대한 한정된 성질을 갖는 단일 화합물을 확인하는데 중요하다. 이러한 풍부하게 하는 능력을 증명하기 위해, rhAbl 키나제(GenBank 제 U07563 호)에 대한 공지된 결합 분자[본원에 참고문헌으로 인용되어 있는 Shah 등의 Science 305, 399-401(2004) 참조]를 합성하였다. 실시예 1 및 2 에 기재한 방법을 통해 생산된 이러한 분자와 유사한 분자(올리고누클레오티드에 결합된 작용 성분)를 생산하기 위해 표준 화학 방법을 사용하여 상기의 실시예에서 기재한 링커를 통해 이러한 화합물을 이중가닥 DNA 올리고누클레오티드에 부착시켰다. 실시예 2 에서 기재한 바와 같이 일반적으로 생산된 라이브러리 및 DNA-결합된 Abl 키나제 결합제를 두 종류의 qPCR 분석을 가능하게 하는 특정 DNA 서열로 설계하였다. DNA-결합된 Abl 키나제 결합제를 1:1000 의 비율로 라이브러리와 혼합하였다. 이러한 혼합물을 rhAble 키나제로 평형시키고, 효소를 고체상에 포획시키고 비-결합 라이브러리 구성요소를 제거하기 위해 세척한 다음 결합 분자를 용출시켰다. 용출액에서 라이브러리 분자 대 DNA-결합된 Abl 키나제 저해제의 비율은 1:1 이며, 이는 1000 배 초과량의 라이브러리 분자에서 DNA-결합된 Abl-키나제 결합제가 500 배 보다 더 풍부함을 나타낸다.

등가물

본 분야의 숙련자는 본원에 기재된 본 발명의 특정한 실시형태에 대한 많은 등가물을 인지하거나 단지 일반적인 실험을 사용하여 확인할 수 있다. 이러한 등가물이 다음의 청구의 범위에 의해 포함되도록 의도하였다.

SEQUENCE LISTING <110> Praecis Pharmaceuticals, Inc. <120> METHODS FOR SYNTHESIS OF ENCODED LIBRARIES <130> PPI-156CPPC <150> 11/015458 <151> 2004-12-17 <150> 60/530854 <151> 2003-12-17 <150> 60/540681 <151> 2004-01-30 <150> 60/553715 <151> 2004-03-15 <150> 60/588672 <151> 2004-07-16 <150> 60/689466 <151> 2005-06-09 <150> 60/731041 <151> 2005-10-28 <160> 890 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 1 gcaacgaag 9 <210> 2 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 2 tcgttgcca 9 <210> 3 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 3 gcgtacaag 9 <210> 4 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 4 tgtacgcca 9 <210> 5 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 5 gctctgtag 9 <210> 6 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 6 acagagcca 9 <210> 7 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 7 gtgccatag 9 <210> 8 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 8 atggcacca 9 <210> 9 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 9 gttgaccag 9 <210> 10 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 10 ggtcaacca 9 <210> 11 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 11 cgacttgac 9 <210> 12 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 12 acgctgaac 9 <210> 13 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 13 cgtagtcag 9 <210> 14 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 14 gactacgca 9 <210> 15 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 15 ccagcatag 9 <210> 16 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 16 atgctggca 9 <210> 17 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 17 cctacagag 9 <210> 18 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 18 ctgtaggca 9 <210> 19 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 19 ctgaacgag 9 <210> 20 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 20 acgacttgc 9 <210> 21 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 21 ctccagtag 9 <210> 22 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 22 actggagca 9 <210> 23 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 23 taggtccag 9 <210> 24 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 24 ggacctaca 9 <210> 25 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 25 gcgtgttgt 9 <210> 26 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 26 aacacgcct 9 <210> 27 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 27 gcttggagt 9 <210> 28 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 28 tccaagcct 9 <210> 29 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 29 gtcaagcgt 9 <210> 30 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 30 gcttgacct 9 <210> 31 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 31 caagagcgt 9 <210> 32 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 32 gctcttgct 9 <210> 33 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 33 cagttcggt 9 <210> 34 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 34 cgaactgct 9 <210> 35 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 35 cgaaggagt 9 <210> 36 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 36 tccttcgct 9 <210> 37 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 37 cggtgttgt 9 <210> 38 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 38 aacaccgct 9 <210> 39 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 39 cgttgctgt 9 <210> 40 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 40 agcaacgct 9 <210> 41 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 41 ccgatctgt 9 <210> 42 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 42 agatcggct 9 <210> 43 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 43 ccttctcgt 9 <210> 44 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 44 gagaaggct 9 <210> 45 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 45 tgagtccgt 9 <210> 46 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 46 ggactcact 9 <210> 47 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 47 tgctacggt 9 <210> 48 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 48 cgttagact 9 <210> 49 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 49 gtgcgttga 9 <210> 50 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 50 aacgcacac 9 <210> 51 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 51 gttggcaga 9 <210> 52 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 52 tgccaacac 9 <210> 53 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 53 cctgtagga 9 <210> 54 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 54 ctacaggac 9 <210> 55 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 55 ctgcgtaga 9 <210> 56 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 56 tacgcagac 9 <210> 57 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 57 cttacgcga 9 <210> 58 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 58 gcgtaagac 9 <210> 59 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 59 tggtcacga 9 <210> 60 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 60 gtgaccaac 9 <210> 61 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 61 tcagagcga 9 <210> 62 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 62 gctctgaac 9 <210> 63 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 63 ttgctcgga 9 <210> 64 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 64 cgagcaaac 9 <210> 65 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 65 gcagttgga 9 <210> 66 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 66 caactgcac 9 <210> 67 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 67 gcctgaaga 9 <210> 68 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 68 ttcaggcac 9 <210> 69 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 69 gtagccaga 9 <210> 70 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 70 tggctacac 9 <210> 71 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 71 gtcgcttga 9 <210> 72 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 72 aagcgacac 9 <210> 73 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 73 gcctaagtt 9 <210> 74 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 74 cttaggctc 9 <210> 75 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 75 gtagtgctt 9 <210> 76 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 76 gcactactc 9 <210> 77 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 77 gtcgaagtt 9 <210> 78 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 78 cttcgactc 9 <210> 79 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 79 gtttcggtt 9 <210> 80 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 80 ccgaaactc 9 <210> 81 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 81 cagcgtttt 9 <210> 82 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 82 aacgctgtc 9 <210> 83 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 83 catacgctt 9 <210> 84 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 84 gcgtatgtc 9 <210> 85 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 85 cgatctgtt 9 <210> 86 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 86 cagatcgtc 9 <210> 87 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 87 cgctttgtt 9 <210> 88 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 88 caaagcgtc 9 <210> 89 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 89 ccacagttt 9 <210> 90 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 90 actgtggtc 9 <210> 91 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 91 cctgaagtt 9 <210> 92 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 92 cttcaggtc 9 <210> 93 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 93 ctgacgatt 9 <210> 94 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 94 tcgtcagtc 9 <210> 95 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 95 ctccacttt 9 <210> 96 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 96 agtggagtc 9 <210> 97 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 97 accagagcc 9 <210> 98 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 98 ctctggtaa 9 <210> 99 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 99 atccgcacc 9 <210> 100 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 100 tgcggataa 9 <210> 101 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 101 gacgacacc 9 <210> 102 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 102 tgtcgtcaa 9 <210> 103 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 103 ggatggacc 9 <210> 104 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 104 tccatccaa 9 <210> 105 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 105 gcagaagcc 9 <210> 106 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 106 cttctgcaa 9 <210> 107 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 107 gccatgtcc 9 <210> 108 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 108 acatggcaa 9 <210> 109 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 109 gtctgctcc 9 <210> 110 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 110 agcagacaa 9 <210> 111 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 111 cgacagacc 9 <210> 112 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 112 tctgtcgaa 9 <210> 113 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 113 cgctactcc 9 <210> 114 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 114 agtagcgaa 9 <210> 115 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 115 ccacagacc 9 <210> 116 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 116 tctgtggaa 9 <210> 117 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 117 cctctctcc 9 <210> 118 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 118 agagaggaa 9 <210> 119 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 119 ctcgtagcc 9 <210> 120 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 120 ctacgagaa 9 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 121 aaatcgatgt ggtcactcag 20 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 122 gagtgaccac atcgatttgg 20 <210> 123 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 123 aaatcgatgt ggactaggag 20 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 124 cctagtccac atcgatttgg 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 125 aaatcgatgt gccgtatgag 20 <210> 126 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 126 catacggcac atcgatttgg 20 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 127 aaatcgatgt gctgaaggag 20 <210> 128 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 128 ccttcagcac atcgatttgg 20 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 129 aaatcgatgt ggactagcag 20 <210> 130 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 130 gctagtccac atcgatttgg 20 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 131 aaatcgatgt gcgctaagag 20 <210> 132 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 132 cttagcgcac atcgatttgg 20 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 133 aaatcgatgt gagccgagag 20 <210> 134 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 134 ctcggctcac atcgatttgg 20 <210> 135 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 135 aaatcgatgt gccgtatcag 20 <210> 136 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 136 gatacggcac atcgatttgg 20 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 137 aaatcgatgt gctgaagcag 20 <210> 138 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 138 gcttcagcac atcgatttgg 20 <210> 139 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 139 aaatcgatgt gtgcgagtag 20 <210> 140 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 140 actcgcacac atcgatttgg 20 <210> 141 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 141 aaatcgatgt gtttggcgag 20 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 142 cgccaaacac atcgatttgg 20 <210> 143 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 143 aaatcgatgt gcgctaacag 20 <210> 144 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 144 gttagcgcac atcgatttgg 20 <210> 145 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 145 aaatcgatgt gagccgacag 20 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 146 gtcggctcac atcgatttgg 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 147 aaatcgatgt gagccgaaag 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 148 ttcggctcac atcgatttgg 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 149 aaatcgatgt gtcggtagag 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 150 ctaccgacac atcgatttgg 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 151 aaatcgatgt ggttgccgag 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 152 cggcaaccac atcgatttgg 20 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 153 aaatcgatgt gagtgcgtag 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 154 acgcactcac atcgatttgg 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 155 aaatcgatgt ggttgccaag 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 156 tggcaaccac atcgatttgg 20 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 157 aaatcgatgt gtgcgaggag 20 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 158 cctcgcacac atcgatttgg 20 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 159 aaatcgatgt ggaacacgag 20 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 160 cgtgttccac atcgatttgg 20 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 161 aaatcgatgt gcttgtcgag 20 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 162 cgacaagcac atcgatttgg 20 <210> 163 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 163 aaatcgatgt gttccggtag 20 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 164 accggaacac atcgatttgg 20 <210> 165 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 165 aaatcgatgt gtgcgagcag 20 <210> 166 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 166 gctcgcacac atcgatttgg 20 <210> 167 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 167 aaatcgatgt ggtcaggtag 20 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 168 acctgaccac atcgatttgg 20 <210> 169 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 169 aaatcgatgt ggcctgttag 20 <210> 170 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 170 aacaggccac atcgatttgg 20 <210> 171 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 171 aaatcgatgt ggaacaccag 20 <210> 172 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 172 ggtgttccac atcgatttgg 20 <210> 173 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 173 aaatcgatgt gcttgtccag 20 <210> 174 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 174 ggacaagcac atcgatttgg 20 <210> 175 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 175 aaatcgatgt gtgcgagaag 20 <210> 176 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 176 tctcgcacac atcgatttgg 20 <210> 177 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 177 aaatcgatgt gagtgcggag 20 <210> 178 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 178 ccgcactcac atcgatttgg 20 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 179 aaatcgatgt gttgtccgag 20 <210> 180 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 180 cggacaacac atcgatttgg 20 <210> 181 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 181 aaatcgatgt gtggaacgag 20 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 182 cgttccacac atcgatttgg 20 <210> 183 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 183 aaatcgatgt gagtgcgaag 20 <210> 184 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 184 tcgcactcac atcgatttgg 20 <210> 185 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 185 aaatcgatgt gtggaaccag 20 <210> 186 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 186 ggttccacac atcgatttgg 20 <210> 187 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 187 aaatcgatgt gttaggcgag 20 <210> 188 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 188 cgcctaacac atcgatttgg 20 <210> 189 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 189 aaatcgatgt ggcctgtgag 20 <210> 190 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 190 cacaggccac atcgatttgg 20 <210> 191 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 191 aaatcgatgt gctcctgtag 20 <210> 192 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 192 acaggagcac atcgatttgg 20 <210> 193 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 193 aaatcgatgt ggtcaggcag 20 <210> 194 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 194 gcctgaccac atcgatttgg 20 <210> 195 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 195 aaatcgatgt ggtcaggaag 20 <210> 196 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 196 tcctgaccac atcgatttgg 20 <210> 197 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 197 aaatcgatgt ggtagccgag 20 <210> 198 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 198 cggctaccac atcgatttgg 20 <210> 199 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 199 aaatcgatgt ggcctgtaag 20 <210> 200 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 200 tacaggccac atcgatttgg 20 <210> 201 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 201 aaatcgatgt gctttcggag 20 <210> 202 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 202 ccgaaagcac atcgatttgg 20 <210> 203 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 203 aaatcgatgt gcgtaaggag 20 <210> 204 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 204 ccttacgcac atcgatttgg 20 <210> 205 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 205 aaatcgatgt gagagcgtag 20 <210> 206 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 206 acgctctcac atcgatttgg 20 <210> 207 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 207 aaatcgatgt ggacggcaag 20 <210> 208 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 208 tgccgtccac atcgatttgg 20 <210> 209 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 209 aaatcgatgt gctttcgcag 20 <210> 210 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 210 gcgaaagcac atcgatttgg 20 <210> 211 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 211 aaatcgatgt gcgtaagcag 20 <210> 212 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 212 gcttacgcac atcgatttgg 20 <210> 213 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 213 aaatcgatgt ggctatggag 20 <210> 214 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 214 ccatagccac atcgatttgg 20 <210> 215 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 215 aaatcgatgt gactctggag 20 <210> 216 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 216 ccagagtcac atcgatttgg 20 <210> 217 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 217 aaatcgatgt gctggaaag 19 <210> 218 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 218 ttccagcaca tcgatttgg 19 <210> 219 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 219 aaatcgatgt gccgaagtag 20 <210> 220 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 220 acttcggcac atcgatttgg 20 <210> 221 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 221 aaatcgatgt gctcctgaag 20 <210> 222 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 222 tcaggagcac atcgatttgg 20 <210> 223 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 223 aaatcgatgt gtccagtcag 20 <210> 224 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 224 gactggacac atcgatttgg 20 <210> 225 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 225 aaatcgatgt gagagcggag 20 <210> 226 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 226 ccgctctcac atcgatttgg 20 <210> 227 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 227 aaatcgatgt gagagcgaag 20 <210> 228 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 228 tcgctctcac atcgatttgg 20 <210> 229 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 229 aaatcgatgt gccgaaggag 20 <210> 230 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 230 ccttcggcac atcgatttgg 20 <210> 231 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 231 aaatcgatgt gccgaagcag 20 <210> 232 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 232 gcttcggcac atcgatttgg 20 <210> 233 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 233 aaatcgatgt gtgttccgag 20 <210> 234 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 234 cggaacacac atcgatttgg 20 <210> 235 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 235 aaatcgatgt gtctggcgag 20 <210> 236 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 236 cgccagacac atcgatttgg 20 <210> 237 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 237 aaatcgatgt gctatcggag 20 <210> 238 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 238 ccgatagcac atcgatttgg 20 <210> 239 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 239 aaatcgatgt gcgaaaggag 20 <210> 240 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 240 cctttcgcac atcgatttgg 20 <210> 241 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 241 aaatcgatgt gccgaagaag 20 <210> 242 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 242 tcttcggcac atcgatttgg 20 <210> 243 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 243 aaatcgatgt ggttgcagag 20 <210> 244 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 244 ctgcaaccac atcgatttgg 20 <210> 245 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 245 aaatcgatgt ggatggtgag 20 <210> 246 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 246 caccatccac atcgatttgg 20 <210> 247 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 247 aaatcgatgt gctatcgcag 20 <210> 248 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 248 gcgatagcac atcgatttgg 20 <210> 249 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 249 aaatcgatgt gcgaaagcag 20 <210> 250 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 250 gctttcgcac atcgatttgg 20 <210> 251 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 251 aaatcgatgt gacactggag 20 <210> 252 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 252 ccagtgtcac atcgatttgg 20 <210> 253 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 253 aaatcgatgt gtctggcaag 20 <210> 254 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 254 tgccagacac atcgatttgg 20 <210> 255 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 255 aaatcgatgt ggatggtcag 20 <210> 256 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 256 gaccatccac atcgatttgg 20 <210> 257 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 257 aaatcgatgt ggttgcacag 20 <210> 258 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 258 gtgcaaccac atcgatttgg 20 <210> 259 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 259 aaatcgatgt gggcatcgag 20 <210> 260 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 260 cgatgcccca tccgatttgg 20 <210> 261 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 261 aaatcgatgt gtgcctccag 20 <210> 262 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 262 ggaggcacac atcgatttgg 20 <210> 263 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 263 aaatcgatgt gtgcctcaag 20 <210> 264 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 264 tgaggcacac atcgatttgg 20 <210> 265 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 265 aaatcgatgt gggcatccag 20 <210> 266 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 266 ggatgcccac atcgatttgg 20 <210> 267 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 267 aaatcgatgt gggcatcaag 20 <210> 268 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 268 tgatgcccac atcgatttgg 20 <210> 269 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 269 aaatcgatgt gcctgtcgag 20 <210> 270 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 270 cgacaggcac atcgatttgg 20 <210> 271 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 271 aaatcgatgt ggacggatag 20 <210> 272 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 272 atccgtccac atcgatttgg 20 <210> 273 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 273 aaatcgatgt gcctgtccag 20 <210> 274 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 274 ggacaggcac atcgatttgg 20 <210> 275 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 275 aaatcgatgt gaagcacgag 20 <210> 276 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 276 cgtgcttcac atcgatttgg 20 <210> 277 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 277 aaatcgatgt gcctgtcaag 20 <210> 278 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 278 tgacaggcac atcgatttgg 20 <210> 279 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 279 aaatcgatgt gaagcaccag 20 <210> 280 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 280 ggtgcttcac atcgatttgg 20 <210> 281 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 281 aaatcgatgt gccttcgtag 20 <210> 282 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 282 acgaaggcac atcgatttgg 20 <210> 283 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 283 aaatcgatgt gtcgtccgag 20 <210> 284 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 284 cggacgacac atcgatttgg 20 <210> 285 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 285 aaatcgatgt ggagtctgag 20 <210> 286 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 286 cagactccac atcgatttgg 20 <210> 287 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 287 aaatcgatgt gtgatccgag 20 <210> 288 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 288 cggatcacac atcgatttgg 20 <210> 289 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 289 aaatcgatgt gtcaggcgag 20 <210> 290 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 290 cgcctgacac atcgatttgg 20 <210> 291 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 291 aaatcgatgt gtcgtccaag 20 <210> 292 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 292 tggacgacac atcgatttgg 20 <210> 293 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 293 aaatcgatgt ggacggagag 20 <210> 294 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 294 ctccgtccac atcgatttgg 20 <210> 295 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 295 aaatcgatgt ggtagcagag 20 <210> 296 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 296 ctgctaccac atcgatttgg 20 <210> 297 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 297 aaatcgatgt ggctgtgtag 20 <210> 298 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 298 acacagccac atcgatttgg 20 <210> 299 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 299 aaatcgatgt ggacggacag 20 <210> 300 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 300 gtccgtccac atcgatttgg 20 <210> 301 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 301 aaatcgatgt gtcaggcaag 20 <210> 302 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 302 tgcctgacac atcgatttgg 20 <210> 303 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 303 aaatcgatgt ggctcgaaag 20 <210> 304 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 304 ttcgagccac atcgatttgg 20 <210> 305 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 305 aaatcgatgt gccttcggag 20 <210> 306 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 306 ccgaaggcac atcgatttgg 20 <210> 307 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 307 aaatcgatgt ggtagcacag 20 <210> 308 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 308 gtgctaccac atcgatttgg 20 <210> 309 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 309 aaatcgatgt ggaaggtcag 20 <210> 310 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 310 gaccttccac atcgatttgg 20 <210> 311 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 311 aaatcgatgt ggtgctgtag 20 <210> 312 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 312 acagcaccac atcgatttgg 20 <210> 313 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 313 gttgcctgt 9 <210> 314 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 314 aggcaacct 9 <210> 315 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 315 caggacggt 9 <210> 316 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 316 cgtcctgct 9 <210> 317 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 317 agacgtggt 9 <210> 318 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 318 cacgtctct 9 <210> 319 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 319 caggaccgt 9 <210> 320 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 320 ggtcctgct 9 <210> 321 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 321 caggacagt 9 <210> 322 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 322 tgtcctgct 9 <210> 323 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 323 cactctggt 9 <210> 324 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 324 cagagtgct 9 <210> 325 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 325 gacggctgt 9 <210> 326 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 326 agccgtcct 9 <210> 327 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 327 cactctcgt 9 <210> 328 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 328 gagagtgct 9 <210> 329 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 329 gtagcctgt 9 <210> 330 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 330 aggctacct 9 <210> 331 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 331 gccacttgt 9 <210> 332 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 332 aagtggcct 9 <210> 333 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 333 catcgctgt 9 <210> 334 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 334 agcgatgct 9 <210> 335 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 335 cactggtgt 9 <210> 336 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 336 accagtgct 9 <210> 337 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 337 gccactggt 9 <210> 338 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 338 cagtggcct 9 <210> 339 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 339 tctggctgt 9 <210> 340 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 340 agccagact 9 <210> 341 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 341 gccactcgt 9 <210> 342 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 342 gagtggcct 9 <210> 343 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 343 tgcctctgt 9 <210> 344 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 344 agaggcact 9 <210> 345 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 345 catcgcagt 9 <210> 346 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 346 tgcgatgct 9 <210> 347 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 347 caggaaggt 9 <210> 348 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 348 cttcctgct 9 <210> 349 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 349 ggcatctgt 9 <210> 350 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 350 agatgccct 9 <210> 351 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 351 cggtgctgt 9 <210> 352 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 352 agcaccgct 9 <210> 353 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 353 cactggcgt 9 <210> 354 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 354 gccagtgct 9 <210> 355 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 355 tctcctcgt 9 <210> 356 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 356 gaggagact 9 <210> 357 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 357 cctgtctgt 9 <210> 358 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 358 agacaggct 9 <210> 359 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 359 caacgctgt 9 <210> 360 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 360 agcgttgct 9 <210> 361 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 361 tgcctcggt 9 <210> 362 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 362 cgaggcact 9 <210> 363 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 363 acactgcgt 9 <210> 364 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 364 gcagtgtct 9 <210> 365 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 365 tcgtcctgt 9 <210> 366 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 366 aggacgact 9 <210> 367 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 367 gctgccagt 9 <210> 368 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 368 tggcagcct 9 <210> 369 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 369 tcaggctgt 9 <210> 370 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 370 agcctgact 9 <210> 371 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 371 gccaggtgt 9 <210> 372 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 372 acctggcct 9 <210> 373 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 373 cggacctgt 9 <210> 374 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 374 aggtccgct 9 <210> 375 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 375 caacgcagt 9 <210> 376 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 376 tgcgttgct 9 <210> 377 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 377 cacacgagt 9 <210> 378 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 378 tcgtgtgct 9 <210> 379 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 379 atggcctgt 9 <210> 380 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 380 aggccatct 9 <210> 381 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 381 ccagtctgt 9 <210> 382 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 382 agactggct 9 <210> 383 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 383 gccaggagt 9 <210> 384 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 384 tcctggcct 9 <210> 385 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 385 cggaccagt 9 <210> 386 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 386 tggtccgct 9 <210> 387 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 387 ccttcgcgt 9 <210> 388 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 388 gcgaaggct 9 <210> 389 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 389 gcagccagt 9 <210> 390 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 390 tggctgcct 9 <210> 391 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 391 ccagtcggt 9 <210> 392 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 392 cgactggct 9 <210> 393 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 393 actgagcgt 9 <210> 394 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 394 gctcagtct 9 <210> 395 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 395 ccagtccgt 9 <210> 396 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 396 ggactggct 9 <210> 397 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 397 ccagtcagt 9 <210> 398 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 398 tgactggct 9 <210> 399 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 399 catcgaggt 9 <210> 400 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 400 ctcgatgct 9 <210> 401 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 401 ccatcgtgt 9 <210> 402 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 402 acgatggct 9 <210> 403 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 403 gtgctgcgt 9 <210> 404 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 404 gcagcacct 9 <210> 405 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 405 gactacggt 9 <210> 406 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 406 cgtagtcct 9 <210> 407 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 407 gtgctgagt 9 <210> 408 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 408 tcagcacct 9 <210> 409 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 409 gctgcatgt 9 <210> 410 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 410 atgcagcct 9 <210> 411 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 411 gagtggtgt 9 <210> 412 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 412 accactcct 9 <210> 413 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 413 gactaccgt 9 <210> 414 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 414 ggtagtcct 9 <210> 415 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 415 cggtgatgt 9 <210> 416 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 416 atcaccgct 9 <210> 417 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 417 tgcgactgt 9 <210> 418 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 418 agtcgcact 9 <210> 419 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 419 tctggaggt 9 <210> 420 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 420 ctccagact 9 <210> 421 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 421 agcactggt 9 <210> 422 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 422 cagtgctct 9 <210> 423 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 423 tcgcttggt 9 <210> 424 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 424 caagcgact 9 <210> 425 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 425 agcactcgt 9 <210> 426 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 426 gagtgctct 9 <210> 427 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 427 gcgattggt 9 <210> 428 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 428 caatcgcct 9 <210> 429 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 429 ccatcgcgt 9 <210> 430 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 430 gcgatggct 9 <210> 431 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 431 tcgcttcgt 9 <210> 432 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 432 gaagcgact 9 <210> 433 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 433 agtgcctgt 9 <210> 434 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 434 aggcactct 9 <210> 435 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 435 ggcataggt 9 <210> 436 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 436 ctatgccct 9 <210> 437 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 437 gcgattcgt 9 <210> 438 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 438 gaatcgcct 9 <210> 439 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 439 tgcgacggt 9 <210> 440 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 440 cgtcgcact 9 <210> 441 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 441 gagtggcgt 9 <210> 442 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 442 gccactcct 9 <210> 443 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 443 cggtgaggt 9 <210> 444 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 444 ctcaccgct 9 <210> 445 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 445 gctgcaagt 9 <210> 446 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 446 ttgcagcct 9 <210> 447 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 447 ttccgctgt 9 <210> 448 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 448 agcggaact 9 <210> 449 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 449 gagtggagt 9 <210> 450 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 450 tccactcct 9 <210> 451 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 451 acagagcgt 9 <210> 452 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 452 gctctgtct 9 <210> 453 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 453 tgcgaccgt 9 <210> 454 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 454 ggtcgcact 9 <210> 455 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 455 cctgtaggt 9 <210> 456 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 456 ctacaggct 9 <210> 457 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 457 tagccgtgt 9 <210> 458 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 458 acggctact 9 <210> 459 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 459 tgcgacagt 9 <210> 460 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 460 tgtcgcact 9 <210> 461 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 461 ggtctgtgt 9 <210> 462 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 462 acagaccct 9 <210> 463 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 463 cggtgaagt 9 <210> 464 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 464 ttcaccgct 9 <210> 465 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 465 caacgaggt 9 <210> 466 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 466 ctcgttgct 9 <210> 467 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 467 gcagcatgt 9 <210> 468 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 468 atgctgcct 9 <210> 469 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 469 tcgtcaggt 9 <210> 470 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 470 ctgacgact 9 <210> 471 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 471 agtgccagt 9 <210> 472 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 472 tggcactct 9 <210> 473 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 473 tagaggcgt 9 <210> 474 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 474 gcctctact 9 <210> 475 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 475 gtcagcggt 9 <210> 476 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 476 cgctgacct 9 <210> 477 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 477 tcaggaggt 9 <210> 478 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 478 ctcctgact 9 <210> 479 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 479 agcaggtgt 9 <210> 480 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 480 acctgctct 9 <210> 481 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 481 ttccgcagt 9 <210> 482 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 482 tgcggaact 9 <210> 483 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 483 gtcagccgt 9 <210> 484 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 484 ggctgacct 9 <210> 485 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 485 ggtctgcgt 9 <210> 486 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 486 gcagaccct 9 <210> 487 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 487 tagccgagt 9 <210> 488 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 488 tcggctact 9 <210> 489 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 489 gtcagcagt 9 <210> 490 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 490 tgctgacct 9 <210> 491 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 491 ggtctgagt 9 <210> 492 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 492 tcagaccct 9 <210> 493 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 493 cggacaggt 9 <210> 494 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 494 ctgtccgct 9 <210> 495 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 495 ttagccggt 9 <210> 496 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 496 cggctaact 9 <210> 497 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 497 gagacgagt 9 <210> 498 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 498 tcgtctcct 9 <210> 499 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 499 cgtaaccgt 9 <210> 500 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 500 ggttacgct 9 <210> 501 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 501 ttggcgtgt 9 <210> 502 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 502 acgccaact 9 <210> 503 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 503 atggcaggt 9 <210> 504 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 504 ctgccatct 9 <210> 505 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 505 cagctacga 9 <210> 506 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 506 gtagctgac 9 <210> 507 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 507 ctcctgcga 9 <210> 508 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 508 gcaggagac 9 <210> 509 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 509 gctgcctga 9 <210> 510 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 510 aggcagcac 9 <210> 511 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 511 caggaacga 9 <210> 512 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 512 gttcctgac 9 <210> 513 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 513 cacacgcga 9 <210> 514 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 514 gcgtgtgac 9 <210> 515 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 515 gcagcctga 9 <210> 516 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 516 aggctgcac 9 <210> 517 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 517 ctgaacgga 9 <210> 518 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 518 cgttcagac 9 <210> 519 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 519 ctgaaccga 9 <210> 520 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 520 ggttcagac 9 <210> 521 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 521 tctggacga 9 <210> 522 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 522 gtccagaac 9 <210> 523 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 523 tgcctacga 9 <210> 524 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 524 gtaggcaac 9 <210> 525 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 525 ggcatacga 9 <210> 526 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 526 gtatgccac 9 <210> 527 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 527 cggtgacga 9 <210> 528 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 528 gtcaccgac 9 <210> 529 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 529 caacgacga 9 <210> 530 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 530 gtcgttgac 9 <210> 531 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 531 ctcctctga 9 <210> 532 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 532 agaggagac 9 <210> 533 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 533 tcaggacga 9 <210> 534 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 534 gtcctgaac 9 <210> 535 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 535 aaaggcgga 9 <210> 536 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 536 cgcctttac 9 <210> 537 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 537 ctcctcgga 9 <210> 538 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 538 cgaggagac 9 <210> 539 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 539 cagatgcga 9 <210> 540 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 540 gcatctgac 9 <210> 541 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 541 gcagcaaga 9 <210> 542 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 542 ttgctgcac 9 <210> 543 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 543 gtggagtga 9 <210> 544 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 544 actccacac 9 <210> 545 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 545 ccagtagga 9 <210> 546 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 546 ctactggac 9 <210> 547 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 547 atggcacga 9 <210> 548 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 548 gtgccatac 9 <210> 549 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 549 ggactgtga 9 <210> 550 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 550 acagtccac 9 <210> 551 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 551 ccgaactga 9 <210> 552 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 552 agttcggac 9 <210> 553 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 553 ctcctcaga 9 <210> 554 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 554 tgaggagac 9 <210> 555 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 555 cactgctga 9 <210> 556 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 556 agcagtgac 9 <210> 557 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 557 agcaggcga 9 <210> 558 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 558 gcctgctac 9 <210> 559 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 559 agcaggaga 9 <210> 560 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 560 tcctgctac 9 <210> 561 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 561 agagccaga 9 <210> 562 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 562 tggctctac 9 <210> 563 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 563 gtcgttgga 9 <210> 564 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 564 caacgacac 9 <210> 565 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 565 ccgaacgga 9 <210> 566 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 566 cgttcggac 9 <210> 567 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 567 cactgcgga 9 <210> 568 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 568 cgcagtgac 9 <210> 569 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 569 gtggagcga 9 <210> 570 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 570 gctccacac 9 <210> 571 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 571 gtggagaga 9 <210> 572 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 572 tctccacac 9 <210> 573 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 573 ggactgcga 9 <210> 574 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 574 gcagtccac 9 <210> 575 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 575 ccgaaccga 9 <210> 576 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 576 ggttcggac 9 <210> 577 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 577 cactgccga 9 <210> 578 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 578 ggcagtgac 9 <210> 579 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 579 cgaaacgga 9 <210> 580 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 580 cgtttcgac 9 <210> 581 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 581 ggactgaga 9 <210> 582 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 582 tcagtccac 9 <210> 583 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 583 ccgaacaga 9 <210> 584 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 584 tgttcggac 9 <210> 585 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 585 cgaaaccga 9 <210> 586 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 586 ggtttcgac 9 <210> 587 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 587 ctggcttga 9 <210> 588 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 588 aagccagac 9 <210> 589 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 589 cacacctga 9 <210> 590 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 590 aggtgtgac 9 <210> 591 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 591 aacgaccga 9 <210> 592 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 592 ggtcgttac 9 <210> 593 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 593 atccagcga 9 <210> 594 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 594 gctggatac 9 <210> 595 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 595 tgcgaagga 9 <210> 596 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 596 cttcgcaac 9 <210> 597 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 597 tgcgaacga 9 <210> 598 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 598 gttcgcaac 9 <210> 599 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 599 ctggctgga 9 <210> 600 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 600 cagccagac 9 <210> 601 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 601 cacaccgga 9 <210> 602 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 602 cggtgtgac 9 <210> 603 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 603 agtgcagga 9 <210> 604 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 604 ctgcactac 9 <210> 605 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 605 gaccgttga 9 <210> 606 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 606 aacggtcac 9 <210> 607 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 607 ggtgagtga 9 <210> 608 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 608 actcaccac 9 <210> 609 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 609 ccttcctga 9 <210> 610 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 610 aggaaggac 9 <210> 611 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 611 ctggctaga 9 <210> 612 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 612 tagccagac 9 <210> 613 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 613 cacaccaga 9 <210> 614 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 614 tggtgtgac 9 <210> 615 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 615 agcggtaga 9 <210> 616 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 616 taccgctac 9 <210> 617 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 617 gtcagagga 9 <210> 618 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 618 ctctgacac 9 <210> 619 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 619 ttccgacga 9 <210> 620 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 620 gtcggaaac 9 <210> 621 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 621 aggcgtaga 9 <210> 622 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 622 tacgcctac 9 <210> 623 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 623 ctcgactga 9 <210> 624 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 624 agtcgagac 9 <210> 625 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 625 tacgctgga 9 <210> 626 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 626 cagcgtaac 9 <210> 627 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 627 gttcggtga 9 <210> 628 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 628 accgaacac 9 <210> 629 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 629 gccagcaga 9 <210> 630 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 630 tgctggcac 9 <210> 631 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 631 gaccgtaga 9 <210> 632 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 632 tacggtcac 9 <210> 633 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 633 gtgctctga 9 <210> 634 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 634 agagcacac 9 <210> 635 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 635 ggtgagcga 9 <210> 636 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 636 gctcaccac 9 <210> 637 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 637 ggtgagaga 9 <210> 638 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 638 tctcaccac 9 <210> 639 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 639 ccttccaga 9 <210> 640 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 640 tggaaggac 9 <210> 641 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 641 ctcctacga 9 <210> 642 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 642 gtaggagac 9 <210> 643 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 643 ctcgacgga 9 <210> 644 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 644 cgtcgagac 9 <210> 645 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 645 gccgtttga 9 <210> 646 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 646 aaacggcac 9 <210> 647 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 647 gcggagtga 9 <210> 648 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 648 actccgcac 9 <210> 649 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 649 cgtgcttga 9 <210> 650 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 650 aagcacgac 9 <210> 651 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 651 ctcgaccga 9 <210> 652 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 652 ggtcgagac 9 <210> 653 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 653 agagcagga 9 <210> 654 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 654 ctgctctac 9 <210> 655 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 655 gtgctcgga 9 <210> 656 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 656 cgagcacac 9 <210> 657 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 657 ctcgacaga 9 <210> 658 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 658 tgtcgagac 9 <210> 659 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 659 ggagagtga 9 <210> 660 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 660 actctccac 9 <210> 661 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 661 aggctgtga 9 <210> 662 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 662 acagcctac 9 <210> 663 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 663 agagcacga 9 <210> 664 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 664 gtgctctac 9 <210> 665 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 665 ccatcctga 9 <210> 666 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 666 aggatggac 9 <210> 667 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 667 gttcggaga 9 <210> 668 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 668 tccgaacac 9 <210> 669 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 669 tggtagcga 9 <210> 670 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 670 gctaccaac 9 <210> 671 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 671 gtgctccga 9 <210> 672 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 672 ggagcacac 9 <210> 673 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 673 gtgctcaga 9 <210> 674 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 674 tgagcacac 9 <210> 675 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 675 gccgttgga 9 <210> 676 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 676 caacggcac 9 <210> 677 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 677 gagtgctga 9 <210> 678 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 678 agcactcac 9 <210> 679 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 679 gctccttga 9 <210> 680 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 680 aaggagcac 9 <210> 681 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 681 ccgaaagga 9 <210> 682 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 682 ctttcggac 9 <210> 683 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 683 cactgagga 9 <210> 684 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 684 ctcagtgac 9 <210> 685 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 685 cgtgctgga 9 <210> 686 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 686 cagcacgac 9 <210> 687 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 687 ccgaaacga 9 <210> 688 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 688 gtttcggac 9 <210> 689 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 689 gcggagaga 9 <210> 690 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 690 tctccgcac 9 <210> 691 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 691 gccgttaga 9 <210> 692 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 692 taacggcac 9 <210> 693 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 693 tctcgtgga 9 <210> 694 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 694 cacgagaac 9 <210> 695 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 695 cgtgctaga 9 <210> 696 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 696 tagcacgac 9 <210> 697 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 697 gcctgtctt 9 <210> 698 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 698 gacaggctc 9 <210> 699 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 699 ctcctggtt 9 <210> 700 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 700 ccaggagtc 9 <210> 701 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 701 actctgctt 9 <210> 702 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 702 gcagagttc 9 <210> 703 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 703 catcgcctt 9 <210> 704 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 704 ggcgatgtc 9 <210> 705 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 705 gccactatt 9 <210> 706 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 706 tagtggctc 9 <210> 707 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 707 cacacggtt 9 <210> 708 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 708 ccgtgtgtc 9 <210> 709 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 709 caacgcctt 9 <210> 710 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 710 ggcgttgtc 9 <210> 711 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 711 actgaggtt 9 <210> 712 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 712 cctcagttc 9 <210> 713 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 713 gtgctggtt 9 <210> 714 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 714 ccagcactc 9 <210> 715 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 715 catcgactt 9 <210> 716 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 716 gtcgatgtc 9 <210> 717 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 717 ccatcggtt 9 <210> 718 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 718 ccgatggtc 9 <210> 719 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 719 gctgcactt 9 <210> 720 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 720 gtgcagctc 9 <210> 721 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 721 acagaggtt 9 <210> 722 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 722 cctctgttc 9 <210> 723 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 723 agtgccgtt 9 <210> 724 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 724 cggcacttc 9 <210> 725 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 725 cggacattt 9 <210> 726 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 726 atgtccgtc 9 <210> 727 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 727 ggtctggtt 9 <210> 728 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 728 ccagacctc 9 <210> 729 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 729 gagacggtt 9 <210> 730 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 730 ccgtctctc 9 <210> 731 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 731 ctttccgtt 9 <210> 732 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 732 cggaaagtc 9 <210> 733 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 733 cagatggtt 9 <210> 734 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 734 ccatctgtc 9 <210> 735 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 735 cggacactt 9 <210> 736 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 736 gtgtccgtc 9 <210> 737 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 737 actctcgtt 9 <210> 738 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 738 cgagagttc 9 <210> 739 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 739 gcagcactt 9 <210> 740 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 740 gtgctgctc 9 <210> 741 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 741 actctcctt 9 <210> 742 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 742 ggagagttc 9 <210> 743 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 743 accttggtt 9 <210> 744 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 744 ccaaggttc 9 <210> 745 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 745 agagccgtt 9 <210> 746 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 746 cggctcttc 9 <210> 747 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 747 accttgctt 9 <210> 748 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 748 gcaaggttc 9 <210> 749 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 749 aagtccgtt 9 <210> 750 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 750 cggactttc 9 <210> 751 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 751 ggactggtt 9 <210> 752 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 752 ccagtcctc 9 <210> 753 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 753 gtcgttctt 9 <210> 754 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 754 gaacgactc 9 <210> 755 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 755 cagcatctt 9 <210> 756 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 756 gatgctgtc 9 <210> 757 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 757 ctatccgtt 9 <210> 758 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 758 cggatagtc 9 <210> 759 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 759 acactcgtt 9 <210> 760 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 760 cgagtgttc 9 <210> 761 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 761 atccaggtt 9 <210> 762 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 762 cctggattc 9 <210> 763 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 763 gttcctgtt 9 <210> 764 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 764 caggaactc 9 <210> 765 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 765 acactcctt 9 <210> 766 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 766 ggagtgttc 9 <210> 767 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 767 gttcctctt 9 <210> 768 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 768 gaggaactc 9 <210> 769 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 769 ctggctctt 9 <210> 770 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 770 gagccagtc 9 <210> 771 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 771 acggcattt 9 <210> 772 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 772 atgccgttc 9 <210> 773 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 773 ggtgaggtt 9 <210> 774 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 774 cctcacctc 9 <210> 775 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 775 ccttccgtt 9 <210> 776 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 776 cggaaggtc 9 <210> 777 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 777 tacgctctt 9 <210> 778 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 778 gagcgtatc 9 <210> 779 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 779 acggcagtt 9 <210> 780 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 780 ctgccgttc 9 <210> 781 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 781 actgacgtt 9 <210> 782 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 782 cgtcagttc 9 <210> 783 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 783 acggcactt 9 <210> 784 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 784 gtgccgttc 9 <210> 785 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 785 actgacctt 9 <210> 786 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 786 ggtcagttc 9 <210> 787 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 787 tttgcggtt 9 <210> 788 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 788 ccgcaaatc 9 <210> 789 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 789 tggtaggtt 9 <210> 790 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 790 cctaccatc 9 <210> 791 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 791 gttcggctt 9 <210> 792 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 792 gccgaactc 9 <210> 793 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 793 gccgttctt 9 <210> 794 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 794 gaacggctc 9 <210> 795 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 795 ggagaggtt 9 <210> 796 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 796 cctctcctc 9 <210> 797 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 797 cactgactt 9 <210> 798 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 798 gtcagtgtc 9 <210> 799 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 799 cgtgctctt 9 <210> 800 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 800 gagcacgtc 9 <210> 801 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 801 aatccgctt 9 <210> 802 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 802 gcggatttc 9 <210> 803 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 803 aggctggtt 9 <210> 804 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 804 ccagccttc 9 <210> 805 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 805 gctagtgtt 9 <210> 806 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 806 cactagctc 9 <210> 807 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 807 ggagagctt 9 <210> 808 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 808 gctctcctc 9 <210> 809 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 809 ggagagatt 9 <210> 810 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 810 tctctcctc 9 <210> 811 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 811 aggctgctt 9 <210> 812 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 812 gcagccttc 9 <210> 813 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 813 gagtgcgtt 9 <210> 814 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 814 cgcactctc 9 <210> 815 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 815 ccatccatt 9 <210> 816 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 816 tggatggtc 9 <210> 817 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 817 gctagtctt 9 <210> 818 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 818 gactagctc 9 <210> 819 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 819 aggctgatt 9 <210> 820 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 820 tcagccttc 9 <210> 821 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 821 acagacgtt 9 <210> 822 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 822 cgtctgttc 9 <210> 823 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 823 gagtgcctt 9 <210> 824 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 824 ggcactctc 9 <210> 825 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 825 acagacctt 9 <210> 826 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 826 ggtctgttc 9 <210> 827 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 827 cgagctttt 9 <210> 828 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 828 aagctcgtc 9 <210> 829 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 829 ttagcggtt 9 <210> 830 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 830 ccgctaatc 9 <210> 831 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 831 cctcttgtt 9 <210> 832 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 832 caagaggtc 9 <210> 833 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 833 ggtctcttt 9 <210> 834 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 834 agagacctc 9 <210> 835 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 835 gccagattt 9 <210> 836 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 836 atctggctc 9 <210> 837 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 837 gagaccttt 9 <210> 838 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 838 aggtctctc 9 <210> 839 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 839 cacacagtt 9 <210> 840 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 840 ctgtgtgtc 9 <210> 841 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 841 cctcttctt 9 <210> 842 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 842 gaagaggtc 9 <210> 843 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 843 tagagcgtt 9 <210> 844 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 844 cgctctatc 9 <210> 845 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 845 gcacctttt 9 <210> 846 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 846 aaggtgctc 9 <210> 847 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 847 ggcttgttt 9 <210> 848 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 848 acaagcctc 9 <210> 849 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 849 gacgcgatt 9 <210> 850 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 850 tcgcgtctc 9 <210> 851 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 851 cgagctgtt 9 <210> 852 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 852 cagctcgtc 9 <210> 853 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 853 tagagcctt 9 <210> 854 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 854 ggctctatc 9 <210> 855 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 855 catccgttt 9 <210> 856 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 856 acggatgtc 9 <210> 857 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 857 ggtctcgtt 9 <210> 858 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 858 cgagacctc 9 <210> 859 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 859 gccagagtt 9 <210> 860 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 860 ctctggctc 9 <210> 861 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 861 gagaccgtt 9 <210> 862 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 862 cggtctctc 9 <210> 863 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 863 cgagctatt 9 <210> 864 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 864 tagctcgtc 9 <210> 865 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 865 gcaagtgtt 9 <210> 866 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 866 cacttgctc 9 <210> 867 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 867 ggtctcctt 9 <210> 868 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 868 ggagacctc 9 <210> 869 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 869 gccagactt 9 <210> 870 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 870 gtctggctc 9 <210> 871 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 871 ggtctcatt 9 <210> 872 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 872 tgagacctc 9 <210> 873 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 873 gagaccatt 9 <210> 874 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 874 tggtctctc 9 <210> 875 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 875 ccttcagtt 9 <210> 876 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 876 ctgaaggtc 9 <210> 877 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 877 gcacctgtt 9 <210> 878 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 878 caggtgctc 9 <210> 879 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 879 aaaggcgtt 9 <210> 880 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 880 cgccttttc 9 <210> 881 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 881 cagatcgtt 9 <210> 882 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 882 cgatctgtc 9 <210> 883 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 883 cataggctt 9 <210> 884 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 884 gcctatgtc 9 <210> 885 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 885 ccttcactt 9 <210> 886 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 886 gtgaaggtc 9 <210> 887 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 887 gcacctctt 9 <210> 888 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 888 gaggtgctc 9 <210> 889 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 889 cagaagacag acaagcttca cctgc 25 <210> 890 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 890 gcaggtgaag cttgtctgtc ttctgaa 27 PPI-156CP 2

Claims

다음 단계를 포함하는, 코딩 올리고누클레오티드에 효과적으로 결합하는 작용 성분(functional moiety)을 포함하는 분자의 합성 방법

(a) n 빌딩 블록을 포함하는 개시 작용 성분으로 이루어진 개시 화합물을 제공하는 단계(여기에서, n 은 1 또는 그 보다 큰 정수이고, 상기 개시 작용 성분은 적어도 하나의 반응성 기를 포함하며, 개시 올리고누클레오티드에 효과적으로 결합한다) ;

(b) 적어도 하나의 상보적 반응성 기를 포함하는 빌딩 블록과 개시 화합물을 반응시키는 단계(여기에서, 공유 결합을 형성하기 위해 상보적 반응성 기의 반응에 적합한 조건 하에서, 적어도 하나의 상보적 반응성 기는 단계 (a) 의 반응성 기에 대하여 상보적이다) ;

(c) 코딩 올리고누클레오티드를 형성하기 위해 도입(incoming) 올리고누클레오티드 및 개시 올리고누클레오티드를 결합시키기 위한 적합한 조건 하에서, 상기 개시 올리고누클레오티드 및 도입 올리고누클레오티드의 결합을 촉진시키는 효소의 존재 하에 단계 (b) 의 빌딩 블록을 확인하는 도입 올리고누클레오티드와 개시 올리고누클레오티드를 반응시키는 단계

에 의해 n + 1 빌딩 블록을 포함하는, 코딩 올리고누클레오티드에 효과적으로 결합하는 작용 성분을 포함하는 분자를 생성한다.
제 1 항에 있어서, 단계 (c) 의 작용 성분은 반응성 기(reactive group)를 포함하며, 단계 (a) 내지 (c) 를 1 회 또는 그 이상으로 반복시켜서 사이클 1 내지 i(여기에서, i 는 2 또는 그 보다 큰 정수이다)를 형성하며, 여기에서 사이클 s 의 단계 (c) 의 산물(여기에서, s 는 i - 1 또는 그 보다 작은 정수이다)은 사이클 s + 1 의 개시 화합물임을 특징으로 하는 방법.
제 1 항에 있어서, 단계 (c) 가 단계 (b) 보다 앞서 일어나거나 또는 단계 (b) 가 단계 (c) 보다 앞서 일어남을 특징으로 하는 방법.
제 1 항에 있어서, 빌딩 블록 중 적어도 하나는 아미노산 또는 활성화된 아미노산임을 특징으로 하는 방법.
제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 아미노기 ; 카르복시기 ; 술포닐기 ; 포스포닐기 ; 에폭시드기 ; 아지리딘기 ; 및 이소시안에이트기 중에서 선택한 것임을 특징으로 하는 방법.
제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 히드록시기 ; 카르복시기 ; 술포닐기 ; 포스포닐기 ; 에폭시드기 ; 아지리딘기 ; 및 이소시안에이트기 중에서 선택한 것임을 특징으로 하는 방법.
제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 아미노기 및 알데히드 또는 케톤기 중에서 선택한 것임을 특징으로 하는 방법.
제 7 항에 있어서, 반응성 기와 상보적 반응성 기 사이의 반응은 환원(reducing) 조건 하에서 시행함을 특징으로 하는 방법.
제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 인 일리드기(phosphorous ylide group) 및 알데히드 또는 케톤기 중에서 선택한 것임을 특징으로 하는 방법.
제 1 항에 있어서, 반응성 기 및 상보적 반응성 기는 고리화첨가반응을 통해서 반응하여 고리형 구조를 형성함을 특징으로 하는 방법.
제 10 항에 있어서, 반응성 기 및 상보적 반응성 기는 알킨 및 아지드 중에서 선택한 것임을 특징으로 하는 방법.
제 10 항에 있어서, 반응성 기 및 상보적 반응성 기는 할로겐화 헤테로방향족기 및 친핵체(nucleophile) 중에서 선택한 것임을 특징으로 하는 방법.
제 12 항에 있어서, 할로겐화 헤테로방향족기는 염소화 피리미딘, 염소화 트리아진 및 염소화 푸린 중에서 선택한 것임을 특징으로 하는 방법.
제 12 항에 있어서, 친핵체는 아미노기임을 특징으로 하는 방법.
제 1 항에 있어서, 효소는 DNA 리가제, RNA 리가제, DNA 폴리머라제, RNA 폴리머라제 및 토포아이소머라제(topoisomerase) 중에서 선택한 것임을 특징으로 하는 방법.
제 1 항에 있어서, 개시 올리고누클레오티드는 이중-가닥 또는 단일-가닥임을 특징으로 하는 방법.
제 16 항에 있어서, 개시 올리고누클레오티드는 PCR 프라이머 서열을 포함함을 특징으로 하는 방법.
제 16 항에 있어서, 개시 올리고누클레오티드는 단일-가닥이고, 도입 올리고누클레오티드는 단일-가닥이거나 ; 또는 개시 올리고누클레오티드는 이중-가닥이고 도입 올리고누클레오티드가 이중-가닥임을 특징으로 하는 방법.
제 18 항에 있어서, 개시 작용 성분과 개시 올리고누클레오티드는 결합 성분에 의해 결합됨을 특징으로 하는 방법.
제 19 항에 있어서, 개시 올리고누클레오티드는 이중-가닥이고, 결합 성분은 개시 작용 성분 및 개시 올리고누클레오티드의 두 가닥에 공유 결합됨을 특징으로 하는 방법.
제 1 항에 있어서, 도입 올리고누클레오티드는 3 내지 10 개의 누클레오티드의 길이를 가짐을 특징으로 하는 방법.
제 2 항에 있어서, 사이클 i 의 도입 올리고누클레오티드는 PCR 종결 (closing) 프라이머를 포함함을 특징으로 하는 방법.
제 2 항에 있어서, 종결 PCR 프라이머 서열을 포함하는 올리고누클레오티드를 코딩 올리고누클레오티드에 결합시키는 단계 (d) 를 사이클 i 에 추가로 포함시킴을 특징으로 하는 방법.
제 23 항에 있어서, 결합을 촉진시키는 효소의 존재 하에, 종결 PCR 프라이머 서열을 포함하는 올리고누클레오티드를 코딩 올리고누클레오티드에 결합시킴을 특징으로 하는 방법.
제 2 항에 있어서, 작용 성분을 고리화시키는 단계 (e) 를 사이클 i 후에 추가로 포함함을 특징으로 하는 방법.
제 25 항에 있어서, 작용 성분은 알킨일기 및 아지도기를 포함하며, 트리아졸기를 형성하기 위해 알킨일기와 아지도기의 고리화첨가반응에 적합한 조건에서 화합물을 시행하여 상기 작용 성분을 고리화시킴을 특징으로 하는 방법.
다음 단계를 포함하는, 둘 또는 그 이상의 빌딩 블록을 포함하는 작용 성분의 구조를 확인하는 개시 올리고누클레오티드에 효과적으로 결합하는 상기 작용 성분을 포함하는 화합물의 라이브러리를 합성하는 방법

(a) m 개시 화합물을 포함하는 용액을 제공하는 단계(여기에서, m 은 1 또는 그 보다 큰 정수이고, 상기 개시 화합물은 n 빌딩 블록을 포함하는 작용 성분으로 이루어졌으며, 이 작용 성분은 n 빌딩 블록을 확인하는 개시 올리고누클레오티드에 효과적으로 결합하고, 여기에서, n 은 1 또는 그 보다 큰 정수이다) ;

(b) 단계 (a) 의 용액을 r 반응 용기 내로 분할하여 용액의 r 분할량 (r aliquots)을 생성하는 단계(여기에서, r 은 2 또는 그 보다 큰 정수이다) ;

(c) r 빌딩 블록 중 하나와 각 반응 용기에서의 개시 화합물을 반응시켜서 개시 올리고누클레오티드에 효과적으로 결합하는 n + 1 빌딩 블록을 포함하는 작용 성분으로 이루어진 화합물을 포함하는 r 분할량을 생성하는 단계 ;

(d) 도입 올리고누클레오티드 및 개시 올리고누클레오티드의 효소적 결합에 적합한 조건 하에서, 도입 올리고누클레오티드 및 개시 올리고누클레오티드의 결합을 촉진시키는 효소의 존재 하에 특정 r 도입 올리고누클레오티드 세트 중 하나와 각 분할량에서의 개시 올리고누클레오티드와 반응시키는 단계

에 의해 n + 1 빌딩 블록을 코드하는 신장시킨 올리고누클레오티드에 효과적으로 결합하는 n + 1 빌딩 블록을 포함하는 작용 성분으로 이루어진 분자를 포함하는 r 분할량을 생성한다.
제 27 항에 있어서, 둘 또는 그 이상의 r 분할량을 조합하여, n + 1 빌딩 블록을 포함하는, 상기 n + 1 빌딩 블록을 코드하는 신장시킨 올리고누클레오티드에 효과적으로 결합하는 작용 성분으로 이루어진 분자를 포함하는 용액을 생성하는 단계 (e) 를 추가로 포함함을 특징으로 하는 방법.
제 28 항에 있어서, r 분할량은 조합된 것임을 특징으로 하는 방법.
제 28 항에 있어서, 사이클 1 내지 i 를 수득하기 위해 단계 (a) 내지 (e) 를 1 또는 그 이상의 횟수로 시행하고, 여기에서, i 는 2 또는 그 보다 큰 정수이고, 사이클 s + 1 에서, s 는 i - 1 또는 그 보다 작은 정수이고, 단계 (a) 의 m 개시 화합물을 포함하는 용액은 사이클 s 의 단계 (e) 의 용액임을 특징으로 하는 방법.
제 7 항 또는 제 8 항에 있어서, 사이클 1 내지 i 중 적어도 하나에서, 단계 (d) 가 단계 (c) 보다 앞서 일어남을 특징으로 하는 방법.
제 28 항에 있어서, 빌딩 블록 중 적어도 하나가 아미노산임을 특징으로 하는 방법.
제 7 항에 있어서, 효소는 DNA 리가제, RNA 리가제, DNA 폴리머라제, RNA 폴리머라제 또는 토포아이소머라제임을 특징으로 하는 방법.
제 28 항에 있어서, 개시 올리고누클레오티드는 이중-가닥의 올리고누클레오티드임을 특징으로 하는 방법.
제 34 항에 있어서, 도입 올리고누클레오티드는 이중-가닥의 올리고누클레오티드임을 특징으로 하는 방법.
제 28 항에 있어서, 개시 화합물은 빌딩 블록과 함께 결합하는데 적합한 제 1 작용기, 올리고누클레오티드의 5' 말단에 결합하는데 적합한 제 2 작용기, 및 올리고누클레오티드의 3' 말단에 결합하는데 적합한 제 3 작용기를 포함하는 링커 성분을 포함함을 특징으로 하는 방법.
제 36 항에 있어서, 링커 성분은 다음의 구조를 나타냄을 특징으로 하는 방법

이 식에서,

A 는 빌딩 블록에 결합하는데 적합한 작용기이고 ;

B 는 올리고누클레오티드의 5'-말단에 결합하는데 적합한 작용기이고 ;

C 는 올리고누클레오티드의 3'-말단에 결합하는데 적합한 작용기이고 ;

S 는 원자 또는 스캐폴드(scaffold) 이고 ;

D 는 A 를 S 에 결합시키는 화학 구조물이고 ;

E 는 B 를 S 에 결합시키는 화학 구조물이며 ;

F 는 C 를 S 에 결합시키는 화학 구조물이다.
제 37 항에 있어서,

A 는 아미노기이고 ;

B 는 인산염기이며 ;

C 는 인산염기임

을 특징으로 하는 방법.
제 37 항에 있어서, D, E 및 F 는 각각 독립적으로 알킬렌기 또는 올리고(에틸렌 글리콜)기임을 특징으로 하는 방법.
제 37 항에 있어서, S 는 탄소 원자, 질소 원자, 인 원자, 붕소 원자, 인산염기, 시클로기 또는 폴리시클로기임을 특징으로 하는 방법.
제 40 항에 있어서, 링커 성분은 다음의 구조를 가짐을 특징으로 하는 방법

여기에서, 각각의 n, m 및 p 는 독립적으로 정수 1 내지 약 20 이다.
제 41 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 2 내지 8 임을 특징으로 하는 방법.
제 42 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 3 내지 6 임을 특징으로 하는 방법.
제 41 항에 있어서, 링커 성분은 다음의 구조를 가짐을 특징으로 하는 방법
제 27 항에 있어서, 각각의 개시 화합물은 반응성 기를 포함하고, 각각의 r 빌딩 블록은 상기 반응성 기에 상보적인 상보적 반응성 기를 포함함을 특징으로 하는 방법.
제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 아미노기 ; 카르복시기 ; 술포닐기 ; 포스포닐기 ; 에폭시드기 ; 아지리딘기 ; 및 이소시안에이트기 중에서 선택한 것임을 특징으로 하는 방법.
제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 히드록시기 ; 카르복시기 ; 술포닐기 ; 포스포닐기 ; 에폭시드기 ; 아지리딘기 ; 및 이소시안에이트기 중에서 선택한 것임을 특징으로 하는 방법.
제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 아미노기 및 알데히드 또는 케톤기 중에서 선택한 것임을 특징으로 하는 방법.
제 45 항에 있어서, 반응성 기와 상보적 반응성 기 사이의 반응은 환원(reducing) 조건 하에서 시행함을 특징으로 하는 방법.
제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 인 일리드기 및 알데히드 또는 케톤기 중에서 선택한 것임을 특징으로 하는 방법.
제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 고리화첨가반응을 통해서 반응하여 고리형 구조를 형성함을 특징으로 하는 방법.
제 51 항에 있어서, 반응성 기 및 상보적 반응성 기는 알킨 및 아지드 중에서 선택한 것임을 특징으로 하는 방법.
제 45 항에 있어서, 반응성 기 및 상보적 반응성 기는 할로겐화 헤테로방향족기 및 친핵체(nucleophile) 중에서 선택한 것임을 특징으로 하는 방법.
제 53 항에 있어서, 할로겐화 헤테로방향족기는 염소화 피리미딘, 염소화 트리아진 및 염소화 푸린 중에서 선택한 것임을 특징으로 하는 방법.
제 53 항에 있어서, 친핵체는 아미노기임을 특징으로 하는 방법.
제 28 항에 있어서, 사이클 i 후에, 하나 또는 그 이상의 작용 성분을 고리화반응시키는 단계 (f) 를 추가로 포함함을 특징으로 하는 방법.
제 56 항에 있어서, 단계 (f) 의 작용 성분은 아지도기 및 알킨일기를 포함함을 특징으로 하는 방법.
제 57 항에 있어서, 트리아졸기를 형성하기 위해 아지도기와 알킨일기가 고리화첨가반응하기에 적합한 조건 하에서 작용 성분을 유지하여 시클로 작용 성분을 형성함을 특징으로 하는 방법.
제 58 항에 있어서, 고리화첨가반응은 구리 촉매의 존재 하에 시행함을 특징으로 하는 방법.
제 59 항에 있어서, 단계 (f) 의 하나 또는 그 이상의 작용 성분 중 적어도 하나는 적어도 2 개의 술프히드릴기를 포함하고, 디설파이드기를 형성하기 위해, 상기 작용 성분을 2 개의 술프히드릴기의 반응에 적합한 조건 하에서 유지하여 작용 성분을 고리화반응시킴을 특징으로 하는 방법.
제 27 항에 있어서, 개시 올리고누클레오티드는 PCR 프라이머 서열을 포함함을 특징으로 하는 방법.
제 28 항에 있어서, 사이클 i 의 도입 올리고누클레오티드는 PCR 종결 (closing) 프라이머를 포함함을 특징으로 하는 방법.
제 28 항에 있어서, 사이클 i 후에, 종결(closing) PCR 프라이머 서열을 포함하는 올리고누클레오티드를 코딩 올리고누클레오티드에 결합시키는 단계 (d) 를 추가로 포함함을 특징으로 하는 방법.
제 63 항에 있어서, 종결 PCR 프라이머 서열을 포함하는 올리고누클레오티드를, 결합을 촉진시키는 효소의 존재 하에 코딩 올리고누클레오티드에 결합시킴을 특징으로 하는 방법.
다음 화학식 Ⅰ 의 화합물

화학식 Ⅰ

이 식에서,

X 는 하나 또는 그 이상의 빌딩 블록을 포함하는 작용 성분이고 ;

Z 는 3' 말단에서 B 에 결합된 올리고누클레오티드이고 ;

Y 는 5' 말단에서 C 에 결합된 올리고누클레오티드이고 ;

A 는 X 와 공유결합을 형성하는 작용기이고 ;

B 는 Z 의 3'-말단과 결합을 형성하는 작용기이고 ;

C 는 Y 의 5'-말단과 결합을 형성하는 작용기이고 ;

D, F 및 E 각각은 독립적으로 이작용기성 결합기(bifunctional linking group)이며 ;

S 는 원자 또는 분자 스캐폴드(molecular scaffold)이다.
제 65 항에 있어서, D, E 및 F 는 각각 독립적으로 알킬렌쇄 또는 올리고(에틸렌 글리콜)쇄임을 특징으로 하는 화합물.
제 65 항에 있어서, Y 및 Z 는 실질적으로 상보적이며, 적절한 조건 하에서 왓슨-크릭 염기쌍(Watson-Crick base pairing) 및 이중가닥 형성이 가능해지도록 화합물에서 방향이 정해져 있음(oriented)을 특징으로 하는 화합물.
제 65 항에 있어서, Y 및 Z 는 길이가 동일하거나 상이함을 특징으로 하는 화합물.
제 68 항에 있어서, Y 및 Z 는 길이가 동일함을 특징으로 하는 화합물.
제 65 항에 있어서, Y 및 Z 는 각각 10 또는 그 이상의 염기 길이를 가지며, 10 또는 그 이상의 염기쌍의 상보적 영역을 가짐을 특징으로 하는 화합물.
제 65 항에 있어서, S 는 탄소 원자, 붕소 원자, 질소 원자, 인 원자, 또는 다원자 스캐폴드(polyatomic scaffold)임을 특징으로 하는 화합물.
제 71 항에 있어서, S 는 인산염기 또는 시클로기임을 특징으로 하는 화합물.
제 72 항에 있어서, S 는 시클로알킬, 시클로알켄일, 헤테로시클로알킬, 헤테로시클로알켄일, 아릴 또는 헤테로아릴기임을 특징으로 하는 화합물.
제 65 항에 있어서, 링커 성분은 다음의 구조임을 특징으로 하는 화합물

여기에서, 각각의 n, m 및 p 는 독립적으로 정수 1 내지 약 20 이다.
제 74 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 2 내지 8 임을 특징으로 하는 화합물.
제 75 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 3 내지 6 임을 특징으로 하는 화합물.
제 65 항에 있어서, 링커 성분은 다음의 구조를 가짐을 특징으로 하는 화합물
제 65 항에 있어서, X 및 Y 는 PCR 프라이머 서열을 포함함을 특징으로 하는 화합물.
적어도 약 10² 개의 특정 화합물을 포함하는 화합물 라이브러리이되, 상기 특정 화합물은 둘 또는 그 이상의 빌딩 블록을 포함하는 작용 성분을 포함하며, 상기 작용 성분의 구조를 확인하는 올리고누클레오티드에 효과적으로 결합하는 상기 작용 성분을 포함하는 화합물 라이브러리.
제 79 항에 있어서, 라이브러리는 각각의 특정 화합물의 적어도 약 10⁵ 개의 복사물을 포함함을 특징으로 하는 화합물 라이브러리.
제 79 항에 있어서, 라이브러리는 각각의 특정 화합물의 적어도 약 10⁶ 개의 복사물을 포함함을 특징으로 하는 화합물 라이브러리.
제 79 항에 있어서, 적어도 약 10⁴ 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
제 79 항에 있어서, 적어도 약 10⁶ 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
제 79 항에 있어서, 적어도 약 10⁸ 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
제 79 항에 있어서, 적어도 약 10¹⁰ 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
제 79 항에 있어서, 적어도 약 10¹² 개의 특정 화합물을 포함함을 특징으로 하는 화합물 라이브러리.
제 79 항에 있어서, 상기 라이브러리는 독립적으로 다음 화학식 Ⅰ을 갖는 다수의 화합물을 포함함을 특징으로 하는 화합물 라이브러리

화학식 Ⅰ

이 식에서,

X 는 하나 또는 그 이상의 빌딩 블록을 포함하는 작용 성분이고 ;

Z 는 3' 말단에서 B 에 결합된 올리고누클레오티드이고 ;

Y 는 5' 말단에서 C 에 결합된 올리고누클레오티드이고 ;

A 는 X 와 공유결합을 형성하는 작용기이고 ;

B 는 Z 의 3'-말단과 결합을 형성하는 작용기이고 ;

C 는 Y 의 5'-말단과 결합을 형성하는 작용기이고 ;

D, F 및 E 각각은 독립적으로 이작용기성 결합기이며 ;

S 는 원자 또는 분자 스캐폴드(molecular scaffold)이다.
제 87 항에 있어서, A, B, C, D, E, F 및 S 각각은 화학식 Ⅰ 의 각각의 화합물과 동일한 동일성(identity)을 가짐을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, 라이브러리는 화학식 Ⅰ을 갖는 다수의 화합물을 필수적으로 함유함을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, D, E 및 F 는 각각 독립적으로 알킬렌쇄 또는 올리고(에틸렌 글리콜)쇄임을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, Y 및 Z 는 실질적으로 상보적이며, 적절한 조건 하에서 왓슨-크릭 염기쌍(Watson-Crick base pairing) 및 이중가닥 형성이 가능해지도록 화합물에서 방향이 정해져 있음을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, Y 및 Z 는 길이가 동일하거나 상이함을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, Y 및 Z 는 길이가 동일함을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, Y 및 Z 는 각각 10 또는 그 이상의 염기 길이를 가지며, 10 또는 그 이상의 염기쌍의 상보적 영역을 가짐을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, S 는 탄소 원자, 붕소 원자, 질소 원자, 인 원자, 또는 다원자 스캐폴드(polyatomic scaffold)임을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, S 는 인산염기 또는 시클로기임을 특징으로 하는 화합물 라이브러리.
제 96 항에 있어서, S 는 시클로알킬, 시클로알켄일, 헤테로시클로알킬, 헤테로시클로알켄일, 아릴 또는 헤테로아릴기임을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, 링커 성분은 다음의 구조임을 특징으로 하는 화합물 라이브러리

여기에서, 각각의 n, m 및 p 는 독립적으로 정수 1 내지 약 20 이다.
제 98 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 2 내지 8 임을 특징으로 하는 화합물 라이브러리.
제 99 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 3 내지 6 임을 특징으로 하는 화합물 라이브러리.
제 87 항에 있어서, 링커 성분은 다음의 구조를 가짐을 특징으로 하는 화합물 라이브러리
제 87 항에 있어서, X 및 Z 는 PCR 프라이머 서열을 포함함을 특징으로 하는 화합물 라이브러리.
제 1 항의 방법으로 제조된 화합물.
제 27 항의 방법으로 제조된 화합물 라이브러리.
다음 단계를 포함하는, 생물학적 표적에 결합하는 하나 또는 그 이상의 화합물을 확인하는 방법

(a) 화합물 라이브러리 중 적어도 하나의 구성요소(member)가 생물학적 표적에 결합하는데 적합한 조건 하에서, 제 27 항의 방법으로 제조된 화합물 라이브러리와 상기 생물학적 표적을 접촉시키는 단계 ;

(b) 생물학적 표적에 결합하지 않은 라이브러리 구성요소를 제거하는 단계 ;

(c) 생물학적 표적에 결합하는 화합물 라이브러리 중 적어도 하나의 구성요소의 코딩 올리고누클레오티드를 증폭시키는 단계 ;

(d) 단계 (c) 의 코딩 올리고누클레오티드의 서열을 결정하는 단계 ; 및

(e) 생물학적 표적에 결합하는 화합물 라이브러리 중 구성요소의 작용 성분의 구조를 측정하기 위해 단계 (d) 에서 결정된 서열을 사용하는 단계

에 의해 상기 생물학적 표적에 결합하는 하나 또는 그 이상의 화합물을 확인한다.
다음 단계를 포함하는, 생물학적 표적에 결합하는 화합물을 확인하는 방법

(a) 적어도 약 10² 개의 특정 화합물을 포함하는 화합물 라이브러리와 생물학적 표적을 접촉시키는 단계로서, 상기 특정 화합물은 화합물 라이브러리 중 적어도 하나의 구성요소(member)가 상기 생물학적 표적에 결합하는데 적합한 조건 하에서 작용 성분의 구조를 확인하는 올리고누클레오티드에 효과적으로 결합하는, 둘 또는 그 이상의 빌딩 블록을 포함하는 작용 성분을 포함하며 ;

(b) 생물학적 표적에 결합하지 않은 라이브러리 구성요소를 제거하는 단계 ;

(c) 생물학적 표적에 결합한 화합물 라이브러리 중 적어도 하나의 구성요소의 코딩 올리고누클레오티드를 증폭시키는 단계 ;

(d) 단계 (c) 의 코딩 올리고누클레오티드의 서열을 결정하는 단계 ; 및

(e) 생물학적 표적에 결합하는 화합물 라이브러리 중 구성요소의 작용 성분의 구조를 측정하기 위해, 단계 (d) 에서 결정된 서열을 사용하는 단계

에 의해 상기 생물학적 표적에 결합하는 하나 또는 그 이상의 화합물을 확인한다.
제 106 항에 있어서, 라이브러리는 각각의 특정 화합물의 적어도 약 10⁵ 개의 복사물을 포함함을 특징으로 하는 방법.
제 106 항에 있어서, 라이브러리는 각각의 특정 화합물의 적어도 약 10⁶ 개의 복사물을 포함함을 특징으로 하는 방법.
제 106 항에 있어서, 라이브러리는 적어도 약 10⁴ 개의 특정 화합물을 포함함을 특징으로 하는 방법.
제 106 항에 있어서, 라이브러리는 적어도 약 10⁶ 개의 특정 화합물을 포함함을 특징으로 하는 방법.
제 106 항에 있어서, 라이브러리는 적어도 약 10⁸ 개의 특정 화합물을 포함함을 특징으로 하는 방법.
제 106 항에 있어서, 라이브러리는 적어도 약 10¹⁰ 개의 특정 화합물 을 포함함을 특징으로 하는 방법.
제 106 항에 있어서, 화합물 라이브러리는 적어도 약 10¹² 개의 특정 화합물을 포함함을 특징으로 하는 방법.
제 106 항에 있어서, 화합물 라이브러리는 독립적으로 다음 화학식 Ⅰ 을 갖는 다수의 화합물을 포함함을 특징으로 하는 방법

화학식 Ⅰ

이 식에서,

X 는 하나 또는 그 이상의 빌딩 블록을 포함하는 작용 성분이고 ;

Z 는 3' 말단에서 B 에 결합된 올리고누클레오티드이고 ;

Y 는 5' 말단에서 C 에 결합된 올리고누클레오티드이고 ;

A 는 X 와 공유결합을 형성하는 작용기이고 ;

B 는 Z 의 3'-말단과 결합을 형성하는 작용기이고 ;

C 는 Y 의 5'-말단과 결합을 형성하는 작용기이고 ;

D, F 및 E 각각은 독립적으로 이작용기성 결합기이며 ;

S 는 원자 또는 분자 스캐폴드(molecular scaffold)이다.
제 114 항에 있어서, A, B, C, D, E, F 및 S 각각은 화학식 Ⅰ 의 각각의 화합물과 동일한 동일성(identity)을 가짐을 특징으로 하는 방법.
제 114 항에 있어서, 화합물 라이브러리는 화학식 Ⅰ을 갖는 다수의 화합물을 필수적으로 함유함을 특징으로 하는 방법.
제 114 항에 있어서, D, E 및 F 는 각각 독립적으로 알킬렌쇄 또는 올리고(에틸렌 글리콜)쇄임을 특징으로 하는 방법.
제 114 항에 있어서, Y 및 Z 는 실질적으로 상보적이며, 적절한 조건 하에서 왓슨-크릭 염기쌍(Watson-Crick base pairing) 및 이중가닥 형성이 가능해지도록 화합물에서 방향이 정해져 있음을 특징으로 하는 방법.
제 114 항에 있어서, Y 및 Z 는 길이가 동일하거나 상이함을 특징으로 하는 방법.
제 119 항에 있어서, Y 및 Z 는 길이가 동일함을 특징으로 하는 방 법.
제 114 항에 있어서, Y 및 Z 는 각각 10 또는 그 이상의 염기 길이를 가지며, 10 또는 그 이상의 염기쌍의 상보적 영역을 가짐을 특징으로 하는 방법.
제 114 항에 있어서, S 는 탄소 원자, 붕소 원자, 질소 원자, 인 원자, 또는 다원자 스캐폴드(polyatomic scaffold)임을 특징으로 하는 방법.
제 114 항에 있어서, S 는 인산염기 또는 시클로기임을 특징으로 하는 방법.
제 123 항에 있어서, S 는 시클로알킬, 시클로알켄일, 헤테로시클로알킬, 헤테로시클로알켄일, 아릴 또는 헤테로아릴기임을 특징으로 하는 방법.
제 114 항에 있어서, 링커 성분은 다음의 구조임을 특징으로 하는 방법

여기에서, 각각의 n, m 및 p 는 독립적으로 정수 1 내지 약 20 이다.
제 125 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 2 내지 8 임을 특징으로 하는 방법.
제 126 항에 있어서, 각각의 n, m 및 p 는 독립적으로 정수 3 내지 6 임을 특징으로 하는 방법.
제 127 항에 있어서, 링커 성분은 다음의 구조를 가짐을 특징으로 하는 방법
제 114 항에 있어서, X 및 Z 는 PCR 프라이머 서열을 포함함을 특징으로 하는 방법.