KR20190093664A - 폴리뉴클레오타이드 셔플링 방법 - Google Patents

폴리뉴클레오타이드 셔플링 방법 Download PDF

Info

Publication number
KR20190093664A
KR20190093664A KR1020197020918A KR20197020918A KR20190093664A KR 20190093664 A KR20190093664 A KR 20190093664A KR 1020197020918 A KR1020197020918 A KR 1020197020918A KR 20197020918 A KR20197020918 A KR 20197020918A KR 20190093664 A KR20190093664 A KR 20190093664A
Authority
KR
South Korea
Prior art keywords
sequence
type
recognition
vector
coding
Prior art date
Application number
KR1020197020918A
Other languages
English (en)
Other versions
KR102509887B1 (ko
Inventor
데니스 그리몬
한스 거스트만스
이브 브리어스
롭 라빈
Original Assignee
유니버시테이트 젠트
카톨리에케 유니버시테이트 루벤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유니버시테이트 젠트, 카톨리에케 유니버시테이트 루벤 filed Critical 유니버시테이트 젠트
Publication of KR20190093664A publication Critical patent/KR20190093664A/ko
Application granted granted Critical
Publication of KR102509887B1 publication Critical patent/KR102509887B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1027Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/30Characterised by physical treatment
    • C12Q2523/313Irradiation, e.g. UV irradiation

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)

Abstract

본 발명의 제1 목적은 타일(Tile) 벡터를 제조하는 방법을 제공하는 것이며, 상기 벡터는 선택적 마커 및 코딩 폴리뉴클레오타이드를 포함하고, 여기서, 상기 코딩 폴리뉴클레오타이드의 바로 앞뒤에 선행 및 후행 Ms형 인지 서열이 있으며, 상기 선행 인지 서열 및 후행 인지 서열은 동일한 Iis형 제한 효소에 의해 인지되지만, 반대 배향을 갖는다. 보다 특히, 상기 선행 및 후행 Iis형 인지 서열의 위치 및 배향은 상응하는 Iis형 제한 효소에 의한 상기 타일 벡터의 절단을 제공하여, 이의 각각의 말단에 공지된 배향 및 길이를 갖는 오버행(overhang) 서열을 갖는 상기 코딩 폴리뉴클레오타이드 서열의 방출을 초래하는 한편, 상기 선행 및 후행 Ms형 인지 서열은 결여되어 있다. 제2 목적에서, 본 발명은 생성물 폴리뉴클레오타이드를 형성하기 위해 2개 이상의 코딩 폴리뉴클레오타이드를 접합시키기 위해 이전에 기재된 바와 같이 수득된 이러한 타일 벡터를 사용하는 방법을 제공한다. 전형적으로, 상기 생성물 폴리뉴클레오타이드는 벡터에 통합된다.

Description

폴리뉴클레오타이드 셔플링 방법
단백질은 천연 촉매작용(효소), 에피토프 인지(항체)부터 구조적 기능에 이르기까지 광범위한 기능을 수행하는 고도로 다재다능한(versatile) 생체분자이다. 매우 특이적인 반응을 높은 비율(rate)로 수행하는 효소의 능력은 이들 효소를 기술적 용도(종이 및 텍스타일 산업), 식품 및 사료 산업(낙농, 제과, 양조, 쥬스 생산, 전분 가공), 유기 합성 산업, 화장품, 의료 및 생명공학을 포함한 다양한 분야에 점점 유용하게 만들었다. 이와 같이, 산업 효소는 인간의 일상 생활에 혁신을 일으켰다. 항체는 특이적인 에피토프에 결합하고, 진단 툴 및 치료제로서 개발된다. 구조 단백질은 세포 또는 조직의 구조에서 중요한 기능을 가진다. 가장 잘 알려진 예는 콜라겐으로서, 인간의 뼈 및 피부에 풍부하게 존재한다.
자연은 단백질을, 다윈의 진화론에 의해 최적화된, 이들 단백질의 천연 역할을 수행하도록 구성하였다. 그러나, 단백질의 천연 기능과, 과학자 및 공학자에 의해 구상되는 적용 사이에는 큰 불일치가 대체로 존재한다. 따라서, 천연 단백질은 다양한 적용을 위해 신규 또는 바람직한 특성을 도입하도록 조작되어야 한다(Lutz, 2010). 따라서, 강력하고 다재다능한 단백질 공학 기술은 시장용 단백질의 가능성을 증진시키는 데 있어서 중추적인 역할을 가진다.
단백질 공학 분야는 지난 20년 이내에 급격한 기술적 탈바꿈을 거쳤다. 사실상, 시험관내 단백질 공학은 실험실-규모 상에서 천연 단백질 진화 힘(evolutionary force)을 모방한다. 수직 진화 또는 적응 진화는 단백질-인코딩 서열에서, 변경된 특성을 갖는 단백질을 유발하는 유전자 돌연변이의 축적을 내포한다. 이러한 과정은 촉매적(예를 들어 반응 속도) 또는 생물물리학적(예를 들어 안정성) 특성(합리적인 설계)을 개선하기 위해 선택된 아미노산을 변형시키기 위해 시험관내에서 부위-특이적 돌연변이생성(site-directed mutagenesis)에 의해 수행될 수 있다. 그러나, 부위-특이적 돌연변이생성은 3차원 구조 및/또는 효소 기전이 알려져 있는 경우에만 이해가 되고, 이러한 정보는 종종 입수 가능하지 않다. 유도 진화(directed evolution)를 위한 무작위 돌연변이생성 기술의 개발을 이용하면, 이러한 요건은 회피되었다. 흥미롭게도, 촉매적 아미노산으로부터 더 먼 부위에서 예상치 못한 아미노산에서 돌연변이체가 종종 선택되었기 때문에, 무작위 돌연변이생성은 부위-특이적 돌연변이생성을 보완하는 것으로 입증되었다.
단백질이 새로운 기능을 진화시키는 또 다른 주된 기전은 유전자 단편의 교환(셔플링/수평적 전달(horizontal transfer))에 의해 구동된다(Lutz and Benkovic, 2000). 이와 같이, 신규 기능을 갖는 급격하게 변화된 단백질이 생성된다. 이러한 진화 힘은 시험관내 단백질 공학을 이용하여 한정된 정도까지 모방될 수 있을 뿐이다. 제한(restriction)/연결에 의한 도메인 스워핑(swapping)은 상이한 기원으로부터의 단백질-인코딩 단편을 전형적인 분자 클로닝 기술을 사용하여 합리적인 방식으로 재조합할 수 있게 한다. 요건은, 이러한 클로닝 공정에서 사용되는 제한 부위의 인지 부위의 부재(absence)이다. 이러한 요건은, 상이한 공급원으로부터의 다수의 단편이 무작위로 조립되고 많은 상이한 제한 효소가 필요할 때, 특히 번거롭게 된다. DNA 셔플링은 부모 서열의 무작위 셔플링을 허용하지만 밀접하게 관련된 유전자(70% 초과의 서열 동일성, 계통(family) 셔플링)에 대해서만 적용 가능한 방법이다. 그러나, 서열 동일성이 낮은 무관한(non-related) 유전자 단편의 무제한 셔플링은 신규 단백질 기능을 가장 파괴적인 방식으로 설계하는 잠재성을 가진다. 기술적 어려움은 이러한 분야에서 진전을 방해하였다. 전형적인 재조합은 유전자 단편 사이에서 상동성의 부재로 인해 가능하지 않다. 관련성이 먼 서열로부터 하이브리드 단백질을 생성하기 위한 2가지 방법(SHIPREC 및 ITCHY)이 보고되어 있다(Ostermeier et al., 1999; Sieber et al., 2001; Patrick and Gerth, 2014). 그러나, 이 2가지 방법 모두는 2개의 부모 유전자로부터 유래된 2개의 단편으로 구성된 하이브리드로 제한된다. ITCHY를 기초로 하는 보다 정교한 방법인 SCRATCHY, 및 SCOPE는 다수의 단편의 재조합을 허용하지만, 이들 단편은 여전히 2개의 부모 유전자로부터만 유래될 수 있다(Kawarasaki et al., 2003; O'Maille et al., 2002). 골든 게이트(Golden Gate) 셔플링은, 부모 유전자 둘 모두로부터의 단편을 합리적이고 무작위적인 방식으로 셔플링하는 것을 허용하는 방법이다. 상이한 부모 유전자의 단편들 사이의 연접(junction)은 각각의 연접에서 모든 부모 유전자에 존재하는 4개의 보존된 뉴클레오타이드이다. 잠재적인 연접 부위를 식별하기 위해서는, 이들 유전자 중에서 충분히 높은 상동성이 요구된다. 골든 게이트 셔플링은 II형 제한 효소의 독특한 특징, 즉, 인지 부위 밖에서의 절단에 의존한다. 이는, 인지 부위가 단편의 말단에 위치하였을 때 상기 인지 부위의 제거를 허용한다. 이러한 특색은 하나의 튜브에서 동시적인 제한/연결, 스카리스(scar-less) 조립체에서 다수의 유전자 단편의 조립을 위한 1 단계 반응을 허용한다(Engler et al., 2009). 신규 효소를 생성하기 위한 많은 상이한 공급원으로부터의 다수의 무관한 유전자 단편의 무제한, 대규모 셔플링은 단백질 공학 분야에서 공백(void)으로 남아 있었다. 무관한 단편의 무작위 셔플링 - 무작위 돌연변이생성과 유사함 - 은 일반적으로, 이전에는 합리적으로 구상될 수 없었던 단편을 조합하는 많은 기대하지 않은 신규, 개선된 키메라 단백질을 제공하는 것으로 기대된다.
본 발명은 타일(Tile) 벡터로 지칭되는 벡터를 제조하기 위한 효율적인 방법을 제공하며, 생성물 뉴클레오타이드를 발생시키기 위한 방법에 사용하기 위한 단백질 단위를 인코딩하는 폴리뉴클레오타이드의 저장소 및/또는 공여체 벡터로서 특히 맞춰지고, 여기서, 상기 생성물 뉴클레오타이드는 단백질 단위를 인코딩하는 2개 이상의 상기 폴리뉴클레오타이드의 조합을 포함한다. 바람직하게는, 단백질 단위를 인코딩하는 상기 폴리뉴클레오타이드는 상기 생성물 뉴클레오타이드 내에서 조합되어, 이들의 서열은 단일 해독틀(reading frame) 내에서 통합되게 된다.
본 발명의 제1 목적은 타일(Tile) 벡터를 제조하는 방법을 제공하는 것이며, 상기 벡터는 선택적 마커 및 코딩 폴리뉴클레오타이드를 포함하고, 여기서, 상기 코딩 폴리뉴클레오타이드의 바로 앞뒤에 선행 및 후행 II형 인지 서열이 있으며, 상기 선행 인지 서열 및 후행 인지 서열은 동일한 II형 제한 효소에 의해 인지되지만, 반대 배향을 갖는다. 보다 특히, 상기 선행 및 후행 II형 인지 서열의 위치 및 배향은 상응하는 II형 제한 효소에 의한 상기 타일 벡터의 절단을 제공하여, 이의 각각의 말단에 공지된 배향 및 길이를 갖는 오버행(overhang) 서열을 갖는 상기 코딩 폴리뉴클레오타이드 서열의 방출을 초래하는 한편, 상기 선행 및 후행 II형 인지 서열은 결여되어 있다.
제2 목적에서, 본 발명은 생성물 폴리뉴클레오타이드를 형성하기 위해 2개 이상의 코딩 폴리뉴클레오타이드를 접합시키기 위해 이전에 기재된 바와 같이 수득된 이러한 타일 벡터를 사용하는 방법을 제공한다. 전형적으로, 상기 생성물 폴리뉴클레오타이드는 벡터에 통합된다.
본 발명의 적용 가능성의 추가의 범위는 하기에 주어진 상세한 설명으로부터 분명해질 것이다. 그러나, 본 발명의 사상 및 범위 내에서 다양한 변화 및 변형은 이러한 상세한 설명으로부터 당업자에게 분명해질 것이기 때문에, 상세한 설명 및 구체적인 실시예는 본 발명의 바람직한 실시형태를 가리키는 한편, 예시로서만 주어지는 것으로 이해되어야 한다. 상기 일반적인 설명 및 뒤이은 상세한 설명 둘 모두는 예시적이고 설명적인 것일 뿐이며, 청구된 바와 같은 본 발명을 제약하는 것이 아닌 것으로 이해된다.
본 발명은 뒤이은 언급에서 더 요약될 수 있다.
1. 선택적 마커(6), 및 코딩 폴리뉴클레오타이드 서열(10)과 이의 바로 앞뒤에 선행 및 후행 II형 인지 서열(12)을 포함하는 타일(Tile) 벡터(24)를 제조하는 방법으로서, 여기서, 상기 선행 및 후행 인지 서열은 동일한 II형 제한 효소에 의해 인지되지만, 반대 배향을 갖고,
상기 타일 벡터는 상기 선행 및 후행 인지 부위를 인지하는 II형 제한 효소를 사용하여 절단되어, 이의 각각의 말단에 공지된 오버행(overhang) 서열을 갖는 상기 코딩 폴리뉴클레오타이드 서열의 방출을 초래하고, 상기 방출된 코딩 폴리뉴클레오타이드 서열은 상기 선행 및 후행 II형 인지 서열이 결여되어 있고;
상기 방법은 다음의 포함하는 단계를 포함하는 방법:
a) 초기 코딩 폴리뉴클레오타이드(8)를 제공하고, 제1 종결 서열(16) 및 제2 종결 서열(17)로 상기 폴리뉴클레오타이드의 각각의 말단을 연장시키는 단계로서, 상기 종결 서열은 각각 하기의 요소를 포함하는, 단계:
i. 상기 초기 코딩 폴리뉴클레오타이드의 개방 해독틀의 각각의 말단에 인접하고 이와 프레임 내에서(in frame) 첨가되는 코딩 연장 서열(11)(3xn);
ii. 상기 코딩 연장 서열에 인접한 제1 II형 인지 서열(12)로서, 여기서, 상기 제1 인지 서열은 상기 제1 인지 부위를 인지하는 II형 제한 효소가 상기 코딩 연장 서열 내에서 절단하여 오버행을 발생시킬 수 있도록 배향되고, 제1 및 제2 종결 서열의 상기 제1 II형 인지 서열(12)은 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는 것인, 제1 II형 인지 서열(12);
iii. 상기 제1 II형 인지 서열에 인접하거나 그 안의 스페이서 서열(13);
iv. 상기 스페이서 서열에 인접한 제2 II형 인지 서열(14)로서, 여기서, 상기 제2 인지 서열은 상기 제2 인지 서열을 인지하는 II형 제한 효소가 상기 스페이서 서열을 절단하여 스페이서 오버행을 발생시킬 수 있도록 배향되고, 상기 제2 II형 인지 서열은 상기 제1 II형 인지 서열을 인지하는 II형 효소에 의해 인지되지 않는 것인, 제2 II형 인지 서열(14);
v. II형 제한 효소가 상기 제2 인지 서열에 결합할 수 있도록 충분한 길이의 테일(tail) 서열(15);
b) 제1 II형 인지 서열(3)과 제2 II형 인지 서열(4) 사이에 위치한 선택적 마커(6)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 수용 벡터(1)를 제공하여, 상기 벡터가 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 인지하는 II형 인지 효소를 사용하여 절단되어,
· 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 포함하는 스터퍼(stuffer) 서열(2); 및
· 상기 선택적 마커(6)를 포함하지만 상기 제1 II형 인지 서열 및 제2 II형 인지 서열이 결여되어 있고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(7)으로서, 여기서, 1개의 오버행은 상기 제1 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 인지 효소를 사용하여 상기 제1 종결 서열을 절단한 후 수득되는 스페이서 오버행에 상보적인 한편, 다른 오버행 서열은 상기 제2 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 제한 효소를 사용하여 상기 제2 종결 서열을 절단함으로써 수득되는 스페이서 오버행에 상보적인 것인, 선택적 벡터 단편(7)
을 형성할 수 있는 단계;
c) 혼합물을 인큐베이션하는 단계로서, 상기 혼합물은 다음을 포함함:
i. 단계 (a)의 연장된 초기 코딩 폴리뉴클레오타이드;
ii. 단계 (b)의 수용 벡터;
iii. 상기 연장된 초기 코딩 폴리뉴클레오타이드의 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 제한 효소;
iv. 수용 벡터의 상기 제1 II형 인지 서열 및 제2 II형 인지 서열을 인지하는 II형 제한 효소;
v. DNA 리가제.
2. 1에 있어서, 수용 벡터의 상기 스터퍼 단편(2)이 역-선택적(counter-selective) 마커(5)를 포함하는, 방법.
3. 1 또는 2에 있어서, 연장된 폴리뉴클레오타이드의 제1 종결 서열(16) 및 제2 종결 서열(17)의 상기 제2 II형 인지 서열(14)이 동일한 II형 효소에 의해 인지되는, 방법.
4. 3에 있어서, 수용 벡터의 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)이 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는, 방법.
5. 4에 있어서, 수용 벡터의 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)이 상기 연장된 초기 코딩 폴리뉴클레오타이드의 제1 종결 서열(16) 및 제2 종결 서열(17)의 제2 II형 인지 서열(14)과 동일한 II형 효소에 의해 인지되는, 방법.
6. 5에 있어서, 상기 수용 벡터(1)가 2개의 다중 클로닝 부위를 포함하며, 제1 다중 클로닝 부위는 일련의 다수의 상이한 II형 인지 서열을 포함하고 제2 다중 클로닝 부위는 제1 다중 클로닝 부위에서와 동일한 II형 효소에 의해 인지되는 반대로 배향된 II형 인지 서열을 포함하고, 상기 다중 클로닝 부위는 수용 벡터(1)의 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 포함하며, 이들은 상기 연장된 초기 코딩 폴리뉴클레오타이드의 제1 종결 서열(16) 및 제2 종결 서열(17)의 제2 II형 인지 서열(14)과 동일한 II형 효소에 의해 인지되는, 방법.
7. 1 내지 6 중 어느 하나에 있어서, 상기 종결 서열(16, 17)을 이용하여 연장된 상기 초기 코딩 폴리뉴클레오타이드(8)가 DNA 합성 방법을 사용하여 제조되는, 방법.
8. 1 내지 6 중 어느 하나에 있어서, 상기 초기 코딩 폴리뉴클레오타이드(8)가 중합효소 연쇄 반응(PCR)을 사용하여 상기 종결 서열(16, 17)을 이용하여 연장되며, 여기서, 상기 PCR은 상기 초기 코딩 폴리뉴클레오타이드의 각각의 말단 상에서 어닐링하는 테일드(tailed) 포워드 및 리버스 프라이머의 사용을 수반하고, 포워드 프라이머의 상기 테일은 제1 종결 서열(16)을 첨가하고, 리버스 프라이머의 테일은 제2 종결 서열(17)을 첨가하는, 방법.
9. 8에 있어서, 상기 PCR이 에러 유발 PCR(error prone PCR)이어서, 다수의 벡터를 발생시키고, 이들 벡터는 상기 초기 코딩 폴리뉴클레오타이드의 무작위 돌연변이체를 포함한다는 점에서 서로 다양하다. 대안적으로, 8.의 상기 PCR은 예정된 돌연변이를 초기 코딩 서열 내에 도입할 수 있게 하는 부위-특이적 돌연변이생성 PCR을 수반한다.
10. 1 내지 9 중 어느 하나에 있어서, 상기 방법이 상기 타일 벡터에 포함된 초기 코딩 폴리뉴클레오타이드의 서열 내에 유도 돌연변이(directed mutation)를 도입하는 부가적인 단계를 포함하고, 상기 부가적인 단계는 Kunkel 방법, 미스매치 프라이머를 이용한 PCR 부위-특이적 돌연변이생성 또는 전체 플라스미드 돌연변이생성 방법(예를 들어 Quickchange 방법)의 사용을 포함하는, 방법.
11. 선택적 마커(6), 및 바로 앞뒤에 선행 및 후행 제1 II형 인지 서열(12)이 있는 코딩 폴리뉴클레오타이드 서열(10)을 포함하는 타일 벡터(24)로서,
여기서, 상기 선행 및 후행 II형 인지 서열(12)은 동일한 II형 제한 효소에 의해 인지되지만 반대 배향을 갖고;
상기 타일 벡터(24)는 코딩 폴리뉴클레오타이드 서열(10)이, 초기 코딩 서열(8)의 개방 해독틀과 프레임 내에서 바로 앞뒤에 2개의 코딩 연장 서열(11)(3xn)이 있는 초기 폴리뉴클레오타이드 서열(8)을 포함하는, 타일 벡터(24).
12. 초기 코딩 폴리뉴클레오타이드 서열(8)과 제1 및 제2 종결 서열(16, 17)을 포함하는 폴리뉴클레오타이드 서열로서,
여기서, 상기 제1 및 제2 종결 서열(16, 17)은 각각 하기의 요소를 포함하는 폴리뉴클레오타이드 서열:
i. 코딩 연장 서열(11)(3xn)로서, 초기 코딩 폴리뉴클레오타이드 서열의 바로 앞뒤에 존재하고, 상기 초기 코딩 폴리뉴클레오타이드의 개방 해독틀과의 프레임 내에서 존재하는, 코딩 연장 서열(11)(3xn);
ii. 상기 코딩 연장 서열(11)(3xn)에 인접한 제1 II형 인지 서열(12)로서, 여기서, 상기 제1 II형 인지 서열(12)은 상기 제1 II형 인지 서열을 인지하는 II형 제한 효소가 상기 코딩 연장 서열(11)(3xn) 내에서 절단하여 오버행을 발생시킬 수 있도록 배향되고, 제1 및 제2 종결 서열의 상기 제1 II형 인지 서열(12)은 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는 것인, 제1 II형 인지 서열(12);
iii. 상기 제1 II형 인지 서열(12)에 인접하거나 그 안의 스페이서 서열(13);
iv. 상기 스페이서 서열(13)에 인접한 제2 II형 인지 서열(14)로서, 여기서, 상기 제2 II형 인지 서열(14)은 상기 제2 II형 인지 서열(14)을 인지하는 II형 제한 효소가 상기 스페이서 서열(13)을 절단하여 스페이서 오버행을 발생시킬 수 있도록 배향되고, 제1 및 제2 종결 서열의 상기 제2 II형 인지 서열(14)은 상기 제1 II형 인지 서열(12)을 인지하는 II형 효소에 의해 인지되지 않는 것인, 제2 II형 인지 서열(14);
v. II형 제한 효소가 상기 제2 인지 서열(14)에 결합할 수 있도록 충분한 길이의 테일 서열(15).
13. 2개 이상의 코딩 폴리뉴클레오타이드를 접합시켜, 벡터 내에서 통합된 생성물 폴리뉴클레오타이드를 형성하는 방법으로서,
상기 방법은 혼합물을 인큐베이션하는 단계를 포함하고, 상기 혼합물은
i. 2개 이상의 타일 벡터로서, 바람직하게는 상기 타일 벡터는 1 내지 10 중 어느 하나의 방법에 따라 수득되고, 각각의 타일 벡터는 2개의 코딩 연장 서열(11)(3xn)을 포함하는 코딩 폴리뉴클레오타이드 서열(10)을 포함하고, 상기 코딩 폴리뉴클레오타이드 서열(10)의 바로 앞뒤에 선행 및 후행 II형 인지 서열(12)이 존재하며, 상기 벡터의 상기 선행 및 후행 인지 서열(12)은 동일한 II형 제한 효소에 의해 인지되는, 2개 이상의 타일 벡터;
ii. 상기 타일 벡터 내에서 상기 선행 및 후행 II형 인지 서열(12)을 인지하고 상기 각각의 벡터로부터 코딩 폴리뉴클레오타이드 서열(10)을 절단하는 II형 제한 효소로서, 여기서, 각각의 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행은 하나의 다른 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행에 상보적인 것인, II형 제한 효소;
iii. 2개의 제1 II형 인지 서열(21) 사이에 위치한 선택적 마커(23)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 지정(destination) 벡터(18)로서, 여기서, 상기 제1 II형 인지 서열(21)은 동일한 II형 제한 효소에 의해 인지되지만 반대 배향을 가져서, 상기 벡터는 상기 제1 II형 인지 서열을 인지하는 II형 제한 효소를 사용하여 절단되어,
· 상기 제1 II형 인지 서열(21)을 포함하는 스터퍼 서열(20); 바람직하게는 상기 스터퍼 서열은 역-선택적 마커(5)를 추가로 포함하는, 스터퍼 서열(20); 및
· 상기 선택적 마커(23)를 포함하지만 상기 제1 II형 인지 서열(21)이 결여되어 있고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(19)으로서, 여기서, 1개의 오버행은 임의의 상기 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행에 상보적인 한편, 다른 오버행은 임의의 상기 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 다른 오버행에 상보적인 것인, 선택적 벡터 단편(19)
을 형성할 수 있는, 지정 벡터(18);
iv. 상기 지정 벡터의 상기 제1 II형 인지 서열(21)을 인지하는 II형 제한 효소;
v. DNA 리가제
를 포함하는, 방법.
14. 13에 있어서, 상기 코딩 폴리뉴클레오타이드가 단일 해독틀 내에서 상기 생성물 폴리뉴클레오타이드 내에서 조합되는, 방법.
15. 13 또는 14에 있어서, 지정 벡터의 상기 제1 II형 인지 서열(21)이 상기 타일 벡터의 상기 선행 및 후행 인지 서열(12)을 인지하는 동일한 II형 제한 효소에 의해 인지되는, 방법.
16. 13 내지 15 중 어느 하나에 있어서, 상기 타일 벡터가, 예정된 수의 연결된 코딩 폴리뉴클레오타이드를 포함하는 생성물 뉴클레오타이드의 형성을 유도하는 오버행 서열을 포함하는 코딩 뉴클레오타이드를 방출하도록 설계되고, 방출된 코딩 폴리뉴클레오타이드의 오버행 서열이 생성물 뉴클레오타이드 내의 또 다른 코딩 폴리뉴클레오타이드 내에서 상기 코딩 폴리뉴클레오타이드의 위치를 예정하는, 방법.
17. 16에 있어서, 상기 타일 벡터가, 뉴클레오타이드 서열에서 상이하지만 동일한 오버행 서열을 공유하는 2개 이상의 방출된 코딩 폴리뉴클레오타이드를 제공하며, 상기 방법이 상기 상이하게 방출된 코딩 폴리뉴클레오타이드의 상기 공유된 오버행 서열에 의해 정의된 바와 같이 생성물 뉴클레오타이드 내의 위치에서 뉴클레오타이드 서열이 다양한 상이한 생성물 뉴클레오타이드의 형성을 초래하는, 방법.
18. 17에 있어서, 뉴클레오타이드 서열이 상이하지만 동일한 오버행 서열을 공유하는 상기 방출된 코딩 폴리뉴클레오타이드가 주어진 단백질 단위를 인코딩하는 폴리뉴클레오타이드의 상이한 변이체 또는 돌연변이체를 포함하는, 방법.
19. 17에 있어서, 뉴클레오타이드 서열이 상이하지만 동일한 오버행 서열을 공유하는 상기 방출된 코딩 폴리뉴클레오타이드가, 상이한 단백질 단위를 인코딩하는 상이한 폴리뉴클레오타이드를 포함하는, 방법.
20. 선택적 마커(23), 2개의 제1 II형 인지 서열(21) 및 역-선택적 마커를 포함하는 지정 벡터(18)로서,
- 선택적 마커(23)는 2개의 (3xn) 서열(P1 및 Pn+1) 사이에 위치하고, 상기 (3xn) 서열의 각각의 뒤에 제1 II형 인지 서열(21)이 존재하고;
- 2개의 제1 II형 인지 서열(21)은 상기 2개의 제1 II형 인지 서열(21)을 인지하는 동일한 II형 제한 효소에 의해 인지되는 것을 특징으로 하는, 지정 벡터(18).
21. 2개의 다중 클로닝 부위 사이에 위치한 선택적 마커(6)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 수용 벡터(1)로서, 제1 다중 클로닝 부위는 일련의 다수의 상이한 II형 인지 서열을 포함하고, 제2 다중 클로닝 부위는 제1 다중 클로닝 부위에서와 동일한 II형 효소에 의해 인지되는 반대로 배향된 II형 인지 서열을 포함하고, 여기서, 상기 다중 클로닝 부위는 제1(3) 및 제2(4) II형 인지 서열을 포함하며; 따라서, 상기 벡터는 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 인지하는 II형 인지 효소를 사용하여 절단되어,
상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 포함하는 스터퍼 서열(2); 및
상기 선택적 마커(6)를 포함하지만 상기 제1 및 제2 II형 인지 서열이 결여되어 있고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(7)
을 형성할 수 있는, 수용 벡터(1).
도 1: II형 제한 효소를 기초로 한 VersaTile 셔플링이다. a. 비-회문형 II형 인지 부위(▲)는 뉴클레오타이드 오버행(코딩 연장 서열)을 생성하는 타일의 말단으로부터 제거된다. 이들 단편이 각각의 지정 벡터에서 연결될 때, II형 인지 부위가 제거됨에 따라 이들은 재분해되고, 이로써 동시적인 제한 및 연결 반응이 가능해진다. II형 제한 부위의 적절한 설계 및 뉴클레오타이드 오버행의 선택은 요망되는 구축물인 안정한 데드(dead)-말단 생성물을 초래한다. b. VersaTile 셔플링에서, 생성된 오버행은, 이것이 1 내지 n개의 아미노산을 코딩하는 적어도 3개의 뉴클레오타이드에 포매되도록 선택되며, 이는 인접 타일들을 배향된 방식으로 연결한다. 조심스럽게 선택된 뉴클레오타이드 링커는 타일 조립체의 최종 순서를 정의하는 코딩 연장 서열로서 작용한다(정사각형, 다이아몬드형, 구형, 다각형).
도 2: 중첩 연장(overlap extension)에 의한 스플라이싱이다. a. 개략적인 SOE PCR: 제1 PCR에서, 돌연변이화된 내부 BsaI 인지 서열을 포함하는 상보적인 말단을 갖는 2개의 단편이 발생된다. 돌연변이는 이상적으로, 코딩 서열에서 침묵 돌연변이다. 제2 PCR에서, 이들 단편은 혼성화할 것이고, 포워드(a) 및 리버스(d) 프라이머의 첨가를 이용하여, 내부 인지 부위이 결여된 원래의 서열이 재생된다. b. 제2 PCR(터치-다운(Touch-down) PCR)에 사용된 온도 프로그램의 도식도이다. 저하되는 어닐링 온도는 2개의 발생된 단편의 중첩의 혼성화를 위한 최적 온도를 확인할 수 있게 한다. c. EAD10 및 EAD16 둘 모두에 대해 사용되는 SOE 프라이머의 표이다(BsaI 인지 서열은 밑줄이 그어져 있고, 점 돌연변이는 볼드체로 표시되어 있음).
도 3: iPCR을 이용한 pVTSE 수용 벡터 백본 및 선형화이다. 4개의 상이한 pVTSE는 4개의 상이한 인서트 카세트의 삽입을 통해 발생되었으며, 각각의 인서트 카세트는 각각의 코딩 연장 서열(Pn) 및 측면(flanking) BsaI 인지 부위: pVTSE1: P1, P2; pVTSE2: P2, P3: pVTSE3: P3, P4; pVTSE4: P4, P5를 포함한다. pVTSE는, 선형화된 벡터의 말단이 코딩 연장 서열로 구성되는 방식으로 iPCR을 통해 선형화된다. 이는 도면에 도시된 바와 같이, 각각의 코딩 연장 서열 및 인접 BsaI 인지 부위에 상보적인 프라이머를 사용함으로써 수행된다. 하기 표는 상이한 코딩 연장 서열, 비-회문형(non-palindromic) BsaI 인지 부위 및 이들의 상응하는 뉴클레오타이드 및 아미노산 서열을 보여준다.
도 4: 수용 벡터 pVTSEII 및 pVTSEIII의 도식도이다.
도 5: VTS와 융화성인 상이한 지정 벡터의 개략도이다.
도 6. 준-합리적 VersaTile 셔플링의 길이 분포이다. R 스크립트(script)를 사용하여 계산된 이론적 기대(theoretical expectation)는 연회색 곡선으로 표시된다. 개념 증명(proof-of-concept)의 실험 데이터는 진회색 곡선으로 표시된다. 곡선들은 논쟁의 여지가 없다(non-contentious).
도 7. 위치 1에 존재하는 상이한 펩타이드의 수이다. 연회색 막대는 제1 조립체에서 확인된 펩타이드를 표시하고, 진회색 막대는 제2 조립체의 펩타이드를 보여준다.
도 8. 무작위 VersaTile 셔플링의 길이 분포이다. 연회색 곡선은, R 스크립트를 사용하여 계산된 이론적 기대를 표시한다. 개념 증명의 실험 데이터는 진회색 곡선으로 표시된다. 곡선들은 상대적으로 유사하다.
도 9: 조성물 pLVTSD1 및 pYVTSD1의 개요이다.
도 10: a. 코딩 서열이 VersaTile 셔플링에 의해 발생되는 조작된 엔도라이신(endolysin)(H11 내지 46 kDa) 의 대규모 발현이다. b. 레인 1: 저분자량 단백질 사다리, 레인 2: 관류(flow through), 레인 3: 세척, 레인 4: 제1 용출, 레인 5: 제2 용출, 레인 6: 용출 1 투석된, 레인 7: 용출 2 투석된, 레인 8: PageRuler 예비염색된 단백질 사다리.
도 11: 병행하여 96-상이한 VTS 발생된 단백질의 소규모 발현의 SDS-page 정제된 분획(Thermo Scientific사로부터의 HisPurTM Ni-NTA 스핀 플레이트(spin plate))이다. 레인 1: 단백질 1, 레인 2: 단백질 2, 레인 3: 단백질 3, 레인 4: 단백질 4, 레인 5: PageRuler 예비염색된(prestained) 단백질 사다리, 레인 6: 단백질 5, 레인 7: 단백질 6, 레인 8: 단백질 7, 레인 9: 단백질 8, 레인 10: 단백질 9, 레인 11: 단백질 10, 레인 12: 단백질 11, 레인 13: 단백질 12, 레인 14: 단백질 13, 레인 15: 단백질 14.
도 12: 수용 벡터의 도식도이다.
도 13: 제1(16) 및 제2(17) 종결 서열을 이용하여 연장된 초기 코딩 서열(8)의 도식도이다.
도 14: 타일 벡터의 도식도이다.
도 15: 지정 벡터의 도식도이다.
본원 상기에 상술된 바와 같이, 본 발명은 타일 벡터를 제조하는 방법을 제공하며, 상기 벡터는 선택적 마커 및 코딩 폴리뉴클레오타이드를 포함하고, 여기서, 상기 코딩 폴리뉴클레오타이드의 바로 앞뒤에 선행 및 후행 II형 인지 서열이 있으며, 상기 선행 인지 서열 및 후행 인지 서열은 동일한 II형 제한 효소에 의해 인지되지만, 반대 배향을 갖는다.
이러한 측면에서, 당업계, 예를 들어 US2014/0329233은 2개 이상의 코딩 폴리뉴클레오타이드를 생성물 뉴클레오타이드로도 지칭되는 조합된 코딩 폴리뉴클레오타이드로 조합하는 방법을 제공한다. 이들 방법은 비-회문형 서열을 인지하고 이의 인지 서열 밖에서 절단하는 제한 효소, 예컨대 II형 제한 효소에 의한 DNA 분해를 이용한다. II형 제한 효소에 의한 DNA의 절단 후, 이러한 절단에 의해 생성된 말단 중 하나는 인지 서열의 임의의 일부가 결여되어 있다. 따라서, 선행 및 후행 II형 인지 서열이 측면에 있는 코딩 폴리뉴클레오타이드 서열을 포함하는 제1 폴리뉴클레오타이드 서열을 설계하는 것이 가능하며, 이는 상기 선행 및 후행 인지 서열을 인지하는 II형 효소를 사용한 상기 제1 폴리뉴클레오타이드의 절단이 상기 코딩 폴리뉴클레오타이드의 방출을 초래하도록 배향되며, 여기서, 상기 방출된 코딩 폴리뉴클레오타이드 단편은 상기 선행 또는 후행 II형 인지 서열의 임의의 일부를 포함하지 않는다. 이후, 이러한 제1 폴리뉴클레오타이드는 타일 폴리뉴클레오타이드 또는 타일 벡터로 지칭되며, 이러한 폴리뉴클레오타이드는 벡터이다.
많은 II형 제한 효소의 추가의 흥미로운 특징은, 폴리뉴클레오타이드의 이들의 절단이 공지된 방향 및 길이를 갖는 오버행의 형성과 연관이 있다는 점이다. 결론적으로, 2개 이상의 타일 폴리뉴클레오타이드를 설계하는 것이 가능하며, 각각의 타일 폴리뉴클레오타이드는 선행 및 후행 II형 인지 서열의 측면에 존재하는 코딩 폴리뉴클레오타이드를 포함하며, 따라서 상응하는 II형 효소를 사용한 상기 폴리뉴클레오타이드의 절단은 복수의 코딩 폴리뉴클레오타이드의 방출을 초래하며, 이는 상기 방출된 코딩 폴리뉴클레오타이드의 오버행의 설계에 따라 유도, 무작위 또는 준-무작위 방식으로 조합할 수 있다.
본 발명을 이용하여, 폴리뉴클레오타이드의 발생을 위한 현재 이용 가능한 기술이 추가로 개선된다. 특히, 본 발명은 신규 단백질을 형성하기 위해, 많은 상이한 공급원으로부터의 다수의 무관한 유전자 단편의 대규모 셔플링을 위한 방법 및 툴을 제공한다. 본 발명은 다수의 하이브리드 또는 융합 단백질을 생성하는 데 특히 유용하다.
본 발명은 구체적으로, 코딩 폴리뉴클레오타이드 서열(10)의 일부로서의 코딩 연장 서열(3xn)(11)의 용도에 초점을 맞춘다. 하기 맥락에서, 본 발명자들은 n=2를 지칭하며, 본 발명자들은 이를 본 발명자들의 실험 셋업에서 사용하였다.
하기 표에서, 독자는 수행된 3개의 상이한 실험 셋업에 대한 이들 선택을 알 수 있다.
표 1: 사용된 코딩 연장 서열의 개요
Figure pct00001
1 (A/C) 사용된 지정 벡터에 따라 첨가되는 각각의 뉴클레오타이드(P1 지정 벡터 = ACCATN; 지정 벡터가 생성물 뉴클레오타이드 바로 뒤에 라이신(Lys) 및 정지 코돈을 갖는다면 Pn+1 지정 벡터 = NAGTAA이거나, 지정 벡터가 생성물 폴리뉴클레오타이드 바로 뒤에 라이신(Lys) 및 티로신(Tyr)을 갖는다면 Pn+1 지정 벡터 = NAGTAC이다. 후자의 지정 벡터는 정제 태그와 같은 C-종결 서열을 단백질에 첨가한다.
2 N: 이 뉴클레오타이드는 타일의 발생을 위해 자유롭게 선택될 수 있다. 이는 조립 동안 제거될 것이다.
제1 II형 인지 서열을 이용한 분해 후, 오버행 서열은 혼합물 내의 또 다른 오버행 서열에 상보적일 각각의 코딩 연장 서열(3xn)로부터 생성될 것이다. 도 16은 지정 벡터(18)에서 상이한 코딩 연장 서열(11)의 측면에 있는 3개의 초기 코딩 폴리뉴클레오타이드 서열(8)의 조립을 위한 것을 예시하고 있다. 타일 위치에 따라, 당업자는 어떤 코딩 연장 서열이 초기 코딩 뉴클레오타이드 서열에 선행하고 후행하는지 알 수 있다. VersaTile 셔플링 반응이 상이한 타일 벡터(또는 연장된 코딩 폴리뉴클레오타이드 서열) 및 지정 벡터를 이용하여 수행될 때, 분해된 코딩 연장 서열의 2개의 상보적인 오버행은 재조합된 코딩 연장 서열(25) 내로 재조합될 것이다.
1) 조립체에서 제1 위치를 차지하는 초기 코딩 폴리뉴클레오타이드 서열의 선행 코딩 연장 서열은 지정 벡터의 3xn 서열 P1와 재조합될 것이다. 지정 벡터는, 재조합된 코딩 연장 서열의 제2 트리플렛(triplet)이 리보좀 결합 부위에 비해 올바르게 위치하는 개시 코돈이어서 이러한 개시 코돈에서 번역의 개시를 보장하도록 구축된다. 지정 벡터가 N-말단 정제 태그 또는 임의의 다른 N-종결 서열을 인코딩하는 경우, 재조합된 코딩 연장 서열의 제1 트리플렛은 지정 벡터의 3xn 서열 P1의 첫번째 뉴클레오타이드에 따라 또 다른 아미노산 (P, T, A)을 생성할 것이다.
2) 조립체에서 제1 위치를 차지하는 초기 코딩 폴리뉴클레오타이드 서열의 후행 코딩 연장 서열은 조립체에서 제2 위치를 차지하는 초기 코딩 폴리뉴클레오타이드 서열의 선행 코딩 연장 서열과 재조합될 것이다. 조립체에서 제2 위치를 차지하는 초기 코딩 폴리뉴클레오타이드 서열의 후행 코딩 연장 서열은 조립체에서 제3 위치를 차지하는 초기 코딩 폴리뉴클레오타이드 서열의 선행 코딩 연장 서열과 재조합될 것이다. 새로운 재조합된 코돈 연장 서열(25)은 모든 연접에서 생성된다. 2개의 인접한 코딩 폴리뉴클레오타이드 서열 사이의 재조합된 코돈 연장 서열은 2개의 아미노산을 인코딩한다. 오버행 서열은 제1 트리플렛의 마지막 2개의 뉴클레오타이드 및 제2 트리플렛의 처음 2개의 뉴클레오타이드를 포함한다. 정확히 2개의 아미노산은 위치 x에서 초기 코딩 폴리뉴클레오타이드 서열의 후행 코딩 연장 서열의 처음 뉴클레오타이드, 및 위치 x+1에서 초기 코딩 폴리뉴클레오타이드 서열의 선행 코딩 서열의 마지막 뉴클레오타이드에 의해 결정될 것이다.
3) 조립체에서 마지막 위치를 차지하는 초기 코딩 폴리뉴클레오타이드 서열의 후행 코딩 연장 서열은 지정 벡터의 3xn 서열 Pn+1과 재조합될 것이다. 지정 벡터는, 재조합된 코딩 연장 서열의 제2 트리플렛이 정지 코돈(TAA, 태그; Pn+1의 6번째 뉴클레오타이드는 A 또는 G임)이 되도록 구축된다. 지정 벡터가 C-말단 정제 태그 또는 임의의 다른 C-종결 서열을 인코딩하는 경우, 재조합된 코딩 연장 서열의 제2 트리플렛은 정지 코돈 대신에 아미노산 (Y)를 인코딩하는 TAC(Pn+1의 6번째 뉴클레오타이드는 C임)일 것이다.
Sarrion-Perdigones 등, 2011은 우선 프로모터, 코딩 서열 및 종결자를 포함하는 전사 단위를 조립하고, 그 후에 다중유전자(multigene) 조립체에서 상이한 전사 단위의 추가의 제2 조립체를 조립하는 방법인 'Goldenbraid를 기재하고 있다. 전사 단위의 조립에 대해, 상기 조립이 해독틀 밖에서 발생하기 때문에, 모든 것이 틀 내에 잔류하는 것은 중요하지 않다. 이는 모든 연접이 해독틀 내에서 발생하는 본 발명의 VersaTile 셔플링 방법과는 대조적이다. 대조적으로, GoldenBraid는 인접한 빌딩 블록(building block) 사이에서 중첩되는 별개의 4개 nt를 사용하여, 스카리스 클로닝을 초래한다. 4개의 nt는 비-코딩 서열이다. 이는, 2개의 인접한 타일 사이에서 스카(scar)(2개의 아미노산의 링커)를 생성하도록 3xn 뉴클레오타이드의 코딩 연장 서열이 첨가되는 VersaTile 셔플링과는 대조적이다. 해독틀 내에 머무르고 조합 설계(combinatorial design)를 허용하기 위해서는 이것이 필요하다.
Vad-Nielsen 등 2016은 II형 제한/연결 프로토콜을 이용하여 상이한 빌딩 블록을 조립하여, CRISPR gRNA 발현 어레이를 초래하기 위한 골든 게이트 기술을 이용한다. 이러한 어레이는 또한 하나의 코딩 서열이 아니며, 따라서, 모든 빌딩 블록이 틀에서 조립될 필요가 없다. 또한 여기서, 저자들은 상이한 gRNA 사이에서 비-코딩 서열이기도 한 별개의 4개 nt를 사용하였다.
Engler 등, 2009에 의해 사용된 바와 같이 골든 게이트 셔플링 기술에서, 생성된 조립체는 코딩 서열이다. 따라서, Sarrion-Perdigones 등, 2011 및 Vad-Nielsen 등, 2016과는 대조적으로, 연접은 코딩 서열이다. 그러나, 4개 nt는, 이들이 셔플링될 상이한 코딩 서열(부모 유전자) 중에서 보존되도록 선택된다. 따라서, 이들 nt는 스카리스 조립을 위한 연접점으로서 역할을 할 수 있으며, 본 발명의 VersaTile 셔플링 기술과는 대조적으로 인접한 빌딩 블록 사이에 어떠한 부가적인 아미노산도 첨가되지 않는다. VersaTile 셔플링은 완전한 상동성-독립 서열과 함께 사용하기에 적합하며, 이를 위해 부모 유전자 중에서 4개의 보존된 뉴클레오타이드를 식별하는 것이 불가능할 것이며, 이는, 선행 기술에 기재된 기술과 비교하여 더 많은 적용에 유용하게 만든다.
US20140329233에서, 빌딩 블록은 II형 제한/연결에 의해 조립된다. 그러나, 재조합 부위는, 본 발명의 VersaTile 셔플링 방법에서와 같이 2개의 특이적인 아미노산을 생성하도록 특이적으로 설계되지는 않는다. VersaTile 셔플링(도 16 참조)에서, 재조합된 코딩 연장 서열은 2개의 코딩 연장 서열(3xn)에 기인하고, 이때, 4 nt 오버행의 처음 2개의 뉴클레오타이드는 제1 트리플렛의 마지막 2개의 뉴클레오타이드이고 4 nt 오버행의 마지막 2개의 뉴클레오타이드는 제2 트리플렛의 처음 2개의 뉴클레오타이드이다. 위치 n에서 타일 벡터의 후행 코딩 연장 서열의 첫번째 뉴클레오타이드 및 위치 n+1에서 타일 벡터의 선행 코딩 연장 서열의 6번째 뉴클레오타이드는 최종적으로 정확히 2개의 아미노산을 결정한다. US20140329233은, 3개의 뉴클레오타이드의 오버행이 메티오닌/글리신/알라닌과 같은 단일 코돈일 수 있고, 따라서 상기 오버행은 개입 아미노산을 완전히 인코딩함을 언급하고 있다. 그러나, 3개 뉴클레오타이드의 오버행은 조립 과정에서 4개 뉴클레오타이드의 오버행보다 덜 효율적이고, 더 적은 수의 타일이 단일 조립체에 포함될 수 있다.
본 발명의 제1 실시예(즉, 실시예 9)(유도 조합)에서, 4개의 타일 폴리뉴클레오타이드는 이러한 코딩 폴리뉴클레오타이드를 방출하도록 설계되며, 이 중 제1 방출된 폴리뉴클레오타이드는 제2 방출된 폴리뉴클레오타이드의 상보적인 오버행과 동일한 방향 및 길이를 갖는 오버행을 보유하는 한편, 상기 제2 방출된 폴리뉴클레오타이드의 다른 오버행은 제3의 상보적인 오버행과 동일한 방향 및 길이를 갖는 오버행을 보유하고, 여기서, 상기 제1 및 제3 방출된 폴리뉴클레오타이드는 상보적인 오버행을 갖지 않는다. 이러한 실시예에서, DNA 리가제의 존재 하에 적절한 II형 효소를 사용한 이들 코딩 폴리뉴클레오타이드의 방출은 생성물 폴리뉴클레오타이드의 형성을 초래하며, 여기서, 제2 코딩 폴리뉴클레오타이드의 서열은 제1 및 제3 코딩 폴리뉴클레오타이드의 서열 사이에 위치한다.
제2 실시예(즉, 실시예 11)(무작위 조합)에서, 16(4 x 4)개의 이러한 타일 폴리뉴클레오타이드는 4개의 코딩 폴리뉴클레오타이드로 구성된 세트 4개를 방출하도록 설계되며, 여기서, 주어진 세트의 각각의 방출된 코딩 폴리뉴클레오타이드는 동일한 오버행 서열의 측면에 제1, 제2, 제3 또는 제4 뉴클레오타이드 서열을 포함하고, 상기 제1, 제2, 제3 및 제4 뉴클레오타이드 서열은 각각의 세트에서 동일하다. 더욱이, 상기 제1 세트의 방출된 폴리뉴클레오타이드는 제2 세트의 방출된 폴리뉴클레오타이드의 상보적인 오버행과 동일한 방향 및 길이를 갖는 오버행을 보유하는 한편, 상기 제2 세트의 방출된 폴리뉴클레오타이드의 다른 오버행은 제3 세트의 방출된 코딩 폴리뉴클레오타이드의 상보적인 오버행과 동일한 방향 및 길이를 갖는 오버행을 보유하고, 상기 제1 및 제3 세트의 방출된 폴리뉴클레오타이드는 상보적인 오버행을 갖지 않는다. 더욱이, 상기 제4 세트의 방출된 폴리뉴클레오타이드는 제3 세트의 방출된 폴리뉴클레오타이드의 상보적인 오버행과 동일한 방향 및 길이의 오버행을 보유하고, 여기서, 상기 제1, 제2 및 제4 세트의 방출된 폴리뉴클레오타이드는 상보적인 오버행을 갖지 않는다. 본원에서, 제1 세트의 오버행은 지정 벡터의 상보적인 오버행과 동일하고, 이는 제4 세트에 대해서도 동일하게 적용된다.
이러한 제2 실시예에서, DNA 리가제의 존재 하에 적절한 II형 효소를 사용한 이들 코딩 폴리뉴클레오타이드의 방출은 상기 생성물 뉴클레오타이드 내에서 상기 제1, 제2, 제3 및 제4 뉴클레오타이드 서열의 순서로 다양한 생성물 뉴클레오타이드의 형성을 초래한다.
제3 실시예(실시예 10)(준-무작위 조합)에서, 4개의 이러한 타일 폴리뉴클레오타이드는 4개의 코딩 폴리뉴클레오타이드를 방출하도록 설계되며, 이 중 제1 및 제2 방출된 코딩 폴리뉴클레오타이드는 동일한 오버행 서열의 측면에서 각각 제1 및 제2 뉴클레오타이드 서열을 포함하는 한편, 제3 및 제4 방출된 코딩 폴리뉴클레오타이드는 각각, 상이한 오버행의 측면에 제3 및 제4 뉴클레오타이드 서열을 각각 포함한다. 나아가, 상기 제1 및 제2 방출된 코딩 폴리뉴클레오타이드는 상기 제3 방출된 폴리뉴클레오타이드의 상보적인 오버행과 동일한 방향 및 길이를 갖는 오버행을 포함하는 한편, 상기 제3 방출된 폴리뉴클레오타이드의 다른 오버행은 제4의 상보적인 오버행과 동일한 방향 및 길이를 갖는 오버행을 보유하고, 여기서, 상기 제1 및 제2 방출된 코딩 폴리뉴클레오타이드는 제4 방출된 코딩 폴리뉴클레오타이드의 오버행에 상보적인 오버행을 갖지 않는다. 이러한 제3 실시예에서, DNA 리가제의 존재 하에 적절한 II형 효소에 의한 이들 코딩 폴리뉴클레오타이드의 방출은 제1 위치에서 상기 제1 또는 제2 뉴클레오타이드 서열을 포함하고, 뒤이어 상기 제3 및 제4 뉴클레오타이드 서열을 각각 포함하도록 다양한 생성물 뉴클레오타이드의 형성을 초래한다.
폴리뉴클레오타이드를 조합하기 위한 이러한 방법은 수득된 생성물 뉴클레오타이드를 벡터, 바람직하게는 원형 벡터에 통합하는 것을 수반할 수 있다. 이러한 통합은 이하 지정 벡터로 지칭되는 벡터를 사용하여 달성될 수 있으며, 이러한 벡터는 바람직하게는 II형 제한 효소를 사용하여 절단되도록 설계되며, 따라서, 절단 후, 생성물 폴리뉴클레오타이드의 제1 오버행과 상보적인 오버행을 하나의 말단에 포함하고 상기 생성물 폴리뉴클레오타이드의 제2 오버행과 상보적인 오버행을 또 다른 말단에 포함하는 벡터 단편이 발생되며, 여기서, 상기 벡터 단편은 바람직하게는, 벡터 단편을 발생시키거나 타일 폴리뉴클레오타이드로부터 상기 코딩 폴리뉴클레오타이드를 방출시키기 위해 사용되는 임의의 II형 효소에 의해 인지되는 임의의 II형 인지 서열을 포함하지 않는다. DNA 리가제의 존재 하에 적절한 II형 효소에 의한 상기 코딩 폴리뉴클레오타이드 및 상기 벡터 단편의 방출은 동일하거나 다양한 생성물 폴리뉴클레오타이드를 포함하는 이러한 원형 벡터의 형성을 초래한다. 이러한 벡터는 생성물 뉴클레오타이드, 또는 상기 생성물 뉴클레오타이드로부터의 발현 생성물의 특성을 연구하는 데 사용될 수 있다.
폴리뉴클레오타이드를 조합하기 위한 이러한 방법은 단백질의 연구, 설계 또는 조작에서 중요한 툴임이 명백하다. 특히, 이들 방법은 각각의 타일 폴리뉴클레오타이드로부터 동일한 또는 다수의 상이한 생성물 뉴클레오타이드 내로 방출되는 다수의 코딩 폴리뉴클레오타이드의 유도, 무작위 or 준-무작위 조립에 의한 새로운 단백질의 설계를 가능하게 한다. 후속적으로, 각각의 이들 생성물 뉴클레오타이드는 발현될 수 있고, 생성된 단백질은 분석되어, 이들의 물리화학적, 효소적, 기능적 또는 다른 특성이 결정될 수 있다. 여러 가지 단백질이 발생되었으며, 따라서 임의의 이들 단백질이 요망되는 특성을 갖는 기회는, 다수의 변이체가 적어도 하나의 방출된 코딩 폴리뉴클레오타이드에 이용 가능할 때 증가될 수 있고, 여기서, 상기 변이체는 상기 코딩 폴리뉴클레오타이드의 하나 이상의 위치에서 서열이 상이하지만, 방출된 코딩 폴리뉴클레오타이드의 오버행의 위치에서의 임의의 서열 차이는 배제한다. 이러한 방식으로, 생성물 뉴클레오타이드는 각각의 코딩 폴리뉴클레오타이드 서열의 순서에서 다양하게 생성될 수 있을 뿐만 아니라 이들 생성물 뉴클레오타이드가 포함하는 코딩 폴리뉴클레오타이드의 서열 변이체에서도 다양하게 생성될 수 있다. 일상적인 단백질 설계 및 조작 프로젝트에서 이러한 부가적인 수준의 변동(변동)을 도입하기 위해, 상기 타일 폴리뉴클레오타이드, 특히 타일 벡터를 제조하는 효율적인 방법이 필요하다. 바람직하게는, 이러한 방법은 주어진 단백질 코딩 폴리뉴클레오타이드에 대한 변이체의 집합(collection)으로부터 출발하여 다수의 타일 폴리뉴클레오타이드 또는 타일 벡터의 발생을 가능하게 하고 용이하게 한다. 대안적으로, 이러한 방법은 이러한 타일 폴리뉴클레오타이드 또는 타일 벡터의 발생 동안 또는 이후에 코딩 폴리뉴클레오타이드에 서열 변동을 도입할 수 있게 한다.
따라서, 제1 목적에서, 본 발명은 이러한 타일 폴리뉴클레오타이드, 바람직하게는 타일 벡터를 발생시키는 방법을 제공한다. 상기 방법은 특히, 주어진 코딩 폴리뉴클레오타이드의 다수의 변이체를 포함하는 이러한 타일 폴리뉴클레오타이드, 특히 타일 벡터의 라이브러리의 효율적인 발생을 위해 맞춰진다. 보다 특히, 본 발명은 타일 벡터(24)(도 14)를 제조하는 방법을 제공하며, 상기 타일 벡터는 바람직하게는 선택적 마커(6) 및 코딩 폴리뉴클레오타이드(10)를 포함하는 벡터이고, 여기서, 상기 코딩 폴리뉴클레오타이드(10)의 바로 앞과 뒤에 선행 및 후행 II형 인지 서열(12)이 존재하고, 상기 선행 및 후행 인지 서열은 동일한 II형 제한 효소에 의해 인지되지만 반대 방향을 가진다. 보다 특히, 상기 선행 및 후행 II형 인지 서열(12)의 위치 및 배향은 상응하는 II형 제한 효소에 의한 상기 타일 벡터의 절단을 제공하여, 이의 각각의 말단에 공지된 배향 및 길이를 갖는 오버행 서열을 갖는 상기 코딩 폴리뉴클레오타이드 서열의 방출을 초래하는 한편, 상기 선행 및 후행 II형 인지 서열은 결여되어 있다. 제1 단계 (a)에서, 이러한 타일 벡터의 제조는 초기 코딩 폴리뉴클레오타이드(8), 예를 들어 효소 또는 항체의 기능 단위를 인코딩하는 폴리뉴클레오타이드를 제공하는 단계, 및 상기 폴리뉴클레오타이드의 각각의 말단을 제1(16) 및 제2(17) 종결 서열을 이용하여 연장하는 단계를 수반하고, 여기서, 상기 종결 서열은 각각 하기의 요소를 포함한다(도 13):
i. 상기 초기 코딩 폴리뉴클레오타이드(8)의 개방 해독틀의 각각의 말단에 인접하고 이와 프레임 내에서 첨가되는 코딩 연장 서열(11)(3xn). 전형적으로, 타일 벡터의 상기 코딩 폴리뉴클레오타이드(10)는 상기 코딩 연장 서열(11)을 이용하여 연장된 초기 코딩 폴리뉴클레오타이드(8)로 구성되며;
ii. 상기 코딩 연장 서열에 인접한 제1 II형 인지 서열(12)로서, 여기서, 상기 제1 인지 서열은 상기 제1 인지 부위를 인지하는 II형 제한 효소가 상기 코딩 연장 서열 내에서 절단하여 오버행을 발생시킬 수 있도록 배향되며, 상기 오버행은 상기 초기 코딩 폴리뉴클레오타이드의 개방 해독틀과 틀 내에 존재하고, 제1 및 제2 종결 서열의 상기 제1 II형 인지 서열은 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는 것인, 제1 II형 인지 서열(12);
iii. 상기 제1 II형 인지 서열에 인접하거나 그 안의 스페이서 서열(13);
iv. 상기 스페이서 서열에 인접한 제2 II형 인지 서열(14)로서, 여기서, 상기 제2 인지 서열은 상기 제2 인지 서열을 인지하는 II형 제한 효소가 상기 스페이서 서열을 절단하여 스페이서 오버행을 발생시킬 수 있도록 배향되고, 상기 제2 II형 인지 서열은 상기 제1 II형 인지 서열을 인지하는 II형 효소에 의해 인지되지 않는 것인, 제2 II형 인지 서열(14). 특정 실시형태에서, 상기 제1 및 제2 종결 서열의 상기 제2 II형 인지 서열은 동일한 II형 효소에 의해 인지되도록 선택되는 것인, 제2 II형 인지 서열(14);
v. II형 제한 효소가 상기 제2 인지 서열에 결합할 수 있도록 충분한 길이의 테일 서열(15).
사용되는 제한 효소의 유형에 따라, 테일 서열(15)은 또한 부재(absent)할 수 있으며, 그러는 한, 선택된 제한 효소는 이러한 추가의 테일 서열의 부재 시 제2 인지 서열에 결합할 수 있다. 따라서, 본 발명의 맥락에서, 테일 서열(15)은 종결 서열의 선택적 요소이다. 더욱이, II형 제한 효소의 결합을 가능하게 하는 데에 추가의 테일 서열이 필요하고, 상기 테일 서열은 바람직하게는 0 내지 28개의 뉴클레오타이드를 포함하고; 보다 바람직하게는 상기 테일 서열은 3 내지 6개의 뉴클레오타이드를 포함한다.
제2 단계 (b)에서, 이러한 타일 벡터의 제조는 수용 벡터(1)를 제공하는 단계를 수반하며, 상기 수용 벡터는 제1(3)과 제2(4) II형 인지 서열 사이에 위치한 선택적 마커(6)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 벡터이고, 따라서, 상기 벡터는 상기 제1 및 제2 II형 인지 서열을 인지하는 II형 인지 효소를 사용하여 절단되어,
· 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 포함하는 스터퍼 서열(2)로서, 바람직하게는 상기 스터퍼 서열은 역-선택적 마커(5)를 추가로 포함하는, 스터퍼 서열(2);
· 상기 선택적 마커(6)를 포함하지만 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)이 결여되어 있고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(7)으로서, 여기서, 1개의 오버행은 상기 제1 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 인지 효소를 사용하여 상기 제1 종결 서열을 절단한 후 수득되는 스페이서 오버행에 상보적인 한편, 다른 오버행 서열은 상기 제2 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 제한 효소를 사용하여 상기 제2 종결 서열을 절단함으로써 수득되는 스페이서 오버행에 상보적인 것인, 선택적 벡터 단편(7)
을 형성한다.
전형적으로, 수용 벡터(1)의 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)은 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는다.
제3 단계 (c)에서, 이러한 타일 벡터의 제조는 혼합물을 인큐베이션하는 단계를 수반하며, 여기서, 상기 혼합물은
i. 단계 (a)의 연장된 초기 코딩 폴리뉴클레오타이드;
ii. 단계 (b)의 수용 벡터(1);
iii. 상기 연장된 초기 코딩 폴리뉴클레오타이드의 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 제한 효소;
iv. 수용 벡터의 상기 제1 II형 인지 서열 및 제2 II형 인지 서열을 인지하는 II형 제한 효소;
v. DNA 리가제
를 포함한다.
본 발명의 방법에 사용되는 제한 효소의 수를 제한하기 위해, 수용 벡터(1)의 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)이, 상기 연장된 초기 코딩 폴리뉴클레오타이드의 제1 종결 서열(16) 및 제2 종결 서열(17)의 제2 II형 인지 서열(14) 둘 모두와 동일한 II형 제한 효소에 의해 인지되는 것이 바람직하다. 이러한 방식으로, 단일 제한 효소는 연장된 초기 코딩 서열의 절단 및 수용 벡터의 절단을 제공한다.
본 발명의 방법을 융통성 있는 방식으로 수행하기 위해, 상기 제1 및 제2 II형 인지 서열이 제1 및 제2 다중 클로닝 부위 내에 포함된 수용 벡터가 설계되었다. 상기 제1 다중 클로닝 부위는 일련의 다수의 상이한 II형 인지 서열을 포함하는 한편, 상기 제2 다중 클로닝 부위는 제1 다중 클로닝 부위에서와 동일한 II형 효소에 의해 인지되는 반대로 배향된 II형 인지 서열을 포함한다. 유리하게는, 상기 다중 클로닝 부위를 포함하는 이러한 수용 벡터는 단계 (a)에서 수득된 바와 같이 임의의 연장된 초기 코딩 폴리뉴클레오타이드와 함께 단계 (c)에서 단일 II형 제한 효소를 사용하여 본 발명의 방법을 수행하는 데 사용될 수 있으며, 이는 각각이 동일한 II형 인지 효소에 의해 인지되는 제2 II형 인지 서열(14)을 포함하는 제1(16) 및 제2 (17) 종결 서열을 포함하고, 이는 또한, 상기 다중 클로닝 부위에서 인지 서열을 인지한다. 흥미롭게는, 상기 다중 클로닝 부위를 포함하는 이러한 수용 벡터는 단백질 코딩 서열의 조합 또는 셔플링 이외의 적용에 유용할 수 있다. 따라서, 상기 특정 수용 벡터는 본 발명의 독립적인 목적이다.
본 발명은 전형적으로, 코딩 폴리뉴클레오타이드 서열(10)이 초기 코딩 폴리뉴클레오타이드 서열(8)을 포함하고 이것의 바로 앞뒤에 코딩 연장 서열(11)(3xn)이 있는 것을 특징으로 한다. 상기 코딩 연장 서열(11)은 전형적으로, 3개 뉴클레오타이드로 구성된 다수의 세트(3xn)로 구성되며, 여기서, n은 1부터 출발하는 임의의 수일 수 있으며; 바람직하게는 n은 1 내지 10의 범위이고, 보다 바람직하게는 n은 1 내지 6의 범위이며, 보다 더 바람직하게는 n은 1, 2, 3, 4, 5 또는 6이고; 가장 바람직하게는 n은 2이다. n이 2인 것으로 선택되는 경우, 6개의 뉴클레오타이드(3 x 2)가 2개의 아미노산을 인코딩한다.
구체적으로, 바람직한 코딩 폴리뉴클레오타이드 서열(10)은 ACCATG, GGTGCT, GCAGGC, GGAAGC, AAGTAA, AGCACA, CCAACG, ACGAGC, CCGTCT, TCTGGT, GGTTCA를 포함하는 목록(상응하는 코딩 연장 서열에 대해서는 표 1을 또한 참조)으로부터 선택된다.
II형 제한 효소를 이용하여 분해되어 생성된 오버행(대체로 4개 뉴클레오타이드)은 제1 코돈의 마지막 2개의 뉴클레오타이드 및 제2 코돈의 첫번째 2개의 뉴클레오타이드를 포함한다. 2개의 인접한 초기 코딩 폴리뉴클레오타이드 서열의 코딩 연장 서열은, 발생된 오버행(대체로 4개 뉴클레오타이드)이 상보적인 한, 동일하지 않아야 한다. 따라서, 코딩 연장 서열의 제1 및 제6 뉴클레오타이드는 자유롭게 선택될 수 있으며, 2개(또는 그 이상)의 아미노산을 결정한다.
본 발명의 방법의 특정 실시형태에서, 상기 종결 서열(16, 17)을 이용하여 연장된 상기 초기 코딩 폴리뉴클레오타이드(8)(단계 (a) 참조)는 DNA 합성 방법을 사용하여 제조된다.
본 발명의 방법의 특정 실시형태에서, 초기 코딩 폴리뉴클레오타이드(8)는 상기 종결 서열(16, 17)(단계 (a) 참조)을 이용하여 중합효소 연쇄 반응(PCR)을 사용하여 연장되며, 상기 초기 코딩 폴리뉴클레오타이드의 각각의 말단 상에서 테일드 포워드 및 리버스 프라이머 어닐링의 사용을 수반하고, 여기서, 포워드 프라이머의 상기 테일은 제1 종결 서열(16)을 첨가하고, 리버스 프라이머의 테일은 제2 종결 서열(17)을 첨가한다. 추가의 특정 실시형태에서, 상기 PCR에 사용된 프라이머 및 반응 조건은 상기 초기 코딩 서열 내에서 유도 또는 무작위 돌연변이의 도입을 촉진하기 위해 선택된다. 예를 들어, 상기 PCR 반응 조건은 에러 유발 PCR 조건일 수 있으며, 따라서 다수의 벡터를 발생시키며, 이러한 벡터는 이들이 상기 초기 코딩 폴리뉴클레오타이드의 무작위 돌연변이체를 포함한다는 점에서 서로 다양하다.
또 다른 특정 실시형태에서, 본 발명의 방법은 상기 타일 벡터에 포함된 초기 코딩 폴리뉴클레오타이드의 서열에 하나 이상의 유도 돌연변이를 도입하는 부가적인 단계를 포함하며, 상기 부가적인 단계는 Kunkel 방법, 미스매치 프라이머를 이용한 PCR 부위-특이적 돌연변이생성, 또는 전체 플라스미드 돌연변이생성(예를 들어 Quickchange 방법)의 사용을 포함한다.
제2 목적에서, 본 발명은 선택적 마커(6) 및 코딩 폴리뉴클레오타이드 서열(10), 이의 바로 앞뒤에 선행 및 후행 II형 인지 서열(12)을 포함하는 타일 벡터(24)를 제공하며, 여기서, 상기 선행 및 후행 II형 인지 서열(12)은 동일한 II형 제한 효소에 의해 인지되지만 반대 배향을 갖는다. 상기 타일 벡터는 추가로, 코딩 폴리뉴클레오타이드 서열(10)이 초기 폴리뉴클레오타이드 서열(8) 및 이의 바로 앞뒤에 2개의 코딩 연장 서열(11)(3xn)을 포함하는 것을 특징으로 하며, 상기 코딩 연장 서열은 초기 코딩 서열(8)의 개방 해독틀과의 틀 내에 존재한다.
제3 목적에서, 본 발명은 초기 코딩 폴리뉴클레오타이드 서열(8) 및 제1 및 제2 종결 서열(16, 17)을 포함하는 폴리뉴클레오타이드 서열을 제공하며, 여기서, 각각의 상기 제1 및 제2 종결 서열(16, 17)은 하기의 요소:
i. 코딩 연장 서열(11)(3xn)로서, 초기 코딩 폴리뉴클레오타이드(8)의 바로 앞뒤에 존재하고 상기 초기 코딩 폴리뉴클레오타이드 서열(8)의 개방 해독틀과의 프레임 내에서 존재하는, 코딩 연장 서열(11)(3xn);
ii. 상기 코딩 연장 서열(11)(3xn)에 인접한 제1 II형 인지 서열로서, 여기서, 상기 제1 유형 인지 서열은 상기 제1 인지 부위를 인지하는 II형 제한 효소가 상기 코딩 연장 서열(11)(3xn) 내에서 절단하여 오버행을 발생시킬 수 있도록 배향되고, 제1 및 제2 종결 서열의 상기 제1 II형 인지 서열은 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는 것인, 제1 II형 인지 서열;
iii. 상기 제1 II형 인지 서열(12)에 인접하거나 그 안의 스페이서 서열(13);
iv. 상기 스페이서 서열(13)에 인접한 제2 II형 인지 서열(14)로서, 여기서, 상기 제2 인지 서열(14)은 상기 제2 인지 서열(14)을 인지하는 II형 제한 효소가 상기 스페이서 서열(13)을 절단하여 스페이서 오버행을 발생시킬 수 있도록 배향되고, 제1 및 제2 종결 서열의 상기 제2 II형 인지 서열(14)은 상기 제1 II형 인지 서열(12)을 인지하는 II형 효소에 의해 인지되지 않는 것인, 제2 II형 인지 서열(14);
v. II형 제한 효소가 상기 제2 인지 서열(14)에 결합할 수 있도록 충분한 길이의 테일 서열(15)
을 포함한다.
추가의 실시형태에서, 상기 인공 폴리뉴클레오타이드 서열은 본원 상기에서 열거된 바와 같이 본 발명의 임의의 실시형태에 따라 타일 벡터를 제조하는 방법에 사용될 수 있다.
제4 목적에서, 본 발명은 2개 이상의 코딩 폴리뉴클레오타이드를 접합시켜 생성물 폴리뉴클레오타이드를 형성하기 위해 이러한 타일 벡터를 사용하는 방법을 제공한다. 전형적으로, 상기 생성물 폴리뉴클레오타이드는 벡터에 통합된다. 본 발명의 이러한 제2 양태에 따른 방법은 혼합물의 인큐베이션을 수반하며, 상기 혼합물은
i. 본 발명의 제1 목적에 따른 방법에 의해 수득되는 2개 이상의 타일 벡터로서, 각각의 이러한 타일 벡터는 2개의 코딩 연장 서열(11)(3xn)을 포함하는 코딩 폴리뉴클레오타이드 서열(10)을 포함하고, 여기서, 상기 코딩 폴리뉴클레오타이드 서열(10)의 바로 앞뒤에 상기 II형 인지 서열(12)이 존재하며, 상기 벡터의 선행 및 후행 인지 서열(12)은 동일한 II형 제한 효소에 의해 인지되는, 2개 이상의 타일 벡터;
ii. 상기 타일 벡터 내에서 상기 선행 및 후행 II형 인지 서열(12)을 인지하고 상기 각각의 벡터로부터 코딩 폴리뉴클레오타이드 서열(10)을 절단하는 II형 제한 효소로서, 여기서, 각각의 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행은 하나의 다른 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행에 상보적인 것인, II형 제한 효소;
iii. 2개의 제1 II형 인지 서열(21) 사이에 위치한 선택적 마커(23)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 지정 벡터(18)(도 15)로서, 여기서, 상기 제1 II형 인지 서열(21)은 II형 제한 효소, 바람직하게는 동일한 II형 제한 효소에 의해 인지되지만, 반대 배향을 가져서, 상기 벡터는 상기 제1 II형 인지 서열(21)을 인지하는 II형 제한 효소를 사용하여 절단되어,
· 상기 제1 II형 인지 서열(21)을 포함하는 스터퍼 서열(20)로서, 바람직하게는 상기 스터퍼 서열은 역-선택적 마커를 추가로 포함하는, 스터퍼 서열(20); 및
· 상기 선택적 마커(23)를 포함하지만 상기 제1 II형 인지 서열(21)이 결여되어 있고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(19)으로서, 여기서, 1개의 오버행은 임의의 상기 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행에 상보적인 한편, 다른 오버행은 임의의 상기 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 다른 오버행에 상보적인 것인, 선택적 벡터 단편(19)
을 형성할 수 있는, 지정 벡터(18);
iv. 상기 지정 벡터의 상기 제1 II형 인지 서열(21)을 인지하는 II형 제한 효소. 본 발명의 제4 목적에 따른 방법의 특정 실시형태에서, 지정 벡터(18)의 상기 제1 II형 인지 서열(21)은 상기 타일 벡터의 상기 선행 및 후행 인지 서열을 인지하는 동일한 II형 제한 효소에 의해 인지된다. 이러한 방식으로, 동일한 II형 제한 효소는 상기 타일 벡터(24) 및 상기 지정 벡터(18)를 절단하는 데 사용될 수 있는, II형 제한 효소; 및
v. DNA 리가제
를 포함한다.
바람직하게는, 이러한 제4 양태에 따른 방법에 사용되는 바와 같은 타일 벡터는 본 발명의 제1 목적의 방법에 따라 제조된다.
전형적으로, 코딩 폴리뉴클레오타이드의 서열은 상기 타일 벡터 사이에서 상이하다. 이러한 서열 변동은 (i) 타일 벡터가 주어진 코딩 폴리뉴클레오타이드의 변이체를 포함하며, (ii) 타일 벡터가 단백질의 상이한 기능적 또는 다른 단위를 인코딩하는 코딩 폴리뉴클레오타이드를 포함하며, 및/또는 (iii) 타일 벡터가 상이한 오버행 서열을 갖는 코딩 폴리뉴클레오타이드를 방출하도록 설계되는 데 있을 수 있다.
전형적으로, 방출된 코딩 폴리뉴클레오타이드가 생성물 뉴클레오타이드에서 조합되는 순서는 각각의 방출된 코딩 폴리뉴클레오타이드의 오버행의 상보성에 의해 결정되며, 이는 즉, 각각의 코딩 폴리뉴클레오타이드에 통합된 바와 같이 코딩 연장 서열의 설계에 의해 결정된다. 바람직하게는, 본 발명의 제4 목적에 따른 방법에서, 타일 벡터의 선택은 예정된 수의 연결된 코딩 폴리뉴클레오타이드를 포함하는 생성물 뉴클레오타이드의 형성을 유도하도록 설계되고, 여기서, 방출된 코딩 폴리뉴클레오타이드의 오버행 서열은 생성물 뉴클레오타이드에서 코딩 폴리뉴클레오타이드의 순서 내에서 상기 코딩 폴리뉴클레오타이드의 위치를 정의한다. 더욱이, 타일 벡터는 뉴클레오타이드 서열이 상이하지만 동일한 오버행 서열을 공유하는 2개 이상의 방출된 코딩 폴리뉴클레오타이드를 제공하도록 선택될 수 있으며, 여기서, 상기 방법은 상기 방출된 코딩 폴리뉴클레오타이드의 상기 공유된 오버행 서열에 의해 정의된 바와 같이 상기 생성물 뉴클레오타이드에서 위치에서 뉴클레오타이드 서열이 다양한 상이한 생성물 뉴클레오타이드의 형성을 초래한다. 뉴클레오타이드 서열이 상이하지만 동일한 오버행 서열을 공유하는 이러한 방출된 코딩 폴리뉴클레오타이드는 주어진 단백질 단위를 인코딩하는 폴리뉴클레오타이드의 상이한 변이체 또는 돌연변이체를 포함할 수 있다. 대안적으로, 뉴클레오타이드 서열이 상이하지만 동일한 오버행 서열을 공유하는 이러한 방출된 코딩 폴리뉴클레오타이드는 상이한 단백질 단위를 인코딩하는 상이한 폴리뉴클레오타이드를 포함한다.
전형적으로, 본 발명의 제4 목적에 따른 방법은 코딩 뉴클레오타이드를 방출하도록 설계된 타일 벡터의 선택을 사용하여 수행되며, 이중 이들의 각각의 오버행의 상보성이 동일한 방향을 갖는 오버행으로의 오버행의 짝지음(pairing)을 선호하는, 바람직하게는 제약한다. 이러한 방식으로, 수득된 생성물 뉴클레오타이드는 단일 해독틀에서 상기 코딩 폴리뉴클레오타이드를 조합한다.
나아가, 본 발명은 선택적 마커(23), 2개의 제1 II형 인지 서열(21) 및 역-선택적 마커를 포함하는 지정 벡터(18)를 제공하며,
- 선택적 마커(23)는 2개의 (3xn) 서열(P1 및 Pn+1) 사이에 위치하고, 상기 각각의 서열 뒤에 제1 II형 인지 서열(21)이 존재하고;
- 2개의 제1 II형 인지 서열(21)은 상기 2개의 제1 II형 인지 서열(21)을 인지하는 동일한 II형 제한 효소에 의해 인지되는 것을 특징으로 한다.
구체적인 실시형태에서, 지정 벡터(18)는 pVTSD1-pVTSD9(SEQ ID N°13-SEQ ID N°21)를 포함하는 목록으로부터 선택되며; 보다 구체적으로, 지정 벡터는 pVTSD2(SEQ ID N°14), pVTSD3(SEQ ID N°15), pVTSD4(SEQ ID N°16), pVTSD5(SEQ ID N°17), pVTSD6(SEQ ID N°18), pVTSD7(SEQ ID N°19), pVTSD8(SEQ ID N°20), pVTSD9(SEQ ID N°21)를 포함하는 목록으로부터 선택된다.
본 발명은 또한, 2개의 다중 클로닝 부위 사이에 위치한 선택적 마커(6)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 수용 벡터(1)를 제공하며, 제1 다중 클로닝 부위는 일련의 다수의 상이한 II형 인지 서열을 포함하고, 제2 다중 클로닝 부위는 제1 다중 클로닝 부위에서와 동일한 II형 효소에 의해 인지되는 반대로 배향된 II형 인지 서열을 포함하고, 여기서, 상기 다중 클로닝 부위는 제1(3) 및 제2(4) II형 인지 서열을 포함하며; 따라서, 상기 벡터는 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 인지하는 II형 인지 효소를 사용하여 절단되어,
- 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 포함하는 스터퍼 서열(2); 및
- 상기 선택적 마커(6)를 포함하지만 상기 제1 및 제2 II형 인지 서열이 결여되고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(7)
을 형성할 수 있다.
수용 벡터는 다수의 II형 제한 부위(다중 클로닝 부위)의 존재에 의해 특징화되며, 이러한 수용 벡터는, 인지 부위 중 하나가 타일 벡터로 전환되어야 하는 코딩 폴리뉴클레오타이드 서열에 존재한다면, 실험자에게 더 큰 융통성을 제공한다. 2개의 II형 다중 클로닝 부위는 각각의 반대 방향으로, 수용 벡터에 존재하며, 이와 더불어 음성 선택 마커로서 삽입된 sacB 서열이 측면에 존재한다. 기능성 다중 클로닝 부위를 갖기 위해, 이들 II형 제한 효소의 존재하는 인지 부위는 또한, 백본으로부터 제거되었다. 부가적으로, 전체 플라스미드는 프로모터, 리포터 유전자 및 발현 요소의 제거를 포함하여, 타일 담체로서만 역할을 하도록 추가로 감소되었다.
실시예
실시예 1: 평활-말단 연결을 사용한 타일 벡터의 구축을 위한 일반적인 프로토콜
타일은 각각의 면(side)에서 코딩 연장 서열(11)의 측면에 있는 각각의 모듈의 초기 코딩 서열 및 궁극적인 말단에서 인워드(inwards) 배향된 제1 II형 인지 부위(12)이다. 타일이 수용 벡터에 존재하는 경우, 이러한 타일은 타일 벡터로 지칭될 것이다. 일반적으로, 각각의 모듈(100 bp 초과)의 초기 코딩 폴리뉴클레오타이드 서열을, 교정 PCR 효소와 함께 표준 PCR 조건 및 프라이머를 사용하여 증폭시켰다. 내부 II형 인지 부위가 초기 코딩 폴리뉴클레오타이드 서열에 존재한다면, 이를 우선, 돌연변이화된 미스매치를 포함하여 중첩 프라이머를 사용한 중첩-연장-의한-스플라이싱(SOE) 기술을 사용하여 제거하여, II형 인지 부위를 변형시켰다(도 2). 유사한 결과를 갖는 상이한 부위-특이적 돌연변이생성 방법을 사용할 수 있다.
특이적인 PCR 생성물을 정제하였다. 특이적인 생성물의 경우, PCR 조건을 최적화하였거나, 또는 겔 추출 프로토콜을 사용하여 순수한 특이적인 생성물을 수득하였다. 소형(small) 초기 코딩 폴리뉴클레오타이드 서열(100 bp 미만)을 프라이머 혼성화에 의해 발생시켰다. 이러한 프라이머를 이들이 적어도 15개의 중첩 염기쌍을 갖는 방식으로 설계하였으며, 이는 혼성화 후 완전한 초기 코딩 폴리뉴클레오타이드 서열을 초래한다. 프라이머들을 등몰량(5 μM)으로 혼합하고, 95℃(5분)의 출발 온도를 이용하여 가열 블록(heat block)에서 인큐베이션하고, 뒤이어 실온(20℃)까지 점차 냉각시켰다. 60 bp 미만의 단편의 경우, 프라이머 혼성화는 완전한 초기 코딩 폴리뉴클레오타이드 서열을 초래한 한편, 60 내지 100 bp 길이의 단편의 경우, 오버행잉(overhanging) 단일-가닥 DNA에서 충전시키기 위해 부가적인 충전(fill-in) 단계가 필요하였다. 충전 반응은 Pfu DNA 중합효소를 이용하여 수행하였다(72℃에서 10분).
4개의 사용된 수용 벡터를 pUC19 벡터 백본으로부터 구축하였다. 본원에서, 앰피실린(amp) 내성 유전자에 위치한 내부 BsaI 인지 부위를 먼저 부위-특이적 돌연변이생성을 통해 제거하여(pUC19*), VersaTile 셔플링 반응 동안 벡터 백본의 분해를 방지하였다(도 1 참조). 4개의 수용 벡터(pVTSE1, pVTSE2, pVTSE3, pVTSE4 또는 일반적으로 pVTSEx, 이때 x는 조립체에서 특이적인 위치에 상응하는 코딩 연장 서열의 특이적인 세트를 지칭함)를 생성하기 위해, 2개의 BasI 인지 부위 측면에 코딩 연장 서열(Pn 및 Pn+1로서, 이때 n은 조립체 내의 타일의 위치임, 도 15)을 함유하는 카세트를 먼저 HindIII와 XbaI 인지 부위(도 3) 사이의 다중 클로닝 부위에 삽입하였다. 생성된 4개의 빈(empty) 수용 벡터를 인버스 PCR(iPCR)에 의해 선형화하였다. 각각의 pVTSEx에 대해, 프라이머 세트를 인서트 카세트 및 벡터 백본의 일부에 상보적이도록 설계하였다(표 2 참조).
표 2: iPCR에 사용되는 프라이머의 개요. BsaI는 볼드체로, 코딩 연장 서열은 밑줄이 그어져 있다.
Figure pct00002
인버스 PCR(iPCR)을 Pfu DNA 중합효소(Thermo Scientific사)를 이용하여 수행하였다. 요망되는 생성물(2710 bp)의 길이때문에 연장 단계(72℃)를 6분까지 연장시켰다. 생성된 선형화된 pVTSEx를 겔 전기영동을 통해 조절하고, PCR 정제 또는 겔 추출을 이용하여 정제하였다. 평활-말단 연결을 사용하여, 인서트 단편(초기 코딩 폴리뉴클레오타이드 서열)을 선형화된 pVTSEx에서 연결하였다. 선형화된 pVTSEx(50 ng) 및 인서트 단편을 각각 1:3 몰비로 혼합하였다. 사용된 반응 혼합물의 조성을 표 3에 제공한다(모든 구성성분을 Thermo Scientific사로부터 주문하였음). 반응 혼합물을 22℃에서 1시간 동안 인큐베이션하고, 뒤이어 65℃에서 10분의 불활성화 단계를 수행하였다.
표 3: 평활 말단 연결 반응 혼합물의 개요.
Figure pct00003
화학적으로 적격인 이. 콜라이 TOP10 세포(루비듐 클로라이드 방법 사용)를 pVTSEx 및 인서트 단편의 연결 혼합물을 이용하여 형질변환시켰다. 10 μL의 각각의 연결 혼합물을 첨가하고 이러한 혼합물을 얼음 상에서 30분 동안 인큐베이션함으로써, 형질변환을 수행하였다. 인큐베이션 후, 열 충격(42℃)을 적용하고, 1 mL LB 배지를 첨가하였다. 후속적으로, 세포를 37℃에서 1시간 동안 인큐베이션하여, 항생제 내성을 발달시켰다. 인큐베이션 후, 세포를 100 μL/ml 앰피실린 및 X-gal을 함유하는 선택적 플레이트 상에 평판배양하였다(900 μL 및 100 μL). 블루-화이트 스크린의 경우, 디메틸포름아미드(10 mg/mL) 중 X-gal 용액을 만들었으며, 이 중 1 mL 배지 당 2 μL를 첨가하였다. pUC19* 벡터 백본 상에 위치한 하나의 프라이머(M13-포워드-D20 프라이머 pUC19) 및 반대 방향에서 인서트 상의 하나의 프라이머를 이용하여 유도 PCR을 수행한다. 초기 코딩 폴리뉴클레오타이드를 올바른 배향으로 삽입할 때만, 증폭이 일어날 것이다. 선택적 플레이트로부터, 각각의 구축물에 대해 8개의 콜로니를 집어 내어, DreamTaq DNA 중합효소(Thermo Scientific사) 반응 혼합물에서 용해시켰다. DreamTaq 그린 완충제를 사용하여, 유도 PCR 후 시료를 겔 전기영동을 위해 바로 로딩할 수 있었다. 각각의 분석된 콜로니에 대해, 새로운 선택적 플레이트 상에서 복제물을 스트리킹하였다(streak). 겔 전기영동에 의해 분석된 바와 같이 성공적인 클론을 Sanger 시퀀싱에 의해 서열 입증하였으며, 플라스미드 스톡(stock)/글리세롤 스톡을 제조하였다.
실시예 2: 점착(sticky)-말단 II형 제한 효소를 사용한 타일 벡터의 구축을 위한 일반적인 프로토콜
표준 제한 및 연결 단계를 사용하여 타일 구축을 수행하였다. 이제, 초기 코딩 폴리뉴클레오타이드 서열을, 각각의 프라이머의 5' 말단에 후속적으로 테일 서열(15), 제한 부위(포워드 프라이머에 대해 HindIII 및 리버스 프라이머에 대해 XbaI), 제1 II형 인지 서열 및 각각의 코딩 연장 서열을 포함하는 프라이머를 이용하여 증폭시켰다. 점착-말단 연결에 사용된 pVTSEI 수용 벡터는, 실시예 1에 사용된 pVTSEx와는 대조적으로 최종 조립체에서 보편적이고 각각의 위치에 특이적이지 않다. pVTSEI 벡터는 pUC19로부터 출발하여 부위-특이적 돌연변이생성에 의해 앰피실린 내성 유전자에서 내부 BsaI 인지 부위의 제거에 의해 수득된다. 특이적인 PCR 생성물을 정제하며, HindIII 및 XbaI을 이용하여 이중 분해하고, 재-정제한다. 보편적인 pVTSEI 벡터를 준비하고, HindIII 및 XbaI을 이용하여 이중 분해하고, 탈인산화한 다음, 정제한다. 표준 연결 및 형질변환 프로토콜을 이용하여, 새로운 클론을 수득하고, PCR 클론 분석에 의해 분석하고, 서열 입증한다. 초기 코딩 폴리뉴클레오타이드 서열과 함께 올바른 타일 벡터를 함유하는 클론을 플라스미드 및 글리세롤 스탁으로서 저장한다.
실시예 3: II형 제한 효소를 사용한 타일 벡터의 구축을 위한 일반적인 프로토콜
상이한 프로토콜에서, 실시예 2에서 접근법을 추가로 변형하였다. PCR용 프라이머에서 제한 부위를 II형 제한 효소 BpiI(BbsI)의 인워드 배향 인지 부위(제2 II형 인지 서열, 14), 뒤이어 6 nt(스페이서 서열, 13)로 교환하였다. 따라서, 각각의 프라이머의 상이한 부분의 완전한 순서는 테일 서열(15), 인워드 배향 BpiI 인지 부위(14), 4개는 보존된 것인 6개의 뉴클레오타이드(13), 인워드 배향 BsaI 인지 부위(12), 코딩 연장 서열, 및 증폭될 단편의 말단에 매칭되는 뉴클레오타이드이다. 새로운 보편적인 수용 벡터(pVTSEII - SEQ ID N°9)를 pVTSEI로부터 출발하여 구축하였다. HindIII과 XbaI 제한 부위 사이에, 인서트(NNGATA)의 포워드 프라이머의 스페이서 서열에서와 같이 동일한 6개 뉴클레오타이드, 아웃워드 배향 BpiI 인지 부위, sacB 유전자, 아웃워드 배향 Bpil 인지 부위, 및 인서트(NNAAGC)의 리버스 프라이머의 스페이서 서열의 동일한 6개 뉴클레오타이드를 포함한다(도 4).
표 4: 반응 혼합물 및 VTS 반응 조성물
Figure pct00004
정제된 PCR 생성물, pVTSEII 수용 벡터, BpiI 및 T4 DNA 리가제를 단일 튜브에서 혼합하고, 뒤이어 최적의 연결 온도와 분해 온도 사이에서 온도 프로그램 사이클링(표 4), 뒤이어 리가제 및 II형 제한 효소 각각의 단계별 가열 불활성화는 pVTSEII에서 제1 및 제2 종결 서열의 측면에서 초기 코딩 폴리뉴클레오타이드 서열의 1-단계 연결을 초래한다.
프로토콜의 추가의 연장은 pVTSEII(도 4)에서 Bpil과 동일한 방향에서 배향된 몇몇 II형 인지 부위(표 5)를 포함하는 II형 다중 클로닝 부위를 함유하는 pVTSEIII(SEQ ID N°10)의 구축이다. 1개 초과의 II형 인지 부위의 존재는 시험자가, 타일 벡터 구축에 가장 적절한 II형 제한 효소를 선택할 수 있게 한다. 이는, 사용되는 II형 제한 효소가 각각의 타일에서 이의 인지 부위의 부재를 기초로 선택될 수 있기 때문에 이러한 타일 벡터 구축 방법의 다재다능성(versatility)에 기여하며, 이는 단지 Bpil만 사용될 수 있는 pVTSEII와는 대조적이다.
표 5: pVTSEIII 다중 클로닝 부위에 존재하는 II형 제한 효소(인지 및 제한 서열)의 개요
Figure pct00005
pVTSEIII를 pVTSEII로부터 출발하여 구축한다. pVTSEII를 테일-보유(bearing) 프라이머를 이용하여 선형화하여, sacB 단편을 제거하고, 후속적으로 아웃워드 배향 BseRI 및 인워드 배향 BsmbI, BtgZI 및 BsaI 인지 부위를 선형 벡터에 첨가한다. 유사하게는, sacB 단편을 테일-보유 프라이머를 이용하여 증폭시켜, 아웃워드 배향 BpiI, BfuAI, SapI 및 BtgZI 인지 부위 각각 및 인워드 배향 BsaI 인지 부위의 측면에 sacB 단편을 초래한다. 발생된 선형 벡터에 존재하는 BsaI 인지 부위 및 sacB 단편을, T4 DNA 리가제와 BsaI 둘 모두와 혼합 후, pVTSEIII가 1-단계, 1 혼합물 프로토콜에서 구축되는 방식으로 위치시키고, 이로써 종래의 제한 연결 반응의 노동이 드는 단계를 피한다.
pVTSEIII을 사용한 타일 벡터의 생성은 pVTSEII(표 4, 도 13)에 대한 프로토콜과 유사하다. 그러나, 사용되는 II형 제한 효소의 온도 프로파일에 따라, 인큐베이션 시간, 온도 및 효소의 양이 조정되어야 한다.
실시예 4: 타일 벡터 구축을 위한 프라이머 카세트의 사용
상이한 프로토콜에서, PCR 증폭된 단편 외에도 프라이머 카세트의 사용을 위해 실시예 3에서의 접근법(II형 제한 효소를 사용한 타일 벡터의 구축을 위한 일반적인 프로토콜)을 변형시켰다. 본원에서, 각각의 초기 코딩 폴리뉴클레오타이드 서열을, 제1 및 제2 종결 서열을 포함하여 단일 가닥 DNA 가닥으로서 완전히 합성한다. (제1 및 제2 종결 서열을 포함하여) 최대 60개 염기쌍 길이를 갖는 단편에 대해, 2개의 완전히 상보적인 프라이머를 합성하고 어닐링하여(표 6), 각각의 초기 코딩 폴리뉴클레오타이드 서열 및 측면 제1 종결 서열(16)과 제2 종결 서열(17)을 포함하는 이중 가닥 폴리뉴클레오타이드를 초래한다. 본원에서, 포워드 프라이머에서 상이한 부분의 순서는 하기와 같다: 3개의 무작위 뉴클레오타이드의 테일 서열(15), 인워드 배향 제2 II형 인지 부위(14), 3 또는 4개 뉴클레오타이드가 보존된 6개 뉴클레오타이드의 스페이서 서열(13), 인워드 배향 제1 II형 인지 부위(12), 올바른 코딩 연장 서열(3xn)(11), 초기 코딩 폴리뉴클레오타이드 서열(8), 올바른 코딩 연장 서열(3xn)(11), 인워드 배향 제1 II형 인지 부위(12), 3 또는 4개 뉴클레오타이드가 보존된 6개 뉴클레오타이드의 스페이서 서열(13), 인워드 배향 제2 II형 인지 부위(12) 및 3개 무작위 뉴클레오타이드의 테일 서열(15). 리버스 프라이머는 상기 제1 프라이머의 완전 리버스 보체이고, 이와 같이 완전히 상보적이다. 동일한 농도의 2개 프라이머 모두의 첨가는, 실시예 1 내지 3에서 PCR 증폭된 단편과 유사하게 초기 코딩 폴리뉴클레오타이드 서열 및 각각의 종결 서열을 포함하는 이중 가닥 폴리뉴클레오타이드를 초래한다:
표 6: 프라이머 카세트의 발생을 위한 프로토콜
Figure pct00006
길이가 60 bp 초과인 초기 코딩 폴리뉴클레오타이드 서열에 대해, 다수의 프라이머를 어닐링하고, 뒤이어 중합효소 반응에서 최종 충전하여(표 7), 이중 가닥 폴리뉴클레오타이드 서열에서 최종 갭을 충전시킨다. 프라이머를, 동일 농도에서 이들 프라이머의 혼합이 제1 종결 서열(16) 및 제2 종결 서열(17)을 포함하는 완전 초기 코딩 폴리뉴클레오타이드 서열을 초래하도록 설계한다. 본원에서, 2개의 연속적으로 중첩된 프라이머 사이에 최소 15개의 뉴클레오타이드 중첩이 존재하고, 이는 이들이 프라이머 어닐링을 올바른 순서로 보장하도록 설계된다. 제1 프라이머는 제1 종결 서열(16), 및 초기 코딩 폴리뉴클레오타이드 서열의 제1 부분을 함유한다. 후행 프라이머는 제1 프라이머의 말단에 역상보적인 적어도 15개 뉴클레오타이드, 및 초기 코딩 폴리뉴클레오타이드 서열의 제2 부분을 함유한다. 초기 코딩 폴리뉴클레오타이드 서열이 완전히 피복될 때까지 이를 이와 같이 반복한다. 마지막 프라이머는 이전 프라이머의 말단에 역상보적인 15개 뉴클레오타이드, 초기 코딩 폴리뉴클레오타이드 서열의 마지막 일부 및 제2 종결 서열(17)을 가진다. 동일한 농도에서 이들 프라이머의 혼합, 뒤이어 가열 및 점차적인 냉각은 초기 코딩 폴리뉴클레오타이드 서열 및 제1 종결 서열(16)과 제2 종결 서열(17) 둘 모두를 피복하는 DNA 분자를 초래하며, 이는 부분적으로 이중 가닥이지만 여전히 단일 가닥 신장부(stretch)를 함유하고, 여기서, 프라이머는 상보적인 부분을 갖지 않는다. 생성된 단편을 중합효소 반응(표 7)에서 최종 충전에서 주형으로서 사용하여, 단일 가닥 신장부를 충전시켜, 실시예 1 내지 3과 유사한 이중 가닥 폴리뉴클레오타이드(종결 서열 및 초기 코딩 폴리뉴클레오타이드 서열) 및 완전 중첩 프라이머 세트를 초래한다.
표 7: 중첩 프라이머 세트의 중합효소 반응에서 최종 충전
Figure pct00007
각각의 수용에서 이중 가닥 폴리뉴클레오타이드(이 실시예에서 기재된 바와 같이 프라이머 어닐링에 의해 수득됨)의 클로닝을 위한 프로토콜은 실시예 3에서 설명된 프로토콜과 완전히 유사하다.
이를 프라이머 카세트(60 bp 이하), 및 부분 중첩 프라이머 뿐만 아니라 완 중첩 프라이머로 구성된 DNA 단편(60 bp 초과)을 사용하여 시험하고, 입증하였다. 각각의 수용 벡터에서 구축된 프라이머 카세트/이중 가닥 폴리뉴클레오타이드의 클로닝을 95% 초과의 효율로 수행하였다.
실시예 5: 타일 벡터 구축을 위한, 유전자 합성에 의해 생성된 DNA 단편의 용도
상이한 프로토콜에서, 화학적으로 합성된 이중 가닥 폴리뉴클레오타이드 단편(예를 들어 DNA 스트링(string), gBlocks)의 사용을 위해 실시예 3 및 4의 접근법을 추가로 변형하였다. 본원에서, 제1 종결 서열(16) 및 제2 종결 서열(17)을 포함하는 각각의 초기 코딩 폴리뉴클레오타이드 서열을 유전자 합성을 통해 완전히 발생시킨다. 이들 합성된 이중 가닥 단편에서 상이한 부분의 각각의 순서는 하기와 같다: 테일 서열(15), 제2 II형 인지 부위(14), 스페이서 서열(13), 제1 II형 인지 서열(12), 코딩 연장 서열(11), 초기 코딩 폴리뉴클레오타이드 서열(8), 코딩 연장 서열(11), 제1 II형 인지 부위(12), 스페이서 서열(13), 제2 II형 인지 부위(14) 및 테일 서열(15). 화학적으로 합성된 단편에서 상이한 부분의 순서는 실시예 1 내지 4에서 PCR 증폭된 단편 또는 프라이머 카세트와 완전히 유사하고, 코딩 서열 및 각각의 종결 서열(16, 17)을 포함하는 폴리뉴클레오타이드를 수득하는 데 사용된 방법에서만 상이하다. 각각의 수용에서 화학적으로 합성된 단편을 클로닝하기 위한 프로토콜은 실시예 3에서 설명된 프로토콜과 완전히 유사하다.
실시예 6: 수용 벡터에서 PCR 증폭된 폴리뉴클레오타이드를 클로닝하기 위한 최적화된 프로토콜
실시예 3의 프로토콜을, PCR 반응에 기인할 수 있는 프라이머 이량체의 의도치 않은 클로닝을 피하기 위해 PCR 증폭된 폴리뉴클레오타이드로부터 출발하여 타일 벡터의 구축을 위해 추가로 최적화하였다. 사실상, 빈번하게 발생하는 문제점은, 각각의 종결 서열(16, 17)을 첨가하는 긴(long) 프라이머 테일로 인한 프라이머 이량체의 형성이었다. 생성된 프라이머 이량체의 바람직한 클로닝은 타일 구축 프로토콜의 효율을 유의하게 감소시켰고, 이와 같이 최적화를 위한 유의한 마진(margin)이 존재하였다. 이러한 문제점을 예방하기 위해, 2개의 최적화를 적용하였다: (1) 2-단계 PCR 프로토콜의 도입, 및 (2) 증폭된 단편의 부가적인 겔 추출. 2-단계 PCR 프로토콜(표 8)은 2개의 상이한 어닐링 온도를 이용하며, 제1 단계에서 초기 코딩 폴리뉴클레오타이드 서열(8)와의 중첩 부분 단독의 어닐링 온도가 사용되는 한편, 제2 단계에서 초기 코딩 폴리뉴클레오타이드 서열(8)과의 중첩 부분과 종결 서열(16, 17) 둘 모두의 어닐링 온도가 사용된다. 제2 단계의 보다 엄격한 조건은 프라이머 이량체의 형성된 양을 감소시킨다. 제2 최적화는 프라이머 이량체를 완전히 제거하고, 훨씬 더 작은 프라이머 이량체를 배제한 올바른 길이를 갖는 앰플리콘을 선택적으로 정제하기 위한 겔 추출(예를 들어 Thermo Scientific사의 Genejet 겔 추출 키트와 같은 상업용 키트)의 사용이다. 이들 최적화는 95% 초과의 효율로 타일 구축을 위한 프로토콜을 초래하였다.
8: 감소된 프라이머 이량체 형성과 함께 타일 증폭을 위한 2-단계 PCR 프로토콜
Figure pct00008
실시예 7: 2-단계 조립체
상이한 프로토콜에서, 이전의 실시예로부터의 접근법을, 다수의 코딩 폴리뉴클레오타이드 서열을 하나의 타일 내로 동시에 클로닝하도록 더 정교하게 만들었다. 본원에서, 각각의 코딩 폴리뉴클레오타이드 서열을 실시예 3 내지 5와 유사하게 생성하고, 동일한 프로토콜을 사용하여 수용 벡터에서 클로닝한다. 타일로서 하나의 코딩 폴리뉴클레오타이드의 클로닝과는 대조적으로, 다수의 코딩 폴리뉴클레오타이드 서열의 동시적인 클로닝은 상이한 종결 서열의 첨가를 필요로 하고, 이는 올바른 순서에서의 조립뿐만 아니라 수용 벡터에서 효율적인 클로닝을 보장한다.
본원에서, 제1 코딩 폴리뉴클레오타이드는 하기 부분들을 이들의 각각의 순서로 함유한다: 테일 서열, 인워드 배향 제2 II형 인지 부위, 스페이서 서열, 인워드 배향 제1 II형 인지 부위, 올바른 코딩 연장 서열, 제1 단편 초기 코딩 폴리뉴클레오타이드 서열, 제2 단편에 상보적인 코딩 연장 서열, 인워드 배향 제2 II형 제한 부위 및 테일 서열. 후행 코딩 폴리뉴클레오타이드 서열은 테일 서열, 인워드 배향 제2 II형 제한 부위, 제1 단편에 상보적인 코딩 연장 서열, 초기 코딩 폴리뉴클레오타이드 서열, 후행 단편에 상보적인 코딩 연장 서열, 인워드 배향 제2 II형 인지 부위 및 테일 서열로 구성된다. 후행 코딩 단편의 순서 및 상이한 부분은 이들의 코딩 연장 서열에서만 상이한 이전의 단편과 유사하다. 마지막 단편은 하기 부분들을 이들의 각각의 순서로 구성된다: 테일 서열, 제2 인워드 배향 II형 인지 부위, 이전 단편에 상보적인 코딩 연장 서열, 초기 코딩 폴리뉴클레오타이드 서열,코딩 연장 서열, 인워드 배향 제1 II형 인지 부위, 스페이서 서열, 인워드 배향 제2 II형 인지 부위 및 테일 서열. 본원에서, 상이한 코딩 연장 서열은 2개의 인접한 초기 코딩 폴리뉴클레오타이드 서열 사이에서 상보적이어야 한다. 이들 서열은 초기 코딩 폴리뉴클레오타이드 서열 중 하나의 일부로서 선택되어 스카리스 조립체를 초래할 수 있거나, 또는 이들 서열은 이들이 각각의 초기 코딩 폴리뉴클레오타이드 서열 사이에 최소 3개의 뉴클레오타이드를 첨가하도록 선택될 수 있다. 마지막으로 따라서, 이러한 타일은 조립되는 상이한 하위단편을 포함하고, 그 자체가 다른 타일과 함께 제2 조립체로서 합리적인, 준-무작위적인 또는 무작위적인 방식으로 사용될 수 있다.
이를 pVTSEII에서 하나의 타일로의 2개 하위단편의 조립체에 대해 시험하였다. 클로닝의 효율은 단일 단편의 VersaTile 클로닝, 및 VersaTile 셔플링의 효율과 유사하였으며, 95% 초과였다. 이러한 2-단계 방법은 특히, 더 큰 유전자 생성물의 조립, 및 VersaTile 셔플링에 사용될 수 있는 타일 라이브러리의 발생에 흥미롭다.
실시예 8: VersaTile 셔플링 프로토콜 최적화
실시예 5 내지 6(합리적인, 준-무작위, 무작위)에 대한 변형으로서, VersaTile 셔플링에 대한 프로토콜을 시간뿐만 아니라 비용의 측면에서 최적화하였다. 광범위한 상이한 조건을 시험하였으며, 본원에서 사이클 횟수, 리가제 및 BsaI의 양을 다양하게 하였다. 이들 실험은 새로운 최적화된 프로토콜을 이끌었으며, 여기서, 필요한 시간 및 사용된 효소의 양은 원래의 프로토콜과 비교하여 2배 감소된다. 단지 1개의 올바른 클론만 필요한 합리적인 프로토콜(표 9), 및 변동이 가능한 한 높게 유지될 필요가 있는 준-무작위 및 무작위 프로토콜(표 10)의 최적화에 구별이 있을 수 있다. 따라서, 합리적인 프로토콜은 준-무작위 및 무작위 프로토콜과 비교하여 더 엄격한 조건을 갖는다.
표 9: 합리적인 조립에 대한 VersaTile 셔플링 프로토콜의 최적화
Figure pct00009
10: 준-무작위 및 무작위 조립에 대한 최적화된 프로토콜
Figure pct00010
실시예 8: 상이한 프로모터 및 정제 태그를 이용한 지정 벡터의 다재다능 세트의 구축
지정 벡터는 VersaTile 셔플링에 의해 생성된 최종 구축물에 대한 발현 및 조립 벡터로서 역할을 한다. 지정 벡터의 다재다능 세트의 이용 가능성은 실험자가 각각의 단백질에 대한 발현 시스템을 쉽게 조정할 수 있게 한다. 이는, 단백질 발현, 정제, 안정성 및 용해성의 측면에서 최적 발현 시스템을 스크리닝하는 용이한 방식을 허용하면서도, 종래의 클로닝과 짝을 이룬 문제점을 피한다. pNIC28-BsaI 백본을 기초로 한 9개의 지정 벡터를 구축하였다(도 5). 본원에서, 프로모터, N-말단 태그, 음성 선택 마커 및 C-말단 태그는, 상이한 벡터 백본 사이에서 교환 가능한 모듈인 것으로 간주된다(도 5). 9개의 지정 벡터는 카나마이신 내성 유전자, 및 음성 선택을 위한 SacB 모듈을 함유한다.
pNIC28-Bsa4 벡터를 선형화하고, 뒤이어 변형된 프라이머를 이용하여 각각의 벡터 구성성분(예를 들어 프로모터, SacB, 태그)을 증폭 및 정제함으로써, pNIC28-Bsa4 벡터로부터 출발하는 pVTSD의 구축을 수행하였다. 표준 제한 연결 프로토콜을 사용함으로써 각각의 모듈 및 벡터 백본을 유도 방식으로 연쇄시켜, 새로운 pVTSDx를 발생시키는 방식으로 프라이머를 설계하였다. 이들 지정 벡터에 대해, 종래의 IIp형 제한 효소를 사용하였으나, 보다 효율적인 생성을 위해 II형 제한 효소를 이용할 수 있었다. 이를 새로운 지정 벡터(pVTSD4)의 발생에 의해 확인하였으며, 여기서, SacB 모듈을 삽입하고, 카나마이신 내성 마커를 앰피실린 내성 마커로 교환하였다. 이러한 조립체의 효율을 고려할 때, II형 제한 효소는 벡터의 생성 및 통상적인 조립에 편리한 툴이다.
VersaTile 셔플링과 융화성인 지정 벡터의 조성물은 이들 실시예에 사용되는 모듈(프로모터, 선택 마커, 태그)로 제한되지 않는다. 임의의 벡터 백본, 프로모터(유도성, 구성적, 조직 특이성,...), 음성 선택 마커(예를 들어 rpsL, ccdB, URA3, tetAR,...), 및 N- 또는 C-말단 태그(예를 들어 GST, MBP, FLAG,...)를 사용하여, VersaTile 셔플링과 융화성인 맞춤 제작 지정 벡터를 설계할 수 있다.
실시예 9: 4개 타일의 합리적인 또는 유도 조립을 위한 VersaTile 셔플링 반응
VersaTile 셔플링의 가능성을 위치의 수의 측면에서 더 확장시키기 위해, 4개 타일로 된 시스템을 설계하였다. 하기 실싱예는 조작된 엔도라이신만 포함하지만, 이로 한정되는 것은 아니다. 이들 변형된 박테리오파지-유래 효소를 4개 모듈로 분리할 수 있다. 실시예 3에 따라 조작된 엔도라이신(펩타이드, 링커, 효소적 활성 도메인 및 세포벽 결합 도메인)에 특이적인 타일 벡터로 구성된 저장소의 생성은 임의의 합리적으로 설계된 조작된 엔도라이신의 용이한 선택 및 조립을 가능하게 한다.
VersaTile 셔플링 방법의 효율을 96개의 상이한 조작된 엔도라이신의 합리적인 설계를 기초로 병행하여 평가하였다. 이들 96개의 조작된 엔도라이신을 이들의 항균 활성 및 내염성을 개선하는 목적으로 문헌에서 확인된 정보를 기초로 설계하였다. 제1 단계는 표 11 및 12에 도시된 바와 같이, 지정 벡터(이 경우 pVTSD3), BsaI 및 T4 DNA 리가제와 함께 다중-웰 PCR 플레이트의 각각의 웰에서 모든 4개의 상응하는 타일을 피펫팅하고, 뒤이어 VersaTile 반응을 수행하는 것이다. 후속적으로, 이. 콜라이 BL21(DE3)pLysS 적격(competent) 세포를 반응 혼합물을 이용하여 형질변환시키고, 선택 배지(Kan50 및 5% 수크로스) 상에 평판배양하였다. 적격 세포를 사전에 제조하고(루비움(rubium) 클로라이드 방법), 다중-웰 플레이트에 저장하여, 형질변환 단계를 단순화시키고, 96개의 조작된 엔도라이신을 어레이 상태로 유지시켰다. 평판배양을, 96개의 개별 페트리 디쉬에 비해 더 시간 효율적인 Q-트레이 플레이트 상에서 수행하였다. 각각의 플레이트는 48개의 웰로 구성되고, 각각의 웰에 각각의 배양물을 접종하였다.
표 11: VersaTile 반응 혼합물의 조성
Figure pct00011
표 12: VersaTile 셔플링의 온도 프로그램
Figure pct00012
밤새 인큐베이션 후, Q-트레이는 96개의 구축물 중 95개에 대해 콜로니의 풍부도(abundance)를 보여주었으며, 이는 VersaTile 반응이 성공적이었음을 가리킨다. 모든 구축물에 대한 단일 콜로니 상에서뿐만 아니라 이들 구축물의 각각의 정제된 플라스미드 DNA 상에서도 추가의 확인을 위해 클론 분석을 수행하였다. 합리적인 설계의 결과로서, 생성된 조작된 엔도라이신 구축물의 기대된 염기쌍 길이를 계산하고, 겔 전기영동에 의해 분석된 콜로니 PCR의 수득된 길이와 비교할 수 있었다. 95개의 클론 중 90개는 올바른 길이를 갖는 밴드를 보여주었으며, 따라서 95.7%의 효율을 가리킨다. 더욱이, 9개의 양성 클론 및 1개의 음성 클론을 시퀀싱하였다. 모든 9개의 양성 클론은 타일의 올바른 조립을 보여주었다. 시퀀싱된 음성 클론은 타일의 잘못된 순서 및 조성을 가졌으며, 이는 VersaTile 반응의 제조에서 타일의 피펫팅 동안 발생한 에러로 인한 가능성이 크다.
요약하자면, 결과는, 4개 타일을 이용한 VersaTile 반응이 심지어 다중-웰 규모에서도 매우 효율적임을 가리킨다. 상이한 기원의 4개 단편을 포함하는 재조합 조립체의 종래의 생성과 비교하여, 저장소의 사용은 과정을 대단히 단순화시킨다. 다중-웰 포맷에서의 어레잉(arraying)과 조합하여 저장소는, 본 발명자들이 필요한 시간을 단지 3일까지 감소시킬 수 있게 하였으며, 이로써 서열 유사성이 없는 타일의 DNA 조립체의 고-처리량 발생을 위한 VersaTile 포맷의 잠재성을 강조하고 있다.
실시예 10: 4개 타일의 준-무작위 조립을 위한 VersaTile 셔플링 반응
상이한 프로토콜에서, VersaTile 셔플링을 이용하여, 다수의 조작된 엔도라이신을 준-무작위로 발생시킨다. 준-무작위 설계는, 적어도 하나의 위치에 대해 1개 초과의 타일이 저장소로부터 선택됨을 내포한다. 다른 위치 상에서는 단지 1개의 타일이 선택될 수 있다. 본원에서, 발생된 구축물의 변동은 합리적인 설계(실시예 9)와는 대조적으로 증가된다.
VersaTile 셔플링의 준-무작위 특성을 평가하기 위해, 하기 실험을 셋업하였다: 위치 1에서 펩타이드, 위치 2에서 1개의 링커, 위치 3에서 4개의 세포벽 결합 도메인 및 위치 4에서 13개의 효소적 활성 도메인을 투과하는 24개의 아우터(outer) 막. 이는 1248개의 상이한 가능성을 생성한다. 선택된 타일을 VersaTile한 반응 혼합물과 함께 혼합하고, VersaTile 프로토콜에 따라 조립하였다(표 11 및 12).
모든 타일이 고르게 분포된 방식으로 구축되도록 조절하기 위해, 화학적으로 적격인 이. 콜라이 Top10 세포를 준-합리적으로 셔플링된 VersaTile 반응 혼합물을 이용하여 형질변환시키고, 카나마이신(Kan50) 및 수크로스(5%)와 함께 LB 상에 평판배양하였다. 192개의 콜로니를 골라서, 콜로니 PCR 및 뒤이어 아가로스 겔 전기영동을 이용하여 평가하여, 상이한 조립된 생성물의 길이 분포를 관찰하였다. 밴드를 수동으로 계수하고, 길이를 DNA 사다리(Phage Lambda(Psti) 및 GeneRuler 100 bp DNA 사다리)를 사용하여 평가하였다. 클론을 이들의 길이(예를 들어 1000 내지 1100 bp)에 따라 상이한 그룹으로 나누었다. 모든 그룹의 비율을 계산하고, R(통계 소프트웨어, www.r-project.org )을 이용하여 계산된 이론적 길이 분포 곡선으로 도시하였다(plot)(도 6).
준-무작위 셔플링된 조립체의 길이 분포는 두 그래프 모두가 대체로 중첩되기 때문에 이론 데이터와 실험 데이터 사이에서 유의한 차이를 보여주지 않는다. 실험 데이터는 모든 길이 범주의 조립된 생성물을 함유하였다.
조립 반응을 2회 수행하였고, 매번 25개의 클론을 시퀀싱하여, 조립된 생성물이 올바른지 평가하였다. 어떤 클론도 조립된 생성물에서 실수(mistake)를 보여주지 않았으며, 이는 VersaTile 셔플링이 말단 생성물을 올바른 방식에서 고효율로 조립함을 실증한다. 수득된 50개의 서열 중 48개는 서로 상이하였으며, 이는 조립된 생성물이 사실상 주로 무작위로 생성됨을 확인시켜 준다(도 7).
실시예 11: 4개 타일의 무작위 조립을 위한 VersaTile 셔플링 반응
또 다른 프로토콜에서, 타일의 무작위 조립을 위한 VersaTile 셔플링의 실행 가능성을 평가하였다. 무작위 셔플링은, 모든 위치에 대해 1개 초과의 타일이 선택됨을 의미한다. 이는 실시예 6과 유사하지만, 무작위 셔플링은 준-무작위 셔플링과 비교하여 훨씬 더 큰 다양성을 수반한다.
VersaTile 셔플링이 상이한 타일을 무작위 방식으로 조립할 것인지 결정하기 위해, 하기 실험을 셋업하였다: 모든 pVTSE에 존재하고 길이에서 분명한 차이가 존재하는 4개의 타일을 선택하였다. 따라서, 각각의 타일은 모든 위치(1, 2, 3 또는 4)에 존재하여, 256(44)개의 상이한 가능성을 생성한다. 타일들 사이에서 길이의 더 큰 차이로 인해, 이들은 등몰 농도로 된다. 이는, 펩타이드 12에 대해 타일의 이상 농도인 50 ng/μL의 농도를 설정함으로써 수행된다. 다른 타일의 필요한 농도를 하기 방정식을 사용하여 계산하였다:
Figure pct00013
4개 혼합물에서 모든 타일의 필요한 양을 취하고, 4개 혼합물을 제조한다. 혼합물의 농도를 NanoDrop 2000을 이용하여 측정하고, 필요할 때 50 ng/μL로 희석시킨다. 이후, 이들 혼합물을 함께 가져와서 VersaTile 셔플링 프로토콜(표 11 및 12)에 따라 셔플링한다. 조립체의 길이를 평가하기 위해, 클론 분석을 192개의 콜로니 상에서 수행하며, 이들 콜로니 중 25개 시료를 시퀀싱을 위해 보낸다.
골라낸 192개의 콜로니 중 189개는 아가로스 겔 상에서 가시적인 밴드를 제공하였다. 이들 밴드를 수동으로 계수하고, 길이를 평가하여, 무작위 셔플링된 타일의 각각의 길이 분포를 결정하였다. 실시예 6과 유사하게, 모든 클론을 이들의 길이에 따라 상이한 그룹으로 나눈다. 모든 그룹의 비율을 계산하고, R(도 8)을 이용하여 계산된 이론 분포 곡선을 도시하였다.
이론적 기대 및 실험 데이터의 그래프는 각각의 범주에 대해 양호한 상관성이 있다. VersaTile 셔플링을 사용하여 무작위 셔플링을 수행할 수 있고, 짧은, 중간 길이 또는 긴 타일을 유사한 선호도로 밀접하게 통합시키는 것으로 결론내릴 수 있다.
조립된 생성물이 타일 또는 코딩 연장 서열에 임의의 돌연변이를 함유하지 않음을 입증하기 위해, 25개의 시료를 시퀀싱하였다(상기 언급됨). 모든 조립체는 올바른 것이었으며, 예를 들어 타일의 수는 4였고, 코딩 연장 서열을 올바른 것이었으며, 타일은 돌연변이를 갖지 않는 등이다. 이는, VersaTile 셔플링이 말단 생성물을 올바른 방식에서 고효율로 조립함을 확인시켜 준다. 또한, 수득된 25개의 서열 중 23개는 서로 상이하고, 이는 조립된 생성물이 사실상 주로 무작위로 생성됨을 가리킨다.
실시예 12: 상이한 지정 벡터( 에스케리키아 콜라이 가 아닌 다른 숙주에서의 발현을 포함)에서 VersaTile 셔플링 반응
VersaTile 셔플링의 사용에 대한 주요 자산(asset)은 지정 벡터의 상호 교환성이다. VersaTile 셔플링 기술과 융화성인 임의의 벡터를 용이하게 제조할 수 있다. 이는 발현 유기체 및 시스템(예를 들어 프로모터, 정제 태그,...)의 측면에서 광범위한 옵션을 수반하며, 이로써 이러한 기술의 다재다능성에 기여한다.
상이한 pVTSD의 사용에 대한 초기 입증을 이. 콜라이에서 수행하였다. 9개의 상이한 pVTSD(pVTSD1 - pVTSD9, 즉, SEQ ID N°13 - SEQ ID N°21)(도 5에 도시됨)를 발생시켰으며, 실시예 9 내지 11, 13, 14 및 17에 설명된 바와 같이 재조합 단백질(예를 들어 조작된 엔도라이신, GFP, 탄수화물 분해 효소) 세트의 셔플링에 이용하였다. 발생된 구축물의 분석은, VersaTile 셔플링 반응의 고효율이 pVTSDs 조성물과는 독립적으로 보존됨을 확인시켜 주었다. 더욱이, 9개의 발생된 pVTSD 각각에서 VersaTile 셔플링된 재조합 단백질의 발현 및 정제는 이들 모두가 작용함을 보여주었다. 이들 결과는, 가능한 pVTSD의 범위가 실시예 4에서 발생된 9개로 제한되지 않으며, VersaTile 셔플링과 융화성인 임의의 이. 콜라이 발현 시스템이 쉽게 제조될 수 있음을 내포한다.
상이한 프로토콜에서, 2개의 새로운 지정 벡터를 상이한 숙주(도 9, 락토콕커스 락티스(Lactococcus lactis) 및 피치아 파스토리스(Pichia pastoris))에서 발현을 위해 구축하였다. 이. 콜라이에서 실시예와 유사하게, 두 지정 벡터 모두를 이들의 각각의 숙주 유기체에서 입증하였다. 락토콕커스 락티스에서 단백질 발현에 특이적인 pLVTSD(SEQ ID N°12)를 구축하였다. VTS 지정 벡터의 일반적인 레이-아웃과 대조적으로, SacB 음성 선택 마커는, SacB의 발현이 엘. 락티스에 독성이지 않기 때문에 pLVTSD에 포함시키지 않았다. VersaTile 셔플링된 단백질의 N-말단에 존재하는 usp45 신호 펩타이드는, 발현된 재조합 단백질이 엘. 락티스에 의해 분비됨을 보장한다.
피. 파스토리스에서 pYVTSD(SEQ ID N°11)에 대해서도 동일하게 수행하였다. VTS뿐만 아니라 피. 파스토리스에서 이러한 지정 벡터를 이용한 단백질 발현은 이. 콜라이엘. 락티스에서처럼 효율적이었다. 이들 실시예는, VersaTile 셔플링이 고정된 pVTSD 레이-아웃 또는 숙주 유기체 중 어느 것으로도 제한되지 않음을 확인시켜 준다. 이. 콜라이, 엘. 락티스피치아 파스토리스에서의 확인은, 이러한 방법이 다양한 범위의 발현 숙주(박테리아, 진핵 세포) 및 지정 벡터에 사용될 수 있음을 내포한다.
실시예 13: 상이한 코딩 연장 서열을 이용한 VersaTile 셔플링 반응
VTS는 이전의 실시예에서 사용된 코딩 연장 서열로 제한되지 않는다. 이론상, 코딩 연장 서열로서 작용하는 임의의 코딩 뉴클레오타이드 서열(다수의 3개 뉴클레오타이드)이 선택될 수 있다. 본원에서, 코딩 연장 서열은 상이한 타일을 함께 연결하는 보존된 뉴클레오타이드이고, 이들은 서열 독립적이며, 실험자가 특이적인 요건을 맞추도록 설계될 수 있었다. 그러나, 코딩 연장 서열에 존재하는 뉴클레오타이드가 인코딩하는 아미노산은 단백질 수준을 고려할 필요가 있다. 상이한 아미노산은 상이한 구조를 가지며, 이는 이들 아미노산이 더 크거나, 더 작거나, 더 가요성이거나 더 강성일 수 있음을 의미한다. 이들 매개변수는 이들의 협력적인 단백질-단백질 상호작용, 폴딩, 구조, 활성 및 안정성을 유지시키는 측면에서 단백질의 모듈러 조립에서 중요한 역할을 한다. 이를 확인하기 위해, 상이한 코딩 연장 서열을 갖는 시스템을 설계하고 시험하였다(표 1 참조). 사용되는 특이적인 코딩 연장 서열과 상관없이 유사한 DNA 조립 효율을 수득하였다.
실시예 14: 주어진 초기 코딩 폴리뉴클레오타이드 서열의 돌연변이화된 변이체를 포함하는 타일 벡터의 돌연변이화된 라이브러리가 차지하는 하나의 위치와 함께 VersaTile 셔플링 반응.
이러한 프로토콜에서, VersaTile 셔플링의 다재다능성을 돌연변이화된 타일의 저장소의 사용까지 더 확장시켰다. 무작위 또는 합리적인 돌연변이생성에 의해, 타일 저장소에 존재하는 변동을 더 확장시킬 수 있다. 따라서, VersaTile 셔플링 방법과 돌연변이생성 기술의 조합은, 적절한 스크리닝 방법이 보충될 때 단백질의 유도 진화(directed evolution)에 이용될 수 있는 전례 없는 변동을 생성하는 가능성을 만든다. 이러한 실시예에서, 에러 유발 PCR에 의해 발생된 하나의 타일의 돌연변이화된 저장소를 VersaTile 반응에 직접 사용하여, 이의 실행 가능성을 평가하였다.
에러 유발 PCR 프로토콜을 표 13에 도시하고, 완전 KZ144 엔도라이신 타일을 돌연변이화하는 데 이용하였다. 증폭 단계 후, 생성된 앰플리콘을 아가로스 겔 전기영동을 사용하여 조절하고, 후속적으로 정제하였다. 정제된 단편은 필요한 부분(테일 서열, 제1 II형 인지 서열 및 코딩 연장 서열)을 함유하였으며, 따라서 이들 단편은 VersaTile 셔플링에 직접 사용할 수 있었다. VersaTile 반응을 실시예 5에 제시된 바와 같이 위치 1 상에서 펩타이드 1, 위치 2 상에서 링커 1 및 위치 3 상에서 KZ144 엔도라이신의 돌연변이화된 라이브러리를 사용하여 수행하였다. 이. 콜라이 적격 세포를 완전 VTS 혼합물을 이용하여 형질변환시키고, 선택 배지(카나마이신, 수크로스) 상에 평판배양하였다. 이는 콜로니의 풍부도를 초래하였으며, 이는 돌연변이화된 타일의 사용이 VersaTile 방법의 효율에 영향을 미치지 않음을 가리킨다. 192개 콜로니의 클론 분석은 이를 추가로 확인시켜 주었으며, 대부분(74%)이 아가로스 겔 상에서 올바른 이동 패턴을 보여주었기 때문이다. 시퀀싱을 위해 5개의 시료를 보내어, 돌연변이가 존재하는지 입증하였다. 모든 5개의 시료는 KZ144 엔도라이신 타일에 돌연변이를 함유하였으며, 이들 돌연변이 중 대부분은 치환이었으며, 이로써 VersaTile 셔플링이 효율에서 임의의 감소 없이 돌연변이생성고 융화성임을 확인시켜 주었다. 돌연변이화된 PCR 생성물을 셔플링에 직접 사용하는 것 외에도, 돌연변이체의 플라스미드 라이브러리를 또한, pVTSE 수용 벡터에서 이들 돌연변이화된 단편을 클로닝함으로써 생성할 수 있다. 따라서, 오류 유발 조건 하에 테일드 프라이머(테일 서열, 제2 II형 인지 부위, 스페이서 서열, 제1 II형 인지 서열, 코딩 연장 서열)(도 13)를 사용하거나, 또는 각각의 서열의 이전에 돌연변이화된 라이브러리를 주형으로서 사용하여, 각각의 서열을 증폭시킬 수 있다. pVTSEII 및 pVTSEIII 둘 모두에서 II형 클로닝의 효율로 인해, 증폭 단계에서 생성된 변동은 pVTSE에서 클로닝 동안 보존되고, 이로써 용이하게 복제되고 셔플링에 사용될 수 있는 플라스미드 라이브러리를 생성한다. 종결자 DNA 중합효소의 돌연변이화된 라이브러리를 주형으로서 사용하여 타일을 발생시킴으로써 이를 확인하였다. 각각의 타일을 이용한 셔플링에 기인하는 셔플링된 생성물의 시퀀싱은, 돌연변이화된 라이브러리의 초기 변동이 타일 생성 동안 보존되었음을 확인시켜 준다.
표 13: 에러 유발 프로토콜. 처음에 96 μL의 마스터 혼합물을 취하고, 2 μL의 주형 DNA, 1 μL의 Dreamtaq DNA 중합효소 및 1 μL의 50 mM MnCl2를 첨가한다. 10회의 사이클 후, 10 μL의 반응 혼합물을 취하고, 90 μL의 신선한 마스터 혼합물에 첨가한다. 이를 3회 반복하여, 돌연변이 비(ratio)를 증가시킨다.
Figure pct00014
실시예 15: 주어진 초기 코딩 폴리뉴클레오타이드 서열의 돌연변이화된 변이체를 각각 포함하는 타일 벡터의 2개의 상이한 라이브러리로부터 기원하는 서열이 차지하는 2개 위치를 이용한 VersaTile 셔플링 반응
실시예 10의 설명에서와 같이, 돌연변이화된 타일 라이브러리가 VersaTile 반응에서 2개 위치를 차지하였다. KZ144 엔도라이신을 2개의 타일인 KZ144 CBD 및KZ144 EAD로 나누었으며, 이들 둘 모두를 에러 유발 PCR(표 13)로 처리하여, 돌연변이화된 타일의 2개의 개별 라이브러리를 발생시켰다. VTS에 사용된 프로토콜은 실시예 14와 완전히 유사하다.
각각의 VTS 혼합물의 형질변환 후, 콜로니의 풍부도를 볼 수 있었다. 24개 클론을 분석하였으며, 이들 중 18개는 클론 분석 후 올바른 패턴을 보여주었으며, 6개의 시퀀싱된 클론 중 6개는 올바른 구축물을 함유하였다. 모든 시퀀싱된 클론에서, 2개의 돌연변이화된 타일에 돌연변이가 존재하였다.
실시예 14와 15 둘 모두는, 돌연변이화된 타일의 저장소가 VersaTile 셔플링 기술과 용이하게 조합될 수 있음을 가리키고, 이는 돌연변이생성이 모든 사용된 타일에 적용될 수 있음을 제안한다. 이들 실시예에서, 타일의 돌연변이생성은 에러 유발 PCR로 제한되었으나, 다른 돌연변이생성 기술(예를 들어 부위-특이적 돌연변이생성)이 이용되어 돌연변이화된 타일 저장소를 발생시킬 수 있었다. 돌연변이생성과 DNA 셔플링의 조합이 단백질 변동의 수많은 저장소를 생성하기 때문에 이는 VTS 방법의 다재다능성에 대단히 추가하며, 이는 요망되는 기능 및 특성을 갖는 단백질에 대해 태핑(tapped)될 수 있다.
실시예 16: 상이한 II형 제한 효소(BsaI 이외의)를 사용한 VersaTile 셔플링 반응
이전의 실시예에서, BsaI를 VTS 반응에 사용하였다. 그러나, VTS는 BsaI로 제한되지 않고, 다른 II형 제한 효소(표 5)가 또한 이용될 수 있었다. 그러나, 지정 벡터는 각각의 II형 제한 효소에 조정되어야 한다.
이를 확인하기 위해, 본 발명자들은 BfuAI(표 5)를 이용하여 VTS 반응을 수행하였다. 테일-보유 프라이머를 사용하여 4개 타일을 발생시켰다. 프라이머 테일은 초기 코딩 폴리뉴클레오타이드 서열에 상보적인 부분, 코딩 연장 서열 및 BfuAI 인지 부위를 각각 함유하였다(제1 II형 인지 부위). 생성된 PCR 생성물을 정제하고, VTS 반응에서 즉시 사용하였으며, 여기서, pVTSEIII가 지정 벡터로서 작용하였다. pVTSEIII는, 음성 선택 마커의 측면에서 올바른 순서 및 배향에서 다중 클로닝 부위에서 BfuAI 인지 부위의 존재때문에 지정 벡터로서 사용될 수 있었다. 따라서, 이 실험은 또한, pVTSEII 및 pVTSEIII가 셔플링된 단편의 조립에 사용될 수 있음을 가리킨다. VTS 반응 혼합물의 형질변환은 콜로니의 풍부도를 초래하였으며, 이들 콜로니 중 대부분(92%)은 클론 분석 후 올바른 패턴을 보여주었다. 더욱이, 4개의 시퀀싱된 클론은 모두, 완벽하게 연쇄화된 서열을 함유하였다.
이러한 실시예에 첨가하기 위해, 본 발명자들은 SapI(표 5)를 사용하여 VTS 반응을 또한 수행하였다. BfuAI 및 BsaI와는 대조적으로 SapI는 3개 뉴클레오타이드 오버행을 발생시키지만, 7개 뉴클레오타이드의 인지 부위를 갖는다는 이점을 가진다. SapI 제한 효소를 사용한 4개 타일의 VTS 조립은 BfuAI 및 BsaI를 이용한 VTS와 유사하였다. 효율에서 어떠한 감소도 존재하지 않았으며, 이는 3개 뉴클레오타이드 오버행이 올바른 조립에 효율적임을 가리킨다. 그러나, 4개 뉴클레오타이드 오버행과 비교하여 감소된 수의 코딩 연장 서열이 고려되어야 한다.
상이한 절단 특징을 갖는 것을 포함하여 상이한 II형 제한 효소의 성공적인 사용은, VTS가 BsaI에 제한되지 않음을 실증한다. 전범위의 II형 제한 효소를 VTS에 이용할 수 있으며, 이는 실험자가, 각각의 타일에서 II형 제한 효소를 이의 인지 부위의 부재를 기초로 선택할 수 있게 한다. 이것이 VTS를 보다 다재다능하게 만듦에도 불구하고, 각각의 II형 제한 효소에 대해 융화성 지정 벡터가 생성되어야 한다는 것이 고려되어야 한다.
실시예 17: VersaTile 셔플링 및 골든 게이트 셔플링과, 보존된 뉴클레오타이드(골든 게이트 셔플링) 또는 2개의 인접한 모듈 사이에서 링커를 인코딩하는 부가적인 뉴클레오타이드(VersaTile 셔플링)인 코딩 연장 서열의 선택의 하이브리드
보존된 뉴클레오타이드와 자유롭게 선택된 뉴클레오타이드 둘 모두가 VTS 반응 동안 동시에 사용될 수 있음을 입증하기 위해 이 실험을 셋업하였다. 이는 상동성 미 비-상동성 부분(코딩 연장 서열로서 보존된 뉴클레오타이드)의 스카리스 셔플링을 가능하게 하는 한편, 비-상동성 부분(코딩 연장 서열로서 첨가된 뉴클레오타이드)이 선택된 코딩 연장 서열 세트에 의해 연결되어 동시에 셔플링될 수 있게 하기도 한다.
제1 실시예는 종결자 DNA 중합효소, 및
Figure pct00015
DNA 중합효소의 루프 구조를 포함한다. 종결자를 상이한 변이체에 존재하는 상동성 영역을 기초로 7개 타일로 나누었으며, 코딩 연장 서열로서 작용하는 보존된 뉴클레오타이드를 선택하였다. 그러나,
Figure pct00016
DNA 중합효소는 종결자와 거의 상동성을 나타내지 않거나 아예 나타내지 않으며, 따라서 이러한 루프 구조를 도입하기 위해,
Figure pct00017
의 비-상동성 루프 구조를 종결자 DNA 중합효소의 팜(palm) 및 핑거(finger) 도메인에 연결하는 코딩 연장 서열로서 작용하는 6개의 부가적인 뉴클레오타이드를 선택하였다. 이는 종결자 DNA 중합효소의 동시적인(상동성) 셔플링을 가능하게 하는 한편,
Figure pct00018
루프 구조의 용이한 도입을 허용한다. 비-상동성 부분의 도입은 DNA 중합효소 활성, 특이성 및 가공성을, 상동성 DNA 셔플링만 사용함으로써 달성될 수 있는 것과 비교하여 급격하게 변화시킬 수 있었다. 상기 기재된 실시예와 유사하게, 모든 분석된 클론은 올바른 서열을 가졌다.
제2 실시예는 5개의 타일로 나뉜 조작된 엔도라이신으로 구성된다. 4개 타일(pep46, Link2, CBD3 및 EAD11)은 조작된 엔도라이신 코딩 서열을 구성하고, 스카리스 방식(코딩 연장 서열 부분은 인접 타일 코딩 서열임)으로 조립된다. 5번째 타일은 정제 태그(예를 들어 Strep, His, GST,...)이고, 2개의 잉여(extra) 아미노산을 코딩하는 6개의 조심스럽게 선택된 뉴클레오타이드에 의해 조작된 엔도라이신에 연결된다. 이 실험을, 조작된 엔도라이신의 N-말단뿐만 아니라 C-말단에서 정제 태그를 이용하여 수행하였다. 잉여 타일로서 정제 태그의 첨가는 큰 다재다능성을 수반하는데, 왜냐하면 이러한 첨가가 실험자로 하여금 재조합 단백질에 관하여 사용된 정제 방법을 선택할 수 있게 하기 때문이다. 보존된 뉴클레오타이드와 자유롭게 선택된 코딩 연장 서열 둘 모두의 사용은 종래의 VersaTile 반응과 같이 효율적이다. 이를, 모든 클론이 올바른 길이를 보여준 8개 클론 상에서 클론 분석, 및 두 클론 모두가 올바른 서열을 가진 2개 클론의 시퀀싱에 의해 확인하였다.
실시예 18: VersaTile 셔플링을 이용하여 생성된 단백질의 정제 및 분석
이러한 기술에 대한 키(key)는, 상이한 모듈 사이에서 부가적인 뉴클레오타이드 링커의 사용인데, 이것이 VTS를 상동성 및 비-상동성 서열 둘 모두를 포함하는 보편적인 셔플링 방법으로 만들기 때문이다. 단백질 수준에서 잉여의 뉴클레오타이드는 모듈들 사이에서 잉여 아미노산의 첨가를 초래한다. 생성된 단백질 상에서 잉여 아미노산 링커의 효과를 결정하는 것 외에도 단백질 수준에서 VTS를 입증하기 위해, 발생된 몇몇 VTS 단백질의 발현, 정제 및 스크리닝을 수행하였다. 엘. 락티스에서 활성 VTS 발생 단백질의 발현이 이미 보여진 실시예 8 외에도, 몇몇 VTS 발생 단백질의 대규모(500 mL) 및 소규모(96-웰) 발현을 이. 콜라이에서 수행하였다.
위치 1 상에서 펩타이드 1, 위치 2 및 3 상에서 CBD1, 및 위치 4 상에서 EAD12로 구성되 조작된 엔도라이신을 카나마이신-함유 500 mL 용원성 브로쓰(lysogenic broth)에서 발현시켰으며, HisGraviTrap 컬럼(GE Healthcare)을 사용하여 정제하였다. 도 10은 각각의 단백질의 분명한 발현을 보여주며, 더욱이 생성된 단백질의 양은 종래의 클로닝 방법에 의해 발생된 유사한 단백질에 대해서 동일하였다. 또한, 효소적 및 항균 검정법은, VTS 생성된 단백질이 기능적으로 활성임을 보여주었다.
상이한 프로토콜에서, 96개의 상이한 VTS 발생 단백질을 병행하여 발현시키고, 정제하고, 스크리닝하였다. BL21-코돈 플러스(DE3)-RIL 세포를 각각의 플라스미드를 이용하여 형질변환시키고, 자가-유도(auto-induction) 배지에 어레이된 방식으로(96-웰) 접종하였다. 배양물을 37℃에서 5시간 동안 인큐베이션하고, 16℃에서 24시간 동안 인큐베이션하였다. 다중-웰 규모(Thermo Scientific사의 HisPurTM Ni-NTA 스핀 플레이트)에서 his-태그 정제를 위한 상업용 키트를 사용하여 정제를 수행하였다. 단백질 수율을 SDS-PAGE 상에서 시각화한다(도 11). 더욱이, 효소적 및 항균 검정법은, 대부분의 VTS 발생 단백질이 활성이었음을 보여주었다.
대규모 및 소규모 발현 둘 모두는 활성 단백질을 제공하였으며, 이로써 VersaTile 셔플링의 유용성을 단백질 수준에서 입증하였다. 단백질 모듈 사이에서 잉여 아미노산 링커는 단백질 3차 구조, 발현되는 이의 능력 또는 이의 활성을 없애지 않아, VTS를 새로운 재조합 단백질의 생성을 위한 유망한 방법으로 만든다.
실시예 19: 스카리스 조립을 위한 VersaTile 셔플링. 코딩 연장 서열이 스카리스 조립을 허용하는 한 이들 서열을 선택한다. 이는, 모든 조립을 위해, 코딩 연장 서열이 인접 타일의 서열 종결에 따라 취해져야 하는 것을 필요로 한다.
VTS 방법의 주요 이점은, 전례 없는 양의 모듈을 이들의 서열 상동성과는 독립적으로 셔플링하는 데 상기 방법이 사용될 수 있다는 점이다. 그러나, 일부 경우, 상이한 단백질 부분 사이에서 잉여 아미노산의 도입은 요망되지 않을 수 있었다. 이들 경우, VTS가 또한 사용될 수 있었으나, 코딩 연장 서열은 각각의 구상된 조립에 대해 특이적으로 조정되고 선택될 필요가 있다. 타일 측면에서 선택된 코딩 연장 서열은 후행(또는 선행) 타일 서열의 출발(또는 종결) 뉴클레오타이드와 동일해야 한다. 이와 같이, 스카리스 조립체는, 2개의 인접한 타일 사이에 첨가된 개입 뉴클레오타이드가 없기 때문에 달성될 수 있다. 그러나, 종래의 VersaTile 셔플링의 보편적인 특징과는 대조적으로, 스카리스 조립체는, 각각의 특이적인 조립체에 대해, 새로운 세트의 코딩 연장 서열이 설계될 필요가 있으며, 이는 무작위 또는 조합 셔플링에 대한 가능성을 없앰을 내포한다.
이러한 프로토콜에서, 3개 타일(펩타이드 1, CBD6 및 EAD9)을, 이들의 조립체가 스카리스가 되는 방식으로 셔플링하였다. 코딩 연장 서열을 선행 타일의 코딩 서열의 일부인 것으로 선택하였다. 조립의 효율은 실시예 5 내지 7과 유사하였다. 스카리스 조립 외에도, 이러한 방법은 또한, 부위-특이적 돌연변이생성에 이용될 수 있었다. 본원에서, 점 돌연변이는, 상이한 타일의 연쇄화 후 돌연변이가 각각의 코딩 폴리뉴클레오타이드 서열 내의 예정된 위치에 도입되는 방식으로 타일의 프라이머에 도입될 수 있다.
SEQUENCE LISTING <110> Universiteit Antwerpen Universiteit Gent <120> POLYNUCLEOTIDE SHUFFLING METHOD <130> TTO-055 <150> GB1621589.9 <151> 2016-12-19 <160> 21 <170> BiSSAP 1.3.6 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> pVTSE1 Forward Primer <400> 1 ggtgctgaga cctctagagg 20 <210> 2 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> pVTSE1 Reverse Primer <400> 2 catggtgaga ccaagcttgg 20 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> pVTSE2 Forward Primer <400> 3 gcaggtgaga cctctagagg 20 <210> 4 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> pVTSE2 Reverse Primer <400> 4 tgcactgaga ccaagcttgg 20 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> pVTSE3 Forward Primer <400> 5 ggaagcgaga cctctagagg 20 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> pVTSE3 Reverse Primer <400> 6 acctgtgaga ccaagcttgg 20 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> pVTSE4 Forward Primer <400> 7 aagtaggaga cctctagagg 20 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> pVTSE4 Reverse Primer <400> 8 gcttctgaga ccaagcttgg 20 <210> 9 <211> 3811 <212> DNA <213> Artificial Sequence <220> <223> pVTSEII Vector <400> 9 agcttgacgt caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt 60 ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa 120 taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt 180 tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat 240 gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag 300 atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg 360 ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata 420 cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat 480 ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc 540 aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg 600 ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac 660 gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact 720 ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa 780 gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct 840 ggagccggtg agcgtggttc tcgcggtatc attgcagcac tggggccaga tggtaagccc 900 tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga 960 cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac 1020 tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag 1080 atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 1140 tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 1200 tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 1260 ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt 1320 cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 1380 ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 1440 gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 1500 tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 1560 gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 1620 ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 1680 tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 1740 ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 1800 tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt 1860 attaccgcct ttgagtgtct agatagtctt cgacgtccac atatacctgc cgttcactat 1920 tatttagtga aatgagatat tatgatattt tctgaattgt gattaaaaag gcaactttat 1980 gcccatgcaa cagaaactat aaaaaataca gagaatgaaa agaaacagat agatttttta 2040 gttctttagg cccgtagtct gcaaatcctt ttatgatttt ctatcaaaca aaagaggaaa 2100 atagaccagt tgcaatccaa acgagagtct aatagaatga ggtcgaaaag taaatcgcgc 2160 gggtttgtta ctgataaagc aggcaagacc taaaatgtgt aaagggcaaa gtgtatactt 2220 tggcgtcacc ccttacatat tttaggtctt tttttattgt gcgtaactaa cttgccatct 2280 tcaaacagga gggctggaag aagcagaccg ctaacacagt acataaaaaa ggagacatga 2340 acgatgaaca tcaaaaagtt tgcaaaacaa gcaacagtat taacctttac taccgcactg 2400 ctggcaggag gcgcaactca agcgtttgcg aaagaaacga accaaaagcc atataaggaa 2460 acatacggca tttcccatat tacacgccat gatatgctgc aaatccctga acagcaaaaa 2520 aatgaaaaat ataaagttcc tgagttcgat tcgtccacaa ttaaaaatat ctcttctgca 2580 aaaggcctgg acgtttggga cagctggcca ttacaaaaca ctgacggcac tgtcgcaaac 2640 tatcacggct accacatcgt ctttgcatta gccggagatc ctaaaaatgc ggatgacaca 2700 tcgatttaca tgttctatca aaaagtcggc gaaacttcta ttgacagctg gaaaaacgct 2760 ggccgcgtct ttaaagacag cgacaaattc gatgcaaatg attctatcct aaaagaccaa 2820 acacaagaat ggtcaggttc agccacattt acatctgacg gaaaaatccg tttattctac 2880 actgatttct ccggtaaaca ttacggcaaa caaacactga caactgcaca agttaacgta 2940 tcagcatcag acagctcttt gaacatcaac ggtgtagagg attataaatc aatctttgac 3000 ggtgacggaa aaacgtatca aaatgtacag cagttcatcg atgaaggcaa ctacagctca 3060 ggcgacaacc atacgctgag agatcctcac tacgtagaag ataaaggcca caaatactta 3120 gtatttgaag caaacactgg aactgaagat ggctaccaag gcgaagaatc tttatttaac 3180 aaagcatact atggcaaaag cacatcattc ttccgtcaag aaagtcaaaa acttctgcaa 3240 agcgataaaa aacgcacggc tgagttagca aacggcgctc tcggtatgat tgagctaaac 3300 gatgattaca cactgaaaaa agtgatgaaa ccgctgattg catctaacac agtaacagat 3360 gaaattgaac gcgcgaacgt ctttaaaatg aacggcaaat ggtacctgtt cactgactcc 3420 cgcggatcaa aaatgacgat tgacggcatt acgtctaacg atatttacat gcttggttat 3480 gtttctaatt ctttaactgg cccatacaag ccgctgaaca aaactggcct tgtgttaaaa 3540 atggatcttg atcctaacga tgtaaccttt acttactcac acttcgctgt acctcaagcg 3600 aaaggaaaca atgtcgtgat tacaagctat atgacaaaca gaggattcta cgcagacaaa 3660 caatcaacgt ttgcgcctag cttcctgctg aacatcaaag gcaagaaaac atctgttgtc 3720 aaagacagca tccttgaaca aggacaatta acagttaaca aataaaaacg caaaagaaaa 3780 tgccgatatc ctattggcat tggaagacat a 3811 <210> 10 <211> 3877 <212> DNA <213> Artificial Sequence <220> <223> pVTSEIII Vector <400> 10 gcgatgcgtc tcgactcctc gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc 60 cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc 120 tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc 180 gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg 240 gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat 300 ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc 360 acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa 420 ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa 480 aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt 540 gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct 600 tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat 660 gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg 720 cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg 780 atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt 840 attgctgata aatctggagc cggtgagcgt ggttctcgcg gtatcattgc agcactgggg 900 ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg 960 gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg 1020 tcagaccaag tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa 1080 aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt 1140 tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 1200 tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 1260 ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 1320 ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 1380 gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 1440 aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 1500 ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 1560 agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 1620 aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 1680 aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 1740 ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 1800 cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 1860 tctgtggata accgtattac cgcctttgag tggaggagtc gagacgcatc gctagatgaa 1920 gagcaggtta gatagtcttc gacgtccaca tatacgtgcc gttcactatt atttagtgaa 1980 atgagatatt atgatatttt ctgaattgtg attaaaaagg caactttatg cccatgcaac 2040 agaaactata aaaaatacag agaatgaaaa gaaacagata gattttttag ttctttaggc 2100 ccgtagtctg caaatccttt tatgattttc tatcaaacaa aagaggaaaa tagaccagtt 2160 gcaatccaaa cgagagtcta atagaatgag gtcgaaaagt aaatcgcgcg ggtttgttac 2220 tgataaagca ggcaagacct aaaatgtgta aagggcaaag tgtatacttt ggcgtcaccc 2280 cttacatatt ttaggtcttt ttttattgtg cgtaactaac ttgccatctt caaacaggag 2340 ggctggaaga agcagaccgc taacacagta cataaaaaag gagacatgaa cgatgaacat 2400 caaaaagttt gcaaaacaag caacagtatt aacctttact accgcactgc tggcaggagg 2460 cgcaactcaa gcgtttgcga aagaaacgaa ccaaaagcca tataaggaaa catacggcat 2520 ttcccatatt acacgccatg atatgctgca aatccctgaa cagcaaaaaa atgaaaaata 2580 taaagttcct gagttcgatt cgtccacaat taaaaatatc tcttctgcaa aaggcctgga 2640 cgtttgggac agctggccat tacaaaacac tgacggcact gtcgcaaact atcacggcta 2700 ccacatcgtc tttgcattag ccggagatcc taaaaatgcg gatgacacat cgatttacat 2760 gttctatcaa aaagtcggcg aaacttctat tgacagctgg aaaaacgctg gccgcgtctt 2820 taaagacagc gacaaattcg atgcaaatga ttctatccta aaagaccaaa cacaagaatg 2880 gtcaggttca gccacattta catctgacgg aaaaatccgt ttattctaca ctgatttctc 2940 cggtaaacat tacggcaaac aaacactgac aactgcacaa gttaacgtat cagcatcaga 3000 cagctctttg aacatcaacg gtgtagagga ttataaatca atctttgacg gtgacggaaa 3060 aacgtatcaa aatgtacagc agttcatcga tgaaggcaac tacagctcag gcgacaacca 3120 tacgctgaga gatcctcact acgtagaaga taaaggccac aaatacttag tatttgaagc 3180 aaacactgga actgaagatg gctaccaagg cgaagaatct ttatttaaca aagcatacta 3240 tggcaaaagc acatcattct tccgtcaaga aagtcaaaaa cttctgcaaa gcgataaaaa 3300 acgcacggct gagttagcaa acggcgctct cggtatgatt gagctaaacg atgattacac 3360 actgaaaaaa gtgatgaaac cgctgattgc atctaacaca gtaacagatg aaattgaacg 3420 cgcgaacgtc tttaaaatga acggcaaatg gtacctgttc actgactccc gcggatcaaa 3480 aatgacgatt gacggcatta cgtctaacga tatttacatg cttggttatg tttctaattc 3540 tttaactggc ccatacaagc cgctgaacaa aactggcctt gtgttaaaaa tggatcttga 3600 tcctaacgat gtaaccttta cttactcaca cttcgctgta cctcaagcga aaggaaacaa 3660 tgtcgtgatt acaagctata tgacaaacag aggattctac gcagacaaac aatcaacgtt 3720 tgcgcctagc ttcctgctga acatcaaagg caagaaaaca tctgttgtca aagacagcat 3780 ccttgaacaa ggacaattaa cagttaacaa ataaaaacgc aaaagaaaat gccgatatcc 3840 tattggcatt ggaagacata agcacctgct cttctaa 3877 <210> 11 <211> 5415 <212> DNA <213> Artificial Sequence <220> <223> pYVTSD Vector <400> 11 ccaaagacga aaggttgaat gaaacctttt tgccatccga catccacagg tccattctca 60 cacataagtg ccaaacgcaa caggagggga tacactagca gcagaccgtt gcaaacgcag 120 gacctccact cctcttctcc tcaacaccca cttttgccat cgaaaaacca gcccagttat 180 tgggcttgat tggagctcgc tcattccaat tccttctatt aggctactaa caccatgact 240 ttattagcct gtctatcctg gcccccctgg cgaggttcat gtttgtttat ttccgaatgc 300 aacaagctcc gcattacacc cgaacatcac tccagatgag ggctttctga gtgtggggtc 360 aaatagtttc atgttcccca aatggcccaa aactgacagt ttaaacgctg tcttggaacc 420 taatatgaca aaagcgtgat ctcatccaag atgaactaag tttggttcgt tgaaatgcta 480 acggccagtt ggtcaaaaag aaacttccaa aagtcggcat accgtttgtc ttgtttggta 540 ttgattgacg aatgctcaaa aataatctca ttaatgctta gcgcagtctc tctatcgctt 600 ctgaaccccg gtgcacctgt gccgaaacgc aaatggggaa acacccgctt tttggatgat 660 tatgcattgt ctccacattg tatgcttcca agattctggt gggaatactg ctgatagcct 720 aacgttcatg atcaaaattt aactgttcta acccctactt gacagcaata tataaacaga 780 aggaagctgc cctgtcttaa accttttttt ttatcatcat tattagctta ctttcataat 840 tgcgactggt tccaattgac aagcttttga ttttaacgac ttttaacgac aacttgagaa 900 gatcaaaaaa caactaatta ttcgaaacga tgagatttcc ttcaattttt actgctgttt 960 tattcgcagc atcctccgca ttagctgctc cagtcaacac tacaacagaa gatgaaacgg 1020 cacaaattcc ggctgaagct gtcatcggtt actcagattt agaaggggat ttcgatgttg 1080 ctgttttgcc attttccaac agcacaaata acgggttatt gtttataaat actactattg 1140 ccagcattgc tgctaaagaa gaaggggtat ctctcgagaa aagagaggct gaagccatgg 1200 agaccgacgt ccacatatac ctgccgttca ctattattta gtgaaatgag atattatgat 1260 attttctgaa ttgtgattaa aaaggcaact ttatgcccat gcaacagaaa ctataaaaaa 1320 tacagagaat gaaaagaaac agatagattt tttagttctt taggcccgta gtctgcaaat 1380 ccttttatga ttttctatca aacaaaagag gaaaatagac cagttgcaat ccaaacgaga 1440 gtctaataga atgaggtcga aaagtaaatc gcgcgggttt gttactgata aagcaggcaa 1500 gacctaaaat gtgtaaaggg caaagtgtat actttggcgt caccccttac atattttagg 1560 tcttttttta ttgtgcgtaa ctaacttgcc atcttcaaac aggagggctg gaagaagcag 1620 accgctaaca cagtacataa aaaaggagac atgaacgatg aacatcaaaa agtttgcaaa 1680 acaagcaaca gtattaacct ttactaccgc actgctggca ggaggcgcaa ctcaagcgtt 1740 tgcgaaagaa acgaaccaaa agccatataa ggaaacatac ggcatttccc atattacacg 1800 ccatgatatg ctgcaaatcc ctgaacagca aaaaaatgaa aaatataaag ttcctgagtt 1860 cgattcgtcc acaattaaaa atatctcttc tgcaaaaggc ctggacgttt gggacagctg 1920 gccattacaa aacactgacg gcactgtcgc aaactatcac ggctaccaca tcgtctttgc 1980 attagccgga gatcctaaaa atgcggatga cacatcgatt tacatgttct atcaaaaagt 2040 cggcgaaact tctattgaca gctggaaaaa cgctggccgc gtctttaaag acagcgacaa 2100 attcgatgca aatgattcta tcctaaaaga ccaaacacaa gaatggtcag gttcagccac 2160 atttacatct gacggaaaaa tccgtttatt ctacactgat ttctccggta aacattacgg 2220 caaacaaaca ctgacaactg cacaagttaa cgtatcagca tcagacagct ctttgaacat 2280 caacggtgta gaggattata aatcaatctt tgacggtgac ggaaaaacgt atcaaaatgt 2340 acagcagttc atcgatgaag gcaactacag ctcaggcgac aaccatacgc tgagagatcc 2400 tcactacgta gaagataaag gccacaaata cttagtattt gaagcaaaca ctggaactga 2460 agatggctac caaggcgaag aatctttatt taacaaagca tactatggca aaagcacatc 2520 attcttccgt caagaaagtc aaaaacttct gcaaagcgat aaaaaacgca cggctgagtt 2580 agcaaacggc gctctcggta tgattgagct aaacgatgat tacacactga aaaaagtgat 2640 gaaaccgctg attgcatcta acacagtaac agatgaaatt gaacgcgcga acgtctttaa 2700 aatgaacggc aaatggtacc tgttcactga ctcccgcgga tcaaaaatga cgattgacgg 2760 cattacgtct aacgatattt acatgcttgg ttatgtttct aattctttaa ctggcccata 2820 caagccgctg aacaaaactg gccttgtgtt aaaaatggat cttgatccta acgatgtaac 2880 ctttacttac tcacacttcg ctgtacctca agcgaaagga aacaatgtcg tgattacaag 2940 ctatatgaca aacagaggat tctacgcaga caaacaatca acgtttgcgc ctagcttcct 3000 gctgaacatc aaaggcaaga aaacatctgt tgtcaaagac agcatccttg aacaaggaca 3060 attaacagtt aacaaataaa aacgcaaaag aaaatgccga tatcctattg gcattgacgg 3120 tctcaagtac catcatcatc atcatcattg agtttgtagc cttagacatg actgttcctc 3180 agttcaagtt gggcacttac gagaagaccg gtcttgctag attctaatca agaggatgtc 3240 agaatgccat ttgcctgaga gatgcaggct tcatttttga tactttttta tttgtaacct 3300 atatagtata ggattttttt tgtcattttg tttcttctcg tacgagcttg ctcctgatca 3360 gcctatctcg cagctgatga atatcttgtg gtaggggttt gggaaaatca ttcgagtttg 3420 atgtttttct tggtatttcc cactcctctt cagagtacag aagattaagt gagacattcg 3480 tttgtgcgga tcccccacac accatagctt caaaatgttt ctactccttt tttactcttc 3540 cagattttct cggactccgc gcatcgccgt accacttcaa aacacccaag cacagcatac 3600 taaattttcc ctctttcttc ctctagggtg tcgttaatta cccgtactaa aggtttggaa 3660 aagaaaaaag agacagcctc gtttcttttt cttcgtcgaa aaaggcaata aaaattttta 3720 tcacgtttct ttttcttgaa attttttttt ttagtttttt tctctttcag tgacctccat 3780 tgatatttaa gttaataaac ggtcttcaat ttctcaagtt tcagtttcat ttttcttgtt 3840 ctattacaac tttttttact tcttgttcat tagaaagaaa gcatagcaat ctaatctaag 3900 gggcggtgtt gacaattaat catcggcata gtatatcggc atagtataat acgacaaggt 3960 gaggaactaa accatggcca agttgaccag tgccgttccg gtgctcaccg cgcgcgacgt 4020 cgccggagcg gtcgagttct ggaccgaccg gctcgggttc tcccgggact tcgtggagga 4080 cgacttcgcc ggtgtggtcc gggacgacgt gaccctgttc atcagcgcgg tccaggacca 4140 ggtggtgccg gacaacaccc tggcctgggt gtgggtgcgc ggcctggacg agctgtacgc 4200 cgagtggtcg gaggtcgtgt ccacgaactt ccgggacgcc tccgggccgg ccatgaccga 4260 gatcggcgag cagccgtggg ggcgggagtt cgccctgcgc gacccggccg gcaactgcgt 4320 gcacttcgtg gccgaggagc aggactgaca cgtccgacgg cggcccacgg gtcccaggcc 4380 tcggagatcc gtcccccttt tcctttgtcg atatcatgta attagttatg tcacgcttac 4440 attcacgccc tccccccaca tccgctctaa ccgaaaagga aggagttaga caacctgaag 4500 tctaggtccc tatttatttt tttatagtta tgttagtatt aagaacgtta tttatatttc 4560 aaatttttct tttttttctg tacagacgcg tgtacgcatg taacattata ctgaaaacct 4620 tgcttgagaa ggttttggga cgctcgaagg ctttaatttg caagctggag actaacatgt 4680 gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 4740 ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 4800 acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 4860 ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 4920 cgctttctca atgctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 4980 tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 5040 gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 5100 ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 5160 acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 5220 gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 5280 ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 5340 tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 5400 gatcagatct aacat 5415 <210> 12 <211> 3274 <212> DNA <213> Artificial Sequence <220> <223> pLVTSD Vector <400> 12 tagtcttata actatactga caatagaaac attaacaaat ctaaaacagt cttaattcta 60 tcttgagaaa gtattggtaa taatattatt gtcgataacg cgagcataat aaacggctct 120 gattaaattc tgaagtttgt tagatacaat gatttcgttc gaaggaacta caaaataaat 180 tataaggagg cactcaaaat gagtacaaaa gattttaact tggatttggt atctgtttcg 240 aagaaagatt caggtgcatc accacgcatt acaagtattt cgctatgtac acccggttgt 300 aaaacaggag actctgcatg gatccatgaa gaagaagatt atctcagcta ttttaatgtc 360 tacagtgata ctttctgctg cagccccgtt gtcaggtgtt tacgctgcca tggagaccga 420 cgtgctagct gctactccgg acattgacgg tctccagtaa gaattcgcat gcgagctcgt 480 cgacagatct tctagactcg agtgcatatt ttcggcaatc ttctcaatga gatgctcttc 540 agcatgttca atgatgtcga ttttttatta aaacgtctca aaatcgtttc tgagacgttt 600 tagcgtttat ttcgtttagt tatcggcata atcgttaaaa caggcgttat cgtagcgtaa 660 aagcccttga gcgtagcgtg ctttgcagcg aagatgttgt ctgttagatt atgaaagccg 720 atgactgaat gaaataataa gcgcagcgtc cttctatttc ggttggagga ggctcaaggg 780 agtttgaggg aatgaaattc cctcatgggt ttgattttaa aaattgcttg caattttgcc 840 gagcggtagc gctggaaaat ttttgaaaaa aatttggaat ttggaaaaaa atggggggaa 900 aggaagcgaa ttttgcttcc gtactacgac cccccattaa gtgccgagtg ccaatttttg 960 tgccaaaaac gctctatccc aactggctca agggtttgag gggtttttca atcgccaacg 1020 aatcgccaac gttttcgcca acgtttttta taaatctata tttaagtagc tttattgttg 1080 tttttatgat tacaaagtga tacactaatt ttataaaatt atttgattgg agttttttaa 1140 atggtgattt cagaatcgaa aaaaagagtt atgatttctc tgacaaaaga gcaagataaa 1200 aaattaacag atatggcgaa acaaaaaggt ttttcaaaat ctgcggttgc ggcgttagct 1260 atagaagaat atgcaagaaa ggaatcagaa caaaaaaaat aagcgaaagc tcgcgttttt 1320 agaaggatac gagttttcgc tacttgtttt tgataaggta atatatcatg gctattaaaa 1380 atactaaagc tagaaatttt ggatttttat tatatcctga ctcaattcct aatgattgga 1440 aagaaaaatt agagagtttg ggcgtatcta tggctgtcag tcctttacac gatatggacg 1500 aaaaaaaaga taaagataca tggaatagta gtgatgttat acgaaatgga aagcactata 1560 aaaaaccaca ctatcacgtt atatatattg cacgaaatcc tgtaacaata gaaagcgtta 1620 ggaacaagat taagcgaaaa ttggggaata gttcagttgc tcatgttgag atacttgatt 1680 atatcaaagg ttcatatgaa tatttgactc atgaatcaaa ggacgctatt gctaagaata 1740 aacatatata cgacaaaaaa gatattttga acattaatga ttttgatatt gaccgctata 1800 taacacttga tgaaagccaa aaaagagaat tgaagaattt acttttagat atagtggatg 1860 actataattt ggtaaataca aaagatttaa tggcttttat tcgccttagg ggagcggagt 1920 ttggaatttt aaatacgaat gatgtaaaag atattgtttc aacaaactct agcgccttta 1980 gattatggtt tgagggcaat tatcagtgtg gatatagagc aagttatgca aaggttcttg 2040 atgctgaaac gggggaaata aaatgacaaa caaagaaaaa gagttatttg ctgaaaatga 2100 ggaattaaaa aaagaaatta aggacttaaa agagcgtatt gaaagataca gagaaatgga 2160 agttgaatta agtacaacaa tagatttatt gagaggaggg attattgaat aaataaaagc 2220 ccccctgacg aaagtcgacg gcaatagtta cccttattat caagataaga aagaaaagga 2280 tttttcgcta cgctcaaatc ctttaaaaaa acacaaaaga ccacattttt taatgtggtc 2340 tttattcttc aactaaagca cccattagtt caacaaacga aaattggata aagtgggata 2400 tttttaaaat atatatttat gttacagtaa tattgacttt taaaaaagga ttgattctaa 2460 tgaagaaagc agacaagtaa gcctcctaaa ttcactttag ataaaaattt aggaggcata 2520 tcaaatgaac tttaataaaa ttgatttaga caattggaag agaaaagaga tatttaatca 2580 ttatttgaac caacaaacga cttttagtat aaccacagaa attgatatta gtgttttata 2640 ccgaaacata aaacaagaag gatataaatt ttaccctgca tttattttct tagtgacaag 2700 ggtgataaac tcaaatacag cttttagaac tggttacaat agcgacggag agttaggtta 2760 ttgggataag ttagagccac tttatacaat ttttgatggt gtatctaaaa cattctctgg 2820 tatttggact cctgtaaaga atgacttcaa agagttttat gatttatacc tttctgatgt 2880 agagaaatat aatggttcgg ggaaattgtt tcccaaaaca cctatacctg aaaatgcttt 2940 ttctctttct attattccat ggacttcatt tactgggttt aacttaaata tcaataataa 3000 tagtaattac cttctaccca ttattacagc aggaaaattc attaataaag gtaattcaat 3060 atatttaccg ctatctttac aggtacatca ttctgtttgt gatggttatc atgcaggatt 3120 gtttatgaac tctattcagg aattgtcaga taggcctaat gactggcttt tataatatga 3180 gataatgccg actgtacttt ttacagtcgg ttttctaatg tcactaacct gccccgttag 3240 ttgaagaagg tttttatatt acagctccaa gatc 3274 <210> 13 <211> 7284 <212> DNA <213> Artificial Sequence <220> <223> pVTSD1 Vector <400> 13 taatacgact cactataggg gaattgtgag cggataacaa ttcccctcta gaaataattt 60 tgtttaactt taagaaggag atatacatat gcaccatcat catcatcatt cttctggtgt 120 agatctgggt accgagaacc tgtacttcca atccatggag accgacgtcc acatatacct 180 gccgttcact attatttagt gaaatgagat attatgatat tttctgaatt gtgattaaaa 240 aggcaacttt atgcccatgc aacagaaact ataaaaaata cagagaatga aaagaaacag 300 atagattttt tagttcttta ggcccgtagt ctgcaaatcc ttttatgatt ttctatcaaa 360 caaaagagga aaatagacca gttgcaatcc aaacgagagt ctaatagaat gaggtcgaaa 420 agtaaatcgc gcgggtttgt tactgataaa gcaggcaaga cctaaaatgt gtaaagggca 480 aagtgtatac tttggcgtca ccccttacat attttaggtc tttttttatt gtgcgtaact 540 aacttgccat cttcaaacag gagggctgga agaagcagac cgctaacaca gtacataaaa 600 aaggagacat gaacgatgaa catcaaaaag tttgcaaaac aagcaacagt attaaccttt 660 actaccgcac tgctggcagg aggcgcaact caagcgtttg cgaaagaaac gaaccaaaag 720 ccatataagg aaacatacgg catttcccat attacacgcc atgatatgct gcaaatccct 780 gaacagcaaa aaaatgaaaa atataaagtt cctgagttcg attcgtccac aattaaaaat 840 atctcttctg caaaaggcct ggacgtttgg gacagctggc cattacaaaa cactgacggc 900 actgtcgcaa actatcacgg ctaccacatc gtctttgcat tagccggaga tcctaaaaat 960 gcggatgaca catcgattta catgttctat caaaaagtcg gcgaaacttc tattgacagc 1020 tggaaaaacg ctggccgcgt ctttaaagac agcgacaaat tcgatgcaaa tgattctatc 1080 ctaaaagacc aaacacaaga atggtcaggt tcagccacat ttacatctga cggaaaaatc 1140 cgtttattct acactgattt ctccggtaaa cattacggca aacaaacact gacaactgca 1200 caagttaacg tatcagcatc agacagctct ttgaacatca acggtgtaga ggattataaa 1260 tcaatctttg acggtgacgg aaaaacgtat caaaatgtac agcagttcat cgatgaaggc 1320 aactacagct caggcgacaa ccatacgctg agagatcctc actacgtaga agataaaggc 1380 cacaaatact tagtatttga agcaaacact ggaactgaag atggctacca aggcgaagaa 1440 tctttattta acaaagcata ctatggcaaa agcacatcat tcttccgtca agaaagtcaa 1500 aaacttctgc aaagcgataa aaaacgcacg gctgagttag caaacggcgc tctcggtatg 1560 attgagctaa acgatgatta cacactgaaa aaagtgatga aaccgctgat tgcatctaac 1620 acagtaacag atgaaattga acgcgcgaac gtctttaaaa tgaacggcaa atggtacctg 1680 ttcactgact cccgcggatc aaaaatgacg attgacggca ttacgtctaa cgatatttac 1740 atgcttggtt atgtttctaa ttctttaact ggcccataca agccgctgaa caaaactggc 1800 cttgtgttaa aaatggatct tgatcctaac gatgtaacct ttacttactc acacttcgct 1860 gtacctcaag cgaaaggaaa caatgtcgtg attacaagct atatgacaaa cagaggattc 1920 tacgcagaca aacaatcaac gtttgcgcct agcttcctgc tgaacatcaa aggcaagaaa 1980 acatctgttg tcaaagacag catccttgaa caaggacaat taacagttaa caaataaaaa 2040 cgcaaaagaa aatgccgata tcctattggc attgacggtc tccagtaaag gtggatacgg 2100 atccgaattc gagctccgtc gacaagcttg cggccgcact cgagcaccac caccaccacc 2160 actgagatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct gccaccgctg 2220 agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgctga 2280 aaggaggaac tatatccgga ttggcgaatg ggacgcgccc tgtagcggcg cattaagcgc 2340 ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 2400 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 2460 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 2520 acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 2580 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 2640 caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 2700 gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 2760 tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt 2820 ctaaatacat tcaaatatgt atccgctcat gaattaattc ttagaaaaac tcatcgagca 2880 tcaaatgaaa ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc 2940 gtttctgtaa tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt 3000 atcggtctgc gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa 3060 aaataaggtt atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca 3120 aaagtttatg catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa 3180 aatcactcgc atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata 3240 cgcgatcgct gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca 3300 ctgccagcgc atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg 3360 ctgttttccc ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat 3420 gcttgatggt cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg 3480 taacatcatt ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct 3540 tcccatacaa tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat 3600 acccatataa atcagcatcc atgttggaat ttaatcgcgg cctagagcaa gacgtttccc 3660 gttgaatatg gctcataaca ccccttgtat tactgtttat gtaagcagac agttttattg 3720 ttcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 3780 aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 3840 aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 3900 ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg 3960 tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 4020 ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 4080 cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 4140 agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 4200 gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 4260 ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 4320 tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 4380 tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 4440 cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 4500 tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 4560 gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 4620 atatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc cagtatacac 4680 tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa cacccgctga 4740 cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4800 cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga ggcagctgcg 4860 gtaaagctca tcagcgtggt cgtgaagcga ttcacagatg tctgcctgtt catccgcgtc 4920 cagctcgttg agtttctcca gaagcgttaa tgtctggctt ctgataaagc gggccatgtt 4980 aagggcggtt ttttcctgtt tggtcactga tgcctccgtg taagggggat ttctgttcat 5040 gggggtaatg ataccgatga aacgagagag gatgctcacg atacgggtta ctgatgatga 5100 acatgcccgg ttactggaac gttgtgaggg taaacaactg gcggtatgga tgcggcggga 5160 ccagagaaaa atcactcagg gtcaatgcca gcgcttcgtt aatacagatg taggtgttcc 5220 acagggtagc cagcagcatc ctgcgatgca gatccggaac ataatggtgc agggcgctga 5280 cttccgcgtt tccagacttt acgaaacacg gaaaccgaag accattcatg ttgttgctca 5340 ggtcgcagac gttttgcagc agcagtcgct tcacgttcgc tcgcgtatcg gtgattcatt 5400 ctgctaacca gtaaggcaac cccgccagcc tagccgggtc ctcaacgaca ggagcacgat 5460 catgcgcacc cgtggggccg ccatgccggc gataatggcc tgcttctcgc cgaaacgttt 5520 ggtggcggga ccagtgacga aggcttgagc gagggcgtgc aagattccga ataccgcaag 5580 cgacaggccg atcatcgtcg cgctccagcg aaagcggtcc tcgccgaaaa tgacccagag 5640 cgctgccggc acctgtccta cgagttgcat gataaagaag acagtcataa gtgcggcgac 5700 gatagtcatg ccccgcgccc accggaagga gctgactggg ttgaaggctc tcaagggcat 5760 cggtcgagat cccggtgcct aatgagtgag ctaacttaca ttaattgcgt tgcgctcact 5820 gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 5880 ggggagaggc ggtttgcgta ttgggcgcca gggtggtttt tcttttcacc agtgagacgg 5940 gcaacagctg attgcccttc accgcctggc cctgagagag ttgcagcaag cggtccacgc 6000 tggtttgccc cagcaggcga aaatcctgtt tgatggtggt taacggcggg atataacatg 6060 agctgtcttc ggtatcgtcg tatcccacta ccgagatatc cgcaccaacg cgcagcccgg 6120 actcggtaat ggcgcgcatt gcgcccagcg ccatctgatc gttggcaacc agcatcgcag 6180 tgggaacgat gccctcattc agcatttgca tggtttgttg aaaaccggac atggcactcc 6240 agtcgccttc ccgttccgct atcggctgaa tttgattgcg agtgagatat ttatgccagc 6300 cagccagacg cagacgcgcc gagacagaac ttaatgggcc cgctaacagc gcgatttgct 6360 ggtgacccaa tgcgaccaga tgctccacgc ccagtcgcgt accgtcttca tgggagaaaa 6420 taatactgtt gatgggtgtc tggtcagaga catcaagaaa taacgccgga acattagtgc 6480 aggcagcttc cacagcaatg gcatcctggt catccagcgg atagttaatg atcagcccac 6540 tgacgcgttg cgcgagaaga ttgtgcaccg ccgctttaca ggcttcgacg ccgcttcgtt 6600 ctaccatcga caccaccacg ctggcaccca gttgatcggc gcgagattta atcgccgcga 6660 caatttgcga cggcgcgtgc agggccagac tggaggtggc aacgccaatc agcaacgact 6720 gtttgcccgc cagttgttgt gccacgcggt tgggaatgta attcagctcc gccatcgccg 6780 cttccacttt ttcccgcgtt ttcgcagaaa cgtggctggc ctggttcacc acgcgggaaa 6840 cggtctgata agagacaccg gcatactctg cgacatcgta taacgttact ggtttcacat 6900 tcaccaccct gaattgactc tcttccgggc gctatcatgc cataccgcga aaggttttgc 6960 gccattcgat ggtgtccggg atctcgacgc tctcccttat gcgactcctg cattaggaag 7020 cagcccagta gtaggttgag gccgttgagc accgccgccg caaggaatgg tgcatgcaag 7080 gagatggcgc ccaacagtcc cccggccacg gggcctgcca ccatacccac gccgaaacaa 7140 gcgctcatga gcccgaagtg gcgagcccga tcttccccat cggtgatgtc ggcgatatag 7200 gcgccagcaa ccgcacctgt ggcgccggtg atgccggcca cgatgcgtcc ggcgtagagg 7260 atcgagatct cgatcccgcg aaat 7284 <210> 14 <211> 7227 <212> DNA <213> Artificial Sequence <220> <223> pVTSD2 Vector <400> 14 taatacgact cactataggg gaattgtgag cggataacaa ttcccctcta gaaataattt 60 tgtttaactt taagaaggag atataaccat ggagaccgac gtccacatat acctgccgtt 120 cactattatt tagtgaaatg agatattatg atattttctg aattgtgatt aaaaaggcaa 180 ctttatgccc atgcaacaga aactataaaa aatacagaga atgaaaagaa acagatagat 240 tttttagttc tttaggcccg tagtctgcaa atccttttat gattttctat caaacaaaag 300 aggaaaatag accagttgca atccaaacga gagtctaata gaatgaggtc gaaaagtaaa 360 tcgcgcgggt ttgttactga taaagcaggc aagacctaaa atgtgtaaag ggcaaagtgt 420 atactttggc gtcacccctt acatatttta ggtctttttt tattgtgcgt aactaacttg 480 ccatcttcaa acaggagggc tggaagaagc agaccgctaa cacagtacat aaaaaaggag 540 acatgaacga tgaacatcaa aaagtttgca aaacaagcaa cagtattaac ctttactacc 600 gcactgctgg caggaggcgc aactcaagcg tttgcgaaag aaacgaacca aaagccatat 660 aaggaaacat acggcatttc ccatattaca cgccatgata tgctgcaaat ccctgaacag 720 caaaaaaatg aaaaatataa agttcctgag ttcgattcgt ccacaattaa aaatatctct 780 tctgcaaaag gcctggacgt ttgggacagc tggccattac aaaacactga cggcactgtc 840 gcaaactatc acggctacca catcgtcttt gcattagccg gagatcctaa aaatgcggat 900 gacacatcga tttacatgtt ctatcaaaaa gtcggcgaaa cttctattga cagctggaaa 960 aacgctggcc gcgtctttaa agacagcgac aaattcgatg caaatgattc tatcctaaaa 1020 gaccaaacac aagaatggtc aggttcagcc acatttacat ctgacggaaa aatccgttta 1080 ttctacactg atttctccgg taaacattac ggcaaacaaa cactgacaac tgcacaagtt 1140 aacgtatcag catcagacag ctctttgaac atcaacggtg tagaggatta taaatcaatc 1200 tttgacggtg acggaaaaac gtatcaaaat gtacagcagt tcatcgatga aggcaactac 1260 agctcaggcg acaaccatac gctgagagat cctcactacg tagaagataa aggccacaaa 1320 tacttagtat ttgaagcaaa cactggaact gaagatggct accaaggcga agaatcttta 1380 tttaacaaag catactatgg caaaagcaca tcattcttcc gtcaagaaag tcaaaaactt 1440 ctgcaaagcg ataaaaaacg cacggctgag ttagcaaacg gcgctctcgg tatgattgag 1500 ctaaacgatg attacacact gaaaaaagtg atgaaaccgc tgattgcatc taacacagta 1560 acagatgaaa ttgaacgcgc gaacgtcttt aaaatgaacg gcaaatggta cctgttcact 1620 gactcccgcg gatcaaaaat gacgattgac ggcattacgt ctaacgatat ttacatgctt 1680 ggttatgttt ctaattcttt aactggccca tacaagccgc tgaacaaaac tggccttgtg 1740 ttaaaaatgg atcttgatcc taacgatgta acctttactt actcacactt cgctgtacct 1800 caagcgaaag gaaacaatgt cgtgattaca agctatatga caaacagagg attctacgca 1860 gacaaacaat caacgtttgc gcctagcttc ctgctgaaca tcaaaggcaa gaaaacatct 1920 gttgtcaaag acagcatcct tgaacaagga caattaacag ttaacaaata aaaacgcaaa 1980 agaaaatgcc gatatcctat tggcattgac ggtctccagt aaggatccta taggtggata 2040 cggatccgaa ttcgagctcc gtcgacaagc ttgcggccgc actcgagcac caccaccacc 2100 accactgaga tccggctgct aacaaagccc gaaaggaagc tgagttggct gctgccaccg 2160 ctgagcaata actagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc 2220 tgaaaggagg aactatatcc ggattggcga atgggacgcg ccctgtagcg gcgcattaag 2280 cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 2340 cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 2400 tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 2460 aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 2520 ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 2580 actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 2640 ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 2700 gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 2760 tttctaaata cattcaaata tgtatccgct catgaattaa ttcttagaaa aactcatcga 2820 gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat ttttgaaaaa 2880 gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg gcaagatcct 2940 ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat ttcccctcgt 3000 caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc ggtgagaatg 3060 gcaaaagttt atgcatttct ttccagactt gttcaacagg ccagccatta cgctcgtcat 3120 caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa 3180 atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac cggcgcagga 3240 acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct aatacctgga 3300 atgctgtttt cccggggatc gcagtggtga gtaaccatgc atcatcagga gtacggataa 3360 aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg accatctcat 3420 ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct ggcgcatcgg 3480 gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg cgagcccatt 3540 tatacccata taaatcagca tccatgttgg aatttaatcg cggcctagag caagacgttt 3600 cccgttgaat atggctcata acaccccttg tattactgtt tatgtaagca gacagtttta 3660 ttgttcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 3720 gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 3780 acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 3840 tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag 3900 ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 3960 atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 4020 agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 4080 cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 4140 agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 4200 acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 4260 gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 4320 ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 4380 gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 4440 gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 4500 gaagcggaag agcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac 4560 cgcatatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata 4620 cactccgcta tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc 4680 tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt 4740 ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagct 4800 gcggtaaagc tcatcagcgt ggtcgtgaag cgattcacag atgtctgcct gttcatccgc 4860 gtccagctcg ttgagtttct ccagaagcgt taatgtctgg cttctgataa agcgggccat 4920 gttaagggcg gttttttcct gtttggtcac tgatgcctcc gtgtaagggg gatttctgtt 4980 catgggggta atgataccga tgaaacgaga gaggatgctc acgatacggg ttactgatga 5040 tgaacatgcc cggttactgg aacgttgtga gggtaaacaa ctggcggtat ggatgcggcg 5100 ggaccagaga aaaatcactc agggtcaatg ccagcgcttc gttaatacag atgtaggtgt 5160 tccacagggt agccagcagc atcctgcgat gcagatccgg aacataatgg tgcagggcgc 5220 tgacttccgc gtttccagac tttacgaaac acggaaaccg aagaccattc atgttgttgc 5280 tcaggtcgca gacgttttgc agcagcagtc gcttcacgtt cgctcgcgta tcggtgattc 5340 attctgctaa ccagtaaggc aaccccgcca gcctagccgg gtcctcaacg acaggagcac 5400 gatcatgcgc acccgtgggg ccgccatgcc ggcgataatg gcctgcttct cgccgaaacg 5460 tttggtggcg ggaccagtga cgaaggcttg agcgagggcg tgcaagattc cgaataccgc 5520 aagcgacagg ccgatcatcg tcgcgctcca gcgaaagcgg tcctcgccga aaatgaccca 5580 gagcgctgcc ggcacctgtc ctacgagttg catgataaag aagacagtca taagtgcggc 5640 gacgatagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg 5700 catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg cgttgcgctc 5760 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 5820 cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc accagtgaga 5880 cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc aagcggtcca 5940 cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc gggatataac 6000 atgagctgtc ttcggtatcg tcgtatccca ctaccgagat atccgcacca acgcgcagcc 6060 cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca accagcatcg 6120 cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg gacatggcac 6180 tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga tatttatgcc 6240 agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac agcgcgattt 6300 gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct tcatgggaga 6360 aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc ggaacattag 6420 tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta atgatcagcc 6480 cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg acgccgcttc 6540 gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat ttaatcgccg 6600 cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca atcagcaacg 6660 actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc tccgccatcg 6720 ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc accacgcggg 6780 aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt actggtttca 6840 cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg cgaaaggttt 6900 tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc ctgcattagg 6960 aagcagccca gtagtaggtt gaggccgttg agcaccgccg ccgcaaggaa tggtgcatgc 7020 aaggagatgg cgcccaacag tcccccggcc acggggcctg ccaccatacc cacgccgaaa 7080 caagcgctca tgagcccgaa gtggcgagcc cgatcttccc catcggtgat gtcggcgata 7140 taggcgccag caaccgcacc tgtggcgccg gtgatgccgg ccacgatgcg tccggcgtag 7200 aggatcgaga tctcgatccc gcgaaat 7227 <210> 15 <211> 7202 <212> DNA <213> Artificial Sequence <220> <223> pVTSD3 Vector <400> 15 taatacgact cactataggg gaattgtgag cggataacaa ttcccctcta gaaataattt 60 tgtttaactt taagaaggag atataaccat ggagaccgac gtccacatat acctgccgtt 120 cactattatt tagtgaaatg agatattatg atattttctg aattgtgatt aaaaaggcaa 180 ctttatgccc atgcaacaga aactataaaa aatacagaga atgaaaagaa acagatagat 240 tttttagttc tttaggcccg tagtctgcaa atccttttat gattttctat caaacaaaag 300 aggaaaatag accagttgca atccaaacga gagtctaata gaatgaggtc gaaaagtaaa 360 tcgcgcgggt ttgttactga taaagcaggc aagacctaaa atgtgtaaag ggcaaagtgt 420 atactttggc gtcacccctt acatatttta ggtctttttt tattgtgcgt aactaacttg 480 ccatcttcaa acaggagggc tggaagaagc agaccgctaa cacagtacat aaaaaaggag 540 acatgaacga tgaacatcaa aaagtttgca aaacaagcaa cagtattaac ctttactacc 600 gcactgctgg caggaggcgc aactcaagcg tttgcgaaag aaacgaacca aaagccatat 660 aaggaaacat acggcatttc ccatattaca cgccatgata tgctgcaaat ccctgaacag 720 caaaaaaatg aaaaatataa agttcctgag ttcgattcgt ccacaattaa aaatatctct 780 tctgcaaaag gcctggacgt ttgggacagc tggccattac aaaacactga cggcactgtc 840 gcaaactatc acggctacca catcgtcttt gcattagccg gagatcctaa aaatgcggat 900 gacacatcga tttacatgtt ctatcaaaaa gtcggcgaaa cttctattga cagctggaaa 960 aacgctggcc gcgtctttaa agacagcgac aaattcgatg caaatgattc tatcctaaaa 1020 gaccaaacac aagaatggtc aggttcagcc acatttacat ctgacggaaa aatccgttta 1080 ttctacactg atttctccgg taaacattac ggcaaacaaa cactgacaac tgcacaagtt 1140 aacgtatcag catcagacag ctctttgaac atcaacggtg tagaggatta taaatcaatc 1200 tttgacggtg acggaaaaac gtatcaaaat gtacagcagt tcatcgatga aggcaactac 1260 agctcaggcg acaaccatac gctgagagat cctcactacg tagaagataa aggccacaaa 1320 tacttagtat ttgaagcaaa cactggaact gaagatggct accaaggcga agaatcttta 1380 tttaacaaag catactatgg caaaagcaca tcattcttcc gtcaagaaag tcaaaaactt 1440 ctgcaaagcg ataaaaaacg cacggctgag ttagcaaacg gcgctctcgg tatgattgag 1500 ctaaacgatg attacacact gaaaaaagtg atgaaaccgc tgattgcatc taacacagta 1560 acagatgaaa ttgaacgcgc gaacgtcttt aaaatgaacg gcaaatggta cctgttcact 1620 gactcccgcg gatcaaaaat gacgattgac ggcattacgt ctaacgatat ttacatgctt 1680 ggttatgttt ctaattcttt aactggccca tacaagccgc tgaacaaaac tggccttgtg 1740 ttaaaaatgg atcttgatcc taacgatgta acctttactt actcacactt cgctgtacct 1800 caagcgaaag gaaacaatgt cgtgattaca agctatatga caaacagagg attctacgca 1860 gacaaacaat caacgtttgc gcctagcttc ctgctgaaca tcaaaggcaa gaaaacatct 1920 gttgtcaaag acagcatcct tgaacaagga caattaacag ttaacaaata aaaacgcaaa 1980 agaaaatgcc gatatcctat tggcattgac ggtctccagt accaccatca tcatcatcat 2040 taagtcagcg gccgcactcg agcaccacca ccaccaccac tgagatccgg ctgctaacaa 2100 agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactag cataacccct 2160 tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta tatccggatt 2220 ggcgaatggg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 2280 agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 2340 tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 2400 ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 2460 cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 2520 tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 2580 tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 2640 caaaaattta acgcgaattt taacaaaata ttaacgttta caatttcagg tggcactttt 2700 cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 2760 ccgctcatga attaattctt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 2820 catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 2880 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 2940 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 3000 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 3060 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 3120 gttattcatt cgtgattgcg cctgagcgag acgaaatacg cgatcgctgt taaaaggaca 3180 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 3240 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gttttcccgg ggatcgcagt 3300 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 3360 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 3420 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaatc gatagattgt 3480 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 3540 gttggaattt aatcgcggcc tagagcaaga cgtttcccgt tgaatatggc tcataacacc 3600 ccttgtatta ctgtttatgt aagcagacag ttttattgtt catgaccaaa atcccttaac 3660 gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 3720 atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 3780 tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 3840 gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 3900 actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 3960 gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 4020 agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 4080 ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 4140 aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 4200 cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 4260 gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 4320 cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 4380 cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 4440 gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 4500 attttctcct tacgcatctg tgcggtattt cacaccgcat atatggtgca ctctcagtac 4560 aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 4620 gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 4680 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 4740 ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 4800 tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 4860 agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 4920 gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 4980 cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 5040 tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 5100 caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 5160 gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 5220 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 5280 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 5340 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggggccgcc 5400 atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc agtgacgaag 5460 gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccgat catcgtcgcg 5520 ctccagcgaa agcggtcctc gccgaaaatg acccagagcg ctgccggcac ctgtcctacg 5580 agttgcatga taaagaagac agtcataagt gcggcgacga tagtcatgcc ccgcgcccac 5640 cggaaggagc tgactgggtt gaaggctctc aagggcatcg gtcgagatcc cggtgcctaa 5700 tgagtgagct aacttacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac 5760 ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 5820 gggcgccagg gtggtttttc ttttcaccag tgagacgggc aacagctgat tgcccttcac 5880 cgcctggccc tgagagagtt gcagcaagcg gtccacgctg gtttgcccca gcaggcgaaa 5940 atcctgtttg atggtggtta acggcgggat ataacatgag ctgtcttcgg tatcgtcgta 6000 tcccactacc gagatatccg caccaacgcg cagcccggac tcggtaatgg cgcgcattgc 6060 gcccagcgcc atctgatcgt tggcaaccag catcgcagtg ggaacgatgc cctcattcag 6120 catttgcatg gtttgttgaa aaccggacat ggcactccag tcgccttccc gttccgctat 6180 cggctgaatt tgattgcgag tgagatattt atgccagcca gccagacgca gacgcgccga 6240 gacagaactt aatgggcccg ctaacagcgc gatttgctgg tgacccaatg cgaccagatg 6300 ctccacgccc agtcgcgtac cgtcttcatg ggagaaaata atactgttga tgggtgtctg 6360 gtcagagaca tcaagaaata acgccggaac attagtgcag gcagcttcca cagcaatggc 6420 atcctggtca tccagcggat agttaatgat cagcccactg acgcgttgcg cgagaagatt 6480 gtgcaccgcc gctttacagg cttcgacgcc gcttcgttct accatcgaca ccaccacgct 6540 ggcacccagt tgatcggcgc gagatttaat cgccgcgaca atttgcgacg gcgcgtgcag 6600 ggccagactg gaggtggcaa cgccaatcag caacgactgt ttgcccgcca gttgttgtgc 6660 cacgcggttg ggaatgtaat tcagctccgc catcgccgct tccacttttt cccgcgtttt 6720 cgcagaaacg tggctggcct ggttcaccac gcgggaaacg gtctgataag agacaccggc 6780 atactctgcg acatcgtata acgttactgg tttcacattc accaccctga attgactctc 6840 ttccgggcgc tatcatgcca taccgcgaaa ggttttgcgc cattcgatgg tgtccgggat 6900 ctcgacgctc tcccttatgc gactcctgca ttaggaagca gcccagtagt aggttgaggc 6960 cgttgagcac cgccgccgca aggaatggtg catgcaagga gatggcgccc aacagtcccc 7020 cggccacggg gcctgccacc atacccacgc cgaaacaagc gctcatgagc ccgaagtggc 7080 gagcccgatc ttccccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg 7140 cgccggtgat gccggccacg atgcgtccgg cgtagaggat cgagatctcg atcccgcgaa 7200 at 7202 <210> 16 <211> 5075 <212> DNA <213> Artificial Sequence <220> <223> pVTSD4 Vector <400> 16 cgagggcaaa ccatggctca ccatcatcat catcattctt ctggtgtaga tctgggtacc 60 gagaacctgt acttccaatc catggagacc gacgtccaca tatacctgcc gttcactatt 120 atttagtgaa atgagatatt atgatatttt ctgaattgtg attaaaaagg caactttatg 180 cccatgcaac agaaactata aaaaatacag agaatgaaaa gaaacagata gattttttag 240 ttctttaggc ccgtagtctg caaatccttt tatgattttc tatcaaacaa aagaggaaaa 300 tagaccagtt gcaatccaaa cgagagtcta atagaatgag gtcgaaaagt aaatcgcgcg 360 ggtttgttac tgataaagca ggcaagacct aaaatgtgta aagggcaaag tgtatacttt 420 ggcgtcaccc cttacatatt ttaggtcttt ttttattgtg cgtaactaac ttgccatctt 480 caaacaggag ggctggaaga agcagaccgc taacacagta cataaaaaag gagacatgaa 540 cgatgaacat caaaaagttt gcaaaacaag caacagtatt aacctttact accgcactgc 600 tggcaggagg cgcaactcaa gcgtttgcga aagaaacgaa ccaaaagcca tataaggaaa 660 catacggcat ttcccatatt acacgccatg atatgctgca aatccctgaa cagcaaaaaa 720 atgaaaaata taaagttcct gagttcgatt cgtccacaat taaaaatatc tcttctgcaa 780 aaggcctgga cgtttgggac agctggccat tacaaaacac tgacggcact gtcgcaaact 840 atcacggcta ccacatcgtc tttgcattag ccggagatcc taaaaatgcg gatgacacat 900 cgatttacat gttctatcaa aaagtcggcg aaacttctat tgacagctgg aaaaacgctg 960 gccgcgtctt taaagacagc gacaaattcg atgcaaatga ttctatccta aaagaccaaa 1020 cacaagaatg gtcaggttca gccacattta catctgacgg aaaaatccgt ttattctaca 1080 ctgatttctc cggtaaacat tacggcaaac aaacactgac aactgcacaa gttaacgtat 1140 cagcatcaga cagctctttg aacatcaacg gtgtagagga ttataaatca atctttgacg 1200 gtgacggaaa aacgtatcaa aatgtacagc agttcatcga tgaaggcaac tacagctcag 1260 gcgacaacca tacgctgaga gatcctcact acgtagaaga taaaggccac aaatacttag 1320 tatttgaagc aaacactgga actgaagatg gctaccaagg cgaagaatct ttatttaaca 1380 aagcatacta tggcaaaagc acatcattct tccgtcaaga aagtcaaaaa cttctgcaaa 1440 gcgataaaaa acgcacggct gagttagcaa acggcgctct cggtatgatt gagctaaacg 1500 atgattacac actgaaaaaa gtgatgaaac cgctgattgc atctaacaca gtaacagatg 1560 aaattgaacg cgcgaacgtc tttaaaatga acggcaaatg gtacctgttc actgactccc 1620 gcggatcaaa aatgacgatt gacggcatta cgtctaacga tatttacatg cttggttatg 1680 tttctaattc tttaactggc ccatacaagc cgctgaacaa aactggcctt gtgttaaaaa 1740 tggatcttga tcctaacgat gtaaccttta cttactcaca cttcgctgta cctcaagcga 1800 aaggaaacaa tgtcgtgatt acaagctata tgacaaacag aggattctac gcagacaaac 1860 aatcaacgtt tgcgcctagc ttcctgctga acatcaaagg caagaaaaca tctgttgtca 1920 aagacagcat ccttgaacaa ggacaattaa cagttaacaa ataaaaacgc aaaagaaaat 1980 gccgatatcc tattggcatt gacggtctca agtaataagg atccgacctg tgaagtgaaa 2040 aatggcgcac attgtgcgac attttttttg tctgccgttt accgctactg cgtcacggat 2100 ctccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 2160 accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 2220 gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 2280 tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 2340 gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 2400 agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 2460 ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 2520 tttaacgcga attttaacaa aatattaacg cttacaattt caggtggcac ttttcgggga 2580 aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc 2640 atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagccat 2700 attcaacggg aaacgtcttg ctctaggccg cgattaaatt ccaacatgga tgctgattta 2760 tatgggtata aatgggctcg cgataatgtc gggcaatcag gtgcgacaat ctatcgattg 2820 tatgggaagc ccgatgcgcc agagttgttt ctgaaacatg gcaaaggtag cgttgccaat 2880 gatgttacag atgagatggt cagactaaac tggctgacgg aatttatgcc tcttccgacc 2940 atcaagcatt ttatccgtac tcctgatgat gcatggttac tcaccactgc gatccccggg 3000 aaaacagcat tccaggtatt agaagaatat cctgattcag gtgaaaatat tgttgatgcg 3060 ctggcagtgt tcctgcgccg gttgcattcg attcctgttt gtaattgtcc ttttaacagc 3120 gatcgcgtat ttcgtctcgc tcaggcgcaa tcacgaatga ataacggttt ggttgatgcg 3180 agtgattttg atgacgagcg taatggctgg cctgttgaac aagtctggaa agaaatgcat 3240 aaacttttgc cattctcacc ggattcagtc gtcactcatg gtgatttctc acttgataac 3300 cttatttttg acgaggggaa attaataggt tgtattgatg ttggacgagt cggaatcgca 3360 gaccgatacc aggatcttgc catcctatgg aactgcctcg gtgagttttc tccttcatta 3420 cagaaacggc tttttcaaaa atatggtatt gataatcctg atatgaataa attgcagttt 3480 catttgatgc tcgatgagtt tttctaagaa ttaatgatgt ctcgtttaga taaaagtaaa 3540 gtgattaaca gcgcattaga gctgcttaat gaggtcggaa tcgaaggttt aacaacccgt 3600 aaactcgccc agaagctagg tgtagagcag cctacattgt attggcatgt aaaaaataag 3660 cgggctttgc tcgacgcctt agccattgag atgttagata ggcaccatac tcacttttgc 3720 cctttagaag gggaaagctg gcaagatttt ttacgtaata acgctaaaag ttttagatgt 3780 gctttactaa gtcatcgcga tggagcaaaa gtacatttag gtacacggcc tacagaaaaa 3840 cagtatgaaa ctctcgaaaa tcaattagcc tttttatgcc aacaaggttt ttcactagag 3900 aatgcattat atgcactcag cgcagtgggg cattttactt taggttgcgt attggaagat 3960 caagagcatc aagtcgctaa agaagaaagg gaaacaccta ctactgatag tatgccgcca 4020 ttattacgac aagctatcga attatttgat caccaaggtg cagagccagc cttcttattc 4080 ggccttgaat tgatcatatg cggattagaa aaacaactta aatgtgaaag tgggtcttaa 4140 aagcagcata acctttttcc gtgatggtaa cttcactagt ttaaaaggat ctaggtgaag 4200 atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 4260 tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 4320 tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 4380 ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc 4440 cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 4500 ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 4560 gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 4620 tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 4680 gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 4740 ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 4800 tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 4860 ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 4920 tgctggcctt ttgctcacat gacccgacac catcgaatgg ccagatgatt aattcctaat 4980 ttttgttgac actctatcat tgatagagtt attttaccac tccctatcag tgatagagaa 5040 aagtgaaatg aatagttcga caaaaatcta gataa 5075 <210> 17 <211> 7208 <212> DNA <213> Artificial Sequence <220> <223> pVTSD5 Vector <400> 17 taatacgact cactataggg gaattgtgag cggataacaa ttcccctcta gaaataattt 60 tgtttaactt taagaaggag atatatccat ggagaccgac gtccacatat acctgccgtt 120 cactattatt tagtgaaatg agatattatg atattttctg aattgtgatt aaaaaggcaa 180 ctttatgccc atgcaacaga aactataaaa aatacagaga atgaaaagaa acagatagat 240 tttttagttc tttaggcccg tagtctgcaa atccttttat gattttctat caaacaaaag 300 aggaaaatag accagttgca atccaaacga gagtctaata gaatgaggtc gaaaagtaaa 360 tcgcgcgggt ttgttactga taaagcaggc aagacctaaa atgtgtaaag ggcaaagtgt 420 atactttggc gtcacccctt acatatttta ggtctttttt tattgtgcgt aactaacttg 480 ccatcttcaa acaggagggc tggaagaagc agaccgctaa cacagtacat aaaaaaggag 540 acatgaacga tgaacatcaa aaagtttgca aaacaagcaa cagtattaac ctttactacc 600 gcactgctgg caggaggcgc aactcaagcg tttgcgaaag aaacgaacca aaagccatat 660 aaggaaacat acggcatttc ccatattaca cgccatgata tgctgcaaat ccctgaacag 720 caaaaaaatg aaaaatataa agttcctgag ttcgattcgt ccacaattaa aaatatctct 780 tctgcaaaag gcctggacgt ttgggacagc tggccattac aaaacactga cggcactgtc 840 gcaaactatc acggctacca catcgtcttt gcattagccg gagatcctaa aaatgcggat 900 gacacatcga tttacatgtt ctatcaaaaa gtcggcgaaa cttctattga cagctggaaa 960 aacgctggcc gcgtctttaa agacagcgac aaattcgatg caaatgattc tatcctaaaa 1020 gaccaaacac aagaatggtc aggttcagcc acatttacat ctgacggaaa aatccgttta 1080 ttctacactg atttctccgg taaacattac ggcaaacaaa cactgacaac tgcacaagtt 1140 aacgtatcag catcagacag ctctttgaac atcaacggtg tagaggatta taaatcaatc 1200 tttgacggtg acggaaaaac gtatcaaaat gtacagcagt tcatcgatga aggcaactac 1260 agctcaggcg acaaccatac gctgagagat cctcactacg tagaagataa aggccacaaa 1320 tacttagtat ttgaagcaaa cactggaact gaagatggct accaaggcga agaatcttta 1380 tttaacaaag catactatgg caaaagcaca tcattcttcc gtcaagaaag tcaaaaactt 1440 ctgcaaagcg ataaaaaacg cacggctgag ttagcaaacg gcgctctcgg tatgattgag 1500 ctaaacgatg attacacact gaaaaaagtg atgaaaccgc tgattgcatc taacacagta 1560 acagatgaaa ttgaacgcgc gaacgtcttt aaaatgaacg gcaaatggta cctgttcact 1620 gactcccgcg gatcaaaaat gacgattgac ggcattacgt ctaacgatat ttacatgctt 1680 ggttatgttt ctaattcttt aactggccca tacaagccgc tgaacaaaac tggccttgtg 1740 ttaaaaatgg atcttgatcc taacgatgta acctttactt actcacactt cgctgtacct 1800 caagcgaaag gaaacaatgt cgtgattaca agctatatga caaacagagg attctacgca 1860 gacaaacaat caacgtttgc gcctagcttc ctgctgaaca tcaaaggcaa gaaaacatct 1920 gttgtcaaag acagcatcct tgaacaagga caattaacag ttaacaaata aaaacgcaaa 1980 agaaaatgcc gatatcctat tggcattgac ggtctccagt actggagcca cccgcagttc 2040 gaaaaataag tcagcggccg cactcgagca ccaccaccac caccactgag atccggctgc 2100 taacaaagcc cgaaaggaag ctgagttggc tgctgccacc gctgagcaat aactagcata 2160 accccttggg gcctctaaac gggtcttgag gggttttttg ctgaaaggag gaactatatc 2220 cggattggcg aatgggacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 2280 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 2340 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 2400 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 2460 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 2520 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 2580 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 2640 atttaacaaa aatttaacgc gaattttaac aaaatattaa cgtttacaat ttcaggtggc 2700 acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 2760 atgtatccgc tcatgaatta attcttagaa aaactcatcg agcatcaaat gaaactgcaa 2820 tttattcata tcaggattat caataccata tttttgaaaa agccgtttct gtaatgaagg 2880 agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt ctgcgattcc 2940 gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa ggttatcaag 3000 tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc 3060 tttccagact tgttcaacag gccagccatt acgctcgtca tcaaaatcac tcgcatcaac 3120 caaaccgtta ttcattcgtg attgcgcctg agcgagacga aatacgcgat cgctgttaaa 3180 aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac 3240 aatattttca cctgaatcag gatattcttc taatacctgg aatgctgttt tcccggggat 3300 cgcagtggtg agtaaccatg catcatcagg agtacggata aaatgcttga tggtcggaag 3360 aggcataaat tccgtcagcc agtttagtct gaccatctca tctgtaacat cattggcaac 3420 gctacctttg ccatgtttca gaaacaactc tggcgcatcg ggcttcccat acaatcgata 3480 gattgtcgca cctgattgcc cgacattatc gcgagcccat ttatacccat ataaatcagc 3540 atccatgttg gaatttaatc gcggcctaga gcaagacgtt tcccgttgaa tatggctcat 3600 aacacccctt gtattactgt ttatgtaagc agacagtttt attgttcatg accaaaatcc 3660 cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 3720 cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 3780 cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 3840 tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 3900 tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 3960 ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 4020 aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 4080 cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 4140 ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 4200 agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 4260 ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 4320 acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 4380 cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 4440 gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga 4500 tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatat ggtgcactct 4560 cagtacaatc tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt 4620 gactgggtca tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 4680 tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 4740 cagaggtttt caccgtcatc accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg 4800 tggtcgtgaa gcgattcaca gatgtctgcc tgttcatccg cgtccagctc gttgagtttc 4860 tccagaagcg ttaatgtctg gcttctgata aagcgggcca tgttaagggc ggttttttcc 4920 tgtttggtca ctgatgcctc cgtgtaaggg ggatttctgt tcatgggggt aatgataccg 4980 atgaaacgag agaggatgct cacgatacgg gttactgatg atgaacatgc ccggttactg 5040 gaacgttgtg agggtaaaca actggcggta tggatgcggc gggaccagag aaaaatcact 5100 cagggtcaat gccagcgctt cgttaataca gatgtaggtg ttccacaggg tagccagcag 5160 catcctgcga tgcagatccg gaacataatg gtgcagggcg ctgacttccg cgtttccaga 5220 ctttacgaaa cacggaaacc gaagaccatt catgttgttg ctcaggtcgc agacgttttg 5280 cagcagcagt cgcttcacgt tcgctcgcgt atcggtgatt cattctgcta accagtaagg 5340 caaccccgcc agcctagccg ggtcctcaac gacaggagca cgatcatgcg cacccgtggg 5400 gccgccatgc cggcgataat ggcctgcttc tcgccgaaac gtttggtggc gggaccagtg 5460 acgaaggctt gagcgagggc gtgcaagatt ccgaataccg caagcgacag gccgatcatc 5520 gtcgcgctcc agcgaaagcg gtcctcgccg aaaatgaccc agagcgctgc cggcacctgt 5580 cctacgagtt gcatgataaa gaagacagtc ataagtgcgg cgacgatagt catgccccgc 5640 gcccaccgga aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt 5700 gcctaatgag tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg 5760 ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg 5820 cgtattgggc gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc 5880 cttcaccgcc tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag 5940 gcgaaaatcc tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc 6000 gtcgtatccc actaccgaga tatccgcacc aacgcgcagc ccggactcgg taatggcgcg 6060 cattgcgccc agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc 6120 attcagcatt tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc 6180 cgctatcggc tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg 6240 cgccgagaca gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac 6300 cagatgctcc acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg 6360 tgtctggtca gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc 6420 aatggcatcc tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag 6480 aagattgtgc accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac 6540 cacgctggca cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc 6600 gtgcagggcc agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg 6660 ttgtgccacg cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg 6720 cgttttcgca gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac 6780 accggcatac tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg 6840 actctcttcc gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc 6900 cgggatctcg acgctctccc ttatgcgact cctgcattag gaagcagccc agtagtaggt 6960 tgaggccgtt gagcaccgcc gccgcaagga atggtgcatg caaggagatg gcgcccaaca 7020 gtcccccggc cacggggcct gccaccatac ccacgccgaa acaagcgctc atgagcccga 7080 agtggcgagc ccgatcttcc ccatcggtga tgtcggcgat ataggcgcca gcaaccgcac 7140 ctgtggcgcc ggtgatgccg gccacgatgc gtccggcgta gaggatcgag atctcgatcc 7200 cgcgaaat 7208 <210> 18 <211> 7057 <212> DNA <213> Artificial Sequence <220> <223> pVTSD6 Vector <400> 18 gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc 60 aaatggacga agcagggatt ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct 120 gattcgttac caattatgac aacttgacgg ctacatcatt cactttttct tcacaaccgg 180 cacggaactc gctcgggctg gccccggtgc attttttaaa tacccgcgag aaatagagtt 240 gatcgtcaaa accaacattg cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa 300 gcagcttcgc ctggctgata cgttggtcct cgcgccagct taagacgcta atccctaact 360 gctggcggaa aagatgtgac agacgcgacg gcgacaagca aacatgctgt gcgacgctgg 420 cgatatcaaa attgctgtct gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc 480 gattatccat cggtggatgg agcgactcgt taatcgcttc catgcgccgc agtaacaatt 540 gctcaagcag atttatcgcc agcagctccg aatagcgccc ttccccttgc ccggcgttaa 600 tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc 660 ccgtattggc aaatattgac ggccagttaa gccattcatg ccagtaggcg cgcggacgaa 720 agtaaaccca ctggtgatac cattcgcgag cctccggatg acgaccgtag tgatgaatct 780 ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac aaattctcgt ccctgatttt 840 tcaccacccc ctgaccgcga atggtgagat tgagaatata acctttcatt cccagcggtc 900 ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg cgttaaaccc gccaccagat 960 gggcattaaa cgagtatccc ggcagcaggg gatcattttg cgcttcagcc atacttttca 1020 tactcccgcc attcagagaa gaaaccaatt gtccatattg catcagacat tgccgtcact 1080 gcgtctttta ctggctcttc tcgctaacca aaccggtaac cccgcttatt aaaagcattc 1140 tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg 1200 gcagaaaagt ccacattgat tatttgcacg gcgtcacact ttgctatgcc atagcatttt 1260 tatccataag attagcggat cctacctgac gctttttatc gcaactctct actgtttctc 1320 catacccgtt tttttgggct agaaataatt ttgtttaact ttaagaagga gatatacata 1380 cccggatctg ataaaattat tcatctgact gatgattctt ttgatactga tgtacttaag 1440 gcagatggtg caatcctggt tgatttctgg gcacactggt gcggtccgtg caaaatgatc 1500 gctccgattc tggatgaaat cgctgacgaa tatcagggca aactgaccgt tgcaaaactg 1560 aacatcgatc acaacccggg cactgcgccg aaatatggca tccgtggtat cccgactctg 1620 ctgctgttca aaaacggtga agtggcggca accaaagtgg gtgcactgtc taaaggtcag 1680 ttgaaagagt tcctcgacgc taacctggcc ggctctggat ccggtgatga cgatgacaag 1740 gccatggaga ccgacgtcca catatacctg ccgttcacta ttatttagtg aaatgagata 1800 ttatgatatt ttctgaattg tgattaaaaa ggcaacttta tgcccatgca acagaaacta 1860 taaaaaatac agagaatgaa aagaaacaga tagatttttt agttctttag gcccgtagtc 1920 tgcaaatcct tttatgattt tctatcaaac aaaagaggaa aatagaccag ttgcaatcca 1980 aacgagagtc taatagaatg aggtcgaaaa gtaaatcgcg cgggtttgtt actgataaag 2040 caggcaagac ctaaaatgtg taaagggcaa agtgtatact ttggcgtcac cccttacata 2100 ttttaggtct ttttttattg tgcgtaacta acttgccatc ttcaaacagg agggctggaa 2160 gaagcagacc gctaacacag tacataaaaa aggagacatg aacgatgaac atcaaaaagt 2220 ttgcaaaaca agcaacagta ttaaccttta ctaccgcact gctggcagga ggcgcaactc 2280 aagcgtttgc gaaagaaacg aaccaaaagc catataagga aacatacggc atttcccata 2340 ttacacgcca tgatatgctg caaatccctg aacagcaaaa aaatgaaaaa tataaagttc 2400 ctgagttcga ttcgtccaca attaaaaata tctcttctgc aaaaggcctg gacgtttggg 2460 acagctggcc attacaaaac actgacggca ctgtcgcaaa ctatcacggc taccacatcg 2520 tctttgcatt agccggagat cctaaaaatg cggatgacac atcgatttac atgttctatc 2580 aaaaagtcgg cgaaacttct attgacagct ggaaaaacgc tggccgcgtc tttaaagaca 2640 gcgacaaatt cgatgcaaat gattctatcc taaaagacca aacacaagaa tggtcaggtt 2700 cagccacatt tacatctgac ggaaaaatcc gtttattcta cactgatttc tccggtaaac 2760 attacggcaa acaaacactg acaactgcac aagttaacgt atcagcatca gacagctctt 2820 tgaacatcaa cggtgtagag gattataaat caatctttga cggtgacgga aaaacgtatc 2880 aaaatgtaca gcagttcatc gatgaaggca actacagctc aggcgacaac catacgctga 2940 gagatcctca ctacgtagaa gataaaggcc acaaatactt agtatttgaa gcaaacactg 3000 gaactgaaga tggctaccaa ggcgaagaat ctttatttaa caaagcatac tatggcaaaa 3060 gcacatcatt cttccgtcaa gaaagtcaaa aacttctgca aagcgataaa aaacgcacgg 3120 ctgagttagc aaacggcgct ctcggtatga ttgagctaaa cgatgattac acactgaaaa 3180 aagtgatgaa accgctgatt gcatctaaca cagtaacaga tgaaattgaa cgcgcgaacg 3240 tctttaaaat gaacggcaaa tggtacctgt tcactgactc ccgcggatca aaaatgacga 3300 ttgacggcat tacgtctaac gatatttaca tgcttggtta tgtttctaat tctttaactg 3360 gcccatacaa gccgctgaac aaaactggcc ttgtgttaaa aatggatctt gatcctaacg 3420 atgtaacctt tacttactca cacttcgctg tacctcaagc gaaaggaaac aatgtcgtga 3480 ttacaagcta tatgacaaac agaggattct acgcagacaa acaatcaacg tttgcgccta 3540 gcttcctgct gaacatcaaa ggcaagaaaa catctgttgt caaagacagc atccttgaac 3600 aaggacaatt aacagttaac aaataaaaac gcaaaagaaa atgccgatat cctattggca 3660 ttgacggtct ccagtactgg agccacccgc agttcgaaaa ataagtcagc ggccgcactc 3720 gagcaccacc accaccacca ctgagatccg gctgctaaca aagcccgaaa ggaagctgag 3780 ttggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc taaacgggtc 3840 ttgaggggtt ttttgctgaa aggaggaact atatccggat tggcgaatgg gacgcgccct 3900 gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 3960 ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 4020 gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 4080 ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 4140 gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 4200 tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 4260 tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 4320 ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa 4380 cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg aattaattct 4440 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 4500 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 4560 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 4620 attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 4680 gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 4740 ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 4800 gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgaa 4860 tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 4920 tcttctaata cctggaatgc tgttttcccg gggatcgcag tggtgagtaa ccatgcatca 4980 tcaggagtac ggataaaatg cttgatggtc ggaagaggca taaattccgt cagccagttt 5040 agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 5100 aactctggcg catcgggctt cccatacaat cgatagattg tcgcacctga ttgcccgaca 5160 ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 5220 ctagagcaag acgtttcccg ttgaatatgg ctcataacac cccttgtatt actgtttatg 5280 taagcagaca gttttattgt tcatgaccaa aatcccttaa cgtgagtttt cgttccactg 5340 agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 5400 aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 5460 agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 5520 tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 5580 atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 5640 taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 5700 gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 5760 gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 5820 aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta 5880 tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 5940 gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc 6000 cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa 6060 ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag 6120 cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg tattttctcc ttacgcatct 6180 gtgcggtatt tcacaccgca tatatggtgc actctcagta caatctgctc tgatgccgca 6240 tagttaagcc agtatacact ccgctatcgc tacgtgactg ggtcatggct gcgccccgac 6300 acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca 6360 gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga 6420 aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc gtgaagcgat tcacagatgt 6480 ctgcctgttc atccgcgtcc agctcgttga gtttctccag aagcgttaat gtctggcttc 6540 tgataaagcg ggccatgtta agggcggttt tttcctgttt ggtcactgat gcctccgtgt 6600 aagggggatt tctgttcatg ggggtaatga taccgatgaa acgagagagg atgctcacga 6660 tacgggttac tgatgatgaa catgcccggt tactggaacg ttgtgagggt aaacaactgg 6720 cggtatggat gcggcgggac cagagaaaaa tcactcaggg tcaatgccag cgcttcgtta 6780 atacagatgt aggtgttcca cagggtagcc agcagcatcc tgcgatgcag atccggaaca 6840 taatggtgca gggcgctgac ttccgcgttt ccagacttta cgaaacacgg aaaccgaaga 6900 ccattcatgt tgttgctcag gtcgcagacg ttttgcagca gcagtcgctt cacgttcgct 6960 cgcgtatcgg tgattcattc tgctaaccag taaggcaacc ccgccagcct agccgggtcc 7020 tcaacgacag gagcacgatc atgcgcaccc gtgaaac 7057 <210> 19 <211> 6701 <212> DNA <213> Artificial Sequence <220> <223> pVTSD7 Vector <400> 19 gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc 60 aaatggacga agcagggatt ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct 120 gattcgttac caattatgac aacttgacgg ctacatcatt cactttttct tcacaaccgg 180 cacggaactc gctcgggctg gccccggtgc attttttaaa tacccgcgag aaatagagtt 240 gatcgtcaaa accaacattg cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa 300 gcagcttcgc ctggctgata cgttggtcct cgcgccagct taagacgcta atccctaact 360 gctggcggaa aagatgtgac agacgcgacg gcgacaagca aacatgctgt gcgacgctgg 420 cgatatcaaa attgctgtct gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc 480 gattatccat cggtggatgg agcgactcgt taatcgcttc catgcgccgc agtaacaatt 540 gctcaagcag atttatcgcc agcagctccg aatagcgccc ttccccttgc ccggcgttaa 600 tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc 660 ccgtattggc aaatattgac ggccagttaa gccattcatg ccagtaggcg cgcggacgaa 720 agtaaaccca ctggtgatac cattcgcgag cctccggatg acgaccgtag tgatgaatct 780 ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac aaattctcgt ccctgatttt 840 tcaccacccc ctgaccgcga atggtgagat tgagaatata acctttcatt cccagcggtc 900 ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg cgttaaaccc gccaccagat 960 gggcattaaa cgagtatccc ggcagcaggg gatcattttg cgcttcagcc atacttttca 1020 tactcccgcc attcagagaa gaaaccaatt gtccatattg catcagacat tgccgtcact 1080 gcgtctttta ctggctcttc tcgctaacca aaccggtaac cccgcttatt aaaagcattc 1140 tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg 1200 gcagaaaagt ccacattgat tatttgcacg gcgtcacact ttgctatgcc atagcatttt 1260 tatccataag attagcggat cctacctgac gctttttatc gcaactctct actgtttctc 1320 catacccgtt tttttgggct agaaataatt ttgtttaact ttaagaagga gatatacata 1380 cccatccatg gagaccgacg tccacatata cctgccgttc actattattt agtgaaatga 1440 gatattatga tattttctga attgtgatta aaaaggcaac tttatgccca tgcaacagaa 1500 actataaaaa atacagagaa tgaaaagaaa cagatagatt ttttagttct ttaggcccgt 1560 agtctgcaaa tccttttatg attttctatc aaacaaaaga ggaaaataga ccagttgcaa 1620 tccaaacgag agtctaatag aatgaggtcg aaaagtaaat cgcgcgggtt tgttactgat 1680 aaagcaggca agacctaaaa tgtgtaaagg gcaaagtgta tactttggcg tcacccctta 1740 catattttag gtcttttttt attgtgcgta actaacttgc catcttcaaa caggagggct 1800 ggaagaagca gaccgctaac acagtacata aaaaaggaga catgaacgat gaacatcaaa 1860 aagtttgcaa aacaagcaac agtattaacc tttactaccg cactgctggc aggaggcgca 1920 actcaagcgt ttgcgaaaga aacgaaccaa aagccatata aggaaacata cggcatttcc 1980 catattacac gccatgatat gctgcaaatc cctgaacagc aaaaaaatga aaaatataaa 2040 gttcctgagt tcgattcgtc cacaattaaa aatatctctt ctgcaaaagg cctggacgtt 2100 tgggacagct ggccattaca aaacactgac ggcactgtcg caaactatca cggctaccac 2160 atcgtctttg cattagccgg agatcctaaa aatgcggatg acacatcgat ttacatgttc 2220 tatcaaaaag tcggcgaaac ttctattgac agctggaaaa acgctggccg cgtctttaaa 2280 gacagcgaca aattcgatgc aaatgattct atcctaaaag accaaacaca agaatggtca 2340 ggttcagcca catttacatc tgacggaaaa atccgtttat tctacactga tttctccggt 2400 aaacattacg gcaaacaaac actgacaact gcacaagtta acgtatcagc atcagacagc 2460 tctttgaaca tcaacggtgt agaggattat aaatcaatct ttgacggtga cggaaaaacg 2520 tatcaaaatg tacagcagtt catcgatgaa ggcaactaca gctcaggcga caaccatacg 2580 ctgagagatc ctcactacgt agaagataaa ggccacaaat acttagtatt tgaagcaaac 2640 actggaactg aagatggcta ccaaggcgaa gaatctttat ttaacaaagc atactatggc 2700 aaaagcacat cattcttccg tcaagaaagt caaaaacttc tgcaaagcga taaaaaacgc 2760 acggctgagt tagcaaacgg cgctctcggt atgattgagc taaacgatga ttacacactg 2820 aaaaaagtga tgaaaccgct gattgcatct aacacagtaa cagatgaaat tgaacgcgcg 2880 aacgtcttta aaatgaacgg caaatggtac ctgttcactg actcccgcgg atcaaaaatg 2940 acgattgacg gcattacgtc taacgatatt tacatgcttg gttatgtttc taattcttta 3000 actggcccat acaagccgct gaacaaaact ggccttgtgt taaaaatgga tcttgatcct 3060 aacgatgtaa cctttactta ctcacacttc gctgtacctc aagcgaaagg aaacaatgtc 3120 gtgattacaa gctatatgac aaacagagga ttctacgcag acaaacaatc aacgtttgcg 3180 cctagcttcc tgctgaacat caaaggcaag aaaacatctg ttgtcaaaga cagcatcctt 3240 gaacaaggac aattaacagt taacaaataa aaacgcaaaa gaaaatgccg atatcctatt 3300 ggcattgacg gtctccagta ctggagccac ccgcagttcg aaaaataagt cagcggccgc 3360 actcgagcac caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc 3420 tgagttggct gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg 3480 ggtcttgagg ggttttttgc tgaaaggagg aactatatcc ggattggcga atgggacgcg 3540 ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 3600 cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 3660 gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 3720 ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 3780 ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 3840 ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 3900 attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 3960 aattttaaca aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc 4020 ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgaattaa 4080 ttcttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 4140 aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 4200 ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 4260 acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 4320 gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 4380 ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 4440 ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 4500 cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 4560 atattcttct aatacctgga atgctgtttt cccggggatc gcagtggtga gtaaccatgc 4620 atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 4680 gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 4740 aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 4800 gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 4860 cggcctagag caagacgttt cccgttgaat atggctcata acaccccttg tattactgtt 4920 tatgtaagca gacagtttta ttgttcatga ccaaaatccc ttaacgtgag ttttcgttcc 4980 actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 5040 gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 5100 atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 5160 atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 5220 ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 5280 gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 5340 cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 5400 tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 5460 cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 5520 ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 5580 gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 5640 tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 5700 ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 5760 gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 5820 atctgtgcgg tatttcacac cgcatatatg gtgcactctc agtacaatct gctctgatgc 5880 cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat ggctgcgccc 5940 cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct 6000 tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca 6060 ccgaaacgcg cgaggcagct gcggtaaagc tcatcagcgt ggtcgtgaag cgattcacag 6120 atgtctgcct gttcatccgc gtccagctcg ttgagtttct ccagaagcgt taatgtctgg 6180 cttctgataa agcgggccat gttaagggcg gttttttcct gtttggtcac tgatgcctcc 6240 gtgtaagggg gatttctgtt catgggggta atgataccga tgaaacgaga gaggatgctc 6300 acgatacggg ttactgatga tgaacatgcc cggttactgg aacgttgtga gggtaaacaa 6360 ctggcggtat ggatgcggcg ggaccagaga aaaatcactc agggtcaatg ccagcgcttc 6420 gttaatacag atgtaggtgt tccacagggt agccagcagc atcctgcgat gcagatccgg 6480 aacataatgg tgcagggcgc tgacttccgc gtttccagac tttacgaaac acggaaaccg 6540 aagaccattc atgttgttgc tcaggtcgca gacgttttgc agcagcagtc gcttcacgtt 6600 cgctcgcgta tcggtgattc attctgctaa ccagtaaggc aaccccgcca gcctagccgg 6660 gtcctcaacg acaggagcac gatcatgcgc acccgtgaaa c 6701 <210> 20 <211> 7051 <212> DNA <213> Artificial Sequence <220> <223> pVTSD8 Vector <400> 20 gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc 60 aaatggacga agcagggatt ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct 120 gattcgttac caattatgac aacttgacgg ctacatcatt cactttttct tcacaaccgg 180 cacggaactc gctcgggctg gccccggtgc attttttaaa tacccgcgag aaatagagtt 240 gatcgtcaaa accaacattg cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa 300 gcagcttcgc ctggctgata cgttggtcct cgcgccagct taagacgcta atccctaact 360 gctggcggaa aagatgtgac agacgcgacg gcgacaagca aacatgctgt gcgacgctgg 420 cgatatcaaa attgctgtct gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc 480 gattatccat cggtggatgg agcgactcgt taatcgcttc catgcgccgc agtaacaatt 540 gctcaagcag atttatcgcc agcagctccg aatagcgccc ttccccttgc ccggcgttaa 600 tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc 660 ccgtattggc aaatattgac ggccagttaa gccattcatg ccagtaggcg cgcggacgaa 720 agtaaaccca ctggtgatac cattcgcgag cctccggatg acgaccgtag tgatgaatct 780 ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac aaattctcgt ccctgatttt 840 tcaccacccc ctgaccgcga atggtgagat tgagaatata acctttcatt cccagcggtc 900 ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg cgttaaaccc gccaccagat 960 gggcattaaa cgagtatccc ggcagcaggg gatcattttg cgcttcagcc atacttttca 1020 tactcccgcc attcagagaa gaaaccaatt gtccatattg catcagacat tgccgtcact 1080 gcgtctttta ctggctcttc tcgctaacca aaccggtaac cccgcttatt aaaagcattc 1140 tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg 1200 gcagaaaagt ccacattgat tatttgcacg gcgtcacact ttgctatgcc atagcatttt 1260 tatccataag attagcggat cctacctgac gctttttatc gcaactctct actgtttctc 1320 catacccgtt tttttgggct agaaataatt ttgtttaact ttaagaagga gatatacata 1380 cccggatctg ataaaattat tcatctgact gatgattctt ttgatactga tgtacttaag 1440 gcagatggtg caatcctggt tgatttctgg gcacactggt gcggtccgtg caaaatgatc 1500 gctccgattc tggatgaaat cgctgacgaa tatcagggca aactgaccgt tgcaaaactg 1560 aacatcgatc acaacccggg cactgcgccg aaatatggca tccgtggtat cccgactctg 1620 ctgctgttca aaaacggtga agtggcggca accaaagtgg gtgcactgtc taaaggtcag 1680 ttgaaagagt tcctcgacgc taacctggcc ggctctggat ccggtgatga cgatgacaag 1740 gccatggaga ccgacgtcca catatacctg ccgttcacta ttatttagtg aaatgagata 1800 ttatgatatt ttctgaattg tgattaaaaa ggcaacttta tgcccatgca acagaaacta 1860 taaaaaatac agagaatgaa aagaaacaga tagatttttt agttctttag gcccgtagtc 1920 tgcaaatcct tttatgattt tctatcaaac aaaagaggaa aatagaccag ttgcaatcca 1980 aacgagagtc taatagaatg aggtcgaaaa gtaaatcgcg cgggtttgtt actgataaag 2040 caggcaagac ctaaaatgtg taaagggcaa agtgtatact ttggcgtcac cccttacata 2100 ttttaggtct ttttttattg tgcgtaacta acttgccatc ttcaaacagg agggctggaa 2160 gaagcagacc gctaacacag tacataaaaa aggagacatg aacgatgaac atcaaaaagt 2220 ttgcaaaaca agcaacagta ttaaccttta ctaccgcact gctggcagga ggcgcaactc 2280 aagcgtttgc gaaagaaacg aaccaaaagc catataagga aacatacggc atttcccata 2340 ttacacgcca tgatatgctg caaatccctg aacagcaaaa aaatgaaaaa tataaagttc 2400 ctgagttcga ttcgtccaca attaaaaata tctcttctgc aaaaggcctg gacgtttggg 2460 acagctggcc attacaaaac actgacggca ctgtcgcaaa ctatcacggc taccacatcg 2520 tctttgcatt agccggagat cctaaaaatg cggatgacac atcgatttac atgttctatc 2580 aaaaagtcgg cgaaacttct attgacagct ggaaaaacgc tggccgcgtc tttaaagaca 2640 gcgacaaatt cgatgcaaat gattctatcc taaaagacca aacacaagaa tggtcaggtt 2700 cagccacatt tacatctgac ggaaaaatcc gtttattcta cactgatttc tccggtaaac 2760 attacggcaa acaaacactg acaactgcac aagttaacgt atcagcatca gacagctctt 2820 tgaacatcaa cggtgtagag gattataaat caatctttga cggtgacgga aaaacgtatc 2880 aaaatgtaca gcagttcatc gatgaaggca actacagctc aggcgacaac catacgctga 2940 gagatcctca ctacgtagaa gataaaggcc acaaatactt agtatttgaa gcaaacactg 3000 gaactgaaga tggctaccaa ggcgaagaat ctttatttaa caaagcatac tatggcaaaa 3060 gcacatcatt cttccgtcaa gaaagtcaaa aacttctgca aagcgataaa aaacgcacgg 3120 ctgagttagc aaacggcgct ctcggtatga ttgagctaaa cgatgattac acactgaaaa 3180 aagtgatgaa accgctgatt gcatctaaca cagtaacaga tgaaattgaa cgcgcgaacg 3240 tctttaaaat gaacggcaaa tggtacctgt tcactgactc ccgcggatca aaaatgacga 3300 ttgacggcat tacgtctaac gatatttaca tgcttggtta tgtttctaat tctttaactg 3360 gcccatacaa gccgctgaac aaaactggcc ttgtgttaaa aatggatctt gatcctaacg 3420 atgtaacctt tacttactca cacttcgctg tacctcaagc gaaaggaaac aatgtcgtga 3480 ttacaagcta tatgacaaac agaggattct acgcagacaa acaatcaacg tttgcgccta 3540 gcttcctgct gaacatcaaa ggcaagaaaa catctgttgt caaagacagc atccttgaac 3600 aaggacaatt aacagttaac aaataaaaac gcaaaagaaa atgccgatat cctattggca 3660 ttgacggtct ccagtaccac catcatcatc atcattaagt cagcggccgc actcgagcac 3720 caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc tgagttggct 3780 gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg ggtcttgagg 3840 ggttttttgc tgaaaggagg aactatatcc ggattggcga atgggacgcg ccctgtagcg 3900 gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 3960 ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4020 cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4080 tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4140 cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4200 ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4260 tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 4320 aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 4380 tttgtttatt tttctaaata cattcaaata tgtatccgct catgaattaa ttcttagaaa 4440 aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat 4500 ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg 4560 gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat 4620 ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc 4680 ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg ccagccatta 4740 cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga 4800 gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac 4860 cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct 4920 aatacctgga atgctgtttt cccggggatc gcagtggtga gtaaccatgc atcatcagga 4980 gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg 5040 accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct 5100 ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg 5160 cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg cggcctagag 5220 caagacgttt cccgttgaat atggctcata acaccccttg tattactgtt tatgtaagca 5280 gacagtttta ttgttcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 5340 agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 5400 ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 5460 accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct 5520 tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 5580 cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 5640 gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc 5700 gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 5760 gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 5820 cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 5880 tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 5940 ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 6000 ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat 6060 taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc 6120 agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc atctgtgcgg 6180 tatttcacac cgcatatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta 6240 agccagtata cactccgcta tcgctacgtg actgggtcat ggctgcgccc cgacacccgc 6300 caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 6360 ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 6420 cgaggcagct gcggtaaagc tcatcagcgt ggtcgtgaag cgattcacag atgtctgcct 6480 gttcatccgc gtccagctcg ttgagtttct ccagaagcgt taatgtctgg cttctgataa 6540 agcgggccat gttaagggcg gttttttcct gtttggtcac tgatgcctcc gtgtaagggg 6600 gatttctgtt catgggggta atgataccga tgaaacgaga gaggatgctc acgatacggg 6660 ttactgatga tgaacatgcc cggttactgg aacgttgtga gggtaaacaa ctggcggtat 6720 ggatgcggcg ggaccagaga aaaatcactc agggtcaatg ccagcgcttc gttaatacag 6780 atgtaggtgt tccacagggt agccagcagc atcctgcgat gcagatccgg aacataatgg 6840 tgcagggcgc tgacttccgc gtttccagac tttacgaaac acggaaaccg aagaccattc 6900 atgttgttgc tcaggtcgca gacgttttgc agcagcagtc gcttcacgtt cgctcgcgta 6960 tcggtgattc attctgctaa ccagtaaggc aaccccgcca gcctagccgg gtcctcaacg 7020 acaggagcac gatcatgcgc acccgtgaaa c 7051 <210> 21 <211> 6695 <212> DNA <213> Artificial Sequence <220> <223> pVTSD9 Vector <400> 21 gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc 60 aaatggacga agcagggatt ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct 120 gattcgttac caattatgac aacttgacgg ctacatcatt cactttttct tcacaaccgg 180 cacggaactc gctcgggctg gccccggtgc attttttaaa tacccgcgag aaatagagtt 240 gatcgtcaaa accaacattg cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa 300 gcagcttcgc ctggctgata cgttggtcct cgcgccagct taagacgcta atccctaact 360 gctggcggaa aagatgtgac agacgcgacg gcgacaagca aacatgctgt gcgacgctgg 420 cgatatcaaa attgctgtct gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc 480 gattatccat cggtggatgg agcgactcgt taatcgcttc catgcgccgc agtaacaatt 540 gctcaagcag atttatcgcc agcagctccg aatagcgccc ttccccttgc ccggcgttaa 600 tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc 660 ccgtattggc aaatattgac ggccagttaa gccattcatg ccagtaggcg cgcggacgaa 720 agtaaaccca ctggtgatac cattcgcgag cctccggatg acgaccgtag tgatgaatct 780 ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac aaattctcgt ccctgatttt 840 tcaccacccc ctgaccgcga atggtgagat tgagaatata acctttcatt cccagcggtc 900 ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg cgttaaaccc gccaccagat 960 gggcattaaa cgagtatccc ggcagcaggg gatcattttg cgcttcagcc atacttttca 1020 tactcccgcc attcagagaa gaaaccaatt gtccatattg catcagacat tgccgtcact 1080 gcgtctttta ctggctcttc tcgctaacca aaccggtaac cccgcttatt aaaagcattc 1140 tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg 1200 gcagaaaagt ccacattgat tatttgcacg gcgtcacact ttgctatgcc atagcatttt 1260 tatccataag attagcggat cctacctgac gctttttatc gcaactctct actgtttctc 1320 catacccgtt tttttgggct agaaataatt ttgtttaact ttaagaagga gatatacata 1380 cccatccatg gagaccgacg tccacatata cctgccgttc actattattt agtgaaatga 1440 gatattatga tattttctga attgtgatta aaaaggcaac tttatgccca tgcaacagaa 1500 actataaaaa atacagagaa tgaaaagaaa cagatagatt ttttagttct ttaggcccgt 1560 agtctgcaaa tccttttatg attttctatc aaacaaaaga ggaaaataga ccagttgcaa 1620 tccaaacgag agtctaatag aatgaggtcg aaaagtaaat cgcgcgggtt tgttactgat 1680 aaagcaggca agacctaaaa tgtgtaaagg gcaaagtgta tactttggcg tcacccctta 1740 catattttag gtcttttttt attgtgcgta actaacttgc catcttcaaa caggagggct 1800 ggaagaagca gaccgctaac acagtacata aaaaaggaga catgaacgat gaacatcaaa 1860 aagtttgcaa aacaagcaac agtattaacc tttactaccg cactgctggc aggaggcgca 1920 actcaagcgt ttgcgaaaga aacgaaccaa aagccatata aggaaacata cggcatttcc 1980 catattacac gccatgatat gctgcaaatc cctgaacagc aaaaaaatga aaaatataaa 2040 gttcctgagt tcgattcgtc cacaattaaa aatatctctt ctgcaaaagg cctggacgtt 2100 tgggacagct ggccattaca aaacactgac ggcactgtcg caaactatca cggctaccac 2160 atcgtctttg cattagccgg agatcctaaa aatgcggatg acacatcgat ttacatgttc 2220 tatcaaaaag tcggcgaaac ttctattgac agctggaaaa acgctggccg cgtctttaaa 2280 gacagcgaca aattcgatgc aaatgattct atcctaaaag accaaacaca agaatggtca 2340 ggttcagcca catttacatc tgacggaaaa atccgtttat tctacactga tttctccggt 2400 aaacattacg gcaaacaaac actgacaact gcacaagtta acgtatcagc atcagacagc 2460 tctttgaaca tcaacggtgt agaggattat aaatcaatct ttgacggtga cggaaaaacg 2520 tatcaaaatg tacagcagtt catcgatgaa ggcaactaca gctcaggcga caaccatacg 2580 ctgagagatc ctcactacgt agaagataaa ggccacaaat acttagtatt tgaagcaaac 2640 actggaactg aagatggcta ccaaggcgaa gaatctttat ttaacaaagc atactatggc 2700 aaaagcacat cattcttccg tcaagaaagt caaaaacttc tgcaaagcga taaaaaacgc 2760 acggctgagt tagcaaacgg cgctctcggt atgattgagc taaacgatga ttacacactg 2820 aaaaaagtga tgaaaccgct gattgcatct aacacagtaa cagatgaaat tgaacgcgcg 2880 aacgtcttta aaatgaacgg caaatggtac ctgttcactg actcccgcgg atcaaaaatg 2940 acgattgacg gcattacgtc taacgatatt tacatgcttg gttatgtttc taattcttta 3000 actggcccat acaagccgct gaacaaaact ggccttgtgt taaaaatgga tcttgatcct 3060 aacgatgtaa cctttactta ctcacacttc gctgtacctc aagcgaaagg aaacaatgtc 3120 gtgattacaa gctatatgac aaacagagga ttctacgcag acaaacaatc aacgtttgcg 3180 cctagcttcc tgctgaacat caaaggcaag aaaacatctg ttgtcaaaga cagcatcctt 3240 gaacaaggac aattaacagt taacaaataa aaacgcaaaa gaaaatgccg atatcctatt 3300 ggcattgacg gtctccagta ccaccatcat catcatcatt aagtcagcgg ccgcactcga 3360 gcaccaccac caccaccact gagatccggc tgctaacaaa gcccgaaagg aagctgagtt 3420 ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt 3480 gaggggtttt ttgctgaaag gaggaactat atccggattg gcgaatggga cgcgccctgt 3540 agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 3600 agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 3660 tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 3720 cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 3780 tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 3840 caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 3900 ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt 3960 aacaaaatat taacgtttac aatttcaggt ggcacttttc ggggaaatgt gcgcggaacc 4020 cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgaa ttaattctta 4080 gaaaaactca tcgagcatca aatgaaactg caatttattc atatcaggat tatcaatacc 4140 atatttttga aaaagccgtt tctgtaatga aggagaaaac tcaccgaggc agttccatag 4200 gatggcaaga tcctggtatc ggtctgcgat tccgactcgt ccaacatcaa tacaacctat 4260 taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa tcaccatgag tgacgactga 4320 atccggtgag aatggcaaaa gtttatgcat ttctttccag acttgttcaa caggccagcc 4380 attacgctcg tcatcaaaat cactcgcatc aaccaaaccg ttattcattc gtgattgcgc 4440 ctgagcgaga cgaaatacgc gatcgctgtt aaaaggacaa ttacaaacag gaatcgaatg 4500 caaccggcgc aggaacactg ccagcgcatc aacaatattt tcacctgaat caggatattc 4560 ttctaatacc tggaatgctg ttttcccggg gatcgcagtg gtgagtaacc atgcatcatc 4620 aggagtacgg ataaaatgct tgatggtcgg aagaggcata aattccgtca gccagtttag 4680 tctgaccatc tcatctgtaa catcattggc aacgctacct ttgccatgtt tcagaaacaa 4740 ctctggcgca tcgggcttcc catacaatcg atagattgtc gcacctgatt gcccgacatt 4800 atcgcgagcc catttatacc catataaatc agcatccatg ttggaattta atcgcggcct 4860 agagcaagac gtttcccgtt gaatatggct cataacaccc cttgtattac tgtttatgta 4920 agcagacagt tttattgttc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 4980 cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 5040 tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 5100 agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 5160 tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 5220 acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 5280 ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 5340 gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 5400 gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 5460 gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 5520 tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 5580 caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct 5640 tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc 5700 gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg 5760 agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt 5820 gcggtatttc acaccgcata tatggtgcac tctcagtaca atctgctctg atgccgcata 5880 gttaagccag tatacactcc gctatcgcta cgtgactggg tcatggctgc gccccgacac 5940 ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc cgcttacaga 6000 caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa 6060 cgcgcgaggc agctgcggta aagctcatca gcgtggtcgt gaagcgattc acagatgtct 6120 gcctgttcat ccgcgtccag ctcgttgagt ttctccagaa gcgttaatgt ctggcttctg 6180 ataaagcggg ccatgttaag ggcggttttt tcctgtttgg tcactgatgc ctccgtgtaa 6240 gggggatttc tgttcatggg ggtaatgata ccgatgaaac gagagaggat gctcacgata 6300 cgggttactg atgatgaaca tgcccggtta ctggaacgtt gtgagggtaa acaactggcg 6360 gtatggatgc ggcgggacca gagaaaaatc actcagggtc aatgccagcg cttcgttaat 6420 acagatgtag gtgttccaca gggtagccag cagcatcctg cgatgcagat ccggaacata 6480 atggtgcagg gcgctgactt ccgcgtttcc agactttacg aaacacggaa accgaagacc 6540 attcatgttg ttgctcaggt cgcagacgtt ttgcagcagc agtcgcttca cgttcgctcg 6600 cgtatcggtg attcattctg ctaaccagta aggcaacccc gccagcctag ccgggtcctc 6660 aacgacagga gcacgatcat gcgcacccgt gaaac 6695

Claims (22)

  1. 선택적 마커(6), 및 코딩 폴리뉴클레오타이드 서열(10)과 이의 바로 앞뒤에 선행 및 후행 II형 인지 서열(12)을 포함하는 타일(Tile) 벡터(24)를 제조하는 방법으로서, 여기서, 상기 선행 및 후행 인지 서열은 동일한 II형 제한 효소에 의해 인지되지만, 반대 배향을 갖고,
    상기 타일 벡터는 상기 선행 및 후행 인지 부위를 인지하는 II형 제한 효소를 사용하여 절단되어, 이의 각각의 말단에 공지된 오버행(overhang) 서열을 갖는 상기 코딩 폴리뉴클레오타이드 서열의 방출을 초래하고, 상기 방출된 코딩 폴리뉴클레오타이드 서열은 상기 선행 및 후행 II형 인지 서열이 결여되어 있고;
    상기 방법은 다음의 포함하는 단계를 포함하는 방법:
    a) 초기 코딩 폴리뉴클레오타이드(8)를 제공하고, 제1 종결 서열(16) 및 제2 종결 서열(17)로 상기 폴리뉴클레오타이드의 각각의 말단을 연장시키는 단계로서, 상기 종결 서열은 각각 하기의 요소를 포함하는, 단계:
    i. 상기 초기 코딩 폴리뉴클레오타이드의 개방 해독틀의 각각의 말단에 인접하고 이와 프레임 내에서(in frame) 첨가되는 코딩 연장 서열(11)(3xn);
    ii. 상기 코딩 연장 서열에 인접한 제1 II형 인지 서열(12)로서, 여기서, 상기 제1 인지 서열은 상기 제1 인지 부위를 인지하는 II형 제한 효소가 상기 코딩 연장 서열 내에서 절단하여 오버행을 발생시킬 수 있도록 배향되고, 제1 및 제2 종결 서열의 상기 제1 II형 인지 서열(12)은 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는 것인, 제1 II형 인지 서열(12);
    iii. 상기 제1 II형 인지 서열에 인접하거나 그 안의 스페이서 서열(13);
    iv. 상기 스페이서 서열에 인접한 제2 II형 인지 서열(14)로서, 여기서, 상기 제2 인지 서열은 상기 제2 인지 서열을 인지하는 II형 제한 효소가 상기 스페이서 서열을 절단하여 스페이서 오버행을 발생시킬 수 있도록 배향되고, 상기 제2 II형 인지 서열은 상기 제1 II형 인지 서열을 인지하는 II형 효소에 의해 인지되지 않는 것인, 제2 II형 인지 서열(14);
    v. II형 제한 효소가 상기 제2 인지 서열에 결합할 수 있도록 충분한 길이의 테일(tail) 서열(15);
    b) 제1 II형 인지 서열(3)과 제2 II형 인지 서열(4) 사이에 위치한 선택적 마커(6)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 수용 벡터(1)를 제공하여, 상기 벡터가 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 인지하는 II형 인지 효소를 사용하여 절단되어,
    · 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 포함하는 스터퍼(stuffer) 서열(2); 및
    · 상기 선택적 마커(6)를 포함하지만 상기 제1 II형 인지 서열 및 제2 II형 인지 서열이 결여되어 있고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(7)으로서, 여기서, 1개의 오버행은 상기 제1 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 인지 효소를 사용하여 상기 제1 종결 서열을 절단한 후 수득되는 스페이서 오버행에 상보적인 한편, 다른 오버행 서열은 상기 제2 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 제한 효소를 사용하여 상기 제2 종결 서열을 절단함으로써 수득되는 스페이서 오버행에 상보적인 것인, 선택적 벡터 단편(7)
    을 형성할 수 있는 단계;
    c) 혼합물을 인큐베이션하는 단계로서, 상기 혼합물은 다음을 포함함:
    i. 단계 (a)의 연장된 초기 코딩 폴리뉴클레오타이드;
    ii. 단계 (b)의 수용 벡터;
    iii. 상기 연장된 초기 코딩 폴리뉴클레오타이드의 종결 서열의 상기 제2 II형 인지 서열을 인지하는 II형 제한 효소;
    iv. 수용 벡터의 상기 제1 II형 인지 서열 및 제2 II형 인지 서열을 인지하는 II형 제한 효소;
    v. DNA 리가제.
  2. 제1항에 있어서, 수용 벡터의 상기 스터퍼 단편(2)이 역-선택적(counter-selective) 마커(5)를 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 연장된 폴리뉴클레오타이드의 제1 종결 서열(16) 및 제2 종결 서열(17)의 상기 제2 II형 인지 서열(14)이 동일한 II형 효소에 의해 인지되는, 방법.
  4. 제3항에 있어서, 수용 벡터의 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)이 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는, 방법.
  5. 제4항에 있어서, 수용 벡터의 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)이 상기 연장된 초기 코딩 폴리뉴클레오타이드의 제1 종결 서열(16) 및 제2 종결 서열(17)의 제2 II형 인지 서열(14)과 동일한 II형 효소에 의해 인지되는, 방법.
  6. 제5항에 있어서, 상기 수용 벡터(1)가 2개의 다중 클로닝 부위를 포함하며, 제1 다중 클로닝 부위는 일련의 다수의 상이한 II형 인지 서열을 포함하고 제2 다중 클로닝 부위는 제1 다중 클로닝 부위에서와 동일한 II형 효소에 의해 인지되는 반대로 배향된 II형 인지 서열을 포함하고, 상기 다중 클로닝 부위는 수용 벡터(1)의 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 포함하며, 이들은 상기 연장된 초기 코딩 폴리뉴클레오타이드의 제1 종결 서열(16) 및 제2 종결 서열(17)의 제2 II형 인지 서열(14)과 동일한 II형 효소에 의해 인지되는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 종결 서열(16, 17)을 이용하여 연장된 상기 초기 코딩 폴리뉴클레오타이드(8)가 DNA 합성 방법을 사용하여 제조되는, 방법.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 초기 코딩 폴리뉴클레오타이드(8)가 중합효소 연쇄 반응(PCR)을 사용하여 상기 종결 서열(16, 17)을 이용하여 연장되며, 여기서, 상기 PCR은 상기 초기 코딩 폴리뉴클레오타이드의 각각의 말단 상에서 어닐링하는 테일드(tailed) 포워드 및 리버스 프라이머의 사용을 수반하고, 포워드 프라이머의 상기 테일은 제1 종결 서열(16)을 첨가하고, 리버스 프라이머의 테일은 제2 종결 서열(17)을 첨가하는, 방법.
  9. 제8항에 있어서, 상기 PCR이 에러 유발 PCR(error prone PCR)이어서, 다수의 벡터를 발생시키고, 이들 벡터는 상기 초기 코딩 폴리뉴클레오타이드의 무작위 돌연변이체를 포함한다는 점에서 서로 다양한 것인, 방법.
  10. 제8항에 있어서, 상기 PCR이, 예정된 돌연변이를 초기 코딩 서열 내에 도입할 수 있게 하는 부위-특이적 돌연변이생성 PCR을 수반하는 것인, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 방법이 상기 타일 벡터에 포함된 초기 코딩 폴리뉴클레오타이드의 서열 내에 유도 돌연변이(directed mutation)를 도입하는 부가적인 단계를 포함하고, 상기 부가적인 단계는 Kunkel 방법, 미스매치 프라이머를 이용한 PCR 부위-특이적 돌연변이생성 또는 전체 플라스미드 돌연변이생성 방법(예를 들어 Quickchange 방법)의 사용을 포함하는, 방법.
  12. 선택적 마커(6), 및 바로 앞뒤에 선행 및 후행 II형 인지 서열(12)이 있는 코딩 폴리뉴클레오타이드 서열(10)을 포함하는 타일 벡터(24)로서,
    여기서, 상기 선행 및 후행 II형 인지 서열(12)은 동일한 II형 제한 효소에 의해 인지되지만 반대 배향을 갖고;
    상기 타일 벡터(24)는 코딩 폴리뉴클레오타이드 서열(10)이, 초기 코딩 서열(8)의 개방 해독틀과 프레임 내에서 바로 앞뒤에 2개의 코딩 연장 서열(11)(3xn)이 있는 초기 폴리뉴클레오타이드 서열(8)을 포함하는, 타일 벡터(24).
  13. 초기 코딩 폴리뉴클레오타이드 서열(8)과 제1 및 제2 종결 서열(16, 17)을 포함하는 폴리뉴클레오타이드 서열로서,
    여기서, 상기 제1 및 제2 종결 서열(16, 17)은 각각 하기의 요소를 포함하는 폴리뉴클레오타이드 서열:
    i. 코딩 연장 서열(11)(3xn)로서, 초기 코딩 폴리뉴클레오타이드 서열의 바로 앞뒤에 존재하고, 상기 초기 코딩 폴리뉴클레오타이드의 개방 해독틀과의 프레임 내에서 존재하는, 코딩 연장 서열(11)(3xn);
    ii. 상기 코딩 연장 서열(11)(3xn)에 인접한 제1 II형 인지 서열로서, 여기서, 상기 제1 II형 인지 서열은 상기 제1 인지 부위를 인지하는 II형 제한 효소가 상기 코딩 연장 서열(11)(3xn) 내에서 절단하여 오버행을 발생시킬 수 있도록 배향되고, 제1 및 제2 종결 서열의 상기 제1 II형 인지 서열은 동일한 II형 효소에 의해 인지되지만, 반대 배향을 갖는 것인, 제1 II형 인지 서열;
    iii. 상기 제1 II형 인지 서열(12)에 인접하거나 그 안의 스페이서 서열(13);
    iv. 상기 스페이서 서열(13)에 인접한 제2 II형 인지 서열(14)로서, 여기서, 상기 제2 II형 인지 서열(14)은 상기 제2 II형 인지 서열(14)을 인지하는 II형 제한 효소가 상기 스페이서 서열(13)을 절단하여 스페이서 오버행을 발생시킬 수 있도록 배향되고, 제1 및 제2 종결 서열의 상기 제2 II형 인지 서열(14)은 상기 제1 II형 인지 서열(12)을 인지하는 II형 효소에 의해 인지되지 않는 것인, 제2 II형 인지 서열(14);
    v. II형 제한 효소가 상기 제2 인지 서열(14)에 결합할 수 있도록 충분한 길이의 테일 서열(15).
  14. 2개 이상의 코딩 폴리뉴클레오타이드를 접합시켜, 벡터 내에서 통합된 생성물 폴리뉴클레오타이드를 형성하는 방법으로서,
    상기 방법은 혼합물을 인큐베이션하는 단계를 포함하고, 상기 혼합물은
    i. 2개 이상의 타일 벡터로서, 바람직하게는 상기 타일 벡터는 제1항 내지 제11항 중 어느 한 항의 방법에 따라 수득되고, 각각의 타일 벡터는 2개의 코딩 연장 서열(11)(3xn)을 포함하는 코딩 폴리뉴클레오타이드 서열(10)을 포함하고, 상기 코딩 폴리뉴클레오타이드 서열(10)의 바로 앞뒤에 선행 및 후행 II형 인지 서열(12)이 존재하며, 상기 벡터의 상기 선행 및 후행 인지 서열(12)은 동일한 II형 제한 효소에 의해 인지되는, 2개 이상의 타일 벡터;
    ii. 상기 타일 벡터 내에서 상기 선행 및 후행 II형 인지 서열(12)을 인지하고 상기 각각의 벡터로부터 코딩 폴리뉴클레오타이드 서열(10)을 절단하는 II형 제한 효소로서, 여기서, 각각의 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행은 하나의 다른 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행에 상보적인 것인, II형 제한 효소;
    iii. 2개의 제1 II형 인지 서열(21) 사이에 위치한 선택적 마커(23)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 지정(destination) 벡터(18)로서, 여기서, 상기 제1 II형 인지 서열(21)은 동일한 II형 제한 효소에 의해 인지되지만 반대 배향을 가져서, 상기 벡터는 상기 제1 II형 인지 서열을 인지하는 II형 제한 효소를 사용하여 절단되어,
    · 상기 제1 II형 인지 서열(21)을 포함하는 스터퍼 서열(20); 바람직하게는 상기 스터퍼 서열은 역-선택적 마커(5)를 추가로 포함하는, 스터퍼 서열(20); 및
    · 상기 선택적 마커(23)를 포함하지만 상기 제1 및 제2 II형 인지 서열이 결여되어 있고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(19)로서, 여기서, 1개의 오버행은 임의의 상기 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 오버행에 상보적인 한편, 다른 오버행은 임의의 상기 방출된 코딩 폴리뉴클레오타이드의 적어도 하나의 다른 오버행에 상보적인 것인, 선택적 벡터 단편(19)
    을 형성할 수 있는, 지정 벡터(18);
    iv. 상기 지정 벡터의 상기 제1 II형 인지 서열(21)을 인지하는 II형 제한 효소;
    v. DNA 리가제
    를 포함하는, 방법.
  15. 제14항에 있어서, 상기 코딩 폴리뉴클레오타이드가 단일 해독틀 내에서 상기 생성물 폴리뉴클레오타이드 내에서 조합되는, 방법.
  16. 제14항 또는 제15항에 있어서, 지정 벡터의 상기 제1 II형 인지 서열(21)이 상기 타일 벡터의 상기 선행 및 후행 인지 서열(12)을 인지하는 동일한 II형 제한 효소에 의해 인지되는, 방법.
  17. 제14항 내지 제16항 중 어느 한 항에 있어서, 상기 타일 벡터가, 예정된 수의 연결된 코딩 폴리뉴클레오타이드를 포함하는 생성물 뉴클레오타이드의 형성을 유도하는 오버행 서열을 포함하는 코딩 뉴클레오타이드를 방출하도록 설계되고, 방출된 코딩 폴리뉴클레오타이드의 오버행 서열이 생성물 뉴클레오타이드 내의 또 다른 코딩 폴리뉴클레오타이드 내에서 상기 코딩 폴리뉴클레오타이드의 위치를 예정하는, 방법.
  18. 제17항에 있어서, 상기 타일 벡터가, 뉴클레오타이드 서열에서 상이하지만 동일한 오버행 서열을 공유하는 2개 이상의 방출된 코딩 폴리뉴클레오타이드를 제공하며, 상기 방법이 상기 상이하게 방출된 코딩 폴리뉴클레오타이드의 상기 공유된 오버행 서열에 의해 정의된 바와 같이 생성물 뉴클레오타이드 내의 위치에서 뉴클레오타이드 서열이 다양한 상이한 생성물 뉴클레오타이드의 형성을 초래하는, 방법.
  19. 제18항에 있어서, 뉴클레오타이드 서열이 상이하지만 동일한 오버행 서열을 공유하는 상기 방출된 코딩 폴리뉴클레오타이드가 주어진 단백질 단위를 인코딩하는 폴리뉴클레오타이드의 상이한 변이체 또는 돌연변이체를 포함하는, 방법.
  20. 제19항에 있어서, 뉴클레오타이드 서열이 상이하지만 동일한 오버행 서열을 공유하는 상기 방출된 코딩 폴리뉴클레오타이드가, 상이한 단백질 단위를 인코딩하는 상이한 폴리뉴클레오타이드를 포함하는, 방법.
  21. 선택적 마커(23), 2개의 제1 II형 인지 서열(21) 및 역-선택적 마커를 포함하는 지정 벡터(18)로서,
    - 선택적 마커(23)는 2개의 (3xn) 서열(P1 및 Pn+1) 사이에 위치하고, 상기 서열의 각각의 뒤에 제1 II형 인지 서열(21)이 존재하고;
    - 2개의 제1 II형 인지 서열(21)은 상기 2개의 제1 II형 인지 서열(21)을 인지하는 동일한 II형 제한 효소에 의해 인지되는 것을 특징으로 하는, 지정 벡터(18).
  22. 2개의 다중 클로닝 부위 사이에 위치한 선택적 마커(6)를 포함하는 제1 뉴클레오타이드 서열을 포함하는 수용 벡터(1)로서, 제1 다중 클로닝 부위는 일련의 다수의 상이한 II형 인지 서열을 포함하고, 제2 다중 클로닝 부위는 제1 다중 클로닝 부위에서와 동일한 II형 효소에 의해 인지되는 반대로 배향된 II형 인지 서열을 포함하고, 여기서, 상기 다중 클로닝 부위는 제1(3) 및 제2(4) II형 인지 서열을 포함하며; 따라서, 상기 벡터는 상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 인지하는 II형 인지 효소를 사용하여 절단되어,
    상기 제1 II형 인지 서열(3) 및 제2 II형 인지 서열(4)을 포함하는 스터퍼 서열(2); 및
    상기 선택적 마커(6)를 포함하지만 상기 제1 및 제2 II형 인지 서열이 결여되어 있고 비-상보적 종결 오버행을 갖는 선택적 벡터 단편(7)
    을 형성할 수 있는, 수용 벡터(1).
KR1020197020918A 2016-12-19 2017-12-19 폴리뉴클레오타이드 셔플링 방법 KR102509887B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1621589.9A GB201621589D0 (en) 2016-12-19 2016-12-19 Polynucleotide shuffling method
GB1621589.9 2016-12-19
PCT/EP2017/083596 WO2018114980A1 (en) 2016-12-19 2017-12-19 Polynucleotide shuffling method

Publications (2)

Publication Number Publication Date
KR20190093664A true KR20190093664A (ko) 2019-08-09
KR102509887B1 KR102509887B1 (ko) 2023-03-13

Family

ID=58284697

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197020918A KR102509887B1 (ko) 2016-12-19 2017-12-19 폴리뉴클레오타이드 셔플링 방법

Country Status (7)

Country Link
US (1) US11725212B2 (ko)
EP (1) EP3555298B1 (ko)
KR (1) KR102509887B1 (ko)
CN (1) CN110462046A (ko)
CA (1) CA3047650A1 (ko)
GB (1) GB201621589D0 (ko)
WO (1) WO2018114980A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11655476B2 (en) * 2017-09-29 2023-05-23 Victoria Link Llimited Modular DNA assembly system
EP4253549A3 (en) * 2018-09-19 2023-12-06 The University of Hong Kong Improved high-throughput combinatorial genetic modification system and optimized cas9 enzyme variants
CN111378677A (zh) * 2018-12-27 2020-07-07 南京中科游子生物技术研究院有限公司 一种dna组装的方法及其应用
CN110060734B (zh) * 2019-03-29 2021-08-13 天津大学 一种高鲁棒性dna测序用条形码生成和读取方法
CN117203333A (zh) 2021-03-09 2023-12-08 诺瓦莱欣股份公司 抗菌多肽

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110102351A (ko) * 2008-11-19 2011-09-16 아미리스 인코퍼레이티드 폴리뉴클레오타이드의 집합체 조성물 및 이에 대한 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10145553B4 (de) * 2001-09-16 2006-06-08 Gene Architects Ag Nukleinsäure für einen Klonierungsvektor
US9206433B2 (en) 2013-05-01 2015-12-08 Dna Twopointo, Inc. Methods, compositions and kits for a one-step DNA cloning system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110102351A (ko) * 2008-11-19 2011-09-16 아미리스 인코퍼레이티드 폴리뉴클레오타이드의 집합체 조성물 및 이에 대한 방법

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Genetic Analysis: Biomolecular Engineering,제13권,139-145면(1996) 1부.* *
Kawarasaki et al., 2003 *
Patrick and Gerth, 2014 *

Also Published As

Publication number Publication date
US11725212B2 (en) 2023-08-15
GB201621589D0 (en) 2017-02-01
CN110462046A (zh) 2019-11-15
US20190323017A1 (en) 2019-10-24
EP3555298A1 (en) 2019-10-23
CA3047650A1 (en) 2018-06-28
EP3555298B1 (en) 2024-04-17
WO2018114980A1 (en) 2018-06-28
KR102509887B1 (ko) 2023-03-13

Similar Documents

Publication Publication Date Title
KR102509887B1 (ko) 폴리뉴클레오타이드 셔플링 방법
AU2020289750B2 (en) Engineered meganucleases with recognition sequences found in the human T cell receptor alpha constant region gene
KR102191739B1 (ko) 변형된 구제역 바이러스 3c 프로테아제, 조성물 및 이의 방법
AU2021200863A1 (en) Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
DK2663645T3 (da) Gærstammer, der er modificeret til produktion af ethanol fra glycerol
KR102528337B1 (ko) 정의된 서열 및 길이의 dna 단일 가닥 분자의 확장 가능한 생명공학적 생산
CN111757890A (zh) 发酵工艺
DK2768848T3 (en) METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS
KR20210044795A (ko) 고 처리량 대사 공학에서 CRISPRi의 응용
US20200188531A1 (en) Single-vector gene construct comprising insulin and glucokinase genes
KR20190116282A (ko) 복수의 숙주를 위한 다중 dna 구조체의 조립 및 편집을 위한 모듈식 범용 플라스미드 디자인 전략
CN1981039A (zh) 组装多表达构建体的方法
TW201217532A (en) Nucleic acid construct, recombinant vector and method for producing a target protein
CN108504670B (zh) 一种大肠杆菌冷休克助溶型表达质粒的构建方法及其应用
CN116083398B (zh) 分离的Cas13蛋白及其应用
KR20200086303A (ko) 숙주 세포에서의 향미 화합물 생산
CN114934031A (zh) 新型Cas效应蛋白、基因编辑系统及用途
CN111849978B (zh) 一种基于Type I-F CRISPR/Cas的染色质成像方法和染色质成像系统
CN111411114B (zh) 一种调控嗜热链球菌胞外多糖含量的方法
US20030059870A1 (en) Recombinant bacterial strains for the production of natural nucleosides and modified analogues thereof
US20040235121A1 (en) High copy number plasmids and their derivatives
CN110551746A (zh) Pgb蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用
US20210371859A1 (en) Rna mediated gene regulating methods
TW202403048A (zh) 用於治療龐貝症之具有訊號肽修飾之以密碼子最佳化核酸編碼α-葡萄糖苷酶(GAA)之治療性腺相關病毒

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant