KR102533566B1 - 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 - Google Patents

코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 Download PDF

Info

Publication number
KR102533566B1
KR102533566B1 KR1020200084659A KR20200084659A KR102533566B1 KR 102533566 B1 KR102533566 B1 KR 102533566B1 KR 1020200084659 A KR1020200084659 A KR 1020200084659A KR 20200084659 A KR20200084659 A KR 20200084659A KR 102533566 B1 KR102533566 B1 KR 102533566B1
Authority
KR
South Korea
Prior art keywords
val
ala
leu
gly
arg
Prior art date
Application number
KR1020200084659A
Other languages
English (en)
Other versions
KR20220006800A (ko
Inventor
강학수
지창훈
Original Assignee
건국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 건국대학교 산학협력단 filed Critical 건국대학교 산학협력단
Priority to KR1020200084659A priority Critical patent/KR102533566B1/ko
Publication of KR20220006800A publication Critical patent/KR20220006800A/ko
Application granted granted Critical
Publication of KR102533566B1 publication Critical patent/KR102533566B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 이종 발현이 가능한 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군 및 이의 제조 방법에 대한 것으로, 보다 구체적으로는 스트렙토마이시스 로제오스포로스의 유전체에 포함된 답토마이신 생합성 유전자 군을 클로닝한 후, 생산 수율이 높은 이종 균주에서 발현시킬 수 있도록 리팩토링한 재조합된 답토마이신 생합성 유전자 군의 서열 및 이를 제조하는 방법 및 이의 응용과 관련된 것이다.

Description

코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도{Codon-reprogrammed daptomycin non-ribosomal peptide synthetase gene and uses thereof}
본 발명은 생산 수율 향상을 위한 프로모터 엔지니어링 및 이종 발현이 가능하도록 생합성 유전자의 코돈을 리프로그래밍화 하고, 이에 의해 리팩토링된 답토마이신 생합성 유전자 군 및 이의 용도에 대한 것이다.
답토마이신은 미국식품의약처(FDA)에 승인된 리포펩타이드계 항생제로서 항생제 내성 슈퍼박테리아에 우수한 항미생물활성을 나타내며 내성 율이 낮아 다제내성 박테리아 감염증 치료제로 사용된다.
답토마이신의 생산은 스트렙토마이시스 로제오스포로스(Streptomyces roseosporus)의 발효배양 중 유전체 내 답토마이신 생합성 유전자군의 발현에 의해 이루어진다. 답토마이신 생합성유전자군은 생합성에 관련한 전사조절인자, 생합성유전자, 수송유전자 등을 포함하고 있다. 하지만 생산균주 내 답토마이신 생합성유전자군의 발현은 복잡한 발현 시스템에 조절되어 발현 수준이 매우 낮아 소량의 답토마이신이 생산되며, 고생산성 균주 개발의 어려움으로 작용한다.
생합성유전자군의 전사 및 발현율 증가에 따른 생산수율 증가방법으로는 다중화프로모터 엔지니어링과 같은 유전적 조작방법이 개발되었지만, 답토마이신 생합성유전자군의 경우 상대적으로 큰 핵산분자의 염기서열과 비-리보솜성 펩타이드 생합성유전자 (dptBC, non-ribosomal peptide synthetase) 내 다수의 반복되는 염기서열로 인해 클로닝을 통한 이종발현 및 프로모터 엔지니어링 조작이 제한된다.
따라서, 답토마이신 대량생산능을 갖는 산업 균주 개발을 위해서는 답토마이신 생합성 유전자군의 리팩토링 및 이종발현 방법에 의한 답토마이신 대량생산 방법에 대한 개발 및 연구가 절실히 필요하다.
이에 본 발명자들은 답토마이신의 생산 수율 증가 및 이종 발현을 위한 목적으로 답토마이신 생합성 유전자 군에 대한 연구 끝에, 상기 유전자의 일부 서열을 치환 또는 코돈 리프로그래밍화를 통해 리팩토링하고, 이를 대량 생산이 가능한 산업 균주에서 발현하여, 답토마이신을 생산할 수 있는 본 발명을 완성하였다.
즉, 본 발명의 목적은 답토마이신 생합성 유전자 군 내의 비-리보솜성 펩타이드 생합성 효소 유전자 내의 반복 서열을 코돈 리프로그래밍화를 통한 리팩토링에 의해 제거한 답토마이신 생합성 유전자 군을 포함하는 DNA 분자를 제공하는 것이다.
본 발명의 다른 목적은, 상기 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 DNA 분자가 포함된 벡터를 제공하는 것이다.
본 발명의 또 다른 목적은, 상기 벡터를 통해 형질 전환된 숙주 세포를 제공하는 것이다.
본 발명의 또 다른 목적은, 본 발명은 스트렙토마이시스 로제오포러스(Streptomyces roseosporus)의 유전체 라이브러리로부터 개별 dptA, dptBCdptD 유전자를 포함하는 포스미드(fosmid)를 선별하는 단계; 상기 답토마이신 생합성 유전자 군 내의, dptBC 유전자의 반복 염기서열을 제거하기 위한 코돈 리프로그래밍화를 수행하는 단계; 코돈 리프로그래밍화된 dptBCdptAdptD 유전자들을 포함하는 유전자 군의 리팩토링 및 클로닝 단계; 및 상기 클로닝된 각각의 유전자를 서브-클로닝하여 재조립하는 단계를 포함하는 리팩토링된 답토마이신 생합성 유전자 군의 클로닝 방법을 제공하는 것이다.
상기와 같은 목적을 달성하기 위하여, 본 발명은 답토마이신 생합성 유전자 군 내의 비-리보솜성 펩타이드인 답토마이신의 생합성 유전자(답토마이신 NRPS) 서열 내에 포함된 반복 서열 중 한 개 이상의 서열을 코돈 리프로그래밍화를 통해 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 DNA 분자를 제공한다.
답토마이신 생합성 유전자 군은 유기체, 바람직하게는 박테리아 세포에서 답토마이신의 생합성을 위해 필요한 생합성 효소, 수송 단백질 그리고 전사 조절 단백질 등을 코딩하는 유전자를 포함하는 DNA 분자이다. 답토마이신 생합성 유전자 군은 비-리보솜성 펩타이드 생합성 효소(DptA, DptBC, DptD), 보조 생합성 효소(DptE, DptF, DptG DptH, DptI, DptJ), 수송 단백질(DptM, DptN, DptP), 그리고 전사 조절 단백질 (DptR1, DptR2)을 코딩하는 유전자들과 그 외 기능이 알려지지 않은 답토마이신 합성에 필요한 다른 생합성 효소 단백질을 코딩하는 유전자 서열을 포함한다. 본 발명의 일 실시 예에서, 상기 답토마이신 생합성 유전자 군은 상기 제1항에 있어서, 상기 dptA, dptBC ,dptD, dptE, dptF, dptG, dptH, dptI, dptJ, dptM, dptN, dptP, dptR1dptR2 으로 이루어진 군으로부터 선택되는 하나 이상의 답토마이신 생합성 유전자 를 포함하며, 이에 제한되는 것은 아니나, 특히 "dptA", "dptBC", 및 "dptD" 중 어느 하나 이상을 포함할 수 있다. 상기 "dptA", "dptBC", 및 "dptD" 는 답토마이신의 뼈대 화학 구조의 생합성에 관여하는 일련의 서브유닛으로 구성되는 비-리보솜성 펩타이드 생합성 효소 들을 코딩하는 유전자에 해당한다.
본 발명의 일 양태로서, 상기 답토마이신 생합성 유전자 군을 포함한 포스미드 클론은 스트렙토마이스세스 로제오포러스 (Streptomyces roseosporus)의 유전체 라이브러리로부터 서열번호 1 내지 서열번호 6 의 염기 서열의 프라이머를 이용하여, PCR 스크리닝 방법에 의해 선별된 것이며, 상기 비-리보솜성 펩타이드 생합성 유전자(NRPS)의 염기서열 내에 다수의 반복적인 염기서열을 포함하는 특징이 있다.
본 발명자들은 상기 반복 서열에 의해 답토마이신 생합성 유전자 군의 프로모터 엔지니어링에 한계가 있음을 확인하고, 이를 해결하고자 상기 반복 서열과 코딩하는 아미노산 서열은 동일하나 상이한 코돈을 포함하는 염기서열로 이를 치환하는 코돈 리프로그래밍화를 수행하였다.
본 발명의 일 실시 예에서, 상기 답토마이신 비-리보솜성 펩타이드 생합성 효소 유전자(dptBC NRPS)는 서열번호 3 및 서열번호 4의 프라이머 쌍에 의해 선별된 "pNRRL11379-248-6" 단위체 DNA 염기서열 내에 포함되며, 상기 유전자(dptBC, NRPS, 22,017bp)의 반복 서열은 상기 단위체 서열의 5,596 내지 7,323번째 서열을 포함하는 A 영역, 12,217 내지 15,225 번째 서열을 포함하는 B 영역 및 16,606 내지 21,951 번째 서열을 포함하는 C 영역이며, 코돈 리프로그래밍화 결과, 상기 A, B 및 C 영역은 각각 서열번호 7의 염기서열로 이루어진 합성 A영역, 서열번호 8의 염기서열로 이루어진 합성 B영역, 및 서열번호 9의 염기 서열로 이루어진 합성 C영역으로 치환되었다.
본 발명의 일 실시양태에서, 상기 DNA 분자는, 각각의 답토마이신 생합성 유전자 군이 박테리아 인공 염색체(BAC)에 서브클로닝 됨으로써, 상기 BAC으로부터 유래된 DNA 서열을 포함하는 것인, DNA 분자이다. 본 발명의 답토마이신 생합성 유전자 군에 포함되는 dptA, dptBCdptD 유전자는 각각 효모 내 상동재조합을 통하여 BAC 벡터 시스템으로 서브클로닝 되었다.
본 발명의 다른 목적을 달성하기 위하여, 본 발명은 상기의 DNA 분자를 포함하는 벡터 및 이를 통해 형질 전환된 숙주 세포를 제공한다. 상기 벡터는 그 종류에 제한되는 것은 아니나, 플라스미드 (plasmid), 코스미드 (cosmid), 포스미드 (fosmid), 박테리아 인공 염색체(BAC) 또는 효모 인공 염색체(YAC)일 수 있다. 상기 벡터는 숙주 세포의 게놈으로 통합되어 숙주 게놈과 함께 복제된다. 본 발명의 벡터는 상기 벡터 내에 작동 가능하게 연결된 답토마이신 생합성 유전자 군을 발현되도록 할 수 있으며, 이는 재조합 발현 벡터이다. 본 발명의 일 실시예에서, 상기 재조합 발현 벡터는 BAC을 이용하였다.
본 발명에서 제공하는 DNA 분자의 주요한 특징은 효모 내 상동재조합을 이용한 리팩토링 혹은 이종 발현이 가능한 점에 있다. 따라서, 본 발명의 상기 숙주 세포는 그 종류에 제한되는 것은 아니나, 스트렙토마이스시스 로제오포러스(Streptomyces roseosporus) 및, 이 밖에 이종 숙주를 이용할 수 있다. 상기 유전적 엔지니어링을 위한 숙주는 효모 혹은 대장균, 이종 발현 숙주로는 스트렙토마이시스 리비단스(Streptomyces. lividans) 혹은 스트렙토마이시스 시엘리칼라(Streptomyces coelicolor) 등을 이용할 수 있다.
본 발명의 또 다른 목적을 달성하기 위하여, 본 발명은 스트렙토마이시스 로제오포러스(Streptomyces roseosporus)의 유전체 라이브러리로부터 dptA, dptBC 또는 dptD 생합성 유전자를 포함하는 포스미드 클론을 선별하는 단계; 상기 답토마이신 생합성 유전자 군 중, dptBC의 반복 서열을 제거하기 위한 코돈 리프로그래밍화를 수행하는 단계; 코돈 리프로그래밍화된 dptBC, dptAdptD 유전자 들을 포함하는 유전자 군을 클로닝하는 단계; 및 상기 클로닝된 유전자군을 서브-클로닝하여 재조립하는 단계를 포함하는 리팩토링된 답토마이신 생합성 유전자 군의 클로닝 방법을 제공한다.
본 발명에서 "리팩토링"이란, 세포에서 발현되는 유전자 발현 패턴을 조절하여, 목적하는 세포로 전환시키기 위한 방법을 말한다. 일반적으로 클로닝은 외래 유전자 또는 DNA 등을 포함하는 벡터를 도입하는 과정을 통해 수행될 수 있으며, 본 발명에서는 재조합된 답토마이신 생합성 유전자 군을 포함하는 DNA 서열을 숙주 세포에 도입함으로써 수행될 수 있다.
상기 답토마이신 생합성 유전자 클러스터는 dptA, dptBCdptD 유전자 서열을 포함하며, 본 발명에서는 상기 유전자 중에서 dptBC의 반복 DNA 염기서열을 제거하기 위하여 코돈 리프로그래밍화를 수행하였다. "코돈 리프로그래밍(Codon reprograming)" 이란, 단백질을 코딩하는 부위의 아미노산 코돈 중에서 반복 염기서열에서 나타나는 코돈을 동일 아미노산을 코딩하는 대체 코돈으로 변형시켜 상동재조합을 일으킬 수 있는 반복 염기서열을 제거하는 과정을 말한다. 본 발명에서는 상기 코돈 리프로그래밍화된 서열을 포함하는 답토마이신 생합성 유전자 클러스터가 스트렙토마이시스 속(sp.)에 속하는 미생물 뿐만 아니라, 답토마이신의 대량 생산이 가능한 산업 미생물에서 DNA를 안정적으로 유지하고, 증폭할 수 있도록 하는 효과를 가진다. 또한 이러한 이종 발현을 통해, 결과적으로는 답토마이신의 생산 수율을 현저히 개선할 수 있게 되었다.
본 발명의 또 다른 목적을 달성하기 위하여, 본 발명은 상기 설명한 코돈 리프로그래밍화에 의해 리펙토링된 답토마이신 생합성 유전자 군을 포함하는 DNA 분자를 이용하여 답토마이신을 생산하는 방법을 제공한다.
본 발명의 일 실시 예에서, 상기 DNA 분자를 통해 형질 전환된 대장균에서, 상기 도입된 DNA의 안정적 발현 및 복제를 유지함을 확인하였다. 즉, 기존의 반복 서열을 가지고 있는 답토마이신 생합성 유전자 군(WT: Wild Type)과 비교하여, WT의 경우에는 다수의 DNA 절편이 관찰되는 등, 세포 내 유지 및 복제가 불완전 하였던 반면, 본 발명의 코돈 리프로그래밍화에 의해 리팩토링된 DNA 분자는 이종 숙주인 대장균에서도 안정적으로 유지 및 증폭됨을 확인하였다.
본 발명은 이종 발현이 가능하도록 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군 및 이의 용도에 대한 것으로, 코돈 리프로그래밍화된 서열을 포함하는 리팩토링된 답토마이신 생합성 유전자 군이 답토마이신의 대량 생산이 가능한 산업 미생물에서 DNA를 안정적으로 유지하고, 증폭할 수 있도록 하는 효과를 가진다.
도 1은 본 발명에 따른 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군 및 이를 이용한 이종 발현 과정을 나타낸 모식도이다.
도 2는 스트렙토마이시스 로제오스포로스(S. roseoporus) 유전체 내의 답토아미신 생합성 유전자 군 및 이의 포스미드 클론을 선별하는 과정을 나타낸 것이다.
도 3은 답토마이신 생합성 유전자 군에 포함된 비 리보솜성 펩타이드 생합성 유전자 (dptBC NRPS)의 반복 서열 및 이의 코돈 리프로그래밍화 결과의 좌표를 나타낸 것이다.
도 4는 코돈 리프로그래밍화된 dptBC 유전자를 포함하는 답토마이신 생합성 유전자 군의 재조립을 위한 서브클로닝 및 이의 유전자 맵을 나타낸 것이다.
도 5는 효모 내 상동 재조합에 의한 신규 리팩토링된 답토마이신 생합성 유전자 군의 클로닝 과정 및 클론을 선별하는 과정을 나타낸 것이다.
도 6은 스트렙토마이시스 리비단스(S. lividans)를 생산 균주로 하여, 이종 발현에 의한 답토마이신 유도체인 리포펩타이드 생산을 고성능 액체 크로마토그래피로 분석한 결과이다.
도 7은 본 발명의 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 BAC 클론이 숙주 세포 내에서 안정적으로 복제 및 증폭되는 결과를 확인한 것이다.
이하, 본 명세서를 구체적으로 설명하기 위해 실시 예를 들어 상세히 설명한다. 그러나, 본 명세서에 따른 실시 예들은 여러 가지 다른 형태로 변형될 수 있으며, 본 명세서의 범위가 아래에서 상술하는 실시 예들에 한정되는 것으로 해석되지는 않는다. 본 명세서의 실시 예들은 당 업계에서 평균적인 지식을 가진 자에게 본 명세서를 보다 완전하게 설명하기 위해 제공되는 것이다.
실시예 1. 스트렙토마이시스 로제오스포로스 유전체 DNA 라이브러리 제작
답토마이신 생산 균주의 유전체 DNA를 추출하기 위해, 스트렙토마이시스 로제오스포로스 균주를 TSB배지에 접종하여 30
Figure 112020071376651-pat00001
의 배양기에서 3-4일간 배양하였다. 배양액으로부터 원심분리기를 이용해 균체를 분리한 후 염석(salting out)방법으로 유전체 DNA를 분리하였으며 이는 DNA 전기영동법으로 확인하였다.
상기 분리한 유전체 DNA 단편은 루시젠(Lucigen) 회사의 포스미드(Fosmid) 라이브러리 제작 키트의 방법에 따라 pCC1FOS (Genebank: EU140751)에 클로닝하고, 이를 EPI300T1 대장균 균주에 형질 전환하여 유전체 라이브러리를 제작하였다.
실시예 2. 답토마이신 생합성 유전자 군을 포함하는 클론 선별
상기 실시예 1에서 제작한 유전체 라이브러리를 대상으로 PCR 기반 스크리닝 방법을 이용하여 답토마이신 생합성 유전자 군을 포함하는 포스미드 클론인, pNRRL11379-7-24, pNRRL11379-248-6 및 pNRRL11379-178-42을 선별하였다. PCR 스크리닝에 사용된 프라이머 쌍의 DNA 염기서열은 하기 표 1과 같다.
단위체 이름 길이 서열 서열번호
pNRRL11379-7-24 dpt_Front_GT_FW1 20 CGATTGGTGAACGTGATGGT 1
dpt_Front_GT_RV1 20 CGAGGAGATGACCGATCCAG 2
pNRRL11379-248-6 dpt_Middle_GT_FW1 20 CGTGGTGGGTGACATCGAGA 3
dpt_ Middle _GT_RV1 20 CTGGACGACACAGAGATCCG 4
pNRRL11379-178-42 dpt_Back_GT_FW1 20 TACGAGAACCACGGCAGTCT 5
dpt_Back_GT_RV1 20 GCACCAGTCTTGCGCTCTTG 6
도 2에 도시한 바와 같이, 상기 선별한 세 개의 포스미드 클론에 대하여 생어 분석 방법을 통해 해당 클론의 말단 DNA 염기서열을 확인하였으며, 그 결과, pNRRL11379-248-6 클론의 말단이 pNRRL11379-7-24 및 pNRRL11379-178-42의 말단과 서로 부분적으로 중복됨을 확인하였다.
실시예 3. 비 리보솜성 펩타이드 생합성 유전자(dptBC)의 코돈 리프로그래밍화에 의한 리팩토링
상기 실시 예 2에서 선별한 pNRRL11379-248-6 클론은 dptBC 비-리보솜성 펩타이드 생합성 효소의 유전자를 포함하고 있으며, 이는 22,017 kb 길이의 DNA 염기서열로서, 7,339개의 아미노산으로 이루어진 단백질을 암호화한다. 하지만 dptBC 유전자 내 생합성 모듈간에 고도의 유사성을 가지는 서열을 포함하며, 다수의 반복되는 염기서열이 존재하고 있어, 정확한 반복 염기서열의 위치와 크기 및 중복 회수를 분석하기 위해 온라인 생물정보 소프트웨어인 Ugene 소프트웨어를 사용하여 dptBC 생합성 유전자의 DNA 염기서열을 분석하고, 이 정보를 바탕으로 코돈 리프로그래밍 방법을 디자인 하였다.
본 발명에서는 반복되는 DNA 염기서열을 제거하고자 dptBC 비리보솜성 펩타이드 생합성 효소의 아미노산 암호화 코돈 중에서 반복되는 DNA 염기서열에 포함되는 코돈 들을, 동일한 아미노산을 코딩하는 다른 코돈 들로 대체하였다. 또, 암호화 서열 중 희귀 코돈(rare codon)은 방선균 숙주에서 편중되어 사용되는 코돈(preferred codon)으로 대체하는 코돈 최적화 (Codon-optimization) 방법을 사용하였다.
그 결과, dptBC 비-리보솜성 펩타이드 생합성효소의 유전자 코돈은 도 3과 같이 리프로그래밍에 의해 재구성되었으며, 정확하게는 5,596-7,323 번째 염기서열 (SynthA region : 1,728), 12,217-15,225 번째 염기서열 (SynthB reion : 3,009), 16606-21951 번째 염기서열 (SynthC region: 5,346)이 각각 리프로그래밍에 의해 재구성되었다.
코돈 리프로그래밍화에 의해 리팩토링 된 비-리보솜성 펩타이 생합성효소의 유전자(dptBC)를 클로닝하기 위해 젠스크립트(Genescript) 회사에 유전자 합성 서비스를 의뢰하여 공통염기서열(Overlapped sequences)을 포함한 각 6,500 bp, 4,804 bp, 2730 bp 크기의 DNA 염기서열을 갖는 3개의 DNA 분자를 화학적 방법으로 합성하였다.
실시예 4. 효모 내 상동재조합에 의한 답토마이신 생합성유전자 군 클로닝
먼저, 상기 <실시예 2> 및 <실시예 3>에서 제작한 3개의 답토마이신 생합성 유전자를 포함하는 단편 클론들의 염기서열 들을 생어 분석법으로 확인하였고, 도 4의 내용과 같이 효모 내 상동재조합(Homologous recombination)을 이용해 BAC 벡터 시스템으로 각각 서브 클로닝(Sub-cloning)하였다.
구체적으로, <실시예 2> 및 <실시예 3>에서 제작한 답토마이신 생합성유전자를 포함하는 단편 클론들이 서브 클로닝 되어있는 (Sub-cloning) BAC 클론들을 SwaI 제한효소를 처리하여 선형화(linearization) 하고, HpaI 제한 효소로 처리된 캡쳐 BAC 벡터와 함께 염화 리튬 형질전환 방법으로 효모에 동시에 형질전환하였다. 이때, 효모의 상동재조합(Homologous recombination)에 의해서 재조립된 형질 전환체는 His이 결핍된 한천배지에서 선별되었고, 3-4일 동일한 구성성분을 갖는 배지에서 액체 배양 후 재조합 DNA를 분리하였다.
그 결과, 도 5에서 보는 바와 같이, 답토마이신 생합성유전자 군이 클로닝 된 BAC 클론은 PCR을 이용한 방법 및 DNA 전기영동 방법을 이용하여 확인되었다. PCR 스크리닝을 위한 프라이머 염기서열은 하기 표와 같다.
단위체 프라이머 이름 프라이머 쌍
번호
서열
Reprogrammed daptomycin biosynthetic gene cluster dpt_Front_GT_FW1 1 GGTTACAGAAGTCGTGAA
dpt_Front_GT_RV1 TTCAAGCCCCTCTACGACGA
dpt_Front_GT_FW2 2 GTGAAGTCCCGGAGGCTCTC
dpt_Front_GT_RV2 CGTTTCGCGCTGACTTTCCA
dpt_Middle_GT_FW1 3 CGTGGTGGGTGACATCGAGA
dpt_Middle_GT_RV1 CTGGACGACACAGAGATCCG
dpt_Middle_GT_FW2 4 TACACGCGAGTGTTGAGGAT
dpt_Middle_GT_RV2 GAAGCCATGTGGTACTCGAC
dpt_Middle_GT_FW3 5 TTCCACTCCGTCAGGACACG
dpt_Middle_GT_RV3 CCGAAGATCTCATCGGCTTC
dpt_Middle_GT_FW4 6 CACGATCAGATCCAGCCCAC
dpt_Middle_GT_RV4 AACACGATTGACCGTGAGGT
dpt_Middle_GT_FW5 7 GCGGAGTTTGATCTGATCGT
dpt_Middle_GT_RV5 AACTGCACCTTATTGACGAC
dpt_Back_GT_FW1 8 ACAGGATCTCTTCACGGGCT
dpt_Back_GT_RV1 CCATCGGCGAACTGTATGTG
dpt_Back_GT_FW2 9 TACGAGAACCACGGCAGTCT
dpt_Back_GT_RV2 GCACCAGTCTTGCGCTCTTG
본 발명에서 제작된 리팩토링된 답토마이신 생합성유전자 군이 클로닝된 BAC 클론의 전체 DNA 염기서열은 일루미나 (Illumina) 차세대염기서열분석(NGS)법을 이용하여 동정하였다.
실시예 5. 리팩토링된 답토마이신 생합성유전자 군의 이종발현
상기에서 수행한 실험 결과를 바탕으로, 리팩토링된 답토마이신 생합성유전자군의 이종 발현 방법을 구축하였다.
구체적으로, 상기 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성유전자군 BAC 클론은 대장균의 접합성 형질전환 (Conjugative transfer method) 방법을 이용하여 이종 숙주인 스트렙토마이시스 리비단스 (Streptomyces lividans) 균주로 형질전환 하였으며, 형질전환체는 10 mM 염화마그네슘이 첨가된 ISP4 (BD bioscience, USA) 배지에서 항생제 내성 특이성을 이용해 선별하였다.
선별된 형질전환체는 아프라마이신(Apramycin) 날리딕산(Nalidixic acid)이 첨가된 ISP4 고체배지에서 7-8일간 배양 후 포자를 회수하여 100 ml 삼각플라스크의 R5A 액체배지에 접종하여 배양하였다.
도 6의 내용과 같이, 이종 숙주의 배양액 내 대사 산물의 정성 분석은 역상 액체크로마토그래피(Reverse-phased HPLC)법을 이용하여 분석하였다. 그 결과 답토마이신 유도체(A21978C)가 생산되었으며 HPLC/MS을 이용한 분자량 분석 시, 각각 1634(A21978C1), 1648(A21978C2), 1662(A21978C3)의 분자량을 갖는 것을 확인할 수 있었다.
실시예 6. 리팩토링된 답토마이신 생합성 유전자군 BAC 클론의 복제 및 증폭
본 발명에 의한 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 BAC 클론은 코돈 리프로그래밍화에 의해 반복적 염기서열을 제거하였으며, 유전적 엔지니어링(Genetic engineering)에 용이한 모델 생명체 (Model organism)인 효모, 대장균 혹은 방선균으로의 형질전환 및 유전적 복제가 가능한 BAC 클론 시스템을 구축하였다.
상기 <실시예 4>에서 선별된 리팩토링된 답토마이신 생합성 유전자 군이 포함된 BAC 클론은 기존의 반복적 염기서열을 보유한 답토마이신 생합성 유전자 군 BAC 클론에 비해 세포 내에서 안정적 유지 및 복제가 가능하다는 장점이 있다.
이를 확인하기 위한 방법으로, 기존의 답토마이신 생합성 유전자 군 그리고 본 발명의 리팩토링된 답토마이신 생합성 유전자군이 포함된 각각의 BAC 클론을 전기충격 형질전환 (Electro-transformation) 방법을 이용하여 대장균 내 형질전환 후, 클로람페니콜 (Chloramphenicol 12.5 μg/ml) 혹은 아프라마이신 (Aprmycin 50μg/ml) 을 함유한 LB (Difco broth miller, BD) 한천배지에서 항생제 내성 특이성을 이용하여 형질전환체를 선별하였다. 이후, 각 대장균 클론들은 클로람페니콜 (Chloramphenicol 12.5 μg/ml) 및 유도인자용액(Copy control induction solution) 이 첨가된 LB 액체배지에서 배양 (37℃ 24시간 배양) 후 세포 내 플라스미드(Plasmid)를 추출하였다. 추출한 각 답토마이신 생합성유전자군을 포함하는 BAC 클론은 도7에서 나타낸 바와 같이 0.5% 아가로즈겔 (Agarose gel)에서 135 V로 60분간 전기영동 (electrophoresis)하였다.
그 결과, 도 7에서 보듯이, 기존의 답토마이신 생합성 유전자 군이 포함되어 있는 BAC 클론은 세포 내 불안정한 유지 및 복제로 인한 다수의 DNA 절편 조각이 관찰 되었지만, 반면 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 BAC 클론은 기존의 답토마이신 생합성 유전자 군 클론에 비해 안정적 세포 내 유지 및 플라스미드 증폭이 가능하였다. 모델 생명체 내 안정적 유지 및 복제는 유전적 엔지니어링에 유용하게 이용될 수 있으며, 다른 이종 숙주로의 형질전환을 가능하게 한다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 진술한 설명이 아니라 청구 범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
<110> Industry academy coorperation of Konkuk university <120> Codon-reprogrammed daptomycin non-ribosomal peptide synthetase gene and uses thereof <130> 1067439 <160> 11 <170> KoPatentIn 3.0 <210> 1 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 1 cgattggtga acgtgatggt 20 <210> 2 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 2 cgaggagatg accgatccag 20 <210> 3 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 3 cgtggtgggt gacatcgaga 20 <210> 4 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 4 ctggacgaca cagagatccg 20 <210> 5 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 5 tacgagaacc acggcagtct 20 <210> 6 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 6 gcaccagtct tgcgctcttg 20 <210> 7 <211> 1728 <212> DNA <213> Artificial Sequence <220> <223> Reprogrammed region A <400> 7 gtcgtcccgg tgggtgtcgt cggtgagctg tacgtggccg gtgtcggtct cgcacggggg 60 tacctcggtc gtgccggtct cacggccgag cggttcgtgg cgtgcccgtt cggtgcgccg 120 ggtgagcgta tgtaccgtac gggggatctg gtgcggtggc gggtggacgg cgccctggag 180 ttcgtgggtc gtgcggacga ccaggtcaag gtgcgtggct tccgggtcga gttgggtgag 240 gtcgagggtg ccgtggcagc ccacccggac gtggtgcgtg cggtcgtggt cgtccgggaa 300 gaccgtcccg gtgaccaccg cctggtggcg tacgtgacgg gtgtcgacac cggtggcctc 360 agcagcgcgg tcatgcgtgc ggtcgcggag cgtctccctg cctacatggt cccgagcgcc 420 gtggtcgtgc tggacgagat cccgctgacc ccgaacggga aggtggaccg ggcggcgctt 480 ccggtgccgg gggtggaggc gggcgcgggc taccgggcgc ctgttagccc gcgtgaggaa 540 gtcctgtgcg gtctcttcgc cgaagtgctc gggctggagc gggtgggggt ggacgatgat 600 ttcttcgggt tgggtggtca ctcgctgctg gcgacgcgtc tgatctcgcg tgtccgtgcg 660 gtgctcggtg tggaggcggg tgtgcgtgcg ctcttcgagg cgccgacggt gagccgtctg 720 gagcggctgc tgcgggagcg gagcgctctc ggggtgcggg tgccgctggt ggcacgggag 780 cggacgggtc gggagccgct gagcttcgct cagcagcgtc tgtggttcct ggaggagctg 840 gagggtcccg gtgctgcgta caacatcccg atggcgctgc gtctggccgg tgtgctggac 900 gtcgaggcgc tgcaccaggc gctcatcgac gtcatcgctc gccacgagag cctccgcacc 960 ctcatcgcgc aggatgcggg tacggcctgg cagcacatcc tgcccgtgga cgaccctcgc 1020 acccgtcccg gtctccctct ggtggacatc ggtgccgacg ccctgcagga gcggctcgac 1080 gaggccgctg gtcggccctt cgacctcgct gccgacctcc cggtccgtgc cacggtcttc 1140 cgcctcaccg acaacgacca catcctcctg gtcgtggccc accacgtggc cttcgacgcg 1200 atgtcccgtg tgccgttcat ccggaacgtc aagcgcgcct tcgaggcccg tacgaacggc 1260 gcagcccccg actggcgtcc gctgcccgtg cagtacgcgg actacgcggc ctggcagcgc 1320 gacgtgctcg gcacggagga cgacgagtcg agcgagctgt cggcccagct cgcctactgg 1380 cgcacccagc tagcctcgct gcctgccgag ctggcgctcc cgacggaccg tgcccgtccc 1440 gccgtcgcct cgtacgaagg cggcaaggtc gagttcaccg tccccgctgg tgtgtacgac 1500 ggcctggtgg ctctcgcccg tgccgagggt gtcacggtct tcatggtcgt gcaggcggcg 1560 ctggccgcgc tcctctcccg gctgggtgcc ggcgacgaca tcccgatcgg gacgccgatc 1620 gccggccgca ccgaccaggc caccgaagat ctcatcggct tcttcgtgaa caccctcgtc 1680 ctccgcacgg acgtcagcgg tgacccgacc ttcgcggagc tgctggcc 1728 <210> 8 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> Reprogrammed region B <400> 8 ctggtccggg tcctcgaggg cgtcgtcagc ggcggtggcg gtgtctccgt gagcggtgtg 60 gatgtcctcg gtgtcggcga gcgcgaacgg ttgctcggtt ggggcgtcgg cggaccggtc 120 ccggtcgtgc ccggaggcgg tctcgtcggc ctgttcgaag agcgcgtccg tgcggacgcc 180 gatgccgtcg ccgtccgtgg tgcaggcgtc gtctggtcct acggcgagct caacgcccgg 240 gtcaacgtgg tcgcccgctg gctcgtcgga cgcggcgtcg gtgccgagtg cggtgtcggc 300 gtcgtcatgg gtcgcggtgt cgacgtggtc gtcatgctgc tcgccgtcgc caaggccggt 360 ggcttctacg tgcccgtcga ccccgagtgg cccgtcgagc gcgtcggctg ggtcctcgcc 420 gacgccggtg tcggcctcgt ggtcgtcggt gagggcctct cccacgtcgt gggtgacttc 480 cccggtggcg aggtgttcga attctcccgc gtggtgcgcg agtcctgcct ggtcgagctc 540 gtcgcggctg acggtgtcga ggtgcgcaac gtcaccgacg gcgagcgcgc ctcccgtctc 600 ctccccggtc accccctcta cgtcgtgtac acctccgggt ccacgggtcg tcccaagggc 660 gtcgtcgtca cccacgcctc ggtcggcggt tacctggccc gtggccggga cgtctacgca 720 ggcgccgtgg gcggtgtcgg gttcgtccac tcgtccctcg ccttcgacct gaccgtcacc 780 gtgctcttca ccccgttggt ctcgggtggc tgcgtggtgc tgggcgagct cgacgagtcc 840 gcccagggtg tcggggcctc cttcgtcaag gtcaccccgt cccacctcgg tctcctcggc 900 gagctcgagg gcgtcgtcgc cggtaacggg atgctcctcg tcggtggcga ggccctctcc 960 ggtggggctc tccgcgagtg gcgcgagcgc aaccccggtg tcgtggtcgt caacgcctac 1020 ggtcccaccg agctcaccgt caactgcgcg gagttcctga tcgcccctgg cgaggaggtg 1080 cccgacggcc cggtcccgat cggtcgcccg ttcgctggcc agcggatgtt cgtgctcgac 1140 gcggccctgc gcgtcgtccc ggtgggcgtc gtgggcgagc tctacgtcgc cggtgtcggc 1200 ctcgctcggg gttacctggg tcgcgtcggt ctcaccgccg agcgcttcgt cgcctgcccg 1260 ttcggcgtgc ccggcgaacg catgtaccgg acgggtgacc tggtccgttg gcgcgtcgac 1320 ggtgcgctgg agttcgtcgg tcgcgccgac gaccaggtca aggtgcgcgg tttccgcgtc 1380 gagctcggcg aggtcgaggg tgcggtcgct gcgcacccgg acgtggtccg tgccgtggtg 1440 gtcgtccggg aggatcgtcc cggtgaccac cgcttggtcg cctacgtcac cgctggtggc 1500 gtgggtggtg acggcctgcg gtcggccatc tccggtctcg tggccgagcg cctccctgcc 1560 tacatggtcc cgtccgccgt cgtggtcctg gacgagatcc ccctcacccc gaacggtaag 1620 gtcgaccgtg ctgcgctgcc ggtccccgag gtcgaggccg ggacggggta ccgcgctccg 1680 gtgagccctc gcgaggaggt cctctgcggt ctcttcgccg aggtcctcgg tgtggagcgg 1740 gtcggtgtgg atgacgactt cttcgagctc ggcggtcact ccctgctcgc gacccgtctc 1800 atctcccgtg tgcgtgccgt gctcggcgtc gaggccggtg tccgtgccct cttcgaggcc 1860 ccgaccgtgt cgcgcctgga gcgcctgctg cgtgagcgct ccggtctcgg ggtccgcgtg 1920 ccgctcgtcg cacgcgagcg caccggtcgt gagccgctgt ccttcgcgca gcagcggctc 1980 tggttcctgg aggagctgga gggtccgggt gcggcctaca acatccccat ggccctgcgg 2040 ctcgcgggtg tgctcgacgt ggaggcgctc caccaggccc tgatcgacgt gatcgcgcgc 2100 cacgagtcgc tccggacgct gatcgcccag gacgccggta cggcgtggca gcacatcctc 2160 ccggtcgacg atcctcggac gcgtccgggt ctgcctctgg tcgacatcgg tgcggatgcc 2220 ctgcaggagc gcctggacga ggcggctggt cgtccgttcg acctggcggc ggacctgccg 2280 gtgcgtgcca cggtgttccg gctcacggac aacgatcaca tcctgctcct cgtgctccac 2340 cacatcgcgg gtgacggctg gagcatgggt cccctggctc gcgacctgtc gacggcctac 2400 tcggctcgcg cagccggagc ggcttccgcg tggcgtccgc tgtcggtcca gtacgccgac 2460 tacgccgcgt ggcagcggga cgtgctgggg acggaggatg acgagtcctc ggagctctcc 2520 gcgcagctcg cgtactggcg gacgcagctg gcgtcgctcc cggcggagct cgcgctgccc 2580 accgaccggg ctcgccctgc cgtggcgacg taccggggtg gccggatcga gttcacgatc 2640 cccgctgacg tgcaccggtc gctcgcggac ctggcgcgtg cggaaggggt gacggtgttc 2700 atggtggtcc aggccgcgct ggccgcgctg ctgtcgcggc tgggtgccgg ggacgatatc 2760 ccgatcggga cgcccatcgc gggtcggacg gaccaggcga cggaggacct gatcgggttc 2820 ttcgtcaaca cgctcgtcct gcggacggac gtgagcgggg accccacctt cgcggagctg 2880 ctggcgcgtg tgcgcgccac ggacctggac gcgtacgcgc accaggatat cccgttcgag 2940 cggctggtgg aggcggtgaa cccggagcgg agcctggccc gtcacccgct cttccaggtg 3000 atgctcgcg 3009 <210> 9 <211> 5346 <212> DNA <213> Artificial Sequence <220> <223> Reprogrammed region C <400> 9 gcccgtgggt acctgggtcg tgccggtctc accgccgagc gcttcgtcgc gtgcccgttc 60 ggtgcccctg gcgagcgcat gtaccggacc ggcgacctcg tgcggtggcg cgtcgacggt 120 gccctggagt tcgtgggtcg tgccgacgac caggtcaagg tgcgcgggtt ccgcgtcgag 180 ctgggcgagg tcgagggcgc tgtggctgcc caccctgacg tcgtccgtgc ggtggtggtc 240 gtccgcgagg accgcccggg tgaccaccgc ctcgtggcct acgtcacggg tgtggacacc 300 ggtggcctct cgtccgccgt catgcgtgcg gtcgccgaac gtctcccggc gtacatggtc 360 ccgagcgcgg tggtcgtgct cgacgagatc ccgctcaccc cgaacggcaa ggtcgaccgt 420 gccgctctgc cggtcccggg tgtcgaggct ggtgccggct accgggctcc cgtgagccct 480 cgcgaggagg tcctctgtgg cctcttcgcc gaggtcctcg gcgtcgagcg cgtcggtgtc 540 gacgacgact tcttcggcct cggtggccac tcgctgctcg cgacgcggct catctcccgt 600 gtgcgtgccg tcctcggcgt ggaggccggt gtccgtgcgc tgttcgaggc cccgaccgtg 660 tcgcgcctcg agcgcctcct ccgcgagcgc agcgggctcg gtgtccgtgt cccgctcgtc 720 gcacgcgagc gcaccggtcg cgagccgctc tccttcgcgc agcagcgcct ctggttcctg 780 gaggagctgg agggacccgg tgcggcctac aacatcccca tggcgctccg gctcgctggc 840 gtgctcgacg tggaggccct ccaccaggcc ctgatcgacg tgatcgcacg gcacgagtcg 900 ctgcggacgc tcatcgctcg ggacagcgac gggaccgctc gccagcaggt cctcccggtg 960 ggtgacccgg cagctcgccc tgcgctgccg gtggtgcaga cggacgcgga cacgctggtg 1020 gccaagctca acgaggcggt gggtcggccg ttcgacctga ccgcggagat gccgctccgt 1080 gcgacggtgt tccgggtcgc ggacgaggat cacgccctcc tgctcgtctt ccaccacatc 1140 gcaggggacg ggtggagcac cggcctcctg gctcgggacc tctcgacggc ctacgccgca 1200 cgcctggagg gtcgcgaccc gcagctcccg cccctgccgg tgcagtacgc tgactacgca 1260 gcgtggcagc gggatgtgct gggcaccgaa gacgatgaga gctccgagct ctccgcgcag 1320 ctggcgtact ggcggacgca gctggcggac ctgcctgcgg agctcgcgct gcctgccgac 1380 cgcgtgcgcc ccgcacgcgc ctcctacgag ggcggtcgcg tgggcttcac ggtgccggca 1440 ggcgtgctgc gcgacctgac ccggctggct cgcgtggagg gcgtgaccgt gttcatggtg 1500 gtccaggctg ccctcgcagc gctgctgagc cgcctgggtg cgggcgatga catcccgatc 1560 gggacgccca tcgcaggccg gaccgatcag gcgacggagg acctgatcgg attcttcgtc 1620 aacaccctgg tcctgcgcac ggacgtgtcg ggcgatccga ccttcgccga gctgctcgcc 1680 cgtgtgcgtg cgaccgacct ggacgcatac gcgcaccagg atatcccgtt cgaacggctc 1740 gtcgaggccg tgaacccgga gcggtcgctg gcacggcacc cgctgttcca ggtgatgctg 1800 gcgttcgaca acaccgcgga tggcggaccg gtggaggact tcccgggtct ctcggcagcg 1860 ggtctcccgc tcggtgccgg agccgccaag ttcgacctcc tgttcggcct gtcggaggtc 1920 ggcggtgagc tccggggagc ggtcgagtac cggtgcgacc tgttcgatca ccccaccgcc 1980 gcacggatcg cggagcgcct ggtgcgggtg ctggagcggg tcgccgccga cgcgtcggta 2040 cgcctgggcg agctgcccgt ggtgagcgac gccgagcggg cctgcgtcct gacggagtgg 2100 aacgacaccg ccgtccccgg cgtgacggga acgctgtcgg cgctgttcga ggcacgggcc 2160 gcagcccggg gcgacgcgcc ggcggtcgtg tacgagggtg aagaactgtc gtaccgtgaa 2220 ctgaacacac gcgccaaccg cctcgcccat gtcctggccg agcacggcgc aggccccgag 2280 cggttcgtcg gtgtggccct gccccgcagt ccggacctcg tagtggcact gctggcggtc 2340 gtgaaatcgg gcgcggccta cgtaccgctc gaccccgagt acccggccga ccggctcgcg 2400 tacatggccg gcgacgctgc ccccgtggcg gtcctgaccc gcggggacgt cgaactcccc 2460 gggtccgtcc cgcggatcgg gctggacgac acagagatcc gcgcgacact cgccaccgcc 2520 cccggcacga accccggcac gccggtgacc gaggcccacc ccgcgtacat gatctacacc 2580 tccggatcca ccggccgccc caagggcgtc gtcgtctccc acggcgccat cgtcaaccgg 2640 ctcgcctgga tgcaggcgga gtaccgtctc gacgcgaccg atcgtgtctt gcagaagact 2700 ccggccggtt tcgacgtgtc ggtctgggag ttcttctggc cgctgctcga gggcgcggtc 2760 ctcgtgttcg cccggcccgg cggccaccgg gacgcggcgt atctggccgg actcatcgag 2820 cgcgagcgca tcaccacggc acatttcgtg ccctccatgc tgcgcgtctt cctcgaagag 2880 cccggcgcgg cactctgcac cggactgagg cgggtgatat gcagcggcga ggccctcggc 2940 acggacctgg ccgtggactt ccgcgcgaaa ctgcccgtcc ccctgcacaa tctgtacggc 3000 ccgaccgaag cggctgtcga tgtcacccac cacgcgtatg agcccgccac cggcacggcc 3060 acggtcccca ttggccgccc catctggaac atccgcacct acgtcctcga cgccgccctg 3120 cgtcctgtgc caccgggcgt gcccggcgag ctgtatctgg ccggcgccgg cctggcccgc 3180 ggctaccacg gccgcccggc actgaccgcc gagcgcttcg tcgcctgccc cttcggtgtc 3240 cccggtgagc gcatgtaccg gaccggtgac ctcgtccgct ggcgcgtcga cgggacgctg 3300 gaattcgtgg gtcgggcaga cgatcaggtc aaggtccggg gtttccgggt cgagctcggc 3360 gaggtcgagg gtgccgtggc tgcccacccg gacgtcgtcc gtgccgtggt ggtcgtgcgg 3420 gaggaccgtc ccggtgacca ccgcctcgtc gcctacgtca cggtcggtgg cgtcggtggc 3480 gacgggctgc gttcggccat ctcgggtctc gtcgccgagc gtctccctgc ctacatggtc 3540 ccctccgcgg tcgtcgtgct cgacgagatc ccgctcaccc ccaacggcaa ggtcgatcgc 3600 gcaggcctcc cggtcccggt cgtctccgtc gccggtttct gcgcaccctc cagcccgcgt 3660 gaggaagtcc tctgcggact cttcgccgaa gtcctcggcg tggaacgcgt cggcgtcgac 3720 gacggcttct tcgacctcgg tggcgactcg atcctgtcca tccagctcgt cgctcgcgct 3780 cgccgtgcag gtctcgagct gtccgtgcgg gacgtgttcg aagggcgtac cgtgcgtgct 3840 ctcgctgccg tcgtccgtgg ttccgacgct ggggcggtgg gtgtcgtcgg tggcgctgag 3900 atcgtcctcc cgggtgtcgg cgaggtcgag cgctggccgg tcgtcgagtg gctcgccgag 3960 cgtggcggtg gatccctcgg tggcgtcgtc cgtggcttca accagtcggt ggtcctggct 4020 gtcccggcag gcctggtctg ggaggagctc cgcgtcctcc tgggtgccgt ccgggaccgg 4080 cacgaggcct ggcggctccg ggtcctcgac tcgggagccc tctgcgtgga cggtgtcgtg 4140 cccgacgacg gctcctggat cgtgcggtgc gacctctcgg gcatgggtgt cgacggccag 4200 gtcgacgccg tccgtgccgc agccgtcgag gcccgtgcgt ggctcgaccc gtccgtcgga 4260 cgcgtcgtcc gtgccgtctg gctcgagcgc ggtggtgacc gttccggtgt cctcgtcctc 4320 gtcgcccacc acctcgtcgt cgacggcgtc tcctggcgcg tcgtcctcgg cgacctggcg 4380 gagggctggg cccaggtccg ctccggtggg cgtgtcgagc tcggcgtcgt cggcacctcc 4440 ctccgcggat gggctgccgc tctcgccgag cagggtcgcc gtggggagcg tgcaggcgag 4500 gtcgagctct ggtcccgcat ggtccgcggt gcggacgtgc tcgtcggctc ccgtgccgtc 4560 gacggtgccg tcgacgtctt cggtggcgtc gtctccgtcg acagccgtgc ctccgtctcc 4620 gtctcccgtg ccctcctgac cgaggtcccc agcgtgctcg gtgtgggtgt ccaggaggtc 4680 ctgctcgcag cgttcggcct cgccgtggca cgctggcggg gtcgtggcgg tcccgtggtc 4740 gtcgacgtgg agggccacgg tcggaacgag gacgccgtcc gcggtgccga cctctcgcgg 4800 acggtgggct ggttcacgag cgtctacccc gtgcgtgtcc cggtcgagtc ggcttcctgg 4860 gatgaggtcc gggcaggtgg tcccgtcgtc ggtcgggtcg tccgggaggt caaggagacg 4920 ctccgcagcc tcccggacca gggactcggc tacgggatcc tccggtacct ggacccggaa 4980 cacggacctg ccctcgctcg ccacgcgacg ccccagttcg ggttcaacta cctgggtcgg 5040 ttcacgacgg gcacggacga gacgacgacc gcggacgccc tggaccgtgc gcctgcctgg 5100 agcctgctgg cacggagcgc tgcgggtcag gacccggagc tcccggtcgc ccacgccgtg 5160 gagttcaacg ccatcaccct cgacacgccc gaaggtcccc gtctcggggt cacgtggtcc 5220 tggcccacca ccctcctccc ggagtcgcgc atccgcgagc tcgcacggta ctgggatgag 5280 gcgctcgagg gcctcgtgga gcacgctcgc cacccggagg caggtgggct gaccccgtcg 5340 gacgtc 5346 <210> 10 <211> 22017 <212> DNA <213> Artificial Sequence <220> <223> Reprogrammed dptBC gene sequence <400> 10 gtgaaccgcc ggtcgaaggt agtcgaggag atcctgcctg tctcggcgct ccaggaagga 60 ctgctgttcc acagctcctt cgccgccgcc gacggagtcg acgtgtacgc gggacagctc 120 gcgttcgacc tggtcggcgc ggtggacacc ggtcggctgc gggccgccgt cgaaagcctc 180 gtggcgcggc acggcgtcct gcgctcaagc taccgtcagg cgcgctccgg ggagtgggtc 240 gcggtcgtgg cgcggcgcgt cgcgacgcca tggcgcgccg tcgacgcccg cgacggtgcc 300 acggacgctg ccgccgtggc ccgggaggaa cgctggcgcc cgttcgacct gggccgggcc 360 ccgctggctc ggttcgtgct cgtacggacc gacgacgacc gtttccggtt cgtgatcacg 420 taccaccacg tcatcctcga cggctggtcg ctgccggtac tgctgcgcga actccttgcc 480 ctgtacggaa gcggcgccga cccgtcggtg ctgccgcccg tccgccccta cggcgacttt 540 ctccggtggg ccgccgcgcg cgacgacgcc gccgccgaaa ccgcctggcg cgacgcgctc 600 accggcctgg acgagccctc cctggtcgca cccggcgctt cccccgacgg cgtcgtgccg 660 gcctccgtcc acgccgaact cgacaaggcc ggcaccgaga acctcgccgc ctgggccagg 720 caccgcggca tcacccaggc caccgccgtc cgcgccgcgt gggccctcgt tctcggccag 780 cacaccggcc gcgacgacgt cgtgttcggc gtcaccgtct ccggacggcc cgccgaactc 840 gccggcgccg agcacatggt cggactcttc atcaacaccg tccccctgcg cacggtcctc 900 gaccccgccg acaccctcgg cacgttcgcc gctcgcctcc aggccgaaca gaccaccctc 960 ctcgaacacc agcacgtgcg gctctccgac atccagcgct gggccggaca caaagaactc 1020 ttcgacacca ttgtcgtctt cgagaactac cccatcggcc acagcggccc cggctccatc 1080 cgcaccgacg acttcaccgt caccgccacc gaaggctccg acgccaccca ctaccccctc 1140 accctcaccg ccgtacccgg cgaaaccctg cgcctcaagc tcgaccaccg ccccgacctc 1200 gtcgacacca ccaccgccac cgccctgctg cgccgcgtga cccgcgtcct ggaaaccgcc 1260 accgacgaca ccgggcacac cctcgcccgc ctcgacctcc tcgacgacga cgaacgccac 1320 cgcctgctgc gcggctggaa cgacaccacg cgcgagcagc cgcccaccta ctaccaccag 1380 gaattcgagg aacaggcgcg gaggcggccc cacgacacgg cccttgtctt caccagcacc 1440 tcctggacgt acgaagaact caacgaccgc gccaaccggc tcgcccgcct gctcgtcgcc 1500 gccggcgccg gctccgacga cttcgtcgcg ctcgccttcc cccgttccgc ggaatccgtc 1560 gtcgccatcc tcgccgtact caaagcgggc gccgcctacc tgccgctcga catggaccag 1620 cccgccgaac ggctcaccgg catcctcgcc gacgcacacc cgaccgtcgt cctcacgacc 1680 accaccgcca ccccgctgcc gcaccccggc cgcaccctcg tcctcgacag ccccaccacc 1740 gcccgcgccc tcgctgcggc acccgcacac aacctcaccg acgccgaccg ccgtaccccg 1800 ctcaacgccc gcaacgccgc ctacatcatc cacacctccg gctccaccgg acgccccaag 1860 ggcgtcgtca tcgaacaccg cagtctcgcc aacctcttcc acgaccatcg gcgcgccctc 1920 atagaacccc atgccgccgg aggatcacgg ctcaaggccg gcctcaccgc ctccctctcc 1980 ttcgacacct cctgggaagg tctgatctgc ctggccgccg gccacgaact gcaccttatt 2040 gacgacgaca cccgccgaga cgccgaacgc gtcgccgaac tcatcgaccg gcagcgcatc 2100 gacgtcatcg acgtcacccc ctccttcgcc cagcaactcg tagagaccgg aatcctcgac 2160 gagggccgcc accaccccgc cgccttcatg ctcggcggtg aaggcgtcga cgcgaaactc 2220 tggaccaggc tctccgacgt ccccggcgtc acctcgtaca actactacgg ccccaccgaa 2280 ttcaccgtcg acgccctcgc ctgcacggtc ggcatcgcac cccgccccgt catcggccac 2340 cccctcgaca acacggccgc ctacatcctc gacggcttcc tgcgtcccgt acccgaaggc 2400 gtcgccggcg agctctacct cgccggcacc cagctcgccc gcggctacgc cggccggccc 2460 ggcctgacgg ccgaacgctt cgtggcctgc cccttcggcg cgccgggcga acgcatgtac 2520 cgcaccggcg acctcgtccg gcgcagtccc ggcggcgtgg tcgaatacct cggacgcgtg 2580 gacgatcaga tcaaactccg cggcttccgc atcgaacccg ccgagatcga gctcgccctg 2640 gccggccacc ccgccgtcgc ccagaacgtc gtcctcctgc accgctccgc caccggagag 2700 gctcgcctcg tggcgtacgt cgtccccggc acacccgtcg acccgcggga actcaccggg 2760 cacctcgccg cccggctgcc cgcgtacatg gtgccctcgg ctttcgttct cctcgacacc 2820 ctcccgctca cccccaacgg caaactggac cgcggcgccc tgccggagcc cgccttcggt 2880 accgcgcccc gccccgagcg cccccgcaca cccgtcgagg agatcctctg cggcctgtac 2940 gccgacgtgc tcgggcttcc ctcgttcggc gccgacgacg acttcttcga cgccggcggg 3000 cactcgctgc tggccagcaa actcgtcagc cgtatccgta cgaacctgaa aaccgaactc 3060 aacgtccgcg ccctcttcga gcaccgcacg gtctcctccc tggccaccgc cctccaccgg 3120 gccgcgcagg ccggccccgc gctcaccgcc ggaccgcgcc ccgcacggat cccgctgtcg 3180 tacgcccagc gccgcctgtg gttcctcaac cggctcgacc gcgacagcgc cgcgtacaac 3240 atgcccgtcg cactccgcct gcgtggcccc ctggacagca ccgccatgtg cgccgcactc 3300 accgacgtcg ccgaacgcca cgaggcgctg cgcaccgtgt tcgaggagga ccgggacggt 3360 gcccaccaga tcgtgctgcc cgcgaccggc ctcggccctc tgctcaccgt gaccggggcc 3420 gacgggacga ccctgcgtgc cctcatcacc gagttcgtac gcaggccctt cgacctggcg 3480 gcggagatcc ccttccgcgc cgcactgttc cgcgtcggcg acgaggaaca tgtactggtc 3540 gtcgtcctgc accacatcgc cggggacggc tggtccatgg gaccgctcgc acgcgacgtg 3600 gccgaggcct accgggcgcg ggcggccggg agggcacccg actgggaacc gctgcccgtg 3660 cagtacgccg actacgcgct ctggcagcgg gaggtgctgg gcgcggagga cgacgagacc 3720 ggcgaactct ccgcccaact cgcccactgg cgcacccgcc tcgcaggggc ccccgcagaa 3780 ctcacgctgc ccaccgaccg cccacgcccc gctgtcgcct ccaccgccgg agaccgcgtc 3840 gaattcaccg tgcccgccgg actccaccag gccctcgccg acctggcacg ggcccacggc 3900 gcgacggtct tcatggtcgt ccaggccgcc ctcgccgtcc tgctgtcacg tctcggcgcc 3960 ggcgacgaca tccccatcgg caccccggtc gccggccgca ccgacgaggc cacggaggaa 4020 ctgatcgggt tcttcgtcaa cacgctggtg ctgcgcaccg acgtgtccgg cgacccgacg 4080 ttcgccgaac tcctcgcgcg ggtgcgggcc accgacctcg acgcgtacgc acaccaggac 4140 gtgccattcg aacgtctggt cgaggtgttg aacccggagc ggtcactggc acggcatcca 4200 ctgttccagg tcatgctgac gttcaacgtc ccggacatgg acggggtcgg aagcgcgctg 4260 gggaatctgg gggaactgga ggtctccggt gaggccatcc ggacggatca gaccaaggtg 4320 gatctcgctt tcacgtgcac ggagatgtac gccgcggacg gtgcggcctc gggaatgcgc 4380 ggggtgctgg aataccggct tgatgtgttc ggtgcggtac aggcccggga aacgacggag 4440 cggttggtgc gggtgttgga gggtgtggtt tctggtgggg gtggggtgtc tgtgtcgggg 4500 gttgatgtgt tgggtgtggg tgagcgggag aggttgttgg ggtggggtgt gggtgggccg 4560 gtgcctgtgg tgccgggtgg tgggttggtg gggttgttcg aggagcgggt gcgggccgac 4620 gcggacgcgg tggccgtgcg tggcgcgggg gtggtgtgga gttatgggga gttgaatgcg 4680 cgggtgaatg tggtggcgcg gtggttggtg ggtcggggtg tgggggcgga gtgtggtgtg 4740 ggtgtggtga tgggccgcgg ggtggatgtg gtggtgatgt tgctggcggt ggcgaaggcg 4800 ggtgggtttt atgtgccggt ggatccggag tggccggtgg agcgggtggg gtgggtgctg 4860 gcggatgccg gggtggggct ggttgtggtg ggggaggggt tgtcgcatgt ggtgggggat 4920 tttcctgggg gtgaggtttt cgagttttcg cgggttgttc gtgagtcgtg tcttgtggag 4980 ttggtggctg cggatggggt tgaggttcgg aatgtgacgg atggtgagcg ggcgtcgcgt 5040 ctgttgccgg ggcatccgtt gtatgtggtt tatacgtcgg gttcgacggg gcggccgaag 5100 ggtgttgtgg tgacgcatgc ttcggtgggt gggtatttgg cgcgtggtcg ggatgtgtat 5160 gcgggtgccg ttggtggtgt ggggtttgtg cattcgtcgc ttgcgttcga tctgacggtg 5220 acggttctgt tcacgccttt ggtgtctggc ggttgtgttg tgttgggtga gttggacgag 5280 tcggcgcagg gggtgggtgc ctcgttcgtg aaggtgactc cgtcgcatct gggtttgctg 5340 ggtgagctgg agggtgtggt ggcggggaac ggcatgctgc tggtgggggg tgaggcgttg 5400 tcgggtggtg cgctgcgtga gtggcgtgag cgtaatccgg gtgtggtggt ggtgaatgct 5460 tatggtccga cggagctgac ggtgaactgt gccgagttcc ttatcgcgcc tggtgaggag 5520 gttccggatg ggcctgtgcc gatcgggcgt cctttcgcgg gtcagcggat gtttgttctg 5580 gatgcggcgc tgcgggtcgt cccggtgggt gtcgtcggtg agctgtacgt ggccggtgtc 5640 ggtctcgcac gggggtacct cggtcgtgcc ggtctcacgg ccgagcggtt cgtggcgtgc 5700 ccgttcggtg cgccgggtga gcgtatgtac cgtacggggg atctggtgcg gtggcgggtg 5760 gacggcgccc tggagttcgt gggtcgtgcg gacgaccagg tcaaggtgcg tggcttccgg 5820 gtcgagttgg gtgaggtcga gggtgccgtg gcagcccacc cggacgtggt gcgtgcggtc 5880 gtggtcgtcc gggaagaccg tcccggtgac caccgcctgg tggcgtacgt gacgggtgtc 5940 gacaccggtg gcctcagcag cgcggtcatg cgtgcggtcg cggagcgtct ccctgcctac 6000 atggtcccga gcgccgtggt cgtgctggac gagatcccgc tgaccccgaa cgggaaggtg 6060 gaccgggcgg cgcttccggt gccgggggtg gaggcgggcg cgggctaccg ggcgcctgtt 6120 agcccgcgtg aggaagtcct gtgcggtctc ttcgccgaag tgctcgggct ggagcgggtg 6180 ggggtggacg atgatttctt cgggttgggt ggtcactcgc tgctggcgac gcgtctgatc 6240 tcgcgtgtcc gtgcggtgct cggtgtggag gcgggtgtgc gtgcgctctt cgaggcgccg 6300 acggtgagcc gtctggagcg gctgctgcgg gagcggagcg ctctcggggt gcgggtgccg 6360 ctggtggcac gggagcggac gggtcgggag ccgctgagct tcgctcagca gcgtctgtgg 6420 ttcctggagg agctggaggg tcccggtgct gcgtacaaca tcccgatggc gctgcgtctg 6480 gccggtgtgc tggacgtcga ggcgctgcac caggcgctca tcgacgtcat cgctcgccac 6540 gagagcctcc gcaccctcat cgcgcaggat gcgggtacgg cctggcagca catcctgccc 6600 gtggacgacc ctcgcacccg tcccggtctc cctctggtgg acatcggtgc cgacgccctg 6660 caggagcggc tcgacgaggc cgctggtcgg cccttcgacc tcgctgccga cctcccggtc 6720 cgtgccacgg tcttccgcct caccgacaac gaccacatcc tcctggtcgt ggcccaccac 6780 gtggccttcg acgcgatgtc ccgtgtgccg ttcatccgga acgtcaagcg cgccttcgag 6840 gcccgtacga acggcgcagc ccccgactgg cgtccgctgc ccgtgcagta cgcggactac 6900 gcggcctggc agcgcgacgt gctcggcacg gaggacgacg agtcgagcga gctgtcggcc 6960 cagctcgcct actggcgcac ccagctagcc tcgctgcctg ccgagctggc gctcccgacg 7020 gaccgtgccc gtcccgccgt cgcctcgtac gaaggcggca aggtcgagtt caccgtcccc 7080 gctggtgtgt acgacggcct ggtggctctc gcccgtgccg agggtgtcac ggtcttcatg 7140 gtcgtgcagg cggcgctggc cgcgctcctc tcccggctgg gtgccggcga cgacatcccg 7200 atcgggacgc cgatcgccgg ccgcaccgac caggccaccg aagatctcat cggcttcttc 7260 gtgaacaccc tcgtcctccg cacggacgtc agcggtgacc cgaccttcgc ggagctgctg 7320 gcccgcgtcc gggccaccga cctcgacgcc tacgcccacc aggacatccc cttcgaacga 7380 ctggtcgaag cggtcaaccc cgagcgctcc ctcgcccgcc accccctctt ccaggtcatg 7440 ctgaccttcg acaacacgat tgaccgtgag gtcacggagg gcttcgcggg cctcggggtg 7500 gaaggcctgc cgctgggtgc gggagcggtc aaattcgatc tgctcttcgg tctctccgag 7560 gtgggcggcg agctgcgcgg agccgtggag taccgctgcg atctcttcga ccacccgacg 7620 gtggcgcagc tcgcggagcg cctggtgcgg gtactggagc gcgtggcttc cgacgcttcg 7680 gtacgcacgg gtgaactgcc ggtcgtcggc gaggcggagc gcgcccgtgt cctgacggag 7740 tggaatgaca cgggcgtccc cggtgtgccg gaaacattcc tggagttgtt cgaggcgcag 7800 gtcgcggccc ggggtgacgc gccggcggtc gtgtacgagg gtgaggttct gtcgtaccgg 7860 gaactcgacg cgcgggcgaa ccgcctggcc gggctgctgg tggggcgcgg tgcgggcccg 7920 gagcatttcg tgggggtggc gctgccgcgt gggctggatc tgatcgtggc cctgctggcc 7980 gtgctcaagt ccggtgccgc gtacgttccc ctggacccgg agtacccggc cgagcggctg 8040 gtccacatgg tcaccgacgc cgcccccgtc gtggtcgtga cctccaccga cgtacgtact 8100 ctgcggaccg ttccccgggt cgagctggac gacgaggcga cccgcgccac cctggtcgca 8160 gcccccgcca cagggcccga cgtgaagatg tccgcctccc accccgcgta cgtgatctac 8220 acctccgggt ccacgggccg ccccaagggc gtcgtcatca gccacggcag cctggccaac 8280 ttcctcgcct gggcgcggga agacctgggt gccgagcggc tccggcacgt cgtgttgtcc 8340 acgtccctca gcttcgacgt ctccgtggtc gaactcttcg ccccgctgtc ctgcggcggc 8400 accgtcgaga tcgtccggaa tctgctggcc ctcgtcgacc gccccggccg atggtccgcg 8460 agcctggtca gcggcgtgcc gtcggccttc gcgcagctgc tggaagccgg cctcgaccgg 8520 gccgacgtgg gcatgatcgc cctggccggc gaggcgctgt ccgctcgcga cgtgcgccgc 8580 gtccgcgctg tgctgcccgg ggcccgcgtg gccaacttct acggcccgac cgaagccacc 8640 gtctacgcca cggcctggta cggcgacacc cccatggacg ccgcggcccc catgggccgg 8700 cccctgcgca acacgtgtgt gtatgtgctg gacgacgggc tgcgcgtggt gccggtcggt 8760 gtggtgggtg agctgtatgt ggcgggtgtg ggtctggcgc ggggctatct cgggcgtgtg 8820 ggtctgacgg cggagcggtt tgtggcgtgt ccgttcggtg cgcggggtga gcgtatgtat 8880 cgcacggggg atttggtgcg gtggcgggtg gacggcacgc ttgagtttgt tggtcgtgcg 8940 gatgatcagg tgaaggtccg tggtttccgt gtggagttgg gtgaggtgga gggtgctgtt 9000 gcggcgcatc ctgatgtggt gcgtgcggtt gttgtggtgc gtgaggaccg gccgggtgat 9060 caccggttgg ttgcgtatgt caccggtgtt gacacgggtg gactgtcctc tgcggtgatg 9120 cgtgccgttg ctgagcgtct gcctgcgtac atggtgccgt cggcggtggt ggttctggat 9180 gagatcccgt tgacgccgaa cgggaaggtg gaccgggcgg gtcttccggt gccggtggtg 9240 tcggtggcgg ggttctgtgc gccgtcgtcg ccgcgggagg aggtgttgtg tggtctgttc 9300 gcggaggtgc tgggtgttga gcgggtgggg gtggacgatg ggttcttcga tctgggcggg 9360 gacagcattc tgtcgattca gttggtggcg cgggctcgtc gggcgggtct ggagttgtcg 9420 gttcgggatg ttttcgaggg ccgtacggta cgtgctctgg cggctgtggt gcgtggttcg 9480 gacgctgggg cggttggtgt ggtggggggt gctgagattg tgctgccggg tgtgggtgag 9540 gtggagcggt ggccggtggt ggagtggctg gcggagcgtg gtggggggtc gctgggtggt 9600 gtggttcggg gtttcaatca gtctgttgtg cttgctgtgc ctgctgggtt ggtgtgggag 9660 gagttgcggg tgttgttggg tgcggtgcgg gatcggcatg aggcgtggcg gttgcgggtg 9720 ctggattccg gggcgttgtg tgttgatggt gttgttccgg atgacgggtc gtggattgtc 9780 cggtgtgacc tgagcggtat gggtgtggat ggtcaggtgg atgctgtgcg ggctgcggct 9840 gtggaggcgc gtgcgtggct ggatccgtcg gtgggccggg tggtgcgggc ggtgtggctg 9900 gagcgtggtg gtgatcgttc gggggtgttg gtgctggtgg cgcatcacct ggtggtggac 9960 ggtgtgtcgt ggcgggtggt gctgggggat ctggcggagg ggtgggcgca ggtgcgttcg 10020 ggtggccgtg tggagttggg tgtggtgggg acgtcgttgc ggggttgggc ggcggcgttg 10080 gcggagcagg gccggcgggg cgagcgtgcg ggggaggtgg agttgtggtc gcggatggtt 10140 cggggtgcgg atgttctggt ggggtcgcgt gctgtggatg gtgcggtgga tgttttcggc 10200 ggggtggtgt cggttgattc gcgggcgtcg gtgtcggtgt cgcgtgcgtt gctgacggag 10260 gtgccgtcgg ttctgggtgt tggtgtgcag gaggtgttgc tggcggcatt cgggctggcg 10320 gtcgcgcggt ggcgcggccg gggtgggccg gttgtggtgg atgttgaggg gcacgggcgt 10380 aatgaggacg ctgtgcgggg tgctgatctg tctcgtactg tcggttggtt caccagtgtg 10440 tatccggtcc gtgtgccggt ggagtccgct tcgtgggacg aggtgcgtgc gggtggtccg 10500 gtggtgggcc gtgtggtgcg tgaggtgaag gagactctgc gttcgctgcc tgaccagggt 10560 ctgggttatg gcatcctgcg ctatctcgat cccgagcacg gtcctgctct ggcccggcat 10620 gccaccccgc agttcggttt caactacctc ggccgcttca ccaccggaac cgacgacacc 10680 ggtgacgagg ggatgacgga ctgggtcccc gtgtcagggc cgttcgcggt gggagccggc 10740 caggaccccg aactgcccgt ggcgcacgcg gtcgagttca acgcgatcac gctggacacc 10800 ccggagggcc cgcgcctggg cgtgacatgg tcgtggccga cgacgctgct gccggagtcc 10860 cggatacggg agctggcccg ctactgggac gaggccctgg aagggctggt cgaacacgcc 10920 cggcaccccg aagccggcgg cctcacgccg tccgacgtga cgctggtgga agtgaaccag 10980 gtggagctcg accgtctgca ggcgggggtc gccggtggtg cggaggagat tctgccggtg 11040 tcggccctgc aagaggggct gctgttccac agcgcgttgg cctctggtgg ggtggacgtg 11100 tatgtggggc agctggtgtt cgatctggtc ggtccggtgg acgtcgaccg gctgcgcgcg 11160 gctgtcgaag gtctggtggc gcggcacggg gtgctgcggt cgggataccg ccaactgcgg 11220 tcgggcgaat gggttgcggt cgtcgcacga caggtggatc tgccgtggca gtccatcgac 11280 gtgcgcgacg gcggtatcga cgggttggtg gaagaggagc gctggcgccg gttcgacatg 11340 ggccggggtc cactggcgcg cttcgtgctc atccggacgc acgacgatcg tttccggttc 11400 gtcatcacgt accaccacgt cgtcctcgac ggctggtccg tcccggtgct gctgcgtgag 11460 ctgctggccc tgtacggcag ctcgggggac gtatcggttc tgccgggggt ccgctcgtac 11520 ggcgatttcc tgcgatgggt cgccgcgcga gacgccgcag ccgccgaagg cgcatggcgg 11580 cgggcgctga cgggcctgga ggagccgtcg ctcgtcgcgc caggcgtttc ccgagacggg 11640 gtcgtcccgg cggcgttcca cggtgcggtc gacggcgacc tctcgcagaa gatcgtggcg 11700 tgggcgcgcg ggcgtggtgt gacggttgcg tcggtggtac aggcggcgtg ggccttggtg 11760 ctggggcggt tgatgggtcg ggacgatgtg gtgttcgggg tgacggtgtc gggtcggcct 11820 gccgaggtgg tgggtgtgga ggacatggtc ggtctgttcg tgaacaccat tccgttgcgg 11880 gcgcggctgg atccggcgga gtcgctgggt ggtttcgtgg agcggctgca gcgggagcag 11940 acggagctgc tggagcatca gcatgtccgg ctggcggaag tccagcggtg ggccgggcac 12000 aaggaactct tcgatgtcgg aatggtcttc gacaactacc cggtttcttc tgaatccccg 12060 gaagcggaat tccagatctc acgaacaggc ggatacaacg gaacccacta cgcactgaac 12120 ctcgttgctt ccatgcacgg cctggagctg gaactggaaa tcggttatcg gccggatgtg 12180 tttgatgcgg gtcgggtgcg tgaggtgtgg ggatggctgg tccgggtcct cgagggcgtc 12240 gtcagcggcg gtggcggtgt ctccgtgagc ggtgtggatg tcctcggtgt cggcgagcgc 12300 gaacggttgc tcggttgggg cgtcggcgga ccggtcccgg tcgtgcccgg aggcggtctc 12360 gtcggcctgt tcgaagagcg cgtccgtgcg gacgccgatg ccgtcgccgt ccgtggtgca 12420 ggcgtcgtct ggtcctacgg cgagctcaac gcccgggtca acgtggtcgc ccgctggctc 12480 gtcggacgcg gcgtcggtgc cgagtgcggt gtcggcgtcg tcatgggtcg cggtgtcgac 12540 gtggtcgtca tgctgctcgc cgtcgccaag gccggtggct tctacgtgcc cgtcgacccc 12600 gagtggcccg tcgagcgcgt cggctgggtc ctcgccgacg ccggtgtcgg cctcgtggtc 12660 gtcggtgagg gcctctccca cgtcgtgggt gacttccccg gtggcgaggt gttcgaattc 12720 tcccgcgtgg tgcgcgagtc ctgcctggtc gagctcgtcg cggctgacgg tgtcgaggtg 12780 cgcaacgtca ccgacggcga gcgcgcctcc cgtctcctcc ccggtcaccc cctctacgtc 12840 gtgtacacct ccgggtccac gggtcgtccc aagggcgtcg tcgtcaccca cgcctcggtc 12900 ggcggttacc tggcccgtgg ccgggacgtc tacgcaggcg ccgtgggcgg tgtcgggttc 12960 gtccactcgt ccctcgcctt cgacctgacc gtcaccgtgc tcttcacccc gttggtctcg 13020 ggtggctgcg tggtgctggg cgagctcgac gagtccgccc agggtgtcgg ggcctccttc 13080 gtcaaggtca ccccgtccca cctcggtctc ctcggcgagc tcgagggcgt cgtcgccggt 13140 aacgggatgc tcctcgtcgg tggcgaggcc ctctccggtg gggctctccg cgagtggcgc 13200 gagcgcaacc ccggtgtcgt ggtcgtcaac gcctacggtc ccaccgagct caccgtcaac 13260 tgcgcggagt tcctgatcgc ccctggcgag gaggtgcccg acggcccggt cccgatcggt 13320 cgcccgttcg ctggccagcg gatgttcgtg ctcgacgcgg ccctgcgcgt cgtcccggtg 13380 ggcgtcgtgg gcgagctcta cgtcgccggt gtcggcctcg ctcggggtta cctgggtcgc 13440 gtcggtctca ccgccgagcg cttcgtcgcc tgcccgttcg gcgtgcccgg cgaacgcatg 13500 taccggacgg gtgacctggt ccgttggcgc gtcgacggtg cgctggagtt cgtcggtcgc 13560 gccgacgacc aggtcaaggt gcgcggtttc cgcgtcgagc tcggcgaggt cgagggtgcg 13620 gtcgctgcgc acccggacgt ggtccgtgcc gtggtggtcg tccgggagga tcgtcccggt 13680 gaccaccgct tggtcgccta cgtcaccgct ggtggcgtgg gtggtgacgg cctgcggtcg 13740 gccatctccg gtctcgtggc cgagcgcctc cctgcctaca tggtcccgtc cgccgtcgtg 13800 gtcctggacg agatccccct caccccgaac ggtaaggtcg accgtgctgc gctgccggtc 13860 cccgaggtcg aggccgggac ggggtaccgc gctccggtga gccctcgcga ggaggtcctc 13920 tgcggtctct tcgccgaggt cctcggtgtg gagcgggtcg gtgtggatga cgacttcttc 13980 gagctcggcg gtcactccct gctcgcgacc cgtctcatct cccgtgtgcg tgccgtgctc 14040 ggcgtcgagg ccggtgtccg tgccctcttc gaggccccga ccgtgtcgcg cctggagcgc 14100 ctgctgcgtg agcgctccgg tctcggggtc cgcgtgccgc tcgtcgcacg cgagcgcacc 14160 ggtcgtgagc cgctgtcctt cgcgcagcag cggctctggt tcctggagga gctggagggt 14220 ccgggtgcgg cctacaacat ccccatggcc ctgcggctcg cgggtgtgct cgacgtggag 14280 gcgctccacc aggccctgat cgacgtgatc gcgcgccacg agtcgctccg gacgctgatc 14340 gcccaggacg ccggtacggc gtggcagcac atcctcccgg tcgacgatcc tcggacgcgt 14400 ccgggtctgc ctctggtcga catcggtgcg gatgccctgc aggagcgcct ggacgaggcg 14460 gctggtcgtc cgttcgacct ggcggcggac ctgccggtgc gtgccacggt gttccggctc 14520 acggacaacg atcacatcct gctcctcgtg ctccaccaca tcgcgggtga cggctggagc 14580 atgggtcccc tggctcgcga cctgtcgacg gcctactcgg ctcgcgcagc cggagcggct 14640 tccgcgtggc gtccgctgtc ggtccagtac gccgactacg ccgcgtggca gcgggacgtg 14700 ctggggacgg aggatgacga gtcctcggag ctctccgcgc agctcgcgta ctggcggacg 14760 cagctggcgt cgctcccggc ggagctcgcg ctgcccaccg accgggctcg ccctgccgtg 14820 gcgacgtacc ggggtggccg gatcgagttc acgatccccg ctgacgtgca ccggtcgctc 14880 gcggacctgg cgcgtgcgga aggggtgacg gtgttcatgg tggtccaggc cgcgctggcc 14940 gcgctgctgt cgcggctggg tgccggggac gatatcccga tcgggacgcc catcgcgggt 15000 cggacggacc aggcgacgga ggacctgatc gggttcttcg tcaacacgct cgtcctgcgg 15060 acggacgtga gcggggaccc caccttcgcg gagctgctgg cgcgtgtgcg cgccacggac 15120 ctggacgcgt acgcgcacca ggatatcccg ttcgagcggc tggtggaggc ggtgaacccg 15180 gagcggagcc tggcccgtca cccgctcttc caggtgatgc tcgcgttcaa caacgccgag 15240 acgagcaccc cgctgcccat ggccgaaggc ctggctgcct cccggcagga catcgaaccg 15300 ggcgtggcga aattcgatct ggccctgtat tgcaacgaat cccgcggtga gacgggcgac 15360 caccagggca tcagaagtgt cttcgagtac cgccgcgacc tgtgggacga ggacaccgtg 15420 cggcagctcg ccgaccggtt cctgcatgtt ctcgctgctt ttgcggcagc cccggagcaa 15480 cgtgcgagca gcgtcgacgt gctccgggcg ggcgagcgcg accaactgct gcacgagtgg 15540 aacgacacgg ctgccgctct ccccccggca ctgctgcccc agctgttcga ggagcaggtg 15600 cggcgcaccc cgcacgatgt cgctctcgtc tcggggaaca tccggctcac gtacgcggag 15660 ctggacgcgc gcgcgaaccg cctggcccac ttgctgctcg cccggggcgc ggcccccgag 15720 acgttcgtcg cggtggccct gccccggacc gaagagctcc tggtggccct gctggccgta 15780 cagaaaacag gtgccggaca tctgccgctg gatcccggct tcccggccga gcggctcagc 15840 tacatgctgg atgacgcccg ccctgcggtg gtcctcacca cggaggacat cagcgcccgc 15900 atacccggcg gaagccatgt ggtactcgac tccgagcagg tgaccggcga gctccacgac 15960 cacccggcca cgtcccccgc cggccggggc aaccccgccg gcccggcgta cgtgatctac 16020 acctccggat ccaccggcca gcccaagggc gtcgtcgtac cgtcggccgc cctggtgaac 16080 ttcctggccg acatggtgcc caggctcggg ctccgcggtg gcgaccgcct gctgtccgtg 16140 accaccgtgg gcttcgacat cgcggccctc gagctcttcg tcccgctact gagcggcgcc 16200 accgtcgtcc tcgcggacgg ggagacggtc cgcgacccgg cgctggcccg ccagacgtgc 16260 gaggaccacg gcgtcaccat ggtccaggcg acaccgagct ggtggcacgg catgctcgcc 16320 gacgcgggcg acagcctgcg cggcgtgcac gccgtcgtgg gcggtgaggc cctgagcccc 16380 gggttgcgcg acgcgctgac acgaggcgcg cggtccgtca cgaacatgta cggcccgacg 16440 gagacgacca tctggtccac cagcgccggg caggccgccg gggacagcgc tcccccttcg 16500 atcggcacac ccatcctcaa cactcgcgtg tatgtgctcg acgctgcttt gtgtgtcgtg 16560 ccaccgggcg tcgcaggcga gctgtacatc gcgggcgacg gcctcgcccg tgggtacctg 16620 ggtcgtgccg gtctcaccgc cgagcgcttc gtcgcgtgcc cgttcggtgc ccctggcgag 16680 cgcatgtacc ggaccggcga cctcgtgcgg tggcgcgtcg acggtgccct ggagttcgtg 16740 ggtcgtgccg acgaccaggt caaggtgcgc gggttccgcg tcgagctggg cgaggtcgag 16800 ggcgctgtgg ctgcccaccc tgacgtcgtc cgtgcggtgg tggtcgtccg cgaggaccgc 16860 ccgggtgacc accgcctcgt ggcctacgtc acgggtgtgg acaccggtgg cctctcgtcc 16920 gccgtcatgc gtgcggtcgc cgaacgtctc ccggcgtaca tggtcccgag cgcggtggtc 16980 gtgctcgacg agatcccgct caccccgaac ggcaaggtcg accgtgccgc tctgccggtc 17040 ccgggtgtcg aggctggtgc cggctaccgg gctcccgtga gccctcgcga ggaggtcctc 17100 tgtggcctct tcgccgaggt cctcggcgtc gagcgcgtcg gtgtcgacga cgacttcttc 17160 ggcctcggtg gccactcgct gctcgcgacg cggctcatct cccgtgtgcg tgccgtcctc 17220 ggcgtggagg ccggtgtccg tgcgctgttc gaggccccga ccgtgtcgcg cctcgagcgc 17280 ctcctccgcg agcgcagcgg gctcggtgtc cgtgtcccgc tcgtcgcacg cgagcgcacc 17340 ggtcgcgagc cgctctcctt cgcgcagcag cgcctctggt tcctggagga gctggaggga 17400 cccggtgcgg cctacaacat ccccatggcg ctccggctcg ctggcgtgct cgacgtggag 17460 gccctccacc aggccctgat cgacgtgatc gcacggcacg agtcgctgcg gacgctcatc 17520 gctcgggaca gcgacgggac cgctcgccag caggtcctcc cggtgggtga cccggcagct 17580 cgccctgcgc tgccggtggt gcagacggac gcggacacgc tggtggccaa gctcaacgag 17640 gcggtgggtc ggccgttcga cctgaccgcg gagatgccgc tccgtgcgac ggtgttccgg 17700 gtcgcggacg aggatcacgc cctcctgctc gtcttccacc acatcgcagg ggacgggtgg 17760 agcaccggcc tcctggctcg ggacctctcg acggcctacg ccgcacgcct ggagggtcgc 17820 gacccgcagc tcccgcccct gccggtgcag tacgctgact acgcagcgtg gcagcgggat 17880 gtgctgggca ccgaagacga tgagagctcc gagctctccg cgcagctggc gtactggcgg 17940 acgcagctgg cggacctgcc tgcggagctc gcgctgcctg ccgaccgcgt gcgccccgca 18000 cgcgcctcct acgagggcgg tcgcgtgggc ttcacggtgc cggcaggcgt gctgcgcgac 18060 ctgacccggc tggctcgcgt ggagggcgtg accgtgttca tggtggtcca ggctgccctc 18120 gcagcgctgc tgagccgcct gggtgcgggc gatgacatcc cgatcgggac gcccatcgca 18180 ggccggaccg atcaggcgac ggaggacctg atcggattct tcgtcaacac cctggtcctg 18240 cgcacggacg tgtcgggcga tccgaccttc gccgagctgc tcgcccgtgt gcgtgcgacc 18300 gacctggacg catacgcgca ccaggatatc ccgttcgaac ggctcgtcga ggccgtgaac 18360 ccggagcggt cgctggcacg gcacccgctg ttccaggtga tgctggcgtt cgacaacacc 18420 gcggatggcg gaccggtgga ggacttcccg ggtctctcgg cagcgggtct cccgctcggt 18480 gccggagccg ccaagttcga cctcctgttc ggcctgtcgg aggtcggcgg tgagctccgg 18540 ggagcggtcg agtaccggtg cgacctgttc gatcacccca ccgccgcacg gatcgcggag 18600 cgcctggtgc gggtgctgga gcgggtcgcc gccgacgcgt cggtacgcct gggcgagctg 18660 cccgtggtga gcgacgccga gcgggcctgc gtcctgacgg agtggaacga caccgccgtc 18720 cccggcgtga cgggaacgct gtcggcgctg ttcgaggcac gggccgcagc ccggggcgac 18780 gcgccggcgg tcgtgtacga gggtgaagaa ctgtcgtacc gtgaactgaa cacacgcgcc 18840 aaccgcctcg cccatgtcct ggccgagcac ggcgcaggcc ccgagcggtt cgtcggtgtg 18900 gccctgcccc gcagtccgga cctcgtagtg gcactgctgg cggtcgtgaa atcgggcgcg 18960 gcctacgtac cgctcgaccc cgagtacccg gccgaccggc tcgcgtacat ggccggcgac 19020 gctgcccccg tggcggtcct gacccgcggg gacgtcgaac tccccgggtc cgtcccgcgg 19080 atcgggctgg acgacacaga gatccgcgcg acactcgcca ccgcccccgg cacgaacccc 19140 ggcacgccgg tgaccgaggc ccaccccgcg tacatgatct acacctccgg atccaccggc 19200 cgccccaagg gcgtcgtcgt ctcccacggc gccatcgtca accggctcgc ctggatgcag 19260 gcggagtacc gtctcgacgc gaccgatcgt gtcttgcaga agactccggc cggtttcgac 19320 gtgtcggtct gggagttctt ctggccgctg ctcgagggcg cggtcctcgt gttcgcccgg 19380 cccggcggcc accgggacgc ggcgtatctg gccggactca tcgagcgcga gcgcatcacc 19440 acggcacatt tcgtgccctc catgctgcgc gtcttcctcg aagagcccgg cgcggcactc 19500 tgcaccggac tgaggcgggt gatatgcagc ggcgaggccc tcggcacgga cctggccgtg 19560 gacttccgcg cgaaactgcc cgtccccctg cacaatctgt acggcccgac cgaagcggct 19620 gtcgatgtca cccaccacgc gtatgagccc gccaccggca cggccacggt ccccattggc 19680 cgccccatct ggaacatccg cacctacgtc ctcgacgccg ccctgcgtcc tgtgccaccg 19740 ggcgtgcccg gcgagctgta tctggccggc gccggcctgg cccgcggcta ccacggccgc 19800 ccggcactga ccgccgagcg cttcgtcgcc tgccccttcg gtgtccccgg tgagcgcatg 19860 taccggaccg gtgacctcgt ccgctggcgc gtcgacggga cgctggaatt cgtgggtcgg 19920 gcagacgatc aggtcaaggt ccggggtttc cgggtcgagc tcggcgaggt cgagggtgcc 19980 gtggctgccc acccggacgt cgtccgtgcc gtggtggtcg tgcgggagga ccgtcccggt 20040 gaccaccgcc tcgtcgccta cgtcacggtc ggtggcgtcg gtggcgacgg gctgcgttcg 20100 gccatctcgg gtctcgtcgc cgagcgtctc cctgcctaca tggtcccctc cgcggtcgtc 20160 gtgctcgacg agatcccgct cacccccaac ggcaaggtcg atcgcgcagg cctcccggtc 20220 ccggtcgtct ccgtcgccgg tttctgcgca ccctccagcc cgcgtgagga agtcctctgc 20280 ggactcttcg ccgaagtcct cggcgtggaa cgcgtcggcg tcgacgacgg cttcttcgac 20340 ctcggtggcg actcgatcct gtccatccag ctcgtcgctc gcgctcgccg tgcaggtctc 20400 gagctgtccg tgcgggacgt gttcgaaggg cgtaccgtgc gtgctctcgc tgccgtcgtc 20460 cgtggttccg acgctggggc ggtgggtgtc gtcggtggcg ctgagatcgt cctcccgggt 20520 gtcggcgagg tcgagcgctg gccggtcgtc gagtggctcg ccgagcgtgg cggtggatcc 20580 ctcggtggcg tcgtccgtgg cttcaaccag tcggtggtcc tggctgtccc ggcaggcctg 20640 gtctgggagg agctccgcgt cctcctgggt gccgtccggg accggcacga ggcctggcgg 20700 ctccgggtcc tcgactcggg agccctctgc gtggacggtg tcgtgcccga cgacggctcc 20760 tggatcgtgc ggtgcgacct ctcgggcatg ggtgtcgacg gccaggtcga cgccgtccgt 20820 gccgcagccg tcgaggcccg tgcgtggctc gacccgtccg tcggacgcgt cgtccgtgcc 20880 gtctggctcg agcgcggtgg tgaccgttcc ggtgtcctcg tcctcgtcgc ccaccacctc 20940 gtcgtcgacg gcgtctcctg gcgcgtcgtc ctcggcgacc tggcggaggg ctgggcccag 21000 gtccgctccg gtgggcgtgt cgagctcggc gtcgtcggca cctccctccg cggatgggct 21060 gccgctctcg ccgagcaggg tcgccgtggg gagcgtgcag gcgaggtcga gctctggtcc 21120 cgcatggtcc gcggtgcgga cgtgctcgtc ggctcccgtg ccgtcgacgg tgccgtcgac 21180 gtcttcggtg gcgtcgtctc cgtcgacagc cgtgcctccg tctccgtctc ccgtgccctc 21240 ctgaccgagg tccccagcgt gctcggtgtg ggtgtccagg aggtcctgct cgcagcgttc 21300 ggcctcgccg tggcacgctg gcggggtcgt ggcggtcccg tggtcgtcga cgtggagggc 21360 cacggtcgga acgaggacgc cgtccgcggt gccgacctct cgcggacggt gggctggttc 21420 acgagcgtct accccgtgcg tgtcccggtc gagtcggctt cctgggatga ggtccgggca 21480 ggtggtcccg tcgtcggtcg ggtcgtccgg gaggtcaagg agacgctccg cagcctcccg 21540 gaccagggac tcggctacgg gatcctccgg tacctggacc cggaacacgg acctgccctc 21600 gctcgccacg cgacgcccca gttcgggttc aactacctgg gtcggttcac gacgggcacg 21660 gacgagacga cgaccgcgga cgccctggac cgtgcgcctg cctggagcct gctggcacgg 21720 agcgctgcgg gtcaggaccc ggagctcccg gtcgcccacg ccgtggagtt caacgccatc 21780 accctcgaca cgcccgaagg tccccgtctc ggggtcacgt ggtcctggcc caccaccctc 21840 ctcccggagt cgcgcatccg cgagctcgca cggtactggg atgaggcgct cgagggcctc 21900 gtggagcacg ctcgccaccc ggaggcaggt gggctgaccc cgtcggacgt cggcctcgcg 21960 gaactctcct ttgctgagat cgaactgctc gaagacgact ggaggacaca gggatga 22017 <210> 11 <211> 7338 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Reprogrammed dptBC gene <400> 11 Met Asn Arg Arg Ser Lys Val Val Glu Glu Ile Leu Pro Val Ser Ala 1 5 10 15 Leu Gln Glu Gly Leu Leu Phe His Ser Ser Phe Ala Ala Ala Asp Gly 20 25 30 Val Asp Val Tyr Ala Gly Gln Leu Ala Phe Asp Leu Val Gly Ala Val 35 40 45 Asp Thr Gly Arg Leu Arg Ala Ala Val Glu Ser Leu Val Ala Arg His 50 55 60 Gly Val Leu Arg Ser Ser Tyr Arg Gln Ala Arg Ser Gly Glu Trp Val 65 70 75 80 Ala Val Val Ala Arg Arg Val Ala Thr Pro Trp Arg Ala Val Asp Ala 85 90 95 Arg Asp Gly Ala Thr Asp Ala Ala Ala Val Ala Arg Glu Glu Arg Trp 100 105 110 Arg Pro Phe Asp Leu Gly Arg Ala Pro Leu Ala Arg Phe Val Leu Val 115 120 125 Arg Thr Asp Asp Asp Arg Phe Arg Phe Val Ile Thr Tyr His His Val 130 135 140 Ile Leu Asp Gly Trp Ser Leu Pro Val Leu Leu Arg Glu Leu Leu Ala 145 150 155 160 Leu Tyr Gly Ser Gly Ala Asp Pro Ser Val Leu Pro Pro Val Arg Pro 165 170 175 Tyr Gly Asp Phe Leu Arg Trp Ala Ala Ala Arg Asp Asp Ala Ala Ala 180 185 190 Glu Thr Ala Trp Arg Asp Ala Leu Thr Gly Leu Asp Glu Pro Ser Leu 195 200 205 Val Ala Pro Gly Ala Ser Pro Asp Gly Val Val Pro Ala Ser Val His 210 215 220 Ala Glu Leu Asp Lys Ala Gly Thr Glu Asn Leu Ala Ala Trp Ala Arg 225 230 235 240 His Arg Gly Ile Thr Gln Ala Thr Ala Val Arg Ala Ala Trp Ala Leu 245 250 255 Val Leu Gly Gln His Thr Gly Arg Asp Asp Val Val Phe Gly Val Thr 260 265 270 Val Ser Gly Arg Pro Ala Glu Leu Ala Gly Ala Glu His Met Val Gly 275 280 285 Leu Phe Ile Asn Thr Val Pro Leu Arg Thr Val Leu Asp Pro Ala Asp 290 295 300 Thr Leu Gly Thr Phe Ala Ala Arg Leu Gln Ala Glu Gln Thr Thr Leu 305 310 315 320 Leu Glu His Gln His Val Arg Leu Ser Asp Ile Gln Arg Trp Ala Gly 325 330 335 His Lys Glu Leu Phe Asp Thr Ile Val Val Phe Glu Asn Tyr Pro Ile 340 345 350 Gly His Ser Gly Pro Gly Ser Ile Arg Thr Asp Asp Phe Thr Val Thr 355 360 365 Ala Thr Glu Gly Ser Asp Ala Thr His Tyr Pro Leu Thr Leu Thr Ala 370 375 380 Val Pro Gly Glu Thr Leu Arg Leu Lys Leu Asp His Arg Pro Asp Leu 385 390 395 400 Val Asp Thr Thr Thr Ala Thr Ala Leu Leu Arg Arg Val Thr Arg Val 405 410 415 Leu Glu Thr Ala Thr Asp Asp Thr Gly His Thr Leu Ala Arg Leu Asp 420 425 430 Leu Leu Asp Asp Asp Glu Arg His Arg Leu Leu Arg Gly Trp Asn Asp 435 440 445 Thr Thr Arg Glu Gln Pro Pro Thr Tyr Tyr His Gln Glu Phe Glu Glu 450 455 460 Gln Ala Arg Arg Arg Pro His Asp Thr Ala Leu Val Phe Thr Ser Thr 465 470 475 480 Ser Trp Thr Tyr Glu Glu Leu Asn Asp Arg Ala Asn Arg Leu Ala Arg 485 490 495 Leu Leu Val Ala Ala Gly Ala Gly Ser Asp Asp Phe Val Ala Leu Ala 500 505 510 Phe Pro Arg Ser Ala Glu Ser Val Val Ala Ile Leu Ala Val Leu Lys 515 520 525 Ala Gly Ala Ala Tyr Leu Pro Leu Asp Met Asp Gln Pro Ala Glu Arg 530 535 540 Leu Thr Gly Ile Leu Ala Asp Ala His Pro Thr Val Val Leu Thr Thr 545 550 555 560 Thr Thr Ala Thr Pro Leu Pro His Pro Gly Arg Thr Leu Val Leu Asp 565 570 575 Ser Pro Thr Thr Ala Arg Ala Leu Ala Ala Ala Pro Ala His Asn Leu 580 585 590 Thr Asp Ala Asp Arg Arg Thr Pro Leu Asn Ala Arg Asn Ala Ala Tyr 595 600 605 Ile Ile His Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Val Ile 610 615 620 Glu His Arg Ser Leu Ala Asn Leu Phe His Asp His Arg Arg Ala Leu 625 630 635 640 Ile Glu Pro His Ala Ala Gly Gly Ser Arg Leu Lys Ala Gly Leu Thr 645 650 655 Ala Ser Leu Ser Phe Asp Thr Ser Trp Glu Gly Leu Ile Cys Leu Ala 660 665 670 Ala Gly His Glu Leu His Leu Ile Asp Asp Asp Thr Arg Arg Asp Ala 675 680 685 Glu Arg Val Ala Glu Leu Ile Asp Arg Gln Arg Ile Asp Val Ile Asp 690 695 700 Val Thr Pro Ser Phe Ala Gln Gln Leu Val Glu Thr Gly Ile Leu Asp 705 710 715 720 Glu Gly Arg His His Pro Ala Ala Phe Met Leu Gly Gly Glu Gly Val 725 730 735 Asp Ala Lys Leu Trp Thr Arg Leu Ser Asp Val Pro Gly Val Thr Ser 740 745 750 Tyr Asn Tyr Tyr Gly Pro Thr Glu Phe Thr Val Asp Ala Leu Ala Cys 755 760 765 Thr Val Gly Ile Ala Pro Arg Pro Val Ile Gly His Pro Leu Asp Asn 770 775 780 Thr Ala Ala Tyr Ile Leu Asp Gly Phe Leu Arg Pro Val Pro Glu Gly 785 790 795 800 Val Ala Gly Glu Leu Tyr Leu Ala Gly Thr Gln Leu Ala Arg Gly Tyr 805 810 815 Ala Gly Arg Pro Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe 820 825 830 Gly Ala Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Arg 835 840 845 Ser Pro Gly Gly Val Val Glu Tyr Leu Gly Arg Val Asp Asp Gln Ile 850 855 860 Lys Leu Arg Gly Phe Arg Ile Glu Pro Ala Glu Ile Glu Leu Ala Leu 865 870 875 880 Ala Gly His Pro Ala Val Ala Gln Asn Val Val Leu Leu His Arg Ser 885 890 895 Ala Thr Gly Glu Ala Arg Leu Val Ala Tyr Val Val Pro Gly Thr Pro 900 905 910 Val Asp Pro Arg Glu Leu Thr Gly His Leu Ala Ala Arg Leu Pro Ala 915 920 925 Tyr Met Val Pro Ser Ala Phe Val Leu Leu Asp Thr Leu Pro Leu Thr 930 935 940 Pro Asn Gly Lys Leu Asp Arg Gly Ala Leu Pro Glu Pro Ala Phe Gly 945 950 955 960 Thr Ala Pro Arg Pro Glu Arg Pro Arg Thr Pro Val Glu Glu Ile Leu 965 970 975 Cys Gly Leu Tyr Ala Asp Val Leu Gly Leu Pro Ser Phe Gly Ala Asp 980 985 990 Asp Asp Phe Phe Asp Ala Gly Gly His Ser Leu Leu Ala Ser Lys Leu 995 1000 1005 Val Ser Arg Ile Arg Thr Asn Leu Lys Thr Glu Leu Asn Val Arg Ala 1010 1015 1020 Leu Phe Glu His Arg Thr Val Ser Ser Leu Ala Thr Ala Leu His Arg 1025 1030 1035 1040 Ala Ala Gln Ala Gly Pro Ala Leu Thr Ala Gly Pro Arg Pro Ala Arg 1045 1050 1055 Ile Pro Leu Ser Tyr Ala Gln Arg Arg Leu Trp Phe Leu Asn Arg Leu 1060 1065 1070 Asp Arg Asp Ser Ala Ala Tyr Asn Met Pro Val Ala Leu Arg Leu Arg 1075 1080 1085 Gly Pro Leu Asp Ser Thr Ala Met Cys Ala Ala Leu Thr Asp Val Ala 1090 1095 1100 Glu Arg His Glu Ala Leu Arg Thr Val Phe Glu Glu Asp Arg Asp Gly 1105 1110 1115 1120 Ala His Gln Ile Val Leu Pro Ala Thr Gly Leu Gly Pro Leu Leu Thr 1125 1130 1135 Val Thr Gly Ala Asp Gly Thr Thr Leu Arg Ala Leu Ile Thr Glu Phe 1140 1145 1150 Val Arg Arg Pro Phe Asp Leu Ala Ala Glu Ile Pro Phe Arg Ala Ala 1155 1160 1165 Leu Phe Arg Val Gly Asp Glu Glu His Val Leu Val Val Val Leu His 1170 1175 1180 His Ile Ala Gly Asp Gly Trp Ser Met Gly Pro Leu Ala Arg Asp Val 1185 1190 1195 1200 Ala Glu Ala Tyr Arg Ala Arg Ala Ala Gly Arg Ala Pro Asp Trp Glu 1205 1210 1215 Pro Leu Pro Val Gln Tyr Ala Asp Tyr Ala Leu Trp Gln Arg Glu Val 1220 1225 1230 Leu Gly Ala Glu Asp Asp Glu Thr Gly Glu Leu Ser Ala Gln Leu Ala 1235 1240 1245 His Trp Arg Thr Arg Leu Ala Gly Ala Pro Ala Glu Leu Thr Leu Pro 1250 1255 1260 Thr Asp Arg Pro Arg Pro Ala Val Ala Ser Thr Ala Gly Asp Arg Val 1265 1270 1275 1280 Glu Phe Thr Val Pro Ala Gly Leu His Gln Ala Leu Ala Asp Leu Ala 1285 1290 1295 Arg Ala His Gly Ala Thr Val Phe Met Val Val Gln Ala Ala Leu Ala 1300 1305 1310 Val Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile Pro Ile Gly Thr 1315 1320 1325 Pro Val Ala Gly Arg Thr Asp Glu Ala Thr Glu Glu Leu Ile Gly Phe 1330 1335 1340 Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser Gly Asp Pro Thr 1345 1350 1355 1360 Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp Leu Asp Ala Tyr 1365 1370 1375 Ala His Gln Asp Val Pro Phe Glu Arg Leu Val Glu Val Leu Asn Pro 1380 1385 1390 Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val Met Leu Thr Phe 1395 1400 1405 Asn Val Pro Asp Met Asp Gly Val Gly Ser Ala Leu Gly Asn Leu Gly 1410 1415 1420 Glu Leu Glu Val Ser Gly Glu Ala Ile Arg Thr Asp Gln Thr Lys Val 1425 1430 1435 1440 Asp Leu Ala Phe Thr Cys Thr Glu Met Tyr Ala Ala Asp Gly Ala Ala 1445 1450 1455 Ser Gly Met Arg Gly Val Leu Glu Tyr Arg Leu Asp Val Phe Gly Ala 1460 1465 1470 Val Gln Ala Arg Glu Thr Thr Glu Arg Leu Val Arg Val Leu Glu Gly 1475 1480 1485 Val Val Ser Gly Gly Gly Gly Val Ser Val Ser Gly Val Asp Val Leu 1490 1495 1500 Gly Val Gly Glu Arg Glu Arg Leu Leu Gly Trp Gly Val Gly Gly Pro 1505 1510 1515 1520 Val Pro Val Val Pro Gly Gly Gly Leu Val Gly Leu Phe Glu Glu Arg 1525 1530 1535 Val Arg Ala Asp Ala Asp Ala Val Ala Val Arg Gly Ala Gly Val Val 1540 1545 1550 Trp Ser Tyr Gly Glu Leu Asn Ala Arg Val Asn Val Val Ala Arg Trp 1555 1560 1565 Leu Val Gly Arg Gly Val Gly Ala Glu Cys Gly Val Gly Val Val Met 1570 1575 1580 Gly Arg Gly Val Asp Val Val Val Met Leu Leu Ala Val Ala Lys Ala 1585 1590 1595 1600 Gly Gly Phe Tyr Val Pro Val Asp Pro Glu Trp Pro Val Glu Arg Val 1605 1610 1615 Gly Trp Val Leu Ala Asp Ala Gly Val Gly Leu Val Val Val Gly Glu 1620 1625 1630 Gly Leu Ser His Val Val Gly Asp Phe Pro Gly Gly Glu Val Phe Glu 1635 1640 1645 Phe Ser Arg Val Val Arg Glu Ser Cys Leu Val Glu Leu Val Ala Ala 1650 1655 1660 Asp Gly Val Glu Val Arg Asn Val Thr Asp Gly Glu Arg Ala Ser Arg 1665 1670 1675 1680 Leu Leu Pro Gly His Pro Leu Tyr Val Val Tyr Thr Ser Gly Ser Thr 1685 1690 1695 Gly Arg Pro Lys Gly Val Val Val Thr His Ala Ser Val Gly Gly Tyr 1700 1705 1710 Leu Ala Arg Gly Arg Asp Val Tyr Ala Gly Ala Val Gly Gly Val Gly 1715 1720 1725 Phe Val His Ser Ser Leu Ala Phe Asp Leu Thr Val Thr Val Leu Phe 1730 1735 1740 Thr Pro Leu Val Ser Gly Gly Cys Val Val Leu Gly Glu Leu Asp Glu 1745 1750 1755 1760 Ser Ala Gln Gly Val Gly Ala Ser Phe Val Lys Val Thr Pro Ser His 1765 1770 1775 Leu Gly Leu Leu Gly Glu Leu Glu Gly Val Val Ala Gly Asn Gly Met 1780 1785 1790 Leu Leu Val Gly Gly Glu Ala Leu Ser Gly Gly Ala Leu Arg Glu Trp 1795 1800 1805 Arg Glu Arg Asn Pro Gly Val Val Val Val Asn Ala Tyr Gly Pro Thr 1810 1815 1820 Glu Leu Thr Val Asn Cys Ala Glu Phe Leu Ile Ala Pro Gly Glu Glu 1825 1830 1835 1840 Val Pro Asp Gly Pro Val Pro Ile Gly Arg Pro Phe Ala Gly Gln Arg 1845 1850 1855 Met Phe Val Leu Asp Ala Ala Leu Arg Val Val Pro Val Gly Val Val 1860 1865 1870 Gly Glu Leu Tyr Val Ala Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly 1875 1880 1885 Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe Gly Ala 1890 1895 1900 Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Arg Val 1905 1910 1915 1920 Asp Gly Ala Leu Glu Phe Val Gly Arg Ala Asp Asp Gln Val Lys Val 1925 1930 1935 Arg Gly Phe Arg Val Glu Leu Gly Glu Val Glu Gly Ala Val Ala Ala 1940 1945 1950 His Pro Asp Val Val Arg Ala Val Val Val Val Arg Glu Asp Arg Pro 1955 1960 1965 Gly Asp His Arg Leu Val Ala Tyr Val Thr Gly Val Asp Thr Gly Gly 1970 1975 1980 Leu Ser Ser Ala Val Met Arg Ala Val Ala Glu Arg Leu Pro Ala Tyr 1985 1990 1995 2000 Met Val Pro Ser Ala Val Val Val Leu Asp Glu Ile Pro Leu Thr Pro 2005 2010 2015 Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val Pro Gly Val Glu Ala 2020 2025 2030 Gly Ala Gly Tyr Arg Ala Pro Val Ser Pro Arg Glu Glu Val Leu Cys 2035 2040 2045 Gly Leu Phe Ala Glu Val Leu Gly Leu Glu Arg Val Gly Val Asp Asp 2050 2055 2060 Asp Phe Phe Gly Leu Gly Gly His Ser Leu Leu Ala Thr Arg Leu Ile 2065 2070 2075 2080 Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala Gly Val Arg Ala Leu 2085 2090 2095 Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg Leu Leu Arg Glu Arg 2100 2105 2110 Ser Ala Leu Gly Val Arg Val Pro Leu Val Ala Arg Glu Arg Thr Gly 2115 2120 2125 Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu Trp Phe Leu Glu Glu 2130 2135 2140 Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro Met Ala Leu Arg Leu 2145 2150 2155 2160 Ala Gly Val Leu Asp Val Glu Ala Leu His Gln Ala Leu Ile Asp Val 2165 2170 2175 Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile Ala Gln Asp Ala Gly 2180 2185 2190 Thr Ala Trp Gln His Ile Leu Pro Val Asp Asp Pro Arg Thr Arg Pro 2195 2200 2205 Gly Leu Pro Leu Val Asp Ile Gly Ala Asp Ala Leu Gln Glu Arg Leu 2210 2215 2220 Asp Glu Ala Ala Gly Arg Pro Phe Asp Leu Ala Ala Asp Leu Pro Val 2225 2230 2235 2240 Arg Ala Thr Val Phe Arg Leu Thr Asp Asn Asp His Ile Leu Leu Val 2245 2250 2255 Val Ala His His Val Ala Phe Asp Ala Met Ser Arg Val Pro Phe Ile 2260 2265 2270 Arg Asn Val Lys Arg Ala Phe Glu Ala Arg Thr Asn Gly Ala Ala Pro 2275 2280 2285 Asp Trp Arg Pro Leu Pro Val Gln Tyr Ala Asp Tyr Ala Ala Trp Gln 2290 2295 2300 Arg Asp Val Leu Gly Thr Glu Asp Asp Glu Ser Ser Glu Leu Ser Ala 2305 2310 2315 2320 Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala Ser Leu Pro Ala Glu Leu 2325 2330 2335 Ala Leu Pro Thr Asp Arg Ala Arg Pro Ala Val Ala Ser Tyr Glu Gly 2340 2345 2350 Gly Lys Val Glu Phe Thr Val Pro Ala Gly Val Tyr Asp Gly Leu Val 2355 2360 2365 Ala Leu Ala Arg Ala Glu Gly Val Thr Val Phe Met Val Val Gln Ala 2370 2375 2380 Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile Pro 2385 2390 2395 2400 Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp Gln Ala Thr Glu Asp Leu 2405 2410 2415 Ile Gly Phe Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser Gly 2420 2425 2430 Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp Leu 2435 2440 2445 Asp Ala Tyr Ala His Gln Asp Ile Pro Phe Glu Arg Leu Val Glu Ala 2450 2455 2460 Val Asn Pro Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val Met 2465 2470 2475 2480 Leu Thr Phe Asp Asn Thr Ile Asp Arg Glu Val Thr Glu Gly Phe Ala 2485 2490 2495 Gly Leu Gly Val Glu Gly Leu Pro Leu Gly Ala Gly Ala Val Lys Phe 2500 2505 2510 Asp Leu Leu Phe Gly Leu Ser Glu Val Gly Gly Glu Leu Arg Gly Ala 2515 2520 2525 Val Glu Tyr Arg Cys Asp Leu Phe Asp His Pro Thr Val Ala Gln Leu 2530 2535 2540 Ala Glu Arg Leu Val Arg Val Leu Glu Arg Val Ala Ser Asp Ala Ser 2545 2550 2555 2560 Val Arg Thr Gly Glu Leu Pro Val Val Gly Glu Ala Glu Arg Ala Arg 2565 2570 2575 Val Leu Thr Glu Trp Asn Asp Thr Gly Val Pro Gly Val Pro Glu Thr 2580 2585 2590 Phe Leu Glu Leu Phe Glu Ala Gln Val Ala Ala Arg Gly Asp Ala Pro 2595 2600 2605 Ala Val Val Tyr Glu Gly Glu Val Leu Ser Tyr Arg Glu Leu Asp Ala 2610 2615 2620 Arg Ala Asn Arg Leu Ala Gly Leu Leu Val Gly Arg Gly Ala Gly Pro 2625 2630 2635 2640 Glu His Phe Val Gly Val Ala Leu Pro Arg Gly Leu Asp Leu Ile Val 2645 2650 2655 Ala Leu Leu Ala Val Leu Lys Ser Gly Ala Ala Tyr Val Pro Leu Asp 2660 2665 2670 Pro Glu Tyr Pro Ala Glu Arg Leu Val His Met Val Thr Asp Ala Ala 2675 2680 2685 Pro Val Val Val Val Thr Ser Thr Asp Val Arg Thr Leu Arg Thr Val 2690 2695 2700 Pro Arg Val Glu Leu Asp Asp Glu Ala Thr Arg Ala Thr Leu Val Ala 2705 2710 2715 2720 Ala Pro Ala Thr Gly Pro Asp Val Lys Met Ser Ala Ser His Pro Ala 2725 2730 2735 Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Val 2740 2745 2750 Ile Ser His Gly Ser Leu Ala Asn Phe Leu Ala Trp Ala Arg Glu Asp 2755 2760 2765 Leu Gly Ala Glu Arg Leu Arg His Val Val Leu Ser Thr Ser Leu Ser 2770 2775 2780 Phe Asp Val Ser Val Val Glu Leu Phe Ala Pro Leu Ser Cys Gly Gly 2785 2790 2795 2800 Thr Val Glu Ile Val Arg Asn Leu Leu Ala Leu Val Asp Arg Pro Gly 2805 2810 2815 Arg Trp Ser Ala Ser Leu Val Ser Gly Val Pro Ser Ala Phe Ala Gln 2820 2825 2830 Leu Leu Glu Ala Gly Leu Asp Arg Ala Asp Val Gly Met Ile Ala Leu 2835 2840 2845 Ala Gly Glu Ala Leu Ser Ala Arg Asp Val Arg Arg Val Arg Ala Val 2850 2855 2860 Leu Pro Gly Ala Arg Val Ala Asn Phe Tyr Gly Pro Thr Glu Ala Thr 2865 2870 2875 2880 Val Tyr Ala Thr Ala Trp Tyr Gly Asp Thr Pro Met Asp Ala Ala Ala 2885 2890 2895 Pro Met Gly Arg Pro Leu Arg Asn Thr Cys Val Tyr Val Leu Asp Asp 2900 2905 2910 Gly Leu Arg Val Val Pro Val Gly Val Val Gly Glu Leu Tyr Val Ala 2915 2920 2925 Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly Arg Val Gly Leu Thr Ala 2930 2935 2940 Glu Arg Phe Val Ala Cys Pro Phe Gly Ala Arg Gly Glu Arg Met Tyr 2945 2950 2955 2960 Arg Thr Gly Asp Leu Val Arg Trp Arg Val Asp Gly Thr Leu Glu Phe 2965 2970 2975 Val Gly Arg Ala Asp Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu 2980 2985 2990 Leu Gly Glu Val Glu Gly Ala Val Ala Ala His Pro Asp Val Val Arg 2995 3000 3005 Ala Val Val Val Val Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val 3010 3015 3020 Ala Tyr Val Thr Gly Val Asp Thr Gly Gly Leu Ser Ser Ala Val Met 3025 3030 3035 3040 Arg Ala Val Ala Glu Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val 3045 3050 3055 Val Val Leu Asp Glu Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg 3060 3065 3070 Ala Gly Leu Pro Val Pro Val Val Ser Val Ala Gly Phe Cys Ala Pro 3075 3080 3085 Ser Ser Pro Arg Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu 3090 3095 3100 Gly Val Glu Arg Val Gly Val Asp Asp Gly Phe Phe Asp Leu Gly Gly 3105 3110 3115 3120 Asp Ser Ile Leu Ser Ile Gln Leu Val Ala Arg Ala Arg Arg Ala Gly 3125 3130 3135 Leu Glu Leu Ser Val Arg Asp Val Phe Glu Gly Arg Thr Val Arg Ala 3140 3145 3150 Leu Ala Ala Val Val Arg Gly Ser Asp Ala Gly Ala Val Gly Val Val 3155 3160 3165 Gly Gly Ala Glu Ile Val Leu Pro Gly Val Gly Glu Val Glu Arg Trp 3170 3175 3180 Pro Val Val Glu Trp Leu Ala Glu Arg Gly Gly Gly Ser Leu Gly Gly 3185 3190 3195 3200 Val Val Arg Gly Phe Asn Gln Ser Val Val Leu Ala Val Pro Ala Gly 3205 3210 3215 Leu Val Trp Glu Glu Leu Arg Val Leu Leu Gly Ala Val Arg Asp Arg 3220 3225 3230 His Glu Ala Trp Arg Leu Arg Val Leu Asp Ser Gly Ala Leu Cys Val 3235 3240 3245 Asp Gly Val Val Pro Asp Asp Gly Ser Trp Ile Val Arg Cys Asp Leu 3250 3255 3260 Ser Gly Met Gly Val Asp Gly Gln Val Asp Ala Val Arg Ala Ala Ala 3265 3270 3275 3280 Val Glu Ala Arg Ala Trp Leu Asp Pro Ser Val Gly Arg Val Val Arg 3285 3290 3295 Ala Val Trp Leu Glu Arg Gly Gly Asp Arg Ser Gly Val Leu Val Leu 3300 3305 3310 Val Ala His His Leu Val Val Asp Gly Val Ser Trp Arg Val Val Leu 3315 3320 3325 Gly Asp Leu Ala Glu Gly Trp Ala Gln Val Arg Ser Gly Gly Arg Val 3330 3335 3340 Glu Leu Gly Val Val Gly Thr Ser Leu Arg Gly Trp Ala Ala Ala Leu 3345 3350 3355 3360 Ala Glu Gln Gly Arg Arg Gly Glu Arg Ala Gly Glu Val Glu Leu Trp 3365 3370 3375 Ser Arg Met Val Arg Gly Ala Asp Val Leu Val Gly Ser Arg Ala Val 3380 3385 3390 Asp Gly Ala Val Asp Val Phe Gly Gly Val Val Ser Val Asp Ser Arg 3395 3400 3405 Ala Ser Val Ser Val Ser Arg Ala Leu Leu Thr Glu Val Pro Ser Val 3410 3415 3420 Leu Gly Val Gly Val Gln Glu Val Leu Leu Ala Ala Phe Gly Leu Ala 3425 3430 3435 3440 Val Ala Arg Trp Arg Gly Arg Gly Gly Pro Val Val Val Asp Val Glu 3445 3450 3455 Gly His Gly Arg Asn Glu Asp Ala Val Arg Gly Ala Asp Leu Ser Arg 3460 3465 3470 Thr Val Gly Trp Phe Thr Ser Val Tyr Pro Val Arg Val Pro Val Glu 3475 3480 3485 Ser Ala Ser Trp Asp Glu Val Arg Ala Gly Gly Pro Val Val Gly Arg 3490 3495 3500 Val Val Arg Glu Val Lys Glu Thr Leu Arg Ser Leu Pro Asp Gln Gly 3505 3510 3515 3520 Leu Gly Tyr Gly Ile Leu Arg Tyr Leu Asp Pro Glu His Gly Pro Ala 3525 3530 3535 Leu Ala Arg His Ala Thr Pro Gln Phe Gly Phe Asn Tyr Leu Gly Arg 3540 3545 3550 Phe Thr Thr Gly Thr Asp Asp Thr Gly Asp Glu Gly Met Thr Asp Trp 3555 3560 3565 Val Pro Val Ser Gly Pro Phe Ala Val Gly Ala Gly Gln Asp Pro Glu 3570 3575 3580 Leu Pro Val Ala His Ala Val Glu Phe Asn Ala Ile Thr Leu Asp Thr 3585 3590 3595 3600 Pro Glu Gly Pro Arg Leu Gly Val Thr Trp Ser Trp Pro Thr Thr Leu 3605 3610 3615 Leu Pro Glu Ser Arg Ile Arg Glu Leu Ala Arg Tyr Trp Asp Glu Ala 3620 3625 3630 Leu Glu Gly Leu Val Glu His Ala Arg His Pro Glu Ala Gly Gly Leu 3635 3640 3645 Thr Pro Ser Asp Val Thr Leu Val Glu Val Asn Gln Val Glu Leu Asp 3650 3655 3660 Arg Leu Gln Ala Gly Val Ala Gly Gly Ala Glu Glu Ile Leu Pro Val 3665 3670 3675 3680 Ser Ala Leu Gln Glu Gly Leu Leu Phe His Ser Ala Leu Ala Ser Gly 3685 3690 3695 Gly Val Asp Val Tyr Val Gly Gln Leu Val Phe Asp Leu Val Gly Pro 3700 3705 3710 Val Asp Val Asp Arg Leu Arg Ala Ala Val Glu Gly Leu Val Ala Arg 3715 3720 3725 His Gly Val Leu Arg Ser Gly Tyr Arg Gln Leu Arg Ser Gly Glu Trp 3730 3735 3740 Val Ala Val Val Ala Arg Gln Val Asp Leu Pro Trp Gln Ser Ile Asp 3745 3750 3755 3760 Val Arg Asp Gly Gly Ile Asp Gly Leu Val Glu Glu Glu Arg Trp Arg 3765 3770 3775 Arg Phe Asp Met Gly Arg Gly Pro Leu Ala Arg Phe Val Leu Ile Arg 3780 3785 3790 Thr His Asp Asp Arg Phe Arg Phe Val Ile Thr Tyr His His Val Val 3795 3800 3805 Leu Asp Gly Trp Ser Val Pro Val Leu Leu Arg Glu Leu Leu Ala Leu 3810 3815 3820 Tyr Gly Ser Ser Gly Asp Val Ser Val Leu Pro Gly Val Arg Ser Tyr 3825 3830 3835 3840 Gly Asp Phe Leu Arg Trp Val Ala Ala Arg Asp Ala Ala Ala Ala Glu 3845 3850 3855 Gly Ala Trp Arg Arg Ala Leu Thr Gly Leu Glu Glu Pro Ser Leu Val 3860 3865 3870 Ala Pro Gly Val Ser Arg Asp Gly Val Val Pro Ala Ala Phe His Gly 3875 3880 3885 Ala Val Asp Gly Asp Leu Ser Gln Lys Ile Val Ala Trp Ala Arg Gly 3890 3895 3900 Arg Gly Val Thr Val Ala Ser Val Val Gln Ala Ala Trp Ala Leu Val 3905 3910 3915 3920 Leu Gly Arg Leu Met Gly Arg Asp Asp Val Val Phe Gly Val Thr Val 3925 3930 3935 Ser Gly Arg Pro Ala Glu Val Val Gly Val Glu Asp Met Val Gly Leu 3940 3945 3950 Phe Val Asn Thr Ile Pro Leu Arg Ala Arg Leu Asp Pro Ala Glu Ser 3955 3960 3965 Leu Gly Gly Phe Val Glu Arg Leu Gln Arg Glu Gln Thr Glu Leu Leu 3970 3975 3980 Glu His Gln His Val Arg Leu Ala Glu Val Gln Arg Trp Ala Gly His 3985 3990 3995 4000 Lys Glu Leu Phe Asp Val Gly Met Val Phe Asp Asn Tyr Pro Val Ser 4005 4010 4015 Ser Glu Ser Pro Glu Ala Glu Phe Gln Ile Ser Arg Thr Gly Gly Tyr 4020 4025 4030 Asn Gly Thr His Tyr Ala Leu Asn Leu Val Ala Ser Met His Gly Leu 4035 4040 4045 Glu Leu Glu Leu Glu Ile Gly Tyr Arg Pro Asp Val Phe Asp Ala Gly 4050 4055 4060 Arg Val Arg Glu Val Trp Gly Trp Leu Val Arg Val Leu Glu Gly Val 4065 4070 4075 4080 Val Ser Gly Gly Gly Gly Val Ser Val Ser Gly Val Asp Val Leu Gly 4085 4090 4095 Val Gly Glu Arg Glu Arg Leu Leu Gly Trp Gly Val Gly Gly Pro Val 4100 4105 4110 Pro Val Val Pro Gly Gly Gly Leu Val Gly Leu Phe Glu Glu Arg Val 4115 4120 4125 Arg Ala Asp Ala Asp Ala Val Ala Val Arg Gly Ala Gly Val Val Trp 4130 4135 4140 Ser Tyr Gly Glu Leu Asn Ala Arg Val Asn Val Val Ala Arg Trp Leu 4145 4150 4155 4160 Val Gly Arg Gly Val Gly Ala Glu Cys Gly Val Gly Val Val Met Gly 4165 4170 4175 Arg Gly Val Asp Val Val Val Met Leu Leu Ala Val Ala Lys Ala Gly 4180 4185 4190 Gly Phe Tyr Val Pro Val Asp Pro Glu Trp Pro Val Glu Arg Val Gly 4195 4200 4205 Trp Val Leu Ala Asp Ala Gly Val Gly Leu Val Val Val Gly Glu Gly 4210 4215 4220 Leu Ser His Val Val Gly Asp Phe Pro Gly Gly Glu Val Phe Glu Phe 4225 4230 4235 4240 Ser Arg Val Val Arg Glu Ser Cys Leu Val Glu Leu Val Ala Ala Asp 4245 4250 4255 Gly Val Glu Val Arg Asn Val Thr Asp Gly Glu Arg Ala Ser Arg Leu 4260 4265 4270 Leu Pro Gly His Pro Leu Tyr Val Val Tyr Thr Ser Gly Ser Thr Gly 4275 4280 4285 Arg Pro Lys Gly Val Val Val Thr His Ala Ser Val Gly Gly Tyr Leu 4290 4295 4300 Ala Arg Gly Arg Asp Val Tyr Ala Gly Ala Val Gly Gly Val Gly Phe 4305 4310 4315 4320 Val His Ser Ser Leu Ala Phe Asp Leu Thr Val Thr Val Leu Phe Thr 4325 4330 4335 Pro Leu Val Ser Gly Gly Cys Val Val Leu Gly Glu Leu Asp Glu Ser 4340 4345 4350 Ala Gln Gly Val Gly Ala Ser Phe Val Lys Val Thr Pro Ser His Leu 4355 4360 4365 Gly Leu Leu Gly Glu Leu Glu Gly Val Val Ala Gly Asn Gly Met Leu 4370 4375 4380 Leu Val Gly Gly Glu Ala Leu Ser Gly Gly Ala Leu Arg Glu Trp Arg 4385 4390 4395 4400 Glu Arg Asn Pro Gly Val Val Val Val Asn Ala Tyr Gly Pro Thr Glu 4405 4410 4415 Leu Thr Val Asn Cys Ala Glu Phe Leu Ile Ala Pro Gly Glu Glu Val 4420 4425 4430 Pro Asp Gly Pro Val Pro Ile Gly Arg Pro Phe Ala Gly Gln Arg Met 4435 4440 4445 Phe Val Leu Asp Ala Ala Leu Arg Val Val Pro Val Gly Val Val Gly 4450 4455 4460 Glu Leu Tyr Val Ala Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly Arg 4465 4470 4475 4480 Val Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe Gly Val Pro 4485 4490 4495 Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Arg Val Asp 4500 4505 4510 Gly Ala Leu Glu Phe Val Gly Arg Ala Asp Asp Gln Val Lys Val Arg 4515 4520 4525 Gly Phe Arg Val Glu Leu Gly Glu Val Glu Gly Ala Val Ala Ala His 4530 4535 4540 Pro Asp Val Val Arg Ala Val Val Val Val Arg Glu Asp Arg Pro Gly 4545 4550 4555 4560 Asp His Arg Leu Val Ala Tyr Val Thr Ala Gly Gly Val Gly Gly Asp 4565 4570 4575 Gly Leu Arg Ser Ala Ile Ser Gly Leu Val Ala Glu Arg Leu Pro Ala 4580 4585 4590 Tyr Met Val Pro Ser Ala Val Val Val Leu Asp Glu Ile Pro Leu Thr 4595 4600 4605 Pro Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val Pro Glu Val Glu 4610 4615 4620 Ala Gly Thr Gly Tyr Arg Ala Pro Val Ser Pro Arg Glu Glu Val Leu 4625 4630 4635 4640 Cys Gly Leu Phe Ala Glu Val Leu Gly Val Glu Arg Val Gly Val Asp 4645 4650 4655 Asp Asp Phe Phe Glu Leu Gly Gly His Ser Leu Leu Ala Thr Arg Leu 4660 4665 4670 Ile Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala Gly Val Arg Ala 4675 4680 4685 Leu Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg Leu Leu Arg Glu 4690 4695 4700 Arg Ser Gly Leu Gly Val Arg Val Pro Leu Val Ala Arg Glu Arg Thr 4705 4710 4715 4720 Gly Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu Trp Phe Leu Glu 4725 4730 4735 Glu Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro Met Ala Leu Arg 4740 4745 4750 Leu Ala Gly Val Leu Asp Val Glu Ala Leu His Gln Ala Leu Ile Asp 4755 4760 4765 Val Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile Ala Gln Asp Ala 4770 4775 4780 Gly Thr Ala Trp Gln His Ile Leu Pro Val Asp Asp Pro Arg Thr Arg 4785 4790 4795 4800 Pro Gly Leu Pro Leu Val Asp Ile Gly Ala Asp Ala Leu Gln Glu Arg 4805 4810 4815 Leu Asp Glu Ala Ala Gly Arg Pro Phe Asp Leu Ala Ala Asp Leu Pro 4820 4825 4830 Val Arg Ala Thr Val Phe Arg Leu Thr Asp Asn Asp His Ile Leu Leu 4835 4840 4845 Leu Val Leu His His Ile Ala Gly Asp Gly Trp Ser Met Gly Pro Leu 4850 4855 4860 Ala Arg Asp Leu Ser Thr Ala Tyr Ser Ala Arg Ala Ala Gly Ala Ala 4865 4870 4875 4880 Ser Ala Trp Arg Pro Leu Ser Val Gln Tyr Ala Asp Tyr Ala Ala Trp 4885 4890 4895 Gln Arg Asp Val Leu Gly Thr Glu Asp Asp Glu Ser Ser Glu Leu Ser 4900 4905 4910 Ala Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala Ser Leu Pro Ala Glu 4915 4920 4925 Leu Ala Leu Pro Thr Asp Arg Ala Arg Pro Ala Val Ala Thr Tyr Arg 4930 4935 4940 Gly Gly Arg Ile Glu Phe Thr Ile Pro Ala Asp Val His Arg Ser Leu 4945 4950 4955 4960 Ala Asp Leu Ala Arg Ala Glu Gly Val Thr Val Phe Met Val Val Gln 4965 4970 4975 Ala Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile 4980 4985 4990 Pro Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp Gln Ala Thr Glu Asp 4995 5000 5005 Leu Ile Gly Phe Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser 5010 5015 5020 Gly Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp 5025 5030 5035 5040 Leu Asp Ala Tyr Ala His Gln Asp Ile Pro Phe Glu Arg Leu Val Glu 5045 5050 5055 Ala Val Asn Pro Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val 5060 5065 5070 Met Leu Ala Phe Asn Asn Ala Glu Thr Ser Thr Pro Leu Pro Met Ala 5075 5080 5085 Glu Gly Leu Ala Ala Ser Arg Gln Asp Ile Glu Pro Gly Val Ala Lys 5090 5095 5100 Phe Asp Leu Ala Leu Tyr Cys Asn Glu Ser Arg Gly Glu Thr Gly Asp 5105 5110 5115 5120 His Gln Gly Ile Arg Ser Val Phe Glu Tyr Arg Arg Asp Leu Trp Asp 5125 5130 5135 Glu Asp Thr Val Arg Gln Leu Ala Asp Arg Phe Leu His Val Leu Ala 5140 5145 5150 Ala Phe Ala Ala Ala Pro Glu Gln Arg Ala Ser Ser Val Asp Val Leu 5155 5160 5165 Arg Ala Gly Glu Arg Asp Gln Leu Leu His Glu Trp Asn Asp Thr Ala 5170 5175 5180 Ala Ala Leu Pro Pro Ala Leu Leu Pro Gln Leu Phe Glu Glu Gln Val 5185 5190 5195 5200 Arg Arg Thr Pro His Asp Val Ala Leu Val Ser Gly Asn Ile Arg Leu 5205 5210 5215 Thr Tyr Ala Glu Leu Asp Ala Arg Ala Asn Arg Leu Ala His Leu Leu 5220 5225 5230 Leu Ala Arg Gly Ala Ala Pro Glu Thr Phe Val Ala Val Ala Leu Pro 5235 5240 5245 Arg Thr Glu Glu Leu Leu Val Ala Leu Leu Ala Val Gln Lys Thr Gly 5250 5255 5260 Ala Gly His Leu Pro Leu Asp Pro Gly Phe Pro Ala Glu Arg Leu Ser 5265 5270 5275 5280 Tyr Met Leu Asp Asp Ala Arg Pro Ala Val Val Leu Thr Thr Glu Asp 5285 5290 5295 Ile Ser Ala Arg Ile Pro Gly Gly Ser His Val Val Leu Asp Ser Glu 5300 5305 5310 Gln Val Thr Gly Glu Leu His Asp His Pro Ala Thr Ser Pro Ala Gly 5315 5320 5325 Arg Gly Asn Pro Ala Gly Pro Ala Tyr Val Ile Tyr Thr Ser Gly Ser 5330 5335 5340 Thr Gly Gln Pro Lys Gly Val Val Val Pro Ser Ala Ala Leu Val Asn 5345 5350 5355 5360 Phe Leu Ala Asp Met Val Pro Arg Leu Gly Leu Arg Gly Gly Asp Arg 5365 5370 5375 Leu Leu Ser Val Thr Thr Val Gly Phe Asp Ile Ala Ala Leu Glu Leu 5380 5385 5390 Phe Val Pro Leu Leu Ser Gly Ala Thr Val Val Leu Ala Asp Gly Glu 5395 5400 5405 Thr Val Arg Asp Pro Ala Leu Ala Arg Gln Thr Cys Glu Asp His Gly 5410 5415 5420 Val Thr Met Val Gln Ala Thr Pro Ser Trp Trp His Gly Met Leu Ala 5425 5430 5435 5440 Asp Ala Gly Asp Ser Leu Arg Gly Val His Ala Val Val Gly Gly Glu 5445 5450 5455 Ala Leu Ser Pro Gly Leu Arg Asp Ala Leu Thr Arg Gly Ala Arg Ser 5460 5465 5470 Val Thr Asn Met Tyr Gly Pro Thr Glu Thr Thr Ile Trp Ser Thr Ser 5475 5480 5485 Ala Gly Gln Ala Ala Gly Asp Ser Ala Pro Pro Ser Ile Gly Thr Pro 5490 5495 5500 Ile Leu Asn Thr Arg Val Tyr Val Leu Asp Ala Ala Leu Cys Val Val 5505 5510 5515 5520 Pro Pro Gly Val Ala Gly Glu Leu Tyr Ile Ala Gly Asp Gly Leu Ala 5525 5530 5535 Arg Gly Tyr Leu Gly Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala 5540 5545 5550 Cys Pro Phe Gly Ala Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu 5555 5560 5565 Val Arg Trp Arg Val Asp Gly Ala Leu Glu Phe Val Gly Arg Ala Asp 5570 5575 5580 Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu Leu Gly Glu Val Glu 5585 5590 5595 5600 Gly Ala Val Ala Ala His Pro Asp Val Val Arg Ala Val Val Val Val 5605 5610 5615 Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val Ala Tyr Val Thr Gly 5620 5625 5630 Val Asp Thr Gly Gly Leu Ser Ser Ala Val Met Arg Ala Val Ala Glu 5635 5640 5645 Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val Val Val Leu Asp Glu 5650 5655 5660 Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val 5665 5670 5675 5680 Pro Gly Val Glu Ala Gly Ala Gly Tyr Arg Ala Pro Val Ser Pro Arg 5685 5690 5695 Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu Gly Val Glu Arg 5700 5705 5710 Val Gly Val Asp Asp Asp Phe Phe Gly Leu Gly Gly His Ser Leu Leu 5715 5720 5725 Ala Thr Arg Leu Ile Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala 5730 5735 5740 Gly Val Arg Ala Leu Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg 5745 5750 5755 5760 Leu Leu Arg Glu Arg Ser Gly Leu Gly Val Arg Val Pro Leu Val Ala 5765 5770 5775 Arg Glu Arg Thr Gly Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu 5780 5785 5790 Trp Phe Leu Glu Glu Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro 5795 5800 5805 Met Ala Leu Arg Leu Ala Gly Val Leu Asp Val Glu Ala Leu His Gln 5810 5815 5820 Ala Leu Ile Asp Val Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile 5825 5830 5835 5840 Ala Arg Asp Ser Asp Gly Thr Ala Arg Gln Gln Val Leu Pro Val Gly 5845 5850 5855 Asp Pro Ala Ala Arg Pro Ala Leu Pro Val Val Gln Thr Asp Ala Asp 5860 5865 5870 Thr Leu Val Ala Lys Leu Asn Glu Ala Val Gly Arg Pro Phe Asp Leu 5875 5880 5885 Thr Ala Glu Met Pro Leu Arg Ala Thr Val Phe Arg Val Ala Asp Glu 5890 5895 5900 Asp His Ala Leu Leu Leu Val Phe His His Ile Ala Gly Asp Gly Trp 5905 5910 5915 5920 Ser Thr Gly Leu Leu Ala Arg Asp Leu Ser Thr Ala Tyr Ala Ala Arg 5925 5930 5935 Leu Glu Gly Arg Asp Pro Gln Leu Pro Pro Leu Pro Val Gln Tyr Ala 5940 5945 5950 Asp Tyr Ala Ala Trp Gln Arg Asp Val Leu Gly Thr Glu Asp Asp Glu 5955 5960 5965 Ser Ser Glu Leu Ser Ala Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala 5970 5975 5980 Asp Leu Pro Ala Glu Leu Ala Leu Pro Ala Asp Arg Val Arg Pro Ala 5985 5990 5995 6000 Arg Ala Ser Tyr Glu Gly Gly Arg Val Gly Phe Thr Val Pro Ala Gly 6005 6010 6015 Val Leu Arg Asp Leu Thr Arg Leu Ala Arg Val Glu Gly Val Thr Val 6020 6025 6030 Phe Met Val Val Gln Ala Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly 6035 6040 6045 Ala Gly Asp Asp Ile Pro Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp 6050 6055 6060 Gln Ala Thr Glu Asp Leu Ile Gly Phe Phe Val Asn Thr Leu Val Leu 6065 6070 6075 6080 Arg Thr Asp Val Ser Gly Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg 6085 6090 6095 Val Arg Ala Thr Asp Leu Asp Ala Tyr Ala His Gln Asp Ile Pro Phe 6100 6105 6110 Glu Arg Leu Val Glu Ala Val Asn Pro Glu Arg Ser Leu Ala Arg His 6115 6120 6125 Pro Leu Phe Gln Val Met Leu Ala Phe Asp Asn Thr Ala Asp Gly Gly 6130 6135 6140 Pro Val Glu Asp Phe Pro Gly Leu Ser Ala Ala Gly Leu Pro Leu Gly 6145 6150 6155 6160 Ala Gly Ala Ala Lys Phe Asp Leu Leu Phe Gly Leu Ser Glu Val Gly 6165 6170 6175 Gly Glu Leu Arg Gly Ala Val Glu Tyr Arg Cys Asp Leu Phe Asp His 6180 6185 6190 Pro Thr Ala Ala Arg Ile Ala Glu Arg Leu Val Arg Val Leu Glu Arg 6195 6200 6205 Val Ala Ala Asp Ala Ser Val Arg Leu Gly Glu Leu Pro Val Val Ser 6210 6215 6220 Asp Ala Glu Arg Ala Cys Val Leu Thr Glu Trp Asn Asp Thr Ala Val 6225 6230 6235 6240 Pro Gly Val Thr Gly Thr Leu Ser Ala Leu Phe Glu Ala Arg Ala Ala 6245 6250 6255 Ala Arg Gly Asp Ala Pro Ala Val Val Tyr Glu Gly Glu Glu Leu Ser 6260 6265 6270 Tyr Arg Glu Leu Asn Thr Arg Ala Asn Arg Leu Ala His Val Leu Ala 6275 6280 6285 Glu His Gly Ala Gly Pro Glu Arg Phe Val Gly Val Ala Leu Pro Arg 6290 6295 6300 Ser Pro Asp Leu Val Val Ala Leu Leu Ala Val Val Lys Ser Gly Ala 6305 6310 6315 6320 Ala Tyr Val Pro Leu Asp Pro Glu Tyr Pro Ala Asp Arg Leu Ala Tyr 6325 6330 6335 Met Ala Gly Asp Ala Ala Pro Val Ala Val Leu Thr Arg Gly Asp Val 6340 6345 6350 Glu Leu Pro Gly Ser Val Pro Arg Ile Gly Leu Asp Asp Thr Glu Ile 6355 6360 6365 Arg Ala Thr Leu Ala Thr Ala Pro Gly Thr Asn Pro Gly Thr Pro Val 6370 6375 6380 Thr Glu Ala His Pro Ala Tyr Met Ile Tyr Thr Ser Gly Ser Thr Gly 6385 6390 6395 6400 Arg Pro Lys Gly Val Val Val Ser His Gly Ala Ile Val Asn Arg Leu 6405 6410 6415 Ala Trp Met Gln Ala Glu Tyr Arg Leu Asp Ala Thr Asp Arg Val Leu 6420 6425 6430 Gln Lys Thr Pro Ala Gly Phe Asp Val Ser Val Trp Glu Phe Phe Trp 6435 6440 6445 Pro Leu Leu Glu Gly Ala Val Leu Val Phe Ala Arg Pro Gly Gly His 6450 6455 6460 Arg Asp Ala Ala Tyr Leu Ala Gly Leu Ile Glu Arg Glu Arg Ile Thr 6465 6470 6475 6480 Thr Ala His Phe Val Pro Ser Met Leu Arg Val Phe Leu Glu Glu Pro 6485 6490 6495 Gly Ala Ala Leu Cys Thr Gly Leu Arg Arg Val Ile Cys Ser Gly Glu 6500 6505 6510 Ala Leu Gly Thr Asp Leu Ala Val Asp Phe Arg Ala Lys Leu Pro Val 6515 6520 6525 Pro Leu His Asn Leu Tyr Gly Pro Thr Glu Ala Ala Val Asp Val Thr 6530 6535 6540 His His Ala Tyr Glu Pro Ala Thr Gly Thr Ala Thr Val Pro Ile Gly 6545 6550 6555 6560 Arg Pro Ile Trp Asn Ile Arg Thr Tyr Val Leu Asp Ala Ala Leu Arg 6565 6570 6575 Pro Val Pro Pro Gly Val Pro Gly Glu Leu Tyr Leu Ala Gly Ala Gly 6580 6585 6590 Leu Ala Arg Gly Tyr His Gly Arg Pro Ala Leu Thr Ala Glu Arg Phe 6595 6600 6605 Val Ala Cys Pro Phe Gly Val Pro Gly Glu Arg Met Tyr Arg Thr Gly 6610 6615 6620 Asp Leu Val Arg Trp Arg Val Asp Gly Thr Leu Glu Phe Val Gly Arg 6625 6630 6635 6640 Ala Asp Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu Leu Gly Glu 6645 6650 6655 Val Glu Gly Ala Val Ala Ala His Pro Asp Val Val Arg Ala Val Val 6660 6665 6670 Val Val Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val Ala Tyr Val 6675 6680 6685 Thr Val Gly Gly Val Gly Gly Asp Gly Leu Arg Ser Ala Ile Ser Gly 6690 6695 6700 Leu Val Ala Glu Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val Val 6705 6710 6715 6720 Val Leu Asp Glu Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg Ala 6725 6730 6735 Gly Leu Pro Val Pro Val Val Ser Val Ala Gly Phe Cys Ala Pro Ser 6740 6745 6750 Ser Pro Arg Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu Gly 6755 6760 6765 Val Glu Arg Val Gly Val Asp Asp Gly Phe Phe Asp Leu Gly Gly Asp 6770 6775 6780 Ser Ile Leu Ser Ile Gln Leu Val Ala Arg Ala Arg Arg Ala Gly Leu 6785 6790 6795 6800 Glu Leu Ser Val Arg Asp Val Phe Glu Gly Arg Thr Val Arg Ala Leu 6805 6810 6815 Ala Ala Val Val Arg Gly Ser Asp Ala Gly Ala Val Gly Val Val Gly 6820 6825 6830 Gly Ala Glu Ile Val Leu Pro Gly Val Gly Glu Val Glu Arg Trp Pro 6835 6840 6845 Val Val Glu Trp Leu Ala Glu Arg Gly Gly Gly Ser Leu Gly Gly Val 6850 6855 6860 Val Arg Gly Phe Asn Gln Ser Val Val Leu Ala Val Pro Ala Gly Leu 6865 6870 6875 6880 Val Trp Glu Glu Leu Arg Val Leu Leu Gly Ala Val Arg Asp Arg His 6885 6890 6895 Glu Ala Trp Arg Leu Arg Val Leu Asp Ser Gly Ala Leu Cys Val Asp 6900 6905 6910 Gly Val Val Pro Asp Asp Gly Ser Trp Ile Val Arg Cys Asp Leu Ser 6915 6920 6925 Gly Met Gly Val Asp Gly Gln Val Asp Ala Val Arg Ala Ala Ala Val 6930 6935 6940 Glu Ala Arg Ala Trp Leu Asp Pro Ser Val Gly Arg Val Val Arg Ala 6945 6950 6955 6960 Val Trp Leu Glu Arg Gly Gly Asp Arg Ser Gly Val Leu Val Leu Val 6965 6970 6975 Ala His His Leu Val Val Asp Gly Val Ser Trp Arg Val Val Leu Gly 6980 6985 6990 Asp Leu Ala Glu Gly Trp Ala Gln Val Arg Ser Gly Gly Arg Val Glu 6995 7000 7005 Leu Gly Val Val Gly Thr Ser Leu Arg Gly Trp Ala Ala Ala Leu Ala 7010 7015 7020 Glu Gln Gly Arg Arg Gly Glu Arg Ala Gly Glu Val Glu Leu Trp Ser 7025 7030 7035 7040 Arg Met Val Arg Gly Ala Asp Val Leu Val Gly Ser Arg Ala Val Asp 7045 7050 7055 Gly Ala Val Asp Val Phe Gly Gly Val Val Ser Val Asp Ser Arg Ala 7060 7065 7070 Ser Val Ser Val Ser Arg Ala Leu Leu Thr Glu Val Pro Ser Val Leu 7075 7080 7085 Gly Val Gly Val Gln Glu Val Leu Leu Ala Ala Phe Gly Leu Ala Val 7090 7095 7100 Ala Arg Trp Arg Gly Arg Gly Gly Pro Val Val Val Asp Val Glu Gly 7105 7110 7115 7120 His Gly Arg Asn Glu Asp Ala Val Arg Gly Ala Asp Leu Ser Arg Thr 7125 7130 7135 Val Gly Trp Phe Thr Ser Val Tyr Pro Val Arg Val Pro Val Glu Ser 7140 7145 7150 Ala Ser Trp Asp Glu Val Arg Ala Gly Gly Pro Val Val Gly Arg Val 7155 7160 7165 Val Arg Glu Val Lys Glu Thr Leu Arg Ser Leu Pro Asp Gln Gly Leu 7170 7175 7180 Gly Tyr Gly Ile Leu Arg Tyr Leu Asp Pro Glu His Gly Pro Ala Leu 7185 7190 7195 7200 Ala Arg His Ala Thr Pro Gln Phe Gly Phe Asn Tyr Leu Gly Arg Phe 7205 7210 7215 Thr Thr Gly Thr Asp Glu Thr Thr Thr Ala Asp Ala Leu Asp Arg Ala 7220 7225 7230 Pro Ala Trp Ser Leu Leu Ala Arg Ser Ala Ala Gly Gln Asp Pro Glu 7235 7240 7245 Leu Pro Val Ala His Ala Val Glu Phe Asn Ala Ile Thr Leu Asp Thr 7250 7255 7260 Pro Glu Gly Pro Arg Leu Gly Val Thr Trp Ser Trp Pro Thr Thr Leu 7265 7270 7275 7280 Leu Pro Glu Ser Arg Ile Arg Glu Leu Ala Arg Tyr Trp Asp Glu Ala 7285 7290 7295 Leu Glu Gly Leu Val Glu His Ala Arg His Pro Glu Ala Gly Gly Leu 7300 7305 7310 Thr Pro Ser Asp Val Gly Leu Ala Glu Leu Ser Phe Ala Glu Ile Glu 7315 7320 7325 Leu Leu Glu Asp Asp Trp Arg Thr Gln Gly 7330 7335

Claims (14)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 서열번호 10으로 표시되는 코돈 리프로그래밍화된 dptBC 유전자를 포함하는 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 DNA 분자.
  7. 제6 항에 있어서, 상기 DNA 분자는 박테리아 인공 염색체(BAC)로부터 유래된 DNA 서열을 포함하는 것인, DNA 분자.
  8. 제6 항 또는 제7 항의 DNA 분자를 포함하는 벡터.
  9. 제8항에 있어서, 상기 벡터는 플라스미드, 코스미드, BAC 및 효모 인공 염색체(YAC)를 포함하는 군으로부터 선택되는 것인 벡터.
  10. 제8항의 벡터를 통해 형질 전환된 답토마이신 생합성 유전자 군을 포함하는 DNA를 가지고 있는 숙주 세포.
  11. 제10 항에 있어서, 상기 숙주 세포는 스트렙토마이시스 리비단스 (Streptomyces lividans), 스트렙토마이시스 로제오스포로스 (Streptomyces roseosporus), 및 스트렙토마이시스 시엘리칼라 (Streptomyces coelicolor)로 이루어진 군으로부터 선택되는 미생물로부터 유래된 것인 세포.
  12. ⅰ) 스트렙토마이스세스 로제오포러스(Streptomyces roseosporus)의 유전체 라이브러리로부터 dptBC를 포함하는 답토마이신 생합성 유전자 군을 포함하는 포스미드 클론을 선별하는 단계;
    ⅱ) 상기 답토마이신 생합성 유전자 군 중, 비-리보솜성 펩타이드 생합성 유전자 (dptBC, NRPS)의 반복 서열을 제거하기 위한 코돈 리프로그래밍화를 수행하는 단계;
    ⅲ) 상기 코돈 리프로그래밍화에 의해 리팩토링되어 서열번호 10으로 표시되는 dptBC 유전자를 클로닝하는 단계; 및
    ⅳ) 상기 클로닝된 각각의 유전자들을 포함하는 DNA 절편의 서브-클로닝을 통해 재조립하는 단계를 포함하는 리팩토링된 답토마이신 생합성 유전자 군을 클로닝 하는 방법.
  13. 제12항에 있어서, 상기 ⅱ) 단계의 코돈 리프로그래밍화는 dptBC 유전자의 5,596 내지 7,323번째 염기를 포함하는 A 영역, 12,217 내지 15,225 번째 염기를 포함하는 B 영역 및 16,606 내지 21,951번째 염기를 포함하는 C 영역 중 하나 이상의 영역을 각각 치환하여 재구성하는 단계를 포함하는 것인 방법.
  14. 제13항에 있어서, 상기 A 영역, B 영역 및 C 영역은 각각 서열번호 7의 염기서열로 이루어진 합성 A영역, 서열번호 8의 염기서열로 이루어진 합성 B영역, 및 서열번호 9의 염기서열로 이루어진 합성 C영역으로 치환되는 것인 방법.
KR1020200084659A 2020-07-09 2020-07-09 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 KR102533566B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200084659A KR102533566B1 (ko) 2020-07-09 2020-07-09 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200084659A KR102533566B1 (ko) 2020-07-09 2020-07-09 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도

Publications (2)

Publication Number Publication Date
KR20220006800A KR20220006800A (ko) 2022-01-18
KR102533566B1 true KR102533566B1 (ko) 2023-05-16

Family

ID=80052030

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200084659A KR102533566B1 (ko) 2020-07-09 2020-07-09 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도

Country Status (1)

Country Link
KR (1) KR102533566B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230123366A (ko) * 2022-02-16 2023-08-23 건국대학교 산학협력단 신규 합성 프로모터 및 이를 이용한 답토마이신의 생산 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002324580A1 (en) * 2001-08-06 2003-02-24 Cubist Pharmaceuticals, Inc. Compositions and methods relating to the daptomycin biosynthetic gene cluster

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DOEKEL 등, Microbiology, 제14권, 페이지 2872-2880 (2008)

Also Published As

Publication number Publication date
KR20220006800A (ko) 2022-01-18

Similar Documents

Publication Publication Date Title
NZ621527A (en) A genetically modified yeast cell and method of production of recombinant protein or polypeptide thereof
JPH0691827B2 (ja) 新規ベクタ−プラスミド
CN111278852A (zh) 重组欧氏杆菌天冬酰胺酶的生产方法
CN112210549B (zh) 腈水解酶突变蛋白及其在催化合成(r)-3-取代-4-氰基丁酸类化合物中的应用
JP7497348B2 (ja) リボフラビンの改善された産生
CN107858340B (zh) 高催化活性的d-果糖-6-磷酸醛缩酶a突变体、重组表达载体、基因工程菌及其应用
KR102277407B1 (ko) 신규한 글루타메이트 합성 효소 서브 유니트 알파 변이체 및 이를 이용한 l-글루탐산 생산 방법
CN111278979A (zh) 重组大肠杆菌天冬酰胺酶的生产方法
CN111117942B (zh) 一种产林可霉素的基因工程菌及其构建方法和应用
KR102624718B1 (ko) 변이형 rpoc 암호화 서열을 포함하는 핵산 분자
KR102533566B1 (ko) 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도
KR20150069976A (ko) D(-)2,3-부탄디올의 생성능이 증강된 재조합 미생물 및 이를 이용한 d(-)2,3-부탄디올의 생산 방법
CN113461789B (zh) 一种来源于伯克霍尔德氏菌的LysR家族转录调控蛋白、基因及应用
JP2954601B2 (ja) 二次代謝産物生産増加のための生合成遺伝子又は制御遺伝子の単離法及び使用法
KR20230095120A (ko) 재조합 미생물, 이의 제조 방법 및 타가토스 생산에서의 응용
Wachi et al. A novel RNase G mutant that is defective in degradation of adhE mRNA but proficient in the processing of 16S rRNA precursor
JP3549210B2 (ja) プラスミド
CN117651776A (zh) 使用了大肠杆菌的质粒dna的制造方法
CN112410353B (zh) 一种fkbS基因、含其的基因工程菌及其制备方法和用途
KR102565817B1 (ko) 변이형 inc 암호화 가닥을 포함하는 핵산 분자
KR102303662B1 (ko) 화합물을 생산하는 미생물 및 이를 이용한 화합물의 생산 방법
JPH08266277A (ja) 形質転換体を用いたアミド化合物の製造法
CN112375725A (zh) 一种生产维生素b6的代谢工程菌株及其构建方法与应用
JPH0670780A (ja) 放線菌のシトクロムP−450sca遺伝子
CN110551739A (zh) 吡唑霉素生物合成基因簇、重组菌及其应用

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant