KR102533566B1 - 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 - Google Patents
코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 Download PDFInfo
- Publication number
- KR102533566B1 KR102533566B1 KR1020200084659A KR20200084659A KR102533566B1 KR 102533566 B1 KR102533566 B1 KR 102533566B1 KR 1020200084659 A KR1020200084659 A KR 1020200084659A KR 20200084659 A KR20200084659 A KR 20200084659A KR 102533566 B1 KR102533566 B1 KR 102533566B1
- Authority
- KR
- South Korea
- Prior art keywords
- val
- ala
- leu
- gly
- arg
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/76—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 이종 발현이 가능한 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군 및 이의 제조 방법에 대한 것으로, 보다 구체적으로는 스트렙토마이시스 로제오스포로스의 유전체에 포함된 답토마이신 생합성 유전자 군을 클로닝한 후, 생산 수율이 높은 이종 균주에서 발현시킬 수 있도록 리팩토링한 재조합된 답토마이신 생합성 유전자 군의 서열 및 이를 제조하는 방법 및 이의 응용과 관련된 것이다.
Description
본 발명은 생산 수율 향상을 위한 프로모터 엔지니어링 및 이종 발현이 가능하도록 생합성 유전자의 코돈을 리프로그래밍화 하고, 이에 의해 리팩토링된 답토마이신 생합성 유전자 군 및 이의 용도에 대한 것이다.
답토마이신은 미국식품의약처(FDA)에 승인된 리포펩타이드계 항생제로서 항생제 내성 슈퍼박테리아에 우수한 항미생물활성을 나타내며 내성 율이 낮아 다제내성 박테리아 감염증 치료제로 사용된다.
답토마이신의 생산은 스트렙토마이시스 로제오스포로스(Streptomyces roseosporus)의 발효배양 중 유전체 내 답토마이신 생합성 유전자군의 발현에 의해 이루어진다. 답토마이신 생합성유전자군은 생합성에 관련한 전사조절인자, 생합성유전자, 수송유전자 등을 포함하고 있다. 하지만 생산균주 내 답토마이신 생합성유전자군의 발현은 복잡한 발현 시스템에 조절되어 발현 수준이 매우 낮아 소량의 답토마이신이 생산되며, 고생산성 균주 개발의 어려움으로 작용한다.
생합성유전자군의 전사 및 발현율 증가에 따른 생산수율 증가방법으로는 다중화프로모터 엔지니어링과 같은 유전적 조작방법이 개발되었지만, 답토마이신 생합성유전자군의 경우 상대적으로 큰 핵산분자의 염기서열과 비-리보솜성 펩타이드 생합성유전자 (dptBC, non-ribosomal peptide synthetase) 내 다수의 반복되는 염기서열로 인해 클로닝을 통한 이종발현 및 프로모터 엔지니어링 조작이 제한된다.
따라서, 답토마이신 대량생산능을 갖는 산업 균주 개발을 위해서는 답토마이신 생합성 유전자군의 리팩토링 및 이종발현 방법에 의한 답토마이신 대량생산 방법에 대한 개발 및 연구가 절실히 필요하다.
이에 본 발명자들은 답토마이신의 생산 수율 증가 및 이종 발현을 위한 목적으로 답토마이신 생합성 유전자 군에 대한 연구 끝에, 상기 유전자의 일부 서열을 치환 또는 코돈 리프로그래밍화를 통해 리팩토링하고, 이를 대량 생산이 가능한 산업 균주에서 발현하여, 답토마이신을 생산할 수 있는 본 발명을 완성하였다.
즉, 본 발명의 목적은 답토마이신 생합성 유전자 군 내의 비-리보솜성 펩타이드 생합성 효소 유전자 내의 반복 서열을 코돈 리프로그래밍화를 통한 리팩토링에 의해 제거한 답토마이신 생합성 유전자 군을 포함하는 DNA 분자를 제공하는 것이다.
본 발명의 다른 목적은, 상기 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 DNA 분자가 포함된 벡터를 제공하는 것이다.
본 발명의 또 다른 목적은, 상기 벡터를 통해 형질 전환된 숙주 세포를 제공하는 것이다.
본 발명의 또 다른 목적은, 본 발명은 스트렙토마이시스 로제오포러스(Streptomyces roseosporus)의 유전체 라이브러리로부터 개별 dptA, dptBC 및 dptD 유전자를 포함하는 포스미드(fosmid)를 선별하는 단계; 상기 답토마이신 생합성 유전자 군 내의, dptBC 유전자의 반복 염기서열을 제거하기 위한 코돈 리프로그래밍화를 수행하는 단계; 코돈 리프로그래밍화된 dptBC와 dptA 및 dptD 유전자들을 포함하는 유전자 군의 리팩토링 및 클로닝 단계; 및 상기 클로닝된 각각의 유전자를 서브-클로닝하여 재조립하는 단계를 포함하는 리팩토링된 답토마이신 생합성 유전자 군의 클로닝 방법을 제공하는 것이다.
상기와 같은 목적을 달성하기 위하여, 본 발명은 답토마이신 생합성 유전자 군 내의 비-리보솜성 펩타이드인 답토마이신의 생합성 유전자(답토마이신 NRPS) 서열 내에 포함된 반복 서열 중 한 개 이상의 서열을 코돈 리프로그래밍화를 통해 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 DNA 분자를 제공한다.
답토마이신 생합성 유전자 군은 유기체, 바람직하게는 박테리아 세포에서 답토마이신의 생합성을 위해 필요한 생합성 효소, 수송 단백질 그리고 전사 조절 단백질 등을 코딩하는 유전자를 포함하는 DNA 분자이다. 답토마이신 생합성 유전자 군은 비-리보솜성 펩타이드 생합성 효소(DptA, DptBC, DptD), 보조 생합성 효소(DptE, DptF, DptG DptH, DptI, DptJ), 수송 단백질(DptM, DptN, DptP), 그리고 전사 조절 단백질 (DptR1, DptR2)을 코딩하는 유전자들과 그 외 기능이 알려지지 않은 답토마이신 합성에 필요한 다른 생합성 효소 단백질을 코딩하는 유전자 서열을 포함한다. 본 발명의 일 실시 예에서, 상기 답토마이신 생합성 유전자 군은 상기 제1항에 있어서, 상기 dptA, dptBC ,dptD, dptE, dptF, dptG, dptH, dptI, dptJ, dptM, dptN, dptP, dptR1 및 dptR2 으로 이루어진 군으로부터 선택되는 하나 이상의 답토마이신 생합성 유전자 를 포함하며, 이에 제한되는 것은 아니나, 특히 "dptA", "dptBC", 및 "dptD" 중 어느 하나 이상을 포함할 수 있다. 상기 "dptA", "dptBC", 및 "dptD" 는 답토마이신의 뼈대 화학 구조의 생합성에 관여하는 일련의 서브유닛으로 구성되는 비-리보솜성 펩타이드 생합성 효소 들을 코딩하는 유전자에 해당한다.
본 발명의 일 양태로서, 상기 답토마이신 생합성 유전자 군을 포함한 포스미드 클론은 스트렙토마이스세스 로제오포러스 (Streptomyces roseosporus)의 유전체 라이브러리로부터 서열번호 1 내지 서열번호 6 의 염기 서열의 프라이머를 이용하여, PCR 스크리닝 방법에 의해 선별된 것이며, 상기 비-리보솜성 펩타이드 생합성 유전자(NRPS)의 염기서열 내에 다수의 반복적인 염기서열을 포함하는 특징이 있다.
본 발명자들은 상기 반복 서열에 의해 답토마이신 생합성 유전자 군의 프로모터 엔지니어링에 한계가 있음을 확인하고, 이를 해결하고자 상기 반복 서열과 코딩하는 아미노산 서열은 동일하나 상이한 코돈을 포함하는 염기서열로 이를 치환하는 코돈 리프로그래밍화를 수행하였다.
본 발명의 일 실시 예에서, 상기 답토마이신 비-리보솜성 펩타이드 생합성 효소 유전자(dptBC NRPS)는 서열번호 3 및 서열번호 4의 프라이머 쌍에 의해 선별된 "pNRRL11379-248-6" 단위체 DNA 염기서열 내에 포함되며, 상기 유전자(dptBC, NRPS, 22,017bp)의 반복 서열은 상기 단위체 서열의 5,596 내지 7,323번째 서열을 포함하는 A 영역, 12,217 내지 15,225 번째 서열을 포함하는 B 영역 및 16,606 내지 21,951 번째 서열을 포함하는 C 영역이며, 코돈 리프로그래밍화 결과, 상기 A, B 및 C 영역은 각각 서열번호 7의 염기서열로 이루어진 합성 A영역, 서열번호 8의 염기서열로 이루어진 합성 B영역, 및 서열번호 9의 염기 서열로 이루어진 합성 C영역으로 치환되었다.
본 발명의 일 실시양태에서, 상기 DNA 분자는, 각각의 답토마이신 생합성 유전자 군이 박테리아 인공 염색체(BAC)에 서브클로닝 됨으로써, 상기 BAC으로부터 유래된 DNA 서열을 포함하는 것인, DNA 분자이다. 본 발명의 답토마이신 생합성 유전자 군에 포함되는 dptA, dptBC 및 dptD 유전자는 각각 효모 내 상동재조합을 통하여 BAC 벡터 시스템으로 서브클로닝 되었다.
본 발명의 다른 목적을 달성하기 위하여, 본 발명은 상기의 DNA 분자를 포함하는 벡터 및 이를 통해 형질 전환된 숙주 세포를 제공한다. 상기 벡터는 그 종류에 제한되는 것은 아니나, 플라스미드 (plasmid), 코스미드 (cosmid), 포스미드 (fosmid), 박테리아 인공 염색체(BAC) 또는 효모 인공 염색체(YAC)일 수 있다. 상기 벡터는 숙주 세포의 게놈으로 통합되어 숙주 게놈과 함께 복제된다. 본 발명의 벡터는 상기 벡터 내에 작동 가능하게 연결된 답토마이신 생합성 유전자 군을 발현되도록 할 수 있으며, 이는 재조합 발현 벡터이다. 본 발명의 일 실시예에서, 상기 재조합 발현 벡터는 BAC을 이용하였다.
본 발명에서 제공하는 DNA 분자의 주요한 특징은 효모 내 상동재조합을 이용한 리팩토링 혹은 이종 발현이 가능한 점에 있다. 따라서, 본 발명의 상기 숙주 세포는 그 종류에 제한되는 것은 아니나, 스트렙토마이스시스 로제오포러스(Streptomyces roseosporus) 및, 이 밖에 이종 숙주를 이용할 수 있다. 상기 유전적 엔지니어링을 위한 숙주는 효모 혹은 대장균, 이종 발현 숙주로는 스트렙토마이시스 리비단스(Streptomyces. lividans) 혹은 스트렙토마이시스 시엘리칼라(Streptomyces coelicolor) 등을 이용할 수 있다.
본 발명의 또 다른 목적을 달성하기 위하여, 본 발명은 스트렙토마이시스 로제오포러스(Streptomyces roseosporus)의 유전체 라이브러리로부터 dptA, dptBC 또는 dptD 생합성 유전자를 포함하는 포스미드 클론을 선별하는 단계; 상기 답토마이신 생합성 유전자 군 중, dptBC의 반복 서열을 제거하기 위한 코돈 리프로그래밍화를 수행하는 단계; 코돈 리프로그래밍화된 dptBC, dptA 및 dptD 유전자 들을 포함하는 유전자 군을 클로닝하는 단계; 및 상기 클로닝된 유전자군을 서브-클로닝하여 재조립하는 단계를 포함하는 리팩토링된 답토마이신 생합성 유전자 군의 클로닝 방법을 제공한다.
본 발명에서 "리팩토링"이란, 세포에서 발현되는 유전자 발현 패턴을 조절하여, 목적하는 세포로 전환시키기 위한 방법을 말한다. 일반적으로 클로닝은 외래 유전자 또는 DNA 등을 포함하는 벡터를 도입하는 과정을 통해 수행될 수 있으며, 본 발명에서는 재조합된 답토마이신 생합성 유전자 군을 포함하는 DNA 서열을 숙주 세포에 도입함으로써 수행될 수 있다.
상기 답토마이신 생합성 유전자 클러스터는 dptA, dptBC 및 dptD 유전자 서열을 포함하며, 본 발명에서는 상기 유전자 중에서 dptBC의 반복 DNA 염기서열을 제거하기 위하여 코돈 리프로그래밍화를 수행하였다. "코돈 리프로그래밍(Codon reprograming)" 이란, 단백질을 코딩하는 부위의 아미노산 코돈 중에서 반복 염기서열에서 나타나는 코돈을 동일 아미노산을 코딩하는 대체 코돈으로 변형시켜 상동재조합을 일으킬 수 있는 반복 염기서열을 제거하는 과정을 말한다. 본 발명에서는 상기 코돈 리프로그래밍화된 서열을 포함하는 답토마이신 생합성 유전자 클러스터가 스트렙토마이시스 속(sp.)에 속하는 미생물 뿐만 아니라, 답토마이신의 대량 생산이 가능한 산업 미생물에서 DNA를 안정적으로 유지하고, 증폭할 수 있도록 하는 효과를 가진다. 또한 이러한 이종 발현을 통해, 결과적으로는 답토마이신의 생산 수율을 현저히 개선할 수 있게 되었다.
본 발명의 또 다른 목적을 달성하기 위하여, 본 발명은 상기 설명한 코돈 리프로그래밍화에 의해 리펙토링된 답토마이신 생합성 유전자 군을 포함하는 DNA 분자를 이용하여 답토마이신을 생산하는 방법을 제공한다.
본 발명의 일 실시 예에서, 상기 DNA 분자를 통해 형질 전환된 대장균에서, 상기 도입된 DNA의 안정적 발현 및 복제를 유지함을 확인하였다. 즉, 기존의 반복 서열을 가지고 있는 답토마이신 생합성 유전자 군(WT: Wild Type)과 비교하여, WT의 경우에는 다수의 DNA 절편이 관찰되는 등, 세포 내 유지 및 복제가 불완전 하였던 반면, 본 발명의 코돈 리프로그래밍화에 의해 리팩토링된 DNA 분자는 이종 숙주인 대장균에서도 안정적으로 유지 및 증폭됨을 확인하였다.
본 발명은 이종 발현이 가능하도록 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군 및 이의 용도에 대한 것으로, 코돈 리프로그래밍화된 서열을 포함하는 리팩토링된 답토마이신 생합성 유전자 군이 답토마이신의 대량 생산이 가능한 산업 미생물에서 DNA를 안정적으로 유지하고, 증폭할 수 있도록 하는 효과를 가진다.
도 1은 본 발명에 따른 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군 및 이를 이용한 이종 발현 과정을 나타낸 모식도이다.
도 2는 스트렙토마이시스 로제오스포로스(S. roseoporus) 유전체 내의 답토아미신 생합성 유전자 군 및 이의 포스미드 클론을 선별하는 과정을 나타낸 것이다.
도 3은 답토마이신 생합성 유전자 군에 포함된 비 리보솜성 펩타이드 생합성 유전자 (dptBC NRPS)의 반복 서열 및 이의 코돈 리프로그래밍화 결과의 좌표를 나타낸 것이다.
도 4는 코돈 리프로그래밍화된 dptBC 유전자를 포함하는 답토마이신 생합성 유전자 군의 재조립을 위한 서브클로닝 및 이의 유전자 맵을 나타낸 것이다.
도 5는 효모 내 상동 재조합에 의한 신규 리팩토링된 답토마이신 생합성 유전자 군의 클로닝 과정 및 클론을 선별하는 과정을 나타낸 것이다.
도 6은 스트렙토마이시스 리비단스(S. lividans)를 생산 균주로 하여, 이종 발현에 의한 답토마이신 유도체인 리포펩타이드 생산을 고성능 액체 크로마토그래피로 분석한 결과이다.
도 7은 본 발명의 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 BAC 클론이 숙주 세포 내에서 안정적으로 복제 및 증폭되는 결과를 확인한 것이다.
도 2는 스트렙토마이시스 로제오스포로스(S. roseoporus) 유전체 내의 답토아미신 생합성 유전자 군 및 이의 포스미드 클론을 선별하는 과정을 나타낸 것이다.
도 3은 답토마이신 생합성 유전자 군에 포함된 비 리보솜성 펩타이드 생합성 유전자 (dptBC NRPS)의 반복 서열 및 이의 코돈 리프로그래밍화 결과의 좌표를 나타낸 것이다.
도 4는 코돈 리프로그래밍화된 dptBC 유전자를 포함하는 답토마이신 생합성 유전자 군의 재조립을 위한 서브클로닝 및 이의 유전자 맵을 나타낸 것이다.
도 5는 효모 내 상동 재조합에 의한 신규 리팩토링된 답토마이신 생합성 유전자 군의 클로닝 과정 및 클론을 선별하는 과정을 나타낸 것이다.
도 6은 스트렙토마이시스 리비단스(S. lividans)를 생산 균주로 하여, 이종 발현에 의한 답토마이신 유도체인 리포펩타이드 생산을 고성능 액체 크로마토그래피로 분석한 결과이다.
도 7은 본 발명의 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 BAC 클론이 숙주 세포 내에서 안정적으로 복제 및 증폭되는 결과를 확인한 것이다.
이하, 본 명세서를 구체적으로 설명하기 위해 실시 예를 들어 상세히 설명한다. 그러나, 본 명세서에 따른 실시 예들은 여러 가지 다른 형태로 변형될 수 있으며, 본 명세서의 범위가 아래에서 상술하는 실시 예들에 한정되는 것으로 해석되지는 않는다. 본 명세서의 실시 예들은 당 업계에서 평균적인 지식을 가진 자에게 본 명세서를 보다 완전하게 설명하기 위해 제공되는 것이다.
실시예 1. 스트렙토마이시스 로제오스포로스 유전체 DNA 라이브러리 제작
답토마이신 생산 균주의 유전체 DNA를 추출하기 위해, 스트렙토마이시스 로제오스포로스 균주를 TSB배지에 접종하여 30의 배양기에서 3-4일간 배양하였다. 배양액으로부터 원심분리기를 이용해 균체를 분리한 후 염석(salting out)방법으로 유전체 DNA를 분리하였으며 이는 DNA 전기영동법으로 확인하였다.
상기 분리한 유전체 DNA 단편은 루시젠(Lucigen) 회사의 포스미드(Fosmid) 라이브러리 제작 키트의 방법에 따라 pCC1FOS (Genebank: EU140751)에 클로닝하고, 이를 EPI300T1 대장균 균주에 형질 전환하여 유전체 라이브러리를 제작하였다.
실시예 2. 답토마이신 생합성 유전자 군을 포함하는 클론 선별
상기 실시예 1에서 제작한 유전체 라이브러리를 대상으로 PCR 기반 스크리닝 방법을 이용하여 답토마이신 생합성 유전자 군을 포함하는 포스미드 클론인, pNRRL11379-7-24, pNRRL11379-248-6 및 pNRRL11379-178-42을 선별하였다. PCR 스크리닝에 사용된 프라이머 쌍의 DNA 염기서열은 하기 표 1과 같다.
단위체 | 이름 | 길이 | 서열 | 서열번호 |
pNRRL11379-7-24 | dpt_Front_GT_FW1 | 20 | CGATTGGTGAACGTGATGGT | 1 |
dpt_Front_GT_RV1 | 20 | CGAGGAGATGACCGATCCAG | 2 | |
pNRRL11379-248-6 | dpt_Middle_GT_FW1 | 20 | CGTGGTGGGTGACATCGAGA | 3 |
dpt_ Middle _GT_RV1 | 20 | CTGGACGACACAGAGATCCG | 4 | |
pNRRL11379-178-42 | dpt_Back_GT_FW1 | 20 | TACGAGAACCACGGCAGTCT | 5 |
dpt_Back_GT_RV1 | 20 | GCACCAGTCTTGCGCTCTTG | 6 |
도 2에 도시한 바와 같이, 상기 선별한 세 개의 포스미드 클론에 대하여 생어 분석 방법을 통해 해당 클론의 말단 DNA 염기서열을 확인하였으며, 그 결과, pNRRL11379-248-6 클론의 말단이 pNRRL11379-7-24 및 pNRRL11379-178-42의 말단과 서로 부분적으로 중복됨을 확인하였다.
실시예 3. 비 리보솜성 펩타이드 생합성 유전자(dptBC)의 코돈 리프로그래밍화에 의한 리팩토링
상기 실시 예 2에서 선별한 pNRRL11379-248-6 클론은 dptBC 비-리보솜성 펩타이드 생합성 효소의 유전자를 포함하고 있으며, 이는 22,017 kb 길이의 DNA 염기서열로서, 7,339개의 아미노산으로 이루어진 단백질을 암호화한다. 하지만 dptBC 유전자 내 생합성 모듈간에 고도의 유사성을 가지는 서열을 포함하며, 다수의 반복되는 염기서열이 존재하고 있어, 정확한 반복 염기서열의 위치와 크기 및 중복 회수를 분석하기 위해 온라인 생물정보 소프트웨어인 Ugene 소프트웨어를 사용하여 dptBC 생합성 유전자의 DNA 염기서열을 분석하고, 이 정보를 바탕으로 코돈 리프로그래밍 방법을 디자인 하였다.
본 발명에서는 반복되는 DNA 염기서열을 제거하고자 dptBC 비리보솜성 펩타이드 생합성 효소의 아미노산 암호화 코돈 중에서 반복되는 DNA 염기서열에 포함되는 코돈 들을, 동일한 아미노산을 코딩하는 다른 코돈 들로 대체하였다. 또, 암호화 서열 중 희귀 코돈(rare codon)은 방선균 숙주에서 편중되어 사용되는 코돈(preferred codon)으로 대체하는 코돈 최적화 (Codon-optimization) 방법을 사용하였다.
그 결과, dptBC 비-리보솜성 펩타이드 생합성효소의 유전자 코돈은 도 3과 같이 리프로그래밍에 의해 재구성되었으며, 정확하게는 5,596-7,323 번째 염기서열 (SynthA region : 1,728), 12,217-15,225 번째 염기서열 (SynthB reion : 3,009), 16606-21951 번째 염기서열 (SynthC region: 5,346)이 각각 리프로그래밍에 의해 재구성되었다.
코돈 리프로그래밍화에 의해 리팩토링 된 비-리보솜성 펩타이 생합성효소의 유전자(dptBC)를 클로닝하기 위해 젠스크립트(Genescript) 회사에 유전자 합성 서비스를 의뢰하여 공통염기서열(Overlapped sequences)을 포함한 각 6,500 bp, 4,804 bp, 2730 bp 크기의 DNA 염기서열을 갖는 3개의 DNA 분자를 화학적 방법으로 합성하였다.
실시예 4. 효모 내 상동재조합에 의한 답토마이신 생합성유전자 군 클로닝
먼저, 상기 <실시예 2> 및 <실시예 3>에서 제작한 3개의 답토마이신 생합성 유전자를 포함하는 단편 클론들의 염기서열 들을 생어 분석법으로 확인하였고, 도 4의 내용과 같이 효모 내 상동재조합(Homologous recombination)을 이용해 BAC 벡터 시스템으로 각각 서브 클로닝(Sub-cloning)하였다.
구체적으로, <실시예 2> 및 <실시예 3>에서 제작한 답토마이신 생합성유전자를 포함하는 단편 클론들이 서브 클로닝 되어있는 (Sub-cloning) BAC 클론들을 SwaI 제한효소를 처리하여 선형화(linearization) 하고, HpaI 제한 효소로 처리된 캡쳐 BAC 벡터와 함께 염화 리튬 형질전환 방법으로 효모에 동시에 형질전환하였다. 이때, 효모의 상동재조합(Homologous recombination)에 의해서 재조립된 형질 전환체는 His이 결핍된 한천배지에서 선별되었고, 3-4일 동일한 구성성분을 갖는 배지에서 액체 배양 후 재조합 DNA를 분리하였다.
그 결과, 도 5에서 보는 바와 같이, 답토마이신 생합성유전자 군이 클로닝 된 BAC 클론은 PCR을 이용한 방법 및 DNA 전기영동 방법을 이용하여 확인되었다. PCR 스크리닝을 위한 프라이머 염기서열은 하기 표와 같다.
단위체 | 프라이머 이름 | 프라이머 쌍 번호 |
서열 |
Reprogrammed daptomycin biosynthetic gene cluster | dpt_Front_GT_FW1 | 1 | GGTTACAGAAGTCGTGAA |
dpt_Front_GT_RV1 | TTCAAGCCCCTCTACGACGA | ||
dpt_Front_GT_FW2 | 2 | GTGAAGTCCCGGAGGCTCTC | |
dpt_Front_GT_RV2 | CGTTTCGCGCTGACTTTCCA | ||
dpt_Middle_GT_FW1 | 3 | CGTGGTGGGTGACATCGAGA | |
dpt_Middle_GT_RV1 | CTGGACGACACAGAGATCCG | ||
dpt_Middle_GT_FW2 | 4 | TACACGCGAGTGTTGAGGAT | |
dpt_Middle_GT_RV2 | GAAGCCATGTGGTACTCGAC | ||
dpt_Middle_GT_FW3 | 5 | TTCCACTCCGTCAGGACACG | |
dpt_Middle_GT_RV3 | CCGAAGATCTCATCGGCTTC | ||
dpt_Middle_GT_FW4 | 6 | CACGATCAGATCCAGCCCAC | |
dpt_Middle_GT_RV4 | AACACGATTGACCGTGAGGT | ||
dpt_Middle_GT_FW5 | 7 | GCGGAGTTTGATCTGATCGT | |
dpt_Middle_GT_RV5 | AACTGCACCTTATTGACGAC | ||
dpt_Back_GT_FW1 | 8 | ACAGGATCTCTTCACGGGCT | |
dpt_Back_GT_RV1 | CCATCGGCGAACTGTATGTG | ||
dpt_Back_GT_FW2 | 9 | TACGAGAACCACGGCAGTCT | |
dpt_Back_GT_RV2 | GCACCAGTCTTGCGCTCTTG |
본 발명에서 제작된 리팩토링된 답토마이신 생합성유전자 군이 클로닝된 BAC 클론의 전체 DNA 염기서열은 일루미나 (Illumina) 차세대염기서열분석(NGS)법을 이용하여 동정하였다.
실시예 5. 리팩토링된 답토마이신 생합성유전자 군의 이종발현
상기에서 수행한 실험 결과를 바탕으로, 리팩토링된 답토마이신 생합성유전자군의 이종 발현 방법을 구축하였다.
구체적으로, 상기 코돈 리프로그래밍화에 의해 리팩토링된 답토마이신 생합성유전자군 BAC 클론은 대장균의 접합성 형질전환 (Conjugative transfer method) 방법을 이용하여 이종 숙주인 스트렙토마이시스 리비단스 (Streptomyces lividans) 균주로 형질전환 하였으며, 형질전환체는 10 mM 염화마그네슘이 첨가된 ISP4 (BD bioscience, USA) 배지에서 항생제 내성 특이성을 이용해 선별하였다.
선별된 형질전환체는 아프라마이신(Apramycin) 날리딕산(Nalidixic acid)이 첨가된 ISP4 고체배지에서 7-8일간 배양 후 포자를 회수하여 100 ml 삼각플라스크의 R5A 액체배지에 접종하여 배양하였다.
도 6의 내용과 같이, 이종 숙주의 배양액 내 대사 산물의 정성 분석은 역상 액체크로마토그래피(Reverse-phased HPLC)법을 이용하여 분석하였다. 그 결과 답토마이신 유도체(A21978C)가 생산되었으며 HPLC/MS을 이용한 분자량 분석 시, 각각 1634(A21978C1), 1648(A21978C2), 1662(A21978C3)의 분자량을 갖는 것을 확인할 수 있었다.
실시예 6. 리팩토링된 답토마이신 생합성 유전자군 BAC 클론의 복제 및 증폭
본 발명에 의한 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 BAC 클론은 코돈 리프로그래밍화에 의해 반복적 염기서열을 제거하였으며, 유전적 엔지니어링(Genetic engineering)에 용이한 모델 생명체 (Model organism)인 효모, 대장균 혹은 방선균으로의 형질전환 및 유전적 복제가 가능한 BAC 클론 시스템을 구축하였다.
상기 <실시예 4>에서 선별된 리팩토링된 답토마이신 생합성 유전자 군이 포함된 BAC 클론은 기존의 반복적 염기서열을 보유한 답토마이신 생합성 유전자 군 BAC 클론에 비해 세포 내에서 안정적 유지 및 복제가 가능하다는 장점이 있다.
이를 확인하기 위한 방법으로, 기존의 답토마이신 생합성 유전자 군 그리고 본 발명의 리팩토링된 답토마이신 생합성 유전자군이 포함된 각각의 BAC 클론을 전기충격 형질전환 (Electro-transformation) 방법을 이용하여 대장균 내 형질전환 후, 클로람페니콜 (Chloramphenicol 12.5 μg/ml) 혹은 아프라마이신 (Aprmycin 50μg/ml) 을 함유한 LB (Difco broth miller, BD) 한천배지에서 항생제 내성 특이성을 이용하여 형질전환체를 선별하였다. 이후, 각 대장균 클론들은 클로람페니콜 (Chloramphenicol 12.5 μg/ml) 및 유도인자용액(Copy control induction solution) 이 첨가된 LB 액체배지에서 배양 (37℃ 24시간 배양) 후 세포 내 플라스미드(Plasmid)를 추출하였다. 추출한 각 답토마이신 생합성유전자군을 포함하는 BAC 클론은 도7에서 나타낸 바와 같이 0.5% 아가로즈겔 (Agarose gel)에서 135 V로 60분간 전기영동 (electrophoresis)하였다.
그 결과, 도 7에서 보듯이, 기존의 답토마이신 생합성 유전자 군이 포함되어 있는 BAC 클론은 세포 내 불안정한 유지 및 복제로 인한 다수의 DNA 절편 조각이 관찰 되었지만, 반면 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 BAC 클론은 기존의 답토마이신 생합성 유전자 군 클론에 비해 안정적 세포 내 유지 및 플라스미드 증폭이 가능하였다. 모델 생명체 내 안정적 유지 및 복제는 유전적 엔지니어링에 유용하게 이용될 수 있으며, 다른 이종 숙주로의 형질전환을 가능하게 한다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 진술한 설명이 아니라 청구 범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
<110> Industry academy coorperation of Konkuk university
<120> Codon-reprogrammed daptomycin non-ribosomal peptide synthetase
gene and uses thereof
<130> 1067439
<160> 11
<170> KoPatentIn 3.0
<210> 1
<211> 20
<212> DNA
<213> Streptomyces roseosporus
<400> 1
cgattggtga acgtgatggt 20
<210> 2
<211> 20
<212> DNA
<213> Streptomyces roseosporus
<400> 2
cgaggagatg accgatccag 20
<210> 3
<211> 20
<212> DNA
<213> Streptomyces roseosporus
<400> 3
cgtggtgggt gacatcgaga 20
<210> 4
<211> 20
<212> DNA
<213> Streptomyces roseosporus
<400> 4
ctggacgaca cagagatccg 20
<210> 5
<211> 20
<212> DNA
<213> Streptomyces roseosporus
<400> 5
tacgagaacc acggcagtct 20
<210> 6
<211> 20
<212> DNA
<213> Streptomyces roseosporus
<400> 6
gcaccagtct tgcgctcttg 20
<210> 7
<211> 1728
<212> DNA
<213> Artificial Sequence
<220>
<223> Reprogrammed region A
<400> 7
gtcgtcccgg tgggtgtcgt cggtgagctg tacgtggccg gtgtcggtct cgcacggggg 60
tacctcggtc gtgccggtct cacggccgag cggttcgtgg cgtgcccgtt cggtgcgccg 120
ggtgagcgta tgtaccgtac gggggatctg gtgcggtggc gggtggacgg cgccctggag 180
ttcgtgggtc gtgcggacga ccaggtcaag gtgcgtggct tccgggtcga gttgggtgag 240
gtcgagggtg ccgtggcagc ccacccggac gtggtgcgtg cggtcgtggt cgtccgggaa 300
gaccgtcccg gtgaccaccg cctggtggcg tacgtgacgg gtgtcgacac cggtggcctc 360
agcagcgcgg tcatgcgtgc ggtcgcggag cgtctccctg cctacatggt cccgagcgcc 420
gtggtcgtgc tggacgagat cccgctgacc ccgaacggga aggtggaccg ggcggcgctt 480
ccggtgccgg gggtggaggc gggcgcgggc taccgggcgc ctgttagccc gcgtgaggaa 540
gtcctgtgcg gtctcttcgc cgaagtgctc gggctggagc gggtgggggt ggacgatgat 600
ttcttcgggt tgggtggtca ctcgctgctg gcgacgcgtc tgatctcgcg tgtccgtgcg 660
gtgctcggtg tggaggcggg tgtgcgtgcg ctcttcgagg cgccgacggt gagccgtctg 720
gagcggctgc tgcgggagcg gagcgctctc ggggtgcggg tgccgctggt ggcacgggag 780
cggacgggtc gggagccgct gagcttcgct cagcagcgtc tgtggttcct ggaggagctg 840
gagggtcccg gtgctgcgta caacatcccg atggcgctgc gtctggccgg tgtgctggac 900
gtcgaggcgc tgcaccaggc gctcatcgac gtcatcgctc gccacgagag cctccgcacc 960
ctcatcgcgc aggatgcggg tacggcctgg cagcacatcc tgcccgtgga cgaccctcgc 1020
acccgtcccg gtctccctct ggtggacatc ggtgccgacg ccctgcagga gcggctcgac 1080
gaggccgctg gtcggccctt cgacctcgct gccgacctcc cggtccgtgc cacggtcttc 1140
cgcctcaccg acaacgacca catcctcctg gtcgtggccc accacgtggc cttcgacgcg 1200
atgtcccgtg tgccgttcat ccggaacgtc aagcgcgcct tcgaggcccg tacgaacggc 1260
gcagcccccg actggcgtcc gctgcccgtg cagtacgcgg actacgcggc ctggcagcgc 1320
gacgtgctcg gcacggagga cgacgagtcg agcgagctgt cggcccagct cgcctactgg 1380
cgcacccagc tagcctcgct gcctgccgag ctggcgctcc cgacggaccg tgcccgtccc 1440
gccgtcgcct cgtacgaagg cggcaaggtc gagttcaccg tccccgctgg tgtgtacgac 1500
ggcctggtgg ctctcgcccg tgccgagggt gtcacggtct tcatggtcgt gcaggcggcg 1560
ctggccgcgc tcctctcccg gctgggtgcc ggcgacgaca tcccgatcgg gacgccgatc 1620
gccggccgca ccgaccaggc caccgaagat ctcatcggct tcttcgtgaa caccctcgtc 1680
ctccgcacgg acgtcagcgg tgacccgacc ttcgcggagc tgctggcc 1728
<210> 8
<211> 3009
<212> DNA
<213> Artificial Sequence
<220>
<223> Reprogrammed region B
<400> 8
ctggtccggg tcctcgaggg cgtcgtcagc ggcggtggcg gtgtctccgt gagcggtgtg 60
gatgtcctcg gtgtcggcga gcgcgaacgg ttgctcggtt ggggcgtcgg cggaccggtc 120
ccggtcgtgc ccggaggcgg tctcgtcggc ctgttcgaag agcgcgtccg tgcggacgcc 180
gatgccgtcg ccgtccgtgg tgcaggcgtc gtctggtcct acggcgagct caacgcccgg 240
gtcaacgtgg tcgcccgctg gctcgtcgga cgcggcgtcg gtgccgagtg cggtgtcggc 300
gtcgtcatgg gtcgcggtgt cgacgtggtc gtcatgctgc tcgccgtcgc caaggccggt 360
ggcttctacg tgcccgtcga ccccgagtgg cccgtcgagc gcgtcggctg ggtcctcgcc 420
gacgccggtg tcggcctcgt ggtcgtcggt gagggcctct cccacgtcgt gggtgacttc 480
cccggtggcg aggtgttcga attctcccgc gtggtgcgcg agtcctgcct ggtcgagctc 540
gtcgcggctg acggtgtcga ggtgcgcaac gtcaccgacg gcgagcgcgc ctcccgtctc 600
ctccccggtc accccctcta cgtcgtgtac acctccgggt ccacgggtcg tcccaagggc 660
gtcgtcgtca cccacgcctc ggtcggcggt tacctggccc gtggccggga cgtctacgca 720
ggcgccgtgg gcggtgtcgg gttcgtccac tcgtccctcg ccttcgacct gaccgtcacc 780
gtgctcttca ccccgttggt ctcgggtggc tgcgtggtgc tgggcgagct cgacgagtcc 840
gcccagggtg tcggggcctc cttcgtcaag gtcaccccgt cccacctcgg tctcctcggc 900
gagctcgagg gcgtcgtcgc cggtaacggg atgctcctcg tcggtggcga ggccctctcc 960
ggtggggctc tccgcgagtg gcgcgagcgc aaccccggtg tcgtggtcgt caacgcctac 1020
ggtcccaccg agctcaccgt caactgcgcg gagttcctga tcgcccctgg cgaggaggtg 1080
cccgacggcc cggtcccgat cggtcgcccg ttcgctggcc agcggatgtt cgtgctcgac 1140
gcggccctgc gcgtcgtccc ggtgggcgtc gtgggcgagc tctacgtcgc cggtgtcggc 1200
ctcgctcggg gttacctggg tcgcgtcggt ctcaccgccg agcgcttcgt cgcctgcccg 1260
ttcggcgtgc ccggcgaacg catgtaccgg acgggtgacc tggtccgttg gcgcgtcgac 1320
ggtgcgctgg agttcgtcgg tcgcgccgac gaccaggtca aggtgcgcgg tttccgcgtc 1380
gagctcggcg aggtcgaggg tgcggtcgct gcgcacccgg acgtggtccg tgccgtggtg 1440
gtcgtccggg aggatcgtcc cggtgaccac cgcttggtcg cctacgtcac cgctggtggc 1500
gtgggtggtg acggcctgcg gtcggccatc tccggtctcg tggccgagcg cctccctgcc 1560
tacatggtcc cgtccgccgt cgtggtcctg gacgagatcc ccctcacccc gaacggtaag 1620
gtcgaccgtg ctgcgctgcc ggtccccgag gtcgaggccg ggacggggta ccgcgctccg 1680
gtgagccctc gcgaggaggt cctctgcggt ctcttcgccg aggtcctcgg tgtggagcgg 1740
gtcggtgtgg atgacgactt cttcgagctc ggcggtcact ccctgctcgc gacccgtctc 1800
atctcccgtg tgcgtgccgt gctcggcgtc gaggccggtg tccgtgccct cttcgaggcc 1860
ccgaccgtgt cgcgcctgga gcgcctgctg cgtgagcgct ccggtctcgg ggtccgcgtg 1920
ccgctcgtcg cacgcgagcg caccggtcgt gagccgctgt ccttcgcgca gcagcggctc 1980
tggttcctgg aggagctgga gggtccgggt gcggcctaca acatccccat ggccctgcgg 2040
ctcgcgggtg tgctcgacgt ggaggcgctc caccaggccc tgatcgacgt gatcgcgcgc 2100
cacgagtcgc tccggacgct gatcgcccag gacgccggta cggcgtggca gcacatcctc 2160
ccggtcgacg atcctcggac gcgtccgggt ctgcctctgg tcgacatcgg tgcggatgcc 2220
ctgcaggagc gcctggacga ggcggctggt cgtccgttcg acctggcggc ggacctgccg 2280
gtgcgtgcca cggtgttccg gctcacggac aacgatcaca tcctgctcct cgtgctccac 2340
cacatcgcgg gtgacggctg gagcatgggt cccctggctc gcgacctgtc gacggcctac 2400
tcggctcgcg cagccggagc ggcttccgcg tggcgtccgc tgtcggtcca gtacgccgac 2460
tacgccgcgt ggcagcggga cgtgctgggg acggaggatg acgagtcctc ggagctctcc 2520
gcgcagctcg cgtactggcg gacgcagctg gcgtcgctcc cggcggagct cgcgctgccc 2580
accgaccggg ctcgccctgc cgtggcgacg taccggggtg gccggatcga gttcacgatc 2640
cccgctgacg tgcaccggtc gctcgcggac ctggcgcgtg cggaaggggt gacggtgttc 2700
atggtggtcc aggccgcgct ggccgcgctg ctgtcgcggc tgggtgccgg ggacgatatc 2760
ccgatcggga cgcccatcgc gggtcggacg gaccaggcga cggaggacct gatcgggttc 2820
ttcgtcaaca cgctcgtcct gcggacggac gtgagcgggg accccacctt cgcggagctg 2880
ctggcgcgtg tgcgcgccac ggacctggac gcgtacgcgc accaggatat cccgttcgag 2940
cggctggtgg aggcggtgaa cccggagcgg agcctggccc gtcacccgct cttccaggtg 3000
atgctcgcg 3009
<210> 9
<211> 5346
<212> DNA
<213> Artificial Sequence
<220>
<223> Reprogrammed region C
<400> 9
gcccgtgggt acctgggtcg tgccggtctc accgccgagc gcttcgtcgc gtgcccgttc 60
ggtgcccctg gcgagcgcat gtaccggacc ggcgacctcg tgcggtggcg cgtcgacggt 120
gccctggagt tcgtgggtcg tgccgacgac caggtcaagg tgcgcgggtt ccgcgtcgag 180
ctgggcgagg tcgagggcgc tgtggctgcc caccctgacg tcgtccgtgc ggtggtggtc 240
gtccgcgagg accgcccggg tgaccaccgc ctcgtggcct acgtcacggg tgtggacacc 300
ggtggcctct cgtccgccgt catgcgtgcg gtcgccgaac gtctcccggc gtacatggtc 360
ccgagcgcgg tggtcgtgct cgacgagatc ccgctcaccc cgaacggcaa ggtcgaccgt 420
gccgctctgc cggtcccggg tgtcgaggct ggtgccggct accgggctcc cgtgagccct 480
cgcgaggagg tcctctgtgg cctcttcgcc gaggtcctcg gcgtcgagcg cgtcggtgtc 540
gacgacgact tcttcggcct cggtggccac tcgctgctcg cgacgcggct catctcccgt 600
gtgcgtgccg tcctcggcgt ggaggccggt gtccgtgcgc tgttcgaggc cccgaccgtg 660
tcgcgcctcg agcgcctcct ccgcgagcgc agcgggctcg gtgtccgtgt cccgctcgtc 720
gcacgcgagc gcaccggtcg cgagccgctc tccttcgcgc agcagcgcct ctggttcctg 780
gaggagctgg agggacccgg tgcggcctac aacatcccca tggcgctccg gctcgctggc 840
gtgctcgacg tggaggccct ccaccaggcc ctgatcgacg tgatcgcacg gcacgagtcg 900
ctgcggacgc tcatcgctcg ggacagcgac gggaccgctc gccagcaggt cctcccggtg 960
ggtgacccgg cagctcgccc tgcgctgccg gtggtgcaga cggacgcgga cacgctggtg 1020
gccaagctca acgaggcggt gggtcggccg ttcgacctga ccgcggagat gccgctccgt 1080
gcgacggtgt tccgggtcgc ggacgaggat cacgccctcc tgctcgtctt ccaccacatc 1140
gcaggggacg ggtggagcac cggcctcctg gctcgggacc tctcgacggc ctacgccgca 1200
cgcctggagg gtcgcgaccc gcagctcccg cccctgccgg tgcagtacgc tgactacgca 1260
gcgtggcagc gggatgtgct gggcaccgaa gacgatgaga gctccgagct ctccgcgcag 1320
ctggcgtact ggcggacgca gctggcggac ctgcctgcgg agctcgcgct gcctgccgac 1380
cgcgtgcgcc ccgcacgcgc ctcctacgag ggcggtcgcg tgggcttcac ggtgccggca 1440
ggcgtgctgc gcgacctgac ccggctggct cgcgtggagg gcgtgaccgt gttcatggtg 1500
gtccaggctg ccctcgcagc gctgctgagc cgcctgggtg cgggcgatga catcccgatc 1560
gggacgccca tcgcaggccg gaccgatcag gcgacggagg acctgatcgg attcttcgtc 1620
aacaccctgg tcctgcgcac ggacgtgtcg ggcgatccga ccttcgccga gctgctcgcc 1680
cgtgtgcgtg cgaccgacct ggacgcatac gcgcaccagg atatcccgtt cgaacggctc 1740
gtcgaggccg tgaacccgga gcggtcgctg gcacggcacc cgctgttcca ggtgatgctg 1800
gcgttcgaca acaccgcgga tggcggaccg gtggaggact tcccgggtct ctcggcagcg 1860
ggtctcccgc tcggtgccgg agccgccaag ttcgacctcc tgttcggcct gtcggaggtc 1920
ggcggtgagc tccggggagc ggtcgagtac cggtgcgacc tgttcgatca ccccaccgcc 1980
gcacggatcg cggagcgcct ggtgcgggtg ctggagcggg tcgccgccga cgcgtcggta 2040
cgcctgggcg agctgcccgt ggtgagcgac gccgagcggg cctgcgtcct gacggagtgg 2100
aacgacaccg ccgtccccgg cgtgacggga acgctgtcgg cgctgttcga ggcacgggcc 2160
gcagcccggg gcgacgcgcc ggcggtcgtg tacgagggtg aagaactgtc gtaccgtgaa 2220
ctgaacacac gcgccaaccg cctcgcccat gtcctggccg agcacggcgc aggccccgag 2280
cggttcgtcg gtgtggccct gccccgcagt ccggacctcg tagtggcact gctggcggtc 2340
gtgaaatcgg gcgcggccta cgtaccgctc gaccccgagt acccggccga ccggctcgcg 2400
tacatggccg gcgacgctgc ccccgtggcg gtcctgaccc gcggggacgt cgaactcccc 2460
gggtccgtcc cgcggatcgg gctggacgac acagagatcc gcgcgacact cgccaccgcc 2520
cccggcacga accccggcac gccggtgacc gaggcccacc ccgcgtacat gatctacacc 2580
tccggatcca ccggccgccc caagggcgtc gtcgtctccc acggcgccat cgtcaaccgg 2640
ctcgcctgga tgcaggcgga gtaccgtctc gacgcgaccg atcgtgtctt gcagaagact 2700
ccggccggtt tcgacgtgtc ggtctgggag ttcttctggc cgctgctcga gggcgcggtc 2760
ctcgtgttcg cccggcccgg cggccaccgg gacgcggcgt atctggccgg actcatcgag 2820
cgcgagcgca tcaccacggc acatttcgtg ccctccatgc tgcgcgtctt cctcgaagag 2880
cccggcgcgg cactctgcac cggactgagg cgggtgatat gcagcggcga ggccctcggc 2940
acggacctgg ccgtggactt ccgcgcgaaa ctgcccgtcc ccctgcacaa tctgtacggc 3000
ccgaccgaag cggctgtcga tgtcacccac cacgcgtatg agcccgccac cggcacggcc 3060
acggtcccca ttggccgccc catctggaac atccgcacct acgtcctcga cgccgccctg 3120
cgtcctgtgc caccgggcgt gcccggcgag ctgtatctgg ccggcgccgg cctggcccgc 3180
ggctaccacg gccgcccggc actgaccgcc gagcgcttcg tcgcctgccc cttcggtgtc 3240
cccggtgagc gcatgtaccg gaccggtgac ctcgtccgct ggcgcgtcga cgggacgctg 3300
gaattcgtgg gtcgggcaga cgatcaggtc aaggtccggg gtttccgggt cgagctcggc 3360
gaggtcgagg gtgccgtggc tgcccacccg gacgtcgtcc gtgccgtggt ggtcgtgcgg 3420
gaggaccgtc ccggtgacca ccgcctcgtc gcctacgtca cggtcggtgg cgtcggtggc 3480
gacgggctgc gttcggccat ctcgggtctc gtcgccgagc gtctccctgc ctacatggtc 3540
ccctccgcgg tcgtcgtgct cgacgagatc ccgctcaccc ccaacggcaa ggtcgatcgc 3600
gcaggcctcc cggtcccggt cgtctccgtc gccggtttct gcgcaccctc cagcccgcgt 3660
gaggaagtcc tctgcggact cttcgccgaa gtcctcggcg tggaacgcgt cggcgtcgac 3720
gacggcttct tcgacctcgg tggcgactcg atcctgtcca tccagctcgt cgctcgcgct 3780
cgccgtgcag gtctcgagct gtccgtgcgg gacgtgttcg aagggcgtac cgtgcgtgct 3840
ctcgctgccg tcgtccgtgg ttccgacgct ggggcggtgg gtgtcgtcgg tggcgctgag 3900
atcgtcctcc cgggtgtcgg cgaggtcgag cgctggccgg tcgtcgagtg gctcgccgag 3960
cgtggcggtg gatccctcgg tggcgtcgtc cgtggcttca accagtcggt ggtcctggct 4020
gtcccggcag gcctggtctg ggaggagctc cgcgtcctcc tgggtgccgt ccgggaccgg 4080
cacgaggcct ggcggctccg ggtcctcgac tcgggagccc tctgcgtgga cggtgtcgtg 4140
cccgacgacg gctcctggat cgtgcggtgc gacctctcgg gcatgggtgt cgacggccag 4200
gtcgacgccg tccgtgccgc agccgtcgag gcccgtgcgt ggctcgaccc gtccgtcgga 4260
cgcgtcgtcc gtgccgtctg gctcgagcgc ggtggtgacc gttccggtgt cctcgtcctc 4320
gtcgcccacc acctcgtcgt cgacggcgtc tcctggcgcg tcgtcctcgg cgacctggcg 4380
gagggctggg cccaggtccg ctccggtggg cgtgtcgagc tcggcgtcgt cggcacctcc 4440
ctccgcggat gggctgccgc tctcgccgag cagggtcgcc gtggggagcg tgcaggcgag 4500
gtcgagctct ggtcccgcat ggtccgcggt gcggacgtgc tcgtcggctc ccgtgccgtc 4560
gacggtgccg tcgacgtctt cggtggcgtc gtctccgtcg acagccgtgc ctccgtctcc 4620
gtctcccgtg ccctcctgac cgaggtcccc agcgtgctcg gtgtgggtgt ccaggaggtc 4680
ctgctcgcag cgttcggcct cgccgtggca cgctggcggg gtcgtggcgg tcccgtggtc 4740
gtcgacgtgg agggccacgg tcggaacgag gacgccgtcc gcggtgccga cctctcgcgg 4800
acggtgggct ggttcacgag cgtctacccc gtgcgtgtcc cggtcgagtc ggcttcctgg 4860
gatgaggtcc gggcaggtgg tcccgtcgtc ggtcgggtcg tccgggaggt caaggagacg 4920
ctccgcagcc tcccggacca gggactcggc tacgggatcc tccggtacct ggacccggaa 4980
cacggacctg ccctcgctcg ccacgcgacg ccccagttcg ggttcaacta cctgggtcgg 5040
ttcacgacgg gcacggacga gacgacgacc gcggacgccc tggaccgtgc gcctgcctgg 5100
agcctgctgg cacggagcgc tgcgggtcag gacccggagc tcccggtcgc ccacgccgtg 5160
gagttcaacg ccatcaccct cgacacgccc gaaggtcccc gtctcggggt cacgtggtcc 5220
tggcccacca ccctcctccc ggagtcgcgc atccgcgagc tcgcacggta ctgggatgag 5280
gcgctcgagg gcctcgtgga gcacgctcgc cacccggagg caggtgggct gaccccgtcg 5340
gacgtc 5346
<210> 10
<211> 22017
<212> DNA
<213> Artificial Sequence
<220>
<223> Reprogrammed dptBC gene sequence
<400> 10
gtgaaccgcc ggtcgaaggt agtcgaggag atcctgcctg tctcggcgct ccaggaagga 60
ctgctgttcc acagctcctt cgccgccgcc gacggagtcg acgtgtacgc gggacagctc 120
gcgttcgacc tggtcggcgc ggtggacacc ggtcggctgc gggccgccgt cgaaagcctc 180
gtggcgcggc acggcgtcct gcgctcaagc taccgtcagg cgcgctccgg ggagtgggtc 240
gcggtcgtgg cgcggcgcgt cgcgacgcca tggcgcgccg tcgacgcccg cgacggtgcc 300
acggacgctg ccgccgtggc ccgggaggaa cgctggcgcc cgttcgacct gggccgggcc 360
ccgctggctc ggttcgtgct cgtacggacc gacgacgacc gtttccggtt cgtgatcacg 420
taccaccacg tcatcctcga cggctggtcg ctgccggtac tgctgcgcga actccttgcc 480
ctgtacggaa gcggcgccga cccgtcggtg ctgccgcccg tccgccccta cggcgacttt 540
ctccggtggg ccgccgcgcg cgacgacgcc gccgccgaaa ccgcctggcg cgacgcgctc 600
accggcctgg acgagccctc cctggtcgca cccggcgctt cccccgacgg cgtcgtgccg 660
gcctccgtcc acgccgaact cgacaaggcc ggcaccgaga acctcgccgc ctgggccagg 720
caccgcggca tcacccaggc caccgccgtc cgcgccgcgt gggccctcgt tctcggccag 780
cacaccggcc gcgacgacgt cgtgttcggc gtcaccgtct ccggacggcc cgccgaactc 840
gccggcgccg agcacatggt cggactcttc atcaacaccg tccccctgcg cacggtcctc 900
gaccccgccg acaccctcgg cacgttcgcc gctcgcctcc aggccgaaca gaccaccctc 960
ctcgaacacc agcacgtgcg gctctccgac atccagcgct gggccggaca caaagaactc 1020
ttcgacacca ttgtcgtctt cgagaactac cccatcggcc acagcggccc cggctccatc 1080
cgcaccgacg acttcaccgt caccgccacc gaaggctccg acgccaccca ctaccccctc 1140
accctcaccg ccgtacccgg cgaaaccctg cgcctcaagc tcgaccaccg ccccgacctc 1200
gtcgacacca ccaccgccac cgccctgctg cgccgcgtga cccgcgtcct ggaaaccgcc 1260
accgacgaca ccgggcacac cctcgcccgc ctcgacctcc tcgacgacga cgaacgccac 1320
cgcctgctgc gcggctggaa cgacaccacg cgcgagcagc cgcccaccta ctaccaccag 1380
gaattcgagg aacaggcgcg gaggcggccc cacgacacgg cccttgtctt caccagcacc 1440
tcctggacgt acgaagaact caacgaccgc gccaaccggc tcgcccgcct gctcgtcgcc 1500
gccggcgccg gctccgacga cttcgtcgcg ctcgccttcc cccgttccgc ggaatccgtc 1560
gtcgccatcc tcgccgtact caaagcgggc gccgcctacc tgccgctcga catggaccag 1620
cccgccgaac ggctcaccgg catcctcgcc gacgcacacc cgaccgtcgt cctcacgacc 1680
accaccgcca ccccgctgcc gcaccccggc cgcaccctcg tcctcgacag ccccaccacc 1740
gcccgcgccc tcgctgcggc acccgcacac aacctcaccg acgccgaccg ccgtaccccg 1800
ctcaacgccc gcaacgccgc ctacatcatc cacacctccg gctccaccgg acgccccaag 1860
ggcgtcgtca tcgaacaccg cagtctcgcc aacctcttcc acgaccatcg gcgcgccctc 1920
atagaacccc atgccgccgg aggatcacgg ctcaaggccg gcctcaccgc ctccctctcc 1980
ttcgacacct cctgggaagg tctgatctgc ctggccgccg gccacgaact gcaccttatt 2040
gacgacgaca cccgccgaga cgccgaacgc gtcgccgaac tcatcgaccg gcagcgcatc 2100
gacgtcatcg acgtcacccc ctccttcgcc cagcaactcg tagagaccgg aatcctcgac 2160
gagggccgcc accaccccgc cgccttcatg ctcggcggtg aaggcgtcga cgcgaaactc 2220
tggaccaggc tctccgacgt ccccggcgtc acctcgtaca actactacgg ccccaccgaa 2280
ttcaccgtcg acgccctcgc ctgcacggtc ggcatcgcac cccgccccgt catcggccac 2340
cccctcgaca acacggccgc ctacatcctc gacggcttcc tgcgtcccgt acccgaaggc 2400
gtcgccggcg agctctacct cgccggcacc cagctcgccc gcggctacgc cggccggccc 2460
ggcctgacgg ccgaacgctt cgtggcctgc cccttcggcg cgccgggcga acgcatgtac 2520
cgcaccggcg acctcgtccg gcgcagtccc ggcggcgtgg tcgaatacct cggacgcgtg 2580
gacgatcaga tcaaactccg cggcttccgc atcgaacccg ccgagatcga gctcgccctg 2640
gccggccacc ccgccgtcgc ccagaacgtc gtcctcctgc accgctccgc caccggagag 2700
gctcgcctcg tggcgtacgt cgtccccggc acacccgtcg acccgcggga actcaccggg 2760
cacctcgccg cccggctgcc cgcgtacatg gtgccctcgg ctttcgttct cctcgacacc 2820
ctcccgctca cccccaacgg caaactggac cgcggcgccc tgccggagcc cgccttcggt 2880
accgcgcccc gccccgagcg cccccgcaca cccgtcgagg agatcctctg cggcctgtac 2940
gccgacgtgc tcgggcttcc ctcgttcggc gccgacgacg acttcttcga cgccggcggg 3000
cactcgctgc tggccagcaa actcgtcagc cgtatccgta cgaacctgaa aaccgaactc 3060
aacgtccgcg ccctcttcga gcaccgcacg gtctcctccc tggccaccgc cctccaccgg 3120
gccgcgcagg ccggccccgc gctcaccgcc ggaccgcgcc ccgcacggat cccgctgtcg 3180
tacgcccagc gccgcctgtg gttcctcaac cggctcgacc gcgacagcgc cgcgtacaac 3240
atgcccgtcg cactccgcct gcgtggcccc ctggacagca ccgccatgtg cgccgcactc 3300
accgacgtcg ccgaacgcca cgaggcgctg cgcaccgtgt tcgaggagga ccgggacggt 3360
gcccaccaga tcgtgctgcc cgcgaccggc ctcggccctc tgctcaccgt gaccggggcc 3420
gacgggacga ccctgcgtgc cctcatcacc gagttcgtac gcaggccctt cgacctggcg 3480
gcggagatcc ccttccgcgc cgcactgttc cgcgtcggcg acgaggaaca tgtactggtc 3540
gtcgtcctgc accacatcgc cggggacggc tggtccatgg gaccgctcgc acgcgacgtg 3600
gccgaggcct accgggcgcg ggcggccggg agggcacccg actgggaacc gctgcccgtg 3660
cagtacgccg actacgcgct ctggcagcgg gaggtgctgg gcgcggagga cgacgagacc 3720
ggcgaactct ccgcccaact cgcccactgg cgcacccgcc tcgcaggggc ccccgcagaa 3780
ctcacgctgc ccaccgaccg cccacgcccc gctgtcgcct ccaccgccgg agaccgcgtc 3840
gaattcaccg tgcccgccgg actccaccag gccctcgccg acctggcacg ggcccacggc 3900
gcgacggtct tcatggtcgt ccaggccgcc ctcgccgtcc tgctgtcacg tctcggcgcc 3960
ggcgacgaca tccccatcgg caccccggtc gccggccgca ccgacgaggc cacggaggaa 4020
ctgatcgggt tcttcgtcaa cacgctggtg ctgcgcaccg acgtgtccgg cgacccgacg 4080
ttcgccgaac tcctcgcgcg ggtgcgggcc accgacctcg acgcgtacgc acaccaggac 4140
gtgccattcg aacgtctggt cgaggtgttg aacccggagc ggtcactggc acggcatcca 4200
ctgttccagg tcatgctgac gttcaacgtc ccggacatgg acggggtcgg aagcgcgctg 4260
gggaatctgg gggaactgga ggtctccggt gaggccatcc ggacggatca gaccaaggtg 4320
gatctcgctt tcacgtgcac ggagatgtac gccgcggacg gtgcggcctc gggaatgcgc 4380
ggggtgctgg aataccggct tgatgtgttc ggtgcggtac aggcccggga aacgacggag 4440
cggttggtgc gggtgttgga gggtgtggtt tctggtgggg gtggggtgtc tgtgtcgggg 4500
gttgatgtgt tgggtgtggg tgagcgggag aggttgttgg ggtggggtgt gggtgggccg 4560
gtgcctgtgg tgccgggtgg tgggttggtg gggttgttcg aggagcgggt gcgggccgac 4620
gcggacgcgg tggccgtgcg tggcgcgggg gtggtgtgga gttatgggga gttgaatgcg 4680
cgggtgaatg tggtggcgcg gtggttggtg ggtcggggtg tgggggcgga gtgtggtgtg 4740
ggtgtggtga tgggccgcgg ggtggatgtg gtggtgatgt tgctggcggt ggcgaaggcg 4800
ggtgggtttt atgtgccggt ggatccggag tggccggtgg agcgggtggg gtgggtgctg 4860
gcggatgccg gggtggggct ggttgtggtg ggggaggggt tgtcgcatgt ggtgggggat 4920
tttcctgggg gtgaggtttt cgagttttcg cgggttgttc gtgagtcgtg tcttgtggag 4980
ttggtggctg cggatggggt tgaggttcgg aatgtgacgg atggtgagcg ggcgtcgcgt 5040
ctgttgccgg ggcatccgtt gtatgtggtt tatacgtcgg gttcgacggg gcggccgaag 5100
ggtgttgtgg tgacgcatgc ttcggtgggt gggtatttgg cgcgtggtcg ggatgtgtat 5160
gcgggtgccg ttggtggtgt ggggtttgtg cattcgtcgc ttgcgttcga tctgacggtg 5220
acggttctgt tcacgccttt ggtgtctggc ggttgtgttg tgttgggtga gttggacgag 5280
tcggcgcagg gggtgggtgc ctcgttcgtg aaggtgactc cgtcgcatct gggtttgctg 5340
ggtgagctgg agggtgtggt ggcggggaac ggcatgctgc tggtgggggg tgaggcgttg 5400
tcgggtggtg cgctgcgtga gtggcgtgag cgtaatccgg gtgtggtggt ggtgaatgct 5460
tatggtccga cggagctgac ggtgaactgt gccgagttcc ttatcgcgcc tggtgaggag 5520
gttccggatg ggcctgtgcc gatcgggcgt cctttcgcgg gtcagcggat gtttgttctg 5580
gatgcggcgc tgcgggtcgt cccggtgggt gtcgtcggtg agctgtacgt ggccggtgtc 5640
ggtctcgcac gggggtacct cggtcgtgcc ggtctcacgg ccgagcggtt cgtggcgtgc 5700
ccgttcggtg cgccgggtga gcgtatgtac cgtacggggg atctggtgcg gtggcgggtg 5760
gacggcgccc tggagttcgt gggtcgtgcg gacgaccagg tcaaggtgcg tggcttccgg 5820
gtcgagttgg gtgaggtcga gggtgccgtg gcagcccacc cggacgtggt gcgtgcggtc 5880
gtggtcgtcc gggaagaccg tcccggtgac caccgcctgg tggcgtacgt gacgggtgtc 5940
gacaccggtg gcctcagcag cgcggtcatg cgtgcggtcg cggagcgtct ccctgcctac 6000
atggtcccga gcgccgtggt cgtgctggac gagatcccgc tgaccccgaa cgggaaggtg 6060
gaccgggcgg cgcttccggt gccgggggtg gaggcgggcg cgggctaccg ggcgcctgtt 6120
agcccgcgtg aggaagtcct gtgcggtctc ttcgccgaag tgctcgggct ggagcgggtg 6180
ggggtggacg atgatttctt cgggttgggt ggtcactcgc tgctggcgac gcgtctgatc 6240
tcgcgtgtcc gtgcggtgct cggtgtggag gcgggtgtgc gtgcgctctt cgaggcgccg 6300
acggtgagcc gtctggagcg gctgctgcgg gagcggagcg ctctcggggt gcgggtgccg 6360
ctggtggcac gggagcggac gggtcgggag ccgctgagct tcgctcagca gcgtctgtgg 6420
ttcctggagg agctggaggg tcccggtgct gcgtacaaca tcccgatggc gctgcgtctg 6480
gccggtgtgc tggacgtcga ggcgctgcac caggcgctca tcgacgtcat cgctcgccac 6540
gagagcctcc gcaccctcat cgcgcaggat gcgggtacgg cctggcagca catcctgccc 6600
gtggacgacc ctcgcacccg tcccggtctc cctctggtgg acatcggtgc cgacgccctg 6660
caggagcggc tcgacgaggc cgctggtcgg cccttcgacc tcgctgccga cctcccggtc 6720
cgtgccacgg tcttccgcct caccgacaac gaccacatcc tcctggtcgt ggcccaccac 6780
gtggccttcg acgcgatgtc ccgtgtgccg ttcatccgga acgtcaagcg cgccttcgag 6840
gcccgtacga acggcgcagc ccccgactgg cgtccgctgc ccgtgcagta cgcggactac 6900
gcggcctggc agcgcgacgt gctcggcacg gaggacgacg agtcgagcga gctgtcggcc 6960
cagctcgcct actggcgcac ccagctagcc tcgctgcctg ccgagctggc gctcccgacg 7020
gaccgtgccc gtcccgccgt cgcctcgtac gaaggcggca aggtcgagtt caccgtcccc 7080
gctggtgtgt acgacggcct ggtggctctc gcccgtgccg agggtgtcac ggtcttcatg 7140
gtcgtgcagg cggcgctggc cgcgctcctc tcccggctgg gtgccggcga cgacatcccg 7200
atcgggacgc cgatcgccgg ccgcaccgac caggccaccg aagatctcat cggcttcttc 7260
gtgaacaccc tcgtcctccg cacggacgtc agcggtgacc cgaccttcgc ggagctgctg 7320
gcccgcgtcc gggccaccga cctcgacgcc tacgcccacc aggacatccc cttcgaacga 7380
ctggtcgaag cggtcaaccc cgagcgctcc ctcgcccgcc accccctctt ccaggtcatg 7440
ctgaccttcg acaacacgat tgaccgtgag gtcacggagg gcttcgcggg cctcggggtg 7500
gaaggcctgc cgctgggtgc gggagcggtc aaattcgatc tgctcttcgg tctctccgag 7560
gtgggcggcg agctgcgcgg agccgtggag taccgctgcg atctcttcga ccacccgacg 7620
gtggcgcagc tcgcggagcg cctggtgcgg gtactggagc gcgtggcttc cgacgcttcg 7680
gtacgcacgg gtgaactgcc ggtcgtcggc gaggcggagc gcgcccgtgt cctgacggag 7740
tggaatgaca cgggcgtccc cggtgtgccg gaaacattcc tggagttgtt cgaggcgcag 7800
gtcgcggccc ggggtgacgc gccggcggtc gtgtacgagg gtgaggttct gtcgtaccgg 7860
gaactcgacg cgcgggcgaa ccgcctggcc gggctgctgg tggggcgcgg tgcgggcccg 7920
gagcatttcg tgggggtggc gctgccgcgt gggctggatc tgatcgtggc cctgctggcc 7980
gtgctcaagt ccggtgccgc gtacgttccc ctggacccgg agtacccggc cgagcggctg 8040
gtccacatgg tcaccgacgc cgcccccgtc gtggtcgtga cctccaccga cgtacgtact 8100
ctgcggaccg ttccccgggt cgagctggac gacgaggcga cccgcgccac cctggtcgca 8160
gcccccgcca cagggcccga cgtgaagatg tccgcctccc accccgcgta cgtgatctac 8220
acctccgggt ccacgggccg ccccaagggc gtcgtcatca gccacggcag cctggccaac 8280
ttcctcgcct gggcgcggga agacctgggt gccgagcggc tccggcacgt cgtgttgtcc 8340
acgtccctca gcttcgacgt ctccgtggtc gaactcttcg ccccgctgtc ctgcggcggc 8400
accgtcgaga tcgtccggaa tctgctggcc ctcgtcgacc gccccggccg atggtccgcg 8460
agcctggtca gcggcgtgcc gtcggccttc gcgcagctgc tggaagccgg cctcgaccgg 8520
gccgacgtgg gcatgatcgc cctggccggc gaggcgctgt ccgctcgcga cgtgcgccgc 8580
gtccgcgctg tgctgcccgg ggcccgcgtg gccaacttct acggcccgac cgaagccacc 8640
gtctacgcca cggcctggta cggcgacacc cccatggacg ccgcggcccc catgggccgg 8700
cccctgcgca acacgtgtgt gtatgtgctg gacgacgggc tgcgcgtggt gccggtcggt 8760
gtggtgggtg agctgtatgt ggcgggtgtg ggtctggcgc ggggctatct cgggcgtgtg 8820
ggtctgacgg cggagcggtt tgtggcgtgt ccgttcggtg cgcggggtga gcgtatgtat 8880
cgcacggggg atttggtgcg gtggcgggtg gacggcacgc ttgagtttgt tggtcgtgcg 8940
gatgatcagg tgaaggtccg tggtttccgt gtggagttgg gtgaggtgga gggtgctgtt 9000
gcggcgcatc ctgatgtggt gcgtgcggtt gttgtggtgc gtgaggaccg gccgggtgat 9060
caccggttgg ttgcgtatgt caccggtgtt gacacgggtg gactgtcctc tgcggtgatg 9120
cgtgccgttg ctgagcgtct gcctgcgtac atggtgccgt cggcggtggt ggttctggat 9180
gagatcccgt tgacgccgaa cgggaaggtg gaccgggcgg gtcttccggt gccggtggtg 9240
tcggtggcgg ggttctgtgc gccgtcgtcg ccgcgggagg aggtgttgtg tggtctgttc 9300
gcggaggtgc tgggtgttga gcgggtgggg gtggacgatg ggttcttcga tctgggcggg 9360
gacagcattc tgtcgattca gttggtggcg cgggctcgtc gggcgggtct ggagttgtcg 9420
gttcgggatg ttttcgaggg ccgtacggta cgtgctctgg cggctgtggt gcgtggttcg 9480
gacgctgggg cggttggtgt ggtggggggt gctgagattg tgctgccggg tgtgggtgag 9540
gtggagcggt ggccggtggt ggagtggctg gcggagcgtg gtggggggtc gctgggtggt 9600
gtggttcggg gtttcaatca gtctgttgtg cttgctgtgc ctgctgggtt ggtgtgggag 9660
gagttgcggg tgttgttggg tgcggtgcgg gatcggcatg aggcgtggcg gttgcgggtg 9720
ctggattccg gggcgttgtg tgttgatggt gttgttccgg atgacgggtc gtggattgtc 9780
cggtgtgacc tgagcggtat gggtgtggat ggtcaggtgg atgctgtgcg ggctgcggct 9840
gtggaggcgc gtgcgtggct ggatccgtcg gtgggccggg tggtgcgggc ggtgtggctg 9900
gagcgtggtg gtgatcgttc gggggtgttg gtgctggtgg cgcatcacct ggtggtggac 9960
ggtgtgtcgt ggcgggtggt gctgggggat ctggcggagg ggtgggcgca ggtgcgttcg 10020
ggtggccgtg tggagttggg tgtggtgggg acgtcgttgc ggggttgggc ggcggcgttg 10080
gcggagcagg gccggcgggg cgagcgtgcg ggggaggtgg agttgtggtc gcggatggtt 10140
cggggtgcgg atgttctggt ggggtcgcgt gctgtggatg gtgcggtgga tgttttcggc 10200
ggggtggtgt cggttgattc gcgggcgtcg gtgtcggtgt cgcgtgcgtt gctgacggag 10260
gtgccgtcgg ttctgggtgt tggtgtgcag gaggtgttgc tggcggcatt cgggctggcg 10320
gtcgcgcggt ggcgcggccg gggtgggccg gttgtggtgg atgttgaggg gcacgggcgt 10380
aatgaggacg ctgtgcgggg tgctgatctg tctcgtactg tcggttggtt caccagtgtg 10440
tatccggtcc gtgtgccggt ggagtccgct tcgtgggacg aggtgcgtgc gggtggtccg 10500
gtggtgggcc gtgtggtgcg tgaggtgaag gagactctgc gttcgctgcc tgaccagggt 10560
ctgggttatg gcatcctgcg ctatctcgat cccgagcacg gtcctgctct ggcccggcat 10620
gccaccccgc agttcggttt caactacctc ggccgcttca ccaccggaac cgacgacacc 10680
ggtgacgagg ggatgacgga ctgggtcccc gtgtcagggc cgttcgcggt gggagccggc 10740
caggaccccg aactgcccgt ggcgcacgcg gtcgagttca acgcgatcac gctggacacc 10800
ccggagggcc cgcgcctggg cgtgacatgg tcgtggccga cgacgctgct gccggagtcc 10860
cggatacggg agctggcccg ctactgggac gaggccctgg aagggctggt cgaacacgcc 10920
cggcaccccg aagccggcgg cctcacgccg tccgacgtga cgctggtgga agtgaaccag 10980
gtggagctcg accgtctgca ggcgggggtc gccggtggtg cggaggagat tctgccggtg 11040
tcggccctgc aagaggggct gctgttccac agcgcgttgg cctctggtgg ggtggacgtg 11100
tatgtggggc agctggtgtt cgatctggtc ggtccggtgg acgtcgaccg gctgcgcgcg 11160
gctgtcgaag gtctggtggc gcggcacggg gtgctgcggt cgggataccg ccaactgcgg 11220
tcgggcgaat gggttgcggt cgtcgcacga caggtggatc tgccgtggca gtccatcgac 11280
gtgcgcgacg gcggtatcga cgggttggtg gaagaggagc gctggcgccg gttcgacatg 11340
ggccggggtc cactggcgcg cttcgtgctc atccggacgc acgacgatcg tttccggttc 11400
gtcatcacgt accaccacgt cgtcctcgac ggctggtccg tcccggtgct gctgcgtgag 11460
ctgctggccc tgtacggcag ctcgggggac gtatcggttc tgccgggggt ccgctcgtac 11520
ggcgatttcc tgcgatgggt cgccgcgcga gacgccgcag ccgccgaagg cgcatggcgg 11580
cgggcgctga cgggcctgga ggagccgtcg ctcgtcgcgc caggcgtttc ccgagacggg 11640
gtcgtcccgg cggcgttcca cggtgcggtc gacggcgacc tctcgcagaa gatcgtggcg 11700
tgggcgcgcg ggcgtggtgt gacggttgcg tcggtggtac aggcggcgtg ggccttggtg 11760
ctggggcggt tgatgggtcg ggacgatgtg gtgttcgggg tgacggtgtc gggtcggcct 11820
gccgaggtgg tgggtgtgga ggacatggtc ggtctgttcg tgaacaccat tccgttgcgg 11880
gcgcggctgg atccggcgga gtcgctgggt ggtttcgtgg agcggctgca gcgggagcag 11940
acggagctgc tggagcatca gcatgtccgg ctggcggaag tccagcggtg ggccgggcac 12000
aaggaactct tcgatgtcgg aatggtcttc gacaactacc cggtttcttc tgaatccccg 12060
gaagcggaat tccagatctc acgaacaggc ggatacaacg gaacccacta cgcactgaac 12120
ctcgttgctt ccatgcacgg cctggagctg gaactggaaa tcggttatcg gccggatgtg 12180
tttgatgcgg gtcgggtgcg tgaggtgtgg ggatggctgg tccgggtcct cgagggcgtc 12240
gtcagcggcg gtggcggtgt ctccgtgagc ggtgtggatg tcctcggtgt cggcgagcgc 12300
gaacggttgc tcggttgggg cgtcggcgga ccggtcccgg tcgtgcccgg aggcggtctc 12360
gtcggcctgt tcgaagagcg cgtccgtgcg gacgccgatg ccgtcgccgt ccgtggtgca 12420
ggcgtcgtct ggtcctacgg cgagctcaac gcccgggtca acgtggtcgc ccgctggctc 12480
gtcggacgcg gcgtcggtgc cgagtgcggt gtcggcgtcg tcatgggtcg cggtgtcgac 12540
gtggtcgtca tgctgctcgc cgtcgccaag gccggtggct tctacgtgcc cgtcgacccc 12600
gagtggcccg tcgagcgcgt cggctgggtc ctcgccgacg ccggtgtcgg cctcgtggtc 12660
gtcggtgagg gcctctccca cgtcgtgggt gacttccccg gtggcgaggt gttcgaattc 12720
tcccgcgtgg tgcgcgagtc ctgcctggtc gagctcgtcg cggctgacgg tgtcgaggtg 12780
cgcaacgtca ccgacggcga gcgcgcctcc cgtctcctcc ccggtcaccc cctctacgtc 12840
gtgtacacct ccgggtccac gggtcgtccc aagggcgtcg tcgtcaccca cgcctcggtc 12900
ggcggttacc tggcccgtgg ccgggacgtc tacgcaggcg ccgtgggcgg tgtcgggttc 12960
gtccactcgt ccctcgcctt cgacctgacc gtcaccgtgc tcttcacccc gttggtctcg 13020
ggtggctgcg tggtgctggg cgagctcgac gagtccgccc agggtgtcgg ggcctccttc 13080
gtcaaggtca ccccgtccca cctcggtctc ctcggcgagc tcgagggcgt cgtcgccggt 13140
aacgggatgc tcctcgtcgg tggcgaggcc ctctccggtg gggctctccg cgagtggcgc 13200
gagcgcaacc ccggtgtcgt ggtcgtcaac gcctacggtc ccaccgagct caccgtcaac 13260
tgcgcggagt tcctgatcgc ccctggcgag gaggtgcccg acggcccggt cccgatcggt 13320
cgcccgttcg ctggccagcg gatgttcgtg ctcgacgcgg ccctgcgcgt cgtcccggtg 13380
ggcgtcgtgg gcgagctcta cgtcgccggt gtcggcctcg ctcggggtta cctgggtcgc 13440
gtcggtctca ccgccgagcg cttcgtcgcc tgcccgttcg gcgtgcccgg cgaacgcatg 13500
taccggacgg gtgacctggt ccgttggcgc gtcgacggtg cgctggagtt cgtcggtcgc 13560
gccgacgacc aggtcaaggt gcgcggtttc cgcgtcgagc tcggcgaggt cgagggtgcg 13620
gtcgctgcgc acccggacgt ggtccgtgcc gtggtggtcg tccgggagga tcgtcccggt 13680
gaccaccgct tggtcgccta cgtcaccgct ggtggcgtgg gtggtgacgg cctgcggtcg 13740
gccatctccg gtctcgtggc cgagcgcctc cctgcctaca tggtcccgtc cgccgtcgtg 13800
gtcctggacg agatccccct caccccgaac ggtaaggtcg accgtgctgc gctgccggtc 13860
cccgaggtcg aggccgggac ggggtaccgc gctccggtga gccctcgcga ggaggtcctc 13920
tgcggtctct tcgccgaggt cctcggtgtg gagcgggtcg gtgtggatga cgacttcttc 13980
gagctcggcg gtcactccct gctcgcgacc cgtctcatct cccgtgtgcg tgccgtgctc 14040
ggcgtcgagg ccggtgtccg tgccctcttc gaggccccga ccgtgtcgcg cctggagcgc 14100
ctgctgcgtg agcgctccgg tctcggggtc cgcgtgccgc tcgtcgcacg cgagcgcacc 14160
ggtcgtgagc cgctgtcctt cgcgcagcag cggctctggt tcctggagga gctggagggt 14220
ccgggtgcgg cctacaacat ccccatggcc ctgcggctcg cgggtgtgct cgacgtggag 14280
gcgctccacc aggccctgat cgacgtgatc gcgcgccacg agtcgctccg gacgctgatc 14340
gcccaggacg ccggtacggc gtggcagcac atcctcccgg tcgacgatcc tcggacgcgt 14400
ccgggtctgc ctctggtcga catcggtgcg gatgccctgc aggagcgcct ggacgaggcg 14460
gctggtcgtc cgttcgacct ggcggcggac ctgccggtgc gtgccacggt gttccggctc 14520
acggacaacg atcacatcct gctcctcgtg ctccaccaca tcgcgggtga cggctggagc 14580
atgggtcccc tggctcgcga cctgtcgacg gcctactcgg ctcgcgcagc cggagcggct 14640
tccgcgtggc gtccgctgtc ggtccagtac gccgactacg ccgcgtggca gcgggacgtg 14700
ctggggacgg aggatgacga gtcctcggag ctctccgcgc agctcgcgta ctggcggacg 14760
cagctggcgt cgctcccggc ggagctcgcg ctgcccaccg accgggctcg ccctgccgtg 14820
gcgacgtacc ggggtggccg gatcgagttc acgatccccg ctgacgtgca ccggtcgctc 14880
gcggacctgg cgcgtgcgga aggggtgacg gtgttcatgg tggtccaggc cgcgctggcc 14940
gcgctgctgt cgcggctggg tgccggggac gatatcccga tcgggacgcc catcgcgggt 15000
cggacggacc aggcgacgga ggacctgatc gggttcttcg tcaacacgct cgtcctgcgg 15060
acggacgtga gcggggaccc caccttcgcg gagctgctgg cgcgtgtgcg cgccacggac 15120
ctggacgcgt acgcgcacca ggatatcccg ttcgagcggc tggtggaggc ggtgaacccg 15180
gagcggagcc tggcccgtca cccgctcttc caggtgatgc tcgcgttcaa caacgccgag 15240
acgagcaccc cgctgcccat ggccgaaggc ctggctgcct cccggcagga catcgaaccg 15300
ggcgtggcga aattcgatct ggccctgtat tgcaacgaat cccgcggtga gacgggcgac 15360
caccagggca tcagaagtgt cttcgagtac cgccgcgacc tgtgggacga ggacaccgtg 15420
cggcagctcg ccgaccggtt cctgcatgtt ctcgctgctt ttgcggcagc cccggagcaa 15480
cgtgcgagca gcgtcgacgt gctccgggcg ggcgagcgcg accaactgct gcacgagtgg 15540
aacgacacgg ctgccgctct ccccccggca ctgctgcccc agctgttcga ggagcaggtg 15600
cggcgcaccc cgcacgatgt cgctctcgtc tcggggaaca tccggctcac gtacgcggag 15660
ctggacgcgc gcgcgaaccg cctggcccac ttgctgctcg cccggggcgc ggcccccgag 15720
acgttcgtcg cggtggccct gccccggacc gaagagctcc tggtggccct gctggccgta 15780
cagaaaacag gtgccggaca tctgccgctg gatcccggct tcccggccga gcggctcagc 15840
tacatgctgg atgacgcccg ccctgcggtg gtcctcacca cggaggacat cagcgcccgc 15900
atacccggcg gaagccatgt ggtactcgac tccgagcagg tgaccggcga gctccacgac 15960
cacccggcca cgtcccccgc cggccggggc aaccccgccg gcccggcgta cgtgatctac 16020
acctccggat ccaccggcca gcccaagggc gtcgtcgtac cgtcggccgc cctggtgaac 16080
ttcctggccg acatggtgcc caggctcggg ctccgcggtg gcgaccgcct gctgtccgtg 16140
accaccgtgg gcttcgacat cgcggccctc gagctcttcg tcccgctact gagcggcgcc 16200
accgtcgtcc tcgcggacgg ggagacggtc cgcgacccgg cgctggcccg ccagacgtgc 16260
gaggaccacg gcgtcaccat ggtccaggcg acaccgagct ggtggcacgg catgctcgcc 16320
gacgcgggcg acagcctgcg cggcgtgcac gccgtcgtgg gcggtgaggc cctgagcccc 16380
gggttgcgcg acgcgctgac acgaggcgcg cggtccgtca cgaacatgta cggcccgacg 16440
gagacgacca tctggtccac cagcgccggg caggccgccg gggacagcgc tcccccttcg 16500
atcggcacac ccatcctcaa cactcgcgtg tatgtgctcg acgctgcttt gtgtgtcgtg 16560
ccaccgggcg tcgcaggcga gctgtacatc gcgggcgacg gcctcgcccg tgggtacctg 16620
ggtcgtgccg gtctcaccgc cgagcgcttc gtcgcgtgcc cgttcggtgc ccctggcgag 16680
cgcatgtacc ggaccggcga cctcgtgcgg tggcgcgtcg acggtgccct ggagttcgtg 16740
ggtcgtgccg acgaccaggt caaggtgcgc gggttccgcg tcgagctggg cgaggtcgag 16800
ggcgctgtgg ctgcccaccc tgacgtcgtc cgtgcggtgg tggtcgtccg cgaggaccgc 16860
ccgggtgacc accgcctcgt ggcctacgtc acgggtgtgg acaccggtgg cctctcgtcc 16920
gccgtcatgc gtgcggtcgc cgaacgtctc ccggcgtaca tggtcccgag cgcggtggtc 16980
gtgctcgacg agatcccgct caccccgaac ggcaaggtcg accgtgccgc tctgccggtc 17040
ccgggtgtcg aggctggtgc cggctaccgg gctcccgtga gccctcgcga ggaggtcctc 17100
tgtggcctct tcgccgaggt cctcggcgtc gagcgcgtcg gtgtcgacga cgacttcttc 17160
ggcctcggtg gccactcgct gctcgcgacg cggctcatct cccgtgtgcg tgccgtcctc 17220
ggcgtggagg ccggtgtccg tgcgctgttc gaggccccga ccgtgtcgcg cctcgagcgc 17280
ctcctccgcg agcgcagcgg gctcggtgtc cgtgtcccgc tcgtcgcacg cgagcgcacc 17340
ggtcgcgagc cgctctcctt cgcgcagcag cgcctctggt tcctggagga gctggaggga 17400
cccggtgcgg cctacaacat ccccatggcg ctccggctcg ctggcgtgct cgacgtggag 17460
gccctccacc aggccctgat cgacgtgatc gcacggcacg agtcgctgcg gacgctcatc 17520
gctcgggaca gcgacgggac cgctcgccag caggtcctcc cggtgggtga cccggcagct 17580
cgccctgcgc tgccggtggt gcagacggac gcggacacgc tggtggccaa gctcaacgag 17640
gcggtgggtc ggccgttcga cctgaccgcg gagatgccgc tccgtgcgac ggtgttccgg 17700
gtcgcggacg aggatcacgc cctcctgctc gtcttccacc acatcgcagg ggacgggtgg 17760
agcaccggcc tcctggctcg ggacctctcg acggcctacg ccgcacgcct ggagggtcgc 17820
gacccgcagc tcccgcccct gccggtgcag tacgctgact acgcagcgtg gcagcgggat 17880
gtgctgggca ccgaagacga tgagagctcc gagctctccg cgcagctggc gtactggcgg 17940
acgcagctgg cggacctgcc tgcggagctc gcgctgcctg ccgaccgcgt gcgccccgca 18000
cgcgcctcct acgagggcgg tcgcgtgggc ttcacggtgc cggcaggcgt gctgcgcgac 18060
ctgacccggc tggctcgcgt ggagggcgtg accgtgttca tggtggtcca ggctgccctc 18120
gcagcgctgc tgagccgcct gggtgcgggc gatgacatcc cgatcgggac gcccatcgca 18180
ggccggaccg atcaggcgac ggaggacctg atcggattct tcgtcaacac cctggtcctg 18240
cgcacggacg tgtcgggcga tccgaccttc gccgagctgc tcgcccgtgt gcgtgcgacc 18300
gacctggacg catacgcgca ccaggatatc ccgttcgaac ggctcgtcga ggccgtgaac 18360
ccggagcggt cgctggcacg gcacccgctg ttccaggtga tgctggcgtt cgacaacacc 18420
gcggatggcg gaccggtgga ggacttcccg ggtctctcgg cagcgggtct cccgctcggt 18480
gccggagccg ccaagttcga cctcctgttc ggcctgtcgg aggtcggcgg tgagctccgg 18540
ggagcggtcg agtaccggtg cgacctgttc gatcacccca ccgccgcacg gatcgcggag 18600
cgcctggtgc gggtgctgga gcgggtcgcc gccgacgcgt cggtacgcct gggcgagctg 18660
cccgtggtga gcgacgccga gcgggcctgc gtcctgacgg agtggaacga caccgccgtc 18720
cccggcgtga cgggaacgct gtcggcgctg ttcgaggcac gggccgcagc ccggggcgac 18780
gcgccggcgg tcgtgtacga gggtgaagaa ctgtcgtacc gtgaactgaa cacacgcgcc 18840
aaccgcctcg cccatgtcct ggccgagcac ggcgcaggcc ccgagcggtt cgtcggtgtg 18900
gccctgcccc gcagtccgga cctcgtagtg gcactgctgg cggtcgtgaa atcgggcgcg 18960
gcctacgtac cgctcgaccc cgagtacccg gccgaccggc tcgcgtacat ggccggcgac 19020
gctgcccccg tggcggtcct gacccgcggg gacgtcgaac tccccgggtc cgtcccgcgg 19080
atcgggctgg acgacacaga gatccgcgcg acactcgcca ccgcccccgg cacgaacccc 19140
ggcacgccgg tgaccgaggc ccaccccgcg tacatgatct acacctccgg atccaccggc 19200
cgccccaagg gcgtcgtcgt ctcccacggc gccatcgtca accggctcgc ctggatgcag 19260
gcggagtacc gtctcgacgc gaccgatcgt gtcttgcaga agactccggc cggtttcgac 19320
gtgtcggtct gggagttctt ctggccgctg ctcgagggcg cggtcctcgt gttcgcccgg 19380
cccggcggcc accgggacgc ggcgtatctg gccggactca tcgagcgcga gcgcatcacc 19440
acggcacatt tcgtgccctc catgctgcgc gtcttcctcg aagagcccgg cgcggcactc 19500
tgcaccggac tgaggcgggt gatatgcagc ggcgaggccc tcggcacgga cctggccgtg 19560
gacttccgcg cgaaactgcc cgtccccctg cacaatctgt acggcccgac cgaagcggct 19620
gtcgatgtca cccaccacgc gtatgagccc gccaccggca cggccacggt ccccattggc 19680
cgccccatct ggaacatccg cacctacgtc ctcgacgccg ccctgcgtcc tgtgccaccg 19740
ggcgtgcccg gcgagctgta tctggccggc gccggcctgg cccgcggcta ccacggccgc 19800
ccggcactga ccgccgagcg cttcgtcgcc tgccccttcg gtgtccccgg tgagcgcatg 19860
taccggaccg gtgacctcgt ccgctggcgc gtcgacggga cgctggaatt cgtgggtcgg 19920
gcagacgatc aggtcaaggt ccggggtttc cgggtcgagc tcggcgaggt cgagggtgcc 19980
gtggctgccc acccggacgt cgtccgtgcc gtggtggtcg tgcgggagga ccgtcccggt 20040
gaccaccgcc tcgtcgccta cgtcacggtc ggtggcgtcg gtggcgacgg gctgcgttcg 20100
gccatctcgg gtctcgtcgc cgagcgtctc cctgcctaca tggtcccctc cgcggtcgtc 20160
gtgctcgacg agatcccgct cacccccaac ggcaaggtcg atcgcgcagg cctcccggtc 20220
ccggtcgtct ccgtcgccgg tttctgcgca ccctccagcc cgcgtgagga agtcctctgc 20280
ggactcttcg ccgaagtcct cggcgtggaa cgcgtcggcg tcgacgacgg cttcttcgac 20340
ctcggtggcg actcgatcct gtccatccag ctcgtcgctc gcgctcgccg tgcaggtctc 20400
gagctgtccg tgcgggacgt gttcgaaggg cgtaccgtgc gtgctctcgc tgccgtcgtc 20460
cgtggttccg acgctggggc ggtgggtgtc gtcggtggcg ctgagatcgt cctcccgggt 20520
gtcggcgagg tcgagcgctg gccggtcgtc gagtggctcg ccgagcgtgg cggtggatcc 20580
ctcggtggcg tcgtccgtgg cttcaaccag tcggtggtcc tggctgtccc ggcaggcctg 20640
gtctgggagg agctccgcgt cctcctgggt gccgtccggg accggcacga ggcctggcgg 20700
ctccgggtcc tcgactcggg agccctctgc gtggacggtg tcgtgcccga cgacggctcc 20760
tggatcgtgc ggtgcgacct ctcgggcatg ggtgtcgacg gccaggtcga cgccgtccgt 20820
gccgcagccg tcgaggcccg tgcgtggctc gacccgtccg tcggacgcgt cgtccgtgcc 20880
gtctggctcg agcgcggtgg tgaccgttcc ggtgtcctcg tcctcgtcgc ccaccacctc 20940
gtcgtcgacg gcgtctcctg gcgcgtcgtc ctcggcgacc tggcggaggg ctgggcccag 21000
gtccgctccg gtgggcgtgt cgagctcggc gtcgtcggca cctccctccg cggatgggct 21060
gccgctctcg ccgagcaggg tcgccgtggg gagcgtgcag gcgaggtcga gctctggtcc 21120
cgcatggtcc gcggtgcgga cgtgctcgtc ggctcccgtg ccgtcgacgg tgccgtcgac 21180
gtcttcggtg gcgtcgtctc cgtcgacagc cgtgcctccg tctccgtctc ccgtgccctc 21240
ctgaccgagg tccccagcgt gctcggtgtg ggtgtccagg aggtcctgct cgcagcgttc 21300
ggcctcgccg tggcacgctg gcggggtcgt ggcggtcccg tggtcgtcga cgtggagggc 21360
cacggtcgga acgaggacgc cgtccgcggt gccgacctct cgcggacggt gggctggttc 21420
acgagcgtct accccgtgcg tgtcccggtc gagtcggctt cctgggatga ggtccgggca 21480
ggtggtcccg tcgtcggtcg ggtcgtccgg gaggtcaagg agacgctccg cagcctcccg 21540
gaccagggac tcggctacgg gatcctccgg tacctggacc cggaacacgg acctgccctc 21600
gctcgccacg cgacgcccca gttcgggttc aactacctgg gtcggttcac gacgggcacg 21660
gacgagacga cgaccgcgga cgccctggac cgtgcgcctg cctggagcct gctggcacgg 21720
agcgctgcgg gtcaggaccc ggagctcccg gtcgcccacg ccgtggagtt caacgccatc 21780
accctcgaca cgcccgaagg tccccgtctc ggggtcacgt ggtcctggcc caccaccctc 21840
ctcccggagt cgcgcatccg cgagctcgca cggtactggg atgaggcgct cgagggcctc 21900
gtggagcacg ctcgccaccc ggaggcaggt gggctgaccc cgtcggacgt cggcctcgcg 21960
gaactctcct ttgctgagat cgaactgctc gaagacgact ggaggacaca gggatga 22017
<210> 11
<211> 7338
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Reprogrammed dptBC gene
<400> 11
Met Asn Arg Arg Ser Lys Val Val Glu Glu Ile Leu Pro Val Ser Ala
1 5 10 15
Leu Gln Glu Gly Leu Leu Phe His Ser Ser Phe Ala Ala Ala Asp Gly
20 25 30
Val Asp Val Tyr Ala Gly Gln Leu Ala Phe Asp Leu Val Gly Ala Val
35 40 45
Asp Thr Gly Arg Leu Arg Ala Ala Val Glu Ser Leu Val Ala Arg His
50 55 60
Gly Val Leu Arg Ser Ser Tyr Arg Gln Ala Arg Ser Gly Glu Trp Val
65 70 75 80
Ala Val Val Ala Arg Arg Val Ala Thr Pro Trp Arg Ala Val Asp Ala
85 90 95
Arg Asp Gly Ala Thr Asp Ala Ala Ala Val Ala Arg Glu Glu Arg Trp
100 105 110
Arg Pro Phe Asp Leu Gly Arg Ala Pro Leu Ala Arg Phe Val Leu Val
115 120 125
Arg Thr Asp Asp Asp Arg Phe Arg Phe Val Ile Thr Tyr His His Val
130 135 140
Ile Leu Asp Gly Trp Ser Leu Pro Val Leu Leu Arg Glu Leu Leu Ala
145 150 155 160
Leu Tyr Gly Ser Gly Ala Asp Pro Ser Val Leu Pro Pro Val Arg Pro
165 170 175
Tyr Gly Asp Phe Leu Arg Trp Ala Ala Ala Arg Asp Asp Ala Ala Ala
180 185 190
Glu Thr Ala Trp Arg Asp Ala Leu Thr Gly Leu Asp Glu Pro Ser Leu
195 200 205
Val Ala Pro Gly Ala Ser Pro Asp Gly Val Val Pro Ala Ser Val His
210 215 220
Ala Glu Leu Asp Lys Ala Gly Thr Glu Asn Leu Ala Ala Trp Ala Arg
225 230 235 240
His Arg Gly Ile Thr Gln Ala Thr Ala Val Arg Ala Ala Trp Ala Leu
245 250 255
Val Leu Gly Gln His Thr Gly Arg Asp Asp Val Val Phe Gly Val Thr
260 265 270
Val Ser Gly Arg Pro Ala Glu Leu Ala Gly Ala Glu His Met Val Gly
275 280 285
Leu Phe Ile Asn Thr Val Pro Leu Arg Thr Val Leu Asp Pro Ala Asp
290 295 300
Thr Leu Gly Thr Phe Ala Ala Arg Leu Gln Ala Glu Gln Thr Thr Leu
305 310 315 320
Leu Glu His Gln His Val Arg Leu Ser Asp Ile Gln Arg Trp Ala Gly
325 330 335
His Lys Glu Leu Phe Asp Thr Ile Val Val Phe Glu Asn Tyr Pro Ile
340 345 350
Gly His Ser Gly Pro Gly Ser Ile Arg Thr Asp Asp Phe Thr Val Thr
355 360 365
Ala Thr Glu Gly Ser Asp Ala Thr His Tyr Pro Leu Thr Leu Thr Ala
370 375 380
Val Pro Gly Glu Thr Leu Arg Leu Lys Leu Asp His Arg Pro Asp Leu
385 390 395 400
Val Asp Thr Thr Thr Ala Thr Ala Leu Leu Arg Arg Val Thr Arg Val
405 410 415
Leu Glu Thr Ala Thr Asp Asp Thr Gly His Thr Leu Ala Arg Leu Asp
420 425 430
Leu Leu Asp Asp Asp Glu Arg His Arg Leu Leu Arg Gly Trp Asn Asp
435 440 445
Thr Thr Arg Glu Gln Pro Pro Thr Tyr Tyr His Gln Glu Phe Glu Glu
450 455 460
Gln Ala Arg Arg Arg Pro His Asp Thr Ala Leu Val Phe Thr Ser Thr
465 470 475 480
Ser Trp Thr Tyr Glu Glu Leu Asn Asp Arg Ala Asn Arg Leu Ala Arg
485 490 495
Leu Leu Val Ala Ala Gly Ala Gly Ser Asp Asp Phe Val Ala Leu Ala
500 505 510
Phe Pro Arg Ser Ala Glu Ser Val Val Ala Ile Leu Ala Val Leu Lys
515 520 525
Ala Gly Ala Ala Tyr Leu Pro Leu Asp Met Asp Gln Pro Ala Glu Arg
530 535 540
Leu Thr Gly Ile Leu Ala Asp Ala His Pro Thr Val Val Leu Thr Thr
545 550 555 560
Thr Thr Ala Thr Pro Leu Pro His Pro Gly Arg Thr Leu Val Leu Asp
565 570 575
Ser Pro Thr Thr Ala Arg Ala Leu Ala Ala Ala Pro Ala His Asn Leu
580 585 590
Thr Asp Ala Asp Arg Arg Thr Pro Leu Asn Ala Arg Asn Ala Ala Tyr
595 600 605
Ile Ile His Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Val Ile
610 615 620
Glu His Arg Ser Leu Ala Asn Leu Phe His Asp His Arg Arg Ala Leu
625 630 635 640
Ile Glu Pro His Ala Ala Gly Gly Ser Arg Leu Lys Ala Gly Leu Thr
645 650 655
Ala Ser Leu Ser Phe Asp Thr Ser Trp Glu Gly Leu Ile Cys Leu Ala
660 665 670
Ala Gly His Glu Leu His Leu Ile Asp Asp Asp Thr Arg Arg Asp Ala
675 680 685
Glu Arg Val Ala Glu Leu Ile Asp Arg Gln Arg Ile Asp Val Ile Asp
690 695 700
Val Thr Pro Ser Phe Ala Gln Gln Leu Val Glu Thr Gly Ile Leu Asp
705 710 715 720
Glu Gly Arg His His Pro Ala Ala Phe Met Leu Gly Gly Glu Gly Val
725 730 735
Asp Ala Lys Leu Trp Thr Arg Leu Ser Asp Val Pro Gly Val Thr Ser
740 745 750
Tyr Asn Tyr Tyr Gly Pro Thr Glu Phe Thr Val Asp Ala Leu Ala Cys
755 760 765
Thr Val Gly Ile Ala Pro Arg Pro Val Ile Gly His Pro Leu Asp Asn
770 775 780
Thr Ala Ala Tyr Ile Leu Asp Gly Phe Leu Arg Pro Val Pro Glu Gly
785 790 795 800
Val Ala Gly Glu Leu Tyr Leu Ala Gly Thr Gln Leu Ala Arg Gly Tyr
805 810 815
Ala Gly Arg Pro Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe
820 825 830
Gly Ala Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Arg
835 840 845
Ser Pro Gly Gly Val Val Glu Tyr Leu Gly Arg Val Asp Asp Gln Ile
850 855 860
Lys Leu Arg Gly Phe Arg Ile Glu Pro Ala Glu Ile Glu Leu Ala Leu
865 870 875 880
Ala Gly His Pro Ala Val Ala Gln Asn Val Val Leu Leu His Arg Ser
885 890 895
Ala Thr Gly Glu Ala Arg Leu Val Ala Tyr Val Val Pro Gly Thr Pro
900 905 910
Val Asp Pro Arg Glu Leu Thr Gly His Leu Ala Ala Arg Leu Pro Ala
915 920 925
Tyr Met Val Pro Ser Ala Phe Val Leu Leu Asp Thr Leu Pro Leu Thr
930 935 940
Pro Asn Gly Lys Leu Asp Arg Gly Ala Leu Pro Glu Pro Ala Phe Gly
945 950 955 960
Thr Ala Pro Arg Pro Glu Arg Pro Arg Thr Pro Val Glu Glu Ile Leu
965 970 975
Cys Gly Leu Tyr Ala Asp Val Leu Gly Leu Pro Ser Phe Gly Ala Asp
980 985 990
Asp Asp Phe Phe Asp Ala Gly Gly His Ser Leu Leu Ala Ser Lys Leu
995 1000 1005
Val Ser Arg Ile Arg Thr Asn Leu Lys Thr Glu Leu Asn Val Arg Ala
1010 1015 1020
Leu Phe Glu His Arg Thr Val Ser Ser Leu Ala Thr Ala Leu His Arg
1025 1030 1035 1040
Ala Ala Gln Ala Gly Pro Ala Leu Thr Ala Gly Pro Arg Pro Ala Arg
1045 1050 1055
Ile Pro Leu Ser Tyr Ala Gln Arg Arg Leu Trp Phe Leu Asn Arg Leu
1060 1065 1070
Asp Arg Asp Ser Ala Ala Tyr Asn Met Pro Val Ala Leu Arg Leu Arg
1075 1080 1085
Gly Pro Leu Asp Ser Thr Ala Met Cys Ala Ala Leu Thr Asp Val Ala
1090 1095 1100
Glu Arg His Glu Ala Leu Arg Thr Val Phe Glu Glu Asp Arg Asp Gly
1105 1110 1115 1120
Ala His Gln Ile Val Leu Pro Ala Thr Gly Leu Gly Pro Leu Leu Thr
1125 1130 1135
Val Thr Gly Ala Asp Gly Thr Thr Leu Arg Ala Leu Ile Thr Glu Phe
1140 1145 1150
Val Arg Arg Pro Phe Asp Leu Ala Ala Glu Ile Pro Phe Arg Ala Ala
1155 1160 1165
Leu Phe Arg Val Gly Asp Glu Glu His Val Leu Val Val Val Leu His
1170 1175 1180
His Ile Ala Gly Asp Gly Trp Ser Met Gly Pro Leu Ala Arg Asp Val
1185 1190 1195 1200
Ala Glu Ala Tyr Arg Ala Arg Ala Ala Gly Arg Ala Pro Asp Trp Glu
1205 1210 1215
Pro Leu Pro Val Gln Tyr Ala Asp Tyr Ala Leu Trp Gln Arg Glu Val
1220 1225 1230
Leu Gly Ala Glu Asp Asp Glu Thr Gly Glu Leu Ser Ala Gln Leu Ala
1235 1240 1245
His Trp Arg Thr Arg Leu Ala Gly Ala Pro Ala Glu Leu Thr Leu Pro
1250 1255 1260
Thr Asp Arg Pro Arg Pro Ala Val Ala Ser Thr Ala Gly Asp Arg Val
1265 1270 1275 1280
Glu Phe Thr Val Pro Ala Gly Leu His Gln Ala Leu Ala Asp Leu Ala
1285 1290 1295
Arg Ala His Gly Ala Thr Val Phe Met Val Val Gln Ala Ala Leu Ala
1300 1305 1310
Val Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile Pro Ile Gly Thr
1315 1320 1325
Pro Val Ala Gly Arg Thr Asp Glu Ala Thr Glu Glu Leu Ile Gly Phe
1330 1335 1340
Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser Gly Asp Pro Thr
1345 1350 1355 1360
Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp Leu Asp Ala Tyr
1365 1370 1375
Ala His Gln Asp Val Pro Phe Glu Arg Leu Val Glu Val Leu Asn Pro
1380 1385 1390
Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val Met Leu Thr Phe
1395 1400 1405
Asn Val Pro Asp Met Asp Gly Val Gly Ser Ala Leu Gly Asn Leu Gly
1410 1415 1420
Glu Leu Glu Val Ser Gly Glu Ala Ile Arg Thr Asp Gln Thr Lys Val
1425 1430 1435 1440
Asp Leu Ala Phe Thr Cys Thr Glu Met Tyr Ala Ala Asp Gly Ala Ala
1445 1450 1455
Ser Gly Met Arg Gly Val Leu Glu Tyr Arg Leu Asp Val Phe Gly Ala
1460 1465 1470
Val Gln Ala Arg Glu Thr Thr Glu Arg Leu Val Arg Val Leu Glu Gly
1475 1480 1485
Val Val Ser Gly Gly Gly Gly Val Ser Val Ser Gly Val Asp Val Leu
1490 1495 1500
Gly Val Gly Glu Arg Glu Arg Leu Leu Gly Trp Gly Val Gly Gly Pro
1505 1510 1515 1520
Val Pro Val Val Pro Gly Gly Gly Leu Val Gly Leu Phe Glu Glu Arg
1525 1530 1535
Val Arg Ala Asp Ala Asp Ala Val Ala Val Arg Gly Ala Gly Val Val
1540 1545 1550
Trp Ser Tyr Gly Glu Leu Asn Ala Arg Val Asn Val Val Ala Arg Trp
1555 1560 1565
Leu Val Gly Arg Gly Val Gly Ala Glu Cys Gly Val Gly Val Val Met
1570 1575 1580
Gly Arg Gly Val Asp Val Val Val Met Leu Leu Ala Val Ala Lys Ala
1585 1590 1595 1600
Gly Gly Phe Tyr Val Pro Val Asp Pro Glu Trp Pro Val Glu Arg Val
1605 1610 1615
Gly Trp Val Leu Ala Asp Ala Gly Val Gly Leu Val Val Val Gly Glu
1620 1625 1630
Gly Leu Ser His Val Val Gly Asp Phe Pro Gly Gly Glu Val Phe Glu
1635 1640 1645
Phe Ser Arg Val Val Arg Glu Ser Cys Leu Val Glu Leu Val Ala Ala
1650 1655 1660
Asp Gly Val Glu Val Arg Asn Val Thr Asp Gly Glu Arg Ala Ser Arg
1665 1670 1675 1680
Leu Leu Pro Gly His Pro Leu Tyr Val Val Tyr Thr Ser Gly Ser Thr
1685 1690 1695
Gly Arg Pro Lys Gly Val Val Val Thr His Ala Ser Val Gly Gly Tyr
1700 1705 1710
Leu Ala Arg Gly Arg Asp Val Tyr Ala Gly Ala Val Gly Gly Val Gly
1715 1720 1725
Phe Val His Ser Ser Leu Ala Phe Asp Leu Thr Val Thr Val Leu Phe
1730 1735 1740
Thr Pro Leu Val Ser Gly Gly Cys Val Val Leu Gly Glu Leu Asp Glu
1745 1750 1755 1760
Ser Ala Gln Gly Val Gly Ala Ser Phe Val Lys Val Thr Pro Ser His
1765 1770 1775
Leu Gly Leu Leu Gly Glu Leu Glu Gly Val Val Ala Gly Asn Gly Met
1780 1785 1790
Leu Leu Val Gly Gly Glu Ala Leu Ser Gly Gly Ala Leu Arg Glu Trp
1795 1800 1805
Arg Glu Arg Asn Pro Gly Val Val Val Val Asn Ala Tyr Gly Pro Thr
1810 1815 1820
Glu Leu Thr Val Asn Cys Ala Glu Phe Leu Ile Ala Pro Gly Glu Glu
1825 1830 1835 1840
Val Pro Asp Gly Pro Val Pro Ile Gly Arg Pro Phe Ala Gly Gln Arg
1845 1850 1855
Met Phe Val Leu Asp Ala Ala Leu Arg Val Val Pro Val Gly Val Val
1860 1865 1870
Gly Glu Leu Tyr Val Ala Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly
1875 1880 1885
Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe Gly Ala
1890 1895 1900
Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Arg Val
1905 1910 1915 1920
Asp Gly Ala Leu Glu Phe Val Gly Arg Ala Asp Asp Gln Val Lys Val
1925 1930 1935
Arg Gly Phe Arg Val Glu Leu Gly Glu Val Glu Gly Ala Val Ala Ala
1940 1945 1950
His Pro Asp Val Val Arg Ala Val Val Val Val Arg Glu Asp Arg Pro
1955 1960 1965
Gly Asp His Arg Leu Val Ala Tyr Val Thr Gly Val Asp Thr Gly Gly
1970 1975 1980
Leu Ser Ser Ala Val Met Arg Ala Val Ala Glu Arg Leu Pro Ala Tyr
1985 1990 1995 2000
Met Val Pro Ser Ala Val Val Val Leu Asp Glu Ile Pro Leu Thr Pro
2005 2010 2015
Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val Pro Gly Val Glu Ala
2020 2025 2030
Gly Ala Gly Tyr Arg Ala Pro Val Ser Pro Arg Glu Glu Val Leu Cys
2035 2040 2045
Gly Leu Phe Ala Glu Val Leu Gly Leu Glu Arg Val Gly Val Asp Asp
2050 2055 2060
Asp Phe Phe Gly Leu Gly Gly His Ser Leu Leu Ala Thr Arg Leu Ile
2065 2070 2075 2080
Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala Gly Val Arg Ala Leu
2085 2090 2095
Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg Leu Leu Arg Glu Arg
2100 2105 2110
Ser Ala Leu Gly Val Arg Val Pro Leu Val Ala Arg Glu Arg Thr Gly
2115 2120 2125
Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu Trp Phe Leu Glu Glu
2130 2135 2140
Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro Met Ala Leu Arg Leu
2145 2150 2155 2160
Ala Gly Val Leu Asp Val Glu Ala Leu His Gln Ala Leu Ile Asp Val
2165 2170 2175
Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile Ala Gln Asp Ala Gly
2180 2185 2190
Thr Ala Trp Gln His Ile Leu Pro Val Asp Asp Pro Arg Thr Arg Pro
2195 2200 2205
Gly Leu Pro Leu Val Asp Ile Gly Ala Asp Ala Leu Gln Glu Arg Leu
2210 2215 2220
Asp Glu Ala Ala Gly Arg Pro Phe Asp Leu Ala Ala Asp Leu Pro Val
2225 2230 2235 2240
Arg Ala Thr Val Phe Arg Leu Thr Asp Asn Asp His Ile Leu Leu Val
2245 2250 2255
Val Ala His His Val Ala Phe Asp Ala Met Ser Arg Val Pro Phe Ile
2260 2265 2270
Arg Asn Val Lys Arg Ala Phe Glu Ala Arg Thr Asn Gly Ala Ala Pro
2275 2280 2285
Asp Trp Arg Pro Leu Pro Val Gln Tyr Ala Asp Tyr Ala Ala Trp Gln
2290 2295 2300
Arg Asp Val Leu Gly Thr Glu Asp Asp Glu Ser Ser Glu Leu Ser Ala
2305 2310 2315 2320
Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala Ser Leu Pro Ala Glu Leu
2325 2330 2335
Ala Leu Pro Thr Asp Arg Ala Arg Pro Ala Val Ala Ser Tyr Glu Gly
2340 2345 2350
Gly Lys Val Glu Phe Thr Val Pro Ala Gly Val Tyr Asp Gly Leu Val
2355 2360 2365
Ala Leu Ala Arg Ala Glu Gly Val Thr Val Phe Met Val Val Gln Ala
2370 2375 2380
Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile Pro
2385 2390 2395 2400
Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp Gln Ala Thr Glu Asp Leu
2405 2410 2415
Ile Gly Phe Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser Gly
2420 2425 2430
Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp Leu
2435 2440 2445
Asp Ala Tyr Ala His Gln Asp Ile Pro Phe Glu Arg Leu Val Glu Ala
2450 2455 2460
Val Asn Pro Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val Met
2465 2470 2475 2480
Leu Thr Phe Asp Asn Thr Ile Asp Arg Glu Val Thr Glu Gly Phe Ala
2485 2490 2495
Gly Leu Gly Val Glu Gly Leu Pro Leu Gly Ala Gly Ala Val Lys Phe
2500 2505 2510
Asp Leu Leu Phe Gly Leu Ser Glu Val Gly Gly Glu Leu Arg Gly Ala
2515 2520 2525
Val Glu Tyr Arg Cys Asp Leu Phe Asp His Pro Thr Val Ala Gln Leu
2530 2535 2540
Ala Glu Arg Leu Val Arg Val Leu Glu Arg Val Ala Ser Asp Ala Ser
2545 2550 2555 2560
Val Arg Thr Gly Glu Leu Pro Val Val Gly Glu Ala Glu Arg Ala Arg
2565 2570 2575
Val Leu Thr Glu Trp Asn Asp Thr Gly Val Pro Gly Val Pro Glu Thr
2580 2585 2590
Phe Leu Glu Leu Phe Glu Ala Gln Val Ala Ala Arg Gly Asp Ala Pro
2595 2600 2605
Ala Val Val Tyr Glu Gly Glu Val Leu Ser Tyr Arg Glu Leu Asp Ala
2610 2615 2620
Arg Ala Asn Arg Leu Ala Gly Leu Leu Val Gly Arg Gly Ala Gly Pro
2625 2630 2635 2640
Glu His Phe Val Gly Val Ala Leu Pro Arg Gly Leu Asp Leu Ile Val
2645 2650 2655
Ala Leu Leu Ala Val Leu Lys Ser Gly Ala Ala Tyr Val Pro Leu Asp
2660 2665 2670
Pro Glu Tyr Pro Ala Glu Arg Leu Val His Met Val Thr Asp Ala Ala
2675 2680 2685
Pro Val Val Val Val Thr Ser Thr Asp Val Arg Thr Leu Arg Thr Val
2690 2695 2700
Pro Arg Val Glu Leu Asp Asp Glu Ala Thr Arg Ala Thr Leu Val Ala
2705 2710 2715 2720
Ala Pro Ala Thr Gly Pro Asp Val Lys Met Ser Ala Ser His Pro Ala
2725 2730 2735
Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Val
2740 2745 2750
Ile Ser His Gly Ser Leu Ala Asn Phe Leu Ala Trp Ala Arg Glu Asp
2755 2760 2765
Leu Gly Ala Glu Arg Leu Arg His Val Val Leu Ser Thr Ser Leu Ser
2770 2775 2780
Phe Asp Val Ser Val Val Glu Leu Phe Ala Pro Leu Ser Cys Gly Gly
2785 2790 2795 2800
Thr Val Glu Ile Val Arg Asn Leu Leu Ala Leu Val Asp Arg Pro Gly
2805 2810 2815
Arg Trp Ser Ala Ser Leu Val Ser Gly Val Pro Ser Ala Phe Ala Gln
2820 2825 2830
Leu Leu Glu Ala Gly Leu Asp Arg Ala Asp Val Gly Met Ile Ala Leu
2835 2840 2845
Ala Gly Glu Ala Leu Ser Ala Arg Asp Val Arg Arg Val Arg Ala Val
2850 2855 2860
Leu Pro Gly Ala Arg Val Ala Asn Phe Tyr Gly Pro Thr Glu Ala Thr
2865 2870 2875 2880
Val Tyr Ala Thr Ala Trp Tyr Gly Asp Thr Pro Met Asp Ala Ala Ala
2885 2890 2895
Pro Met Gly Arg Pro Leu Arg Asn Thr Cys Val Tyr Val Leu Asp Asp
2900 2905 2910
Gly Leu Arg Val Val Pro Val Gly Val Val Gly Glu Leu Tyr Val Ala
2915 2920 2925
Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly Arg Val Gly Leu Thr Ala
2930 2935 2940
Glu Arg Phe Val Ala Cys Pro Phe Gly Ala Arg Gly Glu Arg Met Tyr
2945 2950 2955 2960
Arg Thr Gly Asp Leu Val Arg Trp Arg Val Asp Gly Thr Leu Glu Phe
2965 2970 2975
Val Gly Arg Ala Asp Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu
2980 2985 2990
Leu Gly Glu Val Glu Gly Ala Val Ala Ala His Pro Asp Val Val Arg
2995 3000 3005
Ala Val Val Val Val Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val
3010 3015 3020
Ala Tyr Val Thr Gly Val Asp Thr Gly Gly Leu Ser Ser Ala Val Met
3025 3030 3035 3040
Arg Ala Val Ala Glu Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val
3045 3050 3055
Val Val Leu Asp Glu Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg
3060 3065 3070
Ala Gly Leu Pro Val Pro Val Val Ser Val Ala Gly Phe Cys Ala Pro
3075 3080 3085
Ser Ser Pro Arg Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu
3090 3095 3100
Gly Val Glu Arg Val Gly Val Asp Asp Gly Phe Phe Asp Leu Gly Gly
3105 3110 3115 3120
Asp Ser Ile Leu Ser Ile Gln Leu Val Ala Arg Ala Arg Arg Ala Gly
3125 3130 3135
Leu Glu Leu Ser Val Arg Asp Val Phe Glu Gly Arg Thr Val Arg Ala
3140 3145 3150
Leu Ala Ala Val Val Arg Gly Ser Asp Ala Gly Ala Val Gly Val Val
3155 3160 3165
Gly Gly Ala Glu Ile Val Leu Pro Gly Val Gly Glu Val Glu Arg Trp
3170 3175 3180
Pro Val Val Glu Trp Leu Ala Glu Arg Gly Gly Gly Ser Leu Gly Gly
3185 3190 3195 3200
Val Val Arg Gly Phe Asn Gln Ser Val Val Leu Ala Val Pro Ala Gly
3205 3210 3215
Leu Val Trp Glu Glu Leu Arg Val Leu Leu Gly Ala Val Arg Asp Arg
3220 3225 3230
His Glu Ala Trp Arg Leu Arg Val Leu Asp Ser Gly Ala Leu Cys Val
3235 3240 3245
Asp Gly Val Val Pro Asp Asp Gly Ser Trp Ile Val Arg Cys Asp Leu
3250 3255 3260
Ser Gly Met Gly Val Asp Gly Gln Val Asp Ala Val Arg Ala Ala Ala
3265 3270 3275 3280
Val Glu Ala Arg Ala Trp Leu Asp Pro Ser Val Gly Arg Val Val Arg
3285 3290 3295
Ala Val Trp Leu Glu Arg Gly Gly Asp Arg Ser Gly Val Leu Val Leu
3300 3305 3310
Val Ala His His Leu Val Val Asp Gly Val Ser Trp Arg Val Val Leu
3315 3320 3325
Gly Asp Leu Ala Glu Gly Trp Ala Gln Val Arg Ser Gly Gly Arg Val
3330 3335 3340
Glu Leu Gly Val Val Gly Thr Ser Leu Arg Gly Trp Ala Ala Ala Leu
3345 3350 3355 3360
Ala Glu Gln Gly Arg Arg Gly Glu Arg Ala Gly Glu Val Glu Leu Trp
3365 3370 3375
Ser Arg Met Val Arg Gly Ala Asp Val Leu Val Gly Ser Arg Ala Val
3380 3385 3390
Asp Gly Ala Val Asp Val Phe Gly Gly Val Val Ser Val Asp Ser Arg
3395 3400 3405
Ala Ser Val Ser Val Ser Arg Ala Leu Leu Thr Glu Val Pro Ser Val
3410 3415 3420
Leu Gly Val Gly Val Gln Glu Val Leu Leu Ala Ala Phe Gly Leu Ala
3425 3430 3435 3440
Val Ala Arg Trp Arg Gly Arg Gly Gly Pro Val Val Val Asp Val Glu
3445 3450 3455
Gly His Gly Arg Asn Glu Asp Ala Val Arg Gly Ala Asp Leu Ser Arg
3460 3465 3470
Thr Val Gly Trp Phe Thr Ser Val Tyr Pro Val Arg Val Pro Val Glu
3475 3480 3485
Ser Ala Ser Trp Asp Glu Val Arg Ala Gly Gly Pro Val Val Gly Arg
3490 3495 3500
Val Val Arg Glu Val Lys Glu Thr Leu Arg Ser Leu Pro Asp Gln Gly
3505 3510 3515 3520
Leu Gly Tyr Gly Ile Leu Arg Tyr Leu Asp Pro Glu His Gly Pro Ala
3525 3530 3535
Leu Ala Arg His Ala Thr Pro Gln Phe Gly Phe Asn Tyr Leu Gly Arg
3540 3545 3550
Phe Thr Thr Gly Thr Asp Asp Thr Gly Asp Glu Gly Met Thr Asp Trp
3555 3560 3565
Val Pro Val Ser Gly Pro Phe Ala Val Gly Ala Gly Gln Asp Pro Glu
3570 3575 3580
Leu Pro Val Ala His Ala Val Glu Phe Asn Ala Ile Thr Leu Asp Thr
3585 3590 3595 3600
Pro Glu Gly Pro Arg Leu Gly Val Thr Trp Ser Trp Pro Thr Thr Leu
3605 3610 3615
Leu Pro Glu Ser Arg Ile Arg Glu Leu Ala Arg Tyr Trp Asp Glu Ala
3620 3625 3630
Leu Glu Gly Leu Val Glu His Ala Arg His Pro Glu Ala Gly Gly Leu
3635 3640 3645
Thr Pro Ser Asp Val Thr Leu Val Glu Val Asn Gln Val Glu Leu Asp
3650 3655 3660
Arg Leu Gln Ala Gly Val Ala Gly Gly Ala Glu Glu Ile Leu Pro Val
3665 3670 3675 3680
Ser Ala Leu Gln Glu Gly Leu Leu Phe His Ser Ala Leu Ala Ser Gly
3685 3690 3695
Gly Val Asp Val Tyr Val Gly Gln Leu Val Phe Asp Leu Val Gly Pro
3700 3705 3710
Val Asp Val Asp Arg Leu Arg Ala Ala Val Glu Gly Leu Val Ala Arg
3715 3720 3725
His Gly Val Leu Arg Ser Gly Tyr Arg Gln Leu Arg Ser Gly Glu Trp
3730 3735 3740
Val Ala Val Val Ala Arg Gln Val Asp Leu Pro Trp Gln Ser Ile Asp
3745 3750 3755 3760
Val Arg Asp Gly Gly Ile Asp Gly Leu Val Glu Glu Glu Arg Trp Arg
3765 3770 3775
Arg Phe Asp Met Gly Arg Gly Pro Leu Ala Arg Phe Val Leu Ile Arg
3780 3785 3790
Thr His Asp Asp Arg Phe Arg Phe Val Ile Thr Tyr His His Val Val
3795 3800 3805
Leu Asp Gly Trp Ser Val Pro Val Leu Leu Arg Glu Leu Leu Ala Leu
3810 3815 3820
Tyr Gly Ser Ser Gly Asp Val Ser Val Leu Pro Gly Val Arg Ser Tyr
3825 3830 3835 3840
Gly Asp Phe Leu Arg Trp Val Ala Ala Arg Asp Ala Ala Ala Ala Glu
3845 3850 3855
Gly Ala Trp Arg Arg Ala Leu Thr Gly Leu Glu Glu Pro Ser Leu Val
3860 3865 3870
Ala Pro Gly Val Ser Arg Asp Gly Val Val Pro Ala Ala Phe His Gly
3875 3880 3885
Ala Val Asp Gly Asp Leu Ser Gln Lys Ile Val Ala Trp Ala Arg Gly
3890 3895 3900
Arg Gly Val Thr Val Ala Ser Val Val Gln Ala Ala Trp Ala Leu Val
3905 3910 3915 3920
Leu Gly Arg Leu Met Gly Arg Asp Asp Val Val Phe Gly Val Thr Val
3925 3930 3935
Ser Gly Arg Pro Ala Glu Val Val Gly Val Glu Asp Met Val Gly Leu
3940 3945 3950
Phe Val Asn Thr Ile Pro Leu Arg Ala Arg Leu Asp Pro Ala Glu Ser
3955 3960 3965
Leu Gly Gly Phe Val Glu Arg Leu Gln Arg Glu Gln Thr Glu Leu Leu
3970 3975 3980
Glu His Gln His Val Arg Leu Ala Glu Val Gln Arg Trp Ala Gly His
3985 3990 3995 4000
Lys Glu Leu Phe Asp Val Gly Met Val Phe Asp Asn Tyr Pro Val Ser
4005 4010 4015
Ser Glu Ser Pro Glu Ala Glu Phe Gln Ile Ser Arg Thr Gly Gly Tyr
4020 4025 4030
Asn Gly Thr His Tyr Ala Leu Asn Leu Val Ala Ser Met His Gly Leu
4035 4040 4045
Glu Leu Glu Leu Glu Ile Gly Tyr Arg Pro Asp Val Phe Asp Ala Gly
4050 4055 4060
Arg Val Arg Glu Val Trp Gly Trp Leu Val Arg Val Leu Glu Gly Val
4065 4070 4075 4080
Val Ser Gly Gly Gly Gly Val Ser Val Ser Gly Val Asp Val Leu Gly
4085 4090 4095
Val Gly Glu Arg Glu Arg Leu Leu Gly Trp Gly Val Gly Gly Pro Val
4100 4105 4110
Pro Val Val Pro Gly Gly Gly Leu Val Gly Leu Phe Glu Glu Arg Val
4115 4120 4125
Arg Ala Asp Ala Asp Ala Val Ala Val Arg Gly Ala Gly Val Val Trp
4130 4135 4140
Ser Tyr Gly Glu Leu Asn Ala Arg Val Asn Val Val Ala Arg Trp Leu
4145 4150 4155 4160
Val Gly Arg Gly Val Gly Ala Glu Cys Gly Val Gly Val Val Met Gly
4165 4170 4175
Arg Gly Val Asp Val Val Val Met Leu Leu Ala Val Ala Lys Ala Gly
4180 4185 4190
Gly Phe Tyr Val Pro Val Asp Pro Glu Trp Pro Val Glu Arg Val Gly
4195 4200 4205
Trp Val Leu Ala Asp Ala Gly Val Gly Leu Val Val Val Gly Glu Gly
4210 4215 4220
Leu Ser His Val Val Gly Asp Phe Pro Gly Gly Glu Val Phe Glu Phe
4225 4230 4235 4240
Ser Arg Val Val Arg Glu Ser Cys Leu Val Glu Leu Val Ala Ala Asp
4245 4250 4255
Gly Val Glu Val Arg Asn Val Thr Asp Gly Glu Arg Ala Ser Arg Leu
4260 4265 4270
Leu Pro Gly His Pro Leu Tyr Val Val Tyr Thr Ser Gly Ser Thr Gly
4275 4280 4285
Arg Pro Lys Gly Val Val Val Thr His Ala Ser Val Gly Gly Tyr Leu
4290 4295 4300
Ala Arg Gly Arg Asp Val Tyr Ala Gly Ala Val Gly Gly Val Gly Phe
4305 4310 4315 4320
Val His Ser Ser Leu Ala Phe Asp Leu Thr Val Thr Val Leu Phe Thr
4325 4330 4335
Pro Leu Val Ser Gly Gly Cys Val Val Leu Gly Glu Leu Asp Glu Ser
4340 4345 4350
Ala Gln Gly Val Gly Ala Ser Phe Val Lys Val Thr Pro Ser His Leu
4355 4360 4365
Gly Leu Leu Gly Glu Leu Glu Gly Val Val Ala Gly Asn Gly Met Leu
4370 4375 4380
Leu Val Gly Gly Glu Ala Leu Ser Gly Gly Ala Leu Arg Glu Trp Arg
4385 4390 4395 4400
Glu Arg Asn Pro Gly Val Val Val Val Asn Ala Tyr Gly Pro Thr Glu
4405 4410 4415
Leu Thr Val Asn Cys Ala Glu Phe Leu Ile Ala Pro Gly Glu Glu Val
4420 4425 4430
Pro Asp Gly Pro Val Pro Ile Gly Arg Pro Phe Ala Gly Gln Arg Met
4435 4440 4445
Phe Val Leu Asp Ala Ala Leu Arg Val Val Pro Val Gly Val Val Gly
4450 4455 4460
Glu Leu Tyr Val Ala Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly Arg
4465 4470 4475 4480
Val Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe Gly Val Pro
4485 4490 4495
Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Arg Val Asp
4500 4505 4510
Gly Ala Leu Glu Phe Val Gly Arg Ala Asp Asp Gln Val Lys Val Arg
4515 4520 4525
Gly Phe Arg Val Glu Leu Gly Glu Val Glu Gly Ala Val Ala Ala His
4530 4535 4540
Pro Asp Val Val Arg Ala Val Val Val Val Arg Glu Asp Arg Pro Gly
4545 4550 4555 4560
Asp His Arg Leu Val Ala Tyr Val Thr Ala Gly Gly Val Gly Gly Asp
4565 4570 4575
Gly Leu Arg Ser Ala Ile Ser Gly Leu Val Ala Glu Arg Leu Pro Ala
4580 4585 4590
Tyr Met Val Pro Ser Ala Val Val Val Leu Asp Glu Ile Pro Leu Thr
4595 4600 4605
Pro Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val Pro Glu Val Glu
4610 4615 4620
Ala Gly Thr Gly Tyr Arg Ala Pro Val Ser Pro Arg Glu Glu Val Leu
4625 4630 4635 4640
Cys Gly Leu Phe Ala Glu Val Leu Gly Val Glu Arg Val Gly Val Asp
4645 4650 4655
Asp Asp Phe Phe Glu Leu Gly Gly His Ser Leu Leu Ala Thr Arg Leu
4660 4665 4670
Ile Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala Gly Val Arg Ala
4675 4680 4685
Leu Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg Leu Leu Arg Glu
4690 4695 4700
Arg Ser Gly Leu Gly Val Arg Val Pro Leu Val Ala Arg Glu Arg Thr
4705 4710 4715 4720
Gly Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu Trp Phe Leu Glu
4725 4730 4735
Glu Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro Met Ala Leu Arg
4740 4745 4750
Leu Ala Gly Val Leu Asp Val Glu Ala Leu His Gln Ala Leu Ile Asp
4755 4760 4765
Val Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile Ala Gln Asp Ala
4770 4775 4780
Gly Thr Ala Trp Gln His Ile Leu Pro Val Asp Asp Pro Arg Thr Arg
4785 4790 4795 4800
Pro Gly Leu Pro Leu Val Asp Ile Gly Ala Asp Ala Leu Gln Glu Arg
4805 4810 4815
Leu Asp Glu Ala Ala Gly Arg Pro Phe Asp Leu Ala Ala Asp Leu Pro
4820 4825 4830
Val Arg Ala Thr Val Phe Arg Leu Thr Asp Asn Asp His Ile Leu Leu
4835 4840 4845
Leu Val Leu His His Ile Ala Gly Asp Gly Trp Ser Met Gly Pro Leu
4850 4855 4860
Ala Arg Asp Leu Ser Thr Ala Tyr Ser Ala Arg Ala Ala Gly Ala Ala
4865 4870 4875 4880
Ser Ala Trp Arg Pro Leu Ser Val Gln Tyr Ala Asp Tyr Ala Ala Trp
4885 4890 4895
Gln Arg Asp Val Leu Gly Thr Glu Asp Asp Glu Ser Ser Glu Leu Ser
4900 4905 4910
Ala Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala Ser Leu Pro Ala Glu
4915 4920 4925
Leu Ala Leu Pro Thr Asp Arg Ala Arg Pro Ala Val Ala Thr Tyr Arg
4930 4935 4940
Gly Gly Arg Ile Glu Phe Thr Ile Pro Ala Asp Val His Arg Ser Leu
4945 4950 4955 4960
Ala Asp Leu Ala Arg Ala Glu Gly Val Thr Val Phe Met Val Val Gln
4965 4970 4975
Ala Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile
4980 4985 4990
Pro Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp Gln Ala Thr Glu Asp
4995 5000 5005
Leu Ile Gly Phe Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser
5010 5015 5020
Gly Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp
5025 5030 5035 5040
Leu Asp Ala Tyr Ala His Gln Asp Ile Pro Phe Glu Arg Leu Val Glu
5045 5050 5055
Ala Val Asn Pro Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val
5060 5065 5070
Met Leu Ala Phe Asn Asn Ala Glu Thr Ser Thr Pro Leu Pro Met Ala
5075 5080 5085
Glu Gly Leu Ala Ala Ser Arg Gln Asp Ile Glu Pro Gly Val Ala Lys
5090 5095 5100
Phe Asp Leu Ala Leu Tyr Cys Asn Glu Ser Arg Gly Glu Thr Gly Asp
5105 5110 5115 5120
His Gln Gly Ile Arg Ser Val Phe Glu Tyr Arg Arg Asp Leu Trp Asp
5125 5130 5135
Glu Asp Thr Val Arg Gln Leu Ala Asp Arg Phe Leu His Val Leu Ala
5140 5145 5150
Ala Phe Ala Ala Ala Pro Glu Gln Arg Ala Ser Ser Val Asp Val Leu
5155 5160 5165
Arg Ala Gly Glu Arg Asp Gln Leu Leu His Glu Trp Asn Asp Thr Ala
5170 5175 5180
Ala Ala Leu Pro Pro Ala Leu Leu Pro Gln Leu Phe Glu Glu Gln Val
5185 5190 5195 5200
Arg Arg Thr Pro His Asp Val Ala Leu Val Ser Gly Asn Ile Arg Leu
5205 5210 5215
Thr Tyr Ala Glu Leu Asp Ala Arg Ala Asn Arg Leu Ala His Leu Leu
5220 5225 5230
Leu Ala Arg Gly Ala Ala Pro Glu Thr Phe Val Ala Val Ala Leu Pro
5235 5240 5245
Arg Thr Glu Glu Leu Leu Val Ala Leu Leu Ala Val Gln Lys Thr Gly
5250 5255 5260
Ala Gly His Leu Pro Leu Asp Pro Gly Phe Pro Ala Glu Arg Leu Ser
5265 5270 5275 5280
Tyr Met Leu Asp Asp Ala Arg Pro Ala Val Val Leu Thr Thr Glu Asp
5285 5290 5295
Ile Ser Ala Arg Ile Pro Gly Gly Ser His Val Val Leu Asp Ser Glu
5300 5305 5310
Gln Val Thr Gly Glu Leu His Asp His Pro Ala Thr Ser Pro Ala Gly
5315 5320 5325
Arg Gly Asn Pro Ala Gly Pro Ala Tyr Val Ile Tyr Thr Ser Gly Ser
5330 5335 5340
Thr Gly Gln Pro Lys Gly Val Val Val Pro Ser Ala Ala Leu Val Asn
5345 5350 5355 5360
Phe Leu Ala Asp Met Val Pro Arg Leu Gly Leu Arg Gly Gly Asp Arg
5365 5370 5375
Leu Leu Ser Val Thr Thr Val Gly Phe Asp Ile Ala Ala Leu Glu Leu
5380 5385 5390
Phe Val Pro Leu Leu Ser Gly Ala Thr Val Val Leu Ala Asp Gly Glu
5395 5400 5405
Thr Val Arg Asp Pro Ala Leu Ala Arg Gln Thr Cys Glu Asp His Gly
5410 5415 5420
Val Thr Met Val Gln Ala Thr Pro Ser Trp Trp His Gly Met Leu Ala
5425 5430 5435 5440
Asp Ala Gly Asp Ser Leu Arg Gly Val His Ala Val Val Gly Gly Glu
5445 5450 5455
Ala Leu Ser Pro Gly Leu Arg Asp Ala Leu Thr Arg Gly Ala Arg Ser
5460 5465 5470
Val Thr Asn Met Tyr Gly Pro Thr Glu Thr Thr Ile Trp Ser Thr Ser
5475 5480 5485
Ala Gly Gln Ala Ala Gly Asp Ser Ala Pro Pro Ser Ile Gly Thr Pro
5490 5495 5500
Ile Leu Asn Thr Arg Val Tyr Val Leu Asp Ala Ala Leu Cys Val Val
5505 5510 5515 5520
Pro Pro Gly Val Ala Gly Glu Leu Tyr Ile Ala Gly Asp Gly Leu Ala
5525 5530 5535
Arg Gly Tyr Leu Gly Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala
5540 5545 5550
Cys Pro Phe Gly Ala Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu
5555 5560 5565
Val Arg Trp Arg Val Asp Gly Ala Leu Glu Phe Val Gly Arg Ala Asp
5570 5575 5580
Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu Leu Gly Glu Val Glu
5585 5590 5595 5600
Gly Ala Val Ala Ala His Pro Asp Val Val Arg Ala Val Val Val Val
5605 5610 5615
Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val Ala Tyr Val Thr Gly
5620 5625 5630
Val Asp Thr Gly Gly Leu Ser Ser Ala Val Met Arg Ala Val Ala Glu
5635 5640 5645
Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val Val Val Leu Asp Glu
5650 5655 5660
Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val
5665 5670 5675 5680
Pro Gly Val Glu Ala Gly Ala Gly Tyr Arg Ala Pro Val Ser Pro Arg
5685 5690 5695
Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu Gly Val Glu Arg
5700 5705 5710
Val Gly Val Asp Asp Asp Phe Phe Gly Leu Gly Gly His Ser Leu Leu
5715 5720 5725
Ala Thr Arg Leu Ile Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala
5730 5735 5740
Gly Val Arg Ala Leu Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg
5745 5750 5755 5760
Leu Leu Arg Glu Arg Ser Gly Leu Gly Val Arg Val Pro Leu Val Ala
5765 5770 5775
Arg Glu Arg Thr Gly Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu
5780 5785 5790
Trp Phe Leu Glu Glu Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro
5795 5800 5805
Met Ala Leu Arg Leu Ala Gly Val Leu Asp Val Glu Ala Leu His Gln
5810 5815 5820
Ala Leu Ile Asp Val Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile
5825 5830 5835 5840
Ala Arg Asp Ser Asp Gly Thr Ala Arg Gln Gln Val Leu Pro Val Gly
5845 5850 5855
Asp Pro Ala Ala Arg Pro Ala Leu Pro Val Val Gln Thr Asp Ala Asp
5860 5865 5870
Thr Leu Val Ala Lys Leu Asn Glu Ala Val Gly Arg Pro Phe Asp Leu
5875 5880 5885
Thr Ala Glu Met Pro Leu Arg Ala Thr Val Phe Arg Val Ala Asp Glu
5890 5895 5900
Asp His Ala Leu Leu Leu Val Phe His His Ile Ala Gly Asp Gly Trp
5905 5910 5915 5920
Ser Thr Gly Leu Leu Ala Arg Asp Leu Ser Thr Ala Tyr Ala Ala Arg
5925 5930 5935
Leu Glu Gly Arg Asp Pro Gln Leu Pro Pro Leu Pro Val Gln Tyr Ala
5940 5945 5950
Asp Tyr Ala Ala Trp Gln Arg Asp Val Leu Gly Thr Glu Asp Asp Glu
5955 5960 5965
Ser Ser Glu Leu Ser Ala Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala
5970 5975 5980
Asp Leu Pro Ala Glu Leu Ala Leu Pro Ala Asp Arg Val Arg Pro Ala
5985 5990 5995 6000
Arg Ala Ser Tyr Glu Gly Gly Arg Val Gly Phe Thr Val Pro Ala Gly
6005 6010 6015
Val Leu Arg Asp Leu Thr Arg Leu Ala Arg Val Glu Gly Val Thr Val
6020 6025 6030
Phe Met Val Val Gln Ala Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly
6035 6040 6045
Ala Gly Asp Asp Ile Pro Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp
6050 6055 6060
Gln Ala Thr Glu Asp Leu Ile Gly Phe Phe Val Asn Thr Leu Val Leu
6065 6070 6075 6080
Arg Thr Asp Val Ser Gly Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg
6085 6090 6095
Val Arg Ala Thr Asp Leu Asp Ala Tyr Ala His Gln Asp Ile Pro Phe
6100 6105 6110
Glu Arg Leu Val Glu Ala Val Asn Pro Glu Arg Ser Leu Ala Arg His
6115 6120 6125
Pro Leu Phe Gln Val Met Leu Ala Phe Asp Asn Thr Ala Asp Gly Gly
6130 6135 6140
Pro Val Glu Asp Phe Pro Gly Leu Ser Ala Ala Gly Leu Pro Leu Gly
6145 6150 6155 6160
Ala Gly Ala Ala Lys Phe Asp Leu Leu Phe Gly Leu Ser Glu Val Gly
6165 6170 6175
Gly Glu Leu Arg Gly Ala Val Glu Tyr Arg Cys Asp Leu Phe Asp His
6180 6185 6190
Pro Thr Ala Ala Arg Ile Ala Glu Arg Leu Val Arg Val Leu Glu Arg
6195 6200 6205
Val Ala Ala Asp Ala Ser Val Arg Leu Gly Glu Leu Pro Val Val Ser
6210 6215 6220
Asp Ala Glu Arg Ala Cys Val Leu Thr Glu Trp Asn Asp Thr Ala Val
6225 6230 6235 6240
Pro Gly Val Thr Gly Thr Leu Ser Ala Leu Phe Glu Ala Arg Ala Ala
6245 6250 6255
Ala Arg Gly Asp Ala Pro Ala Val Val Tyr Glu Gly Glu Glu Leu Ser
6260 6265 6270
Tyr Arg Glu Leu Asn Thr Arg Ala Asn Arg Leu Ala His Val Leu Ala
6275 6280 6285
Glu His Gly Ala Gly Pro Glu Arg Phe Val Gly Val Ala Leu Pro Arg
6290 6295 6300
Ser Pro Asp Leu Val Val Ala Leu Leu Ala Val Val Lys Ser Gly Ala
6305 6310 6315 6320
Ala Tyr Val Pro Leu Asp Pro Glu Tyr Pro Ala Asp Arg Leu Ala Tyr
6325 6330 6335
Met Ala Gly Asp Ala Ala Pro Val Ala Val Leu Thr Arg Gly Asp Val
6340 6345 6350
Glu Leu Pro Gly Ser Val Pro Arg Ile Gly Leu Asp Asp Thr Glu Ile
6355 6360 6365
Arg Ala Thr Leu Ala Thr Ala Pro Gly Thr Asn Pro Gly Thr Pro Val
6370 6375 6380
Thr Glu Ala His Pro Ala Tyr Met Ile Tyr Thr Ser Gly Ser Thr Gly
6385 6390 6395 6400
Arg Pro Lys Gly Val Val Val Ser His Gly Ala Ile Val Asn Arg Leu
6405 6410 6415
Ala Trp Met Gln Ala Glu Tyr Arg Leu Asp Ala Thr Asp Arg Val Leu
6420 6425 6430
Gln Lys Thr Pro Ala Gly Phe Asp Val Ser Val Trp Glu Phe Phe Trp
6435 6440 6445
Pro Leu Leu Glu Gly Ala Val Leu Val Phe Ala Arg Pro Gly Gly His
6450 6455 6460
Arg Asp Ala Ala Tyr Leu Ala Gly Leu Ile Glu Arg Glu Arg Ile Thr
6465 6470 6475 6480
Thr Ala His Phe Val Pro Ser Met Leu Arg Val Phe Leu Glu Glu Pro
6485 6490 6495
Gly Ala Ala Leu Cys Thr Gly Leu Arg Arg Val Ile Cys Ser Gly Glu
6500 6505 6510
Ala Leu Gly Thr Asp Leu Ala Val Asp Phe Arg Ala Lys Leu Pro Val
6515 6520 6525
Pro Leu His Asn Leu Tyr Gly Pro Thr Glu Ala Ala Val Asp Val Thr
6530 6535 6540
His His Ala Tyr Glu Pro Ala Thr Gly Thr Ala Thr Val Pro Ile Gly
6545 6550 6555 6560
Arg Pro Ile Trp Asn Ile Arg Thr Tyr Val Leu Asp Ala Ala Leu Arg
6565 6570 6575
Pro Val Pro Pro Gly Val Pro Gly Glu Leu Tyr Leu Ala Gly Ala Gly
6580 6585 6590
Leu Ala Arg Gly Tyr His Gly Arg Pro Ala Leu Thr Ala Glu Arg Phe
6595 6600 6605
Val Ala Cys Pro Phe Gly Val Pro Gly Glu Arg Met Tyr Arg Thr Gly
6610 6615 6620
Asp Leu Val Arg Trp Arg Val Asp Gly Thr Leu Glu Phe Val Gly Arg
6625 6630 6635 6640
Ala Asp Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu Leu Gly Glu
6645 6650 6655
Val Glu Gly Ala Val Ala Ala His Pro Asp Val Val Arg Ala Val Val
6660 6665 6670
Val Val Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val Ala Tyr Val
6675 6680 6685
Thr Val Gly Gly Val Gly Gly Asp Gly Leu Arg Ser Ala Ile Ser Gly
6690 6695 6700
Leu Val Ala Glu Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val Val
6705 6710 6715 6720
Val Leu Asp Glu Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg Ala
6725 6730 6735
Gly Leu Pro Val Pro Val Val Ser Val Ala Gly Phe Cys Ala Pro Ser
6740 6745 6750
Ser Pro Arg Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu Gly
6755 6760 6765
Val Glu Arg Val Gly Val Asp Asp Gly Phe Phe Asp Leu Gly Gly Asp
6770 6775 6780
Ser Ile Leu Ser Ile Gln Leu Val Ala Arg Ala Arg Arg Ala Gly Leu
6785 6790 6795 6800
Glu Leu Ser Val Arg Asp Val Phe Glu Gly Arg Thr Val Arg Ala Leu
6805 6810 6815
Ala Ala Val Val Arg Gly Ser Asp Ala Gly Ala Val Gly Val Val Gly
6820 6825 6830
Gly Ala Glu Ile Val Leu Pro Gly Val Gly Glu Val Glu Arg Trp Pro
6835 6840 6845
Val Val Glu Trp Leu Ala Glu Arg Gly Gly Gly Ser Leu Gly Gly Val
6850 6855 6860
Val Arg Gly Phe Asn Gln Ser Val Val Leu Ala Val Pro Ala Gly Leu
6865 6870 6875 6880
Val Trp Glu Glu Leu Arg Val Leu Leu Gly Ala Val Arg Asp Arg His
6885 6890 6895
Glu Ala Trp Arg Leu Arg Val Leu Asp Ser Gly Ala Leu Cys Val Asp
6900 6905 6910
Gly Val Val Pro Asp Asp Gly Ser Trp Ile Val Arg Cys Asp Leu Ser
6915 6920 6925
Gly Met Gly Val Asp Gly Gln Val Asp Ala Val Arg Ala Ala Ala Val
6930 6935 6940
Glu Ala Arg Ala Trp Leu Asp Pro Ser Val Gly Arg Val Val Arg Ala
6945 6950 6955 6960
Val Trp Leu Glu Arg Gly Gly Asp Arg Ser Gly Val Leu Val Leu Val
6965 6970 6975
Ala His His Leu Val Val Asp Gly Val Ser Trp Arg Val Val Leu Gly
6980 6985 6990
Asp Leu Ala Glu Gly Trp Ala Gln Val Arg Ser Gly Gly Arg Val Glu
6995 7000 7005
Leu Gly Val Val Gly Thr Ser Leu Arg Gly Trp Ala Ala Ala Leu Ala
7010 7015 7020
Glu Gln Gly Arg Arg Gly Glu Arg Ala Gly Glu Val Glu Leu Trp Ser
7025 7030 7035 7040
Arg Met Val Arg Gly Ala Asp Val Leu Val Gly Ser Arg Ala Val Asp
7045 7050 7055
Gly Ala Val Asp Val Phe Gly Gly Val Val Ser Val Asp Ser Arg Ala
7060 7065 7070
Ser Val Ser Val Ser Arg Ala Leu Leu Thr Glu Val Pro Ser Val Leu
7075 7080 7085
Gly Val Gly Val Gln Glu Val Leu Leu Ala Ala Phe Gly Leu Ala Val
7090 7095 7100
Ala Arg Trp Arg Gly Arg Gly Gly Pro Val Val Val Asp Val Glu Gly
7105 7110 7115 7120
His Gly Arg Asn Glu Asp Ala Val Arg Gly Ala Asp Leu Ser Arg Thr
7125 7130 7135
Val Gly Trp Phe Thr Ser Val Tyr Pro Val Arg Val Pro Val Glu Ser
7140 7145 7150
Ala Ser Trp Asp Glu Val Arg Ala Gly Gly Pro Val Val Gly Arg Val
7155 7160 7165
Val Arg Glu Val Lys Glu Thr Leu Arg Ser Leu Pro Asp Gln Gly Leu
7170 7175 7180
Gly Tyr Gly Ile Leu Arg Tyr Leu Asp Pro Glu His Gly Pro Ala Leu
7185 7190 7195 7200
Ala Arg His Ala Thr Pro Gln Phe Gly Phe Asn Tyr Leu Gly Arg Phe
7205 7210 7215
Thr Thr Gly Thr Asp Glu Thr Thr Thr Ala Asp Ala Leu Asp Arg Ala
7220 7225 7230
Pro Ala Trp Ser Leu Leu Ala Arg Ser Ala Ala Gly Gln Asp Pro Glu
7235 7240 7245
Leu Pro Val Ala His Ala Val Glu Phe Asn Ala Ile Thr Leu Asp Thr
7250 7255 7260
Pro Glu Gly Pro Arg Leu Gly Val Thr Trp Ser Trp Pro Thr Thr Leu
7265 7270 7275 7280
Leu Pro Glu Ser Arg Ile Arg Glu Leu Ala Arg Tyr Trp Asp Glu Ala
7285 7290 7295
Leu Glu Gly Leu Val Glu His Ala Arg His Pro Glu Ala Gly Gly Leu
7300 7305 7310
Thr Pro Ser Asp Val Gly Leu Ala Glu Leu Ser Phe Ala Glu Ile Glu
7315 7320 7325
Leu Leu Glu Asp Asp Trp Arg Thr Gln Gly
7330 7335
Claims (14)
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 서열번호 10으로 표시되는 코돈 리프로그래밍화된 dptBC 유전자를 포함하는 리팩토링된 답토마이신 생합성 유전자 군을 포함하는 DNA 분자.
- 제6 항에 있어서, 상기 DNA 분자는 박테리아 인공 염색체(BAC)로부터 유래된 DNA 서열을 포함하는 것인, DNA 분자.
- 제6 항 또는 제7 항의 DNA 분자를 포함하는 벡터.
- 제8항에 있어서, 상기 벡터는 플라스미드, 코스미드, BAC 및 효모 인공 염색체(YAC)를 포함하는 군으로부터 선택되는 것인 벡터.
- 제8항의 벡터를 통해 형질 전환된 답토마이신 생합성 유전자 군을 포함하는 DNA를 가지고 있는 숙주 세포.
- 제10 항에 있어서, 상기 숙주 세포는 스트렙토마이시스 리비단스 (Streptomyces lividans), 스트렙토마이시스 로제오스포로스 (Streptomyces roseosporus), 및 스트렙토마이시스 시엘리칼라 (Streptomyces coelicolor)로 이루어진 군으로부터 선택되는 미생물로부터 유래된 것인 세포.
- ⅰ) 스트렙토마이스세스 로제오포러스(Streptomyces roseosporus)의 유전체 라이브러리로부터 dptBC를 포함하는 답토마이신 생합성 유전자 군을 포함하는 포스미드 클론을 선별하는 단계;
ⅱ) 상기 답토마이신 생합성 유전자 군 중, 비-리보솜성 펩타이드 생합성 유전자 (dptBC, NRPS)의 반복 서열을 제거하기 위한 코돈 리프로그래밍화를 수행하는 단계;
ⅲ) 상기 코돈 리프로그래밍화에 의해 리팩토링되어 서열번호 10으로 표시되는 dptBC 유전자를 클로닝하는 단계; 및
ⅳ) 상기 클로닝된 각각의 유전자들을 포함하는 DNA 절편의 서브-클로닝을 통해 재조립하는 단계를 포함하는 리팩토링된 답토마이신 생합성 유전자 군을 클로닝 하는 방법. - 제12항에 있어서, 상기 ⅱ) 단계의 코돈 리프로그래밍화는 dptBC 유전자의 5,596 내지 7,323번째 염기를 포함하는 A 영역, 12,217 내지 15,225 번째 염기를 포함하는 B 영역 및 16,606 내지 21,951번째 염기를 포함하는 C 영역 중 하나 이상의 영역을 각각 치환하여 재구성하는 단계를 포함하는 것인 방법.
- 제13항에 있어서, 상기 A 영역, B 영역 및 C 영역은 각각 서열번호 7의 염기서열로 이루어진 합성 A영역, 서열번호 8의 염기서열로 이루어진 합성 B영역, 및 서열번호 9의 염기서열로 이루어진 합성 C영역으로 치환되는 것인 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200084659A KR102533566B1 (ko) | 2020-07-09 | 2020-07-09 | 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200084659A KR102533566B1 (ko) | 2020-07-09 | 2020-07-09 | 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220006800A KR20220006800A (ko) | 2022-01-18 |
KR102533566B1 true KR102533566B1 (ko) | 2023-05-16 |
Family
ID=80052030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200084659A KR102533566B1 (ko) | 2020-07-09 | 2020-07-09 | 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102533566B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230123366A (ko) * | 2022-02-16 | 2023-08-23 | 건국대학교 산학협력단 | 신규 합성 프로모터 및 이를 이용한 답토마이신의 생산 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002324580A1 (en) * | 2001-08-06 | 2003-02-24 | Cubist Pharmaceuticals, Inc. | Compositions and methods relating to the daptomycin biosynthetic gene cluster |
-
2020
- 2020-07-09 KR KR1020200084659A patent/KR102533566B1/ko active IP Right Grant
Non-Patent Citations (1)
Title |
---|
DOEKEL 등, Microbiology, 제14권, 페이지 2872-2880 (2008) |
Also Published As
Publication number | Publication date |
---|---|
KR20220006800A (ko) | 2022-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NZ621527A (en) | A genetically modified yeast cell and method of production of recombinant protein or polypeptide thereof | |
JPH0691827B2 (ja) | 新規ベクタ−プラスミド | |
CN111278852A (zh) | 重组欧氏杆菌天冬酰胺酶的生产方法 | |
CN112210549B (zh) | 腈水解酶突变蛋白及其在催化合成(r)-3-取代-4-氰基丁酸类化合物中的应用 | |
JP7497348B2 (ja) | リボフラビンの改善された産生 | |
CN107858340B (zh) | 高催化活性的d-果糖-6-磷酸醛缩酶a突变体、重组表达载体、基因工程菌及其应用 | |
KR102277407B1 (ko) | 신규한 글루타메이트 합성 효소 서브 유니트 알파 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
CN111278979A (zh) | 重组大肠杆菌天冬酰胺酶的生产方法 | |
CN111117942B (zh) | 一种产林可霉素的基因工程菌及其构建方法和应用 | |
KR102624718B1 (ko) | 변이형 rpoc 암호화 서열을 포함하는 핵산 분자 | |
KR102533566B1 (ko) | 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 | |
KR20150069976A (ko) | D(-)2,3-부탄디올의 생성능이 증강된 재조합 미생물 및 이를 이용한 d(-)2,3-부탄디올의 생산 방법 | |
CN113461789B (zh) | 一种来源于伯克霍尔德氏菌的LysR家族转录调控蛋白、基因及应用 | |
JP2954601B2 (ja) | 二次代謝産物生産増加のための生合成遺伝子又は制御遺伝子の単離法及び使用法 | |
KR20230095120A (ko) | 재조합 미생물, 이의 제조 방법 및 타가토스 생산에서의 응용 | |
Wachi et al. | A novel RNase G mutant that is defective in degradation of adhE mRNA but proficient in the processing of 16S rRNA precursor | |
JP3549210B2 (ja) | プラスミド | |
CN117651776A (zh) | 使用了大肠杆菌的质粒dna的制造方法 | |
CN112410353B (zh) | 一种fkbS基因、含其的基因工程菌及其制备方法和用途 | |
KR102565817B1 (ko) | 변이형 inc 암호화 가닥을 포함하는 핵산 분자 | |
KR102303662B1 (ko) | 화합물을 생산하는 미생물 및 이를 이용한 화합물의 생산 방법 | |
JPH08266277A (ja) | 形質転換体を用いたアミド化合物の製造法 | |
CN112375725A (zh) | 一种生产维生素b6的代谢工程菌株及其构建方法与应用 | |
JPH0670780A (ja) | 放線菌のシトクロムP−450sca遺伝子 | |
CN110551739A (zh) | 吡唑霉素生物合成基因簇、重组菌及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |