KR20130014445A - 미생물로부터 레티노이드를 생산하는 방법 - Google Patents

미생물로부터 레티노이드를 생산하는 방법 Download PDF

Info

Publication number
KR20130014445A
KR20130014445A KR1020120083185A KR20120083185A KR20130014445A KR 20130014445 A KR20130014445 A KR 20130014445A KR 1020120083185 A KR1020120083185 A KR 1020120083185A KR 20120083185 A KR20120083185 A KR 20120083185A KR 20130014445 A KR20130014445 A KR 20130014445A
Authority
KR
South Korea
Prior art keywords
ala
leu
val
gly
ser
Prior art date
Application number
KR1020120083185A
Other languages
English (en)
Other versions
KR101392159B1 (ko
Inventor
김선원
장희정
윤상활
하보경
류희경
Original Assignee
경상대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경상대학교산학협력단 filed Critical 경상대학교산학협력단
Priority to US14/235,841 priority Critical patent/US9644217B2/en
Priority to CN201280042839.0A priority patent/CN103857786B/zh
Priority to PCT/KR2012/006071 priority patent/WO2013019051A2/ko
Publication of KR20130014445A publication Critical patent/KR20130014445A/ko
Application granted granted Critical
Publication of KR101392159B1 publication Critical patent/KR101392159B1/ko
Priority to US15/180,032 priority patent/US9834794B2/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/26Processes using, or culture media containing, hydrocarbons
    • C12N1/28Processes using, or culture media containing, hydrocarbons aliphatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/38Chemical stimulation of growth or activity by addition of chemical compounds which are not essential growth factors; Stimulation of growth by removal of a chemical compound
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • C12P1/04Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/22Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Mycology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Cosmetics (AREA)

Abstract

본 발명은 미생물로부터 레티노이드를 생산하는 방법에 관한 것으로서, 보다 상세하게는 레티노이드 생산능을 가진 미생물을 친유성 물질을 포함하는 배지 중에서 배양시키고 그 친유성 물질 상으로부터 레티노이드를 분리함으로써 안정성이 떨어지는 레티노이드를 미생물로부터 효과적으로 수득할 수 있는 방법에 관한 것이다.

Description

미생물로부터 레티노이드를 생산하는 방법{Method of producing retinoids from a microorganism}
레티노이드 생산능을 갖는 미생물로부터 레티노이드를 생산하는 방법에 관한 것이다.
레티노이드는 비타민 A와 화학적으로 관련된 친지질성 이소프레노이드 분자의 클래스이다. 레티노이드는 알코올 (예를 들면, 레티놀), 알데히드 (예를 들면, 레티날), 카르복실산 (예를 들면, 레티노산), 또는 에스테르 (예를 들면, 레티닐 아세테이트) 기능기와 함께, β-이논 고리 및 다불포화(polyunsaturated) 곁사슬로 구성된다. 이들은 시력보호, 골 발달 및 재생, 항산화 효과와 더불어 피부 노화 방지와 같은 인체 건강에 있어 필수적인 역할을 하고 특정 암의 위험을 감소시킨다고 알려져 있다.
레티노이드는 최근 수년간 주름개선 및 피부 질환 치료를 위한 효과적인 화장품 및 의약품 원료로서 큰 관심을 받아 왔다. 레티노이드 시장 규모는 세계적으로 약 160억불 정도로 추정된다. 화학적으로 합성된 레티노이드는 대표적인 상업적 원료이다. 레티놀은 펜타디엔 유도체의 환원에 의해 화학적으로 합성된 레티날의 산성화 또는 가수분해로부터 생산된다. 그러나 이러한 화학적 과정은 복잡한 정제 단계 및 원하지 않는 부산물 형성과 같은 단점을 갖는다. 동물은 과일 및 야채로부터 얻은 카로티노이드로부터 레티노이드를 생산하는 반면, 식물은 레티노이드를 합성할 수 없다. 레티노이드 합성의 전체 경로는 보조기(prosthetic group)로서 레티날을 갖는 박테리오로돕신 또는 프로테오로돕신을 포함하는 미생물에서만 가능하다. 그러나, 미생물은 레티날의 단백질 결합 형태를 생산하므로 자유 레티노이드의 대량 생산에는 적합하지 않다. 지금까지 생물학적 생산을 위해서 효소를 이용한 일부 제한적인 시도가 있었지만 성공적인 결과는 없었다. 따라서, 대사적으로 형질전환된 미생물을 사용하는, 레티노이드 생산을 위한 생명공학적 방법의 개발이 필요하다.
레티노이드는 그의 반응성 있는 콘쥬게이트된 이중 결합으로 인해 화학적으로 매우 불안정하고, 열, 산소 및 빛에 의해 쉽게 산화되고 이성체화된다. 또한 레티노이드는 생물학적으로 레티노산을 통해 쉽게 분해된다. 따라서, 레티노이드를 보다 효율적으로 생산하는 방법이 요구되고 있다.
일 양상은 미생물로부터 레티노이드를 효율적으로 생산하는 방법을 제공한다.
일 양상은 레티노이드 생산능을 가진 미생물을 친유성 물질을 포함하는 배지 중에서 배양하는 단계; 및 상기 친유성 물질 상으로부터 레티노이드를 분리하는 단계;를 포함하는, 미생물로부터 레티노이드를 생산하는 방법을 제공한다.
상기 방법은 레티노이드 생산능을 가진 미생물을 친유성 물질을 포함하는 배지 중에서 배양하는 단계를 포함한다.
용어 "미생물"은 액체 배지 중에서 배양될 수 있는 세포일 수 있다. 상기 미생물은 원핵 세포, 진핵 세포, 또는 분리된 동물세포로 액체 배지에서 배양될 수 있는 것일 수 있다. 상기 미생물은 예를 들면, 박테리아, 곰팡이, 또는 이들의 조합일 수 있다. 박테리아는 그람 양성 박테리아, 그람 음성 박테리아, 또는 이들의 조합일 수 있다. 그람 음성 박테리아는 에세리키아 (Escherichia) 속일 수 있다. 그람 양성 박테리아는 바실러스 속, 코리네박테리움 속, 유산균 또는 이들의 조합일 수 있다. 곰팡이는 효모, 클루베로마이세스, 또는 이들의 조합일 수 있다. 상기 미생물은 천연 또는 외래 유전자가 도입된 것일 수 있다. 외래 유전자는 MEP 또는 MVA 경로의 하나 이상의 유전자와 같은 레티노이드 생산에 관련된 유전자일 수 있다. 동물세포는 재조합 단백질 생산에 사용되는 것일 수 있다. 예를 들면, CHO 세포, BHK 세포, 또는 이들의 조합일 수 있다.
상기 레티노이드 생산능을 가진 에세리키아 (Escherichia) 속 미생물은 천연 에세리키아 속 미생물 또는 형질전환된 에세리키아 속 미생물일 수 있다. 천연 에세리키아 속 미생물은 내재적 레티노이드 합성의 경로로서 MEP 경로를 가지고 있는 것으로 알려져 있다. 형질전환된 에세리키아 속 미생물은 레티노이드 합성의 내재적 MEP 경로에 연관된 유전자, 외래 MVA 경로에 연관된 유전자, 또는 이들의 조합이 도입된 것일 수 있다. MVA 경로 유전자는 아세틸-CoA로부터 IPP를 생산하는데 관여하는 외래 메발로네이트 경로의 효소를 코딩하는 유전자일 수 있다. 또한, 상기 IPP로부터 β-카로틴을 합성하는데 관여하는 효소를 코딩하는 유전자가 도입된 균주일 수 있다. 두 카피 이상의 IPP 이소머라제가 도입되어 IPP로부터 DMAPP로의 전환이 촉진된 것일 수 있다. 따라서, 상기 미생물은 레티노이드를 고농도로 생산할 수 있다. 도 1은 레티날 생합성의 MEP 경로 및 외래의 MVA 경로를 도식적으로 나타낸 도면이다.
천연 에세리키아 속 미생물은 예를 들면, 대장균일 수 있다. 상기 대장균은 DH5α, MG1655, BL21(DE), S17-1, XL1-Blue, BW25113 또는 이들의 조합일 수 있다.
형질전환된 에세리키아 속 미생물은 예를 들면, 서열번호 1의 엔테로코커스 패칼리스 (Enterococcus faecalis) 유래의 아세틸-CoA 아세틸트란스퍼라제/하이드록시메틸글루타릴 (HMG)-CoA 리덕타제를 코딩하는 유전자, 서열번호 2의 엔테로코커스 패칼리스 유래의 HMG-CoA 신타제를 코딩하는 유전자, 서열번호 3의 스트렙토코커스 뉴모니애 (Streptococcus pneumoniae) 유래의 메발로네이트 키나제를 코딩하는 유전자, 서열번호 4의 스트렙토코커스 뉴모니애 유래의 포스포메발로네이트 키나제를 코딩하는 유전자, 서열번호 5의 스트렙토코커스 뉴모니애 유래의 메발로네이트 디포스페이트 데카르복실라제를 코딩하는 유전자, 서열번호 6의 대장균 유래의 이소펜테닐 디포스페이트 (IPP) 이소머라제를 코딩하는 유전자, 서열번호 7의 판토에아 아글루메란스 (Pantoea agglomerans) 유래의 제라닐제라닐 피로포스페이트 (GGPP) 신타제를 코딩하는 유전자, 서열번호 8의 판토에아 아글루메란스 유래의 피토엔 신타제를 코딩하는 유전자, 서열번호 9의 판토에아 아글루메란스 유래의 피토엔 데히드로게나제를 코딩하는 유전자, 및 서열번호 10의 판토에아 아나나티스 (Pantoea ananatis) 유래의 라이코펜-β-시클라제를 코딩하는 유전자로 형질전환된 것일 수 있다.
형질전환된 에세리키아 속 미생물은 서열번호 1 내지 10의 유전자로 형질전환되고, 또한 서열번호 13의 배양되지 않은 해양 박테리아 (uncultured marine bacterium) 66A03 유래의 β-카로틴 모노옥시게나제를 코딩하는 유전자, 서열번호 14의 생쥐 (Mus musculus) 유래의 β-카로틴 15,15'-모노옥시게나제를 코딩하는 유전자, 서열번호 15의 나트로노모나스 파라오니스 (Natronomonas pharaonis) ATCC35678 유래의 brp 유사 단백질 2 (brp-like protein 2: brp2)을 코딩하는 유전자, 및 서열번호 16 또는 17의 할로박테리움 살리나룸 (Halobacterium salinarum) ATCC700922 유래의 β-카로틴 모노옥시게나제를 코딩하는 유전자로 이루어진 군으로 선택되는 하나 이상의 유전자로 더 형질전환된 것일 수 있다.
상기 미생물은 서열번호 12의 헤마토코커스 플루비알리스 (Haematococcus pluvialis) 유래의 IPP 이소머라제를 코딩하는 유전자로 더 형질전환된, 레티노이드를 생산하는 것일 수 있다.
레티노이드 생산능을 가진 미생물은 서열번호 11의 대장균 유래 1-데옥시자일룰로즈-5-포스페이트 (DXP) 신타제(dxs)를 코딩하는 유전자로 형질전환된 것일 수 있다. DXP는 내재적 MEP 경로에서 속도 결정 단계에 해당하는 효소이므로 DXP 신타제를 코딩하는 유전자가 추가적으로 도입됨으로써 미생물은 β-카로틴을 고농도로 생산할 수 있게 된다.
본 발명의 레티노이드 생산능을 가진 미생물이 에세리키아 속에 해당되는 경우 예컨대 기탁번호 KCTC 11254BP의 대장균 DH5α/pTDHB/pSNA (KOREAN COLLECTION FOR TYPE CULTURE, 2008. 1. 2. 기탁) 또는 기탁번호 KCTC 11255BP의 대장균 DH5α/pTDHBSR/pSNA (KOREAN COLLECTION FOR TYPE CULTURE, 2008. 1. 2. 기탁)일 수 있다. 특히, 대장균 DH5α/pTDHBSR/pSNA는 배지 중의 탄소원으로부터 레티노이드를 높은 생산성으로 생산할 수 있다.
일 구체예에서, 상기 미생물은 서열번호 1의 엔테로코커스 패칼리스 (Enterococcus faecalis) 유래의 아세틸-CoA 아세틸트란스퍼라제/하이드록시메틸글루타릴 (HMG)-CoA 리덕타제를 코딩하는 유전자, 서열번호 2의 엔테로코커스 패칼리스 유래의 HMG-CoA 신타제를 코딩하는 유전자, 서열번호 3의 스트렙토코커스 뉴모니애 (Streptococcus pneumoniae) 유래의 메발로네이트 키나제를 코딩하는 유전자, 서열번호 4의 스트렙토코커스 뉴모니애 유래의 포스포메발로네이트 키나제를 코딩하는 유전자, 서열번호 5의 스트렙토코커스 뉴모니애 유래의 메발로네이트 디포스페이트 데카르복실라제를 코딩하는 유전자, 서열번호 6의 대장균 유래의 이소펜테닐 디포스페이트 (IPP) 이소머라제를 코딩하는 유전자, 서열번호 7의 판토에아 아글루메란스 (Pantoea agglomerans) 유래의 제라닐제라닐 피로포스페이트 (GGPP) 신타제를 코딩하는 유전자, 서열번호 8의 판토에아 아글루메란스 유래의 피토엔 신타제를 코딩하는 유전자, 서열번호 9의 판토에아 아글루메란스 유래의 피토엔 데히드로게나제를 코딩하는 유전자, 서열번호 10의 판토에아 아나나티스 (Pantoea ananatis) 유래의 라이코펜-β-시클라제를 코딩하는 유전자, 서열번호 11의 대장균 유래 1-데옥시자일룰로즈-5-포스페이트 (DXP) 신타제를 코딩하는 유전자 및 서열번호 12의 헤마토코커스 플루비알리스 (Haematococcus pluvialis) 유래의 IPP 이소머라제를 코딩하는 유전자로 형질전환된 에세리키아 속 미생물로서, 서열번호 13의 배양되지 않은 해양 박테리아 (uncultured marine bacterium) 66A03 유래의 β-카로틴 모노옥시게나제를 코딩하는 유전자, 서열번호 14의 생쥐 (Mus musculus) 유래의 β-카로틴 15,15'-모노옥시게나제를 코딩하는 유전자, 서열번호 15의 나트로노모나스 파라오니스 (Natronomonas pharaonis) ATCC35678 유래의 brp 유사 단백질 2 (brp-like protein 2)을 코딩하는 유전자, 및 서열번호 16 또는 17의 할로박테리움 살리나룸 (Halobacterium salinarum) ATCC700922 유래의 β-카로틴 모노옥시게나제를 코딩하는 유전자로 이루어진 군에서 선택되는 하나 이상의 유전자로 더 형질전환된 에세리키아 속 미생물일 수 있다. 서열번호 13의 배양되지 않은 해양 박테리아 (uncultured marine bacterium) 66A03 유래의 β-카로틴 모노옥시게나제를 코딩하는 유전자는 대장균에서 코돈 사용 최적화된 서열번호 32의 염기서열을 갖는 것일 수 있다.
본 명세서에 있어서, 용어 "레티노이드 (retinoids)"는 비타민 A에 화학적으로 관련된 화학물질의 부류를 나타낸다. 레티노이드의 구조는 시클릭 말단기, 폴리엔 측쇄 및 극성 말단기로 구성된다. 상기 폴리엔 측쇄의 C=C 이중결합이 교대로 되어 형성된 공액 시스템 (conjugated system)은 레티노이드의 색 (보통 노란색, 오렌지 또는 적색)을 띄게 한다. 많은 레티노이드는 발색소(chromophore)이다. 측쇄 및 말단기를 변화시킴으로써 다양한 레티노이드가 생성될 수 있다. 상기 레티노이드는 레티날, 레티놀, 레티노산, 레티닐 아세테이트, 또는 이들의 조합일 수 있다. 또한, 상기 레티노이드는 레티날, 레티놀, 레티노산, 레티닐 아세테이트, 또는 이들의 조합의 생체 내 분해 산물일 수 있다.
레티노이드는 기본 탄소수가 20인 물질로서, 결합하는 지방산 보조기에 따라 최종 탄소수가 달라질 수 있는데, 예컨대 아세테이트 결합시에는 최종 탄소수가 22이고 올레산 결합시에는 탄소수가 38일 수 있다.
상기 친유성 물질은 탄소수 8 내지 50의 유기 화합물로서 친유성을 갖는 것일 수 있다.
상기 친유성 물질은 탄소수 8 내지 50의 알칸 화합물, 하기 화학식 1의 화합물; 하기 화학식 2의 화합물; 또는 이들의 조합일 수 있다:
[화학식 1]
R1(CO)OR2
(식 중, R1 R2는 각각 독립적으로 탄소수 8 내지 50의 알킬을 나타내고, CO는 카르보닐기를 나타냄),
[화학식 2]
Figure pat00001
(식 중, R3, R4 및 R5는 각각 독립적으로 탄소수 8 내지 50의 알킬을 나타내고, CO는 카르보닐기를 나타냄).
탄소수 8 내지 50의 알칸 화합물은 직쇄 알칸, 분지 알칸, 시클릭 알칸, 또는 이들의 조합일 수 있다. 알칸 화합물은 예를 들면, 탄소수 8 내지 46, 8 내지 40, 8 내지 36, 8 내지 30, 8 내지 26, 8 내지 20, 8 내지 16, 8 내지 12, 8 내지 10, 10 내지 50, 10 내지 46, 10 내지 40, 10 내지 36, 10 내지 30, 10 내지 26, 10 내지 20, 10 내지 16, 10 내지 12, 10 내지 50, 10 내지 46, 12 내지 50, 12 내지 46, 12 내지 36, 12 내지 30, 12 내지 26, 12 내지 20, 또는 12 내지 16의 알칸 화합물일 수 있다.
직쇄 알칸은 탄소수 8 (옥탄), 10 (데칸), 12 (도데칸), 14 (테트라데칸), 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50의 알칸, 또는 이들의 조합일 수 있다.
분지 알칸은 탄소수 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50의 알칸, 또는 이들의 조합일 수 있다. 분지 알칸은 테르펜 화합물의 포화된 유사체(analogue)일 수 있다. 예를 들면, 파이토스쿠알란일 수 있다.
직쇄 알칸, 분지 알칸, 및 시클릭 알칸의 조합은 미네랄 오일일 수 있다. 미네랄 오일은 비식물성 원료 (미네랄) 유래의 탄소 수 15 내지 40의 알칸의 혼합물일 수 있다. 탄소수 15 내지 40의 알칸은 탄소수 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40의 알칸의 2 이상의 혼합물일 수 있다.
미네랄 오일은 경량 미네랄 오일 또는 중량 미네랄 오일일 수 있다. 경량 미네랄 오일(light mineral oil)은 일반적으로 밀도가 880~920kg/m3이며 20℃에서 비중이 820~860 kg/m3, 40℃에서 유동성 점도가 14~18cst를 가지는 물질이다. 중량 미네랄 오일(heavy mineral oil)은 일반적으로 밀도가 920kg/m3이며 20℃에서 비중이 860~900 kg/m3, 40℃에서 유동성 점도가 65~85cst인 물질이다.
화학식 1의 화합물에서 R1 R2는 각각 독립적으로 직쇄, 분지쇄 또는 고리형의 탄소수 8 내지 50의 알킬이다. R1과 R2는 각각 독립적으로 탄소수 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48 또는 50의 알킬일 수 있다.
R1과 R2는 각각 탄소수 8 내지 50, 예를 들면, 탄소수 8 내지 46, 8 내지 40, 8 내지 36, 8 내지 30, 8 내지 26, 8 내지 20, 8 내지 16, 8 내지 12, 8 내지 10, 10 내지 50, 10 내지 46, 10 내지 40, 10 내지 36, 10 내지 30, 10 내지 26, 10 내지 20, 10 내지 16, 10 내지 12, 10 내지 50, 10 내지 46, 12 내지 50, 12 내지 46, 12 내지 36, 12 내지 30, 12 내지 26, 12 내지 20, 또는 12 내지 16의 알킬일 수 있다. R1이 탄소수 13의 직쇄 알킬이고 R2가 이소프로필일 수 있다. 또한, R1이 에틸펜틸기이고 R2가 세틸일 수 있다.
화학식 2의 화합물에서, R3, R4 및 R5는 각각 독립적으로 직쇄, 분지쇄 또는 고리형의 탄소수 8 내지 50의 알킬이다.
R3, R4, 및 R5는 각각 탄소수 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48 또는 50의 알킬일 수 있다. 상기 화합물은 예를 들면, R3, R4, 및 R5가 각각 탄소수 8 내지 50, 예를 들면, 탄소수 8 내지 46, 8 내지 40, 8 내지 36, 8 내지 30, 8 내지 26, 8 내지 20, 8 내지 16, 8 내지 12, 8 내지 10, 10 내지 50, 10 내지 46, 10 내지 40, 10 내지 36, 10 내지 30, 10 내지 26, 10 내지 20, 10 내지 16, 10 내지 12, 10 내지 50, 10 내지 46, 12 내지 50, 12 내지 46, 12 내지 36, 12 내지 30, 12 내지 26, 12 내지 20, 또는 12 내지 16의 알킬일 수 있다.
친유성 물질은 옥탄, 데칸, 도데칸, 테트라데칸, 파이토스쿠알란, 미네랄 오일, 이소프로필 미리스테이트, 세틸 에틸헥사노에이트, 디옥타노일 데카노일 글리세롤, 스쿠알란, 또는 이들의 조합일 수 있다.
친유성 물질은 생산되는 레티노이드를 안정화시키는 것뿐만 아니라, 미생물에 의한 레티노이드의 생산성을 증가시킬 수 있다. 친유성 물질은 미생물의 생장에 영향을 미치지 않거나 적게 영향을 미치는 것일 수 있다.
배양은 합성, 반합성, 또는 복합 배양 배지에서 이루어질 수 있다. 배양 배지로는 탄소원, 질소원, 비타민 및 미네랄로 구성된 배지를 사용할 수 있다. 예를 들어, MRS (Man-Rogosa-Sharp) 액체 배지 또는 우유가 첨가된 액체 배지를 사용할 수 있다.
배지의 탄소원으로는 전분, 포도당, 자당, 갈락토스, 과당, 글리세롤, 글루코스 또는 이들의 혼합물이 사용될 수 있다. 예를 들면, 글리세롤이 탄소원으로 사용될 수 있다. 질소원으로는 황산암모늄, 질산암모늄, 질산나트륨, 글루탐산, 카사미노산, 효모추출물, 펩톤, 트립톤, 대두박 또는 이들의 혼합물이 사용될 수 있다. 미네랄은 염화나트륨, 인산제이칼륨, 황산마그네슘 또는 이들의 혼합물이 사용될 수 있다.
배양이 발효조에서 이루어지는 경우 글루코스를 배지의 탄소원으로 사용하는 것이 좋다. 시험관 배양의 경우에는 글리세롤을 배지의 탄소원으로 사용하는 것이 좋다.
미생물 배양 배지 내 상기 탄소원, 질소원 및 미네랄 각각은 예를 들면, 리터당 10 내지 100 g, 5 내지 40 g 및 0.5 내지 4 g 을 이용할 수 있다.
상기의 통상의 배양 배지에 첨가되는 비타민은 비타민 A, 비타민 B, 비타민 C, 비타민 D, 비타민 E 또는 이들의 혼합물일 수 있다. 비타민은 통상의 배양 배지에 상기에서 언급된 탄소원, 질소원, 미네랄 등과 함께 첨가되거나, 멸균하여 준비된 배지에 별도로 첨가될 수 있다.
배양은 통상의 대장균 배양 조건으로 수행될 수 있다. 배양은 예를 들어 약 15-45℃, 예를 들면, 15-44℃, 15-43℃, 15-42℃, 15-41℃, 15-40℃, 15-39℃, 15-38℃, 15-37℃, 15-36℃, 15-35℃, 15-34℃, 15-33℃, 15-32℃, 15-31℃, 15-30℃, 20-45℃, 20-44℃, 20-43℃, 20-42℃, 20-41℃, 20-40℃, 20-39℃, 20-38℃, 20-37℃, 20-36℃, 20-35℃, 20-34℃, 20-33℃, 20-32℃, 20-31℃, 20-30℃, 25-45℃, 25-44℃, 25-43℃, 25-42℃, 25-41℃, 25-40℃, 25-39℃, 25-38℃, 25-37℃, 25-36℃, 25-35℃, 25-34℃, 25-33℃, 25-32℃, 25-31℃, 25-30℃, 27-45℃, 27-44℃, 27-43℃, 27-42℃, 27-41℃, 27-40℃, 27-39℃, 27-38℃, 27-37℃, 27-36℃, 27-35℃, 27-34℃, 27-33℃, 27-32℃, 27-31℃ 또는 27-30℃에서 수행될 수 있다.
배양액 중의 배양 배지를 제거하고 농축된 균체만을 회수하거나 제거하기 위해 원심분리 또는 여과과정을 거칠 수 있으며 이러한 단계는 당업자의 필요에 따라 수행할 수 있다. 농축된 균체는 통상적인 방법에 따라 냉동하거나 냉동건조하여 그 활성을 잃지 않도록 보존할 수 있다.
배양의 일 예에 있어서, 배양은 탄소원으로서 글리세롤을 포함하는 배지에서 이루어지는 것일 수 있다. 글리세롤은 배지 중의 유일한 탄소원일 수 있다. 0.5-5.0%(w/v), 예를 들면, 0.5-4.5%(w/v), 0.5-4.0%(w/v), 0.5-3.5%(w/v), 0.5-3.0%(w/v), 0.5-2.5%(w/v), 0.5-2.0%(w/v), 1-5.0%(w/v), 1-4.5%(w/v), 1-4.0%(w/v), 1-3.5%(w/v), 1-3.0%(w/v) 또는 1-2.5%(w/v)의 글리세롤을 포함하는 배지에서 이루어지는 것일 수 있다. 상기 배지는 글리세롤 및 아라비노스가 첨가된 YT 배지일 수 있다. YT 배지는 1.6중량% 트립톤, 1중량% 효모 추출물 및 0.5 중량% NaCl을 포함할 수 있다.
배양은 친유성 물질 존재 하의 배양 배지에서, 예를 들면 배지 표면에 친유성 물질인 도데칸 상(dodecane phase)을 위치시킨 상태로 수행될 수 있다. 배양은 교반되는 상태에서 수행될 수 있다.
교반되는 경우, 100 내지 300rpm, 예를 들면, 100 내지 280rpm, 100 내지 260rpm, 100 내지 240rpm, 100 내지 220rpm, 100 내지 200rpm, 100 내지 180rpm, 100 내지 160rpm, 100 내지 140rpm, 100 내지 120rpm, 120 내지 300rpm, 120 내지 280rpm, 120 내지 260rpm, 120 내지 240rpm, 120 내지 220rpm, 120 내지 200rpm, 120 내지 180rpm, 120 내지 160rpm, 120 내지 140rpm, 150 내지 300rpm, 150 내지 280rpm, 150 내지 260rpm, 150 내지 240rpm, 150 내지 220rpm, 150 내지 200rpm, 150 내지 180rpm, 140 내지 160rpm, 200 내지 300rpm, 200 내지 280rpm, 200 내지 260rpm, 200 내지 240rpm, 200 내지 220rpm, 또는 150 rpm으로 교반될 수 있다.
교반되는 경우, 상기 친유성 물질, 예컨대 도데칸은 배지 중에서 분산되어 세포와 접촉된다. 친유성 물질은 배지 중에 분산됨으로써 미생물과 접촉하는 면적이 넓어져 배양 중 레티노이드를 효율적으로 세포로부터 분리되게 하여 안정화 및/또는 용해시킬 수 있다.
친유성 물질, 예컨대 도데칸 상 없이 상기 기술한 레티노이드를 생산하는 미생물을 배양시켰을 때, 레티노이드 생산은 일정 시점에서 최고치를 나타내고 그 이후에 감소할 수 있다. 이는 미생물 성장의 정체 상태 동안 추가적인 레티노이드 합성이 중단되는 반면, 세포 내에서 그의 산화적 분해가 일어나기 때문일 수 있다.
친유성 물질, 예컨대 도데칸 상의 존재 하에 배양 배지에서 상기 미생물을 배양시키게 되면 생산된 레티노이드가 세포 내에서 분해되기 전에 친유성 물질, 예컨대 도데칸 상에 흡수되게 되어 레티노이드 생산량을 향상시킬 수 있다.
상기 친유성 물질, 예컨대 도데칸 상은 에세리키아 속 미생물의 세포 성장에 영향을 미치지 않고, 소수성 레티노이드의 추출을 위해 소수성이고, 낮은 휘발성을 갖는 것일 수 있다. 도 2는 β-카로틴의 레티날, 레티놀, 레티노산, 및 레티닐 에스테르를 포함하는 레티노이드로의 변환을 나타낸다.
배지 대 친유성 물질의 부피비는 특정 범위의 비로 한정되지 않고, 예컨대, 배지 대 친유성 물질의 부피비가 1:0.1-3.0, 1:0.2-3.0, 1:0.5-3.0, 1:1.0-3.0, 1:1.5-3.0, 1:2.0-3.0, 1:2.5-3.0, 1:0.2-2.5, 1:0.2-2.0, 1:0.2-1.5, 1:0.2-1.0, 1:0.2-0.5, 1:0.5-2.5, 1:0.5-2.0, 1:0.5-1.5, 1:0.5-1.0, 1:0.8-2.5, 1:0.8-2.0, 1:0.8-1.5, 1:0.8-1.2, 1:0.8-1.0 등이 가능하다.
일 구체예에 따르면 상기 배양하는 단계에서 상기 배지는 약 2.0% 농도의 글리세롤를 포함하고, 상기 에세리키아 속 미생물은 대장균 DH5α 또는 MG1655이고, 상기 배양하는 단계는 배양액 약 7 ml, 약 29℃에서 배양시키는 것일 수 있다.
상기 방법은 또한, 친유성 물질 상으로부터 레티노이드를 분리하는 단계를 포함한다. 상기 레티노이드, 예를 들면, 레티날, 레티놀, 레티노산, 레티닐 에스테르, 또는 이들의 조합을 분리하는 것은 당업계에 잘 알려져 있다. 예를 들면, 이온교환 크로마토그래피, HPLC 등의 방법에 의하여 분리될 수 있다. 구체적으로, 균체를 회수한 후에 아세톤 등의 용매를 이용한 추출 후에 고순도의 제품을 얻기 위해서는 HPLC 또는 결정화 작업등을 통한 분리정제가 진행될 수 있다.
일 구체예는 레티노이드 생산능을 가진 에세리키아 속 미생물을 친유성 물질을 포함하는 배지 중에서 배양하는 단계; 및 상기 친유성 물질 상으로부터 레티노이드를 분리하는 단계;를 포함하고, 상기 친유성 물질은 탄소수 8 내지 50의 알칸 화합물, 화학식 1의 화합물, 화학식 2의 화합물 또는 이들의 조합인, 에세리키아 속 미생물로부터 레티노이드를 생산하는 방법일 수 있다.
본 발명의 레티노이드를 생산하는 방법에 의하면 레티놀을 높은 효율로 생산할 수 있다.
도 1은 레티날 생합성의 MEP 경로 및 외래의 MVA 경로를 도식적으로 나타낸 도면이다.
도 2는 β-카로틴의 레티날, 레티놀, 레티노산, 및 레티닐 에스테르를 포함하는 레티노이드로의 변환을 나타낸다.
도 3은 pT-HB, pT-HBblh, pT-HBbrp, pT-HBbrp2, pT-HBBCMO1, 및 pT-HBSR를 포함하는 대장균의 레티날 생산, β-카로틴 생산 및 세포 성장을 나타낸다.
도 4는 pT-HB, pT-HBSR, pT-DHB 및 pT-DHBSR을 포함하는 대장균 및 MVA 경로 플라스미드인 pS-NA와 함께 pT-DHB, 또는 pT-DHBSR을 포함하는 대장균의 레티날 생산, β-카로틴 생산 및 세포 성장을 나타낸다.
도 5는 pT-DHBSR 및 pS-NA를 갖는 다양한 대장균 균주의 레티노이드 생산과 세포 성장을 나타낸다.
도 6은 배양액 시험 부피에 따른 pT-DHBSR 및 pS-NA를 갖는 대장균의 레티노이드 생산 및 세포 성장을 나타낸다.
도 7은 배양 온도에 따른 pT-DHBSR 및 pS-NA를 갖는 대장균의 레티노이드 생산 및 세포 성장을 나타낸다.
도 8은 탄소원에 따른 pT-DHBSR 및 pS-NA를 갖는 대장균의 레티노이드 생산과 세포 성장을 나타낸다.
도 9 및 도 10은 pT-DHBSR 및 pS-NA를 포함하는 대장균의 탄소원인 글리세롤의 농도에 따른 레티노이드 생산 및 세포성장을 나타낸다.
도 11 및 도 12는 도데칸 존재 하에서 다양한 대장균 균주의 레티노이드 생산과 세포성장의 결과를 나타낸 도면이다.
도 13은 5 ml 배양 배지 상에 1 mL 도데칸을 포함하는 2-상 배양에서 탄소원인 글리세롤의 농도에 따른 대장균(pT-DHBSR/pS-NA)의 레티노이드 생산 및 세포 성장을 나타낸다.
도 14는 2-상 배양에서의 대장균(pT-DHBSR/pS-NA)의 도데칸 부피에 따른 레티노이드 생산 및 세포 성장을 나타낸다.
도 15는 2-상 배양에서의 대장균(pT-DHBSR/pS-NA)의 배양 시간 및 도데칸 부피에 따른 레티노이드의 분포가 총 레티노이드에 대한 각 구성성분의 백분율로 나타낸 도면이다.
도 16은 pT-DHB 및 pS-NA를 갖는 대장균의 베타-카로틴 생산과 세포 성장에 있어 도데칸 첨가의 효과를 나타낸다.
도 17 및 도 18은 다양한 알칸 존재하에서 대장균(pT-DHBSR/pS-NA)의 레티노이드 생산 및 세포성장 결과를 나타낸 도면이다.
도 19, 도 20 및 도 21은 다양한 부피의 경량 미네랄 오일 존재 하에서 대장균(pT-DHBSR/pS-NA)의 레티노이드 생산, 세포성장, 균체당 레티노이드 생산량(cell specific retinoids productivity) 결과를 나타낸 도면이다.
도 22 및 도 23은 중량 미네랄 오일 존재 하에서 대장균(pT-DHBSR/pS-NA)의 레티노이드 생산 및 세포성장 결과를 나타낸 도면이다.
도 24 및 도 25는 중량 미네랄 오일 존재 하에서 시험관을 기울여 배양한 경우 대장균(pT-DHBSR/pS-NA)의 레티노이드 생산 및 세포성장 결과를 나타낸 도면이다.
도 26은 피부 친화적 친유성 물질 존재 하에서 대장균(pT-DHBSR/pS-NA)의 세포 성장 및 pH를 나타낸 도면이다.
도 27 및 도 28은 피부 친화적 친유성 물질의 다양한 종류와 양에 따른 대장균(pT-DHBSR/pS-NA)의 레티노이드 생산결과를 나타낸 도면이다.
이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다. 이하의 실시예에서 다음의 실험 재료 및 방법을 사용하였다.
박테리아 균주 및 배양 조건
대장균 DH5α는 유전자 클로닝 및 레티노이드 생산에 사용하였다. 대장균 MG1655, BL21 (DE3), XL1-Blue, S17-1 및 BW25113을 레티놀 생산에 최적인 균주를 찾기 위해 사용하였다. 레티노이드 생산을 위한 배양은 2YT 배지(리터 당 16g 트립톤, 10g 이스트 추출물, 및 5g NaCl)에서, 29℃ 및 250rpm의 교반 배양기를 사용하여 수행하였다. 각각 주 및 보조 탄소 원료로서 글리세롤 및 아라비노오스를 각각 0.5% 내지 2% (w/v) 및 0.2% (w/v)의 농도로 첨가하였다. 글루코오스, 갈락토오스, 자일로오스 및 말토오스를 레티노이드 생산을 위한 탄소 원료로서 글리세롤과 비교하였다. 엠피실린 (100 ㎍/mL) 및 클로람페티콜 (50 ㎍/mL)을 필요한 배양물에 첨가하였다. 배양을 7 mL 배지를 포함하는 시험관 중에서 수행하였다. 세포 성장은 600nm (OD600)에서 광학 밀도를 측정하여 결정하였다. 레티노이드 생산의 2-상 배양에서, 1 mL의 도데칸 (Cat. No. 297879, Sigma, USA)을 배양 배지 5 mL 위에 위치시켰다.
β-카로틴 및 레티노이드의 분석 조건
β-카로틴 및 레티노이드를 아세톤으로 박테리아 세포 펠렛으로부터 추출하였다. 도데칸 씌움을 갖는 2-상 배양에서, 레티노이드를 포함하는 도데칸 상을 수집하여 14,000 rpm에서 10분 동안 원심분리시켜 모든 세포 파편들을 제거하였다. 아세톤 추출물 및 도데칸 상을 검출 파장 370 nm (레티날), 340 nm (레티놀 및 레티닐 아세테이트) 및 454 nm (β-카로틴)에서 HPLC(LC-20A, Shimadzu, Kyoto, Japan)로 분석하였다. 분석은 Sentry Guard C18 (15 mm×4.6 mm, 5 m)을 갖는 Symmetry C18 (250 mm×4.6 mm, 5 m)의 HPLC 컬럼을 사용하여 수행하였다. 이동상은 레티노이드 및 β-카로틴 분석을 위한 각각 95:5 및 70:30의 메탄올 및 아세토니트릴이었다. HPLC 분석에 1.5 ml/min의 유동속도(flow rate) 및 40℃의 컬럼 온도가 적용되었다. 레티날 (Cat. No. R2500), 레티놀 (Cat. No. R7632), 레티닐 아세테이트 (Cat. No. R4632) 및 β-카로틴 (Cat. No. C4582)을 Sigma(USA)로부터 구매하고 아세톤 중에 용해시켜 표준 화합물로서 사용하였다. 결과는 세 개의 독립적인 실험으로부터 평균±SD으로 나타내었다.
실시예 1 : β-카로틴 및 레티날 고생산성 대장균의 제조용 벡터의 제조
게놈 DNA 제조, 제한효소 절단, 형질전환 및 표준 분자 생물학 기술을 포함하는 통상적인 과정은 문헌에 기재된 대로 수행하였다(Sambrook and Russell 2001). PCR은 그의 표준 프로토콜에 의해 pfu DNA 폴리머라제 (Solgent Co., Korea)를 사용하여 수행하였다. 배양되지 않은 해양 박테리아 66A03의 blh 유전자 (Genbank 허가 번호 AAY68319)를 그의 대장균에서의 발현을 위해 Gene Designer 소프트웨어 (DNA 2.0, Menlo Park, USA)에 의한 코돈-최적화에 따라 Genofocus (대전, 한국)로 합성하였다.
본 실시예에서는 MEP 경로를 가지고 있는 대장균에, 속도 결정 단계에 해당하는 효소인 DXP 신타제를 코딩하는 유전자를 대장균에 추가적으로 도입하는 동시에, 메발로네이트 경로에 관여하는 효소를 코딩하는 유전자를 다양한 유전자원으로부터 선별하여 도입하여, β-카로틴 고생산성 대장균을 제조하였다.
(1) 탄소원으로부터 IPP 를 합성하는데 관여하는 메발로네이트 경로의 효소를 코딩하는 유전자를 포함하는 pSNA 벡터의 제조
본 절에서 사용된 탄소원으로부터 IPP를 합성하는데 관여하는 메발로네이트 경로의 효소를 코딩하는 유전자는 다음 표 1과 같다.
효소명 유전자 유전자 서열
(Genbank 허가번호)
엔테로코커스 패칼리스 (Enterococcus faecalis) 유래의 아세틸-CoA 아세틸트란스퍼라제/하이드록시메틸글루타릴 (HMG)-CoA 리덕타제 mvaE 서열번호 18(AF290092)
엔테로코커스 패칼리스 유래의 HMG-CoA 신타제 mvaS 서열번호 19(AF290092)
스트렙토코커스 뉴모니애 (Streptococcus pneumoniae) 유래의 메발로네이트 키나제 mvaK1 서열번호 20(AF290099)
스트렙토코커스 뉴모니애 유래의 포스포메발로네이트 키나제 mvaK2 서열번호 21(AF290099)
스트렙토코커스 뉴모니애 유래의 메발로네이트 디포스페이트 데카르복실라제 mvaD 서열번호 22 (AF290099)
대장균 유래의 이소펜테닐 디포스페이트(IPP) 이소머라제 idi 서열번호 23 (U00096)
표 1의 유전자를 증폭하기 위한 프라이머 및 제한 효소
유전자 프라이머 서열 제한 효소
mvaE
F 서열번호 37 SacI
R 서열번호 38 SmaI
mvaS
F 서열번호 39 SmaI
R 서열번호 40 BamHI
mvaK1, mvaK2, mvaD
F 서열번호 41 KpnI
R 서열번호 42 XbaI
idi
F 서열번호 43 SmaI
R 서열번호 44 SphI
표 2에 표 1의 유전자 클로닝에 사용된 프라이머 서열 및 제한효소를 나타내었다. mvaK1, mvaK2, mvaD는 하나의 오페론으로 염색체상에 존재해서 각각의 유전자를 PCR 클로닝하지 않고 오페론을 통째로 한번에 PCR 클로닝을 하였다.
표 1의 유전자들은 표 3에 열거된 프라이머를 사용하고, 해당 유전자를 포함하고 있는 균주의 염색체 DNA를 주형으로 한, PCR을 통하여 증폭하였다. 증폭된 산물을 표 2에 열거된 제한 효소를 이용하여 pSTV28 벡터 (Takara Korea, 한국) (서열번호 45)에 도입하여, 벡터 pSNA를 제조하였다. 벡터 pSNA는 아세틸-CoA로부터 IPP를 생산할 수 있는 메발로네이트 경로의 효소를 코딩하는 유전자를 모두 포함하고 있다.
(2) IPP 로부터 β-카로틴을 합성하는데 관여하는 효소를 코딩하는 유전자를 포함하는 벡터 pT - HB pT - DHB 의 제조
본 절에서 사용된 IPP로부터 β-카로틴을 합성하는데 관여하는 효소를 코딩하는 유전자 및 MEP 경로의 속도결정 단계의 효소인 DXP 신타제 유전자는 다음 표 3과 같다.
효소명 유전자 유전자 서열
(Genbank 허가번호)
헤마토코커스 플루비알리스 (Haematococcus pluvialis) 유래의 IPP 이소포머레제 ipiHp1 서열번호 24(AF082325)
대장균 유래 1-데옥시자일룰로즈-5-포스페이트 (DXP) 신타제 dxs 서열번호 25(U00096)
판토에아 아글루메란스 (pantoea agglomerans) 유래의 제라닐제라닐 피로포스페이트 (GGPP) 신타제 crtE 서열번호 26(M87280)
판토에아 아글루메란스 유래의 피토엔 신타제 crtB 서열번호 27(M87280)
판토에아 아글루메란스 유래의 피토엔 데히드로게나제 crtI 서열번호 28M87280
판토에아 아나나티스 (pantoea ananatis) 유래의 라이코펜-β-시클라제 crtY 서열번호 29(D90087)
유전자 프라이머 제한 효소
ipiHp1
F 서열번호 46 SmaI
SphI
R 서열번호 47
dxs
F 서열번호 48 EcoRI
SnaBI
R 서열번호 49
crtE
F 서열번호 50 BspHI
EcoRI
R 서열번호 51
crtB , crtI
F 서열번호 52 EcoRI
SacI
R 서열번호 53
crtY
F 서열번호 54 SalI
PstI
R 서열번호 55
표 3의 유전자 클로닝에 사용된 프라이머 서열 및 제한효소는 표 4와 같다. crtB, crtI는 하나의 오페론으로 염색체상에 존재해서 각각의 유전자를 PCR 클로닝하지 않고 오페론을 통째로 한번에 PCR 클로닝을 하였다.
표 3의 유전자들은 표 4에 열거된 프라이머를 사용하고, 해당 유전자를 포함하고 있는 균주의 염색체 DNA를 주형으로 한, PCR을 통하여 증폭하였다. 증폭된 산물을 표 4에 열거된 제한 효소를 이용하여 pTrc99A 벡터 (Genbank 허가 번호 M22744) (서열번호 30)에 도입하여, 벡터 pT-DHB를 제조하였다. 벡터 pTDHB는 IPP로부터 β-카로틴을 합성하는데 관여하는 효소를 코딩하는 유전자 및 MEP 경로의 속도결정 단계의 효소인 DXP 신타제 (dxs) 유전자를 모두 포함하고 있다. 또한 상기 표 3의 유전자들 중 dxs만을 제외한 모든 유전자를 상기 표 4에 열거된 제한효소를 사용하여 pTrc99A 벡터에 도입하여 벡터 pT-HB를 제조하였다.
(3) β-카로틴으로부터 레티날을 합성하는데 관여하는 효소를 코딩하는 유전자를 포함하는 벡터의 제조
본 발명에서 사용된 β-카로틴으로부터 레티날을 합성하는데 관여하는 효소를 코딩하는 유전자는 다음 표 5와 같다. 표 5에서 배양되지 않은 해양 박테리아 (uncultured marine bacterium) 66A03 유래의 β-카로틴 모노옥시게나제를 코딩하는 유전자는 blh의 대장균 코돈 최적화 서열인 SR 유전자를 사용하였다.
효소명 유전자 유전자 서열
(Genbank 허가번호)
배양되지 않은 해양 박테리아 (uncultured marine bacterium) 66A03 유래의 β-카로틴 모노옥시게나제 blh 서열번호 31
(DQ065755)
배양되지 않은 해양 박테리아 (uncultured marine bacterium) 66A03 유래의 β-카로틴 모노옥시게나제 SR (blh의대장균 코돈최적화 서열) 서열번호 32
생쥐 (Mus musculus) 유래의 β-카로틴 15,15'-모노옥시게나제 bcmo1 서열번호 33
(NM_021486)
나트로노모나스 파라오니스 (Natronomonas pharaonis) ATCC35678 유래의 brp 유사 단백질 2 (brp-like protein 2) brp2 서열번호 34
(CR936257)
할로박테리움 살리나룸 (Halobacterium salinarum) ATCC700922 유래의 β-카로틴 모노옥시게나제 blh 서열번호 35
(AE004437)
할로박테리움 살리나룸 (Halobacterium salinarum) ATCC700922 유래의 β-카로틴 모노옥시게나제 brp 서열번호 36
(AE004437)
유전자 프라이머 서열 제한 효소
SR
F 서열번호 56 EcoR1
SpeI
R 서열번호 57
bcmo1
F 서열번호 58 EcoR1
SpeI
R 서열번호 59
brp2
F 서열번호 60 EcoR1
SpeI
R 서열번호 61
blh
F 서열번호 62 EcoR1
SpeI
R 서열번호 63
brp
F 서열번호 64 EcoR1
SpeI
R 서열번호 65
표 5의 유전자 클로닝에 사용된 프라이머 서열 및 제한효소는 표 6과 같다. 표 5의 유전자들은 표 6에 열거된 프라이머를 사용하고, 해당 유전자를 포함하고 있는 균주의 염색체 DNA와 생쥐의 cDNA 라이브러리를 주형으로 한, PCR을 통하여 증폭하였다. 증폭된 산물을 표 6에 열거된 제한 효소를 이용하여 벡터 pT-HB에 각각 도입하여, 벡터 pT-HBSR, pT-HBBcmo1, pT-HBbrp2, pT-HBblh, pT-HBbrp를 제조하였다. 벡터 pT-HBSR, pT-HBBcmo1, pT-HBbrp2, pT-HBblh 및 pT-HBbrp는 각각 pT-HB 벡터에 SR, Bcmo1, brp2, blh, brp 유전자가 도입된 벡터로서, IPP로부터 β-카로틴을 거쳐 레티날을 합성하는데 관여하는 효소를 코딩하는 유전자를 모두 포함하고 있다. pT-HBSR로부터 SR 유전자를 SpeI으로 절단하여 pT-DHB의 상응하는 부분에 삽입하여 pT-DHBSR을 얻었다.
실시예 2: 레티날 생산에 대한 다양한 BCM (D)O 유전자의 비교
레티날은 β-카로틴을 생산하는 재조합 대장균으로 β-카로틴 모노(디)옥시게나제를 인코딩하는 BCM(D)O 유전자를 도입하는 것에 의해 생산될 수 있다. 본 발명자들은 두 개의 박테리아, 할로박테리움 종 (Halobacterium sp) NRC-1 (blhbrp 유전자) 및 나트로노모나스 파라오니스 (Natronomonas pharaonis) (brp2 유전자) 및 척추동물 무스 무스쿨루스 (Mus musculus) (Bcmo1 유전자)로부터의 BCM(D)O 유전자를 클로닝하였다. 본 발명자들은 또한 배양되지 않은 해양 박테리아 66A03 blh 유전자의 아미노산 서열에 기초하여 코돈-최적화된 BCDO 유전자(SR)을 합성하였다. BCM(D)O 유전자를 레티날 합성 플라스미드 pT-HBblh, pT-HBbrp, pT-HBbrp2, pT-HBBcmo1 및 pT-HBSR 각각을 제조하는데 사용하였다. 각 레티날 플라스미드를 포함하는 재조합 대장균 세포를 탄소 원료로서 0.5% (w/v) 글리세롤 및 0.2% (w/v) 아라비노오스를 포함하는 2YT 배지에서 48시간 동안 29℃에서 배양하였다.
도 3은 pT-HB, pT-HBblh, pT-HBbrp, pT-HBbrp2, pT-HBBCMO1, 및 pT-HBSR를 포함하는 대장균의 레티날 생산, β-카로틴 생산 및 세포 성장을 나타낸다. 흰 막대 및 회색 막대는 각각 24시간, 48시간에서의 수치를 나타낸다.
도 3에 나타낸 바와 같이, pT-HBblh, pT-HBbrp, 또는 pT-HBSR을 포함하는 재조합 대장균은 각각 24시간에서 2.2, 0.8, 또는 1.4 mg/L의 레티날을 생산하였다. 그러나, pT-HBblh 또는 pT-HBbrp을 포함하는 대장균의 레티날 생산은 48시간에서 각각 0.7 또는 0.4 mg/L로 감소한 반면, 대장균(pT-HBSR)의 레티날 생산은 약간 증가하였다. 24시간 후의 레티날 생산 감소는 레티날의 세포 내 산화 분해로 인한 것일 수 있다. 배양물로부터 얻은 레티날 양은 세포 내 합성 및 레티날의 분해 모두에 의존한다.
pT-HBblh 또는 pT-HBbrp를 포함하는 대장균에 있어 배양 시간 24시간 이후의 레티날 생산율은 그들의 분해율에 비해 낮을 것이다. pT-HBbrp2 또는 pT-HBBcmo1을 포함하는 대장균 균주 배양에서 레티날의 소량(trace amount)을 검출하였다. BCM(D)O 유전자를 갖지 않는 대장균(pT-HB)은 35 mg/L의 β-카로틴을 생산하고, 레티날은 생산하지 않았다. β-카로틴은 레티날의 바로 전 전구체이기 때문에, 만약 레티날 분해가 있었다면 BCM(D)O에 의한 β-카로틴 소비량이 레티날 생산량에 정확하게 비례할 것이다. SR을 제외한 BCM(D)O를 포함하는 대장균의 배양물에 β-카로틴이 잔존하였기 때문에, SR의 β-카로틴 절단 활성은 시험된 BCM(D)O 중에서 가장 높을 것으로 추정되었다. 따라서, SR 효소를 추가적인 실험에서 레티날 생산을 위해 선택하였다. 세포 성장은 성장 지연을 보인 N. pharaonis brp 유전자를 제외하고는, BCM(D)O 유전자의 과발현에 의해 영향받지 않았다.
실시예 3: 빌딩 블럭 공급을 위한 MEP MVA 경로로의 유전자 조작
레티날 빌딩 블럭인 IPP 및 DMAPP는 내재된 MEP 경로 및 외래의 MVA 경로를 통해 대장균에서 합성될 수 있다 (도 1). 1-데옥시-d-자일로오스-5-포스페이트 (DXP) 합성이 MEP 경로에서 중요한 속도-제한 단계라고 보고된다. 따라서, (dxs에 의해 인코딩되는)D XP 신타제의 과발현은 본 발명자들의 이전 발명에서 라이코펜 및 β-카로틴 생산을 증가시켰다. dxs 유전자를 pT-HBSR 중의 MEP 경로 앞에 도입하여 pT-DHBSR를 제조하였다.
도 4는 pT-HB, pT-HBSR, pT-DHB, 및 pT-DHBSR을 포함하는 대장균 및 MVA 경로 플라스미드인 pS-NA와 함께 pT-DHB, 또는 pT-DHBSR을 포함하는 대장균의 레티날 생산, β-카로틴 생산 및 세포 성장을 나타낸다. 흰 막대 및 회색 막대는 각각 24시간, 48시간에서의 수치를 나타낸다.
도 4에 나타낸 바와 같이, 24 시간에서 대장균(pT-DHBSR)의 레티날 생산은 대장균 (pT-HBSR)의 것보다 조금 높았으나, 48 시간에서는 차이가 없었다. 대장균(pT-DHB)으로부터의 β-카로틴 생산은 dxs 과발현에 의해 대장균(pT-HB)과 비교하여 1.5 배 증가하였다. 대장균에서의 외래 MVA 경로는 IPP 및 DMAPP 빌딩 블럭의 충분한 양을 제공하는 것에 의해 이소프레노이드 생산을 크게 증가시키는 것으로 알려져 있다. 추가적인 외래 MVA 경로를 포함하는 대장균(pT-DHBSR/pS-NA)은 48 시간에 8.7 mg/L의 레티날을 생산하였고, 이는 대장균(pT-DHBSR)의 생산량보다 4배 더 높은 것이다. SR 유전자를 포함하는 대장균 균주에서, 세포 중에 β-카로틴이 없거나 소량 잔존하였는데, 이는 SR에 의한 효과적인 β-카로틴 절단 반응으로 인한 것으로 추정된다. 소비된 β-카로틴(기질) 양과 생산된 레티날(생산물) 양 사이에 큰 차이가 있었다. 이는 레티날의 생물학적 분해 외에 대장균 내에서 레티날을 대사하는 세포 반응의 존재로 인한 것일 수 있다. 따라서, 대장균 내의 임의의 효소에 의한 레티날로부터 유래된 다른 레티노이드의 형성이 고려된다. 레티날은 세포 효소 반응에 의해 레티놀, 레티노산 및 레티닐 에스테르로 변환될 수 있기 때문에 (도 2), 대장균 배양물 중의 레티날 유도체들을 분석하였다. 레티노산을 제외한 유도체들의 형성이 확인되었고 레티날, 레티놀 및 레티닐 아세테이트의 생산이 추가적인 실험에서 측정되었다.
실시예 4: 레티노이드 생산에 있어 대장균 균주, 배양 조건 및 탄소 원료의 효과
(1) 균주
레티날, 레티놀 및 레티닐 아세테이트를 포함하는 레티노이드의 생산에 있어 대장균 균주의 효과를 조사하였다. pT-DHBSR 및 pS-NA를 포함하는 5개의 대장균 균주인 MG1655, DH5α, XL1-Blue, S17-1, 및 BL21 (DE3)를 사용하여 레티노이드 생산을 수행하였다. 표 5는 상기 5 개 균주를 포함한 6개 대장균 균주의 특성을 나타낸 것이다.
대장균 균주 설명
MG1655 K12, 야생형
DH5α F-, φf80dlacZ△M15, △(lacZYA-argF)U169, deoR , recA1endA1, hsdR17(rK -mK +), phoA, supE44, λ-, thi-1, gyrA96, relA1
XL1-Blue hsdR17,supE44,recA1,endA1,gyrA46,thi,relA1,lac/F'[proAB +,lacI q,lacZ△M15::Tn10(tetr)]
S17-1 recA pro hsdR RP4-2-Tc::Mu-Km::Tn7
BL21(DE3) F-,ompT,hsdS B(rB -mB -),gal(lcI857,ind1,Sam7,nin5,lacUV5-T7gene1),dcm(DE3)
BW25113 △(araD-araB)567, △lacZ4787(::rrnB-3), lambda-, rph -1, △(rhaD -rhaB)568, hsdR514
도 5는 pT-DHBSR 및 pS-NA를 갖는 5개 대장균 균주의 레티노이드 생산과 세포 성장을 나타낸다. 배양은 0.5%(w/v) 글리세롤 및 0.2%(w/v) 아라비노오스를 포함하는 2YT 배지에서 48시간 동안 29℃에서 수행되었다. 레티날, 레티놀, 및 레티닐 아세테이트는 밝은 회색, 어두운 회색 및 검은색으로 각각 나타내고, 세포 성장에서 MG1655, DH5α, XL1-Blue, S17-1, 및 BL21(DE3)을 각각 ■, ●, ▲, ▼, ◆로 나타내었다.
도 5에 나타낸 바와 같이, 대장균 DH5α가 36 시간에서 40 mg/L로서 가장 높은 양의 레티노이드를 나타내고, 대장균 S17-1 및 XL1-Blue가 그 다음으로 22 mg/L 정도의 레티노이드를 생산하였다. 그러나, 대장균 MG1655 및 BL21 (DE3)에서는 아주 작은 양의 레티노이드를 얻었다. 따라서 대장균 DH5α가 레티노이드 생산 균주로 선택되었다.
(2) 배양 조건
레티노이드 생산에 있어 용존 산소의 효과를 30 mm 지름 시험관에서 상이한 시험 부피로 시험하였다.
도 6은 시험 부피에 따른 pT-DHBSR 및 pS-NA를 갖는 대장균의 레티노이드 생산 및 세포 성장을 나타낸다. 도 6에서, 레티날, 레티놀, 및 레티닐 아세테이트는 밝은 회색, 어두운 회색 및 검은색으로 각각 나타내고, 세포 성장에서 시험 부피 3 mL, 5 mL, 7 mL, 및 10 mL를 각각 ■, ●, ▲, ▼로 나타내었다. 배양은 0.5%(w/v) 글리세롤 및 0.2%(w/v) 아라비노오스를 포함하는 2YT 배지에서 48시간 동안 29℃에서 수행되었다.
도 6에 나타낸 바와 같이, 낮은 시험 부피를 가질 때, 레티노이드 생산이 더 빨리 최대에 이르렀고 (더 높게 용해된 산소에 상응하는), 아마도 그의 산화 분해로 인해 더 빨리 감소한 것으로 보인다. 10 mL의 시험 부피에서 세포 성장 및 레티노이드 생산 모두 지연되었으나, 작은 생산물 분해가 관찰되었다. 레티노이드 생산을 위한 최적의 시험 부피는 7 mL인 것으로 밝혀졌다.
또한, 온도에 따른 레티노이드 생산을 조사하였다. 도 7은 배양 온도에 따른 pT-DHBSR 및 pS-NA를 갖는 대장균의 레티노이드 생산 및 세포 성장을 나타낸다. 도 7에서, 레티날, 레티놀, 및 레티닐 아세테이트는 밝은 회색, 어두운 회색 및 검은색으로 각각 나타내고, 세포 성장에서 배양 온도 29℃, 34℃, 37℃는 각각 ■, ●, ▲로 나타내었다. 배양은 0.5%(w/v) 글리세롤 및 0.2%(w/v) 아라비노오스를 포함하는 2YT 배지에서 48시간 동안 수행되었다.
도 7에 나타낸 바와 같이, 레티노이드 생산은 배양 온도에 의해 영향을 받았고 가장 높은 생산은 29℃에서 얻어졌다.
(3) 탄소원
상이한 탄소 원료를 레티노이드 생산에 미치는 영향을 비교하였다.
도 8은 탄소원에 따른 pT-DHBSR 및 pS-NA를 갖는 대장균의 레티노이드 생산과 세포 성장을 나타낸다. 도 8에서, 레티날, 레티놀, 및 레티닐 아세테이트는 밝은 회색, 어두운 회색 및 검은색으로 각각 나타내고, 세포 성장에서 탄소원 없음, 탄소원 글리세롤, 글루코오스, 자일로오스, 말토오스, 및 갈락토오스를 각각 ■, ●, ▲, ▼, ◆, 및 ◀로 나타내었다. 배양은 0.2%(w/v) 아라비노오스 및 0.5%(w/v) 글리세롤, 글루코오스, 자일로오스, 말토오스, 또는 갈락토오스를 포함하는 2YT 배지에서 48시간 동안 29℃에서 수행되었다.
도 8에 나타낸 바와 같이, 글리세롤이 레티노이드 생산에 가장 좋은 탄소 원료였다. 글루코오스 또는 갈락토즈를 탄소 원료로서 사용한 경우, 레티노이드의 생산량은 탄소 원료가 없을 경우보다 더 적었다.
그 후, 레티노이드 생산 및 세포 성장에 있어 글리세롤 농도의 효과를 조사하였다. 대장균 DH5α(pT-DHBSR/pSNA)를 0.0% 내지 2.0% (w/v) 글리세롤을 포함하는 2YT 배지, 29℃에서 성장시켰다.
도 9는 pT-DHBSR 및 pS-NA를 포함하는 대장균의 레티노이드(레티날, 레티놀 및 레티닐 아세테이트) 생산을 나타낸다. 레티날, 레티놀 및 레티닐 아세테이트를 각각 밝은 회색, 어두운 회색 및 검은색으로 나타내었다.
도 10은 pT-DHBSR 및 pS-NA를 포함하는 대장균의 세포 성장을 나타낸다. 제공한 글리세롤 농도 0%, 0.5%, 1%, 및 2%를 각각 ■, ●, ▲, ▼로 나타내었다.
도 9 및 도 10에 나타낸 바와 같이, 세포 성장은 글리세롤 농도에 비례하여 증가하였다. 0.5, 1.0 및 2.0 (w/v)의 글리세롤 농도에서 각각 36, 48, 및 72 시간에 정체 상태에 이르렀다. 상기 시간에서 그의 최대 레티노이드 생산을 얻었고 그 후 정체 상태 동안 생산량이 현저히 감소하였다. 레티노이드 생산은 주로 24 시간 후에 증가하는 것으로 나타났다. 레티노이드 생산은 다양한 글리세롤 농도 중, 2.0% (w/v) 글리세롤에서 95 mg/L로 가장 높았고 이는 0.5% (w/v) 글리세롤의 최대 레티노이드 생산량보다 2.4배 높았다. 글리세롤 농도의 증가는 정체 상태를 지연시켰고, 레티노이드 생산의 기간을 연장시켰다.
모든 배양물에서 세포 성장의 정체 상태에서 레티노이드 생산의 극심한 감소를 관찰하였고, 이는 정체 상태 동안 레티노이드 합성 중단 및 그의 세포 내 산화적 분해로 인한 것일 것이다.
(4) 도데칸의 존재하에서 배양
표 7의 6개 균주에 pT-DHBSR/pSNA가 형질전환된 균주를 사용하고, 5ml 배지에 1ml의 도데칸을 첨가하고 "박테리아 균주 및 배양 조건"에 기재된 조건에 따라 배양하였다. 배지는 0.2%(w/v) 아라비노스와 0.5%(w/v) 글리세롤이 첨가된 2YT 배지를 사용하였다.
도 11은 도데칸 존재하에서 서로 다른 레티노이드 생산 균주에 따른 레티노이드 생산 결과를 나타낸 도면이다. 도 11에 나타낸 바와 같이, DH5α와 MG1655에서 가장 많은 레티노이드가 생산되었다. MG1655의 경우, 도데칸이 첨가되지 않은 경우에 비하여 균체 성장 및 레티노이드 생산량이 증가하였다. MG1655의 균체 성장 속도 및 레티노이드 생산량 증가 속도는 DH5α보다 빨랐다. BL21(DE3) 균주는 균체 성장은 여전히 높았으며, 레티닐 아세테이트 생산은 거의 되지 않았다. 그 결과, 6개 균주 중에서 DH5α와 MG1655가 다른 균주에 비하여 상대적으로 더 적합하였다.
도 12는 도데칸 존재하에서 레티노이드 생산 균주의 생장 결과를 나타낸 도면이다.
도 13은 도데칸 존재하에서 탄소원인 글리세롤 농도에 따른 레티노이드 생산과 생장 결과를 나타낸 도면이다.
실시예 5: 레티노이드의 인-시추 추출을 위한 도데칸을 사용한 2-상 배양
세포 내 레티노이드 분해를 막기 위해, 소수성 용매 도데칸을 사용한 2-상 배양을 세포로부터 레티노이드의 인-시추 추출을 위해 수행하였다. 대장균에 대해 낮은 독성을 갖고, 소수성 레티노이드의 추출을 위해 높은 소수성 (log PO /W, 6.6)을 갖고, 낮은 휘발성 때문에 증발 손실이 없는 도데칸을 선택하였다.
본 실시예에서, 1 mL의 도데칸을 5 mL의 배양액 상에 첨가하였다. 도 13은 5 mL 배양 배지 상에 1 mL 도데칸을 포함하는 2-상 배양에서 대장균(pT-DHBSR/pS-NA)의 레티노이드 생산 및 세포 성장을 나타낸다. 레티노이드 생산에서 레티날, 레티놀 및 레티닐 아세테이트를 각각 밝은 회색, 어두운 회색 및 검은색으로 나타내었다. 세포 성장에서 제공한 글리세롤 농도 0.5%, 1%, 및 2%를 각각 ■, ●, ▲로 나타내었다.
레티노이드가 도데칸 상으로 추출되고 무시할 수 있는 양의 레티노이드가 세포 질량 및 배양물에서 검출되었다(데이터는 나타내지 않음). 그 결과, 도데칸 상으로부터 레티노이드 생산을 측정하였다. 도 13에 나타낸 바와 같이, 도데칸에 의해 인-시추 추출은 레티노이드의 세포 내 분해를 최소화할 수 있었다. 도데칸 상 중에 레티노이드는 상대적으로 안정한 것으로 보였고 현저한 산화적 분해 없이 잔존하였다. 도 9 및 10의 결과(도데칸 첨가 없음)와 비교할 때, 1 mL의 도데칸을 첨가한 경우 레티노이드 생산은 24 시간에서도 현저하게 증가하였고, 세포 성장이 도데칸 첨가에 의해 영향받지 않으면서 레티노이드 생산의 감소가 정체 상태에서 나타나지 않았다. 그러나 2% (w/v) 글리세롤의 배양에서의 레티노이드 생산은 1% (w/v)에서 2% (w/v)로 글리세롤 농도의 증가에 따라 세포 성장이 현저하게 증가하였음에도, 1% (w/v) 글리세롤에서 얻은 것에 비해 높지 않았다. 1 mL의 도데칸 첨가 부피는 2% (w/v) 글리세롤의 배양에서 효과적인 레티노이드 인-시추 추출에 불충분할 수 있다.
레티노이드 생산 및 세포 성장에 있어 도데칸 첨가 부피의 효과를 조사하기 위하여, 1 mL 내지 5 mL의 도데칸을 2% (w/v) 글리세롤을 포함하는 배양액 상에 초기에 첨가하였다.(도 14).
도 14는 2-상 배양에서의 대장균(pT-DHBSR/pS-NA)의 도데칸 부피에 따른 레티노이드 생산 및 세포 성장을 나타낸다. 레티노이드 생산에서 레티날, 레티놀 및 레티닐 아세테이트를 각각 밝은 회색, 어두운 회색 및 검은색으로 나타내었다. 세포 배양시에 오버레이한 도데칸 부피 0 mL, 1 mL, 2 mL, 3 mL, 4 mL, 5 mL 및 6 mL를 각각 ■, ●, ▲, □, ○, △ 및 ☆로 나타내었다.
도 15는 배양 시간 및 도데칸 부피에 따른 레티노이드의 분포가 총 레티노이드에 대한 각 구성성분의 백분율로 나타난다. 레티날, 레티놀 및 레티닐 아세테이트를 각각 밝은 회색, 어두운 회색 및 검은색으로 나타내었다.
도 14 및 도 15에 나타낸 바와 같이, 도데칸 첨가 부피가 증가함에 따라 전체 레티노이드 생산도 향상되었다. 5 mL 도데칸을 갖는 배양의 72 시간에서 136 mg/L의 가장 높은 레티노이드 생산을 얻었고 이는 1 mL 도데칸으로 할 경우(65 mg/L)보다 약 2 배 높은 수치이다. 5 mL 도데칸으로 72 시간 이상 연장된 배양을 시켰을 때 추가적인 레티노이드 생산의 증가는 없었고 그의 최고치를 분해 없이 유지하였다(데이터는 나타내지 않음). 0, 24, 및 48 시간에서 2 mL의 도데칸을 배양에 추가하는 것에 의해 도데칸 첨가 부피를 6 mL까지 증가시켰다. 6 mL 도데칸 첨가 배양에서 5 mL 도데칸을 갖는 배양에 비교하였을 때 전체 레티노이드 생산의 증가는 없었다. 6 mL 도데칸을 초기에 첨가 배양에서도 레티노이드 생산의 증가는 없었다(데이터는 나타내지 않음). 도데칸을 갖는 모든 배양액에서의 세포 성장은 도데칸이 없을 때보다 약간 높았다 (도 14).
도 15는 도데칸 첨가 부피에 따라 얻은 레티노이드들의 분포를 나타낸다. 도데칸 첨가가 있는 경우와 없는 경우 얻은 레티날 및 레티놀 비율에서 현저한 레티노이드 분포 차이가 나타난다. 48 시간에서 레티노이드 중 레티날의 비율은 도데칸 첨가 배양에서 약 51% (w/w)이고 도데칸 첨가가 없는 배양에서 23%인 반면, 레티놀 비율은 도데칸 첨가 배양에서 30% 내지 39%이고 도데칸 첨가 없는 배양에서 59%이다. 따라서, 도데칸 첨가는 레티날의 비율을 높이지만 레티놀의 비율을 감소시킨다. 세포에서 레티날로부터의 레티놀 형성의 반응 순서를 고려하였을 때, 레티날은 도데칸에 의해 그의 레티놀로의 전환 전에 세포로부터 추출되는 것으로 생각된다. 48 시간에서의 레티닐 아세테이트 비율은 도데칸 첨가 있는 배양 및 없는 배양 모두에서 20% 미만이고, 이는 레티날 및 레티놀에 비해 상대적으로 낮은 수치이다. 도데칸 첨가 배양에서 레티닐 아세테이트 비율은 배양 시간이 길어짐에 따라 감소하는데 이는 레티닐 아세테이트 형성을 위한 세포 활동이 배양 동안 감소함을 나타낸다. 결론적으로, 도데칸 첨가는 세포 성장의 정체 상태에서 레티노이드 생산의 감소를 방지하고 레티노이드 생산을 증가시켰다.
본 발명의 레티노이드의 인-시추 추출에는 세포벽 분해를 위한 리소자임이 필요하지 않다. 레티노이드(C20, 이소프레노이드 분자)는 세포벽의 손실 없이 세포로부터 효과적으로 방출될 수 있다. 레티노이드 생산의 2-상 배양에서, β-카로틴은 레티노이드의 직접적인 전구체이기 때문에 세포 내에 계속 유지되어야 한다. β-카로틴이 도데칸 상에서 추출되는 경우, 이는 시토졸에 위치한 BCD(M)O에 의해 절단될 수 있다.
β-카로틴은 분자 크기 때문에 세포로부터 방출될 수 없어 도데칸에 의해 추출되지 않으므로, β-카로틴의 2-상 배양에서 세포 내에서 계속 유지될 수 있다(도 16).
도 16은 pT-DHB 및 pS-NA를 갖는 대장균의 베타-카로틴 생산과 세포 성장에 있어 도데칸 첨가의 효과를 나타낸다. 배양은 0.5%(w/v) 글리세롤 및 0.2%(w/v) 아라비노오스를 포함하는 2YT 배지 5 mL 상에 1 mL 도데칸 첨가와 함께 48시간 동안 29℃에서 수행되었다. 회색 막대 및 검은색 막대는 각각 24 및 48시간을 나타낸다.
도 16에 나타낸 바와 같이, 무시할 만한 양의 β-카로틴이 도데칸 상에서 검출되고, 거의 모든 β-카로틴은 세포 내에 유지되었다. 도데칸 첨가가 있는 배양과 없는 배양 사이에 β-카로틴 생산 및 세포 성장의 현저한 차이는 없었다.
5 mL 도데칸 첨가가 있는 배양에서 48시간에 122 mg/L의 총 레티노이드 생산을 얻은 반면, 도데칸 첨가 없는 배양에서는 동일한 시간대에 그의 절반에 해당하는 양(60 mg/L)의 생산을 얻었다. 따라서, 도데칸-첨가 2-상 배양 시스템은 친유성 작은 분자를 생산하는 다른 형질전환 시스템에 적용될 수 있을 것이다.
실시예 6: 친유성 물질을 포함하는 배지에서 레티노이드의 생산
본 실시예에서는 다양한 친유성 물질에 대하여 레티노이드 생산 증가 효과가 있는지 확인하였다.
(1) 알칸을 포함하는 배지에서 레티노이드의 생산
DH5α에 pT-DHBSR/pSNA가 형질전환된 균주 DH5α(pT-DHBSR/pSNA)를 사용하고, 5ml 배지에 5ml의 옥탄, 데칸, 도데칸 및 테트라데칸을 각각 첨가하고 "박테리아 균주 및 배양 조건"에 기재된 조건에 따라 배양하였다. 배지는 0.2%(w/v) 아라비노스와 2.0%(w/v) 글리세롤이 첨가된 2YT 배지를 사용하였다.
도 17은 알칸 존재하에서 레티노이드 생산 결과를 나타낸 도면이다. 도 18은 알칸 존재하에서 레티노이드 생산 균주의 생장 결과를 나타낸 도면이다.
도 17에 나타낸 바와 같이, 데칸을 사용한 경우에 총 108 mg/L의 레티노이드가 생산되었다. 그 외 균체 증식, pH 및 균체 내 β-카로틴의 양은 알칸에 따라 큰 차이를 보이 않았다. 그 결과 도데칸에 비해 데칸이 레티노이드 생산에 더 유리한 것으로 여겨진다. 옥탄을 사용한 경우, 레티날 및 레티놀의 생산은 다른 알칸과 유시하였으나, 레티닐 아세테이트는 거의 생산하지 않았다. 테트라데칸은 전체 레티노이드 생산량이 다른 알칸에 비하여 낮았다.
(2) 미네랄 오일을 포함 배지에서 레티노이드의 생산
(2.1) 경량 미네랄 오일
경량 미네랄 오일은 알칸에 비하여 가격이 싸다는 장점이 있다. DH5α에 pT-DHBSR/pSNA가 형질전환된 균주 DH5α(pT-DHBSR/pSNA)를 사용하고, 5ml 배지에 다른 부피의 경량 미네랄 오일을 각각 첨가하고 "박테리아 균주 및 배양 조건"에 기재된 조건에 따라 배양하였다. 배지는 0.2%(w/v) 아라비노스와 2.0%(w/v) 글리세롤이 첨가된 2YT 배지를 사용하였다.
도 19는 경량 미네랄 오일 존재하에서 레티노이드 생산 결과를 나타낸 도면이다. 도 20은 경량 미네랄 오일 존재하에서 균주의 생장 결과를 나타낸 도면이다.
도 19에 나타낸 바와 같이, 도데칸 5ml에서 136.1mg/L이 생산될 때, 2ml 경량 미네랄 오일에서 158mg/L이 생산되었다. 도 20에 나타낸 바와 같이, pH는 도데칸 이외의 경우 큰 차이를 보지 않았다. 반면, 균체 성장은 경량 미네랄 오일의 양이 증가할수록 감소하였다. 이는 경량 미네랄 오일의 높은 점도와 비중으로 인하여 배지와 미네랄 오일이 충분히 혼합되지 않았기 때문인 것으로 예상된다. 균체 성장의 감소로 인해 레티노이드 생산도 감소하였다.
도 21은 균체당 레티노이드 생산량 (cell specific retinoids productivity)을 나타낸 도면이다. 도 21에 나타낸 바와 같이, 미네랄 오일의 양에 상관없이 약 5mg/L/OD600nm의 비생산성을 보였다.
(2.2) 중량 미네랄 오일
중량 미네랄 오일은 경량 미네랄 오일에 비하여 싸다. DH5α에 pT-DHBSR/pSNA가 형질전환된 균주 DH5α(pT-DHBSR/pSNA)를 사용하고, 5ml 배지에 2ml의 중량 미네랄 오일을 각각 첨가하고 "박테리아 균주 및 배양 조건"에 기재된 조건에 따라 배양하였다. 배지는 0.2%(w/v) 아라비노스와 2.0%(w/v) 글리세롤이 첨가된 2YT 배지를 사용하였다.
도 22는 중량 미네랄 오일 존재하에서 레티노이드 생산 결과를 나타낸 도면이다. 도 23은 중량 미네랄 오일 존재하에서 균주의 생장 결과를 나타낸 도면이다. 도 22 및 도 23에 나타낸 바와 같이, 경량 미네랄 오일, 및 도데칸에 비하여 중량 미네랄 오일의 경우 세포 성장이 적었다. 또한, 레티노이드 104.6mg/L을 생산하였다. 이는 중량 미네랄 오일의 점도에 의하여 배지와 미네랄 오일이 잘 혼합되지 않았기 때문인 것으로 예측된다.
사용된 시험관 (test tube)를 기울여서 배양기에 배치시키는 것을 제외하고는 위와 동일하게 세포를 배양하였다. 시험관을 기울임으로써 교반의 효과가 더 증대되어 배지와 미네랄 오일이 더 잘 혼합될 수 있었다.
도 24는 시험관을 기울여 배양한 경우 레티노이드 생산 결과를 나타낸 도면이다. 도 25는 시험관을 기울여 배양한 경우 균주 생장 결과를 나타낸 도면이다. 도 24 및 도 25에 나타낸 바와 같이, 기울여 배양한 경우 세포 성장 및 레티노이드 생산이 증가하였다. 구체적으로, 시험관을 수직으로 한 경우, 96시간에서 88.2mg/L의 레티노이드가 생산되었으나, 시험관을 기울인 경우, 173.9mg/L이 생산되었다.
이는 경량 및 중량 미네랄 오일은 높은 점도로 인하여 배지와의 혼합이 레티노이드 생산에 중요한 인자라는 것을 나타낸다. 따라서, 배양 중 적절한 교반을 제공함으로써 레티노이드에 사용될 수 있다.
(3) 피부 친화적 친유성 물질을 포함 배지에서 레티노이드의 생산
피부 친화적 친유성 물질을 포함하는 배지에서 레티노이드를 생산하였다. 피부 친화적 친유성 물질은 이소프로필 미리스테이트 (IPM), 디옥타노일-데카노일 글리세롤(ODO), 세틸 에틸헥사노에이트 (CEH), 및 피토스쿠알란을 사용하였다.
DH5α에 pT-DHBSR/pSNA가 형질전환된 균주 DH5α(pT-DHBSR/pSNA)를 사용하고, 5ml 배지에 2ml의 중량 미네랄 오일을 각각 첨가하고 "박테리아 균주 및 배양 조건"에 기재된 조건에 따라 배양하였다. 배지는 0.2%(w/v) 아라비노스와 2.0%(w/v) 글리세롤이 첨가된 2YT 배지를 사용하였다. 대조군은 도데칸 5ml을 첨가하였다.
도 26은 피부 친화적 친유성 물질 존재하에서 세포 성장 및 pH를 나타낸 도면이다. 도 27 및 도 28은 피부 친화적 친유성 물질의 양에 따른 레티노이드 생산결과를 나타낸 도면이다. 도 27 및 도 28에 나타낸 바와 같이, 도데칸을 제외한 친유성 물질에서 5mL에 비하여 2mL에서 레티노이드 생산량이 많았다. 즉, 경량 미네랄 오일, IPM, ODO, CEH, 및 피토스쿠알란의 배지 5mL에 대하여 약 2mL을 사용한 경우, 레티노이드 생산량이 많았다. IPM, ODO, CEH 및 피토스쿠알란 중 IPM에서 가장 많은 레티노이드가 생산되었다. 특히, IPM 2mL를 첨가한 경우, 180mg/L의 레티노이드가 생산되었다. IPM의 경우, 균체 성장이 비슷한 것을 고려하면, 균체당 비생산성이 높은 것으로 예측된다.
한국생명공학연구원 KCTC11254BP 20080107 한국생명공학연구원 KCTC11255BP 20080107
<110> INDUSTRY-ACADEMIC COOPERATION FOUNDATION GYEONGSANG NATIONAL UNIVERSITY <120> A method of producing retinoids using a microorganism of Escherichia genus having enhanced retinoids productivity <130> PN093621 <160> 65 <170> KopatentIn 1.71 <210> 1 <211> 803 <212> PRT <213> Enterococcus faecalis <400> 1 Met Lys Thr Val Val Ile Ile Asp Ala Leu Arg Thr Pro Ile Gly Lys 1 5 10 15 Tyr Lys Gly Ser Leu Ser Gln Val Ser Ala Val Asp Leu Gly Thr His 20 25 30 Val Thr Thr Gln Leu Leu Lys Arg His Ser Thr Ile Ser Glu Glu Ile 35 40 45 Asp Gln Val Ile Phe Gly Asn Val Leu Gln Ala Gly Asn Gly Gln Asn 50 55 60 Pro Ala Arg Gln Ile Ala Ile Asn Ser Gly Leu Ser His Glu Ile Pro 65 70 75 80 Ala Met Thr Val Asn Glu Val Cys Gly Ser Gly Met Lys Ala Val Ile 85 90 95 Leu Ala Lys Gln Leu Ile Gln Leu Gly Glu Ala Glu Val Leu Ile Ala 100 105 110 Gly Gly Ile Glu Asn Met Ser Gln Ala Pro Lys Leu Gln Arg Phe Asn 115 120 125 Tyr Glu Thr Glu Ser Tyr Asp Ala Pro Phe Ser Ser Met Met Tyr Asp 130 135 140 Gly Leu Thr Asp Ala Phe Ser Gly Gln Ala Met Gly Leu Thr Ala Glu 145 150 155 160 Asn Val Ala Glu Lys Tyr His Val Thr Arg Glu Glu Gln Asp Gln Phe 165 170 175 Ser Val His Ser Gln Leu Lys Ala Ala Gln Ala Gln Ala Glu Gly Ile 180 185 190 Phe Ala Asp Glu Ile Ala Pro Leu Glu Val Ser Gly Thr Leu Val Glu 195 200 205 Lys Asp Glu Gly Ile Arg Pro Asn Ser Ser Val Glu Lys Leu Gly Thr 210 215 220 Leu Lys Thr Val Phe Lys Glu Asp Gly Thr Val Thr Ala Gly Asn Ala 225 230 235 240 Ser Thr Ile Asn Asp Gly Ala Ser Ala Leu Ile Ile Ala Ser Gln Glu 245 250 255 Tyr Ala Glu Ala His Gly Leu Pro Tyr Leu Ala Ile Ile Arg Asp Ser 260 265 270 Val Glu Val Gly Ile Asp Pro Ala Tyr Met Gly Ile Ser Pro Ile Lys 275 280 285 Ala Ile Gln Lys Leu Leu Ala Arg Asn Gln Leu Thr Thr Glu Glu Ile 290 295 300 Asp Leu Tyr Glu Ile Asn Glu Ala Phe Ala Ala Thr Ser Ile Val Val 305 310 315 320 Gln Arg Glu Leu Ala Leu Pro Glu Glu Lys Val Asn Ile Tyr Gly Gly 325 330 335 Gly Ile Ser Leu Gly His Ala Ile Gly Ala Thr Gly Ala Arg Leu Leu 340 345 350 Thr Ser Leu Ser Tyr Gln Leu Asn Gln Lys Glu Lys Lys Tyr Gly Val 355 360 365 Ala Ser Leu Cys Ile Gly Gly Gly Leu Gly Leu Ala Met Leu Leu Glu 370 375 380 Arg Pro Gln Gln Lys Lys Asn Ser Arg Phe Tyr Gln Met Ser Pro Glu 385 390 395 400 Glu Arg Leu Ala Ser Leu Leu Asn Glu Gly Gln Ile Ser Ala Asp Thr 405 410 415 Lys Lys Glu Phe Glu Asn Thr Ala Leu Ser Ser Gln Ile Ala Asn His 420 425 430 Met Ile Glu Asn Gln Ile Ser Glu Thr Glu Val Pro Met Gly Val Gly 435 440 445 Leu His Leu Thr Val Asp Glu Thr Asp Tyr Leu Val Pro Met Ala Thr 450 455 460 Glu Glu Pro Ser Val Ile Ala Ala Leu Ser Asn Gly Ala Lys Ile Ala 465 470 475 480 Gln Gly Phe Lys Thr Val Asn Gln Gln Arg Leu Met Arg Gly Gln Ile 485 490 495 Val Phe Tyr Asp Val Ala Asp Ala Glu Ser Leu Ile Asp Glu Leu Gln 500 505 510 Val Arg Glu Thr Glu Ile Phe Gln Gln Ala Glu Leu Ser Tyr Pro Ser 515 520 525 Ile Val Lys Arg Gly Gly Gly Leu Arg Asp Leu Gln Tyr Arg Ala Phe 530 535 540 Asp Glu Ser Phe Val Ser Val Asp Phe Leu Val Asp Val Lys Asp Ala 545 550 555 560 Met Gly Ala Asn Ile Val Asn Ala Met Leu Glu Gly Val Ala Glu Leu 565 570 575 Phe Arg Glu Trp Phe Ala Glu Gln Lys Ile Leu Phe Ser Ile Leu Ser 580 585 590 Asn Tyr Ala Thr Glu Ser Val Val Thr Met Lys Thr Ala Ile Pro Val 595 600 605 Ser Arg Leu Ser Lys Gly Ser Asn Gly Arg Glu Ile Ala Glu Lys Ile 610 615 620 Val Leu Ala Ser Arg Tyr Ala Ser Leu Asp Pro Tyr Arg Ala Val Thr 625 630 635 640 His Asn Lys Gly Ile Met Asn Gly Ile Glu Ala Val Val Leu Ala Thr 645 650 655 Gly Asn Asp Thr Arg Ala Val Ser Ala Ser Cys His Ala Phe Ala Val 660 665 670 Lys Glu Gly Arg Tyr Gln Gly Leu Thr Ser Trp Thr Leu Asp Gly Glu 675 680 685 Gln Leu Ile Gly Glu Ile Ser Val Pro Leu Ala Leu Ala Thr Val Gly 690 695 700 Gly Ala Thr Lys Val Leu Pro Lys Ser Gln Ala Ala Ala Asp Leu Leu 705 710 715 720 Ala Val Thr Asp Ala Lys Glu Leu Ser Arg Val Val Ala Ala Val Gly 725 730 735 Leu Ala Gln Asn Leu Ala Ala Leu Arg Ala Leu Val Ser Glu Gly Ile 740 745 750 Gln Lys Gly His Met Ala Leu Gln Ala Arg Ser Leu Ala Met Thr Val 755 760 765 Gly Ala Thr Gly Lys Glu Val Glu Ala Val Ala Gln Gln Leu Lys Arg 770 775 780 Gln Lys Thr Met Asn Gln Asp Arg Ala Leu Ala Ile Leu Asn Asp Leu 785 790 795 800 Arg Lys Gln <210> 2 <211> 383 <212> PRT <213> Enterococcus faecalis <400> 2 Met Thr Ile Gly Ile Asp Lys Ile Ser Phe Phe Val Pro Pro Tyr Tyr 1 5 10 15 Ile Asp Met Thr Ala Leu Ala Glu Ala Arg Asn Val Asp Pro Gly Lys 20 25 30 Phe His Ile Gly Ile Gly Gln Asp Gln Met Ala Val Asn Pro Ile Ser 35 40 45 Gln Asp Ile Val Thr Phe Ala Ala Asn Ala Ala Glu Ala Ile Leu Thr 50 55 60 Lys Glu Asp Lys Glu Ala Ile Asp Met Val Ile Val Gly Thr Glu Ser 65 70 75 80 Ser Ile Asp Glu Ser Lys Ala Ala Ala Val Val Leu His Arg Leu Met 85 90 95 Gly Ile Gln Pro Phe Ala Arg Ser Phe Glu Ile Lys Glu Ala Cys Tyr 100 105 110 Gly Ala Thr Ala Gly Leu Gln Leu Ala Lys Asn His Val Ala Leu His 115 120 125 Pro Asp Lys Lys Val Leu Val Val Ala Ala Asp Ile Ala Lys Tyr Gly 130 135 140 Leu Asn Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met 145 150 155 160 Leu Val Ala Ser Glu Pro Arg Ile Leu Ala Leu Lys Glu Asp Asn Val 165 170 175 Met Leu Thr Gln Asp Ile Tyr Asp Phe Trp Arg Pro Thr Gly His Pro 180 185 190 Tyr Pro Met Val Asp Gly Pro Leu Ser Asn Glu Thr Tyr Ile Gln Ser 195 200 205 Phe Ala Gln Val Trp Asp Glu His Lys Lys Arg Thr Gly Leu Asp Phe 210 215 220 Ala Asp Tyr Asp Ala Leu Ala Phe His Ile Pro Tyr Thr Lys Met Gly 225 230 235 240 Lys Lys Ala Leu Leu Ala Lys Ile Ser Asp Gln Thr Glu Ala Glu Gln 245 250 255 Glu Arg Ile Leu Ala Arg Tyr Glu Glu Ser Ile Ile Tyr Ser Arg Arg 260 265 270 Val Gly Asn Leu Tyr Thr Gly Ser Leu Tyr Leu Gly Leu Ile Ser Leu 275 280 285 Leu Glu Asn Ala Thr Thr Leu Thr Ala Gly Asn Gln Ile Gly Leu Phe 290 295 300 Ser Tyr Gly Ser Gly Ala Val Ala Glu Phe Phe Thr Gly Glu Leu Val 305 310 315 320 Ala Gly Tyr Gln Asn His Leu Gln Lys Glu Thr His Leu Ala Leu Leu 325 330 335 Asp Asn Arg Thr Glu Leu Ser Ile Ala Glu Tyr Glu Ala Met Phe Ala 340 345 350 Glu Thr Leu Asp Thr Asp Ile Asp Gln Thr Leu Glu Asp Glu Leu Lys 355 360 365 Tyr Ser Ile Ser Ala Ile Asn Asn Thr Val Arg Ser Tyr Arg Asn 370 375 380 <210> 3 <211> 292 <212> PRT <213> Streptococcus pneumoniae <400> 3 Met Thr Lys Lys Val Gly Val Gly Gln Ala His Ser Lys Ile Ile Leu 1 5 10 15 Ile Gly Glu His Ala Val Val Tyr Gly Tyr Pro Ala Ile Ser Leu Pro 20 25 30 Leu Leu Glu Val Glu Val Thr Cys Lys Val Val Ser Ala Glu Ser Pro 35 40 45 Trp Arg Leu Tyr Glu Glu Asp Thr Leu Ser Met Ala Val Tyr Ala Ser 50 55 60 Leu Glu Tyr Leu Asp Ile Thr Glu Ala Cys Val Arg Cys Glu Ile Asp 65 70 75 80 Ser Ala Ile Pro Glu Lys Arg Gly Met Gly Ser Ser Ala Ala Ile Ser 85 90 95 Ile Ala Ala Ile Arg Ala Val Phe Asp Tyr Tyr Gln Ala Asp Leu Pro 100 105 110 His Asp Val Leu Glu Ile Leu Val Asn Arg Ala Glu Met Ile Ala His 115 120 125 Met Asn Pro Ser Gly Leu Asp Ala Lys Thr Cys Leu Ser Asp Gln Pro 130 135 140 Ile Arg Phe Ile Lys Asn Val Gly Phe Thr Glu Leu Glu Met Asp Leu 145 150 155 160 Ser Ala Tyr Leu Val Ile Ala Asp Thr Gly Val Tyr Gly His Thr Arg 165 170 175 Glu Ala Ile Gln Val Val Gln Asn Lys Gly Lys Asp Ala Leu Pro Phe 180 185 190 Leu His Ala Leu Gly Glu Leu Thr Gln Gln Ala Glu Val Ala Ile Ser 195 200 205 Gln Lys Tyr Ala Glu Gly Leu Gly Leu Ile Phe Ser Gln Ala His Leu 210 215 220 His Leu Lys Glu Ile Gly Val Ser Ser Pro Glu Ala Asp Phe Leu Val 225 230 235 240 Glu Thr Ala Leu Ser Tyr Gly Ala Leu Gly Ala Lys Met Ser Gly Gly 245 250 255 Gly Leu Gly Gly Cys Ile Ile Ala Leu Val Thr Asn Leu Thr His Ala 260 265 270 Gln Glu Leu Ala Glu Arg Leu Glu Glu Lys Gly Ala Val Gln Thr Trp 275 280 285 Ile Glu Ser Leu 290 <210> 4 <211> 336 <212> PRT <213> Streptococcus pneumoniae <400> 4 Met Ile Ala Val Lys Thr Cys Gly Lys Leu Tyr Trp Ala Gly Glu Tyr 1 5 10 15 Ala Ile Leu Glu Pro Gly Gln Leu Ala Leu Ile Lys Asp Ile Pro Ile 20 25 30 Tyr Met Arg Ala Glu Ile Ala Phe Ser Asp Ser Tyr Arg Ile Tyr Ser 35 40 45 Asp Met Phe Asp Phe Ala Val Asp Leu Arg Pro Asn Pro Asp Tyr Ser 50 55 60 Leu Ile Gln Glu Thr Ile Ala Leu Met Gly Asp Phe Leu Ala Val Arg 65 70 75 80 Gly Gln Asn Leu Arg Pro Phe Ser Leu Lys Ile Cys Gly Lys Met Glu 85 90 95 Arg Glu Gly Lys Lys Phe Gly Leu Gly Ser Ser Gly Ser Val Val Val 100 105 110 Leu Val Val Lys Ala Leu Leu Ala Leu Tyr Asn Leu Ser Val Asp Gln 115 120 125 Asn Leu Leu Phe Lys Leu Thr Ser Ala Val Leu Leu Lys Arg Gly Asp 130 135 140 Asn Gly Ser Met Gly Asp Leu Ala Cys Ile Val Ala Glu Asp Leu Val 145 150 155 160 Leu Tyr Gln Ser Phe Asp Arg Gln Lys Ala Ala Ala Trp Leu Glu Glu 165 170 175 Glu Asn Leu Ala Thr Val Leu Glu Arg Asp Trp Gly Phe Phe Ile Ser 180 185 190 Gln Val Lys Pro Thr Leu Glu Cys Asp Phe Leu Val Gly Trp Thr Lys 195 200 205 Glu Val Ala Val Ser Ser His Met Val Gln Gln Ile Lys Gln Asn Ile 210 215 220 Asn Gln Asn Phe Leu Ser Ser Ser Lys Glu Thr Val Val Ser Leu Val 225 230 235 240 Glu Ala Leu Glu Gln Gly Lys Ala Glu Lys Val Ile Glu Gln Val Glu 245 250 255 Val Ala Ser Lys Leu Leu Glu Gly Leu Ser Thr Asp Ile Tyr Thr Pro 260 265 270 Leu Leu Arg Gln Leu Lys Glu Ala Ser Gln Asp Leu Gln Ala Val Ala 275 280 285 Lys Ser Ser Gly Ala Gly Gly Gly Asp Cys Gly Ile Ala Leu Ser Phe 290 295 300 Asp Ala Gln Ser Ser Arg Asn Thr Leu Lys Asn Arg Trp Ala Asp Leu 305 310 315 320 Gly Ile Glu Leu Leu Tyr Gln Glu Arg Ile Gly His Asp Asp Lys Ser 325 330 335 <210> 5 <211> 317 <212> PRT <213> Streptococcus pneumoniae <400> 5 Met Asp Arg Glu Pro Val Thr Val Arg Ser Tyr Ala Asn Ile Ala Ile 1 5 10 15 Ile Lys Tyr Trp Gly Lys Lys Lys Glu Lys Glu Met Val Pro Ala Thr 20 25 30 Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Tyr Thr Glu Thr Thr Leu 35 40 45 Ser Pro Leu Pro Ala Asn Val Thr Ala Asp Glu Phe Tyr Ile Asn Gly 50 55 60 Gln Leu Gln Asn Glu Val Glu His Ala Lys Met Ser Lys Ile Ile Asp 65 70 75 80 Arg Tyr Arg Pro Ala Gly Glu Gly Phe Val Arg Ile Asp Thr Gln Asn 85 90 95 Asn Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser 100 105 110 Ala Leu Val Lys Ala Cys Asn Ala Tyr Phe Lys Leu Gly Leu Asp Arg 115 120 125 Ser Gln Leu Ala Gln Glu Ala Lys Phe Ala Ser Gly Ser Ser Ser Arg 130 135 140 Ser Phe Tyr Gly Pro Leu Gly Ala Trp Asp Lys Asp Ser Gly Glu Ile 145 150 155 160 Tyr Pro Val Glu Thr Asp Leu Lys Leu Ala Met Ile Met Leu Val Leu 165 170 175 Glu Asp Lys Lys Lys Pro Ile Ser Ser Arg Asp Gly Met Lys Leu Cys 180 185 190 Val Glu Thr Ser Thr Thr Phe Asp Asp Trp Val Arg Gln Ser Glu Lys 195 200 205 Asp Tyr Gln Asp Met Leu Ile Tyr Leu Lys Glu Asn Asp Phe Ala Lys 210 215 220 Ile Gly Glu Leu Thr Glu Lys Asn Ala Leu Ala Met His Ala Thr Thr 225 230 235 240 Lys Thr Ala Ser Pro Ala Phe Ser Tyr Leu Thr Asp Ala Ser Tyr Glu 245 250 255 Ala Met Ala Phe Val Arg Gln Leu Arg Glu Lys Gly Glu Ala Cys Tyr 260 265 270 Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Phe Cys Gln Glu Lys 275 280 285 Asp Leu Glu His Leu Ser Glu Ile Phe Gly Gln Arg Tyr Arg Leu Ile 290 295 300 Val Ser Lys Thr Lys Asp Leu Ser Gln Asp Asp Cys Cys 305 310 315 <210> 6 <211> 182 <212> PRT <213> E. coli K12 MG1655 <400> 6 Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Thr 1 5 10 15 Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His 20 25 30 Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val 35 40 45 Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn 50 55 60 Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val 65 70 75 80 Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu 85 90 95 Ser Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile 100 105 110 Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala 115 120 125 Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu 130 135 140 Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro 145 150 155 160 Trp Met Val Met Gln Ala Thr Asn Arg Glu Ala Arg Lys Arg Leu Ser 165 170 175 Ala Phe Thr Gln Leu Lys 180 <210> 7 <211> 307 <212> PRT <213> Pantoea agglomerans <400> 7 Met Val Ser Gly Ser Lys Ala Gly Val Ser Pro His Arg Glu Ile Glu 1 5 10 15 Val Met Arg Gln Ser Ile Asp Asp His Leu Ala Gly Leu Leu Pro Glu 20 25 30 Thr Asp Ser Gln Asp Ile Val Ser Leu Ala Met Arg Glu Gly Val Met 35 40 45 Ala Pro Gly Lys Arg Ile Arg Pro Leu Leu Met Leu Leu Ala Ala Arg 50 55 60 Asp Leu Arg Tyr Gln Gly Ser Met Pro Thr Leu Leu Asp Leu Ala Cys 65 70 75 80 Ala Val Glu Leu Thr His Thr Ala Ser Leu Met Leu Asp Asp Met Pro 85 90 95 Cys Met Asp Asn Ala Glu Leu Arg Arg Gly Gln Pro Thr Thr His Lys 100 105 110 Lys Phe Gly Glu Ser Val Ala Ile Leu Ala Ser Val Gly Leu Leu Ser 115 120 125 Lys Ala Phe Gly Leu Ile Ala Ala Thr Gly Asp Leu Pro Gly Glu Arg 130 135 140 Arg Ala Gln Ala Val Asn Glu Leu Ser Thr Ala Val Gly Val Gln Gly 145 150 155 160 Leu Val Leu Gly Gln Phe Arg Asp Leu Asn Asp Ala Ala Leu Asp Arg 165 170 175 Thr Pro Asp Ala Ile Leu Ser Thr Asn His Leu Lys Thr Gly Ile Leu 180 185 190 Phe Ser Ala Met Leu Gln Ile Val Ala Ile Ala Ser Ala Ser Ser Pro 195 200 205 Ser Thr Arg Glu Thr Leu His Ala Phe Ala Leu Asp Phe Gly Gln Ala 210 215 220 Phe Gln Leu Leu Asp Asp Leu Arg Asp Asp His Pro Glu Thr Gly Lys 225 230 235 240 Asp Arg Asn Lys Asp Ala Gly Lys Ser Thr Leu Val Asn Arg Leu Gly 245 250 255 Ala Asp Ala Ala Arg Gln Lys Leu Arg Glu His Ile Asp Ser Ala Asp 260 265 270 Lys His Leu Thr Phe Ala Cys Pro Gln Gly Gly Ala Ile Arg Gln Phe 275 280 285 Met His Leu Trp Phe Gly His His Leu Ala Asp Trp Ser Pro Val Met 290 295 300 Lys Ile Ala 305 <210> 8 <211> 309 <212> PRT <213> Pantoea agglomerans <400> 8 Met Ser Gln Pro Pro Leu Leu Asp His Ala Thr Gln Thr Met Ala Asn 1 5 10 15 Gly Ser Lys Ser Phe Ala Thr Ala Ala Lys Leu Phe Asp Pro Ala Thr 20 25 30 Arg Arg Ser Val Leu Met Leu Tyr Thr Trp Cys Arg His Cys Asp Asp 35 40 45 Val Ile Asp Asp Gln Thr His Gly Phe Ala Ser Glu Ala Ala Ala Glu 50 55 60 Glu Glu Ala Thr Gln Arg Leu Ala Arg Leu Arg Thr Leu Thr Leu Ala 65 70 75 80 Ala Phe Glu Gly Ala Glu Met Gln Asp Pro Ala Phe Ala Ala Phe Gln 85 90 95 Glu Val Ala Leu Thr His Gly Ile Thr Pro Arg Met Ala Leu Asp His 100 105 110 Leu Asp Gly Phe Ala Met Asp Val Ala Gln Thr Arg Tyr Val Thr Phe 115 120 125 Glu Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu 130 135 140 Met Met Ala Arg Val Met Gly Val Arg Asp Glu Arg Val Leu Asp Arg 145 150 155 160 Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp 165 170 175 Ile Ile Asp Asp Ala Ala Ile Asp Arg Cys Tyr Leu Pro Ala Glu Trp 180 185 190 Leu Gln Asp Ala Gly Leu Thr Pro Glu Asn Tyr Ala Ala Arg Glu Asn 195 200 205 Arg Ala Ala Leu Ala Arg Val Ala Glu Arg Leu Ile Asp Ala Ala Glu 210 215 220 Pro Tyr Tyr Ile Ser Ser Gln Ala Gly Leu His Asp Leu Pro Pro Arg 225 230 235 240 Cys Ala Trp Ala Ile Ala Thr Ala Arg Ser Val Tyr Arg Glu Ile Gly 245 250 255 Ile Lys Val Lys Ala Ala Gly Gly Ser Ala Trp Asp Arg Arg Gln His 260 265 270 Thr Ser Lys Gly Glu Lys Ile Ala Met Leu Met Ala Ala Pro Gly Gln 275 280 285 Val Ile Arg Ala Lys Thr Thr Arg Val Thr Pro Arg Pro Ala Gly Leu 290 295 300 Trp Gln Arg Pro Val 305 <210> 9 <211> 486 <212> PRT <213> Pantoea agglomerans <400> 9 Met Lys Lys Thr Val Val Ile Gly Ala Gly Phe Gly Gly Leu Ala Leu 1 5 10 15 Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Thr Val Leu Leu Glu Gln 20 25 30 Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Trp His Asp Gln Gly Phe 35 40 45 Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp Pro Thr Ala Leu Glu 50 55 60 Ala Leu Phe Thr Leu Ala Gly Arg Arg Met Glu Asp Tyr Val Arg Leu 65 70 75 80 Leu Pro Val Lys Pro Phe Tyr Arg Leu Cys Trp Glu Ser Gly Lys Thr 85 90 95 Leu Asp Tyr Ala Asn Asp Ser Ala Glu Leu Glu Ala Gln Ile Thr Gln 100 105 110 Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Arg Phe Leu Ala Tyr Ser 115 120 125 Gln Ala Val Phe Gln Glu Gly Tyr Leu Arg Leu Gly Ser Val Pro Phe 130 135 140 Leu Ser Phe Arg Asp Met Leu Arg Ala Gly Pro Gln Leu Leu Lys Leu 145 150 155 160 Gln Ala Trp Gln Ser Val Tyr Gln Ser Val Ser Arg Phe Ile Glu Asp 165 170 175 Glu His Leu Arg Gln Ala Phe Ser Phe His Ser Leu Leu Val Gly Gly 180 185 190 Asn Pro Phe Thr Thr Ser Ser Ile Tyr Thr Leu Ile His Ala Leu Glu 195 200 205 Arg Glu Trp Gly Val Trp Phe Pro Glu Gly Gly Thr Gly Ala Leu Val 210 215 220 Asn Gly Met Val Lys Leu Phe Thr Asp Leu Gly Gly Glu Ile Glu Leu 225 230 235 240 Asn Ala Arg Val Glu Glu Leu Val Val Ala Asp Asn Arg Val Ser Gln 245 250 255 Val Arg Leu Ala Asp Gly Arg Ile Phe Asp Thr Asp Ala Val Ala Ser 260 265 270 Asn Ala Asp Val Val Asn Thr Tyr Lys Lys Leu Leu Gly His His Pro 275 280 285 Val Gly Gln Lys Arg Ala Ala Ala Leu Glu Arg Lys Ser Met Ser Asn 290 295 300 Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn Gln Pro His Ser Gln Leu 305 310 315 320 Ala His His Thr Ile Cys Phe Gly Pro Arg Tyr Arg Glu Leu Ile Asp 325 330 335 Glu Ile Phe Thr Gly Ser Ala Leu Ala Asp Asp Phe Ser Leu Tyr Leu 340 345 350 His Ser Pro Cys Val Thr Asp Pro Ser Leu Ala Pro Pro Gly Cys Ala 355 360 365 Ser Phe Tyr Val Leu Ala Pro Val Pro His Leu Gly Asn Ala Pro Leu 370 375 380 Asp Trp Ala Gln Glu Gly Pro Lys Leu Arg Asp Arg Ile Phe Asp Tyr 385 390 395 400 Leu Glu Glu Arg Tyr Met Pro Gly Leu Arg Ser Gln Leu Val Thr Gln 405 410 415 Arg Ile Phe Thr Pro Ala Asp Phe His Asp Thr Leu Asp Ala His Leu 420 425 430 Gly Ser Ala Phe Ser Ile Glu Pro Leu Leu Thr Gln Ser Ala Trp Phe 435 440 445 Arg Pro His Asn Arg Asp Ser Asp Ile Ala Asn Leu Tyr Leu Val Gly 450 455 460 Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly Val Val Ala Ser Ala 465 470 475 480 Lys Ala Thr Ala Ser Leu 485 <210> 10 <211> 382 <212> PRT <213> Pantoea ananatis <400> 10 Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu Ala Asn 1 5 10 15 Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met Arg Ile 20 25 30 Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr Trp Ser 35 40 45 Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile Ala Pro 50 55 60 Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro Thr Arg 65 70 75 80 Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln Arg Phe 85 90 95 Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met Asp Thr 100 105 110 Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys Gly Gln 115 120 125 Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala Ala Asn 130 135 140 Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu Trp Arg 145 150 155 160 Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp Ala Thr 165 170 175 Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro Leu Ser 180 185 190 Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn Ala Thr 195 200 205 Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala Ala Gln 210 215 220 Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly Ala Leu 225 230 235 240 Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln Arg Pro 245 250 255 Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr Thr Gly 260 265 270 Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser Ala Leu 275 280 285 Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His Phe Ala 290 295 300 Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn Arg Met 305 310 315 320 Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met Gln Arg 325 330 335 Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala Gly Lys 340 345 350 Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro Pro Val 355 360 365 Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr His Arg 370 375 380 <210> 11 <211> 620 <212> PRT <213> E. coli K12 MG1655 <400> 11 Met Ser Phe Asp Ile Ala Lys Tyr Pro Thr Leu Ala Leu Val Asp Ser 1 5 10 15 Thr Gln Glu Leu Arg Leu Leu Pro Lys Glu Ser Leu Pro Lys Leu Cys 20 25 30 Asp Glu Leu Arg Arg Tyr Leu Leu Asp Ser Val Ser Arg Ser Ser Gly 35 40 45 His Phe Ala Ser Gly Leu Gly Thr Val Glu Leu Thr Val Ala Leu His 50 55 60 Tyr Val Tyr Asn Thr Pro Phe Asp Gln Leu Ile Trp Asp Val Gly His 65 70 75 80 Gln Ala Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Ile Gly 85 90 95 Thr Ile Arg Gln Lys Gly Gly Leu His Pro Phe Pro Trp Arg Gly Glu 100 105 110 Ser Glu Tyr Asp Val Leu Ser Val Gly His Ser Ser Thr Ser Ile Ser 115 120 125 Ala Gly Ile Gly Ile Ala Val Ala Ala Glu Lys Glu Gly Lys Asn Arg 130 135 140 Arg Thr Val Cys Val Ile Gly Asp Gly Ala Ile Thr Ala Gly Met Ala 145 150 155 160 Phe Glu Ala Met Asn His Ala Gly Asp Ile Arg Pro Asp Met Leu Val 165 170 175 Ile Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val Gly Ala Leu 180 185 190 Asn Asn His Leu Ala Gln Leu Leu Ser Gly Lys Leu Tyr Ser Ser Leu 195 200 205 Arg Glu Gly Gly Lys Lys Val Phe Ser Gly Val Pro Pro Ile Lys Glu 210 215 220 Leu Leu Lys Arg Thr Glu Glu His Ile Lys Gly Met Val Val Pro Gly 225 230 235 240 Thr Leu Phe Glu Glu Leu Gly Phe Asn Tyr Ile Gly Pro Val Asp Gly 245 250 255 His Asp Val Leu Gly Leu Ile Thr Thr Leu Lys Asn Met Arg Asp Leu 260 265 270 Lys Gly Pro Gln Phe Leu His Ile Met Thr Lys Lys Gly Arg Gly Tyr 275 280 285 Glu Pro Ala Glu Lys Asp Pro Ile Thr Phe His Ala Val Pro Lys Phe 290 295 300 Asp Pro Ser Ser Gly Cys Leu Pro Lys Ser Ser Gly Gly Leu Pro Ser 305 310 315 320 Tyr Ser Lys Ile Phe Gly Asp Trp Leu Cys Glu Thr Ala Ala Lys Asp 325 330 335 Asn Lys Leu Met Ala Ile Thr Pro Ala Met Arg Glu Gly Ser Gly Met 340 345 350 Val Glu Phe Ser Arg Lys Phe Pro Asp Arg Tyr Phe Asp Val Ala Ile 355 360 365 Ala Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Ile Gly Gly 370 375 380 Tyr Lys Pro Ile Val Ala Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr 385 390 395 400 Asp Gln Val Leu His Asp Val Ala Ile Gln Lys Leu Pro Val Leu Phe 405 410 415 Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly Gln Thr His Gln 420 425 430 Gly Ala Phe Asp Leu Ser Tyr Leu Arg Cys Ile Pro Glu Met Val Ile 435 440 445 Met Thr Pro Ser Asp Glu Asn Glu Cys Arg Gln Met Leu Tyr Thr Gly 450 455 460 Tyr His Tyr Asn Asp Gly Pro Ser Ala Val Arg Tyr Pro Arg Gly Asn 465 470 475 480 Ala Val Gly Val Glu Leu Thr Pro Leu Glu Lys Leu Pro Ile Gly Lys 485 490 495 Gly Ile Val Lys Arg Arg Gly Glu Lys Leu Ala Ile Leu Asn Phe Gly 500 505 510 Thr Leu Met Pro Glu Ala Ala Lys Val Ala Glu Ser Leu Asn Ala Thr 515 520 525 Leu Val Asp Met Arg Phe Val Lys Pro Leu Asp Glu Ala Leu Ile Leu 530 535 540 Glu Met Ala Ala Ser His Glu Ala Leu Val Thr Val Glu Glu Asn Ala 545 550 555 560 Ile Met Gly Gly Ala Gly Ser Gly Val Asn Glu Val Leu Met Ala His 565 570 575 Arg Lys Pro Val Pro Val Leu Asn Ile Gly Leu Pro Asp Phe Phe Ile 580 585 590 Pro Gln Gly Thr Gln Glu Glu Met Arg Ala Glu Leu Gly Leu Asp Ala 595 600 605 Ala Gly Met Glu Ala Lys Ile Lys Ala Trp Leu Ala 610 615 620 <210> 12 <211> 305 <212> PRT <213> Haematococcus pluvialis <400> 12 Met Leu Arg Ser Leu Leu Arg Gly Leu Thr His Ile Pro Arg Val Asn 1 5 10 15 Ser Ala Gln Gln Pro Ser Cys Ala His Ala Arg Leu Gln Phe Lys Leu 20 25 30 Arg Ser Met Gln Met Thr Leu Met Gln Pro Ser Ile Ser Ala Asn Leu 35 40 45 Ser Arg Ala Glu Asp Arg Thr Asp His Met Arg Gly Ala Ser Thr Trp 50 55 60 Ala Gly Gly Gln Ser Gln Asp Glu Leu Met Leu Lys Asp Glu Cys Ile 65 70 75 80 Leu Val Asp Val Glu Asp Asn Ile Thr Gly His Ala Ser Lys Leu Glu 85 90 95 Cys His Lys Phe Leu Pro His Gln Pro Ala Gly Leu Leu His Arg Ala 100 105 110 Phe Ser Val Phe Leu Phe Asp Asp Gln Gly Arg Leu Leu Leu Gln Gln 115 120 125 Arg Ala Arg Ser Lys Ile Thr Phe Pro Ser Val Trp Thr Asn Thr Cys 130 135 140 Cys Ser His Pro Leu His Gly Gln Thr Pro Asp Glu Val Asp Gln Leu 145 150 155 160 Ser Gln Val Ala Asp Gly Thr Val Pro Gly Ala Lys Ala Ala Ala Ile 165 170 175 Arg Lys Leu Glu His Glu Leu Gly Ile Pro Ala His Gln Leu Pro Ala 180 185 190 Ser Ala Phe Arg Phe Leu Thr Arg Leu His Tyr Cys Ala Ala Asp Val 195 200 205 Gln Pro Ala Ala Thr Gln Ser Ala Leu Trp Gly Glu His Glu Met Asp 210 215 220 Tyr Ile Leu Phe Ile Arg Ala Asn Val Thr Leu Ala Pro Asn Pro Asp 225 230 235 240 Glu Val Asp Glu Val Arg Tyr Val Thr Gln Glu Glu Leu Arg Gln Met 245 250 255 Met Gln Pro Asp Asn Gly Leu Gln Trp Ser Pro Trp Phe Arg Ile Ile 260 265 270 Ala Ala Arg Phe Leu Glu Arg Trp Trp Ala Asp Leu Asp Ala Ala Leu 275 280 285 Asn Thr Asp Lys His Glu Asp Trp Gly Thr Val His His Ile Asn Glu 290 295 300 Ala 305 <210> 13 <211> 275 <212> PRT <213> Uncultured marine bacterium 66A03 <400> 13 Met Gly Leu Met Leu Ile Asp Trp Cys Ala Leu Ala Leu Val Val Phe 1 5 10 15 Ile Gly Leu Pro His Gly Ala Leu Asp Ala Ala Ile Ser Phe Ser Met 20 25 30 Ile Ser Ser Ala Lys Arg Ile Ala Arg Leu Ala Gly Ile Leu Leu Ile 35 40 45 Tyr Leu Leu Leu Ala Thr Ala Phe Phe Leu Ile Trp Tyr Gln Leu Pro 50 55 60 Ala Phe Ser Leu Leu Ile Phe Leu Leu Ile Ser Ile Ile His Phe Gly 65 70 75 80 Met Ala Asp Phe Asn Ala Ser Pro Ser Lys Leu Lys Trp Pro His Ile 85 90 95 Ile Ala His Gly Gly Val Val Thr Val Trp Leu Pro Leu Ile Gln Lys 100 105 110 Asn Glu Val Thr Lys Leu Phe Ser Ile Leu Thr Asn Gly Pro Thr Pro 115 120 125 Ile Leu Trp Asp Ile Leu Leu Ile Phe Phe Leu Cys Trp Ser Ile Gly 130 135 140 Val Cys Leu His Thr Tyr Glu Thr Leu Arg Ser Lys His Tyr Asn Ile 145 150 155 160 Ala Phe Glu Leu Ile Gly Leu Ile Phe Leu Ala Trp Tyr Ala Pro Pro 165 170 175 Leu Val Thr Phe Ala Thr Tyr Phe Cys Phe Ile His Ser Arg Arg His 180 185 190 Phe Ser Phe Val Trp Lys Gln Leu Gln His Met Ser Ser Lys Lys Met 195 200 205 Met Ile Gly Ser Ala Ile Ile Leu Ser Cys Thr Ser Trp Leu Ile Gly 210 215 220 Gly Gly Ile Tyr Phe Phe Leu Asn Ser Lys Met Ile Ala Ser Glu Ala 225 230 235 240 Ala Leu Gln Thr Val Phe Ile Gly Leu Ala Ala Leu Thr Val Pro His 245 250 255 Met Ile Leu Ile Asp Phe Ile Phe Arg Pro His Ser Ser Arg Ile Lys 260 265 270 Ile Lys Asn 275 <210> 14 <211> 566 <212> PRT <213> Mus musculus <400> 14 Met Glu Ile Ile Phe Gly Gln Asn Lys Lys Glu Gln Leu Glu Pro Val 1 5 10 15 Gln Ala Lys Val Thr Gly Ser Ile Pro Ala Trp Leu Gln Gly Thr Leu 20 25 30 Leu Arg Asn Gly Pro Gly Met His Thr Val Gly Glu Ser Lys Tyr Asn 35 40 45 His Trp Phe Asp Gly Leu Ala Leu Leu His Ser Phe Ser Ile Arg Asp 50 55 60 Gly Glu Val Phe Tyr Arg Ser Lys Tyr Leu Gln Ser Asp Thr Tyr Ile 65 70 75 80 Ala Asn Ile Glu Ala Asn Arg Ile Val Val Ser Glu Phe Gly Thr Met 85 90 95 Ala Tyr Pro Asp Pro Cys Lys Asn Ile Phe Ser Lys Ala Phe Ser Tyr 100 105 110 Leu Ser His Thr Ile Pro Asp Phe Thr Asp Asn Cys Leu Ile Asn Ile 115 120 125 Met Lys Cys Gly Glu Asp Phe Tyr Ala Thr Thr Glu Thr Asn Tyr Ile 130 135 140 Arg Lys Ile Asp Pro Gln Thr Leu Glu Thr Leu Glu Lys Val Asp Tyr 145 150 155 160 Arg Lys Tyr Val Ala Val Asn Leu Ala Thr Ser His Pro His Tyr Asp 165 170 175 Glu Ala Gly Asn Val Leu Asn Met Gly Thr Ser Val Val Asp Lys Gly 180 185 190 Arg Thr Lys Tyr Val Ile Phe Lys Ile Pro Ala Thr Val Pro Asp Ser 195 200 205 Lys Lys Lys Gly Lys Ser Pro Val Lys His Ala Glu Val Phe Cys Ser 210 215 220 Ile Ser Ser Arg Ser Leu Leu Ser Pro Ser Tyr Tyr His Ser Phe Gly 225 230 235 240 Val Thr Glu Asn Tyr Val Val Phe Leu Glu Gln Pro Phe Lys Leu Asp 245 250 255 Ile Leu Lys Met Ala Thr Ala Tyr Met Arg Gly Val Ser Trp Ala Ser 260 265 270 Cys Met Ser Phe Asp Arg Glu Asp Lys Thr Tyr Ile His Ile Ile Asp 275 280 285 Gln Arg Thr Arg Lys Pro Val Pro Thr Lys Phe Tyr Thr Asp Pro Met 290 295 300 Val Val Phe His His Val Asn Ala Tyr Glu Glu Asp Gly Cys Val Leu 305 310 315 320 Phe Asp Val Ile Ala Tyr Glu Asp Ser Ser Leu Tyr Gln Leu Phe Tyr 325 330 335 Leu Ala Asn Leu Asn Lys Asp Phe Glu Glu Lys Ser Arg Leu Thr Ser 340 345 350 Val Pro Thr Leu Arg Arg Phe Ala Val Pro Leu His Val Asp Lys Asp 355 360 365 Ala Glu Val Gly Ser Asn Leu Val Lys Val Ser Ser Thr Thr Ala Thr 370 375 380 Ala Leu Lys Glu Lys Asp Gly His Val Tyr Cys Gln Pro Glu Val Leu 385 390 395 400 Tyr Glu Gly Leu Glu Leu Pro Arg Ile Asn Tyr Ala Tyr Asn Gly Lys 405 410 415 Pro Tyr Arg Tyr Ile Phe Ala Ala Glu Val Gln Trp Ser Pro Val Pro 420 425 430 Thr Lys Ile Leu Lys Tyr Asp Ile Leu Thr Lys Ser Ser Leu Lys Trp 435 440 445 Ser Glu Glu Ser Cys Trp Pro Ala Glu Pro Leu Phe Val Pro Thr Pro 450 455 460 Gly Ala Lys Asp Glu Asp Asp Gly Val Ile Leu Ser Ala Ile Val Ser 465 470 475 480 Thr Asp Pro Gln Lys Leu Pro Phe Leu Leu Ile Leu Asp Ala Lys Ser 485 490 495 Phe Thr Glu Leu Ala Arg Ala Ser Val Asp Ala Asp Met His Leu Asp 500 505 510 Leu His Gly Leu Phe Ile Pro Asp Ala Asp Trp Asn Ala Val Lys Gln 515 520 525 Thr Pro Ala Glu Thr Gln Glu Val Glu Asn Ser Asp His Pro Thr Asp 530 535 540 Pro Thr Ala Pro Glu Leu Ser His Ser Glu Asn Asp Phe Thr Ala Gly 545 550 555 560 His Gly Gly Ser Ser Leu 565 <210> 15 <211> 350 <212> PRT <213> Natronomonas pharaonis ATCC35678 <400> 15 Met Ser Asn Ala Ser Leu Arg Pro Ser Gly Thr Ala Ser Ala Thr Leu 1 5 10 15 Phe Arg Leu Ala Phe Leu Pro Gly Trp Ala Val Ile Ala Ala Thr Thr 20 25 30 Gly Ala Phe Leu Val Gly Ala Ser Leu Pro Leu Thr Tyr Gln Leu Ile 35 40 45 Pro Leu Ala Ala Ser Val Val Leu Leu Gly Leu Pro His Gly Ala Val 50 55 60 Asp His Leu Ala Leu Pro Arg Thr Arg Asn Glu Arg Val Thr Val Arg 65 70 75 80 Trp Leu Ala Ala Ile Gly Val Leu Tyr Ala Val Val Gly Gly Leu Tyr 85 90 95 Ala Ala Val Trp Phe Leu Ala Pro Val Gly Ala Val Ala Ala Phe Ile 100 105 110 Phe Met Thr Trp Val His Trp Gly Gln Gly Glu Ile Tyr Pro Leu Val 115 120 125 Ala Leu Ala Asp Ala Asp His Leu Asp Gly Arg Leu Glu Arg Gly Leu 130 135 140 Thr Ala Ala Ile Arg Gly Ala Leu Pro Met Leu Val Pro Phe Val Ala 145 150 155 160 Phe Pro Asp Gln Tyr Glu Leu Val Val Thr Thr Leu Val Gly Leu Phe 165 170 175 Asp Ala Asp Ala Ala Ala Thr Ala Ala Ala Ala Phe Thr Pro Thr Ala 180 185 190 Arg Leu Ala Val Ala Val Thr Val Gly Gly Leu Val Ala Val Thr Leu 195 200 205 Gly Ile Gly Ala Val Ala Ala Ser Glu Thr Gly Trp Gly Pro Trp Leu 210 215 220 Leu Asp Ala Gly Glu Thr Gly Leu Leu Ile Leu Phe Phe Ala Ala Val 225 230 235 240 Pro Pro Ile Phe Ala Ile Gly Leu Tyr Phe Cys Phe Trp His Ser Leu 245 250 255 Arg His Ile Val Arg Leu Leu Ala Val Asp Asn Arg Ala Ala Pro Ala 260 265 270 Leu Asp Gly Arg Arg Tyr Gly Ala Ala Leu Ala Arg Phe Ala Arg Asp 275 280 285 Ala Ala Pro Leu Ser Ala Ala Ser Leu Val Leu Leu Gly Leu Leu Tyr 290 295 300 Leu Ala Val Pro Gly Ser Val Asp Ser Pro Leu Ser Leu Val Gly Thr 305 310 315 320 Tyr Leu Val Leu Ile Ala Val Leu Thr Leu Pro His Val Val Val Val 325 330 335 Ala Trp Met Asp His Glu Gln Arg Leu Trp Arg Pro Gly Ala 340 345 350 <210> 16 <211> 284 <212> PRT <213> Halobacterium salinarum ATCC700922 <400> 16 Met Pro His Gly Ala Ile Asp Tyr Leu Ala Leu Pro Arg Ala Val Thr 1 5 10 15 Gly Thr Val Thr Val Arg Trp Leu Ala Val Val Gly Val Leu Tyr Leu 20 25 30 Val Leu Gly Gly Gly Tyr Ala Ala Ala Trp Phe Phe Ala Pro Val Pro 35 40 45 Ala Ala Phe Ala Phe Val Ala Ile Thr Trp Leu His Trp Gly Gln Gly 50 55 60 Asp Leu Tyr Pro Leu Leu Asp Phe Leu Asp Val Asp Tyr Leu Asp Thr 65 70 75 80 Arg Pro Arg Arg Ala Ala Thr Val Leu Ile Arg Gly Gly Leu Pro Met 85 90 95 Leu Val Pro Leu Leu Gly Phe Pro Glu Arg Tyr Arg Ser Val Val Asp 100 105 110 Ala Phe Ala Ala Pro Phe Gly Gly Ser Val Gly Asp Leu Ala Val Phe 115 120 125 Asp Pro Arg Val Arg Leu Trp Leu Gly Val Ala Phe Ala Ala Ala Thr 130 135 140 Val Ala Val Leu Ala Ala Gly Arg Arg Arg Thr His Ser Pro Gly Ala 145 150 155 160 Trp Arg Val Asp Ala Ala Glu Thr Leu Leu Leu Trp Val Phe Phe Phe 165 170 175 Val Val Pro Pro Val Phe Ala Val Gly Val Tyr Phe Cys Val Trp His 180 185 190 Ser Val Arg His Val Ala Arg Ala Ile Ala Val Asp Gly Ser Val His 195 200 205 Pro Ser Leu Arg Ala Gly Asp Ile Leu Gly Pro Leu Ala Arg Phe Gly 210 215 220 Val Glu Ala Ala Pro Met Thr Ala Ala Ala Leu Ala Leu Gly Gly Val 225 230 235 240 Leu Trp Trp Ala Val Pro Asn Pro Pro Thr Thr Leu Glu Ser Gly Ala 245 250 255 Ala Leu Tyr Leu Val Leu Ile Ala Val Leu Thr Leu Pro His Val Ala 260 265 270 Val Val Thr Trp Met Asp Arg Val Gln Gly Val Leu 275 280 <210> 17 <211> 284 <212> PRT <213> Halobacterium salinarum ATCC700922 <400> 17 Met Pro His Gly Ala Ile Asp Tyr Leu Ala Leu Pro Arg Ala Val Thr 1 5 10 15 Gly Thr Val Thr Val Arg Trp Leu Ala Val Val Gly Val Leu Tyr Leu 20 25 30 Val Leu Gly Gly Gly Tyr Ala Ala Ala Trp Phe Phe Ala Pro Val Pro 35 40 45 Ala Ala Phe Ala Phe Val Ala Ile Thr Trp Leu His Trp Gly Gln Gly 50 55 60 Asp Leu Tyr Pro Leu Leu Asp Phe Leu Asp Val Asp Tyr Leu Asp Thr 65 70 75 80 Arg Pro Arg Arg Ala Ala Thr Val Leu Ile Arg Gly Gly Leu Pro Met 85 90 95 Leu Val Pro Leu Leu Gly Phe Pro Glu Arg Tyr Arg Ser Val Val Asp 100 105 110 Ala Phe Ala Ala Pro Phe Gly Gly Ser Val Gly Asp Leu Ala Val Phe 115 120 125 Asp Pro Arg Val Arg Leu Trp Leu Gly Val Ala Phe Ala Ala Ala Thr 130 135 140 Val Ala Val Leu Ala Ala Gly Arg Arg Arg Thr His Ser Pro Gly Ala 145 150 155 160 Trp Arg Val Asp Ala Ala Glu Thr Leu Leu Leu Trp Val Phe Phe Phe 165 170 175 Val Val Pro Pro Val Phe Ala Val Gly Val Tyr Phe Cys Val Trp His 180 185 190 Ser Val Arg His Val Ala Arg Ala Ile Ala Val Asp Gly Ser Val His 195 200 205 Pro Ser Leu Arg Ala Gly Asp Ile Leu Gly Pro Leu Ala Arg Phe Gly 210 215 220 Val Glu Ala Ala Pro Met Thr Ala Ala Ala Leu Ala Leu Gly Gly Val 225 230 235 240 Leu Trp Trp Ala Val Pro Asn Pro Pro Thr Thr Leu Glu Ser Gly Ala 245 250 255 Ala Leu Tyr Leu Val Leu Ile Ala Val Leu Thr Leu Pro His Val Ala 260 265 270 Val Val Thr Trp Met Asp Arg Val Gln Gly Val Leu 275 280 <210> 18 <211> 2412 <212> DNA <213> Enterococcus faecalis <400> 18 ttgaaaacag tagttattat tgatgcatta cgaacaccaa ttggaaaata taaaggcagc 60 ttaagtcaag taagtgccgt agacttagga acacatgtta caacacaact tttaaaaaga 120 cattccacta tttctgaaga aattgatcaa gtaatctttg gaaatgtttt acaagctgga 180 aatggccaaa atcccgcacg acaaatagca ataaacagcg gtttatctca tgaaattccc 240 gcaatgacag ttaatgaggt ctgcggatca ggaatgaagg ccgttatttt ggcgaaacaa 300 ttgattcaat taggagaagc ggaagtttta attgctggcg ggattgagaa tatgtcccaa 360 gcacctaaat tacaacgatt taattacgaa acagaaagct atgatgcgcc tttttctagt 420 atgatgtacg atgggttaac ggatgccttt agtggtcaag caatgggctt aactgctgaa 480 aatgtggccg aaaagtatca tgtaactaga gaagagcaag atcaattttc tgtacattca 540 caattaaaag cagctcaagc acaagcagaa gggatattcg ctgacgaaat agccccatta 600 gaagtatcag gaacgcttgt ggagaaagat gaagggattc gccctaattc gagcgttgag 660 aagctaggaa cgcttaaaac agtttttaaa gaagacggta ctgtaacagc agggaatgca 720 tcaaccatta atgatggggc ttctgctttg attattgctt cacaagaata tgccgaagca 780 cacggtcttc cttatttagc tattattcga gacagtgtgg aagtcggtat tgatccagcc 840 tatatgggaa tttcgccgat taaagccatt caaaaactgt tagcgcgcaa tcaacttact 900 acggaagaaa ttgatctgta tgaaatcaac gaagcatttg cagcaacttc aatcgtggtc 960 caaagagaac tggctttacc agaggaaaag gtcaacattt atggtggcgg tatttcatta 1020 ggtcatgcga ttggtgccac aggtgctcgt ttattaacga gtttaagtta tcaattaaat 1080 caaaaagaaa agaaatatgg agtggcttct ttatgtatcg gcggtggctt aggactcgct 1140 atgctactag agagacctca gcaaaaaaaa aacagccgat tttatcaaat gagtcctgag 1200 gaacgcctgg cttctcttct taatgaaggc cagatttctg ctgatacaaa aaaagaattt 1260 gaaaatacgg ctttatcttc gcagattgcc aatcatatga ttgaaaatca aatcagtgaa 1320 acagaagtgc cgatgggcgt tggcttacat ttaacagtgg acgaaactga ttatttggta 1380 ccaatggcga cagaagagcc ctcagtgatt gcggctttga gtaatggtgc aaaaatagca 1440 caaggattta aaacagtgaa tcaacaacgt ttaatgcgtg gacaaatcgt tttttacgat 1500 gttgcagacg ccgagtcatt gattgatgaa ctacaagtaa gagaaacgga aatttttcaa 1560 caagcagagt taagttatcc atctatcgtt aaacgcggcg gcggcttaag agatttgcaa 1620 tatcgtgctt ttgatgaatc atttgtatct gtcgactttt tagtagatgt taaggatgca 1680 atgggggcaa atatcgttaa cgctatgttg gaaggtgtgg ccgagttgtt ccgtgaatgg 1740 tttgcggagc aaaagatttt attcagtatt ttaagtaatt atgccacgga gtcggttgtt 1800 acgatgaaaa cggctattcc agtttcacgt ttaagtaagg ggagcaatgg ccgggaaatt 1860 gctgaaaaaa ttgttttagc ttcacgctat gcttcattag atccttatcg ggcagtcacg 1920 cataacaaag ggatcatgaa tggcattgaa gctgtcgttt tagctacagg aaatgataca 1980 cgcgctgtta gcgcttcttg tcatgctttt gcggtgaagg aaggtcgcta ccaaggtttg 2040 actagttgga cgctggatgg cgaacaacta attggtgaaa tttcagttcc gcttgcgtta 2100 gccacggttg gcggtgccac aaaagtctta cctaaatctc aagcagctgc tgatttgtta 2160 gcagtgacgg atgcaaaaga actaagtcga gtagtagcgg ctgttggttt ggcacaaaat 2220 ttagcggcgt tacgggcctt agtctctgaa ggaattcaaa aaggacacat ggctctacaa 2280 gcacgttctt tagcgatgac ggtcggagct actggtaaag aagttgaggc agtcgctcaa 2340 caattaaaac gtcaaaaaac gatgaaccaa gaccgagcct tggctatttt aaatgattta 2400 agaaaacaat aa 2412 <210> 19 <211> 1152 <212> DNA <213> Enterococcus faecalis <400> 19 atgacaattg ggattgataa aattagtttt tttgtgcccc cttattatat tgatatgacg 60 gcactggctg aagccagaaa tgtagaccct ggaaaatttc atattggtat tgggcaagac 120 caaatggcgg tgaacccaat cagccaagat attgtgacat ttgcagccaa tgccgcagaa 180 gcgatcttga ccaaagaaga taaagaggcc attgatatgg tgattgtcgg gactgagtcc 240 agtatcgatg agtcaaaagc ggccgcagtt gtcttacatc gtttaatggg gattcaacct 300 ttcgctcgct ctttcgaaat caaggaagct tgttacggag caacagcagg cttacagtta 360 gctaagaatc acgtagcctt acatccagat aaaaaagtct tggttgtagc agcagatatt 420 gcaaaatatg gattaaattc tggcggtgag cctacacaag gagctggggc ggttgcaatg 480 ttagttgcta gtgaaccgcg catcttggct ttaaaagagg ataatgtgat gctgacgcaa 540 gatatctatg acttttggcg tccaacaggc catccgtatc ctatggtcga tggtcctttg 600 tcaaacgaaa cctacatcca atcttttgcc caagtctggg atgaacataa aaaaagaacc 660 ggtcttgatt ttgcagatta tgatgcttta gcgttccata ttccttacac aaaaatgggc 720 aaaaaagcct tattagcaaa aatctccgac caaactgaag cagaacagga acgaatttta 780 gcccgttatg aagaaagcat catctatagt cgtcgcgtag gaaacttgta tacgggttca 840 ctttatctgg gactcatttc ccttttagaa aatgcaacga ctttaaccgc aggcaatcaa 900 attgggttat tcagttatgg ttctggtgct gtcgctgaat ttttcactgg tgaattagta 960 gctggttatc aaaatcattt acaaaaagaa actcatttag cactgctaga taatcggaca 1020 gaactttcta tcgctgaata tgaagccatg tttgcagaaa ctttagacac agatattgat 1080 caaacgttag aagatgaatt aaaatatagt atttctgcta ttaataatac cgttcgctct 1140 tatcgaaact aa 1152 <210> 20 <211> 879 <212> DNA <213> Streptococcus pneumoniae <400> 20 atgacaaaaa aagttggtgt cggtcaggca catagtaaga taattttaat aggggaacat 60 gcggtcgttt acggttatcc tgccatttcc ctgcctcttt tggaggtgga ggtgacctgt 120 aaggtagttt ctgcagagag tccttggcgc ctttatgagg aggatacctt gtccatggcg 180 gtttatgcct cactggagta tttggatatc acagaagcct gcgttcgttg tgagattgac 240 tcggctatcc ctgagaaacg ggggatgggt tcgtcagcgg ctatcagcat agcggccatt 300 cgtgcggtat ttgactacta tcaggctgat ctgcctcatg atgtactaga aatcttggtc 360 aatcgagctg agatgattgc ccatatgaat cctagtggtt tggatgctaa gacctgtctc 420 agtgaccaac ctattcgctt tatcaagaac gtaggattta cagaacttga gatggattta 480 tccgcctatt tggtgattgc cgatacgggt gtttatggtc atactcgtga agccatccaa 540 gtggttcaaa ataagggcaa ggatgcccta ccgtttttgc atgccttggg agaattaacc 600 cagcaagcag aagttgcgat ttcacaaaaa tatgctgaag gactgggact aatcttcagt 660 caagctcatt tacatctaaa agaaattgga gtcagtagcc ctgaggcaga ctttttggtt 720 gaaacggctc ttagctatgg tgctctgggt gccaagatga gcggtggtgg gctaggaggt 780 tgtatcatag ccttggtaac caatttgacg cacgcacaag aactagcaga aagattagaa 840 gagaaaggag ctgttcagac atggatagag agcctgtaa 879 <210> 21 <211> 1011 <212> DNA <213> Streptococcus pneumoniae <400> 21 atgattgctg ttaaaacttg cggaaaactc tattgggcag gtgaatatgc tattttagag 60 ccagggcagt tagctttgat aaaggatatt cccatctata tgagggctga gattgctttt 120 tctgacagct accgtatcta ttcagatatg tttgatttcg cagtggactt aaggcccaat 180 cctgactaca gcttgattca agaaacgatt gctttgatgg gagacttcct cgctgttcgc 240 ggtcagaatt taagaccttt ttccctaaaa atctgtggca aaatggaacg agaagggaaa 300 aagtttggtc taggttctag tggcagcgtc gttgtcttgg ttgtcaaggc tttactggct 360 ctctataatc tttcggttga tcagaatctc ttgttcaagc tgactagcgc tgtcttgctc 420 aagcgaggag acaatggttc catgggcgac cttgcctgta ttgtggcaga ggatttggtt 480 ctttaccagt catttgatcg ccagaaggcg gctgcttggt tagaagaaga aaacttggcg 540 acagttctgg agcgtgattg gggatttttt atctcacaag tgaaaccaac tttagaatgt 600 gatttcttag tgggatggac caaggaagtg gctgtatcga gtcacatggt ccagcaaatc 660 aagcaaaata tcaatcaaaa ttttttaagt tcctcaaaag aaacggtggt ttctttggtc 720 gaagccttgg agcaggggaa agccgaaaaa gttatcgagc aagtagaagt agccagcaag 780 cttttagaag gcttgagtac agatatttac acgcctttgc ttagacagtt gaaagaagcc 840 agtcaagatt tgcaggccgt tgccaagagt agtggtgctg gtggtggtga ctgtggcatc 900 gccctgagtt ttgatgcgca atcttctcga aacactttaa aaaatcgttg ggccgatctg 960 gggattgagc tcttatatca agaaaggata ggacatgacg acaaatcgta a 1011 <210> 22 <211> 954 <212> DNA <213> Streptococcus pneumoniae <400> 22 atggatagag agcctgtaac agtacgttcc tacgcaaata ttgctattat caaatattgg 60 ggaaagaaaa aagaaaaaga gatggtgcct gctactagca gtatttctct aactttggaa 120 aatatgtata cagagacgac cttgtcgcct ttaccagcca atgtaacagc tgacgaattt 180 tacatcaatg gtcagctaca aaatgaggtc gagcatgcca agatgagtaa gattattgac 240 cgttatcgtc cagctggtga gggctttgtc cgtatcgata ctcaaaacaa tatgcctacg 300 gcagcgggcc tgtcctcaag ttctagtggt ttgtccgccc tggtcaaggc ttgtaatgct 360 tatttcaagc ttggattgga tagaagtcag ttggcacagg aagccaaatt tgcctcaggc 420 tcttcttctc ggagttttta tggaccacta ggagcctggg ataaggatag tggagaaatt 480 taccctgtag agacagactt gaaactagct atgattatgt tggtgctaga ggacaagaaa 540 aaaccaatct ctagccgtga cgggatgaaa ctttgtgtgg aaacctcgac gacttttgac 600 gactgggttc gtcagtctga gaaggactat caggatatgc tgatttatct caaggaaaat 660 gattttgcca agattggaga attaacggag aaaaatgctc tggctatgca tgctacgaca 720 aagactgcta gtccagcctt ttcttatctg acggatgcct cttatgaggc tatggccttt 780 gttcgccagc ttcgtgagaa aggagaggcc tgctacttta ccatggatgc tggtcccaat 840 gttaaggtct tctgtcagga gaaagacttg gagcatttgt cagaaatttt cggtcagcgt 900 tatcgcttga ttgtgtcaaa aacaaaggat ttgagtcaag atgattgctg ttaa 954 <210> 23 <211> 546 <212> DNA <213> E. coli K12 MG1655 <400> 23 atgcaaacgg aacacgtcat tttattgaat gcacagggag ttcccacggg tacgctggaa 60 aagtatgccg cacacacggc agacacccgc ttacatctcg cgttctccag ttggctgttt 120 aatgccaaag gacaattatt agttacccgc cgcgcactga gcaaaaaagc atggcctggc 180 gtgtggacta actcggtttg tgggcaccca caactgggag aaagcaacga agacgcagtg 240 atccgccgtt gccgttatga gcttggcgtg gaaattacgc ctcctgaatc tatctatcct 300 gactttcgct accgcgccac cgatccgagt ggcattgtgg aaaatgaagt gtgtccggta 360 tttgccgcac gcaccactag tgcgttacag atcaatgatg atgaagtgat ggattatcaa 420 tggtgtgatt tagcagatgt attacacggt attgatgcca cgccgtgggc gttcagtccg 480 tggatggtga tgcaggcgac aaatcgcgaa gccagaaaac gattatctgc atttacccag 540 cttaaa 546 <210> 24 <211> 918 <212> DNA <213> Haematococcus pluvialis <400> 24 atgcttcgtt cgttgctcag aggcctcacg catatccccc gcgtgaactc cgcccagcag 60 cccagctgtg cacacgcgcg actccagttt aagctcagga gcatgcagat gacgctcatg 120 cagcccagca tctcagccaa tctgtcgcgc gccgaggacc gcacagacca catgaggggt 180 gcaagcacct gggcaggcgg gcagtcgcag gatgagctga tgctgaagga cgagtgcatc 240 ttggtggatg ttgaggacaa catcacaggc catgccagca agctggagtg tcacaagttc 300 ctaccacatc agcctgcagg cctgctgcac cgggccttct ctgtgttcct gtttgacgat 360 caggggcgac tgctgctgca acagcgtgca cgctcaaaaa tcaccttccc aagtgtgtgg 420 acgaacacct gctgcagcca ccctttacat gggcagaccc cagatgaggt ggaccaacta 480 agccaggtgg ccgacggaac agtacctggc gcaaaggctg ctgccatccg caagttggag 540 cacgagctgg ggataccagc gcaccagctg ccggcaagcg cgtttcgctt cctcacgcgt 600 ttgcactact gtgccgcgga cgtgcagcca gctgcgacac aatcagcgct ctggggcgag 660 cacgaaatgg actacatctt gttcatccgg gccaacgtca ccttggcgcc caaccctgac 720 gaggtggacg aagtcaggta cgtgacgcaa gaggagctgc ggcagatgat gcagccggac 780 aacgggctgc aatggtcgcc gtggtttcgc atcatcgccg cgcgcttcct tgagcgttgg 840 tgggctgacc tggacgcggc cctaaacact gacaaacacg aggattgggg aacggtgcat 900 cacatcaacg aagcgtga 918 <210> 25 <211> 1884 <212> DNA <213> E. coli K12 MG1655 <400> 25 atggaattca ggaggcccct gatgagtttt gatattgcca aatacccgac cctggcactg 60 gtcgactcca cccaggagtt acgactgttg ccgaaagaga gtttaccgaa actctgcgac 120 gaactgcgcc gctatttact cgacagcgtg agccgttcca gcgggcactt cgcctccggg 180 ctgggcacgg tcgaactgac cgtggcgctg cactatgtct acaacacccc gtttgaccaa 240 ttgatttggg atgtggggca tcaggcttat ccgcataaaa ttttgaccgg acgccgcgac 300 aaaatcggca ccatccgtca gaaaggcggt ctgcacccgt tcccgtggcg cggcgaaagc 360 gaatatgacg tattaagcgt cgggcattca tcaacctcca tcagtgccgg aattggtatt 420 gcggttgctg ccgaaaaaga aggcaaaaat cgccgcaccg tctgtgtcat tggcgatggc 480 gcgattaccg caggcatggc gtttgaagcg atgaatcacg cgggcgatat ccgtcctgat 540 atgctggtga ttctcaacga caatgaaatg tcgatttccg aaaatgtcgg cgcgctcaac 600 aaccatctgg cacagctgct ttccggtaag ctttactctt cactgcgcga aggcgggaaa 660 aaagttttct ctggcgtgcc gccaattaaa gagctgctca aacgcaccga agaacatatt 720 aaaggcatgg tagtgcctgg cacgttgttt gaagagctgg gctttaacta catcggcccg 780 gtggacggtc acgatgtgct ggggcttatc accacgctaa agaacatgcg cgacctgaaa 840 ggcccgcagt tcctgcatat catgaccaaa aaaggtcgtg gttatgaacc ggcagaaaaa 900 gacccgatca ctttccacgc cgtgcctaaa tttgatccct ccagcggttg tttgccgaaa 960 agtagcggcg gtttgccgag ctattcaaaa atctttggcg actggttgtg cgaaacggca 1020 gcgaaagaca acaagctgat ggcgattact ccggcgatgc gtgaaggttc cggcatggtc 1080 gagttttcac gtaaattccc ggatcgctac ttcgacgtgg caattgccga gcaacacgcg 1140 gtgacctttg ctgcgggtct ggcgattggt gggtacaaac ccattgtcgc gatttactcc 1200 actttcctgc aacgcgccta tgatcaggtg ctgcatgacg tggcgattca aaagcttccg 1260 gtcctgttcg ccatcgaccg cgcgggcatt gttggtgctg acggtcaaac ccatcagggt 1320 gcttttgatc tctcttacct gcgctgcata ccggaaatgg tcattatgac cccgagcgat 1380 gaaaacgaat gtcgccagat gctctatacc ggctatcact ataacgatgg cccgtcagcg 1440 gtgcgctacc cgcgtggcaa cgcggtcggc gtggaactga cgccgctgga aaaactacca 1500 attggcaaag gcattgtgaa gcgtcgtggc gagaaactgg cgatccttaa ctttggtacg 1560 ctgatgccag aagcggcgaa agtcgccgaa tcgctgaacg ccacgctggt cgatatgcgt 1620 tttgtgaaac cgcttgatga agcgttaatt ctggaaatgg ccgccagcca tgaagcgctg 1680 gtcaccgtag aagaaaacgc cattatgggc ggcgcaggca gcggcgtgaa cgaagtgctg 1740 atggcccatc gtaaaccagt acccgtgctg aacattggcc tgccggactt ctttattccg 1800 caaggaactc aggaagaaat gcgcgccgaa ctcggcctcg atgccgctgg tatggaagcc 1860 aaaatcaagg cctggctggc ataa 1884 <210> 26 <211> 924 <212> DNA <213> Pantoea agglomerans <400> 26 atggtgagtg gcagtaaagc gggcgtttcg cctcatcgcg aaatagaagt aatgagacaa 60 tccattgacg atcacctggc tggcctgtta cctgaaaccg acagccagga tatcgtcagc 120 cttgcgatgc gtgaaggcgt catggcaccc ggtaaacgga tccgtccgct gctgatgctg 180 ctggccgccc gcgacctccg ctaccagggc agtatgccta cgctgctcga tctcgcctgc 240 gccgttgaac tgacccatac cgcgtcgctg atgctcgacg acatgccctg catggacaac 300 gccgagctgc gccgcggtca gcccactacc cacaaaaaat ttggtgagag cgtggcgatc 360 cttgcctccg ttgggctgct ctctaaagcc tttggtctga tcgccgccac cggcgatctg 420 ccgggggaga ggcgtgccca ggcggtcaac gagctctcta ccgccgtggg cgtgcagggc 480 ctggtactgg ggcagtttcg cgatcttaac gatgccgccc tcgaccgtac ccctgacgct 540 atcctcagca ccaaccacct caagaccggc attctgttca gcgcgatgct gcagatcgtc 600 gccattgctt ccgcctcgtc gccgagcacg cgagagacgc tgcacgcctt cgccctcgac 660 ttcggccagg cgtttcaact gctggacgat ctgcgtgacg atcacccgga aaccggtaaa 720 gatcgcaata aggacgcggg aaaatcgacg ctggtcaacc ggctgggcgc agacgcggcc 780 cggcaaaagc tgcgcgagca tattgattcc gccgacaaac acctcacttt tgcctgtccg 840 cagggcggcg ccatccgaca gtttatgcat ctgtggtttg gccatcacct tgccgactgg 900 tcaccggtca tgaaaatcgc ctga 924 <210> 27 <211> 930 <212> DNA <213> Pantoea agglomerans <400> 27 atgagccaac cgccgctgct tgaccacgcc acgcagacca tggccaacgg ctcgaaaagt 60 tttgccaccg ctgcgaagct gttcgacccg gccacccgcc gtagcgtgct gatgctctac 120 acctggtgcc gccactgcga tgacgtcatt gacgaccaga cccacggctt cgccagcgag 180 gccgcggcgg aggaggaggc cacccagcgc ctggcccggc tgcgcacgct gaccctggcg 240 gcgtttgaag gggccgagat gcaggatccg gccttcgctg cctttcagga ggtggcgctg 300 acccacggta ttacgccccg catggcgctc gatcacctcg acggctttgc gatggacgtg 360 gctcagaccc gctatgtcac ctttgaggat acgctgcgct actgctatca cgtggcgggc 420 gtggtgggtc tgatgatggc cagggtgatg ggcgtgcggg atgagcgggt gctggatcgc 480 gcctgcgatc tggggctggc cttccagctg acgaatatcg cccgggatat tattgacgat 540 gcggctattg accgctgcta tctgcccgcc gagtggctgc aggatgccgg gctgaccccg 600 gagaactatg ccgcgcggga gaatcgggcc gcgctggcgc gggtggcgga gcggcttatt 660 gatgccgcag agccgtacta catctcctcc caggccgggc tacacgatct gccgccgcgc 720 tgcgcctggg cgatcgccac cgcccgcagc gtctaccggg agatcggtat taaggtaaaa 780 gcggcgggag gcagcgcctg ggatcgccgc cagcacacca gcaaaggtga aaaaattgcc 840 atgctgatgg cggcaccggg gcaggttatt cgggcgaaga cgacgagggt gacgccgcgt 900 ccggccggtc tttggcagcg tcccgtttag 930 <210> 28 <211> 1459 <212> DNA <213> Pantoea agglomerans <400> 28 atgaaaaaaa ccgttgtgat tggcgcaggc tttggtggcc tggcgctggc gattcgcctg 60 caggcggcag ggatcccaac cgtactgctg gagcagcggg acaagcccgg cggtcgggcc 120 tacgtctggc atgaccaggg ctttaccttt gacgccgggc cgacggtgat caccgatcct 180 accgcgcttg aggcgctgtt caccctggcc ggcaggcgca tggaggatta cgtcaggctg 240 ctgccggtaa aacccttcta ccgactctgc tgggagtccg ggaagaccct cgactatgct 300 aacgacagcg ccgagcttga ggcgcagatt acccagttca acccccgcga cgtcgagggc 360 taccggcgct ttctggctta ctcccaggcg gtattccagg agggatattt gcgcctcggc 420 agcgtgccgt tcctctcttt tcgcgacatg ctgcgcgccg ggccgcagct gcttaagctc 480 caggcgtggc agagcgtcta ccagtcggtt tcgcgcttta ttgaggatga gcatctgcgg 540 caggccttct cgttccactc cctgctggta ggcggcaacc ccttcaccac ctcgtccatc 600 tacaccctga tccacgccct tgagcgggag tggggggtct ggttccctga gggcggcacc 660 ggggcgctgg tgaacggcat ggtgaagctg tttaccgatc tgggcgggga gatcgaactc 720 aacgcccggg tcgaagagct ggtggtggcc gataaccgcg taagccaggt ccggctggcg 780 gatggtcgga tctttgacac cgacgccgta gcctcgaacg ctgacgtggt gaacacctat 840 aaaaagctgc tcggccacca tccggtgggg cagaagcggg cggcagcgct ggagcgcaag 900 agcatgagca actcgctgtt tgtgctctac ttcggcctga accagcctca ttcccagctg 960 gcgcaccata ccatctgttt tggtccccgc taccgggagc tgatcgacga gatctttacc 1020 ggcagcgcgc tggcggatga cttctcgctc tacctgcact cgccctgcgt gaccgatccc 1080 tcgctcgcgc ctcccggctg cgccagcttc tacgtgctgg ccccggtgcc gcatcttggc 1140 aacgcgccgc tggactgggc gcaggagggg ccgaagctgc gcgaccgcat ctttgactac 1200 cttgaagagc gctatatgcc cggcctgcgt agccagctgg tgacccagcg gatctttacc 1260 ccggcagact tccacgacac gctggatgcg catctgggat cggccttctc catcgagccg 1320 ctgctgaccc aaagcgcctg gttccgcccg cacaaccgcg acagcgacat tgccaacctc 1380 tacctggtgg gcgcaggtac tcaccctggg gcgggcattc ctggcgtagt ggcctcggcg 1440 aaagccaccg ccagcctga 1459 <210> 29 <211> 1149 <212> DNA <213> Pantoea ananatis <400> 29 atgcaaccgc attatgatct gattctcgtg ggggctggac tcgcgaatgg ccttatcgcc 60 ctgcgtcttc agcagcagca acctgatatg cgtattttgc ttatcgacgc cgcaccccag 120 gcgggcggga atcatacgtg gtcatttcac cacgatgatt tgactgagag ccaacatcgt 180 tggatagctc cgctggtggt tcatcactgg cccgactatc aggtacgctt tcccacacgc 240 cgtcgtaagc tgaacagcgg ctacttttgt attacttctc agcgtttcgc tgaggtttta 300 cagcgacagt ttggcccgca cttgtggatg gataccgcgg tcgcagaggt taatgcggaa 360 tctgttcggt tgaaaaaggg tcaggttatc ggtgcccgcg cggtgattga cgggcggggt 420 tatgcggcaa attcagcact gagcgtgggc ttccaggcgt ttattggcca ggaatggcga 480 ttgagccacc cgcatggttt atcgtctccc attatcatgg atgccacggt cgatcagcaa 540 aatggttatc gcttcgtgta cagcctgccg ctctcgccga ccagattgtt aattgaagac 600 acgcactata ttgataatgc gacattagat cctgaatgcg cgcggcaaaa tatttgcgac 660 tatgccgcgc aacagggttg gcagcttcag acactgctgc gagaagaaca gggcgcctta 720 cccattactc tgtcgggcaa tgccgacgca ttctggcagc agcgccccct ggcctgtagt 780 ggattacgtg ccggtctgtt ccatcctacc accggctatt cactgccgct ggcggttgcc 840 gtggccgacc gcctgagtgc acttgatgtc tttacgtcgg cctcaattca ccatgccatt 900 acgcattttg cccgcgagcg ctggcagcag cagggctttt tccgcatgct gaatcgcatg 960 ctgtttttag ccggacccgc cgattcacgc tggcgggtta tgcagcgttt ttatggttta 1020 cctgaagatt taattgcccg tttttatgcg ggaaaactca cgctgaccga tcggctacgt 1080 attctgagcg gcaagccgcc tgttccggta ttagcagcat tgcaagccat tatgacgact 1140 catcgttaa 1149 <210> 30 <211> 4176 <212> DNA <213> Artificial Sequence <220> <223> pTrc99A vector <400> 30 gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60 ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120 gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180 tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240 taacaatttc acacaggaaa cagaccatgg aattcgagct cggtacccgg ggatcctcta 300 gagtcgacct gcaggcatgc aagcttggct gttttggcgg atgagagaag attttcagcc 360 tgatacagat taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca 420 gtagcgcggt ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg 480 atggtagtgt ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga 540 aaggctcagt cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc 600 ctgagtagga caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg 660 tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg 720 acggatggcc tttttgcgtt tctacaaact ctttttgttt atttttctaa atacattcaa 780 atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 840 agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 900 ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 960 gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 1020 gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 1080 tatcccgtgt tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 1140 acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 1200 aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 1260 cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 1320 gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 1380 cgatgcctac agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 1440 tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 1500 tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 1560 ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 1620 tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 1680 gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 1740 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1800 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1860 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1920 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1980 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 2040 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 2100 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 2160 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 2220 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 2280 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 2340 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 2400 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 2460 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 2520 acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 2580 gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 2640 cggaagagcg cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca 2700 tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc 2760 gctatcgcta cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc 2820 gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 2880 gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa 2940 ttcgcgcgcg aaggcgaagc ggcatgcatt tacgttgaca ccatcgaatg gtgcaaaacc 3000 tttcgcggta tggcatgata gcgcccggaa gagagtcaat tcagggtggt gaatgtgaaa 3060 ccagtaacgt tatacgatgt cgcagagtat gccggtgtct cttatcagac cgtttcccgc 3120 gtggtgaacc aggccagcca cgtttctgcg aaaacgcggg aaaaagtgga agcggcgatg 3180 gcggagctga attacattcc caaccgcgtg gcacaacaac tggcgggcaa acagtcgttg 3240 ctgattggcg ttgccacctc cagtctggcc ctgcacgcgc cgtcgcaaat tgtcgcggcg 3300 attaaatctc gcgccgatca actgggtgcc agcgtggtgg tgtcgatggt agaacgaagc 3360 ggcgtcgaag cctgtaaagc ggcggtgcac aatcttctcg cgcaacgcgt cagtgggctg 3420 atcattaact atccgctgga tgaccaggat gccattgctg tggaagctgc ctgcactaat 3480 gttccggcgt tatttcttga tgtctctgac cagacaccca tcaacagtat tattttctcc 3540 catgaagacg gtacgcgact gggcgtggag catctggtcg cattgggtca ccagcaaatc 3600 gcgctgttag cgggcccatt aagttctgtc tcggcgcgtc tgcgtctggc tggctggcat 3660 aaatatctca ctcgcaatca aattcagccg atagcggaac gggaaggcga ctggagtgcc 3720 atgtccggtt ttcaacaaac catgcaaatg ctgaatgagg gcatcgttcc cactgcgatg 3780 ctggttgcca acgatcagat ggcgctgggc gcaatgcgcg ccattaccga gtccgggctg 3840 cgcgttggtg cggatatctc ggtagtggga tacgacgata ccgaagacag ctcatgttat 3900 atcccgccgt caaccaccat caaacaggat tttcgcctgc tggggcaaac cagcgtggac 3960 cgcttgctgc aactctctca gggccaggcg gtgaagggca atcagctgtt gcccgtctca 4020 ctggtgaaaa gaaaaaccac cctggcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 4080 gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg 4140 caacgcaatt aatgtgagtt agcgcgaatt gatctg 4176 <210> 31 <211> 828 <212> DNA <213> Uncultured marine bacterium 66A03 <220> <221> misc_feature <222> (1)..(828) <223> blh gene : DQ065755 <400> 31 atgggcttga tgttaattga ttggtgtgct ttagcattgg ttgtgtttat tggtttgcca 60 catggtgcct tagatgctgc tatttctttt tcaatgattt cttcagcaaa gagaattgct 120 agattagcag gaatactatt aatttacctg ttgttagcaa ccgcattttt tttaatttgg 180 tatcaattac cagcattttc tcttcttatt tttcttttga taagcataat ccattttgga 240 atggctgatt tcaatgcatc cccaagtaaa cttaagtggc ctcatattat tgcacatggc 300 ggcgttgtta ctgtttggtt gccgcttatc caaaaaaatg aagttacgaa gctattttca 360 atattaacaa atggtccaac tcccatttta tgggacatac tattgatatt ttttttatgt 420 tggagcatag gagtatgtct tcatacctat gaaactttac gttctaaaca ttataatatc 480 gcctttgaac ttattggatt aatttttcta gcctggtatg cacccccact cgttactttt 540 gccacatact tctgctttat ccacagcaga cgtcacttta gttttgtttg gaaacagtta 600 cagcatatga gttcaaaaaa aatgatgata ggtagtgcca ttattttatc ttgtacgagc 660 tggttgatag gcggaggaat atattttttc ctcaattcga aaatgattgc cagtgaagct 720 gctttacaaa ctgtctttat tggtcttgca gctttaacag ttcctcacat gatacttatc 780 gactttatat ttagaccaca ctcttccaga attaaaatca aaaattga 828 <210> 32 <211> 828 <212> DNA <213> Artificial Sequence <220> <223> E. coli codon optimized blh gene of uncultured marine bacterium 66A03 <400> 32 atgggtctga tgctgattga ttggtgtgca ctggctctgg ttgttttcat tggcctgccg 60 cacggcgcgc tggatgctgc catttctttt tctatgatct cttctgcaaa acgcattgct 120 cgtctggctg gtattctgct gatctatctg ctgctggcga ccgcgttctt cctgatctgg 180 tatcagctgc cagcgtttag cctgctgatc ttcctgctga tctccattat ccactttggt 240 atggcagact tcaacgcgtc cccaagcaaa ctgaaatggc cgcatatcat cgcccacggc 300 ggtgttgtta ctgtttggct gccgctgatc cagaaaaacg aagtaactaa actgtttagc 360 atcctgacta acggtccgac tccgatcctg tgggacatcc tgctgatttt cttcctgtgt 420 tggtctattg gcgtgtgtct gcacacgtac gaaaccctgc gctctaaaca ttacaacatc 480 gcctttgaac tgatcggtct gattttcctg gcgtggtatg cgccgcctct ggttacgttt 540 gccacttact tctgcttcat tcattcccgt cgccacttct cctttgtgtg gaagcagctg 600 caacacatgt cttccaaaaa gatgatgatt ggcagcgcga ttatcctgtc ctgtacctct 660 tggctgatcg gcggtggtat ctatttcttc ctgaactcca aaatgatcgc ctctgaggct 720 gcgctgcaga ctgtgttcat cggtctggcg gcactgaccg tgccgcacat gattctgatc 780 gacttcatct tccgtccgca ctcttcccgt atcaaaatca aaaactaa 828 <210> 33 <211> 1701 <212> DNA <213> Mus musculus <400> 33 atggagataa tatttggcca gaataagaaa gaacagctgg agccagttca ggccaaagtg 60 acaggcagca ttccagcatg gctgcagggg accctgctcc gaaacgggcc cgggatgcac 120 acagtgggag agagcaagta caaccattgg tttgatggcc tggcccttct ccacagtttc 180 tccatcagag atggggaggt cttctacagg agcaaatacc tgcagagtga cacctacatc 240 gccaacattg aggccaacag aatcgtggtg tctgagttcg gaaccatggc ctacccggac 300 ccctgcaaaa acatcttttc caaagctttc tcctacttgt ctcacaccat ccccgacttc 360 acagacaact gtctgatcaa catcatgaaa tgtggagaag acttctatgc aaccacggag 420 accaactaca tcaggaaaat cgacccccag accctagaga ccttggagaa ggttgattac 480 cggaagtatg tggcggtaaa cctggctacc tcgcaccctc attatgacga ggctgggaat 540 gtccttaaca tgggcacatc cgtcgtggac aaagggagga caaaatacgt gatatttaag 600 atccctgcca cagtgccaga cagcaagaag aaagggaaga gtcccgtgaa gcacgcggaa 660 gttttctgct ccatttcctc ccgctcgctg ctctctccca gctactacca cagctttggt 720 gtcacggaga actatgtggt gtttctggag cagcctttta agttggatat cctcaagatg 780 gccaccgcat acatgagggg agtgagctgg gcttcctgta tgtcattcga cagggaggac 840 aagacataca ttcatatcat cgaccagagg accaggaagc ctgtgcctac caagttctac 900 acagatccca tggtggtctt ccatcatgtc aatgcctacg aggaggacgg ctgtgtgctg 960 tttgatgtga tcgcctatga ggacagcagc ctctatcagc tcttctacct ggccaacctg 1020 aacaaggact tcgaggagaa gtccaggctg acctcagtgc ctaccctcag gaggtttgct 1080 gtgcccctcc atgtggacaa ggatgcagaa gtgggctcaa atttagtcaa ggtgtcatct 1140 acaactgcaa cagccctgaa ggagaaagac ggccatgtct attgccagcc cgaggtcctc 1200 tacgaaggcc tagagctccc tcggataaat tatgcttaca acgggaagcc atatcgctac 1260 atctttgcag ctgaagtaca gtggagtcca gtcccaacca agatactgaa atatgacatt 1320 ctcacaaagt cctccttaaa gtggtctgag gagagctgct ggccagcaga gcctctgttt 1380 gttcccacgc caggtgcgaa ggatgaagat gatggagtca ttttatcagc catcgtctct 1440 acggatcccc aaaagctgcc ttttttactc attctggatg ccaaaagttt tacggaactg 1500 gctcgcgcct ctgttgatgc ggacatgcac ctggaccttc atggtttatt tatcccagat 1560 gcagactgga atgcagtgaa gcagactcca gctgaaacgc aagaggttga aaactcagat 1620 catcccacag atccgacagc accagaactg agccacagtg aaaatgactt cacagcgggt 1680 catggtggct caagtcttta a 1701 <210> 34 <211> 1053 <212> DNA <213> Natronomonas pharaonis ATCC35678 <400> 34 atgagtaacg cgtcgctccg gccctccggg acggccagtg cgacactgtt ccggctggcg 60 ttcctcccgg gctgggctgt catcgcggcg acgacgggtg cgttcctcgt gggagcctca 120 ctacccctta cctaccaact catcccgctc gccgctagcg tggtcctgct cgggctccca 180 cacggcgctg tcgaccattt ggcgctcccg cggacccgaa acgagcgggt cacggttcga 240 tggcttgcgg ccatcggtgt cctctatgcc gttgtcggcg ggctctatgc ggcagtctgg 300 tttctcgcgc ccgtcggtgc cgtcgccgcg ttcattttta tgacgtgggt tcactggggc 360 caaggagaaa tctatccgct tgttgcgctc gctgacgccg accacctcga tgggcggctc 420 gaacgcggac tgacagccgc catccgcggc gcattgccga tgctcgtccc gtttgtcgcc 480 tttcccgacc agtacgagct cgtcgtgaca accctcgtcg ggctcttcga cgccgatgca 540 gcggcgacgg cggcggccgc gttcacgccg accgcacggc tcgcagtcgc ggtcaccgtc 600 ggggggttgg tggcggtcac cctcggtatt ggagctgtcg ctgccagcga gaccggctgg 660 gggccgtggc tgcttgatgc cggcgaaaca gggcttctga ttctgttctt tgcggcggtg 720 ccgccgattt tcgccatcgg cctctacttt tgtttctggc actcgcttcg ccacatcgtc 780 cggttgctcg ctgtcgataa ccgggcagca ccggcgctcg atggtcgccg atacggcgcg 840 gcgcttgcgc gctttgctcg ggatgcagcc ccgctgtcag cggcgtcgct cgtgttgctc 900 gggctgttgt atctagccgt gcccggcagc gtcgactcgc cgctttcgct tgtcgggacc 960 tacctcgtgt tgatagccgt gctcacgctc ccgcacgtgg tcgtcgtggc gtggatggac 1020 cacgaacagc ggctctggcg acccggagca tag 1053 <210> 35 <211> 855 <212> DNA <213> Halobacterium salinarum ATCC700922 <400> 35 atgccacacg gcgcgatcga ctacctcgcg ttgccccgcg cggtcacggg caccgtcacc 60 gtgcggtggc tggcggtcgt cggcgtcctc tacctcgtgc tcggtggtgg ctacgccgcc 120 gcgtggtttt tcgcgcccgt tcccgctgcg ttcgcgttcg tcgcgatcac gtggctgcac 180 tgggggcagg gcgacctcta cccgctgctc gacttcctcg acgtcgacta cctcgatacg 240 cgcccgcggc gcgcggcgac ggtcctgatc cggggtggcc tcccgatgct cgtgccgctg 300 ctcgggttcc cggagcggta ccgcagcgtc gtcgacgcgt tcgccgcgcc gttcggcggc 360 tccgtcggcg acctcgcggt gttcgacccg cgcgtccgcc tgtggctggg cgtcgcgttc 420 gcagccgcga ccgtcgcggt gctcgcggcg ggcagacgcc gcacccactc ccccggcgcg 480 tggcgcgtcg acgccgccga aaccctcctg ttgtgggtgt tcttcttcgt cgtgccgccg 540 gtgttcgccg tcggcgtcta cttctgcgtc tggcactcgg tccggcacgt cgcgcgcgcc 600 atcgccgtcg acggctcggt ccacccgtcg ctgcgcgcgg gcgacatcct cggaccgctg 660 gcccggttcg gcgtggaggc cgcgccgatg acggcggccg cgctcgcgtt gggcggcgtg 720 ctgtggtggg cggtacccaa cccgccgacc acgctcgaat ccggggccgc actctacctc 780 gtgttgatcg ccgtgctcac cctgccacac gtcgccgtgg tcacgtggat ggaccgcgtg 840 cagggcgtcc tctga 855 <210> 36 <211> 1080 <212> DNA <213> Halobacterium salinarum ATCC700922 <400> 36 atgagcaata ggtcgcagtt cgtcccgtcg tggctcgtgc cggaggcagc cggcgacctc 60 ccgttgaccg tgtcgcggct gtcactgctc gcgcttgccg ccgcgttcgc ggtcggatac 120 ggcgcgggct tcgcggtccc actggaggtc caggcgggcg tctacctgtt gggtatggtc 180 gcgatgaacc tcccgcacgg cggctacgag catttcgaga acctgcggcg acgggctgcc 240 tccttccagg gcaagtatat cgtcgcctac ctggtcggga tcgcggcgtt cggcgcgctg 300 tttttcgtcg cgcccgtcgc cggactgggg ctggcagtca cggtggccgt cgccaaaggt 360 gggttcggtg gcgtgcagtc gatggacgcc ctctacggaa ctgaccattt gcgcacgcgc 420 ccccagcggt ggctcgccgc cgtcgtccgg ggcggcgcgg tgatggtggt tcccatgttg 480 ttctggacgg acgtgttcta cgcgttcagc tcggtcatga tctcgatttt cgaccccagc 540 gccgtgtcgg cgctcggcgg tgacatcgca acccggcggc tcgtgctcgg cggcgggtac 600 ggggcgctcg tggtcgcaca cctggggctc ggctaccggc gggcggccgg caccgggtcg 660 ttcctcgccg acgccgccga gacgctgctg ttgatcgcgt acttcgcgct cgttccggtg 720 gtcatcgccg tcgggctgta cttcccgctg tggtactcgg cccgccaggt ggcccgatcg 780 tcggccgtcg acgacacggc gatgacgcag gcagacgcca ccggcatgct tgacgccctg 840 gacgccgacg acccggcgcg cgccacgctt gcctcgtggg cggtgctcat cgtcggcagc 900 gtcgccacgt tcggcctggc ggccgtgctc tggctgctgt ccccacagcc cctgggtggt 960 ggtgggatcc tcgtgggctt ggtcgcgttc tggagcatct tcgtgagcat catcgcgctc 1020 ccgcacgtcg tcgtcggcgg gtggcttgac cgcactcgcg gcatctggta cgtcccataa 1080 1080 <210> 37 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 37 cgagctcagg agcatttaga tgttgaaaac agtagttatt attg 44 <210> 38 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 38 gcccggggtg gcctgaaacg gctacc 26 <210> 39 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 39 gcccgggagg agttaaagaa atgacaattg 30 <210> 40 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 40 cggatccctt agtttcgata agagcgaac 29 <210> 41 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 41 cggtaccaat gacaaaaaaa gttggtgtcg g 31 <210> 42 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 42 ttctagatta cgatttgtcg tcatgtcc 28 <210> 43 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 43 ccccgggagg agagaaatta tgcaaacgga ac 32 <210> 44 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 44 tgcatgctta tttaagctgg gtaaatg 27 <210> 45 <211> 2999 <212> DNA <213> Artificial Sequence <220> <223> pSTV28 vector sequence <400> 45 cgtatggcaa tgaaagacgg tgagctggtg atatgggata gtgttcaccc ttgttacacc 60 gttttccatg agcaaactga aacgttttca tcgctctgga gtgaatacca cgacgatttc 120 cggcagtttc tacacatata ttcgcaagat gtggcgtgtt acggtgaaaa cctggcctat 180 ttccctaaag ggtttattga gaatatgttt ttcgtctcag ccaatccctg ggtgagtttc 240 accagttttg atttaaacgt ggccaatatg gacaacttct tcgcccccgt tttcaccatg 300 ggcaaatatt atacgcaagg cgacaaggtg ctgatgccgc tggcgattca ggttcatcat 360 gccgtctgtg atggcttcca tgtcggcaga atgcttaatg aattacaaca gtactgcgat 420 gagtggcagg gcggggcgta atttttttaa ggcagttatt ggtgccctta aacgcctggt 480 gctacgcctg aataagtgat aataagcgga tgaatggcag aaattcgaaa gcaaattcga 540 cccggtcgtc ggttcagggc agggtcgtta aatagccgct tatgtctatt gctggtttac 600 cggtttattg actaccggaa gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt 660 tgctcaggct ctccccgtgg aggtaataat tgacgatatg atcatttatt ctgcctccca 720 gagcctgata aaaacggtta gcgcttcgtt aatacagatg taggtgttcc acagggtagc 780 cagcagcatc ctgcgatgca gatccggaac ataatggtgc agggcgcttg tttcggcgtg 840 ggtatggtgg caggccccgt ggccggggga ctgttgggcg ctgccggcac ctgtcctacg 900 agttgcatga taaagaagac agtcataagt gcggcgacga tagtcatgcc ccgcgcccac 960 cggaaggagc taccggacag cggtgcggac tgttgtaact cagaataaga aatgaggccg 1020 ctcatggcgt tccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 1080 gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 1140 gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 1200 gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgaat 1260 tcgagctcgg tacccgggga tcctctagag tcgacctgca ggcatgcaag cttggcactg 1320 gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 1380 gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 1440 tcccaacagt tgcgcagcct gaatggcgaa tgagcttatc gatgataagc tgtcaaacat 1500 gagaattaca acttatatcg tatggggctg acttcaggtg ctacatttga agagataaat 1560 tgcactgaaa tctagaaata ttttatctga ttaataagat gatcttcttg agatcgtttt 1620 ggtctgcgcg taatctcttg ctctgaaaac gaaaaaaccg ccttgcaggg cggtttttcg 1680 aaggttctct gagctaccaa ctctttgaac cgaggtaact ggcttggagg agcgcagtca 1740 ccaaaacttg tcctttcagt ttagccttaa ccggcgcatg acttcaagac taactcctct 1800 aaatcaatta ccagtggctg ctgccagtgg tgcttttgca tgtctttccg ggttggactc 1860 aagacgatag ttaccggata aggcgcagcg gtcggactga acggggggtt cgtgcataca 1920 gtccagcttg gagcgaactg cctacccgga actgagtgtc aggcgtggaa tgagacaaac 1980 gcggccataa cagcggaatg acaccggtaa accgaaaggc aggaacagga gagcgcacga 2040 gggagccgcc aggggaaacg cctggtatct ttatagtcct gtcgggtttc gccaccactg 2100 atttgagcgt cagatttcgt gatgcttgtc aggggggcgg agcctatgga aaaacggctt 2160 tgccgcggcc ctctcacttc cctgttaagt atcttcctgg catcttccag gaaatctccg 2220 ccccgttcgt aagccatttc cgctcgccgc agtcgaacga ccgagcgtag cgagtcagtg 2280 agcgaggaag cggaatatat cctgtatcac atattctgct gacgcaccgg tgcagccttt 2340 tttctcctgc cacatgaagc acttcactga caccctcatc agtgccaaca tagtaagcca 2400 gtatacactc cgctagcgct gatgtccggc ggtgcttttg ccgttacgca ccaccccgtc 2460 agtagctgaa caggagggac agctgataga aacagaagcc actggagcac ctcaaaaaca 2520 ccatcataca ctaaatcagt aagttggcag catcacccga cgcactttgc gccgaataaa 2580 tacctgtgac ggaagatcac ttcgcagaat aaataaatcc tggtgtccct gttgataccg 2640 ggaagccctg ggccaacttt tggcgaaaat gagacgttga tcggcacgta agaggttcca 2700 actttcacca taatgaaata agatcactac cgggcgtatt ttttgagtta tcgagatttt 2760 caggagctaa ggaagctaaa atggagaaaa aaatcactgg atataccacc gttgatatat 2820 cccaatggca tcgtaaagaa cattttgagg catttcagtc agttgctcaa tgtacctata 2880 accagaccgt tcagctggat attacggcct ttttaaagac cgtaaagaaa aataagcaca 2940 agttttatcc ggcctttatt cacattcttg cccgcctgat gaatgctcat ccggaattt 2999 <210> 46 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 46 ccccgggagg agagaaatta tgcaaacgga ac 32 <210> 47 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 47 tgcatgctta tttaagctgg gtaaatg 27 <210> 48 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 48 ccggaattca taatgagttt tgatattgcc 30 <210> 49 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 49 ctcctcgagt acgtatcatt atgccagcca ggccttg 37 <210> 50 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 50 ctcatgacgg tctgcgcaaa aaaacacgtt c 31 <210> 51 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 51 ggaattctta actgacggca gcgagttttt tg 32 <210> 52 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 52 cgaattcagg agcgactaca tgaaaccaac tacgg 35 <210> 53 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 53 ggagctctta gagcgggcgc tgccagagat g 31 <210> 54 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 54 ggtcgacagg aggatcggga tgaccgcgag ac 32 <210> 55 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 55 gctgcagtta tgcgcgggtt cctgcaaatg 30 <210> 56 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 56 gactagtgaa ttcaggaggt aataaatatg g 31 <210> 57 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 57 cactagttag tttttgattt tg 22 <210> 58 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 58 ggaattcagg agcggttcca tggagataat atttg 35 <210> 59 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 59 gactagttaa agacttgagc caccatg 27 <210> 60 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 60 ggaattcagg aggccgagta tgagtaacgc gtc 33 <210> 61 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 61 gactagttat gctccgggtc gccagag 27 <210> 62 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 62 ggaattcagg aggtgttcgg catgccacac gg 32 <210> 63 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 63 gactagttag aggacgccct gcacgcggtc 30 <210> 64 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Forward primer <400> 64 ggaattcagg aggtattcat atgagcaata ggtc 34 <210> 65 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer <400> 65 gactagttat gggacgtacc agatgccg 28

Claims (19)

  1. 레티노이드 생산능을 가진 미생물을 친유성 물질을 포함하는 배지 중에서 배양하는 단계; 및
    상기 친유성 물질 상으로부터 레티노이드를 분리하는 단계;
    를 포함하는, 미생물로부터 레티노이드를 생산하는 방법.
  2. 청구항 1에 있어서, 상기 미생물은 박테리아, 곰팡이, 분리된 동물세포, 또는 이들의 조합인, 방법.
  3. 청구항 1에 있어서, 상기 미생물은 에세리키아 속, 바실러스 속, 코리네박테리움 속, 효모, 클루베로마이세스 또는 이들의 조합인, 방법.
  4. 청구항 1에 있어서, 상기 친유성 물질은 탄소수 8 내지 50의 알칸 화합물; 하기 화학식 1의 화합물; 하기 화학식 2의 화합물; 또는 이들의 조합인, 방법:
    [화학식 1]
    R1(CO)OR2
    (식 중, R1 R2는 각각 독립적으로 탄소수 8 내지 50의 알킬을 나타내고, CO는 카르보닐기를 나타냄),
    [화학식 2]
    Figure pat00002

    (식 중, R3, R4 및 R5는 각각 독립적으로 탄소수 8 내지 50의 알킬을 나타내고, CO는 카르보닐기를 나타냄).
  5. 청구항 1에 있어서, 상기 친유성 물질은 옥탄, 데칸, 도데칸, 테트라데칸, 파이토스쿠알란, 미네랄 오일, 이소프로필 미리스테이트, 세틸 에틸헥사노에이트, 디옥타노일 데카노일 글리세롤, 스쿠알란, 또는 이들의 조합인, 방법.
  6. 청구항 1에 있어서, 상기 배지 대 친유성 물질의 부피비는 1:0.2-3.0인, 방법.
  7. 청구항 1에 있어서, 배양은 교반하면서 이루어지는 것인, 방법.
  8. 청구항 1에 있어서, 상기 배지는 글리세롤을 포함하는 것인 방법.
  9. 청구항 1에 있어서, 상기 배지는 글루코스를 포함하는 것인 방법.
  10. 청구항 1에 있어서, 상기 분리하는 단계는 배양물로부터 세포를 제거한 후 도데칸으로부터 레티노이드를 분리하는 것인, 방법.
  11. 청구항 1에 있어서, 상기 레티노이드는 레티날, 레티놀, 레티닐에스테르 및 레티노산으로 이루어진 군에서 선택되는 적어도 하나인, 방법.
  12. 청구항 1에 있어서, 상기 미생물은 대장균인, 방법.
  13. 청구항 12에 있어서, 상기 대장균은 DH5α, MG1655, BL21(DE), S17-1, XL1-Blue, BW25113 또는 이들의 조합인, 방법.
  14. 청구항 1에 있어서, 상기 미생물은 서열번호 1의 엔테로코커스 패칼리스 (Enterococcus faecalis) 유래의 아세틸-CoA 아세틸트란스퍼라제/하이드록시메틸글루타릴 (HMG)-CoA 리덕타제를 코딩하는 유전자; 서열번호 2의 엔테로코커스 패칼리스 유래의 HMG-CoA 신타제를 코딩하는 유전자; 서열번호 3의 스트렙토코커스 뉴모니애 (Streptococcus pneumoniae) 유래의 메발로네이트 키나제를 코딩하는 유전자; 서열번호 4의 스트렙토코커스 뉴모니애 유래의 포스포메발로네이트 키나제를 코딩하는 유전자; 서열번호 5의 스트렙토코커스 뉴모니애 유래의 메발로네이트 디포스페이트 데카르복실라제를 코딩하는 유전자; 서열번호 6의 대장균 유래의 이소펜테닐 디포스페이트 (IPP) 이소머라제를 코딩하는 유전자; 서열번호 7의 판토에아 아글루메란스 (Pantoea agglomerans) 유래의 제라닐제라닐 피로포스페이트 (GGPP) 신타제를 코딩하는 유전자; 서열번호 8의 판토에아 아글루메란스 유래의 피토엔 신타제를 코딩하는 유전자; 서열번호 9의 판토에아 아글루메란스 유래의 피토엔 데히드로게나제를 코딩하는 유전자; 및 서열번호 10의 판토에아 아나나티스 (Pantoea ananatis) 유래의 라이코펜-β-시클라제를 코딩하는 유전자로 형질전환된 것인, 방법.
  15. 청구항 14에 있어서, 상기 미생물은 서열번호 13의 배양되지 않은 해양 박테리아 (uncultured marine bacterium) 66A03 유래의 β-카로틴 모노옥시게나제를 코딩하는 유전자; 서열번호 14의 생쥐 (Mus musculus) 유래의 β-카로틴 15,15'-모노옥시게나제를 코딩하는 유전자; 서열번호 15의 나트로노모나스 파라오니스 (Natronomonas pharaonis) ATCC35678 유래의 brp 유사 단백질 2 (brp-like protein 2)를 코딩하는 유전자; 및 서열번호 16 또는 17의 할로박테리움 살리나룸 (Halobacterium salinarum) ATCC700922 유래의 β-카로틴 모노옥시게나제를 코딩하는 유전자로 이루어진 군으로 선택되는 하나 이상의 유전자로 더 형질전환된 것인, 방법.
  16. 청구항 14에 있어서, 상기 미생물은 대장균에서 코돈 사용 최적화된 서열번호 32의 염기서열을 갖는 유전자로 더 형질전환된 것인, 방법.
  17. 청구항 1에 있어서, 상기 미생물은 서열번호 11의 대장균 유래 1-데옥시자일룰로즈-5-포스페이트 (DXP) 신타제를 코딩하는 유전자로 형질전환된 것인, 방법.
  18. 청구항 1에 있어서, 상기 미생물은 서열번호 12의 헤마토코커스 플루비알리스 (Haematococcus pluvialis) 유래의 IPP 이소머라제를 코딩하는 유전자로 형질전환된 것인, 방법.
  19. 청구항 1에 있어서, 상기 에세리키아속 미생물은 기탁번호 KCTC 11254BP의 대장균 DH5α/pTDHB/pSNA 또는 기탁번호 KCTC 11255BP의 대장균 DH5α/pTDHBSR/pSNA인, 방법.
KR1020120083185A 2011-07-29 2012-07-30 미생물로부터 레티노이드를 생산하는 방법 KR101392159B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US14/235,841 US9644217B2 (en) 2011-07-29 2012-07-30 Method for producing retinoid from microorganism
CN201280042839.0A CN103857786B (zh) 2011-07-29 2012-07-30 从微生物中制造类视黄醇的方法
PCT/KR2012/006071 WO2013019051A2 (ko) 2011-07-29 2012-07-30 미생물로부터 레티노이드를 생산하는 방법
US15/180,032 US9834794B2 (en) 2011-07-29 2016-06-12 Method for producing retinoid from microorganism

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020110075715 2011-07-29
KR20110075715 2011-07-29

Publications (2)

Publication Number Publication Date
KR20130014445A true KR20130014445A (ko) 2013-02-07
KR101392159B1 KR101392159B1 (ko) 2014-05-12

Family

ID=47894611

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020120083185A KR101392159B1 (ko) 2011-07-29 2012-07-30 미생물로부터 레티노이드를 생산하는 방법
KR1020120083186A KR101440922B1 (ko) 2011-07-29 2012-07-30 YbbO 유전자가 결실 또는 증폭된 에세리키아 속 미생물 및 그를 이용한 레티노이드의 생산 방법
KR1020120083188A KR101359484B1 (ko) 2011-07-29 2012-07-30 EutE 유전자 또는 PuuC 유전자가 결실된 에세리키아 속 미생물 및 그를 이용한 레티노이드 생산 방법

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020120083186A KR101440922B1 (ko) 2011-07-29 2012-07-30 YbbO 유전자가 결실 또는 증폭된 에세리키아 속 미생물 및 그를 이용한 레티노이드의 생산 방법
KR1020120083188A KR101359484B1 (ko) 2011-07-29 2012-07-30 EutE 유전자 또는 PuuC 유전자가 결실된 에세리키아 속 미생물 및 그를 이용한 레티노이드 생산 방법

Country Status (3)

Country Link
US (2) US9644217B2 (ko)
KR (3) KR101392159B1 (ko)
CN (1) CN103857786B (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204058A1 (ko) * 2013-06-20 2014-12-24 경상대학교산학협력단 레티노이드 생산에 관여하는 효소를 코딩하는 유전자를 포함하는 미생물 및 이를 이용한 레티노이드의 생산 방법
KR20160019480A (ko) * 2016-01-27 2016-02-19 경상대학교산학협력단 레티노이드 생산에 관여하는 효소를 코딩하는 유전자를 포함하는 미생물 및 이를 이용한 레티노이드의 생산 방법
KR20210041657A (ko) * 2019-10-07 2021-04-16 아주대학교산학협력단 레티노이드 생성능을 가지는 재조합 미생물 및 이를 이용한 레티노이드 제조방법
KR102518841B1 (ko) * 2021-11-09 2023-04-10 경상국립대학교산학협력단 레티노이드 제조용 조성물 및 이를 이용한 레티노이드의 제조 방법

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11326173B2 (en) * 2015-08-28 2022-05-10 Phytowelt Greentechnologies Gmbh Method of fermentative alpha-ionone production
EP3687488A1 (en) * 2017-09-25 2020-08-05 DSM IP Assets B.V. Production of trans-retinal
WO2019058001A1 (en) * 2017-09-25 2019-03-28 Dsm Ip Assets B.V. PRODUCTION OF RETINYL ESTERS
BR112020005774A2 (pt) * 2017-09-25 2020-09-24 Dsm Ip Assets B.V. biossíntese de retinoides
US20200248151A1 (en) * 2017-09-25 2020-08-06 Dsm Ip Assets B.V. Production of retinol
KR102202606B1 (ko) * 2018-11-30 2021-01-15 (주)바이오스플래시 바이오레티놀을 생산하는 미생물 및 이를 이용한 바이오레티놀의 생산방법
BR112021012401A2 (pt) * 2018-12-31 2021-12-14 Dsm Ip Assets Bv Acetil-transferases inovadoras
US20230407344A1 (en) * 2020-10-30 2023-12-21 Dsm Ip Assets B.V. Fermentative production of isoprenoids
EP4308717A1 (en) * 2021-03-19 2024-01-24 Givaudan SA Process
JP2024517415A (ja) * 2021-04-16 2024-04-22 カプラ バイオサイエンシーズ インコーポレイテッド バイオフィルムバイオリアクタにおける遺伝子操作された炭化水素分解性生物を使用するイソプレノイド合成の方法
KR102646404B1 (ko) * 2021-07-15 2024-03-08 아주대학교산학협력단 레티노익산의 미생물 생합성
WO2024050080A2 (en) * 2022-09-01 2024-03-07 Amyris Inc. Methods of biomanufacturing and purifying retinoids

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4388644B2 (ja) * 1999-10-18 2009-12-24 大洋香料株式会社 新規乳酸菌発酵代謝物を含有する化粧料
DE60314430T2 (de) * 2002-09-27 2008-02-07 Dsm Ip Assets B.V. Rekombinante mikroorganismen für die produktion von vitamin b6
WO2005075658A1 (en) * 2004-01-30 2005-08-18 Dsm Ip Assets B.V. Microbial production of vitamin c
KR100701319B1 (ko) * 2005-02-22 2007-03-29 경상대학교산학협력단 라이코펜 생산능이 향상된 대장균 및 그를 이용한 라이코펜의 생산방법
KR100971508B1 (ko) * 2008-01-14 2010-07-21 경상대학교산학협력단 이소프레노이드 생산성이 향상된 에세리키아 속 미생물 및그를 이용하여 이소프레노이드를 생산하는 방법
JPWO2009116566A1 (ja) 2008-03-18 2011-07-21 協和発酵キリン株式会社 工業的に有用な微生物

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204058A1 (ko) * 2013-06-20 2014-12-24 경상대학교산학협력단 레티노이드 생산에 관여하는 효소를 코딩하는 유전자를 포함하는 미생물 및 이를 이용한 레티노이드의 생산 방법
US10030258B2 (en) 2013-06-20 2018-07-24 Industrial-Academic Cooperation Foundation Gyeongsang National University Microorganism comprising gene for coding enzyme involved in producing retinoid and method for producing retinoid by using same
KR20160019480A (ko) * 2016-01-27 2016-02-19 경상대학교산학협력단 레티노이드 생산에 관여하는 효소를 코딩하는 유전자를 포함하는 미생물 및 이를 이용한 레티노이드의 생산 방법
KR20210041657A (ko) * 2019-10-07 2021-04-16 아주대학교산학협력단 레티노이드 생성능을 가지는 재조합 미생물 및 이를 이용한 레티노이드 제조방법
KR102518841B1 (ko) * 2021-11-09 2023-04-10 경상국립대학교산학협력단 레티노이드 제조용 조성물 및 이를 이용한 레티노이드의 제조 방법
WO2023085688A1 (ko) * 2021-11-09 2023-05-19 경상국립대학교산학협력단 레티노이드 제조용 조성물 및 이를 이용한 레티노이드의 제조 방법

Also Published As

Publication number Publication date
US9644217B2 (en) 2017-05-09
US20160362709A1 (en) 2016-12-15
KR101392159B1 (ko) 2014-05-12
US20140170720A1 (en) 2014-06-19
CN103857786A (zh) 2014-06-11
KR101440922B1 (ko) 2014-09-18
KR20130014674A (ko) 2013-02-08
KR101359484B1 (ko) 2014-02-13
CN103857786B (zh) 2016-04-06
KR20130014673A (ko) 2013-02-08
US9834794B2 (en) 2017-12-05

Similar Documents

Publication Publication Date Title
KR20130014445A (ko) 미생물로부터 레티노이드를 생산하는 방법
AU2021204038B2 (en) Mutant microorganisms resistant to lactose killing
KR101106253B1 (ko) 사이코스 3-에피머라제 효소를 코딩하는 폴리뉴클레오티드를 포함하는 대장균 및 그를 이용하여 사이코스를 생산하는 방법
CN111235080B (zh) 基因重组大肠杆菌及5-羟色胺的生产方法
KR100971508B1 (ko) 이소프레노이드 생산성이 향상된 에세리키아 속 미생물 및그를 이용하여 이소프레노이드를 생산하는 방법
CN111154707B (zh) 基因工程化大肠杆菌及褪黑素的生产方法
JP6877336B2 (ja) スピルリナにおける標的化された突然変異誘発
CN114008197A (zh) 用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代谢工程
KR20190024783A (ko) 에탄올 비생산성 아세토젠 균주를 에탄올 생성균주로 전환하는 방법 및 상기 에탄올 생성균주로부터 일산화탄소를 이용한 에탄올의 제조방법
KR102636404B1 (ko) 터펜 알코올 또는 그 유도체의 제조 방법
KR101443052B1 (ko) 변형된 콘드로이틴 합성 효소 폴리펩타이드 및 이의 결정
CN101027403A (zh) 生产伯醇的方法
CN114107368B (zh) 表达反式菊酸的联合表达载体及其在调控番茄vi型腺体腺毛合成反式菊酸中的应用
KR102636395B1 (ko) 터펜 알코올 또는 그 유도체의 제조 방법
CN106479928B (zh) 一株耐高盐耐高cod盐水球菌菌株和来源该菌株的内源质粒
CN111394383B (zh) 生物合成石竹烯的聚球藻基因工程菌及其构建方法与应用
KR20120088062A (ko) 파네솔 생산성이 향상된 에세리키아 속 미생물 및 그를 이용하여 파네솔을 생산하는 방법
CN111088267B (zh) 一种提高产溶剂梭菌液体发酵细胞密度的方法
KR101226644B1 (ko) 지방산 생합성 경로의 과발현용 형질전환 대장균 및 그의 제조방법
KR100918121B1 (ko) 아세틸-CoA 소비를 증가시키는 대장균 균주 및 상기균주 및 흡착제 수지를 이용한 바닐린 생산 방법
CN113755412B (zh) 一种生产mk-7的基因工程菌及方法、应用
KR101246910B1 (ko) 말로닐―CoA와 말로닐―[acp]를 이용한 지방산 생합성 경로 과발현용 형질전환 대장균 및 그의 제조방법
CN111254105B (zh) 基因工程大肠杆菌及制备方法和吲哚-3-乙酸的生产方法
KR20110107209A (ko) 지방산 생합성 경로의 과발현용 형질전환 대장균의 제조방법 및 상기 제조방법으로 제조된 형질전환 대장균
KR20120099817A (ko) α-파르네센 생산성이 향상된 에세리키아 속 미생물 및 그를 이용하여 α-파르네센을 생산하는 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180409

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190327

Year of fee payment: 6