KR20230113685A - 바실러스 세포에서 시알산화된 올리고사카라이드의 생산 - Google Patents

바실러스 세포에서 시알산화된 올리고사카라이드의 생산 Download PDF

Info

Publication number
KR20230113685A
KR20230113685A KR1020227009316A KR20227009316A KR20230113685A KR 20230113685 A KR20230113685 A KR 20230113685A KR 1020227009316 A KR1020227009316 A KR 1020227009316A KR 20227009316 A KR20227009316 A KR 20227009316A KR 20230113685 A KR20230113685 A KR 20230113685A
Authority
KR
South Korea
Prior art keywords
bacillus
cells
sialyltransferase
cell
phosphate
Prior art date
Application number
KR1020227009316A
Other languages
English (en)
Inventor
스테판 젠와인
더크 바르텐베르그
스테파니 하베르세체르
Original Assignee
크리스찬 한센 에이치엠오 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 크리스찬 한센 에이치엠오 게엠베하 filed Critical 크리스찬 한센 에이치엠오 게엠베하
Publication of KR20230113685A publication Critical patent/KR20230113685A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/20Reducing nutritive value; Dietetic products with reduced nutritive value
    • A23L33/21Addition of substantially indigestible substances, e.g. dietary fibres
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/40Complete food formulations for specific consumer groups or specific purposes, e.g. infant formula
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H1/00Processes for the preparation of sugar derivatives
    • C07H1/06Separation; Purification
    • C07H1/08Separation; Purification from natural products
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H3/00Compounds containing only hydrogen atoms and saccharide radicals having only carbon, hydrogen, and oxygen atoms
    • C07H3/06Oligosaccharides, i.e. having three to five saccharide radicals attached to each other by glycosidic linkages
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1081Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Polymers & Plastics (AREA)
  • Food Science & Technology (AREA)
  • Nutrition Science (AREA)
  • Mycology (AREA)
  • Pediatric Medicine (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)

Abstract

시알산화된 올리고사카라이드(sialylated oligosaccharide)의 생산을 위한 비-포자형성 바실러스(non-sporulating Bacillus) 세포뿐만 아니라, 상기 바실러스 세포를 사용하는 시알산화된 올리고사카라이드의 생산 방법을 개시하며, 여기서 상기 바실러스 세포는 락토스 퍼미아제(lactose permease), CMP-NeuNAc 생합성 경로(biosynthesis pathway) 및 시알릴트랜스퍼라제를 갖도록 유전자 조작되었다.

Description

바실러스 세포에서 시알산화된 올리고사카라이드의 생산
본 발명은 유전 공학의 기술 분야, 특히 바실러스(Bacillus) 세포에서 시알산화된 올리고사카라이드(sialylated oligo-saccharide)의 생산을 위한 상기 바실러스 세포의 유전 공학, 상기 바실러스 세포를 사용하는 시알산화된 올리고사카라이드의 발효 생산, 및 이와 같이 생성된 시알화된 올리고사카라이드의 용도에 관한 것이다.
모유는 유아에게 건강한 성장과 발달에 필요한 모든 영양소를 제공한다. 모유에 존재하는 사카라이드는 지방과 단백질에 앞서, 모유의 주성분을 나타낸다. 에너지원으로 사용되는 락토스 외에도 모유에는 더 복잡한 사카라이드 분자, 즉 올리고사카라이드가 함유되어 있다. 현재까지 약 200개의 구조적으로 구별되는 올리고사카라이드가 모유에서 확인되었다. 이러한 올리고사카라이드는 인간의 모유에서만 유의미한 농도로 발견되며, 집합적으로 인간의 모유 올리고사카라이드(HMO)로서 공지되어 있다. 상기 HMO는 디사카라이드 락토스(글루코스(Glc) 부분 및 갈락토스(Gal) 부분으로 이루어진다)를 기반으로 하며, N-아세틸-글루코스아민(GlcNAc), 푸코스(Fuc), 시알산/N-아세틸뉴라민산(NeuNAc), 및/또는 갈락토스(Gal)를 기반으로 하는 추가의 모노사카라이드 잔기를 갖는다. 모유에 있는 HMO의 농도와 구성은 개인에 따라 다르며 수유 기간 동안 초유에서 최대 20 g/L에서부터 성숙한 모유에서 5-10 g/L로 다양하다.
상당 수의 HMO는 적어도 하나의 NeuNAc 부분을 갖는다. 이러한 시알산화된 인간 모유 올리고사카라이드(SHMO) 중에서, 3'-시알릴락토스, 6'-시알릴락토스, 시알릴락토-N-테트라오스, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 c 및 디시알릴-락토-N-테트라오스가 모유 중 가장 일반적인 구성원이다.
시알산(Sia)은 9개의 탄소 주쇄를 갖는 음으로 하전된 모노사카라이드의 패밀리이다. 50개를 초과하는 형태의 이러한 α-케토산이 자연에서 발견되었다. 가장 풍부한 시알산은 N-아세틸뉴라민산(NANA, NeuNAc, Neu5Ac)인 것으로 보인다.
시알산은 척추동물 및 고등 무척추동물의 세포 표면상에서 당접합체(당단백질 및 당지질) 중에 존재하는 글리칸의 말단 모노사카라이드 부분으로서 존재한다. 시알산은 에스케리키아 콜라이(Escherichia coli) K1, 헤모필루스 인플루엔자에(Haemophilus influenzae), 헤모필루스 듀크레이(Haemophilus ducreyi), 파테우렐라 뮬토시다(Pateurella multocida), 네이세리아 고노로에아에(Neisseria gonorrhoeae), 네이세리아 메닌지티디스(Neisseria meningitidis), 캄필로박터 제주니(Campylobacter jejuni) 및 스트렙토코커스 아갈락티아에(Streptococcus agalactiae)를 포함한 병원성 세균의 리포폴리사카라이드 및 협막 폴리사카라이드의 성분이다.
시알산화된 HMO는 장병원성 세균 및 바이러스에 대한 유아의 저항성을 지지하는 것으로 관찰되었다. 흥미롭게도, 최근의 연구는 미숙아에서 가장 흔하고 치명적인 질병 중 하나인 괴사성 전장염(necrotizing enterocolitis)에 대한 장쇄 SHMO의 보호 효과를 추가로 입증하였다. 또한, 시알산화된 올리고사카라이드는 에스케리키아 콜라이, 비브리오 콜레라에(Vibrio cholerae) 및 살모넬라(Salmonella)를 포함한 다양한 병원성 미생물의 장독소를 중화시키는 것으로 나타났다. 더욱이, 시알산화된 올리고사카라이드는 헬리코박터 파이로리(Helicobacter pylori)에 의한 장 콜로니생성을 방해하는 것으로 밝혀졌다. 추가로, SHMO는 유아의 뇌 발달 및 이의 인지 능력을 지지하는 것으로 여겨진다.
HMO, 특히 시알산화된 HMO의 공지된 이득으로 인해, 이러한 시알산화된 올리고사카라이드 또는 이들 시알산화된 올리고사카라이드 중 적어도 일부가 유아용 조제분유(infant formula)에 대한 보충제로서 이용가능해지도록 경제적으로 가치있는 생산 공정이 요구된다.
모유 수유 이외의 목적을 위한 모유의 제한된 가용성, 및 천연 공급원으로부터 개별적인 모유 올리고사카라이드의 순수한 분획을 얻기가 어렵기 때문에 합성을 위한 화학적 경로가 개발되었다. 그러나 화학적 합성이나 생체촉매적 시험관내 접근법 모두 상업적으로 지속 가능한 것으로 입증되지 않았다. 더욱이, 모유 올리고사카라이드의 화학적 합성에는 최종 제품을 오염시킬 위험이 있는 여러 유해 화학 물질의 사용이 포함된다.
화학적 및 생체촉매적 시험관내 합성의 대안으로, HMO의 발효 생산이 개발되었다. 현재까지, 재조합 에스케리키아 콜라이 세포가 산업적 규모로 일부 HMO의 미생물 생산에 사용되고 있다.
그러나, 에스케리키아 콜라이 속은 비병원성 구성원뿐만 아니라 병원성 구성원도 포함한다. 비병원성 이. 콜라이(E. coli) 균주는 HMO의 미생물 생산에 사용됨에도 불구하고, 이와 같은 비병원성 이. 콜라이는 다양한 관할권에서 사람이 섭취하도록 의도된 제품의 제조에 안전한 것으로 인식되지 않고 있다. 이는 해당 관할권에서 인간이 소비하기 위한 현행의 생명공학적 방법으로 제조되는 HMO에 대한 규제 승인을 방해한다. 따라서 인간 소비에 안전한 것으로 인식되거나 또는 그러한 관할권에서 인간 소비를 위한 화합물의 생산에 사용될 때 안전한 것으로 인식되는 속의 미생물 세포가, 인간 소비를 위한 사카라이드, 예를 들어 특히 유아가 섭취하기 위한 모유 올리고사카라이드를 제조하는데 필요하다. 안전한 것으로 인정된 생산 균주의 사용은, 사카라이드가 인체 건강에 위험할 가능성에 대한 우려를 최소한으로 줄여주고 대부분의 관할권에서 규제 승인을 용이하게 한다.
이 문제는 시알산화된 올리고사카라이드, 특히 시알산화된 HMO의 생산에 바실러스 속의 세균 세포를 사용함으로써 해결된다. 바실러스 속의 일부 종의 세균 세포는 이미 사람이 섭취하고 있거나 사람이 섭취할 수 있는 화합물/식품의 생산에 안전한 것으로 인식되고 있다. 따라서, 시알산화된 올리고사카라이의 생산, 특히 시알산화된 모유 올리고사카라이드의 생산에 일반적으로 안전한 것으로 인식되는 종 및/또는 균주의 바실러스 세포가 제공된다.
바실러스 속의 세균은 호기성 또는 통성 혐기성 종의 그람 양성, 막대 모양, 내생포자-형성 미생물 세포이다. 바실러스 속은 피르미쿠테스(Firmicutes) 문에 속한다. 바실러스 속 구성원의 게놈은 이의 코돈 사용빈도에서 A-T 염기쌍에 대한 편향을 가지고 있다. 바실러스 종은 자연에서 거의 어디에나 존재한다. 이들 종은 예를 들어 토양(바실러스 서브틸리스(B. subtilis))에서 발견될 수 있지만 높은 pH(바실러스 알칼로필루스(B. alcalophilus)), 고온(바실러스 써모필루스(B. thermophilus)) 또는 고염(바실러스 할로두란스(B. halodurans))과 같은 극한 환경에서도 존재한다.
바실러스 속은 266개의 명명된 종을 포함하며, 여기에는 기생 병원성 종뿐만 아니라 자유 생물 종도 포함된다. 탄저병을 일으키는 바실러스 안트라시스(B. anthracis)와 식중독을 일으키는 바실러스 세레우스(B. cereus)의 두 가지 바실러스 종이 의학적으로 중요한 것으로 간주된다. 세 번째 종인 바실러스 튜린지엔시스(B. thuringiensis)는 곤충을 죽일 수 있는 독소를 생성하는 중요한 곤충 병원체이다. 따라서 해충을 방제하기 위한 살충제로 사용된다.
GRAS(일반적으로 안전한 것으로 인정됨) 상태로 인해 여러 바실러스 종, 예를 들어 바실러스 아밀로리퀘파시엔스(B. amyloliquefaciens), 바실러스 리케니포르미스(B. licheniformis) 및 바실러스 서브틸리스는 식품 및 제약 산업에서 사용되는 다양한 단백질 및 화합물의 생명공학적 생산에 사용된다.
바실러스 아밀로리퀘파시엔스는 제한효소 BamHI의 공급원이며 천연항생제 단백질인 바르나제를 합성하기도 한다. 또한 바실러스 아밀로리퀘파시엔스는 바실러스 안트라시스에 대해 선택적 활성을 갖는 항생제인 플란타졸리신을 생산한다. 바실러스 아밀로리퀘파시엔스로부터의 알파-아밀라제가 종종 전분 가수분해에 사용된다. 바실러스 아밀로리퀘파시엔스는 또한 단백질의 분해를 촉매화하는 서브틸리신의 공급원이다.
바실러스 아밀로리퀘파시엔스는 세균 및 진균 병원체에 대항하여 작용하므로 농업, 양식업 및 수경재배에서 일부 식물 뿌리 병원체와 싸우는데 사용되는 뿌리-콜로니형성 세균이며, 원치않는 병원체를 경쟁적으로 배제하거나 싸워-이겨 감염을 예방할 수 있다.
바실러스 리케니포르미스는 알칼리성 세린 프로테아제를 분비하는 높은 능력으로 인해 산업적 효소 생산에서 가장 중요한 세균 중 하나가 되었다. 바실러스 리케니포르미스에 의해 분비되는 서브틸리신 칼스버그(Subtilisin Carlsberg)는 세제 프로테아제로 사용되며 Alcalase®라는 상품명으로 판매된다.
바실러스 서브틸리스는 토양, 및 반추동물과 인간의 위장관에서 발견되는 카탈라제 양성 세균이다. 바실러스 서브틸리스 및 이러한 내독소가 없는 세균으로부터 유래하는 물질은, 식품에서의 안전하고 유익한 사용에 대해서 여러 권위있는 기관에서 평가되었다. 미국에서 바실러스 서브틸리스로부터의 카보하이드라제 및 프로테아제 효소는 미국 식품 안전청(FDA)에 의해 일반적으로 안전한 것으로(GRAS) 인정된다. 바실러스 서브틸리스는 또한 유럽 식품 안전청(European Food Safety Authority)에 의해 "적격 안전 추정(QPS)" 지위를 부여받았다.
더욱이, 바실러스 서브틸리스 균주의 비독성 및 비병원성 균주는 통상적으로 식품에 사용된다. 예를 들어, 낫토 형태의 발효 대두는 일본에서 빈번히 소비되며 그램당 108 개 정도로 많은 생육성 바실러스 서브틸리스 세포를 포함한다. 낫토는 건강한 장내 세균총과 비타민 K2 섭취에 기여하는 것으로 인식되고 있다.
낫토 제품 및 주성분으로서 바실러스 서브틸리스 변종 낫토는 일본 후생노동성에서 건강보존에 효과가 있다고 인정한 FOSHU(특정 건강용 식품)이다.
바실러스 서브틸리스는 취급이 용이하고 빠르게 증식하며 배양 조건이 간단하다. 재조합 바실러스 서브틸리스 균주는 폴리하이드록시-알칸올레이트, 히알루론산 및 아밀라아제 및 프로테아제와 같은 다양한 효소의 생산에 사용된다.
바실러스 서브틸리스의 야생형 자연 단리물은, 돌연변이 유발 및 선택의 재배화(domestication) 과정을 거친 실험실 균주와 비교하여 작업하기가 어렵다. 이러한 재배화된 균주는 종종 자연적 능력 개발(환경 DNA의 흡수 및 통합)을 겪을 수 있는 개선된 능력, "야생에서" 필요한 개선된 증식 능력 및 능력 상실을 가지고 있다. 바실러스 서브틸리스에서, 선형 DNA뿐만 아니라 다량체 형태의 플라스미드 DNA는 천연 수용능력 세포에 의해 능동적으로 흡수된다.
특정 생리학적 조건하에서, 바실러스 서브틸리스 세포의 작은 하위집단은 수용능력성으로 된다. 바실러스 서브틸리스에서, 고유의 수용능력은 복잡한 조절 네트워크에 의해 조절된다. 이러한 네트워크의 주요 조절인자는 무엇보다도 수용능력성 ComK의 마스터 조절인자, 및 포자형성 SpoOA의 전사 마스터 조절인자이다. 바실러스 서브틸리스 세포의 형질전환 효율 및 추정상 DNA의 게놈내로의 통합 효능은 유전 공학에 의해 개선될 수 있다. 이는 조절된 프로모터(예를 들어 만니톨 유도성 P mtlA 프로모터)와 유전자 comKcomS를 포함하는 발현 카세트를 바실러스 서브틸리스의 게놈에 이소성 통합시킴으로써 성취될 수 있다. 추가로, 이 전략은 복합 배지(예를 들어 LB)를 사용하는 고유의 수용능력에 의한 바실러스 서브틸리스의 형질전환을 허용한다.
시알산화된 올리고사카라이드의 생산을 위해서, 바실러스 세포를 다양한 방법에 의해 유전자 조작할 수 있다.
본원에 사용되는 바와 같은 "유전자 조작된"이란 용어는 분자 생물학적 방법을 사용하여 바실러스 세포의 유전자 구성을 변형시키는 것을 지칭한다. 바실러스 세포의 유전적 구성의 변형은 종 경계 내 및/또는 종 경계를 가로질러 유전자의 전달, 뉴클레오티드, 트리플릿, 유전자, 개방 판독 프레임, 프로모터, 인핸서, 종결자 및 유전자 발현을 매개 및/또는 조절하는 기타 뉴클레오티드 서열의 삽입, 결실, 교체 및/또는 변형을 포함할 수 있다. 바실러스 세포의 유전자 구성의 변형은 원하는 특정 특성을 지닌 유전자 변형 바실러스 세포를 생성시키는 것을 목표로 한다. 유전자 조작된 바실러스 세포는 세포의 고유(유전자 조작되지 않은) 형태에는 존재하지 않는 하나 이상의 유전자를 포함할 수 있다. 세포 유전 정보의 뉴클레오티드 서열을 삽입, 결실 또는 변경하기 위해 외인성 핵산 분자를 도입하고/하거나 외인성 핵산 분자(재조합, 이종)를 바실러스 세포의 유전 정보에 삽입하는 기술은 당업자에게 공지되어 있다. 유전자 조작된 바실러스 세포는 세포의 고유 형태에 존재하는 하나 이상의 유전자를 함유할 수 있으며, 여기서 상기 유전자는 인공적인 수단에 의해 변형되고 바실러스 세포 내로 재도입된다. "유전자 조작된"이라는 용어는 또한, 세포에 내인성인 핵산 분자를 함유하고 세포로부터 핵산 분자 제거 없이 변형된 바실러스 세포를 포함한다. 이러한 변형에는 유전자 교체, 부위 특이적 돌연변이 및 관련 기법에 의해 획득된 변형이 포함된다.
붕괴 또는 결실에 의한 유전자 통합 및/또는 (동시) 유전자 불활성화는 상동성 재조합에 의해 성취될 수 있다. 효율적인 상동성 재조합을 위해서는 바실러스 서브틸리스에서 적어도 400-500 bp의 상동성 가지가 필요하다.
표적화된 게놈 공학을 위한 또 다른 방법은 CRISPR-Cas9 시스템이다. 이러한 신속한 무-마커 게놈 편집 도구는 대규모 게놈 결실, 크고 작은 DNA 삽입, 정지 코돈 도입에 의한 유전자 침묵 및 점 돌연변이 도입에 사용될 수 있다. CRISPR-Cas9에 의한 흉터없는 게놈 편집에는 선행의 게놈 변형이 필요하지 않다.
유전자의 무작위 염색체 통합 및 삽입 돌연변이 유발은 변형된 마리너(mariner)-유래 트랜스포손을 사용하여 수행할 수 있다. 이 시스템은 바실러스 서브틸리스의 핫포트(hotpot)로 편향되지 않고 무작위 이소성 통합에서 높은 효율을 나타낸다.
바실러스 종은 효소의 산업적 규모의 생산에 사용되고 있지만, 바실러스 세포는 올리고사카라이드의 산업적 규모의 생산, 특히 시알산화된 올리고사카라이드의 산업적 규모의 생산에 대해서 지금까지 구현되지 않았다.
중국 특허 출원 CN 108 410 787 A는 락틸-N-네오테트라오스를 합성하는 재조합 바실러스 서브틸리스 세포를 개시하고 있다. 상기 재조합 바실러스 서브틸리스 세포는 세포의 게놈에 통합된 락토스 퍼미아제(lactose permease) 유전자를 갖는다. 또한, 상기 바실러스 세포는 β-1,3-N-글루코스아민 트랜스퍼라제 유전자 및 β-1,4-갈락토실트랜스퍼라제 유전자를 포함하는 플라스미드를 보유한다. 상기 바실러스 서브틸리스 세포는 외인성 락토스의 존재하에서 배양될 수 있으며, 최대 약 1 g/ L의 역가에서 락틸-N-네오테트라오스를 합성하는데, 이는 경제적으로 합리적인 산업적 규모의 생산에는 너무 적다.
중국 특허 출원 CN 109 735 479 A는 2'-푸코실락토스 합성을 위한 재조합 바실러스 서브틸리스 세포를 개시하고 있으며, 여기서 락토스 수송 효소의 발현이 향상되고, 이 세포는 푸코스 키나제, 포스페이트 구아닌 트랜스퍼라제 및 푸코실트랜스퍼라제를 발현한다. 발효 배지에서 2'-푸코실락토스의 수율은 0.424 g/L 내지 1.042 g/L인 것으로 보고되었다.
다양한 특허 출원에서, 락토-N-네오테트라오스 또는 2'-푸코실락토스와 같은 중성 올리고사카라이드의 생산에 적합한 것으로 간주되는 속으로서 바실러스를 언급하고 있지만, 바실러스의 시알산화된 올리고사카라이드, 특히 시알산화된 모유 올리고사카라이드의 생산은 아직 구현되지 않았는데, 아마도 바실러스에서 HMO 생산에 필요한 생합성 경로(biosynthetic pathway)를 구현하는데 필요한 대사 공학의 상당한 노력 때문일 것이다. LNnT의 생산에 대해 상기에서 언급한 바실러스 서브틸리스는 바실러스 서브틸리스 세포에서 자연적으로 발생하는 공여자 기질에 의존하는 반면, 바실러스에서 시알산화된 올리고사카라이의 생산은 공여자 기질, 즉 시알산화된 올리고사카라이드 합성에 필수적인 CMP-NeuNAc를 제공하기 위해 세포에서 이종 대사 경로의 구현을 필요로 한다.
상기 목적은 세포에 외인성 락토스의 수입을 위해 락토스 퍼미아제를 갖는 바실러스 세포, 시알산 부분에 대한 공여자 기질로서, 뉴클레오티드-활성화된 시알산, 즉 시티딘 모노포스페이트 N-아세틸뉴라민산(CMP-NeuNAc)의 세포내 형성을 위한 CMP-NeuNAc 생합성 경로(biosynthesis pathway), 및 CMP-NeuNAc에서 수용자 기질로 시알산 부분의 전달을 위한 시알릴트랜스퍼라제를 제공함으로써 성취되었다. 외인성 락토스의 존재하에서 이러한 바실러스 세포의 배양은 목적하는 시알산화된 올리고사카라이드의 생산을 허용한다.
첫 번째 측면에 따라, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 속의 비-포자형성(non-sporulating) 세균 세포를 제공하며, 여기서 상기 바실러스 세포는 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 갖는다.
두 번째 측면에 따라, 시알산화된 올리고사카라이드의 생산을 위한 첫 번째 측면에 따른 바실러스 속의 비-포자형성 세균 세포의 용도를 제공한다.
세 번째 측면에 따라, 시알산화된 올리고사카라이드의 생산 방법을 제공하며, 상기 방법은
- 바실러스 속의 비-포자형성 세균 세포를 제공하고, 여기서 상기 바실러스 세포는 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 가지며;
- 락토스를 함유하는 배양 배지에서, 상기 바실러스 세포가 시알산화된 올리고사카라이드를 생산할 수 있게 하는 조건하에서, 상기 바실러스 세포를 배양하고;
- 임의로 상기 배양 배지 및/또는 바실러스 세포로부터 시알산화된 올리고사카라이드를 회수(retrieving)함
을 포함한다.
네 번째 측면에 따라, 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 갖는 바실러스 세포에 의해 생산된 시알산화된 올리고사카라이드를 제공한다.
다섯 번째 측면에 따라, 영양 조성물의 제조를 위한, 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 갖는 바실러스 세포에 의해 생산된 시알산화된 올리고사카라이드의 용도를 제공한다.
여섯 번째 측면에 따라, 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 갖는 바실러스 세포에 의해 생산된 적어도 하나의 시알산화된 올리고사카라이드를 함유하는 영양 조성물을 제공한다.
도 1은 시알산화된 올리고사카라이드의 생산을 위해 바실러스 세포에서 실행되는 CMP-NeuNAc 생합성 경로의 상이한 구현예를 예시한다.
첫 번째 측면에 따라, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 속의 비-포자형성 세균 세포를 제공한다. 시알산화된 올리고사카라이드의 생산이 가능하기 위해서, 상기 바실러스 세포는, 시알릴트랜스퍼라제가 시알산 부분을 공여자 기질로부터 수용자 기질로 전달하여 시알산화된 올리고사카라이드를 생성시킬 수 있도록, 시알산 부분을 포함하는 공여자 기질 및 디사카라이드 또는 올리고사카라이드인 수용자 기질을 시알릴트랜스퍼라제에 제공해야 한다.
상기 바실러스 세포가 생산하고자 하는 시알산화된 올리고사카라이드가 목적하는 시알산화된 올리고사카라이드인 반면, 상기 바실러스 세포에서 상기 목적하는 시알산화된 올리고사카라이드의 생산 중에 상기 시알릴트랜스퍼라제의 무차별 혼합으로 인해 생성될 수도 있는 다른 시알산화된 올리고사카라이드는, 목적하지 않는 시알산화된 올리고사카라이드 또는 부산물로서 간주되는 것을 이해해야 한다.
시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 비-포자형성 바실러스 세포이다. 야생형 바실러스 세포는 포자를 형성할 수 있다. 세균에서 포자형성, 즉 포자를 형성하는 과정은, 별개의 형태 및 운명의 딸 세포의 형성으로 이어지는 발생 프로그램을 개시시키는 세균 세포의 반응인 것으로 간주된다. 바실러스의 포자형성은 세포 분화에 대한 기본 모델로서 연구되었다. 포자형성 동안, 막대-모양 바실러스 세포가 비대칭적으로 분열하여, 상이한 형태 및 운명을 갖는 2개의 유전적으로 동일한 세포를 생성시킨다.
그러나, 산업적인 생산에서, 세균 생산 균주가 목적하는 생성물의 발효 생산 중에 포자를 형성하는 것은 바람직하지 않다. 따라서, 시알산화된 올리고사카라이드의 생산을 위해 포자를 형성할 수 없는 바실러스 세포를 사용하는 것이 바람직하다. 이러한 바실러스 세포를 "비-포자형성"이라 칭한다.
하나의 구현예에서, 시알산화된 올리고사카라이드의 생산을 위한 비-포자형성 바실러스 세포는 표 1에 나열된 바실러스 서브틸리스 균주 중 하나로부터 기원하였다.
[표 1]
바실러스 서브틸리스 균주의 비제한적인 목록
일부 구현예에서, 바실러스 세포를 예를 들어 SpoOA의 결실 또는 기능적 불활성화에 의해 비-포자형성성으로 되도록 유전자 조작하였다. SpoOA는 초기 발아형성 단계 동안 500개를 초과하는 유전자의 발현에 직접적으로 또는 간접적으로 영향을 미치는 DNA-결합 단백질이다. Spo0A의 적합한 기능적 불활성화는 Spo0F 및 Spo0B 포스포트랜스퍼라제가 Spo0A를 인산화하는 인산화 부위의 결실을 포함한다. 상기 Spo0F 및 Spo0B 포스포트랜스퍼라제 인산화 부위의 결실 또는 기능적 불활성화는 Spo0A의 기능적 불활성화로 이어지며 이에 의해 포자를 형성하는 바실러스 세포의 능력이 손상된다. 대안적으로, Spo0A를 암호화(encoding)하는 유전자 또는 뉴클레오티드 서열, 또는 Spo0A를 암호화하는 유전자 또는 뉴클레오티드 서열의 부분을 바실러스 세포의 게놈으로부터 결실시킬 수 있다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포를 시그마 인자 SigE(sigE) 및/또는 시그마 인자 SigF(sigF)를 암호화하는 유전자(들)의 결실 또는 기능적 불활성화에 의해 유전자 조작하였다. 시그마 인자 SigE 및 SigF는 초기 포자형성 단계에 관련되는 단백질을 암호화하는 유전자의 발현에 관련된 전사 인자들이다.
Spo0A, SigE 및/또는 SigF의 결실 또는 기능적 불활성화는 포자를 형성하는 바실러스 세포의 포자형성 능력을 손상시킨다. 이와 같은 비-포자형성 바실러스 세포를, 시알산화된 올리고사카라이드를 생산할 수 있는 바실러스 세포의 생성을 위한 전구세포로서 사용할 수 있다.
야생형 바실러스 세포는 락토스를 세포내에서 합성하지도 않고, 외인성 락토스를 내면화하지도 않는다. 그러나, 락토스는 3'-시알릴락토스(3-SL) 또는 6'-시알릴락토스(6-SL)와 같은 일부 시알산화된 올리고사카라이드의 형성에서 락토스-수용 시알릴트랜스퍼라제에 의한 시알산 부분에 대한 수용자 기질이다. 따라서, 이와 같은 시알산화된 올리고사카라이드를 생산할 수 있기 위해서 바실러스 세포는, 락토스를 세포내에서 생성시키고/시키거나 외인성 락토스를 내면화함으로써, 락토스-수용 시알릴트랜스퍼라제에 락토스를 제공하는 능력을 가져야 한다. 더욱이, 락토스는 전형적으로 대부분 시알산화된 HMO(전부는 아니지만)가 갖는 디사카라이드 부분이다. 따라서, 락토스의 내면화가 또한, 트리사카라이드 외의 다른 시알산화된 HMO의 생합성에, 즉 NeuNAc 부분에 대한 수용자 기질이 디사카라이드 락토스보다는 올리고사카라이드인 경우에, 요구된다.
하나의 구현예에서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 외인성 락토스의 내면화를 위한 락토스 퍼미아제를 갖는다. 따라서, 상기 바실러스 세포는 외인성 락토스를 내면화할 수 있다. 대안적으로, 상기 바실러스 세포를, 락토스의 외인성 공급이 시알산화된 올리고사카라이드의 생산에 필요하지 않도록 세포내에서 글루코스 및 갈락토스로부터 락토스를 합성하도록 유전자 조작할 수 있다.
본원에 사용되는 바와 같은 락토스에 관한 "외인성"이란 용어는 시알산화된 올리고사카라이드의 생산을 위해 바실러스 세포로부터 기원하지 않고, 즉 상기 바실러스 세포에 의해 세포내적으로 합성되지 않고, 상기 바실러스 세포의 외부로부터 기원하며 상기 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포가 증식하여 상기 시알산화된 올리고사카라이드를 생산하는 배양 배지에 첨가되는 락토스를 지칭한다.
일부 구현예에서, 바실러스 세포는 외인성 락토스를 내면화할 수 있도록 유전자 조작되었다, 즉 락토스 퍼미아제를 갖도록 유전자 조작되었다. 따라서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 이종 락토스 퍼미아제를 갖는다. 적합한 이종 락토스 퍼미아제는 이. 콜라이 LacY 또는 이의 기능성 변이체이다.
단백질, 폴리펩티드, 효소 및 수송체뿐만 아니라, 핵산 분자, 뉴클레오티드 서열 및/또는 유전자와 관련하여 본원에 사용되는 바와 같은 "이종"이란 용어는 분자를 함유하는 바이러스 세포의 종에 고유하지 않은 상기 분자를 지칭한다. "고유하지 않은"이란 용어는 상기 분자가 천연 또는 야생형 바실러스 전구세포(wild-type progenitor bacillus cell), 즉 자연에서 가장 통상적으로 존재하는 동일한 종의 바실러스 세포에 존재하지 않음을 가리킨다. 따라서, 본원에 사용되는 바와 같은 "이종 서열" 또는 "이종 핵산" 또는 "이종 폴리펩티드"는 바실러스 세포에 대해 외부 공급원으로부터(예를 들어 상이한 종으로부터) 기원하거나, 또는 동일한 종으로부터 기원하는 경우, 이의 원래 형태로부터 변형된 것이다. 이종 서열은 예를 들어 형질감염, 형질전환, 접합 또는 형질도입에 의해 숙주 미생물 숙주 세포의 게놈내로 안정하게 도입되어, 유전자 변형된 숙주 세포를 나타낼 수 있다. 서열이 도입되는 숙주 세포에 따라 기법을 적용할 수 있다. 다양한 기법이 당업자에게 공지되어 있으며 예를 들어 문헌[Sambrook et al, Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989)]에 개시되어 있다. 상응하게, "이종 폴리펩티드"는 세포에서 자연적으로 존재하지 않는 폴리펩티드이며, "이종 시알릴트랜스퍼라제"는 미생물 세포 중에 자연적으로 존재하지 않는 시알릴트랜스퍼라제이다.
효소 및/또는 수송 분자와 관련하여 본원에 사용되는 바와 같은 "기능성 변이체"란 용어는, 참조 효소 또는 수송체와 동일한 활성(효소, 촉매 또는 변위)을 갖지만 상기 참조 효소 또는 수송체 분자와 상이한 아미노산 서열을 갖는 단백질 또는 폴리펩티드를 지칭한다. 따라서, 단백질/폴리펩티드의 전형적인 변이체는 상기 참조 단백질/폴리펩티드와 아미노산 서열이 상이하다. 변이체 및 참조 단백질/폴리펩티드는 하나 이상의 치환, 부가, 및/또는 결실의 임의의 조합에 의해 아미노산 서열이 상이할 수 있다. 따라서, "기능성 변이체"란 용어는 참조 단백질/폴리펩티드와 동일한 활성을 갖는 참조 단백질/폴리펩티드의 절두된 버전을 포함한다. 치환되거나 삽입된 아미노산 잔기는 유전 암호에 의해 암호화된 것이거나 암호화된 것이 아닐 수 있다. 단백질/폴리펩티드의 변이체는 대립유전자 변이체와 같이 천연이거나, 또는 자연에서 발생하지 않는 것으로 공지된 변이체일 수 있다. 단백질/폴리펩티드의 비-천연 변이체는 돌연변이유발 기법에 의해, 직접 합성에 의해, 및 당업자에게 공지된 다른 재조합 방법에 의해 제조될 수 있다. 본 개시내용의 범위내에서, 또한 단백질 및 종간 상동체가, 참조 폴리펩티드에 대해, 바람직하게는 적어도 약 25, 50, 100, 200, 500, 1000개 이상의 아미노산에 걸쳐 약 60% 초과의 아미노산 서열 일치성, 바람직하게는 65%, 70%, 75%, 80%, 85%, 90%, 보다 바람직하게는 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 아미노산 서열 일치성을 갖는 아미노산 서열을 갖는 "변이체"란 용어에 의해 포함된다.
본원에 사용되는 바와 같은 "동일한 활성"이란 용어는 단지 정성적인 방식의 단백질/폴리펩티드의 효소, 촉매 또는 변위 활성을 지칭한다. 따라서, "기능성 변이체"는 또한 참조 단백질/폴리펩티드의 활성과 비교하여, 증가되거나 감소된 활성을 갖는 변이체를 포함한다.
다양한 구현예에서, 바실러스 세포는 락토스 퍼미아제를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 락토스 퍼미아제 LacY(UniProtKB - P02920) 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
상기 이. 콜라이 락토스 퍼미아제 LacY는 이. 콜라이 lacY 유전자(GenBank acc. no: NP_414877.1)의 단백질 암호화 영역(즉 개방 판독 프레임)에 의해 암호화된다.
따라서, 일부 구현예에서, 바실러스 세포는 이. 콜라이 lacY의 단백질-암호화 영역을 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
일부 구현예에서, 이종 락토스 퍼미아제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다. 예를 들어 바실러스 서브틸리스의 코돈 사용빈도는 전체 GC-함량이 약 45% 미만이고, 상기 코돈의 첫 번째 문자의 GC-함량은 약 51% 초과이고, 상기 코돈의 두 번째 문자의 CG-함량은 약 36.1% 미만이고, 상기 코돈의 세 번째 문자의 CG-함량은 약 46% 미만이라는 점에서 독특하다.
락토스 퍼미아제의 발현을 위해서, 바실러스 세포는 재조합 락토스 퍼미아제 유전자를 함유하며, 여기서 상기 락토스 퍼미아제를 암호화하는 뉴클레오티드 서열은 상기 락토스 퍼미아제를 암호화하는 뉴클레오티드 서열의 발현을 매개하는 발현 조절 서열에 작동적으로 연결된다.
본원에 사용되는 바와 같은 "작동적으로 연결된"이란 용어는 폴리펩티드 또는 단백질을 암호화하는 뉴클레오티드 서열(전형적으로 "단백질 암호화 영역", "개방 판독 프레임", 및 때때로 심지어 "유전자"로서)과, 상기 폴리펩티드 또는 단백질을 암호화하는 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 제2 뉴클레오티드 서열(발현 조절 서열, 예를 들어 프로모터, 신호 서열, 또는 전사 인자 결합 부위의 배열)간의 기능적 연결을 의미할 것이다. 상응하게, "프로모터"란 용어는 대개 DNA 중합체 중의 개방 판독 프레임에 "선행하고" mRNA로의 전사 개시를 위한 부위를 제공하는 데옥시리보핵산(DNA) 서열을 표시한다. "조절제" DNA 서열(또한 대개 주어진 DNA 중합체 중의 개방 판독 프레임의 "상류"(즉 선행하는))은 전사 개시의 빈도(또는 비율)를 결정하는 단백질에 결합한다. "프로모터/조절제" 또는 "조절" DNA 서열로서 종합적으로 지칭되는, 기능성 DNA 중합체에서 선택된 개방 판독 프레임(또는 일련의 개방 판독 프레임)에 선행하는 이들 서열은 개방 판독 프레임의 전사(및 최종적인 발현)가 발생할 것인지를 협력하여 결정한다. DNA 중합체 중의 유전자"에 이어지고" mRNA로의 전사에 대한 종결 신호를 제공하는 DNA 서열을 전사 "종결자" 서열이라 칭한다.
재조합 락토스 퍼미아제 유전자는 바실러스 염색체내에 통합되는 것으로서 제공되거나, 또는 바실러스 세포내 추가적인 플라스미드상의 에피솜 버전으로서 제공될 수 있다.
바실러스 세포에서 이종 락토스 퍼미아제 유전자의 발현은 생성되는 바실러스 세포가 배양 배지로부터의 외부적으로 공급된 락토스를 내면화하게 할 수 있다. 이어서 상기 내면화된 락토스는 예를 들어 3'-SL 또는 6'-SL의 형태로, 락토스 수용 시알릴트랜스퍼라제(본원의 하기를 참조하시오)에 의해 전달되는 시알산 부분에 대한 수용자 기질로서 작용할 수 있다.
시알산화된 올리고사카라이드의 생산을 위해서, 바실러스는 NeuNAc 부분을 수용자 기질로 전달하기 위한 공여자 기질을 제공할 수 있어야 한다. NeuNAc 부분에 대한 예시적인 공여자 기질은 CMP-NeuNAc이다. 따라서, 바실러스 세포는 시알산화된 올리고사카라이드의 생산을 위해 CMP-NeuNAc를 세포내에서 생산할 수 있어야 한다. CMP-NeuNAc의 세포내 생합성을 위해서, 바실러스 세포는 CMP-NeuNAc 생합성 경로를 갖는다(도 1). 따라서, 바실러스 세포는 CMP-NeuNAc 생합성 경로를 갖도록 유전자 조작되었다.
상기 CMP-NeuNAc 생합성 경로는 NeuNAc의 세포내 드노보 생합성을 위한 NeuNAc 회수 경로 또는 시알산 생합성 경로를 포함한다. 따라서, 바실러스 세포는 NeuNAc 회수 경로 및/또는 시알산 생합성 경로를 포함하는 CMP-NeuNAc 생합성 경로를 갖는다.
상기 NeuNAc 회수 경로는 바실러스 세포에 의한 외인성 시알산의 내면화, 및 내면화된 시알산의 CMP-NeuNAc로의 전환을 포함한다. 외인성 NeuNAc의 내면화를 위해서, 바실러스 세포는 시알산 수송체를 갖는다. 일부 구현예에서, 유전자 조작된 바실러스는 외인성 NeuNAc의 내면화를 위한 시알산 수송체를 갖도록 유전자 조작되었다. 적합한 시알산 수송체는 이. 콜라이 NanT(UniProtKB P41036)이다. 이. 콜라이 NanT는 시알산의 양성자-의존적인 동반수송(symport)을 촉매화한다. NanT는 NeuNAc뿐만 아니라 관련된 시알산 N-글리콜릴뉴라민산(NeuNGc) 및 3-케토-3-데옥시-D-글리세로-D-갈락토논논산(KDN)을 수송할 수 있다. 하나의 구현예에서, 유전자 조작된 바실러스는 이. 콜라이 NanT 또는 이의 기능성 변이체를 갖는다.
일부 구현예에서, 바실러스 세포는 외인성 NeuNAc의 내면화를 위한 시알산 수송체를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 NanT 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
상기 이. 콜라이 NanT는 이. 콜라이 nanT 유전자의 단백질-암호화 영역에 의해 암호화된다. 따라서, 일부 구현예에서, 바실러스 세포는 이. 콜라이 시알산 수송체 NanT 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
시알산 수송체의 발현을 위해서, 바실러스 세포는 재조합 시알산 수송체 유전자를 함유하며, 여기서 상기 시알산 수송체를 암호화하는 뉴클레오티드 서열은 상기 시알산 수송체를 암호화하는 뉴클레오티드 서열의 발현을 매개하는 발현 조절 서열에 작동적으로 연결된다.
상기 재조합 시알산 수송체 유전자는 바실러스 염색체내에 통합되는 것으로서 제공되거나, 바실러스 세포 중의 추가적인 플라스미드 상의 에피솜 버전으로서 제공될 수 있다.
일부 구현예에서, 시알산 수송체를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
다양한 구현예에서, CMP-NeuNAc 생합성 경로는 시알산 생합성 경로를 포함한다. 따라서, 바실러스 세포는 N-아세틸뉴라민산의 세포내 생합성을 위한 시알산 생합성 경로를 포함할 수 있다. 상기 시알산 생합성 경로는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제(도 1: ①) 및 N-아세틸-뉴라민산 신타제(=시알산 신타제)(도 1: ⑩)의 효소 활성을 포함한다. 따라서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 및 N-아세틸뉴라민산 신타제를 갖는다.
상기 효소 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제(EC 2.6.1.16)는 글루타민(도 1: ①)을 사용하여 프럭토스-6-포스페이트(Frc-6P)의 글루코스아민-6-포스페이트(GlcN-6P)로의 전환을 촉매화한다. 이러한 효소 반응은 전형적으로 헥소스아민 생합성 경로의 첫 번째 단계로 간주된다. 상기 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제의 대체명은 D-프럭토스-6-포스페이트 아미노트랜스퍼라제, GFAT, 글루코스아민-6-포스페이트 신타제, 헥소스포스페이트 아미노트랜스퍼라제, 및 L-글루타민-D-프럭토스-6-포스페이트 아미노트랜스퍼라제이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제, 바람직하게는 이종 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제를 갖는다. 적합한 이종 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제의 일례는 이. 콜라이로부터 유래된다. 이. 콜라이 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제(UniProtKB - P17169)는 GlmS라 표시된다. 따라서, 바실러스 세포는 이. 콜라이 GlmS 또는 이. 콜라이 GlmS의 기능성 변이체를 갖는다. 바람직하게, 상기 이. 콜라이 GlmS의 기능성 변이체는 야생형 효소와 비교하여 글루코스아민-6-포스페이트 억제에 대해 현저하게 감소된 감도를 보이는 버전이다. 글루코스아민-6-포스페이트 억제에 대해 현저하게 감소된 감도를 보이는 이. 콜라이 GlmS의 기능성 변이체의 일례. 글루코스아민-6-포스페이트 억제에 대해 현저하게 감소된 감도를 보이는 이. 콜라이 GlmS의 기능성 변이체의 일례는 국제 출원 PCT/EP2019/063669(본원에 참고로 인용된다)에 기재된 바와 같은 GlmS*54 및 GlmS*이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제, 바람직하게는 이. 콜라이 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 GlmS를 암호화하는 뉴클레오티드 서열, 또는 야생형 효소와 비교하여 글루코스아민-6-포스페이트 억제에 대해 현저하게 감소된 감도를 보이는 이. 콜라이 GlmS의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 분자를 함유한다.
글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제의 발현을 위해서, 바실러스 세포는 재조합 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 유전자를 함유하며, 여기서 상기 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제를 암호화하는 뉴클레오티드 서열은 상기 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 개방 판독 프레임의 발현을 매개하는 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드 상의 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 시알산 신타제를 포함한다. 상기 시알산 신타제는 N-아세틸만노스아민(ManNAc) 및 포스포에놀피루베이트(PEP)의 N-아세틸뉴라민산(NeuNAc)에의 축합(도 1: ⑩)을 촉매화한다. NeuNAc의 효소적 형성은 시알산 생합성 경로의 최종 단계이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 시알산 신타제 또는 이의 기능성 변이체, 바람직하게는 이종 시알산 신타제를 포함한다. 다양한 세균 종, 예를 들어 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 아갈락티아에(Streptococcus agalac-tiae), 부티리비브리오 프로테오클라스티쿠스(Butyrivibrio proteoclasticus), 메타노브레비박터 루미나티움(Methanobrevibacter ruminatium), 아세토박테리움 우디이(Acetobacterium woodii), 데술포바큘라 톨루올리카(Desulfobacula toluolica), 에스케리키아 콜라이(Escherichia coli), 프레보텔라 니게센스(Prevotella nigescens), 할로라브두스 티아마테아(Halorhabdus tiamatea), 데술포티그눔 포스피톡시단스(Desulfotignum phosphitoxidans) 또는 칸디다투스 스칼린두아 스페시즈(Candidatus Scalindua sp.), 이도마리나 이오이히엔시스(Idomarina loihiensis), 푸소박테리움 뉴클레아툼(Fusobacterium nucleatum) 또는 네이세리아 메닌지티디스(Neisseria meningitidis)로부터의 시알산 신타제의 예가 공지되어 있다. 적합한 시알산 신타제의 일례는 씨 제주니 neuB 유전자에 의해 암호화된 바와 같은 씨 제주니의 N-아세틸뉴라민산 신타제 NeuB이다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸뉴라민산 신타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, N-아세틸뉴라민산 신타제를 암호화하는 뉴클레오티드 서열은, 세포내 N-아세틸뉴라민산 신타제 활성을 제공하기 위해 유전자 조작된 바실러스 세포 중의 N-아세틸뉴라민산 신타제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸뉴라민산 신타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸뉴라민산 신타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
하나의 구현예에서, 시알산 생합성 경로는 중간체 화합물로서 유리딘 디포스페이트-N-아세틸글루코스아민(UDP-GlcNAc)를 포함한다. 중간체 화합물로서 UDP-GlcNAc를 포함하는 시알산 생합성 경로를 포함하는 바실러스 세포는 포스포글루코스아민 뮤타제(도 1: ②), 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제(도 1: ③), N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제(도 1 ④), 및 UDP-N-아세틸글루코스아민 2-에피머라제(도 1: ④)를 추가로 갖는다.
상기 포스포글루코스아민 뮤타제는 글루코스아민-6-포스페이트(GlcN-6P)를 글루코스아민-1-포스페이트(GlcN-1P)로 전환시킨다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 포스포글루코스아민 뮤타제를 갖도록 유전자 조작되었다. 적합한 포스포글루코스아민 뮤타제는 이. 콜라이 포스포글루코스아민 뮤타제 GlmM 또는 이의 기능성 변이체이다. 상기 이. 콜라이 GlmM은 이. 콜라이 glmM 유전자에 의해 암호화된다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는, 포스포글루코스아민 뮤타제를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 GlmM 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
상기 이. 콜라이 포스포글루코스아민 뮤타제 GlmM은 이. 콜라이 glmM 유전자의 단백질 암호화 영역에 의해 암호화된다. 따라서, 바실러스 세포는 이. 콜라이 GlmM을 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 포스포글루코스아민 뮤타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, 포스포글루코스아민 뮤타제를 암호화하는 뉴클레오티드 서열은, 세포내 포스포글루코스아민 뮤타제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 포스포글루코스아민 뮤타제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 포스포글루코스아민 뮤타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 포스포글루코스아민 뮤타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제는, 아세틸 조효소 A에서 글루코스아민-1-포스페이트(GlcN-1-P)로의 아세틸기의 전달을 촉매화하여 N-아세틸글루코스아민-1-포스페이트(GlcNAc-1-P)를 생성시킨다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 갖도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열은, 세포내 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제는, 유리딘 5-모노포스페이트(유리딘 5-트리포스페이트로부터)의 전달에 의해 N-아세틸글루코스아민-1-포스페이트(GlcNAc-1-P)를 UDP-GlcNAc로 전환시킨다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 갖도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열은, 세포내 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제 활성 및 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 활성이 이중기능성 효소에 의해 제공된다. 이와 같은 효소의 일례는 이. 콜라이 GlmU이다. 이. 콜라이 GlmU는 글루코스아민-1-포스페이트를 UDP-GlcNAc로 전환시키는(도 1: ③) 최종 2개의 순차적인 반응을 촉매화한다. C-말단 도메인은 아세틸 조효소 A에서 글루코스아민-1-포스페이트(GlcN-1-P)로의 아세틸기의 전달을 촉매화하여 N-아세틸글루코스아민-1-포스페이트(GlcNAc-1-P)(이는 N-말단 도메인에 의해 촉매화되는 반응인 유리딘 5-모노포스페이트(유리딘 5-트리포스페이트로부터)의 전달에 의해 UDP-GlcNAc로 전환된다)를 생성시킨다.
이와 같은 이중기능성 효소는 또한 바실러스 서브틸리스 및 헤모필루스 인플루엔자에로부터 공지되어 있다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 이종의 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 갖도록 유전자 조작되었다. 적합한 예는 이. 콜라이 GlmU 또는 이의 기능성 변이체(에이치 인플루엔자에 GlmU 포함)이다. 상기 이. 콜라이 GlmU는 이. 콜라이 glmU 유전자에 의해 암호화된다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 상기 이중기능성 효소를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 GlmU 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하거나 과발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열은, 세포내 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제 활성 및 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 시알산 생합성 경로는 UDP-GlcNAc의 N-아세틸만노스아민(ManNAc)으로의 전환을 포함한다. 이러한 전환은 단지 UDP-N-아세틸글루코스아민을 UDP-N-아세틸만노스아민으로만 전환시키지 않고 UDP를 동반하여 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제에 의해 촉매화될 수 있다(도 1: ④).
따라서, 바실러스 세포는 UDP를 동반하여 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제 에피머라제를 포함한다.
UDP를 동반 방출하는 적합한 UDP-N-아세틸글루코스아민 2-에피머라제 에피머라제는 캄필로박터 제주니 neuC 유전자에 의해 암호화된, 캄필로박터 제주니 UDP-N-아세틸글루코스아민 2-에피머라제 NeuC이다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 UDP를 동반 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제를 갖도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 UDP를 동반 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열, 바람직하게는 씨 제주니 NeuC 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
상기 씨 제주니 UDP-N-아세틸글루코스아민 2-에피머라제 NeuC는 상기 씨 제주니 neuC 유전자의 단백질 암호화 영역에 의해 암호화된다. 따라서, 바실러스 세포는 씨 제주니 NeuC를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는, 효소 반응 동안 UDP의 동반 방출과 함께 ManNAc를 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, UDP를 동반하여 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열은, 세포내 UDP-N-아세틸글루코스아민 2-에피머라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, UDP를 동반하여 방출하는 이종 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 UDP-N-아세틸글루코스아민 2-에피머라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
대안의 구현예에서, 시알산 생합성 경로는 중간체로서 N-아세틸-글루코스아민-6-포스페이트(GlcNAc-6-P)를 사용하지만, UDP-GlcNAc는 사용하지 않는다. 유전자 조작된 바실러스 세포는 중간체로서 GlcNAc-6-P를 사용하고 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제를 포함하는 N-아세틸뉴라민산의 세포내 생합성에 대한 시알산 생합성 경로를 포함한다(도 1: ⑤). N-아세틸뉴라민산의 세포내 생합성을 위해 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제를 사용하는 시알산 생합성 경로는 시알산의 생합성을 위해 UDP-GlcNAc를 사용하지 않는다.
GlcNAc-6P를 사용하는 시알산 생합성 경로는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제(도 1: ①) 및 N-아세틸뉴라민산 신타제(도 1: ⑩)의 효소 활성을 포함한다. 상기 시알산 생합성 경로는 a) 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제(도 1: ⑤), N-아세틸글루코스아민-6-포스페이트 포스파타제(도 1: ⑥), 및 N-아세틸글루코스아민 2-에피머라제(도 1: ⑧)의 효소 활성 또는 b) 글ㄹ코스아민-6-포스페이트 N-아세틸트랜스퍼라제(도 1: ⑤), N-아세틸글루코스아민-6-포스페이트 에피머라제(도 1: ⑦) 및 N-아세틸만노스아민-6-포스페이트 포스파타제(도 1: ⑨)의 효소 활성을 추가로 포함한다. 따라서, 유전자 조작된 바실러스 세포는 세포내 시알산 생합성을 위해 포스포글루코스아민 뮤타제, N-아세틸글루코스아민-6-포스페이트 유리딜트랜스퍼라제 및 UDP를 동반 방출하는 UDP N-아세틸글루코스아민 2-에피머라제의 효소 활성을 포함할 필요가 없다. 따라서, 추가적인 및/또는 대안의 구현예에서, 시알산을 합성할 수 있는 유전자 조작된 바실러스 세포는 포스포글루코스아민 뮤타제, N-아세틸글루코스아민-6-포스페이트 유리딜트랜스퍼라제 및 UDP를 동반 방출하는 UDP N-아세틸글루코스아민 2-에피머라제의 효소 활성으로 이루어지는 그룹 중에서 선택된 하나 이상의 효소 활성을 포함하지 않는다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제 활성을 갖는다. 상기 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제 활성은 GlcN-6P를 N-아세틸글루코스아민-6-포스페이트(GlcNAc-6P)로 전환시킨다. 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제의 일례는 사카로마이세스 세레비지아에 Gna1(UniProtKB - P43577)이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제, 바람직하게는 이종 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제, 보다 바람직하게는 에스 세레비지아에로부터의 Gna1 또는 이의 기능성 변이체를 함유한다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제, 바람직하게는 에스 세레비지아에 Gna1을 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유하며, 여기서 상기 뉴클레오티드 서열은, 세포내 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 포스파타제 활성을 갖는다. 상기 N-아세틸글루코스아민-6-포스페이트 포스파타제 활성은 GlcNAc-6P를 N-아세틸글루코스아민(GlcNAc)으로 전환시킨다. N-아세틸글루코스아민-6-포스페이트 포스파타제의 예는 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제이다. 상기 효소의 HAD-유사 상과는 세균 효소 할로애시드 데하이드로게나제 후에 명명되며 포스파타제를 포함한다. GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 적합한 포스파타제는 프럭토스-1-포스페이트 포스파타제(YqaB, UniProtKB - P77475) 및 알파-D-글루코스 1-포스페이트 포스파타제(YihX, UniProtKB - P0A8Y3)로 이루어지는 그룹 중에서 선택될 수 있다. 이. 콜라이 YqaB 및 이. 콜라이 YihX 효소는 또한 GlcNAc6P상에서 작용하는 것으로 간주된다(Lee, S.-W. and Oh, M.-K. (2015) Metabolic Engineering 28: 143-150).
추가적인 및/또는 대안의 구현예에서, GlcNAc-6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제는 유전자 조작된 바실러스 세포 중의 이종 효소이다. 추가적인 및/또는 대안의 구현예에서, 상기 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제는 이. 콜라이 YqaB, 이. 콜라이 YihX, 및 이의 기능성 변이체로 이루어지는 그룹 중에서 선택된다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 추가적인 및/또는 대안의 구현예에서, 상기 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제를 암호화하는 뉴클레오티드 서열은 이종 뉴클레오티드 서열이다. 추가적인 및/또는 대안의 구현예에서, 상기 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제를 암호화하는 뉴클레오티드 서열은 이. 콜라이 YqaB 또는 이. 콜라이 YihX 또는 이들 두 효소 중 하나의 기능성 변이체를 암호화한다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸글루코스아민 6-포스페이트 포스파타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸글루코스아민-6-포스페이트 포스파타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민 2-에피머라제 활성을 갖는다. N-아세틸글루코스아민 2-에피머라제(EC 5.1.3.8)는 N-아세틸-글루코스아민(GlcNAc)의 N-아세틸만노스아민(ManNAc)으로의 전환을 촉매화하는 효소이다. 상기 효소는 탄수화물 및 이의 유도체상에서 작용하는 라세마제이다. 이 효소 부류의 계통명은 N-아실-D-글루코스아민 2-에피머라제이다. 상기 효소는 아미노-당 대사 및 뉴클레오티드-당 대사에 관여하며, 바람직하게는 이종 N-아세틸글루코스아민 2-에피머라제이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민 2-에피머라제, 바람직하게는 이종 N-아세틸글루코스아민 2-에피머라제를 포함한다. N-아세틸글루코스아민 2-에피머라제의 예는 아나베나 바리아빌리스(Anabena variabilis), 아카리오클로리스 스페시즈(Acaryochloris sp.), 노스톡 스페시즈(Nostoc sp.), 노스톡 푼크티포르메(Nostoc punctiforme), 박테로이데스 오바투스(Bacteroides ovatus) 또는 시네코시스티스 스페시즈(Synechocystis sp.)로부터 기재되었다. 적합한 N-아세틸글루코스아민 2-에피머라제의 일례는 유전자 BACOVA_01816에 의해 암호화되는 바와 같은 바실러스 오바투스 ATCC 8483(UniProtKB - A7LVG6)의 N-아세틸글루코스아민 2-에피머라제이다. 또 다른 예는 시네코시스티스 스페시즈(균주 PCC 6803)(UniProtKB - P74124)의 N-아세틸글루코스아민 2-에피머라제이며, 이는 또한 레닌-결합 단백질로서 공지되어 있고 slr1975 유전자에 의해 암호화된다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민 2-에피머라제, 바람직하게는 바실러스 오바투스 ATCC 8483 또는 시네코시스티스 스페시즈(균주 PCC 6803)의 N-아세틸글루코스아민 2-에피머라제 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 분자를 함유한다.
따라서, 상기 N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열은, 세포내 N-아세틸글루코스아민 2-에피머라제 활성을 제공하기 위해서 상기 유전자 조작된 바실러스 세포 중의 N-아세틸글루코스아민 2-에피머라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸글루코스아민 2-에피머라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 에피머라제 활성 및 N-아세틸-만노스아민-6-포스페이트 포스파타제 활성을 갖는다. N-아세틸글루코스아민-6-포스페이트 에피머라제는 N-아세틸글루코스아민-6-포스페이트(GlcNAc-6P)를 N-아세틸만노스아민-6-포스페이트(ManNAc-6P)로 전환시키는 반면, N-아세틸글루코스아민-6-포스페이트 포스파타제는 ManNAc-6P를 탈인산화하여 N-아세틸만노스아민(ManNAc)을 제공한다. N-아세틸글루코스아민-6-포스페이트 에피머라제 활성 및 N-아세틸만노스아민-6-포스페이트 포스파타제 활성을 갖는 것은 Neu5Ac 생산을 위해 ManNAc를 제공하는 추가적인 또는 대안의 방식을 제공한다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 에피머라제를 함유한다. 적합한 N-아세틸글루코스아민-6-포스페이트 에피머라제의 일례는 이. 콜라이 nanE 유전자에 의해 암호화되는 바와 같은 이. 콜라이 NanE(UniprotKB POA761)이다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 에피머라제를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 NanE를 암호화하는 뉴클레오티드 서열 또는 이의 기능성 변이체를 포함하고 발현하는 핵산 분자를 함유한다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 에피머라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유하며, 여기서 상기 뉴클레오티드 서열은, 세포내 N-아세틸글루코스아민-6-포스페이트 에피머라제 활성을 제공하기 위해서 상기 유전자 조작된 미생물 세포 중의 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸글루코스아민-6-포스페이트 에피머라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 ManNAc-6P를 ManNAc로 전환시키는 N-아세틸글루코스아민-6-포스페이트 포스파타제를 함유한다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸만노스아민-6-포스페이트 포스파타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, N-아세틸만노스아민-6-포스페이트 포스파타제를 암호화하는 뉴클레오티드 서열은, 세포내 N-아세틸만노스아민-6-포스페이트 포스파타제 활성을 제공하기 위해서 상기 유전자 조작된 바실러스 세포 중의 N-아세틸만노스아민-6-포스페이트 포스파타제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸만노스아민-6-포스페이트 포스파타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸만노스아민-6-포스페이트 포스파타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
유전자 조작된 바실러스 세포는, 시티딘 5'-모노포스페이트를 N-아세틸뉴라민산상에 전달하여 CMP-활성화된 N-아세틸뉴라민산(CMP-NeuNAc)을 생성시키기 위해 시티딘 5'-모노포스포(CMP)-N-아세틸뉴라민산 신시타제(도 1: ⑪)를 갖는다. 다수의 5'-모노포스포(CMP)-시알산 신시타제, 예를 들어 이. 콜라이, 네이세리아 메닌지티디스, 캄필로박터 제주니, 스트렙토코커스 스페시즈 등으로부터의 5'-모노포스포-(CMP)-시알산 신시타제가 당해 분야에 공지되어 있고 기재되었다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제, 바람직하게는 이종 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제, 보다 바람직하게는 캄필로박터 제주니로부터의 N-아세틸뉴라미네이트 시티딜트랜스퍼라제 NeuA를 함유한다. 캄필로박터 제주니 NeuA는 캄필로박터 제주니 neuA 유전자에 의해 암호화된다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유하며, 여기서 상기 뉴클레오티드 서열은, N-아세틸뉴라미네이트 시티딜트랜스퍼라제 활성을 제공하기 위해서 상기 유전자 조작된 미생물 중의 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
유전자 조작된 바실러스 세포는 시알릴트랜스퍼라제, 바람직하게는 이종 시알릴트랜스퍼라제, 및 보다 바람직하게는 α-2,3-시알릴트랜스퍼라제 활성, α-2,6-시알릴트랜스퍼라제 활성 및/또는 α-2,8-시알릴트랜스퍼라제 활성으로 이루어지는 그룹 중에서 선택된 시알릴트랜스퍼라제 활성을 갖는다. 상기 시알릴트랜스퍼라제 활성은 CMP-NeuNAc로부터 수용자 분자(여기서 상기 수용자 분자는 사카라이드 분자이다)로 N-아세틸뉴라민산 부분을 전달하여 시알산화된 사카라이드를 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 미생물 세포는 적어도 하나의 시알릴트랜스퍼라제, 바람직하게는 적어도 하나의 이종 시알릴트랜스퍼라제를 함유하며, 여기서 상기 시알릴트랜스퍼라제는 공여자 기질로서 CMP-NeuNAc로부터 NeuNAc 부분을 수용자 사카라이드로 전달하기 위한 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성 및/또는 α-2,8-시알릴트랜스퍼라제 활성을 가질 수 있다. 예시적인 시알릴트랜스퍼라제 및 이의 유전자를 표 2에 나타낸다.
본원에 사용되는 바와 같은 "시알릴트랜스퍼라제"란 용어는 시알릴트랜스퍼라제 활성을 가질 수 있는 폴리펩티드를 지칭한다. "시알릴트랜스퍼라제 활성"은 공여자 기질로부터 수용자 분자로의 시알산 잔기, 바람직하게는 N-아세틸뉴라민산(Neu5Ac) 잔기의 전달을 지칭한다. "시알릴트랜스퍼라제"란 용어는 본원에 기재된 시알릴트랜스퍼라제의 기능성 단편, 본원에 기재된 시알릴트랜스퍼라제의 기능성 변이체, 및 상기 기능성 변이체의 기능성 단편을 포함한다. 이에 관하여 "기능성"은 단편 및/또는 변이체가 시알릴트랜스퍼라제 활성을 가질 수 있음을 의미한다. 시알릴트랜스퍼라제의 기능성 단편은 천연 유전자에 의해 암호화된 바와 같은 시알릴트랜스퍼라제의 절두된 버전을 포함하며, 상기 절두된 버전은 시알릴트랜스퍼라제 활성을 가질 수 있다. 절두된 버전의 예는 전형적으로 폴리펩티드를 특정한 세포이하 위치로 유도하는 소위 리더 서열을 포함하지 않는 시알릴트랜스퍼라제이다. 전형적으로, 이와 같은 리더 서열은 이의 세포이하 수송 동안 폴리펩티드로부터 제거되며, 천연의 성숙한 시알릴트랜스퍼라제 중에 또한 존재하지 않는다.
상기 이종 시알릴트랜스퍼라제는 공여자 기질로부터 수용자 분자로 시알산 잔기를 전달할 수 있다. 상기 이종 시알릴트랜스퍼라제와 관련하여 "~할 수 있는"이란 용어는 상기 이종 시알릴트랜스퍼라제의 시알릴트랜스퍼라제 활성을 지칭하나, 단 효소 활성을 갖기 위해서 상기 이종 시알릴트랜스퍼라제에 적합한 반응 조건이 요구된다. 적합한 반응 조건의 부재하에서 상기 이종 시알릴트랜스퍼라제는 이의 효소 활성을 갖지 않으며, 적합한 반응 조건이 복원될 때 이의 효소 활성을 유지하고 이의 효소 활성을 갖는다. 적합한 반응 조건은 적합한 공여자 기질의 존재, 적합한 수용자 분자의 존재, 필수 보조인자, 예를 들어 1가 또는 2가 이온, 적합한 범위의 pH 값, 적합한 온도 등의 존재를 포함한다. 상기 이종 시알릴트랜스퍼라제의 효소 반응을 수행하는 각각의 모든 인자에 대해 최적 값이 만족될 필요는 없지만, 상기 반응 조건은 상기 이종 시알릴트랜스퍼라제가 이의 효소 활성을 수행하도록 하는 것이어야 한다. 상응하게, "~할 수 있는"이란 용어는 상기 이종 시알릴트랜스퍼라제의 효소 활성이 비가역적으로 손상된 어떠한 조건도 배제하며, 임의의 상기와 같은 조건에 대한 상기 이종 시알릴트랜스퍼라제의 노출도 배제한다. 대신에, "~할 수 있는"은 상기 시알릴트랜스퍼라제가 효소적으로 활성임, 즉 허용되는 반응 조건(이때 모든 요구조건은 시알릴트랜스퍼라제가 이의 효소 활성을 수행하는데 필요하다)이 시알릴트랜스퍼라제에 제공되는 경우 이의 시알릴트랜스퍼라제 활성을 가짐을 의미한다.
시알릴트랜스퍼라제는 상기가 형성하는 당 연결의 유형에 따라 구별될 수 있다. 본원에 사용되는 바와 같이, "α-2,3-시알릴트랜스퍼라제" 및 "α-2,3-시알릴트랜스퍼라제 활성"이란 용어는 수용자 분자의 갈락토스, N-아세틸갈락토스아민 또는 갈락토스 또는 N-아세틸-갈락토스아민 잔기에 α-2,3 연결로 시알산 잔기를 가하는 폴리펩티드 및 이의 효소 활성을 지칭한다. 마찬가지로, "α-2,6-시알릴트랜스퍼라제" 및 "α-2,6-시알릴트랜스퍼라제 활성"이란 용어는 수용자 분자의 갈락토스, N-아세틸갈락토스아민 또는 갈락토스 또는 N-아세틸갈락토스아민 잔기에 α-2,6 연결로 시알산 잔기를 가하는 폴리펩티드 및 이의 효소 활성을 지칭한다. 마찬가지로, "α-2,8-시알릴트랜스퍼라제" 및 "α-2,8-시알릴트랜스퍼라제 활성"이란 용어는 수용자 분자의 갈락토스, N-아세틸갈락토스아민 또는 갈락토스 또는 N-아세틸갈락토스아민 잔기에 α-2,8 연결로 시알산 잔기를 가하는 폴리펩티드 및 이의 효소 활성을 지칭한다.
또한, 유전자 조작된 바실러스 세포는 이종 시알릴트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다. 이를 위해서, 상기 이종 시알릴트랜스퍼라제를 암호화하는 뉴클레오티드 서열은, 세포내 시알릴트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 이종 시알릴트랜스퍼라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 발현 조절 서열에 작동적으로 연결된다.
또 다른 구현예에서, 상기 이종 시알릴트랜스퍼라제는 α-2,6-시알릴트랜스퍼라제 활성을 가질 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 α-2,6-시알릴트랜스퍼라제 활성을 가질 수 있는 상기 이종 시알릴트랜스퍼라제를 암호화하는 적어도 하나의 뉴클레오티드 서열을 포함하는 핵산 분자를 함유하고 발현한다.
추가적인 및/또는 대안의 구현예에서, 상기 이종 시알릴트랜스퍼라제는 α-2,8-시알릴트랜스퍼라제 활성을 가질 수 있다. 이종 시알릴트랜스퍼라제의 일례는 캄필로박터 제주니 OH4384의 시알릴트랜스퍼라제 CstII의 α-2,8-시알릴트랜스퍼라제 활성을 가질 수 있다.
상기 시알릴트랜스퍼라제는 공여자 기질, 예를 들어 CMP-Neu5Ac로부터 수용자 분자로 시알산 잔기, 예를 들어 N-아세틸뉴라민산(Neu5Ac) 잔기를 전달할 수 있다. 상기 수용자 분자는 사카라이드 분자, 바람직하게는 표 3에 제시된 사카라이드 분자이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 미생물 세포는 α-2,3-시알릴트랜스퍼라제 활성을 가질 수 있는 상기 이종 시알릴트랜스퍼라제를 암호화하는 적어도 하나의 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다.
[표 2]
시알릴트랜스퍼라제-암호화 뉴클레오티드 서열의 목록
상기 시알릴트랜스퍼라제-암호화 뉴클레오티드 서열은 야생형 단백질 암호화 영역과 비교하여 완전길이 구조물(FL)로서 또는 예상되는 신호 펩티드(Δ)가 없이 클로닝되었다. Δ 뒤의 숫자는 상응하는 서열로부터 결실된 N-말단 아미노산을 가리킨다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 모노사카라이드, 바람직하게는 N-아세틸글루코스아민, 갈락토스 및 N-아세틸갈락토스아민으로 이루어지는 그룹 중에서 선택된 모노사카라이드이다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 디사카라이드, 바람직하게는 락토스, 락툴로스, N-아세틸락토스아민, 락토-N-비오스, 락툴로스 및 멜리비오스로 이루어지는 그룹 중에서 선택된 디사카라이드이다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 트리사카라이드, 바람직하게는 라피노스, 락토-N-트리오스 II, 2'-푸코실락토스, 3-푸코실락토스, 3'-시알릴락토스, 6'-시알릴락토스, 3'-시알릴-N-아세틸락토스아민, 6'-시알릴-N-아세틸락토스아민, 3'-갈락토실락토스 및 6'-갈락토실락토스로 이루어지는 그룹 중에서 선택된 트리사카라이드이다.
[표 3]
시알산화된 사카라이드의 생산을 위한 수용자 기질로서 사용될 수 있는 사카라이드의 목록.
상기 시알산화된 올리고사카라이드 자체를 또한 추가의 시알산화된 올리고사카라이드의 생산을 위한 수용자 기질로서 사용할 수 있다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 테트라사카라이드, 바람직하게는 락토-N-테트라오스, 락토-N-네오테트라오스, 2'3-디푸코실락토스, 3-푸코실-3'-시알릴락토스 및 3-푸코실-6'-시알릴락토스로 이루어지는 그룹 중에서 선택된 테트라사카라이드이다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 펜타사카라이드, 바람직하게는 시알릴락토-N-테트라오스 a, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 c, 락토-N-푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-네오푸코펜타오스 I 및 락토-N-네오푸코펜타오스 V로 이루어지는 그룹 중에서 선택된 펜타사카라이드이다.
NeuNAc, CMP-NeuNAc 및/또는 시알산화된 사카라이드를 생산하기에 충분한 방식으로 상기 효소를 암호화하고 상기 유전자를 발현하는 하나 이상의 유전자를 이미 갖는 바실러스 세포는 시알산 생합성을 완료하고 시알산 부분을 사카라이드 수용자로 전달하기 위해 유전자 조작할 필요가 없지만, 그럼에도 불구하고 상기 유전자 조작된 세포에서 상기 하나 이상의 유전자 산물의 세포내 수준, 예를 들어 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제, 글루코스아민-6포스페이트 N-아세틸트랜스퍼라제, N-아세틸글루코스아민-6-포스페이트 포스파타제, N아세틸글루코스아민 2-에피머라제 및/또는 N-아세틸뉴라민산 신타제의 양을 증가시켜, Neu5Ac 생합성의 비율 및 결과적으로 시알산화된 사카라이드의 비율을 증가시키기 위해 상기 유전자 중 하나 이상의 발현 수준을 변경시킬 필요가 있음을 이해해야 한다.
일부 구현예에서, 바실러스 세포는 3'-SL의 생산에 사용하기 위한 것이며 락토스 퍼미아제, 중간체로서 GlcN-1P를 사용하는 CMP-NeuNAc 생합성 경로, 및 α-2,3-시알릴트랜스퍼라제를 갖도록 유전자 조작되었다.
다양한 구현예에서, 바실러스 세포는 6'-SL의 생산에 사용하기 위한 것이며 락토스 퍼미아제, 중간체로서 GlcN-1P를 사용하는 CMP-NeuNAc 생합성 경로, 및 α-2,6-시알릴트랜스퍼라제를 갖도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 상기 세포의 야생형에서보다 더 많은 PEP를 합성한다. 추가적인 및/또는 대안의 구현예에서, 상기 유전자 조작된 미생물 세포는 향상된 PEP 생합성 경로를 갖도록 유전자 조작되었다. 바람직하게, 상기 유전자 조작된 미생물 세포는, 예를 들어 포스포에놀피루베이트 신타제 유전자를 암호화하는 ppsA 유전자가 과발현되고/되거나 비-천연 미생물이 포스포에놀피루베이트 신타제 또는 이의 기능성 변이체의 발현을 허용하는 뉴클레오티드 서열의 적어도 하나의 추가적인 사본을 함유한다는 점에서, 증가된 포스포에놀피루베이트 신타제 활성을 갖도록 유전자 조작되었다. ppsA의 과발현은 보다 많은 PEP가 시알산 생산에 이용될 수 있도록 세포내 PEP 합성을 향상시킨다. 예를 들어 적합한 포스포에놀피루베이트 신타제는 이. 콜라이의 PpsA이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 이. 콜라이 PpsA 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 분자를 함유한다. 상기 이. 콜라이 PpsA 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열은 상기 이. 콜라이 ppsA 유전자에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99%의 서열 일치성을 갖는다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 PEP를 소비하지 않는 기전을 통해 상기 유일한 탄소원을 세포로 전달할 수 있도록 추가로 변형된다.
추가적인 및/또는 대안의 구현예에서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 어떠한 β-갈락토시다제 활성도 없거나 또는 동일한 종의 야생형 바실러스 세포와 비교하여 감소된 β-갈락토시다제 활성을 갖는다.
시알산화된 올리고사카라이드의 세포내 생합성은 락토스-수용 시알릴트랜스퍼라제에 대한 수용자 기질로서 락토스의 수입을 필요로 한다. 내면화된 락토스를 가수분해하는 임의의 세포내 효소 활성은 세포내 락토스의 풀이 감소됨에 따라 시알릴락토스 형성의 효능에 영향을 미칠 것이다. 따라서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 베타-갈락토시다제 활성이 없거나 또는 야생형 바실러스 세포와 비교하여 적어도 감소된 베타-갈락토시다제 활성을 갖는 것이 유리할 것이다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 세포의 β-갈락토시다제 활성을 없애거나 또는 적어도 상기 활성이 감소하도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 ganA 유전자의 결실 또는 기능적 불활성화에 의해 유전자 조작되었다. 또 다른 구현예에서, 바실러스 세포는 야생형 바실러스 세포와 비교하여 ganA 유전자의 발현 수준이 감소하도록 유전자 조작되었다.
바실러스 ganA 유전자는 또한 yvfN 또는 lacA라 지칭된다. 이는 갈락탄의 이용과 관련된 효소를 암호화하는 유전자를 함유하는 GanR 레귤론의 유전자이다. 상기 ganA 유전자는 바실러스의 갈락탄 이용에 관련된 베타-갈락토시다제를 암호화한다.
ganA 유전자의 결실 또는 기능적 불활성화는 바실러스 세포에서 GanA-매개된 β-갈락토시다제 활성을 없애는 반면, ganA 발현의 감소는 바실러스 세포 중 GanA의 양을 낮추고 따라서 시알산화된 올리고사카라이드의 생합성을 방해할 수 있는 β-갈락토시다제 활성을 낮춘다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 yesZ 유전자의 결실 또는 기능적 불활성화에 의해 유전자 조작되었다. 상기 바실러스 yesZ 유전자는 식물 세포벽으로부터 유래되는 람노갈락투로난의 분해에 한 역할을 하는 베타-갈락토시다제 YesZ를 암호화한다. 상기 바실러스 yesZ 유전자의 발현은 람노갈락투로난 I에 의해 유도된다. 또 다른 구현예에서, 상기 바실러스 세포는 야생형 바실러스 세포와 비교하여 yesZ 유전자의 발현 수준이 감소하도록 유전자 조작되었다.
yesZ 유전자의 결실 또는 기능적 불활성화는 바실러스 세포에서 YesZ-매개된 β-갈락토시다제 활성을 없애는 반면, yesZ 발현의 감소는 바실러스 세포 중 YesZ의 양을 낮추고 따라서 시알산화된 올리고사카라이드의 생합성을 방해할 수 있는 β-갈락토시다제 활성을 낮춘다.
바실러스 서브틸리스가 대수증식기-후 단계에 진입할 때, 상기 바실러스는 다량의 세포외 프로테아제를 생산한다(생산하기 시작한다). 외부 단백질은 종종 프로테아제 민감성이다. 따라서, 무-엑소프로테아제 균주는 이종 단백질의 안정성을 증가시키고 높은 수준의 외부 단백질의 축적을 허용하기에 바람직할 수 있다.
바실러스의 게놈은 적어도 8개의 세포외 프로테아제, 즉 nprE, aprE, epr, bpr, mpr, nprB, vpr wprA를 암호화한다. 따라서, 추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 세포외 프로테아제를 암호화하는 적어도 하나의 유전자, 바람직하게는 nprE, aprE, epr, bpr, mpr, nprB, vpr wprA로 이루어지는 그룹 중에서 선택된 유전자 중 적어도 하나가 결실되거나 기능적으로 불활성화되도록 유전자 조작되었다. 바람직하게, nprE, aprE, epr, bpr, mpr, nprB, vpr wprA로 이루어지는 그룹 중에서 선택된 유전자 중 2, 3, 4, 5, 6, 7 또는 8개가 결실되거나 기능적으로 불활성화되었다.
바실러스 서브틸리스는 글루코스 또는 락토스와 같은 탄수화물을 함유하는 배지에서 증식시 풀체리민산(pulcherriminic acid)을 합성한다. 분비된 풀체리민산은 생육 배지에 철이 존재하는 경우 풀체리민산의 염(철 킬레이트)인 적색 안료 풀체리민을 형성한다. 발효 공정 중 이러한 바람직하지 못한 부산물의 형성은 유전자 yvmC 및/또는 cypX의 결실 또는 붕괴에 의해 피하거나/없앨 수 있다. 유전자 yvmC는 사이클로디펩티드 신타제를 암호화하고, 유전자 cypX는 시토크롬 P450 사이클로-I-류실-I-류실 디펩티드 옥시다제를 암호화한다.
따라서, 추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 유전자 yvmCcypX 중 적어도 하나가 결실되거나 기능적으로 불활성화되도록 유전자 조작되었다.
리조박테리움 바실러스 서브틸리스는 20개를 초과하는 항생제의 합성을 위한 유전자를 갖는다. 이들 중에는 바실러스 서브틸리스 랜티바이오틱스(lantibiotics) 및 랜티바이오틱-유사 펩티드(서브틸린, 에리신 S, 메르사시딘, 서브란신 168, 서브틸로신 A) 및 비-리보솜 합성된(펩티드) 항생제(설팩틴, 이투린, 바실로마이신, 마이코서브틸린, 코리네박틴/바실리박틴, 펜지신 플리파스타틴, 마이코바실린, TL-119, 바실리신, 바실리소신, 아미쿠마신, 3,3'-네오트레할로사디아민, 디피시딘, 리족티신)와 같은 펩티드 항생제가 있다.
시알산화된 올리고사카라이드의 생산을 위해서, 항생제를 생성시키지 않는 바실러스 세포를 사용하는 것이 바람직하다. 따라서, 추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 랜티바이오틱스 및 랜티바이오틱스-유사 펩티드, 예를 들어 서브틸린, 에리신 S, 메르사시딘, 서브란신 168, 서브틸로신 A; 비-리보솜 합성된(펩티드) 항생제, 예를 들어 설팩틴, 이투린, 바실로마이신, 마이코서브틸린, 코리네박틴/바실리박틴, 펜지신 플리파스타틴, 마이코바실린, TL-119, 바실리신, 바실리소신, 아미쿠마신, 3,3'-네오트레할로사디아민, 디피시딘 및 리족티신으로 이루어지는 그룹 중에서 선택된 항생제 중 하나 이상을 합성하지 않는다. 바실러스 세포는 상기 항생제 중 하나 이상을 합성하는 능력이 손상되거나 제거되도록 유전자 조작될 수 있다.
시알산화된 올리고사카라이드를 생산할 수 있는 유전자 조작된 바실러스 세포는 추가적인 특징을 임의로 포함할 수 있으며, 이러한 추가적인 특징을 갖도록 유전자 조작될 수 있다. 이러한 추가적인 특징은 비-천연 미생물의 생산성을 개선시켜 보다 많은 시알산화된 올리고사카라이드 수율로 이어지는 것으로 간주된다.
본 발명의 바실러스 세포는, 상기 바실러스 세포가 시알산화된 올리고사카라이드를 생산할 수 있게 하는 배지 및 조건하에서 락토스의 존재하에 배양시 시알산화된 올리고사카라이드를 생산할 수 있다. 따라서, 시알산화된 올리고사카라이드의 생산을 위한 본원에서 이전에 기재한 바와 같은 유전자 조작된 바실러스 세포의 용도를 제공한다.
하나의 측면에서, 시알산화된 올리고사카라이드의 생산 방법을 제공한다. 상기 방법은 (i) 본원에서 이전에 기재한 바와 같은 바실러스 세포를 제공하고, (ii) 상기 바실러스 세포를 시알산화된 올리고사카라이드의 생산에 허용되는 배양 배지 또는 발효 브로쓰(fermentation broth) 및 조건하에서 배양함을 포함한다. 상기 방법은 상기 배양 배지/발효 브로쓰 및/또는 바실러스 세포로부터 시알산화된 올리고사카라이드를 회수함을 추가로 포함할 수 있다.
상기 발효 브로쓰는 바실러스 세포의 대사를 위해 적어도 하나의 탄소원을 함유한다. 일부 구현예에서, 상기 적어도 하나의 탄소원은 글루코스, 프럭토스, 슈크로스, 글리세롤 및 이의 조합으로 이루어지는 그룹 중에서 선택된다. 상기 탄소원은 바실러스 세포에 의해 내면화될 수 있으며 바실러스 세포의 대사에 의해 사용되어 바이오매스 및 에너지 풍부 트리포스페이트 형태의 에너지를 생성시킬 수 있다.
일부 구현예에서, 상기 발효 브로쓰는, 특히 바실러스 세포가 혼자서 락토스를 합성할 수 없는 경우, 락토스를 함유한다. 상기 락토스는 발효 브로쓰에 외부적으로 공급될 수 있다. 락토스는 일부 시알산화된 올리고사카라이드의 생산에서, 특히 시알릴락토스의 생산에서 NeuNAc 부분에 대한 수용자 기질로서 작용할 수 있다.
다양한 구현예에서, 상기 발효 브로쓰는, 특히 바실러스 세포가 시알산 생합성 경로를 갖지 않고 시알산 회수 경로를 갖는 시알산화된 올리고사카라이드의 생산에 사용되는 경우, 시알산을 함유한다.
일부 구현예에서, 시알산화된 올리고사카라이드의 생산은 발효 브로쓰에 N-아세틸글루코스아민, N-아세틸만노스아민 및/또는 N아세틸-뉴라민산의 첨가, 및/또는 시알산화된 올리고사카라이드의 세포내 생합성을 위한 N-아세틸글루코스아민, N-아세틸만노스아민 및/또는 N-아세틸뉴라민산 존재하에서의 유전자 조작된 미생물 세포의 배양을 필요로 하지 않는데, 그 이유는 바실러스 세포가 NeuNAc의 세포내 생합성을 위한 드노보 시알산 생합성 경로를 갖는 시알산화된 올리고사카라이드의 생산에 사용되기 때문이다.
상기 방법에서, 적어도 하나의 유전자 조작된 바실러스 세포를, 적어도 하나의 N-아세틸뉴라민산 부분을 포함하는 사카라이드의 생산에 허용되는 발효 브로쓰 및 조건하에서 배양한다.
상기 공정이 유전자 조작된 바실러스 세포에 대한 발효 브로쓰에 탄소원을 사용하지만, 상기 바실러스 세포가 내포내에서 N-아세틸뉴라민산을 생산할 수 있는 경우 글루코스아민 및/또는 N-아세틸뉴라민산 및/또는 N-아세틸글루코스아민 및/또는 N-아세틸만노스아민을 상기 발효 브로쓰에 첨가할 필요는 없다. 따라서, 시알산화된 올리고사카라이드의 생산에 대한 다양한 구현예에서, 유전자 조작된 바실러스 세포를 글루코스아민, N-아세틸글루코스아민, N-아세틸만노스아민 및 N-아세틸뉴라민산으로 이루어지는 그룹 중에서 선택된 하나 이상의 첨가 없이 및/또는 이들의 부재하에서 배양한다. 상기 유전자 조작된 바실러스 세포를, 갈락토스가 시알실트랜스퍼라제 반응에 대한 수용자 기질로서 공급되지 않는 한, 갈락토스의 첨가 없이 및/또는 이의 부재하에서 배양할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포를 하나 이상의 모노사카라이드(예를 들어 갈락토스), 디사카라이드(예를 들어 락토스), 트리사카라이드(예를 들어 락토-N-트리오스 II), 테트라사카라이드(예를 들어 락토-N-테트라오스) 및/또는 펜타사카라이드(예를 들어 시알릴락토-N-테트라오스 a)의 존재하에서 배양한다.
추가적인 및/또는 대안의 구현예에 따라, 유전자 조작된 바실러스 세포를 갈락토스, N-아세틸갈락토스아민, N-아세틸글루코스아민, 락토스, 락툴로스, N-아세틸락토스아민, 락토-N-비오스, 락토-N-트리오스, 2'-푸코실락토스, 3-푸코실락토스, 3'-시알릴락토스, 6'-시알릴락토스, 3'-시알릴-N-아세틸락토스아민, 6'-시알릴-N-아세틸락토스아민, 3'-갈락토실락토스, 6'-갈락토실락토스, 락토-N-트리오스 II, 락토-N-테트라오스, 락토-N-네오테트라오스, 2'3-디푸코실락토스, 3-푸코실-3'-시알릴락토스 및 3-푸코실-6'-시알릴락토스로 이루어지는 그룹 중에서 선택된 적어도 하나의 수용자 기질의 존재하에서 배양한다. 이들 기질은 세포에 수입되어 상기 세포에서 수용자 분자로서 사용된다.
상기 방법은 발효 브로쓰에서 배양 및 증식 중에 유전자 조작된 바실러스 세포에 의해 생산된 시알릴화된 올리고사카라이드의 임의의 회수 단계를 포함한다. 상기 시알산화된 올리고사카라이드를, 유전자 조작된 바실러스 세포를 예를 들어 원심분리 또는 여과에 의해 제거한 후에 발효 브로쓰로부터 회수하고/하거나, 세포로부터, 예를 들어 원심분리에 의해 발효 브로쓰로부터 수확되고 세포 용해 단계가 가해진 세포로부터 회수할 수 있다. 후속적으로 상기 시알산화된 올리고사카라이드를 당업자에게 공지된 적합한 기법에 의해 발효 브로쓰 및/또는 세포 용해물로부터 추가로 정제할 수 있다. 적합한 기법은 미세여과, 한외여과, 정용여과, 시뮬레이션된 이동층 유형 크로마토그래피, 전기투석, 역삼투, 젤 여과, 음이온 교환 크로마토그래피, 양이온 교환 크로마토그래피 등을 포함한다.
상기 방법 및 상기 방법에 사용되는 유전자 조작된 미생물 세포를 시알산화된 올리고사카라이드의 생산에 사용한다. "시알산화된 올리고사카라이드"란 용어는 적어도 하나의 N-아세틸뉴라민산 부분을 포함하는 올리고사카라이드 분자를 지칭한다.
추가적인 및/또는 대안의 구현예에서, 시알산화된 사카라이드는 올리고사카라이드이다. 본원에 사용되는 바와 같은 "올리고사카라이드"란 용어는 모노사카라이드 잔기의 중합체를 지칭하며, 여기서 상기 중합체는 적어도 2개의 모노사카라이드 잔기, 10개 이하의 모노사카라이드 잔기, 바람직하게는 7개 이하의 모노사카라이드 잔기를 포함한다. 상기 올리고사카라이드는 모노사카라이드의 선형 쇄이거나 분지된다. 또한, 상기 올리고사카라이드의 모노사카라이드 잔기는 다수의 화학 변형을 특징으로 할 수 있다. 상응하게, 상기 올리고사카라이드는 하나 이상의 비-사카라이드 부분을 포함할 수 있다. 본원에 사용되는 바와 같은 "시알산화된 올리고사카라이드"란 용어는 하나 이상의 N-아세틸뉴라민산 부분을 포함하는 올리고사카라이드를 지칭한다.
추가적인 및/또는 대안의 구현예에 따라, 시알산화된 올리고사카라이드는 3'-시알릴락토스, 6'-시알릴락토스, 시알릴-락토-N-테트라오스 a, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 c, 푸코실-시알릴-락토-N-테트라오스 a, 푸코실-시알릴락토-N-테트라오스 b, 푸코실-시알릴락토-N-테트라오스 c, 디시알릴락토-N-테트라오스, 푸코실디시알릴락토-N-테트라오스 I, 푸코실디시알릴락토-N-테트라오스 II, 3'-시알릴갈락토스, 6'-시알릴갈락토스, 3'-시알릴-N-아세틸락토스아민 및 6'-시알릴-N-아세틸락토스아민으로 이루어지는 그룹 중에서 선택된다.
본 발명의 또 다른 구현예에서, 전세포 발효 공정에서 시알산화된 올리고사카라이드의 생산을 위한 이전에 본원에 기재한 바와 같은 유전자 조작된 바실러스 세포의 용도를 제공한다, 즉 상기 시알산화된 올리고사카라이드가 상기 유전자 조작된 바실러스 세포에 의해서 및 상기 세포에서 합성된다.
본 발명의 또 다른 측면에서, 이전에 본원에 기재한 바와 같은 방법에 의해 및/또는 이전에 본원에 기재한 바와 같은 유전자 조작된 바실러스 세포의 사용에 의해 생산된 시알산화된 올리고사카라이드를 제공한다.
본 발명의 또 다른 측면에서, 영양 조성물의 제조를 위한 이전에 본원에 기재한 바와 같은 방법에 의해 및/또는 이전에 본원에 기재한 바와 같은 유전자 조작된 바실러스 세포의 사용에 의해 생산된 시알산화된 올리고사카라이드의 용도를 제공한다.
따라서, 이전에 본원에 기재한 바와 같은 방법에 의해 및/또는 이전에 본원에 기재한 바와 같은 유전자 조작된 바실러스 세포에 의해 생산된 적어도 하나의 시알산화된 올리고사카라이드를 함유하는 영양 조성물을 제공한다.
추가적인 및/또는 대안의 구현예에서, 시알산화된 올리고사카라이드는 3'-시알릴락토스, 6'-시알릴락토스, 시알릴락토-N-테트라오스 a, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 c, 푸코실-시알릴락토-N-테트라오스 a, 푸코실-시알릴락토-N-테트라오스 b, 푸코실-시알릴락토-N-테트라오스 c, 디시알릴락토-N-테트라오스, 푸코실디시알릴락토-N-테트라오스 I, 푸코실디시알릴락토-N-테트라오스 II, 3'-시알릴갈락토스, 6'-시알릴갈락토스, 3'-시알릴-N-아세틸락토스아민 및 6'-시알릴-N-아세틸락토스아민으로 이루어지는 그룹 중에서 선택된다.
일부 구현예에서, 영양 조성물은 적어도 하나의 중성 HMO, 바람직하게는 유전자 조작된 바실러스 세포를 사용하여 생산된 적어도 하나의 중성 HMO를 추가로 함유한다. 상기 적어도 하나의 중성 HMO는 2'-푸코실락토스, 3-푸코실락토스, 2',3-디푸코실락토스, 락토-N-트리오스 II, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-네오디푸코헥사오스 I, 락토-N-헥사오스, 락토-N-네오헥사오스, 파라-락토-N-헥사오스, 및 파라-락토-N-네오헥사오스로 이루어지는 그룹 중에서 선택된다.
추가적인 구현예에서, 상기 영양 조성물은 약제 조성물, 약학 조성물, 뉴트라슈티칼 제형, 유아용 조제분유 및 식이성 보충제로 이루어지는 그룹 중에서 선택된다.
상기 영양 조성물은 액체 형태, 또는 비제한적으로 분말, 과립, 박편 및 펠릿을 포함한 고체 형태로 존재할 수 있다.
본 발명을 특정 구현예에 관하여 기재할 것이나, 본 발명은 이들로 제한되지 않으며 단지 청구범위에 의해서만 제한된다. 더욱 또한, 상기 설명 및 청구범위에서 제1, 제2 등의 용어는 유사한 요소들을 구별하기 위해 사용되며 반드시 시간적으로, 공간적으로, 순위상 또는 임의의 다른 방식으로 순서를 기재하기 위한 것은 아니다. 이렇게 사용된 용어는 적합한 상황하에서 호환가능하며 본원에 기재된 발명의 구현예를 본원에 기재되거나 예시된 것 이외의 순서로 실행할 수 있음을 알아야 한다.
청구범위에 사용된 "포함하는"이라는 용어는 이후에 나열된 수단으로 제한되는 것으로 해석되어서는 안 되며; 다른 요소나 단계를 제외하지 않음을 알아야 한다. 따라서 이는 언급된 특징, 정수, 단계 또는 구성요소의 존재를 명시하는 것으로 해석되어야 하지만, 하나 이상의 다른 특징, 정수, 단계 또는 구성요소, 또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다. 따라서 "수단 A 및 B를 포함하는 장치"라는 표현의 범위는 구성요소 A 및 B로만 구성된 장치로 제한되어서는 안 된다. 이는 본 발명과 관련하여 장치의 유일한 관련 구성요소가 A 및 B임을 의미한다.
본 명세서 전체를 통해 "하나의 구현예" 또는 "구현예"에 대한 언급은 상기 구현예와 관련하여 설명된 특정한 특징, 구조 또는 특성이 본 발명의 적어도 하나의 구현예에 포함된다는 것을 의미한다. 따라서, 본 명세서 전체를 통해 다양한 위치에서 "하나의 구현예에서" 또는 "구현예에서"라는 문구의 출현은 반드시 모두 동일한 구현예를 지칭하는 것은 아니지만, 그럴 수도 있다. 더욱 또한, 특정한 특징, 구조 또는 특성은 하나 이상의 구현예에서 본 개시내용으로부터 당업자에게 명백한 바와 같이 임의의 적합한 방식으로 조합될 수 있다.
유사하게, 본 발명의 예시적인 구현예의 설명에서, 본 발명의 다양한 특징들은 때때로 본 개시를 간소화하고 다양한 본 발명의 측면 중 하나 이상의 이해를 도울 목적으로 단일 구현예, 도면 또는 이에 대한 설명에서 함께 그룹화된다는 것을 이해해야 한다. 그러나 이러한 개시 방법은 청구된 발명이 각 청구범위에 명시적으로 인용된 것보다 더 많은 특징을 필요로 한다는 의도를 반영하는 것으로 해석되어서는 안 된다. 오히려, 이어지는 청구 범위가 반영하는 바와 같이, 독창적인 측면은 단일의 전술한 개시된 구현예의 모든 특징보다 적다. 따라서, 이러한 상세한 설명에 이어지는 청구범위는 이에 의해 상기 상세한 설명에 명시적으로 통합되며, 이때 각 청구범위는 그 자체로 본 발명의 별도의 구현예로서 독자적으로 자립한다.
더욱 또한, 본원에 기재된 구현예 중 일부는 다른 구현예에 포함된 다른 특징이 아닌 일부를 포함하지만, 상이한 구현예의 특징들의 조합은 본 발명의 범위 내에 있는 것으로 의미되며, 당업자에 의해 이해되는 바와 같이, 상이한 구현예를 형성한다. 예를 들어, 하기의 청구범위에서, 청구된 구현예 중 어느 하나가 임의의 조합으로 사용될 수 있다.
더욱 또한, 구현예 중 일부는 컴퓨터 시스템의 프로세서에 의해 또는 기능을 수행하는 다른 수단에 의해 구현될 수 있는 방법 또는 방법의 요소들의 조합으로서 본원에서 설명된다. 따라서, 그러한 방법 또는 방법의 요소를 수행하는데 필요한 명령이 있는 프로세서는 방법 또는 방법의 요소를 수행하기 위한 수단을 형성한다.
더욱 또한, 장치 구현예의 본원에 기재된 요소는 본 발명을 수행할 목적으로 상기 요소에 의해 수행되는 기능을 수행하기 위한 수단의 일례이다.
본원에 제공된 설명 및 도면에서, 다수의 특정한 세부사항이 설명된다. 그러나, 본 발명의 구현예는 이러한 특정한 세부사항 없이 실시될 수 있다는 것이 이해된다. 다른 경우에, 주지된 방법, 구조 및 기술은 이해를 모호하게 하지 않기 위해 상세히 표시되지 않았다. 본 발명은 이제 본 발명의 몇몇 구현예의 상세한 설명에 의해 설명될 것이다. 본 발명의 다른 구현예는 본 발명의 진의 또는 기술적 교시로부터 이탈됨 없이 당업자의 지식에 따라 구성될 수 있으며, 본 발명은 첨부된 특허청구범위의 용어에 의해서만 제한된다는 것이 명백하다.
실시예
실시예 1: 바실러스 서브틸리스의 형질전환
바실러스 서브틸리스를 다양한 기법에 의해 유전자 조작할 수 있다. 바실러스 서브틸리스의 형질전환을 위해서, 컴피턴트 세포를 2-단계 방법의 변형된 프로토콜에 의해 제조하였다(Anagnostopoulos, C. and Spizizen, J. (1961) J Bacteriol 81 (5): 741-746). 밤새 배양물을 MG1 배지에 접종하고 37℃에서 진탕하였다. MG1 배지는 0.5% 글루코스, 5 mM MgSO4 및 0.02% 카사미노산이 보충된(비오틴 및/또는 L-트립토판이 임의로 추가로 보충된다) 스피지젠(Spizizen)의 최소 배지이다. 다음날 아침에, 이 배양물을 신선한 MG1 배지에서 1:20 희석하고 37℃에서 대략 6h 동안 배양하였다. 1 ㎖의 배양물을, 카사미노산의 농도가 MG1 배지와 상이한(0.02% 대신에 0.01%) 8 ㎖ MG2 배지에서 희석하였다. 단축된 프로토콜에서 상기 밤새 배양물을 MG2 배지에서 직접 희석한다. 추가로 90분간 배양 후에, 상기 배양물의 1-㎖ 분취량을 1 내지 3 ㎍의 다량체성 플라스미드 DNA 또는 선형 DNA와 혼합하고 37℃에서 30-60분간 진탕시키면서 배양하였다. 다량체성 플라스미드 DNA를, 플라스미드 DNA의 번식을 위해 이. 콜라이 균주 NM538을 사용함으로써 또는 단일-절단 제한 효소(주쇄 내에서 절단한다)에 의한 절단에 의해 상기 플라스미드를 선형화한 다음, T4 DNA 리가제에 의해 재-결찰시킴으로써 수득하였다.
그 후에, 세포를 적합한 항생제를 함유하는 2x YT 아가 플레이트상에 스프레딩하였다. 항생제는 하기의 농도로 첨가되었다: 5 ㎍·㎖-1 에리쓰로마이신, 5 ㎍·㎖-1 클로람페니콜, 10 ㎍·㎖-1 가나마이신, 100 ㎍·㎖-1 스펙티노마이신.
대안적으로, 원형질체 형질전환의 경우(Romero, D. et al. (2006) Journal of Microbiological Methods 66:556-559), 세포를 증식 정지기(OD600 = 1.7-2)가 개시될 때까지 37℃에서 20 ㎖의 페나세이(Penassay) 브로쓰(PAB)에서 증식시켰다. 이어서 세포를 펠릿화하고 10 ㎖의 SMPP 배지(0.3% 소 혈청 알부민, 5% 2 M 슈크로스, 25% 4x PAB, 50% 2x SMM)에 재현탁시켰으며, 2x SMM의 조성은 1 M 슈크로스, 0.04 M 말레산 이나트륨 염 수화물 및 0.04 M MgCl2(pH 6.5)였다. 리소자임(10 ㎎ ㎖-1) 및 뮤타놀리신(75 U ㎖-1)의 첨가 후에, 혼합물을 37℃에서 진탕시키면서 배양하여 원형질체를 생성시켰다. 원형질체 형성을 현미경에 의해 검사하였다. 이어서 원형질체를 5200 x g 및 4℃에서 5분간 원심분리에 의해 조심스럽게 수확하고, 빙냉 세척 전기형질전환 완충제(1x SMM)로 2회 세척하고, 최종적으로 이 용액에 현탁시켰다. 플라스미드 DNA(1-3 ㎍)를 120 ㎕의 원형질체 현탁액에 가하고 혼합물을 얼음상에서 적어도 5분간 유지시켰다. 형질전환 혼합물을 0.2-㎝ 큐벳으로 옮기고 단일 일렉트로포레이션 펄스를 25 μF, 400 Ω 및 0.7 kV에서 적용하였다. 일렉트로포레이션 충격 직후에, 1 ㎖의 회수 배지(동일 부피의 4x PAB 및 2x SMM, 사용 전에 신선하게 제조됨)를 상기 큐벳에 가하였다. 이어서 형질전환 반응물을 2 ㎖ 튜브로 옮기고 37℃에서 12h 동안 진탕시키면서 배양하였다. 재생을 위해서, 세포 현탁액을 DM3 아가 플레이트(Chang, S. and Cohen, S. (1979) MGG 168(1): 111―115)상에 스프레딩하고 37℃에서 48h 동안 배양하였다. DM3 재생 배지는 리터당 하기의 멸균 용액을 함유하였으며: 200 ㎖ 4% 아가, 100 ㎖ 5% 카사미노산, 50 ㎖ 10% 효모 추출물, 100 ㎖ 3.5% K2HPO4 및 1.5% KH2PO4, 25 ㎖ 20% 글루코스, 20 ㎖ 1 M MgCl2, 500 ㎖ 0.5 M 솔비톨 및 5 ㎖ 필터 멸균된 2% 소 혈청 알부민(온도가 55℃ 미만일 때 혼합물에 첨가됨), 적합한 항생제가 보충되었다.
바실러스 서브틸리스의 일렉트로포레이션을 MoBiTec GmbH에 의해 제공된 장(Zhang) 등(2011)의 변형된 프로토콜에 따라 수행하였다(Zhang, G., Bao, P., Zhang, Y., Deng, A., Chen.N. and Wen, T. (2011) Anal. Biochem., 409:130-137). 2x YT 밤새 배양물을 신선한 2x YT 배지로 100배 희석하고 배양물을 37℃에서 회전 진탕기상에서 0.2의 OD600으로 증식시켰다. 이어서 배양물에 1% DL-쓰레오닌, 2% 글리신, 0.1% 트립토판 및 0.03% 트윈 80을 보충하였다. 추가로 60분간 배양 후에, 세포 현탁액을 얼음상에서 20분간 냉각시키고, 4℃에서 5000 x g에서 10분간 원심분리시키고 일렉트로포레이션 완충제(0.5 M 트레할로스, 0.5 M 솔비톨, 0.5 M 만니톨, 0.5 mM MgCl2, 0.5 mM K2HPO4, 0.5 mM KH2PO4, pH 7.4, 필터-멸균되고 동결 보관됨)로 2회 세척하였다. 최종적으로, 세포를 일렉트로포레이션 완충제에 원래 배양 부피의 1/100으로 재현탁시키고 100 ㎕의 세포 현탁액을 DNA와 혼합하였다. 형질전환 혼합물을 0.1-㎝ 큐벳으로 옮기고 일렉트로포레이션을 1.8 kV에서 MicroPulserTM 장치(Bio-Rad)로 전달된 단일 펄스로 수행하였다. 펄스 전달 직후에, 0.5 M 솔비톨 및 0.38 M 만니톨을 함유하는 1 ㎖ 2x YT 브로쓰를 상기 큐벳에 가하였다. 형질전환 현탁액을 2 ㎖ 튜브로 옮기고 37℃에서 3h 동안 회전 진탕기상에서 배양하였다. 세포를 선택성 2x YT 아가 플레이트상에 스프레딩하고 37℃에서 밤새 배양하였다.
대안의 일렉트로포레이션 프로토콜(Xue, G. P., J. S. Johnson, and B. P. Dalrymple: 1999; Journal of Microbiological Methods 34:183-191)을 사용하여, 0.5 M 글루시톨을 함유하는 5 ㎖의 LB 배지에 바실러스 서브틸리스를 접종하고 37℃에서 밤새 배양하였다. 후속적으로, 상기 밤새 배양물을 0.5 M 글루시톨을 함유하는 75 ㎖의 LB에 의해 희석하고(1:16) 0.85-0.95의 OD600이 획득될 때까지 배양하였다. 이어서 세포를 4℃에서 5.000xg에서 10분간 원심분리에 의해 펠릿화하고 빙-냉 일렉트로포레이션 완충제(10% 글리세롤, 0.5 M 글루시톨, 0.5 M 만니톨)에 의해 4회 세척하였다. 최종적으로, 세포를 1-2 ㎖ 일렉트로포레이션 완충제에 재현탁하였다. 일렉트로포레이션을 냉각된 일렉트포로레이션 큐벳(1-㎜ 전극 틈)에서 DNA와 60 ㎕의 컴피턴트 세포를 사용하여 수행하였다. 상기 세포-DNA 혼합물에 25 μM, 200 Ω 및 21 kV/㎝의 단일 전기 펄스를 가하였다. 최종적으로, 1 ㎖의 회수 브로쓰(0.5 M 글루시톨 및 0.38 만니톨을 함유하는 LB)를 전기투과된 세포에 가하고 세균 배양물을 37℃에서 3h 동안 배양한 다음 항생제가 보충된 LB 아가상에 도말하였다.
2개의 상이한 풍부 배지, 즉 루리아 브로쓰(LB) 및 2x YT를 사용하였다.
루리아 브로쓰(LB) 배지는 1% 트립톤, 0.5% 효모 추출물 및 0.5% NaCl(pH 7.2)로 이루어졌다.
2x YT 배지는 1.6% 트립톤, 1% 효모 추출물 및 0.5% NaCl(pH 7.5)로 이루어졌다.
풍부-배지 아가 플레이트를 제조하기 위해서 15 g L-1 아가를 가하였다.
진탕 플라스크 실험을 위해서, 스피지젠의 최소 배지(Spizizen, J. 1958 Proc. Natl. Acad. Sci. U. S. A. 44(10): 1072-1078)를 사용하였다.
스피지젠의 최소 배지는 하기의 염을 함유한다: 2 g/L (NH4)2SO4, 14 g/L K2HPO4, 6 g/L KH2PO4, 1 g/L Na3 시트레이트 x 2·H2O 및 0.2 g/L MgSO4 x 7·H2O.
전배양 배지는 2 mM의 최종 농도로 2% D-글루코스, 0.05% 카사미노산 및 MgSO4가 보충된(비오틴 및/또는 L-트립토판이 임의로 추가로 보충된다) 스피지젠의 최소 염으로 이루어졌다.
주 배양 배지는 2 mM의 최종 농도로 2% D-글루코스, 0.05% 카사미노산 및 MgSO4가 보충된 스피지젠의 최소 염 및 0.5 ㎖·L-1 1000x 미량원소 용액(비오틴 및/또는 L-트립토판이 임의로 추가로 보충된다)으로 이루어졌다.
미량원소 용액(1000x)은 100.6 g/L C6H9NO6, 56.4 g/L 암모늄 철 시트레이트, 9.8 g/L MnCl2 x 4·H2O, 1.6 g/L CoCl2 x 6·H2O, 1 g/L CuCl2 x 2·H2O, 1.9 g/L H3BO3, 9 g/L ZnS04 x 7·H2O, 1.1 g/L Na2Mo04 x 2·H2O, 1.5 g/L Na2Se03, 1.5 g/L NiS04 x 6·H2O로 이루어졌다.
필요한 경우, 적합한 항생제(들)를 배지에 가하여 선택적으로 만들었다.
바실러스 서브틸리스 균주를 처음에 풍부-배지 아가 플레이트상에서 증식시켜 단일 콜로니를 수득하였다. 이 플레이트를 30-37℃에서 1일간 증식시켰다. 진탕 플라스크 실험을 위해서, 20-㎖ 전배양물에 단일 콜로니를 접종하고 30-37℃에서 회전 진탕기상에서 밤새 증식시켰다. 후속적인 20-㎖ 주 배양물에 상기 전배양물을 약 0.1의 출발 OD600으로 접종하고 30-37℃에서 회전 진탕기상에서 배양하였다. 유도가 필요한 경우, 40-60 ㎖의 주 배양물을 유도 시점에서 20-㎖ 비율로 분할하였다. 배양 부피는 진탕 플라스크 용량의 20%를 초과하지 않았다.
실시예 2: 3'-시알릴락토스에 대한 바실러스 서브틸리스 생산 균주의 구성
neuCBA 경로를 사용하여 대사 중간체 UDP-N-아세틸글루코스아민으로부터 3'-시알릴락토스의 합성을 위해서, 바실러스 서브틸리스 발현 플라스미드(서열번호 1)를 구성하였다. 먼저, 유전자 neuA, neuB, neuC 뿐만 아니라 α-2,3-시알릴트랜스퍼라제를 바실러스 서브틸리스에서의 발현을 위해 코돈-최적화하고 GenScript Corp에 의해 합성적으로 제조하였다. 캄필로박터 제주니 유전자 neuA(UniProtKB 수탁번호: Q93MP7)는 CMP-Neu5Ac 신시타제를 암호화한다. 캄필로박터 제주니 유전자 neuB(UniProtKB 수탁번호: Q93MP9)는 시알산 신타제를 암호화한다. 캄필로박터 제주니 유전자 neuC(UniProtKB 수탁번호: Q93MP8)는 N-아세틸글루코스아민-6-포스페이트 2-에피머라제를 암호화한다. 파스퇴렐라 뮬토시다 유전자 siaT(UniProtKB 수탁번호: Q9CLP3)는 α-2,3-시알릴트랜스퍼라제를 암호화한다. 락토스 퍼미아제를 암호화하는 이. 콜라이 유전자 lacY(Gen Bank 수탁번호: NP_414877.1)의 개방 판독 프레임을 염색체 DNA로부터 PCR에 의해 증폭시켰다. 그 후에, 유도성 프로모터 P grac100 의 조절하에서 모든 필요한 유전자를 포함하는 발현 카세트 <P grac100 -neuBCA-siaT-lacY-종결자>를 구성하였다. 이를 위해서, 바실러스 서브틸리스 발현 벡터 pHT253(MoBiTec GmbH, Gottingen, Germany)을 주쇄로서 사용하였다. 발현 카세트내의 각 유전자를 바실러스 서브틸리스 RBS 서열에 연결하였다. 추가로, iGem 파트 기탁소(서열 ID: BBa_B0015)로부터의 적합한 바실러스 서브틸리스 종결자 서열을 발현 카세트의 하류에 놓았다. 생성 플라스미드 <pHT253-P grac100 -neuBCA-2,3siaT-lacY-종결자>(서열번호 1)를 사용하여 이의 고유 수용능력을 활용함으로써 포자형성 바실러스 서브틸리스 균주(표 1)를 형질전환시켰다.
유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다.
형질전환체를, 바실러스 서브틸리스가 외인성 락토스의 존재하에서 3'-시알릴락토스를 생산할 수 있게 하는 조건하에서 배양하였다.
실시예 3: 3'-시알릴락토스에 대한 바실러스 서브틸리스 생산 균주의 구성
neuCBA 경로를 사용하여 대사 중간체 UDP-N-아세틸글루코스아민으로부터 3'-시알릴락토스의 합성을 위해서, 구성적 바실러스 서브틸리스 발현 플라스미드(서열번호 2)를 구성하였다. 먼저, 유전자 neuA, neuB, neuC 뿐만 아니라 siaT를 바실러스 서브틸리스에서의 발현을 위해 코돈-최적화하고 GenScript Corp에 의해 합성적으로 제조하였다. 캄필로박터 제주니 유전자 neuA(UniProtKB 수탁번호: Q93MP7)는 CMP-Neu5Ac 신시타제를 암호화한다. 캄필로박터 제주니 유전자 neuB(UniProtKB 수탁번호: Q93MP9)는 시알산 신타제를 암호화한다.
캄필로박터 제주니 유전자 neuC(UniProtKB 수탁번호: Q93MP8)는 N-아세틸글루코스아민-6-포스페이트 2-에피머라제를 암호화한다. 파스퇴렐라 뮬토시다 유전자 siaT(UniProtKB 수탁번호: Q9CLP3)는 α-2,3-시알릴트랜스퍼라제를 암호화한다. 락토스 퍼미아제를 암호화하는 이. 콜라이 유전자 lacY(Gen Bank 수탁번호: NP_414877.1)의 개방 판독 프레임을 염색체 DNA로부터 PCR에 의해 증폭시켰다. 그 후에, 2개의 강한 구성적 바실러스 서브틸리스 프로모터 P lepA 및/또는 P43에 작동적으로 연결된 모든 필요한 유전자를 포함하는 발현 카세트 <P43-neuBCA-P lepA -siaT-lacY-종결자>를 구성하였다. 바실러스 서브틸리스 발현 벡터 pHT253(MoBiTec GmbH, Gottingen, Germany)을 플라스미드 주쇄로서 사용하였다. 발현 카세트내의 각 유전자를 바실러스 서브틸리스 RBS 서열에 연결하였다. 추가로, iGem 파트 기탁소(서열 ID: BBa_B0015)로부터의 적합한 바실러스 서브틸리스 종결자 서열을 발현 카세트의 하류에 놓았다.
생성 플라스미드 <pHT253-P43-neuBCA-P lepA -siaT-lacY-종결자>(서열번호 2)를 사용하여 이의 고유 수용능력을 활용함으로써 포자형성 및 비-포자형성 바실러스 서브틸리스 균주(표 1)를 형질전환시켰다.
유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다.
형질전환체를, 바실러스 서브틸리스가 외인성 락토스의 존재하에서 3'-시알릴락토스를 생산할 수 있게 하는 조건하에서 배양하였다.
실시예 4: 6'-시알릴락토스에 대한 바실러스 서브틸리스 생산 균주의 구성
바실러스 서브틸리스에서 6'-시알릴락토스의 생산을 위해서, 포토박테리움 레이오그나티(Photobacterium leiognathi)로부터의 α-2,6-시알릴트랜스퍼라제를 사용하였다. 유전자 siaT(UniProtKB 수탁번호: D0VYB7)의 개방 판독 프레임을 바실러스 서브틸리스에서의 발현에 대해 코돈-최적화하고 GenScript Corp에 의해 합성적으로 제조하였다.
발현 플라스미드 <pHT253-P grac100 -neuBCA-2,6siaT-lacY-종결자>(서열번호 3)를 실시예 2에 기재된 바와 같이 구성하였다. 생성 플라스미드(서열번호 3)를 사용하여 이의 고유 수용능력을 활용함으로써 포자형성 및 비-포자형성 바실러스 서브틸리스 균주(표 1)를 형질전환시켰다. 유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다. 형질전환체를, 바실러스 서브틸리스가 외인성 락토스의 존재하에서 6'-시알릴락토스를 생산할 수 있게 하는 조건하에서 배양하였다.
실시예 5: 3'-시알릴락토스의 생산을 위한 바실러스 서브틸리스 균주의 구성
바실러스 서브틸리스(표 1)의 대사 공학을, 이종 유전자 캄필로박터 제주니 neuA, 이. 콜라이 nanT 및 헤모필루스 파라헤모리티쿠스 siaT의 통합 및 상동성 재조합에 의한 내인성 유전자 ganA의 동시 결실에 의해 성취하였다. 갈락탄 오페론내에 위치한 바실러스 서브틸리스 유전자 ganA(yvfN, lacA)는 베타-갈락토시다제를 암호화한다.
외인성 시알산/N-아세틸뉴라민산 및 락토스로부터 3'-시알릴락토스의 생산을 위해서, neuA, nanTsiaT의 개방 판독 프레임을 오페론으로서 바실러스 서브틸리스 구성적 프로모터 P43(iGem 부분 기탁소: 서열 ID: BBa_K143013)에 작동적으로 연결하였다. 이를 위해서, 먼저 유전자 neuA, nanTsiaT를 바실러스 서브틸리스에서의 발현을 위해 코돈-최적화하고 GenScript Corp에 의해 합성적으로 제조하였다. 캄필로박터 제주니 유전자 neuA(UniProtKB 수탁번호: Q93MP7)는 CMP-Neu5Ac 신시타제를 암호화하고, 이. 콜라이 유전자 nanT(UniProtKB 수탁번호: NP_417691.4)는 시알산 수송체를 암호화하고, 헤모필루스 파라헤모리티쿠스 유전자 siaT(UniProtKB 수탁번호: I3DHL4)는 알파-N-아세틸글루코스아미닐-2,3-베타-갈락토실-1,3-N-아세틸갈락토스아미니드 6-알파-시알릴트랜스퍼라제(알파-2,3-시알릴트랜스퍼라제)를 암호화한다.
발현 카세트내의 각 유전자를 바실러스 서브틸리스 RBS 서열에 연결하였다. 추가로, iGem 파트 기탁소(서열 ID: BBa_B0015)로부터의 적합한 바실러스 서브틸리스 종결자 서열을 발현 카세트의 하류에 놓았다.
클로닝 벡터 pBR322(New England Biolabs GmbH, Frankfurt, Germany)를 플라스미드 주쇄로서 사용하였다. 완전한 통합 카세트를 조립하여 자살 플라스미드 <pBR322 측면인접 ganA 위-P43-siaT-neuA-nanT-종결자-erm-측면인접 ganA 아래>(서열번호 4)를 생성시켰다. 그 후에, 바실러스 서브틸리스를 이의 고유 수용능력에 의해 이 플라스미드로 형질전환시켰다. 세포를 적합한 항생제(5 ㎍ ㎖-1 에리쓰로마이신)를 함유하는 2x YT 아가 플레이트상에 스프레딩하였다. 발현 카세트 <P43-siaT-NeuA-nanT-종결자>의 바실러스 서브틸리스 게놈의 ganA 유전자좌내로의 통합은 균주 A를 생성시켰으며, 이를 콜로니 PCR에 의해 확인하였다. 유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다.
바실러스 세포내로의 외인성 락토스의 수입을 위해서, 이. 콜라이 유전자 lacY를 바실러스 서브틸리스 게놈(알파-아밀라제를 암호화하는)의 내인성 amyE(amyA) 유전자좌에 통합시켰다. 이를 위해서, 락토스 퍼미아제를 암호화하는 이. 콜라이 lacY 유전자(Gen Bank 수탁번호: NP_414877.1)의 개방 판독 프레임을 염색체 DNA로부터 PCR에 의해 증폭시켰다. 통합 카세트 <측면인접 amyE 위-lox71-aad9-lox66-P43-lacY-측면인접 amyE 아래>(서열번호 5)를 구성하고 pBR322(New England Biolabs GmbH, Frankfurt, Germany)내로 클로닝하였다. 균주 A를 생성되는 자살 플라스미드로 고유 수용능력에 의해 형질전환시켰다. 발현 카세트 <P43-lacY>의 균주 A의 amyE 유전자좌내로의 통합은 균주 B를 생성시켰으며, 이를 콜로니 PCR에 의해 확인하였다.
유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다. 균주 B를, 바실러스 서브틸리스가 외인성 락토스 및 시알산/N-아세틸뉴라민산의 존재하에서 3'-시알릴락토스를 생산할 수 있게 하는 조건하에서 배양하였다.
실시예 6: 대사적으로 조작된 바실러스 서브틸리스 균주를 사용하는 시알릴락토스의 생산
전배양물에, 시알릴락토스의 생합성에 적합한 대사 조작된 바실러스 서브틸리스 균주를 접종하였다(실시예 2-5에 기재된 바와 같이).
전배양물을 30-37℃에서 밤새 배양하고 이어서 신선한 주 배양 배지에서 약 0.1의 출발 OD600으로 희석하였다. 주 배양물이 대략 0.5의 OD600에 도달했을 때, 2 mM 락토스를 생육 배지에 가하였다. 유도성 프로모터 Pgrac100을 유전자 발현에 사용했을 때, 유도를 락토스(2 mM) 또는 락토스(2 mM) 및 IPTG(1 mM) 모두로 수행하였다. CMP-N-아세틸뉴라민산의 회수 생합성을 위해서, 추가로 2 mM 시알산/N-아세틸뉴라민산을 가하였다. 유도 후 약 24h/48h 후에 배양을 중단하고 세포내 및 세포외 시알릴락토스를 박층 크로마토그래피 및/또는 HPLC 및/또는 질량 분광분석에 의해 분석하였다(WO 2017/042382 A 또는 WO 2019/008133 A에 기재된 바와 같이). 상당량의 시알릴락토스(3'-시알릴락토스/6'-시알릴락토스)의 생합성을 검출할 수 있었다.
SEQUENCE LISTING <110> Jennewein Biotechnologie GmbH <120> Production of sialylated oligosaccharides in Bacillus cells <130> P 1906 WO <160> 5 <170> PatentIn version 3.5 <210> 1 <211> 13121 <212> DNA <213> Artificial Sequence <220> <223> Expression plasmid <400> 1 ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa 60 tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa 120 gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat 180 aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt 240 tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat 300 ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag 360 gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt 420 ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt 480 tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc 540 cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga 600 aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa 660 tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct 720 cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa 780 tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc 840 ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat 900 ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa 960 aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct 1020 tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact 1080 atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 1140 gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 1200 agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc 1260 gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 1320 aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 1380 attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt 1440 caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg 1500 aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc 1560 gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat 1620 tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt 1680 cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc 1740 tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc 1800 cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag 1860 atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt 1920 ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat 1980 ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag 2040 attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac 2100 gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg 2160 cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg 2220 tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt 2280 tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc 2340 ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt 2400 gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatg 2460 gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca 2520 aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt 2580 ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag 2640 gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa 2700 gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa 2760 acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg 2820 tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg 2880 cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa 2940 tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca 3000 tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac 3060 tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagaagata 3120 tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac 3180 atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca 3240 ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa 3300 caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga 3360 aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg 3420 gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca 3480 gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat 3540 cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac 3600 aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg 3660 aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag 3720 cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt 3780 taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt 3840 ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa 3900 attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg 3960 gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact 4020 acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat 4080 atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg 4140 cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa 4200 ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc 4260 tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa 4320 tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg 4380 aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg 4440 tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc 4500 agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc 4560 ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct 4620 ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca 4680 tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg 4740 gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag 4800 ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata 4860 gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga 4920 aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg 4980 cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc 5040 ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct 5100 caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa 5160 gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga 5220 aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa 5280 acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta 5340 gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt 5400 tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat 5460 atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat 5520 ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt 5580 gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg 5640 aggacaaaca tggataaatt tgctgaacat gaaattccga aagctgttat cgtggccggc 5700 aacggagaat ctctttcaca aatcgattac agactgcttc cgaaaaacta tgatgtcttt 5760 agatgcaacc agttttactt tgaagaacgc tattttcttg gcaacaaaat caaagcagtt 5820 ttctttacac cgggagtgtt tttagaacaa tactacacac tgtaccatct taaacgcaac 5880 aacgaatact ttgtcgataa cgttatcctg tcatcattta accatccgac agttgatctg 5940 gaaaaatcac aaaaaatcca ggctctgttt attgatgtga tcaacggcta cgaaaaatac 6000 ctgtctaaac tgacagcctt tgatgtttat ctgagataca aagaacttta cgaaaaccaa 6060 cgcattacat caggagtgta tatgtgcgcc gtcgcaatcg cgatgggcta tacagatatt 6120 taccttacag gaatcgattt ttatcaggca agcgaagaaa actacgcgtt tgataacaaa 6180 aaaccgaaca tcatcagatt actgccggat tttcgcaaag aaaaaacatt attttcatat 6240 catagcaaag atattgatct tgaagcatta tcttttctgc aacagcatta ccatgttaac 6300 ttttacagca tttctccgat gtctccgctg tcaaaacatt ttccgatccc gacagtggaa 6360 gatgattgtg aaacaacatt tgtcgcgccg ctgaaagaaa actacatcaa cgatattctt 6420 ttaccgccgc attttgtcta tgaaaaactt ggcgttgata aacttgcagc ggctttagaa 6480 catcatcatc atcatcatta aagtgatagc ggtaccatta taggtaagag aggaatgtac 6540 acatgtacta tttaaaaaac acaaactttt ggatgttcgg tttattcttt ttcttttact 6600 tttttatcat gggagcctac ttcccgtttt tcccgatttg gctacatgac atcaaccata 6660 tcagcaaaag tgatacgggt attatttttg ccgctatttc tctgttctcg ctattattcc 6720 aaccgctgtt tggtctgctt tctgacaaac tcgggctgcg caaatacctg ctgtggatta 6780 ttaccggcat gttagtgatg tttgcgccgt tctttatttt tatcttcggg ccactgttac 6840 aatacaacat tttagtagga tcgattgttg gtggtattta tctaggcttt tgttttaacg 6900 ccggtgcgcc agcagtagag gcatttattg agaaagtcag ccgtcgcagt aatttcgaat 6960 ttggtcgcgc gcggatgttt ggctgtgttg gctgggcgct gtgtgcctcg attgtcggca 7020 tcatgttcac catcaataat cagtttgttt tctggctggg ctctggctgt gcactcatcc 7080 tcgccgtttt actctttttc gccaaaacgg atgcgccctc ttctgccacg gttgccaatg 7140 cggtaggtgc caaccattcg gcatttagcc ttaagctggc actggaactg ttcagacagc 7200 caaaactgtg gtttttgtca ctgtatgtta ttggcgtttc ctgcacctac gatgtttttg 7260 accaacagtt tgctaatttc tttacttcgt tctttgctac cggtgaacag ggtacgcggg 7320 tatttggcta cgtaacgaca atgggcgaat tacttaacgc ctcgattatg ttctttgcgc 7380 cactgatcat taatcgcatc ggtgggaaaa acgccctgct gctggctggc actattatgt 7440 ctgtacgtat tattggctca tcgttcgcca cctcagcgct ggaagtggtt attctgaaaa 7500 cgctgcatat gtttgaagta ccgttcctgc tggtgggctg ctttaaatat attaccagcc 7560 agtttgaagt gcgtttttca gcgacgattt atctggtctg tttctgcttc tttaagcaac 7620 tggcgatgat ttttatgtct gtactggcgg gcaatatgta tgaaagcatc ggtttccagg 7680 gcgcttatct ggtgctgggt ctggtggcgc tgggcttcac cttaatttcc gtgttcacgc 7740 ttagcggccc cggcccgctt tccctgctgc gtcgtcaggt gaatgaagtc gcttaaggat 7800 ccatgtctag agtcgacgtc cccggggcag cccgcctaat gagcgggctt ttttcacgtc 7860 ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 7920 gtttgtcggt gaacgctctc tactagagtc acactggctc accttcgggt gggcctttct 7980 gcgtttatac ccggggcagc ccgcctaatg agcgggcttt tttcacgtca cgcgtccatg 8040 gagatctttg tctgcaactg aaaagtttat accttacctg gaacaaatgg ttgaaacata 8100 cgaggctaat atcggcttat taggaatagt ccctgtacta ataaaatcag gtggatcagt 8160 tgatcagtat attttggacg aagctcggaa agaatttgga gatgacttgc ttaattccac 8220 aattaaatta agggaaagaa taaagcgatt tgatgttcaa ggaatcacgg aagaagatac 8280 tcatgataaa gaagctctaa aactattcaa taaccttaca atggaattga tcgaaagggt 8340 ggaaggttaa tggtacgaaa attaggggat ctacctagaa agccacaagg cgataggtca 8400 agcttaaaga acccttacat ggatcttaca gattctgaaa gtaaagaaac aacagaggtt 8460 aaacaaacag aaccaaaaag aaaaaaagca ttgttgaaaa caatgaaagt tgatgtttca 8520 atccataata agattaaatc gctgcacgaa attctggcag catccgaagg gaattcatat 8580 tacttagagg atactattga gagagctatt gataagatgg ttgagacatt acctgagagc 8640 caaaaaactt tttatgaata tgaattaaaa aaaagaacca acaaaggctg agacagactc 8700 caaacgagtc tgttttttta aaaaaaatat taggagcatt gaatatatat tagagaatta 8760 agaaagacat gggaataaaa atattttaaa tccagtaaaa atatgataag attatttcag 8820 aatatgaaga actctgtttg tttttgatga aaaaacaaac aaaaaaaatc cacctaacgg 8880 aatctcaatt taactaacag cggccaaact gagaagttaa atttgagaag gggaaaaggc 8940 ggatttatac ttgtatttaa ctatctccat tttaacattt tattaaaccc catacaagtg 9000 aaaatcctct tttacactgt tcctttaggt gatcgcggag ggacattatg agtgaagtaa 9060 acctaaaagg aaatacagat gaattagtgt attatcgaca gcaaaccact ggaaataaaa 9120 tcgccaggaa gagaatcaaa aaagggaaag aagaagttta ttatgttgct gaaacggaag 9180 agaagatatg gacagaagag caaataaaaa acttttcttt agacaaattt ggtacgcata 9240 taccttacat agaaggtcat tatacaatct taaataatta cttctttgat ttttggggct 9300 attttttagg tgctgaagga attgcgctct atgctcacct aactcgttat gcatacggca 9360 gcaaagactt ttgctttcct agtctacaaa caatcgctaa aaaaatggac aagactcctg 9420 ttacagttag aggctacttg aaactgcttg aaaggtacgg ttttatttgg aaggtaaacg 9480 tccgtaataa aaccaaggat aacacagagg aatccccgat ttttaagatt agacgtaagg 9540 ttcctttgct ttcagaagaa cttttaaatg gaaaccctaa tattgaaatt ccagatgacg 9600 aggaagcaca tgtaaagaag gctttaaaaa aggaaaaaga gggtcttcca aaggttttga 9660 aaaaagagca cgatgaattt gttaaaaaaa tgatggatga gtcagaaaca attaatattc 9720 cagaggcctt acaatatgac acaatgtatg aagatatact cagtaaagga gaaattcgaa 9780 aagaaatcaa aaaacaaata cctaatccta caacatcttt tgagagtata tcaatgacaa 9840 ctgaagagga aaaagtcgac agtactttaa aaagcgaaat gcaaaatcgt gtctctaagc 9900 cttcttttga tacctggttt aaaaacacta agatcaaaat tgaaaataaa aattgtttat 9960 tacttgtacc gagtgaattt gcatttgaat ggattaagaa aagatattta gaaacaatta 10020 aaacagtcct tgaagaagct ggatatgttt tcgaaaaaat cgaactaaga aaagtgcaat 10080 aaactgctga agtatttcag cagttttttt tatttagaaa tagtgaaaaa aatataatca 10140 gggaggtatc aatatttaat gagtactgat ttaaatttat ttagactgga attaataatt 10200 aacacgtaga ctaattaaaa tttaatgagg gataaagagg atacaaaaat attaatttca 10260 atccctatta aattttaaca agggggggat taaaatttaa ttagaggttt atccacaaga 10320 aaagacccta ataaaatttt tactagggtt ataacactga ttaatttctt aatgggggag 10380 ggattaaaat ttaatgacaa agaaaacaat cttttaagaa aagcttttaa aagataataa 10440 taaaaagagc tttgcgatta agcaaaactc tttacttttt cattgacatt atcaaattca 10500 tcgatttcaa attgttgttg tatcataaag ttaattctgt tttgcacaac cttttcagga 10560 atataaaaca catctgaggc ttgttttata aactcagggt cgctaaagtc aatgtaacgt 10620 agcatatgat atggtatagc ttccacccaa gttagccttt ctgcttcttc tgaatgtttt 10680 tcatatactt ccatgggtat ctctaaatga ttttcctcat gtagcaaggt atgagcaaaa 10740 agtttatgga attgatagtt cctctctttt tcttcaactt ttttatctaa aacaaacact 10800 ttaacatctg agtcaatgta agcataagat gtttttccag tcataatttc aatcccaaat 10860 cttttagaca gaaattctgg acgtaaatct tttggtgaaa gaattttttt atgtagcaat 10920 atatccgata cagcaccttc taaaagcgtt ggtgaatagg gcattttacc tatctcctct 10980 cattttgtgg aataaaaata gtcatattcg tccatctacc tatcctatta tcgaacagtt 11040 gaacttttta atcaaggatc agtccttttt ttcattattc ttaaactgtg ctcttaactt 11100 taacaactcg atttgttttt ccagatctcg agggtaacta gcctcgccga tcccgcaaga 11160 ggcccggcag tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 11220 tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 11280 ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 11340 ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 11400 tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 11460 gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 11520 gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 11580 acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 11640 tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 11700 caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 11760 gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 11820 cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 11880 tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 11940 agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 12000 tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 12060 ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 12120 acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 12180 ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 12240 gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 12300 gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 12360 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 12420 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 12480 ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 12540 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 12600 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 12660 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 12720 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 12780 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 12840 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 12900 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 12960 ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 13020 tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 13080 gtcagtgagc gaggaagcgg aagagcgccc aatacgcatg c 13121 <210> 2 <211> 11125 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 2 ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa 60 tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa 120 gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat 180 aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt 240 tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat 300 ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag 360 gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt 420 ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt 480 tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc 540 cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga 600 aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa 660 tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct 720 cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa 780 tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc 840 ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat 900 ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa 960 aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct 1020 tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact 1080 atggcgtgct gctagcattt tacattttta gaaatgggcg tgaaaaaaag cgcgcgatta 1140 tgtaaaatat aaagattaac taataaggag gacaaacatg aaagaaatca aaatccaaaa 1200 catcatcatc agcgaagaaa aagcgccgct ggttgtgccg gaaatcggca ttaatcataa 1260 cggatcttta gaactggcta aaatcatggt tgatgcagcg ttttcagctg gagccaaaat 1320 catcaaacat caaacacata tcgtcgaaga tgaaatgagc aaagctgcaa agaaagttat 1380 cccgggcaac gctaaaatct ctatctacga aatcatgcag aaatgcgctt tagattacaa 1440 agatgaactt gccctgaaag aatacacaga aaaactggga cttgtgtatc ttagcacacc 1500 gttttcaaga gcaggcgcga atcgcttaga agatatggga gtctctgcat ttaaaatcgg 1560 ctcaggagaa tgtaataact atccgctgat caaacatatt gcagcgttta aaaaaccgat 1620 gattgtgtct acaggcatga actcaatcga aagcattaaa ccgacagtga aaatcctgct 1680 tgataacgaa atcccgtttg tcctgatgca tacaacaaac ctgtatccga caccgcataa 1740 tcttgttaga ttaaacgcca tgctggaact gaagaaagaa tttagctgca tggtgggact 1800 ttctgatcat acaacagata atctggcatg ccttggcgcg gtcgttcttg gagcgtgtgt 1860 cttagaaaga cattttacag attcaatgca tcgcagcgga ccggatattg tttgttctat 1920 ggatacaaaa gccttaaaag aactgatcat tcaatcagaa cagatggcaa tcattcgcgg 1980 caataacgaa tcaaagaaag cagccaaaca agaacaggtt acaatcgatt ttgcttttgc 2040 ctctgtggtc tcaatcaaag atattaagaa aggcgaagtt ctgtcaatgg ataatatttg 2100 ggtgaaaaga ccgggacttg gcggaatcag cgcagcggaa tttgaaaata ttctgggcaa 2160 gaaagcactg cgcgatattg aaaacgatgc gcagttaagc tatgaagatt ttgcttaagc 2220 tcttaaggag gattttagaa tgaagaaaat tctgtttatc acaggctcaa gagcggatta 2280 ctctaaaatc aaatcactta tgtaccgcgt ccaaaattca agcgaatttg aactttacat 2340 ctttgctaca ggcatgcatc tgagcaaaaa ctttggatac acagttaaag aattatataa 2400 aaatggcttt aaaaacatct acgaatttat caactacgat aaatattatc agacagataa 2460 agccctggca acaacaattg atggattttc aagatatgcg aacgaattaa aaccggatct 2520 gattgttgtg catggcgatc gcatcgaacc gcttgcagcg gctattgtcg gagcccttaa 2580 caacatcctg gttgcacata tcgaaggcgg agaaattagc ggaacaatcg atgattcttt 2640 aagacatgcg atttcaaaac ttgctcatat ccatctggtg aacgatgaat ttgcaaaaag 2700 acgccttatg caattaggcg aagatgaaaa atcaatcttt atcatcggat ctccggatct 2760 ggaactgctt aacgataaca aaatctcact tagcgaagcc aaaaaatact acgatattaa 2820 ctacgaaaac tatgcattac tgatgtttca tccggtcaca acagaaatca catctatcaa 2880 aaaccaagcc gataacctgg tgaaagcact tatccagtca aacaaaaact acatcgtcat 2940 ctatccgaat aacgatctgg gctttgaact gatccttcag agctatgaag aatttaaaaa 3000 caacccgaga tttaaactgt ttccgtctct gcgctttgaa tactttatca cacttctgaa 3060 aaacgccgat tttattatcg gaaactcttc atgcatcctg aaagaagcgt tatacctgaa 3120 aacagctggc attctggttg gatcaagaca aaatggccgc ttaggaaatg aaaacacact 3180 gaaagtgaat gcgaacagcg atgaaatcct taaagctatc aacacaatcc ataaaaaaca 3240 ggatttattt tctgctaaac tggaaattct tgatagctct aaactgtttt tcgaatatct 3300 tcaatcaggc gatttcttta aacttagcac acagaaagtt tttaaagata ttaaataaaa 3360 aggaggaact actatgtcac ttgcaattat cccggcgaga ggcggaagca aaggcatcaa 3420 aaacaaaaac ctggttctgc ttaacaacaa accgcttatc tactacacaa tcaaagcagc 3480 gctgaatgct aaatctattt caaaagttgt ggtctcaagc gatagcgatg aaatccttaa 3540 ctacgccaaa tctcaaaacg tggatattct gaaaagaccg atctctcttg cacaggatga 3600 tacaacatca gataaagtct tactgcatgc gctgaaattt tacaaagatt acgaagatgt 3660 tgtgttttta caaccgacat ctccgctgcg cacaaacatt catatcaacg aagcatttaa 3720 cctgtacaaa aattcaaacg ctaatgccct gattagcgtc tctgaatgcg ataacaaaat 3780 ccttaaagca tttgtttgca acgattgtgg cgatttagcc ggaatttgta atgatgaata 3840 tccgtttatg ccgcgccaga aactgccgaa aacatatatg agcaacggag cgatctacat 3900 ccttaaaatc aaagaatttc tgaacaaccc gtcatttctg caaagcaaaa caaaacattt 3960 tcttatggat gaatcatcat cactggatat tgattgcctg gaagatttaa agaaagttga 4020 acaaatttgg aaaaaataaa gtcaatgtat gaatggatac gggatatgaa tcaataagta 4080 cgtgaaagag aaaagcaacc cagatatgat agggaacttt tctctttctt gttttacatt 4140 gaatctttac aatcctattg atataatcta agctagtgta ttttgcgttt aatagtggag 4200 aaaagctagc gattaactaa taaggaggac aaacatggat aaatttgctg aacatgaaat 4260 tccgaaagct gttatcgtgg ccggcaacgg agaatctctt tcacaaatcg attacagact 4320 gcttccgaaa aactatgatg tctttagatg caaccagttt tactttgaag aacgctattt 4380 tcttggcaac aaaatcaaag cagttttctt tacaccggga gtgtttttag aacaatacta 4440 cacactgtac catcttaaac gcaacaacga atactttgtc gataacgtta tcctgtcatc 4500 atttaaccat ccgacagttg atctggaaaa atcacaaaaa atccaggctc tgtttattga 4560 tgtgatcaac ggctacgaaa aatacctgtc taaactgaca gcctttgatg tttatctgag 4620 atacaaagaa ctttacgaaa accaacgcat tacatcagga gtgtatatgt gcgccgtcgc 4680 aatcgcgatg ggctatacag atatttacct tacaggaatc gatttttatc aggcaagcga 4740 agaaaactac gcgtttgata acaaaaaacc gaacatcatc agattactgc cggattttcg 4800 caaagaaaaa acattatttt catatcatag caaagatatt gatcttgaag cattatcttt 4860 tctgcaacag cattaccatg ttaactttta cagcatttct ccgatgtctc cgctgtcaaa 4920 acattttccg atcccgacag tggaagatga ttgtgaaaca acatttgtcg cgccgctgaa 4980 agaaaactac atcaacgata ttcttttacc gccgcatttt gtctatgaaa aacttggcgt 5040 tgataaactt gcagcggctt tagaacatca tcatcatcat cattaaagtg atagcggtac 5100 cattataggt aagagaggaa tgtacacatg tactatttaa aaaacacaaa cttttggatg 5160 ttcggtttat tctttttctt ttactttttt atcatgggag cctacttccc gtttttcccg 5220 atttggctac atgacatcaa ccatatcagc aaaagtgata cgggtattat ttttgccgct 5280 atttctctgt tctcgctatt attccaaccg ctgtttggtc tgctttctga caaactcggg 5340 ctgcgcaaat acctgctgtg gattattacc ggcatgttag tgatgtttgc gccgttcttt 5400 atttttatct tcgggccact gttacaatac aacattttag taggatcgat tgttggtggt 5460 atttatctag gcttttgttt taacgccggt gcgccagcag tagaggcatt tattgagaaa 5520 gtcagccgtc gcagtaattt cgaatttggt cgcgcgcgga tgtttggctg tgttggctgg 5580 gcgctgtgtg cctcgattgt cggcatcatg ttcaccatca ataatcagtt tgttttctgg 5640 ctgggctctg gctgtgcact catcctcgcc gttttactct ttttcgccaa aacggatgcg 5700 ccctcttctg ccacggttgc caatgcggta ggtgccaacc attcggcatt tagccttaag 5760 ctggcactgg aactgttcag acagccaaaa ctgtggtttt tgtcactgta tgttattggc 5820 gtttcctgca cctacgatgt ttttgaccaa cagtttgcta atttctttac ttcgttcttt 5880 gctaccggtg aacagggtac gcgggtattt ggctacgtaa cgacaatggg cgaattactt 5940 aacgcctcga ttatgttctt tgcgccactg atcattaatc gcatcggtgg gaaaaacgcc 6000 ctgctgctgg ctggcactat tatgtctgta cgtattattg gctcatcgtt cgccacctca 6060 gcgctggaag tggttattct gaaaacgctg catatgtttg aagtaccgtt cctgctggtg 6120 ggctgcttta aatatattac cagccagttt gaagtgcgtt tttcagcgac gatttatctg 6180 gtctgtttct gcttctttaa gcaactggcg atgattttta tgtctgtact ggcgggcaat 6240 atgtatgaaa gcatcggttt ccagggcgct tatctggtgc tgggtctggt ggcgctgggc 6300 ttcaccttaa tttccgtgtt cacgcttagc ggccccggcc cgctttccct gctgcgtcgt 6360 caggtgaatg aagtcgctta aggatccatg tctagagtcg acgtccccgg ggcagcccgc 6420 ctaatgagcg ggcttttttc acgtcccagg catcaaataa aacgaaaggc tcagtcgaaa 6480 gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact 6540 ggctcacctt cgggtgggcc tttctgcgtt tatagaattc atattactta gaggatacta 6600 ttgagagagc tattgataag atggttgaga cattacctga gagccaaaaa actttttatg 6660 aatatgaatt aaaaaaaaga accaacaaag gctgagacag actccaaacg agtctgtttt 6720 tttaaaaaaa atattaggag cattgaatat atattagaga attaagaaag acatgggaat 6780 aaaaatattt taaatccagt aaaaatatga taagattatt tcagaatatg aagaactctg 6840 tttgtttttg atgaaaaaac aaacaaaaaa aatccaccta acggaatctc aatttaacta 6900 acagcggcca aactgagaag ttaaatttga gaaggggaaa aggcggattt atacttgtat 6960 ttaactatct ccattttaac attttattaa accccataca agtgaaaatc ctcttttaca 7020 ctgttccttt aggtgatcgc ggagggacat tatgagtgaa gtaaacctaa aaggaaatac 7080 agatgaatta gtgtattatc gacagcaaac cactggaaat aaaatcgcca ggaagagaat 7140 caaaaaaggg aaagaagaag tttattatgt tgctgaaacg gaagagaaga tatggacaga 7200 agagcaaata aaaaactttt ctttagacaa atttggtacg catatacctt acatagaagg 7260 tcattataca atcttaaata attacttctt tgatttttgg ggctattttt taggtgctga 7320 aggaattgcg ctctatgctc acctaactcg ttatgcatac ggcagcaaag acttttgctt 7380 tcctagtcta caaacaatcg ctaaaaaaat ggacaagact cctgttacag ttagaggcta 7440 cttgaaactg cttgaaaggt acggttttat ttggaaggta aacgtccgta ataaaaccaa 7500 ggataacaca gaggaatccc cgatttttaa gattagacgt aaggttcctt tgctttcaga 7560 agaactttta aatggaaacc ctaatattga aattccagat gacgaggaag cacatgtaaa 7620 gaaggcttta aaaaaggaaa aagagggtct tccaaaggtt ttgaaaaaag agcacgatga 7680 atttgttaaa aaaatgatgg atgagtcaga aacaattaat attccagagg ccttacaata 7740 tgacacaatg tatgaagata tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca 7800 aatacctaat cctacaacat cttttgagag tatatcaatg acaactgaag aggaaaaagt 7860 cgacagtact ttaaaaagcg aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg 7920 gtttaaaaac actaagatca aaattgaaaa taaaaattgt ttattacttg taccgagtga 7980 atttgcattt gaatggatta agaaaagata tttagaaaca attaaaacag tccttgaaga 8040 agctggatat gttttcgaaa aaatcgaact aagaaaagtg caataaactg ctgaagtatt 8100 tcagcagttt tttttattta gaaatagtga aaaaaatata atcagggagg tatcaatatt 8160 taatgagtac tgatttaaat ttatttagac tggaattaat aattaacacg tagactaatt 8220 aaaatttaat gagggataaa gaggatacaa aaatattaat ttcaatccct attaaatttt 8280 aacaaggggg ggattaaaat ttaattagag gtttatccac aagaaaagac cctaataaaa 8340 tttttactag ggttataaca ctgattaatt tcttaatggg ggagggatta aaatttaatg 8400 acaaagaaaa caatctttta agaaaagctt ttaaaagata ataataaaaa gagctttgcg 8460 attaagcaaa actctttact ttttcattga cattatcaaa ttcatcgatt tcaaattgtt 8520 gttgtatcat aaagttaatt ctgttttgca caaccttttc aggaatataa aacacatctg 8580 aggcttgttt tataaactca gggtcgctaa agtcaatgta acgtagcata tgatatggta 8640 tagcttccac ccaagttagc ctttctgctt cttctgaatg tttttcatat acttccatgg 8700 gtatctctaa atgattttcc tcatgtagca aggtatgagc aaaaagttta tggaattgat 8760 agttcctctc tttttcttca acttttttat ctaaaacaaa cactttaaca tctgagtcaa 8820 tgtaagcata agatgttttt ccagtcataa tttcaatccc aaatctttta gacagaaatt 8880 ctggacgtaa atcttttggt gaaagaattt ttttatgtag caatatatcc gatacagcac 8940 cttctaaaag cgttggtgaa tagggcattt tacctatctc ctctcatttt gtggaataaa 9000 aatagtcata ttcgtccatc tacctatcct attatcgaac agttgaactt tttaatcaag 9060 gatcagtcct ttttttcatt attcttaaac tgtgctctta actttaacaa ctcgatttgt 9120 ttttccagat ctcgagggta actagcctcg ccgatcccgc aagaggcccg gcagtcaggt 9180 ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca 9240 aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg 9300 aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc 9360 cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg 9420 ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt 9480 cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta 9540 ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat 9600 gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga 9660 gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca 9720 acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact 9780 cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc 9840 acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact 9900 ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt 9960 ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt 10020 gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt 10080 atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata 10140 ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag 10200 attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat 10260 ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 10320 aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 10380 aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 10440 ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg 10500 tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 10560 ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 10620 cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 10680 agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 10740 gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 10800 ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 10860 tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 10920 tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 10980 cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 11040 tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 11100 gcggaagagc gcccaatacg catgc 11125 <210> 3 <211> 13805 <212> DNA <213> Artificial Sequence <220> <223> Expression plasmid <400> 3 ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa 60 tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa 120 gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat 180 aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt 240 tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat 300 ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag 360 gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt 420 ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt 480 tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc 540 cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga 600 aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa 660 tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct 720 cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa 780 tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc 840 ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat 900 ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa 960 aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct 1020 tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact 1080 atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 1140 gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 1200 agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc 1260 gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 1320 aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 1380 attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt 1440 caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg 1500 aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc 1560 gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat 1620 tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt 1680 cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc 1740 tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc 1800 cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag 1860 atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt 1920 ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat 1980 ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag 2040 attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac 2100 gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg 2160 cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg 2220 tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt 2280 tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc 2340 ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt 2400 gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatg 2460 gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca 2520 aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt 2580 ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag 2640 gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa 2700 gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa 2760 acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg 2820 tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg 2880 cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa 2940 tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca 3000 tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac 3060 tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagaagata 3120 tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac 3180 atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca 3240 ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa 3300 caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga 3360 aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg 3420 gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca 3480 gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat 3540 cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac 3600 aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg 3660 aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag 3720 cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt 3780 taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt 3840 ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa 3900 attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg 3960 gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact 4020 acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat 4080 atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg 4140 cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa 4200 ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc 4260 tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa 4320 tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg 4380 aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg 4440 tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc 4500 agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc 4560 ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct 4620 ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca 4680 tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg 4740 gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag 4800 ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata 4860 gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga 4920 aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg 4980 cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc 5040 ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct 5100 caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa 5160 gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga 5220 aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa 5280 acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta 5340 gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt 5400 tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat 5460 atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat 5520 ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt 5580 gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg 5640 aggacaaaca tgaaaagaat cttttgcctt gtgtctgcaa tcctgctttc agcgtgtaat 5700 gataaccaga atacagtcga tgttgtggtc tcaacagtga acgataacgt catcgaaaac 5760 aacacatacc aggtcaaacc gatcgataca ccgacaacat ttgatagcta ttcttggatt 5820 caaacatgcg gcacaccgat ccttaaagat gatgaaaaat actcactgtc atttgatttt 5880 gttgctccgg aattagatca ggatgaaaaa ttttgttttg aatttacagg cgatgttgat 5940 ggaaaacgct atgtgacaca aacaaatctg acagttgtgg caccgacact tgaagtgtat 6000 gtcgatcatg cgagcctgcc gtctcttcaa cagctgatga aaatcatcca acagaaaaac 6060 gaatactctc agaacgaaag atttatctca tggggccgca tcggacttac agaagataac 6120 gctgaaaaac tgaatgccca tatttatccg ctggctggaa ataacacatc tcaagaatta 6180 gtcgatgcag ttatcgatta cgcggattca aaaaacagac tgaatctgga acttaacaca 6240 aacacagctc atagctttcc gaacttagcc ccgattctgc gcattatctc aagcaaaagc 6300 aacatcctga tctctaacat caacctttac gatgatggct cagccgaata cgtgaacctg 6360 tacaactgga aagatacaga agataaaagc gtcaaactgt ctgattcatt tttagttctg 6420 aaagattact ttaatggaat ttcttcagaa aaaccgagcg gcatctatgg aagatataac 6480 tggcatcagc tgtacaacac atcttactat tttctgagaa aagattatct gacagtcgaa 6540 ccgcaactgc atgatcttcg cgaatatctt ggcggatcat taaaacagat gagctgggat 6600 ggcttttcac aactgagcaa aggagataaa gaactgtttc tgaacattgt tggctttgat 6660 caagaaaaac tgcaacagga atatcaacag agcgaacttc cgaattttgt gtttacagga 6720 acaacaacat gggcaggcgg agaaacaaaa gaatattatg cgcaacagca agttaacgtc 6780 gttaacaacg caatcaacga aacatctccg tactacctgg gcagagaaca tgatcttttc 6840 tttaaaggac atccgcgcgg cggaattatc aatgatatta tcctgggctc atttaataac 6900 atgattgata ttccggcgaa agttagcttt gaagtgctta tgatgacagg aatgttaccg 6960 gatacagtgg gcggaattgc atcatcactg tattttagca tcccggccga aaaagtctct 7020 tttatcgttt ttacatcaag cgatacaatc acagatcgcg aagatgctct gaaatctccg 7080 cttgttcagg tgatgatgac actgggcatt gtgaaagaaa aagatgtcct gttttggtca 7140 gatttaccgg attgctcttc aggagtttgt attgcccaat attaaagtga tagcggtacc 7200 attataggta agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt 7260 tcggtttatt ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga 7320 tttggctaca tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta 7380 tttctctgtt ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc 7440 tgcgcaaata cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta 7500 tttttatctt cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta 7560 tttatctagg cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag 7620 tcagccgtcg cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg 7680 cgctgtgtgc ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc 7740 tgggctctgg ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc 7800 cctcttctgc cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc 7860 tggcactgga actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg 7920 tttcctgcac ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg 7980 ctaccggtga acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta 8040 acgcctcgat tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc 8100 tgctgctggc tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag 8160 cgctggaagt ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg 8220 gctgctttaa atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg 8280 tctgtttctg cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata 8340 tgtatgaaag catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct 8400 tcaccttaat ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc 8460 aggtgaatga agtcgcttaa ggatccatgt ctagagtcga cgtccccggg gcagcccgcc 8520 taatgagcgg gcttttttca cgtcccaggc atcaaataaa acgaaaggct cagtcgaaag 8580 actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag agtcacactg 8640 gctcaccttc gggtgggcct ttctgcgttt atacccgggg cagcccgcct aatgagcggg 8700 cttttttcac gtcacgcgtc catggagatc tttgtctgca actgaaaagt ttatacctta 8760 cctggaacaa atggttgaaa catacgaggc taatatcggc ttattaggaa tagtccctgt 8820 actaataaaa tcaggtggat cagttgatca gtatattttg gacgaagctc ggaaagaatt 8880 tggagatgac ttgcttaatt ccacaattaa attaagggaa agaataaagc gatttgatgt 8940 tcaaggaatc acggaagaag atactcatga taaagaagct ctaaaactat tcaataacct 9000 tacaatggaa ttgatcgaaa gggtggaagg ttaatggtac gaaaattagg ggatctacct 9060 agaaagccac aaggcgatag gtcaagctta aagaaccctt acatggatct tacagattct 9120 gaaagtaaag aaacaacaga ggttaaacaa acagaaccaa aaagaaaaaa agcattgttg 9180 aaaacaatga aagttgatgt ttcaatccat aataagatta aatcgctgca cgaaattctg 9240 gcagcatccg aagggaattc atattactta gaggatacta ttgagagagc tattgataag 9300 atggttgaga cattacctga gagccaaaaa actttttatg aatatgaatt aaaaaaaaga 9360 accaacaaag gctgagacag actccaaacg agtctgtttt tttaaaaaaa atattaggag 9420 cattgaatat atattagaga attaagaaag acatgggaat aaaaatattt taaatccagt 9480 aaaaatatga taagattatt tcagaatatg aagaactctg tttgtttttg atgaaaaaac 9540 aaacaaaaaa aatccaccta acggaatctc aatttaacta acagcggcca aactgagaag 9600 ttaaatttga gaaggggaaa aggcggattt atacttgtat ttaactatct ccattttaac 9660 attttattaa accccataca agtgaaaatc ctcttttaca ctgttccttt aggtgatcgc 9720 ggagggacat tatgagtgaa gtaaacctaa aaggaaatac agatgaatta gtgtattatc 9780 gacagcaaac cactggaaat aaaatcgcca ggaagagaat caaaaaaggg aaagaagaag 9840 tttattatgt tgctgaaacg gaagagaaga tatggacaga agagcaaata aaaaactttt 9900 ctttagacaa atttggtacg catatacctt acatagaagg tcattataca atcttaaata 9960 attacttctt tgatttttgg ggctattttt taggtgctga aggaattgcg ctctatgctc 10020 acctaactcg ttatgcatac ggcagcaaag acttttgctt tcctagtcta caaacaatcg 10080 ctaaaaaaat ggacaagact cctgttacag ttagaggcta cttgaaactg cttgaaaggt 10140 acggttttat ttggaaggta aacgtccgta ataaaaccaa ggataacaca gaggaatccc 10200 cgatttttaa gattagacgt aaggttcctt tgctttcaga agaactttta aatggaaacc 10260 ctaatattga aattccagat gacgaggaag cacatgtaaa gaaggcttta aaaaaggaaa 10320 aagagggtct tccaaaggtt ttgaaaaaag agcacgatga atttgttaaa aaaatgatgg 10380 atgagtcaga aacaattaat attccagagg ccttacaata tgacacaatg tatgaagata 10440 tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca aatacctaat cctacaacat 10500 cttttgagag tatatcaatg acaactgaag aggaaaaagt cgacagtact ttaaaaagcg 10560 aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg gtttaaaaac actaagatca 10620 aaattgaaaa taaaaattgt ttattacttg taccgagtga atttgcattt gaatggatta 10680 agaaaagata tttagaaaca attaaaacag tccttgaaga agctggatat gttttcgaaa 10740 aaatcgaact aagaaaagtg caataaactg ctgaagtatt tcagcagttt tttttattta 10800 gaaatagtga aaaaaatata atcagggagg tatcaatatt taatgagtac tgatttaaat 10860 ttatttagac tggaattaat aattaacacg tagactaatt aaaatttaat gagggataaa 10920 gaggatacaa aaatattaat ttcaatccct attaaatttt aacaaggggg ggattaaaat 10980 ttaattagag gtttatccac aagaaaagac cctaataaaa tttttactag ggttataaca 11040 ctgattaatt tcttaatggg ggagggatta aaatttaatg acaaagaaaa caatctttta 11100 agaaaagctt ttaaaagata ataataaaaa gagctttgcg attaagcaaa actctttact 11160 ttttcattga cattatcaaa ttcatcgatt tcaaattgtt gttgtatcat aaagttaatt 11220 ctgttttgca caaccttttc aggaatataa aacacatctg aggcttgttt tataaactca 11280 gggtcgctaa agtcaatgta acgtagcata tgatatggta tagcttccac ccaagttagc 11340 ctttctgctt cttctgaatg tttttcatat acttccatgg gtatctctaa atgattttcc 11400 tcatgtagca aggtatgagc aaaaagttta tggaattgat agttcctctc tttttcttca 11460 acttttttat ctaaaacaaa cactttaaca tctgagtcaa tgtaagcata agatgttttt 11520 ccagtcataa tttcaatccc aaatctttta gacagaaatt ctggacgtaa atcttttggt 11580 gaaagaattt ttttatgtag caatatatcc gatacagcac cttctaaaag cgttggtgaa 11640 tagggcattt tacctatctc ctctcatttt gtggaataaa aatagtcata ttcgtccatc 11700 tacctatcct attatcgaac agttgaactt tttaatcaag gatcagtcct ttttttcatt 11760 attcttaaac tgtgctctta actttaacaa ctcgatttgt ttttccagat ctcgagggta 11820 actagcctcg ccgatcccgc aagaggcccg gcagtcaggt ggcacttttc ggggaaatgt 11880 gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 11940 acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 12000 tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 12060 agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 12120 cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 12180 aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg 12240 gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc 12300 agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat 12360 aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga 12420 gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc 12480 ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc 12540 aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 12600 aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc 12660 tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc 12720 agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca 12780 ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca 12840 ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt 12900 ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 12960 acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 13020 agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 13080 ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 13140 cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 13200 gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 13260 cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 13320 gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 13380 caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 13440 aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 13500 tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 13560 gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 13620 ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 13680 atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 13740 cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg 13800 catgc 13805 <210> 4 <211> 10838 <212> DNA <213> Artificial Sequence <220> <223> Suicide plasmid <400> 4 ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa 60 ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg 120 caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt 180 gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata 240 tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg 300 ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac 360 cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac 420 aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca 480 cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg 540 actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct 600 caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat 660 gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt 720 cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct 780 ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct 840 tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa 900 acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt 960 cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc 1020 cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca 1080 tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc 1140 gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat 1200 tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg 1260 ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga 1320 attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac 1380 atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg 1440 tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg 1500 ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc 1560 tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg 1620 taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca 1680 ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga 1740 ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa 1800 cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt 1860 ttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc 1920 aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt 1980 ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac 2040 gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac 2100 ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc 2160 agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc 2220 cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg 2280 tactgagagt gcaccagcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc 2340 tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta 2400 tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct 2460 gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg 2520 aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa 2580 tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa 2640 gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc 2700 gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc 2760 ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt 2820 gaatgatgtc atgggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat 2880 accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg 2940 cggaacgaag ggctaagaga acaaggagga gaatgtgatg tcaaagcttg aaaaaacgca 3000 cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga 3060 tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt 3120 ttctgtcggc aattttacat ttttagaaat gggcgtgaaa aaaagcgcgc gattatgtaa 3180 aatataaaga ttaactaata aggaggacaa acatgacaga acagtacatc aaaaacgttg 3240 aagtgtatct tgattatgca acaatcccga cactgaacta cttttaccat tttacagaaa 3300 acaaagatga tattgcgaca attagactgt ttggccttgg acgctttaac atctctaaat 3360 caatcatcga atcatatccg gaaggcatta tcagatattg cccgattatc tttgaagatc 3420 agacagcttt tcaacagctg tttatcacac tgcttacaga agattctttt tgtcaatacc 3480 gctttaactt tcatattaac ctgtttcatt catggaaaat gcttatcccg ctgctgcata 3540 ttatctggca atttaaacat aaagtcctgg atattaaact taacttttat gatgatggct 3600 ctgaaggact ggttacactg tcaaaaatcg aacaaaacta ttcaagcgaa attcttcaga 3660 aaatcatcga tattgatagc caatcttttt acgctgataa acttagcttt ttagatgaag 3720 atattgccag atatttatgg aatagcctgt ttgaatcaca ttactatctt ttaaacgatt 3780 ttctgcttaa aaacgaaaaa ctgagcttac tgaaaaactc tatcaaatac tgccatatca 3840 tggatcttga acgctattta caatttacac aggaagaaaa agatttcttt aacgaacttc 3900 tgggcattaa catccagagc cttgaagata aaatcaaaat ctttcaacaa aagaaaacat 3960 ttatttttac aggaacaaca atcttttctc tgccgaaaga agaagaagaa acactttaca 4020 gactgcatct gaacgctatc cttaactaca tccatccgaa cggcaaatac tttatcggcg 4080 atggatttac actggtgatc aaaggacatc cgcatcaaaa agaaatgaat agcagactgg 4140 aaaaatcatt tgaaaaagcc gtcatgctgc cggataacat cccgtttgaa attctttacc 4200 tgatcggctg caaaccggat aaaattggcg gatttgtttc aacaagctac ttttcatgtg 4260 ataagaaaaa tattgcggat ctgctgttta tcagcgcgag acaggaagaa gtgcgcaaaa 4320 acgattatct ttttaacatc caataccagc tgagagatat gatgatcaaa acaggattta 4380 tccaagaaga aaaaacacat ttttacagcg atattccgat ctttatttct taaaaaggag 4440 gaactactat gtcacttgca attatcccgg cgagaggcgg aagcaaaggc atcaaaaaca 4500 aaaacctggt tctgcttaac aacaaaccgc ttatctacta cacaatcaaa gcagcgctga 4560 atgctaaatc tatttcaaaa gttgtggtct caagcgatag cgatgaaatc cttaactacg 4620 ccaaatctca aaacgtggat attctgaaaa gaccgatctc tcttgcacag gatgatacaa 4680 catcagataa agtcttactg catgcgctga aattttacaa agattacgaa gatgttgtgt 4740 ttttacaacc gacatctccg ctgcgcacaa acattcatat caacgaagca tttaacctgt 4800 acaaaaattc aaacgctaat gccctgatta gcgtctctga atgcgataac aaaatcctta 4860 aagcatttgt ttgcaacgat tgtggcgatt tagccggaat ttgtaatgat gaatatccgt 4920 ttatgccgcg ccagaaactg ccgaaaacat atatgagcaa cggagcgatc tacatcctta 4980 aaatcaaaga atttctgaac aacccgtcat ttctgcaaag caaaacaaaa cattttctta 5040 tggatgaatc atcatcactg gatattgatt gcctggaaga tttaaagaaa gttgaacaaa 5100 tttggaaaaa ataagctctt aaggaggatt ttagaatgag cacaacaaca caaaatatcc 5160 cgtggtatcg ccatcttaac agagcccagt ggcgcgcatt ttctgcagcg tggttaggct 5220 atctgcttga tggatttgat tttgttctga ttgcactggt tcttacagaa gtgcaaggcg 5280 aatttggact tacaacagtg caggctgcct ctttaatttc agcagcgttt atcagcagat 5340 ggtttggcgg attaatgctg ggcgcaatgg gagatcgcta tggaagacgc ctggcgatgg 5400 tcacatctat tgttctgttt tcagcgggca cattagcttg cggctttgcc ccgggatata 5460 ttacaatgtt tatcgcgaga cttgtgattg gcatgggaat ggcaggcgaa tatggatcaa 5520 gcgcgacgta tgttatcgaa tcttggccga aacatctgcg caataaagca tcaggatttc 5580 ttattagcgg cttttctgtg ggagcggttg tggctgccca agtctattct cttgtcgttc 5640 cggtttgggg atggagagca ctgtttttca ttggcatcct tccgattatc tttgctcttt 5700 ggttacgcaa aaatatcccg gaagccgaag attggaaaga aaaacatgcc ggaaaagcac 5760 ctgtgagaac aatggtcgat attctgtata gaggcgaaca tcgcattgct aacatcgtta 5820 tgacattagc agcggctaca gctctgtggt tttgctttgc cggaaattta caaaacgccg 5880 caatcgttgc tgtgctgggc ttactgtgtg cggctatttt tatcagcttt atggttcagt 5940 ctgccggaaa acgctggccg acaggcgtga tgttaatggt ggtcgttctg tttgcttttc 6000 tttattcatg gccgattcaa gcccttttac cgacatacct gaaaacagat ttagcttaca 6060 atccgcatac agtggccaac gtcctgtttt tctcaggctt tggagccgca gttggctgct 6120 gtgtgggcgg atttcttggc gattggttag gaacaagaaa agcgtatgtt tgttcactgc 6180 ttgcgagcca gttactgatt atcccggttt ttgcaatcgg cggagcgaat gtctgggttc 6240 ttggactttt actgtttttc caacagatgt taggccaagg aattgctggc atcttaccga 6300 aactgattgg cggatatttt gatacagatc agagagcggc tggccttgga tttacatata 6360 atgttggagc actgggcgga gcccttgcac cgattatcgg agcgttaatt gctcaacgcc 6420 tggatcttgg cacagcgctt gcttctttat catttagcct gacatttgtg gtcattcttt 6480 taatcggcct tgatatgccg tcaagagttc agcgctggtt aagaccggaa gcactgagaa 6540 cacatgatgc gattgatggc aaaccgtttt caggagctgt gccgtttggc agcgccaaaa 6600 acgatctggt caaaacaaaa tcataaccag gcatcaaata aaacgaaagg ctcagtcgaa 6660 agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac 6720 tggctcacct tcgggtgggc ctttctgcgt ttatatacgc gttaacccgg gcccgcggat 6780 ggatatgatc agatccttta actctggcaa ccctcaaaat tgaatgagac atgctacacc 6840 tccggataat aaatatatat aaacgtatat agatttcata aagtctaaca cactagactt 6900 atttacttcg taattaagtc gttaaaccgt gtgctctacg accaaaacta taaaaccttt 6960 aagaactttc tttttttaca agaaaaaaga aattagataa atctctcata tcttttattc 7020 aataatcgca tccgattgca gtataaattt aacgatcact catcatgttc atatttatca 7080 gagctcgtgc tataattata ctaattttat aaggaggaaa aaatatgggc atttttagta 7140 tttttgtaat cagcacagtt cattatcaac caaacaaaaa ataagtggtt ataatgaatc 7200 gttaataagc aaaattcata taaccaaatt aaagagggtt ataatgaacg agaaaaatat 7260 aaaacacagt caaaacttta ttacttcaaa acataatata gataaaataa tgacaaatat 7320 aagattaaat gaacatgata atatctttga aatcggctca ggaaaaggcc attttaccct 7380 tgaattagta aagaggtgta atttcgtaac tgccattgaa atagaccata aattatgcaa 7440 aactacagaa aataaacttg ttgatcacga taatttccaa gttttaaaca aggatatatt 7500 gcagtttaaa tttcctaaaa accaatccta taaaatatat ggtaatatac cttataacat 7560 aagtacggat ataatacgca aaattgtttt tgatagtata gctaatgaga tttatttaat 7620 cgtggaatac gggtttgcta aaagattatt aaatacaaaa cgctcattgg cattactttt 7680 aatggcagaa gttgatattt ctatattaag tatggttcca agagaatatt ttcatcctaa 7740 acctaaagtg aatagctcac ttatcagatt aagtagaaaa aaatcaagaa tatcacacaa 7800 agataaacaa aagtataatt atttcgttat gaaatgggtt aacaaagaat acaagaaaat 7860 atttacaaaa aatcaattta acaattcctt aaaacatgca ggaattgacg atttaaacaa 7920 tattagcttt gaacaattct tatctctttt caatagctat aaattattta ataagtaagc 7980 gaggcaggat caggacaatg attatatttt tgtcatgaat ttcacggaag aaaaacagct 8040 ggtcacgttt gatcagagtg tgaaggacat aatgacagga gacatattgt caggcgacct 8100 gacgatggaa aagtatgaag tgagaattgt cgtaaacaca cattaggctg atgctccgct 8160 cgatatgggc ggattctttt ttctatagaa tgaaaacgct tgctaagtct tggggggatg 8220 aaatcatgaa aagcaaagtg aaaatgttct ttgcggctgc catcgtgtgg agtgcatgta 8280 gttcaacagg atatgccgct gccattgaga aggagaagca cgtgtcagag cttcgggcag 8340 aggatctttt tgttaaaaaa gtagagggga tgaacaagga ttttatcaaa ggggcagatg 8400 tatccagcgt tattgctttg gaaaacagcg gtgtcacctt ttacaataca aacggaaaac 8460 gccaggatat ctttacaact ttaaaacagg ctggggtcaa ctatgttcgc gtccgcatct 8520 ggaatcaccc gtatgattca aatggcaacg ggtatggcgg gggaaacaat gatgttcaaa 8580 aagccatcga aatcggaaaa agagcgacag cgaacggaat gaaggtgctg gccgactttc 8640 actactctga tttctgggcc gatccagcga aacaaaaggt gcccaaagcc tgggcgaatc 8700 tcagctttga agcaaaaaaa gcaaagctct atgagtatac gaaacaaagc ctgcaaaaga 8760 tgatcaagga aggcgtgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 8820 tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 8880 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 8940 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 9000 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 9060 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 9120 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 9180 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 9240 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 9300 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 9360 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 9420 agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 9480 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 9540 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 9600 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 9660 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 9720 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 9780 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 9840 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 9900 tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 9960 gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 10020 gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 10080 ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 10140 cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 10200 tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 10260 cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 10320 agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 10380 cgtcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 10440 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 10500 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 10560 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 10620 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 10680 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 10740 ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 10800 aaaataggcg tatcacgagg ccctttcgtc ttcaagaa 10838 <210> 5 <211> 4254 <212> DNA <213> Artificial Sequence <220> <223> Integration cassette <400> 5 gcaggctgtt attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc 60 atgaataatc tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa 120 aaagaacaaa aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat 180 gtgatcatcc gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg 240 tttttgttca tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg 300 ccgagaatag acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca 360 attgcggtcg cctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca 420 ttcttcgctt ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg 480 cttcggtatg tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag 540 aaatcatctt ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt 600 ataggaacat tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat 660 tttaaatgta agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg 720 gaagaatgaa gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg 780 agtgtcaaga atgtttgcaa aacgattcaa aacctcttta ctgccgttat tcgctggatt 840 tttattgctg tttcatttgg ttctggcagg accggcggct gcgagtgctg aaacggcgaa 900 caaatcgaat gagcttacag caccgtcgat caaaagcgga accattcttc atgcatggcc 960 agtgaattcg agctcggtac ctaccgttcg tataatgtat gctatacgaa gttatgataa 1020 aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac 1080 tatggatata aaataggtac taatcaaaat agtgaggagg atatatttga atacatacga 1140 acaaattaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac 1200 ttacatgttt ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgacttttt 1260 agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag 1320 acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat 1380 tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga 1440 atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt 1500 aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt 1560 agaggaatta ctacctgata ttccattttc tgatgtgaga agagccatta tggattcgtc 1620 agaggaatta atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg 1680 tatgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt 1740 ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct 1800 tggagagaat attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataa 1860 cagattaaaa aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaatttttt 1920 tgttttatta tttaatattt gggaaatatt cattctaata taacttcgta taatgtatgc 1980 tatacgaacg gtaggatcct ctagagtcga cctgcaggca ttttacattt ttagaaatgg 2040 gcgtgaaaaa aagcgcgcga ttatgtaaaa tataaagtga tagcggtacc attataggta 2100 agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt tcggtttatt 2160 ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tttggctaca 2220 tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttctctgtt 2280 ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tgcgcaaata 2340 cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tttttatctt 2400 cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttatctagg 2460 cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tcagccgtcg 2520 cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg cgctgtgtgc 2580 ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc tgggctctgg 2640 ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc cctcttctgc 2700 cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc tggcactgga 2760 actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tttcctgcac 2820 ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg ctaccggtga 2880 acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta acgcctcgat 2940 tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc tgctgctggc 3000 tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag cgctggaagt 3060 ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg gctgctttaa 3120 atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg tctgtttctg 3180 cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tgtatgaaag 3240 catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tcaccttaat 3300 ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc aggtgaatga 3360 agtcgcttaa gcaatcaatg tcggatgcca gcctggcttt gattacgtgc taaatggttt 3420 atataatgac tcgggcttaa gcggttctct tccccattga gggcaaggct agacgggact 3480 taccgaaaga aaccatcaat gatggtttct tttttgttca taaatcagac aaaacttttc 3540 tcttgcaaaa gtttgtgaag tgttgcacaa tataaatgtg aaatacttca caaacaaaaa 3600 gacatcaaag agaaacatac cctggaagga tgattaatga tgaacaaaca tgtaaataaa 3660 gtagctttaa tcggagcggg ttttgttgga agcagttatg catttgcgtt aattaaccaa 3720 ggaatcacag atgagcttgt ggtcattgat gtaaataaag aaaaagcaat gggcgatgtg 3780 atggatttaa accacggaaa ggcgtttgcg ccacaaccgg tcaaaacatc ttacggaaca 3840 tatgaagact gcaaggatgc tgatattgtc tgcatttgcg ccggagcaaa ccaaaaacct 3900 ggtgagacac gccttgaatt agtagaaaag aacttgaaga ttttcaaagg catcgttagt 3960 gaagtcatgg cgagcggatt tgacggcatt ttcttagtcg cgacaaatcc ggttgatatc 4020 ctgacttacg caacatggaa attcagcggc ctgccaaaag agcgggtgat tggaagcggc 4080 acaacacttg attctgcgag attccgtttc atgctgagcg aatactttgg cgcagcgcct 4140 caaaacgtac acgcgcatat tatcggagag cacggcgaca cagagcttcc tgtttggagc 4200 cacgcgaatg tcggcggtgt gccggtcagt gaactcgttg agaaaaacga tgcg 4254

Claims (17)

  1. 시알산화된 올리고사카라이드(sialylated oligosaccharide)의 생산을 위한 비-포자형성 바실러스(non-sporulating Bacillus) 세포로서, 여기서 상기 바실러스 세포가 락토스 퍼미아제(lactose permease), CMP-NeuNAc 생합성 경로(biosynthesis pathway) 및 시알릴트랜스퍼라제를 갖도록 유전자 조작된, 비-포자형성 바실러스 세포.
  2. 제1항에 있어서,
    바실러스 세포의 포자형성 능력이, Spo0A, 시그마 E 및 시그마 F를 암호화(encoding)하는 유전자 중 하나 이상의 결실 또는 기능적 불활성화에 의해 손상된, 비-포자형성 바실러스 세포.
  3. 제1항 또는 제2항에 있어서,
    락토스 퍼미아제가 이. 콜라이(E. coli) LacY 또는 이의 기능성 변이체인, 비-포자형성 바실러스 세포.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    CMP-NeuNAc 생합성 경로가 중간체로서 GlcN-1P 또는 GlcNAc-6P를 사용하는, 비-포자형성 바실러스 세포.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    CMP-NeuNAc 생합성 경로가 시알산 회수 경로를 사용하는, 비-포자형성 바실러스 세포.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    시알릴트랜스퍼라제가 락토스-수용 시알릴트랜스퍼라제, 바람직하게는 α-2,3-시알릴트랜스퍼라제, α-2,6-시알릴트랜스퍼라제 및 α-2,8-시알릴트랜스퍼라제로 이루어지는 그룹 중에서 선택된 시알릴트랜스퍼라제인, 비-포자형성 바실러스 세포.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 바실러스 세포가 동일한 종의 야생형 바실러스 전구세포(wild-type progenitor Bacillus cell)와 비교하여, 어떠한 β-갈락토시다제 활성도 없거나 또는 감소된 β-갈락토시다제 활성을 갖는, 비-포자형성 바실러스 세포.
  8. 제7항에 있어서,
    상기 바실러스 세포가 yesZ 및 ganA로 이루어지는 그룹 중에서 선택된 유전자 중 적어도 하나의 결실 또는 기능적 불활성화에 의해 유전자 조작된, 비-포자형성 바실러스 세포.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 바실러스 세포가 바실러스 서브틸리스(Bacillus subtilis) 세포인, 비-포자형성 바실러스 세포.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    CMP-NeuNAc 생합성 경로가 중간체로서 GlcN-1P를 사용하고, 시알릴트랜스퍼라제가 α-2,3-시알릴트랜스퍼라제인, 3'-시알릴락토스의 생산에 사용하기 위한, 비-포자형성 바실러스 세포.
  11. 제1항 내지 제9항 중 어느 한 항에 있어서,
    CMP-NeuNAc 생합성 경로가 중간체로서 GlcN-1P를 사용하고, 시알릴트랜스퍼라제가 α-2,6-시알릴트랜스퍼라제인, 6'-시알릴락토스의 생산에 사용하기 위한, 비-포자형성 바실러스 세포.
  12. 시알산화된 올리고사카라이드의 생산을 위한, 제1항 내지 제11항 중 어느 한 항에 따른 바실러스 세포의 용도.
  13. 시알산화된 올리고사카라이드의 생산 방법으로서, 상기 방법이
    - 제1항 내지 제11항 중 어느 한 항에 정의된 바와 같은 비-포자형성 바실러스 세포를 제공하고;
    - 상기 바실러스 세포를 발효 브로쓰(fermentation broth)에서 시알산화된 올리고사카라이드의 생산에 허용되는 조건하에서 배양하고; 임의로
    - 상기 배지 및/또는 바실러스 세포로부터 상기 시알산화된 올리고사카라이드를 회수(retrieving)함
    을 포함하는 방법.
  14. 제13항에 있어서,
    발효 브로쓰가 락토스를 함유하는, 방법.
  15. 제13항 또는 제14항에 따른 방법에 의해 생산된 시알산화된 올리고사카라이드.
  16. 영양 조성물, 바람직하게는 유아용 조제분유(infant formula)의 제조를 위한, 제15항에 따른 시알산화된 올리고사카라이드의 용도.
  17. 제15항에 따른 시알산화된 올리고사카라이드를 함유하는 영양 조성물.
KR1020227009316A 2019-09-03 2020-12-22 바실러스 세포에서 시알산화된 올리고사카라이드의 생산 KR20230113685A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP19195148.2A EP3789495A1 (en) 2019-09-03 2019-09-03 Production of sialylated oligosaccharides in bacillus cells
PCT/EP2020/072429 WO2021043540A1 (en) 2019-09-03 2020-08-10 Production of sialylated oligosaccharides in bacillus cells

Publications (1)

Publication Number Publication Date
KR20230113685A true KR20230113685A (ko) 2023-08-01

Family

ID=68051595

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227009316A KR20230113685A (ko) 2019-09-03 2020-12-22 바실러스 세포에서 시알산화된 올리고사카라이드의 생산

Country Status (9)

Country Link
US (1) US20220290198A1 (ko)
EP (1) EP3789495A1 (ko)
JP (1) JP2022546825A (ko)
KR (1) KR20230113685A (ko)
CN (1) CN115151649A (ko)
AU (1) AU2020342892A1 (ko)
BR (1) BR112022003604A2 (ko)
MX (1) MX2022002700A (ko)
WO (1) WO2021043540A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112020001628A2 (pt) * 2017-07-26 2020-07-21 Jennewein Biotechnologie Gmbh sialiltransferases e uso das mesmas na produção de oligossacarídeos sialilados
US20240200021A1 (en) * 2021-04-16 2024-06-20 Inbiose N.V. Cellular production of sialylated di- and/or oligosaccharides
WO2023110994A1 (en) * 2021-12-14 2023-06-22 Inbiose N.V. Production of alpha-1,4-fucosylated compounds
CN117965663B (zh) * 2024-04-01 2024-06-04 山东润德生物科技有限公司 一种利用微生物发酵提高n-乙酰氨基葡萄糖产量的方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8507227B2 (en) * 2006-03-09 2013-08-13 Centre National De La Recherche Scientifique (Cnrs) Method of producing sialylated oligosaccharides
US9758803B2 (en) * 2013-03-14 2017-09-12 Glycosyn LLC Microorganisms and methods for producing sialylated and N-acetylglucosamine-containing oligosaccharides
EP3141610A1 (en) 2015-09-12 2017-03-15 Jennewein Biotechnologie GmbH Production of human milk oligosaccharides in microbial hosts with engineered import / export
US11535878B2 (en) * 2016-12-27 2022-12-27 Inbiose N.V. In vivo synthesis of sialylated compounds
EP3425052A1 (en) 2017-07-07 2019-01-09 Jennewein Biotechnologie GmbH Fucosyltransferases and their use in producing fucosylated oligosaccharides
NZ764680A (en) * 2017-12-08 2023-06-30 Chr Hansen Hmo Gmbh Spray-dried 3-fucosyllactose
CN108410787A (zh) 2018-03-13 2018-08-17 光明乳业股份有限公司 一种合成乳酰-n-新四糖的重组枯草芽孢杆菌及其构建方法与应用
CN109735479B (zh) 2019-01-30 2022-04-01 光明乳业股份有限公司 一种合成2’-岩藻糖基乳糖的重组枯草芽孢杆菌及其构建方法与应用

Also Published As

Publication number Publication date
US20220290198A1 (en) 2022-09-15
EP3789495A1 (en) 2021-03-10
JP2022546825A (ja) 2022-11-09
CN115151649A (zh) 2022-10-04
AU2020342892A1 (en) 2022-04-07
WO2021043540A1 (en) 2021-03-11
MX2022002700A (es) 2022-04-11
BR112022003604A2 (pt) 2022-05-24

Similar Documents

Publication Publication Date Title
KR20230113685A (ko) 바실러스 세포에서 시알산화된 올리고사카라이드의 생산
KR102424721B1 (ko) Rna-유도 엔도뉴클레아제의 세포 내로의 펩티드 매개성 전달
CN112105369B (zh) 源自基因敲除猪的血液产品及其用途
KR102267412B1 (ko) Rna 전사 벡터 및 이의 용도
AU2021204574A1 (en) Probiotic and prebiotic compositions, and methods of use thereof for modulation of the microbiome
CA3098403C (en) Biosynthesis of human milk oligosaccharides in engineered bacteria
JP2017527311A (ja) フコシル化オリゴ糖の生産において使用するためのα(1,3)フコシルトランスフェラーゼ
CN107635575A (zh) 重组glut1腺相关病毒载体构建体以及用于恢复glut1表达的相关方法
Saburi et al. Practical preparation of epilactose produced with cellobiose 2-epimerase from Ruminococcus albus NE1
CN108289933A (zh) 作为认知和行为障碍药物的哺乳动物Klotho的分泌型剪接变体
EP2741772A1 (en) Pasteurellaceae vaccines
KR20220020826A (ko) 바실러스에서의 푸코실화 올리고당의 생산
CN111065740B (zh) 2-o-硫酸化酶突变体和3-o-硫酸化酶突变体及其使用方法
Nishimoto et al. Identification of the putative proton donor residue of lacto-N-biose phosphorylase (EC 2.4. 1.211)
CN108699580B (zh) 在氨基葡萄糖残基中具有高3-o-硫酸化比率的硫酸乙酰肝素
Yamamoto et al. Characterization of a recombinant Bacteroides fragilis sialidase expressed in Escherichia coli
RU2816764C1 (ru) Продукция сиалированных олигосахаридов в клетках bacillus
US20120276131A1 (en) Anti-trypanosomiasis vaccines and diagnostics
Watanabe et al. Molecular characterization of a novel β1, 3-galactosyltransferase for capsular polysaccharide synthesis by Streptococcus agalactiae type Ib
BE1022780B1 (fr) Purification des polysaccharides secretes par s. agalactiae
KR20210005178A (ko) X-연관 고 igm 증후군에서의 치료적 게놈 편집
CN110191958A (zh) 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法
RU2810729C2 (ru) Продукция фукозилированных олигосахаридов в bacillus
US7309600B2 (en) Haemophilus influenzae sialyltransferase and methods of use thereof
CN113924111A (zh) 减毒的支气管败血性博德特菌菌株、包含该减毒的菌株的口服疫苗及其制备和使用方法