KR20230113685A - 바실러스 세포에서 시알산화된 올리고사카라이드의 생산 - Google Patents
바실러스 세포에서 시알산화된 올리고사카라이드의 생산 Download PDFInfo
- Publication number
- KR20230113685A KR20230113685A KR1020227009316A KR20227009316A KR20230113685A KR 20230113685 A KR20230113685 A KR 20230113685A KR 1020227009316 A KR1020227009316 A KR 1020227009316A KR 20227009316 A KR20227009316 A KR 20227009316A KR 20230113685 A KR20230113685 A KR 20230113685A
- Authority
- KR
- South Korea
- Prior art keywords
- bacillus
- cells
- sialyltransferase
- cell
- phosphate
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L33/00—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
- A23L33/20—Reducing nutritive value; Dietetic products with reduced nutritive value
- A23L33/21—Addition of substantially indigestible substances, e.g. dietary fibres
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L33/00—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
- A23L33/40—Complete food formulations for specific consumer groups or specific purposes, e.g. infant formula
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
- C07H1/06—Separation; Purification
- C07H1/08—Separation; Purification from natural products
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H3/00—Compounds containing only hydrogen atoms and saccharide radicals having only carbon, hydrogen, and oxygen atoms
- C07H3/06—Oligosaccharides, i.e. having three to five saccharide radicals attached to each other by glycosidic linkages
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1081—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/99—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Polymers & Plastics (AREA)
- Food Science & Technology (AREA)
- Nutrition Science (AREA)
- Mycology (AREA)
- Pediatric Medicine (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
Abstract
시알산화된 올리고사카라이드(sialylated oligosaccharide)의 생산을 위한 비-포자형성 바실러스(non-sporulating Bacillus) 세포뿐만 아니라, 상기 바실러스 세포를 사용하는 시알산화된 올리고사카라이드의 생산 방법을 개시하며, 여기서 상기 바실러스 세포는 락토스 퍼미아제(lactose permease), CMP-NeuNAc 생합성 경로(biosynthesis pathway) 및 시알릴트랜스퍼라제를 갖도록 유전자 조작되었다.
Description
본 발명은 유전 공학의 기술 분야, 특히 바실러스(Bacillus) 세포에서 시알산화된 올리고사카라이드(sialylated oligo-saccharide)의 생산을 위한 상기 바실러스 세포의 유전 공학, 상기 바실러스 세포를 사용하는 시알산화된 올리고사카라이드의 발효 생산, 및 이와 같이 생성된 시알화된 올리고사카라이드의 용도에 관한 것이다.
모유는 유아에게 건강한 성장과 발달에 필요한 모든 영양소를 제공한다. 모유에 존재하는 사카라이드는 지방과 단백질에 앞서, 모유의 주성분을 나타낸다. 에너지원으로 사용되는 락토스 외에도 모유에는 더 복잡한 사카라이드 분자, 즉 올리고사카라이드가 함유되어 있다. 현재까지 약 200개의 구조적으로 구별되는 올리고사카라이드가 모유에서 확인되었다. 이러한 올리고사카라이드는 인간의 모유에서만 유의미한 농도로 발견되며, 집합적으로 인간의 모유 올리고사카라이드(HMO)로서 공지되어 있다. 상기 HMO는 디사카라이드 락토스(글루코스(Glc) 부분 및 갈락토스(Gal) 부분으로 이루어진다)를 기반으로 하며, N-아세틸-글루코스아민(GlcNAc), 푸코스(Fuc), 시알산/N-아세틸뉴라민산(NeuNAc), 및/또는 갈락토스(Gal)를 기반으로 하는 추가의 모노사카라이드 잔기를 갖는다. 모유에 있는 HMO의 농도와 구성은 개인에 따라 다르며 수유 기간 동안 초유에서 최대 20 g/L에서부터 성숙한 모유에서 5-10 g/L로 다양하다.
상당 수의 HMO는 적어도 하나의 NeuNAc 부분을 갖는다. 이러한 시알산화된 인간 모유 올리고사카라이드(SHMO) 중에서, 3'-시알릴락토스, 6'-시알릴락토스, 시알릴락토-N-테트라오스, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 c 및 디시알릴-락토-N-테트라오스가 모유 중 가장 일반적인 구성원이다.
시알산(Sia)은 9개의 탄소 주쇄를 갖는 음으로 하전된 모노사카라이드의 패밀리이다. 50개를 초과하는 형태의 이러한 α-케토산이 자연에서 발견되었다. 가장 풍부한 시알산은 N-아세틸뉴라민산(NANA, NeuNAc, Neu5Ac)인 것으로 보인다.
시알산은 척추동물 및 고등 무척추동물의 세포 표면상에서 당접합체(당단백질 및 당지질) 중에 존재하는 글리칸의 말단 모노사카라이드 부분으로서 존재한다. 시알산은 에스케리키아 콜라이(Escherichia coli) K1, 헤모필루스 인플루엔자에(Haemophilus influenzae), 헤모필루스 듀크레이(Haemophilus ducreyi), 파테우렐라 뮬토시다(Pateurella multocida), 네이세리아 고노로에아에(Neisseria gonorrhoeae), 네이세리아 메닌지티디스(Neisseria meningitidis), 캄필로박터 제주니(Campylobacter jejuni) 및 스트렙토코커스 아갈락티아에(Streptococcus agalactiae)를 포함한 병원성 세균의 리포폴리사카라이드 및 협막 폴리사카라이드의 성분이다.
시알산화된 HMO는 장병원성 세균 및 바이러스에 대한 유아의 저항성을 지지하는 것으로 관찰되었다. 흥미롭게도, 최근의 연구는 미숙아에서 가장 흔하고 치명적인 질병 중 하나인 괴사성 전장염(necrotizing enterocolitis)에 대한 장쇄 SHMO의 보호 효과를 추가로 입증하였다. 또한, 시알산화된 올리고사카라이드는 에스케리키아 콜라이, 비브리오 콜레라에(Vibrio cholerae) 및 살모넬라(Salmonella)를 포함한 다양한 병원성 미생물의 장독소를 중화시키는 것으로 나타났다. 더욱이, 시알산화된 올리고사카라이드는 헬리코박터 파이로리(Helicobacter pylori)에 의한 장 콜로니생성을 방해하는 것으로 밝혀졌다. 추가로, SHMO는 유아의 뇌 발달 및 이의 인지 능력을 지지하는 것으로 여겨진다.
HMO, 특히 시알산화된 HMO의 공지된 이득으로 인해, 이러한 시알산화된 올리고사카라이드 또는 이들 시알산화된 올리고사카라이드 중 적어도 일부가 유아용 조제분유(infant formula)에 대한 보충제로서 이용가능해지도록 경제적으로 가치있는 생산 공정이 요구된다.
모유 수유 이외의 목적을 위한 모유의 제한된 가용성, 및 천연 공급원으로부터 개별적인 모유 올리고사카라이드의 순수한 분획을 얻기가 어렵기 때문에 합성을 위한 화학적 경로가 개발되었다. 그러나 화학적 합성이나 생체촉매적 시험관내 접근법 모두 상업적으로 지속 가능한 것으로 입증되지 않았다. 더욱이, 모유 올리고사카라이드의 화학적 합성에는 최종 제품을 오염시킬 위험이 있는 여러 유해 화학 물질의 사용이 포함된다.
화학적 및 생체촉매적 시험관내 합성의 대안으로, HMO의 발효 생산이 개발되었다. 현재까지, 재조합 에스케리키아 콜라이 세포가 산업적 규모로 일부 HMO의 미생물 생산에 사용되고 있다.
그러나, 에스케리키아 콜라이 속은 비병원성 구성원뿐만 아니라 병원성 구성원도 포함한다. 비병원성 이. 콜라이(E. coli) 균주는 HMO의 미생물 생산에 사용됨에도 불구하고, 이와 같은 비병원성 이. 콜라이는 다양한 관할권에서 사람이 섭취하도록 의도된 제품의 제조에 안전한 것으로 인식되지 않고 있다. 이는 해당 관할권에서 인간이 소비하기 위한 현행의 생명공학적 방법으로 제조되는 HMO에 대한 규제 승인을 방해한다. 따라서 인간 소비에 안전한 것으로 인식되거나 또는 그러한 관할권에서 인간 소비를 위한 화합물의 생산에 사용될 때 안전한 것으로 인식되는 속의 미생물 세포가, 인간 소비를 위한 사카라이드, 예를 들어 특히 유아가 섭취하기 위한 모유 올리고사카라이드를 제조하는데 필요하다. 안전한 것으로 인정된 생산 균주의 사용은, 사카라이드가 인체 건강에 위험할 가능성에 대한 우려를 최소한으로 줄여주고 대부분의 관할권에서 규제 승인을 용이하게 한다.
이 문제는 시알산화된 올리고사카라이드, 특히 시알산화된 HMO의 생산에 바실러스 속의 세균 세포를 사용함으로써 해결된다. 바실러스 속의 일부 종의 세균 세포는 이미 사람이 섭취하고 있거나 사람이 섭취할 수 있는 화합물/식품의 생산에 안전한 것으로 인식되고 있다. 따라서, 시알산화된 올리고사카라이의 생산, 특히 시알산화된 모유 올리고사카라이드의 생산에 일반적으로 안전한 것으로 인식되는 종 및/또는 균주의 바실러스 세포가 제공된다.
바실러스 속의 세균은 호기성 또는 통성 혐기성 종의 그람 양성, 막대 모양, 내생포자-형성 미생물 세포이다. 바실러스 속은 피르미쿠테스(Firmicutes) 문에 속한다. 바실러스 속 구성원의 게놈은 이의 코돈 사용빈도에서 A-T 염기쌍에 대한 편향을 가지고 있다. 바실러스 종은 자연에서 거의 어디에나 존재한다. 이들 종은 예를 들어 토양(바실러스 서브틸리스(B. subtilis))에서 발견될 수 있지만 높은 pH(바실러스 알칼로필루스(B. alcalophilus)), 고온(바실러스 써모필루스(B. thermophilus)) 또는 고염(바실러스 할로두란스(B. halodurans))과 같은 극한 환경에서도 존재한다.
바실러스 속은 266개의 명명된 종을 포함하며, 여기에는 기생 병원성 종뿐만 아니라 자유 생물 종도 포함된다. 탄저병을 일으키는 바실러스 안트라시스(B. anthracis)와 식중독을 일으키는 바실러스 세레우스(B. cereus)의 두 가지 바실러스 종이 의학적으로 중요한 것으로 간주된다. 세 번째 종인 바실러스 튜린지엔시스(B. thuringiensis)는 곤충을 죽일 수 있는 독소를 생성하는 중요한 곤충 병원체이다. 따라서 해충을 방제하기 위한 살충제로 사용된다.
GRAS(일반적으로 안전한 것으로 인정됨) 상태로 인해 여러 바실러스 종, 예를 들어 바실러스 아밀로리퀘파시엔스(B. amyloliquefaciens), 바실러스 리케니포르미스(B. licheniformis) 및 바실러스 서브틸리스는 식품 및 제약 산업에서 사용되는 다양한 단백질 및 화합물의 생명공학적 생산에 사용된다.
바실러스 아밀로리퀘파시엔스는 제한효소 BamHI의 공급원이며 천연항생제 단백질인 바르나제를 합성하기도 한다. 또한 바실러스 아밀로리퀘파시엔스는 바실러스 안트라시스에 대해 선택적 활성을 갖는 항생제인 플란타졸리신을 생산한다. 바실러스 아밀로리퀘파시엔스로부터의 알파-아밀라제가 종종 전분 가수분해에 사용된다. 바실러스 아밀로리퀘파시엔스는 또한 단백질의 분해를 촉매화하는 서브틸리신의 공급원이다.
바실러스 아밀로리퀘파시엔스는 세균 및 진균 병원체에 대항하여 작용하므로 농업, 양식업 및 수경재배에서 일부 식물 뿌리 병원체와 싸우는데 사용되는 뿌리-콜로니형성 세균이며, 원치않는 병원체를 경쟁적으로 배제하거나 싸워-이겨 감염을 예방할 수 있다.
바실러스 리케니포르미스는 알칼리성 세린 프로테아제를 분비하는 높은 능력으로 인해 산업적 효소 생산에서 가장 중요한 세균 중 하나가 되었다. 바실러스 리케니포르미스에 의해 분비되는 서브틸리신 칼스버그(Subtilisin Carlsberg)는 세제 프로테아제로 사용되며 Alcalase®라는 상품명으로 판매된다.
바실러스 서브틸리스는 토양, 및 반추동물과 인간의 위장관에서 발견되는 카탈라제 양성 세균이다. 바실러스 서브틸리스 및 이러한 내독소가 없는 세균으로부터 유래하는 물질은, 식품에서의 안전하고 유익한 사용에 대해서 여러 권위있는 기관에서 평가되었다. 미국에서 바실러스 서브틸리스로부터의 카보하이드라제 및 프로테아제 효소는 미국 식품 안전청(FDA)에 의해 일반적으로 안전한 것으로(GRAS) 인정된다. 바실러스 서브틸리스는 또한 유럽 식품 안전청(European Food Safety Authority)에 의해 "적격 안전 추정(QPS)" 지위를 부여받았다.
더욱이, 바실러스 서브틸리스 균주의 비독성 및 비병원성 균주는 통상적으로 식품에 사용된다. 예를 들어, 낫토 형태의 발효 대두는 일본에서 빈번히 소비되며 그램당 108 개 정도로 많은 생육성 바실러스 서브틸리스 세포를 포함한다. 낫토는 건강한 장내 세균총과 비타민 K2 섭취에 기여하는 것으로 인식되고 있다.
낫토 제품 및 주성분으로서 바실러스 서브틸리스 변종 낫토는 일본 후생노동성에서 건강보존에 효과가 있다고 인정한 FOSHU(특정 건강용 식품)이다.
바실러스 서브틸리스는 취급이 용이하고 빠르게 증식하며 배양 조건이 간단하다. 재조합 바실러스 서브틸리스 균주는 폴리하이드록시-알칸올레이트, 히알루론산 및 아밀라아제 및 프로테아제와 같은 다양한 효소의 생산에 사용된다.
바실러스 서브틸리스의 야생형 자연 단리물은, 돌연변이 유발 및 선택의 재배화(domestication) 과정을 거친 실험실 균주와 비교하여 작업하기가 어렵다. 이러한 재배화된 균주는 종종 자연적 능력 개발(환경 DNA의 흡수 및 통합)을 겪을 수 있는 개선된 능력, "야생에서" 필요한 개선된 증식 능력 및 능력 상실을 가지고 있다. 바실러스 서브틸리스에서, 선형 DNA뿐만 아니라 다량체 형태의 플라스미드 DNA는 천연 수용능력 세포에 의해 능동적으로 흡수된다.
특정 생리학적 조건하에서, 바실러스 서브틸리스 세포의 작은 하위집단은 수용능력성으로 된다. 바실러스 서브틸리스에서, 고유의 수용능력은 복잡한 조절 네트워크에 의해 조절된다. 이러한 네트워크의 주요 조절인자는 무엇보다도 수용능력성 ComK의 마스터 조절인자, 및 포자형성 SpoOA의 전사 마스터 조절인자이다. 바실러스 서브틸리스 세포의 형질전환 효율 및 추정상 DNA의 게놈내로의 통합 효능은 유전 공학에 의해 개선될 수 있다. 이는 조절된 프로모터(예를 들어 만니톨 유도성 P mtlA 프로모터)와 유전자 comK 및 comS를 포함하는 발현 카세트를 바실러스 서브틸리스의 게놈에 이소성 통합시킴으로써 성취될 수 있다. 추가로, 이 전략은 복합 배지(예를 들어 LB)를 사용하는 고유의 수용능력에 의한 바실러스 서브틸리스의 형질전환을 허용한다.
시알산화된 올리고사카라이드의 생산을 위해서, 바실러스 세포를 다양한 방법에 의해 유전자 조작할 수 있다.
본원에 사용되는 바와 같은 "유전자 조작된"이란 용어는 분자 생물학적 방법을 사용하여 바실러스 세포의 유전자 구성을 변형시키는 것을 지칭한다. 바실러스 세포의 유전적 구성의 변형은 종 경계 내 및/또는 종 경계를 가로질러 유전자의 전달, 뉴클레오티드, 트리플릿, 유전자, 개방 판독 프레임, 프로모터, 인핸서, 종결자 및 유전자 발현을 매개 및/또는 조절하는 기타 뉴클레오티드 서열의 삽입, 결실, 교체 및/또는 변형을 포함할 수 있다. 바실러스 세포의 유전자 구성의 변형은 원하는 특정 특성을 지닌 유전자 변형 바실러스 세포를 생성시키는 것을 목표로 한다. 유전자 조작된 바실러스 세포는 세포의 고유(유전자 조작되지 않은) 형태에는 존재하지 않는 하나 이상의 유전자를 포함할 수 있다. 세포 유전 정보의 뉴클레오티드 서열을 삽입, 결실 또는 변경하기 위해 외인성 핵산 분자를 도입하고/하거나 외인성 핵산 분자(재조합, 이종)를 바실러스 세포의 유전 정보에 삽입하는 기술은 당업자에게 공지되어 있다. 유전자 조작된 바실러스 세포는 세포의 고유 형태에 존재하는 하나 이상의 유전자를 함유할 수 있으며, 여기서 상기 유전자는 인공적인 수단에 의해 변형되고 바실러스 세포 내로 재도입된다. "유전자 조작된"이라는 용어는 또한, 세포에 내인성인 핵산 분자를 함유하고 세포로부터 핵산 분자 제거 없이 변형된 바실러스 세포를 포함한다. 이러한 변형에는 유전자 교체, 부위 특이적 돌연변이 및 관련 기법에 의해 획득된 변형이 포함된다.
붕괴 또는 결실에 의한 유전자 통합 및/또는 (동시) 유전자 불활성화는 상동성 재조합에 의해 성취될 수 있다. 효율적인 상동성 재조합을 위해서는 바실러스 서브틸리스에서 적어도 400-500 bp의 상동성 가지가 필요하다.
표적화된 게놈 공학을 위한 또 다른 방법은 CRISPR-Cas9 시스템이다. 이러한 신속한 무-마커 게놈 편집 도구는 대규모 게놈 결실, 크고 작은 DNA 삽입, 정지 코돈 도입에 의한 유전자 침묵 및 점 돌연변이 도입에 사용될 수 있다. CRISPR-Cas9에 의한 흉터없는 게놈 편집에는 선행의 게놈 변형이 필요하지 않다.
유전자의 무작위 염색체 통합 및 삽입 돌연변이 유발은 변형된 마리너(mariner)-유래 트랜스포손을 사용하여 수행할 수 있다. 이 시스템은 바실러스 서브틸리스의 핫포트(hotpot)로 편향되지 않고 무작위 이소성 통합에서 높은 효율을 나타낸다.
바실러스 종은 효소의 산업적 규모의 생산에 사용되고 있지만, 바실러스 세포는 올리고사카라이드의 산업적 규모의 생산, 특히 시알산화된 올리고사카라이드의 산업적 규모의 생산에 대해서 지금까지 구현되지 않았다.
중국 특허 출원 CN 108 410 787 A는 락틸-N-네오테트라오스를 합성하는 재조합 바실러스 서브틸리스 세포를 개시하고 있다. 상기 재조합 바실러스 서브틸리스 세포는 세포의 게놈에 통합된 락토스 퍼미아제(lactose permease) 유전자를 갖는다. 또한, 상기 바실러스 세포는 β-1,3-N-글루코스아민 트랜스퍼라제 유전자 및 β-1,4-갈락토실트랜스퍼라제 유전자를 포함하는 플라스미드를 보유한다. 상기 바실러스 서브틸리스 세포는 외인성 락토스의 존재하에서 배양될 수 있으며, 최대 약 1 g/ L의 역가에서 락틸-N-네오테트라오스를 합성하는데, 이는 경제적으로 합리적인 산업적 규모의 생산에는 너무 적다.
중국 특허 출원 CN 109 735 479 A는 2'-푸코실락토스 합성을 위한 재조합 바실러스 서브틸리스 세포를 개시하고 있으며, 여기서 락토스 수송 효소의 발현이 향상되고, 이 세포는 푸코스 키나제, 포스페이트 구아닌 트랜스퍼라제 및 푸코실트랜스퍼라제를 발현한다. 발효 배지에서 2'-푸코실락토스의 수율은 0.424 g/L 내지 1.042 g/L인 것으로 보고되었다.
다양한 특허 출원에서, 락토-N-네오테트라오스 또는 2'-푸코실락토스와 같은 중성 올리고사카라이드의 생산에 적합한 것으로 간주되는 속으로서 바실러스를 언급하고 있지만, 바실러스의 시알산화된 올리고사카라이드, 특히 시알산화된 모유 올리고사카라이드의 생산은 아직 구현되지 않았는데, 아마도 바실러스에서 HMO 생산에 필요한 생합성 경로(biosynthetic pathway)를 구현하는데 필요한 대사 공학의 상당한 노력 때문일 것이다. LNnT의 생산에 대해 상기에서 언급한 바실러스 서브틸리스는 바실러스 서브틸리스 세포에서 자연적으로 발생하는 공여자 기질에 의존하는 반면, 바실러스에서 시알산화된 올리고사카라이의 생산은 공여자 기질, 즉 시알산화된 올리고사카라이드 합성에 필수적인 CMP-NeuNAc를 제공하기 위해 세포에서 이종 대사 경로의 구현을 필요로 한다.
상기 목적은 세포에 외인성 락토스의 수입을 위해 락토스 퍼미아제를 갖는 바실러스 세포, 시알산 부분에 대한 공여자 기질로서, 뉴클레오티드-활성화된 시알산, 즉 시티딘 모노포스페이트 N-아세틸뉴라민산(CMP-NeuNAc)의 세포내 형성을 위한 CMP-NeuNAc 생합성 경로(biosynthesis pathway), 및 CMP-NeuNAc에서 수용자 기질로 시알산 부분의 전달을 위한 시알릴트랜스퍼라제를 제공함으로써 성취되었다. 외인성 락토스의 존재하에서 이러한 바실러스 세포의 배양은 목적하는 시알산화된 올리고사카라이드의 생산을 허용한다.
첫 번째 측면에 따라, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 속의 비-포자형성(non-sporulating) 세균 세포를 제공하며, 여기서 상기 바실러스 세포는 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 갖는다.
두 번째 측면에 따라, 시알산화된 올리고사카라이드의 생산을 위한 첫 번째 측면에 따른 바실러스 속의 비-포자형성 세균 세포의 용도를 제공한다.
세 번째 측면에 따라, 시알산화된 올리고사카라이드의 생산 방법을 제공하며, 상기 방법은
- 바실러스 속의 비-포자형성 세균 세포를 제공하고, 여기서 상기 바실러스 세포는 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 가지며;
- 락토스를 함유하는 배양 배지에서, 상기 바실러스 세포가 시알산화된 올리고사카라이드를 생산할 수 있게 하는 조건하에서, 상기 바실러스 세포를 배양하고;
- 임의로 상기 배양 배지 및/또는 바실러스 세포로부터 시알산화된 올리고사카라이드를 회수(retrieving)함
을 포함한다.
네 번째 측면에 따라, 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 갖는 바실러스 세포에 의해 생산된 시알산화된 올리고사카라이드를 제공한다.
다섯 번째 측면에 따라, 영양 조성물의 제조를 위한, 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 갖는 바실러스 세포에 의해 생산된 시알산화된 올리고사카라이드의 용도를 제공한다.
여섯 번째 측면에 따라, 락토스 퍼미아제, CMP-NeuNAc 생합성 경로 및 시알릴트랜스퍼라제를 갖는 바실러스 세포에 의해 생산된 적어도 하나의 시알산화된 올리고사카라이드를 함유하는 영양 조성물을 제공한다.
도 1은 시알산화된 올리고사카라이드의 생산을 위해 바실러스 세포에서 실행되는 CMP-NeuNAc 생합성 경로의 상이한 구현예를 예시한다.
첫 번째 측면에 따라, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 속의 비-포자형성 세균 세포를 제공한다. 시알산화된 올리고사카라이드의 생산이 가능하기 위해서, 상기 바실러스 세포는, 시알릴트랜스퍼라제가 시알산 부분을 공여자 기질로부터 수용자 기질로 전달하여 시알산화된 올리고사카라이드를 생성시킬 수 있도록, 시알산 부분을 포함하는 공여자 기질 및 디사카라이드 또는 올리고사카라이드인 수용자 기질을 시알릴트랜스퍼라제에 제공해야 한다.
상기 바실러스 세포가 생산하고자 하는 시알산화된 올리고사카라이드가 목적하는 시알산화된 올리고사카라이드인 반면, 상기 바실러스 세포에서 상기 목적하는 시알산화된 올리고사카라이드의 생산 중에 상기 시알릴트랜스퍼라제의 무차별 혼합으로 인해 생성될 수도 있는 다른 시알산화된 올리고사카라이드는, 목적하지 않는 시알산화된 올리고사카라이드 또는 부산물로서 간주되는 것을 이해해야 한다.
시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 비-포자형성 바실러스 세포이다. 야생형 바실러스 세포는 포자를 형성할 수 있다. 세균에서 포자형성, 즉 포자를 형성하는 과정은, 별개의 형태 및 운명의 딸 세포의 형성으로 이어지는 발생 프로그램을 개시시키는 세균 세포의 반응인 것으로 간주된다. 바실러스의 포자형성은 세포 분화에 대한 기본 모델로서 연구되었다. 포자형성 동안, 막대-모양 바실러스 세포가 비대칭적으로 분열하여, 상이한 형태 및 운명을 갖는 2개의 유전적으로 동일한 세포를 생성시킨다.
그러나, 산업적인 생산에서, 세균 생산 균주가 목적하는 생성물의 발효 생산 중에 포자를 형성하는 것은 바람직하지 않다. 따라서, 시알산화된 올리고사카라이드의 생산을 위해 포자를 형성할 수 없는 바실러스 세포를 사용하는 것이 바람직하다. 이러한 바실러스 세포를 "비-포자형성"이라 칭한다.
하나의 구현예에서, 시알산화된 올리고사카라이드의 생산을 위한 비-포자형성 바실러스 세포는 표 1에 나열된 바실러스 서브틸리스 균주 중 하나로부터 기원하였다.
[표 1]
바실러스 서브틸리스 균주의 비제한적인 목록
일부 구현예에서, 바실러스 세포를 예를 들어 SpoOA의 결실 또는 기능적 불활성화에 의해 비-포자형성성으로 되도록 유전자 조작하였다. SpoOA는 초기 발아형성 단계 동안 500개를 초과하는 유전자의 발현에 직접적으로 또는 간접적으로 영향을 미치는 DNA-결합 단백질이다. Spo0A의 적합한 기능적 불활성화는 Spo0F 및 Spo0B 포스포트랜스퍼라제가 Spo0A를 인산화하는 인산화 부위의 결실을 포함한다. 상기 Spo0F 및 Spo0B 포스포트랜스퍼라제 인산화 부위의 결실 또는 기능적 불활성화는 Spo0A의 기능적 불활성화로 이어지며 이에 의해 포자를 형성하는 바실러스 세포의 능력이 손상된다. 대안적으로, Spo0A를 암호화(encoding)하는 유전자 또는 뉴클레오티드 서열, 또는 Spo0A를 암호화하는 유전자 또는 뉴클레오티드 서열의 부분을 바실러스 세포의 게놈으로부터 결실시킬 수 있다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포를 시그마 인자 SigE(sigE) 및/또는 시그마 인자 SigF(sigF)를 암호화하는 유전자(들)의 결실 또는 기능적 불활성화에 의해 유전자 조작하였다. 시그마 인자 SigE 및 SigF는 초기 포자형성 단계에 관련되는 단백질을 암호화하는 유전자의 발현에 관련된 전사 인자들이다.
Spo0A, SigE 및/또는 SigF의 결실 또는 기능적 불활성화는 포자를 형성하는 바실러스 세포의 포자형성 능력을 손상시킨다. 이와 같은 비-포자형성 바실러스 세포를, 시알산화된 올리고사카라이드를 생산할 수 있는 바실러스 세포의 생성을 위한 전구세포로서 사용할 수 있다.
야생형 바실러스 세포는 락토스를 세포내에서 합성하지도 않고, 외인성 락토스를 내면화하지도 않는다. 그러나, 락토스는 3'-시알릴락토스(3-SL) 또는 6'-시알릴락토스(6-SL)와 같은 일부 시알산화된 올리고사카라이드의 형성에서 락토스-수용 시알릴트랜스퍼라제에 의한 시알산 부분에 대한 수용자 기질이다. 따라서, 이와 같은 시알산화된 올리고사카라이드를 생산할 수 있기 위해서 바실러스 세포는, 락토스를 세포내에서 생성시키고/시키거나 외인성 락토스를 내면화함으로써, 락토스-수용 시알릴트랜스퍼라제에 락토스를 제공하는 능력을 가져야 한다. 더욱이, 락토스는 전형적으로 대부분 시알산화된 HMO(전부는 아니지만)가 갖는 디사카라이드 부분이다. 따라서, 락토스의 내면화가 또한, 트리사카라이드 외의 다른 시알산화된 HMO의 생합성에, 즉 NeuNAc 부분에 대한 수용자 기질이 디사카라이드 락토스보다는 올리고사카라이드인 경우에, 요구된다.
하나의 구현예에서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 외인성 락토스의 내면화를 위한 락토스 퍼미아제를 갖는다. 따라서, 상기 바실러스 세포는 외인성 락토스를 내면화할 수 있다. 대안적으로, 상기 바실러스 세포를, 락토스의 외인성 공급이 시알산화된 올리고사카라이드의 생산에 필요하지 않도록 세포내에서 글루코스 및 갈락토스로부터 락토스를 합성하도록 유전자 조작할 수 있다.
본원에 사용되는 바와 같은 락토스에 관한 "외인성"이란 용어는 시알산화된 올리고사카라이드의 생산을 위해 바실러스 세포로부터 기원하지 않고, 즉 상기 바실러스 세포에 의해 세포내적으로 합성되지 않고, 상기 바실러스 세포의 외부로부터 기원하며 상기 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포가 증식하여 상기 시알산화된 올리고사카라이드를 생산하는 배양 배지에 첨가되는 락토스를 지칭한다.
일부 구현예에서, 바실러스 세포는 외인성 락토스를 내면화할 수 있도록 유전자 조작되었다, 즉 락토스 퍼미아제를 갖도록 유전자 조작되었다. 따라서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 이종 락토스 퍼미아제를 갖는다. 적합한 이종 락토스 퍼미아제는 이. 콜라이 LacY 또는 이의 기능성 변이체이다.
단백질, 폴리펩티드, 효소 및 수송체뿐만 아니라, 핵산 분자, 뉴클레오티드 서열 및/또는 유전자와 관련하여 본원에 사용되는 바와 같은 "이종"이란 용어는 분자를 함유하는 바이러스 세포의 종에 고유하지 않은 상기 분자를 지칭한다. "고유하지 않은"이란 용어는 상기 분자가 천연 또는 야생형 바실러스 전구세포(wild-type progenitor bacillus cell), 즉 자연에서 가장 통상적으로 존재하는 동일한 종의 바실러스 세포에 존재하지 않음을 가리킨다. 따라서, 본원에 사용되는 바와 같은 "이종 서열" 또는 "이종 핵산" 또는 "이종 폴리펩티드"는 바실러스 세포에 대해 외부 공급원으로부터(예를 들어 상이한 종으로부터) 기원하거나, 또는 동일한 종으로부터 기원하는 경우, 이의 원래 형태로부터 변형된 것이다. 이종 서열은 예를 들어 형질감염, 형질전환, 접합 또는 형질도입에 의해 숙주 미생물 숙주 세포의 게놈내로 안정하게 도입되어, 유전자 변형된 숙주 세포를 나타낼 수 있다. 서열이 도입되는 숙주 세포에 따라 기법을 적용할 수 있다. 다양한 기법이 당업자에게 공지되어 있으며 예를 들어 문헌[Sambrook et al, Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989)]에 개시되어 있다. 상응하게, "이종 폴리펩티드"는 세포에서 자연적으로 존재하지 않는 폴리펩티드이며, "이종 시알릴트랜스퍼라제"는 미생물 세포 중에 자연적으로 존재하지 않는 시알릴트랜스퍼라제이다.
효소 및/또는 수송 분자와 관련하여 본원에 사용되는 바와 같은 "기능성 변이체"란 용어는, 참조 효소 또는 수송체와 동일한 활성(효소, 촉매 또는 변위)을 갖지만 상기 참조 효소 또는 수송체 분자와 상이한 아미노산 서열을 갖는 단백질 또는 폴리펩티드를 지칭한다. 따라서, 단백질/폴리펩티드의 전형적인 변이체는 상기 참조 단백질/폴리펩티드와 아미노산 서열이 상이하다. 변이체 및 참조 단백질/폴리펩티드는 하나 이상의 치환, 부가, 및/또는 결실의 임의의 조합에 의해 아미노산 서열이 상이할 수 있다. 따라서, "기능성 변이체"란 용어는 참조 단백질/폴리펩티드와 동일한 활성을 갖는 참조 단백질/폴리펩티드의 절두된 버전을 포함한다. 치환되거나 삽입된 아미노산 잔기는 유전 암호에 의해 암호화된 것이거나 암호화된 것이 아닐 수 있다. 단백질/폴리펩티드의 변이체는 대립유전자 변이체와 같이 천연이거나, 또는 자연에서 발생하지 않는 것으로 공지된 변이체일 수 있다. 단백질/폴리펩티드의 비-천연 변이체는 돌연변이유발 기법에 의해, 직접 합성에 의해, 및 당업자에게 공지된 다른 재조합 방법에 의해 제조될 수 있다. 본 개시내용의 범위내에서, 또한 단백질 및 종간 상동체가, 참조 폴리펩티드에 대해, 바람직하게는 적어도 약 25, 50, 100, 200, 500, 1000개 이상의 아미노산에 걸쳐 약 60% 초과의 아미노산 서열 일치성, 바람직하게는 65%, 70%, 75%, 80%, 85%, 90%, 보다 바람직하게는 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 아미노산 서열 일치성을 갖는 아미노산 서열을 갖는 "변이체"란 용어에 의해 포함된다.
본원에 사용되는 바와 같은 "동일한 활성"이란 용어는 단지 정성적인 방식의 단백질/폴리펩티드의 효소, 촉매 또는 변위 활성을 지칭한다. 따라서, "기능성 변이체"는 또한 참조 단백질/폴리펩티드의 활성과 비교하여, 증가되거나 감소된 활성을 갖는 변이체를 포함한다.
다양한 구현예에서, 바실러스 세포는 락토스 퍼미아제를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 락토스 퍼미아제 LacY(UniProtKB - P02920) 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
상기 이. 콜라이 락토스 퍼미아제 LacY는 이. 콜라이 lacY 유전자(GenBank acc. no: NP_414877.1)의 단백질 암호화 영역(즉 개방 판독 프레임)에 의해 암호화된다.
따라서, 일부 구현예에서, 바실러스 세포는 이. 콜라이 lacY의 단백질-암호화 영역을 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
일부 구현예에서, 이종 락토스 퍼미아제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다. 예를 들어 바실러스 서브틸리스의 코돈 사용빈도는 전체 GC-함량이 약 45% 미만이고, 상기 코돈의 첫 번째 문자의 GC-함량은 약 51% 초과이고, 상기 코돈의 두 번째 문자의 CG-함량은 약 36.1% 미만이고, 상기 코돈의 세 번째 문자의 CG-함량은 약 46% 미만이라는 점에서 독특하다.
락토스 퍼미아제의 발현을 위해서, 바실러스 세포는 재조합 락토스 퍼미아제 유전자를 함유하며, 여기서 상기 락토스 퍼미아제를 암호화하는 뉴클레오티드 서열은 상기 락토스 퍼미아제를 암호화하는 뉴클레오티드 서열의 발현을 매개하는 발현 조절 서열에 작동적으로 연결된다.
본원에 사용되는 바와 같은 "작동적으로 연결된"이란 용어는 폴리펩티드 또는 단백질을 암호화하는 뉴클레오티드 서열(전형적으로 "단백질 암호화 영역", "개방 판독 프레임", 및 때때로 심지어 "유전자"로서)과, 상기 폴리펩티드 또는 단백질을 암호화하는 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 제2 뉴클레오티드 서열(발현 조절 서열, 예를 들어 프로모터, 신호 서열, 또는 전사 인자 결합 부위의 배열)간의 기능적 연결을 의미할 것이다. 상응하게, "프로모터"란 용어는 대개 DNA 중합체 중의 개방 판독 프레임에 "선행하고" mRNA로의 전사 개시를 위한 부위를 제공하는 데옥시리보핵산(DNA) 서열을 표시한다. "조절제" DNA 서열(또한 대개 주어진 DNA 중합체 중의 개방 판독 프레임의 "상류"(즉 선행하는))은 전사 개시의 빈도(또는 비율)를 결정하는 단백질에 결합한다. "프로모터/조절제" 또는 "조절" DNA 서열로서 종합적으로 지칭되는, 기능성 DNA 중합체에서 선택된 개방 판독 프레임(또는 일련의 개방 판독 프레임)에 선행하는 이들 서열은 개방 판독 프레임의 전사(및 최종적인 발현)가 발생할 것인지를 협력하여 결정한다. DNA 중합체 중의 유전자"에 이어지고" mRNA로의 전사에 대한 종결 신호를 제공하는 DNA 서열을 전사 "종결자" 서열이라 칭한다.
재조합 락토스 퍼미아제 유전자는 바실러스 염색체내에 통합되는 것으로서 제공되거나, 또는 바실러스 세포내 추가적인 플라스미드상의 에피솜 버전으로서 제공될 수 있다.
바실러스 세포에서 이종 락토스 퍼미아제 유전자의 발현은 생성되는 바실러스 세포가 배양 배지로부터의 외부적으로 공급된 락토스를 내면화하게 할 수 있다. 이어서 상기 내면화된 락토스는 예를 들어 3'-SL 또는 6'-SL의 형태로, 락토스 수용 시알릴트랜스퍼라제(본원의 하기를 참조하시오)에 의해 전달되는 시알산 부분에 대한 수용자 기질로서 작용할 수 있다.
시알산화된 올리고사카라이드의 생산을 위해서, 바실러스는 NeuNAc 부분을 수용자 기질로 전달하기 위한 공여자 기질을 제공할 수 있어야 한다. NeuNAc 부분에 대한 예시적인 공여자 기질은 CMP-NeuNAc이다. 따라서, 바실러스 세포는 시알산화된 올리고사카라이드의 생산을 위해 CMP-NeuNAc를 세포내에서 생산할 수 있어야 한다. CMP-NeuNAc의 세포내 생합성을 위해서, 바실러스 세포는 CMP-NeuNAc 생합성 경로를 갖는다(도 1). 따라서, 바실러스 세포는 CMP-NeuNAc 생합성 경로를 갖도록 유전자 조작되었다.
상기 CMP-NeuNAc 생합성 경로는 NeuNAc의 세포내 드노보 생합성을 위한 NeuNAc 회수 경로 또는 시알산 생합성 경로를 포함한다. 따라서, 바실러스 세포는 NeuNAc 회수 경로 및/또는 시알산 생합성 경로를 포함하는 CMP-NeuNAc 생합성 경로를 갖는다.
상기 NeuNAc 회수 경로는 바실러스 세포에 의한 외인성 시알산의 내면화, 및 내면화된 시알산의 CMP-NeuNAc로의 전환을 포함한다. 외인성 NeuNAc의 내면화를 위해서, 바실러스 세포는 시알산 수송체를 갖는다. 일부 구현예에서, 유전자 조작된 바실러스는 외인성 NeuNAc의 내면화를 위한 시알산 수송체를 갖도록 유전자 조작되었다. 적합한 시알산 수송체는 이. 콜라이 NanT(UniProtKB P41036)이다. 이. 콜라이 NanT는 시알산의 양성자-의존적인 동반수송(symport)을 촉매화한다. NanT는 NeuNAc뿐만 아니라 관련된 시알산 N-글리콜릴뉴라민산(NeuNGc) 및 3-케토-3-데옥시-D-글리세로-D-갈락토논논산(KDN)을 수송할 수 있다. 하나의 구현예에서, 유전자 조작된 바실러스는 이. 콜라이 NanT 또는 이의 기능성 변이체를 갖는다.
일부 구현예에서, 바실러스 세포는 외인성 NeuNAc의 내면화를 위한 시알산 수송체를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 NanT 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
상기 이. 콜라이 NanT는 이. 콜라이 nanT 유전자의 단백질-암호화 영역에 의해 암호화된다. 따라서, 일부 구현예에서, 바실러스 세포는 이. 콜라이 시알산 수송체 NanT 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
시알산 수송체의 발현을 위해서, 바실러스 세포는 재조합 시알산 수송체 유전자를 함유하며, 여기서 상기 시알산 수송체를 암호화하는 뉴클레오티드 서열은 상기 시알산 수송체를 암호화하는 뉴클레오티드 서열의 발현을 매개하는 발현 조절 서열에 작동적으로 연결된다.
상기 재조합 시알산 수송체 유전자는 바실러스 염색체내에 통합되는 것으로서 제공되거나, 바실러스 세포 중의 추가적인 플라스미드 상의 에피솜 버전으로서 제공될 수 있다.
일부 구현예에서, 시알산 수송체를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
다양한 구현예에서, CMP-NeuNAc 생합성 경로는 시알산 생합성 경로를 포함한다. 따라서, 바실러스 세포는 N-아세틸뉴라민산의 세포내 생합성을 위한 시알산 생합성 경로를 포함할 수 있다. 상기 시알산 생합성 경로는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제(도 1: ①) 및 N-아세틸-뉴라민산 신타제(=시알산 신타제)(도 1: ⑩)의 효소 활성을 포함한다. 따라서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 및 N-아세틸뉴라민산 신타제를 갖는다.
상기 효소 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제(EC 2.6.1.16)는 글루타민(도 1: ①)을 사용하여 프럭토스-6-포스페이트(Frc-6P)의 글루코스아민-6-포스페이트(GlcN-6P)로의 전환을 촉매화한다. 이러한 효소 반응은 전형적으로 헥소스아민 생합성 경로의 첫 번째 단계로 간주된다. 상기 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제의 대체명은 D-프럭토스-6-포스페이트 아미노트랜스퍼라제, GFAT, 글루코스아민-6-포스페이트 신타제, 헥소스포스페이트 아미노트랜스퍼라제, 및 L-글루타민-D-프럭토스-6-포스페이트 아미노트랜스퍼라제이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제, 바람직하게는 이종 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제를 갖는다. 적합한 이종 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제의 일례는 이. 콜라이로부터 유래된다. 이. 콜라이 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제(UniProtKB - P17169)는 GlmS라 표시된다. 따라서, 바실러스 세포는 이. 콜라이 GlmS 또는 이. 콜라이 GlmS의 기능성 변이체를 갖는다. 바람직하게, 상기 이. 콜라이 GlmS의 기능성 변이체는 야생형 효소와 비교하여 글루코스아민-6-포스페이트 억제에 대해 현저하게 감소된 감도를 보이는 버전이다. 글루코스아민-6-포스페이트 억제에 대해 현저하게 감소된 감도를 보이는 이. 콜라이 GlmS의 기능성 변이체의 일례. 글루코스아민-6-포스페이트 억제에 대해 현저하게 감소된 감도를 보이는 이. 콜라이 GlmS의 기능성 변이체의 일례는 국제 출원 PCT/EP2019/063669(본원에 참고로 인용된다)에 기재된 바와 같은 GlmS*54 및 GlmS*이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제, 바람직하게는 이. 콜라이 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 GlmS를 암호화하는 뉴클레오티드 서열, 또는 야생형 효소와 비교하여 글루코스아민-6-포스페이트 억제에 대해 현저하게 감소된 감도를 보이는 이. 콜라이 GlmS의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 분자를 함유한다.
글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제의 발현을 위해서, 바실러스 세포는 재조합 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 유전자를 함유하며, 여기서 상기 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제를 암호화하는 뉴클레오티드 서열은 상기 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 개방 판독 프레임의 발현을 매개하는 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드 상의 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 시알산 신타제를 포함한다. 상기 시알산 신타제는 N-아세틸만노스아민(ManNAc) 및 포스포에놀피루베이트(PEP)의 N-아세틸뉴라민산(NeuNAc)에의 축합(도 1: ⑩)을 촉매화한다. NeuNAc의 효소적 형성은 시알산 생합성 경로의 최종 단계이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 시알산 신타제 또는 이의 기능성 변이체, 바람직하게는 이종 시알산 신타제를 포함한다. 다양한 세균 종, 예를 들어 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 아갈락티아에(Streptococcus agalac-tiae), 부티리비브리오 프로테오클라스티쿠스(Butyrivibrio proteoclasticus), 메타노브레비박터 루미나티움(Methanobrevibacter ruminatium), 아세토박테리움 우디이(Acetobacterium woodii), 데술포바큘라 톨루올리카(Desulfobacula toluolica), 에스케리키아 콜라이(Escherichia coli), 프레보텔라 니게센스(Prevotella nigescens), 할로라브두스 티아마테아(Halorhabdus tiamatea), 데술포티그눔 포스피톡시단스(Desulfotignum phosphitoxidans) 또는 칸디다투스 스칼린두아 스페시즈(Candidatus Scalindua sp.), 이도마리나 이오이히엔시스(Idomarina loihiensis), 푸소박테리움 뉴클레아툼(Fusobacterium nucleatum) 또는 네이세리아 메닌지티디스(Neisseria meningitidis)로부터의 시알산 신타제의 예가 공지되어 있다. 적합한 시알산 신타제의 일례는 씨 제주니 neuB 유전자에 의해 암호화된 바와 같은 씨 제주니의 N-아세틸뉴라민산 신타제 NeuB이다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸뉴라민산 신타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, N-아세틸뉴라민산 신타제를 암호화하는 뉴클레오티드 서열은, 세포내 N-아세틸뉴라민산 신타제 활성을 제공하기 위해 유전자 조작된 바실러스 세포 중의 N-아세틸뉴라민산 신타제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸뉴라민산 신타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸뉴라민산 신타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
하나의 구현예에서, 시알산 생합성 경로는 중간체 화합물로서 유리딘 디포스페이트-N-아세틸글루코스아민(UDP-GlcNAc)를 포함한다. 중간체 화합물로서 UDP-GlcNAc를 포함하는 시알산 생합성 경로를 포함하는 바실러스 세포는 포스포글루코스아민 뮤타제(도 1: ②), 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제(도 1: ③), N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제(도 1 ④), 및 UDP-N-아세틸글루코스아민 2-에피머라제(도 1: ④)를 추가로 갖는다.
상기 포스포글루코스아민 뮤타제는 글루코스아민-6-포스페이트(GlcN-6P)를 글루코스아민-1-포스페이트(GlcN-1P)로 전환시킨다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 포스포글루코스아민 뮤타제를 갖도록 유전자 조작되었다. 적합한 포스포글루코스아민 뮤타제는 이. 콜라이 포스포글루코스아민 뮤타제 GlmM 또는 이의 기능성 변이체이다. 상기 이. 콜라이 GlmM은 이. 콜라이 glmM 유전자에 의해 암호화된다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는, 포스포글루코스아민 뮤타제를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 GlmM 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
상기 이. 콜라이 포스포글루코스아민 뮤타제 GlmM은 이. 콜라이 glmM 유전자의 단백질 암호화 영역에 의해 암호화된다. 따라서, 바실러스 세포는 이. 콜라이 GlmM을 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 포스포글루코스아민 뮤타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, 포스포글루코스아민 뮤타제를 암호화하는 뉴클레오티드 서열은, 세포내 포스포글루코스아민 뮤타제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 포스포글루코스아민 뮤타제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 포스포글루코스아민 뮤타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 포스포글루코스아민 뮤타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제는, 아세틸 조효소 A에서 글루코스아민-1-포스페이트(GlcN-1-P)로의 아세틸기의 전달을 촉매화하여 N-아세틸글루코스아민-1-포스페이트(GlcNAc-1-P)를 생성시킨다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 갖도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열은, 세포내 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제는, 유리딘 5-모노포스페이트(유리딘 5-트리포스페이트로부터)의 전달에 의해 N-아세틸글루코스아민-1-포스페이트(GlcNAc-1-P)를 UDP-GlcNAc로 전환시킨다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 갖도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열은, 세포내 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제 활성 및 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 활성이 이중기능성 효소에 의해 제공된다. 이와 같은 효소의 일례는 이. 콜라이 GlmU이다. 이. 콜라이 GlmU는 글루코스아민-1-포스페이트를 UDP-GlcNAc로 전환시키는(도 1: ③) 최종 2개의 순차적인 반응을 촉매화한다. C-말단 도메인은 아세틸 조효소 A에서 글루코스아민-1-포스페이트(GlcN-1-P)로의 아세틸기의 전달을 촉매화하여 N-아세틸글루코스아민-1-포스페이트(GlcNAc-1-P)(이는 N-말단 도메인에 의해 촉매화되는 반응인 유리딘 5-모노포스페이트(유리딘 5-트리포스페이트로부터)의 전달에 의해 UDP-GlcNAc로 전환된다)를 생성시킨다.
이와 같은 이중기능성 효소는 또한 바실러스 서브틸리스 및 헤모필루스 인플루엔자에로부터 공지되어 있다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 이종의 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 갖도록 유전자 조작되었다. 적합한 예는 이. 콜라이 GlmU 또는 이의 기능성 변이체(에이치 인플루엔자에 GlmU 포함)이다. 상기 이. 콜라이 GlmU는 이. 콜라이 glmU 유전자에 의해 암호화된다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 상기 이중기능성 효소를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 GlmU 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하거나 과발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열은, 세포내 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제 활성 및 N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 이중기능성 글루코스아민-1-포스페이트 N-아세틸트랜스퍼라제/N-아세틸글루코스아민-1-포스페이트 유리딜트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 시알산 생합성 경로는 UDP-GlcNAc의 N-아세틸만노스아민(ManNAc)으로의 전환을 포함한다. 이러한 전환은 단지 UDP-N-아세틸글루코스아민을 UDP-N-아세틸만노스아민으로만 전환시키지 않고 UDP를 동반하여 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제에 의해 촉매화될 수 있다(도 1: ④).
따라서, 바실러스 세포는 UDP를 동반하여 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제 에피머라제를 포함한다.
UDP를 동반 방출하는 적합한 UDP-N-아세틸글루코스아민 2-에피머라제 에피머라제는 캄필로박터 제주니 neuC 유전자에 의해 암호화된, 캄필로박터 제주니 UDP-N-아세틸글루코스아민 2-에피머라제 NeuC이다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 UDP를 동반 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제를 갖도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 UDP를 동반 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열, 바람직하게는 씨 제주니 NeuC 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
상기 씨 제주니 UDP-N-아세틸글루코스아민 2-에피머라제 NeuC는 상기 씨 제주니 neuC 유전자의 단백질 암호화 영역에 의해 암호화된다. 따라서, 바실러스 세포는 씨 제주니 NeuC를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는, 효소 반응 동안 UDP의 동반 방출과 함께 ManNAc를 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, UDP를 동반하여 방출하는 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열은, 세포내 UDP-N-아세틸글루코스아민 2-에피머라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, UDP를 동반하여 방출하는 이종 UDP-N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 UDP-N-아세틸글루코스아민 2-에피머라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
대안의 구현예에서, 시알산 생합성 경로는 중간체로서 N-아세틸-글루코스아민-6-포스페이트(GlcNAc-6-P)를 사용하지만, UDP-GlcNAc는 사용하지 않는다. 유전자 조작된 바실러스 세포는 중간체로서 GlcNAc-6-P를 사용하고 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제를 포함하는 N-아세틸뉴라민산의 세포내 생합성에 대한 시알산 생합성 경로를 포함한다(도 1: ⑤). N-아세틸뉴라민산의 세포내 생합성을 위해 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제를 사용하는 시알산 생합성 경로는 시알산의 생합성을 위해 UDP-GlcNAc를 사용하지 않는다.
GlcNAc-6P를 사용하는 시알산 생합성 경로는 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제(도 1: ①) 및 N-아세틸뉴라민산 신타제(도 1: ⑩)의 효소 활성을 포함한다. 상기 시알산 생합성 경로는 a) 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제(도 1: ⑤), N-아세틸글루코스아민-6-포스페이트 포스파타제(도 1: ⑥), 및 N-아세틸글루코스아민 2-에피머라제(도 1: ⑧)의 효소 활성 또는 b) 글ㄹ코스아민-6-포스페이트 N-아세틸트랜스퍼라제(도 1: ⑤), N-아세틸글루코스아민-6-포스페이트 에피머라제(도 1: ⑦) 및 N-아세틸만노스아민-6-포스페이트 포스파타제(도 1: ⑨)의 효소 활성을 추가로 포함한다. 따라서, 유전자 조작된 바실러스 세포는 세포내 시알산 생합성을 위해 포스포글루코스아민 뮤타제, N-아세틸글루코스아민-6-포스페이트 유리딜트랜스퍼라제 및 UDP를 동반 방출하는 UDP N-아세틸글루코스아민 2-에피머라제의 효소 활성을 포함할 필요가 없다. 따라서, 추가적인 및/또는 대안의 구현예에서, 시알산을 합성할 수 있는 유전자 조작된 바실러스 세포는 포스포글루코스아민 뮤타제, N-아세틸글루코스아민-6-포스페이트 유리딜트랜스퍼라제 및 UDP를 동반 방출하는 UDP N-아세틸글루코스아민 2-에피머라제의 효소 활성으로 이루어지는 그룹 중에서 선택된 하나 이상의 효소 활성을 포함하지 않는다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제 활성을 갖는다. 상기 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제 활성은 GlcN-6P를 N-아세틸글루코스아민-6-포스페이트(GlcNAc-6P)로 전환시킨다. 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제의 일례는 사카로마이세스 세레비지아에 Gna1(UniProtKB - P43577)이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제, 바람직하게는 이종 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제, 보다 바람직하게는 에스 세레비지아에로부터의 Gna1 또는 이의 기능성 변이체를 함유한다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제, 바람직하게는 에스 세레비지아에 Gna1을 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유하며, 여기서 상기 뉴클레오티드 서열은, 세포내 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 글루코스아민-6-포스페이트 N-아세틸트랜스퍼라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 포스파타제 활성을 갖는다. 상기 N-아세틸글루코스아민-6-포스페이트 포스파타제 활성은 GlcNAc-6P를 N-아세틸글루코스아민(GlcNAc)으로 전환시킨다. N-아세틸글루코스아민-6-포스페이트 포스파타제의 예는 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제이다. 상기 효소의 HAD-유사 상과는 세균 효소 할로애시드 데하이드로게나제 후에 명명되며 포스파타제를 포함한다. GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 적합한 포스파타제는 프럭토스-1-포스페이트 포스파타제(YqaB, UniProtKB - P77475) 및 알파-D-글루코스 1-포스페이트 포스파타제(YihX, UniProtKB - P0A8Y3)로 이루어지는 그룹 중에서 선택될 수 있다. 이. 콜라이 YqaB 및 이. 콜라이 YihX 효소는 또한 GlcNAc6P상에서 작용하는 것으로 간주된다(Lee, S.-W. and Oh, M.-K. (2015) Metabolic Engineering 28: 143-150).
추가적인 및/또는 대안의 구현예에서, GlcNAc-6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제는 유전자 조작된 바실러스 세포 중의 이종 효소이다. 추가적인 및/또는 대안의 구현예에서, 상기 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제는 이. 콜라이 YqaB, 이. 콜라이 YihX, 및 이의 기능성 변이체로 이루어지는 그룹 중에서 선택된다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 추가적인 및/또는 대안의 구현예에서, 상기 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제를 암호화하는 뉴클레오티드 서열은 이종 뉴클레오티드 서열이다. 추가적인 및/또는 대안의 구현예에서, 상기 GlcNAc6P의 GlcNAc로의 전환을 촉매화하는 HAD-유사 상과의 당 포스파타제를 암호화하는 뉴클레오티드 서열은 이. 콜라이 YqaB 또는 이. 콜라이 YihX 또는 이들 두 효소 중 하나의 기능성 변이체를 암호화한다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸글루코스아민 6-포스페이트 포스파타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸글루코스아민-6-포스페이트 포스파타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민 2-에피머라제 활성을 갖는다. N-아세틸글루코스아민 2-에피머라제(EC 5.1.3.8)는 N-아세틸-글루코스아민(GlcNAc)의 N-아세틸만노스아민(ManNAc)으로의 전환을 촉매화하는 효소이다. 상기 효소는 탄수화물 및 이의 유도체상에서 작용하는 라세마제이다. 이 효소 부류의 계통명은 N-아실-D-글루코스아민 2-에피머라제이다. 상기 효소는 아미노-당 대사 및 뉴클레오티드-당 대사에 관여하며, 바람직하게는 이종 N-아세틸글루코스아민 2-에피머라제이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민 2-에피머라제, 바람직하게는 이종 N-아세틸글루코스아민 2-에피머라제를 포함한다. N-아세틸글루코스아민 2-에피머라제의 예는 아나베나 바리아빌리스(Anabena variabilis), 아카리오클로리스 스페시즈(Acaryochloris sp.), 노스톡 스페시즈(Nostoc sp.), 노스톡 푼크티포르메(Nostoc punctiforme), 박테로이데스 오바투스(Bacteroides ovatus) 또는 시네코시스티스 스페시즈(Synechocystis sp.)로부터 기재되었다. 적합한 N-아세틸글루코스아민 2-에피머라제의 일례는 유전자 BACOVA_01816에 의해 암호화되는 바와 같은 바실러스 오바투스 ATCC 8483(UniProtKB - A7LVG6)의 N-아세틸글루코스아민 2-에피머라제이다. 또 다른 예는 시네코시스티스 스페시즈(균주 PCC 6803)(UniProtKB - P74124)의 N-아세틸글루코스아민 2-에피머라제이며, 이는 또한 레닌-결합 단백질로서 공지되어 있고 slr1975 유전자에 의해 암호화된다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민 2-에피머라제, 바람직하게는 바실러스 오바투스 ATCC 8483 또는 시네코시스티스 스페시즈(균주 PCC 6803)의 N-아세틸글루코스아민 2-에피머라제 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 분자를 함유한다.
따라서, 상기 N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열은, 세포내 N-아세틸글루코스아민 2-에피머라제 활성을 제공하기 위해서 상기 유전자 조작된 바실러스 세포 중의 N-아세틸글루코스아민 2-에피머라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸글루코스아민 2-에피머라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸글루코스아민 2-에피머라제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 에피머라제 활성 및 N-아세틸-만노스아민-6-포스페이트 포스파타제 활성을 갖는다. N-아세틸글루코스아민-6-포스페이트 에피머라제는 N-아세틸글루코스아민-6-포스페이트(GlcNAc-6P)를 N-아세틸만노스아민-6-포스페이트(ManNAc-6P)로 전환시키는 반면, N-아세틸글루코스아민-6-포스페이트 포스파타제는 ManNAc-6P를 탈인산화하여 N-아세틸만노스아민(ManNAc)을 제공한다. N-아세틸글루코스아민-6-포스페이트 에피머라제 활성 및 N-아세틸만노스아민-6-포스페이트 포스파타제 활성을 갖는 것은 Neu5Ac 생산을 위해 ManNAc를 제공하는 추가적인 또는 대안의 방식을 제공한다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 에피머라제를 함유한다. 적합한 N-아세틸글루코스아민-6-포스페이트 에피머라제의 일례는 이. 콜라이 nanE 유전자에 의해 암호화되는 바와 같은 이. 콜라이 NanE(UniprotKB POA761)이다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 에피머라제를 암호화하는 뉴클레오티드 서열, 바람직하게는 이. 콜라이 NanE를 암호화하는 뉴클레오티드 서열 또는 이의 기능성 변이체를 포함하고 발현하는 핵산 분자를 함유한다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸글루코스아민-6-포스페이트 에피머라제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유하며, 여기서 상기 뉴클레오티드 서열은, 세포내 N-아세틸글루코스아민-6-포스페이트 에피머라제 활성을 제공하기 위해서 상기 유전자 조작된 미생물 세포 중의 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸글루코스아민-6-포스페이트 에피머라제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 ManNAc-6P를 ManNAc로 전환시키는 N-아세틸글루코스아민-6-포스페이트 포스파타제를 함유한다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 N-아세틸만노스아민-6-포스페이트 포스파타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다. 따라서, N-아세틸만노스아민-6-포스페이트 포스파타제를 암호화하는 뉴클레오티드 서열은, 세포내 N-아세틸만노스아민-6-포스페이트 포스파타제 활성을 제공하기 위해서 상기 유전자 조작된 바실러스 세포 중의 N-아세틸만노스아민-6-포스페이트 포스파타제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 N-아세틸만노스아민-6-포스페이트 포스파타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 N-아세틸만노스아민-6-포스페이트 포스파타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
유전자 조작된 바실러스 세포는, 시티딘 5'-모노포스페이트를 N-아세틸뉴라민산상에 전달하여 CMP-활성화된 N-아세틸뉴라민산(CMP-NeuNAc)을 생성시키기 위해 시티딘 5'-모노포스포(CMP)-N-아세틸뉴라민산 신시타제(도 1: ⑪)를 갖는다. 다수의 5'-모노포스포(CMP)-시알산 신시타제, 예를 들어 이. 콜라이, 네이세리아 메닌지티디스, 캄필로박터 제주니, 스트렙토코커스 스페시즈 등으로부터의 5'-모노포스포-(CMP)-시알산 신시타제가 당해 분야에 공지되어 있고 기재되었다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제, 바람직하게는 이종 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제, 보다 바람직하게는 캄필로박터 제주니로부터의 N-아세틸뉴라미네이트 시티딜트랜스퍼라제 NeuA를 함유한다. 캄필로박터 제주니 NeuA는 캄필로박터 제주니 neuA 유전자에 의해 암호화된다.
따라서, 추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제를 암호화하는 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유하며, 여기서 상기 뉴클레오티드 서열은, N-아세틸뉴라미네이트 시티딜트랜스퍼라제 활성을 제공하기 위해서 상기 유전자 조작된 미생물 중의 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 조절 서열에 작동적으로 연결된다.
추가적인 및/또는 대안의 구현예에서, 이종 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제를 암호화하는 뉴클레오티드 서열의 코돈 사용빈도를 바실러스의 코돈 사용빈도에 맞게 조정한다.
재조합 시티딘 5'-모노포스포-(CMP)-N-아세틸뉴라민산 신시타제 유전자를 바실러스 염색체에 통합시키거나, 또는 바실러스 세포내 플라스미드상에 에피솜 버전으로서 제공할 수 있다.
유전자 조작된 바실러스 세포는 시알릴트랜스퍼라제, 바람직하게는 이종 시알릴트랜스퍼라제, 및 보다 바람직하게는 α-2,3-시알릴트랜스퍼라제 활성, α-2,6-시알릴트랜스퍼라제 활성 및/또는 α-2,8-시알릴트랜스퍼라제 활성으로 이루어지는 그룹 중에서 선택된 시알릴트랜스퍼라제 활성을 갖는다. 상기 시알릴트랜스퍼라제 활성은 CMP-NeuNAc로부터 수용자 분자(여기서 상기 수용자 분자는 사카라이드 분자이다)로 N-아세틸뉴라민산 부분을 전달하여 시알산화된 사카라이드를 제공할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 미생물 세포는 적어도 하나의 시알릴트랜스퍼라제, 바람직하게는 적어도 하나의 이종 시알릴트랜스퍼라제를 함유하며, 여기서 상기 시알릴트랜스퍼라제는 공여자 기질로서 CMP-NeuNAc로부터 NeuNAc 부분을 수용자 사카라이드로 전달하기 위한 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성 및/또는 α-2,8-시알릴트랜스퍼라제 활성을 가질 수 있다. 예시적인 시알릴트랜스퍼라제 및 이의 유전자를 표 2에 나타낸다.
본원에 사용되는 바와 같은 "시알릴트랜스퍼라제"란 용어는 시알릴트랜스퍼라제 활성을 가질 수 있는 폴리펩티드를 지칭한다. "시알릴트랜스퍼라제 활성"은 공여자 기질로부터 수용자 분자로의 시알산 잔기, 바람직하게는 N-아세틸뉴라민산(Neu5Ac) 잔기의 전달을 지칭한다. "시알릴트랜스퍼라제"란 용어는 본원에 기재된 시알릴트랜스퍼라제의 기능성 단편, 본원에 기재된 시알릴트랜스퍼라제의 기능성 변이체, 및 상기 기능성 변이체의 기능성 단편을 포함한다. 이에 관하여 "기능성"은 단편 및/또는 변이체가 시알릴트랜스퍼라제 활성을 가질 수 있음을 의미한다. 시알릴트랜스퍼라제의 기능성 단편은 천연 유전자에 의해 암호화된 바와 같은 시알릴트랜스퍼라제의 절두된 버전을 포함하며, 상기 절두된 버전은 시알릴트랜스퍼라제 활성을 가질 수 있다. 절두된 버전의 예는 전형적으로 폴리펩티드를 특정한 세포이하 위치로 유도하는 소위 리더 서열을 포함하지 않는 시알릴트랜스퍼라제이다. 전형적으로, 이와 같은 리더 서열은 이의 세포이하 수송 동안 폴리펩티드로부터 제거되며, 천연의 성숙한 시알릴트랜스퍼라제 중에 또한 존재하지 않는다.
상기 이종 시알릴트랜스퍼라제는 공여자 기질로부터 수용자 분자로 시알산 잔기를 전달할 수 있다. 상기 이종 시알릴트랜스퍼라제와 관련하여 "~할 수 있는"이란 용어는 상기 이종 시알릴트랜스퍼라제의 시알릴트랜스퍼라제 활성을 지칭하나, 단 효소 활성을 갖기 위해서 상기 이종 시알릴트랜스퍼라제에 적합한 반응 조건이 요구된다. 적합한 반응 조건의 부재하에서 상기 이종 시알릴트랜스퍼라제는 이의 효소 활성을 갖지 않으며, 적합한 반응 조건이 복원될 때 이의 효소 활성을 유지하고 이의 효소 활성을 갖는다. 적합한 반응 조건은 적합한 공여자 기질의 존재, 적합한 수용자 분자의 존재, 필수 보조인자, 예를 들어 1가 또는 2가 이온, 적합한 범위의 pH 값, 적합한 온도 등의 존재를 포함한다. 상기 이종 시알릴트랜스퍼라제의 효소 반응을 수행하는 각각의 모든 인자에 대해 최적 값이 만족될 필요는 없지만, 상기 반응 조건은 상기 이종 시알릴트랜스퍼라제가 이의 효소 활성을 수행하도록 하는 것이어야 한다. 상응하게, "~할 수 있는"이란 용어는 상기 이종 시알릴트랜스퍼라제의 효소 활성이 비가역적으로 손상된 어떠한 조건도 배제하며, 임의의 상기와 같은 조건에 대한 상기 이종 시알릴트랜스퍼라제의 노출도 배제한다. 대신에, "~할 수 있는"은 상기 시알릴트랜스퍼라제가 효소적으로 활성임, 즉 허용되는 반응 조건(이때 모든 요구조건은 시알릴트랜스퍼라제가 이의 효소 활성을 수행하는데 필요하다)이 시알릴트랜스퍼라제에 제공되는 경우 이의 시알릴트랜스퍼라제 활성을 가짐을 의미한다.
시알릴트랜스퍼라제는 상기가 형성하는 당 연결의 유형에 따라 구별될 수 있다. 본원에 사용되는 바와 같이, "α-2,3-시알릴트랜스퍼라제" 및 "α-2,3-시알릴트랜스퍼라제 활성"이란 용어는 수용자 분자의 갈락토스, N-아세틸갈락토스아민 또는 갈락토스 또는 N-아세틸-갈락토스아민 잔기에 α-2,3 연결로 시알산 잔기를 가하는 폴리펩티드 및 이의 효소 활성을 지칭한다. 마찬가지로, "α-2,6-시알릴트랜스퍼라제" 및 "α-2,6-시알릴트랜스퍼라제 활성"이란 용어는 수용자 분자의 갈락토스, N-아세틸갈락토스아민 또는 갈락토스 또는 N-아세틸갈락토스아민 잔기에 α-2,6 연결로 시알산 잔기를 가하는 폴리펩티드 및 이의 효소 활성을 지칭한다. 마찬가지로, "α-2,8-시알릴트랜스퍼라제" 및 "α-2,8-시알릴트랜스퍼라제 활성"이란 용어는 수용자 분자의 갈락토스, N-아세틸갈락토스아민 또는 갈락토스 또는 N-아세틸갈락토스아민 잔기에 α-2,8 연결로 시알산 잔기를 가하는 폴리펩티드 및 이의 효소 활성을 지칭한다.
또한, 유전자 조작된 바실러스 세포는 이종 시알릴트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 함유하고 발현하도록 유전자 조작되었다. 이를 위해서, 상기 이종 시알릴트랜스퍼라제를 암호화하는 뉴클레오티드 서열은, 세포내 시알릴트랜스퍼라제 활성을 제공하기 위해 상기 유전자 조작된 바실러스 세포 중의 이종 시알릴트랜스퍼라제를 암호화하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 발현 조절 서열에 작동적으로 연결된다.
또 다른 구현예에서, 상기 이종 시알릴트랜스퍼라제는 α-2,6-시알릴트랜스퍼라제 활성을 가질 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 α-2,6-시알릴트랜스퍼라제 활성을 가질 수 있는 상기 이종 시알릴트랜스퍼라제를 암호화하는 적어도 하나의 뉴클레오티드 서열을 포함하는 핵산 분자를 함유하고 발현한다.
추가적인 및/또는 대안의 구현예에서, 상기 이종 시알릴트랜스퍼라제는 α-2,8-시알릴트랜스퍼라제 활성을 가질 수 있다. 이종 시알릴트랜스퍼라제의 일례는 캄필로박터 제주니 OH4384의 시알릴트랜스퍼라제 CstII의 α-2,8-시알릴트랜스퍼라제 활성을 가질 수 있다.
상기 시알릴트랜스퍼라제는 공여자 기질, 예를 들어 CMP-Neu5Ac로부터 수용자 분자로 시알산 잔기, 예를 들어 N-아세틸뉴라민산(Neu5Ac) 잔기를 전달할 수 있다. 상기 수용자 분자는 사카라이드 분자, 바람직하게는 표 3에 제시된 사카라이드 분자이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 미생물 세포는 α-2,3-시알릴트랜스퍼라제 활성을 가질 수 있는 상기 이종 시알릴트랜스퍼라제를 암호화하는 적어도 하나의 뉴클레오티드 서열을 포함하고 발현하는 핵산 분자를 함유한다.
[표 2]
시알릴트랜스퍼라제-암호화 뉴클레오티드 서열의 목록
상기 시알릴트랜스퍼라제-암호화 뉴클레오티드 서열은 야생형 단백질 암호화 영역과 비교하여 완전길이 구조물(FL)로서 또는 예상되는 신호 펩티드(Δ)가 없이 클로닝되었다. Δ 뒤의 숫자는 상응하는 서열로부터 결실된 N-말단 아미노산을 가리킨다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 모노사카라이드, 바람직하게는 N-아세틸글루코스아민, 갈락토스 및 N-아세틸갈락토스아민으로 이루어지는 그룹 중에서 선택된 모노사카라이드이다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 디사카라이드, 바람직하게는 락토스, 락툴로스, N-아세틸락토스아민, 락토-N-비오스, 락툴로스 및 멜리비오스로 이루어지는 그룹 중에서 선택된 디사카라이드이다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 트리사카라이드, 바람직하게는 라피노스, 락토-N-트리오스 II, 2'-푸코실락토스, 3-푸코실락토스, 3'-시알릴락토스, 6'-시알릴락토스, 3'-시알릴-N-아세틸락토스아민, 6'-시알릴-N-아세틸락토스아민, 3'-갈락토실락토스 및 6'-갈락토실락토스로 이루어지는 그룹 중에서 선택된 트리사카라이드이다.
[표 3]
시알산화된 사카라이드의 생산을 위한 수용자 기질로서 사용될 수 있는 사카라이드의 목록.
상기 시알산화된 올리고사카라이드 자체를 또한 추가의 시알산화된 올리고사카라이드의 생산을 위한 수용자 기질로서 사용할 수 있다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 테트라사카라이드, 바람직하게는 락토-N-테트라오스, 락토-N-네오테트라오스, 2'3-디푸코실락토스, 3-푸코실-3'-시알릴락토스 및 3-푸코실-6'-시알릴락토스로 이루어지는 그룹 중에서 선택된 테트라사카라이드이다.
추가적인 및/또는 대안의 구현예에서, 수용자 분자는 펜타사카라이드, 바람직하게는 시알릴락토-N-테트라오스 a, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 c, 락토-N-푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-네오푸코펜타오스 I 및 락토-N-네오푸코펜타오스 V로 이루어지는 그룹 중에서 선택된 펜타사카라이드이다.
NeuNAc, CMP-NeuNAc 및/또는 시알산화된 사카라이드를 생산하기에 충분한 방식으로 상기 효소를 암호화하고 상기 유전자를 발현하는 하나 이상의 유전자를 이미 갖는 바실러스 세포는 시알산 생합성을 완료하고 시알산 부분을 사카라이드 수용자로 전달하기 위해 유전자 조작할 필요가 없지만, 그럼에도 불구하고 상기 유전자 조작된 세포에서 상기 하나 이상의 유전자 산물의 세포내 수준, 예를 들어 글루타민:프럭토스-6-포스페이트 아미노트랜스퍼라제, 글루코스아민-6포스페이트 N-아세틸트랜스퍼라제, N-아세틸글루코스아민-6-포스페이트 포스파타제, N아세틸글루코스아민 2-에피머라제 및/또는 N-아세틸뉴라민산 신타제의 양을 증가시켜, Neu5Ac 생합성의 비율 및 결과적으로 시알산화된 사카라이드의 비율을 증가시키기 위해 상기 유전자 중 하나 이상의 발현 수준을 변경시킬 필요가 있음을 이해해야 한다.
일부 구현예에서, 바실러스 세포는 3'-SL의 생산에 사용하기 위한 것이며 락토스 퍼미아제, 중간체로서 GlcN-1P를 사용하는 CMP-NeuNAc 생합성 경로, 및 α-2,3-시알릴트랜스퍼라제를 갖도록 유전자 조작되었다.
다양한 구현예에서, 바실러스 세포는 6'-SL의 생산에 사용하기 위한 것이며 락토스 퍼미아제, 중간체로서 GlcN-1P를 사용하는 CMP-NeuNAc 생합성 경로, 및 α-2,6-시알릴트랜스퍼라제를 갖도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 상기 세포의 야생형에서보다 더 많은 PEP를 합성한다. 추가적인 및/또는 대안의 구현예에서, 상기 유전자 조작된 미생물 세포는 향상된 PEP 생합성 경로를 갖도록 유전자 조작되었다. 바람직하게, 상기 유전자 조작된 미생물 세포는, 예를 들어 포스포에놀피루베이트 신타제 유전자를 암호화하는 ppsA 유전자가 과발현되고/되거나 비-천연 미생물이 포스포에놀피루베이트 신타제 또는 이의 기능성 변이체의 발현을 허용하는 뉴클레오티드 서열의 적어도 하나의 추가적인 사본을 함유한다는 점에서, 증가된 포스포에놀피루베이트 신타제 활성을 갖도록 유전자 조작되었다. ppsA의 과발현은 보다 많은 PEP가 시알산 생산에 이용될 수 있도록 세포내 PEP 합성을 향상시킨다. 예를 들어 적합한 포스포에놀피루베이트 신타제는 이. 콜라이의 PpsA이다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 이. 콜라이 PpsA 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 분자를 함유한다. 상기 이. 콜라이 PpsA 또는 이의 기능성 변이체를 암호화하는 뉴클레오티드 서열은 상기 이. 콜라이 ppsA 유전자에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99%의 서열 일치성을 갖는다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포는 PEP를 소비하지 않는 기전을 통해 상기 유일한 탄소원을 세포로 전달할 수 있도록 추가로 변형된다.
추가적인 및/또는 대안의 구현예에서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 어떠한 β-갈락토시다제 활성도 없거나 또는 동일한 종의 야생형 바실러스 세포와 비교하여 감소된 β-갈락토시다제 활성을 갖는다.
시알산화된 올리고사카라이드의 세포내 생합성은 락토스-수용 시알릴트랜스퍼라제에 대한 수용자 기질로서 락토스의 수입을 필요로 한다. 내면화된 락토스를 가수분해하는 임의의 세포내 효소 활성은 세포내 락토스의 풀이 감소됨에 따라 시알릴락토스 형성의 효능에 영향을 미칠 것이다. 따라서, 시알산화된 올리고사카라이드의 생산을 위한 바실러스 세포는 베타-갈락토시다제 활성이 없거나 또는 야생형 바실러스 세포와 비교하여 적어도 감소된 베타-갈락토시다제 활성을 갖는 것이 유리할 것이다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 세포의 β-갈락토시다제 활성을 없애거나 또는 적어도 상기 활성이 감소하도록 유전자 조작되었다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 ganA 유전자의 결실 또는 기능적 불활성화에 의해 유전자 조작되었다. 또 다른 구현예에서, 바실러스 세포는 야생형 바실러스 세포와 비교하여 ganA 유전자의 발현 수준이 감소하도록 유전자 조작되었다.
바실러스 ganA 유전자는 또한 yvfN 또는 lacA라 지칭된다. 이는 갈락탄의 이용과 관련된 효소를 암호화하는 유전자를 함유하는 GanR 레귤론의 유전자이다. 상기 ganA 유전자는 바실러스의 갈락탄 이용에 관련된 베타-갈락토시다제를 암호화한다.
ganA 유전자의 결실 또는 기능적 불활성화는 바실러스 세포에서 GanA-매개된 β-갈락토시다제 활성을 없애는 반면, ganA 발현의 감소는 바실러스 세포 중 GanA의 양을 낮추고 따라서 시알산화된 올리고사카라이드의 생합성을 방해할 수 있는 β-갈락토시다제 활성을 낮춘다.
추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 yesZ 유전자의 결실 또는 기능적 불활성화에 의해 유전자 조작되었다. 상기 바실러스 yesZ 유전자는 식물 세포벽으로부터 유래되는 람노갈락투로난의 분해에 한 역할을 하는 베타-갈락토시다제 YesZ를 암호화한다. 상기 바실러스 yesZ 유전자의 발현은 람노갈락투로난 I에 의해 유도된다. 또 다른 구현예에서, 상기 바실러스 세포는 야생형 바실러스 세포와 비교하여 yesZ 유전자의 발현 수준이 감소하도록 유전자 조작되었다.
yesZ 유전자의 결실 또는 기능적 불활성화는 바실러스 세포에서 YesZ-매개된 β-갈락토시다제 활성을 없애는 반면, yesZ 발현의 감소는 바실러스 세포 중 YesZ의 양을 낮추고 따라서 시알산화된 올리고사카라이드의 생합성을 방해할 수 있는 β-갈락토시다제 활성을 낮춘다.
바실러스 서브틸리스가 대수증식기-후 단계에 진입할 때, 상기 바실러스는 다량의 세포외 프로테아제를 생산한다(생산하기 시작한다). 외부 단백질은 종종 프로테아제 민감성이다. 따라서, 무-엑소프로테아제 균주는 이종 단백질의 안정성을 증가시키고 높은 수준의 외부 단백질의 축적을 허용하기에 바람직할 수 있다.
바실러스의 게놈은 적어도 8개의 세포외 프로테아제, 즉 nprE, aprE, epr, bpr, mpr, nprB, vpr 및 wprA를 암호화한다. 따라서, 추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 세포외 프로테아제를 암호화하는 적어도 하나의 유전자, 바람직하게는 nprE, aprE, epr, bpr, mpr, nprB, vpr 및 wprA로 이루어지는 그룹 중에서 선택된 유전자 중 적어도 하나가 결실되거나 기능적으로 불활성화되도록 유전자 조작되었다. 바람직하게, nprE, aprE, epr, bpr, mpr, nprB, vpr 및 wprA로 이루어지는 그룹 중에서 선택된 유전자 중 2, 3, 4, 5, 6, 7 또는 8개가 결실되거나 기능적으로 불활성화되었다.
바실러스 서브틸리스는 글루코스 또는 락토스와 같은 탄수화물을 함유하는 배지에서 증식시 풀체리민산(pulcherriminic acid)을 합성한다. 분비된 풀체리민산은 생육 배지에 철이 존재하는 경우 풀체리민산의 염(철 킬레이트)인 적색 안료 풀체리민을 형성한다. 발효 공정 중 이러한 바람직하지 못한 부산물의 형성은 유전자 yvmC 및/또는 cypX의 결실 또는 붕괴에 의해 피하거나/없앨 수 있다. 유전자 yvmC는 사이클로디펩티드 신타제를 암호화하고, 유전자 cypX는 시토크롬 P450 사이클로-I-류실-I-류실 디펩티드 옥시다제를 암호화한다.
따라서, 추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 유전자 yvmC 및 cypX 중 적어도 하나가 결실되거나 기능적으로 불활성화되도록 유전자 조작되었다.
리조박테리움 바실러스 서브틸리스는 20개를 초과하는 항생제의 합성을 위한 유전자를 갖는다. 이들 중에는 바실러스 서브틸리스 랜티바이오틱스(lantibiotics) 및 랜티바이오틱-유사 펩티드(서브틸린, 에리신 S, 메르사시딘, 서브란신 168, 서브틸로신 A) 및 비-리보솜 합성된(펩티드) 항생제(설팩틴, 이투린, 바실로마이신, 마이코서브틸린, 코리네박틴/바실리박틴, 펜지신 플리파스타틴, 마이코바실린, TL-119, 바실리신, 바실리소신, 아미쿠마신, 3,3'-네오트레할로사디아민, 디피시딘, 리족티신)와 같은 펩티드 항생제가 있다.
시알산화된 올리고사카라이드의 생산을 위해서, 항생제를 생성시키지 않는 바실러스 세포를 사용하는 것이 바람직하다. 따라서, 추가적인 및/또는 대안의 구현예에서, 바실러스 세포는 랜티바이오틱스 및 랜티바이오틱스-유사 펩티드, 예를 들어 서브틸린, 에리신 S, 메르사시딘, 서브란신 168, 서브틸로신 A; 비-리보솜 합성된(펩티드) 항생제, 예를 들어 설팩틴, 이투린, 바실로마이신, 마이코서브틸린, 코리네박틴/바실리박틴, 펜지신 플리파스타틴, 마이코바실린, TL-119, 바실리신, 바실리소신, 아미쿠마신, 3,3'-네오트레할로사디아민, 디피시딘 및 리족티신으로 이루어지는 그룹 중에서 선택된 항생제 중 하나 이상을 합성하지 않는다. 바실러스 세포는 상기 항생제 중 하나 이상을 합성하는 능력이 손상되거나 제거되도록 유전자 조작될 수 있다.
시알산화된 올리고사카라이드를 생산할 수 있는 유전자 조작된 바실러스 세포는 추가적인 특징을 임의로 포함할 수 있으며, 이러한 추가적인 특징을 갖도록 유전자 조작될 수 있다. 이러한 추가적인 특징은 비-천연 미생물의 생산성을 개선시켜 보다 많은 시알산화된 올리고사카라이드 수율로 이어지는 것으로 간주된다.
본 발명의 바실러스 세포는, 상기 바실러스 세포가 시알산화된 올리고사카라이드를 생산할 수 있게 하는 배지 및 조건하에서 락토스의 존재하에 배양시 시알산화된 올리고사카라이드를 생산할 수 있다. 따라서, 시알산화된 올리고사카라이드의 생산을 위한 본원에서 이전에 기재한 바와 같은 유전자 조작된 바실러스 세포의 용도를 제공한다.
하나의 측면에서, 시알산화된 올리고사카라이드의 생산 방법을 제공한다. 상기 방법은 (i) 본원에서 이전에 기재한 바와 같은 바실러스 세포를 제공하고, (ii) 상기 바실러스 세포를 시알산화된 올리고사카라이드의 생산에 허용되는 배양 배지 또는 발효 브로쓰(fermentation broth) 및 조건하에서 배양함을 포함한다. 상기 방법은 상기 배양 배지/발효 브로쓰 및/또는 바실러스 세포로부터 시알산화된 올리고사카라이드를 회수함을 추가로 포함할 수 있다.
상기 발효 브로쓰는 바실러스 세포의 대사를 위해 적어도 하나의 탄소원을 함유한다. 일부 구현예에서, 상기 적어도 하나의 탄소원은 글루코스, 프럭토스, 슈크로스, 글리세롤 및 이의 조합으로 이루어지는 그룹 중에서 선택된다. 상기 탄소원은 바실러스 세포에 의해 내면화될 수 있으며 바실러스 세포의 대사에 의해 사용되어 바이오매스 및 에너지 풍부 트리포스페이트 형태의 에너지를 생성시킬 수 있다.
일부 구현예에서, 상기 발효 브로쓰는, 특히 바실러스 세포가 혼자서 락토스를 합성할 수 없는 경우, 락토스를 함유한다. 상기 락토스는 발효 브로쓰에 외부적으로 공급될 수 있다. 락토스는 일부 시알산화된 올리고사카라이드의 생산에서, 특히 시알릴락토스의 생산에서 NeuNAc 부분에 대한 수용자 기질로서 작용할 수 있다.
다양한 구현예에서, 상기 발효 브로쓰는, 특히 바실러스 세포가 시알산 생합성 경로를 갖지 않고 시알산 회수 경로를 갖는 시알산화된 올리고사카라이드의 생산에 사용되는 경우, 시알산을 함유한다.
일부 구현예에서, 시알산화된 올리고사카라이드의 생산은 발효 브로쓰에 N-아세틸글루코스아민, N-아세틸만노스아민 및/또는 N아세틸-뉴라민산의 첨가, 및/또는 시알산화된 올리고사카라이드의 세포내 생합성을 위한 N-아세틸글루코스아민, N-아세틸만노스아민 및/또는 N-아세틸뉴라민산 존재하에서의 유전자 조작된 미생물 세포의 배양을 필요로 하지 않는데, 그 이유는 바실러스 세포가 NeuNAc의 세포내 생합성을 위한 드노보 시알산 생합성 경로를 갖는 시알산화된 올리고사카라이드의 생산에 사용되기 때문이다.
상기 방법에서, 적어도 하나의 유전자 조작된 바실러스 세포를, 적어도 하나의 N-아세틸뉴라민산 부분을 포함하는 사카라이드의 생산에 허용되는 발효 브로쓰 및 조건하에서 배양한다.
상기 공정이 유전자 조작된 바실러스 세포에 대한 발효 브로쓰에 탄소원을 사용하지만, 상기 바실러스 세포가 내포내에서 N-아세틸뉴라민산을 생산할 수 있는 경우 글루코스아민 및/또는 N-아세틸뉴라민산 및/또는 N-아세틸글루코스아민 및/또는 N-아세틸만노스아민을 상기 발효 브로쓰에 첨가할 필요는 없다. 따라서, 시알산화된 올리고사카라이드의 생산에 대한 다양한 구현예에서, 유전자 조작된 바실러스 세포를 글루코스아민, N-아세틸글루코스아민, N-아세틸만노스아민 및 N-아세틸뉴라민산으로 이루어지는 그룹 중에서 선택된 하나 이상의 첨가 없이 및/또는 이들의 부재하에서 배양한다. 상기 유전자 조작된 바실러스 세포를, 갈락토스가 시알실트랜스퍼라제 반응에 대한 수용자 기질로서 공급되지 않는 한, 갈락토스의 첨가 없이 및/또는 이의 부재하에서 배양할 수 있다.
추가적인 및/또는 대안의 구현예에서, 유전자 조작된 바실러스 세포를 하나 이상의 모노사카라이드(예를 들어 갈락토스), 디사카라이드(예를 들어 락토스), 트리사카라이드(예를 들어 락토-N-트리오스 II), 테트라사카라이드(예를 들어 락토-N-테트라오스) 및/또는 펜타사카라이드(예를 들어 시알릴락토-N-테트라오스 a)의 존재하에서 배양한다.
추가적인 및/또는 대안의 구현예에 따라, 유전자 조작된 바실러스 세포를 갈락토스, N-아세틸갈락토스아민, N-아세틸글루코스아민, 락토스, 락툴로스, N-아세틸락토스아민, 락토-N-비오스, 락토-N-트리오스, 2'-푸코실락토스, 3-푸코실락토스, 3'-시알릴락토스, 6'-시알릴락토스, 3'-시알릴-N-아세틸락토스아민, 6'-시알릴-N-아세틸락토스아민, 3'-갈락토실락토스, 6'-갈락토실락토스, 락토-N-트리오스 II, 락토-N-테트라오스, 락토-N-네오테트라오스, 2'3-디푸코실락토스, 3-푸코실-3'-시알릴락토스 및 3-푸코실-6'-시알릴락토스로 이루어지는 그룹 중에서 선택된 적어도 하나의 수용자 기질의 존재하에서 배양한다. 이들 기질은 세포에 수입되어 상기 세포에서 수용자 분자로서 사용된다.
상기 방법은 발효 브로쓰에서 배양 및 증식 중에 유전자 조작된 바실러스 세포에 의해 생산된 시알릴화된 올리고사카라이드의 임의의 회수 단계를 포함한다. 상기 시알산화된 올리고사카라이드를, 유전자 조작된 바실러스 세포를 예를 들어 원심분리 또는 여과에 의해 제거한 후에 발효 브로쓰로부터 회수하고/하거나, 세포로부터, 예를 들어 원심분리에 의해 발효 브로쓰로부터 수확되고 세포 용해 단계가 가해진 세포로부터 회수할 수 있다. 후속적으로 상기 시알산화된 올리고사카라이드를 당업자에게 공지된 적합한 기법에 의해 발효 브로쓰 및/또는 세포 용해물로부터 추가로 정제할 수 있다. 적합한 기법은 미세여과, 한외여과, 정용여과, 시뮬레이션된 이동층 유형 크로마토그래피, 전기투석, 역삼투, 젤 여과, 음이온 교환 크로마토그래피, 양이온 교환 크로마토그래피 등을 포함한다.
상기 방법 및 상기 방법에 사용되는 유전자 조작된 미생물 세포를 시알산화된 올리고사카라이드의 생산에 사용한다. "시알산화된 올리고사카라이드"란 용어는 적어도 하나의 N-아세틸뉴라민산 부분을 포함하는 올리고사카라이드 분자를 지칭한다.
추가적인 및/또는 대안의 구현예에서, 시알산화된 사카라이드는 올리고사카라이드이다. 본원에 사용되는 바와 같은 "올리고사카라이드"란 용어는 모노사카라이드 잔기의 중합체를 지칭하며, 여기서 상기 중합체는 적어도 2개의 모노사카라이드 잔기, 10개 이하의 모노사카라이드 잔기, 바람직하게는 7개 이하의 모노사카라이드 잔기를 포함한다. 상기 올리고사카라이드는 모노사카라이드의 선형 쇄이거나 분지된다. 또한, 상기 올리고사카라이드의 모노사카라이드 잔기는 다수의 화학 변형을 특징으로 할 수 있다. 상응하게, 상기 올리고사카라이드는 하나 이상의 비-사카라이드 부분을 포함할 수 있다. 본원에 사용되는 바와 같은 "시알산화된 올리고사카라이드"란 용어는 하나 이상의 N-아세틸뉴라민산 부분을 포함하는 올리고사카라이드를 지칭한다.
추가적인 및/또는 대안의 구현예에 따라, 시알산화된 올리고사카라이드는 3'-시알릴락토스, 6'-시알릴락토스, 시알릴-락토-N-테트라오스 a, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 c, 푸코실-시알릴-락토-N-테트라오스 a, 푸코실-시알릴락토-N-테트라오스 b, 푸코실-시알릴락토-N-테트라오스 c, 디시알릴락토-N-테트라오스, 푸코실디시알릴락토-N-테트라오스 I, 푸코실디시알릴락토-N-테트라오스 II, 3'-시알릴갈락토스, 6'-시알릴갈락토스, 3'-시알릴-N-아세틸락토스아민 및 6'-시알릴-N-아세틸락토스아민으로 이루어지는 그룹 중에서 선택된다.
본 발명의 또 다른 구현예에서, 전세포 발효 공정에서 시알산화된 올리고사카라이드의 생산을 위한 이전에 본원에 기재한 바와 같은 유전자 조작된 바실러스 세포의 용도를 제공한다, 즉 상기 시알산화된 올리고사카라이드가 상기 유전자 조작된 바실러스 세포에 의해서 및 상기 세포에서 합성된다.
본 발명의 또 다른 측면에서, 이전에 본원에 기재한 바와 같은 방법에 의해 및/또는 이전에 본원에 기재한 바와 같은 유전자 조작된 바실러스 세포의 사용에 의해 생산된 시알산화된 올리고사카라이드를 제공한다.
본 발명의 또 다른 측면에서, 영양 조성물의 제조를 위한 이전에 본원에 기재한 바와 같은 방법에 의해 및/또는 이전에 본원에 기재한 바와 같은 유전자 조작된 바실러스 세포의 사용에 의해 생산된 시알산화된 올리고사카라이드의 용도를 제공한다.
따라서, 이전에 본원에 기재한 바와 같은 방법에 의해 및/또는 이전에 본원에 기재한 바와 같은 유전자 조작된 바실러스 세포에 의해 생산된 적어도 하나의 시알산화된 올리고사카라이드를 함유하는 영양 조성물을 제공한다.
추가적인 및/또는 대안의 구현예에서, 시알산화된 올리고사카라이드는 3'-시알릴락토스, 6'-시알릴락토스, 시알릴락토-N-테트라오스 a, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 c, 푸코실-시알릴락토-N-테트라오스 a, 푸코실-시알릴락토-N-테트라오스 b, 푸코실-시알릴락토-N-테트라오스 c, 디시알릴락토-N-테트라오스, 푸코실디시알릴락토-N-테트라오스 I, 푸코실디시알릴락토-N-테트라오스 II, 3'-시알릴갈락토스, 6'-시알릴갈락토스, 3'-시알릴-N-아세틸락토스아민 및 6'-시알릴-N-아세틸락토스아민으로 이루어지는 그룹 중에서 선택된다.
일부 구현예에서, 영양 조성물은 적어도 하나의 중성 HMO, 바람직하게는 유전자 조작된 바실러스 세포를 사용하여 생산된 적어도 하나의 중성 HMO를 추가로 함유한다. 상기 적어도 하나의 중성 HMO는 2'-푸코실락토스, 3-푸코실락토스, 2',3-디푸코실락토스, 락토-N-트리오스 II, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-네오디푸코헥사오스 I, 락토-N-헥사오스, 락토-N-네오헥사오스, 파라-락토-N-헥사오스, 및 파라-락토-N-네오헥사오스로 이루어지는 그룹 중에서 선택된다.
추가적인 구현예에서, 상기 영양 조성물은 약제 조성물, 약학 조성물, 뉴트라슈티칼 제형, 유아용 조제분유 및 식이성 보충제로 이루어지는 그룹 중에서 선택된다.
상기 영양 조성물은 액체 형태, 또는 비제한적으로 분말, 과립, 박편 및 펠릿을 포함한 고체 형태로 존재할 수 있다.
본 발명을 특정 구현예에 관하여 기재할 것이나, 본 발명은 이들로 제한되지 않으며 단지 청구범위에 의해서만 제한된다. 더욱 또한, 상기 설명 및 청구범위에서 제1, 제2 등의 용어는 유사한 요소들을 구별하기 위해 사용되며 반드시 시간적으로, 공간적으로, 순위상 또는 임의의 다른 방식으로 순서를 기재하기 위한 것은 아니다. 이렇게 사용된 용어는 적합한 상황하에서 호환가능하며 본원에 기재된 발명의 구현예를 본원에 기재되거나 예시된 것 이외의 순서로 실행할 수 있음을 알아야 한다.
청구범위에 사용된 "포함하는"이라는 용어는 이후에 나열된 수단으로 제한되는 것으로 해석되어서는 안 되며; 다른 요소나 단계를 제외하지 않음을 알아야 한다. 따라서 이는 언급된 특징, 정수, 단계 또는 구성요소의 존재를 명시하는 것으로 해석되어야 하지만, 하나 이상의 다른 특징, 정수, 단계 또는 구성요소, 또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다. 따라서 "수단 A 및 B를 포함하는 장치"라는 표현의 범위는 구성요소 A 및 B로만 구성된 장치로 제한되어서는 안 된다. 이는 본 발명과 관련하여 장치의 유일한 관련 구성요소가 A 및 B임을 의미한다.
본 명세서 전체를 통해 "하나의 구현예" 또는 "구현예"에 대한 언급은 상기 구현예와 관련하여 설명된 특정한 특징, 구조 또는 특성이 본 발명의 적어도 하나의 구현예에 포함된다는 것을 의미한다. 따라서, 본 명세서 전체를 통해 다양한 위치에서 "하나의 구현예에서" 또는 "구현예에서"라는 문구의 출현은 반드시 모두 동일한 구현예를 지칭하는 것은 아니지만, 그럴 수도 있다. 더욱 또한, 특정한 특징, 구조 또는 특성은 하나 이상의 구현예에서 본 개시내용으로부터 당업자에게 명백한 바와 같이 임의의 적합한 방식으로 조합될 수 있다.
유사하게, 본 발명의 예시적인 구현예의 설명에서, 본 발명의 다양한 특징들은 때때로 본 개시를 간소화하고 다양한 본 발명의 측면 중 하나 이상의 이해를 도울 목적으로 단일 구현예, 도면 또는 이에 대한 설명에서 함께 그룹화된다는 것을 이해해야 한다. 그러나 이러한 개시 방법은 청구된 발명이 각 청구범위에 명시적으로 인용된 것보다 더 많은 특징을 필요로 한다는 의도를 반영하는 것으로 해석되어서는 안 된다. 오히려, 이어지는 청구 범위가 반영하는 바와 같이, 독창적인 측면은 단일의 전술한 개시된 구현예의 모든 특징보다 적다. 따라서, 이러한 상세한 설명에 이어지는 청구범위는 이에 의해 상기 상세한 설명에 명시적으로 통합되며, 이때 각 청구범위는 그 자체로 본 발명의 별도의 구현예로서 독자적으로 자립한다.
더욱 또한, 본원에 기재된 구현예 중 일부는 다른 구현예에 포함된 다른 특징이 아닌 일부를 포함하지만, 상이한 구현예의 특징들의 조합은 본 발명의 범위 내에 있는 것으로 의미되며, 당업자에 의해 이해되는 바와 같이, 상이한 구현예를 형성한다. 예를 들어, 하기의 청구범위에서, 청구된 구현예 중 어느 하나가 임의의 조합으로 사용될 수 있다.
더욱 또한, 구현예 중 일부는 컴퓨터 시스템의 프로세서에 의해 또는 기능을 수행하는 다른 수단에 의해 구현될 수 있는 방법 또는 방법의 요소들의 조합으로서 본원에서 설명된다. 따라서, 그러한 방법 또는 방법의 요소를 수행하는데 필요한 명령이 있는 프로세서는 방법 또는 방법의 요소를 수행하기 위한 수단을 형성한다.
더욱 또한, 장치 구현예의 본원에 기재된 요소는 본 발명을 수행할 목적으로 상기 요소에 의해 수행되는 기능을 수행하기 위한 수단의 일례이다.
본원에 제공된 설명 및 도면에서, 다수의 특정한 세부사항이 설명된다. 그러나, 본 발명의 구현예는 이러한 특정한 세부사항 없이 실시될 수 있다는 것이 이해된다. 다른 경우에, 주지된 방법, 구조 및 기술은 이해를 모호하게 하지 않기 위해 상세히 표시되지 않았다. 본 발명은 이제 본 발명의 몇몇 구현예의 상세한 설명에 의해 설명될 것이다. 본 발명의 다른 구현예는 본 발명의 진의 또는 기술적 교시로부터 이탈됨 없이 당업자의 지식에 따라 구성될 수 있으며, 본 발명은 첨부된 특허청구범위의 용어에 의해서만 제한된다는 것이 명백하다.
실시예
실시예 1: 바실러스 서브틸리스의 형질전환
바실러스 서브틸리스를 다양한 기법에 의해 유전자 조작할 수 있다. 바실러스 서브틸리스의 형질전환을 위해서, 컴피턴트 세포를 2-단계 방법의 변형된 프로토콜에 의해 제조하였다(Anagnostopoulos, C. and Spizizen, J. (1961) J Bacteriol 81 (5): 741-746). 밤새 배양물을 MG1 배지에 접종하고 37℃에서 진탕하였다. MG1 배지는 0.5% 글루코스, 5 mM MgSO4 및 0.02% 카사미노산이 보충된(비오틴 및/또는 L-트립토판이 임의로 추가로 보충된다) 스피지젠(Spizizen)의 최소 배지이다. 다음날 아침에, 이 배양물을 신선한 MG1 배지에서 1:20 희석하고 37℃에서 대략 6h 동안 배양하였다. 1 ㎖의 배양물을, 카사미노산의 농도가 MG1 배지와 상이한(0.02% 대신에 0.01%) 8 ㎖ MG2 배지에서 희석하였다. 단축된 프로토콜에서 상기 밤새 배양물을 MG2 배지에서 직접 희석한다. 추가로 90분간 배양 후에, 상기 배양물의 1-㎖ 분취량을 1 내지 3 ㎍의 다량체성 플라스미드 DNA 또는 선형 DNA와 혼합하고 37℃에서 30-60분간 진탕시키면서 배양하였다. 다량체성 플라스미드 DNA를, 플라스미드 DNA의 번식을 위해 이. 콜라이 균주 NM538을 사용함으로써 또는 단일-절단 제한 효소(주쇄 내에서 절단한다)에 의한 절단에 의해 상기 플라스미드를 선형화한 다음, T4 DNA 리가제에 의해 재-결찰시킴으로써 수득하였다.
그 후에, 세포를 적합한 항생제를 함유하는 2x YT 아가 플레이트상에 스프레딩하였다. 항생제는 하기의 농도로 첨가되었다: 5 ㎍·㎖-1 에리쓰로마이신, 5 ㎍·㎖-1 클로람페니콜, 10 ㎍·㎖-1 가나마이신, 100 ㎍·㎖-1 스펙티노마이신.
대안적으로, 원형질체 형질전환의 경우(Romero, D. et al. (2006) Journal of Microbiological Methods 66:556-559), 세포를 증식 정지기(OD600 = 1.7-2)가 개시될 때까지 37℃에서 20 ㎖의 페나세이(Penassay) 브로쓰(PAB)에서 증식시켰다. 이어서 세포를 펠릿화하고 10 ㎖의 SMPP 배지(0.3% 소 혈청 알부민, 5% 2 M 슈크로스, 25% 4x PAB, 50% 2x SMM)에 재현탁시켰으며, 2x SMM의 조성은 1 M 슈크로스, 0.04 M 말레산 이나트륨 염 수화물 및 0.04 M MgCl2(pH 6.5)였다. 리소자임(10 ㎎ ㎖-1) 및 뮤타놀리신(75 U ㎖-1)의 첨가 후에, 혼합물을 37℃에서 진탕시키면서 배양하여 원형질체를 생성시켰다. 원형질체 형성을 현미경에 의해 검사하였다. 이어서 원형질체를 5200 x g 및 4℃에서 5분간 원심분리에 의해 조심스럽게 수확하고, 빙냉 세척 전기형질전환 완충제(1x SMM)로 2회 세척하고, 최종적으로 이 용액에 현탁시켰다. 플라스미드 DNA(1-3 ㎍)를 120 ㎕의 원형질체 현탁액에 가하고 혼합물을 얼음상에서 적어도 5분간 유지시켰다. 형질전환 혼합물을 0.2-㎝ 큐벳으로 옮기고 단일 일렉트로포레이션 펄스를 25 μF, 400 Ω 및 0.7 kV에서 적용하였다. 일렉트로포레이션 충격 직후에, 1 ㎖의 회수 배지(동일 부피의 4x PAB 및 2x SMM, 사용 전에 신선하게 제조됨)를 상기 큐벳에 가하였다. 이어서 형질전환 반응물을 2 ㎖ 튜브로 옮기고 37℃에서 12h 동안 진탕시키면서 배양하였다. 재생을 위해서, 세포 현탁액을 DM3 아가 플레이트(Chang, S. and Cohen, S. (1979) MGG 168(1): 111―115)상에 스프레딩하고 37℃에서 48h 동안 배양하였다. DM3 재생 배지는 리터당 하기의 멸균 용액을 함유하였으며: 200 ㎖ 4% 아가, 100 ㎖ 5% 카사미노산, 50 ㎖ 10% 효모 추출물, 100 ㎖ 3.5% K2HPO4 및 1.5% KH2PO4, 25 ㎖ 20% 글루코스, 20 ㎖ 1 M MgCl2, 500 ㎖ 0.5 M 솔비톨 및 5 ㎖ 필터 멸균된 2% 소 혈청 알부민(온도가 55℃ 미만일 때 혼합물에 첨가됨), 적합한 항생제가 보충되었다.
바실러스 서브틸리스의 일렉트로포레이션을 MoBiTec GmbH에 의해 제공된 장(Zhang) 등(2011)의 변형된 프로토콜에 따라 수행하였다(Zhang, G., Bao, P., Zhang, Y., Deng, A., Chen.N. and Wen, T. (2011) Anal. Biochem., 409:130-137). 2x YT 밤새 배양물을 신선한 2x YT 배지로 100배 희석하고 배양물을 37℃에서 회전 진탕기상에서 0.2의 OD600으로 증식시켰다. 이어서 배양물에 1% DL-쓰레오닌, 2% 글리신, 0.1% 트립토판 및 0.03% 트윈 80을 보충하였다. 추가로 60분간 배양 후에, 세포 현탁액을 얼음상에서 20분간 냉각시키고, 4℃에서 5000 x g에서 10분간 원심분리시키고 일렉트로포레이션 완충제(0.5 M 트레할로스, 0.5 M 솔비톨, 0.5 M 만니톨, 0.5 mM MgCl2, 0.5 mM K2HPO4, 0.5 mM KH2PO4, pH 7.4, 필터-멸균되고 동결 보관됨)로 2회 세척하였다. 최종적으로, 세포를 일렉트로포레이션 완충제에 원래 배양 부피의 1/100으로 재현탁시키고 100 ㎕의 세포 현탁액을 DNA와 혼합하였다. 형질전환 혼합물을 0.1-㎝ 큐벳으로 옮기고 일렉트로포레이션을 1.8 kV에서 MicroPulserTM 장치(Bio-Rad)로 전달된 단일 펄스로 수행하였다. 펄스 전달 직후에, 0.5 M 솔비톨 및 0.38 M 만니톨을 함유하는 1 ㎖ 2x YT 브로쓰를 상기 큐벳에 가하였다. 형질전환 현탁액을 2 ㎖ 튜브로 옮기고 37℃에서 3h 동안 회전 진탕기상에서 배양하였다. 세포를 선택성 2x YT 아가 플레이트상에 스프레딩하고 37℃에서 밤새 배양하였다.
대안의 일렉트로포레이션 프로토콜(Xue, G. P., J. S. Johnson, and B. P. Dalrymple: 1999; Journal of Microbiological Methods 34:183-191)을 사용하여, 0.5 M 글루시톨을 함유하는 5 ㎖의 LB 배지에 바실러스 서브틸리스를 접종하고 37℃에서 밤새 배양하였다. 후속적으로, 상기 밤새 배양물을 0.5 M 글루시톨을 함유하는 75 ㎖의 LB에 의해 희석하고(1:16) 0.85-0.95의 OD600이 획득될 때까지 배양하였다. 이어서 세포를 4℃에서 5.000xg에서 10분간 원심분리에 의해 펠릿화하고 빙-냉 일렉트로포레이션 완충제(10% 글리세롤, 0.5 M 글루시톨, 0.5 M 만니톨)에 의해 4회 세척하였다. 최종적으로, 세포를 1-2 ㎖ 일렉트로포레이션 완충제에 재현탁하였다. 일렉트로포레이션을 냉각된 일렉트포로레이션 큐벳(1-㎜ 전극 틈)에서 DNA와 60 ㎕의 컴피턴트 세포를 사용하여 수행하였다. 상기 세포-DNA 혼합물에 25 μM, 200 Ω 및 21 kV/㎝의 단일 전기 펄스를 가하였다. 최종적으로, 1 ㎖의 회수 브로쓰(0.5 M 글루시톨 및 0.38 만니톨을 함유하는 LB)를 전기투과된 세포에 가하고 세균 배양물을 37℃에서 3h 동안 배양한 다음 항생제가 보충된 LB 아가상에 도말하였다.
2개의 상이한 풍부 배지, 즉 루리아 브로쓰(LB) 및 2x YT를 사용하였다.
루리아 브로쓰(LB) 배지는 1% 트립톤, 0.5% 효모 추출물 및 0.5% NaCl(pH 7.2)로 이루어졌다.
2x YT 배지는 1.6% 트립톤, 1% 효모 추출물 및 0.5% NaCl(pH 7.5)로 이루어졌다.
풍부-배지 아가 플레이트를 제조하기 위해서 15 g L-1 아가를 가하였다.
진탕 플라스크 실험을 위해서, 스피지젠의 최소 배지(Spizizen, J. 1958 Proc. Natl. Acad. Sci. U. S. A. 44(10): 1072-1078)를 사용하였다.
스피지젠의 최소 배지는 하기의 염을 함유한다: 2 g/L (NH4)2SO4, 14 g/L K2HPO4, 6 g/L KH2PO4, 1 g/L Na3 시트레이트 x 2·H2O 및 0.2 g/L MgSO4 x 7·H2O.
전배양 배지는 2 mM의 최종 농도로 2% D-글루코스, 0.05% 카사미노산 및 MgSO4가 보충된(비오틴 및/또는 L-트립토판이 임의로 추가로 보충된다) 스피지젠의 최소 염으로 이루어졌다.
주 배양 배지는 2 mM의 최종 농도로 2% D-글루코스, 0.05% 카사미노산 및 MgSO4가 보충된 스피지젠의 최소 염 및 0.5 ㎖·L-1 1000x 미량원소 용액(비오틴 및/또는 L-트립토판이 임의로 추가로 보충된다)으로 이루어졌다.
미량원소 용액(1000x)은 100.6 g/L C6H9NO6, 56.4 g/L 암모늄 철 시트레이트, 9.8 g/L MnCl2 x 4·H2O, 1.6 g/L CoCl2 x 6·H2O, 1 g/L CuCl2 x 2·H2O, 1.9 g/L H3BO3, 9 g/L ZnS04 x 7·H2O, 1.1 g/L Na2Mo04 x 2·H2O, 1.5 g/L Na2Se03, 1.5 g/L NiS04 x 6·H2O로 이루어졌다.
필요한 경우, 적합한 항생제(들)를 배지에 가하여 선택적으로 만들었다.
바실러스 서브틸리스 균주를 처음에 풍부-배지 아가 플레이트상에서 증식시켜 단일 콜로니를 수득하였다. 이 플레이트를 30-37℃에서 1일간 증식시켰다. 진탕 플라스크 실험을 위해서, 20-㎖ 전배양물에 단일 콜로니를 접종하고 30-37℃에서 회전 진탕기상에서 밤새 증식시켰다. 후속적인 20-㎖ 주 배양물에 상기 전배양물을 약 0.1의 출발 OD600으로 접종하고 30-37℃에서 회전 진탕기상에서 배양하였다. 유도가 필요한 경우, 40-60 ㎖의 주 배양물을 유도 시점에서 20-㎖ 비율로 분할하였다. 배양 부피는 진탕 플라스크 용량의 20%를 초과하지 않았다.
실시예 2: 3'-시알릴락토스에 대한 바실러스 서브틸리스 생산 균주의 구성
neuCBA 경로를 사용하여 대사 중간체 UDP-N-아세틸글루코스아민으로부터 3'-시알릴락토스의 합성을 위해서, 바실러스 서브틸리스 발현 플라스미드(서열번호 1)를 구성하였다. 먼저, 유전자 neuA, neuB, neuC 뿐만 아니라 α-2,3-시알릴트랜스퍼라제를 바실러스 서브틸리스에서의 발현을 위해 코돈-최적화하고 GenScript Corp에 의해 합성적으로 제조하였다. 캄필로박터 제주니 유전자 neuA(UniProtKB 수탁번호: Q93MP7)는 CMP-Neu5Ac 신시타제를 암호화한다. 캄필로박터 제주니 유전자 neuB(UniProtKB 수탁번호: Q93MP9)는 시알산 신타제를 암호화한다. 캄필로박터 제주니 유전자 neuC(UniProtKB 수탁번호: Q93MP8)는 N-아세틸글루코스아민-6-포스페이트 2-에피머라제를 암호화한다. 파스퇴렐라 뮬토시다 유전자 siaT(UniProtKB 수탁번호: Q9CLP3)는 α-2,3-시알릴트랜스퍼라제를 암호화한다. 락토스 퍼미아제를 암호화하는 이. 콜라이 유전자 lacY(Gen Bank 수탁번호: NP_414877.1)의 개방 판독 프레임을 염색체 DNA로부터 PCR에 의해 증폭시켰다. 그 후에, 유도성 프로모터 P grac100 의 조절하에서 모든 필요한 유전자를 포함하는 발현 카세트 <P grac100 -neuBCA-siaT-lacY-종결자>를 구성하였다. 이를 위해서, 바실러스 서브틸리스 발현 벡터 pHT253(MoBiTec GmbH, Gottingen, Germany)을 주쇄로서 사용하였다. 발현 카세트내의 각 유전자를 바실러스 서브틸리스 RBS 서열에 연결하였다. 추가로, iGem 파트 기탁소(서열 ID: BBa_B0015)로부터의 적합한 바실러스 서브틸리스 종결자 서열을 발현 카세트의 하류에 놓았다. 생성 플라스미드 <pHT253-P grac100 -neuBCA-2,3siaT-lacY-종결자>(서열번호 1)를 사용하여 이의 고유 수용능력을 활용함으로써 포자형성 바실러스 서브틸리스 균주(표 1)를 형질전환시켰다.
유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다.
형질전환체를, 바실러스 서브틸리스가 외인성 락토스의 존재하에서 3'-시알릴락토스를 생산할 수 있게 하는 조건하에서 배양하였다.
실시예 3: 3'-시알릴락토스에 대한 바실러스 서브틸리스 생산 균주의 구성
neuCBA 경로를 사용하여 대사 중간체 UDP-N-아세틸글루코스아민으로부터 3'-시알릴락토스의 합성을 위해서, 구성적 바실러스 서브틸리스 발현 플라스미드(서열번호 2)를 구성하였다. 먼저, 유전자 neuA, neuB, neuC 뿐만 아니라 siaT를 바실러스 서브틸리스에서의 발현을 위해 코돈-최적화하고 GenScript Corp에 의해 합성적으로 제조하였다. 캄필로박터 제주니 유전자 neuA(UniProtKB 수탁번호: Q93MP7)는 CMP-Neu5Ac 신시타제를 암호화한다. 캄필로박터 제주니 유전자 neuB(UniProtKB 수탁번호: Q93MP9)는 시알산 신타제를 암호화한다.
캄필로박터 제주니 유전자 neuC(UniProtKB 수탁번호: Q93MP8)는 N-아세틸글루코스아민-6-포스페이트 2-에피머라제를 암호화한다. 파스퇴렐라 뮬토시다 유전자 siaT(UniProtKB 수탁번호: Q9CLP3)는 α-2,3-시알릴트랜스퍼라제를 암호화한다. 락토스 퍼미아제를 암호화하는 이. 콜라이 유전자 lacY(Gen Bank 수탁번호: NP_414877.1)의 개방 판독 프레임을 염색체 DNA로부터 PCR에 의해 증폭시켰다. 그 후에, 2개의 강한 구성적 바실러스 서브틸리스 프로모터 P lepA 및/또는 P43에 작동적으로 연결된 모든 필요한 유전자를 포함하는 발현 카세트 <P43-neuBCA-P lepA -siaT-lacY-종결자>를 구성하였다. 바실러스 서브틸리스 발현 벡터 pHT253(MoBiTec GmbH, Gottingen, Germany)을 플라스미드 주쇄로서 사용하였다. 발현 카세트내의 각 유전자를 바실러스 서브틸리스 RBS 서열에 연결하였다. 추가로, iGem 파트 기탁소(서열 ID: BBa_B0015)로부터의 적합한 바실러스 서브틸리스 종결자 서열을 발현 카세트의 하류에 놓았다.
생성 플라스미드 <pHT253-P43-neuBCA-P lepA -siaT-lacY-종결자>(서열번호 2)를 사용하여 이의 고유 수용능력을 활용함으로써 포자형성 및 비-포자형성 바실러스 서브틸리스 균주(표 1)를 형질전환시켰다.
유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다.
형질전환체를, 바실러스 서브틸리스가 외인성 락토스의 존재하에서 3'-시알릴락토스를 생산할 수 있게 하는 조건하에서 배양하였다.
실시예 4: 6'-시알릴락토스에 대한 바실러스 서브틸리스 생산 균주의 구성
바실러스 서브틸리스에서 6'-시알릴락토스의 생산을 위해서, 포토박테리움 레이오그나티(Photobacterium leiognathi)로부터의 α-2,6-시알릴트랜스퍼라제를 사용하였다. 유전자 siaT(UniProtKB 수탁번호: D0VYB7)의 개방 판독 프레임을 바실러스 서브틸리스에서의 발현에 대해 코돈-최적화하고 GenScript Corp에 의해 합성적으로 제조하였다.
발현 플라스미드 <pHT253-P grac100 -neuBCA-2,6siaT-lacY-종결자>(서열번호 3)를 실시예 2에 기재된 바와 같이 구성하였다. 생성 플라스미드(서열번호 3)를 사용하여 이의 고유 수용능력을 활용함으로써 포자형성 및 비-포자형성 바실러스 서브틸리스 균주(표 1)를 형질전환시켰다. 유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다. 형질전환체를, 바실러스 서브틸리스가 외인성 락토스의 존재하에서 6'-시알릴락토스를 생산할 수 있게 하는 조건하에서 배양하였다.
실시예 5: 3'-시알릴락토스의 생산을 위한 바실러스 서브틸리스 균주의 구성
바실러스 서브틸리스(표 1)의 대사 공학을, 이종 유전자 캄필로박터 제주니 neuA, 이. 콜라이 nanT 및 헤모필루스 파라헤모리티쿠스 siaT의 통합 및 상동성 재조합에 의한 내인성 유전자 ganA의 동시 결실에 의해 성취하였다. 갈락탄 오페론내에 위치한 바실러스 서브틸리스 유전자 ganA(yvfN, lacA)는 베타-갈락토시다제를 암호화한다.
외인성 시알산/N-아세틸뉴라민산 및 락토스로부터 3'-시알릴락토스의 생산을 위해서, neuA, nanT 및 siaT의 개방 판독 프레임을 오페론으로서 바실러스 서브틸리스 구성적 프로모터 P43(iGem 부분 기탁소: 서열 ID: BBa_K143013)에 작동적으로 연결하였다. 이를 위해서, 먼저 유전자 neuA, nanT 및 siaT를 바실러스 서브틸리스에서의 발현을 위해 코돈-최적화하고 GenScript Corp에 의해 합성적으로 제조하였다. 캄필로박터 제주니 유전자 neuA(UniProtKB 수탁번호: Q93MP7)는 CMP-Neu5Ac 신시타제를 암호화하고, 이. 콜라이 유전자 nanT(UniProtKB 수탁번호: NP_417691.4)는 시알산 수송체를 암호화하고, 헤모필루스 파라헤모리티쿠스 유전자 siaT(UniProtKB 수탁번호: I3DHL4)는 알파-N-아세틸글루코스아미닐-2,3-베타-갈락토실-1,3-N-아세틸갈락토스아미니드 6-알파-시알릴트랜스퍼라제(알파-2,3-시알릴트랜스퍼라제)를 암호화한다.
발현 카세트내의 각 유전자를 바실러스 서브틸리스 RBS 서열에 연결하였다. 추가로, iGem 파트 기탁소(서열 ID: BBa_B0015)로부터의 적합한 바실러스 서브틸리스 종결자 서열을 발현 카세트의 하류에 놓았다.
클로닝 벡터 pBR322(New England Biolabs GmbH, Frankfurt, Germany)를 플라스미드 주쇄로서 사용하였다. 완전한 통합 카세트를 조립하여 자살 플라스미드 <pBR322 측면인접 ganA 위-P43-siaT-neuA-nanT-종결자-erm-측면인접 ganA 아래>(서열번호 4)를 생성시켰다. 그 후에, 바실러스 서브틸리스를 이의 고유 수용능력에 의해 이 플라스미드로 형질전환시켰다. 세포를 적합한 항생제(5 ㎍ ㎖-1 에리쓰로마이신)를 함유하는 2x YT 아가 플레이트상에 스프레딩하였다. 발현 카세트 <P43-siaT-NeuA-nanT-종결자>의 바실러스 서브틸리스 게놈의 ganA 유전자좌내로의 통합은 균주 A를 생성시켰으며, 이를 콜로니 PCR에 의해 확인하였다. 유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다.
바실러스 세포내로의 외인성 락토스의 수입을 위해서, 이. 콜라이 유전자 lacY를 바실러스 서브틸리스 게놈(알파-아밀라제를 암호화하는)의 내인성 amyE(amyA) 유전자좌에 통합시켰다. 이를 위해서, 락토스 퍼미아제를 암호화하는 이. 콜라이 lacY 유전자(Gen Bank 수탁번호: NP_414877.1)의 개방 판독 프레임을 염색체 DNA로부터 PCR에 의해 증폭시켰다. 통합 카세트 <측면인접 amyE 위-lox71-aad9-lox66-P43-lacY-측면인접 amyE 아래>(서열번호 5)를 구성하고 pBR322(New England Biolabs GmbH, Frankfurt, Germany)내로 클로닝하였다. 균주 A를 생성되는 자살 플라스미드로 고유 수용능력에 의해 형질전환시켰다. 발현 카세트 <P43-lacY>의 균주 A의 amyE 유전자좌내로의 통합은 균주 B를 생성시켰으며, 이를 콜로니 PCR에 의해 확인하였다.
유전자 발현을 표적화된 프로테오믹스 및/또는 실시간 PCR에 의해 확인하였다. 균주 B를, 바실러스 서브틸리스가 외인성 락토스 및 시알산/N-아세틸뉴라민산의 존재하에서 3'-시알릴락토스를 생산할 수 있게 하는 조건하에서 배양하였다.
실시예 6: 대사적으로 조작된 바실러스 서브틸리스 균주를 사용하는 시알릴락토스의 생산
전배양물에, 시알릴락토스의 생합성에 적합한 대사 조작된 바실러스 서브틸리스 균주를 접종하였다(실시예 2-5에 기재된 바와 같이).
전배양물을 30-37℃에서 밤새 배양하고 이어서 신선한 주 배양 배지에서 약 0.1의 출발 OD600으로 희석하였다. 주 배양물이 대략 0.5의 OD600에 도달했을 때, 2 mM 락토스를 생육 배지에 가하였다. 유도성 프로모터 Pgrac100을 유전자 발현에 사용했을 때, 유도를 락토스(2 mM) 또는 락토스(2 mM) 및 IPTG(1 mM) 모두로 수행하였다. CMP-N-아세틸뉴라민산의 회수 생합성을 위해서, 추가로 2 mM 시알산/N-아세틸뉴라민산을 가하였다. 유도 후 약 24h/48h 후에 배양을 중단하고 세포내 및 세포외 시알릴락토스를 박층 크로마토그래피 및/또는 HPLC 및/또는 질량 분광분석에 의해 분석하였다(WO 2017/042382 A 또는 WO 2019/008133 A에 기재된 바와 같이). 상당량의 시알릴락토스(3'-시알릴락토스/6'-시알릴락토스)의 생합성을 검출할 수 있었다.
SEQUENCE LISTING
<110> Jennewein Biotechnologie GmbH
<120> Production of sialylated oligosaccharides in Bacillus cells
<130> P 1906 WO
<160> 5
<170> PatentIn version 3.5
<210> 1
<211> 13121
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression plasmid
<400> 1
ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa 60
tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa 120
gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat 180
aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt 240
tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat 300
ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag 360
gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt 420
ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt 480
tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc 540
cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga 600
aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa 660
tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct 720
cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa 780
tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc 840
ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat 900
ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa 960
aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct 1020
tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact 1080
atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 1140
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 1200
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc 1260
gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 1320
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 1380
attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt 1440
caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg 1500
aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc 1560
gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat 1620
tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt 1680
cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc 1740
tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc 1800
cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag 1860
atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt 1920
ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat 1980
ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag 2040
attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac 2100
gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg 2160
cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg 2220
tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt 2280
tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc 2340
ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt 2400
gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatg 2460
gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca 2520
aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt 2580
ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag 2640
gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa 2700
gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa 2760
acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg 2820
tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg 2880
cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa 2940
tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca 3000
tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac 3060
tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagaagata 3120
tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac 3180
atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca 3240
ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa 3300
caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga 3360
aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg 3420
gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca 3480
gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat 3540
cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac 3600
aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg 3660
aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag 3720
cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt 3780
taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt 3840
ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa 3900
attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg 3960
gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact 4020
acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat 4080
atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg 4140
cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa 4200
ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc 4260
tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa 4320
tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg 4380
aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg 4440
tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc 4500
agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc 4560
ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct 4620
ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca 4680
tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg 4740
gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag 4800
ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata 4860
gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga 4920
aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg 4980
cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc 5040
ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct 5100
caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa 5160
gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga 5220
aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa 5280
acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta 5340
gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt 5400
tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat 5460
atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat 5520
ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt 5580
gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg 5640
aggacaaaca tggataaatt tgctgaacat gaaattccga aagctgttat cgtggccggc 5700
aacggagaat ctctttcaca aatcgattac agactgcttc cgaaaaacta tgatgtcttt 5760
agatgcaacc agttttactt tgaagaacgc tattttcttg gcaacaaaat caaagcagtt 5820
ttctttacac cgggagtgtt tttagaacaa tactacacac tgtaccatct taaacgcaac 5880
aacgaatact ttgtcgataa cgttatcctg tcatcattta accatccgac agttgatctg 5940
gaaaaatcac aaaaaatcca ggctctgttt attgatgtga tcaacggcta cgaaaaatac 6000
ctgtctaaac tgacagcctt tgatgtttat ctgagataca aagaacttta cgaaaaccaa 6060
cgcattacat caggagtgta tatgtgcgcc gtcgcaatcg cgatgggcta tacagatatt 6120
taccttacag gaatcgattt ttatcaggca agcgaagaaa actacgcgtt tgataacaaa 6180
aaaccgaaca tcatcagatt actgccggat tttcgcaaag aaaaaacatt attttcatat 6240
catagcaaag atattgatct tgaagcatta tcttttctgc aacagcatta ccatgttaac 6300
ttttacagca tttctccgat gtctccgctg tcaaaacatt ttccgatccc gacagtggaa 6360
gatgattgtg aaacaacatt tgtcgcgccg ctgaaagaaa actacatcaa cgatattctt 6420
ttaccgccgc attttgtcta tgaaaaactt ggcgttgata aacttgcagc ggctttagaa 6480
catcatcatc atcatcatta aagtgatagc ggtaccatta taggtaagag aggaatgtac 6540
acatgtacta tttaaaaaac acaaactttt ggatgttcgg tttattcttt ttcttttact 6600
tttttatcat gggagcctac ttcccgtttt tcccgatttg gctacatgac atcaaccata 6660
tcagcaaaag tgatacgggt attatttttg ccgctatttc tctgttctcg ctattattcc 6720
aaccgctgtt tggtctgctt tctgacaaac tcgggctgcg caaatacctg ctgtggatta 6780
ttaccggcat gttagtgatg tttgcgccgt tctttatttt tatcttcggg ccactgttac 6840
aatacaacat tttagtagga tcgattgttg gtggtattta tctaggcttt tgttttaacg 6900
ccggtgcgcc agcagtagag gcatttattg agaaagtcag ccgtcgcagt aatttcgaat 6960
ttggtcgcgc gcggatgttt ggctgtgttg gctgggcgct gtgtgcctcg attgtcggca 7020
tcatgttcac catcaataat cagtttgttt tctggctggg ctctggctgt gcactcatcc 7080
tcgccgtttt actctttttc gccaaaacgg atgcgccctc ttctgccacg gttgccaatg 7140
cggtaggtgc caaccattcg gcatttagcc ttaagctggc actggaactg ttcagacagc 7200
caaaactgtg gtttttgtca ctgtatgtta ttggcgtttc ctgcacctac gatgtttttg 7260
accaacagtt tgctaatttc tttacttcgt tctttgctac cggtgaacag ggtacgcggg 7320
tatttggcta cgtaacgaca atgggcgaat tacttaacgc ctcgattatg ttctttgcgc 7380
cactgatcat taatcgcatc ggtgggaaaa acgccctgct gctggctggc actattatgt 7440
ctgtacgtat tattggctca tcgttcgcca cctcagcgct ggaagtggtt attctgaaaa 7500
cgctgcatat gtttgaagta ccgttcctgc tggtgggctg ctttaaatat attaccagcc 7560
agtttgaagt gcgtttttca gcgacgattt atctggtctg tttctgcttc tttaagcaac 7620
tggcgatgat ttttatgtct gtactggcgg gcaatatgta tgaaagcatc ggtttccagg 7680
gcgcttatct ggtgctgggt ctggtggcgc tgggcttcac cttaatttcc gtgttcacgc 7740
ttagcggccc cggcccgctt tccctgctgc gtcgtcaggt gaatgaagtc gcttaaggat 7800
ccatgtctag agtcgacgtc cccggggcag cccgcctaat gagcgggctt ttttcacgtc 7860
ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 7920
gtttgtcggt gaacgctctc tactagagtc acactggctc accttcgggt gggcctttct 7980
gcgtttatac ccggggcagc ccgcctaatg agcgggcttt tttcacgtca cgcgtccatg 8040
gagatctttg tctgcaactg aaaagtttat accttacctg gaacaaatgg ttgaaacata 8100
cgaggctaat atcggcttat taggaatagt ccctgtacta ataaaatcag gtggatcagt 8160
tgatcagtat attttggacg aagctcggaa agaatttgga gatgacttgc ttaattccac 8220
aattaaatta agggaaagaa taaagcgatt tgatgttcaa ggaatcacgg aagaagatac 8280
tcatgataaa gaagctctaa aactattcaa taaccttaca atggaattga tcgaaagggt 8340
ggaaggttaa tggtacgaaa attaggggat ctacctagaa agccacaagg cgataggtca 8400
agcttaaaga acccttacat ggatcttaca gattctgaaa gtaaagaaac aacagaggtt 8460
aaacaaacag aaccaaaaag aaaaaaagca ttgttgaaaa caatgaaagt tgatgtttca 8520
atccataata agattaaatc gctgcacgaa attctggcag catccgaagg gaattcatat 8580
tacttagagg atactattga gagagctatt gataagatgg ttgagacatt acctgagagc 8640
caaaaaactt tttatgaata tgaattaaaa aaaagaacca acaaaggctg agacagactc 8700
caaacgagtc tgttttttta aaaaaaatat taggagcatt gaatatatat tagagaatta 8760
agaaagacat gggaataaaa atattttaaa tccagtaaaa atatgataag attatttcag 8820
aatatgaaga actctgtttg tttttgatga aaaaacaaac aaaaaaaatc cacctaacgg 8880
aatctcaatt taactaacag cggccaaact gagaagttaa atttgagaag gggaaaaggc 8940
ggatttatac ttgtatttaa ctatctccat tttaacattt tattaaaccc catacaagtg 9000
aaaatcctct tttacactgt tcctttaggt gatcgcggag ggacattatg agtgaagtaa 9060
acctaaaagg aaatacagat gaattagtgt attatcgaca gcaaaccact ggaaataaaa 9120
tcgccaggaa gagaatcaaa aaagggaaag aagaagttta ttatgttgct gaaacggaag 9180
agaagatatg gacagaagag caaataaaaa acttttcttt agacaaattt ggtacgcata 9240
taccttacat agaaggtcat tatacaatct taaataatta cttctttgat ttttggggct 9300
attttttagg tgctgaagga attgcgctct atgctcacct aactcgttat gcatacggca 9360
gcaaagactt ttgctttcct agtctacaaa caatcgctaa aaaaatggac aagactcctg 9420
ttacagttag aggctacttg aaactgcttg aaaggtacgg ttttatttgg aaggtaaacg 9480
tccgtaataa aaccaaggat aacacagagg aatccccgat ttttaagatt agacgtaagg 9540
ttcctttgct ttcagaagaa cttttaaatg gaaaccctaa tattgaaatt ccagatgacg 9600
aggaagcaca tgtaaagaag gctttaaaaa aggaaaaaga gggtcttcca aaggttttga 9660
aaaaagagca cgatgaattt gttaaaaaaa tgatggatga gtcagaaaca attaatattc 9720
cagaggcctt acaatatgac acaatgtatg aagatatact cagtaaagga gaaattcgaa 9780
aagaaatcaa aaaacaaata cctaatccta caacatcttt tgagagtata tcaatgacaa 9840
ctgaagagga aaaagtcgac agtactttaa aaagcgaaat gcaaaatcgt gtctctaagc 9900
cttcttttga tacctggttt aaaaacacta agatcaaaat tgaaaataaa aattgtttat 9960
tacttgtacc gagtgaattt gcatttgaat ggattaagaa aagatattta gaaacaatta 10020
aaacagtcct tgaagaagct ggatatgttt tcgaaaaaat cgaactaaga aaagtgcaat 10080
aaactgctga agtatttcag cagttttttt tatttagaaa tagtgaaaaa aatataatca 10140
gggaggtatc aatatttaat gagtactgat ttaaatttat ttagactgga attaataatt 10200
aacacgtaga ctaattaaaa tttaatgagg gataaagagg atacaaaaat attaatttca 10260
atccctatta aattttaaca agggggggat taaaatttaa ttagaggttt atccacaaga 10320
aaagacccta ataaaatttt tactagggtt ataacactga ttaatttctt aatgggggag 10380
ggattaaaat ttaatgacaa agaaaacaat cttttaagaa aagcttttaa aagataataa 10440
taaaaagagc tttgcgatta agcaaaactc tttacttttt cattgacatt atcaaattca 10500
tcgatttcaa attgttgttg tatcataaag ttaattctgt tttgcacaac cttttcagga 10560
atataaaaca catctgaggc ttgttttata aactcagggt cgctaaagtc aatgtaacgt 10620
agcatatgat atggtatagc ttccacccaa gttagccttt ctgcttcttc tgaatgtttt 10680
tcatatactt ccatgggtat ctctaaatga ttttcctcat gtagcaaggt atgagcaaaa 10740
agtttatgga attgatagtt cctctctttt tcttcaactt ttttatctaa aacaaacact 10800
ttaacatctg agtcaatgta agcataagat gtttttccag tcataatttc aatcccaaat 10860
cttttagaca gaaattctgg acgtaaatct tttggtgaaa gaattttttt atgtagcaat 10920
atatccgata cagcaccttc taaaagcgtt ggtgaatagg gcattttacc tatctcctct 10980
cattttgtgg aataaaaata gtcatattcg tccatctacc tatcctatta tcgaacagtt 11040
gaacttttta atcaaggatc agtccttttt ttcattattc ttaaactgtg ctcttaactt 11100
taacaactcg atttgttttt ccagatctcg agggtaacta gcctcgccga tcccgcaaga 11160
ggcccggcag tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 11220
tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 11280
ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 11340
ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 11400
tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 11460
gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 11520
gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 11580
acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 11640
tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 11700
caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 11760
gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 11820
cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 11880
tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 11940
agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 12000
tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 12060
ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 12120
acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 12180
ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 12240
gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 12300
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 12360
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 12420
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 12480
ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 12540
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 12600
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 12660
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 12720
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 12780
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 12840
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 12900
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 12960
ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 13020
tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 13080
gtcagtgagc gaggaagcgg aagagcgccc aatacgcatg c 13121
<210> 2
<211> 11125
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 2
ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa 60
tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa 120
gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat 180
aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt 240
tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat 300
ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag 360
gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt 420
ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt 480
tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc 540
cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga 600
aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa 660
tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct 720
cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa 780
tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc 840
ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat 900
ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa 960
aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct 1020
tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact 1080
atggcgtgct gctagcattt tacattttta gaaatgggcg tgaaaaaaag cgcgcgatta 1140
tgtaaaatat aaagattaac taataaggag gacaaacatg aaagaaatca aaatccaaaa 1200
catcatcatc agcgaagaaa aagcgccgct ggttgtgccg gaaatcggca ttaatcataa 1260
cggatcttta gaactggcta aaatcatggt tgatgcagcg ttttcagctg gagccaaaat 1320
catcaaacat caaacacata tcgtcgaaga tgaaatgagc aaagctgcaa agaaagttat 1380
cccgggcaac gctaaaatct ctatctacga aatcatgcag aaatgcgctt tagattacaa 1440
agatgaactt gccctgaaag aatacacaga aaaactggga cttgtgtatc ttagcacacc 1500
gttttcaaga gcaggcgcga atcgcttaga agatatggga gtctctgcat ttaaaatcgg 1560
ctcaggagaa tgtaataact atccgctgat caaacatatt gcagcgttta aaaaaccgat 1620
gattgtgtct acaggcatga actcaatcga aagcattaaa ccgacagtga aaatcctgct 1680
tgataacgaa atcccgtttg tcctgatgca tacaacaaac ctgtatccga caccgcataa 1740
tcttgttaga ttaaacgcca tgctggaact gaagaaagaa tttagctgca tggtgggact 1800
ttctgatcat acaacagata atctggcatg ccttggcgcg gtcgttcttg gagcgtgtgt 1860
cttagaaaga cattttacag attcaatgca tcgcagcgga ccggatattg tttgttctat 1920
ggatacaaaa gccttaaaag aactgatcat tcaatcagaa cagatggcaa tcattcgcgg 1980
caataacgaa tcaaagaaag cagccaaaca agaacaggtt acaatcgatt ttgcttttgc 2040
ctctgtggtc tcaatcaaag atattaagaa aggcgaagtt ctgtcaatgg ataatatttg 2100
ggtgaaaaga ccgggacttg gcggaatcag cgcagcggaa tttgaaaata ttctgggcaa 2160
gaaagcactg cgcgatattg aaaacgatgc gcagttaagc tatgaagatt ttgcttaagc 2220
tcttaaggag gattttagaa tgaagaaaat tctgtttatc acaggctcaa gagcggatta 2280
ctctaaaatc aaatcactta tgtaccgcgt ccaaaattca agcgaatttg aactttacat 2340
ctttgctaca ggcatgcatc tgagcaaaaa ctttggatac acagttaaag aattatataa 2400
aaatggcttt aaaaacatct acgaatttat caactacgat aaatattatc agacagataa 2460
agccctggca acaacaattg atggattttc aagatatgcg aacgaattaa aaccggatct 2520
gattgttgtg catggcgatc gcatcgaacc gcttgcagcg gctattgtcg gagcccttaa 2580
caacatcctg gttgcacata tcgaaggcgg agaaattagc ggaacaatcg atgattcttt 2640
aagacatgcg atttcaaaac ttgctcatat ccatctggtg aacgatgaat ttgcaaaaag 2700
acgccttatg caattaggcg aagatgaaaa atcaatcttt atcatcggat ctccggatct 2760
ggaactgctt aacgataaca aaatctcact tagcgaagcc aaaaaatact acgatattaa 2820
ctacgaaaac tatgcattac tgatgtttca tccggtcaca acagaaatca catctatcaa 2880
aaaccaagcc gataacctgg tgaaagcact tatccagtca aacaaaaact acatcgtcat 2940
ctatccgaat aacgatctgg gctttgaact gatccttcag agctatgaag aatttaaaaa 3000
caacccgaga tttaaactgt ttccgtctct gcgctttgaa tactttatca cacttctgaa 3060
aaacgccgat tttattatcg gaaactcttc atgcatcctg aaagaagcgt tatacctgaa 3120
aacagctggc attctggttg gatcaagaca aaatggccgc ttaggaaatg aaaacacact 3180
gaaagtgaat gcgaacagcg atgaaatcct taaagctatc aacacaatcc ataaaaaaca 3240
ggatttattt tctgctaaac tggaaattct tgatagctct aaactgtttt tcgaatatct 3300
tcaatcaggc gatttcttta aacttagcac acagaaagtt tttaaagata ttaaataaaa 3360
aggaggaact actatgtcac ttgcaattat cccggcgaga ggcggaagca aaggcatcaa 3420
aaacaaaaac ctggttctgc ttaacaacaa accgcttatc tactacacaa tcaaagcagc 3480
gctgaatgct aaatctattt caaaagttgt ggtctcaagc gatagcgatg aaatccttaa 3540
ctacgccaaa tctcaaaacg tggatattct gaaaagaccg atctctcttg cacaggatga 3600
tacaacatca gataaagtct tactgcatgc gctgaaattt tacaaagatt acgaagatgt 3660
tgtgttttta caaccgacat ctccgctgcg cacaaacatt catatcaacg aagcatttaa 3720
cctgtacaaa aattcaaacg ctaatgccct gattagcgtc tctgaatgcg ataacaaaat 3780
ccttaaagca tttgtttgca acgattgtgg cgatttagcc ggaatttgta atgatgaata 3840
tccgtttatg ccgcgccaga aactgccgaa aacatatatg agcaacggag cgatctacat 3900
ccttaaaatc aaagaatttc tgaacaaccc gtcatttctg caaagcaaaa caaaacattt 3960
tcttatggat gaatcatcat cactggatat tgattgcctg gaagatttaa agaaagttga 4020
acaaatttgg aaaaaataaa gtcaatgtat gaatggatac gggatatgaa tcaataagta 4080
cgtgaaagag aaaagcaacc cagatatgat agggaacttt tctctttctt gttttacatt 4140
gaatctttac aatcctattg atataatcta agctagtgta ttttgcgttt aatagtggag 4200
aaaagctagc gattaactaa taaggaggac aaacatggat aaatttgctg aacatgaaat 4260
tccgaaagct gttatcgtgg ccggcaacgg agaatctctt tcacaaatcg attacagact 4320
gcttccgaaa aactatgatg tctttagatg caaccagttt tactttgaag aacgctattt 4380
tcttggcaac aaaatcaaag cagttttctt tacaccggga gtgtttttag aacaatacta 4440
cacactgtac catcttaaac gcaacaacga atactttgtc gataacgtta tcctgtcatc 4500
atttaaccat ccgacagttg atctggaaaa atcacaaaaa atccaggctc tgtttattga 4560
tgtgatcaac ggctacgaaa aatacctgtc taaactgaca gcctttgatg tttatctgag 4620
atacaaagaa ctttacgaaa accaacgcat tacatcagga gtgtatatgt gcgccgtcgc 4680
aatcgcgatg ggctatacag atatttacct tacaggaatc gatttttatc aggcaagcga 4740
agaaaactac gcgtttgata acaaaaaacc gaacatcatc agattactgc cggattttcg 4800
caaagaaaaa acattatttt catatcatag caaagatatt gatcttgaag cattatcttt 4860
tctgcaacag cattaccatg ttaactttta cagcatttct ccgatgtctc cgctgtcaaa 4920
acattttccg atcccgacag tggaagatga ttgtgaaaca acatttgtcg cgccgctgaa 4980
agaaaactac atcaacgata ttcttttacc gccgcatttt gtctatgaaa aacttggcgt 5040
tgataaactt gcagcggctt tagaacatca tcatcatcat cattaaagtg atagcggtac 5100
cattataggt aagagaggaa tgtacacatg tactatttaa aaaacacaaa cttttggatg 5160
ttcggtttat tctttttctt ttactttttt atcatgggag cctacttccc gtttttcccg 5220
atttggctac atgacatcaa ccatatcagc aaaagtgata cgggtattat ttttgccgct 5280
atttctctgt tctcgctatt attccaaccg ctgtttggtc tgctttctga caaactcggg 5340
ctgcgcaaat acctgctgtg gattattacc ggcatgttag tgatgtttgc gccgttcttt 5400
atttttatct tcgggccact gttacaatac aacattttag taggatcgat tgttggtggt 5460
atttatctag gcttttgttt taacgccggt gcgccagcag tagaggcatt tattgagaaa 5520
gtcagccgtc gcagtaattt cgaatttggt cgcgcgcgga tgtttggctg tgttggctgg 5580
gcgctgtgtg cctcgattgt cggcatcatg ttcaccatca ataatcagtt tgttttctgg 5640
ctgggctctg gctgtgcact catcctcgcc gttttactct ttttcgccaa aacggatgcg 5700
ccctcttctg ccacggttgc caatgcggta ggtgccaacc attcggcatt tagccttaag 5760
ctggcactgg aactgttcag acagccaaaa ctgtggtttt tgtcactgta tgttattggc 5820
gtttcctgca cctacgatgt ttttgaccaa cagtttgcta atttctttac ttcgttcttt 5880
gctaccggtg aacagggtac gcgggtattt ggctacgtaa cgacaatggg cgaattactt 5940
aacgcctcga ttatgttctt tgcgccactg atcattaatc gcatcggtgg gaaaaacgcc 6000
ctgctgctgg ctggcactat tatgtctgta cgtattattg gctcatcgtt cgccacctca 6060
gcgctggaag tggttattct gaaaacgctg catatgtttg aagtaccgtt cctgctggtg 6120
ggctgcttta aatatattac cagccagttt gaagtgcgtt tttcagcgac gatttatctg 6180
gtctgtttct gcttctttaa gcaactggcg atgattttta tgtctgtact ggcgggcaat 6240
atgtatgaaa gcatcggttt ccagggcgct tatctggtgc tgggtctggt ggcgctgggc 6300
ttcaccttaa tttccgtgtt cacgcttagc ggccccggcc cgctttccct gctgcgtcgt 6360
caggtgaatg aagtcgctta aggatccatg tctagagtcg acgtccccgg ggcagcccgc 6420
ctaatgagcg ggcttttttc acgtcccagg catcaaataa aacgaaaggc tcagtcgaaa 6480
gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact 6540
ggctcacctt cgggtgggcc tttctgcgtt tatagaattc atattactta gaggatacta 6600
ttgagagagc tattgataag atggttgaga cattacctga gagccaaaaa actttttatg 6660
aatatgaatt aaaaaaaaga accaacaaag gctgagacag actccaaacg agtctgtttt 6720
tttaaaaaaa atattaggag cattgaatat atattagaga attaagaaag acatgggaat 6780
aaaaatattt taaatccagt aaaaatatga taagattatt tcagaatatg aagaactctg 6840
tttgtttttg atgaaaaaac aaacaaaaaa aatccaccta acggaatctc aatttaacta 6900
acagcggcca aactgagaag ttaaatttga gaaggggaaa aggcggattt atacttgtat 6960
ttaactatct ccattttaac attttattaa accccataca agtgaaaatc ctcttttaca 7020
ctgttccttt aggtgatcgc ggagggacat tatgagtgaa gtaaacctaa aaggaaatac 7080
agatgaatta gtgtattatc gacagcaaac cactggaaat aaaatcgcca ggaagagaat 7140
caaaaaaggg aaagaagaag tttattatgt tgctgaaacg gaagagaaga tatggacaga 7200
agagcaaata aaaaactttt ctttagacaa atttggtacg catatacctt acatagaagg 7260
tcattataca atcttaaata attacttctt tgatttttgg ggctattttt taggtgctga 7320
aggaattgcg ctctatgctc acctaactcg ttatgcatac ggcagcaaag acttttgctt 7380
tcctagtcta caaacaatcg ctaaaaaaat ggacaagact cctgttacag ttagaggcta 7440
cttgaaactg cttgaaaggt acggttttat ttggaaggta aacgtccgta ataaaaccaa 7500
ggataacaca gaggaatccc cgatttttaa gattagacgt aaggttcctt tgctttcaga 7560
agaactttta aatggaaacc ctaatattga aattccagat gacgaggaag cacatgtaaa 7620
gaaggcttta aaaaaggaaa aagagggtct tccaaaggtt ttgaaaaaag agcacgatga 7680
atttgttaaa aaaatgatgg atgagtcaga aacaattaat attccagagg ccttacaata 7740
tgacacaatg tatgaagata tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca 7800
aatacctaat cctacaacat cttttgagag tatatcaatg acaactgaag aggaaaaagt 7860
cgacagtact ttaaaaagcg aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg 7920
gtttaaaaac actaagatca aaattgaaaa taaaaattgt ttattacttg taccgagtga 7980
atttgcattt gaatggatta agaaaagata tttagaaaca attaaaacag tccttgaaga 8040
agctggatat gttttcgaaa aaatcgaact aagaaaagtg caataaactg ctgaagtatt 8100
tcagcagttt tttttattta gaaatagtga aaaaaatata atcagggagg tatcaatatt 8160
taatgagtac tgatttaaat ttatttagac tggaattaat aattaacacg tagactaatt 8220
aaaatttaat gagggataaa gaggatacaa aaatattaat ttcaatccct attaaatttt 8280
aacaaggggg ggattaaaat ttaattagag gtttatccac aagaaaagac cctaataaaa 8340
tttttactag ggttataaca ctgattaatt tcttaatggg ggagggatta aaatttaatg 8400
acaaagaaaa caatctttta agaaaagctt ttaaaagata ataataaaaa gagctttgcg 8460
attaagcaaa actctttact ttttcattga cattatcaaa ttcatcgatt tcaaattgtt 8520
gttgtatcat aaagttaatt ctgttttgca caaccttttc aggaatataa aacacatctg 8580
aggcttgttt tataaactca gggtcgctaa agtcaatgta acgtagcata tgatatggta 8640
tagcttccac ccaagttagc ctttctgctt cttctgaatg tttttcatat acttccatgg 8700
gtatctctaa atgattttcc tcatgtagca aggtatgagc aaaaagttta tggaattgat 8760
agttcctctc tttttcttca acttttttat ctaaaacaaa cactttaaca tctgagtcaa 8820
tgtaagcata agatgttttt ccagtcataa tttcaatccc aaatctttta gacagaaatt 8880
ctggacgtaa atcttttggt gaaagaattt ttttatgtag caatatatcc gatacagcac 8940
cttctaaaag cgttggtgaa tagggcattt tacctatctc ctctcatttt gtggaataaa 9000
aatagtcata ttcgtccatc tacctatcct attatcgaac agttgaactt tttaatcaag 9060
gatcagtcct ttttttcatt attcttaaac tgtgctctta actttaacaa ctcgatttgt 9120
ttttccagat ctcgagggta actagcctcg ccgatcccgc aagaggcccg gcagtcaggt 9180
ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca 9240
aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg 9300
aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc 9360
cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg 9420
ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt 9480
cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta 9540
ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat 9600
gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga 9660
gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca 9720
acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact 9780
cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc 9840
acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact 9900
ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt 9960
ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt 10020
gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt 10080
atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata 10140
ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag 10200
attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat 10260
ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 10320
aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 10380
aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 10440
ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg 10500
tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 10560
ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 10620
cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 10680
agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 10740
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 10800
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 10860
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 10920
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 10980
cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 11040
tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 11100
gcggaagagc gcccaatacg catgc 11125
<210> 3
<211> 13805
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression plasmid
<400> 3
ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa 60
tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa 120
gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat 180
aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt 240
tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat 300
ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag 360
gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt 420
ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt 480
tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc 540
cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga 600
aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa 660
tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct 720
cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa 780
tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc 840
ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat 900
ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa 960
aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct 1020
tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact 1080
atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 1140
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 1200
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc 1260
gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 1320
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 1380
attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt 1440
caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg 1500
aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc 1560
gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat 1620
tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt 1680
cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc 1740
tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc 1800
cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag 1860
atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt 1920
ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat 1980
ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag 2040
attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac 2100
gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg 2160
cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg 2220
tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt 2280
tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc 2340
ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt 2400
gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatg 2460
gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca 2520
aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt 2580
ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag 2640
gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa 2700
gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa 2760
acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg 2820
tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg 2880
cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa 2940
tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca 3000
tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac 3060
tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagaagata 3120
tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac 3180
atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca 3240
ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa 3300
caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga 3360
aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg 3420
gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca 3480
gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat 3540
cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac 3600
aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg 3660
aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag 3720
cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt 3780
taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt 3840
ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa 3900
attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg 3960
gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact 4020
acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat 4080
atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg 4140
cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa 4200
ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc 4260
tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa 4320
tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg 4380
aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg 4440
tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc 4500
agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc 4560
ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct 4620
ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca 4680
tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg 4740
gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag 4800
ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata 4860
gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga 4920
aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg 4980
cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc 5040
ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct 5100
caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa 5160
gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga 5220
aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa 5280
acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta 5340
gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt 5400
tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat 5460
atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat 5520
ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt 5580
gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg 5640
aggacaaaca tgaaaagaat cttttgcctt gtgtctgcaa tcctgctttc agcgtgtaat 5700
gataaccaga atacagtcga tgttgtggtc tcaacagtga acgataacgt catcgaaaac 5760
aacacatacc aggtcaaacc gatcgataca ccgacaacat ttgatagcta ttcttggatt 5820
caaacatgcg gcacaccgat ccttaaagat gatgaaaaat actcactgtc atttgatttt 5880
gttgctccgg aattagatca ggatgaaaaa ttttgttttg aatttacagg cgatgttgat 5940
ggaaaacgct atgtgacaca aacaaatctg acagttgtgg caccgacact tgaagtgtat 6000
gtcgatcatg cgagcctgcc gtctcttcaa cagctgatga aaatcatcca acagaaaaac 6060
gaatactctc agaacgaaag atttatctca tggggccgca tcggacttac agaagataac 6120
gctgaaaaac tgaatgccca tatttatccg ctggctggaa ataacacatc tcaagaatta 6180
gtcgatgcag ttatcgatta cgcggattca aaaaacagac tgaatctgga acttaacaca 6240
aacacagctc atagctttcc gaacttagcc ccgattctgc gcattatctc aagcaaaagc 6300
aacatcctga tctctaacat caacctttac gatgatggct cagccgaata cgtgaacctg 6360
tacaactgga aagatacaga agataaaagc gtcaaactgt ctgattcatt tttagttctg 6420
aaagattact ttaatggaat ttcttcagaa aaaccgagcg gcatctatgg aagatataac 6480
tggcatcagc tgtacaacac atcttactat tttctgagaa aagattatct gacagtcgaa 6540
ccgcaactgc atgatcttcg cgaatatctt ggcggatcat taaaacagat gagctgggat 6600
ggcttttcac aactgagcaa aggagataaa gaactgtttc tgaacattgt tggctttgat 6660
caagaaaaac tgcaacagga atatcaacag agcgaacttc cgaattttgt gtttacagga 6720
acaacaacat gggcaggcgg agaaacaaaa gaatattatg cgcaacagca agttaacgtc 6780
gttaacaacg caatcaacga aacatctccg tactacctgg gcagagaaca tgatcttttc 6840
tttaaaggac atccgcgcgg cggaattatc aatgatatta tcctgggctc atttaataac 6900
atgattgata ttccggcgaa agttagcttt gaagtgctta tgatgacagg aatgttaccg 6960
gatacagtgg gcggaattgc atcatcactg tattttagca tcccggccga aaaagtctct 7020
tttatcgttt ttacatcaag cgatacaatc acagatcgcg aagatgctct gaaatctccg 7080
cttgttcagg tgatgatgac actgggcatt gtgaaagaaa aagatgtcct gttttggtca 7140
gatttaccgg attgctcttc aggagtttgt attgcccaat attaaagtga tagcggtacc 7200
attataggta agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt 7260
tcggtttatt ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga 7320
tttggctaca tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta 7380
tttctctgtt ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc 7440
tgcgcaaata cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta 7500
tttttatctt cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta 7560
tttatctagg cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag 7620
tcagccgtcg cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg 7680
cgctgtgtgc ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc 7740
tgggctctgg ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc 7800
cctcttctgc cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc 7860
tggcactgga actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg 7920
tttcctgcac ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg 7980
ctaccggtga acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta 8040
acgcctcgat tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc 8100
tgctgctggc tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag 8160
cgctggaagt ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg 8220
gctgctttaa atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg 8280
tctgtttctg cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata 8340
tgtatgaaag catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct 8400
tcaccttaat ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc 8460
aggtgaatga agtcgcttaa ggatccatgt ctagagtcga cgtccccggg gcagcccgcc 8520
taatgagcgg gcttttttca cgtcccaggc atcaaataaa acgaaaggct cagtcgaaag 8580
actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag agtcacactg 8640
gctcaccttc gggtgggcct ttctgcgttt atacccgggg cagcccgcct aatgagcggg 8700
cttttttcac gtcacgcgtc catggagatc tttgtctgca actgaaaagt ttatacctta 8760
cctggaacaa atggttgaaa catacgaggc taatatcggc ttattaggaa tagtccctgt 8820
actaataaaa tcaggtggat cagttgatca gtatattttg gacgaagctc ggaaagaatt 8880
tggagatgac ttgcttaatt ccacaattaa attaagggaa agaataaagc gatttgatgt 8940
tcaaggaatc acggaagaag atactcatga taaagaagct ctaaaactat tcaataacct 9000
tacaatggaa ttgatcgaaa gggtggaagg ttaatggtac gaaaattagg ggatctacct 9060
agaaagccac aaggcgatag gtcaagctta aagaaccctt acatggatct tacagattct 9120
gaaagtaaag aaacaacaga ggttaaacaa acagaaccaa aaagaaaaaa agcattgttg 9180
aaaacaatga aagttgatgt ttcaatccat aataagatta aatcgctgca cgaaattctg 9240
gcagcatccg aagggaattc atattactta gaggatacta ttgagagagc tattgataag 9300
atggttgaga cattacctga gagccaaaaa actttttatg aatatgaatt aaaaaaaaga 9360
accaacaaag gctgagacag actccaaacg agtctgtttt tttaaaaaaa atattaggag 9420
cattgaatat atattagaga attaagaaag acatgggaat aaaaatattt taaatccagt 9480
aaaaatatga taagattatt tcagaatatg aagaactctg tttgtttttg atgaaaaaac 9540
aaacaaaaaa aatccaccta acggaatctc aatttaacta acagcggcca aactgagaag 9600
ttaaatttga gaaggggaaa aggcggattt atacttgtat ttaactatct ccattttaac 9660
attttattaa accccataca agtgaaaatc ctcttttaca ctgttccttt aggtgatcgc 9720
ggagggacat tatgagtgaa gtaaacctaa aaggaaatac agatgaatta gtgtattatc 9780
gacagcaaac cactggaaat aaaatcgcca ggaagagaat caaaaaaggg aaagaagaag 9840
tttattatgt tgctgaaacg gaagagaaga tatggacaga agagcaaata aaaaactttt 9900
ctttagacaa atttggtacg catatacctt acatagaagg tcattataca atcttaaata 9960
attacttctt tgatttttgg ggctattttt taggtgctga aggaattgcg ctctatgctc 10020
acctaactcg ttatgcatac ggcagcaaag acttttgctt tcctagtcta caaacaatcg 10080
ctaaaaaaat ggacaagact cctgttacag ttagaggcta cttgaaactg cttgaaaggt 10140
acggttttat ttggaaggta aacgtccgta ataaaaccaa ggataacaca gaggaatccc 10200
cgatttttaa gattagacgt aaggttcctt tgctttcaga agaactttta aatggaaacc 10260
ctaatattga aattccagat gacgaggaag cacatgtaaa gaaggcttta aaaaaggaaa 10320
aagagggtct tccaaaggtt ttgaaaaaag agcacgatga atttgttaaa aaaatgatgg 10380
atgagtcaga aacaattaat attccagagg ccttacaata tgacacaatg tatgaagata 10440
tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca aatacctaat cctacaacat 10500
cttttgagag tatatcaatg acaactgaag aggaaaaagt cgacagtact ttaaaaagcg 10560
aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg gtttaaaaac actaagatca 10620
aaattgaaaa taaaaattgt ttattacttg taccgagtga atttgcattt gaatggatta 10680
agaaaagata tttagaaaca attaaaacag tccttgaaga agctggatat gttttcgaaa 10740
aaatcgaact aagaaaagtg caataaactg ctgaagtatt tcagcagttt tttttattta 10800
gaaatagtga aaaaaatata atcagggagg tatcaatatt taatgagtac tgatttaaat 10860
ttatttagac tggaattaat aattaacacg tagactaatt aaaatttaat gagggataaa 10920
gaggatacaa aaatattaat ttcaatccct attaaatttt aacaaggggg ggattaaaat 10980
ttaattagag gtttatccac aagaaaagac cctaataaaa tttttactag ggttataaca 11040
ctgattaatt tcttaatggg ggagggatta aaatttaatg acaaagaaaa caatctttta 11100
agaaaagctt ttaaaagata ataataaaaa gagctttgcg attaagcaaa actctttact 11160
ttttcattga cattatcaaa ttcatcgatt tcaaattgtt gttgtatcat aaagttaatt 11220
ctgttttgca caaccttttc aggaatataa aacacatctg aggcttgttt tataaactca 11280
gggtcgctaa agtcaatgta acgtagcata tgatatggta tagcttccac ccaagttagc 11340
ctttctgctt cttctgaatg tttttcatat acttccatgg gtatctctaa atgattttcc 11400
tcatgtagca aggtatgagc aaaaagttta tggaattgat agttcctctc tttttcttca 11460
acttttttat ctaaaacaaa cactttaaca tctgagtcaa tgtaagcata agatgttttt 11520
ccagtcataa tttcaatccc aaatctttta gacagaaatt ctggacgtaa atcttttggt 11580
gaaagaattt ttttatgtag caatatatcc gatacagcac cttctaaaag cgttggtgaa 11640
tagggcattt tacctatctc ctctcatttt gtggaataaa aatagtcata ttcgtccatc 11700
tacctatcct attatcgaac agttgaactt tttaatcaag gatcagtcct ttttttcatt 11760
attcttaaac tgtgctctta actttaacaa ctcgatttgt ttttccagat ctcgagggta 11820
actagcctcg ccgatcccgc aagaggcccg gcagtcaggt ggcacttttc ggggaaatgt 11880
gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 11940
acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 12000
tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 12060
agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 12120
cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 12180
aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg 12240
gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc 12300
agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat 12360
aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga 12420
gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc 12480
ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc 12540
aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 12600
aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc 12660
tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc 12720
agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca 12780
ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca 12840
ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt 12900
ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 12960
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 13020
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 13080
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 13140
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 13200
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 13260
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 13320
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 13380
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 13440
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 13500
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 13560
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 13620
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 13680
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 13740
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg 13800
catgc 13805
<210> 4
<211> 10838
<212> DNA
<213> Artificial Sequence
<220>
<223> Suicide plasmid
<400> 4
ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa 60
ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg 120
caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt 180
gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata 240
tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg 300
ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac 360
cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac 420
aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca 480
cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg 540
actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct 600
caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat 660
gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt 720
cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct 780
ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct 840
tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa 900
acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt 960
cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc 1020
cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca 1080
tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc 1140
gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat 1200
tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg 1260
ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga 1320
attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac 1380
atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg 1440
tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg 1500
ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc 1560
tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg 1620
taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca 1680
ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga 1740
ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa 1800
cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt 1860
ttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc 1920
aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt 1980
ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac 2040
gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac 2100
ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc 2160
agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc 2220
cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg 2280
tactgagagt gcaccagcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc 2340
tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta 2400
tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct 2460
gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg 2520
aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa 2580
tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa 2640
gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc 2700
gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc 2760
ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt 2820
gaatgatgtc atgggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat 2880
accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg 2940
cggaacgaag ggctaagaga acaaggagga gaatgtgatg tcaaagcttg aaaaaacgca 3000
cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga 3060
tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt 3120
ttctgtcggc aattttacat ttttagaaat gggcgtgaaa aaaagcgcgc gattatgtaa 3180
aatataaaga ttaactaata aggaggacaa acatgacaga acagtacatc aaaaacgttg 3240
aagtgtatct tgattatgca acaatcccga cactgaacta cttttaccat tttacagaaa 3300
acaaagatga tattgcgaca attagactgt ttggccttgg acgctttaac atctctaaat 3360
caatcatcga atcatatccg gaaggcatta tcagatattg cccgattatc tttgaagatc 3420
agacagcttt tcaacagctg tttatcacac tgcttacaga agattctttt tgtcaatacc 3480
gctttaactt tcatattaac ctgtttcatt catggaaaat gcttatcccg ctgctgcata 3540
ttatctggca atttaaacat aaagtcctgg atattaaact taacttttat gatgatggct 3600
ctgaaggact ggttacactg tcaaaaatcg aacaaaacta ttcaagcgaa attcttcaga 3660
aaatcatcga tattgatagc caatcttttt acgctgataa acttagcttt ttagatgaag 3720
atattgccag atatttatgg aatagcctgt ttgaatcaca ttactatctt ttaaacgatt 3780
ttctgcttaa aaacgaaaaa ctgagcttac tgaaaaactc tatcaaatac tgccatatca 3840
tggatcttga acgctattta caatttacac aggaagaaaa agatttcttt aacgaacttc 3900
tgggcattaa catccagagc cttgaagata aaatcaaaat ctttcaacaa aagaaaacat 3960
ttatttttac aggaacaaca atcttttctc tgccgaaaga agaagaagaa acactttaca 4020
gactgcatct gaacgctatc cttaactaca tccatccgaa cggcaaatac tttatcggcg 4080
atggatttac actggtgatc aaaggacatc cgcatcaaaa agaaatgaat agcagactgg 4140
aaaaatcatt tgaaaaagcc gtcatgctgc cggataacat cccgtttgaa attctttacc 4200
tgatcggctg caaaccggat aaaattggcg gatttgtttc aacaagctac ttttcatgtg 4260
ataagaaaaa tattgcggat ctgctgttta tcagcgcgag acaggaagaa gtgcgcaaaa 4320
acgattatct ttttaacatc caataccagc tgagagatat gatgatcaaa acaggattta 4380
tccaagaaga aaaaacacat ttttacagcg atattccgat ctttatttct taaaaaggag 4440
gaactactat gtcacttgca attatcccgg cgagaggcgg aagcaaaggc atcaaaaaca 4500
aaaacctggt tctgcttaac aacaaaccgc ttatctacta cacaatcaaa gcagcgctga 4560
atgctaaatc tatttcaaaa gttgtggtct caagcgatag cgatgaaatc cttaactacg 4620
ccaaatctca aaacgtggat attctgaaaa gaccgatctc tcttgcacag gatgatacaa 4680
catcagataa agtcttactg catgcgctga aattttacaa agattacgaa gatgttgtgt 4740
ttttacaacc gacatctccg ctgcgcacaa acattcatat caacgaagca tttaacctgt 4800
acaaaaattc aaacgctaat gccctgatta gcgtctctga atgcgataac aaaatcctta 4860
aagcatttgt ttgcaacgat tgtggcgatt tagccggaat ttgtaatgat gaatatccgt 4920
ttatgccgcg ccagaaactg ccgaaaacat atatgagcaa cggagcgatc tacatcctta 4980
aaatcaaaga atttctgaac aacccgtcat ttctgcaaag caaaacaaaa cattttctta 5040
tggatgaatc atcatcactg gatattgatt gcctggaaga tttaaagaaa gttgaacaaa 5100
tttggaaaaa ataagctctt aaggaggatt ttagaatgag cacaacaaca caaaatatcc 5160
cgtggtatcg ccatcttaac agagcccagt ggcgcgcatt ttctgcagcg tggttaggct 5220
atctgcttga tggatttgat tttgttctga ttgcactggt tcttacagaa gtgcaaggcg 5280
aatttggact tacaacagtg caggctgcct ctttaatttc agcagcgttt atcagcagat 5340
ggtttggcgg attaatgctg ggcgcaatgg gagatcgcta tggaagacgc ctggcgatgg 5400
tcacatctat tgttctgttt tcagcgggca cattagcttg cggctttgcc ccgggatata 5460
ttacaatgtt tatcgcgaga cttgtgattg gcatgggaat ggcaggcgaa tatggatcaa 5520
gcgcgacgta tgttatcgaa tcttggccga aacatctgcg caataaagca tcaggatttc 5580
ttattagcgg cttttctgtg ggagcggttg tggctgccca agtctattct cttgtcgttc 5640
cggtttgggg atggagagca ctgtttttca ttggcatcct tccgattatc tttgctcttt 5700
ggttacgcaa aaatatcccg gaagccgaag attggaaaga aaaacatgcc ggaaaagcac 5760
ctgtgagaac aatggtcgat attctgtata gaggcgaaca tcgcattgct aacatcgtta 5820
tgacattagc agcggctaca gctctgtggt tttgctttgc cggaaattta caaaacgccg 5880
caatcgttgc tgtgctgggc ttactgtgtg cggctatttt tatcagcttt atggttcagt 5940
ctgccggaaa acgctggccg acaggcgtga tgttaatggt ggtcgttctg tttgcttttc 6000
tttattcatg gccgattcaa gcccttttac cgacatacct gaaaacagat ttagcttaca 6060
atccgcatac agtggccaac gtcctgtttt tctcaggctt tggagccgca gttggctgct 6120
gtgtgggcgg atttcttggc gattggttag gaacaagaaa agcgtatgtt tgttcactgc 6180
ttgcgagcca gttactgatt atcccggttt ttgcaatcgg cggagcgaat gtctgggttc 6240
ttggactttt actgtttttc caacagatgt taggccaagg aattgctggc atcttaccga 6300
aactgattgg cggatatttt gatacagatc agagagcggc tggccttgga tttacatata 6360
atgttggagc actgggcgga gcccttgcac cgattatcgg agcgttaatt gctcaacgcc 6420
tggatcttgg cacagcgctt gcttctttat catttagcct gacatttgtg gtcattcttt 6480
taatcggcct tgatatgccg tcaagagttc agcgctggtt aagaccggaa gcactgagaa 6540
cacatgatgc gattgatggc aaaccgtttt caggagctgt gccgtttggc agcgccaaaa 6600
acgatctggt caaaacaaaa tcataaccag gcatcaaata aaacgaaagg ctcagtcgaa 6660
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac 6720
tggctcacct tcgggtgggc ctttctgcgt ttatatacgc gttaacccgg gcccgcggat 6780
ggatatgatc agatccttta actctggcaa ccctcaaaat tgaatgagac atgctacacc 6840
tccggataat aaatatatat aaacgtatat agatttcata aagtctaaca cactagactt 6900
atttacttcg taattaagtc gttaaaccgt gtgctctacg accaaaacta taaaaccttt 6960
aagaactttc tttttttaca agaaaaaaga aattagataa atctctcata tcttttattc 7020
aataatcgca tccgattgca gtataaattt aacgatcact catcatgttc atatttatca 7080
gagctcgtgc tataattata ctaattttat aaggaggaaa aaatatgggc atttttagta 7140
tttttgtaat cagcacagtt cattatcaac caaacaaaaa ataagtggtt ataatgaatc 7200
gttaataagc aaaattcata taaccaaatt aaagagggtt ataatgaacg agaaaaatat 7260
aaaacacagt caaaacttta ttacttcaaa acataatata gataaaataa tgacaaatat 7320
aagattaaat gaacatgata atatctttga aatcggctca ggaaaaggcc attttaccct 7380
tgaattagta aagaggtgta atttcgtaac tgccattgaa atagaccata aattatgcaa 7440
aactacagaa aataaacttg ttgatcacga taatttccaa gttttaaaca aggatatatt 7500
gcagtttaaa tttcctaaaa accaatccta taaaatatat ggtaatatac cttataacat 7560
aagtacggat ataatacgca aaattgtttt tgatagtata gctaatgaga tttatttaat 7620
cgtggaatac gggtttgcta aaagattatt aaatacaaaa cgctcattgg cattactttt 7680
aatggcagaa gttgatattt ctatattaag tatggttcca agagaatatt ttcatcctaa 7740
acctaaagtg aatagctcac ttatcagatt aagtagaaaa aaatcaagaa tatcacacaa 7800
agataaacaa aagtataatt atttcgttat gaaatgggtt aacaaagaat acaagaaaat 7860
atttacaaaa aatcaattta acaattcctt aaaacatgca ggaattgacg atttaaacaa 7920
tattagcttt gaacaattct tatctctttt caatagctat aaattattta ataagtaagc 7980
gaggcaggat caggacaatg attatatttt tgtcatgaat ttcacggaag aaaaacagct 8040
ggtcacgttt gatcagagtg tgaaggacat aatgacagga gacatattgt caggcgacct 8100
gacgatggaa aagtatgaag tgagaattgt cgtaaacaca cattaggctg atgctccgct 8160
cgatatgggc ggattctttt ttctatagaa tgaaaacgct tgctaagtct tggggggatg 8220
aaatcatgaa aagcaaagtg aaaatgttct ttgcggctgc catcgtgtgg agtgcatgta 8280
gttcaacagg atatgccgct gccattgaga aggagaagca cgtgtcagag cttcgggcag 8340
aggatctttt tgttaaaaaa gtagagggga tgaacaagga ttttatcaaa ggggcagatg 8400
tatccagcgt tattgctttg gaaaacagcg gtgtcacctt ttacaataca aacggaaaac 8460
gccaggatat ctttacaact ttaaaacagg ctggggtcaa ctatgttcgc gtccgcatct 8520
ggaatcaccc gtatgattca aatggcaacg ggtatggcgg gggaaacaat gatgttcaaa 8580
aagccatcga aatcggaaaa agagcgacag cgaacggaat gaaggtgctg gccgactttc 8640
actactctga tttctgggcc gatccagcga aacaaaaggt gcccaaagcc tgggcgaatc 8700
tcagctttga agcaaaaaaa gcaaagctct atgagtatac gaaacaaagc ctgcaaaaga 8760
tgatcaagga aggcgtgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 8820
tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 8880
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 8940
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 9000
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 9060
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 9120
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 9180
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 9240
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 9300
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 9360
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 9420
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 9480
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 9540
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 9600
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 9660
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 9720
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 9780
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 9840
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 9900
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 9960
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 10020
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 10080
ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 10140
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 10200
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 10260
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 10320
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 10380
cgtcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 10440
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 10500
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 10560
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 10620
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 10680
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 10740
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 10800
aaaataggcg tatcacgagg ccctttcgtc ttcaagaa 10838
<210> 5
<211> 4254
<212> DNA
<213> Artificial Sequence
<220>
<223> Integration cassette
<400> 5
gcaggctgtt attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc 60
atgaataatc tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa 120
aaagaacaaa aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat 180
gtgatcatcc gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg 240
tttttgttca tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg 300
ccgagaatag acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca 360
attgcggtcg cctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca 420
ttcttcgctt ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg 480
cttcggtatg tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag 540
aaatcatctt ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt 600
ataggaacat tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat 660
tttaaatgta agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg 720
gaagaatgaa gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg 780
agtgtcaaga atgtttgcaa aacgattcaa aacctcttta ctgccgttat tcgctggatt 840
tttattgctg tttcatttgg ttctggcagg accggcggct gcgagtgctg aaacggcgaa 900
caaatcgaat gagcttacag caccgtcgat caaaagcgga accattcttc atgcatggcc 960
agtgaattcg agctcggtac ctaccgttcg tataatgtat gctatacgaa gttatgataa 1020
aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac 1080
tatggatata aaataggtac taatcaaaat agtgaggagg atatatttga atacatacga 1140
acaaattaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac 1200
ttacatgttt ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgacttttt 1260
agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag 1320
acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat 1380
tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga 1440
atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt 1500
aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt 1560
agaggaatta ctacctgata ttccattttc tgatgtgaga agagccatta tggattcgtc 1620
agaggaatta atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg 1680
tatgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt 1740
ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct 1800
tggagagaat attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataa 1860
cagattaaaa aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaatttttt 1920
tgttttatta tttaatattt gggaaatatt cattctaata taacttcgta taatgtatgc 1980
tatacgaacg gtaggatcct ctagagtcga cctgcaggca ttttacattt ttagaaatgg 2040
gcgtgaaaaa aagcgcgcga ttatgtaaaa tataaagtga tagcggtacc attataggta 2100
agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt tcggtttatt 2160
ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tttggctaca 2220
tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttctctgtt 2280
ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tgcgcaaata 2340
cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tttttatctt 2400
cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttatctagg 2460
cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tcagccgtcg 2520
cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg cgctgtgtgc 2580
ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc tgggctctgg 2640
ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc cctcttctgc 2700
cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc tggcactgga 2760
actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tttcctgcac 2820
ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg ctaccggtga 2880
acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta acgcctcgat 2940
tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc tgctgctggc 3000
tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag cgctggaagt 3060
ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg gctgctttaa 3120
atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg tctgtttctg 3180
cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tgtatgaaag 3240
catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tcaccttaat 3300
ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc aggtgaatga 3360
agtcgcttaa gcaatcaatg tcggatgcca gcctggcttt gattacgtgc taaatggttt 3420
atataatgac tcgggcttaa gcggttctct tccccattga gggcaaggct agacgggact 3480
taccgaaaga aaccatcaat gatggtttct tttttgttca taaatcagac aaaacttttc 3540
tcttgcaaaa gtttgtgaag tgttgcacaa tataaatgtg aaatacttca caaacaaaaa 3600
gacatcaaag agaaacatac cctggaagga tgattaatga tgaacaaaca tgtaaataaa 3660
gtagctttaa tcggagcggg ttttgttgga agcagttatg catttgcgtt aattaaccaa 3720
ggaatcacag atgagcttgt ggtcattgat gtaaataaag aaaaagcaat gggcgatgtg 3780
atggatttaa accacggaaa ggcgtttgcg ccacaaccgg tcaaaacatc ttacggaaca 3840
tatgaagact gcaaggatgc tgatattgtc tgcatttgcg ccggagcaaa ccaaaaacct 3900
ggtgagacac gccttgaatt agtagaaaag aacttgaaga ttttcaaagg catcgttagt 3960
gaagtcatgg cgagcggatt tgacggcatt ttcttagtcg cgacaaatcc ggttgatatc 4020
ctgacttacg caacatggaa attcagcggc ctgccaaaag agcgggtgat tggaagcggc 4080
acaacacttg attctgcgag attccgtttc atgctgagcg aatactttgg cgcagcgcct 4140
caaaacgtac acgcgcatat tatcggagag cacggcgaca cagagcttcc tgtttggagc 4200
cacgcgaatg tcggcggtgt gccggtcagt gaactcgttg agaaaaacga tgcg 4254
Claims (17)
- 시알산화된 올리고사카라이드(sialylated oligosaccharide)의 생산을 위한 비-포자형성 바실러스(non-sporulating Bacillus) 세포로서, 여기서 상기 바실러스 세포가 락토스 퍼미아제(lactose permease), CMP-NeuNAc 생합성 경로(biosynthesis pathway) 및 시알릴트랜스퍼라제를 갖도록 유전자 조작된, 비-포자형성 바실러스 세포.
- 제1항에 있어서,
바실러스 세포의 포자형성 능력이, Spo0A, 시그마 E 및 시그마 F를 암호화(encoding)하는 유전자 중 하나 이상의 결실 또는 기능적 불활성화에 의해 손상된, 비-포자형성 바실러스 세포. - 제1항 또는 제2항에 있어서,
락토스 퍼미아제가 이. 콜라이(E. coli) LacY 또는 이의 기능성 변이체인, 비-포자형성 바실러스 세포. - 제1항 내지 제3항 중 어느 한 항에 있어서,
CMP-NeuNAc 생합성 경로가 중간체로서 GlcN-1P 또는 GlcNAc-6P를 사용하는, 비-포자형성 바실러스 세포. - 제1항 내지 제4항 중 어느 한 항에 있어서,
CMP-NeuNAc 생합성 경로가 시알산 회수 경로를 사용하는, 비-포자형성 바실러스 세포. - 제1항 내지 제5항 중 어느 한 항에 있어서,
시알릴트랜스퍼라제가 락토스-수용 시알릴트랜스퍼라제, 바람직하게는 α-2,3-시알릴트랜스퍼라제, α-2,6-시알릴트랜스퍼라제 및 α-2,8-시알릴트랜스퍼라제로 이루어지는 그룹 중에서 선택된 시알릴트랜스퍼라제인, 비-포자형성 바실러스 세포. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 바실러스 세포가 동일한 종의 야생형 바실러스 전구세포(wild-type progenitor Bacillus cell)와 비교하여, 어떠한 β-갈락토시다제 활성도 없거나 또는 감소된 β-갈락토시다제 활성을 갖는, 비-포자형성 바실러스 세포. - 제7항에 있어서,
상기 바실러스 세포가 yesZ 및 ganA로 이루어지는 그룹 중에서 선택된 유전자 중 적어도 하나의 결실 또는 기능적 불활성화에 의해 유전자 조작된, 비-포자형성 바실러스 세포. - 제1항 내지 제8항 중 어느 한 항에 있어서,
상기 바실러스 세포가 바실러스 서브틸리스(Bacillus subtilis) 세포인, 비-포자형성 바실러스 세포. - 제1항 내지 제9항 중 어느 한 항에 있어서,
CMP-NeuNAc 생합성 경로가 중간체로서 GlcN-1P를 사용하고, 시알릴트랜스퍼라제가 α-2,3-시알릴트랜스퍼라제인, 3'-시알릴락토스의 생산에 사용하기 위한, 비-포자형성 바실러스 세포. - 제1항 내지 제9항 중 어느 한 항에 있어서,
CMP-NeuNAc 생합성 경로가 중간체로서 GlcN-1P를 사용하고, 시알릴트랜스퍼라제가 α-2,6-시알릴트랜스퍼라제인, 6'-시알릴락토스의 생산에 사용하기 위한, 비-포자형성 바실러스 세포. - 시알산화된 올리고사카라이드의 생산을 위한, 제1항 내지 제11항 중 어느 한 항에 따른 바실러스 세포의 용도.
- 시알산화된 올리고사카라이드의 생산 방법으로서, 상기 방법이
- 제1항 내지 제11항 중 어느 한 항에 정의된 바와 같은 비-포자형성 바실러스 세포를 제공하고;
- 상기 바실러스 세포를 발효 브로쓰(fermentation broth)에서 시알산화된 올리고사카라이드의 생산에 허용되는 조건하에서 배양하고; 임의로
- 상기 배지 및/또는 바실러스 세포로부터 상기 시알산화된 올리고사카라이드를 회수(retrieving)함
을 포함하는 방법. - 제13항에 있어서,
발효 브로쓰가 락토스를 함유하는, 방법. - 제13항 또는 제14항에 따른 방법에 의해 생산된 시알산화된 올리고사카라이드.
- 영양 조성물, 바람직하게는 유아용 조제분유(infant formula)의 제조를 위한, 제15항에 따른 시알산화된 올리고사카라이드의 용도.
- 제15항에 따른 시알산화된 올리고사카라이드를 함유하는 영양 조성물.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19195148.2A EP3789495A1 (en) | 2019-09-03 | 2019-09-03 | Production of sialylated oligosaccharides in bacillus cells |
PCT/EP2020/072429 WO2021043540A1 (en) | 2019-09-03 | 2020-08-10 | Production of sialylated oligosaccharides in bacillus cells |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230113685A true KR20230113685A (ko) | 2023-08-01 |
Family
ID=68051595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227009316A KR20230113685A (ko) | 2019-09-03 | 2020-12-22 | 바실러스 세포에서 시알산화된 올리고사카라이드의 생산 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220290198A1 (ko) |
EP (1) | EP3789495A1 (ko) |
JP (1) | JP2022546825A (ko) |
KR (1) | KR20230113685A (ko) |
CN (1) | CN115151649A (ko) |
AU (1) | AU2020342892A1 (ko) |
BR (1) | BR112022003604A2 (ko) |
MX (1) | MX2022002700A (ko) |
WO (1) | WO2021043540A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112020001628A2 (pt) * | 2017-07-26 | 2020-07-21 | Jennewein Biotechnologie Gmbh | sialiltransferases e uso das mesmas na produção de oligossacarídeos sialilados |
US20240200021A1 (en) * | 2021-04-16 | 2024-06-20 | Inbiose N.V. | Cellular production of sialylated di- and/or oligosaccharides |
WO2023110994A1 (en) * | 2021-12-14 | 2023-06-22 | Inbiose N.V. | Production of alpha-1,4-fucosylated compounds |
CN117965663B (zh) * | 2024-04-01 | 2024-06-04 | 山东润德生物科技有限公司 | 一种利用微生物发酵提高n-乙酰氨基葡萄糖产量的方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8507227B2 (en) * | 2006-03-09 | 2013-08-13 | Centre National De La Recherche Scientifique (Cnrs) | Method of producing sialylated oligosaccharides |
US9758803B2 (en) * | 2013-03-14 | 2017-09-12 | Glycosyn LLC | Microorganisms and methods for producing sialylated and N-acetylglucosamine-containing oligosaccharides |
EP3141610A1 (en) | 2015-09-12 | 2017-03-15 | Jennewein Biotechnologie GmbH | Production of human milk oligosaccharides in microbial hosts with engineered import / export |
US11535878B2 (en) * | 2016-12-27 | 2022-12-27 | Inbiose N.V. | In vivo synthesis of sialylated compounds |
EP3425052A1 (en) | 2017-07-07 | 2019-01-09 | Jennewein Biotechnologie GmbH | Fucosyltransferases and their use in producing fucosylated oligosaccharides |
NZ764680A (en) * | 2017-12-08 | 2023-06-30 | Chr Hansen Hmo Gmbh | Spray-dried 3-fucosyllactose |
CN108410787A (zh) | 2018-03-13 | 2018-08-17 | 光明乳业股份有限公司 | 一种合成乳酰-n-新四糖的重组枯草芽孢杆菌及其构建方法与应用 |
CN109735479B (zh) | 2019-01-30 | 2022-04-01 | 光明乳业股份有限公司 | 一种合成2’-岩藻糖基乳糖的重组枯草芽孢杆菌及其构建方法与应用 |
-
2019
- 2019-09-03 EP EP19195148.2A patent/EP3789495A1/en active Pending
-
2020
- 2020-08-10 WO PCT/EP2020/072429 patent/WO2021043540A1/en active Application Filing
- 2020-08-10 BR BR112022003604A patent/BR112022003604A2/pt unknown
- 2020-08-10 AU AU2020342892A patent/AU2020342892A1/en active Pending
- 2020-08-10 CN CN202080061953.2A patent/CN115151649A/zh active Pending
- 2020-08-10 JP JP2022514508A patent/JP2022546825A/ja active Pending
- 2020-08-10 MX MX2022002700A patent/MX2022002700A/es unknown
- 2020-08-10 US US17/639,729 patent/US20220290198A1/en active Pending
- 2020-12-22 KR KR1020227009316A patent/KR20230113685A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
US20220290198A1 (en) | 2022-09-15 |
EP3789495A1 (en) | 2021-03-10 |
JP2022546825A (ja) | 2022-11-09 |
CN115151649A (zh) | 2022-10-04 |
AU2020342892A1 (en) | 2022-04-07 |
WO2021043540A1 (en) | 2021-03-11 |
MX2022002700A (es) | 2022-04-11 |
BR112022003604A2 (pt) | 2022-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230113685A (ko) | 바실러스 세포에서 시알산화된 올리고사카라이드의 생산 | |
KR102424721B1 (ko) | Rna-유도 엔도뉴클레아제의 세포 내로의 펩티드 매개성 전달 | |
CN112105369B (zh) | 源自基因敲除猪的血液产品及其用途 | |
KR102267412B1 (ko) | Rna 전사 벡터 및 이의 용도 | |
AU2021204574A1 (en) | Probiotic and prebiotic compositions, and methods of use thereof for modulation of the microbiome | |
CA3098403C (en) | Biosynthesis of human milk oligosaccharides in engineered bacteria | |
JP2017527311A (ja) | フコシル化オリゴ糖の生産において使用するためのα(1,3)フコシルトランスフェラーゼ | |
CN107635575A (zh) | 重组glut1腺相关病毒载体构建体以及用于恢复glut1表达的相关方法 | |
Saburi et al. | Practical preparation of epilactose produced with cellobiose 2-epimerase from Ruminococcus albus NE1 | |
CN108289933A (zh) | 作为认知和行为障碍药物的哺乳动物Klotho的分泌型剪接变体 | |
EP2741772A1 (en) | Pasteurellaceae vaccines | |
KR20220020826A (ko) | 바실러스에서의 푸코실화 올리고당의 생산 | |
CN111065740B (zh) | 2-o-硫酸化酶突变体和3-o-硫酸化酶突变体及其使用方法 | |
Nishimoto et al. | Identification of the putative proton donor residue of lacto-N-biose phosphorylase (EC 2.4. 1.211) | |
CN108699580B (zh) | 在氨基葡萄糖残基中具有高3-o-硫酸化比率的硫酸乙酰肝素 | |
Yamamoto et al. | Characterization of a recombinant Bacteroides fragilis sialidase expressed in Escherichia coli | |
RU2816764C1 (ru) | Продукция сиалированных олигосахаридов в клетках bacillus | |
US20120276131A1 (en) | Anti-trypanosomiasis vaccines and diagnostics | |
Watanabe et al. | Molecular characterization of a novel β1, 3-galactosyltransferase for capsular polysaccharide synthesis by Streptococcus agalactiae type Ib | |
BE1022780B1 (fr) | Purification des polysaccharides secretes par s. agalactiae | |
KR20210005178A (ko) | X-연관 고 igm 증후군에서의 치료적 게놈 편집 | |
CN110191958A (zh) | 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法 | |
RU2810729C2 (ru) | Продукция фукозилированных олигосахаридов в bacillus | |
US7309600B2 (en) | Haemophilus influenzae sialyltransferase and methods of use thereof | |
CN113924111A (zh) | 减毒的支气管败血性博德特菌菌株、包含该减毒的菌株的口服疫苗及其制备和使用方法 |