KR20170117224A - 라비린툴로바이코타문 미생물에서의 단백질 생산 - Google Patents

라비린툴로바이코타문 미생물에서의 단백질 생산 Download PDF

Info

Publication number
KR20170117224A
KR20170117224A KR1020177027988A KR20177027988A KR20170117224A KR 20170117224 A KR20170117224 A KR 20170117224A KR 1020177027988 A KR1020177027988 A KR 1020177027988A KR 20177027988 A KR20177027988 A KR 20177027988A KR 20170117224 A KR20170117224 A KR 20170117224A
Authority
KR
South Korea
Prior art keywords
seq
ala
sequence
protein
nucleic acid
Prior art date
Application number
KR1020177027988A
Other languages
English (en)
Other versions
KR101939014B1 (ko
Inventor
커크 이. 에이피티
제임스 케이시 립마이어
데이비드 심슨
준 왕
제임스 피. 윈
로스 저클
Original Assignee
디에스엠 아이피 어셋츠 비.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디에스엠 아이피 어셋츠 비.브이. filed Critical 디에스엠 아이피 어셋츠 비.브이.
Publication of KR20170117224A publication Critical patent/KR20170117224A/ko
Application granted granted Critical
Publication of KR101939014B1 publication Critical patent/KR101939014B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/10Protozoa; Culture media therefor
    • C12N1/105Protozoal isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2431Beta-fructofuranosidase (3.2.1.26), i.e. invertase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01026Beta-fructofuranosidase (3.2.1.26), i.e. invertase
    • C12R1/90
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/90Protozoa ; Processes using protozoa

Abstract

본 발명은 라비린툴로마이코타(Labyrinthulomycota) 문의 재조합 세포 및 미생물과 이종성 단백질 생산에서의 이들의 용도에 관한 것이다. 재조합 숙주 세포 및 미생물로부터 폴리펩티드를 생성 및 임의로 분비하기 위한 신규한 프로모터, 터미네이터 및 신호 서열이 또한 본 발명에 포함된다.

Description

라비린툴로바이코타문 미생물에서의 단백질 생산{Protein production in microorganisms of the phylum Labyrinthulomycota}
본 발명은 라비린툴로마이코타(Labyrinthulomycota) 문의 재조합 세포 및 미생물과 이종성 단백질 생산에서의 이들의 용도에 관한 것이다. 재조합 숙주 세포 및 미생물로부터 폴리펩티드를 생성 및 임의로 분비하기 위한 신규한 프로모터, 터미네이트 및 신호 서열이 또한 본 발명에 포함된다.
생명과학 및 분자생물학의 발달은 미생물, 식물 및 동물 세포에서 단백질을 생산할 수 있게 되었고, 다수는 이미 사람 및 기타 동물의 조직, 혈액 또는 뇨로부터의 추출에 의해서만 이용가능하다. 현재 상업적으로 이용가능한 생물제제는 통상 포유동물 세포, 예를 들면, 차이니즈 햄스터 난소(CHO) 세포 또는 미생물 세포, 예를 들면, 효모 또는 이. 콜라이(E.coli) 세포주에서 제조되고 있다.
미생물의 발효를 통한 단백질의 생산은 식물 및 동물 세포 배양물 등의 종래 시스템에 비해 몇몇 이점을 제공한다. 예를 들면, 미생물 발효-기반 공정은 (i) 고농도 단백질의 신속한 생산; (ii) 멸균의 양호하게 제어된 생산 조건(예: 의약품의 제조 및 품질관리에 관한 기준(Good Manufacturing Practice; CMP) 조건)의 이용 능력; (iii) 발효를 보다 단순화시키고 불순물을 보다 적게 하는 단순한 화학적 규정된 성장 배지의 이용 능력; (iv) 사람 또는 동물 병원체의 오염 부재; 및 (v) 단백질의 회수 용이성(예: 발효 배지로부터의 분리에 의해)을 제공할 수 있다. 또한, 발효 시설은 세포 배양 시설보다 통상 구축 비용이 보다 적다.
미국 특허 출원 공개 제2003/0166207호(현재 미국 특허 제7,001,772호)는 쉬조키트리움(Schizochytrium) 속의 구성원을 포함하는 트라우스토키트리드의 형질전환에 적합한 재조합 작제물을 최초로 개시하였다. 당해 공보는 그 중에서도 아세톨락테이트 신타제에 대한 쉬조키트리움(Schizochytrium) 핵산 및 아미노산 서열, 아세토락테이트 신타제 프로모터 및 터미네이터 영역, α-투블린 프로모터, 폴리펩티드 신타제(PKS) 시스템으로부터의 프로모터, 지방산 불포화효소 프로모터를 개시했다. 미국 특허 출원 공개공보 제2006/0275904 및 제2006/0286650호(둘 다 본원에서 전체 내용이 참조로 인용됨)은 후속적으로 액틴에 대한 쉬조키트리움 서열, 신장 인자 1 알파(eflα), 및 글리세르알데히드 3-포스페이트 데하이드로게나제(gadph) 프로모터 및 터미네이터를 개시했다.
예를 들면, 상이한 시점 동안 또는 특정한 성장 조건하에, 또는 화학적 또는 환경적 자극에 대한 반응으로 차별적으로 발현되는 조절 제어 요소를 포함하여 트라우스토키트리드 미생물에서 단백질을 발현시키는 추가의 조절 제어 요소를 확인하는 것이 지속적으로 요구되고 있다. 또한, 라비린툴로마이코타 목 또는 트라우스토키트리알레스 속 미생물, 예를 들면, 쉬조키트리움 및 기타 트라우스토키트리드로부터 단백질의 분비를 효율적으로 유도할 수 있는 분비 신호 서열을 확인하는 것이 요구되고 있다.
본 발명은 서열번호 3의 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다.
본 발명은 또한 서열번호 4의 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다.
본 발명은 또한 서열번호 1의 아미노산을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 당해 폴리뉴클레오티드 서열은 서열번호 2를 포함한다.
본 발명은 또한 서열번호 37의 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 당해 폴리뉴클레오티드 서열은 서열번호 38을 포함한다.
본 발명은 또한 서열번호 42의 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 당해 폴리뉴클레오티드 서열은 서열번호 43의 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 서열번호 44의 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 당해 폴리뉴클레오티드 서열은 서열번호 45의 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 서열번호 46의 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다.
본 발명은 또한 상기한 폴리뉴클레오티드 서열에 완전히 상보적인 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다.
본 발명은 또한 상기한 분리된 핵산 분자 또는 이의 조합을 포함하는 재조합 핵산 분자에 관한 것이다. 몇몇 양태에서, 재조합 핵산 분자는 벡터이다.
몇몇 양태에서, 분리된 핵산 분자는 단백질을 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되어 있다. 몇몇 양태에서, 단백질은 분비 신호에 작동적으로 연결되어 있다.
본 발명은 또한 상기한 분리된 핵산 분자 또는 재조합 핵산 분자, 또는 이의 조합물을 포함하는 숙주 세포에 관한 것이다. 몇몇 양태에서, 숙주 세포는 트라우스토키트리알레스(Thraustochytriales) 목의 구성원이다. 몇몇 양태에서, 숙주 세포는 쉬조키트리움(Schizochytrium) 또는 트라우스토키트리움(Thraustochytrium)이다.
본 발명은 또한 단백질을 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된 상기한 바와 같은 분리된 핵산 분자를 포함하는 트라우스토키트리알레스 목의 재조합체 미생물을 배지에서 배양하여 단백질을 생산함을 포함하는 단백질의 생산 방법에 관한 것이다. 몇몇 양태에서, 단백질은 분리된 트라우스토키트리알레스 바이오매스로부터 회수된다. 몇몇 양태에서, 단백질은 미생물 속에 축적된다. 몇몇 양태에서, 단백질은 미생물 막 속에 축적된다. 몇몇 양태에서, 단백질은 배양 배지로부터 회수된다. 몇몇 양태에서, 단백질은 분비된다.
본 발명은 또한 서열번호 1의 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다.
본 발명은 또한 서열번호 15의 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다.
본 발명은 또한 (a) 숙주 세포를 프로테아제 활성을 갖는 효소로 전처리하는 단계 및 (b) 핵산 분자를 전기천공에 의해 숙주 세포 내로 도입하는 단계를 포함하는, 숙주 세포의 형질전환 방법에 관한 것이다.
도 1은 쉬조키트리움 Na/Pi-IIIb2 수송체 단백질 신호 펩티드 아미노산 서열(서열번호 1)을 나타낸다.
도 2는 서열번호 1의 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열(서열번호 2)을 나타낸다.
도 3은 쉬조키트리움 PUFA PKS OrfC 프로모터 영역 폴리뉴클레오티드 서열(서열번호 3)을 나타낸다.
도 4는 쉬조키트리움 PUFA PKS OrfC 터미네이터 요소-1 폴리뉴클레오티드 서열(서열번호 4)을 나타낸다.
도 5는 pSchizE의 플라스미드 맵을 나타낸다.
도 6은 pCOOOOl로도 지칭되는 pSchiz-sG의 플라스미드 맵을 나타낸다.
도 7은 pSchiz-sGr의 플라스미드 맵을 나타낸다.
도 8은 pSchiz-cG의 플라스미드 맵을 나타낸다.
도 9는 시크조키트리움 세포의 세포질과 소포체(ER)에서 eGFP 발현을 나타낸다. 도 9A, 9B 및 9E는 형광성 현미경사진이다. 도 9C, 9D 및 9F는 밝은 현미경사진이다. 도 9A 및 9B는 pSchiz-sGr로 형질전환시킨 세포의 동일한 필드를 나타낸다. 도 9C 및 9D는 pSchiz-cG로 형질전환시킨 세포의 동일한 필드를 나타낸다. 도 9E 및 9F는 pSchiz-E로 형질전환시킨 세포의 동일한 필드를 나타낸다.
도 10A는 pSchiz-sGr로 형질전환시킨 쉬조키트리움 세포에서 ER-표적화 eGFP 및 핵산 특이적 염색 4',6-디아미디노-2-페닐인돌(DAPI)의 복합 형광 국지화를 나타낸다. 도 10B 및 10C는 복합 현미경사진의 작성에 사용된 dGFP(ER 염색 및 DAPI)을 핵에 염색한 것을 각각 나타낸다. 도 10D는 동일한 필드의 밝은 현미경사진을 나타낸다. 도 10A에 나타낸 바와 같이, ER 막은 세포의 각 핵을 둘러싸고, 각각의 세포는 각각 다핵을 함유할 수 있다. 1개 세포 중의 1개 핵의 관련 특성이 제시되어 있다.
도 11은 4개 쉬조키트리움 형질전환체 클론으로부터의 세포 비함유 상청액 및 세포 비함유 추출물 샘플의 웨스턴 블롯 및 상응하는 쿠마시에 염색 SDS-PAGE 겔을 나타낸다. "sup" 및 "cyto"은 각각 세포 비함유 상청액 및 세포 비함유 추출물을 지칭한다. "sG"는 pSchiz-sG로 형질전환된 세포의 샘플을 지칭한다. "sGr"은 pSchiz-sGr로 형질전환된 세포의 샘플을 지칭한다. "cG"은 pSchiz-cG로 형질전환된 세포의 샘플을 지칭한다. "vec(-)"은 pSchiz-E10로 형질전환된 세포의 샘플을 지칭한다. "GFP(+)"은 정제된 재조합 GFP 표준(Clontech, Mountain View, CA)을 지칭한다. 겔에는 3 μg의 세포 비함유 상청액 단백질 및 1 μg의 세포 비함유 추출물 단백질 샘플이 적재된다. 공(empty) 레인은 각 쌍의 샘플, 재조합 GFP 표준 및 분자량 마커 사이에서 발견된다.
도 12는 쉬조키트리움 Sec1 단백질 수송체 단백질의 최초 30개 아미노산을 나타낸다. 아미노산 1 내지 20은 신호 펩티드 서열(서열번호 37)을 구성한다.
도 13은 서열번호 37의 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열(서열번호 38)을 나타낸다.
도 14는 pCL0001로도 지칭되는 pSchiz-Cpt-sleGFP의 플라스미드 맵을 나타낸다.
도 15A는 분비된 eGFP 단백질에 대한 웨스턴 블롯을 나타내고, 도 15B는 상이한 발효 조건(도 15에 정의된 바와 같이 "B26", "B27" 또는 "B28" 발효 조건)하에 성장시킨 쉬조키트리움의 3개 배양물로부터 상응하는 쿠마시에 염색된 SDS-PAGE 겔을 나타낸다. 레인 1 내지 19는 지시된 양의 단백질이 적재되었다. LH = 발효 시간(시간). 도 15A의 레인 20은 10 ng이 적재되었고, 도 15B의 레인 20은 0.5 μg의 정제된 재조합 GFP 표준이 적재되었으며, 쉬조키트리움으로부터의 eGFP 밴드는 이들이 링커 서열을 함유하기 때문에 대조군 밴드보다 약간 더 크다.
도 16은 pSchiz-Cpt-slkappabh의 플라스미드 맵을 나타낸다.
도 17은 쉬조키트리움에 의한 kappa 항체 아단위에 대한 웨스턴 블롯을 ㄴ나타낸다. L = 세포 비함유 추출물; S = 세포 비함유 상청액.
도 18A는 kappa 항체 아단위의 발현에 대한 웨스턴 블롯을 나타낸다. 배양 상청액 샘플이 수득되는 배양 시간은 도 18A의 상분에 제시되어 있다. "wt"는 "야생형"(즉, 비형질전환된) 쉬조키트리움을 지징한다. "+cptSlkappa"는 사람 kappa 항체 단편을 코딩하는 코돈-최적화 유전자, ORFC 프로모터 및 터미네이터, Sec1 신호 펩티드를 코딩하는 서열을 함유하는 젝터로 형질전환된 쉬조키트리움을 지칭한다. 도 18B는 cptSlkappa로 형질전환된 쉬조키트리움의 배양 상청액에서 전체 단백질(브래드포드(Bradford)에 따라 분석됨) 및 항체 쇄 kappa(ELISA에 의해 분석됨)의 축적을 나타낸다.
도 19는 쉬조키트리움 EFl 짧은 프로모터 폴리뉴클레오티드 서열(서열번호 42)을 나타낸다.
도 20은 쉬조키트리움 EFl 긴 프로모터 폴리뉴클레오티드 서열(서열번호 43)을 나타낸다.
도 21은 쉬조키트리움 60S 짧은 프로모터 폴리뉴클레오티드 서열(서열번호 44)을 나타낸다.
도 22는 쉬조키트리움 60S 긴 프로모터 폴리뉴클레오티드 서열(서열번호 45)을 나타낸다.
도 23은 쉬조키트리움 Secl 프로모터 폴리뉴클레오티드 서열(서열번호 46)을 나타낸다.
도 24는 pABOOl1의 플라스미드 맵을 나타낸다.
도 25는 pABOOl8의 플라스미드 맵을 나타낸다.
도 26은 pAB0022의 플라스미드 맵을 나타낸다.
도 27은 각각 EF1 프로모터(짧은 버젼), EF1 프로모터(긴 버젼), 60S 프로모터(짧은 버젼), 60S 프로모터(긴 버젼), SEC1 프로모터 및 OrfC 프로모터에 의해 유도된 eGFP 유전자를 함유하는 발현 벡터로 형질전환시킨 쉬조키트리움 배양물로부터 취한 세포 비함유 상청액 샘플 중의 eGFP에 대한 웨스턴 블롯을 나타낸다.
도 28은 OrfC 프로모터(pCL0001-4) 또는 EF1-L 프로모터(AB001 8-9 및 -10)에 의해 유도된 eGFP 발현과 관련된 형질전환체 세포주의 형광 현미경사진을 나타낸다.
도 29는 퍼메틸화 N-글리칸의 NSI-전체 MS 분석으로 측정한 천연 쉬조키트리움 분비된 단백질 상에서 검출된 N-글리칸 구조를 나타낸다.
도 30은 퍼메틸화된 N-글리칸의 NSI-전체 이온 맵핑으로 측정한 천연 쉬조키트리움 분비된 단백질 상에서 검출된 N- 글리칸 구조를 나타낸다.
도 31은 pCL0076으로도 지칭되는 pSchiz-EPCR(+)-slSuc2_CL0076의 플라스미드 맵을 나타낸다.
도 32는 슈크로즈-SSFM 상에서 성장시킨 pCL0076으로 형질전환시킨 쉬조키트리움종 ATCC 20888의 배양물로부터 세포 펠렛의 건조 중량(g/L)를 나타낸다. 형질전환체는 1-1, 1-3, 1-24, 3-1, 3-2, 3-5, 3-21, 4-1, 4-24 및 4-31로 지칭된다. "대조군"은 글루코즈-SSFM 상에서 성장시킨 야생형 쉬조키트리움종 ATCC 20888 세포를 지칭한다.
도 33은 슈크로즈-SSFM 상에서 성장시킨 pCL0076으로 형질전환시킨 쉬조키트리움종 ATCC 20888의 배양물로부터 세포 펠렛 중의 지방 함량(무수 바이오매스의 중량%로서 표시됨)을 나타낸다. 형질전환체는 1-1, 1-3, 1-24, 3-1, 3-2, 3-5, 3-21, 4-1, 4-24 및 4-31로서 지칭된다. "대조군"은 글루코즈-SSFM 상에서 성장시킨 야생형 쉬조키트리움종 ATCC 20888 세포를 지칭한다.
도 34는 슈크로즈-SSFM 상에서 성장시킨 pCL0076으로 형질전환시킨 쉬조키트리움종 ATCC 20888의 배양물에 대해 시간 경과에 따라 측정한 세포 펠렛의 건조 중량(g/L)을 나타낸다. 형질전환체는 1-3 및 3-5로서 지칭된다. "대조군"은 글루코즈-SSFM 상에서 성장시킨 야생형 쉬조키트리움종 ATCC 20888 세포를 지칭한다.
도 35는 슈크로즈-SSFM 상에서 성장시킨 2개 형질전환체 배양물로부터 세포 펠렛 중의 지방 함량(무수 바이오매스의 중량%로서 표시됨)을 나타낸다. 형질전환체는 1-3 및 3-5로서 지칭된다. "대조군"은 글루코즈-SSFM 상에서 성장시킨 야생형 쉬조키트리움종 ATCC 20888을 지칭한다.
도 36은 pCL0076으로 형질전환시키고 글루코즈-SSFM에서 성장 2일 또는 7일 후에 수거한 쉬조키트리움 균주 B76-32의 배양물로부터 세포 펠렛의 건조 중량(g/L)을 나타낸다. "2118*"은 글루코즈-SSFM 상에서 성장시킨 야생형 쉬조키트리움종 ATCC 20888 세포의 부분리물을 지칭한다. "B76-32**"은 글루코즈-SSFM 상에서 성장시킨 B76-32 모균주를 지칭한다.
도 37은 pCL0076으로 형질전환시키고 슈크로즈-SSFM에서 성장 2일 또는 7일 후에 수거한 쉬조키트리움 균주 B76-32의 배양무로부터 세포 펠렛의 지방 함량을 나타낸다. 각 샘플의 최우측 컬럼은 무수 바이오매스의 중량%로서 지방 함량을 나타낸다. 각 샘플의 최좌측 컬럼은 18개 이하의 탄소(연회색) 또는 20개 이상의 탄소(중간 회색)를 갖는 아실 그룹으로 이루어진 전체 지방의 %를 나타낸다. "2118*"은 글루코즈-SSFM 상에서 성장시킨 야생형 쉬조키트리움종 ATCC 20888 세포의 서브분리물을 지칭한다. "B76-32**"는 글루코즈-SSFM 상에서 성장시킨 B76-32 모균주를 지칭한다.
도 38A는 인버타제 단백질에 대한 웨스턴 블롯을 나타내고, 도 38B는 상응하는 쿠마시에 염색된 SDS-PAGE 겔을 나타낸다. pCL0076 형질전환체 1-3을 3일 배양한 에이 에스 세레비지아에(A S. serevisiae) 인버타제 대조군 및 세포 비함유 상청액은 웨스턴 블롯의 상부에 나타낸 바와 같이 각각 5 ㎍, 2.5 ㎍, 1.25 ㎍ 및 0.625 ㎍의 양으로 적재했다.
도 39A는 슈크로즈 농도의 함수로서 반응 속도에 의해 설명된 인버타제 활성 분석을 나타낸다. 도 39B는 Km 및 Vmax의 계산에 사용된 표준 라인웨버-버크(Lineweaver-Burk) 플롯을 나타낸다.
도 40A는 퍼메틸화된 N-글리칸의 NSI-전체 이온 맵핑에 의해 측정한 쉬조키트리움 분비된 단백질 상에서 검출한 N-글리칸 구조를 나타낸다.
도 40B는 퍼메틸환 N-글리칸의 NSI-전체 이온 맵핑에 의해 수득한 글리칸 종의 표를 나타낸다.
도 41A 및 도 41B는 SignalP 알고리즘의 사용에 기반한 쉬조키트리움(Schizochytrium)에 고유한 예상된 신호 서열을 나타낸다[참조: Bendsten et al., J MoI. Biol. 340: 783-795 (2004); Nielsen and Krogh, Proc. Int. Conf. Intell. Syst. MoI. Biol. (5:122-130 (1998); Nielsen et al, Protein Engineering 12:3-9 (1999); Emanuelsson et al., Nature Protocols 2:953-971 (2007)].
도 42는 쉬조키트리움에 대한 코돈 사용 표를 나타낸다.
도 43은 pCL0120의 플라스미드 맵을 나타낸다.
도 44는 아스퍼길루스 니거(Aspergillus niger)(GenBank Accession No. S33920)로부터 성숙 Suc1 인버타제에 융합된 쉬조키트리움으로부터 Sec1 신호 펩티드를 코딩하는 코돈 최적화 핵산 서열(서열번호 75)을 나타낸다.
도 45는 pCL0137로도 지칭되는 pCL0137_EPCR(+)-slSucl의 플라스미드 맵을 나타낸다.
라비린툴로마이코타문의 구성원, 예를 들면, 쉬조키트리움, 트라우스토키트리움 및 기타 트라우토키트리드는 통상의 분비 경로를 통해 폴리펩티드를 처리할 수 있는 진핵생물이다. 이들 미생물은 또한 CHO 세포보다 적은 수의 충분히 분비된 단백질을 생산하여 CHO 세포보다 쉬조키트리움을 사용하는 잇점을 제공하는 것으로 인식되어 있다. 또한, 이. 콜라이(E. coli)와는 달리, 라비린툴로마이코타의 구성원, 예를 들면, 쉬조키트리움은 특정 단백질의 생물학적 활성에 요구되는 N-연결된 글리코실화 등의 단백질 글리코실화를 수행한다. 쉬조키트리움 등의 트라우스토키트리드에 의해 나타난 N-연결된 글리코실화는 효모 글리코실화를 수행하는 것보다 포유동물 글리코실화 패턴에 보다 밀접하게 유사한 것으로 측정되었다.
재조합 단백질의 효율적인 생산은 또한 (i) 선별된 숙주 세포를 형질전환시키는 방법, (ii) 형질전환체를 설별하는 설별 마커 및 (iii) 특정 숙주 세포에서 작용하는 조절 요소를 포함하는 발현 카세트를 포함한다. 이러한 조절 요소는 플로뉴클레오티드 서열의 발현을 조절하는데 중요한 프로모터 및 터미네이터 서열을 포함한다. 본 발명에 따르면, 용어 조절 요소, 조절 제어 요소 및 조절 서열은 상호 교대로 사용될 수 있고, 이로써 한정되는 것은 아니지만, 프로모터, 인핸서, 전사 터미네이터, 신호 서열, 리보솜 결합 부위, 리프레서 결합 부위, 줄기-루프 및 인트론 스플라이싱 부위를 포함한다. 단백질의 분비를 유도하는 신호 펩티드(또한 신호 서열, 분비 신호 펩티드 또는 리더 서열로서도 공지됨)는 배양 배지로의 단백질 분비가 요구되는 경우에 또한 사용될 수 있다.
숙주 세포
본 발명은 라비린툴로마이코타문의 미생물인 숙주 세포에서 단백질 생산에 관한 것이다. 몇몇 양태에서, 라비린툴로마이코타문 숙주 세포는 단백질 생산을 위한 생물공장으로 사용된다.
몇몇 양태에서, 라비린툴로마이코타문의 재조합 숙주 세포는 트라우스토키트리드, 예들 들면, 스키토키트리움 또는 트라우스토키트리움이다. 본 발명에 따르면, 용어 "트라우스토키트리드"는 트라우스토키트리아세아에(Thraustochytriaceae)과을 포함하는 트라우스토키트리알레스목의 임의의 구성원을 지칭하고, 용어 "라비린툴리드"는 라비린툴라세아에(Labyrinthulaceae)과를 포함하는 라비린툴라레스목의 임의의 구성원을 지칭한다. 라비린툴라세아에과의 구성원은 트라우스토키트리알레스목의 구성원인 것으로 이미 고려되었지만, 이러한 생물체의 분류학적 위치규명에 대한 가장 최근의 수정에서 라비린툴라세아에과는 이제 라비린툴라레스목의 구성원인 것으로 고려된다. 라비린툴라레스 및 트라우스토키트리알레스 둘 다는 라비린툴로마이코타문의 구성원인 것으로 고려된다. 분류학상 이론은 이제 일반적으로 스트라메노필 계통의 조류 또는 조류 유사 원생생물에 이들 미생물 그룹 둘 다를 위치시킨다. 트라우스토키트리드 및 라비린툴리드의 현재의 분류학상 위치는 다음과 같이 요약될 수 있다:
영역: 스트라메노필라(크로미스타)
문: 라비린툴로마이코타(Heterokonta)
강: 라브린툴로마이세테스(Labyrinthulae)
목: 라비린투랄레스
과: 라비린툴라세아에
목: 트라우스토키트리알레스
과: 트라우스토키트리아세아에
본 발명의 목적을 위해, 트라우스토키트리드로서 기재된 균주는 다음 생물체를 포함한다: 목: 트라우스토키트리알레스; 과: 트라우스토키트리아세아데; 종류: 트라우스토키트리움(Thraustochytrium)(종류: 종, 아루디멘탈레(arudimentale), 아우레움(aureum), 벤티콜라(benthicola), 글로보숨(globosum), 킨네이(kinnei), 모티붐(motivum), 멀티루디멘탈레(multirudimentale), 파키데르뭄(pachydermum), 프로리퍼룸(proliferum), 로세움(roseum), 스트리아툼(striatum)), 울케니아(Ulkenia)(종류: 종, 아모에보이데아(amoeboidea), 케르구엘렌시스(kerguelensis), 미누타(minuta), 프로펀다(profunda), 라디아타(radiata), 사일렌스(sailens), 사르카리아나(sarkariana), 스키조키트롭스(schizochytrops), 비수르겐시스(visurgensis), 요르켄시스(yorkensis)), 쉬조키트리움(종류: 종, 아그레가툼(aggregatum), 림나세움(limnaceum), 만그로베이(mangrovei), 미누툼(minutum), 옥토스포룸(octosporum)), 자포노키트리움(Japonochytrium)(종류: 종, 마리눔(marinum)), 아플라노키트리움(Aplanochytrium)(종류: 종, 할리오티디스(haliotidis), 케르구엘렌시스(kerguelensis), 프로펀다(profunda), 스토키노이(stocchinoi)), 알토르니아(Althornia)(종류: 종, 크로우치(crouchii)) 또는 엘리나(Elina)(종류: 종, 마리살바(marisalba), 시노리피카(sinorifica)). 본 발명의 목적을 위해, 울케니아(Ulkenia)에 기재된 종류가 트라우스토키트리움(Thraustochytrium)속의 구성원인 것으로 고려될 수 있다. 오란티아코티트리움(Aurantiacochytrium) 및 오블로고스포라(Oblogospora)은 본 발명에서 라비린툴로마이코타문에 의해 포함되는 2개의 추가의 속이다.
본원에서 라비린툴리드로서 기재된 균주는 다음 생물체를 포함한다: 목: 라비린툴라레스(Labyrinthulales), 과: 라비린툴라세아에, 속: 라비린툴라(Labyrinthula)(종류: 종, 알게리엔시스(Algeriensis), 코에노시스티스(coenocystis), 카토니이(chattonii), 마크로시스티스(macrocystis), 마크로시스티스 아틀란티카(macrocystis atlantica), 비텔리나 파시피카(vitellina pacifica), 비텔리나 비텔리나(vitellina vitellina), 조프피이(zopfii)), 라비린툴로이데스(Labyrinthuloides)(종류: 종, 할리오티디스(haliotidis), 요르켄시스(yorkensis), 라비린토믹사(Labyrinthomyxa)(종류: 종, 마리나(marina), 디플로프리스(Diplophrys)(종류: 종, 아르케리(archeri)), 피르호소루스(pyrrhosorus)(종류: 종, 마리누스(marinus), 소로디플로프리스(Sorodiplophrys)(종류, 종: 스테르코리아(stercorea)) 또는 클라미도믹사(Chlamydomyxa)(종류: 종, 라비린툴로이데스(labyrinthuloides), 몬타나(montana))(피르호소루스(Pyrrhosorus), 소로디플로프리스(Sorodiplophrys) 또는 클라미도믹사(Chlamydomyxa)의 정확한 분류학상 위치에 대한 합의는 현재 없더라도).
라비린툴로마이코타문의 숙주 세포에는, 이로써 한정되는 것은 아니지만, 기탁된 균주 PTA-10212, PTA-10213, PTA-10214, PTA-10215, PTA-9695, PTA-9696, PTA-9697, PTA-9698, PTA-10208, PTA-10209, PTA-10210, PTA-10211, SAM2179로서 기탁된 미생물(기탁자에 의해 "Ulkenia SAM2179"로서 지칭됨), 임의의 트라우스토키트리움(Thraustochytrium) 종류(상기 울케니아 종류, 예를 들면, 유. 비수르겐시스(U. visurgensis), 유. 아모에보이다(U. amoeboida), 유. 사르카리아나(U. sarkariana), 유. 프로펀다(U. profunda), 유. 라디아타(U. radiata), 유. 미누타(U. minuta) 및 유케니아(Ulkenia) 종 BP-5601을 포함함)이 포함되고, 트라우스토키트리움 스트리아툼(Thraustochytrium striatum), 트라우스토키트리움 아우레움(Thraustochytrium aureum), 트라우스토키트리움 로제움(Thraustochytrium roseum) 및 임의의 자포노키트리움(Japonochytrium) 종류도 포함된다. 트라우스토키트리알레스(Thraustochytriales) 균주에는, 이로써 한정되는 것은 아니지만, 트라우스토키트리움(Thraustochytrium)종(23B)(ATCC 20891); 트라우스토키트리움 스트리아툼(Thraustochytrium striatum)(Schneider)(ATCC 24473); 트라우스토키트리움 아우레움(Thraustochytrium aureum)(Goldstein)(ATCC 34304); 트라우스토키트리움 로제움(Thraustochytrium roseum)(Goldstein)(ATCC 28210); 및 자포노키트리움(Japonochytrium)종(Ll)(ATCC 28207)이 포함된다. 쉬조키트리움(Schizochytrium)에는, 이로써 한정되는 것은 아니지만, 쉬조키트리움 아그레가툼(Schizochytrium aggregatum), 쉬조키트리움 리마시눔(Schizochytrium limacinum), 쉬조키트리움(Schizochytrium)종(S31)(ATCC 20888), 쉬조키트리움(Schizochytrium)종(S8)(ATCC 20889), 쉬조키트리움(Schizochytrium)종(LC-RM)(ATCC 18915), 쉬조키트리움(Schizochytrium)종(SR 21), 기탁된 균주 ATCC 28209 및 기탁된 쉬조키트리움 리마시눔(Schizochytrium limacinum) 균주 IFO 32693가 포함된다. 몇몇 양태에서, 숙주 세포는 쉬조키트리움(Schizochytrium) 또는 트라우스토키트리움(Thraustochytrium)이다. 쉬조키트리움(Schizochytrium)은 연속적인 이분열에 의해 또는 포자낭을 형성함으로써 복제될 수 있고, 이는 궁극적으로 유주자를 방출한다. 그러나, 트라우스토키트리움(Thraustochytrium)은 포자낭을 형성함으로써 복제될 수 있고, 이는 이어서 유주자를 방출한다. 몇몇 양태에서, 본 발명의 숙주 세포는 재조합 숙주 세포이다.
본 발명의 숙주 세포로서 효과적인 배양 조건은, 이로써 한정되는 것은 아니지만, 단백질 생산 및/또는 재조합을 가능하게 하는 유효 배지, 생물반응기, 온도, pH 및 산소 조건을 포함한다. 유효 배지는 트라우스토키트리알레스 세포, 예를 들면, 쉬조키트리움(Schizochytrium) 숙주 세포가 통상적으로 배양되는 임의의 배지를 지칭한다. 이러한 배지는 통상적으로 동화가능한 탄소, 질소 및 인 공급원 뿐만 아니라 적절한 염, 무기물, 금속 및 기타 영양소(예: 비타민)을 갖는 수성 배지를 포함한다. 적합한 배지 및 배양 조건의 비제한적 예는 실시예 부분에 기재되어 있다. 트라우스토키트리알레스 미생물에 적합한 비제한적 배양 조건은 또한 이의 전체 내용이 본원에서 참조로 인용되는 미국 특허 제5,340,742호에 기재되어 있다. 본 발명의 세포는 통상의 발효 생물반응기, 진탕 플라스크, 시험 튜브, 미세적정 접시 및 페트리 접시에서 배양할 수 있다. 배양은 재조합 세포에 적절한 온도, pH 및 산소 함량에서 수행할 수 있다. 몇몇 양태에서, 본 발명의 라비린툴로마이코타 숙주 세포는 선별 마커를 코딩하는 핵산 서열을 포함하는 재조합 벡터를 함유한다. 몇몇 양태에서, 선별 마커는 형질전환된 미생물의 선별을 가능하게 한다. 우성 선별 마커의 예는항생 또는 살균 활성을 갖는 화합물을 분해시키는 효소, 예를 들면, 서열번호 5로 나타낸 "블레오마이신 결합 단백질"을 코딩하는 스텝토알로테이쿠스 힌두스타누스(Steptoalloteichus hindustanus)로부터의 Sh ble 유전자를 포함한다. 몇몇 양태에서, 우성 선별 마커를 코딩하는 핵산 서열은 서열번호 6의 폴리뉴클레오티드 서열의 돌연변이된 버젼 등의 트라우스토키트리드 아세토락테이트 신타제 서열을 포함한다. 몇몇 양태에서, 아세토락테이트 신타제는 변형, 돌연변이 또는 달리 선별되어 설포닐우레아 화합물, 이미다졸리논 계열 억제제 및/또는 피리미디닐 옥시벤조에이트에 의한 억제에 대해 내성이 있다. 몇몇 양태에서, 아세토락테이트 신타제는 자연 발생 아세토락테이트 신타제의 동족체이다. 몇몇 양태에서, 아세토락테이트 신타제를 포함하는 재조합 벡터로 형질감염시킨 트라우스토키트리드 미생물은 설포우레아 화합물, 이미다졸리논 계열 억제제 및/또는 피리미디닐 옥시벤조에이트에 대해 감소된 감도를 갖는다. 몇몇 양태에서, 재조합 벡터는 하나 이상의 다음 위치: 116G, 117A, 192P, 200A, 251K, 358M, 383D, 592V, 595W 또는 599F에서 아미노산 결실, 삽입 또는 치환에 의해 서열번호 7과 상이한 아미노산 서열을 포함하는 아세토락테이트 신타제 단백질을 코딩하는 핵산 서열을 포함한다. 몇몇 양태에서, 돌연변이된 아세토락테이트 신타제 단백질은 서열번호 8, 서열번호 9 및 서열번호 10으로 이루어진 그룹으로부터 선택된 아미노산 서열을 갖는다. 몇몇 양태에서, 재조합 벡터는 서열번호 7, 서열번호 8, 서열번호 9 또는 서열번호 10과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열을 포함하고, 여기서 상기 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 우성 선별 마커로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 재조합 벡터는 적어도 트라우스토키트리드에서 우성 선별 마커로서 작용하는 서열번호 7의 작용성 단편을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 재조합 벡터는 서열번호 11, 서열번호 12 및 서열번호 13으로 이루어진 그룹으로부터 선택된 폴리뉴클레오티드 서열을 포함한다.
본 발명에 따르면, 용어 "형질전환"은 외생 핵산 분자(즉, 재조합 핵산 분자)가 미생물 세포 내로 삽입될 수 있는 임의의 방법을 지칭하기 위해 사용된다. 미생물 시스템에서, 용어 "형질전환"은 미생물에 의한 외생 핵산의 인지에 기인하는 상속 변화를 기재하기 위해 사용되고, 본질적으로 용어 "형질감염"과 동의어이다. 외생 핵산 분자를 라비린툴로마이코타 숙주 세포 내로 도입하기 위한 적합한 형질전환 기술에는, 이로써 한정되는 것은 아니지만, 입자 충격, 전기천공, 마이크로주입, 리포펙션, 흡수, 감염 및 원형질 융합이 포함된다. 몇몇 양태에서, 재조합 벡터를 포함하는 외생 핵산 분자는 정지상 상태로 미생물 세포 내로 도입된다. 몇몇 양태에서, 재조합 벡터를 포함하는 외생 핵산 분자는 지수 성장기 동안 미생물 세포 내로 도입된다. 몇몇 양태에서, 재조합 벡터를 포함하는 외생 핵산 분자는 이들이 600 nm에서 1.5 내지 2의 광학 밀도에 도달할 때에 세포 내로 도입된다.
본 발명은 (a) 숙주 세포를 프로테아제 활성을 갖는 효소로 전처리하는 단계 및 (b) 핵산 분자를 전기천공에 의해 숙주 세포 내로 도입하는 단계를 포함하는 숙주 세포의 형질전환 방법에 관한 것이다. 몇몇 양태에서, 숙주 세포는 효소 전처리가 부재하는 것보다 전기천공 전에 효소 전처리를 수행함으로써 보다 효율적으로 형질전환된다. 효소는, 이로써 한정되는 것은 아니지만, 달팽이 아세톤 분말, 프로테아제 IX, 프로테아제 XIV, 설파타제, β-글루쿠로니다제 및 이들의 조합물과 관련된 효소 활성을 포함한다. 몇몇 양태에서, 숙주 세포는 약 0.05 mg/ml, 약 0.1 mg/ml, 약 0.15 mg/ml, 약 0.2 mg/ml, 약 0.25 mg/ml, 약 0.3 mg/ml, 약 0.4 mg/ml, 약 0.5 mg/ml, 약 0.6 mg/ml, 0.7 mg/ml, 0.8 mg/ml, 0.9 mg/ml, 또는 약 1 mg/ml의 달팽이 아세톤 분말, 프로테아제 IX, 프로테아제 XIV 또는 이들의 조합물로 전처리된다. 몇몇 양태에서, 숙주 세포는 약 0.05 mg/ml 내지 약 1 mg/ml, 약 0.1 mg/ml 내지 약 1 mg/ml, 약 0.1 mg/ml 내지 약 0.5 mg/ml, 또는 약 0.05 mg/ml 내지 약 0.5 mg/ml의 달팽이 아세톤 분말, 프로테아제 IX, 프로테아제 XIV 또는 이들의 조합물로 처리된다. 몇몇 양태에서, 숙주 세포는 0.05X, 0.1X, 0.2X, 0.3X, 0.4X, 0.5X, 0.6X, 0.7X, 0.8X, 0.9X 또는 1X의 설파타제, β-글루쿠로니다제 또는 이들의 조합물로 처리된다. 몇몇 양태에서, 숙주 세포는 약 0.05X 내지 약 1X, 약 0.1X 내지 약 1X, 약 0.1X 내지 약 0.5X 또는 약 0.05X 내지 약 0.5X의 설파타제, β-글루쿠로니다제 또는 이들의 조합물로 처리된다. 몇몇 양태에서, 프로테아제 전처리는 상기한 농도에서 프로테아제 IX, 프로테아제, XIV, 달팽이 아세톤 분말, 설파타제, β-글루쿠로니다제 또는 이들의 조합물을 사용한 전처리를 포함한다. 몇몇 양태에서, 전기천공은 약 100 V 내지 약 500 V의 전압에서 0.1 cm 또는 0.2 cm 큐벳 갭 거리에 대해 수행한다. 몇몇 양태에서, 전기천공은 약 100 V, 150 V, 200 V, 250 V, 300 V, 350 V, 400 V, 450 V 또는 500 V의 전압에서 0.1 cm 또는 0.2 cm 큐벳 갭 거리에 대해 수행한다.
본 발명의 몇몇 양태에서, 숙주 세포는 유전자 변형되어, 글리코실화에 수반된 것들을 포함하는 탄수화물의 전송 및/또는 합성과 관련된 생합성 경로에 수반된 유전자가 도입되거나 결실된다. 예를 들면, 숙주 세포는 내생 글리코실화 유전자를 결실시키고/시키거나 사람 또는 동물 글리코실화 유전자를 삽입하여 사람의 유전자와 보다 친밀하게 유사한 글리코실화 패턴을 가능하게 함으로써 변형될 수 있다. 효모에서 글리코실화의 변형은, 예를 들면, 미국 특허 출원 공개번호 제7,029,872호 및 제2004/0171826호, 제2004/0230042호, 제2006/0257399호, 제2006/0029604호 및 제2006/0040353호에서 발견할 수 있다. 본 발명의 숙주 세포는 또한 RNA 바이러스 요소가 유전자 발현의 증가 또는 조절에 사용되는 세포를 포함한다.
발현 시스템
몇몇 양태에서, 숙주 세포에서 단백질의 발현에 사용된 본 발명의 발현 시스템은 조류 세포에서 활성적인 조절 제어 요소를 포함한다. 몇몇 양태에서, 본 발명의 발현 시스템은 라비린툴로마이코타 세포에서 활성적인 조절 제어 요소를 포함한다. 몇몇 양태에서, 본 발명의 발현 시스템은 트라우스토키트리드에서 활성적인 조절 제어 요소를 포함한다. 몇몇 양태에서, 본 발명의 발현 시스템은 시크조키트리움(Schizochytrium) 또는 트라우스토키트리움(Thraustochytrium)에서 활성적인 조절 제어 요소를 포함한다. 바이러스 프로모터를 포함하여 다수의 조류 조절 제어 요소는 다수의 다양한 종에서 활성적이다. 따라서, 본 발명의 양태로서 개시된 신규한 조절 서열은 이들이 분리된 세포와 상동성인 세포 유형에서 사용되거나, 이들이 분리된 세포와는 상이한 세포 유형에서 사용될 수 있다. 이러한 발현 카세트의 디자인 및 구성은 당해 기술분야의 통상의 지식을 가진 자에게 공지된 표준 분자 생물학 기술은 사용한다[참조: Sambrook et ah, 2001, Molecular Cloning: A Laboratory Manual, 3rd edition].
몇몇 양태에서, 라비린툴로마이코타 세포에서 단백질 생산에 사용된 발현 시스템은 라비린툴로마이코타 서열로부터 유도된 조절 요소를 포함한다. 몇몇 양태에서, 라비린툴로마이코타 세포에서 단백질의 생산에 사용된 발현 시스템은 비라비린툴로마이코타 조류 서열로부터 유도된 서열을 포함하여 비-라비린툴로마이코타 서열로부터 유도된 조절 요소를 포함한다. 몇몇 양태에서, 본 발명의 발현 시스템은 단백질을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 당해 폴리뉴클레오티드 서열은 라비린툴로마이코타 숙주 세포에서 작용하는 임의의 프로모터 서열, 임의의 터미네이터 서열 및/또는 임의의 기타 조절 서열과 관련된다. 유도성 또는 구조적 활성 서열이 사용될 수 있다. 적합한 조절 제어 요소는 또한 본원에 기재된 핵산 분자와 관련된 임의의 조절 제어 요소를 포함한다.
본 발명은 또한 숙주 세포에서 단백질을 발현시키기 위한 발현 카세트에 관한 것이다. 본 발명은 또한 숙주 세포에서 단백질을 발현시키기 위한 발현 카세트를 포함하는 임의의 상기 숙주 세포에 관한 것이다. 몇몇 양태에서, 발현 시스템은 숙주 세포에서 작용성인 방식으로 작동적으로 연결된 유전자 요소, 예를 들면, 적어도 프로모터, 코딩 서열 및 터미네이터 영역을 함유하는 발현 카세트를 포함한다. 몇몇 양태에서, 발현 카세트는 본원에 기재된 바와 같은 본 발명의 분리된 핵산 분자의 적어도 하나를 포함한다. 몇몇 양태에서, 발현 카세트의 모든 유전자 유소는 분리된 핵산 분자와 관련된 서열이다. 몇몇 양태에서, 조절 서열은 유도성 서열이다. 몇몇 양태에서, 단백질을 코딩하는 핵산 서열은 숙주 세포의 게놈 내로 통합된다. 몇몇 양태에서, 단백질을 코딩하는 핵산 서열은 숙주 세포의 게놈 내로 안정하게 통합된다.
몇몇 양태에서, 발현되는 단백질을 코딩하는 분리된 핵산 서열은 숙주 세포에서 작용성인 프로모터 서열 및/또는 터미네이터 서열에 작동적으로 연결된다. 발현되는 단백질을 코딩하는 분리된 핵산 서열이 작동적으로 연결되는 프로모터 및/또는 터미네이터 서열은, 이로써 한정되지는 않지만, 본 발명의 신규한 핵산 서열, 미국 특허 출원 공개번호 제7,001,772호에 기재된 조절 서열, 미국 특허 출원 공개번호 제2006/0275904호 및 제2006/0286650호에 기재된 조절 서열, 또는 이들이 형질전환되는 숙주 세포에서 작용성이고 단백질을 코딩하는 분리된 폴리뉴클레오티드 서열에 작동적으로 연결된 기타 조절 서열을 포함하여, 임의의 프로모터 및/또는 터미네이터 서열을 포함할 수 있다. 몇몇 양태에서, 단백질을 코딩하는 핵산 서열은 해독 효율을 최적화하기 위해 특정한 라비린툴로마이코타 숙주 세포에 대해 코돈 최적화되어 있다.
본 발명은 또한 본 발명의 발현 카세트를 포함하는 재조합 벡터에 관한 것이다. 재조합 벡터는, 이로써 한정되는 것은 아니지만, 플라스미드, 파지 및 바이러스를 포함한다. 몇몇 양태에서, 재조합 벡터는 선형 벡터이다. 몇몇 양태에서, 재조합 벡터는 발현 벡터이다. 본원에 사용된 바와 같이, 문구 "발현 벡터"는 코딩된 생성물(예: 목적하는 단백질)의 생성에 적합한 벡터를 지칭한다. 몇몇 양태에서, 생성되는 생성물을 코딩하는 핵산 서열은 재조합 핵산 분자를 생성하기 위해 재조합 벡터 내로 삽입된다. 생성되는 단백질을 코딩하는 핵산 서열은 핵산 서열을 벡터 내에서 조절 서열(예: 트라우스토키트리알레스 프로모터)에 작동적으로 연결시키는 방식으로 벡터 내로 삽입되고, 당해 벡터는 핵산 사열을 재조합 미생물 내에서 전사 및 해독할 수 있다. 몇몇 양태에서, 본원에 기재된 임의의 선별가능한 마커를 포함하는 선별가능한 마커는 본 발명의 재조합 핵산 분자가 성공적으로 도입되는 재조합 미생물의 선별을 가능하게 한다.
몇몇 양태에서, 본 발명의 재조합 숙주 세포에 의해 생산된 단백질은, 이로써 한정되는 것은 아니지만, 치료학적 단백질을 포함한다. 본원에 사용된 바와 같이 "치료학적 단백질"은 동물 및 사람에서 질환, 증상 또는 질병의 치료 또는 예방에 유용한 단백질을 포함한다. 용어 "치료하다" 및 "치료"는 치료학적 치료 및 예후적 또는 예방적 수단 둘 다를 지칭하고, 당해 목적은 바람직하지 않은 생리학적 증상, 질환 또는 질병을 예방하거나 지연(완화)시키거나 유리하거나 목적하는 임상적 결과를 수득하기 위한 것이다. 본 발명의 목적을 위해, 유리하거나 목적하는 임상적 결과는, 이로써 한정되는 것은 아니지만, 증상, 질환 또는 질병과 관련된 징후 또는 증상의 완화; 증상, 질환 또는 질병 정도의 감소; 증상, 질환 또는 질병의 안정화(즉, 증상, 질환 또는 질병이 악화되지 않는 경우); 증상, 질환 또는 질병의 개시 또는 진행의 지연; 증상, 질환 또는 질병의 완화; 증상, 질환 또는 질병의 경감(부분적이거나 전체적이거나 및 검출가능하거나 검출불가능하거나); 증상, 질환 또는 질병의 향상 또는 개선을 포함한다. 치료는 과도한 부작용 없이 임상적으로 현저한 반응의 유도를 포함한다. 치료는 또한 처치를 제공하지 않은 경우의 예상된 생존율과 비교하여 연장된 생존율을 포함한다.
특정한 양태에서, 치료학적 단백질은, 이로써 한정되는 것은 아니지만, 생물학적 활성 단백질, 예를 들면, 효소, 항체 또는 항원성 단백질을 포함한다. 특정 양태에서, 치료학적 단백질은, 이로써 한정되는 것은 아니지만, 단백질 A, 사람 성장 호르몬, 인터페론, 아프로티닌, 사람 알파 항트립신, 친지성 단백질, 사람 혈청 알부민, 글루탐산 데카복실라제, 위장 리파제, 락토페린/리소자임, 역전사효소, 항체(이로써 한정되는 것은 아니지만, VEGF 모노클로날 항체(AVASTIN®) 및 HER2 모노클로날 항체(HERCEPTIN®)), 사람 백신, 동물 백신 및 동물 치료제를 포함한다.
몇몇 양태에서, 본 발명의 재조합 숙주 세포에 의해 생산된 단백질은, 이로써 한정되는 것은 아니지만 산업적 효소를 포함한다. 산업적 효소는, 이로써 한정되는 것은 아니지만, 식품, 의약, 화학적, 기계적 및 기타 산업적 생성물의 생산, 제조, 보존, 영양 고정 또는 가공에 사용되는 효소를 포함한다. 산업적 효소에는, 이로써 한정되는 것은 아니지만, 알파 아밀라제, 알파-갈락토시다제, 베타-아밀라제, 셀룰로오즈, 베타-글루카나제, 덱스트라나제, 덱스트리나제, 글루코아밀라제, 헤미셀룰라제/펜토사나제, 자이실라나제, 인버타제, 락타제, 나린기나제, 펙티나제, 풀루라나제, 산 프로테이나제, 알칼리 프로테아제, 프로멜라인, 파파인, 펩신, 아미노펩티다제, 엔도-펩티다제(트립신, 케모트립신, 펩신, 엘라스타제), 렌넷/렌닌/키모신, 서브틸리즘, 써모리신, 아미노아실라제, 글루타미나제, 리소자임, 페니실린 아실라제, 트리글리세리다제, 포스포리파제, 프레가스트릭 에스테라제, 피타제, 아미다제, 이소머라제, 알콜 데하이드로게나제, 아미노산 옥시다제, 세탈라제, 클로로퍼옥시다제, 퍼옥시다제, 아세토락테이트 데카복실라제, 아스파르틱 베타-데카복실라제, 히스티다제, 사이클로덱스트린 글리코실트랜스퍼라제, 프로마제, 피타제 및 키노신이 포함된다.
몇몇 양태에서, 본 발명의 재조합 숙주 세포에 의해 생산된 단백질은 영양요구성 마커, 우성 선별 마커(예를 들면, 항생제 활성을 열화시키는 효소) 또는 형질전환 선별에 수반되는 또 다른 단백질, 리포터로서 작용하는 단백질, 단백질 글리코실화에 수반되는 효소 및 세포 대사에 수반되는 효소를 포함한다.
본 발명의 임의의 양태에서, 본 발명의 숙주 세포에 의해 생산된 단백질은 "출력 단백질" 또는 "이종성 출력 단백질"일 수 있다. 본원에 사용된 바와 같은 "출력 단백질" 또는 "이종성 출력 단백질"은 단백질을 생산하는 숙주 세포의 신진대사의 변형에 관련되지 않고 후속 분리용 숙주 세포에 의해 생성되는 이종성 재조합 단백질을 지칭한다. 본원에 정의된 바와 같은 "출력 단백질"은 리포터 유전자에 의해 코딩된 단백질을 포함하지 않는다.
본 발명의 재조합 숙주 세포에 의해 생성된 이종성 출력 단백질은 선별가능한 마커, 예를 들면, 에오신 내성 유전자(예: 스텝토알로테이쿠스 힌두스타누스(Steptoalloteichus hindustanus)로부터의 ble 유전자) 및 이. 콜라이(E. coli) 네오마이신 포스포트랜스퍼라제(npt), 및 트랜스포손 Tn5, 아스퍼길루스 테레우스(Aspergillus terreus)로부터의 블라스티시딘 데아미나제(bsdR), 트라우스토키트리움(Thraustochytrium) T23B로부터의 PUFA 신타제 ORFA, 트라우스토키트리움(Thraustochytrium) T23B로부터의 PUFA 신타제 ORFB, 트라우스토키트리움(Thraustochytrium) T23B로부터의 PUFA 신타제 ORFC, 아에쿠오레아 빅토리아(Aequorea victoria)로부터 유도된 합성 eGFP, 도도코사헥사엔산(DHA), 도코사펜타엔산(DPA), 에이코사펜타엔산(EPA) 및 아라키돈산(ARA)로 이루어진 그룹으로부터 선택된 지방산의 합성과 관련된 단백질을 코딩하는 천연 유전자, 지방산 신타제, 지방산 불포화효소, 지방산 이롱가제, 폴리케티드 신타제 복합체와 관련된 단백질 및 인지질 또는 트리아실글리세롤 분자 내로의 지방산의 도입과 관련된 단백질, 오메가-3 지방산 불포화효소, 폴리엔산 지방산 이소머라제, 피토엔 불포화효소, 카로테노이드 사이클라제, 카로네노이드 하이드록실라제, 카로테노이드 케톨라제, 비타민 E 및 리포산, 이소프로노이드 생합성 경로와 관련된 단백질, 및 폴리불포화 지방산 또는 카로테노이드의 숙주 세포 생성에 수반되는 효소를 포함하지 않는다.
몇몇 양태에서, 본 발명의 숙주 세포에 의해 생산된 단백질은 상업적 규모로 생성된다. 상업적 규모는 크기 ≥100L, ≥1,000L, ≥10,000L 또는 ≥100,000L의 통기된 발효기에서 성장한 미생물로부터 단백질의 생산을 포함한다. 몇몇 양태에서, 상업적 규모 생산은 진탕과 함께 통기된 발효기에서 수행된다.
몇몇 양태에서, 본 발명의 숙주 세포에 의해 생산된 단백질은 세포 속에 축적될 수 있거나, 세포로부터, 예를 들어 가용성 단백질로서 배양 배지로 분비될 수 있다.
몇몇 양태에서, 본 발명의 숙주 세포에 의해 생산된 단백질은 세포, 배양 배지, 또는 당해 세포기 성장하는 발효 배지로부터 회수된다. 몇몇 양태에서, 단백질은 가용성 단백질로서 배양 배지로부터 회수되는 분비된 단백질이다. 몇몇 양태에서, 단백질은 신호 펩티드를 포함하는 분비된 단백질이다.
몇몇 양태에서, 본 발명에 의해 생산된 단백질은 소포체에서 이의 체류를 유도하고, 이의 세포외 분비를 유도하거나, 이를 다른 세포기관 또는 세포 구획으로 유도하는 표적 신호를 포함한다. 몇몇 양태에서, 당해 단백질은 신호 펩티드를 포함한다. 몇몇 양태에서, 당해 단백질은 Na/Pi-IIb2 수송체 신호 펩티드 또는 Sec1 수송 단백질을 포함한다. 몇몇 양태에서, 신호 펩티드는 서열번호 1 또는 서열번호 37의 아미노산 서열을 포함한다. 몇몇 양태에서, 서열번호 1 또는 서열번호 37의 아미노산 서열을 갖는 신호 펩티드를 포함하는 단백질은 배양 배지 내로 분비된다. 몇몇 양태에서, 신호 펩티드는 분비 과정 동안 단백질로부터 분리되어 성숙 형태의 단백질을 생산한다.
몇몇 양태에서, 본 발명의 숙주 세포에 의해 생산된 단백질은 글리코실화된다. 몇몇 양태에서, 본 발명에 의해 생산된 단백질의 글리코실화 패턴은 효모 또는 이. 콜라이에서 생산된 단백질보다 포유동물 글리코실화 패턴과 보다 밀접하게 유사하다. 몇몇 양태에서, 본 발명의 라비린툴로마이코타 숙주 세포에 의해 생산된 단백질은 N-연결된 글리코실화 패턴을 포함한다. 치료 목적에 사용된 글리코실화 단백질은, 이들의 글리코실화 패턴이 대상 생물체에서 발견된 글리코실화 패턴과 유사한 경우, 항-글리코형 면역 반응을 덜 촉진시킬 것이다. 반대로, 대상 생물체의 특성이 아닌 연결 또는 당을 갖는 글리코실화 단백질은 더욱 항원성일 것이다. 이펙터 작용은 또한 특정한 글리코형에 의해 조절될 수 있다. 예를 들면, IgG는 각각 Fc 영역 글리코형 상에 말단 시알릭산의 존재 또는 부재와 관련하여 프로염증성 또는 항염증성 반응을 매개할 수 있다[참조: Kaneko et al, Science 313(5787):670-3 (2006)].
본 발명은 추가로 본 발명의 재조합 라비린툴로마이코타 숙주 세포를, 단백질을 코딩하는 폴리뉴클레오티드 서열을 발현시키기에 충분한 조건하에 배양함을 포함하는, 재조합 단백질의 생산 방법에 관한 것이다. 몇몇 양태에서, 재조합 단백질은 숙주 세포로부터 분비되고, 배양 배지로부터 회수된다. 몇몇 양태에서, 세포로부터 분비되는 단백질은 분비 신호 펩티드를 포함한다. 생성에 사용된 벡터 및 숙주 시스템에 따라, 본 발명의 재조합 단백질은 재조합 세포 내에 잔류할 수 있고, 발효 배지 내로 분비될 수 있으며, 세포 막의 외부 표면 상에 유지될 수 있다. 본원에 사용된 바와 같이, 문구 "단백질의 회수"는 단백질을 함유하는 발효 배지를 회수하는 것을 지칭하며, 추가의 분리 또는 정제 단계를 반드시 의미하는 것은 아니다. 본 발명의 방법에 의해 생산된 단백질은 다양한 표준 단백질 정제 기술, 예를 들면, 이로써 한정되는 것은 아니지만, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 여과, 전기영동, 소수성 상호작용 크로마토그래피, 겔 여과 크로마토그래피, 역상 크로마토그래피, 콘카나발린 A 크로마토그래피, 크로마토분획 및 시차 가용화를 사용하여 정제할 수 있다. 몇몇 양태에서, 본 발명의 방법에 의해 생산된 단백질은 "실질적으로 순수한" 형태로 분리된다. 본원에 사용된 바와 같이, "실질적으로 순수한"은 상업적 생성물로서 당해 단백질의 효과적인 사용을 가능하게 하는 순도를 지칭한다. 몇몇 양태에서, 재조합 단백질은 세포 내에 축적되고, 세포로부터 회수된다. 몇몇 양태에서, 당해 방법의 숙주 세포는 트라우스토키트리드이다. 몇몇 양태에서, 당해 방법의 숙주 세포는 쉬조키트리움 또는 트라우스토키트리움이다. 몇몇 양태에서, 재조합 단백질은 치료용 단백질, 식품 효소 또는 산업적 효소이다. 몇몇 양태에서, 재조합 라비린툴로마이코타 숙주 세포는 쉬조키트리움이고, 재조합 단백질은 분비 신호 서열을 포함하는 치료용 단백질이다.
몇몇 양태에서, 본 발명의 재조합 벡터는 표적화 벡터이다. 본원에 사용된 바와 같이, 문구 "표적화 벡터"는 재조합 세포 내로 특정 핵산 분자를 전달하는데 사용되는 벡터를 지칭하고, 여기서 핵산 분자는 내생 유전자를 숙주 세포 내에서 결실하거나 불활성화하는데 사용된다(즉, 표적화 유전자 파괴 또는 녹-아웃 기술에 사용됨). 이러한 벡터는 또한 "녹-아웃" 벡터로서 공지되어 있다. 몇몇 양태에서, 표적화 벡터의 일부는 숙주 세포에서 표적 유전자의 핵산 서열과 상동성인 핵산 서열을 갖는다(즉, 결실 또는 불활성화되도록 표적화된 유전자). 몇몇 양태에서, 벡터 내로 삽입된 핵산 분자(즉, 삽입체)는 표적 유전자와 상동성이다. 몇몇 양태에서, 벡터 삽입체의 핵산 서열은 표적 유전자와 결합하도록 설계되어, 당해 표적 유전자 및 삽입체는 상동성 재조합을 경험하고, 이에 의해 내생 표적 유전자가 결실, 불활성화 또는 약독화된다(즉, 성숙 또는 결실되는 내생 표적 유전자의 적어도 일부에 의해).
분리된 핵산 분자
본 발명은 또한 재조합 숙주 세포에서 유전자 발현을 조절하고/하거나 단백질 분비를 유도하는데 사용될 수 있는 분리된 핵산 분자 또는 폴리뉴클레오티드 서열에 관한 것이다. 본원에 기재된 핵산 서열은 프로모터, 종결 서열, 및 신호 펩티드를 코딩하는 핵산 서열을 포함하고, 상동성 또는 이종성 단백질의 전사 및/또는 분비의 조절에 사용될 수 있다.
본 발명에 따라서, 분리된 핵산 분자는 이의 천연 환경으로부터 제거된 (즉, 사람 조작으로 처리된) 핵산 분자이고, 여기서 천연 환경은 당해 핵산 분자가 자연에서 발견되는 게놈 또는 염색체이다. 이와 같이, "분리된"은 핵산 분자가 정제된 정도를 반드시 반영하지는 않지만, 당해 분자는 핵산 분자가 자연에서 발견되는 전체 게놈 또는 전체 염색체를 포함하지 않음을 나타낸다. 분리된 핵산 분자는 DNA, RNA(예: mRNA) 또는 DNA 또는 RNA의 유도체(예: cDNA)를 포함할 수 있다. 문구 "핵산 분자"는 주로 물리적 핵산 분자를 지칭하고, 문구 "핵산 서열" 또는 "폴리뉴클레오티드 서열"은 주로 핵산 분자 상의 뉴클레오티드 서열을 지칭하며, 당해 문구는 특히 핵산 분자, 폴리뉴클레오티드 서열, 또는 단백질을 코딩할 수 있는 핵산 서열과 관련하여 상호 교대로 사용된다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 재조합 DNA 기술(예: 폴리머라제 연쇄 반응(PCR) 증폭, 클로닝) 또는 화학적 합성을 사용하여 생성된다. 분리된 핵산 분자는 천연 핵산 분자 및 이의 동족체를 포함하며, 이로써 한정되는 것은 아니지만, 당해 변형이 코딩된 펩티드 또는 단백질의 서열, 기능 및/또는 생물학적 활성에 바람직한 효과를 제공하는 방식으로 뉴클레오티드가 삽입, 결실, 치환 및/또는 전환된 천연 대립인자 변이체 및 변형된 핵산 분자를 포함한다.
본 발명의 프로모터, 터미네이터 서열, 신호 펩티드 서열 또는 임의의 기타 서열의 핵산 서열 상보체는 본 발명의 프로모터 서열, 터미네이터 서열, 신호 펩티드 서열 또는 임의의 기타 서열에 상보적인 핵산 가닥의 핵산 서열을 지칭한다. 본 발명의 서열을 함유하는 이중가닥 DNA는 단일가닥 DNA, 및 당해 단일가닥 DNA에 상보적인 서열을 갖는 이의 상보성 가닥을 포함한다. 이와 같이, 본 발명의 핵산 분자는 이중가닥 또는 단일가닥일 수 있고, "엄격한" 하이브리드화 조건하에 본 발명의 서열 및또는 본 발명의 서열의 상보체와 안정한 하이브리드를 형성하는 핵산 분자를 포함한다. 상보성 서열을 유도하는 방법은 당해 기술분야의 통상의 지식을 가진 자에게 공지되어 있다.
용어 "단백질"은 개개 구성 폴리펩티드가 공유 또는 비공유 수단에 의해 연결되어 있는 다중-폴리펩티드 복합체 뿐만 아니라 단일-사슬 폴리펩티드 분자를 포함한다. 용어 "폴리펩티드"는 2개 이상의 아미노산 길이, 통상 5, 10 또는 20개 이상의 아미노산을 갖는 펩티드를 포함한다.
본 발명의 신규한 핵산 분자는 이들 작용하는 임의의 미생물에서 사용될 수 있다. 몇몇 양태에서, 핵산 분자는 라비린툴로마이코타문의 재조합 미생물에서 사용된다. 몇몇 양태에서, 재조합 핵산 분자는 트라우스토키트리알레스목의 재조합 미생물에서 사용된다. 몇몇 양태에서, 재조합 핵산 분자는 쉬조키트리움 또는 트라우스토키트리움 미생물에서 사용된다. 본원에 사용된 바와 같이, 재조합 미생물은 재조합 기술을 사용하여 이의 정상(즉, 야생형 또는 천연 발생) 형태로부터 변형된(즉, 돌연변이 또는 변화된) 게놈을 갖는다. 본 발명에 따르는 재조합 미생물은, 당해 변형 또는 변형들이 미생물 내에서 목적하는 효과를 제공하는 방식으로, 핵산 분자가 삽입, 결실 또는 변형(즉, 예를 들면, 뉴클레오티의 삽입, 결실, 치환 및/또는 전환에 의해 돌연변이)된 미생물을 포함할 수 있다. 본원에 사용된 바와 같이, 유전자 발면, 유전자 작용 또는 유전자 생성물(즉, 당해 유전자에 의해 코딩된 단백질)의 작용을 감소시키는 유전자 변형은 유전자의 불활성화(완전 또는 부분), 결실, 차단, 봉쇄 또는 하향조절로서 지칭될 수 있다. 예를 들면, 이러한유전자에 의해 코딩된 단백질의 작용을 감소시키는 유전자에서 유전자 변형은 당해 유전자의 완전한 결실(즉, 당해 유전자는 재조합 미생물에 존재하지 않고, 따라서 단백질은 재조합 미생물에 존재하지 않는다), 단백질의 불완전한 해독 또는 비해독(예를 들면, 당해 단백질은 발현되지 않는다)을 생성하는 유전자의 돌연변이, 또는 단백질의 자연적 작용을 감소 또는 소멸(예를 들면, 활성(예: 효소적 활성 또는 작용)이 감소되거나 활성이 없는 단백질이 발현됨)시키는 유전자의 돌연변이을 생성할 수 있다. 유전자 발현 또는 작용을 증가시키는 유전자 변형은 유전자의 증폭, 과생성, 과발현, 활성화, 증강, 부가 또는 상향조절로서 지칭될 수 있다.
본 발명은 또한 프로모터인 신규한 조절 제어 요소에 관한 것이다. 본 발명의 프로모터는 관련된 코딩 영역의 전사를 유도하는 DNA의 영역이다.
몇몇 양태에서, 당해 프로모터는 라비린툴로마이코타문의 미생물 기원이다. 몇몇 양태에서, 당해 프로모터는 트라우스토키트리드 기원이고, 이로써 한정되는 것은 아니지만, SAM2179(기탁자에 의해 "Ulkenia SAM2179"로서 명명됨)로서 기탁된 미생물, 울케니아(Ulkenia) 또는 트라우스토키트리움(Thraustochytrium) 또는 쉬조키트리움(Schizochytrium)속의 미생물을 포함한다. 쉬조키트리움은, 이로써 한정되는 것은 아니지만, 쉬조키트리움 아그레가툼(Schizochytrium aggregatum), 쉬조키트리움 리마시눔(Schizochytrium limacinum), 쉬조키트리움(Schizochytrium) 종(S31)(ATCC 20888), 쉬조키트리움(Schizochytrium) 종(S8) (ATCC 20889), 쉬조키트리움(Schizochytrium) 종(LC-RM)(ATCC 18915), 쉬조키트리움(Schizochytrium) 종(SR 21), 기탁된 쉬조키트리움(Schizochytrium) 균주 ATCC 28209 및 기탁된 쉬조키트리움(Schizochytrium) 균주 IFO 32693을 포함한다.
본 발명의 프로모터는 트라우스토키트리드에서 적어도 프로모터 활성을 가질 수 있고, 전장 프로모터 서열 및 이의 작용성 단편, 융합 서열 및 자연 발생 프로모터의 동족체를 포함한다. 제한 효소는 본 발명의 핵산 분자를 소화시키기 위해 사용될 수 있고, 이어서 프로모터 활성에 요구되는 최소 서열을 측정하기 위해 적절히 분석할 수 있다. 이러한 단편 자체는 개별적으로 본 발명의 양태를 나타낸다. 프로모터의 동족체는 1개, 2개, 3개 또는 수개의 뉴클레오티드가 결실, 삽입, 전환, 치환 및/또는 유도체화되어 있다는 점에서 자연 발생 프로모터와 상이하다. 프로모터의 동족체는, 활성이 특정한 자극에 의해 증가, 감소 또는 형성될 수 있지만, 적어도 트라우스토키트리드에서 프로모터로서 활성을 보유할 수 있다. 본 발명의 프로모터는 발전적 및 조직 특이적 조절 제어 또는 발현을 제공하는 하나 이상의 서열 요소를 포함할 수 있다.
몇몇 양태에서, 본 발명의 분리된 핵산 분자는 PUFA PKS OrfC 프로모터("PKS OrfC 프로모터")를 포함한다. 본 발명의 PKS OrfC 프로모터는 OrfC 코딩 영역의 상류(5' 영역 방향으로)에 자연적으로 위치하고 OrfC 전사를 유도하는 DNA 영역이다. 몇몇 양태에서, PKS OrfC 프로모터는 서열번호 3으로 나타낸 폴리뉴클레오티드 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 3과 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 프로모터 활성을 갖는다(즉, 적어도 PUFA PKS OrfC 서열에 대해 기본 프로모터 전사 활성을 갖는다). 상동성(또는 % 동일성)은 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 1000, 적어도 1500 뉴클레오티드에 걸쳐 또는 전체 서열에 걸쳐 발견할 수 있다.
본 발명은 또한, 서열번호 3과 하이브리드화하거나, 서열번호 3과 적어도 95% 동일한 폴리뉴클레오티드 서열과 하이브리드화하는 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 분리된 핵산 분자는, 서열번호 3, 또는 서열번호 3과 적어도 95% 동일한 폴리뉴클레오티드 서열에 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 본 발명의 PKS OrfC 프로모터는 자연 발생 PKS OrfC 프로모터 서열과 충분히 유사한 PKS OrfC 프로모터 동족체를 포함하고, 여기서 당해 동족체의 핵산 서열은 중도, 고도 또는 초고도 엄격한 조건(하기 기재됨)하에 자연 발생 PKS OrfC 프로모터의 핵산 서열의 상보체와 하이브리드화할 수 있다. 몇몇 양태에서, 본 발명의 PUFA PKS OrfC 프로모터 서열은 중도, 고도 또는 초고도 엄격한 조건하에 서열번호 3의 상보체와 하이브리드화한다.
몇몇 양태에서, 본 발명의 프로모터는 ATCC 수탁번호 PTA-9615로 기탁된 pCL0001의 OrfC 프로모터를 포함한다.
몇몇 양태에서, 본 발명의 분리된 핵산 분자는 EF1 짧은 프로모터("EF1 짧은" 또는 "EF1-S" 프로모터) 또는 EF1 긴 프로모터("EF1 긴" 또는 "EF1-S" 프로모터)를 포함한다. 본 발명의 EF1 짧은 또는 긴 프로모터는 EF1 코딩 영역의 상류(5' 영역 방향)에 자연적으로 위치하고 EF1 전사를 유도하는 DNA의 영역이다. 몇몇 양태에서, EF1 짧은 프로모터는 서열번호 42로 나타내어진 폴리뉴클레오티드 서열을 갖는다. 몇몇 양태에서, EF1 긴 프로모터는 서열번호 43으로 나타내어진 폴리뉴클레오티드 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 42 또는 서열번호 43과 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 프로모터 활성을 갖는다(즉, 각각 적어도 EF1 짧은 또는 긴 프로모터 서열에 대해 기본 프로모터 전사 활성을 갖는다). 상동성(또는 % 동일성)은 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 200, 적어도 300, 적어도 400 또는 적어도 500개 뉴클레오티드 서열에 걸쳐 또는 전체 서열에 걸쳐 발견할 수 있다.
본 발명은 또한 서열번호 42 및/또는 서열번호 43과 하이브리드화하거나, 서열번호 42 및/또는 서열번호 43과 적어도 95% 동일한 폴리뉴클레오티드 서열과 하이브리드화하는 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 42 또는 서열번호 43, 또는 서열번호 42 또는 서열번호 43과 적어도 95% 동일한 폴리뉴클레오티드 서열과 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 본 발명의 EF1 짧은 또는 EF1 긴 프로모터는 각각 자연 발생 EF1 짧은 또는 긴 프로모터 서열과 충분히 유사한 EF1 짧은 또는 긴 프로모터 동족체를 포함하고, 여기서 당해 동족체의 핵산 서열은 중도, 고도 또는 초고도 엄격한 조건(하기 기재됨)하에 각각 자연 발생 EF1 짧은 및/또는 긴 프로모터의 핵산 서열의 상보체와 하이브리드화할 수 있다. 몇몇 양태에서, 본 발명의 EF1 짧은 및/또는 긴 프로모터 서열은 중도, 고도 또는 초고도 엄격한 조건하에 각각 서열번호 42 및/또는 서열번호 43의 상보체와 하이브리드화한다.
몇몇 양태에서, 본 발명의 프로모터는 ATCC 수탁번호 PTA-9616으로 기탁된 pAB0018의 EF1 긴 프로모터를 포함한다.
몇몇 양태에서, 본 발명의 분리된 핵산 분자는 60S 짧은 프로모터("60S 짧은" 또는 "60S-S" 프로모터) 또는 60S 긴 프로모터("60S 긴" 또는 "60S-L" 프로모터)를 포함한다. 본 발명의 60S 짧은 또는 긴 프로모터는 60S 코딩 영역의 상류(5' 영역 방향)에 자연적으로 위치하고 60S 전사를 유도하는 DNA의 영역이다. 몇몇 양태에서, 60S 짧은 프로모터는 서열번호 44로 나타내어진 폴리뉴클레오티드 서열을 갖는다. 몇몇 양태에서, 60S 긴 프로모터는 서열번호 45로 나타내어진 폴리뉴클레오티드 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 44 또는 서열번호 45와 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 프로모터 활성을 갖는다(즉, 각각 적어도 60S 짧은 또는 긴 프로모터 서열에 대해 기본 전사 활성을 갖는다). 상동성(또는 % 동일성)은 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 200, 적어도 300, 적어도 400 또는 적어도 500개 뉴클레오티드 서열에 걸쳐 또는 전체 서열에 걸쳐 발견할 수 있다.
본 발명은 또한 서열번호 44 및/또는 서열번호 45와 하이브리드화하거나, 서열번호 44 및/또는 서열번호 45와 적어도 95% 동일한 폴리뉴클레오티드 서열과 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 44 및/또는 서열번호 45, 또는 서열번호 44 및/또는 서열번호 45와 적어도 95% 동일한 폴리뉴클레오티드 서열과 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 본 발명의 60S 짧은 또는 60S 긴 프로모터는 각각 자연 발생 60S 짧은 또는 60S 긴 프로모터 서열과 충분히 유사한 60S 짧은 또는 60S 긴 프로모터 동족체를 포함하고, 여기서 동족체의 핵산 서열은 중도, 고도 또는 초고도 엄격한 조건(하기 기재됨)하에 각각 자연 발생 60S 짧은 및/또는 60S 긴 프로모터의 핵산 서열의 상보체와 하이브리드화할 수 있다. 몇몇 양태에서, 본 발명의 60S 짧은 및/또는 60S 긴 프로모터 서열은 중도, 고도 또는 초고도 엄격한 조건하에 각각 서열번호 44 및/또는 서열번호 45의 상보체와 하이브리드화한다.
몇몇 양태에서, 본 발명의 프로모터는 ATCC 수탁번호 PTA-9614로 기탁된 pAB0011의 60S 긴 프로모터를 포함한다.
몇몇 양태에서, 본 발명의 분리된 핵산 분자는 Sec1 프로모터("Sec1 프로모터")를 포함한다. 본 발명의 Sec1 프로모터는 Sec1 코딩 영역의 상류(5' 영역 방향)에 자연적으로 위치하고 Sec1 전사를 유도하는 DNA 영역이다. 몇몇 양태에서, Sec1 프로모터는 서열번호 46으로 나타내어진 폴리뉴클레오티드 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 46과 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 프로모터 활성을 갖는다(즉, 적어도 Sec1 서열에 대해 기본 프로모터 전사 활성을 갖는다). 상동성(또는 % 동일성)은 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 200, 적어도 300, 적어도 400 또는 적어도 500개 뉴클레오티드 서열에 걸쳐 또는 전체 서열에 걸쳐 발견할 수 있다.
본 발명은 또한 서열번호 46과 하이브리드화하거나, 서열번호 46과 적어도 95% 동일한 폴리뉴클레오티드 서열과 하이브리드화하는 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 46, 또는 서열번호 46과 적어도 95% 동일한 폴리뉴클레오티드 서열과 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 본 발명의 Sec1 프로모터는 자연 발생 Sec1 프로모터 서열과 충분히 유사한 Sec1 프로모터 동족체를 포함하고, 여기서 당해 동족체의 핵산 서열은 중도, 고도 또는 초고도 엄격한 조건(하기 기재됨)하에 자연 발생 Sec1 프로모터의 핵산 서열의 상보체와 하이브리드화할 수 있다. 몇몇 양태에서, 본 발명의 Sec1 프로모터 서열은 중도, 고도 또는 초고도 엄격한 조건하에 서열번호 46의 상보체와 하이브리드화한다.
몇몇 양태에서, 본 발명의 프로모터는 ATCC 수탁번호 PTA-9613으로 기탁된 pAB0022의 Sec1 프로모터를 포함한다.
터미네이터
본 발명은 또한 전사 터미네이터인 신규한 조절 제어 요소에 관한 것이다. 본 발명의 터미네이터 영역은 전사를 위해 게놈 DNA에서 유전자 서열의 말단을 표지하는 유전자 서열 부분이다.
몇몇 양태에서, 터미네이터 영역은 라비린툴로마이코타문 기원이다. 몇몇 양태에서, 터미네이터 영역은 트라우스토키트리드 기원이다. 몇몇 양태에서, 터미네이터 영역은 쉬조키트리움 또는 트라우스토키트리움 기원이다. 스키토키트리움(Schizochytrium)은, 이로써 한정되는 것은 아니지만, 쉬조키트리움 아그레가툼(Schizochytrium aggregatum), 쉬조키트리움 리마시눔(Schizochytrium limacinum), 쉬조키트리움(Schizochytrium) 종(S31)(ATCC 20888), 쉬조키트리움(Schizochytrium) 종(S8)(ATCC 20889), 쉬조키트리움(Schizochytrium) 종(LC-RM)(ATCC 18915), 쉬조키트리움(Schizochytrium) 종(SR 21), 기탁된 균주 ATCC 28209 및 기탁된 균주 IFO 32693을 포함한다.
본 발명의 터미네이터 영역은 적어도 트라우스토키트리드에서 터미네이터 활성을 갖고, 전장 터미네이터 서열 및 이의 작용성 단편, 융합 서열 및 자연 서열 터미네이터 영역의 동족체를 포함한다. 터미네이터의 동족체는 적어도 하나 또는 몇개, 이로써 한정되는 것은 아니지만, 하나 또는 몇개의 뉴클레오티드가 결실, 삽입, 전환, 치환 및/또는 유도체화되어 있다는 점에서 자연 발생 터미네이터와는 상이하다. 몇몇 양태에서, 본 발명의 터미네이터의 동족체는 적어도 트라우스토키트리드에서 터미네이터 영역으로서 활성을 보유하지만, 당해 활성은 특정한 자극에 따라 증가, 감소 또는 생성될 수 있다.
몇몇 양태에서, 본 발명은 PUFA PKS OrfC 유전자의 터미네이터 영역("PKS OrfC 터미네이터 영역")을 포함하는 분리된 핵산 분자를 포함한다. 본 발명의 PKS OrfC 터미네이터 영역은 전사를 위해 게놈 DNA에서 OrfC 유전자 서열의 말단을 표지하는 유전자 서열 부분이다. 몇몇 양태에서, 터미네이터 영역은 서열번호 4로 나타내어진 폴리뉴클레오티드 서열을 갖는다. 서열번호 4에 개시된 터미네이터 영역은 트라우스토키트리드 미생물로부터의 자연 발생(야생형) 터미네이터 서열이고, 구체적으로는 스키토키트리움 PKS OrfC 터미네이터 영역이고 "OrfC 터미네이터 요소 1"로서 지칭된다. 몇몇 양태에서, 본 발명의 핵산 분자는, 서열번호 4와 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하고 적어도 트라우스토키트리드에서 PUFA PKS OrfC 터미네이터 영역으로서 적어도 작용하는 폴리뉴클레오티드 서열을 포함한다. 상동성(또는 % 동일성)은 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 150 또는 적어도 200개 뉴클레오티드 서열에 걸쳐 또는 전체 서열에 걸쳐 발견할 수 있다.
본 발명은 또한 서열번호 4와 하이브리드화하거나, 서열번호 4와 적어도 95% 동일한 폴리뉴클레오티드 서열과 하이브리드화하는 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 4, 또는 서열번호 4와 적어도 95% 동일한 폴리뉴클레오티드 서열과 완전히 상보적인 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자를 포함한다. 몇몇 양태에서, 본 발명의 PKS OrfC 터미네이터 영역은 자연 발생 PUFA PKS OrfC 터미네이터 영역과 충분히 유사한 PKS OrfC 터미네이터 영역 동족체를 포함하고, 여기서 동족체의 핵산 서열은 중도, 고도 또는 초고도 엄격한 조건(하기에 기재됨)하에 자연 발생 PKS OrfC 터미네이터 영역의 핵산 서열의 상보체와 하이브리드화할 수 있다. 몇몇 양태에서, PKS OrfC 터미네이터 영역 서열은 중도, 고도 또는 초고도 엄격한 조건하에 서열번호 4의 상보체와 하이브리드화한다.
몇몇 양태에서, 본 발명의 터미네이터는 ATCC 수탁번호 PTA-9614로 기탁된 pAB0011의 OrfC 터미네이터 영역을 포함한다.
신호 펩티드
본 발명은 또한 신호 펩티드를 코딩하는 신규한 핵산 분자에 관한 것이다.
몇몇 양태에서, 본 발명은 라비린툴로마이코타문의 미생물로부터 분비된 단백질의 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 몇몇 양태에서, 미생물은 트라우스토키트리드이다. 몇몇 양태에서, 미생물은 쉬조키트리움(Schizochytrium) 또는 트라우스토키트리움(Thraustochytrium)이다.
본 발명의 신호 펩티드는 트리우스토키트리드에서 분비 신호 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 펩티드 및 자연 발생 신호 펩티드의 동족체를 포함한다. 신호 펩티드의 동족체는 적어도 하나 또는 수개, 이로써 한정되는 것은 아니지만, 하나 또는 수개의 아미노산이 결실, 전환, 치환 및/또는 유도체화(예를 들면, 글리코실화, 포스포릴화, 아세틸화, 미리스토일화, 프레닐화, 팔미트화, 아미드화 및/또는 글리코포스파티딜 이노시톨의 부가에 의해)되어 있다는 점에서 자연 발생 신호 펩티드와는 상이하다. 몇몇 양태에서, 신호 펩티드의 동족체는 적어도 트라우스토키트리드에서 신호로서 활성을 보유하지만, 당해 활성은 특정한 자극에 따라 증가, 감소 또는 형성될 수 있다.
몇몇 양태에서, 분리된 핵산 분자는 Na/Pi-IIb2 수송체 단백질 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. Na/Pi-IIb2 수송체 단백질 신호 펩티드는 적어도 트라우스토키트리드에서 Na/Pi-IIb2 수송체 단백질에 대해 적어도 신호 표적화 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 펩티드 및 다연 발생 Na/Pi-IIb2 수송체 단백질 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, Na/Pi-IIb2 수송체 단백질 신호 펩티드는 서열번호 1로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, Na/Pi-IIb2 수송체 단백질 신호 펩티드는 서열번호 15로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 1 또는 서열번호 15와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 Na/Pi-IIb2 수송체 단백질에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 Na/Pi-IIb2 수송체 단백질에 대해 신호 펩티드로서 작용하는 서열번호 1 또는 서열번호 15의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 2를 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 2; (ii) 서열번호 2와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; (iii) 서열번호 1을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (vi) 서열번호 15를 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 2: (ii) 서열번호 2와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; (iii) 서열번호 1을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (vi) 서열번호 15를 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 Na/Pi-IIb2 수송체 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 1; (ii) 서열번호 15; 및 (iii) 적어도 트라우스토키트리드에서 적어도 Na/Pi-IIb2에 대해 신호 서열로서 작용하는 서열번호 1 또는 서열번호 15와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 15의 처음 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산 잔기를 포함한다(즉, 당해 서열의 C 말단에서 마지막 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개 아미노산이 결실되어 있는 서열번호 15). 서열번호 15의 C 말단에 위치된 18번 아미노산은 성숙 Na/Pi 수송체 단백질의 일부인 것으로 예상되고, 신호 서열의 절단 부위는 서열번호 15의 아미노산 잔기 35번 및 36번 사이에서 발생하는 것으로 예상된다. 그러나, 성숙 Na/Pi 수송체 단백질의 모든 18개 이하의 아미노산을 포함하는 신호 펩티드(즉, 서열번호 15의 마지막 18개 아미노산)을 사용할 수 있고, 본 발명에 의해 고려된다. 본 발명에 따라서, 분리된 폴리펩티드는 이의 천연 환경으로부터 제거된 폴리펩티드이고(즉, 사람 조작으로 처리한 폴리펩티드)이고, 예를 들면, 정제된 단백질, 정제된 펩티드, 부분 정제된 단백질, 부분 정제된 펩티드, 재조합 생산된 단백질 또는 펩티드, 및 합성 생산된 단백질 또는 펩티드를 포함할 수 있다. 이와 같이, "분리된"은 당해 폴리펩티드가 정제된 정도를 반영하지는 않는다. 몇몇 양태에서, 본 발명의 분리된 Na/Pi-IIb2 수송체 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자는 알파-1,6-만노실트랜스퍼라제(ALG12) 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. ALG12 신호 펩티드는 적어도 트라우스토키트리드에서 적어도 ALG12 단백질에 대해 신호 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 펩티드, 및 자연 발생 ALG12 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, ALG12 신호 펩티드는 서열번호 59로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 59와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 당해 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 ALG12 단백질에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 ALG12 단백질에 대해 신호 펩티드로서 작용하는 서열번호 59의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 60을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 60, (ii) 서열번호 60과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 59를 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 60; (ii) 서열번호 60과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 59를 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 ALG12 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 59 및 (ii) 적어도 트라우스토키트리드에서 적어도 ALG12 단백질에 대해 신호 서열로서 작용하는 서열번호 59와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 59의 처음 24, 25, 26, 27, 28, 29, 30, 31 또는 32개 아미노산 잔기를 포함한다. 몇몇 양태에서, 본 발명의 분리된 ALG12 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자를 결합 면역글로불린 단백질(BiP) 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. BiP 신호 펩티드는 적어도 트라우스토키트리드에서 적어도 BiP 단백질에 대해 신호 표적화 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 펩티드, 및 자연 발생 BiP 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, BiP 신호 펩티드는 서열번호 61로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 61과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 BiP 단백질에 대해 신호 서열로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 BiP 단백질에 대해 신호 펩티드로서 작용하는 서열번호 61의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 62를 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 62; (ii) 서열번호 62와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 61을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 62, (ii) 서열번호 62와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열, 및 (iii) 서열번호 61을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 BiP 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 61 및 (ii) 적어도 트라우스토키트리드에서 적어도 BiP 단백질에 대해 신호 서열로서 작용하는 서열번호 61과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 61의 처음 23, 24, 25, 26, 27, 28, 29, 30 또는 31개 아미노산 잔기를 포함한다. 몇몇 양태에서, 본 발명의 분리된 BiP 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자는 알파-1,3-글루코시다제(GLS2) 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. GLS2 신호 펩티드는 적어도 트라우스토키트리드에서 적어도 GLS2 단백질에 대해 신호 표적화 활성을 가질 것이고, 전장 펩티드 및 이의 작용성 단편, 융합 단백질, 및 자연 발생 GLS2 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, GLS2 신호 펩티드는 서열번호 63으로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 63과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 GLS2 단백질에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 GLS2 단백질에 대해 신호 펩티드로서 작용하는 서열번호 63의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 64를 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 64; (ii) 서열번호 64와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 63을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 64; (ii) 서열번호 64와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 63을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 GLS2 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 63 및 (ii) 적어도 트라우스토키트리드에서 적어도 GLS2 단백질에 대해 신호 서열로서 작용하는 서열번호 63과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 63의 처음 30, 31, 32, 33, 34, 35, 36, 37 또는 38개 아미노산 잔기를 포함한다. 몇몇 양태에서, 본 발명의 분리된 GLS2 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자는 알파-1,3-1,6-만노시다제 유사 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. 알파-1,3-1,6-만노시다제 유사 단백질은 적어도 트라우스토키트리드에서 적어도 알파-1,3-1,6-만노시다제 유사 단백질에 대해 신호 표적화 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 단백질, 및 자연 발생 알파-1,3-1,6-만노시다제 유사 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, 알파-1,3-1,6-만노시다제 유사 신호 펩티드는 서열번호 65로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 65와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 알파-1,3-1,6-만노시다제 유사 단백질에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 알파-1,3-1,6-만노시다제 유사 단백질에 대해 신호 펩티드로서 작용하는 서열번호 65의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 66을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 66; (ii) 서열번호 66과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 65를 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 66, (ii) 서열번호 66과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열, 및 (iii) 서열번호 65를 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 알파-1,3-1,6-만노시다제 유사 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 65 및 (ii) 적어도 트라우스토키트리드에서 적어도 알파-1,3-1,6-만노시다제 유사 단백질에 대해 신호 서열로서 작용하는 서열번호 65와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 65의 처음 24, 25, 26, 27, 28, 29, 30, 31, 32, 33 또는 34개 아미노산 잔기를 포함한다. 몇몇 양태에서, 본 발명의 분리된 알파-1,3-1,6-만노시다제 유사 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자는 알파-1,3-1,6-만노시다제 유사 #1 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. 알파-1,3-1,6-만노시다제 유사 #1 신호 펩티드는 적어도 트라우스토키트리드에서 적어도 알파-1,3-1,6-만노시다제 유사 #1 단백질에 대해 표적화 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 단백질, 및 자연 발생 알파-1,3-1,6-만노시다제 유사 #1 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, 알파-1,3-1,6-만노시다제 유사 #1 신호 펩티드는 서열번호 67로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 67과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 알파-1,3-1,6-만노시다제 유사 #1 폴리펩티드에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 알파-1,3-1,6-만노시다제 유사 #1 단백질에 대해 신호 펩티드로서 작용하는 서열번호 67의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 68을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 68; (ii) 서열번호 68과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 67을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (ii) 서열번호 68; (ii) 서열번호 68과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 67을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 알파-1,3-1,6-만노시다제 유사 #1 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 67 및 (ii) 적어도 트라우스토키트리드에서 적어도 알파-1,3-1,6-만노시다제 유사 #1 단백질에 대해 신호 서열로서 작용하는 서열번호 67과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 67의 처음 23, 24, 25, 26, 27, 28 또는 29 아미노산 잔기를 포함한다. 몇몇 양태에서, 본 발명의 분리된 알파-1,3-1,6-만노시다제 유사 #1 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자는 알파-1,2-만노시다제 유사 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. 알파-1,2-만노시다제 유사 신호 펩티는 적어도 트라우스토키트리드에서 적어도 알파-1,2-만노시다제 유사 단백질에 대해 신호 표적화 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 단백질, 및 자연 발생 알파-1,2-만노시다제 유사 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, 알파-1,2-만노시다제 유사 신호 펩티드는 서열번호 69로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 69와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 알파-1,2-만노시다제 유사 단백질에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 알파-1,2-만노시다제 유사 단백질에 대해 신호 펩티드로서 작용하는 서열번호 69의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 70을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 70; (ii) 서열번호 70과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 69를 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 70; (ii) 서열번호 70과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 69를 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 알파-1,2-만노시다제 유사 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 69 및 (ii) 적어도 트라우스토키트리드에서 적어도 알파-1,2-만노시다제 유사 단백질에 대해 신호 서열로서 작용하는 서열번호 69와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 69의 처음 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 또는 36개 아미노산 잔기를 포함한다. 몇몇 양태에서, 본 발명의 분리된 알파-1,2-만노시다제 유사 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자는 베타-자이실로스디아제 유사 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. 베타-자이실로스디아제 유사 신호 펩티드는 적어도 트라우스토키트리드에서 적어도 베타-자이실로스디아제 유사 단백질에 대해 신호 표적화 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 펩티드, 및 자연 발생 베터-자이실로스디아제 유사 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, 베타-자이실로스디아제 유사 신호 펩티드는 서열번호 71로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 71과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 베타-자이실로스디아제 유사 단백질에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 자이실로스디아제 유사 단백질에 대해 신호 펩티드로서 작용하는 서열번호 71의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 72를 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 72; (ii) 서열번호 72와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 71을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 72, (ii) 서열번호 72와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열, 및 (iii) 서열번호 71을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 베타-자이실로스디아제 유사 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 71 및 (ii) 적어도 트라우스토키트리드에서 적어도 자이실로스디아제 유사 단백질에 대해 신호 서열로서 작용하는 서열번호 71과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 71의 처음 24, 25, 26, 27, 28, 29 또는 30개 아미노산 잔기를 포함한다. 몇몇 양태에서, 본 발명의 분리된 베타-자이실로스디아제 유사 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자는 카로텐 신타제 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. 카로텐 신타제 신호 펩티드는 적어도 트라우스토키트리드에서 적어도 카로텐 신타제 단백질에 대해 신호 표적화 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 펩티드, 및 자연 발생 카로텐 신타제 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, 카로텐 신타제 신호 펩티드는 서열번호 73으로 나타내어진 아미노산 서열을 갖는다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 73과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서, 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 카로텐 신타제 단백질에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 카로텐 신타제 단백질에 대해 신호 펩티드로서 작용하는 서열번호 73의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 74를 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 74를 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 74; (ii) 서열번호 74와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 73을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 74, (ii) 서열번호 74와 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 73을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 카로텐 신타제 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 73 및 (ii) 적어도 트라우스토키트리드에서 적어도 카로텐 신타제 단백질에 대해 신호 서열로서 작용하는 서열번호 73과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 73의 처음 15, 16, 17, 18, 19, 20, 21, 29, 30, 31, 32, 33 또는 34개 아미노산 잔기를 포함한다. 몇몇 양태에서, 본 발명의 분리된 카로텐 신타제 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서, 분리된 핵산 분자는 Sec1 단백질("Sec1") 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다. Sec1 신호 펩티드는 적어도 트라우스토키트리드에서 적어도 Sec1 단백질에 대해 분비 신호 활성을 가질 수 있고, 전장 펩티드 및 이의 작용성 단편, 융합 단백질, 및 자연 발생 Sec1 신호 펩티드의 동족체를 포함한다. 몇몇 양태에서, Sec1 신호 펩티드는 서열번호 37로 나타내어진다. 몇몇 양태에서, 본 발명의 분리된 핵산 분자는 서열번호 37과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함하고, 여기서 폴리뉴클레오티드 서열은 적어도 트라우스토키트리드에서 적어도 Sec1 단백질에 대해 신호 펩티드로서 작용하는 아미노산 서열을 코딩한다. 몇몇 양태에서, 분리된 핵산 분자는 적어도 트라우스토키트리드에서 적어도 Sec1 단백질에 대해 신호 펩티드로서 작용하는 서열번호 37의 작용성 단편을 포함하는 분리된 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 서열번호 38을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 38; (ii) 서열번호 38과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 37을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 하이브리드화하는 폴리뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 분리된 핵산 분자는 (i) 서열번호 38, (ii) 서열번호 38과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열; 및 (iii) 서열번호 37을 코딩하는 핵산 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 폴리뉴클레오티드 서열 중의 어느 하나와 완전히 상보적인 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 Sec1 신호 펩티드 아미노산 서열을 포함하는 분리된 폴리펩티드에 관한 것이다. 몇몇 양태에서, 분리된 폴리펩티드는 (i) 서열번호 37 및 (ii) 적어도 트라우스토키트리드에서 적어도 Sec1 수송체에 대해 신호 서열로서 작용하는 서열번호 37과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 아미노산 서열로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 몇몇 양태에서, 분리된 폴리펩티드는 서열번호 37의 처음 18 또는 19개 아미노산 잔기를 포함하는 아미노산 서열을 포함한다(즉, 당해 서열의 C 말단에서 마지막 1 또는 2개의 아미노산 결실되어 있는 서열번호 37). 몇몇 양태에서, 본 발명의 분리된 Sec1 신호 펩티드는 재조합에 의해 생성된다.
몇몇 양태에서 본 발명의 분리된 핵산 분자는 단백질을 코딩하는 핵산 서열의 5' 말단에 작동적으로 연결된 본 발명의 OrfC 프로모터, EF1 짧은 프로모터, EF1 긴 프로모터, 60S 짧은 프로모터, 60S 긴 프로모터, Sec1 프로모터, PKS OrfC 터미네이터 영역, Na/Pi-IIb2 수송체 단백질 신호 펩티드를 코딩하는 서열, 또는 Sec1 수송체 단백질 신호 펩티드를 코딩하는 서열을 포함한다. 본 발명은 또한 단백질을 코딩하는 핵산 서열의 5' 말단에 작동적으로 연결된 본 발명의 OrfC 프로모터, EF1 짧은 프로모터, EF1 긴 프로모터, 60S 짧은 프로모터, 60S 긴 프로모터, Sec1 프로모터, PKS OrfC 터미네이터 영역, Na/Pi-IIb2 수송체 단백질 신호 펩티드를 코딩하는 서열, 또는 Sec1 수송체 단백질 신호 펩티드를 코딩하는 서열을 포함하는 재조합 벡터(이로써 한정되는 것은 아니지만, 발현 벡터 포함), 발현 카세트 및 숙주 세포를 포함한다.
본 발명의 상기한 분리된 핵산 분자의 어느 하나(예: OrfC 프로모터, EF1 짧은 프로모터, EF1 긴 프로모터, 60S 짧은 프로모터, 60S 긴 프로모터, Sec1 프로모터, PKS OrfC 터미네이터 영역, Na/Pi-IIb2 수송체 단백질 신호 펩티드를 코딩하는 서열, 또는 Sec1 수송체 단백질 신호 펩티드를 코딩하는 서열)를 포함하는 재조합 벡터(이로써 한정되는 것은 아니지만, 발현 벡터 포함). 발현 카세트, 숙주 세포 및 미생물은 벡터 및/또는 발현 카세트를 숙주 세포 및 재조합 미생물에 도입하는 방법과 마찬가지로 본 발명에 포함된다. 적합한 벡터 및 발현 카세트는 적절한 조절 서열, 터미네이터 단편, 폴리아데닐화 서열, 인핸서 서열, 마커 유전자 및 적절한 기타 서열을 함유하도록 선별 또는 작제될 수 있다. 벡터, 발현 카세트 및 숙주 세포에 관한 추가의 상세 설명은 본원에 기재되어 있다.
본원에 사용된 바와 같이, 달리 명시되지 않는 한, 퍼센트(%) 동일성(및 % 상동성)의 기준은 (1) 아미노산 검색을 위한 blastp 및 핵산 검색을 위한 blastn을 표준 디폴트 파라메터로 사용하는 BLAST 2.0 Basic BLAST 상동성 검색으로, 이때 질의 서열이 디폴트에 의해 복잡성이 낮은 영역에 대해 필터링되는 검색(전체가 본원에서 참조로 도입되는 문헌[참조: Altschul, S., al., Nucleic Acids Res. 25:3389-3402]); (2) 하기 기재된 파라미터를 사용하는 BLAST 2 정렬; (3) 및/또는 표준 디폴트 파라메터로서 PSI-BLAST (Position-Specific Iterated BLAST)를 사용하여 수행되는 상동성의 평가를 지칭한다. BLAST 2.0 Basic BLAST와 BLAST 2 간의 표준 파라메터에서의 약간의 차이로 인해, 2개의 특정 서열이 BLAST 2 프로그램을 사용하여 유의한 상동성이 있는 것으로 인식될 수 있는 반면, 서열들 중 하나를 질의 서열로 사용하여 BLAST 2.0 Basic BLAST에서 수행된 검색에서는 최상의 매치에서 제2 서열이 확인되지 않을 수 있다는 것이 주목된다. 또한, PSI-BLAST는 사용하기 쉬운 자동화 버젼의 "프로파일" 검색을 제공하고, 이는 서열 상동체를 찾기 위한 감도높은 방식이다. 이 프로그램은 먼저 갭(gapped) BLAST 데이터베이스 검색을 수행한다. PSI-BLAST 프로그램은 부위-특이적 스코어 매트릭스를 작제하도록 복귀된 임의의 유의한 정렬로부터의 정보를 사용하고, 상기 매트릭스는 다음 회차의 데이터베이스 검색을 위해 질의 서열을 교체한다. 따라서, 이러한 프로그램들 중 임의의 하나를 사용함으로써 퍼센트 동일성이 결정될 수 있는 것으로 이해된다.
예를 들면, 이의 전체가 본원에서 참조로 도입되는 문헌[참조: Tatusova and Madden, FEMS Microbiol. Lett. 174:247-250]에 기술된 바와 같은 BLAST 2 서열을 사용하여 2개의 특정 서열을 서로 정렬할 수 있다. 2개의 서열 간의 Gapped BLAST 검색 (BLAST 2.0)을 수행하기 위해 BLAST 2.0 알고리즘을 사용하여 blastp 또는 blastn에서 BLAST 2 서열 정렬을 수행하여, 생성된 정렬에 갭(결실 및 삽입)을 도입한다. 몇몇 양태에서, 하기와 같은 표준 디폴트 파라메터를 사용하여 BLAST 2 서열 정렬을 수행한다.
blastn의 경우, 0 BLOSUM62 매트릭스를 사용한다:
매치 보상 = 1
미스매치 패널티 = -2
개방 갭(5) 및 신장 갭(2) 페널티 갭 x_dropoff(50)expect(10) 워드 사이즈(11) 필터(on).
blastp의 경우, 0 BLOSUM62 매트릭스를 사용한다:
개방 갭(11) 및 신장 갭(1) 패널티
갭 x_dropoff(50)expect(10 워드 사이즈(3) 필터(on).
본원에 사용된 바와 같이, 하이브리드화 조건은 핵산 분자를 사용하여 유사한 핵산 분자를 확인하는 표준 하이브리드화 조건을 지칭한다[참조: Sambrook J. and Russell D.(2001) Molecular Cloning: A Laboratory Manual, 3rd ed. Cold Spring Harbor Labs Press, Cold Spring Harbor, New York, 이의 전체 내용은 본원에서 참조로 도입됨]. 또한, 적절한 하이브리드화를 계산하는 수학식 및 뉴클레오티드의 상이한 미스매치 정도를 허용하는 하이브리드화를 달성하기 위한 세정 조건은, 예를 들면, 문헌[참조: Meinkoth et al., Anal. Biochem. 138, 267-284 (1984), 이의 전체 내용은 본원에서 참조로도입됨]에 개시되어 있다.
더욱 특히, 본원에서 지칭되는 중도 엄격한 하이브리드화 및 세정 조건은 하이브리드화 반응에서 프로브로 사용될 핵산 분자와의 핵산 서열 동일성이 적어도 약 70%인 핵산 분자가 분리되도록 하는 조건(즉, 뉴클레오티드들의 약 30% 이하의 미스매치를 허용하는 조건)을 지칭한다. 본원에서 지칭되는 고도 엄격한 하이브리드화 및 세정 조건은 하이브리드화 반응에서 프로브로 사용될 핵산 분자와의 핵산 서열 동일성이 적어도 약 80%인 핵산 분자가 분리되도록 하는 조건(즉, 뉴클레오티드의 약 20% 이하의 미스매치를 허용하는 조건)을 지칭한다. 본원에서 지칭되는 초고도 엄격한 하이브리드화 및 세정 조건은 하이브리드화 반응에서 프로브로 사용될 핵산 분자와의 핵산 서열 동일성이 적어도 약 90%인 핵산 분자가 분리되도록 하는 조건(즉, 뉴클레오티드의 약 10% 이하의 미스매치를 허용하는 조건)을 지칭한다. 상기에서 논의된 바와 같이, 당업자는, 예를 들면, 문헌[참조: Meinkoth et al.]의 수학식을 사용하여 이러한 특정 수준의 뉴클레오티드 미스매치를 달성하기 위한 적합한 하이브리드화 및 세정 조건을 계산할 수 있다. 이러한 조건은 DNA:RNA 또는 DNA:DNA 하이브리드가 형성되는지 여부에 따라 달라질 것이다. DNA:DNA 하이브리드에 대한 계산된 용융 온도는 DNA:RNA 하이브리드에 대해 10℃ 더 낮다. 특정 양태에서, DNA:DNA 하이브리드에 대한 엄격한 하이브리드화 조건은, 적합한 세정 조건과 함께, 6× SSC(0.9 M Na+)의 이온 강도, 약 20℃ 내지 약 35℃ 사이 (낮은 엄격성), 약 28℃ 내지 약 40℃ 사이 (더욱 엄격함), 및 약 35℃ 내지 약 45℃ 사이 (더욱 더 엄격함)의 온도에서의 하이브리드화를 포함한다. 특정 양태에서, DNA:RNA 하이브리드에 대한 엄격한 하이브리드화 조건은, 유사하게 엄격한 세정 조건과 함께, 6×SSC(0.9 M Na+)의 이온 강도, 약 30℃ 내지 약 45℃ 사이, 약 38℃ 내지 약 50℃ 사이, 및 약 45℃ 내지 약 55℃ 사이의 온도에서의 하이브리드화를 포함한다. 이러한 값들은 약 100개의 뉴클레오티드보다 큰 분자, 0% 포름아미드 및 약 40%의 G + C 함량에 대한 용융 온도의 계산을 기초로 한다. 또는, Tm은 문헌[참조: Sambrook et al.]에 기재된 바와 같이 경험적으로 계산할 수 있다. 일반적으로, 세정 조건은 가능한 한 엄격하여야 하고, 선택된 하이브리드화 조건에 적합하여야 한다. 예를 들면, 하이브리드화 조건은 특정 하이브리드의 계산된 Tm보다 대략 20-25℃ 낮은 온도 및 염 조건들의 조합을 포함할 수 있고, 전형적으로 세정 조건은 특정 하이브리드의 계산된 Tm보다 대략 12-20℃ 낮은 온도 및 염 조건들의 조합을 포함한다. DNA:DNA 하이브리드와 사용하기에 적절한 하이브리드화 조건의 한 가지 예는 6× SSC(50% 포름아미드), 약 42℃에서 2-24시간 하이브리드화시킨 후, 실온, 약 2×SSC에서의 1회 이상의 세정, 이어서 더 높은 온도 및 더 낮은 이온 강도에서 추가적인 세정(예를 들면, 약 37℃, 약 0.1×-0.5× SSC에서의 1회 이상의 세정, 이어서 약 68℃, 약 0.1×-0.5× SSC에서의 1회 이상의 세정)을 포함한다.
본 발명이 일반적으로 기재되었지만, 하기 제공된 실시예를 참조로 하여 추가의 이해가 수득될 수 있다. 이들 실시예는 단지 설명을 위한 것이며, 한정하는 것으로 의도되지 않는다.
실시예 1
쉬조키트리움 단백질 발현 벡터 pSchizE의 작제
a. p07074#6의 작제:
pSP73 벡터(Promega, acc#X65333)를 XbaI 및 녹두 뉴클레아제로 소화시킨 다음 정제하고, 결찰시켜 벡터 p070604#3을 생성했다. 이어서, p070604#3을 Sphl, Hpal 및 녹두 뉴클레아제로 추가로 소화시킨 다음, 정제하고, 재결찰시켜 벡터 p070704#6을 생성했다.
b. pSchizl의 작제:
국제 출원 공개공개공보 제WO02/083869에 기재된 바와 같은 pTUBzeoll-2 벡터를 BamHI로 소화시켜, 쉬조키트리움 α-투불린 프로모터, ble 유전자 및 SV40 터미네이터 영역을 함유하는 1122개 염기쌍(bp) 단편을 방출시켰다. 이 단편을 겔 정제하고, 미리 BamHI로 소화시킨 벡터 pYES2/CT(Invitrogen)에 결찰시켰다. 이어서, 생성된 작제물을 Smal, Sphl 및 녹두 뉴클레아제로 소화시켜 α-투불린 프로모터를 함유하는 540bp 단편을 방출시켰다. 이 단편을 미리 BamHI, SmaI 및 녹두 리가제로 소화시킨 pUC19(Genbank Accession No. L09137)로 결찰시켜 pSchizl을 생성했다.
c. pSchiz2의 작제:
별도의 반응에서, PCR을 사용하여, 결찰을 위해 NcoI 및 PciI 제한 부위(이탤릭체로 도시됨)을 도입한 하기 프라이머를 사용하여 pTUBzeoll-2로부터 SV40 터미네이터를 코딩하는 앰플리콘을 생성했다:
프라이머 S4termF: 5'-GATCCCATGGCACGTGCTACG (서열번호 16)
프라이머 S4termR: 5'-GGCAACATGTATGATAAGATAC (서열번호 17)
생성된 앰플리콘을 NcoI 및 PciI로 소화시켜 점착 말단을 노출시켰다. 이어서, 이러한 265 bp 단편을 미리 NcoI로 소화시킨 pSchiz1에 결찰시켰다. 생성된 플라스미드(pSchiz2로 지칭함)은 α-투불린 프로모터, 이어서 SV40 터미네이터를 함유했다.
d. pSchiz3의 작제:
별도의 반응에서, PCR을 사용하여, 어느 하나의 말단에 SmaI 부위(이탤릭체로 도시됨)을 부가하도록 설계된 하기 프라이머를 사용하여 pYES2/CT로부터 다중 클로닝 부위(MCS)를 증폭시켰다:
프라이머 C2mcsSmaF: 5'-GATCCCCGGGTTAAGCTTGGT (서열번호 18)
프라이머 C2mcsSmaR: 5'-ACTGGGGCCCGTTTAAACTC (서열번호 19)
이어서, 생성된 MCS 앰플리콘을 Smal로 소화시키고, 미리 NcoI 및 녹두 뉴클레아제로 소화시킨 pSchiz2에 결찰시켰다. 생성된 벡터(pSchiz3로 지칭됨)은 알파 투불린 프로모터, SV40 터미네이터 및 pYES2/CT MCS를 함유했다.
e. pSchiz0.5#4의 작제
PCR을 하기 프라이머 및 주형으로서의 pSchiz3와 함께 사용하여, α-투불린 프로모터, pYES2/CT MCS 및 SV40 터미네이터 영역으로 이루어진 MCS 카세트를 코딩하는 앰플리콘을 생성했다.
프라이머 5'tubMCS_BglII: 5'-GACTAGATCTCAATTTTAGGCCCCCCACTGACCG (서열번호 20)
프라이머 3'SV40MCS_Sal: 5'-GACTGTCGACCATGTATGATAAGATACATTGATG (서열번호 21)
이들 프라이머는 MCS 카세트 앰플리콘의 말단에 Bg1II 및 Sa1I 제한 부위(이탤릭체로 도시됨)를 부가하도록 설계되었다. 생성된 PCR 단편을 BglII 및 SalI으로 소화시키고, 미리 Bg1II 및 Sa1I로 소화시킨 p070704#6에 결찰시켜 pSchizO.5#4를 생성했다.
f. pSchizE의 작제
PCR을 사용하여, 주형으로서 미국 특허 제7,001,772호에 기재된 벡터 pMON50203을 사용하여 ALS 유전자를 코딩하는 4776 bp 앰플리콘(이의 프로모터 및 터미네이터 영역을 포함함)을 생성했다. NdeI 및 BglII 제한 부위(이탤릭체로 도시됨)을 함유하는 하기 프라이머가 당해 PCR 반응에 사용했다:
프라이머 5'ALSproNde3: 5'-GACTCATATGGCCCAGGCCTACTTTCAC (서열번호 22)
프라이머 3'ALStermBglII: 5'GACTAGATCTGGGTCAAGGCAGAAGAATTCCGCC (서열번호 23)
이어서, 생성된 ALS 앰플리콘을 Bg1II 및 NdeI로 소화시켰다. pSchizO.5#4은 마찬가지로 Bg1II 및 NdeI로 소화시키고, 보다 큰 3171 bp 밴드를 겔 정제하고, 정제된 ALS PCR 앰플리콘으로 결찰시켰다. 생성된 벡터(pSchizE로 지칭됨)을 서열분석하여 확인하고, ALS 유전자(프로모터 및 터미네이터 영역을 포함함), 이어서 쉬조키트리움 α-투불린 프로모터, pYES2/CT MCS 및 SV40 터미네이터 영역을 하유하는 발현 카세트를 함유했다(도 5 참조).
실시예 2
쉬조키트리움 단백질 발현 벡터 pSchiz-sG의 작제
eGFP의 발현 및 분비는 pSchiz-sG을 사용하여 달성했다(도 6 참조). 당해 플라스미는 또한 pCOOOOl로서 지칭하고, 아메리칸 타입 컬쳐 컬렉션(American Type Culture Collection, Patent Depository, 10801 University Boulevard, Manassas, VA 20110-2209)에 2008년 11월 18일자로 기타하고, ATCC 수탁번호 PTA-9617을 부여받았다. 당해 벡터는 (i) 쉬조키트리움 α-투불린 프로모터 서열, 이어서 (ii) eGFP 암호화 서열에 부착 및 융합된 성숙 수송체 단백질의 N 말단 부분의 단편을 갖는 쉬조키트리움 Na/Pi 수송체 신호 서열을 코딩하는 서열(서열번호 15), 이어서 (iii) 나머지 MCS 및 (iv) SV40 터미네이터 영역을 함유한다. 당해 벡터는 또한 선별가능한 마커로서 쉬조키트리움 ALS 유전자를 함유한다. 당해 벡터는 하기 기재된 바와 같이 작제했다.
신호 펩티드(서열번호 2)를 코딩하도록 선택된 서열은 쉬조키트리움 EST 라이브러리로부터 분리한 Na/Pi 수송체로부터 기원했다. 신호 펩티드 및 eGFP를 코딩하는 뉴클레오티드 서열은 eGFP 함유 플라스미드 pPha-Tl-eGFP를 사용하여 PCR에 의해 융합하고[참조: Apt et al., J. Cell Sci. 7/5:4061-4069 (2002)], 3개 프라이머는 신호 서열을 부가하도록 설계했다. 1차 PCR 반응은 주형으로서 eGfp 함유 플라스미드, eGfp의 3' 말단에 있는 작은 프라이머(SpeI 부위를 함유하는 프라이머 sec Gfp3'Spe, 하기에 이탤릭체로 도시됨), 및 eGfp의 5' 말단과 신호 서열의 3' 말단에 플랭킹된 100 bp 프라이머(프라이머 2차.Gfp5'lb, sec)를 사용했다. 프라이머 서열은 다음과 같다:
프라이머 2차 Gfp5'lb: 5'-TACTGGTTCCTTGTCGGCCTCGCCCTTCTCGGCGAT GGCTTCAAGGTCATCGCCGGTGACTCCGCCGGTACGCTCTTCATGGTGAGCAAGGGCGAGG (서열번호 24)
프라이머 2차 Gfp3'Spe: 5'-CGTCACTAGTTTACTTGTACAGCTCGTCCATGCC (서열번호 25)
2차 PCR 반응에서, 1차 PCR의 증폭 생성물을 주형으로서 사용했다. 동일한 3' 프라이머를 나머지 신호 서열이 도입된 2차 100 bp 5' 프라이머(2차 Gfp5'Bam)와 함께 사용했다. 2차 5' 프라이머 서열은 BamHI 부위(하기에 이탤릭체로 도시됨)을 함유했고, 다음과 같다:
프라이머 2차 Gfp5'Bam: 5'-TAATGGATCCATGGCCAACATCATGGCC AACGTCACGCCCCAGGGCGTCGCCAAGGGCTTTGGCCTCTTTGTCGGCGTGCTCTTCTTTCTCTACTGGTTCCTTGT (서열번호 26)
이러한 2차 PCR 반응으로부터 생성된 PCR 생성물은 클로닝을 위한 BamHI 및 SpeI 부위를 함유했다.
2차 PCR 반응의 앰플리콘 및 pSchizE를 둘다 BamHI 및 SpeI로 소화시키고, 서로 결찰시켜 벡터 pSchiz-sG를 생성했다.
실시예 3
쉬조키트리움 단백질 발현 벡터 pSchiz-sGr의 작제
pSchiz-sGr 벡터는 α-투불린 프로모터, ER 체류 신호를 코딩하는 서열을 갖는 eGFP 뉴클레오티드 서열, SV40 터미네이터 영역, 및 성숙 ALS 선별가능한 마커를 포함한다.
통상의 ER 체류 신호 아미노산 서열 HDEL을 역해독하고, 이러한 체류 신호를 코딩하는 서열(서열번호 14)을 주형으로서 실시예 2의 pSchiz-sG를 사용하여 PCR에 의해 eGFP에 융합시켰다. 올리고뉴클레오티드 프라이머는 정지 코돈(박스로 도시됨), + 하나의 프라이머 내의 BamHI 부위(이탤릭체로 도시됨) 및 다른 프라이머 내의 EcoRV 부위(이탤릭체화됨)과 함께 프레임 내에 HDEL 코딩 서열(하기 ss.eGfpHELD3'RV 프라이머에서 밑줄된 역전 상보체)을 포함한다.
프라이머 ss.eGfpHELD3'RV: 5'-CCTGATATC TTA CAACTCGTCGTGGTTGTACAGCTCGTCC (서열번호 27)
Primer sec.Gfp5'Bam2: 5'-TAATGGATCCATGGCCAACATCATGGCCAACGT CACGCCCCAGGGCGTCGCCAAGGGCTTTGGCCTCTTTGTCGGCGTGCTCTTCTTTCTCTACTGGTTCCTTGT (서열번호 28)
생성된 PCR 생성물을 BamHI 및 EcoRV로 소화시키고, pSchizE(실시예 1에 기재됨)을 BamHI 및 EcoRV로 소화시켜 생성한 보다 큰 단편에 결찰시켰다. 생성된 벡터를 pSchiz-sGr로 명명했다(도 7 참조).
실시예 4
쉬조키트리움 단백질 발현 벡터 pSchiz-cG의 작제
비교 대조군으로서, pSchiz-cG 벡터를 작제하여, 형광 단백질이 세포 세포질 내에 축적되도록 하는 방식으로 eGFP를 발현시켰다. pSchiz-cG 플라스미드는 쉬조키트리움 OrfC 프로모터, eGFP를 코딩하는 폴리뉴클레오티드 서열, SV40 프로모터 영역 및 돌연변이된 쉬조키트리움 ALS 선별가능한 마커를 포함한다.
먼저, 쉬조키트리움 ORFC 상류의 2000 bp 서열을 쉬조키트리움 종 ATCC 20888의 게놈 DNA로부터의 하기 서열로 PCR 증폭시켰다:
프라이머 prREZ15: 5'-CGGTACCCGCGAATCAAGAAGGTAGGC (서열번호 29)
프라이머 prREZl6: 5'-CGGATCCCGTCTCTGCCGCTTTTTCTT (서열번호 30)
prREZ15 및 prREZl6 프라이머는 각각 KpnI 및 BamHI 서열을 함유했다(이탤릭체). 생성된 앰플리콘을 BamHI 및 KpnI로 소화시키고, 겔 정제했다.
이어서, 쉬조키트리움 OFRC 하류의 1985 bp 서열을 쉬조키트리움 종 ATCC 20888의 게놈 DNA로부터의 하기 프라이머로 증폭시켰다:
프라이머 prREZ17: 5'-CGGATCCGAAAGTGAACCTTGTCCTAACCC (서열번호 31)
프라이머 prREZ18: 5'-CTCTAGACAGATCCGCACCATCGGCCG (서열번호 32)
prREZ17 및 prREZ18 프라이머는 각각 BamHI 서열 및 XbaI 서열을 함유했다(이탤릭체). 생성된 앰플리콘을 BamHI 및 XbaI로 소화시키고, 겔 정제했다.
이어서, 벡터 pBluescript SK(+)(Stratagene, acc# X52328)를 KpnI 및 XbaI로 소화시키고, 겔 정제했다. 상기 생성된 이 벡터 및 2개의 앰플리콘을 동시에 결찰시켜 벡터 pREZ22을 생성했다.
이어서, 벡터 pSchizE(실시예 1)을 BamHI으로 소화시키고, 녹두 뉴클레아제로 처리하고, 컬럼 정제하고, XbaI로 소화시킨 다음, 겔 정제했다. 이어서, 하기 프라이머로 PCR을 수행하여, eGFP 코딩 영역을 함유하는 앰플리콘을 생성했다(주형 pPha-Tl-eGFP을 사용함):
프라이머 5'eGFP_kpn: 5'-GACTGGTACCATGGTGAAGCAAGGGCGAGGAG (서열번호 33)
프라이머 3'eGFP_xba: 5'-GACTTCAGATTACTTGTACAGCTCGTCCATGCC (서열번호 34)
이어서, 당해 앰플리콘을 XbaI로 소화시키고, 상기한 pSchizE의 단편에 결찰시켜 벡터 pSchizE-eGFP를 생성했다.
이어서, 주형으로서 pREZ22와 함께 PCR을 사용하여, ORFC의 프로모터를 코딩하는 앰플리콘을 생성했다. 각각 KpnI 제한 부위 서열(이탤랙체로 도시됨)을 당해 PCR에 사용했다:
프라이머 5'ORFCproKpn-2: 5'-GATCGGTACCGGTGTTCTTTGTTTTGATTTCT (서열번호 35)
프라이머 3'ORFCproKpn-2: 5'-GATCGGTACCGTCTCTGCCGCTTTTTCTTTA (서열번호 36)
이어서, 당해 앰플리콘을 KpnI로 소화시켰다. 이어서, pSchizE-eGFP 벡터를 또한 KpnI로 소화시켜 2개의 단편을 생성했다. 보다 큰 단편(7554 bp)을 겔 정제하고, 상기 KpnI 소화된 앰플리콘에 결찰시켜 pSchiz-cG 벡터를 생성하고, 이는 쉬조키트리움 ORFC 프로모터 서열, 이어서 eGFP 서열 및 SV40 터미네이터 영역(도 8 참조)을 함유했다.
실시예 5
쉬조키트리움의 형질전화 및 후속의 단백질 발현
달리 명시하지 않는 한, 모든 벡터 및 작제물은 소정 규모의 배양물에 적절한 Qiagen 키트(Valencia, CA)를 사용한 플라스미드 정제를 위해 이. 콜라이 UltraMax DH5-α FT 화학적 경쟁 세포(Invitrogen, Carlsbad, CA)에서 전파시켰다.
쉬조키트리움 종 ATCC 번호 20888의 배양물은 10 g/L 글루코즈, 0.8 g/L (NH4)2SO4, 5 g/L Na2SO4, 2 g/L MgSO4·7H2O, 0.5 g/L KH2PO4, 0.5 g/L KCl, 0.1 g/L CaCl2·2H2O, 0.1 M MES(pH 6.0), 0.1% PB26 금속 및 0.1% PB26 비타민(v/v)으로 이루어진 M2B 배지에서 성장시켰다. PB26 비타민은 50 mg/mL 비타민 B 12, 100 ㎍/mL 티아민 및 100 ㎍/mL Ca-판토테네이트로 이루어졌다. PB26 금속은 pH 4.5로 조정했고, 3 g/L FeSO4·7H2O, 1 g/L MnCl2·4H2O, 800 mg/mL ZnSO4·7H2O, 20 mg/mL CoCl2-6H2O, 10 mg/mL Na2MoO4·2H2O, 600 mg/mL CuSO4·5H2O 및 800 mg/mL NiSO4·6H2O로 이루어졌다. PB26 스톡 용액을 별도로 여과 멸균시키고, 오토클레이빙후 브로쓰에 첨가했다. 글루코즈, KH2PO4 및 CaCl2·2H2O를 혼합 전에 나머지 브로쓰 성분으로부터 별도로 오토클레이빙하여 염 침전 및 탄수화물 카라멜화를 방지했다. 모든 배지 성분은 시그마 케미칼(Sigma Chemical; St. Louis, MO)로부터 구입했다. 쉬조키트리움 배양물은 지수 상으로 성장시키고, 벡터 pSchiz-El(실시예 1), pSchiz-sG (실시예 2), pSchiz-sGr (실시예 3) 또는 pSchiz-cG(실시예 4)를 사용하여 Biolistic™ 입자 충격(BioRad, Hercules, CA)으로 형질전환시켰다. Biolistic™ 형질전환 공정은 본질적으로 상기 기재한 바와 동일하다[참조: Apt et al, J. Cell. ScL 775(Pt 21):4061-9 (1996) 및 U.S. Patent No. 7,001,772]. 1차 형질전환체는 27℃에서 2 내지 6일 후에 20 g/L 한천(VWR, West Chester, PA), 10 ㎍/mL 설포메투론 메틸(SMM)(Chem Service, Westchester, PA)을 함유하는 고체 M2B 배지 상에서 선별했다. 또한, 모든 1차 형질전환체를 SMM을 갖는 신선한 M2B 플레이트로 옮겼다.
1차 형질전환체 콜로니를 형광 및 광 현미경으로 분석했다. 1차 형질전환체 콜로니를 사용하여 50 mL의 M2B-SMM 액체 배지를 접종시켰다. 27℃에서 2 내지 5일 동안 배양한 후, 배양물을 15분 동안 5500×g에서 원심분리하여 수거했다. 세포 비함유 상청액은 Centriprep™ 중력 농축기(Millipore, Billerica, MA)를 사용하여 100배 농축시키고, 세포 펠렛을 물에서 세정하고, 액체 질소에서 동결시킨 다음, 용해 완충액(50 mM 인산나트륨(pH 7.4), 1 mM EDTA, 5% 글리세롤 및 1 mM 신선한 페닐메틸설포닐플루오라이드를 함유함)의 펠렛 중량의 2배 및 0.5 mm 유리 비드(Sigma, St. Louis, MO)의 펠렛 중량의 2배로 재현탁시켰다. 이어서, 세포 펠렛 혼합물을 다중관 와동기(VWR, Westchester, PA)에서 3시간 동안 최대 속도로 4℃에서 와동시켜 용해시켰다. 이어서, 세포 용해물을 5500×g에서 10분 동안 4℃로 원심분리했다. 상청액을 체류시키고, 5500×g에서 10분 동안 4℃로 재원심분리시켰다. 생성된 상청액을 본원에서 "세포 비함유 추출물"로서 정의한다. 세포 비함유 상청액 및 세포 비함유 추출물 둘 다의 단백질을 Bradford 분석 키트(Sigma, St. Louis, MO)로 정량하고, 4-12% 폴리아크릴아미드 비스-트리스 겔(Bio-Rad, Hercules, CA) 상에 적제하기 전에, 제조업자의 지시(Bio-Rad, Hercules, CA)에 따라 XT 샘플 완충액과의 혼합물로서 비등시켰다.
SDS-PAGE 겔은 쿠마시에 염료로 염색시키거나 웨스턴 블롯팅에 의해 PVDF로 전달했다. 블롯팅 후, PVDF 막을 트리스-완충된 염수(TBS)(Sigma, St. Louis, MO)로 세정하고, TBS 중의 5% 비-지방 무수 밀크(NFDM)로 실온에서 2시간 동안 처리했다. 목적하는 단백질에 특이적인 1차 항체는 제조업자의 지시에 따라 5% NFDM-TBS에서 희석시켰다. 필요한 경우, 당해 용액을 제거하고, 신선한 5% NFDM-TBS로 대체하고, 여기에 알칼리 포스파타제 및 제1 항체에 특이적인 제2 항체를 첨가했다. 제2 항체가 사용되지 않는 경우, 1차 항체를 알칼리 포스파타제에 접합시킬 수 있다. 이어서, 항체 처리된 PVDF를 TBS로 세정하고, 5-브로모-4-클로로-3-인도일-포스페이트/니트로블루 테트라졸리움 용액(BCIP/NBT)(KPL, Gaithersburg, MD)으로 처리했다.
도 9에 도시된 바와 같이, pSchizGr로 형질전환된 쉬조키트리움은 ER에서 eGFP 국지화를 나타낸 반면(또한 도 10 참조), pSchizcG로 형질전환된 쉬조키트리움은 세포질 전체에 걸쳐 eGFP를 나타냈다. pSchizE(공 벡터 대조군)으로 형질전환된 쉬조키트리움은 eGFP의 어떠한 발현도 나타내지 않았다. 도 11에 도시된 바와 같이, eGFP은 pSchiz-sG로 형질전환된 쉬조키트리움에 대해 세포 비함유 상청액 샘플(즉, 세포외) 뿐만 아니라 세포 비함유 추출물에서 검출되었다. pSchiz-sGr로 형질전환된 쉬조키트리움은 세포 비함유 추출물 및 보다 적은 정도로 세포 비함유 상청액 중에 eGFP을 함유했다. 마지막으로, pSchizcG로 형질전환된 쉬조키트리움은 세포 비함유 추출물 중에 거의 독점적으로 eGFP를 함유했다.
실시예 6
Secl 신호 펩티드의 확인
쉬조키트리움의 게놈 서열을 미리 생성하고, 조립하고, 산업적 표준 기술을 사용하여 BLAST 검색을 위해 포맷했다. N-충전 조건하에 성장시킨 쉬조키트리움의 배양물로부터 상청액을 농축시키고, SDS-PAGE 상에서 작동시켰다. 주요 분비된 단백질 밴드를 겔로부터 분해시키고, 아미노산 서열분석을 위해 사용했다. 수득된 아미노산 서열을 쉬조키트리움 게놈과 BLAST 비교하여(알고리즘 - tBLASTn, 낮은 복잡성 필터링 - off, 예상 - 1000, 매트릭스 - PAM30, Ungapped Alignment - on), 상응하는 ORF을 확인했다. ORF의 5' 부분은 SignalP 알로리즘을 사용하여 분석했다[참조: Bendsten et al., J, MoI. Biol. 340: 783-795 (2004); Nielsen and Krogh, Proc. Int. Conf. Intell. Syst. MoI. Biol. (5:122-130 (1998); Nielsen et al, Protein Engineering 72:3-9 (1999); Emanuelsson et al., Nature Protocols 2:953-971 (2007)]. Secl 단백질의 5' 영역은 당해 분석에 따라 분비 신호로서 확인되었다. 도 12(서열번호 37 포함) 및 도 13(서열번호 38) 참조.
실시예 7
쉬조키트리움 벡터 pSehiz-Cpt의 작제
pSchiz-Cpt 벡터는 OrfC 프로모터 및 터미네이터 및 ALS 선별가능한 마커를 함유한다. 요약하면, 벡터는 pSchizE 플라스미드를 먼저 KpnI/XbaI로 소화시키고 생성된 6.89 kb 단편을 겔 정제하여 작제했다. 이러한 소화는 또한 pSchizE 플라스미드로부터 투불린 프로모터 및 대부분의 폴리링커를 제거했고, ALS 코딩 서열은 순수한 상태로 유지되었다. 생성된 6.8 kb SchizE 골격 내로, 상류 및 하류 절편을 분리하는 BamHI과 함께 쉬조키트리움 OrfC 상류의 2 kb 서열 및 쉬조키트리움 OrfC 하류의 2 kb 서열을 함유하는 4 kb KpnI/XbaI 단편을 결찰시켰다. 4 kb KpnI/XbaI 단편을 플라스미드 pREZ22(실시예 4 참조)로부터 분해시켰다. 6.8 kb pSchizE 골격 및 4 kb KpnI/XbaI 단편의 결찰은 pSchiz-Cpt을 생성했다.
실시예 8
쉬조키트리움 단백질 발현 벡터 pSchizCpt-sleGFP의 작제
pSchizCpt-s1eGFP 플라스미드는 쉬조키트리움 OrfC 프로모터, eGFP를 코딩하는 서열에 선행하는 Secl 신호 서열 및 돌연변이된 쉬조키트리움 ALS 선별가능한 마커 서열을 포함한다. 도 14 참조. 당해 플라스미드는 또한 pCLOOOl로 지칭되며, 아메리칸 타입 컬쳐 컬렉션(American Type Culture Collection, Patent Depository, 10801 University Boulevard, Manassas, VA 20110- 2209)에 2008년 11월 18일자로 기탁되었고, ATCC 수탁번호 PTA-9615를 부여받았다.
실시예 9
발효기에서 쉬조키트리움에 의한 eGFP의 발현 및 분비
쉬조키트리움 세포를 실시예 5에 기재된 바와 같이 pSchizCpt-s1eGFP로 형질전환시켜다(실시예 8 참조). SMM에 내성이 있는 세포주를 M2B 한천 플레이트 상에서 분리하고, 진탕 플라스크 중의 M2B 액체 배양물(10 ㎍/ml SMM 함유) 내로 옮기고, 150 rpm으로 진탕시키면서 27.5℃에서 배양했다. 72-168시간 동안 배양한 후, 배양물을 원심분리(10분 동안 5000 x g)에 의해 수거하고, Centriprep 및 Microcon 농축기(MWCO 10000)를 사용하여 세포 비함유 상청액을 농축시켰다(대략 250배). 샘플(1-7 ㎕)을 SDS-PAGE 상에서 작동시키고, 분리된 단백질을 PVDF 막으로 옮겼다. 차단된 및 세척된 막을 래빗 항-eGFP IgG(Biovision)으로 탐지하고, 결합 단백질 밴드는 알칼리 포스파타제 접합된 염소 항-래빗 IgG(fc)(Promega)을 사용한 탐지 및 BCIP/NBT 시약을 사용한 처리로 가시화했다. 최대량의 eGFP를 발현하는 세포주를 선별했다.
고도 생성 세포주 중의 하나를 2.0 L (작동 용적) 발효기에서 배양했다. 배플 접종 플라스크는 150 ml의 HDl 배지를 함유하고, 29.5℃에서 24-48시간 동안 200 rpm으로 진탕시키면서 배양했다. 접종 배양물을 사용하여 하기 성분을 함유하는 발효기를 접종했다: 50 g/L 글루코즈, 13.62 g/L Na2SO4, 0.72 g/L K2SO4, 0.56 g/L KCl, 2.27 g/L MgSO4·7H2O, 1.8 g/L KH2PO4, 17.5 g/L (NH4)2SO4, 0.19 g/L CaCl2·2H2O, 51.5 mg FeSO4·7H2O, 3.1 g/L MnCl2·4H2O, 6.2 g/L ZnSO4·7H2O, 0.04 mg CoCl2·6H2O, 0.04 mg Na2MoO4, 2.07 g/L CuSO4·5H2O, 2.07 g/L NiSO4·6H2O, 9.75 mg 티아민, 0.16 mg 비타민 B12 및 3.33 mg 칼슘 판토테네이트. 배양 동안, 온도는 29.5℃이고, dO2%는 20%로 조절하고, 글루코즈 농도는 초기 수준이 당해 범위에 포함되는 경우에 15-20 g/L로 유지시키고, pH는 6.5로 유지시켰다. 샘플은 분석을 위해 소정 간격에서 무균 제거했다.
세포 비함유 상청액(0.5-5.0 ㎍ 전체 단백질 함유)의 비농축 샘플은 SDS-PAGE로 분리하고, 단백질을 PVDF 막으로 옮겼다. 차단된 및 세척된 막을 상기한 바와 같이 분비된 eGFP에 대해 탐지했다. 도 15 참조.
실시예 10
쉬조키트리움 단백질 벡터 pSchizCpt-slkappabh의 작제
pSchizCpt-slkappabh 플라스미드는 쉬조키트리움 OrfC 프로모터, IgG kappa 아단위를 코딩하는 폴리뉴클레오티드 서열에 선행하는 Secl 신호 서열, 및 OrfC 터미네이터 영역 및 돌연변이된 쉬조키트리움 ALS 선별가능한 마커를 포함한다(도 16 참조). 발현 벡터는 하기와 같이 생성했다:
IgG의 kappa 쇄를 코딩하는 재합성된(코돈-최적화된) 유전자는 표 42의 코돈 사용 표를 사용하여 블루 헤론 바이오테크놀로지(Blue Heron Biotechnologies)에 의해 상응하는 아미노산 서열로부터 생성하고, 5' Secl 분비 신호 서열로 orfC 프로모터와 orfC 터미네이터 사이에 플라스미드 pSchiz-Cpt 내로 클로닝시켰다. 요약하면, 벡터 pSchiz-Cpt를 BamHI 및 알칼리 포스파타제로 효소 제업업자의 지시(New England Biolabs)에 따라 소화시켰다. 이를 Bg1II(NEB)로 소화시킨 앰플리콘에 결찰시키고, 하기 프로이머:
프라이머 5'ss-X Bg1 긴: GACTagatctATGAAGTTCGCGACCTCG (서열번호 39)
프라이머 3'ritx_kap_bh_Bgl: gactagatctTCAGCACTCACCGCGGTTAAAGG (서열번호 40), 및 Sec1 신호 펩티드에 대한 폴리뉴클레오티드 서열, 이어서 kappa 폴리뉴클레오티드 서열(서열번호 41)을 함유하는 합성 최적화된 DNA 분자를 포함하는 블루 헤론 바이오테크놀로지스가 제공한 주형을 사용하여 생성했다. 생성된 박테리아 형질전환체 콜로니를 벡터 삽입체에 대해 스크리닝하고, 발현을 위해 적절하게 정렬시켰다. 클론(pSchizCPT-slkappabh로 지정됨)을 추가의 분석, 서열 확인 및 쉬조키트리움의 형질전환을 위해 선택했다.
실시예 1l
쉬조키트리움에 의한 항체 아단위 kappa의 발현 및 분비
형질전환체 세포주의 생성
쉬조키트리움 종 ATCC 20888은 50 ml의 M2B 배지를 함유하는 250 ml 진탕 플라스크에서 27℃로 24시간 동안 배양했다. 흡광도를 600 nm에서 측정하고, 흡광도 값이 1인 배양물 1 ml를 8,000×g으로 5분 동안 원심분리했다. 세포 펠렛을 100 ㎕의 M2B에 현탁시키고, 2 cm 직경 원으로 M2B 한천 플레이트 상에 전파시켰다.
전파된 쉬조키트리움 세포를 함유하는 플레이트 부분을 1100 Psi의 압력으로 pSchizCptSlkappa(XbaI으로 선형화됨) 피복된 MlO 비드로 충격시켰다.
충격 후, M2B 플레이트를 16시간 동안 27℃에서 배양하고, 쉬조키트리움 전파된 플레이트의 중심에서 성장하는 콜로니를 선택하고, 10 ㎍/ml SMM을 함유하는 M2B 플레이트 위에 전파시켰다. 24 내지 72시간 후, 20개 콜로니를 선택하고, 25 ml 배양 튜브에 10 mg/ml SMM을 함유하는 5 ml M2B 내로 접종시켰다. 배양 튜브를 27℃에서 135 rpm으로 72시간 동안 배양했다.
kappa 발현의 검출
상기로부터 가장 혼탁한 진탕 플라스크 배양물 중의 10개를 발현 분석을 위해 선택했다. 250 ml 플라스크에 10 ㎍/ml SMM을 함유하는 50 ml의 M2B를 튜브 배양물로부터의 0.5 ml로 접종했다. 배양물을 135 rpm에서 24시간 동안 진탕시키면서 27℃에서 배양하고, 이어서 세포 펠렛 및 세포 비함유 상청액을 10분 동안 5500×g에서 원심분리하여 분리했다.
세포 펠렛을 40 ml dH2O에 현탁시키고, 5500 x g에서 10분 동안 원심분리한 다음, 추출 완충액 습윤 중량의 2배로 현탁시켰다. 유리 비드의 펠렛 습윤 중량을 2배 첨가하고, 튜브를 3시간 동안 4℃에서 진탕시켰다. 생성된 세포 균질물을 5000 x g에서 10분 동안 원심분리하고, 상청액은 세포 비함유 추출물로 유지되었다.
세포 비함유 상청액은 Centriprep 및 Microcon 농축기(Amicon)를 10000 MW 컷 오프로 사용하여 대략 50 ml에서 > 200 ㎕로 농축시켰다.
각각의 선별된 형질전환체에 대해 3㎍의 단백질(세포 비함유 추출물 및 농축된 세포 비함유 상청액)을 200V에서 대략 45분 동안(염료 전방이 겔 하부로의 이동을 개시할 때까지) MOPS 작용 완충액으로 4 내지 12% 비스 트리스 SDS PAGE(st 표준, BioRad) 상에서 작동시켰다. 단백질 밴드는 70V에서 90분 동안 Nupage 전달 완충액을 사용하여 PVDF 막으로 옮겼다. 막은 0.1% 트윈 20을 함유하는 TBS에서 5%(w/v) 밀크 완충제로 차단시키고, 항체 아단위 kappa는 알칼리 포스파타제 접합된 항-사람 kappa IgG(Sigma)를 사용한 웨스턴 블롯에 의해 국지화시켰다. 포지티브 밴드는 BCIP/NBT 포스파타제 기질(KPL)로 가시화했다.
항체 아단위 kappa는 상기한 바와 같이 배양한 진탕 플라스크 배양물로부터의 세포 비함유 상청액에서 주로 명백하게 검출가능했다(도 17 참조). 진정한 kappa 표준과 구별가능한 MW를 갖는 세포 비함유 상청액에서 kappa 단백질의 외관은 분비되고 적절하게 해독후 변형(Sec1 분비 신호의 절단)되는 kappa 아단위와 일치했다.
실시예 12
발효기에서 쉬조키트리움에 의한 항체 아단위 kappa의 발현
배양
최대량의 세포외 kappa 아단위를 발현하는 것으로 나타난 2개의 클론(1 및 3)을 2.0 L(작동 용적) 발효기에서 배양했다. 배플 접종 플라스크는 150 ml의 HDl 배지를 함유하고, 200rpm에서 진탕시키면서 29.5℃에서 24-48시간 동안 배양했다. 접종 배양물을 사용하여 하기 성분을 함유하는 발효기를 접종시켰다: 50 g/L 글루코즈, 13.62 g/L Na2SO4, 0.72 g/L K2SO4, 0.56 g/L KCl, 2.27 g/L MgSO4·7H2O, 1.8 g/L KH2PO4, 17.5 g/L (NH4)2SO4, 0.19 g/L CaCl2·2H2O, 51.5 mg FeSO4·7H2O, 3.1 g/L MnCl4H2O, 6.2 g/L ZnSO4·7H2O, 0.04 mg CoCl2·6H2O, 0.04 mg Na2MoO4, 2.07 g/L CuSO4·5H2O, 2.07 g/L NiSO4·6H2O, 9.75 mg 티아민, 0.16 mg 비타민 B12 및 3.33 mg 칼슘 판토테네이트. 배양 동안 온도는 29.5℃이고, dO2%는 20%로 조절하고, 글루코즈 농도는 초기 수준이 당해 범위에 포함되는 경우에 15-20 g/L로 유지시키고, pH는 6.5로 유지시켰다. 샘플은 분석을 위해 소정 간격에서 무균적으로 제거했다.
kappa 발현의 검출
세포 비함유 상청액은 농축 없이 분석했고, 전체 단백질은 단백질 표준으로서의 BSA로 Bradford 방법(Sigma Bradford Reagent)을 사용하여 측정했다. kappa 아단위 발현을 확인하기 위한 웨스턴 분석은 진탕 플라스크 배양에 대해 상기 기재한 바와 같이 수행했다.
kappa 발현의 정량화는 Kappa-B+F 엘리사 정량화 키트(Elisa Quantification Kit)(Bethyl Laboratories Inc.) 및 플루오로 오메가 플레이트 판독기(Fluoro Omega plate reader)(BMG Labtech)를 사용하여 제조업자의 지시에 따라 수행했다. 도 18 참조.
실시예 13
pABOOll 발현 벡터의 작제
주형으로서 쉬조키트리움 종 ATCC 20888으로부터 추출한 gDNA를 사용하여, PCR을 하기 프라이머로 수행하여 앰플리콘 2015 bp 길이를 생성했다:
5' 60S-807: TCGATTTGCGGATACTTGCTCACA (서열번호 47)
3' 60S-2821: GACGACCTCGCCCTTGGACAC (서열번호 48)
앰플리콘을 겔 정제하고, 하기 프라이머를 사용한 후속 PCR을 위해 주형으로서 사용했다:
5' 60Sp-1302-Kpn: GACTggtaccTTTTTCCGCTCTGCATAATCCTAA (서열번호 49)
3' 60Sp-Bam: GACTggatccTTGGCTTTTTCTTTCTTGTTGC (서열번호 50)
생성된 1017bp 앰플리콘을 정제하고, KpnI 및 BamHI로 소화시키고, 미리 정제되고 KpnI 및 BamHI로 소화시킨 pSchiz-CPT(+)-slGFP(6h)에 결찰시켰다. 결찰 생성물을 사용하여 이. 콜라이를 형질전환시키고, 플라스미드를 정제하고, 생성된 콜로니로부터의 제한 소화에 의해 스크리닝했다. 예상된 제한 소화 패턴을 갖고 60S 긴 프로모터를 포함하는 하나의 플라스미드 클론(#4.1)을 생거(Sanger) 서열분석에 의해 확인하고, 쉬조키트리움의 형질전환을 위해 pABOOll으로 지정했다. 도 24 참조. 벡터 pABOOll은 아메리칸 타입 컬쳐 컬렉션(American Type Culture Collection, Patent Depository, 10801 University Boulevard, Manassas, VA 20110-2209)에 2008년 11월 18일자로 기탁되었고, ATCC 수탁번호 PTA-9614를 부여받았다.
실시예 14
pAB0018 발현 벡터의 작제
주형으로서 쉬조키트리움 종 ATCC 20888로부터 추출한 gDNA를 사용하여, PCR을 하기 프라이머로 수행하여 앰플리콘 2268 bp 길이를 생성했다:
5' EF1-68: CGCCGTTGACCGCCGCTTGACTCT (서열번호 51)
3' EF1-2312: CGGGGGTAGCCTCGGGGATGGACT (서열번호 52)
이 앰플리콘을 정제하고, 하기 프라이머를 사용한 후속 PCR을 위한 주형으로서 사용했다:
5' EFl-54-Kpn: GACTggtaccTCTTATCTGCCTCGCGCCGTTGAC (서열번호 53)
3' EFl-1114-Bam: GACTggatccCTTGCTTGCTAGTAGTCGCTTTCGAAC (서열번호 54)
생성된 1060 bp 앰플리콘을 정제하고, KpnI 및 BamHI으로 소화시키고, 미리 정제하고 KpnI 및 BamHI으로 소화시킨 pSchiz-CPT(+)-slGFP(6h)에 결찰시켰다. 결찰 생성물을 사용하여 이. 콜라이를 형질전환시키고, 플라스미드는 정제하고 생성 콜로니로부터 제한 소화에 의해 스크리닝했다. 예상된 제한 소화 패턴을 갖고 EF-1 긴 프로모터를 함유하는 하나의 플라스미드 클론(#6.1)을 생거 서열분석에 의해 확인하고, 쉬조키트리움의 형질전환을 위해 pAB0018로 지정했다. 도 25 참조. 벡터 pAB0018은 아메리칸 타입 컬쳐 컬렉션(American Type Culture Collection, Patent Depository, 10801 University Boulevard, Manassas, VA 20110-2209)에 2008년 11월 18일자로 기탁되었고, ATCC 수탁번호 PTA-9616을 부여받았다.
실시예 15
pAB0022 발현 벡터의 작제
쉬조키트리움 배양물의 세포 비함유 상청액을 SDS-PAGE에 의해 분석하고, 이로부터 Sec1p(Sec1 단백질에 대해)로 지정된 단일 단백질 밴드를 선별하여 균질해질 때까지 정제했다. 이 단백질의 펩티드 단편 서열은 질량 분광학 기술을 사용하여 확인하고, BLAST 알고리즘(tB LASTn, Ungapped 정렬, 낮은 복잡성 여과 OFF, 예상 = 10000, 매트릭스 = PAM30)(ftp://ncbi.nlm.nih.gov/blast)을 사용하여 쉬조키트리움 전체 게놈 서열의 개념 해독으로 보정했다. 모든 펩티드 서열을 코딩하는 하나의 오픈 리딩 프레임을 확인하고, Seclg(Secl 유전자에 대해)로 지정했다. 개시 ATG의 상류의 추정 프로모터 서열을 또한 확인하고 합성했다(Blue Heron Biotechnologies). 합성 Seclg 프로모터를 함유하는 벡터는 하기 프라이머를 사용한 PCR을 위한 주형으로서 사용했다:
5' SeclP-kpn: GACTggtaccCCGTCCTTGACGCCTTCGC (서열번호 55)
3' SeclP-bam: GACTggatccGATGAGTAATGGACGATCTTC (서열번호 56)
생성된 1438 bp 앰플리콘을 증폭시키고, KpnI 및 BamHI으로 소화시키고, 미리 정제하여 KpnI 및 BamHI으로 소화시킨 pSchiz-CPT(+)-s1GFP(6h)에 결찰시켰다. 결찰 생성물을 사용하여 이. 콜라이를 형질전환시키고, 플라스미드를 정제하고 생성된 콜로니로부터의 제한 소화에 의해 스크리닝했다. 예상된 제한 소화 패턴을 갖고 Sec1 프로모터를 함유하는 하나의 플라스미드(#8.1)를 생거 서열분석에 의해 확인하고, 쉬조키트리움의 형질전환을 위해 pAB0022로 지정했다. 도 26 참조. 벡터 pAB0022은 아메리칸 타입 컬쳐 컬렉션(American Type Culture Collection, Patent Depository, 10801 University Boulevard, Manassas, VA 20110-2209)에 2008년 11월 18일자로 기탁되었고, ATCC 수탁번호 PTA-9613을 부여받았다.
실시예 16
이종성 유전자의 전사
신장 인자 1(EF1) 및 60S 리보솜 단위를 코딩하는 유전자에 대한 프로모터를 쉬조키트리움에서 이종성 유전자의 전사를 위한 프로모터로서 선별했다. 쉬조키트리움으 게놈 서열을 검색하고, 두 유전자에 대한 공개된 서열과의 상동성을 나타내는 유전자를 확인했다. 각 프로모터에 대한 2개 버젼(하나는 짧고 하나는 김)을 PCR을 통해 클로닝시켰다.
SEC1 유전자의 프로모터 유도 발현을 또한 쉬조키트리움에서 이종성 유전자의 전사를 위한 프로모터로서 선별했다. SEC1 유전자는 쉬조키트리움에서 확인한 바 단지 천연 분비된 및 글리코실화된 단백질만을 코딩하기 때문에, 당해 프로모터는 분비된 글리코실화 단백질의 생산에 가장 적합한 성장 상까지 이종성 단백질의 시간 발현시킬 수 있다.
S1eGFP 작제물(즉, N-말단에 SEC1 분비 신호 및 OrfC 프로모터에 의해 유도된 발현을 갖는 eGFP 유전자 - 벡터 CLOOOl)을 함유하는 벡터 cpt(+)를 변형시켜 OrfC 프로모터를 분해시키고, 당해 요소를 하기 서열 중의 하나로 치환시킨다:
EFl 프로모터 (짧은 버젼) = 벡터 ABOOl5로부터의 EF1-S
EFl 프로모터 (긴 버젼) = 벡터 ABOOl8로부터의 EF1-L
60S 프로모터 (짧은 버젼) = 벡터 ABOOlO으로부터의 60S-S
60S 프로모터 (긴 버젼) = 벡터 ABOOl1로부터의 60S-L
SECl 프로모커 = 벡터 AB0022로부터의 Secl
쉬조키트리움 종 20888을 상기한 바와 같은 입자 충격을 통해 5개 벡터 각각으로 형질전환시켰다. 각 형질전환에 대한 생존 세포주는 분석을 위해 랜덤으로 선택했다. CLOOOl을 사용한 형질전환은 5개 벡터 각각에 대해 대조군으로서 사용했다. CLOOOl을 사용한 형질전환에 대한 5개의 생존 세포주는 분석을 위해 랜덤으로 선택했다.
형질전환체 세포주는 200 rpm에서 연속 진탕시키면서 29.5℃에서 72시간 동안 50 ml M2B를 함유하는 250 ml 진탕 플라스크에서 배양했다. 바이오매스는 5000 x g으로 10분 동안 원심분리하여 제거하고, 세포 비함유 상청액은 Centriprep 농축기(MWCO 10000)를 사용하여 대략 1ml로 농축시켰다. 세포 비함유 상청액 샘플의 단백질 농도는 브래드포드 방법을 사용하여 측정했다.
세포 비함유 상청액의 분획을 환원 조건하에 SDS 아크릴아미드 겔(XT Criterion) 상에서 분리하고, 분리된 단백질 밴드를 PVDF 막으로 옮겼다. eGFP는 AP-접합된 항-eGFP 항체를 사용하여 검출하고, NCIP/NBT 시약을 사용하여 가시화했다.
농축된 상청액(7 ㎕)의 최대량을 각 레인에서 분리하여 세포주의 어느 것이 eGFP를 발현 및 분비했는지를 측정한다(표 1). eGFP 발현 수준은 프로모터 및 개개 프로모터에 대한 세포주마다 상이하지만, 33개 세포주(비교된 6개 프로모터에 대해 분석된 55개 세포주로부터)는 eGFP를 발현하는 것으로 나타났다(데이타는 도시하지 않음).
분비된 eGFP의 검출가능한 양을 발현시키는 각 형질전환체로부터의 세포주 수
프로모터 OrfC
(CL0001)
EF1-S
AB0015
EF1-L
AB0008
S60-S
AB0010
60S-L
AB0011
SEC1
AB0022
eGFP 발현#/분석된 전체# 2/5 6/10 5/10 6/10 6/10 8/10
모든 세포주가 eGFP를 발현하는 것은 아니지만, 세포주의 적어도 대략 절반은 검출가능한 수준의 eGFP를 생성했고, 각 프로모터는 eGFP의 발현을 검출할 수 있었다.
eGFP를 발현 및 분비하는 것으로 밝혀진 세포주를 추가로 분석하여 상대 프로모터 강도를 비교했다. eGFP를 발현하는 것으로 측정된 각 배양물의 세포 비함유 상청액으로부터의 단백질을 SDS 아크릴아미드 겔 상에 적재하고, 레인당 1 ㎍으로 규정화했다. 단백질을 전기영동에 의해 분리하고, 분리된 단백질을 PVDF 막으로 옮기고, 상기한 바와 같은 AP 접합된 항-eGFP 항체를 사용하여 eGFP에 대해 탐지했다. 도 27 참조. eGFP에 대한 초기 스크린에 적재된 상청액 단백질의 양은 도 27을 생성한 당해 실험에 사용된 것보다 대략 10배 더 많았다. 이와 같이, 이종성 eGFP 단백질은 당해 실험을 위해 적재된 단백질 수준에서 몇몇 샘플에 대해 섬출 수준 이하이기 때문에 도 27의 모든 레인에서 명백하지는 않다. 1 ㎍ 단백질/레인의 적재량에서, OrfC 프로모터의 분비된 eGFP의 발현은 검출 한계 이하였다. 그러나, 기타 모든 프로모터에 의해 유도된 eGFP의 발현/분비는 생성된 세포주의 적어도 일부에서 검출가능했다. 이는 선별된 모든 프로모터, EF1, 60S 및 SEC1이 OrfC 프로모터와 비교하여 "강력한" 프로모터임을 입증했다. 특히, EF1-L 형질전환체로부터의 특정한 세포주에서 분비된 eGFP의 발현은 다른 프로모터 작제물의 어느 것보다도 가시적으로 보다 크고, 이는 당해 프로모터가 시험된 가장 강력한 프로모터임을 나타낸다.
EFl-L 프로모터의 강도의 확인은 형광 현미경하에 통상의 OrfC 형질전환체, CLOOO1-4와 비교하여 EFl-L 형질전환체 세포주 AB0018-9 및 ABOOl 8-10 중의 발현을 관찰함으로써 수득했다. 도 28 참조. CLOOOl-4 세포주는 가장 완만한 형광(Fluo:ISO 200 1.1 sec panes)을 나타내는 반면, ABOOl8-9 및 ABOOl8-10 세포주는 명백한 형광을 나타내어 세포내 eGFP의 상당한 축적을 나타냈다.
실시예 17
쉬조키트리움 중의 글리코실화 프로파일
천연 쉬조키트리움 단밸질의 N-글리코실화를 측정했다. 쉬조키트리움은 포유동물 및 곤충의 글리코실화 경로와 공통 단계를 공유하는 것으로 밝혀졌고, 효모의 하이퍼만노실화 경로 특성을 사용하는 것으로 관찰되지는 않았다. 도 29 및 도 30은 쉬조키트리움 분비된 단백질의 질량 분광학적 분석으로 검출된 글리칸 구조를 도시한다. 특히, m/z 1580에서 GlcNAc2Man5, m/z 1785에서 G1cNAc2MHn6 및 m/z 1991에서 GlcNAc2Man7에 대해 독특한 피크가 관찰되었다.
실시예 18
전기천공에 의한 쉬조키트리움의 형질전환
쉬조키트리움 종 ATCC 20888 세포를 진탕기 상에서 200rpm에서 48시간 동안 29℃에서 M50-20 배지[참조: 미국 공보 제2008/0022422호]에서 성장시켰다. 세포를 신선한 배지 속에서 1:100으로 희석시키고, 밤새 성장시켰다. 세포를 원심분리하고, 1M 만니톨 및 10mM CaCl2(pH 5.5)에 최종 농도 2 OD600 단위로 재현탁시켰다. 5mL의 세포를 0.25mg/mL 프로테아제 XIV(Sigma-Chemical)와 혼합하고, 진탕기 상에서 4시간 동안 배양했다. 세포를 10% 빙냉 글리세롤로 2회 세척하고, 500μL의 빙냉 10% 글리세롤에 재현탁시켰다. 90μL의 세포를 예비냉각된 0.2cm 갭 전자-큐벳(Biorad 165-2086) 속에서 분획했다. 10㎕의 DNA(1 내지 5㎍)를 큐벳에 첨가하고, 완만하게 혼합하고, 아이스 위에 정치시켰다. 세포를 200옴(저항), 25μF 및 전압 범위 0V 내지 500V(0.1cm 큐벳 갭 거리) 또는 500V(0.2cm 큐벳 갭 거리)에서 재조합 벡터로 전기천공시켰다. 0.5mL의 배지를 큐벳에 즉시 첨가했다. 이어서, 세포를 4.5mL의 M50-20 배지로 옮기고, 진탕기 상에서 약 100rpm에서 2 내지 3시간 동안 배양했다. 세포를 원심분리하고, 0.5mL의 M50-20 배지에 재현탁시키고, 적합한 선별(필요할 경우)과 함께 2 내지 5개의 M2B 플레이트 위에 플레이팅하고, 29℃에서 배양했다.
표 2는 상이한 효소 조합(파라미터 300V 및 0.1cm 큐벳 갭 거리)으로 전처리 후 생성된 쉬조키트리움 종 ATCC 20888 형질전환체의 수를 나타낸다.
표 3은 상이한 효소 조합 및 전압(0.1cm 큐벳 갭 거리)으로 전처리 후 생성된 쉬조키트리움 종 ATCC 20888 형질전환체의 수를 나타낸다.
표 4는 상이한 전기천공 큐벳 갭 거리를 사용하여 생성된 쉬조키트리움 종 ATCC 20888 형질전환체의 수를 나타낸다. 세포를 0.25mg/mL 프로테아제 XIV로 전처리했다.
표 5는 상이한 전기천공 전압을 사용하여 생성된 쉬조키트리움 종 ATCC 20888 형질전환체의 수를 나타낸다. 세포를 0.1mg/mL 달팽이 아세톤 분말 + 0.25mg/mL 프로테아제 XIV(0.1cm 큐벳 갭 거리)로 전처리했다.
상이한 효소 조합으로 전처리 후 생성된 쉬조키트리움 형질전환체
처리 형질전환체의 수
없음 0
0.1mg/mL 달팽이 아세톤 분말 + 0.25mg/mL 프로테아제 XIV 450
달팽이 아세톤 분말, 프로테아제 XIV 첨가 전 225
0.1X 설파타제 + 프로테아제 XIV 240
0.1X β-글루쿠로니다제 + 프로테아제 XIV 430
0.5X 설파타제 + 프로테아제 XIV 200
0.5X β-글루쿠로니다제 + 프로테아제 XIV 375
상이한 효소 조합 및 전압으로 전처리 후 생성된 쉬조키트리움 형질전환체
처리 200V에서의
형질전환체의 수
250V에서의
형질전환체의 수
0.1mg/mL 달팽이 아세톤 분말 + 0.25mg/mL 프로테아제 XIV 315 380
프로테아제 XIV 820 1360
0.5X β-글루쿠로니다제 + 프로테아제 XIV 650 110
0.1X β-글루쿠로니다제 + 프로테아제 XIV 400 560
상이한 전기천공 큐벳 갭 거리를 사용하여 생성된 쉬조키트리움 형질전환체(0.25mg/mL 프로테아제 XIV로 전처리됨)
큐벳 갭 형질전환체의 수
0.1cm(250V) 345
0.2cm(500V) 530
상이한 전기천공 전압을 사용하여 생성된 쉬조키트리움 형질전환체(0.1mg/mL 달팽이 아세톤 분말 + 0.25mg/mL 프로테아제 XIV로 전처리됨)
전압(V) 0 100 150 200 300 400 500
형질전환체의 수 0 4 490 1320 794 156 100
실시예 19
쉬조키트리움 중의 인버타제의 발현
벡터 pAB0018을 BamΗI 및 NdeI로 소화시켜 838 bp 및 9879 bp 길이의 두 단편을 유도했다. 9879 bp 단편은 한천 겔 중에서 표준 전기영동 기술에 의해 분획하고, 통상의 DNA 정제 키트를 사용하여 정제하고, 쉬조키트리움의 Sec1 단백질의 천연 분비 신호를 코딩하는 폴리뉴클레오티드 서열을 포함하는 서열(서열번호 57)에 결찰시킨 후, 사카로마이세스 세레비지에(Saccharomyces cerevisiae)의 성숙 인버타제 단백질(SUC2)을 코딩하는 합성 서열에 결찰시키고, 이 합성 서열은 쉬조키트리움 중의 발현을 위해 코돈 최적화되었다(도 42 참조). Sec1 신호 펩티드 및 사카로마이세스 세레비지에 인버타제 단백질을 코딩하는 서열을 포함하는 융합 서열을 쉬조키트리움 벡터 pSchiz에 삽입한 다음, BamHl 및 Ndel로 소화시켜 서열번호 57을 수득한다.
결찰 생성물을 사용하여 제조업자의 프로토콜을 사용하여 경쟁 DH5α 이. 콜라이(E. coli) 세포(Invitrogen)의 통상적으로 공급된 균주를 변형시켰다. 생성되는 클론 다수를 전파시키고, 이들의 플라스미드를 추출하고 정제시켰다. 이어서, 이러한 플라스미드를 제한 소화 또는 PCR로 선별하여 결찰이 예상 플라스미드 벡터를 생성했음을 확인했다. 서열번호 57의 결찰로부터 생성되는 하나의 이러한 플라스미드 벡터는 생거 서열분석으로 입증하고, pCL0076(서열번호 58)로 지정했다(도 31 참조).
쉬조키트리움 종 ATCC 20888 및 B76-32로서 지정된 유전적으로 변형된 쉬조키트리움 유도체의 배양물을 10g/L 글루코즈, 0.8g/L (NH4)2SO4, 5g/L Na2SO4, 2g/L MgSO4·7H2O, 0.5g/L KH2PO4, 0.5g/L KCl, 0.1g/L CaCl2·2H2O, 0.1M MES(pH 6.0) 0.1% PB26 금속, 및 0.1% PB26 비타민(v/v)으로 이루어진 M2B 배지에서 성장시켰다. PB26 비타민은 50mg/mL 비타민 B12, 100㎍/mL 티아민, 및 100㎍/mL Ca-판토네테이트로 이루어진다. PB26 금속은 pH 4.5로 조정했고, 3g/L FeSO4·7H2O, 1g/L MnCl2·4H2O, 800mg/mL ZnSO4·7H2O, 20mg/mL CoCl2·6H2O, 10mg/mL Na2MoO4·2H2O, 600mg/mL CuSO4·5H2O, 및 800mg/mL NiSO4·6H2O로 이루어진다. PB26 스톡 용액은 개별적으로 여과 멸균시키고, 오토클레이빙 후 배양액에 첨가했다. 글루코즈, KH2PO4 및 CaCl2·2H2O는 염 침전 및 탄수화물 카라멜화를 방지하기 위해 혼합 전에 배양물 성분의 나머지로부터 별도로 각각 오토클레이빙했다. 모든 배지 성분은 시그마 케미칼(Sigma Chemical; St. Louis, MO)로부터 구입했다. 균주 B76-32는 미국 특허 제7,211,418호 및 미국 특허 출원 공보 제2008/0022422호 및 제2008/0026434호에 따라 조작된 쉬조키트리움 종 ATCC 20888의 유도체이다..
쉬조키트리움 종 ATCC 20888 및 B76-32의 배양물을 지수 단계로 성장시키고, 이하 기술되는 바와 같이 효소 전처리에 의한 전기천공법을 사용하여 벡터 pCL0076로 형질전환시켰다.
효소 전처리에 의한 전기천공법- 세포를 진탕기 상에서 200rpm에서 2일 동안 30℃에서 50mL의 M50-20 배지(참조: 미국 공보 제2008/0022422호)에서 성장시켰다. 세포를 M2B 배지 속에서 1:100으로 희석시키고(하기 단락 참조), 밤새(16-24시간) 성장시켜 중간-지수 단계 성장에 도달하도록 시도했다(OD600 1.5-2.5). 세포를 약 3000 x g에서 5분 동안 50mL 원뿔 튜브에서 원심분리했다. 상청액을 제거하고, 세포를 1M 만니톨, pH 5.5에 적합한 용적으로 재현탁시켜 최종 농도 2 OD600 단위에 도달했다. 5mL의 세포를 25mL 진탕기 플라스크 속에서 분획화하고, 10mM CaCl2(1.0M 스톡, 여과 멸균됨) 및 0.25mg/mL 프로테아제 XIV(10mg/mL 스톡, 여과 멸균됨; Sigma-Aldrich, St. Louis, MO)로 보정했다. 플라스크를 진탕기 상에서 약 30℃ 및 약 100rpm에서 4시간 동안 배양했다. 세포를, 원형질화도를 측정하기 위해 목적하는 단일 세포와 함께 현미경으로 모니터링했다. 세포를 환저 튜브(즉, 14mL Falcon™ 튜브, BD Biosciences, San Jose, CA)에서 약 2500 x g에서 5분 동안 원심분리했다. 상청액을 제거하고, 세포를 5mL의 빙냉 10% 글리세롤과 함께 완만하게 재현탁시켰다. 세포를 환저 튜브에서 약 2500 x g에서 5분 동안 재원심분리했다. 상청액을 제거하고, 세포를 광범위한 구멍의 피펫 선단을 사용하여 500μL의 빙냉 10% 글리세롤로 완만하게 재현탁시켰다. 90μL의 세포를 예비냉각된 전자-큐벳(Gene Pulser® cuvette - 0.1cm 갭 또는 0.2cm 갭, Bio-Rad, Hercules, CA) 속에서 분획화했다. 1㎍ 내지 5㎍의 DNA(10μL 용적 이하 중)를 큐벳에 첨가하고, 피펫 선단으로 완만하게 혼합하고, 5분 동안 아이스 위에 두었다. 세포를 200옴(저항), 25μF(전기용량) 및 250V(0.1cm 갭의 경우) 또는 500V(0.2cm 갭)에서 전기천공시켰다. 0.5mL의 M50-20 배지를 큐벳에 즉시 첨가했다. 이어서, 세포를 25mL 진탕기 플라스크 중의 4.5mL의 M50-20 배지로 옮기고, 진탕기 상에서 30℃ 및 약 100rpm에서 2 내지 3시간 동안 배양했다. 세포를 환저 튜브에서 약 2500 x g에서 5분 동안 원심분리했다. 상청액을 제거하고, 세포 펠렛을 0.5mL의 M50-20 배지에 재현탁시켰다. 세포를 적합한 선별(필요할 경우)과 함께 적합한 수(2 내지 5)의 M2B 플레이트 위에 플레이팅하고, 3O℃에서 배양했다.
형질전환체 M2B + SMM 배지 중에서의 성장용으로 선택하거나 MSFM + 슈크로즈 상에 플레이팅하여 슈크로즈 상에서의 성장용으로 직접 선택했다. MSFM + 슈크로즈 선택을 위해, 1 내지 2주 후, 콜로니를 새로운 슈크로즈 함유 배지 상에서 다수의 통과로 재플레이팅했다. 인버타제의 발현은 단일 탄소원으로서 슈크로즈 상에서 성장된 트라우스토키트리드 콜로니를 위한 선별가능한 마커로서 사용할 수 있음을 결정했다.
하기 실험에서, 주요 형질전환체는 27℃에서 2 내지 6일 동안 배양 후, 20g/L 한천(VWR, West Chester, PA) 및 10㎍/mL SMM(Chem Service, Westchester, PA)을 함유하는 고체 M2B 배지 상에서 성장용으로 선택했다. 모든 주요 형질전환체를 SMM을 갖는 M2B 플레이트로 수동으로 옮겼다. 1주일 후, 콜로니를 SMM 없는 MSFM 및 5g/L 슈크로즈로 옮겼다. 1주일 후, 최대 콜로니를 새로운 MSFM/슈크로즈 배지 플레이트로 옮겼다. 슈크로즈 상에서 성장하는 쉬조키트리움 종 ATCC 20888 형질전환체 10개를 추가의 특성화용으로 선택하고, 각각 1-1, 1-3, 1-24, 3-1, 3-2, 3-5, 3-21, 4-1, 4-24 및 4-31으로 지정했다. 슈크로즈 상에서 성장하는 9개의 B76-32 형질전환체를 추가의 특성화용으로 선택하고, B76-32 #2, #12, #19, 326, #30, #39, #42, #56 및 #61로서 지정했다.
슈크로즈 상에서 성장하는 콜로니(1-1, 1-3, 1-24, 3-1, 3-2, 3-5, 3-21, 4-1, 4-24, 4-31)를 접종 루프를 사용하여 플레이트로부터 분리하고, 5mL의 슈크로즈 배지를 함유하는 배양 튜브로 옮기고, 진탕기 상에서 29℃에서 4일 동안 성장시켰다. 이 배양물 2mL를 사용하여 250ml 플라스크에서 50mL의 배지(MSFM 또는 SSFM)를 접종하고, 2000rpm에서 진탕기 상에서 29℃에서 성장시켰다.
모균주 쉬조키트리움 종 ATCC 20888의 대조군 플라스크를 같은 날에 글루코즈 함유 배지를 사용하여 성장시켰다. 7일 후, 세포를 수거했다. 세포를 원심분리하고, 50% 이소프로판올:증류수 혼합물로 세척했다. 펠렛화 세포를 동결 건조시키고, 칭량하고, 지방산 메틸 에스테르(FAME) 분석을 수행했다. 쉬조키트리움 종 ATCC 20888 또는 B76-32의 CL0076 형질전환체의 성장 및 지방 함량은 중량측정으로 전체가 본원에서 참조로 인용된 미국 공보 제2008/0022422호에 이미 기술된 바와 같이 유도체화 오일의 기체 크로마토그래피로 분석했다. 결과는 표 6 내지 9에 제시한다. 형질전환체 및 모균주의 진탕 플라스크 배양물로부터의 펠렛의 건조 중량 및 지방 함량은 도 32 내지 37에 도시된다.
SSFM 배지: 50g/L 글루코즈 또는 슈크로즈, 13.6g/L Na2SO4, 0.7g/L K2SO4, 0.36g/L KCl, 2.3g/L MgSO4·7H2O, 0.1M MES (pH 6.0), 1.2g/L (NH4)2SO4, 0.13g/L 일나트륨 글루타메이트, 0.056g/L KH2PO4, 및 0.2g/L CaCl2·2H2O. 0.16g/L 비타민 B12, 9.7g/L 티아민, 및 3.3g/L Ca-판토테네이트로 이루어진 스톡으로부터 비타민을 1mL/L에서 첨가했다. pH 2.5로 조정된, 1g/L 시트르산, 5.2g/L FeSO4·7H2O, 1.5g/L MnCl2·4H2O, 1.5g/L ZnSO4·7H2O, 0.02g/L CoCl2·6H2O, 0.02g/L Na2MoO4·2H2O, 1.0g/L CuSO4·5H2O, 및 1.0g/L NiSO4·6H2O로 이루어진 스톡으로부터 미량의 금속을 2mL/L에서 첨가했다.
변형된 SFM (MSFM) 배지: 10g/L 글루코즈 또는 슈크로즈, 25.0g/L NaCl, 1.0g/L KCl, 0.2g/L (NH4)2SO4, 5g/L, 5.0g/L MgSO4·7H2O, 0.1g/L KH2PO4, 0.3g/L CaCl2·2H2O, 0.1M HEPES (pH 7.0), 0.1% PB26 금속, 및 0.1% PB26 비타민(v/v). 0.16g/L 비타민 B12, 9.7g/L 티아민, 및 3.3g/L Ca-판토테네이트로 이루어진 스톡으로부터 비타민을 2mL/L에서 첨가했다. pH 2.5로 조정된, 1g/L 시트르산, 5.2g/L FeSO4·7H2O, 1.5g/L MnCl2·4H2O, 1.5g/L ZnSO4·7H2O, 0.02g/L CoCl2·6H2O, 0.02g/L Na2MoO4·2H2O, 1.0g/L CuSO4·5H2O, 및 1.0g/L NiSO4·6H2O로 이루어진 스톡으로부터 미량의 금속을 2mL/L에서 첨가했다.
표 6은 글루코즈, 프럭토즈, 슈크로즈를 갖고 탄소원이 첨가되지 않은 MSFM 중에서 성장된 쉬조키트리움 종 ATCC 20888의 성장 및 지방 수준을 제시한다.
표 7은 글루코즈(대조군)을 갖는 MSFM 배지 중에서 성장된 쉬조키트리움 종 ATCC 20888 및 슈크로즈를 갖는 MSFM 배지 중에서 성장된 쉬조키트리움 종 ATCC 20888 형질전환된 세포주의 건조 중량 및 지방산 비율(%)을 제시한다.
표 8은 글루코즈(대조군)을 갖는 SSFM 배지 중에서 성장된 쉬조키트리움 종 ATCC 20888 및 슈크로즈를 갖는 SSFM 배지 중에서 성장된 쉬조키트리움 종 ATCC 20888 형질전환된 세포주의 건조 중량 및 지방산 비율(%)을 제시한다.
표 9는 글루코즈(대조군)을 갖는 SSFM 배지 중에서 성장된 쉬조키트리움 B76-32 및 슈크로즈를 갖는 SSFM 배지 중에서 성장된 쉬조키트리움 B76-32 형질전환된 세포주의 건조 중량 및 지방산 비율(%)을 제시한다.
글루코즈, 프럭토즈, 슈크로즈를 갖고 탄소원이 첨가되지 않은 MSFM 중에서 성장시킨 쉬조키트리움 종 ATCC 20888의 성장 및 지방 수준
글루코즈 프럭토즈 슈크로즈 추가된 탄소원 부재
DW(g/L) 2.84 2.65 0.16 0.11
% FA 66.5 65.3 ND ND
DW= 건조 중량
FA= 지방산
슈크로즈를 갖는 MSFM 배지 중에서 성장시킨 쉬조키트리움 종 ATCC 20888 형질전환된 세포주
20888
대조군
1-1 1-3 3-2 3-5 3-21 4-1 4-24 4-31
DW(g/L) 2.94 2.49 2.79 2.21 2.60 2.64 2.44 3.05 2.24
% FA 70.87 70.79 72.36 67.97 69.78 71.05 68.84 73.85 73.66
DW= 건조 중량
FA= 지방산
슈크로즈를 갖는 SSFM 배지 중에서 성장시킨 쉬조키트리움 종 ATCC 20888 형질전환된 세포주
20888
대조군
1-1 1-3 1-24 3-1 3-2 3-5 3-21 4-1 4-24 4-31
DW(g/L) 11.24 10.04 10.51 9.99 8.40 10.29 9.03 8.34 8.16 10.63 10.92
% FA 78.22 78.20 76.29 77.10 77.37 77.71 74.97 73.44 73.65 80.05 79.82
DW= 건조 중량
FA= 지방산
슈크로즈를 갖는 SSFM 배지 중에서 성장시킨 B76-32 형질전환된 세포주
B76-32
대조군
#2 #12 #19 #26 #30 #39 #42 #56 #61
7일
DW(g/L)
10.56 13.37 10.21 13.26 7.88 10.26 11.81 10.47 12.84 8.97
% FA 62.8 74.3 75.2 65.4 66.9 65.1 64.8 71.4 77.9 73.7
DW= 건조 중량
FA= 지방산
면역불롯팅 - SSFM 중에서 3일 동안 성장된 50mL 진탕 플라스크 배양물의 세포 비함유 상청액(참조: 미국 공개 공보 제2008/0022422호)를, 배양물을 5000 x g에서 원심분리한 후 수집했다. 배양물 상청액을 SDS-PAGE용으로 직접 사용하거나 10kDa보다 무거운 모든 성분의 농축화를 허용하는 침투가능한 막이 장착된 시판되는 농축기를 사용하여 50 내지 100배 농축시켰다. 총 단백질 농도는 브래드포드 분석(Bradford assay; Biorad)으로 측정했다. 이어서, 인버타제의 발현은 면역블롯팅 분석에 이어, 표준 면역블롯팅 과정(참조: Sambrook et al)으로 입증했다. 요약하면, 단백질(0.625㎍ 내지 5㎍)을 비스-트리스 겔 상에서 SDS-PAGE로 분리했다(Invitrogen, Carlsbad, CA, USA). 이어서, 단백질을 쿠마시에 블루(Coomassie blue)(SimplyBlue Safe Stain, Invitrogen)로 염색하거나 폴리비닐리덴 플루오라이드 상으로 옮기고, 사카로마이세스 세레비지에 인버타제(Sigma)의 순수 제제를 주입한 래빗으로부터 유도된 인버타제 항혈청(Open Biosystems)으로 인버타제 단백질의 존재를 탐지했다. 이어서, 막을 알칼리성 포스파타제(Promega)에 결합된 마우스 항-래빗 2차 항체로 배양했다. 이어서, 막을 제조업자의 지시(KPL, Gaithersburg, MD)에 따라 5-브로모-4-클로로-3-인돌릴-포스페이트/니트로블루 테트라졸륨 용액(BCIP/NBT)으로 처리했다. 예는 도 38에 제시한다. 항-인버타제 면역블롯팅 및 상응하는 쿠마시에 블루 염색된 겔을 각각 패널 A 및 B에 제시한다. 클론 1-3의 배양 상청액 중에세 나타난 4개의 주요 밴드 중에서, 단지 1개가 항-인버타제 항혈청과 반응하는 것으로 나타났다. 단백질의 동일성은 펩티드 서열 분석으로 확인되었다.
작용 분석- 효소 EC 3.2.1.26은 슈크로즈의 프럭토즈 및 글루코즈로의 가수분해를 촉매하는 슈크라제의 인버타제 형태이다. 슈크라제 활성은 슈크로즈로부터 프럭토즈 및 글루코즈의 유리 속도로 측정했다. 분석은 발효 배양액 상청액에 슈크로즈를 첨가하여 천연 그대로 수행하고, 글리코스/프럭토즈 함량은 HPLC로 측정했다.
쉬조키트리움 균주 B76-32 #3을 MSFM(슈크로즈 포함) 중에서 OD가 29℃에서 50mL 진탕 플라스크에서 약 4에 도달할 때까지 성장시켰다. 세포를 4500 x g에서 15분 동안 회전시키고, 상청액 중에서 인버타제 활성을 측정했다. 인버타제는 0.1M 슈크로즈를 발효 배양액의 가변 용적에 첨가하고, 최종 용적을 1mL로 조정하여 분석했다. 반응물을 55℃에서 3분 동안 배양했다. 반응의 종료는 100℃에서 10분 동안 수행한 다음, HPLC에 의한 글루코즈, 프럭토즈 및 슈크로즈의 측정으로 이루어진 분석까지 동결시켰다. HPLC는 문헌[참조: Liu et al, Food Sd. 25:293-296 (2007)]에 기술된 방법의 변형태를 사용하여 수행했다. 요약하면, 모노- 및 디-사카라이드는 루나(Luna) NH2 컬럼을 갖는 HPLC를 사용하여 분리하고, RID(굴절률 검출기)를 사용하여 검출했다. 체류 시간을 표준 체류 시간과 비교하여 확인을 수행했다. 정량화는 외부 표준 보정으로 수행했다. 슈크로즈 농도 함수로서의 반응 속도는 도 39A에 도시한다. Km(33.4mM) 및 Vmax(6.8mM 글루코즈/분)를 표준 라인위버-부르크 플롯(standard Lineweaver-Burk plot)으로부터 계산했다. 도 39B 참조.
글리코실화 분석 - 상청액 단백질을 4-12% 비스-트리스 겔(Invitrogen) 상에서 SDS-PAGE로 분리했다. 이어서, 단백질을 쿠마시에 블루(SimplyBlue Safe Stain, Invitrogen)로 염색했다. 목적하는 염색된 단백질을 겔로부터 절단하고, 슬라이스를 보다 작은 조각(약 1mm3)으로 절단하고, 40mM 중탄산암모늄(AmBic) 및 100% 아세토니트릴을 사용하여 색상이 투명해질 때까지 교호로 탈색시켰다. 탈색된 겔을 55℃에서 1시간 동안 40mM AmBic 중의 10mM DTT에 재팽윤시켰다. DTT 용액을 55mM 요오도아세트아미드(IAM)로 교환하고, 어둠 속에서 45분 동안 배양했다. 배양은 40mM AmBic 및 100% 아세토니트릴로 2회 교호로 세척함으로써 지속된다. 탈수된 겔을 초기에 45분 동안 아이스 위의 트립신 용액(40mM AmBic 중의 트립신)으로 재팽윤시키고, 단백질 소화를 37℃에서 밤새 수행했다. 상청액을 다른 튜브로 옮겼다. 펩티드 및 글리코펩티드를 5% 포름산 중의 20% 아세토니트릴, 5% 포름산 중의 50% 아세토니트릴에 이어서, 5% 포름산 중의 80% 아세토니트릴로 연속하여 겔로부터 추출했다. 샘플 용액을 건조시키고, 하나의 튜브 속에서 배합했다. 추출된 트립신 소화물을 Cl8 sep-pak 카트리지를 통과시키고, 5% 아세트산으로 세척하여 오염물질(예: 염 및 SDS)을 제거했다. 펩티드 및 글리코펩티드를 5% 아세트산 중의 20% 이소프로판올, 5% 아세트산 중의 40% 이소프로판올 및 5% 아세트산 중의 100% 이소프로판올로 연속하여 용출시키고, 속도 진공 농축기 중에서 건조시켰다. 건조된 샘플을 배합한 다음, 50mM 인산나트륨 완충액(pH 7.5)으로 재구성하고, 100℃에서 5분 동안 가열하여 트립신을 불활성화시켰다. 트립신 소화물을 37℃에서 밤새 PNGase F로 배양하여 N-글리칸을 방출시켰다. 소화후, 샘플을 Cl8 sep-pak 카트리지를 통해 통과시키고, 탄수화물 분획을 5% 아세트산으로 용출시키고, 동결 건조시켰다. 방출된 N-결합 올리고사카라이드를 문헌[참조: Anumula and Taylor, Anal Biochem. 203:101-108 (1992)]의 방법에 기초하여 퍼메틸화하고, 질량 분석으로 프로파일화했다. 질량 분광학적 분석은 복합 탄수화물 연구 센터에서 개발된 방법에 따라 수행했다[참조: Aoki K et al., J. Biol. Chem. 282:9127-42 (2007)]. 질량 분석은 NSI-LTQ/MSn을 사용하여 측정했다. 간단하게, 퍼메틸화 글리칸을 50% 메탄올 중의 1mM NaOH에 용해시키고, 일정한 유동 속도 0.4μL/분에서 기기(LTQ, Thermo Finnigan)에 직접 주입했다. MS 분석은 양이온 방식으로 수행했다. 총 이온 맵핑에서, 자동화 MS/MS 분석(35 충동 에너지), m/z 범위 500 내지 2000을 2개 질량 단위로 선행 윈도우를 중접시킨 연속 2.8 질량 단위 윈도우에서 스캐닝했다.
총 이온 맵핑을 수행하여 글리칸의 척도인 단편 이온의 존재를 시험했다. m/z 500으로부터 m/z 2000까지의 MS/MS 데이터를 취하고, 미가공 데이터를 수동으로 분석했다. NSI-총 이온 맵핑에 의해 수득된 종의 크로마토그램 및 표는 도 40A 및 도 40B에 도시한다. 이 크로마토그램은 스캔 필터로 처리하고, m/z 139의 중성 손실은 고-만노스 형태 글리칸의 특성이다. 총 이온 맵핑은 이 샘플이 장쇄 만노스를 갖는 일련의 고-만노스 형태 글리칸을 함유한다는 것을 나타냈다. 이러한 결과는 실시예 17과 동일한 방법론(참조: 도 30)으로 측정된 바와 같이, 천연 쉬조키트리움 분비 단백질 상에서 검출된 N-글리칸 구조와 유사하다.
실시예 20
쉬조키트리움 중의 아스퍼길루스 니거(Aspergillus niger) 인버타제의 발현
벡터 pAB0018(ATCC 수탁번호 PTA-9616)을 HindIII로 소화시키고, 녹두 뉴클레아제로 처리하고, 정제한 다음, 다양한 크기의 4개 단편을 생성하는 KpnI로 추가로 소화시켰다. 2552 bp의 단편을 한천 겔 중에서 표준 전기영동 기술로 분리하고, 통상의 DNA 정제 키트로 정제했다. 이어서, PmeI 및 Kpn에 의한 pAB0018의 제2 소화를 수행했다. 6732 bp의 단편을 이 소화물로부터 분리하고 정제하고, 2552 bp 단편에 결찰시켰다. 이어서, 결찰 생성물을 사용하여 제조업자의 프로토콜을 사용하여 경쟁 DH5-α 이. 콜라이 세포(Invitrogen)의 통상적으로 공급된 균주를 형질변환시켰다. 암피실린-내성 클론으로부터의 플라스미드를 전파시키고, 정제한 다음, 제한 소화 또는 PCR로 선별하여 결찰이 예상 플라스미드 구조물을 생성한다는 것을 확인했다. 하나의 확인된 플라스미드를 pCL0120으로 지정했다. 도 43 참조.
진균 아스퍼길루스 니거(Aspergillus niger)부터의 Sucl 인버타제 단백질의 성숙 형태(GenBank 수탁번호 S33920)를 도 42의 쉬조키트리움 코돈 사용 표를 사용하여 쉬조키트리움 중의 발현용으로 코돈 최적화했다(코돈 최적화는 문헌[참조: Blue Heron Biotechnology, Bothell, WA]에 따라 수행했다). 코돈 최적화 서열을 합성하고, 생성되는 폴리뉴클레오티드 서열을 내생 신호 펩티드 대신 N-말단 판독기로서 쉬조키트리움 Secl 신호 펩티드("Secl ss")를 코딩하는 폴리뉴클레오티드 서열에 융합시켰다. 생성되는 "s1Sucl" 핵산 서열(서열번호 75)의 코딩 영역을 도 44에 도시한다. 이 코돈 최적화된 s1Sucl 폴리뉴클레오티드는 표준 기술에 따라 삽입 및 결찰을 위한 5' 및 3' 제한 위치 BamHI 및 NdeI을 사용하여 벡터 pCL0120에서 클론화했다. 생성되는 벡터 pCL0137의 플라스미드 맵을 도 45에 도시한다. 야생형 균주 쉬조키트리움 종 ATCC 20888을 이 벡터로 형질전환시키고, 생성되는 클론을 SMM을 함유하는 고체 SSFM 배지 상에서 선별했다. 이어서, SMM-내성 클론을 단일 탄소원으로 슈크로즈를 함유하는 SSFM 고체 배지에 재플레이팅하고, 성장을 분석했다. 형질전환 실험에 따라, 50% 내지 90%의 SMM-내성 주요 형질전환체를 슈크로즈 배지 중에서 성장시킬 수 있다.
본원에서 기술된 각종 국면, 양태 및 선택안 모두는 임의의 모든 변형태에 조합될 수 있다.
본원에서 언급된 모든 공보, 특허문헌, 및 특허출원은 마치 각각의 개별 공보, 특허문헌 또는 특허출원이 구체적으로 그리고 개별적으로 참조로 인용되는 것으로 기술되는 경우와 동일한 정도로 본원에 참조로 인용된다.
<110> DSM IP ASSETS B.V. <120> Protein production in microorganisms of the phylum labyrinthulomycota <130> IPA110736 <140> PCT/US2010/027352 <141> 2010-03-15 <150> US 61/160,618 <151> 2009-03-16 <150> US 61/290,441 <151> 2009-12-28 <160> 75 <170> KopatentIn 2.0 <210> 1 <211> 35 <212> PRT <213> Schizochytrium <400> 1 Met Ala Asn Ile Met Ala Asn Val Thr Pro Gln Gly Val Ala Lys Gly 1 5 10 15 Phe Gly Leu Phe Val Gly Val Leu Phe Phe Leu Tyr Trp Phe Leu Val 20 25 30 Gly Leu Ala 35 <210> 2 <211> 105 <212> DNA <213> Schizochytrium <400> 2 atggccaaca tcatggccaa cgtcacgccc cagggcgtcg ccaagggctt tggcctcttt 60 gtcggcgtgc tcttctttct ctactggttc cttgtcggcc tcgcc 105 <210> 3 <211> 1999 <212> DNA <213> Schizochytrium <400> 3 ccgcgaatca agaaggtagg cgcgctgcga ggcgcggcgg cggagcggag cgagggagag 60 ggagagggag agagagggag ggagacgtcg ccgcggcggg gcctggcctg gcctggtttg 120 gcttggtcag cgcggccttg tccgagcgtg cagctggagt tgggtggatt catttggatt 180 ttcttttgtt tttgtttttc tctctttccc ggaaagtgtt ggccggtcgg tgttctttgt 240 tttgatttct tcaaaagttt tggtggttgg ttctctctct tggctctctg tcaggcggtc 300 cggtccacgc cccggcctct cctctcctct cctctcctct cctctccgtg cgtatacgta 360 cgtacgtttg tatacgtaca tacatcccgc ccgccgtgcc ggcgagggtt tgctcagcct 420 ggagcaatgc gatgcgatgc gatgcgatgc gacgcgacgc gacgcgagtc actggttcgc 480 gctgtggctg tggcttgctt gcttacttgc tttcgagctc tcccgctttc ttctttcctt 540 ctcacgccac caccaacgaa agaagatcgg ccccggcacg ccgctgagaa gggctggcgg 600 cgatgacggc acgcgcgccc gctgccacgt tggcgctcgc tgctgctgct gctgctgctg 660 ctgctgctgc tgctgctgct gctgctgctt ctgcgcgcag gctttgccac gaggccggcg 720 tgctggccgc tgccgcttcc agtccgcgtg gagagatcga atgagagata aactggatgg 780 attcatcgag ggatgaatga acgatggttg gatgcctttt tcctttttca ggtccacagc 840 gggaagcagg agcgcgtgaa tctgccgcca tccgcatacg tctgcatcgc atcgcatcgc 900 atgcacgcat cgctcgccgg gagccacaga cgggcgacag ggcggccagc cagccaggca 960 gccagccagg caggcaccag agggccagag agcgcgcctc acgcacgcgc cgcagtgcgc 1020 gcatcgctcg cagtgcagac cttgattccc cgcgcggatc tccgcgagcc cgaaacgaag 1080 agcgccgtac gggcccatcc tagcgtcgcc tcgcaccgca tcgcatcgca tcgcgttccc 1140 tagagagtag tactcgacga aggcaccatt tccgcgctcc tcttcggcgc gatcgaggcc 1200 cccggcgccg cgacgatcgc ggcggccgcg gcgctggcgg cggccctggc gctcgcgctg 1260 gcggccgccg cgggcgtctg gccctggcgc gcgcgggcgc cgcaggagga gcggcagcgg 1320 ctgctcgccg ccagagaagg agcgcgccgg gcccggggag ggacggggag gagaaggaga 1380 aggcgcgcaa ggcggccccg aaagagaaga ccctggactt gaacgcgaag aagaagaaga 1440 aggagaagaa gttgaagaag aagaagaaga aggagaggaa gttgaagaag acgaggagca 1500 ggcgcgttcc aaggcgcgtt ctcttccgga ggcgcgttcc agctgcggcg gcggggcggg 1560 ctgcggggcg ggcgcgggcg cgggtgcggg cagaggggac gcgcgcgcgg aggcggaggg 1620 ggccgagcgg gagcccctgc tgctgcgggg cgcccgggcc gcaggtgtgg cgcgcgcgac 1680 gacggaggcg acgacgccag cggccgcgac gacaaggccg gcggcgtcgg cgggcggaag 1740 gccccgcgcg gagcaggggc gggagcagga caaggcgcag gagcaggagc agggccggga 1800 gcgggagcgg gagcgggcgg cggagcccga ggcagaaccc aatcgagatc cagagcgagc 1860 agaggccggc cgcgagcccg agcccgcgcc gcagatcact agtaccgctg cggaatcaca 1920 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagccacgag agggagataa 1980 agaaaaagcg gcagagacg 1999 <210> 4 <211> 325 <212> DNA <213> Schizochytrium <400> 4 gatccgaaag tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa 60 gatcgtatta catagtattt ttcccctact ctttgtgttt gtcttttttt ttttttgaac 120 gcattcaagc cacttgtctt ggtttacttg tttgtttgct tgcttgcttg cttgcttgcc 180 tgcttcttgg tcagacggcc caaaaaaggg aaaaaattca ttcatggcac agataagaaa 240 aagaaaaagt ttgtcgacca ccgtcatcag aaagcaagag aagagaaaca ctcgcgctca 300 cattctcgct cgcgtaagaa tctta 325 <210> 5 <211> 372 <212> DNA <213> Streptoalloteichus hindustanus <400> 5 atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc 60 gagttctgga ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt 120 gtggtccggg acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac 180 aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag 240 gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag 300 ccgtgggggc gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc 360 gaggagcagg ac 372 <210> 6 <211> 2055 <212> DNA <213> Schizochytrium <400> 6 atgagcgcga cccgcgcggc gacgaggaca gcggcggcgc tgtcctcggc gctgacgacg 60 cctgtaaagc agcagcagca gcagcagctg cgcgtaggcg cggcgtcggc acggctggcg 120 gccgcggcgt tctcgtccgg cacgggcgga gacgcggcca agaaggcggc cgcggcgagg 180 gcgttctcca cgggacgcgg ccccaacgcg acacgcgaga agagctcgct ggccacggtc 240 caggcggcga cggacgatgc gcgcttcgtc ggcctgaccg gcgcccaaat ctttcatgag 300 ctcatgcgcg agcaccaggt ggacaccatc tttggctacc ctggcggcgc cattctgccc 360 gtttttgatg ccatttttga gagtgacgcc ttcaagttca ttctcgctcg ccacgagcag 420 ggcgccggcc acatggccga gggctacgcg cgcgccacgg gcaagcccgg cgttgtcctc 480 gtcacctcgg gccctggagc caccaacacc atcaccccga tcatggatgc ttacatggac 540 ggtacgccgc tgctcgtgtt caccggccag gtgcccacct ctgctgtcgg cacggacgct 600 ttccaggagt gtgacattgt tggcatcagc cgcgcgtgca ccaagtggaa cgtcatggtc 660 aaggacgtga aggagctccc gcgccgcatc aatgaggcct ttgagattgc catgagcggc 720 cgcccgggtc ccgtgctcgt cgatcttcct aaggatgtga ccgccgttga gctcaaggaa 780 atgcccgaca gctcccccca ggttgctgtg cgccagaagc aaaaggtcga gcttttccac 840 aaggagcgca ttggcgctcc tggcacggcc gacttcaagc tcattgccga gatgatcaac 900 cgtgcggagc gacccgtcat ctatgctggc cagggtgtca tgcagagccc gttgaatggc 960 ccggctgtgc tcaaggagtt cgcggagaag gccaacattc ccgtgaccac caccatgcag 1020 ggtctcggcg gctttgacga gcgtagtccc ctctccctca agatgctcgg catgcacggc 1080 tctgcctacg ccaactactc gatgcagaac gccgatctta tcctggcgct cggtgcccgc 1140 tttgatgatc gtgtgacggg ccgcgttgac gcctttgctc cggaggctcg ccgtgccgag 1200 cgcgagggcc gcggtggcat cgttcacttt gagatttccc ccaagaacct ccacaaggtc 1260 gtccagccca ccgtcgcggt cctcggcgac gtggtcgaga acctcgccaa cgtcacgccc 1320 cacgtgcagc gccaggagcg cgagccgtgg tttgcgcaga tcgccgattg gaaggagaag 1380 cacccttttc tgctcgagtc tgttgattcg gacgacaagg ttctcaagcc gcagcaggtc 1440 ctcacggagc ttaacaagca gattctcgag attcaggaga aggacgccga ccaggaggtc 1500 tacatcacca cgggcgtcgg aagccaccag atgcaggcag cgcagttcct tacctggacc 1560 aagccgcgcc agtggatctc ctcgggtggc gccggcacta tgggctacgg ccttccctcg 1620 gccattggcg ccaagattgc caagcccgat gctattgtta ttgacatcga tggtgatgct 1680 tcttattcga tgaccggtat ggaattgatc acagcagccg aattcaaggt tggcgtgaag 1740 attcttcttt tgcagaacaa ctttcagggc atggtcaaga actggcagga tctcttttac 1800 gacaagcgct actcgggcac cgccatgttc aacccgcgct tcgacaaggt cgccgatgcg 1860 atgcgtgcca agggtctcta ctgcgcgaaa cagtcggagc tcaaggacaa gatcaaggag 1920 tttctcgagt acgatgaggg tcccgtcctc ctcgaggttt tcgtggacaa ggacacgctc 1980 gtcttgccca tggtccccgc tggctttccg ctccacgaga tggtcctcga gcctcctaag 2040 cccaaggacg cctaa 2055 <210> 7 <211> 684 <212> PRT <213> Schizochytrium <400> 7 Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser 1 5 10 15 Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val 20 25 30 Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr 35 40 45 Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr 50 55 60 Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val 65 70 75 80 Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln 85 90 95 Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly 100 105 110 Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser 115 120 125 Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His 130 135 140 Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu 145 150 155 160 Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp 165 170 175 Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro 180 185 190 Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly 195 200 205 Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys 210 215 220 Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly 225 230 235 240 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255 Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln 260 265 270 Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly 275 280 285 Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg 290 295 300 Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly 305 310 315 320 Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr 325 330 335 Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser 340 345 350 Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met 355 360 365 Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 380 Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn 405 410 415 Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430 Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu 435 440 445 Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460 Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val 465 470 475 480 Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala 485 490 495 Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln 500 505 510 Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser 515 520 525 Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala 530 535 540 Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala 545 550 555 560 Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys 565 570 575 Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val 580 585 590 Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605 Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620 Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu 625 630 635 640 Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655 Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670 Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 680 <210> 8 <211> 684 <212> PRT <213> Artificial Sequence <220> <223> Mutated ALS 1 <400> 8 Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser 1 5 10 15 Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val 20 25 30 Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr 35 40 45 Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr 50 55 60 Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val 65 70 75 80 Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln 85 90 95 Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly 100 105 110 Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser 115 120 125 Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His 130 135 140 Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu 145 150 155 160 Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp 165 170 175 Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro 180 185 190 Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly 195 200 205 Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys 210 215 220 Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly 225 230 235 240 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255 Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln 260 265 270 Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly 275 280 285 Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg 290 295 300 Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly 305 310 315 320 Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr 325 330 335 Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser 340 345 350 Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met 355 360 365 Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 380 Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn 405 410 415 Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430 Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu 435 440 445 Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460 Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val 465 470 475 480 Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala 485 490 495 Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln 500 505 510 Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser 515 520 525 Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala 530 535 540 Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala 545 550 555 560 Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys 565 570 575 Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val 580 585 590 Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605 Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620 Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu 625 630 635 640 Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655 Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670 Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 680 <210> 9 <211> 684 <212> PRT <213> Artificial Sequence <220> <223> Mutated ALS 2 <400> 9 Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser 1 5 10 15 Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val 20 25 30 Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr 35 40 45 Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr 50 55 60 Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val 65 70 75 80 Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln 85 90 95 Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly 100 105 110 Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser 115 120 125 Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His 130 135 140 Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu 145 150 155 160 Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp 165 170 175 Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln 180 185 190 Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly 195 200 205 Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys 210 215 220 Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly 225 230 235 240 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255 Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln 260 265 270 Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly 275 280 285 Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg 290 295 300 Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly 305 310 315 320 Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr 325 330 335 Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser 340 345 350 Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met 355 360 365 Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 380 Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn 405 410 415 Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430 Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu 435 440 445 Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460 Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val 465 470 475 480 Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala 485 490 495 Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln 500 505 510 Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser 515 520 525 Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala 530 535 540 Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala 545 550 555 560 Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys 565 570 575 Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val 580 585 590 Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605 Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620 Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu 625 630 635 640 Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655 Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670 Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 680 <210> 10 <211> 684 <212> PRT <213> Artificial Sequence <220> <223> Mutated ALS 3 <400> 10 Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser 1 5 10 15 Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val 20 25 30 Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr 35 40 45 Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr 50 55 60 Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val 65 70 75 80 Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln 85 90 95 Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly 100 105 110 Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser 115 120 125 Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His 130 135 140 Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu 145 150 155 160 Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp 165 170 175 Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln 180 185 190 Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly 195 200 205 Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys 210 215 220 Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly 225 230 235 240 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255 Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln 260 265 270 Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly 275 280 285 Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg 290 295 300 Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly 305 310 315 320 Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr 325 330 335 Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser 340 345 350 Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met 355 360 365 Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 380 Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn 405 410 415 Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430 Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu 435 440 445 Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460 Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val 465 470 475 480 Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala 485 490 495 Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln 500 505 510 Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser 515 520 525 Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala 530 535 540 Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala 545 550 555 560 Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys 565 570 575 Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val 580 585 590 Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605 Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620 Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu 625 630 635 640 Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655 Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670 Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 680 <210> 11 <211> 2052 <212> DNA <213> Artificial Sequence <220> <223> Mutated ALS 1 <400> 11 atgagcgcga cccgcgcggc gacgaggaca gcggcggcgc tgtcctcggc gctgacgacg 60 cctgtaaagc agcagcagca gcagcagctg cgcgtaggcg cggcgtcggc acggctggcg 120 gccgcggcgt tctcgtccgg cacgggcgga gacgcggcca agaaggcggc cgcggcgagg 180 gcgttctcca cgggacgcgg ccccaacgcg acacgcgaga agagctcgct ggccacggtc 240 caggcggcga cggacgatgc gcgcttcgtc ggcctgaccg gcgcccaaat ctttcatgag 300 ctcatgcgcg agcaccaggt ggacaccatc tttggctacc ctggcggcgc cattctgccc 360 gtttttgatg ccatttttga gagtgacgcc ttcaagttca ttctcgctcg ccacgagcag 420 ggcgccggcc acatggccga gggctacgcg cgcgccacgg gcaagcccgg cgttgtcctc 480 gtcacctcgg gccctggagc caccaacacc atcaccccga tcatggatgc ttacatggac 540 ggtacgccgc tgctcgtgtt caccggccag gtgcccacct ctgctgtcgg cacggacgct 600 ttccaggagt gtgacattgt tggcatcagc cgcgcgtgca ccaagtggaa cgtcatggtc 660 aaggacgtga aggagctccc gcgccgcatc aatgaggcct ttgagattgc catgagcggc 720 cgcccgggtc ccgtgctcgt cgatcttcct aaggatgtga ccgccgttga gctcaaggaa 780 atgcccgaca gctcccccca ggttgctgtg cgccagaagc aaaaggtcga gcttttccac 840 aaggagcgca ttggcgctcc tggcacggcc gacttcaagc tcattgccga gatgatcaac 900 cgtgcggagc gacccgtcat ctatgctggc cagggtgtca tgcagagccc gttgaatggc 960 ccggctgtgc tcaaggagtt cgcggagaag gccaacattc ccgtgaccac caccatgcag 1020 ggtctcggcg gctttgacga gcgtagtccc ctctccctca agatgctcgg catgcacggc 1080 tctgcctacg ccaactactc gatgcagaac gccgatctta tcctggcgct cggtgcccgc 1140 tttgatgatc gtgtgacggg ccgcgttgac gcctttgctc cggaggctcg ccgtgccgag 1200 cgcgagggcc gcggtggcat cgttcacttt gagatttccc ccaagaacct ccacaaggtc 1260 gtccagccca ccgtcgcggt cctcggcgac gtggtcgaga acctcgccaa cgtcacgccc 1320 cacgtgcagc gccaggagcg cgagccgtgg tttgcgcaga tcgccgattg gaaggagaag 1380 cacccttttc tgctcgagtc tgttgattcg gacgacaagg ttctcaagcc gcagcaggtc 1440 ctcacggagc ttaacaagca gattctcgag attcaggaga aggacgccga ccaggaggtc 1500 tacatcacca cgggcgtcgg aagccaccag atgcaggcag cgcagttcct tacctggacc 1560 aagccgcgcc agtggatctc ctcgggtggc gccggcacta tgggctacgg ccttccctcg 1620 gccattggcg ccaagattgc caagcccgat gctattgtta ttgacatcga tggtgatgct 1680 tcttattcga tgaccggtat ggaattgatc acagcagccg aattcaaggt tggcgtgaag 1740 attcttcttt tgcagaacaa ctttcagggc atggtcaaga acgttcagga tctcttttac 1800 gacaagcgct actcgggcac cgccatgttc aacccgcgct tcgacaaggt cgccgatgcg 1860 atgcgtgcca agggtctcta ctgcgcgaaa cagtcggagc tcaaggacaa gatcaaggag 1920 tttctcgagt acgatgaggg tcccgtcctc ctcgaggttt tcgtggacaa ggacacgctc 1980 gtcttgccca tggtccccgc tggctttccg ctccacgaga tggtcctcga gcctcctaag 2040 cccaaggacg cc 2052 <210> 12 <211> 2052 <212> DNA <213> Artificial Sequence <220> <223> Mutated ALS 2 <400> 12 atgagcgcga cccgcgcggc gacgaggaca gcggcggcgc tgtcctcggc gctgacgacg 60 cctgtaaagc agcagcagca gcagcagctg cgcgtaggcg cggcgtcggc acggctggcg 120 gccgcggcgt tctcgtccgg cacgggcgga gacgcggcca agaaggcggc cgcggcgagg 180 gcgttctcca cgggacgcgg ccccaacgcg acacgcgaga agagctcgct ggccacggtc 240 caggcggcga cggacgatgc gcgcttcgtc ggcctgaccg gcgcccaaat ctttcatgag 300 ctcatgcgcg agcaccaggt ggacaccatc tttggctacc ctggcggcgc cattctgccc 360 gtttttgatg ccatttttga gagtgacgcc ttcaagttca ttctcgctcg ccacgagcag 420 ggcgccggcc acatggccga gggctacgcg cgcgccacgg gcaagcccgg cgttgtcctc 480 gtcacctcgg gccctggagc caccaacacc atcaccccga tcatggatgc ttacatggac 540 ggtacgccgc tgctcgtgtt caccggccag gtgcagacct ctgctgtcgg cacggacgct 600 ttccaggagt gtgacattgt tggcatcagc cgcgcgtgca ccaagtggaa cgtcatggtc 660 aaggacgtga aggagctccc gcgccgcatc aatgaggcct ttgagattgc catgagcggc 720 cgcccgggtc ccgtgctcgt cgatcttcct aaggatgtga ccgccgttga gctcaaggaa 780 atgcccgaca gctcccccca ggttgctgtg cgccagaagc aaaaggtcga gcttttccac 840 aaggagcgca ttggcgctcc tggcacggcc gacttcaagc tcattgccga gatgatcaac 900 cgtgcggagc gacccgtcat ctatgctggc cagggtgtca tgcagagccc gttgaatggc 960 ccggctgtgc tcaaggagtt cgcggagaag gccaacattc ccgtgaccac caccatgcag 1020 ggtctcggcg gctttgacga gcgtagtccc ctctccctca agatgctcgg catgcacggc 1080 tctgcctacg ccaactactc gatgcagaac gccgatctta tcctggcgct cggtgcccgc 1140 tttgatgatc gtgtgacggg ccgcgttgac gcctttgctc cggaggctcg ccgtgccgag 1200 cgcgagggcc gcggtggcat cgttcacttt gagatttccc ccaagaacct ccacaaggtc 1260 gtccagccca ccgtcgcggt cctcggcgac gtggtcgaga acctcgccaa cgtcacgccc 1320 cacgtgcagc gccaggagcg cgagccgtgg tttgcgcaga tcgccgattg gaaggagaag 1380 cacccttttc tgctcgagtc tgttgattcg gacgacaagg ttctcaagcc gcagcaggtc 1440 ctcacggagc ttaacaagca gattctcgag attcaggaga aggacgccga ccaggaggtc 1500 tacatcacca cgggcgtcgg aagccaccag atgcaggcag cgcagttcct tacctggacc 1560 aagccgcgcc agtggatctc ctcgggtggc gccggcacta tgggctacgg ccttccctcg 1620 gccattggcg ccaagattgc caagcccgat gctattgtta ttgacatcga tggtgatgct 1680 tcttattcga tgaccggtat ggaattgatc acagcagccg aattcaaggt tggcgtgaag 1740 attcttcttt tgcagaacaa ctttcagggc atggtcaaga actggcagga tctcttttac 1800 gacaagcgct actcgggcac cgccatgttc aacccgcgct tcgacaaggt cgccgatgcg 1860 atgcgtgcca agggtctcta ctgcgcgaaa cagtcggagc tcaaggacaa gatcaaggag 1920 tttctcgagt acgatgaggg tcccgtcctc ctcgaggttt tcgtggacaa ggacacgctc 1980 gtcttgccca tggtccccgc tggctttccg ctccacgaga tggtcctcga gcctcctaag 2040 cccaaggacg cc 2052 <210> 13 <211> 2055 <212> DNA <213> Artificial Sequence <220> <223> Mutated ALS 3 <400> 13 atgagcgcga cccgcgcggc gacgaggaca gcggcggcgc tgtcctcggc gctgacgacg 60 cctgtaaagc agcagcagca gcagcagctg cgcgtaggcg cggcgtcggc acggctggcg 120 gccgcggcgt tctcgtccgg cacgggcgga gacgcggcca agaaggcggc cgcggcgagg 180 gcgttctcca cgggacgcgg ccccaacgcg acacgcgaga agagctcgct ggccacggtc 240 caggcggcga cggacgatgc gcgcttcgtc ggcctgaccg gcgcccaaat ctttcatgag 300 ctcatgcgcg agcaccaggt ggacaccatc tttggctacc ctggcggcgc cattctgccc 360 gtttttgatg ccatttttga gagtgacgcc ttcaagttca ttctcgctcg ccacgagcag 420 ggcgccggcc acatggccga gggctacgcg cgcgccacgg gcaagcccgg cgttgtcctc 480 gtcacctcgg gccctggagc caccaacacc atcaccccga tcatggatgc ttacatggac 540 ggtacgccgc tgctcgtgtt caccggccag gtgcagacct ctgctgtcgg cacggacgct 600 ttccaggagt gtgacattgt tggcatcagc cgcgcgtgca ccaagtggaa cgtcatggtc 660 aaggacgtga aggagctccc gcgccgcatc aatgaggcct ttgagattgc catgagcggc 720 cgcccgggtc ccgtgctcgt cgatcttcct aaggatgtga ccgccgttga gctcaaggaa 780 atgcccgaca gctcccccca ggttgctgtg cgccagaagc aaaaggtcga gcttttccac 840 aaggagcgca ttggcgctcc tggcacggcc gacttcaagc tcattgccga gatgatcaac 900 cgtgcggagc gacccgtcat ctatgctggc cagggtgtca tgcagagccc gttgaatggc 960 ccggctgtgc tcaaggagtt cgcggagaag gccaacattc ccgtgaccac caccatgcag 1020 ggtctcggcg gctttgacga gcgtagtccc ctctccctca agatgctcgg catgcacggc 1080 tctgcctacg ccaactactc gatgcagaac gccgatctta tcctggcgct cggtgcccgc 1140 tttgatgatc gtgtgacggg ccgcgttgac gcctttgctc cggaggctcg ccgtgccgag 1200 cgcgagggcc gcggtggcat cgttcacttt gagatttccc ccaagaacct ccacaaggtc 1260 gtccagccca ccgtcgcggt cctcggcgac gtggtcgaga acctcgccaa cgtcacgccc 1320 cacgtgcagc gccaggagcg cgagccgtgg tttgcgcaga tcgccgattg gaaggagaag 1380 cacccttttc tgctcgagtc tgttgattcg gacgacaagg ttctcaagcc gcagcaggtc 1440 ctcacggagc ttaacaagca gattctcgag attcaggaga aggacgccga ccaggaggtc 1500 tacatcacca cgggcgtcgg aagccaccag atgcaggcag cgcagttcct tacctggacc 1560 aagccgcgcc agtggatctc ctcgggtggc gccggcacta tgggctacgg ccttccctcg 1620 gccattggcg ccaagattgc caagcccgat gctattgtta ttgacatcga tggtgatgct 1680 tcttattcga tgaccggtat ggaattgatc acagcagccg aattcaaggt tggcgtgaag 1740 attcttcttt tgcagaacaa ctttcagggc atggtcaaga acgttcagga tctcttttac 1800 gacaagcgct actcgggcac cgccatgttc aacccgcgct tcgacaaggt cgccgatgcg 1860 atgcgtgcca agggtctcta ctgcgcgaaa cagtcggagc tcaaggacaa gatcaaggag 1920 tttctcgagt acgatgaggg tcccgtcctc ctcgaggttt tcgtggacaa ggacacgctc 1980 gtcttgccca tggtccccgc tggctttccg ctccacgaga tggtcctcga gcctcctaag 2040 cccaaggacg cctaa 2055 <210> 14 <211> 12 <212> DNA <213> Schizochytrium <400> 14 cacgacgagt tg 12 <210> 15 <211> 53 <212> PRT <213> Schizochytrium <400> 15 Met Ala Asn Ile Met Ala Asn Val Thr Pro Gln Gly Val Ala Lys Gly 1 5 10 15 Phe Gly Leu Phe Val Gly Val Leu Phe Phe Leu Tyr Trp Phe Leu Val 20 25 30 Gly Leu Ala Leu Leu Gly Asp Gly Phe Lys Val Ile Ala Gly Asp Ser 35 40 45 Ala Gly Thr Leu Phe 50 <210> 16 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer S4termF <400> 16 gatcccatgg cacgtgctac g 21 <210> 17 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer S4termR <400> 17 ggcaacatgt atgataagat ac 22 <210> 18 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer C2mcsSmaF <400> 18 gatccccggg ttaagcttgg t 21 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer C2mcsSmaR <400> 19 actggggccc gtttaaactc 20 <210> 20 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'tubMCS_BglI <400> 20 gactagatct caattttagg ccccccactg accg 34 <210> 21 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'SV40MCS_Sal <400> 21 gactgtcgac catgtatgat aagatacatt gatg 34 <210> 22 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'ALSproNde3 <400> 22 gactcatatg gcccaggcct actttcac 28 <210> 23 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'ALStermBglII <400> 23 gactagatct gggtcaaggc agaagaattc cgcc 34 <210> 24 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer sec.Gfp5'1b <400> 24 tactggttcc ttgtcggcct cgcccttctc ggcgatggct tcaaggtcat cgccggtgac 60 tccgccggta cgctcttcat ggtgagcaag ggcgagg 97 <210> 25 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer sec.Gfp3'Spe <400> 25 gatcggtacc ggtgttcttt gttttgattt ct 32 <210> 26 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer sec.Gfp5'Bam <400> 26 taatggatcc atggccaaca tcatggccaa cgtcacgccc cagggcgtcg ccaagggctt 60 tggcctcttt gtcggcgtgc tcttctttct ctactggttc cttgt 105 <210> 27 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer ss.eGfpHELD3'RV <400> 27 cctgatatct tacaactcgt cgtggttgta cagctcgtcc 40 <210> 28 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer sec.Gfp5'Bam2 <400> 28 taatggatcc atggccaaca tcatggccaa cgtcacgccc cagggcgtcg ccaagggctt 60 tggcctcttt gtcggcgtgc tcttctttct ctactggttc cttgt 105 <210> 29 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer prREZ15 <400> 29 cggtacccgc gaatcaagaa ggtaggc 27 <210> 30 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer prREZ16 <400> 30 cggatcccgt ctctgccgct ttttctt 27 <210> 31 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer prREZ17 <400> 31 cggatccgaa agtgaacctt gtcctaaccc 30 <210> 32 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer prREZ18 <400> 32 ctctagacag atccgcacca tcggccg 27 <210> 33 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'eGFP_kpn <400> 33 gactggtacc atggtgaagc aagggcgagg ag 32 <210> 34 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'eGFP_xba <400> 34 gacttctaga ttacttgtac agctcgtcca tgcc 34 <210> 35 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'ORFCproKpn-2 <400> 35 gatcggtacc ggtgttcttt gttttgattt ct 32 <210> 36 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'ORFCproKpn-2 <400> 36 gatcggtacc gtctctgccg ctttttcttt a 31 <210> 37 <211> 20 <212> PRT <213> Schizochytrium <400> 37 Met Lys Phe Ala Thr Ser Val Ala Ile Leu Leu Val Ala Asn Ile Ala 1 5 10 15 Thr Ala Leu Ala 20 <210> 38 <211> 60 <212> DNA <213> Schizochytrium <400> 38 atgaagttcg cgacctcggt cgcaattttg cttgtggcca acatagccac cgccctcgcg 60 60 <210> 39 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'ss-X Bgl long <400> 39 gactagatct atgaagttcg cgacctcg 28 <210> 40 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'ritx_kap_bh_Bgl <400> 40 gactagatct tcagcactca ccgcggttaa agg 33 <210> 41 <211> 702 <212> DNA <213> Artificial Sequence <220> <223> Optimized Sec1 <400> 41 atgaagttcg cgacctcggt cgcaattttg cttgtggcca acatagccac cgccctcgcg 60 cagatcgtcc tcagccagtc ccccgccatc ctttccgctt cccccggtga gaaggtgacc 120 atgacctgcc gcgctagctc ctccgtctcg tacatccact ggttccagca gaagcccggc 180 tcgtccccca agccctggat ctacgccacc tccaacctcg cctccggtgt tcccgttcgt 240 ttttccggtt ccggttccgg cacctcctac tccctcacca tctcccgcgt cgaggccgag 300 gatgccgcca cctactactg ccagcagtgg accagcaacc cccccacctt cggcggtggt 360 acgaagctcg agattaagcg caccgtcgcc gccccctccg tcttcatttt tcccccctcc 420 gatgagcagc tcaagtccgg taccgcctcc gtcgtttgcc tcctcaacaa cttctacccc 480 cgtgaggcca aggtccagtg gaaggtcgac aacgcgcttc agtccggtaa ctcccaggag 540 tccgtcaccg agcaggattc gaaggacagc acctactccc tctcctccac cctcaccctc 600 tccaaggccg actacgagaa gcacaaggtc tacgcctgcg aggtcacgca ccagggtctt 660 tcctcccccg tcacgaagtc ctttaaccgc ggtgagtgct ga 702 <210> 42 <211> 853 <212> DNA <213> Schizochytrium <400> 42 ctccatcgat cgtgcggtca aaaagaaagg aagaagaaag gaaaaagaaa ggcgtgcgca 60 cccgagtgcg cgctgagcgc ccgctcgcgg ccccgcggag cctccgcgtt agtccccgcc 120 ccgcgccgcg cagtcccccg ggaggcatcg cgcacctctc gccgccccct cgcgcctcgc 180 cgattccccg cctccccttt tccgcttctt cgccgcctcc gctcgcggcc gcgtcgcccg 240 cgccccgctc cctatctgct ccccaggggg gcactccgca ccttttgcgc ccgctgccgc 300 cgccgcggcc gccccgccgc cctggtttcc cccgcgagcg cggccgcgtc gccgcgcaaa 360 gactcgccgc gtgccgcccc gagcaacggg tggcggcggc gcggcggcgg gcggggcgcg 420 gcggcgcgta ggcggggcta ggcgccggct aggcgaaacg ccgcccccgg gcgccgccgc 480 cgcccgctcc agagcagtcg ccgcgccaga ccgccaacgc agagaccgag accgaggtac 540 gtcgcgcccg agcacgccgc gacgcgcggc agggacgagg agcacgacgc cgcgccgcgc 600 cgcgcggggg gggggaggga gaggcaggac gcgggagcga gcgtgcatgt ttccgcgcga 660 gacgacgccg cgcgcgctgg agaggagata aggcgcttgg atcgcgagag ggccagccag 720 gctggaggcg aaaatgggtg gagaggatag tatcttgcgt gcttggacga ggagactgac 780 gaggaggacg gatacgtcga tgatgatgtg cacagagaag aagcagttcg aaagcgacta 840 ctagcaagca agg 853 <210> 43 <211> 1064 <212> DNA <213> Schizochytrium <400> 43 ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60 tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120 gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180 ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240 gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300 gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360 gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420 tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480 ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540 ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600 gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660 taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720 accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780 cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840 cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900 aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960 gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020 gcacagagaa gaagcagttc gaaagcgact actagcaagc aagg 1064 <210> 44 <211> 837 <212> DNA <213> Schizochytrium <400> 44 cttcgctttc tcaacctatc tggacagcaa tccgccactt gccttgatcc ccttccgcgc 60 ctcaatcact cgctccacgt ccctcttccc cctcctcatc tccgtgcttt ctctgccccc 120 cccccccccg ccgcggcgtg cgcgcgcgtg gcgccgcggc cgcgacacct tccatactat 180 cctcgctccc aaaatgggtt gcgctatagg gcccggctag gcgaaagtct agcaggcact 240 tgcttggcgc agagccgccg cggccgctcg ttgccgcgga tggagaggga gagagagccc 300 gcctcgataa gcagagacag acagtgcgac tgacagacag acagagagac tggcagaccg 360 gaatacctcg aggtgagtgc ggcgcgggcg agcgggcggg agcgggagcg caagagggac 420 ggcgcggcgc ggcggccctg cgcgacgccg cggcgtattc tcgtgcgcag cgccgagcag 480 cgggacgggc ggctggctga tggttgaagc ggggcggggt gaaatgttag atgagatgat 540 catcgacgac ggtccgtgcg tcttggctgg cttggctggc ttggctggcg ggcctgccgt 600 gtttgcgaga aagaggatga ggagagcgac gaggaaggac gagaagactg acgtgtaggg 660 cgcgcgatgg atgatcgatt gattgattga ttgattggtt gattggctgt gtggtcgatg 720 aacgtgtaga ctcagggagc gtggttaaat tgttcttgcg ccagacgcga ggactccacc 780 cccttctttc gcctttacac agcctttttg tgaagcaaca agaaagaaaa agccaag 837 <210> 45 <211> 1020 <212> DNA <213> Schizochytrium <400> 45 ctttttccgc tctgcataat cctaaaagaa agactatacc ctagtcactg tacaaatggg 60 acatttctct cccgagcgat agctaaggat ttttgcttcg tgtgcactgt gtgctctggc 120 cgcgcatcga aagtccagga tcttactgtt tctctttcct ttcctttatt tcctgttctc 180 ttcttcgctt tctcaaccta tctggacagc aatccgccac ttgccttgat ccccttccgc 240 gcctcaatca ctcgctccac gtccctcttc cccctcctca tctccgtgct ttctctcgcc 300 cccccccccc ccgccgcggc gtgcgcgcgc gtggcgccgc ggccgcgaca ccttccatac 360 tatcctcgct cccaaaatgg gttgcgctat agggcccggc taggcgaaag tctagcaggc 420 acttgcttgg cgcagagccg ccgcggccgc tcgttgccgc ggatggagag ggagagagag 480 cccgcctcga taagcagaga cagacagtgc gactgacaga cagacagaga gactggcaga 540 ccggaatacc tcgaggtgag tgcggcgcgg gcgagcgggc gggagcggga gcgcaagagg 600 gacggcgcgg cgcggcggcc ctgcgcgacg ccgcggcgta ttctcgtgcg cagcgccgag 660 cagcgggacg ggcggctggc tgatggttga agcggggcgg ggtgaaatgt tagatgagat 720 gatcatcgac gacggtccgt gcgtcttggc tggcttggct ggcttggctg gcgggcctgc 780 cgtgtttgcg agaaagagga tgaggagagc gacgaggaag gacgagaaga ctgacgtgta 840 gggcgcgcga tggatgatcg attgattgat tgattgattg gttgattggc tgtgtggtcg 900 atgaacgtgt agactcaggg agcgtggtta aattgttctt gcgccagacg cgaggactcc 960 acccccttct ttcgccttta cacagccttt ttgtgaagca acaagaaaga aaaagccaag 1020 1020 <210> 46 <211> 1416 <212> DNA <213> Schizochytrium <400> 46 cccgtccttg acgccttcgc ttccggcgcg gccatcgatt caattcaccc atccgatacg 60 ttccgccccc tcacgtccgt ctgcgcacga cccctgcacg accacgccaa ggccaacgcg 120 ccgctcagct cagcttgtcg acgagtcgca cgtcacatat ctcagatgca ttgcctgcct 180 gcctgcctgc ctgcctgcct gcctgcctgc ctgcctgcct cagcctctct ttgctctctc 240 tgcggcggcc gctgcgacgc gctgtacagg agaatgactc caggaagtgc ggctgggata 300 cgcgctggcg tcggccgtga tgcgcgtgac gggcggcggg cacggccggc acgggttgag 360 cagaggacga agcgaggcga gacgagacag gccaggcgcg gggagcgctc gctgccgtga 420 gcagcagacc agggcgcagg aatgtacttt tcttgcggga gcggagacga ggctgccggc 480 tgctggctgc cggttgctct gcacgcgccg cccgacttgg cgtagcgtgg acgcgcggcg 540 gcggccgccg tctcgtcgcg gtcggctttg ccgtgtatcg acgctgcggg cttgacacgg 600 gatggcggaa gttcagcatc gctgcgatcc ctcgcgccgc agaacgagga gagcgcaggc 660 cggcttcaag tttgaaagga gaggaaggca ggcaaggagc tggaagcttg ccgcggaagg 720 cgcaggcatg cgtcacgtga aaaaaaggga tttcaagagt agtaagtagg tatggtctac 780 aagtccccta ttcttacttc gcggaacgtg ggctgctcgt gcgggcgtcc atcttgtttt 840 tgtttttttt tccgctaggc gcgtgcattg cttgatgagt ctcagcgttc gtctgcagcg 900 agggcaggaa aataagcggc ccgtgccgtc gagcgcacag gacgtgcaag cgccttgcga 960 gcgcagcatc cttgcacggc gagcatagag accgcggccg atggactcca gcgaggaatt 1020 ttcgaccctc tctatcaagc tgcgcttgac agccgggaat ggcagcctga ggagagaggg 1080 gcgaaggaag ggacttggag aaaagaggta aggcaccctc aatcacggcg cgtgaaagcc 1140 agtcatccct cgcaaagaaa agacaaaagc gggttttttg tttcgatggg aaagaatttc 1200 ttagaggaag aagcggcaca cagactcgcg ccatgcagat ttctgcgcag ctcgcgatca 1260 aaccaggaac gtggtcgctg cgcgccacta tcaggggtag cgcacgaata ccaaacgcat 1320 tactagctac gcgcctgtga cccgaggatc gggccacaga cgttgtctct tgccatccca 1380 cgacctggca gcgagaagat cgtccattac tcatcg 1416 <210> 47 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'60S-807 <400> 47 tcgatttgcg gatacttgct caca 24 <210> 48 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'60S-2821 <400> 48 gacgacctcg cccttggaca c 21 <210> 49 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'60Sp-1302-Kpn <400> 49 gactggtacc tttttccgct ctgcataatc ctaa 34 <210> 50 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'60Sp-Bam <400> 50 gactggatcc ttggcttttt ctttcttgtt gc 32 <210> 51 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'EF1-68 <400> 51 cgccgttgac cgccgcttga ctct 24 <210> 52 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'EF1-2312 <400> 52 cgggggtagc ctcggggatg gact 24 <210> 53 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'EF1-54-Kpn <400> 53 gactggtacc tcttatctgc ctcgcgccgt tgac 34 <210> 54 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'EF1-1114-Bam <400> 54 gactggatcc cttgcttgct agtagtcgct ttcgaac 37 <210> 55 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 5'Sec1P-kpn <400> 55 gactggtacc ccgtccttga cgccttcgc 29 <210> 56 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer 3'Sec1P-ba <400> 56 gactggatcc gatgagtaat ggacgatctt c 31 <210> 57 <211> 1614 <212> DNA <213> Artificial Sequence <220> <223> Secretion signal <400> 57 ggatccatga agttcgcgac ctcggtcgca attttgcttg tggccaacat agccaccgcc 60 ctcgcgtcga tgaccaacga gacctcggac cgccctctcg tgcactttac ccccaacaag 120 ggttggatga acgatcccaa cggcctctgg tacgacgaga aggatgctaa gtggcacctt 180 tactttcagt acaaccctaa cgacaccgtc tggggcaccc cgctcttctg gggccacgcc 240 acctccgacg acctcaccaa ctgggaggac cagcccattg ctatcgcccc caagcgcaac 300 gactcgggag ctttttccgg ttccatggtt gtggactaca acaacacctc cggttttttt 360 aacgacacca ttgacccccg ccagcgctgc gtcgccatct ggacctacaa cacgcccgag 420 agcgaggagc agtacatcag ctacagcctt gatggaggct acacctttac cgagtaccag 480 aagaaccctg tcctcgccgc caactccacc cagttccgcg accctaaggt tttttggtac 540 gagccttccc agaagtggat tatgaccgcc gctaagtcgc aggattacaa gatcgagatc 600 tacagcagcg acgacctcaa gtcctggaag cttgagtccg cctttgccaa cgagggtttt 660 ctcggatacc agtacgagtg ccccggtctc atcgaggtcc ccaccgagca ggacccgtcc 720 aagtcctact gggtcatgtt tatttccatc aaccctggcg cccctgccgg cggcagcttc 780 aaccagtact tcgtcggctc ctttaacggc acgcattttg aggccttcga caaccagtcc 840 cgcgtcgtcg acttcggcaa ggactactac gccctccaga ccttctttaa caccgacccc 900 acctacggca gcgccctcgg tattgcttgg gcctccaact gggagtactc cgctttcgtc 960 cccactaacc cctggcgcag ctcgatgtcc ctcgtccgca agttttcgct taacaccgag 1020 taccaggcca accccgagac cgagcttatt aacctgaagg ccgagcctat tctcaacatc 1080 tccaacgctg gcccctggtc ccgctttgct actaacacta ccctcaccaa ggccaactcc 1140 tacaacgtcg atctctccaa ctccaccggt actcttgagt ttgagctcgt ctacgccgtc 1200 aacaccaccc agaccatctc caagtccgtc ttcgccgacc tctccctctg gttcaagggc 1260 cttgaggacc ccgaggagta cctgcgcatg ggttttgagg tctccgcctc ctccttcttc 1320 ctcgatcgcg gtaactccaa ggttaagttt gtcaaggaga acccctactt tactaaccgt 1380 atgagcgtca acaaccagcc ctttaagtcc gagaacgatc ttagctacta caaggtttac 1440 ggcctcctcg accagaacat tctcgagctc tactttaacg acggagatgt cgtcagcacc 1500 aacacctact ttatgaccac tggaaacgcc ctcggcagcg tgaacatgac caccggagtc 1560 gacaacctct tttacattga caagtttcag gttcgcgagg ttaagtaaca tatg 1614 <210> 58 <211> 11495 <212> DNA <213> Artificial Sequence <220> <223> pCL0076 <400> 58 ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60 tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120 gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180 ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240 gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300 gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360 gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420 tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480 ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540 ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600 gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660 taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720 accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780 cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840 cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900 aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960 gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020 gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tgaagttcgc 1080 gacctcggtc gcaattttgc ttgtggccaa catagccacc gccctcgcgt cgatgaccaa 1140 cgagacctcg gaccgccctc tcgtgcactt tacccccaac aagggttgga tgaacgatcc 1200 caacggcctc tggtacgacg agaaggatgc taagtggcac ctttactttc agtacaaccc 1260 taacgacacc gtctggggca ccccgctctt ctggggccac gccacctccg acgacctcac 1320 caactgggag gaccagccca ttgctatcgc ccccaagcgc aacgactcgg gagctttttc 1380 cggttccatg gttgtggact acaacaacac ctccggtttt tttaacgaca ccattgaccc 1440 ccgccagcgc tgcgtcgcca tctggaccta caacacgccc gagagcgagg agcagtacat 1500 cagctacagc cttgatggag gctacacctt taccgagtac cagaagaacc ctgtcctcgc 1560 cgccaactcc acccagttcc gcgaccctaa ggttttttgg tacgagcctt cccagaagtg 1620 gattatgacc gccgctaagt cgcaggatta caagatcgag atctacagca gcgacgacct 1680 caagtcctgg aagcttgagt ccgcctttgc caacgagggt tttctcggat accagtacga 1740 gtgccccggt ctcatcgagg tccccaccga gcaggacccg tccaagtcct actgggtcat 1800 gtttatttcc atcaaccctg gcgcccctgc cggcggcagc ttcaaccagt acttcgtcgg 1860 ctcctttaac ggcacgcatt ttgaggcctt cgacaaccag tcccgcgtcg tcgacttcgg 1920 caaggactac tacgccctcc agaccttctt taacaccgac cccacctacg gcagcgccct 1980 cggtattgct tgggcctcca actgggagta ctccgctttc gtccccacta acccctggcg 2040 cagctcgatg tccctcgtcc gcaagttttc gcttaacacc gagtaccagg ccaaccccga 2100 gaccgagctt attaacctga aggccgagcc tattctcaac atctccaacg ctggcccctg 2160 gtcccgcttt gctactaaca ctaccctcac caaggccaac tcctacaacg tcgatctctc 2220 caactccacc ggtactcttg agtttgagct cgtctacgcc gtcaacacca cccagaccat 2280 ctccaagtcc gtcttcgccg acctctccct ctggttcaag ggccttgagg accccgagga 2340 gtacctgcgc atgggttttg aggtctccgc ctcctccttc ttcctcgatc gcggtaactc 2400 caaggttaag tttgtcaagg agaaccccta ctttactaac cgtatgagcg tcaacaacca 2460 gccctttaag tccgagaacg atcttagcta ctacaaggtt tacggcctcc tcgaccagaa 2520 cattctcgag ctctacttta acgacggaga tgtcgtcagc accaacacct actttatgac 2580 cactggaaac gccctcggca gcgtgaacat gaccaccgga gtcgacaacc tcttttacat 2640 tgacaagttt caggttcgcg aggttaagta acatatgtta tgagagatcc gaaagtgaac 2700 cttgtcctaa cccgacagcg aatggcggga gggggcgggc taaaagatcg tattacatag 2760 tatttttccc ctactctttg tgtttgtctt tttttttttt ttgaacgcat tcaagccact 2820 tgtctgggtt tacttgtttg tttgcttgct tgcttgcttg cttgcctgct tcttggtcag 2880 acggcccaaa aaagggaaaa aattcattca tggcacagat aagaaaaaga aaaagtttgt 2940 cgaccaccgt catcagaaag caagagaaga gaaacactcg cgctcacatt ctcgctcgcg 3000 taagaatctt agccacgcat acgaagtaat ttgtccatct ggcgaatctt tacatgagcg 3060 ttttcaagct ggagcgtgag atcatacctt tcttgatcgt aatgttccaa ccttgcatag 3120 gcctcgttgc gatccgctag caatgcgtcg tactcccgtt gcaactgcgc catcgcctca 3180 ttgtgacgtg agttcagatt cttctcgaga ccttcgagcg ctgctaattt cgcctgacgc 3240 tccttctttt gtgcttccat gacacgccgc ttcaccgtgc gttccacttc ttcctcagac 3300 atgcccttgg ctgcctcgac ctgctcggta agcttcgtcg taatctcctc gatctcggaa 3360 ttcttcttgc cctccatcca ctcggcacca tacttggcag cctgttcaac acgctcattg 3420 aaaaactttt cattctcttc cagctccgca acccgcgctc gaagctcatt cacttccgcc 3480 accacggctt cggcatcgag cgccgaatca gtcgccgaac tttccgaaag atacaccacg 3540 gcccctccgc tgctgctgcg cagcgtcatc atcagtcgcg tgttatcttc gcgcagattc 3600 tccacctgct ccgtaagcag cttcacggtg gcctcttgat tctgagggct cacgtcgtgg 3660 attagcgctt gcagctcttg cagctccgtc agcttggaag agctcgtaat catggctttg 3720 cacttgtcca gacgtcgcag agcgttcgag agccgcttcg cgttatctgc catggacgct 3780 tctgcgctcg cggcctccct gacgacagtc tcttgcagtt tcactagatc atgtccaatc 3840 agcttgcggt gcagctctcc aatcacgttc tgcatcttgt ttgtgtgtcc gggccgcgcc 3900 tcgtcttgcg atttgcgaat ttcctcctcg agctcgcgtt cgagctccag ggcgccttta 3960 agtagctcga agtcagccgc cgttagcccc agctccgtcg ccgcgttcag acagtcggtt 4020 agcttgattc gattccgctt ttccatggca agtttaagat cctggcccag ctgcacctcc 4080 tgcgccttgc gcatcatgcg cggttccgcc tggcgcaaaa gcttcgagtc gtatcctgcc 4140 tgccatgcca gcgcaatggc acgcacgagc gacttgagtt gccaactatt catcgccgag 4200 atgagcagca ttttgatctg catgaacacc tcgtcagagt cgtcatcctc tgcctcctcc 4260 agctctgcgg gcgagcgacg ctctccttgc agatgaagcg agggccgcag gcctccgaag 4320 agcacctctt gcgcgagatc ctcctccgtc gtcgccctcc gcaggattgc ggtcgtgtcc 4380 gccatcttgc cgccacagca gcttttgctc gctctgcacc ttcaatttct ggtgccgctg 4440 gtgccgctgg tgccgcttgt gctggtgctg gtgctggtgc tggtgctggt gccttgtgct 4500 ggtgctgcca cagacaccgc cgctcctgct gctgctcttc cggccccctc gccgccgccg 4560 cgagcccccg ccgcgcgccg tgcctgggct ctccgcgctc tccgcgggct cctcggcctc 4620 ggcctcgccg tccgcgacga cgtctgcgcg gccgatggtg cggatctgct ctagagggcc 4680 cttcgaaggt aagcctatcc ctaaccctct cctcggtctc gattctacgc gtaccggtca 4740 tcatcaccat caccattgag tttaaacggg ccccagcacg tgctacgaga tttcgattcc 4800 accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg 4860 atcctccagc gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca 4920 gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 4980 tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tacatggtcg 5040 acctgcagga acctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 5100 gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 5160 gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 5220 ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 5280 ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 5340 cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 5400 ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 5460 tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 5520 gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 5580 tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 5640 gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 5700 tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 5760 ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 5820 agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 5880 gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 5940 attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 6000 agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 6060 atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 6120 cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 6180 ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 6240 agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 6300 tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 6360 gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 6420 caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 6480 ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 6540 gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 6600 tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 6660 tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 6720 cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 6780 cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 6840 gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 6900 atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 6960 agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 7020 ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa 7080 aataggcgta tcacgaggcc ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc 7140 tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga 7200 caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggctggct taactatgcg 7260 gcatcagagc agattgtact gagagtgcac caagctttgc ctcaacgcaa ctaggcccag 7320 gcctactttc actgtgtctt gtcttgcctt tcacaccgac cgagtgtgca caaccgtgtt 7380 ttgcacaaag cgcaagatgc tcactcgact gtgaagcaaa ggttgcgcgc aagcgactgc 7440 gactgcgagg atgaggatga ctggcagcct gttcaaaaac tgaaaatccg cgatgggtca 7500 gctgccattc gcgcatgacg cctgcgagag acaagttaac tcgtgtcact ggcatgtcct 7560 agcatcttta cgcgagcaaa attcaatcgc tttatttttt cagtttcgta accttctcgc 7620 aaccgcgaat cgccgtttca gcctgactaa tctgcagctg cgtggcactg tcagtcagtc 7680 agtcagtcgt gcgcgctgtt ccagcaccga ggtcgcgcgt cgccgcgcct ggaccgctgc 7740 tgctactgct agtggcacgg caggtaggag cttgttgccg gaacaccagc agccgccagt 7800 cgacgccagc caggggaaag tccggcgtcg aagggagagg aaggcggcgt gtgcaaacta 7860 acgttgacca ctggcgcccg ccgacacgag caggaagcag gcagctgcag agcgcagcgc 7920 gcaagtgcag aatgcgcgaa agatccactt gcgcgcggcg ggcgcgcact tgcgggcgcg 7980 gcgcggaaca gtgcggaaag gagcggtgca gacggcgcgc agtgacagtg ggcgcaaagc 8040 cgcgcagtaa gcagcggcgg ggaacggtat acgcagtgcc gcgggccgcc gcacacagaa 8100 gtatacgcgg gccgaagtgg ggcgtcgcgc gcgggaagtg cggaatggcg ggcaaggaaa 8160 ggaggagacg gaaagagggc gggaaagaga gagagagaga gtgaaaaaag aaagaaagaa 8220 agaaagaaag aaagaaagct cggagccacg ccgcggggag agagagaaat gaaagcacgg 8280 cacggcaaag caaagcaaag cagacccagc cagacccagc cgagggagga gcgcgcgcag 8340 gacccgcgcg gcgagcgagc gagcacggcg cgcgagcgag cgagcgagcg agcgcgcgag 8400 cgagcaaggc ttgctgcgag cgatcgagcg agcgagcggg aaggatgagc gcgacccgcg 8460 cggcgacgag gacagcggcg gcgctgtcct cggcgctgac gacgcctgta aagcagcagc 8520 agcagcagca gctgcgcgta ggcgcggcgt cggcacggct ggcggccgcg gcgttctcgt 8580 ccggcacggg cggagacgcg gccaagaagg cggccgcggc gagggcgttc tccacgggac 8640 gcggccccaa cgcgacacgc gagaagagct cgctggccac ggtccaggcg gcgacggacg 8700 atgcgcgctt cgtcggcctg accggcgccc aaatctttca tgagctcatg cgcgagcacc 8760 aggtggacac catctttggc taccctggcg gcgccattct gcccgttttt gatgccattt 8820 ttgagagtga cgcgcttcaa gttcattctc gctcgccacg agcagggcgc cggccacatg 8880 gccgagggct acgcgcgcgc cacgggcaag cccggcgttg tcctcgtcac ctcgggccct 8940 ggagccacca acaccatcac cccgatcatg gatgcttaca tggacggtac gccgctgctc 9000 gtgttcaccg gccaggtgca gacctctgct gtcggcacgg acgctttcca ggagtgtgac 9060 attgttggca tcagccgcgc gtgcaccaag tggaacgtca tggtcaagga cgtgaaggag 9120 ctcccgcgcc gcatcaatga ggcctttgag attgccatga gcggccgccc gggtcccgtg 9180 ctcgtcgatc ttcctaagga tgtgaccgcc gttgagctca aggaaatgcc cgacagctcc 9240 ccccaggttg ctgtgcgcca gaagcaaaag gtcgagcttt tccacaagga gcgcattggc 9300 gctcctggca cggccgactt caagctcatt gccgagatga tcaaccgtgc ggagcgaccc 9360 gtcatctatg ctggccaggg tgtcatgcag agcccgttga atggcccggc tgtgctcaag 9420 gagttcgcgg agaaggccaa cattcccgtg accaccacca tgcagggtct cggcggcttt 9480 gacgagcgta gtcccctctc cctcaagatg ctcggcatgc acggctctgc ctacgccaac 9540 tactcgatgc agaacgccga tcttatcctg gcgctcggtg cccgctttga tgatcgtgtg 9600 acgggccgcg ttgacgcctt tgctccggag gctcgccgtg ccgagcgcga gggccgcggt 9660 ggcatcgttc actttgagat ttcccccaag aacctccaca aggtcgtcca gcccaccgtc 9720 gcggtcctcg gcgacgtggt cgagaacctc gccaacgtca cgccccacgt gcagcgccag 9780 gagcgcgagc cgtggtttgc gcagatcgcc gattggaagg agaagcaccc ttttctgctc 9840 gagtctgttg attcggacga caaggttctc aagccgcagc aggtcctcac ggagcttaac 9900 aagcagattc tcgagattca ggagaaggac gccgaccagg aggtctacat caccacgggc 9960 gtcggaagcc accagatgca ggcagcgcag ttccttacct ggaccaagcc gcgccagtgg 10020 atctcctcgg gtggcgccgg cactatgggc tacggccttc cctcggccat tggcgccaag 10080 attgccaagc ccgatgctat tgttattgac atcgatggtg atgcttctta ttcgatgacc 10140 ggtatggaat tgatcacagc agccgaattc aaggttggcg tgaagattct tcttttgcag 10200 aacaactttc agggcatggt caagaacgtt caggatctct tttacgacaa gcgctactcg 10260 ggccaccgcc atgttcaacc cgcgcttcga caaggtcgcc gatgcgatgc gtgccaaggg 10320 tctctactgc gcgaaacagt cggagctcaa ggacaagatc aaggagtttc tcgagtacga 10380 tgagggtccc gtcctcctcg aggttttcgt ggacaaggac acgctcgtct tgcccatggt 10440 ccccgctggc tttccgctcc acgagatggt cctcgagcct cctaagccca aggacgccta 10500 agttcttttt tccatggcgg gcgagcgagc gagcgcgcga gcgcgcaagt gcgcaagcgc 10560 cttgccttgc tttgcttcgc ttcgctttgc tttgcttcac acaacctaag tatgaattca 10620 agttttcttg cttgtcggcg atgcctgcct gccaaccagc cagccatccg gccggccgtc 10680 cttgacgcct tcgcttccgg cgcggccatc gattcaattc acccatccga tacgttccgc 10740 cccctcacgt ccgtctgcgc acgacccctg cacgaccacg ccaaggccaa cgcgccgctc 10800 agctcagctt gtcgacgagt cgcacgtcac atatctcaga tgcatttgga ctgtgagtgt 10860 tattatgcca ctagcacgca acgatcttcg gggtcctcgc tcattgcatc cgttcgggcc 10920 ctgcaggcgt ggacgcgagt cgccgccgag acgctgcagc aggccgctcc gacgcgaggg 10980 ctcgagctcg ccgcgcccgc gcgatgtctg cctggcgccg actgatctct ggagcgcaag 11040 gaagacacgg cgacgcgagg aggaccgaag agagacgctg gggtatgcag gatatacccg 11100 gggcgggaca ttcgttccgc atacactccc ccattcgagc ttgctcgtcc ttggcagagc 11160 cgagcgcgaa cggttccgaa cgcggcaagg attttggctc tggtgggtgg actccgatcg 11220 aggcgcaggt tctccgcagg ttctcgcagg ccggcagtgg tcgttagaaa tagggagtgc 11280 cggagtcttg acgcgcctta gctcactctc cgcccacgcg cgcatcgccg ccatgccgcc 11340 gtcccgtctg tcgctgcgct ggccgcgacc ggctgcgcca gagtacgaca gtgggacaga 11400 gctcgaggcg acgcgaatcg ctcgggttgt aagggtttca agggtcgggc gtcgtcgcgt 11460 gccaaagtga aaatagtagg gggggggggg ggtac 11495 <210> 59 <211> 32 <212> PRT <213> Schizochytrium <400> 59 Met Arg Thr Val Arg Gly Pro Gln Thr Ala Ala Leu Ala Ala Leu Leu 1 5 10 15 Ala Leu Ala Ala Thr His Val Ala Val Ser Pro Phe Thr Lys Val Glu 20 25 30 <210> 60 <211> 96 <212> DNA <213> Schizochytrium <400> 60 atgcgcacgg tgagggggcc gcaaacggcg gcactcgccg cccttctggc acttgccgcg 60 acgcacgtgg ctgtgagccc gttcaccaag gtggag 96 <210> 61 <211> 30 <212> PRT <213> Schizochytrium <400> 61 Met Gly Arg Leu Ala Lys Ser Leu Val Leu Leu Thr Ala Val Leu Ala 1 5 10 15 Val Ile Gly Gly Val Arg Ala Glu Glu Asp Lys Ser Glu Ala 20 25 30 <210> 62 <211> 90 <212> DNA <213> Schizochytrium <400> 62 atgggccgcc tcgcgaagtc gcttgtgctg ctgacggccg tgctggccgt gatcggaggc 60 gtccgcgccg aagaggacaa gtccgaggcc 90 <210> 63 <211> 38 <212> PRT <213> Schizochytrium <400> 63 Met Thr Ser Thr Ala Arg Ala Leu Ala Leu Val Arg Ala Leu Val Leu 1 5 10 15 Ala Leu Ala Val Leu Ala Leu Leu Ala Ser Gln Ser Val Ala Val Asp 20 25 30 Arg Lys Lys Phe Arg Thr 35 <210> 64 <211> 114 <212> DNA <213> Schizochytrium <400> 64 atgacgtcaa cggcgcgcgc gctcgcgctc gtgcgtgctt tggtgctcgc tctggctgtc 60 ttggcgctgc tagcgagcca aagcgtggcc gtggaccgca aaaagttcag gacc 114 <210> 65 <211> 34 <212> PRT <213> Schizochytrium <400> 65 Met Leu Arg Leu Lys Pro Leu Leu Leu Leu Phe Leu Cys Ser Leu Ile 1 5 10 15 Ala Ser Pro Val Val Ala Trp Ala Arg Gly Gly Glu Gly Pro Ser Thr 20 25 30 Ser Glu <210> 66 <211> 102 <212> DNA <213> Schizochytrium <400> 66 atgttgcggc tcaagccact tttactcctc ttcctctgct cgttgattgc ttcgcctgtg 60 gttgcctggg caagaggagg agaagggccg tccacgagcg aa 102 <210> 67 <211> 29 <212> PRT <213> Schizochytrium <400> 67 Met Ala Lys Ile Leu Arg Ser Leu Leu Leu Ala Ala Val Leu Val Val 1 5 10 15 Thr Pro Gln Ser Leu Arg Ala His Ser Thr Arg Asp Ala 20 25 <210> 68 <211> 87 <212> DNA <213> Schizochytrium <400> 68 atggccaaga tcttgcgcag tttgctcctg gcggccgtgc tcgtggtgac tcctcaatca 60 ctgcgtgctc attcgacgcg ggacgca 87 <210> 69 <211> 36 <212> PRT <213> Schizochytrium <400> 69 Met Val Phe Arg Arg Val Pro Trp His Gly Ala Ala Thr Leu Ala Ala 1 5 10 15 Leu Val Val Ala Cys Ala Thr Cys Leu Gly Leu Gly Leu Asp Ser Glu 20 25 30 Glu Ala Thr Tyr 35 <210> 70 <211> 108 <212> DNA <213> Schizochytrium <400> 70 atggtgtttc ggcgcgtgcc atggcacggc gcggcgacgc tggcggcctt ggtcgtggcc 60 tgcgcgacgt gtttaggcct gggactggac tcggaggagg ccacgtac 108 <210> 71 <211> 30 <212> PRT <213> Schizochytrium <400> 71 Met Thr Ala Asn Ser Val Lys Ile Ser Ile Val Ala Val Leu Val Ala 1 5 10 15 Ala Leu Ala Trp Glu Thr Cys Ala Lys Ala Asn Tyr Gln Trp 20 25 30 <210> 72 <211> 90 <212> DNA <213> Schizochytrium <400> 72 atgacagcta actcggtgaa aataagcatc gtggctgtgc tggtcgcggc actggcttgg 60 gaaacatgcg caaaagctaa ctatcagtgg 90 <210> 73 <211> 35 <212> PRT <213> Schizochytrium <400> 73 Met Ala Arg Arg Ala Ser Arg Leu Gly Ala Ala Val Val Val Val Leu 1 5 10 15 Val Val Val Ala Ser Ala Cys Cys Trp Gln Ala Ala Ala Asp Val Val 20 25 30 Asp Ala Gln 35 <210> 74 <211> 105 <212> DNA <213> Schizochytrium <400> 74 atggcgcgca gggcgtcgcg cctcggcgcc gccgtcgtcg tcgtcctcgt cgtcgtcgcc 60 tccgcctgct gctggcaagc cgctgcggac gtcgtggacg cgcag 105 <210> 75 <211> 1785 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized nucleic acid sequence <400> 75 atgaagttcg cgacctcggt cgcaattttg cttgtggcca acatagccac cgccctcgcg 60 gcctccccct cgatgcagac ccgtgcctcc gtcgtcattg attacaacgt cgctcctcct 120 aacctctcca ccctcccgaa cggcagcctc tttgagacct ggcgtcctcg cgcccacgtt 180 cttcccccta acggtcagat tggcgatccc tgcctccact acaccgatcc ctcgactggc 240 ctctttcacg tcggctttct ccacgatggc tccggcattt cctccgccac tactgacgac 300 ctcgctacct acaaggatct caaccagggc aaccaggtca tcgtccccgg cggtatcaac 360 gaccctgtcg ctgttttcga cggctccgtc attccttccg gcattaacgg cctccctacc 420 ctcctctaca cctccgtcag ctacctcccc attcactggt ccatccccta cacccgcggt 480 tccgagacgc agagcctggc tgtctccagc gatggtggct ccaactttac taagctcgac 540 cagggccccg ttattcctgg cccccccttt gcctacaacg tcaccgcctt ccgcgacccc 600 tacgtctttc agaaccccac cctcgactcc ctcctccact ccaagaacaa cacctggtac 660 accgtcattt cgggtggcct ccacggcaag ggccccgccc agtttcttta ccgtcagtac 720 gaccccgact ttcagtactg ggagttcctc ggccagtggt ggcacgagcc taccaactcc 780 acctggggca acggcacctg ggccggccgc tgggccttca acttcgagac cggcaacgtc 840 ttttcgcttg acgagtacgg ctacaacccc cacggccaga tcttctccac cattggcacc 900 gagggctccg accagcccgt tgtcccccag ctcacctcca tccacgatat gctttgggtc 960 tccggtaacg tttcgcgcaa cggatcggtt tccttcactc ccaacatggc cggcttcctc 1020 gactggggtt tctcgtccta cgccgccgcg ggtaaggttc ttccttccac gtcgctcccc 1080 tccaccaagt ccggtgcccc cgatcgcttc atttcgtacg tttggctctc cggcgacctc 1140 tttgagcagg ctgagggctt tcctaccaac cagcagaact ggaccggcac cctcctcctc 1200 ccccgtgagc tccgcgtcct ttacatcccc aacgtggttg ataacgccct tgcgcgcgag 1260 tccggcgctt cctggcaggt cgtctcctcc gatagctcgg ccggtactgt ggagctccag 1320 accctcggca tttccatcgc ccgcgagacc aaggccgccc tcctgtccgg cacctcgttc 1380 actgagtccg accgcactct taactcctcc ggcgtcgttc cctttaagcg ttccccctcc 1440 gagaagtttt tcgtcctctc cgcccagctc tccttccccg cctccgcccg cggctcgggc 1500 ctcaagtccg gcttccagat tctttcctcc gagctcgagt ccaccacggt ctactaccag 1560 tttagcaacg agtccatcat cgtcgaccgc agcaacacca gcgccgccgc ccgtactacc 1620 gacggtatcg actcctccgc cgaggccggc aagctccgcc tctttgacgt cctcaacggc 1680 ggcgagcagg ctattgagac cctcgacctt accctcgtcg ttgataactc cgtgctcgag 1740 atttacgcca acggtcgttt cgcgctttcc acctgggttc gctaa 1785

Claims (21)

  1. (a) 서열번호 43의 폴리뉴클레오티드 서열과 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열; 또는
    (b) 상기 (a)의 폴리뉴클레오티드 서열에 완전히 상보적인 폴리뉴클레오티드 서열
    을 포함하는, 재조합 핵산 분자.
  2. 제1항에 있어서,
    폴리뉴클레오티드 서열이 서열번호 43의 폴리뉴클레오티드 서열과 적어도 90% 서열 동일성을 갖는, 재조합 핵산 분자.
  3. 제1항에 있어서,
    폴리뉴클레오티드 서열이 서열번호 43인, 재조합 핵산 분자.
  4. 제1항에 있어서,
    % 서열 동일성이 서열번호 43의 적어도 10개의 뉴클레오티드의 서열에 걸쳐 발견될 수 있는, 재조합 핵산 분자.
  5. 제1항에 있어서,
    % 서열 동일성이 서열번호 43의 적어도 20개의 뉴클레오티드의 서열에 걸쳐 발견될 수 있는, 재조합 핵산 분자.
  6. 제1항에 있어서,
    % 서열 동일성이 서열번호 43의 적어도 50개의 뉴클레오티드의 서열에 걸쳐 발견될 수 있는, 재조합 핵산 분자.
  7. 제1항에 있어서,
    % 서열 동일성이 서열번호 43의 적어도 100개의 뉴클레오티드의 서열에 걸쳐 발견될 수 있는, 재조합 핵산 분자.
  8. 제1항에 있어서,
    % 서열 동일성이 서열번호 43의 적어도 300개의 뉴클레오티드의 서열에 걸쳐 발견될 수 있는, 재조합 핵산 분자.
  9. 제1항에 있어서,
    % 서열 동일성이 서열번호 43의 전장(entire length)에 걸쳐 발견될 수 있는, 재조합 핵산 분자.
  10. 제1항에 있어서,
    벡터인 재조합 핵산 분자.
  11. 제1항에 있어서,
    단백질을 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되는 재조합 핵산 분자.
  12. 제11항에 있어서,
    단백질이 분비 신호에 작동적으로 연결되는, 재조합 핵산 분자.
  13. 제1항에 따른 재조합 핵산 분자를 포함하는 숙주 세포.
  14. 제13항에 있어서,
    트라우스토키트리알레스(Thraustochytriales) 목의 구성원인 숙주 세포.
  15. 제14항에 있어서,
    쉬조키트리움(Schizochytrium) 또는 트라우스토키트리움(Thraustochytrium)인 숙주 세포.
  16. (a) 트라우스토키트리알레스 목의 재조합체 미생물을 배지에서 배양하는 단계로서, 상기 재조합체 미생물이 제11항 또는 제12항에 따른 재조합 핵산 분자를 포함하는, 단계;
    (b) 단계 (a)에서 수득된 단백질을 생산하는 단계; 및
    (c) 단계 (b)에서 생산된 단백질을 분리하는 단계
    를 포함하는, 제1항에 기재된 폴리뉴클레오티드에 작동적으로 연결되는 폴리뉴클레오티드에 의해 코딩되는 단백질의 생산 방법.
  17. 제16항에 있어서,
    단백질이 분리된 트라우스토키트리알레스 바이오매스로부터 회수되는, 생산 방법.
  18. 제16항에 있어서,
    단백질이 미생물 속에 축적되는, 생산 방법.
  19. 제16항에 있어서,
    단백질이 미생물 막 속에 축적되는, 생산 방법.
  20. 제16항에 있어서,
    단백질이 배양 배지로부터 회수되는, 생산 방법.
  21. 제16항에 있어서,
    단백질이 분비되는, 생산 방법.
KR1020177027988A 2009-03-16 2010-03-15 라비린툴로바이코타문 미생물에서의 단백질 생산 KR101939014B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16061809P 2009-03-16 2009-03-16
US61/160,618 2009-03-16
US29044109P 2009-12-28 2009-12-28
US61/290,441 2009-12-28
PCT/US2010/027352 WO2010107709A1 (en) 2009-03-16 2010-03-15 Protein production in microorganisms of the phylum labyrinthulomycota

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020117024332A Division KR101786121B1 (ko) 2009-03-16 2010-03-15 라비린툴로바이코타문 미생물에서의 단백질 생산

Publications (2)

Publication Number Publication Date
KR20170117224A true KR20170117224A (ko) 2017-10-20
KR101939014B1 KR101939014B1 (ko) 2019-01-15

Family

ID=42731038

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020117024332A KR101786121B1 (ko) 2009-03-16 2010-03-15 라비린툴로바이코타문 미생물에서의 단백질 생산
KR1020177027988A KR101939014B1 (ko) 2009-03-16 2010-03-15 라비린툴로바이코타문 미생물에서의 단백질 생산

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020117024332A KR101786121B1 (ko) 2009-03-16 2010-03-15 라비린툴로바이코타문 미생물에서의 단백질 생산

Country Status (11)

Country Link
US (5) US8637651B2 (ko)
EP (2) EP3202906B1 (ko)
JP (3) JP2012520676A (ko)
KR (2) KR101786121B1 (ko)
CN (2) CN102648207A (ko)
AR (1) AR075860A1 (ko)
AU (2) AU2010225930B2 (ko)
CA (2) CA2755667C (ko)
ES (2) ES2627758T3 (ko)
TW (2) TWI504749B (ko)
WO (1) WO2010107709A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2519642B1 (en) 2009-12-28 2017-10-25 DSM IP Assets B.V. Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof
JP5838473B2 (ja) * 2009-12-28 2016-01-06 サノフィ ワクチン テクノロジーズ エス.エー.エス. 微細藻類におけるヘマグルチニン−ノイラミニダーゼタンパク質の産生方法
US20110189228A1 (en) 2009-12-28 2011-08-04 Bayne Anne-Cecile V Production of Heterologous Polypeptides in Microalgae, Microalgal Extracellular Bodies, Compositions, and Methods of Making and Uses Thereof
CN103068965A (zh) 2009-12-28 2013-04-24 Dsmip资产公司 在蔗糖上生长的重组破囊壶菌和其组合物、制备方法及用途
BR112012023852B1 (pt) 2010-03-12 2020-11-10 Biolex Therapeutics vacinas recombinantes do vírus da língua azul e usos das mesmas
AU2014274812B2 (en) 2013-06-05 2018-09-27 Bausch Health Ireland Limited Ultra-pure agonists of guanylate cyclase C, method of making and using same
US11213048B2 (en) 2014-07-25 2022-01-04 Smallfood, Inc. Protein rich food ingredient from biomass and methods of preparation
US20220000141A1 (en) * 2014-07-25 2022-01-06 Smallfood Inc. Protein rich food ingredient from biomass and methods of production
US11122817B2 (en) * 2014-07-25 2021-09-21 Smallfood Inc. Protein rich food ingredient from biomass and methods of production
AU2016226418B2 (en) * 2015-03-02 2022-05-26 Synthetic Genomics, Inc. Regulatory elements from labyrinthulomycetes microorganisms
EP3430035A4 (en) * 2016-03-16 2020-02-19 Conagen Inc. PRODUCTION OF PROTEINS IN LABYRINE THULOMYCETES
WO2017194683A1 (en) 2016-05-12 2017-11-16 Dsm Ip Assets B.V. Method of increasing omega-3 polyunsaturated fatty acids production in microalgae
KR102319845B1 (ko) 2016-07-13 2021-11-01 디에스엠 아이피 어셋츠 비.브이. 조류 숙주 세포에 대한 crispr-cas 시스템
US10633454B2 (en) 2016-11-01 2020-04-28 Conagen Inc. Expression of modified glycoproteins and glycopeptides
CN109923206A (zh) * 2016-11-01 2019-06-21 合成基因组股份有限公司 修饰的糖蛋白和糖肽的表达
EP3762485A4 (en) * 2018-03-05 2021-12-08 Conagen Inc. ORGANISMS AND PROCESSES FOR THE PRODUCTION OF LOW SULPHATION GLYCOMOLECULES
WO2019213095A1 (en) * 2018-05-01 2019-11-07 Conagen Inc. Recombinant organisms and methods for producing glycomolecules with high glycan occupancy
CN109777815B (zh) * 2019-03-28 2021-10-29 昆明理工大学 HMG-CoA合成酶基因RKHMGCS及其应用
WO2022232213A1 (en) * 2021-04-28 2022-11-03 Conagen Inc. Methods of producing sars-cov-2 spike protein
WO2023144707A1 (en) 2022-01-25 2023-08-03 Dsm Ip Assets B.V. Media refinement and nutrient feeding approaches to increase polyunsaturated fatty acid production

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
LU35839A1 (ko)
BE545283A (ko)
US3223456A (en) 1963-11-14 1965-12-14 Siemens Ag Conveying apparatus for fine-granular material
US4381897A (en) 1980-10-06 1983-05-03 Krupp Polysius Ag Installation for transporting fine-grained material
US4626505A (en) 1984-02-24 1986-12-02 E. I. Du Pont De Nemours And Company Selectable markers for yeast transformation
US5605011A (en) 1986-08-26 1997-02-25 E. I. Du Pont De Nemours And Company Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
IL83348A (en) 1986-08-26 1995-12-08 Du Pont Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
GB8716899D0 (en) * 1987-07-17 1987-08-26 Unilever Plc Detergent compositions
US5340742A (en) 1988-09-07 1994-08-23 Omegatech Inc. Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids
US5130242A (en) 1988-09-07 1992-07-14 Phycotech, Inc. Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids
US5426040A (en) 1989-08-17 1995-06-20 Northeastern University Methods for producing improved strains of seaweed by fusion of spore-protoplasts, and resultant seaweeds and phycocolloids
IL100908A0 (en) 1991-02-22 1992-11-15 Salk Inst Biotech Ind Invertase genes and their use
US5804408A (en) 1991-03-13 1998-09-08 Yoshihide Hagiwara Expression of human SOD in blue green algae
US5661017A (en) 1993-09-14 1997-08-26 Dunahay; Terri Goodman Method to transform algae, materials therefor, and products produced thereby
US5853973A (en) 1995-04-20 1998-12-29 American Cyanamid Company Structure based designed herbicide resistant products
DE19529475A1 (de) 1995-08-11 1997-02-13 Marcus Weis Siebkonstruktion zum Abtrennen des Faseranteils aus der Shredderleichtfraktion
WO1997020854A1 (en) 1995-12-05 1997-06-12 University Of Massachusetts Recombinant gas vesicles and uses thereof
US6027900A (en) 1996-04-12 2000-02-22 Carnegie Institution Of Washington Methods and tools for transformation of eukaryotic algae
CN1190673A (zh) 1996-04-29 1998-08-19 中国科学院微生物研究所 丝状真菌中独立复制的表达载体及表达系统
CN1155715C (zh) 1997-02-20 2004-06-30 植物遗传系统有限公司 植物转化的改良方法
ES2125195B1 (es) 1997-04-18 1999-10-01 Antibioticos Sa Procedimiento de inactivacion de genes que codifican para enzimas del catabolismo del fenilacetato, plasmidos que intervienen y cepas transformadas con los mismos.
US7211418B2 (en) 1999-01-14 2007-05-01 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US8003772B2 (en) 1999-01-14 2011-08-23 Martek Biosciences Corporation Chimeric PUFA polyketide synthase systems and uses thereof
US7217856B2 (en) 1999-01-14 2007-05-15 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US7247461B2 (en) 1999-01-14 2007-07-24 Martek Biosciences Corporation Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof
FR2791699B1 (fr) 1999-03-29 2004-10-29 Meristem Therapeutics Promoteurs chimeriques d'expression, cassettes d'expression, vecteurs, plantes et semences transgeniques les contenant, et methodes de leur obtention
KR20000075076A (ko) 1999-05-28 2000-12-15 최태진 형질전환된 미세조류를 이용하여 외래 단백질을 생산하는 방법
US7625756B2 (en) 2000-06-28 2009-12-01 GycoFi, Inc. Expression of class 2 mannosidase and class III mannosidase in lower eukaryotic cells
ES2330330T3 (es) 2000-06-28 2009-12-09 Glycofi, Inc. Procedimiento de produccion de glucoproteinas modificadas.
US7795002B2 (en) 2000-06-28 2010-09-14 Glycofi, Inc. Production of galactosylated glycoproteins in lower eukaryotes
US20060257399A1 (en) 2000-06-28 2006-11-16 Glycofi, Inc. Immunoglobulins comprising predominantly a Man5GIcNAc2 glycoform
US20060029604A1 (en) 2000-06-28 2006-02-09 Gerngross Tillman U Immunoglobulins comprising predominantly a GlcNAc2Man3GlcNAc2 glycoform
ES2343106T3 (es) 2000-09-28 2010-07-23 BIORIGINAL FOOD &amp; SCIENCE CORP. Fad4, fad5, fad5-2 y fad6, miembros de la familia de desaturasas de acidos grasos y usos de los mismos.
US6419425B1 (en) 2001-02-28 2002-07-16 Neu Transf'air Granular material distributing apparatus comprising at least two transfer vessels that operate in alternation
TWI377253B (en) * 2001-04-16 2012-11-21 Martek Biosciences Corp Product and process for transformation of thraustochytriales microorganisms
US7332299B2 (en) 2003-02-20 2008-02-19 Glycofi, Inc. Endomannosidases in the modification of glycoproteins in eukaryotes
EP1623008B1 (en) * 2003-03-26 2014-07-30 DSM IP Assets B.V. Pufa polyketide synthase systems and uses thereof
ES2311857T3 (es) 2003-06-05 2009-02-16 Wyeth Holdings Corporation Composiciones inmunogenas que comprenden vectores de replicon del virus de la encefalitis equina venezolana y antigenos de proteina de paramixovirus.
JP4796786B2 (ja) * 2005-04-28 2011-10-19 富士フイルム株式会社 ラビリンチュラ類を形質転換可能なベクター
JP4796787B2 (ja) 2005-04-28 2011-10-19 富士フイルム株式会社 ラビリンチュラ類への遺伝子導入法
PT103331A (pt) 2005-08-05 2007-02-28 Fundacao Da Faculdade De Cienc Expressão dum transportador activo de xilose em saccharomyces cerevisiae modificada geneticamente
AU2007226510B2 (en) 2006-03-15 2013-09-19 Dsm Ip Assets B.V. Polyunsaturated fatty acid production in heterologous organisms using pufa polyketide synthase systems
US8477593B2 (en) 2006-07-28 2013-07-02 Qualcomm Incorporated Method and apparatus for sending signaling for data transmission in a wireless communication system
MX2009001346A (es) 2006-08-01 2009-04-17 Ocean Nutrition Canada Ltd Microbios productores de aceite y metodos de modificacion de los mismos.
CA2615372A1 (en) 2007-07-13 2009-01-13 Marc-Andre D'aoust Influenza virus-like particles (vlps) comprising hemagglutinin
AU2008300002B2 (en) 2007-09-12 2014-04-10 Dsm Ip Assets B.V. Biological oils and production and uses thereof
EP2090648A1 (en) 2008-02-12 2009-08-19 Institut Francais de Recherche pour l'Exploitation de la Mere(Ifremer) Production of glycosylated polypeptides in microalgae
WO2009126843A2 (en) 2008-04-09 2009-10-15 Solazyme, Inc. Direct chemical modification of microbial biomass and microbial oils
CN103068965A (zh) 2009-12-28 2013-04-24 Dsmip资产公司 在蔗糖上生长的重组破囊壶菌和其组合物、制备方法及用途
JP5838473B2 (ja) 2009-12-28 2016-01-06 サノフィ ワクチン テクノロジーズ エス.エー.エス. 微細藻類におけるヘマグルチニン−ノイラミニダーゼタンパク質の産生方法
US20110189228A1 (en) 2009-12-28 2011-08-04 Bayne Anne-Cecile V Production of Heterologous Polypeptides in Microalgae, Microalgal Extracellular Bodies, Compositions, and Methods of Making and Uses Thereof
EP2519642B1 (en) 2009-12-28 2017-10-25 DSM IP Assets B.V. Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof

Also Published As

Publication number Publication date
EP3202906B1 (en) 2019-09-25
EP2408795A4 (en) 2013-09-18
CA2755667C (en) 2018-06-12
US20100233760A1 (en) 2010-09-16
CN104263729A (zh) 2015-01-07
CA3003188C (en) 2020-04-14
JP2016208993A (ja) 2016-12-15
KR20110128931A (ko) 2011-11-30
ES2752196T3 (es) 2020-04-03
KR101939014B1 (ko) 2019-01-15
EP2408795A1 (en) 2012-01-25
WO2010107709A1 (en) 2010-09-23
TW201546088A (zh) 2015-12-16
KR101786121B1 (ko) 2017-10-16
JP2015077140A (ja) 2015-04-23
JP6369952B2 (ja) 2018-08-08
JP6012698B2 (ja) 2016-10-25
EP3202906A1 (en) 2017-08-09
CA3003188A1 (en) 2010-09-23
US20170145461A1 (en) 2017-05-25
TW201040276A (en) 2010-11-16
TWI548648B (zh) 2016-09-11
AR075860A1 (es) 2011-05-04
US20190211369A1 (en) 2019-07-11
US9012616B2 (en) 2015-04-21
JP2012520676A (ja) 2012-09-10
CA2755667A1 (en) 2010-09-23
US9518102B2 (en) 2016-12-13
TWI504749B (zh) 2015-10-21
EP2408795B1 (en) 2017-04-19
US8637651B2 (en) 2014-01-28
AU2017202378A1 (en) 2017-05-18
US20150132803A1 (en) 2015-05-14
CN104263729B (zh) 2020-09-15
US20140106402A1 (en) 2014-04-17
US10829794B2 (en) 2020-11-10
AU2010225930A1 (en) 2011-11-03
AU2017202378B2 (en) 2019-02-14
ES2627758T3 (es) 2017-07-31
AU2010225930B2 (en) 2017-01-12
CN102648207A (zh) 2012-08-22

Similar Documents

Publication Publication Date Title
KR101939014B1 (ko) 라비린툴로바이코타문 미생물에서의 단백질 생산
AU2019206054B2 (en) Production of heterologous polypeptides in microalgae, microalgal extracellular bodies, compositions, and methods of making and uses thereof
CN101720332B (zh) 生产促卵泡激素的细胞克隆
CN109486803A (zh) 工程化苯丙氨酸解氨酶多肽
KR20120034652A (ko) 유전적으로 변형된 미생물을 발생시키는 방법
CN114702597B (zh) 表达植物抗菌肽Ct-AMP1的工程菌构建与应用
US20120094338A1 (en) Continuous production and excretion of waxy products from photosynthetic organisms
RU2710731C1 (ru) Система редактирования генома дрожжей debaryomyces hansenii на основе crispr/cas9
US20010010928A1 (en) Protozoan expression system
CN114736308B (zh) 球虫抗原肽/il5的融合蛋白基因工程菌的制备及用途
CN114853901B (zh) 表达抗菌肽afp1融合蛋白的工程菌构建与应用
KR102335519B1 (ko) 인체 감염 사스코로나 바이러스 예방 및 감염 증상 완화용 백신 조성물
KR100721140B1 (ko) 류코노스톡과 대장균에서 상호복제가 가능한 셔틀벡터
CN111100841B (zh) 抗肥胖药物靶点ucp1的基因工程细胞株和高通量药物筛选模型的建立及应用
CN106795504A (zh) 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸
CN114703207B (zh) 重组质粒的制备方法和重组病毒
CN113846116B (zh) 一种提高酿酒酵母中花青素合成效率的方法
CN114317536B (zh) 基于CRISPR/Cas9构建uPA转基因小鼠的制备方法
CN114231566B (zh) 一种R26-e(CN362-1)载体及其制备方法
CN114181939B (zh) 一种表达na4蛋白和荧光标签的重组球虫载体及其检测方法
CN108588100B (zh) 一种抑制素b双基因片段联合表达载体及其应用
KR101876486B1 (ko) Myh4 유전자를 포함하는 재조합 벡터 및 이의 이용
CN112852651A (zh) 一种提高酿酒酵母生物转化生产氢化可的松产量的方法
CN112553255A (zh) 一种表达传染性法氏囊病毒vp2抗原的重组病毒及制备与应用
CN102002513A (zh) 一种高效介导dc基因转移的重组腺病毒

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant