KR101426667B1 - 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 - Google Patents
비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 Download PDFInfo
- Publication number
- KR101426667B1 KR101426667B1 KR1020137020324A KR20137020324A KR101426667B1 KR 101426667 B1 KR101426667 B1 KR 101426667B1 KR 1020137020324 A KR1020137020324 A KR 1020137020324A KR 20137020324 A KR20137020324 A KR 20137020324A KR 101426667 B1 KR101426667 B1 KR 101426667B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- pro
- arg
- asp
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8245—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8245—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
- C12N15/8246—Non-starch polysaccharides, e.g. cellulose, fructans, levans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/005—Glycopeptides, glycoproteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Nutrition Science (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- Botany (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 야생형 또는 변형된 형태로 사용될 수 있는 비-포유동물 β-1,4-갈락토실트랜스퍼라제에 관한 것이다. 본 발명은 또한 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하는 형질전환된 식물 및 식물 세포, 및 변경된 및 바람직하게는 포유동물형 글리코실화를 갖는 당단백질을 생산하는 방법에 관한 것이다. 본 발명은 추가로 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 핵산 분자 및 발현 벡터를 제공한다.
Description
본 발명은 트랜스제닉 식물에서, 특히 재조합 생물의약용 단백질의 생산을 위해 사용되는 식물에서 당단백질 처리 분야에 관한 것이다.
재조합 단백질 생산은 트랜스제닉 식물의 중요한 용도를 구성한다. 재조합 단백질의 논밭 생산의 수확량과 유리한 비용에 추가로, 트랜스제닉 식물은 다른 생산 시스템, 예를 들어 세균, 효모 및 동물 세포에 비해 특정 잇점을 제공한다. 실제로, 식물에는 인간에 감염성인 물질이 없고, 관심있는 단백질을 저장 조직, 예를 들어 종자 또는 덩이줄기에 축적할 수 있다. 이는 후속적인 추출 가능성을 제공하면서 주변 온도에서 그의 취급, 수송 및 저장을 용이하게 한다. 또한, 트랜스제닉 식물 또는 그의 일부분의 몇몇은 의약 또는 백신의 벡터로서 이용될 수 있다.
단백질성 물질의 공장으로서 식물의 잇점은 대부분 생물의약의 측면에서 설명되지만, 식물은 또한 예를 들어 보다 큰 안정성을 생성시키는 그들의 글리코실화 능력으로 인해 다른 단백질, 예를 들어, 산업용 효소 등의 생산을 위해 유용하다. 오늘날, 치료 및 다른 용도를 위한 이종 당단백질의 생산을 위한 식물의 활용이 대두, 담배, 감자, 벼 및 유채 (rapeseed)에서 조사되었고, 여기서 생산된 당단백질은 모노클로날 항체, 호르몬, 백신 항원, 효소 및 혈액 단백질을 포함한다. 상기 단백질의 일부는 인간에서 그 효능이 이미 입증되었다.
식물에서 당단백질 생산의 단점은 식물에서 생산된 당단백질의 글리코실화 패턴에 관련된다. 다른 이종 발현 시스템과는 달리, 식물은 포유동물에 비해 상이한 글리코실화 프로필을 나타낸다. N-연결된 글리칸을 갖지 않는 세균 및 고 만노스형 (high mannose type)의 N-연결된 글리칸만을 갖는 효모와 대조적으로, 식물은 복합형 (complex type)의 N-연결된 글리칸을 갖는 단백질을 생산할 수 있다. 그러나, 식물 당단백질은 포유동물에서 발견되지 않는 β-1,2-자일로스 및 α-1,3-푸코스 잔기를 함유하는 복합형 N-연결된 글리칸을 갖는다. 또한, 식물 당단백질은 포유동물에서 발견되는 특징적인 갈락토스-함유 복합형 N-글리칸이 결여된다.
짧게 설명하면, 식물로부터의 당단백질의 분석에서는 유사성이 존재하지만 식물 및 포유동물의 글리코실화 경로에서, 특히 복합형 글리칸의 합성에서 몇몇 단계가 상이함을 나타낸다. 식물의 복합형 글리칸은 일반적으로 훨씬 더 작고, Man3(GlcNAc)2 코어에 부착된 베타-1,2 자일로스 또는 알파-1,3 푸코스 잔기를 함유한다. 당단백질 상의 그러한 잔기는 면역원성인 것으로 알려져 있고, 이는 이들 당을 보유하는 재조합 단백질의 특정 용도에 대해 문제를 일으킨다.
도 1은 다양한 포유동물 (인간, 마우스, 소) 및 비-포유동물 (닭, 제브라피시, 개구리) 기원의 β-1,4-갈락토실트랜스퍼라제의 서열 정렬 (Clustal W)을 도시한 것이다. "포유동물 연장부"는 β-1,4-갈락토실트랜스퍼라제의 비-포유동물 동족체 (ortholog)에서 발견되지 않는, 포유동물에 특이적인 아미노-말단 구역이다 (상자표시, 실선). "TM"은 막횡단 구역을 표시한다 (상자표시, 점선).
도 2는 닭 유전자를 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 Maldi-TOF 분석의 결과를 도시한 것이다. 상단으로부터 저변으로, 정상 닭 유전자 (닭 GalT), 13개 아미노산의 N-말단 인간 GalT-닭 GalT, 및 SialT-CTS-닭 GalT.
도 3은 제브라피시 GalT 유전자 서열을 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 Maldi-TOF 분석의 결과를 도시한 것이다. 상단으로부터 저변으로, 정상 제브라피시 유전자 (제브라피시 GalT, 2개의 식물), 13개 아미노산의 N-말단 인간 GalT-제브라피시 GalT, 및 SialT-CTS-제브라피시 GalT.
도 4는 2-안테나형 "야생형" 식물 N-글리칸 (GlcNAc2-Man3-Xyl-Fuc-GlcNAc2-Asn), 하나의 갈락토스를 갖는 (자일로스 및 푸코스가 결여되는) 하이브리드형 N-글리칸, 및 2개의 갈락토스를 갖는 2-안테나형 (상단으로부터 저변으로)에 대하여, 인간, 제브라피시 및 닭 GalT로부터의 결과를 요약하는 막대 그래프를 도시한 것이다.
도 5는 Dgal (SEQ Dgal, 서열 14)와 공개된 추정 제브라피시 β-1,4-GalT1 (Machingo et al, Dev Biol 297, 471-82, 2006; NM_001017730)과의 아미노산 서열 비교를 도시한 것이다.
도 2는 닭 유전자를 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 Maldi-TOF 분석의 결과를 도시한 것이다. 상단으로부터 저변으로, 정상 닭 유전자 (닭 GalT), 13개 아미노산의 N-말단 인간 GalT-닭 GalT, 및 SialT-CTS-닭 GalT.
도 3은 제브라피시 GalT 유전자 서열을 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 Maldi-TOF 분석의 결과를 도시한 것이다. 상단으로부터 저변으로, 정상 제브라피시 유전자 (제브라피시 GalT, 2개의 식물), 13개 아미노산의 N-말단 인간 GalT-제브라피시 GalT, 및 SialT-CTS-제브라피시 GalT.
도 4는 2-안테나형 "야생형" 식물 N-글리칸 (GlcNAc2-Man3-Xyl-Fuc-GlcNAc2-Asn), 하나의 갈락토스를 갖는 (자일로스 및 푸코스가 결여되는) 하이브리드형 N-글리칸, 및 2개의 갈락토스를 갖는 2-안테나형 (상단으로부터 저변으로)에 대하여, 인간, 제브라피시 및 닭 GalT로부터의 결과를 요약하는 막대 그래프를 도시한 것이다.
도 5는 Dgal (SEQ Dgal, 서열 14)와 공개된 추정 제브라피시 β-1,4-GalT1 (Machingo et al, Dev Biol 297, 471-82, 2006; NM_001017730)과의 아미노산 서열 비교를 도시한 것이다.
<발명의 개요>
당단백질의 생산을 위한 일부 식물 기반 시스템이 제안되었거나 사용되고 있지만, 인간화 단백질의 생산을 위한 개선된 식물 기반 시스템이 필요하다. 특정 실시태양에서, 본 발명은 그러한 개선된 식물 기반 시스템을 제공한다.
예를 들어, WO01/31045 (전체 내용이 본원에 포함된다)에 기재된 것과 같은 이전에 제안된 식물 기반 시스템에서는 인간화 단백질의 생산을 위해 포유동물 β-1,4-갈락토실트랜스퍼라제를 사용하였다.
현재, 특성이 결정된 포유동물 β-1,4-갈락토실트랜스퍼라제의 특정한 일부에 상동성을 보이는 비-포유동물, 닭 및 제브라피시 (zebrafish)로부터 유래된 것과 같은 몇몇의 이전에 특성이 결정되지 않은 글리코실트랜스퍼라제가 인간화 단백질의 생산에 있어서 선행 기술 방법에 비해 예기치 않은 개선을 보여주는 것으로 밝혀졌다.
본 발명의 한 측면에 따르면, N-연결된 글리칸에 β-1,4-연결로 갈락토스 잔기를 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법을 제공한다. 상기 방법은 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자를 식물 또는 식물 세포 내로 삽입하고, 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자를 흡수하고 핵산 분자를 발현하는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 선택하여, N-연결된 글리칸에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 것을 포함한다. 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 1을 포함한다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 1은 서열 2를 포함하는 한편, 제브라피시 β-1,4-갈락토실트랜스퍼라제 1은 서열 14를 포함한다. 일부 실시태양에서, 닭 또는 제브라피시의 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 골지체 내에 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 국재화 (localization)를 지시할 수 있는 아미노산 서열로 연장된다. 일부 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 N-말단에서 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 서열로 연장된다. 특정 실시태양에서, N-말단 아미노산 서열은 처음 10개의 N-말단 아미노산 내에 적어도 서열 [K/R]-X-[K/R]을 포함하고, 여기서 [K/R]은 라이신 또는 아르기닌 잔기를 나타내고, X는 임의의 아미노산일 수 있다. 특정 실시태양에서, N-말단 아미노산 서열은 MRLREPLLSGSAA (서열 21)이다. 일부 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 세포질-막횡단-스템 (stem) 구역 (CTS)은 또다른 골지체에 국재화된 (Golgi-localized) 단백질의 CTS로 교체된다. 일부 실시태양에서, CTS는 포유동물 또는 식물의 골지체에 국재화된 단백질로부터 유래된다. 일부 실시태양에서, CTS는 포유동물 시알릴트랜스퍼라제로부터 유래된다. 특정 실시태양에서, CTS는 래트 α-2,6-시알릴트랜스퍼라제로부터 유래된다.
본 발명의 다른 측면에 따르면, 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자 및 이종 당단백질을 코딩하는 핵산 분자를 식물 또는 식물 세포 내로 삽입하여, 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하고, 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 핵산 분자의 발현에 적절한 조건 하에 유지시켜 하나 이상의 갈락토실화된 N-연결된 글리칸을 포함하는 이종 당단백질을 생산하는 것을 포함하는, 하나 이상의 갈락토실화된 N-연결된 글리칸을 포함하는 이종 당단백질을 생산하는 방법을 제공한다.
특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제이다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제는 N-말단에서 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 서열로 연장된다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제의 CTS는 또다른 골지체에 국재화된 단백질의 CTS로 교체된다.
특정 실시태양에서, 방법은 이종 당단백질을 트랜스제닉 식물 또는 트랜스제닉 식물 세포로부터 적어도 부분적으로 단리하는 것을 추가로 포함한다. 특정 실시태양에서, 당단백질은 하나 이상의 N-글리칸 상에 하나 이상의 갈락토스 잔기를 포함한다. 일부 실시태양에서, 당단백질의 N-글리칸에는 본질적으로 자일로스, 푸코스, 또는 자일로스와 푸코스 잔기가 모두 없다. 특정 실시태양에서, 이종 당단백질을 코딩하는 핵산 분자는 호르몬; 사이토킨; 백신; 부착 분자, 또는 항체 또는 그의 기능적 단편을 코딩한다.
특정 실시태양에서, 식물 또는 식물 세포는 식물 또는 식물 세포 내에서 발현가능한 적어도 하나의 선택 마커를 코딩하는 핵산 분자를 추가로 포함한다. 특정 실시태양에서, 식물 또는 식물 세포는 니코티아나 (Nicotiana) 종이거나 그로부터 유래된다. 일부 실시태양에서, 핵산 분자는 미세주사, PEG 형질전환, 아그로박테리움 (Agrobacterium) 매개 형질전환, 전기천공, 탄도 (ballistic) 입자 폭격, 직접 유전자 전달, 리포좀 융합, 식물체내 (in planta) 형질전환, 인산칼슘 침전, 애그로필트레이션 (agrofiltration), 또는 바이러스 감염을 통해 삽입된다.
본 발명의 다른 측면에 따르면, N-연결된 글리칸에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법을 제공하고, 여기서 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)과 적어도 85% 동일한 핵산에 의해 코딩된다. 다른 실시태양에서, 핵산은 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)과 적어도 90%, 95%, 또는 98% 동일하다.
본 발명의 다른 측면에 따르면, N-연결된 글리칸에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법을 제공하고, 여기서 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 85% 동일하다. 다른 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 90%, 95%, 또는 98% 동일하다. 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 아미노산 서열은 포유동물 연장부를 추가로 포함한다. 일부 실시태양에서, 포유동물 연장부는 MRLREPLLSGSAA (서열 21)이다. 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 CTS는 또다른 골지체에 국재화된 단백질로부터의 CTS로 교체되고, 여기서 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 85% 동일하다. 다른 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 90%, 95%, 또는 98% 동일하다. 특정 실시태양에서, 또다른 골지체에 국재화된 단백질로부터의 CTS는 래트 α-2,6-시알릴트랜스퍼라제로부터의 CTS이다.
본 발명의 또다른 측면에 따르면, N-연결된 글리칸에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법을 제공하고, 여기서 식물 또는 식물 세포는 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드 (hybrid)형 N-연결된 글리칸을 포함하는 당단백질을 생산한다. 특정 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸의 생산량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물에 의한 생산량의 2배이다. 다른 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸의 생산량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량의 5배, 10배, 또는 50배이다. 특정 실시태양에서, 식물 또는 식물 세포는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 (bi-antennary) N-글리칸을 포함하는 당단백질을 생산한다. 상기 실시태양에서, 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 생산량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량의 2배, 5배, 10배, 또는 50배이다.
본 발명의 또다른 측면에 따르면, 본원에 기재된 방법에 따라 생산된 당단백질을 제공한다.
본 발명의 다른 측면에 따르면, 본원에 기재된 방법에 따라 생산된 식물, 또는 상기 식물의 일부분을 제공한다. 특정 실시태양에서, 식물은 종자, 배, 유합 (callus) 조직, 잎, 뿌리, 싹, 화분 및 소포자로 이루어지는 군 중에서 선택되는 식물의 일부분이다.
본 발명의 다른 측면에 따르면, 본원에 기재된 방법에 따라 생산된 식물 세포를 제공한다. 특정 실시태양에서, 식물 세포는 현탁 배양으로 성장된다. 특정 실시태양에서, 현탁 배양으로 성장되는 식물 세포는 엔. 타바쿰 (N. tabacum; 담배) BY2, 다우쿠스 카로타 (Daucus carota; 당근) 및 아라비돕시스 탈리아나 (Arabidopsis thaliana; 애기장대) 세포 현탁액으로 이루어지는 군 중에서 선택된다. 특정 실시태양에서, 식물 세포는 브리오피타에아 (Bryophytaea), 피스코미트렐라 파텐스 (Physcomitrella patens), 푸나리아 히그로메트리카 (Funaria hygrometrica; 표주박이끼), 및 케라토돈 푸르푸레우스 (Ceratodon purpureus)로 이루어지는 군 중에서 선택된 이끼의 일부분이다.
본 발명의 다른 측면에 따르면, 닭 β-1,4-갈락토실트랜스퍼라제 1 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 1 (서열 14)의 아미노산 서열 및 그의 N-말단에서의 연장부를 포함하는 폴리펩티드를 코딩하는 핵산을 제공하고, 여기서 연장부는 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 서열이고, 여기서 N-말단 아미노산 서열은 처음 10개의 N-말단 아미노산 내에 적어도 서열 [K/R]-X-[K/R]을 포함하고, 여기서 [K/R]은 라이신 또는 아르기닌 잔기를 나타내고, X는 임의의 아미노산일 수 있다. 특정 실시태양에서, 아미노산 서열은 MRLREPLLSGSAA (서열 21)이다. 특정 실시태양에서, 아미노산 서열은 서열 8 또는 서열 15를 포함한다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 1 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 1 (서열 14)의 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 핵산을 제공하고, 여기서 닭 β-1,4-갈락토실트랜스퍼라제 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제의 CTS는 또다른 골지체에 국재화된 단백질의 CTS로 교체된다. 특정 실시태양에서, CTS는 포유동물 또는 식물의 골지체에 국재화된 단백질로부터 유래된다. 특정 실시태양에서, CTS는 포유동물 시알릴트랜스퍼라제로부터 유래된다. 특정 실시태양에서, CTS는 래트 α-2,6-시알릴트랜스퍼라제로부터 유래된다. 특정 실시태양에서, 아미노산 서열은 서열 11 또는 서열 18을 포함한다.
본 발명의 또다른 측면에 따르면, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 아미노산 서열 (여기서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 1 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 1 (서열 14)의 대응 서열에 적어도 90% 동일함) 및 그의 N-말단에서의 연장부 (여기서, 연장부는 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 서열임)를 포함하는 폴리펩티드를 코딩하는 핵산을 제공하고, 여기서 N-말단 아미노산 서열은 처음 10개의 N-말단 아미노산 내에 적어도 서열 [K/R]-X-[K/R]을 포함하고, 여기서 [K/R]은 라이신 또는 아르기닌 잔기를 나타내고, X는 임의의 아미노산일 수 있다. 다른 실시태양에서, 서열 동일성은 적어도 95% 또는 98%이다.
본 발명의 또다른 측면에 따르면, 본원에 기재된 핵산 분자를 포함하는 발현 벡터를 제공한다. 일부 실시태양에서, 핵산 분자는 진핵 또는 원핵 세포에서 핵산 분자의 전사에 충분한 조절 요소에 연결된다.
본 발명의 다른 측면에 따르면, 식물 세포에서 전사에 충분한 이종 조절 요소에 연결되는 본원에 기재된 핵산 분자를 포함하거나, 본원에 기재된 벡터를 포함하는 숙주 세포를 제공한다.
[발명의 상세한 설명]
골지체 (Golgi apparatus)는 복합형 글리칸 형성이 일어나는 소기관이고, 글리코실화 기구의 부위이다. 글리코실화의 핵심 매개체는 글리코실트랜스퍼라제이다. 가장 잘 연구된 골지-연관된 글리코실트랜스퍼라제 중 하나는 β-1,4-갈락토실트랜스퍼라제 1 (GalT)이다. β-1,4-갈락토실트랜스퍼라제 1은 세포기질 테일 (tail), 막횡단 도메인 (TMD) 및 촉매 도메인으로 이루어진다. 포유동물의 글리코실트랜스퍼라제의 수많은 유전자가 이미 클로닝되었다. 식물 시스템의 형질전환의 용이성으로 인해 연구자들은 식물이 생산하는 당단백질의 글리칸을 "인간화" 또는 "포유동물화"하기 위해 포유동물로부터의 글리코실트랜스퍼라제에 의해 식물의 골지체를 "보완"할 수 있다.
식물에서 포유동물화 또는 인간화 당단백질의 생산을 위한 비-포유동물 β-1,4-갈락토실트랜스퍼라제 (GalT)의 용도는 지금까지 보고되지 않았다.
현재, 닭 및 제브라피시로부터 유래된 것과 같은 몇몇의 이전에 특성이 결정되지 않은 비-포유동물 β-1,4-갈락토실트랜스퍼라제가 식물에서 N-연결된 당단백질의 말단 갈락토실화를 위해 이용될 수 있고, 이들 비-포유동물 β-1,4-갈락토실트랜스퍼라제가 인간화 단백질의 생산에 있어서 선행 기술 방법에 비해 예기치 않은 개선을 보여주는 것으로 밝혀졌다. 예를 들어, 닭 β-1,4-갈락토실트랜스퍼라제는 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸을 주로 생산한다.
닭 및 제브라피시로부터의 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 포유동물 β-1,4-갈락토실트랜스퍼라제보다 더 짧고, 포유동물 β-1,4-갈락토실트랜스퍼라제 내에 존재하는 아미노-말단 구역이 결여되는 것이 추가로 밝혀졌다. 이들 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 아미노-말단에서 포유동물 β-1,4-갈락토실트랜스퍼라제의 아미노-말단에 대응하는 아미노산 서열로 연장될 수 있다 ("포유동물 연장부"). 이들 변형된 버전의 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 특정 N-연결된 글리칸을 인간 β-1,4-갈락토실트랜스퍼라제에 비해 더 높은 정도로 생산한다. 예를 들어, 그의 아미노-말단이 래트 시알릴트랜스퍼라제의 CTS 구역으로 치환된 제브라피시 GalT는 주로 2-안테나형의 이중 갈락토실화된 N-글리칸을 생산한다.
본 발명은 일부 실시태양에서, 식물에서 포유동물화된 당단백질을 생산하기 위해 사용되는 닭 및 물고기로부터의 변형되지 않은 또는 변형된 비-포유동물 GalT를 제공한다. 특정 실시태양에서, 상기 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 또는 식물 세포에서 생산된 포유동물화된 당단백질을 또한 제공한다.
정의
본원에서 사용될 때, 용어 "핵산"은 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체, 즉, 폴리뉴클레오티드 (단일가닥 또는 이중가닥 형태의)에 대한 언급을 포함하고, 달리 제한하지 않으면, 자연 발생 뉴클레오티드 (예를 들어, 펩티드 핵산)와 유사한 방식으로 단일가닥 핵산에 혼성화한다는 점에서 천연 뉴클레오티드의 필수 성질을 갖는 공지의 유사체를 포함한다. 폴리뉴클레오티드는 천연 또는 이종성 구조 또는 조절 유전자의 전장 또는 하위서열일 수 있다. 달리 지시하지 않으면, 상기 용어는 명시된 서열뿐만 아니라 그의 상보성 서열에 대한 언급을 포함한다. 따라서, 안정성 또는 다른 이유로 인해 백본 (backbone)이 변형된 DNA 또는 RNA는 본원에서 의도하는 것과 같은 "폴리뉴클레오티드"이다. 또한, 단지 2개의, 예를 들어 이노신과 같은 이상 (unusual) 염기, 또는 트리틸화 염기와 같은 변형 염기를 포함하는 DNA 또는 RNA는 본원에서 사용되는 것과 같은 폴리뉴클레오티드이다. 당업자에게 공지된 많은 유용한 목적을 만족시키는 매우 다양한 변형이 DNA 및 RNA에 대해 이루어질 수 있음이 이해될 것이다. 용어 폴리뉴클레오티드는 본원에서 사용될 때 그러한 화학적, 효소적 또는 대사적으로 변형된 형태의 폴리뉴클레오티드, 및 특히 단순 및 복합형 세포를 포함하는 세포 및 바이러스의 DNA 및 RNA 특징의 화학적 형태를 포함한다.
본원에서 사용될 때, "~를 코딩하는 핵산 분자" 또는 "~ 코딩 핵산 분자"는 개별적인 또는 별개의 분자, 예를 들어 별개의 엔티티 (entity)로서 핵산 분자에 제한되지 않고 (여기서 각각의 엔티티는 하나의 핵산 분자를 포함한다), 하나 이상의 핵산 분자가 임의의 개재하는 서열에 의해 분리될 수 있는 하나의 연속 서열 내에 연결될 수 있는 것을 포함한다. 하나의 연속 서열 내의 핵산 분자의 순서 및 배향은 임의의 구체적인 입체형상으로 제한되지 않고, 예를 들어 핵산 분자는 동일한 프로모터 또는 상이한 프로모터에 연결될 수 있고, 1방향성 또는 2방향성일 수 있고, 직접 인접하거나 개재하는 서열에 의해 분리될 수 있다. 다양한 그러한 입체형상이 당업계에 공지되어 있다. 추가의 핵산 분자가 하나의 연속 서열 내에 조합될 수 있거나, 별개의 엔티티로서 제공될 수 있다. 예를 들어, 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제, 이종성 당단백질 및 하나 이상의 선택 마커를 포함하는 핵산 분자를 포함하는 식물 또는 식물 세포를 제공한다. 이들 핵산 분자는 본원에 기재된 바와 같이 1, 2, 3개 이상의 벡터 형태로 제공될 수 있다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 본원에서 아미노산 잔기들의 중합체를 나타내도록 상호 교환가능하게 사용된다. 상기 용어는 하나 이상의 아미노산 잔기가 대응하는 자연 발생 아미노산의 인공적인 화학 유사체인 아미노산 중합체뿐만 아니라 자연 발생 아미노산 중합체에도 적용된다. 자연 발생 아미노산의 그러한 유사체의 필수 성질은 단백질 내로 포함될 때, 단백질이 동일하지만 전적으로 자연 발생 아미노산으로 이루어지는 단백질에 대해 유도된 항체에 대해 특이적으로 반응성인 것이다. 용어 "폴리펩티드", "펩티드" 및 "단백질"은 또한 글리코실화, 지질 부착, 황산화, 글루탐산 잔기의 감마-카르복실화, 수산화 및 ADP-리보실화를 포함하지만 이로 제한되지 않는 변형을 포함한다.
"코딩" 또는 "코딩하는" 서열은 단백질의 아미노산 서열, 또는 기능적 RNA, 예를 들어 tRNA 또는 rRNA를 코딩하는 유전자의 일부분이고, 구체적으로 핵산 서열이 명시된 단백질로의 번역을 위한 정보를 포함한다는 사실을 나타낸다. 단백질을 코딩하는 핵산은 핵산의 번역된 구역 내에 비-번역된 서열 (예를 들어, 인트론)을 포함할 수 있거나, 상기 개재하는 비-번역된 서열이 결여될 수 있다 (예를 들어, cDNA에서와 같이). 그에 의해 단백질이 코딩되는 정보는 코돈의 사용에 의해 구체화된다. 전형적으로, 아미노산 서열은 "보편적 (universal)" 유전자 코드를 이용하여 핵산에 의해 코딩된다. 그러나, 핵산이 그 내부에서 발현될 때 일부 식물, 동물 및 진균 미토콘드리아, 세균 미코플라스마 카프리콜럼 (Mycoplasma capricolum), 또는 섬모충 대핵에 존재하는 것과 같은 보편적 코드의 변이체가 사용될 수 있다. 핵산이 합성 방식으로 제조되거나 변경될 때, 핵산을 발현시킬 의도된 숙주의 공지의 코돈 선호도가 이용될 수 있다. 예를 들어, 본 발명의 핵산 서열은 외떡잎 및 쌍떡잎 식물 종 모두에서 발현될 수 있지만, 서열은 선호도가 상이한 것으로 나타났기 때문에 외떡잎 식물 및 쌍떡잎 식물의 특이적 코돈 선호도 및 GC 함량 선호도에 대해 변형될 수 있다.
"발현"은 구조적 RNA (rRNA, tRNA) 또는 단백질로 후속적으로 번역되는 메신저 RNA (mRNA)로의 유전자의 전사를 나타낸다.
단백질 또는 핵산에 관련하여 용어 "비-포유동물"은 예를 들어, 비-포유동물 척추동물, 예를 들어 새 (예를 들어, 닭 또는 오리) 또는 물고기, 및 비-포유동물 무척추동물을 포함하는 비-포유동물로부터 유래된 상기 화합물을 나타낸다. 비-포유동물 β-1,4-갈락토실트랜스퍼라제 (및 코딩 서열)의 매우 적합한 공급원은 닭 및 물고기이다.
단백질 또는 핵산에 관련하여 용어 "포유동물"은 포유동물, 예를 들어, 인간, 비-인간 영장류, 마우스, 돼지, 소, 염소, 고양이, 토끼, 래트, 기니아 피그, 햄스터, 말, 원숭이, 양, 왈라비, 오리너구리 또는 다른 비-인간 포유동물로부터 유래된 상기 화합물을 나타낸다.
용어 "β-1,4-갈락토실트랜스퍼라제"는 N-연결된 글리칸 상에 널리 나타나는 타입 2 사슬로부터 백본 구조의 생합성 (Galβ1 → 4GlcNAc)을 위해 요구되는 글리코실트랜스퍼라제 EC 2.4.1.38 (β-1,4-GalT1)을 나타내고, 즉, 상기 효소는 i.a. N-연결된 글리칸 상에 갈락토실화 활성을 갖는다. 각각 면역계 및 초기 배발생에서 일정 역할을 하는 시알릴 루이스 x 및 SSEA-1의 합성에서 타입 2 사슬이 특히 중요하다. 포유동물 β-1,4-갈락토실트랜스퍼라제 (예를 들어, 인간, 마우스, 래트로부터), 및 비-포유동물 종, 예를 들어 닭 및 물고기로부터의 β-1,4-갈락토실트랜스퍼라제의 동족체가 본원에서 제공된다.
본원에서 사용될 때 용어 "서열 동일성"은 2개 이상의 폴리뉴클레오티드 사이에 또는 2개 이상의 폴리펩티드 사이에 동일성의 존재를 나타낸다. 폴리뉴클레오티드 또는 폴리펩티드는 하나의 폴리뉴클레오티드 또는 폴리펩티드의 뉴클레오티드 또는 아미노산의 서열이 각각 다른 폴리뉴클레오티드 또는 폴리펩티드에 최대 대응성을 갖도록 정렬될 때 동일하면 "동일한" 서열을 갖는다. 2개 이상의 폴리뉴클레오티드 또는 폴리펩티드 사이의 서열 비교는 일반적으로 서열 유사성의 국소 구역을 확인하고 비교하기 위해 비교창 위에서 2개의 서열의 일부를 비교함으로써 수행된다. 비교창은 일반적으로 약 20 내지 200개의 연속 뉴클레오티드 또는 약 7 내지 70개의 연속 아미노산이다. 폴리뉴클레오티드 또는 폴리펩티드에 대한 "서열 동일성의 백분율", 예를 들어 50, 60, 70, 80, 90, 95, 98, 99 또는 100% 서열 동일성은 2개의 최적으로 정렬된 서열을 비교창 위에서 비교함으로써 결정할 수 있고, 여기서 비교창 내의 폴리뉴클레오티드 또는 폴리펩티드 서열의 일부는 2개의 서열의 최적 정렬을 위해 참조 서열 (부가 또는 결실을 포함하지 않는)에 비해 부가 또는 결실 (즉, 갭 (gap))을 포함할 수 있다. 백분율은 (a) 두 서열 모두에서 동일한 핵산 염기 또는 아미노산 잔기가 발생하는 위치의 수를 결정하여 매칭된 위치의 수를 얻고; (b) 매칭된 위치의 수를 비교창 내의 위치의 총수로 나누고; (c) 결과에 100을 곱하여 서열 상동성의 백분율을 얻음으로써 계산한다. 비교를 위한 서열의 최적 정렬은 공지의 알고리즘의 컴퓨터 구현에 의해, 또는 정밀검사에 의해 수행될 수 있다. 서열 상동성 또는 동일성의 비교 및 계산을 위해 서열을 정렬하기 위해 적합한 알고리즘 및 소프트웨어는 당업자에게 잘 알려져 있다. 그러한 툴 (tool)의 중요한 예는 피어슨 및 립만 (Pearson and Lipman) 탐색 기반 FASTA 및 BLAST 프로그램이고, 그의 상세내용은 문헌 ([Altschul et al (1997), Nucleic Acid Res. 25:3389-3402]; [Altschul et al (1990), J. Mol. Biol. 215: 403-10]; [Pearson and Lipman (1988), Proc. Natl. Acad. Sci. USA 85:2444-8]; [Lipman and Pearson (1985), Science 227:1435-41])에서 찾을 수 있다. 다른 적합한 프로그램은 현재 액셀리스 인크. (Accelrys Inc)를 통해 제공되는 유니버시티 오브 위스콘신 제네틱스 컴퓨터 그룹 (University of Wisconsin Genetics Computer Group, 미국 위스콘신주 매디슨)의 GCG® Wisconsin Package® 내의 PILEUP, LINEUP, GAP, BESTFIT 및 FASTA 프로그램을 포함한다. 상기 프로그램의 상세내용은 'http://www.ncbi.nlm.nih.gov/BLAST' 또는 미러 사이트 (mirror site) 및 "http://www.accelrys.com/products/gcg_wisconsin_package"를 통해 인터넷에서 이용가능하다. 따라서, 그러한 상동성 및 동일성 백분율은 공용 또는 시판 소프트웨어 패키지를 사용하여 또는 인터넷에서 컴퓨터 서버에 의해 확인할 수 있다. 용어 "동일성"은 서열이 최고 백분율의 아미노산 또는 염기의 정렬을 허용하는 갭의 도입을 요구하는 특정 위치에서 결실 또는 부가를 가질 수 있다는 사실에도 불구하고 서열들이 최적으로 정렬될 때 언급된 백분율의 목적하는 아미노산 서열 또는 핵산 서열이 참조 서열의 동일한 상대적인 위치에서 발견될 것임을 의미한다. 바람직하게는, 서열은 10 이하의 갭을 사용하여 정렬되고, 즉, 2개의 서열 내로 도입된 갭의 총수는 함께 첨가될 때 10 이하이다. 그러한 갭의 길이는 특히 중요하지 않지만, 일반적으로 10개 이하, 바람직하게는 5개 이하의 아미노산, 또는 30개, 바람직하게는 15개 이하의 염기일 것이다.
용어 "유전자 코드의 다의성 (degeneracy)"은 다수의 기능적으로 동일한 핵산이 임의의 주어진 단백질을 코딩하는 사실을 의미한다. 예를 들어, 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산 알라닌을 코딩한다. 따라서, 알라닌이 코돈에 의해 명시되는 모든 위치에서, 코돈은 코딩되는 폴리펩티드를 변경시키지 않으면서 기재된 임의의 대응하는 코돈으로 변경될 수 있다. 그러한 핵산 변이는 "침묵 변이"이다. 유전자 코드에 관련하여, 폴리펩티드를 코딩하는 본원의 모든 핵산 서열은 또한 핵산의 모든 가능한 침묵 변이를 설명한다.
"상보성 스트랜드"에서 용어 "상보성"은 핵산 스트랜드가 와슨-크릭 (Watson-Crick) 염기쌍 형성 규칙에 따라 다른 서열의 뉴클레오티드와 수소-결합된 이중체를 형성하는 뉴클레오티드의 서열을 갖는 것을 의미한다. 예를 들어, 5'-AAGGCT-3'에 대한 상보성 염기 서열은 3'-TTCCGA-5'이다.
용어 "갈락토실화된 N-연결된 글리칸"은 당단백질 내의 N-연결된 올리고당 단위의 공통 코어 (core)가 적어도 3개의 만노스 및 적어도 하나의 N-아세틸글루코사민 잔기와 함께 키토비오스 코어로 이루어지고, 비환원 단부에서 N-아세틸글루코사민 상의 적어도 하나의 갈락토스 잔기가 추가로 연장되는 것을 의미한다.
용어 "항체"는 항원 결합 형태의 항체 (예를 들어, Fab, F(ab)2)에 대한 언급을 포함한다. 용어 "항체"는 종종 분석물 (항원)을 특이적으로 결합하고 인식하는, 면역글로불린 유전자(들)에 의해 실질적으로 코딩되는 폴리펩티드 또는 그의 단편을 나타낸다. 그러나, 다양한 항체 단편이 무손상 항체의 소화의 측면에서 정의될 수 있지만, 당업자는 그러한 단편이 화학적으로 또는 재조합 DNA 방법을 이용함으로써 드 노보 (de novo) 합성될 수 있음을 이해할 것이다. 따라서, 본원에서 사용될 때, 용어 항체는 또한 항체 단편, 예를 들어 단일쇄 Fv, 키메라 항체 (즉, 상이한 종들로부터의 불변 및 가변 구역을 포함함), 인간화 항체 (즉, 비-인간 공급원으로부터의 상보성 결정 구역 (CDR)을 포함함) 및 이종컨쥬게이트 항체 (예를 들어, 이중특이적 항체)를 포함한다.
용어 "항체 중쇄 또는 경쇄"는 당업계에서 인정되는 의미로 사용된다.
용어 "기능적 단편"은 기능적 변이체 또는 기능적 유도체인 단백질의 짧아진 버전을 나타낸다. 단백질의 "기능적 변이체" 또는 "기능적 유도체"는 그의 아미노산 서열이 아미노산 서열의 변화에도 불구하고, 기능적 변이체가 당업자에게 검출가능한 원래의 단백질의 적어도 하나의 생물학적 활성의 적어도 일부를 보유하는 방식으로 하나 이상의 아미노산 잔기의 치환, 결실 및/또는 부가에 의해 원래의 단백질의 아미노산 서열로부터 유래될 수 있는 단백질이다. 기능적 변이체는 일반적으로 그가 유래되는 단백질에 적어도 50% 상동성 (바람직하게는, 아미노산 서열은 적어도 50% 동일성임), 적어도 70% 상동성 또는 적어도 90% 상동성이다. 기능적 변이체는 또한 단백질의 임의의 기능적 일부일 수 있다. 특정 실시태양에서, 기능은 갈락토실트랜스퍼라제 활성이다. 일부 실시태양에서, 아미노산 서열은 서열 2 (닭 갈락토실트랜스퍼라제의 단백질 서열) 또는 서열 14 (제브라피시 갈락토실트랜스퍼라제의 단백질 서열)와 주로 또는 단지 보존적 치환에 의해 상이하다. 일부 실시태양에서, 단백질은 서열 2 또는 서열 14와 65% 이상, 75% 이상, 85% 이상, 90% 이상, 또는 95% 이상의 서열 동일성, 특정 실시태양에서 이들 서열과 100% 동일성을 갖는 아미노산 서열을 포함한다. 본원에서 사용될 때, "기능적"은 또한 식물에서 기능적임을 포함한다.
아미노산에 관하여 사용될 때 표현 "보존적 치환"은 유사한 생화학적 특징을 갖는 아미노산에 의한 주어진 아미노산의 치환을 나타낸다. 따라서, 일부 실시태양에서, 서열 2 또는 서열 14의 서열의 아미노산이 소수성기를 갖는 경우에, 보존적 치환은 이를 또한 소수성기를 갖는 다른 아미노산으로 교체하고; 다른 그러한 생화학적 유사성은 특징적인 기가 친수성, 양이온성, 음이온성이거나 티올 또는 티오에테르를 함유하는 경우이다. 그러한 치환은 당업자에게 잘 알려져 있다 (즉, 미국 특허 5,380,712 참조). 보존적 아미노산 치환은 예를 들어 지방족 비-극성 아미노산의 집단 (Gly, Ala, Pro, Ile, Leu, Val), 극성 비하전된 아미노산 (Cys, Ser, Thr, Met, Asn, Gln)의 집단, 극성 하전된 아미노산 (Asp, Glu, Lys, Arg)의 집단 또는 방향족 아미노산 (His, Phe, Tyr, Trp)의 집단 내에서 이루어질 수 있다.
용어 "선택 마커"는 트랜스제닉 및 비-트랜스제닉 유기체의 분리를 허용하는 대사 형질을 코딩하는 폴리뉴클레오티드 서열을 나타내고, 항생제 내성의 제공을 나타낼 수 있다. 선택가능 마커는 예를 들어 aphL1 코딩된 카나마이신 내성 마커, nptII 유전자, 히그로마이신 내성을 코딩하는 유전자이다. 다른 내성 마커는 당업계에 잘 공지되어 있다. 다른 선택 마커는 예를 들어 리포터 (reporter) 유전자, 예를 들어 클로람페니콜 아세틸 트랜스퍼라제, β-갈락토시다제, 루시퍼라제 및 초록 형광 단백질이다. 리포터 유전자의 산물에 대한 확인 방법은 효소 분석 및 형광측정 분석을 포함하고 이로 제한되지 않는다. 리포터 유전자 및 그의 산물을 검출하기 위한 분석은 당업계에 공지되어 있고, 예를 들어 문헌 [Current Protocols in Molecular Biology, eds. Ausubel et al, Greene Publishing and Wiley-Interscience: New York (1987)] 및 주기적 업데이트에 설명되어 있다.
본원에서 사용될 때, 용어 "벡터"는 숙주 세포의 형질감염에서 사용되고, 그 내부로 폴리뉴클레오티드가 삽입될 수 있는 핵산에 대한 언급을 포함한다. 벡터는 종종 레플리콘 (replicon)이다. 발현 벡터는 내부에 삽입된 핵산의 전사를 허용한다.
본원에서 사용될 때, 용어 "작동가능하게 연결된"은 기재된 성분들이 그들의 의도된 방식으로 기능하는 것을 허용하는 관계로 존재하는 기능적 연결 또는 병렬 (juxtaposition)을 나타낸다. 다른 제어 서열에 및/또는 코딩 서열에 "작동가능하게 연결된" 제어 서열은 코딩 서열의 전사 및/또는 발현이 제어 서열과 상호적합한 조건 하에 달성되도록 하는 방식으로 라이게이팅된다. 일반적으로, 작동가능하게 연결된은 연결되는 핵산 서열들이 연속적이고, 2개의 단백질 코딩 구역을 연결하는 것이 필요한 경우에는 연속적이고 동일한 판독 프레임 내에 존재하는 것을 의미한다.
"숙주 세포"는 벡터를 함유하고, 벡터의 복제 및/또는 발현을 지지하는 세포를 의미한다. 숙주 세포는 원핵 세포, 예를 들어 이. 콜라이 (E. coli), 또는 진핵 세포, 예를 들어 식물, 효모, 곤충, 양서류 또는 포유동물 세포일 수 있다.
본원에서 사용될 때, 핵산에 관련하여 "이종성"은 외래종으로부터 기원하거나, 동일한 종의 것인 경우에 개입에 의해 조성 및/또는 게놈 로커스에서 그의 천연 형태로부터 변형되는 핵산을 의미한다. 예를 들어, 이종 구조 유전자에 작동가능하게 연결된 프로모터는 구조 유전자가 유래된 것과 상이한 종으로부터의 것이거나, 동일한 종의 것인 경우에, 하나 또는 둘 모두 그들의 원래의 형태로부터 변형된다. 이종 단백질은 외래종으로부터 기원할 수 있거나, 동일한 종의 것인 경우에 개입에 의해 그의 원래의 형태로부터 변형된다.
용어 "조절 서열" 또는 "제어 서열"은 코딩 서열의 발현을 위해 필요하거나 유리한 임의의 성분을 포함하도록 본원에서 사용된다. 조절 서열은 코딩 서열에 대해 천연이거나 외래일 수 있다. 그러한 조절 서열은 리더 (leader), 폴리아데닐화 서열, 프로펩티드 (propeptide) 서열, 프로모터, 신호 서열, 및 전사 터미네이터를 포함하나 이로 제한되지 않는다. 그러한 서열은 당업계에 잘 공지되어 있다. 최소한으로, 조절 서열은 프로모터, 또는 특정 프로모터 요소 및 전사 및 번역 중지 신호를 포함한다. 조절 서열에는 조절 서열과 폴리펩티드를 코딩하는 핵산 서열의 코딩 구역의 라이게이션을 용이하게 하는 특이적 제한 부위를 도입하기 위한 목적의 링커가 제공될 수 있다.
용어 "프로모터"는 RNA 폴리머라제의 결합 및 전사의 개시를 위한 DNA 서열을 함유하는 유전자의 부분을 나타내도록 당업계에서 인정되는 의미로 본원에서 사용된다. 프로모터 서열은 항상은 아니지만 일반적으로 유전자의 5' 비-코딩 구역에서 발견된다. "식물 프로모터"는 그의 기원이 식물 세포이든 아니든 식물 세포에서 전사를 개시할 수 있는 프로모터이다. 예시적인 식물 프로모터는 식물 세포에서 발현된 유전자를 포함하는 식물, 식물 바이러스 및 세균, 예를 들어 아그로박테리움 또는 리조븀 (Rhizobium)으로부터 얻은 것을 포함한다. 적합한 프로모터의 예는 콜리플라워 모자이크 바이러스의 35S 프로모터 및 그의 유도체, 페레독신 프로모터, 노팔린 합성효소 (nos), 만노핀 합성효소 (mas) 및 옥토핀 합성효소 (ocs) 프로모터 (EP 0 122 791, EP 0 126 546, EP 0 145 338), 유비퀴틴 프로모터 (EP 0 342 926), 카사바 베인 (cassava vein) 모자이크 바이러스 프로모터 및 루비스코 (Rubisco)의 짧은 하위단위에 대한 국화 (chrysanthemum) 프로모터이다.
용어 "트랜스제닉 식물 또는 식물 세포"는 그의 게놈 내에 이종 폴리뉴클레오티드를 포함하는 식물 또는 식물 세포에 대한 언급을 포함한다. 일반적으로, 이종 폴리뉴클레오티드는 게놈 내에 안정하게 통합되어, 폴리뉴클레오티드가 다음 세대로 전달된다. 이종 폴리뉴클레오티드는 게놈 내로 단독으로 또는 재조합 발현 카세트의 일부로서 통합될 수 있다. 또한, 이종 폴리뉴클레오티드가 형질전환된 식물의 게놈 내에 안정하게 통합되지 않는 것도 가능하다. 그러한 경우에, 유전자는 '일시적으로' 발현될 수 있고, 이는 발현이 주어진 시간 동안 일어나고, 그 후에 도입된 폴리뉴클레오티드가 세포로부터 상실되는 것을 의미한다. 본 발명의 목적에서, 트랜스제닉 식물 또는 식물 세포는 또한 이종 폴리펩티드를 일시적으로 발현하는 식물 또는 식물 세포를 포함한다. "트랜스제닉"은 초기에 이렇게 변경된 트랜스제닉 및 초기 트랜스제닉으로부터 유성 교배 또는 무성 증식에 의해 생성된 것을 포함하는, 그의 유전자형이 이종 핵산의 존재에 의해 변경된 임의의 세포, 세포주, 유합 조직, 식물 일부분 또는 식물을 포함하도록 본원에서 사용된다. 본원에서 사용될 때, 용어 "트랜스제닉"은 종래의 식물 육종 방법에 의한 또는 자연 발생 사건, 예를 들어 무작위 타가-수정, 비-재조합 바이러스 감염, 비-재조합 세균 형질전환, 비-재조합 전위 (transposition), 또는 자발적 돌연변이에 의한 게놈 (염색체 또는 염색체외)의 변경을 포함하지 않는다.
핵산을 세포 내로 도입시키는 문맥에서 용어 "삽입"은 "형질감염" 또는 "형질전환" 또는 "형질도입"을 의미하고, 진핵 또는 원핵 세포 내로 핵산의 포함에 대한 언급을 포함하고, 여기서 핵산은 세포의 게놈 (예를 들어, 염색체, 플라스미드, 플라스티드 또는 미토콘드리아 DNA) 내로 포함되거나, 자가 레플리콘으로 전환되거나, 일시적으로 발현될 수 있다 (예를 들어, 형질감염된 mRNA).
본원에서 사용될 때, 용어 "식물"은 전체 식물, 식물 기관 (예를 들어, 잎, 줄기, 뿌리 등), 종자 및 식물 세포 및 그의 자손체를 (이들에 대한 언급을) 포함한다. 본원에서 사용될 때, 식물 세포(들)은 종자, 배, 분열 조직 구역, 유합 조직, 잎, 뿌리, 싹, 배우체, 포자체, 화분 및 소포자를 포함하고 이로 제한되지 않는다. 일부 실시태양에서, 식물 세포는 현탁 배양으로 성장된다. 일부 실시태양에서, 식물 세포는 전체 식물을 재생할 수 있다. 본 발명의 방법에서 사용될 수 있는 식물의 종류는 일반적으로 외떡잎 및 쌍떡잎 식물을 모두 포함하는, 형질전환 기술에 적용가능한 고등 식물의 종류만큼 넓다. 식물을 언급하여 본원에서 사용될 때, 달리 명시하지 않으면 조류로부터 나무까지 전체 범위의 식물이 의도된다 . 바람직한 식물은 니코티아나 종, 바람직하게는 엔. 타바쿰 또는 엔. 벤타미아나 (N. benthamiana)이다.
용어 "특이적으로 인식하는"은 항체와 항체의 항원 결합 부위에 의해 인식되는 에피토프를 갖는 단백질 사이의 결합 반응에 대한 언급을 포함한다. 상기 결합 반응은 단백질 및 다른 생물학제의 이종 집단의 존재 사이에서 인식된 에피토프를 갖는 단백질의 존재를 결정한다. 따라서, 지정된 면역분석 조건 하에, 명시된 항체는 샘플 내에 존재하는 에피토프가 결핍되는 실질적으로 모든 분석물에 대해서보다 실질적으로 더 큰 정도 (예를 들어, 배경에 비해 적어도 2배)로 인식된 에피토프를 갖는 분석물에 결합한다. 그러한 조건 하에 항체에 대한 특이적 결합은 특정 항원에 대한 그의 특이성에 대해 선택되는 항체를 필요로 할 수 있다. 예를 들어, 본원에 기재된 폴리펩티드, 예를 들어, 서열 2, 4, 7, 9, 11, 14, 16, 18 및 20에 대해 생성된 항체가 이들 폴리펩티드를 특이적으로 인식하는 항체를 얻기 위해 선택될 수 있다. 면역원으로서 사용되는 단백질 또는 폴리펩티드는 천연 입체형태로 존재하거나 선형 에피토프를 제공하도록 변성될 수 있다. 특정 단백질 (또는 다른 분석물)을 특이적으로 인식하는 항체를 선택하기 위해 다양한 면역분석 형식이 이용될 수 있다. 예를 들어, 고체상 ELISA 면역분석이 단백질과 특이적 면역반응성인 모노클로날 항체를 선택하기 위해 일상적으로 사용된다. 선택적 반응성을 결정하기 위해 사용될 수 있는 면역분석 형식 및 조건의 설명에 대해서는 문헌 [Harlow 및 Lane, Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York (1988)]을 참조한다.
핵산 분자 및 세포성 발현 시스템
본원에 기재된 폴리펩티드를 코딩하는 핵산 분자는 임의의 세포성 발현 시스템, 예를 들어 식물, 효모, 세균, 비-포유동물 및 포유동물 세포성 발현 시스템 내에서 발현될 수 있지만, 핵산 분자는 바람직하게는 현탁액에서 성장될 수 있는 식물 또는 식물 세포 내에서 발현된다.
일부 실시태양에서, 본 발명은 N-글리칸 생합성을 제공하는 기능적 단백질을 포함하는 식물 또는 식물 세포를 제공하고, 여기서 단백질은 예를 들어, 닭 또는 물고기 기원으로부터의 비-포유동물 β-1,4-갈락토실트랜스퍼라제이다. 다른 실시태양에서, 상기 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 N-말단에서 효소의 의도된 기능을 가능하게 하도록 골지 기관에 관한 국재화를 용이하게 하는 N-말단 연장부 서열로 연장된다. N-말단 연장부 서열은 일반적으로 골지-국재화 신호 서열을 포함하는 세포기질 테일 및 막횡단 도메인으로 이루어진다. 그러한 N-말단 서열 ("CTS"로서 지정함)은 포유동물 β-1,4-갈락토실트랜스퍼라제로부터, 포유동물 시알릴트랜스퍼라제로부터, 또는 임의의 다른 골지체에 국재화된 단백질로부터 유래되고, 예를 들어, 닭 또는 물고기 기원으로부터의 비-포유동물 GalT의 촉매 도메인에 융합되고, 식물 세포 또는 식물 내에서 발현될 수 있다.
글리코실트랜스퍼라제의 N-말단 세포질, 막횡단 구역 (본원에서 CTS 구역으로서 칭함)은 ER 또는 골지 막에 효소의 국재화를 결정한다. 천연 또는 바람직한 글리코실화를 제공하기 위해, 글리코실트랜스퍼라제는 포유동물에서 발생하는 것과 마찬가지로 식물 내에서 발현될 수 있지만, 또한 2개의 상이한 글리코실트랜스퍼라제, 또는 2개의 상이한 글리코실트랜스퍼라제의 일부분 사이의 융합 단백질로서 발현될 수 있다. 그러한 경우에, 국재화는 하나의 효소에 의해 결정되고, 촉매 활성은 제2 효소에 의해 결정된다. 예로서, 래트 시알릴트랜스퍼라제의 세포질, 막횡단 및 스템 구역과, 예를 들어 서열 10 및 서열 17에 제공된 것과 같은 포유동물 갈락토실트랜스퍼라제의 촉매 도메인 사이의 융합은 갈락토실트랜스퍼라제 활성 및 시알릴트랜스퍼라제의 국재화를 갖는 효소를 제공한다.
포유동물 GalT 효소의 이용가능한 N-말단 연장부는 길이가 약 10-20개의 아미노산이고, 세포기질 테일 서열의 처음 10개의 아미노-말단 아미노산 내에 모티프 [K/R]-X-[K/R] (여기서, K/R은 라이신 또는 아르기닌 잔기를 의미하고, X는 임의의 아미노산일 수 있다)을 함유하는 것을 특징으로 한다.
특정 실시태양에서, N-말단 아미노산 서열 연장부는 인간 β-1,4-갈락토실트랜스퍼라제 폴리펩티드 1 서열의 처음 13개의 아미노산 잔기, 즉, MRLREPLLSGSAA (서열 21)를 포함한다 (도 1 참조). 다른 실시태양에서, 비-포유동물 GalT의 CTS는 또다른 골지체에 국재화된 단백질로부터의 CTS로 교체되고; 교체부는 예를 들어 래트 α-2,6-시알릴트랜스퍼라제 (Genbank 기탁 번호 M18769)로부터의 CTS로부터 유래될 수 있다.
특정 실시태양에서, 식물 세포 또는 식물은 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1)와 적어도 85% 동일한 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 다른 실시태양에서, 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1)에 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.
특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1)에 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 및 그의 벡터가 제공된다.
특정 실시태양에서, 식물 세포 또는 식물은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2)와 적어도 65% 동일한 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 다른 실시태양에서, 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.
특정 실시태양에서, 식물 세포 또는 식물은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2)와 적어도 65% 동일하고 포유동물 연장부를 포함하는 변형된 N-말단을 포함하는 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 포유동물 연장부는 예를 들어, 인간 β-1,4-갈락토실트랜스퍼라제 폴리펩티드 1 서열의 처음 13개의 아미노산 잔기, 즉, MRLREPLLSGSAA (서열 21)를 포함할 수 있거나, 비-포유동물 GalT의 CTS는 또다른 골지체에 국재화된 단백질로부터의 CTS로 교체되고; 교체부는 예를 들어 래트 α-2,6-시알릴트랜스퍼라제 (Genbank 기탁 번호 M18769)로부터의 CTS로부터 유래될 수 있다. 다른 실시태양에서, 포유동물 연장부를 포함하는 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.
특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열에 관해서만, 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1)에 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한, 상기 설명된 바와 같은 포유동물 연장부 또는 변경된 CTS 구역을 포함하는 핵산 및 그의 벡터를 제공하고; 즉, 서열 동일성은 포유동물 연장부 또는 변경된 CTS 구역에 대해서는 확립되지 않는다.
특정 실시태양에서, 식물 세포 또는 식물은 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)과 적어도 85% 동일한 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 다른 실시태양에서, 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)에 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.
특정 실시태양에서, 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)에 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 및 그의 벡터가 제공된다.
특정 실시태양에서, 식물 세포 또는 식물은 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 65% 동일한 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 다른 실시태양에서, 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.
특정 실시태양에서, 식물 세포 또는 식물은 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 65% 동일하고 포유동물 연장부를 포함하는 변형된 N-말단을 포함하는 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 포함한다. 다른 실시태양에서, 포유동물 연장부를 포함하는 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.
특정 실시태양에서, 식물 세포 또는 식물은 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 65% 동일한 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하고, 여기서 제브라피시 β-1,4-갈락토실트랜스퍼라제의 CTS는 또다른 골지체에 국재화된 단백질로부터의 CTS로 교체된다. 다른 실시태양에서, 포유동물 연장부를 포함하는 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.
특정 실시태양에서, 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열에 관해서만, 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)에 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한, 상기 설명된 바와 같은 포유동물 연장부 또는 변경된 CTS 구역을 포함하는 핵산 및 그의 벡터를 제공하고; 즉, 서열 동일성은 포유동물 연장부 또는 변경된 CTS 구역에 대해서는 확립되지 않는다.
일부 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 또는 물고기 β-1,4-갈락토실트랜스퍼라제인 한편, N-말단 연장부는 인간 β-1,4-갈락토실트랜스퍼라제 유전자로부터 유래되거나, CTS는 래트 시알릴트랜스퍼라제로부터 유래된다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제는 서열 2의 아미노산 서열을 갖고, 물고기 β-1,4-갈락토실트랜스퍼라제는 제브라피시 (다니오 레리오 (Danio rerio))로부터 유래되고 서열 14의 아미노산 서열을 갖는다. 특정 실시태양에서, 효소는 각각 서열 1 및 서열 13의 핵산에 의해 코딩된다.
일부 실시태양에서, 닭 및 물고기로부터 유래된 것과 같은 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물이 제공된다. 특정 실시태양에서, 식물 세포 또는 식물은 기능적 야생형 닭 β-1,4-갈락토실트랜스퍼라제 (서열 2)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸 (즉, N-글리칸의 α-1,3-아암 (arm) 상의 비환원 단부에서 적어도 트리만노스화 키토비오스 코어, 하나의 추가의 만노스 및 갈락토실화된 GlcNAc 잔기를 포함하는 N-글리칸)을 적어도 생산한다. 특정 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.
다른 실시태양에서, 식물 세포 또는 식물은 N-말단에서 13개의 아미노산 연장부를 포함하는 닭 β-1,4-갈락토실트랜스퍼라제 (서열 9)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸을 적어도 생산한다. 특정 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.
다른 실시태양에서, 식물 세포 또는 식물은 N-말단에서 시알릴트랜스퍼라제 CTS 연장부를 포함하는 닭 β-1,4-갈락토실트랜스퍼라제 (서열 11)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸, 및 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸 (즉, 트리만노스화 키토비오스 코어에 추가로 비-환원 단부에서 적어도 하나의 갈락토실화된 GlcNAc 잔기를 갖는 N-글리칸)을 적어도 생산한다. 특정 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸 및/또는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.
특정 실시태양에서, 식물 세포 또는 식물은 야생형 제브라피시 β-1,4-갈락토실트랜스퍼라제 (서열 14)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 2-안테나형 N-연결된 글리칸, 및 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸을 적어도 생산한다. 특정 실시태양에서, 2-안테나형 N-연결된 글리칸 및/또는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.
다른 실시태양에서, 식물 세포 또는 식물은 N-말단에서 13개의 아미노산 연장부를 포함하는 제브라피시 β-1,4-갈락토실트랜스퍼라제 (서열 16)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 2-안테나형 N-연결된 글리칸, 및 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸을 적어도 생산한다. 특정 실시태양에서, 2-안테나형 N-연결된 글리칸 및/또는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.
다른 실시태양에서, 식물 세포 또는 식물은 N-말단에서 시알릴트랜스퍼라제 CTS 연장부를 포함하는 제브라피시 β-1,4-갈락토실트랜스퍼라제 (서열 18)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 2-안테나형 N-연결된 글리칸, 및 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸을 적어도 생산한다. 특정 실시태양에서, 2-안테나형 N-연결된 글리칸 및/또는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.
특정 실시태양에서, 본원에 설명된, N-말단에서 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단으로부터 유래되는 서열로 또는 포유동물 β-1,4-갈락토실트랜스퍼라제 또는 시알릴트랜스퍼라제로부터의 N-말단 CTS 서열로 연장되는 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산은 별법으로 식물, 동물 또는 진균의 골지체에 국재화된 단백질로부터의 임의의 다른 CTS 서열로 연장될 수 있어서, 그가 C-말단에서 융합되는 비-포유동물 GalT 촉매 도메인의 트랜스 (trans)-골지 국재화된 발현을 일으킨다. 상기 핵산을 본 발명에서 제공한다.
특정 실시태양에서, 식물 세포 또는 식물은 본원에 설명된 비-포유동물 β-1,4-갈락토실트랜스퍼라제에 추가로, 제2 단백질, 바람직하게는 갈락토실화된 N-연결된 글리칸이 제공된 포유동물 단백질을 발현하여 이종 당단백질을 생산하고, 그 중 그의 N-글리칸의 β-1,4-갈락토실화, 2-안테나형 또는 별법으로 하이브리드 형태가 중요하다. 또한, 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물에서 생산되는 상기 당단백질도 본 발명에서 제공된다.
특정 실시태양에서, 상기 제2 단백질은 항체 중쇄 및/또는 경쇄 또는 그의 기능적 단편을 코딩하는 핵산으로부터 발현된다.
당업자는 전체 식물을 생성할 수 있는, 예를 들어 식물 세포와 같은 세포성 발현 시스템에서 재조합 핵산의 발현을 잘 이해한다. 세포성 발현 시스템에서 재조합 핵산의 발현을 위해 발현 벡터가 사용될 수 있다. 특정 실시태양에서, 그러한 벡터는 임의로 N-연결된 글리칸 상에 갈락토실화 활성을 갖도록 하는 방식으로 N-말단에서 연장되거나 그 자신의 CTS가 또다른 골지체에 국재화된 단백질로부터의 N-말단 CTS 서열로 교체되는 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 그의 효소 활성 유도체 또는 일부분을 코딩하는 DNA를 포함할 것이다. 적합한 벡터는 조절 요소, 예를 들어 프로모터, 및 임의로 상기 세포성 발현 시스템 내에서 발현가능한 적어도 하나의 선택 마커를 추가로 포함할 수 있다. 발현 벡터는 글리코실화될 수 있는 포유동물 당단백질을 코딩하는 적어도 하나의 추가의 DNA를 추가로 코딩할 수 있다.
특정 실시태양에서, 정상적으로 식물 내에 존재하지 않는 N-글리칸 생합성을 제공하여, 예를 들어, N-연결된 글리칸을 갈락토스의 부가에 의해 연장하는 능력을 제공하는 기능적 비-포유동물 효소 (임의로 포유동물 GalT로부터 유래된 N-말단 연장부를 갖거나, 그 내부에서 내인성 CTS가 식물의 골지체에 국재화된 단백질로부터의 또다른 CTS로 교체된다)가 제공된 식물 또는 식물 세포를 제공한다. 특정 실시태양에서 발현은 일시적이지만, 다른 실시태양에서 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 그의 효소 활성 유도체 또는 일부분, 및 임의로 글리코실화될 수 있는 추가의 이종 단백질의 발현이 안정적인 식물 또는 식물 세포가 제공된다. 특정 실시태양에서, 식물 세포 또는 식물에 의해 제3 단백질이 추가로 발현된다. 그러한 제3 단백질은 상기 갈락토실화된 제2 단백질의 글리코실화를 추가로 처리하는 효소일 수 있다. 특정 실시태양에서, 식물 세포 또는 식물은 이량체 또는 다량체 단백질의 단량체를 코딩하는 2개의 핵산을 포함할 수 있다. 특정 실시태양에서, 항체 경쇄 및 중쇄 또는 그의 기능적 단편 모두에 대해 또는 임의의 다른 관심있는 이량체 또는 다량체 단백질에 대해 별개의 핵산이 제공된다. 물론, 전체 단백질이 발현되는 것이 필요하지는 않다. 특정 실시태양에서, 본 발명에 따른 식물 세포 또는 식물은 상기 제2 포유동물 당단백질의 단편, 바람직하게는 기능적 단편만을 발현하고, 여기서 상기 단편은 전체 단백질의 적어도 하나의 활성을 갖고, 추가로 예를 들어 끝이 잘린 (truncated) 폴리펩티드 사슬, 또는 완전히 연장되지 않은 글리칸, 예를 들어 갈락토스만으로 연장된 글리칸을 특징으로 한다. 그러한 당단백질 또는 그의 단편은 또한 본원에서 제공된다.
식물에서 생산된 당단백질에 식물-특이적 잔기, 예를 들어 β-1,2-자일로스 및 α-1,3-푸코스 잔기를 부가하면 포유동물에서 β-1,2-자일로스 및 α-1,3-푸코스 잔기의 바람직하지 않은 항원성 및 면역원성 특징 때문에 상기 당단백질은 제약 용도에 덜 적합하게 된다. 식물에서 생산된 당단백질 상의 β-1,2-자일로스 및 α-1,3-푸코스 잔기의 수를 실질적으로 제한하기 위해 또는 이들 잔기의 완전한 결여를 달성하기 위해, 합성된 당단백질이 인간화 또는 포유동물화 특징을 나타내도록 하는 방식으로 식물 세포의 게놈을 변형시키는 전략이 요구된다.
특정 실시태양에서, 제2 단백질, 및 바람직하게는 제2 포유동물 단백질 또는 그의 기능적 단편이 자일로스 및/또는 푸코스가 없는 연장된 N-연결된 글리칸을 포함하는 식물 세포 또는 식물을 제공한다. 식물-유래 갈락토실화된 당단백질은 여전히 자일로스 및 푸코스 잔기를 함유할 수 있다. 따라서, 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 본원에서 설명된 그의 변형된 형태는 효소가 골지체 내에서 천연 기질에 대해 작용하도록, 즉, N-아세틸글루코사미닐트랜스퍼라제 I, 골지-만노시다제 II 및 N-아세틸글루코사미닐트랜스퍼라제 II의 작용에 후속적으로, 및 식물에서 이들 효소가 다른 방식으로 억제되지 않으면 자일로실트랜스퍼라제 및 푸코실트랜스퍼라제의 작용에 후속적으로 또는 그의 작용 동안 작용하도록 하는 방식으로 식물에서 발현된다. 식물로부터 얻은 갈락토실화된 단백질은 본원에서 식물-유래로서 칭한다. 그러한 식물-유래 갈락토실화된 단백질도 본원에서 제공한다.
식물에서 맞춤 (tailored) 생산된 당단백질의 생산을 위한 식물의 글리코실화를 포유동물화하기 위해, 자일로실트랜스퍼라제 및 푸코실트랜스퍼라제는 녹-아웃 (knock out)되거나 침묵될 수 있고, 몇몇 포유동물 글리코실트랜스퍼라제 중 적어도 하나가 발현되어야 한다. 예를 들어, N-아세틸글루코사미닐트랜스퍼라제 I을 코딩하는 유전자에서 돌연변이된 아라비돕시스 탈리아나 돌연변이체가 완전히 생육가능하였기 때문에, 자일로실트랜스퍼라제 및 푸코실트랜스퍼라제 녹-아웃을 제공하고, 그에 의해 식물의 원치 않는 글리코실화 가능성을 감소시키는 것은 실행가능한 선택사항이다. N-아세틸글루코사미닐트랜스퍼라제 I은 복합형 글리칸의 형성을 개시하는 효소이므로, 상기 식물에는 자일로스 및 푸코스 잔기 함유 복합형 글리칸이 완전히 결여된다.
특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 그의 효소 활성 유도체 또는 일부분, 글리코실화될 수 있는 추가의 이종 단백질, 및 임의로 추가로 추가의 N-글리칸 생합성을 제공하는 제3 단백질이 발현되고, 자일로스 및/또는 푸코스 부가를 담당하는 효소를 코딩하는 유전자가 녹-아웃되거나, 안티센스 또는 RNAi 기술을 이용하여 이들 유전자의 발현을 침묵시킨 식물 또는 식물 세포를 제공한다. 식물에서 유전자 녹-아웃을 위한 방법 또는 RNAi를 통한 유전자 침묵은 당업계에 잘 공지되어 있다.
RNA 간섭 (RNAi)은 번역 단계에서 또는 특이적 유전자의 전사를 방해함으로써 유전자 발현을 억제하는 메카니즘이다. 작은 간섭 RNA 스트랜드 (siRNA)는 RNAi 과정에 핵심적이고, 표적 RNA 스트랜드에 상보성인 뉴클레오티드 서열을 갖는다. 특이적 RNAi 경로 단백질, 예를 들어 다이서 (dicer) (RISC)가 siRNA에 의해 표적 메신저 RNA (mRNA)로 안내되고, 여기서 이들은 표적을 더 이상 단백질로 번역될 수 없는 보다 작은 부분으로 절단한다. RNA 간섭은 특히 식물에서 바이러스 및 다른 외래 유전 물질에 대한 면역 반응의 중요한 부분이다.
RNA 간섭은 식물 생물공학에서의 적용을 위해, 예를 들어 보다 낮은 수준의 천연 식물 독소를 생산하는 식품 식물의 공학처리에서, 토마토 식물에서 알레르겐의 수준을 감소시키도록, 및 토마토에서 식물을 식이 항산화제로 강화시키기 위해 사용되었다 ([Sunilkumar G. et al. (2006) Proc Natl Acad Sci USA 103(48): 18054-9]; [Siritunga D, Sayre R (2003) Planta 217(3): 367-73]; [Le L. et al. (2006) Plant Biotechnol J 4(2): 231-42]; [Niggeweg R. et al. (2004) Nat Biotechnol 22(6): 746-54]). 상기 기술은 식물체에서 안정하고 유전가능한 RNAi 표현형을 이용한다.
다른 실시태양에서, 자일로스 및/또는 푸코스가 없는 연장된 N-연결된 글리칸을 포함하는 당단백질을 특이적으로 분리하고 정제하는 방법을 제공한다. 요구되는 정제를 매개하기 위해 (면역) 친화도 정제 또는 크기-배제 크로마토그래피 또는 전기영동과 같은 몇몇 종류의 분리 기술이 존재한다. 그러한 방법은 당업계에 잘 공지되어 있다 (예를 들어, US 2008/0003680 참조).
당업자는 본 발명이 식물 또는 식물 세포에 제한되는 것이 아니라, 본 발명에 따른 당단백질 (본질적으로 비시알릴화된) (여기서 상기 N-연결된 글리칸은 갈락토스를 포함한다)을 생산하는 능력을 가진 동물, 진균 또는 효모와 같은 다른 유기체, 또는 포유동물 세포주 또는 곤충 세포주와 같은 세포주를 제공함을 이해할 것이다.
상업적으로 중요한 맞춤형 당단백질을 생산하는 일시적으로 또는 안정적으로 형질전환된 식물을 생성하는 것은 일부 실시태양에서, 본원에 기재된 바와 같은 N-글리코실화 변형 효소를 코딩하는 뉴클레오티드 서열 및 상업적으로 중요한 이종 당단백질을 코딩하는 유전자를 모두 포함하는 (2원) 벡터를 함유하는 아그로박테리움 균주를 식물 세포 또는 조직에 접종함으로써 확립될 수 있다. 별법으로, 일부 실시태양에서, 상업적으로 중요한 맞춤형 당단백질을 생산하는 일시적으로 또는 안정적으로 형질전환된 식물은 각각 N-글리코실화 변형 효소를 코딩하는 뉴클레오티드 서열 또는 상업적으로 중요한 이종 당단백질을 코딩하는 뉴클레오티드 서열을 포함하는 벡터를 보유하는 2개 이상의 아그로박테리움 균주의 동시 접종 (동시-형질전환)에 의해 생성될 수 있다. 별법으로, 일부 실시태양에서, 상업적으로 중요한 맞춤형 당단백질을 생산하는 일시적으로 또는 안정적으로 형질전환된 식물은 변형된 N-글리코실화를 가진 식물과 상업적으로 중요한 단백질을 코딩하는 폴리뉴클레오티드를 발현하는 식물의 (다수) 교배(들)에 의해 생성될 수 있다. 이들 모든 절차에서, 벡터는 또한 선택제에 대한 내성을 부여하는 핵산 서열을 포함할 수 있다.
N-글리코실화에 관여된 단백질, 및 상업적으로 중요한 당단백질 또는 폴리펩티드를 만족스럽게 발현시키기 위해, 뉴클레오티드 서열을 당업자에게 공지된 바와 같이 숙주 식물의 특이적 전사 및 번역 기구에 적응시킬 수 있다. 예를 들어, 코돈 사용 빈도를 개선하기 위해 코딩 구역에서 침묵 돌연변이를 도입시킬 수 있고, 관련 식물 조직에서 상기 유전자의 발현을 진행시키기 위해 특이적 프로모터를 사용할 수 있다. 적절한 시간에, 예를 들어, 식물 조직이 논밭으로부터 수확되어 제어된 조건에 놓인 후에만 발현을 보장하기 위해 발생상 조절되거나 의도한 바와 같이 도입될 수 있는 프로모터를 사용할 수 있다. 이들 모든 경우에, 글리코실화 변형 단백질 및 상업적으로 중요한 당단백질의 발현 카세트의 선택은 당단백질에 대한 목적하는 번역후 변형을 허용하도록 동일한 세포 내에서 발현되도록 하는 것이어야 한다.
특정 실시태양에서, 담배 식물, 또는 니코티아나속의 종, 바람직하게는 엔. 타바쿰 또는 엔. 벤타미아나에 관련된 식물을 제공한다. 다른 실시태양에서, 다른 비교적 용이하게 형질전환가능한 식물, 예를 들어 아라비돕시스 탈리아나, 또는 제아 메이즈 (Zea mays), 또는 그에 관련된 식물을 사용할 수 있다. 재조합 당단백질의 생산을 위해서, 개구리밥을 사용하는 것이 특정한 잇점을 제공한다. 이 식물은 일반적으로 작고, 영양 출아 (vegetative budding)를 통해 무성 방식으로 번식한다. 대부분의 개구리밥 종은 뿌리, 줄기, 꽃, 종자 및 엽상체를 포함한 훨씬 더 큰 식물의 모든 조직 및 기관을 갖는다. 개구리밥은 쉽게 수확할 수 있는 완전 용기 (full containment) 내에서 간단한 액체 용액의 표면에서 부유 식물로서 저렴하고 매우 빠르게 성장시킬 수 있다. 특정 실시태양에서, 개구리밥에는 본원에 기재된 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 그의 변형된 버전 및/또는 상업적으로 중요한 이종 당단백질을 코딩하는 유전자가 재조합 방식으로 제공된다. 개구리밥 식물은 예를 들어 스피로델라 (Spirodella) 속, 울피아 (Wolffia) 속, 울피엘라 (Wolffiella) 속, 또는 렘나 (Lemna) 속, 렘나 마이너 (Lemna minor), 렘나 미니스쿨라 (Lemna miniscula) 및 렘나 깁바 (Lemna gibba)를 포함할 수 있다.
특정 실시태양에서, 토마토 열매에서의 발현을 제공한다. 토마토는 온실 내에서 억제되고 제어된 조건 하에 쉽게 성장시킬 수 있고, 토마토 열매 생물량은 1년 내내 막대한 양으로 연속적으로 수확할 수 있다. 관심있는 당단백질을 함유하는 수질 분획은 나머지 토마토 열매로부터 쉽게 분리할 수 있고, 이는 당단백질의 용이한 정제를 가능하게 한다. 특정 실시태양에서, 비제한적으로 옥수수의 낟알, 감자의 덩이줄기, 및 유채 또는 해바라기의 종자를 포함하는 다른 작물의 저장 기관 내에서의 발현을 제공하고, 이는 수확 및 처리 기술이 쉽게 이용가능한 기관 내에 막대한 생물량을 제공하는 매력적인 대안이다.
일부 실시태양에서, 트랜스제닉 식물을 적어도 하나의, 임의로 기능적인 비-포유동물 단백질, 예를 들어, 정상적으로 식물 내에 존재하지 않는 N-글리칸 생합성을 제공하는 효소 또는 트랜스포터 (transporter)를 포함하는 식물과 교배시키고, 상기 교잡으로부터 자손체를 수확하고, 상기 재조합 단백질을 발현하고 정상적으로 식물 내에 존재하지 않는 포유동물-유사 N-글리칸 생합성에 관여하는 기능적 비-포유동물 효소를 발현하는 목적하는 자손체 식물을 선택하는 것을 포함하는, N-연결된 글리칸을 갈락토스로 연장시키는 능력을 가진, 재조합 단백질을 발현할 수 있는 트랜스제닉 식물, 예를 들어 트랜스제닉 니코티아나 종, 바람직하게는 엔. 타바쿰 또는 엔. 벤타미아나, 아라비돕시스 탈리아나, 또는 옥수수, 감자, 토마토, 또는 개구리밥을 제공하기 위한 방법을 제공한다. 한 실시태양에서, 상기 방법은 적어도 갈락토스를 포함하는 연장된 N-연결된 글리칸을 포함하는 상기 재조합 단백질을 발현하는 목적하는 자손체 식물을 선택하는 것을 추가로 포함할 수 있다.
일부 실시태양에서, N-연결된 글리칸을 포함하는 상기 재조합 당단백질을 발현하고 포유동물-유사 N-글리칸 생합성에 관여하는 비-포유동물 효소를 발현하는 식물을 제공한다. 추가의 실시태양에서, 본 발명은 또한 목적하는 당단백질 또는 그의 기능적 단편을 생산하기 위한 트랜스제닉 식물의 용도를 제공하고, 특히, 상기 당단백질 또는 그의 기능적 단편은 적어도 갈락토스를 포함하는 연장된 N-연결된 글리칸을 포함한다.
일부 실시태양에서, N-연결된 글리칸을 갈락토스로 연장시키는 능력을 가진, 재조합 단백질을 발현할 수 있는 트랜스제닉 식물 세포의 현탁 배양액, 예를 들어 트랜스제닉 니코티아나 종, 바람직하게는 엔. 타바쿰 BY2, 다우쿠스 카로타 또는 아라비돕시스 탈리아나 세포 현탁액을 제공하기 위한 방법을 제공한다.
일부 실시태양에서, N-연결된 글리칸을 갈락토스로 연장시키는 능력을 가진, 재조합 단백질을 발현할 수 있는 트랜스제닉 이끼, 예를 들어 트랜스제닉 브리오피타에아, 바람직하게는 피스코미트렐라 파텐스, 또는 푸나리아 히그로메트리카, 케라토돈 푸르푸레우스를 제공하기 위한 방법을 제공한다.
일부 실시태양에서, 예를 들어 적어도 갈락토스를 포함하는 연장된 N-연결된 글리칸을 포함하는 목적하는 당단백질 또는 그의 기능적 단편을 얻는 방법을 제공한다. 상기 방법은 본원에 기재된 바와 같은 식물을 상기 식물이 수확가능 단계에 도달할 때까지, 예를 들어 수익성 높은 수확을 허용하기 위해 충분한 생물량이 성장될 때까지 재배한 후, 당업계에 공지된 확립된 기술로 상기 식물을 수확하고, 당업계에 공지된 확립된 기술로 상기 식물을 분별하여 분별된 식물 물질을 얻고, 상기 분별된 식물 물질로부터 상기 당단백질을 적어도 부분적으로 단리하는 것을 포함한다.
일부 실시태양에서, 예를 들어 상기 설명된 방법에 의해 수득되는 적어도 갈락토스를 포함하는 연장된 N-연결된 글리칸을 포함하는 식물-유래 당단백질 또는 그의 기능적 단편을 제공한다. 적어도 갈락토스를 포함하는 연장된 글리칸을 갖는 상기 식물-유래 당단백질은 본질적으로 식물에서 발현될 수 있는 임의의 목적하는 당단백질일 수 있다. 예를 들어, 항체, 백신, 사이토킨, FSH, TSH 및 다른 호르몬 당단백질, EPO와 같은 다른 호르몬, 안티트립신 또는 리파제와 같은 효소, NCAM과 같은 세포 부착 분자 또는 콜라겐이 식물 내에서 생산되고, 본질적으로 포유동물 글리코실화 패턴이 제공될 수 있다.
일부 실시태양에서, 본 발명은 예를 들어 항체, 호르몬, 사이토킨, 백신 항원, 효소 등을 사용한 환자 치료용의 제약 조성물의 생산을 위한, 본원에 기재된 바와 같은 상기 식물-유래 당단백질 또는 그의 기능적 단편의 용도를 제공한다. 또한, 당단백질 또는 그의 기능적 단편을 포함하는 상기 제약 조성물도 제공한다.
식물 형질전환
예를 들어 N-글리칸 생합성을 제공하는 비-포유동물 효소, 및 당단백질, 예를 들어 항체, 사이토킨, 백신, 호르몬 등과 같은 단백질의 발현은 당업계에 공지된 방법을 이용하여, 예를 들어, 아그로박테리움 매개 형질전환, 전기천공 또는 입자 폭격을 통한 안정한 발현에 의해, 또는 예를 들어 PVX와 같은 바이러스 벡터, 또는 애그로필트레이션을 이용하는 일시적 발현에 의해, 또는 당업계에 공지된 다른 방법에 의해 수행할 수 있다. 글리칸 생합성, 및/또는 글리코실화를 겪는 당단백질을 제공할 수 있는 본 발명의 글리코실트랜스퍼라제는 특정 조직 또는 기관에서의 발현을 용이하게 하기 위해 특이적 프로모터의 제어 하에 발현될 수 있다. 비-포유동물 글리코실트랜스퍼라제 및/또는 본원에 기재된 당단백질의 목적하는 폴리펩티드를 코딩하는 DNA 서열, 예를 들어 전장 단백질을 코딩하는 게놈 서열 또는 cDNA가 목적하는 식물 내로 도입될 수 있는 재조합 발현 카세트를 구성하기 위해 사용될 수 있다.
예를 들어, 서열 1, 8, 10, 13, 15 및 17과 같은 서열을 포함하는 본원에 기재된 바와 같은 단리된 핵산은 당업계에 공지된 기술에 따라 식물 내로 도입될 수 있다. 일반적으로, 식물 세포의 형질전환에 적합한 상기 설명된 바와 같은 재조합 발현 카세트가 제조된다. 이어서, 본원에 기재된 단리된 핵산은 형질전환을 위해 사용될 수 있다. 상기 방식으로, 유전자 변형 식물, 식물 세포, 식물 조직, 종자 등을 얻을 수 있다.
형질전환 프로토콜은 형질전환을 위해 표적으로 하는 식물 세포의 종류, 즉, 외떡잎식물 또는 쌍떡잎식물에 따라 변할 수 있다. 식물 세포를 형질전환시키기 위한 적합한 방법은 미세주사 (Crossway et al. (1986) Biotechniques 4:320-334), 전기천공 (Riggs et al. (1986) Proc. Natl. Acad. Sci. USA 83: 5602-5606), 아그로박테리움-매개 형질전환 (예를 들어, 미국 특허 5,981,840 (Zhao et al.); [Hinchee et al. (1988) Biotechnology 6: 915-921] 참조), 직접 유전자 전달 (Paszkowski et al. (1984) EMBO J. 3:2717-2722], 및 탄도 (ballistic) 입자 가속 (예를 들어, 미국 특허 4,945,050 (Sanford et al); [Tomes et al. (1995) "Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment" In Gamborg and Phillips (Eds.) Plant Cell, Tissue and Organ Culture: Fundamental Methods, Springer-Verlag, Berlin (1995)]; 및 [McCabe et al. (1988) Biotechnology 6:923-926])을 포함한다.
형질전환된 세포는 종래의 방법에 따라 식물로 성장시킬 수 있다 (예를 들어, [McCormick et al. (1986) Plant Cell Reports, 5: 81-84] 참조). 이어서, 이들 식물을 성장시키고, 동일한 형질전환된 품종 또는 상이한 품종으로 수분시킬 수 있고, 목적하는 표현형 특징을 갖는 생성되는 하이브리드를 확인할 수 있다. 대상 표현형 특징이 안정적으로 유지되고 유전되는지 보장하기 위해 2개 이상의 세대를 성장시킬 수 있고, 이어서 목적하는 표현형 또는 다른 특성이 달성되는지 보장하기 위해 종자를 수확할 수 있다.
트랜스제닉 식물 재생
식물 발현 벡터를 사용하여 형질전환된 식물 세포는 표준 식물 조직 배양 기술에 따라 예를 들어, 단일 세포, 유합 조직 또는 엽 절편 (leaf disc)으로부터 재생시킬 수 있다. 거의 모든 식물로부터의 다양한 세포, 조직 및 기관이 전체 식물을 재생하기 위해 성공적으로 배양될 수 있음이 당업계에 잘 공지되어 있다. 배양된 원형질체로부터 식물의 재생은 문헌 ([Evans et al., Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, Macmillan Publishing Company, New York, pp. 124-176 (1983)]; 및 [Binding, Regeneration of Plants, Plant Protoplasts, CRC Press, Boca Raton, pp. 21-73 (1985)]에 기재되어 있다.
잎 절편체 (explant)로부터 아그로박테리움에 의해 도입된 외래 유전자를 함유하는 식물의 재생은 문헌 [Horsch et al., Science, 227: 1229-1231 (1985)]에 기재된 바와 같이 달성할 수 있다. 상기 절차에서, 형질전환체는 선택제의 존재 하에 및 문헌 [Fraley et al., Proc. Natl. Acad. Sci. (U.S.A.) 80: 4803 (1983)]에 기재된 바와 같이 형질전환되는 식물 종에서 싹의 재생을 유도하는 배지 내에서 성장시킨다. 상기 절차는 전형적으로 2 내지 4주 내에 싹을 생산시키고, 이어서, 이들 형질전환체 싹을 선택제 및 세균 성장을 억제하기 위해 항생제를 함유하는 적절한 뿌리-유도 배지로 전달한다. 본 발명의 트랜스제닉 식물은 생식가능하거나 불임성일 수 있다.
재생은 또한 식물 유합 조직, 절편체, 기관 또는 그의 일부분으로부터 얻을 수 있다. 상기 재생 기술은 일반적으로 문헌 [Klee et al., Annu Rev Plant Phys. 38: 467-486 (1987)]에 기재되어 있다. 단일 식물 원형질체 또는 다양한 절편체로부터 식물의 재생은 당업계에 잘 공지되어 있다 (예를 들어, [Methods for Plant Molecular Biology, A. Weissbach and H. Weissbach, eds., Academic Press, Inc., San Diego, Calif. (1988)] 참조). 상기 재생 및 성장 과정은 형질전환체 세포 및 싹의 선택, 형질전환체 싹의 발근, 토양에서 모종의 성장의 단계를 포함한다. 옥수수 세포 배양 및 재생에 관해서는, 일반적으로 문헌 [The Maize Handbook, Freeling and Walbot, Eds., Springer, New York (1994)]; [Com and Corn Improvement, 3rd edition, Sprague and Dudley Eds., American Society of Agronomy, Madison, Wisconsin (1988)]을 참조한다.
재조합 발현 카세트는 트랜스제닉 식물 내에 안정적으로 포함되고 작동가능한 것이 확인된 후, 유성 교배에 의해 다른 식물 내로 도입될 수 있음을 당업자는 알 것이다. 교배시킬 종에 따라 임의의 많은 표준 육종 기술이 사용될 수 있다. 영양 번식되는 작물에서, 성숙한 트랜스제닉 식물은 삽목 (cutting)을 취함으로써 또는 다수의 동일한 식물을 생산하기 위해 조직 배양 기술에 의해 번식시킬 수 있다.
바람직한 트랜스제닉 식물의 선택의 이루어지고, 새로운 변종을 얻고 바람직하게는 상업적인 용도를 위해 영양 번식시킨다. 종자 번식되는 작물에서, 성숙한 트랜스제닉 식물은 자가 교배되어 동종접합성 순계 (inbred) 식물을 생산할 수 있다. 순계 식물은 새로 도입된 이종 핵산을 함유하는 종자를 생산한다. 이들 종자는 성장되어 선택된 표현형을 생성할 식물을 생산할 수 있다.
재생된 식물, 예를 들어 꽃, 종자, 잎, 가지, 열매 등으로부터 얻은 일부분은 이들 일부분이 본원에 기재된 단리된 핵산을 포함하는 세포를 포함한다면 본 발명에 포함된다. 재생된 식물의 자손체와 변이체 및 돌연변이체가 또한 이들 일부분이 도입된 핵산 서열을 포함한다면 본 발명의 범위 내에 포함된다.
선택가능 마커를 발현하는 트랜스제닉 식물을 예를 들어, 표준 면역블롯 및 DNA 검출 기술에 의해 본원에 기재된 핵산의 전달에 대해 스크리닝할 수 있다. 트랜스제닉 주는 또한 전형적으로 이종 핵산의 발현 수준에 대해 평가된다. 발현-양성 식물을 확인하고 정량하기 위해 RNA 수준에서 발현을 초기에 결정할 수 있다. RNA 분석을 위한 표준 기술을 사용할 수 있고, 이종 RNA 템플레이트만을 증폭시키기 위해 설계된 올리고뉴클레오티드 프라이머를 사용하는 PCR 증폭 분석 및 이종 핵산-특이적 프로브를 사용하는 용액 혼성화 분석을 포함한다. 이어서, RNA 양성 식물을 본원에 기재된 특이적 반응성 항체를 사용하는 웨스턴 (Western) 면역블롯 분석에 의해 단백질 발현에 대해 분석할 수 있다. 또한, 트랜스제닉 조직 내에서 발현의 부위를 국재화하기 위해 각각 이종 핵산 특이적 폴리뉴클레오티드 프로브 및 항체를 사용하여 표준 프로토콜에 따른 계내 (in situ) 혼성화 및 면역세포화학을 수행할 수 있다. 일반적으로, 가장 적절한 발현 프로필을 갖는 식물을 확인하고 선택하기 위해 도입된 핵산에 대해 많은 트랜스제닉 주가 스크리닝된다.
특정 실시태양에서, 부가된 이종 핵산에 대해 동종접합성인 트랜스제닉 식물; 즉, 2개의 부가된 핵산 서열 (염색체 쌍의 각각의 염색체 상의 동일한 로커스에서 하나의 유전자)을 함유하는 트랜스제닉 식물을 제공한다. 동종접합성 트랜스제닉 식물은 단일 첨가된 이종 핵산을 함유하는 이종접합성 트랜스제닉 식물을 유성 교배시키고 (자가수분시키고), 생산된 종자의 일부를 발아시키고, 생산된 생성되는 식물을 대조 식물 (즉, 천연, 비-트랜스제닉)에 비해 본원에 기재된 폴리뉴클레오티드의 변경된 발현에 대해 분석함으로써 얻을 수 있다. 모 식물에 대한 역교배 및 비-트랜스제닉 식물과의 이종교배가 또한 고려된다.
특정 실시태양에서, (a) 식물 또는 식물 세포의 게놈 내로 DNA의 삽입 (상기 DNA는 본원에 기재된 바와 같이 임의로 포유동물 N-말단 서열로 연장된, 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 서열을 포함하거나, 그의 CTS가 본원에 기재된 바와 같이 또다른 골지체에 국재화된 단백질의 것으로 교체된 GalT 또는 그의 효소 활성 유도체 또는 일부분을 코딩하고, 바람직하게는 그의 N-연결된 글리칸의 갈락토실화를 요구하는 적어도 하나의 포유동물 단백질에 추가로 상기 DNA는 상기 식물 또는 상기 식물 세포 내에서 발현가능한 적어도 하나의 선택 마커를 추가로 코딩한다), (b) (a)에 따른 상기 DNA를 흡수한 트랜스제닉 식물 또는 식물 세포의 선택; 및 (c) 적합한 배양 배지 내에서 목적하는 트랜스제닉 식물 또는 목적하는 트랜스제닉 식물 세포의 배양을 포함하는, 트랜스제닉 식물 또는 트랜스제닉 식물 세포의 생산 방법을 제공한다. 당업자는 상기 단백질을 코딩하는 핵산 분자에 관련하여 용어 "갈락토실화된 N-연결된 글리칸을 포함하는 단백질"은 단지 폴리펩티드를 코딩하는 반면, 갈락토실화된 N-연결된 글리칸은 골지에서 단백질의 처리 결과임을 이해할 것이다.
일부 실시태양에서, 재조합 GalT 단백질, 및 갈락토실화된 N-연결된 글리칸을 포함하는 단백질을 발현하는 트랜스제닉 식물을 생산하기 위한 추가의 방법을 제공한다. 상기 방법은 예를 들어, 본원에 기재된 트랜스제닉 식물을 다른 식물과 교배시키고, 상기 교잡으로부터 자손체를 수확하고, 재조합 GalT 단백질을 발현하고 재조합 포유동물 당단백질, 특히 갈락토실화된 N-글리칸, 또는 그의 기능적 단편을 포함하는 단백질을 발현하는 목적하는 자손체 식물을 선택하는 것을 포함할 수 있다.
단백질의 정제
특정 실시태양에서, 목적하는 당단백질 또는 그의 기능적 단편을 얻기 위한 방법은 본원에 기재된 식물을 상기 식물이 수확가능 단계에 도달할 때까지 재배하고, 식물을 수확 및 분별하여 분별된 식물 물질을 얻고, 상기 당단백질을 상기 분별된 식물 물질로부터 적어도 부분적으로 단리하는 것을 포함한다. 특정 실시태양에서, 목적하는 당단백질 또는 그의 기능적 단편을 얻기 위한 방법은 식물 세포를 발효기 내에서 세포 배양액 내에서, 상기 세포 배양액이 수확가능 단계에 도달하거나 목적하는 당단백질이 배지로부터 수집될 수 있을 때까지 성장시키는 것을 포함한다. 예를 들어, 항체, 백신, 사이토킨 및 호르몬과 같은 본원에 기재된 당단백질은 당업자에게 잘 공지된 표준 기술에 의해 정제할 수 있다. 상기 재조합 방식으로 생산된 단백질은 직접 발현되거나 융합 단백질로서 발현될 수 있다. 재조합 단백질은 세포 용해 (예를 들어, 초음파 처리, 세포파쇄기 (French press)) 및 친화도 크로마토그래피 또는 다른 친화도-기반 방법의 조합에 의해 정제된다. 융합 생성물에 대해, 적절한 단백분해 효소를 사용하는 융합 단백질의 후속적인 소화로 목적하는 재조합 단백질을 방출시킨다.
본원에 기재된 단백질 (재조합 또는 합성)은 세제 가용화, 황산암모늄과 같은 물질을 사용한 선택적인 침전, 칼럼 크로마토그래피, 면역정제 방법 등을 포함한 당업계에 잘 공지된 표준 기술에 의해 실질적인 순도로 정제될 수 있다 (예를 들어, 문헌 [R. Scopes, Protein Purification: Principles and Practice, Springer-Verlag: New York (1982)]; [Deutscher, Guide to Protein Purification, Academic Press (1990)] 참조). 예를 들어, 항체는 본원에 기재된 바와 같은 단백질에 대해 생성될 수 있다. 이. 콜라이로부터의 정제는 미국 특허 4,511,503에 기재된 절차에 따라 수행할 수 있다. 이어서, 단백질은 단백질을 발현하는 세포로부터 단리되고, 본원에 기재된 바와 같은 표준 단백질 화학 기술에 의해 추가로 정제될 수 있다. 발현된 단백질의 검출은 당업계에 공지된 방법에 의해 달성되고, 예를 들어, 방사성 면역분석, 웨스턴 블로팅 기술 또는 면역침전을 포함한다.
[실시예]
실시예 1:
추정 비-포유동물 β1,4 GalT의 확인
β-1,4-갈락토실트랜스퍼라제 (GalT)의 패밀리는 적어도 7개의 멤버를 포함하고, 그 중 몇몇은 클로닝되었지만 단지 소수만이 특성이 결정되었다. 인간 및 소 기원의 β-1,4-갈락토실트랜스퍼라제가 가장 잘 특성이 결정되었고, N-글리칸 상의 말단 GlcNAc 잔기에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 것으로 보였다. 상동성에 기반한 비-포유동물 종 유전자 서열 사이에서 N-글리코실화에 관여하는 추정 GalT 유전자가 확인되었다. 도 1은 포유동물 GalT 유전자 서열 (인간, 마우스 및 소) 및 비-포유동물 추정 GalT 유전자 서열 (닭, 제브라피시 및 개구리)의 Clustal W 정렬을 보여준다. 특히, 세포기질성이고 막횡단 구역 (TM, 상자표시, 점선)에 인접하고, 골지-국재화에 관여하는 것으로 추정되는 포유동물 아미노 말단 (상자표시, 실선)은 예를 들어 닭 및 제브라피시와 같은 비-포유동물 기원으로부터의 GalT 동족체 내에 보존되지 않는다 (도 1 참조).
골지-국재화는 GalT 활성에 중요한 것으로 생각되고, 이는 '후기' (아마도 트랜스-골지)일 수 있고, 이는 GalT 촉매 활성이 식물에서 예를 들어, Man-I, GnT-I, Man-II, GnT-II, XyIT 및 FucT와 같은 다른 글리코실트랜스퍼라제의 작용 후에 일어나 2-안테나형 N-글리칸을 생산하는 것을 의미하거나, GalT 촉매 활성은 Man-II, XyIT 및 FucT의 활성 전인 '초기' (시스 (cis)/메디알 (medial)-골지)에 일어나서 이들 효소의 활성을 방지하여, 푸코스 및 자일로스가 결여되는 식물 하이브리드형 N-글리칸을 생산할 수 있다.
예를 들어 닭 및 제브라피시로부터 유래된 비-포유동물 GalT 동족체는 특히 식물에서 외인성으로 발현될 때 N-글리칸 상의 말단 GlcNAc 잔기에 갈락토스 잔기를 β-1,4-연결로 부가하는 그들의 능력에 대해 이전에 특성이 결정되지 않았다. 2-안테나형 또는 하이브리드형 N-글리칸의 생산에 대한 상이한 포유동물 아미노 말단의 영향 (세포내 국재화에 영향을 줄 수 있는) 및 식물에서 비-포유동물 GalT 동족체에 융합되어 발현될 때 식물-특이적 푸코스 및 자일로스 잔기를 N-글리칸에 부가하는 것에 대한 효과도 조사되지 않았다.
각각의 닭 및 제브라피시에 대한 3개의 GalT 구성체를 클로닝하고, N-글리코실화 활성에 대해 시험하였다: a) 야생형의 비-포유동물 닭 및 제브라피시 β-1,4-GalT1; b) 비-포유동물 닭 및 제브라피시 β-1,4-GalT1에 대한 13개 아미노산의 보존된 포유동물 (인간) 아미노 말단 (도 1 참조) 연장부의 융합 단백질; 및 c) 닭 및 제브라피시 β-1,4-GalT1의 아미노 말단을 래트 시알릴트랜스퍼라제의 CTS로 교체한, 비-포유동물 닭 및 제브라피시 β-1,4-GalT1에 대한 래트 시알릴트랜스퍼라제 유전자로부터 유래된 포유동물 세포기질 테일 및 막횡단 도메인 (CTS)의 융합 단백질 (실시예 2 및 3 참조).
실시예 2:
전장 닭 β-1,4-GalT1 효소를 코딩하는 유전자 및 그의 변이체의 클로닝 및 발현.
추정되는 닭 β-1,4-GalT1 (GGal; GenBank 기탁 번호 U19890; SEQ Ggal, 서열 2)은 일찍이 클로닝되었지만, N-글리칸을 갈락토실화할 수 있는 것으로 밝혀지지 않았다 (Shaper et al., J Biol Chem 272, 31389-31399, 1997). 본 발명자들의 실험실에서, 잔기 114 내지 362를 포함하는 cDNA 단편 (SEQ GgGal114-362, 서열 3)을 프라이머 GgalLEEVAST 및 GgGaldw (표 1 참조)를 사용하는 RT-PCR을 이용하여 닭 비장 총 RNA로부터 증폭시켰다. C-말단을 함유하는 생성되는 단편을 Xho I 및 Bam HI로 소화시킨 후, 플라스미드 pCASeco 내로 클로닝하였고, 상기 플라스미드는 다중 클로닝 부위에 측면이 접하는 Hin dIII 및 Eco RI 부위가 사용되어 백본에서 이들 2개의 부위 및 Eco 31I-부위를 동시에 제거하면서 서열 SEQ CASeco를 삽입시킨 pUC19 유도체이다. 상기 플라스미드 pCASeco를 C-말단 GGal 단편을 수용하도록 Xho I 및 Bam HI로 소화시켜 클론 GgGalC를 생성하였다.
GGal의 N-말단을 함유하고 잔기 1 내지 113을 포함하는 cDNA 단편을 긴 올리고로부터 PCR-기반 방법을 이용하여 합성 방식으로 생산하였다. 천연 cDNA 단편의 GC-풍부 특성은 간단한 RT-PCR 클로닝을 제한하였고, 야생형 서열에 비해 아미노산 변경이 없는 상기 단편의 코돈 최적화된 버전 (SEQ GgGalsyn, 서열 6)을 야생형 GGal 아미노산 서열 (SEQ Ggal, 서열 2)를 코딩하는 유전자 (SEQ GgGalhybr, 서열 1)를 생성하도록 하는 방식으로 SEQ GgGal114-362를 코딩하는 클론 GgGalC와 조합시켰다. 이어서, SEQ GgGalhybr 하에 설명된 유전자를 출발 물질로서 사용하여 2개의 변이체를 생성하였다 (하나에서는 그의 N-말단이 전장 인간 β-1,4-GalT1 (GenBank 기탁 번호 NM_001497)의 13개의 아미노산 잔기를 코딩하는 서열로 연장되고, 다른 하나에서는 GGal의 촉매 도메인을 포함하는 잔기 40 내지 362를 코딩하는 단편이 잔기 1 내지 53을 포함하는 래트 α-2,6-시알릴트랜스퍼라제 (SialT; GenBank 기탁 번호 M18769) N-말단 도메인의 C-말단에 융합되어, 세포기질 테일, 막횡단 도메인, 및 스템 구역의 일부분을 포함한다). 래트 SialT-유래 서열은 야생형 서열에 비해 하나의 침묵 돌연변이를 함유한다.
13개의 아미노산 N-말단 연장부를 갖는 GGal을 GGal을 코딩하는 하이브리드 클론 (SEQ GgGalhybr, 서열 1)으로부터 올리고 HsGgGalstart 및 M13 정방향 프라이머 (표 1)를 사용하는 PCR을 이용하여 제조하였다. 생성되는 PCR 단편을 Bpi I 및 Xba I로 소화시키고, 마찬가지로 소화시킨 GGal 클론 내로 클로닝하였다. 생성되는 클론은 SEQ HsGGal (서열 8)을 갖는 유전자를 함유한다.
래트 SialT N-말단 도메인을 갖는 변이체는 완전 GGal을 코딩하는 클론 (SEQ GgGalhybr, 서열 1)으로부터 올리고 GgGal142 및 M13 정방향 프라이머 (표 1)를 사용하는 PCR을 이용하여 제조하였다. 생성되는 단편을 Eco 31I 및 Bam HI로 소화시키고, Nco I 및 Bam HI로 소화시킨 래트 서열을 함유하는 pCASeco 플라스미드 내로 클로닝하였다. 생성되는 클론은 SEQ sialGGal (서열 10)를 갖는 유전자를 함유한다.
3개의 상이한 GGal 유전자를 함유하는 식물 형질전환 벡터는 먼저 Eco 31I 및 Bam HI로 소화시킨 유전자를 Nco I 및 Bam HI로 소화시킨 벡터 pRAP40 내로 클로닝시켜, 유전자가 향상된 CaMV 35S 프로모터 및 AMV 번역 인핸서의 하류에 존재하도록 함으로써 제조하였다. pRAP40은 향상된 CaMV 35S 프로모터, 및 프로모터의 상류에서 Asc I 부위와 터미네이터의 하류에서 Pac I 부위와 측면이 접하는 nos 터미네이터를 함유하는 pUC19 유도체이고; 측면이 접하는 제한 부위를 포함하는 전체 카세트는 SEQ RAP40 (서열 12) 아래에 설명된다. 이어서, 프로모터, 3개의 유전자 중 하나 및 터미네이터를 포함하는 3개의 카세트의 각각을 다중 클로닝 부위의 Eco RI 및 Hin dIII 부위가 각각 Pac I 및 Asc I로 교체된 2원 벡터 pMOG22의 변형된 버전에 따로 전달하였다 (Goddijn et al., 1993, Plant J 4:863-873). 이를 위해, pRAP-유래 클론을 Pac I 및 Asc I로 소화시킨 후, Asc-Pac 소화시킨 2원 벡터 내로 클로닝시켜, 식물 형질전환을 위해 준비된 3개의 상이한 벡터를 제공하였다. 니코티아나 타바쿰의 아그로박테리움 투메파시엔스 (Agrobacterium tumefaciens)-매개 형질전환 후에, GGal 또는 그의 변이체를 발현하는 트랜스제닉 식물은 예를 들어 바커 (Bakker) 등에 의해 이전에 설명된 방법 ([Proc Natl Acad Sci U S A 98:2899-904, 2001] 및 [Proc Natl Acad Sci U S A 103:7577-82, 2006])을 사용하여 형질전환체에 의해 합성된 N-글리칸을 분석함으로써 선택하였다.
닭 유전자를 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 MALDI-TOF 분석의 결과 (도 2를 참조하고, 도 4의 우측 칼럼 및 표 3에 요약됨)는 13개의 아미노산 연장부 (HsGGal, 서열 8) 또는 SialT-CTS (sialGGal, 서열 10) 발현을 갖는 닭 유전자 서열만이 갈락토스 잔기를 갖는 전체 2-안테나형 N-글리칸을 생산함을 보여준다. 야생형 닭 GalT 유전자의 발현은 하이브리드형 N-글리칸만을 생성시킨다. 13개 아미노산의 연장부 (HsGGal, 서열 8) 또는 SialT-CTS (sialGGal, 서열 10) 모두의 닭 GalT는 일부 하이브리드형 갈락토실화된 N-글리칸을 또한 갖는다.
특히, 3개의 상이한 GGal 유전자의 발현은 2개의 GlcNAc 잔기로 끝나는 2-안테나형 N-글리칸의 거의 완전한 결여를 일으키고 (표 3 및 도 4, 상부 패널, 우측 칼럼 참조), 대신에 하나의 갈락토스를 갖고 자일로스 및 푸코스가 둘다 결여되는 하이브리드형 갈락토실화된 N-글리칸이 특히 야생형 닭 GalT의 발현을 위해 우세하다 (도 4, 중간 패널, 우측 칼럼 참조). 상기 N-글리칸 생산의 패턴은 인간 GalT 또는 제브라피시로부터의 GalT로 형질전환된 식물에서 얻은 것과 현저하게 상이하다 (각각 표 3 및 도 4의 좌측 및 중간 칼럼 참조 및 아래 참조).
β-1,2-자일로스 및 β1,3-푸코스 잔기는 포유동물의 당단백질에 부착되지 않고, 알레르겐으로서 작용하므로, 식물-특이적 자일로스 및 푸코스 잔기의 감소, 또는 야생형 닭 GalT가 식물에서 발현될 때 하이브리드형 갈락토실화된 N-글리칸에서 보이는 것과 같은 그의 완전 결여가 예를 들어 외인성 치료 당단백질을 생산할 때 바람직하다.
실시예 3:
전장 제브라피시 β-1,4-GalT1 효소 및 그의 변이체를 코딩하는 유전자의 클로닝 및 발현.
추정 제브라피시 β-1,4-GalT1 ([Machingo et al, Dev Biol 297, 471-82, 2006]; NM_001017730)은 확인되었지만 그의 기능은 입증되지 않았고, 본 발명자들은 그러한 확인이 부정확한 것으로 생각한다. 전체 제브라피시 총 RNA로부터 출발하여, 전장 DGal 유전자 (SEQ Dgal, 서열 13)를 프라이머 DrGalup 및 DrGaldw (표 2 참조)를 사용하는 RT-PCR을 이용하여 증폭시켰다. 생성되는 단편을 Xba I 및 Bam HI로 소화시킨 후, 마찬가지로 소화시킨 플라스미드 pCASeco (상기 참조) 내로 클로닝하였다. 서열 결정 결과, 이것이 여기에 보인 바와 같은 3개의 돌연변이 (+1에서 출발하고, 비-침묵 돌연변이에 밑줄을 침), 즉 T126C, T230G, G862C에도 불구하고 비확인된 Genbank 기탁 번호 NM_001077259와 실질적으로 동일함을 보여주었다. Dgal (SEQ Dgal, 서열 14)를 공개된 추정 제브라피시 β-1,4-GalT1 ([Machingo et al, Dev Biol 297, 471-82, 2006]; NM_0017730)과 아미노산 서열 비교하면, 특히 N-말단 (골지-국재화에 관여되는 것으로 생각됨) 및 C-말단 (본 발명의 클론이 유의하게 더 길다)에서 아미노산 수준에서의 서열 상동성이 거의 없음을 보여주었다 (도 5 참조).
13개 아미노산의 N-말단 연장부를 갖는 DGal를 올리고 HsDrup 및 DrGaldw (표 2)를 사용하는 PCR을 이용하여 DGal (SEQ Dgal, 서열 13)을 코딩하는 클론으로부터 제조하였다. 생성되는 PCR 단편을 Ace I 및 Bpi I로 소화시키고, 마찬가지로 소화시킨 DGal 클론 내로 클로닝하였다. 생성되는 클론은 SEQ HsDGal (서열 15)를 갖는 유전자를 함유한다.
래트 SialT N-말단 도메인을 갖는 변이체를 완전 DGal (SEQ Dgal, 서열 13)을 코딩하는 클론으로부터 올리고 DrGal160 및 DrGaldw (표 2)를 사용하는 PCR을 이용하여 제조하였다. 생성되는 단편을 Bpi I 및 Bam HI로 소화시키고, Nco I 및 Bam HI로 소화시킨 래트 서열을 함유하는 pCASeco 플라스미드 내로 클로닝하였다. 생성되는 클론은 래트 SialT 유전자 (SEQ sialDGal, 서열 17)의 N-말단에 융합된 DGal 촉매 도메인을 함유한다.
3개의 상이한 DGal 유전자를 함유하는 식물 형질전환 벡터는 먼저 Eco 311 및 Bam HI로 소화시킨 유전자를 Nco I 및 Bam HI로 소화시킨 벡터 pRAP40 내로 클로닝시켜 유전자가 향상된 CaMV 35S 프로모터의 하류에 존재하도록 함으로써 제조하였다. 이어서, 프로모터, 3개의 유전자 중 하나 및 터미네이터를 포함하는 3개의 카세트의 각각을 다중 클로닝 부위의 Eco RI 및 Hin dIII 부위가 각각 Pac I 및 Asc I로 교체된 2원 벡터 pMOG22의 변형된 버전에 따로 전달하였다 (Goddijn et al., 1993, Plant J 4:863-873). 이를 위해, pRAP-유래 클론을 Pac I 및 Asc I로 소화시킨 후, Asc-Pac 소화시킨 2원 벡터 내로 클로닝시켜, 식물 형질전환을 위해 준비된 3개의 상이한 벡터를 제공하였다. 니코티아나 타바쿰의 아그로박테리움 투메파시엔스-매개 형질전환 후에, DGal 또는 그의 변이체를 발현하는 트랜스제닉 식물을 예를 들어 바커 등에 의해 이전에 설명된 방법 ([Proc Natl Acad Sci U S A 98:2899-904, 2001] 및 [Proc Natl Acad Sci U S A 103:7577-82, 2006])을 사용하여 형질전환체에 의해 합성된 N-글리칸을 분석함으로써 선택하였다.
제브라피시 GalT 유전자 서열을 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 MALDI-TOF 분석 결과 (도 3을 참조하고, 도 4의 중간 칼럼 및 표 3에 요약됨)는 야생형 제브라피시 GalT 유전자 서열의 발현이 일부 하이브리드형 갈락토실화된 N-글리칸뿐만 아니라 또한 2개의 갈락토스를 갖는 완전 2-안테나형 N-글리칸을 생성시킴을 보여준다. 식물에 따라, 일부 식물은 제브라피시 야생형 GalT 유전자 서열의 발현 시에 갈락토실화된 2-안테나형 N-글리칸만을 갖는다 (도 3, 최상부 대 상부 패널로부터 2번째 참조). 이중 갈락토실화된 2-안테나형 N-글리칸의 양은 13개 아미노산의 N-말단 인간 GalT (HsDGal, 서열 15) 또는 SialT-CTS-GalT (sialDGal, 서열 17)에 의해 유의하게 증가할 수 있고, 후자는 최고량의 갈락토실화된 2-안테나형 N-글리칸을 갖는다 (표 3과 도 4의 하부 패널, 중간 칼럼 참조).
특히, 담배에서 Sial-CTS-제브라피시 GalT의 발현을 통해 얻은 이중-갈락토실화된 2-안테나형 N-글리칸의 갈락토실화는 SialT-CTS-인간 GalT에 비해 SialT-CTS-제브라피시 GalT에서 50% 증가한다 (각각 표 3과 도 4의 하부 패널, 중간 칼럼 및 좌측 칼럼 참조). Sial-CTS-제브라피시 GalT는 45%까지의 하나 이상의 갈락토스 잔기를 갖는 총 N-글리칸을 생산한다 (표 3 참조).
Sial-CTS-제브라피시 GalT가 식물에서 발현될 때 2-안테나형 N-글리칸에서 보이는 것과 같은 하나 이상의 갈락토스 잔기를 갖는 총 N-글리칸의 높은 수율은 예를 들어, 외인성 치료 당단백질을 생산할 때 바람직하다. 표 1은 실시예 1에서 사용된 올리고뉴클레오티드 (5'에서 3'으로)를 보여준다.
SEQ GgGalhybr (서열 1):
SEQ Ggal (서열 2):
SEQ GgGal114-362 (서열 3):
SEQ GgGal114-362 (서열 4):
SEQ CASeco (서열 5):
SEQ GgGalsyn (서열 6):
SEQ GgGalsyn (서열 7):
SEQ HsGGal (서열 8):
SEQ HsGgGal (서열 9):
SEQ sialGGal (서열 10):
SEQ sialGGal (서열 11):
SEQ RAP40 (서열 12):
SEQ Dgal (서열 13):
SEQ Dgal (서열 14):
SEQ HsDGal (서열 15):
SEQ HsDGal (서열 16):
SEO sialDGal (서열 17):
SEQ sialDGal (서열 18):
SEQ CTS sialT (서열 19):
SEQ CTS sialT (서열 20):
N-말단의 13개 아미노산 잔기, 인간 β-1,4-갈락토실트랜스퍼라제 1 (서열 21)
MRLREPLLSGSAA
SEQUENCE LISTING P0850.70007WO00
<110> Plant Research International B.V.
<120> Mammalian-type glycosylation in plants by expression of
non-mammalian glycosyltransferases
<130> P80213EP00
<140> EP 07106337.4
<141> 2007-04-17
<160> 29
<170> PatentIn version 3.3
<210> 1
<211> 1089
<212> DNA
<213> Gallus domesticus
<220>
<221> CDS
<222> (1)..(1089)
<400> 1
atg aag gag cca gcc ctc cca ggt aca tca ctt cag agg gct tgc agg 48
Met Lys Glu Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg
1 5 10 15
ctc ctc gtc gct ttc tgt gca ctt cac ctc tct gca act ctg ctc tac 96
Leu Leu Val Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr
20 25 30
tac ctc gca ggt agt tct ctc acg cca cct aga agt cct gaa cct cca 144
Tyr Leu Ala Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro
35 40 45
cct aga cga cca cct cca gct aac ctc tct ctt cca cca tct aga cca 192
Pro Arg Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro
50 55 60
cct cct cca cct gct gca cgt cca cga cct gga cct gtt tca gca caa 240
Pro Pro Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln
65 70 75 80
cca cgt aac ctc cca gac tct gct cca tct gga ctt tgt cct gac cct 288
Pro Arg Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro
85 90 95
tct cca ctt ctc gtc gga cca ctt aga gtt gag ttc tct cag cct gtg 336
Ser Pro Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val
100 105 110
aac ctc gag gag gtg gcg agc aca aac cct gag gtc agg gag gga ggt 384
Asn Leu Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly
115 120 125
cgt ttt gct cca aag gac tgc aag gcg ctg cag aaa gta gca atc atc 432
Arg Phe Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile
130 135 140
atc ccg ttc cga aac cga gag gag cat ctg aag tac tgg ctc tat tac 480
Ile Pro Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr
145 150 155 160
atg cac cca att ctt caa agg cag cag cta gat tat gga gtg tat gtc 528
Met His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val
165 170 175
atc aac cag gat gga gac gaa gaa ttt aac cgt gct aaa ctg ctg aat 576
Ile Asn Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn
180 185 190
gta gga ttc acg gaa gct ttg aag gag tat gac tat gac tgc ttt gtg 624
Val Gly Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val
195 200 205
ttt agt gat gta gac ctg atc cca atg gat gac agg aac acc tac aag 672
Phe Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys
210 215 220
tgc tac agc caa cca agg cac ctt tct gtc tcc atg gat aaa ttc gga 720
Cys Tyr Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly
225 230 235 240
ttt cgg tta ccc tac aat cag tat ttt gga ggt gtg tct gcc ttg agc 768
Phe Arg Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser
245 250 255
aaa gaa caa ttc acg aag atc aat ggg ttc cca aac aat tac tgg ggc 816
Lys Glu Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly
260 265 270
tgg gga ggc gaa gat gat gac atc tac aac agg ctg gtg ttc aaa ggc 864
Trp Gly Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly
275 280 285
atg ggc ata tct cgg cca gat gct gtc att ggg aaa tgc aga atg att 912
Met Gly Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile
290 295 300
cgc cac tcg cgt gat cgg aag aac gag ccc aac ccg gag agg ttt gac 960
Arg His Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp
305 310 315 320
cgt att gct cac acc agg gag acg atg agc tct gat ggc ttg aac tcg 1008
Arg Ile Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser
325 330 335
ctc tcc tac gag gtg cta agg act gac agg ttc cct ctg tac acg agg 1056
Leu Ser Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg
340 345 350
atc aca gtg gat atc gga gcg ccc ggc agc tga 1089
Ile Thr Val Asp Ile Gly Ala Pro Gly Ser
355 360
<210> 2
<211> 362
<212> PRT
<213> Gallus domesticus
<400> 2
Met Lys Glu Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg
1 5 10 15
Leu Leu Val Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr
20 25 30
Tyr Leu Ala Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro
35 40 45
Pro Arg Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro
50 55 60
Pro Pro Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln
65 70 75 80
Pro Arg Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro
85 90 95
Ser Pro Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val
100 105 110
Asn Leu Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly
115 120 125
Arg Phe Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile
130 135 140
Ile Pro Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr
145 150 155 160
Met His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val
165 170 175
Ile Asn Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn
180 185 190
Val Gly Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val
195 200 205
Phe Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys
210 215 220
Cys Tyr Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly
225 230 235 240
Phe Arg Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser
245 250 255
Lys Glu Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly
260 265 270
Trp Gly Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly
275 280 285
Met Gly Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile
290 295 300
Arg His Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp
305 310 315 320
Arg Ile Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser
325 330 335
Leu Ser Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg
340 345 350
Ile Thr Val Asp Ile Gly Ala Pro Gly Ser
355 360
<210> 3
<211> 750
<212> DNA
<213> Gallus domesticus
<220>
<221> CDS
<222> (1)..(750)
<400> 3
ctc gag gag gtg gcg agc aca aac cct gag gtc agg gag gga ggt cgt 48
Leu Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg
1 5 10 15
ttt gct cca aag gac tgc aag gcg ctg cag aaa gta gca atc atc atc 96
Phe Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile
20 25 30
ccg ttc cga aac cga gag gag cat ctg aag tac tgg ctc tat tac atg 144
Pro Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met
35 40 45
cac cca att ctt caa agg cag cag cta gat tat gga gtg tat gtc atc 192
His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile
50 55 60
aac cag gat gga gac gaa gaa ttt aac cgt gct aaa ctg ctg aat gta 240
Asn Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val
65 70 75 80
gga ttc acg gaa gct ttg aag gag tat gac tat gac tgc ttt gtg ttt 288
Gly Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe
85 90 95
agt gat gta gac ctg atc cca atg gat gac agg aac acc tac aag tgc 336
Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys
100 105 110
tac agc caa cca agg cac ctt tct gtc tcc atg gat aaa ttc gga ttt 384
Tyr Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe
115 120 125
cgg tta ccc tac aat cag tat ttt gga ggt gtg tct gcc ttg agc aaa 432
Arg Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys
130 135 140
gaa caa ttc acg aag atc aat ggg ttt cca aac aat tac tgg ggc tgg 480
Glu Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp
145 150 155 160
gga ggc gaa gat gat gac atc tac aac agg ctg gtg ttc aaa ggc atg 528
Gly Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met
165 170 175
ggc ata tct cgg cca gat gct gtc att ggg aaa tgc aga atg att cgc 576
Gly Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg
180 185 190
cac tcg cgt gat cgg aag aac gag ccc aac ccg gag agg ttt gac cgt 624
His Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg
195 200 205
att gct cac acc agg gag acg atg agc tct gat ggc ttg aac tcg ctc 672
Ile Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu
210 215 220
tcc tac gag gtg cta agg act gac agg ttc cct ctg tac acg agg atc 720
Ser Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile
225 230 235 240
aca gtg gat atc gga gcg ccc ggc agc tga 750
Thr Val Asp Ile Gly Ala Pro Gly Ser
245
<210> 4
<211> 249
<212> PRT
<213> Gallus domesticus
<400> 4
Leu Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg
1 5 10 15
Phe Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile
20 25 30
Pro Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met
35 40 45
His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile
50 55 60
Asn Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val
65 70 75 80
Gly Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe
85 90 95
Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys
100 105 110
Tyr Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe
115 120 125
Arg Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys
130 135 140
Glu Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp
145 150 155 160
Gly Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met
165 170 175
Gly Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg
180 185 190
His Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg
195 200 205
Ile Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu
210 215 220
Ser Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile
225 230 235 240
Thr Val Asp Ile Gly Ala Pro Gly Ser
245
<210> 5
<211> 121
<212> DNA
<213> Artificial
<220>
<223> CASeco
<400> 5
ggcgcgcctc gaggcgatcg cagatctatc gatgcatgcc atggtacccg ggagctcgaa 60
ttctagaagc ttctgcagac gcgtcgacgt catatggatc cgcgagagac ctcttaatta 120
a 121
<210> 6
<211> 366
<212> DNA
<213> artificial
<220>
<223> GGal N-terminus
<220>
<221> CDS
<222> (22)..(366)
<400> 6
ctcgaggaga ccgaagacaa c atg aag gag cca gcc ctc cca ggt aca tca 51
Met Lys Glu Pro Ala Leu Pro Gly Thr Ser
1 5 10
ctt cag agg gct tgc agg ctc ctc gtc gct ttc tgt gca ctt cac ctc 99
Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Phe Cys Ala Leu His Leu
15 20 25
tct gca act ctg ctc tac tac ctc gca ggt agt tct ctc acg cca cct 147
Ser Ala Thr Leu Leu Tyr Tyr Leu Ala Gly Ser Ser Leu Thr Pro Pro
30 35 40
aga agt cct gaa cct cca cct aga cga cca cct cca gct aac ctc tct 195
Arg Ser Pro Glu Pro Pro Pro Arg Arg Pro Pro Pro Ala Asn Leu Ser
45 50 55
ctt cca cca tct aga cca cct cct cca cct gct gca cgt cca cga cct 243
Leu Pro Pro Ser Arg Pro Pro Pro Pro Pro Ala Ala Arg Pro Arg Pro
60 65 70
gga cct gtt tca gca caa cca cgt aac ctc cca gac tct gct cca tct 291
Gly Pro Val Ser Ala Gln Pro Arg Asn Leu Pro Asp Ser Ala Pro Ser
75 80 85 90
gga ctt tgt cct gac cct tct cca ctt ctc gtc gga cca ctt aga gtt 339
Gly Leu Cys Pro Asp Pro Ser Pro Leu Leu Val Gly Pro Leu Arg Val
95 100 105
gag ttc tct cag cct gtg aac ctc gag 366
Glu Phe Ser Gln Pro Val Asn Leu Glu
110 115
<210> 7
<211> 115
<212> PRT
<213> artificial
<220>
<223> Synthetic Construct
<400> 7
Met Lys Glu Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg
1 5 10 15
Leu Leu Val Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr
20 25 30
Tyr Leu Ala Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro
35 40 45
Pro Arg Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro
50 55 60
Pro Pro Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln
65 70 75 80
Pro Arg Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro
85 90 95
Ser Pro Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val
100 105 110
Asn Leu Glu
115
<210> 8
<211> 1128
<212> DNA
<213> Artificial
<220>
<223> HsGGal
<220>
<221> CDS
<222> (1)..(1128)
<400> 8
atg agg ctt cgg gag cct ctc ctc agc ggc agc gcc gct atg aag gag 48
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Lys Glu
1 5 10 15
cca gcc ctc cca ggt aca tca ctt cag agg gct tgc agg ctc ctc gtc 96
Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg Leu Leu Val
20 25 30
gct ttc tgt gca ctt cac ctc tct gca act ctg ctc tac tac ctc gca 144
Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr Tyr Leu Ala
35 40 45
ggt agt tct ctc acg cca cct aga agt cct gaa cct cca cct aga cga 192
Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro Pro Arg Arg
50 55 60
cca cct cca gct aac ctc tct ctt cca cca tct aga cca cct cct cca 240
Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro Pro Pro Pro
65 70 75 80
cct gct gca cgt cca cga cct gga cct gtt tca gca caa cca cgt aac 288
Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln Pro Arg Asn
85 90 95
ctc cca gac tct gct cca tct gga ctt tgt cct gac cct tct cca ctt 336
Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro Ser Pro Leu
100 105 110
ctc gtc gga cca ctt aga gtt gag ttc tct cag cct gtg aac ctc gag 384
Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val Asn Leu Glu
115 120 125
gag gtg gcg agc aca aac cct gag gtc agg gag gga ggt cgt ttt gct 432
Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg Phe Ala
130 135 140
cca aag gac tgc aag gcg ctg cag aaa gta gca atc atc atc ccg ttc 480
Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile Pro Phe
145 150 155 160
cga aac cga gag gag cat ctg aag tac tgg ctc tat tac atg cac cca 528
Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met His Pro
165 170 175
att ctt caa agg cag cag cta gat tat gga gtg tat gtc atc aac cag 576
Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn Gln
180 185 190
gat gga gac gaa gaa ttt aac cgt gct aaa ctg ctg aat gta gga ttc 624
Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe
195 200 205
acg gaa gct ttg aag gag tat gac tat gac tgc ttt gtg ttt agt gat 672
Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser Asp
210 215 220
gta gac ctg atc cca atg gat gac agg aac acc tac aag tgc tac agc 720
Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys Tyr Ser
225 230 235 240
caa cca agg cac ctt tct gtc tcc atg gat aaa ttc gga ttt cgg tta 768
Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe Arg Leu
245 250 255
ccc tac aat cag tat ttt gga ggt gtg tct gcc ttg agc aaa gaa caa 816
Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Glu Gln
260 265 270
ttc acg aag atc aat ggg ttc cca aac aat tac tgg ggc tgg gga ggc 864
Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly
275 280 285
gaa gat gat gac atc tac aac agg ctg gtg ttc aaa ggc atg ggc ata 912
Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met Gly Ile
290 295 300
tct cgg cca gat gct gtc att ggg aaa tgc aga atg att cgc cac tcg 960
Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg His Ser
305 310 315 320
cgt gat cgg aag aac gag ccc aac ccg gag agg ttt gac cgt att gct 1008
Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg Ile Ala
325 330 335
cac acc agg gag acg atg agc tct gat ggc ttg aac tcg ctc tcc tac 1056
His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu Ser Tyr
340 345 350
gag gtg cta agg act gac agg ttc cct ctg tac acg agg atc aca gtg 1104
Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile Thr Val
355 360 365
gat atc gga gcg ccc ggc agc tga 1128
Asp Ile Gly Ala Pro Gly Ser
370 375
<210> 9
<211> 375
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 9
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Lys Glu
1 5 10 15
Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg Leu Leu Val
20 25 30
Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr Tyr Leu Ala
35 40 45
Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro Pro Arg Arg
50 55 60
Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro Pro Pro Pro
65 70 75 80
Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln Pro Arg Asn
85 90 95
Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro Ser Pro Leu
100 105 110
Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val Asn Leu Glu
115 120 125
Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg Phe Ala
130 135 140
Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile Pro Phe
145 150 155 160
Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met His Pro
165 170 175
Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn Gln
180 185 190
Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe
195 200 205
Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser Asp
210 215 220
Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys Tyr Ser
225 230 235 240
Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe Arg Leu
245 250 255
Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Glu Gln
260 265 270
Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly
275 280 285
Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met Gly Ile
290 295 300
Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg His Ser
305 310 315 320
Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg Ile Ala
325 330 335
His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu Ser Tyr
340 345 350
Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile Thr Val
355 360 365
Asp Ile Gly Ala Pro Gly Ser
370 375
<210> 10
<211> 1131
<212> DNA
<213> Artificial
<220>
<223> sialGGal
<220>
<221> CDS
<222> (1)..(1131)
<400> 10
atg att cat acc aac ttg aag aaa aag ttc agc ctc ttc atc ctg gtc 48
Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val
1 5 10 15
ttt ctc ctg ttc gca gtc atc tgt gtt tgg aag aaa ggg agc gac tat 96
Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr
20 25 30
gag gcc ctt aca ctg caa gcc aag gag ttc cag atg ccc aag agc cag 144
Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln
35 40 45
gag aaa gtg gcc atg acg cca cct aga agt cct gaa cct cca cct aga 192
Glu Lys Val Ala Met Thr Pro Pro Arg Ser Pro Glu Pro Pro Pro Arg
50 55 60
cga cca cct cca gct aac ctc tct ctt cca cca tct aga cca cct cct 240
Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro Pro Pro
65 70 75 80
cca cct gct gca cgt cca cga cct gga cct gtt tca gca caa cca cgt 288
Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln Pro Arg
85 90 95
aac ctc cca gac tct gct cca tct gga ctt tgt cct gac cct tct cca 336
Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro Ser Pro
100 105 110
ctt ctc gtc gga cca ctt aga gtt gag ttc tct cag cct gtg aac ctc 384
Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val Asn Leu
115 120 125
gag gag gtg gcg agc aca aac cct gag gtc agg gag gga ggt cgt ttt 432
Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg Phe
130 135 140
gct cca aag gac tgc aag gcg ctg cag aaa gta gca atc atc atc ccg 480
Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile Pro
145 150 155 160
ttc cga aac cga gag gag cat ctg aag tac tgg ctc tat tac atg cac 528
Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met His
165 170 175
cca att ctt caa agg cag cag cta gat tat gga gtg tat gtc atc aac 576
Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn
180 185 190
cag gat gga gac gaa gaa ttt aac cgt gct aaa ctg ctg aat gta gga 624
Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val Gly
195 200 205
ttc acg gaa gct ttg aag gag tat gac tat gac tgc ttt gtg ttt agt 672
Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser
210 215 220
gat gta gac ctg atc cca atg gat gac agg aac acc tac aag tgc tac 720
Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys Tyr
225 230 235 240
agc caa cca agg cac ctt tct gtc tcc atg gat aaa ttc gga ttt cgg 768
Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe Arg
245 250 255
tta ccc tac aat cag tat ttt gga ggt gtg tct gcc ttg agc aaa gaa 816
Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Glu
260 265 270
caa ttc acg aag atc aat ggg ttt cca aac aat tac tgg ggc tgg gga 864
Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly
275 280 285
ggc gaa gat gat gac atc tac aac agg ctg gtg ttc aaa ggc atg ggc 912
Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met Gly
290 295 300
ata tct cgg cca gat gct gtc att ggg aaa tgc aga atg att cgc cac 960
Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg His
305 310 315 320
tcg cgt gat cgg aag aac gag ccc aac ccg gag agg ttt gac cgt att 1008
Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg Ile
325 330 335
gct cac acc agg gag acg atg agc tct gat ggc ttg aac tcg ctc tcc 1056
Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu Ser
340 345 350
tac gag gtg cta agg act gac agg ttc cct ctg tac acg agg atc aca 1104
Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile Thr
355 360 365
gtg gat atc gga gcg ccc ggc agc tga 1131
Val Asp Ile Gly Ala Pro Gly Ser
370 375
<210> 11
<211> 376
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 11
Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val
1 5 10 15
Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr
20 25 30
Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln
35 40 45
Glu Lys Val Ala Met Thr Pro Pro Arg Ser Pro Glu Pro Pro Pro Arg
50 55 60
Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro Pro Pro
65 70 75 80
Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln Pro Arg
85 90 95
Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro Ser Pro
100 105 110
Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val Asn Leu
115 120 125
Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg Phe
130 135 140
Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile Pro
145 150 155 160
Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met His
165 170 175
Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn
180 185 190
Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val Gly
195 200 205
Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser
210 215 220
Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys Tyr
225 230 235 240
Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe Arg
245 250 255
Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Glu
260 265 270
Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly
275 280 285
Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met Gly
290 295 300
Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg His
305 310 315 320
Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg Ile
325 330 335
Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu Ser
340 345 350
Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile Thr
355 360 365
Val Asp Ile Gly Ala Pro Gly Ser
370 375
<210> 12
<211> 1229
<212> DNA
<213> Artificial
<220>
<223> cassette RAP40
<400> 12
ggcgcgccaa gcttgaatta attctactcc aaaaatatca aagatacagt ctcagaagac 60
caaagggcaa ttgagacttt tcaacaaagg gtaatatccg gaaacctcct cggattccat 120
tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg ctcctacaaa 180
tgccatcatt gcgataaagg aaaggccatc gttgaagatg cctctgccga cagtggtccc 240
aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 300
tcaaagcaag tggattgatg tgataattcc gcatggagtc aaagattcaa atagaggacc 360
taacagaact cgccgtaaag actggcgaac agttcataca gagtctctta cgactcaatg 420
acaagaagaa aatcttcgtc aacatggtgg agcacgacac acttgtctac tccaaaaata 480
tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa agggtaatat 540
ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg aagatagtgg 600
aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc atcgttgaag 660
atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc atcgtggaaa 720
aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc tccactgacg 780
taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata taaggaagtt 840
catttcattt ggagagggtt tttattttta attttctttc aaatacttcc accatgggcg 900
agctcggtac ccggggatcc ccgggtaccg agctcgaatt tccccgatcg ttcaaacatt 960
tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatataa 1020
tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg 1080
agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa 1140
atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt actagatcgg 1200
gaattccaga tctgcggccg cttaattaa 1229
<210> 13
<211> 1066
<212> DNA
<213> Danio rerio
<220>
<221> CDS
<222> (14)..(1066)
<400> 13
tctagaagac aac atg ccg gac tcc acc ggg aac ttc agc ctc ctg cag 49
Met Pro Asp Ser Thr Gly Asn Phe Ser Leu Leu Gln
1 5 10
cgg acc tgc tct ctg gtg gtg ctg ctg tgc ttc tta cac atc ttt gtc 97
Arg Thr Cys Ser Leu Val Val Leu Leu Cys Phe Leu His Ile Phe Val
15 20 25
acc gtc att tac tac atg agg aac tcg gac tct cgg cca gcc ttc gcc 145
Thr Val Ile Tyr Tyr Met Arg Asn Ser Asp Ser Arg Pro Ala Phe Ala
30 35 40
cag aac cag cag cag aga ccg acg ata cac agg aaa ctg gcg gag cag 193
Gln Asn Gln Gln Gln Arg Pro Thr Ile His Arg Lys Leu Ala Glu Gln
45 50 55 60
agg ggc acc act gag gac agc aga ccc gcg gcc aac gcc tcg agc aac 241
Arg Gly Thr Thr Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn
65 70 75
ggc cag gag ctg cag atc tgc cca gag gag ccg ccg cgc ctg gtg ggt 289
Gly Gln Glu Leu Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly
80 85 90
cct ctg cgt gtg gag ttc tca gac ccg atc acg tta gaa atg gtg cgg 337
Pro Leu Arg Val Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg
95 100 105
aca gag aac agt gtt ctg caa gag ggc gga cgc ttc aga ccc cca gac 385
Thr Glu Asn Ser Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp
110 115 120
tgc ata gct cgg cag aag gtg gcc atg atc atc ccc ttc cgg aac cga 433
Cys Ile Ala Arg Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg
125 130 135 140
gac gag cac ctg aag ttc tgg ctc tat tac ctg cac ccc atc ctg cag 481
Asp Glu His Leu Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln
145 150 155
cgc caa cag ctc gac tac ggc gtc tac gtc atc aac cag gat ggc gag 529
Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu
160 165 170
gac acg ttt aat cga gct aaa ctc ctg aac atc ggc tat gcg gag gcg 577
Asp Thr Phe Asn Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala
175 180 185
ctg aag gag tac gat tac gac tgt ttt gtg ttc agc gac gtg gac ctg 625
Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu
190 195 200
atc ccg atg gat gac cgc aac atc tac aag tgc tac aat cag ccc aga 673
Ile Pro Met Asp Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg
205 210 215 220
cac ctg gcc gtc tcc atg gac aag ttc ggc ttc agg ctg ccg tac aca 721
His Leu Ala Val Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr
225 230 235
cag tat ttc ggt ggc gtt tcg tcg ctc agc aaa gag cag ttc ctg aag 769
Gln Tyr Phe Gly Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys
240 245 250
atc aac gga ttc ccc aac aac tac tgg ggc tgg ggc gga gag gac gac 817
Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp
255 260 265
gac atc ttc aac agg atc tcc tcc aga ggg atg tcg ata tct agg cct 865
Asp Ile Phe Asn Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro
270 275 280
gac gga ctc ctg ggt cgc tgt agg atg atc cgg cat gag aga gac aag 913
Asp Gly Leu Leu Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys
285 290 295 300
cag aac gac cca aac cct caa aga ttt gac cga atc gcg cac aca agg 961
Gln Asn Asp Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg
305 310 315
gaa acc atg gca act gat ggg atc aat tcg cta aaa tat aac gtg gta 1009
Glu Thr Met Ala Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val
320 325 330
aaa atc gag aaa gac ctg ctc ttc acc aaa atc aca gtg gac gtg ggc 1057
Lys Ile Glu Lys Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly
335 340 345
aaa ccc tga 1066
Lys Pro
350
<210> 14
<211> 350
<212> PRT
<213> Danio rerio
<400> 14
Met Pro Asp Ser Thr Gly Asn Phe Ser Leu Leu Gln Arg Thr Cys Ser
1 5 10 15
Leu Val Val Leu Leu Cys Phe Leu His Ile Phe Val Thr Val Ile Tyr
20 25 30
Tyr Met Arg Asn Ser Asp Ser Arg Pro Ala Phe Ala Gln Asn Gln Gln
35 40 45
Gln Arg Pro Thr Ile His Arg Lys Leu Ala Glu Gln Arg Gly Thr Thr
50 55 60
Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu Leu
65 70 75 80
Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg Val
85 90 95
Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn Ser
100 105 110
Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala Arg
115 120 125
Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His Leu
130 135 140
Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln Leu
145 150 155 160
Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe Asn
165 170 175
Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu Tyr
180 185 190
Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asp
195 200 205
Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala Val
210 215 220
Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe Gly
225 230 235 240
Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly Phe
245 250 255
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
260 265 270
Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu Leu
275 280 285
Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp Pro
290 295 300
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met Ala
305 310 315 320
Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu Lys
325 330 335
Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro
340 345 350
<210> 15
<211> 1105
<212> DNA
<213> Artificial
<220>
<223> HsDGal
<220>
<221> CDS
<222> (14)..(1105)
<400> 15
tctagaagac aac atg agg ctt cgg gag ccg ctc ctg agc ggc agc gcc 49
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala
1 5 10
gcg atg ccg gac tcc acc ggg aac ttc agc ctc ctg cag cgg acc tgc 97
Ala Met Pro Asp Ser Thr Gly Asn Phe Ser Leu Leu Gln Arg Thr Cys
15 20 25
tct ctg gtg gtg ctg ctg tgc ttc tta cac atc ttt gtc acc gtc att 145
Ser Leu Val Val Leu Leu Cys Phe Leu His Ile Phe Val Thr Val Ile
30 35 40
tac tac atg agg aac tcg gac tct cgg cca gcc ttc gcc cag aac cag 193
Tyr Tyr Met Arg Asn Ser Asp Ser Arg Pro Ala Phe Ala Gln Asn Gln
45 50 55 60
cag cag aga ccg acg ata cac agg aaa ctg gcg gag cag agg ggc acc 241
Gln Gln Arg Pro Thr Ile His Arg Lys Leu Ala Glu Gln Arg Gly Thr
65 70 75
act gag gac agc aga ccc gcg gcc aac gcc tcg agc aac ggc cag gag 289
Thr Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu
80 85 90
ctg cag atc tgc cca gag gag ccg ccg cgc ctg gtg ggt cct ctg cgt 337
Leu Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg
95 100 105
gtg gag ttc tca gac ccg atc acg tta gaa atg gtg cgg aca gag aac 385
Val Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn
110 115 120
agt gtt ctg caa gag ggc gga cgc ttc aga ccc cca gac tgc ata gct 433
Ser Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala
125 130 135 140
cgg cag aag gtg gcc atg atc atc ccc ttc cgg aac cga gac gag cac 481
Arg Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His
145 150 155
ctg aag ttc tgg ctc tat tac ctg cac ccc atc ctg cag cgc caa cag 529
Leu Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln
160 165 170
ctc gac tac ggc gtc tac gtc atc aac cag gat ggc gag gac acg ttt 577
Leu Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe
175 180 185
aat cga gct aaa ctc ctg aac atc ggc tat gcg gag gcg ctg aag gag 625
Asn Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu
190 195 200
tac gat tac gac tgt ttt gtg ttc agc gac gtg gac ctg atc ccg atg 673
Tyr Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met
205 210 215 220
gat gac cgc aac atc tac aag tgc tac aat cag ccc aga cac ctg gcc 721
Asp Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala
225 230 235
gtc tcc atg gac aag ttc ggc ttc agg ctg ccg tac aca cag tat ttc 769
Val Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe
240 245 250
ggt ggc gtt tcg tcg ctc agc aaa gag cag ttc ctg aag atc aac gga 817
Gly Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly
255 260 265
ttc ccc aac aac tac tgg ggc tgg ggc gga gag gac gac gac atc ttc 865
Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe
270 275 280
aac agg atc tcc tcc aga ggg atg tcg ata tct agg cct gac gga ctc 913
Asn Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu
285 290 295 300
ctg ggt cgc tgt agg atg atc cgg cat gag aga gac aag cag aac gac 961
Leu Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp
305 310 315
cca aac cct caa aga ttt gac cga atc gcg cac aca agg gaa acc atg 1009
Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met
320 325 330
gca act gat ggg atc aat tcg cta aaa tat aac gtg gta aaa atc gag 1057
Ala Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu
335 340 345
aaa gac ctg ctc ttc acc aaa atc aca gtg gac gtg ggc aaa ccc tga 1105
Lys Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro
350 355 360
<210> 16
<211> 363
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 16
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Asp
1 5 10 15
Ser Thr Gly Asn Phe Ser Leu Leu Gln Arg Thr Cys Ser Leu Val Val
20 25 30
Leu Leu Cys Phe Leu His Ile Phe Val Thr Val Ile Tyr Tyr Met Arg
35 40 45
Asn Ser Asp Ser Arg Pro Ala Phe Ala Gln Asn Gln Gln Gln Arg Pro
50 55 60
Thr Ile His Arg Lys Leu Ala Glu Gln Arg Gly Thr Thr Glu Asp Ser
65 70 75 80
Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu Leu Gln Ile Cys
85 90 95
Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg Val Glu Phe Ser
100 105 110
Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn Ser Val Leu Gln
115 120 125
Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala Arg Gln Lys Val
130 135 140
Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His Leu Lys Phe Trp
145 150 155 160
Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly
165 170 175
Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe Asn Arg Ala Lys
180 185 190
Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu Tyr Asp Tyr Asp
195 200 205
Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn
210 215 220
Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala Val Ser Met Asp
225 230 235 240
Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe Gly Gly Val Ser
245 250 255
Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly Phe Pro Asn Asn
260 265 270
Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg Ile Ser
275 280 285
Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu Leu Gly Arg Cys
290 295 300
Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp Pro Asn Pro Gln
305 310 315 320
Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met Ala Thr Asp Gly
325 330 335
Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu Lys Asp Leu Leu
340 345 350
Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro
355 360
<210> 17
<211> 1053
<212> DNA
<213> Artificial
<220>
<223> sialDGal
<220>
<221> CDS
<222> (1)..(1053)
<400> 17
atg att cat acc aac ttg aag aaa aag ttc agc ctc ttc atc ctg gtc 48
Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val
1 5 10 15
ttt ctc ctg ttc gca gtc atc tgt gtt tgg aag aaa ggg agc gac tat 96
Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr
20 25 30
gag gcc ctt aca ctg caa gcc aag gag ttc cag atg ccc aag agc cag 144
Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln
35 40 45
gag aaa gtg gcc atg cac agg aaa ctg gcg gag cag agg ggc acc act 192
Glu Lys Val Ala Met His Arg Lys Leu Ala Glu Gln Arg Gly Thr Thr
50 55 60
gag gac agc aga ccc gcg gcc aac gcc tcg agc aac ggc cag gag ctg 240
Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu Leu
65 70 75 80
cag atc tgc cca gag gag ccg ccg cgc ctg gtg ggt cct ctg cgt gtg 288
Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg Val
85 90 95
gag ttc tca gac ccg atc acg tta gaa atg gtg cgg aca gag aac agt 336
Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn Ser
100 105 110
gtt ctg caa gag ggc gga cgc ttc aga ccc cca gac tgc ata gct cgg 384
Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala Arg
115 120 125
cag aag gtg gcc atg atc atc ccc ttc cgg aac cga gac gag cac ctg 432
Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His Leu
130 135 140
aag ttc tgg ctc tat tac ctg cac ccc atc ctg cag cgc caa cag ctc 480
Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln Leu
145 150 155 160
gac tac ggc gtc tac gtc atc aac cag gat ggc gag gac acg ttt aat 528
Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe Asn
165 170 175
cga gct aaa ctc ctg aac atc ggc tat gcg gag gcg ctg aag gag tac 576
Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu Tyr
180 185 190
gat tac gac tgt ttt gtg ttc agc gac gtg gac ctg atc ccg atg gat 624
Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asp
195 200 205
gac cgc aac atc tac aag tgc tac aat cag ccc aga cac ctg gcc gtc 672
Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala Val
210 215 220
tcc atg gac aag ttc ggc ttc agg ctg ccg tac aca cag tat ttc ggt 720
Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe Gly
225 230 235 240
ggc gtt tcg tcg ctc agc aaa gag cag ttc ctg aag atc aac gga ttc 768
Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly Phe
245 250 255
ccc aac aac tac tgg ggc tgg ggc gga gag gac gac gac atc ttc aac 816
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
260 265 270
agg atc tcc tcc aga ggg atg tcg ata tct agg cct gac gga ctc ctg 864
Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu Leu
275 280 285
ggt cgc tgt agg atg atc cgg cat gag aga gac aag cag aac gac cca 912
Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp Pro
290 295 300
aac cct caa aga ttt gac cga atc gcg cac aca agg gaa acc atg gca 960
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met Ala
305 310 315 320
act gat ggg atc aat tcg cta aaa tat aac gtg gta aaa atc gag aaa 1008
Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu Lys
325 330 335
gac ctg ctc ttc acc aaa atc aca gtg gac gtg ggc aaa ccc tga 1053
Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro
340 345 350
<210> 18
<211> 350
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 18
Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val
1 5 10 15
Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr
20 25 30
Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln
35 40 45
Glu Lys Val Ala Met His Arg Lys Leu Ala Glu Gln Arg Gly Thr Thr
50 55 60
Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu Leu
65 70 75 80
Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg Val
85 90 95
Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn Ser
100 105 110
Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala Arg
115 120 125
Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His Leu
130 135 140
Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln Leu
145 150 155 160
Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe Asn
165 170 175
Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu Tyr
180 185 190
Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asp
195 200 205
Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala Val
210 215 220
Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe Gly
225 230 235 240
Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly Phe
245 250 255
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
260 265 270
Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu Leu
275 280 285
Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp Pro
290 295 300
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met Ala
305 310 315 320
Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu Lys
325 330 335
Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro
340 345 350
<210> 19
<211> 159
<212> DNA
<213> Artificial
<220>
<223> CTSsialT
<220>
<221> CDS
<222> (1)..(159)
<400> 19
atg att cat acc aac ttg aag aaa aag ttc agc ctc ttc atc ctg gtc 48
Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val
1 5 10 15
ttt ctc ctg ttc gca gtc atc tgt gtt tgg aag aaa ggg agc gac tat 96
Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr
20 25 30
gag gcc ctt aca ctg caa gcc aag gaa ttc cag atg ccc aag agc cag 144
Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln
35 40 45
gag aaa gtg gcc atg 159
Glu Lys Val Ala Met
50
<210> 20
<211> 53
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 20
Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val
1 5 10 15
Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr
20 25 30
Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln
35 40 45
Glu Lys Val Ala Met
50
<210> 21
<211> 13
<212> PRT
<213> Artificial
<220>
<223> synthetic
<400> 21
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala
1 5 10
<210> 22
<211> 30
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 22
gtgacctcga ggaggtggcg agcacaaacc 30
<210> 23
<211> 34
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 23
gtgacggatc cttcagctgc cgggcgctcc gata 34
<210> 24
<211> 76
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 24
gtcaggtcga cgaagacaac atgaggcttc gggagcctct cctcagcggc agcgccgcta 60
tgaaggagcc agccct 76
<210> 25
<211> 36
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 25
gtgacggtct cacatgacgc cacctagaag tcctga 36
<210> 26
<211> 40
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 26
gtgactctag aagacaacat gccggactcc accgggaact 40
<210> 27
<211> 32
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 27
gtgacggatc cttcagggtt tgcccacgtc ca 32
<210> 28
<211> 36
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 28
gtgacgaaga caacatgcac aggaaactgg cggagc 36
<210> 29
<211> 73
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 29
gtgactctag aagacaacat gaggcttcgg gagccgctcc tgagcggcag cgccgcgatg 60
ccggactcca ccg 73
Claims (22)
- (a) 서열 14의 제브라피시 β1,4-갈락토실트랜스퍼라제 활성 도메인을 포함하는 β1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자를 식물 또는 식물 세포 내로 삽입하고;
(b) β1,4-갈락토실트랜스퍼라제를 발현하는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 선택하여, N-연결된 글리칸에 갈락토스 잔기를 β1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 것
을 포함하는, N-연결된 글리칸에 갈락토스 잔기를 β1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법. - 제1항에 있어서, 핵산 분자가 서열 14, 서열 16, 또는 서열 18을 코딩하는 것인 방법.
- 제1항에 있어서, β1,4-갈락토실트랜스퍼라제가 N-말단에 포유동물 β1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 10-20개 길이의 아미노산 서열 단편을 포함하는 것인 방법.
- 제3항에 있어서, N-말단 아미노산 서열이 처음 10개의 N-말단 아미노산 내에 적어도 서열 [K/R]-X-[K/R]을 포함하고, 여기서 [K/R]은 라이신 또는 아르기닌 잔기를 나타내고, X는 임의의 아미노산일 수 있는 것인 방법.
- 제4항에 있어서, 아미노산 서열이 MRLREPLLSGSAA (서열 21)인 방법.
- 제1항에 있어서, β1,4-갈락토실트랜스퍼라제가 포유동물 시알릴트랜스퍼라제 또는 식물 골지체에 국재화된 단백질의 세포질-막횡단-스템 구역 (CTS)을 포함하는 것인 방법.
- 제1항에 있어서, 트랜스제닉 식물 또는 트랜스제닉 식물 세포가, β1,2-자일로스 잔기, α1,3-푸코스 잔기, 또는 β1,2-자일로스 잔기 및 α1,3-푸코스 잔기가 둘다 결여된 하이브리드형의 N-연결된 글리칸을 포함하는 당단백질을 생산하는 것인 방법.
- 제7항에 있어서, β1,2-자일로스 및 α1,3-푸코스 잔기가 둘다 결여된 하이브리드형의 N-연결된 글리칸의 생산량이 야생형 인간 β1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물에 의한 생산량의 2배 이상인 방법.
- 제1항 내지 제8항 중 어느 한 항의 방법에 따라 생산된 트랜스제닉 식물 또는 상기 식물의 일부분.
- 제1항 내지 제8항 중 어느 한 항의 방법에 따라 생산된 트랜스제닉 식물 세포.
- 제10항에 있어서, 현탁 배양으로 성장된 트랜스제닉 식물 세포.
- (a) 서열 14의 제브라피시 β1,4-갈락토실트랜스퍼라제 활성 도메인을 포함하는 β1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자, 및 이종 당단백질을 코딩하는 핵산 분자를 식물 또는 식물 세포 내로 삽입하여 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하고,
(b) 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 핵산 분자의 발현에 적절한 조건 하에 유지시켜, 하나 이상의 하이브리드형의 갈락토실화된 N-연결된 글리칸을 포함하는 이종 당단백질을 생산하는 것을 포함하는,
하나 이상의 하이브리드형의 갈락토실화된 N-연결된 글리칸을 포함하는 이종 당단백질을 생산하는 방법. - 제12항에 있어서, 이종 당단백질을 트랜스제닉 식물 또는 트랜스제닉 식물 세포로부터 단리하는 것을 추가로 포함하는 방법.
- 제12항 또는 제13항에 있어서, β1,4-갈락토실트랜스퍼라제가 N-말단에 (i) 포유동물 β1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 10-20개 길이의 아미노산 서열인 단편, 또는 (ii) 포유동물 시알릴트랜스퍼라제 또는 식물 골지체에 국재화된 단백질의 세포질-막횡단-스템 구역 (CTS)인 단편을 포함하는 것인 방법.
- 제12항에 있어서, 핵산 분자가 서열 14, 서열 16, 또는 서열 18을 코딩하는 것인 방법.
- 제12항, 제13항 및 제15항 중 어느 한 항에 있어서, 상기 당단백질의 N-글리칸에 자일로스, 푸코스, 또는 이들 모두가 없는 것인 방법.
- 삭제
- 삭제
- 삭제
- 당단백질 상의 β1,2-자일로스 및 α1,3-푸코스 잔기가 둘다 결여된 하이브리드형의 N-연결된 글리칸의 생산량이 야생형 인간 β1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물에 의한 생산량의 2배 이상이며, 서열 14의 제브라피시 β1,4-갈락토실트랜스퍼라제 활성 도메인을 포함하는 β1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자를 포함하고, β1,2-자일로스 및 α1,3-푸코스 잔기가 둘다 결여된 하이브리드형의 N-연결된 글리칸을 갖는 당단백질을 생산할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포.
- 제20항에 있어서, 핵산 분자가 서열 14, 서열 16, 또는 서열 18을 코딩하는 것인 트랜스제닉 식물 또는 트랜스제닉 식물 세포.
- 제20항 또는 제21항에 있어서, 이종 당단백질을 코딩하는 핵산 분자를 추가로 포함하는 트랜스제닉 식물 또는 트랜스제닉 식물 세포.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP07106337 | 2007-04-17 | ||
EP07106337.4 | 2007-04-17 | ||
PCT/IB2008/000944 WO2008125972A2 (en) | 2007-04-17 | 2008-04-17 | Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097023815A Division KR101426576B1 (ko) | 2007-04-17 | 2008-04-17 | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147011279A Division KR101460953B1 (ko) | 2007-04-17 | 2008-04-17 | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130090426A KR20130090426A (ko) | 2013-08-13 |
KR101426667B1 true KR101426667B1 (ko) | 2014-08-06 |
Family
ID=38441415
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147011279A KR101460953B1 (ko) | 2007-04-17 | 2008-04-17 | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 |
KR1020137020324A KR101426667B1 (ko) | 2007-04-17 | 2008-04-17 | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 |
KR1020097023815A KR101426576B1 (ko) | 2007-04-17 | 2008-04-17 | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147011279A KR101460953B1 (ko) | 2007-04-17 | 2008-04-17 | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097023815A KR101426576B1 (ko) | 2007-04-17 | 2008-04-17 | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 |
Country Status (15)
Country | Link |
---|---|
US (2) | US8829276B2 (ko) |
EP (2) | EP2535418B1 (ko) |
JP (2) | JP5485869B2 (ko) |
KR (3) | KR101460953B1 (ko) |
CN (2) | CN104195166B (ko) |
AU (1) | AU2008237632B2 (ko) |
BR (1) | BRPI0810443A2 (ko) |
CA (2) | CA2684370C (ko) |
DK (2) | DK2535418T3 (ko) |
HK (2) | HK1142092A1 (ko) |
IL (2) | IL201496A (ko) |
MX (2) | MX341988B (ko) |
NZ (2) | NZ580510A (ko) |
WO (1) | WO2008125972A2 (ko) |
ZA (2) | ZA200907301B (ko) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL143641A0 (en) | 1998-12-09 | 2002-04-21 | A method for manufacturing glycoproteins having human-type glycosylation | |
CA2925231A1 (en) | 1999-10-26 | 2001-05-03 | Stichting Dienst Landbouwkundig Onderzoek | Mammalian-type glycosylation in transgenic plants expressing galactosyltransferase and sialyl transferase |
CA2434364C (en) | 2001-01-19 | 2013-03-19 | The Dow Chemical Company | Method for secretory production of glycoprotein having human-type sugar chain using plant cell |
IL157736A0 (en) * | 2001-03-06 | 2004-03-28 | Dow Chemical Co | Plant cell having animal-type sugar chain adding function |
EP1485492B1 (en) | 2002-03-19 | 2011-12-21 | Stichting Dienst Landbouwkundig Onderzoek | Gntiii (udp-n-acetylglucosamine:beta-d mannoside beta(1,4)-n-acetylglucosaminyltransferase iii) expression in plants |
JP4532118B2 (ja) | 2002-03-19 | 2010-08-25 | スティヒティング ディーンスト ランドバウクンディフ オンデルズーク | 植物体内のグリカンプロセシングの最適化 |
MX341988B (es) | 2007-04-17 | 2016-09-08 | Stichting Dienst Landbouwkunding Onderzoek | Glicosilacion tipo mamifera en plantas para la expresion de glicosil-transferasas no mamiferas. |
JP5571576B2 (ja) * | 2008-01-07 | 2014-08-13 | シナジェバ・バイオファーマ・コーポレイション | トリにおけるグリコシル化 |
EP2443234B1 (en) | 2009-06-15 | 2018-08-15 | Icon Genetics GmbH | Nicotiana benthamiana plants deficient in xylosyltransferase activity |
WO2013013019A2 (en) * | 2011-07-21 | 2013-01-24 | Alnylam Pharmaceuticals, Inc. | Lysosomal polypeptides, methods of making and using |
US9181532B2 (en) | 2011-07-29 | 2015-11-10 | Icon Genetics Gmbh | Production of galactosylated N-glycans in plants |
JP6523748B2 (ja) * | 2015-04-01 | 2019-06-05 | シスメックス株式会社 | 糖タンパク質の製造方法および糖タンパク質 |
EP3305893A1 (en) * | 2016-10-10 | 2018-04-11 | Universität für Bodenkultur Wien | Production of polysialylated polypeptides in plants and plant cells |
WO2018098572A1 (en) | 2016-12-01 | 2018-06-07 | Plantform Corporation | Transgenic plant with reduced fucosyltransferase and xylosyltransferase activity |
KR102348638B1 (ko) * | 2019-11-21 | 2022-01-11 | (주)지플러스 생명과학 | 비푸코실화된 담배를 이용하여 생산한 항체 및 이의 용도 |
Family Cites Families (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5455790A (en) | 1977-10-05 | 1979-05-04 | Tomoyuki Tajima | Production of erythropoetin |
JPS5616496A (en) | 1979-07-20 | 1981-02-17 | Sumitomo Chem Co Ltd | Recovery of erythropoietin |
JPS5653696A (en) | 1979-10-09 | 1981-05-13 | Ajinomoto Co Inc | Isolation of erythropoietin by adsorption |
JPS56108798A (en) | 1980-02-01 | 1981-08-28 | Green Cross Corp:The | Purification of erythropoietin |
JPS57149228A (en) | 1981-03-11 | 1982-09-14 | Ajinomoto Co Inc | Novel erythropoietin and its preparation |
JPS57169424A (en) | 1981-04-10 | 1982-10-19 | Toyo Shinyaku Kk | Preparation of erythropoietin |
US4511503A (en) | 1982-12-22 | 1985-04-16 | Genentech, Inc. | Purification and activity assurance of precipitated heterologous proteins |
NZ207765A (en) | 1983-04-15 | 1987-03-06 | Lubrizol Genetics Inc | Plant expression of transferred dna(t-dna)from plasmids associated with agrobacterium sp |
EP0126546B2 (en) | 1983-04-15 | 1994-03-30 | Lubrizol Genetics Inc. | Plant structural gene expression |
NZ210093A (en) | 1983-11-18 | 1988-11-29 | Lubrizol Genetics Inc | Genetic modification of plant cells by octopine t-dna promoters and/or polyadenylation sites; dna vectors, bacterial strains and plant tissue |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US4956282A (en) | 1985-07-29 | 1990-09-11 | Calgene, Inc. | Mammalian peptide expression in plant cells |
GB8725529D0 (en) | 1987-10-30 | 1987-12-02 | Delta Biotechnology Ltd | Polypeptides |
ES2060765T3 (es) | 1988-05-17 | 1994-12-01 | Lubrizol Genetics Inc | Sistema promotor de ubiquitina en plantas. |
US5179198A (en) | 1988-07-11 | 1993-01-12 | Hidechika Okada | Glycoprotein and gene coding therefor |
US5202422A (en) | 1989-10-27 | 1993-04-13 | The Scripps Research Institute | Compositions containing plant-produced glycopolypeptide multimers, multimeric proteins and method of their use |
US5959177A (en) | 1989-10-27 | 1999-09-28 | The Scripps Research Institute | Transgenic plants expressing assembled secretory antibodies |
WO1991016449A1 (en) | 1990-04-16 | 1991-10-31 | The Trustees Of The University Of Pennsylvania | Saccharide compositions, methods and apparatus for their synthesis |
CA2085744A1 (en) | 1991-04-18 | 1992-10-19 | Shingou Sakurai | Interleukin-6 compositions, and a production process thereof |
US5294593A (en) * | 1992-05-14 | 1994-03-15 | Cornell Research Foundation, Inc. | Inducing dormancy in non dormant seeds |
US5874271A (en) | 1992-08-21 | 1999-02-23 | Takara Shuzo Co., Ltd. | Human glycosyltransferase gene, compounds and method for inhibiting cancerous metastasis |
EP0788548A1 (en) | 1992-11-27 | 1997-08-13 | Novartis AG | Proteins having glycosyltransferase activity |
EP0785988A1 (en) | 1993-07-15 | 1997-07-30 | Neose Pharmaceuticals, Inc | Method of synthesizing saccharide compositions |
US5459031A (en) | 1993-11-05 | 1995-10-17 | Amgen Inc. | Methods for controlling sialic acid derivatives in recombinant glycoproteins |
US5854042A (en) | 1993-12-24 | 1998-12-29 | The Institute Of Physical And Chemical Research | Sugar-chain synthetase and process for producing the same |
WO1995021248A1 (en) | 1994-02-03 | 1995-08-10 | The Scripps Research Institute | Method for using tobacco mosaic virus to overproduce peptides and proteins |
US5723755A (en) | 1995-05-16 | 1998-03-03 | Francis E. Lefaivre | Large scale production of human or animal proteins using plant bioreactors |
US5939288A (en) | 1995-06-07 | 1999-08-17 | Iowa State University Research Foundation, Inc. | Plant secretory signal peptides and nectarins |
JPH09261A (ja) | 1995-06-16 | 1997-01-07 | Green Cross Corp:The | 糖蛋白質の製造方法 |
FR2736930B1 (fr) | 1995-07-17 | 1997-09-19 | Biocem | Procede de production, par des cellules vegetales, de proteines heminiques, proteines ainsi obtenues et produits contenant ces proteines |
US6020169A (en) | 1995-07-20 | 2000-02-01 | Washington State University Research Foundation | Production of secreted foreign polypeptides in plant cell culture |
JPH0984582A (ja) | 1995-09-21 | 1997-03-31 | Kirin Brewery Co Ltd | 糖転移酵素活性を強化した動物細胞、糖鎖改変糖蛋白質ならびにその製造方法 |
US6054304A (en) | 1996-01-24 | 2000-04-25 | Toyo Boseki Kabushiki Kaisha | α1-6 fucosyltransferase |
JP2770010B2 (ja) | 1996-03-29 | 1998-06-25 | 工業技術院長 | 酵母のマンノース−1−リン酸転移を正に制御する遺伝子ならびにこの遺伝子の欠損変異株を利用する高マンノース型中性糖鎖の製造方法 |
WO1998005768A1 (en) | 1996-08-02 | 1998-02-12 | The Austin Research Institute | Improved nucleic acids encoding a chimeric glycosyltransferase |
JP4246264B2 (ja) | 1996-12-12 | 2009-04-02 | 協和発酵キリン株式会社 | 新規β1→4N―アセチルグルコサミニルトランスフェラーゼ、それをコードする遺伝子 |
US6399336B1 (en) | 1997-01-16 | 2002-06-04 | Neose Technologies, Inc. | Practical in vitro sialylation of recombinant glycoproteins |
US6087115A (en) | 1997-01-22 | 2000-07-11 | Cornell Research Foundation, Inc. | Methods of identifying negative antagonists for G protein coupled receptors |
US5981840A (en) | 1997-01-24 | 1999-11-09 | Pioneer Hi-Bred International, Inc. | Methods for agrobacterium-mediated transformation |
JP3921271B2 (ja) | 1997-05-16 | 2007-05-30 | 生化学工業株式会社 | グルクロン酸転移酵素をコードするdna |
JP4003093B2 (ja) | 1997-07-29 | 2007-11-07 | 東洋紡績株式会社 | 糖類の製造方法 |
JPH11127890A (ja) | 1997-10-31 | 1999-05-18 | Kazuo Shimada | 糖蛋白質の生産方法 |
AU1585999A (en) | 1997-11-12 | 1999-05-31 | Neurotherapeutics | Methods for the detection and treatment of disease using a glycosyltransferase |
DE19754622A1 (de) | 1997-12-09 | 1999-06-10 | Antje Von Dr Schaewen | Pflanzliche GntI-Sequenzen und Verwendung derselben zur Gewinnung von Pflanzen mit verminderter oder fehlender N-Acetylglucosaminyltransferase I (GnTI)-Aktivität |
FR2774379B1 (fr) | 1998-01-30 | 2002-03-29 | Groupe Limagrain Holding | Procede de production, par des cellules vegetales, d'alpha 1-antitrypsine et de ses variantes, et produits contenant l'alpha-antitrypsine ainsi obtenue |
US6096546A (en) | 1998-01-30 | 2000-08-01 | Board Of Trustees, Rutgers, The State University Of New Jersey | Methods for recovering polypeptides from plants and portions thereof |
US5955282A (en) | 1998-04-03 | 1999-09-21 | Incyte Pharmaceuticals, Inc. | Human galactosyltransferases |
DK2180007T4 (da) | 1998-04-20 | 2017-11-27 | Roche Glycart Ag | Glycosyleringsteknik for antistoffer til forbedring af antistofafhængig cellecytotoxicitet |
US6558934B1 (en) | 1998-07-17 | 2003-05-06 | Glycozm Aps | UDP-galactose: β-N-acetyl-glucosamine β-1,4-galactosyl-transferase, β4Gal-T2 |
IL126967A (en) | 1998-11-09 | 2002-09-12 | Lightech Electronics Ind Ltd | Electronic transformer for lighting |
JP2002530087A (ja) | 1998-11-18 | 2002-09-17 | ネオーズ テクノロジーズ, インコーポレイテッド | オリゴ糖の安価な産生 |
IL143641A0 (en) | 1998-12-09 | 2002-04-21 | A method for manufacturing glycoproteins having human-type glycosylation | |
AT408446B (de) | 1999-02-18 | 2001-11-26 | Altmann Friedrich Dr | Fucosyltransferase-gen |
JP2000245470A (ja) | 1999-02-26 | 2000-09-12 | Noda Inst For Scient Res | 植物細胞間液による外来ポリペプチドの製造方法 |
JP2002537796A (ja) | 1999-03-02 | 2002-11-12 | ヒューマン ジノーム サイエンシーズ, インコーポレイテッド | ヒトグリコシル化酵素 |
JP2000287692A (ja) | 1999-04-09 | 2000-10-17 | Mitsui Chemicals Inc | 糖タンパク質の有するn−結合型糖鎖の組成中、分岐数が異なる糖鎖の含有割合を制御する方法 |
CA2387876A1 (en) | 1999-10-15 | 2001-04-26 | Calgene Llc | Methods and vectors for site-specific recombination in plant cell plastids |
WO2001029242A2 (en) | 1999-10-21 | 2001-04-26 | Monsanto Company | Post-translational modification of recombinant proteins produced in plants |
WO2001031044A1 (en) | 1999-10-26 | 2001-05-03 | Id-Lelystad, Instituut Voor Dierhouderij En Diergezondheid B.V. | Gonadotrophins in plants |
CA2925231A1 (en) | 1999-10-26 | 2001-05-03 | Stichting Dienst Landbouwkundig Onderzoek | Mammalian-type glycosylation in transgenic plants expressing galactosyltransferase and sialyl transferase |
JP2001546898A (en) | 1999-12-21 | 2003-06-10 | Kyowa Hakko Kogyo Kk | MODIFIED alpha -1,2-FUCOSYLTRANSFERASE GENE AND PROCESS FOR PRODUCING alpha -1,2-FUCOSYLTRANSFERASE AND FUCOSE-CONTAINING SUGAR CHAIN |
AU2676801A (en) | 1999-12-30 | 2001-07-16 | Knut Kleesiek | Xylosyltransferase and isoforms thereof |
FR2803307A1 (fr) | 1999-12-30 | 2001-07-06 | Centre Nat Rech Scient | Lignees de lymphocytes t cd4 specifiques de type th1 et procede pour leur induction ex vivo |
EP1257641A2 (en) | 2000-02-24 | 2002-11-20 | University of Guelph | Method of modulating glycosylation pathways |
US20020174453A1 (en) | 2001-04-18 | 2002-11-21 | Henry Daniell | Production of antibodies in transgenic plastids |
AT409381B (de) | 2000-03-03 | 2002-07-25 | Gloessl Josef Dr | Xylosyltransferase-gen |
JP5623683B2 (ja) | 2000-03-22 | 2014-11-12 | フィトン ホールディングス,リミティド ライアビリティ カンパニー | 動物型糖鎖付加機能をもつ植物細胞 |
FR2808286B1 (fr) | 2000-04-26 | 2004-12-17 | Agronomique Inst Nat Rech | Nouvelle glucosidase i de plante et son application a la production de proteines recombinantes a glycosylation modifiee |
AU2001250573A1 (en) | 2000-04-28 | 2001-11-12 | Michel Xilinas | Treatment of pathological conditions influenced by the action of matrix metalloproteinases (mmps) using phanquinone |
US20020019342A1 (en) | 2000-05-12 | 2002-02-14 | Robert Bayer | In vitro modification of glycosylation patterns of recombinant glycopeptides |
AU2001256762A1 (en) | 2000-05-17 | 2001-11-26 | Mitsubishi Pharma Corporation | Process for producing protein with reduction of acidic sugar chain and glycoprotein produced thereby |
PT1522590E (pt) | 2000-06-28 | 2009-10-26 | Glycofi Inc | Métodos para a produção de glicoproteínas modificadas |
WO2002002793A1 (fr) | 2000-07-05 | 2002-01-10 | Japan As Represented By Secretary Of Osaka University | Processus de production de glycoproteine |
AU2002222965A1 (en) | 2000-07-19 | 2002-01-30 | Digimarc Corporation | Print media with embedded messages for controlling printing |
TW519716B (en) * | 2000-12-19 | 2003-02-01 | Tokyo Electron Ltd | Wafer bias drive for a plasma source |
CA2434364C (en) | 2001-01-19 | 2013-03-19 | The Dow Chemical Company | Method for secretory production of glycoprotein having human-type sugar chain using plant cell |
IL157736A0 (en) | 2001-03-06 | 2004-03-28 | Dow Chemical Co | Plant cell having animal-type sugar chain adding function |
AU2002312698B2 (en) | 2001-06-22 | 2007-03-22 | Siemens Schweiz Ag | Video smoke detection system and method for examining the same |
WO2003007661A1 (fr) | 2001-07-09 | 2003-01-23 | Ibiden Co., Ltd. | Appareil de chauffage en ceramique et article en ceramique soude |
SE519261C2 (sv) | 2001-07-17 | 2003-02-04 | Sca Hygiene Prod Ab | Absorberande alster |
WO2003007861A1 (en) | 2001-07-20 | 2003-01-30 | Cutmed Ltd. | System for performing a micro-drilling procedure in human or animal and a method for use thereof |
MXPA04001072A (es) | 2001-08-03 | 2005-02-17 | Glycart Biotechnology Ag | Variantes de glicosilacion de anticuerpos que tienen citotoxicidad celulares dependiente de anticuerpos incrementada. |
US20030175755A1 (en) | 2002-03-05 | 2003-09-18 | Yoshihiro Abiko | Method of collecting data for estimation of susceptibility to periodontal disease |
AU2011203355B2 (en) | 2002-03-19 | 2012-02-02 | Stichting Dienst Landbouwkundig Onderzoek | Optimizing glycan processing in plants |
EP1485492B1 (en) | 2002-03-19 | 2011-12-21 | Stichting Dienst Landbouwkundig Onderzoek | Gntiii (udp-n-acetylglucosamine:beta-d mannoside beta(1,4)-n-acetylglucosaminyltransferase iii) expression in plants |
JP4532118B2 (ja) | 2002-03-19 | 2010-08-25 | スティヒティング ディーンスト ランドバウクンディフ オンデルズーク | 植物体内のグリカンプロセシングの最適化 |
DE10229635C1 (de) | 2002-07-02 | 2003-07-10 | Ise Gmbh | Überrollschutzsystem für Kraftfahrzeuge |
AR042145A1 (es) | 2002-11-27 | 2005-06-08 | Dow Agrociences Llc | Produccion de inmunoglobulinas en plantas con una fucocilacion reducida |
KR20080021590A (ko) | 2005-03-24 | 2008-03-07 | 네오스 테크놀로지스, 인크. | 가용성이고 활성인 진핵생물 글리코실트랜스퍼라제의원핵생물 유기체 내에서의 발현 |
US20070214273A1 (en) | 2006-03-10 | 2007-09-13 | Pronto Networks | Across firewall communication system and method |
MX341988B (es) | 2007-04-17 | 2016-09-08 | Stichting Dienst Landbouwkunding Onderzoek | Glicosilacion tipo mamifera en plantas para la expresion de glicosil-transferasas no mamiferas. |
-
2008
- 2008-04-17 MX MX2013009960A patent/MX341988B/es unknown
- 2008-04-17 AU AU2008237632A patent/AU2008237632B2/en not_active Ceased
- 2008-04-17 WO PCT/IB2008/000944 patent/WO2008125972A2/en active Application Filing
- 2008-04-17 JP JP2010503614A patent/JP5485869B2/ja not_active Expired - Fee Related
- 2008-04-17 KR KR1020147011279A patent/KR101460953B1/ko not_active IP Right Cessation
- 2008-04-17 CA CA2684370A patent/CA2684370C/en not_active Expired - Fee Related
- 2008-04-17 CA CA2977953A patent/CA2977953A1/en not_active Abandoned
- 2008-04-17 BR BRPI0810443A patent/BRPI0810443A2/pt not_active Application Discontinuation
- 2008-04-17 DK DK12179164.4T patent/DK2535418T3/en active
- 2008-04-17 CN CN201410338812.7A patent/CN104195166B/zh not_active Expired - Fee Related
- 2008-04-17 DK DK08737470.8T patent/DK2147108T3/da active
- 2008-04-17 KR KR1020137020324A patent/KR101426667B1/ko not_active IP Right Cessation
- 2008-04-17 EP EP12179164.4A patent/EP2535418B1/en not_active Not-in-force
- 2008-04-17 MX MX2009011109A patent/MX2009011109A/es active IP Right Grant
- 2008-04-17 CN CN200880016408.0A patent/CN101702919B/zh not_active Expired - Fee Related
- 2008-04-17 EP EP08737470.8A patent/EP2147108B1/en not_active Not-in-force
- 2008-04-17 US US12/596,063 patent/US8829276B2/en not_active Expired - Fee Related
- 2008-04-17 KR KR1020097023815A patent/KR101426576B1/ko not_active IP Right Cessation
- 2008-04-17 NZ NZ580510A patent/NZ580510A/en not_active IP Right Cessation
- 2008-04-17 NZ NZ593203A patent/NZ593203A/xx not_active IP Right Cessation
-
2009
- 2009-10-13 IL IL201496A patent/IL201496A/en not_active IP Right Cessation
- 2009-10-19 ZA ZA2009/07301A patent/ZA200907301B/en unknown
-
2010
- 2010-09-04 HK HK10108419.4A patent/HK1142092A1/xx not_active IP Right Cessation
-
2011
- 2011-01-19 ZA ZA2011/00485A patent/ZA201100485B/en unknown
-
2013
- 2013-01-08 HK HK13100236.9A patent/HK1173179A1/zh not_active IP Right Cessation
- 2013-10-25 JP JP2013222359A patent/JP5856126B2/ja not_active Expired - Fee Related
- 2013-12-08 IL IL229861A patent/IL229861A/en not_active IP Right Cessation
-
2014
- 2014-07-25 US US14/341,296 patent/US9745594B2/en not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
GenBank Accession Number AAI24814 (2006.10.27.) * |
국제공개공보 WO01/31045 (2001.05.03.) * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101426667B1 (ko) | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 | |
KR101196023B1 (ko) | 식물에서 글리칸 프로세싱의 최적화 | |
JPH09505467A (ja) | トランスジェニックフルクタン蓄積作物およびその生産法 | |
CA3040017A1 (en) | Production of polysialylated polypeptides in plants and plant cells | |
AU2013203379B2 (en) | Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases | |
WO2008143513A1 (en) | Alg3 mutant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
A107 | Divisional application of patent | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
B701 | Decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170704 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |