KR20080094918A - 식물에서 n-글리칸의 인간화 및 최적화 조성물 및 방법 - Google Patents

식물에서 n-글리칸의 인간화 및 최적화 조성물 및 방법 Download PDF

Info

Publication number
KR20080094918A
KR20080094918A KR1020087020032A KR20087020032A KR20080094918A KR 20080094918 A KR20080094918 A KR 20080094918A KR 1020087020032 A KR1020087020032 A KR 1020087020032A KR 20087020032 A KR20087020032 A KR 20087020032A KR 20080094918 A KR20080094918 A KR 20080094918A
Authority
KR
South Korea
Prior art keywords
sequence
seq
xylt
fragment
nucleotide
Prior art date
Application number
KR1020087020032A
Other languages
English (en)
Inventor
린 에프. 딕키
케빈 엠. 콕스
찰스 지. 펠레
밍-보 왕
Original Assignee
바이오렉스 쎄라퓨틱스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이오렉스 쎄라퓨틱스, 인코포레이티드 filed Critical 바이오렉스 쎄라퓨틱스, 인코포레이티드
Publication of KR20080094918A publication Critical patent/KR20080094918A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • C12N15/8258Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon for the production of oral vaccines (antigens) or immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/13Immunoglobulins specific features characterized by their source of isolation or production isolated from plants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/40Immunoglobulins specific features characterized by post-translational modification
    • C07K2317/41Glycosylation, sialylation, or fucosylation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/71Decreased effector function due to an Fc-modification
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/72Increased effector function due to an Fc-modification
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/73Inducing cell death, e.g. apoptosis, necrosis or inhibition of cell proliferation
    • C07K2317/732Antibody-dependent cellular cytotoxicity [ADCC]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/73Inducing cell death, e.g. apoptosis, necrosis or inhibition of cell proliferation
    • C07K2317/734Complement-dependent cytotoxicity [CDC]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Public Health (AREA)
  • Pain & Pain Management (AREA)
  • Rheumatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 고등 식물에서 당단백질의 N-당화 패턴을 변형시키는 방법을 제공한다. 상기 방법은 식물에서 α1,3-푸코실트랜스퍼라제(FucT) 및 β1,2-자일로실트랜스퍼라제(XylT)의 발현 저해를 제겅하는 재조합 구조체를 식물에 도입하는 단계를 포함한다. 이들 2종의 효소, 및 이의 이소형의 발현을 저해 또는 억제하기 위한 이들 구조체의 사용은, 식물 생장 및 발생에 영향없이 "인간화된" N-당화 패턴을 가지는 내인성의 이종의 단백질을 생산하는데 유익하다. 또한, 이러한 단백질 N-당화 패턴을 가지는 안정적으로 형질전환된 고등 식물을 제공한다. 단일클론 항체 조성물을 포함하여, 실질적으로 동질적인 당화 프로파일을 가지며, 실질적으로 동질적인 GO 글리코형인, 당단백질 조성물에 대한 방법을 제공한다.

Description

식물에서 N-글리칸의 인간화 및 최적화 조성물 및 방법{COMPOSITIONS AND METHODS FOR HUMANIZATION AND OPTIMIZATION OF N-GLYCANS IN PLANTS}
본 발명은 식물 분자 생물학 분야에 관한 것으로, 보다 상세하게는 식물에서의 재조합 포유류 단백질의 생산 분야에 관한 것이다.
많은 식물 종들이 제약학적으로 흥미로운 포유류 단백질의 "분자 양식(molecular farming)"에 사용하기 위한 표적이 되어 왔다. 이들 식물 발현 시스템은 생물학적으로 활성인 포유류 단백질의 저가 생산을 제공하며, 신속하고 경제적인 생산 규모로의 확대가 용이하게 이루어질 수 있다(Ma et al. (2003) Nat . Rev. Genet . 4:794-805; Raskin et al . (2002) Trends Biotechnol . 20:522-531). 많은 종류의 포유류 및 식물 단백질들에는 적절한 폴딩, 어셈블리 및 기능을 위해 번역 후 가공이 요구된다. 이러한 수정(midofocation)들 중, 식물과 포유류 간의 당화 패턴의 차이는 제약학적 용도의 고품질의 재조합 포유류 단백질을 생산하기 위해 식물 발현 시스템을 이용하는데 도전이 된다.
펩타이드가 소포체(endoplasmic reticulum, ER)와 골지체의 세포내 구획물을 통해 이동함에 따라, 당 잔기 체인 또는 글리칸이 부착되어, 궁극적으로 당단백질이 된다. 4가지 단백질 아미노산들, 아스파라긴, 세린, 트레오닌 및 하이드록시라 이신 중 오직 하나에만 화학적 결합이 형성됨으로써, 당쇄와 펩타이드 사이에 결합(linkage)이 이루어진다. 이러한 결합 패턴을 기본으로, 당단백질에서 2가지 기본적인 형태의 당 잔기 체인들이 확인되었다: 펩타이드의 아스파라긴 잔기에 결합하는 N-글리코시드-연결된 당 체인(또한, N-연결된 글리칸 또는 N-글리칸이라고도 함)과, 펩타이드의 세린, 트레오닌 및 하이드록시라이신 잔기에 결합하는 O-글리코시드-연결된 당 체인.
N-글리코시드-연결된 당 체인 또는 N-글리칸은 다양한 구조를 가지지만(예, Takahashi, ed. (1989) Biochemical Experimentation Method 23 - Method for Studying glycoprotein Sugar Chain (Gakujutsu Shuppan Center)), 공통된 올리고만노스 코어를 공유하고 있다(도 29A 참조). N-글리칸 형성으로 이어지는 당화 경로의 첫번째 단계는 식물과 동물에 보존되어 있다. 그러나, 컴플렉스 N-글리칸 생성에 관여하는 마지막 단계가 서로 상이하다(Lerouge et al . (1998) Plant Mo . Biol . 38:31-48; Steinkellner and Strasser (2003) Ann . Plant Rev .9:181-192). 식물에서는 포유류에서 관찰되는 바와 유사하게, 2개의 N-아세틸글루코사민(GlcNAc) 잔기를 가지고 있는 코어를 가진 컴플렉스 N-글리칸이 있는 당단백질이 만들어진다. 그러나, 식물 당단백질에서, 상기 코어는 인간에서는 형성되지 않는 β1,2-연결된 자일로스 잔기(코어 자일로스), 루이스a 에피토프 및 포유류의 α1,6-연결된 코어 푸코스 대신 α1,3-연결된 푸코스(코어 α[1,3]-푸코스)로 치환된다(예, Lerouge et al . (1998) Plant Mol . Biol . 38:31-48)(또한 도 29B 참조). α(1,3)-푸코스 및 β(1,2)-자일로스 잔기는 포유류에서의 식물 당단백질의 면역원성에 일정 부분 이상 관여한다(예, Ree et al . (2000) J. Biol . Chem . 15:11451-11458; Bardor et al . (2003) Glycobiol . 13:427-434; Garcia-Casado et al . (1996) Glycobiol . 6:471-477). 따라서, 식물에서 재조합으로 제조된 포유류 당단백질로부터 이러한 잠재적인 알레르기성 당 잔기를 제거함으로써, 인간 치료용 약제로서의 이들 단백질의 이용과 관련있는 문제를 해결할 수 있을 것이다.
현재 재조합으로 제조된 다수의 당단백질들이 치료제로서 제공되고 있거나, 또는 임상 시험중에 있다. 그 예로는, 인터페론(IFN), 에리트로포이에틴(EPO), 조직 플라스미노겐 활성자(tPA), 항트롬빈, 과립구-대식세포 콜로니 자극 인자(GM-CSF), 및 치료적 단일클론 항체(mAb)가 있다. 당단백질의 N-글리칸 구조의 올리고당 성분은 이의 치료학적 효능 뿐만 아니라 이의 물리적 안정성, 프로테아제 공격에 대한 저항성, 약동력학, 면역계와의 상호작용 및 특이적인 생물학적 활성에 영향을 미칠 수 있다. 예로, Jenkins et al . (1996) Nature Biotechnol . 14:975-981을 참조한다.
식물 발현 시스템에서 당화 패턴을 변형시키는 방법, 구체적으로는, 진핵생물의 코어 구조에서 식물 특이적인 당화를 저해하여, 유익하게는 인간화된 당화 패턴을 가지는 재조합 포유류 단백질을 생산하는 방법이 요구된다.
발명의 간단한 개요
고등 식물에서 N-당화 패턴을 변형시키는 방법을 제공한다. 상기 방법은, 식물에서 α1,3-푸코실트랜스퍼라제(FucT) 및 β1,2-자일로실트랜스퍼라제(XylT)의 발현 저해를 제공하는, 하나 이상의 재조합 뉴클레오타이드 구조체를 식물에 안정적으로 형질전환시키는 단계를 포함한다. 상기 2가지 효소 중 어느 하나 또는 2가지 모두, 및 이의 이소형(isoform)의 발현을 저해 또는 억제하기 위한 상기 구조체를 사용하여, 이롭게도 식물 생장과 발생에 영향을 주지 않으면서 "인간화된" N-당화 패턴을 갖는 내인성의 이종의 단백질을 생산한다. 이러한 단백질 N-당화 패턴을 가지고 있는 안정적으로 형질전환된 고등 식물을 제공한다. 일부 예에서, 식물은 완두, 알파파 및 담배 등의 쌍자엽 식물인 작물이며; 다른 예로, 식물은 벼 또는 옥수수와 같은 단자엽의 작물이다. 또다른 예로, 식물은 예컨대 렘나 종(Lemna sp)과 같은 개구리밥 과(Lemnaceae)의 식물이다.
본 발명의 형질전환 식물은 포유류 숙주와 더욱 유사한 N-당화 패턴을 갖는 재조합 포유류 단백질을 생산하는 능력을 가진다. 따라서, 일부 예에서, 재조합으로 생산된 포유류 단백질은 식물 특이적인 α(1,3)-푸코스 및 β(1,2)-자일로스 잔기의 부착이 감소된 컴플렉스 N-글리칸을 포함하는 당단백질이다. 다른 예에서, 이들 재조합으로 생산된 당단백질은 이들 식물 특이적인 잔기가 전혀 없는 컴플렉스 N-글리칸을 포함한다. 또다른 예로, 이들 재조합으로 생산된 당단백질은 당단백질내에 아스파라긴 당화 부위(들)에 부착된 하나의 글리칸 종으로서 GlcNAc2Man3GlcNAc2를 갖는다.
일부 예들에서, 재조합으로 생산되는 당단백질은 단일클론 항체이다. 이러한 방식으로, 본 발명은 작동자 기능이 증가된 단일클론 항체 등의, 원하는 표적 단백질에 특이적으로 결합할 수 있는 형질전환 식물을 제공한다. 따라서, 일부 예들에서, 재조합으로 생산된 글리칸-최적화된 단일클론 항체는 α(1,3)-연결된 푸코스 잔기 부착이 감소되어, 따라서 상기 항체의 ADCC 활성이 증가된 컴플렉스 N-글리칸을 포함한다. 다른 예로, 재조합으로 생산된 단일클론 항체는 이들 식물-특이적인 푸코스 잔기가 결여된 컴플렉스 N-글리칸을 포함한다. 이러한 방식으로, 본 발명은 온전한 항체(intact antibody)의 90% 이상이 단일 글리코형(glycoform)이고, 보다 구체적으로는 GO 글리코형으로 표시되는, 단일클론 항체 조성물의 생산 방법을 제공한다. 따라서, 본 발명의 일부 예들에서, 재조합으로 생산되는 단일클론 항체는 ADCC 활성이 증가 및/또는 ADCC/CDC 활성 비가 증가된, 증가된 작동자 기능을 갖는다. 이러한 예들로, 재조합으로 생산된 단일클론 항체는 감소된 CDC 활성을 가지는데, 이는 바람직하게는 투여시 CDC 활성화와 관련있는 잠재적인 부작용을 감소시킬 수 있다. 이러한 글리칸-최적화된 단일클론 항체는, 이의 증가된 작동자 기능이 이들을 보다 낮은 농도, 그리고 적은 횟수로 투여할 수 있도록 하며, 이는 항체의 독성 가능성 및/또는 항체 허용성(antibody tolerance)의 발현을 감소시킬 수 있음을 의미하므로, 현재의 투여 경로와 치료 요법을 변형시는데 이용될 수 있다. 더욱이, 이의 개선된 작동자 기능은 다른 재조합 숙주 시스템에서 생산된 해당 단일클론 항체를 이용한 치료에 내성이거나 또는 난치성인 것으로 나타난 임상 증상을 치료하는 새로운 접근법을 창출한다.
본 발명의 방법을 실시하기 위한 조성물을 제공한다. 상기 조성물은 렘나 마이너의 α1,3-푸코실트랜스퍼라제와 β1,2-자일로실트랜스퍼라제를 코딩하는 분리된 신규 폴리뉴클레오타이드 및 폴리펩타이드와, 이의 변이체 및 단편을 포함한다. 이들 2종의 단백질의 발현 또는 그 변이체의 발현을 표적으로 하는 재조합 뉴클레오타이드 구조체와, 이들 재조합 구조체를 포함하는 식물 세포, 식물 조직, 식물 및 종자도 제공한다.
발명의 상세한 설명
이하, 첨부된 도면을 참조하여 보다 충분하게 본 발명을 설명하지만, 본 발명의 모든 예를 언급하는 것은 아니다. 실제, 이러한 발명들은 여러가지 수많은 형태로 구현될 수 있어, 본원에 기재된 구현예들로 한정되는 것으로 해석되어서는 안되며, 이러한 예들은 적용가능한 법적 요건을 만족시키기 위해 제공된다. 명세서 전체에서 동일한 숫자는 동일한 요소를 지칭한다.
본 발명이 속하는 기술 분야의 당업자는, 전술한 설명 및 관련된 도면에 제시된 내용의 이점을 가지는 본원에 기재된 본 발명의 수많은 변형 및 다른 예를 생각할 수 있을 것이다. 따라서, 본 발명은 개시된 구체적인 예로 한정되지 않으며, 변형 및 그외 예들이 첨부된 청구항의 범위내에 포함되는 것으로 의도된 것으로 이해되어야 한다. 특정 용어가 본원에서 사용되었지만, 이는 단지 일반적이고 기술적인 의미로만 사용되며 한정의 목적은 아니다.
본 발명은 식물, 특히 원하는 재조합 단백질에 대한 발현 시스템으로서 제공되는 식물에서 생산되는, 동종의 폴리펩타이드 및 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 조성물 및 방법을 제공한다. 본 발명의 방법은 식물에서, 상기 α1,3-푸코실트랜스퍼라제(FucT) 및 β1,2-자일로실트랜스퍼라제(XylT)의 발현을 저해할 수 있는 하나 이상의 서열을 포함하는 뉴클레오타이드 구조체의 사용을 포함한다. 또한, 개선된 작동자 기능을 가진 글리칸-최적화된 단일클론 항체를 포함하여, 본 발명의 방법을 실시하는데 사용되는 조성물 및 실질적으로 동종의 당화 프로파일을 가진 당단백질을 포함하는 조성물을 제공한다.
정의:
"폴리펩타이드"는 임의의 단량체 또는 다량체 단백질 또는 펩타이드를 의미한다.
"생물학적으로 활성인 폴리펩타이드"는 생물학적 측면에서 폴리펩타이드에 정상적으로 부여된 하나 이상의 생물학적 기능 또는 활성 세트를 수행하는 능력을 가진 폴리펩타이드를 의미한다. 당업자라면, 용어 "생물학적으로 활성인"은 천연 단백질(예, 억제된 또는 강화된)에 비해, 산업적 또는 화학적 공정, 또는 치료적, 백신 또는 진단 시약으로서 사용하는데 흥미로운 충분한 활성을 가지는 수준으로만, 생물학적 활성이 변형된 폴리펩타이드를 포함하는 것으로 이해할 것이다. 생물학적 활성은 당업계에 이용가능한 임의 방법에 의해 결정할 수 있다. 예로, 인터페론 계열에 속하는 단백질의 생물학적 활성은, 인터페론-특이적인 항체와의 상호 작용, 바이러스 감염에 대한 내성을 증가시키는 능력, 또는 인터페론-조절성 유전자 타겟의 전사를 조정하는 능력을 포함하여, 임의의 여러가지 방법으로 결정할 수 있다. 이와 같은 방식으로, 비제한적으로, 단일클론 항체의 생물학적 활성을, 결합 특이성 및 작동자 기능을 측정하는 분석을 포함한 수많은 임의의 방법에 의해, 예컨대 항체-의존적인 세포성 세포독성(ADCC) 및 보체-의존성 세포독성(CDC) 활성 분석을 이용하여 결정할 수 있다.
"숙주 세포"는 본 발명의 이종의 핵산 서열을 포함하는 세포를 의미한다. 본 발명의 핵산 서열, 그 단편 및 변이체를 원하는 임의 세포에 도입할 수 있지만, 특히 원하는 세포는 식물 숙주 세포이다. 일부 예에서, 식물 숙주 세포는 재조합 단백질을 발현하기 위한 숙주로서 제공되는 식물의 세포, 예컨대 후술하는 바와 같이 원하는 재조합 포유류 단백질을 생산하기 위한 식물 발현 시스템이다.
"이종의 원하는 폴리펩타이드"는 자연적으로는 숙주 세포에 의해 발현되지 않는 폴리펩타이드를 의미한다. 역으로, "동종의 폴리펩타이드"는 숙주의 세포에서 자연적으로 생산되는 폴리펩타이드를 의미한다. 번역 후 N-당화되는 이종의 폴리펩타이드 및 동종의 폴리펩타이드는 이종의 또는 동종의 당단백질로서 본원에서 언급된다. 본 발명의 방법과 관련하여, 이종의 및 동종의 당단백질 이들 모두의 N-당화 패턴은 식물 숙주의 세포내에서 변형되어, 이들 당단백질은 포유류 숙주에서 관찰되는 바와 보다 비슷한 N-당화 패턴을 갖는다.
원하는 이종의 폴리펩타이드 및 동종의 뉴클레오타이드 예로는, 비제한적으로, 포유류 폴리펩타이드, 예컨대 인슐린, 성장 호르몬, α-인터페론, 베타-인터페론, 베타-글루코세레브로시다제, 베타-글루코로니다제, 레티노블라스토마 단백질, p53 단백질, 안지오스타틴, 렙틴, 에리트로포이에틴(EPO), 과립구 대식세포 콜로니 자극 인자, 플라스미노겐, 조직 플라스미노겐 활성자, 혈액 응고 인자, 예컨대 팩터 VII, 팩터 VIII, 팩터 IX 및 활성화된 단백질 C, 알파 1-항트립신, 단일클론 항체(mAb), Fab 단편, 단쇄 항체, 사이토카인, 수용체(receptor), 호르몬, 인간 백신, 동물 백신, 펩타이드 및 혈청 알부민을 코딩하는 서열을 포함한다.
본 발명의 목적에서, 용어 "N-글리칸", "N-연결된 글리칸" 및 "글리칸"은 상호 호환적으로 사용되며, N-연결된 올리고당, 예컨대 단백질의 아스파라긴 잔기의 아미드 질소에 연결된 N-아세틸글루코사민(GlcNAc)이거나, 또는 N-아세틸글루코사민에 이해 부착된 것을 의미한다. 당단백질에서 발견되는 우세한 당은 글루코스, 갈락토스, 만노스, 푸코스, N-아세틸갈락토스아민(GalNAc), N-아세틸글루코사민(GlcNAc) 및 시알산(예, N-아세틸-뉴라민산(NeuAc))이다. N-연결된 당단백질에서 당 그룹들의 가공은 ER의 루멘에서 공동-번역으로 이루어지며 골지체에서도 계속된다.
컴플렉스 N-글리칸의 "올리고만노시딕 코어 구조" 또는 "트리만노스 코어 구조"는, 코어가 당단백질의 아스파라긴 잔기에 부착된 3개의 만노스(Man) 및 2개의 N-아세틸글루코사민(GlcNAc) 단당류 잔기로 구성된, 도 29A에 나타낸 코어 구조를 의미한다. 아스파라긴 잔기는 보존적인 펩타이드 서열 Asn-Xxx-Thr 또는 Asn-Xxx-Ser이 일반적이며, Xxx는 프롤린, 아스파르테이트 또는 글루타메이트 이외의 임의 잔기이다. 이후의 당화 단계에서, 최종적인 컴플렉스 N-글리칸 구조가 만들어진다. 트리만노스 코어 구조는 본원에서 "Man3GlcNAc2"로 표시된다.
당단백질에 부착된 N-글리칸은 트리만노스 코어 구조에 부가된 말초 당(예, GlcNAc, 갈락토스, 푸코스 및 시알산)을 포함하는 많은 수의 분지(안테나) 측면에서 상이하다. N-글리칸은 이의 분지 구성 성분에 따라 일반적으로 분류된다(예, 컴플렉스, 고 만노스 또는 하이브리드). "컴플렉스" 타입의 N-글리칸은 전형적으로 1,3 만노스 암에 부착된 하나 이상의 GlcNAc와 "트리만노스" 코어의 1,6 만노스 암에 부착된 하나 이상의 GlcNAc를 가지고 있다. 각 만노스 암에 부착된 경우, N-연결된 글리칸 종들을 본원에서는 "GlcNAc2Man3GlcNAc2" 또는 "GnGn"이라고 한다. GlcNac 하나만 부착된 N-글리칸 종들을 본원에서는 "GlcNAc1Man3GlcNAc2"이라고 하며, GlcNac는 1,3 만노스 암(본원에서는 "MGn"이라고 함) 또는 1,6 만노스 암(본원에서는 "GnM"이라고 함)(도 30 참조) 중 어느 하나에 부착된다. 또한, 컴플렉스 N-글리칸은 시알산 또는 유도체(예, "NeuAc", 여기서, "Neu"는 뉴라민산이라고 하고, "Ac"는 아세틸이라고 함)로 선택적으로 변형된 갈락토스("Gal") 또는 N-아세틸갈락토스아민("GalNAc") 당 잔기를 가질 수 있다. 각 만노스 암 상의 각 GlcNAc에 갈락토스 당 잔기가 부착된 경우에, N-연결된 글리칸 종은 본원에서는 "Gal2GlcNAc2Man3GlcNAc2"라고 한다. 또한, 컴플렉스 N-글리칸은 "양분성(bisecting)" GlcNAc 및 코어 푸코스("Fuc")를 포함하는 쇄간 치환을 가질 수 있다. 컴플렉스 N-글리칸은 또한 종종 "다중성 안테나 글리칸"이라고 하는 "트리만노스 코어"상에 다수의 안테나를 가질 수 있다. "고 만노스" 타입의 N-글리칸은 5개 이상의 만노스 잔기를 가진다. "하이브리드" N-글리칸은 트리만노스 코어의 1,3 만노스 암의 말단에 하나 이상의 GlcNAc와 트리만노스 코어의 1,6 만노스 암 상에 0개 이상의 만노스를 가진다.
용어 "GO 글리칸" 및 "GO 글리칸 구조" 및 "GO 글리칸 종"은 상호 호환적으로 사용되며, GlcNAc2Man3GlcNAc2 구조를 가지는 컴플렉스 N-연결된 글리칸을 의미하며, 여기에서 말단 시알산(NeuAcs) 또는 말단 갈락토스(Gal) 당 잔기는 존재하지 않는다.
G0 글리칸이 트리만노스 코어 구조에 부착된 푸코스("Fuc") 잔기를 가지는 경우를, 본원에서는 "G0F3 글리칸"(식물 특이적인 α1,3-연결된 푸코스 잔기를 가짐) 또는 "G0F6 글리칸"(포유류의 α1,6-연결된 푸코스 잔기를 가짐)이라고 한다. 식물에서, 트리만노스 코어 구조에 부착된 식물 특이적인 β1,2-연결된 자일로스 잔기를 포함하는 G0 글리칸을 본원에서는 "GO 글리칸"이라고 하며, 트리만노스 코어 구조에 부착된 식물 특이적인 β1,2-연결된 자일로스 잔기와 식물 특이적인 α1,3-연결된 푸코스 둘다를 포함하는 GP 글리칸은 "G0XF3 글리칸"이라고 한다.
용어 "G1 글리칸" 및 "G1 글리칸 구조" 및 "G1 글리칸 종"은 상호 호환적으로 사용되며, 하나의 말단 갈락토스(Gal) 잔기가 1,3 만노스 또는 1,6 만노스 암에 부착되어 있지만 말단 시알산은 존재하지 않는 GlcNAc2Man3GlcNAc2 구조의 컴플렉스 N-연결된 글리칸을 의미한다. 용어 "G2 글리칸" 및 "G2 글리칸 구조" 및 "G2 글리칸 종"은 상호 호환적으로 사용되며, 하나의 말단 갈락토스(Gal) 잔기가 1,3 만노스와 1,6 만노스 암에 부착되어 있지만 말단 시알산은 존재하지 않는 GlcNAc2Man3GlcNAc2 구조의 컴플렉스 N-연결된 글리칸을 의미한다.
용어 "글리코형(glycoform)"은 본원에서 특정 탄수화물 구조 또는 구조체를 함유하는 당단백질을 의미한다. 따라서, 예컨대, "GO 글리코형"은 그것의 당화 부위에 부착된 GO 글리칸 종으로만 구성된 당단백질을 의미한다. 2 곳 이상의 당화 부위를 가지는 당단백질은 각 당화 부위에 부착된 동일한 글리칸 종을 가지거나 또는 상이한 당화 부위에 부착된 서로 다른 글리칸 종을 가질 수 있는 것으로 이해된다. 이러한 방식으로, 여러가지 글리칸 부착 패턴은 당단백질의 여러가지 글리코형을 만든다.
용어 "당화 프로파일"은 효소적으로 또는 화학적으로 당단백질 조성물 또는 당단백질 산물로부터 분리되는, 대표적인 N-글리칸 종의 특징적인 "핑거프린트"를 의미하며, 이는 예컨대 LC-HPLC, 또는 MALDI-TOF MS 등을 이용하여 이의 탄수화물 구조를 분석한다. 예컨대, Current Analytical Chemistry, Vol. 1, No. 1 (2005), pp. 28-57을 참조하며, 원용에 의해 그 전체가 본 명세서에 포함된다.
당단백질 조성물 또는 당단백질 산물에 대한 당화 프로파일과 관련하여, 용어 "실질적으로 동질적인", "실질적으로 균일한" 및 "실질적인 동질성"은 서로 호환적으로 사용되며, 프로파일에 속하는 총 N-글리칸 종의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%가 원하는 N-글리칸 종으로 표시되고, 미량의 N-글리칸 종이 프로파일에 나타나는, 당화 프로파일을 의미한다. "미량"은 당화 프로파일에 존재하는 임의의 주어진 전구체 N-글리칸 종이 프로파일에서 나타나는 총 N-글리칸 종의 5% 미만, 바람직하기로는 4% 미만, 3% 미만, 2% 미만, 1% 미만, 심지어 0.5% 미만 또는 0.1% 미만으로 존재하는 것을 의미한다. "전구체" N-글리칸 종은 불완전하게 처리된 N-글리칸 종을 의미한다. 본 발명의 당단백질 조성물 또는 당단백질 산물내 미량으로 존재하여 이의 당화 프로파일에서 나타나는 전구체 N- 종의 예로는, 전술한 Man3GlcNAc2, MGn (GlcNac1Man3GlcNAc2, 여기에서 GlcNac1은 1,3 만노스 암에 부착됨), 및 GnM (GlcNac1Man3GlcNAc2, 여기에서 GlcNac1은 1,6 만노스 암에 부착됨) 전구체 N-글리칸 종이 있다.
따라서, 예컨대, 당단백질 산물 또는 조성물내 적정 N-글리칸 종이 GO인 경우, 상기 산물 또는 조성물에 대한 실질적으로 동질적인 당화 프로파일은, 상기 산물 또는 조성물에 대한 당화 프로파일에서 나타나는 N-글리칸 종들의 총 양의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99%가 GO 글리칸 종으로 표시되며, 당화 프로파일에서 나타나는 전구체 N-글리칸 종이 미량인 경우이다. 이런 조성물에서, 당화 프로파일에서 나타나는 대표적인 전구체 N-글리칸 종은 전술한 Man3GlcNAc2, MGn(GlcNac1Man3GlcNAc2, GlcNac1은 1,3 만노스 암에 부착됨), 및 GnM(GlcNac1Man3GlcNAc2, GlcNac1은 1,6 만노스 암에 부착됨) N-글리칸 종일 것이다.
당화 조성물 또는 당화 산물과 관련하여, 용어 "실질적으로 동질적인", "실질적으로 균일한" 및 "실질적인 동질성"은 상호 호환적으로 사용되며, 상기 산물이나 조성물에 존재하는 당단백질의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%가 원하는 글리코형으로 표시되며 조성물내에 존재되는 전구체 또는 부적절한 글리코형이 미량으로 있는, 당단백질 산물 또는 당단백질 조성물을 의미한다. "미량"은 당단백질 산물 또는 조성물에 존재하는 임의의 주어진 전구체 또는 부적합한 글리코형이, 총 당단백질의 5% 미만, 바람직하기로는 4% 미만, 3% 미만, 2% 미만, 1% 미만, 심지어 0.5% 미만 또는 0.1% 미만으로 존재하는 것으로 의도된다. "전구체" 글리코형은, 하나 이상의 당화 부위가 당화되지 않았거나, 또는 바람직한 N-글리칸 종의 전구체를 표시하는 N-글리칸 종으로 채워진 글리코 형, 또는 바람직한 글리코형에 비해 하나 이상의 추가적인 당화 부위가 존재하며 바람직한 N-글리칸 종 또는 부적절한 N-글리칸 종으로 채워진(즉, 이에 부착된) 글리코형을 의미한다.
따라서, 예컨대, GO 글리코형을 포함하는 실질적으로 동질적인 당단백질 조성물 또는 산물은, 상기 산물이나 조성물에 존재하는 당단백질의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%이 GO 글리코형으로 표시되며, 참여하는 모든 당화 부위가 GO 글리칸 종으로 채워지며, 조성물에 전구체 또는 부적절한 글리코형이 미량으로 존재하는, 조성물 또는 산물이다. 그러한 조성물에서, 대표적인 전구체 글리코형은 당화 부위가 채워져 있지 않은 것일 수 있으며, 예시적인 부적절한 글리코형은 그것의 당화 부위에 부착된 GO 글리칸 및 GOX 또는 GOXF3 글리칸 종들의 혼합을 가지고 있는 글리코형일 것이다.
용어 "항체"는 광의적인 의미로 사용되며, 완전하게 조립된 항체, 항체에 결합할 수 있는 항체 단편(예, Fab', F'(ab)2, Fv, 단쇄 항체, 다이항체(diabodies)) 및 전술한 것을 포함하는 재조합 펩타이드를 포괄한다. 항체는 본 발명의 방법 및 조성물에 의해 고려되는 많은 당단백질들 중 하나로 예시된다. 또한, 항체의 유도체도 본 발명에 고려된다. 유도체는 CH2 도메인을 가진 Fc 영역과 같이, 면역글로불린 또는 이의 일부분을 포함하는 융합 단백질을 포함한다.
본원에서, 용어 "단일클론 항체"는 실질적으로 동질적인 항체 집단으로부터 수득되는 항체, 즉 상기 집단을 구성하는 개별 항체들은 소량으로 존재할 수 있는 자연적으로 발생 가능성 있는 돌연변이를 제외하고는 동일하다.
"천연 항체(native antibody)" 및 "천연 면역글로불린"은 통상적으로 2개의 동일한 경쇄(L)과 2개의 동일한 중쇄(H)로 구성된, 약 150,000 달톤의 헤테로테트라머 당단백질이다. 각 경쇄는 하나의 공유 결합성 이황화 결합에 의해 경쇄에 연결되어 있지만, 이황화 결합의 수는 상이한 면역글로불린 이소타입의 중쇄들마다 다양하다. 또한, 각 중쇄 및 경쇄는 일정한 간격으로 체인간 이황화 결합을 갖는다. 각 중쇄는 한쪽 말단에 가변성 도메인(VH)이 있고, 뒤이어 다수개의 불변 도메인이 있다. 각 경쇄는 한쪽 말단에 가변성 도메인(VL)과 다른 한쪽에 불변 도메인이 있으며; 경쇄의 불변 도메인은 중쇄의 첫번째 불변 도메인과 정렬되어 있으며, 경쇄의 가변성 도메인은 중쇄의 가변성 도메인과 정렬되어 있다. 특정 아미노산 잔기는 경쇄- 및 중쇄- 가변성 도메인 간에 인터페이스를 형성하는 것으로 생각된다.
용어 "가변성"은 가변성 도메인의 임의 부분의 서열이 항체들 간에 광범위하게 다르다는 것을 의미하며, 이는 특정 항원에 대한 각 특정 항체의 결합성 및 특이성에 사용된다. 그러나, "가변성"은 항체의 가변성 도메인 전반에 균일하게 분포되어 있진 않다. 이는 경쇄 및 중쇄 가변성 도메인에서 상보성 결정 영역(CDR) 또는 초가변 영역이라고 하는 3곳의 세그먼트(segment)에 집중되어 있다. 가변성 도메인에서 보다 훨씬 더 보존적인 부위를 프래임워크(FR) 영역이라고 한다. 천연 중쇄 및 경쇄의 가변성 도메인은 각각 대개 3개의 CDR로 연결된 베타-시트 구조를 채택하고 있으며, 루프 연결과, 어떤 경우에는 베타-시트 구조의 일부를 형성하는 4개의 FR 영역을 포함하고 있다. 각 체인의 CDR은 FR 영역과 매우 근접한 상태로 유지되어 있으며, 다른 체인의 CDR과 함께 항체의 항원 결합부위의 형성에 기여한다(Kabat et al . (1991) NIH Publ . No . 91-3242, Vol. I, pages 647-669 참조).
불변 도메인은 항체의 항원 결합에 직접 참여하진 않지만, Fc 수용체(FcR) 결합성, 항원-의존적인 세포성 세포독성(ADCC)에 항체의 참여, 옵소닌 작용(opsonization), 보체 의존적인 세포독성(CDC 활성)의 개시 및 비만세포 탈과립화와 같은, 다양한 작동자 기능을 나타낸다.
"항체 단편"은 온전한 항체의 일부분, 바람직하기로는 온전한 항체의 항원-결합 부위 또는 가변성 부위를 포함한다. 항체 단편의 예는 Fab, Fab', F(ab')2, 및 Fv 단편; 다이항체(diabody); 선형 항체(Zapata et al . (1995) Protein Eng . 8(10):1057-1062); 단쇄 항체 분자; 및 항체 단편으로부터 형성된 다중특이적인 항체가 있다. 항체의 파파인 절단으로, 각각 하나의 항원결합 부위를 가지는 2개의 동일한 항원 결합성 단편, "Fab" 단편과, 명칭에서 쉽게 결정화하는 능력이 반영되어 있는 나머지 "Fc" 단편이 만들어진다. 파파인 처리로, 2개의 항원-조합성 부위를 가지며 여전히 항원을 교차 연결시킬 수 있는 F(ab')2 단편이 만들어진다.
"Fv"는 완전한 항원 인지 부위 및 결합 부위를 포함하는 항체의 최소 단편이다. 2쇄 Fv 종에서, 이 부위는 강력한 비-공유성 조합에서 하나의 중쇄- 및 하나의 경쇄 가변성 도메인으로 이루어진 이량체로 구성된다. 단쇄 Fv 종에서, 경쇄 및 중쇄가 2쇄 Fv 종과 유사한 "이량체" 구조로 조합할 수 있도록, 하나의 중쇄 및 하나의 경쇄 가변성 도메인이 유연한 펩타이드 링커에 의해 공유 결합으로 연결될 수 있다. 이러한 배열에서, 각 가변성 도메인의 3개의 CDR이 상호작용하여, VH-VL 이량체 표면상의 항원-결합 부위를 규정하고 있다. 종합적으로, 6개의 CDR은 항체에 대한 항원-결합 특이성을 부여한다. 그러나, 하나의 가변성 도메인(오직 항원에 특이적인 3개의 CDR을 포함하는 Fv의 절반)은 전체 결합 부위 보다 친화성이 낮음에도 불구하고 항원을 인지하여 결합하는 능력을 가지고 있다.
또한, Fab 단편은 경쇄의 불변 도메인과 중쇄의 1차 불변 도메인(CH1)을 포함한다. Fab 단편은 항체 힌지 영역으로부터의 하나 이상의 시스테인을 포함하여, 중쇄 CH1 도메인의 카르복시 말단에 수개의 잔기 부가에 의해, Fab' 단편과 상이하다. Fab'-SH는 불변 도메인의 시스테인 잔기(들)가 유리형 티올기를 가지는 Fab'을 의미한다. F(ab')2 항체 단편은 이들간에 힌지 시스테인을 가지고 있는 Fab' 단편 쌍으로 본래 제조된다. 그외 화학적인 항체 단편 커플링제들도 알려져 있다.
임의의 척추동물 종 유래의 항체의 "경쇄"(면역글로불린)는 이의 불변 도메인의 아미노산 서열을 토대로, 2개의 명확하게 구분되는 타입, 카파(κ) 및 람다(λ) 중 하나로 나타낼 수 있다.
중쇄 불변 도메인의 아미노산 서열에 따라, 면역글로불린을 여러가지 클래스로 지정할 수 있다. 인간 면역글로불린의 주된 클래스 5가지, IgA, IgD, IgE, IgG, 및 IgM가 있으며, 이들 중 수개는 서브클래스(이소타입)로, 예컨대, IgG1, IgG2, IgG3, IgG4, IgA, 및 IgA2로 더욱 분류할 수 있다. 상이한 면역글로불린 클래스에 대응되는 중쇄 불변 도메인을 각각 알파, 델타, 엡실론, 감마 및 뮤라고 한다. 상이한 면역글로불린 클래스의 서브유닛 구조와 3차 구조는 잘 알려져 있다. 상이한 이소타입은 상이한 작동자 기능을 가진다. 예컨대, 인간 IgG1 및 IgG3 이소타입은 항체 의존적인 세포-매개성 세포독성(ADCC) 활성을 매개한다.
면역글로불린은 2개의 중쇄 각각에 Fc 영역의 보존적인 N-연결된 당화를 가지고 있다. 따라서, 예컨대, IgG 타입의 면역글로불린은 아스파라긴 297 (Asn-297)에 N-연결된 올리고당이 있는 당화된 CH2 도메인을 가지고 있다. 2개의 당화 부위 각각에 부착된 특정 N-글리칸 종에 따라, 그리고 상기 2 부위가 면역글로불린 조성물내에서 당화된 정도에 따라, 면역글루불린의 상이한 글리코형이 존재한다.
본원에서, "원하는 뉴클레오타이드 서열"은 이종의 폴리펩타이드의 발현에서 숙주, 특히 식물 숙주, 예컨대 쌍자엽식물강(dicotyledonaceae) 및 단자엽식물강(monocotyledonaceae) 등의 고등 식물에서 발현이 의도된 이종의 폴리펩타이드를 코딩하는 임의의 폴리뉴클레오타이드 서열을 의미한다. 예컨대, 치료적(예, 수의 또는 의학적 용도의) 또는 면역성(예, 백신화) 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 본 발명에 따라 형질전환된 식물 숙주, 예컨대, 개구리밥을 이용하여 발현시킬 수 있다.
용어 "폴리뉴클레오타이드"의 사용은 본 발명을 DNA를 포함하는 폴리뉴클레오타이드로 한정하는 것은 아니다. 당업자라면, 폴리뉴클레오타이드가 리보뉴클레오타이드와, 리보뉴클레오타이드 및 데옥시리보뉴클레오타이드의 조합을 포함할 수 있음을 알 것이다. 이러한 데옥시리보뉴클레오타이드 및 리보뉴클레오타이드는 둘다 자연적으로 생성되는 분자 및 합성 유사체 둘다를 포함한다. 또한, 본 발명의 폴리뉴클레오타이드는 모든 형태의 서열을 포함하며, 비제한적으로, 단일 가닥 형, 이중 가닥 형, 헤어핀, 스템(stem) 및 루프(loop) 구조 등을 포함한다.
용어 "저해한다", "저해" 및 "저해하는"은 본원에서 발현 또는 기능의 임의의 상대적인 감소 및 타겟 유전자 산물의 발현 또는 기능의 완전한 저지 등의, 타겟 유전자 산물의 발현 또는 기능의 임의 감소를 의미한다. 용어 "발현"은, 본원에서 유전자 산물 측면에서 유전자 산물의 전사 및/또는 번역 및/또는 조합 등의 유전자 산물의 생합성을 의미한다. 타겟 유전자(즉, 원하는 유전자 산물) 산물의 발현 또는 기능의 저해는, 임의의 2종의 식물들 간의 비교 측면에서, 예컨대 유전자 변형된 식물에서의 타겟 유전자 산물의 발현 또는 기능 대 대응되는 야생형 식물에서의 타겟 유전자 산물의 발현 또는 기능일 수 있다. 다른 예로, 타겟 유전자 산물의 발현 또는 기능의 저해는 동일한 식물내, 또는 식물들간의 식물 세포, 세포 기관(organelle), 기관(organ), 조직 또는 식물의 일부분의 비교일 수 있으며, 동일 식물내에서나 또는 식물들 간의 발생 단계 또는 시기적 단계 비교를 포함한다. 전사 또는 번역 수준에서 타겟 유전자 산물의 발현을 하향 조절하거나, 또는 타겟 유전자 산물의 기능적 활성을 하향 조절하는 임의 방법 또는 조성물을 사용하여, 타겟 유전자 산물의 발현 또는 기능의 저해를 달성할 수 있다.
용어 "저해성 서열(inhibitory sequence)"은 예컨대 전사 또는 번역 수준에서 타겟 유전자 산물의 발현을 저해시킬 수 있거나, 또는 타겟 유전자 산물의 기능을 저해할 수 있는 임의의 폴리뉴클레오타이드 또는 폴리펩타이드를 포함한다. 저해성 서열의 예로는, 비제한적으로, 전장 폴리뉴클레오타이드 또는 폴리펩타이드 서열, 절단된(truncated) 폴리뉴클레오타이드 또는 폴리펩타이드 서열, 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 단편, 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 변이체, 센스 방향의 뉴클레오타이드 서열, 안티센스 방향의 뉴클레오타이드 서열, 센스 또는 안티센스 방향의 뉴클레오타이드 서열의 상보체, 뉴클레오타이드 서열의 역위된 영역(inverted region), 뉴클레오타이드 서열의 헤어핀, 이중 가닥의 뉴클레오타이드 서열, 단일 가닥의 뉴클레오타이드, 이의 조합 등을 포함한다. 용어 "폴리뉴클레오타이드 서열"은 RNA, DNA, 화학적으로 변형된 핵산, 핵산 유사체, 이의 조합 등의 서열을 포함한다.
저해성 폴리뉴클레오타이드는 타겟 유전자 산물의 발현을 직접(즉, 전사가 불필요함) 또는 간접적으로(즉, 전사 또는 전사와 번역이 필요함) 저해하는 뉴클레오타이드 서열을 포함하는 것으로 이해된다. 예컨대, 저해 폴리뉴클레오타이드는 화학적으로 합성된 뉴클레오타이드 서열, 또는 식물 세포, 조직 또는 기관에 도입되었을 때, 일시적이지만 원하는 타겟 유전자 산물의 발현을 직접적으로 침묵시키는 시험관내에서 만들어진 소형 간섭 RNA(siRNA) 또는 마이크로 RNA(miRNA)를 포함할 수 있다. 다른 예로, 저해성 폴리뉴클레오타이드는 센스 방향의 RNA, 안티센스 RNA, 이중 가닥 RNA(dsRNA), 헤어핀 RNA(hpRNA), 인트론-함유성 hpRNA, 촉매성 RNA, miRNA 등과 같이 원하는 유전자 산물의 발현을 침묵시키도록 설계된 저해성 뉴클레오타이드 분자를 코딩하는 뉴클레오타이드 서열을 포함할 수 있다. 또다른 예로, 저해성 폴리뉴클레오타이드는 mRNA를 코딩하는 뉴클레오타이드 서열을 포함할 수 있으며, 이의 번역으로 원하는 타겟 유전자 산물의 발현이나 기능을 저해하는 폴리펩타이드가 만들어진다. 이러한 방식으로, 저해성 폴리뉴클레오타이드는 저해성 뉴클레오타이드 분자를 코딩하는 뉴클레오타이드 서열 또는 폴리펩타이드에 대한 mRNA를 포함하는 경우, 코딩 서열은 식물에서 발현을 유도하는 프로모터에 작동가능하게 연결되어, 코딩된 저해성 뉴클레오타이드 분자 또는 mRNA가 발현될 수 있다.
저해성 서열은 타겟 유전자 산물의 명칭에 의해 본원에서 명기된다. 따라서, 예컨대, "α1,3-푸코실트랜스퍼라제(FucT) 저해성 서열"은 예컨대 전사 및/또는 번역 수준에서 FucT의 발현을 저해할 수 있거나 또는 FucT의 기능을 저해할 수 있는 저해성 서열을 나타낸다. 이와 유사하게, "β1,2-자일로실트랜스퍼라제(XylT) 저해성 서열"은 전사 및/또는 번역 수준에서 XylT의 발현을 저해할 수 있거나 또는 XylT의 기능을 저해할 수 있는 저해성 서열을 나타낸다. 폴리뉴클레오타이드 저해성 서열 측면에서 "저해할 수 있는"이라는 표현을 사용하는 경우, 이는 상기 저해성 서열 그 자체가 저해성 효과를 나타내는 것을 의미하는 것으로 의도되거나, 또는 저해성 서열이 저해성 뉴클레오타이드 분자(예, 헤어핀 RNA, miRNA 또는 이중 가닥 RNA 폴리뉴클레오타이드)를 코딩하거나, 또는 저해성 폴리펩타이드(즉, 타겟 유전자 산물의 발현 또는 기능을 저해하는 폴리펩타이드)를 코딩하는 경우, 이의 전사(예컨대 헤어핀 RNA, miRNA, 또는 이중 가닥의 RNA 폴리뉴클레오타이드의 경우에)나 전사 및 번역(저해성 폴리펩타이드를 코딩하는 저해성 서열의 경우) 이후에, 전사 산물 또는 번역 산물이 각각 타겟 유전자 산물에 저해 작용을 나타내는 것(즉, 타겟 유전자 산물의 발현 또는 기능을 저해함)을 의미하는 것으로 의도된다.
폴리뉴클레오타이드, 예컨대 원하는 뉴클레오타이드 구조 측면에서 용어 "도입하는"은, 폴리뉴클레오타이드가 식물의 세포 내부에 접근을 득하는 방식으로 식물에 폴리뉴클레오타이드가 존재하는 것을 의미하는 것으로 의도된다. 2 이상의 폴리뉴클레오타이드가 도입되는 경우, 이러한 폴리뉴클레오타이드는 단일 뉴클레오타이드 구조체의 일부분으로서 또는 별개의 뉴클레오타이드 구조체로서 조립될 수 있으며, 동일하거나 상이한 형질전환 벡터에 위치될 수 있다. 따라서, 이들 폴리뉴클레오타이드는 한번의 형질전환 수행으로서, 개별적인 형질전환 수행으로서, 또는 예컨대 식물에서 육종 프로토콜의 일부로서 원하는 숙주 세포에 도입할 수 있다. 본 발명의 방법은 폴리뉴클레오타이드(들)가 식물의 하나 이상의 세포 내부에 접근하는 것을 제외하고는, 식물에 하나 이상의 폴리뉴클레오타이드를 도입하는 특정한 방법에 의존되지 않는다. 폴리뉴클레오타이드를 식물에 도입하는 방법은 당업계에 공지되어 있으며, 일시적인 형질전환 방법, 안정적인 형질전환 방법 및 바이러스-매개성 방법을 포함하나, 이로 한정되는 것은 아니다.
폴리뉴클레오타이드 측면에서 "일시적인 형질전환"은 폴리뉴클레오타이드가 식물에 도입되어 식물의 게놈에 통합되지 않은 것을 의미하는 것으로 의도된다.
식물에 도입된 폴리뉴클레오타이드 측면에서 "안정적으로 도입하는" 또는 "안정적으로 도입된"은 도입된 폴리뉴클레오타이드가 안정적으로 식물 게놈에 도입되어 식물이 상기 폴리뉴클레오타이드로 안정적으로 형질전환된 것으로 의도된다.
"안정적인 형질전환" 또는 "안정적으로 형질전환된"은 식물에 도입된 폴리뉴클레오타이드, 예컨대 본원에 기재된 뉴클레오타이드 구조체가 식물의 게놈에 통합되어 그 후대에 유전될 수 있으며, 특히 여러 번의 연속적인 후대 세대에 유전될 수 있음을 의미하는 것으로 의도된다. 일부 예들에서, 연속적인 세대는 예컨대 클론 증식(clonal propagation)으로 생장 생산된 후대를 포함한다. 다른 예로, 연속적인 세대는 유성 생식을 통해 생산된 후대를 포함한다. 본원의 FucT 및/또는 XylT의 발현을 저해할 수 있는 하나 이상의 뉴클레오타이드 구조체가 "안정적으로 형질전환"된 고등 식물 숙주는 그 게놈에 통합된 뉴클레오타이드 구조체(들)를 가지며, 무성 또는 유성 생식에 의해 후대를 생산할 수 있으며, 또한 그 게놈에 안정적으로 통합된 저해성 뉴클레오타이드 구조체(들)를 포함하는 고등 식물 숙주를 의미하며, 따라서 후대는 거기에서 생산된 동종의 당단백질 및 이종의 당단백질의 N-글리칸에 α1,3-푸코스 및/또는 β1,2-자일로스 잔기의 부착 감소가 특징인 변형된 N-당화 패턴을 가진 원하는 표현형을 나타낼 것이다.
본원에서, 용어 "식물"은 전 식물(whole plant), 식물 기관(예, 잎, 줄기, 뿌리 등), 종자, 식물 세포 및 이의 후대를 포함한다. 형질전환 식물의 일부분은 본 발명의 범위내인 것으로 이해되며, 예컨대, 본 발명의 DNA 분자로 이미 형질전환된 형질전환 식물 또는 그 후대로부터 기원하여 따라서 일정 부분 이상의 형질전환 세포로 구성되는, 식물 세포, 프로토플라스트, 조직, 캘러스, 배아 뿐만 아니라 꽃, 배주, 줄기, 과실, 잎, 뿌리, 근단 등을 포함한다. 본원에서, 용어 "식물 세포"는 비제한적으로, 종자, 배아, 분열 영역, 캘러스 조직, 잎, 뿌리, 줄기, 배우체, 포자체, 꽃가루 및 미소체의 세포를 포함한다.
본 발명의 방법에 이용할 수 있는 식물 클래스는 일반적으로 넓게는 단자엽(monocot) 및 쌍자엽(dicot) 식물 등의, 형질전환 기법으로 변형가능한 고등 식물 클래스이다. 쌍자엽의 예로는 콩 등의 콩과 식물, 알파파, 담배, 감자, 토마토 등이 있지만, 이로 한정되는 것은 아니다. 단자엽의 예로는 옥수수, 벼, 귀리, 보리, 밀, 개구리밥 과의 식물, 목초 등이 있으나, 이로 한정되는 것은 아니다. "저급 식물(Lower-order plant)"은 양치류 식물(fern), 속새(horsetail), 석송(club moss), 이끼류(moss), 우산이끼(liverwort), 붕어마름(hornwort), 조류(algae), 예컨대 홍조류, 갈조류 및 녹조류, 양치 식물(pteridophyte)의 배우체(gametophyte), 포자체(sporophyte) 등의, 무화(non-flowering) 식물을 의미한다. 일부 예들에서, 원하는 식물은 개구리밥 과에 속하는 식물이다.
용어 "개구리밥"은 개구리밥 과(Lemnaceae)에 속하는 식물을 의미한다. 상기 과는 현재 5개의 속과 38개의 종의 개구리밥으로 분류된다: 렘나(Lemna) 속(렘나 에퀴녹티얼리스(Lemna aequinoctialis), 렘니 디스페르마(L. disperma), 렘나 에큐아도리엔시스(L. ecuadoriensis), 렘니 지바(L. gibba), 렘나 자포니카(L. japonica), 렘나 마이너(렘나 마이너), 렘나 미니스큘라(L. miniscula), 렘나 오브스큐라(L. obscura), 렘나 페르푸실라(L. perpusilla), 렘나 테네라(L. tenera), 렘나 트리술카(L. trisulca), 렘나 투리오니페라(L. turionifera), 렘나 발디비아나(L. valdiviana)); 스피로델라(Spirodela) 속(스피로델라 인테메디아(S. intermedia), 스피로델라 폴리리자(S. polyrrhiza), 스피로델라 푼크타타(S. punctata)); 울피아(Wolffia) 속(울피아 안구스타(Wa . angusta), 울피아 아리자(Wa . arrhiza), 울피아 아우스트랄리나(Wa . australina), 울피아 보레알리스(Wa . borealis ), 울피아 브라실리엔시스(Wa . brasiliensis), 울피아 컬럼비아나(Wa . columbiana), 울피아 엘롱가타(Wa . elongata), 울피아 글로보사(Wa . globosa), 울피아 마이크로스코피카(Wa . microscopica), 울피아 네글렉타(Wa . neglecta); 울피엘라(Wolfiella) 속(울피엘라 카우다타(Wl. caudata), 울피엘라 덴티큘라타(Wl . denticulata), 울피엘라 글라디아타(Wl . gladiata), 울피엘라 히알리나(Wl . hyalina), 울피엘라 린굴라타(Wl . lingulata), 울피엘라 레푼다(Wl . repunda), 울피엘라 로툰다(Wl . rotunda), 울피엘라 네오트로피카(Wl . neotropica)), 및 란돌티아(Landoltia) 속(란돌티아 푼크타타(L. punctata)). 그외 개구리밥과의 다른 속 또는 종 역시 본 발명에 포함된다. 렘나 종은 Landolt (1986) Biosystematic Investigation on the Family of Duckweeds. The family of Le , nnaceae - A Monograph Study(Geobatanischen Institut ETH, Stiftung Rubel, Zurich)에 기재된 분류표에 따라 분류될 수 있다.
용어 "개구리밥 결절(duckweed nodule)"은, 세포의 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%가 분화된 세포인, 개구리밥 세포를 포함하는 개구리밥 조직을 의미한다. "분화된 세포"는 본원에서 미분화 세포 또는 다른 조직 유형에서 발견되는 세포와 구별되는, 적어도 하나 이상의 표현형 특징(예, 특이한 세포 형태 또는 마커 핵산 또는 단백질의 발현)을 가진 세포이다. 본원에 개시된 개구리밥 결절 배양물의 분화된 세포는, 이의 인접한 세포 벽들이 융합되어 상호연결된 세포의 타일 형태로 덮힌 평활면을 형성하며, 조직 전역에 산재된 잎의 원시 세포로 조직화되기 시작하는 결절을 가진다. 결절 배양물의 조직 표면은 플라스마데스마타(plasmadesmata)를 통해 서로 연결된 상피 세포를 가진다. 개구리밥 과 식물은 클론 증식(clonal propagation)에 의해 생식하므로, 따라서 클론 증식하는 식물의 예가 된다.
본원에서 "개구리밥 선호 코돈"은 개구리밥에서의 코돈 사용 빈도가 17% 이상인 코돈을 의미한다.
"렘나 선호 코돈"은 본원에서 렘나 종에서의 코돈 사용 빈도가 17% 이상인 코돈을 의미한다.
"렘나 지바 코돈"은 본원에서 렘나 지바 식물에서의 코돈 사용 빈도가 17% 이상인 코돈을 의미하며, 렘나 지바에서의 코돈 사용 빈도는 코돈 사용 데이타베이스(GenBank Release 113,0; at http://www.kazusa.or.jp/codon/cgibin/showcodon.cgi?species=Lemna+gibba+[gbpln])에서 볼 수 있다.
"번역 개시 코돈"은 원하는 뉴클레오타이드 서열로부터 전사된 mRNA의 번역을 개시하는 코돈을 의미한다.
"번역 개시 관여 뉴클레오타이드 서열(Translation initiation context nucleotide sequence)"은 본원에서 5' 번역 개시 코돈의 뉴클레오타이드 3개를 의미한다.
"분비"는 본원에서 숙주 세포의 세포막(plasma membrane)과 세포벽 둘다를 통과하는 폴리펩타이드의 전좌를 의미한다.
"작동가능하게 연결된"은 본원에서 뉴클레오타이드 서열을 참조하여 서로 기능적인 상호 관련하에 배치된 다수개의 뉴클레오타이드 서열을 의미한다. 일반적으로, 작동가능하게 연결된 DNA 서열은 연속적이며, 필요에 따라 리딩 프래임내에 2개의 단백질 코딩 부위가 연결되어 있다.
분리된 폴리뉴클레오타이드 폴리펩타이드
본 발명은 식물 N-연결된 글리칸 (또한, "N-글리칸"이라 함), 특히 개구리밥 과 식물인 렘나 마이너에서 동정된 α1,3-푸코실트랜스퍼라제(FucT) 및 β1,2-자일로실트랜스퍼라제(XylT)의 추가적인 변형에 관여하는 분리된 폴리뉴클레오타이드 및 폴리펩타이드, 이들 폴리뉴클레오타이드와 폴리펩타이드의 변이체 및 단편을 제공한다. 이들 단백질들 중 어느 하나 또는 둘다, 또는 이의 생물학적 활성을 가진 변이체의, 이들 단백질을 발현하는 식물에서의 발현 저해로, 당단백질 N-글리칸에 α1,3-푸코스 및 β1,2-자일로스 잔기의 부착이 감소된 N-당화 패턴이 만들어진다. 본 발명의 일부 예들에서, 본원의 방법은 N-연결된 글리칸에 α1,3-푸코스 및 β1,2-자일로스 잔기가 결여된 식물내에서 생산된 당단백질의 N-당화 패턴을 형성하는, FucT 및 XylT 발현의 완전한 저해를 제공한다.
렘나 마이너 알파 1-3 푸코실트랜스퍼라제(FucT)의 5'- 및 3'- UTR을 포함한 전장의 cDNA 서열을 도 1에 나타내며, 또한 서열번호 1(서열번호 2에 기재된 오픈 리딩 프래임)로 나타낸다. 이로부터 예측되는 아미노산 서열은 서열번호 3에 나타낸다. 렘나 마이너 FucT 유전자의 2종 이상의 이소형이 동정되었으며, 이들 이소형간의 상동성은 약 90%이다. 코팅된 단백질은 다른 고등 식물의 기타 FucT와 일부 유사성을 공유하고 있다. 도 2를 참조한다. 예컨대, 렘나 마이너의 FucT 서열은 도 2에 나타낸 아라비돕시스 탈리아나의 FucT와 약 50.1%의 서열 동일성을 공유하고 있다.
렘나 마이너 β1-2 자일로실트랜스퍼라제(XylT)(이소형 #1)의 5'- 및 3'- UTR을 포함한 전장의 cDNA 서열을 도 3과 서열번호 4(서열번호 5의 ORF)에 나타낸다. 이로부터 예측되는 아미노산 서열은 서열번호 6에 나타낸다. 렘나 마이너 XylT 유전자의 2종 이상의 이소형이 동정되었으며, 이들 이소형간의 상동성은 약 90%이다. 코팅된 단백질은 다른 고등 식물의 기타 XylT와 일부 유사성을 공유하고 있다. 도 4를 참조한다. 예컨대, 렘나 마이너의 XylT 서열은 도 4에 나타낸 아라비돕시스 탈리아나의 XylT와 약 56.4%의 서열 동일성을 공유하고 있다. 렘나 마이너 β1-2 자일로실트랜스퍼라제(XylT)(이소형 #2)의 경우, 3'-UTR을 포함하는 cDNA 부분 서열을 도 31과 서열번호 19(서열번호 20의 ORF)에 나타낸다. 이로부터 예측되는 아미노산 서열은 서열번호 21에 나타낸다. 도 32에 정렬에서 알 수 있는 바와 같이. XylT 이소형 #2의 부분 서열은 전장 XylT 이소형 #1의 대응 부위와 높은 서열 동일성을 공유하고 있다.
본 발명은 분리되거나 또는 실질적으로 정제된 폴리뉴클레오타이드 또는 단백질 조성물을 포함한다. "분리된" 또는 "정제된" 폴리뉴클레오타이드 또는 단백질, 또는 이의 생물학적으로 활성인 부분은, 이의 자연적으로 생성되는 환경에서 발견되는 폴리뉴클레오타이드나 단백질을 정상적으로 수반하거나 이와 상호작용하는 구성 요소가 실질적으로 또는 본질적으로 결여되어 있다. 따라서, 분리된 또는 정제된 폴리뉴클레오타이드 또는 단백질은 재조합 기법에 의해 생산되었을 때 다른 세포성 물질이나 배양 배지가 실질적으로 결여되어 있거나, 또는 화학적으로 합성하였을 때 화학적 전구체나 다른 화합물이 실질적으로 결여되어 있다. 선택적으로, "분리된" 폴리뉴클레오타이드는 상기 폴리뉴클레오타이드가 유래된 유기체의 게놈 DNA에서 천연적으로 상기 폴리뉴클레오타이드에 측면에 위치한 서열(선택적으로는 단백질 코딩 서열)(즉, 상기 폴리뉴클레오타이드의 5' 및 3' 말단에 있는 서열)이 없는 상태이다. 예컨대, 다양한 예로, 분리된 폴리뉴클레오타이드는 상기 폴리뉴클레오타이드가 유래된 세포의 게놈 DNA에서 천연적으로 상기 폴리뉴클레오타이드의 측면으로 위치하던 뉴클레오타이드 서열 보다 약 5 kb, 4 kb, 3kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb 미만으로 짧은 서열을 포함할 수 있다. 실질적으로 세포성 물질이 결여된 단백질은 오염 단백질이 약 30%, 20%, 10%, 5%, 또는 1%(건조 중량) 미만으로 있는 단백질 조제물을 포함한다. 본 발명의 단백질 또는 이의 생물학적으로 활성인 부분을 재조합으로 생산하는 경우, 최적으로는, 배양 배지는 화학적 전구체나 원하는 단백질 이외의 화합물(non-protein-of-interest chemical)을 약 30%, 20%, 10%, 5%, 또는 1%(건조 중량) 미만으로 나타낸다.
렘나 마이너 FucT 유전자에 대한 코딩 서열은 서열번호 1의 243-1715 뉴클레오타이드(nt)와 서열번호 2에 나타내며, 코딩된 FucT 폴리펩타이드의 아미노산 서열은 서열번호 3으로 나타낸다. 렘나 마이너 XylT 이소형 #1 유전자에 대한 코딩 서열은 서열번호 4의 63-1592 뉴클레오타이드(nt)와 서열번호 5에 나타내며, 코딩된 XylT 폴리펩타이드의 아미노산 서열은 서열번호 6으로 나타낸다. 렘나 마이너 XylT 이소형 #2 유전자의 일부분에 대한 코딩 서열은 서열번호 19의 1-1276 뉴클레오타이드(nt)와 서열번호 20에 나타내며, 코딩된 XylT 폴리펩타이드 일부분의 아미노산 서열은 서열번호 21로 나타낸다.
특히, 본 발명은 서열번호 3, 6 및 21에 나타낸 아미노산 서열을 코딩하는 뉴클레오타이드 서열을 포함하는 분리된 폴리뉴클레오타이드를 제공한다. 또한, 본원의 폴리뉴클레오타이드, 예컨대 서열번호 1, 2, 4, 5, 19 및 20에 기재된 폴리뉴클레오타이드, 및 이의 단편 및 변이체에 의해 코딩되는 아미노산 서열을 가지는 폴리펩타이드를 제공한다. 이들 뉴클레오타이드 서열의 상보체를 포함하는 핵산 분자도 제공한다.
FucT 및/또는 XylT 유전자의 코딩 서열을, 코딩된 FucT 및/또는 XylT의 과다 발현을 위해 식물에서 발현시킬 수 있는 것으로 생각된다. 그러나, 이들 단백질의 발현을 억제 또는 저해하기 위한 목적으로, 서열번호 1, 2, 4, 5, 19, 및 20의 각 뉴클레오타이드 서열을 사용하여, 각각의 FucT 및/또는 XylT 단백질의 발현을 억제하기 위한 구조체를 제작할 수 있을 것이다. 따라서, FucT 단백질을 억제한다는 측면에서, 폴리뉴클레오타이드는, FucT 코딩 서열 또는 발현시켰을 때, 후술되는 바와 같이 직접 또는 간접 억제를 통해, FucT 유전자의 발현을 억제 또는 저해하는 폴리뉴클레오타이드를 의미한다. 이와 유사하게, XylT 단백질을 억제 또는 저해한다는 측면에서, 폴리뉴클레오타이드는, XylT 코딩 서열 또는 발현시켰을 때, 후술되는 바와 같이 직접 또는 간접 억제를 통해, XylT 유전자의 발현을 억제 또는 저해하는 폴리뉴클레오타이드를 의미한다.
언급된 폴리뉴클레오타이드와 이로부터 코딩되는 단백질의 단편 및 변이체도 본 발명에 포함된다. "단편"은 FucT 또는 XylT 폴리뉴클레오타이드의 일부분 또는 이로부터 코딩되는 FucT 또는 XylT 아미노산 서열의 일부분을 의미한다. 폴리뉴클레오타이드의 단편은 천연 단백질의 생물학적 활성을 유지하여, 명세서의 도처에 언급된 바와 같은 FucT 또는 XylT 활성을 가지고 있는, 단백질 단편을 코딩할 수 있다. 다른 예로, 혼성화 프로브로서 유용한 폴리뉴클레오타이드의 단편은 생물학적 활성을 유지하고 있는 단편 단백질을 코딩하진 않는다. FucT 또는 XylT 폴리뉴클레오타이드의 단편은 FucT 및/또는 XylT 폴리펩타이드의 발현을 억제하기 위한 저해성 서열로 제작하기 위해 사용할 수 있다. 따라서, 예컨대 뉴클레오타이드 서열의 단편 길이는 약 적어도 약 15 뉴클레오타이드, 20 뉴클레오타이드, 약 50 뉴클레오타이드, 약 100 뉴클레오타이드, 약 150 뉴클레오타이드, 약 200 뉴클레오타이드, 약 250 뉴클레오타이드, 약 300 뉴클레오타이드, 약 350 뉴클레오타이드, 약 400 뉴클레오타이드, 약 450 뉴클레오타이드, 약 500 뉴클레오타이드, 약 550 뉴클레오타이드, 약 600 뉴클레오타이드, 약 650 뉴클레오타이드, 약 700 뉴클레오타이드, 약 750 뉴클레오타이드, 약 800 뉴클레오타이드, 및 최대 본 발명의 단백질을 코딩하는 전장 폴리뉴클레오타이드의 길이일 수 있다.
본 발명의 FucT 단백질의 생물학적인 활성인 부분을 코딩하는 FucT 폴리뉴클레오타이드의 단편은 적어도 15, 25, 30, 50, 100, 150, 200, 250, 300, 350, 400, 450, 475, 500개 이상의 연속적인 아미노산, 또는 본 발명의 전장 FucT 단백질에 존재되는 아미노산 전체(예, 서열번호 3의 경우 509개 아미노산)를 코딩할 것이다. 본 발명의 XylT 단백질의 생물학적인 활성인 부분을 코딩하는 XylT 폴리뉴클레오타이드의 단편은 적어도 15, 25, 30, 50, 100, 150, 200, 250, 300, 350, 400, 450, 475개 이상의 연속적인 아미노산, 또는 본 발명의 전장 XylT 단백질에 존재되는 아미노산 전체(예, 서열번호 3의 경우 490개 아미노산)를 코딩할 것이다. 본 발명의 XylT 단백질 일부분의 생물학적인 활성인 부분을 코딩하는 XylT 폴리뉴클레오타이드의 단편은 적어도 15, 25, 30, 50, 100, 150, 200, 250, 300, 350, 400개 이상의 연속적인 아미노산, 또는 본 발명의 XylT 단백질 일부분에 존재되는 아미노산 전체(예, 서열번호 21의 경우 490개 아미노산)를 코딩할 것이다.
따라서, FucT 또는 XylT 폴리뉴클레오타이드의 단편은 각각 FucT 또는 XylT 단백질의 생물학적으로 활성인 부분을 코딩할 수 있거나, 또는 혼성화 프로브나 PCR 프라이머로 사용될 수 있거나 후술되는 방법을 이용하여 억제용 저해성 서열을 제작하는데 사용할 수 있는 단편일 수 있다. FucT 또는 XylT 단백질의 생물학적으로 활성인 부분은, 각각 본 발명의 FucT 또는 XylT 폴리뉴클레오타이드 중 어느 하나의 일부분을 분리하고, 코딩되는 FucT 또는 XylT 단백질 영역을 (예컨대, 시험관내 재조합 발현에 의해) 발현시킨 후, 코딩된 FucT 또는 XylT 폴리펩타이드 영역의 활성을 평가함으로써, 준비할 수 있다. FucT 또는 XylT 뉴클레오타이드 서열의 단편인 폴리뉴클레오타이드는 적어도 15, 20, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 또는 1450개의 연속적인 뉴클레오타이드, 또는 최대 본원의 FucT 또는 XylT 폴리뉴클레오타이드에 존재되는 뉴클레오타이드 수를 포함할 수 있다(예, 서열번호 1, 2, 3, 5, 19 및 20의 경우 각각 1865, 1473, 1860, 1530, 1282, 또는 1275개의 뉴클레오타이드).
"변이체"는 실질적으로 유사한 서열을 의미한다. 폴리뉴클레오타이드에서, 변이체는 천연 폴리뉴클레오타이드내 한 곳 이상에서의 하나 이상의 뉴클레오타이드의 결손 및/또는 부가, 및/또는 천연 폴리뉴클레오타이드의 한 곳 이상에서 하나 이상의 뉴클레오타이드의 치환을 포함한다. 본원에서, "천연" 폴리뉴클레오타이드 또는 폴리펩타이드는 각각 자연적으로 생성되는 뉴클레오타이드 서열 또는 아미노산 서열을 포함한다. 폴리뉴클레오타이드의 경우, 보존적인 변이체는 유전자 코드의 축중(degeneracy)으로 인해, 본 발명의 FucT 또는 XylT 폴리펩타이드 중 어느 하나의 아미노산 서열을 코딩하는 서열을 포함한다. 이와 같은 자연적으로 생성되는 대립유전자 변이체는 잘 공지되어 있는 분자 생물학적 기법, 예컨대 후술되는 바와 같은 중합효소 연쇄 반응(PCR) 및 혼성화 기법으로 식별할 수 있다. 또한, 변이체 폴리뉴클레오타이드는 예컨대 부위 특이적인 돌연변이 유발을 이용하여 제조된 바와 같은, 합성에 의해 파생되는 폴리뉴클레오타이드를 포함하지만, 여전히 본 발명의 FucT 또는 XylT 단백질을 코딩한다. 일반적으로, 본 발명의 구체적인 폴리뉴클레오타이드(예, 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20, 이의 단편 및 상보체)의 변이체는 본원에 기재된 서열 정렬 프로그램 및 파라미터에 의해 결정된 바에 따라 구체적인 폴리뉴클레오타이드와 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가질 것이다.
본 발명의 특정 폴리뉴클레오타이드(즉, 기준 폴리뉴클레오타이드)의 변이체는 또한 변이체 폴리뉴클레오타이드에 의해 코딩되는 폴리펩타이드와 상기 기준 폴리뉴클레오타이드에 의해 코딩되는 폴리뉴클레오타이드 사이의 서열 동일성%를 비교함으로써, 확인할 수 있다. 따라서, 예컨대 각각 서열번호 3, 서열번호 6, 또는 서열번호 21의 FucT 또는 XylT 폴리펩타이드와 주어진 서열 상동성%를 가지는 폴리펩타이드를 코딩하는 분리된 폴리뉴클레오타이드가 확인된다. 임의의 2개의 폴리펩타이드 사이의 서열 동일성 %는 본원에 언급된 서열 정렬 프로그램과 파라미터를 이용하여 계산할 수 있다. 본 발명의 임의의 주어진 쌍의 폴리뉴클레오타이드를 이들이 코딩하는 2개의 폴리펩타이드에 의해 공유되는 서열 동일성 %를 비교하여 평가하는 경우, 코딩되는 2개의 폴리펩타이드 사이의 서열 동일성%는 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상이다.
"변이체" 단백질은 천연 단백질내 한 곳 이상에서의 하나 이상의 아미노산의결손 및/또는 부가, 및/또는 천연 단백질의 한 곳 이상에서 하나 이상의 아미노산의 치환에 의해, 천연 단백질로부터 파생되는 단백질을 의미한다. 본 발명은 생물학적으로 활성인, 천연 단백질의 바람직한 생물학적 활성을 계속해서 가지는, 즉 본원에 언급된 바와 같이, 식물에서 당단백질 N-글리칸에 α1,3-연결된 푸코스 잔기(FucT의 활성) 또는 β1,2-연결된 자일로스 잔기(XylT의 활성)를 부착시키는 효소적 활성을 가지고 있는 변이체 단백질을 고려한다. 이러한 변이체들은 예컨대 유전자 다형성이나 인간 조작으로부터 만들어질 수 있다. 본 발명의 천연 FucT 또는 XylT 단백질의 생물학적 활성을 가진 변이체는, 본 발명에 언급된 서열 정렬 프로그램과 파라미터에 의해 결정된 바에 따라, 천연 단백질에 대한 아미노산 서열과 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가질 것이다. 본 발명의 단백질의 생물학적 활성을 가진 변이체는 적게는 1-15개의 아미노산 잔기, 적게는 1-10개, 예컨대 6-10개, 적게는 5개, 적게는 4, 3, 2, 또는 심지어 1개의 아미노산 잔기가 상기 단백질과 다를 수 있다.
본 발명의 단백질을 아미노산 치환, 결손, 절단(truncation) 및 삽입 등의 다양한 방법으로 변형시킬 수 있다. 이러한 조작은 통상적으로 당업계에 공지되어 있다. 예컨대, FucT 및 XylT 단백질의 아미노산 서열 변이체 및 단편은 DNA의 돌연변이에 의해 만들 수 있다. 돌연변이 유발 및 폴리뉴클레오타이드 변형 방법은 당업계에 잘 알려져 있다. 예로, Kunkel (1985) Proc . Natl . Acad . Sci . USA 82:488-492; Kunkel et al . (1987) Methods in Enzymol . 154:367-382; 미국 특허 4,873,192; Walker and Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York)과 이에 참조된 문헌을 참조한다. 원하는 단백질의 생물학적인 활성에 영향을 미치지 않는 적합한 아미노산 치환을 하기 위한 지침은 Dayhoff et al . (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.) 모델에서 확인할 수 있으며, 이 문헌은 원용에 의해 본 명세서에 포함된다. 유사한 성질을 가진 다른 아미노산으로 아미노산 하나를 치환하는 것과 같은 보존적인 치환이 최적일 수 있다.
따라서, 본 발명의 폴리뉴클레오타이드는 자연적으로 생성되는 FucT 및 XylT 서열 뿐 아니라 돌연변이 형도 포함한다. 이처럼, 본 발명의 단백질은 자연적으로 생성되는 FucT 및 XylT 단백질 둘 다와 이의 변이체와 변형체를 포함한다. 이러한 변형체는 원하는 활성을 계속 가질 것이다. 따라서, 기능성 단백질의 발현이 바람직한 경우, 발현된 단백질은 바람직한 FucT 또는 XylT 활성, 즉 본원에 언급된 바와 같이 식물에서 당단백질 N-글리칸에 α1,3-연결된 푸코스 잔기(FucT의 활성) 또는 β1,2-연결된 자일로스 잔기(XylT의 활성)를 부착시키는 효소 활성을 가질 것이다. FucT 및/또는 XylT 폴리펩타이드의 발현이나 기능의 저해가 목적인 경우, 변이체 폴리뉴클레오타이드 또는 폴리펩타이드의 바람직한 활성은 각각의 FucT 및/또는 XylT 폴리펩타이드의 발현 또는 기능을 저해하는 활성이다. 명백하게는, 기능성 FucT 및/또는 XylT 폴리펩타이드의 발현이 바람직한 경우, 변이체를 코딩하는 DNA를 만들게 될 돌연변이는 리딩 프래임 이외 서열에 위치되어서는 안되며, 이차 mRNA 구조를 만들 수 있는 상보적인 영역을 만들게 되는 것이 최상이다. 유럽 특허 출원 공개공보 75,444를 참조한다.
기능성 단백질이 바람직한 경우, 본원에서 고려되는 단백질 서열의 결손, 삽입 및 치환은 단백질의 특징에 극단적인 변화(radical change)를 형성할 것으로 예상되지 않는다. 그러나, 나아가 그러한 치환, 결손 또는 삽입의 실제 효과를 예측하기 어려운 경우, 당업자는 하기 실험 부분에 기재된 FucT 및 XylT 활성을 모니터링하는 분석을 포함하여, 일상적인 스크리닝 분석으로 효과를 평가할 것으로 이해할 것이다.
또한, 변이체 폴리뉴클레오타이드 및 단백질은 DNA 셔플링(shuffling)과 같은 돌연변이 과정 및 재조합 과정으로부터 파생되는 서열과 단백질을 포함한다. 그러한 과정으로, 하나 이상의 상이한 FucT 또는 XylT 코딩 서열을 조작하여 원하는 특성을 가지는 새로운 FucT 또는 XylT 단백질을 만들 수 있다. 이러한 방식으로, 실질적인 서열 동일성을 가지며, 시험관내 및 생체내에서 상동적으로 재조합할 수 있는, 서열 영역을 포함하는 관련 서열 폴리뉴클레오타이드의 집단으로부터, 재조합 폴리뉴클레오타이드 라이브러리를 만든다. 예컨대, 이러한 방법을 이용하여, 원하는 도메인을 코딩하는 서열 모티브를 본 발명의 FucT 또는 XylT 유전자와 그외 공지된 FucT 또는 XylT 유전자 사이에 셔플링시켜, 원하는 개선된 특성을 가진 단백질을 코딩하는 새로운 유전자를 수득할 수 있다. 이러한 DNA 셔플링 전략은 당업계에 공지되어 있다. 예로, Stemmer (1994) Proc . Natl . Acad . Sci . USA 91:10747-10751; Stemmer (1994) Nature 370:389-391; Crameri et al . (1997) Nature Biotech . 15:436-438; Moore et al . (1997) J. Mol . Biol . 272:336-347; Zhang et al . (1997) Proc. Natl . Acad . Sci . USA 94:4504-4509; Crameri et al . (1998) Nature 391:288-291; 및 미국 특허 5,605,793 및 5,837,458을 참조한다.
서열 비교 및 2종의 서열간의 동일성%과 유사성% 결정은 수학적 알고리즘을 이용하여 수행할 수 있다. 바람직한 예에서, 2종의 아미노산 서열간의 동일성%는 GCG 프로그램 팩키지(www.accelrys.com)에 들어있는 GAP 프로그램에 도입된 Needleman and Wunsch (1970) J. Mol . Biol . 48:444-453 알고리즘을, BLOSSUM62 매트릭스 또는 PAM250 매트릭스, 그리고 갭 웨이트 16, 14, 12, 10, 8, 6, 또는 4와 길이 웨이트(length weight) 1, 2, 3, 4, 5, 또는 6을 이용하여 결정한다. 또다른 바람직한 예에서, 2개의 뉴클레오타이드 서열 간의 동일성%는 GCG 소프트웨어 팩키지의 GAP 프로그램을 BLOSUM62 스코링 매트릭스(scoring matrix)(Henikoff et al . (1989) Proc. Natl . Acad . Sci . USA 89:10915)와 갭 웨이트 40, 50, 60, 70, 또는 80, 그리고 길이 웨이트 1, 2, 3, 4, 5, 또는 6을 이용하여 결정한다. 특히 바람직한 파라미터 세트(그리고 분자가 본 발명의 서열 동일성 범위 내인지를 결정하기 위해 어떤 파라미터를 적용해야하는지 실무자가 확신하지 못할 때 사용하여야 하는 세트)는 BLOSUM62 스코링 매트릭스, 갭 웨이트 60 그리고 길이 웨이트 3을 이용하는 것이다.
2개의 아미노산 또는 뉴클레오타이드 서열 사이의 서열 동일성은 ALIGN 프로그램(version 2.0)에 도입되어 있으며, PAM120 웨이트 잔기 테이블, 갭 길이 패널티 12 및 갭 패널티 4를 이용하는, Meyers and Miller (1989) CABIOS 4:11-17 알고리즘을 이용하여 결정할 수 있다.
2개의 핵산 분자가 밀접하게 관련 있음을 나타내는 다른 방법은, 2개의 분자를 엄격 조건하에서 서로 혼성하는 것이다. 엄격 조건은 서열-의존적이며, 여러가지 환경 파라미터에 따라 달라진다. 일반적으로, 엄격 조건은 규정된 이온 세기 및 pH에서 특정 서열에 대한 열 융점(Tm) 보다 약 5 ℃ 내지 20 ℃ 낮게 선택된다. Tm은 타겟 서열의 50%가 완벽하게 일치되는 프로브에 혼성화하는 온도이다(규정된 이온 세기 및 pH 하에서). 핵산 혼성화 조건과 엄격성 계산은, 예컨대, Sambrook et al . (2001) Molecular Cloning : A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) 및 Tijssen (1993) Hybridization With Nucleic Acid Probes, Part I: Theory and Nucleic Acid Preparation (Laboratory Techniques in Biochemistry and Molecular Biology, Elsevier Science Ltd., NY, NY)에서 볼 수 있다.
본 발명의 목적에서, "엄격 조건"은 혼성 분자와 타겟 서열 사이의 미스매치가 25% 미만인 경우에만 혼성화가 이루어지도록 하는 조건을 포함한다. "엄격 조건"은 보다 정확한 명시를 위해 특정 엄격 수준으로 분류될 수 있다. 따라서, 본원에서, "온화한 엄격성(moderate stringency)" 조건은 서열 미스매치가 25% 이상인 분자들이 혼성화되지 않게 하는 조건이고; "중간 수준의 엄격성" 조건은 미스매치가 15% 이상인 분자들이 혼성화되지 않게 하는 조건이고, "고 엄격성" 조건은 미스매치가 10% 이상인 서열들이 혼성화되지 않게 하는 조건이다. "매우 높은 엄격성" 조건은 미스매치가 6% 이상이 서열들이 혼성화되지 않게 하는 조건이다.
본 발명의 FucT 및 XylT 폴리뉴클레오타이드는 다른 유기체, 보다 구체적으로는 다른 식물 종에서 대응되는 상동적인 서열의 분리를 위한 프로브로서 사용할 수 있다. 이러한 방식으로, PCR, 혼성화 등과 같은 방법을 이용하여, 본 발명의 서열과 서열 상동성을 기초로 그러한 서열을 동정할 수 있다. 예로, Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York) and Innis et al. (1990), PCR Protocols: A Guide to Methods and Applications (Academic Press, New York)을 참조한다. 본 발명의 전체 FucT 또는 XylT 폴리뉴클레오타이드에 대한 서열 상동성을 기초로 분리된 폴리뉴클레오타이드 서열(즉, FucT: 서열번호 1 및 2; 서열번호 6의 XylT 이소형 #1: 서열번호 4 및 5; 서열번호 21의 XylT 이소형 #2: 서열번호 19 및 20), 또는 그 단편 및 변이체도 본 발명에 포함된다.
PCR 방법에서, 임의의 목적 유기체로부터 추출한 cDNA 또는 게놈 DNA로부터 유래된 대응되는 DNA 서열을 증폭하기 위한 PCR 반응에 사용하기 위해 올리고뉴클레오타이드 프라이머를 제작할 수 있다. 공지된 PCR 방법은 쌍을 이룬 프라이머(paired primer), 네스티드 프라이머(nested primer), 단일 특이적인 프라이머(single specific primer), 축중 프라이머(degenerate primer), 유전자 특이적인 프라이머(gene-specific primer), 벡터 특이적인 프라이머, 부분-미스매치되는 프라이머(partially-mismatched primer) 등을 이용하는 방법이 있으나, 이로 한정되는 것은 아니다. PCR 프라이머 및 PCR 클로닝에 대한 방법은 당업계에 일반적으로 공지되어 있으며, Sambrook et al. (1989) Molecular Cloning : A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)에 기재되어 있다. 또한, Innis et al., eds. (1990) PCR Protocols : A Guide to Methods and Applications (Academic Press, New York); Innis and Gelfand, eds. (1995) PCR Strategies (Academic Press, New York); 및 Innis and Gelfand, eds. (1999) PCR Methods Manual (Academic Press, New York)을 참조한다.
혼성화 방법에서, 공지된 뉴클레오타이드 서열의 전체 또는 일부를 다른 목적 유기체의 클로닝한 게놈 DNA 단편 또는 cDNA 단편의 집단(즉, cDNA 또는 게놈 라이브러리)에 존재되는 그외 대응되는 폴리뉴클레오타이드에 선택적으로 혼성화하는 프로브로서 사용할 수 있다. 이른바 혼성화 프로브는 게놈 DNA 단편, cDNA 단편, RNA 단편 또는 그외 올리고뉴클레오타이드일 수 있으며, 32P와 같이 검출가능한 그룹이나 그외 임의의 검출성 마커로 표지될 수 있다. 혼성화용 프로브는 목적 뉴클레오타이드 서열, 예컨대 본 발명의 FucT 또는 XylT 폴리뉴클레오타이드를 기초로 한 합성 올리고뉴클레오타이드를 표지함으로써 만들 수 있다. 공지된 뉴클레오타이드 또는 코딩된 아미노산 서열에서 보존된 뉴클레오타이드나 아미노산 잔기를 기초로 제작한 축중 프라이머를 부가적으로 사용할 수 있다. cDNA 및 게놈 라이브러리 구축 방법과 혼성 프로브 제조 방법은 일반적으로 당업계에 공지되어 있으며, Sambrook et al. (1989) Molecular Cloning : A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)에 언급되어 있으며, 상기 문헌은 원용에 의해 본 발명에 포함된다.
예컨대, 구체적으로 공지된 FucT 또는 XylT 폴리뉴클레오타이드 서열의 전체 또는 일부를 다른 FucT 또는 XylT 뉴클레오타이드 및 메신저 RNA에 선택적으로 혼성화하는 프로브로서 사용할 수 있다. 다양한 조건하에서 특이적인 혼성화를 달성하기 위해, 상기 프로브는 고유 서열을 포함하고 길이가 적어도 약 10개의 뉴클레오타이드인 것이 바람직하고, 더 바람직하기로는 길이가 적어도 약 20개 이상의 뉴클레오타이드이다. 이러한 기법을 사용하여 원하는 유기체로부터 그외 대응되는 FucT 또는 XylT 뉴클레오타이드 서열을 분리할 수 있으며, 또는 진단적 분석으로서 사용하여 유기체내 FucT 또는 XylT 코딩 서열의 존재를 결정할 수 있다. 혼성화 기법은 접종된 DNA 라이브러리의 혼성화 스크리닝(hybridization screening of plated DNA library)을 포함한다(플라그 또는 콜로니, 예로 Innis et al., eds. (1990) PCR Protocols : A Guide to Methods and Applications (Academic Press, New York) 참조).
따라서, 천연의 FucT 및 XylT 폴리뉴클레오타이드 및 이의 단편과 변이체 뿐만 아니라, 본 발명의 분리된 폴리뉴클레오타이드는, 본 발명의 FucT 또는 XylT 폴리뉴클레오타이드로부터 수득되는 전체 또는 부분 서열과의 혼성화에 의해 다른 유기체로부터 동정 및 분리된 상동적인 DNA 서열 또는 그 변이체를 포함한다. 본원의 DNA 서열과 다른 DNA 서열의 혼성화를 허용하는 조건은 당업계에 통상적으로 공지된 기법에 따라 결정할 수 있다. 예로, 그러한 서열의 혼성화는 전술한 바와 같이, 온화한, 중간의, 높은 또는 매우 높은 엄격성과 같은 다양한 조건하에서 수행할 수 있다.
본 발명의 방법
본 발명은 고등 식물, 특히 재조합 단백질, 특히 약학적으로 관심이 있는 재조합 포유류 단백질을 생산하기 위한 숙주로서 제공되는 고등 식물에서 단백질의 당화 패턴을 변형시키는 방법에 관한 것이다. 포유류에서 발견되는 패턴과 훨씬 더 유사한 N-당화 패턴을 가진 재조합 단백질을 생산할 수 있는 고등 식물의 생산에 이용된다. 본 발명의 조성물은 변형된 N-당화 패턴을 가진 이들의 내인적이고(즉, 동종의) 재조합으로 생산된 단백질을 포함하도록 안정적으로 형질전환된 고등 식물을 포함한다. 일부 예들에서, 고등 식물은, 식물에서 생산되는 동종의 그리고 이종의 당단백질의 N-글리칸에 α1,3-푸코스 잔기의 식물 특이적인 부착을 감소시키도록 변형된 당화 장치를 가지고 있지 않은, 대조군 식물에서 생산된 mAb에 비해, 강화된 ADCC 활성을 가진 포유류 단백질에 대한 단일클론 항체(mAb)를 생산하는 형질전환 식물이다.
본 발명의 방법은 고등 식물에서 컴플렉스 당단백질의 생산에 관여되는 효소 중 어느 하나 또는 둘다의 발현 억제(즉, 저해)를 타겟으로 한다. 특히 관심을 가지는 것은, 푸코실트랜스퍼라제나 이의 하나 이상의 이소형의 억제, 자일로실트랜스퍼라제나 이의 하나 이상의 이소형의 억제, 또는 상기 2종의 단백질 모두와 이들 하나 이상의 이소형의 발현 억제이다. 푸코실트랜스퍼라제 및/또는 자일로실트랜스퍼라제, 이의 하나 이상의 이소형의 억제는 일시적으로 달성할 수 있는 것으로 생각된다. 다른 예로, 푸코실트랜스퍼라제 및/또는 자일로실트랜스퍼라제의 발현을 안정적으로 억제함으로써, 포유류, 특히 인간에서 발견되는 패턴과 훨씬 더 유사한 N-당화 패턴을 가진 당단백질을 생산하는 능력을, 무성 또는 유성 생식으로 세대에서 세대로 전달하는 형질전환 고등 식물을 만드는 것이 가능하다. 이는, 당단백질 N-글리칸에 식물 β1,2-연결된 자일로스 잔기 및/또는 α1,3-연결된 푸코스 잔기의 부착이 감소된 재조합 포유류 당단백질 생산하는데 유리하다.
식물, 예컨대 단자엽 또는 쌍자엽 식물, 예컨대 개구리밥 식물에서 이들 단백질 하나 또는 이롭게는 둘다의 발현 저해는, 당업계에 공지된 임의 방법을 이용하여 수행할 수 있다. 이러한 방식으로, FucT, XylT 또는 이의 조합에 대한 저해성 서열을 포함하는 폴리뉴클레오타이드를 원하는 숙주 세포에 도입한다. 일시적 억제를 위해, FucT 또는 XylT 저해성 서열을 숙주 세포에 도입되었을 때 이들 타겟 유전자 산물(들)의 발현을 침묵화함으로써, 일시적으로 FucT, XylT 또는 그 조합을 직접적으로 저해하게 될, 화학적으로 합성하거나 시험관내에서 제조된 소형 간섭 RNA(siRNA) 또는 마이크로 RNA(miRNA)일 수 있다.
다른 예로, FucT, XylT 또는 그 조합의 발현의 안정적인 억제가 전술한 바와 같이 적합하다. 따라서, 일부 예에서, 본 발명의 FucT 또는 XylT 폴리펩타이드의 활성은 FucT, XylT 또는 둘다의 발현을 저해하는 폴리뉴클레오타이드를 발현하는 발현 카세트로 식물 세포를 형질전환함으로써 감소 또는 없앨 수 있다. 폴리뉴클레오타이드는 FucT, XylT 메신저 RNA의 전사나 번역을 저해함으로써 직접적으로, 또는 FucT, XylT 또는 둘다를 코딩하는 유전자의 전사 또는 번역을 저해하는 폴리펩타이드를 코딩함으로써 간접적으로, FucT, XylT 또는 이 둘다의 발현을 저해할 수 있다. 식물에서 유전자 발현을 저해 또는 제거하는 방법은 당업계에 잘 알려져 있으며, 이러한 임의 방법을 본 발명에 사용하여 FucT, XylT 또는 둘다의 발현을 저해할 수 있다.
따라서, 일부 예에서, FucT 및/또는 XylT 단백질의 발현을, 목적한 FucT 및/또는 XylT 유전자 산물의 발현이 침묵되도록 하는 저해성 뉴클레오타이드 서열, 예컨대 센스 방향의 RNA, 안티센스 RNA, 이중 가닥 RNA(dsRNA), 헤어핀 RNA(hpRNA), 인트론 함유성 hpRNA, 촉매성 RNA, miRNA 등을 코딩하는 서열을 포함하는 발현 벡터와 같은, 뉴클레오타이드 구조체를 식물에 도입함으로써, 저해할 수 있다. 다른 예에서, 뉴클레오타이드 구조체, 예컨대 발현 카세트는 목적한 FucT 및/또는 XylT 유전자 산물의 발현이나 기능을 저해하는 목적 폴리펩타이드로 번역되는 mRNA를 코딩하는 서열을 포함할 수 있다. 뉴클레오타이드 구조체가 목적한 폴리펩타이드에 대한 저해성 뉴클레오타이드 분자나 mRNA를 코딩하는 서열을 포함하는 경우, 상기 서열은 코딩된 저해성 뉴클레오타이드 분자나 mRNA가 발현될 수 있도록 식물 세포에서 발현을 진행시키는 프로모터에 작동가능하게 연결된다.
본 발명에서, FucT 또는 XylT의 단백질 수준이, FucT 또는 XylT의 발현을 저해하기 위해 유전자 변형 또는 돌연변이화되지 않은 식물에서의 동일한 FucT 또는 XylT의 단백질 수준 보다 통계적으로 낮다면, FucT 또는 XylT 유전자의 발현은 저해된 것이다. 본 발명의 특정 예에서, 본 발명에 따른 변형된 식물에서, FucT 또는 XylT 또는 이들 2개의 단백질 수준은, FucT 또는 XylT, 또는 이 둘다의 발현을 저해하기 위해 유전자 변형되지 않은 식물 또는 돌연변이가 아닌 식물에서의 동일한 FucT 또는 XylT의 단백질 수준에, 95% 미만, 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만 또는 5% 미만이다. FucT 또는 XylT 또는 이들 둘다의 발현 수준은 예컨대 식물 세포나 식물에서 발현된 FucT 또는 XylT 또는 이들 둘다의 수분을 분석함으로써 직접적으로, 또는 예컨대 식물에서 당단백질 N-글리칸에 β1,2-자일로스 및/또는 α1,3-푸코스 잔기의 부착 감소 또는 심지어 소거로서 관찰되는, 표현형 수준에서 형질전환 식물에서의 효과를 관찰함으로써 간접적으로, 관찰할 수 있다.
본 발명의 다른 예로, FucT, XylT 또는 이들 둘다의 활성을 저해하는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드를 포함하는 발현 카세트로 식물 세포를 형질전환함으로써, FucT, XylT 또는 이들 둘다의 활성을 감소 또는 없앨 수 있다. FucT 또는 XylT의 활성이, FucT 또는 XylT의 활성을 저해하기 위해 유전적으로 변형되지 않은 식물에서의 동일한 FucT 또는 XylT의 활성보다 통계적으로 낮다면, FucT 또는 XylT의 활성은 본 발명에 따라 저해된 것이다. 본 발명의 특정 예에서, 본 발명에 따른 변형된 식물에서의 FucT 또는 XylT의 활성은 FucT 또는 XylT의 발현을 저해하기 위해 유전자 변형하지 않은 식물에서의 동일한 FucT 또는 XylT의 활성의 95% 미만, 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만 또는 5% 미만이다. 본원 명세서에 언급된 분석 방법에 의해 검출되지 않았을 때, 본 발명에 따라 FucT 또는 XylT의 활성은 "없어진" 것이다.
다른 예에서, FucT, XylT 또는 이들 둘다의 활성은 FucT 또는 XylT를 코딩하는 유전자나 또는 이들 둘다의 유전자를 파괴함으로써, 감소 또는 없앨 수 있다. 본 발명은 돌연변이화된 식물, 특히, FucT 또는 XylT 유전자나 또는 이들 둘다에 돌연변이가 있는, 개구리밥 과의 식물을 포함하며, 상기 돌연변이는 FucT 및/또는 XylT 유전자의 발현을 감소시키거나, 또는 코딩된 FucT 및/또는 XylT이 활성을 저해한다.
본 발명의 방법은 고등 식물 세포에서 FucT 및/또는 XylT의 활성이나 수준을 감소 또는 소거하기 위해 당업계에 공지된 임의 방법이나 메카니즘을 포함할 수 있으며, 그 예로는 안티센스 억제 센스 억제, RNA 간섭, 부위 결손(directed deletion ) 또는 돌연변이, 우성의-네거티브 전략 등이 있으나, 이로 한정되는 것은 아니다. 따라서, 본 발명의 방법 및 조성물은 임의의 메카니즘 또는 작용 이론에 한정되지 않으며, FucT 및/또는 XylT의 발현 또는 기능이 원하는 고등 식물 세포에서 저해되어 식물에서 생산되는 내인적이며 이종의 당단백질의 N-당화 패턴이 변형되는, 임의 방법을 포함한다.
예컨대, 일부 예들에서, FucT 저해 서열 또는 XylT 저해성 서열은 (또는 둘다) 센스 방향으로 발현되며, 상기 센스 방향의 전사체는 이들 효소 중 어느 하나나 둘다의 발현을 공동-억제시킨다. 다른 예로, FucT 및/또는 XylT 저해성 서열(예, 전장 서열, 절단된 서열, 서열의 단편, 이의 조합 등)은 안티센스 방향으로 발현되어, 안티센스 메카니즘에 의해 내인성의 FucT 및/또는 XylT 발현 또는 기능을 저해할 수 있다.
또다른 예로, FucT 및/또는 XylT 저해성 서열 또는 서열들은 센스 서열과 안티센스 서열 둘다를 포함하는, 헤어핀 RNA로서 발현된다. 헤어핀 구조를 포함하는 예에서, 루프 구조는 예컨대, 서열번호 1 또는 2의 FucT 폴리뉴클레오타이드의 5' UTR 및/또는 번역 영역, 또는 서열번호 4, 5, 19 또는 20의 XylT 폴리뉴클레오타이드의 5' UTR 및/또는 번역 영역 등과 같이, 억제할 유전자의 5' 비번역 영역 및/또는 번역 영역 등의 임의의 적합한 뉴클레오타이드 서열을 포함할 수 있다. 일부 예들에서, 헤어핀으로서 발현되는 FucT 또는 XylT 저해성 서열은 상기 FucT 또는 XylT 뉴클레오타이드 서열의 역위된 영역(inverted region)에 의해 코딩된다. 다른 예로, FucT 및/또는 XylT 저해성 서열은, 하나의 FucT 및/또는 XylT 저해성 서열이 센스 방향으로 발현되고 다른 상보성 서열이 안티센스 방향으로 발현되는, 이중 가닥 RNA로서 발현된다. FucT 뉴클레오타이드 서열, XylT 뉴역 또는 이의 조합을 포함하는 이중 가닥 RNA, 헤어핀 구조 및 이의 조합은 RNA 간섭, 공동-억제, 안티센스 메카니즘, 이들의 임의 조합에 의해, 또는 FucT 및/또는 XylT 발현 또는 기능의 저해를 초래하는 그외 다른 임의 메카니즘에 의해 작동될 수 있다.
따라서, FucT 또는 XylT, 또는 이 2가지 단백질, 그리고 이들의 임의 이소형의 활성을 감소 또는 제거하기 위해 많은 방법들을 사용할 수 있다. "이소형"은 목적한 FucT 또는 XylT 단백질의 자연적으로 생성되는 단백질 변이체로, 상기 변이체는 상이한 유전자에 의해 코딩된다. 일반적으로, 목적한 특정 FucT 또는 XylT 단백질의 이소형은 목적한 FucT 또는 잘 단백질을 코딩하는 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 가지는 뉴클레오타이드 서열에 의해 코딩된다. 2가지 이상의 방법을 사용하여, 하나의 식물 FucT 또는 XylT, 그리고 이의 이소형의 활성을 감소 또는 제거할 수 있다. 식물 FucT 또는 XylT의 활성을 감소 또는 제거하는 방법의 비제한적인 예는 하기에 기술되어 있다.
폴리뉴클레오타이드를 이용한 방법:
본 발명의 일부 예에서, 식물 세포는 FucT, XylT 또는 이 둘다의 발현을 저해하는 폴리뉴클레오타이드를 발현할 수 있는 발현 카세트로 형질전환된다. 용어 "발현"은 본원에서 유전자 산물의 전사 및/또는 번역을 포함한, 유전자 산물의 생합성을 의미한다. 예컨대, 본 발명의 목적에서, 하나 이상의 FucT 또는 XylT, 또는 이둘다의 발현을 저해하는 폴리뉴클레오타이드를 발현할 수 있는 발현 카세트는 적어도 하나 이상의 FucT, XylT 또는 이 둘다의 전사 및/또는 번역을 저해하는 RNA 분자를 만들 수 있는 발현 카세트이다. DNA 분자로부터 단백질 또는 폴리펩타이드의 '발현" 또는 "생산"은 단백질 또는 폴리펩타이드를 생산하기 위한 코딩 서열의 전사 및 번역을 의미하며, RNA 분자로부터의 단백질 또는 폴리펩타이드의 "발현" 또는 "생산"은 단백질 또는 폴리펩타이드를 생산하기 위한 RNA 코딩 서열의 번역이다.
FucT, XylT 또는 이 둘다의 발현을 저해하는 폴리뉴클레오타이드의 예는 하기와 같다.
센스 억제/공동-억제
본 발명의 일부 예에서, FucT, XylT 또는 이 둘다의 발현 저해는, 센스 억제 또는 공동-억제에 의해 취할 수 있다. 공동-억제에서, 발현 카세트는 "센스" 방향으로 FucT, XylT 또는 이 둘다를 코딩하는 메신저 RNA 모두 또는 일부분에 해당되는 RNA 분자를 발현하도록 제작된다. RNA 분자의 과다 발현은 천연 유전자의 발현 감소를 초래할 수 있다. 따라서, 공동-억제 발현 카세트로 형질전환된 다수의 식물주들을 스크리닝하여, FucT 또는 XylT 발현의 최대 억제를 보이는 식물주를 동정한다.
공동-억제에 사용되는 폴리뉴클레오타이드는 FucT 또는 XylT를 코딩하는 서열의 전체 또는 일부분, FucT 또는 XylT 전사체의 5' 및/또는 3' 비번역 영역 전체 또는 일부분, 또는 FucT 또는 XylT를 코딩하는 전사체의 코딩 서열과 비번역 영역 둘다의 전체나 일부분에 해당할 수 있다. 폴리뉴클레오타이드가 FucT 또는 XylT 단백질에 대한 코딩 부위의 전체 또는 일부분을 포함하는 경우에, 발현 카세트는 단백질 산물이 전사되지 않도록 폴리뉴클레오타이드의 개시 코돈이 없어지도록 제작한다.
공동-억제는 식물 유전자의 발현을 저해하거나 또는 이들 유전자에 의해 코딩되는 단백질에 대해 검출불가한 단백질 수준을 보이는 식물을 생산하기 위해 사용할 수 있다. 예로, Broin et al . (2002) Plant Cell 14:1417-1432를 참조한다. 또한, 동일한 식물에서 다수의 단백질의 발현을 저해하기 위해 공동-억제를 이용할 수 있다. 예로, 미국 특허 5,942,657을 참조한다. 내인성 유전자의 발현을 식물에서 저해하기 위해 공동-억제를 이용하는 방법은 Flavell et al . (1994) Proc . Natl . Acad. Sci . USA 91:3490-3496; Jorgensen et al . (1996) Plant Mol . Biol . 31:957-973; Johansen and Carrington (2001) Plant Physiol . 126:930-938; Broin et al . (2002) Plant Cell 14:1417-1432; Stoutjesdijk et al . (2002) Plant Physiol . 129:1723-1731; Yu et al . (2003) Phytochemistry 63:753-763; 및 미국 특허 5,942,657에 기술되어 있으며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다. 공동-억제 효과는, 발현 카세트에서 센스 서열의 3' 위치와 폴리아데닐화 신호의 5' 위치에 poly-dT 영역을 포함시킴으로써 증가시킬 수 있다. 미국 특허 공개공보 20020048814를 참조하며, 이는 원용에 의해 본 명세서에 포함된다.
안티센스 억제
본 발명의 일부 예에서, FucT, XylT 또는 이들 둘다의 발현 저해는 안티센스 억제에 의해 달성할 수 있다. 안티센스 억제를 위해, 발현 카세트는 FucT 또는 XylT를 코딩하는 메신저 RNA의 전체나 일부분과 상보적인 RNA 분자를 발현하도록 제작된다. 안티센스 RNA 분자의 과다 발현은 천연 유전자의 발현 감소로 귀결될 수 있다. 따라서, 안티센스 억제성 발현 카세트로 형질전환된 다수의 식물주들을 스크리닝하여 FucT 또는 XylT 발현의 최대 저해를 보이는 식물을 동정한다.
안티센스 억제에 사용되는 폴리뉴클레오타이드는 FucT 또는 XylT를 코딩하는 서열의 상보체 전체 또는 일부분, FucT 또는 XylT 전사체의 5' 및/또는 3' 비번역 영역의 상보체 전체 또는 일부분, 또는 FucT 또는 XylT를 코딩하는 전사체의 코딩 서열과 비번역 영역 둘다의 상보체 전체나 일부분에 해당될 수 있다. 또한, 안티센스 폴리뉴클레오타이드는 타겟 서열과 완전히 상보적(즉, 타겟 서열의 상보체와 100% 동일)하거나 부분 상보적(즉, 타겟 서열과 100 미만으로 동일)일 수 있다. 예로, 미국 특허 5,942,657을 참조한다. 또한, 안티센스 뉴클레오타이드의 일부분을 사용하여, 타겟 유전자의 발현을 교란시킬 수 있다. 일반적으로, 50개 이상의 뉴클레오타이드, 100개 이상의 뉴클레오타이드, 200개 이상의 뉴클레오타이드, 300, 400, 450, 500, 550 또는 그 이상의 뉴클레오타이드로 구성된 서열을 사용할 수 있다. 식물에서 내인성 유전자의 발현을 저해하기 위해 안티센스 억제를 이용하는 방법은, 예컨대 Liu et al . (2002) Plant Physiol . 129:1732-1743과 미국 특허 5,759,829 및 5,942,657에 기술되어 있으며, 이들 각각은 원용에 의해 본 명세서에 포함된다. 안티센스 억제 효과는, 발현 카세트에서 안티센스 서열의 3' 위치와 폴리아데닐화 신호의 5' 위치에 poly-dT 영역을 포함시킴으로써 증가시킬 수 있다. 미국 특허 공개공보 20020048814를 참조하며, 이는 원용에 의해 본 명세서에 포함된다.
이중 가닥 RNA 간섭
본 발명의 일부 예에서, FucT, XylT 또는 이 둘다의 발현 저해는 이중 가닥 RNA(dsRNA) 간섭에 의해 달성할 수 있다. dsRNA 간섭을 위해, 상기 공동-억제에서 기술된 것과 유사한 센스 RNA와 상기 센스 RNA에 전체 또는 부분적으로 상보적인 안티센스 RNA를 동일한 세포에서 발현시켜, 대응되는 내인성 메신저 RNA의 발현 저해가 이루어진다.
센스 및 안티센스 분자의 발현은 센스 서열과 안티센스 서열 둘다를 포함하도록 발현 카세트를 제작함으로써 달성할 수 있다. 대안적으로, 분리된 발현 카세트를 센스 및 안티센스 서열로 사용할 수 있다. deRNA 간섭 발현 카세트 또는 발현 카세트들로 형질전환된 다수의 식물주들을 이후 스크리닝하여 FucT 또는 XylT 발현의 최대 저해를 보이는 식물주를 동정한다. 내인성 식물 유전자의 발현을 저해하기 위해 dsRNA 간섭을 이용하는 방법들은 Waterhouse et al . (1998) Proc . Natl . Acad . Sci . USA 95:13959-13964, Liu et al . (2002) Plant Physiol . 129:1732-1743, 및 WO 99/49029, WO 99/53050, WO 99/61631, WO 00/49035에 기술되어 있으며, 상기 문헌은 원용에 의해 본 명세서에 포함된다.
헤어핀 RNA 간섭 및 인트론 - 함유성 헤어핀 RNA 간섭
본 발명의 일부 예에서, FucT, XylT 또는 이 둘다의 발현 저해는 헤어핀 RNA(hpRNA) 간섭 또는 인트론-함유성 헤어핀 RNA(ihpRNA) 간섭에 의해 달성할 수 있다. 이러한 방법들은 내인성 유전자의 발현 저해에 매우 효과적이다. Waterhouse and Helliwell (2003) Nat . Rev . Genet . 4:29-38과 이에 참조된 문헌을 참조한다.
hpRNA 간섭을 위해, 발현 카세트는 단일 가닥 루프 영역과 염기쌍으로 이루어진 스템을 포함하는 헤어핀 구조를 형성하도록, 자신과 혼성화하는 RNA 분자를 발현하도록 제작된다. 염기쌍으로 이루어진 스템 영역은 이의 발현이 저해될 유전자를 코딩하는 내인성 메신저 RNA 전제 또는 일부분에 해당되는 센스 서열과, 상기 센스 서열에 완전히 또는 부분적으로 상보적인 안티센스 서열을 포함한다. 따라서, 염기쌍으로 이루어진 분자의 영역은 일반적으로 RNA 간섭의 특이성을 결정한다. hpRNA 분자는 내인성 유전자의 발현 저해에 매우 효과적이며, 이들이 유도하는 RNA 간섭은 이후 식물 세대에 유전된다. 예로, Chuang and Meyerowitz (2000) Proc . Natl . Acad . Sci . USA 97:4985-4990; Stoutjesdijk et al . (2002) Plant Physiol . 129:1723-1731; and Waterhouse and Helliwell (2003) Nat . Rev . Genet . 4:29-38을 참조한다. 유전자의 발현을 저해 또는 침묵화하기 위해 hpRNA를 사용하는 방법은, 예컨대 Chuang and Meyerowitz (2000) Proc . Natl . Acad . Sci . USA 97:4985-4990; Stoutjesdijk et al . (2002) Plant Physiol . 129:1723-1731; Waterhouse and Helliwell (2003) Nat . Rev . Genet. 4:29-38; Pandolfini et al . BMC Biotechnology 3:7, 및 미국 공개공보 20030175965에 기술되어 있으며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다. 생체내 유전자 발현을 침묵화시키는 hpRNA 구조체의 일시적인 효과 분석은 Panstruga et al . (2003) Mol . Biol . Rep . 30:135-140에 기술되어 있으며, 상기 문헌은 원용에 의해 본 명세서에 포함된다.
ihpRNA의 경우, 간섭 분자는 hpRNA로서 동일한 일반적인 구조를 가지지만, RNA 분자는 ihpRNA가 발현되는 세포에서 스플라이싱될 수 있는 인트론을 부가적으로 포함한다. 인트론의 사용은 스플라이싱 이후의 헤어핀 RNA 분자내 루프의 크기를 최소화시키며, 이는 간섭 효과를 증가시킨다. 예로, Smith et al . (2000) Nature 407:319-320을 참조한다. 실제, Smith et al .은 ihpRNA 매개성 간섭을 이용하여 내인성 유전자 발현을 100% 억제함을 보였다. ihpRNA 간섭을 이용하여 내인성 식물 유전자의 발현을 저해하는 방법은, 예컨대 Smith et al . (2000) Nature 407:319-320; Wesley et al . (2001) Plant J. 27:581-590; Wang and Waterhouse (2001) Curr . Opin. Plant Biol . 5:146-150; Waterhouse and Helliwell (2003) Nat . Rev . Genet . 4:29-38; Helliwell and Waterhouse (2003) Methods 30:289-295, 및 미국 특허 공개공보 20030180945에 기술되어 있으며, 이들 각각은 원용에 의해 본 명세서에 포함된다.
hpRNA 간섭용 발현 카세트는 또한 센스 서열과 안티센스 서열이 내인성 RNA에 대응되지 않도록 제작할 수 있다. 이러한 예에서, 센스 및 안티센스 서열은 타겟 유전자의 내인성 메신저 RNA의 전체 또는 일부분에 대응되는 뉴클레오타이드 서열을 포함하는 루프 서열 옆에 위치한다. 따라서, RNA 간섭의 특이성을 결정하는 것은 루프 영역이다. 예로, WO 02/00904를 참조하며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다.
전사 유전자 침묵(transcriptional gene silencing, TGS)은 헤어핀의 역전위된 반복부가 침묵될 유전자의 프로모터 영역과 서열 동일성을 공유하는 hpRNA 구조체의 사용을 통해 달성될 수 있다. hpRNA의 상동적인 프로모터 영역과 상호작용할 수 있는 짧은 RNA로의 가공 처리는 결과적으로 침묵으로 귀결되는 분해 또는 메틸화를 촉발시킬 수 있다(Aufsatz et al . (2002) PNAS 99 (Suppl. 4):16499-16506; Mette et al . (2000) EMBO J 19(19):5194-5201).
헤어핀 구조를 형성하는 RNA 분자를 발현하도록 되어 있는 발현 카세트는 RNAi 발현 카세트로서 본원에서 언급된다. 일부 예들에서, RNAi 발현 카세트는 도 28에 개략화한 전략에 따라 설계된다. 그러한 예에서, RNAi 발현 카세트는 개별적인 FucT 및 XylT 유전자의 발현을 억제하도록(즉, 각 카세트는 단일 유전자 낫아웃을 제공함) 제작될 수 있으며, 또는 FucT 및 XylT 유전자의 발현을 억제하도록(즉, 단일 RNAi 발현 카세트는 이들 2종의 유전자의 발현 억제를 제공하는 저해성 분자를 발현함) 제작될 수 있다. RNAi 발현 카세트가 FucT 및 XylT 유전자 둘다의 발현을 억제하는 경우, 본원에서는 이를 "키메라" RNAi 발현 카세트라고 한다. 단일-유전자 및 키메라 RNAi 발현 카세트는 더 큰 hpRNA 구조체를 발현하거나 또는 다른 예로 후술되는 바와 같이 소형 hpRNA 구조를 발현하도록 제작할 수 있다.
따라서, 일부 예들에서, RNAi 발현 카세트는 FucT 및 XylT 유전자 중 어느 하나나 또는 이 둘다의 전사 후 유전자 침묵을 제공하기 위해, 타겟 mRNA 전사체에 대해 충분한 상동성을 가지는 보다 큰 hpRNA 구조체를 발현하도록 제작된다. 좀더 큰 hpRNA 구조체의 경우, RNAi 발현 카세트의 센스 가닥은 5'에서 3' 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 목적 프로모터, FucT 또는 XylT 각각에 대한 센스 가닥의 약 500 내지 800개의 뉴클레오타이드(nt)를 포함하는, FucT 또는 XylT 유전자 서열의 정방향 단편(forward fragment), 후술되는 임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열, 및 FucT 또는 XylT 유전자 서열의 역방향 단편(reverse fragment), 상기 역방향 단편은 각각(즉, FucT 또는 XylT)의 정방향 단편에 상보적인 안티센스 서열을 포함한다. 따라서, 예컨대, 정방향 단편이 뉴클레오타이드 "...acttg..."이라면 대응되는 역방향 단편은 뉴클레오타이드 "...caagt..."이고, 그러한 RNAi 발현 카세트에 대한 센스 가닥은 다음의 서열을 포함한다: "5'-...acttg...nnnn...caagt...-3', 상기에서, "nnnn"은 스페이서 서열이다.
정방향 단편은 타겟 FucT 또는 XylT 유전자 서열에 대한 센스 가닥의 대응 부위와 100% 동일한 뉴클레오타이드 서열을 포함할 수 있으며, 다른 예로 침묵하게 될 타겟 펄 또는 XylT 유전자에 대한 센스 가닥의 대응되는 부위와 적어도 90%, 적어도 95%, 또는 적어도 98%의 서열 동일성을 공유하는 서열을 포함할 수 있는 것으로 생각된다. 이와 유사한 방식으로, 정방향 단편은 정방향 단편의 상보체와 100% 서열 상동성을 공유하지 않아야 하며, 오히려 저해성 RNA 분자가 발현되었을 때 정방향 단편과 역방향 단편에 대응되는 전사된 영역이 혼성화하여 hpRNA 구조의 염기쌍으로 이루어진 스템(즉, 이중 가닥 부분)을 형성하도록, 정방향 단편 서열에 대한 충분한 길이 및 충분한 상보성을 가져야 하는 것으로 이해된다. "충분한 길이"는 정방향 단편의 길이의 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 보다 흔하게는 적어도 50%, 적어도 75%, 적어도 90%, 또는 적어도 95%인 길이이다. "충분한 상보성"은 역방향 단편의 서열이 역방향 단편과 혼성화하여 hpRNA 구조의 염기쌍으로 이루어진 스템을 형성하게될 정방향 단편의 부분의 상보체와 적어도 90%, 적어도 95%, 적어도 98% 서열 동일성을 공유하는 것을 의미한다. 따라서, 일부 예들에서, 역방향 단편은 정방향 단편의 상보체(즉, 안티센스 버전)이다.
그러한 RNAi 발현 카세트 설계에서, 정방향 단편 스페이서 서열 및 역방향 단편의 길이는, hpRNA 구조체를 코딩하는 조합된 폴리뉴클레오타이드의 길이가 약 650 내지 약 2500 nt, 약 750 내지 약 2500 nt, 약 750 내지 약 2400 nt, 약 1000 내지 약 2400 nt, 약 1200 내지 약 2300 nt, 약 1250 내지 약 2100 nt, 또는 약 1500 내지 약 1800 nt가 되도록 선택된다. 일부 예들에서, 발현된 헤어핀 구조체의 조합 길이는 약 650 nt, 약 700 nt, 약 750 nt, 약 800 nt, 약 850 nt, 약 900 nt, 약 950 nt, 약 1000 nt, 약 1050 nt, 약 1100 nt, 약 1150 nt, 약 1200 nt, 약 1250 nt, 약 1300 nt, 약 1350 nt, 약 1400 nt, 약 1450 nt, 약 1500 nt, 약 1550 nt, 약 1600 nt, 약 1650 nt, 약 1700 nt, 약 1750 nt, 약 1800 nt, 약 1850 nt, 약 1900 nt, 약 1950 nt, 약 2000 nt, 약 2050 nt, 약 2100 nt, 약 2150 nt, 약 2200 nt, 약 2250 nt, 약 2300 nt이거나 또는 약 650 nt 내지 약 2300 nt의 임의 길이이다.
일부 예들에서, 정방향 단편은 FucT 또는 XylT에 대한 센스 가닥의, 예컨대 서열번호 1 또는 2(FucT), 또는 서열번호 4, 5, 19, 또는 20 (XylT)에 나타낸 센스 가닥의, 약 500 내지 약 800nt, 예컨대 500, 525, 550, 575, 600, 625, 650, 675, 700, 725, 750, 775, 또는 800이고; 스페이서 서열은 후술되는 임의 서열의 약 100 내지 약 700 nt, 예컨대, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 또는 700 nt를 포함하며, 역방향 단편은 상기 정방향 서열에 대한 안티센스 가닥 또는 상기 정방향 단편 서열에 충분한 길이 및 충분한 상동성을 가지는 서열을 포함한다.
스페이서 서열은 타겟 유전자, 즉 FucT 또는 XylT에 상동성이 부족하며, 스페이서 영역에 대응되는 발현된 저해성 RNA 분자의 영역이 자기-혼성화하지 못하여 헤어핀 RNA 구조의 루프를 형성하도록 스스로에 대한 상동성이 결여된, 임의 서열일 수 있다. 일부 예들에서 스페이서 서열은 인트론을 포함하며, 따라서 발현된 저해성 RNA 분자는 전술한 바와 같은 ihpRNA를 형성한다. 다른 예에서, 스페이서 서열은 침묵되게 될 FucT 또는 XylT 유전자에 대한 센스 가닥의 일부분, 예컨대 서열번호 1 또는 2 (FucT), 또는 서열번호 4, 5, 19 또는 20 (XylT)에 기재된 센스 가닥의 일부분, 특히 정방향 단편 서열의 바로 하류 센스 가닥의 일부분을 포함한다.
작동가능하게 연결된 프로모터는 후술되는 프로모터들 중 하나를 포함하여, 원하는 식물내에서 작동가능하게 연결된 저해성 폴리뉴클레오타이드의 발현을 제공하는 목적한 임의 프로모터일 수 있다. 조절 영역(regulatory region)은 5' 리더 서열 및 5' 리더 서열 + 하기 식물 인트론을 비제한적으로 포함하여, 저해성 폴리뉴클레오타이드의 발현을 강화하는 추가적인 저해성 요소(regulatory element)를 포함할 수 있다.
일 예에서, RNAi 발현 카세트는 서열번호 3의 FucT 폴리펩타이드; 서열번호 3의 FucT 폴리펩타이드의 생물학적 활성을 가진 변이체, 또는, 서열번호 1 또는 2의 서열과 적어도 75% 이상, 예컨대 서열번호 1 또는 2의 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95%의 서열 동일성을 가지는 서열에 의해 코딩된 FucT 폴리펩타이드의 발현을 억제하도록 제작된다. 이러한 방식으로, RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터, FucT 유전자 서열의 정방향 단편으로, 상기 정방향 단편은 서열번호 1의 nt 255-985를 포함함; 전술한 임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열; 및 서열번호 1의 nt 255-985의 상보체(즉, 안티센스 버전)을 포함하는, FucT 유전자 서열의 역방향 단편. 일 예로, 스페이서 서열은 서열번호 1의 nt 986-1444이고, hpRNA 구조의 코팅 서열에 대응되는 RNAi 발현 카세트의 센스 가닥의 해당 부분의 총 길이는 1918 nt이다. 이러한 RNAi 발현 카세트, 예컨대 도 8의 벡터를 포함하는 뉴클레오타이드 구조체를 이용한 식물의 안정적인 형질전환은 hpRNA 구조가 발현되는 식물의 세포내에서 FucT의 발현을 효과적으로 저해한다. 일 예에서, 대상 식물은 개구리밥 과의 식물, 예컨대, Lemnaceae에 속하는 식물이며, 식물은 도 8의 벡터로 안정적으로 형질전환된 것이다.
본 발명의 다른 예로, RNAi 발현 카세트는 서열번호 6 또는 21의 XylT 폴리펩타이드; 서열번호 6 또는 21의 XylT 폴리펩타이드의 생물학적 활성을 가진 변이체, 또는 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 서열과 75% 이상의 서열 동일성을 가지는 서열에 의해 코딩되는 XylT 폴리펩타이드, 예컨대 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 이상의 서열 동일성을 가지는 서열에 의해 코딩되는 XylT 폴리펩타이드의 발현을 억제하도록 제작된다. 이러한 방식으로, RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터, XylT 유전자 서열의 정방향 단편으로, 상기 정방향 단편은 서열번호 4의 nt 318-1052를 포함함; 전술한 임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열; 및 서열번호 4의 nt 318-1052의 상보체(즉, 안티센스 버전)을 포함하는, XylT 유전자 서열의 역방향 단편. 일 예로, 스페이서 서열은 서열번호 4의 nt 1053-1599이고, hpRNA 구조의 코팅 서열에 대응되는 RNAi 발현 카세트의 센스 가닥의 해당 부분의 총 길이는 2015 nt이다. 이러한 RNAi 발현 카세트, 예컨대 도 9의 벡터를 포함하는 뉴클레오타이드 구조체를 이용한 식물의 안정적인 형질전환은 hpRNA 구조가 발현되는 식물의 세포내에서 XylT의 발현을 효과적으로 저해한다. 일 예에서, 대상 식물은 개구리밥 과의 식물, 예컨대, Lemnaceae에 속하는 식물이며, 식물은 도 9의 벡터로 안정적으로 형질전환된 것이다.
다른 예로, RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터, XylT 유전자 서열의 정방향 단편으로, 상기 정방향 단편은 서열번호 19의 nt 1-734를 포함함; 전술한 임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열; 및 서열번호 19의 nt 1-734의 상보체(즉, 안티센스 버전)을 포함하는, XylT 유전자 서열의 역방향 단편. 일 예로, 스페이서 서열은 서열번호 19의 nt 735-1282이고, hpRNA 구조의 코팅 서열에 대응되는 RNAi 발현 카세트의 센스 가닥의 해당 부분의 총 길이는 2015 nt이다. 이러한 RNAi 발현 카세트, 예컨대 도 9의 벡터를 포함하는 뉴클레오타이드 구조체를 이용한 식물의 안정적인 형질전환은 hpRNA 구조가 발현되는 식물의 세포내에서 XylT의 발현을 효과적으로 저해한다. 일 예에서, 대상 식물은 개구리밥 과의 식물, 예컨대, Lemnaceae에 속하는 식물이며, 식물은 도 9의 벡터로 안정적으로 형질전환된 것이다.
또다른 예로, 보다 큰 hpRNA 구조체는, 안티센스와 센스 서열이 반대 방향이도록 제작할 수 있다. 이러한 방식으로, RNAi 발현 카세트의 센스 가닥은 하기 작동가능하게 연결된 요소를 5'에서 3' 방향으로 포함하도록 제작된다: 원하는 프로모터, 안티센스 방향의 전장의 FucT 또는 XylT 유전자 서열, 및 센스 방향으로 서열의 3'-절반을 포함하는 FucT 또는 XylT 유전자 서열의 정방향 단편(도 28, 디자인 1 참조). 이러한 구조체 타입에서, 서열의 3'-절반은 hpRNA의 염기쌍으로 이루어진(즉, 이중 가닥) 스넴을 형성하며, 서열의 5'-절반은 스페이서 서열로 작용한다. 어떠한 이론이나 메카니즘에 결부됨이 없이, FucT 또는 XylT 서열의 3' 영역은 5' 영역에 비해 여러가지 식물 종들에서 비교적 보존되어 있으므로, 상기 구조체에서 hpRNA의 이중 가닥 영역을 형성하도록 선택된다.
그러한 일 예에서, RNAi 발현 카세트는 서열번호 3의 FucT 폴리펩타이드; 서열번호 3의 FucT 폴리펩타이드의 생물학적 활성을 가진 변이체, 또는, 서열번호 1 또는 2의 서열과 적어도 75% 이상, 예컨대 서열번호 1 또는 2의 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95%의 서열 동일성을 가지는 서열에 의해 코딩된 FucT 폴리펩타이드의 발현을 억제하도록 제작된다. 이러한 방식으로, RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터, 안티센스 방향의 서열번호 1의 뉴클레오타이드 1-1865; 및 센스 방향의 서열번호 1의 뉴클레오타이드 950-1865. 이러한 RNAi 발현 카세트를 포함하는 뉴클레오타이드 구조체를 이용한 식물의 안정적인 형질전환은 hpRNA 구조가 발현되는 식물의 세포내에서 FucT의 발현을 효과적으로 저해한다. 일 예에서, 대상 식물은 개구리밥 과의 식물, 예컨대, Lemnaceae에 속하는 식물이다.
본 발명의 다른 예로, RNAi 발현 카세트는 서열번호 6 또는 21의 XylT 폴리펩타이드; 서열번호 6 또는 21의 XylT 폴리펩타이드의 생물학적 활성을 가진 변이체, 또는 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 서열과 75% 이상의 서열 동일성을 가지는 서열에 의해 코딩되는 XylT 폴리펩타이드, 예컨대 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 이상의 서열 동일성을 가지는 서열에 의해 코딩되는 XylT 폴리펩타이드의 발현을 억제하도록 제작된다. 이러한 방식으로, RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터; 안티센스 방향의 서열번호 4의 뉴클레오타이드 1-1860; 및 센스 방향의 서열번호 4의 뉴클레오타이드 950-1860. 이러한 RNAi 발현 카세트를 포함하는 뉴클레오타이드 구조체를 이용한 식물의 안정적인 형질전환은, hpRNA 구조가 발현되는 식물의 세포내에서 XylT의 발현을 효과적으로 저해한다. 일 예에서, 대상 식물은 개구리밥 과의 식물, 예컨대, Lemnaceae에 속하는 식물이다.
그러한 다른 예로, RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터; 안티센스 방향의 서열번호 19의 뉴클레오타이드 1-1282; 및 센스 방향의 서열번호 19의 뉴클레오타이드 652-1282. 이러한 RNAi 발현 카세트를 포함하는 뉴클레오타이드 구조체를 이용한 식물의 안정적인 형질전환은 hpRNA 구조가 발현되는 식물의 세포내에서 XylT의 발현을 효과적으로 저해한다. 일 예에서, 대상 식물은 개구리밥 과의 식물, 예컨대, Lemnaceae에 속하는 식물이다.
FucT 및 XylT 단백질 둘다의 발현이 바람직한 경우, 이는 한번의 형질전환, 예컨대, 단일 형질전환 벡터, 예컨대 도 11에 나타낸 벡터와 유사한 벡터내에서의 이들 단일-유전자 RNAi 발현 카세트들의 조합에 의해, 또는 예컨대 2개의 형질전환 벡터, 예컨대 도 8 및 9의 벡터와 유사한 벡터내에서의 이들 단일-유전자 RNAi 발현 카세트의 조합에 의해 개별 공동-형질전환으로, 본원에 언급된 형질전환 방법들을 비제한적으로 포함하는, 당업계에 공지된 모든 적합한 형질전환 방법을 이용하여, 식물에 이들 단일-유전자 RNAi 발현 카세트를 도입함으로써 달성할 수 있다.
다른 예로, FucT 및 XylT 단백질 둘다의 억제는 본원에 언급된 키메라 RNAi 발현 카세트를 원하는 고등 식물에 도입함으로써 달성할 수 있다. 따라서, 본 발명의 어떤 예로, 키메라 RNAi 발현 카세트의 센스 가닥은 다음의 작동가능하게 연결된 요소를 5'에서 3'방향으로 포함하도록 제작된다: 원하는 프로모터; 펄 센스 가닥의 약 500 내지 약 650 뉴클레오타이드 (nt)와 XylT 센스 가닥의 약 500 내지 약 650 nt를 포함하는, 키메라 정방향 단편으로, 상기 펄 서열과 XylT 서열은 어떠한 순서일 수 있음;임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열; 및 각각의 키메라 정방향 단편에 상보적인 안티센스 서열을 포함하는, 상기 키메라 정방향 단편의 역방향 단편.
각각의 RNAi 발현 카세트들에 대해 앞서 언급한 바와 같이, 키메라 정방향 단편내 각 FucT 또는 XylT 서열은 각각 타겟 FucT 및 XylT 유전자 서열의 센스 가닥의 대응하는 부분과 100% 동일한 뉴클레오타이드 서열을 포함할 수 있으며, 또는 다른 예로 침묵시킬 타겟 FucT 또는 XylT 유전자의 센스 가닥의 대응 부분과 적어도 90%, 적어도 95% 또는 적어도 98%의 서열 동일성을 공유하는 서열을 포함할 수 있다. 이처럼, 역방항 단편은 상기 키메라 정방향 단편의 상보체와 100%의 서열 동일성을 공유하지 않아야 하며, 오히려 저해성 RNA 분자가 발현되었을 때 상기 키메라 정방향 단편과 역방향 단편에 대응되는 전사된 영역이 혼성화하여 hpRNA 구조의 염기쌍으로 이루어진 스템(즉, 이중 가닥 부분)을 형성하도록, 상기 키메라 정방향 단편 서열에 대한 충분한 길이 및 충분한 상보성이어야 하는 것으로 이해된다. 이러한 키메라 RNAi 발현 카세트를 제작함에 있어, 상기 정방향 단편, 스페이서 서열 및 역방향 단편의 길이는, hpRNA 구조를 코딩하는 폴리뉴클레오타이드의 조합 길이가 약 1200 내지 약 3300 nt, 약 1250 내지 약 3300 nt, 약 1300 내지 약 3300 nt, 약 1350 내지 약 3300 nt, 약 1400 내지 약 3300 nt, 약 1450 nt 내지 약 3300 nt, 약 1500 내지 약 3300 nt, 약 2200 내지 약 3100 nt, 약 2250 내지 약 2800 nt, 또는 약 2500 내지 약 2700 nt이도록 선택된다. 일부 예들에서, 발현된 헤어핀 구조체의 조합 길이는 약 1200 nt, 약 1250 nt, 약 1300 nt, 약 1350 nt, 약 1400 nt, 약 1450 nt, 약 1500 nt, 약 1800 nt, 약 2200 nt, 약 2250 nt, 약 2300 nt, 약 2350 nt, 약 2400 nt, 약 2450 nt, 약 2500 nt, 약 2550 nt, 약 2600 nt, 약 2650 nt, 약 2700 nt, 약 2750 nt, 약 2800 nt, 약 2850 nt, 약 2900 nt, 약 2950 nt, 약 3000 nt, 약 3050 nt, 약 3100 nt, 약 3150 nt, 약 3200 nt, 약 3250 nt, 약 3300 nt, 또는 약 1200 nt 내지 약 3300 nt의 임의 길이이다.
일부 예에서, 상기 키메라 정방향 단편은 정방향 단편은 FucT에 대한 센스 가닥의, 예컨대 서열번호 1 또는 2(FucT)에 나타낸 센스 가닥의, 약 500 내지 약 650nt, 예컨대 500, 525, 550, 575, 600, 625 또는 650 nt 및 XylT의 센스 가닥의, 예컨대 서열번호 4, 5, 19 또는 20에 나타낸 센스 가닥의 약 500 내지 약 650 nt, 예컨대, 500, 525, 550, 575, 600, 625 또는 650 nt를 포함하며, FucT 및 XylT 서열은 어떠한 순서로도 융합될 수 있으며; 스페이서 서열은 원하는 임의 서열의 약 100 내지 약 700 nt, 예컨대, 100, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675 또는 700 nt를 포함하며; 및 역방향 단편은 상기 키메라 정방향 서열에 대한 안티센스 가닥 또는 상기 키메라 정방향 단편 서열에 대해 충분한 길이 및 충분한 상동성을 가지는 서열을 포함한다.
단일-유전자 RNAi 발현 카세트에서 언급한 바와 같이, 스페이서 서열은 타겟 유전자, 즉 FucT 또는 XylT에 대한 상동성이 부족하며, 스페이서 영역에 대응되는 발현된 저해성 RNA 분자의 영역이 자기-혼성화하지 못하여 hpRNA 구조의 루프를 형성하도록 스스로에 대한 상동성이 결여된, 임의 서열일 수 있다. 일부 예들에서, 스페이서 서열은 인트론을 포함하며, 따라서 발현된 저해성 RNA 분자는 전술한 바와 같은 ihpRNA를 형성한다. 다른 예에서, 스페이서 서열은 침묵시킬 FucT 또는 XylT 유전자 센스 가닥의 일부분, 예컨대 서열번호 1 또는 2 (FucT), 또는 서열번호 4, 5, 19 또는 20 (XylT)에 기재된 센스 가닥의 일부분을 포함한다. 일 예에서, 상기 키메라 정방향 단편은 그 순서로 융합된 FucT 및 XylT 서열을 포함하며, 스페이서 서열은 상기 키메라 정방향 단편내에 포함된 XylT 서열의 바로 하류 XylT 센스 가닥을 포함한다. 다른 예로, 상기 키메라 정방향 단편은 XylT 및 FucT 서열 순서로 융합된 XylT 및 FucT 서열을 포함하고, 상기 스페이서 서열이 키메라 정방향 단편애에 포함된 FucT 서열의 바로 하류 FucT 센스 가닥의 일부분을 포함한다.
일부 예들에서, 상기 키메라 RNAi 발현 카세트는 서열번호 3의 FucT 폴리펩타이드; 서열번호 3의 FucT 폴리펩타이드의 생물학적 활성을 가진 변이체, 또는, 서열번호 1 또는 2의 서열과 적어도 75% 이상, 예컨대 서열번호 1 또는 2의 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95%의 서열 동일성을 가지는 서열에 의해 코딩된 FucT 폴리펩타이드의 발현을 억제시키며, 서열번호 6 또는 21의 XylT 폴리펩타이드; 서열번호 6 또는 21의 XylT 폴리펩타이드의 생물학적 활성을 가진 변이체, 또는 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 서열과 75% 이상의 서열 동일성을 가지는 서열에 의해 코딩되는 XylT 폴리펩타이드, 예컨대 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 이상의 서열 동일성을 가지는 서열에 의해 코딩되는 XylT 폴리펩타이드의 발현을 억제하도록 제작된다. 이러한 예들의 일부로, 상기 키메라 정방향 단편내 FucT 서열은 서열번호 1 또는 2의 nt 700 내지 nt 1400에 대응하도록 선택되며, 및/또는 상기 키메라 정방향 단편내 XylT 서열은 서열번호 4 또는 5의 nt 700 내지 nt 1400, 또는 서열번호 19 또는 20의 nt 383 내지 1083에 대응하도록 선택된다. 이론에 결부되지 않으면서, 이 영역(특히 FucT의 경우)은 여러가지 식물 종들에서 비교적 보존적이므로, 잠재적으로 좋은 타겟이 된다.
다른 예에서, 상기 키메라 RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터; 서열번호 1(FucT 서열)의 nt 254-855 및 서열번호 4(XylT 서열)의 nt 318-943을 포함하는 키메라 정방향 단편; 전술한 임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열; 및 상기 키메라 정방항 단편의 상보체(즉, 안티센스 버전)을 포함하는, 즉, 서열번호 4의 nt 318-943의 상보체와 서열번호 1의 nt 254-855의 상보체를 포함하는 역방항 단편. 바람직한 예로, 상기 키메라 RNAi 발현 카세트내 스페이서 서열은 서열번호 4의 944-1443으로 표시되며, hpRNA 구조의 코딩 서열에 대응하는 RNAi 발현 카세트의 세스 가닥 부분의 총 길이는 2956 nt이다.
다른 예로, 상기 키메라 RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터; 서열번호 4(XylT 서열)의 nt 318-943 및 서열번호 1(FucT 서열)의 nt 254-855를 포함하는 키메라 정방향 단편; 전술한 임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열; 및 상기 키메라 정방항 단편의 상보체(즉, 안티센스 버전)을 포함하는, 즉, 서열번호 1의 nt 254-855의 상보체와 서열번호 4의 nt 318-943의 상보체를 포함하는 역방항 단편. 특정 예로, 상기 키메라 RNAi 발현 카세트내 스페이서 서열은 서열번호 1의 nt 856-1355로 표시되며, hpRNA 구조의 코딩 서열에 대응하는 RNAi 발현 카세트의 세스 가닥 부분의 총 길이는 2956 nt이다.
또다른 예에서, 상기 키메라 RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터; 서열번호 1(FucT 서열)의 nt 254-855 및 서열번호 19(XylT 서열)의 nt 1-626를 포함하는 키메라 정방향 단편; 전술한 임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열; 및 상기 키메라 정방항 단편의 상보체(즉, 안티센스 버전)을 포함하는, 즉, 서열번호 19의 nt 1-626의 상보체와 서열번호 1의 nt 254-855의 상보체를 포함하는 역방항 단편. 특정 예로, 상기 키메라 RNAi 발현 카세트내 스페이서 서열은 서열번호 19의 nt 627-1126로 표시되며, hpRNA 구조의 코딩 서열에 대응하는 RNAi 발현 카세트의 세스 가닥 부분의 총 길이는 2956 nt이다.
이의 다른 예로, 상기 키메라 RNAi 발현 카세트의 센스 가닥은 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 원하는 프로모터; 서열번호 19(XylT 서열)의 nt 1-626 및 서열번호 1(FucT 서열)의 nt 254-855를 포함하는 키메라 정방향 단편; 전술한 임의 서열의 약 100 내지 약 700 nt를 포함하는 스페이서 서열; 및 상기 키메라 정방항 단편의 상보체(즉, 안티센스 버전)을 포함하는, 즉, 서열번호 1의 nt 254-855의 상보체와 서열번호 19의 nt 1-626의 상보체를 포함하는 역방항 단편. 특정 예로, 상기 키메라 RNAi 발현 카세트내 스페이서 서열은 서열번호 1의 nt 856-1355로 표시되며, hpRNA 구조의 코딩 서열에 대응하는 RNAi 발현 카세트의 센스 가닥 부분의 총 길이는 2956 nt이다.
본원의 키메라 RNAi 발현 카세트를 포함하는 뉴클레오타이드 구조체를 이용한 식물의 안정적인 형질전환, 예컨대 도 10의 벡터를 이용한 안정적인 형질전환은 hpRNA 구조가 발현되는 식물의 세포내에서 FucT 및 XylT 둘다의 발현을 효과적으로 저해한다. 일 예에서, 대상 식물은 개구리밥 과의 식물, 예컨대, Lemnaceae에 속하는 식물이며, 식물은 도 10의 벡터로 안정적으로 형질전환된 것이다.
이들 키메라 RNAi 발현 카세트 2 이상을 식물에 안정적으로 형질전환하여, FucT 및 XylT 단백질의 모든 이소형의 침묵화 등의, 이들 2종의 단백질을 침묵시키는 매우 유효한 유전자를 제공할 수 있음을 알 것이다. 예로, 2가지 방향은 도 28의 "가능성있는 디자인 2"로 제공하였다. 이러한 방식으로, 키메라 정방향 단편이 FucT 및 XylT 순으로 융합된 서열을 포함하며 스페이서 서열이 상기 키메라 정방향 단편내에 포함된 XylT 서열로부터 바로 하류 XylT 센스 서열의 일부분을 포함하는, 제1 키메라 RNAi 발현 카세트; 및 상기 키메라 정방향 단편이 XylT 및 FucT 순서로 융합된 서열을 포함하고 스페이서 서열이 상기 키메라 정방향 단편내에 포함된 FucT 서열로부터 바로 하류 FucT 센스 가닥의 일부분을 포함하는, 제2 키메라 RNAi 발현 카세트로 안정적으로 형절전환시킬 수 있다.
큰 hpRNA 구조 또는 큰 ihpRNA 구조를 코딩하는 임의의 RNAi 발현 카세트내에 작동가능하게 연결된 프로모터는 후술되는 프로모터들 중 어느 하나를 포함하여, 대상 식물내에서 작동가능하게 연결된 저해성 폴리뉴클레오타이드의 발혀을 제공하는 임의의 원하는 프로모터일 수 있다. 조절 영역은 비제한적으로 5' 리더 서열 및 5' 리더 서열 + 후술되는 식물 인트론을 포함하여, 저해성 폴리뉴클레오타이드의 발현을 강화하는 추가적인 조절 요소를 포함할 수 있다.
또다른 예에서, RNAi 발현 카세트는 약 200 염기쌍 이하를 포함하는 염기쌍으로 이루어진 스템 영역을 가지고 있는 소형 hpRNA 구조체의 발현을 제공하도록 제작될 수 있다. 소형 hpRNA 구조체의 발현은 바람직하기로는 DNA-의존성 RNA 중합효소 III에 의해 인지되는 프로모터에 의해 추진되는 것이 바람직하다. 예로, 미국 특허 출원 20040231016을 참조하며, 이는 그 전체가 원용에 의해 본 명세서에 포함된다.
이러한 방식으로, RNAi 발현 카세트는 전사되는 DNA 영역이 센스 및 안티센스 뉴클레오타이드 영역을 포함하는 RNA 분자를 코딩하도록 제작되며, 상기 센스 뉴클레오타이드 서열은 대상 유전자로부터 전사되는 RNA로부터 약 19개의 연속적인 뉴클레오타이드로 구성된 뉴클레오타이드 서열과 약 90% 내지 약 100%의 서열 동일성을 가지는, 약 19개의 연속적인 뉴클레오타이드를 포함하며, 상기 안티센스 뉴클레오타이드 서열은 상기 센스 서열의 약 19개의 연속적인 뉴클레오타이드로 구성된 뉴클레오타이드 서열의 상보체와 약 90 내지 약 100% 서열 동일성을 가지는 약 19개의 연속적인 뉴클레오타이드를 포함한다. RNA 분자의 센스 및 안티센스 뉴클레오타이드 서열은 길이가 약 19 내지 약 200 뉴클레오타이드, 또는 약 21 내지 약 90 또는 100 뉴클레오타이드, 또는 약 40 내지 약 50 뉴클레오타이드인, RNA의 염기쌍으로 이루어진(즉, 이중 가닥) 스템 영역을 형성할 수 있어야 한다. 그러나, 또한, RNA의 염기쌍으로 이루어진 스템 영역의 길이는 약 30, 약 60, 약 70 또는 약 80 뉴클레오타이드 길이일 수 있다. RNA 분자의 염기쌍으로 이루어진 스템 영역이 19개의 뉴클레오타이드보다 긴 경우, 원하는 타겟 FucT 또는 XylT 폴리뉴클레오타이드의 19개의 연속 뉴클레오타이드와 "동일한"(하나의 미스매치는 허용함) 약 19개의 폴리펩타이드 센스 가닥의 하나 이상의 이중 가닥 영역(센스와 안티센스 영역간에 약 1개의 미스매치가 있을 수 있음)이 있는 것이 유일한 요건이다. 이러한 타입의 RNAi 발현 카세트의 전사되는 DNA 영역은 센스 및 안티센스를 코딩하는 뉴클레오타이드 영역 사이에 위치된 스페이서 서열을 포함할 수 있다. 상기 스페이스 서열은 타겟화된 FucT 또는 XylT 폴리뉴클레오타이드와 관련없으며, 그 길이는 약 3 내지 약 100 뉴클레오타이드이거나 또는 약 6 내지 약 40 뉴클레오타이드일 수 있다. 이러한 타입의 RNAi 발현 카세트는 또한 중합효소 III에 의해 인지되는 종결자 서열을 포함할 수 있으며, 그 서열은 옹리고 dT 가닥이며, 카세트의 안티센스 코팅 뉴클레오타이드 영역의 하류에 위치된다. "올리고 dT 가닥"은 연속적인 T 잔기들이다. 이는 4개 이상의 T 잔기를 포함하여야 하며, 명백하게는 더 많은 T 잔기를 포함할 수 있다.
짧은 hpRNA 제작에서, RNAi 발현 카세트의 hpRNA 코딩 부위내에 포함되는 타겟화된 유전자 서열의 단편(즉, FucT 또는 XylT 유전자 서열의 단편)과 스페이서 서열은 GC-다수 존재 서열을 피하도록, 특히 3개의 연속적인 G/C가 있는 서열을 피하도록 선정되어야 하며, 즉 "TTTT..."는 RNA 중합효소 III에 의해 인지되는 종결자 서열로서 제공되므로, T 또는 A가 연속적으로 4개 이상 있지 않도록 선정되어야 한다.
따라서, 짧은 hpRNA를 이용한 유전자 침묵을 원하는 경우, RNAi 발현 카세트는 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 후술되는 바와 같은 식물 세포의 DNA 의존적인 RNA 중합효소 III에 의해 인지되는 프로모터; 센스 및 안티센스 뉴클레오타이드 서열을 포함하는 DNA 단편으로, 센스 뉴클레오타이드 서열은 대상 FucT 또는 XylT 유전자의 센스 가닥으로부터 적어도 19개 이상의 연속체로 구성된 뉴클레오타이드 서열과 약 90% 내지 약 100%의 서열 동일성을 가지는, 19개 이상의 연속적인 뉴클레오타이드를 포함하며, 상기 안티센스 뉴클레오타이드 서열은 상기 센스 서열의 19개 이상의 연속적인 뉴클레오타이드로 구성된 뉴클레오타이드 서열의 상보체와 약 90 내지 약 100% 서열 동일성을 가지는 19개 이상의 연속적인 뉴클레오타이드를 포함하며, 상기 센스 및 안티센스 뉴클레오타이드 서열은 약 19 내지 약 200개의 뉴클레오타이드 길이의 이중가닥 RNA를 형성할 수 있음; 및 T 잔기가 4번 이상 연속되는 올리고 dT 가닥.
본 발명의 일부 예에서, RNAi 발현 카세트는 서열번호 3의 FucT의 발현을 억제하는 소형 hpRNA, 서열번호 3의 FucT 폴리펩타이드의 생물학적 활성을 가진 변이체, 또는 서열번호 1 또는 2의 서열과 90% 이상의 서열 동일성을 가지는 서열에 의해 코딩되는 FucT 폴리펩타이드를 발현하도록 제작된다. 이러한 방식으로, RNAi 발현 카세트는 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 후술되는 바와 같이, 식물 세포의 DNA 의존성 RNA 중합효소 III에 의해 인지되는 프로모터; 센스 및 안티센스 뉴클레오타이드 서열을 포함하는 DNA 단편으로, 센스 뉴클레오타이드 서열은 서열번호 1의 적어도 19개 이상의 연속적인 뉴클레오타이드로 구성된 뉴클레오타이드 서열과 약 90% 내지 약 100%의 서열 동일성을 가지는, 19개 이상의 연속적인 뉴클레오타이드를 포함하며, 상기 안티센스 뉴클레오타이드 서열은 상기 센스 서열의 19개 이상의 연속적인 뉴클레오타이드로 구성된 뉴클레오타이드 서열의 상보체와 약 90 내지 약 100% 서열 동일성을 가지는 19개 이상의 연속적인 뉴클레오타이드를 포함하며, 상기 센스 및 안티센스 뉴클레오타이드 서열은 약 19 내지 약 200개의 뉴클레오타이드 길이의 이중가닥 RNA를 형성할 수 있음; 및 T 잔기가 4번 이상 연속되는 올리고 dT 가닥.
본 발명의 다른 예에서, RNAi 발현 카세트는 서열번호 6 또는 서열번호 21의 XylT 폴리펩타이드의 발현을 억제하는 소형 hpRNA, 서열번호 6 또는 서열번호 21의 XylT 폴리펩타이드의 생물학적 활성을 가진 변이체, 또는 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 서열과 90% 이상의 서열 동일성을 가지는 서열에 의해 코딩되는 XylT 폴리펩타이드를 발현하도록 제작된다. 이러한 방식으로, RNAi 발현 카세트는 5'- 에서 3'- 방향으로 하기 작동가능하게 연결된 요소를 포함하도록 제작된다: 후술되는 바와 같이, 식물 세포의 DNA 의존성 RNA 중합효소 III에 의해 인지되는 프로모터; 센스 및 안티센스 뉴클레오타이드 서열을 포함하는 DNA 단편으로, 센스 뉴클레오타이드 서열은 서열번호 4의 적어도 19개 이상의 연속적인 뉴클레오타이드로 구성된 뉴클레오타이드 서열과 약 90% 내지 약 100%의 서열 동일성을 가지는, 19개 이상의 연속적인 뉴클레오타이드를 포함하며, 상기 안티센스 뉴클레오타이드 서열은 상기 센스 서열의 19개 이상의 연속적인 뉴클레오타이드로 구성된 뉴클레오타이드 서열의 상보체와 약 90 내지 약 100% 서열 동일성을 가지는 19개 이상의 연속적인 뉴클레오타이드를 포함하며, 상기 센스 및 안티센스 뉴클레오타이드 서열은 약 19 내지 약 200개의 뉴클레오타이드 길이의 이중가닥 RNA를 형성할 수 있음; 및 T 잔기가 4번 이상 연속되는 올리고 dT 가닥.
앰플리콘 매개 간섭( Amplicon - Mediated Interference )
앰플리콘 발현 카세트는 타겟 유전자의 전체 또는 일부를 포함하는 식물 바이러스 유래 서열을 포함하지만, 일반적으로 천연 바이러스의 모든 유전자를 포함하진 않는다. 발현 카세트의 전사 산물에 존재하는 바이러스 서열은 전사 산물이 그 자신의 복제를 지시하도록 한다. 앰플리콘에 의해 생성된 전사체는 타겟 서열(즉, FucT 또는 XylT, 또는 이 둘다의 메신저 RNA)에 대해 센스 또는 안티센스 중 어느 하나일 수 있다. 앰플리콘을 이용하여 내인성 식물 유전자의 발현을 저해하는 방법은 예컨대 Angell and Baulcombe (1997) EMBO J. 16:3675-3684, Angell and Baulcombe (1999) Plant J. 20:357-362, 및 미국 특허 6,646,805에 기술되어 있으며, 이들 각각은 원용에 의해 본 명세서에 포함된다.
리보자임
일부 예에서, 본 발명의 발현 카세트에 의해 생산되는 폴리뉴클레오타이드는 촉매성 RNA이거나 또는 FucT 또는 XylT, 또는 이 둘다의 메신저 RNA에 특이적인 리보자임 활성을 가진다. 따라서, 상기 폴리뉴클레오타이드는 내인성 메신저 RNA의 분해를 야기하여 FucT 또는 XylT, 또는 이 둘다의 발현을 감소시킨다. 이러한 방법은, 예컨대 미국 특허 4,987,071에 언급되어 있으며, 상기 문헌은 원용에 의해 본 명세서에 포함된다.
소형 간섭 RNA 또는 마이크로 RNA
본 발명의 일부 예들에서, FucT, XylT, 또는 둘다의 발현 저해는 마이크로 RNA(miRNA)를 코딩하는 유전자의 발현에 의한 RNA 간섭으로 달성할 수 있다. miRNA는 약 22개의 리보뉴클레오타이드로 구성된 조절성 물질이다. miRNA는 내인성 유전자의 발현 저해에 매우 효과적이다. 예로, Javier et al . (2003) Nature 425: 257-263을 참조하며, 상기 문헌은 원용에 의해 본 명세서에 포함된다.
miRNA 간섭을 위해, 발현 카세트는 내인성 miRNA 유전자상에 몰드(mold)되는 RNA 분자를 발현하도록 제작된다. miRNA 유전자는, 다른 내인성 유전자(타겟 서열)에 상보적인 22-뉴클레오타이드 서열을 포함하는, 헤어핀 구조를 형성하는, RNA를 코딩한다. FucT 또는 XylT 발현의 억제를 위해, 22-뉴클레오타이드 서열을 FucT 또는 XylT 전사체 서열로부터 선택되며, 상기 FucT 또는 XylT 서열의 센스 방향의 22개의 뉴클레오타이드와 센스 서열과 상보적인 대응되는 안티센스 서열의 21개의 뉴클레오타이드를 포함한다. miRNA 분자는 내인성 유전자의 발현 저해에 매우 효과적이며, 이들이 유도하는 RNA 간섭은 식물의 다음 세대로 유전된다.
유전자 발현의 폴리펩타이드를 이용한 저해
일 예에서, 폴리펩타이드는 FucT, XylT, 또는 둘다를 코딩하는 유전자에 결합하여 상기 유전자의 발현을 감소시키는, 아연 핑거 단백질(zinc finger protein)을 코딩한다. 특정 예에서, 아연 핑거 단백질은 FucT 또는 짙 유전자의 조절 영역에 결합한다. 다른 예로, 아연 핑거 단백질은 FucT 또는 XylT를 코딩하는 메신저 RNA에 결합하여, 이의 전좌를 방지한다. 아연 핑거 단백질에 의한 타겟팅 부위를 선정하는 방법은 예컨대 미국 특허 6,453,242에 개시되어 있으며, 아연 핑거 단백질을 이용하여 유전자의 발현을 저해하는 방법은 예컨대, 미국 특허 공개공보 20030037355에 개시되어 있으며; 이들 각각은 원용에 의해 본 명세서에 포함된다.
단백질 활성의 폴리펩타이드를 이용한 저해
본 발명의 일부 예에서, 폴리펩타이드는 하나 이상의 FucT 또는 XylT에 결합하는 항체를 코딩하며, FucT 또는 XylT의 활성을 감소시킨다. 다른 예로, 항체의 결합으로 세포 퀄러티 관리 기전(cellular quality control mechanism)에 의해 항체-FucT 또는 XylT 컴플렉스의 반감기가 증가된다. 식물에서에서의 항체 발현과 식물 세포에서 발현과 항체 결합에 의한 저해의 분자 경로는 당업계에 잘 알려져 있다. 예로, Conrad and Sonnewald (2003) Nature Biotech . 21:35-36을 참조하며, 원용에 의해 본 명세서에 포함된다.
유전자 파괴
본 발명의 일부 예에서, FucT, XylT, 또는 둘다의 활성은 FucT, XylT, 또는 둘다를 코딩하는 유전자의 파괴에 의해 감소 또는 없어진다. FucT, XylT, 또는 둘다를 코딩하는 유전자는 당업계에 공지된 임의 방법에 의해 파괴될 수 있다. 예컨대, 일 예에서, 유전자는 트랜스포존 테깅(transposon tagging)에 의해 파괴된다. 다른 예에서, 유전자는 무작위 또는 타겟화된 돌연변이 유발을 이용한 식물의 돌연변이 유발 및 FucT 및/또는 XylT 활성이 감소된 식물의 선별 단계에 의해 파괴된다.
트랜스포존 테깅
본 발명의 일 예에서, 트랜스포존 테깅은 FucT, XylT, 또는 둘다의 활성을 감소 또는 제거하는데 사용된다. 트랜스포존 테깅은 FucT 또는 XylT의 발현을 감소 또는 없애개 위해 내인성 FucT 또는 XylT 유전자내에 트랜스포존을 삽입하는 것을 포함한다. "FucT" 또는 "XylT" 유전자는 본 발명에 따라 각각 FucT 또는 XylT를 코딩하는 유전자를 의미한다.
상기 예에서, FucT 또는 XylT의 발현은 FucT 또는 XylT를 코딩하는 유전자의 코딩 영역 또는 조절 영역내에 트랜스포존을 삽입함으로써, 감소 또는 소거된다. 엑손, 인트론, 5' 또는 3' 비번역 서열, 프로모터 또는 FucT, XylT, 또는 둘다의 임의 그외 조절 서열내에 있는 트랜스포존을 사용하여 코딩된 FucT 또는 XylT의 활성 및/또는 발현을 감소 또는 소거할 수 있다.
식물에서의 특이적인 유전자의 트랜스포존 테깅 방법은 당업계에 잘 알려져 있다. 예로, Maes et al . (1999) Trends Plant Sci . 4:90-96; Dharmapuri and Sonti (1999) FEMS Microbiol . Lett. 179:53-59; Meissner et al . (2000) Plant J. 22:265-274; Phogat et al . (2000) J. Biosci. 25:57-63; Walbot (2000) Curr . Opin . Plant Biol . 2:103-107; Gai et al . (2000) Nucleic Acids Res . 28:94-96; Fitzmaurice et al. (1999) Genetics 153:1919-1928)을 참조한다. 아울러, 선택된 유전자에서 Mu 삽입을 선별하기 위한 TUSC 과정은 Bensen et al . (1995) Plant Cell 7:75-84; Mena et al. (1996) Science 274:1537-1540에 기술되어 있으며; 이들 각각은 원용에 의해 본 명세서에 포함된다.
본 발명은 FucT 또는 XylT의 활성을 감소 또는 소거하기 위한 추가적인 방법을 포함한다. 식물에서 게놈 뉴클레오타이드 서열을 변형 또는 돌연변이화하는 그외 방법들은 당업계에 공지되어 있으며, 비제한적으로 RNA:DNA 벡터의 사용, RNA:DNA 돌연변이 벡터의 사용, RNA:DNA 교정 벡터(repair vector)의 사용, 혼성-이중의 올리고뉴클레오타이드의 사용, 자가-상보적인 RNA:DNA 올리고뉴클레오타이드의 사용 및 재조합으로 제조한 올리고뉴클레오타이드의 사용을 포함한다. 이러한 사용 벡터 및 방법은 당업계에 공지되어 있다. 예로, 미국 특허 5,565,350; 5,731,181; 5,756,325; 5,760,012; 5,795,972; 및 5,871,984를 참조하며, 이들 각각은 원용에 의해 본 명세서에 포함된다. 또한, WO 98/49350, WO 99/07865, WO 99/25821 및 Beetham et al . (1999) Proc . Natl. Acad . Sci . USA 96:8774-8778을 참조하며; 이들 각각은 원용에 의해 본 명세서에 포함된다.
따라서, 원하는 고등 식물에서의 FucT 및/또는 XylT의 발현 저해는, 상기 식물내에서 생산되는 내인성 및 이종의 당단백질의 N-당화 패턴을 변형시키기 때문에, 이들 단백질이 β1,2-연결된 자일로스 잔기 및/또는 α1,3-연결된 푸코스 잔기의 함유량이 감소된 컴플렉스 N-글리칸을 포함하도록, 전술한 임의 방법에 의해 달성할 수 있다. 당단백질 N-글리칸에 β1,2-연결된 자일로스 잔기 및/또는 α1,3-연결된 푸코스 잔기의 부착이 감소되는 정도는 각각의 FucT 및 XylT 효소의 발현 저해 정도에 의해 결정된다.
본 발명의 일부 예들에서, 본원의 방법을 이용하여 안정적으로 형질전환되어 XylT 발현을 타겟으로 하는 식물 숙주에서 생산되는 재조합 당단백질은, XylT 효소 및 이의 이소형의 발현을 저해하도록 유전자 변형되지 않은 식물 숙주에서 생산되는 당단백질의 각 N-연결된 글리칸에서 형성되는, β1,2-연결된 자일로스 잔기를, 50% 미만, 40% 미만, 30% 미만으로 포함하는, N-연결된 글리칸을 가진다. 다른 예에서, 이들 재조합 당단백질은 XylT 효소 및 이의 이소형의 발현을 저해하도록 유전자 변형되지 않은 식물 숙주에서 생산되는 당단백질의 각 N-연결된 글리칸에서 형성되는, β1,2-연결된 자일로스 잔기를, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 또는 1% 미만으로 포함하는, N-연결된 글리칸을 가진다. 또다른 예에서, 본 발명은 식물에서 생산된 재조합 단백질이 β1,2-연결된 자일로스 잔기가 결여된 N-연결된 글리칸을 가지도록, 안정적으로 형질전환된 식물내에서의 XylT 유전자 및 이의 임의 이소형의 완전한 침묵화를 제공한다.
이와 같은 방식으로, 본 발명의 방법으로 안정적으로 형질전환되어 FucT 발현을 타겟으로 하는 경우, 식물내에서 생산되는 재조합 당단백질은 FucT 효소 및 이의 이소형의 발현을 저해하도록 유전자 변형되지 않은 식물 숙주에서 생산되는 당단백질의 각 N-연결된 글리칸에서 형성되는, α1,3-연결된 푸코스 잔기를, 50% 미만, 40% 미만, 30% 미만으로 포함하는, N-연결된 글리칸을 가진다. 다른 예에서, 이들 재조합 당단백질은 FucT 효소 및 이의 이소형의 발현을 저해하도록 유전자 변형되지 않은 식물 숙주에서 생산되는 당단백질의 각 N-연결된 글리칸에서 형성되는, α1,3-연결된 푸코스 잔기를, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 또는 1% 미만으로 포함하는, N-연결된 글리칸을 가진다. 또다른 예에서, 본 발명은 식물에서 생산된 재조합 단백질이 α1,3-연결된 푸코스 잔기가 결여된 N-연결된 글리칸을 가지도록, 안정적으로 형질전환된 식물내에서의 XylT 유전자 및 이의 임의 이소형의 완전한 침묵화를 제공한다.
식물 숙주가 본 발명의 방법으로 안정적으로 형질전환되어, XylT과 FucT 이들 둘다, 및 이들의 임의 이소형의 발현을 타겟으로 하는 경우, 식물내에서 생산되는 재조합 당단백질은, FucT 및 XylT 효소와 이의 이소형의 발현을 저해하도록 유전자 변형되지 않은 식물 숙주에서 생산되는 당단백질의 각 N-연결된 글리칸에서 형성되는, β1,2-연결된 자일로스 잔기를, 50% 미만, 40% 미만, 30% 미만으로 포함하고 α1,3-연결된 푸코스 잔기를 50% 미만, 40% 미만, 30% 미만으로 포함하는, N-연결된 글리칸을 가진다. 다른 예에서, 이들 재조합 당단백질은, FucT 및 XylT 효소와 이의 이소형의 발현을 저해하도록 유전자 변형되지 않은 식물 숙주에서 생산되는 당단백질의 각 N-연결된 글리칸에서 형성되는, β1,2-연결된 자일로스 잔기를, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 또는 1% 미만으로 포함하고 α1,3-연결된 푸코스 잔기를 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 또는 1% 미만으로 포함하는, N-연결된 글리칸을 가진다. 또다른 예에서, 본 발명은 식물에서 생산된 재조합 단백질이 β1,2-연결된 자일로스 잔기와 α1,3-연결된 푸코스 잔기가 결여된 N-연결된 글리칸을 가지도록, 안정적으로 형질전환된 식물내에서의 XylT 및 FucT 유전자와 이의 임의 이소형의 완전한 침묵화를 제공한다.
본 발명의 일부 예에서, 본 발명의 방법으로 안정적으로 형질전환되어, XylT 및 FucT 둘다, 및 이의 임의 이소형의 발현을 타겟으로 식물 숙주는, N-연결된 글리칸이 실질적으로 동질적인 재조합 단백질을 생산할 수 있다. "실질적으로 동질적인"은 당화 프로파일에서 바람직한 N-글리칸 종, 특히 상기 당단백질에 존재하는 N-글리칸 구조체의 90% 이상이 GO 글리칸 종이고, GO 글리칸 종에 해당되는 하나의 주 피크가 존재하는 것으로 의도된다.
또한, 당화 프로파일이라고도 하는 당단백질의 N-당화 패턴 변화를 모니터링하는 방법은 당업계에 잘 알려져 있으며, 예컨대 하기 실시예 3에 언급된 MALDI-TOF의 변형 분석을 이용한 MALDI-TOF(matrix-assisted laser desorption ionization time-of-flight) 질량 측정, 액체 크로마토그래피 질량 측정(LS-MS), 기체 크로마토그래피, 음이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 고-농도 폴리아크릴아미드 겔 전기영동, 핵 자기 공명 스펙트로스코피, 모세관 전기영동, 모세관 겔 전기영동, 형광 표지, 및 고성능 액체 크로마토그래피(HPKC) 및 QTOF 등이 있으나, 이로 한정되는 것은 아니다. 이러한 방식으로, 본 발명의 안정적으로 형질전환된 식물에서의 XylT 및/또는 FucT의 발현 또는 기능의 저해로 인한, 안정적으로 형질전환된 식물에서 수득한 샘플(예, 잎 조직 샘플)의 N-당화 패턴 변화는, MALDI-TOF 질량 측정에 의해 총 N-글리칸 분석을 실시하고, 그 결과를 XylT 및/또는 FucT의 발현이나 기능을 저해하도록 유전자 변형하지 않은 대조군 식물의 상응하는 시료로부터 구한 결과와 비교함으로써, 모니터링할 수 있다. N-글리칸에서의 자일로스 및/또는 푸코스 잔기의 함유량 감소는 각 피크의 질량 감소에 의해 모니터링할 수 있다. 예로, Strasser et al. (2004) FEBS Letters 561:132-136을 참조한다.
이와 유사하게, 임의의 주어진 재조합으로 생산된 당단백질의 당화 프로파일은 당업계에 잘 알려져 있는 표준 기법을 이용하여 쉽게 결정된다. 예로, Morelle and Michalski (2005) Curr . Anal . Chem . 1:29-57을 참조하며, 그 전체가 원용에 의해 본 명세서에 포함된다. 따라서, 식물 숙주 등의 숙주 유기체에서 재조합으로 생상된 당단백질을 이에 부착된 구체적인 N-연결된 글리칸의 비를 분석할 수 있다. 이러한 방식으로, 재조합으로 생산된 분리된 당단백질을 포함하는 샘플은 상기 당단백질로부터 개별 글리칸 구조체를 분리시키기 위해 효소적 또는 화학적 반응에 투입할 수 있다. 이러한 탈당화 단계 이후에, 당화 프로파일의 분석은 전술한 임의 분석 방법으로 수행할 수 있다.
재조합으로 생산된 당단백질 산물은 전형적으로 다양한 부위 점유율(degrees of site occupancy)로 당화 부위에 가변적인 몰 양으로 하나 내지 수십 개의 상이한 글리칸이 있는 다양한 글리코형 집단으로서 존재한다. 당단백질에 따라, 상이한 글리코형은 상이한 기능적인 프로파일을 생성할 수 있다. 따라서, 본 발명의 일부 예에서, N-글리칸 온전체를 가지는 당단백질의 당화 프로파일을 결정하는 것이 바람직하다. 온전한 당단백질의 당화 프로파일을 결정하기 위한 당업계에 공지된 임의 기법을 사용할 수 있으며, 전술한 질량 측정 방법과 하기 실시예의 질량 측정 방법을 포함한다.
본원의 방식으로 푸코실트랜스퍼라제 및/또는 자일로실트랜스퍼라제의 발현 또는 기능을 일시적으로 또는 안정적으로 감소시키거나 소거함으로써, 이들 효소의 발현이나 기능이 변형되지 않았을 때(즉, 식물은 천연형 또는 야생형 당화 장치를 가지고 있음) 식물에서 생산되는 당단백질들에서 정상적으로 관찰되는 프로파일이 비해, 이질성(heterogeneity)이 감소된 N-당화 프로파일을 가지는 당단백질을 생산할 수 있는 능력을 지닌, 형질전환된 고등 식물을 생산할 수 있다. 이들 효소 중 하나 또는 둘다의 발현이나 기능을 전술한 본원의 한가지 이상의 방법을 이용하여 안정적 감소 또는 소거한 경우, 형질전환 식물에서 생산되는 당단백질의 N-당화 프로파일의 이질성 감소는 무성 또는 유성 생식으로 식물 세대에서 세대로 유지될 것이며, 배양 조건 및 생산 규모 확대에 따라서도 유지될 것이다.
이러한 방식으로, 본 발명은 고등 식물, 예컨대 쌍자엽식물강 또는 단자엽식물강 식물, 예컨대 개구리밥에서 생산되는 당단백질의 N-당화 프로파일의 이질성을 감소시키는 방법을 제공한다. 이 방법은 푸코실트랜스퍼라제 및/또는 자일로실트랜스퍼라제의 발현이나 기능이 식물내에서 감소되거나 없어지도록, 본원의 뉴클레오타이드 구조체를 식물에 도입하는 단계를 포함한다. 본 발명의 일부 예들에서, 고등 식물에서 생산되는 당단백질의 N-당화 프로파일의 이질성을 감소시키는 방법은, 전술한 하나 이상의 뉴클레오타이드 구조체를 원하는 고등 식물에 도입하는 단계를 포함하며, 상기 뉴클레오타이드 구조체(들)는, 식물에서, 예컨대 전술한 한가지 이상의 방법을 이용하여, 푸코실트랜스퍼라제 및/또는 자일로실트랜스퍼라제의 발현 억제를 제공한다.
"N-당화 프로파일의 이질성 감소"는 N-당화 프로파일에서 나타나는 개별적인 N-글리칸 종들의 총 수 감소가 특징적인 것을 의미한다. 따라서, 예컨대, 천연형 또는 야생형의 당화 장치를 가져 (푸코실트랜스퍼라제 및 자일로실트랜스퍼라제의 발현을 감소 또는 없애기 위해 유전자 변형하지 않은) 고등 식물에서 생산된 당단백질이N-글리칸 5종의 혼합물의 존재가 특징인 N-당화 프로파일의 당단백질을 보이는 경우, 본 발명의 방법을 이용하여 N-당화 프로파일에서 나타나는 N-글리칸 종의 수를 낮출 수 있다. 이러한 방식으로, 고등 식물이 본원의 방식으로 유전자 변형되어 푸코실트랜스퍼라제 및/또는 자일로실트랜스퍼라제의 발현 또는 기능이 저해 또는 소거된 경우에, 이러한 당단백질의 N-당화 프로파일은 프로파일에서 나타나는 N-글리칸 종의 수 감소, 예컨대 N-글리칸 5종 미만의 혼합물, 예컨대, N-글리칸 종 4, 3, 2 개 미만, 또는 심지어 하나의 N-글리칸 종으로의 감소가 특징적일 수 있다. N-당화 프로파일에서 단일의 우세적인 N-글리칸 종의 존재가 특징적이도록 프로파일의 이질성이 감소된 경우, N-당화 프로파일은 실질적으로 상기 N-글리칸 종과 동질적일 것이다.
일부 예들에서, 고등 식물에서 생산되는 당단백질의 N-당화 프로파일의 이질성을 감소시키는 방법은, GO 글리칸 종에 실질적으로 동질적인 N-당화 프로파일을 갖는 단백질의 생산으로 귀결된다. 그러한 예로, 고등 식물에서 생산되는 당단백질의 N-당화 프로파일의 이질성을 감소시키는 방법은, 당단백질의 N-당화 프로파일에서 나타나는 N-글리칸 종의 총 량의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%가 GO 글리칸 종인, 실질적으로 동질적인 N-당화 프로파일을 가지는 당단백질을 만든다. 이러한 예로, 미량의 전구체 N-글리칸이 본원에 언급된 바와 같이 N-당화 프로파일에서 나타날 수 있으며, 이 때 N-당화 프로파일에 존재하는 임의의 주어진 전구체 N-글리칸 종들은 프로파일에서 나타나는 N-글리칸 종의 총 양에 5% 미만, 바람직하기로는 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 또는 심지어 0.1% 미만으로 존재한다.
당단백질은 원하는 내인성 당단백질이거나, 원하는 고등 식물에서 생산되는 이종의 당단백질, 예컨대 본원에 언급된 당단백질 등의 포유류 당단백질일 수 있다. 일부 예에서, 당단백질은 단일클론 항체이다. 다른 예에서, 당단백질은 인터페론 에리트로포이에틴(EPO) 및 조직 플라스미노겐 활성자(tPA), 플라스미노겐, 과립구-대식세포 콜로니 자극 인자(GM-CSF) 및 치료적 면역글로불린으로 이루어진 군으로부터 선택된다.
본 발명의 방법을 이용하여, 생산 규모가 확대된 형질전환 식물에서 생산되는 당단백질에 대한 N-당화 프로파일에서 이질성 감소를 유지하여, 따라서 이의 N-당화 프로파일에서 프로파일에 나타나는 다수의 N-글리칸 종 감소가 특징인 당단백질을 식물이 계속 생산한다. "생산 규모 확대" 또는 "생산 규모 증가"는 원하는 단백질을 생산하기 위해 사용되는 배양 시스템(즉, 배양 바셀 또는 식물이 배양되는 배양 용기)내에 존재하는 식물 생중량 증가를 의미한다. 따라서, 예컨대 연구 목적에 적합한 규모에서 파일롯 생산(pilot production)에 적합한 규모로의 생산 규모 확대와 이후 원하는 당단백질의 상업적인 생산에 적합한 규모로의 규모 확대일 때, 생산 규모 확대가 이루어진다.
일부 예에서, 형질전환 고등 식물은 당단백질의 재조합 생산을 위한 숙주로서 제공하는 단자엽식물강 식물 예컨대 개구리밥 식물이며, 재조합으로 생산된 당단백질의 N-당화 프로파일의 이질성 감소가 생산 규모는 초기 출발 생중량의 적어도 300배, 적어도 500배 적어도 700배, 적어도 1,000배, 적어도 1,500배 또는 그 이상으로 증가됨에 따라 유지된다. 이들 일부 예로, 형질전환성 고등 식물은 원하는 당단백질을 재조합으로 생산하는 개구리밥 식물이며, N-당화 프로파일의 이질성 감소는 생산 규모가 초기 출발 생중량의 적어도 2,000배, 적어도 3,000배, 적어도 4,000배, 적어도 5,000배, 적어도 6,000배, 적어도 6,500 배 또는 그 이상으로 증가됨에 따라 유지된다. 그러한 일 예로, 고등 식물은 원하는 당단백질을 재조합으로 생산하는 개구리밥 식물이며, 상기 당단백질의 N-당화 프로파일의 이질성 감소는 생산 규모가 초기 출발 생중량의 적어도 7,000배, 8,000배, 9,000배, 10,000배, 12,500배, 15,000배, 17,500배, 20,000배, 23,000배, 26,000배 또는 그 이상으로 증가됨에 따라 유지된다.
아울러, 원하는 형질전환 식물이 연속적인 클론 배양(clonal culture)에 의해 유지되는 경우, 수득되는 형질전환주는 이의 N-당화 프로파일내의 이질성 감소를 보이는 단백질을 계속적으로 생산한다. 연속적인 클론 배양은 당업계에 공지된 임의의 적정 방법으로 달성할 수 있다. 일부 예에서, 연속적인 클론 배양은 식물 배양물의 하나 이상의 부표본을 주기적으로 취하여 이를 추가적인 배양을 위해 신선한 배양 배지에 이동시킴으로써 달성한다. 따라서, 예컨대, 일부 예들에서, 연속적인 클론 배양에 의해 유지되는 형질전환 식물주는 푸코실트랜스퍼라제 및/또는 자일로실트랜스퍼라제의 발현 또는 기능을 감소 또는 없애기 위해 유전자 변형된 개구리밥 형질전환 식물주이다. 이러한 방식으로, 형질전환 식물주에서 생산되는 당단백질의 N-당화 프로파일의 이질성 감소는 적어도 8 개월, 적어도 10 개월, 적어도 1 년, 적어도 1.5 년, 적어도 2 년, 적어도 2.5 년, 적어도 3 년, 적어도 3.5 년, 적어도 4 년, 적어도 4.5 년, 적어도 5 년 또는 그 이상의 기간동안 형질전환 식물의 연속적인 클론 배양으로 유지되며, 형질전환 식물주가 유지되는 한 유지될 수 있다.
이종의 폴리펩타이드 및 당단백질
본원의 방법을 이용하여 변형된 N-당화 패턴을 가진 당단백질을 생산하도록 안정적으로 형질전환된 고등 식물, 특히 제약학적 용도의 재조합 단백질의 발현 시스템으로서 제공하는 고등 식물을, 원하는 임의의 재조합 단백질을 생산하도록 유전자 변형할 수 있다. 재조합 단백질을 번역 후 당화에 적용가능한 경우, 본 발명의 방법은 포유류 숙주의 패턴과 훨씬 유사하게 나타나는 N-당화 패턴, 특히 "인간화"된 당화 패턴을 가지는 당단백질을 생산하기 위한 수단을 제공하는데 유익하다. 본 발명의 재조합 단백질의 예로는, 인슐린, 성장 호르몬, 플라스미노겐, α-인터페론, 베타-인타페론, 베타-글루코세레브로시다제, 베타-글루코로니다제, 레니토블라스토마 단백질, p53 단백질, 안지오스타틴, 렙틴, 단일클론 항체 및 이의 단편, 사이토카인, 예컨대, 에리트로포이에틴(EPO), 과립구 대식세포 콜로니 자극 인자, 조직 플라스미노겐 활성자, 혈액 응고 인자, 예컨대 팩터 VII, 팩터 VIII, 팩터 IX 및 활성화된 단백질 C, 알파 1-항트립신, 수용체, 호르몬, 인간 백신, 동물 백신, 펩타이드 및 혈청 알부민을 포함하나, 이로 한정되는 것은 아니다. 아울러, 본 발명의 형질전환 고등 식물은 GO 글리칸 종에 대한 실질적으로 동질적인 당화 프로파일을 가지며 GO 글리코형에 대한 그것의 실질적인 동질성이 특징적인, 당단백질 산물을 생산할 수 있다. 이는, 이롭게는 생산 농도(production consistency)가 증가되었으며, 이들 당단백질 조성물의 생산과 관련있는 화학적, 제조 및 관리(CMC) 위험성이 감소된 식물 숙주 발현 시스템이 된다.
본 발명의 방법에 따라 생산된 당단백질 조성물은 약학적으로 허용가능한 담체를 포함하는 조성물내에 포함될 수 있다. 이러한 조성물은 당단백질 처리가 이로운 효과를 제공할 질환 또는 장애에 대해 개체를 치료하는 방법에 이용가능하다. 이러한 방식으로, 본 발명의 방법에 따라 안정적으로 형질전환된 식물, 예컨대 개구리밥 식물에서 생산된 당단백질은 이를 필요로하는 개체에 투여될 수 있다.
본 발명의 당단백질 조성물은 GO 글리칸 구조물이 우세한 N-연결된 글리칸을 포함한다. 이러한 방식으로, 본 발명은 전술한 바와 같이 "실질적으로 동질적인" 또는 "실질적으로 균일한" 당화 프로파일을 가지거나, 또는 "실질적인 동질성"을 가지는 당화 프로파일의 당단백질 조성물을 제공한다. 따라서, 당단백질 조성물은 GO 글리칸 종들에 대해 실질적으로 동질적이며, 따라서 조성물의 당화 프로파일에서 나타나는 N-글리칸 종의 총 양의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%이 GO 글리칸 종이고 전구체 N-글리칸 종이 미량으로 당화 프로파일에 나타나는, 즉 당화 프로파일에 존재하는 임의의 주어진 전구체 N-글리칸이 프로파일에서 나타나는 N-글리칸 종의 총 양의 5% 미만, 바람직하기로는, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 심지어 0.5% 또는 0.1% 미만으로 존재하는, 실질적으로 동질적인 당화 프로파일을 가진다. 그러한 조성물에서, 이의 당화 프로파일에서 나타나는 대표적인 전구체 N-글리칸 종은 전술한 Man3GlcNAc2, MGn (GlcNac1Man3GlcNAc2, GlcNac1은 1,3 만노스 암에 부착됨), 및 GnM (GlcNac1Man3GlcNAc2, GlcNac1은 1,6 만노스 암에 부착됨) 전구체 N-글리칸 종이며, 여기에서 임의의 하나 또는 이들 전구체 N-글리칸 종들의 조합으로 존재될 수 있다.
이러한 방식으로, 본 발명은 전술한 정의에 따라 "실질적으로 동질적인" 또는 "실질적으로 균일한" 당단백질 조성물, 또는 "실질적인 동질성"을 가진 당단백질 조성물을 제공한다. 일부 예에서, 본 발명은 조성물에 존재하는 당단백질의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99% 가 GO 글리코형이고, 참여하는 당화 부위 모두에 GO 글리칸 종이 차지하고 있으며, 전구체 또는 부적절한 글리코형은 미량으로 조성물에 존재하는 즉, 조성물에 존재하는 총 글리코형의 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5 미만 또는 0.1% 미만이 전구체 글리코형인, 실질적으로 동질적인 당단백질 조성물을 제공한다. 이런 조성물에서, 대표적인 전구체 글리코형은 당화 부위가 채워지지 않은 것일 수 있으며, 부적절한 글리코형의 예로는 당화 부위에 GO 글리칸 및 GOX 또는 GOXF3 글리칸 종의 혼합물이 부착되어 있는 글리코형일 것이다.
본 발명이 일부 예에서, 식물 숙주는 원하는 포유류 단백질, 특히 원하는 인간 단백질에 특이적으로 결합하는 항체의 발현을 제공하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 따라서, 일 측면으로, 본 발명은 고등 식물에서 N-연결된 글리칸내의 β1,2-연결된 자일로스 잔기 및 α1,3-연결된 푸코스 잔기의 함량 감소가 반영된 N-당화 패턴을 가지는 단일클론 항체를 생산하는 방법과, 본원의 방식으로 유전자 변형된 식물 숙주를 이용하여 생산된 재조합 단일클론 항체를 포함하는 조성물을 제공한다. 일부 예에서, 원하는 식물 숙주는 개구리밥 과의 식물이다.
단일클론 항체는, 자가면역 또는 감염성 요소를 가진 암 및 질환들을 비제한적으로 포함하는, 인간 질환을 치료하기 위한 치료제로서의 사용이 점차 증가하고 있다. 예컨대, King (1999) Curr . Opin . Drug Discovery Dev . 2:110-17; Vaswani and Hamilton (1998) Ann . Allergy Asthma Immunol . 81:105-19; 및 Holliger and Hoogenboom, Nat . Biotechnology 16:1015-16을 참조하며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다. 이들 항체 중 일부는, 예컨대 수용체나 리간드에 결합하여 리간드-수용체 상호작용을 저해하는 항체는, 단독으로 항체 결합을 유발하는 치료 효과를 가지지만, 치료학적으로 활성이 되기 위해 면역 시스템을 충원(recruitment)하여 타겟 세포를 죽이는 것과 같은 작동자 기능이 필요하다. 예로, Clynes et al . (2000) Nat . Med . 6:443-46; Clynes et al . (1998) Proc . Natl . Acad . Sci . U.S.A. 95:652-56, and Anderson et al . (1997) Biochem . Soc . Trans . 25:705-8을 참조하며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다.
항체의 항원 인지 활성과 작동자 기능은 항체 분자의 서로 다른 위치에 있다. 항체의 Fab' 부분은 항원 인지 활성을 제공하지만, Fc 부분은 식균 세포(대식세포 및 호중구), 자연 살상 세포, 및 비만세포(mast cell) 등의 보조 작동자 세포의 활성화와 같은 작동자 기능을 제공한다. 항체는 Fc 영역을 통해 세포에 결합하며, 항체 Fc 영역상의 Fc 수용체 부위는 세포상에서 Fc 수용체(FcR)에 결합한다. IgG (감마 수용체), IgE (에타 수용체), IgA (알파 수용체) 및 IgM (뮤 수용체) 등의 여러가지 항체 클래스에 특이적인 다수의 Fc 수용체들이 있다. 세포 표면상에서 Fc 수용체에 항체 결합은, 항체로 코딩된 입자의 포획(engulfment) 및 파괴, 면역 복합체의 소거(clearance) 및 살상 세포에 의한 항체 코딩된 타겟 세포의 세포 용혈(항체 의존적인 세포 매개성 세포독성 또는 ADCC라 함), 보체-의존적인 세포독성(CDC) 개시, 염증성 매개자의 분비 및 면역글로불린 생산 조절 등의 중요하고 다양한 생물학적 반응 다수를 촉발시킨다. 항체의 작동자 기능을 분석하는 방법은 당업계에 잘 알려져 있으며, CDC, ADCC 및 세포자살 분석 방법을 포함한다. 예로, Subbramanian et al. (2002) J. Clin . Microbiol . 40:2141-2146; Ahman et al. (1994) J. Immunol . Methods 36:243-254; Brezicka et al. (2000) Cancer Immunol . Immunother . 49:235-242; Gazzano-Santoro et al. (1997) J. Immunol . Methods 202:163-171; Prang et al. (2005) British J. Cancer 92:342-349; Shan et al. (1998) Blood 92:3756-3771; Ghetie et al. (2001) Blood 97:1392-1398; 및 Mathas et al. (2000) Cancer Research 60:7170-7176을 참조하며, 이들은 원용에 의해 본 명세서에 포함된다.
항체 분자의 Fc 부분의 당화 상태가 항체가 작동자 기능을 가질 것일지를 결정하는데 중요한 작용을 한다는 것은 당업계에 공지되어 있다. 예로, Tao and Morrison (1987) J. Immunol . 143:2595-601; Wright and Morrison (1997) Trends in Biotech . 15:26-32; Wright and Morrison (1998) J. Immunol . 160:3393-402; Mimura et al. (2000) Mol . Immunol . 37:697-706; Jefferis and Lund (2002) Immunol . Lett . 82:57-65; Krapp et al . (2003) J. Mol . Biol . 325:979-89; 및 Jefferis (2005) Biotechnol. Prog . 21:11-16을 참조하며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다. 재조합으로 생산된 항체의 당화는 사용되는 발현 시스템에 따라 달라진다. 예로, Raju et al . (2000) Glycobiology 10:477-86; Wright and Morrison (1997) Trends in Biotech . 15:26-32를 참조한다. 또한, 포유류에서 생산된 단일클론 항체의 N-당화 패턴이 변형되어 α(1,6)-연결된 코어 푸코스 잔기가 감소 또는 없어진 경우, 단일클론 항체는 작동자 기능, 특히 ADCC 활성의 증가를 보인다. 예컨대, 미국 특허 6,946,292를 참조한다. N-당화 패턴이 변형되어 1,3 및/또는 1,6 만노스 암에 부착된 β(1,4)-갈락토스 잔기가 감소 또는 없어진, 포유류에서 생산된 일부 단일클론 항체의 경우, ADCC 활성 등의 항체의 기타 기능적 활성화를 변형시키지 않으면서, 항원을 가지고 있는 타겟 세포에 대한 보체-의존적인 세포독성(CDC)의 활성화를 감소시킬 수 있다. 예로, Boyd et al . (1995) Mol . Immunol . 32:1311-1318을 참조한다.
항원 인지 활성을 가진 항체, 일부 경우에 향상된 작동자 기능을 가진 항체를, 개구리밥과 같이 본원의 방식으로 안정적으로 형질전환되어 이의 당화 장치가 변형된, 고등 식물에 의해 생산할 수 있다. 따라서, 본 발명은 향상된 작동자 기능을 가진 단일클론 항체 등의 재조합 단일클론 항체를 생산하는 방법을 제공하며, 상기 항체는 이들 당단백질에서 N-글리칸에 부착된 식물 특이적인 β1,2-연결된 자일로스 잔기 및/또는 α1,3-연결된 푸코스 잔기의 함유 감소가 나타나도록, 그곳에서 생산되는 내인성의 이종의 당단백질에 대해 변형된 N-당화 패턴을 가진 식물내에서, 재조합으로 생산된다. 항체에서 이의 N-글리칸에 부착된 α1,3-연결된 푸코스 잔기의 양이 감소된 경우, 항체는 FucT의 발현 또는 기능을 저해하기 위해 유전자 변형하지 않은 대조군 식물에서 생산되는 항체에 비해, ADCC 활성 증가를 보일 수 있다.
또한, 본 발명은 작동자 기능, 일부 예에서는 개선된 작동자 기능을 가지며, 서열번호 3의 FucT 및/또는 서열번호 6의 XylT, 및 이들의 이소형, 예컨대 서열번호 21(서열번호 20에 의해 코딩됨)에 기재된 서열을 포함하는 FucT 이소형 #2의 발현 또는 기능을 저해하도록 유전자 변형된 개구리밥 발현 시스템에서 생산되는, 재조합 단일클론 항체를 포함한다. 따라서, 일부 예들에서, 상기 단일클론 항체의 재조합 생산용 숙주로서 제공되는 식물은, 본원에 언급된 바와 같이, 게놈내에 안정적으로 삽입된 전술한 FucT RNAi 발현 카세트 및/또는 XylT RNA 발현 카세트를 포함하는, Lemnaceae에 속하는 식물, 예컨대 렘나 식물이다. 이러한 방식으로, 본 발명은 포유류 숙주 발현 시스템에서 발견되는 패턴에 더 가까운 N-당화 패턴을 가지며 개선된 작동자 기능을 가진, 재조합 단일클론 항체를 생산하는 방법을 제공하며, 상기 방법은 재조합으로 생산되는 단일클론 항체가 N-글리칸에 식물 β1,2-연결된 자일로스 잔기 및/또는 α1,3-연결된 푸코스 잔기의 부착 감소를 보이도록 당화 장치를 변형시키기 위해 유전자 변형된, 개구리밥 식물, 개구리밥 세포 또는 개구리밥 결절에서 하나 이상의 항체 쇄를 발현하는 단계, 및 상기 단일클론 항체 발현에 적합한 조건하에서 상기 개구리밥 식물, 개구리밥 세포 또는 개구리밥 결절을 배양하는 단계를 포함한다.
따라서, 본 발명은 항체가 GO 글리칸 구조가 우세적인 N-연결된 글리칸을 포함하는, 신규한 항체 조성물을 제공한다. 이런 방식으로, 본 발명은 전술한 바와 같이 "실질적으로 동질적인" 또는 "실질적으로 균일한" 또는 "실질적인 동질성"을 갖는, 항체 조성물, 예컨대 단일클론 항체 조성물을 제공한다. 따라서, 일부 예에서, 항체 조성물은 GO 글리칸 종에 실질적으로 동질적이므로, 상기 조성물의 당화 프로파일에서 나타나는 N-글리칸 종의 총 양의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%가 GO 글리칸 종이고, 상기 당화 프로파일에서 미량의 전구체 N-글리칸 종이 나타나는, 즉 상기 당화 프로파일에 존재하는 임의의 주어진 전구체 N-글리칸 종이 프로파일에서 나타나는 N-글리칸 종의 총 양의 5% 미만, 바람직하기로는 4% 미만, 3% 미만, 2% 미만, 1% 미만, 심지어 0.5% 미만 또는 0.1% 미만으로 존재하는, 실질적으로 동질적인 당화 프로파일을 가진다. 그러한 조성물에서, 당화 프로파일에 나타나는 전구체 N-글리칸 종의 대표적인 예로는 전술한 Man3GlcNAc2, MGn(GlcNac1Man3GlcNAc2, GlcNac1은 1,3 만노스 암에 부착됨), 및 GnM (GlcNac1Man3GlcNAc2, GlcNac1은 1,6 만노스 암에 부착됨) N-글리칸 전구체가 있으며, 이들 N-글리칸 전구체 중 어느 하나 또는 임의 조합이 존재될 수 있다.
그러한 일 예에서, 단일클론 항체 조성물은, 상기 조성물에 대한 당화 프로파일에서 나타나는 N-글리칸 종의 총 양의 95.8%가 GO 글리칸 종(GlcNAc2Man3GlcNAc2)이고, Man3GlcNAc2 (0.67%), GlcNAcMan3GlcNAc2 (1.6%), GalGlcNAc2Man3GlcNAc2 (1.2%), Man6GlcNAc2 (0.21%), Man7GlcNAc2 (0.30%) 및 Man8GlcNAc2 (0.28%) N-글리칸 전구체가 상기 당화 프로파일에서 나타나는, 실질적으로 동질적인 당화 프로파일을 갖는다. 이는 동일한 단일클론 항체가 발현되지만 개구리밥 식물의 당화 장치가 XylT 및 FucT의 발현을 저해하도록 유전자 변형되지 않은, "야생형" 개구리밥 식물 발현 시스템으로부터 수득되는 단일클론 항체 조성물과 비교할 수 있다. 이러한 "야생형" 유래 단일클론 항체 조성물은 N-글리칸 종 2가지, 즉 G0XF3 및 G0X이 우세적이며 수종의 N-글리칸 전구체 종이 미량 존재하는 것이 특징적인, 보다 이질적인 당화 프로파일을 갖는다. 이의 일 예로, "야생형" 유래 단일클론 항체 조성물은 하기 N-글리칸 종들이 표시되는 당화 프로파일을 갖는다: G0 (GlcNAc2Man3GlcNAc2)(8.4%); G0X (GlcNAc2[Xyl]Man3GlcNAc2)(17.2%); G0XF3 (GlcNAc2[Xyl]Man3[Fuc]GlcNAc2)(67.4%); Man3GlcNAc2 (0.26%); GlcNAcMan3GlcNAc2 (0.40%); (Xyl)Man3(Fuc)GlcNAc2 (0.76%); GlcNAc2Man3(Fuc)GlcNAc2 (2.1%); GlcNAc(Xyl)Man3(Fuc)GlcNAc2 (1.4%); Man6GlcNAc2 (0.21%); Man7GlcNAc2 (0.63%); Gal(Fuc)GlcNAc2(Xyl)Man3(Fuc)GlcNAc2 (0.26%); Man8GlcNAc2 (0.61%); 및 Man9GlcNAc2 (0.40%).
이런 방식으로, 본 발명은 전술한 바와 같이 "실질적으로 동질적인" 또는 "실질적으로 균일한" 항체 조성물 또는 "실질적인 동질성"을 가지는 항체 조성물을 제공한다. 일부 예에서, 본 발명은, 조성물에 존재되는 항체의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%가 GO 글리코형이고, 참여하는 모든 당화 부위(예, IgG 타입의 항체의 중쇄에서 CH2 도메인의 Asn-297 잔기)에 GO 글리칸 종들이 점유하고 있으며, 글리코형의 전구체가 미량 상기 조성물에 존재하는, 실질적으로 동질적인 항체 조성물, 예컨대 단일클론 항체 조성물을 제공한다. 이의 일 예로, 상기 글리코형의 전구체는, 하나의 중쇄의 CH2 도메인이 Asn 297에 부착된 GO 글리칸 종을 가지며 다른 중쇄의 CH2 도메인은 당화되지 않은, Fc 영역을 포함하는 항체; 하나의 중쇄의 CH2 도메인이 Asn 297에 부착된 GO 글리칸 종을 가지며 다른 중쇄의 CH2 도메인은 Asn 297에 부착된 GnM 또는 MGn 전구체 글리칸을 가지는, Fc 영역을 포함하는 항체; 및 CH2 도메인 각각에서 Asn 297 당화 부위에 부착된 GO 글리칸 종을 가지며 mAb 구조내 다른 당화 부위에 부착된 3번째 GO 글리칸 종을 가지는, Fc 영역을 포함하는 항체로 이루어진 군으로부터 선택되며; 이들 글리코형의 전구체는 미량으로 존재, 즉 상기 항체 조성물에 존재하는 총 글리코형의 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 심지어 0.5% 미만 또는 0.1% 미만으로 상기 글리코형의 전구체가 존재한다.,
상기 조성물에 존재하는 항체의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%가 GO 글리코형인 본 발명의 실질적으로 동질적인 항체 조성물은, "글리칸-최적화된 항체"라고 한다. "글리칸-최적화된 항체"는 본 발명의 항체가 GO 글리코형이 실질적으로 동질적이도록 당화 패턴을 유전자 조작되어, 개선된 Fc 작동자 기능을 가지는 항체가 만들어지는 것을 의미한다. "개선된 Fc 작동자 기능"은 생산 과정의 결과로 보다 이질적인 당화 프로파일을 갖는, 동일 서열의 항체(즉, 동일한 아미노산 서열의 항체)에 비해, 항체가 증가된 ADCC 활성을 가지는 것을 의미한다. 따라서, 예컨대 포유류 숙주 발현 시스템, 예컨대 CHO 세포, 곤충 숙주 세포, 효모 세포 또는 FucT 및 XylT 발현을 저해하기 위해 유전자 변형하지 않은 그외 식물 숙주 발현 시스템에서 생산되는 항체는, 항체 산물의 전반적인 작동자 기능에 영향을 미칠 수 있는, 보다 이질적인 당화 패턴, 따라서 글리코형의 혼합형을 보이는 경향이 있다. 본 발명의 항체 조성물의 GO 글리코형은 푸코스 잔기의 부재와 조합되어, 증가된 ADCC 활성을 갖는 항체 조성물을 제공하는데 유리하다. 일부 예에서, ADCC 활성은 이질적인 당화 프로파일(즉, 항체 조성물에서 주된 글리코형으로서 복수 개의 글리코형이 존재함)을 갖는 동일 서열 항체에 비해 25배, 50배, 75배, 100배, 150배, 200배, 250배, 300배, 400배, 500배, 또는 심지어 1000배까지 증가된다. 게다가, GO 글리코형에는 G2 글리코형을 가지고 있는 항체에 존재하는 말단 Gal 잔기가 결여되어 있다. 이로써, GO 글리코형을 우세적으로 포함하는 본 발명의 실질적으로 동질적인 이들 항체 조성물은 증가된 ADCC/CDC 비를 보인다. 또한, GO 글리코형이 우세적인 본 발명의 실질적으로 동질적인 항체 조성물은 FcγRIII, 예컨대, FcγRIIIa에 대한 결합성이 증가되며, 결합 친화성은 이질적인 당화 프로파일의 동일 서열 항체 조성물, 즉 글리코형 혼합물에서 관찰되는 결합 친화성 보다 약 20배, 30배, 40배, 50배, 75배, 최대 100배 증가된다. 암 및 자가면역 질환에서, Fc 수용체, 예컨대 FcγRIII에 대해 결합 친화성이 증가된 치료 항체는 치료 효능 증가 및 치료 반응 향상과 밀접하게 상호 관련있다.
본 발명의 일부 예에서, GO 글리코형이 우세적인 본 발명의 실질적으로 동질적인 항체 조성물은, 이질적인 당화 프로파일, 즉 글리코형이 혼합을 가지는 동일 서열의 항체 조성물에서 관찰되는 활성과 비교하였을 때, 변형된 CDC 활성을 갖는다. 예컨대, 이의 일 예로, 본 발명의 실질적으로 동질적인 항체 조성물은 GO 글리코형을 우세적으로 포함하며, 이질적인 당화 프로파일, 즉 글리코형이 혼합을 가지는 동일 서열의 항체 조성물에서 관찰되는 활성에 비해 감소된 CDC 활성을 갖는다. 따라서, 일부 예에서, 본 발명은 GO 글리코형이 우세적이며, CDC 활성이 이질적인 당화 프로파일 가지는 동일 서열의 항체 조성물에서 관찰되는 활성과 비교하여 크게는 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 심지어 100% 감소된, 실질적으로 동질적인 항체 조성물을 제공한다. 이들 일부 예에서, GO 글리코형이 우세적이며 CDC 활성이 감소된 실질적으로 동질적인 항체 조성물은 또한 이질적인 당화 프로파일의 동일 서열의 항체 조성물에 비해 증가된 ADCC 활성을 가지는 것이 특징이다.
어떠한 이론이나 작용 기전에 결부됨이 없이, 전술한 바와 같이, CDC 활성이 감소되고 ADCC 활성이 유사하거나 또는 증가된, 본 발명의 실질적으로 동질적인 GO 글리코형 항체 조성물은, 이의 투여 후 보체 활성화와 관련 있을 수 있는 잠재적인 부작용을 감소시키면서, 타겟 세포에 대한 증가된 세포 독성을 제공하는데 이로울 수 있다. 이러한 부작용 가능성을 낮춤으로써, GO 글리코형이 우세적인 실질적으로 동질적인 항체 조성물은 보다 빠른 주입 속도로 투여하여 임의의 주어진 투여에서 투여 시간을 단축시킬 수 있으며, 및/또는 보증가능하다면 초기 농도를 보다 높게 투약할 수 있으며, 보체 활성화와 관련있는 부작용을 촉발시키는 문제를 감소시킬 수 있다.
예컨대, 보체 활성화는 키메라 항-CD20 단일클론 항체 IDEC-C2B8(IDEC Pharmaceuticals Corp., San Diego, California; 상표 Rituxan®로 구입가능하며, 또한 리투시맵(rituximab)이라고도 함)를 이용한 치료의 경미 내지 심각한 1차 -투약 부작용(first-dose side effect) 발생에 중요한 작용을 한다. 예로, van der Kolk et al . (2001) British J. Haematol . 115:807-811을 참조한다. Rituxan® 제품의 리투시맵 항체는 중국 햄스터 난소(CHO) 세포에서 발현되므로, 따라서 이질적인 당화 프로파일(즉, 글리코형의 혼합)을 포함한다. 리투시맵의 CDC 활성은 갈락토스 함유와 관련있는 것으로 나타나고 있다. 이런 방식으로, 0-2 몰/몰(중쇄)로 갈락토스 잔기의 수가 증가함에 따라, CDC 활성 수준은 1 몰 갈락토스/몰(중쇄)인 항체에서 관찰되는 최대값의 80%(중쇄 CH2 도메인의 Asn297에 부착된 N-글리칸의 1,3 및 1,6 만노스 암으로부터 β(1,4)-갈락토스 잔기 모두를 제거하기 위해, β-갈락토시다제 처리) 내지 150%(Asn297 부위에 부착된 N-글리칸의 1,3 및 1,6 만노스 암 둘다에 부착된 β(1,4)-갈락토스 잔기를 지키기 위해, UDP 갈락토실 트랜스퍼라제 처리)로 증가된다(IDEC BLA 97-0260 at the website fda.gov/Cder/biologics/review/ritugen112697, 월드와이드 웹 사이트에서 이용가능함). 리투시맵과 서열이 동일하고 GO 글리코형이 우세적인 항-CD20 항체를 포함하는 실질적으로 동질적인 항-CD20 항체 조성물은, 이롭게도 CDC 활성이 감소되어, 따라서 항체 조성물이 이질적인 당화 프로파일을 포함할 때(즉 글리코형의 혼합) 항체를 투여한 경우의 보체 활성화와 정상적으로 관련있는 부작용 가능성을 낮출 것이다.
따라서, CDC 활성이 감소되고 ADCC 활성이 동일하거나 증가된 본 발명의 실질적으로 동질적인 GO 글리코형 항체 조성물은, 이질적인 당화 프로파일을 포함하는(즉, 글리코형 혼합) 동일 서열의 항체 조성물 투여로 인한 보체 활성화와 정상적으로 관련있는 부작용으로 인한 합병증의 결과로서, 하나 이상의 환자 개체군에게 부적절하거나, 권할 수 없거나 또는 효과가 없는, 치료적 이용에 이롭게 사용할 수 있다. 상기 부작용은 항체의 1차 및/또는 빠른 투여와 관련있을 수 있는 경미한 수준 내지 중증의 부작용을 비제한적으로 포함하며, 예컨대 열, 오한, 구역질, 호흡곤란, 홍조 등이 있으나, 이로 한정되는 것은 아니다. 예로, van der Kolk et al . (2001) British J. Haematol . 115:807-811 및 이의 참조 문헌; Winkler et al . (1999) Blood 94:2217-2224를 참조한다. 이러한 방식으로, 본 발명은 항체, 예컨대 단일클론 항체의 투여시 보체 활성화와 관련있는 한가지 이상의 부작용을 감소시키는 방법을 제공하며, 상기 방법은 전술한 실질적으로 동질적인 항체 조성물로서, 즉 조성물에 존재하는 항체의 적어도 80%, 적어도 85%, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%가 GO 글리코형이고 미량의 글리코형의 전구체가 존재하는 조성물로서, 항체를 투여하는 단계를 포함한다. 일부 예에서, 조성물에 존재하는 항체의 적어도 90%, 적어도 95%, 또는 적어도 99% 는 GO 글리코형이며, 이 조성물에 글리코형의 전구체는 미량 존재된다.
GO 글리코형이 우세적인 본 발명의 실질적으로 동질적인 조성물은, 이의 증가된 Fc 작동자 기능으로 인해, 새롭고 개선된 투여 경로의 기회를, 예컨대, 공지된 치료 항체의 가능한 투여 경로를 주입 및 정맥내 투여 이외의 다른 투여 경로로 확장시키고, 예컨대 피하 투여를 제공한다. 더욱이, 이의 증가된 효능으로 인해, 본 발명의 항체 조성물은 보다 낮은 농도로 또는 보다 적은 부피로 투여할 수 있으며, 투여 횟수를 줄일 수 있다. 투여되는 항체 조성물의 부피 감소는, 특히 단일클론 항체의 주입 반응으로 인한 부작용 현상이 부피와 관련 있는 경우에 유익하다. 또한, 본 발명의 항체 조성물의 효능 증가는, 보다 이질적인 글리코형 항체 조성물을 이용한 항체 요법에 반응성이 없는 기존 mAb 타겟에 대한 새로운 임상적인 처방을 제공하며, 기존의 미개발된 mAb 타겟을 찾아볼 수 있는 능력을 제공한다.
본 발명의 방법에 따라 생산되는 단일클론 항체는 약학적으로 허용가능한 담체를 포함하는 조성물에 포함될 수 있다. 이러한 조성물은 FucT 발현 저해를 타겟으로 하는 작동자 기능, 일 예로 개선된 작동자 기능을 가진 항체를 필요로 하는 개채를 치료하는 방법에 이용가능하다. 이러한 방식으로, 본 발명으로 방법에 따라 안정적으로 형질전환된 식물, 예컨대 개구리밥 식물에서 생산되는 단일클론 항체를 이를 필요로하는 개체에 투여할 수 있다.
본 발명의 방법에 따라 유전자 변형된 식물 숙주내에서 임의의 항체를 만들 수 있다. 일 예로, 상기 항체는 치료 항체이다. 항체는 수많은 장애의 치료제로서 승인받았으며, 추가적인 치료 항체 다수가 개발중에 있다. Brekke and Sandlie (2003) Nat . Rev . Drug . Discov. 2(3):240을 참조하며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다. 본 발명의 방법에 의해 발현될 수 있는 치료 항체의 예로는, CD3 항원을 타겟으로 하는 항-CD3 항체(예, OKT®); 항-혈소판 gpIIb/IIIa 항체(예, 앱시시맵(abciximab)(c7E3 Fab라고 기공지됨), ReoPro®로 판매됨; 항-EpCAM 항체(예, Panorex®; CD-20 항원을 타겟으로 하는 항-CD20 항체(예, 리투시맵, Rituxan®로 판매, 미국 특허 5,736,137을 참조하며, 원용에 의해 본 명세서에 포함됨); 항 IL-2 수용체(예, Zenapax®, Simulect®; 항-ERBB2 (예, 트라스투주맵(trastuzumab, Herceptin®로 판매, 미국 특허 6,165,464를 참조하며, 원용에 의해 본 명세서에 포함됨); 항-TNF-α(예, 인플리시맵(infliximab), Remicade®로 판매, 항-F-단백질(예, Synagis®; CD30을 타겟으로 하는 항-CD30 항체(예, Borchmann et al . (2003) Blood 102:3737-3742 및 하기 실시예 6에 개시된 5F11 항체, WO 03/059282 및 미국 특허 출원 공개공보 2004/0006215를 참조하며, 원용에 의해 본 명세서에 포함됨; Wahl et al. (2002) Cancer Res . 62:3736-3742의 SGN-30 항체, AC10 항-CD30 항체의 키메라 버전, 또한 미국 특허 공개공보 20040018194 및 미국 특허 7,090,843을 참조하며, 원용에 의해 본 명세서에 포함됨); CD33을 타겟으로 하는 항-CD33 항체(예, Mylotarg®, 미국 특허 5,733,001을 참조하며, 원용에 의해 본 명세서에 포함됨); CD52를 타겟으로 하는 항-CD52 항체(예, 알렘투주맵(alemtuzumab), Campath®로 판매, 미국 특허 5,846,534를 참조하며, 원용에 의해 본 명세서에 포함됨); 항-CD20(예, Zevalin®; 항-IgE Fc(예, 오말리주맵(omalizumab), Xolair®로 시판됨; 항-VEGF(예, 베박시주맵(bevacizumab), Avastin®로 판매, Presta et al . (1997) Cancer Res . 57:4593-9를 참조하며, 원용에 의해 본 명세서에 포함됨); 항-EGF-R(예, 세투시맵(cetuximab), Erbitux®로 판매); 항-CD11a(예, 에팔리주맵(efalizumab), Raptiva®로 판매, 항-IL-8; 항-C5; 항-TNF-α(예, 아달리무맵(adalimumab), Humira®로 판매; 항-TGF-베타2; 항-IL2 수용체(예, 다클리주맵(daclizumab)(Zenapax) 및 바실리시맵(basiliximab) (Simulect)); 항-α-4-인테그린; 항-CD4; 항-CD2; 항-CD19 (예, MT103, 2중 특이성의 항체); CD22 항원을 타겟으로 하는 항-CD22 항체(예, 단일클론 항체 BL-22); 악성 B 세포상의 CD23 항원을 타겟으로 하는 항-CD23 항체(예, IDEC-152); CD80 항원을 타겟으로 하는 항-CD80 항체(예, IDEC-114); 악성 B 세포 상의 CD38 항원을 타겟으로 하는 항-CD38 항체; 대식세포 콜로니 자극 인자를 타겟으로 하는 α-M-CSF; 핵 인자-kappaB의 수용체 활성자(RANK)를 타겟으로 하는 항체, 이는 복수의 마이엘로마에서 과다발현됨; 악성 B 세포 상의 CD40 항원을 타겟으로 하는 항-CD40 항체(예, SGN-40); 종양 괴사 인자-관련 세포자살-유발성 리간드 수용체 1(TRAIL-R1)을 타겟으로 하는 항체(예, 작용성(agonistic) 인간 단일클론 항체 HGS-ETR1) 및 조혈 기원의 고형 종양 및 종양 다수에서 발현되는 TRAIL-R2); 항-HBV 항체; 또는 항-MHC 클래스 II 항체를 포함하나, 이로 한정되는 것은 아니다. 이들 수많은 항체들에는 CDC 및/또는 ADCC 중 어느 한가지 기능에 대한 작동자 활성, Herceptin®, Rituxan®, Mylotarg®, 및 Campath®이 필요한 것으로 알려져 있다.
일부 예에서, 전술한 방식으로 당화 장치가 변형되도록 유전자 변형된 식물 숙주, 예컨대 개구리밥으로부터 생물학적으로 활성인 α-2b-인터페론, 예컨대 인간 α-2b-인터페론 전구체(NCBI Protein Accession No. AAB59402) 또는 성숙형 인간 α-2b-인터페론 전구체(NCBI Protein Accession No. AAB9402의 아미노산 24-188) 또는 생물학적으로 활성인 이의 변이체를 발현시킬 수 있다. 인간 α-2b-인터페론의 생물학적 활성을 가진 변이체의 예들이 당업계에 공지되어 있다. 예로, α-2b-인터페론의 절단된 버전이 개시된 WO 2005/035767; 유럽 특허 EP211148B1; 및 미국 특허 4,748,233, 4,801,685, 4,816,566, 4,973,479, 4,975,276, 5,089,400, 5,098,703, 5,231,176, 및 5,869,293을 참조하며, 이들은 원용에 의해 본 명세서에 포함된다. 다른 예에서, 식물 숙주, 예컨대, 개구리밥에서 신호 펩타이드를 수반하거나 또는 수반하지 않은 상태로 생물학적으로 활성인 성숙형의 인간 성장 호르몬을 발현시킬 수 있다. 또한, 식물 숙주에서 인간 성장 호르몬의 생물학적 활성을 가진 변이체도 발현시킬 수 있다. 예로, 개구리밥 발현 시스템을 이용한 생물학적으로 활성인 폴리펩타이드의 발현에 관한 WO 02/10414를 참조한다.
또다른 예로, 식물 숙주, 예컨대 개구리밥에서 플라스미노겐, 마이크로플라스미노겐 또는 생물학적으로 활성인 이의 변이체를 발현시킬 수 있다. 식물 숙주에서 발현되는 플라스미노겐 또는 마이크로플라스미노겐은 임의의 포유류 기원으로부터 유래된 것일 수 있다. 일부 예에서, 플라스미노겐 또는 마이크로 플라스미노겐은 인간 또는 돼지 유래이다. 예로, 개구리밥 발현 시스템을 이용한 이들 단백질의 발현에 관한 WO 2005/078109를 참조한다.
이들 이종의 폴리펩타이드의 "생물학적 활성을 가진 변이체"는 천연 단백질의 N-말단 및/또는 C-말단에 하나 이상의 아미노산의 결손(이른바 절단), 부가; 천연 단백질의 한 부위 이상에서 하나 이상의 아미노산 결손 또는 부가; 또는 천연 단백질의 한 부위 이상에서의 하나 이상의 아미노산의 치환에 의해 천연 폴리펩타이드로부터 파생되는 폴리펩타이드를 의미한다. 본 발명에 포함되는 원하는 이종의 폴리펩타이드 변이체는 천연 폴리펩타이드의 생물학적 활성을 유지한다.
예컨대, α-2b-인터페론의 생물학적 활성을 가진 변이체는 바이러스 감염에 대한 내성을 증가시키는 능력, 또는 α-2b-인터페론-조절성 유전자 타겟의 전사를 매개하는 능력 등의, 천연 α-2b-인터페론의 원하는 생물학적 활성을 계속적으로 유지한다. 이러한 생물학적 활성을 가진 변이체는, 예컨대 유전자 다형성 또는 인간 조작으로부터 초래될 수 있다. 원하는 이종의 단백질의 생물학적 활성을 가진 변이체는 원하는 이종의 단백질의 아미노산 서열과 적어도 약 50%, 60%, 65%, 70%, 일반적으로 적어도 약 75%, 80%, 85%, 바람직하기로는 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 더 바람직하기로는 적어도 약 98%, 99% 또는 그 이상의 서열 동일성을 가질 것이다. 따라서, 예컨대, 천연 α-2b-인터페론의 생물학적 활성을 가진 변이체는 인간 α-2b-인터페론 전구체(NCBI Protein Accession No. AAB59402) 또는 성숙형 인간 α-2b-인터페론(NCBI Protein Accession No. AAB9402에서 아미노산 24-188)과 적어도 약 50%, 60%, 65%, 70%, 일반적으로 적어도 약 75%, 80%, 85%, 바람직하기로는 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 더 바람직하기로는 적어도 약 98%, 99% 또는 그 이상의 아미노산 서열 동일성을 가질 것이며, 상기 서열 동일성은 전술한 파라미터를 이용하여 결정된다. 따라서, 원하는 이종의 천연 단백질의 생물학적 활성을 가진 변이체는 천연 단백질과 적게는 1-15개의 아미노산 잔기, 적게는 1-10, 예컨대 6-10, 적게는 5, 적게는 4, 3, 2, 또는 심지어 1개의 아미노산이 다를 수 있다.
일 예에서, 본원에 언급된 방식으로 당화 장치를 변형시키기 위해 유전자 변형된 식물 숙주는, 비용 또는 운영 제한요소(logistical constraint) 또는 이 2가지 측면으로 인해, 기존의 유전자 발현 시스템에 의해 상업적으로 효율적으로 생산할 수 없었던, 생물학적으로 활성인 폴리펩타이드를 발현하는, 안정적으로 형질전환된 개구리밥 식물, 개구리밥 세포 또는 개구리밥 결절이다. 예를 들면, 단백질이 포유류 세포내에서 세포 생활성, 세포 증식, 세포 분화 또는 단백질 조립을 방해하여, 일부 단백질들은 포유류 시스템에서 발현시킬 수 없다. 이러한 단백질로는, 망막모세포 단백질, p53, 안지오스타틴 및 렙틴을 포함하나, 이들로 한정되는 것은 아니다. 본 발명은 포유류의 조절 단백질을 생산하는데 이롭게 사용할 수 있으며, 고등 식물과 포유류 사이에 진화적으로 매우 먼 거리를 고려하면, 아마도 이들 단백질은 개구리밥에서의 조절 과정을 간섭하진 않을 것이다. 개구리밥 형질전환체를 또한 사용하여, 혈청 알부민(특히, 인간 혈청 알부민), 헤모글로빈 및 콜라겐 등의 단백질의 다량 생산할 수 있어, 기존 발현 시스템의 생산력에 도전해 볼 수 있다.
마지막으로, 고등 식물 시스템을 포유류 시스템에서 보다 훨씬 쉽게 생물학적으로 활성인 다량체 단백질(예, 단일클론 항체, 헤모글로빈, P450 옥시다제, 콜라겐 등)을 생산하도록 조작할 수 있다. 개구리밥에서 생물학적으로 활성인 다량체 단백질을 생산하기 위한 예시적인 방법은, 폴리펩타이드 서브유닛 모두를 코딩하는 유전자를 포함하는 발현 구조체를 이용한다. 예로, During et al . (1990) Plant Mol . Biol. 15:281 and van Engelen et al . (1994) Plant Mol . Biol . 26:1701을 참조한다. FucT 및/또는 XylT 저해성 폴리펩타이드를 포함하는 발현 카세트를 그러한 벡터에 도입할 수 있다. 이후, 이 벡터는 공지된 임의 형질전환 방법, 예컨대 탄도 충격(ballistic bombardment) 또는 아그로박테리움 매개의 형질전환을 이용하여 개구리밥 세포에 도입된다. 이러한 방법으로 다량체 단백질을 조립하는데 필수적인 모든 폴리펩타이드를 발현하는 클로날 세포주 뿐만 아니라, 당단백질의 N-글리칸의 당화 패턴이 변형된 XylT 및/또는 FucT 저해성 서열이 만들어진다. 따라서, 일부 예에서, 형질전환된 개구리밥은 단일클론 항체의 중쇄 및 경쇄, 또는 Fab' 항체 단편, 및 XylT 및/또는 FucT 저해성 폴리펩타이드를 포함하는 발현 카세트를 코딩하는 하나 이상의 발현 벡터를 포함하며, 발현된 중쇄 및 경쇄로부터 단일클론 항체 또는 항체 단편이 개구리밥 식물에서 조합된다.
이의 변형 방법은, 단일 유전자 구조체를 만들고, 이로부터 유래된 DNA를 혼합한 다음 이 DNA 혼합물을 탄도 충격 또는 아그로박테리움 매개의 형질전환으로 식물 세포에 도입하는 방법이다. 다른 변형 방법으로는, 일부 또는 모든 벡터가 다량체 단백질의 2 이상의 서브유닛을 코딩할 수 있다(즉, 다량체 단백질내 서브유닛의 갯 수 보다 크로스(cross)되는 개구리밥 클론 수가 더 적다). 다른 예로, 각 개구리밥 클론을 당화 장치가 변형되도록 유전자 변형시키고, 다량체 단백질의 서브유닛들 중 적어도 하나를 발현시켜, 각각의 서브유닛을 분비하는 개구리밥 클론들을 함께 배양함으로써, 분비된 다양한 서브유닛으로부터 다량체 단백질을 배지내에서 조립되게 한다. 어떤 경우에, 산업적 또는 화학적 공정상, 또는 진단, 치료 또는 백신화 목적으로, 다량체 단백질의 서브유닛들 모두 보다 적게, 또는 심지어 하나의 단백질 서브유닛을, 형질전환된 개구리밥 식물, 개구리밥 결절 배양물에서 생산하는 것이 바람직할 수 있다.
본 발명의 일부 예에서, 원하는 형질전환 식물 숙주는, 예컨대 GO 글리칸 구조가 우세한 N-연결된 글리칸을 포함하는 당단백질 등의, 당단백질의 "고 발현체"이다. "고발현체"는 원하는 당단백질이 형질전환 식물 숙주에서 생산되는 총 가용성 단백질의 적어도 5% 이상이 되는 수준으로 원하는 당단백질을 생산할 수 있는, 본원의 당단백질을 생산하도록 조작된 형질전환된 식물 숙주를 의미한다. 일부 예로, "고발현체"는 원하는 당단백질이 형질전환 식물 숙주에서 생산되는 총 가용성 단백질의 적어도 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15% 또는 그 이상으로 본원의 당단백질을 생산하도록 조작된 형질전환된 식물 숙주이다. 따라서, 예컨대, 일 예로, 형질전환 식물 숙주는 FucT 및 XylT의 발현을 저해하도록 변형된 개구리밥이고, 상기 형질전환 개구리밥은 본원의 당단백질의 고발현체이다. 이러한 일부 예로, 형질전환 개구리밥은 전술한 Go 글리코형이 우세한 글리칸-최적화된 단일클론 항체의 고발현체이다. 또다른 예로, 형질전환 개구리밥은 이 당단백질이 총 가용성 단백질의 약 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15% 또는 그 이상이도록, 글리칸-최적화된 단일클론 항체를 발현한다.
당단백질의 추가적인 인간화
일부 예에서, 본 발명의 당단백질은 1,3 및/또는 1,6 만노스 암에 부착된 말단 β(1,4)-갈락토스 잔기를 가지는, 컴플렉스 N-글리칸을 포함하는 것이 바람직할 수 있다. 이론에 결부되지 않으면서, 이들 말단 갈락토스 잔기는 당단백질의 치료학적 작용 및/또는 약동학적 활성에 기여할 수 있다. 본 발명의 방법은 이에 부착된 N-글리칸 하나 이상이 하나 이상의 말단 갈락토스 잔기를 포함하도록, 즉 하나 이상의 N-글리칸이 G1 또는 G2 글리칸 종으로 표시되는, 본 발명의 당단백질을 추가적으로 변형시키기 위해, 당업계에 공지된 다른 방법과 조합할 수 있는 것으로 이해된다. 이러한 방식으로, 본원의 단일클론 항체를 포함한 본 발명의 당단백질 조성물을 변형 예컨대 글리코실트랜스퍼라제 효소를 이용하여 화학적으로 변형하여, G1, 바람직하기로는 G2 글리칸 종에 대해 실질적으로 동질적인 당화 패턴을 가지는 당단백질을 수득할 수 있다. 예로, 미국 특허 공개공보 2004/0191256를 참조하며, 이는 원용에 의해 그 전체가 본 명세서에 포함되며, 상기 문헌에서는 N-연결된 글리간 종 모두가 실질적으로 G2 형인 당단백질을 수득하기 위한 기질 당단백질의 갈락토실트랜스퍼라제 변형이 기술되어 있다. 이러한 방식으로, 원하는 당단백질을 갈락토실트랜스퍼라제 및 금속 염의 존재하에 활성화된 갈락토스와 반응시킬 수 있다. 갈락토실트랜스퍼라제는 포유류의 β1,4 갈락토실트랜스퍼라제(GalT), 예커대, 인간 GalT일 수 있으며, 상기 활성화된 갈락토스는 예컨대 UDP-갈락토스일 수 있다.
다른 예로, 본원에 언급된 방식으로 침묵화된 FucT 및 XylT 발현을 보이는 본 발명의 형질전환 식물은, 이들이 갈락토실크랜스퍼라제를 발현하여 그 곳에서 생산되는 내인성의 이종의 당단백질의 N-글리칸에 말단 갈락토스 잔기를 효과적으로 부착할 수 있도록, 그것의 당화 장치가 추가적으로 변형될 수 있다. 이러한 방식으로, 본 발명의 형질전환 식물에 갈락토실트랜스퍼라제 발현을 제공하기 위한 뉴클레오타이드 구조체, 예컨대 발현 카세트를 도입함으로써 더욱 변형시킬 수 있다. 갈락토실트랜스퍼라제는 포유류의 β1,4 갈락토실트랜스퍼라제(GalT)(예, 미국 특허 6,998,267, 이는 그 전체가 원용에 의해 본 명세서에 포함됨), 예컨대 인간 (GalT) 또는, 제1 글리코실트랜스퍼라제(예, 자일로실트랜스퍼라제, N-아세틸글리코사민일트랜스퍼라제 또는 푸코실트랜스퍼라제와 같은 식물 글리코실트랜스퍼라제)의 세포질 테일-트랜스멤브래인-줄기 영역(cytoplasmic tail-transmembrane-stem region)의 적어도 일부분(GalT) 및 제2 글리코실트랜스퍼라제(예, 포유류 글리코실트랜스퍼라제, 예컨대 인간 GalT)의 촉매 부위의 적어도 일부분을 포함하는, 하이브리드 GalT(예, WO 03/078637, 이는 그 전체가 원용에 의해 본 명세서에 포함됨)일 수 있다. 식물, 예컨대 개구리밥에서 XylT 및 FucT의 발현 침묵화 및 GalT, 예컨대 인간 GalT, 또는, 식물, 예컨대 개구리밥에서의 GalT, 예컨대 인간 GalT의 촉매 도메인의 일부분을 포함하는 하이브리드 효소의 발현 제공에 의해, 이에 부착된 N-연결된 글리칸에 식물 특이적인 자일로스 및 식물 특이적인 푸코스 잔기의 부착이 감소되어 있으며 말단 갈락토스 잔기(즉, G2 글리간 종)를 포함하는, 변형된 당화 패턴을 가지는, 내인성의 이종의 당단백질을 생산하는 형질전환 식물을 수득할 수 있다. 이러한 방식으로, G2 글리칸 종에 대해 실질적으로 동질적인 프로파일을 가지며, 및/또는 G2 글리코형에 대해 실질적으로 동질적인 당단백질을 본 발명의 형질전환 식물로부터 수득할 수 있다.
다른 예로, 부착된 N-연결된 글리칸이 1,3 및 1,6 만노스 암에 부착된 갈락토스 잔기 중 어느 하나 또는 둘 다에 부착되어 있는 말단 시알산 잔기를 더 포함하는, 본 발명의 당단백질의 당화 패턴을 더욱 변형시키는 것이 바람직할 수 있다. 일부 치료 단백질의 지속적인 안정성, 그리고 어떤 경우에는 기능을 위해 상기 말단 시알산 잔기(들)의 부가가 필요할 수 있다.
형질전환 식물 시스템에 따라, 당단백질의 천연적인 시알화(sialylation)가 이루어질 수 있다. 따라서, 배양된 아라비돕시스, 담배 및 메디카고(Medicago) 배양된 세포에서 시알화된 당단백질을 합성하는 문헌들이 보고되고 있다(Shah et al . (2003) Nat . Biotech . 21(12):1470-1471; Joshi and Lopez (2005) Curr . Opin . Plant Biol. 8(2):223-226). 최근 들어, 일본 벼에서 활성의 시알릴트랜스퍼라제-유사 단백질을 발현시킨 경우가 보고되었다(Takashima et al . (2006) J. Biochem . ( Tokyo ) 139(2):279-287). 즉, 식물이 당단백질을 시알화하기 위해 필요한 장비를 가지고 있다는 오르쏘고날 리포트(orthogonal report)가 있다.
부착된 N-연결된 글리칸이, 추가적으로, 1,3 및 1,6 만노스 암에 부착된 갈락토스 잔기 중 어느 하나 또는 둘다에 부착되어 있는 말단 시알산 잔기를 포함하는 것이 바람직한, 본 발명의 당단백질의 당화 패턴의 추가적인 변형에서, 본 발명의 형질전환 식물은 β-1,4 갈락토실트랜스퍼라제, 예컨대 인간 β-1,4 갈락토실트랜스퍼라제를 발현하고, 시알릴트랜스퍼라제를 발현 또는 과다 발현하도록, 변형될 수 있다. 따라서, 예컨대, 형질전환 식물은 α-2,3- 및/또는 α-2,6-시알릴트랜스퍼라제와 같은 시알릴트랜스퍼라제를 발현하도록 추가적으로 변형될 수 있다. 예로, WO 2004/071177; 및 Wee et al . (1998) Plant Cell 10:1759-1768을 참조하며, 이는 원용에 의해 그 전체가 본 명세서에 포함된다. 다른 예로, 본 발명의 형질전환 식물은 β-1,4 갈락토실트랜스퍼라제, 예컨대 인간 β-1,4 갈락토실트랜스퍼라제를 발현하도록, 식물 숙주의 시알산 경로에서 결손된 임의의 그외 효소를 발현하도록 변형될 수 있다. 특정 식물 숙주, 예컨대 개구리밥에서 천연 또는 재조합으로 생산된 당단백질 상에 시알산-함유성 N-글리칸이 자연적으로 발현되었는지를 일차적으로 평가한 후, 사용 전략(들)을 결정할 수 있다. 예컨대, 형질전환 식물 숙주, 특히 β-1,4 갈락토실트랜스퍼라제를 발현하도록 조작된 형질전환 식물 숙주에서, 생산되는 당단백질의 N-글리칸 상에 말단 시알산 잔기의 존재를 나타내는 증거가 없다면, 하나 또는 2가지 전략을 사용하여 원하는 형질전환 식물 숙주에서 생산되는 당단백질의 N-글리칸의 말단 시알화를 달성할 수 있다.
다르게는, 시험관내 효소 처리에 의해, G2 글리칸 종 또는 G2 글리코형에 대해 실질적으로 동질적인 본 발명의 당단백질 조성물을 변형시킬 수 있으며, 예로 미국 특허 공개공보 20030040037를 참조하며, 이는 원용에 의해 그 전체가 본 명세서에 포함된다.
본 발명의 형질전환 식물에서 생산되는 일부 당단백질의 경우, 부착된 N-글리칸 종은 트리만노스 코어 구조(Man3GlcNAc2)에 부착되어 있는 포유류 α1-6 푸코스 잔기를 가지는 것이 바람직할 수 있음을, 이해할 것이다. 그러한 예로, 당업계에 공지된 당조작 방법(glycoengineering method)을 이용하여 α1-6 푸코실트랜스퍼라제, 예컨대 인간 α1-6 푸코실트랜스퍼라제를 발현하도록, 추가적으로, 본 발명의 형질전환 식물을 유전자 변형시킬 수 있다.
본원에 예시 및 기술된 식물 숙주 세포를 포함한, 원하는 임의 숙주 세포를 조작함으로써, 본 발명의 당단백질 조성물을, 생산할 수 있음을 이해한다. 이러한 방식으로, 식물 숙주 뿐만 아니라, 동물, 곤충, 박테리아 세포 등의 그외 단백질 발현 숙주 시스템을 이용하여, 본 발명에 따른 당단백질 조성물을 만들 수 있다. 그러한 단백질 발현 숙주 시스템을, 우세한 글리코형을 발현하도록 조작 또는 선택할 수 있으며, 또는 다르게는, 우세한 글리칸 구조를 갖는 당단백질을 자연적으로 생산할 수 있다. 우세한 글리코형의 당단백질을 생산하는 조작된 단백질 발현 숙주 시스템의 예로는, 유전자 낫아웃/돌연변이(Shields et al . (2002) JBC 277:26733-26740); 유전자 조작(Umana et al . (1999) Nature Biotech . 17:176-180); 또는 이의 조합을 포함한다. 다르게는, 임의 세포, 예컨대 닭, 인간 및 소는 우세한 글리코형을 자연적으로 발현한다(Raju et al . (2000) Glycobiology 10:477-486). 따라서, 단일클론 항체와 같은 면역글로불린 등의, 본 발명에 따른 우세적으로 특이적인 글리칸 구조를 갖는 당단백질 또는 조성물의 발현은, 수많은 숙주 발현 시스템들 중에서 한가지 이상을 선택하여, 당업자가 달성할 수 있다. 또한, 당단백질 생산 분야에서 확인되는 추가적인 발현 숙주 시스템으로는, CHO 세포(예, WO 9922764A1 and WO 03/035835A1); 하이브리도마 세포 (Trebak et al . (1999) J. Immunol . Methods 230:59-70); 곤충 세포(Hsu et al . (1997) JBC 272:9062-970)가 있다. 또한, 식물 숙주 시스템에 대한 WO 04/074499A2를 참조한다.
본 발명의 방법에 따라 생산되는 당단백질은, 분리된 또는 정제된 형태로 수득하기 위해, 재조합으로 생산하는 숙주 세포로부터 수확할 수 있다. 이러한 방식으로, 본 발명의 재조합으로 생산되는 당단백질을 당업계에 공지된 임의의 통상적인 수단으로 숙주 세포로부터 분리하고, 예컨대 크로마토그래피, 전기영동, 투석, 용매-용매 추출 등에 의해 정제한다. 따라서, 본 발명은 또한 당단백질이 실질적으로 동질적인 당화 프로파일을 가지며 GO 글리코형에 대해 실질적으로 동질적인, 단일클론 항체 조성물 등의, 정제된 당단백질을 제공한다. 이들 정제된 당단백질은 숙주 세포 물질이 실질적으로 없으며, 전술한 바와 같이 오염원 단백질이 약 30% 미만, 20% 미만, 10% 미만, 5% 미만, 또는 1%(건조 중량) 미만인 당단백질 조제물을 포함한다. 일부 예들에서, 이들 정제된 당단백질은 오염원 단백질을 적어도 0.001%, 0.005%, 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5%, 6%, 6.5%, 7%, 7.5%, 8%, 8.5%, 9%, 9.5%, 10%, 15%, 20%, 25%, 또는 최대 약 30%(건조 중량)으로 포함할 수 있다. 아울러, 본 발명의 재조합으로 생산한 정제된 당단백질의 경우, 최적으로는, 전술한 바와 같이, 정제된 당단백질 조제물내 배양 배지는 화합물 전구체 또는 원하는 단백질 이외의 화합물의 약 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만(건조 중량)이다. 따라서, 일부 예에서, 이들 정제된 당단백질내 배양 배지 성분은 정제된 당단백질 조제물내 화합물 전구체 또는 원하는 단백질 이외의 화합물의 적어도 0.001%, 0.005%, 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5%, 6%, 6.5%, 7%, 7.5%, 8%, 8.5%, 9%, 9.5%, 10%, 15%, 20%, 25% 또는 최대 약 30%(건조 중량)일 수 있다. 일부 예들에서, 분리 및 정제로, 오염성 숙주 단백질, 배양 배지 및/또는 오염성 숙주 단백질과 배양 배지 성분 둘다가 없는, 정제된 당단백질을 수득한다.
따라서, 일부 예들에서, 단백질 발현 숙주 시스템은 식물, 예컨대 개구리밥이고, 당단백질 조제물이 오염성 식물 단백질을 약 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1%(건조 중량) 미만으로 포함하는 예를 포함하여, 상기 식물 숙주로부터 수득되는 정제된 당단백질에는 식물의 세포 물질이 실질적으로 결핍되어 있다. 다른 예에서, 식물 배양 배지는 정제된 단백질내 화합물 전구체 또는 원하는 단백질 이외의 화합물의 적어도 약 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1%(건조 중량) 미만이다.
일부 예에서, 식물 숙주로부터 수득되는 정제된 이들 당단백질은 오염성 식물 단백질을 적어도 0.001%, 0.005%, 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5%, 6%, 6.5%, 7%, 7.5%, 8%, 8.5%, 9%, 9.5%, 10%, 15%, 20%, 25%, 또는 최대 약 30%(건조 중량)로 포함할 수 있다. 다른 예로, 이들 정제된 단백질내 식물 배양 배지 성분은 상기 정제된 단백질내 화합물 전구체 또는 원하는 단백질 이외의 화합물의 적어도 0.001%, 0.005%, 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5%, 6%, 6.5%, 7%, 7.5%, 8%, 8.5%, 9%, 9.5%, 10%, 15%, 20%, 25%, 또는 최대 약 30%(건조중량)일 수 있다. 일부 예들에서, 식물 숙주로부터의 분리 및 정제로, 오염성 식물 단백질, 배양 배지 성분, 및/또는 오염성 식물 단백질과 배양 배지 성분 둘다가 없는, 정제된 당단백질이 수득된다.
발현 카세트
본 발명에 있어서, 안정적으로 형질전환된 고등 식물, 예컨대 안정적으로 형질전환된 개구리밥은, 발현 카세트내에 포함된 원하는 폴리뉴클레오타이드로 형질전환시킴으로써, 수득된다. 목적에 따라, 상기 원하는 폴리뉴클레오타이드는 목적한 FucT 또는 XylT 폴리펩타이드를 코딩하는, 예컨대 서열번호 3 (FucT) 또는 서열번호 6 또는 21 (XylT)에 나타낸 폴리펩타이드, 또는 이의 변이체를 코딩하는 것일 수 있으며, 따라서, 세포, 예컨대 식물 세포에서 이들 폴리펩타이드의 발현을 제공할 수 있으며, 또는 세포 예컨대 원하는 식물 세포에 안정적으로 도입되었을 때 FucT 또는 XylT 폴리펩타이드의 발현이나 기능을 저해할 수 있는 FucT 또는 XylT 저해성 폴리뉴클레오타이드일 수 있다.
따라서, 일부 예들에서, 서열번호 1과 2 (FucT) 및 서열번호 4, 5, 19와 20 (XylT)의 폴리뉴클레오타이드, 및 이의 변이체 및 단편 등의 본 발명의 FucT 및/또는 XylT 폴리뉴클레오타이드를 사용하여, 전술한 바와 같이, FucT 및/또는 XylT 저해성 폴리뉴클레오타이드를 포함하는 발현 카세트를 구축한다. 상기 발현 카세트를 원하는 식물 또는 식물 세포에 안정적으로 도입하여, 서열번호 3 (FucT) 및 서열번호 6 또는 21 (XylT)의 폴리펩타이드 및 이의 변이체 등의, 본 발명의 FucT 및/또는 XylT 폴리펩타이드의 발현 또는 기능 저해를 제공함으로써, 따라서 상기 발현 구조체로 안정적으로 형질전환된 식물 또는 식물 세포내에서의 내인성의 이종적인 당단백질의 N-글리칸 당화 패턴을 변형시킬 수 있다.
일부 예에서, FucT 및/또는 XylT 저해성 폴리뉴클레오타이드를 포함하는 발현 카세트로 안정적으로 형질전환된 식물 또는 식물 세포는, 또한 전술한 바와 같이 약학적으로 관심있는 포유류 단백질 등의, 원하는 이종의 폴리펩타이드, 예컨대 원하는 포유류 단백질의 발현을 제공하는 발현 카세트로 형질전환된다. 원하는 이종의 폴리펩타이드 발현을 제공하는 발현 카세트를 식물에 도입하기 위해, 동일한 폴리펩타이드(예컨대 동일한 형질전환 벡터 상) 상에, 또는 동시에 또는 다른 시간대에 원하는 식물이나 식물 세포에 도입하기 위해, 상이한 폴리펩타이드 상에(예컨대, 상이한 형질전환 벡터들 상에), 동일한 또는 상이한 도입 방법, 예컨대 동일하거나 상이한 형질전환 방법에 의해 제공할 수 있다.
본 발명의 발현 카세트는 원하는 폴리뉴클레오타이드, 즉 본 발명의 FucT 또는 XylT 폴리펩타이드를 코딩하는 폴리뉴클레오타이드, FucT 및/또는 XylT 저해성 폴리뉴클레오타이드, 또는 원하는 이종의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드, 예컨대 포유류 단백질에 연결된 전사 개시 영역(예, 프로모터)를 적어도 포함하는, 발현 조절 요소를 포함한다. 이러한 발현 카세트에는 프로모터 및 그외 발현 조절 요소의 전사 조절 하에 있는, 원하는 폴리뉴클레오타이드 또는 폴리뉴클레오타이드들을 삽입하기 위한 복수 개의 제한 부위가 제공된다. 본 발명의 특정 예에서, 전달되는 폴리뉴클레오타이드는 각각이 하나 이상의 원하는 폴리뉴클레오타이드를 코딩하는 2 이상의 발현 카세트를 포함한다.
"발현 조절 요소"는 RNA 중합효소II, 또는 일부 예에서 RNA 중합효소III가 특정 코딩 서열에 대한 적절한 전사 개시 부위에서 RNA 합성의 개시를 지시할 수 있는, 일반적으로 TATA 박스를 포함하는, DNA의 조절 영역을 의미한다. 발현 조절 요소는 전사 개시율에 영향을 미치는(예컨대, 강화하는), TATA 박스의 상류 또는 5'에 일반적으로 위치된 그외 인지 서열을 부가적으로 포함할 수 있다. 아울러, 발현 조절 요소는 전사 개시율에 영향을 미치는(예컨대, 강화하는), TATA 박스의 하류 또는 3'에 일반적으로 위치된 그외 인지 서열을 부가적으로 포함할 수 있다
전사 개시 영역(예, 프로모터)은 숙주에 천연, 동종, 외래 또는 이종일 수 있으며, 또는 천연 서열이나 합성 서열일 수 있다. 외래는, 전사 개시 영역이 도입되는 야생형 숙주에서는 발견되지 않는 전사 개시 영역을 의미한다. "기능적 프로모터"는 목적 단백질을 코딩하는 서열에 작동가능하게 연결되었을 때, 또는 저해성 뉴클레오타이드 분자(예컨대, 헤어핀 RNA, 이중 가닥 RNA, miRNA 폴리펩타이드 등)를 코딩하는 저해성 서열에 작동가능하게 연결되었을 때, 코딩된 단백질의 발현(즉, 전사 및 번역)을 추진할 수 있는 프로모터를 의미하며, 프로모터는 상기 저해성 뉴클레오타이드 분자가 발현되도록 작동가능하게 연결된 저해성 서열의 전사를 시작할 수 있다. 프로모터는 원하는 결과에 따라 선택할 수 있다. 따라서, 본 발명의 발현 카세트는 구성적인(constitutive), 조직 선호적인, 또는 그외 식물 발현용 프로모터를 포함할 수 있다.
본원에서, 키메라 유전자는 코딩 서열과 이종적인 전사 개시 영역에 작동가능하게 연결된 코딩 서열을 포함한다.
본 발명에 따라, 박테리아, 효모, 진균, 곤충, 포유류 및 식물 프로모터 등의 당업계에 공지된 적합한 프로모터를 사용할 수 있다. 예컨대, 개구리 프로모터 등의 식물 프로모터를 사용할 수 있다. 프로모터의 예는, 콜리플로워 모자이크 바이러스(Cauliflower Mosaic Virus)의 35S 프로모터, 오핀 신테타제(opine synthetase ) 프로모터(예, nos, mas, ocs 등), 유비퀴틴 프로모터, 엑틴 프로모터, 리불로스 바이포스페이트(RubP) 카르복실라제 소형 서브유닛 프로모터, 및 알코올 데하이드로게나제 프로모터가 있으나, 이로 한정되는 것은 아니다. 개구리밥 RubP 카르복실라제 소형 서브유닛 프로모터가 당업계에 공지되어 있다(Silverthorne et al . (1990) Plant Mol. Biol . 15:49). 식물, 바람직하기로는 개구리밥을 감염시키는 바이러스 유래의 그외 프로모터도 적합하며, 다센 모자이크 바이러스(Dasheen mosaic virus), 콜레라 바이러스(예, 콜레라 바이러스 아데닌 메틸트랜스퍼라제 프로모터; Mitra et al . (1994) Plant Mol . Biol . 26:85), 토마토 스팟 윌트 바이러스(tomato spotted wilt virus), 담배 래틀 바이러스(tobacco rattle virus), 담배 괴사 바이러스, 담배 링 스팟 바이러스(tobacco ring spot virus), 토마토 링 스팟 바이러스, 오이 모자이크 바이러스, 땅콩 스텀프 바이러스(peanut stump virus), 알파파 모자이크 바이러스, 사탕수수 바실리형 베드나바이러스(sugarcane baciliform badnavirus) 등을 포함하지만, 이로 한정되는 것은 아니다.
그외 적합한 발현 조절 요소가 일반적으로 이용가능하게 개시되어 있으며, 계류중인 2006년 1월 17일자로 가출원된 미국 출원 60/759,308, Attorney Docket No. 040989/243656의 표제 "개구리밥 과 식물 유래의 발현 조절 요소"에 기술되어 있으며, 이는 그 전체가 원용에 의해 본 명세서에 포함된다. 상기 계류중인 출원에 언급된 발현 조절 요소를 개구리밥 과에 속하는 여러가지 식물의 유비퀴틴 유전자로부터 분리하였고, 이를 "개구리밥 과 식물의 유비퀴틴 발현 조절 요소"라고 한다. 본 발명의 서열번호 2는 전장의 렘나 마이너 유비퀴티 발현 조절 요소이며, 프로모터 + 5' UTR(뉴클레오타이드 1-1625) 및 인트론(뉴클레오타이드 1626-2160) 둘다가 포함된다. 서열번호 8은 프로모터 + 5'UTR(뉴클레오타이드 1-1041) 및 인트론(뉴클레오타이드 1042-2021) 모두를 포함하는, 전장의 스피로델라 폴리리자(Spirodella polyrrhiza) 유비퀴틴 발현 조절 요소를 기재한 것이다. 서열번호 9는 프로모터 + 5'UTR(뉴클레오타이드 1-964) 및 인트론(뉴클레오타이드 965-2068) 모두를 포함하는, 전장의 렘나 에퀴녹티알리스(Lemna aequinoctialis) 유비퀴틴 발현 조절 요소를 기재한 것이다. 서열번호 10은 프로모터 + 렘나 마이너 유비퀴틴 발현 조절 요소의 5'UTR 부위를 기재한 것이다. 서열번호 5는 스피로델라 폴리리자 발현 조절 요소의 프로모터 + 5'UTR 부위를 기재한 것("LmUbq promoter")이다. 서열번호 11은 스피로델라 폴리리자 발현 조절 요소의 프로모터 + 5'UTR 부위를 기재한 것이다("SpUbq promoter"). 서열번호 12는 스피로델라 폴리리자 유비퀴틴 발현 조절 요소의 프로모터 + 5' UTR 부분을 기재한 것이다("LaUbq promoter"). 서열번호 13은 렘나 마이너 유비퀴틴 발현 조절 요소의 인트론을 기재한 것이다("LmUbq intron"). 서열번호 14는 스피로델라 폴리리자 유비퀴틴 발현 조절 요소의 인트론을 기재한 것이다("SpUbq intron"). 서열번호 15는 렘나 에퀴녹티알리스 유비퀴틴 발현 조절 요소의 인트론을 기재한 것이다("LaUbq intron"). 서열 10-12의 각 프로모터 + 5'UTR 서열과, 이의 생물학적 활성을 가진 변이체와 단편을 이용하여, 식물에서 작동가능하게 연결된 목적 뉴클레오타이드 서열의 전사를 조절할 수 있다. 이와 유사하게, 프로모터에 작동가능하게 연결된 뉴클레오타이드 서열의 발현을 강화하기 위해, 서열번호 13-15의 인트론 서열 하나 이상, 이의 생물학적으로 활성인 단편이나 변이체를 서열번호 10, 11, 또는 12의 프로모터 등의 원하는 프로모터에 작동가능하게 연결할 수 있다.
본원의 발현 조절 요소의 단편 및 변이체도 발현 카세트에 사용하여, 작동가능하게 연결된 목적 폴리뉴클레오타이드의 발현을 유도할 수 있다. "발현 조절 요소의 단편"은 서열번호 7-9에 기재된 발현 조절 요소들 중 임의 하나의 일부와 같이, 전장 발현 조절 요소의 일부분을 의미한다. 발현 조절 요소의 단편은 생물학적 활성을 보유하고 있어, 작동가능하게 연결된 목적 폴리뉴클레오타이드의 발현을 개시 또는 강화할 수 있는 단편도 포함한다. 따라서, 예컨대 본원의 전체 발현 조절 요소 보다 짧은 것을 이용하여, 작동가능하게 연결된 원하는 폴리뉴클레오타이드의 발현을 진행할 수 있다. 그러한 발현 조절 요소의 단편에 대한 구체적인 비제한적인 예로는, 서열번호 10-12(전술한 바와 같이) 중 어느 하나의 뉴클레오타이드 서열 뿐 아니라 서열번호 7의 뉴클레오타이드 1288-2160(LmUbq truncated promoter No. 1) 및 서열번호 1의 뉴클레오타이드 1132-2160(LmUbq truncated promoter No. 2) 등의 렘나 마이너 유비퀴틴 발현 조절 요소의 5' 절단체(서열번호 7)를 포함한다. 미국 특허 출원번호 60/759,308의 계류중인 미국 가출원을 참조하며, 이는 그 전체가 원용에 의해 본 명세서에 포함된다.
상기 단편의 뉴클레오타이드는 일반적으로 특정 발현 조절 요소의 TATA 인지 서열을 포함할 것이다. 상기 단편은, 본원에 언급된 자연적으로 생성되는 발현 조절 요소를 절단하기 위한 제한 효소의 사용에 의해, 또는 발현 조절 요소 DNA 서열의 자연적으로 생성되는 서열로부터 뉴클레오타이드 서열의 합성에 의해, 수득할 수 있으며, 또는 중합효소 연괘 반응(PCR) 기법에 의해서도 수득할 수 있다. 구체적으로, Mullis et al . (1987) Methods Enzymol . 155:335-350, and Erlich, ed. (1989) PCR Technology (Stockton Press, New York)을 참조한다.
부위 특이적인 돌연변이 유발로 인한 변이체와 같은 발현 조절 요소의 변이체를, 또한 본 발명의 발현 카세트에 사용하여, 작동가능하게 연결된 원하는 폴리뉴클레오타이드의 발현을 제공할 수 있다. "발현 조절 요소의 변이체"는 본원에 언급된 발현 조절 요소(예, 7, 9,또는 9의 발현 조절 요소), 또는 이의 단편(예, 서열번호 10-15의 각 서열)과 실질적인 유사성을 갖는 서열로 의도된다. 발현 조절 요소의 자연적으로 생성되는 변이체는, 잘 알려져 있는 분자 생물학 기법, 예컨대 상기에서 개괄적으로 언급한 PCR 및 혼성화 기법으로 동정할 수 있다. 변이체 발현 조절 요소는, 또한 예컨대 부위 특이적인 돌연변이를 이용함으로써 제조된 서열과 같이, 합성으로 유래된 뉴클레오타이드 서열을 포함할 수 있다. 일반적으로, 서열번호 7-15의 변이체 등의 본원에 언급된 특정 발현 조절 요소의 변이체는, 디폴터 파라미터를 이용한 전술한 서열 정렬 프로그램에 의해 결정된 바에 따라, 상기 특정 뉴클레오타이드 서열과 적어도 40%, 50%, 60%, 65%, 70%, 일반적으로 적어도 75%, 80%, 85%, 바람직하기로는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 더 바람직하기로는 약 98%, 99% 또는 그 이상의 서열 동일성을 가질 것이다.
프로모터를 포함한 발현 조절 요소들은 원하는 조절 수준을 제공하도록 선택될 수 있다. 예로, 어떤 경우, 구성적인 발현(constitutive expression)을 부여하는 프로모터(예, 아그로박테리움 투메팩시엔스의 만노핀 신타제 프로모터)를 사용하는 것이 이로울 수 있다. 다른 예로, 다른 경우에서는, 예컨대 이종의 폴리펩타이드의 발현에 관한 것인 경우, 특이적인 환경 자극에 반응하여 활성화되는 프로모터(예, 열 충격 유전자의 프로모터, 수분 부족-유발성 유전자의 프로모터, 병원체 유발성 유전자의 프로모터, 상처 유발성 유전자의 프로모터 및 주/야 유발성 유전자의 프로모터), 또는 식물 성장 조절자(예, 앱시스산, 옥신, 사이토키닌 및 지베렐산에 의해 유도되는 유전자의 프로모터)를 사용하는 것이 이로울 수 있다. 또다른 예로, 조직 특이적 발현을 제공하는 프로모터(예, 뿌리, 잎 및 꽃 특이적인 프로모터)를 선택할 수 있다.
주어진 프로모터의 전체적인 세기는 상류 활성화 서열과 같이 cis로 작용하는 뉴클레오타이드 서열의 조합 및 공간적인 구조에 의해 영향을 받을 수 있다. 예컨대, 아그로박테리움 투메팩시엔스의 옥토핀 신타제 유전자로부터 유래된 활성화 뉴클레오타이드 서열은, 아그로박테리움 투메팩시엔스 만노핀 신타제 프로모터에서의 전사를 강화할 수 있다(예, Gelvin 등의 미국 특허 5,955,646). 본 발명에서, 발현 카세트는 프로모터 서열의 상류에 삽입된 활성화 뉴클레오타이드 서열을 포함함으로써, 원하는 뉴클레오타이드 서열의 발현을 강화할 수 있다. 일 예로, 발현 카세트는 아그로박테리움 투메팩시엔스 만노핀 신타제 유전자로부터 유래된 프로모터에 작동가능하게 연결된, 아그로박테리움 투메팩시엔스의 옥토핀 신타제 유전자로부터 유래된 3개의 상류 활성화 서열을, 포함한다(미국 특허 5,955,646을 참조하며, 원용에 의해 본 명세서에 포함됨).
발현 조절 요소를, 예컨대 전술한 RNAi 발현 카세트내에서 소형 hpRNA 분자를 코딩하는 작동가능하게 연결된 DNA 서열의 발현을 진행하기 위해 사용할 경우, DNA 의존적인 RNA 중합효소 III에 의해 인지되는 프로모터를 포함하고 있는 발현 조절 요소를 사용하는 것이 유리하다. 본원에서, "DNA 의존적인 RNA 중합효소 III에 의해 인지되는 프로모터"는 RNA 중합효소 III의 중합효소 작용을 통해 결합된 DNA 영역의 전사를 지시하는 프로모터이다. 이는 대부분 RNA 프로세싱에 참여하는, 5S RNA, tRNA, 7SL RNA, U6 snRNA 및 수개의 그외 소형의 안정적인 RNA를 코딩하는 유전자를 포함한다. Pol III에 의해 사용되는 대부분의 프로모터는 전사 영역내 +1 하류의 서열 요소들을 필요로 한다. 그러나, 일부 Pol III 주형들은 유전자내 프로모터 요소들에 대한 요건이 결여되어 있다. 이러한 것을 3형 프로모터라고 한다. "3형 Pol III 프로모터"는 RNA 중합효소 III에 의해 인지되며 RNA 중합효소 III에 의해 정상적으로 전사되는 영역의 상류가 RNA 중합효소 III와 상호작용하는, 모두 cis로 작용하는 요소들을 포함하는, 프로모터를 의미한다. 3형 Pol III 프로모터는 본 발명의 RNAi 발현 카세트내에 조합되어, 소형 hpRNA 분자를 코딩하는 작동가능하게 연결된 DNA 서열의 발현을 추진할 수 있다.
전형적으로, 3형 Pol III 프로모터는 TATA 박스(인간 U6 snRNA 유전자에서 -25 내지 -30에 위치됨) 및 근위 서열 요소(Proximal Sequence element)(PSE, 인간 U6 snRNA의 경우 -214 - -244에 위치됨)를 포함한다. 이는 또한, 원위 서열 요소(DSE; 인간 U6 snRNA의 경우 -214 - -244 에 위치됨)를 포함할 수 있다. 3형 Pol III 프로모터는, 예컨대 7SL RNA, U3 snRNA 및 U6 snRNA를 코딩하는 유전자와 조합된 상태로 확인할 수 있다. 이러한 서열들은 아라비돕시스, 벼 및 토마토로부터 분리되었다. 예로, 미국 특허 공개공보 20040231016의 서열번호 1-8을 참조한다.
3형 Pol III 프로모터에 대한 그외 뉴클레오타이드 서열들은, 7SL RNA 에 대한 아라비돕시스 탈리아나(A. thaliana ) 유전자 AT7SL-1(X72228), 7SL RNA에 대한 아라비돕시스 탈리아나 유전자 AT7SL-2(X72229), 7SL RNA (AJ290403)에 대한 아라비돕시스 탈리아나 유전자 AT7SL-3, 인간 루풀러스(Humulus lupulus ) H17SL-1 유전자 (AJ236706), 인간 루풀러스 H17SL-2 유전자 (AJ236704), 인간 루풀러스 H17SL-3 유전자 (AJ236705), 인간 루풀러스 H17SL-4 유전자 (AJ236703), 아라비돕시스 탈리아나 U6-1 snRNA 유전자 (X52527), 아라비돕시스 탈리아나 U6-26 snRNA 유전자 (X52528), 아라비돕시스 탈리아나 U6-29 snRNA 유전자 (X52529), 아라비돕시스 탈리아나 U6-1 snRNA 유전자 (X52527), 지아 메이(Zea mays) U3 snRNA 유전자 (Z29641), 솔라눔 투베로섬(Solanum tuberosum) U6 snRNA 유전자 (Z17301; X 60506; S83742), 토마토 U6 소형 핵 RNA 유전자 (X51447), 아라비돕시스 탈리아나 U3C snRNA 유전자 (X52630), 아라비돕시스 탈리아나 U3B snRNA 유전자 (X52629), 오리제 사티바(Oryza sativa ) U3 snRNA 프로모터 (X79685), 토마토 U3 소형 핵 RNA 유전자 (X14411), 트리티컴 에스티붐(Triticum aestivum) U3 snRNA 유전자 (X63065), 및 트리티컴 에스티붐 U6 snRNA 유전자 (X63066)가 등재된 뉴클레오타이드 서열 데이타베이스에서 확인할 수 있다.
기타 3형 Pol III 프로모터를 토마토, 벼 또는 아라비돕시스 등의 기타 다양한 식물로부터 분리하거나, 또는 당업계에 잘 알려져 있는 방법을 이용하여 다른 식물 종들로부터 분리할 수 있다. 예로, U6 snRNA, U3 snRNA, 또는 7SL RNA 코딩 서열(예컨대, 이의 등록 번호로 확인되는 전술한 임의 서열들 중 코딩 서열과 부가적으로 Vicia faba U6 snRNA 코딩 서열 (X04788), U6 snRNA에 대한 옥수수 DNA(X52315), 또는 7SL RNA에 대한 옥수수 DNA(X14661))을 프로브로 이용하여 이러한 식물의 게놈 클론 라이브러리를 분리할 수 있으며, 상류 서열, 바람직하기로는 전사되는 영역에서 약 300 내지 400 bp 상류 서열을 분리하여 3형 Pol III 프로모터로 사용할 수 있다. 또는, 역 PCR 또는 TAIL™-PCR과 같은 PCR을 기본으로한 기법을 이용하여, 공지된 전사 영역에 인접한 프로모터 서열을 포함하는 게놈 서열을 분리할 수 있다. 더욱이, 본원에 언급된 등록 번호 및 서열번호로 구별되는 임의의 3형 Pol III 프로모터 서열을, 엄격 혼성화 조건하의 프로브로 이용하거나, 또는 PCR 프라이머를 만들기 위한 정보의 소스로서 사용하여, 그외 다양한 유기체 또는 식물 종들로부터 해당되는 프로모터 서열을 분리할 수 있다.
3형 Pol III 프로모터는 전사된 영역과 함께 위치된 cis로 작용하는 요소에 대한 요건은 없지만, 그럼에도 불구하고 정상적으로 전사 개시 부위의 하류에 위치된 서열이 본 발명의 RNAi 발현 카세트에 포함될 수 있다. 또한, 본래 단자엽식물강의 식물로부터 분리된 3형 Pol III 프로모터는 RNAi 발현 카세트에 사용하여, 쌍자엽식물강 및 단자엽식물강의 식물 세포 및 식물 모두에서 타겟 유전자의 발현을 효과적으로 억제할 수 있지만, 본래 쌍자엽식물강의 식물로부터 분리된 3형 Pol III 프로모터는 오직 쌍자엽식물강의 식물 세포와 식물에서만 효과적으로 사용될 수 있다. 게다가, 보고에 의하면, 가장 효과적인 유전자 침묵은 RNAi 발현 카세트가 동일하거나 또는 매우 가까운 종으로부터 유래된 3형 Pol III 프로모터를 포함하도록 제작되었을 때, 달성된다. 예로, 미국 특허 공개공보 20040231016을 참조한다. 따라서, 원하는 식물이 단자엽식물강이고, 소형 hpRNA 간섭이 FucT 및/또는 XylT의 발현을 저해하기 위해 선택된 방법인 경우, 3형 Pol III 프로모터는 바람직하기로는 원하는 당단백질의 N-연결된 글리칸의 당화 패턴이 변형될 식물 종을 포함하여, 다른 단자엽식물강으로부터 유래된다.
따라서, 본 발명의 발현 카세트는 5'-3' 방향으로 전사, 전사 및 번역 개시 영역을 포함하는 발현 조절 요소, 원하는 폴리뉴클레오타이드, 예컨대 목적한 이종의 단백질을 코딩하는 서열이나, 또는 발현되었을 때 FucT 및/또는 XylT의 발현이나 기능을 저해할 수 있는 FucT 및 XylT 저해성 서열을 코딩하는 서열, 및 식물에서 기능하는 전사 및 번역 종결 영역을 포함한다. 당업계에 공지된 임의의 적합한 종결 서열을 본 발명에 따라 사용할 수 있다. 종결 영역은 전사 개시 영역과 천연적일 수 있거나, 목적한 뉴클레오타이드 서열과 천연적일 수 있거나, 또는 다른 기원으로부터 유래될 수 있다. 통상적인 종결 영역은 옥토핀 신테타제 및 노팔린 신테타제의 종결 영역과 같이 아그로박테리움 투메팩시엔스의 Ti-플라스미드로부터 이용가능하다. 또한, Guerineau et al . (1991) Mol . Gen . Genet. 262:141; Proudfoot (1991) Cell 64:671; Sanfacon et al . (1991) Genes Dev. 5:141; Mogen et al . (1990) Plant Cell 2:1261; Munroe et al . (1990) Gene 91:151; Ballas et al . (1989) Nucleic Acids Res. 17:7891; 및 Joshi et al . (1987) Nucleic Acids Res. 15:9627을 참조한다. 종결 서열의 추가적인 예로는, 완두의 RubP 카르복실라제 소형 서브유닛 종결 서열과 콜리플로워 모자이크 바이러스 35S 종결 서열이 있다. 그외 적합한 종결 서열은 당업자들에게 명백할 것이며, 소형 hpRNA 구조를 형성하는 FucT 및/또는 XylT 저해성 폴리뉴클레오타이드의 발현을 추진하는 3형 Pol III 프로모터와 함께 이용하기 위한, 전술한 올리고 dT 가닥을 포함한다.
또는, 원하는 폴리뉴클레오타이드(들)를 당업계에 공지된 그외 적합한 발현 카세트에 제공할 수 있다.
일반적으로, 발현 카세트는 형질전환된 세포 또는 조직의 선별을 위한 선별 마커 유전자를 포함할 것이다. 선별 마커 유전자는 네오마이신 포스포트랜스퍼라제 II(NEO) 및 히그로마이신 포스포트랜스퍼라제(HPT)를 코딩하는 유전자와 같은 항생제 내성을 코딩하는 유전자 뿐 아니라, 제초제 화합물에 대한 내성을 부여하는 유전자를 포함한다. 제초제 내성 유전자는 일반적으로 제초제에 둔감한 변형된 표적 단백질이나 또는 제초제가 작용할 수 있기 전에 식물내에서 제초제를 분해하거나 또는 무독화시키는 효소를 코딩한다. DeBlock et al . (1987) EMBO J. 6:2513; DeBlock et al.(1989) Plant Physiol. 91:691; Fromm et al . (1990) BioTechnology 8:833; Gordon-Kamm et al . (1990) Plant Cell 2:603을 참조한다. 예를 들어, 글리포스페이트 또는 설포닐유레아 제초제에 대한 내성은, 돌연변이 표적 효소들, 5-에놀피루빌시키메이트-3-포스페이트 신타제(5-enolpyruvylshikimate-3-phosphate synthase, EPSPS) 및 아세토락테이트 신타제(acetolactate synthase, ALS)를 코딩하는 유전자를 이용하여 수득한다. 글루포시네이트 암모늄(glufosinate amnionium), 보로목시닐(boromoxynil) 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대한 내성은, 포스피노트리신 아세틸트랜스퍼라제(phosphinothricin acetyltransferase), 니트릴라제(nitrilase) 또는 2,4-디클로로페녹시아세테이트 모노옥시게나제(2,4-dichlorophenoxyacetate monooxygenase)를 코딩하는 박테리아 유전자를 이용하여 수득하며, 이들은 각 제초제를 무독화한다.
본 발명의 목적에 있어서, 선별 마커 유전자는, 네오마이신 포스포트랜스퍼라제 II(Fraley et al. (1986) CRC Critical Reviews in Plant Science 4:1); 시안아미드 하이드라타제(Maier-Greiner et al . (1991) Proc . Natl . Acad . Sci . USA 88:4250); 아스파르테이트 키나제; 디하이드로디피콜린네이트 신타제(Perl et al. (1993) BioTechnology 11:715); bar 유전자(Told et al. (1992) Plant Physiol . 100:1503; Meagher et al. (1996) Crop Sci . 36:1367); 트립토판 디카르복실라제(Goddijn. et al . (1993) Plant Mol . Biol . 22:907); 네오마이신 포스포트랜스퍼라제(NEO; Southern et al . (1982) J. Mol . Appl . Gen . 1:327); 히그로마이신 포스포트랜스퍼라제(HPT 또는 HYG; Shimizu et al . (1986) Mol . Cell . Biol . 6:1074); 디하이드로폴레이트 리덕타제(DHFR; Kwok et al . (1986) Proc . Natl . Acad . Sci . USA 83:4552); 포스피노트리신 아세틸트랜스퍼라제(DeBlock et al. (1987) EMBO J. 6:2513); 2,2-디클로로프로피오닌산 디할로게나제(Buchanan-Wollatron et al. (1989) J. Cell . Biochern . 13D:330); 아세토하이드록시산 신타제(U.S. Pat. No. 4,761,373 to Anderson et al.; Haughn et al . (1988) Mol . Gen . Genet . 221:266); 5-에놀피루빌-시키메이트-포스페이트 신타제(aroA; Comai et al. (1985) Nature 3 17:741); 할로아릴니트릴라제(WO 87/04181 to Stalker et al .); 아세틸-코엔자임 A 카르복실라제(Parker et al . (1990) Plant Physiol . 92:1220); 디하이드로프테로에이트 신타제(sulI; Guenineau et al . (1990) Plant Mol . Biol . 15:127); 및 32 kDa 광시스템 II 폴리펩타이드(psbA; Hirschberg et al. (1983) Science 222:1346 (1983))를 코딩하는 유전자를 포함하나, 이들로 한정되는 것은 아니다.
또한, 젠타마이신(예, aacC1, Wohlleben et al. (1989) Mol . Gen . Genet . 2 17:202-208); 클로람페니콜(Herrera-Estrella et al. (1983) EMBO J. 2:987); 메토트렉세이트(Herrera-Estrella et al. (1983) Nature 303:209; Meijer et al. (1991) Plant Mol . Biol . 16:807); 히그로마이신(Waldron et al . (1985) Plant Mol . Biol . 5:103; Zhijian et al. (1995) Plant Science 108:219; Meijer et al. (1991) Plant Mol. Bio . 16:807); 스트렙토마이신(Jones et al. (1987) Mol. Gen. Genet. 210: 86); 스펙티노마이신(Bretagne-Sagnard et al. (1996) Transgenic Res. 5: 131); 블레오마이신(Hille et al . (1986) Plant Mol . Biol . 7:171); 설폰아미드(Guerineau et al. (1990) Plant Mol . Bio . 15:127); 브로목시닐(Stalker et al. (1988) Science 242:419); 2,4-D(Streber et al . (1989) BioTechnology 7:811); 포스피노트리신(DeBlock et al. (1987) EMBO J. 6:2513); 스펙티노마이신(Bretagne-Sagnard and Chupeau, Transgenic Research 5:131)에 대한 내성을 코딩하는 유전자를 포함한다.
bar 유전자는, 포스피노트리신(PPT) 또는 비알라포스(bialaphos) 등과 같은 글루포시네이트 타입의 제초제에 대해, 제초제 내성을 부여한다. 전술한 바와 같이, 벡터 구조체에 사용할 수 있는 다른 선별 마커로, 바이알라포스 및 포스피노트리신 내성에 대한 PAT 유전자, 이미다졸린온 내성에 대한 ALS 유전자, 히그로마이신 내성에 대한 HPH 또는 HYG 유전자, 글리포세이트 내성에 대한 EPSP 신타제 유전자, Hc-독소 내성에 대한 Hm1 유전자, 및 당업계에서 일상적으로 사용되는 공지된 그외 선별제를 포함하나, 이들로 한정되는 것은 아니다. Yarranton (1992) Curr . Opin . Biotech. 3:506; Chistopherson et al . (1992) Proc . Natl . Acad . Sci . USA 89:6314; Yao et al . (1992) Cell 71:63; Reznikoff (1992) Mol. Microbiol . 6:2419; Barkley et al . (1980) The Operon 177-220; Hu et al . (1987) Cell 48:555; Brown et al . (1987) Cell 49:603; Figge et al . (1988) Cell 52:713; Deuschle et al . (1989) Proc . Natl. Acad . Sci . USA 86:5400; Fuerst et al . (1989) Proc . Natl . Acad . Sci . USA 86:2549; Deuschle et al . (1990) Science 248:480; Labow et al . (1990) Mol . Cell . Biol . 10:3343; Zambretti et al . (1992) Proc . Natl . Acad . Sci . USA 89:3952; Baim et al . (1991) Proc . Natl . Acad . Sci. USA 88:5072; Wyborski et al . (1991) Nuc . Acids Res. 19:4647; Hillenand-Wissman (1989) Topics in Mol. And Struc . Biol. 10:143; Degenkolb et al . (1991) Antimicrob . Agents Chemother . 35:1591; Kleinschnidt et al . (1988) Biochemistry 27:1094; Gatz et al . (1992) Plant J. 2:397; Gossen et al . (1992) Proc . Natl . Acad . Sci . USA 89:5547; Oliva et al . (1992) Antimicrob . Agents Chemother. 36:913; Hlavka et al . (1985) Handbook of Experimental Pharmacology 78; 및 Gill et al . (1988) Nature 334:721을 참조한다. 상기한 문헌들은 원용에 의해 본 발명에 포함된다.
전술한 선별 마커 유전자 리스트는 한정되는 것으로 의도되는 것은 아니다. 본 발명에 임의의 선별 마커 유전자를 사용할 수 있다.
식물 숙주에서 발현 강화를 위한 뉴클레오타이드 서열의 변형
원하는 식물이 원하는 이종의 단백질을 발현하도록 유전자 변형한 경우, 예컨해 형질전환 식물 숙주가 이종의 단백질의 재조합 생산을 위한 발현 시스템으로서 제공되는 경우, 본 발명은 숙주 식물에서의 이의 발현을 강화하기 위해, 원하는 이종의 단백질을 코딩하는 발현된 폴리뉴클레오타이드 서열의 변형을 제공한다. 따라서, 적절하다면, 폴리뉴클레오타이드는 형질전환된 식물에서 발현 증가를 위해 최적화될 수 있다. 즉, 폴리뉴클레오타이드를 향상된 발현을 위한 식물 선호 코돈을 이용하여 합성할 수 있다. 예로, 숙주 선호 코돈 사용에 대한 내용은 Campbell and Gowri (1990) Plant Physiol . 92:1-11을 참조한다. 식물 선호 코돈으로 뉴클레오타이드 서열을 합성하기 위한 방법은 당업계에서 이용가능하다. 예로, 미국 특허 5,380,831 and 5,436,391; Perlak et al . (1991) Proc . Natl . Acad . Sci . USA 15:3324; Iannacome et al . (1997) Plant Mol . Biol . 34:485; 및 Murray et al ., (1989) Nucleic Acids . Res . 17:477을 참조하며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다.
본 발명의 일부 예들에서, 식물 숙주는 개구리밥 과의 식물이며, 원하는 이종의 폴리펩타이드, 예컨대 포유류 폴리펩타이드를 코딩하는 폴리뉴클레오타이드는 코딩된 이종의 폴리펩타이드의 발현 강화를 위해 변형된다. 이러한 방식으로, 상기한 변형은 개구리밥 선호 코돈을 이용하여 원하는 이종의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드를 합성하는 것이며, 합성은 당업자에게 공지된 임의 방법으로 수행할 수 있다. 선호 코돈은 개구리밥에서 발현된 단백질에서 최고의 빈도를 보이는 코돈으로부터 결정할 수 있다. 예로, 렘니 지바의 코돈 사용 빈도는 웹 페이지: http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=Lemna+gibba+[gbpln]에서 확인되며, 렘나 마인의 코돈 사용 빈도는 웹 페이지: http://www.kazusa.or.jp/codon/cgibin/showcodon.cgi?species=Lemna+minor+[gbpln] 및 표 1에서 확인된다. 개구리밥 및 그외 단자엽, 그리고 그외 쌍자엽에서 발현시키기 위해 최적화된 이종의 유전자를, 본 발명의 방법에 사용할 수 있을 것으로 이해된다. 예로, EP 0 359 472, EP 0 385 962, WO 91/16432; Perlak et al . (1991) Proc . Natl. Acad . Sci . USA 88:3324; Iannacome et al . (1997) Plant Mol . Biol . 34:485; and Murray et al . (1989) Nuc . Acids Res . 17:477 등을 참조하며, 상기 문헌들은 원용에 의해 본 명세서에 포함된다. 원하는 이종의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드의 전체 또는 임의 일부를 최적화하거나 합성할 수 있는 것으로 또한 이해된다. 즉, 충분히 최적화되거나 또는 부분적으로 최적화된 서열도 사용할 수 있다. 예로, 코돈의 40 %, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%가 개구리밥 선호 코돈일 수 있다. 일 예로, 코돈들의 90 내지 96%는 개구리밥 선호 코돈이다. 원하는 이종의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열의 코딩 서열은 렘나 지바에서 17% 이상의 빈도로 사용되는 코돈들을 포함할 수 있다. 일 예로, 변형된 뉴클레오타이드 서열은 93%의 개구리밥 선호 코돈을 포함하는, 서열번호 16의 인간 α-2B-인터페론을 코딩하는 뉴클레오타이드 서열이다.
표 1: GenBank Release 113의 렘나 지바(Lemna gibba) 코돈
Figure 112008058316948-PCT00001
또한, 개구리밥 등의 원하는 식물 숙주에서 이의 발현을 강화하기 위해, 원하는 이종의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드에 다른 변형을 만들 수 있다. 이러한 변형으로는 가성 폴리아데닐레이션 신호(spurious polyadenylation signal)를 코딩하는 서열, 엑손-인트론 스플라이스 사이트 신호(exon-intron splice site signal)를 코딩하는 서열, 트랩스포존 유사 반복부(transposon-like repeat)를 코딩하는 서열, 및 유전자 발현에 유해할 수 있는 그외 특정화된 서열의 제거를 포함하나, 이로 한정되는 것은 아니다. 서열의 G-C 비율을 주어진 세포 숙주에서의 평균 수준으로 조절할 수 있으며, 이는 숙주 세포에서 발현된 공지 유전자를 참조로 계산된다. 가능하다면, 서열을 추정되는 헤어핀 이차 mRNA 구조를 방지하도록 변형시킬 수 있다.
동물 및 식물에서 번역 개시 코돈에 대한 최적의 번역 개시 관여 뉴클레오타이드 서열(translation initiation context nucleotide sequence)들간에 상이성이 알려져 있어, 이들 번역 개시 관여 뉴클레오타이드 서열의 구성이 번역 개시 효율에 영향을 미칠 수 있다. 그 예로, Lukaszewicz et al . (2000) Plant Science 154:89-98와 Joshi et al . (1997) Plant Mol . Biol . 35:993-1001을 참조한다. 본 발명에서, 원하는 폴리뉴클레오타이드 서열의 번역 개시 코돈에 대한 번역 개시 관여 뉴클레오타이드 서열을, 예컨대 원하는 이종의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드를, 개구리밥에서의 발현을 강화하기 위해 변형시킬 수 있다. 일 예에서, 뉴클레오타이드 서열은 원하는 뉴클레오타이드 서열의 번역 개시 코돈의 바로 상류에 있는 3개의 뉴클레오타이드가 "ACC"이도록 변형된다. 두번째 예로, 상기 뉴클레오타이드는 "ACA"이다.
또한, 개구리밥 등의 식물 숙주에서의 트랜스 유전자의 발현은, 5' 리더 서열을 사용하여 강화할 수 있다. 이러한 리더 서열은 번역을 강화하는 것으로 작용할 있다. 번역 리더는 당업계에 공지되어 있으며, 피코르나바이러스의 리더, 예로 EMCV 리더(Encephalomyocarditis 5'noncoding region; Elroy-Stein et al . (1989) Proc . Natl. Acad . Sci USA 86:6126); 포티바이러스(potyvirus)의 리더, 예로, TEV 리더(Tobacco Etch Virus; Allison et al . (1986) Virology 154:9); 인간 면역글로불린 중쇄 결합 단백질(BiP; Macajak and Sarnow (1991) Nature 353:90); 알파파 모자이크 바이러스의 코트 단백질 mRNA의 비번역 리더(AMY RNA 4; Jobling and Gelirke (1987) Nature 325:622); 담배 모자이크 바이러스의 리더(TMV; Gallie (1989) Molecular Biology of RNA , 23:56); 감자 에츠 바이러스(potato etch virus)의 리더(Tomashevskaya et al . (1993) J. Gen . Virol . 74:2717-2724); Fed-l 5' 비번역 영역(Dickey (1992) EMBO J. 11:2311-2317); RbcS 5' 비번역 영역(Silverthome et al. (1990) J. Plant . Mol . Biol . 15:49-58); 및 옥수수 클로로틱 모틀 바이러스(maize chlorotic mottle virus)의 리더(MCMV; Lommel et al . (1991) Virology 81:382)가 있으나, 이들로 한정되는 것은 아니다. 또한, Della-Cioppa et al.(1987) Plant Physiology 84:965를 참조한다. 또한, 옥수수 디하이드로게나제 1 유전자, 피마자 식물의 카탈라제 유전자 또는 아라비돕시스의 트립토판 경로 유전자 PAT1 등의, 식물 인트론 서열을 포함하는 리더 서열도, 식물에서 번역 효율을 증가시키는 것으로 입증되었다(Callis et al . (1987) Genes Dev . 1:1183-1200; Mascareuhas et al. (1990) Plant Mol . Biol . 15:913-920). 또한, 계류중인 미국 가출원 60/759,308을 참조하며, 여기에서 서열번호 13-15의 인트론들로 이루어진 군으로부터 선택된 개구리밥 인트론 서열을 포함하는 리더 서열이 개구리밥에서 번역 효율을 증가시킨다.
본 발명의 일부 예들로, 옥수수 알코올 디하이드로게나제 1 유전자(ADH1; GenBank Accession Number X04049)의 뉴클레오타이드 1222-1775에 해당되는 뉴클레오타이드 서열, 또는 서열번호 13, 14 또는 15의 인트론에 해당되는 뉴클레오타이드 서열이, 번역 효율을 강화하기 위해 FucT 및/또는 XylT 저해성 폴리뉴클레오타이드나 원하는 이종의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드의 상류에 삽입된다. 다른 예로, 발현 카세트는 렘나 지바의 리불로스-비스-포스페이트 카르복실라제 소형 서브유닛 5B 유전자로부터 유래된 리더(RbcS leader; Buzby et al . (1990) Plant Cell 2:805-814; 본 발명의 서열번호 16, 17 또는 18 참조)를 포함한다.
또한, 단지 예로서, RbcS 리더 및 ADH1 인트론이 FucT 저해성 폴리뉴클레오타이드(도 8), XylT 저해성 폴리뉴클레오타이드(도 9 및 11), 키메라 FucT/XylT 저해성 분자를 포함하는 발현 카세트(도 10), 또는 이종의 폴리펩타이드의 코딩 서열, 단일클론 항체의 IgG1 중쇄(도 12, 13 및 14) 또는 단일클론 항체의 경쇄(도 14)를 포함하는 발현 카세트내에 상류 조절 서열로서 포함되며; LmUbq 프로모터 및 LmUbq 인트론이 FucT 저해성 폴리뉴클레오타이드(도 11)을 포함하는 발현 카세트, 또는 이종의 폴리펩타이드의 코딩 서열, 단일클론 항체의 IgF1 경쇄(도 13)을 포함하는 발현 카세트내에 발현 카세트내에 상류 조절 서열로서 포함되며; SpUbq 프로모터 및 SpUbq 인트론이 FucT 저해성 폴리뉴클레오타이드(도 13)을 포함하는 발현 카세트 또는 키메라 FucT/XylT 저해성 폴리뉴클레오타이드를 포함하는 발현 카세트(도 12)내에 상류 조절 서열로 포함되며; 및 LaUbq 프로모터 및 LaUbq 인트론이 XylT 저해성 폴리뉴클레오타이드(도 13)을 포함하는 발현 카세트내에 상류 조절 서열로 포함된, 발현 벡터들이 본원에 도면에 언급되어 있다.
임의의 한가지 변형 또는 가능한 모든 변형 조합을 포함하여, 전술한 발현-강화성 뉴클레오타이드 서열의 모든 변형 방법을, 본 발명에 사용할 수 있는 것으로 이해된다. 식물, 예컨대 개구리밥 식물에서의 "발현 강화를 위해 변형된"이라는 표현은 본원에서 임의의 한가지 변형 또는 이들 변형의 모든 조합을 포함하는 폴리뉴클레오타이드 서열을 의미한다.
신호 펩타이드
원하는 이종의 폴리펩타이드가 정상적으로 또는 유익하게는 분비된 단백질로서 발현되는 것일 수 있는 것으로 이해된다. 분비된 단백질은, 세포로부터 분비되기 위해, 생성되고 있는 폴리펩타이드 체인을 막을 통과시켜 ER(endoplasmic reticulum)로 전좌시키도록 하는, ER 막 상의 수용체 단백질과 상호작용하는 "신호 펩타이드"를 포함하는 폴리펩타이드 전구체로부터, 일반적으로 번역된다. 종종 폴리펩타이드 전구체에서 신호 펩타이드가 절단되어, 신호 펩타이드가 없는 "성숙형" 폴리펩타이드가 생산된다. 본 발명의 예에서, 생물학적으로 활성인 폴리펩타이드는, 원하는 식물 숙주, 예컨대 개구리밥 또는 고등 식물에서, 배양 배지로 폴리펩타이드의 분비를 인가하는, 신호 펩타이드를 코딩하는 뉴클레오타이드 서열과 작동가능하도록 연결된 폴리뉴클레오타이드 서열로부터 발현된다. (세포외 분비를 위해) ER로 타겟 단백질 전좌를 표적화하는 식물의 신호 펩타이드들은, 당업계에 알려져 있다. 예로, Lee 등의 미국 특허 6,020,169를 참조한다. 본 발명에서, 임의의 식물 신호 펩타이드를 발현된 폴리펩타이드가 ER로 타겟팅하기 위해 사용할 수 있다.
일부 예들로, 신호 펩타이드는 아라비돕시스 탈리아나의 베이직 엔도키티나제 신호 펩타이드(basic endochitinase signal peptide)(NCBI Protein Accession No. BAA82823의 아미노산 14-34), 인스텐신 신호 펩타이드(extensin signal peptide)(Stiefel et al . (1990) Plant Cell 2:785-793), 벼의 α-아밀라제 신호 펩타이드(NCBI Protein Accession No. AAA33885의 아미노산 1-31), 또는 변형된 벼 α-아밀라제 신호 서열(서열번호 17)이 있다. 다른 예로, 신호 펩타이드는 분비된 개구리밥 단백질의 신호 펩타이드와 일치된다.
다른 예로, 포유류의 신호 펩타이드는 본 발명의 유전자 조작된 식물, 예컨대 개구리밥 또는 그외 원하는 고등 식물에서 발현된 재조합 폴리펩타이드가 분비되도록 타겟화하는데 사용할 수 있다. 식물 세포가 ER를 타겟으로 하는 포유류 신호 펩타이드를 인지하여, 이들 신호 펩타이드가 세포막과 식물 세포벽을 통과하여 폴리펩타이드의 분비를 지시할 수 있는 것으로 입증되었다. Hiatt 등의 미국 특허 5,202,422 및 5,639,947을 참조한다. 본 발명의 일 예에서, 폴리펩타이드의 분비를 타겟으로 하는 포유류의 신호 펩타이드는 인간 α-2b-인터페론 신호 펩타이드(NCBI Protein Accession No. AAB59402의 아미노산 1-23)이다.
일 예에서, 원하는 폴리뉴클레오타이드 서열에 대해 전술한 임의 변형 또는 변형 조합을 이용하여, 신호 펩타이드를 코딩하는 뉴클레오타이드 서열을 원하는 식물 숙주 예컨대 개구리밥 또는 그외 고등 식물에서 발현 강화를 위해 변형시킨다.
분비된 생물학적으로 활성인 폴리펩타이드는 당업계에 공지된 임의 방법으로 배양 배지로부터 회수하여, 크로마토그래피, 전기영동, 투석, 용매-용매 추출 등으로 정제할 수 있다. 이러한 방식으로, 전술한 바와 같이, 정제된 폴리펩타이드를 배양 배지로부터 수득할 수 있다.
따라서, 일부 예로, 단백질 발현 숙주 시스템은 식물 예컨대 개구리밥 또는 그외 고등 식물이며, 분비된 생물학적으로 활성인 폴리펩타이드는 본 발명의 당단백질로, 상기 당단백질은 실질적으로 동질적인 당화 프로파일을 가지며 GO 글리코형이 실질적으로 동질적이다. 이러한 예로, 식물 성분내에 잔류할 수 있는 임의의 그러한 당단백질을 전술한 바와 같이 선택적으로 분리 및 정제할 수 있다. 분리된 당단백질을 식물 배양 배지로부터 취하고, 전술한 바와 같이 당업계에 통상적인 임의 수단을 이용하여 정제한다. 이러한 방법으로, 식물 성분으로부터 취한 정제된 당단백질은 실질적으로 식물 세포 성분이 결여되어 있으며, 당단백질의 조제물은 오염성 식물 단백질을 약 30%, 20%, 10%, 5%, 또는 1% (건조 중량) 미만으로 포함하는 경우를 포함한다. 정제된 당단백질을 식물 배양 배지로부터 취하는 경우, 식물 배양 배지는 정제된 당단백질 조제물내에서 화합물 전구체 또는 원하는 단백질 이외의 화합물의 약 30%, 20%, 10%, 5%, 또는 1% (건조 중량) 미만이다.
일부 예들에서, 식물 숙주로부터 취한 이들 정제된 당단백질은 오염성 식물 단백질을 적어도 0.001%, 0.005%, 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5%, 6%, 6.5%, 7%, 7.5%, 8%, 8.5%, 9%, 9.5%, 10%, 15%, 20%, 25%, 또는 최대 약 약 30%(건조 중량)으로 포함할 수 있다. 다른 예로, 당단백질을 식물 배양 배지로부터 취한 경우, 이들 정제된 당단백질 중의 식물 배양 배지는 정제된 당단백질 조제물내에 화합물 전구체 또는 원하는 단백질 이외의 화합물을 적어도 0.001%, 0.005%, 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5%, 6%, 6.5%, 7%, 7.5%, 8%, 8.5%, 9%, 9.5%, 10%, 15%, 20%, 25%, 또는 최대 30%(건조 중량)로 포함할 수 있다. 일부 예들에서, 식물 숙주로부터, 그리고 분비되는 경우 배양 배지로부터, 분리 및 정제로, 오염성 식물 단백질, 식물 배양 배지 성분, 및/또는 오염성 식물 단백질과 식물 배양 배지 성분 둘다가 없는, 정제된 당단백질이 회수된다.
형질전환된 식물, 형질전환된 개구리밥 식물 및 개구리밥 결절 배양물
형질전환 프로토콜과 식물에 뉴클레오타이드 서열을 도입하는 프로토콜은, 단자엽 또는 쌍자엽인 형질전환에 타겟이 되는 식물, 식물 세포 또는 결절의 종류에 따라 달라질 수 있다. 뉴클레오타이드 서열을 식물, 식물 세포 또는 결절에 도입하는 적합한 방법으로는, 미세주사(Crossway et al. (1986) Biotechniques 4:320-334), 전기천공(Riggs et al. (1986) Proc. Natl. Acad. ScL USA 83:5602-5606), 아그로박테리움 매개의 형질전환(미국 특허 5,563,055 및 5,981,840, 이들 모두 원용에 의해 본 명세서에 포함됨), 직접 유전자 전달(Paszkowski et al. (1984) EMBO J. 3:2717-2722), 및 탄도 입자 가속(ballistic particle acceleration)(예, 미국 특허 4,945,050; 5,879,918; 5,886,244; 및 5,932,782, 이들 각각은 원용에 의해 본 명세서에 포함됨; 및 Tomes et al. (1995) "Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment," in Plant Cell, Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg and Phillips (Springer-Verlag, Berlin); McCabe et al. (1988) Biotechnology 6:923-926)이 있다. 형질전환된 세포는 통상적인 방법에 따라 식물로 생장시킬 수 있다. 예로, McCormick et al. (1986) Plant Cell Reports 5:81-84를 참조한다.
본 발명에 이용되는 안정적으로 형질전환된 개구리밥은 당업계에 공지된 임의 방법으로 수득할 수 있다. 일 예로, 안정적으로 형질전환된 개구리밥은 Stomp 등의 미국 특허 6,040,498에 언급된 유전자 전달 방법들 중 한가지로 수득하며, 상기 문헌은 원용에 의해 본 명세서에 포함된다. 이러한 방법으로는, 원하는 뉴클레오타이드 서열을 포함하는 핵산이 코딩된 마이크로발사체를 이용한 탄도 충격에 의한 유전자 전달, 및 원하는 뉴클레오타이드 서열을 포함하는 벡터를 포함하는 아그로박테리움 매개 유전자 전달을 포함한다. 일 예에서, 안정적으로 형질전환된 개구리밥은 Stomp 등의 미국 특허 6,040,498에 기술된 아그로박테리움 매개 방법들 중 어느 하나를 통해 수득한다. 사용되는 아그로박테리움은 아그로박테리움 투메팩시엔스(Agrobacterium tumefaciens) 또는 아그로박테리움 리조게네스(Agrobacterium rhizogenes)이다.
이러한 방법에 사용되는 안정적으로 형질전환된 개구리밥 식물은 정상적인 형태를 나타내며 유성 생식으로 번식한다. 바람직하기로는, 본 발명의 형질전환된 식물은 전달된 핵산 1 카피를 포함하며, 형질전달된 핵산은 그 곳에서 주목할만한 재정렬을 수행하진 않는다. 또한, 형질전환된 핵산이 저카피수(즉 4 카피수 이하, 또는 3 카피수 이하, 또는 형질전환된 세포 당 핵산 카피수 3 미만)로 존재하는 개구리밥 식물이 바람직하다.
도 1은 렘나 마이너 α1,3-푸코실트랜스퍼라제(FucT)의 DNA(서열번호 1; 서열번호 2의 코딩 서열) 및 아미노산(서열번호 3) 서열이다. 코딩 서열은 진하게 표시되어 있다. 밑줄 한 줄( )이 그어진 뉴클레오타이드는 FucT의 발현을 저해하기 위해 제작된 RNAi 발현 카세트내의 FucT 정방향 단편(도 5)이고, 이중 밑줄( )의 뉴클레오타이드는 이 RNAi 발현 카세트내의 FucT 스페이서 서열이다. RNAi 발현 카세트의 FucT 역방향 단편은 상기 FucT 정방향 단편의 안티센스이다.
도 2는 서열번호 3의 렘나 마이너 FucT과 그외 고등 식물의 α1,3-푸코실트랜스퍼라제를 정렬한 것이다.
도 3은 렘나 마이너 β1,2-자일로실트랜스퍼라제(XylT) 이소형 #1의 DNA(서열번호 4; 서열번호 5에 나타낸 코딩 서열) 서열과 코딩되는 아미노산(서열번호 6) 서열이다. 밑줄 한 줄( )이 그어진 뉴클레오타이드는 XylT의 발현을 저해하기 위해 제작된 RNAi 발현 카세트내의 XylT 정방향 단편(도 6)이고, 이중 밑줄( )의 뉴클레오타이드는 이 RNAi 발현 카세트내의 FucT 스페이서 서열이다. RNAi 발현 카세트의 XylT 역방향 단편은 상기 XylT 정방향 단편의 안티센스이다.
도 4는 서열번호 5의 렘나 마이너 FucT과 그외 고등 식물의 β1,2-자일로실트랜스퍼라제를 정렬한 것이다.
도 5는 렘나 마이너 FucT의 단일-유전자 RNAi 낫아웃을 제작하기 위한 한가지 전략을 나타낸 것이다.
도 6은 XylT 이소형 #1에 대한 DNA 서열을 기초로, 렘나 마이너 XylT의 단일-유전자 RNAi 낫아웃을 제작하기 위한 한가지 전략을 나타낸 것이다.
도 7은 RNAi 낫아웃의 XylT 부분을 XylT 이소형 #1에 대한 DNA 서열을 기초하여, 렘나 마이너 FucT 및 XylT의 2개-유전자 RNA 낫아웃을 제작하기 위한 한가지 전략을 나타낸 것이다.
도 8은 렘나 마이너 FucT의 단일-유전자 RNA 낫아웃을 위해 제작된 RNAi 발현 카세트를 포함하는 Fuc02 구조체이다. FucT 저해성 서열(FucT 정방향 및 FucT 역방향 화살표시, 도 5 참조)의 발현은 아그로박테리움 투메팩시엔스 만노핀 신타제 프로모터(AmasPmas)에 작동가능하게 연결된, 아그로박테리움 투메팩시엔스의 옥토핀 신타제 유전자로부터 유래된 3가지 상류 활성화 서열(Aocs)을 포함하는 작동가능하게 연결된 발현 조절 요소(AocsAocsAocsAmasPmas)에 의해 진행된다. RbcS 리더, 루비스코 소형 서브유닛 리더 서열; ADH1, 옥수수 알코올 디하이드로게나제 1 유전자의 인트론; nos-ter, 아그로박테리움 투메팩시엔스 노팔린 신테타제(nos) 종결자 서열.
도 9는 렘나 마이너 XylT의 단일-유전자 RNA 낫아웃을 위해 제작된 RNAi 발현 카세트를 포함하는 Xyl02 구조체이다. XylT 저해성 서열(XylT 정방향 및 XylT 역방향 화살표시, 도 6 참조)의 발현은 작동가능하게 연결된 AocsAocsAocsAmasPmas 발현 조절 요소에 의해 진행된다. RbcS 리더, 루비스코 소형 서브유닛 리더 서열; ADH1, 옥수수 알코올 디하이드로게나제 1 유전자의 인트론; nos-ter, 아그로박테리움 투메팩시엔스 노팔린 신테타제(nos) 종결자 서열.
도 10은 렘나 마이너 FucT/XylT의 2가지-유전자 RNA 낫아웃을 위해 제작된 키메라 RNAi 발현 카세트를 포함하는 XF02 구조체이다. 헤어핀 RNA는 키메라 서열(키메라 헤어핀 RNA)로 발현되며, 2가지 유전자의 단편들은 함께 융합되어 하나의 전사체로 발현된다. FucT/XylT 저해성 서열(FucT 및 XylT 정방향 화살표, 및 XylT 및 FucT 역방향 화살표시, 도 7 참조)의 발현은 작동가능하게 연결된 AocsAocsAocsAmasPmas 발현 조절 요소에 의해 진행된다. RbcS 리더, 루비스코 소형 서브유닛 리더 서열; ADH1, 옥수수 알코올 디하이드로게나제 1 유전자의 인트론; nos-ter, 아그로박테리움 투메팩시엔스 노팔린 신테타제(nos) 종결자 서열.
도 11은 렘나 마이너 FucT/XylT의 2가지-유전자 RNA 낫아웃을 위해 제작된 키메라 RNAi 발현 카세트를 포함하는 XF03 구조체이다. 카세트는 두개의 RNAi 헤어핀을 발현하며, 하나는 FucT를 발현을 타겟팅하고, 다른 하나는 XylT의 발현을 타겟팅한다. FucT 저해성 서열(FucT 정방향 및 FucT 역방향 화살표시, 도 5 참조) 의 발현은 렘나 마이너 유비퀴틴 프로모터 + 5' UTR (LmUbq 프로모터) 및 인트론(LmUbq 인트론)(서열번호 7 참조)를 포함하는 작동가능하게 연결된 발현 조절 요소에 의해 진행된다. XylT 저해성 서열(XylT 정방향 및 XylT 역방향 화살표시, 도 6 참조)의 발현은 작동가능하게 연결된 AocsAocsAocsAmasPmas 발현 조절 요소에 의해 진행된다. RbcS 리더, 루비스코 소형 서브유닛 리더 서열; ADH1, 옥수수 알코올 디하이드로게나제 1 유전자의 인트론; nos-ter, 아그로박테리움 투메팩시엔스 노팔린 신테타제(nos) 종결자 서열.
도 12는 IgG1 단일클론 항체(이하 mAbI라 함)와 렘나 마이너 FucT 및 XylT의 2가지 유전자 낫아웃의 공동-발현을 제공하는 mAbI04 구조체로, FucT 및 XylT의 키메라 헤어핀 RNA를 타겟팅 발현이 이루어진다. FucT/XylT 저해성 서열(FucT 및 XylT 정방향 화살표, 및 XylT 및 FucT 역방향 화살표시, 도 7 참조)의 발현은 스피로델라 폴리리자 유비퀴틴 프로모터 + 5' UTR (SpUbq 프로모터) 및 인트론(SpUbq 인트론)(서열번호 8 참조)를 포함하는 작동가능하게 연결된 발현 조절 요소에 의해 진행된다. IgG1 경쇄의 발현은 렘나 마이너 유비퀴틴 프로모터 + 5' UTR (LmUbq 프로모터) 및 인트론(LmUbq 인트론)을 포함하는 작동가능하게 연결된 발현 조절 요소에 의해 진행된다. IgG1 중쇄의 발현은 작동가능하게 연결된 AocsAocsAocsAmasPmas 발현 조절 요소에 의해 진행된다. RbcS 리더, 루비스코 소형 서브유닛 리더 서열; ADH1, 옥수수 알코올 디하이드로게나제 1 유전자의 인트론; nos-ter, 아그로박테리움 투메팩시엔스 노팔린 신테타제(nos) 종결자 서열.
도 13은 mAbI과 렘나 마이너 FucT 및 XylT의 이중-낫아웃의 공동-발현을 제 공하는 mAbI05 구조체로, 2개의 헤어핀 RNA를 발현하며, 하나는 FucT의 발현을, 다른 하나는 XylT의 발현을 타겟팅한다. FucT 저해성 서열(FucT 정방향 및 FucT 역방향 화살표시, 도 5 참조)의 발현은 스피로델라 폴리리자 유비퀴틴 프로모터 + 5' UTR (SpUbq 프로모터) 및 인트론(SpUbq 인트론)을 포함하는 작동가능하게 연결된 발현 조절 요소에 의해 진행된다. XylT 저해성 서열(XylT 정방향 및 XylT 역방향 화살표시, 도 6 참조)의 발현은 렘나 에퀴녹티알리스 유비퀴틴 프로모터 + 5' UTR (LaUbq 프로모터) 및 인트론(LaUbq 인트론)(서열번호 9 참조)을 포함하는 작동가능하게 연결된 발현 조절 요소에 의해 진행된다. RbcS 리더, 루비스코 소형 서브유닛 리더 서열; ADH1, 옥수수 알코올 디하이드로게나제 1 유전자의 인트론; nos-ter, 아그로박테리움 투메팩시엔스 노팔린 신테타제(nos) 종결자 서열. IgG1 경쇄의 발현은 렘나 마이너 유비퀴틴 프로모터 + 5' UTR (LmUbq 프로모터) 및 인트론(LmUbq 인트론)을 포함하는 작동가능하게 연결된 발현 조절 요소에 의해 진행된다. IgG1 중쇄의 발현은 작동가능하게 연결된 AocsAocsAocsAmasPmas 발현 조절 요소에 의해 진행된다. RbcS 리더, 루비스코 소형 서브유닛 리더 서열; ADH1, 옥수수 알코올 디하이드로게나제 1 유전자의 인트론; nos-ter, 아그로박테리움 투메팩시엔스 노팔린 신테타제(nos) 종결자 서열.
도 14는 mAbI의 발현을 제공하는 mAbI01 구조체로, FucT과 XylT의 발현을 억제하지 않는다. IgG1 경쇄 및 IgG1 중쇄의 발현은 작동가능하게 연결된 AocsAocsAocsAmasPmas 발현 조절 요소에 의해 독립적으로 진행된다. RbcS 리더, 루비스코 소형 서브유닛 리더 서열; ADH1, 옥수수 알코올 디하이드로게나제 1 유전 자의 인트론; nos-ter, 아그로박테리움 투메팩시엔스 노팔린 신테타제(nos) 종결자 서열. mAbI01은 발현된 mAbI이 야생형 렘나 마이너의 당화 프로파일을 나타내므로, "야생형" mAbI01 구조체라고 한다.
도 15 및 16은 도 10의 XF02 구조체를 포함하는 형질전환성 RNAi 렘나 마이너 식물 주의 일차 스크리닝 데이타이다.
도 17은 도 12의 mAbI04 구조체와 도 13의 mAbI05 구조체를 포함하는 RNAi 렘나 마이너 식물 주의 일차 스크리닝 데이타이다.
도 18은 유도체화된 야생형 렘나 마이너 mAb N-글리칸의 구조 및 분자량을 나타낸다. "GnGn"은 GlcNAc2Man3GlcNAc2 N-글리칸 종으로, 또한 G0 N-글리칸 종이라고도 한다. "GnGnX"는 식물 특이적인 β(1,2)-자일로스 잔기가 부착된 GlcNAc2Man3GlcNAc2 N-글리칸 종이다. "GnGnXF"은 식물 특이적인 β(1,2)-자일로스 잔기와 식물 특이적인 α(1,3)-푸코스 잔기가 부착된 GlcNAc2Man3GlcNAc2 N-글리칸이다.
도 19는 렘나 마이너 FucT 및 XylT의 RNAi 억제 없이, 렘나 마이너에서 mAbI 단일클론 IgG1 항체의 발현을 제공하며, β1,2-연결된 자일로스를 갖는 한 종, 및 β1,2-연결된 자일로스 및 코어 α1,3-연결된 푸코스 잔기 둘다를 갖는 한 종을 포함하여, 주류 N-글리칸 종 3가지가 나타나는 N-당화 프로파일을 형성하며, 이 프로파일은 액체 크로마토그래피 질량 측정(LC-MS)(도 20)과 MALDI (도 21) 분석으로 검증된다.
도 22는 mAbI01 구조체(FucT 또는 XylT 억제 없음)를 포함하는 야생형 렘나 마이너 식물주와 도 12의 mAbI04 구조체(mAbI와, 렘나 마이너 FucT 및 XlT 둘 다를 타겟팅하는 키메라 RNAi 구조체의 공동-발현을 제공함)를 포함하는 2종의 형질전환된 렘나 마이너 식물주에서 생산되는 mAbI의 다양한 N-글리칸 종의 상태적인 양을 중첩하여 나타낸 것이다. GnGn (즉, G0) 글리코 종의 다량 존재와 β1,2-연결된 자일로스 또는 코어 α1,3-연결된 푸코스 잔기의 부착이 없음을 주지하여야 한다. "MGn"은 트리만노스 코어 구조, Man3GlcNAc2가 1,3 만노스 암에 부착된 하나의 N-아세틸 글루코사민을 가지고 있는, N-글리칸 전구체이다. "GnM"은 트리만노스 코어 구조 Man3GlcNAc2가 1,6 만노스 암에 부착된 하나의 N-아세틸 글루코사민을 가지고 있는, N-글리칸 전구체이다. 이들 N-글리칸 전구체들은 샘플내에 존재하는 총 N-글리칸에 미량으로 나타난다. 이 프로파일은 질량 측정(LC-MS)(도 23) 및 MALDI (도 24) 분석으로 검증된다.
도 25는 mAbI01 구조체를 포함하는 야생형 렘나 마이너(주 20)에서 생산되는 mAbI 조성물의 무가공 질량 분석을 나타낸다. XylT 및 FucT의 발현이 렘나 마이너에서 억제되지 않았을 때, 재조합으로 생산되는 mAbI 조성물은 이질적이며, 9개 이상의 상이한 글리코형을 포함하며, 우세 종은 G0XF3 글리코형이다. 아주 작은 피크는 GO 글리코형이다.
도 26은 도 12의 mAbI04 구조체를 포함하는 형질전환된 렘나 마이너(주 15)에서 생산되는 mAbI 조성물의 무가공 질량 분석을 나타낸 것이다. XylT 및 FucT의 발현이 키메라 RNAi 구조체를 이용하여 렘나 마이너에서 억제되었을 때, 온전한 mAbI 조성물은 실질적으로 동질적인 GO N-글리칸이고, 전구체 N-글리칸(GnM 및 MGn 전구체 글리칸 종임)은 단지 미량 존재한다. 아울러, mAbI 조성물은 실질적으로 동질적인 GO 글리코형이며, 양쪽 당화 부위에는 GO N-글리칸 종이 차지하고 있으며, 미량의 전구체 글리코형을 나타내는 3개의 작은 피크가 있다(피크 하나는 중쇄 하나의 CH2 도메인에 Asn 297에 부착된 GO 글리칸 종이 있으며 다른 중쇄의 CH2 도메인은 당화되지 않은, Fc 영역을 가지고 있는 mAbI이며; 다른 피크는 중쇄 하나의 CH2 도메인에 Asn 297에 부착된 GO 글리칸 종이 있으며 다른 중쇄의 CH2 도메인은 Asn 297에 부착된 GnM 또는 MGn 전구체 글리칸이 있는, Fc 영역을 가지고 있는 mAbI이며, 또다른 피크는 각 CH2 도메인의 Asn 297 당화 부위에 GO 글리칸 종이 부착되어 있는, Fc 영역을 가지고 있으며 mAbI 구조체의 다른 당화 부위에 3번째 글리칸 종이 부착되어 있는 mAb임).
도 27은 도 13의 mAbI01 구조체를 포함하는 형질전환된(주 72)에서 생산되는 mAbI 조성물의 무가공(intact) 질량 분석을 나타낸 것이다. 상기 구조체를 이용하여 XylT 및 FucT 발현을 억제하였을 때, 온전한 mAbI 조성물은 실질적으로 동질적인 GO N-글리칸이며, 미량의 전구체 N-글리칸 종(GnM 및 MGn 전구체 글리칸 종임)이 유일하게 존재한다. 또한, mAbI 조성물은 실질적으로 동질적인(90% 이상) GO 글리코형이며, mAbI04 구조체의 결과와 같이 전구체 글리코형을 나타내는 동일한 작은 피크 3개가 존재한다.
도 28은 각각의 FucT 및 XylT 유전자의 발현을 타겟팅하기 위한 2가지 실현가능한 디자인을 요약한 것이다.
도 29A는 식물 및 동물에서 생산되는 당단백질의 컴플렉스 N-글리칸의 공통되는 올리고만노스의 코어 구조를 나타낸 것이다. 포유류에서, 상기 코어 구조는 푸코스의 1-위치가 알파 결합을 통해 환원성 말단에서 N-아세틸글루코사민의 6- 위치에 결합되어 있는 푸코스 잔기를 포함할 수 있다(즉, α(1,6)-연결된 푸코스). 도 29B는 이들 N-글리칸에 대한 식물 특이적인 변형을 나타낸 것이다. 포유류 R 그룹은 하기 중 하나 일 수 있다: (a) R=GlcNAcβ(1,2); (b) R=Galβ(1,4)-GlcNAcβ(1,2); (c) R=NeuAcα(2,3)-Galβ(1,4)-GlcNAcβ(1,2); (d) R=NeuGcα(2,3)-Galβ(1,4)-GlcNAcβ(1,2); 및 (e) R=Galα(1,3)-Galβ(1,4)-GlcNAcβ(1,2). 식물 R 그룹은 하기 중 하나 일 수 있다: (a) R=null; (b) R=GlcNAcβ(1,2);
Figure 112008058316948-PCT00002
약어: Man, 만노스; GlcNAc, N-아세틸글루코사민; Xyl, 자일로스; Fuc, 푸코스; Gal, 갈락토스; NeuAc(뉴라민산(시알산); *, 아스파라진에 결합하는 당쇄의 환원성 말단.
도 30은 본 발명의 상세한 설명 및 청구항에서 언급되며 본원에서 사용한 그외 명명에 따른 당단백질의 N-연결된 글리칸의 G0, G0X, 및 G0XF3 종을 나타낸다.
도 31은 렘나 마이너 β1,2-자일로실트랜스퍼라제(XylT) 이소형 #2에 대한 부분 cDNA(서열번호 19; 서열번호 20에 기재된 코딩 서열) 서열과, 이로부터 코딩되는 부분 아미노산(서열번호 21) 서열을 나타낸 것이다. 밑줄 한 줄( )이 그어진 뉴클레오타이드는 XylT의 발현을 저해하기 위해 제작된 RNAi 발현 카세트내의 XylT 정방향 단편(도 33)이고, 이중 밑줄( )의 뉴클레오타이드는 이 RNAi 발현 카세트내의 스페이서 서열이다. RNAi 발현 카세트의 XylT 역방향 단편은 본원에 나타낸 XylT 정방향 단편의 안티센스이다.
도 32는 렘나 마이너의 서열번호 6의 XylT 이소형 #1과 서열번호 21의 렘나 부분-길이의 XylT 이소형 #2를 정렬한 것이다.
도 33은 XylT 이소형 #2에 대한 부분 DNA 서열을 기초로 렘나 마이너 XylT의 단일-유전자 RNAi 낫아웃을 디자인하기 위한 하나의 전략을 나타낸 것이다.
도 34는 렘나 FucT 및 XylT의 2가지 유전자의 RNAi 낫아웃을 디자인하기 위한 하나의 전략으로, RNAi 낫아웃의 XylT 영역은 XylT 이소형 #2에 대한 부분 DNA 서열을 기초한 것이다.
도 35는 갓 분리한 인간 NK 세포 상에서의 FcγRIIIa에 대한 CHO-유래 및 SP2/0-유래의 mAbI 산물의 수용체 결합 활성을 나타낸 것이다.
도 36은 야생형 렘나 유래의 mAbI 산물과 형질전환된 렘나 유래의 mAbI 산물의, 수여체 1로부터 수득한 갓 분리한 인간 NK 세포 상에서의 FcγRIIIa에 대한 수용체 결합 활성을 나타낸 것이다.
도 37은 야생형 렘나 유래의 mAbI 산물과 형질전환된 렘나 유래의 mAbI 산물 의, 수여체 2 및 3로부터 수득한 갓 분리한 인간 NK 세포 상에서의 FcγRIIIa에 대한 수용체 결합 활성을 나타낸 것이다.
도 38은 Sp2/0-유래 mAbI 산물, 야생형 렘나-유래 mAbI 산물 및 형질전환된 렘나-유래 mAbI 산물의, 마우스 FcγRIV에 대한 수용체 결합 활성을 나타낸 것이다.
도 39는 렘나에서 FucT 및 XylT 활성의 RNAi 침묵화를 위한 MDXA04 바이너리 발현 벡터의 개략도이다. 빗금 친 부분은, 완전한 인간의 mAb1 카파 항체 MDX-060, 및 FucT 및 XylT를 코딩하는 내인성 렘나 유전자의 침묵화를 타겟팅하도록 제작된, 키메라 헤어핀 RNA(RNAi)의 중쇄(H) 및 경쇄(L)의 가변성 영역의 유전자 서열의 위치를 나타낸다. 프로모터: P1, P2, 및 P3; 종결자: T; 선별 마커: SM; 좌측 보더(left border): LB; 우측 보더, RB. 야생형 렘나에서 MDX-060 mAb를 발현하기 위해 사용한 MDXA01 발현 벡터는 헤어핀 RNA 영역을 포함하지 않았다.
도 40은 렘나 야생형 및 MDX-060 LEXOpt RNAi 식물주들에서 글리코실트랜스퍼라제 활성을 나타낸 것이다. 야생형 (WT) 및 MDX-060 LEXOpt RNAi (식물주의 번호가 표시됨) 식물 유래의 미소좀 막을 GDP-Fuc, UDP-Xyl 및 GnGn-답실-펩타이드 어셉터를 포함하고 있는 반응 완충액의 존재하에 인큐베이션하였다. 각 식물로의 미소좀에 의해 합성된 푸실화된(백색 막대) 또는 자일로실화된(검은색 바)에 해당되는 질량 피크를 포지티브 레플렉트론 모드의 MALDI-TOF MS로 측정하고, WT 양성 대조군에 대한 퍼센트로 표준화하였다. 끓인 야생형 막(BWT)는 백그라운드 이온 카 운트이다.
도 41은 MDX-060 LEXOpt유래의 식물 추출물 및 단백질 A 또는 하이드록시아파티트로 정제한 샘플의, 각각 비환원(도 41A) 및 환원(도 41B) 조건하에서 SDS-PAGE를 나타낸 것이다. CHO 세포주(MDX-060 CHO)로부터 정제한 mAb를 양성 대조군으로 사용하였다. Mark12 분자량 마커가 겔에 포함되어 있다. 겔은 콜로이달 블루로 염색하였다.
도 42는 CHO(MDX-060 CHO), 야생형 렘나(MDX-060 LEX), 또는 XylT/FucT RNAi 구조체(MDX-060 LEXOpt)로 형질전환된 렘나에서 발현된 MDX-060 mAb로부터 분비되는 2-AA로 표지된 N-글리칸의, 네커티브 레플렉트론 모드 MALDI-TOF 질량 분광측정 분석의 스펙트럼이다. 의미있는 피크들은 대응되는 질량([M-H]-)에 의해 동정한다. *는 매트릭스 아르터팩트(matrix artefact)의 위치를 표시한다.
도 43은 CHO (MDX-060 CHO), 야생형 렘나(MDX-060 LEX), 또는 XylT/FucT RNAi 구조체(MDX-060 LEXOpt)로 형질전환된 렘나에서 발현되는 MDX-060 mAb로부터 분비된 2-AA로 표지된 N-글리칸의, NP-HPLC-QTOF MS 분석으로 수득한 스펙트럼이다. 2-AA로 표지된 N-글리칸은 정상 상의 크로마토그래피에 의해 분리되고 형광으로 검출된다. 온라인 네거티브 모드의 QTOF MS에 의해 각 샘플(a - i)에서 가장 많은 피크들을 특정화하여, 이의 대응되는 QTOF 질량 스펙트럼([M-2H]2-)를 나타낸다.
도 44는 L540 세포 상에 발현된 CD30에 대한, MDX-060 CHO, LEX 또는 글리코-최적화된 LEXOpt mAb의 결합성을, 유세포 측정 분석에 의해 측정한, MDX-060 mAb의 시험관내 활성을 나타낸 것이다. L540 세포를 하기 실시예 6의 기재한 항체의 농도를 증가시키면서 인큐베이션하였다. GMFI(Geo Mean Fluorescence Intensity)는 사용한 다양한 mAb 농도에 대해 그래프를 그렸다. n: MDX-060 CHO; p: MDX-060 LEX;q: MDX-060 LEXopt.
도 45는 글리코-최적화된 mAb 및 야생형 mAb의, 2개의 상이한 인간 FcRgIIIa 알로타입(Val158 또는 Phe158)에 대한 평형 결합을 나타낸 것이다. FcRgIIIa에 대한 함수로서의 결합 신호를 원-사이트 결합 모델에 적용하였다. n: MDX-060 CHO; p: MDX-060 LEX;q: MDX-060 LEXopt.
도 46은 CHO, LEX (야생형 렘나 당화) 또는 LEXOpt (RNAi transgenic Lemna)로부터 유래된 MDX-060 mAb의 ADCC 활성을 나타낸 것이다. FcgRIIIaPhe158 동형접합체 공여체 유래의 인간 작동자 세포와 FcgRIIIaPhe/Val158 이형접합체 공여체 유래의 인간 작동자 세포를, 표시된 항체의 농도를 증가시키면서, 작동자 : 타겟 비 50:1로, BATDA로 표지된 L540 세포와 인큐베이션하였다. 각 mAb 농도에서의 특이적인 세포용해율(cell lysis %)을 그래프로 나타낸다. L540 세포에서 항원을 인지하지 않는 mAb1을 모든 실험들에서 이소형 대조군으로서 사용하였다. EC50 값(㎍ /mL), 결합 상수 및 최대 세포용해율을 GraphPad Prism 3.0 소프트웨어로 계산하였다. n: MDX-060 CHO; p: MDX-060 LEX;q: MDX-060 LEXopt.
도 47은 MDXA01 구조체를 포함하는 야생형 렘나 마이너에서 생산되는 MDX-060 LEX mAb 조성물의 무가공 질량 분석을 나타낸 것이다. 렘나 마이너에서 XylT 및 FucT 발현이 억제되었을 때, 재조합으로 생산된 MDX-060 LEX mAb 조성물은 7개 이상의 상이한 글리코형을 포함하며, 우세 종은 G0XF3 글리코형이다. GO 글리코형에 해당되는 피크가 없음을 주지하여야 한다.
도 48은 MDXA01 구조체를 포함하는 야생형 렘나 마이너에서 생산되는 MDX-060 LEX mAb의 중쇄의 글리칸 질량 분석을 나타낸 것이다. 렘나 마이너에서 XylT 및 FucT 발현이 억제되었을 때, 존재하는 우세 N-글리칸 종은 G0XF3이며, GOX 종을 나타내는 추가적인 주 피크가 있다. GO 글리칸 종이 소량 존재함을 주지하여야 한다.
도 49는 MDXA04 구조체를 포함하는 형질전환된 렘나 마이너에서 생산되는 MDX-060 LEXOpt mAb 조성물의 무가공 질량 분석을 나타낸 것이다. 렘나 마이너에서 XylT 및 FucT 발현이 억제되었을 때, 무가공 mAb 조성물은 GO N-글리칸만 포함한다. 또한, 상기 조성물은 실질적으로 동질적인 GO 글리코형(피크 2)이며, 양쪽의 당화 부위는 GO N-글리칸 종이 점유하고 있으며, 미량의 전구체 글리코형을 나타내는 2개의 작은 피크가 있다(중쇄 하나의 CH2 도메인에 Asn 297에 부착된 GO 글리칸 종이 있으며 다른 중쇄의 CH2 도메인은 당화되지 않은, 피크 1; 및 각 CH2 도메인의 Asn 297 당화 부위에 GO 글리칸 종이 부착되어 있으며 mAb 구조체의 다른 당화 부위에 3번째 글리칸 종이 부착되어 있는 피크 3).
도 50은 MDXA04 구조체를 포함하는 형질전환된 렘나 마이너에서 생산되는 MDX-060 LEXOpt의 중쇄의 글리칸 질량 분석을 나타낸 것이다. FucT 및 XylT이 렘나 마이너에서 발현되었을 때, 중쇄 CH2 도메인의 Asn 297 당화 부위에 부착된, 쉽게 검출할 수 있는 유일한 N-글리칸 종은 GO이다.
도 51A(MALDI 분석) 및 51B(HPLC 분석)는 mAbI04 RNAi 구조체를 포함하는 형질전환된 렘나 마이너(주 24)에서 생산되는, mAbI에 의해 표시되는 동질적인 당화 프로파일이, 생산 규모 확대시에 일치되게 관찰됨을 나타낸 것이다.
도 52는 도 12의 키메라 RNAi mAbI04 구조체를 이용한 FucT 및 XylT 발현의 억제에 의해, 재조합 당단백질에서 관찰되는 패턴과 일치되는 동질적인 당화 패턴을 갖는 내인성 당단백질이 생성됨을 나타낸 것이다. 도 52에서, 트리만노스 코어 구조에 부착된 β1,2-연결된 자일로스 잔기는 별표로 표시되어 있다.
도 53은 하기 실시예 6에 언급된 컴플렉스 N-글리칸의 구조를 나타낸 것이다.
하기 실시예는 예시로 제공되며 한정의 의미는 아니다.
실험
소형 수생 식물인 렘나는 인간 병원체가 없는 치료 단백질의 제조에 있어, 측정가능하며 경제적으로도 매력적인 발현 플랫폼으로, 규제 승인에 있어 클리어 패스(clear path towards regulatory approval)이다. 렘나 발현 시스템(LEX SystemSM)은 형질전환 식물의 빠른 클론 증폭, 형질전환 단백질의 분비, 단백질 고수율, CHO 세포와 같은 포유류 세포 배양 시스템과 비교되는 오염 문제에 대해 안심시킬 수 있으며, 운영 자금이 낮은 추가적인 이점이 있다(Gasdaska et al . (2003) Bioprocessing J. 50-56). 아울러, 이 식물 발현 시스템은 (총 가용성 단백질(TSP)의 6-8% 범위의) 단백질 고수율 이점을 제공한다. 이러한 발현 수준은, 렘나의 단백질 높은 함유율 및 빠른 증식 속도(2배수 증식시간: 36시간)와 조합하여, 견고하고-잘 통제된 포맷으로 생중량 kg 등 >1g의 mAb를 생산할 수 있다.
하기 실시예들은 mAb의 당화 프로파일의 인간화가 α1,3-푸코실트랜스퍼라제 및 β1,2-자일로실트랜스퍼라제의 내인성 발현을 타겟팅하는 RNA 간섭(RNAi) 구조체와 mAb의 공동 발현에 의해 어떻게 달성되지는를 설명한다. 수득되는 mAb에 함유된 단일한 주된 N-글리칸 종(>95%)에는 식물 특이적인 α1,3-푸코스 및 β1,2-자일로스 당이 없다. 리포터 결합 분석에서, 글리칸 최적화된 mAb는 천연형 당화 장치를 가지고 있는 야생형 렘나에서 생산되는 mAb와 CHO 세포에서 생산된 mAb와 비교하였을 때, 강화된 작동자 세포 수용체 결합 활성을 나타내었다.
실시예 1: 단백질의 N- 당화에 관여하는 렘나 마이너 단백질들의 분리
리모델링한 N-글리칸을 가진 재조합 단백질을 제조하기 위해, 렘나 마이너에 서 RNAi 유전자 침묵화를 위해, α1,3-푸코실트랜스퍼라제 및 β1,2-자일로실트랜스퍼라제를 타겟으로서 선택하였다. cDNA 서열분석 시도로 얻은 일차 결과에서, 2 이상의 이소형이 타겟 유전자 각각에서 나타났다. 이소형간의 서열 상동성은 90% 내지 95%인 것으로 결정되었다. 이 둘의 타겟 유전자의 cDNA 전장 서열을 회수하여 특징을 파악하였다. 렘나 마이너 α1,3-푸코실트랜스퍼라제(FucT)의, 5' 및 3'-UTR을 포함하는 전장 cDNA 서열을 도 1과 서열번호 1(서열번호 2에 오픈 리딩 프래임 나타냄)에 나타낸다. 이로부터 코딩되는 것으로 예측되는 아미노산 서열은 서열번호 3에 나타낸다. 코딩된 단백질은 다른 고등 식물의 FucT과 일부 유사성을 공유한다. 도 2를 참조한다. 예컨대, 렘나 마이너 FucT 서열은 도 2에 나타낸 아라비돕시스 탈리아나의 FucT과 약 50.1%의 서열 동일성을 가진다.
렘나 마이너 β1,2-자일로실트랜스퍼라제(XylT)(이소형 #1)의, 5' 및 3'-UTR을 포함하는 전장 cDNA 서열을 도 3과 서열번호 4(서열번호 5에 오픈 리딩 프래임 나타냄)에 나타낸다. 이로부터 코딩되는 것으로 예측되는 아미노산 서열을 서열번호 6에 나타낸다. 코딩된 단백질은 다른 고등 식물의 XylT과 일부 유사성을 공유한다. 도 4를 참조한다. 예컨대, 렘나 마이너 XylT 서열은 도 4에 나타낸 아라비돕시스 탈리아나의 XylT과 약 56.4%의 서열 동일성을 가진다. 렘나 마이너 β1,2-자일로실트랜스퍼라제(XylT)(이소형 #2)의, 3'-UTR을 포함하는 부분 길이의 cDNA 서열(partial-length cDNA sequence)을 도 31과 서열번호 19(서열번호 20에 오픈 리딩 프래임 나타냄)에 나타낸다. 이로부터 코딩되는 것으로 예측되는 아미노산 서열을 서열번호 21에 나타낸다. 부분 길이의 XylT 이소형 #2는 도 32에 나타낸 정렬로부터 알 수 있는 바와 같이, 전장의 XylT 이소형 #1의 대응되는 영역과 높은 서열 동일성을 공유한다.
실시예 2: 렘나 마이너 FucT 및 XylT 발현에 대한 RNAi 저해
여러가지 RNAi 전략을 수행하여 렘나 FucT 및 XylT 이소형들의 발현을 저해하였다. 도 5-7, 33 및 34에 이러한 전략을 개괄적으로 나타낸다. 도 8-13에는 이들 2종의 유전자의 발현의 바람직한 낫아웃을 달성하기 위해 제조된 다양한 구조체들의 맵을 나타낸다. 다양한 낫아웃 RNAi 구조체를 포함하는 다수의 형질전환주들은 전술한 표준 형질전환 프로토콜을 이용하여 제조하였다.
본원에서 mAbI이라고 명시한 테스트 항체를 천연의 당화 장치를 가지고 있는 야생형 렘나와, 렘나 마이너의 XylT 및 FucT 이소형의 발현을 저해하도록 되어 있는 RNAi 구조체를 발현하는 렘나 형질전환주에서 발현시켰다. 일반적으로, 3종의 바이너리 벡터를 렘나 시스템에서 mAbI 발현을 위해 제조하였다. 발현 벡터 mAbI01은 mAbI의 중쇄(H) 및 경쇄(L)를 코딩하는 최적화된 유전자를 포함하고 있으며; 벡터 mAbI04는 mAbI H 및 L 체인을 코딩하는 최적화된 유전자와 XylT 및 FucT 이소형 둘다의 발현을 표적화하는 키메라 RNAi 구조체를 포함하고 있으며; 및 벡터 mAbI05는 mAbI H 및 L 체인을 코딩하는 최적화된 유전자, FucT 유전자 발현을 표적화하는 단일-유전자 RNAi 구조체, 및 XylT 유전자 발현을 표적화하는 단일-유전자 RNAi 구조체를 포함하고 있다. mABI01, mABI04 및 mABI05에 대해 독립적인 형질전환주들을 제조하였다.
mAbI H 및 L 체인에 대해 최적화된 유전자는 렘나 선호 코돈 관례(Lemna preferred codon usage)(63% - 67% GC 함량)에 따르며, 이의 코딩 서열의 5' 말단에 융합된 쌀 α-아밀라제 신호 서열(GenBank M24286)을 포함하도록, 제작되었다. 아가로박테리움 바이너리 벡터로 클로닝하기 위해 제한 엔도뉴클레아제 부위를 추가하였다(EcoRI (5') / SacI (3'), 중쇄) 및 (SalI (5') / HindIII (3'), 경쇄).
도 15-17에 나타낸 XF02 데이타와 도 22-24 및 26의 mAbI04 데이타에서, 후술되는 바와 같이, 렘나 마이너의 FucT 및 XylT 이소형들의 발현을 저해하기 위한 RNAi 전략에서는 도 34에 나타낸 키메라 RNAi 디자인을 사용하였다. 도 27에 나타낸 mAbI05 데이타에서, 후술되는 바와 같이, 렘나 마이너의 FucT 및 XylT 이소형들의 발현을 저해하기 위한 RNAi 전략은 도 5(FucT RNAi design) 및 도 33(XylT RNAi design)에 나타낸 단일 유전자 RNAi 디자인의 조합을 이용한 이들 유전자의 이중 낫아웃을 사용하였다.
최적화된 mAbI H 및 L 체인과 단일 유전자 또는 키메라 RNAi에 대한, 프로모터, 원하는 유전자 및 Nos 종결자를 포함하는 독립적인 발현 카세트를 만들었다. 발현 카세트를 아그로박테리움 바이너리 벡터의 변형, pBMSP3(Dr. Stan Gelvin, Purdue University)에 적절한 제한 부위를 사용하여 클로닝하였다. 발현 카세트에 따라, 경쇄를 렘나 지바 5' RbcS 리더(mAbI01, 도 14)를 갖춘 변형된 옥토핀 및 만노핀 신타제 키메라 프로모터, 또는 고발현의, 구성적인(constitutive) 렘나 마이너의 폴리유비퀴틴 프로모터(LmUbq)(mAbI04, 도 12; mAbI05; 도 13) 중 어느 하나에 융합하였다. 중쇄는 렘나 지바 5' RbcS 리더 (mAbI04, mAbI05, 및 mAbI01)를 갖춘 변형된 옥토핀 및 만노핀 신타제 키메라 프로모터에 융합하였다. T7-4에서 플라스미드 XF02로부터 취한 키메라 RNAi 카세트를, 고발현의 구성적인 스피로델라 폴리리자 폴리유비퀴틴 프로모터(SpUbq)에 융합하였다. FucT 저해성 서열을 발현하기 위한 단일 유전자 RNAi 구조체는 SpUbq 프로모터에 의해 구현되며, XylT 저해성 서열을 발현하기 위한 단일 유전자 RNAi 구조체는 렘나 에퀴녹티알리스의 유비퀴틴 프로모터 + 5' UTR(LaUbq 프로모터)를 포함하는 작동가능하게 연결된 발현 조절 요소에 의해 구현된다. H, L 및 키메라 RNAi 발현 카세트를 직렬로, 변형된 pBMSP3 바이너리 벡터에 클로닝하여, 플라스미드 mAbI04를 만들었다. FucT 및 XylT 발현을 타겟팅하는 H, L 및 단일 유전자 RNAi 발현 카세트를 변형된 pBMSP3 바이너리 벡터에 클로닝하여, 플라스미드 mAbI05를 만들었다. H 및 L 발현 카세트를 변형된 pBMSP3 바이너리 벡터에 클로닝하여, 플라스미드 mAbI01을 만들었다.
임의의 형질전환 프로토콜을 전술한 바와 같이 사용할 수 있지만, 일 예로, 형질전환 프로토콜은 다음과 같다. 2 암의, 숙주 범위가 넓은 C58 균주인 아그로박테리움 투메픽시엔스 C58Z707을 이용하여(Hepburn et al . (1985) J. Gen . Microbiol . 131:2961-2969), 개별 클론 주를 나타내는 형질전환 식물들을 야마모토 등 (2001) In Vitro Cell Dev . Biol . Plant 37:349-353의 공정에 따라 빠르게 생장하는 렘나 마이너 결절로부터 제조하였다. 형질전환 스크리닝으로, 개별 클론 주를 자당이 함유되지 않은 SH 배지(Schenk and Hildebrandt (1972) Can . J. Botany 50:199-204)가 든 통풍구가 있는 식물 배양 바셀에서 150 - 200 μmol m-2s-2로 1주간 미리 조건을 형성시켰다. 15-20개의 미리 조건화한 엽상체를 신선한 SH 배지가 든 통풍구가 있는 용기로 옮겨, 2주간 배양하였다. 각 주의 조직 및 배지 샘플을 동결시켜, -70 ℃에 저장하였다.
렘나 마이너 β-1,2-자일로실트랜스퍼라제(XylT) 및 α-1,3-푸코실트랜스퍼라제(FucT)의 활성을 측정하기 위해, MALDI-TOF 분석을 개발하였다(하기 실시예 3).
도 15-17은 전술한 분석 방법을 이용하여 XF02, mAbII04, 및 mAbI05 식물 주로부터 수득한 일차 스크리닝 데이타이다. 본 분석에서, WT (야생형)는 야생형 식물에서의 FucT 및 XylT의 활성이고, BWT(끓인 야생형)는 끓인 식물 추출물에서의 이들의 활성이다. 끓인 야생형 (BWT) 식물 추출물은 FucT 및 XylT의 활성이 없어진 식물 물질의 예이다. 이러한 데이타 세트는, 각 구조체의 식물 주 수종이 야생형 식물 주(WT)에 비해 감소된, 그리고 끓인 야생형 샘플(BWT)에 상응하는 수준의 FucT 및 XylT 활성을 가지는 것으로 나타났다.
구체적으로, 도 10의 XF02 구조체를 포함하는 형질전환 RNAi 렘나 마이너 식물 주의 일차 스크리닝 데이타를 도 15 및 16에 나타낸다. XF02 구조체는 각각의 단백질의 다양한 이소형을 포함하여, 렘나 마이너의 FucT 및 XylT 단백질 둘다의 발현을 타겟으로 하는 키메라 RNAi 분자를 발현한다.
도 17은 도 12의 mAbI04 구조체 및 도 13의 mAbI05를 포함하는, 형질전환 RNAi 렘나 마이너 식물 주의 일차 스크리닝 데이타이다.
실시예 3: N- 글리칸 β-1,2- 자일로실트랜스퍼라제 ( XylT ) 및 α-1,3-푸코실트 랜스퍼라제( FucT ) 활성에 대한 MALDI - TOF 분석
하기 변형된 MALDI-TOF 분석으로, 상기 실시예 2에서 언급한 형질전환 식물에서의 XylT 및 FucT의 활성을 결정하였다.
재료
동질화 완충액: 50 mM HEPES, pH 7.5, 0.25 M 자당, 2 mM EDTA, 1 mM DTT.
반응 완충액: 0.1 M Mes, pH 7.0, 10 mM MnCl2, 0.1% (v/v) Triton X-100.
우리딘-5'-다이포스포-D-자일로스(UDP-Xyl)
구아노신-5'-다이포스포-L-푸코스(GDP-Fuc)
N-아세틸글루코사민
폴리에틸렌 글리콜(PEG) 혼합물 1000-3000 (10 mg/mL PEG 1000, 2000, 및 3000 (4:5:6 비), 2 mg/mL 소듐 요오드화물과 4:1로 혼합).
[Glu1]-파이브리노펩타이드 B (GFP), 인간(1 pmol/㎕, 수중)
뎁실화된(DABSYLATED), 테트라펩타이드, N-글리칸 어셉터(EMD Biosciences)
CHCA(α-시아노-4-하이드록시신나믹산) 매트릭스(50% [v/v] 아세토니트릴, 0.05% [v/v] 트리플루오로아세트산 중의 10 mg).
미소좀 준비
렘나 마이너 조직(100 mg)을 비드 밀내 차가운 동질화 완충액 1 mL 중에서 40초간 5x 속도로 배양하였다. 동질물을 5분간 4 ℃에서 1,000g로 회전시켰다. 상층물을 취하여 4 ℃에서 2시간 동안 18,000g로 회전시켰다. 상층물을 버렸다. 펠렛은 차가운 반응 완충액 20 ㎕에 재현탁한 다음, 얼음에 두거나 사용하기 전까지 -80℃에 보관하였다.
반응 조건
반응 믹스는 125 mM N-아세틸글루코사민, 6.25 mM UDP-Xyl, 6.25 mM GDP-Fuc, 12.5 mM MnCl2, 및 1.5 nmol of 뎁실화된 테트라펩타이드 N-글리칸 어셉터를 포함한다. 미소좀(4 ㎕)을 상기 반응 믹스에 넣어 반응을 개시하였다. 반응물은 실온에서 30분간 두고, 37 ℃에 90분간 두었다. 1분간 18,000g로 원심분리하여 반응을 종결한 다음 4 ℃에 인큐베이션하였다.
MALDI - TOF 분석
각 반응물의 상층액 일부(0.5 ㎕)를 MALDI 타겟 플레이트 상에서 CHCA 매트릭스 0.5 ㎕과 혼합하고, 건조시켰다. MALDI 장치를 리플렉톤 양이온 모드(reflectron positive ion)로 세팅하고, PEG 1000-3000로 보정하였다. 조합된 MS 스펙트럼(~200 shots)을 잠금 질량(lock mass)으로서 0.5 pmol GFP을 이용하여 1500-2500 Da로부터 취하였다. 기준 피크의 이온 카운트(m/z = 2222.865)는 400 보다 높아야 한다. XylT 및 FucT 산물의 이온 카운트(각각 m/z = 2192.854 및 2206.870)를, 미소좀 분획의 단백질 농도와 기준 피크로 표준화하였다.
실시예 4: 단일클론 항체의 당화 파일에서 렘나 마이너의 FucT 및 XylT 발현의 RNAi 저해 효과
mAbI01 구조체(도 14)를 포함하는 야생형(즉, FucT 및 XylT의 발현이 침묵화 되지 않은) 렘나 마이너와, mAbI04 구조체(도 12) 또는 mAbI05 구조체(도 13)에 대한 렘나 마이너 형질전환주에서 생산되는 단일클론 항체를, N-당화 프로파일에 대해 분석하였다. 다음의 공정으로 실시하였다.
렘나로부터 mAb 정제
Silverson High Shear Mixer로, 50mM 소듐 포스페이트, 0.3M 소듐 클로라이드 및 10mM EDTA, pH 7.2을 조직 : 완충액 비를 1:8으로 사용하여 식물 조직을 동질화하였다. 동질물은 1 M 시트르산으로 pH4.5로 산성화한 다음 4 ℃에서 50분간 7,500 x g로 원심분리하였다. 상층액을 0.22㎛ 필터로 여과하고, 50mM 소듐 포스페이트, 0.3M 소듐 클로라이드 및 10mM EDTA, pH 7.2를 포함하는 용액으로 평형화한 mAbSelect SuRe resin (GE Healthcare)에 직접 주입하였다. 주입한 후, 컬럼은 평형 완충액으로 베이스라인으로 헹구고, 컬럼 부피의 5배의 0.1M 소듐 아세테이트, pH 5.0로 중간 헹굼을 한 다음, 컬럼 부피의 10배의 0.1M 소듐 아세테이트, pH 3.0으로 용출시켰다. 용리액은 즉시 2M 트리스 염기로 중화하였다.
N-연결된 글리칸의 정제
야생형 및 RNAi 렘나 마이너 식물주로부터 유래된 단백질 A-정제된 단일클론 항체(1 mg)를 물로 광범위로 투석한 다음 동결건조하여 건조시켰다. 샘플을 5% (v/v) 포름산 100 ㎕에 재현탁하고, 0.05 mg/mL 펩신을 첨가하여 하룻밤동안 37 ℃에 두었다. 샘플을 10분간 95 ℃에서 불활성화한 다음 건조하였다. 펩신 소화물을 100 mM 소듐 아세테이트, pH 5.0 100 ㎕에 재현탁하여, 37 ℃에서 하룻밤동안 N-글리코시다제 A 1 mU와 함께 인큐베이션하였다. 분리된 N-글리칸을 Packer et al . (1998) Glycoconj . J. 15: 737-747에 따라 4 cc Carbograph SPE 컬럼으로 분리한 다음 건조하였다.
건조된 N-글리칸을 1 cc Waters Oasis MCX 카트리지를 이용하여 더욱 정제하였다. 컬럼 부피의 3배에 해당하는 메탄올과 이어 3배의 5% (v/v) 포름산으로 컬럼을 헹구어 준비하였다. 5% (v/v) 포름산 1 mL에 재현탁된 N-글리칸을 준비한 컬럼에 주입하였다. 비결합 분획과 컬럼 부피의 2배의 5% (v/v) 포름산에 의한 세정물을 채집하고, 모아, 건조하였다.
2- 아미노벤조산(2-AA)를 이용한 올리고당의 유도체화
정제된 N-글리칸 또는 말토올리고당을 2-AA와 함께 주입하고, Anumula and Dhume (1998) Glycobiology 8: 685-694에 따라 1 cc Waters Oasis HLB 카트리지를 이용하여 정제하였다. 표지된 N-글리칸 및 말토올리고당을 물 50 ㎕에 재현탁하여, MALDI-TOF MS 및 정상 상(NP) HPLC-QTOF MS로 분석하였다.
MALDI - TOF 질량 측정.
MALDI-TOF MS를 Waters MALDI Micro MX (Millford, MA)를 이용하여 수행하였다. 2-AA 표지된 N-글리칸 (0.5 ㎕)을 물로 적절하게 희석하고, 70% (v/v) 아세토니트릴 중의 10 mg/mL DHB 매트릭스 0.5 ㎕와 혼합한 다음 타겟 플레이트에 점을 찍고, 네거티브 리플렌트론 모드로 분석하였다.
2- AA 표지된 N- 글리칸의 NP - HPLC -Q- TOF MS 분석.
2-AA 표지된 N-글리칸 또는 말토올리고당을 80% (v/v) 아세토니트릴에 첨가하여, TSK-Gel Amide-80 (2 mm x 25 cm, 5㎛) 컬럼(Tosoh Biosciences, Montgomeryville, PA)이 구비된 Waters 2695 HPLC 시스템으로 분리하였다. 2-AA 표지된 탄수화물을 검출하고, HPLC 시스템이 일직선으로 구비된 Waters Q-TOF API US quadropole-time of Flight (Q-TOF) 질량 측정기(Millford, MA)와 Waters 2475 형광 검출기로 형광(230 nm 여기, 425 nm 방사)을 분석하였다.
분리는 10 mM 암모늄 아세테이트, pH 7.3 (용매 A) 및 10 mM 암모늄 아세테이트, pH 7.3, 80% (v/v) 아세토니트릴 (용매 B)를 이용하여 0.2 mL/min으로 수행하였다. 샘플 용리는 0% A 정조성으로 5분간 진행하고, 8분에 10% A로 선형 증가시킨 다음 48분에 30% A로 선형 증가시켜, 진행하였다. 컬럼은 15분간 100% A로 세정하고, 다음 샘플을 주입하기 전에 15분간 0% A로 평형화하였다.
Q-TOF 분석을 소스 및 각각 100℃ 및 300℃의 탈용매(desolvation) 온도로 네거티브 이온 모드에서 수행하였으며, 모세 및 콘 전압(cone voltage)은 각각 2,100 및 30 V를 사용하였다. 나타낸 질량 스펙트럼은, 표지된 N-글리칸 당 >50의 각각의 스캔을 조합한 결과이다.
온전한( intact ) IgG RP - HPLC -Q- TOF MS 분석
단백질 A로 정제한 IgG(50 ㎍)를 Poros R1-10 컬럼(2 mm x 30 mm; Applied Biosystems)이 구비된 Waters 2695 HPLC 시스템을 이용하여 탈염하였다. IgG를 검출하고, Waters 2487 듀얼 파장 UV 검출기(280 nm) 및 Waters Q-TOF API US를 이용하여 분석하였다. 분리는 0.05% (v/v) 트리플루오로아세트산 (TFA; 용매 A) 및 0.05% (v/v)TFA, 80% (v/v) 아세토니트릴 (용매 B)을 이용하여 0.15 mL/min, 60℃에서 수행하였다. 샘플 용리는 5분간 30 -> 50% B로의 선형 증가, 5분간 80% 로 증가에 의해 수행하였다. 용매 비율은 4분간 더 80% B로 유지한 다음 1분간 100% B로 세정한 다음, 다음번 운영을 하기 전에 15분간 30% B로 컬럼을 평형화하였다.
Q-TOF 분석을 소스 및 각각 100℃ 및 300℃의 탈용매(desolvation) 온도로 네거티브 이온 모드에서 수행하였으며, 모세 및 콘 전압(cone voltage)은 각각 3.0 및 60 V를 사용하였다. 데이타는, 표지된 N-글리칸 당 >100의 각각의 스캔을 조합하고, MaxEnt 1을 이용하여 모체 질량 스펙트럼으로 디컨볼루션(deconvolution)한 결과이다.
또한, Triguero et al . (2005) Plant Biotechnol . J. 3: 449-457; Takahashi et al . (1998) Anal . Biochem . 255: 183-187; Dillon et al . (2004) J. Chromatogr . A. 1053: 299-305를 참조한다.
결과.
도 18은 유도체화된 야생형 렘나 마이너 단일클론 항체 N-글리칸의 구조와 분자량을 나타낸다.
도 19는 렘나 마이너 FucT 및 XylT의 RNAi 억제없이, 렘나 마이너에서 mAbI 단일클론 IgG1 항체의 발현을 제공하는 야생형 mAbI01 구조체(도 15)가, β1,2-자일로스를 가지는 종과 β1,2-자일로스와 코어 알스 잔기 둘다 가지는 종을 포함하는, 3가지 주된 N-글리칸 종이 나타나는 N-당화 프로파일을 보임을 나타낸 것으로, 이 프로파일은 LC-MS(liquid chromatography mass spectrometry)(도 20) 및 MALDI (도 21) 분석으로 검증한 것이다.
도 22는, mAbI01 구조체(또는 XylT의 억제 없음)를 포함하는 야생형 렘나 마 이너 주 및 도 12의 mAbI04 구조체를 포함하는 2가지 형질전환 렘나 마이너주에서 생산되는 mAbI의 다양한 N-글리칸 종의 상대적인 양을 중첩(overlay)하여 나타낸 것이다. GnGn (즉, G0) 글리칸 종의 농화, 부착된 β1,2-자일로스 또는 코어 α1,3-푸코스 잔기가 없고, 그리고 β1,2-자일로스, 또는 β1,2-자일로스 및 코어 α1,3-푸코스 잔기 둘다를 가진 종의 부재를 주지한다. 이러한 프로파일 질량 측정(LC-MS)(도 23) 및 MALDI (도 24) 분석으로 검증하였다.
도 25는 mAbI01 구조체를 포함하는 야생형 렘나 마이너(주 20)에서 생산되는 mAbI 조성물의 무가공 질량 분석(intact mass analysis)을 나타낸 것이다. FucT과 XylT의 발현이 렘나 마이너에서 억제되지 않은 경우, 재조합으로 생산된 mAbI 조성물은 이질적이며, 최소 9개 이상의 서로 다른 글리코형을 포함하며, G0XF3가 우세적인 종으로 존재한다. GO 글리코형을 나타내는 매우 작은 피크들을 주지하라.
도 26은 도 12의 mAbI04 구조체를 포함하는 렘나 마이너 형질전환주(line 15)에서 생산된 mAbI 조성물의 무가공 질량 분석을 나타낸 것이다. FucT과 XylT 발현이 키메라 RNAi 구조체를 사용하여 렘나 마이너에서 억제되었을 때, 온전한 mAbI 조성물은 실질적으로 GO N-글리칸에 동질적이며, N-글리칸 전구체(GnM 및 MGn 전구체 글리칸 종임)는 미량으로만 존재한다. 아울러, mAbI 조성물은 GO글리코형에 실질적으로 동질적인데, 여기서 당화 부위 양쪽 모두 GO N-글리칸 종이 점유하고 있으며, 미량의 글리코형 전구체를 나타내는 작은 피크 3개가 있다(피크 하나는 중쇄 CH2 도메인이 Asn 297에 부착된 GO 글리칸 종을 가지며 다른 중쇄의 CH2도메인 이 당화되지 않은, Fc 영역을 가지고 있는 mAbI이고; 다른 피크는 하나의 중쇄의 CH2 도메인이 Asn 297에 부착된 GO 글리칸 종을 가지며 다른 중쇄의 CH2도메인은 Asn 297에 부착된 GnM 또는 MGn 전구체 글리칸을 가지고 있는, Fc 영역을 가지고 있는 mAbI이고; 다른 피크는 각 CH2 도메인 상의 Asn 297 당화 부위에 부착된 GO 글리칸 종이 있으며 mAbI 구조내 다른 당화 부위에 3번째 GO 글리칸 종이 부착되어 있는, Fc 영역을 가지고 있는 mAbI임).
도 27은 도 13의 mAbI05 구조체를 포함하는 렘나 마이너 형질전환주(주 72)에서 생산된 mAbI 조성물의 무가공 질량 분석을 나타낸 것이다. FucT과 XylT 발현이 상기 구조체를 사용하여 렘나 마이너에서 억제되었을 때, 온전한 mAbI 조성물은 실질적으로 GO N-글리칸에 대해 동질적이며, N-글리칸 전구체(GnM 및 MGn 전구체 글리칸 종임)는 미량으로만 존재한다. 아울러, mAbI 조성물은 GO 글리코형에 대해 실질적으로 동질적(적어도 90%)이며, mAbI04 구조체로 수득되는 바와 같이 글리코형 전구체를 나타내는 작은 피크 3개가 있다.
mAbI01 구조체를 포함하는 야생형 렘나 주(즉, FucT 및 XylT의 발현이 억제되지 않음) 및 mAbI04 또는 mAbI05 구조체를 포함하는 렘나 형질전환주(즉, FucT 및 XylT의 발현이 억제됨)에서 생산되는 mAbI의 수용체 결합 활성을, 포유류 세포주(CHO 및 SP2/0)에서 생산되는 mAbI의 수용체 결합 활성과 비교하였다.
갓 분리한 인간 NK 세포상의 FcFcγRIIIa에 대한 결합을 여러가지 mAbI 산물에서 조사하였다. CHO-유래 mAbI 및 SP2/0-유래 mAbI에 대해 수집한 대조군 데이 타를 도 35에 나타낸다. 정상적인 식물 N-글리칸 프로파일을 가지는 야생형 렘나에서 생산되는 mAbI에서 수집한 시험 데이타를 mAbI01-15 및 mAbI01-20이라고 명기하였고, 여기에서 mAbI 산물은 α1,3-푸코스 잔기를 포함하는 N-연결된 글리칸을 가진다(도 36 및 37). α1,3-푸코실트랜스퍼라제의 발현을 표적화하는 유전자-침묵화 RNAi 구조체를 이용하여 수득한, 최적화된 N-글리칸 프로파일(OPT)를 가지는 형질전환된 렘나-유래의 mAbI에서 수집한 시험 데이타는, mAbI05-72, mAbI05-74, mAbI04-24, 및 mAbI04-15로 명기하였으며(도 36 및37), 여기에서 mAbI 산물은 α1,3-푸코스가 없는 N-연결된 글리칸을 가지고 있다. 인간 FcγRIIIa의 대행제(surrogate)로 제공되며 IgG 푸코스 수준에 민감한 수용체인, 재조합 마우스 FcγRIV에 대한 mAbI01-15, mAbI01-20, mAbI SP2/0, mAbI04-15, mAbI04-24, mAbI05-72, 및 mAbI05-74의 결합 효과를 비교하는 데이타는 도 38에 나타낸다.
이들 데이타는, 최적화된 글리칸 프로파일(OPT)을 갖는 형질전환된 렘나 유래의 mAbI 산물이 야생형 렘나 유래의 mAbI 산물에 비해 갓 분리된 인간 NK 세포 상의 FcγRIIIa에 대해 강화된 결합성(약 20 - 50배 증가)을 보일 뿐만 아니라, 재조합 마우스 FcγRIV에 대해 강화된 결합성(약 10배 증가)을 보임을 입증한다.
실시예 6: 개선된 수용체 결합성 및 증가된 ADCC 활성을 가지는 항- CD30 단일클론 항체의 생산
본 실시예는 렘나에서 인간 항-CD30 mAb의 발현을 개략한다. 항-CD30 mAb 당화의 최적화를, mAbI에 대한 상기 실시예에서 언급한 방법과 유사한 방법으로, α-1,3-푸코실트랜스퍼라제(FucT) 및 β-1,2-자일로실트랜스퍼라제(XylT) 유전자의 내인성 발현을 타겟팅하는 RNAi 구조체와 함께 공동-발현함으로써 달성하였다. FucT 및 XylT 발현을 억제하도록 조작된 천연적인 당화 장치를 가지고 있는 렘나에서 생산되는 수득한 항-CD30 mAb에는, 하나의 주된 N-글리칸 종이 포함되어 있었지만, 식물 특이적인 N-글리칸은 미량으로도 존재하지 않았다. N-글리칸 동질화 이외에도, 글리코-최적화된 항-CD30 mAb는 또한 항체 의존적인 세포 매개성 세포독성(ADCC)과 작동자 세포 수용체 결합 활성이 CHO에서 발현시킨 항-CD30 mAb에 비해 강화된 것으로 확인되었다.
방법
균주 및 시약
노바블루(Novablue) 컴피턴트 에스케이차 콜리 세포를 모든 재조합 DNA 작업에 사용하였다(EMD Biosciences, San Diego, CA). 제한 엔도뉴클레아제 및 DNA 변형 효소는 New England Biolabs (Ipswich, MA)에서 구입하였다. Integrated DNA technologies (Coralville, IA)로부터 올리고뉴클레오타이드를 수득하였다. Waters Oasis HLB 및 MCX 컬럼(1 cc), 2,5-디하이드록시벤조(DHB), 및 α-시아노-4-하이드록시신남산(CHCA)은 Waters Corporation (Milford, MA)에서 구입하였다. 정제된 뎁실화된 테트라펩타이드, GnGn N-글리칸 어셉터(GnGn-답실-펩타이드)와 N-글리코시다제 A는 EMD Biosciences에서 구입하였다. Carbograph SPE 컬럼(4 cc)은 Grace Davidson Discovery Sciences (Deerfield, IL)에서 구입하였다. 우리딘-5'-디포스포-D-자일로스(UDP-Xyl)는 Carbosource Services (Athens, GA)에서 구입하였다. 아세토니트릴 (Optima grade)은 Fisher Scientific (Summerville, NY)에서 구 입하였다. 암모늄 아세테이트는 MP Biochemicals (Irvine, CA)에서 구입하였다. 말토올리고당 (MD6-1)은 V-Labs Inc. (Covington, CA)에서 구입하였다. 단당류 표준물질은 Dionex (Sunnyvale, CA)에서 구입하였다. BATDA(비스(아세트옥시메틸)2,2':6',2''-테르피리딘-6,6''-디카르복실레이트) 및 유러퓸 용액은 Perkin-Elmer(Wellesley, MA)에서 구입하였다. 구아노신-5'-디포스포-L-푸코스 (GDP-Fuc), N-아세틸글루코사민 (GlcNAc), 2-아미노벤조산(2-AA) 및 그외 모든 물질들은 Sigma (St. Louis, MO)에서 구입하였다.
mAb RNAi 발현 구조체의 구축
형질전환 Medarex HuMAb-Mouse®(Borchmann et al . (2003) Blood 102:3737-3742)으로부터 유래된 완전한 인간의 mAb1 카파 항체 MDX-060의 중쇄(H) 및 경쇄(L) 가변성 영역의 cDNA 서열을 표준 기법을 이용하여 중국 햄스터 난소 세포주, CHO- DG44 (Urlaub et al . (1986) Cell Mol . Genet . 12:555-566)에서 재조합으로 생산하였다. 렘나 선호 코돈 관례(GC 함유율 63-67%)에 따르며, 코딩 서열의 5' 말단에 융합된 벼의 α-아밀라제 신호 서열(GenBank M24286)을 포함하도록, 중쇄 및 경쇄에 대한 최적화된 유전자를 제작하였다. 아그로박테리움 바이너리 벡터로 클론닝하기 위해 제한 엔도뉴클레아제 부위(EcoRI (5') / SacI (3'), 중쇄) 및 (SalI (5') / HindIII (3'), 경쇄)를 추가하였다. 합성 유전자는 Picoscript (Houston, TX)에서 제조 및 구입하였다.
α-1,3-푸코실트랜스퍼라제(서열번호 2의 렘나 마이너 FucT 이소형 #1 코딩 서열을 기초로 하며, GenBank DQ789145를 참조함) 및 β-1,2-자일로실트랜스퍼라제(서열번호 19의 nt 1-1275 및 서열번호 20의 렘나 마이너 XylT 이소형 #2 코딩 서열을 기초로 하며, GenBank DQ789146을 참조함)을 코딩하는 내인성 렘나 유전자의 침묵화를 타겟으로 하기 위한 키메라 헤어핀 RNA(도 34)를 제작하였다. 키메라 FucT + XylT 헤어핀 RNA는 이중 가닥의 FucT 서열 602 bp, 이중 가닥의 XylT 서열 626 bp, 및 스페이서 서열 500 bp를 포함하도록 제작하였다. 헤어핀 RNA 카세트의 센스 가닥 부분은 FucT 정방향 단편(서열번호 2의 nt 12-613, 서열번호 1의 254-855과 등가임) 및 XylT 정방향 단편(서열번호 19의 nt 1-626), 스페이서 서열(서열번호 19의 nt 627-1126)를 포함한다. 헤어핀 RNA의 안티센스 가닥 부분은 XylT 역방향 단편(서열번호 19 nt 1-626의 안티센스 버전) 및 FucT 역방향 단편(서열번호 2 nt 12-613 또는 서열번호 1 nt 254-855의 안티센스 버전)을 포함한다. 키메라 헤어핀 RNA는 렘나 마이너 (8627) cDNA로부터 XylT 및 FucT의 정방향 및 역방향 유전자 단편을 PCR 증폭시키고, 이어 이를 pT7blue (EMD Biosciences)에 클로닝하여 플라스미드 XF02를 T7-4에서 제조하였다. FucT 정방향 유전자 단편은 DNA 프라이머 BLX 686 (5'-ATGGTCGACTGCTGCTGGTGCTC TCAAC-3')(서열번호 22) 및 BLX690 (5'- ATGTCTAGAATG CAGCAGCAAGTGCACC-3')(서열번호 23)로 증폭하여, 말단에 SalI (5') 및 XbaI (3') 클로닝 부위가 있는 620 bp 산물을 만들었다. XylT 정방향 유전자 단편은 DNA 프라이머 BLX 700 (5'-ATGACTAGTTGC GAAGCCTACTTCGGCAACAGC3')(서열번호 24) 및 BLX694 (5'-ATGGGATCCGAATCTCAAGA ACAACTGTCG-3')(서열번호 25)로 증폭하여, 말단에 SpeI (5') 및 BamHI (3') 클로닝 부위가 있는 1144 bp를 만들었다. XylT 역방향 유전자 단편은 DNA 프라이머 BLX 695 (5'-ATGGGTACCTGCGAAGCCTACTTCGGCAA CAGC-3')(서열번호 26) 및 BLX696 (5'- ATGGGA TCCACTGGCTGGGAGAAGTTCTT-3')(서열번호 27)로 증폭시켜 말단에 BamHI (5') 및 KpnI (3') 클로닝 부위가 있는 644 bp 산물을 만들었다. FucT 역방향 유전자 단편은 DNA 프라이머 BLX 691 (5'- ATGGAGCTCTGCTGCTGGTGCT CTCAAC-3')(서열번호 28) 및 BLX692 (5'- ATGGGTACCATGCAGCAGCAAGTGCACC-3')(서열번호 29)로 증폭하여, 말단에 KpnI (5') 및 SacI(3') 클로닝 부위가 있는 620 bp 산물을 만들었다.
프로모터, 목적 유전자 및 Nos 종결자를 포함하는 독립적인 발현 카세트를 최적화된 MDX-060 경쇄 및 중쇄, 그리고 키메라 RNAi에 대해 만들었다. 발현 카세트는 적절한 제한 부위를 이용하여 아그로박테리움 바이너리 벡터 변형체 pBMSP3 (Dr. Stan Gelvin, Purdue University)에 클로닝하였다. 중쇄는 렘나 지바 5' RbcS 리더 (Gasdaska et al . (2003) Bioprocessing J. 50-56)가 있는 변형된 키메라 옥토핀 및 만노핀 신타제 프로모터에 융합시켰다. 경쇄는 고발현성의 구성적인 렘나 마이너 폴리유비퀴틴 프로모터(LmUbq)에 융합시켰다. T7-4에서 플라스미드 XF02로부터 취한 키메라 RNAi 발현체는 고발현성의 구성적인 스피로델라 폴리리자 폴리유비퀴틴 프로모터(SpUbq)에 융합시켰다.
형질전환 및 식물 주의 스크리닝
각 클론 주를 나타내는 형질전환 식물들을 야마모토 등 (2001) In Vitro Cell Dev. Biol . Plant 37:349-353의 공정에 따라 빠르게 생장하는 렘나 마이너 결절로부터 제조하였다. 형질전환 스크리닝으로, 개별 클론 주를 자당이 함유되지 않은 SH 배지(Schenk and Hildebrandt (1972) Can. J. Botany 50:199-204)가 든 통풍구가 있는 식물 배양 바셀에서 150 - 200 μmol m-2s-2로 1주간 미리 조건을 형성시켰다. 15-20개의 미리 조건화한 엽상체를 신선한 SH 배지가 든 통풍구가 있는 용기로 옮겨, 2주간 배양하였다. 각 주의 조직 및 배지 샘플을 동결시켜, -70 ℃에 저장하였다.
렘나에서 생산되는 mAb ELISA 분석.
렘나 조직(100 mg)을 FastPrep FP120 비드 밀(Thermo Electron Corporation)을 이용하여 동질화하였다. 상층액은 1 ㎍/mL로 희석한 다음 IgG 정량 ELISA 키트(Bethyl Laboratories)로 분석하였다. 본 분석을 위해, 10 ㎍/mL 농도로 염소 항-인간 IgG로 마이크로타이터 플레이트를 코팅하고, 호르세라디쉬 페록시다제(HRP)-접합된 염소 항-인간 IgG 1:100,000 희석물에 의해 mAb를 검출하였다. ELISA 키트에 제공된 인간 기준 IgG로 표준 곡선을 그렸다. ELISA의 민감도는 7.8 ng/mL이었다. 모든 샘플은 이배수로 분석하였다.
렘나 미소좀 막 제조 및 코어 β-1,2- 자일로실트랜스퍼라제 및 α-1,3- 푸코실트랜스퍼라제 활성 분석
각 식물주로부터 취한 렘나 조직(100 mg)을 차가운 동질화 완충액(50 mM 4-[2-하이드록시에틸]-1-피페라진에탄설폰산[HEPES], pH 7.5, 0.25 M 자당, 2 mM 에틸렌디아민테트라아세트산[EDTA], 1 mM 1,4-디티오트레이톨[DTT]) 1 mL 중에서 40초간 FastPrep FP120 비드 밀(Thermo Electron Corporation, Waltham, MA)에서 동 질화하였다. 동질물을 5분간 4 ℃에서 1,000g로 원심분리하였다. 상층물을 취하여 4 ℃에서 90분간 18,000g로 원심분리하였다. 수득되는 펠렛은 차가운 반응 완충액(0.1 M 2-[4-모르폴리노]메탄설폰산[Mes], pH 7.0, 0.1% [v/v] 트리톤 X-100, 10 mM MnCl2) 20 ㎕에 재현탁한 다음, 얼음에 두거나 사용하기 전까지 -80℃에 보관하였다.
코어 β-1,2-자일로실트랜스퍼라제 및 α-1,3-푸코실트랜스퍼라제 활성은, 종래 방법((Leiter et al . (1999) J. Biol . Chem . 274:21830-21839))에 따라 125 mM GlcNAc, 6.25 mM UDP-Xyl, 6.25 mM GDP-Fuc, 12.5 mM MnCl2, 및 1.5 nmol의 GnGn-답실-펩타이드 어셉터와 2시간동안 37 ℃에서 인큐베이션함으로써, 각 RNA 라인으로부터 준비한 미소좀 막 4 ㎕ 중에서 동시에 측정하였다. 반응은 간단한 원심분리로 종결시키고 4 ℃에 인큐베이션한 다음, 포지티스 레플렉트론 모드의 MALDI-TOF MS로 산물을 분석하였다.
MDX -060 LEX LEX Opt mAb 의 정제.
식물 조직을 Silverson high shear 믹서를 이용하여 50 mM 소듐 포스페이트, 0.3 M 소듐 클로라이드 및 10 mM EDTA, pH 7.2으로 동질화하였다. 동질물은 1 M 시트르산으로 pH4.5로 산성화한 다음 4 ℃에서 30분간 7,500 x g로 원심분리하였다. 상층액의 pH를 2 M Tris로 pH7.2로 조절한 다음 0.22㎛ 필터로 여과하였다. 여과 물은 50mM 소듐 포스페이트, 0.3M 소듐 클로라이드 및 10mM EDTA, pH 7.2를 포함하는 용액으로 평형화한 mAbSelect SuRe 단백질 A 수지 (GE Healthcare)에 직 접 주입하였다. 주입한 후, 컬럼은 평형 완충액으로 베이스라인으로 헹구고, 컬럼 부피의 5배의 0.1M 소듐 아세테이트, pH 5.0로 중간 헹굼을 하였다. 컬럼 부피의 10배의 0.1M 소듐 아세테이트, pH 3.0으로 결합된 항체를 용출시켰다. 단백질 A 용리액은 즉시 2M 2-아미노-2-[하이드록시메틸]-1,3-프로판디올(Tris)로 중화하였다. 응집물을 제거하기 위해, 단백질 A 용리액을 pH 5.5로 조정하고, 25 mM 소듐 포스페이트, pH 5.5로 평형화되 세라믹 하이드록시아파티트 I형(Bio-Rad) 컬럼에 가하였다. 컬럼 부피의 5배의 평형 완충액으로 컬럼을 헹군 다음, 0.25 M 소듐 포스페이트, pH 5.5를 이용한 한단계 용출로 항체를 용리시켰다. A280에 의해 항체를 포함하는 분획을 모아, -80 ℃에 보관하였다.
조직 추출물 및 단백질 A 통과물(flow through sample)을, 2X SDS 샘플 완충액 + 5% [v/v] 2-머캅토에탄올 첨가에 의해, 환원 또는 비환원 조건하에서, SDS-PAGE를 준비하였다. 단백질 A 용리액과 하이드록시아파티트 용리 샘플을 단백질 농도 0.5mg/mL로 희석한 다음, 2X SDS 샘플 완충액 + 5% [v/v] 2-머캅토에탄올을 첨가하였다. 이를 2분간 95 ℃에 둔 다음, 4-20% Tris-글리신 농도구배 겔(Invitrogen, Carlsbad, CA)을 이용하여 전기영동하였다. Mark12 분자량 마커(Invitrogen) 및 MDX-060을 겔에 포함시켰다. 겔은 콜로이달 블루 염색으로 염색하였다.
N-연결된 글리칸의 정제.
야생형 및 RNAi 렘나 식물 주로부터 유래된 단백질 A 정제한 단일클론 항 체(1 mg)을 물로 광범위하게 투석한 다음 동결건조하여 건조시켰다. 샘플을 5% (v/v) 포름산 100 ㎕에 재현탁하고, 0.05 mg/mL 펩신을 첨가하여 하룻밤동안 37 ℃에 두었다. 샘플을 15분간 95 ℃에서 불활성화한 다음 건조하였다. 펩신 소화물을 100 mM 소듐 아세테이트, pH 5.0 100 ㎕에 재현탁하여, 37 ℃에서 하룻밤동안 N-글리코시다제 A 1 mU와 함께 인큐베이션하였다. 분리된 N-글리칸을 Packer et al . (1998) Glycoconj. J. 15: 737-747에 따라 4 cc Carbograph SPE 컬럼으로 분리한 다음 건조하였다.
건조된 N-글리칸을 1 cc Waters Oasis MCX 카트리지를 이용하여 더욱 정제하였다. 컬럼 부피의 3배에 해당하는 메탄올과 이어 3배의 5% (v/v) 포름산으로 컬럼을 헹구어 준비하였다. 5% (v/v) 포름산 1 mL에 재현탁된 N-글리칸을 준비한 컬럼에 주입하였다. 비결합 분획과 컬럼 부피의 2배의 5% (v/v) 포름산에 의한 세정물을 채집하고, 모아, 건조하였다.
2- 아미노벤조산(2-AA)를 이용한 올리고당의 유도체화
정제된 N-글리칸 또는 말토올리고당을 2-AA로 표지하고, Anumula and Dhume (1998) Glycobiology 8: 685-694에 따라 1 cc Waters Oasis HLB 카트리지를 이용하여 정제하였다. 표지된 N-글리칸 및 말토올리고당을 물 50 ㎕에 재현탁하여, 네거티브 모드 MALDI-TOF MS 및 NP-HPLC-QTOF MS로 분석하였다.
MALDI - TOF 질량 측정.
MALDI-TOF MS를 Waters MALDI Micro MX (Millford, MA)를 이용하여 수행하였다. β-1,2-자일로실트랜스퍼라제/α-1,3-푸코실트랜스퍼라제 반응 산물의 분석 은, 각 반응 상층액 0.5 ㎕을 0.05% (v/v) TFA, 50% (v/v) 아세토니트릴 중의 10 mg/mL CHCA 0.5 ㎕와 타겟 플레이트 상에서 혼합하여, 수행하였다. 자일로스화된([M+H]+ = 2192.85 Da) 또는 푸코실화된([M+H]+ = 2206.87 Da) GnGn-답실-펩타이드 산물을 포지티브 레플렉트론 모드에서 검출하였다. 각 샘플의 200개의 스펙트럼 조합의 이온 카운트를, EMD Biosciences사의 오리지날 GnGn-답실-펩타이드 혼합물에 오염원(<5%)으로 존재하는 β-1,4-갈락토실화된 GnGn-답실-펩타이드 ([M+H]+ = 2222.87 Da)의 이온 카운트에 대해 표준화하였다.
2-AA로 표지된 N- 글리칸 또는 말토올리고당 (0.5 ㎕)을 물에 희석하고, 70% (v/v) 아세토니트릴 중의 10 mg/mL DHB 매트릭스 0.5 ㎕와 혼합한 다음 타겟 플레이트에 점을 찍고, 네거티브 리플렌트론 모드로 분석하였다.
2- AA 표지된 N- 글리칸의 NP - HPLC -Q- TOF MS 분석.
2-AA 표지된 N-글리칸 또는 말토올리고당을 80% (v/v) 아세토니트릴에 첨가하여, TSK-Gel Amide-80 (2 mm x 25 cm, 5㎛) 컬럼(Tosoh Biosciences, Montgomeryville, PA)이 구비된 Waters 2695 HPLC 시스템으로 분리하였다. 2-AA 표지된 탄수화물을 검출하고, HPLC 시스템이 일직선으로 구비된 Waters Q-TOF API US Q-TOF(quadropole-time of Flight) 질량 측정기(Millford, MA)와 Waters 2475 형광 검출기로 형광(230 nm 여기, 425 nm 방사)을 분석하였다.
분리는 10 mM 암모늄 아세테이트, pH 7.3 (용매 A) 및 10 mM 암모늄 아세테이트, pH 7.3, 80% (v/v) 아세토니트릴 (용매 B)를 이용하여 0.2 mL/min으로 수행 하였다. 샘플 용리는 0% A 정조성으로 5분간 진행하고, 8분에 10% A로 선형 증가시킨 다음 48분에 30% A로 선형 증가시켜, 진행하였다. 컬럼은 15분간 100% A로 세정하고, 다음 샘플을 주입하기 전에 15분간 0% A로 평형화하였다.
Q-TOF 분석을 소스 및 각각 100℃ 및 300℃의 탈용매(desolvation) 온도로 네거티브 이온 모드에서 수행하였으며, 모세 및 콘 전압(cone voltage)은 각각 2,100 및 30 V를 사용하였다. 나타낸 질량 스펙트럼은, 표지된 N-글리칸 당 >40의 각각의 스캔을 조합한 결과이다.
HPAEC - PAD 에 의한 단당류 분석.
mAb 샘플(200 ㎍)을 3시간 동안 100 ℃에서 2 N TFA를 이용한 산 가수분해에 투입하였다. 샘플은, 주위 온도에서 진공 원심분리에 의해 건조시키고, 물 150 ㎕에 재구성한 다음 HPAE-PAD (Dionex)로 분석하였다. 재구성한 샘플 분획(25 ㎕)을 프리-컬럼 Amino Trap (Dionex)이 장착된 CarboPac PA10 컬럼(4 x 250 mm)에 적용하였다. 단당류의 분리는 EG40 용출 제조기를 이용하여 이동상 3.5 mM KOH로 수행하였다. 단당류 피크 확인과 상대적인 흡광도는 단당류 표준물을 이용하여 결정하였다.
mAb 의 열 안정성.
MicroCal(Northampton, MA) VP-캐필러리 미량시차주사열량계(Capillary differential scanning calorimetry (DSC) instrument)를 이용하여, 글리콜-최적화된 mAb와 야생형 mAb의 열 안정성을 결정하였다. 정제한 mAb 샘플을 밤새 20 mM NaH2PO4, pH 7.4, 150 mM NaCl (PBS)으로 투석하였다. 1℃/min 스캔 속도로 35 ℃에서 95 ℃로 기준 용액으로서 PBS를 이용하여 300 ㎍/mL 농도의 샘플을 가열함으로써, 열 변성 데이타를 수집하였다. 피드백(feedback) 및 게인(gain)을 낮게 설정하였다. 베이스라인-보정 및 표준화한 데이타를 오리진 v7.0 소프트웨어를 이용하여 비-2-스테이트 모델에 적용하였다.
mAb FcR 결합 활성
실험은 표면 플라스몬 공명 기법을 이용하여 BIACORE (Biacore AB, Uppsala, Sweden) 장치로 수행하였다. mAbs, 2 ㎍/mL을 항원이 코딩된 표면(재조합 인간 CD30)에 포획하였다. FcRgIIIa Val158 및 Phe158 알로타입을 6 μM에서 시작하여, 여러가지 농도로, 3분간 포획된 항체 상에 흘려주었다. FcRgIIIa의 함수로서 결합 신호는 GraphPad Prism (v4.01) 소프트웨어를 이용하여 한부위 결합 모델에 적용하여, KD 값을 구하였다. HBS-EP 완충액(10 mM HEPES, 0.15 M NaCl, 3 mM EDTA 및 0.005% (v/v) P20, pH 7.4)를 실험 전반에 사용하였다. mAb의 완충액 또는 FcRgIIIa의 블랜크 표면 결합을 음성 대조군으로 사용하였다.
항원 결합 친화성 분석.
CD30을 발현하는 L540 세포(DSMZ Cell Culture Collection # ACC 72)를 항원 양성 세포로 사용하여 결합을 분석하였다. 분획 2 x 105 cells/well을 정해진 농도의 일차 항원 100 ㎕과 함께 4 ℃에서 30분간 인큐베이션하였다. 세포는 2% (v/v) 소 태아 항체(FBS)가 포함된 PBS로 2번 헹군 다음, 염소 항-인간 mAb, FITC-표지된 이차 항체(Jackson ImmunoResearch, West Grove, PA)를 1:500로 희석하여 100 ㎕/well로 30분간 4 ℃로 가하였다. 세포는 2% (v/v) FBS로 1번 헹구고, FACS Calibur instrument (Becton Dickinson, Franklin Lakes, NJ)로 유세포측정에 의해 분석하였다. L540 상에서 CD30에 대한 MDX-060 CHO, LEX 및 LEXOpt mAb 결합성의 EC50은 GraphPad Prism 3.0 소프트웨어를 이용한 결합 곡선으로부터 결정하였다.
ADCC 분석.
인간 말초 혈액 단핵구 작동자 세포를 헤파린 처리한 전혈구로부터 표준 Ficoll-Paque 분리에 의해 정제하였다. 세포(2 x 106)를 PBS에서 헹군 다음, 유전자형을 확인하기 위해 보냈다. 나머지 작동자 세포를 10% (v/v) FBS 및 50 U/mL의 인간 IL-2 (Research Diagnostics, Concord, MA)를 포함하는 RPMI 1640 배지에 1 x 106 cells/mL로 재현탁한 다음, 37 ℃에서 밤새 인큐베이션하였다. 작동자 세포를 배양 배지로 1회 헹구고, 이를 사용하기 전에 1 x 107 cell/mL로 재현탁하였다. 10% (v/v) FBS 및 5 mM 프로베네시드(probenecid)가 포함된 RPMI 1640 배지내 1 x 106 cells/mL의 L540 타겟 세포를 20 μM BATDA(비스(아세트옥시메틸) 2,2':6',2''-테르피리딘-6,6''-디카르복실레이트)로 20분간 37 ℃에서 표지하였다. 타겟 세포를 20 mM HEPES 및 5 mM 프로베네시드가 첨가된 PBS로 3번 헹구고, 1 x 105 cell/mL 로 재현탁한 다음 96웰 플레이트에서 작동자 세포에 최종 타겟:작동자 비가 1:50이 되도록 첨가하였다(1 x 104 타겟 세포 및 5 x 105 작동자 세포/well). 타겟 세포의 3% (v/v) Lysol 인큐베이션에 의해 최대 방출을 구하였으며, 자연적 방출은 세포 배양 배지 단독에서의 인큐베이션에 의해 구하였다. 37 ℃에 1시간 인큐베이션한 다음, 각 웰에서 상층액 20 ul을 취하여 유러품 용액 180 ul에 있는 웰에 첨가하였다. 반응은, 400 μsec 지연 및 각각 330/80, 620/10 여기와 방사 필터를 이용하여 Perkin Elmer Fusion Alpha TRF 리더로 판독하였다. 초당 카운트를 항체 농도의 함수로서 그래프를 그리고, GraphPad Prism 3.0 소프트웨어를 이용하여 비선형 회귀, 시그모이달 농도 반응(가변 슬로프)에 의해 데이타를 분석하였다. 특이적 세포용해%는 (실험에서의 방출 - 자연적 방출)/(최대 방출 - 자연적 방출) x 100으로 계산하였다. 모든 실험들에서, 인간 mAb1 이소형 대조군을 포함시켰으며, MDX-060 CHO, LEX, 및 LEXOpt mAb와 비교하였다. 그외 대조군으로는 mAb 무첨가한 타겟 및 작동자 세포, 작동자 세포 무사용의 타겟 세포, 및 타겟 및 작동자 세포를 3% (v/v) Lysol 존재하에 포함시켰다.
결과
LEX 시스템에서의 MDX -060 mAb 발현
MDX-060은 홉킨스 림프종과 미분화 대세포 림프종(anaplastic large cell lymphoma)(Borchmann et al . (2003) Blood 102:3737-3742) 치료를 위해 개발중인 항-CD30 항체(일반적으로 5F11로 알려져 있음)이다. LEX 시스템에서 MDX-060 발현 을 위한 2가지 바이너리 벡터를 구축하였다. 발현 벡터 MDXA01에는 MDX-060의 중쇄(H) 및 경쇄(L)를 코딩하는 코돈 최적화된 유전자가 포함되어 있으며, 벡터 MDXA04에는 키메라 FucT/XylT RNAi 유전자 이외에도 중쇄 및 경쇄를 코딩하는 유전자가 포함되어 있다(도 39). MDXA01 (165개) 및 MDXA04 (195개) 발현 벡터 둘다에 대해 독립적인 형질전환주를 만들었다. 간략하게는, MDXA01 유래 mAb(야생형 N-당화), 및 MDXA04 유래 mAb FucT/XylT RNAi 구조체 포함)를 각각 MDX-060 LEX 및 MDX-060 LEXOpt로 하기에서 언급된다.
형질전환된 식물주를 먼저 IgG ELISA를 이용하여 mAb 발현에 대해 스크리닝하였다. mAb 발현 수준이 높은 LEXOpt은 FucT 및 XylT 활성에 대해서도 분석하였다. 고발현성 MDX-060 LEXOpt 식물주 대부분에서의 트랜스퍼라제 활성은 음성 대조군의 수분으로 감소되어, 분석한 대부분의 식물주들에서 효과적인 침묵됨을 시사하였다(도 40). MDX-060 LEXOpt 식물주는 야생형 렘나 식물에 비해 형태나 생장에 있어서 어떠한 차이도 없었다(데이타 미기재) .
MDX-060 CHO, LEX, 및 LEXOpt mAb의 열 안정성을 DSC(differential scanning calorimetry)로 결정하였다. 모두 3개의 mAb에서 유사한 융해 곡선 카이네틱스(melting curve kinetics)(데이타 미기재) 및 융해 전이점 온도(표 2)가 나타나, MDX-060 CHO mAb에 비교되는 MDX-060 LEX 및 LEXOpt mAb의 구조 완전성이 입증되었 다. 비환원(도 41A) 및 환원 조건(도 41B)에서의 SDS-PAGE 분석으로, MDX-060 LEXOpt 및 MDX-060 CHO 세포로부터 유래된 mAb가 단백질 추출물에서 주된 성분으로서 나타나는 mAb와 유사한 단백질 프로파일을 가지는 것으로 확인되었다.
표 2. DSC(differential scanning calorimetry)에 의한 MDX-060 CHO, MDX-060 LEX, 및 글리코-최적화된 MDX-060 LEXOpt mAb의 열 안정성 비교
항체 T m1 (℃) T m2 (℃) T m3 (℃)
MDX -060 CHO 72 75 84
MDX -060 LEX 71 75 84
MDX -060 LEX Opt 72 76 84
MDX -060 CHO , LEX , 및 LEX Opt mAb 의 N- 글리칸 구조.
재조합 MDX-060 CHO, MDX-060 LEX 및 MDX-060 LEXOpt 유래의 mAb의 N-글리칸 프로파일을 네거티브 레플렉트론 모드의 MALDI-TOF MS와 정상 상태(NP) HPLC-QTOF MS로 결정하였다. 하기 내용에서 언급된 N-글리칸의 구조는 도 53에 나타내었다.
MDX-060 CHO 주 유래의 N-글리칸의 MALDI-TOF MS 분석 결과, 2-AA로 표지된 GnGnF6 (http://www.proglycan.com에 따라 명명함), Man5, GnAisoF6, 및 AAF6에 해당되는 m/z 값을 가진 4가지 주된 N-글리칸류가 존재하는 것으로 나타났다(도 42). NP-HPLC는 GnAisoF6 N-글리칸을 2개의 이소형(α-1,6-Man 또는 α-1,3-Man 암에 부착된 Gal)로 분리시켜, MDX-060 CHO에서 발현되는 주 N-글리칸류의 총 수가 5개가 되었다(도 43). 피크의 MS/MS 단편화(fragmentation)를 수행하여 각 이소형의 실체 를 검증하였고, 보다 초기 피크의 더 높은 크기는, Gal이 이 N-글리칸의 α-1,6-Man 암에 부착되어 있음을 제시하였다(Shinkawa et al . (2003) J. Biol . Chem . 278:3466-3473; Zhu et al . (2005) Nat . Biotechnol . 23:1159-1169). 온라인 네거티브 모드의 QTOF MS 분석시, 이중으로 하전된 GnGnF6, Man5, GnAisoF6 (2가지 이소형), 및 AAF6에 해당되는 m/z 값이 나타나, MALDI-TOF MS 결과를 뒷받침하였다(표 3). 형광 트레이스의 피크 적분(Peak integration)으로, GnGnF6, Man5, AGnF6, GnAF6, 및 AAF6이 각각 MDX-060 CHO의 총 N-글리칸 구조체들의 50.8, 2.5, 26.1, 10.7 및 6.8%를 구성하는 것으로 나타났다. 나머지 3.1%의 N-글리칸은 GnGn, GnMisoF6, GnMiso, 및 MM 혼합물인 것으로 확인되었고, 총 N-글리칸의 1.2%를 초과하는 N-글리칸 구조체는 없었다(데이타 미기재).
표 3. CHO 세포(CHO), 야생형 Lemna (LEX) 또는 RNAi 구조체(LEXOpt)를 발현하는 글리코-최적화된 렘나 주에서 생산된, 2-AA로 표지된 주 N-글리칸의 MALDI-TOF 및 QTOF MS 관찰 결과 요약
Figure 112008058316948-PCT00003
야생형 MDX-060 LEX mAb의 MALDI-TOF MS 분석으로, GnGnXF3, GnGnX 및 GnGn에 해당되는 m/z 값을 가진 3가지 주된 N-글리칸류가 존재하는 것으로 나타났다(도 42). NP-HPLC-QTOF MS 분석 결과, 이중으로 하전된 GnGnXF3, GnGnX 및 GnGn에 해당 하는 m/z 값을 가진 3개의 주 형광 피크가 나타나, MALDI-TOF MS 결과를 다시 확인해주었다(도 43; 표 3). 형광 피크 적분 결과, GnGnXF3, GnGnX 및 GnGn은 각각 MDX-060 LEX mAb 유래의 총 N-글리칸의 67.4, 17.2 및 8.4%를 구성하는 것으로 나타났다. 나머지 7%의 N-글리칸은 MM, GnMiso, MMXF3, GnGnF3, GnMisoXF3, Man6, Man7, Gn(FA)isoXF3, Man8 및 Man9 혼합물인 것으로 확인되었고, 총 N-글리칸의 2%를 초과하는 N-글리칸 구조체는 없었다. 각각 형질전환한 2종의 MDX-060 LEX 주로부터 분리한 mAb에서도 유사한 결과가 관찰되었다(데이타 미기재). 본원에서 입증된 LEX mAb의 단순한 N-글리칸 어레이는 글리코-최적화에 호의적인 출발 시점을 제공한다.
MDX-060 LEX mAb와는 대조적으로, DX-060 LEXOpt mAb의 N-글리칸은 MALD-TOF MS 및 NP-HPLC-QTOF MS 분석에 의해 주된 N-글리칸 종으로서 GnGn을 가지고 있었다(도 42 및 43, 표 3). GnGn은 총 N-글리칸의 95.8%였으며, 나머지 4.2%는 MM, GnMiso, GnAiso, Man6, Man7 및 Man8로 결정되었으며, 총 N-글리칸의 1.2%를 초과하는 구조체는 없었다. LEXOpt N-글리칸에는 푸코스(Fuc) 또는 자일로스(Xyl)가 포함되어 있지 않았다. 이러한 결과는, 렘나 FucT 및 XylT를 타겟팅하는 RNAi 구조체의 공동-발현으로, MDX-060 LEXOpt mAb 유래 N-글리칸을 포함하는 Fuc 및 Xyl의 완전한 소거가 이루어졌으며, 매우 동질적인 mAb 글리코형이 생성됨을 나타내었다. 동일 한 결과는 다른 배양 규모(형질전환주 225 300g 대 형질전환주 52 1 g, 도 42 및 43에 나타낸 N-글리칸 프로파일의 MDX-060 LEXOpt mAb를 생산함)로 MDXA04 발현 벡터를 포함하는 개별 형질전환주(주 255)로부터 수득한 MDX-060 LEXOpt mAb에서도 나타났다. N-글리칸 이질성을 배양 조건, 배양 규모 및 배양 기간에 따라 변경할 수 있는 포유류 세포 배양 시스템(Kanda et al . (2006) Biotechnol . Bioeng . 94:680-688)과는 다르게, LEXOpt mAb에서 관찰되는 글리칸 동일성(glycan uniformity)은 다양한 생장 조건 및 스케일에서 일정한 것으로 확인되었다.
MDX-060 LEXOpt mAb N-글리칸 상에 Fuc 또는 Xyl의 부재를 또한 단당류 분석으로 검증하였다(표 4). 단당류는 MDX-060 CHO, LEX 및 LEXOpt mAb로부터 산 가수분해에 의해 분리하였으며, PAD(pulsed amperometric detection)와 연계된 고성능 음이온 교환 크로마토그래피(HPAEC)에 의해 분석하였다. Man 및 GlcNAc 잔기에 대한 단당류 비는 CHO 및 야생형 LEX mAb에서와 유사하고 상호 관련이 있었으며, 예상된 수치를 보였다. LEX mAb는 CHO-유래 mAb에 비하여 Gal 및 Fuc 함량이 현저하게 감소되었으며, Fuc는 현저하게 증가되었다. 렘나 유래 mAb의 단당류 분석으로, Fuc 및 Xyl이 야생형 LEX N-글리칸에 존재하고 있지만, LEXOpt mAb에서는 검출되지 않은 것으로 나타났다. 종합하면, 이러한 결과들은, 렘나 XylT 및 FucT를 타켓팅하는 RNAi 구조체의 공동-발현으로 MDX-060 LEXOpt mAb로부터 Fuc 및 Xyl 함유 성 N-글리칸이 없어지며, 매우 동질적인 mAb 글리코형을 생산함을 나타낸다. 이러한 글리코-최적화 전략의 견고성은 MDX-060 LEXOpt mAb를 발현하는 복수의 개별 식물 주들과 LEX 시스템에서 발현되는 그외 mAb, 예컨대 상기 실시예에서 언급된 mAbI 단일클론 항체에서 검증되었다. 후속적인 형질전환에서, 총 가용성 단백질(TSP)의 최대 6%에 이르는 글리코-최적화된 mAb 발현이 달성되었다.
표 4. 산 가수분해에 의해 MDX-060 CHO, LEX 및 LEXOpt mAb로부터 분리되고 HPAEC-PAD로 분석된 단당류. 각 mAb의 단당류 함량은 탄수화물 대조군에 대해 표준화함으로써 결정하였다.
단당류 MDX -060 CHO pmol (% 총) MDX -060 LEX pmol (% 총) MDX -060 LEX Opt pmol (% 총)
Fuc 254 (20) 232 (13) 0
GlcNAc 605 (47) 773 (45) 1,003 (67)
Gal 75 (6) 0 0
Man 355 (27) 491 (29) 501 (33)
Xyl 0 226 (13) 0
1,289 (100) 1,722 (100) 1,504 (100)
MDX -060 CHO , LEX LEX Opt mAb 의 기능성 활성.
MDX-060 CHO, MDX-060 LEX, 및 MDX-060 LEXOpt mAb의 항원 결합 특성을 CD30을 발현하는 L540 세포를 이용하여 결정하였다. 모두 3종의 mAb는 거의 동일한 결합 곡선(도 43)을 보였다. EC50 농도는 MDX-060 CHO, LEX, 및 LEXOpt 각각에 대해 0.180 ㎍/mL, 0.227 ㎍/mL, 및 0.196 ㎍/mL로 결정되었으며(도 44), 이는 3종의 mAb 모두 항원 결합성이 유사함을 의미한다.
FC-수용체-매개성 작동자 세포의 기능은 많은 치료학적 mAb의 생체내 활성에 중요한 것으로 입증되고 있다. ADCC 활성을 담당하는 NK 세포와 대식세포 상에 발현되는 FcR는 FcγRIIIa이므로, 이 수용체에 대한 다양한 mAb의 결합성을 비교하였다. CHO, LEX 및 LEXOpt mAb의 FcR 결합성은, 2개의 서로 상이한 인간 FcRgIIIa 알로타입 (Phe158 또는 Val158)을 발현하는 작동자 세포에 대한 mAb의 결합 평형에 의해 결정하였다. MDX-060 LEX는 CHO 유래 mAb에 비하여, FcRgIIIaPhe158에 대해 1.7배 증가, 그리고 FcRgIIIaVal158에 대해 0.4배 감소를 보였으며, CHO 및 LEX mAb에 대한 수용체 결합성은 유사한 것으로 나타났다. 반면, LEXOpt mAb는 CHO mAb에 비하여 FcRgIIIaPhe158 및 FcRgIIIaVal158 각각에 대해 27 및 15배 높은 친화성을 보였다(도 45). 이러한 결과들은, LEXOpt 주에서의 렘나 FucT 및 XylT 활성의 RNAi 침묵화로 FcR 결합성이 강화된 mAb가 생산됨을 시사하였다.
CHO, LEX 및 LEXOpt mAb의 ADCC 활성을, 동질적인 (FcRgIIIaPhe158) 또는 이질적인 (FcRgIIIaPhe/Val158) 인간 작동자 세포 중 어느 하나, 및 BATDA(비스(아세트옥시메틸)2,2':6,2''-테르피리딘-6,6''-디카르복실레이트) 표지된 L540 타겟 세포를 mAb와 함께 인큐베이션함으로써 결정하였다(도 45).
MDX-060 LEX mAb(31%)는 이질적인 FcRgIIIaPhe/Val158 인간 작동자 세포를 이용한 CHO mAb(31%)와 동일한 최대 세포 용해율을 보였으며(도 46), EC50 값도 비슷하였다. LEX mAb에 있어 최대 세포 용해율(27%)은 동질적인 FcgRIIIa Phe/Phe158 작동자 세포를 이용한 CHO mAb(15%)에 비하여 약간 증가되었다. LEXOpt mAb는 수여체 유전자형과 관계없이 DX-060 CHO 및 LEX mAb에 비하여 ADCC 활성이 현저하게 증가되었다. 이는 세기(potency)와 효과(efficacy) 두가지 측면에서의 증가로 평가되었다. MDX-060 LexOpt에서 최대 용해율은 양쪽 모두 45%였지만, FcgRIIIa Val/Phe158 작동자 세포의 경우 EC50 값은 MDX-060 LEX 및 MDX-060 CHO mAb 각각에 비해 3 - 5배 낮았고, FcgRIIIa Phe/Phe158 작동자 세포에 경우 2-3배 더 낮았다. 이들 결과는, MDX-060 LEXOpt mAb의 Fuc 및 Xyl-함유성 N-글리칸이 ADCC 활성을 강화를 유발하여 따라서 이들의 치료학적 잠재력을 개선시킬 수 있음을 입증한다.
MDX -060 LEX MDX -060 LEX Opt 에 대한 온전한 IgG RP - HPLC -Q- TOF MS 분석
단백질 A로 정제한 IgG(50 ㎍)를 Poros R1-10 컬럼(2 mm x 30 mm; Applied Biosystems)이 구비된 Waters 2695 HPLC 시스템을 이용하여 탈염하였다. IgG를 검출하고, Waters 2487 듀얼 파장 UV 검출기(280 nm) 및 Waters Q-TOF API US를 이용하여 분석하였다. 분리는 0.05% (v/v) 트리플루오로아세트산 (TFA; 용매 A) 및 0.05% (v/v) TFA, 80% (v/v) 아세토니트릴 (용매 B)을 이용하여 0.15 mL/min, 60℃에서 수행하였다. 샘플 용리는 5분간 30 -> 50% B로의 선형 증가, 5분간 80%까지 증가에 의해 수행하였다. 용매 비율은 4분간 더 80% B로 유지한 다음 1분간 100% B로 세정한 다음, 다음번 운영을 하기 전에 15분간 30% B로 컬럼을 평형화하였다.
Q-TOF 분석을 소스 및 각각 100℃ 및 300℃의 탈용매(desolvation) 온도로 네거티브 이온 모드에서 수행하였으며, 모세 및 콘 전압(cone voltage)은 각각 3.0 및 60 V를 사용하였다. 데이타는, >100의 각각의 스캔을 조합하고, MaxEnt 1을 이용하여 모체 질량 스펙트럼으로 디컨볼루션(deconvolution)한 결과이다.
또한, Triguero et al . (2005) Plant Biotechnol . J. 3: 449-457; Takahashi et al . (1998) Anal . Biochem . 255: 183-187; Dillon et al . (2004) J. Chromatogr . A. 1053: 299-305를 참조한다.
도 47은 MDXA01 구조체를 포함하는 야생형 렘나 마이너에서 생산되는 MDX-060 LEX mAb 조성물의 무가공 질량 분석을 나타낸 것이다. XylT 및 FucT 발현이 렘나 마이너에서 억제되지 않았을 때, 재조합으로 생산된 MDX-060 LEX mAb 조성물은 7가지 이상의 서로 상이한 글리코형을 포함하며, G0XF3 글리형이 우세한 종이었다. GO 글리코형을 나타내는 피크가 없음을 주지하여야 한다.
도 48은 MDXA01 구조체를 포함하는 야생형 렘나 마이너에서 생산되는 MDX-060 LEX mAb의 중쇄에 대한 글리칸 질량 분석을 나타낸 것이다. XylT 및 FucT 발현이 렘나 마이너에서 억제되지 않았을 때, 우세하게 존재하는 N-글리칸 종은 G0XF3 이었으며, GOC 종을 나타내는 주 피크들이 몇개 있었다. GO 글리코형을 나타내는 피크가 적음을 주지하여야 한다.
도 49는 MDXA04 구조체를 포함하는 형질전환된 렘나 마이너에서 생산되는 MDX-060 LEXOpt mAb 조성물의 무가공 질량 분석을 나타낸 것이다. XylT 및 FucT 발현이 렘나 마이너에서 억제되었을 때, 무가공 mAb 조성물은 오직 GO N-글리칸만 포함하고 있다. 게다가, 이 조성물은 Go 글리코형(피크2)에 대해 실질적으로 동질적이었으며, 양쪽 당화 부위에는 GO N-글리칸 종들이 차지하고 있었으며, 미량의 글리코형 전구체를 나타내는 2개의 작은 피크가 나타났다(피크 1, 하나의 중쇄의 CH2 도메인이 Ans 297에 부착되어 있고, 다른 중쇄의 CH2 도메인은 당화되지 않은, Fc 영역을 가지고 있는 mAb를 나타냄; 및 피크 3, 각 CH2 도메인의 Ans 297 당화 부위에 GO 글리칸 종들이 부착되어 있고, mAb 구조내 다른 당화 부위에 3번째 GO 글리칸 종이 부착디어 있는, Fc 영역을 가지고 있는 mAb를 나타냄).
도 50은 MDXA04 구조체를 포함하는 형질전환된 렘나 마이너에서 생산되는 MDX-060 LEXOpt mAb의 글리칸 질량 분석을 나타낸 것이다. XylT 및 FucT 발현이 렘나 마이너에서 억제되었을 때, 중쇄의 CH2 도메인의 Asn 297 당화 부위에 부착된 쉽게 검출할 수 있는 N-글리칸 종은 오직 GO이다.
고찰
MDX-060의 글리코 최적화는, 내인성 렘나 FucT 및 XylT 유전자의 침묵을 목 적으로 하는 RNAi 구조체의 공동-발현에 의해 달성되었다. FucT 및 XylT 유전자 둘다의 동시 침묵화는, 단일 RNAi 전사체를 이용하여 달성되었다. LEXOpt mAb 상에 Fuc 및 Xyl의 부재는, MDX-060 LEXOpt mAb로부터 정제한 N-글리칸의 MALDI-TOF, NP-HPLC-QTOF MS 및 단당류 분석에 의해 검증하였다. 이들 분석은 미소좀 막에서 관찰되는 트랜스퍼라제 활성 결핍을 뒷받침한다. 중요한 점은, LEXOpt mAb로부터 분리된 N-글리칸 >95%가 단일 구조의 GnGn이라는 것인데, 이는 본 전략이 동질적인 N-글리칸 프로파일을 가진 mAb 생산에 추가적인 이점이 있음을 시사한다. MDX-060 LEX 및 LEXOpt mAb는 MDX-060 CHO에 비해 열 안정성 및 항원 결합성에 있어 구별되지 않는 것으로 확인되었다. 또한, 전기영동 분석을 통해, 3종의 mAb 모두 유사한 것으로 확인되었다. 실제, 검출되는 유일한 구조적 차이는 mAb N-글리칸 프로파일에서 있었다.
이론에 결부되지 않으면서, MDX-060 LEXOpt 주가 단일의 주류 N-글리칸 종을 가진 mAb를 생산하는 능력은 야생형 렘나에서 발견되는 더욱 균일한 mAb 글리코형 분포에 기초한 것일 수 있다. 야생형 담배(Fujiyama et al . (2006) J. Biosci . Bioeng. 101:212-218; Elbers et al . (2001) Plant Physiol . 126:1314-1322; Bakker et al . (2001) Proc . Natl . Acad . Sci . 98:2899-2904), 알파파(Bardor et al . (2003) Plant Biotechnol . J. 1:451-462), 및 모스(Koprivova et al . (2003) Plant Bio . 5:582-591)로부터 정제된 mAb에서 분리된 N-글리칸은, 야생형 N-당화를 가진 식물에서의 mAb 글리코형의 이질성이 5(알파파)(Bardor et al . (2003) Plant Biotechnol . J. 1:451-462) 내지 8(담배)(Fujiyama et al . (2006) J. Biosci . Bioeng . 101:212-218)개의 상이한 주류 구조체 범위일 수 있음을 나타낸다. MDX-060 LEX는 오직 3가지 주류 N-글리칸 구조체(GnGn, GnGnX 및 GnGnXF3)만 가진다. 야생형 렘나에서 생산되는 mAb의 단순한 N-글리칸 어레이는, 다른 시스템에서 관찰되는 동질성 보다 높은 동질성을 유도하는, 글리코-최적화에 호의적인 출발 시점을 제공할 수 있다.
Fc-수용체 매개의 작동자 세포 기능은 많은 치료학적 mAb의 생체내 활성에 중요한 것으로 입증되고 있다. 본 실험에서, MDX-060 CHO, MDX-060 LEX 및 MDX-060 LEXOpt mAb의 ADCC 활성을 비교하였다. ADCC 활성을 담당하는 NK 세포와 대식세포 상에 발현되는 FcR는 FcγRIIIa이므로, 이 수용체에 대한 다양한 mAb의 결합성을 비교하였다. 전술한 결과, CHO, LEX 및 LEXOpt mAb의 FcR 결합성은, 2개의 서로 상이한 인간 FcRgIIIa 알로타입 (Phe158 또는 Val158)을 발현하는 작동자 세포에 대한 mAb의 결합 평형에 의해 결정하였다. MDX-060 LEX는 CHO 유래 mAb에 비하여, FcRgIIIaPhe158에 대해 1.7배 증가, 그리고 FcRgIIIaVal158에 대해 0.4배 감소를 보였으며, CHO 및 LEX mAb에 대한 수용체 결합성은 유사한 것으로 나타났다. MDX-060 LEXOpt mAb는 MDX-060 CHO 및 MDX-060 LEX mAb에 비해, FcgRIIIa에 대해 증가된 결 합 친화성(15-25 배) 및 최대 결합성(4-5 배) 뿐만 아니라 강화된 ADCC 활성을 가지는 것으로 확인되었다. 다른 발현 시스템에서 생산된 다양한 mAb에서의α-1,6-연결된 Fuc의 제거가, FcR 결합성을 증가시키고 ADCC 기능을 강화하는 것으로 기존에 확인되었다(Shinkawa et al . (2003) J. Biol . Chem . 278:3466-3473; Shields et al . (2002) J. Biol . Chem . 277:26733-26740; Niwa et al . (2004) Clin . Cancer Res . 10:6248-6255). 본원의 결과는, MDX-060 LEXOpt mAb에서 α-1,3-연결된 Fuc의 제거도 α-1,6-연결된 Fuc의 제거와 동일한 mAb 작용 효과를 가지는 것으로, 나타났다.
본 연구에서, 잔기 15841, Val158 및 Phe158에서 자연적으로 생성되는 2가지 FcgRIIIa 다형성 이소형을 평가하였다. MDX-060 LEXOpt는 다른 IgG1 mAb(Shields et al. (2002) J. Biol . Chem . 277:26733-26740)에서 관찰되는 바와 같이, FcgRIIIa-Phe158에 비해, FcgRIIIa-Val158 에 대해 보다 높은 결합 친화성을 보인다. Phe158 상의 Val158에 대한 상이한 결합이 항-CD20 치료제를 복용하는 특정 환자군의 임상적 및 면역학적 반응의 전조인 것으로 확인되었기 때문에, MDX-060 LEXOpt를 이용한 결합 증가가 2가지 이소형에서 관찰된다는 사실이 매우 중요하다(Cartron et al . (2002) Blood 99:754-758; Weng et al . (2003) J. Clin . Oncol . 21:3940-3947; Weng et al . (2004) J. Clin . Oncol . 22:4717-4724). 이러한 결합 성 증가는, Fc 관능화가 필요한 치료에 반응성인 환자 %를 높게 하는 것으로 가설이 설정되었다.
유사한 ADCC 활성 증가도 관찰되었다. 이 실험에서, MDX-060 LEXOpt mAb는 세포 용해 증가 및 EC50 수치 감소를 보여, 결과적으로 MDX-060 CHO에 비해 효능 및 강도가 증가되었다. 이는 MDX-060 CHO의 최대 용해율을 구하고, MDX-060 LEXOpt mAb의 농도를 계산하여 결정한, 20배 활성 증가에 해당되며, 이는 동일한 세포 용해율을 보인다. FcgRIIIa 결합 연구에서와 같이, ADCC 활성은 동질적인 FcgRIIIaPhe/Phe158 및 이질적인 FcgRIIIa Phe/Val158 작동자 세포 수여체 둘다에서 관찰되었다. 본원의 결과는, MDX-060 LEXOpt mAb에서 α-1,3-연결된 Fuc 제거가 mAb 기능에 있어 α-1,6-연결된 Fuc의 제거와 동일한 효과를 가짐을 시사한다.
이러한 글리코-최적화된 전략의 견고성은, MDX-060 LEXOpt mAb를 발현하는 복수의 개별 렘나 식물주 뿐만 아니라 렘나 발현 시스템에서 발현되는 다른 항체에서 입증되었다(예, 실시예 2-4). 게다가, 야생형 렘나 식물들과 비교하여, 식물 표현형이나 생장율에 뚜렷한 차이는 없었다. N-글리칸 이질성이 배양 조건, 배양 규모 및 배양 기간에 따라 바뀔 수 있는 포유류 세포 배양 시스템과는 달리, LEXOpt mAb에서 관찰되는 글리칸 균일성은 다양한 배양 조건 및 스케일에서 일정한 것으로 확인되었다(데이타 미기재).
결론적으로, 렘나 발현 시스템에서 글리코-최적화된 항-CD30 항체를 제조하기 위해 RNAi 전략을 사용하였다. 수득되는 mAb는, 단일의 주류 N-글리칸 구조로 구성되며, 식물 특이적인 Fuc 및 Xyl 잔기에 대한 어떠한 증거는 없다. 또한, 제조되는 최적화된 mAb는 CHO 유래의 mAb에 비해 증가된 ADCC 활성 및 FcgRIIIa 결합 활성을 가진다. FucT + XylT 유전자 낫아웃 전략을 가진 렘나 발현 시스템에서 생산된 mAb에서 수득되는 동질적인 당화 프로파일은, 생산 일관성(production consistency)이 증가된 이들 mAb를 발현시키는 것을 가능하게 하다.
실시예 7: 렘나 마이너에서 글리칸 -최적화된 mAbI 의 생산 규모 확대
도 12의 mAbI04 구조체(FucT 및 XylT의 억제 제공함)를 포함하는 렘나 마이너 형질전환주 24를 상기와 유사한 방식으로 제조하였다. 제조한 후, 형질전환주 24개를 이후의 배양을 위해 식물 배양물의 부표본을 주기적으로 신선한 배양 배지에 옮기는, 클론 배양에 의해 계속 유지시켰다. 생산 규모를 1 g 조직에서 최대 300 g(0.3 kg) 조직으로 확대하고, 추가적으로 6.5 kg 조직으로 확대한 후, 재조합으로 생산된 mAbI 항체의 N-당화 패턴에 대해 상기 형질전환주를 분석하였다. 형질전환주 24개를 만든 후, 약 8개월 동안 최대 6.35 kg 조직으로 생산 규모를 확대하는 과정을 실시하였다. 결과는 도 51A (N-글리칸의 MALDI-TOF 분석) 및 51B (N-글리칸의 HPLC 형광 분석)에 나타내었다.
mAbI04 구조체를 포함하고 있는 형질전환주 24종에서 생산되는 mAbI 항체의 당화 프로파일은 1 g 조직에서 0.3 kg, 그리고 최대 6.5 kg 조직으로 확대함에 따라 동질적으로 유지되었고, 따라서 GnGn (즉, G0) 글리칸 종에 해당되는 하나의 우 세한 피크가 존재하는 것이 확인되었다. 따라서, mAbI04 구조체를 포함하고 있는 형질전환된 렘나 마이너에서 당화 프로파일의 동질성은, 생산 스케일을 약 6,500배로 증가(즉, 1 g에서 최대 6.5 kg)함에 따라 일정하게 유지되었다. 또한, 당화 프로파일의 동질성은 이의 제조 후 8개월까지 형질전환주에서 일정하게 유지되었다.
mAbI04 구조체를 포함하고 있는 형질전환된 렘나 마이너에서 당화 프로파일의 동질성은 생산 스케일을 적어도 6,500배로 증가함에 따라 일정하게 유지된다는 것은, 상기 데이타들에서 확인된다. 또한, mAbI04 구조체를 포함하고 있는 형질전환된 렘나 마이너에서 당화 프로파일의 동질성은 이의 제조 후 적어도 8개월까지 형질전환주에서 일정하게 유지되었다. 당화 프로파일의 동질성은 추가적인 생산 규모 증가에 따라 유지될 것으로 예상할 수 있으며, 따라서, 예컨대 6.5 kg을 다시 4배(예, 6.5 kg에서 26 kg으로 확대)로 생산 규모를 증가시키는 경우, 유지될 것으로 예상할 수 있다. 당화 프로파일의 동질성도 형질전환주를 제조한 후 8개월 넘게 형질전환주의 연속적인 클론 배양시 유지될 것으로 예상할 수 있다.
실시예 8: mAbI04 RNAi 구조체로 형질전환된 렘나 마이너에서의 내인성 당단백질의 당화 패턴
L40 프로테아제는 렘나 마이너에서 생산되는 대표적인 내인성 당단백질이다. mAbI04 RNAi 구조체(도 12)의 내인성 단백질의 당화에 미치는 영향을 평가하기 위해, mAbI04 RNAi 구조체로 형질전환된 렘나 마이너로부터 벤즈아미딘 친화성 크로마토그래피를 이용하여 L40 단백질을 분리하였다. 분리된 L40 단백질의 N-당화 패턴을 전술한 방식으로 MALDI-TOF로 분석하였다. 결과는 도 52에 나타내었다.
이러한 분석에서 알 수 있는 바와 같이, 키메라 RNAi mAbI04를 이용한 FucT 및 XylT 발현의 억제로, 재조합 당단백질에서 관찰되는 패턴과 일치하는 동질적인 당화 패턴을 가진 내인성 당단백질이 만들어진다. 따라서, 야생형 당화 장치를 가진 렘나 마이너로부터 분리한 L40 당단백질의 이질적인 N-글리칸 프로파일은, β1,2-연결된 자일로스 잔기, 또는 β1,2-연결된 자일로스와 코어 α1,3-연결된 푸코스 잔기 둘다가 부착된 N-글리칸 혼합물을 나타낸다. 그러나, mAbI04 RNAi 구조체로 형질전환된 렘나 마이너로부터 분리된 L40의 동질적인 N-글리칸 프로파일은 GO 글리칸 종에 해당되는 하나의 우세한 피크를 나타내며, β1,2-연결된 자일로스 또는 β1,2-연결된 자일로스 및 코어 α1,3-연결된 푸코스 잔기 둘다가 부착된 N-글리칸 종이 없는 것으로 특정화되었다.
실시예 9: ADCC 활성이 증가된 항- CD20 및 항- HER2 단일클론 항체의 생산
IDEC-C2B8(IDEC Pharmaceuticals Corp., San Diego, California; 상표 Rituxan®로 시판됨, 또한 리투시맵이라고 함; 미국 특허 5,736,137을 참조하며, 원용에 의해 본 명세서에 포함됨)은 인간 IgG1과 카파 불변부, 그리고 뮤라인 항-CD20 단일클론 항체, IDEC-2B8로부터 분리된 뮤라인 가변성 영역을 포함하고 있는 키메라 항-CD20 단일클론 항체이다(Reff et al. (1994) Blood 83:435-445). 리투시맵은 재발성 B 세포 저-등급 또는 여포성 비-홉킨스 림프종(NHL)의 치료제로 인가받았다. 리투시맵(Rituxan®)으로 시판되는 항-CD20 항체는 CHO 세포에서 재조합으로 생산된다. CHO에서 발현되는 항-CD20 항체의 당화 패턴은 이질적인 글리코형 혼합물로 확인되었다.
인간화된 항-ERBB2 항체는 상표 Herceptin®(Genentech, Inc., San Francisco, California)(미국 특허 6,165,464를 참조하며, 원용에 의해 본 명세서에 포함된)으로 상업적으로 구입가능하다. 이러한 재조합 인간화된 단일클론 항체는 p185HER2에 대해 높은 친화성을 가진다. 광범위의 전이성 유방 악성 종양을 가진 환자에 대한 초기 임상 시험에서, 이 단일클론 항체가 HER2를 과다 발현하는 유방 암세포의 증식을 저해하는 능력이 입증되었다(Baselga et al. (1996) J. Clin . Oncol . 14(3):737-744).
리투시맵-서열 항체 및 Herceptin® 항-ERBB2-서열 항체는 전술한 mAbI01 구조체를 이용하여, 야생형 당화 패턴의 렘나와, FucT과 XylT 둘다의 발현을 억제하기 위해 mAbI04 키메라 RNAi 구조체를 이용하여 유전자 변형된 렘나에서, 리투시맵 또는 항-ERBB2 중쇄 및 경쇄 코딩 서열이 각 구조체에서 mAbI으로 치환된 형태로, 재조합으로 생산된다. 중쇄 및 경쇄를 코딩하는 서열은 선택적으로 렘나 선호 코돈으로 둘다 코돈 최적화된다. 분리된 리투시맵-서열 mAb(즉, 리투시맵 항체의 아미노산 서열을 가짐) 및 항-ERBB2-서열 mAb(즉, Herceptin® 항-ERBB2 mAb의 아미노산 서열을 가짐)를, 실시예 1에 언급된 바와 같이, 당화 패턴을 분석하였다.
mAbI01-유사 구조체를 포함하는 야생형 렘나에서 생산되는 온전한 리투시맵-서열 mAb 또는 항-ERBB2-서열 mAb의 당화 프로파일은, 복수의 글리코형에 해당되는 다수 피크가 있는 이질적인 프로파일을 보인다. 반면, mAbI01-유사 구조체를 포함 하는 형질전환된 렘나에서 생산되는 온전한 리투시맵-서열 mAb 또는 온전한 항-ERBB2-서열 mAb의 당화 프로파일은, 실질적으로 동질적인 당단백질 조성물이며, GO 글리코형에 해당되는 가장 큰 피크와 미량의 글리코 전구체에 해당되는 2개의 매우 작은 피크인 주류 글리코형 3개 피크가 있으며, 자일로스 및 푸코스 잔기는 부착되어 있지 않다.
실질적으로 동질적인 GO글리코형 당화 프로파일을 가지는 리투시맵-서열 및 항-ERBB2-서열 단일클론 항체 조성물을, ADCC 활성 및 신선하게 분리한 인간 NK 세포상에서의 Fcγ 수용체 IIIa (FcγRIIIa) 결합성에 대해 테스트하였다. mAbI01-유사 구조체를 가지는 조작된 렘나 마이너에서 생산되는 리투시맵-서열 mAb 또는 항-ERBB2-서열 mAb는, 야생형 당화 장치를 가지고 있는(즉, FucT 또는 XylT의 침묵화가 없음) 렘나 마이너에서 생산되는 리투시맵-서열 mAb 또는 항-ERBB2-서열 mAb에서 관찰되는 결합성에 비해, 모든 푸코스 잔기의 결핍 측면에서, 예상되는 강화된 결합성을 나타낸다. 또한, CHO 세포주에서 생산된 대응되는 mAb에 대해서는, 결합 친화성은 적어도 강력하였다.
mAbI01-유사 구조체를 가지는 조작된 렘나 마이너에서 생산되는 리투시맵-서열 mAb 또는 항-ERBB2-서열 mAb의 실질적으로 동질적인 GO 글리코형의 ADCC 활성은, 작동자 세포로서 일간 말초 혈액 단핵구 세포를 이용하여 분석된다(예, Shinkawa et al. (2003) J. Biol . Chem . 278(5):3466-3473; 원용에 의해 그 전체가 본 명세서에 포함됨). GO 글리코형의 리투시맵-서열 mAb 또는 항-ERBB2-서열 mAb 조성물의 활성은, 야생형 당화 장치를 가지고 있는 렘나 마이너에서 생산되거나 또 는 CHO 세포에서 생산되는 각각의 리투시맵-서열 mAb 또는 항-ERBB2-서열 mAb의 활성에 비하여 50-1000배 향상된다.
mAbI01-유사 RNAi 구조체를 가지는 조작된 렘나 마이너에서 생산되는 리투시맵-서열 mAb의 실질적으로 동질적인 GO 글리코형의 CDC 활성은, 당업계에 공지된 표준 분석 방법으로 분석하며(예, 미국 특허 공개공보 2004/0167319에 기술된 보체 활성화 분석법, 이는 그 전체가 원용에 의해 본 명세서에 포함됨), 리투시맵에서 관찰되는 활성과 비교하였다. 관련없는 항체를 음성 대조군으로 사용하였다. 이러한 분석에서, 타겟 Daudi 세포에 대한 다양한 항체들의 CDC 활성을 프로피듐 요오드화물(PI) 배제 분석을 이용한 막 투과성 증가를 조사함으로써 측정하고, 보체 소스로서 건강한 자원자로부터 취한 혈청을 사용하였다. 보체 용해(complement lysis)용 혈청은 건강한 자원자로부터 혈액을 오토셉 겔(autosep gel) 및 응고 활성자 진공 채혈관(BD Biosciences, Rutherford, New Jersey)으로 흐르게 하여 준비하였고, 이를 실온에서 30-60분간 둔 후 5분간 3000 rpm으로 원심분리하였다. 혈청을 수득하여 -80 ℃에 저장하였다.
간략하게, CDC 활성 분석을 위해, Daudi 세포를 헹구고, 1 X 106/ml로 RPMI-1% BSA에 재현탁하였다. 실질적으로 동질적인 GO 글리코형의 리투시맵-서열 mAb, 리투시맵, 및 음성 대조군을 다양한 농도로 Daudi 세포에 첨가하고, 실온에서 10-15분간 결합하게 두었다. 이후, 보체 소스로서 혈청을 최종 농도 20%(v/v)로 첨가하고, 혼합물을 37 ℃에서 45분간 인큐베이션하였다. 이후, 세포는 분석하기 전까 지 4 ℃에 두었다. 각 샘플(150 ㎕)을 10 ㎕의 PI 용액(10 ㎍/ml in PBS)에 FACS 튜브에서 첨가하였다. 이 혼합물은, FACScalibur 유세포 측정기에 의해 세포 용혈(PI-양성 세포의 수)을 평가하고, CellQuest 프로 소프트웨어(BD Biosciences, Mountain View, California)로 분석하였다. FCS(forward sideward scatter) 역치의 조정에 의해 배제된 세포 파편을 이용한 분석을 위해 적어도 5000건을 취합하였다.
실질적으로 동질적인 GO 글리코형의 리투시맵-서열 mAb의 CDC 활성은 리투시맵의 활성에 비해 감소되었다.
본 명세서에 언급된 모든 공개물 및 특허 출원은 본 발명이 속하는 기술분야의 당업자의 수준을 나타낸다. 모든 공개물 및 특허 출원은, 각각의 공개물 또는 특허 출원이 원용에 의해 포함되는 것으로 구체적이고 개별적으로 제시되어 있는 것과 동일한 수준으로 원용에 의해 본원에 포함된다.
SEQUENCE LISTING <110> Dickey, Lynn F. Cox, Kevin M. Peele, Charles G. Wang, Ming-Bo <120> COMPOSITIONS AND METHODS FOR HUMANIZATION AND OPTIMIZATION OF N-GLYCANS IN PLANTS <130> 040989/322372 <150> 60/759,298 <151> 2006-01-17 <150> 60/790,373 <151> 2006-04-07 <150> 60/791,178 <151> 2006-04-11 <150> 60/812,702 <151> 2006-06-09 <150> 60/836,998 <151> 2006-08-11 <150> 60/860,358 <151> 2006-11-21 <160> 29 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 1865 <212> DNA <213> Lemna minor <220> <221> CDS <222> (243)...(1715) <400> 1 acgcgggggg aagtggttga gtagctcagt ggaaaattgg aaatgtctat tagaggggga 60 agaggggagg gatccgaggg gaacgaggaa ggtgtgccga attctcgtag atttcttcaa 120 ttcctgcaga tctcgtcttc tctctgattt cttcccgagc tccgcccgta ggaactcaat 180 cggactcgat ccaagttgac gaggcctacy gaggaaggcg attttccgaa gccctgcgat 240 cg atg gcc acc tct gct gct ggt gct ctc aac gcc ggt ggc agg gtc 287 Met Ala Thr Ser Ala Ala Gly Ala Leu Asn Ala Gly Gly Arg Val 1 5 10 15 ggg ggc agg agg agt tgg gtc aga ttg ctt ccc ttc ttt gtg ttg atg 335 Gly Gly Arg Arg Ser Trp Val Arg Leu Leu Pro Phe Phe Val Leu Met 20 25 30 ctg gtg gta ggg gag atc tgg ttc ctc ggg cgg ctg gat gtg gtc aag 383 Leu Val Val Gly Glu Ile Trp Phe Leu Gly Arg Leu Asp Val Val Lys 35 40 45 aac gcc gct atg gtt caa aac tgg act tcc tcc cac ttg ttt ttc tta 431 Asn Ala Ala Met Val Gln Asn Trp Thr Ser Ser His Leu Phe Phe Leu 50 55 60 cca gtt tct tcc tac acg tgg tcc gag acc gtc aag gag gaa gag gat 479 Pro Val Ser Ser Tyr Thr Trp Ser Glu Thr Val Lys Glu Glu Glu Asp 65 70 75 tgc aag gac tgg ctg gaa aga gta gat gcg gtc gat tac aag aga gat 527 Cys Lys Asp Trp Leu Glu Arg Val Asp Ala Val Asp Tyr Lys Arg Asp 80 85 90 95 ttc cgt gtg gaa ccc gtt ctg gta aat gac gct gaa cag gat tgg agt 575 Phe Arg Val Glu Pro Val Leu Val Asn Asp Ala Glu Gln Asp Trp Ser 100 105 110 tca tgt tca gtg ggc tgt aag ttc gga tca ttc ccc gga aga acg cct 623 Ser Cys Ser Val Gly Cys Lys Phe Gly Ser Phe Pro Gly Arg Thr Pro 115 120 125 gat gct aca ttt ggt ttc tct cag aat cca tca aca gtc agt gtc cat 671 Asp Ala Thr Phe Gly Phe Ser Gln Asn Pro Ser Thr Val Ser Val His 130 135 140 cga tcc atg gaa tca tcc cat tat tat ttg gag aat aat ctt gat aat 719 Arg Ser Met Glu Ser Ser His Tyr Tyr Leu Glu Asn Asn Leu Asp Asn 145 150 155 gca cga cgg aaa ggc tat caa att gtg atg aca act agt ctc ttg tca 767 Ala Arg Arg Lys Gly Tyr Gln Ile Val Met Thr Thr Ser Leu Leu Ser 160 165 170 175 gat gtg cct gtc ggt tat ttc tca tgg gct gaa tat gat atc atg gcg 815 Asp Val Pro Val Gly Tyr Phe Ser Trp Ala Glu Tyr Asp Ile Met Ala 180 185 190 cct ctt cag ccg aaa act gct ggt gca ctt gct gct gca ttt ata tct 863 Pro Leu Gln Pro Lys Thr Ala Gly Ala Leu Ala Ala Ala Phe Ile Ser 195 200 205 aat tgc gga gca cgt aat ttc cgc ttg cag gcc ctt gat atg ctc gaa 911 Asn Cys Gly Ala Arg Asn Phe Arg Leu Gln Ala Leu Asp Met Leu Glu 210 215 220 aag tcg aat att aag att gat tca tat ggt gct tgc cat cgc aac caa 959 Lys Ser Asn Ile Lys Ile Asp Ser Tyr Gly Ala Cys His Arg Asn Gln 225 230 235 gac ggt aaa gtg gac aag gta caa act ttg aag cgg tat aag ttc agc 1007 Asp Gly Lys Val Asp Lys Val Gln Thr Leu Lys Arg Tyr Lys Phe Ser 240 245 250 255 tta gct ttt gaa aac tcg aac gag gat gac tat gtt act gag aag ttc 1055 Leu Ala Phe Glu Asn Ser Asn Glu Asp Asp Tyr Val Thr Glu Lys Phe 260 265 270 ttt caa tct ctt gtc gct gga gct att cct gtt gtc gtc gga gcc ccc 1103 Phe Gln Ser Leu Val Ala Gly Ala Ile Pro Val Val Val Gly Ala Pro 275 280 285 aac att caa aat ttt gcg cca tct tct gat tca att ctg cac atc agg 1151 Asn Ile Gln Asn Phe Ala Pro Ser Ser Asp Ser Ile Leu His Ile Arg 290 295 300 gag ccc aag gat gtc agt tca gtc gct gag aga atg aaa ttt ctc gct 1199 Glu Pro Lys Asp Val Ser Ser Val Ala Glu Arg Met Lys Phe Leu Ala 305 310 315 tca aat cca gaa gca tat aac caa tca ctg agg tgg aag ttt gag ggc 1247 Ser Asn Pro Glu Ala Tyr Asn Gln Ser Leu Arg Trp Lys Phe Glu Gly 320 325 330 335 cct tct aac tcc ttc aaa gcc ctg gtg gac atg gca gca gtt cac tcc 1295 Pro Ser Asn Ser Phe Lys Ala Leu Val Asp Met Ala Ala Val His Ser 340 345 350 tcc tgc cgc cta tgc att cac att gcc acc aag atc aga gag aag gaa 1343 Ser Cys Arg Leu Cys Ile His Ile Ala Thr Lys Ile Arg Glu Lys Glu 355 360 365 gag aga aac ccg aat ttc aag act cgc cct tgc aag tgc acc cgc aat 1391 Glu Arg Asn Pro Asn Phe Lys Thr Arg Pro Cys Lys Cys Thr Arg Asn 370 375 380 ggg tct acc tta tat cac tta tac gcc cgc gaa aga ggc acc ttt gac 1439 Gly Ser Thr Leu Tyr His Leu Tyr Ala Arg Glu Arg Gly Thr Phe Asp 385 390 395 ttc tta tca atc ttc atg aga tcg gat aat cta tca ctg aaa gcg ctg 1487 Phe Leu Ser Ile Phe Met Arg Ser Asp Asn Leu Ser Leu Lys Ala Leu 400 405 410 415 ggg tca aca gtt ctt gag aaa ttc agt tct ttg aag cac gtg ccg att 1535 Gly Ser Thr Val Leu Glu Lys Phe Ser Ser Leu Lys His Val Pro Ile 420 425 430 tgg aag aag gag agg cca gag agt ctg aaa gga ggg agc aag ctg gat 1583 Trp Lys Lys Glu Arg Pro Glu Ser Leu Lys Gly Gly Ser Lys Leu Asp 435 440 445 ctt tac aga atc tat cca gtg ggc att act cag aga gaa gct ctc ttc 1631 Leu Tyr Arg Ile Tyr Pro Val Gly Ile Thr Gln Arg Glu Ala Leu Phe 450 455 460 tct ttc cag ttc aac act gac aaa gaa ctt caa atc tac ctt gaa tcc 1679 Ser Phe Gln Phe Asn Thr Asp Lys Glu Leu Gln Ile Tyr Leu Glu Ser 465 470 475 cat cca tgt gcg aag ttt gaa gtc atc ttt att tga tccctgaggt 1725 His Pro Cys Ala Lys Phe Glu Val Ile Phe Ile * 480 485 490 aattaggtca cgaattcagc taatttggtt aattatgctt caagcccaca tggtatttca 1785 tatcattaat tgaaggcata gttagttgat attgacattt tcgtctagga tcattctaaa 1845 gtctatccca atgaacttaa 1865 <210> 2 <211> 1473 <212> DNA <213> Lemna minor <220> <221> CDS <222> (1)...(1473) <223> Encodes alpha-1, 3-fucosyltransferase <400> 2 atg gcc acc tct gct gct ggt gct ctc aac gcc ggt ggc agg gtc ggg 48 Met Ala Thr Ser Ala Ala Gly Ala Leu Asn Ala Gly Gly Arg Val Gly 1 5 10 15 ggc agg agg agt tgg gtc aga ttg ctt ccc ttc ttt gtg ttg atg ctg 96 Gly Arg Arg Ser Trp Val Arg Leu Leu Pro Phe Phe Val Leu Met Leu 20 25 30 gtg gta ggg gag atc tgg ttc ctc ggg cgg ctg gat gtg gtc aag aac 144 Val Val Gly Glu Ile Trp Phe Leu Gly Arg Leu Asp Val Val Lys Asn 35 40 45 gcc gct atg gtt caa aac tgg act tcc tcc cac ttg ttt ttc tta cca 192 Ala Ala Met Val Gln Asn Trp Thr Ser Ser His Leu Phe Phe Leu Pro 50 55 60 gtt tct tcc tac acg tgg tcc gag acc gtc aag gag gaa gag gat tgc 240 Val Ser Ser Tyr Thr Trp Ser Glu Thr Val Lys Glu Glu Glu Asp Cys 65 70 75 80 aag gac tgg ctg gaa aga gta gat gcg gtc gat tac aag aga gat ttc 288 Lys Asp Trp Leu Glu Arg Val Asp Ala Val Asp Tyr Lys Arg Asp Phe 85 90 95 cgt gtg gaa ccc gtt ctg gta aat gac gct gaa cag gat tgg agt tca 336 Arg Val Glu Pro Val Leu Val Asn Asp Ala Glu Gln Asp Trp Ser Ser 100 105 110 tgt tca gtg ggc tgt aag ttc gga tca ttc ccc gga aga acg cct gat 384 Cys Ser Val Gly Cys Lys Phe Gly Ser Phe Pro Gly Arg Thr Pro Asp 115 120 125 gct aca ttt ggt ttc tct cag aat cca tca aca gtc agt gtc cat cga 432 Ala Thr Phe Gly Phe Ser Gln Asn Pro Ser Thr Val Ser Val His Arg 130 135 140 tcc atg gaa tca tcc cat tat tat ttg gag aat aat ctt gat aat gca 480 Ser Met Glu Ser Ser His Tyr Tyr Leu Glu Asn Asn Leu Asp Asn Ala 145 150 155 160 cga cgg aaa ggc tat caa att gtg atg aca act agt ctc ttg tca gat 528 Arg Arg Lys Gly Tyr Gln Ile Val Met Thr Thr Ser Leu Leu Ser Asp 165 170 175 gtg cct gtc ggt tat ttc tca tgg gct gaa tat gat atc atg gcg cct 576 Val Pro Val Gly Tyr Phe Ser Trp Ala Glu Tyr Asp Ile Met Ala Pro 180 185 190 ctt cag ccg aaa act gct ggt gca ctt gct gct gca ttt ata tct aat 624 Leu Gln Pro Lys Thr Ala Gly Ala Leu Ala Ala Ala Phe Ile Ser Asn 195 200 205 tgc gga gca cgt aat ttc cgc ttg cag gcc ctt gat atg ctc gaa aag 672 Cys Gly Ala Arg Asn Phe Arg Leu Gln Ala Leu Asp Met Leu Glu Lys 210 215 220 tcg aat att aag att gat tca tat ggt gct tgc cat cgc aac caa gac 720 Ser Asn Ile Lys Ile Asp Ser Tyr Gly Ala Cys His Arg Asn Gln Asp 225 230 235 240 ggt aaa gtg gac aag gta caa act ttg aag cgg tat aag ttc agc tta 768 Gly Lys Val Asp Lys Val Gln Thr Leu Lys Arg Tyr Lys Phe Ser Leu 245 250 255 gct ttt gaa aac tcg aac gag gat gac tat gtt act gag aag ttc ttt 816 Ala Phe Glu Asn Ser Asn Glu Asp Asp Tyr Val Thr Glu Lys Phe Phe 260 265 270 caa tct ctt gtc gct gga gct att cct gtt gtc gtc gga gcc ccc aac 864 Gln Ser Leu Val Ala Gly Ala Ile Pro Val Val Val Gly Ala Pro Asn 275 280 285 att caa aat ttt gcg cca tct tct gat tca att ctg cac atc agg gag 912 Ile Gln Asn Phe Ala Pro Ser Ser Asp Ser Ile Leu His Ile Arg Glu 290 295 300 ccc aag gat gtc agt tca gtc gct gag aga atg aaa ttt ctc gct tca 960 Pro Lys Asp Val Ser Ser Val Ala Glu Arg Met Lys Phe Leu Ala Ser 305 310 315 320 aat cca gaa gca tat aac caa tca ctg agg tgg aag ttt gag ggc cct 1008 Asn Pro Glu Ala Tyr Asn Gln Ser Leu Arg Trp Lys Phe Glu Gly Pro 325 330 335 tct aac tcc ttc aaa gcc ctg gtg gac atg gca gca gtt cac tcc tcc 1056 Ser Asn Ser Phe Lys Ala Leu Val Asp Met Ala Ala Val His Ser Ser 340 345 350 tgc cgc cta tgc att cac att gcc acc aag atc aga gag aag gaa gag 1104 Cys Arg Leu Cys Ile His Ile Ala Thr Lys Ile Arg Glu Lys Glu Glu 355 360 365 aga aac ccg aat ttc aag act cgc cct tgc aag tgc acc cgc aat ggg 1152 Arg Asn Pro Asn Phe Lys Thr Arg Pro Cys Lys Cys Thr Arg Asn Gly 370 375 380 tct acc tta tat cac tta tac gcc cgc gaa aga ggc acc ttt gac ttc 1200 Ser Thr Leu Tyr His Leu Tyr Ala Arg Glu Arg Gly Thr Phe Asp Phe 385 390 395 400 tta tca atc ttc atg aga tcg gat aat cta tca ctg aaa gcg ctg ggg 1248 Leu Ser Ile Phe Met Arg Ser Asp Asn Leu Ser Leu Lys Ala Leu Gly 405 410 415 tca aca gtt ctt gag aaa ttc agt tct ttg aag cac gtg ccg att tgg 1296 Ser Thr Val Leu Glu Lys Phe Ser Ser Leu Lys His Val Pro Ile Trp 420 425 430 aag aag gag agg cca gag agt ctg aaa gga ggg agc aag ctg gat ctt 1344 Lys Lys Glu Arg Pro Glu Ser Leu Lys Gly Gly Ser Lys Leu Asp Leu 435 440 445 tac aga atc tat cca gtg ggc att act cag aga gaa gct ctc ttc tct 1392 Tyr Arg Ile Tyr Pro Val Gly Ile Thr Gln Arg Glu Ala Leu Phe Ser 450 455 460 ttc cag ttc aac act gac aaa gaa ctt caa atc tac ctt gaa tcc cat 1440 Phe Gln Phe Asn Thr Asp Lys Glu Leu Gln Ile Tyr Leu Glu Ser His 465 470 475 480 cca tgt gcg aag ttt gaa gtc atc ttt att tga 1473 Pro Cys Ala Lys Phe Glu Val Ile Phe Ile * 485 490 <210> 3 <211> 490 <212> PRT <213> Lemna minor <400> 3 Met Ala Thr Ser Ala Ala Gly Ala Leu Asn Ala Gly Gly Arg Val Gly 1 5 10 15 Gly Arg Arg Ser Trp Val Arg Leu Leu Pro Phe Phe Val Leu Met Leu 20 25 30 Val Val Gly Glu Ile Trp Phe Leu Gly Arg Leu Asp Val Val Lys Asn 35 40 45 Ala Ala Met Val Gln Asn Trp Thr Ser Ser His Leu Phe Phe Leu Pro 50 55 60 Val Ser Ser Tyr Thr Trp Ser Glu Thr Val Lys Glu Glu Glu Asp Cys 65 70 75 80 Lys Asp Trp Leu Glu Arg Val Asp Ala Val Asp Tyr Lys Arg Asp Phe 85 90 95 Arg Val Glu Pro Val Leu Val Asn Asp Ala Glu Gln Asp Trp Ser Ser 100 105 110 Cys Ser Val Gly Cys Lys Phe Gly Ser Phe Pro Gly Arg Thr Pro Asp 115 120 125 Ala Thr Phe Gly Phe Ser Gln Asn Pro Ser Thr Val Ser Val His Arg 130 135 140 Ser Met Glu Ser Ser His Tyr Tyr Leu Glu Asn Asn Leu Asp Asn Ala 145 150 155 160 Arg Arg Lys Gly Tyr Gln Ile Val Met Thr Thr Ser Leu Leu Ser Asp 165 170 175 Val Pro Val Gly Tyr Phe Ser Trp Ala Glu Tyr Asp Ile Met Ala Pro 180 185 190 Leu Gln Pro Lys Thr Ala Gly Ala Leu Ala Ala Ala Phe Ile Ser Asn 195 200 205 Cys Gly Ala Arg Asn Phe Arg Leu Gln Ala Leu Asp Met Leu Glu Lys 210 215 220 Ser Asn Ile Lys Ile Asp Ser Tyr Gly Ala Cys His Arg Asn Gln Asp 225 230 235 240 Gly Lys Val Asp Lys Val Gln Thr Leu Lys Arg Tyr Lys Phe Ser Leu 245 250 255 Ala Phe Glu Asn Ser Asn Glu Asp Asp Tyr Val Thr Glu Lys Phe Phe 260 265 270 Gln Ser Leu Val Ala Gly Ala Ile Pro Val Val Val Gly Ala Pro Asn 275 280 285 Ile Gln Asn Phe Ala Pro Ser Ser Asp Ser Ile Leu His Ile Arg Glu 290 295 300 Pro Lys Asp Val Ser Ser Val Ala Glu Arg Met Lys Phe Leu Ala Ser 305 310 315 320 Asn Pro Glu Ala Tyr Asn Gln Ser Leu Arg Trp Lys Phe Glu Gly Pro 325 330 335 Ser Asn Ser Phe Lys Ala Leu Val Asp Met Ala Ala Val His Ser Ser 340 345 350 Cys Arg Leu Cys Ile His Ile Ala Thr Lys Ile Arg Glu Lys Glu Glu 355 360 365 Arg Asn Pro Asn Phe Lys Thr Arg Pro Cys Lys Cys Thr Arg Asn Gly 370 375 380 Ser Thr Leu Tyr His Leu Tyr Ala Arg Glu Arg Gly Thr Phe Asp Phe 385 390 395 400 Leu Ser Ile Phe Met Arg Ser Asp Asn Leu Ser Leu Lys Ala Leu Gly 405 410 415 Ser Thr Val Leu Glu Lys Phe Ser Ser Leu Lys His Val Pro Ile Trp 420 425 430 Lys Lys Glu Arg Pro Glu Ser Leu Lys Gly Gly Ser Lys Leu Asp Leu 435 440 445 Tyr Arg Ile Tyr Pro Val Gly Ile Thr Gln Arg Glu Ala Leu Phe Ser 450 455 460 Phe Gln Phe Asn Thr Asp Lys Glu Leu Gln Ile Tyr Leu Glu Ser His 465 470 475 480 Pro Cys Ala Lys Phe Glu Val Ile Phe Ile 485 490 <210> 4 <211> 1860 <212> DNA <213> Lemna minor <220> <221> CDS <222> (63)...(1592) <400> 4 ggcttccaac cggaggatct cgagctgaag aatcttcatg actgaagaat tcatgtgatc 60 cc atg gct ttg gtg aac tcg cga ggg agc agg gtc aga cgc atc gcg 107 Met Ala Leu Val Asn Ser Arg Gly Ser Arg Val Arg Arg Ile Ala 1 5 10 15 aag ccc acc ttc gtt ttc ctc ttg atc aac gta gtc tgt ctc ctg tac 155 Lys Pro Thr Phe Val Phe Leu Leu Ile Asn Val Val Cys Leu Leu Tyr 20 25 30 ttt ttc cgt cag aac cct aat ccc att ccc gac gct tgt ctt cac ggg 203 Phe Phe Arg Gln Asn Pro Asn Pro Ile Pro Asp Ala Cys Leu His Gly 35 40 45 gaa tgc gac aaa ccc ccg att tta gtg act ccc cgg cga tgg aac ttg 251 Glu Cys Asp Lys Pro Pro Ile Leu Val Thr Pro Arg Arg Trp Asn Leu 50 55 60 aag cca tgg ccg att ctt cct tcc ttt ctg cca tgg gtg ccg agc tcc 299 Lys Pro Trp Pro Ile Leu Pro Ser Phe Leu Pro Trp Val Pro Ser Ser 65 70 75 cac cct gcc cag ggc tcc tgc gaa gcc tac ttc ggc aac agc ttc aac 347 His Pro Ala Gln Gly Ser Cys Glu Ala Tyr Phe Gly Asn Ser Phe Asn 80 85 90 95 cgc cgg acg gag atg ctg aag aag gta gag gga aga gga tgg ttc cag 395 Arg Arg Thr Glu Met Leu Lys Lys Val Glu Gly Arg Gly Trp Phe Gln 100 105 110 tgc ctg tac agc gat act ctt cga agt tct gtt tgc cag gga ggg aat 443 Cys Leu Tyr Ser Asp Thr Leu Arg Ser Ser Val Cys Gln Gly Gly Asn 115 120 125 ttg cgg atg gac ccg gaa agg att agg atg tcg aaa ggg ggg gaa gat 491 Leu Arg Met Asp Pro Glu Arg Ile Arg Met Ser Lys Gly Gly Glu Asp 130 135 140 cta gag gag gtg atg aag aga gag gag gaa gaa gaa ttg ccc aaa ttc 539 Leu Glu Glu Val Met Lys Arg Glu Glu Glu Glu Glu Leu Pro Lys Phe 145 150 155 gag gag ggg tcg ttc cag att gaa tct ggt tat gga agc gga ggg gaa 587 Glu Glu Gly Ser Phe Gln Ile Glu Ser Gly Tyr Gly Ser Gly Gly Glu 160 165 170 175 gtt gga gag aga att gcg act gac gag gtc ctc gat aat gtt gtg ccg 635 Val Gly Glu Arg Ile Ala Thr Asp Glu Val Leu Asp Asn Val Val Pro 180 185 190 aaa ggc gct gtt cat gta cat acc atg cgc aat ctc atc agt tcg att 683 Lys Gly Ala Val His Val His Thr Met Arg Asn Leu Ile Ser Ser Ile 195 200 205 cag att gtt ggt ccc ggg cat ctt caa tgc tct cag tgg atc gac gaa 731 Gln Ile Val Gly Pro Gly His Leu Gln Cys Ser Gln Trp Ile Asp Glu 210 215 220 ccg gtt ctt ctt gtc aca cgc ttc gaa tac gcc aat ctc ttt cac acc 779 Pro Val Leu Leu Val Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr 225 230 235 gtc acc gac tgg tac agc gcc tac gca agc tcg agg att gcc aac ttg 827 Val Thr Asp Trp Tyr Ser Ala Tyr Ala Ser Ser Arg Ile Ala Asn Leu 240 245 250 255 cct tct cgc cct cac tta att ttc gtc gat ggc cat tgc agg gcg gaa 875 Pro Ser Arg Pro His Leu Ile Phe Val Asp Gly His Cys Arg Ala Glu 260 265 270 cag tta gag gac atg tgg aga gcc ctg ttc tcg acc gtc cga tac tcc 923 Gln Leu Glu Asp Met Trp Arg Ala Leu Phe Ser Thr Val Arg Tyr Ser 275 280 285 aag aac ttc tcc cag cca atc tgc ttc cgc cac gtc gtc ctc tca cct 971 Lys Asn Phe Ser Gln Pro Ile Cys Phe Arg His Val Val Leu Ser Pro 290 295 300 ctg ggc tat gag acg gct ctc ttc aaa ggc cta tca gag agc ttc agc 1019 Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Ser Phe Ser 305 310 315 tgt gag gga gct ccg gcc aat cgg ctc aaa gtc aac ccc gat gac cag 1067 Cys Glu Gly Ala Pro Ala Asn Arg Leu Lys Val Asn Pro Asp Asp Gln 320 325 330 335 aag act gca aga ctg gct gaa ttc gga gag atg atc aga gcc gcc ttt 1115 Lys Thr Ala Arg Leu Ala Glu Phe Gly Glu Met Ile Arg Ala Ala Phe 340 345 350 gac ttt cct gtc gtt gac ccg tcc att gac ccg ttg acc aaa tcc atc 1163 Asp Phe Pro Val Val Asp Pro Ser Ile Asp Pro Leu Thr Lys Ser Ile 355 360 365 ctc ttc gtg cgg cgg gaa gat tac gtg gcg cac cca cgc cac agt ggg 1211 Leu Phe Val Arg Arg Glu Asp Tyr Val Ala His Pro Arg His Ser Gly 370 375 380 aga gtg gag tcg cgg ctg acc aac gag caa gag gtg ttt gac ttt ctg 1259 Arg Val Glu Ser Arg Leu Thr Asn Glu Gln Glu Val Phe Asp Phe Leu 385 390 395 cac aat tgg gca agt cat cac aga ggc agg tgc aac atc agt atg gtc 1307 His Asn Trp Ala Ser His His Arg Gly Arg Cys Asn Ile Ser Met Val 400 405 410 415 aac ggg ctt ttc gcg cac atg gga atg aag gaa cag ttg aag gcg att 1355 Asn Gly Leu Phe Ala His Met Gly Met Lys Glu Gln Leu Lys Ala Ile 420 425 430 atg gaa gct tcg gtg gtg gtg ggg gcc cac ggg gct ggt ttg acc cat 1403 Met Glu Ala Ser Val Val Val Gly Ala His Gly Ala Gly Leu Thr His 435 440 445 ctg gtg gca gca agg tca acg aca gtt gtt ctt gag att ctg agt agt 1451 Leu Val Ala Ala Arg Ser Thr Thr Val Val Leu Glu Ile Leu Ser Ser 450 455 460 caa tac cgt aga ccg cac ttt caa ctg att tct cgg tgg aaa ggg ttg 1499 Gln Tyr Arg Arg Pro His Phe Gln Leu Ile Ser Arg Trp Lys Gly Leu 465 470 475 gac tac cat gca att aat ctt gcc ggg tca ttt gct gac cct cgg gag 1547 Asp Tyr His Ala Ile Asn Leu Ala Gly Ser Phe Ala Asp Pro Arg Glu 480 485 490 495 gtg gtc gag aaa ttg act ggc ata gtt gac agg ctt gga tgt tga 1592 Val Val Glu Lys Leu Thr Gly Ile Val Asp Arg Leu Gly Cys * 500 505 agagaagtga aagtcaacat ttggaatttt aactttaagg ggtggttaac aattgagcgg 1652 cattgtcaac gggtttggat gctgggaaaa gtgaaaatca acacttggag ttctgacatt 1712 gaaggcaaga cgtggaattt tgatggtgtt gaggatattt ggatgtggag ttctgatgaa 1772 ttaaagcagg ggttgatcat ttgccagtgg aattatgttg gtgtaagaga gaagggggag 1832 aataaacagt gttagagagc tatgctgg 1860 <210> 5 <211> 1530 <212> DNA <213> Lemna minor <220> <221> CDS <222> (1)...(1530) <223> XyIT isoform #1; Encodes beta-1, 2-xylosyltransferase <400> 5 atg gct ttg gtg aac tcg cga ggg agc agg gtc aga cgc atc gcg aag 48 Met Ala Leu Val Asn Ser Arg Gly Ser Arg Val Arg Arg Ile Ala Lys 1 5 10 15 ccc acc ttc gtt ttc ctc ttg atc aac gta gtc tgt ctc ctg tac ttt 96 Pro Thr Phe Val Phe Leu Leu Ile Asn Val Val Cys Leu Leu Tyr Phe 20 25 30 ttc cgt cag aac cct aat ccc att ccc gac gct tgt ctt cac ggg gaa 144 Phe Arg Gln Asn Pro Asn Pro Ile Pro Asp Ala Cys Leu His Gly Glu 35 40 45 tgc gac aaa ccc ccg att tta gtg act ccc cgg cga tgg aac ttg aag 192 Cys Asp Lys Pro Pro Ile Leu Val Thr Pro Arg Arg Trp Asn Leu Lys 50 55 60 cca tgg ccg att ctt cct tcc ttt ctg cca tgg gtg ccg agc tcc cac 240 Pro Trp Pro Ile Leu Pro Ser Phe Leu Pro Trp Val Pro Ser Ser His 65 70 75 80 cct gcc cag ggc tcc tgc gaa gcc tac ttc ggc aac agc ttc aac cgc 288 Pro Ala Gln Gly Ser Cys Glu Ala Tyr Phe Gly Asn Ser Phe Asn Arg 85 90 95 cgg acg gag atg ctg aag aag gta gag gga aga gga tgg ttc cag tgc 336 Arg Thr Glu Met Leu Lys Lys Val Glu Gly Arg Gly Trp Phe Gln Cys 100 105 110 ctg tac agc gat act ctt cga agt tct gtt tgc cag gga ggg aat ttg 384 Leu Tyr Ser Asp Thr Leu Arg Ser Ser Val Cys Gln Gly Gly Asn Leu 115 120 125 cgg atg gac ccg gaa agg att agg atg tcg aaa ggg ggg gaa gat cta 432 Arg Met Asp Pro Glu Arg Ile Arg Met Ser Lys Gly Gly Glu Asp Leu 130 135 140 gag gag gtg atg aag aga gag gag gaa gaa gaa ttg ccc aaa ttc gag 480 Glu Glu Val Met Lys Arg Glu Glu Glu Glu Glu Leu Pro Lys Phe Glu 145 150 155 160 gag ggg tcg ttc cag att gaa tct ggt tat gga agc gga ggg gaa gtt 528 Glu Gly Ser Phe Gln Ile Glu Ser Gly Tyr Gly Ser Gly Gly Glu Val 165 170 175 gga gag aga att gcg act gac gag gtc ctc gat aat gtt gtg ccg aaa 576 Gly Glu Arg Ile Ala Thr Asp Glu Val Leu Asp Asn Val Val Pro Lys 180 185 190 ggc gct gtt cat gta cat acc atg cgc aat ctc atc agt tcg att cag 624 Gly Ala Val His Val His Thr Met Arg Asn Leu Ile Ser Ser Ile Gln 195 200 205 att gtt ggt ccc ggg cat ctt caa tgc tct cag tgg atc gac gaa ccg 672 Ile Val Gly Pro Gly His Leu Gln Cys Ser Gln Trp Ile Asp Glu Pro 210 215 220 gtt ctt ctt gtc aca cgc ttc gaa tac gcc aat ctc ttt cac acc gtc 720 Val Leu Leu Val Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val 225 230 235 240 acc gac tgg tac agc gcc tac gca agc tcg agg att gcc aac ttg cct 768 Thr Asp Trp Tyr Ser Ala Tyr Ala Ser Ser Arg Ile Ala Asn Leu Pro 245 250 255 tct cgc cct cac tta att ttc gtc gat ggc cat tgc agg gcg gaa cag 816 Ser Arg Pro His Leu Ile Phe Val Asp Gly His Cys Arg Ala Glu Gln 260 265 270 tta gag gac atg tgg aga gcc ctg ttc tcg acc gtc cga tac tcc aag 864 Leu Glu Asp Met Trp Arg Ala Leu Phe Ser Thr Val Arg Tyr Ser Lys 275 280 285 aac ttc tcc cag cca atc tgc ttc cgc cac gtc gtc ctc tca cct ctg 912 Asn Phe Ser Gln Pro Ile Cys Phe Arg His Val Val Leu Ser Pro Leu 290 295 300 ggc tat gag acg gct ctc ttc aaa ggc cta tca gag agc ttc agc tgt 960 Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Ser Phe Ser Cys 305 310 315 320 gag gga gct ccg gcc aat cgg ctc aaa gtc aac ccc gat gac cag aag 1008 Glu Gly Ala Pro Ala Asn Arg Leu Lys Val Asn Pro Asp Asp Gln Lys 325 330 335 act gca aga ctg gct gaa ttc gga gag atg atc aga gcc gcc ttt gac 1056 Thr Ala Arg Leu Ala Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Asp 340 345 350 ttt cct gtc gtt gac ccg tcc att gac ccg ttg acc aaa tcc atc ctc 1104 Phe Pro Val Val Asp Pro Ser Ile Asp Pro Leu Thr Lys Ser Ile Leu 355 360 365 ttc gtg cgg cgg gaa gat tac gtg gcg cac cca cgc cac agt ggg aga 1152 Phe Val Arg Arg Glu Asp Tyr Val Ala His Pro Arg His Ser Gly Arg 370 375 380 gtg gag tcg cgg ctg acc aac gag caa gag gtg ttt gac ttt ctg cac 1200 Val Glu Ser Arg Leu Thr Asn Glu Gln Glu Val Phe Asp Phe Leu His 385 390 395 400 aat tgg gca agt cat cac aga ggc agg tgc aac atc agt atg gtc aac 1248 Asn Trp Ala Ser His His Arg Gly Arg Cys Asn Ile Ser Met Val Asn 405 410 415 ggg ctt ttc gcg cac atg gga atg aag gaa cag ttg aag gcg att atg 1296 Gly Leu Phe Ala His Met Gly Met Lys Glu Gln Leu Lys Ala Ile Met 420 425 430 gaa gct tcg gtg gtg gtg ggg gcc cac ggg gct ggt ttg acc cat ctg 1344 Glu Ala Ser Val Val Val Gly Ala His Gly Ala Gly Leu Thr His Leu 435 440 445 gtg gca gca agg tca acg aca gtt gtt ctt gag att ctg agt agt caa 1392 Val Ala Ala Arg Ser Thr Thr Val Val Leu Glu Ile Leu Ser Ser Gln 450 455 460 tac cgt aga ccg cac ttt caa ctg att tct cgg tgg aaa ggg ttg gac 1440 Tyr Arg Arg Pro His Phe Gln Leu Ile Ser Arg Trp Lys Gly Leu Asp 465 470 475 480 tac cat gca att aat ctt gcc ggg tca ttt gct gac cct cgg gag gtg 1488 Tyr His Ala Ile Asn Leu Ala Gly Ser Phe Ala Asp Pro Arg Glu Val 485 490 495 gtc gag aaa ttg act ggc ata gtt gac agg ctt gga tgt tga 1530 Val Glu Lys Leu Thr Gly Ile Val Asp Arg Leu Gly Cys * 500 505 <210> 6 <211> 509 <212> PRT <213> Lemna minor <400> 6 Met Ala Leu Val Asn Ser Arg Gly Ser Arg Val Arg Arg Ile Ala Lys 1 5 10 15 Pro Thr Phe Val Phe Leu Leu Ile Asn Val Val Cys Leu Leu Tyr Phe 20 25 30 Phe Arg Gln Asn Pro Asn Pro Ile Pro Asp Ala Cys Leu His Gly Glu 35 40 45 Cys Asp Lys Pro Pro Ile Leu Val Thr Pro Arg Arg Trp Asn Leu Lys 50 55 60 Pro Trp Pro Ile Leu Pro Ser Phe Leu Pro Trp Val Pro Ser Ser His 65 70 75 80 Pro Ala Gln Gly Ser Cys Glu Ala Tyr Phe Gly Asn Ser Phe Asn Arg 85 90 95 Arg Thr Glu Met Leu Lys Lys Val Glu Gly Arg Gly Trp Phe Gln Cys 100 105 110 Leu Tyr Ser Asp Thr Leu Arg Ser Ser Val Cys Gln Gly Gly Asn Leu 115 120 125 Arg Met Asp Pro Glu Arg Ile Arg Met Ser Lys Gly Gly Glu Asp Leu 130 135 140 Glu Glu Val Met Lys Arg Glu Glu Glu Glu Glu Leu Pro Lys Phe Glu 145 150 155 160 Glu Gly Ser Phe Gln Ile Glu Ser Gly Tyr Gly Ser Gly Gly Glu Val 165 170 175 Gly Glu Arg Ile Ala Thr Asp Glu Val Leu Asp Asn Val Val Pro Lys 180 185 190 Gly Ala Val His Val His Thr Met Arg Asn Leu Ile Ser Ser Ile Gln 195 200 205 Ile Val Gly Pro Gly His Leu Gln Cys Ser Gln Trp Ile Asp Glu Pro 210 215 220 Val Leu Leu Val Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val 225 230 235 240 Thr Asp Trp Tyr Ser Ala Tyr Ala Ser Ser Arg Ile Ala Asn Leu Pro 245 250 255 Ser Arg Pro His Leu Ile Phe Val Asp Gly His Cys Arg Ala Glu Gln 260 265 270 Leu Glu Asp Met Trp Arg Ala Leu Phe Ser Thr Val Arg Tyr Ser Lys 275 280 285 Asn Phe Ser Gln Pro Ile Cys Phe Arg His Val Val Leu Ser Pro Leu 290 295 300 Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Ser Phe Ser Cys 305 310 315 320 Glu Gly Ala Pro Ala Asn Arg Leu Lys Val Asn Pro Asp Asp Gln Lys 325 330 335 Thr Ala Arg Leu Ala Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Asp 340 345 350 Phe Pro Val Val Asp Pro Ser Ile Asp Pro Leu Thr Lys Ser Ile Leu 355 360 365 Phe Val Arg Arg Glu Asp Tyr Val Ala His Pro Arg His Ser Gly Arg 370 375 380 Val Glu Ser Arg Leu Thr Asn Glu Gln Glu Val Phe Asp Phe Leu His 385 390 395 400 Asn Trp Ala Ser His His Arg Gly Arg Cys Asn Ile Ser Met Val Asn 405 410 415 Gly Leu Phe Ala His Met Gly Met Lys Glu Gln Leu Lys Ala Ile Met 420 425 430 Glu Ala Ser Val Val Val Gly Ala His Gly Ala Gly Leu Thr His Leu 435 440 445 Val Ala Ala Arg Ser Thr Thr Val Val Leu Glu Ile Leu Ser Ser Gln 450 455 460 Tyr Arg Arg Pro His Phe Gln Leu Ile Ser Arg Trp Lys Gly Leu Asp 465 470 475 480 Tyr His Ala Ile Asn Leu Ala Gly Ser Phe Ala Asp Pro Arg Glu Val 485 490 495 Val Glu Lys Leu Thr Gly Ile Val Asp Arg Leu Gly Cys 500 505 <210> 7 <211> 2160 <212> DNA <213> Lemna minor <400> 7 agtcgagtga tatgaaatct tggtgaagaa ggatcggaga acggaccggg tgaggcaagg 60 ataattctgc tgttaaattc gagagcaaga cacctgcaat tcaagaatcg agtggcaatt 120 aatatagcag gatgatctgg aaggtagatc ctgcccatcg aatgatccaa acatcaacac 180 taggatcata ccgttaacaa taatgaatga aaaagtagaa gatgacgaag ttgaagtgat 240 gaccaaaaac tttgaaaatt ccaaccgtat ggccggaatc agtgtgaaga aaatcgaaat 300 caaatactct aatggatcgg attgttattc tggaggcaaa tctgaaactt cgaggatagg 360 atttaatcca cgcaagtaat aatttgaaac tcagaaggag aaaaaaaaac taaaatagag 420 aagaagagat ctcaaagaag ccgtgagcac gagacgaacg agaagaggta aagcaccagt 480 cagaggaaaa caccaaaatt agagaaatag cacgaacatt aaagcacaga tccgcgccgc 540 aaacccgaaa gacgaaaaat agagccaaac gaaaccctaa taatcgatct gcacaaaaaa 600 aaaaaaaaaa aactttgaga agagccgcga aattacccta gaatcctcag aactggccgg 660 acgagagaag cgctcgatcg aaacccaaca taaaacccct tccaacggca aattactccg 720 caaaacccga aaaataaaca aaatcaacga tcacgagaag gtgcaagggc aaaaagaggc 780 agtgcgatcg agagtctacc tgaatcgtcg gcgcaaaagg cgagcccacc gacgaacgct 840 ccctctagaa cctggagatg cggcgagaga gaaggaaaga tcttcggtgg gtgatgctcg 900 ctatttatcg caagagagtt agagagatct tcttcggcgg cggatttctg gcatctagcg 960 tttaacctca ccgcccagtg ctcacatcct tcttctcata tttgaatatt taattaacaa 1020 atgaatcagt catttttctt taatttttaa ttcccggaga gggcaatgtt ggtatcaaaa 1080 attatttagg aaaaattaat tacacgaata atcggatttt tccctttttt taattaattt 1140 ctaattttgg aaaaggaaag aaaaatttta ggggtatgga gggcaagaat gaaatattac 1200 aaaattaggg gtttttgcgt aatttattat atttaataaa gaaagtcgaa tattcccatc 1260 cgattggtag ttgaaagggg ccgaaaggcc tcggggtttc tagagatttc tacattattc 1320 tcgtttttgt cgccaagaag gtgggcaatt atgtttcatg ccttaacttc ttctttttgt 1380 gggaatactc ttattcttag tacaaaagaa aagagtatat gcataaataa gatgaaaaat 1440 gggtttattc gagatttcta cgtcatgtgt gactcgctta ggaaatatcg ccgaaaccta 1500 acaaaggcgg tacgctcctc tcccccgacc tataaataga gacctttgcc tcgtctttct 1560 caactcaagc atttctgtat gatccttctc tttccgcgga agctctcgcg ccagttgatc 1620 gcaaggtatg cgtctttcct ccttgtgatt cgatctttct gttggctaga tctggtctat 1680 tgatctgctc tattgatctg gtctatttat cgctgcatcg ggatctattg atccgtatgt 1740 tgatttggga tccgtaggtt ggtttggatc ggagactgcg atttgattct tgtgatttcg 1800 cttggatttc ggaaatcggt gtggttgaag tcgtgcgatc ttttagatct gctccttttt 1860 ttatttgcta ttttatattt acgttgttta tgatcgcgga ttattttgat tcgtttattc 1920 gagatccatg ccgtttaact cgttctttgt gctccgatct ttgcgatacg tcggtcgttc 1980 tagatccgtt cactaggtta gttttaagtt ctttgagctt gatttatatg gatttgctgt 2040 tttccaggaa aaatttatgc gcgattctta cgcccgtttc cccattttac tttaggtcgt 2100 gaattctttt gatctgagaa tgatgaatct gacatgtacc ttccggtttg taatttgcag 2160 <210> 8 <211> 2021 <212> DNA <213> Spirodela polyrrhiza <400> 8 caaataaaga gatggacaga taatgagatg aattagaaaa aaaaaattcg tgttgtaaga 60 tagaatactt gctatctact gatgaatgca gttcagtttt cctcacgatc ttaaagatcg 120 cgcactatcc tcagcttcac tctggaaatt ttgattctct tcttctgctc agcagcctcg 180 actctgtcta gggtttcgta caatcggacg ccattctaca tgaatcgagc acagggaatg 240 aagacaatta ggagatcctc gatgtcctcc gacttacttg catgacttga cggggaagat 300 ctcgagcagg gaagcgacgc ctctccggag gactcgcctc gccgagagga cctcctccgc 360 gacacggacc atggcctcca cggggtagaa gctggccctg ttctttattc tcttgaggat 420 catcggccga agcctccgca aatccatccc cgaggagtag aatctcgcct gcaggaagca 480 tctgtcgaga tcctcgccga ggcggcggag atacctcgcc ggcgccgcca tggcgccggg 540 gacggagcac caccacggag aagaagaacc ctaacccaag gcattaacga agttgcgcag 600 attatacaaa agccctcaaa tatctttcat tttctatttc actgatacat tttcattatt 660 gtatatgagt gtttatttaa attattccgt attagaaaag cacctccaga acccgacaaa 720 atagggtgac gtcatcatgg tgtcatgacc gcccaacagc cgcagattta aaatcggtgg 780 atgagtgcgg ccacgccacg aaagcgatgg gccttcgtcg atgccgtgag aatccatctg 840 acataaagta aacggcgccg tcagtattga cggcgtatga cacgtggaaa gaagctattg 900 gttcacgcat cggtggttcc gctagcctcc gtcgaccgct agtactataa atacggtccc 960 gaggcctcct caccactcgc acatatcctc tttgttttcc tctccgtgaa agaagcgagg 1020 aagcgcgtcg tctctcccaa ggtaaggagc agatctcttt gatcgttttt gttcttcttt 1080 tgttttgttt tttttttctg cggatcttcg gttgcatcat gccttggctg tttttattag 1140 tttaggatat cctcgtttgg atctgagccg atcatatatg ttaaaggttg tgttcgatct 1200 ctttgttcat tttcgcatga aaaggatgta tccttttgat gtgaggcgat cttctatggt 1260 taagactttg ttcggtctat tgatcatttc tgttcttcgt ttttgagttt ttttctgcgg 1320 atatcgcatc atccctaggt ttttgctttg gttaggatgc atcctttgga tttgagccga 1380 tctcccttgg ttaaggctgt gtctgttgca gaggagaaag tctgtcgagg tccttatgca 1440 ggctttgtcc agatgcgcgt gctctctcat gctatgaatt tatgttttga gaactcctcc 1500 cggtttttct agatccggat ttgaagtatt cattgcggtt ccccttcggt tttatgtatt 1560 tctcgagttg atttggtcca tgatcgtgtt ctgtccagat ctctcttgat atggatgaga 1620 tattcgttac ctctttcaaa catcggtgga tgttcttttt agtcttggct cacctttatc 1680 tagaaattaa ttttcggttt gaaacccctg cttgttaagg tgatgtattc cttctttata 1740 gatttcggtg tgttatttct taacggtgat ctgtccgatc catgtgttgc acctcttgtt 1800 ttctgtgtaa tcctctgtga attataatta tgttttgaaa acgtacttaa gtaaggggca 1860 tgttccccgt ttaaaacttt tgttctatca atttgtggtt aatagatcct gatttgtggt 1920 cgccttattc tgtctttaat cgtggatttt atttatcttg agcgcgtcct tttcttttaa 1980 aatcatgtgt ttaacctttc agtcgtcata tgttccatca g 2021 <210> 9 <211> 2068 <212> DNA <213> Lemna aequinoctialis <400> 9 agtgtaccaa tattttaaac cctacattta tcattcttta ttcattattg ccataagtta 60 atgaatattg aaattcaaat acgcgcaaga tgtcaatatc gatcgaatat gaataccaga 120 tataaaatca aaaatcaaat atcaaattaa taaagatata aaatattgaa tccaaaagca 180 ataaagaata tcactattaa tatcaaaata tcgatttgaa gttcaaaaat tgggtccatt 240 aggagccaag accgatcatg atccgatact gatatcaata tctgtagctc agtggctagg 300 cccctcaatt tgcctggccg aaggcagtgt acaaaacctg gctctcgcaa gggcaaagaa 360 agagtctttc ccaaaaaaaa aaaaatcgaa cccatttgta gtatccaata tttggattga 420 cataagatac caaaacataa agtactaacc acccaatctt ataattaatc aagatttata 480 tcacatccaa tatcaagatc cgatatcaat acctagaccg gtaaacccta atttactctt 540 cccccctcta aaaatttcca ataaatatct ccacatattt aactattaaa aaattgataa 600 gagataggcc ctagccctaa gtcctaacat ataaccactc tctatgaaaa gtcctattaa 660 atgacgtcat ttatttattt attgccggtt ggctgctcca cagccgcaat ttaatggatg 720 gctgacacgg cacgaaaccg acgggcggtg ccgtgggaat aattctagag taaacctaac 780 ggcgccgtta actttgacgg tggcgaagac gcgtggggat aggtggttgg tccgcgtgac 840 ggcggcggtt cagcccgtcg accttgagcc gagactataa atcgaggcga agggatgagc 900 tttgccattg cgttcttctt ctgttcatct ctgaaattcg ggcggaatcc ttcttcttct 960 caaggtatgg gcctcgatct ttctgtttca atcgagtttt gatcttcgtt ttggcggcga 1020 tcggtgtttt ctttgtattg tgaataaatc cttgataaga aaaccctagg ttttgtgacc 1080 tgttgacgga tgcgtgcgga tctgttattt gtcttttagg cgattttctc ttgtttgtaa 1140 tagtttatca taaccagatg aacatggatc aagtcgattt gacttatttt ttctgtgaaa 1200 ttaggccgaa atcctttttt ttggtttgag ccttgatatt tctatataat tcgatttgat 1260 tttttgtttt cttctgcgtc tgatgctttc tcttgactcc tgattaaatt tttgctacgg 1320 aaaccctaga tgtcgagatc tgttgacaga ttctggcaaa tctgttttta tcataatcag 1380 atgaacgcaa attaagtcga tttggttttt ctctgaaatt aggggggaaa ctccttatag 1440 tatgagcctc gatatttcta taatagtcga tttgattttc tcttgcctcc tgattcaatt 1500 tttggtgcgg aaaccctaga tattgtaatc tgtttacgga tgcttgcgga tctgattttt 1560 aatattgtga tctattgacg gatgctcgta gatctggttg ttttgatttc ttcatgcctt 1620 atacggcgat ttgattcggc gattaaaaat tttcaattct tttaaaaaaa atattaagat 1680 tttcaacgtt tcaaattatt tcatagatcg gcacaaatac ttttcatcag attcctcctg 1740 atgtgatggt ttgtgtttaa aatctgttga agatatcaga ttctattagg tcaccgatat 1800 aatcttctct gtttattctg cgatcggtgc ttacaaaccc tatttcctac ggtgattaat 1860 tatttttaat ctcctagcta gcgtaaatat atattttttt aatttgatct ttgcattagt 1920 ttcctccttt tatttgctat taattgtaac cgatgctaca aaacatcaga ttttttttcc 1980 caattcgttg tcatcattat agaaaacttt tatctgatat ttttaatcgt cattaatata 2040 attttcaatt tattattttc ccttgcag 2068 <210> 10 <211> 1625 <212> DNA <213> Lemna minor <400> 10 agtcgagtga tatgaaatct tggtgaagaa ggatcggaga acggaccggg tgaggcaagg 60 ataattctgc tgttaaattc gagagcaaga cacctgcaat tcaagaatcg agtggcaatt 120 aatatagcag gatgatctgg aaggtagatc ctgcccatcg aatgatccaa acatcaacac 180 taggatcata ccgttaacaa taatgaatga aaaagtagaa gatgacgaag ttgaagtgat 240 gaccaaaaac tttgaaaatt ccaaccgtat ggccggaatc agtgtgaaga aaatcgaaat 300 caaatactct aatggatcgg attgttattc tggaggcaaa tctgaaactt cgaggatagg 360 atttaatcca cgcaagtaat aatttgaaac tcagaaggag aaaaaaaaac taaaatagag 420 aagaagagat ctcaaagaag ccgtgagcac gagacgaacg agaagaggta aagcaccagt 480 cagaggaaaa caccaaaatt agagaaatag cacgaacatt aaagcacaga tccgcgccgc 540 aaacccgaaa gacgaaaaat agagccaaac gaaaccctaa taatcgatct gcacaaaaaa 600 aaaaaaaaaa aactttgaga agagccgcga aattacccta gaatcctcag aactggccgg 660 acgagagaag cgctcgatcg aaacccaaca taaaacccct tccaacggca aattactccg 720 caaaacccga aaaataaaca aaatcaacga tcacgagaag gtgcaagggc aaaaagaggc 780 agtgcgatcg agagtctacc tgaatcgtcg gcgcaaaagg cgagcccacc gacgaacgct 840 ccctctagaa cctggagatg cggcgagaga gaaggaaaga tcttcggtgg gtgatgctcg 900 ctatttatcg caagagagtt agagagatct tcttcggcgg cggatttctg gcatctagcg 960 tttaacctca ccgcccagtg ctcacatcct tcttctcata tttgaatatt taattaacaa 1020 atgaatcagt catttttctt taatttttaa ttcccggaga gggcaatgtt ggtatcaaaa 1080 attatttagg aaaaattaat tacacgaata atcggatttt tccctttttt taattaattt 1140 ctaattttgg aaaaggaaag aaaaatttta ggggtatgga gggcaagaat gaaatattac 1200 aaaattaggg gtttttgcgt aatttattat atttaataaa gaaagtcgaa tattcccatc 1260 cgattggtag ttgaaagggg ccgaaaggcc tcggggtttc tagagatttc tacattattc 1320 tcgtttttgt cgccaagaag gtgggcaatt atgtttcatg ccttaacttc ttctttttgt 1380 gggaatactc ttattcttag tacaaaagaa aagagtatat gcataaataa gatgaaaaat 1440 gggtttattc gagatttcta cgtcatgtgt gactcgctta ggaaatatcg ccgaaaccta 1500 acaaaggcgg tacgctcctc tcccccgacc tataaataga gacctttgcc tcgtctttct 1560 caactcaagc atttctgtat gatccttctc tttccgcgga agctctcgcg ccagttgatc 1620 gcaag 1625 <210> 11 <211> 1041 <212> DNA <213> Spirodela polyrrhiza <400> 11 caaataaaga gatggacaga taatgagatg aattagaaaa aaaaaattcg tgttgtaaga 60 tagaatactt gctatctact gatgaatgca gttcagtttt cctcacgatc ttaaagatcg 120 cgcactatcc tcagcttcac tctggaaatt ttgattctct tcttctgctc agcagcctcg 180 actctgtcta gggtttcgta caatcggacg ccattctaca tgaatcgagc acagggaatg 240 aagacaatta ggagatcctc gatgtcctcc gacttacttg catgacttga cggggaagat 300 ctcgagcagg gaagcgacgc ctctccggag gactcgcctc gccgagagga cctcctccgc 360 gacacggacc atggcctcca cggggtagaa gctggccctg ttctttattc tcttgaggat 420 catcggccga agcctccgca aatccatccc cgaggagtag aatctcgcct gcaggaagca 480 tctgtcgaga tcctcgccga ggcggcggag atacctcgcc ggcgccgcca tggcgccggg 540 gacggagcac caccacggag aagaagaacc ctaacccaag gcattaacga agttgcgcag 600 attatacaaa agccctcaaa tatctttcat tttctatttc actgatacat tttcattatt 660 gtatatgagt gtttatttaa attattccgt attagaaaag cacctccaga acccgacaaa 720 atagggtgac gtcatcatgg tgtcatgacc gcccaacagc cgcagattta aaatcggtgg 780 atgagtgcgg ccacgccacg aaagcgatgg gccttcgtcg atgccgtgag aatccatctg 840 acataaagta aacggcgccg tcagtattga cggcgtatga cacgtggaaa gaagctattg 900 gttcacgcat cggtggttcc gctagcctcc gtcgaccgct agtactataa atacggtccc 960 gaggcctcct caccactcgc acatatcctc tttgttttcc tctccgtgaa agaagcgagg 1020 aagcgcgtcg tctctcccaa g 1041 <210> 12 <211> 964 <212> DNA <213> Lemna aequinoctialis <400> 12 agtgtaccaa tattttaaac cctacattta tcattcttta ttcattattg ccataagtta 60 atgaatattg aaattcaaat acgcgcaaga tgtcaatatc gatcgaatat gaataccaga 120 tataaaatca aaaatcaaat atcaaattaa taaagatata aaatattgaa tccaaaagca 180 ataaagaata tcactattaa tatcaaaata tcgatttgaa gttcaaaaat tgggtccatt 240 aggagccaag accgatcatg atccgatact gatatcaata tctgtagctc agtggctagg 300 cccctcaatt tgcctggccg aaggcagtgt acaaaacctg gctctcgcaa gggcaaagaa 360 agagtctttc ccaaaaaaaa aaaaatcgaa cccatttgta gtatccaata tttggattga 420 cataagatac caaaacataa agtactaacc acccaatctt ataattaatc aagatttata 480 tcacatccaa tatcaagatc cgatatcaat acctagaccg gtaaacccta atttactctt 540 cccccctcta aaaatttcca ataaatatct ccacatattt aactattaaa aaattgataa 600 gagataggcc ctagccctaa gtcctaacat ataaccactc tctatgaaaa gtcctattaa 660 atgacgtcat ttatttattt attgccggtt ggctgctcca cagccgcaat ttaatggatg 720 gctgacacgg cacgaaaccg acgggcggtg ccgtgggaat aattctagag taaacctaac 780 ggcgccgtta actttgacgg tggcgaagac gcgtggggat aggtggttgg tccgcgtgac 840 ggcggcggtt cagcccgtcg accttgagcc gagactataa atcgaggcga agggatgagc 900 tttgccattg cgttcttctt ctgttcatct ctgaaattcg ggcggaatcc ttcttcttct 960 caag 964 <210> 13 <211> 535 <212> DNA <213> Lemna minor <400> 13 gtatgcgtct ttcctccttg tgattcgatc tttctgttgg ctagatctgg tctattgatc 60 tgctctattg atctggtcta tttatcgctg catcgggatc tattgatccg tatgttgatt 120 tgggatccgt aggttggttt ggatcggaga ctgcgatttg attcttgtga tttcgcttgg 180 atttcggaaa tcggtgtggt tgaagtcgtg cgatctttta gatctgctcc tttttttatt 240 tgctatttta tatttacgtt gtttatgatc gcggattatt ttgattcgtt tattcgagat 300 ccatgccgtt taactcgttc tttgtgctcc gatctttgcg atacgtcggt cgttctagat 360 ccgttcacta ggttagtttt aagttctttg agcttgattt atatggattt gctgttttcc 420 aggaaaaatt tatgcgcgat tcttacgccc gtttccccat tttactttag gtcgtgaatt 480 cttttgatct gagaatgatg aatctgacat gtaccttccg gtttgtaatt tgcag 535 <210> 14 <211> 980 <212> DNA <213> Spirodela polyrrhiza <400> 14 gtaaggagca gatctctttg atcgtttttg ttcttctttt gttttgtttt ttttttctgc 60 ggatcttcgg ttgcatcatg ccttggctgt ttttattagt ttaggatatc ctcgtttgga 120 tctgagccga tcatatatgt taaaggttgt gttcgatctc tttgttcatt ttcgcatgaa 180 aaggatgtat ccttttgatg tgaggcgatc ttctatggtt aagactttgt tcggtctatt 240 gatcatttct gttcttcgtt tttgagtttt tttctgcgga tatcgcatca tccctaggtt 300 tttgctttgg ttaggatgca tcctttggat ttgagccgat ctcccttggt taaggctgtg 360 tctgttgcag aggagaaagt ctgtcgaggt ccttatgcag gctttgtcca gatgcgcgtg 420 ctctctcatg ctatgaattt atgttttgag aactcctccc ggtttttcta gatccggatt 480 tgaagtattc attgcggttc cccttcggtt ttatgtattt ctcgagttga tttggtccat 540 gatcgtgttc tgtccagatc tctcttgata tggatgagat attcgttacc tctttcaaac 600 atcggtggat gttcttttta gtcttggctc acctttatct agaaattaat tttcggtttg 660 aaacccctgc ttgttaaggt gatgtattcc ttctttatag atttcggtgt gttatttctt 720 aacggtgatc tgtccgatcc atgtgttgca cctcttgttt tctgtgtaat cctctgtgaa 780 ttataattat gttttgaaaa cgtacttaag taaggggcat gttccccgtt taaaactttt 840 gttctatcaa tttgtggtta atagatcctg atttgtggtc gccttattct gtctttaatc 900 gtggatttta tttatcttga gcgcgtcctt ttcttttaaa atcatgtgtt taacctttca 960 gtcgtcatat gttccatcag 980 <210> 15 <211> 1104 <212> DNA <213> Lemna aequinoctialis <400> 15 gtatgggcct cgatctttct gtttcaatcg agttttgatc ttcgttttgg cggcgatcgg 60 tgttttcttt gtattgtgaa taaatccttg ataagaaaac cctaggtttt gtgacctgtt 120 gacggatgcg tgcggatctg ttatttgtct tttaggcgat tttctcttgt ttgtaatagt 180 ttatcataac cagatgaaca tggatcaagt cgatttgact tattttttct gtgaaattag 240 gccgaaatcc ttttttttgg tttgagcctt gatatttcta tataattcga tttgattttt 300 tgttttcttc tgcgtctgat gctttctctt gactcctgat taaatttttg ctacggaaac 360 cctagatgtc gagatctgtt gacagattct ggcaaatctg tttttatcat aatcagatga 420 acgcaaatta agtcgatttg gtttttctct gaaattaggg gggaaactcc ttatagtatg 480 agcctcgata tttctataat agtcgatttg attttctctt gcctcctgat tcaatttttg 540 gtgcggaaac cctagatatt gtaatctgtt tacggatgct tgcggatctg atttttaata 600 ttgtgatcta ttgacggatg ctcgtagatc tggttgtttt gatttcttca tgccttatac 660 ggcgatttga ttcggcgatt aaaaattttc aattctttta aaaaaaatat taagattttc 720 aacgtttcaa attatttcat agatcggcac aaatactttt catcagattc ctcctgatgt 780 gatggtttgt gtttaaaatc tgttgaagat atcagattct attaggtcac cgatataatc 840 ttctctgttt attctgcgat cggtgcttac aaaccctatt tcctacggtg attaattatt 900 tttaatctcc tagctagcgt aaatatatat ttttttaatt tgatctttgc attagtttcc 960 tccttttatt tgctattaat tgtaaccgat gctacaaaac atcagatttt ttttcccaat 1020 tcgttgtcat cattatagaa aacttttatc tgatattttt aatcgtcatt aatataattt 1080 tcaatttatt attttccctt gcag 1104 <210> 16 <211> 64 <212> DNA <213> Lemna gibba <400> 16 aagcacgagc tgagcgagaa ttcggggagg ctgagtcgaa gaggaagaga gaagtaggta 60 cgcc 64 <210> 17 <211> 58 <212> DNA <213> Lemna gibba <400> 17 actcgcaagt ggagagagga tccgagcgtc cagtgagagg aagagagagg gaggcgcg 58 <210> 18 <211> 62 <212> DNA <213> Lemna gibba <400> 18 aaactcccga ggtgagcaag gatccggagt cgagcgcgaa gaagagaaag agggaaagcg 60 cg 62 <210> 19 <211> 1282 <212> DNA <213> Lemna minor <220> <221> CDS <222> (1)...(1276) <400> 19 tgc gaa gcc tac ttc ggc aac agc ttc aac cgc cgg acg gag atg ctg 48 Cys Glu Ala Tyr Phe Gly Asn Ser Phe Asn Arg Arg Thr Glu Met Leu 1 5 10 15 aag aag gta gag gga aga gga tgg ttc cag tgc ctg tac agc gat act 96 Lys Lys Val Glu Gly Arg Gly Trp Phe Gln Cys Leu Tyr Ser Asp Thr 20 25 30 ctt cga agt tct gtt tgc cag gga ggg aat ttg cgg atg gac ccg gaa 144 Leu Arg Ser Ser Val Cys Gln Gly Gly Asn Leu Arg Met Asp Pro Glu 35 40 45 agg att agg atg tcg aaa ggg ggg gaa gat cta gag gag gtg atg aag 192 Arg Ile Arg Met Ser Lys Gly Gly Glu Asp Leu Glu Glu Val Met Lys 50 55 60 aga gag gag gaa gaa gaa ttg ccc aaa ttc gag gag ggg tcg ttc cag 240 Arg Glu Glu Glu Glu Glu Leu Pro Lys Phe Glu Glu Gly Ser Phe Gln 65 70 75 80 att gaa tct ggt tat gga agc gga ggg gaa gtt gga gag aga att gcg 288 Ile Glu Ser Gly Tyr Gly Ser Gly Gly Glu Val Gly Glu Arg Ile Ala 85 90 95 act gac gag gtc ctc gat aat gtt gtg ccg aaa ggc gct gtt cat gta 336 Thr Asp Glu Val Leu Asp Asn Val Val Pro Lys Gly Ala Val His Val 100 105 110 cat acc atg cgc aat ctc atc agt tcg att cag att gtt ggt ccc ggg 384 His Thr Met Arg Asn Leu Ile Ser Ser Ile Gln Ile Val Gly Pro Gly 115 120 125 cat ctt caa tgc tct cag tgg atc gac gaa ccg gtt ctt ctt gtc aca 432 His Leu Gln Cys Ser Gln Trp Ile Asp Glu Pro Val Leu Leu Val Thr 130 135 140 cgc ttc gaa tac gcc aat ctc ttt cac acc gtc acc gac tgg tac agc 480 Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser 145 150 155 160 gcc tac gca agc tcg agg att gcc aac ttg ccc tct cgc cct cac ttg 528 Ala Tyr Ala Ser Ser Arg Ile Ala Asn Leu Pro Ser Arg Pro His Leu 165 170 175 att ttc gtc gat ggc cat tgc agg gca gaa cag tta gag gac acg tgg 576 Ile Phe Val Asp Gly His Cys Arg Ala Glu Gln Leu Glu Asp Thr Trp 180 185 190 cga gcc ctg ttc tca acc gtc cga tac gcc aag aac ttc tcc cag cca 624 Arg Ala Leu Phe Ser Thr Val Arg Tyr Ala Lys Asn Phe Ser Gln Pro 195 200 205 gtc tgc ttc cgc cac gcc gtc ctc tcc cct ctt ggc tat gag aca gct 672 Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala 210 215 220 ctc ttc aaa ggc cta tca gag agc ttc agc tgt gag gga gtg ccg gcc 720 Leu Phe Lys Gly Leu Ser Glu Ser Phe Ser Cys Glu Gly Val Pro Ala 225 230 235 240 aat cag ctc aaa gtc aac cct gat gac cag aag act gcg aga ctg gct 768 Asn Gln Leu Lys Val Asn Pro Asp Asp Gln Lys Thr Ala Arg Leu Ala 245 250 255 gaa ttc gga gag atg atc agg gct gcc ttt gac ttt cct gtc gtt gac 816 Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Asp Phe Pro Val Val Asp 260 265 270 ccg ccc gtt gac ccg ttg acc aaa tcc atc ctc ttt gtg cgg cgg gaa 864 Pro Pro Val Asp Pro Leu Thr Lys Ser Ile Leu Phe Val Arg Arg Glu 275 280 285 gat tac gtg gcg cac cca cgc cac agt ggg aga gtg gag tcg cgg ttg 912 Asp Tyr Val Ala His Pro Arg His Ser Gly Arg Val Glu Ser Arg Leu 290 295 300 acc aat gag caa gag gtg ttt gac ttt ctg cac aaa tgg gca agt caa 960 Thr Asn Glu Gln Glu Val Phe Asp Phe Leu His Lys Trp Ala Ser Gln 305 310 315 320 cac aga agc agg tgc aac gtc agt gtg gtc aac ggg ctt ttc gcg cac 1008 His Arg Ser Arg Cys Asn Val Ser Val Val Asn Gly Leu Phe Ala His 325 330 335 atg gga atg aag gaa cag gtg aag gca att atg gaa gct tcg gtg gtg 1056 Met Gly Met Lys Glu Gln Val Lys Ala Ile Met Glu Ala Ser Val Val 340 345 350 gtc ggg gcc cac ggg gct ggt ttg act cat ctg gtg gca gca agg tca 1104 Val Gly Ala His Gly Ala Gly Leu Thr His Leu Val Ala Ala Arg Ser 355 360 365 acg aca gtt gtt ctt gag att ctg agc agt caa tat cgt aga ccg cac 1152 Thr Thr Val Val Leu Glu Ile Leu Ser Ser Gln Tyr Arg Arg Pro His 370 375 380 ttt caa ctg att tca cgg tgg aaa ggg ttg gac tac cac gca att aat 1200 Phe Gln Leu Ile Ser Arg Trp Lys Gly Leu Asp Tyr His Ala Ile Asn 385 390 395 400 ctt gcc ggg tcg tat gct gat cct cgg gag gtg gtc gag aaa ttg act 1248 Leu Ala Gly Ser Tyr Ala Asp Pro Arg Glu Val Val Glu Lys Leu Thr 405 410 415 ggc ata gtc gat ggg ctt gga tgt tga a gataag 1282 Gly Ile Val Asp Gly Leu Gly Cys * 420 <210> 20 <211> 1275 <212> DNA <213> Lemna minor <220> <221> CDS <222> (1)...(1276) <221> misc_feature <222> (0)...(0) <223> Xy1T isoform #2; Encodes partial-length beta-1, 2-xylosyltransferase <400> 20 tgc gaa gcc tac ttc ggc aac agc ttc aac cgc cgg acg gag atg ctg 48 Cys Glu Ala Tyr Phe Gly Asn Ser Phe Asn Arg Arg Thr Glu Met Leu 1 5 10 15 aag aag gta gag gga aga gga tgg ttc cag tgc ctg tac agc gat act 96 Lys Lys Val Glu Gly Arg Gly Trp Phe Gln Cys Leu Tyr Ser Asp Thr 20 25 30 ctt cga agt tct gtt tgc cag gga ggg aat ttg cgg atg gac ccg gaa 144 Leu Arg Ser Ser Val Cys Gln Gly Gly Asn Leu Arg Met Asp Pro Glu 35 40 45 agg att agg atg tcg aaa ggg ggg gaa gat cta gag gag gtg atg aag 192 Arg Ile Arg Met Ser Lys Gly Gly Glu Asp Leu Glu Glu Val Met Lys 50 55 60 aga gag gag gaa gaa gaa ttg ccc aaa ttc gag gag ggg tcg ttc cag 240 Arg Glu Glu Glu Glu Glu Leu Pro Lys Phe Glu Glu Gly Ser Phe Gln 65 70 75 80 att gaa tct ggt tat gga agc gga ggg gaa gtt gga gag aga att gcg 288 Ile Glu Ser Gly Tyr Gly Ser Gly Gly Glu Val Gly Glu Arg Ile Ala 85 90 95 act gac gag gtc ctc gat aat gtt gtg ccg aaa ggc gct gtt cat gta 336 Thr Asp Glu Val Leu Asp Asn Val Val Pro Lys Gly Ala Val His Val 100 105 110 cat acc atg cgc aat ctc atc agt tcg att cag att gtt ggt ccc ggg 384 His Thr Met Arg Asn Leu Ile Ser Ser Ile Gln Ile Val Gly Pro Gly 115 120 125 cat ctt caa tgc tct cag tgg atc gac gaa ccg gtt ctt ctt gtc aca 432 His Leu Gln Cys Ser Gln Trp Ile Asp Glu Pro Val Leu Leu Val Thr 130 135 140 cgc ttc gaa tac gcc aat ctc ttt cac acc gtc acc gac tgg tac agc 480 Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser 145 150 155 160 gcc tac gca agc tcg agg att gcc aac ttg ccc tct cgc cct cac ttg 528 Ala Tyr Ala Ser Ser Arg Ile Ala Asn Leu Pro Ser Arg Pro His Leu 165 170 175 att ttc gtc gat ggc cat tgc agg gca gaa cag tta gag gac acg tgg 576 Ile Phe Val Asp Gly His Cys Arg Ala Glu Gln Leu Glu Asp Thr Trp 180 185 190 cga gcc ctg ttc tca acc gtc cga tac gcc aag aac ttc tcc cag cca 624 Arg Ala Leu Phe Ser Thr Val Arg Tyr Ala Lys Asn Phe Ser Gln Pro 195 200 205 gtc tgc ttc cgc cac gcc gtc ctc tcc cct ctt ggc tat gag aca gct 672 Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala 210 215 220 ctc ttc aaa ggc cta tca gag agc ttc agc tgt gag gga gtg ccg gcc 720 Leu Phe Lys Gly Leu Ser Glu Ser Phe Ser Cys Glu Gly Val Pro Ala 225 230 235 240 aat cag ctc aaa gtc aac cct gat gac cag aag act gcg aga ctg gct 768 Asn Gln Leu Lys Val Asn Pro Asp Asp Gln Lys Thr Ala Arg Leu Ala 245 250 255 gaa ttc gga gag atg atc agg gct gcc ttt gac ttt cct gtc gtt gac 816 Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Asp Phe Pro Val Val Asp 260 265 270 ccg ccc gtt gac ccg ttg acc aaa tcc atc ctc ttt gtg cgg cgg gaa 864 Pro Pro Val Asp Pro Leu Thr Lys Ser Ile Leu Phe Val Arg Arg Glu 275 280 285 gat tac gtg gcg cac cca cgc cac agt ggg aga gtg gag tcg cgg ttg 912 Asp Tyr Val Ala His Pro Arg His Ser Gly Arg Val Glu Ser Arg Leu 290 295 300 acc aat gag caa gag gtg ttt gac ttt ctg cac aaa tgg gca agt caa 960 Thr Asn Glu Gln Glu Val Phe Asp Phe Leu His Lys Trp Ala Ser Gln 305 310 315 320 cac aga agc agg tgc aac gtc agt gtg gtc aac ggg ctt ttc gcg cac 1008 His Arg Ser Arg Cys Asn Val Ser Val Val Asn Gly Leu Phe Ala His 325 330 335 atg gga atg aag gaa cag gtg aag gca att atg gaa gct tcg gtg gtg 1056 Met Gly Met Lys Glu Gln Val Lys Ala Ile Met Glu Ala Ser Val Val 340 345 350 gtc ggg gcc cac ggg gct ggt ttg act cat ctg gtg gca gca agg tca 1104 Val Gly Ala His Gly Ala Gly Leu Thr His Leu Val Ala Ala Arg Ser 355 360 365 acg aca gtt gtt ctt gag att ctg agc agt caa tat cgt aga ccg cac 1152 Thr Thr Val Val Leu Glu Ile Leu Ser Ser Gln Tyr Arg Arg Pro His 370 375 380 ttt caa ctg att tca cgg tgg aaa ggg ttg gac tac cac gca att aat 1200 Phe Gln Leu Ile Ser Arg Trp Lys Gly Leu Asp Tyr His Ala Ile Asn 385 390 395 400 ctt gcc ggg tcg tat gct gat cct cgg gag gtg gtc gag aaa ttg act 1248 Leu Ala Gly Ser Tyr Ala Asp Pro Arg Glu Val Val Glu Lys Leu Thr 405 410 415 ggc ata gtc gat ggg ctt gga tgt tga 1275 Gly Ile Val Asp Gly Leu Gly Cys * 420 <210> 21 <211> 424 <212> PRT <213> Lemna minor <400> 21 Cys Glu Ala Tyr Phe Gly Asn Ser Phe Asn Arg Arg Thr Glu Met Leu 1 5 10 15 Lys Lys Val Glu Gly Arg Gly Trp Phe Gln Cys Leu Tyr Ser Asp Thr 20 25 30 Leu Arg Ser Ser Val Cys Gln Gly Gly Asn Leu Arg Met Asp Pro Glu 35 40 45 Arg Ile Arg Met Ser Lys Gly Gly Glu Asp Leu Glu Glu Val Met Lys 50 55 60 Arg Glu Glu Glu Glu Glu Leu Pro Lys Phe Glu Glu Gly Ser Phe Gln 65 70 75 80 Ile Glu Ser Gly Tyr Gly Ser Gly Gly Glu Val Gly Glu Arg Ile Ala 85 90 95 Thr Asp Glu Val Leu Asp Asn Val Val Pro Lys Gly Ala Val His Val 100 105 110 His Thr Met Arg Asn Leu Ile Ser Ser Ile Gln Ile Val Gly Pro Gly 115 120 125 His Leu Gln Cys Ser Gln Trp Ile Asp Glu Pro Val Leu Leu Val Thr 130 135 140 Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser 145 150 155 160 Ala Tyr Ala Ser Ser Arg Ile Ala Asn Leu Pro Ser Arg Pro His Leu 165 170 175 Ile Phe Val Asp Gly His Cys Arg Ala Glu Gln Leu Glu Asp Thr Trp 180 185 190 Arg Ala Leu Phe Ser Thr Val Arg Tyr Ala Lys Asn Phe Ser Gln Pro 195 200 205 Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala 210 215 220 Leu Phe Lys Gly Leu Ser Glu Ser Phe Ser Cys Glu Gly Val Pro Ala 225 230 235 240 Asn Gln Leu Lys Val Asn Pro Asp Asp Gln Lys Thr Ala Arg Leu Ala 245 250 255 Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Asp Phe Pro Val Val Asp 260 265 270 Pro Pro Val Asp Pro Leu Thr Lys Ser Ile Leu Phe Val Arg Arg Glu 275 280 285 Asp Tyr Val Ala His Pro Arg His Ser Gly Arg Val Glu Ser Arg Leu 290 295 300 Thr Asn Glu Gln Glu Val Phe Asp Phe Leu His Lys Trp Ala Ser Gln 305 310 315 320 His Arg Ser Arg Cys Asn Val Ser Val Val Asn Gly Leu Phe Ala His 325 330 335 Met Gly Met Lys Glu Gln Val Lys Ala Ile Met Glu Ala Ser Val Val 340 345 350 Val Gly Ala His Gly Ala Gly Leu Thr His Leu Val Ala Ala Arg Ser 355 360 365 Thr Thr Val Val Leu Glu Ile Leu Ser Ser Gln Tyr Arg Arg Pro His 370 375 380 Phe Gln Leu Ile Ser Arg Trp Lys Gly Leu Asp Tyr His Ala Ile Asn 385 390 395 400 Leu Ala Gly Ser Tyr Ala Asp Pro Arg Glu Val Val Glu Lys Leu Thr 405 410 415 Gly Ile Val Asp Gly Leu Gly Cys 420 <210> 22 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 22 atggtcgact gctgctggtg ctctcaac 28 <210> 23 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 23 atgtctagaa tgcagcagca agtgcacc 28 <210> 24 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 24 atgactagtt gcgaagccta cttcggcaac agc 33 <210> 25 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 25 atgggatccg aatctcaaga acaactgtcg 30 <210> 26 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 26 atgggtacct gcgaagccta cttcggcaac agc 33 <210> 27 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 27 atgggatcca ctggctggga gaagttctt 29 <210> 28 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 28 atggagctct gctgctggtg ctctcaac 28 <210> 29 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 29 atgggtacca tgcagcagca agtgcacc 28

Claims (165)

  1. 실질적으로 동질적인(homogeneous) N-당화 프로파일을 포함하는 당단백질 조성물로서,
    상기 프로파일에 존재하는 N-글리칸 종의 90% 이상이 GlcNAc2Man3GlcNAc2 (G0)이고,
    상기 프로파일이 미량의 전구체 N-글리칸(glycoform) 종을 포함하며,
    상기 전구체 N-글리칸 종이 Man3GlcNAc2, GlcNac1이 1,3 만노스 암(mannose arm, MGn)에 부착된 GlcNac1Man3GlcNAc2, GlcNac1이 1,6 만노스 암((GnM))에 부착된 GlcNac1Man3GlcNAc2, 및 이들의 임의 조합으로 이루어진 군으로부터 선택되는 것을 특징으로 하는, 당단백질 조성물.
  2. 제 1항에 있어서,
    상기 당단백질이 면역글로불린인 것을 특징으로 하는 당단백질 조성물.
  3. 제 2항에 있어서,
    상기 면역글로불린이 IgG1, IgG2, IgG3 및 IgG4 영역으로 이루어진 군으로부터 선택되는 Fc 영역을 포함하는 것을 특징으로 하는 당단백질 조성물.
  4. 제 2항에 있어서,
    상기 면역글로불린이 단일클론 항체인 것을 특징으로 하는 당단백질 조성물.
  5. 제 4항에 있어서,
    상기 단일클론 항체가 CD20 및 ERBB2(HER2)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 당단백질 조성물.
  6. 제 2항 내지 제 5항 중 어느 한 항에 있어서,
    상기 면역글로불린이 FcγRIII에 대해 증가된 결합 친화성을 보이는 것을 특징으로 하는 당단백질 조성물.
  7. 제 2항 내지 제 6항 중 어느 한 항에 있어서,
    상기 면역글로불린이 증가된 항체-의존적인 세포성 세포독성(ADCC) 활성을 보이는 것을 특징으로 하는 당단백질 조성물.
  8. 제 2항 내지 제 7항 중 어느 한 항에 있어서,
    상기 면역글로불린이 감소된 보체-의존적인 세포독성(CDC) 활성을 보이는 것을 특징으로 하는 당단백질 조성물.
  9. 실질적으로 동질적인 당단백질 조성물로서,
    상기 조성물에 존재하는 당단백질의 90% 이상이 GO 글리코형이고,
    상기 조성물이 미량의 전구체 글리코형을 포함하는 것을 특징으로 하는, 당단백질 조성물.
  10. 제 9항에 있어서,
    상기 당단백질이 면역글로불린인 것을 특징으로 하는 당단백질 조성물.
  11. 제 10항에 있어서,
    상기 면역글로불린이 IgG1, IgG2, IgG3 및 IgG4 영역으로 이루어진 군으로부터 선택되는 Fc 영역을 포함하는 것을 특징으로 하는 당단백질 조성물.
  12. 제 10항에 있어서,
    상기 면역글로불린이 단일클론 항체인 것을 특징으로 하는 당단백질 조성물.
  13. 제 12항에 있어서,
    상기 단일클론 항체가 CD20 및 ERBB2(HER2)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 당단백질 조성물.
  14. 제 10항 내지 제 13항 중 어느 한 항에 있어서,
    상기 면역글로불린이 FcγRIII에 대해 증가된 결합 친화성을 보이는 것을 특징으로 하는 당단백질 조성물.
  15. 제 10항 내지 제 14항 중 어느 한 항에 있어서,
    상기 면역글로불린이 증가된 항체-의존적인 세포성 세포독성(ADCC) 활성을 보이는 것을 특징으로 하는 당단백질 조성물.
  16. 제 10항 내지 제 15항 중 어느 한 항에 있어서,
    상기 면역글로불린이 증가된 보체-의존적인 세포독성(CDC) 활성을 보이는 것을 특징으로 하는 당단백질 조성물.
  17. 제 1항 내지 제 16항 중 어느 한 항에 따른 당단백질 조성물을 포함하는 약학적 조성물.
  18. 제 1항 내지 제 16항 중 어느 한 항에 따른 당단백질 조성물을 포함하는 숙주 세포.
  19. 제 18항에 있어서,
    상기 숙주 세포가 식물 숙주 세포인 것을 특징으로 하는 숙주 세포.
  20. 제 19항에 있어서,
    상기 식물이 개구리밥(duckweed)인 것을 특징으로 하는 숙주 세포.
  21. 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 생산되는 이종의(heterologous) 폴리펩타이드의 N-당화 패턴을 변형시키는 방법으로서,
    상기 방법이
    (a) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 α1,3-푸코실트랜스퍼라제(FucT)의 발현 또는 기능을 저해할 수 있는, 제1 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체를 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에 도입하는 단계로,
    상기 제1 뉴클레오타이드 서열이 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있으며, 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (i), (ii) 및 (iii)를 포함하는 것을 특징으로 하는 도입 단계:
    (i) 서열번호 1 또는 2의 약 500 내지 약 800개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는, FucT 정방향 단편;
    (ii) 상기 FucT 정방향 단편의 바로 하류 약 200 내지 약 700개의 뉴클레오타이드를 포함하는 스페이서 서열(spacer sequence); 및
    (iii) 상기 제1 뉴클레오타이드 서열이 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 FucT 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 가진, FucT 역방향 단편,
    (b) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절을 상기 이종의 폴리 펩타이드의 발현에 적합한 조건하에서 배양하는 단계를 포함하는 것을 특징으로 하는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법.
  22. 제 21항에 있어서,
    상기 FucT 역방향 단편이 상기 FucT 정방향 단편의 상보체 또는 상기 FucT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 방법.
  23. 제 21항 또는 제 22항에 있어서,
    상기 FucT 정방향 단편이 서열번호 1의 뉴클레오타이드(nt) 255-985를 포함하며,
    상기 스페이서 서열이 서열번호 1의 nt 986-1444를 포함하는 것을 특징으로 하는 방법.
  24. 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 생산되는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법으로서,
    상기 방법이
    (a) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 α1,3-푸코실트랜스퍼라제(FucT)의 발현 또는 기능을 저해할 수 있는, 제1 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체를 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에 도입하는 단계로,
    상기 제1 뉴클레오타이드 서열이 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있으며, 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (i) 및 (ii)를 포함하며,
    상기 제1 뉴클레오타이드 서열이 약 200 염기쌍 보다 길이가 짧은 염기쌍으로 이루어진 스템(stem)을 가지는 소형 헤어핀 RNA로서 전사되는 것을 특징으로 하는 도입 단계:
    (i) 서열번호 1의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 센스 뉴클레오타이드 서열;
    (ii) 상기 센스 뉴클레오타이드 서열의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열의 상보체와 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 안티센스 뉴클레오타이드 서열,
    (b) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절을 상기 이종의 폴리펩타이드의 발현에 적합한 조건하에서 배양하는 단계를 포함하는 것을 특징으로 하는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법.
  25. 제 24항에 있어서,
    상기 제1 뉴클레오타이드 서열에 작동가능하게 연결된 상기 프로모터가 3형(type 3)의 RNA 중합효소 III 프로모터인 것을 특징으로 하는 방법.
  26. 제 21항 내지 제 25항 중 어느 한 항에 있어서,
    상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  27. 제 26항에 있어서,
    상기 XylT의 발현 또는 기능이 하기로 이루어진 군으로부터 선택되는 방법에 의해 저해되는 것을 특징으로 하는 방법:
    (a) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에 폴리뉴클레오타이드 또는 폴리펩타이드를 도입하여, 상기 폴리뉴클레오타이드 또는 폴리펩타이드가 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 상기 XylT의 발현 또는 기능을 저해하는 방법;
    (b) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 상기 XylT를 코딩하는 유전자를 제거하는 방법; 및
    (c) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 상기 XylT를 코딩하는 유전자를 돌연변이시키는 방법.
  28. 제 27항에 있어서,
    상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에, 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 상기 XylT의 발현 또는 기능을 저해할 수 있는 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체를, 도입하는 단계를 포함하며,
    상기 XylT의 발현 또는 기능을 저해시킬 수 있는 상기 뉴클레오타이드 서열이 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있는 것을 특징으로 하는 방법.
  29. 제 28항에 있어서,
    상기 XylT의 발현 또는 기능을 저해시킬 수 있는 상기 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a), (b) 및 (c)를 포함하는 것을 특징으로 하는 방법:
    (a) 서열번호 4, 5, 19 또는 20의 약 500 내지 약 800개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는 XylT 정방향 단편;
    (b) 상기 XylT 정방향 단편의 바로 하류에 약 200 내지 약 700개의 뉴클레오타이드를 포함하는 스페이서 서열;
    (c) 상기 XylT의 발현 또는 기능을 저해할 수 있는 상기 뉴클레오타이드 서열이 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 XylT 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 가지는 XylT 역방향 단편.
  30. 제 29항에 있어서,
    상기 XylT 역방향 단편이 상기 XylT 정방향 단편의 상보체, 또는 상기 XylT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 가지는 서열을 포함하는 것을 특징으로 하는 방법.
  31. 제 29항 또는 제 30항에 있어서,
    (a) 상기 XylT 정방향 단편이 서열번호 4의 뉴클레오타이드 (nt) 318-1052를 포함하고, 상기 스페이서 서열이 서열번호 4의 nt 1053-1599를 포함하거나, 또는
    (b) 상기 XylT 정방향 단편이 서열번호 19의 nt 1-734를 포함하고, 상기 스페이서 서열이 서열번호 19의 nt 735-1282를 포함하는 것을 특징으로 하는 방법.
  32. 제 28항에 있어서,
    상기 XylT의 발현 또는 기능을 저해시킬 수 있는 상기 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a) 및 (b)를 포함하며:
    (a) 서열번호 4 또는 19의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 센스 뉴클레오타이드 서열;
    (b) (a)의 센스 뉴클레오타이드 서열의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열의 상보체와 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 안티센스 뉴클레오타이드 서열,
    상기 XylT의 발현 또는 기능을 저해할 수 있는 상기 뉴클레오타이드 서열이 약 200개의 염기 쌍 보다 짧은 길이의 염기쌍으로 이루어진 스템을 가지는 소형 헤어핀 RNA로서 전사되는 것을 특징으로 하는 방법.
  33. 제 32항에 있어서,
    상기 XylT의 발현 또는 기능을 저해할 수 있는 상기 뉴클레오타이드 서열에 작동가능하게 연결된 상기 프로모터가 3형의 RNA 중합효소III 프로모터인 것을 특징으로 하는 방법.
  34. 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 생산되는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법으로서,
    상기 방법이
    (a) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는, 제1 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체를 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에 도입하는 단계로,
    상기 제1 뉴클레오타이드 서열은 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있으며, 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (i), (ii) 및 (iii)를 포함하는 것을 특징으로 하는 도입 단계:
    (i) 서열번호 6 또는 21의 약 500 내지 약 800개의 연속적인 뉴클레오타이 드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는, XylT 정방향 단편;
    (ii) 상기 XylT 정방향 단편의 바로 하류에 약 200 내지 약 700개의 뉴클레오타이드를 포함하는 스페이서 서열(spacer sequence); 및
    (iii) 상기 제1 뉴클레오타이드 서열이 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 XylT 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 가진, XylT 역방향 단편,
    (b) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절을 상기 이종의 폴리펩타이드의 발현에 적합한 조건하에서 배양하는 단계를 포함하는 것을 특징으로 하는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법.
  35. 제 34항에 있어서,
    상기 XylT 역방향 단편이 상기 XylT 정방향의 상보체 또는 상기 XylT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 방법.
  36. 제 34항 또는 제 35항에 있어서,
    (a) 상기 XylT 정방향 단편이 서열번호 4의 뉴클레오타이드 (nt) 318-1052를 포함하고, 상기 스페이서 서열이 서열번호 4의 nt 1053-1599를 포함하거나, 또는
    (b) 상기 XylT 정방향 단편이 서열번호 19의 nt 1-734를 포함하고, 상기 스 페이서 서열이 서열번호 19의 nt 735-1282를 포함하는 것을 특징으로 하는 방법.
  37. 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 생산되는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법으로서,
    상기 방법이
    (a) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는, 제1 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체를 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에 도입하는 단계로,
    상기 제1 뉴클레오타이드 서열이 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있으며, 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (i) 및 (ii)를 포함하며,
    상기 제1 뉴클레오타이드 서열이 약 200 염기쌍 보다 길이가 짧은 염기쌍으로 이루어진 스템을 가지는 소형 헤어핀 RNA로서 전사되는 것을 특징으로 하는 도입 단계:
    (i) 서열번호 4 또는 19의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 센스 뉴클레오타이드 서열;
    (ii) (a)의 상기 센스 뉴클레오타이드 서열의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열의 상보체와 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 안티센스 뉴클레오타이드 서열,
    (b) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절을 상기 이종의 폴리펩타이드의 발현에 적합한 조건하에서 배양하는 단계를 포함하는 것을 특징으로 하는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법.
  38. 제 37항에 있어서,
    상기 제1 뉴클레오타이드 서열에 작동가능하게 연결된 프로모터가 3형 RNA 중합효소III 프로모터인 것을 특징으로 하는 방법.
  39. 제 34항 내지 제 38항 중 어느 한 항에 있어서,
    상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 α1,3-푸코실트랜스퍼라제(FucT)의 발현 또는 기능을 저해하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  40. 제 39항에 있어서,
    상기 FucT의 발현 또는 기능이 하기 방법으로 이루어진 군으로부터 선택된 방법에 의해 저해되는 것을 특징으로 하는 방법:
    (a) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에 폴리뉴클레오타이드 또는 폴리펩타이드를 도입하여, 상기 폴리뉴클레오타이드 또는 폴리펩타이드가 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 상기 FucT의 발현 또는 기능을 저해하는 방법;
    (b) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 상기 FucT를 코딩하는 유전자를 제거하는 방법; 및
    (c) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 상기 FucT를 코딩하는 유전자를 돌연변이시키는 방법.
  41. 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 생산되는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법으로서,
    상기 방법이
    (a) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 α1,3-푸코실트랜스퍼라제(FucT) 및 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는, 융합 폴리뉴클레오타이드를 포함하는 뉴클레오타이드 구조체를 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에 도입하는 단계로,
    상기 융합 폴리뉴클레오타이드는 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있으며, 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (i), (ii) 및 (iii)을 포함하는 것을 특징으로 하는 도입 단계:
    (i) (a) FucT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 제1 단편; 및
    (b) XylT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 제2 단편;
    을 포함하는 키메라 정방향 단편;
    (ii) 상기 키메라 정방향 단편의 상기 제2 단편의 바로 하류에 약 200 내지 약 700개의 뉴클레오타이드를 포함하는 스페이서 서열;
    (iii) 상기 융합 폴리뉴클레오타이드가 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 키메라 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 갖는 역방향 단편,
    (b) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절을 상기 이종의 폴리펩타이드의 발현에 적합한 조건하에서 배양하는 단계를 포함하는 것을 특징으로 하는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법.
  42. 제 41항에 있어서,
    상기 제1 단편이 서열번호 1의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하며;
    상기 제2 단편이 서열번호 4 또는 19의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 것을 특징으로 하는 방법.
  43. 제 42항에 있어서,
    상기 역방향 단편이 상기 키메라 정방향 단편의 상보체 또는 상기 키메라 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 방법.
  44. 제 42항 또는 제 43항에 있어서,
    (a) 상기 키메라 정방향 단편이 서열번호 1의 뉴클레오타이드 (nt) 254-855 및 서열번호 4의 nt 318-943을 포함하고, 상기 스페이서 서열이 서열번호 4의 nt 944-1443을 포함하거나, 또는
    (b) 상기 키메라 정방향 단편이 서열번호 1의 뉴클레오타이드 (nt) 254-855 및 서열번호 19의 nt 1-626을 포함하고, 상기 스페이서 서열이 서열번호 19의 nt 627-1126을 포함하는 것을 특징으로 하는 방법.
  45. 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 생산되는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법으로서,
    상기 방법이
    (a) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 α1,3-푸코실트 랜스퍼라제(FucT) 및 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는, 융합 폴리뉴클레오타이드를 포함하는 뉴클레오타이드 구조체를 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절에 도입하는 단계로,
    상기 융합 폴리뉴클레오타이드가 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있으며, 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (i), (ii) 및 (iii)을 포함하는 것을 특징으로 하는 도입 단계:
    (i) (a) XylT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 제1 단편; 및
    (b) FucT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 제2 단편;
    을 포함하는 키메라 정방향 단편;
    (ii) 상기 키메라 정방향 단편의 상기 제2 단편의 바로 하류에 약 200 내지 약 700개의 뉴클레오타이드를 포함하는 스페이서 서열;
    (iii) 상기 융합 폴리뉴클레오타이드가 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 키메라 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 갖는 역방향 단편,
    (b) 상기 개구리밥 식물, 개구리밥 식물 세포 또는 결절을 상기 이종의 폴리 펩타이드의 발현에 적합한 조건하에서 배양하는 단계를 포함하는 것을 특징으로 하는 이종의 폴리펩타이드의 N-당화 패턴을 변형시키는 방법.
  46. 제 45항에 있어서,
    상기 역방향 단편이 상기 키메라 정방향 단편의 상보체 또는 상기 키메라 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 방법.
  47. 제 45항에 있어서,
    상기 제1 단편이 서열번호 4 또는 19의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열과 90% 이상의 서열 동일성을 가지는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하며,
    상기 제2 단편이 서열번호 1의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열과 90% 이상의 서열 동일성을 가지는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 것을 특징으로 하는 방법.
  48. 제 47항에 있어서,
    상기 역방향 단편이 상기 키메라 정방향 단편의 상보체 또는 상기 키메라 정방향 단편의 상보체와 90% 이상의 서열 동일성을 가지는 서열을 포함하는 것을 특 징으로 하는 방법.
  49. 식물에서 α1,3-푸코실트랜스퍼라제(FucT)의 발현 또는 기능을 저해할 수 있는 제1 뉴클레오타이드 서열 및 식물에서 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는 제2 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체로서,
    상기 제1 뉴클레오타이드 서열이 식물 세포에서 기능하는 제1 프로모터에 작동가능하게 연결되어 있으며,
    상기 제2 뉴클레오타이드 서열이 식물 세포에서 기능하는 제2 프로모터에 작동가능하게 연결되어 있으며,
    상기 제1 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a), (b) 및 (c)를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 1 또는 2의 약 500 내지 약 800개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는 FucT 정방향 단편;
    (b) 서열번호 1에 기재된 서열의 뉴클레오타이드 단편을 포함하는 스페이서 서열; 및
    (c) 상기 제1 뉴클레오타이드 서열이 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 FucT 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 갖는 역방향 단편.
  50. 제 49항에 있어서,
    상기 FucT 역방향 단편이 상기 FucT 정방향 단편의 상보체 또는 상기 FucT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 가지는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  51. 제 49항 또는 제 50항에 있어서,
    상기 FucT 정방향 단편이 서열번호 1의 뉴클레오타이드 (nt) 255-985를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  52. 제 49항 내지 제 51항 중 어느 한 항에 있어서,
    상기 서열번호 1에 기재된 서열의 뉴클레오타이드 단편이 상기 FucT 정방향 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  53. 제 52항에 있어서,
    상기 스페이서 서열이 서열번호 1의 (nt) 986-1444를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  54. 식물에서 α1,3-푸코실트랜스퍼라제(FucT)의 발현 또는 기능을 저해할 수 있 는 제1 뉴클레오타이드 서열 및 식물에서 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는 제2 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체로서,
    상기 제1 뉴클레오타이드 서열이 식물 세포에서 기능하는 제1 프로모터에 작동가능하게 연결되어 있으며,
    상기 제2 뉴클레오타이드 서열이 식물 세포에서 기능하는 제2 프로모터에 작동가능하게 연결되어 있으며,
    상기 제1 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a) 및 (b)를 포함하며:
    (a) 서열번호 1의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 센스 뉴클레오타이드 서열;
    (b) 상기 센스 뉴클레오타이드 서열의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열의 상보체와 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 안티센스 뉴클레오타이드 서열,
    상기 제1 뉴클레오타이드 서열이 약 200 bp 보다 짧은 염기쌍의 스템을 가진 소형 헤어핀 RNA로 전사되는 것을 특징으로 하는 뉴클레오타이드 구조체.
  55. 제 54항에 있어서,
    상기 제1 뉴클레오타이드 서열에 작동가능하게 연결된 상기 프로모터가 3형 RNA 중합효소 III 프로모터인 것을 특징으로 하는 뉴클레오타이드 구조체.
  56. 제 49항 내지 제 55항 중 어느 한 항에 있어서,
    상기 XylT이 하기 서열로 이루어진 군으로부터 선택되는 아미노산을 포함하며, XylT 활성을 가지는 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 6 또는 서열번호 21에 나타낸 아미노산 서열; 및
    (b) 서열번호 6 또는 서열번호 21에 나타낸 아미노산 서열과 90% 이상의 서열 동일성을 갖는 아미노산 서열.
  57. 제 56항에 있어서,
    상기 제2 뉴클레오타이드 서열이 하기 서열로 이루어진 군으로부터 선택되는 서열을 포함하며:
    (a) 서열번호 4 또는 서열번호 19에 나타낸 뉴클레오타이드 서열 또는 그 상보체;
    (b) 서열번호 5 또는 서열번호 20에 나타낸 뉴클레오타이드 서열, 또는 그 상보체;
    (c) 상기 (a) 또는 (b)의 서열과 90% 이상의 서열 동일성을 갖는 뉴클레오타이드 서열; 및
    (d) 상기 (a) 내지 (c) 중 어느 하나의 뉴클레오타이드 서열의 단편,
    상기 단편이 상기 뉴클레오타이드 서열의 75개 이상의 연속적인 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  58. 제 56항에 있어서,
    상기 제2 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a), (b) 및 (c)를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 약 500 내지 약 800개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는 XylT 정방향 단편;
    (b) 200 내지 약 700 뉴클레오타이드를 포함하는 스페이서 서열; 및
    (c) 상기 제2 뉴클레오타이드 서열이 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 XylT 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 갖는 XylT 역방향 단편.
  59. 제 58항에 있어서,
    상기 XylT 역방향 단편이 상기 XylT 정방향 단편의 상보체 또는 상기 XylT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 가지는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  60. 제 58항 또는 제 59항에 있어서,
    상기 XylT 정방향 단편이 서열번호 4의 뉴클레오타이드(nt) 318 - 1052 또는 서열번호 19의 nt 1-734를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  61. 제 58항 내지 제 60항 중 어느 한 항에 있어서,
    상기 제2 뉴클레오타이드 서열내 스페이서 서열이 서열번호 4 또는 19에 기재된 서열의 뉴클레오타이드 단편을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  62. 제 61항에 있어서,
    상기 서열번호 4 또는 19에 기재된 서열의 뉴클레오타이드 단편이 상기 XylT 정방향 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  63. 제 62항에 있어서,
    (a) 상기 XylT 정방향 단편이 서열번호 4의 nt 318-1052를 포함하고, 상기 스페이스 서열이 서열번호 4의 nt 1053-1599를 포함하거나; 또는
    (b) 상기 XylT 정방향 단편이 서열번호 19의 nt 1-734를 포함하고, 상기 스페이트 서열이 서열번호 19의 nt 735-1282를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  64. 제 58항 내지 제 60항 중 어느 한 항에 있어서,
    상기 제2 뉴클레오타이드 서열내 스페이서 서열이 인트론을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  65. 제 56항에 있어서,
    상기 제2 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a) 및 (b)를 포함하며:
    (a) 서열번호 4 또는 서열번호 19의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 센스 뉴클레오타이드 서열; 및
    (b) 상기 (a) 센스 뉴클레오타이드 서열의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열의 상보체와 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 안티센스 뉴클레오타이드 서열,
    상기 제2 뉴클레오타이드 서열이 약 200 bp 보다 짧은 염기쌍의 스템을 가진 소형 헤어핀 RNA로 전사되는 것을 특징으로 하는 뉴클레오타이드 구조체.
  66. 제 65항에 있어서,
    상기 제2 뉴클레오타이드 서열에 작동가능하게 연결된 상기 프로모터가 3형 RNA 중합효소 III 프로모터인 것을 특징으로 하는 뉴클레오타이드 구조체.
  67. 식물에서 α1,3-푸코실트랜스퍼라제(FucT)의 발현 또는 기능을 저해할 수 있는 제1 뉴클레오타이드 서열 및 식물에서 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는 제2 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체로서,
    상기 제1 뉴클레오타이드 서열이 식물 세포에서 기능하는 제1 프로모터에 작동가능하게 연결되어 있으며,
    상기 제2 뉴클레오타이드 서열이 식물 세포에서 기능하는 제2 프로모터에 작동가능하게 연결되어 있으며,
    상기 제2 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a), (b) 및 (c)를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 약 500 내지 약 800개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는 XylT 정방향 단편;
    (b) 서열번호 4 또는 서열번호 19에 기재된 서열의 뉴클레오타이드 단편을 포함하는 스페이서 서열; 및
    (c) 상기 제2 뉴클레오타이드 서열이 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 XylT 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 갖는 XylT 역방향 단편.
  68. 제 67항에 있어서,
    상기 XylT 역방향 단편이 상기 XylT 정방향 단편의 상보체 또는 상기 XylT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 가지는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  69. 제 67항 또는 제 68항에 있어서,
    상기 XylT 정방향 단편이 서열번호 4의 뉴클레오타이드(nt) 318 - 1052 또는 서열번호 19의 nt 1-734를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  70. 제 67항 내지 제 69항 중 어느 한 항에 있어서,
    상기 서열번호 4 또는 서열번호 19에 기재된 서열의 뉴클레오타이드 단편이 상기 XylT 정방향 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  71. 제 70항에 있어서,
    (a) 상기 XylT 정방향 단편이 서열번호 4의 nt 318-1052를 포함하고, 상기 스페이서 서열이 서열번호 4의 nt 1053-1599를 포함하거나; 또는
    (b) 상기 XylT 정방향 단편이 서열번호 19의 nt 1-734를 포함하고, 상기 스페이서 서열이 서열번호 19의 nt 735-1282를 포함하는 것을 특징으로 하는 뉴클레 오타이드 구조체.
  72. 식물에서 α1,3-푸코실트랜스퍼라제(FucT)의 발현 또는 기능을 저해할 수 있는 제1 뉴클레오타이드 서열 및 식물에서 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는 제2 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체로서,
    상기 제1 뉴클레오타이드 서열이 식물 세포에서 기능하는 제1 프로모터에 작동가능하게 연결되어 있으며,
    상기 제2 뉴클레오타이드 서열이 식물 세포에서 기능하는 제2 프로모터에 작동가능하게 연결되어 있으며,
    상기 제2 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a) 및 (b)를 포함하며:
    (a) 서열번호 4 또는 서열번호 19의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 센스 뉴클레오타이드 서열; 및
    (b) 상기 (a) 센스 뉴클레오타이드 서열의 19개 이상의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열의 상보체와 90% 이상의 서열 동일성을 갖는 19개 이상의 연속적인 뉴클레오타이드를 포함하는 안티센스 뉴클레오타이드 서열,
    상기 제2 뉴클레오타이드 서열이 약 200 bp 보다 짧은 염기쌍의 스템을 가진 소형 헤어핀 RNA로 전사되는 것을 특징으로 하는 뉴클레오타이드 구조체.
  73. 제 72항에 있어서,
    상기 제2 뉴클레오타이드 서열에 작동가능하게 연결된 상기 프로모터가 3형 RNA 중합효소 III 프로모터인 것을 특징으로 하는 뉴클레오타이드 구조체.
  74. 제 67항 내지 제 73항 중 어느 한 항에 있어서,
    상기 FucT이 하기 서열로 이루어진 군으로부터 선택되는 아미노산을 포함하며 FucT 활성을 가지는 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 3에 나타낸 아미노산 서열; 및
    (b) 서열번호 3에 나타낸 아미노산 서열과 90% 이상의 서열 동일성을 갖는 아미노산 서열.
  75. 제 74항에 있어서,
    상기 제1 뉴클레오타이드 서열이 하기 서열로 이루어진 군으로부터 선택되는 서열을 포함하며:
    (a) 서열번호 1에 나타낸 뉴클레오타이드 서열 또는 그 상보체;
    (b) 서열번호 2에 나타낸 뉴클레오타이드 서열 또는 상보체;
    (c) 상기 (a) 또는 (b)의 서열과 90% 이상의 서열 동일성을 갖는 뉴클레오타이드 서열; 및
    (d) 상기 (a) 내지 (c) 중 어느 하나의 뉴클레오타이드 서열의 단편,
    상기 단편이 상기 뉴클레오타이드 서열의 75개 이상의 연속적인 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  76. 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 α1,3-푸코실트랜스퍼라제(FucT) 및 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는 융합 폴리뉴클레오타이드를 포함하는 뉴클레오타이드 구조체로서,
    상기 융합 폴리뉴클레오타이드가 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있으며, 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a), (b) 및 (c)를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) (i) FucT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 제1 단편; 및
    (ii) XylT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 제2 단편;
    을 포함하는 키메라 정방향 단편;
    (b) 상기 XylT를 코딩하는 폴리뉴클레오타이드의, 약 200 내지 약 700 뉴클레오타이드 길이의 단편을 포함하는 스페이서 서열;
    (c) 상기 융합 폴리뉴클레오타이드가 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 키메라 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 갖는 역방향 단편.
  77. 제 76항에 있어서, 상기 역방향 단편이 상기 키메라 정방향 단편의 상보체 또는 상기 키메라 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  78. 제 76항 또는 제 77항에 있어서,
    상기 스페이스 서열이 상기 키메라 정방향 단편의 제2 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  79. 제 76항 내지 제 78항 중 어느 한 항에 있어서,
    상기 FucT이 하기 서열로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는, FucT 활성을 가지는 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 3의 아미노산 서열; 및
    (b) 서열번호 3의 아미노산 서열과 90% 이상의 서열 동일성을 갖는 아미노산 서열.
  80. 제 76항 내지 제 79항 중 어느 한 항에 있어서,
    상기 XylT이 하기 서열로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는, XylT 활성을 가지는 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 6 또는 서열번호 21의 아미노산 서열; 및
    (b) 서열번호 6 또는 서열번호 21의 아미노산 서열과 90% 이상의 서열 동일성을 갖는 아미노산 서열.
  81. 제 76항에 있어서,
    상기 제1 단편이 서열번호 1의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하며;
    상기 제2 단편이 서열번호 4 또는 19의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  82. 제 81항에 있어서,
    상기 역방향 단편이 상기 키메라 정방향 단편의 상보체 또는 상기 키메라 정 방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  83. 제 81항 또는 제 82항에 있어서,
    상기 키메라 정방향 단편이 (a) 서열번호 1의 뉴클레오타이드 (nt) 254-855 및 서열번호 4의 nt 318-943, 또는 (b) 서열번호 1의 뉴클레오타이드 (nt) 254-855 및 서열번호 19의 nt 1-626을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  84. 제 81항 내지 제 83항 중 어느 한 항에 있어서,
    상기 스페이서 서열이 서열번호 4 또는 서열번호 19에 기재된 서열의 뉴클레오타이드 단편을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  85. 제 84항에 있어서,
    상기 뉴클레오타이드 단편이 상기 키메라 정방향 단편의 제2 단편의 바로 하류에 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  86. 제 85항에 있어서,
    (a) 상기 키메라 정방향 단편이 서열번호 1의 뉴클레오타이드 (nt) 254-855 및 서열번호 4의 nt 318-943을 포함하며, 상기 스페이서 서열이 서열번호 4의 nt 944-1443을 포함하거나, 또는
    (b) 상기 키메라 정방향 단편이 서열번호 1의 뉴클레오타이드 (nt) 254-855 및 서열번호 19의 nt 1-626을 포함하고, 상기 스페이서 서열이 서열번호 19의 nt 627-1126을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  87. 개구리밥 식물, 개구리밥 식물 세포 또는 결절에서 α1,3-푸코실트랜스퍼라제(FucT) 및 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는 융합 폴리뉴클레오타이드를 포함하는 뉴클레오타이드 구조체로서,
    상기 융합 폴리뉴클레오타이드가 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있으며, 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a), (b) 및 (c)를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) (i) XylT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 서열 이상의 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 제1 단편; 및
    (ii) FucT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 서열 이상의 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 제2 단편;
    을 포함하는 키메라 정방향 단편;
    (b) 상기 FucT를 코딩하는 폴리뉴클레오타이드의, 약 200 내지 약 700 뉴클레오타이드 길이의 단편을 포함하는 스페이서 서열;
    (c) 상기 융합 폴리뉴클레오타이드가 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 키메라 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 갖는 역방향 단편.
  88. 제 87항에 있어서,
    상기 역방향 단편이 상기 키메라 정방향 단편의 상보체 또는 상기 키메라 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  89. 제 87항 또는 제 88항에 있어서,
    상기 스페이스 서열이 상기 키메라 정방향 단편의 제2 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  90. 제 87항 내지 제 89항 중 어느 한 항에 있어서,
    상기 FucT이 하기 서열로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는, FucT 활성을 가지는 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 3의 아미노산 서열; 및
    (b) 서열번호 3의 아미노산 서열과 90% 이상의 서열 동일성을 갖는 아미노산 서열.
  91. 제 87항 내지 제 90항 중 어느 한 항에 있어서,
    상기 XylT이 하기 서열로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는, XylT 활성을 가지는 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 6 또는 서열번호 21의 아미노산 서열; 및
    (b) 서열번호 6 또는 서열번호 21의 아미노산 서열과 90% 이상의 서열 동일성을 갖는 아미노산 서열.
  92. 제 87항에 있어서,
    상기 제1 단편이 서열번호 4 또는 19의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하며;
    상기 제2 단편이 서열번호 1의 약 500 내지 약 650개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 650개의 연속적인 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  93. 제 92항에 있어서,
    상기 역방향 단편이 상기 키메라 정방향 단편의 상보체 또는 상기 키메라 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  94. 제 92항 또는 제 93항에 있어서,
    상기 스페이서 서열이 서열번호 1에 기재된 서열의 뉴클레오타이드 단편을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  95. 제 94항에 있어서,
    상기 뉴클레오타이드 단편이 상기 키메라 정방향 단편의 제2 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  96. 식물에서 α1,3-푸코실트랜스퍼라제(FucT)의 발현 또는 기능을 저해할 수 있는 제1 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체로서,
    상기 제1 뉴클레오타이드 서열이 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a), (b) 및 (c)를 포함하며;
    (a) 상기 FucT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 800개의 연 속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는, FucT 정방향 단편;
    (b) 상기 FucT를 코딩하는 폴리뉴클레오타이드의, 약 200 내지 약 700 뉴클레오타이드 길이의 단편을 포함하는 스페이서 서열; 및
    (c) 상기 제1 폴리뉴클레오타이드 서열이 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 FucT 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 가진, FucT 역방향 단편,
    상기 제1 폴리뉴클레오타이드 서열이 식물에서 기능하는 프로모터에 작동가능하게 연결되어 있는 것을 특징으로 하는, 뉴클레오타이드 구조체.
  97. 제 96항에 있어서,
    상기 FucT 역방향 단편이 상기 FucT 정방향 단편의 상보체 또는 상기 FucT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  98. 제 96항 또는 제 97항에 있어서,
    상기 제1 폴리뉴클레오타이드 서열내 스페이서 서열이 상기 FucT 정방향 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  99. 제 96항에 있어서,
    상기 FucT이 하기 서열로 이루어진 군으로부터 선택되는 아미노산을 포함하며, FucT 활성을 가지는 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 3에 나타낸 아미노산 서열; 및
    (b) 서열번호 3에 나타낸 아미노산 서열과 90% 이상의 서열 동일성을 갖는 아미노산 서열.
  100. 제 99항에 있어서,
    상기 FucT 정방향 단편이 서열번호 1 또는 2의 약 500 내지 약 800개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  101. 제 100항에 있어서,
    상기 FucT 역방향 단편이 상기 FucT 정방향 단편의 상보체 또는 상기 FucT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  102. 제 100항 또는 제 101항에 있어서,
    상기 FucT 정방향 단편이 서열번호 1의 뉴클레오타이드(nt) 255-985를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  103. 제 100항 내지 제 102항 중 어느 한 항에 있어서,
    상기 제1 폴리뉴클레오타이드 서열내 스페이서 서열이 서열번호 1에 기재된 서열의 뉴클레오타이드 단편을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  104. 제 103항에 있어서,
    상기 서열번호 1에 기재된 서열의 뉴클레오타이드 단편이 상기 FucT 정방향 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  105. 제 104항에 있어서,
    상기 스페이서 서열이 서열번호 1의 nt 986-1444를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  106. 식물에서 β1,2-자일로실트랜스퍼라제(XylT)의 발현 또는 기능을 저해할 수 있는 제1 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 구조체로서,
    상기 제1 뉴클레오타이드 서열은 5'-에서 3'- 방향으로 작동가능하게 연결된 하기 (a), (b) 및 (c)를 포함하며:
    (a) 상기 XylT를 코딩하는 폴리뉴클레오타이드의 약 500 내지 약 800개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는, XylT 정방향 단편;
    (b) 상기 XylT를 코딩하는 폴리뉴클레오타이드의, 약 200 내지 약 700개의 뉴클레오타이드 길이로 된 단편을 포함하는 스페이서 서열; 및
    (c) 상기 제1 뉴클레오타이드 서열이 헤어핀 RNA 구조를 형성할 수 있는 RNA 분자로서 전사되도록, 상기 XylT 정방향 단편에 대해 충분한 길이 및 충분한 상보성을 가진, XylT 역방향 단편,
    상기 제1 폴리뉴클레오타이드 서열이 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있는 것을 특징으로 하는 뉴클레오타이드 구조체.
  107. 제 106항에 있어서,
    상기 XylT 역방향 단편이 상기 XylT 정방향 단편의 상보체 또는 상기 XylT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  108. 제 106항 또는 제 107항에 있어서,
    상기 제1 폴리뉴클레오타이드 서열내 스페이서 서열이 상기 XylT 정방향 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  109. 제 106항에 있어서,
    상기 XylT이 하기 서열로 이루어진 군으로부터 선택되는 아미노산을 포함하며, XylT 활성을 가지는 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체:
    (a) 서열번호 6 또는 21에 나타낸 아미노산 서열; 및
    (b) 서열번호 6 또는 21에 나타낸 아미노산 서열과 90% 이상의 서열 동일성을 갖는 아미노산 서열.
  110. 제 109항에 있어서,
    상기 XylT 정방향 단편이 서열번호 4, 서열번호 5, 서열번호 19, 또는 서열번호 20의 약 500 내지 약 800개의 연속적인 뉴클레오타이드로 이루어진 뉴클레오타이드 서열과 90% 이상의 서열 동일성을 갖는 약 500 내지 약 800개의 연속적인 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  111. 제 110항에 있어서,
    상기 XylT 역방향 단편이 상기 XylT 정방향 단편의 상보체 또는 상기 XylT 정방향 단편의 상보체와 90% 이상의 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  112. 제 110항 또는 제 111항에 있어서,
    상기 XylT 정방향 단편이 서열번호 4의 nt 318-1052 또는 서열번호 19의 nt 1-734를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  113. 제 110항 내지 제 112항 중 어느 한 항에 있어서,
    상기 제1 폴리뉴클레오타이드 서열의 스페이서 서열이 서열번호 4 또는 19에 기재된 서열의 뉴클레오타이드 단편을 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  114. 제 113항에 있어서,
    상기 서열번호 4 또는 19에 기재된 서열의 뉴클레오타이드 단편이 상기 XylT 정방향 단편의 바로 하류 약 200 내지 700개의 뉴클레오타이드를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  115. 제 114항에 있어서,
    (a) 상기 XylT 정방향 단편이 서열번호 4의 nt 318-1052를 포함하고, 상기 스페이서 서열이 서열번호 4의 nt 1053-1599를 포함하거나; 또는
    (b) 상기 XylT 정방향 단편이 서열번호 19의 nt 1-734를 포함하고, 상기 스페이서 서열이 서열번호 19의 nt 735-1282를 포함하는 것을 특징으로 하는 뉴클레오타이드 구조체.
  116. 제 49항 내지 제 115항 중 어느 한 항에 있어서,
    원하는 폴리펩타이드를 코딩하는 하나 이상의 폴리뉴클레오타이드를 더 포함하며,
    상기 원하는 폴리펩타이드를 코딩하는 상기 폴리뉴클레오타이드는 식물 세포에서 기능하는 프로모터에 작동가능하게 연결되어 있는 것을 특징으로 하는 뉴클레오타이드 구조체.
  117. 제 116항에 있어서,
    상기 원하는 폴리펩타이드는 포유류 폴리펩타이드인 것을 특징으로 하는 뉴클레오타이드 구조체.
  118. 제 117항에 있어서,
    상기 포유류 폴리펩타이드가 단일클론 항체인 것을 특징으로 하는 뉴클레오타이드 구조체.
  119. 제 117항에 있어서,
    상기 포유류 폴리펩타이드가 인터페론, 에리트로포이에틴(EPO), 조직 플라스미노겐 활성자(tPA), 플라스미노겐, 혈액 응고 인자, 과립구-대식세포 콜로니 자극 인자(GM-CSF) 및 치료학적 면역글로불린으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 뉴클레오타이드 구조체.
  120. 제 49항 내지 제 119항 중 어느 한 항에 따른 뉴클레오타이드 구조체를 포함하는 벡터.
  121. 게놈에 안정적으로 삽입된 제 49항 내지 제 119항 중 어느 한 항에 따른 뉴클레오타이드 구조체를 포함하는 식물 또는 식물 세포.
  122. 제 121항에 있어서,
    상기 식물이 단자엽이거나,
    상기 식물 세포가 단자엽 유래인 것을 특징으로 하는 식물 또는 식물 세포.
  123. 제 122항에 있어서,
    상기 단자엽이 개구리밥과(Lemnaceae)에 속하는 식물인 것을 특징으로 하는 식물 또는 식물 세포.
  124. 제 123항에 있어서,
    상기 단자엽이 스피로델라(Spirodela) 속, 울피아(Wolffia) 속, 울피엘라(Wolfiella) 속, 란돌티아(Landoltia) 속 및 렘나(Lemna) 속으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 식물 또는 식물 세포.
  125. 제 124항에 있어서,
    상기 단자엽이 렘나 마이너(Lemna minor), 렘나 미니스큘라(Lemna miniscula), 렘나 에퀴녹티얼리스(Lemna aequinoctialis) 및 렘나 지바(Lemna gibba)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 식물 또는 식물 세포.
  126. 제 121항에 있어서,
    상기 식물이 쌍자엽이거나,
    상기 식물 세포가 쌍자엽 유래인 것을 특징으로 하는 식물 또는 식물 세포.
  127. 고등 식물에 제 50항 내지 제 95항 중 어느 한 항에 따른 뉴클레오타이드 구조체를 도입하는 단계를 포함하는, 고등 식물을 안정적으로 형질전환시켜 N-당화 패턴이 변형된 당단백질을 발현하는 방법.
  128. 제 127항에 있어서,
    상기 고등 식물이 원하는 하나 이상의 이종의 폴리펩타이드를 발현하는 식물 숙주인 것을 특징으로 하는 방법.
  129. 제 128항에 있어서,
    상기 원하는 이종의 폴리펩타이드가 포유류 폴리펩타이드이거나 또는 생물학적 활성을 가진 그 변이체인 것을 특징으로 하는 방법.
  130. 제 129항에 있어서,
    상기 포유류 폴리펩타이드가 단일클론 항체인 것을 특징으로 하는 방법.
  131. 제 129항에 있어서,
    상기 포유류 폴리펩타이드가 인터페론, 에리트로포이에틴(EPO), 조직 플라스미노겐 활성자(tPA), 플라스미노겐, 혈액 응고 인자, 과립구-대식세포 콜로니 자극 인자(GM-CSF) 및 치료학적 면역글로불린으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
  132. 고등 식물에 제 116항 내지 제 119항 중 어느 한 항에 따른 뉴클레오타이드 구조체를 도입하는 단계를 포함하는, 고등 식물을 안정적으로 형질전환시켜 N-당화 패턴이 변형된 원하는 이종의 폴리펩타이드를 발현하는 방법.
  133. 제 132항에 있어서,
    상기 N-당화 패턴은 상기 이종의 폴리펩타이드에 부착된 N-글리칸에 α1,3- 푸코스 잔기의 부착 감소가 특징인 것을 특징으로 하는 방법.
  134. 제 132항에 있어서,
    상기 N-당화 패턴은 상기 이종의 폴리펩타이드에 부착된 N-글리칸에 β1,2-자일로스 잔기의 부착 감소가 특징인 것을 특징으로 하는 방법.
  135. 제 132항에 있어서,
    상기 N-당화 패턴은 상기 이종의 폴리펩타이드에 부착된 N-글리칸에 α1,3-푸코스 잔기 및 β1,2-자일로스 잔기의 부착 감소가 특징인 것을 특징으로 하는 방법.
  136. 고등 식물에서 이종의 포유류 당단백질을 생산하는 방법으로서,
    상기 이종의 포유류 당단백질은 상기 고등 식물에서 생산되었을 때 상기 당단백질의 N-글리칸에 α1,3-푸코스 및 β1,2-자일로스 잔기의 부착이 감소되며,
    상기 방법은
    (a) 상기 당단백질로서 번역후 가공되는 포유류 폴리펩타이드를 코딩하는 서열, 및 제 50항 내지 제 79항 중 어느 한 항에 따른 뉴클레오타이드 구조체를 포함하는 폴리뉴클레오타이드를 포함하는 발현 카세트를 상기 식물에 도입하는 단계; 및
    (b) 상기 당단백질의 발현에 적합한 조건하에서 상기 식물을 배양하는 단계 를 포함하는 것을 특징으로 하는 방법.
  137. 제 136항에 있어서,
    상기 포유류 폴리펩타이드가 단일클론 항체인 것을 특징으로 하는 방법.
  138. 제 136항에 있어서,
    상기 포유류의 폴리펩타이드가 인터페론, 에리트로포이에틴(EPO), 조직 플라스미노겐 활성자(tPA), 플라스미노겐, 혈액 응고 인자, 과립구-대식세포 콜로니 자극 인자(GM-CSF) 및 치료학적 면역글로불린으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
  139. 제 127항 내지 제 138항 중 어느 한 항에 있어서,
    상기 고등 식물이 단자엽인 것을 특징으로 하는 방법.
  140. 제 139항에 있어서,
    상기 단자엽이 개구리밥과(Lemnaceae)에 속하는 식물인 것을 특징으로 하는 방법.
  141. 제 140항에 있어서,
    상기 단자엽이 스피로델라(Spirodela) 속, 울피아(Wolffia) 속, 울피엘 라(Wolfiella) 속, 란돌티아(Landoltia) 속 및 렘나(Lemna) 속으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
  142. 제 141항에 있어서,
    상기 단자엽이 렘나 마이너(Lemna minor), 렘나 미니스큘라(Lemna miniscula), 렘나 에퀴녹티얼리스(Lemna aequinoctialis) 및 렘나 지바(Lemna gibba)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
  143. 제 127항 내지 제 138항 중 어느 한 항에 있어서,
    상기 식물이 쌍자엽인 것을 특징으로 하는 방법.
  144. 고등 식물에 제 50항 내지 제 99항 중 어느 한 항에 따른 뉴클레오타이드 구조체를 도입하여, 당단백질의 발현에 적합한 조건하에서 상기 식물을 배양하는 단계를 포함하는, 고등 식물에서 생산되는 당단백질의 N-당화 프로파일(N-glycosylation profile)의 이질성(heterogeneity)을 감소시키는 방법.
  145. 제 144항에 있어서,
    상기 당단백질이 내인성 당단백질인 것을 특징으로 하는 방법.
  146. 제 144항에 있어서,
    상기 당단백질이 이종의 당단백질인 것을 특징으로 하는 방법.
  147. 제 146항에 있어서,
    상기 이종의 당단백질이 포유류 당단백질인 것을 특징으로 하는 방법.
  148. 제 147항에 있어서,
    상기 포유류 당단백질이 단일클론 항체인 것을 특징으로 하는 방법.
  149. 제 147항에 있어서,
    상기 포유류 당단백질이 인터페론, 에리트로포이에틴(EPO), 조직 플라스미노겐 활성자(tPA), 플라스미노겐, 혈액 응고 인자, 과립구-대식세포 콜로니 자극 인자(GM-CSF) 및 치료학적 면역글로불린으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
  150. 제 144항 내지 제 149항 중 어느 한 항에 있어서,
    상기 프로파일에서 N-글리칸의 90% 이상이 GlcNAc2Man3GlcNAc2(G0)이고,
    상기 프로파일은 푸코스, 자일로스, 또는 푸코스와 자일로스 둘다의 부착이 결여된 것을 특징으로 하는 방법.
  151. 제 150항에 있어서,
    상기 프로파일에서 N-글리칸의 95% 이상이 GO인 것을 특징으로 하는 방법.
  152. 제 144항 내지 제 151항 중 어느 한 항에 있어서,
    상기 고등 식물이 단자엽인 것을 특징으로 하는 방법.
  153. 제 152항에 있어서,
    상기 단자엽이 개구리밥과(Lemnaceae)에 속하는 식물인 것을 특징으로 하는 방법.
  154. 제 153항에 있어서,
    상기 단자엽이 스피로델라(Spirodela) 속, 울피아(Wolffia) 속, 울피엘라(Wolfiella) 속, 란돌티아(Landoltia) 속 및 렘나(Lemna) 속으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
  155. 제 154항에 있어서,
    상기 단자엽이 렘나 마이너(Lemna minor), 렘나 미니스큘라(Lemna miniscula), 렘나 에퀴녹티얼리스(Lemna aequinoctialis) 및 렘나 지바(Lemna gibba)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
  156. 제 153항 내지 제 155항 중 어느 한 항에 있어서,
    상기 N-당화 프로파일의 이질성 감소가 상기 식물의 생산 규모를 확대해도 유지되며,
    상기 생산 규모가 6,500배 이상 증가하는 것을 특징으로 하는 방법.
  157. 제 153항 내지 제 156항 중 어느 한 항에 있어서,
    상기 N-당화 프로파일의 이질성 감소는 상기 식물의 연속 클론 배양(clonal culture) 동안에 유지되는 것을 특징으로 하는 방법.
  158. 제 157항에 있어서,
    상기 N-당화 프로파일의 이질성 감소는 8개월 이상 상기 식물을 연속 클론 배양하는 동안에 유지되는 것을 특징으로 하는 방법.
  159. 제 144항 내지 제 151항 중 어느 한 항에 있어서,
    상기 고등 식물이 쌍자엽인 것을 특징으로 하는 방법.
  160. 항체 투여에 의한 보체 활성화와 관련있는 한가지 이상의 부작용을 낮추는 방법으로서,
    상기 방법이 실질적으로 동질적인 항체(substantially homogeneous antibody) 조성물의 형태로 상기 항체를 투여하는 단계를 포함하며;
    상기 조성물에 존재하는 상기 항체의 90% 이상이 GO 글리코형(glycoform)이 며,
    상기 조성물이 전구체 글리코형으로 표시되는 미량의 상기 항체를 포함하며,
    상기 조성물내 상기 항체가 감소된 보체-의존적인 세포독성(CDC) 활성을 가지는 것을 특징으로 하는 방법.
  161. 제 160항에 있어서,
    상기 항체가 단일클론 항체인 것을 특징으로 하는 방법.
  162. 제 161항에 있어서,
    상기 단일클론 항체가 CD20 항원에 결합하는 것을 특징으로 하는 방법.
  163. 제 160항 내지 제 162항 중 어느 한 항에 있어서,
    상기 항체가 FcγRIII에 대해 증가된 결합 친화성을 보이는 것을 특징으로 하는 방법.
  164. 제 160항 내지 제 163항 중 어느 한 항에 있어서, 상기 항체가 증가된 항체-의존적인 세포성 세포독성(ADCC) 활성을 가지는 것을 특징으로 하는 방법.
  165. 제 136항 내지 제 159항 중 어느 한 항의 방법에 따라 제조된 당단백질을 포함하는 조성물.
KR1020087020032A 2006-01-17 2007-01-17 식물에서 n-글리칸의 인간화 및 최적화 조성물 및 방법 KR20080094918A (ko)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
US75929806P 2006-01-17 2006-01-17
US60/759,298 2006-01-17
US79037306P 2006-04-07 2006-04-07
US60/790,373 2006-04-07
US79117806P 2006-04-11 2006-04-11
US60/791,178 2006-04-11
US81270206P 2006-06-09 2006-06-09
US60/812,702 2006-06-09
US83699806P 2006-08-11 2006-08-11
US60/836,998 2006-08-11
US86035806P 2006-11-21 2006-11-21
US60/860,358 2006-11-21

Publications (1)

Publication Number Publication Date
KR20080094918A true KR20080094918A (ko) 2008-10-27

Family

ID=38288381

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020087020032A KR20080094918A (ko) 2006-01-17 2007-01-17 식물에서 n-글리칸의 인간화 및 최적화 조성물 및 방법
KR1020087019978A KR20080094064A (ko) 2006-01-17 2007-01-17 식물에서 n-글리칸의 인간화 및 최적화 조성물 및 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020087019978A KR20080094064A (ko) 2006-01-17 2007-01-17 식물에서 n-글리칸의 인간화 및 최적화 조성물 및 방법

Country Status (14)

Country Link
US (3) US8716557B2 (ko)
EP (2) EP1974040B1 (ko)
JP (2) JP2009526520A (ko)
KR (2) KR20080094918A (ko)
AU (2) AU2007205935B2 (ko)
BR (2) BRPI0707290A2 (ko)
CA (2) CA2637252A1 (ko)
DK (1) DK1974040T3 (ko)
ES (1) ES2395842T3 (ko)
HK (1) HK1118309A1 (ko)
IL (2) IL192761A0 (ko)
MX (2) MX2008009221A (ko)
NZ (2) NZ596322A (ko)
WO (2) WO2007084922A2 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021101351A3 (ko) * 2019-11-21 2021-07-22 (주)지플러스 생명과학 비푸코실화된 담배를 이용하여 생산한 항체 및 이의 용도
KR20230105738A (ko) 2022-01-04 2023-07-12 (주)지플러스생명과학 당쇄 구조가 변형된 식물로부터 생산된 SARS-CoV-2의 스파이크 단백질의 수용체 결합 도메인 및 이의 용도
WO2024096643A1 (ko) * 2022-11-02 2024-05-10 주식회사 피토맵 N-당질화 돌연변이 벼를 이용한 단일클론항체 생산용 벼의 제조방법 및 이에 의해 제조된 단일클론항체

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0707290A2 (pt) 2006-01-17 2011-08-16 Biolex Therapeutics Inc composições e métodos para humanização e otimização de n-glicanas em plantas
ES2396569T3 (es) * 2006-01-17 2013-02-22 Medarex, Inc. Anticuerpos monoclonales contra CD30 que carecen de restos fucosilo y xilosilo
US20090060921A1 (en) * 2006-01-17 2009-03-05 Biolex Therapeutics, Inc. Glycan-optimized anti-cd20 antibodies
EP1905825A1 (en) * 2006-09-29 2008-04-02 greenovation Biotech GmbH Galactosyltransferase
ES2678060T3 (es) 2006-12-01 2018-08-08 E. R. Squibb & Sons, L.L.C. Anticuerpos, en particular, anticuerpos humanos, que se unen a CD22 y usos de los mismos
CL2007003622A1 (es) 2006-12-13 2009-08-07 Medarex Inc Anticuerpo monoclonal humano anti-cd19; composicion que lo comprende; y metodo de inhibicion del crecimiento de celulas tumorales.
MX2009006277A (es) 2006-12-14 2009-07-24 Medarex Inc Anticuerpos humanos que se enlazan a cd70 y usos de los mismos.
JP5311060B2 (ja) 2007-03-08 2013-10-09 カロバイオス ファーマシューティカルズ インコーポレイティッド 固形腫瘍の治療のためのEphA3抗体
AU2007360682A1 (en) * 2007-10-31 2009-05-07 Bayer Bioscience N.V. Method to produce modified plants with altered N-glycosylation pattern
JP2010029102A (ja) * 2008-07-29 2010-02-12 Katakura Industries Co Ltd α1,3−フコシルトランスフェラーゼ
JP5435535B2 (ja) * 2008-08-30 2014-03-05 独立行政法人産業技術総合研究所 植物における糖鎖構造の改変方法及びその植物体
US9181341B2 (en) 2009-01-19 2015-11-10 Innate Pharma Anti-KIR3D antibodies
EP2400984A4 (en) * 2009-02-25 2013-01-23 Merck Sharp & Dohme HER2 ANTIBODY COMPOSITIONS
EA201101241A1 (ru) 2009-03-06 2012-04-30 Калобайос Фармасьютиклз, Инк. Лечение лейкозов и хронических миелопролиферативных болезней антителами к ерна3
WO2011005502A2 (en) 2009-06-23 2011-01-13 Biolex Therapeutics, Inc. Methods and compositions for the cryopreservation of duckweed
CA2794037A1 (en) * 2010-03-22 2011-09-29 Philip Morris Products S.A. Modifying enzyme activity in plants
US20130177555A1 (en) 2010-08-13 2013-07-11 Medimmune Limited Monomeric Polypeptides Comprising Variant FC Regions And Methods Of Use
WO2012022734A2 (en) 2010-08-16 2012-02-23 Medimmune Limited Anti-icam-1 antibodies and methods of use
KR101293658B1 (ko) * 2010-12-30 2013-08-07 대한민국 알파-1,3-푸코실트랜스퍼라아제 및/또는 베타-1,2-자일로실트렌스퍼라아제 유전자를 포함하는 벼 형질전환용 벡터 및 형질전환된 벼
EP2665818B1 (en) 2011-01-17 2017-03-22 Philip Morris Products S.a.s. Protein expression in plants
CN103502455A (zh) * 2011-01-17 2014-01-08 菲利普莫里斯生产公司 用于在植物中核酸表达的载体
BR112013020086B1 (pt) 2011-02-08 2020-12-08 Medimmune, Llc Anticorpo isolado ou seu fragmento de ligação a antígeno, composição compreendendo o anticorpo ou fragmento de ligação a antígeno, kit, uso de uma quantidade eficaz de um anticorpo ou seu fragmento de ligação a antígeno e método para inibir a formação da oligômeros de alfatoxina
US10160789B2 (en) * 2011-03-14 2018-12-25 University Of Louisville Research Foundation, Inc. Polypeptides having immunoactivating activity and methods of producing the same
CA2854806A1 (en) 2011-11-07 2013-05-16 Medimmune, Llc Multispecific and multivalent binding proteins and uses thereof
US9573996B2 (en) 2011-12-16 2017-02-21 Synthon Biopharmaceuticals B.V. Monoclonal antibodies to human proinflammatory cytokines and methods for treating inflammatory diseases
US10577416B2 (en) 2012-02-07 2020-03-03 Innate Pharma, S.A. Mica binding agents
WO2014070786A1 (en) * 2012-10-29 2014-05-08 The University Of North Carolina At Chapel Hill Compositions and methods for inhibiting pathogen infection
US10829543B2 (en) 2012-10-29 2020-11-10 The University Of North Carolina At Chapel Hill Compositions and methods for inhibiting pathogen infection
CN104968193B (zh) * 2012-11-01 2021-02-09 塞尔克蒂斯股份有限公司 用于生成治疗性蛋白质的植物
US9534041B2 (en) 2013-02-12 2017-01-03 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Monoclonal antibodies that neutralize a norovirus
WO2014125041A1 (en) 2013-02-14 2014-08-21 Innate Pharma Treatment of peripheral t cell lymphoma
ES2730011T3 (es) 2013-02-20 2019-11-07 Innate Pharma Un compuesto que se une específicamente a KIR3DL2 para el uso en el tratamiento de linfoma de células T periférico
JP2013143969A (ja) * 2013-04-30 2013-07-25 National Institute Of Advanced Industrial Science & Technology 植物における糖鎖構造の改変方法及びその植物体
EP3583950A1 (en) 2013-05-09 2019-12-25 The U.S.A. As Represented By The Secretary, Department Of Health And Human Services Single-domain vhh antibodies directed to norovirus gi.1 and gii.4 and their use
WO2015050959A1 (en) 2013-10-01 2015-04-09 Yale University Anti-kit antibodies and methods of use thereof
AU2014329609B2 (en) 2013-10-02 2019-09-12 Humabs Biomed Sa Neutralizing anti-influenza A antibodies and uses thereof
AU2015289805B2 (en) 2014-07-15 2020-06-25 Humabs Biomed Sa Neutralizing anti-influenza B antibodies and uses thereof
KR101606918B1 (ko) * 2014-08-04 2016-03-28 경상대학교산학협력단 인간화 저-만노스형 엔-당질 합성 식물 및 이의 용도
WO2016030488A1 (en) 2014-08-27 2016-03-03 Innate Pharma Treatment of celiac disease
MX2017004196A (es) 2014-10-01 2017-07-19 Medimmune Ltd Anticuerpos contra ticagrelor y metodos de uso.
US11566082B2 (en) 2014-11-17 2023-01-31 Cytiva Bioprocess R&D Ab Mutated immunoglobulin-binding polypeptides
EA038931B9 (ru) * 2014-11-20 2022-02-18 Йиссум Рисерч Дивелопмент Компани Оф Зе Хебрю Юниверсити Оф Иерусалим Лтд. Композиции и способы получения полипептидов с модифицированным профилем гликозилирования в клетках растений
WO2016090170A1 (en) 2014-12-05 2016-06-09 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services A potent anti-influenza a neuraminidase subtype n1 antibody
HUE051749T2 (hu) 2015-03-02 2021-03-29 Conagen Inc Labirintusgomba mikroorganizmusokból származó szabályozó elemek
EP3292152A1 (en) 2015-05-07 2018-03-14 Agenus Inc. Anti-ox40 antibodies and methods of use thereof
CN107667114B (zh) 2015-06-01 2021-07-02 免疫医疗有限责任公司 中和抗流感结合分子及其用途
WO2017004168A1 (en) 2015-06-29 2017-01-05 University Of Louisville Research Foundation, Inc. Compositions and methods for treating cancer and promoting wound healing
SG11201806542PA (en) 2016-03-15 2018-08-30 Innate Pharma Anti-mica antibodies
CA3017225A1 (en) 2016-03-16 2017-09-21 Synthetic Genomics, Inc. Production of proteins in labyrinthulomycetes
US10730908B2 (en) 2016-05-11 2020-08-04 Ge Healthcare Bioprocess R&D Ab Separation method
US10889615B2 (en) 2016-05-11 2021-01-12 Cytiva Bioprocess R&D Ab Mutated immunoglobulin-binding polypeptides
US10654887B2 (en) 2016-05-11 2020-05-19 Ge Healthcare Bio-Process R&D Ab Separation matrix
US11753438B2 (en) 2016-05-11 2023-09-12 Cytiva Bioprocess R&D Ab Method of cleaning and/or sanitizing a separation matrix
JP7106187B2 (ja) 2016-05-11 2022-07-26 サイティバ・バイオプロセス・アールアンドディ・アクチボラグ 分離マトリックスを保存する方法
CN109071613A (zh) 2016-05-11 2018-12-21 通用电气医疗集团生物工艺研发股份公司 分离基质
US10703774B2 (en) 2016-09-30 2020-07-07 Ge Healthcare Bioprocess R&D Ab Separation method
IL264962B1 (en) 2016-08-23 2024-05-01 Medimmune Ltd Antibodies against VEGF-A and against ANG2 and their uses
EP3783022A3 (en) 2016-08-23 2021-06-30 MedImmune Limited Anti-vegf-a antibodies and uses thereof
WO2018053032A1 (en) 2016-09-13 2018-03-22 Humanigen, Inc. Epha3 antibodies for the treatment of pulmonary fibrosis
KR20190068602A (ko) 2016-10-21 2019-06-18 이나뜨 파르마 항-kir3dl2 작용제에 의한 치료
US10457970B2 (en) 2016-11-01 2019-10-29 Conagen Inc. Expression of modified glycoproteins and glycopeptides
US10633454B2 (en) 2016-11-01 2020-04-28 Conagen Inc. Expression of modified glycoproteins and glycopeptides
WO2018098572A1 (en) 2016-12-01 2018-06-07 Plantform Corporation Transgenic plant with reduced fucosyltransferase and xylosyltransferase activity
CA3046082A1 (en) 2016-12-07 2018-06-14 Agenus Inc. Antibodies and methods of use thereof
CN111108123A (zh) 2017-05-29 2020-05-05 加马玛布斯制药公司 癌症相关的免疫抑制抑制剂
GB201710838D0 (en) 2017-07-05 2017-08-16 Ucl Business Plc Bispecific antibodies
JP7437301B2 (ja) 2017-08-25 2024-02-22 ファイヴ プライム セラピューティクス インク B7-h4抗体及びその使用方法
CN111868089A (zh) 2018-02-21 2020-10-30 戊瑞治疗有限公司 B7-h4抗体给药方案
CA3091174A1 (en) 2018-02-21 2019-08-29 Five Prime Therapeutics, Inc. B7-h4 antibody formulations
CN111971308A (zh) 2018-03-02 2020-11-20 戊瑞治疗有限公司 B7-h4抗体及其使用方法
KR20210076025A (ko) 2018-10-15 2021-06-23 파이브 프라임 테라퓨틱스, 인크. 암 병용 요법
WO2020190834A1 (en) * 2019-03-18 2020-09-24 Score Pharma, Inc. Compounds for inhibiting fucosylation and methods for using the same
US20210355196A1 (en) 2020-05-17 2021-11-18 Astrazeneca Uk Limited Sars-cov-2 antibodies and methods of selecting and using the same
CN116234577A (zh) 2020-08-10 2023-06-06 阿斯利康(英国)有限公司 用于治疗和预防covid-19的sars-cov-2抗体
US11277658B1 (en) 2020-08-21 2022-03-15 Beam, Inc. Integrating overlaid digital content into displayed data via graphics processing circuitry
WO2022153212A1 (en) 2021-01-13 2022-07-21 Axon Neuroscience Se Antibodies neutralizing sars-cov-2
US11475610B1 (en) 2021-04-30 2022-10-18 Mobeus Industries, Inc. Controlling interactivity of digital content overlaid onto displayed data via graphics processing circuitry using a frame buffer
TW202342095A (zh) 2021-11-05 2023-11-01 英商阿斯特捷利康英國股份有限公司 用於治療和預防covid—19之組成物
WO2023209177A1 (en) 2022-04-29 2023-11-02 Astrazeneca Uk Limited Sars-cov-2 antibodies and methods of using the same

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL81737A (en) 1986-03-28 1992-11-15 Calgene Inc Regulation of gene expression in plant cells
JPH08501928A (ja) 1992-07-02 1996-03-05 ハイブライドン インコーポレイテッド 治療剤としての自己安定化オリゴヌクレオチド
AU710874B2 (en) 1995-06-30 1999-09-30 Dna Plant Technology Corporation Delayed ripening tomato plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
US7161064B2 (en) * 1997-08-12 2007-01-09 North Carolina State University Method for producing stably transformed duckweed using microprojectile bombardment
US6506559B1 (en) * 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
CZ295108B6 (cs) 1998-03-20 2005-05-18 Benitec Australia Ltd Syntetický gen obsahující dispergovanou nebo cizorodou deoxyribonukleovou molekulu a genový konstrukt obsahující tento syntetický gen
AUPP249298A0 (en) 1998-03-20 1998-04-23 Ag-Gene Australia Limited Synthetic genes and genetic constructs comprising same I
ES2624549T3 (es) 1998-04-08 2017-07-14 Commonwealth Scientific And Industrial Research Organisati Métodos y medios para obtener fenotipos modificados
US20040214330A1 (en) * 1999-04-07 2004-10-28 Waterhouse Peter Michael Methods and means for obtaining modified phenotypes
WO1999054342A1 (en) 1998-04-20 1999-10-28 Pablo Umana Glycosylation engineering of antibodies for improving antibody-dependent cellular cytotoxicity
US7019195B1 (en) 1998-05-26 2006-03-28 Syngenta Participations Ag Method for conferring resistance or tolerance aganist furovirus, potyvirus, tospovirus, and cucomovirus to plant cells
AR020078A1 (es) 1998-05-26 2002-04-10 Syngenta Participations Ag Metodo para alterar la expresion de un gen objetivo en una celula de planta
EP2264177B1 (en) * 1998-12-09 2015-09-30 Phyton Holdings, LLC Glycoproteins having human-type glycosylation
EP2314700A1 (en) 1999-01-28 2011-04-27 Medical College of Georgia Research Institute, Inc Composition and method for in vivo and in vitro attenuation of gene expression using double stranded RNA
AT408446B (de) 1999-02-18 2001-11-26 Altmann Friedrich Dr Fucosyltransferase-gen
WO2000049035A1 (en) 1999-02-19 2000-08-24 The General Hospital Corporation Gene silencing
ES2568899T3 (es) * 1999-04-09 2016-05-05 Kyowa Hakko Kirin Co., Ltd. Procedimiento para controlar la actividad de una molécula inmunofuncional
BR0014945A (pt) 1999-10-21 2004-08-31 Monsanto Co Modificação pós-traducional de proteìnas recombinantes produzidas em plantas
NZ518532A (en) 1999-10-26 2004-02-27 Plant Res Internat B Transgenic plant expressing mammalian beta-1,4- galactosyltransferase
ES2349427T3 (es) * 1999-10-26 2011-01-03 Stichting Dienst Landbouwkundig Onderzoek Glicosilación de tipo mamífero en plantas.
US7829693B2 (en) * 1999-11-24 2010-11-09 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of a target gene
AT409381B (de) 2000-03-03 2002-07-25 Gloessl Josef Dr Xylosyltransferase-gen
EP1272630A2 (en) 2000-03-16 2003-01-08 Genetica, Inc. Methods and compositions for rna interference
IL151928A0 (en) * 2000-03-30 2003-04-10 Whitehead Biomedical Inst Rna sequence-specific mediators of rna interference
US7598055B2 (en) * 2000-06-28 2009-10-06 Glycofi, Inc. N-acetylglucosaminyltransferase III expression in lower eukaryotes
US7449308B2 (en) 2000-06-28 2008-11-11 Glycofi, Inc. Combinatorial DNA library for producing modified N-glycans in lower eukaryotes
DE60139720D1 (de) * 2000-06-28 2009-10-08 Glycofi Inc Verfahren für die Herstellung modifizierter Glykoproteine
US20060029604A1 (en) * 2000-06-28 2006-02-09 Gerngross Tillman U Immunoglobulins comprising predominantly a GlcNAc2Man3GlcNAc2 glycoform
US6946292B2 (en) 2000-10-06 2005-09-20 Kyowa Hakko Kogyo Co., Ltd. Cells producing antibody compositions with increased antibody dependent cytotoxic activity
ES2651952T3 (es) 2000-10-06 2018-01-30 Kyowa Hakko Kirin Co., Ltd. Células que producen unas composiciones de anticuerpo
ES2215494T5 (es) * 2000-12-01 2017-12-28 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Moléculas de RNA pequeñas que median la interferencia de RNA
CA2433680A1 (en) 2000-12-28 2002-08-01 Gregory M Arndt Double-stranded rna-mediated gene suppression
WO2002057468A2 (en) * 2001-01-19 2002-07-25 The Dow Chemical Company Method for secretory production of glycoprotein having human-type sugar chain using plant cell
CN101781635A (zh) 2001-03-06 2010-07-21 陶氏化学公司 具有动物型糖链加成功能的植物细胞
HUP0700103A3 (en) 2001-08-03 2012-09-28 Glycart Biotechnology Ag Antibody glycosylation variants having increased antibody-dependent cellular cytotoxicity
CN100423777C (zh) 2001-10-25 2008-10-08 杰南技术公司 糖蛋白组合物
EP2359685B1 (en) * 2001-12-27 2013-12-04 GlycoFi, Inc. Methods to engineer mammalian-type carbohydrate structures
JP2003235561A (ja) 2002-02-21 2003-08-26 Kazuhito Fujiyama 植物型糖鎖を持つ糖タンパク質を動物型糖鎖を持つ糖タンパク質に変換する方法
JP2006503548A (ja) 2002-03-14 2006-02-02 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガニゼーション 遺伝子サイレンシングをモニタリングおよび調節するための方法および手段
EP1498491A4 (en) 2002-04-09 2006-12-13 Kyowa Hakko Kogyo Kk METHOD FOR INCREASING THE ACTIVITY OF AN ANTIBODY COMPOSITION FOR BINDING TO THE FC GAMMA RECEPTOR IIIA
DE10224878A1 (de) * 2002-06-05 2004-01-08 Pall Corporation Filtereinsatz und Verfahren zu dessen Herstellung
EP1560931B1 (en) * 2002-11-14 2011-07-27 Dharmacon, Inc. Functional and hyperfunctional sirna
AR042145A1 (es) 2002-11-27 2005-06-08 Dow Agrociences Llc Produccion de inmunoglobulinas en plantas con una fucocilacion reducida
CA2549932C (en) 2002-12-20 2013-08-20 Greenovation Biotech Gmbh Production of heterologous glycosylated proteins in bryophyte cells
AU2004276306A1 (en) 2003-09-23 2005-04-07 Favrille, Inc. Altering a B cell pathology using self-derived antigens in conjunction with specific-binding cytoreductive agent
JPWO2005035778A1 (ja) 2003-10-09 2006-12-21 協和醗酵工業株式会社 α1,6−フコシルトランスフェラーゼの機能を抑制するRNAを用いた抗体組成物の製造法
EP1776385A1 (en) 2004-07-21 2007-04-25 Glycofi, Inc. Immunoglobulins comprising predominantly a glcnac2man3glcnac2 glycoform
JP2008525440A (ja) 2004-12-23 2008-07-17 グライコフィ, インコーポレイテッド 主としてGalGlcNAcMan5GLcNAc2グリコフォームを含む免疫グロブリン
EP1942935A4 (en) 2005-09-02 2009-12-23 Glycofi Inc IMMUNOGLOBULINS COMPRISING MAINLY A GLYCOFORM GLCNACMAN3GLCNAC2
ES2396569T3 (es) * 2006-01-17 2013-02-22 Medarex, Inc. Anticuerpos monoclonales contra CD30 que carecen de restos fucosilo y xilosilo
BRPI0707290A2 (pt) * 2006-01-17 2011-08-16 Biolex Therapeutics Inc composições e métodos para humanização e otimização de n-glicanas em plantas
EP1878747A1 (en) 2006-07-11 2008-01-16 greenovation Biotech GmbH Glyco-engineered antibodies

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021101351A3 (ko) * 2019-11-21 2021-07-22 (주)지플러스 생명과학 비푸코실화된 담배를 이용하여 생산한 항체 및 이의 용도
KR20230105738A (ko) 2022-01-04 2023-07-12 (주)지플러스생명과학 당쇄 구조가 변형된 식물로부터 생산된 SARS-CoV-2의 스파이크 단백질의 수용체 결합 도메인 및 이의 용도
WO2024096643A1 (ko) * 2022-11-02 2024-05-10 주식회사 피토맵 N-당질화 돌연변이 벼를 이용한 단일클론항체 생산용 벼의 제조방법 및 이에 의해 제조된 단일클론항체

Also Published As

Publication number Publication date
WO2007084922A8 (en) 2009-07-23
AU2007205939A1 (en) 2007-07-26
US8716557B2 (en) 2014-05-06
IL192802A0 (en) 2009-02-11
CA2637252A1 (en) 2007-07-26
NZ598048A (en) 2013-05-31
WO2007084922A3 (en) 2008-03-06
US20080066200A1 (en) 2008-03-13
MX2008009220A (es) 2008-10-10
US7884264B2 (en) 2011-02-08
AU2007205935A1 (en) 2007-07-26
EP1974040A2 (en) 2008-10-01
WO2007084926A3 (en) 2008-04-24
JP2009526520A (ja) 2009-07-23
HK1118309A1 (en) 2009-02-06
MX2008009221A (es) 2008-11-27
AU2007205939B2 (en) 2012-12-13
CA2637254A1 (en) 2007-07-26
US20110144308A1 (en) 2011-06-16
WO2007084922A2 (en) 2007-07-26
AU2007205935B2 (en) 2013-07-11
WO2007084926A2 (en) 2007-07-26
IL192761A0 (en) 2011-08-01
ES2395842T3 (es) 2013-02-15
NZ596322A (en) 2013-02-22
BRPI0707290A2 (pt) 2011-08-16
EP1974040B1 (en) 2012-10-03
US20080060092A1 (en) 2008-03-06
EP1973940A2 (en) 2008-10-01
JP2009523432A (ja) 2009-06-25
KR20080094064A (ko) 2008-10-22
DK1974040T3 (da) 2012-12-17
BRPI0707289A2 (pt) 2011-04-26

Similar Documents

Publication Publication Date Title
US7884264B2 (en) Compositions and methods for inhibition of fucosyltransferase and xylosyltransferase expression in duckweed plants
US20090060921A1 (en) Glycan-optimized anti-cd20 antibodies
US8084222B2 (en) Methods for generating host cells
JP5820800B2 (ja) 改変抗体組成物
JP5424878B2 (ja) 糖が操作された抗体
US10196664B2 (en) Nicotiana benthamiana plants deficient in fucosyltransferase activity
Jez et al. Significant impact of single N-glycan residues on the biological activity of Fc-based antibody-like fragments
CN101426814B (zh) 组合物和用于植物中n聚糖的人源化和最优化的方法

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E601 Decision to refuse application