KR20090077059A - 갈락토실트랜스퍼라아제 - Google Patents

갈락토실트랜스퍼라아제 Download PDF

Info

Publication number
KR20090077059A
KR20090077059A KR1020097008893A KR20097008893A KR20090077059A KR 20090077059 A KR20090077059 A KR 20090077059A KR 1020097008893 A KR1020097008893 A KR 1020097008893A KR 20097008893 A KR20097008893 A KR 20097008893A KR 20090077059 A KR20090077059 A KR 20090077059A
Authority
KR
South Korea
Prior art keywords
sequence
plant
seq
leu
val
Prior art date
Application number
KR1020097008893A
Other languages
English (en)
Inventor
하이케 라운하르트
크리스티안 스템머
볼프강 조스트
길베르트 고르
랄프 레스키
슈테판 렌징
Original Assignee
그리노파티온 바이오테크 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 그리노파티온 바이오테크 게엠베하 filed Critical 그리노파티온 바이오테크 게엠베하
Publication of KR20090077059A publication Critical patent/KR20090077059A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/001Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
    • C07K14/003Peptide-nucleic acids (PNAs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01086Glucosaminylgalactosylglucosylceramide beta-galactosyltransferase (2.4.1.86)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 갈락토실트랜스퍼라아제를 엔코딩하는 DNA 분자, 기능이상 갈락토실트랜스퍼라아제 유전자(들)을 포함하는 재조합 숙주 세포, 조직 또는 생물체, 도입된 기능성 갈락토실트랜스퍼라아제 유전자를 포함하는 재조합 숙주 세포, 조직 또는 생물체, 이를 사용하여 단백질을 생성시키는 방법, 갈락토실트랜스퍼라아제를 생성시키는 방법 및 갈락토실트랜스퍼라아제의 벡터 및 용도에 관한 것이다.

Description

갈락토실트랜스퍼라아제 {GALACTOSYLTRANSFERASE}
본 발명은 글리코실트랜스퍼라아제를 코딩하는 폴리누클레오티드에 관한 것이다. 또한, 본 발명은 상기 폴리누클레오티드의 부분 폴리누클레오티드 뿐만 아니라 발현 또는 유전자 붕괴를 위해 이러한 폴리누클레오티드를 포함하는 벡터, 상기 폴리누클레오티드 또는 이의 일부 또는 이로부터 유래된 DNA로 트랜스펙션된 재조합 숙주 세포, 조직 또는 생물체, 뿐만 아니라 이러한 숙주 세포, 조직 또는 생물체에서 생성된 당단백질에 관한 것이다. 또한, 본 발명은 시험관내 뿐만 아니라 생체내에서의 상기 폴리누클레오티드의 발현 생성물의 용도에 관한 것이다.
과거에, 이종 단백질은 다양한 형질전환된 세포 시스템, 예를 들어 세균, 진균, 예를 들어 효모, 곤충, 식물 또는 포유동물 세포주로부터 유래된 것들을 사용하여 생성되었다.
원핵 생물체에서 생성된 단백질은 진핵 시스템에서 생성된 진핵 단백질과 유사한 방식으로 번역후 수식될 수 없는데, 예를 들어, 원핵 단백질은 특정 아미노산 잔기, 예를 들어 아스파르트산 (N) 잔기에서 적절한 당에 의해 당화 (N-결합된 당화)될 수 없다. 또한, 세균 생성된 진핵 단백질의 폴딩은 예를 들어 세균이 시스테인 이황화물 다리를 형성할 수 없기 때문에 부적절할 수 있다. 더욱이, 세균 생 성된 재조합 단백질은 자주 불용성 봉입체(inclusion body)로서 응집되고 축적된다.
진핵세포 시스템이 다양한 진핵 생물체, 예를 들어 인간에서 발견되는 당화된 단백질의 생성에 더 적합한데, 이는 이러한 세포 시스템이 번역후 수식, 예를 들어 생성된 단백질의 N-당화를 수행할 수 있기 때문이다. 그러나, 예를 들어 약제로서 사용하고자 하는 단백질 서열을 생성하기에 적합한 이종 유전자로 형질전환된 진핵세포 시스템에서 부딪히는 문제는 이러한 단백질상의 당화 패턴이 종종 고유 패턴, 즉, 그러한 단백질이 생성된 진핵세포 시스템의 고유 패턴을 획득한다는 것이다: 비-동물(non-animal) 당화 패턴을 포함하는 당화된 단백질이 생성되고, 이어서 이러한 단백질은 인간을 포함하는 동물에 적용되는 경우 면역원성 및/또는 알레르겐성이 될 수 있다. 식물의 경우, 이러한 제한은 식물에서 일반적으로 N-글리칸의 코어 구조에 결합되어 있는 식물 특이적 당 잔기인 1,2-크실로오스와 α1,3-푸코오스의 제거에 의해 극복되었다 (Lerouge et al. 1998 Plant Mol. Biol. 38, 31-48; Rayon et al. 1998 J. Experimental Bot . 49, 1463-1472). 아라비돕시스 탈리아나(Arabidopsis thaliana) (Strasser et al. 2004 FEBS Lett. 561, 132-136) 및 선태류(bryophyte) 피스코미트렐라 파텐스(Physcomitrella patens) (EP1431394 ; Koprivova et al. 2004 Plant Biotechnol. J. 2, 517-523)의 경우, 코어 α1,3-푸코오스와 1,2-크실로오스 잔기가 완전히 결여된 N-글리칸 패턴을 나타내는 돌연변이체가 생성되었다. 놀랍게도, 복합체형(complex-type) N-글리칸의 패턴의 변형에도 불구하고, 이러한 돌연변이체에서 형태학적 변경 또는 생존도의 변화는 관찰되지 않았다.
상기 기재된 2개의 식물 특이적 잔기의 첨가는 별도로 하고, ER 및 시스-골지(cis-Golgi)에서의 당단백질 성숙 단계는 GlcNAc-트랜스퍼라아제 I, GlcNAc-트랜스퍼라아제 II 및 골지 a-만노시다아제의 작용까지는 식물과 포유동물에서 동일하다 (Lerouge et al. 1998 Plant Mol. Biol. 38, 31-48). 또한, N-글리칸 신장은 2개의 계(kingdom)에서 상이한 방식으로 수행된다. 포유동물의 경우, 이러한 단계가 단지 부분적으로 일어나는 IgG를 특히 제외하고는 말단 GlcNAc 잔기가 βl,4- (혹은 드물게는 β1,3-에 의함)- 갈락토실트랜스퍼라아제의 작용에 의해 즉시 차폐되는 반면, 식물의 경우 신장은 오로지 β1,3-갈락토실화에 의해서만 이루어지고, 다양한 구조 유형들의 상대 존재비로부터 추론될 수 있는 바와 같이 글리칸의 매우 적은 부분만이 이러한 변형을 겪는 것으로 여겨진다. 포유동물에서 갈락토오스-잔기는 시알산에 의해 캡핑(capping)될 수 있고, 매우 드물게만 푸코오스에 의해 치환될 수 있다. 재차 언급하지만, 식물은 상이한데, 이는 식물에서는 시알릴화가 없으며, 말단 1,3-결합 갈락토오스 잔기가 결합되어 있는 경우, 식물은 끝에서 두 번째 GlcNAc 잔기를 본질적으로 항상 푸코실화하여 루이스(Lewis) a (LeA) 결정인자를 형성하기 때문이다. 명백히, β1,3-갈락토실트랜스퍼라아제가 한정 효소(limiting enzyme)이지만, 대부분의 식물 세포는 각각의 Gal 함유 안테나가 푸코실화되는 것을 보장하기에 충분한 αl,4-Fuc-트랜스퍼라아제 활성을 함유한다. LeA 구조는 인간 혈액형 결정인자이다. 이는 건강한 성인에서 그 자체로는 드물게 존재하지만, 시알릴-루이스 a (sLeA)로서는 결장암과 같은 악성 조직에서 널리 발 견되는 것으로 알려져 있다.
여하튼, LeA 함유 당단백질은 식물로부터는 드물게 단리되며, 피스코미트렐라(Physcomitrella)의 경우, 이는 야생형 식물로부터 단리되거나 코어 푸코오스와 크실로오스가 결여된 글리코-엔지니어링된(glyco-engineered) 돌연변이체로부터 단리되는 지의 여부와 관계없이 전체 가용성 당단백질의 단지 5% 이하의 양을 나타낸다 (Koprivova et al. 2003 Plant Biol. 5, 582-591; Koprivova et al. 2004 Plant Biotechnol. J. 2, 517-523).
식물에서 루이스 a 유형 글리칸 구조의 생성에 관여하는 αl,4-푸코실트랜스퍼라아제에 관한 얼마간의 연구가 수행되었지만 (JoIy et al . 2002 J. Experimental Bot. 53, 1429-1436; Bakker et al. 2001 FEBS Lett. 507, 307-312), 식물에서 N-글리칸 구조의 신장에 관여하는 특정한 β1,3 갈락토실트랜스퍼라아제에 관해 이용가능한 정보는 존재하지 않는다.
진핵생물의 경우, β1,3-갈락토실트랜스퍼라아제는 광범위한 억셉터(acceptor) 특이성 뿐만 아니라 독특한 조직 발현 패턴을 나타낸다 (Hennet 2002 Cell. Mol. Life Sci. 59, 1081-1095; Amado et al. 1998 J. Biol. Chem. 21, 12770-12778). 인간의 β1,3-갈락토실트랜스퍼라아제 패밀리(family)의 다양한 일원중에서, β1,3-갈락토실트랜스퍼라아제 2에 관해 이러한 효소가 억셉터 기질로서의 복합체형 N-글리칸 구조를 나타내는 GlcNAcβ 및 에그 오발부민(egg ovalbumin)으로 갈락토오스 잔기를 전달하는 것에 대해 활성이라는 것이 시험관내에서 밝혀졌다 (Amado et al. 1998 J. Biol. Chem. 21, 12770-12778).
인간에서의 상동 β1,3-갈락토실트랜스퍼라아제의 패밀리의 존재와 일치하게, 데이터 베이스 분석은 다양한 식물 종, 예를 들어 아라비돕시스 탈리아나 및 오리자 사티바(Oryza sativa)의 경우 β1,3-갈락토실트랜스퍼라아제 유전자의 유사하게 많은 유전자 패밀리가 존재한다는 것을 밝혀내었다. 이러한 β1,3-갈락토실트랜스퍼라아제 유전자의 일원 중 어느 것도 시험관내 또는 생체내에서 갈락토오스를 UDP-갈락토오스로부터 말단 비환원 GlcNAc 잔기, 예를 들어 복합체형 N-글리칸의 비환원 말단 잔기를 지닌 억셉터 기질로 전달하는 능력을 포함하는 효소를 코딩하는 것으로 공지되어 있지 않다.
본 발명의 목적은 식물 β1,3갈락토실트랜스퍼라아제를 코딩하는 하나 이상의 유전자 (상응하는 비-코딩(non-coding) 게놈 서열을 포함함)를 확인하고, 클로닝하고, 시퀀싱하고, 상기 유전자, 상기 유전자의 DNA 단편 또는 상기 유전자의 변경된 DNA 또는 상기 유전자로부터 유래된 DNA 또는 상기 유전자의 결실을 포함하는 DNA를 포함하는 벡터를 제조하는 데에 있다. 또 다른 목적은 이러한 벡터 중 하나 이상을 포함하는 숙주 세포, 조직 또는 생물체를 생성시키고, 루이스 a 유형 N-글리칸 구조가 완전히 결여된 당단백질을 제조하는 데에 있다. 또 다른 목적은 개선된 루이스 a 유형 N-글리칸 구조를 지닌 당단백질을 제조하기 위해 이러한 벡터 중 하나 이상을 포함하는 숙주 세포, 조직 또는 생물체를 생성시키는 데에 있다. 또 다른 목적은 효소를 후기 골지 시스터나(late Golgi cisternae)로 표적화하기 위한 막 도메인을 엔코딩하는 누클레오티드 서열을 제공하는 데에 있다.
따라서, 본 발명은 i) 염기쌍 513 내지 염기쌍 2417의 오픈 리딩 프레임(open reading frame)을 지닌 SEQ ID NO: 1에 따른 서열, 또는 상기 언급된 서열과 50% 이상의 동일성을 지니거나, 유전 암호로 인해 상기 DNA 서열로 축퇴(degenerated)되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자, ii) 염기쌍 1 내지 염기쌍 1902의 오픈 리딩 프레임을 지닌 SEQ ID NO: 2에 따른 서열, 또는 상기 언급된 서열과 50% 이상의 동일성을 지니거나, 유전 암호로 인해 상기 DNA 서열로 축퇴되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자, iii) 염기쌍 321 내지 염기쌍 2387의 오픈 리딩 프레임을 지닌 SEQ ID NO: 24에 따른 서열, 또는 상기 언급된 서열과 50% 이상의 동일성을 지니거나, 유전 암호로 인해 상기 DNA 서열로 축퇴되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자, iv) 염기쌍 1 내지 염기쌍 2052의 오픈 리딩 프레임을 지닌 SEQ ID NO: 25에 따른 서열, 또는 상기 언급된 서열과 50% 이상의 동일성을 지니거나, 유전 암호로 인해 상기 서열로 축퇴되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자, v) 게놈 서열을 지닌 녹아웃 작제물의 생성을 가능하게 하는, SEQ ID NO: 1에 상응하는 인트론 서열과 엑손 서열을 포함하는 염기쌍 1 내지 염기쌍 6187의 게놈 DNA 구조를 나타내는 SEQ ID NO: 3에 따른 서열을 포함하는 DNA 분자, vi) 게놈 서열을 지닌 녹아웃 작제물의 생성을 가능하게 하는, SEQ ID NO: 2에 상응하는 인트론 서열과 엑손 서열을 포함하는 염기쌍 1 내지 염기쌍 4087의 게놈 DNA 구조를 나타내는 SEQ ID NO: 4에 따른 서열을 포함하는 DNA 분자를 제공한다.
글리코실트랜스퍼라아제의 패밀리가 고도로 분산성(divergent)이고 (도 1), 단지 보존된 영역 (도 1에서 진하게 표시된 부분)이 고도로 유사하기 때문에, 또한 본 발명은 SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 24 또는 SEQ ID NO: 25 중 어느 하나에 따른 서열과 20% 이상의 전체 동일성을 지니고 SEQ ID NO: 19 또는 SEQ ID NO: 20의 단백질의 아미노산 387-392 (DLFIGI 또는 ELFVGI), 402-409 (RMAVRKTW), 425-428 (FVAL), 455-465 (DRYDIVVLKTV), 479-489 (YIMKCDDDTFV 또는 HVMKCDDDTFV), 536-548 (YPIYANGPGYILS 또는 YPTYANGPGYILS) 및 570-576 (EDVSVGI)을 엔코딩하는 SEQ ID NO: 1 또는 SEQ ID NO: 2의 7개의 보존된 도메인의 서열과 80% 이상의 동일성을 지닌 서열을 포함하거나 유전 암호로 인해 상기 서열로 축퇴되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자를 제공한다. 또한, SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 24 또는 SEQ ID NO: 25 중 어느 하나에 따른 서열과 20% 이상의 전체 동일성을 지니고 SEQ ID NO: 19 또는 SEQ ID NO: 20의 단백질의 아미노산 388 (L), 402 (R), 404 (A), 406 (R), 408 (T), 409 (W), 425 (F), 455 (D), 457 (Y), 463 (K), 464 (T), 481 (M), 482 (K), 484 (D), 486 (D), 488 (F), 489 (V), 536 (Y), 537 (P), 542 (G), 544 (G), 545 (Y), 548 (S), 570 (E), 571 (D), 572 (V), 575 (G) 및 576 (I)로부터 선택된 SEQ ID NO: 1 또는 SEQ ID NO: 2의 7개의 보존된 도메인의 보존된 아미노산의 95% 이상, 바람직하게는 전부를 엔코딩하는 서열을 포함하거나 유전 암호로 인해 상기 서열로 축퇴되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자가 제공된다. 바람직하게는, 전체 서열 동일성은 25% 이상, 30% 이상, 35% 이상, 40% 이상 또는 45% 이상이다. 추가의 바람직한 구체예에서, 보존된 도메인에 대한 서열 동일성은 90% 이상, 95% 이상 또는 100% 이다.
SEQ ID NO: 1을 지닌 서열의 오픈 리딩 프레임은 634개의 아미노산을 지닌 단백질을 코딩한다 (도 2, SEQ ID NO: 19). SEQ ID NO: 1에 의해 엔코딩되는 단백질은 Leu20과 Leu39 사이의 영역에 트랜스멤브레인(transmembrane) 도메인을 함유하고, 헤넷(Hennet)의 문헌 (2002 Cell. Mol. Life Sci. 59, 1081-1095, Fig. 2)에 기재된 7개의 보존된 도메인 (인간 β1,3-갈락토실트랜스퍼라아제에 존재함) 뿐만 아니라 아마도(Amado) 등의 문헌 (1998 J. Biol. Chem. 21, 12770-12778, Fig. 2)에 기재된 C-말단에 위치하는 보존된 아미노산의 대부분을 포함한다.
SEQ ID NO: 2를 지닌 서열의 오픈 리딩 프레임은 633개의 아미노산을 지닌 단백질을 코딩한다 (도 3, SEQ ID NO: 20). SEQ ID NO: 2에 의해 엔코딩되는 단백질은 Leu20과 Leu39 사이의 영역에 트랜스멤브레인 도메인을 함유하고, 헤넷의 문헌 (2002 Cell. Mol. Life Sci. 59, 1081-1095, 도 2)에 기재된 7개의 보존된 도메인 (인간 β1,3-갈락토실트랜스퍼라아제에 존재함) 뿐만 아니라 아마도 등의 문헌 (1998 J. Biol. Chem. 21, 12770-12778, 도 2)에 기재된 C-말단에 위치하는 보존된 아미노산의 대부분을 포함한다.
SEQ ID NO: 24를 지닌 서열의 오픈 리딩 프레임은 688개의 아미노산을 지닌 단백질을 코딩하는데 (도 4; SEQ ID NO: 26), 이러한 단백질은 SEQ ID NO: 1의 단백질의 선택적 스플라이스 변이체(alternative splice variant)이다.
SEQ ID NO: 25를 지닌 서열의 오픈 리딩 프레임은 683개의 아미노산을 지닌 단백질을 코딩하는데 (도 5; SEQ ID NO: 27), 이러한 단백질은 SEQ ID NO: 2의 단백질의 선택적 스플라이스 변이체이다.
또한, 본 발명은 물론 SEQ ID NO: 3 또는 4로 표현되는 이러한 유전자의 게놈 서열에 관한 것인데, 이는 본 발명에 따른 모든 다른 DNA 분자 또는 단백질이 (명확히 다르게 기재되지 않은 경우) 단리된 형태로 존재하기 때문이다.
식물 β1,3-갈락토실트랜스퍼라아제의 활성은 다양한 방법에 의해 분석될 수 있다.
아마도 등의 문헌 (1998 J. Biol. Chem. 21, 12770-12778)에 따르면, β1,3-갈락토실트랜스퍼라아제의 가용성 분비 형태 (트랜스멤브레인 도메인이 결여됨)를 엔코딩하는 작제물은 발현 벡터, 예를 들어 바큘로 바이러스의 트랜스펙션에 적합한 발현 벡터내로 클로닝되고, Sf9 세포에서 증폭되며, 수득된 발현 생성물은 정제된 후 β1,3-갈락토실트랜스퍼라아제 활성에 대해 검정될 수 있다.
비활성(specific activity)의 분석에 기인한 또 다른 방법은 본 발명에 따른 β1,3-갈락토실트랜스퍼라아제의 전체 오픈 리딩 프레임을 엔코딩하도록 설계된 발현 작제물을 제조하고, 본 발명에 따른 β1,3-갈락토실트랜스퍼라아제 유전자 중 하나 이상에 대해 유전자이식된(transgenic) 피스코미트렐라 스트레인(strain)을 생성시킴으로써 적합한 숙주, 예를 들어 피스코미트렐라 파텐스에서 β1,3-갈락토실트랜스퍼라아제를 과발현시키는 것일 수 있다. 생성된 유전자이식된 스트레인은 개선된 함량의 갈락토실화된 N-글리칸을 나타낸다. 피스코미트렐라로부터의 N-글리칸 패턴은 코프리보바(Koprivova) 등의 문헌 (2003 Plant Biol. 5, 582-591) 및 코프리보바 등의 문헌 (2004 Plant Biotechnol. J. 2, 517-523)에 기재된 바와 같이 단리되고 분석될 수 있다.
본 발명에 따른 β1,3-갈락토실트랜스퍼라아제 활성은 적합한 숙주, 예를 들어 피스코미트렐라 파텐스에서 담당 유전자의 표적화된 붕괴에 의해 간접적으로 검정될 수 있는데, 상기 붕괴는 갈락토오스를 UDP-갈락토오스로부터 N-글리칸상의 비환원 말단 GlcNAc 잔기로 전달하는 것과 관련된 β1,3-갈락토실트랜스퍼라아제 활성의 억제를 초래하여 말단 갈락토실화를 제거한다. 재차 언급하지만, 피스코미트렐라로부터의 N-글리칸 패턴은 코프리보바 등의 문헌 (2003 Plant Biol. 5, 582-591) 및 코프리보바 등의 문헌 (2004 Plant Biotechnol. J. 2, 517-523)에 기재된 바와 같이 단리되고 분석될 수 있다. 바람직하게는, 본 발명에 따른 β1,3-갈락토실트랜스퍼라아제는 GlcNAc-β1,3-갈락토실트랜스퍼라아제이다.
또한, β1,3-갈락토실트랜스퍼라아제 활성의 감소는 이러한 종류의 목적을 위해 통상적으로 사용되는 방법, 예를 들어 널리 공지된 안티센스 전략, 센스 전략, 리보자임 기술, PNA 기술 또는 RNA 간섭 전략에 의해 달성될 수 있다.
본 발명에 따르면, 숙주 세포, 조직 또는 생물체는 기능성 β1,3-갈락토실트랜스퍼라아제를 코딩하는 SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 24 또는 SEQ ID NO: 25의 서열을 적어도 포함하는 누클레오티드 서열로 트랜스펙션된다. 본 발명의 바람직한 구체예에서, 코딩 서열은 프로모터 및 종결 서열과 같은 조절 서열에 결합되어, β1,3-갈락토실트랜스퍼라아제 활성을 나타내는 발현 생성물을 초래하는 β1,3-갈락토실트랜스퍼라아제 유전자의 발현을 가능하게 한다. 숙주 세포 조직 또는 생물체와 관련하여, β1,3-갈락토실트랜스퍼라아제 코딩 서열에 작동적으로 결합된 조절 서열은 이종(heterologous)일 수 있다. 또 다른 구체예에서, β1,3-갈락토실트랜스퍼라아제 코딩 서열에 작동적으로 결합된 조절 서열은 사용되는 숙주로 인해 상동(homologous)일 수 있다. β1,3-갈락토실트랜스퍼라아제 코딩 서열에 작동적으로 결합된 조절 서열은 트랜스펙션을 위해 사용되는 벡터에 의해 제공될 수 있거나, β1,3-갈락토실트랜스퍼라아제 코딩 서열을 표적화된 통합, 예를 들어 상동 재조합에 의해 적절한 유전자좌내로 도입시켜서 β1,3-갈락토실트랜스퍼라아제 코딩 서열과 숙주 세포, 조직 또는 생물체의 내인성 조절 서열과 작동적으로 기능하는 어셈블리를 초래함으로써 생체내에서 달성될 수 있다.
본 발명의 바람직한 구체예에서, 발현 생성물 또는 이의 일부, 예를 들어 β1,3-갈락토실트랜스퍼라아제를 구성하는 트랜스멤브레인 도메인이 결여된 가용성 형태가 시험관내 또는 생체내에서 당지질 또는 당단백질상의 N-글리칸의 신장을 위해 사용될 수 있다. 또 다른 구체예에서, 말단 1,3 결합 갈락토오스 잔기를 포함하는 생성된 N-글리칸은 푸코오스, 갈락토오스 또는 시알산 잔기와 같은 추가의 당 잔기를 사용하여 시험관내 또는 생체내에서 더욱 신장될 수 있다. 따라서, 본 발명은 갈락토오스, 추가의 푸코오스, 시알산 또는 이들의 조합물과 같은 말단 당 잔기를 함유하는 복합체형 N-글리칸을 포함하는 N-글리칸 당 구조를 지닌 신규한 당단백질에 관한 것이다. 더욱 바람직한 구체예에서, 이러한 당단백질은 세포의 외부 환경에 복합체형 N-글리칸을 제시하여, 예를 들어 단백질/단백질 접촉 (예를 들어, 항체, 다른 세포 등과의 접촉)을 가능하게 하는 표면 단백질 또는 분비 단백질, 예를 들어 항체 또는 에리트로포이에틴이다. 본 발명에 따라 생성된 이러한 당단백질은 시험관내 및 생체내 둘 모두에서 특히 인간의 백신접종을 위해 매우 적합하다.
본 발명의 또 다른 구체예에서, 이종 단백질을 후기 골지 시스터나에 표적화하기 위한 트랜스멤브레인 도메인을 엔코딩하는 SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 24 또는 SEQ ID NO: 25에 따른 누클레오티드 서열이 제공된다. 바람직한 구체예에서, N-글리칸의 신장에 대한 활성을 나타내는 βl,4-갈락토실트랜스퍼라아제 또는 시알릴트랜스퍼라아제는 고유 트랜스멤브레인 도메인을 본 발명에 따른 β1,3-갈락토실트랜스퍼라아제의 트랜스멤브레인 도메인으로 교환시킴으로써 후기 골지 시스터나에 표적화된다.
본 발명에 따르면, 하나 이상의 기능이상(dysfunctional) β1,3-갈락토실트랜스퍼라아제 누클레오티드 서열을 포함하는 형질전환된 숙주 세포가 제공된다.
본 발명의 바람직한 구체예에서, 숙주 세포는 식물, 예를 들어 렘나(Lemna) 종, 울피아(Wolffia) 종, 벼, 당근, 콘(corn), 메이즈(maize) 및 담배 종으로부터 선택된다. 본 발명의 더욱 바람직한 구체예에서, 숙주 세포는 피스코미트렐라, 푸나리아(Funaria), 스파그넘(Sphagnum), 세라토돈(Ceratodon), 마르찬티아(Marchantia) 및 스패로카르포스(Sphaerocarpos) 속으로부터의 종의 이끼(moss) 및 우산이끼(liverwort)를 포함하는 선태류로부터 선택된다. 선태류 세포는 바람직하게는 피스코미트렐라 파텐스로부터 유래된다.
본 발명에 따른 바람직한 숙주는 선태류, 특히 반수체 무관속 육상식물인 피스코미트렐라 파텐스이며, 이는 글리코-엔지니어링된 재조합 단백질을 생성하기 위해 사용될 수 있다 (WO 01/25456). 피스코미트렐라 파텐스에서 뿐만 아니라 다른 식물에서도 루이스 a 유형 구조가 검출되었다 (Koprivova et al. 2003 Plant Biol. 5, 582-591; Koprivova et al. 2004 Plant Biotechnol. J. 2, 517-523). N-글리칸 구조의 신장에서 비활성(specific activity)을 나타내는 β1,3-갈락토실트랜스퍼라아제가 식물로부터 확인되지 않았지만, 피스코미트렐라가 이러한 미지의 종류의 글리코실트랜스퍼라아제에 대한 추정 공급원으로서 선택되었다.
이끼의 생활주기는 광독립영양적 배우자형 세대가 우세하다. 상기 생활주기는 포자체가 우세한 세대인 고등 식물의 생활주기와 완전히 상이하며, 고등 식물과 선태류 간에는 주목할 만하게 많은 차이점이 관찰될 수 있다.
이끼를 포함하는 선태류의 배우체는 2개의 독특한 발달 단계에 의해 특징화된다. 정단 성장(apical growth)을 통해 발달하는 원사체는 단지 2개의 세포 유형 (클로로네말(chloronemal) 및 카울로네말(caulonemal) 세포)의 섬유상 그물구조(filamentous network)로 성장한다. 배우자낭병(gametophore)으로 일컬어지는 두 번째 단계는 단순한 정단 시스템과 카울리나리(caulinary) 성장에 의해 구별된다. 두 단계 모두는 광독립영양적으로 활성이다. 더욱 복잡한 배우자낭병으로의 분화 없이 원사체를 배양하는 것은 플라스크에서의 현탁 배양에 대해서 뿐만 아니라 생물반응기 배양에 대해서도 입증되었다 (WO 01/25456). 수 개의 세포 유형만을 함유하는 완전 분화되고 광독립영양적으로 활성인 다세포 조직을 배양하는 것은 고등 식물에 대해 공지되어 있지 않다. 이끼 세포 시스템의 유전적 안정성은 식물 세포 배양에 비해 중요한 이점을 제공한다.
생화학적 수준에서 선태류 (무관속 식물)과 고등 식물 (유관속 식물) 사이에 몇 가지 중요한 차이점이 존재한다. 피스코미트렐라 파텐스에서의 설페이트 동화는 고등 식물에서의 설페이트 동화와 현저히 차이가 있다. 고등 식물에서 설페이트 동화의 핵심 효소는 아데노신 5'-포스포설페이트 환원효소이다. 피스코미트렐라 파텐스의 경우, 포스포아데노신 5'-포스포설페이트 환원효소를 통한 또 다른 경로가 공존한다 (Koprivova et al. (2002) J. Biol. Chem. 277,32195-32201). 이러한 경로는 고등 식물에서 특징화된 바 없다.
또한, 선태류, 조류 및 양치류 과(family)의 다수의 일원은 광범위한 다중불포화 지방산을 생성한다 (Dembitsky (1993) Prog. Lipid Res. 32, 281-356). 예를 들어, 아라키돈산 및 에이코사펜타에노산은 고등 식물이 아닌 하등 식물에 의해서만 생성되는 것으로 생각된다. 다중불포화 지방산의 대사와 관련된 일부 효소 (델타 6-아실기 불포화화효소(desaturase) (Girke et al. (1998), Plant J, 15, 39-48) 및 델타 6 신장효소(elongase)의 성분 (Zank et al. (2002) Plant J 31, 255-268)이 피스코미트렐라 파텐스로부터 클로닝되었다. 상응하는 유전자는 고등 식물에서 발견되지 않았다. 이러한 사실은 생화학적 수준에서 고등 식물과 하등 식물 간에 본질적인 차이점이 존재한다는 것을 확인해주는 것으로 여겨진다.
더욱이, 선태류는 식물 특유의 특징인 이의 핵 DNA에서 매우 효율적인 상동 재조합을 나타내며, 이는 추가로 고등 식물과의 근본적인 차이를 예증하는 지정 유전자 붕괴(directed gene disruption)를 가능하게 한다 (Girke et al. (1998) Plant J, 15, 39-48; Strepp et al. (1998) Proc Natl Acad Sci USA 95,4368-4373; Koprivova (2002) J. Biol. Chem.277, 32195-32201; reviewed by Reski (1999) Planta 208, 301-309; Schaefer and Zryd (2001) Plant Phgs 127, 1430-1438; Schaefer (2002) Annu. Rev. Plant Biol.53, 477-501; Koprivova et al. 2004 Plant Biotechnol. J. 2, 517-523; Brucker et al. 2005 Planta 220, 864-874). 그러나, 일부 경우, 당화 패턴을 변화시키기 위해 이러한 메커니즘을 사용하는 것은 본 명세서의 실시예에서 제시된 바와 같이 문제가 있는 것으로 판명되었다. 피스코미트렐라 파텐스에서 N-아세틸글루코사미닐트랜스퍼라아제 I (GNT1)가 붕괴되면 특정 전사체의 손실을 초래하지만 N-당화 패턴에서는 미미한 차이만을 초래한다. 이러한 결과는 폰 스캐벤(von Schaewen) 등의 문헌 [(1993) Plant Physiol 102, 1109-1118]에 의해 관찰된 GNT1이 결여된 돌연변이 아라비돕시스 탈리아나 식물에서의 골지 변형된 복합체 글리칸의 손실과 직접적인 대조를 이루었다. 따라서, 피스코미트렐라 파텐스에서의 녹아웃은 N-당화 패턴의 예상된 변형을 초래하지 않았다.
녹아웃 전략은 글리코실트랜스퍼라아제 GNT1에 대해 성공적이지 않았지만, βl,2-크실로실트랜스퍼라아제 및 α1,3-갈락토실트랜스퍼라아제를 코딩하는 유전자의 붕괴와 관련하여, 녹아웃이 피스코미트렐라 파텐스에서 성공적으로 수행되었다.
또한, 2중 녹아웃 피스코미트렐라 파텐스 식물의 게놈내로의 인간 βl,4-갈락토실트랜스퍼라아제의 통합은 식물 특이적 푸코실 및 크실로실 잔기를 지니지 않고 포유동물 유사 말단 1,4 갈락토실 잔기를 지니는 포유동물 유사 N-결합 당화 패턴을 초래하였다. 갈락토실트랜스퍼라아제는 활성인 것으로 밝혀졌다.
선태류 세포, 예를 들어 피스코미트렐라 파텐스 세포는 본 명세서에 기재된 본 발명의 방법에 따른 형질전환에 적합한 임의의 세포일 수 있고, 이끼 원형질체 세포, 원사체 조직에서 발견되는 세포 또는 다른 세포 유형일 수 있다. 실제로, 당업자는 본 발명에 따른 형질전환된 선태류 세포의 집단을 포함하는 이끼 식물 조직, 예를 들어 형질전환된 원사체 조직이 또한 본 발명의 일면을 형성한다는 것을 인식할 것이다.
본 명세서에 사용된 "기능이상(dysfunctional)"은 β1,3-갈락토실트랜스퍼라아제 (β1,3-GalT)의 지명된 트랜스퍼라아제 누클레오티드 서열이 1,3 결합 말단 갈락토오스 잔기를 지닌 식물 N-결합 글리칸을 변형시킬 수 있는 기능성 β1,3-GalT 단백질을 코딩하는 mRNA를 실질적으로 엔코딩할 수 없다는 것을 의미한다. 바람직하게는, 기능이상 β1,3-GalT 식물 트랜스퍼라아제 누클레오티드 서열은 기능성 β1,3-GalT 활성을 코딩하는 mRNA의 전사를 실질적으로 억제하거나 제지하는 핵 선태류 게놈 (이것이 진정한 천연 선태류 게놈, 즉, 인위적으로 다른 핵산 서열에 의해 형질전환된 적이 없는 선태류 세포에 존재하는 게놈이든지 또는 핵산 서열 삽입이 사전에 요망되는 핵산 서열에 의해 이루어진 형질전환된 핵 선태류 게놈이든지 간에)에 포함된 내인성, 즉, 천연 게놈 β1,3-GalT 유전자내로의 외인성 누클레오티드 서열의 표적화된 삽입을 포함한다.
본 발명의 추가의 일면은 20개 이상의 염기쌍을 지닌 길이가 다양한 상기 기재된 DNA 분자 또는 이의 일부 중 하나를 포함하는 생물학적 기능성 벡터(biologically functional vector)에 관한 것이다. 숙주 세포내로의 트랜스펙션을 위해, 증폭할 수 있는 독립적 벡터가 필요한데, 여기서 숙주 세포, 트랜스펙션 메커니즘, 작업 및 DNA 분자의 크기에 따라 적절한 벡터가 사용될 수 있다. 다수의 다양한 벡터가 공지되어 있기 때문에, 그러한 벡터들을 열거하는 것은 본원의 범위 밖의 것이므로 본 명세서에서는 열거하지 않았는데, 이는 특히 그러한 벡터가 당업자에게 매우 잘 알려져 있기 때문이다 (그러한 벡터 뿐만 아니라 당업자에게 알려져 있는 본 명세서에서 사용된 모든 기술 및 용어에 관해서는 샘브룩 마니아티스(Sambrook Maniatis)가 또한 참조됨). 이상적으로는, 벡터는 작은 분자량을 지니고, 세포에서 용이하게 인식될 수 있는 표현형을 초래함으로써 벡터 함유 및 벡터 비함유 숙주 세포의 용이한 선별이 가능해 지도록 선별 유전자(selectable genes)를 포함해야 한다. 고수율의 DNA 및 상응하는 유전자 생성물을 수득하기 위해, 벡터는 강력한 프로모터 뿐만 아니라 인핸서, 유전자 증폭 신호 및 조절 서열을 포함해야 한다. 또한, 벡터의 자율 복제를 위해, 복제 기점이 중요하다. 폴리아데닐화 부위는 RNA 전사체를 위한 mRNA와 스플라이스 신호의 정확한 프로세싱을 담당한다. 파아지, 바이러스 또는 바이러스 입자가 벡터로서 사용되는 경우, 패키징 신호는 벡터 DNA의 팩키징을 제어할 것이다. 예를 들어, 식물에서의 전사를 위해서는 Ti 플라스미드가 적합하고, 곤충 세포에서의 전사를 위해서는 바큘로바이러스가 적합하고, 곤충의 경우 P 엘리먼트와 같은 트랜스포손이 적합하다.
상기 기재된 본 발명의 벡터가 식물 또는 식물 세포내로 삽입된 경우, 내인성 β1,3갈락토실트랜스퍼라아제 유전자의 유전자 발현의 전사후 억제는 센스 배향인 상기 유전자에 상동인 이식유전자(transgene) 또는 이의 일부의 전사에 의해 수득된다. 또한, 이러한 센스 기술의 경우, 문헌 [Baucombe 1996, Plant. Mol. Biol., 9:373-382] 및 문헌 [Brigneti et al., 1998, EMBO J. 17:6739-6746]이 참조된다. 이러한 "유전자 침묵(gene silencing)" 전략은 β1,3갈락토실트랜스퍼라아제 유전자의 발현을 억제하는 효과적인 방법이며, 이에 관해 문헌 [Waterhouse et al., 1998, Proc. Natl. Acad. Sci . USA, 95:13959-13964]이 참조된다.
또한, 본 발명은 프로모터에 대해 역배향으로 존재하는 상기 기재된 구체예들 중 하나에 따른 DNA 분자 또는 길이가 상이한 이의 일부를 포함하는 생물학적 기능성 벡터에 관한 것이다. 이러한 벡터가 숙주 세포에서 트랜스펙션된 경우, β1,3갈락토실트랜스퍼라아제의 mRNA에 상보적이고 이와 복합체를 형성하는 "안티센스 mRNA"가 해독(read)될 것이다. 이러한 결합은 정확한 프로세싱, 수송, 안정성을 방해하거나, 리보솜 어닐링(annealing)을 억제함으로써 번역을 방해하고 이에 따라 β1,3갈락토실트랜스퍼라아제의 정상적인 유전자 발현을 방해할 것이다.
DNA 분자의 전체 서열이 벡터내로 삽입될 수 있지만, 이의 부분 서열이 보다 작은 크기로 인해 특정 목적을 위해 유리할 수 있다. 안티센스 일면과 관련하여, 예를 들어, DNA 분자가 트랜스퍼라아제 mRNA에 결합하는 충분히 큰 안티센스 mRNA를 형성할 정도로 충분히 크다는 것이 중요하다. 적절한 안티센스 RNA 분자는 예를 들어 50개 내지 200개의 누클레오티드를 포함하는데, 이는 다수의 공지된 천연 안티센스 RNA 분자가 약 100개의 누클레오티드를 포함하기 때문이다.
활성 β1,3갈락토실트랜스퍼라아제의 발현의 특히 효과적인 억제를 위해, 센스 기술과 안티센스 기술을 병용하는 것이 적합하다 (Waterhouse et al., 1998, Proc. Natl. Acad. Sci., USA, 95:13959-13964).
유리하게는, 신속히 하이브리드화하는 RNA 분자가 사용된다. 50개 이하의 누클레오티드의 크기를 지닌 안티센스 RNA 분자의 효율은 시험관내에서 어닐링 반응속도론(annealing kinetics)에 좌우될 것이다. 따라서, 예를 들어 신속히 어닐링하는 안티센스 RNA 분자는 서서히 하이브리드화하는 RNA 분자 보다 높은 단백질 발현 억제를 나타낸다 (Wagner et al., 1994, Annu. Rev. Microbiol., 48:713-742; Rittner et al., 1993, Nucl . Acids Res., 21:1381-1387). 이러한 신속히 하이브리드화하는 안티센스 RNA 분자는 특히 다수의 외부 염기 (유리 말단 및 연결 서열), 다수의 구조 서브도메인(subdomain) (성분(component)) 뿐만 아니라 저수준의 루프(loop)를 포함한다 (Patzel et al. 1998; Nature Biotechnology, 16; 64-68). 안티센스 RNA 분자의 가상 2차 구조는 예를 들어 적절한 안티센스 RNA DNA 서열이 선택되는 지에 따라 컴퓨터 프로그램의 도움을 받아 결정될 수 있다.
DNA 분자의 다양한 서열 영역이 벡터내로 삽입될 수 있다. 한 가지 가능성은 예를 들어 리보솜 어닐링을 담당하는 부분만을 벡터내로 삽입시키는 것이다. mRNA의 이러한 영역에서의 차단은 전체 번역을 정지시키기에 충분할 것이다. 또한, 안티센스 분자의 특히 높은 효율성은 유전자의 5'- 및 3'-비번역(non-translated) 영역을 초래한다.
바람직하게는, 본 발명에 따른 DNA 분자는 결실, 삽입 및/또는 치환 돌연변이를 포함하는 서열을 포함한다. 돌연변이 누클레오티드의 수는 가변적이고, 하나의 누클레오티드에서 수 개의 결실되거나, 삽입되거나 치환된 누클레오티드까지 다양하다. 리딩 프레임이 돌연변이에 의해 시프트(shift)되는 것이 또한 가능하다. 이러한 "녹-아웃 유전자"의 경우, 단지 β1,3갈락토실트랜스퍼라아제의 발현이 저해되고 활성인 기능성 효소의 형성이 억제된다는 것이 중요하다. 이렇게 함에 있어서, 효소적 활성 단백질의 발현이 억제되는 한은 돌연변이 부위는 가변적이다. C-말단 영역에 위치한 효소의 촉매 영역에서의 돌연변이가 바람직하다. DNA 서열에 돌연변이부를 삽입시키는 방법이 당업자에게 널리 알려져 있으므로, 다양한 돌연변이유발 가능성을 본 명세서에서 상세히 논의할 필요는 없다. 이와 관련하여 동시적(coincidental) 돌연변이유발 뿐만 아니라 특히 지정 돌연변이유발, 예를 들어 부위 지정 돌연변이유발, 올리고누클레오티드 제어된 돌연변이유발 또는 제한 효소 보조된 돌연변이유발이 이용될 수 있다.
또한, 리보자임 또는 siRNA 기술이 야생형 β1,3-GalT 활성을 지닌 세포에서 β1,3-GaltT 활성을 감소시키거나 제거하기 위해 적용될 수 있다. siRNA 기술을 본 발명에 적합시키는 것은 기존의 당 분야의 기술 수준에 기초해 볼 때 간단하다 (예: Nat. Reviews: RNA interference collection (October 2005)).
또한, 본 발명은 각각의 서열 부분이 10개 내지 15개 이상의 염기쌍 길이를 지니는 두 개의 서열 부분(portion)을 포함하는 리보자임을 코딩하는 DNA 분자로서, 상기 두 개의 서열 부분은 상기 리보자임이 천연 β1,3갈락토실트랜스퍼라아제 DNA 분자로부터 전사되는 mRNA와 복합체를 형성하여 이를 절단하도록 상기 기재된 본 발명의 DNA 분자의 서열 부분과 상보적인 DNA 분자를 제공한다. 리보자임은 mRNA와의 상보적인 염기쌍형성에 의해 β1,3갈락토실트랜스퍼라아제의 mRNA를 인식할 것이다. 후속하여, 리보자임은 효소가 번역되기 전에 서열 특이적 방식으로 RNA를 절단하고 이를 파과할 것이다. 절단된 기질로부터 해리된 후, 리보자임은 RNA 분자와 반복적으로 하이브리드화하고 특이적 엔도누클레아제로서 작용할 것이다. 일반적으로, 리보자임은 단백질을 코딩하는 전체 DNA 서열이 알려져 있지 않다고 하더라도 특정 mRNA의 비활성화를 위해 특이적으로 생성될 수 있다. 리보자임은 리보솜이 mRNA를 따라 서서히 이동하는 경우 특히 효율적이다. 이러한 경우, 리보자임이 mRNA상에서 리보솜이 없는 부위를 찾아내는 것이 보다 용이해진다. 이러한 이유로, 느린 리보솜 돌연변이체가 리보자임을 위한 시스템으로서 또한 적합하다 (J. Burke, 1997, Nature Biotechnology; 15, 414-415). 이러한 DNA 분자는 식물 β1,3갈락토실트랜스퍼라아제의 발현의 하향조절 및 억제 각각을 위해 특히 유리하다.
또한, 한 가지 가능한 방법은 리보자임의 변화된 형태, 즉, 미니자임(minizyme)을 사용하는 것이다. 미니자임은 보다 큰 mRNA 분자를 절단하기 위해 특히 효율적이다. 미니자임은 스템/루프(stem/loop) II 대신 짧은 올리고누클레오티드 링커를 지닌 해머 헤드(hammer head) 리보자임이다. 이량체-미니자임이 특히 효율적이다 (Kuwabara et al., 1998, Nature Biotechnology, 16; 961-965).
결과적으로, 본 발명은 상기 언급된 마지막 2가지 DNA 분자 (돌연변이 또는 리보자임-DNA 분자) 중 하나를 포함하는 생물학적 기능성 벡터에 관한 것이다. 이와 관련하여 벡터에 관해 상기 언급된 것이 또한 적용된다. 이러한 벡터는 예를 들어 미생물내로 삽입될 수 있고, 상기 기재된 DNA 분자를 고농도로 생성시키기 위해 사용될 수 있다. 또한, 이러한 벡터는 식물체에서 β1,3갈락토실트랜스퍼라아제 생성을 하향조절하거나 완전히 억제시키기 위해 특정 DNA 분자를 상기 식물체내로 삽입시키는 데에 특히 우수하다. 상기 기재된 모든 벡터는 β1,3-GalT 유전자의 게놈 서열, 예를 들어 SEQ ID NO: 3 또는 4를 사용하여 생성될 수 있다.
본 발명의 선태류 세포 또는 이의 선조(ancestor)는 본 명세서에 기재된 바와 같이 포유동물 당화 패턴을 나타내며 당화되는 관심있는 단백질의 1차 서열을 코딩하는 관심있는 이종 유전자로 사전에 형질전환된 임의의 것일 수 있다. 바람직하게는, 당화 패턴은 인간 유형이다. 또한, 선태류 세포는 개별적으로 형질전환될 수 있는데, 즉, 적어도 관심있는 1차 단백질 서열, 전형적으로 본 명세서에 기재된 바와 같은 본 발명의 방법에 따라 포유동물 당화 패턴이 배치될 것을 필요로 하는 인간 또는 포유동물, 예를 들어 소, 양, 말 및 돼지 종을 포함하는 가축 종에 사용되는 관심있는 약제용 단백질을 적어도 코딩하는 누클레오티드 서열로 동시에 또는 시간 간격을 두고 형질전환될 수 있다. 인간을 포함하는 포유동물에 사용되는 이러한 약제용 당단백질은 비제한적으로 VEGF, 인터페론, 예를 들어 α-인터페론, β-인터페론, 감마-인터페론, 인자 VII, VIII, IX, X, XI 및 XII로부터 선택된 혈액-응고 인자, 황체형성 호르몬, 난포 자극 호르몬을 포함하는 생식 호르몬, 표피 성장 인자, 혈소판-유래 성장 인자를 포함하는 성장 인자, 과립구 집락 자극 인자 등, 프로락틴, 옥시토신, 갑상선 자극 호르몬, 부신피질자극 호르몬, 칼시토닌, 부갑상선 호르몬, 소마토스타틴(somatostatin), 에리트로포이에틴(EPO), 효소, 예를 들어 β-글루코세레브로시다아제, 헤모글로빈, 콜라겐, 융합 단백질, 예를 들어 TNF α수용체 리간드 결합 도메인과 IgG의 Fc 부분의 융합 단백질 등과 같은 단백질을 포함한다. 또한, 본 발명의 방법은 면역글로불린, 예를 들어 특정한 모노클로날 항체와 같은 항체 또는 이의 활성 단편을 생성시키기 위해 이용될 수 있다.
생물반응기에서 본 발명에 사용하기에 적합한 이끼, 예를 들어 렙토브리움 피리포르메(Leptobryum pyriforme) 및 스파그넘 마젤라니쿰(Sphagnum magellanicum)을 배양하는 것에 관한 상세한 정보는 종래 기술 분야에 공지되어 있다 (참조: E. Wilbert, "Biotechnological studies concerning the mass culture of mosses with particular consideration of the arachidonic acid metabolism", Ph.D. thesis, University of Mainz (1991); H. Rudolph and S. Rasmussen, Studies on secondary metabolism of Sphagnum cultivated in bioreactors, Crypt. Bot., 3, pp. 67-73 (1992)). 본 발명의 목적을 위해 특히 바람직한 것은 피스코미트렐라 파텐스를 사용하는 것인데, 이는 분자 생물학 기술이 이러한 생물체에 대해 실행되기 때문이다 (참조: R. Reski, Development, genetics and molecular biology of mosses, Bot. Acta, 111, pp. 1-15 (1998)).
이종 단백질의 생성을 위해 피스코미트렐라를 생물공학적으로 이용하기에 적합한 형질전환 시스템이 개발되었다. 예를 들어, 성공적인 형질전환은 입자 총(particle gun)을 사용하여 원사체 조직내로 직접 DNA를 전달함으로써 수행되었다. 이끼 원형질체내로의 PEG 매개된 DNA 전달이 또한 성공적으로 달성되었다. PEG 매개된 형질전환 방법은 피스코미트렐라 파텐스에 대해 수 차례 기술되었고, 이는 일시적 형질전환체 및 안정한 형질전환체 둘 모두를 초래한다 (참조: K. Reutter and R. Reski, Production of a heterologous protein in bioreactor cultures of fully differentiated moss plants, Pl. Tissue culture and Biotech., 2, pp. 142-147 (1996)).
본 발명의 또 다른 구체예에서, β-1,3-GalT 활성이 실질적으로 감소된 선태류 세포를 적어도 생성시키는 방법으로서, SEQ ID NO: 1에 따른 내인성 β1,3 엔코딩 누클레오티드 서열로 특이적으로 표적화되는 제 1 핵산 서열 및 ii) SEQ ID NO: 2에 따른 내인성 β1,3 엔코딩 누클레오티드 서열로 특이적으로 표적화되는 제 2 핵산 서열을 상기 세포내로 도입시키는 것을 포함하는 방법이 제공된다.
당업자는 상기 제 1 및 제 2 트랜스퍼라아제 핵산 서열을 선태류 세포내로 도입시키는 순서가 중요하지 않음을 인식할 것이며, 이는 임의의 순서로 수행될 수 있다. 제 1 및 제 2 핵산 서열은 예를 들어 본 명세서에 제공된 실시예에 따르면 특정 제한 효소 부위에 의해 규정되는 선태류 세포의 핵 게놈에 위치한 내인성 천연 β1,3-GalT 유전자의 특정 부분으로 표적화될 수 있다. 천연 β1,3-GalT 유전자의 서열을 관심있는 표적 천연 트랜스퍼라아제 유전자와 특이적으로 통합되는 누클레오티드 서열을 사용하여 특이적으로 표적화함으로써, 상기 서열의 발현이 완전히 붕괴되지는 않더라도 실질적으로 손상된다.
바람직하게는, 상기 언급된 모든 당화된 포유동물 단백질은 인간 유형이다. 본 발명에서 생성시키는 것이 고려되는 다른 단백질은 수의 간호(veterinary care)에 사용되는 단백질을 포함하고, 본 명세서에 언급된 인간 단백질의 동물 동족체(homologue)에 상응할 수 있다.
외인성 프로모터는 관심있는 핵산 서열의 전방에 도입되어 이와 작동적으로 결합되는 프로모터를 의미한다. 따라서, 외인성 프로모터는 본 명세서에서 규정된 바와 같이 선택된 핵산 성분 전방에 위치하며, 야생형의 경우에서 발견되는 관심있는 핵산 성분과 일반적으로 결합된 천연 또는 고유 프로모터로 구성되지 않은 것이다. 따라서, 프로모터는 관심있는 선태류 세포에 대해 고유한 것일 수 있지만 야생형 선태류 세포의 경우 전방에 있는 관심있는 핵산과 작동적으로 결합되지 않을 수 있다. 전형적으로, 외인성 프로모터는 숙주 세포 이외의 공급원으로부터 숙주 선태류 세포로 옮겨진 것이다.
개선된 β1,3-갈락토실화를 지닌 N-글리칸 구조를 생성하는 것과 관련하여, 본 명세서에 기재된 β-1,3-GalT 단백질, 당화된 단백질 및 포유동물 단백질을 엔코딩하는 cDNA는 선태류 세포에서 작동가능한 하나 이상의 프로모터 유형, 예를 들어 β1,3-GalT 핵산 서열 및/또는 본 명세서에서 규정되고 본 발명에 의해 제공되는 당화된 포유동물 단백질에 대한 제 2 핵산 서열에 작동적으로 결합되는 유도성 또는 항시성 프로모터를 함유한다. 논의된 바와 같이, 이는 유전자(들)의 발현의 제어를 가능하게 한다.
프로모터에 적용되는 "유도성"이란 용어는 당업자에 의해 잘 이해되는 용어이다. 본질적으로, 유도성 프로모터의 제어를 받는 발현은 적용된 자극 (이는 세포내에서 발생되거나 외부에서 제공될 수 있음)에 응답하여 "스위치 온(switched on)"되거나 증가된다. 자극의 특성은 프로모터별로 상이하다. 일부 유도성 프로모터는 적절한 자극이 없는 경우 발현을 거의 일으키지 않거나 검출불가능한 수준으로 일으킨다 (또는 발현을 전혀 일으키지 않음). 다른 유도성 프로모터는 자극이 없는 경우 검출가능한 항시성 발현을 일으킨다. 자극이 없는 경우에 발현의 수준이 어떻든지 간에, 임의의 유도성 프로모터로부터의 발현은 정확한 자극의 존재하에서 증가된다. 바람직한 상황은 발현의 수준이 관련 자극의 적용시에 표현형 특징을 변화시키기에 효과적인 양 만큼 증가하는 경우이다. 따라서, 유도성 (또는 "스위칭될 수 있는(switchable)" 프로모터가 사용될 수 있는데, 이는 자극이 없는 경우 기본적인 발현 수준을 야기하며 이러한 수준은 너무 낮아서 (실제로 0일 수 있음) 요망되는 표현형을 초래할 수 없다. 자극의 적용시에, 발현은 요망되는 표현형을 초래하는 수준으로 증가 (또는 스위치 온)된다.
본 명세서에 언급된 바와 같이, 선태류 발현 시스템은 또한 당업자에게 알려져 있다. 선태류 프로모터, 특히 피스코미트렐라 파텐스 프로모터는 숙주 DNA-의존성 RNA 폴리머라아제와 결합하여 mRNA로의 코딩 서열 (예를 들어, 구조 유전자)의 다운스트림 (3') 전사를 개시할 수 있는 임의의 DNA 서열이다. 프로모터는 일반적으로 코딩 서열의 5' 단부의 근위부에 위치한 전사 개시 영역을 지닐 것이다. 이러한 전사 개시 영역은 일반적으로 RNA 폴리머라아제 결합 부위 ("TATA Box") 및 전사 개시 부위를 포함한다. 선태류 프로모터는, 존재하는 경우 일반적으로 구조 유전자의 원위부에 위치한 업스트림 활성화제 서열 (upstream activator sequence, UAS)이라 일컬어지는 제 2 도메인을 또한 지닐 수 있다. UAS는 조절된 (유도성) 발현을 가능하게 한다. 항시성 발현은 UAS가 없는 경우 일어난다. 조절된 발현은 포지티브 또는 네거티브일 수 있으며, 따라서 전사를 향상시키거나 감소시킨다.
당업자는 선태류 대사 경로에서 효소를 엔코딩하는 선태류 프로모터 서열이 특히 유용한 프로모터 서열을 제공할 수 있다는 것을 인식할 것이다.
또한, 자연계에 존재하지 않는 합성 프로모터가 또한 선태류 프로모터로서 기능할 수 있다. 예를 들어, 하나의 선태류 프로모터의 UAS 서열이 또 다른 선태류 프로모터의 전사 활성화 영역과 결합하여 합성 하이브리드 프로모터를 생성시킬 수 있다. 적합한 프로모터의 예는 문헌 [Zeidler et al. (1996) Plant. Mol. Biol. 30, 199-205]에 기재된 피스코미트렐라 파텐스에 대한 TOP 10 발현 시스템에서 사용되는 것이다. 또한, 선태류 프로모터는 선태류 DNA-의존성 RNA 폴리머라아제와 결합하여 전사를 개시시키는 능력을 지닌 비-선태류 기원의 천연 프로모터를 포함할 수 있다. 이러한 프로모터의 예로는 공지된 것들, 특히 벼 P-액틴 1 프로모터 및 클라미도모나스 RbcS 프로모터가 있다 (Zeidler et al. (1999) J. Plant Physiol. 154, 641-650; Cohen et al., Proc. Natl. Acad. Sci. USA, 77: 1078, 1980; Henikoff et al., Nature, 283: 835, 1981; Hollenberg et al., Curr. Topics Microbiol. Immunol., 96: 119, 198 1; Hollenberg et al., "The Expression of Bacterial Antibiotic Resistance Genes in the Yeast Saccharomyces cerevisiae", in: Plasmids of Medical, Environmental and Commercial Importance (eds. K. N. Timms and A. Puhler), 1979; Mercerau-Puigalon et al., Gene, 1 1: 163, 1980; Panthier et al., Curr. Genet., 2: 109, 1980).
본 발명에 따른 DNA 분자는 선태류에서 세포내 발현될 수 있다. 프로모터 서열은 DNA 분자와 직접 결합될 수 있는데, 이 경우 재조합 단백질의 N-말단에 존재하는 첫 번째 아미노산은 항상 메티오닌이며, 이는 mRNA 상의 AUG 개시 코돈에 의해 엔코딩된다. 요망되는 경우, N-말단에 존재하는 메티오닌은 시아노겐 브로마이드와의 시험관내 인큐베이션에 의해 단백질로부터 절단될 수 있다.
또한, 선태류 세포 안팎으로의 외래 단백질의 분비를 제공하는 리더(leader) 서열 단편을 포함하는 융합 단백질을 엔코딩하는 키메라 DNA 분자를 생성시킴으로써 외래 단백질이 선태류 세포로부터 성장 배지내로 또한 분비될 수 있다. 바람직하게는, 생체내 또는 시험관내에서 절단될 수 있는, 리더 단편과 외래 유전자 사이에 엔코딩되는 프로세싱 부위가 존재한다. 리더 서열 단편은 세포로부터의 단백질의 분비를 유도하는 소수성 아미노산을 포함하는 신호 펩티드를 일반적으로 엔코딩한다.
적절한 신호 서열을 엔코딩하는 DNA는 분비되는 선태류 단백질에 대한 유전자로부터 유래될 수 있으며, 선태류 세포에서의 분비를 또한 제공할 수 있는 비-선태류 기원의 리더, 예를 들어 VEGF 리더가 존재한다.
선태류 세포에 의해 인식되고 이러한 세포에서 기능성인 전사 종결 서열은 번역 정지 코돈의 3'에 위치하는 조절 영역이며, 이로써 프로모터와 함께 코딩 서열을 플랭킹(flanking)한다. 이러한 서열은 DNA에 의해 엔코딩되는 폴리펩티드로 번역될 수 있는 mRNA의 전사를 유도한다. 피스코미트렐라 파텐스에서 기능을 발휘하는 적절한 종결 서열의 예는 콜리플라워 모자이크 바이러스의 종결 영역이다.
전형적으로, 프로모터, 리더 (요망되는 경우), 관심있는 코딩 서열 및 전사 종결 서열을 포함하는 성분들은 본 발명의 발현 작제물로 합체된다. 발현 작제물은 세균과 같은 숙주에서 안정하게 유지될 수 있는 염색체외 엘리먼트인 DNA 플라스미드에서 종종 유지된다. DNA 플라스미드는 2개의 복제 기점을 지녀서, 예를 들어 발현을 위해 선태류에서 유지되고 클로닝 및 증폭을 위해 원핵 숙주에서 유지될 수 있게 한다. 대체로, 플라스미드는 원핵 숙주 세포에서의 클로닝 및 증폭을 위한 하나의 복제 기점을 지니면 된다. 또한, DNA 플라스미드는 많거나 적은 카피(copy) 수의 플라스미드일 수 있다. 많은 카피 수의 플라미드는 일반적으로 약 5개 내지 약 200개, 통상적으로 약 10개 내지 약 150개의 카피 수를 지닐 것이다. 많은 카피 수의 플라스미드를 함유하는 숙주는 바람직하게는 10개 이상, 더욱 바람직하게는 약 20개 이상을 지닐 것이다. 숙주에 대한 벡터 및 외래 단백질의 효과에 따라 많거나 적은 카피 수의 벡터가 선택될 수 있다 (참조: Brake et al., supra).
또한, 발현 작제물은 통합 벡터(integrating vector)를 사용하여 선태류 게놈내로 통합될 수 있다. 통합 벡터는 일반적으로 벡터가 통합될 수 있게 하는 선태류 염색체에 상동인 하나 이상의 서열을 함유하고, 바람직하게는 발현 작제물을 플랭킹하는 2개의 상동 서열을 함유한다. 통합 벡터는 본 명세서에 기재되고 예시된 바와 같이 벡터에 포함되는 적절한 상동 서열을 선택함으로써 이끼에서 특정 유전자좌로 유도될 수 있다. 하나 이상의 발현 작제물이 통합될 수 있다. 벡터에 포함되는 염색체 서열은 벡터에서 하나의 세그먼트로서 존재하여 전체 벡터의 통합을 초래하거나, 염색체내의 인접 세그먼트에 상동이고 벡터에서 발현 작제물을 플랭킹하는 2개의 세그먼트로서 존재하여 발현 작제물만의 안정한 통합을 초래할 수 있다.
일반적으로, 염색체외 및 통합 발현 작제물은 형질전환된 선태류 세포의 선택을 가능하게 하는 선별 마커를 함유할 수 있다.
선별 마커는 이끼 숙주에서 발현될 수 있는 생합성 유전자, 예를 들어 각각 G418 및 히드로마이신 B에 대해 선태류 세포에서 내성을 부여하는 G418 또는 히드로마이신 B 내성 유전자를 포함할 수 있다. 추가로, 적절한 선별 마커는 금속과 같은 독성 화합물의 존재하에서 성장하는 능력을 지닌 선태류 세포를 또한 제공할 수 있다.
또한, 상기 기재된 성분들 중 일부는 형질전환 벡터로 합체될 수 있다. 형질전환 벡터는 일반적으로 DNA 플라스미드에서 유지되거나 상기 기재된 바와 같이 통합 벡터내로 전개되는 선별 마커를 포함한다.
또한, 피스코미트렐라에서 관찰된 바와 같이 고수율의 형질전환 사건을 달성함으로써, 형질전환 사건의 선별을 위한 마커를 사용하는 것이 회피될 수 있다.
외인성 DNA를 선태류 세포내로 도입시키는 방법은 당 분야에 널리 공지되어 있고, 특히 문헌 [Schaefer D. G. "Principles and protocols for the moss Physcomitrella patens", (May 2001) Institute of Ecology, Laboratory of Plant Cell Genetics, University of Lausanne; Reutter K. and Reski R., Plant Tissue Culture and Biotechnology September 1996, Vol.2, No.3; Zeidler M et al., (1996), Plant Molecular Biology 30:199-205]에 기재되어 있다.
당업자는 상기 기재된 바와 같이 재조합 핵산 서열 또는 유전자 발현을 위해 벡터를 작제하고 프로토콜을 설계하는 것을 능히 수행할 수 있다. 프로모터 서열을 포함하는 적절한 조절 서열, 터미네이터 단편(terminator fragment), 폴리아데닐화 서열, 인핸서 서열, 마커 유전자 및 적절한 경우 다른 서열을 함유하는 적합한 벡터가 선택되거나 작제될 수 있다. 추가의 상세한 사항에 대해서는 문헌 [Molecular Cloning: a Laboratory Manual: 2nd edition, Sambrook et al, 1989, Cold Spring Harbor Laboratory Press]이 참조된다. 예를 들어 핵산 작제물을 제조하는 데에 있어서의 핵산의 조작, 돌연변이유발, 시퀀싱, 세포내로의 DNA의 도입 및 유전자 발현, 및 단백질의 분석을 위한 다수의 공지된 기술 및 프로토콜은 문헌 [Current Protocols in Molecular Biology, Second Edition, Ausubel et al. eds., John Wiley & Sons, 1992]에 상세히 기재되어 있다. 샘브룩(Sambrook) 등의 문헌 및 오수벨(Ausubel) 등의 문헌이 본 명세서에 참조로 포함된다.
상기 기재된 바와 같이, 선별 유전자 마커는 유전자이식된 선태류 세포의 선택을 용이하게 할 수 있고, 이들 마커는 본원에 언급된 선별 표현형을 부여하는 키메라 유전자로 구성될 수 있다.
글리코실트랜스퍼라아제 활성을 포함하는 선택된 글리코실트랜스퍼라아제 엔코딩 핵산 서열 및 폴리펩티드 서열을 선태류 세포내로 도입시키는 경우, 당업자에게 널리 공지된 일정한 고려사항이 참작되어야 한다. 삽입시키려는 핵산(들)은 전사를 유도하는 유효한 조절 엘리먼트를 함유하는 작제물내에 어셈블링되어야 한다. 작제물을 세포내로 수송하는 방법이 이용가능해야 한다. 작제물이 세포막내에 존재하는 경우, 내인성 염색체 물질내로의 통합이 일어나거나 일어나지 않을 것이다.
본 발명은 상기 제시된 벡터 또는 작제물로 형질전환된 숙주 세포, 특히 선태류 또는 미생물 세포를 추가로 포함한다. 따라서, 본 명세서에 기재된 본 발명의 누클레오티드 서열을 포함하는 선태류 세포와 같은 숙주 세포가 제공된다. 세포내에서, 누클레오티드 서열은 염색체내로 혼입될 수 있다.
또한, 본 발명에 따르면, 본 명세서에 기재된 바와 같은 발현의 제어를 위해 조절 서열의 작동적 제어를 받는 본 발명에 의해 제공되는 적어도 누클레오티드 서열, 특히 이종 누클레오티드 서열이 게놈내로 혼입된 선태류 세포가 제공된다. 코딩 서열은 본 발명에 사용되는 핵산 서열에 대해 이종이거나 외래성일 수 있는, 예를 들어 발현을 위해 핵산 서열(들)과 천연적으로 결합되어 있지 않은 하나 이상의 조절 서열에 작동적으로 결합될 수 있다. 본 발명에 따른 누클레오티드 서열은 발현이 사용자의 제어를 받게 되도록 외부 유도성 프로모터의 제어를 받을 수 있다. 본 발명의 추가의 일면은 본 발명에서 사용이 고려되는 핵산 서열(들) 또는 적어도 본 발명에서 사용이 고려되는 서열(들)을 포함하는 적절한 벡터를 선태류 세포내로 도입시키고, 벡터와 선태류 세포 게놈 사이의 재조합이 상기 서열을 게놈내로 도입시키게 하거나 도입시킬 수 있게 하는 것을 포함하여 그러한 선태류 세포, 특히 피스코미트렐라 파텐스 세포를 제조하는 방법을 제공한다. 본 발명은 포유동물 당화 패턴을 첨가시키고자 하는 폴리펩티드 서열을 코딩하며 누클레오티드 서열이 선조 세포내로 도입된 결과로써 본 발명에 사용하기에 적합한 GalT 누클레오티드 및/또는 누클레오티드 서열을 함유하는 선태류 세포, 특히 피스코미트렐라 파텐스 세포에까지 확장된다.
"이종"이란 용어는 해당 유전자/누클레오티드의 서열이 유전 공학을 이용하여, 즉, 인간 개입에 의해 선태류 세포 또는 이의 선조내로 도입되었음을 나타내기 위해 사용될 수 있다. 유전자이식된 선태류 세포, 즉, 해당 누클레오티드 서열에 대해 유전자이식된 선태류 세포가 제공될 수 있다. 이식유전자는 게놈외 벡터상에 존재하거나 바람직하게는 안정하게 게놈내로 혼입될 수 있다. 이종 유전자는 등가의 내인성 유전자, 즉, 정상적으로는 동일하거나 유사한 기능을 수행하는 유전자를 대체할 수 있거나, 삽입된 서열은 내인성 유전자 또는 다른 서열에 대해 부가적일 수 있다. 이종 유전자의 도입과 관련된 이점은 선호도에 따라 발현에 영향을 미칠 수 있게 하기 위해 서열의 발현이 선택된 프로모터의 제어를 받게 하는 능력이다. 선태류 세포에 대해 이종이거나 외인성이거나 외래성인 누클레오티드 서열은 그러한 유형, 스트레인 또는 종의 세포에서 비천연적인 것일 수 있다. 따라서, 누클레오티드 서열은 상이한 유형 또는 종의 선태류 세포의 환경내에 위치하는 특정 유형의 선태류 세포, 예를 들어 피스코미트렐라 파텐스 세포의 코딩 서열 또는 상기 세포로부터 유래된 코딩 서열을 포함할 수 있다. 또 다른 가능성은 누클레오티드 또는 동족체가 천연 상태에서 발견되는 선태류 세포내에 상기 누클레오티드 서열이 위치해 있지만, 상기 누클레오티드가 발현의 제어를 위해 프로모터 서열과 같은 하나 이상의 조절 서열에 작동적으로 결합되어 있는 것과 같이 그러한 유형 또는 종 또는 스트레인의 세포(들)내에 천연 상태에서 존재하지 않는 핵산에 결합되고/되거나 이러한 핵산에 인접해 있는 것이다. 선태류 또는 다른 숙주 세포내의 서열은 확인가능하게 이종, 외인성 또는 외래성일 수 있다.
또한, 본 발명은 본 명세서에 기재되어 있거나 본 명세서에 기재된 정보 및 시사된 내용에 따라 수득할 수 있는 본 발명에 따른 핵산 분자들의 조합물의 요망되는 폴리펩티드 발현 생성물을 포함한다. 또한, 적합한 숙주 세포, 예를 들어 대장균에서 적절한 조건하에서 그러한 발현 생성물을 엔코딩하는 누클레오티드 서열로부터의 발현에 의해 상기 발현 생성물을 제조하는 방법이 제공된다. 당업자는 재조합 유전자 발현 생성물의 발현 및 회수를 위해 벡터를 작제하고 프로토콜과 시스템을 설계하는 것을 능히 수행할 수 있다.
본 발명에 따른 폴리펩티드는 본 명세서에 언급된 폴리펩티드(들)의 대립인자(allele), 변이체, 단편, 유도체, 돌연변이체 또는 동족체일 수 있다. 대립인자, 변이체, 단편, 유도체, 돌연변이체 또는 동족체는 상기 언급되고 본 명세서에 제시된 폴리펩티드와 실질적으로 동일한 기능을 지닐 수 있거나 상기 폴리펩티드의 기능적 돌연변이체일 수 있다. 인간에서 사용되는 본 명세서에 기재된 약제용 단백질과 관련하여, 당업자는 이러한 단백질의 1차 서열 및 이의 당화 패턴이 인간에서 발견되는 것을 의태(mimick)하거나 바람직하게는 이와 동일함을 인식할 것이다.
"동일성"은 본 발명의 핵산 서열 또는 아미노산 서열과 관련하여 전체 서열 또는 이의 본질적 부분의 동일성을 의미하기 위해 사용될 수 있다. 앞서 이미 언급된 바와 같이, 고수준의 아미노산 동일성은 기능적으로 중요한 도메인 또는 영역, 예를 들어 본 명세서에서 확인된 도메인 중 어느 하나로 제한될 수 있다.
특히, 본 명세서에 제공된 특정 선태류 유래된 폴리펩티드 서열의 동족체가 본 발명에 의해 제공되며, 또한 그러한 동족체의 돌연변이체, 변이체, 단편 및 유도체도 제공된다. 따라서, 본 발명은 본 명세서에 규정되어 있고 본 명세서에 제공된 서열 정보를 이용하여 수득될 수 있는 β1,3-갈락토실트랜스퍼라아제 기능을 지닌 아미노산을 포함하는 폴리펩티드에까지 또한 확장된다. 본 발명에 따른 β1,3-갈락토실트랜스퍼라아제는 아미노산 수준에서 본 명세서에 개시된 서열, 특히 Pp GalTl, PpGalT2, PpGalT1as 또는 PpGalT2as (도 2 내지 5)의 아미노산 서열과 약 50% 이상, 또는 약 55% 이상, 또는 약 60% 이상, 또는 약 65% 이상, 또는 약 70% 이상, 또는 약 75% 이상, 또는 약 80% 이상, 또는 약 85% 이상, 또는 약 88% 이상, 또는 약 90% 이상, 가장 바람직하게는 적어도 약 95% 또는 이를 초과하는 동일성을 지닐 수 있으며, 단, 이러한 단백질은 본 발명과 관련하여 적합한 β1,3-갈락토실트랜스퍼라아제 활성을 지닌다. 언급된 % 동일성은 바람직하게는 해당 서열을 예를 들어 PpGa1Tl, PpGalT2, PpGalT1as 또는 PpGalT2as와 비교한 경우 도 1에 도시된 바와 같은 7개의 보존된 도메인을 포함하는 영역 (당업자에게는 자명할 것인 적절한 "-"를 포함함)에서 나타날 수 있다.
특정 구체예에서, 특정 서열의 대립인자, 변이체, 유도체, 돌연변이 유도체, 돌연변이체 또는 동족체는 그러한 특정 서열과 낮은 전체 동일성을 나타낼 수 있는데, 예를 들어 전체 동일성은 20% 이상, 또는 25% 이상, 또는 30% 이상, 또는 35% 이상, 또는 40% 이상 또는 45% 이상 (즉, 약 20%, 또는 약 25%, 또는 약 30%, 또는 약 35%, 또는 약 40%, 또는 약 45% (즉, 예를 들어 20% 또는 그 보다 높음)) 이다. 그러나, 기능적으로 중요한 도메인 또는 영역의 경우, 아미노산 동일성은 훨씬 높을 수 있다. 기능적으로 중요한 추정 도메인 또는 영역은 동족체의 서열의 비교를 포함하는 생물정보학 프로세스를 이용하여 확인될 수 있다. 바람직한 본 발명에 따른 β1,3-GalT 단백질은 도 1에 따른 7개의 보존된 도메인 (진하게 표시된 아미노산 잔기)에서 80% 이상, 특히 90% 이상의 동일성을 나타내며, 특히 바람직하게는 보존된 아미노산 (도 1에서 "*" (별표)로 표현됨)이 완전하게 (또는 적어도 95% 범위까지) 존재한다. 본 발명에 따른 β1,3-GalT의 특히 바람직한 변이체는 도 1에 도시된 보존된 아미노산의 80% 이상, 바람직하게는 90% 이상, 특히 100%를 포함한다.
다양한 폴리펩티드의 기능적으로 중요한 도메인 또는 영역은 융합 단백질로서의 엔코딩 핵산으로부터의 발현을 위해 조합될 수 있다. 예를 들어, 다양한 동족체의 특히 유리하거나 바람직한 특성이 하이브리드 단백질에서 조합될 수 있어서, β1,3-갈락토실트랜스퍼라아제 기능을 지닌 수득된 발현 생성물이 적절한 경우 여러가지 모체(parent) 단백질의 단편을 포함할 수 있게 된다.
동일성은 정렬된 서열의 % 값으로서 용이하게 계산될 수 있다 (인텔리전트(intelligent) "-"을 포함함). 아미노산 서열의 유사성은 규정된 바와 같고 문헌 [Altschul et al. (1990) J. Mol. Biol. 215: 403-10]의 TBLASTN 프로그램에 의해 측정될 수 있는데, 상기 프로그램은 당 분야에서 표준적으로 사용되는 것이다. 특히, TBLASTN 2.0은 매트릭스(Matrix) BLOSUM62 및 갭 페널티(GAP penalties) (이그지스턴스(existence): 11, 익스텐션(extension): 1)와 함께 사용될 수 있다. 사용될 수 있는 또 다른 표준 프로그램은 베스트핏(BestFit)이며, 이는 1994년 9월 출시된 위스콘신 패키지(Wisconsin Package) 버전 8의 일부이다 (Genetics Computer Group, 575 Science Drive, Madison, Wisconsin, USA, Wisconsin 53711). 베스트핏은 두 서열 간의 유사성의 최상의 세그먼트의 최적 정렬을 달성한다. 최적 정렬은 스미쓰(Smith)와 워터맨(Waterman)의 국소 동일성 알고리듬(local identity algorithm) (Adv. Appl. Math. (1981) 2: 482-489)을 이용하여 매치(match)의 수를 최대화시키기 위해 갭을 삽입함으로써 발견된다. 그 밖의 알고리듬은 GAP를 포함하며, 이는 니들맨(Needleman)과 운쉬(Wunsch) 알고리듬을 이용하여 두 개의 완전한 서열을 정렬시키는데, 이는 매치의 수를 최대화시키고 갭의 수를 최소화시킨다. 임의의 알고리듬과 마찬가지로, 일반적으로 디폴트(default) 파라미터가 사용되는데, GAP의 경우 이는 갭 크리에이션 페널티(gap creation penalty) = 12 이고 갭 익스텐션 페널티(gap extension penalty) = 4 이다. 또한, 3의 갭 크리에이션 페널티 및 0.1의 갭 익스텐션 페널티가 사용될 수 있다. 알고리듬 FASTA (이는 피어슨(Pearson)과 립맨(Lipma)의 문헌 [(1988) PNAS USA 85: 2444-2448]에 기재된 방법을 이용함)가 또 다른 대안이다.
재조합 숙주 세포, 특히 식물 세포, 또는 식물 각각을 생성시키는 유리한 방법은 본 발명에 따른 DNA 분자, 특히 비활성화 돌연변이를 포함하는 본 발명에 따른 DNA 분자를 비-돌연변이성 상동 서열 대신 숙주 세포, 또는 식물 각각의 게놈내로 삽입시키는 것이다 (Schaefer et al., 1997, Plant J.; 11 (6) : 1195-1206). 따라서, 이러한 방법은 벡터와 함께 기능하는 것이 아니라 순수한 DNA 분자와 함께 기능한다. 본 발명에 따른 DNA 분자는 단지 3가지 예를 언급한다면 예를 들어 유전자 충격(gene bombardment), 마이크로인젝션(microinjection) 또는 PEG 매개된 직접 DNA 전달에 의해 숙주내로 삽입된다. 이러한 DNA 분자는 숙주의 게놈내의 상동 서열에 결합하는데, 이로써 상동 재조합 및 이에 따른 결실, 삽입 또는 치환 돌연변이 각각의 수용이 게놈에서 일어나게 된다: β1,3-갈락토실트랜스퍼라아제의 발현은 예를 들어 각각 억제되거나 완전히 차단될 수 있다.
본 발명의 추가의 일면은 β1,3갈락토실트랜스퍼라아제 활성이 천연 식물 또는 식물 세포에 존재하는 β1,3갈락토실트랜스퍼라아제 활성의 50% 이하, 특히 20% 이하, 특히 바람직하게는 0%인 식물, 식물 조직 또는 식물 세포 각각에 관한 것이다. 이러한 식물 또는 식물 세포 각각의 이점은 이에 의해 생성되는 당단백질이 임의의 β1,3-결합 갈락토오스를 포함하지 않거나 거의 포함하지 않는다는 것이다. 이러한 식물 각각의 생성물이 인간 또는 척추동물 신체에 의해 흡수된 경우, β1,3 결합 갈락토오스 에피토프에 대한 면역 반응이 일어나지 않을 것이다.
바람직하게는, 상기 기재된 방법들 중 하나에 의해 제조되며 β1,3-갈락토실트랜스퍼라아제 생성이 각각 억제되거나 완전히 차단된 재조합 식물 또는 식물 세포 각각이 제공된다.
또한, 본 발명은 본 발명에 따른 DNA 분자의 서열에 상보적인 염기 서열 뿐만 아니라 이의 부분 서열을 포함하는 PNA 분자에 관한 것이다. PNA (펩티드 핵산)는 DNA-유사 서열이며, 누클레오염기(nucleobase)가 슈도-펩티드 골격에 결합되어 있다. 일반적으로 PNA는 왓슨-크릭(Watson-Crick) 염기쌍 형성 및 나선 형성에 의해 상보적 DNA-, RNA- 또는 PNA-올리머와 하이브리드화한다. 펩티드 골격은 효소적 분해에 대한 보다 큰 내성을 보장한다. 따라서, PNA 분자는 개선된 안티센스 작용제이다. 누클레아제 뿐만 아니라 프로테아제도 PNA 분자를 공격할 수 없다. 상보적 서열에 결합된 경우 PNA 분자의 안정성은 DNA 및 RNA 폴리머라아제, 역전사효소, 텔로머라아제 및 리보솜의 충분한 입체적 차단을 포함한다. PNA 분자가 상기 언급된 서열을 포함하는 경우, 이는 β1,3갈락토실트랜스퍼라아제를 코딩하는 DNA 또는 DNA의 부위 각각에 결합할 것이고, 이러한 방식으로 상기 효소의 전사를 억제할 수 있다. 전사되거나 번역되지 않기 때문에, PNA 분자는 합성적으로, 예를 들어 t-Boc 기술의 도움을 받아 제조될 것이다. 유리하게는, 본 발명의 DNA 분자의 서열 뿐만 아니라 이의 부분 서열에 상응하는 염기 서열을 포함하는 PNA 분자가 제공된다. 이러한 PNA 분자는 β1,3-갈락토실트랜스퍼라아제의 mRNA 또는 mRNA의 부위와 복합체를 형성함으로써 상기 효소의 번역이 억제될 것이다. 안티센스 RNA에 대해 제시된 유사한 논증이 이러한 경우 적용된다. 따라서, 예를 들어 특히 효율적인 복합체형성 영역은 mRNA의 번역 개시 영역 또는 5'-비번역 영역이다.
본 발명의 또 다른 일면은 전사 또는 번역 수준 각각에서 β1,3갈락토실트랜스퍼라아제의 차단된 발현을 포함하는 식물, 조직 또는 세포 각각, 특히 식물 세포를 제조하는 방법에 관한 것이며, 이는 본 발명의 PNA 분자가 세포내에 삽입됨을 특징으로 한다. PNA 분자(들) 각각을 세포내에 삽입하기 위해, 또 다시 통상적인 방법, 예를 들어 일렉트로포레이션 또는 마이크로인젝션이 사용된다. 특히 효율적인 것은 PNA 올리고머가 세포 침투 펩티드, 예를 들어 트랜스포르탄(transportan) 또는 pAntp에 결합된 경우의 삽입이다 (Pooga et al., 1998, Nature Biotechnology, 16; 857-861).
본 발명은 β1,3-갈락토실트랜스퍼라아제 생성이 각각 억제되거나 완전히 차단된 본 발명의 재조합 식물 또는 식물 세포 각각, 또는 PNA 분자가 본 발명의 방법에 따라 삽입된 식물, 또는 조직, 또는 세포 각각을 재조합 당단백질이 발현되도록 당단백질을 발현하는 유전자로 트랜스펙션시킴을 특징으로 하는 재조합 당단백질을 제조하는 방법을 제공한다. 이렇게 함에 있어서, 앞서 이미 언급된 바와 같이, 요망되는 단백질에 대한 유전자를 포함하는 벡터가 숙주 또는 숙주 세포 각각내로 트랜스펙되며, 이는 또한 이미 상기에 설명되어 있다. 트랜스펙션된 식물 세포는 요망되는 단백질을 발현시키며, 임의의 β1,3-결합 갈락토오스를 전혀 지니지 않거나 거의 지니지 않는다. 따라서, 상기 단백질은 인간 또는 척추동물 신체에서 앞서 이미 언급된 면역 반응을 촉발시키지 않는다.
임의의 단백질이 이러한 시스템에서 생성될 수 있다.
유리하게는, β1,3-갈락토실트랜스퍼라아제 생성이 억제되거나 완전히 차단된 재조합 식물 또는 식물 세포 각각, 또는 PNA 분자가 본 발명의 방법에 따라 삽입된 식물, 또는 조직, 또는 세포 각각을 재조합 당단백질이 발현되도록 당단백질을 발현하는 유전자로 트랜스펙션시킴을 특징으로 하는 재조합 인간 당단백질을 제조하는 방법이 제공된다. 이러한 방법에 의해, 인체에 의해 흡수된 경우 β1,3-결합 갈락카타아제(galacatase)에 대해 유도된 임의의 면역 반응을 촉발시키지 않는 인간 단백질을 식물 (식물 세포)에서 생성시키는 것이 가능해진다. 이와 관련하여, 식품으로서 기능하는 재조합 당단백질을 생성시키기 위한 식물 유형, 예를 들어 바나나, 감자 및/또는 토마토를 이용하는 것이 가능하다. 예를 들어 조직으로부터의 재조합 당단백질의 추출에 이은 투여에 의해, 또는 식물 조직을 직접 섭취함에 의해 재조합 당단백질이 인체에 흡수되도록 이러한 식물의 조직은 재조합 당단백질을 포함한다. 바람직하게는, β1,3-갈락토실트랜스퍼라아제 생성이 각각 억제되거나 완전히 차단된 본 발명의 재조합 식물 또는 식물 세포 각각, 또는 PNA 분자가 본 발명의 방법에 따라 삽입된 식물, 또는 조직, 또는 세포 각각을 재조합 당단백질이 발현되도록 당단백질을 발현하는 유전자로 트랜스펙션시키는 것을 포함하여 의약용 재조합 인간 당단백질을 제조하는 방법이 제공된다. 이렇게 함에 있어서, 의약용으로 관심을 끄는 임의의 단백질이 사용될 수 있다.
더욱이, 본 발명은 상기 기재된 방법에 따른 재조합 당단백질에 관한 것이며, 이러한 재조합 당단백질은 식물 시스템에서 제조된 것이고 이의 펩티드 서열은 갈락토실트랜스퍼라아제-감소되지 않은 식물 시스템에서 발현된 단백질에 존재하는 β1,3-결합 갈락토오스 잔기의 50% 이하, 특히 20% 이하, 특히 바람직하게는 0%를 포함한다. 물론, β1,3-결합 갈락토오스 잔기를 포함하지 않는 당단백질이 바람직할 수 있다. β1,3-결합 갈락토오스의 양은 β1,3-갈락토실트랜스퍼라아제의 상기 기재된 억제의 정도에 좌우될 것이다.
바람직하게는, 본 발명은 상기 기재된 방법에 따라 식물 시스템에서 생성된 것이고 펩티드 서열이 갈락토실트랜스퍼라아제-감소되지 않은 식물 또는 시스템에서 발현된 단백질에 존재하는 β1,3-결합 갈락토오스 잔기의 50% 이하, 특히 20% 이하, 특히 바람직하게는 0%를 포함하는 재조합 인간 당단백질에 관한 것이다.
특히 바람직한 구체예는 상기 기재된 방법에 따라 식물 시스템에서 제조된 것이고 펩티드 서열이 갈락토실트랜스퍼라아제-감소되지 않은 식물 또는 시스템에서 발현된 단백질에 존재하는 β1,3-결합 갈락토오스 잔기의 50% 이하, 특히 20% 이하, 특히 바람직하게는 0%를 포함하는 의약용 재조합 인간 당단백질에 관한 것이다.
추가의 일면은 본 발명에 따른 당단백질을 포함하는 약제 조성물을 포함한다. 약제 조성물은 본 발명의 당단백질 이외에 이러한 조성물에 통상적인 첨가제를 추가로 포함한다. 이러한 것들로는 예를 들어 다양한 완충제 함량을 지닌 적절한 희석제 (예를 들어, Tris-HCl, 아세테이트, 포스페이트), pH 및 이온 강도 첨가제, 예를 들어 텐시드(tenside) 및 가용화제 (예를 들어, 트윈 80, 폴리소르베이트 80), 방부제 (예를 들어, 티메로살, 벤질 알코올), 애쥬번트, 산화방지제 (예를 들어, 아스코르브산, 나트륨 메타비설파이트), 에멀젼화제, 충전제(filler) (예를 들어, 락토오스, 만니톨), 단백질에 대한 폴리에틸렌 글리콜과 같은 중합체의 공유 결합, 폴리락트산, 폴리글리콜산 등과 같은 고분자 화합물의 미립자 조성물 또는 리포솜내의 물질의 혼입, 각각의 치료에서 적합한 보조제 및/또는 담체 물질이 있다. 이러한 조성물은 본 발명의 당단백질의 물리적 상태, 안정성, 생체내 방출 속도 및 생체내 배출 속도에 영향을 미친다.
또한, 본 발명은 샘플에서 β1,3-갈락토실트랜스퍼라아제를 코딩하는 DNA 분자를 선택하는 방법으로서, 본 발명의 표지된 DNA 분자가 샘플로 혼합되고, 이러한 분자가 β1,3-갈락토실트랜스퍼라아제를 코딩하는 DNA 분자에 결합하는 방법을 제공한다. 하이브리드화된 DNA 분자가 검출되고, 정량되고, 선별될 수 있다. 표지된 DNA 분자가 하이브리드화할 수 있는 단일 가닥 DNA를 함유하는 샘플의 경우, 샘플이 예를 들어 가열에 의해 변성된다.
한 가지 가능한 방법은 가능하게는 엔도누클레아제의 첨가 후에 아가로오스 겔상에서의 겔 전기영동에 의해 검정하려는 DNA를 분리하는 것이다. 니트로셀룰로오스의 막으로 옮겨진 후, 상응하는 상동 DNA 분자에 하이브리드화되는 본 발명에 따른 표지된 DNA 분자들이 혼합된다 ("서던 블롯팅(Southern blotting)").
또 다른 가능한 방법은 본 발명에 따른 DNA 분자의 서열로부터 유래된 특정 및/또는 축퇴(degenerated) 프라이머를 사용하는 PCR-의존성 방법에 의해 다른 종으로부터 상동 유전자를 발견하는 것이다.
바람직하게는, 상기 확인된 본 발명의 방법을 위한 샘플은 식물체의 게놈 DNA를 포함한다. 이러한 방법에 의해, 다수의 식물이 β1,3-갈락토실트랜스퍼라아제 유전자의 존재에 대해 매우 신속하고 효율적인 방식으로 검정된다. 이러한 방식으로, 상기 기재된 본 발명의 방법에 의해 이러한 유전자를 포함하지 않는 식물을 선별하거나 이러한 유전자를 포함하는 식물에서 β1,3-갈락토실트랜스퍼라아제의 발현을 각각 억제하거나 완전히 차단하는 것이 각각 가능하며, 이로써 상기 식물은 후속하여 (인간) 당단백질의 트랜스펙션 및 생성을 위해 사용될 수 있다.
또한, 본 발명은 상기 언급된 마지막 2가지 방법에 따라 선별되고 후속하여 샘플로부터 단리된 β1,3-갈락토실트랜스퍼라아제를 코딩하는 DNA 분자에 관한 것이다. 이러한 분자는 추가의 검정을 위해 사용될 수 있다. 상기 분자는 시퀀싱되고, 이어서 β1,3-갈락토실트랜스퍼라아제를 발견하기 위한 DNA 프로브로서 사용될 수 있다. 이러한 (표지된) DNA 분자는 상기 분자가 단리된 생물체와 관련된 생물체에 대해 본 발명의 DNA 분자 보다 더욱 효율적으로 프로브로서 기능할 것이다.
또한, 본 발명은 푸코오스 단위 뿐만 아니라 상기 기재된 DNA 분자에 의해 엔코딩되는 β1,3갈락토실트랜스퍼라아제가 탄수화물 단위 또는 당단백질 각각을 포함하는 샘플로 혼합됨으로써 β1,3-위치의 갈락토오스가 β1,3갈락토실트랜스퍼라아제에 의해 탄수화물 단위 또는 당단백질 각각에 결합되는, 인간 및 다른 척추동물 당단백질의 "식물화된(plantified)" 탄수화물 단위를 제조하는 방법에 관한 것이다. β1,3갈락토실트랜스퍼라아제를 클로닝하기 위한 본 발명에 따른 방법에 의해, 대량의 정제된 효소를 생성하는 것이 가능하다. 완전 활성 트랜스퍼라아제를 수득하기 위해, 적절한 반응 조건이 제공된다.
본 발명은 하기 실시에 및 도면에 의해 보다 상세히 설명될 것이지만, 물론 이에 제한되지 않는다.
도 1은 β1,3-GalT의 아미노산 정렬을 도시한다. β1,3-갈락토실트랜스퍼라아제의 7개의 보존된 도메인은 진한 글자로 표시된다. 보존된 아미노산 잔기는 별표로 표시된다. 인간으로부터의 기준 서열 (CAA75344, 인간으로부터의 β1,3-갈락토실트랜스퍼라아제)에 따른 유사성은 다음과 같이 예측된다: BAD17812 (오리자 사티바(Oryza sativa)로부터의 추정 β1,3-갈락토실트랜스퍼라아제) = 17%; NP 174003 (아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 추정 β1,3-갈락토실트랜스퍼라아제) = 16%; PpGa1Tl (피스코미트렐라 파텐스(Physcomitrella patens)로부터의 β1,3-갈락토실트랜스퍼라아제 1) = 15%; PpGalT2 (피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제 2) = 16%.
도 2는 피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제 1 유전자의 코딩 DNA 서열로부터 예측된 단백질 서열을 도시한다.
도 3은 피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제 2 유전자의 코딩 DNA 서열로부터 예측된 단백질 서열을 도시한다. 트랜스멤브레인 도메인은 진한 글자로 표시된다.
도 4는 피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제 1 유전자의 선택적 스플라이스 변이체의 단백질 서열을 도시한다. 추가의 55개 아미노산 스플라이스 삽입물은 진한 글자로 표시된다.
도 5는 피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제 2 유 전자의 선택적 스플라이스 변이체의 단백질 서열을 도시한다. 추가의 50개 아미노산 스플라이스 삽입물은 진한 글자로 표시된다.
방법 및 재료
식물 재료
N-글리칸의 코어 구조에서 푸코오스와 크실로오스 잔기가 결여된 피스코미트렐라 파텐스의 글리코-엔지니어링된 2중 녹아웃 스트레인을 사용하였다 (Koprivova et al. 2004 Plant Biotechnol. J. 2, 517-523).
표준 배양 조건
식물을 플레인(plain) 무기 액체 변형된 놉(Knop) 배지 (1000 mg/l Ca (NO3)2 x 4H2O 250 mg/l KCl, 250 mg/l KH2PO4, 250 mg/l MgSO4 x 7 H2O 및 12.5 mg/l FeSO4 X 7 H2O; pH 5.8)에서 멸균 조건하에서 무균적으로(axenicallly) 성장시켰다 (Reski and Abel (1985) Planta 165, 354-358). 식물을 200 ml의 배양 배지를 함유하는 500 ml 에를렌마이어(Erlenmeyer) 플라스크에서 성장시키고, 플라스크를 120 rpm으로 설정된 세르토맷(Certomat) R 진탕기 (B.Braun Biotech International, Germany)에서 진탕시켰다. 성장 챔버내의 조건은 25 +/- 3℃ 및 16:8 h의 명암 방식이었다. 플라스크를 35 마이크로몰-1m-2를 제공하는 2개의 형광 튜브 (Osram L 58 W / 25)에 의해 위에서 조명하였다. 배양물을 울트라-투락스(Ultra-Turrax) 균질기 (IKA, Staufen, Germany)를 사용하여 붕 괴(disintegration)시키고 100 ml의 새로운 놉 배지를 함유하는 2개의 새로운 500 ml 에를렌마이어 플라스크에 접종함으로써 주 당 1회 계대배양하였다.
원형질체 단리
여과 후, 이끼 원사체를 0.5 M 만니톨 중에서 사전인큐베이션시켰다. 30분 후, 4 % 드리셀라아제(Driselase) (Sigma, Deisenhofen, Germany)를 현탁액에 첨가하였다. 드리셀라아제를 0.5 M 만니톨에 용해시키고 (pH 5.6-5.8), 3600 rpm에서 10분간 원심분리시키고, 0.22 마이크론(microm) 필터 (Millex GP, Millipore Corporation, USA)를 통과시켜 멸균시켰다. 1% 드리셀라아제 (최종 농도)를 함유하는 현탁액을 실온에서 어두운 곳에서 인큐베이션시키고, 약하게 교반하였다 (원형질체의 최적 수율은 2시간 인큐베이션 후에 달성되었음) (Schaefer, "Principles and protocols for the moss Physcomitrella patens", (May 2001) Institute of Ecology, Laboratory of Plant Cell Genetics, University of Lausanne). 현탁액을 100 마이크론 및 50 마이크론의 포어 크기를 지닌 시브(sieve) (Wilson, CLF, Germany)를 통과시켰다. 현탁액을 멸균 원심분리 튜브에서 원심분리시키고, 원형질체를 55g에서 실온에서 10분간 침강시켰다 (3의 가속(accelaration); 3에서 감속(slow down); Multifuge 3 S-R, Kendro, Germany) (Schaefer, supra). 원형질체를 3M 배지 (15 mM MgCl2 x 2H2O; 0.1 % MES; 0.48 M 만니톨; pH 5.6; 540 mOsm; 멸균 여과됨, Schaefer et al. (1991) Mol Gen Genet 226, 418-424)에서 약하게 재현탁시켰다. 현탁액을 55g에서 실온에서 10분간 재차 원심분리시켰다 (3의 가속; 3 에서 감속; Multifuge 3 S-R, Kendro, Germany). 원형질체를 3M 배지 (15 mM MgCl2 x 2H2O; 0.1 % MES; 0.48 M 만니톨; pH 5.6; 540 mOsm; 멸균 여과됨, Schaefer et al. (1991) Mol Gen Genet 226, 418-424)에서 약하게 재현탁시켰다. 원형질체를 계수하기 위해, 적은 부피의 현탁액을 푸쉬스-로젠탈-챔버(Fuchs-Rosenthal-chamber)로 옮겼다.
형질전환 프로토콜
형질전환을 위해, 원형질체를 어두운 곳에서 얼음상에서 30분간 인큐베이션시켰다. 후속하여, 원형질체를 55g에서 실온에서 10분간 원심분리에 의해 침강시켰다 (3의 가속; 3에서 감속; Multifuge 3 S-R, Kendro, Germany). 원형질체를 3M 배지 (15 mM MgCl2 x 2H2O; 0.1 % MES; 0.48 M 만니톨; pH 5.6; 540 mOsm; 멸균 여과됨, Schaefer et al. (1991) Mol Gen Genet 226, 418-424)에서 1.2 x 106개 원형질체/ml의 농도로 재현탁시켰다 (Reutter and Reski (1996) Production of a heterologous protein in bioreactor cultures of fully differentiated moss plants, Pl. Tissue culture and Biotech., 2, pp. 142-147). 25 마이크로리터의 이러한 원형질체 현탁액을 새로운 멸균 원심분리 튜브내로 분배하고, 5 마이크로리터의 DNA 용액 (H2O 중의 컬럼 정제된 DNA (Qiagen, Hilden, Germany); 10-100 마이크로리터; 6 마이크로그램의 최적 DNA 양)을 첨가하고, 마지막으로 25 마이크로리터의 PEG-용액 (40% PEG 4000; 0.4 M 만니톨; 0.1 M Ca(NO3)2; 오토클레이빙 후 pH 6)를 첨가하였다. 현탁액을 바로 혼합하되 약하게 혼합한 후, 이따금씩 약하게 혼합하며 실온에서 6분간 인큐베이션시켰다. 현탁액을 1, 2, 3 및 4ml의 3M 배지를 첨가함으로써 점진적으로 희석시켰다. 현탁액을 55g에서 20℃에서 10분간 원심분리시켰다 (3의 가속; 3에서 감속; Multifuge 3 S-R, Kendro). 펠릿을 3 ml 재생 배지(regeneration medium) (변형된 놉 배지; 5% 글루코오스; 3% 만니톨; 540 mOsm; pH 5.6-5.8)에서 재현탁시켰다. 재생을 문헌 [Strepp et al. (1998) Proc Natl Acad Sci USA 95,4368-4373]에 기재된 바와 같이 수행하였다. 유전자이식된 클론을 분자 스크리닝에 의해 확인하였다.
이끼 글리칸의 MALDI-Tof MS
식물 재료를 액체 배양법으로 배양하고, 여과에 의해 단리하고, 액체 질소로 동결시키고, -80℃에서 저장하였다. 상기 재료를 드라이아이스에 넣어 운반하였다. MALDI-TOF MS 분석을 에프. 알트만(F. Altmann) 교수(Prof. Dr.)의 실험실 (Glycobiology Division, Institut fur Chemie, Universitat fur Bodenkultur, Vienna, Austria)에서 수행하였다.
0.2 내지 0.5 g의 생중량(fresh weight)의 유전자이식된 피스코미트렐라 파텐스 재료를 펩신으로 분해하였다. N-글리칸을 문헌 [Wilson et al. (2001)]에 기재된 바와 같이 분해물로부터 수득하였다. 본질적으로, 글리칸은 펩티드:N-글리코시다아제 A에 의한 처리에 의해 방출되었고, DYNAMO상에서의 MALDI-TOF 질량분석법 (Thermo BioAnalysis, Santa Fe, NM)에 의해 분석되었다.
1. β1,3-갈락토실트랜스퍼라아제 엔코딩 유전자의 확인
N-글리칸 구조의 신장에 관한 인간으로부터의 β1,3-갈락토실트랜스퍼라아제 (β-1,3galT)의 생물학적 기능성이 공지되지 않았지만, 인간의 β-1,3galT 2 (Ace. No: CAA75344)의 서열을 출발 서열로서 선택하였다. 아마도(Amado) 등의 문헌 [1998 J. Biol. Chem. 273, 12770-12778]에 기재된 보존된 아미노산과 함께 헤넷(Hennet)의 문헌 [2002 Cell. Mol. Life Sci. 59, 1081-1095]에 기재된 7개의 보존된 도메인을 기초로 하여, 데이터베이스 스크리닝을 수행하였다. 이러한 전략으로 인해, 추정 β1,3-갈락토실트랜스퍼라아제로서 공지된 아라비돕시스 탈리아나로부터의 하나의 서열 (Ace. No: NP174003) 및 오리자 사티바(Oryza sativa)로부터의 하나의 서열 (Ace. No: BAD17812)이 확인되었다. 둘 모두의 종에 대해 추정 β1,3-갈락토실트랜스퍼라아제의 다수의 단백질 서열이 공개 데이터베이스에 올려져 있지만, 이들 2개만이 한편으로는 7개의 보존된 도메인에 대해 유사성을 나타내었고 다른 한편으로는 고도로 보존된 추가의 아미노산 중 몇 개에 대해 유사성을 나타내었다. 그러나, CAA75344와 비교된 경우, 전체 동일성은 둘 모두에 대해 매우 낮았는데, NP174003의 경우 16%였고, BAD17812의 경우 17%였다 (도 1).
모든 3개의 단백질 서열을 피스코미트렐라 파텐스의 비공개 "발현 서열 표지(expressed sequence tag)" (EST) 데이터베이스의 스크리닝을 위해 사용하였다. β1,3-갈락토실트랜스퍼라아제의 7개의 보존된 도메인과 약간의 유사성을 포함하는 펩티드 서열을 엔코딩하는 발현 서열 표지를 확인하였다. 이러한 EST를 사용하여,피스코미트렐라 파텐스의 게놈 서열을 포함하는 데이터베이스의 β1,3-갈락토실트랜스퍼라아제 유전자 패밀리에 관해 클로닝을 위해 그리고 추가 스크리닝을 위해 프라이머를 설계하였다.
수득된 서열은 인트론과 엑손 서열 및 유전자 구조 (β-1,3galT 1은 SEQ ID NO: 1 및 SEQ ID NO: 3에 상응하고, β-1,3galT 2는 SEQ ID NO: 2 및 SEQ ID NO: 4에 상응함)를 포함하는 2개의 추정 β1,3-갈락토실트랜스퍼라아제 유전자를 포함하였다. 오픈 리딩 프레임으로부터 예측된 단백질 서열 (β1,3-GalT 1 (도 2) 및 β1,3-GalT 2 (도 3))은 트랜스멤브레인 도메인, 7개의 보존된 도메인 및 다수의 보존된 아미노산 (도 1)을 포함하였다.
1.1 피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제 1 유전자의 코딩 서열의 클로닝
피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제를 엔코딩하는 누클레오티드 서열
Figure 112009026097670-PCT00001
Figure 112009026097670-PCT00002
Figure 112009026097670-PCT00003
의 증폭을 cDNA 및 프라이머 MOB1251, (SEQ ID NO: 5: 5'- CTGAATATCCGTGGCCAA -3') 및 프라이머 MOB 1410 (SEQ ID NO: 6: 5'- TTCGAGCTCATGAAGAGGGGGTCGAGACT -3')를 사용하는 PCR에 의해 수행하였다. 증폭 생성물을 Sac I과 Msc I로 분해시키고, Sac I/Sma I 분해된 벡터 pRT1Ol (Toepfer et al. 1987 NAR 15, 5890)내로 클로닝하였다. 클로닝된 서열을 시퀀싱에 의해 검증하였다.
1.2 피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제 2 유전자의 코딩 서열의 클로닝
피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제를 엔코딩하는 누클레오티드 서열
Figure 112009026097670-PCT00004
의 증폭을 cDNA 및 프라이머 Ppβ1-3 GalT2 for (SEQ ID NO: 7: 5'- TACGAGCTCATGAAGAGGGGTGTGAGACC -3') 및 프라이머 Ppβ1-3GalT2 rev (SEQ ID NO: 8: 5'- GTAGAGCTCTCACAAGGTGCAGCACTTG -3')를 사용하는 PCR에 의해 수행하였다. 증폭 생성물을 Sac I로 분해시키고, Sac I 분해된 벡터 pRT1Ol (Toepfer et al. 1987 NAR 15, 5890)내로 클로닝하였다. 클로닝된 서열을 시퀀싱에 의해 검증하였다.
2.1 피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스퍼라아제 1 유전자의 녹아웃 작제물의 생성
피스코미트렐라 파텐스의 β1,3-갈락토실트랜스퍼라아제 1 유전자의 표적화된 유전자 붕괴를 위한 녹아웃 작제물을 피스코미트렐라 파텐스로부터의 게놈 DNA를 사용하여 수행되는 PCR에 의해 생성시켰다. 하나의 PCR에서, 프라이머 MOB1336 (SEQ ID NO: 9: 5'- TACGGATCCAACTTCGAGTTCGTGTCTGTA -3') 및 프라이머 MOB1333 (SEQ ID NO: 10: 5'- ACACTAAGCTTCTAATCAATGTCCGGAAGTGAG -3')을 사용하여 녹아웃 작제물의 5' 부분을 증폭시켰다. 두 번째 PCR에서, 프라이머 MOB1334 (SEQ ID NO: 11: 5'- TTAGAAGCTTAGTGTACGCTGAGTGTCTACATTG -3') 및 프라이머 MOB1335 (SEQ ID NO: 12: 5'- CATTGTCGACCCTACACAGCTCTTAACGTCTAC -3')를 사용하여 녹아웃 작제물의 3' 부분을 증폭시켰다. 둘 모두의 증폭 작제물을 Hin dIII로 분해시키고 (제한 부위는 프라이머 서열 MOB1333 및 MOB1334에서 진한 글자로 표시됨), T4 DNA 리가아제를 사용하여 후속 리게이션 반응에서 리게이션시켰다. 수득된 리게이션되고 정제된 DNA 서열을 프라이머 MOB1336과 MOB1335를 사용하는 추가 PCR을 위한 주형으로서 사용하였다. 수득된 증폭 생성물 β1-3GalTlko
Figure 112009026097670-PCT00005
은 상응하는 cDNA의 초기 5' 부분에서 정지 코돈을 추가로 개시하는 피스코미트렐라 파텐스의 β1,3-갈락토실트랜스퍼라아제 유전자 1의 게놈 서열과 관련하여 270 bp의 결실을 포함하였다. 따라서, 상동 재조합에 의해 피스코미트렐라 파텐스의 게놈내로 통합된 경우 기능이상 β1,3-갈락토실트랜스퍼라아제 유전자가 생성된다. 이러한 녹아웃 작제물을 단독으로 또는 녹아웃 작제물 β1-3GalT2ko (2.2 참조)와 함께 피스코미트렐라 파텐스의 형질전환을 위해 사용하였다.
추정 형질전환 식물의 스크리닝을 적절한 프라이머 조합물을 사용하는 PCR에 의해 수행하였다.
2.2 피스코미트렐라 파텐스로부터의 β1,3-갈락토실트랜스라아제 2 유전자의 녹아웃 작제물의 생성
피스코미트렐라 파텐스의 β1,3-갈락토실트랜스퍼라아제 2 유전자의 표적화된 유전자 붕괴를 위한 녹아웃 작제물을 피스코미트렐라 파텐스로부터의 게놈 DNA를 사용하여 수행되는 PCR에 의해 생성시켰다. 하나의 PCR에서, 프라이머 MOB1339 (SEQ ID NO: 14: 5'- TGGCACGATACAGTGGCATGA -3') 및 프라이머 MOB1337 (SEQ ID NO: 15: 5'- TGGAATTCATTCAAGAAACGGTGGGATGA -3')을 사용하여 녹아웃 작제물의 5' 부분을 증폭시켰다. 두 번째 PCR에서, 프라이머 MOB1338 (SEQ ID NO: 16: 5'- TGAATTCCATAACGAAGACACCGTCTA -3') 및 프라이머 MOB1313 (SEQ ID NO: 17: 5'- CAAGCAGCGGAGACCTTGCAATGC -3')를 사용하여 녹아웃 작제물의 3' 부분을 증폭시켰다. 둘 모두의 증폭 작제물을 Eco RI로 분해시키고 (제한 부위는 프라이머 서열 MOB1337 및 MOB1338에서 진한 글자로 표시됨), T4 DNA 리가아제를 사용하여 후속 리게이션 반응에서 리게이션시켰다. 수득된 리게이션되고 정제된 DNA 서열을 프라이머 MOB1339 및 MOB1313을 사용하는 추가 PCR을 위한 주형으로서 사용하였다. 수득된 증폭 생성물 β1-3GalT2ko
Figure 112009026097670-PCT00006
은 상응하는 cDNA의 초기 5' 부분에서 정지 코돈을 추가로 개시하는 피스코미트렐라 파텐스의 β1,3-갈락토실트랜스퍼라아제 2 유전자의 게놈 서열과 관련하여 148 bp의 결실을 포함하였다. 따라서, 상동 재조합에 의해 피스코미트렐라 파텐스의 게놈내로 통합된 경우 기능이상 β1,3-갈락토실트랜스퍼라아제 유전자가 생성된다. 이러한 녹아웃 작제물을 단독으로 또는 녹아웃 작제물 β1-3GalT1ko (2.1 참조)와 함께 피스코미트렐라 파텐스의 형질전환을 위해 사용하였다.
추정 형질전환 식물의 스크리닝을 적절한 프라이머 조합물을 사용하는 PCR에 의해 수행하였다.
3. MALDI-TOF 질량 분광법
본 명세서에서 대조표준으로서 사용되는 식물 특이적 코어 α1,3 푸코오스 및 β1,2 크실로오스 잔기가 결여된 글리코-엔지니어링된 피스코미트렐라 파텐스의 N-글리칸은 문헌 [Koprivova et al . 2004 Plant Biotechnol. J. 2, 517-523]에 기재된 바와 같이 이러한 스트레인에서 프로세싱된 식물 N-글리칸의 전형적인 구조적 특징을 나타내는데, 즉, 이러한 특징은 ASN-결합 GlcNAc에 대한 α1,3-결합에서 푸코오스의 비존재 및 β만노실 잔기에 대한 β1,2-결합에서 크실로오스의 비존재, 비환원 말단 엘리먼트로서의 루이스 a 에피토프 (GlcNAc에 결합된 α1,4-푸코실 및 β1,3-갈락토실 잔기)이다 (표 1). 대조적으로, 루이스 a 에피토프 (GlcNAc에 결합된 α1,4-푸코실 및 β1,3-갈락토실 잔기) 비존재는 β1,3-갈락토실트랜스퍼라아제 1 유전자 및 β1,3-갈락토실트랜스퍼라아제 2 유전자 둘 모두의 표적화된 유전자 붕괴를 추가로 포함하는 글리코-엔지니어링된 피스코미트렐라 파텐스로부터 단리된 N-글리칸상에서 검출되었다.
피스코미트렐라 파텐스 2중 녹아웃 피스코미트렐라 파텐스 4중 녹아웃
코어 α1,3-푸코오스와 β1,3-크실로오스 잔기가 결여된 N-글리칸 구조 코어 α1,3-푸코오스, β1,3-크실로오스 및 β1,3-갈락토오스 잔기가 결여된 N-글리칸 구조 (결과적으로, 전체로 보아 루이스 a 에피토프가 결여됨)
933 Man 3 (MM) Man 3 (MM)
1096 Man 4 Man 4
1137 MGn/GnM MGn/GnM
1258 Man5 Man5
1299 Man4Gn Man4Gn
1340 GnGn GnGn
1420 Man6 Man6
1582 Man7 Man7
1648 (GF)Gn/Gn(GF)
1744 Man8 Man8
1907 Man9 Man9
1956 (GF)(GF)
표 1: 2중 녹아웃 및 4중 녹아웃 피스코미트렐라 파텐스 스트레인의 N-글리칸. N-글리칸은 동일한 조건 (100 ml 플라스크, 놉 배지)하에서 성장시킨 식물 재료로부터 단리되었다. 잔기, GF = 푸코오스와 갈락토오스 (β1,3-결합)를 포함하는 루이스 a 구조, Gn = N-아세틸글루코사민, M/Man = 만노오스
SEQ ID NO : 1
cDNA β1-3GalTl
Figure 112009026097670-PCT00007
Figure 112009026097670-PCT00008
SEQ ID NO: 2
cDNA Ppβ1-3GalT2
Figure 112009026097670-PCT00009
Figure 112009026097670-PCT00010
SEQ ID NO: 3
게놈 DNA β1-3GalTl
Figure 112009026097670-PCT00011
Figure 112009026097670-PCT00012
Figure 112009026097670-PCT00013
SEQ ID NO: 4
게놈 DNA Ppβ1-3GalT2
Figure 112009026097670-PCT00014
Figure 112009026097670-PCT00015
Figure 112009026097670-PCT00016
SEQ ID NO. 24
cDNA β1,3-GalTl 선택적 스플라이스 변이체
165개 누클레오티드 스플라이스 삽입물은 진한 글자로 나타나 있음 (nt471-635)
Figure 112009026097670-PCT00017
Figure 112009026097670-PCT00018
SEQ ID NO: 25
cDNA β1,3-GalT2 선택적 스플라이스 변이체
150개 누클레오티드 스플라이스 삽입물은 진한 글자로 나타나 있음 (ntl51-300)
Figure 112009026097670-PCT00019
Figure 112009026097670-PCT00020
SEQUENCE LISTING <110> Greenovation Biotech GmbH <120> Galactosyltransferase <130> r51014 <150> EP 06450139.8 <151> 2006-09-29 <160> 27 <170> PatentIn version 3.4 <210> 1 <211> 2957 <212> DNA <213> Physcomitrella patens <220> <221> misc_feature <222> (432)..(432) <223> n is a, c, g, or t <400> 1 agttgtcgat ttgttgtttt tgatatgtaa ggcggttgcc ttcgcgccgt gcttgattgt 60 aattgtaatt caatctggag tgtgagatat atatatatat atatatatag cgagagggag 120 agagaaagag agagagaggg agagagaaag agagagagag ggagagagag agatggcttg 180 tgtatgaggg ccatgcgagg aggaggctgt gtttgttgcc cgaagagatg ggatggttta 240 tgtgtagtgc aggggttgga tgtgaagcac ctgtttgaag gagtctgcga gagtttgaaa 300 ttcggattca gagtgcggcg atcgatggtg caacgttgtt agcagtgatt gttttcgcca 360 acagaactga catcatttgg atttttttta cgcgtggatg tgccctcttt ttaaaaaatt 420 tccgcgtgga anagagacgg gggtttgtaa tggaggcagg ctgtggtcat cacccctagt 480 atagcctgtc aagagagttc aaattcggta atatgaagag ggggtcgaga ctaccggata 540 tggcgtgtac agggcggcaa agaaatgatc ttatcctagt tgcaattgtt tgcttgtttt 600 ttatggtgat attcatccca ccatatctcc aaatgaactc acttccggac attgattctc 660 ctgattcgga caagaaatca tcaagctact cgaaaaaaac cactctagaa gccaatagta 720 aggaggaacg ccgtagtccg gggaatacca caggcgacat tgtttctctg gatgatgtga 780 tagatcgtgc ctggtctgct ggtgccaaag cgtgggaaga actggaaact gcgttaagaa 840 atggagaagg tgtctcaaag aatgtcagta atgccactgc aaatgctgat ccgtgtccag 900 catcactctc tgcagcaggg aaaaagttag acgaattggg taaagtcttc cccttgccct 960 gtggtctaat gtttgggtca gccattactc tgattggaaa gcctcgagag gctcacatgg 1020 agtacaaacc gccaatcgcc agagttgggg aaggcgtctc tccatatgtc atggtttccc 1080 agttcttagt agagttacaa ggcttaaagg tggtgaaagg tgaagatcct cctcgaattc 1140 tacacttgaa tcctcgactt cgtggtgatt ggagctggaa acccatcatt gagcacaaca 1200 cttgttatcg gaaccagtgg ggtcctgccc accgatgcga gggttggcaa gtgcctgaat 1260 acgaagaaac tgttgacggt cttcccaagt gcgagaagtg gcttcgagat gatggcaaga 1320 aacctgcttc aacgcaaaaa tcttggtggc ttggaagatt agttggtcgt tctgacaagg 1380 agacgcttga atgggagtac ccattatctg agggtcggga gttcgttctc accattcgag 1440 caggtgttga agggtttcat gtgactatcg atggtcgtca catcagctcg tttccttatc 1500 gtgtgggtta cgctgtggaa gaaacaacgg ggatattagt agcaggagac gttgatgtga 1560 tgtctatcac agtgacatcc ctacccttaa cacatcctag ctactaccct gagttagttt 1620 tggaatcggg ggacatttgg aaggcaccac ctgtcccagc taccaagata gatttattta 1680 ttgggatcat gtccagcagt aaccattttg cagaacggat ggcagtaagg aagacgtggt 1740 ttcaatctaa agctattcaa tcttcgcagg ccgtggctcg cttctttgta gctctgcatg 1800 caaacaagga tatcaatatg cagttgaaga aggaggcaga ctattatggc gatattataa 1860 tcctgccttt catcgacaga tatgatatag tggttctcaa gaccgttgaa atttgcaagt 1920 ttggggtcca gaatgtcaca gctaagtata ttatgaagtg tgacgatgac acttttgtga 1980 ggattgatag cgttctcgaa gagattcgaa ctacttcaat atcacaaggc ctttacatgg 2040 gtagcatgaa tgagtttcac aggcctcttc gttctggaaa gtgggccgtg actgccgagg 2100 aatggcctga gcgaatttac ccaatatatg ctaatggacc aggatatatc ctgtcagagg 2160 atattgtgca tttcattgtg gagatgaatg agagaggcag tttgcagtta tttaagatgg 2220 aggacgtcag tgttggaata tgggtacgcg aatatgcgaa gcaagtgaag cacgttcaat 2280 acgaacatag catacggttt gctcaagccg gttgtatacc gaaatacttg acagctcatt 2340 accaatcgcc gcgtcaaatg ctgtgtctgt gggacaaggt acttgctcat gacgatggga 2400 aatgctgcaa cttgtgagga aaatacatac aatgaatgtg ttcaacggtc tttaccagac 2460 agaattactt tgggtcggga accagatata gcagacagct cacattcaat tcagccgtgt 2520 tgatccagag gggtaattga tagtttcctt gtcccctacc ctctctagag gtggagatct 2580 tacaacttaa tcaaatgatc ctctgcaatg tcacttgtca caatacttag tatagctcaa 2640 aattggccac ggatattcag gaatgttcat cttgtaaggt cgcagcttgt gagtaaatgg 2700 ttgggtggtg tcgatggcat ggttgcttat caatccctct tagcatcagt gatcgtcaga 2760 atcagtgttt tcgacactcc ccggtggagt attttttcga ttctcttgat tccactcaag 2820 tggtactagc ttatatttag tgaggcctgg aacccaagta gttagttcag tacgtctgcc 2880 ttttgccgaa atgagtagag taatttgtgg cagtagttgg tgaagagaca tggttaggat 2940 ttagtgttca aaatctg 2957 <210> 2 <211> 1902 <212> DNA <213> Physcomitrella patens <400> 2 atgaagaggg gtgtgagacc accgggtgtg ggatgtacag ggcggcaaag aaacaatcta 60 atcatagtgg caatcatatg tttggttttt atagcgatat tcatcccacc gtttcttgaa 120 atgaattcac ttcccgatat tgattcccct gttttggaga agaaagtatc aagctatttg 180 aaaaaagtca ctctggaaac ttacagtaaa gaggaacgcc gtagtccagg gaacacaaca 240 ggtgacattg tttcgctgga agatgtgata gatcgcgcct ggtctgccgg cgccaaagct 300 tgggaagagc tggaaattgc attcagacag ggagaacatt tttcgaagaa ggacaataat 360 gccaatgcaa ctgcagatcc atgcccagca tcactcttta caacaggaaa ggaattggac 420 aatttaggaa gggtcttccc actgccttgt ggtctaatgt ttggatcagc cataactctc 480 attggaaagc cacgggaagc tcacatggag tacaaaccgc caatcgccag agttggggaa 540 ggtgtctctc catacgtcat ggtgtcccag ttcataatgg agttacaggg cttgaaggtg 600 gtaaaaggtg aagatcctcc tagaatcctc cacataaacc ctcgactccg tggtgactgg 660 agctggaaac ccatcattga gcataataca tgctatcgaa accagtgggg cccagctcat 720 cggtgtgaag gttggcaagt acctgaatac gaagaaaccg tggacggtct tcccaagtgc 780 gagaagtggc ttcgaggcga tgacaaaaaa cctgcttcga cccaaaaatc ctggtggctt 840 gggcgattag ttggtcattc cgacaaggag acgcttgaat gggagtatcc attgtccgaa 900 ggtcgggagt ttgttctcac cattcgagca ggtgtagaag gatttcactt aactattgat 960 ggtcggcaca tcagttcgtt cccttatcgt gcgggttatg ctatggaaga agcaacagga 1020 atatcagtgg caggagacgt cgatgttctt tcgatgacag taacatcatt acctttaaca 1080 catcccagct actaccctga gttggttttg gattcgggtg atatctggaa ggcaccacct 1140 ttaccaacag gcaagataga gttatttgtt ggaatcatgt caagcagcaa tcactttgca 1200 gaacgtatgg cagtaagaaa gacgtggttt cagtctctgg ttatccaatc ctcccaagcg 1260 gtggctcgct tctttgtagc tctgcatgca aacaaggata tcaatctgca gctgaagaaa 1320 gaggctgact attacggcga tatgataatt ttacctttca tcgacagata tgatatagtg 1380 gttcttaaga ccgttgaaat tttcaagttt ggggtccaga atgttacagt tagccacgtc 1440 atgaaatgtg acgatgacac atttgtaagg attgacagcg ttcttgaaga gattcgaacg 1500 acgtcagtag gacagggcct ttacatgggc agcatgaatg agtttcatag accccttcgt 1560 tctgggaagt gggccgtgac agttgaggag tggcctgagc gcatttaccc aacatacgca 1620 aatggtccag gatacatcct ttcggaagat attgtgcatt ttatagtgga ggagagcaaa 1680 agaaataatt tgaggttatt taagatggag gacgtcagcg taggtatatg ggtacgcgag 1740 tatgcaaaga tgaagtacgt gcaatacgag catagcgtac ggtttgctca agccggttgt 1800 atacctaact acctgacagc gcactatcaa tcgccgcgtc aaatgctgtg tctgtgggac 1860 aaggtgcttg ctaccaatga cggcaagtgc tgcaccttgt ga 1902 <210> 3 <211> 6187 <212> DNA <213> Physcomitrella patens <400> 3 agttgtcgat ttgttgtttt tgatatgtaa ggcggttgcc ttcgcgccgt gcttgattgt 60 aattgtaatt caatctggag tgtgagatat atatatatat atatatatag cgagagggag 120 agagaaagag agagagaggg agagagaaag agagagagag ggagagagag agatggcttg 180 tgtatgaggg ccatgcgagg aggaggctgt gtttgttgcc cgaagagatg ggatggttta 240 tgtgtagtgc aggggttgga tgtgaagcac ctgtttgaag gagtctgcga gagtttgaaa 300 ttcggattca gagtgcggcg atcgatggtg caacgttgtt agcagtgatt gttttcgcca 360 acagaactga catgtaatga atagtttcga ggcatgatcg cggtttttct caatttgaag 420 gggttgtttg tgggtgatct atgtgcagaa gtgtcactga tggtcagatt cgatgcttga 480 caatttgatc ctttgtgagt gtgcagcatt tggatttttt ttacgcgtgg atgtgccctc 540 tttttaaaaa atttccgcgt ggaaaagaga cgggggtttg taatggaggc aggctgtggt 600 catcacccct agtatagcct gtcaagaggt gagattgaca ccctctttgc tcaattgtag 660 atttttttcc ttctcagggc tgaatcccag tttttttttt tttttttttt tttttttcct 720 tcttcttcaa cttcgagttc gtgtctgtat gaagaagtcc acgggttcaa tgtgttaaga 780 cttaggcatt tccttcagct ttgcctagtg gagatatgcg tattttttga ttgtgaggat 840 tccggttctt agaccatgat tggtttatta cagtggtcat tcaaatccta tttgatttga 900 gaatgtattt acttcgttgt gttgggagat gattgttccc tcgaattcta tgcggtagct 960 accgcttctt tcgtaatgaa gacctttgaa gttcacatag acttcaagaa gaatgctatt 1020 tgtgtttttg tgattgtgtg ttcaagtttg gtgcagtatt gttaaaattt gggtgatgac 1080 taagtacact ttatgcggcc caagtagtca agttgagcat ttgtaaatgc tgaaatgagt 1140 taggctgacg gtaaatgtct gtggatgtag cctagtgatg tatttgatct cggcataatc 1200 ttcagtgatc aatacaaata attcaagaaa gaggggtcaa tgtgttcctg cgagtacctt 1260 cgcatgttca acgtgaactg aattatgtta attaagctga gcaacataga ccttcttgct 1320 gttgacagag ttcaaattcg gtaatatgaa gagggggtcg agactaccgg atatggcgtg 1380 tacagggcgg caaagaaatg atcttatcct agttgcaatt gtttgcttgt tttttatggt 1440 gatattcatc ccaccatatc tccaaatgaa ctcacttccg gacattgatt ctcctgtcga 1500 gaagctagaa gatgatgatg atgctgtctt cacttctcat agacgtcgta accaagagca 1560 gatttcagtt gtcactgaca gtggtcagag acggacagtt atgccatctt cgactggtgc 1620 ggaggacgta acgaatgcac cgtctaaaga ttcacaggtt agaccaaaag tagttgacct 1680 gaaatgcatg tggtaatcaa gcactcttgt ccttattcga gcttttattt cttgccatca 1740 ggtattttta atacttccct agtgtacgct gagtgtctac attgtgtatt gaatgttcct 1800 tagaattgtt tgtttgttta tgtttttatt tttatatttc tgccggctat tgaggaagaa 1860 tacattcaaa ttgttcagga ttcggacaag aaatcatcaa gctactcgaa aaaaaccact 1920 ctagaagcca atagtaagga ggaacgccgt agtccgggga ataccacagg cgacattgtt 1980 tctctggatg atgtgataga tcgtgcctgg tctgctggtg ccaaagcgtg ggaagaactg 2040 gaaactgcgt taagaaatgg agaaggtgtc tcaaagaatg tcagtaatgc cactgcaaat 2100 gctgatccgt gtccagcatc actctctgca gcagggaaaa agttagacga attgggtaaa 2160 gtcttcccct tgccctgtgg tctaatgttt gggtcagcca ttactctgat tggaaagcct 2220 cgagaggctc acatggagta caaaccgcca atcgccagag ttggggaagg cgtctctcca 2280 tatgtcatgg tttcccagtt cttagtagag ttacaaggct taaaggtggt gaaaggtgaa 2340 gatcctcctc gaattctaca cttgaatcct cgacttcgtg gtgattggag ctggaaaccc 2400 atcattgagc acaacacttg ttatcggaac cagtggggtc ctgcccaccg atgcgagggt 2460 tggcaagtgc ctgaatacga agaaactggt gagtgctgat tccaccgcac cagtttgtgt 2520 tttttatgct gacactatgc ttctcaggtt tgtagacgtt aagagctgtg taggttccgt 2580 ggtacttcga attggcactt gccacttctc tcattgtaag ttggtaaatg tctgcatgag 2640 caataaattc caacactgga tgtgtatttt ctgaaatgat tcgttttctt gtagttgacg 2700 gtcttcccaa gtgcgagaag tggcttcgag atgatggcaa gaaacctgct tcaacgcaaa 2760 aatcttggtg gcttggaaga ttagttggtc gttctgacaa ggagacgctt gaatgggagt 2820 acccattatc tgagggtcgg gagttcgttc tcaccattcg agcaggtgtt gaagggtttc 2880 atgtgactat cgatggtcgt cacatcagct cgtttcctta tcgtgtggta agttgaaaat 2940 gctatgttaa catataatgc taaagttgac ctcatgtctt tcttttttct ttttttcttt 3000 tttattttct ggaggggggg ggggtaatgc aaatcaactc taaaatttta gtataccagt 3060 taaattattc atttcaaata taacaataca aatacacatc tttttaattt gtattttttg 3120 atccctctcc tcctctacta aaattaataa tatagcaaca ttttggtact acgaaagttc 3180 atttgtattg cttcatgtcg aagatttatt caaaatttct atccctcgtg tttctgaatt 3240 acattatcaa caatggaata acaataatga cggccccatc cttcagacac caggaacatt 3300 acctatacca gactacgtct gggtaagtct gaagaattaa ttataaccaa gaaactagtt 3360 gtattcactg tttttctttt tacgcccatg cgatttatcg aagtcttctt caatttctta 3420 ttattcttct ttattatttt aagtttttaa ttatttttaa agcaacgaat tgataaataa 3480 ataacatatt aatgttttta actttaaagt ttttttcccg tatttagtat aagatttcgt 3540 caaaacgatt aggtgattag atcgaacatt atctaattgc actctactta tatgatatga 3600 agagtaattt ctcttagcag aagctacatc ctgctatttc cttgggaaac ccgattaggt 3660 ctttcaaatc acccctgctt cctctataag tgtaccatga ttgaggttcg ttagggcatt 3720 agtttaaggg tatcgttgtg atgtgtgtct agttagtctt aaaatctgtg caaatcgatt 3780 cattaacaac tcttttctgt agtgttttgt tttgagaact gctatttatc ttccattgtg 3840 cagggttacg ctgtggaaga aacaacgggg atattagtag caggagacgt tgatgtgatg 3900 tctatcacag tgacatccct acccttaaca catcctagct actaccctga gttagttttg 3960 gaatcggggg acatttggaa ggcaccacct gtcccagcta ccaagataga tttatttatt 4020 gggatcatgt ccagcagtaa ccattttgca gaacggatgg cagtaaggaa gacgtggttt 4080 caatctaaag ctattcaatc ttcgcaggcc gtggctcgct tctttgtagc tctggtactt 4140 cctcctatca aatctcatta actttcgaat tattagtgat catctacata agtggtctgt 4200 tgattgctga aaggtggctg ttgcgtgcct ttgcgtaatg actttccaaa ttcatttaga 4260 acagtggaaa cataatttgt gtgttgcgtt gcgtatttaa ctttttcggt gaatgtctta 4320 ttgaattgtg atgtagcatg caaacaagga tatcaatatg cagttgaaga aggaggcaga 4380 ctattatggc gatattataa tcctgccttt catcgacaga tatgatatag tggttctcaa 4440 gaccgttgaa atttgcaagt ttggggtacg tgtgtcgaat aatggcttca aagctttgtg 4500 acggtgtctg caatttgggg atggtgataa tgaggcttga taccaactga aggttaggtg 4560 acttttaaca ctaggttctg cttactgtgc aggtccagaa tgtcacagct aagtatatta 4620 tgaagtgtga cgatgacact tttgtgagga ttgatagcgt tctcgaagag attcgaacta 4680 cttcaatatc acaaggcctt tacatgggta gcatgaatga gtttcacagg cctcttcgtt 4740 ctggaaagtg ggccgtgact gccgaggtat ttttattttt atttttggct tttgtcggga 4800 acgtgagaga aaccaagatg aatataatca cgatgttgtt ttttattgca aggatttatt 4860 tgatgctctt gagaaatctg tggtagccat accactcaat ttggatacta gatgtgttcg 4920 tccttatgta taaaaatgaa acatgtgctt ttcaggaaga ttaattcagt ttgacttgta 4980 cgtctagtta gattgatggt gatgaaacaa gaggattatc tcgcgaattg acaagtgggt 5040 tgcttggaca ggaatggcct gagcgaattt acccaatata tgctaatgga ccaggatata 5100 tcctgtcaga ggatattgtg catttcattg tggagatgaa tgagagaggc agtttgcagg 5160 taggttcttt tagaactgtg tcgtcgctat tacacgtcta caagttttaa aaattagaaa 5220 ctttcttgtt ggcaaatttc catccaggaa tctttttgca ccgcaagttc gtaataggag 5280 tcggtacatt ctgtgtgtgt gcatcgtttg ttaaatgcat ttttcaattt tcttttgctt 5340 aaaatatctc tgttgtcgat atctcctcat gatcttgcat tgtgaacatg agaagatatg 5400 aaatgtgaac tcaatattct tctatgatca tgtgcagtta tttaagatgg aggacgtcag 5460 tgttggaata tgggtacgcg aatatgcgaa gcaagtgaag cacgttcaat acgaacatag 5520 catacggttt gctcaagccg gttgtatacc gaaatacttg acagctcatt accaatcgcc 5580 gcgtcaaatg ctgtgtctgt gggacaaggt acttgctcat gacgatggga aatgctgcaa 5640 cttgtgagga aaatacatac aatgaatgtg ttcaacggtc tttaccagac agaattactt 5700 tgggtcggga accagatata gcagacagct cacattcaat tcagccgtgt tgatccagag 5760 gggtaattga tagtttcctt gtcccctacc ctctctagag gtggagatct tacaacttaa 5820 tcaaatgatc ctctgcaatg tcacttgtca caatacttag tatagctcaa aattggccac 5880 ggatattcag gaatgttcat cttgtaaggt cgcagcttgt gagtaaatgg ttgggtggtg 5940 tcgatggcat ggttgcttat caatccctct tagcatcagt gatcgtcaga atcagtgttt 6000 tcgacactcc ccggtggagt attttttcga ttctcttgat tccactcaag tggtactagc 6060 ttatatttag tgaggcctgg aacccaagta gttagttcag tacgtctgcc ttttgccgaa 6120 atgagtagag taatttgtgg cagtagttgg tgaagagaca tggttaggat ttagtgttca 6180 aaatctg 6187 <210> 4 <211> 4087 <212> DNA <213> Physcomitrella patens <400> 4 atgaagaggg gtgtgagacc accgggtgtg ggatgtacag ggcggcaaag aaacaatcta 60 atcatagtgg caatcatatg tttggttttt atagcgatat tcatcccacc gtttcttgaa 120 atgaattcac ttcccgatat tgattcccct gtgtataggt tagaaggtat taacttcgct 180 tcacatagac gtcgctatca agaacaggat tcacgtgtca gttacagtgg ctatggacag 240 ccagatatgc catcaactgg tgatgaagac ataacgaaga caccgtctaa agcttcacag 300 gttagtgcag aaatgattgg ttcgccctcg ctatgccagt caggcttact gagttctact 360 tggatcgttc tacttggatc ttttatggct tcctagcagt cggaggtttc tttctggttt 420 gaagaaagcc atgtatggaa cgtttacagg ttttggagaa gaaagtatca agctatttga 480 aaaaagtcac tctggaaact tacagtaaag aggaacgccg tagtccaggg aacacaacag 540 gtgacattgt ttcgctggaa gatgtgatag atcgcgcctg gtctgccggc gccaaagctt 600 gggaagagct ggaaattgca ttcagacagg gagaacattt ttcgaagaag gacaataatg 660 ccaatgcaac tgcagatcca tgcccagcat cactctttac aacaggaaag gaattggaca 720 atttaggaag ggtcttccca ctgccttgtg gtctaatgtt tggatcagcc ataactctca 780 ttggaaagcc acgggaagct cacatggagt acaaaccgcc aatcgccaga gttggggaag 840 gtgtctctcc atacgtcatg gtgtcccagt tcataatgga gttacagggc ttgaaggtgg 900 taaaaggtga agatcctcct agaatcctcc acataaaccc tcgactccgt ggtgactgga 960 gctggaaacc catcattgag cataatacat gctatcgaaa ccagtggggc ccagctcatc 1020 ggtgtgaagg ttggcaagta cctgaatacg aagaaaccgg tgagtgctgg ttccatcaca 1080 ctttatcttt tcatagtgac acggttcttt ttaggtgtac tagtgttgaa agctgtgcat 1140 gttaaatggt aaccctaatc aatcttctcg ctaattttcg cattgcaagg tctccgctgc 1200 ttggacaatc agcactctaa cattggctgt atttactgaa atgattcttt actttgtagt 1260 ggacggtctt cccaagtgcg agaagtggct tcgaggcgat gacaaaaaac ctgcttcgac 1320 ccaaaaatcc tggtggcttg ggcgattagt tggtcattcc gacaaggaga cgcttgaatg 1380 ggagtatcca ttgtccgaag gtcgggagtt tgttctcacc attcgagcag gtgtagaagg 1440 atttcactta actattgatg gtcggcacat cagttcgttc ccttatcgtg cggtgagttg 1500 aaaatactag tttgatatct aatgatgagg tttaccgcag gtatatttgg tctcattgtc 1560 aagtgtgtgt gtgtgtgttg tttttctttt ttccttttca ttttctgaat cataatgata 1620 agaaatcaat tctatgaaac ttagcgtcaa tattttaaag ttttattgtt tttgtttgtt 1680 tttatttttt tgtgttttgt gttttgtgtt tatttcacaa tacaatgtta acaatggaat 1740 agaaacaatg atggtcccac ctcacagaca ccaggtacac tacctacacc agactgcgtc 1800 tgagtaagtt taagaaacag caaccaccaa caatctgatt gtaaattcta aattccttct 1860 ccaccagaaa accatgtgat ccgtcttgca gttctgcttg cactctacct atatgatcca 1920 aagagtaatt cctcttaaca ggagttataa cctgctgggg ttttgaaaat accgatgagt 1980 tcaaattgta aacaaacccc ggatctattt caagggtatg aagggcttag ctttgtttaa 2040 gaataaggtc aagagtatct gtgtggtgag catcccaaaa tggatgcaaa tttgttaatt 2100 ggcaactgtt ttctgtggta tgttttgtga cgcactattt attgtgtatt gtgcagggtt 2160 atgctatgga agaagcaaca ggaatatcag tggcaggaga cgtcgatgtt ctttcgatga 2220 cagtaacatc attaccttta acacatccca gctactaccc tgagttggtt ttggattcgg 2280 gtgatatctg gaaggcacca cctttaccaa caggcaagat agagttattt gttggaatca 2340 tgtcaagcag caatcacttt gcagaacgta tggcagtaag aaagacgtgg tttcagtctc 2400 tggttatcca atcctcccaa gcggtggctc gcttctttgt agctctggta cttgtcatta 2460 tactcttttt tcgtgccaag tatcgtgaac tcgggaatat ttaaaaagtg caaacaacaa 2520 gtgagctgtt aattgctgaa aattggtgtt ataagtcttg atgcagtgac cttccagatt 2580 gaccaagtat atcagacctt agaatttgaa cagcactact tacttaccat ttttaatgaa 2640 tcccttgttg ggttgtgatg cagcatgcaa acaaggatat caatctgcag ctgaagaaag 2700 aggctgacta ttacggcgat atgataattt tacctttcat cgacagatat gatatagtgg 2760 ttcttaagac cgttgaaatt ttcaagtttg gggtaagcga attaaaattt gtagtattta 2820 caaagtaata tttttaaacg ttgtgaggac atctgcaact tgatatattt ctttcgtgag 2880 gttcgatgct gattaaagct taggtgattt aaaagcacgg tgttgcttgc tatgcaggtc 2940 cagaatgtta cagttagcca cgtcatgaaa tgtgacgatg acacatttgt aaggattgac 3000 agcgttcttg aagagattcg aacgacgtca gtaggacagg gcctttacat gggcagcatg 3060 aatgagtttc atagacccct tcgttctggg aagtgggccg tgacagttga ggtaattttc 3120 cctgtaccaa attatccaag attttcgtaa ccattgtgtg ccttattcat ttcttctgaa 3180 atctcaagaa aaatgaaaaa tgcttgagaa acgctcgtag ccgtatcaca ttatgcgaat 3240 tccaaaaaag aatgtggaac aaaagttctt gtgaaaataa ttgatatgtt caaattgtac 3300 acatttatgc actaagataa gatatgtgca aatagtgcct tccagtggtc tagaaaatgc 3360 ttgttttttt ttggaagctt taactttatt tagcttgaac atcttgtttg agggttggtg 3420 accaagtaag aaggtccata caagacaata aatggattgg ttcgtgcatg tacaggagtg 3480 gcctgagcgc atttacccaa catacgcaaa tggtccagga tacatccttt cggaagatat 3540 tgtgcatttt atagtggagg agagcaaaag aaataatttg agggtgcgtt tttcatagct 3600 gtgtcctggt gattaaatgc cccatgttca acattgaaac cttcatcttg gacagttttc 3660 catccatgta tctcctgtca ttataattgc attatagaac tgttcgcgtg tacatttctt 3720 tcctgttcct ctttttcatt ttctttttct cttcttttct tcatttactt ctcctcttgt 3780 cgatgctttc tgttgacctt atattgtgga tatgtatctc ttcagtacta cggagacgat 3840 atgaaacata agtttgatat tcttctgtga taaagcgcag ttatttaaga tggaggacgt 3900 cagcgtaggt atatgggtac gcgagtatgc aaagatgaag tacgtgcaat acgagcatag 3960 cgtacggttt gctcaagccg gttgtatacc taactacctg acagcgcact atcaatcgcc 4020 gcgtcaaatg ctgtgtctgt gggacaaggt gcttgctacc aatgacggca agtgctgcac 4080 cttgtga 4087 <210> 5 <211> 18 <212> DNA <213> Artificial <220> <223> primer <400> 5 ctgaatatcc gtggccaa 18 <210> 6 <211> 29 <212> DNA <213> Artificial <220> <223> primer <400> 6 ttcgagctca tgaagagggg gtcgagact 29 <210> 7 <211> 29 <212> DNA <213> Artificial <220> <223> primer <400> 7 tacgagctca tgaagagggg tgtgagacc 29 <210> 8 <211> 28 <212> DNA <213> Artificial <220> <223> primer <400> 8 gtagagctct cacaaggtgc agcacttg 28 <210> 9 <211> 30 <212> DNA <213> Artificial <220> <223> primer <400> 9 tacggatcca acttcgagtt cgtgtctgta 30 <210> 10 <211> 33 <212> DNA <213> Artificial <220> <223> primer <400> 10 acactaagct tctaatcaat gtccggaagt gag 33 <210> 11 <211> 34 <212> DNA <213> Artificial <220> <223> primer <400> 11 ttagaagctt agtgtacgct gagtgtctac attg 34 <210> 12 <211> 33 <212> DNA <213> Artificial <220> <223> primer <400> 12 cattgtcgac cctacacagc tcttaacgtc tac 33 <210> 13 <211> 1585 <212> DNA <213> Artificial <220> <223> GalT knock-out <400> 13 caacttcgag ttcgtgtctg tatgaagaag tccacgggtt caatgtgtta agacttaggc 60 atttccttca gctttgccta gtggagatat gcgtattttt tgattgtgag gattccggtt 120 cttagaccat gattggttta ttacagtggt cattcaaatc ctatttgatt tgagaatgta 180 tttacttcgt tgtgttggga gatgattgtt ccctcgaatt ctatgcggta gctaccgctt 240 ctttcgtaat gaagaccttt gaagttcaca tagacttcaa gaagaatgct atttgtgttt 300 ttgtgattgt gtgttcaagt ttggtgcagt attgttaaaa tttgggtgat gactaagtac 360 actttatgcg gcccaagtag tcaagttgag catttgtaaa tgctgaaatg agttaggctg 420 acggtaaatg tctgtggatg tagcctagtg atgtatttga tctcggcata atcttcagtg 480 atcaatacaa ataattcaag aaagaggggt caatgtgttc ctgcgagtac cttcgcatgt 540 tcaacgtgaa ctgaattatg ttaattaagc tgagcaacat agaccttctt gctgttgaca 600 gagttcaaat tcggtaatat gaagaggggg tcgagactac cggatatggc gtgtacaggg 660 cggcaaagaa atgatcttat cctagttgca attgtttgct tgttttttat ggtgatattc 720 atcccaccat atctccaaat gaactcactt ccggacattg attagaagct tagtgtacgc 780 tgagtgtcta cattgtgtat tgaatgttcc ttagaattgt ttgtttgttt atgtttttat 840 ttttatattt ctgccggcta ttgaggaaga atacattcaa attgttcagg attcggacaa 900 gaaatcatca agctactcga aaaaaaccac tctagaagcc aatagtaagg aggaacgccg 960 tagtccgggg aataccacag gcgacattgt ttctctggat gatgtgatag atcgtgcctg 1020 gtctgctggt gccaaagcgt gggaagaact ggaaactgcg ttaagaaatg gagaaggtgt 1080 ctcaaagaat gtcagtaatg ccactgcaaa tgctgatccg tgtccagcat cactctctgc 1140 agcagggaaa aagttagacg aattgggtaa agtcttcccc ttgccctgtg gtctaatgtt 1200 tgggtcagcc attactctga ttggaaagcc tcgagaggct cacatggagt acaaaccgcc 1260 aatcgccaga gttggggaag gcgtctctcc atatgtcatg gtttcccagt tcttagtaga 1320 gttacaaggc ttaaaggtgg tgaaaggtga agatcctcct cgaattctac acttgaatcc 1380 tcgacttcgt ggtgattgga gctggaaacc catcattgag cacaacactt gttatcggaa 1440 ccagtggggt cctgcccacc gatgcgaggg ttggcaagtg cctgaatacg aagaaactgg 1500 tgagtgctga ttccaccgca ccagtttgtg ttttttatgc tgacactatg cttctcaggt 1560 ttgtagacgt taagagctgt gtagg 1585 <210> 14 <211> 21 <212> DNA <213> Artificial <220> <223> primer <400> 14 tggcacgata cagtggcatg a 21 <210> 15 <211> 29 <212> DNA <213> Artificial <220> <223> primer <400> 15 tggaattcat tcaagaaacg gtgggatga 29 <210> 16 <211> 27 <212> DNA <213> Artificial <220> <223> primer <400> 16 tgaattccat aacgaagaca ccgtcta 27 <210> 17 <211> 24 <212> DNA <213> Artificial <220> <223> primer <400> 17 caagcagcgg agaccttgca atgc 24 <210> 18 <211> 1656 <212> DNA <213> Artificial <220> <223> GalT knock-out <400> 18 tggcacgata cagtggcatg agatttatcg ctgccaaact gtggacaatg atgtttgaaa 60 cagtctattc atcactggtt ggcaaattct atgtacaggg ctaaaagggc caaactaggc 120 ttaacagcag tgatcgaggt tcttgagcag gatcagcgca agggtaaggt tgcttaggac 180 cgcttcaacc tggtgagtta gacactcaaa ataattacga aacagtgaca tttataagct 240 ttgtgtcgtc actactttga gccttcagag tacatttata ggtggtgact tcgttaatga 300 tgttaaaaat atgaggtgag gacatgtctt cttgtgatta gagtgatcac tttgatcctt 360 ttgcaaacgc tgaaaggagt aagtctgatt gtcaacagaa atgtttttgg ttgcagcctg 420 gctaatatta ttggtctcag ttcaattttc gatggagtgg cgtacaagtg atccagaaag 480 caagaatcat ggatttccta caatttcatt tagattttcg atgttggttg agttatgctg 540 attgatttgg gaaagaggga gcttagcgtt gtatacaggg ttcaaacacc gtaatatgaa 600 gaggggtgtg agaccaccgg gtgtgggatg tacagggcgg caaagaaaca atctaatcat 660 agtggcaatc atatgtttgg tttttatagc gatattcatc ccaccgtttc ttgaatgaat 720 tccataacga agacaccgtc taaagcttca caggttagtg cagaaatgat tggttcgccc 780 tcgctatgcc agtcaggctt actgagttct acttggatcg ttctacttgg atcttttatg 840 gcttcctagc agtcggaggt ttctttctgg tttgaagaaa gccatgtatg gaacgtttac 900 aggttttgga gaagaaagta tcaagctatt tgaaaaaagt cactctggaa acttacagta 960 aagaggaacg ccgtagtcca gggaacacaa caggtgacat tgtttcgctg gaagatgtga 1020 tagatcgcgc ctggtctgcc ggcgccaaag cttgggaaga gctggaaatt gcattcagac 1080 agggagaaca tttttcgaag aaggacaata atgccaatgc aactgcagat ccatgcccag 1140 catcactctt tacaacagga aaggaattgg acaatttagg aagggtcttc ccactgcctt 1200 gtggtctaat gtttggatca gccataactc tcattggaaa gccacgggaa gctcacatgg 1260 agtacaaacc gccaatcgcc agagttgggg aaggtgtctc tccatacgtc atggtgtccc 1320 agttcataat ggagttacag ggcttgaagg tggtaaaagg tgaagatcct cctagaatcc 1380 tccacataaa ccctcgactc cgtggtgact ggagctggaa acccatcatt gagcataata 1440 catgctatcg aaaccagtgg ggcccagctc atcggtgtga aggttggcaa gtacctgaat 1500 acgaagaaac cggtgagtgc tggttccatc acactttatc ttttcatagt gacacggttc 1560 tttttaggtg tactagtgtt gaaagctgtg catgttaaat ggtaacccta atcaatcttc 1620 tcgctaattt tcgcattgca aggtctccgc tgcttg 1656 <210> 19 <211> 634 <212> PRT <213> Physcomitrella patens <400> 19 Met Lys Arg Gly Ser Arg Leu Pro Asp Met Ala Cys Thr Gly Arg Gln 1 5 10 15 Arg Asn Asp Leu Ile Leu Val Ala Ile Val Cys Leu Phe Phe Met Val 20 25 30 Ile Phe Ile Pro Pro Tyr Leu Gln Met Asn Ser Leu Pro Asp Ile Asp 35 40 45 Ser Pro Asp Ser Asp Lys Lys Ser Ser Ser Tyr Ser Lys Lys Thr Thr 50 55 60 Leu Glu Ala Asn Ser Lys Glu Glu Arg Arg Ser Pro Gly Asn Thr Thr 65 70 75 80 Gly Asp Ile Val Ser Leu Asp Asp Val Ile Asp Arg Ala Trp Ser Ala 85 90 95 Gly Ala Lys Ala Trp Glu Glu Leu Glu Thr Ala Leu Arg Asn Gly Glu 100 105 110 Gly Val Ser Lys Asn Val Ser Asn Ala Thr Ala Asn Ala Asp Pro Cys 115 120 125 Pro Ala Ser Leu Ser Ala Ala Gly Lys Lys Leu Asp Glu Leu Gly Lys 130 135 140 Val Phe Pro Leu Pro Cys Gly Leu Met Phe Gly Ser Ala Ile Thr Leu 145 150 155 160 Ile Gly Lys Pro Arg Glu Ala His Met Glu Tyr Lys Pro Pro Ile Ala 165 170 175 Arg Val Gly Glu Gly Val Ser Pro Tyr Val Met Val Ser Gln Phe Leu 180 185 190 Val Glu Leu Gln Gly Leu Lys Val Val Lys Gly Glu Asp Pro Pro Arg 195 200 205 Ile Leu His Leu Asn Pro Arg Leu Arg Gly Asp Trp Ser Trp Lys Pro 210 215 220 Ile Ile Glu His Asn Thr Cys Tyr Arg Asn Gln Trp Gly Pro Ala His 225 230 235 240 Arg Cys Glu Gly Trp Gln Val Pro Glu Tyr Glu Glu Thr Val Asp Gly 245 250 255 Leu Pro Lys Cys Glu Lys Trp Leu Arg Asp Asp Gly Lys Lys Pro Ala 260 265 270 Ser Thr Gln Lys Ser Trp Trp Leu Gly Arg Leu Val Gly Arg Ser Asp 275 280 285 Lys Glu Thr Leu Glu Trp Glu Tyr Pro Leu Ser Glu Gly Arg Glu Phe 290 295 300 Val Leu Thr Ile Arg Ala Gly Val Glu Gly Phe His Val Thr Ile Asp 305 310 315 320 Gly Arg His Ile Ser Ser Phe Pro Tyr Arg Val Gly Tyr Ala Val Glu 325 330 335 Glu Thr Thr Gly Ile Leu Val Ala Gly Asp Val Asp Val Met Ser Ile 340 345 350 Thr Val Thr Ser Leu Pro Leu Thr His Pro Ser Tyr Tyr Pro Glu Leu 355 360 365 Val Leu Glu Ser Gly Asp Ile Trp Lys Ala Pro Pro Val Pro Ala Thr 370 375 380 Lys Ile Asp Leu Phe Ile Gly Ile Met Ser Ser Ser Asn His Phe Ala 385 390 395 400 Glu Arg Met Ala Val Arg Lys Thr Trp Phe Gln Ser Lys Ala Ile Gln 405 410 415 Ser Ser Gln Ala Val Ala Arg Phe Phe Val Ala Leu His Ala Asn Lys 420 425 430 Asp Ile Asn Met Gln Leu Lys Lys Glu Ala Asp Tyr Tyr Gly Asp Ile 435 440 445 Ile Ile Leu Pro Phe Ile Asp Arg Tyr Asp Ile Val Val Leu Lys Thr 450 455 460 Val Glu Ile Cys Lys Phe Gly Val Gln Asn Val Thr Ala Lys Tyr Ile 465 470 475 480 Met Lys Cys Asp Asp Asp Thr Phe Val Arg Ile Asp Ser Val Leu Glu 485 490 495 Glu Ile Arg Thr Thr Ser Ile Ser Gln Gly Leu Tyr Met Gly Ser Met 500 505 510 Asn Glu Phe His Arg Pro Leu Arg Ser Gly Lys Trp Ala Val Thr Ala 515 520 525 Glu Glu Trp Pro Glu Arg Ile Tyr Pro Ile Tyr Ala Asn Gly Pro Gly 530 535 540 Tyr Ile Leu Ser Glu Asp Ile Val His Phe Ile Val Glu Met Asn Glu 545 550 555 560 Arg Gly Ser Leu Gln Leu Phe Lys Met Glu Asp Val Ser Val Gly Ile 565 570 575 Trp Val Arg Glu Tyr Ala Lys Gln Val Lys His Val Gln Tyr Glu His 580 585 590 Ser Ile Arg Phe Ala Gln Ala Gly Cys Ile Pro Lys Tyr Leu Thr Ala 595 600 605 His Tyr Gln Ser Pro Arg Gln Met Leu Cys Leu Trp Asp Lys Val Leu 610 615 620 Ala His Asp Asp Gly Lys Cys Cys Asn Leu 625 630 <210> 20 <211> 633 <212> PRT <213> Physcomitrella patens <400> 20 Met Lys Arg Gly Val Arg Pro Pro Gly Val Gly Cys Thr Gly Arg Gln 1 5 10 15 Arg Asn Asn Leu Ile Ile Val Ala Ile Ile Cys Leu Val Phe Ile Ala 20 25 30 Ile Phe Ile Pro Pro Phe Leu Glu Met Asn Ser Leu Pro Asp Ile Asp 35 40 45 Ser Pro Val Leu Glu Lys Lys Val Ser Ser Tyr Leu Lys Lys Val Thr 50 55 60 Leu Glu Thr Tyr Ser Lys Glu Glu Arg Arg Ser Pro Gly Asn Thr Thr 65 70 75 80 Gly Asp Ile Val Ser Leu Glu Asp Val Ile Asp Arg Ala Trp Ser Ala 85 90 95 Gly Ala Lys Ala Trp Glu Glu Leu Glu Ile Ala Phe Arg Gln Gly Glu 100 105 110 His Phe Ser Lys Lys Asp Asn Asn Ala Asn Ala Thr Ala Asp Pro Cys 115 120 125 Pro Ala Ser Leu Phe Thr Thr Gly Lys Glu Leu Asp Asn Leu Gly Arg 130 135 140 Val Phe Pro Leu Pro Cys Gly Leu Met Phe Gly Ser Ala Ile Thr Leu 145 150 155 160 Ile Gly Lys Pro Arg Glu Ala His Met Glu Tyr Lys Pro Pro Ile Ala 165 170 175 Arg Val Gly Glu Gly Val Ser Pro Tyr Val Met Val Ser Gln Phe Ile 180 185 190 Met Glu Leu Gln Gly Leu Lys Val Val Lys Gly Glu Asp Pro Pro Arg 195 200 205 Ile Leu His Ile Asn Pro Arg Leu Arg Gly Asp Trp Ser Trp Lys Pro 210 215 220 Ile Ile Glu His Asn Thr Cys Tyr Arg Asn Gln Trp Gly Pro Ala His 225 230 235 240 Arg Cys Glu Gly Trp Gln Val Pro Glu Tyr Glu Glu Thr Val Asp Gly 245 250 255 Leu Pro Lys Cys Glu Lys Trp Leu Arg Gly Asp Asp Lys Lys Pro Ala 260 265 270 Ser Thr Gln Lys Ser Trp Trp Leu Gly Arg Leu Val Gly His Ser Asp 275 280 285 Lys Glu Thr Leu Glu Trp Glu Tyr Pro Leu Ser Glu Gly Arg Glu Phe 290 295 300 Val Leu Thr Ile Arg Ala Gly Val Glu Gly Phe His Leu Thr Ile Asp 305 310 315 320 Gly Arg His Ile Ser Ser Phe Pro Tyr Arg Ala Gly Tyr Ala Met Glu 325 330 335 Glu Ala Thr Gly Ile Ser Val Ala Gly Asp Val Asp Val Leu Ser Met 340 345 350 Thr Val Thr Ser Leu Pro Leu Thr His Pro Ser Tyr Tyr Pro Glu Leu 355 360 365 Val Leu Asp Ser Gly Asp Ile Trp Lys Ala Pro Pro Leu Pro Thr Gly 370 375 380 Lys Ile Glu Leu Phe Val Gly Ile Met Ser Ser Ser Asn His Phe Ala 385 390 395 400 Glu Arg Met Ala Val Arg Lys Thr Trp Phe Gln Ser Leu Val Ile Gln 405 410 415 Ser Ser Gln Ala Val Ala Arg Phe Phe Val Ala Leu His Ala Asn Lys 420 425 430 Asp Ile Asn Leu Gln Leu Lys Lys Glu Ala Asp Tyr Tyr Gly Asp Met 435 440 445 Ile Ile Leu Pro Phe Ile Asp Arg Tyr Asp Ile Val Val Leu Lys Thr 450 455 460 Val Glu Ile Phe Lys Phe Gly Val Gln Asn Val Thr Val Ser His Val 465 470 475 480 Met Lys Cys Asp Asp Asp Thr Phe Val Arg Ile Asp Ser Val Leu Glu 485 490 495 Glu Ile Arg Thr Thr Ser Val Gly Gln Gly Leu Tyr Met Gly Ser Met 500 505 510 Asn Glu Phe His Arg Pro Leu Arg Ser Gly Lys Trp Ala Val Thr Val 515 520 525 Glu Glu Trp Pro Glu Arg Ile Tyr Pro Thr Tyr Ala Asn Gly Pro Gly 530 535 540 Tyr Ile Leu Ser Glu Asp Ile Val His Phe Ile Val Glu Glu Ser Lys 545 550 555 560 Arg Asn Asn Leu Arg Leu Phe Lys Met Glu Asp Val Ser Val Gly Ile 565 570 575 Trp Val Arg Glu Tyr Ala Lys Met Lys Tyr Val Gln Tyr Glu His Ser 580 585 590 Val Arg Phe Ala Gln Ala Gly Cys Ile Pro Asn Tyr Leu Thr Ala His 595 600 605 Tyr Gln Ser Pro Arg Gln Met Leu Cys Leu Trp Asp Lys Val Leu Ala 610 615 620 Thr Asn Asp Gly Lys Cys Cys Thr Leu 625 630 <210> 21 <211> 422 <212> PRT <213> homo sapiens <400> 21 Met Leu Gln Trp Arg Arg Arg His Cys Cys Phe Ala Lys Met Thr Trp 1 5 10 15 Asn Ala Lys Arg Ser Leu Phe Arg Thr His Leu Ile Gly Val Leu Ser 20 25 30 Leu Val Phe Leu Phe Ala Met Phe Leu Phe Phe Asn His His Asp Trp 35 40 45 Leu Pro Gly Arg Ala Gly Phe Lys Glu Asn Pro Val Thr Tyr Thr Phe 50 55 60 Arg Gly Phe Arg Ser Thr Lys Ser Glu Thr Asn His Ser Ser Leu Arg 65 70 75 80 Asn Ile Trp Lys Glu Thr Val Pro Gln Thr Leu Arg Pro Gln Thr Ala 85 90 95 Thr Asn Ser Asn Asn Thr Asp Leu Ser Pro Gln Gly Val Thr Gly Leu 100 105 110 Glu Asn Thr Leu Ser Ala Asn Gly Ser Ile Tyr Asn Glu Lys Gly Thr 115 120 125 Gly His Pro Asn Ser Tyr His Phe Lys Tyr Ile Ile Asn Glu Pro Glu 130 135 140 Lys Cys Gln Glu Lys Ser Pro Phe Leu Ile Leu Leu Ile Ala Ala Glu 145 150 155 160 Pro Gly Gln Ile Glu Ala Arg Arg Ala Ile Arg Gln Thr Trp Gly Asn 165 170 175 Glu Ser Leu Ala Pro Gly Ile Gln Ile Thr Arg Ile Phe Leu Leu Gly 180 185 190 Leu Ser Ile Lys Leu Asn Gly Tyr Leu Gln Arg Ala Ile Leu Glu Glu 195 200 205 Ser Arg Gln Tyr His Asp Ile Ile Gln Gln Glu Tyr Leu Asp Thr Tyr 210 215 220 Tyr Asn Leu Thr Ile Lys Thr Leu Met Gly Met Asn Trp Val Ala Thr 225 230 235 240 Tyr Cys Pro His Ile Pro Tyr Val Met Lys Thr Asp Ser Asp Met Phe 245 250 255 Val Asn Thr Glu Tyr Leu Ile Asn Lys Leu Leu Lys Pro Asp Leu Pro 260 265 270 Pro Arg His Asn Tyr Phe Thr Gly Tyr Leu Met Arg Gly Tyr Ala Pro 275 280 285 Asn Arg Asn Lys Asp Ser Lys Trp Tyr Met Pro Pro Asp Leu Tyr Pro 290 295 300 Ser Glu Arg Tyr Pro Val Phe Cys Ser Gly Thr Gly Tyr Val Phe Ser 305 310 315 320 Gly Asp Leu Ala Glu Lys Ile Phe Lys Val Ser Leu Gly Ile Arg Arg 325 330 335 Leu His Leu Glu Asp Val Tyr Val Gly Ile Cys Leu Ala Lys Leu Arg 340 345 350 Ile Asp Pro Val Pro Pro Pro Asn Glu Phe Val Phe Asn His Trp Arg 355 360 365 Val Ser Tyr Ser Ser Cys Lys Tyr Ser His Leu Ile Thr Ser His Gln 370 375 380 Phe Gln Pro Ser Glu Leu Ile Lys Tyr Trp Asn His Leu Gln Gln Asn 385 390 395 400 Lys His Asn Ala Cys Ala Asn Ala Ala Lys Glu Lys Ala Gly Arg Tyr 405 410 415 Arg His Arg Lys Leu His 420 <210> 22 <211> 621 <212> PRT <213> Oryza sativa <400> 22 Met Trp Val Thr Lys Arg Leu Gly Ile Thr Val Leu Ile Val Leu Phe 1 5 10 15 Pro Leu Leu Ile Val His His Leu Ile Val Asn Ser Pro Val Ser Gly 20 25 30 Pro Ser Arg Tyr Gln Val Ile His Ser Asn Leu Leu Gly Trp Leu Ser 35 40 45 Asp Ser Leu Gly Asn Ser Val Ala Gln Asn Pro Asp Asn Thr Pro Val 50 55 60 Glu Val Ile Pro Ala Asp Ala Ser Ala Ser Asn Ser Ser Asp Ser Gly 65 70 75 80 Asn Ser Ser Leu Glu Gly Phe Gln Trp Leu Asn Thr Trp Asn His Met 85 90 95 Lys Gln Leu Thr Asn Ile Ser Asp Gly Leu Pro His Ala Asn Glu Ala 100 105 110 Ile Asp Asn Ala Arg Thr Ala Trp Glu Asn Leu Thr Ile Ser Val His 115 120 125 Asn Ser Thr Ser Lys Gln Ile Lys Lys Glu Arg Gln Cys Pro Tyr Ser 130 135 140 Ile His Arg Met Asn Ala Ser Lys Pro Asp Thr Gly Asp Phe Thr Ile 145 150 155 160 Asp Ile Pro Cys Gly Leu Ile Val Gly Ser Ser Val Thr Ile Ile Gly 165 170 175 Thr Pro Gly Ser Leu Ser Gly Asn Phe Arg Ile Asp Leu Val Gly Thr 180 185 190 Glu Leu Pro Gly Gly Ser Gly Lys Pro Ile Val Leu His Tyr Asp Val 195 200 205 Arg Leu Thr Ser Asp Glu Leu Thr Gly Gly Pro Val Ile Val Gln Asn 210 215 220 Ala Phe Thr Ala Ser Asn Gly Trp Gly Tyr Glu Asp Arg Cys Pro Cys 225 230 235 240 Ser Asn Cys Asn Asn Ala Thr Gln Val Asp Asp Leu Glu Arg Cys Asn 245 250 255 Ser Met Val Gly Arg Glu Glu Lys Arg Ala Ile Asn Ser Lys Gln His 260 265 270 Leu Asn Ala Lys Lys Asp Glu His Pro Ser Thr Tyr Phe Pro Phe Lys 275 280 285 Gln Gly His Leu Ala Ile Ser Thr Leu Arg Ile Gly Leu Glu Gly Ile 290 295 300 His Met Thr Val Asp Gly Lys His Val Thr Ser Phe Pro Tyr Lys Ala 305 310 315 320 Gly Leu Glu Ala Trp Phe Val Thr Glu Val Gly Val Ser Gly Asp Phe 325 330 335 Lys Leu Val Ser Ala Ile Ala Ser Gly Leu Pro Thr Ser Glu Asp Leu 340 345 350 Glu Asn Ser Phe Asp Leu Ala Met Leu Lys Ser Ser Pro Ile Pro Glu 355 360 365 Gly Lys Asp Val Asp Leu Leu Ile Gly Ile Phe Ser Thr Ala Asn Asn 370 375 380 Phe Lys Arg Arg Met Ala Ile Arg Arg Thr Trp Met Gln Tyr Asp Ala 385 390 395 400 Val Arg Glu Gly Ala Val Val Val Arg Phe Phe Val Gly Leu His Thr 405 410 415 Asn Leu Ile Val Asn Lys Glu Leu Trp Asn Glu Ala Arg Thr Tyr Gly 420 425 430 Asp Ile Gln Val Leu Pro Phe Val Asp Tyr Tyr Ser Leu Ile Thr Trp 435 440 445 Lys Thr Leu Ala Ile Cys Ile Tyr Gly Thr Gly Ala Val Ser Ala Lys 450 455 460 Tyr Leu Met Lys Thr Asp Asp Asp Ala Phe Val Arg Val Asp Glu Ile 465 470 475 480 His Ser Ser Val Lys Gln Leu Asn Val Ser His Gly Leu Leu Tyr Gly 485 490 495 Arg Ile Asn Ser Asp Ser Gly Pro His Arg Asn Pro Glu Ser Lys Trp 500 505 510 Tyr Ile Ser Pro Glu Glu Trp Pro Glu Glu Lys Tyr Pro Pro Trp Ala 515 520 525 His Gly Pro Gly Tyr Val Val Ser Gln Asp Ile Ala Lys Glu Ile Asn 530 535 540 Ser Trp Tyr Glu Thr Ser His Leu Lys Met Phe Lys Leu Glu Asp Val 545 550 555 560 Ala Met Gly Ile Trp Ile Ala Glu Met Lys Lys Gly Gly Leu Pro Val 565 570 575 Gln Tyr Lys Thr Asp Glu Arg Ile Asn Ser Asp Gly Cys Asn Asp Gly 580 585 590 Cys Ile Val Ala His Tyr Gln Glu Pro Arg His Met Leu Cys Met Trp 595 600 605 Glu Lys Leu Leu Arg Thr Asn Gln Ala Thr Cys Cys Asn 610 615 620 <210> 23 <211> 643 <212> PRT <213> Arabidopsis thaliana <400> 23 Met Lys Arg Phe Tyr Gly Gly Leu Leu Val Val Ser Met Cys Met Phe 1 5 10 15 Leu Thr Val Tyr Arg Tyr Val Asp Leu Asn Thr Pro Val Glu Lys Pro 20 25 30 Tyr Ile Thr Ala Ala Ala Ser Val Val Val Thr Pro Asn Thr Thr Leu 35 40 45 Pro Met Glu Trp Leu Arg Ile Thr Leu Pro Asp Phe Met Lys Glu Ala 50 55 60 Arg Asn Thr Gln Glu Ala Ile Ser Gly Asp Asp Ile Ala Val Val Ser 65 70 75 80 Gly Leu Phe Val Glu Gln Asn Val Ser Lys Glu Glu Arg Glu Pro Leu 85 90 95 Leu Thr Trp Asn Arg Leu Glu Ser Leu Val Asp Asn Ala Gln Ser Leu 100 105 110 Val Asn Gly Val Asp Ala Ile Lys Glu Ala Gly Ile Val Trp Glu Ser 115 120 125 Leu Val Ser Ala Val Glu Ala Lys Lys Leu Val Asp Val Asn Glu Asn 130 135 140 Gln Thr Arg Lys Gly Lys Glu Glu Leu Cys Pro Gln Phe Leu Ser Lys 145 150 155 160 Met Asn Ala Thr Glu Ala Asp Gly Ser Ser Leu Lys Leu Gln Ile Pro 165 170 175 Cys Gly Leu Thr Gln Gly Ser Ser Ile Thr Val Ile Gly Ile Pro Asp 180 185 190 Gly Leu Val Gly Ser Phe Arg Ile Asp Leu Thr Gly Gln Pro Leu Pro 195 200 205 Gly Glu Pro Asp Pro Pro Ile Ile Val His Tyr Asn Val Arg Leu Leu 210 215 220 Gly Asp Lys Ser Thr Glu Asp Pro Val Ile Val Gln Asn Ser Trp Thr 225 230 235 240 Ala Ser Gln Asp Trp Gly Ala Glu Glu Arg Cys Pro Lys Phe Asp Pro 245 250 255 Asp Met Asn Lys Lys Val Asp Asp Leu Asp Glu Cys Asn Lys Met Val 260 265 270 Gly Gly Glu Ile Asn Arg Thr Ser Ser Thr Ser Leu Gln Ser Asn Thr 275 280 285 Ser Arg Gly Val Pro Val Ala Arg Glu Ala Ser Lys His Glu Lys Tyr 290 295 300 Phe Pro Phe Lys Gln Gly Phe Leu Ser Val Ala Thr Leu Arg Val Gly 305 310 315 320 Thr Glu Gly Met Gln Met Thr Val Asp Gly Lys His Ile Thr Ser Phe 325 330 335 Ala Phe Arg Asp Thr Leu Glu Pro Trp Leu Val Ser Glu Ile Arg Ile 340 345 350 Thr Gly Asp Phe Arg Leu Ile Ser Ile Leu Ala Ser Gly Leu Pro Thr 355 360 365 Ser Glu Glu Ser Glu His Val Val Asp Leu Glu Ala Leu Lys Ser Pro 370 375 380 Thr Leu Ser Pro Leu Arg Pro Leu Asp Leu Val Ile Gly Val Phe Ser 385 390 395 400 Thr Ala Asn Asn Phe Lys Arg Arg Met Ala Val Arg Arg Thr Trp Met 405 410 415 Gln Tyr Asp Asp Val Arg Ser Gly Arg Val Ala Val Arg Phe Phe Val 420 425 430 Gly Leu His Lys Ser Pro Leu Val Asn Leu Glu Leu Trp Asn Glu Ala 435 440 445 Arg Thr Tyr Gly Asp Val Gln Leu Met Pro Phe Val Asp Tyr Tyr Ser 450 455 460 Leu Ile Ser Trp Lys Thr Leu Ala Ile Cys Ile Phe Gly Thr Glu Val 465 470 475 480 Asp Ser Ala Lys Phe Ile Met Lys Thr Asp Asp Asp Ala Phe Val Arg 485 490 495 Val Asp Glu Val Leu Leu Ser Leu Ser Met Thr Asn Asn Thr Arg Gly 500 505 510 Leu Ile Tyr Gly Leu Ile Asn Ser Asp Ser Gln Pro Ile Arg Asn Pro 515 520 525 Asp Ser Lys Trp Tyr Ile Ser Tyr Glu Glu Trp Pro Glu Glu Lys Tyr 530 535 540 Pro Pro Trp Ala His Gly Pro Gly Tyr Ile Val Ser Arg Asp Ile Ala 545 550 555 560 Glu Ser Val Gly Lys Leu Phe Lys Glu Gly Asn Leu Lys Met Phe Lys 565 570 575 Leu Glu Asp Val Ala Met Gly Ile Trp Ile Ala Glu Leu Thr Lys His 580 585 590 Gly Leu Glu Pro His Tyr Glu Asn Asp Gly Arg Ile Ile Ser Asp Gly 595 600 605 Cys Lys Asp Gly Tyr Val Val Ala His Tyr Gln Ser Pro Ala Glu Met 610 615 620 Thr Cys Leu Trp Arg Lys Tyr Gln Glu Thr Lys Arg Ser Leu Cys Cys 625 630 635 640 Arg Glu Trp <210> 24 <211> 2387 <212> DNA <213> Physcomitrella patens <400> 24 atgcgaggag gaggctgtgt ttgttgcccg aagagatggg atggtttatg tgtagtgcag 60 gggttggatg tgaagcacct gtttgaagga gtctgcgaga gtttgaaatt cggattcaga 120 gtgcggcgat cgatggtgca acgttgttag cagtgattgt tttcgccaac agaactgaca 180 tcatttggat tttttttacg cgtggatgtg ccctcttttt aaaaaatttc cgcgtggaaa 240 agagacgggg gtttgtaatg gaggcaggct gtggtcatca cccctagtat agcctgtcaa 300 gagagttcaa attcggtaat atgaagaggg ggtcgagact accggatatg gcgtgtacag 360 ggcggcaaag aaatgatctt atcctagttg caattgtttg cttgtttttt atggtgatat 420 tcatcccacc atatctccaa atgaactcac ttccggacat tgattctcct gtcgagaagc 480 tagaagatga tgatgatgct gtcttcactt ctcatagacg tcgtaaccaa gagcagattt 540 cagttgtcac tgacagtggt cagagacgga cagttatgcc atcttcgact ggtgcggagg 600 acgtaacgaa tgcaccgtct aaagattcac aggattcgga caagaaatca tcaagctact 660 cgaaaaaaac cactctagaa gccaatagta aggaggaacg ccgtagtccg gggaatacca 720 caggcgacat tgtttctctg gatgatgtga tagatcgtgc ctggtctgct ggtgccaaag 780 cgtgggaaga actggaaact gcgttaagaa atggagaagg tgtctcaaag aatgtcagta 840 atgccactgc aaatgctgat ccgtgtccag catcactctc tgcagcaggg aaaaagttag 900 acgaattggg taaagtcttc cccttgccct gtggtctaat gtttgggtca gccattactc 960 tgattggaaa gcctcgagag gctcacatgg agtacaaacc gccaatcgcc agagttgggg 1020 aaggcgtctc tccatatgtc atggtttccc agttcttagt agagttacaa ggcttaaagg 1080 tggtgaaagg tgaagatcct cctcgaattc tacacttgaa tcctcgactt cgtggtgatt 1140 ggagctggaa acccatcatt gagcacaaca cttgttatcg gaaccagtgg ggtcctgccc 1200 accgatgcga gggttggcaa gtgcctgaat acgaagaaac tgttgacggt cttcccaagt 1260 gcgagaagtg gcttcgagat gatggcaaga aacctgcttc aacgcaaaaa tcttggtggc 1320 ttggaagatt agttggtcgt tctgacaagg agacgcttga atgggagtac ccattatctg 1380 agggtcggga gttcgttctc accattcgag caggtgttga agggtttcat gtgactatcg 1440 atggtcgtca catcagctcg tttccttatc gtgtgggtta cgctgtggaa gaaacaacgg 1500 ggatattagt agcaggagac gttgatgtga tgtctatcac agtgacatcc ctacccttaa 1560 cacatcctag ctactaccct gagttagttt tggaatcggg ggacatttgg aaggcaccac 1620 ctgtcccagc taccaagata gatttattta ttgggatcat gtccagcagt aaccattttg 1680 cagaacggat ggcagtaagg aagacgtggt ttcaatctaa agctattcaa tcttcgcagg 1740 ccgtggctcg cttctttgta gctctgcatg caaacaagga tatcaatatg cagttgaaga 1800 aggaggcaga ctattatggc gatattataa tcctgccttt catcgacaga tatgatatag 1860 tggttctcaa gaccgttgaa atttgcaagt ttggggtcca gaatgtcaca gctaagtata 1920 ttatgaagtg tgacgatgac acttttgtga ggattgatag cgttctcgaa gagattcgaa 1980 ctacttcaat atcacaaggc ctttacatgg gtagcatgaa tgagtttcac aggcctcttc 2040 gttctggaaa gtgggccgtg actgccgagg aatggcctga gcgaatttac ccaatatatg 2100 ctaatggacc aggatatatc ctgtcagagg atattgtgca tttcattgtg gagatgaatg 2160 agagaggcag tttgcagtta tttaagatgg aggacgtcag tgttggaata tgggtacgcg 2220 aatatgcgaa gcaagtgaag cacgttcaat acgaacatag catacggttt gctcaagccg 2280 gttgtatacc gaaatacttg acagctcatt accaatcgcc gcgtcaaatg ctgtgtctgt 2340 gggacaaggt acttgctcat gacgatggga aatgctgcaa cttgtga 2387 <210> 25 <211> 2052 <212> DNA <213> Physcomitrella patens <400> 25 atgaagaggg gtgtgagacc accgggtgtg ggatgtacag ggcggcaaag aaacaatcta 60 atcatagtgg caatcatatg tttggttttt atagcgatat tcatcccacc gtttcttgaa 120 atgaattcac ttcccgatat tgattcccct gtgtataggt tagaaggtat taacttcgct 180 tcacatagac gtcgctatca agaacaggat tcacgtgtca gttacagtgg ctatggacag 240 ccagatatgc catcaactgg tgatgaagac ataacgaaga caccgtctaa agcttcacag 300 gttttggaga agaaagtatc aagctatttg aaaaaagtca ctctggaaac ttacagtaaa 360 gaggaacgcc gtagtccagg gaacacaaca ggtgacattg tttcgctgga agatgtgata 420 gatcgcgcct ggtctgccgg cgccaaagct tgggaagagc tggaaattgc attcagacag 480 ggagaacatt tttcgaagaa ggacaataat gccaatgcaa ctgcagatcc atgcccagca 540 tcactcttta caacaggaaa ggaattggac aatttaggaa gggtcttccc actgccttgt 600 ggtctaatgt ttggatcagc cataactctc attggaaagc cacgggaagc tcacatggag 660 tacaaaccgc caatcgccag agttggggaa ggtgtctctc catacgtcat ggtgtcccag 720 ttcataatgg agttacaggg cttgaaggtg gtaaaaggtg aagatcctcc tagaatcctc 780 cacataaacc ctcgactccg tggtgactgg agctggaaac ccatcattga gcataataca 840 tgctatcgaa accagtgggg cccagctcat cggtgtgaag gttggcaagt acctgaatac 900 gaagaaaccg tggacggtct tcccaagtgc gagaagtggc ttcgaggcga tgacaaaaaa 960 cctgcttcga cccaaaaatc ctggtggctt gggcgattag ttggtcattc cgacaaggag 1020 acgcttgaat gggagtatcc attgtccgaa ggtcgggagt ttgttctcac cattcgagca 1080 ggtgtagaag gatttcactt aactattgat ggtcggcaca tcagttcgtt cccttatcgt 1140 gcgggttatg ctatggaaga agcaacagga atatcagtgg caggagacgt cgatgttctt 1200 tcgatgacag taacatcatt acctttaaca catcccagct actaccctga gttggttttg 1260 gattcgggtg atatctggaa ggcaccacct ttaccaacag gcaagataga gttatttgtt 1320 ggaatcatgt caagcagcaa tcactttgca gaacgtatgg cagtaagaaa gacgtggttt 1380 cagtctctgg ttatccaatc ctcccaagcg gtggctcgct tctttgtagc tctgcatgca 1440 aacaaggata tcaatctgca gctgaagaaa gaggctgact attacggcga tatgataatt 1500 ttacctttca tcgacagata tgatatagtg gttcttaaga ccgttgaaat tttcaagttt 1560 ggggtccaga atgttacagt tagccacgtc atgaaatgtg acgatgacac atttgtaagg 1620 attgacagcg ttcttgaaga gattcgaacg acgtcagtag gacagggcct ttacatgggc 1680 agcatgaatg agtttcatag accccttcgt tctgggaagt gggccgtgac agttgaggag 1740 tggcctgagc gcatttaccc aacatacgca aatggtccag gatacatcct ttcggaagat 1800 attgtgcatt ttatagtgga ggagagcaaa agaaataatt tgaggttatt taagatggag 1860 gacgtcagcg taggtatatg ggtacgcgag tatgcaaaga tgaagtacgt gcaatacgag 1920 catagcgtac ggtttgctca agccggttgt atacctaact acctgacagc gcactatcaa 1980 tcgccgcgtc aaatgctgtg tctgtgggac aaggtgcttg ctaccaatga cggcaagtgc 2040 tgcaccttgt ga 2052 <210> 26 <211> 688 <212> PRT <213> Physcomitrella patens <400> 26 Met Lys Arg Gly Ser Arg Leu Pro Asp Met Ala Cys Thr Gly Arg Gln 1 5 10 15 Arg Asn Asp Leu Ile Leu Val Ala Ile Val Cys Leu Phe Phe Met Val 20 25 30 Ile Phe Ile Pro Pro Tyr Leu Gln Met Asn Ser Leu Pro Asp Ile Asp 35 40 45 Ser Pro Val Glu Lys Leu Glu Asp Asp Asp Asp Ala Val Phe Thr Ser 50 55 60 His Arg Arg Arg Asn Gln Glu Gln Ile Ser Val Val Thr Asp Ser Gly 65 70 75 80 Gln Arg Arg Thr Val Met Pro Ser Ser Thr Gly Ala Glu Asp Val Thr 85 90 95 Asn Ala Pro Ser Lys Asp Ser Gln Asp Ser Asp Lys Lys Ser Ser Ser 100 105 110 Tyr Ser Lys Lys Thr Thr Leu Glu Ala Asn Ser Lys Glu Glu Arg Arg 115 120 125 Ser Pro Gly Asn Thr Thr Gly Asp Ile Val Ser Leu Asp Asp Val Ile 130 135 140 Asp Arg Ala Trp Ser Ala Gly Ala Lys Ala Trp Glu Glu Leu Glu Thr 145 150 155 160 Ala Leu Arg Asn Gly Glu Gly Val Ser Lys Asn Val Ser Asn Ala Thr 165 170 175 Ala Asn Ala Asp Pro Cys Pro Ala Ser Leu Ser Ala Ala Gly Lys Lys 180 185 190 Leu Asp Glu Leu Gly Lys Val Phe Pro Leu Pro Cys Gly Leu Met Phe 195 200 205 Gly Ser Ala Ile Thr Leu Ile Gly Lys Pro Arg Glu Ala His Met Glu 210 215 220 Tyr Lys Pro Pro Ile Ala Arg Val Gly Glu Gly Val Ser Pro Tyr Val 225 230 235 240 Met Val Ser Gln Phe Leu Val Glu Leu Gln Gly Leu Lys Val Val Lys 245 250 255 Gly Glu Asp Pro Pro Arg Ile Leu His Leu Asn Pro Arg Leu Arg Gly 260 265 270 Asp Trp Ser Trp Lys Pro Ile Ile Glu His Asn Thr Cys Tyr Arg Asn 275 280 285 Gln Trp Gly Pro Ala His Arg Cys Glu Gly Trp Gln Val Pro Glu Tyr 290 295 300 Glu Glu Thr Val Asp Gly Leu Pro Lys Cys Glu Lys Trp Leu Arg Asp 305 310 315 320 Asp Gly Lys Lys Pro Ala Ser Thr Gln Lys Ser Trp Trp Leu Gly Arg 325 330 335 Leu Val Gly Arg Ser Asp Lys Glu Thr Leu Glu Trp Glu Tyr Pro Leu 340 345 350 Ser Glu Gly Arg Glu Phe Val Leu Thr Ile Arg Ala Gly Val Glu Gly 355 360 365 Phe His Val Thr Ile Asp Gly Arg His Ile Ser Ser Phe Pro Tyr Arg 370 375 380 Val Gly Tyr Ala Val Glu Glu Thr Thr Gly Ile Leu Val Ala Gly Asp 385 390 395 400 Val Asp Val Met Ser Ile Thr Val Thr Ser Leu Pro Leu Thr His Pro 405 410 415 Ser Tyr Tyr Pro Glu Leu Val Leu Glu Ser Gly Asp Ile Trp Lys Ala 420 425 430 Pro Pro Val Pro Ala Thr Lys Ile Asp Leu Phe Ile Gly Ile Met Ser 435 440 445 Ser Ser Asn His Phe Ala Glu Arg Met Ala Val Arg Lys Thr Trp Phe 450 455 460 Gln Ser Lys Ala Ile Gln Ser Ser Gln Ala Val Ala Arg Phe Phe Val 465 470 475 480 Ala Leu His Ala Asn Lys Asp Ile Asn Met Gln Leu Lys Lys Glu Ala 485 490 495 Asp Tyr Tyr Gly Asp Ile Ile Ile Leu Pro Phe Ile Asp Arg Tyr Asp 500 505 510 Ile Val Val Leu Lys Thr Val Glu Ile Cys Lys Phe Gly Val Gln Asn 515 520 525 Val Thr Ala Lys Tyr Ile Met Lys Cys Asp Asp Asp Thr Phe Val Arg 530 535 540 Ile Asp Ser Val Leu Glu Glu Ile Arg Thr Thr Ser Ile Ser Gln Gly 545 550 555 560 Leu Tyr Met Gly Ser Met Asn Glu Phe His Arg Pro Leu Arg Ser Gly 565 570 575 Lys Trp Ala Val Thr Ala Glu Glu Trp Pro Glu Arg Ile Tyr Pro Ile 580 585 590 Tyr Ala Asn Gly Pro Gly Tyr Ile Leu Ser Glu Asp Ile Val His Phe 595 600 605 Ile Val Glu Met Asn Glu Arg Gly Ser Leu Gln Leu Phe Lys Met Glu 610 615 620 Asp Val Ser Val Gly Ile Trp Val Arg Glu Tyr Ala Lys Gln Val Lys 625 630 635 640 His Val Gln Tyr Glu His Ser Ile Arg Phe Ala Gln Ala Gly Cys Ile 645 650 655 Pro Lys Tyr Leu Thr Ala His Tyr Gln Ser Pro Arg Gln Met Leu Cys 660 665 670 Leu Trp Asp Lys Val Leu Ala His Asp Asp Gly Lys Cys Cys Asn Leu 675 680 685 <210> 27 <211> 683 <212> PRT <213> Physcomitrella patens <400> 27 Met Lys Arg Gly Val Arg Pro Pro Gly Val Gly Cys Thr Gly Arg Gln 1 5 10 15 Arg Asn Asn Leu Ile Ile Val Ala Ile Ile Cys Leu Val Phe Ile Ala 20 25 30 Ile Phe Ile Pro Pro Phe Leu Glu Met Asn Ser Leu Pro Asp Ile Asp 35 40 45 Ser Pro Val Tyr Arg Leu Glu Gly Ile Asn Phe Ala Ser His Arg Arg 50 55 60 Arg Tyr Gln Glu Gln Asp Ser Arg Val Ser Tyr Ser Gly Tyr Gly Gln 65 70 75 80 Pro Asp Met Pro Ser Thr Gly Asp Glu Asp Ile Thr Lys Thr Pro Ser 85 90 95 Lys Ala Ser Gln Val Leu Glu Lys Lys Val Ser Ser Tyr Leu Lys Lys 100 105 110 Val Thr Leu Glu Thr Tyr Ser Lys Glu Glu Arg Arg Ser Pro Gly Asn 115 120 125 Thr Thr Gly Asp Ile Val Ser Leu Glu Asp Val Ile Asp Arg Ala Trp 130 135 140 Ser Ala Gly Ala Lys Ala Trp Glu Glu Leu Glu Ile Ala Phe Arg Gln 145 150 155 160 Gly Glu His Phe Ser Lys Lys Asp Asn Asn Ala Asn Ala Thr Ala Asp 165 170 175 Pro Cys Pro Ala Ser Leu Phe Thr Thr Gly Lys Glu Leu Asp Asn Leu 180 185 190 Gly Arg Val Phe Pro Leu Pro Cys Gly Leu Met Phe Gly Ser Ala Ile 195 200 205 Thr Leu Ile Gly Lys Pro Arg Glu Ala His Met Glu Tyr Lys Pro Pro 210 215 220 Ile Ala Arg Val Gly Glu Gly Val Ser Pro Tyr Val Met Val Ser Gln 225 230 235 240 Phe Ile Met Glu Leu Gln Gly Leu Lys Val Val Lys Gly Glu Asp Pro 245 250 255 Pro Arg Ile Leu His Ile Asn Pro Arg Leu Arg Gly Asp Trp Ser Trp 260 265 270 Lys Pro Ile Ile Glu His Asn Thr Cys Tyr Arg Asn Gln Trp Gly Pro 275 280 285 Ala His Arg Cys Glu Gly Trp Gln Val Pro Glu Tyr Glu Glu Thr Val 290 295 300 Asp Gly Leu Pro Lys Cys Glu Lys Trp Leu Arg Gly Asp Asp Lys Lys 305 310 315 320 Pro Ala Ser Thr Gln Lys Ser Trp Trp Leu Gly Arg Leu Val Gly His 325 330 335 Ser Asp Lys Glu Thr Leu Glu Trp Glu Tyr Pro Leu Ser Glu Gly Arg 340 345 350 Glu Phe Val Leu Thr Ile Arg Ala Gly Val Glu Gly Phe His Leu Thr 355 360 365 Ile Asp Gly Arg His Ile Ser Ser Phe Pro Tyr Arg Ala Gly Tyr Ala 370 375 380 Met Glu Glu Ala Thr Gly Ile Ser Val Ala Gly Asp Val Asp Val Leu 385 390 395 400 Ser Met Thr Val Thr Ser Leu Pro Leu Thr His Pro Ser Tyr Tyr Pro 405 410 415 Glu Leu Val Leu Asp Ser Gly Asp Ile Trp Lys Ala Pro Pro Leu Pro 420 425 430 Thr Gly Lys Ile Glu Leu Phe Val Gly Ile Met Ser Ser Ser Asn His 435 440 445 Phe Ala Glu Arg Met Ala Val Arg Lys Thr Trp Phe Gln Ser Leu Val 450 455 460 Ile Gln Ser Ser Gln Ala Val Ala Arg Phe Phe Val Ala Leu His Ala 465 470 475 480 Asn Lys Asp Ile Asn Leu Gln Leu Lys Lys Glu Ala Asp Tyr Tyr Gly 485 490 495 Asp Met Ile Ile Leu Pro Phe Ile Asp Arg Tyr Asp Ile Val Val Leu 500 505 510 Lys Thr Val Glu Ile Phe Lys Phe Gly Val Gln Asn Val Thr Val Ser 515 520 525 His Val Met Lys Cys Asp Asp Asp Thr Phe Val Arg Ile Asp Ser Val 530 535 540 Leu Glu Glu Ile Arg Thr Thr Ser Val Gly Gln Gly Leu Tyr Met Gly 545 550 555 560 Ser Met Asn Glu Phe His Arg Pro Leu Arg Ser Gly Lys Trp Ala Val 565 570 575 Thr Val Glu Glu Trp Pro Glu Arg Ile Tyr Pro Thr Tyr Ala Asn Gly 580 585 590 Pro Gly Tyr Ile Leu Ser Glu Asp Ile Val His Phe Ile Val Glu Glu 595 600 605 Ser Lys Arg Asn Asn Leu Arg Leu Phe Lys Met Glu Asp Val Ser Val 610 615 620 Gly Ile Trp Val Arg Glu Tyr Ala Lys Met Lys Tyr Val Gln Tyr Glu 625 630 635 640 His Ser Val Arg Phe Ala Gln Ala Gly Cys Ile Pro Asn Tyr Leu Thr 645 650 655 Ala His Tyr Gln Ser Pro Arg Gln Met Leu Cys Leu Trp Asp Lys Val 660 665 670 Leu Ala Thr Asn Asp Gly Lys Cys Cys Thr Leu 675 680

Claims (32)

  1. 염기쌍 513 내지 염기쌍 2417의 오픈 리딩 프레임(open reading frame)을 지닌 SEQ ID NO: 1에 따른 서열, 염기쌍 1 내지 염기쌍 1902의 오픈 리딩 프레임을 지닌 SEQ ID NO: 2에 따른 서열, 염기쌍 321 내지 염기쌍 2387의 오픈 리딩 프레임을 지닌 SEQ ID NO: 24에 따른 서열 또는 염기쌍 1 내지 염기쌍 2052의 오픈 리딩 프레임을 지닌 SEQ ID NO: 25에 따른 서열을 포함하거나, 상기 서열 중 하나 이상과 50% 이상의 동일성을 지니거나, 유전 암호로 인해 상기 서열로 축퇴(degenerated)되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성 (β1,3-GalT 활성)을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자.
  2. SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 24 또는 SEQ ID NO: 25 중 어느 하나에 따른 서열과 20% 이상의 전체 동일성(overall identity)을 지니며, SEQ ID NO: 19 또는 SEQ ID NO: 20의 단백질의 아미노산 387-392 (DLFIGI 또는 ELFVGI), 402-409 (RMAVRKTW), 425-428 (FVAL), 455-465 (DRYDIVVLKTV), 479-489 (YIMKCDDDTFV 또는 HVMKCDDDTFV), 536-548 (YPIYANGPGYILS 또는 YPTYANGPGYILS) 및 570-576 (EDVSVGI)를 엔코딩하는 SEQ ID NO: 1 또는 SEQ ID NO: 2의 7개의 보존된 도메인의 서열과 80% 이상의 동일성을 지닌 서열을 포함하거나, 유전 암호로 인해 상기 서열로 축퇴되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토 실트랜스퍼라아제 활성을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자.
  3. SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 24 또는 SEQ ID NO: 25 중 어느 하나에 따른 서열과 20% 이상의 전체 동일성을 지니며, SEQ ID NO: 19 또는 SEQ ID NO: 20의 단백질의 아미노산 388 (L), 402 (R), 404 (A), 406 (R), 408 (T), 409 (W), 425 (F), 455 (D), 457 (Y), 463 (K), 464 (T), 481 (M), 482 (K), 484 (D), 486 (D), 488 (F), 489 (V), 536 (Y), 537 (P), 542 (G), 544 (G), 545 (Y), 548 (S), 570 (E), 571 (D), 572 (V), 575 (G) 및 576 (I)으로부터 선택된 SEQ ID NO: 1 또는 SEQ ID NO: 2의 7개의 보존된 도메인의 보존된 아미노산의 95% 이상을 엔코딩하는 서열을 포함하거나, 유전 암호로 인해 상기 서열로 축퇴되는 서열을 포함하는 DNA 분자로서, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자.
  4. 제 1항 내지 제 3항 중 어느 한 항에 있어서, GlcNAc-β1,3-갈락토실트랜스퍼라아제 활성을 지닌 단백질을 코딩하는 DNA 분자.
  5. 제 1항 내지 제 4항 중 어느 한 항에 있어서, 갈락토오스를 UDP-갈락토오스로부터 비환원(non-reducing) GlcNAc 잔기로 전달하는 것과 관련된 활성을 지닌 단백질을 코딩하는 DNA 분자.
  6. 제 1항 내지 제 5항 중 어느 한 항에 있어서, 갈락토오스를 UDP-갈락토오스로부터 단백질에 결합된 N-글리칸 구조의 비환원 GlcNAc 잔기로 전달하는 것과 관련된 활성을 지닌 단백질을 코딩하는 DNA 분자.
  7. 제 1항 내지 제 6항 중 어느 한 항에 있어서, SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 24 또는 SEQ ID NO: 25에 따른 서열 중 하나와 70% 이상, 바람직하게는 80% 이상, 특히 90% 이상의 동일성을 지니거나, 유전 암호로 인해 상기 서열로 축퇴되거나, 상기 서열에 상보적인 DNA 분자.
  8. 제 1항 내지 제 7항 중 어느 한 항에 있어서, 염기쌍 513 내지 염기쌍 2417의 오픈 리딩 프레임을 지닌 SEQ ID NO: 1에 따른 서열 또는 염기쌍 1 내지 염기쌍 1902의 오픈 리딩 프레임을 지닌 SEQ ID NO: 2에 따른 서열을 포함하거나, 상기 서열 중 하나 이상과 50% 이상의 동일성을 지니거나, 유전 암호로 인해 상기 서열로 축퇴되는 서열을 포함하며, 이러한 서열이 β1,3-갈락토실트랜스퍼라아제 활성 (β1,3-GalT 활성)을 지닌 식물 단백질을 코딩하는 서열이거나 이에 상보적인 서열인 DNA 분자.
  9. 제 1항 내지 제 8항 중 어느 한 항에 따른 DNA 분자의 부분 서열을 포함하며 SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 24 또는 SEQ ID NO: 25에 따른 서열과 80% 이상의 동일성을 지니거나, 이에 상보적인 서열을 포함하고, 크기가 15 내지 300개 염기쌍, 바람직하게는 20 내지 50개 염기쌍인 DNA분자.
  10. 제 1항 내지 제 9항 중 어느 한 항에 있어서, 검출가능한 마커 물질과 공유결합되어 있는 DNA 분자.
  11. 제 1항 내지 제 10항 중 어느 한 항에 따른 DNA 분자를 포함하는 발현 벡터.
  12. 프로모터에 대해 역배향된 제 1항 내지 제 10항 중 어느 한 항에 따른 DNA 분자를 포함하는 발현 벡터.
  13. 각각의 서열 절편(section)이 10개 내지 15개 이상의 염기쌍 길이를 지니는 두 개의 서열 절편을 지니는 리보자임을 코딩하는 DNA 분자로서, 상기 두 개의 서열 절편은 상기 리보자임이 천연 β1,3-GalT 분자에 의해 전사되는 mRNA와 복합체를 형성하여 이를 절단하도록 1항 내지 제 10항 중 어느 한 항에 따른 DNA 분자의 서열 절편에 상보적인 DNA 분자.
  14. 제 13항에 따른 DNA 분자를 포함하는 생물학적 기능성 벡터.
  15. 제 1항 내지 제 8항 중 어느 한 항에 따른 DNA 분자를 벡터내로 클로닝한 후, 이를 숙주 세포, 숙주 조직 또는 숙주내로 트랜스펙션시키고, 트랙스펙션된 숙주 세포를 선별하고 증폭시켜서 활성 β1,3-갈락토실트랜스퍼라아제를 발현하는 세포주를 수득하는 것을 포함하여, β1,3-갈락토실트랜스퍼라아제를 클로닝하는 방법.
  16. 적어도 트랜스멤브레인(transmembrane) 엔코딩 서열이 결여된 제 1항 내지 제 8항 중 어느 한 항에 따른 DNA 분자를 벡터내로 클로닝한 후, 이를 숙주 세포, 숙주 조직 또는 숙주내로 트랜스펙션시키고, 트랙스펙션된 숙주 세포를 선별하고 증폭시켜서 활성 β1,3-갈락토실트랜스퍼라아제를 발현하는 세포주를 수득하는 것을 포함하여, β1,3-갈락토실트랜스퍼라아제를 클로닝하는 방법.
  17. 제 15항 또는 제 16항의 방법에 따라 발현된 단백질로서, β1,3-갈락토실트랜스퍼라아제와 관련하여 활성이고, 시험관내 또는 생체내에서의 당단백질의 N-글리칸의 신장을 위해 사용되는 단백질.
  18. 제 1항 내지 제 8항 중 어느 한 항에 따른 서열을 지닌 DNA 서열을 엔코딩하는 트랜스멤브레인 도메인으로서, 상기 엔코딩된 트랜스멤브레인 도메인이 이종 단백질, 특히 바람직하게는 효소, 더욱 특히 바람직하게는 단백질의 번역후 수식(posttranslational modification)에 관여하는 효소에 작동적으로 결합되는 트랜스멤브레인 도메인.
  19. SEQ ID NO: 3 또는 SEQ ID NO: 4에 따른 핵산 서열을 지닌 분자를 포함하는 DNA 벡터.
  20. β1,3-갈락토실트랜스퍼라아제의 생성이 각각 억제되거나 완전히 정지된, 재조합 숙주 세포, 특히 식물 세포, 또는 식물을 각각 제조하는 방법으로서, 제 11항, 제 12항, 제 14항 또는 제 19항에 따른 벡터 중 하나 이상, 또는 결실, 삽입 및/또는 치환 돌연변이를 포함하는 제 1항 내지 제 7항 중 어느 한 항에 따른 DNA 분자를 포함하는 벡터를 각각 상기 숙주 세포, 또는 식물의 게놈내로 삽입시키는 것을 포함하여, β1,3-갈락토실트랜스퍼라아제의 생성이 각각 억제되거나 완전히 정지된, 재조합 숙주 세포, 특히 식물 세포, 또는 식물을 각각 제조하는 방법.
  21. 재조합 숙주 세포, 특히 식물 세포, 또는 식물을 각각 제조하는 방법으로서, 결실, 삽입 및/또는 치환 돌연변이를 포함하는 제 1항 내지 제 10항 중 어느 한 항에 따른 DNA 분자를 돌연변이되지 않은 상동 서열의 위치에서 각각 상기 숙주 세포, 또는 식물의 게놈내로 삽입시키는 것을 포함하여, 재조합 숙주 세포, 특히 식물 세포, 또는 식물을 각각 제조하는 방법.
  22. 제 11항, 제 12항, 제 14항 또는 제 19항에 따른 벡터 중 하나 이상, 또는 결실, 삽입 및/또는 치환 돌연변이를 포함하는 제 1항 내지 제 10항 중 어느 한 항 에 따른 DNA 분자를 포함하는 벡터를 각각 포함하는 재조합 식물 또는 식물 세포로서, 내인성 β1,3-갈락토실트랜스퍼라아제 생성이 각각 억제되거나 완전히 정지된 재조합 식물 또는 식물 세포.
  23. 결실, 삽입 및/또는 치환 돌연변이를 포함하는 제 1항 내지 제 10항 중 어느 한 항에 따른 DNA 분자를 돌연변이되지 않은 상동 서열의 부위에서 각각 세포 또는 식물의 게놈에 포함하는 재조합 식물 또는 식물 세포로서, 내인성 β1,3-갈락토실트랜스퍼라아제 생성이 각각 억제되거나 완전히 정지된 재조합 식물 또는 식물 세포.
  24. β1,3-갈락토실트랜스퍼라아제를 코딩하는 제 1항 내지 제 9항 중 어느 한 항에 따른 DNA 분자의 서열에 상보적인 염기 서열을 포함하는 펩티드 핵산 (PNA) 분자.
  25. β1,3-갈락토실트랜스퍼라아제를 코딩하는 제 1항 내지 제 9항 중 어느 한 항에 따른 DNA 분자의 서열에 상응하는 염기 서열을 포함하는 펩티드 핵산 (PNA) 분자.
  26. 제 24항 또는 제 25항에 따른 PNA 분자를 세포내로 삽입시키는 것을 포함하여, 각각 전사 또는 번역 수준에서 β1,3-갈락토실트랜스퍼라아제의 발현이 차단된 식물, 또는 세포, 특히 식물 세포를 각각 생성시키는 방법.
  27. 제 22항 또는 제 23항에 따른 각각의 재조합 식물, 식물 세포 또는 식물 조직, 또는 제 24항 또는 제 25항에 따른 PNA 분자가 삽입되어 각각 전사 또는 번역 수준에서 β1,3-갈락토실트랜스퍼라아제의 발현이 차단된 각각의 식물, 식물 조직 또는 세포를 당단백질을 코딩하는 유전자로 트랜스펙션시킴으로써 재조합 당단백질을 발현시키는 것을 포함하여 재조합 당단백질을 생성시키는 방법.
  28. 제 22항 또는 제 23항에 따른 각각의 재조합 식물, 식물 세포 또는 식물 조직, 또는 제 24항 또는 제 25항에 따른 PNA 분자가 삽입되어 각각 전사 또는 번역 수준에서 β1,3-갈락토실트랜스퍼라아제의 발현이 차단된 각각의 식물, 식물 조직 또는 세포를 당단백질을 코딩하는 유전자로 트랜스펙션시킴으로써 재조합 당단백질을 발현시키는 것을 포함하여 재조합 인간 당단백질을 생성시키는 방법.
  29. 제 22항 또는 제 23항에 따른 각각의 재조합 식물, 식물 세포 또는 식물 조직, 또는 제 24항 또는 제 25항에 따른 PNA 분자가 삽입되어 각각 전사 또는 번역 수준에서 β1,3-갈락토실트랜스퍼라아제의 발현이 차단된 각각의 식물, 식물 조직 또는 세포를 당단백질을 코딩하는 유전자로 트랜스펙션시킴으로써 재조합 당단백질을 발현시키는 것을 포함하여 의약용 재조합 인간 당단백질을 생성시키는 방법.
  30. 제 15항 또는 제 16항에 따라 클로닝된 활성 β1,3-갈락토실트랜스퍼라아제를 사용하여 당단백질의 N-글리칸(N-glycan)을 시험관내 또는 생체내 신장시키는 것을 포함하여 N-글리칸들(N-glycans)을 지닌 당단백질을 생성시키는 방법.
  31. β1,3-갈락토실트랜스퍼라아제를 코딩하는 DNA 분자에 결합하는 제 10항에 따른 DNA 분자를 샘플에 첨가하는 것을 포함하여, 샘플에서 β1,3-갈락토실트랜스퍼라아제를 코딩하는 DNA 분자를 선택하는 방법.
  32. 제 31항에 있어서, 상기 샘플이 식물체의 게놈 DNA를 포함하는 방법.
KR1020097008893A 2006-09-29 2007-09-28 갈락토실트랜스퍼라아제 KR20090077059A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP06450139A EP1905825A1 (en) 2006-09-29 2006-09-29 Galactosyltransferase
EP06450139.8 2006-09-29

Publications (1)

Publication Number Publication Date
KR20090077059A true KR20090077059A (ko) 2009-07-14

Family

ID=37744790

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097008893A KR20090077059A (ko) 2006-09-29 2007-09-28 갈락토실트랜스퍼라아제

Country Status (14)

Country Link
US (1) US20100050292A1 (ko)
EP (2) EP1905825A1 (ko)
JP (1) JP2010504741A (ko)
KR (1) KR20090077059A (ko)
CN (1) CN101522891A (ko)
AT (1) ATE513906T1 (ko)
AU (1) AU2007302184B2 (ko)
CA (1) CA2664767A1 (ko)
DK (1) DK2066790T3 (ko)
ES (1) ES2366975T3 (ko)
PL (1) PL2066790T3 (ko)
PT (1) PT2066790E (ko)
SI (1) SI2066790T1 (ko)
WO (1) WO2008037490A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102302690B1 (ko) 2021-03-17 2021-09-15 주식회사 민영승강기 화물엘리베이터의 카박스와 로프 연결장치

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102703399B (zh) * 2012-06-13 2014-06-11 北京京蒙高科干细胞技术有限公司 一种ɑ-1,3半乳糖基转移酶融合蛋白及制备方法
CN106119185A (zh) * 2016-08-30 2016-11-16 中国科学院昆明植物研究所 一种小立碗藓原生质体的制备方法
US11591376B2 (en) * 2017-10-11 2023-02-28 Wisconsin Alumni Research Foundation (Warf) Over-expression of AZF1 improves the rate of anaerobic xylose fermentation in engineered yeast strains

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT1032674E (pt) * 1997-11-21 2007-03-30 Serono Genetics Inst Sa Sequência genómica e polipéptidos (de chlamydia pneumoniae), seus fragmentos e suas utilizações, em particular para o diagnóstico, prevenção e tratamento de infacção
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
US20100293669A2 (en) * 1999-05-06 2010-11-18 Jingdong Liu Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
DE19947290A1 (de) 1999-10-01 2001-04-19 Greenovation Pflanzenbiotechno Verfahren zur Herstellung proteinöser Substanzen
JP2002199885A (ja) * 2001-01-05 2002-07-16 Kyowa Hakko Kogyo Co Ltd β1,3−ガラクトース転移酵素および該酵素をコードするDNA
CA2445295C (en) * 2001-04-23 2009-06-30 Kyowa Hakko Kogyo Co., Ltd. .beta.1,3-galactosyltransferase and dna encoding the same
DE60213626T2 (de) * 2002-12-20 2007-08-09 Greenovation Biotech Gmbh Verfahren zur Herstellung von glykosylierten Proteinen in Bryophyten Zellen
WO2005017176A2 (en) * 2003-07-23 2005-02-24 Sequenom, Inc. Methods for identifying risk of melanoma and treatments thereof
EP2316953A3 (en) * 2003-10-20 2011-10-05 CropDesign N.V. Identification of novel E2F target genes and use thereof
US7884264B2 (en) * 2006-01-17 2011-02-08 Biolex Therapeutics, Inc. Compositions and methods for inhibition of fucosyltransferase and xylosyltransferase expression in duckweed plants

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102302690B1 (ko) 2021-03-17 2021-09-15 주식회사 민영승강기 화물엘리베이터의 카박스와 로프 연결장치

Also Published As

Publication number Publication date
SI2066790T1 (sl) 2011-10-28
JP2010504741A (ja) 2010-02-18
ES2366975T3 (es) 2011-10-27
WO2008037490A2 (en) 2008-04-03
PL2066790T3 (pl) 2011-11-30
WO2008037490A3 (en) 2008-05-15
ATE513906T1 (de) 2011-07-15
CN101522891A (zh) 2009-09-02
EP1905825A1 (en) 2008-04-02
EP2066790B1 (en) 2011-06-22
PT2066790E (pt) 2011-09-05
EP2066790A2 (en) 2009-06-10
US20100050292A1 (en) 2010-02-25
AU2007302184B2 (en) 2013-10-10
DK2066790T3 (da) 2011-10-10
AU2007302184A1 (en) 2008-04-03
CA2664767A1 (en) 2008-04-03

Similar Documents

Publication Publication Date Title
CA2549932C (en) Production of heterologous glycosylated proteins in bryophyte cells
KR101196023B1 (ko) 식물에서 글리칸 프로세싱의 최적화
CA2614998C (en) Production of sialylated glycoproteins in bryophytes
US20070186311A1 (en) BETA 1,2-xylosyltransferase-gene from arabidopsis
IL144777A (en) Focosil transfer gene
EP2066790B1 (en) Galactosyltransferase
CA3040017A1 (en) Production of polysialylated polypeptides in plants and plant cells
EP1431394B1 (en) Method to produce heterologous glycosylated proteins in bryophyte cells
EP1904636B1 (en) Improvements in or relating to protein production

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application