KR101070518B1 - 식물에서의 gntⅲ 발현 - Google Patents

식물에서의 gntⅲ 발현 Download PDF

Info

Publication number
KR101070518B1
KR101070518B1 KR1020047014704A KR20047014704A KR101070518B1 KR 101070518 B1 KR101070518 B1 KR 101070518B1 KR 1020047014704 A KR1020047014704 A KR 1020047014704A KR 20047014704 A KR20047014704 A KR 20047014704A KR 101070518 B1 KR101070518 B1 KR 101070518B1
Authority
KR
South Korea
Prior art keywords
plant
gntiii
nucleic acid
sequence
host system
Prior art date
Application number
KR1020047014704A
Other languages
English (en)
Other versions
KR20040091147A (ko
Inventor
헨드리쿠스 안토니우스 코르넬루스 바커
디오니시우스 엘리사베트 안토니우스 플로라크
헨드리크 얀 보쉬
Original Assignee
스티칭 디엔스트 랜드보위쿤디그 온데조에크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스티칭 디엔스트 랜드보위쿤디그 온데조에크 filed Critical 스티칭 디엔스트 랜드보위쿤디그 온데조에크
Publication of KR20040091147A publication Critical patent/KR20040091147A/ko
Application granted granted Critical
Publication of KR101070518B1 publication Critical patent/KR101070518B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/02Peptides of undefined number of amino acids; Derivatives thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Abstract

본 발명은, 재조합 생물제약학적 단백질의 생산에 비용 효율적이고 오염에 안전한 제작소로서 사용되는 트랜스제닉 식물에서의 당단백질 처리 분야, 및 이러한 당단백질을 포함하는 제약 조성물에 관한 것이다. 본 발명은, 식물에 대개 존재하지 않는 포유동물 GnTIII을 제공하는 기능적 포유동물 효소를 포함하는 식물을 제공하며, 상기 식물은 식물에 대개 존재하지 않는 적어도 두번째 포유동물 단백질 또는 그의 기능적 단편을 추가로 포함한다.

Description

식물에서의 GNTⅢ 발현 {GNTIII EXPRESSION IN PLANTS}
본 발명은, 식물에서 포유동물 N-아세틸글루코사미닐-트랜스퍼라제 III(GnTIII) 효소의 발현 및, 이등분된 올리고사카라이드와 증가된 양의 말단 G1cNAc 잔기를 갖는 당단백질의 제조에 있어서의 그의 용도에 관한 것이다. 또한, 본 발명은 GnTIII의 촉매 부위 및 골지체의 막횡단 도메인 및(또는) 소포체(ER) 단백질 또는 ER 체류 신호를 포함하는 변형 GNTIII을 포함하는 하이브리드 단백질, 및 면역원성 크실로스 및 푸코스 잔기가 결여된 올리고사카라이드를 갖는 당단백질의 제조에 있어서의 그의 용도에 관한 것이다.
N-아세틸글루코사미닐트랜스퍼라제(GlcNAc-트랜스퍼라제)는, 전형적인 N 결합 글리칸의 트리만노실 코어 구조의 만노스 중 하나에 N아세틸글루코사민(GlcNAc) 잔기를 첨가하는 "분지화" 효소이다. 서열 상동성을 거의 또는 완전히 갖지 않는 6개 이상의 GlcNAc-트랜스퍼라제가 공지되어 있다. 상이한 단백질 구조 이외에도, 이러한 GlcNAc트랜스퍼라제는 또한 상이한 효소 성질 및 기질 특이성도 갖는다. 이들 모두는 세포질 도메인, 막횡단 앵커(anchor), 및 촉매 도메인을 갖는 세포외 줄기 영역을 갖는 전형적인 유형 II 막횡단 단백질이다.
주목받는 G1cNAc-트랜스퍼라제는 GlcNAc-트랜스퍼라제III (GnTIII)이다. UDP-N아세틸글루코사민: β-D-만노시드 β(1,4)-N-아세틸글루코사미닐-트랜스퍼라제 III (EC 2.4.1.144)로도 알려져 있는 GnTIII은, 세포내 당단백질의 복합형 N-결합 글리칸에 이등분 GlcNAc 잔기를 삽입한다 (검토를 위하여, 문헌 [Taniguchi 등, "글리코실트랜스퍼라제 유전자로 형질감염된 세포에서 당단백질 기능의 동정 및 특징화에 대한 글리코믹(glycomic) 접근" Proteomics 1:239247, 2001] 참조). GnTIII은 N-결합 글리칸의 트리만노실 코어 구조의 β-결합 만노스에 β(1,4) 결합을 통해 GlcNAc를 첨가한다. GnTIII은 암탉 수란관에서 처음으로 동정되었으나 [Narasimhan S., "당단백질 합성의 조절. UDP-GlcNAc: 당펩티드 β 4-N아세틸글루코사미닐트랜스퍼라제 III, N-글리코실 올리고사카라이드의 트리만노실 코어의 β -결합 만노스에 β 1,4결합으로 GlcNAc를 첨가하는 암탉 수란관에 있는 효소" The Journal of Biological Chemistry 257: 10235-10242, 1982], 더 높은 수준의 활성이 다양한 형태의 쥐 간종양, 인간 혈청, 간종양 및 간경변을 갖는 환자의 간 및 간종양 조직에서 보고되었다 [Ishibashi 등, "인간 혈청 및 간 및 간종양 조직에서의 N-아세틸글루코사미닐트랜스퍼라제 III: 간경변 및 간종양 환자에서의 증가된 활성" Clinical Chimica Acta 185:325, 1989; Narishimhan 등, "오로틴산에 의해 촉진된 쥐 간 발암현상 동안에 간 소결절에서 N-아세틸글루코사미닐트랜스퍼라제 III의 발현" Journal of Biological Chemistry 263: 1273-1281, 1998; Nishikawa 등 "쥐의 정상 및 간종양 조직에서 N-아세틸글루코사미닐트랜스퍼라제 III, IV 및 V의 결정" Biochimica et Biophysica Acta 1035:313-318, 1990; Pascale 등, "쥐 간 발암현상의 상이한 모델에 의해 발생된 간 소결절에서 N-아세틸글루코사미닐트 랜스퍼라제의 발현" Carcinogenesis 10:961964, 1989]. 당단백질 상의 이등분된 올리고사카라이드는 항체-의존성 세포 세포독성 (ADCC)에 관여한다. ADCC는 항체-표적 세포에 대해 세포용해성 공격을 하며, 항체의 불변 영역(Fc)에 대한 림프구 수용체의 결합을 유발한다. GnTIII 활성이 결여된 재조합 차이니즈 햄스터 난소(CHO) 생산 세포주에서 GnTIII의 발현을 제어한 결과, 최적의 ADCC 활성을 갖는 이등분된 올리고사카라이드를 갖는 항체가 얻어졌다 [Davies 등, "재조합 항-CD20 CHO 생산 세포주에서 GnTIII의 발현: 변경된 당형태(glycoform)를 갖는 항체의 발현은 FcγRIII에 대한 높은 친화성을 통하여 ADCC를 증가시킨다" Biotechnology and Bioengineering 74:288-294, 2001; Umana 등, "최적의 항체-의존성 세포 세포독성 활성을 갖는 항신경아세포종 IgG1의 조작된 당형태" Nature Biotechnology 17:176-180, 1999]. ADCC 활성은 재조합 항체 상에 존재하는 Fc영역-관련 이등분 복합 올리고사카라이드의 양과 상관관계를 갖는다 [Umana 등, "최적의 항체-의존성 세포 세포독성 활성을 갖는 항신경아세포종 IgG1의 조작된 당형태" Nature Biotechnology 17:176-180, 1999]. GnTIII 활성으로부터 얻어진 이등분 GlcNAc 잔기는, β(1,4)-갈락토실트랜스퍼라제가 아니라 GlcNAc-트랜스퍼라제 II 및 α1,6-푸코실트랜스퍼라제와 같은 다른 글리코실트랜스퍼라제가 더 이상 작용할 수 없도록 당 사슬의 형태(conformation)에 영향을 미친다(Tanigichi 등, 2001). CHO 세포에서 GnTIII의 과다발현은 치명적이다.
CHO 세포와 같은 전형적인 포유동물 생산 세포주와는 달리, 트랜스제닉 (transgenic) 식물은 일반적으로 치료 단백질을 위해 안전한 생산 체계로서 인식되 고 있다. 그러나, 식물 당단백질은 몇 가지 측면에서 포유동물로부터의 당단백질과 올리고사카라이드 구조가 상이하다. 이들은 말단 갈락토스 및 시알산이 결여되어 있고, (α-1,6) 대신에 상이하게 결합된 코어 푸코스(α-1,3) 및 추가의 코어 크실로스를 갖는다. CHO 및 기타 제약 생산 세포주와 유사하게, 이들에는 이등분된 올리고사카라이드가 완전히 결여되어 있다. 식물은 통상의 코어 구조, GN2M3GN2를 생산하는 능력을 갖지만, 헥소사미니다제에 의한 말단 GN의 제거를 나타내는 M3GN2 변형체가 주로 발견된다.
N-결합 글리칸의 생물발생은 지질 결합된 올리고사카라이드 잔기(Glc3Man9GlcNAc2-)의 합성과 함께 시작되고, 이것은 소포체(ER)에서의 미완성 폴리펩티드 사슬로 일괄적으로 전달된다. ER 및 시스-골지 구획에서 엑소글리코시다제에 의한 일련의 정형(trimming) 반응을 통하여, 이른바 "고 만노스" (Man9GlcNAc2 내지 Man5GlcNAc2) 글리칸이 형성된다. 이어서, GnTI에 의해 첫번째 GlcNAc를 Man5GlCNAC2 상에 전달하고, 만노시다제 II (Mann)에 의해 정형하여 GlcNAcMan3 GlcNAc2를 형성함으로써 복합형 글리칸의 형성이 시작된다. GnTII에 의해 두번째 GlcNAc 잔기를 골지체에 전달할 뿐만 아니라 다수의 다른 글리코실 트랜스퍼라제의 작용하에 GlcNAcMan3GlcNAc2 위에 다른 단당 잔기를 전달하는 것과 함께, 분비 경로를 통해 당단백질이 진행되면서 복합 글리칸 생합성이 계속된다. 식물 및 포유동물은 복합 글리칸의 형성 측면에서 서로 상이하다. 식물에서, 복합 글리칸은, GlcNAc-1에 결합된 α(1,6)-푸코스 잔기 대신에, Man-3에 결합된 β(1,2)-크실로스 잔기 및(또는) GlcNAc1에 결합된 α(1,3)-푸코스 잔기의 존재를 특징으로 한다 [Lerouge,P. 등 "식물에서의 N-당단백질 생합성: 최근의 발전 및 앞으로의 추세" Plant Mol Biol 38:31-48, 1998]. 상응하는 크실로실(XylT) 및 푸코실 (FucT)트랜스퍼라제를 코딩하는 유전자가 단리되었다 (Strasser R, "아라비도프시스 탈리아나(Arabidopsis thaliana)로부터의 β1,2-크실로실트랜스퍼라제 cDNA의 분자 클로닝 및 기능 발현" FEBS Lett. 472:105-8, 2000; Leiter,H. 등 "정제, cDNA 클로닝 및 GDP-L-Fuc의 발현: 녹두로부터의 Asn-결합 GlcNAc α1,3-푸코실트랜스퍼라제" J Biol Chem. 274:21830, 1999]. 크실로스 및 푸코스 에피토프는 고 면역원성으로 공지되어 있고, 치료 당단백질의 생성을 위해 식물이 사용될 경우 문제점을 일으킬 수도 있는 알레르기유발성일 수도 있다. 또한, 많은 알레르기 환자의 혈청은 이러한 에피토프에 대해 지시된 IgE를 함유하고, 이것은 특히 재조합 단백질을 함유하는 크실로스 및 푸코스로의 치료에서 환자를 위험에 빠뜨릴 수 있다. 또한, 탄수화물 특이적 IgE가 알레르기유발 반응에 관련되지 않는다는 증거가 있어서, 혈청 내에서 이러한 탄수화물 지시된 IgE는, 식물 추출물을 사용하는 시험관내 시험에서 잘못된 포지티브(positive) 반응을 일으킬 수도 있다. 식물은 β(1,4)갈락토실트랜스퍼라제나α(2,6)시알릴트랜스퍼라제를 갖지 않고, 그 결과 식물 글리칸은 포유동물 글리칸에서 종종 발견되는 β(1,4)갈락토스 및 말단 α(2,6)NeuAc 잔기가 없다 [Vitale and Chrispeels, "피토헤마글루티닌의 생합성에서 일시적인 N-아세틸글루코사민: 골지체에서의 부착 및 단백질 본체의 제거", J Cell Biol 99: 133-140, 1984: Lerouge, P. 등 "식물에서의 N-당단백질 생합성: 최근의 발전 및 앞으로의 추세" Plant Mol Biol 38:31-48, 1998].
최종 글리칸 구조는 그들의 생합성에 연관된 효소의 단순한 존재에 의해 결정될 뿐만 아니라 각종 효소 반응의 특정한 서열에 의해서도 크게 좌우된다. 후자는 ER 및 골지체 전체에 걸친 효소의 상대적 위치 및 별개의 격리(discrete sequestering)에 의해 조절되고, 이것은 트랜스퍼라제의 결정인자와 트랜스퍼라제가 될 예정인 부(sud)-골지체 구획의 특이적 특징의 상호작용에 의해 매개된다. 하이브리드 분자를 사용한 다수의 연구는, 여러 글리코실트랜스퍼라제의 막횡단 도메인이 부-골지 분류에서 중요한 역할을 한다는 것을 확인하였다 [Grabenhorst E. 등, J.Biol.Chem. 274:36107-36116, 1999; Colley,K., Glycobiology, 7:1-13, 1997, Munro,S., Trends Cell Biol 8:11-15, 1998: Gleeson P.A., Histochem.Cell.Biol. 109:517-532, 1998].
제약 산업에서 사용되는 포유동물 생산 세포주와 유사하게, 식물에서 생성된 당단백질에는 GnTIII 활성이 결여되어 있다. 식물은 GnTIII 활성을 결여할 뿐만 아니라 GnTIII-유사 서열을 완전히 갖고 있지 않다. 또한, 식물은 GnTIV, GnTV 및 GnTVI 서열이 결여되어 있고 또한 시알산 잔기가 결여되어 있다 (식물을 포함하여 일반적으로 사용되는 세포 발현 체계의 목적하는 글리코실화 속성의 개관을 위하여 문헌 [Jenkins 등, "Getting the glycosylation right: 바이오테크놀로지 산업을 위한 관계" Nature Biotechnology 14:975-979, 1996]을 참조한다). 그럼에도 불구하고, 식물은 매우 효과적인 생산 체계이다. 식물은 일반적으로 안전하고 인간에 해로운 입자를 갖지 않는 것으로 인정되고 있다. 식물 생산은 쉽게 조정할 수 있고 N-결합 글리코실화를 조절할 수 있다 [Bakker 등, "트랜스제닉 식물에 의해 생 산된 항체의 갈락토스-연장 글리칸" Proc.Nat.Acad.Sci. USA 98:2899-2904, 2001].
β(1,4)-갈락토실트랜스퍼라제에 대한 인간 유전자의 도입시에 갈락토실화된 재조합 단클론성 항체(Mabs)를 생산하는 형질전환 담배 식물이 보고되어 있다 [hGalT; Bakker 등, "트랜스제닉 식물에 의해 생산된 항체의 갈락토스-확장 글리칸" Proc.Nat.Acad.Sci. USA 98:2899-2904, 2001; WO01/31044 및 WO01/31045].
글리코실화 패턴을 변경시킴으로써 치료 당단백질이 개선될 수 있다 [Davies 등, "재조합 항-CD20 CHO 생산 세포주에서 GnTIII의 발현: 변경된 당형태를 갖는 항체의 발현은 FcγRIII에 대한 높은 친화성을 통해 ADD를 증가시킨다", Biotechnology and Bioengineering 74: 288-294, 2001; Umana 등, "최적화된 항체-의존성 세포 세포독성 활성을 갖는 항신경아세포종 IgG1의 조작된 당형태" Nature Biotechnology 17:176-180, 1999; Fukuta 등, "인간 인터페론-γ의 당 사슬 구조의 재모형화" Glycobiology 10:421-430, 2000; Misaizu 등 "재조합 인간 에리트로포이에틴의 신장 취급에서 N-결합 당 사슬의 촉각 구조의 역할" Blood 86:4097-4104, 1995; Sburlati 등 "차이니즈 햄스터 난소 세포에서 β-1,4-N-아세틸글루코사미닐-트랜스퍼라제 III의 과다발현에 의한 재조합 IFN-β의 이등분된 당형태의 합성" Biotechnology Prog. 14:189-192, 1998]. EPO의 고급 올리고사카라이드 촉각구조는 감소된 신장 여과로 인하여 생체내 활성을 증가시킨다 (Misaizu 등 "재조합 인간 에리트로포이에틴의 신장 취급에서 N-결합 당 사슬의 촉각 구조의 역할" Blood 86:4097-4104, 1995]. 2가지 방법에 의해 정상 생산 세포주의 "표준" 글리코실화 기구를 이용하여 이러한 뛰어난 당형태의 생합성이 달성될 수 있다. 첫번째는 정 제 동안에 특이적 당형태를 풍부하게 하고, 두번째는 폴리펩티드 사슬에 돌연변이를 도입한다. 후자는 당단백질내에서 글리코실화 부위를 변위시킬 수 있고, 그 결과 상이한 접근가능성의 결과로서 상이한 글리코실화 패턴이 얻어진다. 상보성 경로는 생산 세포주 자체의 유전자 조작을 통한다. 생산 세포주에서 글리코실트랜스퍼라제 및 글리코시다제 유전자의 발현을 통해 새로운 글리코실화 패턴이 얻어질 수 있다. 이러한 유전자는 세포 당단백질의 글리칸으로부터 특이적 사카라이드를 제거하거나 여기에 특이적 사카라이드를 첨가하는 효소를 코딩한다. 당형태 생합성을 조작하기 위하여 여러 글리코실트랜스퍼라제 유전자를 CHO 세포에 도입하였다. 이들 중 하나는 GnTIII이다. N-결합 글리칸의 분지화에 글리코실트랜스퍼라제 GnTIII가 관련되고, 이등분 GlcNAc 잔기가 얻어진다. CHO 세포 및 기타 생산 세포주는 전형적으로 GnTIII 활성을 결여하고 있다 [Stanley, P 및 C.A. Campbell, "차이니즈 햄스터 난소 세포에서 리신 내성에 대한 우세한 돌연변이는 UDP-GlcNAc:당펩티드 β-4-N-아세틸글루코사미닐-트랜스퍼라제 III 활성을 유도한다" Journal of Biological Chemistry 261:13370-13378, 1984]. CHO에서 GnTIII의 발현은 예상대로 이등분된 복합 올리고사카라이드를 생산하지만, 과다발현은 성장 저해를 가져오고 세포에 독성이 되었다. 유사하게, 3촉각구조 당 사슬을 도입하는 다른 글리코실트랜스퍼라제인 GnTV의 과다발현은 성장 저해를 가져오고, 이것은 글리코실트랜스퍼라제 과다발현의 일반적 특징일 수도 있음을 시사한다 [Umana 등, "최적화된 항체-의존성 세포 세포독성 활성을 갖는 항신경아세포종 IgG1의 조작된 당형태, Nature Biotechnology 17:176-180, 1999].
따라서, 인간 친화성 비-면역원성 이등분된 올리고사카라이드를 갖는 식물에서 당단백질을 생성하기 위한 수단을 제공하는 것이 요구된다.
발명의 요약
본 발명은, 식물에서 포유동물 N-아세틸글루코사미닐-트랜스퍼라제 III(GnTIII)효소의 발현, 및 이등분된 올리고사카라이드와 증가된 양의 말단 GlcNAc 잔기를 갖는 당단백질을 제조하는데 있어서의 그의 용도에 관한 것이다. 또한, 본 발명은 GnTIII의 촉매 부위 및 골지체의 막횡단 도메인 및(또는) 소포체(ER) 단백질 또는 ER 체류 신호를 포함하는 변형 GNTIII을 포함하는 하이브리드 단백질 , 및 면역원성 크실로스 및 푸코스 잔기가 결여된 올리고사카라이드를 갖는 당단백질의 제조에서의 그의 용도에 관한 것이다.
한 실시양태에서, 본 발명은 포유동물 UDP-N아세틸글루코사민:(β-D-만노시드 β(1,4)-N아세틸글루코사미닐트랜스퍼라제 (GnTIII) 효소 (뉴클레오티드 서열: SEQ ID NO:1, Genbank I.D. 번호 AL022312 (Dunham,I. 등, Nature 402:489-495, 1999); 단백질 서열: SEQ ID NO:2, Genbank I.D. 번호 Q09327)를 포함하거나 발현하는 식물 숙주 체계를 의도하며, 상기 GnTIII은 상기 식물 숙주 체계에 존재하는 당단백질의 복합형 N-결합 글리칸에 이등분 N아세틸 글루코사민(GlcNAc)잔기를 삽입한다.
본 발명의 특정한 실시양태에서, 식물 숙주 체계는 이등분된 올리고사카라이드, 특히 갈락토스 잔기를 포함하는 이종 당단백질 또는 그의 기능적 단편을 추가로 포함한다. GnTIII은 상기 이종 당단백질 상에 N-GlcNAc 잔기를 삽입한다.
한 실시양태에서, 본 발명은 이등분된 올리고사카라이드를 포함한 이종 당단백질을 발현하는 식물 숙주 체계의 수득 방법을 의도한다. 한 실시양태에서, 상기 방법은 이종 당단백질을 발현하는 식물을 상기 GnTIII를 발현하는 식물과 교배시키고, 상기 교배로부터 자손을 수확하고, 상기 이종 당단백질을 발현하고 포유동물 GnTIII을 발현하는 원하는 자손 식물을 선택하는 것을 포함한다. 또한, 상기 식물 숙주 체계는 식물 또는 그의 일부 내에 상기 포유동물 GnTIII을 코딩하는 핵산 및 상기 이종 당단백질을 코딩하는 핵산을 도입시키고, 상기 이종 당단백질을 발현하고 식물에 대개 존재하지 않는 포유동물 GnTIII을 발현하는 식물 또는 그의 일부를 단리함으로써 수득될 수 있다. 또한, 본 발명은 상기 기재된 어느 하나의 절차를 사용하여 식물 숙주 체계를 수득하고 상기 이종 당단백질을 더욱 단리하는 것을 포함하는 상기 식물로부터 이종 당단백질을 수득하는 방법에 관한 것이다.
다른 실시양태에서, 본 발명의 식물 숙주 체계는, 식물에 대개 존재하지 않는 N-글리칸 생합성을 제공하고, 이에 의해 예를 들면 WO 01/21045호 (여기에서 참고문헌으로 인용됨)에 기재된 것과 같이 갈락토스의 첨가에 의해 N-결합 글리칸을 연장시키는 능력을 제공하는 기능성 포유동물 효소를 추가로 포함하는 것으로 이해된다. 다른 실시양태에서, 본 발명은, 수송체 단백질 또는 효소(예를 들면, 포유동물 단백질) 또는 그의 기능적 단편과 같은 기능적 단백질 (상기 단백질은 N-글리칸 생합성을 제공한다)을 포함하는 식물을 상기 포유동물 GnTIII을 포함하는 식물과 교배시키는 것을 포함하는 식물 숙주 체계를 의도한다. 다른 실시양태에서, 본 발명은 상기 교배로부터 자손을 수확하고 예를 들면 수송체 단백질 또는 효소 또는 그의 기능적 단편과 같은 상기 기능적 단백질을 발현하는 원하는 자손 식물을 선택하는 것을 의도한다. 본 발명의 또 다른 실시양태에서, 발현된 단백질은 N-글리칸 생합성 및 포유동물 GnTIII을 제공하는 것으로 이해된다. 또 다른 실시양태에서, 본 발명은 GnTIII을 코딩하는 핵산 및 N-글리칸 생합성을 제공하는 기능적 단백질 (예를 들면, 수송체 또는 효소[예, 포유동물] 또는 그의 기능적 단편)을 코딩하는 핵산을 포함하는 식물 숙주 체계를 의도하고, N-글리칸 생합성을 제공하는 기능적 단백질 또는 그의 기능적 단편 및 상기 포유동물 GnTIII을 발현하는 상기 식물 또는 그의 일부를 단리한다. 본 발명은 어떠한 이론이나 메카니즘에 한정되지 않지만, 이러한 조합이 이종 당단백질의 갈락토실화를 증가시키는 것으로 생각된다. 추가로, 한 실시양태에서, GnTIII 및 GalT와 같은 N-글리코실화를 제공하는 기타 단백질은 하나의 형질전환 벡터를 통해 동시에 도입될 수 있는 것으로 이해된다.
한 실시양태에서, 본 발명은 상기 이종 당단백질을 발현하는 것을 포함하는 식물 숙주 체계 (여기에서, 상기 이종 당단백질은 증가된 갈락토실화를 갖는다) 및 식물 숙주 세포 체계 및 이종 당단백질을 수득하는 방법을 의도한다. 다른 실시양태에서, 포유동물 GnTIII 및 기능적 단백질 (예를 들면, 식물에서 대개 발견되지 않는 N-글리칸 생합성을 제공하는 수송체 또는 효소[예를 들면 포유동물 효소] 또는 그의 기능적 단편)을 포함하는 식물을 이종 당단백질을 포함하는 식물과 교배시키고, 상기 자손 식물을 선택함으로써 식물 숙주 세포 체계가 수득될 수 있다. 또 다른 실시양태에서, 상기 이종 당단백질은 1) 상기 GnTIII, 2) 식물에서 대개 발견되지 않은 N-글리칸 생합성을 제공하는 상기 기능적 단백질 또는 효소 및 3)상기 이종 당단백질을 코딩하는 핵산 서열을 상기 식물 또는 그의 일부내에 도입시키고, 핵산 서열을 발현하는 상기 식물 또는 그의 일부를 단리함으로써 수득될 수 있는 것으로 이해된다. 본 발명의 다른 실시양태에서, 이종 당단백질은 식물 숙주 체계로부터 단리되거나 정제될 수 있는 것으로 이해된다.
본 발명의 한 실시양태에서, 하이브리드 단백질은 1) 포유동물 GnTIII의 촉매적 부분을 포함한 단리된 하이브리드 단백질 및 2) 예를 들면 진핵 세포의 소포체 또는 골지체로부터의 단백질의 막횡단 부분을 포함하는 것으로 이해된다. 다른 실시양태에서, 본 발명은 ER에서 상기 GnTIII를 체류시키기 위한 KDEL과 같은 체류 신호를 포함하는 변경된 포유동물 GnTIII을 의도한다. 또 다른 실시양태에서, 본 발명은 1) 상기 하이브리드 단백질 및 상기 변형 포유동물 GnTIII, 2) 상기 핵산 서열을 포함하는 벡터 및 3) 상기 서열을 포함하는 식물 숙주 체계를 코딩하는 핵산 서열을 의도한다. 한 실시양태에서, 이러한 하이브리드 단백질 및 변경된 GnTIII은 소포체(ER) 및(또는) 골지체에 GnTIII 활성을 재위치화(relocalization)시키는 작용을 할 수도 있다. 다른 실시양태에서, 본 발명은 예를 들면 상기 하이브리드 단백질 또는 변경된 GnTIII을 코딩하는 서열을 식물 또는 그의 일부 내에 도입함으로써 하이브리드 단백질 및 변경된 GnTIII 단백질을 수득하는 방법을 의도한다. 본 발명은 어떠한 이론이나 메카니즘으로 한정되지 않지만, 이러한 재집적화의 결과로서, 반응의 N-글리칸 생합성 서열에 이등분 GlcNAc가 조기에 도입되고 이에 의해 이후의 효소 반응을 방지하며, 그 결과 식물 숙주 체계(예를 들면, 본 발명의 식물 숙주 체계)에서 발현되는 이종 단백질이 크실로스 및 푸코스를 결여하 고 증가된 양의 말단 GlcNAc를 갖는 것으로 생각된다. 따라서, 본 발명의 한 실시양태는 1) 하이브리드 단백질 또는 상기 변경된 GnTIII을 포함하는 식물을 상기 이종 단백질을 포함하는 식물과 교배시키고, 2) 원하는 자손을 선택하는 것을 포함하는, 이종 당단백질을 발현하는 식물 숙주 체계(상기 식물 숙주 체계는 갈락토스로 N-결합 글리칸을 연장하는 능력을 갖는다)를 제공하기 위한 방법을 의도한다. 다른 실시양태에서, 본 발명은 1) 상기 변형된 GnTIII 또는 상기 하이브리드 단백질 및 상기 이종 당단백질을 코딩하는 핵산 서열을 식물 또는 그의 일부 내에 도입시키고, 2) 갈락토스로 N-결합 글리칸을 연장시키는 능력을 갖는 이종 당단백질을 발현하는 식물 또는 그의 일부를 단리하는 것을 의도한다. 또 다른 실시양태에서, 본 발명은 상기 식물 또는 그의 일부로부터 당단백질을 단리하는 것을 포함하는 바람직한 이종 당단백질을 수득하는 방법을 의도한다.
한 실시양태에서, 본 발명은 제약 조성물(예를 들면, 항체, 호르몬, 백신 항원, 효소 등)의 제조를 위하여 식물-유래 당단백질 또는 그의 기능적 단편이 사용될 수 있다는 것을 의도한다. 다른 실시양태에서, 본 발명은 당단백질 또는 그의 기능적 단편을 포함한 제약 조성물이 또한 제공되는 것을 의도한다.
한 실시양태에서, 본 발명은 GnTIII의 변형체 또는 변이체를 의도한다. 용어 "변형체" 및 "변이체"는 폴리펩티드와 관련되어 사용될 때 일반적으로 관련된 다른 폴리펩티드와는 하나 이상의 아미노산이 상이한 아미노산 서열을 지칭한다. 다른 실시양태에서, 본 발명은 "보존성" 변화를 갖는 변형체를 의도하며, 여기에서 치환된 아미노산이 유사한 구조적 또는 화학적 성질을 갖는다. 보존성 아미노산 치환의 한가지 유형은 유사한 측쇄를 갖는 잔기의 상호변화가능성을 지칭한다. 예를 들면, 지방족 측쇄를 갖는 아미노산의 군은 글리신, 알라닌, 발린, 류신 및 이소류신이고; 지방족-히드록실 측쇄를 갖는 아미노산의 군은 세린 및 트레오닌이며; 아미드-함유 측쇄를 갖는 아미노산의 군은 아스파라긴 및 글루타민이고; 방향족 측쇄를 갖는 아미노산의 군은 페닐알라닌, 티로신 및 트립토판이고; 염기성 측쇄를 갖는 아미노산의 군은 리신, 아르기닌 및 히스티딘이고; 황-함유 측쇄를 갖는 아미노산의 군은 시스테인 및 메티오닌이다. 바람직한 보존성 아미노산 치환기는 발린(V), -류신(L), -이소류신(I), 페닐알라닌(F), -티로신(Y), 리신(K), -아르기닌(R), 알라닌(A), -발린(V) 및 아스파라긴(N),-글루타민(Q)이다.
또 다른 실시양태에서, 본 발명은 "비-보존성" 변화 (예를 들면, 글리신을 트립토판으로 치환)를 갖는 변형체를 의도한다. 유사한 최소의 변형은 아미노산 결실 또는 삽입(또는 추가) 또는 양쪽 모두를 포함할 수 있다. 당 기술분야에 공지된 컴퓨터 프로그램, 예를 들면 DNA스타(DNAStar) 소프트웨어를 사용하여 생물학적 활성을 파괴하지 않고도 얼마나 많은 아미노산 잔기가 치환되거나 삽입되거나 결실될 수 있는지를 결정하는 지침을 알아낼 수 있다. 변형체는 기능성 분석에서 시험될 수 있다. 보존성 및 비-보존성 변형체 양쪽 모두를 위하여, 바람직한 변형체는 10% 미만, 바람직하게는 5% 미만, 더욱 바람직하게는 2% 미만의 변화 (치환, 결실 등)을 갖는다.
한 실시양태에서, 본 발명은 포유동물 UDP-N-아세틸글루코사민; β-D 만노시드 β(1,4)-N-아세틸글루코사미닐트랜스퍼라제 (GnTIII) 효소 (또는 그의 일부 또 는 그의 변형체, 여기에서 상기 GnTIII은 상기 식물 숙주 체계에 존재하는 당단백질의 복합형 N-결합 글리칸에 이등분 N-아세틸 글루코사민 (GlcNAc) 잔기를 삽입한다)를 포함하는 식물 숙주(세포) 체계를 의도한다. 다른 실시양태에서, 본 발명은 상기 GnTIII이 인간 GnTIII인 식물 숙주를 의도한다. 또 다른 실시양태에서, 본 발명은 식물의 일부인 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 세포, 잎, 배아, 칼루스, 줄기, 과피, 원형질체, 뿌리, 괴경, 과실의 인, 내배유, 및 배아로 구성된 군에서 선택되는 식물의 일부인 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 전체 식물인 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 이종 당단백질 (또는 그의 기능적 단편)을 추가로 포함하는 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 상기 이종 당단백질 단백질이 항체, 또는 그의 단편 (예를 들면, Fc, Fv, Fab, Fab2)을 포함하는 것인 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 상기 이종 당단백질 또는 그의 기능적 단편이 이등분된 올리고사카라이드를 포함하는 것인 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 상기 이종 당단백질 (또는 그의 기능적 단편)이 갈락토스 잔기를 갖는 이등분된 글리칸을 포함하는 것인 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 상기 식물이 담배 식물인 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 수송체 또는 N-글리칸 생합성을 제공하는 (포유동물) 효소 (또는 그의 기능적 단편)으로 구성된 군에서 선택되는 기능적 단백질을 추가로 포함하는 식물 숙주 체계 를 의도한다. 또 다른 실시양태에서, 본 발명은 상기 효소가 (인간) β-1,4 갈락토실트랜스퍼라제인 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 증가된 수의 갈락토스 잔기를 갖는 이종 당단백질을 추가로 포함하는 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 포유동물 GnTIII 단백질을 코딩하는 핵산 서열을 포함하는 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 포유동물 GnTIII 단백질을 코딩하는 핵산 서열을 포함하는 벡터를 포함하는 식물 숙주 체계를 의도한다. 또 다른 실시양태에서, 본 발명은 수송체 또는 N-글리칸 생합성을 제공하는 (포유동물) 효소 (또는 그의 기능적 단편)으로 구성된 군에서 선택되는 기능적 단백질을 코딩하는 핵산 서열을 추가로 포함한, 식물 숙주를 의도한다.
한 실시양태에서, 본 발명은 a) 이종 당단백질을 발현하는 식물을 교배시키고 b) 상기 교배로부터 자손을 수확하고, c) (상기 이종 당단백질을 발현하고, 식물에 대개 존재하지 않는 포유동물 GnTIII을 발현하는) 원하는 자손 식물을 선택하는 것을 포함하는 (이등분된 올리고사카라이드를 갖는 이종 당단백질을 발현하는 식물 숙주 체계를 수득하기 위한) 방법을 의도한다. 다른 실시양태에서, 본 발명은 상기 원하는 자손 식물이 이등분된 올리고사카라이드를 갖는 이종 당단백질을 발현하는 것인 방법을 의도한다. 또 다른 실시양태에서, 본 발명은 상기 식물 숙주 체계가 트랜스제닉 식물인 방법을 의도한다.
한 실시양태에서, 본 발명은 a) 식물에 대개 존재하지 않는 GnTIII을 코딩하는 핵산 서열을 식물 숙주 체계 및 이종 당단백질을 코딩하는 핵산 서열 내에 도입시키고, b) 상기 이종 당단백질을 단리하는 것을 포함하는, 이등분된 올리고사카라이드를 갖는 이종 당단백질의 수득 방법을 의도한다. 다른 실시양태에서, 본 발명은 상기 핵산 서열을 식물 세포 내에 도입시키고, 상기 식물 세포를 식물 내에 재생시키는 방법을 의도한다. 또 다른 실시양태에서, 본 발명은, 식물에 대개 존재하지 않는 GnTIII를 코딩하는 핵산 서열을 포함하는 벡터를 갖는 숙주 체계를, 식물 및 이종 당단백질을 코딩하는 핵산 서열내로 형질전환시킴으로써, 상기 핵산 서열을 식물 숙주 체계 내에 도입하는 동일한 방법을 의도한다. 또 다른 실시양태에서, 본 발명은, 식물에 대개 존재하지 않는 GnTIII을 코딩하는 핵산 서열을 포함하는 벡터를 갖는 상기 식물 숙주 체계를 식물 및 이종 당단백질을 코딩하는 핵산 서열 내로 형질전환시킴으로써, 상기 핵산 서열을 식물 숙주 체계 내에 도입하는 방법을 의도한다. 또 다른 실시양태에서, 본 발명은 식물에 대개 존재하지 않는 GnTIII을 코딩하는 핵산 서열을 포함하는 벡터를 갖는 상기 식물을 식물 숙주 체계 및 이종 당단백질을 코딩하는 핵산 서열을 포함하는 벡터 내로 형질전환시킴으로써, 상기 핵산 서열을 식물 숙주 체계 내에 도입하는 방법을 의도한다. 또 다른 실시양태에서, 본 발명은, 재생된 식물을 재배하는 것을 포함하는, 이등분된 올리고사카라이드를 갖는 이종 당단백질의 수득 방법을 의도한다.
한 실시양태에서, 본 발명은 a) 식물 숙주 체계를 재배하고 (상기 식물이 수확가능한 단계에 이를 때까지) b) 상기 식물을 수확하고 (분별화하여 분별된 식물 물질을 수득하고) c) 상기 분별된 식물 물질로부터 당단백질을 적어도 부분적으로 단리하는 것을 포함하는 바람직한 당단백질 (또는 그의 기능적 단편)을 수득하는 방법을 의도한다. 다른 실시양태에서, 본 발명은 의도된 방법에 의해 수득가능한 식물을 의도한다.
한 실시양태에서, 본 발명은, 수송체 또는 N-글리칸 생합성을 제공하는 (포유동물) 효소 또는 그의 기능적 단편과 같은 기능적 단백질을 포함하는 식물을 청구범위 제5항에 따른 식물과 교배시키고, 상기 교배로부터 자손을 수확하고, 수송체 또는 N-글리칸 생합성을 제공하는 (포유동물) 효소 또는 그의 기능적 단편 및 상기 포유동물 GnTIII과 같은 기능적 단백질을 발현하는 원하는 자손 식물을 선택하는 것을 포함하는, 수송체 또는 N-글리칸 생합성을 제공하는 (포유동물) 효소 또는 그의 기능적 단편 및 포유동물 GnTIII으로 구성된 군에서 선택되는 기능적 단백질을 포함하는 식물 숙주 체계의 수득 방법을 의도한다. 다른 실시양태에서, 본 발명은 의도된 바에 따라 수득된 트랜스제닉 식물을 의도한다.
한 실시양태에서, 본 발명은 GnTIII을 코딩하는 핵산 서열 및 식물에 대개 존재하지 않는 수송체 또는 (포유동물) 효소 또는 기능적 단편을 코딩하는 서열로 구성된 군에서 선택되는 서열을, 상기 이종 당단백질을 발현하는 식물 숙주 체계 내에 도입시키고, 상기 당단백질을 단리하는 것을 포함하는, 식물 숙주 체계에서 발현된 이종 당단백질의 갈락토실화의 증가 방법을 의도한다.
한 실시양태에서, 본 발명은 이등분된 올리고사카라이드를 포함하는 식물 유래 당단백질을 의도한다.
한 실시양태에서, 본 발명은 바람직한 당단백질 또는 그의 기능적 단편을 제조하기 위해 본 발명에 의해 의도된 식물 숙주 체계의 용도를 의도한다. 다른 실 시양태에서, 본 발명은 상기 당단백질 또는 그의 기능적 단편이 이등분된 올리고사카라이드를 포함하는 것을 의도한다. 또 다른 실시양태에서, 본 발명은 본 발명에 의해 의도된 방법에 의해 수득되는 식물-유래 당단백질 또는 그의 기능적 단편을 의도한다. 또 다른 실시양태에서, 본 발명은 제약 조성물의 제조를 위해 본 발명에 의해 의도된 당단백질 또는 그의 작용성 단편을 의도한다. 또 다른 실시양태에서, 본 발명은 본 발명에 의해 의도된 바와 같은 당단백질 또는 그의 기능적 단편을 포함한 조성물을 의도한다.
한 실시양태에서, 본 발명은 GnTIII의 활성 부위 및 단백질의 막횡단 영역을 포함하는 단리된 하이브리드 단백질을 의도하며, 상기 단백질은 진핵 세포의 소포체 또는 골지체에 존재한다. 다른 실시양태에서, 본 발명은 본 발명의 단백질을 의도하며, 여기에서 진핵 세포의 소포체 또는 골지체에 존재하는 상기 단백질은 효소이다. 또 다른 실시양태에서, 본 발명은 본 발명에 따른 단백질을 의도하며, 여기에서 진핵 세포의 소포체 또는 골지체에 존재하는 상기 단백질은 글리코실트랜스퍼라제이다. 또 다른 실시양태에서, 본 발명은 본 발명의 단백질을 의도하며, 진핵 세포의 소포체 또는 골지체에 존재하는 상기 단백질은 만노시다제I, 만노시다제II, GnTI, GnTII, Xy1T 및 FucT으로 구성된 군에서 선택되는 글리코실트랜스퍼라제이다. 또 다른 실시양태에서, 본 발명은 본 발명에 따른 단백질을 의도하며, 진핵 세포의 소포체 또는 골지체에 존재하는 상기 단백질은 식물 단백질이다. 또 다른 실시양태에서, 본 발명은 본 발명의 단백질을 코딩하는 단리된 핵산 서열을 의도한다. 또 다른 실시양태에서, 본 발명은 본 발명의 단리된 핵산 서열 을 포함하는 벡터를 의도한다. 또 다른 실시양태에서, 본 발명은 본 발명의 단리된 핵산 서열을 포함하는 식물을 의도한다. 또 다른 실시양태에서, 본 발명은 이종 당단백질을 코딩하는 핵산 서열을 추가로 포함하는 본 발명의 식물(들)을 의도한다.
한 실시양태에서, 본 발명은 a) 트랜스제닉 식물을 본 발명의 식물과 교배시키고, b) 상기 교배로부터 자손을 수확하고, c) (상기 재조합 단백질을 발현하고, 식물에 대개 존재하지 않는 (포유동물) N-글리칸 생합성에 관련된 기능성 (포유동물) 효소를 발현하는) 원하는 자손 식물을 선택하는 것을 포함하는 (갈락토스로 N-결합 글리칸을 연장시키는 능력을 갖는 이종 당단백질을 발현할 수 있는 트랜스제닉 식물을 제공하기 위한) 방법을 의도한다.
한 실시양태에서, 본 발명은, 본 발명의 핵산 서열 및 이종 당단백질을 코딩하는 핵산 서열을 도입하는 것을 포함하는, 갈락토스로 N-결합 글리칸을 연장하는 능력을 갖는 이종 당단백질을 발현할 수 있는 트랜스제닉 식물의 제공 방법을 의도한다.
한 실시양태에서, 본 발명은 a) i) 식물 세포 및 ii) GNTIII 효소를 코딩하는 핵산을 포함한 발현 벡터를 제공하고; b) 상기 효소가 발현되는 조건 하에서 상기 발현 벡터를 상기 식물 세포내에 도입하는 것을 포함하는 방법을 의도한다. 다른 실시양태에서, 본 발명은 GNTIII을 코딩하는 핵산이 SEQ ID NO:1의 핵산 서열을 포함하는 것인 방법을 의도한다.
한 실시양태에서, 본 발명은 a) i) 식물 세포, ii) GNTIII 효소를 코딩하는 핵산을 포함한 제 1 발현 벡터, 및 iii) 이종 당단백질을 코딩하는 핵산을 포함하는 제 2 발현 벡터를 제공하고, b) 상기 하이브리드 효소 및 상기 이종 단백질이 발현되는 조건 하에서 상기 제 1 발현 벡터 및 제 2 발현 벡터를 상기 식물 세포내에 도입하는 것을 포함하는 방법을 의도한다. 다른 실시양태에서, 본 발명은 상기 이종 단백질이 항체 또는 항체 단편인 방법을 의도한다.
한 실시양태에서, 본 발명은 a) i) 제 1 발현 벡터를 포함하는 제 1 식물 (상기 제 1 벡터는 GNTIII 효소를 코딩하는 핵산을 포함한다), ii) 제 2 발현 벡터를 포함하는 제 2 식물 (상기 제 2 벡터는 이종 단백질을 코딩하는 핵산을 포함한다)를 제공하고; b) 상기 제 1 식물 및 상기 제 2 식물을 교배하여 상기 하이브리드 효소 및 상기 이종 단백질을 발현하는 자손을 생성하는 것을 포함하는 방법을 의도한다.
한 실시양태에서, 본 발명은 제 1 발현 벡터 및 제 2 발현 벡터를 포함하고, 상기 제 1 벡터가 GNTIII 효소를 코딩하는 핵산을 포함하고 상기 제 2 벡터가 이종 단백질을 코딩하는 핵산을 포함하는 것인 식물을 의도한다. 다른 실시양태에서, 본 발명은 상기 이종 단백질이 항체 또는 항체 단편인 것을 의도한다.
도 1A 및 1B는 (A) 대조 담배 식물의 잎으로부터 단리된 N-결합 글리칸 및 (B) 인간 GnTIII으로 형질전환된 선택된 GnTM-17 담배 식물의 잎으로부터 단리된 N-결합 글리칸의 MALDI-TOF 질량 스펙트럼을 나타낸다. 구조는 표 1 참조.
도 2는 ManI, GnTI, ManII 및 GnTII의 이후 작용 하에서 복합형 글리칸으로 의 고 만노스 유형 글리칸(M9)의 처리를 나타낸다. 또한, 연쇄 반응의 상이한 지점에서 GalT 및(또는) GnTIII의 작용이 어떠한 글리칸 구조를 유도하는지를 나타낸다. 푸코실 트랜스퍼라제 및 크실로실트랜스퍼라제에 의해 촉매작용된 반응은 도시되지 않는다. 코어 GlcNAc(Gn)은 도시되지 않는다. Gn=GlcNAc, Gnb=이등분 GlcNAc, G=갈락토스 및 M=만노스.
도 3A 및 3B는 (A) 면역원성 크실로스 및 푸코스를 갖지 않은, 효율적으로 갈락토실화된 이등분된 글리칸을 생성하기 위해, 글리칸 변경 효소를 코딩하는 유전자를 보유한 T-DNA 구성체 및 (B) 항체 경쇄 및 중쇄 유전자를 보유한 T-DNA 구성체를 나타낸다. TmXyl=크실로실트랜스퍼라제의 막횡단 도메인, TmGnTI=GnT의 막횡단 도메인, P=프로모터, R=선택 마커, L=항체 경쇄 및 H=항체 중쇄.
도 4A 및 도 4B는 c-myc 표지를 포함한 GnTIII의 뉴클레오티드 서열을 나타낸다 (SEQ ID NO:1, 도 4(A) 단백질 서열의 밑줄친 부분, SEQ ID NO:2, 도 4B의 밑줄친 부분).
도 5A 및 5B는 (A) 플라스미드 pDAB4005의 지도 및 (B) 플라스미드 pDAB4005의 뉴클레오티드 서열을 나타낸다.
도 6A 및 6B는 (A) 플라스미드 pDAB7119의 지도 및 (B) 스플라이스 부위를 포함한 플라스미드 pDAB 7119 (SEQ ID NO:9)의 뉴클레오티드 서열을 나타낸다.
도 7A 및 7B는 (A) 플라스미드 pDAB8504의 지도 및 (B) 플라스미드 pDAB 8504(SEQ ID NO:10)의 뉴클레오티드 서열을 나타낸다.
도 8A 및 8B는 (A) 플라스미드 pDAB7113의 지도 및 (B) 스플라이스 부위를 포함한 플라스미드 pDAB7113 (SEQ ID NO:11)의 뉴클레오티드 서열을 나타낸다.
도 9A 및 9B는 대조 및 GnTIII 옥수수로부터 당단백질의 MALDI-TOF 질량 스펙트럼을 나타낸다. (A) 대조 옥수수 및 (B) 선택된 GnTIII-옥수수로부터 단리된 당단백질의 N-글리칸의 질량 스펙트럼을 비교한다. GnTIII 옥수수는 인간 GnTIII-유전자로의 형질전환을 통해 수득되고, E-PHA를 사용한 렉틴 블롯팅에 의해 선택을 수행하였다. 도 9A 및 9B에 함유된 데이타의 주석에 관해 표 3 참조.
도 10은 c-myc 표지를 갖지 않은 GnTIII의 전체 뉴클레오티드 서열(SEQ ID NO:7)을 나타낸다.
도 11은 대조 및 GnTIII 옥수수-2로부터 당단백질의 MALDI-TOF 질량 스펙트럼을 나타낸다.
도 12는 GnTIII 유전자의 발현에 기인하여 변경된 렉틴 결합에 대하여 트랜스제닉 옥수수 칼루스의 샘플의 대표적인 블롯을 나타낸다.
도 13은 c-myc 에피토프 발현을 위한 트랜스제닉 옥수수 칼루스 샘플의 대표적인 블롯이다.
도 14A 및 14B는 (A) 대조 및 (B) GnTIII 옥수수 식물로부터의 당단백질의 MALDI-TOF 질량 스펙트럼을 나타낸다.
정의
용어 "단백질" 및 "폴리펩티드"란 펩티드 결합을 통해 연결된 아미노산을 포함한 화합물을 지칭하고 이것은 서로 바꾸어 사용될 수 있다. 유전자에 의해 코딩 된 "단백질" 또는 "폴리펩티드"는 유전자에 의해 코딩된 아미노산 서열에 한정되지 않으며, 단백질의 후-번역 변형을 포함한다.
용어 "당단백질"이란 세린 또는 트레오닌(O 글리코실화)의 OH기를 통해 또는 아스파라긴(N 글리코실화)의 아미드 NH2를 통해 결합된, 공유 결합된 당 단위를 갖는 단백질을 지칭한다. "당단백질"은 예를 들면 대부분의 분비된 단백질 (혈청 알부민은 주로 제외된다) 및 혈장 막의 외면에 노출된 단백질을 포함할 수도 있으나 이에 한정되지 않는다. 발견된 당 잔기는 만노스, N 아세틸 글루코사민, N 아세틸 갈락토사민, 갈락토스, 푸코스 및 시알산을 포함하지만, 이에 한정되지 않는다.
단백질 분자의 아미노산 서열을 일컫기 위해 용어 "아미노산 서열"이 인용되는 경우에, "아미노산 서열" 및 유사한 용어, 예컨대 "폴리펩티드" 또는 "단백질"은 아미노산 서열을 열거된 단백질 분자와 결합된 완전한 천연 아미노산 서열로 한정함을 의미하지 않는다. 또한, "아미노산 서열"은 단백질을 코딩하는 핵산 서열로부터 유래될 수 있다.
("주어진 단백질의 일부"에서와 같이) 단백질과 관련하여 사용될 때의 용어 "일부"는 그 단백질의 단편을 지칭한다. 단편의 크기는 4개 아미노산 잔기 내지 전체 아미노산 서열 - 1개 아미노산의 범위일 수 있다.
폴리펩티드와 관련하여 사용될 때 용어 "키메라"는, 함께 클로닝(cloning)되고 번역 후에 단일 폴리펩티드 서열로서 작용하는, 상이한 유전자로부터 수득된 2 이상의 코딩 서열의 발현 생성물을 지칭한다. 키메라 폴리펩티드는 "하이브리드" 폴리펩티드로서 언급된다. 코딩 서열은 동일하거나 상이한 종의 유기체로부터 수 득된 것을 포함한다.
폴리펩티드와 관련하여 사용된 용어 "융합"은 외인성 단백질 단편 (융합 파트너)에 결합된 목적하는 단백질을 함유하는 키메라 단백질을 지칭한다. 융합 파트너는, 목적하는 폴리펩티드의 용해성을 증진시킬 뿐만 아니라, 숙주 세포 또는 상층액 또는 양쪽 모두로부터 재조합 융합 폴리펩티드를 정제할 수 있도록 "친화성 표지"를 제공하는 다양한 기능을 할 수 있다. 원한다면, 정제 후 또는 정제 동안에 목적하는 단백질로부터 융합 파트너가 제거될 수도 있다.
폴리펩티드와 관련하여 사용될 때 용어 "상동체" 또는 "상동성"은 2개의 폴리펩티드 간의 고도의 서열 동일성 또는 3차원 구조 간의 고도의 유사성 또는 활성 부위와 작용 메카니즘 사이의 고도의 유사성을 지칭한다. 바람직한 실시양태에서, 상동성은 대조 서열과 60% 초과의 서열 동일성, 더욱 바람직하게는 75% 초과의 서열 동일성, 더욱 더 바람직하게는 90% 초과의 서열 동일성을 갖는다.
폴리펩티드에 적용될 때, 용어 "실질적인 동일성"은, 2개의 펩티드 서열이 최적으로 정렬될 때, 예컨대 디폴트 간격 중량(default gap weight)을 사용한 프로그램 GAP 또는 BESTFIT에 의하여, 80% 이상의 서열 동일성, 바람직하게는 90% 이상의 서열 동일성, 더욱 바람직하게는 95% 이상의 서열 동일성 또는 그 이상 (예를 들면 99% 서열 동일성)을 공유하는 것을 의미한다. 바람직하게는, 동일하지 않은 잔기 위치는 보존성 아미노산 치환에 의해 달라진다.
폴리펩티드와 관련하여 사용될 때 용어 "변형체" 및 "변이체"는 하나 이상의 아미노산에 의해 서로 상이한 아미노산 서열, 대개 관련된 폴리펩티드를 지칭한다. 변형체는 "보존성" 변화를 가질 수도 있고, 이때 치환된 아미노산은 유사한 구조적 또는 화학적 성질을 갖는다. 보존성 아미노산 치환의 한가지 유형은 유사한 측쇄를 갖는 잔기의 상호변화성을 지칭한다. 예를 들면, 지방족 측쇄를 갖는 아미노산의 군은 글리신, 알라닌, 발린, 류신 및 이소류신이고; 지방족-히드록실 측쇄를 갖는 아미노산의 군은 세린 및 트레오닌이고; 아미드-함유 측쇄를 갖는 아미노산의 군은 아스파라긴 및 글루타민이고; 방향족 측쇄를 갖는 아미노산의 군은 페닐알라닌, 티로신 및 트립토판이고; 염기성 측쇄를 갖는 아미노산의 군은 리신, 아르기닌 및 히스티딘이고; 황-함유 측쇄를 갖는 아미노산의 군은 시스테인 및 메티오닌이다. 바람직한 보존성 아미노산 치환기는 발린(V)-류신(L)-이소류신(I), 페닐알라닌(F)-티로신(Y), 리신(K)-아르기닌(R), 알라닌(A)-발린(V) 및 아스파라긴(N)-글루타민(Q)이다. 더욱 드물게, 변형체는 "비-보존성" 변화를 가질 수도 있다 (예를 들면, 글리신을 트립토판으로 대체). 유사한 중요하지 않은 변형은 아미노산 결실 또는 삽입(즉, 추가) 또는 양쪽 모두를 포함할 수도 있다. 생물학적 활성을 파괴하지 않으면서 얼마나 많은 아미노산 잔기가 치환되거나, 삽입되거나 결실될 수 있는지를 결정하는 지침은 당 기술분야에 공지된 컴퓨터 프로그램, 예를 들면 DNA스타 소프트웨어를 사용하여 찾아낼 수 있다. 변형체는 기능 분석으로 시험될 수 있다. 바람직한 변형체는 10% 미만, 바람직하게는 5% 미만, 더욱 더 바람직하게는 2% 미만의 변화를 갖는다 (치환, 결실 등).
폴리펩티드와 관련하여 사용될 때 용어 "도메인"은 특유의 구조적 및(또는) 기능적 특징을 갖는 폴리펩티드의 소구획을 지칭한다; 전형적으로 이 특징은 다양 한 폴리펩티드에 걸쳐 유사하다. 소구획은 접힘 또는 다른 배위로 인하여 밀접하게 위치하거나 협력하에 작용하는 아미노산을 포함할 수도 있긴 하지만, 전형적으로 연속 아미노산을 포함한다.
용어 "유전자"는 RNA의 생성을 위해 필요한 코딩 서열 또는 폴리펩티드 또는 그의 전구체 (예를 들면, 프로인슐린)을 포함하는 핵산(예를 들면, DNA 또는 RNA) 서열을 지칭한다. 기능적 폴리펩티드는, 바람직한 활성 또는 기능적 성질 (예를 들면, 효소 활성, 리간드 결합, 신호 전도 등)이 보유되는 한, 전체 길이 코딩 서열 또는 코딩 서열의 일부에 의해 코딩될 수도 있다. 유전자와 관련하여 사용될 때 용어 "일부"는 그 유전자의 단편을 지칭한다. 단편의 크기는 수 개 뉴클레오티드 (예를 들면 10개 뉴클레오티드) 내지 전체 유전자 서열 - 1개 뉴클레오티드의 범위를 가질 수 있다. 즉, "유전자의 적어도 일부를 포함하는 뉴클레오티드"는 유전자 또는 전체 유전자의 단편을 포함할 수도 있다.
또한, 용어 "유전자"는 구조 유전자의 코딩 영역을 포함하고, 유전자가 전체 길이 mRNA의 길이에 상응하도록 어느 한쪽 말단에서 약 1kb의 거리에 대해 5' 및 3' 말단 양쪽 위의 코딩 영역에 인접하여 위치한 서열을 포함한다. 코딩 영역의 5'에 위치하고 mRNA위에 존재하는 서열을 5' 비-번역 서열이라 일컫는다. 코딩 영역의 3' 또는 하류에 위치하고 mRNA 위에 존재하는 서열을 3' 비-번역 서열이라 일컫는다. 용어 "유전자"는 유전자의 cDNA 및 게놈 형태 양쪽 모두를 포함한다. 유전자 형태 또는 유전자의 클론은 "인트론" 또는 "개재 영역" 또는 "개재 서열"이라 불리는 비-코딩 서열로 방해된 코딩 영역을 함유한다. 인트론은 핵 RNA (hnRNA)으 로 전사된 유전자의 단편이고; 인트론은 인핸서와 같은 조절 요소를 함유할 수도 있다. 인트론은 핵 또는 1차 전사체로부터 제거되거나 "접합 제거(splice out)"되고; 따라서 인트론은 전령 RNA (mRNA) 전사체에 존재하지 않는다. 미완성 폴리펩티드 내의 아미노산의 서열 또는 순서를 규정하기 위하여 번역 동안에 mRNA가 작용한다.
인트론을 함유하는 것 외에도, 유전자의 게놈 형태는 RNA 전사체에 존재하는 서열의 5' 및 3' 말단 양쪽 위에 위치한 서열을 포함할 수도 있다. 이러한 서열은 "플랭킹(flanking)" 서열 또는 영역 (이러한 플랭킹 서열은 mRNA 전사체 위에 존재하는 비-번역 서열에 대해 5' 또는 3'에 위치한다)이라 일컬어진다. 5' 플랭킹 영역은 유전자의 전사를 조절하거나 영향을 미치는 프로모터 및 인핸서와 같은 조절 서열을 함유할 수도 있다. 3' 플랭킹 영역은 전사, 후전사 분열 및 폴리아데닐화의 종결을 지시하는 서열을 함유할 수도 있다.
유전자와 관련하여 사용될 때 용어 "이종"은 천연 환경(즉, 사람의 손에 의해 변경되지 않은 환경)에 존재하지 않는 인자를 코딩하는 유전자를 지칭한다. 예를 들면, 이종 유전자는 다른 종 내에 도입된 하나의 종으로부터의 유전자를 포함한다. 이종 유전자는 일부 방식(예를 들면, 변이되거나, 다중 복제로 첨가되거나, 비-천연 프로모터 또는 인핸서 서열에 연결되는 등의 방식)으로 변화된 유기체에 천연인 유전자를 포함한다. 이종 유전자는 유전자의 cDNA 형태를 포함하는 유전자 서열을 포함할 수도 있고; cDNA 서열은 (mRNA를 생성하기 위해) 센스(sense) 배향으로 또는 (mRNA 전사체에 상보성인 안티-센스 RNA 전사체를 생성하기 위해) 안티- 센스(anti-sense) 배향으로 발현될 수도 있다. 이종 유전자는, 이종 유전자에 의해 코딩된 단백질을 위한 유전자 또는 염색체 내의 유전자 서열과 자연적으로 결합되지 않거나, 또는 자연에서 발견되지 않는 염색체의 일부 (예를 들면, 정상적으로 발현되지 않는 유전자 좌에서 발현된 유전자)와 결합된 것으로 밝혀진, 프로모터와 같은 조절 요소를 포함하는 뉴클레오티드 서열에 이종 유전자 서열이 전형적으로 결합된다는 점에서, 내인성 유전자와 구별된다.
"이종 당단백질"은 식물 숙주 체계 이외의 종으로부터 유래된 당단백질이다. 당단백질은 항체, 호르몬, 성장 인자, 및 성장 인자 수용체, 항원, 사이토카인 및 혈액 생성물을 포함할 수 있지만 이에 한정되지 않는다.
"식물 숙주 체계"는, 이에 한정되지 않지만 식물 세포, 식물 기관 및(또는) 식물 조직을 포함하는 식물 또는 그의 일부를 포함할 수도 있으나 이에 한정되지 않는다. 식물은 하나의 자엽 또는 종자 잎을 갖는 배아를 갖는 개화 식물인 외떡잎(모노코트)일 수도 있고, 이것은 백합, 풀, 옥수수(제아 마이스(Zea mays)), 쌀, 귀리, 밀 및 보리를 포함한 곡류, 난초, 아이리스, 양파 및 야자를 포함하지만 이에 한정되지 않는다. 또한, 식물은 쌍떡잎(다이코트(dicot))일 수도 있고, 담배(니코티아나(Nicotiana)), 토마토, 감자, 콩류 (예, 알파파 및 대두), 장미, 데이지, 선인장, 제비꽃 및 좀개구리밥을 포함하지만 이에 한정되지 않는다. 식물은 이끼일 수도 있고, 이것은 피스코미트렐라 파텐스(Physcomitrella patens)를 포함하지만 이에 한정되지 않는다. 본 발명은, 상기 GnTIII을 코딩하는 핵산을 식물 또는 그의 일부 내로 도입시키고, 상기 GnTIII을 발현하고, 상기 GnTIII을 발현하 는 상기 식물 또는 그의 일부를 단리함으로써, 식물 숙주 체계에서 상기 이등분 GlcNAc를 수득하는 방법에 관한 것이다.
용어 "목적하는 뉴클레오티드 서열" 또는 "목적하는 핵산 서열"이란, 당업자에 의해 조작되는 것이 어떠한 이유 (예를 들면, 질병을 치료하고, 개선된 품질을 부여하는 등의 이유)에서 바람직한 것으로 간주될 수 있는 임의의 뉴클레오티드 서열 (예, RNA 또는 DNA)을 지칭한다. 이러한 뉴클레오티드 서열은 구조 유전자 (예를 들면, 리포터 유전자, 선택 마커 유전자, 발암유전자, 약물 내성 유전자, 성장 인자 등)의 코딩 서열 및 mRNA 또는 단백질 생성물을 코딩하지 않는 비-코딩 조절 서열 (예, 프로모터 서열, 폴리아데닐화 서열, 종결 서열, 인핸서 서열 및 기타 서열)을 포함하지만, 이에 한정되지 않는다. 본 발명은 목적하는 뉴클레오티드 서열에 의해 코딩되는 이종 단백질을 하나 이상의 하이브리드 효소와 함께 발현하는 숙주 세포를 의도한다.
유전자 또는 뉴클레오티드 또는 핵산 서열에 관련하여 본 명세서에 사용된 용어 "구조적"이란, 최종 발현 생성물이 단백질 (예컨대 효소 또는 구조적 단백질), rRNA, sRNA, tRNA 등인 유전자 또는 뉴클레오티드 또는 핵산 서열을 지칭한다.
용어 "올리고뉴클레오티드" 또는 "폴리뉴클레오티드" 또는 "뉴클레오티드" 또는 "핵산"은 2 개 이상, 바람직하게는 3 개 이상, 통상 10 개 이상의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드로 이루어진 분자를 지칭한다. 실제 크기는 많은 인자에 따라 좌우되며, 이것은 다시 궁극적인 기능 또는 올리고뉴클레오티드 의 용도에 따라 좌우된다. 올리고뉴클레오티드는 화학 합성, DNA 복제, 역 전사, 또는 이들의 조합을 포함한 임의의 방법으로 생성될 수도 있다.
용어 "유전자를 코딩하는 뉴클레오티드 서열을 갖는 올리고뉴클레오티드" 또는 특정된 폴리펩티드를 "코딩하는 핵산 서열"은, 유전자의 코딩 영역을 포함하는 핵산, 또는 다시 말해서 유전자 생성물을 코딩하는 핵산 서열을 지칭한다. 코딩 영역은 cDNA, 게놈 DNA 또는 RNA 형태로 존재할 수도 있다. DNA 형태로 존재할 때, 올리고뉴클레오티드는 단일 가닥 (즉, 센스 가닥) 또는 이중 가닥일 수도 있다. 목적하는 RNA 전사체의 전사의 적절한 개시 및(또는) 올바른 처리를 가능하게 하기 위해 필요하다면, 인핸서/프로모터, 스플라이스 접합, 폴리아데닐화 신호 등과 같은 적절한 조절 요소가 유전자의 코딩 영역에 근접하여 위치할 수도 있다. 또한, 본 발명의 발현 벡터에서 사용되는 코딩 영역은 내인성 인핸서/프로모터, 스플라이스 접합, 개재 서열, 폴리아데닐화 신호 등, 또는 내인성 및 외인성 조절 요소의 조합을 함유할 수도 있다.
핵산 분자와 관련하여 사용될 때 용어 "재조합"은, 분자 생물학적 기술에 의해 함께 연결된 핵산의 분절을 포함하는 핵산 분자를 지칭한다. 단백질 또는 폴리펩티드와 관련하여 사용될 때 용어 "재조합"은 재조합 핵산 분자를 사용하여 발현되는 단백질 분자를 지칭한다.
본 명세서에 사용된 용어 "상보적" 또는 "상보성"은 염기쌍 법칙에 의해 관련된 뉴클레오티드 서열과 관련하여 사용된다. 예를 들면, 서열 5'-AGT-3'은 서열 5'-ACT-3'에 상보적이다. 상보성은 "부분" 또는 "전체"일 수 있다. "부분" 상보 성은 하나 이상의 핵산 염기가 염기 쌍 법칙에 따라 매칭(matching)되지 않는 것이다. 핵산 사이의 "전체" 또는 "완전" 상보성은 각각의 모든 핵산 염기가 염기 쌍 법칙 아래에서 다른 염기와 매칭되는 것이다. 핵산 가닥 사이의 상보성 정도는 핵산 가닥 사이의 혼성화 효율 및 강도에 상당한 영향을 미친다.
본 명세서에 사용된 핵산 서열의 "보체"는, 핵산이 핵산 서열의 핵산과 완전 상보성을 나타내는 경우의 뉴클레오티드 서열을 지칭한다. 예를 들면, 본 발명은 SEQ ID NO:1의 보체를 의도한다.
핵산과 관련하여 사용될 때 용어 "상동성"은 상보성의 정도를 지칭한다. 부분 상동성(즉, 부분 동일성) 또는 완전 상동성 (즉, 완전 동일성)이 존재할 수도 있다. 부분 상보성 서열은 완전 상보성 서열이 표적 핵산에 혼성화되는 것을 적어도 부분적으로 억제하는 것이고, "실질적으로 상동성"이라는 기능적 용어를 사용하여 일컬어진다. 낮은 엄격성 조건 하에서 혼성화 분석(서던(southern) 또는 노던 블로트(nothern blot), 용액 혼성화 등)을 사용하여, 표적 서열에 대한 완전 상보성 서열의 혼성화 억제를 시험할 수도 있다. 실질적으로 상동성 서열 또는 프로브 (즉, 다른 목적하는 올리고뉴클레오티드에 혼성화될 수 있는 올리고뉴클레오티드)는, 낮은 엄격성 조건 하에서 완전 상동성 서열이 표적에 결합(즉, 혼성화)하는 것을 경쟁하고 억제한다. 낮은 엄격성 조건이 비-특이적 결합이 허용되는 정도를 의미하는 것은 아니며, 낮은 엄격성 조건은 2개 서열의 상호 결합이 특이적 (즉, 선택적) 상호작용임을 필요로 한다. 심지어 상보성의 일부(예를 들면 약 30% 미만 동일성)가 결여된 두번째 표적을 사용함으로써 비-특이적 결합의 부재를 시험할 수 도 있다; 비-특이적 결합의 부재 하에서는 프로브가 두번째 비-상보성 표적에 혼성화되지 않을 것이다.
cDNA 또는 게놈 클론과 같은 이중-가닥 핵산 서열과 관련하여 사용될 때, 용어 "실질적으로 상동성"은 아래 기재된 것과 같이 낮은 엄격성 조건 하에서 이중-가닥 핵산 서열의 한쪽 또는 양쪽 가닥에 혼성화될 수 있는 프로브를 지칭한다.
단일-가닥 핵산 서열과 관련하여 사용될 때, 용어 "실질적으로 상동성"은 아래 기재된 것과 같은 낮은 엄격성 조건 하에서 단일-가닥 핵산 서열에 혼성화될 수 있는 프로브를 지칭한다.
2 개 이상의 폴리뉴클레오티드 사이의 서열 관계를 설명하기 위하여 하기 용어들이 사용된다: "대조 서열", "서열 동일성", "서열 동일성의 퍼센트" 및 "실질적인 동일성". "대조 서열"은 서열 비교를 위한 기초로서 사용되는 정의된 서열이고; 대조 서열은 더욱 큰 서열의 부분집합, 예를 들면 서열 목록에 주어진 전길이 cDNA 서열의 분절일 수 있거나, 또는 전체 유전자 서열을 포함할 수도 있다. 일반적으로, 대조 서열은 20개 이상의 뉴클레오티드 길이, 종종 적어도 25개 이상 뉴클레오티드 길이이고, 종종 50개 이상의 뉴클레오티드 길이이다. 2개의 폴리뉴클레오티드가 각각 (1) 2개의 폴리뉴클레오티드 사이에서 유사한 서열 (즉, 완전 폴리뉴클레오티드 서열의 일부)을 포함할 수도 있고 (2) 2개의 폴리뉴클레오티드 사이에서 분기된 서열을 추가로 포함할 수도 있기 때문에, 2개의 폴리뉴클레오티드의 서열을 "비교 윈도우"와 비교하여 서열 유사성의 국소 영역을 동정하고 비교함으로써 2개(또는 그 이상)의 폴리뉴클레오티드 사이의 서열 비교를 수행한다. 본 명세 서에 사용된 "비교 윈도우"란, 폴리뉴클레오티드 서열이 20개 이상의 연속 뉴클레오티드의 대조 서열과 비교될 수 있고, 비교 윈도우에 있는 폴리뉴클레오티드 서열의 일부가 2개 서열의 최적 정렬을 위하여 대조 서열(첨가 또는 결실을 포함하지 않음)에 비해 20% 이하의 첨가 또는 결실(즉, 간격)을 포함할 수도 있는, 20개 이상의 연속 뉴클레오티드 위치의 개념상의 분절을 지칭한다. 비교 윈도우를 정렬하기 위한 서열의 최적의 서열 정렬은, 스미스 및 워터맨의 국소 상동성 알고리즘[Smith and Waterman, Adv.Appl.Math. 2: 482(1981)], 니들맨 및 원쉬의 상동성 정렬 알고리즘 [Needleman and Wunsch, J.Mol.Biol. 48:443 (1970)], 피어슨 및 립맨의 유사성 방법 조사 [Pearson and Lipman, Proc.Natl.Acad.Sci. (USA) 85:2444 (1988)], 이러한 알고리즘들의 컴퓨터 임플러맨테이션 (위스콘신 제네틱스 소프트웨어 패키지 릴리즈 7.0에서의 GAP, BESTFIT, FASTA 및 TFASTA, 제네틱스 컴퓨터 그룹(Genetics Computer Group), 575 Science Dr., Madison, Wis.) 또는 조사에 의해 수행될 수 있으며, 다양한 방법에 의해 생성된 최선의 정렬 (즉, 비교 윈도우에 비해 최고 퍼센트의 상동성이 얻어짐)이 선택된다. 용어 "서열 동일성"은, 비교 윈도우에 비해 2개의 폴리뉴클레오티드 서열이 동일함 (즉, 뉴클레오티드-대-뉴클레오티드 기준)을 의미한다. 용어 "서열 동일성의 퍼센트"는, 2개의 최적 정렬 서열을 비교 윈도우와 비교하고, 양쪽 서열에서 동일한 핵산 염기 (예, A, T, C, G, U 또는 I)가 발생되는 위치의 수를 결정하여 매칭된 위치의 수를 얻고, 매칭된 위치의 수를 비교 윈도우에 있는 위치의 전체 수로 나누고 (다시 말해서, 윈도우 크기), 결과를 100으로 곱하여 서열 동일성의 퍼센트를 얻음으로써 계산된다. 본 명세서에 사용된 용어 "실질적 동일성"은 폴리뉴클레오티드 서열의 특징을 나타내고, 폴리뉴클레오티드는 대조 서열과 비교시에 20개 이상의 뉴클레오티드 위치의 비교 윈도우, 종종 적어도 25-50개의 뉴클레오티드의 윈도우에 걸쳐 85% 이상의 서열 동일성, 바람직하게는 적어도 90 내지 95%의 서열 동일성, 더욱 일반적으로 99% 이상의 서열 동일성을 갖는 서열을 포함하며, 여기에서 서열 동일성의 퍼센트는 대조 서열을 비교 윈도우에 걸쳐 대조 서열의 전체 20% 이하의 결실 또는 첨가를 포함할 수도 있는 폴리뉴클레오티드 서열과 비교함으로써 계산된다. 대조 서열은 더욱 큰 서열의 부분집합, 예를 들면 본 발명에 청구된 조성물의 전체 길이 서열의 분절일 수도 있다.
용어 "혼성화"란 상보성 핵산의 쌍합(pairing)을 지칭한다. 혼성화 및 하이브리화 강도 (즉, 핵산 사이의 결합 강도)는 핵산 사이의 상보성 정도, 관련된 조건의 엄격성, 형성된 하이브리드의 Tm, 및 핵산 내의 G:C 비율과 같은 인자에 의해 영향을 받는다. 구조 내에 상보성 핵산의 쌍합을 함유하는 단일 분자는 "자기-혼성화"라고 일컬어진다.
용어 "Tm"은 핵산의 "융점"을 지칭한다. 융점은 이중-가닥 핵산 분자의 집단이 단일 가닥으로 반-해리되어지는 온도이다. 핵산의 Tm을 계산하기 위한 방정식은 당 기술분야에 공지되어 있다. 표준 대조에 의해 나타낸 바와 같이, Tm 값의 단순 견적은 핵산이 1M NaCl로 수용액 중에 있을 때 방정식:Tm=81.5+0.41 (% G+C)에 의해 계산될 수도 있다 (예를 들면, [Anderson and Young, Quantitative Filter Hybridization, Nucleic Acid Hybridization [1985]] 참조). 다른 참고문헌은 Tm 의 계산을 위해 구조 뿐만 아니라 서열 특징을 고려하는 더욱 복잡한 계산을 포함한다.
용어 "엄격성"이란 핵산 혼성화가 수행되는 온도, 이온 강도, 및 유기 용매와 같은 기타 화합물의 존재의 조건을 지칭한다. "고 엄격성" 조건을 사용하면, 높은 빈도의 상보성 염기 서열을 갖는 핵산 단편 사이에서만 핵산 염기 쌍합이 일어난다. 따라서, 유전적으로 다양한 유기체로부터 유래된 핵산에서는, 상보성 서열의 빈도가 대개 낮기 때문에 "낮은" 엄격성 조건이 종종 요구된다.
핵산 혼성화와 관련하여 사용될 때 "낮은 엄격성 조건"은, 5X SSPE (43.8 g/l NaCl, 6.9 g/l NaH2PO4 (H2O 및 1.85 g/l EDTA, NaOH로 7.4로 조정된 pH), 0.1% SDS, 5X 덴하르트(Denhardt) 시약 [50X 덴하르트는 500ml당 5g 피콜(Ficoll) (Type 400, 파마시아(Pharmacia)), 5g BSA (프렉션(Fraction) V; 시그마)를 함유한다] 및 100 ㎍/ml의 변성 연어 정액 DNA로 구성된 용액 중에서 42℃에서 결합 또는 혼성화한 다음, 약 500개 뉴클레오티드 길이의 프로브가 사용될 때 42℃에서 5X SSPE, 0.1% SDS를 포함하는 용액 중에서 세척하는 것에 등가인 조건을 포함한다.
핵산 혼성화와 관련하여 사용될 때 "중간 엄격성 조건"은, 5X SSPE (43.8 g/l NaCl, 6.9 g/l NaH2PO4 (H2O 및 1.85 g/l EDTA, NaOH로 7.4로 조정된 pH), 0.5% SDS, 5X 덴하르트 시약 및 100 ㎍/ml의 변성 연어 정액 DNA로 구성된 용액 중에서 42℃에서 결합 또는 혼성화한 다음, 약 500개 뉴클레오티드 길이의 프로브가 사용될 때 42℃에서 1.0X SSPE, 1.0% SDS를 포함하는 용액 중에서 세척하는 것에 등가 인 조건을 포함한다.
핵산 혼성화와 관련하여 사용될 때 "높은 엄격성 조건"은 5X SSPE (43.8 g/l NaCl, 6.9 g/l NaH2PO4 (H2O 및 1.85 g/l EDTA, NaOH로 7.4로 조정된 pH), 0.5% SDS, 5X 덴하르트 시약 및 100 ㎍/ml의 변성 연어 정액 DNA로 구성된 용액 중에서 42℃에서 결합 또는 혼성화한 다음, 약 500개 뉴클레오티드 길이의 프로브가 사용될 때 42℃에서 0.1X SSPE, 1.0% SDS를 포함하는 용액 중에서 세척하는 것에 등가인 조건을 포함한다.
낮은 엄격성 조건을 포함하기 위해 다수의 등가인 조건이 사용될 수 있는 것으로 알려져 있다; 프로브의 길이 및 성질 (DNA, RNA, 염기 조성), 표적의 성질(용액중에 존재하거나 고정화된 DNA, RNA, 염기 조성) 및 염과 기타 성분의 농도 (예를 들면, 포름아미드, 덱스트란 설페이트, 폴리에틸렌 글리콜의 존재 또는 부재)와 같은 요인이 고려되고, 상기 기재된 조건과 상이하지만 그와 등가인 낮은 엄격성 혼성화 조건을 생성하기 위하여 혼성화 용액을 바꿀 수도 있다. 또한, 당 기술분야에는, 높은 엄격성 조건 하에서 혼성화를 촉진하는 조건이 공지되어 있다 (예를 들면, 혼성화 및(또는) 세척 단계의 온도를 증가시키고, 혼성화 용액 중에서 포름아미드를 사용하는 등).
또한, 목적하는 혼성화 조건과 관련될 때, 혼성화 조건에 관련된 용어 "등가의"는, 혼성화 조건 및 당해 혼성화 조건이 동일한 범위의 상동성 %를 갖는 핵산 서열을 혼성화시킨다는 것을 의미한다. 예를 들면, 당해 혼성화 조건이 첫번째 핵 산 서열에 대해 50% 내지 70% 상동성을 갖는 다른 핵산 서열과 첫번째 핵산 서열의 혼성화를 일으키는 경우에, 다른 혼성화 조건도 첫번째 핵산 서열에 대해 50% 내지 70% 상동성을 갖는 다른 핵산 서열과 첫번째 핵산 서열의 혼성화를 일으킨다면, 이러한 다른 혼성화 조건이 당해 혼성화 조건과 등가인 것으로 언급된다.
핵산 혼성화와 관련하여 사용될 때, 낮거나 높은 엄격성 조건을 포함하는 다수의 등가 조건들이 사용될 수 있다는 것이 당 기술분야에 알려져 있으며; 프로브의 길이 및 성질(DNA, RNA, 염기 조성), 표적의 성질 (용액중에 존재하거나 또는 고정화된 DNA, RNA, 염기 조성) 등 및 염과 기타 성분의 농도 (예를 들면, 포름아미드, 덱스트란 설페이트, 폴리에틸렌 글리콜의 존재 또는 부재)와 같은 요인이 고려되고, 상기 기재된 조건과 상이하지만 그에 등가인 낮거나 높은 엄격성 혼성화 조건을 생성하기 위해 혼성화 용액을 바꿀 수도 있다.
유전자와 관련하여 사용될 때 용어 "와일드타입(wildtype)"은 자연 발생 원천으로부터 단리된 유전자의 특징을 갖는 유전자를 지칭한다. 유전자 생성물과 관련하여 만들어질 때 용어 "와일드타입"은 자연 발생 원천으로부터 단리된 유전자 생성물의 특징을 갖는 유전자 생성물을 지칭한다. 어떤 대상에 대해 적용될 때 용어 "자연 발생"은 그 대상이 자연에서 발견될 수 있다는 사실을 지칭한다. 예를 들면, 자연의 원천으로부터 단리될 수 있고 실험실에서 사람에 의해 의도적으로 변경되지 않은 유기체 (바이러스 포함)에 존재하는 폴리펩티드 또는 폴리뉴클레오티드 서열은 자연-발생적이다. 와일드타입 유전자는 종종 집단에서 가장 빈번히 관찰되는 유전자이고, 따라서 임의로 유전자의 "정상" 또는 "와일드타입" 형태를 표 시한다. 반대로, 유전자 또는 유전자 생성물과 관련하여 언급될 때 용어 "변형된" 또는 "변이체"는, 각각 와일드타입 유전자 또는 유전자 생성물과 비교시에 서열 및(또는) 기능적 성질의 변형 (즉, 변화된 특징)을 나타내는 유전자 또는 유전자 생성물을 지칭한다. 천연 발생 변이체가 단리될 수 있음이 주목되고; 이들은 와일드타입 유전자 또는 유전자 생성물에 비해 변화된 특징을 갖는다는 사실에 의해 동정된다.
즉, 뉴클레오티드 서열과 관련하여 사용될 때 용어 "변형체" 및 "변이체"는, 다른 보통의 관련된 뉴클레오티드 산 서열과는 하나 이상의 뉴클레오티드가 상이한 핵산 서열을 지칭한다. "변형"은 2개의 상이한 뉴클레오티드 서열 간의 차이를 나타내고; 전형적으로 하나의 서열은 대조 서열이다.
용어 "다형 좌(polymorphic locus)"란 집단의 요소 사이에서 변형을 나타내는 집단에 존재하는 유전자 좌를 지칭한다(다시 말해서, 가장 일반적인 대립유전자는 0.95 미만의 빈도수를 갖는다). 따라서, "다형성"이란 집단에서 2 가지 이상의 변형체 형태의 특징이 존재함을 지칭한다. "단일 뉴클레오티드 다형성" (또는 SNP)은 적어도 2개의 상이한 뉴클레오티드의 하나에 의해 차지될 수 있는 단일 염기의 유전자 좌를 지칭한다. 반대로, "단형성 좌" 란 집단의 요소 사이에서 변형이 거의 또는 완전히 보이지 않는 유전자 좌를 지칭한다 (일반적으로, 가장 일반적인 대립유전자가 집단의 유전자 풀에서 0.95의 빈도수를 초과하는 좌인 것으로 간주된다).
"프레임시프트 변이(frameshift mutation)"란 뉴클레오티드 서열에서의 변이 를 지칭하고, 통상 단백질을 코딩하는 구조 DNA 서열의 올바른 판독 프레임에서의 변화를 가져오는 단일 뉴클레오티드 (또는 2 또는 4개의 뉴클레오티드)의 삽입 또는 결실로부터 얻어진다. 변경된 판독 프레임은 통상 번역된 아미노산 서열을 변화시키거나 끝을 절단시킨다.
"스플라이스 변이"란 올바른 RNA 스플라이싱에 영향을 미침으로써 유전자 발현에 영향을 미치는 돌연변이를 지칭한다. 스플라이싱 변이는 스플라이스 부위를 변경시키는 인트론-엑손 경계에서의 돌연변이에 기인할 수도 있다.
용어 "검출 분석"이란, 서열 또는 변형체 핵산 서열의 존재 또는 부재를 검출하거나 (예를 들면 GnTIII 유전자, SEQ ID NO:1, 도 4A에서와 같이 특정한 유전자의 주어진 대립유전자에서의 변이 또는 다형성) 또는 특정한 단백질(예를 들면, GnTIII, SEQ ID NO:2, 도 4B)의 존재 또는 부재 또는 특정한 단백질 (예, GnTIII 활성)의 구조 또는 활성 또는 효과를 검출하거나, 특정한 단백질 (예, N-결합 글리칸) 위의 글리코실화 잔기를 검출하거나, 또는 특정한 단백질의 변형체의 존재 또는 부재를 검출하기 위한 분석을 지칭한다.
용어 "안티센스"란, 데옥시리보뉴클레오티드 잔기의 서열이 DNA 이중가닥의 센스 가닥에서 데옥시리보뉴클레오티드 잔기의 서열과 관련하여 역 5'→ 3' 배향으로 존재하는 것을 지칭한다. DNA 이중가닥의 "센스 가닥"은 자연 상태에 있는 세포에 의해 "센스 mRNA"로 전사된 DNA 이중가닥 내의 가닥을 지칭한다. 즉, "안티센스" 서열은 DNA 이중가닥에 있는 비-코딩 가닥과 동일한 서열을 갖는 서열이다. 용어 "안티센스 RNA"는, 표적 1차 전사체 또는 mRNA의 전부 또는 일부와 상보성이 고, 1차 전사체 또는 mRNA의 처리, 수송 및(또는) 번역을 방해함으로써 표적 유전자의 발현을 봉쇄하는 RNA 전사체를 지칭한다. 안티센스 RNA의 상보성은, 다시 말해서, 5' 비-코딩 서열, 3' 비-코딩 서열, 인트론 또는 코딩 서열에서 특정한 유전자 전사체의 일부와 만들어질 수 있다. 또한, 본 명세서에 사용된 것과 같이, 안티센스 RNA는 유전자 발현을 봉쇄하는 안티센스 RNA의 효능을 증가시키는 리소자임 서열의 영역을 함유할 수도 있다. "리보자임"이란 촉매적 RNA를 지칭하고, 서열-특이적 엔도리보뉴클레아제를 포함한다. "안티센스 억제"란 표적 단백질의 발현을 막을 수 있는 안티센스 RNA 전사체의 생성을 지칭한다.
"증폭"은 주형 특이성과 관련된 핵산 복제의 특별한 경우이다. 이것은 비-특이적 주형 복제(즉, 주형-의존성이지만 특이적 주형에 의존되지 않는 복제)와는 대조되는 것으로 보인다. 여기에서, 주형 특이성은 복제(즉, 적절한 폴리뉴클레오티드 서열의 합성) 충실성 및 뉴클레오티드 (리보- 또는 데옥시리보) 특이성과 구별된다. 주형 특이성은 종종 "표적" 특이성의 측면에서 설명된다. 표적 서열은, 다른 핵산으로부터 분류되는 것이 추구된다는 점에서 "표적"이다. 증폭 기술은 이러한 분류를 위해 주로 고안되었다.
주형 특이성은 효소의 선택에 의한 대부분의 증폭 기술에서 달성된다. 증폭 효소는 이들이 사용되는 조건 하에서 핵산의 이종 혼합물 중의 핵산의 특이적 서열 만을 처리하는 효소이다. 예를 들면 Q∃ 복제효소의 경우에, MDV-1 RNA는 복제효소에 대한 특이적 주형이다 (Kacian 등, Proc.Natl.Acad.Sci. USA, 69: 3038, 1972). 다른 핵산은 이러한 증폭 효소에 의해 복제되지 않을 것이다. 유사하게, T7 RNA 폴리머라제의 경우에, 이러한 증폭 효소는 그 자체의 프로모터를 위해 엄격한 특이성을 갖는다 [Chamberlain 등, Nature, 228:227, 1970]. T4 DNA 리가제의 경우에, 효소는 2개의 올리고뉴클레오티드 또는 폴리뉴클레오티드를 결찰(ligation)시키지 않을 것이고, 이때 결찰 접합부에서 올리고뉴클레오티드 또는 폴리뉴클레오티드 기질과 주형 사이의 미스매칭(mismatching)이 존재한다 [Wu and Wallace, Genomics, 4:560, 1989]. 마지막으로, 고온에서의 작용 능력에 의하여, Taq 및 Pfu 폴리머라제는 프라이머에 의해 결합되고 한정된 서열에 대해 높은 특이성을 나타낸다는 것이 밝혀졌으며; 고온은 표적 서열과의 프라이머 혼성화에 유리하지만 비-표적 서열과의 혼성화에는 유리하지 않은 열역학적 조건을 일으킨다[H.A.Erlich(ed.), PCR 테크놀로지, 스톡톤 프레스, 1989].
용어 "증폭가능한 핵산"은 어떠한 증폭 방법에 의해 증폭될 수 있는 핵산을 지칭한다. "증폭가능한 핵산"은 대개 "샘플 주형"을 포함하는 것으로 의도된다.
용어 "샘플 주형"이란, 표적 (이하 정의됨)의 존재를 위해 분석된 샘플로부터 유래된 핵산을 지칭한다. 반대로, 샘플에 존재하거나 존재하지 않을 수도 있는 샘플 주형 이외의 핵산과 관련하여 "배경 주형(background template)"이 사용된다. 배경 주형은 종종 고의가 아니다. 이것은 캐리오버(carryover)의 결과일 수도 있거나, 샘플로부터 정제하고자 하는 핵산 오염물의 존재에 기인할 수도 있다. 예를 들면, 검출하고자 하는 것 이외의 유기체로부터의 핵산은 시험 샘플 중의 배경으로서 존재할 수도 있다.
용어 "프라이머"는 정제된 제한 소화물로서 자연적으로 발생되든지 합성에 의해 생성되든지 간에 올리고뉴클레오티드를 지칭하고, 이것은 핵산 가닥에 상보성인 프라이머 연장 생성물의 합성을 유발하는 조건(다시 말해서, 뉴클레오티드 및 DNA 폴리머라제와 같은 유도제의 존재하에서 적절한 온도 및 pH에서) 하에 놓여질 때 합성 개시점으로서 작용할 수 있다. 프라이머는 증폭에서의 최대 효능을 위해 바람직하게는 단일 가닥이지만, 또한 이중 가닥일 수도 있다. 이중 가닥이라면, 연장 생성물을 제조하기 위해 사용하기 전에 가닥을 분리하기 위해 프라이머를 먼저 처리한다. 바람직하게는, 프라이머는 올리고데옥시리보뉴클레오티드이다. 프라이머는 유도제의 존재하에서 연장 생성물의 합성을 준비시키기 위해 충분히 길어야 한다. 프라이머의 실제 길이는 온도, 프라이머의 공급원 및 방법의 용도를 포함한 여러 요인에 따라 좌우될 것이다.
용어 "프로브"는, 정제된 제한 소화물에서와 같이 자연적으로 발생되든지, 또는 합성에 의해, 재조합에 의해 또는 PCR 증폭에 의해 생성되든지 간에, 올리고뉴클레오티드 (다시 말해서, 뉴클레오티드의 서열)을 지칭하며, 이것은 다른 올리고뉴클레오티드와 혼성화할 수 있다. 프로브는 단일-가닥 또는 이중-가닥일 수도 있다. 프로브는 특정한 유전자 서열의 검출, 동정 및 단리에 유용하다. 본 발명에서 사용되는 프로브는, 이에 한정되지 않지만 효소 (예를 들면, ELISA 뿐만 아니라 효소-기재 조직화학 분석), 형광, 방사능 및 발광 시스템을 포함한 임의의 검출 시스템으로 검출될 수 있도록, 임의의 "리포터 분자"로 표지화되는 것으로 이해된다. 본 발명은 어떠한 특정한 검출 시스템 또는 표지에 한정되는 것으로 해석되지 않는다.
폴리머라제 연쇄 반응과 관련하여 사용될 때 용어 "표적"이란, 폴리머라제 연쇄 반응을 위해 사용되는 프라이머에 의해 결합된 핵산의 영역을 지칭한다. 즉, "표적"은 다른 핵산 서열로부터 분류될 것이 요구된다. "분절"은 표적 서열 내의 핵산의 영역으로서 정의된다.
용어 "폴리머라제 연쇄 반응"("PCR")이란 미국 특허 4,683,195호, 4,683,202호 및 4,965,188호 (K.B.Mullis)의 방법을 지칭하고, 상기 특허는 클로닝 또는 정제 없이 게놈 DNA의 혼합물에 있는 표적 서열의 분절의 농도를 증가시키는 방법을 설명하고 있다. 표적 서열을 증폭시키기 위한 방법은, 목적하는 표적 서열을 함유하는 DNA 혼합물에 2개의 올리고뉴클레오티드 프라이머의 과량을 도입한 다음, DNA 폴리머라제의 존재하에서 열 순환의 정확한 순서를 수행하는 것으로 구성된다. 2개의 프라이머들은 이중 가닥 표적 서열의 각각의 가닥에 상보적이다. 증폭을 실행하기 위하여, 혼합물을 변성시키고, 프라이머를 표적 분자 내에 있는 상보적 서열에 어닐링(annealing)시킨다. 어닐링 후에, 프라이머를 폴리머라제로 연장시켜 상보성 가닥의 새로운 쌍을 형성한다. 목적하는 표적 서열의 고 농도의 증폭된 분절을 얻기 위하여, 변성, 프라이머 어닐링 및 폴리머라제 연장 단계를 여러번 반복할 수 있다 (즉, 변성, 어닐링 및 연장은 하나의 "주기"를 구성하고; 다수의 "주기"가 존재할 수 있다). 프라이머 상호 간의 상대적 위치에 의하여, 목적하는 표적 서열의 증폭된 분절의 길이를 결정하기 때문에 이러한 길이는 조절가능한 매개변수이다. 방법의 반복 측면에 의하여, 이러한 방법은 "폴리머라제 연쇄 반응" (이하 "PCR")이라 일컬어진다. 표적 서열의 목적하는 증폭된 분절이 혼합물 중의 주된 서열 (농도 측면에서)이기 때문에, 이들은 "PCR 증폭"된 것으로 언급된다.
PCR을 사용하여, 게놈 DNA 내의 특정한 표적 서열의 단일 복제를 여러 상이한 방법에 의해 검출가능한 수준까지 증폭시킬 수 있다 (예를 들면, 표지화 프로브로의 혼성화; 비오티닐화 프라이머의 혼입에 이어서 아비딘-효소 접합체 검출; 증폭된 분절 내로 32P-표지화 데옥시뉴클레오티드 트리포스페이트, 예컨대 dCTP 또는 dATP의 혼입). 게놈 DNA에 추가로, 적절한 프라이머 분자 세트를 사용하여 올리고뉴클레오티드 또는 폴리뉴클레오티드 서열을 증폭시킬 수 있다. 특히, PCR 방법 자체에 의해 생성된 증폭된 분절은, 그 자체로, 이후의 PCR 증폭을 위해 효율적인 주형이다.
용어 "PCR 생성물", "PCR 단편" 및 "증폭 생성물"이란, 변성, 어닐링 및 연장의 PCR 단계들의 2 이상의 주기를 완결한 후에, 화합물들의 얻어진 혼합물을 지칭한다. 이 용어들은 하나 이상의 표적 서열의 하나 이상의 분절을 증폭시킨 경우를 포함한다.
용어 "증폭 시약"이란 프라이머, 핵산 주형 및 증폭 효소를 제외하고 증폭을 위해 필요한 시약 (데옥시리보뉴클레오티드 트리포스페이트, 완충액 등)을 지칭한다. 전형적으로, 증폭 시약은 다른 반응 성분과 함께 위치하고 반응 용기 (시험관, 마이크로웰 등)에 함유된다.
용어 "역-전사효소" 또는 "RT-PCR"이란, 출발 물질이 mRNA인 PCR의 유형을 지칭한다. 출발 mRNA는 역 전사효소 효소를 사용하여 상보성 DNA 또는 "cDNA"로 효소적으로 전환된다. 이어서, cDNA가 "PCR" 반응을 위한 "주형"으로서 사용된다.
용어 "유전자 발현"이란, 유전자 내에 코딩된 유전자 정보를 유전자의 "전사"를 통해 (즉, RNA 폴리머라제의 효소 작용을 통해) RNA (예, mRNA, rRNA, tRNA 또는 snRNA)로, 그리고 mRNA의 "번역"을 통해 단백질로 전환하는 방법을 지칭한다. 유전자 발현은 방법에서 다수의 단계로 조절될 수 있다. "상향-조절" 또는 "활성화"란 유전자 발현 생성물 (즉, RNA 또는 단백질)의 생성을 증가시키는 조절을 지칭하는 반면, "하향-조절" 또는 "억제"란 생성을 저하시키는 조절을 지칭한다. 상향-조절 또는 하향-조절에 관련된 분자들 (예, 전사 인자)은 종종 각각 "활성인자" 및 "억제인자"라 불리운다.
용어 "작동가능한 조합," "작동가능한 순서" 및 "작동가능하게 결합된"이란, 주어진 유전자의 전사 및(또는) 원하는 단백질 분자의 합성을 지시할 수 있는 핵산 분자를 생성하는 방식으로 핵산 서열의 결합을 지칭한다. 상기 용어는 또한 기능적 단백질이 생성되는 방식으로 아미노산 서열의 결합을 지칭한다.
용어 "조절 요소"란 핵산 서열의 발현의 일부 측면을 조절하는 유전자 요소를 지칭한다. 예를 들면, 프로모터는, 작동가능하게 결합된 코딩 영역의 전사 개시를 촉진시키는 조절 요소이다. 다른 조절 요소는 스플라이싱 신호, 폴리아데닐화 신호, 종료 신호 등이다.
진핵 세포의 전사 조절 신호는 "프로모터" 및 "인핸서" 요소를 포함한다. 프로모터 및 인핸서는 전사에 관여하는 세포 단백질과 특이적으로 상호작용하는 DNA 서열의 짧은 배열로 구성된다 [Maniatis 등, Science 236:1237, 1987]. 프로 모터 및 인핸서 요소는 효모, 곤충, 포유동물 및 식물 세포에서의 유전자를 포함하여 각종 진핵세포 원천으로부터 단리되었다. 프로모터 및 인핸서 요소는 바이러스 및 유사한 조절 요소, 예컨대 프로모터로부터 단리되고 또한 원핵세포에서 발견되었다. 특정한 프로모터 및 인핸서의 선택은 목적하는 단백질을 발현하는 데 사용되는 세포 유형에 따른다. 일부 진핵세포 프로모터 및 인핸서는 넓은 숙주 범위를 갖는 반면, 다른 것들은 제한된 세포 유형의 부분집합에서만 기능적이다 (검토를 위하여, 문헌 [Voss 등, Trends Biochem.Sci., 11:287, 1986 및 Maniatis 등, 상동 1987]을 참조한다).
용어 "프로모터 요소", "프로모터" 또는 "프로모터 서열"이란 DNA 중합체의 코딩 영역의 5'말단에 위치한 (다시 말해서, 앞에 있는) DNA 서열을 지칭한다. 자연에 알려진 대부분의 프로모터의 위치는 전사된 영역 앞에 있다. 프로모터는 유전자의 발현을 활성화시키는 스위치로서 작용한다. 유전자가 활성화된다면, 이것이 전사되거나 전사에 참여한 것으로 이해된다. 전사는 유전자로부터 mRNA로의 합성과 관련된다. 따라서, 프로모터는 전사 조절 요소로서 작용하고 또한 mRNA로 유전자의 전사 개시 부위를 제공한다.
프로모터는 조직 특이성 또는 세포 특이성일 수 있다. 프로모터에 적용될 때, 용어 "조직 특이성"은, 목적하는 뉴클레오티드 서열의 발현이 상이한 유형의 조직 (예를 들면, 뿌리)에서는 상대적으로 이루어지지 않으면서 특이적 유형의 조직(예를 들면, 꽃잎)에서 선택적으로 발현될 수 있도록 하는 프로모터를 지칭한다. 프로모터의 조직 특이성은, 예를 들면 프로모터 서열에 리포터 유전자를 작동가능 하게 연결하여 리포터 구성체를 생성하고, 리포터 구성체를 식물의 게놈 내에 도입하여, 얻어지는 트랜스제닉 식물의 모든 조직 내에 리포터 구성체이 통합되도록 하고, 트랜스제닉 식물의 상이한 조직에서 리포터 유전자의 발현을 검출 (예를 들면, mRNA, 단백질, 또는 리포터 유전자에 의해 코딩된 단백질의 활성을 검출)함으로써 평가될 수 있다. 다른 조직에서 리포터 유전자의 발현 수준에 비하여, 하나 이상의 조직에서 더 높은 수준의 리포터 유전자 발현이 검출되는 것은, 더 높은 수준의 발현이 검출되는 조직에 대해 특이적인 것이다. 프로모터에 적용될 때 용어 "세포 유형 특이성"이란, 목적하는 뉴클레오티드 서열의 발현이 동일한 조직 내의 상이한 유형의 세포에서는 상대적으로 이루어지지 않으면서, 특이적 유형의 세포에서 선택적으로 발현될 수 있도록 하는 프로모터를 지칭한다. 용어 "세포 유형 특이성"은 프로모터에 적용될 때 단일 조직 내의 영역에서 목적하는 뉴클레오티드 서열의 선택적 발현을 촉진할 수 있는 프로모터를 의미한다. 프로모터의 세포 유형 특이성은 당 기술분야에 공지된 방법, 예를 들면 면역조직화학 염색을 사용하여 평가될 수 있다. 간략히 언급하면, 조직 절편을 파라핀 내에 매립하고, 파라핀 절편을, 프로모터에 의해 발현이 조절되는 목적하는 뉴클레오티드 서열에 의해 코딩되는 폴리펩티드 생성물에 특이적인 1차 항체와 반응시킨다. 1차 항체에 대해 특이적인 표지화된 (예를 들면, 퍼옥시다제 접합) 2차 항체를 절편화된 조직에 결합시키고, 현미경에 의해 (예를 들면, 아비딘/비오틴과의) 특이적 결합을 검출한다.
프로모터는 구성성이거나 조절성일 수 있다. 프로모터와 관련하여 사용될 때 용어 "구성성"은, 자극인자 (예를 들면, 열 충격, 화학약품, 빛 등)의 부재 하 에서 프로모터가 작동가능하게 결합된 핵산 서열의 전사를 지시할 수 있음을 의미한다. 전형적으로, 구성성 프로모터는 실질적으로 세포 및 조직에서 트랜스진(trnsgene)의 발현을 지시할 수 있다. 반대로, "조절성" 프로모터는, 자극인자 (예를 들면, 열 충격, 화학약품, 빛 등)의 존재하에서 작동가능하게 결합된 핵산 서열의 전사 수준을 지시할 수 있는 프로모터이며, 자극인자의 부재 하에서 작동가능하게 결합된 핵산 서열의 전사 수준과는 상이하다.
세균으로 "감염하는" 및 "감염"이란, 세균 내에 함유된 핵산 서열이 표적 생물학적 샘플의 하나 이상의 세포 내에 도입되도록 하는 조건 하에서, 세균과 표적 생물학적 샘플 (예, 세포, 조직 등)의 공동-배양을 지칭한다.
용어 "아그로박테리움(Agrobacterium)"이란 크라운 골(crown gall)을 일으키는 토양계, 그람-음성, 간상형 식물병원성 세균을 지칭한다. 용어 "아그로박테리움"은, 균주 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) (전형적으로 감염된 식물 내에서 크라운 골을 일으킨다) 및 아그로박테리움 리조겐스(Agrobacterium rhizogens)(감염된 숙주 식물에서 모발상 뿌리 질병을 일으킨다)를 포함하지만 이에 한정되지 않는다. 아그로박테리움으로 식물 세포의 감염은 일반적으로 감염된 세포에 의한 오파인 (예를 들면, 노팔린, 아그로핀, 옥토핀 등)의 생성을 일으킨다. 즉, 노팔린의 생성을 일으키는 아그로박테리움 균주 (예를 들면, 균주 LBA4301, C58, A208)는"노팔린 유형" 아그로박테리아를 지칭하고; 옥토핀의 생성을 일으키는 아그로박테리움 균주 (예를 들면, 균주 LBA4404, Ach5, B6)는 "옥토핀-유형" 아그로박테리아를 지칭하고; 아그로핀의 생성을 일으키는 아 그로박테리움 균주 (예를 들면, 균주 EHA105, EHA101, A281)는 "아그로핀-유형" 아그로박테리아를 지칭한다.
용어 "조절 영역"이란, 프로모터로부터 바로 하류에 위치하고 유전자의 번역 개시점 바로 앞에서 끝나는, 유전자의 5' 전사되지만 비번역된 영역을 지칭한다.
용어 "프로모터 영역"이란 DNA 중합체의 코딩 영역의 바로 상류에 위치하고 전형적으로 약 500bp 내지 4kb의 길이를 가지며, 바람직하게는 약 1 내지 1.5kb의 길이를 갖는 영역을 지칭한다.
반대로, "유도가능한" 프로모터는 자극인자(예를 들면, 열 충격, 화학약품, 빛 등)의 부재 하에서 작동가능하게 결합된 핵산 서열의 전사 수준을 지시할 수 있는 프로모터를 지칭하며, 자극인자의 부재 하에서 작동가능하게 결합된 핵산 서열의 전사 수준과는 상이하다.
용어 "조절 요소"란 핵산 서열(들)의 발현의 일부 측면을 조절하는 유전자 요소를 지칭한다. 예를 들면, 프로모터는 작동가능하게 결합된 코딩 영역의 전사 개시를 촉진하는 조절 요소이다. 다른 조절 요소는 스플라이싱 신호, 폴리아데닐화 신호, 종료 신호 등이다.
인핸서 및(또는) 프로모터는 "내인성" 또는 "외인성" 또는 "이종"일 수 있다. "내인성" 인핸서 또는 프로모터는 게놈에서 주어진 유전자와 자연적으로 결합된 것이다. "외인성" 또는 "이종" 인핸서 또는 프로모터는 유전자 조작 (즉, 분자 생물학적 기술)에 의해 유전자에 대해 가까운 위치에 놓여진 것이고, 결합된 인핸서 또는 프로모터에 의해 유전자의 전사가 지시된다. 예를 들면, 첫번째 유전자와 작동가능하게 조합된 내인성 프로모터는 두번째 유전자와 작동가능하게 조합된 채로 단리되고, 제거되고 위치할 수 있으며, 이에 의해 두번째 유전자와 작동가능하게 조합된 "이종 프로모터"를 형성한다. 이러한 각종 조합이 의도된다 (예를 들면, 제 1 및 두번째 유전자가 동일한 종으로부터 또는 상이한 종으로부터 유래될 수 있다).
핵산 서열의 상대적 위치에 관련하여 사용될 때 용어 "자연적으로 결합된" 또는 "자연적으로 위치한"은, 핵산 서열이 자연에서 상대적 위치로 존재함을 의미한다.
발현 벡터 상에 "스플라이싱 신호"의 존재는 진핵 숙주 세포에서 재조합 전사체가 더 높은 수준으로 발현되도록 한다. 스플라이싱 신호는 주된 RNA 전사체로부터 인트론의 제거를 매개하고, 스플라이스 공여체 및 수용체 부위로 구성된다 [Sambrook 등, Molecular Cloning: A Laboratory Manual, 제2판, Cold Spring Harbor Laboratory Press, New York [1989] 16.7-16.8면]. 일반적으로 사용되는 스플라이스 공여체 및 수용체 부위는 SV40의 16S RNA로부터의 스플라이스 접합부이다.
진핵 세포에서 재조합 DNA 서열의 효율적인 발현은, 얻어지는 전사체의 효율적인 종료 및 폴리아데닐화를 지시하는 신호의 발현을 필요로 한다. 전사 종료 신호는 일반적으로 폴리아데닐화 신호의 하류에서 발견되고, 수백개 뉴클레오티드 길이를 갖는다. 본 명세서에 사용된 용어 "폴리(A) 부위" 또는 "폴리(A) 서열"은 미성숙 RNA 전사체의 종료 및 폴리아데닐화를 양쪽 모두 지시하는 DNA 서열을 나타낸 다. 폴리(A) 꼬리가 없는 전사체는 불안정하고 빨리 분해되기 때문에, 재조합 전사체의 효율적인 폴리아데닐화가 바람직하다. 발현 벡터에서 사용되는 폴리(A) 신호는 "이종" 또는 "내인성"일 수도 있다. 내인성 폴리(A) 신호는 게놈에서 주어진 유전자의 코딩 영역의 3'말단에서 자연적으로 발견되는 것이다. 이종 폴리(A) 신호는 하나의 유전자로부터 단리되고 다른 유전자에 대해 3'에 위치한 것이다. 일반적으로 사용되는 이종 폴리(A) 신호는 SV40 폴리(A) 신호가다. SV40 폴리(A) 신호는 237bp BamHI/BclI 제한 단편 위에 함유되고, 종료 및 폴리아데닐화를 모두 지시한다 [Sambrook 등, 상동, 16.6-16.7].
용어 "벡터"란 적절한 조절 요소와 결합될 때 복제가능하고 세포 내로 및(또는) 세포 사이로 유전자 서열을 전달할 수 있는 플라스미드, 파지, 트랜스포존, 코스미드, 염색체, 레트로바이러스, 비리온 또는 유사한 유전자 요소와 같은 유전자 요소를 지칭한다. 즉, 이 용어는 클로닝 및 발현 전파체 뿐만 아니라 바이러스 벡터를 포함한다.
본 명세서에 사용된 용어 "발현 벡터"는 바람직한 코딩 서열 (또는 코딩 서열들)을 함유하는 재조합 DNA 분자 - 예컨대 이하 더욱 상세히 기재된 하이브리드 효소(들)을 위한 코딩 서열(들) - 및 특정한 숙주 세포 또는 유기체에서 작동적으로 결합된 코딩 서열의 발현을 위해 필요한 적절한 핵산 서열을 지칭한다. 원핵세포에서의 발현을 위해 필요한 핵산 서열은 종종 다른 서열과 함께 대개 프로모터, 작동인자 (임의적임) 및 리보좀 결합 부위를 포함한다. 진핵 세포는 프로모터, 인핸서, 및 종료 및 폴리아데닐화 신호를 사용하는 것으로 알려져 있다. 본 발명은 특정한 요소를 갖는 특정한 발현 벡터 또는 발현 벡터들에 한정되도록 의도되지 않는다.
용어 "형질감염"이란 외래 DNA를 세포내에 도입하는 것을 지칭한다. 형질감염은, 포스페이트-DNA 공-침전, DEAE-덱스트란-매개 형질감염, 폴리브렌-매개 형질감염, 유리 비이드, 일렉트로포레이션, 마이크로주입, 리포좀 융합, 리포펙션, 원형질체 융합, 바이러스 감염, 바이오리스틱스(biolistics) (즉, 입자 충돌) 등을 포함한 당 기술분야에 공지된 여러 수단에 의해 달성될 수도 있다.
용어 "안정한 형질감염" 또는 "안정하게 형질감염된"이란, 형질감염된 세포의 게놈 내로 외래 DNA의 도입 및 통합을 지칭한다. 용어 "안정한 형질감염체"란 게놈 DNA 내로 안정하게 통합된 외래 DNA를 갖는 세포를 지칭한다.
용어 "일시적 형질감염" 또는 "일시적으로 형질감염된"이란, 형질감염된 세포의 게놈 내로 외래 DNA가 통합되지 못한 세포 내에 외래 DNA를 도입하는 것을 지칭한다. 외래 DNA는 수 일동안 형질감염된 세포의 핵에 존속된다. 이 기간 동안에, 외래 DNA를 조절성 제어하고, 이것은 염색체 내에서 내인성 유전자의 발현을 지배한다. 용어 "일시적 형질감염체"란 외래 DNA를 받아들이지만 이 DNA를 통합하지 못한 세포를 지칭한다.
용어 "칼슘 포스페이트 공-침전"이란 세포 내로 핵산의 도입을 위한 기술을 지칭한다. 세포에 의한 핵산의 흡수는, 핵산이 칼슘 포스페이트-핵산 공-침전체로서 제시될 때 더욱 향상된다. 그라함 및 반 데르 엡[Graham and van der Eb, Virol., 52:456, 1973]의 원래의 기술은 특정한 유형의 세포를 위한 조건을 최적화 하기 위해 여러 그룹에 의해 변형되었다. 당 기술분야에는 이러한 다수의 변형이 알려져 있다.
용어 "충돌하는" "충돌" 및 "바이오리스틱(biolistic) 충돌"이란, 표적 생물학적 샘플 내의 세포의 세포막에 상처를 내고/내거나 표적 생물학적 샘플 내로 입자를 도입하기 위해, 표적 생물학적 샘플 (예, 세포, 조직 등)을 향해 입자를 가속화하는 방법을 지칭한다. 바이오리스틱 충돌 방법이 당 기술분야 (예를 들면, 미국 특허 5,584,807호, 그의 내용은 여기에 참고문헌으로 포함됨)에 알려져 있으며, 통상적으로 입수가능하다 (예를 들면, 헬륨 기체-구동 미세투사가능한 가속장치 (PDS-1000/He, 바이오래드).
식물 조직과 관련하여 사용될 때 용어 "미세상처"란 조직 내에 현미경적 크기의 상처가 도입되는 것을 지칭한다. 미세상처는 예를 들면 본 명세서에 기재된 입자 충돌에 의해 달성될 수 있다.
본 명세서에 사용된 용어 "식물"이란, 식물의 발생 단계에서 존재하는 구조로 크게 분화되는 다수의 식물 세포를 지칭한다. 이러한 구조는 과실, 새싹, 줄기, 잎, 꽃잎 등을 포함하지만 이에 한정되지 않는다. 용어 "식물 조직"은 뿌리, 새싹, 잎, 꽃가루, 종자, 괴경 조직 및 다른 유형의 세포(예를 들면, 단일 세포, 원형질체, 배아, 유합 조직, 프로토콤(protocorm)-유사 체 등)를 포함하는 식물의 분화 및 미분화 조직을 포함한다. 식물 조직은 식물, 기관 배양액, 조직 배양액 또는 세포 배양액에 존재할 수 있다. 유사하게, "식물 세포(들)"은 배양액 중의 세포일 수 있거나 식물의 일부일 수 있다.
세포와 관련하여 사용될 때 용어 "트랜스제닉"은, 트랜스진의 도입에 의해 변경된 게놈을 갖거나 트랜스진을 함유하는 세포를 지칭한다. 세포, 조직 또는 식물과 관련하여 사용될 때 용어 "트랜스제닉"은 각각 트랜스진을 포함한 세포, 조직 또는 식물을 지칭하며, 본 명세서에서 조직의 하나 이상의 세포는 트랜스진 (예컨대, 본 발명의 하이브리드 효소(들)를 코딩하는 유전자) 또는 트랜스진의 도입에 의해 변경된 게놈을 갖는 식물이다. 예컨대 본 명세서에 기재된 방법에 의한 인간 간섭에 의하여, 핵산(통상, DNA)을 포함한 "트랜스진"을 표적 세포내에 도입하거나 트랜스진을 표적 세포의 염색체 내에 통합하는 것을 포함하는 여러 방법에 의해 형질전환 세포, 조직 및 식물이 생성될 수 있다.
본 명세서에 사용된 용어 "트랜스진"이란, 실험 조작에 의해 세포의 게놈 내에 도입된 핵산 서열을 지칭한다. 트랜스진은 "내인성 DNA 서열" 또는 "이종 DNA 서열" (즉, "외래 DNA")일 수도 있다. 용어 "내인성 DNA 서열"이란, 자연-발생 서열에 비해 일부 변형 (예를 들면, 점 돌연변이, 선택가능한 마커 유전자의 존재 또는 기타 유사한 변형)을 함유하지 않는 한, 도입된 세포 내에서 자연적으로 발견된 뉴클레오티드 서열을 지칭한다. 용어 "이종 DNA 서열"이란, 자연에서 결찰되지 않거나 자연에서 상이한 위치에서 결찰된 핵산 서열에, 결찰되거나 또는 결찰되도록 조작된 뉴클레오티드 서열을 지칭한다. 이종 DNA는 이것이 도입된 세포에 대해 내인성이 아니지만 다른 세포로부터 수득된다. 이종 DNA는 일부 변형을 함유하는 내인성 DNA 서열을 또한 포함한다. 일반적으로, 필수적인 것은 아니지만, 이종 DNA는 이것이 발현되는 세포에 의해 정상적으로 생성되지 않는 RNA 및 단백질을 코딩 한다. 이종 DNA의 예는 리포터 유전자, 전사 및 번역 조절 서열, 선택가능한 마커 단백질 (예, 약물 내성을 부여하는 단백질) 또는 기타 유사한 요소를 포함한다.
용어 "외래 유전자"란, 도입된 유전자가 자연-발생 유전자에 비해 일부 변형 (예, 점 돌연변이, 선택가능한 마커 유전자의 존재, 또는 기타 유사한 변형)을 함유하는 한, 실험적 조작에 의해 세포의 게놈 내에 도입되고 세포에서 발견되는 유전자 서열을 포함할 수도 있는 핵산(예, 유전자 서열)을 지칭한다.
본 명세서에 사용된 용어 "형질전환"이란, 세포내로 트랜스진의 도입을 지칭한다. 세포의 형질전환은 안정하거나 일시적일 수 있다. 용어 "일시적 형질전환" 또는 "일시적으로 형질전환된"이란, 숙주 세포의 게놈 내로 트랜스진의 통합의 부재 하에서, 세포 내로 하나 이상의 트랜스진이 도입되는 것을 지칭한다. 일시적 형질전환은 예를 들면, 하나 이상의 트랜스진에 의해 코딩되는 폴리펩티드의 존재를 검출하는 효소-연결 면역흡착 분석(ELISA)에 의해 검출될 수 있다. 또한, 본 명세서에 증명된 바와 같이 트랜스진(예를 들면, uid A 유전자)에 의해 코딩되는 단백질(예를 들면, β-글루쿠로니다제)의 활성을 검출함으로써 일시적 형질전환을 검출할 수 있다 (예를 들면, GUS 효소의 존재하에서 청색 침전물을 제공하는 X-gluc로의 염색에 의하여 GUS 효소 활성을 조직화학적으로 분석하거나, GUS-라이트 키트(Light Kit)(트로픽스(Tropix))를 사용하여 GUS 효소 활성을 화학발광적 분석한다). 용어 "일시적 형질전환체"란, 하나 이상의 트랜스진을 일시적으로 통합하는 세포를 지칭한다. 반대로, 용어 "안정한 형질전환" 또는 "안정하게 형질전환된"이란, 세포의 게놈 내로 하나 이상의 트랜스진을 도입하고 통합하는 것을 지칭 한다. 세포의 안정한 형질전환은, 하나 이상의 트랜스진에 결합할 수 있는 핵산 서열을 갖는 세포의 게놈 DNA의 서던 블로트 하이브리드형성에 의해 검출될 수 있다. 또한, 세포의 안정한 형질전환은 트랜스진 서열을 증폭하기 위해 세포의 게놈 DNA의 폴리머라제 연쇄 반응에 의해 검출될 수 있다. 용어 "안정한 형질전환체"란 게놈 DNA내로 하나 이상의 트랜스진을 안정하게 통합하는 세포를 지칭한다. 즉, 안정한 형질전환체로부터의 게놈 DNA가 하나 이상의 트랜스진을 함유하는 반면, 일시적 형질전환체로부터의 게놈 DNA는 트랜스진을 함유하지 않는다는 점에서, 안정한 형질전환체는 일시적 형질전환체와 구별된다.
용어 "숙주 세포"는 이종 유전자를 복제 및(또는) 전사 및(또는) 번역할 수 있는 세포를 지칭한다. 즉, "숙주 세포"는, 시험관내에 위치하든지 또는 생체내에 위치하든지 간에, 임의의 원핵 또는 진핵 세포(대장균와 같은 세균 세포, 효모 세포, 포유동물 세포, 조류 세포, 양서류 세포, 식물 세포, 어류 세포 및 곤충 세포)를 지칭한다. 예를 들면, 숙주 세포는 트랜스제닉 동물에 위치할 수 있다.
용어 "형질전환체" 또는 "형질전환된 세포"는, 전이 수를 고려하지 않은 채로, 1차 형질전환 세포 및 세포로부터 유래된 배양액을 포함한다. 모든 자손은, 계획적이거나 부주의한 돌연변이에 기인하여, DNA 함량이 정확하게 동일하지 않을 수도 있다. 원래의 형질전환된 세포에서 선별된 것과 동일한 기능성을 갖는 돌연변이 자손이 형질전환체의 정의에 포함된다.
용어 "선택가능한 마커"는, 선택가능한 마커가 발현되는 세포에 항생물질 또는 약물 내성을 부여하거나, 검출가능한 특색 (예를 들면, 발광 또는 형광)의 발현 을 부여하는 활성을 갖는 효소를 코딩하는 유전자를 지칭한다. 선택가능한 마커는 "포지티브" 또는 "네가티브(negative)"일 수도 있다. 포지티브 선택가능한 마커의 예는 G418 및 카나마이신에 대한 내성을 부여하는 네오마이신 포스포트랜스퍼라제(NPTII) 유전자 및 항생물질 히그로마이신에 대한 내성을 부여하는 세균 히그로마이신 포스포트랜스퍼라제 유전자(hyg)를 포함한다. 네가티브 선택가능한 마커는 적절한 선택 배지에서 배양될 때 세포에 대해 세포독성인 발현을 갖는 효소 활성을 코딩한다. 예를 들면, HSV-tk 유전자는 통상 네가티브 선택가능한 마커로서 사용된다. 간시클로비르(gancyclovir) 또는 아시클로비르(acyclovir)의 존재하에서 성장하는 세포에서 HSV-tk 유전자의 발현은 세포독성이기 때문에, 간시클로비르 또는 아시클로비르를 함유하는 선택 배지 중에서 세포를 성장시켜 기능적 HSV TK 효소를 발현할 수 있는 세포를 선택한다.
용어 "리포터 유전자"란 분석될 수도 있는 단백질을 코딩하는 유전자를 지칭한다. 리포터 유전자의 예는 루시퍼라제 (예를 들면, [deWet 등, Mol.Cell.Biol. 7:725, 1987 및 미국 특허 6,074,859호; 5,976,796호; 5,674,713호; 및 5,618,682호 (이들 모두는 참고문헌으로 여기에 포함된다)), 녹색 형광 단백질 (예를 들면, 진뱅크 수탁 번호 U43284; 다수의 GFP 변형체는 클론테크 래버러토리즈(CLONTECH Laboratories) (미국 캘리포니아주 팔로 알토)로부터 통상적으로 입수가능하다), 클로람페니콜 아세틸트랜스퍼라제, β-갈락토시다제, 알칼리성 포스파타제 및 고추냉이 퍼옥시다제를 포함하지만 이에 한정되지 않는다.
용어 "과다발현"이란, 정상 또는 비-형질전환 유기체에서의 생성 수준을 초 과하는, 형질전환 유기체에서의 유전자 생성물의 생성을 지칭한다. 용어 "공동억제"란 외래 및 내인성 유전자 양쪽 모두의 발현을 억제시키는, 내인성 유전자와 실질적인 상동성을 갖는 외래 유전자의 발현을 지칭한다. 본 명세서에 사용된 용어 "변경된 수준"이란, 정상 또는 비-형질전환 유기체의 생성과는 상이한 양 또는 비율로 형질전환 유기체에서 유전자 생성물(들)이 생성되는 것을 지칭한다.
용어 "서던 블롯 분석" 및 "서던 블롯" 및 "서던"이란, 크기에 따라 DNA를 분리 또는 분별한 다음, 겔로부터 니트로셀룰로스 또는 나일론 막과 같은 고체 지지체로 DNA를 전달하는, 아가로스 또는 아크릴아미드 겔 상의 DNA 분석을 지칭한다. 이어서, 사용되는 프로브에 상보성인 DNA 종을 검출하기 위하여, 고정화된 DNA를 표지화 프로브에 노출시킨다. 전기영동에 앞서서 제한 효소로 DNA를 절단할 수도 있다. 전기영동 후에, 고체 지지체로의 전달에 앞서 또는 그 동안에, DNA를 부분적으로 탈퓨린화하거나 변성시킬 수도 있다. 서던 블롯은 분자 생물학자의 표준 도구이다 [J.Sambrook 등, Molecular Cloning: A Laboratory: A Laboratory Manual, Cold Spring Harbor Press, NY, pp.9.31-9.58, 1989].
용어 "노던 블롯 분석" 및 "노던 블롯" 및 "노던"이란, 크기에 따라 RNA를 분별하기 위해 아가로스 겔 상에서 RNA를 전기영동한 다음, 겔로부터 니트로셀룰로스 또는 나일론 막과 같은 고체 지지체로 RNA를 전달하는 것에 의한 RNA의 분석을 지칭한다. 고정화된 RNA를 표지화 프로브로 탐사하여 사용된 프로브에 상보성인 RNA 종을 검출한다. 노던 블롯은 분자 생물학자의 표준 도구이다 [J.Sambrook 등, 상동, 7.39-7.52면, 1989].
용어 "웨스턴 블롯 분석" 및 "웨스턴 블롯" 및 "웨스턴"이란, 니트로셀룰로스 또는 막과 같은 지지체 상에 고정화된 단백질(들) (또는 폴리펩티드)의 분석을 지칭한다. 하나 이상의 단백질을 포함하는 혼합물을 먼저 아크릴아미드 겔 위에서 분리하고, 분리된 단백질을 겔로부터 니트로셀룰로스 또는 나일론 막과 같은 고형 지지체로 전달한다. 고정화된 단백질을 하나 이상의 목적하는 항원에 대해 반응성을 갖는 하나 이상의 항체에 노출시킨다. 방사능표지된 항체의 사용을 포함한 다양한 방법에 의해 결합 항체를 검출할 수도 있다.
용어 "항원 결정인자"란, 특정한 항체와 접촉되는 항원의 부위(즉, 에피토프)를 지칭한다. 숙주 동물을 면역시키기 위해 단백질 또는 단백질의 단편이 사용될 때, 다수의 단백질 영역은 단백질 상의 주어진 영역 또는 3차원 구조에 특이적으로 결합하는 항체의 생성을 유발할 수도 있고; 이러한 영역 또는 구조는 항원 결정인자로서 일컬어진다. 항원 결정인자는 항체에 결합하기 위해 원상태 항원(즉, 면역 반응을 이끌어내기 위해 사용되는 "면역원")과 경쟁할 수도 있다.
"단리된 핵산 서열"에서와 같이 핵산에 관련하여 사용될 때 용어 "단리된"이란, 자연적인 원천에서 대개 결합된 하나 이상의 다른 성분들로부터 동정되고 분리된(예를 들면, 핵산을 함유하는 세포로부터 분리되거나, 하나 이상의 오염 핵산으로부터 분리되거나, 하나 이상의 단백질, 하나 이상의 지질로부터 분리된) 핵산 서열을 지칭한다. 단리된 핵산은 자연에서 발견되는 것과는 상이한 형태 또는 상태로 존재하는 핵산이다. 반대로, 비-단리된 핵산은 자연에서 존재하는 상태로 발견되는 DNA 및 RNA와 같은 핵산이다. 예를 들면, 주어진 DNA 서열 (예를 들면, 유전 자)은 이웃 유전자와 근접한 숙주 세포 염색체에서 발견되고; RNA 서열, 예컨대 특정 단백질을 코딩하는 특정 mRNA 서열은 다수의 단백질을 코딩하는 다수의 다른 mRNA와의 혼합물로서 세포에서 발견된다. 그러나, 예를 들면 SEQ ID NO:1을 포함하는 단리된 핵산 서열은, 일례로서, 예를 들면 SEQ ID NO:1을 대개 함유하는 세포내의 핵산 서열을 포함하고, 여기에서 핵산 서열은 천연 세포와는 상이한 염색체 또는 염색체외 위치에 존재하거나, 또는 자연에서 발견되는 것과는 상이한 핵산 서열에 의해 인접해 있다. 단리된 핵산 서열은 단일-가닥 또는 이중-가닥 형태로 존재할 수도 있다. 단리된 핵산 서열이 단백질을 발현하기 위해 이용되어질 때, 핵산 서열은 최소한 센스 또는 코딩 가닥의 적어도 일부를 함유할 것이다 (다시 말해서, 핵산 서열은 단일 가닥일 수도 있다). 또한, 이것은 센스 및 안티-센스 가닥을 모두 함유할 수도 있다 (다시 말해서, 핵산 서열은 이중 가닥일 수도 있다).
용어 "정제된"이란, 자연 환경(또는 자연 환경의 성분)으로부터 제거되거나, 단리되거나 또는 분리된 핵산 또는 아미노산 서열과 같은 분자를 지칭한다. 따라서, "단리된 핵산 서열"은 정제된 핵산 서열일 수도 있다. "실질적으로 정제된" 분자는 자연적으로 결합된 다른 성분을 60% 이상, 바람직하게는 75% 이상, 더욱 바람직하게는 90% 이상 갖지 않는 것이다. 본 명세서에 사용된 용어 "정제된" 또는 "정제한다"란, 샘플로부터 오염물의 제거를 지칭한다. 오염 단백질을 제거하면, 샘플 중의 목적하는 폴리펩티드의 퍼센트가 증가된다. 다른 예에서, 재조합 폴리펩티드가 식물, 세균, 효모 또는 포유동물 숙주 세포에서 발현되고, 숙주 세포 단백질의 제거에 의해 폴리펩티드가 정제되고; 이에 의해 재조합 폴리펩티드의 퍼센 트가 샘플 중에서 증가된다. 본 발명은 정제 (실질적으로 정제된 것 포함) 및 비정제 하이브리드 효소(들)를 의도한다.
폴리뉴클레오티드 서열 또는 폴리펩티드에 대해 주어진 용어 "포함하는 조성물"이란, 넓은 범위에서 주어진 폴리뉴클레오티드 서열 또는 폴리펩티드를 함유하는 조성물을 지칭한다. 조성물은 수용액을 포함할 수도 있다. GnTIII 또는 그의 단편을 코딩하는 폴리뉴클레오티드 서열을 포함한 조성물은 혼성화 프로브로서 사용될 수 있다. 이러한 경우에, 염 (예를 들면, NaCl), 세제(예를 들면, SDS), 및 기타 성분 (예를 들면, 덴하르트 용액, 분유, 연어 정액 DNA 등)을 함유하는 수용액 중에서, 폴리뉴클레오티드 서열을 코딩하는 GnTIII이 전형적으로 사용된다.
용어 "시험 화합물"이란 질병(disease), 병(illness), 질환(sickness), 또는 신체 기능의 이상을 치료하거나 방지하기 위해 사용될 수 있거나, 또는 샘플의 생리학적 또는 세포 상태를 변경시키는 화학물질, 제약, 약물 등을 지칭한다. 시험 화합물은 공지된 치료 화합물 및 잠재적 치료 화합물을 둘다 포함한다. 본 발명의 선별 방법을 사용하여 선별함으로써 시험 화합물이 치료용인지를 결정할 수 있다. "공지된 치료 화합물"이란, 치료 또는 예방에서 (예를 들면, 동물 시험을 통해 또는 인간에 투여한 이전의 경험을 통해) 효과적인 것으로 밝혀진 치료 화합물을 지칭한다.
분석과 관련하여 사용될 때 본 명세서에 사용된 용어 "반응"이란 검출가능한 신호의 발생을 지칭한다 (예를 들면, 리포터 단백질의 축적, 이온 농도의 증가, 검출가능한 화학 생성물의 축적).
용어 "샘플"이 가장 넓은 의미로 사용된다. 하나의 의미에서, 이것은 동물 세포 또는 조직을 가리킬 수 있다. 다른 의미에서, 이것은 다른 공급원 뿐만 아니라 생물학적 및 환경 샘플로부터 수득된 견본 또는 배양액을 포함하는 것을 의미한다. 생물학적 샘플은 식물 또는 동물 (인간 포함)로부터 수득될 수 있고, 유체, 고체, 조직 및 기체를 포함한다. 환경 샘플은 표면 물질, 토양, 물 및 공업적 샘플과 같은 환경 물질을 포함한다. 이러한 예는 본 발명에 적용가능한 샘플 유형을 제한하는 것으로 해석되지 않는다.
용어 "융합 단백질"이란, 하나 이상의 부분 또는 일부가 제 1 단백질로부터 유래되고 다른 부분 또는 일부가 제 2 단백질로부터 유래된 단백질을 지칭한다. 용어 "하이브리드 효소"란, 기능적 효소인 융합 단백질을 지칭하고, 여기에서 하나 이상의 부분 또는 일부는 첫번째 종으로부터 유래되고 다른 부분 또는 일부는 두번째 종으로부터 유래된다. 본 발명의 바람직한 하이브리드 효소는 기능적 글리코실트랜스퍼라제 (또는 그의 일부)이고, 여기에서 적어도 일부 또는 부분은 식물로부터 유래되고 다른 부분 또는 일부는 포유동물(예컨대 인간)로부터 유래된다.
핵산(예를 들면 벡터)의 배경에서 용어 "세포내에 도입"이란, 당 기술분야에서 "형질전환" 또는 "형질감염" 또는 "형질도입"이라 불리는 것을 포함하는 것으로 이해된다. 세포의 형질전환은 안정하거나 일시적일 수도 있고 - 본 발명은 한편으로 안정한 발현이 존재하고 다른 한편으로 단지 일시적인 발현이 존재하는 조건 하에서 벡터의 도입을 의도한다. 용어 "일시적 형질전환" 또는 "일시적으로 형질전환된"이란, 트랜스진이 숙주 세포의 게놈 내로 통합되지 않은 조건 하에서 하나 이 상의 트랜스진이 세포 내로 도입되는 것을 지칭한다. 일시적 형질전환은 예를 들면, 하나 이상의 트랜스진에 의해 코딩된 폴리펩티드의 존재를 검출하는 효소-결합 면역흡착성 분석(ELISA)에 의해 검출될 수 있다. 또한, 트랜스진(예를 들면, 항체 유전자)에 의해 코딩된 단백질의 활성 (예를 들면, 항체의 항원 결합)을 검출함으로써, 일시적 형질전환을 검출할 수도 있다. 용어 "일시적 형질전환체"란 일시적으로 혼입된 하나 이상의 트랜스진을 갖는 세포를 지칭한다. 반대로, 용어 "안정한 형질전환" 또는 "안정하게 형질전환된"이란 세포의 게놈 내로 하나 이상의 트랜스진의 도입 및 통합을 지칭한다. 세포의 안정한 형질전환은, 하나 이상의 트랜스진에 결합할 수 있는 핵산 서열을 갖는 세포의 게놈 DNA의 서던 블롯 혼성화에 의해 검출될 수 있다. 또한, 세포의 안정한 형질전환은 트랜스진 서열을 증폭하기 위한 세포의 게놈 DNA의 폴리머라제 연쇄 반응(PCR)에 의해 검출될 수 있다. 용어 "안정한 형질전환체"란 게놈 DNA내로 하나 이상의 트랜스진을 안정하게 통합한 세포를 지칭한다. 즉, 안정한 형질전환체는, 안정한 형질전환체로부터의 게놈 DNA가 하나 이상의 트랜스진을 함유하는 반면 일시적 형질전환체로부터의 게놈 DNA는 트랜스진을 함유하지 않는다는 점에서, 일시적 형질전환체와 구별된다.
"이등분된 올리고사카라이드"는 예를 들면 2개의 만노스 기 및 올리고사카라이드의 만노스 잔기에 부착된 다른 당 잔기를 포함하는 올리고사카라이드로서 정의되어야 한다. 이등분된 올리고뉴클레오티드의 예를 표 1에 나타낸다.
본 발명의 식물 숙주 세포에서 발현된 GnTIII (예를 들면, SEQ ID NO:1, 도 4A)는 포유동물 GnTIII이다. 특정한 실시양태에서, GnTIII은 인간 GnTIII (예를 들면, SEQ ID NO:2, 도 4B)이다. GnTIII은 특정한 실시양태에서 포유동물 GnTIII의 아미노산 서열과 80% 동일성, 더욱 바람직하게는 약 90% 이상, 더욱 더 바람직하게는 약 95% 이상, 가장 바람직하게는 약 97% 이상의 동일성을 가질 수도 있으며 (이하에서, "상동성 폴리펩티드"라고 일컬어짐), 이것은 정성적으로 포유동물 GnTIII의 활성을 보유한다. 예를 들면, 당해 아미노산 서열과 95% 이상 "동일한" 아미노산 서열을 갖는 폴리펩티드는, 대상 폴리펩티드 서열이 당해 아미노산 서열의 각각 100개 아미노산 당 평균 5개 이하의 아미노산 변경을 포함할 수도 있다는 것을 제외하고는, 당해 서열과 동일하다. 다시 말해서, 당해 아미노산 서열과 95% 이상의 동일성을 갖는 아미노산 서열을 갖는 폴리펩티드를 수득하기 위하여, 대상 서열 내의 아미노산 잔기의 5% 이하가 다른 아미노산과 함께 삽입되거나, 결실되거나, 또는 치환될 수 있다. 대조 서열의 이러한 변경은 대조 아미노산 서열의 아미노 또는 카르복시 말단 위치에서 또는 말단 위치 사이의 어느 곳에서나 발생할 수도 있고, 대조 서열 내의 잔기 중에 또는 대조 서열 내의 하나 이상의 연속 기에 개별적으로 배치된다.
당해 서열 (본 발명의 서열)과 대상 서열 사이의 가장 우수한 전체 매칭을 결정하기 위한 바람직한 방법 (또한, 전체적 서열 정렬로 언급됨)은 문헌 [Brutlag 등, Com.App.Biosci. 6:237-245, 1990]의 알고리즘을 기준으로 한 FASTDB 컴퓨터 프로그램을 사용하여 결정될 수 있다. 서열 정렬에서, 당해 및 대상 서열은 양쪽 뉴클레오티드 서열 또는 양쪽 아미노산 서열이다. 상기 전체적 서열 정렬의 결과 는 퍼센트 동일성이다. FASTDB 아미노산 정렬에서 사용되는 바람직한 매개변수는 행렬=PAM 0, k-투플(tuple)=2, 미스매칭 패널티=1, 결합 패널티=20, 임의추출 군 길이=0, 컷오프 스코어(cutoff score)=1, 윈도우 크기=서열 길이, 간격(gap) 패널티=5, 간격 크기 패널티=0.05, 윈도우 크기=500, 또는 어느 것이나 더 짧은 대상 아미노산 서열의 길이이다.
대상 서열이 내부 결실 때문이 아니라 N- 또는 C- 말단 결실로 인해 당해 서열보다 더 짧다면, 수동 보정을 결과에 행해야만 한다. 이것은, FASTDB 프로그램이 전체적 퍼센트 동일성을 계산할 때 대상 서열의 N- 및 C-말단 절단을 고려하지 못하기 때문이다. 당해 서열에 비해 N- 및 C-말단에서 절단된 대상 서열을 위하여, 상응하는 대상 잔기와 매칭/정렬되지 않은 대상 서열의 N- 및 C-말단인 당해 서열의 잔기의 수를, 당해 서열의 전체 기본의 퍼센트로서 계산함으로써 퍼센트 동일성을 보정한다. 잔기가 매칭/정렬되는지의 여부는 FASTDB 서열 정렬의 결과에 의해 결정된다. 최종 퍼센트 동일성 점수에 도달하기 위하여, 규정된 매개변수를 사용하여 상기 FASTDB에 의해 계산된 퍼센트 동일성으로부터 이 퍼센트를 뺀다. 이러한 최종 동일성 점수는 본 발명의 목적을 위해 사용되는 것이다. 퍼센트 동일성 점수를 수동으로 조절하기 위한 목적에서, 당해 서열과 매칭/정렬되지 않은, 대상 서열의 N- 및 C-말단에 대한 잔기만을 고려하였다. 다시 말해서, 당해 잔기만이 대상 서열의 가장 먼 N- 및 C-말단 잔기 바깥쪽에 위치한다.
본 발명의 식물 숙주 체계에서 발현된 GnTIII은, 포유동물 GnTIII의 아미노산 서열을 코딩하는 핵산 서열과 80% 이상의 동일성, 더욱 바람직하게는 약 90% 이 상, 더욱 더 바람직하게는 약 95% 이상, 가장 바람직하게는 약 97% 이상(이하, "상동성 폴리펩티드")의 동일성을 갖는 핵산 서열에 의해 코딩되며, 이것은 상기 포유동물 GnTIII의 활성을 정성적으로 보유한다. 핵산 서열은 RNA 또는 DNA 서열일 수도 있다.
본 발명의 대조 뉴클레오티드 서열에 대해 95% "동일성"을 갖는 폴리뉴클레오티드는, 폴리뉴클레오티드 서열이 폴리펩티드를 코딩하는 대조 뉴클레오티드 서열의 각각 100개 뉴클레오티드 당 평균 5개 이하의 점 돌연변이를 포함할 수 있다는 것 이외에는, 대조 서열과 동일하다. 다시 말해서, 대조 뉴클레오티드 서열과 95% 이상 동일한 뉴클레오티드 서열을 갖는 폴리뉴클레오티드를 수득하기 위하여, 대조 서열 내의 뉴클레오티드의 5% 이하를 결실시키거나 다른 뉴클레오티드로 치환할 수도 있거나, 또는 대조 서열내의 전체 뉴클레오티드의 5% 이하의 뉴클레오티드를 대조 서열내에 삽입할 수도 있다. 당해 서열은 전체 서열, ORF (개방 판독 프레임) 또는 상기 기재된 것과 같이 규정된 단편일 수도 있다.
실제적으로, 특정한 핵산 분자 또는 폴리펩티드가 본 발명의 뉴클레오티드 서열에 대해 적어도 90%, 95%, 96%, 97%, 98% 또는 99% 동일한지의 여부는 공지된 컴퓨터 프로그램을 사용하여 통상적으로 결정될 수 있다. 당해 서열(본 발명의 서열)과 대상 서열 사이의 최선의 전체 매칭을 결정하기 위해 바람직한 방법 (전체적 서열 정렬이라 일컬어짐)은, 문헌 [Brutlag 등, Comp. App. Biosci., 6:237-245, 1990]의 알고리즘을 기초로 한 FASTDB 컴퓨터 프로그램을 사용하여 결정될 수 있다. 서열 정렬에서, 당해 및 대상 서열들은 모두 DNA 서열이다. RNA 서열은 U(우 리딘)을 T(티민)으로 전환시킴으로써 비교될 수 있다. 상기 전체적 서열 정렬의 결과는 % 동일성으로 주어진다. 퍼센트 동일성을 계산하기 위해 DNA 서열의 FASTDB 정렬에서 사용된 바람직한 매개변수는 행렬=일원, k-투플=4, 미스매칭 패널티=1, 결합 패널티=30, 임의추출 군 길이=0, 컷오프 스코어=1, 간격 패널티=5, 간격 크기 패널티=0.05, 윈도우 크기=500 또는 어느 것이나 더 짧은 대상 아미노산 서열의 길이이다.
본 발명은 또한 상기 포유동물 GnTIII을 코딩하는 핵산 서열로 혼성화되는 폴리뉴클레오티드를 포함한다. 온도 및 용액 이온 강도의 적절한 조건 하에서 폴리뉴클레오티드의 단일 가닥 형태가 다른 폴리뉴클레오티드에 어닐링될 수 있을 때, 폴리뉴클레오티드는 다른 폴리뉴클레오티드에 "혼성화"된다 (Sambrook 등, 상동). 온도 및 이온 강도의 조건은 혼성화의 "엄격성"을 결정한다. 상동성 핵산을 위한 예비 선별을 위하여, 42℃의 온도에 상응하는 낮은 엄격성 혼성화 조건 (예를 들면, 5X SSC, 0.1% SDS, 0.25% 우유, 및 0% 포름아미드; 또는 40% 포름아미드, 5X SSC, 0.5% SDS)이 사용될 수 있다. 중간 엄격성 혼성화 조건은 55℃의 더 높은 온도, 예를 들면 40% 포름아미드, 5X 또는 6X SCC에 상응한다. 높은 엄격성 혼성화 조건은 65℃의 최고 온도, 예를 들면 50% 포름아미드, 5X 또는 6X SCC에 상응한다. 혼성화 엄격성에 따라 염기 간의 미스매칭이 가능하긴 하지만, 혼성화는 2개의 핵산이 상보적 서열을 함유할 것을 필요로 한다. 핵산 혼성화에 적절한 엄격성은 핵산의 길이 및 상보성 정도, 당 기술분야에 공지된 변수에 따라 좌우된다. 2개의 뉴클레오티드 서열 간의 유사성 또는 상동성 정도가 높을수록, 그러한 서열을 갖는 핵산의 하이브리드에 대한 Tm(융점)의 값이 더욱 높아진다. 핵산 혼성화의 상대적 안정성(더 높은 Tm에 상응)은 하기 순서로 저하된다: RNA:RNA, DNA:RNA, DNA:DNA.
식물 숙주 체계에서 GnTIII 및 다른 이종 단백질의 발현
한 실시양태에서, 포유동물 GnTIII 또는 기타 이종 단백질, 예컨대 이종 당단백질 또는 포유동물 글리코실트랜스퍼라제를 코딩하는 핵산을, 적절한 발현 벡터, 즉 삽입된 코딩 서열의 전사 및 번역을 위해 필요한 요소를 함유하는 벡터, 또는 RNA 바이러스 벡터의 경우에 복제 및 번역을 위해 필요한 요소 뿐만 아니라 선택가능한 마커 내에 삽입할 수도 있다. 이들은 프로모터 영역, 신호 서열, 5' 비번역 서열, 구조 유전자가 함께 구비되는지의 여부에 따라 개시 코돈, 및 전사 및 번역 종료 서열을 포함하지만 이에 한정되지 않는다. 이러한 벡터를 수득하기 위한 방법은 당 기술분야에 공지되어 있다 (검토를 위하여 WO 01/29242호 참조).
식물에서 발현하기에 적절한 프로모터 서열은 당 기술분야, 예를 들면 WO 91/198696호에 기재되어 있다. 이들은 비-구성 프로모터 또는 구성 프로모터, 예컨대 노팔린 합성효소 및 옥토핀 합성효소 프로모터, 콜리플라워 모자이크 바이러스(CaMV) 19S 및 35S 프로모터 및 피그워트(figwort) 모자이크 바이러스(FMV) 35 프로모터 (미국 특허 6,051,753호)를 포함한다. 사용된 프로모터는 예를 들면 내배유, 호분 층, 배, 과피, 줄기, 잎, 인, 괴경, 뿌리 등을 표적으로 하는 조직 특이적 프로모터일 수도 있다.
신호 서열은 적절한 경우 단백질을 처리 및 전위시킬 수 있다. 신호는 식물로부터 유래될 수 있거나, 또는 비-식물 신호 서열일 수 있다. 신호 펩티드는 미 성숙 폴리펩티드를 소포체로 보내고, 이곳에서 폴리펩티드는 후-번역 변형을 겪는다. 신호 펩티드는 당 업자에 의해 일상적으로 동정될 수 있다. 이들은 전형적으로 3분절계 구조를 갖고, N-말단에서 포지티브 전하 아미노산을 갖고 이어서 소수성 영역을 가지며 이어서 감소된 소수성 영역 내에 절단 부위를 갖는다.
전사 종료는 전사 개시 조절 영역으로부터 반대쪽 말단에 존재한다. 이것은 전사 개시 영역과 결합될 수 있거나 상이한 유전자로부터 유래되고, 발현을 향상시키기 위해 선택될 수도 있다. 그의 예는 아그로박테리움 Ti 플라스미드로부터의 NOS 터미네이터 및 쌀 α-아밀라제 터미네이터이다. 폴리아데닐화 꼬리를 첨가할 수도 있다. 그의 예는 아그로박테리움 옥토핀 합성효소 신호[Gielen 등, EMBO J. 3:835-846, 1984] 또는 동일한 종의 노팔린 합성효소[Depicker 등, Mol.Appl.Genet. 1:561-573, 1982]를 포함하지만, 이에 한정되지 않는다.
이종 단백질의 전사를 증가 및(또는) 최대화하기 위해 인핸서가 포함될 수도 있다. 이들은 펩티드 익스포트 신호 서열, 코돈 사용, 인트론, 폴리아데닐화 및 전사 종료 부위를 포함하지만 이에 한정되지 않는다 (WO 01/29242 참조).
마커는 제초제 내성 및 원핵세포 선택 마커를 포함한다. 이러한 마커는 암피실린, 테트라사이클린, 카나마이신 및 스펙티노마이신과 같은 항생물질에 대해 내성을 포함한다. 특정 예는 스트렙토마이신 내성을 위해 코딩하는 스트렙토마이신 포스포트랜스퍼라제(spt) 유전자, 카나마이신 또는 제네티신 내성을 코딩하는 네오마이신 포스포트랜스퍼라제(nptII) 유전자, 히그로마이신에 대한 내성을 코딩하는 히그로마이신 포스포트랜스퍼라제(hpt) 유전자를 포함하지만, 이에 한정되지 않는다.
구축된 벡터는 당 기술분야에 공지된 절차를 사용하여 식물 숙주 체계 내에 도입될 수 있다 (WO 01/29242호 및 WO 01/31045호 검토). 벡터들은 A.투메파시엔스(A. tumefaciens)로부터의 T-DNA 경계 영역인 아그로박테리움 투메파시엔스 벡터에 대한 상동성 영역을 함유하는 중간체 식물 형질전환 플라스미드로 변형될 수도 있다. 또한, 본 발명의 방법에서 사용되는 벡터들은 아그로박테리움 벡터일 수도 있다. 벡터를 도입하기 위한 방법은 마이크로주입, 작은 비이드 또는 입자의 기질 내 또는 표면 위에 핵산을 갖는 작은 입자에 의한 속도 사출 침투, 및 에렉트로포레이션(electroporation)을 포함하지만, 이에 한정되지 않는다. 벡터는 식물 세포, 조직 또는 기관내에 도입될 수도 있다. 특정한 실시양태에서, 이종 유전자의 존재가 일단 확인되면, 당 기술분야에 공지된 기술을 사용하여 식물을 재생시킬 수도 있다.
포유동물 GnTIII의 사용
포유동물 GnTIII의 발현은 당단백질 상에 이등분된 N-글리칸을 유도한다. 이등분된 N-글리칸은 일부 포유동물 당단백질의 생물학적 활성을 위해 중요하다. 특히, 이등분된 단클론성 항체는 향상된 ADCC (항체-의존성 세포 세포독성)을 갖는다. 이등분된 구조의 도입은 새롭거나 최적화된 기능 및 당단백질의 증가된 생체이용성을 유도하고, 예를 들면 촉각 유형이 증가되면 신장에 의한 클리어런스(clearance)의 감소 때문에 반감기를 증가시킨다. 따라서, 본 발명은 이등분된 올리고사카라이드, 특히 이등분 GlcNAc 잔기를 갖는 이종 당단백질을 포 함하는 식물 숙주 체계 및 상기 당단백질의 제조 방법에 관한 것이다.
또한, 식물 내에서 GnTIII의 발현은 와일드타입 식물에 비해 말단 GlcNAc의 극적인 증가를 일으킨다 (식물 N-글리칸은 포유동물 N-글리칸에 비해 훨씬 적은 GlcNAc 잔기를 함유한다). 식물에서 생성된 식물 당단백질 또는 재조합 당단백질의 N-글리칸 상에 더욱 많은 GlcNAc 잔기는, 당단백질의 포유동물 N-글리칸과 공통점이 있다. 식물에서의 GnTIII 발현에 기인하여 식물 N-글리칸 (및 Mabs와 같은 식물-생성 재조합 당단백질)에 이등분 GlcNAc이 도입되면, N-글리칸이 β-N-아세틸헥소사미니다제에 의해 분해되는 것을 막는 것으로 보인다. 더욱 많은 GlcNAc 잔기는, 말단 갈락토스를 첨가하는 β(1,4)-갈락토실트랜스퍼라제(GalT)를 위한 수용체 기질이 더욱 많음을 의미한다. GnTIII 및 작용성 단백질, 예컨대 수송체 또는 N-글리칸 생합성을 제공하는 (포유동물) 효소 또는 그의 기능적 단편, 예컨대 갈락토실트랜스퍼라제, 예컨대 GAIT를 공동-발현하거나, 또는 GnTIII 식물을 GalT 식물과 교배하면 (또는 그 반대), 이러한 식물에서 생성되는 당단백질의 갈락토실화가 증가된다. 따라서, 본 발명은 상기 포유동물 GnTIII 및 상기 기능적 단백질을 포함하는 식물 숙주 체계, 상기 식물 숙주 체계의 제공 방법 및 상기 당단백질의 생성 방법에 관한 것이고; 상기 식물 숙주 체계는 상기 포유동물 GnTIII 및 그의 기능적 단백질을 포함하지 않는 식물 숙주 체계에서 생성되는 이종 당단백질에 비하여 증가된 갈락토실화를 갖는 이종 당단백질을 추가로 포함할 수도 있다.
GnTIII을 코딩하는 뉴클레오티드 서열, 임의로 N-글리코실화 변경 효소 및 상업적으로 중요한 이종 당단백질을 코딩하는 뉴클레오티드 서열을 포함하는 벡터 를 함유한 아그로박테리움 균주로 식물 세포 또는 조직을 접종하거나, 또는 에렉트로포레이션, 마이크로주입, 작은 비이드 또는 입자의 기질 내 또는 표면 상에 핵산을 갖는 작은 입자에 의한 속도 사출 침투, 및 에렉트로포레이션과 같은 상기 기재된 절차에 의해, 상업적으로 중요한 당단백질을 생성하는, 안정하게 형질전환된 식물을 발생시킬 수 있다. 또한, 상업적으로 중요한 맞추어진 당단백질을 생성하는, 안정하게 형질전환된 식물은, GNTIII, 임의로 다른 N-글리코실화 변경 효소를 코딩하는 뉴클레오티드 서열 또는 상업적으로 중요한 당단백질을 코딩하는 뉴클레오티드 서열을 포함하는 벡터를 보유하는 2 이상의 아그로박테리움 균주를 동시에 접종함(동시형질전환)으로써 발생될 수 있거나, 식물 세포 또는 조직과 상기 벡터의 동시형질전환을 지시한다. 또한, 상업적으로 중요한 맞추어진 당단백질을 생성하는, 안정하게 형질전환된 식물은, 변형 N-글리코실화를 갖는 식물을 상업적으로 중요한 단백질을 코딩하는 뉴클레오티드 서열을 발현하는 식물과 (다중) 교배시킴으로써 발생될 수 있다. 모든 절차에서, 벡터는 선택된 인자에 대해 내성을 부여하는 뉴클레오티드 서열을 포함할 수도 있다.
N-글리코실화, GnTIII 및 상업적으로 중요한 당단백질 또는 폴리펩티드에 연관된 단백질을 만족스럽게 발현시키기 위하여, 당업자에게 공지된 숙주 식물의 특이적 전사 및 번역 메카니즘에 뉴클레오티드 서열을 적응시킬 수 있다. 예를 들면, 코돈 사용을 개선시키기 위해 코딩 영역에서의 잠재성 돌연변이를 도입할 수도 있고, 관련 식물 조직에서 상기 유전자의 발현을 유도하기 위해 특정한 프로모터가 사용될 수도 있다. 적절한 시기, 예를 들면 들판에서 식물 조직을 수확하고 조절 된 상태로 처리한 후에만, 발현이 일어나도록 하기 위하여, 발생적으로 조절되거나 또는 뜻대로 유도될 수 있는 프로모터를 사용할 수도 있다. 모든 경우에, 발현 카세트가 동일한 세포에서 발현되어 상기 당단백질에 대해 바람직한 후-번역 변경이 가능하도록, 글리코실화 변형 단백질 및 상업적으로 중요한 당단백질의 발현 카세트를 선택해야 한다.
상기 기재된 바와 같이, 특정한 실시양태에서, 본 발명의 방법에서 사용될 수 있는 식물은 담배 식물, 또는 적어도 니코타나(Nicottana) 속에 관련된 식물이지만, 비교적 용이하게 형질전환가능한 기타 식물, 예컨대 아라비도프시스 탈리아나(Arabidopsis thaliana) 또는 제아 마이스(Zea mays) 또는 그에 관련된 식물의 사용이 또한 제공된다. 재조합 당단백질을 생성시키기 위해, 좀개구리밥을 사용하는 것이 특별한 장점을 제공한다. 식물은 일반적으로 작고, 무성 발아를 통해 무성생식으로 재생된다. 그럼에도 불구하고, 대부분의 좀개구리밥 종은 뿌리, 줄기, 꽃, 종자 및 엽상체를 포함한 더욱 큰 식물의 조직 및 기관을 모두 갖는다. 좀개구리밥은 간단한 액체 용액의 표면 위에 자유롭게 떠있는 식물로서 값싸고 매우 빠르게 성장할 수 있고, 그로부터 쉽게 수확할 수 있다. 이들은 영양소-풍부 폐수 위에서 성장할 수도 있고, 이것은 가치있는 생성물을 생성하면서 동시에 폐수를 재활용하기 위해 세정할 수 있다. 제약학적 용도를 위해 특히 적절하게는, 봉쇄되고 조절된 조건 하에서 좀개구리밥을 실내에서 성장시킬 수 있다. 안정하게 형질전환된 좀개구리밥은 예를 들면, 각각 N-글리코실화 변경 효소를 코딩하는 하나 이상의 뉴클레오티드 서열 및(또는) 상업적으로 중요한 이종 당단백질을 코딩하는 유전자 를 포함하는 (2원) 벡터를 함유한 아그로박테리움 균주와 (공동)접종한 후에 조직 또는 세포로부터 재생될 수 있다. 좀개구리밥 식물은 예를 들면 스피로델라(Spirodella) 속, 월피아(Wolffia) 속, 월피엘라(Wolffiella) 속 또는 렘나(Lemna) 속, 렘나 마이너(Lemna minor), 렘나 미니스쿨라(Lemna miniscula) 및 렘나 기바(Lemna gibba)를 포함할 수도 있다. 또한, 피스코미트렐라 파텐스(Physcomitrella patens)와 같은 이끼는, 봉쇄된 조건 하에서 값싸게 성장될 수 있다는 점에서 장점을 제공한다. 또한, 피스코미트렐라 파텐스(Physcomitrella patens)의 1배체 게놈은 비교적 조작이 용이하다.
또한, 토마토 과실에서의 발현이 특별한 장점을 제공한다. 봉쇄되고 조절된 조건 하에서 온실에서 토마토를 쉽게 재배할 수 있고, 1년 내내 상당한 양으로 연속하여 토마토 과실 생물량을 수확할 수 있다. 목적하는 당단백질을 함유하는 수분 분획을 토마토 과실의 나머지로부터 쉽게 분리할 수 있고, 이것은 당단백질의 정제를 더욱 용이하게 한다. 이에 한정되지는 않지만 옥수수의 인, 감자의 괴경 및 평지씨 또는 해바라기의 종자를 포함하는 다른 곡물의 저장 기관에서의 발현은 매력적인 대안이고, 이것은 수확 및 처리 기술이 행해지는 기관에서 상당한 생물량을 제공한다. 화밀에서의 발현은, 화밀에서 분비된 당단백질의 순도 및 균일성의 측면에서 특별한 장점을 제공한다.
또한, 이종 당단백질을 포함하는 식물을, GnTIII 및 임의로 하나 이상의 기능성 포유동물 단백질, 예를 들면 수송체 또는 식물에서 대개 존재하지 않는 N-글리칸 생합성을 제공하는 효소를 포함하는 본 발명에 따른 식물과 교배시키고, 상기 교배로부터 자손을 수확하고, 상기 이종 당단백질을 발현하고 식물에 대개 존재하지 않는 포유동물-유사 N-글리칸 생합성에 관련된 GnTIII 및 임의로 기능성 (포유동물) 효소를 발현하는 원하는 자손 식물을 선택한다. 이 방법은 교차수분받이 (crosspollination)로 공지되어 있다. 바람직한 실시양태에서, 본 발명은 이등분된 올리고사카라이드, 특히 갈락토스 잔기 및(또는) 증가된 갈락토실화를 포함한 상기 재조합 단백질을 발현하는 원하는 자손 식물을 선택하는 것을 추가로 포함한다. 이러한 식물이 제공되므로, 본 발명은 바람직한 당단백질 또는 그의 기능적 단편을 생성하기 위한 트랜스제닉 식물의 용도를 제공하고, 특히 상기 당단백질 또는 그의 기능적 단편은 이등분된 올리고사카라이드 및(또는) 증가된 갈락토실화를 포함한다.
본 발명은 추가로, 상기 식물이 수확가능한 단계에 이를 때까지, 예를 들면 이익이 되는 수확이 얻어지도록 충분한 생물량이 성장될 때까지 본 발명에 따른 식물을 재배하고, 이어서 상기 식물을 당 기술분야에 공지된 기술로 수확하고, 분류된 식물 물질을 얻기 위해 당 기술분야에 공지된 기술을 사용하여 상기 식물을 분류하고, 상기 분류된 식물 물질로부터 상기 당단백질을 적어도 부분적으로 단리하는 것을 포함하는, 원하는 당단백질 또는 그의 기능적 단편의 수득 방법을 제공한다. 당 기술분야에 공지된 방법을 사용하여, 바람직하게는 검출가능한 신호를 생성하기 위한 방식으로 생물학적 활성 부위가 검출되는 선별 분석을 사용하여, 원하는 단백질의 존재를 선별할 수도 있다. 이러한 신호를 직접적으로 또는 간접적으로 생성할 수도 있다. 이러한 분석의 예는 ELISA 또는 방사능면역분석을 포함한 다.
글리코시다제, 예를 들면 β-N-아세틸헥소사미니다제의 활성을 "봉쇄"하고, N-결합 글리칸으로의 다른 당("다른" 연속 글리코실트랜스퍼라제 유전자에 의해 구동됨)의 첨가, 예를 들면 푸코실화, 크실로실화를 방지함으로써, N-글리칸으로부터 당의 제거(분해)를 막기 위해 GnTIII의 발현에 기인한 이등분된 GlcNAc 잔기의 도입을 사용할 수도 있다. 국소화를 조절(예를 들면, 다른 부세포 표적화 신호를 제공)하고/하거나 발현 수준을 조절(예를 들면, 독립적인 트랜스제닉 식물에서의 수준을 바꾸거나 상이한 프로모터를 사용)함으로써, 당형태 조성물을 변조시킬 수 있다. 따라서, 재조합 당단백질을 포함하는 식물에서 당단백질 내에 이등분 GlcNAc 잔기를 도입하는 것은, 활성 α1,3-푸코실트랜스퍼라제를 봉쇄함으로써 α-1,3-푸코스의 혼입을 억제하고, α-1,4-푸코실트랜스퍼라제를 봉쇄함으로써 α-1,4-푸코스의 혼입을 억제하고, β-1,2-크실로실트랜스퍼라제를 봉쇄함으로써 β-1,2-크실로스의 혼입을 억제하고, β-1,3-갈락토실트랜스퍼라제를 봉쇄함으로써 β-1,3-갈락토스의 혼입을 억제하고, β-N-아세틸헥소사미니다제의 활성을 봉쇄함으로써 N-글리칸, 특히 말단 GlcNAc 잔기에 첨가된 당을 제거/분해하고, β-1,4-갈락토시다제를 봉쇄함으로써 말단 β-1,4-갈락토스 (특허 출원 01/31045호에 제공된 β-1,4-갈락토실트랜스퍼라제의 발현에 의해 첨가됨)의 혼입을 억제한다. 따라서, 이러한 방식으로, GnTIII의 조절된 발현 및 이등분 GlcNAc 잔기의 조절된 도입을 사용하여, 당형태 조성물을 조정하고/하거나 당형태 균일성을 제한할 수 있다.
변형된 GnTIII 및 GnTIII 하이브리드 단백질
본 발명은 포유동물 GnTIII의 촉매 부위 및 단백질의 막횡단 부위를 포함하는 단리된 하이브리드 단백질에 관한 것이고, 상기 단백질은 진핵 세포의 소포체 또는 골지체에 존재한다. 본 발명은 또한 변형된 포유동물 GnTIII에 관한 것이며, 여기에서 막횡단 도메인은 제거되지만 상기 GnTIII의 체류를 위한 체류 신호, 예컨대 KDEL이 ER에 포함된다.
제 1 효소의 막횡단 부위 및 제 2 효소의 촉매 부위를 포함하는 하이브리드 효소를 코딩하는 핵산 서열을 다음과 같이 수득할 수 있다. 막횡단 부위를 코딩하는 서열을 제 2 효소로부터 제거하고, 촉매 부위를 포함한 제 2 효소의 C-말단부를 코딩하는 핵산 서열을 포함하는 핵산 서열을 남겨둔다. 제 1 효소의 막횡단 부위를 코딩하는 서열을 PCR에 의해 단리하거나 수득하고, 제 2 효소의 C-말단부를 포함하는 서열을 코딩하는 서열에 결찰시킨다.
단백질, 특히 ER에 체류된 갈락토실트랜스퍼라제, 만노시다제 및 N-아세틸글루코사민 트랜스퍼라제와 같은 효소를 코딩하는 핵산 서열은, 막횡단 단편을 코딩하는 서열을 제거하고, 이것을 메티오닌 (번역 개시) 코돈으로 대체하고, 마지막 코돈과 갈락토실트랜스퍼라제의 정지 코돈 사이에 KDEL(아미노산 잔기 서열:리신-아스파르트산-글루탐산-류신)을 코딩하는 서열과 같은 ER 체류 신호를 코딩하는 핵산 서열을 삽입함으로써 수득될 수 있다 (Rothman, 1987).
발현을 조절하는 것 이외에도, 소포체(ER) 또는 골지체 막에 존재하는 다른 글리코실트랜스퍼라제 또는 효소/단백질의 막횡단 도메인과 GnTIII의 효소 부분을 코딩하는 유전자 서열을 융합함으로써, 또는 ER에서의 체류를 위하여 KDEL에 제한 되지는 않지만 이와 같은 체류 신호를 첨가함으로써, GnTIII 활성의 재위치화를 조절할 수도 있다. 이러한 재위치화는, 재조합 당단백질을 포함한 당단백질의 N-결합 글리칸으로 특정한 사카라이드의 첨가 및 이들의 제거 방지를 변조한다.
GnTIII의 막횡단 도메인과 예를 들면 이에 한정되지는 않지만 GnTI (TmGnTI), 만노시다제 II (TmManII) 크실로실트랜스퍼라제 (TmXyl) 또는 α-1,3-푸코실트랜스퍼라제 (TmFuc)의 막횡단 도메인의 교환은, GnTIII의 조기 발현을 가능하게 하고 도 2에서 위치 (20) 내지 (22)에 이등분 GlcNAc를 도입할 수 있도록 한다. 이것은 기질 상에서 작용하는 크실로실트랜스퍼라제 및 푸코실트랜스퍼라제와 같은 글리코실트랜스퍼라제의 작용을 방지하여, Xyl 및 Fuc이 부족한 당형태를 유도한다. 중요하게, (β-1,4)-갈락토실트랜스퍼라제(GalT)의 작용에 의한 말단 갈락토스의 첨가는 GalT의 이등분 GlcNAc-공동-발현에 의해 억제되지 않고 [Bakker 등, "트랜스제닉 식물에 의해 생성된 항체의 갈락토스-연장 글리칸" Proc.Nat.Acad.Sci. USA 98:2899-2904, 2001], 그 결과 도 2에서 (20), (21) 및 (22)로 표시한 화살표의 오른쪽에 나타낸 것과 유사한 구조가 얻어진다. 면역원성 크실로스 및 푸코스 잔기가 없긴 하지만, 이러한 구조들은 복합형 글리칸으로 처리되는 오직 하나의 팔을 갖는다. 또한, 다른 팔의 전환이 가능하도록, GnTIII을 재배치하는 것에 추가로, 만노시다제 II (ManII) 및 GnTII을 골지체에 재배치하여 글리칸 처리 서열에서 조기에 작용하도록 한다. 이것은 여러 방식으로 달성될 수 있다. 예를 들면, 각각의 막횡단 도메인을 GnTI(TmGnTI)으로 교환함으로써, 도 2에서 (5)로 나타낸 위치로의 재배치가 일어난다. 또한, 막횡단 골지 표적 도메인을 제거하고 나머지 효소 단편에 C-말단 ER 체류 신호 (예를 들면, 아미노산 잔기 KDEL)을 제공함으로써, MarnII 및 GnTII양쪽 모두가 재위치화될 수 있다. GalT [Bakker 등, "트랜스제닉 식물에 의해 생성된 항체의 갈락토스-연장 글리칸, Proc.Nat.Acad.Sci. USA 98:2899-2904, 2001] 뿐만 아니라 GnTIII (예를 들면, TmXyl-GnTIII), ManII (예를 들면, TmGnTI-ManII) 및 GnTII (예를 들면, TmGnTI-GnTII)의 재배치 변형체를 발현하는 식물을, 목적하는 재조합 당단백질을 발현하는 식물과 교배하거나 (도 3), 또는 목적하는 당단백질을 코딩하는 유전자, 예컨대 항체를 코딩하는 유전자로 재형질전환할 수 있다. 이것은 크실로스 및 푸코스가 없는 말단 갈락토스 잔기와 함께 이등분된 글리칸을 갖는 재조합 당단백질의 생성을 가능하게 한다. 형질전환 절차 및 교배(공동-가루받이) 절차는 상기에 설명되어 있다.
다른 실시양태에서, 만노시다제 II(TmManII-GnTIII) 또는 크실로실트랜스퍼라제 (Tmxyl-GnTIII)의 막횡단 도메인을 갖는 GnTIII를 TmXyl-GalT, TmGnTI-GnTII, TmGnTI-ManII과 조합하였다. 이러한 조합은 공동발현에 의해 수득될 수 있거나 또는 관련 유전자들의 교차-가루받이를 통해 조합함으로써 수득될 수 있고, 이에 의해 재조합 당단백질을 포함하고 코어 서열상에 크실로스 및 푸코스가 없지만 트리만노실 코어 및 말단 갈락토스 상에 이등분된 GlcNAc 잔기를 갖는 당단백질이 얻어진다.
식물 내에 GnTIII의 도입이, 식물 당단백질의 글리칸 상에서 이등분된 올리 고사카라이드의 발생에 미치는 효과를 평가하였다. GnTIII을 위한 인간 유전자를 클로닝하고, 표지화 융합 단백질의 발현을 분석하기 위해 C-말단 c-myc 표지를 제공하였으며, 전체를 담배에 도입하기 위한 식물 조절 요소의 제어하에 놓아두었다. GnTIII가 식물에서 발현되고, 발현에 의해 내인성 식물 당단백질 상에 이등분된 올리고사카라이드 구조가 얻어진다는 것이 밝혀졌다. 적어도 2개의 GlcNAc 잔기를 함유하는 N-글리칸의 양은, 정상 담배 식물에서 발견되는 것과 비교하여 2배 이상이었다. 현저하게, 내인성 식물 당단백질의 단리된 글리칸의 기질-보조 레이저 탈착 이온화 경과시간 (Matrix-assisted Laser Desorption Ionization Time of Flight) (MALDI-TOF)으로부터 명백히 알 수 있듯이, GnTIII의 발현에 의해 복합형 N-글리칸 분해 생성물이 상당히 감소되었다. 이러한 데이타는, 담배에서의 GnTIII의 발현에 의해 N-글리칸 상에 이등분 구조가 도입되고, β-N-아세틸헥소사미니다제에 의한 분해로부터 글리칸을 보호한다는 것을 제시한다. β-N-아세틸헥소사미니다제는, 트리만노실 코어(Man-α1-3 및 Man-α1-6) 상에 전형적으로 존재하는 다른 GlcNAc-1-2 결합 중에서, 비-환원 말단 GlcNAc 및 β-N-아세틸글루코사민 (GalNAc) 절단에 대해 넓은 특이성을 갖는다.
실시예 1
플라스미드 및 식물 형질전환
피에터 제이, 드 종, 어린이 병원 오크랜드 연구소(Pieter J. de Jong, Children's Hospital Oakland Research Institute (CHORI))로부터 PAC 클론 RP5-1104E15 GnTIII (SEQ ID NO:1, 도 4A)를 수득하고, 이것은 필요시 생거 센터(Sanger Center)를 통해 클론 세트 HBRC_1.sc.로 입수가능하다. 클론은 인간 남자 혈액으로부터 유래되고, http://www.sanger.ac.uk/Teams/Team63/CloneRequest /(인간 염색체 22q12.3-13.1; 캠브리지 힌스톤의 웰컴 트러스트 게놈 캠퍼스의 더 웰컴 트러스트 생거 인스티튜트(The Wellcome Trust Sanger Institute, Wellcome Trust Genome Campus), CB10 1SA, UK; www.sanger.ac.uk)로부터 요청할 수 있다.
AccuTaq LA DNA 폴리머라제 (시그마 알드리치) 및 프라이머 GNT3F (5'atactcgagttaacaatgaagatgagacgct-3'; SEQ ID NO:3) 및 GNT3Rmyc (5'-tatggatcctaattcagatcctcttctgagatgag-3'; SEQ ID NO:4)를 사용하여 PCR에 의해 상기 PAC 클론으로부터 GnTIII을 위한 인간 유전자를 클로닝하였다. 올리고(Oligos)는 유로겐텍(Eurogentec (벨기에))으로부터 입수되었다. 제조업자에 따라 액큐택(AccuTaq) 폴리머라제를 위한 최적 조건을 사용하여 퍼킨엘머세터스(PerkinElmerCetus) 480 열 순환기(ABI/PE) 상에서 PCR을 수행하였다. 얻어지는 단편을 p블루스크립(pBluescribe) SK+ (미국 캘리포니아주 라 졸라의 스트라타겐 인코포레이티드)의 EcoRV 부위에 클로닝하고 서열을 확인하였다. 필수적으로 문헌 [Sanger 등, "디데옥시 사슬-종결 억제제를 사용한 DNA 시컨싱(sequencing)" Proc.Nat.Acad.Sci. USA 74:5463-5467, 1977]에 기재된 바와 같이 형광 표지 디데옥시뉴클레오티드를 사용하여 시컨싱을 수행하고, 반응 혼합물을 어플라이드 바이오시스템스(Applied Biosystems) 370A 또는 380 자동화 DNA 서열장치 위에서 주행시켰다. 인터넷 웹 상에서 자유롭게 입수가능한 상이한 소프트웨어 모듈을 사용하여 데이타를 분석하고, 데이타베이스에 존재하는 인간 GnTIII의 DNA 서열과 비교하였다.
이어서, C-말단 c-myc 표지와 함께 GnTIII 유전자를 함유하는 1.6kb HpaI/BamHI 단편을, pUCAP35S [Van Engelen 등, "항체 소단위 유전자의 협동 발현은 트랜스제닉 담배의 뿌리에서 다량의 기능성 항체를 생성한다" Plant Molecular Biology 26:1701-1710, 1994]의 Sma/BalII 부위 내에 클로닝하고, pAMV-GnTIII으로 명명하였다. 변경된 GnTIII 유전자를 갖는 꽃양배추 모자이크 바이러스 35S (CaMV35S) 20 프로모터 발현 카세트를 2원 벡터 pBINPLUS에서 AscI/PacI 단편으로서 클로닝하였으며[Van Engelen 등, "항체 소단위 유전자의 협동 발현은 트랜스제닉 담배의 뿌리에서 다량의 기능성 항체를 생성한다" Plant Molecular Biology 26:1701-1710, 1994], 그 결과 pBINPLUSGnTIII이 얻어지고, 에렉트로포레이션에 의해 아그로박테리움 투메파시엔스 균주 Ag10내에 도입된다. 니코티아나 타바쿰(Nicotiana tabacum) 종 샘선(Samsun) NN의 형질전환이 앞서 기재되었다 [Horsch 등 "식물 내로 유전자를 전달하기 위한 간단하고 일반적인 방법" Science 227:1229-1231, 1985]. 16개의 독립적인 트랜스제닉 식물을 선택하고 기재된 바와 같이 온실내에서 성숙단계로 성장시켰다. 잎 물질을 GnTIII(SEQ ID NO:2, 도 4B)의 발현 및 내인성 세포 당단백질의 글리칸 조성에 대해 분석하였다.
실시예 2
발현의 분석
앞서 기재된 바와 같이 담배 잎의 전체 단백질 추출물을 제조하였다 [Bakker 등, "트랜스제닉 식물에 의해 생성된 항체의 갈락토스-연장 글리칸" Proc.Nat.Acad.Sci.USA 98:2899-2904, 2001]. 샘플에 존재하는 단백질의 양을, 표준으로서 소 혈청 알부민을 사용하여 브래드포드 방법 [Bradford, M.M., "단백질-염료 결합 원리를 사용하여 단백질의 마이크로그램 양을 정량화하기 위한 빠르고 민감한 방법", Anal Biochem 72:248-254, 1976]에 의해 산출하였다. 고정된 양의 단백질 샘플을 환원 조건 하에 미리주형된 10 또는 12% SDS-PAGE 겔 (바이오-래드) 상에서 주행시켰다. 무지개 색 분자량 단백질 마커를 아머샴(Amersham)으로부터 입수하였다. 문헌에 기재된 바와 같이 필수적으로 웨스턴 블롯 분석을 수행하였다 [Bakker 등, "트랜스제닉 식물에 의해 생성된 항체의 갈락토스-연장 글리칸", Proc.Nat.Acad.Sci. USA 98:2899-2904, 2001]. 3[시클로헥실아미노]-1-프로판술폰산 (CAPS) 완충액 중에서 60분동안 바이오-래드 미니 트랜스-블롯 전기영동 전달 셀(Bio-Rad Mini Trans-blot Electrophoretic Transfer Cell)을 사용하여 별개의 단백질들을 니트로셀룰로스(BA85, 쉬레이처 및 슈엘(Schleicher and Schuell) 또는 트랜스-블롯 전달 매질, 바이오-래드(Bio-Rad))에 옮겼다. 퍼옥시다제 표지화 c-myc 항체를 사용한 친화성블롯팅에 의하여, GnTIII-c-myc 융합 단백질의 발현을 분석하였다. 비오티닐화 에리트로응집 파이토헤마글루티닌(E-PHA; 벡터 래버러토리즈)과 함께 배양함으로써, 내인성 담배 당단백질에서 이등분된 올리고사카라이드의 도입을 가시화하였다. 루미아날리스트(LumiAnalyst) 소프트웨어(버젼 3.0)를 사용하는 루미-이미져(Lumi-Imager) F1 장치(독일 만하임 뵈링거 만하임 GmbH) 상에서, 로쉐 (독일 만하임 로쉐 다이아그노스틱스 GmbH)로부터의 루미-라이트(Lumi-Light) 웨스턴 블롯팅 기판을 사용하여, 증진된 화학발광에 의해 검출을 수행하였다.
실시예 3
기질-보조 레이저 탈착 이온화 경과시간(MALDI-TOF) 질량 분광분석법
글리칸 구조의 분석을 위하여, 인간 GnTIII(GnTIII-17)으로 형질전환된 선택된 식물의 담배 잎으로부터 세포 단백질을 단리하였다. 단백질 단리 및 N-글리칸 제조를 문헌[Elbers 등, 2001]에 기재된 바와 같이 수행하였다. 앞서 기재된 질량 분광분석 전에, N-글리칸을 비다공성, 흑연화 카본 블랙 컬럼(카보그래피 울트라 클린 튜브(Carbograph Ultra Clean Tubes), 올테크 어소시에이츠(Alltech Associates))상에서 탈염시켰다. 마이크로매스(Micromass)(영국 맨체스터) Tof 스펙(spec) E MALDI-TOF 질량 분광분석계 상에서 MALDI-TOF 스펙트럼을 측정하였다. 필수적으로 문헌[Elbers 등, 2001]에 기재된 바와 같이, 기질로서 2,5-디히드록시벤조산을 사용함으로써 포지티브 모드로 질량 스펙트럼을 수행하였다.
인간 GnTIII의 발현은 이등분 N-글리칸을 N.타바쿰 내의 내인성 당단백질에 도입하였다. 구성 CaMV35S 프로모터의 제어하에서, C-말단 c-myc 표지에 융합된 완전 코딩 서열을 갖는 cDNA를 함유하는 이원 벡터 pBINPLUSGnTIII을 아그로박테리움-매개 형질전환시킴으로써, 인간 GnTIII을 담배 식물에 도입하였다. 카나마이신 내성을 위해 선택된 60개의 독립적인 트랜스제닉 새싹을 수득하고, 이것을 c-myc 항체를 사용하여 GnTIII-c-myc 융합 단백질의 발현을 위해 분석하였다. 분석은, 전부가 다양한 수준으로 유전자를 발현함을 밝혀내었다. 14개를 선택하고, 뿌리깊게 심고 온실로 옮겼다. 비오티닐화 렉틴 E-PHA와의 특이적 결합 분석을 사용하여, 내인성 담배 당단백질의 N-글리칸 상에 이등분된 GlcNAc 잔기가 발생하는 지에 관하여, c-myc 항체를 사용하여 GnTIII-c-myc 융합 단백질의 고도 발현을 위해 선택된 1개의 식물(GnTIII-17)을 분석하였다. 단백질 추출물의 SDS-PAGE에 이어서 니트로셀룰로스로 옮기고, 비오티닐화 E-PHA 렉틴과의 특이적 결합 분석을 사용하여 분석하면, GnTIII-17의 내인성 담배 당단백질은 이등분된 올리고사카라이드를 함유하는 반면 대조 담배의 당단백질은 그렇지 않다는 것이 밝혀졌다. MALDI-TOF에 의하여 글리칸 구조를 더욱 상세히 분석하기 위해 온실에서 GnTIII-17을 번식시켰다.
실시예 4
와일드타입 및 선택된 트랜스제닉 GnTIII-17 담배 식물에서 올리고사카라이드 분포 및 이등분된 복합 올리고사카라이드의 수준
대조 담배 식물의 어린 잎 및 선택된 GnTIII-17 식물로부터 내인성 당단백질을 단리하고, 당단백질에 N-결합 글리칸의 구조에 대한 인간 GnTIII의 발현 효과를 상세히 조사하였다. 대조 와일드타입 담배 식물의 잎에 존재하는 당단백질로부터 단리된 N-글리칸의 구조를, MALDI-TOF를 사용하여 식물 GnTIII-17로부터 단리된 것과 비교하고, 이것을 도 1에 나타낸다. MALDI-TOF는 N-글리칸(당형태)의 풀에서 상이한 분자 종의 검출을 가능하게 하고, 이온의 혼합물이 d,Mans 내지 n,Man9 범위의 고-만노스(Man)-유형 N-글리칸 및 끝이 절단된 구조 a, XM3GN2 내지 m, GN3FXM3GN2 범위의 성숙된 N-글리칸의 (M+Na)+ 부가생성물에 할당됨을 나타낸다 (구조에 관해 표 1 참조; 데이타의 요약을 위해 표 2 참조). 대조 식물(도 1A)에서 특징화된 N-글리칸 이외에도, 식물 GnTIII-17 (도 1B)로부터의 글리칸 혼합물의 MALDI-TOF MS는, N-결합 글리칸에 할당된 적어도 2개의 이온이 인간 GnTIII 효소의 작용으로부터 얻어진다는 것을 나타내었다 (비교를 위해 표 1 및 표 2 참조). 집단의 각각 8% 및 31%를 나타내는 이러한 올리고사카라이드들, GN3XM3GN2 (i) 및 GN3FXM3GN2 (k)는, N-결합 글리칸의 트리만노실 코어 구조의 3개의 만노스 중의 하나에 각각 연결된 3개의 GlcNAc 잔기를 함유한다.
여기에서 수행된 것과 같이 MALDI-TOF를 통한 글리칸 구조의 분석은 만노스에 결합된 GlcNAc 잔기 β(1,2)- 또는 β(1,4)를 구별할 수 없다. 따라서, 구조 GN2XM3GN2 및 GN2FXM3GN2가 이등분된 올리고사카라이드를 갖고 있는지 또는 어느 정도까지 갖고 있는지는 분명하지 않았다. 이러한 구조가 정상 및 이등분된 올리고사카라이드 또는 단일 화합물의 혼합물인지를 밝혀내기 위해서는 추가의 실험이 요구된다.
GnTIII을 과다발현하는 CHO 세포의 관찰된 치사성의 측면에서 [Umana 등, "최적화된 항체-의존성 세포 세포독성 활성을 갖는 항신경아세포종 IgG1의 조작된 당형태" Nature Biochemistry 17:176-180, 1999], 상당한 양의 이등분된 글리칸을 갖는 현저한 트랜스제닉 식물은 표현형에서 정상으로 보이고, 완전히 수정되었다 (교차-가루받이 및 자기-가루받이될 수 있다).
실시예 5
담배에서 인간 GnTIII의 발현은 D-나세틸헥소사미니다제에 의한 분해로부터 N-글리칸을 보호하고 말단 N-글루코사미닐화를 2배 이상 상승시키는 것으로 보인다.
추출물의 MALDI-TOF 분석은, GnTIII 효소의 작용을 통하여, 당형태 집단의 40% 이상이 세포 담배 단백질의 복합형 N-결합 글리칸에서 이등분 GlcNAc를 갖는다는 것을 분명히 나타내었다. 또한, GnTIII-17의 내인성 당단백질의 복합형 N-결합 글리칸 집단의 70%가, 와일드타입 담배의 경우 약 30%인 것에 비하여, 2 또는 3개의 말단 GlcNAc 잔기를 갖는다 (표 1). 담배에서 GnTIII의 발현시에, 이등분 복합형 N-결합 글리칸의 40% 이상의 관찰된 신규 합성(도 1B, 표 1 및 표 2)은, 주로 FXM3GN2 (b, 30% 내지 4%) 및 GNFXM3GN2 (f, 10 내지 2%)의 소실 및 소량의 GN2FXM3GN2 (j, 29% 내지 19%)와 일치하였다. 또한, 이것은 와일드타입 담배에서 4% 내지 GnTIII-17에서 14%로 GN2XM3GN2(h)의 상당한 증가와 일치한다. GnTIII 식물에서의 GN2XM3GN2(h)가 N-결합 글리칸의 트리만노실 코어의 β-결합 만노스에 연결된 두번째 GlcNAc를 갖고 따라서 GnTIII 활성의 결과인지, 또는 트리만노실 코어의 두번째 α-연결된 만노스에 연결된 두번째 GlcNAc를 갖는지의 여부는 여전히 조사되어야 한다 (상기 참조).
GnTI 활성을 결여한 아라비도프시스 탈리아나 변이주가 내인성 당단백질의 N-글리칸에서 크실로스 및 푸코스 잔기를 함유하지 않기 때문에 [Von Schaewen 등, "N-아세틸글루코사미닐 트랜스퍼라제 I을 결여하고, 골지-변경 복합 N-결합 글리칸을 합성할 수 없는 변이주 아라비도프시스 식물의 단리" Plant Physiology 102:1109-1118, 1993], 와일드타입 담배 식물에서 N-결합 글리칸의 40%에 달하는 사카라이드 a, b 및 c는, GnTI 활성 후에 내인성 담배 당단백질의 성숙한 글리칸으로부터 생긴 것으로 예측되는 분해 생성물이다. GNXM3GN2 및 XM3GN2(12%>4%)의 3배 감소와 함께 구조에서 GnTIII-17의 7배 감소 (40%>6%)는, 이등분된 GlcNAc의 도 입이 말단 GlcNAc를 제거하는 내인성 글리코시다제, 특히 β-나세틸헥소사미니다제에 의한 분해로부터 성숙한 N-결합 글리칸을 보호한다는 것을 제시한다. 따라서, 성숙한 전길이 N-결합 글리칸의 분해로부터 생긴 것으로 예측되는 N-결합 글리칸의 총량은 5배 감소되었다 (52%로부터 10%로).
실시예 6
옥수수 형질전환을 위한 벡터 구축 및 DNA 제조
하기 방법에 의해 플라스미드 pAMV-GNTIII로부터 PCR에 의하여 인간 GNTIII 유전자를 3' c-myc 면역검출 표지와 함께 수득하였다. 각각 hGNTIII 유전자의 5' 및 3' 말단에 상동성인 프라이머 MS20 및 MS19를 계획하고, 합성하여, 유전자의 3' 말단에 Pme1 부위 및 정지 코돈을 첨가하였다.
MS20 (5' Nco1 부위): 5'-CCATGGTGATGAGACGCTAC-3' (SEQ ID NO:5)
MS19 (정지 및 Pme1 부위 3' 첨가): 5'-GTTTAAACCTAGGATCCTAATTCAGATCCTCT-3' (SEQ ID NO:6)
보정된 크기의 PCR 생성물을 동정하기 위한 겔 전기영동 후에, QIA 퀵 겔 추출 키트 (미국 캘리포니아주 발렌시아 퀴아겐)로 겔로부터 1.6kbp PCR 생성물을 회수하였다. Zmubi/GUS/per5 카세트 [Christensen 등, Plant Molec. Biol. 18:675-689, 1992]를 함유하는 플라스미드 4005 (SEQ ID NO:8 참조) (도 5A 및 5B)를 Nco1 및 Pme1으로 소화시켜, GUS 유전자를 방출시키고, QIA 퀵 겔 추출 키트 (미국 캘리포니아주 발렌시아 퀴아겐)로 겔로부터 벡터 단편을 회수하였다.
Nco1 및 Pme1으로의 소화 후에, pDAB4005를 Nco1 및 Pme1으로 소화시킨 후에 남은 벡터 단편에 PCR-유래 hGNTIII 단편을 결찰시켜, 중간 플라스미드 pDAB7119 (SEQ ID NO:9) (도 6A 및 6B)를 생성하였다. 중간 플라스미드 pDAB7119를 Spe1 및 Sph1으로 절단하여 hGNTIII 식물 발현 카세트를 방출시키고, 이것을 T4 DNA 폴리머라제로 처리하여 블런트 말단을 생성하였다.
RB7 MAR 서열을 함유하는 플라스미드 pDAB8504 (SEQ ID NO:10) (도 7A 및 7B 참조)를 Srf1으로 소화시키고, T4 DNA 폴리머라제로 블런트 말단화하였다. 소 내장 포스파타제로 처리한 후에, 처리된 8504 단편 및 hGNTIII 식물 발현 카세트를 결찰시켜, 목적하는 유전자에 인접한 RB7 MAR 서열 및 다음과 같은 선택가능한 마커 카세트를 함유하는 플라스미드 pDAB 7113 (SEQ ID NO:10) (도 8A 및 8B 참조)를 생성하였다: RB7 MAR//Zmubi 프로모터/hGNTIII/per5 3'UTR//쌀 액틴 프로모터 [D.McElroy 등 "쌀 형질전환에서 사용하기 위해 효율적인 액틴 프로모터의 단리" The Plant Cell 2: 163-171, 1990]/PAT/Zm 리파제 3'UTR//RB7 MAR.
시컨싱 (Big Dye Terminator Cycle Sequencing Ready Reaction, 미국 캘리포니아 포스터 시트의 어플라이드 바이오시스템스(Applied Biosystems))에 의해 GNTIII 서열의 통합을 검사하고, 인간 GNTIII 효소를 코딩하는 것을 확인하였다. 하나의 염기 변화 G384→384가 발견되었으나, 이러한 치환이 코딩된 아미노산, 프롤린 128에 영향을 미치지 않았다.
플라스미드 pDAB7113을 2리터의 배지 (LB+amp)에서 성장시키고, 퀴아겐 플라스미드 기가(Giga) 키트로 정제시켜 식물 세포 형질전환을 위해 정제된 플라스미드 5 밀리그램을 생성하였다.
실시예 7
옥수수 세포의 형질전환
하기 문헌에 열거된 바와 같이 필수적으로 위스커스(WHISKERS)-매개 DNA 전달에 의하여 옥수수 세포 내에 플라스미드 pDAB7113을 도입하였다 [Frame,B. 등, "탄화규소 위스커-매개 형질전환에 의한 수정 트랜스제닉 옥수수 식물의 생성" Plant J. 6:941-948, 1994; Thompson, J. 등, "탄화규소 위스커를 사용한 옥수수 형질전환; 검토" Euphytica 85:75-80, 1995; P.Song, C.Q.Cai. M.Skokut, B.Kosegi, 및 J.Petolino, "위스커-유래 트랜스제닉 옥수수에서 트랜스진 복제 수를 산출하기 위한 선별 도구로서의 정량적 실제-시간 PCR" Plant Cell Rep. 20:948-954, 2002; 양쪽 모두 참고문헌으로 인용됨].
위스커 매개 형질전환 전 날에, 배형성 옥수수 현탁액 세포 배양액을 배지 G-N6 (30gm/L 슈크로스, 100mg/L 이노시톨 및 2mg/L 2,4-D를 함유하는 N6 배지)에 계대배양시켰다. 실험 일에, 각각 0.2몰 만니톨 및 소르비톨을 함유하는 배지 G-N6와 30분동안 진탕함으로써, 세포를 오스모티컴(osmoticum)으로 전처리하였다. 36ml의 세포를 50ml의 배지 G-N6이 들어있는 250ml 원심분리 병으로 옮기고, 여기에 배지 중의 8.1ml의 5% (w/v) 탄화규소 위스커 현탁액 (실라(Silar)SC-9, 사우스 캐롤라이나 그리어의 어드밴스드 콤포지트 머티어리얼스(Advanced Composite Materials))와 170㎕의 1mg/ml 플라스미드 용액 (TE 완충액 중)을 첨가하였다. 세포, 위스커 및 DNA를 함유하는 원심분리 병을 변형된 레드 데빌(Red Devil) 브랜드 페인트 믹서 위에서 10초동안 격렬하게 교반하였다. 위스커 세포를 배지에서 2시 간동안 진탕하여, 첨가된 오스모티컴의 수준을 반으로 하였다. 위스커 세포를 멸균 부흐너 깔때기 상에서 여과에 의해 회수하고, 여과지를 반고체 G-N6 배지 상에 1주일동안 놓아두었다. 1주일 후에, 필터를 1mg/L 헤르비어스(Herbiace) (일본 도오꾜 메이지 세이카(Meiji Seika)의 20% 비알라포스의 시판 제제)를 함유하는 반고체 G-N6 배지로 이동시켰다. 2주일 후에, 여과지로부터 세포를 제거하고, 7mg/L 세아플라크(Seaplaque) 아가로스 (메인 록랜드의 바이오위타커(BioWhittaker))를 함유하는 용융된 G-N6+1mg/L 헤르비어스 (G-N6+1H) 배지와 혼합하고, G-N6+1H 고체 배지의 위에 도말하였다. 플레이트를 30℃에서 어두운 곳에서 배양하였다. 포매 후 5 내지 7주에 선택 인자에 대해 내성인 콜로니를 회수하고, 조직 량을 더욱 증가시키기 위해 개별적으로 새로운 G-N6+1H 배지로 이동시켰다.
실시예 8
삽입된 DNA의 복제 수의 분자 분석
각각의 트랜스제닉 단리물로부터의 조직을 동결건조장치에서 개별적으로 동결-건조시키고, 표준 방법(DNA이지 96프랜트 키트, 퀴아겐)에 의해 DNA를 추출하였다. 삽입된 트랜스제닉 DNA의 복제 수를 인베이더 오퍼레이팅 시스템(Invader Operating System), 서드 웨이브 테크놀로지스(Third Wave Technologies), 미국 위스콘신 매디슨, twt.com)로부터 입수가능함)에 의해 산출하였다. 서드 웨이브 테크놀로지스 컴퍼니에 의해 PAT 선택가능한 마커에 대해 특이적으로 프라이머를 고안하였으며, 그의 복제 수를 거대한 옥수수 알파-튜불린 유전자에 대한 게놈 DNA 복제 수에 대해 평가하였다.
실시예 9
GnTIII 유전자의 발현에 기인한 변경된 렉틴 결합을 위한 시험 트랜스제닉 옥수수 칼루스
100개의 개별적으로 단리된 특이적 트랜스제닉 사건으로부터 칼루스 샘플을 다음과 같이 추출하였다. 각 사건으로부터의 샘플을, 각각의 웰에 강철 및 텅스텐 비이드를 갖는 96-웰 클러스터 튜브 박스(뚜껑을 갖는 코스타 1.2ml 폴리프로필렌)에서 새로 동결시켰다. 450㎕의 추출 완충액 (25mM 인산나트륨 pH 6.6, 100mM NaCl, 30mM 이황산나트륨, 1% v/v 트리톤 X-100)을 웰에 첨가하고, 샘플의 박스를 클레코 비이드 밀(Kleco Bead Mill) 위에서 3분간 충분한 속도로 분쇄하였다. 플레이트를 2500rpm에서 10분간 원심분리하였다 (4℃). 추출물을 96-웰 깊은 웰 플레이트로 옮기고, 저장을 위해 동결시켰다. 각각의 사건의 추출물에 대하여 모든 선별 분석을 수행하였다.
각각의 추출물에 대해 전체 단백질을 결정하기 위하여 단백질 분석 (마이크로티터 플레이트 프로토콜, 바이오래드 500-0006)을 수행하였다. 샘플 당 25㎍ 단백질을 20㎕ 부하 완충액에 부하하였다 (Laemmli, U.K.Nature 277:680 (1970)). 겔 (4-20% 크리테리온 PAGE 겔, 12+2 웰, 바이오래드 345-0032)을 트리스/글리신/SDS 주행 완충액 (바이오래드 161-077)에서 65mA에서 전기영동하였다. 전달 완충액 (주행 완충액 + 20% v/v 메탄올)에 10분간 침지시킨 후에, 반건조 블로터(150mA/1.5시간)를 사용하여 겔을 니트로셀룰로스 막으로 옮겼다. 막을 실온에서 차단 완충액 (20mM 트리스, 144mM NaCl, 0.5% v/v 트윈(Tween) 20, 10% w/v 탈지 분유)중에서 30분동안 배양한 다음, 차단 완충액을 제거하고, 차단 완충액 중의 2.5㎍/ml 1차 검출 렉틴 (페이젤러스(Phaseolus) 헤마글루티닌 E, 비오티닐화, 벡터 래보러토리즈 B-1125)으로 대체하였다. 1차 검출 렉틴을 실온에서 1시간동안 막 위에서 배양하였다. 1차 검출 용액을 제거하고, 막을 차단 완충액으로 한번 헹구고, 2차 검출 용액을 첨가하였다 (1:5000에서 아비딘-HRP, 바이오래드 170-6528 + 차단 완충액 중의 1:10,000에서 분자량 마커 검출 시약, 스트렙탁틴(Streptactin)-HRP, 바이오래드 161-0380). 2차 검출 시약을 실온에서 1시간동안 막 위에서 배양하였다. 차단, 1차 및 2차 시약 단계 동안에, 용액들을 블롯 상에 혼합하였다. 2차 검출 시약을 제거하고, 0.5% 트윈 20을 함유하는 트리스 완충 염수 (20mM 트리스, 144mM NaCl)로 각각 10분씩 3회 헹구고, 5분동안 한번 더 헹구었다. 과량의 헹군 용액을 방울로 떨어뜨린 후에, 블롯을 기질 ECL (피어스 34080)에서 1분동안 침지시키고, 과량의 ECL 용액을 배수시키고, 막을 필름에 노출시켰다. 트랜스제닉 칼루스 추출물 상에 이등분된 글리칸과 함께 눈에 보이고 렉틴 시약을 검출하는 새로운 당단백질 띠를 구별하기 위하여, 네가티브 대조를 각각의 겔에 포함시켰다.
E-PHA 결합을 위해 포지티브 시험 결과 (표 5)를 0(네가티브), 1(1 플러스, 약), 2 (2 플러스, 약간 강) 또는 3(3 플러스, 가장 강한 등급)으로 등급화하였다. 2 또는 3으로 등급화된 칼루스를 선택하여 질량 분석을 위한 샘플을 생성하였다. 샘플 25, 26, 33, 48, 55, 56 및 59를 모아서, 글리칸 구조의 MALDI-TOF 분석을 위한 단백질 추출물을 생성하였다. 겔 블롯 예 (도 12)는 샘플 19 내지 27을 나타낸 다.
실시예 10
c-myc 에피토프 발현을 위한 시험 트랜스제닉 옥수수 칼루스
100개의 개별적으로 단리된 특이적 트랜스제닉 사건으로부터 다음과 같이 칼루스 샘플을 추출하였다. 각 사건으로부터의 샘플을 각각의 웰에 강철 및 텅스텐 비이드를 갖는 96-웰 클러스터 튜브 박스(뚜껑을 갖는 코스타 1.2ml 폴리프로필렌)에서 새로 동결시켰다. 450㎕의 추출 완충액 (25mM 인산나트륨 pH 6.6, 100mM NaCl, 30mM 이황산나트륨, 1% v/v 트리톤 X-100)을 웰에 첨가하고, 샘플의 박스를 클레코 비이드 밀(Kleco Bead Mill) 위에서 3분간 충분한 속도로 분쇄하였다. 플레이트를 2500rpm에서 10분간 원심분리하였다 (4℃). 추출물을 96-웰 깊은 웰 플레이트로 옮기고, 저장을 위해 동결시켰다. 각 사건의 추출물에 대하여 모든 선별 분석을 수행하였다.
각각의 추출물에 대해 전체 단백질을 결정하기 위하여 단백질 분석 (마이크로티터 플레이트 프로토콜, 바이오래드 500-0006)을 수행하였다. 샘플 당 25㎍ 단백질을 20㎕ 부하 완충액에 부하하였다 (Laemmli, U.K.Nature 277:680 (1970)). 겔 (4-20% 크리테리온 PAGE 겔, 12+2 웰, 바이오래드 345-0032)을 트리스/글리신/SDS 주행 완충액 (바이오래드 161-0772)에서 65mA에서 전기영동하였다. 전달 완충액 (주행 완충액 + 20% v/v 메탄올)에 10분간 침지시킨 후에, 반건조 블로터(150mA/1.5시간)를 사용하여 겔을 니트로셀룰로스 막으로 옮겼다. 막을 실온에서 차단 완충액 (20mM 트리스, 144mM NaCl, 0.5% v/v 트윈 20, 10% w/v 분 유)중에서 30분동안 배양한 다음, 차단 완충액을 제거하고, 차단 완충액 중의 1㎍/ml 1차 검출 시약, 마우스 안티-c-myc 클론 9 E 10 (시그마 M5546) 으로 대체하였다. 실온에서 1시간 배양 후에, 1차 검출 시약을 제거하고, 막을 차단 완충액으로 한번 헹구었다. 1:10,000에서 2차 검출 시약, 항-마우스-HRP (바이오래드 170-6526) + 차단 완충액 중의 1:10,000에서 분자량 마커 검출 시약, (스트렙탁틴(Streptactin)-HRP, 바이오래드 161-0380)을 첨가하고 실온에서 1시간동안 막 위에서 배양하였다. 차단, 1차 및 2차 시약 단계 동안에, 용액들을 블롯 상에 혼합하였다. 2차 검출 시약을 제거하고, 0.5% 트윈 20을 함유하는 트리스 완충 염수 (20mM 트리스, 144mM NaCl)로 각각 10분씩 3회 헹구고, 5분동안 한번 더 헹구었다. 과량의 헹군 용액을 방울로 떨어뜨린 후에, 막을 ECL시약 (피어스 34080)에서 1분동안 침지시키고, 배수시키고, 막을 필름에 노출시켰다.
상기 상술한 바와 같이, 독립적 사건 1-100으로부터의 칼루스 샘플을 c-myc 에피토프의 발현에 대하여 선별하였다. 이어서, 샘플 3, 11, 12, 26, 31, 55 및 64를 분석하였으며, 이것은 50-55 킬로달톤의 예측된 분자량 범위에서 띠의 존재를 나타내었다. 이러한 칼루스 샘플들을 모으고, MALDI-TOF에 의해 글리칸 분석을 위한 단백질 샘플을 생성하였다. 대표적인 블롯을 도 13에 나타낸다.
실시예 11
글리칸의 질량 스펙트럼 분석을 위한 추출물의 제조
E-PHA를 사용한 렉틴 블롯팅을 기초로 하여 GnTIII 트랜스진 발현에 대해 포티브로 시험된 여러 옥수수 칼루스 사건의 조합된 칼루스으로부터 샘플을 제조하였 다. 칼루스 조직을 새로 수집하고, -80℃에서 동결상태로 보관한 다음 액체 질소 중에서 미분말로 분쇄하였다. 측량된 샘플을 추출 완충액 (5mM EDTA, 0.5mM PMSF, 20mM 이황산나트륨, 150mM 인산나트륨 완충액 pH 7.4 및 0.4mM PVPP 가용성, MW 40,000)에 첨가하고, 4℃에서 30분동안 교반하였다. 4℃에서 5000× G에서 원심분리 후에, 상층액을 수집하였다. 황산암모늄 및 세척 완충액 (5mM EDTA, 150mM 인산나트륨 완충액, pH 7.4)을 상층액에 첨가하여, 20% (w/v) 황산암모늄의 최종 농도를 달성하였다. 4℃에서 5000× G에서 5분간 원심분리 후에, 상층액을 새로운 튜브로 옮기고, 추가의 황산암모늄 + 세척 완충액을 첨가하여 60% (w/v) 황산암모늄을 달성하였다. 이러한 침전을 4℃에서 밤새 교반한 다음, 10,000×G에서 20분간 원심분리하였다. 펠릿을 5ml의 세척 완충액에 회수하고 -80℃에서 동결한 다음 건조될 때까지 4℃에서 동결건조하였다. 샘플을 글리칸 분석을 위해 실험실로 보내었다.
실시예 12
트랜스제닉 칼루스 조직으로부터의 옥수수 식물 재생
형질전환된 칼루스로부터의 식물 재생을 위하여, MS 기본 염 및 비타민 (Murashige T. 및 F.Skoog, Physiol Plant 15:473-497, 1962), 30g/l 슈크로스, 5mg/l 6-벤질아미노퓨린(BA), 0.025mg/l 2,4-디클로로페녹시아세트산(2,4-D), 1mg/l 헤르비아스 (20% 비알라포스의 시판 제제, 일본 도오꾜 메이지 세이까) 및 2.5g/l 겔라이트를 함유하는 재생 배지, pH 5.7 상에 조직을 놓아두었다. 배양액을 빛 아래에서 성장시켰다. 새싹이 1-3cm 길이에 이를 때, 이들을 SH 기본 염 및 비타민(Schenk R. 및 A.C.Hildebrandt, Can J Bot 50:199-204, 1972), 10 g/l 슈크로스, 1g/l 미오-이노시톨 및 2.5g/l 겔라이트 (pH 5.8)를 함유하는 용기로 옮겼다.
내인성 단백질에 대한 렉틴 E-PHA의 결합을 변경시킴으로써 GNTIII의 발현에 대해 식물을 선별하였다. 이어서, 상기 실시예 9에 기재된 바와 같이 E-PHA 결합에 대해 샘플을 선별하였다. 단백질 추출물 및 20%/60% 황산암모늄 침전물을 하기 실시예 13에 기재된 칼루스 샘플에 대해서와 실제적으로 동일하게 제조하였다. GNTIII 유전자의 발현 결과를 위해, 각각 23개의 독립적 사건으로부터 재생된 식물로부터의 하나의 식물을 렉틴 블롯팅에 의해 선별하였다. 이러한 사건 중 4개가 E-PHA 결합을 위한 포지티브 신호를 제공하였다. 4개의 사건은 칼루스 단계에서 포지티브로 시험되었다. 4개 사건으로부터 재생된 식물을 모아서, MALDI-TOF에 의한 글리칸 분석을 위한 단백질 추출물을 생성하였다.
실시예 13
와일드타입 및 선택된 트랜스제닉 옥수수 칼루스에서 올리고사카라이드 분포 및 이등분된 복합 올리고사카라이드의 수준
대조 옥수수 칼루스로부터 내인성 당단백질을 단리하고, E-PHA을 사용하는 렉틴 블롯팅을 기초로 하여 GnTIII을 발현하는 옥수수 칼루스를 선택하였다. 또한, 본 발명은 c-myc 표지화 샘플의 추출을 의도한다. E-PHA 및 c-myc 표지화 샘플은 상기 정의 부분에서 정의된 것과 같은 칼루스, 식물 세포, 식물 조직 또는 전체 식물일 수도 있다. 칼루스에 존재하는 당단백질로부터 단리된 N-글리칸의 구조 의 비교를 도 9A 및 9B에 나타낸다. MALDI-TOF는 N-글리칸(당형태)의 풀에서 상이한 분자 종을 검출할 수 있고, 이것은 이온의 혼합물이 d,Man5 내지 l,Man8 범위의 고-만노스 (Man)-유형 N-글리칸 및 끝이 절단된 구조 a,XM3GN2 내지 m,bGN3FXM3GN2 의 성숙한 N-글리칸의 (M+Na)+ 부가생성물에 할당됨을 나타내었다 (표 3 참조). 대조 칼루스에서 특징화된 N-글리칸(도 9A)에 추가로, GnTIII를 발현하는 선택된 옥수수 칼루스로부터의 글리칸 혼합물의 MALDI-TOF MS (도 9B)는, 하나 이상의 이온의 인간 GnTIII 효소(비교용, 표 3 참조)의 작용으로부터 얻어진 N-결합 글리칸에 할당됨을 나타내었다. 이러한 올리고사카라이드, GN3XM3GN2 (m)은 집단의 20%를 나타내고, N-결합 글리칸의 트리만노실 코어 구조의 3개 만노스 중 하나에 각각 연결된 3개의 GlcNAc 잔기를 함유한다. 여기에 수행된 것과 같은 MALDI-TOF를 통한 글리칸 구조의 분석은, 만노스에 β(1,2)- 또는 β(1,4)- 연결된 GlcNAc 잔기들을 구별할 수 없다. 따라서, 구조 GN2XM3GN2(h) 및 GN2FXM3GN2 (k)가 이등분된 올리고사카라이드를 갖는지 또는 어느 정도까지 갖는지는 분명하지 않다. 양쪽 모두 비형질전환 대조 옥수수 세포에 비하여 GnTIII 옥수수 세포에서 증가된 수를 갖는다. 이러한 구조물이 정상 및 이등분된 올리고사카라이드의 혼합물 또는 단일 화합물임을 밝히기 위하여, 추가의 실험이 요구된다.
GnTIII 옥수수에서 사카라이드 구조 m (bGN3FXM3GN2)의 새로운 출현 이외에도, 표 3에 나타낸 바와 같이, 대조 및 GnTIII 옥수수의 당형태의 비교로부터, 고-만노스 유형 N-글리칸 (M4 및 그 이상)을 갖는 구조의 양이 2배 이상 감소함이 명백하며 (19%로부터 7%로), 이것은 대부분 GnTIII 옥수수 대 대조 옥수수에서 M4-함 유 N-글리칸의 감소(전체의 10%로부터 1%로)에 기인할 수 있다. 또한, 2개 이상의 GlcNAc잔기를 갖는 당형태의 양은 16%에서부터 42%로 증가하였다 (대조 대 GnTIII).
계속된 실험에서, 대조 옥수수 칼루스로부터 내인성 당단백질을 단리하고, 웨스턴 블롯팅에 의하여 c-myc 표지 서열의 존재에 대한 분석을 기초로 하여 GnTIII을 발현하는 옥수수 칼루스를 선택하였다. 칼루스에 존재하는 당단백질로부터 단리된 N-글리칸의 구조의 비교를 표 4에 나타낸다. MALDI-TOF는 N-글리칸(당형태)의 풀에서 상이한 분자 종의 검출을 가능하게 하고, 이것은 이온의 혼합물이 d,Man5 내지 l,Man8 범위의 고-만노스(Man)-유형 N-글리칸 및 대조 옥수수에서 끝이 절단된 구조 a,XM3GN2 내지 k,GN2FX3GN2의 성숙한 N-글리칸의 (M+Na)+ 부가생성물에 할당됨을 나타낸다.
현저하게, GnTIII을 발현하는 트랜스제닉 옥수수에서 (표 4, GnTIII-2), 단지 3개의 이소형 만이 검출될 수 있다: FXM3GN2 (b; 전체의 9%에 달함), GN2FXM3GN2/bGN2FXM3GN2 (k; 38%) 및 bGN3FXM3GN2 (m; 54%). k (GN2FXM3GN2/bGN2FXM3GN2)로 예측된 구조가 이등분된 올리고사카라이드를 갖는지 또는 어느 정도까지 이등분된 올리고사카라이드를 갖는지는 분명하지 않는다. 그의 존재는 대조 옥수수에 비하여 GnTIII 옥수수에서 현저히 증가된다. 이러한 구조가 정상 및 이등분된 올리고사카라이드의 혼합물 또는 단일 화합물인지를 밝히기 위하여 추가의 실험이 요구된다.
GnTIII 옥수수에서 당 구조 m(bGN3FXM3GN2)의 새로운 출현(54%) 이외에도, 표 4에 요약된 바와 같이, 대조와 GnTIII 옥수수의 당형태의 비교로부터, 고-만노스 유형 N-글리칸(M4 및 그 이상)을 갖는 구조의 양이 GnTIII 옥수수 대 대조 옥수수에서 0으로 감소된다는 것이 명백하다. 또한, 2개 또는 그 이상(3)의 GlcNAc 잔기를 갖는 N-글리칸의 총 량은 16%로부터 92%로 증가되고 (대조 대 GnTIII), 이것은 트랜스제닉 GnTIII 담배에 대해 앞서 관찰된 바와 같이 이등분된 GlcNAc 잔기의 도입이 내인성 헥소사미니다제에 의한 분해로부터 글리칸을 보호한다는 것을 제시한다.
추가로 MALDI-TOF 질량 분광분석법 데이터 (표 11)는 이등분된 GlcNAc 구조를 증명한다.
실시예 14
와일드타입 및 선택된 트랜스제닉 옥수수 식물에서 올리고사카라이드 분포 및 이등분된 복합 올리고사카라이드의 수준
대조 옥수수 식물 잎으로부터 내인성 당단백질을 단리하고, E-PHA를 사용한 웨스턴 블롯팅 또는 렉틴 블롯팅에 의해 c-myc 표지 서열의 존재에 대한 분석을 근거로 하여 GnTIII을 발현하는 옥수수 식물 잎을 선택하였다. 잎에 존재하는 당단백질로부터 단리된 N-글리칸의 구조를 비교하여 표 6에 나타낸다. MALDI-TOF는 N-글리칸(당형태)의 풀에서 상이한 분자 종의 검출을 가능하게 하고, 이것은 이온의 혼합물이 f,Man6 내지 h,Man8 범위의 고-만노스(Man)-유형 N-글리칸 및 끝이 절단된 구조 a,XM3GN2로부터 대조 옥수수 식물에서 g,GN2FXM3GN2 및 트랜스제닉 GnTIII 옥수수 식물에서 i,bGN3FXM3GN2까지의 성숙한 N-글리칸의 (M+Na)+ 또는 (M+K)+ 부 가생성물에 할당됨을 나타낸다.
대조 식물에서 특징화된 N-글리칸 (도 A)에 추가로, GnTIII를 발현하는 선택된 옥수수 식물로부터의 글리칸 혼합물의 MALDI-TOF MS(도 B)는, 하나 이상의 이온이 인간 GnTIII 효소의 작용으로부터 얻어진 N-결합 글리칸에 할당됨을 나타내었다 (비교를 위해 표 6 참조). 이러한 올리고사카라이드 GN3XM3GN2 (i)는 집단의 15%를 나타내고, N-결합 글리칸의 트리만노실 코어 구조의 3개 만노스 중의 하나에 각각 연결된 3개의 GlcNAc 잔기를 함유한다. 여기에 수행된 바와 같은 MALDI-TOF를 통한 글리칸 구조의 분석은 만노스에 β(1,2)- 또는 β(1,4)- 연결된 GlcNAc 잔기들을 구별할 수 없다. 따라서, 구조 GN2FXM3GN2 (g)가 이등분된 올리고사카라이드를 갖는지 또는 어느 정도로 갖는지는 분명하지 않다. 이것은 대조 옥수수 식물에 비해 GnTIII 옥수수에서 증가되었다 (대조에서 23% 대 5%). 이러한 구조가 정상 및 이등분된 올리고사카라이드의 혼합물 또는 단일 화합물인지를 밝히기 위하여 추가의 실험이 요구된다. 그 외에도, 대조 및 GnTIII 옥수수 식물의 당형태의 비교로부터, 표 6에 나타낸 바와 같이, FXM3GN2를 갖는 구조의 양이 2배 감소하였으며 (59로부터 30으로), 2개 이상의 GlcNAc잔기를 갖는 당형태의 양이 5%로부터 38%로 증가한다 (대조 대 GnTIII)는 것이 분명하다.
또한, 도 14는 대조 옥수수의 잎(A) 및 선택된 GnTIII-옥수수 식물의 잎으로부터 단리된 당단백질의 N-글리칸의 MALDI-TOF 질량 스펙트럼의 비교를 나타낸다. 인간 GnTIII 유전자 서열로의 형질전환을 통해 GnTIII 옥수수 식물을 수득하고, c-myc 표지 또는 E-PHA 렉틴을 사용한 웨스턴 블롯팅에 의해 선택을 수행하였다. 구 조 및 약어에 대해서는 표 6 참조.
본 발명은 여기에 기재된 특정한 방법, 프로토콜, 세포주, 벡터 및 시약 등에 한정되지 않는 것으로 이해되며 이들은 다양하게 변할 수도 있다. 또한, 본 명세서에 사용된 용어들은 단지 특정한 실시양태를 설명하기 위해 사용되는 것으로 이해되고, 본 발명의 범위를 제한할 의도는 없다. 본 명세서 및 첨부된 청구범위에서 사용된 바와 같이 단수 형태는 달리 명백히 언급되지 않는 한 복수를 포함한다는 것을 주목해야 한다.
달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야의 당 업자에 의해 일반적으로 이해되는 의미를 갖는다.
본 명세서에 개시된 실시양태들은 본 발명의 여러 측면을 예증하기 위한 것이기 때문에, 여기에 설명되고 청구된 본 발명은 여기에 개시된 특정한 실시양태에 의해 그 범위가 제한되지 않는다. 등가의 실시양태들이 본 발명의 범위 내에 있는 것으로 간주된다. 사실상, 여기에 나타내고 설명한 것 이외에 본 발명의 다양한 변형이 상기 설명으로부터 당업자에게 분명할 것이다. 이러한 변형은 첨부된 청구범위의 범위 내에 속하는 것으로 간주된다.
다양한 참고문헌들이 여기에 인용되어 있으며, 이들의 개시내용은 그 전체내용이 참고문헌으로 포함된다.
<표 1>
대조군 및 선택된 GnTIII-17 식물로부터 단리된 N-글리칸의 전체 풀의 구조, 분자량 및 퍼센트
Figure 112004042339830-pct00001

<표 2>
대조군 담배 및 선택된 GnTIII-17 식물로부터 단리된 내인성 당단백질의 N-글리칸의 질량 스펙트럼(MALDI-TOF) 분석 결과 비교. 표 1 참조.
Figure 112004042339830-pct00002
<표 3>
대조군 및 트랜스제닉 GnTIII 옥수수에서 관찰된 N-글리칸의 개요
대조군의, 비형질전환된 옥수수 및 GnTIII을 발현하는 트랜스제닉 옥수수 칼루스의 내인성 당단백질에서 발견된 N-글리칸 구조(전체의 %)의 비교. MALDI-TOF 분석을 통해 수득된 상응하는 질량 스펙트럼을 이하에 나타내고, 사카라이드는 "명 칭" 세로줄에 나타낸다. 이등분 GlcNAc 잔기를 bGN으로 나타낸다.
Figure 112004042339830-pct00003
<표 4>
대조군 및 트랜스제닉 GnTIII 옥수수-2에서 관찰된 N-글리칸의 개략적 개요
대조군의, 비형질전환된 옥수수 및 GnTIII을 발현하는 트랜스제닉 옥수수 칼루스의 내인성 당단백질에서 발견된 N-글리칸 구조(전체의 %)의 비교. c-myc 표지를 사용하여 트랜스제닉 옥수수를 선택하였다. MALDI-TOF 분석을 통해 수득된 상응하는 질량 스펙트럼을 이하에 나타내고, 사카라이드를 "명칭" 세로줄에 나타낸 다. 이등분 GlcNAc 잔기를 bGN으로 표시한다.
Figure 112004042339830-pct00004

<표 5>
E-PHA 결합에 대한 포지티브 시험 결과
Figure 112004042339830-pct00005

Figure 112004042339830-pct00006

<표 6>
대조군 및 트랜스제닉 GnTIII 옥수수 식물에서 관찰된 N-글리칸의 개략적 개 요
Figure 112004042339830-pct00007

SEQUENCE LISTING <110> PLANT RESEARCH INTERNATIONAL BV BAKKER, Hendrikus A.C. FLORACK, Dionisius E.A. BOSCH, Hendrik J. <120> GNTIII expression in plants <130> 62862A - P033313WO <150> US-60/365,769 <151> 2002-03-19 <150> US-60/368,047 <151> 2002-03-26 <160> 27 <170> PatentIn version 3.2 <210> 1 <211> 1642 <212> DNA <213> Homo sapiens <400> 1 ccatggtgat gagacgctac aagctctttc tcatgttctg tatggccggc ctgtgcctca 60 tctccttcct gcacttcttc aagaccctgt cctatgtcac cttcccccga gaactggcct 120 ccctcagccc taacctggtg tccagctttt tctggaacaa tgccccggtc acgccccagg 180 ccagccccga gccaggaggc cctgacctgc tgcgtacccc actctactcc cactcgcccc 240 tgctgcagcc gctgccgccc agcaaggcgg ccgaggagct ccaccgggtg gacttggtgc 300 tgcccgagga caccaccgag tatttcgtgc gcaccaaggc cggcggcgtc tgcttcaaac 360 ccggcaccaa gatgctggag aggccgcccc cgggacggcc ggaggagaag cctgaggggg 420 ccaacggctc ctcggcccgg cggccacccc ggtacctcct gagcgcccgg gagcgcacgg 480 ggggccgagg cgcccggcgc aagtgggtgg agtgcgtgtg cctgcccggc tggcacggac 540 ccagctgcgg cgtgcccact gtggtgcagt actccaacct gcccaccaag gagcggctgg 600 tgcccaggga ggtgccgcgc cgcgtcatca acgccatcaa cgtcaaccac gagttcgacc 660 tgctggacgt gcgcttccac gagctgggcg acgtggtgga cgcctttgtg gtgtgcgagt 720 ccaacttcac ggcttatggg gagccgcggc cgctcaagtt ccgggagatg ctgaccaatg 780 gcaccttcga gtacatccgc cacaaggtgc tctatgtctt cctggaccac ttcccgcccg 840 gcggccggca ggacggctgg atcgccgacg actacctgcg caccttcctc acccaggacg 900 gcgtctcgcg gctgcgcaac ctgcggcccg acgacgtctt catcattgac gatgcggacg 960 agatcccggc ccgtgacggc gtccttttcc tcaagctcta cgatggctgg accgagccct 1020 tcgccttcca catgcgcaag tcgctctacg gcttcttctg gaagcagccg ggcaccctgg 1080 aggtggtgtc aggctgcacg gtggacatgc tgcaggcagt gtatgggctg gacggcatcc 1140 gcctgcgccg ccgccagtac tacaccatgc ccaacttcag acagtatgag aaccgcaccg 1200 gccacatcct ggtgcagtgg tcgctgggca gccccctgca cttcgccggc tggcactgct 1260 cctggtgctt cacgcccgag ggcatctact tcaagctcgt gtccgcccag aatggcgact 1320 tcccacgctg gggtgactac gaggacaagc gggacctgaa ctacatccgc ggcctgatcc 1380 gcaccggggg ctggttcgac ggcacgcagc aggagtaccc gcctgcagac cccagcgagc 1440 acatgtatgc gcccaagtac ctgctgaaga actacgaccg gttccactac ctgctggaca 1500 acccctacca ggagcccagg agcacggcgg cgggcgggtg gcgccacagg ggtcccgagg 1560 gaaggccgcc cgcccggggc aaactggacg aggcggaagt cgaacaaaaa ctcatctcag 1620 aagaggatct gaattaggat cc 1642 <210> 2 <211> 544 <212> PRT <213> Homo sapiens <400> 2 Met Val Met Arg Arg Tyr Lys Leu Phe Leu Met Phe Cys Met Ala Gly 1 5 10 15 Leu Cys Leu Ile Ser Phe Leu His Phe Phe Lys Thr Leu Ser Tyr Val 20 25 30 Thr Phe Pro Arg Glu Leu Ala Ser Leu Ser Pro Asn Leu Val Ser Ser 35 40 45 Phe Phe Trp Asn Asn Ala Pro Val Thr Pro Gln Ala Ser Pro Glu Pro 50 55 60 Gly Gly Pro Asp Leu Leu Arg Thr Pro Leu Tyr Ser His Ser Pro Leu 65 70 75 80 Leu Gln Pro Leu Pro Pro Ser Lys Ala Ala Glu Glu Leu His Arg Val 85 90 95 Asp Leu Val Leu Pro Glu Asp Thr Thr Glu Tyr Phe Val Arg Thr Lys 100 105 110 Ala Gly Gly Val Cys Phe Lys Pro Gly Thr Lys Met Leu Glu Arg Pro 115 120 125 Pro Pro Gly Arg Pro Glu Glu Lys Pro Glu Gly Ala Asn Gly Ser Ser 130 135 140 Ala Arg Arg Pro Pro Arg Tyr Leu Leu Ser Ala Arg Glu Arg Thr Gly 145 150 155 160 Gly Arg Gly Ala Arg Arg Lys Trp Val Glu Cys Val Cys Leu Pro Gly 165 170 175 Trp His Gly Pro Ser Cys Gly Val Pro Thr Val Val Gln Tyr Ser Asn 180 185 190 Leu Pro Thr Lys Glu Arg Leu Val Pro Arg Glu Val Pro Arg Arg Val 195 200 205 Ile Asn Ala Ile Asn Val Asn His Glu Phe Asp Leu Leu Asp Val Arg 210 215 220 Phe His Glu Leu Gly Asp Val Val Asp Ala Phe Val Val Cys Glu Ser 225 230 235 240 Asn Phe Thr Ala Tyr Gly Glu Pro Arg Pro Leu Lys Phe Arg Glu Met 245 250 255 Leu Thr Asn Gly Thr Phe Glu Tyr Ile Arg His Lys Val Leu Tyr Val 260 265 270 Phe Leu Asp His Phe Pro Pro Gly Gly Arg Gln Asp Gly Trp Ile Ala 275 280 285 Asp Asp Tyr Leu Arg Thr Phe Leu Thr Gln Asp Gly Val Ser Arg Leu 290 295 300 Arg Asn Leu Arg Pro Asp Asp Val Phe Ile Ile Asp Asp Ala Asp Glu 305 310 315 320 Ile Pro Ala Arg Asp Gly Val Leu Phe Leu Lys Leu Tyr Asp Gly Trp 325 330 335 Thr Glu Pro Phe Ala Phe His Met Arg Lys Ser Leu Tyr Gly Phe Phe 340 345 350 Trp Lys Gln Pro Gly Thr Leu Glu Val Val Ser Gly Cys Thr Val Asp 355 360 365 Met Leu Gln Ala Val Tyr Gly Leu Asp Gly Ile Arg Leu Arg Arg Arg 370 375 380 Gln Tyr Tyr Thr Met Pro Asn Phe Arg Gln Tyr Glu Asn Arg Thr Gly 385 390 395 400 His Ile Leu Val Gln Trp Ser Leu Gly Ser Pro Leu His Phe Ala Gly 405 410 415 Trp His Cys Ser Trp Cys Phe Thr Pro Glu Gly Ile Tyr Phe Lys Leu 420 425 430 Val Ser Ala Gln Asn Gly Asp Phe Pro Arg Trp Gly Asp Tyr Glu Asp 435 440 445 Lys Arg Asp Leu Asn Tyr Ile Arg Gly Leu Ile Arg Thr Gly Gly Trp 450 455 460 Phe Asp Gly Thr Gln Gln Glu Tyr Pro Pro Ala Asp Pro Ser Glu His 465 470 475 480 Met Tyr Ala Pro Lys Tyr Leu Leu Lys Asn Tyr Asp Arg Phe His Tyr 485 490 495 Leu Leu Asp Asn Pro Tyr Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly 500 505 510 Trp Arg His Arg Gly Pro Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu 515 520 525 Asp Glu Ala Glu Val Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn 530 535 540 <210> 3 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 atactcgagt taacaatgaa gatgagacgc t 31 <210> 4 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 tatggatcct aattcagatc ctcttctgag atgag 35 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 5 ccatggtgat gagacgctac 20 <210> 6 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 gtttaaacct aggatcctaa ttcagatcct ct 32 <210> 7 <211> 1602 <212> DNA <213> Homo sapiens <400> 7 atgaagatga gacgctacaa gctctttctc atgttctgta tggccggcct gtgcctcatc 60 tccttcctgc acttcttcaa gaccctgtcc tatgtcacct tcccccgaga actggcctcc 120 ctcagcccta acctggtgtc cagctttttc tggaacaatg ccccggtcac gccccaggcc 180 agccccgagc caggaggccc tgacctgctg cgtaccccac tctactccca ctcgcccctg 240 ctgcagccgc tgccgcccag caaggcggcc gaggagctcc accgggtgga cttggtgctg 300 cccgaggaca ccaccgagta tttcgtgcgc accaaggccg gcggcgtctg cttcaaaccc 360 ggcaccaaga tgctggagag gccgcccccg ggacggccgg aggagaagcc tgagggggcc 420 aacggctcct cggcccggcg gccaccccgg tacctcctga gcgcccggga gcgcacgggg 480 ggccgaggcg cccggcgcaa gtgggtggag tgcgtgtgcc tgcccggctg gcacggaccc 540 agctgcggcg tgcccactgt ggtgcagtac tccaacctgc ccaccaagga gcggctggtg 600 cccagggagg tgccgcgccg cgtcatcaac gccatcaacg tcaaccacga gttcgacctg 660 ctggacgtgc gcttccacga gctgggcgac gtggtggacg cctttgtggt gtgcgagtcc 720 aacttcacgg cttatgggga gccgcggccg ctcaagttcc gggagatgct gaccaatggc 780 accttcgagt acatccgcca caaggtgctc tatgtcttcc tggaccactt cccgcccggc 840 ggccggcagg acggctggat cgccgacgac tacctgcgca ccttcctcac ccaggacggc 900 gtctcgcggc tgcgcaacct gcggcccgac gacgtcttca tcattgacga tgcggacgag 960 atcccggccc gtgacggcgt ccttttcctc aagctctacg atggctggac cgagcccttc 1020 gccttccaca tgcgcaagtc gctctacggc ttcttctgga agcagccggg caccctggag 1080 gtggtgtcag gctgcacggt ggacatgctg caggcagtgt atgggctgga cggcatccgc 1140 ctgcgccgcc gccagtacta caccatgccc aacttcagac agtatgagaa ccgcaccggc 1200 cacatcctgg tgcagtggtc gctgggcagc cccctgcact tcgccggctg gcactgctcc 1260 tggtgcttca cgcccgaggg catctacttc aagctcgtgt ccgcccagaa tggcgacttc 1320 ccacgctggg gtgactacga ggacaagcgg gacctgaact acatccgcgg cctgatccgc 1380 accgggggct ggttcgacgg cacgcagcag gagtacccgc ctgcagaccc cagcgagcac 1440 atgtatgcgc ccaagtacct gctgaagaac tacgaccggt tccactacct gctggacaac 1500 ccctaccagg agcccaggag cacggcggcg ggcgggtggc gccacagggg tcccgaggga 1560 aggccgcccg cccggggcaa actggacgag gcggaagtct ag 1602 <210> 8 <211> 7027 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 catgattacg ccaagctagc ggccgcattc ccgggaagct aggccaccgt ggcccgcctg 60 caggggaagc ttgcatgcct gcagatcccc ggggatcctc tagagtcgac ctgcagtgca 120 gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta agttataaaa 180 aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta tctttataca 240 tatatttaaa ctttaatcta cgaataatat aatctatagt actacaataa tatcagtgtt 300 ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga gtattttgac 360 aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt ttttgcaaat 420 agcttcacct atataatact tcatccattt tattagtaca tccatttagg gtttagggtt 480 aatggttttt atagactaat ttttttagta catctatttt attctatttt agcctctaaa 540 ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata taaaatagaa 600 taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa aactaaggaa 660 acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga cgagtctaac 720 ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga cggcacggca 780 tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg acttgctccg 840 ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac ggcaggcggc 900 ctcctcctcc tctcacggca cggcagctac gggggattcc tttcccaccg ctccttcgct 960 ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt tccccaacct 1020 cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac ccgtcggcac 1080 ctccgcttca aggtacgccg ctcgtcctcc cccccccccc ctctctacct tctctagatc 1140 ggcgttccgg tccatgcatg gttagggccc ggtagttcta cttctgttca tgtttgtgtt 1200 agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc gacctgtacg 1260 tcagacacgt tctgattgct aacttgccag tgtttctctt tggggaatcc tgggatggct 1320 ctagccgttc cgcagacggg atcgatttca tgattttttt tgtttcgttg catagggttt 1380 ggtttgccct tttcctttat ttcaatatat gccgtgcact tgtttgtcgg gtcatctttt 1440 catgcttttt tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg ttctagatcg 1500 gagtagaatt ctgtttcaaa ctacctggtg gatttattaa ttttggatct gtatgtgtgt 1560 gccatacata ttcatagtta cgaattgaag atgatggatg gaaatatcga tctaggatag 1620 gtatacatgt tgatgcgggt tttactgatg catatacaga gatgcttttt gttcgcttgg 1680 ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt ctagatcgga gtagaatact 1740 gtttcaaact acctggtgta tttattaatt ttggaactgt atgtgtgtgt catacatctt 1800 catagttacg agtttaagat ggatggaaat atcgatctag gataggtata catgttgatg 1860 tgggttttac tgatgcatat acatgatggc atatgcagca tctattcata tgctctaacc 1920 ttgagtacct atctattata ataaacaagt atgttttata attattttga tcttgatata 1980 cttggatgat ggcatatgca gcagctatat gtggattttt ttagccctgc cttcatacgc 2040 tatttatttg cttggtactg tttcttttgt cgatgctcac cctgttgttt ggtgttactt 2100 ctgcagggta cccccggggt cgaccatggt aaggggcagc caccaccacc accaccacat 2160 ggtccgtcct gtagaaaccc caacccgtga aatcaaaaaa ctcgacggcc tgtgggcatt 2220 cagtctggat cgcgaaaact gtggaattga tcagcgttgg tgggaaagcg cgttacaaga 2280 aagccgggca attgctgtgc caggcagttt taacgatcag ttcgccgatg cagatattcg 2340 taattatgcg ggcaacgtct ggtatcagcg cgaagtcttt ataccgaaag gttgggcagg 2400 ccagcgtatc gtgctgcgtt tcgatgcggt cactcattac ggcaaagtgt gggtcaataa 2460 tcaggaagtg atggagcatc agggcggcta tacgccattt gaagccgatg tcacgccgta 2520 tgttattgcc gggaaaagtg tacgtatcac cgtttgtgtg aacaacgaac tgaactggca 2580 gactatcccg ccgggaatgg tgattaccga cgaaaacggc aagaaaaagc agtcttactt 2640 ccatgatttc tttaactatg ccggaatcca tcgcagcgta atgctctaca ccacgccgaa 2700 cacctgggtg gacgatatca ccgtggtgac gcatgtcgcg caagactgta accacgcgtc 2760 tgttgactgg caggtggtgg ccaatggtga tgtcagcgtt gaactgcgtg atgcggatca 2820 acaggtggtt gcaactggac aaggcactag cgggactttg caagtggtga atccgcacct 2880 ctggcaaccg ggtgaaggtt atctctatga actgtgcgtc acagccaaaa gccagacaga 2940 gtgtgatatc tacccgcttc gcgtcggcat ccggtcagtg gcagtgaagg gcgaacagtt 3000 cctgattaac cacaaaccgt tctactttac tggctttggt cgtcatgaag atgcggactt 3060 acgtggcaaa ggattcgata acgtgctgat ggtgcacgac cacgcattaa tggactggat 3120 tggggccaac tcctaccgta cctcgcatta cccttacgct gaagagatgc tcgactgggc 3180 agatgaacat ggcatcgtgg tgattgatga aactgctgct gtcggcttta acctctcttt 3240 aggcattggt ttcgaagcgg gcaacaagcc gaaagaactg tacagcgaag aggcagtcaa 3300 cggggaaact cagcaagcgc acttacaggc gattaaagag ctgatagcgc gtgacaaaaa 3360 ccacccaagc gtggtgatgt ggagtattgc caacgaaccg gatacccgtc cgcaagtgca 3420 cgggaatatt tcgccactgg cggaagcaac gcgtaaactc gacccgacgc gtccgatcac 3480 ctgcgtcaat gtaatgttct gcgacgctca caccgatacc atcagcgatc tctttgatgt 3540 gctgtgcctg aaccgttatt acggatggta tgtccaaagc ggcgatttgg aaacggcaga 3600 gaaggtactg gaaaaagaac ttctggcctg gcaggagaaa ctgcatcagc cgattatcat 3660 caccgaatac ggcgtggata cgttagccgg gctgcactca atgtacaccg acatgtggag 3720 tgaagagtat cagtgtgcat ggctggatat gtatcaccgc gtctttgatc gcgtcagcgc 3780 cgtcgtcggt gaacaggtat ggaatttcgc cgattttgcg acctcgcaag gcatattgcg 3840 cgttggcggt aacaagaaag ggatcttcac tcgcgaccgc aaaccgaagt cggcggcttt 3900 tctgctgcaa aaacgctgga ctggcatgaa cttcggtgaa aaaccgcagc agggaggcaa 3960 acaatgataa tgagctcgtt taaactgagg gcactgaagt cgcttgatgt gctgaattgt 4020 ttgtgatgtt ggtggcgtat tttgtttaaa taagtaagca tggctgtgat tttatcatat 4080 gatcgatctt tggggtttta tttaacacat tgtaaaatgt gtatctatta ataactcaat 4140 gtataagatg tgttcattct tcggttgcca tagatctgct tatttgacct gtgatgtttt 4200 gactccaaaa accaaaatca caactcaata aactcatgga atatgtccac ctgtttcttg 4260 aagagttcat ctaccattcc agttggcatt tatcagtgtt gcagcggcgc tgtgctttgt 4320 aacataacaa ttgttacggc atatatccaa cggccggcct agctagccac ggtggccaga 4380 tccactagtt ctagagcggc cgcttaattc actggccgtc gttttacaac gtcgtgactg 4440 ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg 4500 gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 4560 cgaatggcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat 4620 atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc 4680 gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca 4740 agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg 4800 cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat 4860 ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt 4920 atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct 4980 tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc 5040 cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa 5100 agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg 5160 taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt 5220 tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg 5280 catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac 5340 ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc 5400 ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa 5460 catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc 5520 aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt 5580 aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga 5640 taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa 5700 atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa 5760 gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa 5820 tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt 5880 ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt 5940 gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg 6000 agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 6060 aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 6120 agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 6180 tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 6240 atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 6300 taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 6360 gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 6420 gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 6480 aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta 6540 tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 6600 gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc 6660 cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa 6720 ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag 6780 cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg 6840 ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga 6900 gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat 6960 gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 7020 ctatgac 7027 <210> 9 <211> 6818 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 cctgcagatc cccggggatc ctctagagtc gacctgcagt gcagcgtgac ccggtcgtgc 60 ccctctctag agataatgag cattgcatgt ctaagttata aaaaattacc acatattttt 120 tttgtcacac ttgtttgaag tgcagtttat ctatctttat acatatattt aaactttaat 180 ctacgaataa tataatctat agtactacaa taatatcagt gttttagaga atcatataaa 240 tgaacagtta gacatggtct aaaggacaat tgagtatttt gacaacagga ctctacagtt 300 ttatcttttt agtgtgcatg tgttctcctt tttttttgca aatagcttca cctatataat 360 acttcatcca ttttattagt acatccattt agggtttagg gttaatggtt tttatagact 420 aattttttta gtacatctat tttattctat tttagcctct aaattaagaa aactaaaact 480 ctattttagt ttttttattt aataatttag atataaaata gaataaaata aagtgactaa 540 aaattaaaca aatacccttt aagaaattaa aaaaactaag gaaacatttt tcttgtttcg 600 agtagataat gccagcctgt taaacgccgt cgacgagtct aacggacacc aaccagcgaa 660 ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg gcatctctgt cgctgcctct 720 ggacccctct cgagagttcc gctccaccgt tggacttgct ccgctgtcgg catccagaaa 780 ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc ggcctcctcc tcctctcacg 840 gcacggcagc tacgggggat tcctttccca ccgctccttc gctttccctt cctcgcccgc 900 cgtaataaat agacaccccc tccacaccct ctttccccaa cctcgtgttg ttcggagcgc 960 acacacacac aaccagatct cccccaaatc cacccgtcgg cacctccgct tcaaggtacg 1020 ccgctcgtcc tccccccccc cccctctcta ccttctctag atcggcgttc cggtccatgc 1080 atggttaggg cccggtagtt ctacttctgt tcatgtttgt gttagatccg tgtttgtgtt 1140 agatccgtgc tgctagcgtt cgtacacgga tgcgacctgt acgtcagaca cgttctgatt 1200 gctaacttgc cagtgtttct ctttggggaa tcctgggatg gctctagccg ttccgcagac 1260 gggatcgatt tcatgatttt ttttgtttcg ttgcataggg tttggtttgc ccttttcctt 1320 tatttcaata tatgccgtgc acttgtttgt cgggtcatct tttcatgctt ttttttgtct 1380 tggttgtgat gatgtggtct ggttgggcgg tcgttctaga tcggagtaga attctgtttc 1440 aaactacctg gtggatttat taattttgga tctgtatgtg tgtgccatac atattcatag 1500 ttacgaattg aagatgatgg atggaaatat cgatctagga taggtataca tgttgatgcg 1560 ggttttactg atgcatatac agagatgctt tttgttcgct tggttgtgat gatgtggtgt 1620 ggttgggcgg tcgttcattc gttctagatc ggagtagaat actgtttcaa actacctggt 1680 gtatttatta attttggaac tgtatgtgtg tgtcatacat cttcatagtt acgagtttaa 1740 gatggatgga aatatcgatc taggataggt atacatgttg atgtgggttt tactgatgca 1800 tatacatgat ggcatatgca gcatctattc atatgctcta accttgagta cctatctatt 1860 ataataaaca agtatgtttt ataattattt tgatcttgat atacttggat gatggcatat 1920 gcagcagcta tatgtggatt tttttagccc tgccttcata cgctatttat ttgcttggta 1980 ctgtttcttt tgtcgatgct caccctgttg tttggtgtta cttctgcagg gtacccccgg 2040 ggtcgaccat ggtgatgaga cgctacaagc tctttctcat gttctgtatg gccggcctgt 2100 gcctcatctc cttcctgcac ttcttcaaga ccctgtccta tgtcaccttc ccccgagaac 2160 tggcctccct cagccctaac ctggtgtcca gctttttctg gaacaatgcc ccggtcacgc 2220 cccaggccag ccccgagcca ggaggccctg acctgctgcg taccccactc tactcccact 2280 cgcccctgct gcagccgctg ccgcccagca aggcggccga ggagctccac cgggtggact 2340 tggtgctgcc cgaggacacc accgagtatt tcgtgcgcac caaggccggc ggcgtctgct 2400 tcaaacccgg caccaagatg ctggagaggc cccccccggg acggccggag gagaagcctg 2460 agggggccaa cggctcctcg gcccggcggc caccccggta cctcctgagc gcccgggagc 2520 gcacgggggg ccgaggcgcc cggcgcaagt gggtggagtg cgtgtgcctg cccggctggc 2580 acggacccag ctgcggcgtg cccactgtgg tgcagtactc caacctgccc accaaggagc 2640 ggctggtgcc cagggaggtg ccgcgccgcg tcatcaacgc catcaacgtc aaccacgagt 2700 tcgacctgct ggacgtgcgc ttccacgagc tgggcgacgt ggtggacgcc tttgtggtgt 2760 gcgagtccaa cttcacggct tatggggagc cgcggccgct caagttccgg gagatgctga 2820 ccaatggcac cttcgagtac atccgccaca aggtgctcta tgtcttcctg gaccacttcc 2880 cgcccggcgg ccggcaggac ggctggatcg ccgacgacta cctgcgcacc ttcctcaccc 2940 aggacggcgt ctcgcggctg cgcaacctgc ggcccgacga cgtcttcatc attgacgatg 3000 cggacgagat cccggcccgt gacggcgtcc ttttcctcaa gctctacgat ggctggaccg 3060 agcccttcgc cttccacatg cgcaagtcgc tctacggctt cttctggaag cagccgggca 3120 ccctggaggt ggtgtcaggc tgcacggtgg acatgctgca ggcagtgtat gggctggacg 3180 gcatccgcct gcgccgccgc cagtactaca ccatgcccaa cttcagacag tatgagaacc 3240 gcaccggcca catcctggtg cagtggtcgc tgggcagccc cctgcacttc gccggctggc 3300 actgctcctg gtgcttcacg cccgagggca tctacttcaa gctcgtgtcc gcccagaatg 3360 gcgacttccc acgctggggt gactacgagg acaagcggga cctgaactac atccgcggcc 3420 tgatccgcac cgggggctgg ttcgacggca cgcagcagga gtacccgcct gcagacccca 3480 gcgagcacat gtatgcgccc aagtacctgc tgaagaacta cgaccggttc cactacctgc 3540 tggacaaccc ctaccaggag cccaggagca cggcggcggg cgggtggcgc cacaggggtc 3600 ccgagggaag gccgcccgcc cggggcaaac tggacgaggc ggaagtcgaa caaaaactca 3660 tctcagaaga ggatctgaat taggatccta ggtttaaact gagggcactg aagtcgcttg 3720 atgtgctgaa ttgtttgtga tgttggtggc gtattttgtt taaataagta agcatggctg 3780 tgattttatc atatgatcga tctttggggt tttatttaac acattgtaaa atgtgtatct 3840 attaataact caatgtataa gatgtgttca ttcttcggtt gccatagatc tgcttatttg 3900 acctgtgatg ttttgactcc aaaaaccaaa atcacaactc aataaactca tggaatatgt 3960 ccacctgttt cttgaagagt tcatctacca ttccagttgg catttatcag tgttgcagcg 4020 gcgctgtgct ttgtaacata acaattgttc acggcatata tccacggccg gcctagctag 4080 ccacggtggc cagatccact agttctagag cggccgctta attcactggc cgtcgtttta 4140 caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc 4200 cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg 4260 cgcagcctga atggcgaatg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 4320 atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 4380 cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 4440 tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 4500 tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat 4560 gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga 4620 acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 4680 ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 4740 gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 4800 ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 4860 gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 4920 agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 4980 caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 5040 gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 5100 agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 5160 gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 5220 aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 5280 ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 5340 tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 5400 tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 5460 gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 5520 atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 5580 ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 5640 aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 5700 ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 5760 ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 5820 tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 5880 cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 5940 gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 6000 gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 6060 tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 6120 ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg 6180 gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 6240 ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 6300 tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 6360 ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct 6420 gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga 6480 acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat acgcaaaccg 6540 cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt tcccgactgg 6600 aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta ggcaccccag 6660 gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt 6720 cacacaggaa acagctatga ccatgattac gccaagctag cggccgcatt cccgggaagc 6780 taggccaccg tggcccgcct gcaggggaag cttgcatg 6818 <210> 10 <211> 7545 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 cgattaaaaa tctcaattat atttggtcta atttagtttg gtattgagta aaacaaattc 60 gaaccaaacc aaaatataaa tatatagttt ttatatatat gcctttaaga ctttttatag 120 aattttcttt aaaaaatatc tagaaatatt tgcgactctt ctggcatgta atatttcgtt 180 aaatatgaag tgctccattt ttattaactt taaataattg gttgtacgat cactttctta 240 tcaagtgtta ctaaaatgcg tcaatctctt tgttcttcca tattcatatg tcaaaaccta 300 tcaaaattct tatatatctt tttcgaattt gaagtgaaat ttcgataatt taaaattaaa 360 tagaacatat cattatttag gtatcatatt gatttttata cttaattact aaatttggtt 420 aactttgaaa gtgtacatca acgaaaaatt agtcaaacga ctaaaataaa taaatatcat 480 gtgttattaa gaaaattctc ctataagaat attttaatag atcatatgtt tgtaaaaaaa 540 attaattttt actaacacat atatttactt atcaaaaatt tgacaaagta agattaaaat 600 aatattcatc taacaaaaaa aaaaccagaa aatgctgaaa acccggcaaa accgaaccaa 660 tccaaaccga tatagttggt ttggtttgat tttgatataa accgaaccaa ctcggtccat 720 ttgcacccct aatcataata gctttaatat ttcaagatat tattaagtta acgttgtcaa 780 tatcctggaa attttgcaaa atgaatcaag cctatatggc tgtaatatga atttaaaagc 840 agctcgatgt ggtggtaata tgtaatttac ttgattctaa aaaaatatcc caagtattaa 900 taatttctgc taggaagaag gttagctacg atttacagca aagccagaat acaatgaacc 960 ataaagtgat tgaagctcga aatatacgaa ggaacaaata tttttaaaaa aatacgcaat 1020 gacttggaac aaaagaaagt gatatatttt ttgttcttaa acaagcatcc cctctaaaga 1080 atggcagttt tcctttgcat gtaactatta tgctcccttc gttacaaaaa ttttggacta 1140 ctattgggaa cttcttctga aaatagtggc caccgcttaa ttaaggcgcg ccatgcccgg 1200 gcaagcggcc gcttaattaa atttaaatgt ttaaactagg aaatccaagc ttgggctgca 1260 ggtcaatccc attgcttttg aagcagctca acattgatct ctttctcgag gtcattcata 1320 tgcttgagaa gagagtcggg atagtccaaa ataaaacaaa ggtaagatta cctggtcaaa 1380 agtgaaaaca tcagttaaaa ggtggtataa agtaaaatat cggtaataaa aggtggccca 1440 aagtgaaatt tactcttttc tactattata aaaattgagg atgtttttgt cggtactttg 1500 atacgtcatt tttgtatgaa ttggttttta agtttattcg cttttggaaa tgcatatctg 1560 tatttgagtc gggttttaag ttcgtttgct tttgtaaata cagagggatt tgtataagaa 1620 atatctttaa aaaaacccat atgctaattt gacataattt ttgagaaaaa tatatattca 1680 ggcgaattct cacaatgaac aataataaga ttaaaatagc tttcccccgt tgcagcgcat 1740 gggtattttt tctagtaaaa ataaaagata aacttagact caaaacattt acaaaaacaa 1800 cccctaaagt tcctaaagcc caaagtgcta tccacgatcc atagcaagcc cagcccaacc 1860 caacccaacc caacccaccc cagtccagcc aactggacaa tagtctccac acccccccac 1920 tatcaccgtg agttgtccgc acgcaccgca cgtctcgcag ccaaaaaaaa aaaaagaaag 1980 aaaaaaaaga aaaagaaaaa acagcaggtg ggtccgggtc gtgggggccg gaaacgcgag 2040 gaggatcgcg agccagcgac gaggccggcc ctccctccgc ttccaaagaa acgcccccca 2100 tcgccactat atacataccc ccccctctcc tcccatcccc ccaaccctac caccaccacc 2160 accaccacct ccacctcctc ccccctcgct gccggacgac gcctcccccc tccccctccg 2220 ccgccgccgc gccggtaacc accccgcccc tctcctcttt ctttctccgt tttttttttc 2280 cgtctcggtc tcgatctttg gccttggtag tttgggtggg cgagaggcgg cttcgtgcgc 2340 gcccagatcg gtgcgcggga ggggcgggat ctcgcggctg gggctctcgc cggcgtggat 2400 ccggcccgga tctcgcgggg aatggggctc tcggatgtag atctgcgatc cgccgttgtt 2460 gggggagatg atggggggtt taaaatttcc gccatgctaa acaagatcag gaagagggga 2520 aaagggcact atggtttata tttttatata tttctgctgc ttcgtcaggc ttagatgtgc 2580 tagatctttc tttcttcttt ttgtgggtag aatttgaatc cctcagcatt gttcatcggt 2640 agtttttctt ttcatgattt gtgacaaatg cagcctcgtg cggagctttt ttgtaggtag 2700 accatggctt ctccggagag gagaccagtt gagattaggc cagctacagc agctgatatg 2760 gccgcggttt gtgatatcgt taaccattac attgagacgt ctacagtgaa ctttaggaca 2820 gagccacaaa caccacaaga gtggattgat gatctagaga ggttgcaaga tagataccct 2880 tggttggttg ctgaggttga gggtgttgtg gctggtattg cttacgctgg gccctggaag 2940 gctaggaacg cttacgattg gacagttgag agtactgttt acgtgtcaca taggcatcaa 3000 aggttgggcc taggatccac attgtacaca catttgctta agtctatgga ggcgcaaggt 3060 tttaagtctg tggttgctgt tataggcctt ccaaacgatc catctgttag gttgcatgag 3120 gctttgggat acacagcccg gggtacattg cgcgcagctg gatacaagca tggtggatgg 3180 catgatgttg gtttttggca aagggatttt gagttgccag ctcctccaag gccagttagg 3240 ccagttaccc agatctgagg taccctgagc tcggtcgcag cgtgtgcgtg tccgtcgtac 3300 gttctggccg gccgggcctt gggcgcgcga tcagaagcgt tgcgttggcg tgtgtgtgct 3360 tctggtttgc tttaatttta ccaagtttgt ttcaaggtgg atcgcgtggt caaggcccgt 3420 gtgctttaaa gacccaccgg cactggcagt gagtgttgct gcttgtgtag gctttggtac 3480 gtatgggctt tatttgcttc tggatgttgt gtactacttg ggtttgttga attattatga 3540 gcagttgcgt attgtaattc agctgggcta cctggacatt gttatgtatt aataaatgct 3600 ttgctttctt ctaaagatct ttaagtgctg aattcatatt tcctcctgca gggtttaaac 3660 ttgccgtggc ctattttcag aagaagttcc caatagtagt ccaaaatttt tgtaacgaag 3720 ggagcataat agttacatgc aaaggaaaac tgccattctt tagaggggat gcttgtttaa 3780 gaacaaaaaa tatatcactt tcttttgttc caagtcattg cgtatttttt taaaaatatt 3840 tgttccttcg tatatttcga gcttcaatca ctttatggtt ctttgtattc tggctttgct 3900 gtaaatcgta gctaaccttc ttcctagcag aaattattaa tacttgggat atttttttag 3960 aatcaagtaa attacatatt accaccacat cgagctgctt ttaaattcat attacagcca 4020 tataggcttg attcattttg caaaatttcc aggatattga caacgttaac ttaataatat 4080 cttgaaatat taaagctatt atgattaggg gtgcaaatgg accgagttgg ttcggtttat 4140 atcaaaatca aaccaaacca actatatcgg tttggattgg ttcggttttg ccgggttttc 4200 agcattttct ggtttttttt ttgttagatg aatattattt taatcttact ttgtcaaatt 4260 tttgataagt aaatatatgt gttagtaaaa attaattttt tttacaaaca tatgatctat 4320 taaaatattc ttataggaga attttcttaa taacacatga tatttattta ttttagtcgt 4380 ttgactaatt tttcgttgat gtacactttc aaagttaacc aaatttagta attaagtata 4440 aaaatcaata tgatacctaa ataatgatat gttctattta attttaaatt atcgaaattt 4500 cacttcaaat tcgaaaaaga tatataagaa ttttgataga ttttgacata tgaatatgga 4560 agaacaaaga gattgacgca ttttagtaac acttgataag aaagtgatcg tacaaccaat 4620 tatttaaagt taataaaaat ggagcacttc atatttaacg aaatattaca tgccagaaga 4680 gtcgcaaata tttctagata ttttttaaag aaaattctat aaaaagtctt aaaggcatat 4740 atataaaaac tatatattta tattttggtt tggttcgaat ttgttttact caataccaaa 4800 ctaaattaga ccaaatataa ttgggatttt taatcgcggc ccactagtca ccggtgtagc 4860 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 4920 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 4980 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 5040 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 5100 gctgcgcacg ctgcgcacgc tgcgcacgct tcctcgctca ctgactcgct gcgctcggtc 5160 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 5220 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 5280 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 5340 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 5400 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 5460 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 5520 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 5580 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 5640 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 5700 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 5760 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 5820 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 5880 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 5940 aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 6000 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 6060 agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 6120 atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 6180 cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 6240 aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 6300 cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 6360 aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 6420 ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 6480 gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 6540 ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 6600 tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 6660 tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 6720 ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 6780 tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 6840 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 6900 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 6960 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 7020 gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg 7080 acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat 7140 gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg 7200 gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc 7260 tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat gcggtgtgaa 7320 ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc attcaggctg 7380 cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 7440 gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt 7500 tgtaaaacga cggccagtga attacaccgg tgtgatcatg ggccg 7545 <210> 11 <211> 11643 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 11 cgattaaaaa cccaattata tttggtctaa tttagtttgg tattgagtaa aacaaattcg 60 aaccaaacca aaatataaat atatagtttt tatatatatg cctttaagac tttttataga 120 attttcttta aaaaatatct agaaatattt gcgactcttc tggcatgtaa tatttcgtta 180 aatatgaagt gctccatttt tattaacttt aaataattgg ttgtacgatc actttcttat 240 caagtgttac taaaatgcgt caatctcttt gttcttccat attcatatgt caaaatctat 300 caaaattctt atatatcttt ttcgaatttg aagtgaaatt tcgataattt aaaattaaat 360 agaacatatc attatttagg tatcatattg atttttatac ttaattacta aatttggtta 420 actttgaaag tgtacatcaa cgaaaaatta gtcaaacgac taaaataaat aaatatcatg 480 tgttattaag aaaattctcc tataagaata ttttaataga tcatatgttt gtaaaaaaaa 540 ttaattttta ctaacacata tatttactta tcaaaaattt gacaaagtaa gattaaaata 600 atattcatct aacaaaaaaa aaaccagaaa atgctgaaaa cccggcaaaa ccgaaccaat 660 ccaaaccgat atagttggtt tggtttgatt ttgatataaa ccgaaccaac tcggtccatt 720 tgcaccccta atcataatag ctttaatatt tcaagatatt attaagttaa cgttgtcaat 780 atcctggaaa ttttgcaaaa tgaatcaagc ctatatggct gtaatatgaa tttaaaagca 840 gctcgatgtg gtggtaatat gtaatttact tgattctaaa aaaatatccc aagtattaat 900 aatttctgct aggaagaagg ttagctacga tttacagcaa agccagaata caaagaacca 960 taaagtgatt gaagctcgaa atatacgaag gaacaaatat ttttaaaaaa atacgcaatg 1020 acttggaaca aaagaaagtg atatattttt tgttcttaaa caagcatccc ctctaaagaa 1080 tggcagtttt cctttgcatg taactattat gctcccttcg ttacaaaaat tttggactac 1140 tattgggaat tcttctgaaa atagtggcca ccgcttaatt aaggcgcgcc atgccccctg 1200 cagatccccg gggatcctct agagtcgacc tgcagtgcag cgtgacccgg tcgtgcccct 1260 ctctagagat aatgagcatt gcatgtctaa gttataaaaa attaccacat attttttttg 1320 tcacacttgt ttgaagtgca gtttatctat ctttatacat atatttaaac tttaatctac 1380 gaataatata atctatagta ctacaataat atcagtgttt tagagaatca tataaatgaa 1440 cagttagaca tggtctaaag gacaattgag tattttgaca acaggactct acagttttat 1500 ctttttagtg tgcatgtgtt ctcctttttt tttgcaaata gcttcaccta tataatactt 1560 catccatttt attagtacat ccatttaggg tttagggtta atggttttta tagactaatt 1620 tttttagtac atctatttta ttctatttta gcctctaaat taagaaaact aaaactctat 1680 tttagttttt ttatttaata atttagatat aaaatagaat aaaataaagt gactaaaaat 1740 taaacaaata ccctttaaga aattaaaaaa actaaggaaa catttttctt gtttcgagta 1800 gataatgcca gcctgttaaa cgccgtcgac gagtctaacg gacaccaacc agcgaaccag 1860 cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac 1920 ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc 1980 gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac 2040 ggcagctacg ggggattcct ttcccaccgc tccttcgctt tcccttcctc gcccgccgta 2100 ataaatagac accccctcca caccctcttt ccccaacctc gtgttgttcg gagcgcacac 2160 acacacaacc agatctcccc caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc 2220 tcgtcctccc cccccccccc tctctacctt ctctagatcg gcgttccggt ccatgcatgg 2280 ttagggcccg gtagttctac ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat 2340 ccgtgctgct agcgttcgta cacggatgcg acctgtacgt cagacacgtt ctgattgcta 2400 acttgccagt gtttctcttt ggggaatcct gggatggctc tagccgttcc gcagacggga 2460 tcgatttcat gatttttttt gtttcgttgc atagggtttg gtttgccctt ttcctttatt 2520 tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc atgctttttt ttgtcttggt 2580 tgtgatgatg tggtctggtt gggcggtcgt tctagatcgg agtagaattc tgtttcaaac 2640 tacctggtgg atttattaat tttggatctg tatgtgtgtg ccatacatat tcatagttac 2700 gaattgaaga tgatggatgg aaatatcgat ctaggatagg tatacatgtt gatgcgggtt 2760 ttactgatgc atatacagag atgctttttg ttcgcttggt tgtgatgatg tggtgtggtt 2820 gggcggtcgt tcattcgttc tagatcggag tagaatactg tttcaaacta cctggtgtat 2880 ttattaattt tggaactgta tgtgtgtgtc atacatcttc atagttacga gtttaagatg 2940 gatggaaata tcgatctagg ataggtatac atgttgatgt gggttttact gatgcatata 3000 catgatggca tatgcagcat ctattcatat gctctaacct tgagtaccta tctattataa 3060 taaacaagta tgttttataa ttattttgat cttgatatac ttggatgatg gcatatgcag 3120 cagctatatg tggatttttt tagccctgcc ttcatacgct atttatttgc ttggtactgt 3180 ttcttttgtc gatgctcacc ctgttgtttg gtgttacttc tgcagggtac ccccggggtc 3240 gaccatggtg atgagacgct acaagctctt tctcatgttc tgtatggccg gcctgtgcct 3300 catctccttc ctgcacttct tcaagaccct gtcctatgtc accttccccc gagaactggc 3360 ctccctcagc cctaacctgg tgtccagctt tttctggaac aatgccccgg tcacgcccca 3420 ggccagcccc gagccaggag gccctgacct gctgcgtacc ccactctact cccactcgcc 3480 cctgctgcag ccgctgccgc ccagcaaggc ggccgaggag ctccaccggg tggacttggt 3540 gctgcccgag gacaccaccg agtatttcgt gcgcaccaag gccggcggcg tctgcttcaa 3600 acccggcacc aagatgctgg agaggccccc cccgggacgg ccggaggaga agcctgaggg 3660 ggccaacggc tcctcggccc ggcggccacc ccggtacctc ctgagcgccc gggagcgcac 3720 ggggggccga ggcgcccggc gcaagtgggt ggagtgcgtg tgcctgcccg gctggcacgg 3780 acccagctgc ggcgtgccca ctgtggtgca gtactccaac ctgcccacca aggagcggct 3840 ggtgcccagg gaggtgccgc gccgcgtcat caacgccatc aacgtcaacc acgagttcga 3900 cctgctggac gtgcgcttcc acgagctggg cgacgtggtg gacgcctttg tggtgtgcga 3960 gtccaacttc acggcttatg gggagccgcg gccgctcaag ttccgggaga tgctgaccaa 4020 tggcaccttc gagtacatcc gccacaaggt gctctatgtc ttcctggacc acttcccgcc 4080 cggcggccgg caggacggct ggatcgccga cgactacctg cgcaccttcc tcacccagga 4140 cggcgtctcg cggctgcgca acctgcggcc cgacgacgtc ttcatcattg acgatgcgga 4200 cgagatcccg gcccgtgacg gcgtcctttt cctcaagctc tacgatggct ggaccgagcc 4260 cttcgccttc cacatgcgca agtcgctcta cggcttcttc tggaagcagc cgggcaccct 4320 ggaggtggtg tcaggctgca cggtggacat gctgcaggca gtgtatgggc tggacggcat 4380 ccgcctgcgc cgccgccagt actacaccat gcccaacttc agacagtatg agaaccgcac 4440 cggccacatc ctggtgcagt ggtcgctggg cagccccctg cacttcgccg gctggcactg 4500 ctcctggtgc ttcacgcccg agggcatcta cttcaagctc gtgtccgccc agaatggcga 4560 cttcccacgc tggggtgact acgaggacaa gcgggacctg aactacatcc gcggcctgat 4620 ccgcaccggg ggctggttcg acggcacgca gcaggagtac ccgcctgcag accccagcga 4680 gcacatgtat gcgcccaagt acctgctgaa gaactacgac cggttccact acctgctgga 4740 caacccctac caggagccca ggagcacggc ggcgggcggg tggcgccaca ggggtcccga 4800 gggaaggccg cccgcccggg gcaaactgga cgaggcggaa gtcgaacaaa aactcatctc 4860 agaagaggat ctgaattagg atcctaggtt taaactgagg gcactgaagt cgcttgatgt 4920 gctgaattgt ttgtgatgtt ggtggcgtat tttgtttaaa taagtaagca tggctgtgat 4980 tttatcatat gatcgatctt tggggtttta tttaacacat tgtaaaatgt gtatctatta 5040 ataactcaat gtataagatg tgttcattct tcggttgcca tagatctgct tatttgacct 5100 gtgatgtttt gactccaaaa accaaaatca caactcaata aactcatgga atatgtccac 5160 ctgtttcttg aagagttcat ctaccattcc agttggcatt tatcagtgtt gcagcggcgc 5220 tgtgctttgt aacataacaa ttgttcacgg catatatcca cggccggcct agctagccac 5280 ggtggccaga tccactaggg gcaagcggcc gcttaattaa atttaaatgt ttaaactagg 5340 aaatccaagc ttgggctgca ggtcaatccc attgcttttg aagcagctca acattgatct 5400 ctttctcgag gtcattcata tgcttgagaa gagagtcggg atagtccaaa ataaaacaaa 5460 ggtaagatta cctggtcaaa agtgaaaaca tcagttaaaa ggtggtataa agtaaaatat 5520 cggtaataaa aggtggccca aagtgaaatt tactcttttc tactattata aaaattgagg 5580 atgtttttgt cggtactttg atacgtcatt tttgtatgaa ttggttttta agtttattcg 5640 cttttggaaa tgcatatctg tatttgagtc gggttttaag ttcgtttgct tttgtaaata 5700 cagagggatt tgtataagaa atatctttaa aaaaacccat atgctaattt gacataattt 5760 ttgagaaaaa tatatattca ggcgaattct cacaatgaac aataataaga ttaaaatagc 5820 tttcccccgt tgcagcgcat gggtattttt tctagtaaaa ataaaagata aacttagact 5880 caaaacattt acaaaaacaa cccctaaagt tcctaaagcc caaagtgcta tccacgatcc 5940 atagcaagcc cagcccaacc caacccaacc caacccaccc cagtccagcc aactggacaa 6000 tagtctccac acccccccac tatcaccgtg agttgtccgc acgcaccgca cgtctcgcag 6060 ccaaaaaaaa aaaaagaaag aaaaaaaaga aaaagaaaaa acagcaggtg ggtccgggtc 6120 gtgggggccg gaaacgcgag gaggatcgcg agccagcgac gaggccggcc ctccctccgc 6180 ttccaaagaa acgcccccca tcgccactat atacataccc ccccctctcc tcccatcccc 6240 ccaaccctac caccaccacc accaccacct ccacctcctc ccccctcgct gccggacgac 6300 gcctcccccc tccccctccg ccgccgccgc gccggtaacc accccgcccc tctcctcttt 6360 ctttctccgt tttttttttc cgtctcggtc tcgatctttg gccttggtag tttgggtggg 6420 cgagaggcgg cttcgtgcgc gcccagatcg gtgcgcggga ggggcgggat ctcgcggctg 6480 gggctctcgc cggcgtggat ccggcccgga tctcgcgggg aatggggctc tcggatgtag 6540 atctgcgatc cgccgttgtt gggggagatg atggggggtt taaaatttcc gccatgctaa 6600 acaagatcag gaagagggga aaagggcact atggtttata tttttatata tttctgctgc 6660 ttcgtcaggc ttagatgtgc tagatctttc tttcttcttt ttgtgggtag aatttgaatc 6720 cctcagcatt gttcatcggt agtttttctt ttcatgattt gtgacaaatg cagcctcgtg 6780 cggagctttt ttgtaggtag accatggctt ctccggagag gagaccagtt gagattaggc 6840 cagctacagc agctgatatg gccgcggttt gtgatatcgt taaccattac attgagacgt 6900 ctacagtgaa ctttaggaca gagccacaaa caccacaaga gtggattgat gatctagaga 6960 ggttgcaaga tagataccct tggttggttg ctgaggttga gggtgttgtg gctggtattg 7020 cttacgctgg gccctggaag gctaggaacg cttacgattg gacagttgag agtactgttt 7080 acgtgtcaca taggcatcaa aggttgggcc taggatccac attgtacaca catttgctta 7140 agtctatgga ggcgcaaggt tttaagtctg tggttgctgt tataggcctt ccaaacgatc 7200 catctgttag gttgcatgag gctttgggat acacagcccg gggtacattg cgcgcagctg 7260 gatacaagca tggtggatgg catgatgttg gtttttggca aagggatttt gagttgccag 7320 ctcctccaag gccagttagg ccagttaccc agatctgagg taccctgagc tcggtcgcag 7380 cgtgtgcgtg tccgtcgtac gttctggccg gccgggcctt gggcgcgcga tcagaagcgt 7440 tgcgttggcg tgtgtgtgct tctggtttgc tttaatttta ccaagtttgt ttcaaggtgg 7500 atcgcgtggt caaggcccgt gtgctttaaa gacccaccgg cactggcagt gagtgttgct 7560 gcttgtgtag gctttggtac gtatgggctt tatttgcttc tggatgttgt gtactacttg 7620 ggtttgttga attattatga gcagttgcgt attgtaattc agctgggcta cctggacatt 7680 gttatgtatt aataaatgct ttgctttctt ctaaagatct ttaagtgctg aattcatatt 7740 tcctcctgca gggtttaaac ttgccgtggc ctattttcag aagaattccc aatagtagtc 7800 caaaattttt gtaacgaagg gagcataata gttacatgca aaggaaaact gccattcttt 7860 agaggggatg cttgtttaag aacaaaaaat atatcacttt cttttgttcc aagtcattgc 7920 gtattttttt aaaaatattt gttccttcgt atatttcgag cttcaatcac tttatggttc 7980 tttgtattct ggctttgctg taaatcgtag ctaaccttct tcctagcaga aattattaat 8040 acttgggata tttttttaga atcaagtaaa ttacatatta ccaccacatc gagctgcttt 8100 taaattcata ttacagccat ataggcttga ttcattttgc aaaatttcca ggatattgac 8160 aacgttaact taataatatc ttgaaatatt aaagctatta tgattagggg tgcaaatgga 8220 ccgagttggt tcggtttata tcaaaatcaa accaaaccaa ctatatcggt ttggattggt 8280 tcggttttgc cgggttttca gcattttctg gttttttttt tgttagatga atattatttt 8340 aatcttactt tgtcaaattt ttgataagta aatatatgtg ttagtaaaaa ttaatttttt 8400 ttacaaacat atgatctatt aaaatattct tataggagaa ttttcttaat aacacatgat 8460 atttatttat tttagtcgtt tgactaattt ttcgttgatg tacactttca aagttaacca 8520 aatttagtaa ttaagtataa aaatcaatat gatacctaaa taatgatatg ttctatttaa 8580 ttttaaatta tcgaaatttc acttcaaatt cgaaaaagat atataagaat tttgatagat 8640 tttgacatat gaatatggaa gaacaaagag attgacgcat tttagtaaca cttgataaga 8700 aagtgatcgt acaaccaatt atttaaagtt aataaaaatg gagcacttca tatttaacga 8760 aatattacat gccagaagag tcgcaaatat ttctagatat tttttaaaga aaattctata 8820 aaaagtctta aaggcatata tataaaaact atatatttat attttggttt ggttcgaatt 8880 tgttttactc aataccaaac taaattagac caaatataat tgggttttta atcgcggccc 8940 actagtcacc ggtgtagctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 9000 tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 9060 gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 9120 ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg 9180 cgtattgggc gctcttccgc tgcgcacgct gcgcacgctg cgcacgcttc ctcgctcact 9240 gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 9300 atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 9360 caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 9420 cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 9480 taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 9540 ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 9600 tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 9660 gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 9720 ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 9780 aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 9840 aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 9900 agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 9960 cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 10020 gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 10080 atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 10140 gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 10200 tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 10260 gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 10320 ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 10380 actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 10440 ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 10500 tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 10560 cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 10620 ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 10680 ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 10740 tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 10800 agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 10860 atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 10920 gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 10980 aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 11040 tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 11100 aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 11160 gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 11220 ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 11280 acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 11340 gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 11400 caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 11460 cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 11520 ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 11580 ttttcccagt cacgacgttg taaaacgacg gccagtgaat tacaccggtg tgatcatggg 11640 ccg 11643 <210> 12 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 catgattacg ccaagctagc ggccgcattc ccgggaagct aggccaccgt ggcccgcctg 60 caggggaagc ttgcatgcct gcagatcccc ggggatcctc tagagtcgac ctgca 115 <210> 13 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 gggtaccccc ggggtcgac 19 <210> 14 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 taatgagctc gtttaaa 17 <210> 15 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 cggccggcct agctagccac ggtggccaga tccactagtt ctagagcggc cgctt 55 <210> 16 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 cctgcagatc cccggggatc ctctagagtc gacctgca 38 <210> 17 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 gggtaccccc ggggtcgac 19 <210> 18 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 tggccaccgc ttaattaagg cgcgccatgc ccgggcaagc ggccgcttaa ttaaatttaa 60 atgtttaaac taggaaatcc aagcttgggc tgcaggtcaa tcccattgct tttgaagcag 120 ctcaacattg atctcttt 138 <210> 19 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 ggtaccctga gctc 14 <210> 20 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 gaattcatat ttcctcctgc agggtttaaa cttgccgtgg c 41 <210> 21 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 cggcccacta gtcaccggtg t 21 <210> 22 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 gcgcacgctg cgcacgctgc gcacgct 27 <210> 23 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 acaccggtgt gatcatgggc cg 22 <210> 24 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 tggccaccgc ttaattaagg cgcgccatgc cccctgcaga tccccgggga tcctctagag 60 tcgacctgc 69 <210> 25 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 cggccggcct agctagccac ggtggccaga tccactaggg gcaagcggcc gcttaattaa 60 atttaaatgt ttaaactagg aaatccaagc ttgggctgca ggtcaatccc attgcttttg 120 aagcagctca acattgatct cttt 144 <210> 26 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 ggtaccctga gctc 14 <210> 27 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 gaattcatat ttcctcctgc agggtttaaa cttgccgtgg c 41

Claims (56)

  1. 포유동물 UDP-N-아세틸글루코사민: β-D 만노시드 β(1,4)-N-아세틸글루코사미닐트랜스퍼라제(GnTIII) 효소 및 이종 당단백질을 포함하고, 상기 이종 당단백질 또는 그의 기능적 단편이 이등분된(bisecting) 올리고사카라이드를 포함하는 것인, 식물 숙주 체계.
  2. 제1항에 있어서, 상기 GnTIII이 인간 GnTIII인 식물 숙주 체계.
  3. 제1항에 있어서, 상기 체계가 식물의 일부인 식물 숙주 체계.
  4. 제3항에 있어서, 상기 식물의 일부가 세포, 잎, 배아, 칼루스(callus), 줄기, 과피, 원형질체, 뿌리, 괴경, 인(kernel), 내배유 및 배아로 구성된 군에서 선택되는 식물의 일부인 식물 숙주 체계.
  5. 제1항에 있어서, 상기 체계가 전체 식물인 식물 숙주 체계.
  6. 제1항에 있어서, 상기 이종 당단백질이 항체 또는 그의 단편을 포함하는 것인 식물 숙주 체계.
  7. 제5항에 있어서, 상기 식물이 담배 식물인 식물 숙주 체계.
  8. 제1항에 있어서, N-글리칸 생합성을 제공하는 효소 및 수송체로 구성된 군에서 선택되는 기능적 단백질을 추가로 포함하는 식물 숙주 체계.
  9. 제8항에 있어서, 상기 효소가 갈락토실트랜스퍼라제이고, 상기 이종 당단백질이 갈락토스 잔기를 갖는 이등분된 글리칸을 포함하는 것인 식물 숙주 체계.
  10. 제9항에 있어서, 상기 이종 당단백질이, 포유동물 GnTIII 및 N-글리칸 생합성을 제공하는 상기 효소를 포함하지 않는 식물 숙주 체계에서 생산된 이종 당단백질에 비해 증가된 수의 갈락토스 잔기를 갖는 것인 식물 숙주 체계.
  11. 제9항에 있어서, 상기 갈락토실트랜스퍼라제가 인간 β-1,4-갈락토실트랜스퍼라제인 식물 숙주 체계.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 이등분된 올리고사카라이드를 포함하는 원하는 당단백질 또는 그의 기능적 단편을 생성하는 식물 숙주 체계.
  13. a) 이종 당단백질을 발현하는 식물을 포유동물 GnTIII 효소를 발현하는 식물과 교배시키고, b) 상기 교배로부터 자손을 수확하고, c) 원하는 자손 식물을 선택하는 것을 포함하는 방법으로서, 상기 원하는 자손 식물은 이등분된 올리고사카라이드를 갖는 이종 당단백질을 발현하는 것인 방법.
  14. 포유동물 GnTIII을 코딩하는 핵산 서열 및 이종 당단백질을 코딩하는 핵산 서열을 식물 숙주 체계 내에 도입시키고, 이종 당단백질을 단리시키는 것을 포함하는, 이등분된 올리고사카라이드를 갖는 이종 당단백질의 수득 방법.
  15. 제14항에 있어서, 상기 핵산 서열을 식물 세포 내에 도입시키고, 상기 식물 세포를 식물로 재생시키는 것인 방법.
  16. 제14항에 있어서, 포유동물 GnTIII을 코딩하는 핵산 서열 및 이종 당단백질을 코딩하는 핵산 서열을 포함하는 벡터를 사용하여 상기 식물 숙주 체계를 형질전환시킴으로써, 상기 핵산 서열을 식물 숙주 체계 내에 도입시키는 것인 방법.
  17. 제15항에서 수득된 재생 식물을 재배하는 것을 포함하는, 이등분된 올리고사카라이드를 갖는 이종 당단백질의 수득 방법.
  18. a) 제1항의 식물 숙주 체계를 배양하고, b) 상기 식물 숙주 체계를 수확하고 분획화하는 것을 포함하는, 원하는 당단백질의 수득 방법.
  19. 제13항에 따른 방법에 의해 수득가능한 트랜스제닉 식물.
  20. a) N-글리칸 생합성을 제공하는 효소 또는 수송체로 구성된 군에서 선택되는 기능적 단백질을 포함하는 식물을 제13항에 따른 방법으로 제조된 식물과 교배시키고, b) 상기 교배로부터 자손을 수확하고, c) 원하는 자손을 선택하는 것을 포함하는, 식물 숙주 체계의 수득 방법.
  21. 제20항의 방법에 따라 수득된 트랜스제닉 식물.
  22. a) 포유동물 GnTIII을 코딩하는 핵산 서열과, N-글리칸 생합성을 제공하는 효소 또는 수송체로 구성된 군에서 선택되는 서열을, 이종 당단백질을 발현하는 식물 숙주 체계 내에 도입시키고, b) 상기 당단백질을 단리하는 것을 포함하며,
    상기 효소가 갈락토실트랜스퍼라제인, 식물 숙주 체계에서 발현된 이등분된 올리고사카라이드를 갖는 이종 당단백질의 갈락토실화의 증가 방법.
  23. 제14항에 있어서, GnTIII을 코딩하는 상기 핵산이 SEQ ID NO:1의 핵산 서열을 포함하는 것인 방법.
  24. a. i) 식물 세포, ii) 포유동물 GnTIII 효소를 코딩하는 핵산을 포함하는 제 1 발현 벡터, 및 iii) 이종 당단백질을 코딩하는 핵산을 포함하는 제 2 발현 벡터를 제공하고;
    b. 상기 하이브리드 효소 및 이등분된 올리고사카라이드를 포함하는 상기 이종 당단백질이 발현되도록 하는 조건 하에서 상기 제 1 발현 벡터 및 제 2 발현 벡터를 식물 세포 내에 도입시키는 것을 포함하는 방법.
  25. 제24항에 있어서, 상기 이종 단백질이 항체 또는 항체 단편인 방법.
  26. a) i) GnTIII 효소를 코딩하는 핵산을 포함하는 제 1 발현 벡터를 포함하는 제 1 식물, 및 ii) 이종 단백질을 코딩하는 핵산을 포함하는 제 2 발현 벡터를 포함하는 제 2 식물을 제공하고;
    b) 상기 제 1 식물 및 상기 제 2 식물을 교배시켜 상기 하이브리드 효소 및 이등분된 올리고사카라이드를 포함하는 상기 이종 단백질을 발현하는 자손을 생성하는 것을 포함하는 방법.
  27. GnTIII 효소를 코딩하는 핵산을 포함하는 제 1 발현 벡터 및 이종 단백질을 코딩하는 핵산을 포함하는 제 2 발현 벡터를 포함하는 트랜스제닉 식물.
  28. 제27항에 있어서, 상기 이종 단백질이 항체 또는 항체 단편인 식물.
  29. i) GnTIII의 활성 부위, 및 ii) 식물 세포의 소포체 또는 골지체에 존재하는 단백질의 막횡단 영역을 포함하는, 하이브리드 효소.
  30. 제29항에 있어서, 식물 세포의 소포체 또는 골지체에 존재하는 단백질이 효소인 하이브리드 효소.
  31. 삭제
  32. 제30항에 있어서, 식물 효소가 글리코실트랜스퍼라제인 하이브리드 효소.
  33. 제32항에 있어서, 글리코실트랜스퍼라제가 만노시다제I, 만노시다제II, GnTI, GnTII, XylT 및 FucT로 구성된 군에서 선택된 것인 하이브리드 효소.
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
KR1020047014704A 2002-03-19 2003-03-18 식물에서의 gntⅲ 발현 KR101070518B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US36576902P 2002-03-19 2002-03-19
US60/365,769 2002-03-19
US36804702P 2002-03-26 2002-03-26
US60/368,047 2002-03-26
PCT/IB2003/001562 WO2003078614A2 (en) 2002-03-19 2003-03-18 Gntiii (udp-n-acethylglucosamine:beta-d mannoside beta (1,4)-n-acethylglucosaminy ltransferase iii) expression in plants

Publications (2)

Publication Number Publication Date
KR20040091147A KR20040091147A (ko) 2004-10-27
KR101070518B1 true KR101070518B1 (ko) 2011-10-05

Family

ID=28045563

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020047014704A KR101070518B1 (ko) 2002-03-19 2003-03-18 식물에서의 gntⅲ 발현

Country Status (11)

Country Link
US (3) US7897842B2 (ko)
EP (3) EP1485492B1 (ko)
JP (2) JP5350573B2 (ko)
KR (1) KR101070518B1 (ko)
CN (1) CN1665934B (ko)
AR (1) AR039014A1 (ko)
AU (1) AU2003219402B2 (ko)
CA (2) CA2478294C (ko)
HK (2) HK1152073A1 (ko)
NZ (2) NZ546945A (ko)
WO (1) WO2003078614A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220032274A (ko) * 2020-09-07 2022-03-15 성균관대학교산학협력단 크리스퍼 간섭을 이용한 rna 번역 조절용 조성물

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2354377C (en) 1998-12-09 2007-04-10 Tatsuji Seki A method for manufacturing glycoproteins having human-type glycosylation
MXPA02004142A (es) 1999-10-26 2003-08-20 Plant Res Int Bv Glucosilacion tipo mamifero en plantas.
US7598055B2 (en) * 2000-06-28 2009-10-06 Glycofi, Inc. N-acetylglucosaminyltransferase III expression in lower eukaryotes
CA2434364C (en) 2001-01-19 2013-03-19 The Dow Chemical Company Method for secretory production of glycoprotein having human-type sugar chain using plant cell
EP1367881A2 (en) * 2001-03-06 2003-12-10 The Dow Chemical Company Plant cell having animal-type sugar chain adding function
EP1485486B1 (en) 2002-03-19 2012-11-21 Stichting Dienst Landbouwkundig Onderzoek Optimizing glycan processing in plants
JP5350573B2 (ja) 2002-03-19 2013-11-27 スティヒティング ディーンスト ランドバウクンディフ オンデルズーク 植物におけるgntiii発現
AR042145A1 (es) * 2002-11-27 2005-06-08 Dow Agrociences Llc Produccion de inmunoglobulinas en plantas con una fucocilacion reducida
AU2003294912B2 (en) * 2002-12-20 2009-06-04 Greenovation Biotech Gmbh Production of heterologous glycosylated proteins in bryophyte cells
MXPA05007781A (es) 2003-01-22 2005-09-30 Glycart Biotechnology Ag Constructos de fusion y uso de los mismos para producir anticuerpos con afinidad incrementada de enlace al receptor fc y funcion efectora.
SG10202008722QA (en) 2003-11-05 2020-10-29 Roche Glycart Ag Cd20 antibodies with increased fc receptor binding affinity and effector function
EP1774001B1 (en) * 2004-06-25 2012-08-22 Altor BioScience Corporation Mammalian Tissue Factor obtained from plants and applications of the same
BRPI0607315B1 (pt) 2005-02-07 2022-05-17 Roche Glycart Ag Molécula de ligação ao antígeno anti-egfr humanizada e seus usos, composição farmacêutica, e método para detectar a presença de egfr em uma amostra
JP2006288210A (ja) * 2005-04-05 2006-10-26 National Institute Of Advanced Industrial & Technology 糖転移酵素遺伝子の導入による生体内糖鎖伸長の技術
US20160345631A1 (en) 2005-07-19 2016-12-01 James Monsees Portable devices for generating an inhalable vapor
US9675109B2 (en) 2005-07-19 2017-06-13 J. T. International Sa Method and system for vaporization of a substance
TWI615407B (zh) 2005-08-26 2018-02-21 羅齊克雷雅公司 具有經改變細胞傳訊活性之改質抗原結合分子
AR062223A1 (es) 2006-08-09 2008-10-22 Glycart Biotechnology Ag Moleculas de adhesion al antigeno que se adhieren a egfr, vectores que los codifican, y sus usos de estas
EP2147108B1 (en) 2007-04-17 2014-03-05 Stichting Dienst Landbouwkundig Onderzoek Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases
PL2155880T3 (pl) * 2007-06-15 2017-06-30 Medicago Inc. Modyfikacja wytwarzania glikoproteiny w roślinach
KR20100031603A (ko) * 2007-06-15 2010-03-23 메디카고 인코포레이티드 식물에서의 단백질 생산
CA2615372A1 (en) 2007-07-13 2009-01-13 Marc-Andre D'aoust Influenza virus-like particles (vlps) comprising hemagglutinin
WO2009076778A1 (en) 2007-11-27 2009-06-25 Medicago Inc. Recombinant influenza virus-like particles (vlps) produced in transgenic plants expressing hemagglutinin
US8991402B2 (en) 2007-12-18 2015-03-31 Pax Labs, Inc. Aerosol devices and methods for inhaling a substance and uses thereof
JP2011115043A (ja) * 2008-03-27 2011-06-16 Japan Science & Technology Agency 植物においてo型糖鎖結合タンパク質を製造するためのキット及びその利用
JP5809054B2 (ja) * 2008-07-08 2015-11-10 メディカゴ インコーポレイテッド 可溶性組換えインフルエンザ抗原
NZ590351A (en) * 2008-07-18 2012-11-30 Medicago Inc HA1 domain totally or partially free of N-linked glycosylation operatively linked to a regulatory region
US20120100609A1 (en) * 2009-03-27 2012-04-26 Crawford Brett E N-linked glycan biosynthesis modulators
AU2010241154A1 (en) * 2009-04-22 2011-10-27 Bayer Bioscience N.V. Production of multi-antennary N-glycan structures in plants
PT2445928T (pt) 2009-06-24 2018-06-07 Medicago Inc Particulas quiméricas semelhantes a virus da gripe compreendendo hemaglutinina
US8598413B2 (en) * 2009-08-19 2013-12-03 Dow AgroSciecnes, LLC. AAD-1 event DAS-40278-9, related transgenic corn lines, event-specific identification thereof, and methods of weed control involving AAD-1
ES2719599T3 (es) 2009-08-19 2019-07-11 Dow Agrosciences Llc Evento DAS-40278-9 que incorpora add-1, líneas transgénicas de maíz relacionadas e identificación evento-específico de las mismas
SG178567A1 (en) 2009-08-31 2012-04-27 Roche Glycart Ag Affinity-matured humanized anti cea monoclonal antibodies
PT2480560T (pt) 2009-09-22 2018-04-03 Medicago Inc Método de preparação de proteínas derivadas de plantas
CA2792117C (en) * 2010-03-12 2016-09-20 Merial Limited Foot and mouth disease virus recombinant vaccines and uses thereof
WO2012009705A1 (en) 2010-07-15 2012-01-19 Zyngenia, Inc. Ang-2 binding complexes and uses thereof
US20140088019A1 (en) 2011-02-11 2014-03-27 Zyngenia, Inc. Monovalent and Multivalent Multispecific Complexes and Uses Thereof
US8642742B2 (en) 2011-03-02 2014-02-04 Roche Glycart Ag Anti-CEA antibodies
TWI620816B (zh) 2011-03-23 2018-04-11 苜蓿股份有限公司 植物衍生蛋白回收方法
CN106432506A (zh) 2011-05-24 2017-02-22 泽恩格尼亚股份有限公司 多价和单价多特异性复合物及其用途
CA2839932C (en) * 2011-06-07 2022-07-05 Ibio, Inc. In vivo de-glycosylation of recombinant proteins by co-expression with pngase f
US10196664B2 (en) * 2011-10-04 2019-02-05 Icon Genetics Gmbh Nicotiana benthamiana plants deficient in fucosyltransferase activity
GB201201314D0 (en) 2012-01-26 2012-03-07 Isis Innovation Composition
US10517530B2 (en) 2012-08-28 2019-12-31 Juul Labs, Inc. Methods and devices for delivering and monitoring of tobacco, nicotine, or other substances
US10638792B2 (en) 2013-03-15 2020-05-05 Juul Labs, Inc. Securely attaching cartridges for vaporizer devices
US10653180B2 (en) 2013-06-14 2020-05-19 Juul Labs, Inc. Multiple heating elements with separate vaporizable materials in an electric vaporization device
US10279934B2 (en) 2013-03-15 2019-05-07 Juul Labs, Inc. Fillable vaporizer cartridge and method of filling
CN105263345A (zh) 2013-05-06 2016-01-20 派克斯实验公司 用于气溶胶装置的烟碱盐调配物及其方法
US9934981B2 (en) 2013-09-26 2018-04-03 Varian Semiconductor Equipment Associates, Inc. Techniques for processing substrates using directional reactive ion etching
CN105979805B (zh) 2013-12-05 2021-04-16 尤尔实验室有限公司 用于气雾剂装置的尼古丁液体制剂及其方法
DE202014011221U1 (de) 2013-12-23 2018-09-13 Juul Labs Uk Holdco Limited Systeme für eine Verdampfungsvorrichtung
USD825102S1 (en) 2016-07-28 2018-08-07 Juul Labs, Inc. Vaporizer device with cartridge
US10076139B2 (en) 2013-12-23 2018-09-18 Juul Labs, Inc. Vaporizer apparatus
US10159282B2 (en) 2013-12-23 2018-12-25 Juul Labs, Inc. Cartridge for use with a vaporizer device
US10058129B2 (en) 2013-12-23 2018-08-28 Juul Labs, Inc. Vaporization device systems and methods
US20160366947A1 (en) 2013-12-23 2016-12-22 James Monsees Vaporizer apparatus
USD842536S1 (en) 2016-07-28 2019-03-05 Juul Labs, Inc. Vaporizer cartridge
CA2948851A1 (en) 2014-05-16 2015-11-19 Pax Labs, Inc. Systems and methods for aerosolizing a smokeable material
AU2015357509B2 (en) 2014-12-05 2021-05-20 Juul Labs, Inc. Calibrated dose control
HUE054435T2 (hu) 2015-04-06 2021-09-28 Subdomain Llc De novo kötõdomént tartalmazó polipeptidek és alkalmazásaik
ES2705539T3 (es) * 2015-04-16 2019-03-25 Signify Holding Bv Aparato de control de iluminación
WO2017139595A1 (en) 2016-02-11 2017-08-17 Pax Labs, Inc. Fillable vaporizer cartridge and method of filling
CN108699156A (zh) 2016-03-01 2018-10-23 豪夫迈·罗氏有限公司 具有降低的adcp的奥滨尤妥珠单抗和利妥昔单抗变体
US10405582B2 (en) 2016-03-10 2019-09-10 Pax Labs, Inc. Vaporization device with lip sensing
USD849996S1 (en) 2016-06-16 2019-05-28 Pax Labs, Inc. Vaporizer cartridge
USD851830S1 (en) 2016-06-23 2019-06-18 Pax Labs, Inc. Combined vaporizer tamp and pick tool
USD836541S1 (en) 2016-06-23 2018-12-25 Pax Labs, Inc. Charging device
USD848057S1 (en) 2016-06-23 2019-05-07 Pax Labs, Inc. Lid for a vaporizer
US11660403B2 (en) 2016-09-22 2023-05-30 Juul Labs, Inc. Leak-resistant vaporizer device
USD887632S1 (en) 2017-09-14 2020-06-16 Pax Labs, Inc. Vaporizer cartridge
BR112020009136A2 (pt) 2017-11-14 2020-10-13 Arcellx, Inc. polipeptídeos que contêm domínio d e usos dos mesmos
CA3082410A1 (en) 2017-11-14 2019-05-23 Arcellx, Inc. Multifunctional immune cell therapies
EP4229068A1 (en) 2020-10-13 2023-08-23 Avitide LLC Affinity ligand libraries of three-helix bundle proteins and uses thereof
CN116472277A (zh) 2020-10-13 2023-07-21 艾维泰有限责任公司 Aav8亲和剂
US11821014B2 (en) 2020-12-15 2023-11-21 Frito-Lay North America, Inc. Production of gentisic acid 5-O-β-D xylopyranoside
EP4294542A1 (en) 2021-02-19 2023-12-27 Avitide LLC Aav2 affinity agents
WO2023122327A2 (en) 2021-12-24 2023-06-29 Avitide LLC Chi domain affinity ligands and agents
WO2024025911A1 (en) 2022-07-29 2024-02-01 Avitide LLC An affinity agent comprising a ligand that binds vce and comprises seq id no: 1

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001029242A2 (en) * 1999-10-21 2001-04-26 Monsanto Company Post-translational modification of recombinant proteins produced in plants
WO2001031045A1 (en) * 1999-10-26 2001-05-03 Plant Research International B.V. Mammalian-type glycosylation in plants

Family Cites Families (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5455790A (en) 1977-10-05 1979-05-04 Tomoyuki Tajima Production of erythropoetin
JPS5616496A (en) 1979-07-20 1981-02-17 Sumitomo Chem Co Ltd Recovery of erythropoietin
JPS5653696A (en) 1979-10-09 1981-05-13 Ajinomoto Co Inc Isolation of erythropoietin by adsorption
JPS56108798A (en) 1980-02-01 1981-08-28 Green Cross Corp:The Purification of erythropoietin
JPS57149228A (en) 1981-03-11 1982-09-14 Ajinomoto Co Inc Novel erythropoietin and its preparation
JPS57169424A (en) 1981-04-10 1982-10-19 Toyo Shinyaku Kk Preparation of erythropoietin
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4956282A (en) * 1985-07-29 1990-09-11 Calgene, Inc. Mammalian peptide expression in plant cells
US5583024A (en) 1985-12-02 1996-12-10 The Regents Of The University Of California Recombinant expression of Coleoptera luciferase
US5179198A (en) 1988-07-11 1993-01-12 Hidechika Okada Glycoprotein and gene coding therefor
US6051753A (en) 1989-09-07 2000-04-18 Calgene, Inc. Figwort mosaic virus promoter and uses
US5202422A (en) * 1989-10-27 1993-04-13 The Scripps Research Institute Compositions containing plant-produced glycopolypeptide multimers, multimeric proteins and method of their use
US5959177A (en) 1989-10-27 1999-09-28 The Scripps Research Institute Transgenic plants expressing assembled secretory antibodies
US5180674A (en) * 1990-04-16 1993-01-19 The Trustees Of The University Of Pennsylvania Saccharide compositions, methods and apparatus for their synthesis
EP0489166A4 (en) 1990-06-21 1992-11-19 Nippon Shokubai Kagaku Kogyo Co. Ltd. Process for producing n-substituted aziridine compound
EP0550756B1 (en) 1991-04-18 2001-12-05 Toray Industries, Inc. Preparation of interleukin-6 compositions
US5874271A (en) * 1992-08-21 1999-02-23 Takara Shuzo Co., Ltd. Human glycosyltransferase gene, compounds and method for inhibiting cancerous metastasis
CA2148929A1 (en) 1992-11-27 1994-06-09 Eric G. Berger Proteins having glycosyltransferase activity
AT401526B (de) 1993-02-10 1996-09-25 Scheirer Winfried Reagenzlösung zur stabilisierung der lumineszenz bei der luciferasemessung
WO1995002683A1 (en) 1993-07-15 1995-01-26 Neose Pharmaceuticals Method of synthesizing saccharide compositions
US5854042A (en) 1993-12-24 1998-12-29 The Institute Of Physical And Chemical Research Sugar-chain synthetase and process for producing the same
JP3221683B2 (ja) 1994-01-21 2001-10-22 パウダージェクト ヴァクシンズ, インコーポレイテッド ガス駆動型遺伝子搬入装置
WO1995021248A1 (en) 1994-02-03 1995-08-10 The Scripps Research Institute Method for using tobacco mosaic virus to overproduce peptides and proteins
US5723755A (en) 1995-05-16 1998-03-03 Francis E. Lefaivre Large scale production of human or animal proteins using plant bioreactors
US5939288A (en) * 1995-06-07 1999-08-17 Iowa State University Research Foundation, Inc. Plant secretory signal peptides and nectarins
FR2736930B1 (fr) 1995-07-17 1997-09-19 Biocem Procede de production, par des cellules vegetales, de proteines heminiques, proteines ainsi obtenues et produits contenant ces proteines
WO1997004122A1 (en) 1995-07-20 1997-02-06 Washington State University Research Foundation Production of secreted foreign polypeptides in plant cell culture
DE69736261T2 (de) * 1996-01-24 2007-06-06 Toyo Boseki K.K. Alpha-1-6-fucosyltransferasen
EP0874900B1 (en) 1996-08-02 2007-10-03 The Austin Research Institute Improved nucleic acids encoding a chimeric glycosyltransferase
US5976796A (en) 1996-10-04 1999-11-02 Loma Linda University Construction and expression of renilla luciferase and green fluorescent protein fusion genes
AU736993B2 (en) 1997-01-16 2001-08-09 Novo Nordisk A/S Practical in vitro sialylation of recombinant glycoproteins
US6087115A (en) 1997-01-22 2000-07-11 Cornell Research Foundation, Inc. Methods of identifying negative antagonists for G protein coupled receptors
JP3921271B2 (ja) 1997-05-16 2007-05-30 生化学工業株式会社 グルクロン酸転移酵素をコードするdna
US6074859A (en) 1997-07-08 2000-06-13 Kikkoman Corporation Mutant-type bioluminescent protein, and process for producing the mutant-type bioluminescent protein
JP4003093B2 (ja) * 1997-07-29 2007-11-07 東洋紡績株式会社 糖類の製造方法
AU1585999A (en) 1997-11-12 1999-05-31 Neurotherapeutics Methods for the detection and treatment of disease using a glycosyltransferase
DE19754622A1 (de) 1997-12-09 1999-06-10 Antje Von Dr Schaewen Pflanzliche GntI-Sequenzen und Verwendung derselben zur Gewinnung von Pflanzen mit verminderter oder fehlender N-Acetylglucosaminyltransferase I (GnTI)-Aktivität
US6096546A (en) 1998-01-30 2000-08-01 Board Of Trustees, Rutgers, The State University Of New Jersey Methods for recovering polypeptides from plants and portions thereof
FR2774379B1 (fr) 1998-01-30 2002-03-29 Groupe Limagrain Holding Procede de production, par des cellules vegetales, d'alpha 1-antitrypsine et de ses variantes, et produits contenant l'alpha-antitrypsine ainsi obtenue
US5955282A (en) 1998-04-03 1999-09-21 Incyte Pharmaceuticals, Inc. Human galactosyltransferases
EP2180007B2 (en) * 1998-04-20 2017-08-30 Roche Glycart AG Glycosylation engineering of antibodies for improving antibody-dependent cellular cytotoxicity
IL126967A (en) 1998-11-09 2002-09-12 Lightech Electronics Ind Ltd Electronic transformer for lighting
JP2002530087A (ja) * 1998-11-18 2002-09-17 ネオーズ テクノロジーズ, インコーポレイテッド オリゴ糖の安価な産生
CA2354377C (en) 1998-12-09 2007-04-10 Tatsuji Seki A method for manufacturing glycoproteins having human-type glycosylation
AT408446B (de) 1999-02-18 2001-11-26 Altmann Friedrich Dr Fucosyltransferase-gen
JP2000245470A (ja) * 1999-02-26 2000-09-12 Noda Inst For Scient Res 植物細胞間液による外来ポリペプチドの製造方法
AU3388400A (en) 1999-03-02 2000-09-21 Human Genome Sciences, Inc. Human glycosylation enzymes
JP2000287692A (ja) 1999-04-09 2000-10-17 Mitsui Chemicals Inc 糖タンパク質の有するn−結合型糖鎖の組成中、分岐数が異なる糖鎖の含有割合を制御する方法
DE19944849A1 (de) 1999-09-18 2001-03-29 Geck Gmbh J D Preisschildstab mit einem Informationsträger
BR0014858A (pt) 1999-10-15 2002-07-16 Calgene Llc Métodos e vetores para recombinação de sìtio especìfico em plastìdios de células de plantas
ES2349427T3 (es) 1999-10-26 2011-01-03 Stichting Dienst Landbouwkundig Onderzoek Glicosilación de tipo mamífero en plantas.
JP2001546898A (en) 1999-12-21 2003-06-10 Kyowa Hakko Kogyo Kk MODIFIED alpha -1,2-FUCOSYLTRANSFERASE GENE AND PROCESS FOR PRODUCING alpha -1,2-FUCOSYLTRANSFERASE AND FUCOSE-CONTAINING SUGAR CHAIN
FR2803307A1 (fr) 1999-12-30 2001-07-06 Centre Nat Rech Scient Lignees de lymphocytes t cd4 specifiques de type th1 et procede pour leur induction ex vivo
ATE461272T1 (de) 1999-12-30 2010-04-15 Knut Kleesiek Xylosyltransferase und isoformen
WO2001062912A2 (en) 2000-02-24 2001-08-30 University Of Guelph Method of modulating glycosylation pathways
US20020174453A1 (en) * 2001-04-18 2002-11-21 Henry Daniell Production of antibodies in transgenic plastids
AT409381B (de) 2000-03-03 2002-07-25 Gloessl Josef Dr Xylosyltransferase-gen
FR2808286B1 (fr) 2000-04-26 2004-12-17 Agronomique Inst Nat Rech Nouvelle glucosidase i de plante et son application a la production de proteines recombinantes a glycosylation modifiee
WO2001082912A2 (en) 2000-04-28 2001-11-08 Gerolymatos P N Sa TREATMENT OF PATHOLOGICAL CONDITIONS INFLUENCED BY THE ACTION OF MATRIX METALLOPROTEINASES (MMPs) USING PHANQUINONE
MXPA02011016A (es) * 2000-05-12 2004-03-16 Neose Technologies Inc Glicopeptidos recombinantes de glucolisacion in vitro.
EP2339013B1 (en) 2000-06-28 2014-07-02 GlycoFi, Inc. Methods for producing modified glycoproteins
AU2002222965A1 (en) 2000-07-19 2002-01-30 Digimarc Corporation Print media with embedded messages for controlling printing
CA2434364C (en) * 2001-01-19 2013-03-19 The Dow Chemical Company Method for secretory production of glycoprotein having human-type sugar chain using plant cell
EP1367881A2 (en) * 2001-03-06 2003-12-10 The Dow Chemical Company Plant cell having animal-type sugar chain adding function
AU2002312698B2 (en) 2001-06-22 2007-03-22 Siemens Schweiz Ag Video smoke detection system and method for examining the same
KR20030072324A (ko) 2001-07-09 2003-09-13 이비덴 가부시키가이샤 세라믹 히터 및 세라믹 접합체
SE519261C2 (sv) 2001-07-17 2003-02-04 Sca Hygiene Prod Ab Absorberande alster
WO2003007861A1 (en) 2001-07-20 2003-01-30 Cutmed Ltd. System for performing a micro-drilling procedure in human or animal and a method for use thereof
NZ581474A (en) * 2001-08-03 2011-04-29 Glycart Biotechnology Ag Antibody glycosylation variants having increased antibody-dependent cellular cytotoxicity
US20030175755A1 (en) 2002-03-05 2003-09-18 Yoshihiro Abiko Method of collecting data for estimation of susceptibility to periodontal disease
JP5350573B2 (ja) 2002-03-19 2013-11-27 スティヒティング ディーンスト ランドバウクンディフ オンデルズーク 植物におけるgntiii発現
EP1485486B1 (en) 2002-03-19 2012-11-21 Stichting Dienst Landbouwkundig Onderzoek Optimizing glycan processing in plants
DE10229635C1 (de) 2002-07-02 2003-07-10 Ise Gmbh Überrollschutzsystem für Kraftfahrzeuge
AR042145A1 (es) 2002-11-27 2005-06-08 Dow Agrociences Llc Produccion de inmunoglobulinas en plantas con una fucocilacion reducida
EP2147108B1 (en) 2007-04-17 2014-03-05 Stichting Dienst Landbouwkundig Onderzoek Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001029242A2 (en) * 1999-10-21 2001-04-26 Monsanto Company Post-translational modification of recombinant proteins produced in plants
WO2001031045A1 (en) * 1999-10-26 2001-05-03 Plant Research International B.V. Mammalian-type glycosylation in plants

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220032274A (ko) * 2020-09-07 2022-03-15 성균관대학교산학협력단 크리스퍼 간섭을 이용한 rna 번역 조절용 조성물
KR102422842B1 (ko) 2020-09-07 2022-07-18 성균관대학교산학협력단 크리스퍼 간섭을 이용한 rna 번역 조절용 조성물

Also Published As

Publication number Publication date
EP2319934A2 (en) 2011-05-11
JP5480060B2 (ja) 2014-04-23
EP2319934B1 (en) 2015-09-02
WO2003078614A3 (en) 2004-01-08
AR039014A1 (es) 2005-02-02
AU2003219402A1 (en) 2003-09-29
HK1152074A1 (zh) 2012-02-17
EP2319935A3 (en) 2011-06-29
US8492613B2 (en) 2013-07-23
JP5350573B2 (ja) 2013-11-27
JP2005528092A (ja) 2005-09-22
WO2003078614A2 (en) 2003-09-25
EP1485492A2 (en) 2004-12-15
US7897842B2 (en) 2011-03-01
US9255277B2 (en) 2016-02-09
CN1665934A (zh) 2005-09-07
US20130347146A1 (en) 2013-12-26
US20050223430A1 (en) 2005-10-06
KR20040091147A (ko) 2004-10-27
EP1485492B1 (en) 2011-12-21
EP2319934A3 (en) 2011-07-27
CA2819867A1 (en) 2003-09-25
CA2478294A1 (en) 2003-09-25
HK1152073A1 (zh) 2012-02-17
NZ534881A (en) 2006-09-29
CA2478294C (en) 2013-09-03
EP2319935B1 (en) 2016-04-27
JP2010279383A (ja) 2010-12-16
CN1665934B (zh) 2010-05-26
AU2003219402B2 (en) 2008-05-08
US20120010155A1 (en) 2012-01-12
NZ546945A (en) 2008-04-30
EP2319935A2 (en) 2011-05-11

Similar Documents

Publication Publication Date Title
KR101070518B1 (ko) 식물에서의 gntⅲ 발현
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CA2683497C (en) .delta.8 desaturases and their use in making polyunsaturated fatty acids
KR20130132405A (ko) 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주
CN109563505A (zh) 用于真核细胞的组装系统
DK2324120T3 (en) Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS
AU2010258955B2 (en) Expression cassettes derived from maize
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR20110122672A (ko) 이소프렌 및 공-산물을 제조하는 방법
KR20100118973A (ko) 이소프렌을 생성하기 위한 조성물 및 방법
KR20110038087A (ko) 재생가능 자원으로부터의 이소프렌 중합체
CN108431229A (zh) 糖转运蛋白修饰的酵母菌株和用于生物制品生产的方法
KR20090058519A (ko) 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산
CN101827938A (zh) 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物
AU2021204330A1 (en) Materials and methods for PUFA production, and PUFA-containing compositions
JP2002509696A (ja) 植物GntI配列、及びN−アセチルグルコサミニルトランスフェラーゼI(GnTI)活性が減少または欠如した植物の産生のためにそれを用いる方法
TW201127957A (en) Modified oil encapsulating proteins and uses thereof
CN111836825A (zh) 优化的植物crispr/cpf1系统
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포
CN112119160A (zh) 用于在植物中生产重组蛋白的复制和非复制载体及其使用方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150827

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160831

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee