KR20090007354A - 니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열 - Google Patents

니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열 Download PDF

Info

Publication number
KR20090007354A
KR20090007354A KR1020087025826A KR20087025826A KR20090007354A KR 20090007354 A KR20090007354 A KR 20090007354A KR 1020087025826 A KR1020087025826 A KR 1020087025826A KR 20087025826 A KR20087025826 A KR 20087025826A KR 20090007354 A KR20090007354 A KR 20090007354A
Authority
KR
South Korea
Prior art keywords
nicotiana
xylt
nucleotide sequence
ser
specific
Prior art date
Application number
KR1020087025826A
Other languages
English (en)
Inventor
코엔 베터링스
Original Assignee
바이엘 바이오사이언스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이엘 바이오사이언스 엔.브이. filed Critical 바이엘 바이오사이언스 엔.브이.
Publication of KR20090007354A publication Critical patent/KR20090007354A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1077Pentosyltransferases (2.4.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 신규 베타-1,2-크실로스트랜스퍼레이즈 뉴클레오티드 서열 및 이의 용도를 제공한다.

Description

니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열{NOVEL NUCLEOTIDE SEQUENCES ENCODING NICOTIANA BETA-1,2-XYLOSYLTRANSFERASE}
본 발명은 베타-1,2-크실로실트랜스퍼레이즈(XylT)를 코딩하는 니코티아나 종(Nicotiana) 종 및 재배종(cultivar), 특히 니코티아나 벤싸미아나(Nicotiana benthamiana) 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1(Nicotiana tabacum cv. Petite Havana SR1)로부터의 신규 뉴클레오티드 서열; 및 대조군 비변형 니코티아나 식물보다 낮은 수준 또는 변경된 패턴의 면역원성 단백질-결합 N-글리칸, 특히 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 변형된 니코티아나 식물, 특히 니코티아나 벤싸미아나 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1 식물을 생산하는 데 있어서의 상기 신규 뉴클레오티드 서열의 용도에 관한 것이다. 이러한 니코티아나 식물은 내인성 니코티아나 XylT 유전자의 발현을 낮춤으로써, 예컨대, 내인성 니코티아나 XylT 유전자의 활성을 변경시킴으로써, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 낮추는 XylT 유전자의 또 다른 대립유전자로 내인성 니코티아나 XylT 유전자를 치환함으로써, 또는 이들의 임의의 조합 방법으로 수득할 수 있다.
부가가치 재조합 단백질, 예컨대, 항체, 백신, 인간 혈액 생성물, 호르몬, 성장 조절자 등의 제조를 위한 형질전환 식물의 사용은 보다 보편적인 시스템, 예컨대, 동물 및 곤충 세포 배양물, 효모, 섬유상 진균 및 박테리아와 비교할 때 실용적, 경제적 및 안정성 면에서 많은 이점을 제공한다고 보고되어 있다(문헌(Stoger et al., 2002; Twyman et al, 2003; Fischer et al, 2004) 참조).
단백질 합성 경로는 식물과 동물에서 거의 동일하지만, 번역 후 변형, 특히 글리칸-쇄 구조 면에서 일부 차이점이 있다. 따라서, 식물-유래의 재조합 인간 단백질은 포유동물에는 존재하는 않는 탄수화물 기 베타(1→2)-크실로스 및 알파(1→3)-푸코스를 갖지만 많은 천연 인간 당단백질 상에서 발견되는 말단 갈락토스 및 시알산 잔기는 갖지 않는다(Twyman et al, 2003).
크실로스가 UDP-크실로스로부터 단백질-결합 N-글리칸의 코어 베타-결합 만노스로 전달되는 것을 촉진하는 효소가 XylT이다. XylT는 식물 및 일부 비-척추 동물 종, 예컨대, 주혈흡충(Schistosoma) 종(Khoo et al., 1997) 및 달팽이(예컨대, 문헌(Mulder et al, 1995))에만 있는 효소이고 인간 또는 다른 척추동물에는 존재하지 않는다.
테주카 등(Tezuka et al.(1992))은 시카모어(sycamore)(아서 슈도플라타너스 엘.(Acer pseudoplatanus L.))의 XylT의 특징을 규명하였다(1992).
젱 등(Zeng et al. (1997))은 대두 마이크로좀(microsome)으로부터 XylT를 정제하는 것을 기술하였다. 대두 XylT cDNA의 부분만이 단리되었다(국제특허출원 공개 제W0 99/29835 A1호).
스트라서 등(Strasser et al. (2000)) 및 국제특허출원 공개 제WO O1/64901호는 아라비돕시스(Arabidopsis) XylT 유전자의 분리, 코딩된 XylT 단백질의 예측된 아미노산 서열, 및 시험관내 및 생체내에서의 이의 효소 활성을 기술하였다.
하기 데이타베이스 입력 식별은 실험적으로 입증되었고, 잠정적인 XylT cDNA 및 유전자 서열, 이의 부분 또는 상동성 서열이 확인될 수 있다: AJ627182, AJ627183(니코티아나 타바큠 재배종 잔티(Nicotiana tabacum cv. Xanthi)), AM 179855(솔라늄 투버로슘(Solanum tuberosum)), AM179856(비티스 비니페라(Vitis vinifera)), AJ891042(포퓰러스 알바 x 포퓰러스 트레뮬라(Populus alba x Populus tremula)), AY302251(메디카고 사티바(Medicago sativa)), AJ864704(사카륨 오피시나륨(Saccharum officinarum), AMI 79857(제아 메이스(Zea mays)), AMI 79853(호르데움 불가레(Hordeum vulgare)), AM179854(소르굼 비콜로르(Sorghum bicolor)), BD434535, AJ277603, AJ272121, AF272852, AX236965(아라비돕시스 탈리아나(Arabidopsis thaliana)), AJ621918(오리자 사티바(Oryza sativa)), AR359783, AR359782, AR123000, AR123001(대두), AJ618933(피즈코미트렐라 파텐스(Physcomitrella patens)).
스트라서 등(2004a)은 식물에서의 N-글리코실화 경로의 조절에 대한 두 가지 방법을 보고하였다: 첫번째 방법은 고등 진핵생물에서 올리고만노시딕(oligomannosidic) 잔기가 혼성화되어 결합체 N-글리칸를 형성하는 과정에 관여 하는 효소인 베타-1,2-N-아세틸글루코스아미닐트랜스퍼레이즈 I(GnTI)의 발현을, 번역 후 유전자 침묵을 이용하여 넉아웃시켜 니코티아나 벤싸미아나에서의 결합체 N-글리칸의 형성에 대한 GnTI 발현의 영향을 평가하는 방법이다. N-글리칸 프로파일링은 총 N-글리칸 패턴의 유의한 변화를 나타내지 않았는데, 이는 GnTI의 적은 잔류 활성 조차도 니코티아나 벤싸미아나에서의 결합체 N-글리칸의 생합성을 허용한다는 것을 보여준다. 또한, 스트라서 등은 XylT를 넉아웃시키는 유사한 방법이 베타-1,2-크실로실화 N-글리칸의 유의한 감소를 초래한다고 보고하였다. 두번째 방법은 베타-1,2-크실로스 및 알파-1,3-푸코스 잔기를 N-글리칸으로부터 완전히 제거하기 위해 삽입 돌연변이 계통을 사용하여 삼중 넉아웃 아라비돕시스 식물을 발생시키는 방법이다. 이 식물은 활성 베타-1,2-크실로실트랜스퍼레이즈 및 코어 알파-1,3-푸코실트랜스퍼레이즈가 완전히 결여되어 있고 면역원성 단백질-결합 N-글리칸을 갖지 않으며 말단 베타-N-아세틸글루코스아민 잔기를 가진 인간화된 구조를 주로 합성한다(Strasser et al, 2004b).
담배와 같은 잎이 무성한 작물은 재조합 단백질의 상업적 제조를 위한 강력한 후보로서 인식된다(예컨대, 문헌(Twyman et al, 2003) 참조).
도 1a 내지 1c는 잠정적인 XylT 단백질을 코딩하는 니코티아나 타바큠 재배종 잔티의 cDNA 서열(검색번호: AJ627182; 서열번호 23)과 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 2개의 상이한 XylT cDNA 서열(서열번호 3 및 5) 사이의 전체적인 DNA 정렬(하기 파라미터를 가진 표준 선형 스코어링 매트릭스에 기초함: 불일치 패널티 = 2, 개방 갭 패널티 = 4 및 연장 갭 패널티 = 1)이다. 점은 니코티아나 타바큠 재배종 잔티 cDNA 서열의 상응하는 뉴클레오티드와 동일한 니코티아나 타바큠 재배종 페타이트 하바나 SR1 cDNA 서열의 뉴클레오티드를 표시하고; 대시(-)는 니코티아나 타바큠 재배종 잔티 cDNA 서열의 뉴클레오티드에 상응하는 니코티아나 타바큠 재배종 페타이트 하바나 SR1 cDNA 서열의 뉴클레오티드의 부재를 표시한다.
도 2는 니코티아나 타바큠 재배종 잔티로부터 단리된 cDNA 서열(검색번호: AJ627182; 서열번호 24)에 의해 코딩된 잠정적 XylT 단백질과 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 2개의 상이한 XylT cDNA 서열(서열번호 4 및 6) 사이의 전체적인 단백질 정렬(블로스섬(blossum) 62 스코어링 매트릭스에 기초함)이다. 점은 니코티아나 타바큠 재배종 잔티 단백질 서열의 상응하는 아미노산과 동일한 니코티아나 타바큠 재배종 페타이트 하바나 SR1 단백질 서열의 아미노산을 표시하고; 대시(-)는 니코티아나 타바큠 재배종 잔티 단백질 서열의 아미노산에 상응하는 니코티아나 타바큠 재배종 페타이트 하바나 SR1 단백질 서열의 아미노산의 부재를 표시한다.
도 3a 내지 3l은 잠정적 XylT 단백질을 코딩하는 니코티아나 타바큠 재배종 잔티의 게놈 DNA 서열(검색번호: AJ627183; 서열번호 25)과 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 2개의 상이한 XylT 게놈 DNA 서열(서열번호 7 및 9) 및 니코티아나 벤싸미아나로부터 단리된 2개의 상이한 XylT 게놈 DNA 서열(서열번호 11 및 13) 사이의 전체적인 DNA 정렬(하기 파라미터를 가진 표준 선형 스코어링 매트릭스에 기초함: 불일치 패널티 = 2, 개방 갭 패널티 = 4 및 연장 갭 패널티 = 1)이다. 점은 니코티아나 타바큠 재배종 잔티 게놈 DNA 서열의 상응하는 뉴클레오티드와 동일한 니코티아나 타바큠 재배종 페타이트 하바나 SR1 게놈 서열의 뉴클레오티드를 표시하고; 대시(-)는 니코티아나 타바큠 재배종 잔티 게놈 DNA 서열의 뉴클레오티드에 상응하는 니코티아나 타바큠 재배종 페타이트 하바나 SR1 게놈 DNA 서열의 뉴클레오티드의 부재를 표시한다.
도 4a 내지 4b는 니코티아나 타바큠 재배종 잔티로부터 단리된 게놈 DNA 서열에 의해 코딩된 잠정적 XylT 단백질(검색번호: AJ627183; 서열번호 26)과 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 2개의 상이한 XylT 게놈 DNA 서열(서열번호 8 및 10) 및 니코티아나 벤싸미아나로부터 단리된 2개의 상이한 XylT 게놈 DNA 서열(서열번호 12 및 14) 사이의 전체적인 단백질 정렬(블로스섬 62 스코어링 매트릭스에 기초함)이다. 점은 니코티아나 타바큠 재배종 잔티 단백질 서열의 상응하는 아미노산과 동일한 니코티아나 타바큠 재배종 페타이트 하바나 SR1 단백질 서열의 아미노산을 표시하고; 대시(-)는 니코티아나 타바큠 재배종 잔티 단백질 서열의 아미노산에 상응하는 니코티아나 타바큠 재배종 페타이트 하바나 SR1 단백질 서열의 아미노산의 부재를 표시한다.
본 발명의 목적은 특히 니코티아나 종 또는 재배종에서의 XylT 발현을 변경시키기에 보다 적합한, 니코티아나 종 및 재배종, 특히 니코티아나 벤싸미나 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 대체(alternative) XylT cDNA 및 유전자 서열을 제공하는 것이다.
본 발명의 한 측면에서, 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포 내로 도입하여 형질전환 식물 세포를 발생시키는 단계; 경우에 따라, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 비형질전환 니코티아나 식물 세포보다 낮은 형질전환 니코티아나 식물 세포를 확인하는 단계; 형질전환 니코티아나 식물 세포를 재생시켜 형질전환 니코티아나 식물을 수득하는 단계; 및 경우에 따라, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 비형질전환 니코티아나 식물보다 낮은 형질전환 니코티아나 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 생산하는 방법으로서, 이때 상기 키메라 유전자가 작동가능하게 연결된 발현가능한 식물 프로모터; 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열 또는 이의 상보체를 포함하는 제1 센스 DNA 영역, 및 상기 제1 센스 DNA 영역의 상보체와 95% 이상의 서열 동일성을 가진, 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 제2 안티센스 DNA 영역을 포함하는 전사가능한 DNA 영역; 및 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역을 포함하는, 방법을 제공하는데, 이때 상기 제1 센스 DNA 영역에서 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 이의 상보체이며, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 포함하고, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자는 적어도 상기 제1 센스 DNA 영역으로부터 전사된 RNA 영역과 상기 제2 안티센스 DNA 영역으로부터 전사된 RNA 영역 사이에서 이중 가닥 RNA 영역을 형성할 수 있다. 상기 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산 또는 뉴클레오티드는 니코티아나 벤싸미아나-특이적 또는 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산 또는 뉴클레오티드일 수 있고, 니코티아나 종 또는 재배종은 바람직하게는 니코티아나 벤싸미아나 또는 니코티아나 타바큠 재배종 페타이트 하바나 SR1일 수 있다. 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열은 서열번호 12 또는 14의 아미노산 서열 또는 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함할 수 있고, 니코티아나 XylT 유전자의 뉴클레오티드 서열은 서열번호 11, 13 또는 21의 뉴클레오티드 서열, 또는 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함할 수 있다.
본 발명의 또 다른 목적은 하나 이상의 이중 가닥 RNA 분자를 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공하는 단계; 및 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 상기 이중 가닥 RNA 분자를 포함하지 않는 동일한 니코티아나 식물 세포 또는 식물보다 낮은, 이중 가닥 RNA 분자를 포함하는 니코티아나 식물 세포 또는 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 생산하는 방법을 제공하는 것인데, 이때 상기 이중 가닥 RNA 분자는 2개의 RNA 가닥을 포함하고, 상기 2개의 RNA 가닥 중 하나는 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열 또는 이의 상보체로 본질적으로 구성되고, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 이의 상보체이며, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다. 상기 이중 가닥 RNA는 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입하여 형질전환 식물 세포를 발생시키고, 경우에 따라 상기 형질전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 식물 세포 또는 식물에 제공될 수 있는데, 이때 상기 키메라 유전자는 발현가능한 식물 프로모터, 및 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역에 작동가능하게 연결되어 있으면서 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역을 포함하고, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있으며, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이며, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있으며, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 및/또는 센스 방향으로 포함한다. 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산 또는 뉴클레오티드는 니코티아나 벤싸미아나-특이적 또는 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산 또는 뉴클레오티드일 수 있고, 니코티아나 종 또는 재배종은 바람직하게는 니코티아나 벤싸미아나 또는 니코티아나 타바큠 재배종 페타이트 하바나 SR1일 수 있다. 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열은 서열번호 12 또는 14의 아미노산 서열 또는 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함할 수 있고, 니코티아나 XylT 유전자의 뉴클레오티드 서열은 서열번호 11, 13 또는 21의 뉴클레오티드 서열 또는 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함할 수 있다.
본 발명의 또 다른 목적은 니코티아나 종 또는 재배종으로부터 수득될 수 있는 게놈 DNA 또는 cDNA를 제공하는 단계; 프로브로서 사용되는, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편, 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 DNA 단편, 프로브로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 1513개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드, 프로브로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드, 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드, PCR 반응에서 프라이머로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, PCR 반응에서 프라이머로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, PCR 반응에서 프라이머로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, 및 PCR 반응에서 프라이머로서 사용되는, 서열번호 1, 2, 15, 16, 19 또는 20의 뉴클레오티드 서열을 갖는 올리고뉴클레오티드로 구성된 군으로부터 수단을 선택하는 단계; 및 상기 수단을 사용하여 게놈 DNA 또는 cDNA 및 프라이머를 사용한 PCR을 수행하거나 게놈 DNA 또는 cDNA 및 프로브를 사용한 혼성화를 수행하여 니코티아나 종 또는 재배종으로부터 XylT DNA 단편을 확인하는 단계를 포함하는, 니코티아나 XylT DNA 단편을 확인하는 방법을 제공하는 것이다. 그 후, 확인된 단편을 단리하여 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 수득하는 데 사용할 수 있다.
또한, 본 발명은 니코티아나 종 또는 재배종의 상이한 식물 계통의 집단, 경우에 따라 돌연변이 집단을 제공하는 단계; 전술한 본 발명에 따라 상기 집단의 각 식물 계통에서 니코티아나 XylT 대립유전자를 확인하는 단계; 상기 집단의 각 식물 계통의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 분석하는 단계; 및 식물 계통에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준을 특정한 니코티아나 XylT 대립유전자의 존재와 상호관련시키는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 니코티아나 XylT 대립유전자를 확인하는 방법을 제공한다. 니코티아나 XylT 대립유전자를 선택된 니코티아나 식물 세포 또는 식물 내로 도입하여 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 수득할 수 있다.
본 발명의 또 다른 목적은 서열번호 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 벤싸미아나-특이적 XylT 아미노산을 코딩하는 상기 단편의 임의의 부분; 서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드를 포함하는 상기 DNA 단편의 임의의 부분; 서열번호, 4, 6, 8 또는 10의 아미노산 서열을 포함하는 단백질을 코딩하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산을 코딩하는 상기 DNA 단편의 임의의 부분; 및 서열번호 3, 5, 7, 9 또는 17의 뉴클레오티드 서열을 포함하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드를 포함하는 상기 DNA 단편의 임의의 부분을 제공하는 것이다.
추가로, 본 발명은 하기 작동가능하게 연결된 DNA 단편을 포함하는 키메라 유전자를 제공한다: 발현가능한 식물 프로모터; 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 제1 DNA 영역, 및 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 제2 영역을 포함하는 전사가능한 DNA 영역; 및 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역. 이때, 상기 제1 DNA 영역에서 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이며, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하고, 상기 제2 DNA 영역에서 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이며, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함함으로써, 전사가능한 DNA 영역의 전사에 의해 제조된 RNA 분자가 적어도 제1 DNA 영역에 상응하는 RNA 영역과 제2 DNA 영역에 상응하는 RNA 영역 사이에서의 염기-페어링(base-pairing)을 통해 이중 가닥 RNA 영역을 형성할 수 있다. 상기 키메라 유전자는 발현가능한 식물 프로모터; 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역; 및 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역을 포함할 수도 있는데, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이며, 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 또는 안티센스 방향으로 포함한다.
상기 키메라 유전자를 포함하는 니코티아나 식물 세포, 및 이러한 니코티아나 식물로 본질적으로 구성된 니코티아나 식물뿐만 아니라 이들의 종자도 본 발명에 의해 제공된다.
또한, 본 발명은 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 감소시키기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용도; 또는 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 감소시키거나, 니코티아나 종 또는 재배종에서 XylT 유전자 또는 XylT cDNA를 확인하거나, 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 확인하거나, 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 도입하기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하는 상기 뉴클레티드 서열의 임의의 부분의 용도에 관한 것이다.
전술된 것, 및 이하 명확해질 본 발명의 다른 목적, 이점 및 특징과 함께, 본 발명의 성질은 본 발명의 여러 실시양태에 대한 하기 상세한 설명, 첨부된 청구의 범위 및 도면을 참조함으로써 더욱 명확히 이해될 수 있다.
본 발명은 니코티아나 종 및 재배종, 특히 니코티아나 벤싸미아나 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT 유전자 및 XylT cDNA가 예를 들어, 내인성 니코티아나 XylT 유전자의 활성을 변경시키거나, 내인성 니코티아나 XylT 유전자를, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 낮추는 니코티아나 XylT의 또 다른 대립유전자로 치환하거나, 이들의 임의의 조합 방법을 이용함으로써 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 종 및 재배종, 특히 니코티아나 벤싸미아나 식물 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1 식물을 수득하는 데 매우 우수한 공급원 뉴클레오티드 서열이라는 발견에 기초한 것이다.
한 실시양태에서, 본 발명은 하나 이상의 침묵 RNA 분자를 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공함으로써 니코티아나 식물 세포 또는 식물에서 내인성 XylT 유전자의 발현을 감소시킴으로써 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 수득하는 방법에 관한 것으로서, 이때 상기 침묵 RNA 분자는 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 부분을 포함하고, 이때 상기 부분은 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 상기 침묵 RNA 분자는 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열의 부분을 포함하고, 이때 상기 부분은 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다.
본 명세서에서 사용된 바와 같이, "침묵 RNA" 또는 "침묵 RNA 분자"는 식물 세포 내로의 도입 시 표적 유전자의 발현을 감소시키는 임의의 RNA 분자를 지칭한다. 이러한 침묵 RNA는 예를 들어, 소위 "안티센스 RNA"일 수 있으므로, RNA 분자는 표적 핵산의 서열의 상보체, 바람직하게는 표적 유전자의 코딩 서열과 95% 동일한 서열을 가진 20개 이상의 연속 뉴클레오티드로 구성된 서열을 포함한다. 그러나, 안티센스 RNA는 프로모터 서열, 및 전사 종결 및 폴리아데닐화 신호를 비롯한 표적 유전자의 조절 서열에 대해 유도될 수도 있다. 침묵 RNA는 소위 "센스 RNA"를 추가로 포함함으로서 RNA 분자는 표적 핵산의 서열과 95% 동일한 서열을 가진 20개 이상의 연속 뉴클레오티드로 구성된 서열을 포함한다. 다른 침묵 RNA는 국제특허출원 공개 제WO 01/12824호 및 미국특허 제6,423,885호(이들 문헌 둘다 참고로 본 명세서에 도입됨)에 기재된 것과 같은 표적 핵산의 서열의 상보체와 95% 동일한 서열을 가진 20개 이상의 연속 뉴클레오티드를 포함하는 "폴리아데닐화되지 않은 RNA"일 수 있다. 침묵 RNA의 또 다른 종류는 표적 핵산 또는 이의 상보체의 서열과 95% 동일한 서열을 가진 20개 이상의 연속 뉴클레오티드를 포함하고 국제특허출원 공개 제WO 03/076619호에 기재된 주로-이중 가닥 영역(감자 방추 덩이줄기 비로이드-유형의 비로이드로부터의 핵 편재화(localization) 신호, 또는 CUG 트리뉴클레오티드 반복부를 포함하는 주로-이중 가닥 영역을 포함함)을 추가로 포함하는, 국제특허출원 공개 제WO 03/076619호(참고로 본 명세서에 도입됨)에 기재된 RNA 분자이다. 침묵 RNA는 본 명세서에서 정의된 센스 가닥 및 안티센스 가닥을 포함하는 이중 가닥 RNA일 수도 있는데, 이때 상기 센스 가닥 및 안티센스 가닥은 서로 염기-짝짖기를 하여 이중 가닥 RNA 영역을 형성할 수 있다(바람직하게는, 센스 RNA 및 안티센스 RNA의 상기 20개 이상의 연속 뉴클레오티드가 서로 상보적임). 센스 영역 및 안티센스 영역은 센스 영역 및 안티센스 영역이 이중 가닥 RNA 영역을 형성할 때 헤어핀 RNA(hpRNA)가 형성될 수 있도록 하나의 RNA 분자 내에 존재할 수도 있다. hpRNA는 당업게에 잘 공지되어 있다(예컨대, 참고로 본 명세서에 도입되는 국제특허출원 공개 제WO 99/53050호 참조). 주로 상보적일 수 있지만 완전히 상보적일 필요는 없는 긴 센스 및 안티센스 영역(전형적으로 약 200 bp보다 큼, 구체적으로 200 bp 내지 1000 bp)을 가진 긴 hpRNA로서 분류될 수 있다. hpRNA는 약 30 내지 약 42 bp의 다소 작지만 94 bp보다는 훨씬 더 길지 않은 길이를 가질 수도 있다(참고로 본 명세서에 도입되는 국제특허출원 공개 제WO 04/073390호 참조). 침묵 RNA는 예를 들어, 국제특허출원 공개 제WO 05/052170호 또는 제WO 05/047505호, 또는 미국특허 공개 제2005/0144667호에 기재된 인공 마이크로-RNA 분자일 수도 있다(상기 문헌들은 모두 참고로 본 명세서에 도입됨).
또 다른 실시양태에서, 침묵 RNA 분자는 침묵 RNA 분자, 특히 이중 가닥 RNA("dsRNA") 분자를 생성할 수 있는 키메라 유전자를 포함하는 니코티아나 종 또는 재배종의 형질전환 식물 세포 또는 식물을 생산함으로써 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되는데, 이때 이러한 dsRNA 분자의 상보적 RNA 가닥은 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 부분을 포함하고, 이때 상기 부분은 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 상기 dsRNA 분자의 상보적 RNA 가닥은 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열의 부분을 포함하고, 이때 상기 부분은 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다.
본 명세서에서 사용된 "니코티아나"는 공지되어 있는 모든 니코티아나 종, 예컨대, 니코티아나 아카울리스(Nicotiana acaulis), 니코티아나 아큐미나타(Nicotiana acuminata), 니코티아나 아프리카나(Nicotiana africana), 니코티아나 알라타(Nicotiana alata), 니코티아나 앰플렉시카울리스(Nicotiana amplexicaulis), 니코티아나 아렌트시이(Nicotiana arentsii), 니코티아나 아테뉴아타(Nicotiana attenuata), 니코티아나 베나비데시이(Nicotiana benavidesii), 니코티아나 벤싸미아나, 니코티아나 비겔로비이(Nicotiana bigelovii), 니코티아나 보나리엔시스(Nicotiana bonariensis), 니코티아나 카비콜라(Nicotiana cavicola), 니코티아나 클레블랜디이(Nicotiana clevelandii), 니코티아나 코르디폴리아(Nicotiana cordifolia), 니코티아나 코림보사(Nicotiana corymbosa), 니코티아나 데브네이이(Nicotiana debneyi), 니코티아나 엑셀시오르(Nicotiana excelsior), 니코티아나 포겟티아나(Nicotiana forgetiana), 니코티아나 프라그란스(Nicotiana fragrans), 니코티아나 글라우카(Nicotiana glauca), 니코티아나 글루티노사(Nicotiana glutinosa), 니코티아나 굿스피디이(Nicotiana goodspeedii), 니코티아나 고세이(Nicotiana gossei), 니코티아나 하이브리드(Nicotiana hybrid), 니코티아나 인걸바(Nicotiana ingulba), 니코티아나 카와카미이(Nicotiana kawakamii), 니코티아나 나이티아나(Nicotiana knightiana), 니코티아나 랭스도르프피이(Nicotiana langsdorffii), 니코티아나 리니어리스(Nicotiana linearis), 니코티아나 롱기플로라(Nicotiana longiflora), 니코티아나 마라티마(Nicotiana maritima), 니코티아나 메갈로시폰(Nicotiana megalosiphon), 니코티아나 미에르시이(Nicotiana miersii), 니코티아나 녹티플로라(Nicotiana noctiflora), 니코티아나 누디카울리스(Nicotiana nudicaulis), 니코티아나 오브투시폴리아(Nicotiana obtusifolia), 니코티아나 옥시덴탈리스(Nicotiana occidentalis), 니코티아나 옥토포라(Nicotiana otophora), 니코티아나 패니쿨라타(Nicotiana paniculata), 니코티아나 파우치플로라(Nicotiana pauciflora), 니코티아나 페투니오이데스(Nicotiana petunioides), 니코티아나 플럼바기니폴리아(Nicotiana plumbaginifolia), 니코티아나 쿠아드리발비스(Nicotiana quadrivalvis), 니코티아나 라이몬디이(Nicotiana raimondii), 니코티아나 레판다(Nicotiana repanda), 니코티아나 로설라타(Nicotiana rosulata), 니코티아나 로툰디폴리아(Nicotiana rotundifolia), 니코티아나 루스티카(Nicotiana rustica), 니코티아나 셋첼리이(Nicotiana setchellii), 니코티아나 시뮬란스(Nicotiana simulans), 니코티아나 솔라니폴리아(Nicotiana solanifolia), 니코티아나 스페가즈지니이(Nicotiana spegazzinii), 니코티아나 스톡토니이(Nicotiana stocktonii), 니코티아나 수아베올렌스(Nicotiana suaveolens), 니코티아나 실베스트리스(Nicotiana sylvestris), 니코티아나 타바큠(Nicotiana tabacum), 니코티아나 싸이르시플로라(Nicotiana thyrsiflora), 니코티아나 토멘토사(Nicotiana tomentosa), 니코티아나 토멘토시포르미스(Nicotiana tomentosiformis), 니코티아나 트리고노필라(Nicotiana trigonophylla), 니코티아나 움브라티카(Nicotiana umbratica), 니코티아나 운둘라타(Nicotiana undulata), 니코티아나 벨루티나(Nicotiana velutina), 니코티아나 위간디오이데스(Nicotiana wigandioides) 및 니코티아나 x 산데라(Nicotiana x sandera), 및 공지되어 있는 모든 니코티아나 재배종, 예컨대, 니코티아나 타바큠의 재배종, 예컨대, 재배종 버레이21(Burley21), 재배종 델골드(Delgold), 재배종 페타이트 하바나, 재배종 페타이트 하바나 SR1, 재배종 삼선(Samsun) 및 재배종 잔티(Xanthi)를 포함하나, 이들로 한정되지 않는다.
일반 담배인 니코티아나 타바큠은 이배수체 종 니코티아나 실베스트리스 및 니코티아나 토멘토시포르미스로부터 유래된 사배수체 혼성 종이다.
니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA는 니코티아나 종 또는 재배종에서 천연적으로 발생하는 XylT 유전자의 뉴클레오티드 서열, 또는 니코티아나 종 또는 재배종에서 천연적으로 발생하는 XylT 유전자의 mRNA에 상응하는 cDNA를 지칭한다. 유사하게, 니코티아나 XylT 단백질은 니코티아나 종 또는 재배종에서 천연적으로 발생하는 단백질을 지칭한다.
니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 예로는 서열번호 12 또는 14에 기재된 아미노산 서열을 코딩하는, 니코티아나 벤싸미아나로부터 수득된 뉴클레오티드 서열, 및 서열번호 4, 6, 8 또는 10에 기재된 아미노산 서열을 코딩하는, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 수득된 뉴클레오티드 서열을 들 수 있다.
니코티아나 XylT 유전자의 뉴클레오티드 서열의 예로는 서열번호 11, 13 또는 21에 기재된 뉴클레오티드 서열을 포함하는, 니코티아나 벤싸미아나로부터 수득된 뉴클레오티드 서열, 및 서열번호 7 또는 9에 기재된 뉴클레오티드 서열을 포함하는, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 수득된 뉴클레오티드 서열을 들 수 있다.
니코티아나 XylT cDNA의 뉴클레오티드 서열의 예로는 서열번호 3, 5 또는 17에 기재된 뉴클레오티드 서열을 포함하는, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 수득된 뉴클레오티드 서열을 들 수 있다.
그러나, 예시된 뉴클레오티드 서열 또는 이의 부분이 니코티아나 종 또는 재배종에서 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 추가 뉴클레오티드 서열을 확인하는 데 사용될 수 있고, 이러한 뉴클레오티드 서열 또는 이의 부분이 예를 들어, 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스의 수준을 감소시키는 데 사용될 수도 있음이 당업자에게 즉시 명백할 것이다. 예시된 뉴클레오티드 서열은 i) 프로브로서 사용되는, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편; ii) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 DNA 단편; iii) 프로브로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 1513개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드; iv) 프로브로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드; v) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드; vi) PCR 반응에서 프라이머로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열; vii) PCR 반응에서 프라이머로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열; viii) PCR 반응에서 프라이머로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열; 또는 ix) PCR 반응에서 프라이머로서 사용되는, 서열번호 1, 2, 15, 16, 19 또는 20의 뉴클레오티드 서열을 가진 올리고뉴클레오티드를 선택하는 데 사용될 수 있다. 니코티아나 종 또는 재배종으로부터 단리된 게놈 DNA 또는 cDNA 및 프라이머로서의 전술한 올리고뉴클레오티드를 사용하여 PCR을 수행하거나, 니코티아나 종 또는 재배종으로부터 단리된 게놈 DNA 또는 cDNA와 전술한 프로브 사이의 혼성화를 바람직하게는 엄격한 조건 하에서 수행함으로써, 다른 티코티아나 XylT 유전자 또는 니코티아나 XylT cDNA 또는 이들의 단편을 확인하고/하거나 단리할 수 있다.
본 명세서에서 사용된 "엄격한 혼성화 조건"은 프로브와 표적 서열 사이에 95% 이상, 바람직하게는 97% 이상의 서열 동일성이 있는 경우 혼성화가 일반적으로 일어난다는 것을 의미한다. 엄격한 혼성화 조건의 예는 50% 포름아미드, 5 x SSC(150 mM NaCl, 15 mM 트리소듐 시트레이트), 50 mM 인산나트륨(pH 7.6), 5x 덴하츠(Denhardt) 용액, 10% 덱스트란 설페이트 및 20 ㎍/㎖의 전단된 변형 운반체 DNA 예컨대, 연어 정자 DNA를 포함하는 용액 중에서 밤새 항온처리한 후 약 65℃의 0.1 x SSC 중에서 예컨대, 약 10분 동안 혼성화 지지체를 (2회) 세척하는 것이다. 다른 혼성화 및 세척 조건은 잘 공지되어 있고 문헌(Sambrook et al, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor, NY (1989)), 특히 상기 문헌의 11장에 예시되어 있다.
"니코티아나 종-특이적 XylT 뉴클레오티드" 또는 "니코티아나 재배종-특이적 XylT 뉴클레오티드"는 서열번호 25에 기재된, 니코티아나 타바큠 재배종 잔티로부터 단리된 XylT 유전자, 또는 서열번호 23에 기재된, 니코티아나 타바큠 재배종 잔티 단리된 XylT cDNA의 상응하는 뉴클레오티드 서열과 상이하거나 상기 상응하는 뉴클레오티드 서열에 존재하지 않는, 니코티아나 종 또는 재배종으로부터 단리된 XylT 유전자 또는 XylT cDNA의 뉴클레오티드 서열의 뉴클레오티드를 지칭한다.
"니코티아나 종-특이적 XylT 아미노산" 또는 "니코티아나 재배종-특이적 XylT 아미노산"은 서열번호 26에 기재된, 니코티아나 타바큠 재배종 잔티로부터 단리된 XylT 유전자, 또는 서열번호 24에 기재된, 니코티아나 타바큠 재배종 잔티로부터 단리된 XylT cDNA에 의해 코딩된 XylT 단백질의 상응하는 아미노산 서열과 상이하거나 상기 상응하는 아미노산 서열에 존재하지 않는, 니코티아나 종 또는 재배종으로부터 단리된 XylT 유전자 또는 XylT cDNA에 의해 코딩된 XylT 단백질의 아미노산 서열의 아미노산을 지칭한다.
본 발명의 목적을 위해, 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드 또는 아미노산이 니코티아나 종 또는 재배종으로부터 단리된 XylT 유전자 또는 XylT cDNA의 뉴클레오티드 서열, 또는 니코티아나 종 또는 재배종으로부터 단리된 XylT 유전자 또는 XylT cDNA에 의해 코딩된 XylT 단백질의 아미노산 서열에 존재하는 지를 확인하기 위해, 전체적인 정렬 방법을 이용하여 서열을 정렬함으로써 니코티아나 종 또는 재배종으로부터의 XylT 뉴클레오티드 또는 아미노산 서열을 니코티아나 타바큠 재배종 잔티로부터의 상응하는 XylT 뉴클레오티드 또는 아미노산 서열과 비교한다(뉴클레오티드 서열의 경우, 사용된 디폴트 스코어링 매트릭스는 불일치 패널티 = 2, 개방 갭 패널티 = 4 및 연장 갭 패널티 = 1인 "표준 선형"이다. 단백질 서열의 경우, 디폴트 스코어링 매트릭스는 "블로섬62"이다; 문헌(Henikoff and Henikoff, 1992)). 정렬을 수행하기 위해, 얼라인 플러스(Align Plus) 프로그램(미국 소재의 사이언티픽 & 에쥬케이셔널 소프트웨어(Scientific & Educational Software)에 의해 제공됨)을 사용할 수 있다.
이러한 전체적인 DNA 정렬의 한 예는 도 1a 내지 1c에 나타낸 바와 같은, 서열번호 23에 기재된 니코티아나 타바큠 재배종 잔티로부터의 XylT cDNA 서열과, 서열번호 3 및 5에 기재된 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 XylT cDNA 서열의 전체적인 DNA 정렬이다. 이 전체적인 DNA 정렬을 기초로 하여 확인된 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드의 예로는 하기 뉴클레오티드를 들 수 있다:
- 서열번호 3의 위치 1041, 1323, 1332 또는 1421번에 있는 뉴클레오티드, 및
- 서열번호 5의 위치 62, 76, 87, 104, 117, 122, 139, 140, 148, 155, 169, 190, 199, 202, 212, 213, 216, 265, 287, 294, 316, 373, 385, 388, 430, 554, 607, 628, 643, 838, 892, 897, 898, 941, 1005, 1021, 1039 또는 1495번에 있는 뉴클레오티드.
이러한 전체적인 DNA 정렬의 또 다른 예는 도 3a 내지 3l에 나타낸 바와 같은, 서열번호 25에 기재된 니코티아나 타바큠 재배종 잔티로부터의 XylT 유전자 서열과, 서열번호 7 및 9에 기재된 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 XylT 유전자 서열 및 서열번호 11 및 13에 기재된 니코티아나 벤싸미아나로부터의 XylT 유전자 서열의 전체적인 DNA 정렬이다. 이 전체적인 DNA 정렬을 기초로 하여 확인된 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드의 예로는 하기 뉴클레오티드를 들 수 있다:
- 서열번호 7의 위치 61, 75, 86, 100-120, 124, 137, 142, 159, 160, 168, 175, 189, 210, 219, 222, 232, 233, 236, 285, 307, 314, 336, 393, 405, 408, 450, 574, 627, 648, 663, 692, 698, 702, 721, 754, 802, 821, 842, 852, 856, 901, 903, 906, 907, 908, 917, 927, 928, 930, 931, 960, 961, 965, 974, 977, 981, 983, 986, 1001, 1019, 1027, 1029, 1034, 1068, 1073, 1099, 1120, 1129, 1144, 1154, 1158, 1181, 1193, 1208, 1212, 1228, 1230, 1239, 1275, 1313-1316, 1348, 1353, 1357, 1384, 1386, 1496, 1531, 1571, 1601, 1629, 1681, 1696, 1698, 1730, 1754, 1761, 1772, 1789, 1800, 1802, 1811, 1814, 1815, 1855-1861, 1929, 2172, 2190, 2322, 2324, 2328, 2353, 2354, 2391, 2404, 2419, 2428, 2429, 2433, 2434, 2459, 2464, 2478, 2479, 2481, 2484, 2512, 2540-2590, 2595, 2604, 2606, 2630, 2633, 2638, 2670, 2673, 2680, 2695, 2698, 2710, 2711, 2752, 2806, 2811, 2812, 2855, 2919, 2953, 2966, 3217, 3226, 3229 또는 3232번에 있는 뉴클레오티드, 및
- 서열번호 9의 위치 553, 606, 627, 642, 671, 677, 681, 700, 733, 781, 800, 821, 831, 835, 880, 882, 885, 886, 887, 896, 906, 907, 909, 910, 939, 940, 944, 953, 956, 960, 962, 965, 980, 998, 1006, 1008, 1013, 1047, 1052, 1078, 1099, 1108, 1123, 1133, 1137, 1160, 1172, 1187, 1191, 1207, 1209, 1218, 1254, 1292, 1293, 1294, 1295, 1327, 1332, 1336, 1363, 1365, 1475, 1510, 1550, 1580, 1608, 1660, 1675, 1677, 1709, 1733, 1740, 1751, 1768, 1779, 1781, 1790, 1793, 1794, 1834-1840, 1908, 2151, 2169, 2301, 2303, 2307, 2332, 2333, 2370, 2383, 2398, 2407, 2408, 2412, 2413, 2438, 2443, 2457, 2458, 2460, 2463, 2491, 2519-2569, 2574, 2583, 2585, 2609, 2612, 2617, 2649, 2652, 2659, 2674, 2677, 2689, 2690, 2731, 2785, 2790, 2791, 2834, 2898, 2932, 2945, 3196 또는 3205번에 있는 뉴클레오티드.
이 전체적인 DNA 정렬을 기초로 하여 확인된 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드의 예로는 하기 뉴클레오티드를 들 수 있다:
- 서열번호 11의 위치 71, 72, 75, 77, 86, 90, 104, 116, 147, 158, 212, 222, 246, 264, 286, 317, 321, 345, 402, 472, 479, 488, 526, 552, 612, 637, 668, 669, 670, 701, 726, 734, 742, 747, 773, 785, 795, 796, 802, 831, 871, 872, 874, 888, 897, 898, 899, 901, 902, 927, 931, 932, 1039, 1044, 1047, 1080, 1091, 1103, 1104, 1113, 1118, 1131, 1134, 1145, 1152, 1164, 1179, 1183, 1199, 1201, 1206, 1227, 1286, 1287, 1288, 1289, 1296, 1301, 1317, 1328, 1332, 1347, 1376, 1388, 1424, 1429, 1458, 1464, 1510, 1517, 1534, 1559, 1672, 1675, 1676, 1677, 1693, 1705, 1719, 1750, 1757, 1761, 1765, 1832, 1838, 1862, 1872, 1877, 1978, 2010, 2074, 2111, 21 15, 2227, 2251, 2259, 2271, 2283, 2296, 2297, 2341, 2348, 2361, 2370, 2371, 2375, 2384, 2401, 2404, 2406, 2495, 2497, 2521, 2529, 2561, 2607, 2701, 2777, 2822, 2843, 2856, 2867, 3020, 3052, 3053, 3116, 3143 또는 3227에 있는 뉴클레오티드, 및
- 서열번호 13의 위치 77, 107, 203, 297, 312, 399, 449, 469, 489, 492, 496, 529, 538, 566, 573, 633, 661, 662, 666, 671, 683, 690, 699, 723, 763, 774, 784, 785, 791, 861, 877, 886, 887, 888, 890, 891, 920, 921, 943, 996, 1015, 1034, 1116, 1190, 1226, 1277-1280, 1282, 1287, 1331, 1343, 1360, 1386-1651, 1672, 1689, 1738, 1770, 1791, 1813, 1820, 1822, 1831, 1832, 1862, 1869, 1874, 1882, 1893, 1906, 1935, 1945, 1956, 1988, 2007, 2033, 2034, 2045, 2049, 2050, 2167, 2198, 2280, 2299, 2315, 2355, 2392, 2413, 2428, 2442, 2464, 2468, 2477, 2493, 2522, 2544, 2548, 2573, 2574, 2639, 2648, 2649, 2653, 2655, 2659, 2679, 2684, 2740, 2773, 2775, 2781, 2796, 2799, 2807, 2816, 2839, 2857, 2975, 2977, 2990, 3053, 3071, 3083, 3119, 3132, 3265, 3311 또는 3392번에 있는 뉴클레오티드.
이러한 전체적인 단백질 정렬의 한 예는 도 2에 나타낸 바와 같이, 서열번호 24에 기재된 니코티아나 타바큠 재배종 잔티로부터의 XylT cDNA 서열에 의해 코딩된 XylT 단백질 서열과, 서열번호 4 및 6에 기재된 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 XylT cDNA 서열에 의해 코딩된 XylT 단백질 서열의 전체적인 단백질 정렬이다. 이 전체적인 단백질 정렬을 기초로 하여 확인된 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산의 예로는 하기 아미노산을 들 수 있다:
- 서열번호 4의 위치 472 또는 502번에 있는 아미노산, 및
- 서열번호 6의 위치 20, 28, 38, 40, 46, 51, 70, 71, 95, 97, 184, 213, 298, 313, 334 또는 497번에 있는 아미노산.
이러한 전체적인 단백질 정렬의 또 다른 예는 도 4a 내지 4b에 나타낸 바와 같이, 서열번호 26에 기재된 니코티아나 타바큠 재배종 잔티로부터의 XylT 유전자 서열에 의해 코딩된 XylT 단백질 서열과, 서열번호 8 및 10에 기재된 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 XylT 유전자 서열에 의해 코딩된 XylT 단백질 서열, 및 서열번호 12 및 14에 기재된 니코티아나 벤싸미아나로부터의 XylT 유전자 서열에 의해 코딩된 XylT 단백질 서열의 전체적인 단백질 정렬이다. 이 전체적인 단백질 정렬을 기초로 하여 확인된 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산의 예로는 하기 아미노산을 들 수 있다:
- 서열번호 8의 위치 19, 27, 32-38, 44, 46, 52, 57, 76, 77, 101, 103, 190, 219, 304, 319, 340 또는 356번에 있는 아미노산, 및
- 서열번호 10의 위치 183, 212, 297, 312, 333 또는 349번에 있는 아미노산.
이 전체적인 단백질 정렬을 기초로 하여 확인된 니코티아나 벤싸미아나-특이적 XylT 아미노산의 예로는 하기 아미노산을 들 수 있다:
- 서열번호 12의 위치 22, 24, 27, 33, 37, 51, 69, 94, 104, 156, 158, 161, 174, 182, 211, 238, 297, 349 또는 414번에 있는 아미노산, 및
- 서열번호 14의 위치 1, 26, 36, 68, 99, 133, 150, 157, 166, 180, 189, 211, 218, 245, 257, 296, 327, 348 또는 392번에 있는 아미노산.
침묵 RNA 분자, 구체적으로 이중 가닥 RNA 분자의 한 가닥 내에 포함되어 있는, 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 부분, 및 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열의 부분은 19개 이상의 뉴클레오티드 길이를 가져야 하지만, 약 19개 뉴클레오티드 길이 내지 니코티아나 XylT 단백질-코딩 서열 또는 니코티아나 XylT 유전자 또는 cDNA 서열의 길이(뉴클레오티드 길이)와 동일한 길이를 가질 수 있다. 따라서, 센스 또는 안티센스 뉴클레오티드 서열의 총 길이는 25개 이상, 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상 또는 약 500개 이상의 뉴클레오티드 길이일 수 있다. 센스 또는 안티센스 뉴클레오티드 서열의 총 길이에 대한 상한은 없는 것으로 예측된다. 그러나, 실용적 면에서(예컨대, 키메라 유전자의 안정성 면에서), 센스 또는 안티센스 뉴클레오티드 서열의 길이는 5000개 뉴클레오티드 길이를 초과하지 않아야 하며, 구체적으로 2500개 뉴클레오티드 길이를 초과하지 않아야 하고 약 1000개 뉴클레오티드 길이로 한정될 수 있는 것으로 예측된다.
니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 부분 또는 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA(센스 또는 안티센스 영역)의 뉴클레오티드 서열의 부분의 총 길이가 길수록 상기 부분과, 이 부분의 상보체인 니코티아나 종 또는 재배종으로부터의 내인성 XylT 유전자 내의 상응하는 영역 사이의 서열 동일성에 대한 요건이 덜 엄격해질 것임을 인식할 것이다. 바람직하게는, 원하는 핵산의 서열은 상응하는 표적 서열과 약 75% 이상의 서열 동일성을 가져야 하고, 구체적으로 표적 서열 또는 이의 상보체의 상응하는 부분과 약 80% 이상, 보다 구체적으로 약 85% 이상, 특히 구체적으로 약 90%, 특히 약 95%, 보다 특히 약 100%의 서열 동일성을 가져야 해야 한다. 그러나, 원하는 핵산은 표적 XylT 핵산의 상응하는 부분과 100%의 서열 동일성을 갖는 약 19개 연속 뉴클레오티드, 구체적으로 약 25개 연속 뉴클레오티드, 보다 구체적으로 약 50개 연속 뉴클레오티드, 특히 약 100개 연속 뉴클레오티드, 매우 특히 약 150개 연속 뉴클레오티드로 구성된 서열을 항상 포함하며, 이때 상기 약 19개 연속 뉴클레오티드, 구체적으로 약 25개 연속 뉴클레오티드, 보다 구체적으로 약 50개 연속 뉴클레오티드, 특히 약 100개 연속 뉴클레오티드, 매우 특히 약 150개 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 것이 바람직하다.
본 발명의 목적상, %로서 표시되는, 2개의 관련 뉴클레오티드 또는 아미노산 서열의 "서열 동일성"은 최적으로 정렬된 2개의 서열에서 동일한 잔기를 가진 위치의 수를 비교되는 위치의 수로 나누고 100을 곱한 값을 지칭한다. 갭, 즉 정렬에 있어서 하나의 서열에는 존재하나 다른 서열에는 존재하지 않는 잔기의 위치는 동일하지 않은 잔기를 가진 위치로서 간주된다. 바람직하게는, 서열 동일성을 계산하고 상응하는 센스 또는 안티센스 서열을 디자인하기 위해, 특히 보다 짧은 센스 서열의 경우 갭의 수가 최소화되어야 한다.
RNA 분자의 뉴클레오티드 서열이 상응하는 DNA 분자의 뉴클레오티드 서열과 관련하여 정의될 때 뉴클레오티드 서열 내의 타이민(T)은 우라실(U)로 대체되어야 한다는 것은 분명할 것이다. RNA 분자에 대한 언급인지 아니면 DNA 분자에 대한 언급인지는 본원의 내용으로부터 분명해질 것이다.
특정한 표적 유전자를 침묵시키는 데 필요한 최소한의 요건은 표적 유전자 서열에 상응하는 약 20 또는 21개의 연속 뉴클레오티드 길이를 가진 뉴클레오티드 서열이 침묵 키메라 유전자 뉴클레오티드 서열 내에 존재하는 것이고, 이때 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 상응하는 표적 유전자 서열과 동일하다는 것이 입증되어 있다. 본 명세서에서 사용된 용어 "20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드"는 하나의 불일치 뉴클레오티드를 가진 표적 유전자로부터 선택된 20개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 지칭한다.
니코티아나 종 또는 재배종의 내인성 XylT 유전자를 침묵시키기 위해서는, 침묵 키메라 유전자 뉴클레오티드 서열이 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 유래된 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하고, 이때 상기 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 유래된 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하고, 이때 상기 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 것이 바람직하다.
본 명세서에서 사용된 "단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물"은 XylT 활성이 감소되어 있거나 제거되어 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 본 발명의 방법에 따라 처리되지 않은 대조군 니코티아나 식물에서의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준보다 낮거나 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기가 존재하지 않는다. XylT 활성의 표시는 본 발명의 방법에 따라 수득된 니코티아나 식물로부터 수득된 단백질의 글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준을 본 발명의 방법에 따라 처리되지 않은 대조군 니코티아나 식물로부터 수득된 단백질의 글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준과 비교함으로써 얻을 수 있다. 식물의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준은 예컨대, 문헌(Faye et al., Analytical Biochemistry, 1993, 209: 104-108)에 기재된 바와 같이 크실로스-특이적 항체를 사용한 웨스턴 블롯 분석을 수행하여 측정하거나, 예컨대, 문헌(Kolarich and Altmann, 2000, Anal. Biochem. 285: 64-75)에 기재된 바와 같이 매트릭스-보조 레이저 탈착/이온화 비행시간형(Time-of-Flight) 질량 분광분석(MALDI-TOF-MS)을 이용하거나 예컨대, 문헌(Henriksson et al. (2003, Biochem. J. 375: 61-73)에 기재된 바와 같이 액체 크로마토그래피 탠덤 질량 분광분석(LC/MS/MS)을 이용하여 식물의 당단백질로부터 단리된 글리칸에 대한 질량 분광측정을 수행함으로써 측정할 수 있다.
본 발명에 따른 니코티아나 XylT 발현 감소 키메라 유전자를 코딩하는 dsRNA는 예컨대, 국제특허출원 공개 제WO 99/53050호(참고로 본 명세서에 도입됨)의 개시내용에 따라 센스 RNA 영역과 안티센스 RNA 영역 사이의 스페이서 서열에 위치된 인트론 예컨대, 이종 인트론을 포함할 수 있다.
이중 가닥 RNA 분자 예컨대, 전술한 이중 가닥 RNA 분자는 식물 세포 내에서 상응하는 mRNA의 축퇴에 있어서 가이드(guide) 서열로서 작용하는 약 20 또는 21개의 뉴클레오티드로 구성된 작은 RNA 단편으로 절단된다는 것은 분명하다(문헌(Baulcombe, 2004) 참조). 따라서, 또 다른 실시양태에서, 본 발명은 a) 하나 이상의 이중 가닥 RNA 분자를 니코티아나 종 또는 재배종의 식물 세포에 제공하는 단계; 및 b) 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 이중 가닥 RNA 분자를 포함하지 않는 동일한 니코티아나 식물보다 낮은, 상기 이중 가닥 RNA 분자를 포함하는 니코티아나 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 생산하는 방법에 관한 것인데, 이때 상기 이중 가닥 RNA 분자는 2개의 RNA 가닥을 포함하고, 상기 2개의 RNA 가닥 중 한 RNA 가닥은 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열로 본질적으로 구성되되, 상기 20 또는 21개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 또는 한 RNA 가닥은 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열로 본질적으로 구성되되, 상기 20 또는 21개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다.
상기 20 또는 21개 뉴클레오티드 길이의 dsRNA 서열은 통상적인 안티센스 RNA 매개 침묵 또는 센스 RNA 매개 침묵의 과정에서도 생성된다. 따라서, 본 발명의 또 다른 실시양태에서, 작동가능하게 연결된 하기 DNA 단편을 포함하는 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포에 제공하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 생산하는 방법이 제공된다:
a) 발현가능한 식물 프로모터;
b) 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개 이상의 연속 뉴클레오티드를 포함하거나 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택된 20개 이상의 연속 뉴클레오티드를 포함하는 DNA 영역으로서, 이때 상기 20개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 상기 20개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 안티센스 또는 센스 방향으로 포함하는, DNA 영역; 및
c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
따라서, 상기 안티센스 또는 센스 뉴클레오티드 영역은 약 21 내지 약 5000개 뉴클레오티드 길이, 예컨대, 21, 40, 50, 100, 200, 300, 500, 1000 또는 심지어 약 2000개 뉴클레오티드 길이 또는 이보다 더 긴 길이를 가질 수 있다. 더욱이, 사용된 억제 XylT 유전자 분자의 뉴클레오티드 서열 또는 키메라 유전자의 코딩 영역이 니코티아나 식물 세포에서 그 발현을 감소시키고자 하는 내인성 니코티아나 XylT 유전자와 완전히 동일하거나 상보적일 것이 본 발명의 목적상 요구되지는 않는다. 서열이 길수록 총 서열 동일성에 대한 요건이 덜 엄격해진다. 따라서, 센스 또는 안티센스 영역은 내인성 니코티아나 유전자의 뉴클레오티드 서열 또는 이의 상보체와 약 40, 50, 60, 70, 80, 90 또는 100%의 총 서열 동일성을 가질 수 있다. 그러나, 전술한 바와 같이, 안티센스 또는 센스 영역은 바람직하게는 XylT 유전자의 뉴클레오티드 서열과 약 100%의 서열 동일성을 가진 19 또는 20개 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함해야 하는데, 이때 상기 19 또는 20개 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다. 서열 동일성이 약 100%인 스트레취(stretch)는 약 50, 75 또는 100개 뉴클레오티드 길이를 가질 수 있다.
전술한 키메라 유전자가 전사된 경우 안티센스 또는 센스 침묵 RNA를 생성하는 상기 키메라 유전자의 효율은 비정상적인 폴리아데닐화되지 않은 XylT 억제 RNA 분자를 발현시키는 DNA 요소의 도입에 의해 더 상승될 수 있다. 이 목적에 적합한 이러한 DNA 요소 중 하나는 국제특허출원 공개 제WO 00/01133호에 기재된 바와 같은, 자가-스플라이싱 리보자임을 코딩하는 DNA 영역이다. 상기 효율은, 국제특허출원 공개 제WO 03/076619호에 기재된 바와 같이, 생성된 RNA 분자에 핵 편재화 또는 보유 신호를 구비시킴에 의해 상승될 수도 있다.
니코티아나 벤싸미아나 및 니코티아나 타바큠으로부터의 예시된 XylT 뉴클레오티드 서열은 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 니코티아나 종 또는 재배종의 식물 집단에서 확인하는 데 사용될 수도 있다. 이러한 니코티아나 종 또는 재배종의 식물 집단은 이미 돌연변이를 가진 집단일 수 있다. 이어서, 확인된 XylT 대립유전자를 통상적인 재배 기법을 이용하여, 선택된 니코티아나 종 또는 재배종의 식물 계통 내로 도입할 수 있다.
니코티아나 식물을 형질전환시키는 방법도 당업계에 잘 공지되어 있다. 니코티아나의 아그로박테리움-매개 형질전환은 예를 들어, 문헌(Zambryski et al. (1983, EMBO J. 2: 2143-2150)), 문헌(De Block et al. (1984, EMBO J. 3(8): 1681-1689)) 또는 문헌(Horsch et al. (Science (1985) 227: 1229-1231))에 기재되어 있다.
본래의 XylT 대립유전자보다 낮은 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준과 상호관련되어 있는 XylT 대립유전자로 내인성 XylT 유전자를 치환시켜 수득한, 본 발명에 따른 형질전환 니코티아나 식물 또는 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물을 통상적인 재배 기법에서 사용함으로써 동일한 특징을 가진 보다 많은 식물을 발생시키거나 본 발명의 키메라 유전자를 동일한 또는 관련된 식물 종의 다른 재배종 또는 혼성 식물 내에 도입할 수 있다. 형질전환 식물로부터 수득된 종자는 안정한 게놈 삽입물로서 본 발명의 키메라 유전자를 함유하고 본 발명에 포함된다.
나아가, 안티센스, 센스 또는 이중 가닥 RNA 또는 코딩 키메라 유전자의 도입은 표현형의 분포가 표적 유전자 발현 억제가 거의 없거나 극히 약한 표현형부터 표적 유전자 발현 억제가 매우 강하거나 심지어 100%인 표현형까지 다양하게 할 수 있다. 그러나, 당업자라면 원하는 정도의 침묵 표현형 및 원하는 표현형을 이끌어 내는 식물 세포, 식물, 이벤트(event) 또는 식물 계통을 선별할 수 있을 것이다.
본 명세서에서 사용된 "포함하는"은 언급된 특징, 정수, 단계 또는 성분의 존재를 특정하는 것으로서 해석되어야 하는 것이지 하나 이상의 특징, 정수, 단계 또는 성분, 또는 이들의 군의 존재 또는 추가를 배제하는 것은 아니다. 따라서, 예를 들어, 뉴클레오티드 또는 아미노산 서열을 포함하는 핵산 또는 단백질은 실제로 언급된 뉴클레오티드 또는 아미노산보다 더 많은 뉴클레오티드 또는 아미노산을 포함할 수 있다, 즉 보다 큰 핵산 또는 단백질 내에 포함되어 있을 수 있다. 기능적으로 또는 구조적으로 정의된 DNA 영역을 포함하는 키메라 유전자는 추가 DNA 영역 등을 포함할 수 있다.
하기 비-제한적 실시예에는 니코티아나 종, 특히 니코티아나 벤싸미아나, 및 니코티아나 재배종, 특히 니코티아나 타바큠 재배종 페타이트 하바나 SR1에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 변경시키기 위한 키메라 유전자 및 이들의 용도가 기재되어 있다. 실시예에서 달리 명시되어 있지 않은 한, 모든 재조합 DNA 기법은 문헌(Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, NY and in Volumes 1 and 2 of Ausubel et al. (1994) Current Protocols in Molecular Biology, Current Protocols, USA)에 기재된 표준 프로토콜에 따라 수행된다. 분자 수준에서의 식물 연구를 위한 표준 재료 및 방법은 문헌(Plant Molecular Biology Labfax (1993) by R.D.D. Croy, jointly published by BIOS Scientific Publications Ltd (UK) and Blackwell Scientific Publications, UK)에 기재되어 있다.
상세한 설명 및 실시예 전체에 걸쳐 서열목록에 기재된 하기 서열들이 언급되어 있다:
서열번호 1 : 니코티아나 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylF4의 뉴클레오티드 서열.
서열번호 2: 니코티아나 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylR4의 뉴클레오티드 서열.
서열번호 3: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 1의 부분 cDNA 서열.
서열번호 4: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 단백질 변이체 1의 부분 아미노산 서열.
서열번호 5: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 2의 부분 cDNA 서열.
서열번호 6: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 단백질 변이체 2의 부분 아미노산 서열.
서열번호 7: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 1의 부분 뉴클레오티드 서열.
서열번호 8: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 단백질 변이체 1의 부분 아미노산 서열.
서열번호 9: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 2의 부분 뉴클레오티드 서열.
서열번호 10: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 단백질 변이체 2의 부분 아미노산 서열.
서열번호 11: 니코티아나 벤싸미아나 XylT 유전자 변이체 1의 부분 뉴클레오티드 서열.
서열번호 12: 니코티아나 벤싸미아나 XylT 단백질 변이체 1의 부분 아미노산 서열.
서열번호 13: 니코티아나 벤싸미아나 XylT 유전자 변이체 2의 부분 뉴클레오티드 서열.
서열번호 14: 니코티아나 벤싸미아나 XylT 단백질 변이체 2의 부분 아미노산 서열.
서열번호 15: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylF8의 뉴클레오티드 서열.
서열번호 16: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylR8의 뉴클레오티드 서열.
서열번호 17: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 1의 부분 cDNA 서열.
서열번호 18: 벡터 pTKW20의 T-DNA 영역의 뉴클레오티드 서열.
서열번호 19: 니코티아나 벤싸미아나 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylF9의 뉴클레오티드 서열.
서열번호 20: 니코티아나 벤싸미아나 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylR9의 뉴클레오티드 서열.
서열번호 21: 니코티아나 벤싸미아나 XylT 유전자 변이체 1의 부분 서열.
서열번호 22: 벡터 pTKW29의 T-DNA 영역의 뉴클레오티드 서열.
서열번호 23: 잠정적인 베타-(1,2)-크실로실트랜스퍼레이즈에 대한 니코티아나 타바큠 재배종 잔티 mRNA(검색번호 AJ627182).
서열번호 24: 서열번호 23에 의해 코딩된 잠정적인 베타-(1,2)-크실로실트랜스퍼레이즈.
서열번호 25: 잠정적인 베타-(1,2)-크실로실트랜스퍼레이즈에 대한 니코티아나 타바큠 재배종 잔티 XylT 유전자(검색번호 AJ627183).
서열번호 26: 서열번호 25에 의해 코딩된 잠정적인 베타-(1,2)-크실로실트랜스퍼레이즈.
실시예 1: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나로부터 XylT cDNA 및 유전자 서열을 단리하는 데 사용되는 축퇴 프라이머의 디자인
니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나로부터 XylT cDNA 및 게놈 DNA를 PCR 증폭시키는 데 있어서 축퇴 프라이머로서 사용될 올리고뉴클레오티드 서열은 잠정적인 XylT 단백질을 코딩하는 니코티아나 타바큠 재배종 잔티(검색번호 AJ627183)로부터 단리된 게놈 DNA 서열의 엑손 서열을 기초로 하여 디자인하였다. 클로닝을 목적으로 5' 말단에 CACC를 가진 전방향 프라이머를 디자인하였다. 이러한 방식으로 하기 축퇴 프라이머를 제조하였다:
XylF4: 5'-CACCTTGTTTCTCTCTTCGCTCTCAACTCAATCACTC-3' (서열번호 1)
XylR4: 5'-TCGATCACAACTGGAGGATCCGCATAA-3' (서열번호 2)
실시예 2: 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 XylT cDNA 서열의 단리
실시예 1에 기재된 축퇴 프라이머를 사용하여 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 XylT cDNA 서열을 단리하였다.
RNeasy 플랜트 미니 키트(RNeasy Plant Mini Kit; Qiagen)를 제조자의 지시에 따라 사용하여 니코티아나 타바큠 재배종 페타이트 하바나 SR1의 잎으로부터 RNA를 추출하여, RT-PCR용 수퍼스크립트(Superscript)™ 제1-가닥 합성 시스템(Invitrogen Life Technologies)을 제조자의 지시에 따라 사용한 cDNA 합성에 사 용하였다.
cDNA를 기질로 사용하고 프라이머쌍 XylF4/XylR4를 사용하여 하기 조건 하에 PCR 증폭을 수행하였다: 40주기 동안 94℃에서 15초(변성) 및 68℃에서 3분(어닐링 및 연장(elongation)).
약 1500 bp의 DNA 단편을 증폭하여 pENTR™/D-TOPO® 벡터(Invitrogen) 내로 클로닝하고, 여러 클론을 시퀀싱하였다(서열번호 3 - XylTc2Nt 및 서열번호 5 - XylTc7Nt의 서열을 포함함).
잠정적인 XylT 단백질을 코딩하는, 니코티아나 타바큠 재배종 잔티로부터 단리된 mRNA 서열(검색번호 AJ627182; 서열번호 23)과, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT cDNA(서열번호 3 및 5) 사이의 정렬이 도 1a 내지 1c에 나타나 있다.
니코티아나 타바큠 재배종 잔티로부터 단리된 mRNA 서열에 의해 코딩된 잠정적인 XylT 단백질(검색번호 AJ627182; 서열번호 24)과, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 cDNA 서열에 의해 코딩된 잠정적 XylT 단백질(서열번호 4 및 6) 사이의 정렬은 도 2에 나타나 있다.
실시예 3: 니코티아나 타바큠 재배종 페타이트 하바나 SR1의 XylT 유전자 서열 및 니코티아나 벤싸미아나의 XylT 유전자 서열의 단리
실시예 1에 기재된 축퇴 프라이머를 사용하여 니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나로부터 XylT 유전자 서열을 단리하였 다.
문헌(Bernatzky and Tanksley (1986))에 기재된 프로토콜을 기초로 하여 니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나의 잎으로부터 DNA를 추출하였다.
게놈 DNA을 기질로 사용하고 프라이머쌍 XylF4/XylR4를 사용하여 하기 조건 하에 PCR 증폭을 수행하였다: 40주기 동안 94℃에서 15초(변성) 및 68℃에서 3분(어닐링 및 연장).
니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 게놈 DNA를 PCR 증폭용 기질로서 사용하여, 약 3400 bp의 DNA 단편을 증폭하여 pENTR™/D-TOPO® 벡터(Invitrogen) 내로 클로닝하고, 여러 클론을 시퀀싱하였다(서열번호 7 - XylTgINt 및 서열번호 9 - XylTg3Nt의 서열을 포함함).
XylT 게놈 DNA 서열 XylTgINt 및 XylTg3Nt는 2개의 잠정적인 인트론 서열 및 3개의 잠정적인 엑손 서열을 포함한다. 인트론 서열의 위치는 다음과 같다:
- XylTgINt의 경우: 서열번호 7의 위치 679번에 있는 뉴클레오티드부터 위치 1974번에 있는 뉴클레오티드까지, 및 위치 2125번에 있는 뉴클레오티드부터 위치 2722번에 있는 뉴클레오티드까지; 및
- XylTg3Nt의 경우: 서열번호 9의 위치 658번에 있는 뉴클레오티드부터 위치 1953번에 있는 뉴클레오티드까지, 및 위치 2104번에 있는 뉴클레오티드부터 위치 2701번에 있는 뉴클레오티드까지.
니코티아나 벤싸미아나로부터의 게놈 DNA를 PCR 증폭용 기질로서 사용하여, 약 3300 내지 약 3600 bp의 DNA 단편을 증폭하여 pENTR™/D-TOPO® 벡터(Invitrogen) 내로 클로닝하고, 여러 클론을 시퀀싱하였다(서열번호 11 - XylTg14Nb 및 서열번호 13 - XylTgl9Nb의 서열을 포함함).
XylT 게놈 DNA 서열 XylTg14Nb 및 XylTg19Nb는 2개의 잠정적인 인트론 서열 및 3개의 잠정적인 엑손 서열을 포함한다. 인트론 서열의 위치는 다음과 같다:
- XylTg14Nb의 경우: 서열번호 11의 위치 658번에 있는 뉴클레오티드부터 위치 1917번에 있는 뉴클레오티드까지, 및 위치 2068번에 있는 뉴클레오티드부터 위치 2612번에 있는 뉴클레오티드까지; 및
- XylTgl9Nb의 경우: 서열번호 13의 위치 649번에 있는 뉴클레오티드부터 위치 2194번에 있는 뉴클레오티드까지, 및 위치 2345번에 있는 뉴클레오티드부터 위치 2888번에 있는 뉴클레오티드까지.
잠정적인 XylT 단백질을 코딩하는, 니코티아나 타바큠 재배종 잔티로부터 단리된 게놈 DNA 서열(검색번호 AJ627183; 서열번호 25)과, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT 게놈 DNA 서열(서열번호 7 및 9) 및 니코티아나 벤싸미아나로부터 단리된 XylT 게놈 DNA 서열(서열번호 11 및 13) 사이의 정렬은 도 3a 내지 3l에 나타나 있다.
니코티아나 타바큠 재배종 잔티로부터 단리된 게놈 DNA 서열에 의해 코딩된 잠정적인 XylT 단백질(검색번호 AJ627183; 서열번호 26)과, 니코티아나 타바큠 재 배종 페타이트 하바나 SR1로부터 단리된 게놈 DNA 서열에 의해 코딩된 잠정적인 XylT 단백질(서열번호 8 및 10) 및 니코티아나 벤싸미아나로부터 단리된 게놈 DNA 서열에 의해 코딩된 잠정적인 XylT 단백질(서열번호 12 및 14) 사이의 정렬은 도 4a 내지 4b에 나타나 있다.
실시예 4: 니코티아나 XylT 침묵 유전자를 함유하는 T-DNA 벡터의 구축
실시예 2 및 3에 기재된 니코티아나 XylT 서열로부터 증폭된 DNA 단편을 사용하여, 전사되었을 때 상기 증폭된 DNA 단편으로부터의 센스 및 안티센스 DNA 서열을 포함하는 RNA 분자를 생성하고 염기-짝짓기를 하여 이중 가닥 RNA 분자를 형성할 수 있는 키메라 유전자를 포함하는 T-DNA 벡터를 구축하였다. 이러한 키메라 유전자는 니코티아나, 특히 니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나에서의 XylT 유전자의 발현을 감소시키는 데 사용될 수 있다.
4.1. 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT 서열로부터 증폭된 DNA 단편을 가진 XylT 침묵 유전자를 포함하는 T-DNA 벡터의 구축
니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT cDNA 서열의 PCR 증폭에 있어서 비-축퇴 프라이머로서 사용될 올리고뉴클레오티드 서열을 실시예 2에서 단리된 니코티아나 타바큠 재배종 페타이트 하바나 SR1의 cDNA 서열을 기초로 하여 디자인하였다. 클로닝을 위해 5' 말단에 CACC가 있는 전방향 프라이머(서열번호 15)를 디자인하였다. 이 방식으로 하기 비-축퇴 프라이머를 생성하였다:
XylF8: 5'-CACCTCTCGCCTTTGGGATATGAAACT-5'(서열번호 15)
XylR8: 5'-ACAGCTTTGGTGCTGCAGAAACT-3'(서열번호 16)
실시예 2에 기재된 바와 같이, 니코티아나 타바큠 재배종 페타이트 하바나 SR1의 XylT cDNA 서열로부터 증폭된 DNA 단편을 포함하는 벡터를 기질로서 사용하고 프라이머쌍 XylF8/XylR8을 사용하여 하기 조건 하에 PCR 증폭을 수행하였다: 25주기 동안 94℃에서 15초(변성), 56℃에서 30초(어닐링) 및 68℃에서 45초(연장).
약 470 bp의 DNA 단편(XylTi4Nt; 서열번호 17)을 증폭하여 pENTR™/D-TOPO® 벡터(Invitrogen) 내로 클로닝함으로써 플라스미드 pKW19를 수득하였다. 플라스미드 pKW19를 게이트웨이(Gateway)® LR 클로네이즈(Clonase)™ II(Invitrogen)를 사용하여 pHellsgate12(Helliwell and Waterhouse, Methods (2003) 30: 289-295)와 재조합함으로써 플라스미드 pTKW20을 수득하였다.
따라서, pTKW20의 T-DNA 서열(서열번호 18)은 하기 유전자를 포함한다:
1) i) 카울리플라워 모자이크 바이러스(Cauliflower Mosaic Virus) 35S 전사체의 프로모터 영역을 포함하는 단편(Odell et al, 1985)(서열번호 18, 969번에 위치한 뉴클레오티드부터 위치 2314번에 위치한 뉴클레오티드까지),
ii) 센스 방향으로 클로닝된 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT cDNA 서열의 일부를 포함하는 단편(서열번호 18, 2365번에 위치한 뉴클레오티드부터 위치 2834번에 위치한 뉴클레오티드까지),
iii) 피마자로부터 단리된 카테이즈(catase)-1 유전자의 인트론을 포함하는 단편(서열번호 18, 2893번에 위치한 뉴클레오티드부터 위치 3088번에 위치한 뉴클레오 티드까지),
iv) 문헌(Rosche and Westhoff (1995))에 기재된 바와 같은, 플라베리아 트리네르비아(Flaveria trinervia)로부터 단리된 피루베이트 오르토포스페이트 디카이네이즈 유전자의 제2 인트론을 역방향으로 포함하는 단편(서열번호 18, 3130번에 위치한 뉴클레오티드부터 위치 3871번에 위치한 뉴클레오티드까지),
v) 안티센스 방향으로 클로닝된 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT cDNA 서열의 부분을 포함하는 단편(서열번호 18, 3597번에 위치한 뉴클레오티드부터 위치 4426번에 위치한 뉴클레오티드까지), 및
vi) 문헌(De Greve et al. (1982))에 기재된 바와 같은 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)의 옥토핀(octopine) 합성효소 유전자의 3' 비번역 영역을 포함하는 단편(서열번호 18, 4479번에 위치한 뉴클레오티드부터 위치 5244번에 위치한 뉴클레오티드까지)
을 포함하는 키메라 XylT 침묵 유전자; 및
2) i) 아그로박테리움 투메파시엔스 T-DNA의 노팔린(nopaline) 합성효소 유전자의 프로모터 영역을 포함하는 단편(서열번호 18, 5512번에 위치한 뉴클레오티드부터 위치 5744번에 위치한 뉴클레오티드까지),
ii) nptll 항생제 내성 유전자를 포함하는 단편(서열번호 18, 5745번에 위치한 뉴클레오티드부터 위치 6690번에 위치한 뉴클레오티드까지), 및
iii) 아그로박테리움 투메파시엔스 T-DNA의 노팔린 합성효소 유전자의 3' 비번역 영역을 포함하는 단편(서열번호 18, 6691번에 위치한 뉴클레오티드부터 위치 7396 번에 위치한 뉴클레오티드까지)
을 포함하는 선별 마커를 코딩하는 키메라 유전자.
T-DNA 벡터를, 헬퍼 Ti-플라스미드를 포함하는 아그로박테리움 투메파시엔스 내로 도입하였다.
4.2. 니코티아나 벤싸미아나로부터 단리된 XylT 서열로부터 증폭된 DNA 단편을 가진 XylT 침묵 유전자를 포함하는 T-DNA 벡터의 구축
니코티아나 벤싸미아나로부터 단리된 XylT 유전자 서열의 PCR 증폭에 있어서 비-축퇴 프라이머로서 사용될 올리고뉴클레오티드 서열을, 실시예 3에서 단리된 니코티아나 벤싸미아나로부터 단리된 유전자 서열을 기초로 하여 디자인하였다. 클로닝을 위해 5' 말단에 GGCCGGATCCTCG가 있는 전방향 프라이머(서열번호 19)를 디자인하였고, 5' 말단에 GGCCATCGATGGTACC가 있는 역방향 프라이머(서열번호 20)를 디자인하였다. 이 방식으로 하기 비-축퇴 프라이머를 생성하였다:
XylF9: 5'-GGCCGGATCCTCGAGACACAATTGGAGGAAACATGGAAAGC-5'(서열번호 19)
XylR9: 5'-GGCCATCGATGGTACCGGCCCAGCTCTTTATGGAATCAAA-3'(서열번호 20)
실시예 3에 기재된 바와 같은, 니코티아나 벤싸미아나의 XylT 유전자 서열로부터 증폭된 DNA 단편을 포함하는 벡터를 기질로서 사용하고 프라이머쌍 XylF9/XylR9를 사용하여 하기 조건 하에 PCR 증폭을 수행하였다: 25주기 동안 94℃에서 15초(변성), 58℃에서 30초(어닐링) 및 68℃에서 30초(연장).
약 430 bp의 DNA 단편(XylTiNb; 서열번호 21)을 증폭하여 XhoI과 KpnI 및 BamHI과 ClaI으로 절단하였다. XhoI/KpnI 및 BamHI/ClaI으로 절단한 단편을, XhoI/KpnI 및 BamHI/ClaI으로 절단한 pHANNIBAL(Helliwell and Waterhouse, 2003) 내로 클로닝하여 pKW28을 수득하였다.
따라서, 플라스미드 pKW28은 제한효소 인식 부위 MscI과 PstI 사이에 하기 단편을 포함하는 키메라 XylT 침묵 유전자를 포함한다:
1) 카울리플라워 모자이크 바이러스 35S 전사체의 프로모터 영역을 포함하는 단편(Odell et al, 1985)(서열번호 22, 위치 3779번에 있는 뉴클레오티드부터 위치 2434번에 있는 뉴클레오티드까지),
2) 센스 방향으로 클로닝된 니코티아나 벤싸미아나 XylT 유전자의 부분을 포함하는 단편(서열번호 22, 위치 2427번에 있는 뉴클레오티드부터 위치 2023번에 있는 뉴클레오티드까지),
3) 문헌(Rosche and Westhoff (1995))에 기재된 바와 같은, 플라베리아 트리네르비아로부터 단리된 피루베이트 오르토포스페이트 디카이네이즈의 제2 인트론을 포함하는 단편(서열번호 22, 1991번에 위치한 뉴클레오티드부터 위치 1250번에 위치한 뉴클레오티드까지),
4) 안티센스 방향으로 클로닝된 니코티아나 벤싸미아나 XylT 유전자 서열의 부분을 포함하는 단편(서열번호 22, 1211번에 위치한 뉴클레오티드부터 위치 807번에 위치한 뉴클레오티드까지), 및
5) 문헌(De Greve et al. (1982))에 기재된 바와 같은 아그로박테리움 투메파시엔스의 옥토핀 합성효소 유전자의 3' 비번역 영역을 포함하는 단편(서열번호 22, 786번에 위치한 뉴클레오티드부터 위치 76번에 위치한 뉴클레오티드까지).
플라스미드 pKW28은 MscI 및 PstI으로 절단하였고, 상기 키메라 유전자는 하기 단편을 포함하는 선별 마커를 코딩하는 키메라 유전자와 함께 PstI 및 SmaI으로 절단된 T-DNA 벡터의 T-DNA 경계 사이에 도입하여 pTKW29를 수득하였다(pTKW29의 T-DNA의 서열은 서열번호 22에 나타냄):
1) 아그로박테리움 투메파시엔스 T-DNA의 노팔린 합성효소 유전자의 프로모터 영역을 포함하는 단편(서열번호 22, 3854번에 위치한 뉴클레오티드부터 위치 4140번에 위치한 뉴클레오티드까지),
2) 바(bar) 포스피노트리신(phosphinothricin) 내성 유전자를 포함하는 단편(De Block et al, 1987)(서열번호 22, 4161번에 위치한 뉴클레오티드부터 위치 4712번에 위치한 뉴클레오티드까지), 및
3) 아그로박테리움 투메파시엔스 T-DNA의 노팔린 합성효소 유전자의 3' 비번역 영역을 포함하는 단편(서열번호 22, 4731번에 위치한 뉴클레오티드부터 위치 4991번에 위치한 뉴클레오티드까지).
벡터 pTKW29는 pGSC1700(Cornelissen and Vandewiele, 1989)으로부터 유래된 것이다. 이 벡터 골격은 하기 유전 요소를 포함한다:
1) 에쉬케리치아 콜라이(Escherichia coli)에서 복제하기 위한, 플라스미드 pBR322(Bolivar et al., 1977)로부터의 복제 기점(ORI CoIE1)을 포함하는 플라스미드 코어, 및 아그로박테리움 투메파시엔스에서 복제하기 위한, 슈도모나스(Pseudomonas) 플라스미드 pVS1(Itoh et al., 1984)로부터의 복제 기점(ORI pVSl)을 포함하는 제한 단편,
2) 에쉬케리치아 콜라이 및 아그로박테리움 투메파시엔스에서의 플라스미드의 증식 및 선별을 위해 스트렙토마이신 및 스펙티노마이신(aadA)에 대한 내성을 부여하는 선별 마커 유전자, 및
3) 트랜스포존 Tn903(Oka et al., 1981)으로부터 단리된 nptI 유전자의 네오마이신 포스포트랜스퍼레이즈 코딩 서열의 단편으로 구성된 DNA 영역.
상기 T-DNA 벡터는 헬퍼 Ti-플라스미드를 포함하는 아그로박테리움 투메파시엔스 내로 도입된다.
실시예 5: XylT 침묵 유전자를 보유하는 형질전환 니코티아나 식물의 분석
실시예 4에 기재된 아그로박테리움 투메파시엔스 균주를 사용하여 니코티아나 식물을 형질전환시켰다.
5.1. XylT 침묵 유전자를 보유하는 형질전환 니코티아나 타바큠 재배종 페타이트 하바나 SR1 식물의 분석
문헌(Zambryski et al. (1983))에 기재된 프로토콜에 따라 니코티아나 타바큠 재배종 페타이트 하바나 SR1 식물을 실시예 4.1.에 기재된 아그로박테리움 투메파시엔스를 사용하여 형질전환시켰다. 실시예 4.1.에 기재된 키메라 유전자를 포함하는 52종의 형질전환 니코티아나 타바큠 계통을 수득하였다.
형질전환 식물 계통을 서던 블롯 분석을 이용하여 분자 수준에서 분석하였다. 유사하게, 상기 식물 계통들을 노던 블롯 분석을 이용하여 XylT RNA 발현에 대해 분석하였다.
XylT 활성의 표시는 형질전환 계통으로부터 수득된 단백질의 글리칸 상에 존 재하는 베타-1,2-크실로스 잔기의 수준을 비형질전환 식물과 비교함으로써 얻을 수 있다. 식물의 단백질-결합 N-글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준은 예를 들어, 문헌(Faye et al (1993))에 기재된 바와 같이 크실로스-특이적 항체를 사용한 웨스턴 블롯 분석에 의해 측정될 수 있거나, 예컨대, 문헌(Kolarich and Altmann, 2000, Anal. Biochem. 285: 64-75)에 기재된 바와 같이 매트릭스-보조 레이저 탈착/이온화 비행시간형 질량 분광분석(MALDI-TOF-MS)을 이용하거나 예컨대, 문헌(Henriksson et al. (2003, Biochem. J. 375: 61-73)에 기재된 바와 같이 액체 크로마토그래피 탠덤 질량 분광분석(LC/MS/MS)을 이용하여 식물의 당단백질로부터 단리된 글리칸에 대한 질량 분광측정을 수행함으로써 측정할 수 있다.
5.2. XylT 침묵 유전자를 보유하는 형질전환 니코티아나 벤싸미아나 식물의 분석
유사하게, 니코티아나 벤싸미아나 식물을 실시예 4.2.에 기재된 아그로박테리움 투메파시엔스 균주를 사용하여 형질전환시켰고, 단백질의 글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준을 하기와 같이 분석하였다.
잎 디스크(disk)를 pTKW29로 형질전환한 후 실시예 4.2.에 기재된 키메라 유전자를 포함하는 54종의 형질전환 니코티아나 벤싸미아나 계통을 수득하였다.
이 식물 계통들의 내재성 단백질의 글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준을 측정하기 위해, 각 개체의 가용성 잎 단백질을 베타-1,2-크실로스-특이적 항체를 사용한 웨스턴 블롯으로 분석하였다.
6개의 샘플은 상기 항체와의 매우 약한 반응을 보였고, 6개의 샘플은 상기 항체와의 검출가능한 반응을 보이지 않았다. 나머지 샘플들의 경우, 상기 항체와의 반응 수준은 약한 수준부터 야생형 수준까지이다.
pTKW29로부터 수득된 키메라 XylT 침묵 유전자의 삽입 횟수를 측정하기 위해, 베타-1,2-크실로스-특이적 항체에 대해 매우 약한 반응 내지 음성 반응을 보이는 식물 계통으로부터 단리된 게놈 DNA를 단리하여 EcoRI으로 절단하고, 35S 프로모터 영역에 걸쳐있는 프로브 및 바 포스피노트리신 내성 유전자 코딩 영역에 걸쳐 있는 프로브를 사용한 서던 블롯으로 분석하였다.
12종의 식물 계통 중 어느 식물 계통도 단일 삽입을 보이지 않았다. 한 식물 계통은 2개의 삽입을 함유하였고 웨스턴 블롯 분석을 이용하였을 때 크실로스에 대해 음성이었다.
독립적으로 삽입된 이들 2개의 키메라 XylT 침묵 유전자를 시험하기 위해, 그리고 웨스턴 블롯에 의한 분석 시 크실로스에 대해 음성이며 단일 키메라 XylT 침묵 유전자를 함유하는 식물을 수득하기 위해, 2개의 삽입을 함유하는 식물 게통의 자가 수정으로부터 발생된 자손의 씨를 뿌리고, 25종의 식물 계통을 웨스턴 블롯 분석으로 분석하였다.
참고문헌
Baulcombe (2004). Nature 431: 356-363.
Bernatzky and Tanksley (1986). Theor. Appl. Genet. 72: 314-321.
Bolivar et al. (1977). Gene 2: 95-113.
Cornelissen and Vandewiele (1989). Nucleic Acids Research 17: 19-25.
De Block et al. (1984). EMBO J. 3(8): 1681-1689
De Block et al. (1987). EMSO J 6:2513.
De Greve et al. (1982). J. Mol. Appl. Genetics 1 (6): 499-511.
Faye et al. (1993). Analytical Biochemistry 209: 104-108.
Fischer et al. (2004). Curr. Opin. Plant Biol. 7: 152-158.
Helliwell and Waterhouse (2003). Methods 30: 289-295.
Henikoff and Henikoff (1992). Proc. Natl. Acad. Sci. USA 89(22): 10915-10919.
Henriksson et al. (2003). Biochem. J. 375: 61-73.
Horsch et al. (1985). Science 111: 1229-1231.
Itoh et al. (1984). Plasmid 11: 206.
Khoo et al. (1997). Glycobiology 7: 663-677.
Kolarich and Altmann (2000). Anal. Biochem. 285: 64-75.
Mulder et al. (1995). Eur. J. Biochem. 232: 272-283.
Odell et al. (1985). Nature 313: 810.
Oka et al. (1981). Journal of Molecular Biology, 147, 217-226.
Rosche and Westhoff (1995). Plant Molecular Biology 29 (4): 663-678.
Stoger et al. (2002). Curr. Opin. Biotechnol. 13: 161-166.
Strasser et al. (2000). FEBS Lett. 472: 105-108.
Strasser et al. (2004a). 2nd EPSO Conference, October 2004, Italy, Abstract book p. 56, S036.
Strasser et al. (2004b). FEBS Lett. 561: 132-136.
Tezuka et al (1992). Eur J Biochem. 203(3): 401-413.
Twyman et al. (2003). Trends Biotechnol. 21: 570-578.
Zambryski et al. (1983). EMBO J. 2: 2143-2150.
Zeng et al. (1997). J. Biol. Chem. 272: 31340-31347.
SEQUENCE LISTING <110> Bayer BioScience N.V. Weterings, Koen <120> Novel nucleotide sequences encoding Nicotiana beta-1,2-xylosyltransferase <130> BCS 06-2005 <160> 26 <170> PatentIn version 3.3 <210> 1 <211> 37 <212> DNA <213> Artificial <220> <223> oligonucleotide XylF4 <400> 1 caccttgttt ctctcttcgc tctcaactca atcactc 37 <210> 2 <211> 27 <212> DNA <213> Artificial <220> <223> oligonucleotide XylR4 <400> 2 tcgatcacaa ctggaggatc cgcataa 27 <210> 3 <211> 1513 <212> DNA <213> Artificial <220> <223> XylTc2Nt <220> <221> CDS <222> (7)..(1512) <400> 3 cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr 1 5 10 ttc tct tcc cac tct gat cac ttc cgt cac aaa tcc ccc caa aac cac 96 Phe Ser Ser His Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His 15 20 25 30 ttt cct aat acc caa aac cac tat tcc ctg tcg gaa aac cac cat gat 144 Phe Pro Asn Thr Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp 35 40 45 aat ttc cac tct tct gtc act tcc caa tat acc aag cct tgg cca att 192 Asn Phe His Ser Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile 50 55 60 ttg ccc tcc tac ctc ccc tgg tct cag aat cct aat gtt tct ttg aga 240 Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg 65 70 75 tcg tgc gag ggt tac ttc ggt aat ggg ttt act ctc aaa gtt gat ctt 288 Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu 80 85 90 ctc aaa act tcg ccg gag ctt cac cag aaa ttc ggc gaa aac acc gta 336 Leu Lys Thr Ser Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val 95 100 105 110 tcc ggc gac ggc gga tgg ttt agg tgt ttt ttc agt gag act ttg cag 384 Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln 115 120 125 agt tcg att tgc gag gga ggt gct ata cga atg aat ccg gac gag att 432 Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile 130 135 140 ttg atg tct cgt gga ggc gag aaa ttg gag tcg gtt att ggt agg agt 480 Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser 145 150 155 gaa gat gat gag ctg ccc gtg ttc aaa aat gga gct ttt cag att aaa 528 Glu Asp Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys 160 165 170 gtt act gat aaa ctg aaa att ggg aaa aaa tta gtg gat gaa aaa atc 576 Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile 175 180 185 190 ttg aat aaa tac tta ccg gaa ggt gca att tca agg cac act atg cgt 624 Leu Asn Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg 195 200 205 gaa tta att gac tct att cag tta gtt ggc gcc gat gaa ttt cac tgt 672 Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys 210 215 220 tct gag tgg att gag gag ccg tca ctt ttg att aca cga ttt gag tat 720 Ser Glu Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr 225 230 235 gca aac ctt ttc cac aca gtt acc gat tgg tat agt gca tac gtg gca 768 Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala 240 245 250 tcc agg gtt act ggc ttg ccc agt cgg cca cat ttg gtt ttt gta gat 816 Ser Arg Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp 255 260 265 270 ggc cat tgt gag aca caa ttg gag gaa aca tgg aaa gca ctc ttt tca 864 Gly His Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser 275 280 285 agc ctc act tat gct aag aac ttt agt ggc cca gtt tgt ttc cgt cac 912 Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His 290 295 300 gcc gtt ctc tcg cct ttg gga tat gaa act gcc ctg ttt aag gga ctg 960 Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu 305 310 315 aca gaa act ata gat tgt aat gga gct tct gcc cat gat ttg tgg caa 1008 Thr Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln 320 325 330 aat cct gat gat aag aga act gca cgg ttg tcc gag ttt ggg gag atg 1056 Asn Pro Asp Asp Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met 335 340 345 350 atc agg gca gcc ttt gga ttt cct gtg gat aga cag aac atc cca agg 1104 Ile Arg Ala Ala Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg 355 360 365 aca gtc aca ggc cct aat gtc ctc ttt gtt aga cgt gag gat tat tta 1152 Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu 370 375 380 gct cac cca cgt cat ggt gga aag gta cag tct agg ctt agc aat gaa 1200 Ala His Pro Arg His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu 385 390 395 gag caa gta ttt gat tcc ata aag agc tgg gcc ttg aac cac tcg gag 1248 Glu Gln Val Phe Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu 400 405 410 tgc aaa tta aat gta att aac gga ttg ttt gcc cac atg tcc atg aaa 1296 Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys 415 420 425 430 gag caa gtt cga gca atc caa gat gca tct gtc att gtt ggt gct cat 1344 Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His 435 440 445 gga gca ggt cta act cac ata gtt tct gca gca cca aaa gct gta ata 1392 Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile 450 455 460 cta gaa att ata agc agc gaa tat agg cac ccc cat ttt gct ctg att 1440 Leu Glu Ile Ile Ser Ser Glu Tyr Arg His Pro His Phe Ala Leu Ile 465 470 475 gca caa tgg aaa gga ttg gag tac cat ccc ata tat ttg gag ggg tct 1488 Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser 480 485 490 tat gcg gat cct cca gtt gtg atg a 1513 Tyr Ala Asp Pro Pro Val Val Met 495 500 <210> 4 <211> 502 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 4 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser 1 5 10 15 Ser His Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His Phe Pro 20 25 30 Asn Thr Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp Asn Phe 35 40 45 His Ser Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile Leu Pro 50 55 60 Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg Ser Cys 65 70 75 80 Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys 85 90 95 Thr Ser Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val Ser Gly 100 105 110 Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser 115 120 125 Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met 130 135 140 Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp 145 150 155 160 Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr 165 170 175 Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile Leu Asn 180 185 190 Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu 195 200 205 Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys Ser Glu 210 215 220 Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn 225 230 235 240 Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg 245 250 255 Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His 260 265 270 Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu 275 280 285 Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val 290 295 300 Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Thr Glu 305 310 315 320 Thr Ile Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro 325 330 335 Asp Asp Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg 340 345 350 Ala Ala Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val 355 360 365 Thr Gly Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His 370 375 380 Pro Arg His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln 385 390 395 400 Val Phe Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys 405 410 415 Leu Asn Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys Glu Gln 420 425 430 Val Arg Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala 435 440 445 Gly Leu Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu 450 455 460 Ile Ile Ser Ser Glu Tyr Arg His Pro His Phe Ala Leu Ile Ala Gln 465 470 475 480 Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala 485 490 495 Asp Pro Pro Val Val Met 500 <210> 5 <211> 1495 <212> DNA <213> Artificial <220> <223> XylTc7Nt <220> <221> CDS <222> (5)..(1495) <400> 5 cacc ctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 49 Leu Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr 1 5 10 15 ttc tct tcc cac cct gat cac ttc cgc cac aaa tcc cgc caa aac cac 97 Phe Ser Ser His Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His 20 25 30 ttt tcc ttg tcg gaa aac cgc cat cat aat ttc cac tct tca atc act 145 Phe Ser Leu Ser Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr 35 40 45 tct caa tat tcc aag cct tgg cct att ttg ccc tcc tac ctc cct tgg 193 Ser Gln Tyr Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp 50 55 60 tct caa aac cct aat gtt gtt tgg aga tcg tgc gag ggt tac ttc ggt 241 Ser Gln Asn Pro Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly 65 70 75 aat ggg ttt act ctc aaa gtt gac ctt ctc aaa act tcg ccg gag ttt 289 Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe 80 85 90 95 cac cgg aaa ttc ggc gaa aac acc gtc tcc ggc gac ggc gga tgg ttt 337 His Arg Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe 100 105 110 agg tgt ttt ttc agt gag act ttg cag agt tcg atc tgc gag gga ggc 385 Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly 115 120 125 gca ata cga atg aat ccg gac gag att ttg atg tct cgt gga ggt gag 433 Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu 130 135 140 aaa ttg gag tcg gtt att ggt agg agt gaa gat gat gag ctg ccc gtg 481 Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val 145 150 155 ttc aaa aat gga gct ttt cag att aaa gtt act gat aaa ctg aaa att 529 Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile 160 165 170 175 ggg aaa aaa tta gtg gat gaa aaa ttc ttg aat aaa tac tta ccg gaa 577 Gly Lys Lys Leu Val Asp Glu Lys Phe Leu Asn Lys Tyr Leu Pro Glu 180 185 190 ggt gca att tca agg cac act atg cgt gag tta att gac tct att cag 625 Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln 195 200 205 ttg gtt ggc gcc gat gat ttt cac tgt tct gag tgg att gag gag ccg 673 Leu Val Gly Ala Asp Asp Phe His Cys Ser Glu Trp Ile Glu Glu Pro 210 215 220 tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc cac aca gtt 721 Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val 225 230 235 acc gat tgg tat agt gca tac gtg gca tcc agg gtt act ggc ttg ccc 769 Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro 240 245 250 255 agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag aca caa ttg 817 Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu 260 265 270 gag gaa aca tgg aaa gca ctt ttt tca agc ctc act tat gct aag aac 865 Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn 275 280 285 ttt agt ggc cca gtt tgt ttc cgt cat gcc gcc ctc tcg cct ttg gga 913 Phe Ser Gly Pro Val Cys Phe Arg His Ala Ala Leu Ser Pro Leu Gly 290 295 300 tat gaa act gcc ctg ttt aag gga ctg tca gaa act ata gat tgt aat 961 Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn 305 310 315 gga gct tct gcc cat gat ttg tgg caa aat cct gat gat aag aaa act 1009 Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Lys Thr 320 325 330 335 gca cgg ttg tcc gag ttt ggg gag atg att agg gca gcc ttt gga ttt 1057 Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe 340 345 350 cct gtg gat aga cag aac atc cca agg aca gtc aca ggc cct aat gtc 1105 Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val 355 360 365 ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt cat ggt gga 1153 Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly 370 375 380 aag gta cag tct agg ctt agc aat gaa gag caa gta ttt gat tcc ata 1201 Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile 385 390 395 aag agc tgg gcc ttg aac cac tcg gag tgc aaa tta aat gta att aac 1249 Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn 400 405 410 415 gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga gca atc caa 1297 Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln 420 425 430 gat gct tct gtc ata gtt ggt gct cat gga gca ggt cta act cac ata 1345 Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile 435 440 445 gtt tct gca gca cca aaa gct gta ata cta gaa att ata agc agc gaa 1393 Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu 450 455 460 tat agg cgc ccc cat ttt gct ctg att gca caa tgg aaa gga ttg gag 1441 Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu 465 470 475 tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct cca gtt gtg 1489 Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val 480 485 490 495 atc gaa 1495 Ile Glu <210> 6 <211> 497 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 6 Leu Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe 1 5 10 15 Ser Ser His Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His Phe 20 25 30 Ser Leu Ser Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr Ser 35 40 45 Gln Tyr Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser 50 55 60 Gln Asn Pro Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn 65 70 75 80 Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His 85 90 95 Arg Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg 100 105 110 Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala 115 120 125 Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys 130 135 140 Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val Phe 145 150 155 160 Lys Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile Gly 165 170 175 Lys Lys Leu Val Asp Glu Lys Phe Leu Asn Lys Tyr Leu Pro Glu Gly 180 185 190 Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu 195 200 205 Val Gly Ala Asp Asp Phe His Cys Ser Glu Trp Ile Glu Glu Pro Ser 210 215 220 Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr 225 230 235 240 Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro Ser 245 250 255 Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu 260 265 270 Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe 275 280 285 Ser Gly Pro Val Cys Phe Arg His Ala Ala Leu Ser Pro Leu Gly Tyr 290 295 300 Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn Gly 305 310 315 320 Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Lys Thr Ala 325 330 335 Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro 340 345 350 Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu 355 360 365 Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys 370 375 380 Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys 385 390 395 400 Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly 405 410 415 Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp 420 425 430 Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val 435 440 445 Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr 450 455 460 Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr 465 470 475 480 His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val Ile 485 490 495 Glu <210> 7 <211> 3408 <212> DNA <213> Artificial <220> <223> XylTg1Nt <220> <221> CDS <222> (7)..(678) <220> <221> Intron <222> (679)..(1974) <220> <221> CDS <222> (1975)..(2124) <220> <221> Intron <222> (2125)..(2722) <220> <221> CDS <222> (2723)..(3406) <400> 7 cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr 1 5 10 ttc tct tcc cac tct gat cac ttc cgt cac aaa tcc ccc caa aac cac 96 Phe Ser Ser His Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His 15 20 25 30 ttt cct aat acc caa aac cac tat tcc ctg tcg gaa aac cac cat gat 144 Phe Pro Asn Thr Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp 35 40 45 aat ttc cac tct tct gtc act tcc caa tat acc aag cct tgg cca att 192 Asn Phe His Ser Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile 50 55 60 ttg ccc tcc tac ctc ccc tgg tct cag aat cct aat gtt tct ttg aga 240 Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg 65 70 75 tcg tgc gag ggt tac ttc ggt aat ggg ttt act ctc aaa gtt gat ctt 288 Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu 80 85 90 ctc aaa act tcg ccg gag ctt cac cag aaa ttc ggc gaa aac acc gta 336 Leu Lys Thr Ser Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val 95 100 105 110 tcc ggc gac ggc gga tgg ttt agg tgt ttt ttc agt gag act ttg cag 384 Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln 115 120 125 agt tcg att tgc gag gga ggt gct ata cga atg aat ccg gac gag att 432 Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile 130 135 140 ttg atg tct cgt gga ggc gag aaa ttg gag tcg gtt att ggt agg agt 480 Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser 145 150 155 gaa gat gat gag ctg ccc gtg ttc aaa aat gga gct ttt cag att aaa 528 Glu Asp Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys 160 165 170 gtt act gat aaa ctg aaa att ggg aaa aaa tta gtg gat gaa aaa atc 576 Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile 175 180 185 190 ttg aat aaa tac tta ccg gaa ggt gca att tca agg cac act atg cgt 624 Leu Asn Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg 195 200 205 gaa tta att gac tct att cag tta gtt ggc gcc gat gaa ttt cac tgt 672 Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys 210 215 220 tct gag gttagatttt gaaattttgc ttgatcttta aattaaaggt ttgaactttg 728 Ser Glu tgaatgttgg cagatatgga atacaataat ggattttgtt tgatctgttt aatgaagatt 788 gtctagaacc tcattgttat aaatatggtt tgtttgcttc attaattaaa gagcattcct 848 taaaatctcg actagatgcc agataacacc agttagttga cttttggatt atggattttt 908 tttcatttaa tcagataaga tagtcattct taaatgtttc actaaagaat ttgtcatgat 968 ttcagtgtat atctttaagt gtatttggaa ttttggattt ggatctagta ctgaatgggt 1028 aactgcactt gtactcccca gtcatctggg gaggagcaac agattaaatt caagggttga 1088 aaagtaatac agagtcagaa attaaccaca agttggaaaa tggtaaatgt atgtggtcta 1148 agatgattac tcctataact tttgatgtct aacatggaga aagttagttg atttatgctc 1208 tttacttttc cctttattga ttttggtttt caaattctat caattccttt gtttgattgc 1268 tactcagatt gaaccttaga cggagtagca atagaaaagt gaagaaaagc cattttttct 1328 cctttcatct ctttatttct gttttacaca cagaatatgg tagcatctgt ctgaactagt 1388 taattttatt ccttaaaatt tgcataacta attcgagtaa atgccttttg aagctttagt 1448 tgtacaactg gttgttgcat tttgaggact atcgacttga tttgacagtg tctgatacat 1508 ggcttgtaag ttatgaaaac ttatatctag gaagaaatcc caaccagaga tagggagctg 1568 tcgcttggtt atgagctact ggctcaaagt tcgagtttga ccagttaatt ttagatcttc 1628 ggagtctaat caaattctga agcagtattg tgcactaata agaggaacac atcaaggatg 1688 tagcactgcc aggttatgtt accttattta ctaatgattg agaaccagct taaatgatga 1748 caaatggtct tagatttgtt ttttacattg ctcatgactt tgggatattt ctggatcaac 1808 attttccagt tctttatgta cttatcaaaa aattatccct gctagagcct agatgttagt 1868 gttcaagcaa ccatgctagc ttttaaggaa gctccttctt tgattcatgc catctttccg 1928 taatcgatgc cttacgttac tgtcattttt ctaattttca tttcag tgg att gag 1983 Trp Ile Glu 225 gag ccg tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc cac 2031 Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His 230 235 240 aca gtt acc gat tgg tat agt gca tac gtg gca tcc agg gtt act ggc 2079 Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly 245 250 255 ttg ccc agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag 2124 Leu Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu 260 265 270 gtatgtttga aagtattgat aacgatggca tgcattgtac tgtgttatgg atgaaagaaa 2184 tgaaatcagc aattattttc tagcaggcaa tgctcttgag atgcttgtgt caaattggtc 2244 agacttaatc ctgagtttcc atttgtttca gctttctgtt tgactgacta caataattgt 2304 cccaatacct agttgttccg gttggctcat tcttacttct atttacgtgt cactgtttct 2364 ctgaatggtc cctttgtggt gaaaagtgct tttgctatga agaaaaacta gcaaagattt 2424 catttctggg acaatttatt tttaccttac atcacgtctc ataaaattgc ttcctattgc 2484 atactttaat tcttggagag atgctttaat gtgaagaaag ttctttcact ccacttttaa 2544 ttcttggaga gatgctttaa tgtgaagaaa gttctttcac tccactactg taagcttgct 2604 gcatgaattt tacttggcca tattgggggc gtgttttgat ttatcttcaa attcattttc 2664 ttcatgtaat tcttttgagt aatttttttt tctgttttct gtttgggaaa aaattcag 2722 aca caa ttg gag gaa aca tgg aaa gca ctc ttt tca agc ctc act tat 2770 Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr 275 280 285 290 gct aag aac ttt agt ggc cca gtt tgt ttc cgt cac gcc gtt ctc tcg 2818 Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val Leu Ser 295 300 305 cct ttg gga tat gaa act gcc ctg ttt aag gga ctg aca gaa act ata 2866 Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Thr Glu Thr Ile 310 315 320 gat tgt aat gga gct tct gcc cat gat ttg tgg caa aat cct gat gat 2914 Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp 325 330 335 aag aga act gca cgg ttg tcc gag ttt ggg gag atg atc agg gca gcc 2962 Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala 340 345 350 ttt gga ttt cct gtg gat aga cag aac atc cca agg aca gtc aca ggc 3010 Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly 355 360 365 370 cct aat gtc ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt 3058 Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg 375 380 385 cat ggt gga aag gta cag tct agg ctt agc aat gaa gag caa gta ttt 3106 His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe 390 395 400 gat tcc ata aag agc tgg gcc ttg aac cac tcg gag tgc aaa tta aat 3154 Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn 405 410 415 gta att aac gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga 3202 Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg 420 425 430 gca atc caa gat gca tct gtc att gtc ggc gct cat gga gca ggt cta 3250 Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu 435 440 445 450 act cac ata gtt tct gca gca cca aaa gct gta ata cta gaa att ata 3298 Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile 455 460 465 agc agc gaa tat agg cgc ccc cat ttt gct ctg att gca caa tgg aaa 3346 Ser Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys 470 475 480 gga ttg gag tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct 3394 Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro 485 490 495 cca gtt gtg atc ga 3408 Pro Val Val Ile 500 <210> 8 <211> 502 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 8 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser 1 5 10 15 Ser His Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His Phe Pro 20 25 30 Asn Thr Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp Asn Phe 35 40 45 His Ser Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile Leu Pro 50 55 60 Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg Ser Cys 65 70 75 80 Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys 85 90 95 Thr Ser Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val Ser Gly 100 105 110 Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser 115 120 125 Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met 130 135 140 Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp 145 150 155 160 Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr 165 170 175 Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile Leu Asn 180 185 190 Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu 195 200 205 Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys Ser Glu 210 215 220 Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn 225 230 235 240 Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg 245 250 255 Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His 260 265 270 Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu 275 280 285 Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val 290 295 300 Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Thr Glu 305 310 315 320 Thr Ile Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro 325 330 335 Asp Asp Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg 340 345 350 Ala Ala Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val 355 360 365 Thr Gly Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His 370 375 380 Pro Arg His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln 385 390 395 400 Val Phe Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys 405 410 415 Leu Asn Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys Glu Gln 420 425 430 Val Arg Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala 435 440 445 Gly Leu Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu 450 455 460 Ile Ile Ser Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln 465 470 475 480 Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala 485 490 495 Asp Pro Pro Val Val Ile 500 <210> 9 <211> 3385 <212> DNA <213> Artificial <220> <223> XylTg3Nt <220> <221> CDS <222> (7)..(657) <220> <221> Intron <222> (658)..(1953) <220> <221> CDS <222> (1954)..(2103) <220> <221> Intron <222> (2104)..(2701) <220> <221> CDS <222> (2702)..(3385) <400> 9 cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr 1 5 10 ttc tct tcc cac cct gat cac ttc cgc cac aaa tcc cgc caa aac cac 96 Phe Ser Ser His Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His 15 20 25 30 ttt tcc ttg tcg gaa aac cgc cat cat aat ttc cac tct tca atc act 144 Phe Ser Leu Ser Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr 35 40 45 tct caa tat tcc aag cct tgg cct att ttg ccc tcc tac ctc cct tgg 192 Ser Gln Tyr Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp 50 55 60 tct caa aac cct aat gtt gtt tgg aga tcg tgc gag ggt tac ttc ggt 240 Ser Gln Asn Pro Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly 65 70 75 aat ggg ttt act ctc aaa gtt gac ctt ctc aaa act tcg ccg gag ttt 288 Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe 80 85 90 cac cgg aaa ttc ggc gaa aac acc gtc tcc ggc gac ggc gga tgg ttt 336 His Arg Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe 95 100 105 110 agg tgt ttt ttc agt gag act ttg cag agt tcg atc tgc gag gga ggc 384 Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly 115 120 125 gca ata cga atg aat ccg gac gag att ttg atg tct cgt gga ggt gag 432 Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu 130 135 140 aaa ttg gag tcg gtt att ggt agg agt gaa gat gat gag ctg ccc gtg 480 Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val 145 150 155 ttc aaa aat gga gct ttt cag att aaa gtt act gat aaa ctg aaa att 528 Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile 160 165 170 ggg aaa aaa tta gtg gat gaa aaa atc ttg aat aaa tac tta ccg gaa 576 Gly Lys Lys Leu Val Asp Glu Lys Ile Leu Asn Lys Tyr Leu Pro Glu 175 180 185 190 ggt gca att tca agg cac act atg cgt gaa tta att gac tct att cag 624 Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln 195 200 205 tta gtt ggc gcc gat gaa ttt cac tgt tct gag gttagatttt gaaattttgc 677 Leu Val Gly Ala Asp Glu Phe His Cys Ser Glu 210 215 ttgatcttta aattaaaggt ttgaactttg tgaatgttgg cagatatgga atacaataat 737 ggattttgtt tgatctgttt aatgaagatt gtctagaacc tcattgttat aaatatggtt 797 tgtttgcttc attaattaaa gagcattcct taaaatctcg actagatgcc agataacacc 857 agttagttga cttttggatt atggattttt tttcatttaa tcagataaga tagtcattct 917 taaatgtttc actaaagaat ttgtcatgat ttcagtgtat atctttaagt gtatttggaa 977 ttttggattt ggatctagta ctgaatgggt aactgcactt gtactcccca gtcatctggg 1037 gaggagcaac agattaaatt caagggttga aaagtaatac agagtcagaa attaaccaca 1097 agttggaaaa tggtaaatgt atgtggtcta agatgattac tcctataact tttgatgtct 1157 aacatggaga aagttagttg atttatgctc tttacttttc cctttattga ttttggtttt 1217 caaattctat caattccttt gtttgattgc tactcagatt gaaccttaga cggagtagca 1277 atagaaaagt gaagaaaagc cattttttct cctttcatct ctttatttct gttttacaca 1337 cagaatatgg tagcatctgt ctgaactagt taattttatt ccttaaaatt tgcataacta 1397 attcgagtaa atgccttttg aagctttagt tgtacaactg gttgttgcat tttgaggact 1457 atcgacttga tttgacagtg tctgatacat ggcttgtaag ttatgaaaac ttatatctag 1517 gaagaaatcc caaccagaga tagggagctg tcgcttggtt atgagctact ggctcaaagt 1577 tcgagtttga ccagttaatt ttagatcttc ggagtctaat caaattctga agcagtattg 1637 tgcactaata agaggaacac atcaaggatg tagcactgcc aggttatgtt accttattta 1697 ctaatgattg agaaccagct taaatgatga caaatggtct tagatttgtt ttttacattg 1757 ctcatgactt tgggatattt ctggatcaac attttccagt tctttatgta cttatcaaaa 1817 aattatccct gctagagcct agatgttagt gttcaagcaa ccatgctagc ttttaaggaa 1877 gctccttctt tgattcatgc catctttccg taatcgatgc cttacgttac tgtcattttt 1937 ctaattttca tttcag tgg att gag gag ccg tca ctt ttg att aca cga ttt 1989 Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe 220 225 gag tat gca aac ctt ttc cac aca gtt acc gat tgg tat agt gca tac 2037 Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr 230 235 240 245 gtg gca tcc agg gtt act ggc ttg ccc agt cgg cca cat ttg gtt ttt 2085 Val Ala Ser Arg Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe 250 255 260 gta gat ggc cat tgt gag gtatgtttga aagtattgat aacgatggca 2133 Val Asp Gly His Cys Glu 265 tgcattgtac tgtgttatgg atgaaagaaa tgaaatcagc aattattttc tagcaggcaa 2193 tgctcttgag atgcttgtgt caaattggtc agacttaatc ctgagtttcc atttgtttca 2253 gctttctgtt tgactgacta caataattgt cccaatacct agttgttccg gttggctcat 2313 tcttacttct atttacgtgt cactgtttct ctgaatggtc cctttgtggt gaaaagtgct 2373 tttgctatga agaaaaacta gcaaagattt catttctggg acaatttatt tttaccttac 2433 atcacgtctc ataaaattgc ttcctattgc atactttaat tcttggagag atgctttaat 2493 gtgaagaaag ttctttcact ccacttttaa ttcttggaga gatgctttaa tgtgaagaaa 2553 gttctttcac tccactactg taagcttgct gcatgaattt tacttggcca tattgggggc 2613 gtgttttgat ttatcttcaa attcattttc ttcatgtaat tcttttgagt aatttttttt 2673 tctgttttct gtttgggaaa aaattcag aca caa ttg gag gaa aca tgg aaa 2725 Thr Gln Leu Glu Glu Thr Trp Lys 270 275 gca ctc ttt tca agc ctc act tat gct aag aac ttt agt ggc cca gtt 2773 Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val 280 285 290 tgt ttc cgt cac gcc gtt ctc tcg cct ttg gga tat gaa act gcc ctg 2821 Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu 295 300 305 ttt aag gga ctg aca gaa act ata gat tgt aat gga gct tct gcc cat 2869 Phe Lys Gly Leu Thr Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala His 310 315 320 gat ttg tgg caa aat cct gat gat aag aga act gca cgg ttg tcc gag 2917 Asp Leu Trp Gln Asn Pro Asp Asp Lys Arg Thr Ala Arg Leu Ser Glu 325 330 335 ttt ggg gag atg atc agg gca gcc ttt gga ttt cct gtg gat aga cag 2965 Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val Asp Arg Gln 340 345 350 355 aac atc cca agg aca gtc aca ggc cct aat gtc ctc ttt gtt aga cgt 3013 Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg Arg 360 365 370 gag gat tat tta gct cac cca cgt cat ggt gga aag gta cag tct agg 3061 Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val Gln Ser Arg 375 380 385 ctt agc aat gaa gag caa gta ttt gat tcc ata aag agc tgg gcc ttg 3109 Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys Ser Trp Ala Leu 390 395 400 aac cac tcg gag tgc aaa tta aat gta att aac gga ttg ttt gcc cac 3157 Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala His 405 410 415 atg tcc atg aaa gag caa gtt cga gca atc caa gat gca tct gtc att 3205 Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val Ile 420 425 430 435 gtt ggt gct cat gga gca ggt cta act cac ata gtt tct gca gca cca 3253 Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala Pro 440 445 450 aaa gct gta ata cta gaa att ata agc agc gaa tat agg cgc ccc cat 3301 Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg Arg Pro His 455 460 465 ttt gct ctg att gca caa tgg aaa gga ttg gag tac cat ccc ata tat 3349 Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr 470 475 480 ttg gag ggg tct tat gcg gat cct cca gtt gtg atc 3385 Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val Ile 485 490 495 <210> 10 <211> 495 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 10 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser 1 5 10 15 Ser His Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His Phe Ser 20 25 30 Leu Ser Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr Ser Gln 35 40 45 Tyr Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln 50 55 60 Asn Pro Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly 65 70 75 80 Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His Arg 85 90 95 Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys 100 105 110 Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile 115 120 125 Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys Leu 130 135 140 Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val Phe Lys 145 150 155 160 Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile Gly Lys 165 170 175 Lys Leu Val Asp Glu Lys Ile Leu Asn Lys Tyr Leu Pro Glu Gly Ala 180 185 190 Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val 195 200 205 Gly Ala Asp Glu Phe His Cys Ser Glu Trp Ile Glu Glu Pro Ser Leu 210 215 220 Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp 225 230 235 240 Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro Ser Arg 245 250 255 Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu Glu 260 265 270 Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser 275 280 285 Gly Pro Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu 290 295 300 Thr Ala Leu Phe Lys Gly Leu Thr Glu Thr Ile Asp Cys Asn Gly Ala 305 310 315 320 Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Arg Thr Ala Arg 325 330 335 Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val 340 345 350 Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe 355 360 365 Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val 370 375 380 Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys Ser 385 390 395 400 Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu 405 410 415 Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala 420 425 430 Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser 435 440 445 Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg 450 455 460 Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His 465 470 475 480 Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val Ile 485 490 495 <210> 11 <211> 3298 <212> DNA <213> Artificial <220> <223> XylTg14Nb <220> <221> CDS <222> (7)..(657) <220> <221> Intron <222> (658)..(1917) <220> <221> CDS <222> (1918)..(2067) <220> <221> Intron <222> (2068)..(2612) <220> <221> CDS <222> (2613)..(3290) <400> 11 cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr 1 5 10 ttc tct tcc cac cct gat cac tct cgt cgc aaa tcc ccc cag aac cac 96 Phe Ser Ser His Pro Asp His Ser Arg Arg Lys Ser Pro Gln Asn His 15 20 25 30 ttt tcc tcg tcg gaa aac cac cat cat aat ttc cac tct tca atc act 144 Phe Ser Ser Ser Glu Asn His His His Asn Phe His Ser Ser Ile Thr 35 40 45 tcc caa tat tcc agg cct tgg cct att ttg ccc tcc tac ctc cct tgg 192 Ser Gln Tyr Ser Arg Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp 50 55 60 tct caa aac cct aat gtt gct tgg aga tca tgc gag ggt tac ttc ggt 240 Ser Gln Asn Pro Asn Val Ala Trp Arg Ser Cys Glu Gly Tyr Phe Gly 65 70 75 aat ggt ttt act ctc aaa gtt gat ctt ctc aaa act tcg ccg gag ctt 288 Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Leu 80 85 90 cac cgg aaa ttc ggc gaa aac acc gtc ttc gga gac ggc gga tgg ttt 336 His Arg Lys Phe Gly Glu Asn Thr Val Phe Gly Asp Gly Gly Trp Phe 95 100 105 110 agg tgt ttc ttc agt gag act ttg cag agt tcg atc tgc gag gga ggc 384 Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly 115 120 125 gca ata cga atg aat cca gac gag att ttg atg tct cgt gga ggt gag 432 Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu 130 135 140 aaa ttg gag tcg gtt att ggt agg agt gaa gat gat gag gtg ccc gcg 480 Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Val Pro Ala 145 150 155 ttc aaa act gga gct ttt cag att aaa gtt act gat aaa ctg aaa ttt 528 Phe Lys Thr Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Phe 160 165 170 ggg aaa aaa tta gtg gat gaa aac ttc ttg aat aaa tac tta ccg gaa 576 Gly Lys Lys Leu Val Asp Glu Asn Phe Leu Asn Lys Tyr Leu Pro Glu 175 180 185 190 ggt gca att tca agg cac act atg cgt gag tta atc gac tct att cag 624 Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln 195 200 205 ttg gtt ggc gcc aat gat ttt cac tgt tct gag gttagatttt tgaaattttg 677 Leu Val Gly Ala Asn Asp Phe His Cys Ser Glu 210 215 tttgctcttt aaattaaagg tttgaacttt gtgaatgttg gcagatatag aatacaataa 737 tggaatttgc ttgatctgtt taatgaagat tgtctggaac ctcaatgcta taaatatttg 797 tttgtttgct tcattaatta aagagaatat cccaactaga tgccagataa caccagttag 857 ttgacttttg gatcggattg catttcattt aatcagatat ggtactcatt cttaaatgtt 917 tcactaaagt atttgtcaag atttcagagt ttatatgtag gtgtatttgg aattctggat 977 ttggatctag tattgaatgg attactgaac ttgtactccc cagtcatctg gggaggagca 1037 acagattaac ttcaagggtt gaaaagtaat actgagtcag aagttaacca cttcaacttg 1097 gaaaattgta aatgtgtgtg gtctaagatg attactctaa cttttgaggt ctaacatgga 1157 gaaagttagt tgatttatgc tctttacttt tccctttatt gattttggct tttaaattct 1217 atcaattcca ttgtttgatt gctactcaaa ttgaacctta gacggagtag caatagcaaa 1277 aagtgaagaa aggccatttt ttttctcctt tcatctctta atttccgttt tacacacaga 1337 atatggtaga atctgtttga agctttagtt gaatagttat acaactggtt attgcatttt 1397 gaggactatc gacttgattt gacactggac agtgtctgat acatggcttg taagttatga 1457 gaacttctat ctaggaagaa atcccaacca gagataggga gctgtcactt ggctatgagt 1517 tactggctca aagttcgagt ttgaccagtt aattttagat cctcaccagg ataacattta 1577 gagtctaatc aaattctgaa gcagtattgt gcactaataa gaggaacaca tgaaggatgt 1637 agcactacta ggttatgtta ccttatttac taataatgac tgacaaccag cttaattgat 1697 gacaaatggt cttatatttg ccttttacat tgctcatgac ttgggatatt tctgaatcag 1757 catttttcag ttctttatgt acttatcaaa aaattatccc tgctagatgt tagtgttcaa 1817 gcaaccatgc tagcatttaa cgaagctcct tctttgattc atgcgatctt tccgtaatct 1877 atgccttacg ttactgtcat ttttctaatt ttcatttcag tgg att gag gag ccg 1932 Trp Ile Glu Glu Pro 220 tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc cac aca att 1980 Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Ile 225 230 235 acc gat tgg tat agt gca tac gtg gca tcg agg gtt act ggc ttg ccc 2028 Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro 240 245 250 agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag gtatgtctga 2077 Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu 255 260 265 aagtattgat aacgatggca tgcattgtac tgtcttatgg atgaaagaaa tgaaaccagc 2137 aattattttc tagcaggcaa tgctcttgag atgcttgtgt caaattggtc agacttaatc 2197 ctgagtttcc atttgtttca gctttctgtg tgactgacta caataattgt cccgatacct 2257 aattgttgca gttggctcat tcttatttct atttacgtgt cactgtttct ctgaatggcc 2317 ctttgtggtg aaaagagctt ttgatatgta aaaaaactag caaagatttc atttctggaa 2377 caatttcttt ttaccttaca tcacgtgtca taaaattgct tctaactgta tactttaatt 2437 cttggagaga tgctttcatg tgaagaaagt tctttcactc cactactgga agcttgctgc 2497 atgaatttta cttggccata ttggggccgt gttttgattt atcttcaaat tcattttctt 2557 catgtagttc tttcgagtaa ttttttttcc tcttttctgt ttgaaaaaat ttcag aca 2615 Thr caa ttg gag gaa aca tgg aaa gca ctt ttt tca agc ctc act tat gct 2663 Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala 270 275 280 aag aac ttt agt ggc cca gtt tgt ttc cgt cat gcc gtc ctc tcg cct 2711 Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val Leu Ser Pro 285 290 295 300 ttg gga tat gaa act gcc ctg ttt aag gga ctg tca gaa act ata gat 2759 Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp 305 310 315 tgt aat gga gct tct gct cat gat ttg tgg caa aat cct gat gat aag 2807 Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys 320 325 330 aaa act gca cgg tta tcc gag ttt ggg gag atg atc agg gca gcc ttt 2855 Lys Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe 335 340 345 gga ttt cct gtt gat aga cag aac atc cca agg aca gtc aca ggc cct 2903 Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro 350 355 360 aat gtc ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt cat 2951 Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His 365 370 375 380 ggt gga aag gta cag tct agg ctt agc aat gaa gag caa gta ttt gat 2999 Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp 385 390 395 tcc ata aag agc tgg gcc tta aac cac tcg gag tgc aaa tta aat gta 3047 Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val 400 405 410 att agt gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga gca 3095 Ile Ser Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala 415 420 425 atc caa gat gct tct gtc att gtt ggt gct cat gga gca ggt cta acc 3143 Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr 430 435 440 cac ata gtt tct gca gca cca aaa gct gta ata cta gaa att ata agc 3191 His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser 445 450 455 460 agc gaa tat agg cgc ccc cat ttt gct ctg att gct caa tgg aaa gga 3239 Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly 465 470 475 ttg gag tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct cca 3287 Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro 480 485 490 gtt gtgatcga 3298 Val <210> 12 <211> 493 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 12 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser 1 5 10 15 Ser His Pro Asp His Ser Arg Arg Lys Ser Pro Gln Asn His Phe Ser 20 25 30 Ser Ser Glu Asn His His His Asn Phe His Ser Ser Ile Thr Ser Gln 35 40 45 Tyr Ser Arg Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln 50 55 60 Asn Pro Asn Val Ala Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly 65 70 75 80 Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Leu His Arg 85 90 95 Lys Phe Gly Glu Asn Thr Val Phe Gly Asp Gly Gly Trp Phe Arg Cys 100 105 110 Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile 115 120 125 Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys Leu 130 135 140 Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Val Pro Ala Phe Lys 145 150 155 160 Thr Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Phe Gly Lys 165 170 175 Lys Leu Val Asp Glu Asn Phe Leu Asn Lys Tyr Leu Pro Glu Gly Ala 180 185 190 Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val 195 200 205 Gly Ala Asn Asp Phe His Cys Ser Glu Trp Ile Glu Glu Pro Ser Leu 210 215 220 Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Ile Thr Asp 225 230 235 240 Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro Ser Arg 245 250 255 Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu Glu 260 265 270 Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser 275 280 285 Gly Pro Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu 290 295 300 Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn Gly Ala 305 310 315 320 Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Lys Thr Ala Arg 325 330 335 Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val 340 345 350 Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe 355 360 365 Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val 370 375 380 Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys Ser 385 390 395 400 Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Ser Gly Leu 405 410 415 Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala 420 425 430 Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser 435 440 445 Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg 450 455 460 Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His 465 470 475 480 Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val 485 490 <210> 13 <211> 3574 <212> DNA <213> Artificial <220> <223> XylTg19Nb <220> <221> CDS <222> (7)..(648) <220> <221> Intron <222> (649)..(2194) <220> <221> CDS <222> (2195)..(2344) <220> <221> Intron <222> (2345)..(2888) <220> <221> CDS <222> (2889)..(3566) <400> 13 cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr 1 5 10 ttc tct tcc cac cct gat cac aaa tcc ccc caa aac cac ttt tcc ttg 96 Phe Ser Ser His Pro Asp His Lys Ser Pro Gln Asn His Phe Ser Leu 15 20 25 30 tcg gaa aac cac cat cat aat ttc cac tct tca atc act tct caa tat 144 Ser Glu Asn His His His Asn Phe His Ser Ser Ile Thr Ser Gln Tyr 35 40 45 tcc aag cct tgg cct att ttg ccc tcc tac ctc cct tgg tct caa aac 192 Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn 50 55 60 cct aat gtt gct tgg aga tcg tgc gag ggt tac ttc ggt aat ggg ttt 240 Pro Asn Val Ala Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe 65 70 75 act ctc aaa gtt gac ctt ctc aaa act tcg ccg gag ttt cac cgg aaa 288 Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His Arg Lys 80 85 90 ttc ggc gat aac acc gtc tcc ggt gac ggc gga tgg ttt agg tgt ttt 336 Phe Gly Asp Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe 95 100 105 110 ttc agt gag act ttg cag agt tcg atc tgc gag gga ggc gca ata cga 384 Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg 115 120 125 atg aat ccg gac gat att ttg atg tct cgt gga ggt gag aaa ttg gag 432 Met Asn Pro Asp Asp Ile Leu Met Ser Arg Gly Gly Glu Lys Leu Glu 130 135 140 tcg gtt att ggt agg aat gaa gat gat gag ctg ccc atg ttc aaa aat 480 Ser Val Ile Gly Arg Asn Glu Asp Asp Glu Leu Pro Met Phe Lys Asn 145 150 155 gga gct ttc caa att gaa gtt act gat aaa ctg aaa att ggg aaa aaa 528 Gly Ala Phe Gln Ile Glu Val Thr Asp Lys Leu Lys Ile Gly Lys Lys 160 165 170 cta gtg gat aaa aaa ttc ttg aat aaa tac tta ccg gga ggt gcg att 576 Leu Val Asp Lys Lys Phe Leu Asn Lys Tyr Leu Pro Gly Gly Ala Ile 175 180 185 190 tca agg cac act atg cgt gag tta att gac tct att cag ttg gtt ggc 624 Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val Gly 195 200 205 gcc gat gaa ttt cac tgt tct gag gttagatttt gatatttatt tgatctttaa 678 Ala Asp Glu Phe His Cys Ser Glu 210 attagaggtt tgaactttgt taatgttggc agatatggaa tacaataatg gattttgttt 738 gatctgttta atgaagattg tctaaaacct caatgctata aatatttgtt tgtttgcttc 798 attaattaaa gagaatatcc cgactagatg ccagataaca ccagttagtt gacttttgga 858 ttgggttgca tttcatttaa tcagatatgg tactcattct taaatgtttc actaaagaat 918 ttgtcaagat ttcagagttt atatataggt gtatttggaa ttctggattt ggatctagta 978 ttgaatggat tactgaattt gtactcccca gtcatcaggg gaggagcaat agatcgaatt 1038 caagggttga aaagtaatac tgagtcagaa attaaccact ttaacttgga aacggtaaat 1098 gtatgtgttc taagatgatt attcctataa cttttgatgt ctaatatgga gaaagtgagt 1158 tgatttatgc tttttccttt tccctttatt gatgttggtt tttaaattct atcaattcct 1218 ttgtttggtt gctactcaaa ttgaacctta gacggagtag caatagcaaa aagtgaagaa 1278 aggacatttt tttctccttt catctcttta tttccgtttg acatacagaa tacggtagca 1338 tctgcctgaa gtggttaatt tcattcctta aaatttgcat aactaatatt tccgtttttg 1398 tttttgttta tcttttccat tggcatgcca tgttattttt ggtttaggtt tacataatta 1458 tttatgtgat ttctgatgga gttactaatg attttttgtt tttgtttttg tttttttctt 1518 ttccttttcc tgagtcgagg gtcgattgga aatagcctct ctgccctttt ggataggggt 1578 aaggcctggg tacgtgtacc atccccagac cccactctgt gggactatac cgggtagttg 1638 ttgttgttgt aattcgagta aatgcctttt gaacctttag ttgaatagtt gtacaactgg 1698 ttgttgcatt ttgaggacta tcgacttgat ttgacacttt acatgaaaac ttttatctag 1758 gaagaaatcc ctaccagaga tagggagctg tcgcttggtt atgagctact ggcttaaagt 1818 ttgagtttga cctattaatt ttagatcttc accaggataa catctagagt ttaattaaat 1878 tctcaagcag tattttgcac taataagggg aacacatgaa ggatgtagca ctactacgtt 1938 atgttcttta tttactattg attgacaacc agcttaaatg atgacaaatg gtcttatatt 1998 tgctttttta cattgctcat gacttgggat atttttgaat caacattttt cggttcttta 2058 tgtacttatc aaaaaattat ccctgctaga tgttagtgtt caagcaacat gctagctttt 2118 aaggaagctc cttctttgat tcatgccatc tttccgaagc cttacgtttc tgtcattttt 2178 ctaattttca tttcag tgg gtt gag gag ccg tca ctt ttg att aca cga ttt 2230 Trp Val Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe 215 220 225 gag tat gca aac ctt ttc cac aca gtt acc gat tgg tat agt gca tac 2278 Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr 230 235 240 gcg gca tcc agg gtt act ggt ttg ccc agt cgg cca aat ttg gtt ttt 2326 Ala Ala Ser Arg Val Thr Gly Leu Pro Ser Arg Pro Asn Leu Val Phe 245 250 255 gta gat ggc cat tgt gag gtatgtttga cagtattgat aacgatggca 2374 Val Asp Gly His Cys Glu 260 tgcattgtac tgtgttatgg atgaaagaaa tgaaaccatc aattattttc tagtaggcaa 2434 tgctcttaag atgcttgtgt caaattggtt agagttaatc ctaagtttcc atttgtttga 2494 gctttctgtt tgactgacta caatacttgt cccaatacct agttgttgcg gttggctcat 2554 tcttacttct atttacgtgt cactgtttct ctgaatggtc cctttgtggt gaaaagagct 2614 tttgctatgt agaaaaacta gcaaagattt catttctgga gcaacttatt tttaccttac 2674 atcacgtctc ataaaattgc ttctaactgt atactttaat tcttggagag atgctttcat 2734 gtgaataaag ttctttcact ccactactgg aagcttgctg catgaaattt acttggccat 2794 actggggccg tgttttgatt tgtcttcaaa ttcattttct tcatgtagtt ctttcgagta 2854 atattttttc ctcttctgtt tgaaaaaaat tcag aca caa ttg gag gaa aca tgg 2909 Thr Gln Leu Glu Glu Thr Trp 265 270 aaa gca ctt ttt tca agc ctc act tat gct aag aac ttt agt ggc cca 2957 Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro 275 280 285 gtt tgt ttc cgt cat gct gtc ctc tcg cct tta gga tat gaa act gcc 3005 Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala 290 295 300 ctg ttt aag gga ctg tca gaa act ata gat tgt aat gga gct tct gct 3053 Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala 305 310 315 cat gat ttg tgg caa aag cct gat gat aaa aaa act gca cgg ttg tcc 3101 His Asp Leu Trp Gln Lys Pro Asp Asp Lys Lys Thr Ala Arg Leu Ser 320 325 330 335 gag ttt ggg gag atg atc agg gca gcc ttt gga ttt cct gtg gat aga 3149 Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val Asp Arg 340 345 350 cag aac atc cca agg aca gtc aca ggc cct aat gtc ctc ttt gtt aga 3197 Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg 355 360 365 cgt gag gat tat tta gct cac cca cgt cat ggt gga aag gta cag tct 3245 Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val Gln Ser 370 375 380 agg ctt agc aat gaa gag cta gta ttt gat tcc ata aag agc tgg gcc 3293 Arg Leu Ser Asn Glu Glu Leu Val Phe Asp Ser Ile Lys Ser Trp Ala 385 390 395 ttg aac cac tcg gag tgt aaa tta aat gta att aac gga ttg ttt gcc 3341 Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala 400 405 410 415 cac atg tcc atg aaa gag caa gtt cga gca atc caa gat gct tct gtc 3389 His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val 420 425 430 att gtt ggt gct cat gga gca ggt cta act cac ata gtt tct gca gca 3437 Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala 435 440 445 cca aaa gct gta ata cta gaa att ata agc agc gaa tat agg cgc ccc 3485 Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg Arg Pro 450 455 460 cat ttt gct ctg att gca caa tgg aaa gga ttg gag tac cat ccc ata 3533 His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile 465 470 475 tat ttg gag ggg tct tat gcg gat cct cca gtt gtgatcga 3574 Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val 480 485 490 <210> 14 <211> 490 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 14 Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser 1 5 10 15 Ser His Pro Asp His Lys Ser Pro Gln Asn His Phe Ser Leu Ser Glu 20 25 30 Asn His His His Asn Phe His Ser Ser Ile Thr Ser Gln Tyr Ser Lys 35 40 45 Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn 50 55 60 Val Ala Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu 65 70 75 80 Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His Arg Lys Phe Gly 85 90 95 Asp Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser 100 105 110 Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met Asn 115 120 125 Pro Asp Asp Ile Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser Val 130 135 140 Ile Gly Arg Asn Glu Asp Asp Glu Leu Pro Met Phe Lys Asn Gly Ala 145 150 155 160 Phe Gln Ile Glu Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu Val 165 170 175 Asp Lys Lys Phe Leu Asn Lys Tyr Leu Pro Gly Gly Ala Ile Ser Arg 180 185 190 His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala Asp 195 200 205 Glu Phe His Cys Ser Glu Trp Val Glu Glu Pro Ser Leu Leu Ile Thr 210 215 220 Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser 225 230 235 240 Ala Tyr Ala Ala Ser Arg Val Thr Gly Leu Pro Ser Arg Pro Asn Leu 245 250 255 Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys 260 265 270 Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val 275 280 285 Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu 290 295 300 Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala His 305 310 315 320 Asp Leu Trp Gln Lys Pro Asp Asp Lys Lys Thr Ala Arg Leu Ser Glu 325 330 335 Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val Asp Arg Gln 340 345 350 Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg Arg 355 360 365 Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val Gln Ser Arg 370 375 380 Leu Ser Asn Glu Glu Leu Val Phe Asp Ser Ile Lys Ser Trp Ala Leu 385 390 395 400 Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala His 405 410 415 Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val Ile 420 425 430 Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala Pro 435 440 445 Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg Arg Pro His 450 455 460 Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr 465 470 475 480 Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val 485 490 <210> 15 <211> 27 <212> DNA <213> Artificial <220> <223> oligonucleotide XylF8 <400> 15 cacctctcgc ctttgggata tgaaact 27 <210> 16 <211> 24 <212> DNA <213> Artificial <220> <223> oligonucleotide XylR8 <400> 16 acagcttttg gtgctgcaga aact 24 <210> 17 <211> 473 <212> DNA <213> Artificial <220> <223> XylTi4Nt <400> 17 cacctctcgc ctttgggata tgaaactgcc ctgtttaagg gactgacaga aactatagat 60 tgtaatggag cttctgccca tgatttgtgg caaaatcctg atgataagag aactgcacgg 120 ttgtccgagt ttggggagat gatcagggca gcctttggat ttcctgtgga tagacagaac 180 atcccaagga cagtcacagg ccctaatgtc ctctttgtta gacgtgagga ttatttagct 240 cacccacgtc atggtggaaa ggtacagtct aggcttagca atgaagagca agtatttgat 300 tccataaaga gctgggcctt gaaccactcg gagtgcaaat taaatgtaat taacggattg 360 tttgcccaca tgtccatgaa agagcaagtt cgagcaatcc aagatgcatc tgtcattgtt 420 ggtgctcatg gagcaggtct aactcacata gtttctgcag caccaaaagc tgt 473 <210> 18 <211> 7954 <212> DNA <213> Artificial <220> <223> T-DNA of pTKW20 <220> <221> misc_feature <222> (1)..(619) <223> right border <220> <221> misc_feature <222> (969)..(2314) <223> sequence including the promoter region of the Cauliflower Mosaic Virus 35S transcript (Odell et al., 1985) <220> <221> misc_feature <222> (2365)..(2834) <223> sequence including a part of the Nicotiana tabacum cv. Petite Havana SR1 XylT cDNA sequence cloned in sense orientation <220> <221> misc_feature <222> (2893)..(3088) <223> sequence including the intron of the catase-1 gene from castor bean <220> <221> misc_feature <222> (3130)..(3871) <223> sequence containing the second intron of the pyruvate orthophosphate dikinase gene from Flaveria trinervia as described by Rosche and Westhoff (1995) in reverse orientation <220> <221> misc_feature <222> (3957)..(4426) <223> sequence including a part of the Nicotiana tabacum cv. Petite Havana SR1 XylT cDNA sequence cloned in antisense orientation <220> <221> misc_feature <222> (4479)..(5244) <223> sequence including the 3?untranslated region of the octopine synthase gene of Agrobacterium tumefaciens as described by De Greve et al. (1982) <220> <221> misc_feature <222> (5512)..(5744) <223> sequence including the promoter region of the nopaline synthase gene of Agrobacterium tumefaciens T-DNA <220> <221> misc_feature <222> (5745)..(6690) <223> sequence including the nptII antibiotic resistance gene <220> <221> misc_feature <222> (6691)..(7396) <223> sequence including the 3?untranslated region of the nopaline synthase gene of A. tumefaciens T-DNA <220> <221> misc_feature <222> (7397)..(7954) <223> left border <400> 18 tcgacatctt gctgcgttcg gatattttcg tggagttccc gccacagacc cggattgaag 60 gcgagatcca gcaactcgcg ccagatcatc ctgtgacgga actttggcgc gtgatgactg 120 gccaggacgt cggccgaaag agcgacaagc agatcacgat tttcgacagc gtcggatttg 180 cgatcgagga tttttcggcg ctgcgctacg tccgcgaccg cgttgaggga tcaagccaca 240 gcagcccact cgaccttcta gccgacccag acgagccaag ggatcttttt ggaatgctgc 300 tccgtcgtca ggctttccga cgtttgggtg gttgaacaga agtcattatc gtacggaatg 360 ccagcactcc cgaggggaac cctgtggttg gcatgcacat acaaatggac gaacggataa 420 accttttcac gcccttttaa atatccgtta ttctaataaa cgctcttttc tcttaggttt 480 acccgccaat atatcctgtc aaacactgat agtttaaact gaaggcggga aacgacaatc 540 tgatcatgag cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa 600 gccgttttac gtttggaact gacagaaccg caacgattga aggagccact cagccccaat 660 acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt 720 tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta 780 ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg 840 ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat ttaggtgaca 900 ctatagaata ctcaagctat gcatccaacg cgttgggagc tctcccatat cgacctgcag 960 gcggccgctc gacgaattaa ttccaatccc acaaaaatct gagcttaaca gcacagttgc 1020 tcctctcaga gcagaatcgg gtattcaaca ccctcatatc aactactacg ttgtgtataa 1080 cggtccacat gccggtatat acgatgactg gggttgtaca aaggcggcaa caaacggcgt 1140 tcccggagtt gcacacaaga aatttgccac tattacagag gcaagagcag cagctgacgc 1200 gtacacaaca agtcagcaaa cagacaggtt gaacttcatc cccaaaggag aagctcaact 1260 caagcccaag agctttgcta aggccctaac aagcccacca aagcaaaaag cccactggct 1320 cacgctagga accaaaaggc ccagcagtga tccagcccca aaagagatct cctttgcccc 1380 ggagattaca atggacgatt tcctctatct ttacgatcta ggaaggaagt tcgaaggtga 1440 aggtgacgac actatgttca ccactgataa tgagaaggtt agcctcttca atttcagaaa 1500 gaatgctgac ccacagatgg ttagagaggc ctacgcagca ggtctcatca agacgatcta 1560 cccgagtaac aatctccagg agatcaaata ccttcccaag aaggttaaag atgcagtcaa 1620 aagattcagg actaattgca tcaagaacac agagaaagac atatttctca agatcagaag 1680 tactattcca gtatggacga ttcaaggctt gcttcataaa ccaaggcaag taatagagat 1740 tggagtctct aaaaaggtag ttcctactga atctaaggcc atgcatggag tctaagattc 1800 aaatcgagga tctaacagaa ctcgccgtga agactggcga acagttcata cagagtcttt 1860 tacgactcaa tgacaagaag aaaatcttcg tcaacatggt ggagcacgac actctggtct 1920 actccaaaaa tgtcaaagat acagtctcag aagaccaaag ggctattgag acttttcaac 1980 aaaggataat ttcgggaaac ctcctcggat tccattgccc agctatctgt cacttcatcg 2040 aaaggacagt agaaaaggaa ggtggctcct acaaatgcca tcattgcgat aaaggaaagg 2100 ctatcattca agatctctct gccgacagtg gtcccaaaga tggaccccca cccacgagga 2160 gcatcgtgga aaaagaagac gttccaacca cgtcttcaaa gcaagtggat tgatgtgaca 2220 tctccactga cgtaagggat gacgcacaat cccactatcc ttcgcaagac ccttcctcta 2280 tataaggaag ttcatttcat ttggagagga cacgctcgag acaagtttgt acaaaaaagc 2340 aggctccgcg gccgccccct tcacctctcg cctttgggat atgaaactgc cctgtttaag 2400 ggactgacag aaactataga ttgtaatgga gcttctgccc atgatttgtg gcaaaatcct 2460 gatgataaga gaactgcacg gttgtccgag tttggggaga tgatcagggc agcctttgga 2520 tttcctgtgg atagacagaa catcccaagg acagtcacag gccctaatgt cctctttgtt 2580 agacgtgagg attatttagc tcacccacgt catggtggaa aggtacagtc taggcttagc 2640 aatgaagagc aagtatttga ttccataaag agctgggcct tgaaccactc ggagtgcaaa 2700 ttaaatgtaa ttaacggatt gtttgcccac atgtccatga aagagcaagt tcgagcaatc 2760 caagatgcat ctgtcattgt tggtgctcat ggagcaggtc taactcacat agtttctgca 2820 gcaccaaaag ctgtaagggt gggcgcgccg acccagcttt cttgtacaaa gtggtctaga 2880 ggatccaagc ttgtgcaggt aaatttctag tttttctcct tcattttctt ggttaggacc 2940 cttttctctt tttatttttt tgagctttga tctttcttta aactgatcta ttttttaatt 3000 gattggttat ggcgcaaata ttacatagct ttaactgata atctgattac tttatttcgt 3060 gtgtctatga tgatgatgat aactgcagcg caagcttatc gatttcgaac ccagcttccc 3120 aactgtaatc aatccaaatg taagatcaat gataacacaa tgacatgatc tatcatgtta 3180 ccttgtttat tcatgttcga ctaattcatt taattaatag tcaatccatt tagaagttaa 3240 taaaactaca agtattattt agaaattaat aagaatgttg attgaaaata atactatata 3300 aaatgataga tcttgcgctt tgttatatta gcattagatt atgttttgtt acattagatt 3360 actgtttcta ttagtttgat attatttgtt actttagctt gttatttaat attttgttta 3420 ttgataaatt acaagcagat tggaatttct aacaaaatat ttattaactt ttaaactaaa 3480 atatttagta atggtataga tatttaatta tataataaac tattaatcat aaaaaaatat 3540 tattttaatt tatttattct tatttttact atagtatttt atcattgata tttaattcat 3600 caaaccagct agaattacta ttatgattaa aacaaatatt aatgctagta tatcatctta 3660 catgttcgat caaattcatt aaaaataata tacttactct caacttttat cttcttcgtc 3720 ttacacatca cttgtcatat ttttttacat tactatgttg tttatgtaaa caatatattt 3780 ataaattatt ttttcacaat tataacaact atattattat aatcatacta attaacatca 3840 cttaactatt ttatactaaa aggaaaaaag aaaataatta tttccttacc aagctggggt 3900 accgaattcc tcgagaccac tttgtacaag aaagctgggt cggcgcgccc acccttacag 3960 cttttggtgc tgcagaaact atgtgagtta gacctgctcc atgagcacca acaatgacag 4020 atgcatcttg gattgctcga acttgctctt tcatggacat gtgggcaaac aatccgttaa 4080 ttacatttaa tttgcactcc gagtggttca aggcccagct ctttatggaa tcaaatactt 4140 gctcttcatt gctaagccta gactgtacct ttccaccatg acgtgggtga gctaaataat 4200 cctcacgtct aacaaagagg acattagggc ctgtgactgt ccttgggatg ttctgtctat 4260 ccacaggaaa tccaaaggct gccctgatca tctccccaaa ctcggacaac cgtgcagttc 4320 tcttatcatc aggattttgc cacaaatcat gggcagaagc tccattacaa tctatagttt 4380 ctgtcagtcc cttaaacagg gcagtttcat atcccaaagg cgagaggtga agggggcggc 4440 cgcggagcct gcttttttgt acaaacttgt ctagagtcct gctttaatga gatatgcgag 4500 acgcctatga tcgcatgata tttgctttca attctgttgt gcacgttgta aaaaacctga 4560 gcatgtgtag ctcagatcct taccgccggt ttcggttcat tctaatgaat atatcacccg 4620 ttactatcgt atttttatga ataatattct ccgttcaatt tactgattgt accctactac 4680 ttatatgtac aatattaaaa tgaaaacaat atattgtgct gaataggttt atagcgacat 4740 ctatgataga gcgccacaat aacaaacaat tgcgttttat tattacaaat ccaattttaa 4800 aaaaagcggc agaaccggtc aaacctaaaa gactgattac ataaatctta ttcaaatttc 4860 aaaaggcccc aggggctagt atctacgaca caccgagcgg cgaactaata acgttcactg 4920 aagggaactc cggttccccg ccggcgcgca tgggtgagat tccttgaagt tgagtattgg 4980 ccgtccgctc taccgaaagt tacgggcacc attcaacccg gtccagcacg gcggccgggt 5040 aaccgacttg ctgccccgag aattatgcag catttttttg gtgtatgtgg gccccaaatg 5100 aagtgcaggt caaaccttga cagtgacgac aaatcgttgg gcgggtccag ggcgaatttt 5160 gcgacaacat gtcgaggctc agcaggacct gcaggcatgc aagctagctt actagtgatg 5220 catattctat agtgtcacct aaatctgcgg ccgcactagt gatatcccgc ggccatggcg 5280 gccgggagca tgcgacgtcg ggcccaattc gccctatagt gagtcgtatt acaattcact 5340 ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 5400 tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 5460 ttcccaacag ttgcgcagcc tgaatggcga atggaaattg taaacgttaa tgggtttctg 5520 gagtttaatg agctaagcac atacgtcaga aaccattatt gcgcgttcaa aagtcgccta 5580 aggtcactat cagctagcaa atatttcttg tcaaaaatgc tccactgacg ttccataaat 5640 tcccctcggt atccaattag agtctcatat tcactctcaa tccaaataat ctgcaatggc 5700 aattacctta tccgcaactt ctttacctat ttccgcccgg atccgggcag gttctccggc 5760 cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 5820 tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 5880 gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac 5940 gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 6000 attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 6060 atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 6120 cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 6180 cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 6240 gctcaaggcg cgcatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt 6300 gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 6360 tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 6420 cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 6480 catcgccttc tatcgccttc ttgacgagtt cttctgagcg ggactctggg gttcgaaatg 6540 accgaccaag cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat 6600 gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg 6660 gatctcatgc tggagttctt cgcccacccc gatccaacac ttacgtttgc aacgtccaag 6720 agcaaataga ccacgaacgc cggaaggttg ccgcagcgtg tggattgcgt ctcaattctc 6780 tcttgcagga atgcaatgat gaatatgata ctgactatga aactttgagg gaatactgcc 6840 tagcaccgtc acctcataac gtgcatcatg catgccctga caacatggaa catcgctatt 6900 tttctgaaga attatgctcg ttggaggatg tcgcggcaat tgcagctatt gccaacatcg 6960 aactacccct cacgcatgca ttcatcaata ttattcatgc ggggaaaggc aagattaatc 7020 caactggcaa atcatccagc gtgattggta acttcagttc cagcgacttg attcgttttg 7080 gtgctaccca cgttttcaat aaggacgaga tggtggagta aagaaggagt gcgtcgaagc 7140 agatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc 7200 gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg 7260 catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 7320 cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 7380 tatgttacta gatcgaatta attccaggcg gtgaagggca atcagctgtt gcccgtctca 7440 ctggtgaaaa gaaaaaccac cccagtacat taaaaacgtc cgcaatgtgt tattaagttg 7500 tctaagcgtc aatttgttta caccacaata tatcctgcca ccagccagcc aacagctccc 7560 cgaccggcag ctcggcacaa aatcaccact cgatacaggc agcccatcag tccgggacgg 7620 cgtcagcggg agagccgttg taaggcggca gactttgctc atgttaccga tgctattcgg 7680 aagaacggca actaagctgc cgggtttgaa acacggatga tctcgcggag ggtagcatgt 7740 tgattgtaac gatgacagag cgttgctgcc tgtgatcaaa tatcatctcc ctcgcagaga 7800 tccgaattat cagccttctt attcatttct cgcttaaccg tgacaggctg tcgatcttga 7860 gaactatgcc gacataatag gaaatcgctg gataaagccg ctgaggaagc tgagtggcgc 7920 tatttcttta gaagtgaacg ttgacgatgt cgac 7954 <210> 19 <211> 41 <212> DNA <213> Artificial <220> <223> oligonucleotide XylF9 <400> 19 ggccggatcc tcgagacaca attggaggaa acatggaaag c 41 <210> 20 <211> 40 <212> DNA <213> Artificial <220> <223> oligonucleotide XylR9 <400> 20 ggccatcgat ggtaccggcc cagctcttta tggaatcaaa 40 <210> 21 <211> 436 <212> DNA <213> Artificial <220> <223> XylTiNb <400> 21 ggccggatcc tcgagacaca attggaggaa acatggaaag cacttttttc aagcctcact 60 tatgctaaga actttagtgg cccagtttgt ttccgtcatg ccgtcctctc gcctttggga 120 tatgaaactg ccctgtttaa gggactgtca gaaactatag attgtaatgg agcttctgct 180 catgatttgt ggcaaaatcc tgatgataag aaaactgcac ggttatccga gtttggggag 240 atgatcaggg cagcctttgg atttcctgtt gatagacaga acatcccaag gacagtcaca 300 ggccctaatg tcctctttgt tagacgtgag gattatttag ctcacccacg tcatggtgga 360 aaggtacagt ctaggcttag caatgaagag caagtatttg attccataaa gagctgggcc 420 ggtaccatcg atggcc 436 <210> 22 <211> 5093 <212> DNA <213> Artificial <220> <223> T-DNA of pTKW29 <220> <221> misc_feature <222> (1)..(25) <223> right border repeat from the T-DNA of Agrobacterium tumefaciens (Zambryski, 1988) <220> <221> misc_feature <222> (76)..(786) <223> sequence including the 3?untranslated region of the octopine synthase gene of Agrobacterium tumefaciens as described by De Greve et al. (1982) (complement) <220> <221> misc_feature <222> (807)..(1211) <223> sequence including a part of the Nicotiana benthamiana XylT gene sequence cloned in antisense orientation (complement) <220> <221> misc_feature <222> (1250)..(1991) <223> sequence containing the second intron of the pyruvate orthophosphate dikinase gene from Flaveria trinervia as described by Rosche and Westhoff (1995) (complement) <220> <221> misc_feature <222> (2023)..(2427) <223> sequence including a part of the Nicotiana benthamiana XylT gene sequence cloned in sense orientation (complement) <220> <221> misc_feature <222> (2434)..(3779) <223> sequence including the promoter region of the Cauliflower Mosaic Virus 35S transcript (Odell et al., 1985) (complement) <220> <221> misc_feature <222> (3854)..(4140) <223> sequence including the promoter region of the nopaline synthase gene of A. tumefaciens T-DNA <220> <221> misc_feature <222> (4161)..(4712) <223> sequence including the bar phosphinothricin resistance gene [De Block et al. (1987) EMBO J 6:2513] <220> <221> misc_feature <222> (4731)..(4991) <223> sequence including the 3?untranslated region of the nopaline synthase gene of A. tumefaciens T-DNA <220> <221> misc_feature <222> (5069)..(5093) <223> left border repeat from the T-DNA of Agrobacterium tumefaciens (Zambryski, 1988) <400> 22 aattacaacg gtatatatcc tgccagtact cggccgtcga ccgcggtacc ccggaattaa 60 gcttgcatgc ctgcaggtcc tgctgagcct cgacatgttg tcgcaaaatt cgccctggac 120 ccgcccaacg atttgtcgtc actgtcaagg tttgacctgc acttcatttg gggcccacat 180 acaccaaaaa aatgctgcat aattctcggg gcagcaagtc ggttacccgg ccgccgtgct 240 ggaccgggtt gaatggtgcc cgtaactttc ggtagagcgg acggccaata ctcaacttca 300 aggaatctca cccatgcgcg ccggcgggga accggagttc ccttcagtga acgttattag 360 ttcgccgctc ggtgtgtcgt agatactagc ccctggggcc ttttgaaatt tgaataagat 420 ttatgtaatc agtcttttag gtttgaccgg ttctgccgct ttttttaaaa ttggatttgt 480 aataataaaa cgcaattgtt tgttattgtg gcgctctatc atagatgtcg ctataaacct 540 attcagcaca atatattgtt ttcattttaa tattgtacat ataagtagta gggtacaatc 600 agtaaattga acggagaata ttattcataa aaatacgata gtaacgggtg atatattcat 660 tagaatgaac cgaaaccggc ggtaaggatc tgagctacac atgctcaggt tttttacaac 720 gtgcacaaca gaattgaaag caaatatcat gcgatcatag gcgtctcgca tatctcatta 780 aagcaggact ctagaggatc ctcgagacac aattggagga aacatggaaa gcactttttt 840 caagcctcac ttatgctaag aactttagtg gcccagtttg tttccgtcat gccgtcctct 900 cgcctttggg atatgaaact gccctgttta agggactgtc agaaactata gattgtaatg 960 gagcttctgc tcatgatttg tggcaaaatc ctgatgataa gaaaactgca cggttatccg 1020 agtttgggga gatgatcagg gcagcctttg gatttcctgt tgatagacag aacatcccaa 1080 ggacagtcac aggccctaat gtcctctttg ttagacgtga ggattattta gctcacccac 1140 gtcatggtgg aaaggtacag tctaggctta gcaatgaaga gcaagtattt gattccataa 1200 agagctgggc cggtaccatc gatttcgaac ccaatttccc aactgtaatc aatccaaatg 1260 taagatcaat gataacacaa tgacatgatc tatcatgtta ccttgtttat tcatgttcga 1320 ctaattcatt taattaatag tcaatccatt tagaagttaa taaaactaca agtattattt 1380 agaaattaat aagaatgttg attgaaaata atactatata aaatgataga tcttgcgctt 1440 tgttatatta gcattagatt atgttttgtt acattagatt actgtttcta ttagtttgat 1500 attatttgtt actttagctt gttatttaat attttgttta ttgataaatt acaagcagat 1560 tggaatttct aacaaaatat ttattaactt ttaaactaaa atatttagta atggtataga 1620 tatttaatta tataataaac tattaatcat aaaaaaatat tattttaatt tatttattct 1680 tatttttact atagtatttt atcattgata tttaattcat caaaccagct agaattacta 1740 ttatgattaa aacaaatatt aatgctagta tatcatctta catgttcgat caaattcatt 1800 aaaaataata tacttactct caacttttat cttcttcgtc ttacacatca cttgtcatat 1860 ttttttacat tactatgttg tttatgtaaa caatatattt ataaattatt ttttcacaat 1920 tataacaact atattattat aatcatacta attaacatca cttaactatt ttatactaaa 1980 aggaaaaaag aaaataatta tttccttacc aattggggta ccggcccagc tctttatgga 2040 atcaaatact tgctcttcat tgctaagcct agactgtacc tttccaccat gacgtgggtg 2100 agctaaataa tcctcacgtc taacaaagag gacattaggg cctgtgactg tccttgggat 2160 gttctgtcta tcaacaggaa atccaaaggc tgccctgatc atctccccaa actcggataa 2220 ccgtgcagtt ttcttatcat caggattttg ccacaaatca tgagcagaag ctccattaca 2280 atctatagtt tctgacagtc ccttaaacag ggcagtttca tatcccaaag gcgagaggac 2340 ggcatgacgg aaacaaactg ggccactaaa gttcttagca taagtgaggc ttgaaaaaag 2400 tgctttccat gtttcctcca attgtgtctc gagcgtgtcc tctccaaatg aaatgaactt 2460 ccttatatag aggaagggtc ttgcgaagga tagtgggatt gtgcgtcatc ccttacgtca 2520 gtggagatgt cacatcaatc cacttgcttt gaagacgtgg ttggaacgtc ttctttttcc 2580 acgatgctcc tcgtgggtgg gggtccatct ttgggaccac tgtcggcaga gagatcttga 2640 atgatagcct ttcctttatc gcaatgatgg catttgtagg agccaccttc cttttctact 2700 gtcctttcga tgaagtgaca gatagctggg caatggaatc cgaggaggtt tcccgaaatt 2760 atcctttgtt gaaaagtctc aatagccctt tggtcttctg agactgtatc tttgacattt 2820 ttggagtaga ccagagtgtc gtgctccacc atgttgacga agattttctt cttgtcattg 2880 agtcgtaaaa gactctgtat gaactgttcg ccagtcttca cggcgagttc tgttagatcc 2940 tcgatttgaa tcttagactc catgcatggc cttagattca gtaggaacta cctttttaga 3000 gactccaatc tctattactt gccttggttt atgaagcaag ccttgaatcg tccatactgg 3060 aatagtactt ctgatcttga gaaatatgtc tttctctgtg ttcttgatgc aattagtcct 3120 gaatcttttg actgcatctt taaccttctt gggaaggtat ttgatctcct ggagattgtt 3180 actcgggtag atcgtcttga tgagacctgc tgcgtaggcc tctctaacca tctgtgggtc 3240 agcattcttt ctgaaattga agaggctaac cttctcatta tcagtggtga acatagtgtc 3300 gtcaccttca ccttcgaact tccttcctag atcgtaaaga tagaggaaat cgtccattgt 3360 aatctccggg gcaaaggaga tctcttttgg ggctggatca ctgctgggcc ttttggttcc 3420 tagcgtgagc cagtgggctt tttgctttgg tgggcttgtt agggccttag caaagctctt 3480 gggcttgagt tgagcttctc ctttggggat gaagttcaac ctgtctgttt gctgacttgt 3540 tgtgtacgcg tcagctgctg ctcttgcctc tgtaatagtg gcaaatttct tgtgtgcaac 3600 tccgggaacg ccgtttgttg ccgcctttgt acaaccccag tcatcgtata taccggcatg 3660 tggaccgtta tacacaacgt agtagttgat atgagggtgt tgaatacccg attctgctct 3720 gagaggagca actgtgctgt taagctcaga tttttgtggg attggaatta attcgtcgag 3780 cggccgctcg acgagctccc tatagtgagt cgtattagag gccgacttgg gggccggcca 3840 tttaaatgaa ttcgatcatg agcggagaat taagggagtc acgttatgac ccccgccgat 3900 gacgcgggac aagccgtttt acgtttggaa ctgacagaac cgcaacgatt gaaggagcca 3960 ctcagccgcg ggtttctgga gtttaatgag ctaagcacat acgtcagaaa ccattattgc 4020 gcgttcaaaa gtcgcctaag gtcactatca gctagcaaat atttcttgtc aaaaatgctc 4080 cactgacgtt ccataaattc ccctcggtat ccaattagag tctcatattc actctcaatc 4140 aaagatccgg cccatgatcc atggacccag aacgacgccc ggccgacatc cgccgtgcca 4200 ccgaggcgga catgccggcg gtctgcacca tcgtcaacca ctacatcgag acaagcacgg 4260 tcaacttccg taccgagccg caggaaccgc aggagtggac ggacgacctc gtccgtctgc 4320 gggagcgcta tccctggctc gtcgccgagg tggacggcga ggtcgccggc atcgcctacg 4380 cgggcccctg gaaggcacgc aacgcctacg actggacggc cgagtcgacc gtgtacgtct 4440 ccccccgcca ccagcggacg ggactgggct ccacgctcta cacccacctg ctgaagtccc 4500 tggaggcaca gggcttcaag agcgtggtcg ctgtcatcgg gctgcccaac gacccgagcg 4560 tgcgcatgca cgaggcgctc ggatatgccc cccgcggcat gctgcgggcg gccggcttca 4620 agcacgggaa ctggcatgac gtgggtttct ggcagctgga cttcagcctg ccggtaccgc 4680 cccgtccggt cctgcccgtc accgagatct gatctcacgc gtctaggatc cgaagcagat 4740 cgttcaaaca tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg 4800 attatcatat aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg 4860 acgttattta tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg 4920 atagaaaaca aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg 4980 ttactagatc gggaagatcc attaattcgg tactcgaggc attacggcat tacggcactc 5040 gcgagggtcc caattcgagc atggagccat ttacaattga atatatcctg ccg 5093 <210> 23 <211> 2318 <212> DNA <213> Nicotiana tabacum cv. Xanthi <220> <221> 5'UTR <222> (1)..(18) <220> <221> CDS <222> (19)..(1590) <220> <221> 3'UTR <222> (1592)..(2291) <220> <221> polyA_signal <222> (2292)..(2318) <400> 23 agtcagagag agaagaag atg aac aag aaa aag ctg aaa ttt ctt gtt tct 51 Met Asn Lys Lys Lys Leu Lys Phe Leu Val Ser 1 5 10 ctc ttc gct ctc aac tca atc act ctc tat ctc tac ttc tct tcc cac 99 Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser Ser His 15 20 25 tct gat cac ttc cgt cac aaa tcc ccc caa aac cac ttt cct aat acc 147 Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His Phe Pro Asn Thr 30 35 40 caa aac cac tat tcc ctg tcg gaa aac cac cat gat aat ttc cac tct 195 Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp Asn Phe His Ser 45 50 55 tct gtc act tcc caa tat acc aag cct tgg cca att ttg ccc tcc tac 243 Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile Leu Pro Ser Tyr 60 65 70 75 ctc ccc tgg tct cag aat cct aat gtt tct ttg aga tcg tgc gag ggt 291 Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg Ser Cys Glu Gly 80 85 90 tac ttc ggt aat ggg ttt act ctc aaa gtt gat ctt ctc aaa act tcg 339 Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser 95 100 105 ccg gag ctt cac cag aaa ttc ggc gaa aac acc gta tcc ggc gac ggc 387 Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly 110 115 120 gga tgg ttt agg tgt ttt ttc agt gag act ttg cag agt tcg att tgc 435 Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys 125 130 135 gag gga ggt gct ata cga atg aat ccg gac gag att ttg atg tct cgt 483 Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg 140 145 150 155 gga ggc gag aaa ttg gag tcg gtt att ggt agg agt gaa gat gat gag 531 Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu 160 165 170 ctg ccc gtg ttc aaa aat gga gct ttt cag att aaa gtt act gat aaa 579 Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys 175 180 185 ctg aaa att ggg aaa aaa tta gtg gat gaa aaa atc ttg aat aaa tac 627 Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile Leu Asn Lys Tyr 190 195 200 tta ccg gaa ggt gca att tca agg cac act atg cgt gaa tta att gac 675 Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp 205 210 215 tct att cag tta gtt ggc gcc gat gaa ttt cac tgt tct gag tgg att 723 Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys Ser Glu Trp Ile 220 225 230 235 gag gag ccg tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc 771 Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe 240 245 250 cac aca gtt acc gat tgg tat agt gca tac gtg gca tcc agg gtt act 819 His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr 255 260 265 ggc ttg ccc agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag 867 Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu 270 275 280 aca caa ttg gag gaa aca tgg aaa gca ctc ttt tca agc ctc act tat 915 Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr 285 290 295 gct aag aac ttt agt ggc cca gtt tgt ttc cgt cac gcc gtt ctc tcg 963 Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val Leu Ser 300 305 310 315 cct ttg gga tat gaa act gcc ctg ttt aag gga ctg aca gaa act ata 1011 Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Thr Glu Thr Ile 320 325 330 gat tgt aat gga gct tct gcc cat gat ttg tgg caa aat cct gat gat 1059 Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp 335 340 345 aag aga act gca cgg ttg tct gag ttt ggg gag atg atc agg gca gcc 1107 Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala 350 355 360 ttt gga ttt cct gtg gat aga cag aac atc cca agg aca gtc aca ggc 1155 Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly 365 370 375 cct aat gtc ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt 1203 Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg 380 385 390 395 cat ggt gga aag gta cag tct agg ctt agc aat gaa gag caa gta ttt 1251 His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe 400 405 410 gat tcc ata aag agc tgg gcc ttg aac cac tcg gag tgc aaa tta aat 1299 Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn 415 420 425 gta att aac gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga 1347 Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg 430 435 440 gca atc caa gat gct tct gtc ata gtt ggt gct cat gga gca ggt cta 1395 Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu 445 450 455 act cac ata gtt tct gca gca cca aaa gct gta ata cta gaa att ata 1443 Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile 460 465 470 475 agc agc gaa tat agg cgc ccc cat ttt gct ctg att gca caa tgg aaa 1491 Ser Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys 480 485 490 gga ttg gag tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct 1539 Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro 495 500 505 cca gtt gtg atc gac agg ctc agc agc att ttg agg agt ctt ggg tgc 1587 Pro Val Val Ile Asp Arg Leu Ser Ser Ile Leu Arg Ser Leu Gly Cys 510 515 520 taa gtccgctcga cagtttgaat agttcggctt ttctctaaaa gacggggaag 1640 gatagaggaa ttcggggttc tggaacttgg agcctgggaa ttttgataaa tatgtttcac 1700 acgcagttct gtagtcaatg gttgcaatct aggtcctcaa tctggtgttg ataagcttgg 1760 caatttccag cagctactaa tttattagcc cgctctgact cggttatgga ctaccagagc 1820 aatcatatca aatggaagca tggaatcctg attgtggaat ggtgagctca ttgaagagca 1880 tattctttat ggtgttgaag attacaattc acaattaaca cgtgtatgtg aaagattagg 1940 ttggtacact tacttacaat tcattgtcaa ttgtttttca ttattctcat taatgatcat 2000 aggataagaa catgagaaaa ccatccatgt tctgtgttgt tttcccatca atccggccac 2060 cctcttccct ccttatgtag agatgatttc aacagagttt gttttgtagt tgtaacactt 2120 gcactcccag ttacagtttt gcattcgaca cattcatccc atcagatgtc aagtttaaag 2180 gcataagaca tttgacatat tgaagaagca gattaacacg aacgtcagta tgatgcttca 2240 gtgaagatat ggttgtaact tgtaaccaaa caaaagaaat gagactttga caaaaaaaaa 2300 aaaaaaaaaa aaaaaaaa 2318 <210> 24 <211> 523 <212> PRT <213> Nicotiana tabacum cv. Xanthi <400> 24 Met Asn Lys Lys Lys Leu Lys Phe Leu Val Ser Leu Phe Ala Leu Asn 1 5 10 15 Ser Ile Thr Leu Tyr Leu Tyr Phe Ser Ser His Ser Asp His Phe Arg 20 25 30 His Lys Ser Pro Gln Asn His Phe Pro Asn Thr Gln Asn His Tyr Ser 35 40 45 Leu Ser Glu Asn His His Asp Asn Phe His Ser Ser Val Thr Ser Gln 50 55 60 Tyr Thr Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln 65 70 75 80 Asn Pro Asn Val Ser Leu Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly 85 90 95 Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Leu His Gln 100 105 110 Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys 115 120 125 Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile 130 135 140 Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys Leu 145 150 155 160 Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val Phe Lys 165 170 175 Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile Gly Lys 180 185 190 Lys Leu Val Asp Glu Lys Ile Leu Asn Lys Tyr Leu Pro Glu Gly Ala 195 200 205 Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val 210 215 220 Gly Ala Asp Glu Phe His Cys Ser Glu Trp Ile Glu Glu Pro Ser Leu 225 230 235 240 Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp 245 250 255 Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro Ser Arg 260 265 270 Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu Glu 275 280 285 Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser 290 295 300 Gly Pro Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu 305 310 315 320 Thr Ala Leu Phe Lys Gly Leu Thr Glu Thr Ile Asp Cys Asn Gly Ala 325 330 335 Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Arg Thr Ala Arg 340 345 350 Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val 355 360 365 Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe 370 375 380 Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val 385 390 395 400 Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys Ser 405 410 415 Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu 420 425 430 Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala 435 440 445 Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser 450 455 460 Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg 465 470 475 480 Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His 485 490 495 Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val Ile Asp 500 505 510 Arg Leu Ser Ser Ile Leu Arg Ser Leu Gly Cys 515 520 <210> 25 <211> 4973 <212> DNA <213> Nicotiana tabacum cv. Xanthi <220> <221> 5'UTR <222> (1)..(18) <220> <221> CDS <222> (19)..(696) <220> <221> Intron <222> (697)..(2028) <220> <221> CDS <222> (2029)..(2178) <220> <221> Intron <222> (2179)..(3606) <220> <221> CDS <222> (3607)..(4326) <220> <221> 3'UTR <222> (4330)..(4973) <400> 25 agtcagagag agaagaag atg aac aag aaa aag ctg aaa att ctt gtt tct 51 Met Asn Lys Lys Lys Leu Lys Ile Leu Val Ser 1 5 10 ctc ttc gct ctc aac tca atc act ctc tat ctc tac ttc tct tcc cac 99 Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser Ser His 15 20 25 cct gat cac ttc cgc cac aaa tcc cgc caa aac cac ttt tcc ttg tcg 147 Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His Phe Ser Leu Ser 30 35 40 gaa aac cgc cat cat aat ttc cac tct tca atc act tct caa tat tcc 195 Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr Ser Gln Tyr Ser 45 50 55 aag cct tgg cct att ttg ccc tcc tac ctc cct tgg tct caa aac cct 243 Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro 60 65 70 75 aat gtt gtt tgg aga tcg tgc gag ggt tac ttc ggt aat ggg ttt act 291 Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr 80 85 90 ctc aaa gtt gac ctt ctc aaa act tcg ccg gag ttt cac cgg aaa ttc 339 Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His Arg Lys Phe 95 100 105 ggc gaa aac acc gtc tcc ggc gac ggc gga tgg ttt agg tgt ttt ttc 387 Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe 110 115 120 agt gag act ttg cag agt tcg atc tgc gag gga ggc gca ata cga atg 435 Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met 125 130 135 aat ccg gac gag att ttg atg tct cgt gga ggt gag aaa ttg gag tcg 483 Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser 140 145 150 155 gtt att ggt agg agt gaa gat gat gag ctg ccc gtg ttc aaa aat gga 531 Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val Phe Lys Asn Gly 160 165 170 gct ttt cag att aaa gtt act gat aaa ctg aaa att ggg aaa aaa tta 579 Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu 175 180 185 gtg gat gaa aaa ttc ttg aat aaa tac tta ccg gaa ggt gca att tca 627 Val Asp Glu Lys Phe Leu Asn Lys Tyr Leu Pro Glu Gly Ala Ile Ser 190 195 200 agg cac act atg cgt gag tta att gac tct att cag ttg gtt ggc gcc 675 Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala 205 210 215 gat gat ttt cac tgt tct gag gttagatttt gaattttgtt tgctctttaa 726 Asp Asp Phe His Cys Ser Glu 220 225 attaaaggtt taaactttgt gaatgttggc agatatggaa tacactaatg gattttgttt 786 gatctgttta atgaagattg tctagaacct caatgttata aatatggttt ggttgcttca 846 ttaattaaag agaattcctt aatatcccga ctagatgcca gataacacca gttagttgac 906 ttttggatta ttggttgcat ttcatttgat cagataaatt gttcattctt aaatgtttca 966 ctaaagaatt actcaagatt tcagagttta tatgtaggtg tatgtatttg gaattctgga 1026 tttggatcta gtattgaatg gattactgaa cttgtactcc ccagtcatct ggggaggagc 1086 aatagatcaa attcaagggt tgaaaagtaa tactgagtca gaaattaacc actttaactt 1146 ggaaaacggt aaatgtatgt gttctaagat ggttattcct ataacttttg atgtctaata 1206 tggagaaagt gagttgattt atgctttttc cttttccctt tattggtgtt ggtttttaaa 1266 ttctatcaat tcctttgttt gattgctact caaattgaac cttagacgga gtagcaatag 1326 caaaaagtga aggccattct tttctccttt catctcttta tttccgtttg acatacagaa 1386 tatggtagca tctgtctgaa gtggttaatt ttattcctta aaatttgcat aactaattcg 1446 agtaaatgcc ttttgaagct ttagttgaat agttctacaa ctggttgttg cattttgagg 1506 actatcgact tgatttgaca cttgacattg tctgatacat ggcttgtaag ttatgaaaac 1566 ttttatctag gaagaaatcc caaccagaga tagggagctg tcacttggtt atgagctact 1626 ggctcaaagt tcaagtttga ccagttaatt ttagatcttc accaggataa catttagagt 1686 ctaatcaaat tctgaagcag tattgtgcac taataagagg aacacatgaa ggatgtagca 1746 ctactaggtt atgttacctt atttactaat gattgacaac cagcttaaat gatgacaaat 1806 agtcttatat ttgctttttc acattgctca tgacttggga tatttccgaa tcaacatatt 1866 ttagttcttt atgtacttaa ctacttatca aaaaattatc cctgctagat gttagtgttc 1926 aagcaaccat gctagctttt aaggaagctc cttctttgat tcatgccatc tttccgaaat 1986 cgatgcctta cgttactgtc atttttctaa ttttcatttc ag tgg att gag gag 2040 Trp Ile Glu Glu 230 ccg tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc cac aca 2088 Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr 235 240 245 gtt acc gat tgg tat agt gca tac gtg gca tcc agg gtt act ggc ttg 2136 Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu 250 255 260 ccc agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag 2178 Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu 265 270 275 gtatgtttga aagtattgat aacgatggca tgcattgtac tgtgttacgg atgaaagaaa 2238 tgaaaccagc aattattttc tagcaggcaa tgctcttgag atgcttgtgt caaattggtc 2298 agacttaatc ctgagtttcc atttgtttca gctttctgtt tgactgacta caataattgt 2358 cccaattagg ggtgtcaatg gatattcgaa agccgactaa accgaccgaa ccgtaccgta 2418 ccgattttta ggtttctttt taagaaaccg taggttttta tataaatcta taaccgcacc 2478 gataattagg gtaggttttt tattttataa aaataagccg aaaaaatacc gaaccgtacc 2538 gaataaattt tacatgtgga aaatatattt atttagtaag tttaaaaata ataatgcatt 2598 aaattttctt tgggccatgg aattatgaaa actattacaa gccaacaagt aattagactc 2658 aaaatactaa ttcctaaaac ctattatgtt acttctactt aaactaagtt atttcaagta 2718 tctttattag caagacacaa agtattctag cgattatgag caaactacaa tgtattgaat 2778 atgtttcctt tcatatattt tagatttatc tttttgaata tttaatcttc tatagactct 2838 attcttgagt cccagcttgg tatatctttc aactcgtgtg atttatattt tctttgcctt 2898 tgtttgattt cttttacgtt gttgtagaat agtcgatgga tctatactct agccatcttt 2958 ctttttcttt ttttaattca tcacctttta aacagtaaaa atgtctaaag aatttttcta 3018 agtcctataa aagaacgtat gttattgcat tctacttcta ctggtgaatt ttacatgata 3078 ttaaaaaatt aaccgaacct taccgctacc gaagagaaac cgacatgatt gggacggttt 3138 cgaaaagtct aattttggtt atacataata gaataaccga aaaattggta tggtacaaat 3198 tttataaaat aaccggccga accgaaccat tgacacccct agtcccaata cctagttgtt 3258 gcagtttgct cattcttact tctatttacg tcactgtttc tctgaatggt ccctttgtgg 3318 tgaaaagagc ttttgctatg tagaaaaact agcaatgatt tcatagctga aacaatttat 3378 ttttacctta catcatgtct tataaaattg cttctaactg tatactttaa ttcttggaga 3438 gatgctttca tgtgaagaaa gttctttcac tccactactg gaagcttgcc gtatgaattt 3498 tacttggcca tattgtggcc gtgctttgat ttatcttcaa attcattttc ttcatatagt 3558 tctttcgagt aattcttttt tcctcttttc tgtttgaaaa aaattcag aca caa ttg 3615 Thr Gln Leu gag gaa aca tgg aaa gca ctt ttt tca agc ctc act tat gct aag aac 3663 Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn 280 285 290 295 ttt agt ggc cca gtt tgt ttc cgt cat gcc gcc ctc tcg cct ttg gga 3711 Phe Ser Gly Pro Val Cys Phe Arg His Ala Ala Leu Ser Pro Leu Gly 300 305 310 tat gaa act gcc ctg ttt aag gga ctg tca gaa act ata gat tgt aat 3759 Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn 315 320 325 gga gct tct gcc cat gat ttg tgg caa aat cct gat gat aag aaa act 3807 Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Lys Thr 330 335 340 gca cgg ttg tcc gag ttt ggg gag atg att agg gca gcc ttt aga ttt 3855 Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Arg Phe 345 350 355 cct gtg gat aga cag aac atc cca agg aca gtc aca ggc cct aat gtc 3903 Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val 360 365 370 375 ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt cat ggt gga 3951 Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly 380 385 390 aag gta cag tct agg ctt agc aat gaa gag caa gta ttt gat tcc ata 3999 Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile 395 400 405 aag agc tgg gcc ttg aac cac tcg gag tgc aaa tta aat gta att aac 4047 Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn 410 415 420 gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga gca atc caa 4095 Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln 425 430 435 gat gct tct gtc ata gtt ggt gct cat gga gca ggt cta act cac ata 4143 Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile 440 445 450 455 gtt tct gca gca cca aaa gct gta ata cta gaa att ata agc agc gaa 4191 Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu 460 465 470 tat agg cgc ccc cat ttt gct ctg att gca caa tgg aaa gga ttg gag 4239 Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu 475 480 485 tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct cca gtt gtg 4287 Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val 490 495 500 atc gac aag ctc agc agc att ttg agg agt ctt ggg tgc taaatctgct 4336 Ile Asp Lys Leu Ser Ser Ile Leu Arg Ser Leu Gly Cys 505 510 515 cgacagttta gttcgtcttt tctctaaaag actgggaagg atagaggaat tcggggttct 4396 ggaacctgga gcctgggaat tgtgtaaaat atgtttcaca cgcagttcta tagtcaattg 4456 ctgcaatctg gtgttcataa gcttggaaat ttccagcagc tactaactta ttagcccact 4516 ctgactcagt tatggactac cagagcaatc atatcaaatg ggagcatgga atcctgattg 4576 tggaatggtg agctcattga agagcatatt ctttatggtg ttgaagatta cagttgacga 4636 gtaacacgtg tatgtgaaag attaggttgt tacactttct tgcaattcat tgtcaattgt 4696 ttttcgtcat tcttattaat gatcatagga taagaacatg agaaaaccat ccatgttctc 4756 tgttgttttc ccatcaatct ggccaccctc tttcctcttt atgtagagat gatttcaaca 4816 gagtttgttt tgtagttgta atacttgtac tcacagttac tgttttgcat tcatcccatc 4876 agatgtcgaa gaagcagatt aacaagaacg tcagtatgat gtttcagtga atatatggtt 4936 gtaacttgta accaaacaaa agaaatgaga ctttgac 4973 <210> 26 <211> 516 <212> PRT <213> Nicotiana tabacum cv. Xanthi <400> 26 Met Asn Lys Lys Lys Leu Lys Ile Leu Val Ser Leu Phe Ala Leu Asn 1 5 10 15 Ser Ile Thr Leu Tyr Leu Tyr Phe Ser Ser His Pro Asp His Phe Arg 20 25 30 His Lys Ser Arg Gln Asn His Phe Ser Leu Ser Glu Asn Arg His His 35 40 45 Asn Phe His Ser Ser Ile Thr Ser Gln Tyr Ser Lys Pro Trp Pro Ile 50 55 60 Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Val Trp Arg 65 70 75 80 Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu 85 90 95 Leu Lys Thr Ser Pro Glu Phe His Arg Lys Phe Gly Glu Asn Thr Val 100 105 110 Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln 115 120 125 Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile 130 135 140 Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser 145 150 155 160 Glu Asp Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys 165 170 175 Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Phe 180 185 190 Leu Asn Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg 195 200 205 Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Asp Phe His Cys 210 215 220 Ser Glu Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr 225 230 235 240 Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala 245 250 255 Ser Arg Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp 260 265 270 Gly His Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser 275 280 285 Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His 290 295 300 Ala Ala Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu 305 310 315 320 Ser Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln 325 330 335 Asn Pro Asp Asp Lys Lys Thr Ala Arg Leu Ser Glu Phe Gly Glu Met 340 345 350 Ile Arg Ala Ala Phe Arg Phe Pro Val Asp Arg Gln Asn Ile Pro Arg 355 360 365 Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu 370 375 380 Ala His Pro Arg His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu 385 390 395 400 Glu Gln Val Phe Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu 405 410 415 Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys 420 425 430 Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His 435 440 445 Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile 450 455 460 Leu Glu Ile Ile Ser Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile 465 470 475 480 Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser 485 490 495 Tyr Ala Asp Pro Pro Val Val Ile Asp Lys Leu Ser Ser Ile Leu Arg 500 505 510 Ser Leu Gly Cys 515

Claims (60)

  1. a) 키메라 유전자를 니코티아나(Nicotiana) 종 또는 재배종(cultivar)의 식물 세포 내로 도입하여 형질전환 식물 세포를 발생시키는 단계;
    b) 경우에 따라, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 비형질전환 니코티아나 식물 세포보다 낮은 형질전환 니코티아나 식물 세포를 확인하는 단계;
    c) 경우에 따라, 상기 형질전환 니코티아나 식물 세포를 재생하여 형질전환 니코티아나 식물을 수득하는 단계; 및
    d) 경우에 따라, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 비형질전환 니코티아나 식물보다 낮은 형질전환 니코티아나 식물을 확인하는 단계
    를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물의 생산 방법으로서, 상기 키메라 유전자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:
    i) 발현가능한 식물 프로모터;
    ii) (1) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열 또는 이의 상보체를 포함하는 제1 센스 DNA 영역, 및
    (2) 상기 제1 센스 DNA 영역의 상보체와 95% 이상의 서열 동일성을 갖는 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 제2 안티센스 DNA 영역
    을 포함하는 전사가능한 DNA 영역으로서, 이때 상기 제1 센스 DNA 영역에서 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 포함하며, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자가 적어도 상기 제1 센스 DNA 영역으로부터 전사된 RNA 영역과 상기 제2 안티센스 DNA 영역으로부터 전사된 RNA 영역 사이에서 이중 가닥 RNA 영역을 형성할 수 있는, 전사가능한 DNA 영역; 및
    iii) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
  2. 제1항에 있어서,
    니코티아나 종-특이적 XylT 아미노산이 니코티아나 벤싸미아나(Nicotiana benthamiana)-특이적 XylT 아미노산이고, 니코티아나 종이 바람직하게는 니코티아나 벤싸미아나인, 방법.
  3. 제1항 또는 제2항에 있어서,
    니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    니코티아나 종-특이적 XylT 뉴클레오티드가 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드이고, 니코티아나 종이 바람직하게는 니코티아나 벤싸미아나인, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    니코티아나 XylT 유전자의 뉴클레오티드 서열이 서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는, 방법.
  6. 제1항에 있어서,
    니코티아나 재배종-특이적 XylT 아미노산이 니코티아나 타바큠 재배종 페타이트 하바나(Nicotiana tabacum cv. Petite Havana) SR1-특이적 XylT 아미노산이고, 니코티아나 재배종이 바람직하게는 니코티아나 타바큠 재배종 페타이트 하바나 SR1인, 방법.
  7. 제1항 또는 제6항에 있어서,
    니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 방법.
  8. 제1항, 제6항 및 제7항 중 어느 한 항에 있어서,
    니코티아나 재배종-특이적 XylT 뉴클레오티드가 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드이고, 니코티아나 재배종이 바람직하게는 니코티아나 타바큠 재배종 페타이트 하바나 SR1인, 방법.
  9. 제1항 및 제6항 내지 제8항 중 어느 한 항에 있어서,
    니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열이 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함하는, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    제1 DNA 영역 및 제2 DNA 영역이 50개 이상의 연속 뉴클레오티드를 포함하는, 방법.
  11. 제1항 내지 제9항 중 어느 한 항에 있어서,
    제1 DNA 영역 및 제2 DNA 영역이 200개 이상의 연속 뉴클레오티드를 포함하는, 방법.
  12. a) 하나 이상의 이중 가닥 RNA 분자를 니코티아나 종 또는 재배종의 식물 세포 또 는 식물에게 제공하는 단계; 및
    b) 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 상기 이중 가닥 RNA 분자를 포함하지 않는 동일한 니코티아나 식물 세포 또는 식물보다 낮은, 이중 가닥 RNA 분자를 포함하는 니코티아나 식물 세포 또는 식물을 확인하는 단계
    를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물의 생산 방법으로서,
    이때, 이중 가닥 RNA 분자가 2개의 RNA 가닥을 포함하고, 이중 한 RNA 가닥이 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열 또는 이의 상보체로 본질적으로 구성되고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있으며, 이때 상기 20 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있으며, 이때 상기 20 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는, 방법.
  13. 제12항에 있어서,
    이중 가닥 RNA 분자가 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입시켜 형질전환 식물 세포를 발생시키고, 경우에 따라 상기 형질전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 상기 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되며, 이때 상기 키메라 유전자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:
    a) 발현가능한 식물 프로모터;
    b) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역으로서, 이때 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하는, DNA 영역; 및
    c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
  14. 제12항에 있어서,
    이중 가닥 RNA 분자가 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입시켜 형질전환 식물 세포를 발생시키고, 경우에 따라 상기 형질전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 상기 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되며, 이때 상기 키메라 유전자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:
    a) 발현가능한 식물 프로모터;
    b) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역으로서, 이때 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 그의 상보체인 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함하는, DNA 영역; 및
    c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
  15. 제12항에 있어서,
    이중 가닥 RNA 분자가 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입시켜 형질전환 식물 세포를 발생시키고, 경우에 따라 상기 형지전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 상기 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되며, 이때 상기 키메라 유전자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:
    a) 발현가능한 식물 프로모터;
    b) (i) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 제1 DNA 영역, 및
    (ii) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 제2 DNA 영역
    을 포함하는 전사가능한 DNA 영역으로서, 이때 상기 제1 DNA 영역에서 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하며, 상기 제2 DNA 영역에서 뉴클레오티드 서열이 바람 직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함함으로써, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자가 적어도 상기 제1 DNA 영역에 상응하는 RNA 영역과 상기 제2 DNA 영역에 상응하는 RNA 영역 사이에서의 염기-짝짓기(base-pairing)기 통해 이중 가닥 RNA 영역을 형성할 수 있는, 전사가능한 DNA 영역; 및
    c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
  16. 제12항 내지 제15항 중 어느 한 항에 있어서,
    니코티아나 종-특이적 XylT 아미노산이 니코티아나 벤싸미아나-특이적 XylT 아미노산이고, 니코티아나 종이 바람직하게는 니코티아나 벤싸미아나인, 방법.
  17. 제12항 내지 제16항 중 어느 한 항에 있어서,
    니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 방법.
  18. 제12항 내지 제17항 중 어느 한 항에 있어서,
    니코티아나 종-특이적 XylT 뉴클레오티드가 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드이고, 니코티아나 종이 바람직하게는 니코티아나 벤싸미아나인, 방법.
  19. 제12항 내지 제18항 중 어느 한 항에 있어서,
    니코티아나 XylT 유전자의 뉴클레오티드 서열이 서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는, 방법.
  20. 제12항 내지 제15항 중 어느 한 항에 있어서,
    니코티아나 재배종-특이적 XylT 아미노산이 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산이고, 니코티아나 재배종이 바람직하게는 니코티아나 타바큠 재배종 페타이트 하바나 SR1인, 방법.
  21. 제12항 내지 제15항 및 제20항 중 어느 한 항에 있어서,
    니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 방법.
  22. 제12항 내지 제15항, 제20항 및 제21항 중 어느 한 항에 있어서,
    니코티아나 재배종-특이적 XyIT 뉴클레오티드가 니코티아나 타바큠 재배종 페타이 트 하바나 SR1-특이적 XylT 뉴클레오티드이고, 니코티아나 재배종이 바람직하게는 니코티아나 타바큠 재배종 페타이트 하바나 SR1인, 방법.
  23. 제12항 내지 제15항 및 제20항 내지 제22항 중 어느 한 항에 있어서,
    니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열이 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함하는, 방법.
  24. a) i) 프로브로서 사용되는, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편,
    ii) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 DNA 단편,
    iii) 프로브로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20개 내지 1513개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,
    iv) 프로브로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20개 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,
    v) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,
    vi) PCR 반응에서 프라이머로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열,
    vii) PCR 반응에서 프라이머로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열,
    viii) PCR 반응에서 프라이머로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, 및
    ix) PCR 반응에서 프라이머로서 사용되는, 서열번호 1, 2, 15, 16, 19 또는 20의 뉴클레오티드 서열을 가진 올리고뉴클레오티드
    로 구성된 군으로부터 선택된 수단을 사용하여 제1 니코티아나 종 또는 재배종으로부터 수득될 수 있는 XylT 단백질 코딩 DNA 서열의 단편을 확인하는 단계;
    b) 하나 이상의 이중 가닥 RNA 분자를 제1 또는 제2 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공하는 단계로서, 이때 상기 이중 가닥 RNA 분자가 2개의 RNA 가닥을 포함하고, 이중 한 RNA 가닥이 상기 XylT 단백질 코딩 DNA 단편의 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열 또는 이의 상보체로 본질적으로 구성되고, 이때 상기 20 또는 21개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 하나 이상의 니코티아나 종-특이적 또는 재배종-특이 적 XylT 뉴클레오티드를 포함하는, 단계; 및
    c) 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 상기 이중 가닥 RNA 분자를 포함하지 않는 동일한 니코티아나 식물 세포 또는 식물보다 낮은, 이중 가닥 RNA 분자를 포함하는 니코티아나 식물 세포 또는 식물을 확인하는 단계
    를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물의 생산 방법.
  25. 제24항에 있어서,
    이중 가닥 RNA 분자의 제공이 XylT 단백질 코딩 DNA 단편의 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드로 구성된 제1 뉴클레오티드 서열 또는 이의 상보체, 및 상기 제1 뉴클레오티드 서열의 상보체인 제2 뉴클레오티드 서열을 포함하는 이중 가닥 RNA 분자를 제1 또는 제2 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공함으로써 달성되고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는, 방법.
  26. 제24항에 있어서,
    이중 가닥 RNA 분자가 키메라 DNA를 제1 또는 제2 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입하여 형질전환 식물 세포를 발생시키고, 경우에 따라 상 기 형질전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 상기 제1 또는 제2 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되고, 이때 상기 키메라 DNA 분자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:
    a) 발현가능한 식물 프로모터;
    b) i) XylT 단백질 코딩 DNA 단편의 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열 또는 이의 상보체를 포함하는 제1 센스 DNA 영역, 및
    ii) 상기 제1 센스 DNA 영역의 상보체와 95% 이상의 서열 동일성을 갖는 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 제2 안티센스 DNA 영역
    을 포함하는 전사가능한 DNA 영역으로서, 이때 상기 제1 센스 DNA 영역에서 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하고, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자가 적어도 상기 제1 센스 DNA 영역으로부터 전사된 RNA 영역과 상기 제2 안티센스 DNA 영역으로부터 전사된 RNA 영역 사이에서 이중 가닥 RNA 영역을 형성할 수 있는, 전사가능한 DNA 영역; 및
    c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서,
    단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 상기 니코티아나 식물을 또 다른 니코티아나 식물과 교배하여 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 자손 식물을 수득하는 단계를 추가로 포함하는 방법.
  28. a) 니코티아나 종 또는 재배종으로부터 수득될 수 있는 게놈 DNA 또는 cDNA를 제공하는 단계;
    b) i) 프로브로서 사용되는, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편,
    ii) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 DNA 단편,
    iii) 프로브로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 1513개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,
    iv) 프로브로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,
    v) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,
    vi) PCR 반응에서 프라이머로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열,
    vii) PCR 반응에서 프라이머로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열,
    viii) PCR 반응에서 프라이머로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, 및
    ix) PCR 반응에서 프라이머로서 사용되는, 서열번호 1, 2, 15, 16, 19 또는 20의 뉴클레오티드 서열을 가진 올리고뉴클레오티드
    로 구성된 군으로부터 수단을 선택하는 단계; 및
    c) 상기 게놈 DNA 또는 상기 cDNA 및 상기 프라이머를 사용한 PCR을 수행하거나, 상기 게놈 DNA 또는 상기 cDNA 및 상기 프로브를 사용한 혼성화를 수행하여 상기 니코티아나 종 또는 재배종으로부터 XylT DNA 단편을 확인하는 단계
    를 포함하는 니코티아나 XylT DNA 단편을 확인하는 방법.
  29. a) 제28항의 방법에 따라 니코티아나 XylT DNA 단편을 확인하는 단계; 및
    b) 상기 니코티아나 XylT DNA 단편을 단리하는 단계
    를 포함하는, 니코티아나 XylT DNA 단편을 단리하는 방법.
  30. (a) 니코티아나 종 또는 재배종의 상이한 식물 계통의 집단, 경우에 따라 돌연변이된 집단을 제공하는 단계;
    (b) 제28항의 방법에 따라 니코티아나 XylT 대립유전자를 상기 집단의 각 식물 계통에서 확인하는 단계;
    (c) 상기 집단의 각 식물 계통의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 분석하고, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 다른 식물 계통보다 낮은 식물 계통을 확인하는 단계; 및
    (d) 식물 계통 내에서의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준을 특정한 니코티아나 XylT 대립유전자의 존재와 상호관련시키는 단계
    를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 니코티아나 XylT 대립유전자를 확인하는 방법.
  31. a) 제30항의 방법에 따라 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 니코티아나 XylT 대립유전자를 확인하는 단계; 및
    b) 상기 니코티아나 XylT 대립유전자를 선택된 니코티아나 식물 계통 내로 도입하는 단계
    를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 수득하는 방법.
  32. 서열번호 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 벤싸미아나-특이적 XylT 아미노산을 코딩하는 상기 단편의 임의의 부분.
  33. 제32항에 있어서,
    서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드를 포함하는 상기 단편의 임의의 부분.
  34. 서열번호 4, 6, 8 또는 10의 아미노산 서열을 포함하는 단백질을 코딩하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산을 코딩하는 상기 단편의 임의의 부분.
  35. 제34항에 있어서,
    서열번호 3, 5, 7, 9 또는 17의 뉴클레오티드 서열을 포함하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드를 포함하는 상기 단편의 임의의 부분.
  36. 하나 이상의 니코티아나 종-특이적 또는 니코티아나 재배종-특이적 XylT 아미노산을 코딩하는, 제28항의 방법에 의해 수득될 수 있는 단리된 DNA 단편.
  37. 제36항에 있어서,
    하나 이상의 니코티아나 종-특이적 또는 니코티아나 재배종-특이적 XylT 뉴클레오티드를 포함하는 단리된 DNA 단편.
  38. 하기 작동가능하게 연결된 DNA 단편을 포함하는 키메라 유전자:
    a) 발현가능한 식물 프로모터;
    b) (i) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 뉴클레오티드 또는 이의 상보체를 포함하는 제1 DNA 영역, 및
    (ii) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 뉴클레오티드 또는 이의 상보체를 포함하는 제2 DNA 영역
    을 포함하는 전사가능한 DNA 영역으로서, 이때 상기 제1 DNA 영역에서 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하고, 상기 제2 DNA 영역에서 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함함으로써, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자가 적어도 상기 제1 DNA 영역에 상응하는 RNA 영역과 상기 제2 DNA 영역에 상응하는 RNA 영역 사이에서의 염기-짝짓기를 통해 이중 가닥 RNA 영역을 형성할 수 있는, 전사가능한 DNA 영역; 및
    c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
  39. 하기 작동가능하게 연결된 DNA 단편을 포함하는 키메라 유전자:
    a) 발현가능한 식물 프로모터;
    b) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역으로서, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함하는, DNA 영역; 및
    c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
  40. 하기 작동가능하게 연결된 DNA 단편을 포함하는 키메라 유전자:
    a) 발현가능한 식물 프로모터;
    b) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역으로서, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하는, DNA 영역; 및
    c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
  41. 제38항 내지 제40항 중 어느 한 항에 있어서,
    니코티아나 종-특이적 XylT 아미노산이 니코티아나 벤싸미아나-특이적 XylT 아미노산인, 키메라 유전자.
  42. 제38항 내지 제41항 중 어느 한 항에 있어서,
    니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 키메라 유전자.
  43. 제38항 내지 제42항 중 어느 한 항에 있어서,
    니코티아나 종-특이적 XylT 뉴클레오티드가 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드인, 키메라 유전자.
  44. 제38항 내지 제43항 중 어느 한 항에 있어서,
    니코티아나 XylT 유전자의 뉴클레오티드 서열이 서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는, 키메라 유전자.
  45. 제38항 내지 제40항 중 어느 한 항에 있어서,
    니코티아나 재배종-특이적 XylT 아미노산이 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산인, 키메라 유전자.
  46. 제38항 내지 제40항 및 제45항 중 어느 한 항에 있어서,
    니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 키메라 유전자.
  47. 제38항 내지 제40항, 제45항 및 제46항 중 어느 한 항에 있어서,
    니코티아나 재배종-특이적 XylT 뉴클레오티드가 니코티아나 타바큠 재배종 페타이 트 하바나 SR1-특이적 XylT 뉴클레오티드인, 키메라 유전자.
  48. 제38항 내지 제40항 및 제45항 내지 제47항 중 어느 한 항에 있어서,
    니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열이 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함하는, 키메라 유전자.
  49. 제38항 내지 제48항 중 어느 한 항의 키메라 유전자를 포함하는 니코티아나 식물 세포.
  50. 제49항의 니코티아나 식물 세포로 본질적으로 구성된 니코티아나 식물.
  51. 제31항의 방법에 의해 수득된 니코티아나 식물 세포 또는 식물.
  52. 제50항 또는 제51항에 따른 니코티아나 식물의 종자.
  53. 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 감소시키기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용 도.
  54. 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 감소시키기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
  55. 니코티아나 종 또는 재배종에서 XylT 유전자 또는 XylT cDNA를 확인하기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
  56. 니코티아나 종 또는 재배종에서 XylT 유전자 또는 XylT cDNA를 확인하기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
  57. 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 확인하기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
  58. 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 확인하기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
  59. 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 도입하기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
  60. 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 도입하기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 상기 뉴클레오티 드 서열의 임의의 부분의 용도.
KR1020087025826A 2006-03-23 2007-03-15 니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열 KR20090007354A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP06075714.3 2006-03-23
EP06075714 2006-03-23
US78755106P 2006-03-30 2006-03-30
US60/787,551 2006-03-30

Publications (1)

Publication Number Publication Date
KR20090007354A true KR20090007354A (ko) 2009-01-16

Family

ID=40538775

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087025826A KR20090007354A (ko) 2006-03-23 2007-03-15 니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열

Country Status (12)

Country Link
US (1) US20100287657A1 (ko)
EP (1) EP2002008A1 (ko)
JP (1) JP2009529898A (ko)
KR (1) KR20090007354A (ko)
CN (1) CN101405395A (ko)
AU (1) AU2007229061A1 (ko)
BR (1) BRPI0709202A2 (ko)
CA (1) CA2646583A1 (ko)
IL (1) IL194144A0 (ko)
MX (1) MX2008012153A (ko)
WO (1) WO2007107296A1 (ko)
ZA (1) ZA200807497B (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100154081A1 (en) * 2007-05-21 2010-06-17 Bayer Bioscience N.V. Methods and means for producing glycoproteins with altered glycosylation pattern in higher plants
EP2205728A1 (en) * 2007-10-31 2010-07-14 Bayer BioScience N.V. Method to produce modified plants with altered n-glycosylation pattern
CA2765287C (en) * 2009-06-15 2018-12-11 Bayer Bioscience N.V. Nicotiana benthamiana plants deficient in xylosyltransferase activity
WO2011117249A1 (en) * 2010-03-22 2011-09-29 Philip Morris Products S.A. Modifying enzyme activity in plants
EP2551348B1 (en) 2011-07-29 2014-09-24 Icon Genetics GmbH Production of galactosylated N-glycans in plants
JP6104252B2 (ja) 2011-10-04 2017-03-29 アイコン・ジェネティクス・ゲーエムベーハー フコシルトランスフェラーゼ活性が欠損したニコチアナ・ベンサミアナ植物
CN103954701B (zh) * 2014-04-15 2015-12-09 华南农业大学 利用HPLC检测木聚糖合成中β-1,4-木糖转移酶活性的方法
CN103952414A (zh) * 2014-05-22 2014-07-30 中南民族大学 一种烟草糖基转移酶诱导型启动子及其应用
EP3548612A4 (en) 2016-12-01 2020-04-15 Plantform Corporation TRANSGENIC PLANT WITH REDUCED FUCOSYL TRANSFERASE AND XYLOSYL TRANSFERASE ACTIVITY

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT409381B (de) * 2000-03-03 2002-07-25 Gloessl Josef Dr Xylosyltransferase-gen
WO2005047300A2 (en) * 2003-11-10 2005-05-26 University Of Utah Research Foundation Improved methods and compositions for rna interference
US20050166289A1 (en) * 2003-12-01 2005-07-28 North Carolina State University Small interfering RNA (siRNA)-mediated heritable gene manipulation in plants

Also Published As

Publication number Publication date
MX2008012153A (es) 2008-10-03
IL194144A0 (en) 2011-08-01
BRPI0709202A2 (pt) 2011-06-28
AU2007229061A1 (en) 2007-09-27
CN101405395A (zh) 2009-04-08
US20100287657A1 (en) 2010-11-11
JP2009529898A (ja) 2009-08-27
CA2646583A1 (en) 2007-09-27
ZA200807497B (en) 2009-12-30
WO2007107296A1 (en) 2007-09-27
EP2002008A1 (en) 2008-12-17

Similar Documents

Publication Publication Date Title
KR20090007354A (ko) 니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열
DK2535418T3 (en) Mammalian TYPE glycosylation I PLANTS BY EXPRESSION OF NON-mammalian glycosyltransferases
KR102012993B1 (ko) 니코티아나 타바쿰으로부터의 이소프로필말레이트 합성효소 및 그의 방법 및 용도
CA2997344C (en) Nucleic acid encoding n-methylputrescine oxidase and uses thereof
US20100242128A1 (en) Method to produce modified plants with altered n-glycosylation pattern
JP2017131225A (ja) 植物由来アルファ−マンノシダーゼ及びそれを使用する方法
AU2013203379B2 (en) Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application