KR20090007354A - 니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열 - Google Patents
니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열 Download PDFInfo
- Publication number
- KR20090007354A KR20090007354A KR1020087025826A KR20087025826A KR20090007354A KR 20090007354 A KR20090007354 A KR 20090007354A KR 1020087025826 A KR1020087025826 A KR 1020087025826A KR 20087025826 A KR20087025826 A KR 20087025826A KR 20090007354 A KR20090007354 A KR 20090007354A
- Authority
- KR
- South Korea
- Prior art keywords
- nicotiana
- xylt
- nucleotide sequence
- ser
- specific
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1077—Pentosyltransferases (2.4.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Pharmacology & Pharmacy (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 신규 베타-1,2-크실로스트랜스퍼레이즈 뉴클레오티드 서열 및 이의 용도를 제공한다.
Description
본 발명은 베타-1,2-크실로실트랜스퍼레이즈(XylT)를 코딩하는 니코티아나 종(Nicotiana) 종 및 재배종(cultivar), 특히 니코티아나 벤싸미아나(Nicotiana benthamiana) 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1(Nicotiana tabacum cv. Petite Havana SR1)로부터의 신규 뉴클레오티드 서열; 및 대조군 비변형 니코티아나 식물보다 낮은 수준 또는 변경된 패턴의 면역원성 단백질-결합 N-글리칸, 특히 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 변형된 니코티아나 식물, 특히 니코티아나 벤싸미아나 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1 식물을 생산하는 데 있어서의 상기 신규 뉴클레오티드 서열의 용도에 관한 것이다. 이러한 니코티아나 식물은 내인성 니코티아나 XylT 유전자의 발현을 낮춤으로써, 예컨대, 내인성 니코티아나 XylT 유전자의 활성을 변경시킴으로써, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 낮추는 XylT 유전자의 또 다른 대립유전자로 내인성 니코티아나 XylT 유전자를 치환함으로써, 또는 이들의 임의의 조합 방법으로 수득할 수 있다.
부가가치 재조합 단백질, 예컨대, 항체, 백신, 인간 혈액 생성물, 호르몬, 성장 조절자 등의 제조를 위한 형질전환 식물의 사용은 보다 보편적인 시스템, 예컨대, 동물 및 곤충 세포 배양물, 효모, 섬유상 진균 및 박테리아와 비교할 때 실용적, 경제적 및 안정성 면에서 많은 이점을 제공한다고 보고되어 있다(문헌(Stoger et al., 2002; Twyman et al, 2003; Fischer et al, 2004) 참조).
단백질 합성 경로는 식물과 동물에서 거의 동일하지만, 번역 후 변형, 특히 글리칸-쇄 구조 면에서 일부 차이점이 있다. 따라서, 식물-유래의 재조합 인간 단백질은 포유동물에는 존재하는 않는 탄수화물 기 베타(1→2)-크실로스 및 알파(1→3)-푸코스를 갖지만 많은 천연 인간 당단백질 상에서 발견되는 말단 갈락토스 및 시알산 잔기는 갖지 않는다(Twyman et al, 2003).
크실로스가 UDP-크실로스로부터 단백질-결합 N-글리칸의 코어 베타-결합 만노스로 전달되는 것을 촉진하는 효소가 XylT이다. XylT는 식물 및 일부 비-척추 동물 종, 예컨대, 주혈흡충(Schistosoma) 종(Khoo et al., 1997) 및 달팽이(예컨대, 문헌(Mulder et al, 1995))에만 있는 효소이고 인간 또는 다른 척추동물에는 존재하지 않는다.
테주카 등(Tezuka et al.(1992))은 시카모어(sycamore)(아서 슈도플라타너스 엘.(Acer pseudoplatanus L.))의 XylT의 특징을 규명하였다(1992).
젱 등(Zeng et al. (1997))은 대두 마이크로좀(microsome)으로부터 XylT를 정제하는 것을 기술하였다. 대두 XylT cDNA의 부분만이 단리되었다(국제특허출원 공개 제W0 99/29835 A1호).
스트라서 등(Strasser et al. (2000)) 및 국제특허출원 공개 제WO O1/64901호는 아라비돕시스(Arabidopsis) XylT 유전자의 분리, 코딩된 XylT 단백질의 예측된 아미노산 서열, 및 시험관내 및 생체내에서의 이의 효소 활성을 기술하였다.
하기 데이타베이스 입력 식별은 실험적으로 입증되었고, 잠정적인 XylT cDNA 및 유전자 서열, 이의 부분 또는 상동성 서열이 확인될 수 있다: AJ627182, AJ627183(니코티아나 타바큠 재배종 잔티(Nicotiana tabacum cv. Xanthi)), AM 179855(솔라늄 투버로슘(Solanum tuberosum)), AM179856(비티스 비니페라(Vitis vinifera)), AJ891042(포퓰러스 알바 x 포퓰러스 트레뮬라(Populus alba x Populus tremula)), AY302251(메디카고 사티바(Medicago sativa)), AJ864704(사카륨 오피시나륨(Saccharum officinarum), AMI 79857(제아 메이스(Zea mays)), AMI 79853(호르데움 불가레(Hordeum vulgare)), AM179854(소르굼 비콜로르(Sorghum bicolor)), BD434535, AJ277603, AJ272121, AF272852, AX236965(아라비돕시스 탈리아나(Arabidopsis thaliana)), AJ621918(오리자 사티바(Oryza sativa)), AR359783, AR359782, AR123000, AR123001(대두), AJ618933(피즈코미트렐라 파텐스(Physcomitrella patens)).
스트라서 등(2004a)은 식물에서의 N-글리코실화 경로의 조절에 대한 두 가지 방법을 보고하였다: 첫번째 방법은 고등 진핵생물에서 올리고만노시딕(oligomannosidic) 잔기가 혼성화되어 결합체 N-글리칸를 형성하는 과정에 관여 하는 효소인 베타-1,2-N-아세틸글루코스아미닐트랜스퍼레이즈 I(GnTI)의 발현을, 번역 후 유전자 침묵을 이용하여 넉아웃시켜 니코티아나 벤싸미아나에서의 결합체 N-글리칸의 형성에 대한 GnTI 발현의 영향을 평가하는 방법이다. N-글리칸 프로파일링은 총 N-글리칸 패턴의 유의한 변화를 나타내지 않았는데, 이는 GnTI의 적은 잔류 활성 조차도 니코티아나 벤싸미아나에서의 결합체 N-글리칸의 생합성을 허용한다는 것을 보여준다. 또한, 스트라서 등은 XylT를 넉아웃시키는 유사한 방법이 베타-1,2-크실로실화 N-글리칸의 유의한 감소를 초래한다고 보고하였다. 두번째 방법은 베타-1,2-크실로스 및 알파-1,3-푸코스 잔기를 N-글리칸으로부터 완전히 제거하기 위해 삽입 돌연변이 계통을 사용하여 삼중 넉아웃 아라비돕시스 식물을 발생시키는 방법이다. 이 식물은 활성 베타-1,2-크실로실트랜스퍼레이즈 및 코어 알파-1,3-푸코실트랜스퍼레이즈가 완전히 결여되어 있고 면역원성 단백질-결합 N-글리칸을 갖지 않으며 말단 베타-N-아세틸글루코스아민 잔기를 가진 인간화된 구조를 주로 합성한다(Strasser et al, 2004b).
담배와 같은 잎이 무성한 작물은 재조합 단백질의 상업적 제조를 위한 강력한 후보로서 인식된다(예컨대, 문헌(Twyman et al, 2003) 참조).
도 1a 내지 1c는 잠정적인 XylT 단백질을 코딩하는 니코티아나 타바큠 재배종 잔티의 cDNA 서열(검색번호: AJ627182; 서열번호 23)과 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 2개의 상이한 XylT cDNA 서열(서열번호 3 및 5) 사이의 전체적인 DNA 정렬(하기 파라미터를 가진 표준 선형 스코어링 매트릭스에 기초함: 불일치 패널티 = 2, 개방 갭 패널티 = 4 및 연장 갭 패널티 = 1)이다. 점은 니코티아나 타바큠 재배종 잔티 cDNA 서열의 상응하는 뉴클레오티드와 동일한 니코티아나 타바큠 재배종 페타이트 하바나 SR1 cDNA 서열의 뉴클레오티드를 표시하고; 대시(-)는 니코티아나 타바큠 재배종 잔티 cDNA 서열의 뉴클레오티드에 상응하는 니코티아나 타바큠 재배종 페타이트 하바나 SR1 cDNA 서열의 뉴클레오티드의 부재를 표시한다.
도 2는 니코티아나 타바큠 재배종 잔티로부터 단리된 cDNA 서열(검색번호: AJ627182; 서열번호 24)에 의해 코딩된 잠정적 XylT 단백질과 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 2개의 상이한 XylT cDNA 서열(서열번호 4 및 6) 사이의 전체적인 단백질 정렬(블로스섬(blossum) 62 스코어링 매트릭스에 기초함)이다. 점은 니코티아나 타바큠 재배종 잔티 단백질 서열의 상응하는 아미노산과 동일한 니코티아나 타바큠 재배종 페타이트 하바나 SR1 단백질 서열의 아미노산을 표시하고; 대시(-)는 니코티아나 타바큠 재배종 잔티 단백질 서열의 아미노산에 상응하는 니코티아나 타바큠 재배종 페타이트 하바나 SR1 단백질 서열의 아미노산의 부재를 표시한다.
도 3a 내지 3l은 잠정적 XylT 단백질을 코딩하는 니코티아나 타바큠 재배종 잔티의 게놈 DNA 서열(검색번호: AJ627183; 서열번호 25)과 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 2개의 상이한 XylT 게놈 DNA 서열(서열번호 7 및 9) 및 니코티아나 벤싸미아나로부터 단리된 2개의 상이한 XylT 게놈 DNA 서열(서열번호 11 및 13) 사이의 전체적인 DNA 정렬(하기 파라미터를 가진 표준 선형 스코어링 매트릭스에 기초함: 불일치 패널티 = 2, 개방 갭 패널티 = 4 및 연장 갭 패널티 = 1)이다. 점은 니코티아나 타바큠 재배종 잔티 게놈 DNA 서열의 상응하는 뉴클레오티드와 동일한 니코티아나 타바큠 재배종 페타이트 하바나 SR1 게놈 서열의 뉴클레오티드를 표시하고; 대시(-)는 니코티아나 타바큠 재배종 잔티 게놈 DNA 서열의 뉴클레오티드에 상응하는 니코티아나 타바큠 재배종 페타이트 하바나 SR1 게놈 DNA 서열의 뉴클레오티드의 부재를 표시한다.
도 4a 내지 4b는 니코티아나 타바큠 재배종 잔티로부터 단리된 게놈 DNA 서열에 의해 코딩된 잠정적 XylT 단백질(검색번호: AJ627183; 서열번호 26)과 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 2개의 상이한 XylT 게놈 DNA 서열(서열번호 8 및 10) 및 니코티아나 벤싸미아나로부터 단리된 2개의 상이한 XylT 게놈 DNA 서열(서열번호 12 및 14) 사이의 전체적인 단백질 정렬(블로스섬 62 스코어링 매트릭스에 기초함)이다. 점은 니코티아나 타바큠 재배종 잔티 단백질 서열의 상응하는 아미노산과 동일한 니코티아나 타바큠 재배종 페타이트 하바나 SR1 단백질 서열의 아미노산을 표시하고; 대시(-)는 니코티아나 타바큠 재배종 잔티 단백질 서열의 아미노산에 상응하는 니코티아나 타바큠 재배종 페타이트 하바나 SR1 단백질 서열의 아미노산의 부재를 표시한다.
본 발명의 목적은 특히 니코티아나 종 또는 재배종에서의 XylT 발현을 변경시키기에 보다 적합한, 니코티아나 종 및 재배종, 특히 니코티아나 벤싸미나 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 대체(alternative) XylT cDNA 및 유전자 서열을 제공하는 것이다.
본 발명의 한 측면에서, 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포 내로 도입하여 형질전환 식물 세포를 발생시키는 단계; 경우에 따라, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 비형질전환 니코티아나 식물 세포보다 낮은 형질전환 니코티아나 식물 세포를 확인하는 단계; 형질전환 니코티아나 식물 세포를 재생시켜 형질전환 니코티아나 식물을 수득하는 단계; 및 경우에 따라, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 비형질전환 니코티아나 식물보다 낮은 형질전환 니코티아나 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 생산하는 방법으로서, 이때 상기 키메라 유전자가 작동가능하게 연결된 발현가능한 식물 프로모터; 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열 또는 이의 상보체를 포함하는 제1 센스 DNA 영역, 및 상기 제1 센스 DNA 영역의 상보체와 95% 이상의 서열 동일성을 가진, 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 제2 안티센스 DNA 영역을 포함하는 전사가능한 DNA 영역; 및 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역을 포함하는, 방법을 제공하는데, 이때 상기 제1 센스 DNA 영역에서 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 이의 상보체이며, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 포함하고, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자는 적어도 상기 제1 센스 DNA 영역으로부터 전사된 RNA 영역과 상기 제2 안티센스 DNA 영역으로부터 전사된 RNA 영역 사이에서 이중 가닥 RNA 영역을 형성할 수 있다. 상기 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산 또는 뉴클레오티드는 니코티아나 벤싸미아나-특이적 또는 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산 또는 뉴클레오티드일 수 있고, 니코티아나 종 또는 재배종은 바람직하게는 니코티아나 벤싸미아나 또는 니코티아나 타바큠 재배종 페타이트 하바나 SR1일 수 있다. 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열은 서열번호 12 또는 14의 아미노산 서열 또는 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함할 수 있고, 니코티아나 XylT 유전자의 뉴클레오티드 서열은 서열번호 11, 13 또는 21의 뉴클레오티드 서열, 또는 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함할 수 있다.
본 발명의 또 다른 목적은 하나 이상의 이중 가닥 RNA 분자를 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공하는 단계; 및 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 상기 이중 가닥 RNA 분자를 포함하지 않는 동일한 니코티아나 식물 세포 또는 식물보다 낮은, 이중 가닥 RNA 분자를 포함하는 니코티아나 식물 세포 또는 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 생산하는 방법을 제공하는 것인데, 이때 상기 이중 가닥 RNA 분자는 2개의 RNA 가닥을 포함하고, 상기 2개의 RNA 가닥 중 하나는 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열 또는 이의 상보체로 본질적으로 구성되고, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 이의 상보체이며, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다. 상기 이중 가닥 RNA는 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입하여 형질전환 식물 세포를 발생시키고, 경우에 따라 상기 형질전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 식물 세포 또는 식물에 제공될 수 있는데, 이때 상기 키메라 유전자는 발현가능한 식물 프로모터, 및 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역에 작동가능하게 연결되어 있으면서 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역을 포함하고, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있으며, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이며, 상기 뉴클레오티드 서열은 바람직하게는 니코티아나 종 또는 재배종으로부터 수득될 수 있으며, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 및/또는 센스 방향으로 포함한다. 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산 또는 뉴클레오티드는 니코티아나 벤싸미아나-특이적 또는 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산 또는 뉴클레오티드일 수 있고, 니코티아나 종 또는 재배종은 바람직하게는 니코티아나 벤싸미아나 또는 니코티아나 타바큠 재배종 페타이트 하바나 SR1일 수 있다. 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열은 서열번호 12 또는 14의 아미노산 서열 또는 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함할 수 있고, 니코티아나 XylT 유전자의 뉴클레오티드 서열은 서열번호 11, 13 또는 21의 뉴클레오티드 서열 또는 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함할 수 있다.
본 발명의 또 다른 목적은 니코티아나 종 또는 재배종으로부터 수득될 수 있는 게놈 DNA 또는 cDNA를 제공하는 단계; 프로브로서 사용되는, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편, 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 DNA 단편, 프로브로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 1513개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드, 프로브로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드, 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드, PCR 반응에서 프라이머로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, PCR 반응에서 프라이머로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, PCR 반응에서 프라이머로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, 및 PCR 반응에서 프라이머로서 사용되는, 서열번호 1, 2, 15, 16, 19 또는 20의 뉴클레오티드 서열을 갖는 올리고뉴클레오티드로 구성된 군으로부터 수단을 선택하는 단계; 및 상기 수단을 사용하여 게놈 DNA 또는 cDNA 및 프라이머를 사용한 PCR을 수행하거나 게놈 DNA 또는 cDNA 및 프로브를 사용한 혼성화를 수행하여 니코티아나 종 또는 재배종으로부터 XylT DNA 단편을 확인하는 단계를 포함하는, 니코티아나 XylT DNA 단편을 확인하는 방법을 제공하는 것이다. 그 후, 확인된 단편을 단리하여 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 수득하는 데 사용할 수 있다.
또한, 본 발명은 니코티아나 종 또는 재배종의 상이한 식물 계통의 집단, 경우에 따라 돌연변이 집단을 제공하는 단계; 전술한 본 발명에 따라 상기 집단의 각 식물 계통에서 니코티아나 XylT 대립유전자를 확인하는 단계; 상기 집단의 각 식물 계통의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 분석하는 단계; 및 식물 계통에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준을 특정한 니코티아나 XylT 대립유전자의 존재와 상호관련시키는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 니코티아나 XylT 대립유전자를 확인하는 방법을 제공한다. 니코티아나 XylT 대립유전자를 선택된 니코티아나 식물 세포 또는 식물 내로 도입하여 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 수득할 수 있다.
본 발명의 또 다른 목적은 서열번호 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 벤싸미아나-특이적 XylT 아미노산을 코딩하는 상기 단편의 임의의 부분; 서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드를 포함하는 상기 DNA 단편의 임의의 부분; 서열번호, 4, 6, 8 또는 10의 아미노산 서열을 포함하는 단백질을 코딩하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산을 코딩하는 상기 DNA 단편의 임의의 부분; 및 서열번호 3, 5, 7, 9 또는 17의 뉴클레오티드 서열을 포함하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드를 포함하는 상기 DNA 단편의 임의의 부분을 제공하는 것이다.
추가로, 본 발명은 하기 작동가능하게 연결된 DNA 단편을 포함하는 키메라 유전자를 제공한다: 발현가능한 식물 프로모터; 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 제1 DNA 영역, 및 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 제2 영역을 포함하는 전사가능한 DNA 영역; 및 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역. 이때, 상기 제1 DNA 영역에서 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이며, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하고, 상기 제2 DNA 영역에서 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이며, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함함으로써, 전사가능한 DNA 영역의 전사에 의해 제조된 RNA 분자가 적어도 제1 DNA 영역에 상응하는 RNA 영역과 제2 DNA 영역에 상응하는 RNA 영역 사이에서의 염기-페어링(base-pairing)을 통해 이중 가닥 RNA 영역을 형성할 수 있다. 상기 키메라 유전자는 발현가능한 식물 프로모터; 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역; 및 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역을 포함할 수도 있는데, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이며, 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 또는 안티센스 방향으로 포함한다.
상기 키메라 유전자를 포함하는 니코티아나 식물 세포, 및 이러한 니코티아나 식물로 본질적으로 구성된 니코티아나 식물뿐만 아니라 이들의 종자도 본 발명에 의해 제공된다.
또한, 본 발명은 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 감소시키기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용도; 또는 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 감소시키거나, 니코티아나 종 또는 재배종에서 XylT 유전자 또는 XylT cDNA를 확인하거나, 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 확인하거나, 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 도입하기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하는 상기 뉴클레티드 서열의 임의의 부분의 용도에 관한 것이다.
전술된 것, 및 이하 명확해질 본 발명의 다른 목적, 이점 및 특징과 함께, 본 발명의 성질은 본 발명의 여러 실시양태에 대한 하기 상세한 설명, 첨부된 청구의 범위 및 도면을 참조함으로써 더욱 명확히 이해될 수 있다.
본 발명은 니코티아나 종 및 재배종, 특히 니코티아나 벤싸미아나 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT 유전자 및 XylT cDNA가 예를 들어, 내인성 니코티아나 XylT 유전자의 활성을 변경시키거나, 내인성 니코티아나 XylT 유전자를, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 낮추는 니코티아나 XylT의 또 다른 대립유전자로 치환하거나, 이들의 임의의 조합 방법을 이용함으로써 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 종 및 재배종, 특히 니코티아나 벤싸미아나 식물 및 니코티아나 타바큠 재배종 페타이트 하바나 SR1 식물을 수득하는 데 매우 우수한 공급원 뉴클레오티드 서열이라는 발견에 기초한 것이다.
한 실시양태에서, 본 발명은 하나 이상의 침묵 RNA 분자를 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공함으로써 니코티아나 식물 세포 또는 식물에서 내인성 XylT 유전자의 발현을 감소시킴으로써 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 수득하는 방법에 관한 것으로서, 이때 상기 침묵 RNA 분자는 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 부분을 포함하고, 이때 상기 부분은 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 상기 침묵 RNA 분자는 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열의 부분을 포함하고, 이때 상기 부분은 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다.
본 명세서에서 사용된 바와 같이, "침묵 RNA" 또는 "침묵 RNA 분자"는 식물 세포 내로의 도입 시 표적 유전자의 발현을 감소시키는 임의의 RNA 분자를 지칭한다. 이러한 침묵 RNA는 예를 들어, 소위 "안티센스 RNA"일 수 있으므로, RNA 분자는 표적 핵산의 서열의 상보체, 바람직하게는 표적 유전자의 코딩 서열과 95% 동일한 서열을 가진 20개 이상의 연속 뉴클레오티드로 구성된 서열을 포함한다. 그러나, 안티센스 RNA는 프로모터 서열, 및 전사 종결 및 폴리아데닐화 신호를 비롯한 표적 유전자의 조절 서열에 대해 유도될 수도 있다. 침묵 RNA는 소위 "센스 RNA"를 추가로 포함함으로서 RNA 분자는 표적 핵산의 서열과 95% 동일한 서열을 가진 20개 이상의 연속 뉴클레오티드로 구성된 서열을 포함한다. 다른 침묵 RNA는 국제특허출원 공개 제WO 01/12824호 및 미국특허 제6,423,885호(이들 문헌 둘다 참고로 본 명세서에 도입됨)에 기재된 것과 같은 표적 핵산의 서열의 상보체와 95% 동일한 서열을 가진 20개 이상의 연속 뉴클레오티드를 포함하는 "폴리아데닐화되지 않은 RNA"일 수 있다. 침묵 RNA의 또 다른 종류는 표적 핵산 또는 이의 상보체의 서열과 95% 동일한 서열을 가진 20개 이상의 연속 뉴클레오티드를 포함하고 국제특허출원 공개 제WO 03/076619호에 기재된 주로-이중 가닥 영역(감자 방추 덩이줄기 비로이드-유형의 비로이드로부터의 핵 편재화(localization) 신호, 또는 CUG 트리뉴클레오티드 반복부를 포함하는 주로-이중 가닥 영역을 포함함)을 추가로 포함하는, 국제특허출원 공개 제WO 03/076619호(참고로 본 명세서에 도입됨)에 기재된 RNA 분자이다. 침묵 RNA는 본 명세서에서 정의된 센스 가닥 및 안티센스 가닥을 포함하는 이중 가닥 RNA일 수도 있는데, 이때 상기 센스 가닥 및 안티센스 가닥은 서로 염기-짝짖기를 하여 이중 가닥 RNA 영역을 형성할 수 있다(바람직하게는, 센스 RNA 및 안티센스 RNA의 상기 20개 이상의 연속 뉴클레오티드가 서로 상보적임). 센스 영역 및 안티센스 영역은 센스 영역 및 안티센스 영역이 이중 가닥 RNA 영역을 형성할 때 헤어핀 RNA(hpRNA)가 형성될 수 있도록 하나의 RNA 분자 내에 존재할 수도 있다. hpRNA는 당업게에 잘 공지되어 있다(예컨대, 참고로 본 명세서에 도입되는 국제특허출원 공개 제WO 99/53050호 참조). 주로 상보적일 수 있지만 완전히 상보적일 필요는 없는 긴 센스 및 안티센스 영역(전형적으로 약 200 bp보다 큼, 구체적으로 200 bp 내지 1000 bp)을 가진 긴 hpRNA로서 분류될 수 있다. hpRNA는 약 30 내지 약 42 bp의 다소 작지만 94 bp보다는 훨씬 더 길지 않은 길이를 가질 수도 있다(참고로 본 명세서에 도입되는 국제특허출원 공개 제WO 04/073390호 참조). 침묵 RNA는 예를 들어, 국제특허출원 공개 제WO 05/052170호 또는 제WO 05/047505호, 또는 미국특허 공개 제2005/0144667호에 기재된 인공 마이크로-RNA 분자일 수도 있다(상기 문헌들은 모두 참고로 본 명세서에 도입됨).
또 다른 실시양태에서, 침묵 RNA 분자는 침묵 RNA 분자, 특히 이중 가닥 RNA("dsRNA") 분자를 생성할 수 있는 키메라 유전자를 포함하는 니코티아나 종 또는 재배종의 형질전환 식물 세포 또는 식물을 생산함으로써 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되는데, 이때 이러한 dsRNA 분자의 상보적 RNA 가닥은 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 부분을 포함하고, 이때 상기 부분은 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 상기 dsRNA 분자의 상보적 RNA 가닥은 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열의 부분을 포함하고, 이때 상기 부분은 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다.
본 명세서에서 사용된 "니코티아나"는 공지되어 있는 모든 니코티아나 종, 예컨대, 니코티아나 아카울리스(Nicotiana acaulis), 니코티아나 아큐미나타(Nicotiana acuminata), 니코티아나 아프리카나(Nicotiana africana), 니코티아나 알라타(Nicotiana alata), 니코티아나 앰플렉시카울리스(Nicotiana amplexicaulis), 니코티아나 아렌트시이(Nicotiana arentsii), 니코티아나 아테뉴아타(Nicotiana attenuata), 니코티아나 베나비데시이(Nicotiana benavidesii), 니코티아나 벤싸미아나, 니코티아나 비겔로비이(Nicotiana bigelovii), 니코티아나 보나리엔시스(Nicotiana bonariensis), 니코티아나 카비콜라(Nicotiana cavicola), 니코티아나 클레블랜디이(Nicotiana clevelandii), 니코티아나 코르디폴리아(Nicotiana cordifolia), 니코티아나 코림보사(Nicotiana corymbosa), 니코티아나 데브네이이(Nicotiana debneyi), 니코티아나 엑셀시오르(Nicotiana excelsior), 니코티아나 포겟티아나(Nicotiana forgetiana), 니코티아나 프라그란스(Nicotiana fragrans), 니코티아나 글라우카(Nicotiana glauca), 니코티아나 글루티노사(Nicotiana glutinosa), 니코티아나 굿스피디이(Nicotiana goodspeedii), 니코티아나 고세이(Nicotiana gossei), 니코티아나 하이브리드(Nicotiana hybrid), 니코티아나 인걸바(Nicotiana ingulba), 니코티아나 카와카미이(Nicotiana kawakamii), 니코티아나 나이티아나(Nicotiana knightiana), 니코티아나 랭스도르프피이(Nicotiana langsdorffii), 니코티아나 리니어리스(Nicotiana linearis), 니코티아나 롱기플로라(Nicotiana longiflora), 니코티아나 마라티마(Nicotiana maritima), 니코티아나 메갈로시폰(Nicotiana megalosiphon), 니코티아나 미에르시이(Nicotiana miersii), 니코티아나 녹티플로라(Nicotiana noctiflora), 니코티아나 누디카울리스(Nicotiana nudicaulis), 니코티아나 오브투시폴리아(Nicotiana obtusifolia), 니코티아나 옥시덴탈리스(Nicotiana occidentalis), 니코티아나 옥토포라(Nicotiana otophora), 니코티아나 패니쿨라타(Nicotiana paniculata), 니코티아나 파우치플로라(Nicotiana pauciflora), 니코티아나 페투니오이데스(Nicotiana petunioides), 니코티아나 플럼바기니폴리아(Nicotiana plumbaginifolia), 니코티아나 쿠아드리발비스(Nicotiana quadrivalvis), 니코티아나 라이몬디이(Nicotiana raimondii), 니코티아나 레판다(Nicotiana repanda), 니코티아나 로설라타(Nicotiana rosulata), 니코티아나 로툰디폴리아(Nicotiana rotundifolia), 니코티아나 루스티카(Nicotiana rustica), 니코티아나 셋첼리이(Nicotiana setchellii), 니코티아나 시뮬란스(Nicotiana simulans), 니코티아나 솔라니폴리아(Nicotiana solanifolia), 니코티아나 스페가즈지니이(Nicotiana spegazzinii), 니코티아나 스톡토니이(Nicotiana stocktonii), 니코티아나 수아베올렌스(Nicotiana suaveolens), 니코티아나 실베스트리스(Nicotiana sylvestris), 니코티아나 타바큠(Nicotiana tabacum), 니코티아나 싸이르시플로라(Nicotiana thyrsiflora), 니코티아나 토멘토사(Nicotiana tomentosa), 니코티아나 토멘토시포르미스(Nicotiana tomentosiformis), 니코티아나 트리고노필라(Nicotiana trigonophylla), 니코티아나 움브라티카(Nicotiana umbratica), 니코티아나 운둘라타(Nicotiana undulata), 니코티아나 벨루티나(Nicotiana velutina), 니코티아나 위간디오이데스(Nicotiana wigandioides) 및 니코티아나 x 산데라(Nicotiana x sandera), 및 공지되어 있는 모든 니코티아나 재배종, 예컨대, 니코티아나 타바큠의 재배종, 예컨대, 재배종 버레이21(Burley21), 재배종 델골드(Delgold), 재배종 페타이트 하바나, 재배종 페타이트 하바나 SR1, 재배종 삼선(Samsun) 및 재배종 잔티(Xanthi)를 포함하나, 이들로 한정되지 않는다.
일반 담배인 니코티아나 타바큠은 이배수체 종 니코티아나 실베스트리스 및 니코티아나 토멘토시포르미스로부터 유래된 사배수체 혼성 종이다.
니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA는 니코티아나 종 또는 재배종에서 천연적으로 발생하는 XylT 유전자의 뉴클레오티드 서열, 또는 니코티아나 종 또는 재배종에서 천연적으로 발생하는 XylT 유전자의 mRNA에 상응하는 cDNA를 지칭한다. 유사하게, 니코티아나 XylT 단백질은 니코티아나 종 또는 재배종에서 천연적으로 발생하는 단백질을 지칭한다.
니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 예로는 서열번호 12 또는 14에 기재된 아미노산 서열을 코딩하는, 니코티아나 벤싸미아나로부터 수득된 뉴클레오티드 서열, 및 서열번호 4, 6, 8 또는 10에 기재된 아미노산 서열을 코딩하는, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 수득된 뉴클레오티드 서열을 들 수 있다.
니코티아나 XylT 유전자의 뉴클레오티드 서열의 예로는 서열번호 11, 13 또는 21에 기재된 뉴클레오티드 서열을 포함하는, 니코티아나 벤싸미아나로부터 수득된 뉴클레오티드 서열, 및 서열번호 7 또는 9에 기재된 뉴클레오티드 서열을 포함하는, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 수득된 뉴클레오티드 서열을 들 수 있다.
니코티아나 XylT cDNA의 뉴클레오티드 서열의 예로는 서열번호 3, 5 또는 17에 기재된 뉴클레오티드 서열을 포함하는, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 수득된 뉴클레오티드 서열을 들 수 있다.
그러나, 예시된 뉴클레오티드 서열 또는 이의 부분이 니코티아나 종 또는 재배종에서 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 추가 뉴클레오티드 서열을 확인하는 데 사용될 수 있고, 이러한 뉴클레오티드 서열 또는 이의 부분이 예를 들어, 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스의 수준을 감소시키는 데 사용될 수도 있음이 당업자에게 즉시 명백할 것이다. 예시된 뉴클레오티드 서열은 i) 프로브로서 사용되는, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편; ii) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 DNA 단편; iii) 프로브로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 1513개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드; iv) 프로브로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드; v) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드; vi) PCR 반응에서 프라이머로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열; vii) PCR 반응에서 프라이머로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열; viii) PCR 반응에서 프라이머로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열; 또는 ix) PCR 반응에서 프라이머로서 사용되는, 서열번호 1, 2, 15, 16, 19 또는 20의 뉴클레오티드 서열을 가진 올리고뉴클레오티드를 선택하는 데 사용될 수 있다. 니코티아나 종 또는 재배종으로부터 단리된 게놈 DNA 또는 cDNA 및 프라이머로서의 전술한 올리고뉴클레오티드를 사용하여 PCR을 수행하거나, 니코티아나 종 또는 재배종으로부터 단리된 게놈 DNA 또는 cDNA와 전술한 프로브 사이의 혼성화를 바람직하게는 엄격한 조건 하에서 수행함으로써, 다른 티코티아나 XylT 유전자 또는 니코티아나 XylT cDNA 또는 이들의 단편을 확인하고/하거나 단리할 수 있다.
본 명세서에서 사용된 "엄격한 혼성화 조건"은 프로브와 표적 서열 사이에 95% 이상, 바람직하게는 97% 이상의 서열 동일성이 있는 경우 혼성화가 일반적으로 일어난다는 것을 의미한다. 엄격한 혼성화 조건의 예는 50% 포름아미드, 5 x SSC(150 mM NaCl, 15 mM 트리소듐 시트레이트), 50 mM 인산나트륨(pH 7.6), 5x 덴하츠(Denhardt) 용액, 10% 덱스트란 설페이트 및 20 ㎍/㎖의 전단된 변형 운반체 DNA 예컨대, 연어 정자 DNA를 포함하는 용액 중에서 밤새 항온처리한 후 약 65℃의 0.1 x SSC 중에서 예컨대, 약 10분 동안 혼성화 지지체를 (2회) 세척하는 것이다. 다른 혼성화 및 세척 조건은 잘 공지되어 있고 문헌(Sambrook et al, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor, NY (1989)), 특히 상기 문헌의 11장에 예시되어 있다.
"니코티아나 종-특이적 XylT 뉴클레오티드" 또는 "니코티아나 재배종-특이적 XylT 뉴클레오티드"는 서열번호 25에 기재된, 니코티아나 타바큠 재배종 잔티로부터 단리된 XylT 유전자, 또는 서열번호 23에 기재된, 니코티아나 타바큠 재배종 잔티 단리된 XylT cDNA의 상응하는 뉴클레오티드 서열과 상이하거나 상기 상응하는 뉴클레오티드 서열에 존재하지 않는, 니코티아나 종 또는 재배종으로부터 단리된 XylT 유전자 또는 XylT cDNA의 뉴클레오티드 서열의 뉴클레오티드를 지칭한다.
"니코티아나 종-특이적 XylT 아미노산" 또는 "니코티아나 재배종-특이적 XylT 아미노산"은 서열번호 26에 기재된, 니코티아나 타바큠 재배종 잔티로부터 단리된 XylT 유전자, 또는 서열번호 24에 기재된, 니코티아나 타바큠 재배종 잔티로부터 단리된 XylT cDNA에 의해 코딩된 XylT 단백질의 상응하는 아미노산 서열과 상이하거나 상기 상응하는 아미노산 서열에 존재하지 않는, 니코티아나 종 또는 재배종으로부터 단리된 XylT 유전자 또는 XylT cDNA에 의해 코딩된 XylT 단백질의 아미노산 서열의 아미노산을 지칭한다.
본 발명의 목적을 위해, 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드 또는 아미노산이 니코티아나 종 또는 재배종으로부터 단리된 XylT 유전자 또는 XylT cDNA의 뉴클레오티드 서열, 또는 니코티아나 종 또는 재배종으로부터 단리된 XylT 유전자 또는 XylT cDNA에 의해 코딩된 XylT 단백질의 아미노산 서열에 존재하는 지를 확인하기 위해, 전체적인 정렬 방법을 이용하여 서열을 정렬함으로써 니코티아나 종 또는 재배종으로부터의 XylT 뉴클레오티드 또는 아미노산 서열을 니코티아나 타바큠 재배종 잔티로부터의 상응하는 XylT 뉴클레오티드 또는 아미노산 서열과 비교한다(뉴클레오티드 서열의 경우, 사용된 디폴트 스코어링 매트릭스는 불일치 패널티 = 2, 개방 갭 패널티 = 4 및 연장 갭 패널티 = 1인 "표준 선형"이다. 단백질 서열의 경우, 디폴트 스코어링 매트릭스는 "블로섬62"이다; 문헌(Henikoff and Henikoff, 1992)). 정렬을 수행하기 위해, 얼라인 플러스(Align Plus) 프로그램(미국 소재의 사이언티픽 & 에쥬케이셔널 소프트웨어(Scientific & Educational Software)에 의해 제공됨)을 사용할 수 있다.
이러한 전체적인 DNA 정렬의 한 예는 도 1a 내지 1c에 나타낸 바와 같은, 서열번호 23에 기재된 니코티아나 타바큠 재배종 잔티로부터의 XylT cDNA 서열과, 서열번호 3 및 5에 기재된 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 XylT cDNA 서열의 전체적인 DNA 정렬이다. 이 전체적인 DNA 정렬을 기초로 하여 확인된 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드의 예로는 하기 뉴클레오티드를 들 수 있다:
- 서열번호 3의 위치 1041, 1323, 1332 또는 1421번에 있는 뉴클레오티드, 및
- 서열번호 5의 위치 62, 76, 87, 104, 117, 122, 139, 140, 148, 155, 169, 190, 199, 202, 212, 213, 216, 265, 287, 294, 316, 373, 385, 388, 430, 554, 607, 628, 643, 838, 892, 897, 898, 941, 1005, 1021, 1039 또는 1495번에 있는 뉴클레오티드.
이러한 전체적인 DNA 정렬의 또 다른 예는 도 3a 내지 3l에 나타낸 바와 같은, 서열번호 25에 기재된 니코티아나 타바큠 재배종 잔티로부터의 XylT 유전자 서열과, 서열번호 7 및 9에 기재된 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 XylT 유전자 서열 및 서열번호 11 및 13에 기재된 니코티아나 벤싸미아나로부터의 XylT 유전자 서열의 전체적인 DNA 정렬이다. 이 전체적인 DNA 정렬을 기초로 하여 확인된 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드의 예로는 하기 뉴클레오티드를 들 수 있다:
- 서열번호 7의 위치 61, 75, 86, 100-120, 124, 137, 142, 159, 160, 168, 175, 189, 210, 219, 222, 232, 233, 236, 285, 307, 314, 336, 393, 405, 408, 450, 574, 627, 648, 663, 692, 698, 702, 721, 754, 802, 821, 842, 852, 856, 901, 903, 906, 907, 908, 917, 927, 928, 930, 931, 960, 961, 965, 974, 977, 981, 983, 986, 1001, 1019, 1027, 1029, 1034, 1068, 1073, 1099, 1120, 1129, 1144, 1154, 1158, 1181, 1193, 1208, 1212, 1228, 1230, 1239, 1275, 1313-1316, 1348, 1353, 1357, 1384, 1386, 1496, 1531, 1571, 1601, 1629, 1681, 1696, 1698, 1730, 1754, 1761, 1772, 1789, 1800, 1802, 1811, 1814, 1815, 1855-1861, 1929, 2172, 2190, 2322, 2324, 2328, 2353, 2354, 2391, 2404, 2419, 2428, 2429, 2433, 2434, 2459, 2464, 2478, 2479, 2481, 2484, 2512, 2540-2590, 2595, 2604, 2606, 2630, 2633, 2638, 2670, 2673, 2680, 2695, 2698, 2710, 2711, 2752, 2806, 2811, 2812, 2855, 2919, 2953, 2966, 3217, 3226, 3229 또는 3232번에 있는 뉴클레오티드, 및
- 서열번호 9의 위치 553, 606, 627, 642, 671, 677, 681, 700, 733, 781, 800, 821, 831, 835, 880, 882, 885, 886, 887, 896, 906, 907, 909, 910, 939, 940, 944, 953, 956, 960, 962, 965, 980, 998, 1006, 1008, 1013, 1047, 1052, 1078, 1099, 1108, 1123, 1133, 1137, 1160, 1172, 1187, 1191, 1207, 1209, 1218, 1254, 1292, 1293, 1294, 1295, 1327, 1332, 1336, 1363, 1365, 1475, 1510, 1550, 1580, 1608, 1660, 1675, 1677, 1709, 1733, 1740, 1751, 1768, 1779, 1781, 1790, 1793, 1794, 1834-1840, 1908, 2151, 2169, 2301, 2303, 2307, 2332, 2333, 2370, 2383, 2398, 2407, 2408, 2412, 2413, 2438, 2443, 2457, 2458, 2460, 2463, 2491, 2519-2569, 2574, 2583, 2585, 2609, 2612, 2617, 2649, 2652, 2659, 2674, 2677, 2689, 2690, 2731, 2785, 2790, 2791, 2834, 2898, 2932, 2945, 3196 또는 3205번에 있는 뉴클레오티드.
이 전체적인 DNA 정렬을 기초로 하여 확인된 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드의 예로는 하기 뉴클레오티드를 들 수 있다:
- 서열번호 11의 위치 71, 72, 75, 77, 86, 90, 104, 116, 147, 158, 212, 222, 246, 264, 286, 317, 321, 345, 402, 472, 479, 488, 526, 552, 612, 637, 668, 669, 670, 701, 726, 734, 742, 747, 773, 785, 795, 796, 802, 831, 871, 872, 874, 888, 897, 898, 899, 901, 902, 927, 931, 932, 1039, 1044, 1047, 1080, 1091, 1103, 1104, 1113, 1118, 1131, 1134, 1145, 1152, 1164, 1179, 1183, 1199, 1201, 1206, 1227, 1286, 1287, 1288, 1289, 1296, 1301, 1317, 1328, 1332, 1347, 1376, 1388, 1424, 1429, 1458, 1464, 1510, 1517, 1534, 1559, 1672, 1675, 1676, 1677, 1693, 1705, 1719, 1750, 1757, 1761, 1765, 1832, 1838, 1862, 1872, 1877, 1978, 2010, 2074, 2111, 21 15, 2227, 2251, 2259, 2271, 2283, 2296, 2297, 2341, 2348, 2361, 2370, 2371, 2375, 2384, 2401, 2404, 2406, 2495, 2497, 2521, 2529, 2561, 2607, 2701, 2777, 2822, 2843, 2856, 2867, 3020, 3052, 3053, 3116, 3143 또는 3227에 있는 뉴클레오티드, 및
- 서열번호 13의 위치 77, 107, 203, 297, 312, 399, 449, 469, 489, 492, 496, 529, 538, 566, 573, 633, 661, 662, 666, 671, 683, 690, 699, 723, 763, 774, 784, 785, 791, 861, 877, 886, 887, 888, 890, 891, 920, 921, 943, 996, 1015, 1034, 1116, 1190, 1226, 1277-1280, 1282, 1287, 1331, 1343, 1360, 1386-1651, 1672, 1689, 1738, 1770, 1791, 1813, 1820, 1822, 1831, 1832, 1862, 1869, 1874, 1882, 1893, 1906, 1935, 1945, 1956, 1988, 2007, 2033, 2034, 2045, 2049, 2050, 2167, 2198, 2280, 2299, 2315, 2355, 2392, 2413, 2428, 2442, 2464, 2468, 2477, 2493, 2522, 2544, 2548, 2573, 2574, 2639, 2648, 2649, 2653, 2655, 2659, 2679, 2684, 2740, 2773, 2775, 2781, 2796, 2799, 2807, 2816, 2839, 2857, 2975, 2977, 2990, 3053, 3071, 3083, 3119, 3132, 3265, 3311 또는 3392번에 있는 뉴클레오티드.
이러한 전체적인 단백질 정렬의 한 예는 도 2에 나타낸 바와 같이, 서열번호 24에 기재된 니코티아나 타바큠 재배종 잔티로부터의 XylT cDNA 서열에 의해 코딩된 XylT 단백질 서열과, 서열번호 4 및 6에 기재된 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 XylT cDNA 서열에 의해 코딩된 XylT 단백질 서열의 전체적인 단백질 정렬이다. 이 전체적인 단백질 정렬을 기초로 하여 확인된 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산의 예로는 하기 아미노산을 들 수 있다:
- 서열번호 4의 위치 472 또는 502번에 있는 아미노산, 및
- 서열번호 6의 위치 20, 28, 38, 40, 46, 51, 70, 71, 95, 97, 184, 213, 298, 313, 334 또는 497번에 있는 아미노산.
이러한 전체적인 단백질 정렬의 또 다른 예는 도 4a 내지 4b에 나타낸 바와 같이, 서열번호 26에 기재된 니코티아나 타바큠 재배종 잔티로부터의 XylT 유전자 서열에 의해 코딩된 XylT 단백질 서열과, 서열번호 8 및 10에 기재된 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 XylT 유전자 서열에 의해 코딩된 XylT 단백질 서열, 및 서열번호 12 및 14에 기재된 니코티아나 벤싸미아나로부터의 XylT 유전자 서열에 의해 코딩된 XylT 단백질 서열의 전체적인 단백질 정렬이다. 이 전체적인 단백질 정렬을 기초로 하여 확인된 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산의 예로는 하기 아미노산을 들 수 있다:
- 서열번호 8의 위치 19, 27, 32-38, 44, 46, 52, 57, 76, 77, 101, 103, 190, 219, 304, 319, 340 또는 356번에 있는 아미노산, 및
- 서열번호 10의 위치 183, 212, 297, 312, 333 또는 349번에 있는 아미노산.
이 전체적인 단백질 정렬을 기초로 하여 확인된 니코티아나 벤싸미아나-특이적 XylT 아미노산의 예로는 하기 아미노산을 들 수 있다:
- 서열번호 12의 위치 22, 24, 27, 33, 37, 51, 69, 94, 104, 156, 158, 161, 174, 182, 211, 238, 297, 349 또는 414번에 있는 아미노산, 및
- 서열번호 14의 위치 1, 26, 36, 68, 99, 133, 150, 157, 166, 180, 189, 211, 218, 245, 257, 296, 327, 348 또는 392번에 있는 아미노산.
침묵 RNA 분자, 구체적으로 이중 가닥 RNA 분자의 한 가닥 내에 포함되어 있는, 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 부분, 및 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열의 부분은 19개 이상의 뉴클레오티드 길이를 가져야 하지만, 약 19개 뉴클레오티드 길이 내지 니코티아나 XylT 단백질-코딩 서열 또는 니코티아나 XylT 유전자 또는 cDNA 서열의 길이(뉴클레오티드 길이)와 동일한 길이를 가질 수 있다. 따라서, 센스 또는 안티센스 뉴클레오티드 서열의 총 길이는 25개 이상, 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상 또는 약 500개 이상의 뉴클레오티드 길이일 수 있다. 센스 또는 안티센스 뉴클레오티드 서열의 총 길이에 대한 상한은 없는 것으로 예측된다. 그러나, 실용적 면에서(예컨대, 키메라 유전자의 안정성 면에서), 센스 또는 안티센스 뉴클레오티드 서열의 길이는 5000개 뉴클레오티드 길이를 초과하지 않아야 하며, 구체적으로 2500개 뉴클레오티드 길이를 초과하지 않아야 하고 약 1000개 뉴클레오티드 길이로 한정될 수 있는 것으로 예측된다.
니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열의 부분 또는 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA(센스 또는 안티센스 영역)의 뉴클레오티드 서열의 부분의 총 길이가 길수록 상기 부분과, 이 부분의 상보체인 니코티아나 종 또는 재배종으로부터의 내인성 XylT 유전자 내의 상응하는 영역 사이의 서열 동일성에 대한 요건이 덜 엄격해질 것임을 인식할 것이다. 바람직하게는, 원하는 핵산의 서열은 상응하는 표적 서열과 약 75% 이상의 서열 동일성을 가져야 하고, 구체적으로 표적 서열 또는 이의 상보체의 상응하는 부분과 약 80% 이상, 보다 구체적으로 약 85% 이상, 특히 구체적으로 약 90%, 특히 약 95%, 보다 특히 약 100%의 서열 동일성을 가져야 해야 한다. 그러나, 원하는 핵산은 표적 XylT 핵산의 상응하는 부분과 100%의 서열 동일성을 갖는 약 19개 연속 뉴클레오티드, 구체적으로 약 25개 연속 뉴클레오티드, 보다 구체적으로 약 50개 연속 뉴클레오티드, 특히 약 100개 연속 뉴클레오티드, 매우 특히 약 150개 연속 뉴클레오티드로 구성된 서열을 항상 포함하며, 이때 상기 약 19개 연속 뉴클레오티드, 구체적으로 약 25개 연속 뉴클레오티드, 보다 구체적으로 약 50개 연속 뉴클레오티드, 특히 약 100개 연속 뉴클레오티드, 매우 특히 약 150개 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 것이 바람직하다.
본 발명의 목적상, %로서 표시되는, 2개의 관련 뉴클레오티드 또는 아미노산 서열의 "서열 동일성"은 최적으로 정렬된 2개의 서열에서 동일한 잔기를 가진 위치의 수를 비교되는 위치의 수로 나누고 100을 곱한 값을 지칭한다. 갭, 즉 정렬에 있어서 하나의 서열에는 존재하나 다른 서열에는 존재하지 않는 잔기의 위치는 동일하지 않은 잔기를 가진 위치로서 간주된다. 바람직하게는, 서열 동일성을 계산하고 상응하는 센스 또는 안티센스 서열을 디자인하기 위해, 특히 보다 짧은 센스 서열의 경우 갭의 수가 최소화되어야 한다.
RNA 분자의 뉴클레오티드 서열이 상응하는 DNA 분자의 뉴클레오티드 서열과 관련하여 정의될 때 뉴클레오티드 서열 내의 타이민(T)은 우라실(U)로 대체되어야 한다는 것은 분명할 것이다. RNA 분자에 대한 언급인지 아니면 DNA 분자에 대한 언급인지는 본원의 내용으로부터 분명해질 것이다.
특정한 표적 유전자를 침묵시키는 데 필요한 최소한의 요건은 표적 유전자 서열에 상응하는 약 20 또는 21개의 연속 뉴클레오티드 길이를 가진 뉴클레오티드 서열이 침묵 키메라 유전자 뉴클레오티드 서열 내에 존재하는 것이고, 이때 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 상응하는 표적 유전자 서열과 동일하다는 것이 입증되어 있다. 본 명세서에서 사용된 용어 "20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드"는 하나의 불일치 뉴클레오티드를 가진 표적 유전자로부터 선택된 20개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 지칭한다.
니코티아나 종 또는 재배종의 내인성 XylT 유전자를 침묵시키기 위해서는, 침묵 키메라 유전자 뉴클레오티드 서열이 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 유래된 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하고, 이때 상기 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 유래된 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하고, 이때 상기 20 또는 21개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 것이 바람직하다.
본 명세서에서 사용된 "단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물"은 XylT 활성이 감소되어 있거나 제거되어 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 본 발명의 방법에 따라 처리되지 않은 대조군 니코티아나 식물에서의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준보다 낮거나 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기가 존재하지 않는다. XylT 활성의 표시는 본 발명의 방법에 따라 수득된 니코티아나 식물로부터 수득된 단백질의 글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준을 본 발명의 방법에 따라 처리되지 않은 대조군 니코티아나 식물로부터 수득된 단백질의 글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준과 비교함으로써 얻을 수 있다. 식물의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준은 예컨대, 문헌(Faye et al., Analytical Biochemistry, 1993, 209: 104-108)에 기재된 바와 같이 크실로스-특이적 항체를 사용한 웨스턴 블롯 분석을 수행하여 측정하거나, 예컨대, 문헌(Kolarich and Altmann, 2000, Anal. Biochem. 285: 64-75)에 기재된 바와 같이 매트릭스-보조 레이저 탈착/이온화 비행시간형(Time-of-Flight) 질량 분광분석(MALDI-TOF-MS)을 이용하거나 예컨대, 문헌(Henriksson et al. (2003, Biochem. J. 375: 61-73)에 기재된 바와 같이 액체 크로마토그래피 탠덤 질량 분광분석(LC/MS/MS)을 이용하여 식물의 당단백질로부터 단리된 글리칸에 대한 질량 분광측정을 수행함으로써 측정할 수 있다.
본 발명에 따른 니코티아나 XylT 발현 감소 키메라 유전자를 코딩하는 dsRNA는 예컨대, 국제특허출원 공개 제WO 99/53050호(참고로 본 명세서에 도입됨)의 개시내용에 따라 센스 RNA 영역과 안티센스 RNA 영역 사이의 스페이서 서열에 위치된 인트론 예컨대, 이종 인트론을 포함할 수 있다.
이중 가닥 RNA 분자 예컨대, 전술한 이중 가닥 RNA 분자는 식물 세포 내에서 상응하는 mRNA의 축퇴에 있어서 가이드(guide) 서열로서 작용하는 약 20 또는 21개의 뉴클레오티드로 구성된 작은 RNA 단편으로 절단된다는 것은 분명하다(문헌(Baulcombe, 2004) 참조). 따라서, 또 다른 실시양태에서, 본 발명은 a) 하나 이상의 이중 가닥 RNA 분자를 니코티아나 종 또는 재배종의 식물 세포에 제공하는 단계; 및 b) 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 이중 가닥 RNA 분자를 포함하지 않는 동일한 니코티아나 식물보다 낮은, 상기 이중 가닥 RNA 분자를 포함하는 니코티아나 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 생산하는 방법에 관한 것인데, 이때 상기 이중 가닥 RNA 분자는 2개의 RNA 가닥을 포함하고, 상기 2개의 RNA 가닥 중 한 RNA 가닥은 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열로 본질적으로 구성되되, 상기 20 또는 21개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 또는 한 RNA 가닥은 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열로 본질적으로 구성되되, 상기 20 또는 21개의 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다.
상기 20 또는 21개 뉴클레오티드 길이의 dsRNA 서열은 통상적인 안티센스 RNA 매개 침묵 또는 센스 RNA 매개 침묵의 과정에서도 생성된다. 따라서, 본 발명의 또 다른 실시양태에서, 작동가능하게 연결된 하기 DNA 단편을 포함하는 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포에 제공하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 생산하는 방법이 제공된다:
a) 발현가능한 식물 프로모터;
b) 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개 이상의 연속 뉴클레오티드를 포함하거나 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득된, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택된 20개 이상의 연속 뉴클레오티드를 포함하는 DNA 영역으로서, 이때 상기 20개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 상기 20개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 안티센스 또는 센스 방향으로 포함하는, DNA 영역; 및
c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
따라서, 상기 안티센스 또는 센스 뉴클레오티드 영역은 약 21 내지 약 5000개 뉴클레오티드 길이, 예컨대, 21, 40, 50, 100, 200, 300, 500, 1000 또는 심지어 약 2000개 뉴클레오티드 길이 또는 이보다 더 긴 길이를 가질 수 있다. 더욱이, 사용된 억제 XylT 유전자 분자의 뉴클레오티드 서열 또는 키메라 유전자의 코딩 영역이 니코티아나 식물 세포에서 그 발현을 감소시키고자 하는 내인성 니코티아나 XylT 유전자와 완전히 동일하거나 상보적일 것이 본 발명의 목적상 요구되지는 않는다. 서열이 길수록 총 서열 동일성에 대한 요건이 덜 엄격해진다. 따라서, 센스 또는 안티센스 영역은 내인성 니코티아나 유전자의 뉴클레오티드 서열 또는 이의 상보체와 약 40, 50, 60, 70, 80, 90 또는 100%의 총 서열 동일성을 가질 수 있다. 그러나, 전술한 바와 같이, 안티센스 또는 센스 영역은 바람직하게는 XylT 유전자의 뉴클레오티드 서열과 약 100%의 서열 동일성을 가진 19 또는 20개 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함해야 하는데, 이때 상기 19 또는 20개 연속 뉴클레오티드는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함한다. 서열 동일성이 약 100%인 스트레취(stretch)는 약 50, 75 또는 100개 뉴클레오티드 길이를 가질 수 있다.
전술한 키메라 유전자가 전사된 경우 안티센스 또는 센스 침묵 RNA를 생성하는 상기 키메라 유전자의 효율은 비정상적인 폴리아데닐화되지 않은 XylT 억제 RNA 분자를 발현시키는 DNA 요소의 도입에 의해 더 상승될 수 있다. 이 목적에 적합한 이러한 DNA 요소 중 하나는 국제특허출원 공개 제WO 00/01133호에 기재된 바와 같은, 자가-스플라이싱 리보자임을 코딩하는 DNA 영역이다. 상기 효율은, 국제특허출원 공개 제WO 03/076619호에 기재된 바와 같이, 생성된 RNA 분자에 핵 편재화 또는 보유 신호를 구비시킴에 의해 상승될 수도 있다.
니코티아나 벤싸미아나 및 니코티아나 타바큠으로부터의 예시된 XylT 뉴클레오티드 서열은 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 니코티아나 종 또는 재배종의 식물 집단에서 확인하는 데 사용될 수도 있다. 이러한 니코티아나 종 또는 재배종의 식물 집단은 이미 돌연변이를 가진 집단일 수 있다. 이어서, 확인된 XylT 대립유전자를 통상적인 재배 기법을 이용하여, 선택된 니코티아나 종 또는 재배종의 식물 계통 내로 도입할 수 있다.
니코티아나 식물을 형질전환시키는 방법도 당업계에 잘 공지되어 있다. 니코티아나의 아그로박테리움-매개 형질전환은 예를 들어, 문헌(Zambryski et al. (1983, EMBO J. 2: 2143-2150)), 문헌(De Block et al. (1984, EMBO J. 3(8): 1681-1689)) 또는 문헌(Horsch et al. (Science (1985) 227: 1229-1231))에 기재되어 있다.
본래의 XylT 대립유전자보다 낮은 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준과 상호관련되어 있는 XylT 대립유전자로 내인성 XylT 유전자를 치환시켜 수득한, 본 발명에 따른 형질전환 니코티아나 식물 또는 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물을 통상적인 재배 기법에서 사용함으로써 동일한 특징을 가진 보다 많은 식물을 발생시키거나 본 발명의 키메라 유전자를 동일한 또는 관련된 식물 종의 다른 재배종 또는 혼성 식물 내에 도입할 수 있다. 형질전환 식물로부터 수득된 종자는 안정한 게놈 삽입물로서 본 발명의 키메라 유전자를 함유하고 본 발명에 포함된다.
나아가, 안티센스, 센스 또는 이중 가닥 RNA 또는 코딩 키메라 유전자의 도입은 표현형의 분포가 표적 유전자 발현 억제가 거의 없거나 극히 약한 표현형부터 표적 유전자 발현 억제가 매우 강하거나 심지어 100%인 표현형까지 다양하게 할 수 있다. 그러나, 당업자라면 원하는 정도의 침묵 표현형 및 원하는 표현형을 이끌어 내는 식물 세포, 식물, 이벤트(event) 또는 식물 계통을 선별할 수 있을 것이다.
본 명세서에서 사용된 "포함하는"은 언급된 특징, 정수, 단계 또는 성분의 존재를 특정하는 것으로서 해석되어야 하는 것이지 하나 이상의 특징, 정수, 단계 또는 성분, 또는 이들의 군의 존재 또는 추가를 배제하는 것은 아니다. 따라서, 예를 들어, 뉴클레오티드 또는 아미노산 서열을 포함하는 핵산 또는 단백질은 실제로 언급된 뉴클레오티드 또는 아미노산보다 더 많은 뉴클레오티드 또는 아미노산을 포함할 수 있다, 즉 보다 큰 핵산 또는 단백질 내에 포함되어 있을 수 있다. 기능적으로 또는 구조적으로 정의된 DNA 영역을 포함하는 키메라 유전자는 추가 DNA 영역 등을 포함할 수 있다.
하기 비-제한적 실시예에는 니코티아나 종, 특히 니코티아나 벤싸미아나, 및 니코티아나 재배종, 특히 니코티아나 타바큠 재배종 페타이트 하바나 SR1에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 변경시키기 위한 키메라 유전자 및 이들의 용도가 기재되어 있다. 실시예에서 달리 명시되어 있지 않은 한, 모든 재조합 DNA 기법은 문헌(Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, NY and in Volumes 1 and 2 of Ausubel et al. (1994) Current Protocols in Molecular Biology, Current Protocols, USA)에 기재된 표준 프로토콜에 따라 수행된다. 분자 수준에서의 식물 연구를 위한 표준 재료 및 방법은 문헌(Plant Molecular Biology Labfax (1993) by R.D.D. Croy, jointly published by BIOS Scientific Publications Ltd (UK) and Blackwell Scientific Publications, UK)에 기재되어 있다.
상세한 설명 및 실시예 전체에 걸쳐 서열목록에 기재된 하기 서열들이 언급되어 있다:
서열번호 1 : 니코티아나 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylF4의 뉴클레오티드 서열.
서열번호 2: 니코티아나 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylR4의 뉴클레오티드 서열.
서열번호 3: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 1의 부분 cDNA 서열.
서열번호 4: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 단백질 변이체 1의 부분 아미노산 서열.
서열번호 5: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 2의 부분 cDNA 서열.
서열번호 6: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 단백질 변이체 2의 부분 아미노산 서열.
서열번호 7: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 1의 부분 뉴클레오티드 서열.
서열번호 8: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 단백질 변이체 1의 부분 아미노산 서열.
서열번호 9: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 2의 부분 뉴클레오티드 서열.
서열번호 10: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 단백질 변이체 2의 부분 아미노산 서열.
서열번호 11: 니코티아나 벤싸미아나 XylT 유전자 변이체 1의 부분 뉴클레오티드 서열.
서열번호 12: 니코티아나 벤싸미아나 XylT 단백질 변이체 1의 부분 아미노산 서열.
서열번호 13: 니코티아나 벤싸미아나 XylT 유전자 변이체 2의 부분 뉴클레오티드 서열.
서열번호 14: 니코티아나 벤싸미아나 XylT 단백질 변이체 2의 부분 아미노산 서열.
서열번호 15: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylF8의 뉴클레오티드 서열.
서열번호 16: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylR8의 뉴클레오티드 서열.
서열번호 17: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT 유전자 변이체 1의 부분 cDNA 서열.
서열번호 18: 벡터 pTKW20의 T-DNA 영역의 뉴클레오티드 서열.
서열번호 19: 니코티아나 벤싸미아나 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylF9의 뉴클레오티드 서열.
서열번호 20: 니코티아나 벤싸미아나 XylT 유전자 또는 cDNA의 부분을 증폭시키기에 적합한 올리고뉴클레오티드 XylR9의 뉴클레오티드 서열.
서열번호 21: 니코티아나 벤싸미아나 XylT 유전자 변이체 1의 부분 서열.
서열번호 22: 벡터 pTKW29의 T-DNA 영역의 뉴클레오티드 서열.
서열번호 23: 잠정적인 베타-(1,2)-크실로실트랜스퍼레이즈에 대한 니코티아나 타바큠 재배종 잔티 mRNA(검색번호 AJ627182).
서열번호 24: 서열번호 23에 의해 코딩된 잠정적인 베타-(1,2)-크실로실트랜스퍼레이즈.
서열번호 25: 잠정적인 베타-(1,2)-크실로실트랜스퍼레이즈에 대한 니코티아나 타바큠 재배종 잔티 XylT 유전자(검색번호 AJ627183).
서열번호 26: 서열번호 25에 의해 코딩된 잠정적인 베타-(1,2)-크실로실트랜스퍼레이즈.
실시예 1: 니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나로부터 XylT cDNA 및 유전자 서열을 단리하는 데 사용되는 축퇴 프라이머의 디자인
니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나로부터 XylT cDNA 및 게놈 DNA를 PCR 증폭시키는 데 있어서 축퇴 프라이머로서 사용될 올리고뉴클레오티드 서열은 잠정적인 XylT 단백질을 코딩하는 니코티아나 타바큠 재배종 잔티(검색번호 AJ627183)로부터 단리된 게놈 DNA 서열의 엑손 서열을 기초로 하여 디자인하였다. 클로닝을 목적으로 5' 말단에 CACC를 가진 전방향 프라이머를 디자인하였다. 이러한 방식으로 하기 축퇴 프라이머를 제조하였다:
XylF4: 5'-CACCTTGTTTCTCTCTTCGCTCTCAACTCAATCACTC-3' (서열번호 1)
XylR4: 5'-TCGATCACAACTGGAGGATCCGCATAA-3' (서열번호 2)
실시예 2: 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 XylT cDNA 서열의 단리
실시예 1에 기재된 축퇴 프라이머를 사용하여 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 XylT cDNA 서열을 단리하였다.
RNeasy 플랜트 미니 키트(RNeasy Plant Mini Kit; Qiagen)를 제조자의 지시에 따라 사용하여 니코티아나 타바큠 재배종 페타이트 하바나 SR1의 잎으로부터 RNA를 추출하여, RT-PCR용 수퍼스크립트(Superscript)™ 제1-가닥 합성 시스템(Invitrogen Life Technologies)을 제조자의 지시에 따라 사용한 cDNA 합성에 사 용하였다.
cDNA를 기질로 사용하고 프라이머쌍 XylF4/XylR4를 사용하여 하기 조건 하에 PCR 증폭을 수행하였다: 40주기 동안 94℃에서 15초(변성) 및 68℃에서 3분(어닐링 및 연장(elongation)).
약 1500 bp의 DNA 단편을 증폭하여 pENTR™/D-TOPO® 벡터(Invitrogen) 내로 클로닝하고, 여러 클론을 시퀀싱하였다(서열번호 3 - XylTc2Nt 및 서열번호 5 - XylTc7Nt의 서열을 포함함).
잠정적인 XylT 단백질을 코딩하는, 니코티아나 타바큠 재배종 잔티로부터 단리된 mRNA 서열(검색번호 AJ627182; 서열번호 23)과, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT cDNA(서열번호 3 및 5) 사이의 정렬이 도 1a 내지 1c에 나타나 있다.
니코티아나 타바큠 재배종 잔티로부터 단리된 mRNA 서열에 의해 코딩된 잠정적인 XylT 단백질(검색번호 AJ627182; 서열번호 24)과, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 cDNA 서열에 의해 코딩된 잠정적 XylT 단백질(서열번호 4 및 6) 사이의 정렬은 도 2에 나타나 있다.
실시예 3: 니코티아나 타바큠 재배종 페타이트 하바나 SR1의 XylT 유전자 서열 및 니코티아나 벤싸미아나의 XylT 유전자 서열의 단리
실시예 1에 기재된 축퇴 프라이머를 사용하여 니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나로부터 XylT 유전자 서열을 단리하였 다.
문헌(Bernatzky and Tanksley (1986))에 기재된 프로토콜을 기초로 하여 니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나의 잎으로부터 DNA를 추출하였다.
게놈 DNA을 기질로 사용하고 프라이머쌍 XylF4/XylR4를 사용하여 하기 조건 하에 PCR 증폭을 수행하였다: 40주기 동안 94℃에서 15초(변성) 및 68℃에서 3분(어닐링 및 연장).
니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터의 게놈 DNA를 PCR 증폭용 기질로서 사용하여, 약 3400 bp의 DNA 단편을 증폭하여 pENTR™/D-TOPO® 벡터(Invitrogen) 내로 클로닝하고, 여러 클론을 시퀀싱하였다(서열번호 7 - XylTgINt 및 서열번호 9 - XylTg3Nt의 서열을 포함함).
XylT 게놈 DNA 서열 XylTgINt 및 XylTg3Nt는 2개의 잠정적인 인트론 서열 및 3개의 잠정적인 엑손 서열을 포함한다. 인트론 서열의 위치는 다음과 같다:
- XylTgINt의 경우: 서열번호 7의 위치 679번에 있는 뉴클레오티드부터 위치 1974번에 있는 뉴클레오티드까지, 및 위치 2125번에 있는 뉴클레오티드부터 위치 2722번에 있는 뉴클레오티드까지; 및
- XylTg3Nt의 경우: 서열번호 9의 위치 658번에 있는 뉴클레오티드부터 위치 1953번에 있는 뉴클레오티드까지, 및 위치 2104번에 있는 뉴클레오티드부터 위치 2701번에 있는 뉴클레오티드까지.
니코티아나 벤싸미아나로부터의 게놈 DNA를 PCR 증폭용 기질로서 사용하여, 약 3300 내지 약 3600 bp의 DNA 단편을 증폭하여 pENTR™/D-TOPO® 벡터(Invitrogen) 내로 클로닝하고, 여러 클론을 시퀀싱하였다(서열번호 11 - XylTg14Nb 및 서열번호 13 - XylTgl9Nb의 서열을 포함함).
XylT 게놈 DNA 서열 XylTg14Nb 및 XylTg19Nb는 2개의 잠정적인 인트론 서열 및 3개의 잠정적인 엑손 서열을 포함한다. 인트론 서열의 위치는 다음과 같다:
- XylTg14Nb의 경우: 서열번호 11의 위치 658번에 있는 뉴클레오티드부터 위치 1917번에 있는 뉴클레오티드까지, 및 위치 2068번에 있는 뉴클레오티드부터 위치 2612번에 있는 뉴클레오티드까지; 및
- XylTgl9Nb의 경우: 서열번호 13의 위치 649번에 있는 뉴클레오티드부터 위치 2194번에 있는 뉴클레오티드까지, 및 위치 2345번에 있는 뉴클레오티드부터 위치 2888번에 있는 뉴클레오티드까지.
잠정적인 XylT 단백질을 코딩하는, 니코티아나 타바큠 재배종 잔티로부터 단리된 게놈 DNA 서열(검색번호 AJ627183; 서열번호 25)과, 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT 게놈 DNA 서열(서열번호 7 및 9) 및 니코티아나 벤싸미아나로부터 단리된 XylT 게놈 DNA 서열(서열번호 11 및 13) 사이의 정렬은 도 3a 내지 3l에 나타나 있다.
니코티아나 타바큠 재배종 잔티로부터 단리된 게놈 DNA 서열에 의해 코딩된 잠정적인 XylT 단백질(검색번호 AJ627183; 서열번호 26)과, 니코티아나 타바큠 재 배종 페타이트 하바나 SR1로부터 단리된 게놈 DNA 서열에 의해 코딩된 잠정적인 XylT 단백질(서열번호 8 및 10) 및 니코티아나 벤싸미아나로부터 단리된 게놈 DNA 서열에 의해 코딩된 잠정적인 XylT 단백질(서열번호 12 및 14) 사이의 정렬은 도 4a 내지 4b에 나타나 있다.
실시예 4: 니코티아나 XylT 침묵 유전자를 함유하는 T-DNA 벡터의 구축
실시예 2 및 3에 기재된 니코티아나 XylT 서열로부터 증폭된 DNA 단편을 사용하여, 전사되었을 때 상기 증폭된 DNA 단편으로부터의 센스 및 안티센스 DNA 서열을 포함하는 RNA 분자를 생성하고 염기-짝짓기를 하여 이중 가닥 RNA 분자를 형성할 수 있는 키메라 유전자를 포함하는 T-DNA 벡터를 구축하였다. 이러한 키메라 유전자는 니코티아나, 특히 니코티아나 타바큠 재배종 페타이트 하바나 SR1 및 니코티아나 벤싸미아나에서의 XylT 유전자의 발현을 감소시키는 데 사용될 수 있다.
4.1. 니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT 서열로부터 증폭된 DNA 단편을 가진 XylT 침묵 유전자를 포함하는 T-DNA 벡터의 구축
니코티아나 타바큠 재배종 페타이트 하바나 SR1로부터 단리된 XylT cDNA 서열의 PCR 증폭에 있어서 비-축퇴 프라이머로서 사용될 올리고뉴클레오티드 서열을 실시예 2에서 단리된 니코티아나 타바큠 재배종 페타이트 하바나 SR1의 cDNA 서열을 기초로 하여 디자인하였다. 클로닝을 위해 5' 말단에 CACC가 있는 전방향 프라이머(서열번호 15)를 디자인하였다. 이 방식으로 하기 비-축퇴 프라이머를 생성하였다:
XylF8: 5'-CACCTCTCGCCTTTGGGATATGAAACT-5'(서열번호 15)
XylR8: 5'-ACAGCTTTGGTGCTGCAGAAACT-3'(서열번호 16)
실시예 2에 기재된 바와 같이, 니코티아나 타바큠 재배종 페타이트 하바나 SR1의 XylT cDNA 서열로부터 증폭된 DNA 단편을 포함하는 벡터를 기질로서 사용하고 프라이머쌍 XylF8/XylR8을 사용하여 하기 조건 하에 PCR 증폭을 수행하였다: 25주기 동안 94℃에서 15초(변성), 56℃에서 30초(어닐링) 및 68℃에서 45초(연장).
약 470 bp의 DNA 단편(XylTi4Nt; 서열번호 17)을 증폭하여 pENTR™/D-TOPO® 벡터(Invitrogen) 내로 클로닝함으로써 플라스미드 pKW19를 수득하였다. 플라스미드 pKW19를 게이트웨이(Gateway)® LR 클로네이즈(Clonase)™ II(Invitrogen)를 사용하여 pHellsgate12(Helliwell and Waterhouse, Methods (2003) 30: 289-295)와 재조합함으로써 플라스미드 pTKW20을 수득하였다.
따라서, pTKW20의 T-DNA 서열(서열번호 18)은 하기 유전자를 포함한다:
1) i) 카울리플라워 모자이크 바이러스(Cauliflower Mosaic Virus) 35S 전사체의 프로모터 영역을 포함하는 단편(Odell et al, 1985)(서열번호 18, 969번에 위치한 뉴클레오티드부터 위치 2314번에 위치한 뉴클레오티드까지),
ii) 센스 방향으로 클로닝된 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT cDNA 서열의 일부를 포함하는 단편(서열번호 18, 2365번에 위치한 뉴클레오티드부터 위치 2834번에 위치한 뉴클레오티드까지),
iii) 피마자로부터 단리된 카테이즈(catase)-1 유전자의 인트론을 포함하는 단편(서열번호 18, 2893번에 위치한 뉴클레오티드부터 위치 3088번에 위치한 뉴클레오 티드까지),
iv) 문헌(Rosche and Westhoff (1995))에 기재된 바와 같은, 플라베리아 트리네르비아(Flaveria trinervia)로부터 단리된 피루베이트 오르토포스페이트 디카이네이즈 유전자의 제2 인트론을 역방향으로 포함하는 단편(서열번호 18, 3130번에 위치한 뉴클레오티드부터 위치 3871번에 위치한 뉴클레오티드까지),
v) 안티센스 방향으로 클로닝된 니코티아나 타바큠 재배종 페타이트 하바나 SR1 XylT cDNA 서열의 부분을 포함하는 단편(서열번호 18, 3597번에 위치한 뉴클레오티드부터 위치 4426번에 위치한 뉴클레오티드까지), 및
vi) 문헌(De Greve et al. (1982))에 기재된 바와 같은 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)의 옥토핀(octopine) 합성효소 유전자의 3' 비번역 영역을 포함하는 단편(서열번호 18, 4479번에 위치한 뉴클레오티드부터 위치 5244번에 위치한 뉴클레오티드까지)
을 포함하는 키메라 XylT 침묵 유전자; 및
2) i) 아그로박테리움 투메파시엔스 T-DNA의 노팔린(nopaline) 합성효소 유전자의 프로모터 영역을 포함하는 단편(서열번호 18, 5512번에 위치한 뉴클레오티드부터 위치 5744번에 위치한 뉴클레오티드까지),
ii) nptll 항생제 내성 유전자를 포함하는 단편(서열번호 18, 5745번에 위치한 뉴클레오티드부터 위치 6690번에 위치한 뉴클레오티드까지), 및
iii) 아그로박테리움 투메파시엔스 T-DNA의 노팔린 합성효소 유전자의 3' 비번역 영역을 포함하는 단편(서열번호 18, 6691번에 위치한 뉴클레오티드부터 위치 7396 번에 위치한 뉴클레오티드까지)
을 포함하는 선별 마커를 코딩하는 키메라 유전자.
T-DNA 벡터를, 헬퍼 Ti-플라스미드를 포함하는 아그로박테리움 투메파시엔스 내로 도입하였다.
4.2. 니코티아나 벤싸미아나로부터 단리된 XylT 서열로부터 증폭된 DNA 단편을 가진 XylT 침묵 유전자를 포함하는 T-DNA 벡터의 구축
니코티아나 벤싸미아나로부터 단리된 XylT 유전자 서열의 PCR 증폭에 있어서 비-축퇴 프라이머로서 사용될 올리고뉴클레오티드 서열을, 실시예 3에서 단리된 니코티아나 벤싸미아나로부터 단리된 유전자 서열을 기초로 하여 디자인하였다. 클로닝을 위해 5' 말단에 GGCCGGATCCTCG가 있는 전방향 프라이머(서열번호 19)를 디자인하였고, 5' 말단에 GGCCATCGATGGTACC가 있는 역방향 프라이머(서열번호 20)를 디자인하였다. 이 방식으로 하기 비-축퇴 프라이머를 생성하였다:
XylF9: 5'-GGCCGGATCCTCGAGACACAATTGGAGGAAACATGGAAAGC-5'(서열번호 19)
XylR9: 5'-GGCCATCGATGGTACCGGCCCAGCTCTTTATGGAATCAAA-3'(서열번호 20)
실시예 3에 기재된 바와 같은, 니코티아나 벤싸미아나의 XylT 유전자 서열로부터 증폭된 DNA 단편을 포함하는 벡터를 기질로서 사용하고 프라이머쌍 XylF9/XylR9를 사용하여 하기 조건 하에 PCR 증폭을 수행하였다: 25주기 동안 94℃에서 15초(변성), 58℃에서 30초(어닐링) 및 68℃에서 30초(연장).
약 430 bp의 DNA 단편(XylTiNb; 서열번호 21)을 증폭하여 XhoI과 KpnI 및 BamHI과 ClaI으로 절단하였다. XhoI/KpnI 및 BamHI/ClaI으로 절단한 단편을, XhoI/KpnI 및 BamHI/ClaI으로 절단한 pHANNIBAL(Helliwell and Waterhouse, 2003) 내로 클로닝하여 pKW28을 수득하였다.
따라서, 플라스미드 pKW28은 제한효소 인식 부위 MscI과 PstI 사이에 하기 단편을 포함하는 키메라 XylT 침묵 유전자를 포함한다:
1) 카울리플라워 모자이크 바이러스 35S 전사체의 프로모터 영역을 포함하는 단편(Odell et al, 1985)(서열번호 22, 위치 3779번에 있는 뉴클레오티드부터 위치 2434번에 있는 뉴클레오티드까지),
2) 센스 방향으로 클로닝된 니코티아나 벤싸미아나 XylT 유전자의 부분을 포함하는 단편(서열번호 22, 위치 2427번에 있는 뉴클레오티드부터 위치 2023번에 있는 뉴클레오티드까지),
3) 문헌(Rosche and Westhoff (1995))에 기재된 바와 같은, 플라베리아 트리네르비아로부터 단리된 피루베이트 오르토포스페이트 디카이네이즈의 제2 인트론을 포함하는 단편(서열번호 22, 1991번에 위치한 뉴클레오티드부터 위치 1250번에 위치한 뉴클레오티드까지),
4) 안티센스 방향으로 클로닝된 니코티아나 벤싸미아나 XylT 유전자 서열의 부분을 포함하는 단편(서열번호 22, 1211번에 위치한 뉴클레오티드부터 위치 807번에 위치한 뉴클레오티드까지), 및
5) 문헌(De Greve et al. (1982))에 기재된 바와 같은 아그로박테리움 투메파시엔스의 옥토핀 합성효소 유전자의 3' 비번역 영역을 포함하는 단편(서열번호 22, 786번에 위치한 뉴클레오티드부터 위치 76번에 위치한 뉴클레오티드까지).
플라스미드 pKW28은 MscI 및 PstI으로 절단하였고, 상기 키메라 유전자는 하기 단편을 포함하는 선별 마커를 코딩하는 키메라 유전자와 함께 PstI 및 SmaI으로 절단된 T-DNA 벡터의 T-DNA 경계 사이에 도입하여 pTKW29를 수득하였다(pTKW29의 T-DNA의 서열은 서열번호 22에 나타냄):
1) 아그로박테리움 투메파시엔스 T-DNA의 노팔린 합성효소 유전자의 프로모터 영역을 포함하는 단편(서열번호 22, 3854번에 위치한 뉴클레오티드부터 위치 4140번에 위치한 뉴클레오티드까지),
2) 바(bar) 포스피노트리신(phosphinothricin) 내성 유전자를 포함하는 단편(De Block et al, 1987)(서열번호 22, 4161번에 위치한 뉴클레오티드부터 위치 4712번에 위치한 뉴클레오티드까지), 및
3) 아그로박테리움 투메파시엔스 T-DNA의 노팔린 합성효소 유전자의 3' 비번역 영역을 포함하는 단편(서열번호 22, 4731번에 위치한 뉴클레오티드부터 위치 4991번에 위치한 뉴클레오티드까지).
벡터 pTKW29는 pGSC1700(Cornelissen and Vandewiele, 1989)으로부터 유래된 것이다. 이 벡터 골격은 하기 유전 요소를 포함한다:
1) 에쉬케리치아 콜라이(Escherichia coli)에서 복제하기 위한, 플라스미드 pBR322(Bolivar et al., 1977)로부터의 복제 기점(ORI CoIE1)을 포함하는 플라스미드 코어, 및 아그로박테리움 투메파시엔스에서 복제하기 위한, 슈도모나스(Pseudomonas) 플라스미드 pVS1(Itoh et al., 1984)로부터의 복제 기점(ORI pVSl)을 포함하는 제한 단편,
2) 에쉬케리치아 콜라이 및 아그로박테리움 투메파시엔스에서의 플라스미드의 증식 및 선별을 위해 스트렙토마이신 및 스펙티노마이신(aadA)에 대한 내성을 부여하는 선별 마커 유전자, 및
3) 트랜스포존 Tn903(Oka et al., 1981)으로부터 단리된 nptI 유전자의 네오마이신 포스포트랜스퍼레이즈 코딩 서열의 단편으로 구성된 DNA 영역.
상기 T-DNA 벡터는 헬퍼 Ti-플라스미드를 포함하는 아그로박테리움 투메파시엔스 내로 도입된다.
실시예 5: XylT 침묵 유전자를 보유하는 형질전환 니코티아나 식물의 분석
실시예 4에 기재된 아그로박테리움 투메파시엔스 균주를 사용하여 니코티아나 식물을 형질전환시켰다.
5.1. XylT 침묵 유전자를 보유하는 형질전환 니코티아나 타바큠 재배종 페타이트 하바나 SR1 식물의 분석
문헌(Zambryski et al. (1983))에 기재된 프로토콜에 따라 니코티아나 타바큠 재배종 페타이트 하바나 SR1 식물을 실시예 4.1.에 기재된 아그로박테리움 투메파시엔스를 사용하여 형질전환시켰다. 실시예 4.1.에 기재된 키메라 유전자를 포함하는 52종의 형질전환 니코티아나 타바큠 계통을 수득하였다.
형질전환 식물 계통을 서던 블롯 분석을 이용하여 분자 수준에서 분석하였다. 유사하게, 상기 식물 계통들을 노던 블롯 분석을 이용하여 XylT RNA 발현에 대해 분석하였다.
XylT 활성의 표시는 형질전환 계통으로부터 수득된 단백질의 글리칸 상에 존 재하는 베타-1,2-크실로스 잔기의 수준을 비형질전환 식물과 비교함으로써 얻을 수 있다. 식물의 단백질-결합 N-글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준은 예를 들어, 문헌(Faye et al (1993))에 기재된 바와 같이 크실로스-특이적 항체를 사용한 웨스턴 블롯 분석에 의해 측정될 수 있거나, 예컨대, 문헌(Kolarich and Altmann, 2000, Anal. Biochem. 285: 64-75)에 기재된 바와 같이 매트릭스-보조 레이저 탈착/이온화 비행시간형 질량 분광분석(MALDI-TOF-MS)을 이용하거나 예컨대, 문헌(Henriksson et al. (2003, Biochem. J. 375: 61-73)에 기재된 바와 같이 액체 크로마토그래피 탠덤 질량 분광분석(LC/MS/MS)을 이용하여 식물의 당단백질로부터 단리된 글리칸에 대한 질량 분광측정을 수행함으로써 측정할 수 있다.
5.2. XylT 침묵 유전자를 보유하는 형질전환 니코티아나 벤싸미아나 식물의 분석
유사하게, 니코티아나 벤싸미아나 식물을 실시예 4.2.에 기재된 아그로박테리움 투메파시엔스 균주를 사용하여 형질전환시켰고, 단백질의 글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준을 하기와 같이 분석하였다.
잎 디스크(disk)를 pTKW29로 형질전환한 후 실시예 4.2.에 기재된 키메라 유전자를 포함하는 54종의 형질전환 니코티아나 벤싸미아나 계통을 수득하였다.
이 식물 계통들의 내재성 단백질의 글리칸 상에 존재하는 베타-1,2-크실로스 잔기의 수준을 측정하기 위해, 각 개체의 가용성 잎 단백질을 베타-1,2-크실로스-특이적 항체를 사용한 웨스턴 블롯으로 분석하였다.
6개의 샘플은 상기 항체와의 매우 약한 반응을 보였고, 6개의 샘플은 상기 항체와의 검출가능한 반응을 보이지 않았다. 나머지 샘플들의 경우, 상기 항체와의 반응 수준은 약한 수준부터 야생형 수준까지이다.
pTKW29로부터 수득된 키메라 XylT 침묵 유전자의 삽입 횟수를 측정하기 위해, 베타-1,2-크실로스-특이적 항체에 대해 매우 약한 반응 내지 음성 반응을 보이는 식물 계통으로부터 단리된 게놈 DNA를 단리하여 EcoRI으로 절단하고, 35S 프로모터 영역에 걸쳐있는 프로브 및 바 포스피노트리신 내성 유전자 코딩 영역에 걸쳐 있는 프로브를 사용한 서던 블롯으로 분석하였다.
12종의 식물 계통 중 어느 식물 계통도 단일 삽입을 보이지 않았다. 한 식물 계통은 2개의 삽입을 함유하였고 웨스턴 블롯 분석을 이용하였을 때 크실로스에 대해 음성이었다.
독립적으로 삽입된 이들 2개의 키메라 XylT 침묵 유전자를 시험하기 위해, 그리고 웨스턴 블롯에 의한 분석 시 크실로스에 대해 음성이며 단일 키메라 XylT 침묵 유전자를 함유하는 식물을 수득하기 위해, 2개의 삽입을 함유하는 식물 게통의 자가 수정으로부터 발생된 자손의 씨를 뿌리고, 25종의 식물 계통을 웨스턴 블롯 분석으로 분석하였다.
참고문헌
Baulcombe (2004). Nature 431: 356-363.
Bernatzky and Tanksley (1986). Theor. Appl. Genet. 72: 314-321.
Bolivar et al. (1977). Gene 2: 95-113.
Cornelissen and Vandewiele (1989). Nucleic Acids Research 17: 19-25.
De Block et al. (1984). EMBO J. 3(8): 1681-1689
De Block et al. (1987). EMSO J 6:2513.
De Greve et al. (1982). J. Mol. Appl. Genetics 1 (6): 499-511.
Faye et al. (1993). Analytical Biochemistry 209: 104-108.
Fischer et al. (2004). Curr. Opin. Plant Biol. 7: 152-158.
Helliwell and Waterhouse (2003). Methods 30: 289-295.
Henikoff and Henikoff (1992). Proc. Natl. Acad. Sci. USA 89(22): 10915-10919.
Henriksson et al. (2003). Biochem. J. 375: 61-73.
Horsch et al. (1985). Science 111: 1229-1231.
Itoh et al. (1984). Plasmid 11: 206.
Khoo et al. (1997). Glycobiology 7: 663-677.
Kolarich and Altmann (2000). Anal. Biochem. 285: 64-75.
Mulder et al. (1995). Eur. J. Biochem. 232: 272-283.
Odell et al. (1985). Nature 313: 810.
Oka et al. (1981). Journal of Molecular Biology, 147, 217-226.
Rosche and Westhoff (1995). Plant Molecular Biology 29 (4): 663-678.
Stoger et al. (2002). Curr. Opin. Biotechnol. 13: 161-166.
Strasser et al. (2000). FEBS Lett. 472: 105-108.
Strasser et al. (2004a). 2nd EPSO Conference, October 2004, Italy, Abstract book p. 56, S036.
Strasser et al. (2004b). FEBS Lett. 561: 132-136.
Tezuka et al (1992). Eur J Biochem. 203(3): 401-413.
Twyman et al. (2003). Trends Biotechnol. 21: 570-578.
Zambryski et al. (1983). EMBO J. 2: 2143-2150.
Zeng et al. (1997). J. Biol. Chem. 272: 31340-31347.
SEQUENCE LISTING
<110> Bayer BioScience N.V.
Weterings, Koen
<120> Novel nucleotide sequences encoding Nicotiana
beta-1,2-xylosyltransferase
<130> BCS 06-2005
<160> 26
<170> PatentIn version 3.3
<210> 1
<211> 37
<212> DNA
<213> Artificial
<220>
<223> oligonucleotide XylF4
<400> 1
caccttgttt ctctcttcgc tctcaactca atcactc 37
<210> 2
<211> 27
<212> DNA
<213> Artificial
<220>
<223> oligonucleotide XylR4
<400> 2
tcgatcacaa ctggaggatc cgcataa 27
<210> 3
<211> 1513
<212> DNA
<213> Artificial
<220>
<223> XylTc2Nt
<220>
<221> CDS
<222> (7)..(1512)
<400> 3
cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr
1 5 10
ttc tct tcc cac tct gat cac ttc cgt cac aaa tcc ccc caa aac cac 96
Phe Ser Ser His Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His
15 20 25 30
ttt cct aat acc caa aac cac tat tcc ctg tcg gaa aac cac cat gat 144
Phe Pro Asn Thr Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp
35 40 45
aat ttc cac tct tct gtc act tcc caa tat acc aag cct tgg cca att 192
Asn Phe His Ser Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile
50 55 60
ttg ccc tcc tac ctc ccc tgg tct cag aat cct aat gtt tct ttg aga 240
Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg
65 70 75
tcg tgc gag ggt tac ttc ggt aat ggg ttt act ctc aaa gtt gat ctt 288
Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu
80 85 90
ctc aaa act tcg ccg gag ctt cac cag aaa ttc ggc gaa aac acc gta 336
Leu Lys Thr Ser Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val
95 100 105 110
tcc ggc gac ggc gga tgg ttt agg tgt ttt ttc agt gag act ttg cag 384
Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln
115 120 125
agt tcg att tgc gag gga ggt gct ata cga atg aat ccg gac gag att 432
Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile
130 135 140
ttg atg tct cgt gga ggc gag aaa ttg gag tcg gtt att ggt agg agt 480
Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser
145 150 155
gaa gat gat gag ctg ccc gtg ttc aaa aat gga gct ttt cag att aaa 528
Glu Asp Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys
160 165 170
gtt act gat aaa ctg aaa att ggg aaa aaa tta gtg gat gaa aaa atc 576
Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile
175 180 185 190
ttg aat aaa tac tta ccg gaa ggt gca att tca agg cac act atg cgt 624
Leu Asn Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg
195 200 205
gaa tta att gac tct att cag tta gtt ggc gcc gat gaa ttt cac tgt 672
Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys
210 215 220
tct gag tgg att gag gag ccg tca ctt ttg att aca cga ttt gag tat 720
Ser Glu Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr
225 230 235
gca aac ctt ttc cac aca gtt acc gat tgg tat agt gca tac gtg gca 768
Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala
240 245 250
tcc agg gtt act ggc ttg ccc agt cgg cca cat ttg gtt ttt gta gat 816
Ser Arg Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp
255 260 265 270
ggc cat tgt gag aca caa ttg gag gaa aca tgg aaa gca ctc ttt tca 864
Gly His Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser
275 280 285
agc ctc act tat gct aag aac ttt agt ggc cca gtt tgt ttc cgt cac 912
Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His
290 295 300
gcc gtt ctc tcg cct ttg gga tat gaa act gcc ctg ttt aag gga ctg 960
Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu
305 310 315
aca gaa act ata gat tgt aat gga gct tct gcc cat gat ttg tgg caa 1008
Thr Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln
320 325 330
aat cct gat gat aag aga act gca cgg ttg tcc gag ttt ggg gag atg 1056
Asn Pro Asp Asp Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met
335 340 345 350
atc agg gca gcc ttt gga ttt cct gtg gat aga cag aac atc cca agg 1104
Ile Arg Ala Ala Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg
355 360 365
aca gtc aca ggc cct aat gtc ctc ttt gtt aga cgt gag gat tat tta 1152
Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu
370 375 380
gct cac cca cgt cat ggt gga aag gta cag tct agg ctt agc aat gaa 1200
Ala His Pro Arg His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu
385 390 395
gag caa gta ttt gat tcc ata aag agc tgg gcc ttg aac cac tcg gag 1248
Glu Gln Val Phe Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu
400 405 410
tgc aaa tta aat gta att aac gga ttg ttt gcc cac atg tcc atg aaa 1296
Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys
415 420 425 430
gag caa gtt cga gca atc caa gat gca tct gtc att gtt ggt gct cat 1344
Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His
435 440 445
gga gca ggt cta act cac ata gtt tct gca gca cca aaa gct gta ata 1392
Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile
450 455 460
cta gaa att ata agc agc gaa tat agg cac ccc cat ttt gct ctg att 1440
Leu Glu Ile Ile Ser Ser Glu Tyr Arg His Pro His Phe Ala Leu Ile
465 470 475
gca caa tgg aaa gga ttg gag tac cat ccc ata tat ttg gag ggg tct 1488
Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser
480 485 490
tat gcg gat cct cca gtt gtg atg a 1513
Tyr Ala Asp Pro Pro Val Val Met
495 500
<210> 4
<211> 502
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 4
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser
1 5 10 15
Ser His Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His Phe Pro
20 25 30
Asn Thr Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp Asn Phe
35 40 45
His Ser Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile Leu Pro
50 55 60
Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg Ser Cys
65 70 75 80
Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys
85 90 95
Thr Ser Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val Ser Gly
100 105 110
Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser
115 120 125
Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met
130 135 140
Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp
145 150 155 160
Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr
165 170 175
Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile Leu Asn
180 185 190
Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu
195 200 205
Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys Ser Glu
210 215 220
Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn
225 230 235 240
Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg
245 250 255
Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His
260 265 270
Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu
275 280 285
Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val
290 295 300
Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Thr Glu
305 310 315 320
Thr Ile Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro
325 330 335
Asp Asp Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg
340 345 350
Ala Ala Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val
355 360 365
Thr Gly Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His
370 375 380
Pro Arg His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln
385 390 395 400
Val Phe Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys
405 410 415
Leu Asn Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys Glu Gln
420 425 430
Val Arg Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala
435 440 445
Gly Leu Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu
450 455 460
Ile Ile Ser Ser Glu Tyr Arg His Pro His Phe Ala Leu Ile Ala Gln
465 470 475 480
Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala
485 490 495
Asp Pro Pro Val Val Met
500
<210> 5
<211> 1495
<212> DNA
<213> Artificial
<220>
<223> XylTc7Nt
<220>
<221> CDS
<222> (5)..(1495)
<400> 5
cacc ctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 49
Leu Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr
1 5 10 15
ttc tct tcc cac cct gat cac ttc cgc cac aaa tcc cgc caa aac cac 97
Phe Ser Ser His Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His
20 25 30
ttt tcc ttg tcg gaa aac cgc cat cat aat ttc cac tct tca atc act 145
Phe Ser Leu Ser Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr
35 40 45
tct caa tat tcc aag cct tgg cct att ttg ccc tcc tac ctc cct tgg 193
Ser Gln Tyr Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp
50 55 60
tct caa aac cct aat gtt gtt tgg aga tcg tgc gag ggt tac ttc ggt 241
Ser Gln Asn Pro Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly
65 70 75
aat ggg ttt act ctc aaa gtt gac ctt ctc aaa act tcg ccg gag ttt 289
Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe
80 85 90 95
cac cgg aaa ttc ggc gaa aac acc gtc tcc ggc gac ggc gga tgg ttt 337
His Arg Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe
100 105 110
agg tgt ttt ttc agt gag act ttg cag agt tcg atc tgc gag gga ggc 385
Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly
115 120 125
gca ata cga atg aat ccg gac gag att ttg atg tct cgt gga ggt gag 433
Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu
130 135 140
aaa ttg gag tcg gtt att ggt agg agt gaa gat gat gag ctg ccc gtg 481
Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val
145 150 155
ttc aaa aat gga gct ttt cag att aaa gtt act gat aaa ctg aaa att 529
Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile
160 165 170 175
ggg aaa aaa tta gtg gat gaa aaa ttc ttg aat aaa tac tta ccg gaa 577
Gly Lys Lys Leu Val Asp Glu Lys Phe Leu Asn Lys Tyr Leu Pro Glu
180 185 190
ggt gca att tca agg cac act atg cgt gag tta att gac tct att cag 625
Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln
195 200 205
ttg gtt ggc gcc gat gat ttt cac tgt tct gag tgg att gag gag ccg 673
Leu Val Gly Ala Asp Asp Phe His Cys Ser Glu Trp Ile Glu Glu Pro
210 215 220
tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc cac aca gtt 721
Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val
225 230 235
acc gat tgg tat agt gca tac gtg gca tcc agg gtt act ggc ttg ccc 769
Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro
240 245 250 255
agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag aca caa ttg 817
Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu
260 265 270
gag gaa aca tgg aaa gca ctt ttt tca agc ctc act tat gct aag aac 865
Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn
275 280 285
ttt agt ggc cca gtt tgt ttc cgt cat gcc gcc ctc tcg cct ttg gga 913
Phe Ser Gly Pro Val Cys Phe Arg His Ala Ala Leu Ser Pro Leu Gly
290 295 300
tat gaa act gcc ctg ttt aag gga ctg tca gaa act ata gat tgt aat 961
Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn
305 310 315
gga gct tct gcc cat gat ttg tgg caa aat cct gat gat aag aaa act 1009
Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Lys Thr
320 325 330 335
gca cgg ttg tcc gag ttt ggg gag atg att agg gca gcc ttt gga ttt 1057
Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe
340 345 350
cct gtg gat aga cag aac atc cca agg aca gtc aca ggc cct aat gtc 1105
Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val
355 360 365
ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt cat ggt gga 1153
Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly
370 375 380
aag gta cag tct agg ctt agc aat gaa gag caa gta ttt gat tcc ata 1201
Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile
385 390 395
aag agc tgg gcc ttg aac cac tcg gag tgc aaa tta aat gta att aac 1249
Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn
400 405 410 415
gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga gca atc caa 1297
Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln
420 425 430
gat gct tct gtc ata gtt ggt gct cat gga gca ggt cta act cac ata 1345
Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile
435 440 445
gtt tct gca gca cca aaa gct gta ata cta gaa att ata agc agc gaa 1393
Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu
450 455 460
tat agg cgc ccc cat ttt gct ctg att gca caa tgg aaa gga ttg gag 1441
Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu
465 470 475
tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct cca gtt gtg 1489
Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val
480 485 490 495
atc gaa 1495
Ile Glu
<210> 6
<211> 497
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 6
Leu Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe
1 5 10 15
Ser Ser His Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His Phe
20 25 30
Ser Leu Ser Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr Ser
35 40 45
Gln Tyr Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser
50 55 60
Gln Asn Pro Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn
65 70 75 80
Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His
85 90 95
Arg Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg
100 105 110
Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala
115 120 125
Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys
130 135 140
Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val Phe
145 150 155 160
Lys Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile Gly
165 170 175
Lys Lys Leu Val Asp Glu Lys Phe Leu Asn Lys Tyr Leu Pro Glu Gly
180 185 190
Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu
195 200 205
Val Gly Ala Asp Asp Phe His Cys Ser Glu Trp Ile Glu Glu Pro Ser
210 215 220
Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr
225 230 235 240
Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro Ser
245 250 255
Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu
260 265 270
Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe
275 280 285
Ser Gly Pro Val Cys Phe Arg His Ala Ala Leu Ser Pro Leu Gly Tyr
290 295 300
Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn Gly
305 310 315 320
Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Lys Thr Ala
325 330 335
Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro
340 345 350
Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu
355 360 365
Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys
370 375 380
Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys
385 390 395 400
Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly
405 410 415
Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp
420 425 430
Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val
435 440 445
Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr
450 455 460
Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr
465 470 475 480
His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val Ile
485 490 495
Glu
<210> 7
<211> 3408
<212> DNA
<213> Artificial
<220>
<223> XylTg1Nt
<220>
<221> CDS
<222> (7)..(678)
<220>
<221> Intron
<222> (679)..(1974)
<220>
<221> CDS
<222> (1975)..(2124)
<220>
<221> Intron
<222> (2125)..(2722)
<220>
<221> CDS
<222> (2723)..(3406)
<400> 7
cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr
1 5 10
ttc tct tcc cac tct gat cac ttc cgt cac aaa tcc ccc caa aac cac 96
Phe Ser Ser His Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His
15 20 25 30
ttt cct aat acc caa aac cac tat tcc ctg tcg gaa aac cac cat gat 144
Phe Pro Asn Thr Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp
35 40 45
aat ttc cac tct tct gtc act tcc caa tat acc aag cct tgg cca att 192
Asn Phe His Ser Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile
50 55 60
ttg ccc tcc tac ctc ccc tgg tct cag aat cct aat gtt tct ttg aga 240
Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg
65 70 75
tcg tgc gag ggt tac ttc ggt aat ggg ttt act ctc aaa gtt gat ctt 288
Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu
80 85 90
ctc aaa act tcg ccg gag ctt cac cag aaa ttc ggc gaa aac acc gta 336
Leu Lys Thr Ser Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val
95 100 105 110
tcc ggc gac ggc gga tgg ttt agg tgt ttt ttc agt gag act ttg cag 384
Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln
115 120 125
agt tcg att tgc gag gga ggt gct ata cga atg aat ccg gac gag att 432
Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile
130 135 140
ttg atg tct cgt gga ggc gag aaa ttg gag tcg gtt att ggt agg agt 480
Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser
145 150 155
gaa gat gat gag ctg ccc gtg ttc aaa aat gga gct ttt cag att aaa 528
Glu Asp Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys
160 165 170
gtt act gat aaa ctg aaa att ggg aaa aaa tta gtg gat gaa aaa atc 576
Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile
175 180 185 190
ttg aat aaa tac tta ccg gaa ggt gca att tca agg cac act atg cgt 624
Leu Asn Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg
195 200 205
gaa tta att gac tct att cag tta gtt ggc gcc gat gaa ttt cac tgt 672
Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys
210 215 220
tct gag gttagatttt gaaattttgc ttgatcttta aattaaaggt ttgaactttg 728
Ser Glu
tgaatgttgg cagatatgga atacaataat ggattttgtt tgatctgttt aatgaagatt 788
gtctagaacc tcattgttat aaatatggtt tgtttgcttc attaattaaa gagcattcct 848
taaaatctcg actagatgcc agataacacc agttagttga cttttggatt atggattttt 908
tttcatttaa tcagataaga tagtcattct taaatgtttc actaaagaat ttgtcatgat 968
ttcagtgtat atctttaagt gtatttggaa ttttggattt ggatctagta ctgaatgggt 1028
aactgcactt gtactcccca gtcatctggg gaggagcaac agattaaatt caagggttga 1088
aaagtaatac agagtcagaa attaaccaca agttggaaaa tggtaaatgt atgtggtcta 1148
agatgattac tcctataact tttgatgtct aacatggaga aagttagttg atttatgctc 1208
tttacttttc cctttattga ttttggtttt caaattctat caattccttt gtttgattgc 1268
tactcagatt gaaccttaga cggagtagca atagaaaagt gaagaaaagc cattttttct 1328
cctttcatct ctttatttct gttttacaca cagaatatgg tagcatctgt ctgaactagt 1388
taattttatt ccttaaaatt tgcataacta attcgagtaa atgccttttg aagctttagt 1448
tgtacaactg gttgttgcat tttgaggact atcgacttga tttgacagtg tctgatacat 1508
ggcttgtaag ttatgaaaac ttatatctag gaagaaatcc caaccagaga tagggagctg 1568
tcgcttggtt atgagctact ggctcaaagt tcgagtttga ccagttaatt ttagatcttc 1628
ggagtctaat caaattctga agcagtattg tgcactaata agaggaacac atcaaggatg 1688
tagcactgcc aggttatgtt accttattta ctaatgattg agaaccagct taaatgatga 1748
caaatggtct tagatttgtt ttttacattg ctcatgactt tgggatattt ctggatcaac 1808
attttccagt tctttatgta cttatcaaaa aattatccct gctagagcct agatgttagt 1868
gttcaagcaa ccatgctagc ttttaaggaa gctccttctt tgattcatgc catctttccg 1928
taatcgatgc cttacgttac tgtcattttt ctaattttca tttcag tgg att gag 1983
Trp Ile Glu
225
gag ccg tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc cac 2031
Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His
230 235 240
aca gtt acc gat tgg tat agt gca tac gtg gca tcc agg gtt act ggc 2079
Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly
245 250 255
ttg ccc agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag 2124
Leu Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu
260 265 270
gtatgtttga aagtattgat aacgatggca tgcattgtac tgtgttatgg atgaaagaaa 2184
tgaaatcagc aattattttc tagcaggcaa tgctcttgag atgcttgtgt caaattggtc 2244
agacttaatc ctgagtttcc atttgtttca gctttctgtt tgactgacta caataattgt 2304
cccaatacct agttgttccg gttggctcat tcttacttct atttacgtgt cactgtttct 2364
ctgaatggtc cctttgtggt gaaaagtgct tttgctatga agaaaaacta gcaaagattt 2424
catttctggg acaatttatt tttaccttac atcacgtctc ataaaattgc ttcctattgc 2484
atactttaat tcttggagag atgctttaat gtgaagaaag ttctttcact ccacttttaa 2544
ttcttggaga gatgctttaa tgtgaagaaa gttctttcac tccactactg taagcttgct 2604
gcatgaattt tacttggcca tattgggggc gtgttttgat ttatcttcaa attcattttc 2664
ttcatgtaat tcttttgagt aatttttttt tctgttttct gtttgggaaa aaattcag 2722
aca caa ttg gag gaa aca tgg aaa gca ctc ttt tca agc ctc act tat 2770
Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr
275 280 285 290
gct aag aac ttt agt ggc cca gtt tgt ttc cgt cac gcc gtt ctc tcg 2818
Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val Leu Ser
295 300 305
cct ttg gga tat gaa act gcc ctg ttt aag gga ctg aca gaa act ata 2866
Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Thr Glu Thr Ile
310 315 320
gat tgt aat gga gct tct gcc cat gat ttg tgg caa aat cct gat gat 2914
Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp
325 330 335
aag aga act gca cgg ttg tcc gag ttt ggg gag atg atc agg gca gcc 2962
Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala
340 345 350
ttt gga ttt cct gtg gat aga cag aac atc cca agg aca gtc aca ggc 3010
Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly
355 360 365 370
cct aat gtc ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt 3058
Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg
375 380 385
cat ggt gga aag gta cag tct agg ctt agc aat gaa gag caa gta ttt 3106
His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe
390 395 400
gat tcc ata aag agc tgg gcc ttg aac cac tcg gag tgc aaa tta aat 3154
Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn
405 410 415
gta att aac gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga 3202
Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg
420 425 430
gca atc caa gat gca tct gtc att gtc ggc gct cat gga gca ggt cta 3250
Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu
435 440 445 450
act cac ata gtt tct gca gca cca aaa gct gta ata cta gaa att ata 3298
Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile
455 460 465
agc agc gaa tat agg cgc ccc cat ttt gct ctg att gca caa tgg aaa 3346
Ser Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys
470 475 480
gga ttg gag tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct 3394
Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro
485 490 495
cca gtt gtg atc ga 3408
Pro Val Val Ile
500
<210> 8
<211> 502
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 8
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser
1 5 10 15
Ser His Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His Phe Pro
20 25 30
Asn Thr Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp Asn Phe
35 40 45
His Ser Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile Leu Pro
50 55 60
Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg Ser Cys
65 70 75 80
Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys
85 90 95
Thr Ser Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val Ser Gly
100 105 110
Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser
115 120 125
Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met
130 135 140
Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp
145 150 155 160
Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr
165 170 175
Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile Leu Asn
180 185 190
Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu
195 200 205
Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys Ser Glu
210 215 220
Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn
225 230 235 240
Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg
245 250 255
Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His
260 265 270
Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu
275 280 285
Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val
290 295 300
Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Thr Glu
305 310 315 320
Thr Ile Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro
325 330 335
Asp Asp Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg
340 345 350
Ala Ala Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val
355 360 365
Thr Gly Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His
370 375 380
Pro Arg His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln
385 390 395 400
Val Phe Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys
405 410 415
Leu Asn Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys Glu Gln
420 425 430
Val Arg Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala
435 440 445
Gly Leu Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu
450 455 460
Ile Ile Ser Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln
465 470 475 480
Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala
485 490 495
Asp Pro Pro Val Val Ile
500
<210> 9
<211> 3385
<212> DNA
<213> Artificial
<220>
<223> XylTg3Nt
<220>
<221> CDS
<222> (7)..(657)
<220>
<221> Intron
<222> (658)..(1953)
<220>
<221> CDS
<222> (1954)..(2103)
<220>
<221> Intron
<222> (2104)..(2701)
<220>
<221> CDS
<222> (2702)..(3385)
<400> 9
cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr
1 5 10
ttc tct tcc cac cct gat cac ttc cgc cac aaa tcc cgc caa aac cac 96
Phe Ser Ser His Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His
15 20 25 30
ttt tcc ttg tcg gaa aac cgc cat cat aat ttc cac tct tca atc act 144
Phe Ser Leu Ser Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr
35 40 45
tct caa tat tcc aag cct tgg cct att ttg ccc tcc tac ctc cct tgg 192
Ser Gln Tyr Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp
50 55 60
tct caa aac cct aat gtt gtt tgg aga tcg tgc gag ggt tac ttc ggt 240
Ser Gln Asn Pro Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly
65 70 75
aat ggg ttt act ctc aaa gtt gac ctt ctc aaa act tcg ccg gag ttt 288
Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe
80 85 90
cac cgg aaa ttc ggc gaa aac acc gtc tcc ggc gac ggc gga tgg ttt 336
His Arg Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe
95 100 105 110
agg tgt ttt ttc agt gag act ttg cag agt tcg atc tgc gag gga ggc 384
Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly
115 120 125
gca ata cga atg aat ccg gac gag att ttg atg tct cgt gga ggt gag 432
Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu
130 135 140
aaa ttg gag tcg gtt att ggt agg agt gaa gat gat gag ctg ccc gtg 480
Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val
145 150 155
ttc aaa aat gga gct ttt cag att aaa gtt act gat aaa ctg aaa att 528
Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile
160 165 170
ggg aaa aaa tta gtg gat gaa aaa atc ttg aat aaa tac tta ccg gaa 576
Gly Lys Lys Leu Val Asp Glu Lys Ile Leu Asn Lys Tyr Leu Pro Glu
175 180 185 190
ggt gca att tca agg cac act atg cgt gaa tta att gac tct att cag 624
Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln
195 200 205
tta gtt ggc gcc gat gaa ttt cac tgt tct gag gttagatttt gaaattttgc 677
Leu Val Gly Ala Asp Glu Phe His Cys Ser Glu
210 215
ttgatcttta aattaaaggt ttgaactttg tgaatgttgg cagatatgga atacaataat 737
ggattttgtt tgatctgttt aatgaagatt gtctagaacc tcattgttat aaatatggtt 797
tgtttgcttc attaattaaa gagcattcct taaaatctcg actagatgcc agataacacc 857
agttagttga cttttggatt atggattttt tttcatttaa tcagataaga tagtcattct 917
taaatgtttc actaaagaat ttgtcatgat ttcagtgtat atctttaagt gtatttggaa 977
ttttggattt ggatctagta ctgaatgggt aactgcactt gtactcccca gtcatctggg 1037
gaggagcaac agattaaatt caagggttga aaagtaatac agagtcagaa attaaccaca 1097
agttggaaaa tggtaaatgt atgtggtcta agatgattac tcctataact tttgatgtct 1157
aacatggaga aagttagttg atttatgctc tttacttttc cctttattga ttttggtttt 1217
caaattctat caattccttt gtttgattgc tactcagatt gaaccttaga cggagtagca 1277
atagaaaagt gaagaaaagc cattttttct cctttcatct ctttatttct gttttacaca 1337
cagaatatgg tagcatctgt ctgaactagt taattttatt ccttaaaatt tgcataacta 1397
attcgagtaa atgccttttg aagctttagt tgtacaactg gttgttgcat tttgaggact 1457
atcgacttga tttgacagtg tctgatacat ggcttgtaag ttatgaaaac ttatatctag 1517
gaagaaatcc caaccagaga tagggagctg tcgcttggtt atgagctact ggctcaaagt 1577
tcgagtttga ccagttaatt ttagatcttc ggagtctaat caaattctga agcagtattg 1637
tgcactaata agaggaacac atcaaggatg tagcactgcc aggttatgtt accttattta 1697
ctaatgattg agaaccagct taaatgatga caaatggtct tagatttgtt ttttacattg 1757
ctcatgactt tgggatattt ctggatcaac attttccagt tctttatgta cttatcaaaa 1817
aattatccct gctagagcct agatgttagt gttcaagcaa ccatgctagc ttttaaggaa 1877
gctccttctt tgattcatgc catctttccg taatcgatgc cttacgttac tgtcattttt 1937
ctaattttca tttcag tgg att gag gag ccg tca ctt ttg att aca cga ttt 1989
Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe
220 225
gag tat gca aac ctt ttc cac aca gtt acc gat tgg tat agt gca tac 2037
Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr
230 235 240 245
gtg gca tcc agg gtt act ggc ttg ccc agt cgg cca cat ttg gtt ttt 2085
Val Ala Ser Arg Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe
250 255 260
gta gat ggc cat tgt gag gtatgtttga aagtattgat aacgatggca 2133
Val Asp Gly His Cys Glu
265
tgcattgtac tgtgttatgg atgaaagaaa tgaaatcagc aattattttc tagcaggcaa 2193
tgctcttgag atgcttgtgt caaattggtc agacttaatc ctgagtttcc atttgtttca 2253
gctttctgtt tgactgacta caataattgt cccaatacct agttgttccg gttggctcat 2313
tcttacttct atttacgtgt cactgtttct ctgaatggtc cctttgtggt gaaaagtgct 2373
tttgctatga agaaaaacta gcaaagattt catttctggg acaatttatt tttaccttac 2433
atcacgtctc ataaaattgc ttcctattgc atactttaat tcttggagag atgctttaat 2493
gtgaagaaag ttctttcact ccacttttaa ttcttggaga gatgctttaa tgtgaagaaa 2553
gttctttcac tccactactg taagcttgct gcatgaattt tacttggcca tattgggggc 2613
gtgttttgat ttatcttcaa attcattttc ttcatgtaat tcttttgagt aatttttttt 2673
tctgttttct gtttgggaaa aaattcag aca caa ttg gag gaa aca tgg aaa 2725
Thr Gln Leu Glu Glu Thr Trp Lys
270 275
gca ctc ttt tca agc ctc act tat gct aag aac ttt agt ggc cca gtt 2773
Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val
280 285 290
tgt ttc cgt cac gcc gtt ctc tcg cct ttg gga tat gaa act gcc ctg 2821
Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu
295 300 305
ttt aag gga ctg aca gaa act ata gat tgt aat gga gct tct gcc cat 2869
Phe Lys Gly Leu Thr Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala His
310 315 320
gat ttg tgg caa aat cct gat gat aag aga act gca cgg ttg tcc gag 2917
Asp Leu Trp Gln Asn Pro Asp Asp Lys Arg Thr Ala Arg Leu Ser Glu
325 330 335
ttt ggg gag atg atc agg gca gcc ttt gga ttt cct gtg gat aga cag 2965
Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val Asp Arg Gln
340 345 350 355
aac atc cca agg aca gtc aca ggc cct aat gtc ctc ttt gtt aga cgt 3013
Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg Arg
360 365 370
gag gat tat tta gct cac cca cgt cat ggt gga aag gta cag tct agg 3061
Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val Gln Ser Arg
375 380 385
ctt agc aat gaa gag caa gta ttt gat tcc ata aag agc tgg gcc ttg 3109
Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys Ser Trp Ala Leu
390 395 400
aac cac tcg gag tgc aaa tta aat gta att aac gga ttg ttt gcc cac 3157
Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala His
405 410 415
atg tcc atg aaa gag caa gtt cga gca atc caa gat gca tct gtc att 3205
Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val Ile
420 425 430 435
gtt ggt gct cat gga gca ggt cta act cac ata gtt tct gca gca cca 3253
Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala Pro
440 445 450
aaa gct gta ata cta gaa att ata agc agc gaa tat agg cgc ccc cat 3301
Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg Arg Pro His
455 460 465
ttt gct ctg att gca caa tgg aaa gga ttg gag tac cat ccc ata tat 3349
Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr
470 475 480
ttg gag ggg tct tat gcg gat cct cca gtt gtg atc 3385
Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val Ile
485 490 495
<210> 10
<211> 495
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 10
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser
1 5 10 15
Ser His Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His Phe Ser
20 25 30
Leu Ser Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr Ser Gln
35 40 45
Tyr Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln
50 55 60
Asn Pro Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly
65 70 75 80
Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His Arg
85 90 95
Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys
100 105 110
Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile
115 120 125
Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys Leu
130 135 140
Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val Phe Lys
145 150 155 160
Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile Gly Lys
165 170 175
Lys Leu Val Asp Glu Lys Ile Leu Asn Lys Tyr Leu Pro Glu Gly Ala
180 185 190
Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val
195 200 205
Gly Ala Asp Glu Phe His Cys Ser Glu Trp Ile Glu Glu Pro Ser Leu
210 215 220
Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp
225 230 235 240
Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro Ser Arg
245 250 255
Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu Glu
260 265 270
Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser
275 280 285
Gly Pro Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu
290 295 300
Thr Ala Leu Phe Lys Gly Leu Thr Glu Thr Ile Asp Cys Asn Gly Ala
305 310 315 320
Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Arg Thr Ala Arg
325 330 335
Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val
340 345 350
Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe
355 360 365
Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val
370 375 380
Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys Ser
385 390 395 400
Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu
405 410 415
Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala
420 425 430
Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser
435 440 445
Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg
450 455 460
Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His
465 470 475 480
Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val Ile
485 490 495
<210> 11
<211> 3298
<212> DNA
<213> Artificial
<220>
<223> XylTg14Nb
<220>
<221> CDS
<222> (7)..(657)
<220>
<221> Intron
<222> (658)..(1917)
<220>
<221> CDS
<222> (1918)..(2067)
<220>
<221> Intron
<222> (2068)..(2612)
<220>
<221> CDS
<222> (2613)..(3290)
<400> 11
cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr
1 5 10
ttc tct tcc cac cct gat cac tct cgt cgc aaa tcc ccc cag aac cac 96
Phe Ser Ser His Pro Asp His Ser Arg Arg Lys Ser Pro Gln Asn His
15 20 25 30
ttt tcc tcg tcg gaa aac cac cat cat aat ttc cac tct tca atc act 144
Phe Ser Ser Ser Glu Asn His His His Asn Phe His Ser Ser Ile Thr
35 40 45
tcc caa tat tcc agg cct tgg cct att ttg ccc tcc tac ctc cct tgg 192
Ser Gln Tyr Ser Arg Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp
50 55 60
tct caa aac cct aat gtt gct tgg aga tca tgc gag ggt tac ttc ggt 240
Ser Gln Asn Pro Asn Val Ala Trp Arg Ser Cys Glu Gly Tyr Phe Gly
65 70 75
aat ggt ttt act ctc aaa gtt gat ctt ctc aaa act tcg ccg gag ctt 288
Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Leu
80 85 90
cac cgg aaa ttc ggc gaa aac acc gtc ttc gga gac ggc gga tgg ttt 336
His Arg Lys Phe Gly Glu Asn Thr Val Phe Gly Asp Gly Gly Trp Phe
95 100 105 110
agg tgt ttc ttc agt gag act ttg cag agt tcg atc tgc gag gga ggc 384
Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly
115 120 125
gca ata cga atg aat cca gac gag att ttg atg tct cgt gga ggt gag 432
Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu
130 135 140
aaa ttg gag tcg gtt att ggt agg agt gaa gat gat gag gtg ccc gcg 480
Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Val Pro Ala
145 150 155
ttc aaa act gga gct ttt cag att aaa gtt act gat aaa ctg aaa ttt 528
Phe Lys Thr Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Phe
160 165 170
ggg aaa aaa tta gtg gat gaa aac ttc ttg aat aaa tac tta ccg gaa 576
Gly Lys Lys Leu Val Asp Glu Asn Phe Leu Asn Lys Tyr Leu Pro Glu
175 180 185 190
ggt gca att tca agg cac act atg cgt gag tta atc gac tct att cag 624
Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln
195 200 205
ttg gtt ggc gcc aat gat ttt cac tgt tct gag gttagatttt tgaaattttg 677
Leu Val Gly Ala Asn Asp Phe His Cys Ser Glu
210 215
tttgctcttt aaattaaagg tttgaacttt gtgaatgttg gcagatatag aatacaataa 737
tggaatttgc ttgatctgtt taatgaagat tgtctggaac ctcaatgcta taaatatttg 797
tttgtttgct tcattaatta aagagaatat cccaactaga tgccagataa caccagttag 857
ttgacttttg gatcggattg catttcattt aatcagatat ggtactcatt cttaaatgtt 917
tcactaaagt atttgtcaag atttcagagt ttatatgtag gtgtatttgg aattctggat 977
ttggatctag tattgaatgg attactgaac ttgtactccc cagtcatctg gggaggagca 1037
acagattaac ttcaagggtt gaaaagtaat actgagtcag aagttaacca cttcaacttg 1097
gaaaattgta aatgtgtgtg gtctaagatg attactctaa cttttgaggt ctaacatgga 1157
gaaagttagt tgatttatgc tctttacttt tccctttatt gattttggct tttaaattct 1217
atcaattcca ttgtttgatt gctactcaaa ttgaacctta gacggagtag caatagcaaa 1277
aagtgaagaa aggccatttt ttttctcctt tcatctctta atttccgttt tacacacaga 1337
atatggtaga atctgtttga agctttagtt gaatagttat acaactggtt attgcatttt 1397
gaggactatc gacttgattt gacactggac agtgtctgat acatggcttg taagttatga 1457
gaacttctat ctaggaagaa atcccaacca gagataggga gctgtcactt ggctatgagt 1517
tactggctca aagttcgagt ttgaccagtt aattttagat cctcaccagg ataacattta 1577
gagtctaatc aaattctgaa gcagtattgt gcactaataa gaggaacaca tgaaggatgt 1637
agcactacta ggttatgtta ccttatttac taataatgac tgacaaccag cttaattgat 1697
gacaaatggt cttatatttg ccttttacat tgctcatgac ttgggatatt tctgaatcag 1757
catttttcag ttctttatgt acttatcaaa aaattatccc tgctagatgt tagtgttcaa 1817
gcaaccatgc tagcatttaa cgaagctcct tctttgattc atgcgatctt tccgtaatct 1877
atgccttacg ttactgtcat ttttctaatt ttcatttcag tgg att gag gag ccg 1932
Trp Ile Glu Glu Pro
220
tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc cac aca att 1980
Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Ile
225 230 235
acc gat tgg tat agt gca tac gtg gca tcg agg gtt act ggc ttg ccc 2028
Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro
240 245 250
agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag gtatgtctga 2077
Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu
255 260 265
aagtattgat aacgatggca tgcattgtac tgtcttatgg atgaaagaaa tgaaaccagc 2137
aattattttc tagcaggcaa tgctcttgag atgcttgtgt caaattggtc agacttaatc 2197
ctgagtttcc atttgtttca gctttctgtg tgactgacta caataattgt cccgatacct 2257
aattgttgca gttggctcat tcttatttct atttacgtgt cactgtttct ctgaatggcc 2317
ctttgtggtg aaaagagctt ttgatatgta aaaaaactag caaagatttc atttctggaa 2377
caatttcttt ttaccttaca tcacgtgtca taaaattgct tctaactgta tactttaatt 2437
cttggagaga tgctttcatg tgaagaaagt tctttcactc cactactgga agcttgctgc 2497
atgaatttta cttggccata ttggggccgt gttttgattt atcttcaaat tcattttctt 2557
catgtagttc tttcgagtaa ttttttttcc tcttttctgt ttgaaaaaat ttcag aca 2615
Thr
caa ttg gag gaa aca tgg aaa gca ctt ttt tca agc ctc act tat gct 2663
Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala
270 275 280
aag aac ttt agt ggc cca gtt tgt ttc cgt cat gcc gtc ctc tcg cct 2711
Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val Leu Ser Pro
285 290 295 300
ttg gga tat gaa act gcc ctg ttt aag gga ctg tca gaa act ata gat 2759
Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp
305 310 315
tgt aat gga gct tct gct cat gat ttg tgg caa aat cct gat gat aag 2807
Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys
320 325 330
aaa act gca cgg tta tcc gag ttt ggg gag atg atc agg gca gcc ttt 2855
Lys Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe
335 340 345
gga ttt cct gtt gat aga cag aac atc cca agg aca gtc aca ggc cct 2903
Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro
350 355 360
aat gtc ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt cat 2951
Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His
365 370 375 380
ggt gga aag gta cag tct agg ctt agc aat gaa gag caa gta ttt gat 2999
Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp
385 390 395
tcc ata aag agc tgg gcc tta aac cac tcg gag tgc aaa tta aat gta 3047
Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val
400 405 410
att agt gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga gca 3095
Ile Ser Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala
415 420 425
atc caa gat gct tct gtc att gtt ggt gct cat gga gca ggt cta acc 3143
Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr
430 435 440
cac ata gtt tct gca gca cca aaa gct gta ata cta gaa att ata agc 3191
His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser
445 450 455 460
agc gaa tat agg cgc ccc cat ttt gct ctg att gct caa tgg aaa gga 3239
Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly
465 470 475
ttg gag tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct cca 3287
Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro
480 485 490
gtt gtgatcga 3298
Val
<210> 12
<211> 493
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 12
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser
1 5 10 15
Ser His Pro Asp His Ser Arg Arg Lys Ser Pro Gln Asn His Phe Ser
20 25 30
Ser Ser Glu Asn His His His Asn Phe His Ser Ser Ile Thr Ser Gln
35 40 45
Tyr Ser Arg Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln
50 55 60
Asn Pro Asn Val Ala Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly
65 70 75 80
Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Leu His Arg
85 90 95
Lys Phe Gly Glu Asn Thr Val Phe Gly Asp Gly Gly Trp Phe Arg Cys
100 105 110
Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile
115 120 125
Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys Leu
130 135 140
Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Val Pro Ala Phe Lys
145 150 155 160
Thr Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Phe Gly Lys
165 170 175
Lys Leu Val Asp Glu Asn Phe Leu Asn Lys Tyr Leu Pro Glu Gly Ala
180 185 190
Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val
195 200 205
Gly Ala Asn Asp Phe His Cys Ser Glu Trp Ile Glu Glu Pro Ser Leu
210 215 220
Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Ile Thr Asp
225 230 235 240
Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro Ser Arg
245 250 255
Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu Glu
260 265 270
Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser
275 280 285
Gly Pro Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu
290 295 300
Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn Gly Ala
305 310 315 320
Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Lys Thr Ala Arg
325 330 335
Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val
340 345 350
Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe
355 360 365
Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val
370 375 380
Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys Ser
385 390 395 400
Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Ser Gly Leu
405 410 415
Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala
420 425 430
Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser
435 440 445
Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg
450 455 460
Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His
465 470 475 480
Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val
485 490
<210> 13
<211> 3574
<212> DNA
<213> Artificial
<220>
<223> XylTg19Nb
<220>
<221> CDS
<222> (7)..(648)
<220>
<221> Intron
<222> (649)..(2194)
<220>
<221> CDS
<222> (2195)..(2344)
<220>
<221> Intron
<222> (2345)..(2888)
<220>
<221> CDS
<222> (2889)..(3566)
<400> 13
cacctt gtt tct ctc ttc gct ctc aac tca atc act ctc tat ctc tac 48
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr
1 5 10
ttc tct tcc cac cct gat cac aaa tcc ccc caa aac cac ttt tcc ttg 96
Phe Ser Ser His Pro Asp His Lys Ser Pro Gln Asn His Phe Ser Leu
15 20 25 30
tcg gaa aac cac cat cat aat ttc cac tct tca atc act tct caa tat 144
Ser Glu Asn His His His Asn Phe His Ser Ser Ile Thr Ser Gln Tyr
35 40 45
tcc aag cct tgg cct att ttg ccc tcc tac ctc cct tgg tct caa aac 192
Ser Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn
50 55 60
cct aat gtt gct tgg aga tcg tgc gag ggt tac ttc ggt aat ggg ttt 240
Pro Asn Val Ala Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe
65 70 75
act ctc aaa gtt gac ctt ctc aaa act tcg ccg gag ttt cac cgg aaa 288
Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His Arg Lys
80 85 90
ttc ggc gat aac acc gtc tcc ggt gac ggc gga tgg ttt agg tgt ttt 336
Phe Gly Asp Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe
95 100 105 110
ttc agt gag act ttg cag agt tcg atc tgc gag gga ggc gca ata cga 384
Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg
115 120 125
atg aat ccg gac gat att ttg atg tct cgt gga ggt gag aaa ttg gag 432
Met Asn Pro Asp Asp Ile Leu Met Ser Arg Gly Gly Glu Lys Leu Glu
130 135 140
tcg gtt att ggt agg aat gaa gat gat gag ctg ccc atg ttc aaa aat 480
Ser Val Ile Gly Arg Asn Glu Asp Asp Glu Leu Pro Met Phe Lys Asn
145 150 155
gga gct ttc caa att gaa gtt act gat aaa ctg aaa att ggg aaa aaa 528
Gly Ala Phe Gln Ile Glu Val Thr Asp Lys Leu Lys Ile Gly Lys Lys
160 165 170
cta gtg gat aaa aaa ttc ttg aat aaa tac tta ccg gga ggt gcg att 576
Leu Val Asp Lys Lys Phe Leu Asn Lys Tyr Leu Pro Gly Gly Ala Ile
175 180 185 190
tca agg cac act atg cgt gag tta att gac tct att cag ttg gtt ggc 624
Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val Gly
195 200 205
gcc gat gaa ttt cac tgt tct gag gttagatttt gatatttatt tgatctttaa 678
Ala Asp Glu Phe His Cys Ser Glu
210
attagaggtt tgaactttgt taatgttggc agatatggaa tacaataatg gattttgttt 738
gatctgttta atgaagattg tctaaaacct caatgctata aatatttgtt tgtttgcttc 798
attaattaaa gagaatatcc cgactagatg ccagataaca ccagttagtt gacttttgga 858
ttgggttgca tttcatttaa tcagatatgg tactcattct taaatgtttc actaaagaat 918
ttgtcaagat ttcagagttt atatataggt gtatttggaa ttctggattt ggatctagta 978
ttgaatggat tactgaattt gtactcccca gtcatcaggg gaggagcaat agatcgaatt 1038
caagggttga aaagtaatac tgagtcagaa attaaccact ttaacttgga aacggtaaat 1098
gtatgtgttc taagatgatt attcctataa cttttgatgt ctaatatgga gaaagtgagt 1158
tgatttatgc tttttccttt tccctttatt gatgttggtt tttaaattct atcaattcct 1218
ttgtttggtt gctactcaaa ttgaacctta gacggagtag caatagcaaa aagtgaagaa 1278
aggacatttt tttctccttt catctcttta tttccgtttg acatacagaa tacggtagca 1338
tctgcctgaa gtggttaatt tcattcctta aaatttgcat aactaatatt tccgtttttg 1398
tttttgttta tcttttccat tggcatgcca tgttattttt ggtttaggtt tacataatta 1458
tttatgtgat ttctgatgga gttactaatg attttttgtt tttgtttttg tttttttctt 1518
ttccttttcc tgagtcgagg gtcgattgga aatagcctct ctgccctttt ggataggggt 1578
aaggcctggg tacgtgtacc atccccagac cccactctgt gggactatac cgggtagttg 1638
ttgttgttgt aattcgagta aatgcctttt gaacctttag ttgaatagtt gtacaactgg 1698
ttgttgcatt ttgaggacta tcgacttgat ttgacacttt acatgaaaac ttttatctag 1758
gaagaaatcc ctaccagaga tagggagctg tcgcttggtt atgagctact ggcttaaagt 1818
ttgagtttga cctattaatt ttagatcttc accaggataa catctagagt ttaattaaat 1878
tctcaagcag tattttgcac taataagggg aacacatgaa ggatgtagca ctactacgtt 1938
atgttcttta tttactattg attgacaacc agcttaaatg atgacaaatg gtcttatatt 1998
tgctttttta cattgctcat gacttgggat atttttgaat caacattttt cggttcttta 2058
tgtacttatc aaaaaattat ccctgctaga tgttagtgtt caagcaacat gctagctttt 2118
aaggaagctc cttctttgat tcatgccatc tttccgaagc cttacgtttc tgtcattttt 2178
ctaattttca tttcag tgg gtt gag gag ccg tca ctt ttg att aca cga ttt 2230
Trp Val Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe
215 220 225
gag tat gca aac ctt ttc cac aca gtt acc gat tgg tat agt gca tac 2278
Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr
230 235 240
gcg gca tcc agg gtt act ggt ttg ccc agt cgg cca aat ttg gtt ttt 2326
Ala Ala Ser Arg Val Thr Gly Leu Pro Ser Arg Pro Asn Leu Val Phe
245 250 255
gta gat ggc cat tgt gag gtatgtttga cagtattgat aacgatggca 2374
Val Asp Gly His Cys Glu
260
tgcattgtac tgtgttatgg atgaaagaaa tgaaaccatc aattattttc tagtaggcaa 2434
tgctcttaag atgcttgtgt caaattggtt agagttaatc ctaagtttcc atttgtttga 2494
gctttctgtt tgactgacta caatacttgt cccaatacct agttgttgcg gttggctcat 2554
tcttacttct atttacgtgt cactgtttct ctgaatggtc cctttgtggt gaaaagagct 2614
tttgctatgt agaaaaacta gcaaagattt catttctgga gcaacttatt tttaccttac 2674
atcacgtctc ataaaattgc ttctaactgt atactttaat tcttggagag atgctttcat 2734
gtgaataaag ttctttcact ccactactgg aagcttgctg catgaaattt acttggccat 2794
actggggccg tgttttgatt tgtcttcaaa ttcattttct tcatgtagtt ctttcgagta 2854
atattttttc ctcttctgtt tgaaaaaaat tcag aca caa ttg gag gaa aca tgg 2909
Thr Gln Leu Glu Glu Thr Trp
265 270
aaa gca ctt ttt tca agc ctc act tat gct aag aac ttt agt ggc cca 2957
Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro
275 280 285
gtt tgt ttc cgt cat gct gtc ctc tcg cct tta gga tat gaa act gcc 3005
Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala
290 295 300
ctg ttt aag gga ctg tca gaa act ata gat tgt aat gga gct tct gct 3053
Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala
305 310 315
cat gat ttg tgg caa aag cct gat gat aaa aaa act gca cgg ttg tcc 3101
His Asp Leu Trp Gln Lys Pro Asp Asp Lys Lys Thr Ala Arg Leu Ser
320 325 330 335
gag ttt ggg gag atg atc agg gca gcc ttt gga ttt cct gtg gat aga 3149
Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val Asp Arg
340 345 350
cag aac atc cca agg aca gtc aca ggc cct aat gtc ctc ttt gtt aga 3197
Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg
355 360 365
cgt gag gat tat tta gct cac cca cgt cat ggt gga aag gta cag tct 3245
Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val Gln Ser
370 375 380
agg ctt agc aat gaa gag cta gta ttt gat tcc ata aag agc tgg gcc 3293
Arg Leu Ser Asn Glu Glu Leu Val Phe Asp Ser Ile Lys Ser Trp Ala
385 390 395
ttg aac cac tcg gag tgt aaa tta aat gta att aac gga ttg ttt gcc 3341
Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala
400 405 410 415
cac atg tcc atg aaa gag caa gtt cga gca atc caa gat gct tct gtc 3389
His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val
420 425 430
att gtt ggt gct cat gga gca ggt cta act cac ata gtt tct gca gca 3437
Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala
435 440 445
cca aaa gct gta ata cta gaa att ata agc agc gaa tat agg cgc ccc 3485
Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg Arg Pro
450 455 460
cat ttt gct ctg att gca caa tgg aaa gga ttg gag tac cat ccc ata 3533
His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile
465 470 475
tat ttg gag ggg tct tat gcg gat cct cca gtt gtgatcga 3574
Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val
480 485 490
<210> 14
<211> 490
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 14
Val Ser Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser
1 5 10 15
Ser His Pro Asp His Lys Ser Pro Gln Asn His Phe Ser Leu Ser Glu
20 25 30
Asn His His His Asn Phe His Ser Ser Ile Thr Ser Gln Tyr Ser Lys
35 40 45
Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn
50 55 60
Val Ala Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu
65 70 75 80
Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His Arg Lys Phe Gly
85 90 95
Asp Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser
100 105 110
Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met Asn
115 120 125
Pro Asp Asp Ile Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser Val
130 135 140
Ile Gly Arg Asn Glu Asp Asp Glu Leu Pro Met Phe Lys Asn Gly Ala
145 150 155 160
Phe Gln Ile Glu Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu Val
165 170 175
Asp Lys Lys Phe Leu Asn Lys Tyr Leu Pro Gly Gly Ala Ile Ser Arg
180 185 190
His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala Asp
195 200 205
Glu Phe His Cys Ser Glu Trp Val Glu Glu Pro Ser Leu Leu Ile Thr
210 215 220
Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser
225 230 235 240
Ala Tyr Ala Ala Ser Arg Val Thr Gly Leu Pro Ser Arg Pro Asn Leu
245 250 255
Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys
260 265 270
Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val
275 280 285
Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu
290 295 300
Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala His
305 310 315 320
Asp Leu Trp Gln Lys Pro Asp Asp Lys Lys Thr Ala Arg Leu Ser Glu
325 330 335
Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val Asp Arg Gln
340 345 350
Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg Arg
355 360 365
Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val Gln Ser Arg
370 375 380
Leu Ser Asn Glu Glu Leu Val Phe Asp Ser Ile Lys Ser Trp Ala Leu
385 390 395 400
Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala His
405 410 415
Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val Ile
420 425 430
Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala Pro
435 440 445
Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg Arg Pro His
450 455 460
Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr
465 470 475 480
Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val
485 490
<210> 15
<211> 27
<212> DNA
<213> Artificial
<220>
<223> oligonucleotide XylF8
<400> 15
cacctctcgc ctttgggata tgaaact 27
<210> 16
<211> 24
<212> DNA
<213> Artificial
<220>
<223> oligonucleotide XylR8
<400> 16
acagcttttg gtgctgcaga aact 24
<210> 17
<211> 473
<212> DNA
<213> Artificial
<220>
<223> XylTi4Nt
<400> 17
cacctctcgc ctttgggata tgaaactgcc ctgtttaagg gactgacaga aactatagat 60
tgtaatggag cttctgccca tgatttgtgg caaaatcctg atgataagag aactgcacgg 120
ttgtccgagt ttggggagat gatcagggca gcctttggat ttcctgtgga tagacagaac 180
atcccaagga cagtcacagg ccctaatgtc ctctttgtta gacgtgagga ttatttagct 240
cacccacgtc atggtggaaa ggtacagtct aggcttagca atgaagagca agtatttgat 300
tccataaaga gctgggcctt gaaccactcg gagtgcaaat taaatgtaat taacggattg 360
tttgcccaca tgtccatgaa agagcaagtt cgagcaatcc aagatgcatc tgtcattgtt 420
ggtgctcatg gagcaggtct aactcacata gtttctgcag caccaaaagc tgt 473
<210> 18
<211> 7954
<212> DNA
<213> Artificial
<220>
<223> T-DNA of pTKW20
<220>
<221> misc_feature
<222> (1)..(619)
<223> right border
<220>
<221> misc_feature
<222> (969)..(2314)
<223> sequence including the promoter region of the Cauliflower Mosaic
Virus 35S transcript (Odell et al., 1985)
<220>
<221> misc_feature
<222> (2365)..(2834)
<223> sequence including a part of the Nicotiana tabacum cv. Petite
Havana SR1 XylT cDNA sequence cloned in sense orientation
<220>
<221> misc_feature
<222> (2893)..(3088)
<223> sequence including the intron of the catase-1 gene from castor
bean
<220>
<221> misc_feature
<222> (3130)..(3871)
<223> sequence containing the second intron of the pyruvate
orthophosphate dikinase gene from Flaveria trinervia as described
by Rosche and Westhoff (1995) in reverse orientation
<220>
<221> misc_feature
<222> (3957)..(4426)
<223> sequence including a part of the Nicotiana tabacum cv. Petite
Havana SR1 XylT cDNA sequence cloned in antisense orientation
<220>
<221> misc_feature
<222> (4479)..(5244)
<223> sequence including the 3?untranslated region of the octopine
synthase gene of Agrobacterium tumefaciens as described by De
Greve et al. (1982)
<220>
<221> misc_feature
<222> (5512)..(5744)
<223> sequence including the promoter region of the nopaline synthase
gene of Agrobacterium tumefaciens T-DNA
<220>
<221> misc_feature
<222> (5745)..(6690)
<223> sequence including the nptII antibiotic resistance gene
<220>
<221> misc_feature
<222> (6691)..(7396)
<223> sequence including the 3?untranslated region of the nopaline
synthase gene of A. tumefaciens T-DNA
<220>
<221> misc_feature
<222> (7397)..(7954)
<223> left border
<400> 18
tcgacatctt gctgcgttcg gatattttcg tggagttccc gccacagacc cggattgaag 60
gcgagatcca gcaactcgcg ccagatcatc ctgtgacgga actttggcgc gtgatgactg 120
gccaggacgt cggccgaaag agcgacaagc agatcacgat tttcgacagc gtcggatttg 180
cgatcgagga tttttcggcg ctgcgctacg tccgcgaccg cgttgaggga tcaagccaca 240
gcagcccact cgaccttcta gccgacccag acgagccaag ggatcttttt ggaatgctgc 300
tccgtcgtca ggctttccga cgtttgggtg gttgaacaga agtcattatc gtacggaatg 360
ccagcactcc cgaggggaac cctgtggttg gcatgcacat acaaatggac gaacggataa 420
accttttcac gcccttttaa atatccgtta ttctaataaa cgctcttttc tcttaggttt 480
acccgccaat atatcctgtc aaacactgat agtttaaact gaaggcggga aacgacaatc 540
tgatcatgag cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa 600
gccgttttac gtttggaact gacagaaccg caacgattga aggagccact cagccccaat 660
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt 720
tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta 780
ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg 840
ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat ttaggtgaca 900
ctatagaata ctcaagctat gcatccaacg cgttgggagc tctcccatat cgacctgcag 960
gcggccgctc gacgaattaa ttccaatccc acaaaaatct gagcttaaca gcacagttgc 1020
tcctctcaga gcagaatcgg gtattcaaca ccctcatatc aactactacg ttgtgtataa 1080
cggtccacat gccggtatat acgatgactg gggttgtaca aaggcggcaa caaacggcgt 1140
tcccggagtt gcacacaaga aatttgccac tattacagag gcaagagcag cagctgacgc 1200
gtacacaaca agtcagcaaa cagacaggtt gaacttcatc cccaaaggag aagctcaact 1260
caagcccaag agctttgcta aggccctaac aagcccacca aagcaaaaag cccactggct 1320
cacgctagga accaaaaggc ccagcagtga tccagcccca aaagagatct cctttgcccc 1380
ggagattaca atggacgatt tcctctatct ttacgatcta ggaaggaagt tcgaaggtga 1440
aggtgacgac actatgttca ccactgataa tgagaaggtt agcctcttca atttcagaaa 1500
gaatgctgac ccacagatgg ttagagaggc ctacgcagca ggtctcatca agacgatcta 1560
cccgagtaac aatctccagg agatcaaata ccttcccaag aaggttaaag atgcagtcaa 1620
aagattcagg actaattgca tcaagaacac agagaaagac atatttctca agatcagaag 1680
tactattcca gtatggacga ttcaaggctt gcttcataaa ccaaggcaag taatagagat 1740
tggagtctct aaaaaggtag ttcctactga atctaaggcc atgcatggag tctaagattc 1800
aaatcgagga tctaacagaa ctcgccgtga agactggcga acagttcata cagagtcttt 1860
tacgactcaa tgacaagaag aaaatcttcg tcaacatggt ggagcacgac actctggtct 1920
actccaaaaa tgtcaaagat acagtctcag aagaccaaag ggctattgag acttttcaac 1980
aaaggataat ttcgggaaac ctcctcggat tccattgccc agctatctgt cacttcatcg 2040
aaaggacagt agaaaaggaa ggtggctcct acaaatgcca tcattgcgat aaaggaaagg 2100
ctatcattca agatctctct gccgacagtg gtcccaaaga tggaccccca cccacgagga 2160
gcatcgtgga aaaagaagac gttccaacca cgtcttcaaa gcaagtggat tgatgtgaca 2220
tctccactga cgtaagggat gacgcacaat cccactatcc ttcgcaagac ccttcctcta 2280
tataaggaag ttcatttcat ttggagagga cacgctcgag acaagtttgt acaaaaaagc 2340
aggctccgcg gccgccccct tcacctctcg cctttgggat atgaaactgc cctgtttaag 2400
ggactgacag aaactataga ttgtaatgga gcttctgccc atgatttgtg gcaaaatcct 2460
gatgataaga gaactgcacg gttgtccgag tttggggaga tgatcagggc agcctttgga 2520
tttcctgtgg atagacagaa catcccaagg acagtcacag gccctaatgt cctctttgtt 2580
agacgtgagg attatttagc tcacccacgt catggtggaa aggtacagtc taggcttagc 2640
aatgaagagc aagtatttga ttccataaag agctgggcct tgaaccactc ggagtgcaaa 2700
ttaaatgtaa ttaacggatt gtttgcccac atgtccatga aagagcaagt tcgagcaatc 2760
caagatgcat ctgtcattgt tggtgctcat ggagcaggtc taactcacat agtttctgca 2820
gcaccaaaag ctgtaagggt gggcgcgccg acccagcttt cttgtacaaa gtggtctaga 2880
ggatccaagc ttgtgcaggt aaatttctag tttttctcct tcattttctt ggttaggacc 2940
cttttctctt tttatttttt tgagctttga tctttcttta aactgatcta ttttttaatt 3000
gattggttat ggcgcaaata ttacatagct ttaactgata atctgattac tttatttcgt 3060
gtgtctatga tgatgatgat aactgcagcg caagcttatc gatttcgaac ccagcttccc 3120
aactgtaatc aatccaaatg taagatcaat gataacacaa tgacatgatc tatcatgtta 3180
ccttgtttat tcatgttcga ctaattcatt taattaatag tcaatccatt tagaagttaa 3240
taaaactaca agtattattt agaaattaat aagaatgttg attgaaaata atactatata 3300
aaatgataga tcttgcgctt tgttatatta gcattagatt atgttttgtt acattagatt 3360
actgtttcta ttagtttgat attatttgtt actttagctt gttatttaat attttgttta 3420
ttgataaatt acaagcagat tggaatttct aacaaaatat ttattaactt ttaaactaaa 3480
atatttagta atggtataga tatttaatta tataataaac tattaatcat aaaaaaatat 3540
tattttaatt tatttattct tatttttact atagtatttt atcattgata tttaattcat 3600
caaaccagct agaattacta ttatgattaa aacaaatatt aatgctagta tatcatctta 3660
catgttcgat caaattcatt aaaaataata tacttactct caacttttat cttcttcgtc 3720
ttacacatca cttgtcatat ttttttacat tactatgttg tttatgtaaa caatatattt 3780
ataaattatt ttttcacaat tataacaact atattattat aatcatacta attaacatca 3840
cttaactatt ttatactaaa aggaaaaaag aaaataatta tttccttacc aagctggggt 3900
accgaattcc tcgagaccac tttgtacaag aaagctgggt cggcgcgccc acccttacag 3960
cttttggtgc tgcagaaact atgtgagtta gacctgctcc atgagcacca acaatgacag 4020
atgcatcttg gattgctcga acttgctctt tcatggacat gtgggcaaac aatccgttaa 4080
ttacatttaa tttgcactcc gagtggttca aggcccagct ctttatggaa tcaaatactt 4140
gctcttcatt gctaagccta gactgtacct ttccaccatg acgtgggtga gctaaataat 4200
cctcacgtct aacaaagagg acattagggc ctgtgactgt ccttgggatg ttctgtctat 4260
ccacaggaaa tccaaaggct gccctgatca tctccccaaa ctcggacaac cgtgcagttc 4320
tcttatcatc aggattttgc cacaaatcat gggcagaagc tccattacaa tctatagttt 4380
ctgtcagtcc cttaaacagg gcagtttcat atcccaaagg cgagaggtga agggggcggc 4440
cgcggagcct gcttttttgt acaaacttgt ctagagtcct gctttaatga gatatgcgag 4500
acgcctatga tcgcatgata tttgctttca attctgttgt gcacgttgta aaaaacctga 4560
gcatgtgtag ctcagatcct taccgccggt ttcggttcat tctaatgaat atatcacccg 4620
ttactatcgt atttttatga ataatattct ccgttcaatt tactgattgt accctactac 4680
ttatatgtac aatattaaaa tgaaaacaat atattgtgct gaataggttt atagcgacat 4740
ctatgataga gcgccacaat aacaaacaat tgcgttttat tattacaaat ccaattttaa 4800
aaaaagcggc agaaccggtc aaacctaaaa gactgattac ataaatctta ttcaaatttc 4860
aaaaggcccc aggggctagt atctacgaca caccgagcgg cgaactaata acgttcactg 4920
aagggaactc cggttccccg ccggcgcgca tgggtgagat tccttgaagt tgagtattgg 4980
ccgtccgctc taccgaaagt tacgggcacc attcaacccg gtccagcacg gcggccgggt 5040
aaccgacttg ctgccccgag aattatgcag catttttttg gtgtatgtgg gccccaaatg 5100
aagtgcaggt caaaccttga cagtgacgac aaatcgttgg gcgggtccag ggcgaatttt 5160
gcgacaacat gtcgaggctc agcaggacct gcaggcatgc aagctagctt actagtgatg 5220
catattctat agtgtcacct aaatctgcgg ccgcactagt gatatcccgc ggccatggcg 5280
gccgggagca tgcgacgtcg ggcccaattc gccctatagt gagtcgtatt acaattcact 5340
ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 5400
tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 5460
ttcccaacag ttgcgcagcc tgaatggcga atggaaattg taaacgttaa tgggtttctg 5520
gagtttaatg agctaagcac atacgtcaga aaccattatt gcgcgttcaa aagtcgccta 5580
aggtcactat cagctagcaa atatttcttg tcaaaaatgc tccactgacg ttccataaat 5640
tcccctcggt atccaattag agtctcatat tcactctcaa tccaaataat ctgcaatggc 5700
aattacctta tccgcaactt ctttacctat ttccgcccgg atccgggcag gttctccggc 5760
cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 5820
tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 5880
gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac 5940
gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 6000
attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 6060
atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 6120
cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 6180
cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 6240
gctcaaggcg cgcatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt 6300
gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 6360
tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 6420
cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 6480
catcgccttc tatcgccttc ttgacgagtt cttctgagcg ggactctggg gttcgaaatg 6540
accgaccaag cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat 6600
gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg 6660
gatctcatgc tggagttctt cgcccacccc gatccaacac ttacgtttgc aacgtccaag 6720
agcaaataga ccacgaacgc cggaaggttg ccgcagcgtg tggattgcgt ctcaattctc 6780
tcttgcagga atgcaatgat gaatatgata ctgactatga aactttgagg gaatactgcc 6840
tagcaccgtc acctcataac gtgcatcatg catgccctga caacatggaa catcgctatt 6900
tttctgaaga attatgctcg ttggaggatg tcgcggcaat tgcagctatt gccaacatcg 6960
aactacccct cacgcatgca ttcatcaata ttattcatgc ggggaaaggc aagattaatc 7020
caactggcaa atcatccagc gtgattggta acttcagttc cagcgacttg attcgttttg 7080
gtgctaccca cgttttcaat aaggacgaga tggtggagta aagaaggagt gcgtcgaagc 7140
agatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc 7200
gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg 7260
catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 7320
cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 7380
tatgttacta gatcgaatta attccaggcg gtgaagggca atcagctgtt gcccgtctca 7440
ctggtgaaaa gaaaaaccac cccagtacat taaaaacgtc cgcaatgtgt tattaagttg 7500
tctaagcgtc aatttgttta caccacaata tatcctgcca ccagccagcc aacagctccc 7560
cgaccggcag ctcggcacaa aatcaccact cgatacaggc agcccatcag tccgggacgg 7620
cgtcagcggg agagccgttg taaggcggca gactttgctc atgttaccga tgctattcgg 7680
aagaacggca actaagctgc cgggtttgaa acacggatga tctcgcggag ggtagcatgt 7740
tgattgtaac gatgacagag cgttgctgcc tgtgatcaaa tatcatctcc ctcgcagaga 7800
tccgaattat cagccttctt attcatttct cgcttaaccg tgacaggctg tcgatcttga 7860
gaactatgcc gacataatag gaaatcgctg gataaagccg ctgaggaagc tgagtggcgc 7920
tatttcttta gaagtgaacg ttgacgatgt cgac 7954
<210> 19
<211> 41
<212> DNA
<213> Artificial
<220>
<223> oligonucleotide XylF9
<400> 19
ggccggatcc tcgagacaca attggaggaa acatggaaag c 41
<210> 20
<211> 40
<212> DNA
<213> Artificial
<220>
<223> oligonucleotide XylR9
<400> 20
ggccatcgat ggtaccggcc cagctcttta tggaatcaaa 40
<210> 21
<211> 436
<212> DNA
<213> Artificial
<220>
<223> XylTiNb
<400> 21
ggccggatcc tcgagacaca attggaggaa acatggaaag cacttttttc aagcctcact 60
tatgctaaga actttagtgg cccagtttgt ttccgtcatg ccgtcctctc gcctttggga 120
tatgaaactg ccctgtttaa gggactgtca gaaactatag attgtaatgg agcttctgct 180
catgatttgt ggcaaaatcc tgatgataag aaaactgcac ggttatccga gtttggggag 240
atgatcaggg cagcctttgg atttcctgtt gatagacaga acatcccaag gacagtcaca 300
ggccctaatg tcctctttgt tagacgtgag gattatttag ctcacccacg tcatggtgga 360
aaggtacagt ctaggcttag caatgaagag caagtatttg attccataaa gagctgggcc 420
ggtaccatcg atggcc 436
<210> 22
<211> 5093
<212> DNA
<213> Artificial
<220>
<223> T-DNA of pTKW29
<220>
<221> misc_feature
<222> (1)..(25)
<223> right border repeat from the T-DNA of Agrobacterium tumefaciens
(Zambryski, 1988)
<220>
<221> misc_feature
<222> (76)..(786)
<223> sequence including the 3?untranslated region of the octopine
synthase gene of Agrobacterium tumefaciens as described by De
Greve et al. (1982) (complement)
<220>
<221> misc_feature
<222> (807)..(1211)
<223> sequence including a part of the Nicotiana benthamiana XylT gene
sequence cloned in antisense orientation (complement)
<220>
<221> misc_feature
<222> (1250)..(1991)
<223> sequence containing the second intron of the pyruvate
orthophosphate dikinase gene from Flaveria trinervia as described
by Rosche and Westhoff (1995) (complement)
<220>
<221> misc_feature
<222> (2023)..(2427)
<223> sequence including a part of the Nicotiana benthamiana XylT gene
sequence cloned in sense orientation (complement)
<220>
<221> misc_feature
<222> (2434)..(3779)
<223> sequence including the promoter region of the Cauliflower Mosaic
Virus 35S transcript (Odell et al., 1985) (complement)
<220>
<221> misc_feature
<222> (3854)..(4140)
<223> sequence including the promoter region of the nopaline synthase
gene of A. tumefaciens T-DNA
<220>
<221> misc_feature
<222> (4161)..(4712)
<223> sequence including the bar phosphinothricin resistance gene [De
Block et al. (1987) EMBO J 6:2513]
<220>
<221> misc_feature
<222> (4731)..(4991)
<223> sequence including the 3?untranslated region of the nopaline
synthase gene of A. tumefaciens T-DNA
<220>
<221> misc_feature
<222> (5069)..(5093)
<223> left border repeat from the T-DNA of Agrobacterium tumefaciens
(Zambryski, 1988)
<400> 22
aattacaacg gtatatatcc tgccagtact cggccgtcga ccgcggtacc ccggaattaa 60
gcttgcatgc ctgcaggtcc tgctgagcct cgacatgttg tcgcaaaatt cgccctggac 120
ccgcccaacg atttgtcgtc actgtcaagg tttgacctgc acttcatttg gggcccacat 180
acaccaaaaa aatgctgcat aattctcggg gcagcaagtc ggttacccgg ccgccgtgct 240
ggaccgggtt gaatggtgcc cgtaactttc ggtagagcgg acggccaata ctcaacttca 300
aggaatctca cccatgcgcg ccggcgggga accggagttc ccttcagtga acgttattag 360
ttcgccgctc ggtgtgtcgt agatactagc ccctggggcc ttttgaaatt tgaataagat 420
ttatgtaatc agtcttttag gtttgaccgg ttctgccgct ttttttaaaa ttggatttgt 480
aataataaaa cgcaattgtt tgttattgtg gcgctctatc atagatgtcg ctataaacct 540
attcagcaca atatattgtt ttcattttaa tattgtacat ataagtagta gggtacaatc 600
agtaaattga acggagaata ttattcataa aaatacgata gtaacgggtg atatattcat 660
tagaatgaac cgaaaccggc ggtaaggatc tgagctacac atgctcaggt tttttacaac 720
gtgcacaaca gaattgaaag caaatatcat gcgatcatag gcgtctcgca tatctcatta 780
aagcaggact ctagaggatc ctcgagacac aattggagga aacatggaaa gcactttttt 840
caagcctcac ttatgctaag aactttagtg gcccagtttg tttccgtcat gccgtcctct 900
cgcctttggg atatgaaact gccctgttta agggactgtc agaaactata gattgtaatg 960
gagcttctgc tcatgatttg tggcaaaatc ctgatgataa gaaaactgca cggttatccg 1020
agtttgggga gatgatcagg gcagcctttg gatttcctgt tgatagacag aacatcccaa 1080
ggacagtcac aggccctaat gtcctctttg ttagacgtga ggattattta gctcacccac 1140
gtcatggtgg aaaggtacag tctaggctta gcaatgaaga gcaagtattt gattccataa 1200
agagctgggc cggtaccatc gatttcgaac ccaatttccc aactgtaatc aatccaaatg 1260
taagatcaat gataacacaa tgacatgatc tatcatgtta ccttgtttat tcatgttcga 1320
ctaattcatt taattaatag tcaatccatt tagaagttaa taaaactaca agtattattt 1380
agaaattaat aagaatgttg attgaaaata atactatata aaatgataga tcttgcgctt 1440
tgttatatta gcattagatt atgttttgtt acattagatt actgtttcta ttagtttgat 1500
attatttgtt actttagctt gttatttaat attttgttta ttgataaatt acaagcagat 1560
tggaatttct aacaaaatat ttattaactt ttaaactaaa atatttagta atggtataga 1620
tatttaatta tataataaac tattaatcat aaaaaaatat tattttaatt tatttattct 1680
tatttttact atagtatttt atcattgata tttaattcat caaaccagct agaattacta 1740
ttatgattaa aacaaatatt aatgctagta tatcatctta catgttcgat caaattcatt 1800
aaaaataata tacttactct caacttttat cttcttcgtc ttacacatca cttgtcatat 1860
ttttttacat tactatgttg tttatgtaaa caatatattt ataaattatt ttttcacaat 1920
tataacaact atattattat aatcatacta attaacatca cttaactatt ttatactaaa 1980
aggaaaaaag aaaataatta tttccttacc aattggggta ccggcccagc tctttatgga 2040
atcaaatact tgctcttcat tgctaagcct agactgtacc tttccaccat gacgtgggtg 2100
agctaaataa tcctcacgtc taacaaagag gacattaggg cctgtgactg tccttgggat 2160
gttctgtcta tcaacaggaa atccaaaggc tgccctgatc atctccccaa actcggataa 2220
ccgtgcagtt ttcttatcat caggattttg ccacaaatca tgagcagaag ctccattaca 2280
atctatagtt tctgacagtc ccttaaacag ggcagtttca tatcccaaag gcgagaggac 2340
ggcatgacgg aaacaaactg ggccactaaa gttcttagca taagtgaggc ttgaaaaaag 2400
tgctttccat gtttcctcca attgtgtctc gagcgtgtcc tctccaaatg aaatgaactt 2460
ccttatatag aggaagggtc ttgcgaagga tagtgggatt gtgcgtcatc ccttacgtca 2520
gtggagatgt cacatcaatc cacttgcttt gaagacgtgg ttggaacgtc ttctttttcc 2580
acgatgctcc tcgtgggtgg gggtccatct ttgggaccac tgtcggcaga gagatcttga 2640
atgatagcct ttcctttatc gcaatgatgg catttgtagg agccaccttc cttttctact 2700
gtcctttcga tgaagtgaca gatagctggg caatggaatc cgaggaggtt tcccgaaatt 2760
atcctttgtt gaaaagtctc aatagccctt tggtcttctg agactgtatc tttgacattt 2820
ttggagtaga ccagagtgtc gtgctccacc atgttgacga agattttctt cttgtcattg 2880
agtcgtaaaa gactctgtat gaactgttcg ccagtcttca cggcgagttc tgttagatcc 2940
tcgatttgaa tcttagactc catgcatggc cttagattca gtaggaacta cctttttaga 3000
gactccaatc tctattactt gccttggttt atgaagcaag ccttgaatcg tccatactgg 3060
aatagtactt ctgatcttga gaaatatgtc tttctctgtg ttcttgatgc aattagtcct 3120
gaatcttttg actgcatctt taaccttctt gggaaggtat ttgatctcct ggagattgtt 3180
actcgggtag atcgtcttga tgagacctgc tgcgtaggcc tctctaacca tctgtgggtc 3240
agcattcttt ctgaaattga agaggctaac cttctcatta tcagtggtga acatagtgtc 3300
gtcaccttca ccttcgaact tccttcctag atcgtaaaga tagaggaaat cgtccattgt 3360
aatctccggg gcaaaggaga tctcttttgg ggctggatca ctgctgggcc ttttggttcc 3420
tagcgtgagc cagtgggctt tttgctttgg tgggcttgtt agggccttag caaagctctt 3480
gggcttgagt tgagcttctc ctttggggat gaagttcaac ctgtctgttt gctgacttgt 3540
tgtgtacgcg tcagctgctg ctcttgcctc tgtaatagtg gcaaatttct tgtgtgcaac 3600
tccgggaacg ccgtttgttg ccgcctttgt acaaccccag tcatcgtata taccggcatg 3660
tggaccgtta tacacaacgt agtagttgat atgagggtgt tgaatacccg attctgctct 3720
gagaggagca actgtgctgt taagctcaga tttttgtggg attggaatta attcgtcgag 3780
cggccgctcg acgagctccc tatagtgagt cgtattagag gccgacttgg gggccggcca 3840
tttaaatgaa ttcgatcatg agcggagaat taagggagtc acgttatgac ccccgccgat 3900
gacgcgggac aagccgtttt acgtttggaa ctgacagaac cgcaacgatt gaaggagcca 3960
ctcagccgcg ggtttctgga gtttaatgag ctaagcacat acgtcagaaa ccattattgc 4020
gcgttcaaaa gtcgcctaag gtcactatca gctagcaaat atttcttgtc aaaaatgctc 4080
cactgacgtt ccataaattc ccctcggtat ccaattagag tctcatattc actctcaatc 4140
aaagatccgg cccatgatcc atggacccag aacgacgccc ggccgacatc cgccgtgcca 4200
ccgaggcgga catgccggcg gtctgcacca tcgtcaacca ctacatcgag acaagcacgg 4260
tcaacttccg taccgagccg caggaaccgc aggagtggac ggacgacctc gtccgtctgc 4320
gggagcgcta tccctggctc gtcgccgagg tggacggcga ggtcgccggc atcgcctacg 4380
cgggcccctg gaaggcacgc aacgcctacg actggacggc cgagtcgacc gtgtacgtct 4440
ccccccgcca ccagcggacg ggactgggct ccacgctcta cacccacctg ctgaagtccc 4500
tggaggcaca gggcttcaag agcgtggtcg ctgtcatcgg gctgcccaac gacccgagcg 4560
tgcgcatgca cgaggcgctc ggatatgccc cccgcggcat gctgcgggcg gccggcttca 4620
agcacgggaa ctggcatgac gtgggtttct ggcagctgga cttcagcctg ccggtaccgc 4680
cccgtccggt cctgcccgtc accgagatct gatctcacgc gtctaggatc cgaagcagat 4740
cgttcaaaca tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg 4800
attatcatat aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg 4860
acgttattta tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg 4920
atagaaaaca aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg 4980
ttactagatc gggaagatcc attaattcgg tactcgaggc attacggcat tacggcactc 5040
gcgagggtcc caattcgagc atggagccat ttacaattga atatatcctg ccg 5093
<210> 23
<211> 2318
<212> DNA
<213> Nicotiana tabacum cv. Xanthi
<220>
<221> 5'UTR
<222> (1)..(18)
<220>
<221> CDS
<222> (19)..(1590)
<220>
<221> 3'UTR
<222> (1592)..(2291)
<220>
<221> polyA_signal
<222> (2292)..(2318)
<400> 23
agtcagagag agaagaag atg aac aag aaa aag ctg aaa ttt ctt gtt tct 51
Met Asn Lys Lys Lys Leu Lys Phe Leu Val Ser
1 5 10
ctc ttc gct ctc aac tca atc act ctc tat ctc tac ttc tct tcc cac 99
Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser Ser His
15 20 25
tct gat cac ttc cgt cac aaa tcc ccc caa aac cac ttt cct aat acc 147
Ser Asp His Phe Arg His Lys Ser Pro Gln Asn His Phe Pro Asn Thr
30 35 40
caa aac cac tat tcc ctg tcg gaa aac cac cat gat aat ttc cac tct 195
Gln Asn His Tyr Ser Leu Ser Glu Asn His His Asp Asn Phe His Ser
45 50 55
tct gtc act tcc caa tat acc aag cct tgg cca att ttg ccc tcc tac 243
Ser Val Thr Ser Gln Tyr Thr Lys Pro Trp Pro Ile Leu Pro Ser Tyr
60 65 70 75
ctc ccc tgg tct cag aat cct aat gtt tct ttg aga tcg tgc gag ggt 291
Leu Pro Trp Ser Gln Asn Pro Asn Val Ser Leu Arg Ser Cys Glu Gly
80 85 90
tac ttc ggt aat ggg ttt act ctc aaa gtt gat ctt ctc aaa act tcg 339
Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser
95 100 105
ccg gag ctt cac cag aaa ttc ggc gaa aac acc gta tcc ggc gac ggc 387
Pro Glu Leu His Gln Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly
110 115 120
gga tgg ttt agg tgt ttt ttc agt gag act ttg cag agt tcg att tgc 435
Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys
125 130 135
gag gga ggt gct ata cga atg aat ccg gac gag att ttg atg tct cgt 483
Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg
140 145 150 155
gga ggc gag aaa ttg gag tcg gtt att ggt agg agt gaa gat gat gag 531
Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu
160 165 170
ctg ccc gtg ttc aaa aat gga gct ttt cag att aaa gtt act gat aaa 579
Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys
175 180 185
ctg aaa att ggg aaa aaa tta gtg gat gaa aaa atc ttg aat aaa tac 627
Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Ile Leu Asn Lys Tyr
190 195 200
tta ccg gaa ggt gca att tca agg cac act atg cgt gaa tta att gac 675
Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp
205 210 215
tct att cag tta gtt ggc gcc gat gaa ttt cac tgt tct gag tgg att 723
Ser Ile Gln Leu Val Gly Ala Asp Glu Phe His Cys Ser Glu Trp Ile
220 225 230 235
gag gag ccg tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc 771
Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe
240 245 250
cac aca gtt acc gat tgg tat agt gca tac gtg gca tcc agg gtt act 819
His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr
255 260 265
ggc ttg ccc agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag 867
Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu
270 275 280
aca caa ttg gag gaa aca tgg aaa gca ctc ttt tca agc ctc act tat 915
Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr
285 290 295
gct aag aac ttt agt ggc cca gtt tgt ttc cgt cac gcc gtt ctc tcg 963
Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His Ala Val Leu Ser
300 305 310 315
cct ttg gga tat gaa act gcc ctg ttt aag gga ctg aca gaa act ata 1011
Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu Thr Glu Thr Ile
320 325 330
gat tgt aat gga gct tct gcc cat gat ttg tgg caa aat cct gat gat 1059
Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp
335 340 345
aag aga act gca cgg ttg tct gag ttt ggg gag atg atc agg gca gcc 1107
Lys Arg Thr Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala
350 355 360
ttt gga ttt cct gtg gat aga cag aac atc cca agg aca gtc aca ggc 1155
Phe Gly Phe Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly
365 370 375
cct aat gtc ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt 1203
Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg
380 385 390 395
cat ggt gga aag gta cag tct agg ctt agc aat gaa gag caa gta ttt 1251
His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe
400 405 410
gat tcc ata aag agc tgg gcc ttg aac cac tcg gag tgc aaa tta aat 1299
Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn
415 420 425
gta att aac gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga 1347
Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg
430 435 440
gca atc caa gat gct tct gtc ata gtt ggt gct cat gga gca ggt cta 1395
Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu
445 450 455
act cac ata gtt tct gca gca cca aaa gct gta ata cta gaa att ata 1443
Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile
460 465 470 475
agc agc gaa tat agg cgc ccc cat ttt gct ctg att gca caa tgg aaa 1491
Ser Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys
480 485 490
gga ttg gag tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct 1539
Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro
495 500 505
cca gtt gtg atc gac agg ctc agc agc att ttg agg agt ctt ggg tgc 1587
Pro Val Val Ile Asp Arg Leu Ser Ser Ile Leu Arg Ser Leu Gly Cys
510 515 520
taa gtccgctcga cagtttgaat agttcggctt ttctctaaaa gacggggaag 1640
gatagaggaa ttcggggttc tggaacttgg agcctgggaa ttttgataaa tatgtttcac 1700
acgcagttct gtagtcaatg gttgcaatct aggtcctcaa tctggtgttg ataagcttgg 1760
caatttccag cagctactaa tttattagcc cgctctgact cggttatgga ctaccagagc 1820
aatcatatca aatggaagca tggaatcctg attgtggaat ggtgagctca ttgaagagca 1880
tattctttat ggtgttgaag attacaattc acaattaaca cgtgtatgtg aaagattagg 1940
ttggtacact tacttacaat tcattgtcaa ttgtttttca ttattctcat taatgatcat 2000
aggataagaa catgagaaaa ccatccatgt tctgtgttgt tttcccatca atccggccac 2060
cctcttccct ccttatgtag agatgatttc aacagagttt gttttgtagt tgtaacactt 2120
gcactcccag ttacagtttt gcattcgaca cattcatccc atcagatgtc aagtttaaag 2180
gcataagaca tttgacatat tgaagaagca gattaacacg aacgtcagta tgatgcttca 2240
gtgaagatat ggttgtaact tgtaaccaaa caaaagaaat gagactttga caaaaaaaaa 2300
aaaaaaaaaa aaaaaaaa 2318
<210> 24
<211> 523
<212> PRT
<213> Nicotiana tabacum cv. Xanthi
<400> 24
Met Asn Lys Lys Lys Leu Lys Phe Leu Val Ser Leu Phe Ala Leu Asn
1 5 10 15
Ser Ile Thr Leu Tyr Leu Tyr Phe Ser Ser His Ser Asp His Phe Arg
20 25 30
His Lys Ser Pro Gln Asn His Phe Pro Asn Thr Gln Asn His Tyr Ser
35 40 45
Leu Ser Glu Asn His His Asp Asn Phe His Ser Ser Val Thr Ser Gln
50 55 60
Tyr Thr Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln
65 70 75 80
Asn Pro Asn Val Ser Leu Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly
85 90 95
Phe Thr Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Leu His Gln
100 105 110
Lys Phe Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys
115 120 125
Phe Phe Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile
130 135 140
Arg Met Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys Leu
145 150 155 160
Glu Ser Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val Phe Lys
165 170 175
Asn Gly Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile Gly Lys
180 185 190
Lys Leu Val Asp Glu Lys Ile Leu Asn Lys Tyr Leu Pro Glu Gly Ala
195 200 205
Ile Ser Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val
210 215 220
Gly Ala Asp Glu Phe His Cys Ser Glu Trp Ile Glu Glu Pro Ser Leu
225 230 235 240
Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr Val Thr Asp
245 250 255
Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu Pro Ser Arg
260 265 270
Pro His Leu Val Phe Val Asp Gly His Cys Glu Thr Gln Leu Glu Glu
275 280 285
Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn Phe Ser
290 295 300
Gly Pro Val Cys Phe Arg His Ala Val Leu Ser Pro Leu Gly Tyr Glu
305 310 315 320
Thr Ala Leu Phe Lys Gly Leu Thr Glu Thr Ile Asp Cys Asn Gly Ala
325 330 335
Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Arg Thr Ala Arg
340 345 350
Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Gly Phe Pro Val
355 360 365
Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val Leu Phe
370 375 380
Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly Lys Val
385 390 395 400
Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile Lys Ser
405 410 415
Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn Gly Leu
420 425 430
Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln Asp Ala
435 440 445
Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile Val Ser
450 455 460
Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu Tyr Arg
465 470 475 480
Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu Tyr His
485 490 495
Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val Ile Asp
500 505 510
Arg Leu Ser Ser Ile Leu Arg Ser Leu Gly Cys
515 520
<210> 25
<211> 4973
<212> DNA
<213> Nicotiana tabacum cv. Xanthi
<220>
<221> 5'UTR
<222> (1)..(18)
<220>
<221> CDS
<222> (19)..(696)
<220>
<221> Intron
<222> (697)..(2028)
<220>
<221> CDS
<222> (2029)..(2178)
<220>
<221> Intron
<222> (2179)..(3606)
<220>
<221> CDS
<222> (3607)..(4326)
<220>
<221> 3'UTR
<222> (4330)..(4973)
<400> 25
agtcagagag agaagaag atg aac aag aaa aag ctg aaa att ctt gtt tct 51
Met Asn Lys Lys Lys Leu Lys Ile Leu Val Ser
1 5 10
ctc ttc gct ctc aac tca atc act ctc tat ctc tac ttc tct tcc cac 99
Leu Phe Ala Leu Asn Ser Ile Thr Leu Tyr Leu Tyr Phe Ser Ser His
15 20 25
cct gat cac ttc cgc cac aaa tcc cgc caa aac cac ttt tcc ttg tcg 147
Pro Asp His Phe Arg His Lys Ser Arg Gln Asn His Phe Ser Leu Ser
30 35 40
gaa aac cgc cat cat aat ttc cac tct tca atc act tct caa tat tcc 195
Glu Asn Arg His His Asn Phe His Ser Ser Ile Thr Ser Gln Tyr Ser
45 50 55
aag cct tgg cct att ttg ccc tcc tac ctc cct tgg tct caa aac cct 243
Lys Pro Trp Pro Ile Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro
60 65 70 75
aat gtt gtt tgg aga tcg tgc gag ggt tac ttc ggt aat ggg ttt act 291
Asn Val Val Trp Arg Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr
80 85 90
ctc aaa gtt gac ctt ctc aaa act tcg ccg gag ttt cac cgg aaa ttc 339
Leu Lys Val Asp Leu Leu Lys Thr Ser Pro Glu Phe His Arg Lys Phe
95 100 105
ggc gaa aac acc gtc tcc ggc gac ggc gga tgg ttt agg tgt ttt ttc 387
Gly Glu Asn Thr Val Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe
110 115 120
agt gag act ttg cag agt tcg atc tgc gag gga ggc gca ata cga atg 435
Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met
125 130 135
aat ccg gac gag att ttg atg tct cgt gga ggt gag aaa ttg gag tcg 483
Asn Pro Asp Glu Ile Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser
140 145 150 155
gtt att ggt agg agt gaa gat gat gag ctg ccc gtg ttc aaa aat gga 531
Val Ile Gly Arg Ser Glu Asp Asp Glu Leu Pro Val Phe Lys Asn Gly
160 165 170
gct ttt cag att aaa gtt act gat aaa ctg aaa att ggg aaa aaa tta 579
Ala Phe Gln Ile Lys Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu
175 180 185
gtg gat gaa aaa ttc ttg aat aaa tac tta ccg gaa ggt gca att tca 627
Val Asp Glu Lys Phe Leu Asn Lys Tyr Leu Pro Glu Gly Ala Ile Ser
190 195 200
agg cac act atg cgt gag tta att gac tct att cag ttg gtt ggc gcc 675
Arg His Thr Met Arg Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala
205 210 215
gat gat ttt cac tgt tct gag gttagatttt gaattttgtt tgctctttaa 726
Asp Asp Phe His Cys Ser Glu
220 225
attaaaggtt taaactttgt gaatgttggc agatatggaa tacactaatg gattttgttt 786
gatctgttta atgaagattg tctagaacct caatgttata aatatggttt ggttgcttca 846
ttaattaaag agaattcctt aatatcccga ctagatgcca gataacacca gttagttgac 906
ttttggatta ttggttgcat ttcatttgat cagataaatt gttcattctt aaatgtttca 966
ctaaagaatt actcaagatt tcagagttta tatgtaggtg tatgtatttg gaattctgga 1026
tttggatcta gtattgaatg gattactgaa cttgtactcc ccagtcatct ggggaggagc 1086
aatagatcaa attcaagggt tgaaaagtaa tactgagtca gaaattaacc actttaactt 1146
ggaaaacggt aaatgtatgt gttctaagat ggttattcct ataacttttg atgtctaata 1206
tggagaaagt gagttgattt atgctttttc cttttccctt tattggtgtt ggtttttaaa 1266
ttctatcaat tcctttgttt gattgctact caaattgaac cttagacgga gtagcaatag 1326
caaaaagtga aggccattct tttctccttt catctcttta tttccgtttg acatacagaa 1386
tatggtagca tctgtctgaa gtggttaatt ttattcctta aaatttgcat aactaattcg 1446
agtaaatgcc ttttgaagct ttagttgaat agttctacaa ctggttgttg cattttgagg 1506
actatcgact tgatttgaca cttgacattg tctgatacat ggcttgtaag ttatgaaaac 1566
ttttatctag gaagaaatcc caaccagaga tagggagctg tcacttggtt atgagctact 1626
ggctcaaagt tcaagtttga ccagttaatt ttagatcttc accaggataa catttagagt 1686
ctaatcaaat tctgaagcag tattgtgcac taataagagg aacacatgaa ggatgtagca 1746
ctactaggtt atgttacctt atttactaat gattgacaac cagcttaaat gatgacaaat 1806
agtcttatat ttgctttttc acattgctca tgacttggga tatttccgaa tcaacatatt 1866
ttagttcttt atgtacttaa ctacttatca aaaaattatc cctgctagat gttagtgttc 1926
aagcaaccat gctagctttt aaggaagctc cttctttgat tcatgccatc tttccgaaat 1986
cgatgcctta cgttactgtc atttttctaa ttttcatttc ag tgg att gag gag 2040
Trp Ile Glu Glu
230
ccg tca ctt ttg att aca cga ttt gag tat gca aac ctt ttc cac aca 2088
Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr Ala Asn Leu Phe His Thr
235 240 245
gtt acc gat tgg tat agt gca tac gtg gca tcc agg gtt act ggc ttg 2136
Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala Ser Arg Val Thr Gly Leu
250 255 260
ccc agt cgg cca cat ttg gtt ttt gta gat ggc cat tgt gag 2178
Pro Ser Arg Pro His Leu Val Phe Val Asp Gly His Cys Glu
265 270 275
gtatgtttga aagtattgat aacgatggca tgcattgtac tgtgttacgg atgaaagaaa 2238
tgaaaccagc aattattttc tagcaggcaa tgctcttgag atgcttgtgt caaattggtc 2298
agacttaatc ctgagtttcc atttgtttca gctttctgtt tgactgacta caataattgt 2358
cccaattagg ggtgtcaatg gatattcgaa agccgactaa accgaccgaa ccgtaccgta 2418
ccgattttta ggtttctttt taagaaaccg taggttttta tataaatcta taaccgcacc 2478
gataattagg gtaggttttt tattttataa aaataagccg aaaaaatacc gaaccgtacc 2538
gaataaattt tacatgtgga aaatatattt atttagtaag tttaaaaata ataatgcatt 2598
aaattttctt tgggccatgg aattatgaaa actattacaa gccaacaagt aattagactc 2658
aaaatactaa ttcctaaaac ctattatgtt acttctactt aaactaagtt atttcaagta 2718
tctttattag caagacacaa agtattctag cgattatgag caaactacaa tgtattgaat 2778
atgtttcctt tcatatattt tagatttatc tttttgaata tttaatcttc tatagactct 2838
attcttgagt cccagcttgg tatatctttc aactcgtgtg atttatattt tctttgcctt 2898
tgtttgattt cttttacgtt gttgtagaat agtcgatgga tctatactct agccatcttt 2958
ctttttcttt ttttaattca tcacctttta aacagtaaaa atgtctaaag aatttttcta 3018
agtcctataa aagaacgtat gttattgcat tctacttcta ctggtgaatt ttacatgata 3078
ttaaaaaatt aaccgaacct taccgctacc gaagagaaac cgacatgatt gggacggttt 3138
cgaaaagtct aattttggtt atacataata gaataaccga aaaattggta tggtacaaat 3198
tttataaaat aaccggccga accgaaccat tgacacccct agtcccaata cctagttgtt 3258
gcagtttgct cattcttact tctatttacg tcactgtttc tctgaatggt ccctttgtgg 3318
tgaaaagagc ttttgctatg tagaaaaact agcaatgatt tcatagctga aacaatttat 3378
ttttacctta catcatgtct tataaaattg cttctaactg tatactttaa ttcttggaga 3438
gatgctttca tgtgaagaaa gttctttcac tccactactg gaagcttgcc gtatgaattt 3498
tacttggcca tattgtggcc gtgctttgat ttatcttcaa attcattttc ttcatatagt 3558
tctttcgagt aattcttttt tcctcttttc tgtttgaaaa aaattcag aca caa ttg 3615
Thr Gln Leu
gag gaa aca tgg aaa gca ctt ttt tca agc ctc act tat gct aag aac 3663
Glu Glu Thr Trp Lys Ala Leu Phe Ser Ser Leu Thr Tyr Ala Lys Asn
280 285 290 295
ttt agt ggc cca gtt tgt ttc cgt cat gcc gcc ctc tcg cct ttg gga 3711
Phe Ser Gly Pro Val Cys Phe Arg His Ala Ala Leu Ser Pro Leu Gly
300 305 310
tat gaa act gcc ctg ttt aag gga ctg tca gaa act ata gat tgt aat 3759
Tyr Glu Thr Ala Leu Phe Lys Gly Leu Ser Glu Thr Ile Asp Cys Asn
315 320 325
gga gct tct gcc cat gat ttg tgg caa aat cct gat gat aag aaa act 3807
Gly Ala Ser Ala His Asp Leu Trp Gln Asn Pro Asp Asp Lys Lys Thr
330 335 340
gca cgg ttg tcc gag ttt ggg gag atg att agg gca gcc ttt aga ttt 3855
Ala Arg Leu Ser Glu Phe Gly Glu Met Ile Arg Ala Ala Phe Arg Phe
345 350 355
cct gtg gat aga cag aac atc cca agg aca gtc aca ggc cct aat gtc 3903
Pro Val Asp Arg Gln Asn Ile Pro Arg Thr Val Thr Gly Pro Asn Val
360 365 370 375
ctc ttt gtt aga cgt gag gat tat tta gct cac cca cgt cat ggt gga 3951
Leu Phe Val Arg Arg Glu Asp Tyr Leu Ala His Pro Arg His Gly Gly
380 385 390
aag gta cag tct agg ctt agc aat gaa gag caa gta ttt gat tcc ata 3999
Lys Val Gln Ser Arg Leu Ser Asn Glu Glu Gln Val Phe Asp Ser Ile
395 400 405
aag agc tgg gcc ttg aac cac tcg gag tgc aaa tta aat gta att aac 4047
Lys Ser Trp Ala Leu Asn His Ser Glu Cys Lys Leu Asn Val Ile Asn
410 415 420
gga ttg ttt gcc cac atg tcc atg aaa gag caa gtt cga gca atc caa 4095
Gly Leu Phe Ala His Met Ser Met Lys Glu Gln Val Arg Ala Ile Gln
425 430 435
gat gct tct gtc ata gtt ggt gct cat gga gca ggt cta act cac ata 4143
Asp Ala Ser Val Ile Val Gly Ala His Gly Ala Gly Leu Thr His Ile
440 445 450 455
gtt tct gca gca cca aaa gct gta ata cta gaa att ata agc agc gaa 4191
Val Ser Ala Ala Pro Lys Ala Val Ile Leu Glu Ile Ile Ser Ser Glu
460 465 470
tat agg cgc ccc cat ttt gct ctg att gca caa tgg aaa gga ttg gag 4239
Tyr Arg Arg Pro His Phe Ala Leu Ile Ala Gln Trp Lys Gly Leu Glu
475 480 485
tac cat ccc ata tat ttg gag ggg tct tat gcg gat cct cca gtt gtg 4287
Tyr His Pro Ile Tyr Leu Glu Gly Ser Tyr Ala Asp Pro Pro Val Val
490 495 500
atc gac aag ctc agc agc att ttg agg agt ctt ggg tgc taaatctgct 4336
Ile Asp Lys Leu Ser Ser Ile Leu Arg Ser Leu Gly Cys
505 510 515
cgacagttta gttcgtcttt tctctaaaag actgggaagg atagaggaat tcggggttct 4396
ggaacctgga gcctgggaat tgtgtaaaat atgtttcaca cgcagttcta tagtcaattg 4456
ctgcaatctg gtgttcataa gcttggaaat ttccagcagc tactaactta ttagcccact 4516
ctgactcagt tatggactac cagagcaatc atatcaaatg ggagcatgga atcctgattg 4576
tggaatggtg agctcattga agagcatatt ctttatggtg ttgaagatta cagttgacga 4636
gtaacacgtg tatgtgaaag attaggttgt tacactttct tgcaattcat tgtcaattgt 4696
ttttcgtcat tcttattaat gatcatagga taagaacatg agaaaaccat ccatgttctc 4756
tgttgttttc ccatcaatct ggccaccctc tttcctcttt atgtagagat gatttcaaca 4816
gagtttgttt tgtagttgta atacttgtac tcacagttac tgttttgcat tcatcccatc 4876
agatgtcgaa gaagcagatt aacaagaacg tcagtatgat gtttcagtga atatatggtt 4936
gtaacttgta accaaacaaa agaaatgaga ctttgac 4973
<210> 26
<211> 516
<212> PRT
<213> Nicotiana tabacum cv. Xanthi
<400> 26
Met Asn Lys Lys Lys Leu Lys Ile Leu Val Ser Leu Phe Ala Leu Asn
1 5 10 15
Ser Ile Thr Leu Tyr Leu Tyr Phe Ser Ser His Pro Asp His Phe Arg
20 25 30
His Lys Ser Arg Gln Asn His Phe Ser Leu Ser Glu Asn Arg His His
35 40 45
Asn Phe His Ser Ser Ile Thr Ser Gln Tyr Ser Lys Pro Trp Pro Ile
50 55 60
Leu Pro Ser Tyr Leu Pro Trp Ser Gln Asn Pro Asn Val Val Trp Arg
65 70 75 80
Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Leu Lys Val Asp Leu
85 90 95
Leu Lys Thr Ser Pro Glu Phe His Arg Lys Phe Gly Glu Asn Thr Val
100 105 110
Ser Gly Asp Gly Gly Trp Phe Arg Cys Phe Phe Ser Glu Thr Leu Gln
115 120 125
Ser Ser Ile Cys Glu Gly Gly Ala Ile Arg Met Asn Pro Asp Glu Ile
130 135 140
Leu Met Ser Arg Gly Gly Glu Lys Leu Glu Ser Val Ile Gly Arg Ser
145 150 155 160
Glu Asp Asp Glu Leu Pro Val Phe Lys Asn Gly Ala Phe Gln Ile Lys
165 170 175
Val Thr Asp Lys Leu Lys Ile Gly Lys Lys Leu Val Asp Glu Lys Phe
180 185 190
Leu Asn Lys Tyr Leu Pro Glu Gly Ala Ile Ser Arg His Thr Met Arg
195 200 205
Glu Leu Ile Asp Ser Ile Gln Leu Val Gly Ala Asp Asp Phe His Cys
210 215 220
Ser Glu Trp Ile Glu Glu Pro Ser Leu Leu Ile Thr Arg Phe Glu Tyr
225 230 235 240
Ala Asn Leu Phe His Thr Val Thr Asp Trp Tyr Ser Ala Tyr Val Ala
245 250 255
Ser Arg Val Thr Gly Leu Pro Ser Arg Pro His Leu Val Phe Val Asp
260 265 270
Gly His Cys Glu Thr Gln Leu Glu Glu Thr Trp Lys Ala Leu Phe Ser
275 280 285
Ser Leu Thr Tyr Ala Lys Asn Phe Ser Gly Pro Val Cys Phe Arg His
290 295 300
Ala Ala Leu Ser Pro Leu Gly Tyr Glu Thr Ala Leu Phe Lys Gly Leu
305 310 315 320
Ser Glu Thr Ile Asp Cys Asn Gly Ala Ser Ala His Asp Leu Trp Gln
325 330 335
Asn Pro Asp Asp Lys Lys Thr Ala Arg Leu Ser Glu Phe Gly Glu Met
340 345 350
Ile Arg Ala Ala Phe Arg Phe Pro Val Asp Arg Gln Asn Ile Pro Arg
355 360 365
Thr Val Thr Gly Pro Asn Val Leu Phe Val Arg Arg Glu Asp Tyr Leu
370 375 380
Ala His Pro Arg His Gly Gly Lys Val Gln Ser Arg Leu Ser Asn Glu
385 390 395 400
Glu Gln Val Phe Asp Ser Ile Lys Ser Trp Ala Leu Asn His Ser Glu
405 410 415
Cys Lys Leu Asn Val Ile Asn Gly Leu Phe Ala His Met Ser Met Lys
420 425 430
Glu Gln Val Arg Ala Ile Gln Asp Ala Ser Val Ile Val Gly Ala His
435 440 445
Gly Ala Gly Leu Thr His Ile Val Ser Ala Ala Pro Lys Ala Val Ile
450 455 460
Leu Glu Ile Ile Ser Ser Glu Tyr Arg Arg Pro His Phe Ala Leu Ile
465 470 475 480
Ala Gln Trp Lys Gly Leu Glu Tyr His Pro Ile Tyr Leu Glu Gly Ser
485 490 495
Tyr Ala Asp Pro Pro Val Val Ile Asp Lys Leu Ser Ser Ile Leu Arg
500 505 510
Ser Leu Gly Cys
515
Claims (60)
- a) 키메라 유전자를 니코티아나(Nicotiana) 종 또는 재배종(cultivar)의 식물 세포 내로 도입하여 형질전환 식물 세포를 발생시키는 단계;b) 경우에 따라, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 비형질전환 니코티아나 식물 세포보다 낮은 형질전환 니코티아나 식물 세포를 확인하는 단계;c) 경우에 따라, 상기 형질전환 니코티아나 식물 세포를 재생하여 형질전환 니코티아나 식물을 수득하는 단계; 및d) 경우에 따라, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 비형질전환 니코티아나 식물보다 낮은 형질전환 니코티아나 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물의 생산 방법으로서, 상기 키메라 유전자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:i) 발현가능한 식물 프로모터;ii) (1) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열 또는 이의 상보체를 포함하는 제1 센스 DNA 영역, 및(2) 상기 제1 센스 DNA 영역의 상보체와 95% 이상의 서열 동일성을 갖는 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 제2 안티센스 DNA 영역을 포함하는 전사가능한 DNA 영역으로서, 이때 상기 제1 센스 DNA 영역에서 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 포함하며, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자가 적어도 상기 제1 센스 DNA 영역으로부터 전사된 RNA 영역과 상기 제2 안티센스 DNA 영역으로부터 전사된 RNA 영역 사이에서 이중 가닥 RNA 영역을 형성할 수 있는, 전사가능한 DNA 영역; 및iii) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
- 제1항에 있어서,니코티아나 종-특이적 XylT 아미노산이 니코티아나 벤싸미아나(Nicotiana benthamiana)-특이적 XylT 아미노산이고, 니코티아나 종이 바람직하게는 니코티아나 벤싸미아나인, 방법.
- 제1항 또는 제2항에 있어서,니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서,니코티아나 종-특이적 XylT 뉴클레오티드가 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드이고, 니코티아나 종이 바람직하게는 니코티아나 벤싸미아나인, 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서,니코티아나 XylT 유전자의 뉴클레오티드 서열이 서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는, 방법.
- 제1항에 있어서,니코티아나 재배종-특이적 XylT 아미노산이 니코티아나 타바큠 재배종 페타이트 하바나(Nicotiana tabacum cv. Petite Havana) SR1-특이적 XylT 아미노산이고, 니코티아나 재배종이 바람직하게는 니코티아나 타바큠 재배종 페타이트 하바나 SR1인, 방법.
- 제1항 또는 제6항에 있어서,니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 방법.
- 제1항, 제6항 및 제7항 중 어느 한 항에 있어서,니코티아나 재배종-특이적 XylT 뉴클레오티드가 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드이고, 니코티아나 재배종이 바람직하게는 니코티아나 타바큠 재배종 페타이트 하바나 SR1인, 방법.
- 제1항 및 제6항 내지 제8항 중 어느 한 항에 있어서,니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열이 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함하는, 방법.
- 제1항 내지 제9항 중 어느 한 항에 있어서,제1 DNA 영역 및 제2 DNA 영역이 50개 이상의 연속 뉴클레오티드를 포함하는, 방법.
- 제1항 내지 제9항 중 어느 한 항에 있어서,제1 DNA 영역 및 제2 DNA 영역이 200개 이상의 연속 뉴클레오티드를 포함하는, 방법.
- a) 하나 이상의 이중 가닥 RNA 분자를 니코티아나 종 또는 재배종의 식물 세포 또 는 식물에게 제공하는 단계; 및b) 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 상기 이중 가닥 RNA 분자를 포함하지 않는 동일한 니코티아나 식물 세포 또는 식물보다 낮은, 이중 가닥 RNA 분자를 포함하는 니코티아나 식물 세포 또는 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물의 생산 방법으로서,이때, 이중 가닥 RNA 분자가 2개의 RNA 가닥을 포함하고, 이중 한 RNA 가닥이 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열 또는 이의 상보체로 본질적으로 구성되고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있으며, 이때 상기 20 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있으며, 이때 상기 20 또는 21개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는, 방법.
- 제12항에 있어서,이중 가닥 RNA 분자가 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입시켜 형질전환 식물 세포를 발생시키고, 경우에 따라 상기 형질전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 상기 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되며, 이때 상기 키메라 유전자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:a) 발현가능한 식물 프로모터;b) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역으로서, 이때 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하는, DNA 영역; 및c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
- 제12항에 있어서,이중 가닥 RNA 분자가 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입시켜 형질전환 식물 세포를 발생시키고, 경우에 따라 상기 형질전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 상기 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되며, 이때 상기 키메라 유전자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:a) 발현가능한 식물 프로모터;b) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역으로서, 이때 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 그의 상보체인 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함하는, DNA 영역; 및c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
- 제12항에 있어서,이중 가닥 RNA 분자가 키메라 유전자를 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입시켜 형질전환 식물 세포를 발생시키고, 경우에 따라 상기 형지전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 상기 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되며, 이때 상기 키메라 유전자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:a) 발현가능한 식물 프로모터;b) (i) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 제1 DNA 영역, 및(ii) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 제2 DNA 영역을 포함하는 전사가능한 DNA 영역으로서, 이때 상기 제1 DNA 영역에서 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하며, 상기 제2 DNA 영역에서 뉴클레오티드 서열이 바람 직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 상기 뉴클레오티드 서열이 바람직하게는 상기 니코티아나 종 또는 재배종으로부터 수득될 수 있고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함함으로써, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자가 적어도 상기 제1 DNA 영역에 상응하는 RNA 영역과 상기 제2 DNA 영역에 상응하는 RNA 영역 사이에서의 염기-짝짓기(base-pairing)기 통해 이중 가닥 RNA 영역을 형성할 수 있는, 전사가능한 DNA 영역; 및c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
- 제12항 내지 제15항 중 어느 한 항에 있어서,니코티아나 종-특이적 XylT 아미노산이 니코티아나 벤싸미아나-특이적 XylT 아미노산이고, 니코티아나 종이 바람직하게는 니코티아나 벤싸미아나인, 방법.
- 제12항 내지 제16항 중 어느 한 항에 있어서,니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 방법.
- 제12항 내지 제17항 중 어느 한 항에 있어서,니코티아나 종-특이적 XylT 뉴클레오티드가 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드이고, 니코티아나 종이 바람직하게는 니코티아나 벤싸미아나인, 방법.
- 제12항 내지 제18항 중 어느 한 항에 있어서,니코티아나 XylT 유전자의 뉴클레오티드 서열이 서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는, 방법.
- 제12항 내지 제15항 중 어느 한 항에 있어서,니코티아나 재배종-특이적 XylT 아미노산이 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산이고, 니코티아나 재배종이 바람직하게는 니코티아나 타바큠 재배종 페타이트 하바나 SR1인, 방법.
- 제12항 내지 제15항 및 제20항 중 어느 한 항에 있어서,니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 방법.
- 제12항 내지 제15항, 제20항 및 제21항 중 어느 한 항에 있어서,니코티아나 재배종-특이적 XyIT 뉴클레오티드가 니코티아나 타바큠 재배종 페타이 트 하바나 SR1-특이적 XylT 뉴클레오티드이고, 니코티아나 재배종이 바람직하게는 니코티아나 타바큠 재배종 페타이트 하바나 SR1인, 방법.
- 제12항 내지 제15항 및 제20항 내지 제22항 중 어느 한 항에 있어서,니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열이 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함하는, 방법.
- a) i) 프로브로서 사용되는, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편,ii) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 DNA 단편,iii) 프로브로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20개 내지 1513개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,iv) 프로브로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20개 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,v) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,vi) PCR 반응에서 프라이머로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열,vii) PCR 반응에서 프라이머로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열,viii) PCR 반응에서 프라이머로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, 및ix) PCR 반응에서 프라이머로서 사용되는, 서열번호 1, 2, 15, 16, 19 또는 20의 뉴클레오티드 서열을 가진 올리고뉴클레오티드로 구성된 군으로부터 선택된 수단을 사용하여 제1 니코티아나 종 또는 재배종으로부터 수득될 수 있는 XylT 단백질 코딩 DNA 서열의 단편을 확인하는 단계;b) 하나 이상의 이중 가닥 RNA 분자를 제1 또는 제2 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공하는 단계로서, 이때 상기 이중 가닥 RNA 분자가 2개의 RNA 가닥을 포함하고, 이중 한 RNA 가닥이 상기 XylT 단백질 코딩 DNA 단편의 뉴클레오티드 서열로부터 선택된 20 또는 21개의 연속 뉴클레오티드로 구성된 RNA 뉴클레오티드 서열 또는 이의 상보체로 본질적으로 구성되고, 이때 상기 20 또는 21개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 하나 이상의 니코티아나 종-특이적 또는 재배종-특이 적 XylT 뉴클레오티드를 포함하는, 단계; 및c) 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 상기 이중 가닥 RNA 분자를 포함하지 않는 동일한 니코티아나 식물 세포 또는 식물보다 낮은, 이중 가닥 RNA 분자를 포함하는 니코티아나 식물 세포 또는 식물을 확인하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물의 생산 방법.
- 제24항에 있어서,이중 가닥 RNA 분자의 제공이 XylT 단백질 코딩 DNA 단편의 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드로 구성된 제1 뉴클레오티드 서열 또는 이의 상보체, 및 상기 제1 뉴클레오티드 서열의 상보체인 제2 뉴클레오티드 서열을 포함하는 이중 가닥 RNA 분자를 제1 또는 제2 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공함으로써 달성되고, 이때 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는, 방법.
- 제24항에 있어서,이중 가닥 RNA 분자가 키메라 DNA를 제1 또는 제2 니코티아나 종 또는 재배종의 식물 세포의 게놈 내로 삽입하여 형질전환 식물 세포를 발생시키고, 경우에 따라 상 기 형질전환 식물 세포를 재생시켜 형질전환 식물을 수득함으로써 상기 제1 또는 제2 니코티아나 종 또는 재배종의 식물 세포 또는 식물에 제공되고, 이때 상기 키메라 DNA 분자가 하기 작동가능하게 연결된 DNA 단편을 포함하는, 방법:a) 발현가능한 식물 프로모터;b) i) XylT 단백질 코딩 DNA 단편의 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열 또는 이의 상보체를 포함하는 제1 센스 DNA 영역, 및ii) 상기 제1 센스 DNA 영역의 상보체와 95% 이상의 서열 동일성을 갖는 19개 이상의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 제2 안티센스 DNA 영역을 포함하는 전사가능한 DNA 영역으로서, 이때 상기 제1 센스 DNA 영역에서 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하고, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자가 적어도 상기 제1 센스 DNA 영역으로부터 전사된 RNA 영역과 상기 제2 안티센스 DNA 영역으로부터 전사된 RNA 영역 사이에서 이중 가닥 RNA 영역을 형성할 수 있는, 전사가능한 DNA 영역; 및c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
- 제1항 내지 제26항 중 어느 한 항에 있어서,단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 상기 니코티아나 식물을 또 다른 니코티아나 식물과 교배하여 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 자손 식물을 수득하는 단계를 추가로 포함하는 방법.
- a) 니코티아나 종 또는 재배종으로부터 수득될 수 있는 게놈 DNA 또는 cDNA를 제공하는 단계;b) i) 프로브로서 사용되는, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편,ii) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열을 포함하는 DNA 단편,iii) 프로브로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 1513개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,iv) 프로브로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,v) 프로브로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 3574개의 연속 뉴클레오티드로 구성된 뉴클레오티드 서열을 포함하는 DNA 단편 또는 올리고뉴클레오티드,vi) PCR 반응에서 프라이머로서 사용되는, 서열번호 4 또는 6의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열,vii) PCR 반응에서 프라이머로서 사용되는, 서열번호 8, 10, 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열,viii) PCR 반응에서 프라이머로서 사용되는, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열로부터 선택된 20 내지 200개의 연속 뉴클레오티드를 포함하는 뉴클레오티드 서열을 가진 올리고뉴클레오티드 서열, 및ix) PCR 반응에서 프라이머로서 사용되는, 서열번호 1, 2, 15, 16, 19 또는 20의 뉴클레오티드 서열을 가진 올리고뉴클레오티드로 구성된 군으로부터 수단을 선택하는 단계; 및c) 상기 게놈 DNA 또는 상기 cDNA 및 상기 프라이머를 사용한 PCR을 수행하거나, 상기 게놈 DNA 또는 상기 cDNA 및 상기 프로브를 사용한 혼성화를 수행하여 상기 니코티아나 종 또는 재배종으로부터 XylT DNA 단편을 확인하는 단계를 포함하는 니코티아나 XylT DNA 단편을 확인하는 방법.
- a) 제28항의 방법에 따라 니코티아나 XylT DNA 단편을 확인하는 단계; 및b) 상기 니코티아나 XylT DNA 단편을 단리하는 단계를 포함하는, 니코티아나 XylT DNA 단편을 단리하는 방법.
- (a) 니코티아나 종 또는 재배종의 상이한 식물 계통의 집단, 경우에 따라 돌연변이된 집단을 제공하는 단계;(b) 제28항의 방법에 따라 니코티아나 XylT 대립유전자를 상기 집단의 각 식물 계통에서 확인하는 단계;(c) 상기 집단의 각 식물 계통의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 분석하고, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 다른 식물 계통보다 낮은 식물 계통을 확인하는 단계; 및(d) 식물 계통 내에서의 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준을 특정한 니코티아나 XylT 대립유전자의 존재와 상호관련시키는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 니코티아나 XylT 대립유전자를 확인하는 방법.
- a) 제30항의 방법에 따라 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 니코티아나 XylT 대립유전자를 확인하는 단계; 및b) 상기 니코티아나 XylT 대립유전자를 선택된 니코티아나 식물 계통 내로 도입하는 단계를 포함하는, 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준이 낮은 니코티아나 식물 세포 또는 식물을 수득하는 방법.
- 서열번호 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 벤싸미아나-특이적 XylT 아미노산을 코딩하는 상기 단편의 임의의 부분.
- 제32항에 있어서,서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드를 포함하는 상기 단편의 임의의 부분.
- 서열번호 4, 6, 8 또는 10의 아미노산 서열을 포함하는 단백질을 코딩하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산을 코딩하는 상기 단편의 임의의 부분.
- 제34항에 있어서,서열번호 3, 5, 7, 9 또는 17의 뉴클레오티드 서열을 포함하는 단리된 DNA 단편, 또는 하나 이상의 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 뉴클레오티드를 포함하는 상기 단편의 임의의 부분.
- 하나 이상의 니코티아나 종-특이적 또는 니코티아나 재배종-특이적 XylT 아미노산을 코딩하는, 제28항의 방법에 의해 수득될 수 있는 단리된 DNA 단편.
- 제36항에 있어서,하나 이상의 니코티아나 종-특이적 또는 니코티아나 재배종-특이적 XylT 뉴클레오티드를 포함하는 단리된 DNA 단편.
- 하기 작동가능하게 연결된 DNA 단편을 포함하는 키메라 유전자:a) 발현가능한 식물 프로모터;b) (i) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 뉴클레오티드 또는 이의 상보체를 포함하는 제1 DNA 영역, 및(ii) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 뉴클레오티드 또는 이의 상보체를 포함하는 제2 DNA 영역을 포함하는 전사가능한 DNA 영역으로서, 이때 상기 제1 DNA 영역에서 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하고, 상기 제2 DNA 영역에서 상기 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함함으로써, 상기 전사가능한 DNA 영역으로부터 전사된 RNA 분자가 적어도 상기 제1 DNA 영역에 상응하는 RNA 영역과 상기 제2 DNA 영역에 상응하는 RNA 영역 사이에서의 염기-짝짓기를 통해 이중 가닥 RNA 영역을 형성할 수 있는, 전사가능한 DNA 영역; 및c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
- 하기 작동가능하게 연결된 DNA 단편을 포함하는 키메라 유전자:a) 발현가능한 식물 프로모터;b) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역으로서, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 센스 방향으로 포함하는, DNA 영역; 및c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
- 하기 작동가능하게 연결된 DNA 단편을 포함하는 키메라 유전자:a) 발현가능한 식물 프로모터;b) 니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열로부터 선택된 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드 또는 이의 상보체를 포함하는 DNA 영역으로서, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하거나, 니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열로부터 선택되거나, 또는 이의 상보체이고, 이때 상기 20개의 연속 뉴클레오티드 중 19개의 연속 뉴클레오티드가 하나 이상의 니코티아나 종-특이적 XylT 뉴클레오티드를 안티센스 방향으로 포함하는, DNA 영역; 및c) 식물에서 기능하는 전사 종결 및 폴리아데닐화 신호를 포함하는 DNA 영역.
- 제38항 내지 제40항 중 어느 한 항에 있어서,니코티아나 종-특이적 XylT 아미노산이 니코티아나 벤싸미아나-특이적 XylT 아미노산인, 키메라 유전자.
- 제38항 내지 제41항 중 어느 한 항에 있어서,니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 12 또는 14의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 키메라 유전자.
- 제38항 내지 제42항 중 어느 한 항에 있어서,니코티아나 종-특이적 XylT 뉴클레오티드가 니코티아나 벤싸미아나-특이적 XylT 뉴클레오티드인, 키메라 유전자.
- 제38항 내지 제43항 중 어느 한 항에 있어서,니코티아나 XylT 유전자의 뉴클레오티드 서열이 서열번호 11, 13 또는 21의 뉴클레오티드 서열을 포함하는, 키메라 유전자.
- 제38항 내지 제40항 중 어느 한 항에 있어서,니코티아나 재배종-특이적 XylT 아미노산이 니코티아나 타바큠 재배종 페타이트 하바나 SR1-특이적 XylT 아미노산인, 키메라 유전자.
- 제38항 내지 제40항 및 제45항 중 어느 한 항에 있어서,니코티아나 XylT 단백질을 코딩하는 뉴클레오티드 서열이 서열번호 4, 6, 8 또는 10의 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는, 키메라 유전자.
- 제38항 내지 제40항, 제45항 및 제46항 중 어느 한 항에 있어서,니코티아나 재배종-특이적 XylT 뉴클레오티드가 니코티아나 타바큠 재배종 페타이 트 하바나 SR1-특이적 XylT 뉴클레오티드인, 키메라 유전자.
- 제38항 내지 제40항 및 제45항 내지 제47항 중 어느 한 항에 있어서,니코티아나 XylT 유전자 또는 니코티아나 XylT cDNA의 뉴클레오티드 서열이 서열번호 3, 5, 8, 10 또는 17의 뉴클레오티드 서열을 포함하는, 키메라 유전자.
- 제38항 내지 제48항 중 어느 한 항의 키메라 유전자를 포함하는 니코티아나 식물 세포.
- 제49항의 니코티아나 식물 세포로 본질적으로 구성된 니코티아나 식물.
- 제31항의 방법에 의해 수득된 니코티아나 식물 세포 또는 식물.
- 제50항 또는 제51항에 따른 니코티아나 식물의 종자.
- 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 감소시키기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용 도.
- 니코티아나 식물에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 수준을 감소시키기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 20개의 연속 뉴클레오티드 중 19개 이상의 연속 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
- 니코티아나 종 또는 재배종에서 XylT 유전자 또는 XylT cDNA를 확인하기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
- 니코티아나 종 또는 재배종에서 XylT 유전자 또는 XylT cDNA를 확인하기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
- 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 확인하기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
- 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 확인하기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
- 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 도입하기 위한, 서열번호 4, 6, 8, 10, 12 또는 14의 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 아미노산을 코딩하는 상기 뉴클레오티드 서열의 임의의 부분의 용도.
- 니코티아나 종 또는 재배종에서 단백질-결합 N-글리칸 상의 베타-1,2-크실로스 잔기의 낮은 수준과 상호관련되어 있는 XylT 대립유전자를 도입하기 위한, 서열번호 3, 5, 7, 9, 11, 13, 17 또는 21의 뉴클레오티드 서열, 또는 하나 이상의 니코티아나 종-특이적 또는 재배종-특이적 XylT 뉴클레오티드를 포함하는 상기 뉴클레오티 드 서열의 임의의 부분의 용도.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP06075714.3 | 2006-03-23 | ||
EP06075714 | 2006-03-23 | ||
US78755106P | 2006-03-30 | 2006-03-30 | |
US60/787,551 | 2006-03-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20090007354A true KR20090007354A (ko) | 2009-01-16 |
Family
ID=40538775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087025826A KR20090007354A (ko) | 2006-03-23 | 2007-03-15 | 니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20100287657A1 (ko) |
EP (1) | EP2002008A1 (ko) |
JP (1) | JP2009529898A (ko) |
KR (1) | KR20090007354A (ko) |
CN (1) | CN101405395A (ko) |
AU (1) | AU2007229061A1 (ko) |
BR (1) | BRPI0709202A2 (ko) |
CA (1) | CA2646583A1 (ko) |
IL (1) | IL194144A0 (ko) |
MX (1) | MX2008012153A (ko) |
WO (1) | WO2007107296A1 (ko) |
ZA (1) | ZA200807497B (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100154081A1 (en) * | 2007-05-21 | 2010-06-17 | Bayer Bioscience N.V. | Methods and means for producing glycoproteins with altered glycosylation pattern in higher plants |
EP2205728A1 (en) * | 2007-10-31 | 2010-07-14 | Bayer BioScience N.V. | Method to produce modified plants with altered n-glycosylation pattern |
CA2765287C (en) * | 2009-06-15 | 2018-12-11 | Bayer Bioscience N.V. | Nicotiana benthamiana plants deficient in xylosyltransferase activity |
WO2011117249A1 (en) * | 2010-03-22 | 2011-09-29 | Philip Morris Products S.A. | Modifying enzyme activity in plants |
EP2551348B1 (en) | 2011-07-29 | 2014-09-24 | Icon Genetics GmbH | Production of galactosylated N-glycans in plants |
JP6104252B2 (ja) | 2011-10-04 | 2017-03-29 | アイコン・ジェネティクス・ゲーエムベーハー | フコシルトランスフェラーゼ活性が欠損したニコチアナ・ベンサミアナ植物 |
CN103954701B (zh) * | 2014-04-15 | 2015-12-09 | 华南农业大学 | 利用HPLC检测木聚糖合成中β-1,4-木糖转移酶活性的方法 |
CN103952414A (zh) * | 2014-05-22 | 2014-07-30 | 中南民族大学 | 一种烟草糖基转移酶诱导型启动子及其应用 |
EP3548612A4 (en) | 2016-12-01 | 2020-04-15 | Plantform Corporation | TRANSGENIC PLANT WITH REDUCED FUCOSYL TRANSFERASE AND XYLOSYL TRANSFERASE ACTIVITY |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AT409381B (de) * | 2000-03-03 | 2002-07-25 | Gloessl Josef Dr | Xylosyltransferase-gen |
WO2005047300A2 (en) * | 2003-11-10 | 2005-05-26 | University Of Utah Research Foundation | Improved methods and compositions for rna interference |
US20050166289A1 (en) * | 2003-12-01 | 2005-07-28 | North Carolina State University | Small interfering RNA (siRNA)-mediated heritable gene manipulation in plants |
-
2007
- 2007-03-15 EP EP07723304A patent/EP2002008A1/en not_active Ceased
- 2007-03-15 AU AU2007229061A patent/AU2007229061A1/en not_active Abandoned
- 2007-03-15 ZA ZA200807497A patent/ZA200807497B/xx unknown
- 2007-03-15 KR KR1020087025826A patent/KR20090007354A/ko not_active Application Discontinuation
- 2007-03-15 CA CA002646583A patent/CA2646583A1/en not_active Abandoned
- 2007-03-15 US US12/293,761 patent/US20100287657A1/en not_active Abandoned
- 2007-03-15 MX MX2008012153A patent/MX2008012153A/es active IP Right Grant
- 2007-03-15 WO PCT/EP2007/002322 patent/WO2007107296A1/en active Application Filing
- 2007-03-15 BR BRPI0709202-4A patent/BRPI0709202A2/pt not_active IP Right Cessation
- 2007-03-15 JP JP2009500746A patent/JP2009529898A/ja active Pending
- 2007-03-15 CN CNA2007800099585A patent/CN101405395A/zh active Pending
-
2008
- 2008-09-16 IL IL194144A patent/IL194144A0/en unknown
Also Published As
Publication number | Publication date |
---|---|
MX2008012153A (es) | 2008-10-03 |
IL194144A0 (en) | 2011-08-01 |
BRPI0709202A2 (pt) | 2011-06-28 |
AU2007229061A1 (en) | 2007-09-27 |
CN101405395A (zh) | 2009-04-08 |
US20100287657A1 (en) | 2010-11-11 |
JP2009529898A (ja) | 2009-08-27 |
CA2646583A1 (en) | 2007-09-27 |
ZA200807497B (en) | 2009-12-30 |
WO2007107296A1 (en) | 2007-09-27 |
EP2002008A1 (en) | 2008-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20090007354A (ko) | 니코티아나 베타-1,2-크실로실트랜스퍼레이즈를 코딩하는 신규 뉴클레오티드 서열 | |
DK2535418T3 (en) | Mammalian TYPE glycosylation I PLANTS BY EXPRESSION OF NON-mammalian glycosyltransferases | |
KR102012993B1 (ko) | 니코티아나 타바쿰으로부터의 이소프로필말레이트 합성효소 및 그의 방법 및 용도 | |
CA2997344C (en) | Nucleic acid encoding n-methylputrescine oxidase and uses thereof | |
US20100242128A1 (en) | Method to produce modified plants with altered n-glycosylation pattern | |
JP2017131225A (ja) | 植物由来アルファ−マンノシダーゼ及びそれを使用する方法 | |
AU2013203379B2 (en) | Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |