KR102442802B1 - 식물 내 니코틴의 노르니코틴으로의 변환 감소 - Google Patents

식물 내 니코틴의 노르니코틴으로의 변환 감소 Download PDF

Info

Publication number
KR102442802B1
KR102442802B1 KR1020167031693A KR20167031693A KR102442802B1 KR 102442802 B1 KR102442802 B1 KR 102442802B1 KR 1020167031693 A KR1020167031693 A KR 1020167031693A KR 20167031693 A KR20167031693 A KR 20167031693A KR 102442802 B1 KR102442802 B1 KR 102442802B1
Authority
KR
South Korea
Prior art keywords
seq
plant
nicotine demethylase
mutations
mutation
Prior art date
Application number
KR1020167031693A
Other languages
English (en)
Other versions
KR20170002444A (ko
Inventor
베르나 리즈슐츠렛
시몬 고엡퍼트
루시엔 보벳
니콜라스 시에로
Original Assignee
필립모리스 프로덕츠 에스.에이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 필립모리스 프로덕츠 에스.에이. filed Critical 필립모리스 프로덕츠 에스.에이.
Publication of KR20170002444A publication Critical patent/KR20170002444A/ko
Application granted granted Critical
Publication of KR102442802B1 publication Critical patent/KR102442802B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/13Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Virology (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Manufacture Of Tobacco Products (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

본 발명은 돌연변이(mutant), 비-자연 발생 또는 유전자전환(transgenic) 담배 식물 세포에 관한 것으로, (i) 기능성 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되며 서열번호 2와 적어도 95% 서열 동일성을 가지는 폴리뉴클레오티드; (ii) (i)에 기재된 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; (iii) 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되며 서열번호 3과 적어도 95% 서열 동일성을 가지는 폴리펩티드; 또는 (iv) (i)에 기재된 단리된 폴리뉴클레오티드를 포함하는 구성체, 벡터 또는 발현 벡터를 포함하고, 여기서 상기 니코틴 탈메틸효소의 발현 또는 활성은 상기 니코틴 탈메틸효소의 발현 또는 활성이 감소되지 않은 대조군 담배 식물 세포에 비해 감소된다.

Description

식물 내 니코틴의 노르니코틴으로의 변환 감소{REDUCTION OF NICOTINE TO NORNICOTINE CONVERSION IN PLANTS}
본 발명은 니코티아나 속 유래 니코틴 N-탈메틸효소(NND3)의 신규한 변이체의 폴리뉴클레오티드 서열과 그의 변이체, 상동체 및 단편을 개시하고 있다. 폴리펩티드 서열과 그의 변이체, 상동체 및 단편 또한 개시하고 있다. 이 유전자의 발현 또는 그에 의해 암호화된 단백질의 활성을 변형함으로써, 식물 세포 또는 식물 내에서 하나 이상의 담배 특이 니트로사민(tobacco specific nitrosamine; TSNA)의 수준을 조절하는 것 또한 개시되어 있다.
담배 특이 니트로사민(TSNA)은 담뱃잎의 건조(curing) 및 가공 동안에 주로 형성된다. 담배 건조는 담배의 각 종류의 향과 맛을 유발하는 물리적, 생화학적 변화의 과정이다. 건조된 담뱃잎 내의 TSNA 양은 아질산염의 축적에 따라 달라지는 것으로 여겨지는데, 식물 세포의 사멸 동안에 축적하고 혐기성(산소 결핍) 환경에 접근하는 조건에서 질산염의 환원에 의해 건조 동안에 형성된다. 질산염의 아질산염으로의 환원은 혐기성 조건에서 잎 표면에 있는 세균의 작용에 의해 발생하는 것으로 여겨지며, 이러한 환원은 특히 소정의 조건에서 두드러진다. 아질산염이 형성되면, 이 화합물은 피리딘-함유 화합물을 포함해서, 다양한 담배 알칼로이드와 결합해서 니트로사민을 형성하는 것으로 여겨지고 있다.
일반적으로 최고 농도로 존재하는 것으로 알려져 있는, 네 가지 주요 TSNA는, N-니트로소니코틴(NNN), 4-(메틸니트로사미노)-1-(3-피리딜)-1-부타논 (NNK), N-니트로소아나바신(NAB) 및 N-니트로소아나타빈(NAT)이다. 소수 화합물, 즉 일반적으로 주요 TSNA보다 현저히 낮은 수준으로 발견되는 것들은, 4-(메틸니트로사미노) 4-(3-피리딜) 부타날(NNA), 4-(메틸니트로사미노)-1-(3-피리딜)-1-부타놀(NNAL), 4-(메틸니트로사미노)4-(3-피리딜)-1-부타놀 (아이소-NNAL), 및 4-(메틸니트로사미노)-4-(3-피리딜)-1-부티르산 (아이소-NNAC)이다. 적어도 NNN과 NNK는 동물에 적용될 때 발암 물질인 것으로 실험실 연구에서 보고되고 있다.
NNN 형성의 주요 생화학적 메커니즘은 효소 니코틴 N-탈메틸효소에 의한 니코틴의 N-탈메틸화를 통해 생성된 알카로이드인, 노르니코틴의 N-니트로소화이다. 일반적으로 노르니코틴은 재배된 담배 내의 총 알카로이드 함량의 <5%을 나타내지만, 노르니코틴 수준은 니코틴을 자신의 주요 알카로이드로서 축적하는 식물이 잎 니코틴의 큰 부분(95% 만큼 높음)을 노르니코틴으로 대사하는 자손을 발생시키는 "변환"이라고 부르는 메커니즘에 의해 현저히 증가할 수 있다. 유전적으로 변환된 개체에서 ("컨버터"라고 지칭함), 니코틴의 노르니코틴으로의 N-탈메틸화는 주로 노화(senescence) 및 건조(curing) 동안 발생한다. NNN의 전구체로서의 그것의 잘 특징지어진 역할과, 또한 노르니코틴이 그 자체로 원치 않는 건강에 미치는 영향에 대한 책임이 있을 수도 있기 때문에 낮은 노르니코틴 수준을 유지하는 것이 바람직하다. Dickerson 및 Janda (2002) Proc. Natl. Acad. Sci. USA 99, 15084-15088에서는 노르니코틴이 단백질의 비정상적인 당화를 유도할 수 있음을 입증하였고 흡연자의 혈장 내에서의 변형된 단백질의 축적 증가를 보여주었다. 또한, 동일한 보고서에서는 노르니코틴이, 이 약물들의 효능과 독성을 모두 잠재적으로 변경시키는, 프레드니손(prednisone)과 같은 통용되는 스테로이드 약물과 공유 반응할 수 있다는 증거를 제공했다. WO98/58555는 TSNA을 감소시키기 위해 전자레인지에 의해 열풍 건조(flue-curing)하기 이전 또는 도중에 담배의 처리에 대해 기재하고 있다. US 5,810,020은 담배 재료를 트래핑 싱크(trapping sink)와 접촉시켜서 담배로부터 TSNA을 제거하는 공정을 설명하는데, 여기서 상기 트래핑 싱크는 용이하게 니트로스화되어서 거의 동력학적 또는 열역학적으로 방해하지 않고 니트로실 복합체를 형성하는 선택 전이 금속 복합체를 포함한다. US 6,202,649는 담뱃잎의 근방 주위에 혐기성 조건을 실질적으로 저해하기에 충분한 기류를 갖는 제어된 환경에서 담배를 건조시켜서, 다른 것들 중에서 TSNA의 형성을 실질적으로 저해하는 방법을 설명하고 있다. 제어된 환경은 예컨대 기류, 습도, 및 온도와 같은 하나 이상의 건조 매개변수를 조절하여 제공된다. 그러나, 이들과 같은 방법은 담배 제조에 상당한 비용과 시간을 부가할 수 있으며, 이에 따라 담배 산업에 의해 받아들여지기 어렵게 된다. 따라서, TSNA를 감소시키기 위한 효과적이고 비교적 저렴한 방법에 대한 필요성이 남아 있다.
식물 내의 TSNA의 수준을 감소시키기 위한 분자 기반 방법이 매우 바람직한데, TSNA의 감소된 수준을 달성하기 위해, 비싸고 종종 복잡한 방법을 필요로 하지 않기 때문이다. 이러한 분자 기반 접근 방식 중 하나가 WO2011/088180에 개시되어 있다. 담배 식물의 뿌리에서 니코틴의 노르니코틴으로의 대사 변환에 관여하는 뿌리-특이적 니코틴 탈메틸효소 폴리펩티드(CYP82E10)의 발현 또는 기능을 억제하기 위한 조성물 및 방법이 WO2011/088180에 개시되어 있다. 니코틴 탈메틸효소는 시토크롬 P450 모노옥시게나제 (CYP)의 군에 속한다. 니코틴의 노르니코틴으로의 변환에 참여하고 WO2006091194, WO2008070274 및 WO2009064771에 설명되어 있는 CYP82E4CYP82E5를 비롯한 기타 니코틴 탈메틸효소 유전자들이 설명되고 있다. CYP82E4, CYP82E5CYP82E10의 녹아웃은 니코틴의 노르니코틴으로의 변환을 벌리종 담배에서 3.2% 아래에서 1.1%로 감소시킬 수 있다(WO 2011088180 A1 참조).
담배 식물에서 노르니코틴의 수준을 더 감소시켜서 건조 동안 형성되는 노르니코틴의 대사성의 수준을 더 줄이는 것이 본 기술 분야에서 지속적인 필요가 있다 (예를 들어, TSNAs - 예컨대 NNN). 본 발명은 이러한 요구를 해결하고자 한다.
발명의 내용
본 발명자들은 니코티아나 타바쿰에서 니코틴 N-탈메틸효소 (NND) 계열에 속하는 추가 유전자를 확인하였으며, 여기에서 NND3으로서 지칭된다. 비록 NND3의 폴리펩티드 서열은 CYP82E4의 공지된 폴리펩티드 서열과 94% 서열 동일성 및 CYP82E5 및 CYP82E10의 공지된 폴리펩티드 서열과 91% 서열 동일성을 보여주지만, N. 타바쿰 에서 NND3의 발현 프로파일은 CYP82E4, CYP82E5 및 CYP82E10에 비해 놀랍게도 상이하다. 도 1에 나타낸 바와 같이, CYP82E4, CYP82E5, CYP82E10 및 NND3 각각이 꽃과 뿌리에서 발현을 보여주는 동안 NND3은 잎에서 검출가능한 수준으로 발현되지 않는 반면, CYP82E4은 노화 잎에서만 발현을 보여주고 CYP82E5 및 CYP82E10는 테스트된 모든 잎 종류에서 발현을 보여준다. NND3의 폴리뉴클레오티드 코딩 서열은 기능성 니코틴 N-탈메틸효소를 암호화한다. 상기 유전자는 서열번호 1에 기재되어 있고 폴리뉴클레오티드 코딩 서열은 서열번호 2에 기재되어 있다. 폴리펩티드 서열은 서열번호 3에 기재되어 있다. 담배 식물에서 이 유전자의 발현을 감소시킴으로써 니코틴의 노르니코틴으로의 변환 감소를 알 수도 있다. 이는 노르니코틴의 수준과 건조시 형성되는 노르니코틴의 대사산물 - 예컨대 NNN - 감소를 초래할 수 있다. 이는 건조된 담배 재료로부터 연기 내에 NNN의 수준 감소를 초래할 수 있다. 따라서 본 발명은 식물 내의 노르니코틴의 수준 및/또는 TSNA - 예컨대 적어도 NNN의 수준을 조절(예. 감소)하는 데에 유용하다. 구체적으로, 본 발명은 노르니코틴 및/또는 TSNA - 예컨대 NNN의 수준을 감소시킬 수 있는 다른 방법들과 조합할 때 특히 유용할 수도 있다. 이에, 예를 들면, 소정의 구현예들에서 담배 식물 내의 하나 이상의 다른 니코틴 탈메틸효소 유전자와 함께 NND3의 발현을 감소시키는 것이 바람직할 수도 있다. 이 조합은 니코틴의 노르니코틴으로의 변환을 더욱 감소시킬 것으로 예상되며, 이는 건조 동안 및 건조된 재료가 흡연되는 경우 담배에 형성된 대사물질의 수준을 더욱 감소시킬 것이다. 본원에 기재된 담배 식물로부터 유도되는 담배 제품은 담배 제품의 발암 가능성을 감소시키고, 인간의 발암성 니트로사민에 대한 노출을 감소시키기 위한 방법들에서의 용도를 발견할 수도 있다. NND3를 암호화하는 유전자에서의 하나 이상의 돌연변이가 고려되며, 여기서 돌연변이는 NND3의 발현 또는 기능 감소를 초래한다. 담배 식물은 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및/또는 CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및/또는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함할 수 있으며, 여기서 이 유전자들 내에서의 돌연변이들은 CYP82E4 및/또는 CYP82E5 및/또는 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래한다.
본 발명의 측면들 및 구현예들
본 발명의 측면들 및 구현예들이 첨부된 청구범위들에 기재되어 있다.
제1 측면에서, 돌연변이(mutant), 비-자연 발생 또는 유전자전환(transgenic) 담배 식물 세포가 기재되어 있는데, (i) 기능성 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되며 서열번호 3과 적어도 95% 서열 동일성을 가지는 폴리뉴클레오티드; (ii) (i)에 기재된 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; (iii) 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되며 서열번호 3과 적어도 95% 서열 동일성을 가지는 폴리펩티드; 또는 (iv) (i)에 기재된 단리된 폴리뉴클레오티드를 포함하는 구성체, 벡터 또는 발현 벡터를 포함하고, 여기서 상기 니코틴 탈메틸효소의 발현 또는 활성은 상기 니코틴 탈메틸효소의 발현 또는 활성이 감소되지 않은 대조군 담배 식물 세포에 비해 감소된다.
도 1은 서로 다른 식물 조직에서 NND3 및 관련 기능성 CYP82E 유전자들의 상대적 발현 수준을 보여준다. 막대는 세 가지 온실 성장 성숙 N. 타바쿰 var. TN90 식물에서 취한 세 가지 생물학적 복제물의 평균 ± SD를 나타낸다.
도 2는 초저 컨버터 TN90 cyp82e4/cyp82e5/cyp82e10 배경에서 강한 구조 프로모터 하에 NND3 코딩 서열로 형질전환된 개별적인 성숙 T0 식물의 잎에서 측정한 상대적 NND3 발현 (A) 및 니코틴의 노르니코틴으로의 변환 수준 (B)을 보여준다.
도 3은 NND3 및 관련 기능성 CYP82E 유전자들의 N. 타바쿰 var. 스텔라 잎에서 서로 다른 건조 시점에서 상대적 발현 수준을 보여준다. 시료를 몇 개의 잎의 풀(pool)에서 가져온다. 두 풀을 생물학적 복제물로서 분석한다 - (a) 복제물 1 및 (b) 복제물 2. 막대는 세 가지 기술적 복제물의 평균 ± SD를 나타낸다.
한 구현예에서, 담배 식물 세포는 상기 니코틴 탈메틸효소의 발현 또는 활성을 감소시키는 하나 이상의 돌연변이를 포함하고 있다.
한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 담배 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래하며, 바람직하게는, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 12 내지 16 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 변형을 초래하고 서열번호 5의 아미노산 잔기 329, 364, 376, 382, 및 458 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하고, 여기서 상기 돌연변이는 a) 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; b) 서열번호 5의 위치 364에서 라이신 잔기에 대한 아스파라긴 치환; c) 서열번호 5의 위치 376에서 발린 잔기에 대한 메티오닌 치환; d) 서열번호 5의 위치 382에서 프롤린 잔기에 대한 세린 치환; d) 서열번호 5의 위치 458에서 프롤린 잔기에 대한 세린 치환; 및 e) 이들의 둘 이상의 임의의 조합으로 이루어진 군으로부터 선택된다.
한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 담배 식물 세포는 CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래하며, 바람직하게는, 여기서 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 또는 25 또는 이들의 조합으로부터 선택되며, 바람직하게는, 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 변형을 초래하고 서열번호 17의 아미노산 잔기 422 또는 449 또는 이들의 조합에서 발생하고, 바람직하게는, 여기서 상기 돌연변이는 a) 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈; b) 서열번호 17의 위치 449에서 프롤린 잔기에 대해 치환된 류신; 및 c) 이들의 조합으로 이루어진 군으로부터 선택된다.
한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 담배 식물 세포는 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래하며, 바람직하게는, 여기서 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 내지 35 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 변형을 초래하고 서열번호 26의 아미노산 잔기 79, 107, 382, 419 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하고, 여기서 상기 돌연변이는 a) 서열번호 26의 위치 79에서 글리신 잔기에 대한 세린 치환 ; b) 서열번호 26의 위치 107에서 프롤린 잔기에 대한 세린 치환 ; c) 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환 ; d) 서열번호 26의 위치 419에서 프롤린 잔기에 대한 세린 치환 ; e) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 담배 식물 세포는 (i) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래하며, 바람직하게는, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 12 내지 16 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 변형을 초래하고 서열번호 5의 아미노산 잔기 329, 364, 376, 382, 및 458 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하고, 여기서 상기 돌연변이는 a) 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; b) 서열번호 5의 위치 364에서 라이신 잔기에 대한 아스파라긴 치환; c) 서열번호 5의 위치 376에서 발린 잔기에 대한 메티오닌 치환; d) 서열번호 5의 위치 382에서 프롤린 잔기에 대한 세린 치환; d) 서열번호 5의 위치 458에서 프롤린 잔기에 대한 세린 치환; 및 e) 이들의 둘 이상의 임의의 조합으로 이루어진 군으로부터 선택되고, (ii) CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래하며, 바람직하게는, 여기서 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 또는 25 또는 이들의 조합으로부터 선택되며, 바람직하게는, 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 변형을 초래하고 서열번호 17의 아미노산 잔기 422 또는 449 또는 이들의 조합에서 발생하고, 바람직하게는, 여기서 상기 돌연변이는 a) 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈; b) 서열번호 17의 위치 449에서 프롤린 잔기에 대해 치환된 류신; 및 c) 이들의 조합으로 이루어진 군으로부터 선택되고; 그리고 (iii) CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래하며, 바람직하게는, 여기서 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 내지 35 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 변형을 초래하고 서열번호 26의 아미노산 잔기 79, 107, 382, 419 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하고, 여기서 상기 돌연변이는 a) 서열번호 26의 위치 79에서 글리신 잔기에 대한 세린 치환 ; b) 서열번호 26의 위치 107에서 프롤린 잔기에 대한 세린 치환 ; c) 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환 ; d) 서열번호 26의 위치 419에서 프롤린 잔기에 대한 세린 치환 ; e) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 담배 식물 세포는 (i) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함하고, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 33 (G79S)에 기재된 서열을 포함하고; 또는 (ii) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함하고, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 34 (P107S)에 기재된 서열을 포함하고; 또는 (iii) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함하고, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 35 (P382S)에 기재된 서열을 포함하고; 또는 (iv) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고 있으며, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함하고, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 (P419S)에 기재된 서열을 포함하고 있다.
한 구현예에서, 상기 돌연변이(들)은 동형접합 돌연변이이다.
한 구현예에서, 상기 식물 세포 또는 상기 식물 세포를 포함하는 식물은 약 1.0% 미만, 약 0.9% 미만, 약 0.8% 미만, 약 0.7% 미만, 약 0.6% 미만, 약 0.5% 미만, 약 0.4% 미만, 약 0.3% 미만, 약 0.2% 미만 또는 약 0.1% 미만의 니코틴의 노르니코틴으로의 변환을 가진다. 상기 변환 %는 식 [노르니코틴%/(노르니코틴% + 니코틴%)] x 100을 이용해서 산출된다.
한 구현예에서, 상기 식물 세포 또는 상기 식물 세포를 포함하는 식물은 건조 중량을 기준으로 산출한, 약 0.04% 미만, 약 0.03% 미만, 약 0.02% 미만 또는 약 0.01% 미만의 노르니코틴을 가진다.
추가 측면에서, 본원에 기재된 식물 세포를 포함하는 돌연변이, 비-자연 발생 또는 유전자전환 식물이 기재되어 있다.
추가 측면에서, 본원에 기재된 식물로부터의 바이오매스, 종자, 줄기 또는 잎을 포함하는 식물 재료가 기재되어 있다. 적절하게는, NND3는 식물 재료의 꽃(예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 발현된다. 적절하게는, NND3는 식물 재료의 꽃(예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 독점적으로 또는 특이적으로 발현된다.
추가 측면에서, 본원에 기재된 식물 세포, 식물 또는 식물 재료를 포함하는 담배 제품이 기재되어 있다.
추가 측면에서, 노르니코틴 및/또는 NNN의 수준이 감소된 담배 식물을 제조하기 위한 방법이 기재되어 있으며, 상기 방법은, (a) (i) (기능성) 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되며 서열번호 2와 적어도 95% 서열 동일성을 가지는 폴리뉴클레오티드를 포함하는 식물을 제공하는 단계; (b) 하나 이상의 돌연변이를 상기 담배 식물의 상기 폴리뉴클레오티드 내로 삽입해서 돌연변이 담배 식물을 생성하는 단계; (c) 선택적으로 상기 담배 식물 재료를 건조시키는 단계; 그리고 (d) 상기 돌연변이 담배 식물 내에서의 노르니코틴 및/또는 NNN의 수준을 측정하는 단계를 포함하고, 여기서 대조군 담배 식물에 비해 상기 돌연변이 담배 식물 내에서의 노르니코틴 및/또는 NNN의 수준의 감소는 상기 돌연변이 담배 식물 내에서의 노르니코틴 및/또는 NNN의 수준이 감소된 것을 표시한다. 본원에 기재된 서열의 단편의 용도가 또한 고려된다. 예를 들어, 단편들이 RNAi 구성체로서 사용되어서 발현을 조정할 수 있다.
한 구현예에서, (b) 단계에서 담배 식물은 돌연변이 담배 식물이며, 바람직하게는, 여기서 상기 돌연변이 담배 식물은 하나 이상의 추가 니코틴 N-탈메틸효소 유전자에서 하나 이상의 돌연변이를 포함하고 있다.
한 구현예에서, 상기 돌연변이 담배 식물은 CYP82E4, CYP82E5 또는 CYP82E10 또는 이들의 둘 이상의 조합의 군으로 이루어진 유전자들에서 하나 이상의 추가 돌연변이를 가지고 있다.
한 구현예에서, (b) 단계에서 담배 식물은 대조군 담배 식물에 비해 노르니코틴의 수준이 감소된 돌연변이 담배 식물이다.
한 구현예에서, 상기 담배 식물은 CYP82E4, CYP82E5 또는 CYP82E10 또는 이들의 둘 이상의 조합에서 하나 이상의 돌연변이를 가지고 있다.
추가 측면에서, 낮은 노르니코틴 및/또는 NNN의 수준과 연관이 있는 담배 식물에서 하나 이상의 돌연변이를 식별하기 위한 방법이 기재되어 있으며, 상기 방법은, (a) 대조군 담배 식물에 비해 낮은 노르니코틴 및/또는 NNN의 수준을 갖는 담배 식물을 식별하는 단계; (b) (a) 단계에서 식별된 담배 식물로부터 핵산 시료를 제공하는 단계; (c) 상기 대조군 식물에 존재하지 않는 서열번호 2의 서열에서의 하나 이상의 돌연변이의 존재에 대해 (b) 단계로부터의 핵산 시료를 스크리닝하는 단계; (d) 선택적으로 (c) 단계에서 식별된 하나 이상의 돌연변이를 담배 식물에서 상기 노르니코틴 및/또는 NNN의 수준을 감소시키는 공지된 돌연변이와 비교하는 단계; 그리고 (e) 낮은 노르니코틴 및/또는 NNN의 수준과 연관이 있는 그 하나 이상의 돌연변이를 식별하는 단계를 포함하고 있다.
추가 측면에서 감소된 노르니코틴 및/또는 적어도 NNN의 수준을 가지는, 건조된 식물 재료, 바람직하게는 건조된 잎을 생산하기 위한 방법이 기재되어 있으며, (a) 본원에 기재된 식물의 적어도 일부 또는 식물 재료를 제공하는 단계; (b) 선택적으로 상기 식물로부터 식물 재료를 수확하는 단계; 그리고 (c) 노르니코틴 및/또는 적어도 NNN의 수준이 감소하기에 충분한 시간 동안 상기 식물 재료를 건조시키는 단계를 포함하고 있다.
추가 측면에서 NND3 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, 및 CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 포함하는 담배 식물이 기재되어 있고, 선택적으로 여기서 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 서열번호 26의 위치 382에서 돌연변이를 포함하고, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 5의 위치 329에서 돌연변이를 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 17의 위치 422에서 돌연변이를 포함하고, 바람직하게는, 여기서 상기 돌연변이의 각각은 동형접합 돌연변이이다.
추가 측면에서, 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 니코틴 탈메틸효소 활성을 억제하는 NND3 유전자에서의 하나 이상의 돌연변이, 뿌리 및/또는 잎에서 니코틴 탈메틸효소 활성을 억제하는 CYP82E10 유전자에서의 하나 이상의 돌연변이, 노화 잎에서 니코틴 탈메틸효소 활성을 억제하는 CYP82E4v2 유전자에서의 하나 이상의 돌연변이, 및 뿌리 및/또는 잎에서 니코틴 탈메틸효소 활성을 억제하는 CYP83E5v2 유전자에서의 하나 이상의 돌연변이를 포함하는 담배 식물이 기재되어 있다.
추가 측면에서 NND3 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되고 서열번호 2의 서열, 또는 서열번호 2와 적어도 95% 서열 동일성을 가지는 단리된 폴리뉴클레오티드가 기재되어 있으며, 바람직하게는 여기서 상기 단리된 폴리뉴클레오티드는 합성 폴리뉴클레오티드 또는 cDNA이다.
추가 측면에서 본원에 기재된 폴리뉴클레오티드에 의해서 암호화되는 단리된 폴리펩티드가 기재되어 있다.
추가 측면에서 NND3 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되고 서열번호 3의 서열, 또는 서열번호 3과 적어도 95% 서열 동일성을 가지는 단리된 폴리펩티드가 기재되어 있으며, 바람직하게는 여기서 상기 단리된 폴리펩티드는 합성 폴리펩티드이다. 폴리펩티드의 단편은 또한 본원에 기재된 바와 같이 고려된다.
추가 측면에서 본원에 기재된 단리된 폴리뉴클레오티드를 포함하는 구성체, 벡터 또는 발현 벡터가 기재되어 있다.
추가 측면에서 NND3 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이가 기재되어 있으며, 여기서 상기 돌연변이는 상기 NND3 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래한다.
추가 측면에서, 노르니코틴의 수준을 감소시키거나, 또는 니코틴의 노르니코틴으로의 변환율을 감소시키거나, 또는 담배 식물 세포 내 적어도 NNN의 수준을 감소시키기 위한 방법이 기재되어 있으며, (a) (i) 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되며 서열번호 2와 적어도 95% 서열 동일성을 가지는 폴리뉴클레오티드; (ii) (i)에 기재된 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; (iii) 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되고 서열번호 3과 적어도 95% 서열 동일성을 가지는 폴리펩티드의 발현 또는 활성을 감소시키는 단계; (b) (a) 단계에서 수득된 식물 세포 내 적어도 상기 노르니코틴 및/또는 NNN 함량을 측정하는 단계; 그리고 (c) (a)에 기재된 폴리뉴클레오티드 또는 폴리펩티드의 발현 또는 활성이 조절되지 않은 대조군 식물에 비해 적어도 상기 노르니코틴 및/또는 NNN 함량이 변한 식물 세포를 식별하는 단계를 포함한다.
추가 측면에서, 담배 제품의 발암 가능성을 감소시키기 위한 방법이 제공되는데, 상기 방법은 본원에 기재된 담배 식물 또는 그의 후손으로부터 상기 담배 제품을 제조하는 단계를 포함한다.
추가 측면에서, 노르니코틴의 수준을 감소시키거나, 또는 니코틴의 노르니코틴으로의 변환율을 감소시키거나, 또는 담배 식물 세포 내에서 적어도 NNN의 수준을 감소시키는 방법이 제공되어 있으며, 상기 방법은 NND3 니코틴 탈메틸효소 유전자의 적어도 한 개의 대립유전자 내의 하나 이상의 돌연변이를 상기 식물의 유전체 내로 도입하는 단계를 포함하고, 여기서 상기 돌연변이는 상기 니코틴 탈메틸효소 유전자의 발현을 감소시킨다.
한 구현예에서, NND3는 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 발현된다.
한 구현예에서, NND3는 꽃(예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 독점적으로 또는 특이적으로 발현된다.
상기에서 논의한 구현예들 각각은 본 발명의 측면들 각각의 구현예들로서 개시되어 있다. 하나 이상의 구현예들의 조합이 고려된다.
정의
본 출원의 범위 내에서 사용되는 기술적인 용어들 및 표현들은 식물 및 분자 생물학의 관련된 분야에서 통상적으로 적용되는 의미가 일반적으로 주어져야 한다. 모든 이하의 용어 정의는 본 출원의 완전한 내용에 적용된다. 용어 "포함하는(comprising)"은 다른 요소 또는 단계를 배제하지 않고 부정관사 "a" 또는 "an"는 복수를 배제하지 않는다. 단일 단계는 청구항에 인용된 여러 개의 특징의 기능을 충족시킬 수도 있다. 주어진 숫자 값 또는 범위의 문맥에서 용어 "약", "필수적으로" 및 "대략"은 주어진 값 또는 범위의 20% 이내, 10% 이내, 또는 5%, 4%, 3%, 2% 또는 1% 이내의 값 또는 범위를 말하는 것이다.
용어 "단리된(isolated)"은 자연적인 환경으로부터 얻어진 개체를 나타낸 것이지만 이 용어는 어떠한 정제도도 내포하지 않는다.
"발현 벡터"는 핵산의 발현을 가능하게 하기 위한 핵산 성분의 조합을 포함하는 핵산 비히클(vehicle)이다. 적절한 발현 벡터는 원형의, 이중 가닥의 핵산 플라스미드; 선형의 이중가닥의 핵산 플라스미드; 및 임의의 기원의 다른 기능적으로 동등한 발현 벡터와 같은 과잉 염색체 복제가 가능한 에피솜(episome)을 포함한다. 발현 벡터는 이하에서 정의된 바와 같이 핵산, 핵산 구성체 또는 핵산 접합체(conjugate) 상류에 위치하고 작동가능하게 연결되어 있는 프로모터(promoter)를 적어도 포함한다.
용어 "구성체(construct)"는 하나 이상의 폴리뉴클레오티드를 포함하는 이중가닥, 재조합 핵산 단편을 나타낸 것이다. 구성체는 상보적인 "센스 또는 암호화 가닥"으로 염기쌍을 이룬 "주형 가닥(template strand)"을 포함한다. 주어진 구성체는 두 가지 가능한 방향으로 벡터로 삽입될 수 있는데, 즉, 발현 벡터 같은 벡터 내에 위치한 프로모터의 방향과 관련해서 동일한(또는 센스) 방향 또는 역(또는 안티-센스) 방향으로 삽입될 수 있다.
"벡터(vector)"는 핵산, 핵산 구성체 및 핵산 접합체 기타 등등의 수송을 가능하게 하기 위한 핵산 성분들의 조합을 포함하는 핵산 비히클을 나타낸 것이다. 적절한 벡터는 원형의, 이중가닥의 핵산 플라스미드; 선형의 이중가닥의 핵산 플라스미드; 및 임의의 기원의 다른 벡터와 같은 과잉 염색체 복제가 가능한 에피솜을 포함한다.
"프로모터(promoter)"는 전형적으로 이중가닥의 DNA 단편의 상류에 위치하고 작동가능하게 연결되어 있는, 핵산 요소/서열을 나타낸 것이다. 프로모터는 관심 있는 고유한 유전자(native gene)에 근접한 영역으로부터 전체적으로 유도될 수 있거나, 다른 고유한 프로모터 또는 합성 DNA 세그먼트로부터 유도되는 다른 요소로 구성될 수 있다.
용어 "상동성(homology), 동일성(identity) 또는 유사성(similarity)"은 서열 정렬(sequence alignment)에 의해서 비교되는 두 개의 폴리펩티드 사이 또는 두 개의 핵산 분자 사이에서의 서열 유사 정도를 의미한다. 비교되는 두 개의 별개의 핵산 서열 사이의 상동성 정도는 상응하는 위치에서 동일하거나, 일치하는 뉴클레오티드의 수의 함수이다. 동일성 퍼센트는 육안 검사와 산술적 계산에 의해서 결정될 수 있다. 대안적으로, 두 개의 핵산 서열의 동일성 퍼센트는 ClustalW, BLAST, FASTA 또는 Smith-Waterman 같은 컴퓨터 프로그램을 사용하여 서열 정보를 비교하여 결정될 수도 있다.
"변이체"는 실질적으로 유사한 서열을 의미한다. 변이체는 야생형 서열과 유사한 기능 또는 실질적으로 유사한 기능을 가질 수 있다. 니코틴 탈메틸효소의 경우, 유사한 기능은 동일 조건 하에서 니코틴의 노르니코틴으로의 변환의 야생형 효소 기능의 적어도 약 50%, 60%, 70%, 80% 또는 90%이다. 니코틴 탈메틸효소의 경우, 실질적으로 유사한 기능은 동일 조건 하에서 니코틴의 노르니코틴으로의 변환의 야생형 효소 기능의 적어도 약 90%, 95%, 96%, 97%, 98% 또는 99%이다. 예를 들어, 야생형 NND3 코딩 서열은 서열번호 2에 기재되어 있다. 변이체는 야생형 폴리펩티드에 비해 감소된 니코틴 탈메틸효소 활성 수준을 갖는 효소를 초래하는 하나 이상의 유리한 돌연변이를 가질 수 있다. 변이체는 자신의 니코틴 탈메틸효소 활성이 녹아웃되는 결과를 초래하는 하나 이상의 유리한 돌연변이를 가질 수 있다 (즉, 100% 억제, 따라서 비-기능성 폴리펩티드). 예시적인 야생형 CYP82E10의 변이체는 야생형 CYP82E10 폴리펩티드의 니코틴 탈메틸효소 활성의 단지 약 25%를 갖는 효소를 초래하는 유리한 돌연변이를 갖는 CYP82E10 P419S를 포함한다. 변이체 CYP82E10 G79S, CYP82E10 P107S 및 CYP82E10 P382S는 자신들의 니코틴 탈메틸효소 활성이 녹아웃되는 결과를 초래하는 유리한 돌연변이를 가지고 있다 (즉, 100% 억제, 따라서 비-기능성 폴리펩티드). 예시적인 야생형 CYP82E4의 변이체는 야생형 CYP82E4 폴리펩티드의 니코틴 탈메틸효소 활성의 단지 약 50%를 갖는 효소를 초래하는 유리한 돌연변이를 갖는 CYP82E4 V376M를 포함한다. 변이체 CYP82E4 W329Stop, CYP82E4 K364N, CYP82E4 P382S 및 CYP82E4 P458S는 자신들의 니코틴 탈메틸효소 활성이 녹아웃되는 결과를 초래하는 유리한 돌연변이를 가지고 있다 (즉, 100% 억제, 따라서 비-기능성 폴리펩티드). 예시적인 야생형 CYP82E5의 변이체는 자신의 니코틴 탈메틸효소 활성의 억제 결과를 초래하는 유리한 돌연변이를 갖는 CYP82E5 P449L를 포함하고, 변이체 CYP82E5 W22Stop는 자신의 니코틴 탈메틸효소 활성이 녹아웃되는 결과를 초래하는 유리한 돌연변이를 가지고 있다 (즉, 100% 억제, 따라서 비-기능성 폴리펩티드). 이러한 변이체들의 조합이 본원에 개시되어 있다.
용어 "식물"은 수명 주기 또는 발생(development) 중 임의의 단계의 임의의 식물 또는 그 일부, 및 그의 후손을 의미한다. 한 구현예에서, 식물은 "담배 식물"로서, 니코티아나(Nicotiana) 속에 속하는 식물을 의미한다. 바람직한 담배 식물 종들이 본원에서 기재되어 있다.
"식물 부분"은, 식물 세포, 식물 원형질체, 전체 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘러스, 식물 덩어리, 식물 또는 식물의 부분, 예컨대 배아, 화분, 꽃밥, 난자, 씨앗, 잎, 꽃, 줄기, 가지, 열매, 뿌리, 뿌리 끝 등에 무손상되어 있는 식물 세포를 포함한다. 자손, 변이체 및 재생된 식물의 돌연변이는 또한 그들이 본원에 기재된 도입된 폴리뉴클레오티드를 포함하고 있는 경우라면 본 발명의 범위 내에 포함된다.
"식물 세포"는 식물의 구조적 및 생리학적 단위를 의미한다. 식물 세포는 세포벽이 없는 원형질체, 단리된 단일 세포 또는 배양된 세포 형태일 수도 있고, 또는 이들에 한정하는 것은 아니지만 식물 조직, 식물 기관, 또는 전체 식물과 같은 보다 조직화된 단위의 일부분으로서일 수도 있다.
용어 "식물 재료"는 바이오매스, 잎, 줄기, 뿌리, 꽃 또는 꽃 부분, 열매, 꽃가루, 난세포, 접합체(zygote), 종자, 꺾꽂이용 가지, 분비물, 추출물, 세포 또는 조직 배양물, 또는 식물의 임의의 기타 부분 또는 생성물을 포함하는, 식물로부터 수득가능한 임의의 고체, 액체 또는 기체 조성물, 또는 그의 조합을 의미한다. 한 구현예에서, 식물 재료는 바이오매스, 줄기, 종자 또는 잎을 포함하거나, 이로 구성된다. 다른 구현예에서, 식물 재료는 잎을 포함하거나, 이로 구성된다.
용어 "변종(variety)"은 동일한 종의 다른 식물로부터 구분되는 일정한 특징을 공유하는 식물의 집단을 의미한다. 하나 이상의 뚜렷한 특징을 가지면서, 변이체는 이러한 변이체 내의 개체들 사이에서 전체적인 변이가 매우 작은 것을 더욱 특징으로 한다. 변종은 종종 상업적으로 판매되고 있다.
본원에 사용되는 용어 "계통(line)" 또는 "육종 계통(breeding line)"은 식물 육종 동안에 사용되는 식물군을 나타낸다. 계통은 다른 특징에 대해서는 개체들 간에 약간의 변화가 있을 수도 있지만, 관심 있는 하나 이상의 특징에 대해서는 개체들 간에 변화가 거의 없으므로 변이체와 구별될 수 있다.
용어 "조절(modulating)"은 폴리펩티드의 발현 또는 활성을 감소, 억제, 증가 또는 이와 달리 영향을 미치는 것을 의미할 수도 있다. 상기 용어는 또한 이에 한정하는 것은 아니지만, 전사 활성을 조절하는 것을 포함할 수 있는, 폴리펩티드를 인코딩하는 유전자의 활성을 감소, 억제, 증가 또는 이와 달리 영향을 주는 것을 의미할 수도 있다.
본원에서 사용되는 용어 "감소하다" 또는 "감소된"은 이에 한정하는 것은 아니지만, 폴리펩티드 활성, 전사 활성, 및 단백질 발현과 같은 양 또는 활성에 대해, 약 10% 내지 약 99%의 감소, 또는 적어도 10%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 적어도 100% 또는 그 이상의 감소를 의미한다.
본원에서 사용되는 용어 "억제하다" 또는 "억제된"은 이에 한정하는 것은 아니지만, 폴리펩티드 활성, 전사 활성, 및 단백질 발현 같은 양 또는 활성에 대해, 약 98% 내지 약 100%의 감소, 또는 적어도 98%, 적어도 99%, 그러나 특히 100%의 감소를 의미한다.
본원에서 사용되는 용어 "증가하다" 또는 "증가된"은 이에 한정하는 것은 아니지만, 폴리펩티드 활성, 전사 활성, 및 단백질 발현 같은 양 또는 활성에 대해, 약 5% 내지 약 99%의 증가, 또는 적어도 5%, 적어도 10%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 적어도 100% 또는 그 이상의 증가를 의미한다.
대조군 식물의 문맥에서 용어 "대조군(control)"은 효소의 발현 또는 활성이 변형(예를 들어, 증가 또는 감소)되지 않아서 효소의 발현 또는 활성이 변형된 식물과 비교할 수 있는 식물 또는 식물 세포를 의미한다. 대조군 식물은 빈(empty) 벡터를 포함할 수 있다. 대조군 식물은 야생형 식물에 해당할 수 있다. 예를 들어, 대조군 식물 또는 식물 세포는 대상 식물 결과를 초래한 유전자 변형을 위한 출발 물질과 동일한 유전자형일 수 있다. 이러한 경우 모두에서, 대상 식물과 대조군 식물은 비교 목적으로 동일한 프로토콜을 사용하여 배양되고 수확된다. 본원에 기재된 유전자 또는 폴리펩티드의 레벨, 비율, 활성, 또는 분포의 변화, 또는 담배 식물 표현형 변화, 특히 노르니코틴 및 그 발암성 대사산물, NNN의 축적 감소는, 대상 식물을 대조군 식물에 비교하여 측정할 수 있으며, 이때 대상 식물 및 대조군 식물은 동일한 프로토콜을 사용하여 배양 및/또는 수확되었다. 대조군 식물은 대상 식물의 표현형 변화를 측정하기 위한 기준점을 제공할 수 있다. 표현형 변화의 측정은 식물 발생, 노화 도중이나, 건조 후를 포함하여, 식물에서 언제라도 측정될 수 있다. 표현형 변화의 측정은 생장 챔버, 온실 또는 현장에서 생장한 식물로부터를 포함하여, 임의의 조건 하에서 생장한 식물에서 측정할 수 있다. 표현형 변화는 니코틴의 노르니코틴으로의 변환율을 결정하여 측정할 수 있다. 변환은 (총 조직 중량의 백분율로서) 노르니코틴 또는 그 대사산물의 백분율을 (총 조직 중량의 백분율로서) 니코틴과 노르니코틴 또는 그 대사산물의 백분율의 합으로 나누고 100을 곱함으로써 측정될 수 있다. 표현형 변화는 본 기술분야에서 주지된 방법을 이용하여 TSNA 함량- 예컨대 적어도 NNN 함량을 측정하여 측정될 수 있다.
발명의 상세한 설명
한 구현예에서, 서열목록에 보이는 임의의 폴리뉴클레오티드를 포함해서, 본원에 기재된 임의의 서열에 대해 적어도 95%의 서열 동일성을 가지는, 폴리뉴클레오티드 서열을 포함하거나, 이로 구성되거나, 또는 필수적으로 구성되는 단리된 폴리뉴클레오티드가 제공된다. 적절하게는, 단리된 폴리뉴클레오티드는 적어도 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 포함하거나, 이로 구성되거나, 또는 필수적으로 구성된다.
또 다른 구현예에서, 서열번호 2와 적어도 95% 서열 동일성을 가지는 폴리뉴클레오티드 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되는 단리된 폴리뉴클레오티드가 제공된다. 적절하게는, 단리된 폴리뉴클레오티드는 서열번호 2와 적어도 약 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100%의 서열 동일성을 가지는 서열을 포함하거나, 이로 구성되거나, 또는 필수적으로 구성된다.
또 다른 구현예에서, 서열번호 2와 실질적 상동성 (즉, 서열 유사성) 또는 실질적 동일성을 가지는 폴리뉴클레오티드를 포함하거나, 이로 구성되거나, 필수적으로 구성되는 폴리뉴클레오티드가 제공된다.
또 다른 구현예에서, 서열번호 2와 적어도 약 95%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8% 또는 99.9%의 서열 동일성을 가지는 폴리뉴클레오티드 변이체가 제공된다.
또 다른 구현예에서, 서열번호 2의 대응하는 단편들과 적어도 약 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100%의 서열 동일성을 가지는 실질적 상동성(즉, 서열 유사성) 또는 실질적 동일성을 가지는 서열번호 2의 단편들이 제공된다.
바람직하게는, 상기 단편들은 서열번호1의 적어도 15개의 연속된 뉴클레오티드의 신장부에 걸쳐서 상기 언급한 서열 동일성을 가지고 있다. 구현예들에서, 서열 동일성은 적어도 20, 25, 30, 35, 40, 45, 50개 이상의 연속된 뉴클레오티드에 걸쳐서 연장되어 있다.
또 다른 구현예에서, 니코틴 N-탈메틸효소로서 기능하는 폴리펩티드를 암호화하는 서열번호 2와 충분하거나 상당한 정도의 동일성 또는 유사성을 포함하고 있는 폴리뉴클레오티드가 제공된다. 적절하게는, 본원에 기재된 폴리뉴클레오티드(들)은 서열번호 3에 기재된 단백질 활성의 적어도 약 50%, 60%, 70%, 80%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 이상인 니코틴 N-탈메틸효소 활성을 갖는 단백질을 암호화한다. 폴리펩티드가 기능성 니코틴 탈메틸효소인지 판정하기 위해, 그것의 cDNA를 발현 벡터에 클로닝하고 효모 균주 - 예컨대 균주 W(R) 내로 형질전환시킬 수 있다. 균주 W(R)은 효모 NADPH-의존성 P450 환원효소(P450s에 대한 직접 전자 공여체 역할을 하는 효소)를 과발현하도록 조작된 효모 세포주이고; 이 시스템은 효모에서 발현되는 외래 P450 효소 활성의 검출을 향상시킨다 (Pompon 등, (1995) Methods Enzymol. 272: 51-64). 니코틴 탈메틸효소 검정은 [14C]-니코틴을 갖는 효모 마이크로솜막 제제를 배양하고, Siminszky 등 (2005) Proc. Natl. Acad. Sci. USA 102: 14919-14924에 기재된 박막 크로마토그래피에 의해 생성물을 분석해서 수행할 수 있다.
본원에 기재된 폴리뉴클레오티드는 비변형되었거나 변형된 데옥시리보핵산(DNA) 또는 리보핵산(RNA)일 수도 있는, 뉴클레오티드의 중합체를 포함할 수 있다. 따라서, 폴리뉴클레오티드는 제한하지 않고, 유전체 DNA, 상보성 DNA(cDNA), mRNA, 또는 안티센스 RNA 또는 이들의 단편(들)일 수 있다. 더욱이, 폴리뉴클레오티드는 단일가닥 또는 이중가닥 DNA, 단일가닥 및 이중가닥 영역들의 혼합물인 DNA, DNA 및 RNA를 포함하는 혼성 분자, 또는 단일가닥 및 이중가닥 영역들의 혼합물을 가지는 혼성 분자 또는 이들의 단편(들)일 수 있다. 또한, 폴리뉴클레오티드는 DNA, RNA, 또는 둘 다 또는 이들의 단편(들)을 포함하는 삼중가닥 영역들로 구성될 수 있다. 폴리뉴클레오티드는 하나 이상의 변형된 염기, 예컨대 포스포티오에이트(phosphothioate)를 함유할 수 있으며, 펩티드 핵산일 수 있다. 일반적으로, 폴리뉴클레오티드는 cDNA, 유전체 DNA, 올리고뉴클레오티드, 또는 개별 뉴클레오티드의 단리된 혹은 클로닝된 단편, 또는 전술한 것들의 조합으로부터 조립될 수 있다. 비록 본원에 기재된 폴리뉴클레오티드 서열이 DNA 서열로 보여지지만, 상기 서열은 그의 대응하는 RNA 서열, 및 그의 역보체를 포함해서, 그의 상보성(예를 들어, 완전히 상보적인) DNA 또는 RNA 서열을 포함한다.
일부 경우에 예를 들면, 포스포라미데이트(phosphoramidate), 포스포로티오에이트(phosphorothioate), 포스포로디티오에이트(phosphorodithioate), 또는 O-메틸포스포로아미다이트(O-methylphosphoroamidite) 연결을 포함하는 대안적인 골격(backbone); 및 펩티드 폴리뉴클레오티드 골격 및 연결기를 가질 수도 있는 폴리뉴클레오티드 유사체가 포함되지만, 본원에 기재된 폴리뉴클레오티드는 일반적으로 포스포디에스테르(phosphodiester) 결합을 함유할 것이다. 다른 유사체 폴리뉴클레오티드로는 양성 골격; 비이온성 골격, 및 비-리보오스 골격을 가지는 것을 포함한다. 리보오스-인산 골격의 변형은 다양한 이유 때문에 생길 수도 있는데, 예를 들면, 생리학적 환경 또는 바이오칩 상 탐침으로서의 분자들의 안정성 및 반감기를 증대시키기 위한 이유이다. 자연 발생 폴리뉴클레오티드 및 유사체의 혼합이 생길 수 있다; 대안적으로, 상이한 폴리뉴클레오티드 유사체들의 혼합, 및 자연 발생 폴리뉴클레오티드 및 유사체의 혼합이 생길 수도 있다.
예를 들면, 포스포라미데이트(phosphoramidate), 포스포로티오에이트(phosphorothioate), 포스포로디티오에이트(phosphorodithioate), O-메틸포스포라미다이트(O-methylphosphoroamidite) 연결기 및 펩티드 폴리뉴클레오티드 골격 및 연결기를 포함해서, 다양한 폴리뉴클레오티드 유사체가 공지되어 있다. 다른 유사체 폴리뉴클레오티드로는 양성 골격; 비이온성 골격, 및 비-리보오스 골격을 가지는 것을 포함한다. 하나 이상의 카보사이클릭 당을 함유하는 폴리뉴클레오티드가 또한 포함된다.
다른 유사체로는 펩티드 폴리뉴클레오티드 유사체인 펩티드 폴리뉴클레오티드를 포함한다. 이러한 골격은 자연 발생 폴리뉴클레오티드의 고 전하의 포스포디에스테르 골격과 대조적으로, 중성 조건 하에서 실질적으로 비이온성이다. 이것은 이점을 야기할 수도 있다. 첫째, 펩티드 폴리뉴클레오티드 골격은 개선된 혼성화 동역학(hybridization kinetics)을 보여줄 수도 있다. 펩티드 폴리뉴클레오티드는 불일치 대비 완전 일치 염기쌍을 위해 더 큰 용융점 변화를 가진다. DNA 및 RNA는 일반적으로 간격 불일치의 경우에 2-4℃의 용융점 강하를 보여준다. 비이온성 펩티드 폴리뉴클레오티드 골격의 경우, 상기 강하는 7-9℃에 더 가깝다. 마찬가지로, 그것들의 비이온성 성질 때문에, 이 골격들에 부착된 염기의 혼성화는 염 농도에 상대적으로 민감하지 않다. 또한, 펩티드 폴리뉴클레오티드는 세포 효소에 의해 변성되지 않을 수도 있고 더 적은 범위로 변성될 수도 있으므로, 더 안정적일 수도 있다.
개시된 폴리뉴클레오티드, 및 그 단편의 용도 중에는 핵산 혼성화 분석에서 탐침으로서 또는 핵산 증폭 분석에 사용하기 위한 프라이머로서 용도가 있다. 이러한 단편은 일반적으로 적어도 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 또는 그 이상의 연결된 뉴클레오티드의 DNA 서열을 포함하고 있다. 다른 구현예들에서, DNA 단편은 적어도 약 10, 15, 20, 30, 40, 50 또는 60 또는 그 이상의 연결된 뉴클레오티드의 DNA 서열을 포함하고 있다. 따라서, 한 측면에서, 니코틴 N-탈메틸효소 활성 부재을 갖는 단백질을 암호화하거나, 프로브 또는 프라이머 또는 양쪽 모두의 사용을 포함하는 니코틴 N-탈메틸 효소를 암호화하는 폴리뉴클레오티드를 검출하기 위한 방법 또한 제공된다.
혼성화 조건의 선택 및 적절한 조건을 고안하기 위한 지침에 영향을 미치는 기본적인 매개변수는 Sambrook, J., E. F. Fritsch, 및 T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.)에 의해 기재되어 있다. 본원에 기재된 아미노산 서열과 유전 암호의 지식의 조합을 이용해서, 축퇴성 올리고뉴클레오티드의 세트가 생성될 수 있다. 이러한 올리고뉴클레오티드는 예를 들어 DNA 단편이 단리되고 증폭되는 중합효소 연쇄 반응(PCR)에서 프라이머로서 유용하다. 소정의 구현예들에서, 축퇴성 프라이머는 유전자 라이브러리를 위한 탐침으로서 사용될 수 있다. 이러한 라이브러리는 이에만 한정하는 것은 아니지만, cDNA 라이브러리, 유전체 라이브러리, 및 심지어 전자 발현 서열 태그(EST) 또는 DNA 라이브러리를 포함한다. 이러한 방법에 의해서 식별되는 상동성 서열은 본원에서 인식되는 서열의 상동성을 인식하기 위한 탐침으로서 사용될 수 있다.
또한 감소된 엄격성 조건, 전형적으로 중간 엄격성 조건, 및 일반적으로 높은 엄격성 조건 하에서 본원에 기재된 폴리뉴클레오티드와 혼성화되는 올리고뉴클레오티드(예를 들어, 프라이머 또는 탐침)가 잠재적으로 사용될 수 있다. 혼성화 조건의 선택 및 적절한 조건을 고안하기 위한 지침에 영향을 미치는 기본 매개변수는 Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.)에 의해 기재되어 있고 그리고 예를 들어, 폴리뉴클레오티드의 길이 또는 염기 조성을 기초로 하여 본 기술분야의 숙련자들에 의해서 쉽게 결정될 수 있다. 중간 엄격성 조건을 얻는 한가지 방법은 5x 표준 구연산나트륨, 0.5% 도데실 황산나트륨, 1.0 mM 에틸렌디아민테트라아세트산(pH 8.0), 약 50% 포름아미드의 혼성화 완충액, 6x 표준 구연산나트륨을 함유하는 예비세정 용액의 사용, 및 약 55℃의 혼성화 온도 (또는 약 42℃의 혼성화 온도로, 약 50%의 포름아미드를 함유하는 것과 같은, 다른 유사한 혼성화 용액), 및 0.5x 표준 구연산나트륨, 0.1% 도데실 황산나트륨에서의 약 60℃의 세정 조건과 연관된다. 일반적으로, 높은 엄격성 조건은 상기와 같은 혼성화 조건으로서 정의되지만, 약 68℃, 0.2x 표준 구연산나트륨, 0.1% 도데실 황산나트륨으로 세정한다. SSPE(1x SSPE는 0.15M 염화나트륨, 10 mM 인산나트륨, 및 1.25 mM 에틸렌디아민테트라아세트산, pH 7.4)는 혼성화 및 세정 완충액에서 표준 구연산나트륨(1x 표준 구연산나트륨은 0.15M 염화나트륨 및 15 mM 구연산나트륨)에 대해 치환될 수 있고; 혼성화가 완료된 후에 15 분 동안 세정을 수행한다. 세정 온도 및 세정 염 농도는 본 기술분야의 숙련자들에게 공지되고 이하에 더 설명된 바와 같이 (예를 들어, Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. 참조), 혼성화 반응 및 이중 안정성을 조절하는 기본 원칙을 적용하여, 원하는 엄격성 정도를 얻기 위해 필요한 만큼 조절될 수 있는 것으로 이해해야 한다. 미공지된 서열의 표적 폴리뉴클레오티드에 폴리뉴클레오티드를 혼성화할 때, 혼성체 길이는 혼성화 폴리뉴클레오티드의 길이로 추정된다. 공지된 서열의 폴리뉴클레오티드가 혼성화할 때, 혼성체 길이는 폴리뉴클레오티드의 서열을 정렬하고 최적의 서열 상보성의 영역 또는 영역들을 식별하여 결정될 수 있다. 길이가 50 미만의 염기쌍인 것으로 예상되는 혼성체를 위한 혼성화 온도는 혼성체의 용융점 보다 5℃ 내지 10℃ 적어야 하고, 이때 용융점은 다음의 식에 따라 결정된다. 길이가 18 미만의 염기쌍인 혼성체의 경우, 용융점(℃)=2(A+T 염기 수)+4(G+C 염기 수)이다. 길이가 18 초과의 염기쌍인 혼성체의 경우, 용융점(℃)=81.5+16.6(log10 [Na+])+0.41(% G+C)-(600/N)이고, 이때 N은 혼성체 내의 염기 수이고, 그리고 [Na+]는 혼성화 완충액 내의 나트륨 이온의 농도이다(1x 표준 구연산나트륨=0.165M에 대한 [Na+]). 전형적으로, 각각의 이러한 혼성화 폴리뉴클레오티드는 혼성화하는 폴리뉴클레오티드의 길이의 적어도 25%(일반적으로 적어도 50%, 60%, 또는 70%, 가장 일반적으로 적어도 80%)인 길이를 가지고, 혼성화하는 폴리뉴클레오티드에 대해 적어도 60%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%)의 서열 동일성을 가진다.
본 기술분야의 숙련자에 의해서 이해되는 것처럼, 선형 DNA는 두 가지 가능한 배향: 5'→3' 방향과 3'→5' 방향을 가진다. 예를 들어, 참조 서열이 동일한 폴리뉴클레오티드 분자/가닥 내에서 5'→3' 방향에 위치하고, 그리고 두번째 서열이 5'→3' 방향에 위치하면, 이때 참조 서열 및 두번째 서열은 동일한 방향으로 배향되거나, 또는 동일한 배향을 가진다. 전형적으로, 주어진 프로모터의 조절 하에 관심 있는 프로모터 서열 및 유전자는 동일한 배향으로 위치한다. 그러나, 5'→3' 방향에 위치하는 참조 서열과 관련해서는, 두번째 서열이 동일한 폴리뉴클레오티드 분자/가닥 내에서 3'→5' 방향에 위치하면, 이때 참조서열 및 두번째 서열은 안티센스 방향으로 배향되거나, 안티센스 배향을 가진다. 서로에 대하여 안티센스 배향을 가지는 두 가지 서열은, 참조서열(5'→3' 방향) 및 참조 서열의 역상보성 서열(5'→3'에 위치하는 참조 서열)이 동일한 폴리뉴클레오티드 분자/가닥 내에 위치한다면, 동일한 배향을 가지는 것으로 대안적으로 설명될 수 있다. 본원에서 기재한 서열은 5'→3' 방향으로 보여진다.
본원에서 제공되는 재조합 구성체는 단백질 발현 및/또는 활성 수준을 조절하기 위해 식물 또는 식물 세포를 형질전환하는 데에 사용될 수 있다. 재조합 폴리뉴클레오티드 구성체는 본원에 기재된 하나 이상의 폴리뉴클레오티드를 인코딩하며, 폴리펩티드를 발현하는데 적절한 조절 영역에 작동가능하게 연결되는 폴리뉴클레오티드를 포함할 수 있다. 따라서 폴리뉴클레오티드는 본원에 기재된 바와 같은 폴리펩티드를 인코딩하는 암호화 서열을 포함할 수 있다. 단백질 발현 및/또는 활성 수준이 조절되는 식물 또는 식물 세포는 돌연변이, 비-자연 발생, 형질전환, 인공 또는 유전자 조작 식물 또는 식물 세포를 포함할 수 있다. 적절하게는, 유전자전환 식물 또는 식물 세포는 재조합 DNA의 안정적인 통합에 의해서 변경된 유전체를 포함한다. 재조합 DNA는 유전자 조작되었고 세포의 외부에서 구축된 DNA를 포함하고 그리고 자연 발생 DNA 또는 cDNA 또는 합성 DNA를 함유하는 DNA를 포함한다. 유전자전환 식물은 처음에 형질전환된 식물 세포로부터 재생된 식물 및 후속 세대 또는 형질전환된 식물의 교배로부터의 후손 유전자전환 식물을 포함할 수 있다. 적절하게는, 유전자전환 변형은 본원에 기재된 폴리뉴클레오티드 또는 폴리펩티드의 발현 또는 활성을 대조군 식물과 비교해서 변경시킨다.
재조합 폴리뉴클레오티드에 의해서 인코딩되는 폴리펩티드는 고유한 폴리펩티드이거나 또는 세포에 이형일 수 있다. 일부 경우에, 재조합 구성체는 조절 영역에 작동가능하게 연결되는, 발현을 조절하는 폴리뉴클레오티드를 함유한다. 적절한 조절 영역의 실시예들이 본원에서 설명되고 있다.
본원에 기재된 바와 같은 재조합 폴리뉴클레오티드 구성체를 함유하는 벡터가 또한 제공된다. 적절한 벡터 골격은 예를 들어 플라스미드, 바이러스, 인공 염색체, 세균 인공 염색체, 효모 인공 염색체, 또는 박테리오파지 인공 염색체와 같이 본 기술분야에 일상적으로 사용되는 것들을 포함한다. 적절한 발현 벡터는 제한 없이, 예를 들어 박테리오파지, 배큘로바이러스(baculoviruse), 및 레트로바이러스로부터 유도되는 플라스미드 및 바이러스 벡터를 포함한다. 수많은 벡터 및 발현 시스템이 시판 중이다. 벡터는 예를 들어 복제 원점, 지지체 결합 영역(scaffold attachment region) 또는 마커를 포함할 수 있다. 마커 유전자는 식물 세포에 대해 선택할 수 있는 표현형을 부여할 수 있다. 예를 들어, 마커는 항생제(예를 들어, 카나마이신, G418, 블레오마이신, 또는 하이그로마이신), 또는 제초제(예를 들어, 글리포세이트, 클로술푸론 또는 포스피노트리신)에 대한 내성과 같은, 살생제 내성을 부여할 수 있다. 또한, 발현 벡터는 발현된 폴리펩티드의 조작 또는 검출(예를 들어, 정제 또는 위치결정)을 용이하게 하기 위해 고안된 태그 서열을 포함할 수 있다. 루시퍼라아제, 베타-글루쿠로니다아제, 녹색 형광 단백질, 글루타티온 S-전이효소, 폴리히스티딘, c-myc 또는 헤마글루티닌 서열과 같은 태그 서열은 전형적으로 인코딩된 폴리펩티드와의 융합으로서 발현된다. 이러한 태그는 카르복실 또는 아미노 말단을 포함해서, 폴리펩티드 내에 어느 곳에서나 삽입될 수 있다.
식물 또는 식물 세포는 안정적으로 형질전환되도록 그의 유전체로 통합된 재조합 폴리뉴클레오티드를 가져서 형질전환될 수 있다. 본원에서 설명한 식물 또는 식물 세포는 안정적으로 형질전환된다. 안정적으로 형질전환된 세포는 전형적으로 각각의 세포분열시에도 도입된 폴리뉴클레오티드를 보유한다. 식물 또는 식물 세포는 일시적으로 형질전환되어서 재조합 폴리뉴클레오티드가 그의 유전체로 통합되지 않을 수 있다. 일시적으로 형질전환된 세포는 전형적으로 각각의 세포분열시에 도입된 재조합 폴리뉴클레오티드의 전부 또는 일부를 손실함으로써 상기 도입된 재조합 폴리뉴클레오티드가 충분한 수의 세포분열 후에 딸세포에서 검출될 수 없도록 한다. 적절하게는, NND3는 식물의 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 발현된다. 적절하게는, NND3는 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 독점적으로 또는 특이적으로 발현된다. 유전체 편집의 이용 또한 고려된다.
바이오리스틱(biolistics), 유전자 총(gun)기술, 아그로박테리움-매개 형질전환, 바이러스 벡터-매개 형질전환 및 전기천공법을 포함해서, 많은 방법은 본원에서 모두 포괄하는 식물 세포를 형질전환하기 위해 본 기술분야에 이용 가능하다. 외래 DNA를 식물 염색체 내로 통합하기 위한 아그로박테리움 시스템은 식물 유전공학을 위해 광범위하게 연구되고, 변형되고 그리고 채택되어왔다. 센스 또는 안티센스 배향으로, 조절 서열에 작동가능하게 연결되는, 정제된 대상 담배 단백질에 대응하는 DNA 서열을 포함하는 네이키드 재조합 DNA 분자는 통상적인 방법에 의해서 적절한 T-DNA 서열에 연결된다. 이들은 폴리에틸렌 글리콜 기술에 의해서나 전기천공법 기술에 의해서 담배 원형질체 내로 도입되는데, 두 기술 모두 표준이다. 대안적으로, 정제된 대상 담배 단백질을 인코딩하는 재조합 DNA 분자를 포함하는 이러한 벡터는 살아있는 아그로박테리움 세포 내로 도입되고, 그런 다음 DNA를 담배 식물 세포 내로 전달한다. T-DNA 벡터 서열을 동반하지 않는 네이키드 DNA에 의한 형질전환은 담배 원형질체와 DNA-함유 리포솜의 융합을 통해서나 전기천공법을 통해서 달성될 수 있다. T-DNA 벡터 서열을 동반하지 않은 네이키드 DNA는 불활성의, 고속의 미세투사물을 통해서 담배 세포를 형질전환하는 데에도 사용될 수 있다.
세포 또는 배양된 조직이 형질전환을 위한 수용체 조직으로서 사용된다면, 원하는 경우에 식물은 본 기술분야의 숙련자에게 공지된 기술에 의해서 형질전환된 배양물로부터 재생될 수 있다.
재조합 구성체에 포함될 조절 영역의 선택은 이에만 한정하는 것은 아니지만, 효능, 선택가능성, 유도성, 바람직한 발현수준, 및 세포- 또는 조직-우선적 발현을 포함하는 여러 요인에 따라 달라진다. 암호화 서열에 비해 조절 영역을 적절히 선택하고 그리고 위치시켜서 암호화 서열의 발현을 조절하는 것은 본 기술분야의 숙련자에게 일상적인 일이다. 폴리뉴클레오티드의 전사는 유사한 방식으로 조절될 수 있다. 일부 적절한 조절 영역은 소정의 세포 유형에서, 전사를 유일하게 또는 우세하게 개시한다. 식물 유전체 DNA에 있는 조절 영역을 식별하고 특징화하기 위한 방법이 본 기술분야에 공지되어 있다.
적절한 프로모터는 다른 조직 또는 세포 유형(예를 들어, 뿌리-특이적 프로모터, 신초-특이(shoot-specific) 프로모터, 물관-특이(xylem-specific) 프로모터)에 존재하거나, 또는 상이한 발생 단계 동안에 존재하거나, 또는 상이한 환경조건에 반응하여 존재하는 조직-특이적 인자에 의해 인식되는 조직-특이적 프로모터를 포함한다. 적절한 프로모터는 특정한 유도인자(inducer)를 필요로 하지 않고 대부분의 세포 유형에서 활성화될 수 있는 기본구성 프로모터를 포함한다. RNAi 폴리펩티드 생산을 조절하기 위한 적절한 프로모터의 예시는 꽃양배추 모자이크 바이러스 35S (CaMV/35S), SSU, OCS, lib4, usp, STLS1, B33, nos 또는 유비퀴틴- 또는 파세올린-프로모터를 포함한다. 본 기술분야의 숙련자라면 재조합 프로모터의 다수 변이를 생성할 수 있다.
조직-특이적 프로모터는 식물 발생 동안의 특정 시간에 식물 영양조직 또는 생식조직과 같은 세포 또는 조직에서만 활성화되는 전사 조절 요소이다. 조직-특이적 발현은 예를 들어, 특정 조직에서의 폴리뉴클레오티드의 발현이 선호될 때 유리할 수 있다. 발생의 조절 하에서 조직-특이적 프로모터의 예시는 예를 들어, 뿌리 또는 잎과 같은 식물 영양조직, 또는 열매, 배주, 종자, 꽃가루, 암술, 꽃, 또는 임의의 배 조직과 같은 생식조직과 같은 소정의 조직에서만 (또는 주로) 전사를 개시할 수 있는 프로모터를 포함한다. 생식조직-특이적 프로모터는 예를 들어, 꽃밥-특이, 배주-특이, 배-특이, 배젖-특이, 외피-특이, 종자 및 종피-특이, 꽃가루-특이, 꽃잎-특이, 꽃받침-특이, 또는 그들의 조합일 수 있다.
적절한 잎-특이적 프로모터는 피루브산, C4 식물(옥수수)의 오르토인산 디키나아제(PPDK) 프로모터, 옥수수의 cab-m1Ca+2 프로모터, 애기장대(Arabidopsis thaliana) myb-관련 유전자 프로모터 (Atmyb5), 잎 및 광-생장(light-grown) 모종에서 발현된 리불로오스 이인산 카복실라아제(RBCS) 프로모터(예를 들어 잎 및 광-육종 모종에서 발현된 토마토 RBCS 1, RBCS2 및 RBCS3A 유전자, 발생중인 토마토 열매에서 발현된 RBCS1 및 RBCS2 또는 고수준으로 잎새 및 잎관에 있는 엽록소 세포에 거의 배타적으로 발현된 리불로오스 이인산 카복실라아제 프로모터)를 포함한다.
적절한 노화-특이적 프로모터는 열매 숙성, 잎의 노화 및 탈리 동안에 활성인 토마토 프로모터, 시스테인 프로테아제를 인코딩하는 유전자의 옥수수 프로모터, 82E4의 프로모터 및 SAG 유전자의 프로모터를 포함한다. 적절한 꽃밥-특이적 프로모터가 사용될 수 있다. 본 기술분야의 숙련자에게 공지된 적절한 뿌리-우선적 프로모터가 선택될 수도 있다. 적절한 종자-우선적 프로모터는 종자-특이적 프로모터(종자 저장 단백질의 프로모터와 같은 종자 발생 동안에 활성인 프로모터들) 및 종자-발아 프로모터(종자 발아 동안에 활성인 프로모터들)을 모두 포함한다. 이러한 종자-우선적 프로모터는 이들에만 한정하지 않지만, Cim1 (사이토키닌-유도 메세지); cZ19B1 (옥수수 19 kDa 제인); milps (myo-이노시톨-1-포스페이트 합성효소); Zm-40로도 공지된 mZE40-2; nuclc; 및 celA(셀룰로오스 합성효소)를 포함한다. 감마-제인은 배젖-특이적 프로모터다. Glob-1은 배낭-특이적 프로모터다. 쌍자엽의 경우, 종자-특이적 프로모터는 이들에만 한정하지 않지만, 콩 베타-파세올린, 나핀, β-콘글리시닌, 콩 렉틴, 크루시페린 등을 포함한다. 단자엽의 경우, 종자-특이적 프로모터는 이들에만 한정하지 않지만, 옥수수 15 kDa 제인(zein) 프로모터, 22 kDa 제인 프로모터, 27 kDa 제인 프로모터, g-제인 프로모터(gzw64A 프로모터, Genbank 등록번호 S78780과 같은) 27 kDa 감마-제인 프로모터, 왁시(waxy) 프로모터, 수축된 1 프로모터, 수축된 2 프로모터, 글로불린 1 프로모터(Genbank 등록번호 L22344 참조), Itp2 프로모터, cim1 프로모터, 옥수수 end1 및 end2 프로모터, nuc1 프로모터, Zm40 프로모터, eep1 및 eep2; lec1, 티오레독신 H 프로모터; mlip15 프로모터, PCNA2 프로모터; 및 수축된 2 프로모터를 포함한다.
유도성 프로모터의 예시는 병원체 공격, 혐기성 조건, 상승된 온도, 광, 가뭄, 저온, 또는 고농도 염에 반응성이 있는 프로모터를 포함한다. 병원체-유도성 프로모터는 병인성-관련 단백질(PR 단백질)로부터 유래된 것을 포함하는데, 이 단백질은 다음의 병원체 감염에 의해 유도된다(예를 들어, PR 단백질, SAR 단백질, 베타-1,3-글루카나아제, 키티나아제).
식물 프로모터와 더불어, 다른 적절한 프로모터는 세균 기원, 예를 들어, 옥토핀 합성효소 프로모터, 노팔린 합성효소 프로모터 및 (Ti 플라스미드로부터 유도되는) 다른 프로모터로부터 유래될 수도 있고, 또는 바이러스 프로모터(예를 들어, 꽃양배추 모자이크 바이러스(CaMV)의 35S 및 19S RNA 프로모터, 담배 모자이크 바이러스의 기본구성 프로모터, 꽃양배추 모자이크 바이러스(CaMV) 19S 및 35S 프로모터, 또는 현삼 모자이크 바이러스 35S 프로모터)로부터 유래될 수도 있다.
다른 측면에서, 서열 목록에서 보이는 임의의 폴리펩티드를 포함해서, 본원에 기재된 임의의 폴리펩티드 서열과 적어도 95% 서열 동일성을 가지는 폴리펩티드 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되는 단리된 폴리펩티드가 제공되어 있다. 적절하게는, 단리된 폴리펩티드는 적어도 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100%의 서열 동일성을 가지는 서열을 포함하거나, 이로 구성되거나, 또는 필수적으로 구성된다. 한 구현예에서, 서열번호 3에 의해 암호화된 폴리펩티드가 제공되어 있다.
또 다른 구현예에서, 서열번호 3과 적어도 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100%의 서열 동일성을 가지는 서열을 포함하거나, 이로 구성되거나, 또는 필수적으로 구성된 단리된 폴리펩티드가 제공되어 있다.
또 다른 구현예에서, 서열번호 3과 적어도 약 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8% 또는 99.9%의 서열 동일성을 가지는 폴리뉴클레오티드 변이체에 의해 암호화된 아미노산 서열을 포함하거나, 이로 구성되거나, 또는 필수적으로 구성된 폴리펩티드 변이체가 제공되어 있다.
또 다른 구현예에서, 서열번호 3의 대응하는 단편들과 적어도 약 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100%의 서열 동일성을 가지는 서열번호 3의 폴리펩티드의 단편 또는 서열번호 3의 단편이 제공되어 있다.
서열번호 3의 대응하는 단편들은, 예를 들어, 적어도 15 아미노산 길이로, 서열번호3의 15개의 연속된 아미노산을 포함하고 있다. 또한, 단편들은 20, 25, 30, 35, 40 또는 이상의 아미노산 길이, 최대 517개의 아미노산 길이일 수 있으며, 서열번호 3의 연속된 아미노산의 대응하는 수를 포함하고 있다.
바람직한 단편들은 서열번호 3의 아미노산 1-15, 330-345, 420-450 및 480-510을 포괄하는 단편들을 포함하고 있다.
폴리펩티드는 니코틴 N-탈메틸효소로서 작용하도록 서열번호 3과 충분하거나 상당한 정도의 동일성 또는 유사성을 포함하는 서열을 포함할 수 있다. 폴리펩티드(들)의 단편은 전형적으로 전장 서열의 활성의 일부 또는 전부를 보유한다.
본원에서 논의된 바와 같이, 폴리펩티드는 또한 임의의 유형의 변경(예를 들어 아미노산의 삽입, 결실 또는 치환; 글리코실화 상태의 변화; 재접힘 또는 이성질화, 3차원 구조, 또는 자가결합 상태에 영향을 미치는 변화)을 도입하여 생성된 돌연변이를 포함하는데, 이들은 니코틴 N-탈메틸효소로서의 기능 또는 활성의 일부 또는 전부를 여전히 가지도록 의도적으로 조작되거나 자연적으로 단리된 것일 수 있다. 적절하게는, 니코틴 N-탈메틸효소로서의 기능 또는 활성은 조절, 감소 또는 억제된다. 적절하게는, 니코틴 N-탈메틸효소로서의 기능 또는 활성은 니코틴 N-탈메틸효소 활성이 검출가능하지 않도록 억제된다.
100% 서열 동일성을 가지는 서열번호 3에 의하여 인코딩된 폴리펩티드 또는 100% 서열 동일성을 가지는 서열번호 3에 기재된 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되는 폴리펩티드 또한 개시되어 있다.
폴리펩티드는 임의의 유형의 변경(예를 들어, 아미노산의 삽입, 결실, 또는 치환; 글리코실화 상태의 변화; 재접힘, 이성질화, 3차원 구조, 또는 자가-결합 상태에 영향을 미치는 변화)을 도입하여 생성되는 변이체를 포함하는데, 이들은 의도적으로 조작되거나 자연적으로 단리될 수 있다. 변종은 무증상(silent) 변화를 만들고 기능적으로 동등한 단백질을 야기하는 변경을 가질 수도 있다. 의도적인 아미노산 치환은 물질의 2차 결합 활성이 보유되는 한 잔기의 극성, 전하, 용해성, 소수성, 친수성 및 양친매성 성질의 유사성을 기초로 하여 이루어질 수도 있다. 예를 들어, 음전하된 아미노산은 아스파르트산 및 글루탐산을 포함하고; 양전하된 아미노산은 라이신 및 아르기닌을 포함하고; 그리고 유사한 친수성 값을 가지는 비전화된 극성 헤드기를 가지는 아미노산은 루신, 이소루신, 발린, 글리신, 알라닌, 아스파라긴, 글루타민, 세린, 트레오닌, 페닐알라닌 및 티로신을 포함한다. 보존성 치환은, 예를 들어 하기의 표에 따라서 이루어질 수도 있다. 두번째 컬럼의 동일한 블록 내의 아미노산 및 바람직하게는 세번째 컬럼의 동일한 선 내의 아미노산은 서로 치환될 수 있다:
Figure 112016110724051-pct00001
폴리펩티드는 성숙 단백질 또는 미성숙 단백질 또는 미성숙 단백질로부터 유도된 단백질일 수도 있다. 폴리펩티드는 공지의 방법을 이용해서 선형 형태 또는 고리형일 수도 있다. 폴리펩티드는 전형적으로 적어도 10개, 적어도 20개, 적어도 30개, 또는 적어도 40개의 연결된 아미노산을 포함한다.
본원에 기재된 바와 같이 NND3를 암호화하는 유전자에서의 돌연변이를 포함하는 담배 식물 또는 식물 세포가 개시되어 있으며, 여기서 상기 돌연변이는 상기 NND3의 발현 감소 또는 기능 감소 결과를 초래한다. NND3 돌연변이체(들)의 발현 또는 기능은 억제될 수도 있다. NND3 돌연변이체(들)의 발현 또는 기능은 검출가능하지 않을 수도 있다. NND3에서의 하나 이상의 돌연변이 이외에도, 돌연변이체 식물 또는 식물 세포는 하나 이상의 다른 유전자 또는 폴리펩티드에서의 하나 이상의 추가 돌연변이를 가질 수 있다. 소정의 구현예들에서, NND3에서의 하나 이상의 돌연변이 이외에도, 돌연변이체는 하나 이상의 다른 유전자 또는 폴리펩티드 - 예컨대 하나 이상의 다른 니코틴 탈메틸효소 유전자 또는 폴리펩티드에서의 하나 이상의 추가 돌연변이를 가질 수 있다. 적절하게는, NND3는 돌연변이체 식물의 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 발현된다. 적절하게는, NND3는 돌연변이체 식물의 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 독점적으로 또는 특이적으로 발현된다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 6 내지 16 또는 이들의 둘 이상의 조합에 기재된 서열으로부터 선택된다. 적절하게는, 상기 돌연변이는 서열번호 5의 아미노산 잔기 38, 171, 201, 169, 459, 427, 329, 364, 376, 382, 및 458 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E4 니코틴 탈메틸효소의 변형을 초래한다. 적절하게는, 상기 돌연변이는 a) 서열번호 5의 위치 38에서 프롤린 잔기에 대한 류신 치환; b) 서열번호 5의 위치 171에서 아스파르트산 잔기에 대한 아스파라긴 치환; c) 서열번호 5의 위치 201에서 글루탐산 잔기에 대한 라이신 치환; d) 서열번호 5의 위치 169에서 아르기닌 잔기에 대한 글루타민 치환; e) 서열번호 5의 위치 459에서 글리신 잔기에 대한 아르기닌 치환; f) 서열번호 5의 위치 427에서 트레오닌 잔기에 대한 이소류신 치환; g) 서열번호 5의 위치 376에서 발린 잔기에 대한 메티오닌 치환; h) 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; i) 서열번호 5의 위치 364에서 라이신 잔기에 대한 아스파라긴 치환; j) 서열번호 5의 위치 382에서 프롤린 잔기에 대한 세린 치환; k) 서열번호 5의 위치 458에서 프롤린 잔기에 대한 세린 치환; 또는 l) 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E5를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 18 내지 25에 기재된 서열 또는 이들의 둘 이상의 조합으로부터 선택된다. 적절하게는, 상기 돌연변이는 서열번호 17의 아미노산 잔기 72, 143, 174, 224, 235, 410, 422 또는 449 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E5 니코틴 탈메틸효소의 변형을 초래한다. 적절하게는, 상기 돌연변이는 a) 서열번호 17의 위치 72에서 프롤린 잔기에 대한 류신 치환; b) 서열번호 17의 위치 143에서 류신 잔기에 대한 페닐알라닌 치환; c) 서열번호 17의 위치 174에서 세린 잔기에 대한 류신 치환; d) 서열번호 17의 위치 224에서 이소류신 잔기에 대한 류신 치환; e) 서열번호 17의 위치 235에서 프롤린 잔기에 대한 세린 치환; f) 서열번호 17의 위치 427에서 트레오닌 잔기에 대한 이소류신 치환; g) 서열번호 17의 위치 376에서 발린 잔기에 대한 메티오닌 치환; h) 서열번호 17의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; i) 서열번호 17의 위치 410에서 알라닌 잔기에 대한 발린 치환; j) 서열번호 17의 위치 422에서 트립토판 잔기에 대한 정지 코돈 치환; k) 서열번호 17의 위치 449에서 프롤린 잔기에 대한 류신 치환; 또는 l) 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E10를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 27 내지 35에 기재된 서열 또는 이들의 둘 이상의 조합으로부터 선택된다. 적절하게는, 상기 돌연변이는 서열번호 26의 아미노산 잔기 148, 172, 344, 410, 417, 419, 79, 107 또는 382 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E10 니코틴 탈메틸효소의 변형을 초래한다. 적절하게는, 상기 돌연변이는 a) 서열번호 26의 위치 148에서 류신 잔기에 대한 페닐알라닌 치환; b) 서열번호 26의 위치 172에서 글리신 잔기에 대한 아르기닌 치환; c) 서열번호 26의 위치 344에서 알라닌 잔기에 대한 트레오닌 치환; d) 서열번호 26의 위치 410에서 알라닌 잔기에 대한 트레오닌 치환; e) 서열번호 26의 위치 417에서 아르기닌 잔기에 대한 히스티딘 치환; f) 서열번호 26의 위치 419에서 프롤린 잔기에 대한 세린 치환; g) 서열번호 26의 위치 79에서 글리신 잔기에 대한 세린 치환; h) 서열번호 26의 위치 107에서 프롤린 잔기에 대한 세린 치환; i) 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환; 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 내지 16에 기재된 서열 또는 이들의 둘 이상의 조합으로부터 선택된다. 적절하게는, 상기 돌연변이는 서열번호 5의 아미노산 잔기 329, 365, 382 또는 458 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E4 니코틴 탈메틸효소의 변형을 초래한다. 적절하게는, 상기 돌연변이는 a) 서열번호 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; b) 위치 364에서 라이신 잔기에 대한 아스파라긴 치환; c) 위치 376에서 발린 잔기에 대한 메티오닌 치환; d) 위치 382에서 프롤린 잔기에 대한 세린 치환; e) 위치 458에서 프롤린 잔기에 대한 세린 치환; 및 f) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 적절하게는, 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있다. 적절하게는, 상기 돌연변이는 서열번호 5의 아미노산 잔기 329에서 발생하는 상기 CYP82E4 니코틴 탈메틸효소의 변형을 초래한다. 적절하게는, 상기 돌연변이는 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이다.
적절하게는, NND3 돌연변이체 담배 식물 또는 식물 세포는 CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 또는 25 또는 이들의 둘 이상의 조합에 기재된 서열을 포함하고 있다. 적절하게는, 상기 돌연변이는 서열번호 12의 아미노산 잔기 422 및 449로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E5 니코틴 탈메틸효소의 변형을 초래한다. 적절하게는, 상기 돌연변이는 a) 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈; b) 위치 449에서 프롤린 잔기에 대해 치환된 류신; 및 c) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, NND3 돌연변이체 담배 식물 또는 식물 세포는 CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있다. 적절하게는, 상기 돌연변이는 아미노산 잔기 422에서 발생하는 상기 CYP82E5 니코틴 탈메틸효소의 변형을 초래하고, 여기서 상기 번호는 서열번호 17에 따른 것이다. 적절하게는, 상기 돌연변이는 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 추가 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32-35 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된다. 적절하게는, 상기 돌연변이는 아미노산 잔기 79, 107, 382, 419 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E10 니코틴 탈메틸효소의 변형을 초래하고, 여기서 상기 번호는 서열번호 26에 따른 것이다. 적절하게는, 상기 돌연변이는 a) 위치 79에서 글리신 잔기에 대한 세린 치환; b) 위치 107에서 프롤린 잔기에 대한 세린 치환; c) 위치 382에서 프롤린 잔기에 대한 세린 치환; d) 위치 419에서 프롤린 잔기에 대한 세린 치환; 및 e) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32-34 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된다. 적절하게는, 상기 돌연변이는 아미노산 잔기 79, 107, 382 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E10 니코틴 탈메틸효소의 변형을 초래하고, 여기서 상기 번호는 서열번호 26에 따른 것이다. 적절하게는, 상기 돌연변이는 a) 위치 79에서 글리신 잔기에 대한 세린 치환; b) 위치 107에서 프롤린 잔기에 대한 세린 치환; c) 위치 382에서 프롤린 잔기에 대한 세린 치환; 및 d) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, NND3 돌연변이체 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소 유전자 및 CYP82E5 니코틴 탈메틸효소 유전자에서 상기 개시한 바와 같은 하나 이상의 돌연변이를 더 포함하고 있다. 적절하게는, 상기 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소 유전자 및 CYP82E10 니코틴 탈메틸효소 유전자에서 상기 개시한 바와 같은 하나 이상의 돌연변이를 더 포함하고 있다. 적절하게는, 상기 담배 식물 또는 식물 세포는 CYP82E5 니코틴 탈메틸효소 유전자 및 CYP82E10 니코틴 탈메틸효소 유전자에서 상기 개시한 바와 같은 하나 이상의 돌연변이를 더 포함하고 있다. 적절하게는, 상기 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소 유전자 및 CYP82E5 니코틴 탈메틸효소 유전자 및 CYP82E10 니코틴 탈메틸효소 유전자에서 상기 개시한 바와 같은 하나 이상의 돌연변이를 더 포함하고 있다.
적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 33(G79S)에 기재된 서열을 포함하고 있다.
적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 34 (P107S)에 기재된 서열을 포함하고 있다.
적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 35 (P382S)에 기재된 서열을 포함하고 있다.
적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 (P419S)에 기재된 서열을 포함하고 있다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 419에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 79에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 107에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 382에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 위치 79에서 글리신 잔기에 대한 세린 치환이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 위치 107에서 프롤린 잔기에 대한 세린 치환이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 419에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 12 내지 16 또는 이들의 둘 이상의 조합에 기재된 서열로부터 선택된다. 적절하게는, 상기 돌연변이는 서열번호 5의 아미노산 잔기 329, 364, 376, 382, 및 458으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E4 니코틴 탈메틸효소의 변형을 초래한다. 적절하게는, 상기 돌연변이는 a) 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; b) 위치 364에서 라이신 잔기에 대한 아스파라긴 치환; c) 위치 376에서 발린 잔기에 대한 메티오닌 치환; d) 위치 382에서 프롤린 잔기에 대한 세린 치환; e) 위치 458에서 프롤린 잔기에 대한 세린 치환; 및 f) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함한다. 적절하게는, 상기 돌연변이는 서열번호 5의 아미노산 잔기 329에서 발생하는 상기 CYP82E4 니코틴 탈메틸효소의 변형을 초래한다. 적절하게는, 상기 돌연변이는 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이다.
적절하게는, NND3 돌연변이체 담배 식물 또는 식물 세포는 CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 또는 25 또는 이들의 둘 이상의 조합에 기재된 서열을 포함한다. 적절하게는, 상기 돌연변이는 아미노산 잔기 422 및 449로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E5 니코틴 탈메틸효소의 변형을 초래하고, 여기서 상기 번호는 서열번호 12에 따른 것이다. 적절하게는, 상기 돌연변이는 a) 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈; b) 위치 449에서 프롤린 잔기에 대해 치환된 류신; 및 c) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, NND3 돌연변이체 담배 식물 또는 식물 세포는 CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함한다. 적절하게는, 상기 돌연변이는 아미노산 잔기 422에서 발생하는 상기 CYP82E5 니코틴 탈메틸효소의 변형을 초래하고, 여기서 상기 번호는 서열번호 17에 따른 것이다. 적절하게는, 상기 돌연변이는 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 추가 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32-35 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된다. 적절하게는, 상기 돌연변이는 아미노산 잔기 79, 107, 382, 419 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E10 니코틴 탈메틸효소의 변형을 초래하고, 여기서 상기 번호는 서열번호 26에 따른 것이다. 적절하게는, 상기 돌연변이는 a) 위치 79에서 글리신 잔기에 대한 세린 치환; b) 위치 107에서 프롤린 잔기에 대한 세린 치환; c) 위치 382에서 프롤린 잔기에 대한 세린 치환; d) 위치 419에서 프롤린 잔기에 대한 세린 치환; 및 e) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래한다. 적절하게는, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32-34 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된다. 적절하게는, 상기 돌연변이는 아미노산 잔기 79, 107, 382 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 위치에서 발생하는 상기 CYP82E10 니코틴 탈메틸효소의 변형을 초래하고, 여기서 상기 번호는 서열번호 26에 따른 것이다. 적절하게는, 상기 돌연변이는 a) 위치 79에서 글리신 잔기에 대한 세린 치환; b) 위치 107에서 프롤린 잔기에 대한 세린 치환; c) 위치 382에서 프롤린 잔기에 대한 세린 치환; 및 d) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, 상기 NND3 돌연변이체 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소 유전자 및 CYP82E5 니코틴 탈메틸효소 유전자에서 상기 개시한 바와 같은 하나 이상의 돌연변이를 더 포함하고 있다. 적절하게는, 상기 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소 유전자 및 CYP82E10 니코틴 탈메틸효소 유전자에서 상기 개시한 바와 같은 하나 이상의 돌연변이를 더 포함하고 있다. 적절하게는, 상기 담배 식물 또는 식물 세포는 CYP82E5 니코틴 탈메틸효소 유전자 및 CYP82E10 니코틴 탈메틸효소 유전자에서 상기 개시한 바와 같은 하나 이상의 돌연변이를 더 포함하고 있다. 적절하게는, 상기 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소 유전자 및 CYP82E5 니코틴 탈메틸효소 유전자 및 CYP82E10 니코틴 탈메틸효소 유전자에서 상기 개시한 바와 같은 하나 이상의 돌연변이를 더 포함하고 있다.
적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 33(G79S)에 기재된 서열을 포함하고 있다.
적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 34 (P107S)에 기재된 서열을 포함하고 있다.
적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 35 (P382S)에 기재된 서열을 포함하고 있다.
적절하게는, 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13(W329Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24(W422Stop)에 기재된 서열을 포함하고 있으며, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 (P419S)에 기재된 서열을 포함하고 있다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 419에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 79에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 107에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 382에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 위치 79에서 글리신 잔기에 대한 세린 치환이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 위치 107에서 프롤린 잔기에 대한 세린 치환이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환이다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 25의 아미노산 잔기 329에서 발생하고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 아미노산 잔기 422에서 발생하고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 아미노산 잔기 419에서 발생한다.
적절하게는, NND3 돌연변이 담배 식물 또는 식물 세포는 CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 더 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E4 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환이고, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈이고, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 동형접합 돌연변이를 포함하고 있으며, 여기서 상기 돌연변이는 상기 CYP82E10 니코틴 탈메틸효소의 발현 또는 기능 감소 결과를 초래하고 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환이다.
적절하게는, 상기 식물, 식물 세포 식물 재료 또는 본 발명에 따라 수득되었거나 수득가능한 상기 (건조된) 담배 제품 등은 약 1.0% 미만, 약 0.9% 미만, 약 0.8% 미만, 약 0.7% 미만, 약 0.6% 미만, 약 0.5 미만, 약 0.4% 미만, 약 0.3% 미만, 약 0.2% 미만 또는 약 0.1% 미만의 니코틴의 노르니코틴으로의 변환을 가진다. 상기 변환 %는 식 [노르니코틴%/(노르니코틴% + 니코틴%)] x 100을 사용하여 산출된다.
적절하게는, 상기 식물, 식물 세포 식물 재료 또는 본 발명에 따라 수득되었거나 수득가능한 상기 (건조된) 담배 제품 등은 건조 중량을 기준으로 약 0.04% 미만, 약 0.03% 미만, 약 0.02% 미만 또는 약 0.01% 미만의 노르니코틴을 가진다.
상기 NND3 돌연변이체 담배 식물 또는 식물 세포는 돌연변이(들)에 대해 이형접합성 또는 동형접합성일 수 있다. 상기 NND3 돌연변이체 담배 식물 또는 식물 세포는 적어도 하나의 돌연변이에 대해 이형접합성이고 적어도 하나의 다른 돌연변이에 대해 동형접합성일 수 있다.
또한 노르니코틴의 수준을 감소시키거나, 또는 니코틴의 노르니코틴으로의 변환율을 감소시키거나, 또는 (건조된) 담배 식물 내 또는 (건조된) 담배 식물 물질 내 적어도 NNN의 수준을 감소시키는 방법이 제공되어 있으며, 상기 방법은 적어도 하나의 니코틴 탈메틸효소 유전자의 발현을 감소시키는 하나 이상의 돌연변이를 상기 식물의 유전체 내로 도입하는 단계를 포함하고, 여기서 상기 적어도 하나의 니코틴 탈메틸효소 유전자는 NND3를 암호화한다. 적절하게는, NND3의 돌연변이(들)에 더하여, 하나 이상의 돌연변이가 적어도 1개, 2개 또는 3개 또는 그 이상의 추가 니코틴 탈메틸효소 유전자의 적어도 한 개의 대립유전자 내로 도입될 수도 있고, 여기서 상기 유전자들은 상기에서 논의한 바와 같은 CYP82E4, CYP82E5 및 CYP82E10 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택된다.
또한, 낮은 노르니코틴 수준 또는 적어도 NNN의 낮은 수준을 갖는 담배 식물을 식별하기 위한 방법이 제공되어 있으며, 상기 방법은, 관심 있는 담배 식물로부터의 핵산 시료를 서열번호 1 또는 2에서 하나 이상의 돌연변이의 존재에 대해 스크리닝하는 단계, 그리고 선택적으로 상기 식별된 돌연변이(들)를 노르니코틴 또는 NNN의 수준을 조절하는 것으로 공지된 돌연변이(들)와 연관시키는 단계를 포함하고 있다. 적절하게는, 상기 방법은 상기 핵산 시료, 또는 관심 있는 상기 담배 식물로부터의 또 다른 핵산 시료를, 서열번호 5에서 돌연변이의 존재, 서열번호 12에서 돌연변이의 존재, 또는 서열번호 19에서 돌연변이의 존재에 대해 스크리닝하는 단계, 그리고 선택적으로 상기 식별된 돌연변이(들)를 노르니코틴 또는 NNN의 수준을 조절하는 것으로 공지된 돌연변이(들)와 연관시키는 단계를 포함하고 있다.
또한 NND3를 암호화하는 유전자, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자, CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자, 및 CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서 돌연변이에 대해 이형접합성 또는 동형접합성인 담배 식물 또는 식물 세포가 개시되어 있으며, 여기서 상기 돌연변이는 NND3, CYP82E10, CYP82E4, 및 CYP82E5 니코틴 탈메틸효소의 발현 또는 기능 감소를 초래한다.
본원에 기재한 바와 같이, 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 NND3 유전자 또는 폴리펩티드에서 하나 이상의 이형접합 또는 동형접합 돌연변이, 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E10 유전자 또는 폴리펩티드에서 하나 이상의 이형접합 또는 동형접합 돌연변이, 노화 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E4 유전자 또는 폴리펩티드에서 하나 이상의 이형접합 또는 동형접합 돌연변이, 및 녹색 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP83E5 유전자 또는 폴리펩티드에서 하나 이상의 돌연변이를 포함하거나, 이로 구성되거나, 필수적으로 구성되는 담배 식물 또는 식물 세포 가 기재되어 있다.
생식 교배를 포함하는 다수의 접근방식이 한 식물에서 돌연변이를 조합하는 데 이용할 수 있다. 니코틴 탈메틸효소를 감소시키는 NND3에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물이 니코틴 탈메틸효소 활성을 감소시키는 CYP82E4, CYP82E5 및 CYP82E10 중 하나 이상에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배될 수 있다. 한 구현예에서, 교배는 동일한 식물 내에 NND3와 CYP82E10 또는 NND3와 CYP82E4 또는 NND3와 CYP82E5 내에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 도입하기 위해 이루어진다. 이런 식으로, 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 NND3에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물이, 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E10에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배되거나, 또는 노화 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E4에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배되거나, 또는 녹색 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP83E5유전자에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배된다. 또 다른 구현예에서, 교배는 동일한 식물 내에 NND3, CYP82E10 및 CYP82E4 내에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 도입하기 위해 이루어진다. 이런 식으로, 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 NND3에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물이, 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E10에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배되고, 노화 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E4에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배된다. 또 다른 구현예에서, 교배는 동일한 식물 내에 NND3, CYP82E10 및 CYP82E5 내에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 도입하기 위해 이루어진다. 이런 식으로, 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 NND3에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물이, 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E10에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배되고, 녹색 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP83E5 에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배된다. 또 다른 구현예에서, 교배는 동일한 식물 내에 NND3, CYP82E4 및 CYP82E5 내에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 도입하기 위해 이루어진다. 이런 식으로, 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 NND3에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물이, 노화 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E4에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배되고, 녹색 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP83E5 에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배된다. 또 다른 구현예에서, 교배는 시료 식물 내에 NND3, CYP82E4, CYP82E5 및 CYP82E10 내에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 도입하기 위해 이루어진다. 이런 식으로, 꽃 (예를 들어, 미성숙 꽃, 성숙 꽃, 미성숙 캡슐, 건조 캡슐) 및 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 NND3에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물이, 뿌리에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E10에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배되고, 노화 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP82E4에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배되고, 녹색 잎에서 니코틴 탈메틸효소 활성을 감소시키는 CYP83E5 에서 하나 이상의 바람직한 이형접합 또는 동형접합 돌연변이를 갖는 식물과 교배된다. 니코틴 탈메틸효소 내로 하나 이상의 바람직한 돌연변이(들)-예컨대 본원에 기재되어 있는 바람직한 돌연변이-를 도입하여, 감소되거나 무시할 수준이거나 검출가능하지 않은 니코틴의 노르니코틴으로의 변환을 갖는 식물 또는 그 대사산물 또는 감소되거나 무시할 수준이거나 검출가능하지 않은 NNN를 갖는 식물을 생산하는 것이 가능하다
담배 식물에서 니코틴을 노르니코틴 또는 그 대사산물로 변환시키는 데에 있어서 하나 이상의 니코틴 탈메틸효소 폴리펩티드의 활성은, 변환 활성이 그 니코틴 탈메틸효소 폴리펩티드의 변환 활성을 억제하도록 변형되지 않았으며 동일한 프로토콜을 사용하여 배양되고 수확된 담배 식물에서 동일한 탈메틸효소 폴리펩티드(들)의 변환 활성 보다 통계적으로 낮은 경우에 본 발명에 따라 감소되거나 억제된다. 담배 식물에서 니코틴을 노르니코틴으로 변환시키는 데에 있어서 니코틴 탈메틸효소 폴리펩티드의 활성은, 본원에 기재된 검정 방법에 의해 검출가능하지 않을 때 제거되는 것으로 간주된다. 담배 식물에서 니코틴을 노르니코틴으로 변환시키는 데에 있어서 니코틴 탈메틸효소 폴리펩티드의 활성을 결정하는 방법들이 본원에 기재되어 있다.
일부 구현예에서, 상기 바람직한 돌연변이(들)는 돌연변이유발 접근방법을 이용하여 담배 식물 또는 식물 세포 내로 도입되며, 상기 도입된 돌연변이는 본 기술분야의 숙련자들에게 공지된 방법들-예컨대 서던 블롯(Southern blot) 분석, DNA 시퀀싱, PCR 분석, 또는 표현형 분석을 이용하여 식별되거나 선택된다. 유전자 발현에 영향을 주는 돌연변이 또는 암호화된 단백질의 기능을 방해하는 돌연변이는 본 기술분야에 주지된 방법을 사용하여 결정될 수 있다. 유전자 엑손에서의 삽입성 돌연변이는 일반적으로 결손 돌연변이체를 초래한다. 보존된 잔기에서의 돌연변이는 암호화된 단백질의 대사 기능을 억제하는 데 특히 효과적일 수 있다.
돌연변이체 폴리뉴클레오티드와 폴리펩티드를 수득하기 위한 방법이 또한 개시되어 있다. 식물 세포 또는 식물 재료를 포함해서, 관심있는 임의의 식물은 자리-특이적 돌연변이 유발, 올리고뉴클레오티드-특이적 돌연변이 유발, 화학적-유도 돌연변이 유발, 방사-유도 돌연변이 유발, 변형된 염기를 이용하는 돌연변이 유발, 간격 이중체 DNA(gapped duplex DNA)를 이용하는 돌연변이 유발, 이중가닥 파괴 돌연변이 유발, 수선-결핍 숙주 균을 이용하는 돌연변이 유발, 총 유전자 합성에 의한 돌연변이 유발, DNA 셔플링(shuffling) 및 기타 동등한 방법들을 포함해서, 돌연변이 유발을 유도하기 위해서 공지된 다양한 방법에 의해 유전적으로 변형될 수 있다.
NND3 폴리뉴클레오티드와 그에 의해 암호화된 폴리펩티드의 단편들이 또한 개시되어 있다. 폴리뉴클레오티드의 단편들은 고유의 단백질의 생물학적 활성을 보유하고 이에 따라 대사적인 니코틴의 노르니코틴으로의 변환에 관여하는 단백질의 단편들을 암호화할 수도 있다. 대안적으로, 혼성화 탐침 또는 PCR 프라이머로서 유용한 폴리뉴클레오티드의 단편들은 일반적으로 생물학적 활성을 보유하는 단편 단백질을 암호화하지 않는다. 또한, 개시된 뉴클레오티드 서열의 단편들은 본원에 논의된 바와 같이, 재조합 구성체 내에 조립될 수 있는 것들을 포함한다. 폴리뉴클레오티드 서열의 단편들은 적어도 약 25개 뉴클레오티드, 적어도 약 50개 뉴클레오티드, 적어도 약 75개 뉴클레오티드, 적어도 약 100개 뉴클레오티드, 적어도 약 150개 뉴클레오티드, 적어도 약 200개 뉴클레오티드, 적어도 약 250개 뉴클레오티드, 적어도 약 300개 뉴클레오티드, 적어도 약 400개 뉴클레오티드, 적어도 약 500개 뉴클레오티드, 적어도 약 600개 뉴클레오티드, 적어도 약 700개 뉴클레오티드, 적어도 약 800개 뉴클레오티드, 적어도 약 900개 뉴클레오티드, 적어도 약 1000개 뉴클레오티드, 적어도 약 1100개 뉴클레오티드, 적어도 약 1200개 뉴클레오티드, 적어도 약 1300개 뉴클레오티드, 적어도 약 1400개 뉴클레오티드 및 본원에 기재된 폴리펩티드를 암호화하는 최대 전장 폴리뉴클레오티드 범위일 수도 있다. 폴리펩티드 서열의 단편들은 적어도 약 25개 아미노산, 적어도 약 50개 아미노산, 적어도 약 75개 아미노산, 적어도 약 100개 아미노산, 적어도 약 150개 아미노산, 적어도 약 200개 아미노산, 적어도 약 250개 아미노산, 적어도 약 300개 아미노산, 적어도 약 400개 아미노산, 적어도 약 500개 아미노산, 및 본원에 기재된 최대 전장 폴리펩티드 범위일 수도 있다.
돌연변이 폴리펩티드 변이체는 하나 이상의 돌연변이 폴리펩티드 변이체를 포함하는, 비-자연 발생 돌연변이 또는 유전자전환 식물(예를 들어, 돌연변이, 비-자연 발생, 형질전환, 인공 또는 유전자 조작 식물) 또는 식물 세포를 형성하는 데에 사용될 수 있다. 적절하게는, 돌연변이 폴리펩티드 변이체는 돌연변이되지 않은 폴리펩티드의 활성을 보유한다. 돌연변이 폴리펩티드 변이체의 활성은 돌연변이되지 않은 폴리펩티드보다 높거나, 낮거나 또는 거의 동일할 수도 있다.
본원에 기재된 뉴클레오티드 서열 및 폴리펩티드에서의 돌연변이는 인공 돌연변이 또는 합성 돌연변이 또는 유전자 조작 돌연변이를 포함할 수 있다. 본원에 기재된 뉴클레오티드 서열 및 폴리펩티드에서의 돌연변이는 시험관 내 또는 생체 내 조작 단계를 포함하는 공정을 통해서 수득되거나 또는 수득가능한 돌연변이일 수 있다. 본원에 기재된 뉴클레오티드 서열 및 폴리펩티드에서의 돌연변이는 인간에 의한 개입을 포함하는 공정을 통해서 수득되거나 또는 수득가능한 돌연변이일 수 있다. 예시로서, 공정은 예컨대 돌연변이 유발, 기형 발생, 또는 발암성 유기 화합물, 예를 들어 에틸 메탄술포네이트(EMS) 같은 외인성 첨가 화학물질을 사용하는 돌연변이 유발을 포함할 수도 있는데, 이것은 유전 물질에서 무작위 돌연변이를 생성한다. 추가적인 예시로서, 공정은 본원에 기재된 하나 이상의 유전자 조작 단계와 같은 하나 이상의 유전자 조작 단계 또는 그의 조합을 포함할 수도 있다. 추가적인 실시예에 의해서, 공정은 하나 이상의 식물 교배 단계를 포함할 수도 있다.
폴리펩티드는 형질전환 또는 재조합 숙주 세포를 폴리펩티드를 발현하기에 적합한 배양 조건 하에서 배양하여 제조될 수도 있다. 그런 다음 결과물인 발현된 폴리펩티드는 공지의 정제 공정을 이용해서 이러한 배양물로부터 정제될 수도 있다. 폴리펩티드의 정제는 폴리펩티드에 결합할 시약을 함유하는 친화도 컬럼; 이러한 친화도 수지에 대한 하나 이상의 컬럼 단계; 소수성 상호작용 크로마토그래피와 연관된 하나 이상의 단계; 또는 면역친화도 크로마토그래피를 포함할 수도 있다. 대안적으로, 폴리펩티드는 또한 정제를 용이하게 하는 형태로 발현될 수도 있다. 예를 들면, 그것은 말토오스 결합 폴리펩티드, 글루타티온-5-전이효소, his-tag 또는 티오레독신의 폴리펩티드들과 같은, 융합 폴리펩티드로서 발현될 수도 있다. 융합 폴리펩티드의 발현 및 정제를 위한 키트는 시판중이다. 폴리펩티드는 에피토프(epitope)에 태그되고 후속으로 이러한 에피토프에 유도되는 특정한 항체를 사용하여 정제될 수도 있다. 폴리펩티드르 추가적으로 정제하기 위하여 역상 고성능 액체 크로마토그래피와 같은, 하나 이상의 액체 크로마토그래피 단계가 이용될 수 있다. 상기 정제 단계의 일부 또는 전부는 다양하게 조합되어서 실질적으로 상동성인 재조합 폴리펩티드를 제공하기 위해 이용될 수 있다. 이렇게 정제된 폴리펩티드에는 다른 폴리펩티드가 사실상 없고 "실질적으로 정제된 폴리펩티드"로서 본원에서 정의되고; 이러한 정제된 폴리펩티드는 폴리펩티드, 단편, 변이체 기타 등등을 포함한다. 폴리펩티드와 단편의 발현, 단리, 및 정제는 이에만 한정하는 것은 아니지만 본원에 기재된 방법을 포함해서, 임의의 적절한 기술에 의해 달성될 수 있다.
발현된 폴리펩티드를 친화도-정제하기 위해서, 폴리펩티드에 대해 생성된 모노클로날 항체와 같은 친화도 컬럼을 이용하는 것이 또한 가능하다. 이러한 폴리펩티드는, 예를 들어, 사용을 위해서 고염 용리 완충액 이후 저염 완충액으로 투석하거나 또는 이용되는 친화도 매트릭스에 따라 pH 또는 다른 성분을 변화시키는 종래의 기술을 이용하여 친화도 컬럼으로부터 제거되거나, 또는 친화도 부분의 자연 발생 기질을 사용하여 경쟁적으로 제거될 수 있다.
단리된 또는 실질적으로 정제된 폴리뉴클레오티드 또는 단백질 조성물이 개시되어 있다. “단리된” 또는 “정제된” 폴리뉴클레오티드 또는 단백질, 또는 이들의 생물학적 활성 부분은, 자연적으로 발생하는 환경에서 발견되는 폴리뉴클레오티드 또는 단백질과 일반적으로 동반하거나 상호 작용하는 구성성분이 실질적으로 또는 본질적으로 없다. 따라서, 단리된 또는 정제된 폴리뉴클레오티드 또는 단백질은 재조합 기술에 의해 생산된 경우 기타 세포 물질, 또는 배양 배지가 실질적으로 없거나, 화학적으로 합성된 경우 화학적 전구체나 기타 화학물질이 실질적으로 없다. 선택적으로, “단리된” 폴리뉴클레오티드는 폴리뉴클레오티드가 유도되는 유기체의 게놈 DNA에서 자연적으로 폴리뉴클레오티드(예를 들어, 폴리뉴클레오티드의 5’ 및 3’ 말단에 위치한 서열) 측면에 배치되는 서열(선택적으로 단백질 암호화 서열)이 없다. 예를 들어, 다양한 구현예에서, 단리된 폴리뉴클레오티드는 폴리뉴클레오티드가 유도되는 세포의 게놈 DNA에서 자연적으로 폴리뉴클레오티드 측면에 배치되는 뉴클레오티드 서열을 약 5kb, 4kb, 3kb, 2kb, 1kb, 0.5kb, 또는 0.1kb 미만 함유할 수 있다. 세포 물질이 실질적으로 없는 단백질은 약 30%, 20%, 10%, 5%, 또는 1% 미만(건조 중량 기준)의 악성화 단백질을 갖는 단백질 제제를 포함하고 있다.
또한 폴리펩티드는 공지의 종래의 화학적 합성에 의해서 제조될 수도 있다. 합성 수단에 의해서 폴리펩티드 또는 그의 단편을 구성하기 위한 방법은 본 기술분야의 숙련자에게 공지되어 있다. 고유한 폴리펩티드와 1차, 2차 또는 3차 구조 또는 형태 특성을 공유하기 때문에, 합성적으로 구성된 폴리펩티드 서열은 생물학적 활성을 포함해서, 일반적인 생물학적 특성을 가질 수도 있다.
본원에서 사용되는 용어 ‘비-자연 발생(비-자연 발생)’은 자연적으로 형성되지 않거나 또는 자연에 존재하지 않는 실체(예를 들어, 폴리뉴클레오티드, 유전자 돌연변이, 폴리펩티드, 식물, 식물 세포 및 식물 재료)를 기재한 것이다. 이러한 비-자연 발생 실체 또는 인위적인 실체는 본원에 기재된 방법 또는 본 기술분야에 공지된 방법에 의해서 제조, 합성, 개시, 변형, 개입, 또는 조작될 수도 있다. 이러한 비-자연 발생 실체 또는 인위적인 실체는 사람에 의해서 제조, 합성, 개시, 변형, 개입, 또는 조작될 수도 있다. 따라서 예시에 의해서, 비-자연 발생 식물, 비-자연 발생 식물 세포 또는 비-자연 발생 식물 재료는 역교배와 같은 통상적인 식물 육종 기술을 사용해서나 안티센스 RNA, 간섭성 RNA, 메가뉴클레아제 및 기타 등등과 같은 유전자 조작 기술에 의해서 제조될 수도 있다. 추가적인 예시에 의해서, 비-자연 발생 식물, 비-자연 발생 식물 세포 또는 비-자연 발생 식물 재료는 제1 식물 또는 식물 세포로부터 제2 식물 또는 식물 세포(그 자체는 자연적으로 발생할 수도 있음)로 하나 이상의 유전자 돌연변이 (예를 들어 하나 이상의 다형성)를 유전자이입 또는 전달하여 제조됨으로써, 그 결과물인 식물, 식물 세포 또는 식물 재료 또는 그의 후손은 자연적으로 형성되지 않거나 또는 자연에 존재하지 않는 유전자 구성(예를 들어, 유전체, 염색체 또는 그의 단편)을 포함할 수 있게 된다. 따라서 생성된 식물, 식물 세포 또는 식물 재료는 인공적이거나 또는 비-자연 발생한 것이다. 따라서, 생성된 유전자 서열이 제1 식물 또는 식물 세포로부터의 상이한 유전적 배경을 포함하는 제2 식물 또는 식물 세포에서 자연 발생하더라도, 인공적이거나 또는 비-자연 발생 식물 또는 식물 세포는 제1 자연 발생 식물 또는 식물 세포에서 유전자 서열을 변형하여 제조될 수도 있다. 소정의 구현예들에서, 돌연변이는 유전자 또는 단백질 같은 뉴클레오티드 서열 또는 폴리펩티드에 자연적으로 존재하는 자연 발생 돌연변이가 아니다.
유전적 배경에서의 차이는 핵산 서열결정, 유전자 마커(예를 들어, 현미부수체(microsatellite) RNA 마커)의 존재 여부와 같은, 본 기술분야에 공지된 표현형 차이에 의하거나 분자 생물학 기술에 의해서 검출될 수 있다.
본원에 기재된 폴리펩티드에 면역반응성이 있는 항체가 또한 제공된다. 본원에서 기재한 폴리펩티드, 단편, 변이체, 융합 폴리펩티드, 기타 등등은 그것에 면역반응성이 있는 항체를 생산하는 "면역원"으로서 이용될 수 있다. 이러한 항체는 항체의 항원-결합 자리를 통해서 폴리펩티드에 특이적으로 결합할 수도 있다. 특이적으로 결합하는 항체는 폴리펩티드, 상동체, 및 변이체를 특이적으로 인식하고 결합하지만, 다른 분자들과는 그렇지 않다. 한 구현예에서, 항체는 본원에서 개시된 아미노산 서열을 가지는 폴리펩티드에 대해 특이적이고, 다른 폴리펩티드와 교차 반응하지 않는다.
더욱 특이하게는, 폴리펩티드, 단편, 변이체, 융합 폴리펩티드, 기타 등등은 항체 형성을 이끌어내는 항원 결정기 또는 에피토프를 함유하고 있다. 이러한 항원 결정기 또는 에피토프는 선형이든지 입체형태(불연속적)일 수 있다. 입체형태 또는 불연속적인 에피토프는 폴리펩티드 접힘 시에 매우 근접하게 되는 폴리펩티드 사슬의 다른 영역들로부터의 아미노산 부위로 구성되어 있는 반면, 선형 에피토프는 폴리펩티드의 아미노산의 단일 부위로 구성되어 있다. 에피토프는 본 기술분야에 공지된 방법에 의해 식별될 수 있다. 추가적으로, 폴리펩티드 유래 에피토프는 분석시에 연구 시약으로 사용될 수 있고, 배양된 혼성세포에서 폴리클로날 항체 혈청 또는 상청액과 같은 물질로부터의 특이적 결합 항체를 정제하는 데에 사용될 수 있다. 이러한 에피토프 또는 그의 변이체는 고체상 합성, 폴리펩티드의 화학적 또는 효소 분해, 또는 재조합 DNA 기술을 사용하는 것과 같은 본 기술분야에 공지된 기술을 사용하여 생산될 수 있다.
폴리펩티드에 대한 폴리클로날 항체 및 모노클로날 항체는 모두 종래의 기술에 의해 제조될 수 있다. 또한 폴리펩티드에 대해 특이적인 모노클로날 항체를 생산하는 혼성 세포주도 본원에서 고려된다. 이러한 혼성세포는 종래의 기술에 의해서 제조되고 식별될 수 있다. 항체 생산의 경우, 다양한 숙주 동물들은 폴리펩티드, 단편, 변이체, 또는 그의 돌연변이를 주입해서 면역시킬 수 있다. 이러한 숙주 동물은 이에만 한정하는 것은 아니지만 몇 가지만 예를 들면 토끼, 마우스와 랫트를 포함할 수도 있다. 다양한 항원보강제가 면역 반응을 증가시키는 데에 사용될 수도 있다. 숙주 종에 따라, 그러한 항원보강제는 이들에만 한정되지 않지만, 프로인트(Freund's) (완전 및 불완전), 수산화알루미늄 같은 미네랄 겔, 리졸레시틴 같은 계면 활성 물질, 플루로닉 폴리올, 다중 음이온, 펩티드, 유유제, 키홀 림펫 헤모시아닌, 디니트로페놀, 및 BCG (bacille Calmette-Guerin) 및 코리네박테리움 포자충 같은 잠재적으로 유용한 인간 항원보강제를 포함한다. 모노클로날 항체는 종래의 기술에 의해 회수될 수 있다. 이러한 모노클로날 항체는 IgG, IgM, IgE, IgA, IgD, 및 그의 서브클래스를 포함하는 임의의 면역글로불린 클래스 중 하나일 수도 있다.
또한 항체는 시험관 내 또는 생체 내에서 폴리펩티드 또는 단편의 존재를 검출하기 위한 분석에 사용될 수 있다. 항체는 면역친화도 크로마토그래피에 의해 폴리펩티드 또는 단편을 정제하는 데에 이용될 수 있다.
돌연변이 유발 이외에, NND3, CYP82E4, CYP82E5 또는 CYP82E10으로 이루어진 군 또는 이들의 두 개, 세 개, 네 개의 조합(예, NND3, CYP82E4, CYP82E5 및 CYP82E10의 조합)으로부터 선택된 폴리뉴클레오티드 또는 폴리펩티드 중 하나 이상의 발현 또는 활성을 조절시킬 수 있는 조성물은 이들에만 제한하지는 않지만, 하나 이상의 내인성 유전자(들)의 전사를 간섭할 수 있는 서열-특이적 폴리뉴클레오티드; RNA 전사체(예를 들어, 이중가닥 RNA, siRNA, 리보자임)의 번역을 간섭할 수 있는 서열-특이적 폴리뉴클레오티드; 하나 이상의 단백질의 안정성을 간섭할 수 있는 서열-특이적 폴리펩티드; 기질 또는 조절 단백질과 관련해서 하나 이상의 단백질의 효소 활성 또는 하나 이상의 단백질의 결합 활성을 간섭할 수 있는 서열-특이적 폴리뉴클레오티드; 하나 이상의 단백질에 대한 특이성을 나타내는 항체; 하나 이상의 단백질의 안정성 또는 하나 이상의 단백질의 효소 활성 또는 하나 이상의 단백질의 결합 활성을 간섭할 수 있는 소분자 화합물; 하나 이상의 폴리뉴클레오티드를 결합하는 아연 집게 단백질; 및 하나 이상의 폴리뉴클레오티드에 대한 활성을 가지는 메가뉴클레아제를 포함한다. 유전자 편집 기술, 유전적 편집 기술 및 유전체 편집 기술이 본 기술분야에 주지되어 있다.
한 가지 유전자 편집 방법은 세포가 수선 메커니즘에 반응할 수 있는 이중가닥 파단을 유도하는 전사 활성제-유사 효과기 뉴클레아제(transcription activator-like effector nuclease; TALEN)를 사용하는 것을 포함한다. 비-상동 말단 연결은 결합을 위한 서열 중첩이 거의 없거나 전무한 경우에 이중가닥 파단의 각 측으로부터 DNA를 다시 연결한다. 이러한 수선 메커니즘은 삽입 또는 결실, 또는 염색체 재배열을 통해 유전체의 오류를 유발한다. 그러한 임의의 오류는 비-기능성 위치에서 암호화되는 유전자 산물을 제공할 수도 있다. 또 다른 유전자 편집 방법은 세균 CRISPR/Cas 시스템의 사용을 포함한다. 세균과 고세균은 바이러스 및 플라스미드 DNA를 침입하는 것에 대항하는 적응성 면역 시스템의 일부인 CRISPR(clustered regularly interspaced short palindromic repeats)이라고 불리는 염색체 요소를 보여주고 있다. II 유형 CRISPR 시스템에서, CRISPR RNA(crRNA)는 trans-activating crRNA (tracrRNA) 및 CRISPR-associated (Cas) 단백질로 기능해서 표적 DNA의 이중가닥 파단을 도입한다. Cas9에 의한 표적 절단은 crRNA과 tracrRNA 사이의 염기 쌍 뿐만 아니라 crRNA와 표적 DNA 사이의 염기 쌍이 필요하다. 표적 인식은 NGG 서열을 따르는 protospacer-adjacent motif (PAM)라고 불리는 짧은 모티브의 존재에 의해 촉진된다. 이 시스템은 유전체 편집을 위해 이용될 수 있다. Cas9은 보통 crRNA 및 tracrRNA으로 이루어진 이중 RNA에 의해 프로그래밍된다. 그러나, 이들 RNA의 코어 성분은 Cas9 표적화를 위한 단일 혼성체 '가이드 RNA'에 결합될 수 있다. 자리 특이적 절단을 위한 표적 DNA에 대해 비-암호화 RNA 가이드를 사용하면 TALEN 같은 기존의 기술보다 훨씬 더 간단하다는 것을 약속한다. CRISPR/Cas 전략을 사용하여, 뉴클레아제 복합체를 재표적화하는 것은 단지 새로운 RNA 서열의 도입만을 필요로 하며, 단백질 전사 인자의 특이성을 재조작할 필요가 없다.
안티센스 기술은 폴리펩티드의 발현을 조절하는 데 사용될 수 있는 다른 주지의 방법이다. 억제될 유전자의 폴리뉴클레오티드는 클로닝되고 조절 영역 및 전사 종결 서열에 작동가능하게 연결되어서 RNA의 안티센스 가닥이 전사될 수 있게 된다. 그런 다음 재조합 구성체는 식물 세포 내로 형질전환되고 RNA의 안티센스 가닥이 생산된다. 폴리뉴클레오티드는 억제될 유전자의 전체 서열일 필요는 없지만, 전형적으로 억제될 유전자의 센스 가닥의 적어도 일부분에 실질적으로 상보적일 것이다.
폴리뉴클레오티드는 리보자임, 또는 촉매 RNA 내로 전사될 수도 있는데, 이것은 mRNA의 발현에 영향을 미친다. 리보자임은 사실상 어느 표적 RNA에 특정하게 쌍을 이루도록 고안되고 그리고 특정 위치에서 포스포디에스테르 구조를 절단할 수 있고, 그에 의해서 표적 RNA를 기능적으로 불활성시킬 수 있다. 이형 폴리뉴클레오티드는 특정한 mRNA 전사체를 절단하도록 고안된 리보자임을 인코딩함에 따라, 폴리펩티드의 발현을 막을 수 있다. 자리-특이적 인식 서열에서 mRNA를 절단하는 다양한 리보자임이 사용될 수 있지만, 망치머리형 리보자임(hammerhead ribozyme)이 특정한 mRNA를 파괴하는 데 유용하다. 망치머리형 리보자임은 표적 mRNA와 상보적인 염기쌍을 형성하는 측면영역(flanking region)에 의해 생긴 위치에서 mRNA를 절단한다. 유일한 요건은 표적 RNA가 5'-UG-3' 뉴클레오티드 서열을 함유하는 것이다. 망치머리형 리보자임의 구조 및 생산이 본 기술분야에 공지되어 있다. 망치머리형 리보자임 서열은 전달 RNA (tRNA) 같은 안정적인 RNA에 끼어 들어가서 생체 내 절단 효능을 증가시킬 수 있다.
한 구현예에서, RNA 전사체(들)의 번역을 간섭할 수 있는 서열-특이적 폴리뉴클레오티드는 RNA를 간섭한다. RNA 간섭 또는 RNA 침묵(silencing)은 특이적인 mRNA가 효소 변성을 목표로 삼을 수 있는 진화적으로 보존되는 공정이다. 이중가닥 RNA(이중가닥 RNA)는 세포 (예를 들어, 이중가닥 RNA 바이러스, 또는 간섭 RNA 폴리뉴클레오티드)에 의해서 도입되거나 또는 생산되어서 간섭 RNA 경로를 개시한다. 이중가닥 RNA는 RNases III에 의한 21-24 bp 길이의 다중 작은 간섭 RNA(small interfering RNA; siRNA) 이중체로 변환될 수 있고, 이것은 이중가닥 RNA-특이적 엔도뉴클레아제이다. siRNA는 ATP-의존 공정을 통해서 siRNA의 풀림을 촉진하는 RNA-유도 침묵 복합체에 의해 후속적으로 인식될 수 있다. siRNA의 풀린 안티센스 가닥은 활성화된 RNA-유도 침묵 복합체를, siRNA 안티센스 가닥에 대해 상보적인 서열을 포함하는 표적 mRNA로 유도한다. 표적 mRNA 및 안티센스 가닥은 A-형 나선을 형성할 수 있고, A형 나선의 주된 홈(groove)은 활성화된 RNA-유도 침묵 복합체에 의해 인식될 수 있다. 표적 mRNA는 siRNA 가닥의 5'-말단의 결합 자리에 의해서 정의되는 하나의 자리에서 활성화된 RNA-유도 침묵 복합체에 의해서 절단될 수 있다. 활성화된 RNA-유도 침묵 복합체는 또 다른 절단 경우를 촉매하기 위해서 재활용될 수 있다.
간섭 RNA 발현 벡터는 mRNA, pre-mRNA, 또는 관련 RNA 변이체의 발현 수준을 감소시켜서 RNA 간섭 활성을 나타내는 간섭 RNA 폴리뉴클레오티드를 인코딩하는 간섭 RNA 구성체를 포함할 수도 있다. 발현 벡터는 본원에서 더 설명된 바와 같이, 상류에 위치하고 간섭 RNA 구성체에 작동가능하게 연결되어 있는 프로모터를 포함할 수도 있다. 간섭 RNA 발현 벡터는 전사 종결 및 폴리아데닐화 신호, 및 다양한 선택성 마커와 같은 본 기술분야의 숙련자에게 공지된 다른 서열을 포함해서, 적절한 최소 코어 프로모터, 관심있는 간섭 RNA 구성체, 상류 (5') 조절 영역, 하류 (3') 조절 영역을 포함할 수도 있다.
폴리뉴클레오티드는 이중가닥 구조(즉, 안티센스 가닥과 상보성 센스 가닥을 포함하는 이중가닥 RNA 분자), 이중가닥 헤어핀-유사 구조, 또는 단일가닥 구조(즉, 단지 안티센스 가닥을 포함하는 ssRNA 분자)를 포함해서, 다양한 형태로 생산될 수 있다. 구조는 자가-상보성 센스 및 안티센스 가닥을 가지는, 이중체, 비대칭 이중체, 헤어핀 또는 비대칭 헤어핀 2차 구조를 포함할 수도 있다. 이중가닥 간섭 RNA는 이중가닥 siRNA로 효소적으로 변환될 수 있다. siRNA 이중체의 가닥 중 하나는 표적 mRNA 및 관련 RNA 변이체 내에서 상보성 서열에 결합(anneal)할 수 있다. siRNA/mRNA 이중체는 서열-의존 방식으로 다수 자리에서 RNA를 절단할 수 있는 RNA-유도 침묵 복합체에 의해서 인식되고, 그 결과 표적 mRNA 및 관련 RNA 변이체의 변성을 야기한다.
이중가닥 RNA 분자는 줄기-고리 구조의 단일 올리고뉴클레오티드로부터 조립된 siRNA, 뿐만 아니라 자가 상보성 센스 및 안티센스 가닥을 포함하는 2 개 이상의 고리 구조 및 줄기를 가지는 원형 단일가닥 RNA를 포함할 수도 있는데, 여기서 siRNA 분자의 자가-상보적 센스 및 안티센스 영역이 폴리뉴클레오티드계 또는 비-폴리뉴클레오티드계 링커(들)에 의하여 연결된 것이고, 여기서 원형 RNA는 생체 내 또는 시험관 내에서 간섭 RNA를 매개할 수 있는 활성 siRNA 분자를 생성하도록 처리될 수 있다.
작은 헤어핀 RNA 분자들의 용도가 또한 고려된다. 그것들은 역상보성 (센스) 서열과 더불어, 특이적인 안티센스 서열을 포함하는데, 전형적으로 스페이서 또는 루프 서열에 의해서 분리되어 있다. 스페이서 또는 루프의 절단은 단일가닥 RNA 분자 및 그의 역보체를 제공해서, 그들이 결합되어 이중가닥 RNA 분자를 형성할 수도 있다(선택적으로 각각 또는 모든 가닥의 3' 말단 또는 5' 말단에서 한 개, 두 개, 세 개 또는 그 이상의 뉴클레오티드의 첨가 또는 제거를 가져올 수도 있는 후속적인 처리 단계들에 의함). 스페이서는 충분히 길어서, 스페이서 절단(그리고, 선택적으로, 각각 또는 모든 가닥의 3' 말단 또는 5' 말단에서 한 개, 두 개, 세 개, 네 개 또는 그 이상의 뉴클레오티드의 첨가 또는 제거를 가져올 수도 있는 후속적인 처리 단계들) 이전에, 안티센스 및 센스 서열이 이중가닥 구조(또는 줄기)를 결합하고 형성할 수 있게 한다. 스페이서 서열은 일반적으로 이중가닥 폴리뉴클레오티드로 결합될 때, 작은 헤어핀 RNA를 포함하는, 두 개의 상보성 뉴클레오티드 서열 영역 사이에 위치하는 무관한 뉴클레오티드 서열이다. 스페이서 서열은 일반적으로 약 3 내지 약 100개의 뉴클레오티드를 포함하고 있다.
관심있는 RNA 폴리뉴클레오티드는 헤어핀 이중체를 생산하기 위해서 적절한 서열 조성, 루프 크기, 및 줄기 길이를 선택하여 생산될 수 있다. 헤어핀 이중체의 줄기 길이를 고안하기에 적절한 범위는 약 14-30 뉴클레오티드와 같은- 적어도 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20의 뉴클레오티드, 약 30-50 뉴클레오티드, 약 50-100 뉴클레오티드, 약 100-150 뉴클레오티드, 약 150-200 뉴클레오티드, 약 200-300 뉴클레오티드, 약 300-400 뉴클레오티드, 약 400-500 뉴클레오티드, 약 500-600 뉴클레오티드, 및 약 600-700 뉴클레오티드의 줄기 길이를 포함한다. 헤어핀 이중체의 루프 길이를 고안하기에 적절한 범위는, 헤어핀 이중체의 줄기 길이가 상당하다면 약 4-25 뉴클레오티드, 약 25-50 뉴클레오티드 또는 그 이상의 루프 길이를 포함한다. 소정의 구현예들에서, 이중가닥 RNA 또는 ssRNA 분자는 길이가 약 15 내지 약 40의 뉴클레오티드이다. 또 다른 구현예에서, siRNA 분자는 길이가 약 15 내지 약 35의 뉴클레오티드의 이중가닥 RNA 또는 ssRNA 분자이다. 또 다른 구현예에서, siRNA 분자는 길이가 약 17 내지 약 30의 뉴클레오티드 사이의 이중가닥 RNA 또는 ssRNA 분자이다. 또 다른 구현예에서, siRNA 분자는 길이가 약 19 내지 약 25의 뉴클레오티드 사이에 이중가닥 RNA 또는 ssRNA 분자이다. 또 다른 구현예에서, siRNA 분자는 길이가 약 21 내지 약 24 뉴클레오티드의 이중가닥 RNA 또는 ssRNA 분자이다. 소정의 구현예들에서, 21 뉴클레오티드보다 긴 이중체 영역을 가지는 헤어핀 구조는 루프 서열과 길이에 관계없이, 효과적인 siRNA-유도 침묵을 촉진할 수도 있다. RNA 간섭에 대한 예시적인 서열은 서열번호 4에 기재되어 있다.
표적 mRNA 서열은 전형적으로 길이가 약 14 내지 약 50의 뉴클레오티드이다. 따라서, 표적 mRNA는 바람직하게는 표적 서열에 대해 이하의 기준 중 하나 이상을 충족시키는, 약 14 내지 약 50의 뉴클레오티드 길이의 영역이 스캔될 수 있다: 약 2:1 내지 약 1:2의 A+T/G+C 비율; 표적 서열의 5' 말단에서의 AA 디뉴클레오티드 또는 CA 디뉴클레오티드; 표적 mRNA에 고유한 10 이상의 연속된 뉴클레오티드의 서열(즉, 동일한 식물로부터의 다른 mRNA에 존재하지 않는 서열); 및 세 개 넘는 연속된 구아닌(G) 뉴클레오티드 또는 세 개 넘는 연속된 시토신(C) 뉴클레오티드가 "배치(run)"되지 않음. 이러한 기준은 본 기술분야에 공지된 다양한 기술을 이용해서 측정될 수 있는데, 예를 들어 BLAST 같은 컴퓨터 프로그램을 사용해서, 선택된 표적 서열이 표적 mRNA에 대해 고유한지 여부를 결정하기 위해 공개적으로 이용할 수 있는 데이터베이스를 검색할 수 있다. 대안적으로, 표적 서열 (및 고안된 siRNA 서열)은 시판중인 컴퓨터 소프트웨어 (예를 들어, 시판중인 OligoEngine, Target Finder 및 siRNA Design Tool)를 사용해서 선택될 수 있다.
한 구현예에서, 표적 mRNA 서열은 상기 기준 중 하나 이상을 충족시키는, 약 14 내지 약 30 길이의 뉴클레오티드에서 선택된다. 또 다른 구현예에서, 표적 서열은 하나 이상의 상기 기준을 충족시키는, 약 16 내지 약 30 길이의 뉴클레오티드에서 선택된다. 추가적인 구현예에서, 표적 서열은 상기 기준 중 하나 이상을 충족시키는 약 19 내지 약 30 길이의 뉴클레오티드에서 선택된다. 또 다른 구현예에서, 표적 서열은 상기 기준 중 하나 이상을 충족시키는, 약 19 내지 약 25 길이의 뉴클레오티드에서 선택된다.
예시적인 구현예에서, siRNA 분자는 본원에 기재된 임의의 하나의 폴리뉴클레오티드 서열 중의 적어도 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 이상의 연속된 뉴클레오티드에 대해 상보적인 특이적 안티센스 서열을 포함한다.
siRNA 분자에 포함되는 특이적 안티센스 서열은 표적 서열의 보체와 동일하거나, 또는 실질적으로 동일할 수 있다. 한 구현예에서, siRNA 분자에 포함되는 특이적 안티센스 서열은 표적 mRNA 서열의 보체에 대해 적어도 약 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하다. 서열 동일성을 결정하는 방발현벡터법은 본 기술분야에 공지되어 있고, 예를 들면 University of Wisconsion Computer Group (GCG) 소프트웨어 또는 NCBI 웹사이트에서 제공되는 BLASTIN 프로그램을 사용해서 결정될 수 있다.
siRNA 분자의 특이적 안티센스 서열은 표적 mRNA의 서열로부터 한 개, 두 개, 세 개, 네 개 또는 그 이상의 뉴클레오티드에서 변해서(예를 들어, 전이(transition) 또는 전좌(transversion)를 포함하는, 뉴클레오티드 치환에 의해서) 가변성을 나타낼 수도 있다. 이러한 뉴클레오티드 치환이 이중가닥 RNA 분자의 안티센스 가닥에 존재하면, 치환체 뉴클레오티드가 전형적으로 수소결합 염기-쌍을 형성하는, 센스 가닥의 상보적 뉴클레오티드는 이에 상응하게 치환될 수도 있고, 그렇지 않을 수도 있다. 하나 이상의 뉴클레오티드 치환이 안티센스 가닥이 아닌, 센스 서열에서 일어나는 이중가닥 RNA 분자가 또한 고려된다. siRNA 분자의 안티센스 서열이 상술한 바와 같이, siRNA 및 표적 뉴클레오티드 서열 사이의 하나 이상의 불일치를 포함할 때, 불일치는 안티센스 서열의 3' 말단, 5' 말단 또는 중앙부에서 발견될 수도 있다.
또 다른 구현예에서, siRNA 분자는 엄격성 조건 하에서 자연 발생 표적 유전자 또는 표적 mRNA의 일부분에 선택적으로 혼성화할 수 있는, 특이적인 안티센스 서열을 포함한다. 본 기술분야의 숙련자에게 공지된 바와 같이, 혼성화 조건의 엄격도 변화는 혼성화 및 세정 단계에 사용되는 시간, 온도 또는 용액 농도를 변경하여 얻을 수도 있다. 또한 적절한 조건은 부분적으로, 사용되는 구체적인 뉴클레오티드 서열, 예를 들어 표적 mRNA 또는 유전자의 서열에 의존한다.
식물에 이중가닥 RNA-침묵을 유도하기 위한 하나의 방법은 헤어핀 RNA를 생산하는 유전자 구조체에 대한 형질전환이다(Smith 등 (2000) Nature, 407, 319-320). 이러한 구성체는 표적 유전자 서열의 역 영역을 포함하는데, 적절한 스페이서에 의해서 분리되어 있다. 스페이서 단편으로서 기능적인 식물 인트론 영역을 삽입하는 것은 인트론 접합 헤어핀 RNA를 생성시키기 때문에 유전자 침묵 유도의 효능을 추가적으로 증가시킨다(Wesley 등 (2001) Plant J., 27, 581-590). 적절하게는, 줄기 길이는 길이가 약 50 뉴클레오티드 내지 약 1 킬로베이스(kilobase)이다. 인트론 접합 헤어핀 RNA를 생산하기 위한 방법이 본 기술분야에 잘 기재되어 있다(예를 들어, Bioscience, Biotechnology, and Biochemistry (2008) 72, 2, 615-617 참조).
이중체 또는 이중가닥 구조, 예를 들어 이중가닥 RNA 또는 작은 헤어핀 RNA를 가지는 간섭 RNA 분자는 둔단(blunt end)을 가지거나 또는 3' 또는 5' 돌출(overhang)을 가질 수 있다. 본원에서 사용되는, "돌출(overhang)"은 하나의 RNA 가닥의 3’-말단이 다른 가닥의 5' 말단 위로 확장될 때(3' 돌출), 또는 그 반대일 때(5' 돌출) 이중체 구조로부터 돌출되는, 쌍을 이루지 않은 뉴클레오티드 또는 뉴클레오티드들을 의미한다. 돌출을 포함하는 뉴클레오티드는 리보뉴클레오티드, 디옥시리보뉴클레오티드 또는 그의 변형된 버전일 수 있다. 한 구현예에서, 간섭 RNA 분자의 적어도 한 가닥은 길이가 약 1 내지 약 6 뉴클레오티드인 3' 돌출을 가진다. 다른 구현예들에서, 3' 돌출은 길이가 약 1 내지 약 5 뉴클레오티드, 약 1 내지 약 3 뉴클레오티드 및 약 2 내지 약 4 뉴클레오티드이다.
간섭 RNA 분자가 분자의 하나의 말단에서 3' 돌출을 포함할 때, 다른 말단은 둔단일 수 있거나 또는 돌출(5' 또는 3')을 가질 수 있다. 간섭 RNA 분자가 분자의 양쪽 말단 전부에서 돌출을 포함할 때, 돌출들의 길이는 동일하거나 상이할 수도 있다. 한 구현예에서, 간섭 RNA 분자는 분자의 양쪽 말단 전부에 약 1 내지 약 3 뉴클레오티드의 3' 돌출을 포함한다. 추가의 구현예에서, 간섭 RNA 분자는 분자의 양쪽 말단 전부에서 2 뉴클레오티드의 3' 돌출을 가지는 이중가닥 RNA이다. 그러나 또 다른 구현예에서, 간섭 RNA의 돌출을 포함하는 뉴클레오티드는 TT 디뉴클레오티드 또는 UU 디뉴클레오티드이다.
표적 mRNA 서열에 대한 하나 이상의 돌출을 포함하는 간섭 RNA 분자의 동일성 퍼센트를 결정할 때, 돌출(들)은 고려될 수도 있거나, 그렇지 않을 수도 있다. 예를 들어, 3' 돌출의 뉴클레오티드 및 이중가닥의 5'-말단 또는 3'-말단으로부터의 최대 2개의 뉴클레오티드는 siRNA 분자의 활성의 상당한 손실 없이 변형될 수도 있다.
간섭 RNA 분자는 하나 이상의 5' 또는 3'-캡(cap) 구조를 포함할 수 있다. 간섭 RNA 분자는 간섭 RNA 분자의, 센스 가닥, 안티센스 가닥, 또는 센스와 안티센스 가닥 모두에서의 3'-말단에서; 또는 센스가닥, 안티센스 가닥, 또는 센스와 안티센스 가닥의 5'-말단에서 캡 구조를 포함할 수 있다. 대안적으로, 간섭 RNA 분자는 간섭 RNA 분자의 3'-말단과 5'-말단 모두에서 캡 구조를 포함할 수 있다. 용어 "캡 구조"는 올리고뉴클레오티드의 말단 중 하나에서 포함된 화학적 변형을 의미하고, 이것은 분자를 엑소뉴클레아제 변성으로부터 보호하고, 또한 세포 내에서 전달 또는 위치결정을 용이하게 할 수 있다.
간섭 RNA 분자에 적용할 수 있는 또 다른 변형은 간섭 RNA 분자의 활성, 세포 분포, 세포 섭취, 생체이용가능성 또는 안정성을 증가시키는 하나 이상의 부분 또는 접합체의 간섭 RNA 분자에 대한 화학적 연결이다. 폴리뉴클레오티드는 본 기술분야에 잘 정립되어 있는 방법에 의해 합성되거나 변형될 수도 있다. 화학적 변형은 이들에만 한정하는 것은 아니지만, 2' 변형, 비-천연 염기의 도입, 리간드에 대한 공유결합, 및 인산염 결합의 티오인산 결합으로의 대체를 포함할 수도 있다. 본 구현예에서, 이중체 구조의 온전성은 적어도 하나, 및 전형적으로 두 가지 이상의 화학적 결합에 의해서 강화된다. 화학적 결합은 다양한 주지 기술, 예를 들면, 공유, 이온 또는 수소 결합의 도입; 소수성 상호작용, 반데르발스(van der Waals) 또는 적층 상호작용; 금속-이온 배위에 의해서, 또는 퓨린 유사체 사용을 통해서 달성될 수도 있다.
두 개의 단일가닥 중 하나 또는 전부의 뉴클레오티드는 변형되어서 세포 효소, 예를 들어 제한 없이 소정의 뉴클레아제와 같은 것의 활성을 조절할 수도 있다. 세포 효소의 활성을 조절하기 위한 기술은 이들에만 한정하는 것은 아니지만, 2'-아미노 변형, 2'-플루오로 변형, 2'-알킬 변형, 비전하된 골격 변형, 모르폴리노 변형, 2'-O-메틸 변형, 및 포스포라미데이트를 포함해서 본 기술분야에 공지되어 있다. 따라서 이중가닥 RNA에 대한 뉴클레오티드의 적어도 하나의 2'-히드록실기는 화학 작용기에 의해서 치환된다. 또한 적어도 하나의 뉴클레오티드는 변형되어서 잠겨진 뉴클레오티드를 형성할 수도 있다. 이러한 잠겨진 뉴클레오티드는 리보오스의 2'-산소와 리보오스의 4'-탄소를 연결시키는 메틸렌 또는 에틸렌 다리를 함유한다. 잠겨진 뉴클레오티드를 올리고뉴클레오티드에 도입하는 것은 상보적 서열에 대한 친화도를 향상시키고 용융점을 몇 도 증가시킨다.
리간드는 간섭성 RNA 분자에 접합되어서 예를 들어 그의 세포 흡수를 강화시킬 수도 있다. 소정의 구현예들에서, 소수성 리간드가 분자에 접합되어서 세포막의 직접 침투를 용이하게 한다. 이러한 접근들이 안티센스 올리고뉴클레오티드의 세포 투과를 용이하게 하기 위해 사용되어 왔다. 소정의 예들에서, 올리고뉴클레오티드에 대한 양이온 리간드의 접합은 종종 뉴클레아제에 대한 개선된 내성을 야기한다. 양이온 리간드의 대표적인 예시는 프로필암모늄 및 디메틸프로필암모늄을 포함한다. 안티센스 올리고뉴클레오티드는, 양이온 리간드가 올리고뉴클레오티드를 통해서 분산될 때 mRNA에 대한 그들의 높은 결합 친화도를 보유할 수 있다.
본원에 기재된 분자 및 폴리뉴클레오티드는 고체상 합성의 주지된 기술을 사용해서 제조될 수도 있다. 본 기술분야에 공지된 이러한 합성을 위한 임의의 다른 수단이 추가적으로 또는 대안적으로 채택될 수도 있다.
다양한 구현예는 하나 이상의 폴리뉴클레오티드 또는 본원에 기재된 하나 이상의 폴리뉴클레오티드를 포함하는 간섭 RNA 구성체를 포함하는 발현 벡터에 관한 것이다. 예시적인 간섭 RNA 구성체가 서열번호4에서 보여진다.
다양한 구현예는 하나 이상의 폴리뉴클레오티드 또는 본원에 기재된 하나 이상의 간섭 RNA 구성체를 포함하는 발현 벡터에 관한 것이다.
다양한 구현예는 헤어핀 구조를 형성하기 위해 자가-결합(annealing)할 수 있는 하나 이상의 폴리뉴클레오티드, 또는 본원에 기재된 하나 이상의 간섭 RNA 폴리뉴클레오티드를 인코딩하는 하나 이상의 간섭 RNA 구성체를 포함하는 발현 벡터에 관한 것으로, 여기서 상기 구성체는 (a) 본원에서 기재된 하나 이상의 폴리뉴클레오티드; (b) 헤어핀 구조의 루프를 형성하는, 스페이서 요소를 인코딩하는 두번째 서열; 및 (c) 상기 첫번째 서열의 역상보성 서열을 포함하고 상기 첫번째 서열과 동일한 배향으로 위치하는 세번째 서열을 포함하고, 여기서 상기 두번째 서열은 상기 첫번째 서열과 상기 세번째 서열 사이에 위치하고, 그리고 상기 두번째 서열은 상기 첫번째 서열과 상기 세번째 서열에 작동가능하게 연결되어 있다.
개시한 서열은 헤어핀 구조를 형성하지 않는 다양한 폴리뉴클레오티드를 구성하기 위해 이용될 수 있다. 예를 들어, 이중가닥 RNA는 (1) 첫번째 프로모터에 작동가능하게 연결되어 DNA의 첫번째 가닥을 전사하고, (2) 두번째 프로모터에 작동가능하게 연결되어 DNA 단편의 상기 첫번째 가닥의 역상보성 서열을 전사하여 형성될 수 있다. 폴리뉴클레오티드의 각각의 가닥은 동일한 발현 벡터, 또는 상이한 발현 벡터로부터 전사될 수 있다. RNA 간섭 활성을 가지는 RNA 이중체는 siRNA로 효소적으로 변환되어서 RNA 수준을 조절할 수 있다.
따라서 다양한 구현예는 하나 이상의 폴리뉴클레오티드 또는 자가-결합할 수 있는 간섭 RNA 폴리뉴클레오티드를 인코딩하는 본원에 기재된 간섭 RNA 구성체를 포함하는 발현 벡터에 관한 것으로, 상기 구성체는 (a) 본원에서 기재된 하나 이상의 폴리뉴클레오티드; 및 (b) 상기 첫번째 서열과 동일한 배향으로 위치한, 첫번째 서열의 상보성(예를 들어, 역상보성) 서열을 포함하는 두번째 서열을 포함한다.
다양한 조성물 및 방법은 유전자 발현의 공동-억제(co-suppression)를 촉진하여 본원에 기재된 하나 이상의 폴리펩티드(또는 본원에 기재된 그의 임의의 조합)의 내인성 발현 수준을 조절하기 위해 제공된다. 공동-억제 현상은 이식유전자의 다중 사본을 식물 세포 숙주 내로 도입한 결과로서 발생한다. 이식유전자의 다중 사본의 통합시킨 결과 이식유전자 및 표적 내인성 유전자의 조절된 발현이 생길 수 있다. 공동-억제 정도는 이식유전자와 표적 내인성 유전자 간의 서열 상동성의 정도에 따라 달라진다. 내인성 유전자와 이식유전자 전부 침묵하는 것은 전사를 차단할 수 있는 침묵된 자리(즉, 관심있는 내인성 프로모터 및 내인성 유전자)의 광범위한 메틸화에 의해 발생할 수 있다. 대안적으로, 일부 경우에, 외인성 유전자와 이식유전자의 공동-억제는 전사후 유전자 침묵(post transcriptional gene silencing)에 의해 일어날 수 있으며, 전사체는 생산될 수 있지만 증가된 변성율이 전사체의 축적을 차단한다. 전사후 유전자 침묵에 의한 공동-억제 메커니즘은 RNA 간섭과 유사한 것으로 사료되는데, RNA는 이러한 공정들에서 중요한 개시제이면서 표적으로 보인다는 점에서 그러하고, 어쩌면 mRNA의 RNA-지시 변성을 통해서, 동일한 분자 구조에 의해서 적어도 부분적으로 매개될 수도 있다.
핵산의 공동-억제는 이식유전자로서, 핵산의 다중 사본 또는 그의 단편을 관심있는 식물의 유전체로 통합하여 달성할 수 있다. 숙주 식물은 핵산 또는 그의 단편에 작동가능하게 연결된 프로모터를 포함하는 발현 벡터로 형질전환될 수 있다. 다양한 구현예는 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함하는 내인성 유전자의 공동-억제를 촉진하기 위한 발현 벡터에 관한 것이다.
다양한 구현예는 폴리뉴클레오티드(들)의 다중 사본을 (담배) 식물 유전체로 통합시켜서 본원에 기재된 하나 이상의 폴리뉴클레오티드(들) (또는 본원에 기재된 그의 임의의 조합)의 발현 수준을 조절하기 위한 방법에 관한 것으로, 식물 세포 숙주를 폴리뉴클레오티드에 작동가능하게 연결되어 있는 프로모터를 포함하는 발현 벡터로 형질전환하는 것을 포함한다.
다양한 조성물 및 방법은 mRNA의 번역을 조절하여 내인성 유전자 발현 수준을 조절하기 위해서 제공된다. 숙주 (담배) 식물 세포는, 프로모터와 관련해서 안티센스 배향으로 위치하는 폴리뉴클레오티드에 작동가능하게 연결되어서, mRNA의 일부분에 서열 상보성을 가지는 RNA 폴리뉴클레오티드의 발현을 가능하게 하는 프로모터를 포함하는, 발현 벡터로 형질전환될 수 있다.
mRNA의 번역을 조절하기 위한 다양한 발현 벡터는 그 서열이 프로모터와 관련해서 안티센스 배향으로 위치하는 폴리뉴클레오티드에 작동가능하게 연결되어 있는 프로모터를 포함할 수도 있다. 안티센스 RNA 폴리뉴클레오티드의 길이는 다양할 수 있으며, 약 15-20 뉴클레오티드, 약 20-30 뉴클레오티드, 약 30-50 뉴클레오티드, 약 50-75 뉴클레오티드, 약 75-100 뉴클레오티드, 약 100-150 뉴클레오티드, 약 150-200 뉴클레오티드, 및 약 200-300 뉴클레오티드일 수도 있다.
또한 전위인자(transposon)(예를 들어, IS 요소)를 관심있는 식물의 유전체로 도입하여 유전자가 불활성되도록 표적화될 수 있다. 이러한 이동가능한 유전자 요소는 유성 교배-수정에 의해 도입될 수 있고 삽입 돌연변이는 단백질 활성 손실을 위해 스크리닝될 수 있다. 부모 식물에 있는 손상된(disrupted) 유전자는 다른 식물로 도입될 수 있는데, 이것은 부모 식물을, 예를 들어 유성 교배-수정에 의해서, 전위인자-유도 돌연변이 유발을 거치지 않는 식물과 교배함에 의한 것이다. 본 기술분야의 숙련자에게 공지된 임의의 표준 육종 기술이 채택될 수 있다. 한 구현예에서, 하나 이상의 유전자는 하나 이상의 전위인자의 삽입에 의해서 불활성될 수 있다. 하나 이상의 유전자가 손상되면, 돌연변이는 하나 이상의 유전자의 동형 손상, 하나 이상의 유전자의 이형 손상, 또는 동형 및 이형 손상 전부의 조합을 유발할 수 있다. 적절한 전이성 요소는 역전위인자, 레트로포존, 및 SINE-형 인자를 포함한다. 이러한 방법은 본 기술분야의 숙련자에게 공지되어 있다.
대안적으로, 유전자는 식물에서 자가-절단 및 복제할 수 있는 많은 작은 원형 RNA로부터 유도되는 리보자임을 도입하여 불활성을 표적으로 할 수 있다. 이러한 RNA는 단독으로든지(바이로이드 RNA) 또는 보조 바이러스(위성 RNA)로 복제할 수 있다. 적절한 RNA의 예시는 아보카도 선블로치(sunblotch) 바이로이드(viroid)로부터 유도된 것들 및 담배 둥근무늬 바이러스, 루체른 일시적 줄무늬 바이러스, 벨벳 담배 반점 바이러스, 솔라넘 노디플로름 반점 바이러스, 및 지하 클로버 반점 바이러스로부터 유도된 위성 RNA를 포함한다. 다양한 표적 RNA-특이적 리보자임은 본 기술분야의 숙련자에게 공지되어 있다.
여기에서 논의된 바와 같이, 하나 이상의 폴리펩티드의 발현은 비-유전자전환 수단에 의해서 -예컨대 여기에서 논의된 바와 같이, 하나 이상의 유전자에 하나 이상의 돌연변이를 생성해서 조절될 수 있다. 유전자 서열에서 무작위로 돌연변이를 도입하는 방법은 화학적 돌연변이 유발, EMS 돌연변이 유발 및 방사 돌연변이 유발을 포함할 수 있다. 하나 이상의 표적화된 돌연변이를 세포로 도입하는 방법은 이들에만 한정하는 것은 아니지만, 유전체 편집 기술, 특히 아연 집게 뉴클레아제-매개 돌연변이 유발 및 틸링(targeting induced local lesions in genomes: tilling), 동형 재조합, 올리고뉴클레오티드-지시 돌연변이 유발, 및 메가뉴클레아제-매개 돌연변이 유발을 포함한다. 한 구현예에서, TILLING이 이용된다. 이것은 변형된 발현 및/또는 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 생성 및/또는 식별하는 데 사용될 수 있는 돌연변이 유발 기술이다. 틸링은 또한 이러한 돌연변이를 운반하는 식물의 선별을 가능하게 한다. 틸링은 고 처리율(high-throughput) 스크리닝 방법과 고밀도 돌연변이 유발을 결합한다. 틸링을 위한 방법은 당 기술분야에 주지되어 있다(McCallum 등, (2000) Nat Biotechnol 18: 455-457 and Stemple (2004) Nat Rev Genet 5(2): 145-50).
돌연변이의 일부 비제한적인 실시예는 적어도 하나의 뉴클레오티드, 단일 뉴클레오티드 다형성 및 단일 서열 반복의 결실, 삽입 및 과오 돌연변이다. 돌연변이 후에, 스크리닝은 미성숙 중지 코돈 또는 다른 한편으로는 비-기능적인 유전자를 형성하는 돌연변이를 식별하기 위해서 수행될 수 있다. 돌연변이 후에, 스크리닝은 상승된 수준에서 발현될 수 있는 기능적 유전자를 형성하는 돌연변이를 식별하기 위해 수행될 수 있다. 돌연변이의 스크리닝은 서열결정에 의해서나, 유전자 또는 단백질에 특이적인 하나 이상의 탐침 또는 프라이머를 사용해서 수행될 수 있다. 조절된 유전자 발현, mRNA의 조절된 안정성, 또는 단백질의 조절된 안정성을 야기할 수 있는, 폴리뉴클레오티드의 특이적인 돌연변이는 또한 형성될 수 있다. 이러한 식물은 "비-자연 발생" 또는 "돌연변이" 식물로서 본원에서 참조된다. 전형적으로, 돌연변이 또는 비-자연 발생 식물은 조작되기 이전에 식물에 존재하지 않았던 외래 또는 합성 또는 인공 핵산(예를 들어, DNA 또는 RNA)의 일부분을 포함할 것이다. 외래 핵산은 적어도 10, 20, 30, 40, 50,100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 또는 1500 또는 그 이상의 연속된 또는 비-연속된 뉴클레오티드와 같은, 단일 뉴클레오티드, 2개 이상의 뉴클레오티드, 2개 이상의 연속된 뉴클레오티드 또는 2개 이상의 비-연속된 뉴클레오티드일 수도 있다.
돌연변이 또는 비-자연 발생 식물 또는 식물 세포는 조절된 단백질 수준을 야기하는 하나 이상의 유전자에서의 하나 이상의 돌연변이의 임의의 조합을 가질 수 있다. 예를 들어, 돌연변이 또는 비-자연 발생 식물 또는 식물 세포는 단일 유전자에서의 단일 돌연변이; 단일 유전자에서의 다수 돌연변이; 2개 이상의 또는 3개 이상의 또는 4개 이상의 유전자에서의 단일 돌연변이; 또는 2개 이상의 또는 3개 이상의 또는 4개 이상의 유전자에서의 다수 돌연변이를 가질 수도 있다. 이러한 돌연변이의 실시예들이 본원에 기재되어 있다. 추가적인 실시예에 의해서, 돌연변이 또는 비-자연 발생 식물 또는 식물 세포는 단백질 또는 그의 일부분의 활성 자리를 인코딩하는 유전자에서의 영역과 같은 유전자(들)의 특정한 일부분에서 하나 이상의 돌연변이를 가질 수도 있다. 추가적인 실시예에 의해서, 돌연변이 또는 비-자연 발생 식물 또는 식물 세포는 만약 그들이 유전자(들)의 활성 또는 발현을 조절한다면, 그것이 조절하는 유전자의 상류 또는 하류의 영역에서와 같은 하나 이상의 유전자(들)의 외부의 영역에서의 하나 이상의 돌연변이를 가질 수도 있다. 상류에 있는 요소는 프로모터, 증강 인자(enhancer) 또는 전사 인자를 포함할 수 있다. 증강 인자와 같은 몇몇 요소는 그것이 조절하는 유전자의 상류 또는 하류에 위치할 수 있다. 요소(들)은 그것이 조절하는 유전자 가까이에 위치할 필요가 없는데 이것은 그것이 조절하는 유전자의 수십만 염기쌍 상류 또는 하류에서 발견된 적이 있기 때문이다. 돌연변이 또는 비-자연 발생 식물 또는 식물 세포는 유전자(들)의 처음 100개의 뉴클레오티드 내에, 유전자(들)의 처음 200개의 뉴클레오티드 내에, 유전자(들)의 처음 300개의 뉴클레오티드 내에, 유전자(들)의 처음 400개의 뉴클레오티드 내에, 유전자(들)의 처음 500개의 뉴클레오티드 내에, 유전자(들)의 처음 600개의 뉴클레오티드 내에, 유전자(들)의 처음 700개의 뉴클레오티드 내에, 유전자(들)의 처음 800개의 뉴클레오티드 내에, 유전자(들)의 처음 900개의 뉴클레오티드 내에, 유전자(들)의 처음 1000개의 뉴클레오티드 내에, 유전자(들)의 처음 1100개의 뉴클레오티드 내에, 유전자(들)의 처음 1200개의 뉴클레오티드 내에, 유전자(들)의 처음 1300개의 뉴클레오티드 내에, 유전자(들)의 처음 1400개의 뉴클레오티드 내에, 또는 유전자(들)의 처음 1500개의 뉴클레오티드 내에 위치한 하나 이상의 돌연변이를 가질 수도 있다. 돌연변이 또는 비-자연 발생 식물 또는 식물 세포는 유전자(들) 또는 그의 조합의 처음, 두번째, 세번째, 네번째, 다섯번째, 여섯번째, 일곱번째, 여덟번째, 아홉번째, 열번째, 열한번째, 열두번째, 열세번째, 열네번째 또는 열다섯번째 세트의 100개의 뉴클레오티드 내에 위치한 하나 이상의 돌연변이를 가질 수도 있다. 돌연변이 폴리펩티드 변이체를 포함하는 돌연변이 또는 비-자연 발생 식물 또는 식물 세포(예를 들어, 본원에 기재된 바와 같은 비-자연 발생 돌연변이 또는 유전자전환 식물 또는 식물 세포 기타 등등)가 개시되어 있다.
한 구현예에서, 식물의 종자가 돌연변이되고 나서 1세대 돌연변이 식물로 성장한다. 그런 다음 1세대 식물은 자가-수분되고 그리고 1세대 식물의 종자는 2세대 식물로 성장하는데, 그런 다음 이것은 그들의 좌위(loci)에서의 돌연변이를 위해 스크리닝된다. 돌연변이된 식물 재료는 돌연변이를 위해서 스크리닝될 수 있지만, 2세대 식물을 스크리닝하는 이점은 모든 체세포 돌연변이가 생식 돌연변이에 해당한다는 것이다. 본 기술분야의 숙련자라면 이들에만 한정하는 것은 아니지만, 종자, 꽃가루, 식물 조직 또는 식물 세포를 포함해서, 다양한 식물 재료가 돌연변이 식물을 형성하기 위해 돌연변이되는 것을 이해할 것이다. 그러나 돌연변이된 식물 재료의 유형은 식물 핵산이 돌연변이를 위해 스크리닝될 때 영향을 줄 수도 있다. 예를 들어, 비-돌연변이된 식물이 수분되기 전에, 꽃가루가 돌연변이를 거친 경우, 이러한 수분으로부터 발생하는 종자는 1세대 식물로 성장한다. 1세대 식물의 모든 세포는 꽃가루에서 형성되는 돌연변이를 함유할 것이고; 따라서 이러한 1세대 식물은 2세대까지 기다리는 대신에 돌연변이를 위해 스크리닝될 것이다.
화학적 돌연변이원 또는 조사(radiation)를 포함해서, 점 돌연변이, 짧은 결실, 삽입, 전좌, 또는 전이를 생성하는 돌연변이원이 돌연변이를 형성하는 데에 사용될 수도 있다. 돌연변이원은 이들에만 한정하는 것은 아니지만, 에틸 메탄술포네이트, 메틸메탄 술포네이트, N-에틸-N-니트로소우레아, 트리에틸멜라민, N-메틸-N-니트로소우레아, 프로카르바진, 클로람부실, 시클로포스파미드, 디에틸 설페이트, 아크릴아미드 모노머, 멜파란, 질소 머스타드(mustard), 빈크리스틴, 디메틸니트로사민, N-메틸-N'-니트로-니트로소구아니딘, 니트로소구아니딘, 2-아미노퓨린, 7,12 디메틸-벤즈(자)안트라센, 에틸렌 산화물, 헥사메틸포스포아미드, 바이술판, 디에폭시알칸(디에폭시옥탄, 디에폭시부탄, 기타 등등), 2-메톡시-6-클로로-9[3-에틸-2-클로로-에틸)아미노프로필아미노]아크리딘 디하이드로클로라이드 및 포름알데히드를 포함한다.
원하는 표현형을 유발한다면, 돌연변이원에 의해서 직접적으로 야기되지 않은 좌위에서의 자발적 돌연변이가 또한 고려된다. 또한 적절한 돌연변이 유발제는 예를 들어, X-선, 감마선, 고속 중성자 조사 및 UV 방사와 같은 이온화 방사선을 포함한다. 본 기술분야의 숙련자에게 공지된 식물 핵산 제조의 임의의 방법이 돌연변이 스크리닝을 위한 식물 핵산을 제조하기 위해 사용될 수도 있다.
각각의 식물, 식물 세포 또는 식물 재료로부터 제조되는 핵산은 돌연변이 유발된 식물 조직, 세포 또는 재료에서 기원하는 식물 집단의 돌연변이를 위한 스크리닝을 신속히 처리하기 위하여 선택적으로 풀링(pooling)할 수 있다. 하나 이상의 식물, 식물 세포 또는 식물 재료의 후속 세대가 스크리닝될 수 있다. 상기 선택적으로 모아진 그룹의 크기는 사용되는 스크리닝 방법의 민감도에 따라 달라진다.
핵산 시료가 선택적으로 모아진 후에, 그들은 중합효소 연쇄 반응(PCR)과 같은 폴리뉴클레오티드-특이적 증폭 기술을 거칠 수 있다. 유전자 또는 유전자에 바로 인접한 서열에 특이적인 임의의 하나 이상의 프라이머 또는 탐침은 선택적으로 모아진 핵산 시료 내에 서열을 증폭시키는 데에 이용될 수도 있다. 적절하게는, 하나 이상의 프라이머 또는 탐침은 유용한 돌연변이가 가장 발생하기 쉬운 좌위(locus)의 영역을 증폭시키도록 고안되어 있다. 가장 바람직하게는, 프라이머는 폴리뉴클레오티드의 영역 내에서 돌연변이를 감지하도록 고안되어 있다. 추가적으로, 점 돌연변이를 위한 스크리닝을 쉽게 하기 위해서, 프라이머(들) 및 탐침(들)이 공지의 다형성 자리를 피하는 것이 바람직하다. 증폭 산물의 검출을 용이하게 하기 위해서, 하나 이상의 프라이머 또는 탐침은 임의의 종래의 표지방법을 이용해서 표지될 수도 있다. 프라이머(들) 또는 탐침(들)은 본 기술분야에서 잘 이해되고 있는 방법을 사용해서 본원에서 기재된 서열을 기초로 고안될 수 있다.
증폭 산물의 검출을 용이하게 하기 위해서, 프라이머(들) 또는 탐침(들)이 임의의 종래의 표지 방법을 사용해서 표지될 수도 있다. 이들은 본 기술분야에서 잘 이해되고 있는 방법을 사용해서 본원에서 기재되어 있는 서열을 기초로 해서 고안될 수 있다. 다형성은 본 기술분야에 공지된 방법에 의해서 식별될 수도 있고 일부가 본 문헌에 기재되어 있다.
추가적인 측면에서 돌연변이 식물을 제조하기 위한 방법이 제공된다. 상기 방법은 본원에서 기재된 기능적인 폴리뉴클레오티드(또는 본원에서 기재된 그의 임의의 조합)를 인코딩하는 유전자를 포함하는 식물의 적어도 하나의 세포를 제공하는 것을 포함한다. 다음에, 식물의 적어도 하나의 세포는 본원에서 기재된 폴리뉴클레오티드의 활성을 조절하기에 효율적인 조건 하에서 처리된다. 그런 다음 하나 이상의 돌연변이 식물 세포는 돌연변이 식물로 번식되며, 여기서 돌연변이 식물은 대조군 식물의 그것과 비교해서 조절된 수준의 기재된 폴리펩티드(들)(또는 본원에서 기재된 그의 임의의 조합)를 가진다. 돌연변이 식물을 제조하는 이러한 방법의 하나의 구현예에서, 상기 처리 단계는 하나 이상의 세포를 상술한 바와 같고, 하나 이상의 돌연변이 식물 세포를 수득하기에 효과적인 조건 하에서 화학적 돌연변이 유발제로 거치게 하는 것을 포함한다. 이러한 방법의 또 다른 구현예에서, 상기 처리 단계는 하나 이상의 돌연변이 식물 세포를 수득하기에 효과적인 조건 하에서 하나 이상의 세포를 방사선원을 거치게 하는 것을 포함한다. 용어 "돌연변이 식물"은, 적절하게는 유전자 조작 또는 유전자 변형 이외의 수단에 의해서, 대조군 식물과 비교할 때 표현형이 변형되는 돌연변이 식물을 포함한다.
소정의 구현예들에서, 돌연변이 식물, 돌연변이 식물 세포 또는 돌연변이 식물 재료는 또 다른 식물, 식물 세포 또는 식물 재료에서 자연적으로 발생하였으며 원하는 특성을 가지는 하나 이상의 돌연변이를 포함한다. 이러한 돌연변이는 특성을 부여할 다른 식물, 식물 세포 또는 식물 재료(예를 들어, 돌연변이가 유도되는 식물에 대한 상이한 유전적 배경을 가지는 식물, 식물 세포 또는 식물 재료)에 통합(예를 들어, 침투)될 수 있다. 따라서 실시예에 의해서, 첫번째 식물에 자연적으로 발생하는 돌연변이는 첫번째 식물에 대해 상이한 유전적 배경을 가지는 두번째 식물과 같은 두번째 식물에 도입될 수도 있다. 그러므로 숙련자는 원하는 특성을 부여하는 본원에 기재된 유전자의 하나 이상의 돌연변이 대립유전자를 유전체에 자연적으로 운반하는 식물을 검색하고 식별할 수 있다. 자연적으로 발생하는 돌연변이 대립유전자(들)은 육종, 역교배 및 유전자이입을 포함하는 다양한 방법에 의해서 두번째 식물로 전달되어서, 본원에 기재된 유전자에서 하나 이상의 돌연변이를 가지는 계통, 변이체 또는 혼성체를 생성할 수 있다. 원하는 특성을 보여주는 식물은 돌연변이 식물의 풀(pool)로부터 스크리닝될 수도 있다. 적절하게는, 본원에 기재된 뉴클레오티드 서열의 지식을 이용하여 선별이 수행된다. 결과적으로 대조군과 비교할 때 유전자 특성을 스크리닝할 수 있다. 이러한 스크리닝 접근은 본원에서 논의된 바와 같은 통상적인 핵산 증폭 및/또는 혼성화 기술의 적용을 포함할 수도 있다. 따라서 본 발명의 추가적인 측면은 돌연변이 식물을 식별하기 위한 방법에 관한 것으로, (a) 식물로부터 핵산을 포함하는 시료를 제공하는 단계; 그리고 (b) 폴리뉴클레오티드의 핵산 서열을 결정하는 단계를 포함하고, 여기서 대조군 식물의 폴리뉴크레오티드 서열과 비교시 상기 폴리뉴클레오티드의 서열에서의 차이는 상기 식물이 돌연변이 식물인 것을 나타낸다. 또 다른 측면에서, 대조군 식물과 비교시 노르니코틴 및/또는 적어도 NNN의 감소된 수준을 축적하는 돌연변이 식물을 식별하기 위한 방법이 제공되는데, (a) 스크리닝될 식물로부터 시료를 제공하는 단계; (b) 상기 시료가 본원에 설명된 하나 이상의 폴리뉴클레오티드에서 하나 이상의 돌연변이를 포함하는지 판정하는 단계; 및 (c) 상기 식물의 적어도 상기 노르니코틴 및/또는 NNN 함량을 판정하는 단계를 포함한다. 적절하게는 적어도 상기 NNN 함량은 녹색 잎 또는 연기에서 판정된다.
또 다른 측면에서, 대조군 식물과 비교시 노르니코틴 및/또는 적어도 NNN의 감소된 수준을 가지는 돌연변이 식물을 제조하기 위한 방법이 제공되는데, (a) 첫번째 식물로부터 시료를 제공하는 단계; (b) 상기 시료가 노르니코틴 및/또는 적어도 NNN의 감소된 수준을 생성하는 본원에 설명된 하나 이상의 상기 폴리뉴클레오티드에서 하나 이상의 돌연변이를 포함하는지 판정하는 단계; 및 (c) 상기 하나 이상의 돌연변이를 두번째 식물로 전달하는 단계를 포함한다. 적절하게는 적어도 상기 NNN 함량은 녹색 잎 또는 연기에서 판정된다. 돌연변이(들)은 유전 공학, 유전자 조작, 유전자이입, 식물 육종, 역교배 및 기타 등등에 의한 것과 같이, 본 기술분야에 공지된 다양한 방법을 사용해서 두번째 식물로 전달될 수 있다. 한 구현예에서, 상기 첫번째 식물은 자연 발생 식물이다. 한 구현예에서, 상기 두번째 식물은 상기 첫번째 식물에 대해 상이한 유전적 배경을 가진다.
또 다른 측면에서, 대조군 식물과 비교시 노르니코틴 및/또는 적어도 NNN의 감소된 수준을 가지는 돌연변이 식물을 제조하기 위한 방법이 제공되는데, (a) 첫번째 식물로부터 시료를 제공하는 단계; (b) 상기 시료가 노르니코틴 및/또는 적어도 NNN의 감소된 수준을 생성하는 본원에 설명된 상기 폴리뉴클레오티드 중 하나 이상에서 하나 이상의 돌연변이를 포함하는지 판정하는 단계; 및 (c) 상기 첫번째 식물로부터의 하나 이상의 돌연변이를 두번째 식물로 유전자이입하는 단계를 포함한다. 적절하게는 적어도 상기 NNN 함량은 녹색 잎 또는 연기에서 판정된다. 한 구현예에서, 상기 유전자이입하는 단계는 선택적으로 역교배 및 기타 등등을 포함해서, 식물 육종을 포함한다. 한 구현예에서, 상기 첫번째 식물은 자연 발생 식물이다. 한 구현예에서, 상기 두번째 식물은 상기 첫번째 식물에 대해 상이한 유전적 배경을 가진다. 한 구현예에서, 상기 첫번째 식물은 재배품종 또는 엘리트 재배품종이 아니다. 한 구현예에서, 상기 두번째 식물은 재배품종 또는 엘리트 재배품종이다. 추가적인 측면은 본원에 기재된 방법에 의해서 얻어지거나 또는 얻을 수 있는 (재배품종 또는 엘리트 재배품종 돌연변이 식물을 포함하는) 돌연변이 식물에 관한 것이다. 소정의 구현예들에서, "돌연변이 식물"은 본원에 기재된 하나 이상의 폴리뉴클레오티드(들)의 서열 내에서와 같은, 식물의 특정한 영역에만 국소화되는 하나 이상의 돌연변이를 가질 수도 있다. 이러한 구현예에 따르면, 돌연변이 식물의 남은 유전체의 서열은 돌연변이 유발 전의 식물과 동일하거나 또는 실질적으로 동일할 것이다.
소정의 구현예들에서, 돌연변이 식물은 본원에 기재된 폴리뉴클레오티드 중 하나 이상의 서열 내에서와 같은 식물의 하나 이상의 영역, 및 유전체의 하나 이상의 추가의 영역에서 국소화된 하나 이상의 돌연변이를 가질 수도 있다. 이러한 구현예에 따르면, 돌연변이 식물의 남은 유전체 서열은 돌연변이 유발 전의 식물과 동일하지 않거나 실질적으로 동일하지 않을 것이다. 소정의 구현예들에서, 돌연변이 식물은 본원에 기재된 폴리뉴클레오티드(들)의 한 개 이상의, 두 개 이상의, 세 개 이상의, 네 개 이상의 또는 다섯 개 이상의 엑손에서 하나 이상의 돌연변이를 가지지 않을 수도 있고; 또는 본원에 기재된 폴리뉴클레오티드(들)의 한 개 이상의, 두 개 이상의, 세 개 이상의, 네 개 이상의 또는 다섯 개 이상의 인트론에서 하나 이상의 돌연변이를 가지지 않을 수도 있고; 또는 본원에 기재된 폴리뉴클레오티드(들)의 프로모터에서 하나 이상의 돌연변이를 가지지 않을 수도 있고; 또는 본원에 기재된 폴리뉴클레오티드(들)의 3' 비번역 영역에서 하나 이상의 돌연변이를 가지지 않을 수도 있고; 또는 본원에 기재된 폴리뉴클레오티드(들)의 5' 비번역 영역에서 하나 이상의 돌연변이를 가지지 않을 수도 있고; 또는 본원에 기재된 폴리뉴클레오티드(들)의 암호화 영역에서 하나 이상의 돌연변이를 가지지 않을 수도 있고; 또는 본원에 기재된 폴리뉴클레오티드(들)의 비암호화 영역에서 하나 이상의 돌연변이를 가지지 않을 수도 있고; 또는 그의 두 개 이상의, 세 개 이상의, 네 개 이상의, 다섯 개 이상; 또는 그의 여섯개 이상의 조합을 가지지 않을 수도 있다.
추가적인 측면에서 본원에 기재된 폴리뉴클레오티드를 인코딩하는 유전자에서 돌연변이를 포함하는 식물, 식물 세포, 또는 식물 재료를 식별하기 위한 방법이 제공되는데, (a) 식물, 식물 세포 또는 식물 재료가 돌연변이 유발을 거치게 하는 단계; (b) 상기 식물, 식물 세포 또는 식물 재료 또는 그의 후손로부터 핵산 시료를 얻는 단계; 그리고 (c) 또는 본원에 기재된 폴리뉴클레오티드 또는 변이체 또는 그의 단편을 인코딩하는 유전자의 핵산서열을 결정하는 단계를 포함하고, 여기서 상기 서열에서의 차이는 하나 이상의 돌연변이를 나타낸다.
아연 집게(Zinc finger)는 본원에 기재된 폴리뉴클레오티드 중 하나 이상의 발현 또는 활성을 조절하기 위해 사용될 수 있다. 다양한 구현예에서, 폴리뉴클레오티드의 코딩 서열의 부분 또는 전부를 포함하는 유전체 DNA 서열은 아연 집게 뉴클레아제 매개 돌연변이 유발에 의해 변형된다. 유전체 DNA 서열은 아연 집게 단백질 결합을 위한 특이적 자리로 검색된다. 대안적으로, 유전체 DNA 서열은 아연 집게 단백질 결합을 위한 두 개의 특이적 자리로 검색되며, 여기서 상기 두 자리는 모두 대향하는 가닥에 위치해 있으며 함께 인접해 있는데, 예를 들어, 1, 2, 3, 4, 5, 6 또는 그 이상의 염기쌍 만큼 떨어져 있다. 따라서, 본원에 기재된 폴리뉴클레오티드에 결합하는 아연 집게 단백질이 제공된다.
아연 집게 단백질은 유전자에서 선택된 표적 자리를 인식하기 위해 조작될 수도 있다. 아연 집게 단백질은 자연적인 아연 집게 DNA-결합 도메인 및 비-자연적인 아연 집게 DNA-결합 도메인으로부터 절단(truncation) 또는 확장 또는 선별 방법, 예를 들어, 이에 한정하는 것은 아니지만, 파지 표시 선별, 세균 2-혼성 선별 또는 세균 1-혼성 선별과 연결된 자리-특이적 돌연변이 유발에 의하여 유도되는 모티프(motif)의 임의의 조합을 포함할 수 있다. 용어 "비-자연적인 아연 집게 DNA-결합 도메인"은 표적 핵산 내의 3-염기쌍 서열을 결합하고, 변형될 핵산을 포함하는 세포 또는 유기체에서 발생하지 않는, 아연 집게 DNA-결합 도메인을 나타낸다. 표적 유전자에 고유한 특이적 뉴클레오티드 서열을 결합하는 아연 집게 단백질을 고안하기 위한 방법은 본 기술분야에 공지되어 있다.
아연 집게 뉴클레아제는 폴리뉴클레오티드에 결합하는 아연 집게 단백질을 위해 코딩하는 첫번째 폴리뉴클레오티드와, 비-특이적 엔도뉴클레아제, 예를 들어, 이에만 한정하는 것은 아니지만 유형 IIS 엔도뉴클레아제를 위해 코딩하는 두번째 폴리뉴클레오티드의 융합을 형성하여 구축될 수도 있다. 아연 집게 단백질과 뉴클레아제와의 융합 단백질은 두 개의 염기쌍으로 이루어진 스페이서를 포함할 수도 있고 대안적으로, 스페이서는 세 개, 네 개, 다섯 개, 여섯개 또는 일곱개 또는 그 이상의 염기쌍으로 이루어질 수 있다. 다양한 구현예에서, 아연 집게 뉴클레아제는 이중가닥 파손을 폴리뉴클레오티드의 유전체 DNA 서열의 조절 영역, 암호화 영역, 또는 비-암호화 영역에 도입하고 폴리뉴클레오티드의 발현수준의 감소, 또는 그에 의해 인코딩되는 단백질 활성의 감소를 유도한다. 아연 집게 뉴클레아제에 의한 절단(cleavage)은 종종 비-상동 말단 결합에 의한 DNA 수선을 따르는 절단 자리에서 DNA가 결실되는 결과를 가져온다.
다른 구현예에서, 아연 집게 단백질은 폴리뉴클레오티드의 조절 서열에 결합하도록 선택될 수도 있다. 더욱 구체적으로, 조절 서열은 전사 개시 자리, 개시 코돈, 엑손 영역, 엑손-인트론 경계, 종결자, 정지 코돈을 포함할 수도 있다. 따라서 본 발명은 본원에 기재한 하나 이상의 폴리뉴클레오티드의 부근 또는 내부에서의 아연 집게 뉴클레아제-매개 돌연변이 유발에 의해 생성되는, 돌연변이, 비-자연 발생 또는 유전자전환 식물 또는 식물 세포, 및 아연 집게 뉴클레아제-매개 돌연변이 유발에 의해 이러한 식물 또는 식물 세포를 제조하기 위한 방법을 제공한다. 아연 집게 단백질과 아연 집게 뉴클레아제를 담배 식물로 전달하기 위한 방법은 메가뉴클레아제의 전달을 위해 이하에 기재된 것들과 유사하다.
또 다른 측면에서, I-CreI와 같은 메가뉴클아제를 사용해서, 돌연변이, 비-자연 발생 또는 유전자전환 또는 그렇지 않으면 유전적으로 변형된 식물을 제조하기 위한 방법이 제공된다. 자연 발생 메가뉴클레아제뿐만 아니라 재조합 메가뉴클레아제는 식물의 유전체 DNA 내의 단일 자리 또는 상대적으로 적은 자리에 구체적으로 이중가닥 파손을 야기하여 본원에 기재된 하나 이상의 폴리뉴클레오티드를 파괴하는 데에 사용될 수 있다. 메가뉴클레아제는 변경된 DNA-인식 성능을 가지는 조작된 메가뉴클레아제일 수도 있다. 메가뉴클레아제 단백질은 본 기술분야에 공지된 다양한 상이한 메커니즘에 의해 식물 세포로 전달될 수 있다.
본원은 식물 세포 또는 식물에서 본원에 기재된 폴리뉴클레오티드(들)(또는 본원에 기재된 이들의 임의의 조합)를 불활성시키는 메가뉴클레아제의 용도를 포함한다. 특히, 본 발명은 메가뉴클레아제를 사용하여 식물에서 폴리뉴클레오티드를 불활성시키기 위한 방법을 제공하는데, (a) 본원에 기재된 폴리뉴클레오티드를 포함하는 식물 세포를 제공하는 단계; (b) 메가뉴클레아제 또는 메가뉴클레아제를 인코딩하는 구성체를 상기 식물 세포로 도입하는 단계; 및 (c) 상기 메가뉴클레아제가 상기 폴리뉴클레오티드(들)를 실질적으로 불활성시킬 수 있게 하는 단계를 포함한다.
메가뉴클레아제는 폴리뉴클레오티드의 암호화 영역 내에 메가뉴클레아제 인식 자리를 절단하기 위해 사용될 수 있다. 이러한 절단은 종종 비-상동 말단 결합에 의한 돌연변이 DNA 수선을 따르는 메가뉴클레아제 인식 자리에서 DNA가 결실되는 결과를 가져온다. 유전자 암호화 서열에서의 이러한 돌연변이는 전형적으로 유전자를 불활성화하기에 충분하다. 식물 세포를 변형시키기 위한 이러한 방법은 첫째로 적절한 형질전환 방법을 사용하여 식물 세포로 메가뉴클레아제 발현 카세트를 전달하는 것을 포함한다. 최대 효율을 위해, 메가뉴클레아제 발현 카세트를 선택성(selectable) 마커에 연결시키고 선택제의 존재 하에 성공적으로 형질전환된 세포를 선택하는 것이 바람직하다. 이 접근법은 메가뉴클레아제 발현 카세트를 유전체로 통합시키는 결과를 가져올 것이지만, 식물에 조절 승인이 요구되는 경우에는 바람직하지 않을 수도 있다. 이러한 경우에, 메가뉴클레아제 발현 카세트(및 연결된 선택성 마커 유전자)가 통상적인 육종 기술을 사용해서 후속 식물 세대에서 떨어져 나갈 수도 있다. 대안적으로, 식물 세포는 처음에는 선택성 마커가 없는 메가뉴클레아제 발현 카세트로 형질전환될 수도 있고 그리고 선택제가 없는 매질에서 생장할 수도 있다. 이러한 조건 하에서, 처리된 세포의 한 부분은 메가뉴클레아제 발현 카세트를 얻을 것이고 그리고 메가뉴클레아제 발현 카세트를 유전체로 통합하지 않고 조작된 메가뉴클레아제를 일시적으로 발현할 것이다. 이것은 형질전환 효율에 중요하지 않기 때문에, 이러한 후자의 형질전환 절차는 더 많은 수의 처리된 세포가 스크리닝되어서 원하는 유전체 변형을 얻는 것이 필요하다. 상기 접근법은 또한 아연 집게 단백질 또는 아연 집게 뉴클레아제를 사용할 때 식물 세포를 변형하는 데에 적용될 수도 있다.
메가뉴클레아제 발현 카세트의 전달 이후, 식물 세포는, 처음에는, 사용된 구체적인 형질전환 절차에 대해 전형적인 조건 하에서 생장한다. 이것은 종종 어둠에서 26℃ 미만의 온도에서 매질 위에서 생장하는 형질전환된 세포를 의미할 수도 있다. 이러한 표준 조건은 기간, 바람직하게는 1-4일 동안 사용되어서 식물 세포가 형질전환 공정으로부터 복구될 수 있도록 할 수 있다. 이러한 초기의 복구 기간을 따르는 임의의 지점에서, 생장온도를 올려서, 상기 조작된 메가뉴클레아제의 활성을 자극해서 메가뉴클레아제 인식 자리를 절단하고 돌연변이시킬 수도 있다.
소정의 적용분야의 경우, 폴리뉴클레오티드를 식물의 유전체로부터 정확하게 제거시키는 것이 바람직할 수도 있다. 이러한 적용분야는 한 쌍의 조작된 메가뉴클레아제를 이용할 수 있는데, 이들 각각은 의도된 결실의 양쪽 면 위에서 메가뉴클레아제 인식 자리를 절단한다. 유전자를 인식하고 그것에 결합하며 유전체로 이중가닥의 파손을 도입할 수 있는 TAL 효과기 뉴클레아제(TAL Effector Nucleases; TALENs)도 사용될 수 있다. 따라서, 또 다른 측면에서, TAL 효과기 뉴클레아제를 사용해서 본원에 기재된 돌연변이, 비-자연 발생 또는 유전자전환 또는 그렇지 않으면 유전자 변형된 식물이 고려된다.
유전자 변형에 사용하기 위한 적절한 식물은 이들에만 한정하는 것은 아니지만, 단자엽 및 쌍자엽 식물 및 식물 세포계를 포함하고, 이것은 다음의 과들 중 하나로부터의 종을 포함한다: 쥐꼬리망초과, 부추과, 알스트로에메리아세, 수선화과, 협죽도과, 야자과, 국화과, 매자나무과, 빅사세(Bixaceae), 십자화과, 브로멜리아시에, 삼과, 석죽과, 개비자나무과, 명아주과, 콜키카시에(Colchicaceae), 박과, 마과, 마황과, 에리트록실라시에(Erythroxylaceae), 대극과, 콩과, 꿀풀과, 아마과, 석송과, 아욱과, 멜란티움과, 파초과, 도금양과, 니사나무과, 양귀비과, 침엽수, 질경이과, 벼과, 장미과, 꼭두서니과, 버드나무과, 무환자나무과, 가지과, 주목과, 차나무과, 또는 포도과.
적절한 종은 오크라, 침엽수, 관상수, 겨이삭, 파속식물, 알스트로에메리아, 아나나스, 안드로그라피스, 안드로포곤, 향쑥속, 아룬도, 아트로파, 매자나무, 베타(Beta), 빅사(Bixa), 배추속 식물, 금잔화, 동백나무, 캠토테카(Camptotheca), 대마초, 고추, 카르타무스, 일일초, 개비자나무, 국화, 기나나무, 수박, 커피, 콜키쿰, 콜레우스, 오이, 쿠쿠르비타, 우산대바랭이, 흰독말풀, 패랭이속, 디기칼리스, 항염, 오일야자, 마황, 에리언투스(Erianthus), 에리트록실룸(Erythroxylum), 유클리티스, 페스투카(Festuca), 야생딸기, 갈란투스, 글리신, 고시피움, 해바라기, 파라고무, 호르데움, 사리풀잎, 자트로파, 상추종, 아마, 롤리움, 루피너스, 토마토, 석송속, 마니호트, 알팔파, 박하, 억새, 바나나, 니코티아나, 벼, 수수속, 양귀비속, 파르테니움, 페니세튬, 피튜니아, 갈풀, 산조아재비, 소나무, 새포아풀, 포인세티아, 포플러스, 라우월피아, 피마자, 장미, 사탕수수, 버드나무, 혈근초, 스코폴리아, 호밀, 가지속, 수수, 스파르티나, 시금치, 타나세튬, 주목, 테오브로마, 트리티코세케일, 밀, 우니올라(Uniola), 꽃창포과, 빙카속, 리파리아 및 옥수수 속의 일원을 포함할 수도 있다.
적절한 종은 수수속 아종, 수수 아종, 억새 아종, 사탕수수 아종, 에리언투스(Erianthus) 아종, 포플러스 아종, 큰파란줄기(나도기름새), 페니세튬 퍼푸레움(부들), 갈풀(리이드 케너리그라스), 우산잔디(버뮤다 그래스), 페스투카 아룬디나세아(넓은 잎김의털), 스파르티나 펙티나타(프레리 코디-잔디), 알팔파 벼종(알팔파), 아룬도 도낵스(물대), 호밀(라이), 버드나무 아종 (버드나무), 유칼립투스 아종 (유칼립투스), 트리티코세케일(트리틱 밀 타임스 라이), 대나무, 헬리안투스 안누스(해바라기), 카르타무스 홍화(잇꽃), 자트로파 쿠르카스(자트로파), 피마자 코뮤니스(피마자유), 오일야자(야쟈), 아마(플랙스), 배추속 식물, 사탕무우 (사탕무), 마니호트 자리공(카사야), 리코페르시콘 에스쿨렌텀(토마토), 렉투카 사티바(상추), 무시클리제 알카(바나나), 가지속 감자(감자), 배추속 식물(브로콜리, 꽃양배추, 양배추), 동백나무 차나무(차), 야생딸기 아나나세 (딸기), 테오브로마 카카오(코코아), 커피61 아라비카(커피), 리파리아 포도 (포도), 아나나스 코모수스(파인애플), 캅시쿰 안눔(핫 페퍼, 스위트 페퍼), 알리움 세파(양파), 쿠쿠미스 멜로(멜론), 오이(오이), 쿠쿠르비타 맥시마(호박), 쿠쿠르비타 (호박), 스피나세아 올레라세아(시금치), 시트룰루스 라나투스(수박), 아벨모스쿠스 에스쿨렌투스(오크라), 솔라넘 멜로지나(가지), 장미 아종 (장미), 패랭이속 카요필러스(카네이션), 피튜니아 아종 (피튜니아), 포인세티아 풀체리마(포인세티아), 루피너스 알부스(루핀), 우니올라 파니쿨라타(귀리), 벤트그래스(겨이삭 아종), 포플러스 트레물로이드(아스펜), 소나무 아종 (소나무), 침엽수 아종 (침염수), 관상수 아종 (단풍나무), 호르데움 불가레(보리), 모아 프라텐시스(큰새포아풀), 롤리움 아종 (라이그래스) 및 큰조아재비(티모시), 수수속 버들명아주(수수속 풀), 수수61 싸리나무61(수수, 수수류), 마스칸투스 기간투스(억새), 사탕수수 종 (사탕수수), 포플러스, 제아 메이즈(옥수수), 글리신 맥스(콩), 배추속 식물 나프스 (카놀라), 트리티쿰 애스티븀(밀), 고시피움 허수튬(코튼), 오리자 사티바(쌀), 헬리안투스 안누스(해바라기), 메디카고 사티바(알팔파), 베타 불가리스(사탕무), 또는 페니세튬 글라우쿰(진주 기장)을 포함할 수 있다.
다양한 구현예는 유전자 발현 수준을 조절하기 위해 변형된 돌연변이 담배, 비-자연 발생 담배 또는 유전자전환 담배 식물 또는 식물 세포에 관한 것으로, 그에 따라 폴리펩티드의 발현수준이 대조군 식물과 비교시 관심있는 조직 내에서 조절되는 담배 또는 식물 세포-예컨대 담배 식물 또는 식물 세포-를 생산할 수 있다. 상기 개시된 조성물 및 방법은 N. 루스티카 및 N. 타바쿰(예를 들어, LA B21, LN KY171, TI 1406, Basma, Galpao, Perique, Beinhart 1000-1 및 Petico)을 포함해서, 니코티아나 속의 임의의 종에 적용될 수 있다. 다른 종은 N. acaulis, N. acuminata, N. africana, N. alata, N. ameghinoi, N. amplexicaulis, N. arentsii, N. attenuata, N. azambujae, N. benavidesii, N. benthamiana, N. bigelovii, N. bonariensis, N. cavicola, N. clevelandii, N. cordifolia, N. corymbosa, N. debneyi, N. excelsior, N. forgetiana, N. fragrans, N. glauca, N. glutinosa, N. goodspeedii, N. gossei, N. hybrid, N. ingulba, N. kawakamii, N. knightiana, N. langsdorffii, N. linearis, N. longiflora, N. maritima, N. megalosiphon, N. miersii, N. noctiflora, N. nudicaulis, N. obtusifolia, N. occidentalis, N. occidentalis subsp. hesperis, N. otophora, N. paniculata, N. pauciflora, N. petunioides, N. plumbaginifolia, N. quadrivalvis, N. raimondii, N. repanda, N. rosulata, N. rosulata subsp. ingulba, N. rotundifolia, N. setchellii, N. simulans, N. solanifolia, N. spegazzinii, N. stocktonii, N. suaveolens, N. sylvestris, N. thyrsiflora, N. tomentosa, N. tomentosiformis, N. trigonophylla, N. umbratica, N. undulata, N. velutina, N. wigandioides, 및 N. x sanderae을 포함하고 있다.
또한 담배 재배품종 및 엘리트(elite) 담배 재배품종의 용도도 본원에서 고려된다. 따라서 형질전환, 비-자연 발생 또는 돌연변이 식물은 하나 이상의 유전자전환 유전자, 또는 하나 이상의 유전자 돌연변이 또는 그의 조합을 포함하는, 담배 변이체 또는 엘리트 담배 재배품종일 수 있다. 각각의 담배 변이체 또는 담배 재배품종(예를 들어, 엘리트 담배 재배품종)에서 이 돌연변이가 자연적으로 발생하지 않는다는 가정 하에, 유전자 돌연변이(들)(예를 들어, 하나 이상의 다형성)는 각각의 담배 변이체 또는 담배 재배 품종(예를 들어, 엘리트 담배 재배품종)에서 자연적으로 존재하지 않는 돌연변이일 수 있거나 또는 자연 발생 유전자 돌연변이(들)일 수 있다.
특히 유용한 니코티아나 타바쿰 변이체는 버얼리종, 다크종(dark type), 황색종, 및 오리엔탈형 담배를 포함한다. 변종 또는 재배품종의 비-제한적인 예로는 다음과 같다: BD 64, CC 101, CC 200, CC 27, CC 301, CC 400, CC 500, CC 600, CC 700, CC 800, CC 900, Coker 176, Coker 319, Coker 371 Gold, Coker 48, CD 263, DF911, DT 538 LC Galpao tobacco, GL 26H, GL 350, GL 600, GL 737, GL 939, GL 973, HB 04P, HB 04P LC, HB3307PLC, Hybrid 403LC, Hybrid 404LC, Hybrid 501 LC, K 149, K 326, K 346, K 358, K394, K 399, K 730, KDH 959, KT 200, KT204LC, KY10, KY14, KY 160, KY 17, KY 171, KY 907, KY907LC, KY14xL8 LC, Little Crittenden, McNair 373, McNair 944, msKY 14xL8, Narrow Leaf Madole, Narrow Leaf Madole LC, NBH 98, N-126, N-777LC, N-7371LC, NC 100, NC 102, NC 2000, NC 291, NC 297, NC 299, NC 3, NC 4, NC 5, NC 6, NC7, NC 606, NC 71, NC 72, NC 810, NC BH 129, NC 2002, Neal Smith Madole, OXFORD 207, PD 7302 LC, PD 7309 LC, PD 7312 LC, ’Perique' tobacco, PVH03, PVH09, PVH19, PVH50, PVH51, R 610, R 630, R 7-11, R 7-12, RG 17, RG 81, RG H51, RGH 4, RGH 51, RS 1410, Speight 168, Speight 172, Speight 179, Speight 210, Speight 220, Speight 225, Speight 227, Speight 234, Speight G-28, Speight G-70, Speight H-6, Speight H20, Speight NF3, TI 1406, TI 1269, TN 86, TN86LC, TN 90, TN 97, TN97LC, TN D94, TN D950, TR (Tom Rosson) Madole, VA 309, VA359, AA 37-1, B13P, Xanthi (Mitchell-Mor), Bel-W3, 79-615, Samsun Holmes NN, KTRDC number 2 Hybrid 49, Burley 21, KY8959, KY9, MD 609, PG01, PG04, PO1, PO2, PO3, RG11, RG 8, VA509, AS44, Banket A1, Basma Drama B84/31, Basma I Zichna ZP4/B, Basma Xanthi BX 2A, Batek, Besuki Jember, C104, Coker 347, Criollo Misionero, Delcrest, Djebel 81, DVH 405, Galpao Comum, HB04P, Hicks Broadleaf, Kabakulak Elassona, Kutsage E1, LA BU 21, NC 2326, NC 297, PVH 2110, Red Russian, Samsun, Saplak, Simmaba, Talgar 28, Wislica, Yayaldag, Prilep HC-72, Prilep P23, Prilep PB 156/1, Prilep P12-2/1, Yaka JK-48, Yaka JB 125/3, TI-1068, KDH-960, TI-1070, TW136, Basma, TKF 4028, L8, TKF 2002, GR141, Basma xanthi, GR149, GR153, Petit Havana. 본원에서 특정하게 식별되지 않는다고 하더라도 상기한 것들의 낮은 컨버터 아변종도 또한 고려된다.
구현예들은 또한 본원에 기재된 폴리뉴클레오티드(또는 본원에 기재된 그의 임의의 조합)의 발현 또는 활성을 조절하기 위해서 변형된 돌연변이 식물, 비-자연 발생 식물, 혼성 식물 또는 유전자전환 식물을 생산하기 위한 조성물 및 방법에 관한 것이다. 유리하게는, 얻어진 돌연변이 식물, 비-자연 발생 식물, 혼성 식물 또는 유전자전환 식물은 대조군 식물에 대한 전체적인 외관과 동일하거나 또는 실질적으로 동일할 수도 있다. 성숙도, 식물당 잎의 수, 줄기 높이, 잎 삽입각도, 잎 크기(폭 및 길이), 마디 거리, 및 잎몸-주맥 비율과 같은 다양한 표현형 특성은 현장 관측에 의해서 측정될 수 있다.
하나의 측면은 본원에 기재된 돌연변이 식물, 비-자연 발생 식물, 혼성 식물 또는 유전자전환 식물의 종자에 관한 것이다. 바람직하게는, 종자는 담배 종자이다. 추가적인 측면은 본원에 기재된 돌연변이 식물, 비-자연 발생 식물, 혼성 식물 또는 유전자전환 식물의 꽃가루 또는 배주에 관한 것이다. 또한, 웅성 불임성을 부여하는 핵산을 포함하는, 본원에 기재된 돌연변이 식물, 비-자연 발생 식물, 혼성 식물 또는 유전자전환 식물이 제공된다.
본원에 기재된 돌연변이 식물, 비-자연 발생 식물, 혼성 식물 또는 유전자전환 식물 또는 그의 일부분의 재생가능한 세포의 조직 배양이 제공되며, 배양은 부모의 모든 형태학적 및 생리학적 특성을 표현시킬 수 있는 식물을 재생한다. 재생가능한 세포는 이들에만 한정하는 것은 아니지만, 잎, 꽃가루, 배아, 자엽, 배축, 뿌리, 뿌리 끝, 꽃밥, 꽃 및 그의 일부, 밑종자, 싹, 줄기, 줄기대 또는 중과피 및 포자낭 또는 그로부터 유도되는 캘러스 또는 원형질체를 포함한다.
또 다른 측면은, 돌연변이, 비-자연 발생 또는 유전자전환 식물 또는 세포로부터 유도되었거나 유도가능한 건조 식물 재료- 예컨대 건조 잎 또는 건조 담배-에 관한 것으로, 본원에 기재된 폴리뉴클레오티드의 하나 이상의 발현 또는 그에 따라 인코딩된 단백질의 활성이 감소되고 니코틴의 노르니코틴으로의 변환이 감소되고, 결과적으로 NNN 수준 감소를 초래한다.
적절하게는 상기 식물(예를 들어, 잎)의 외관은 대조군 식물과 실질적으로 동일하다. 적절하게는, 식물은 담배 식물이다.
또한 구현예들은 조절된 노르니코틴 및/또는 적어도 NNN의 수준을 갖는 식물 또는 식물 성분(예를 들면, 잎 - 예컨대 녹색 잎 또는 건조 잎 - 또는 담배) 또는 식물 세포를 초래할 수 있는 본원에 기재된 폴리뉴클레오티드 또는 폴리펩티드의 하나 이상의 발현 또는 활성을 조절하기 위해 변형된 돌연변이, 비-자연 발생 또는 유전자전환 식물 또는 식물 세포를 생산하기 위한 조성물 및 방법에 관한 것이다.
본원에 기재한 방법에 따라서 얻어지는 돌연변이, 비-자연 발생 또는 유전자전환 식물은 대조군 식물에 대한 시각적인 외관과 유사하거나 또는 실질적으로 동일할 수도 있다. 한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 식물의 잎 중량은 대조군 식물과 실질적으로 동일하다. 한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 식물의 잎 개수는 대조군 식물과 실질적으로 동일하다. 한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 식물의 잎 중량 및 잎 개수는 대조군 식물과 실질적으로 동일하다. 한 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 식물의 줄기 높이는 예를 들어, 현장 이식 뒤 한 달, 두 달, 세 달 이상 또는 토핑 뒤 10일, 20일, 30일 또는 36일 이상에서, 대조군 식물과 실질적으로 동일하다. 예를 들어, 돌연변이, 비-자연 발생 또는 유전자전환 식물의 줄기 높이는 대조군 식물의 줄기 높이보다 작지 않다. 또 다른 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 식물의 엽록소 함량은 대조군 식물과 실질적으로 유사하다. 또 다른 구현예에서, 돌연변이, 비-자연 발생 또는 유전자전환 식물의 줄기 높이는 실질적으로 대조군 식물과 동일하고 그리고 돌연변이, 비-자연 발생 또는 유전자전환 식물의 엽록소 함량은 실질적으로 대조군 식물과 동일하다. 다른 구현예에서, 비-자연 발생 돌연변이 또는 유전자전환 식물의 잎의 크기 또는 형태 또는 수 또는 착색은 실질적으로 대조군 식물과 동일하다. 적절하게는, 식물은 담배 식물이다.
또 다른 측면에서, 식물의 적어도 일부분(예를 들어, 잎-예컨대 건조 잎-또는 담배) 내의 노르니코틴 및/또는 NNN의 양을 조절하는(예, 감소시키는) 방법이 제공되어 있으며, (i) 본원에 기재된 폴리펩티드(본원에 기재된 이들의 임의의 조합)의 하나 이상의 발현 또는 활성을 조절하는(예. 감소시키는) 단계로, 여기서 적절하게는 상기 폴리펩티드(들)은 본원에 기재된 대응하는 폴리뉴클레오티드 서열에 의해 인코딩되는 단계; (ii) (i) 단계에서 얻은 돌연변이, 비-자연 발생 또는 유전자전환 식물의 적어도 일부분 (예를 들어, 잎-예컨대 건조 잎-또는 담배 또는 연기) 내의 노르니코틴 및/또는 NNN 함량을 측정하는 단계; 그리고 (iii) 상기 노르니코틴 및/또는 NNN 함량이 대조군 식물에 비해 조절된(예. 감소된) 돌연변이, 비-자연 발생 또는 유전자전환 식물을 식별하는 단계를 포함한다. 적절하게는, 돌연변이, 비-자연 발생 또는 유전자전환 식물의 시각적인 외관은 대조군 식물과 실질적으로 동일하다. 적절하게는, 식물은 담배 식물이다.
다른 측면에서, 건조 식물 재료 - 예컨대 건조 잎-의 적어도 일부분 내의 노르니코틴 및/또는 NNN의 양을 조절하는(예. 감소) 방법으로, (i) 폴리펩티드(본원에 기재된 이들의 임의의 조합)의 하나 이상의 발현 또는 활성을 조절하는(예. 감소시키는) 단계로, 여기서 적절하게는 상기 폴리펩티드(들)은 본원에 기재된 대응하는 폴리뉴클레오티드 서열에 의해 인코딩되는 단계; (ii) 식물 재료-예컨대 상기 잎 중 하나 이상-을 수확하고 일정 시간 동안 건조시키는 단계; (iii) (ii) 단계에서 얻은 건조 식물 재료의 적어도 일부분 내의 노르니코틴 및/또는 NNN 함량을 측정하는 단계; 그리고 (iv) 상기 노르니코틴 및/또는 NNN 함량이 대조군 식물에 비해 조절된(예. 감소된) 건조 식물 재료를 식별하는 단계를 포함한다.
대조군에 비해 발현의 증가는 약 5% 내지 약 100%, 또는 적어도 10%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 100% 이상의 증가 - 예컨대 200% 또는 300% 이상일 수도 있으며, 전사 활성 또는 폴리뉴클레오티드 발현 또는 폴리펩티드 발현의 증가 또는 이들의 조합을 포함한다.
대조군에 비해 활성의 증가는 약 5% 내지 약 100%, 또는 적어도 10%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 100% 이상의 증가 - 예컨대 200% 또는 300% 이상일 수도 있다.
대조군에 비해 발현의 감소는 약 5% 내지 약 100%, 또는 적어도 10%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 100%의 감소일 수도 있으며, 전사 활성 또는 폴리뉴클레오티드 발현 또는 폴리펩티드 발현의 감소 또는 이들의 조합을 포함한다.
대조군에 비해 활성의 감소는 약 5% 내지 약 100%, 또는 적어도 10%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 100%의 감소일 수도 있다.
본원에 기재된 폴리뉴클레오티드 및 재조합 구성체는 관심있는 식물 종, 적절하게는 담배에서의 효소의 발현을 조절하기 위해서 사용될 수 있다.
많은 폴리뉴클레오티드 기반 방법은 식물 및 식물 세포에서의 유전자 발현을 증가시키기 위해서 사용될 수 있다. 실시예에 의해서, 형질전환될 식물과 상용성이 있는 것으로 식물 및 식물 세포에서 유전자를 과발현시킬 수 있는 상류의 프로모터와 함께 관심있는 유전자를 포함하는 구성체, 벡터 또는 발현 벡터가 제조될 수 있다. 예시적인 프로모터는 본원에 기재되어 있다. 형질전환에 따라서 그리고 적절한 조건 하에서 성장할 때, 프로모터는 식물 또는 그의 특이적 조직에서의 효소의 수준을 조절(예를 들어 감소)하기 위하여 발현을 유도할 수 있다. 하나의 예시적인 구현예에서, 식물 및 식물 세포에서 유전자를 과발현시키기 위하여 본원에 기재된 하나 이상의 폴리뉴클레오티드 (또는 본원에 기재된 이들의 임의의 조합)을 운반하는 벡터가 생성된다. 벡터는 형질전환유전자의 상류에 식물에서 모든 조직에서의 구성적인 발현을 유도하는 꽃양배추 모자이크 바이러스 35S 프로모터와 같은 적절한 프로모터를 가진다. 벡터는 또한 형질전환된 캘리(calli) 및 세포주를 선별하기 위한 항생제 내성 유전자를 가진다.
따라서 다양한 구현예는 폴리뉴클레오티드의 다중 사본을 식물 유전체로 통합시켜서 본원에 기재된 하나 이상의 폴리뉴클레오티드(또는 본원에 기재된 그의 임의의 조합)의 발현 수준을 조절(예를 들어 감소)하기 위한 방법에 관한 것으로, 본원에 기재된 하나 이상의 폴리뉴클레오티드에 작동가능하게 연결되어 있는 프로모터를 포함하는 발현 벡터로 식물 세포 숙주를 형질전환하는 것을 포함한다. 재조합 폴리뉴클레오티드에 의해서 인코딩된 폴리펩티드는 고유한 폴리펩티드이거나 세포에 이형일 수 있다.
본원에 기재된 하나 이상의 폴리뉴클레오티드(또는 본원에 기재된 그의 임의의 조합)의 돌연변이 대립 유전자를 운반하는 담배 식물은 유용한 계통, 변이체 및 혼성체를 형성하기 위하여 식물 육종 프로그램에 사용될 수 있다. 특히, 돌연변이 대립유전자는 상술한 상업적으로 중요한 변이체로 침투(introgress)된다. 본원에 기재된 비-자연 발생 식물 또는 유전자전환 식물을 상이한 유전자 동일성을 포함하는 식물과 교배하는 것을 포함하는 식물 육종 방법이 제공된다. 방법은 추가로 바람직한 유전적 특성 또는 유전적 배경을 가지는 후손이 얻어질 때까지 후손 식물을 다른 식물과 교배시키는 단계 그리고 선택적으로 반복 교배하는 단계를 더 포함할 수도 있다. 이러한 육종 방법에 의해 작용하는 한가지 목적은 바람직한 유전적 특성을 특히 상업적으로 관심이 있는 다른 변이체, 육종 계통, 혼성체 또는 재배 품종에 도입시키기 위한 것이다. 또 다른 목적은 단일 식물 변이체, 계통, 혼성체 또는 재배 품종에서의 상이한 유전자의 유전자 변형의 적층(stacking)을 용이하게 하기 위한 것이다. 종내 교배 뿐만 아니라 종간의 교배가 고려되고 있다. 이러한 교배로부터 발생하는 후손 식물은 또한 육종 계통으로도 지칭되며, 이들은 본 발명의 비-자연 발생 식물의 실시예이다.
한 구현예에서, 비-자연 발생 담배 식물을 생성하기 위한 방법이 제공되고, (a) 후손 담배 종자를 얻기 위해서 돌연변이 또는 유전자전환 담배 식물을 제2 담배 식물로 교배시키는 단계; (b) 비-자연 발생 담배 식물을 얻기 위해서 식물 성장 조건 하에서 후손 담배 종자를 성장시키는 단계를 포함한다. 본 방법은 추가로 (c) 후손 담배 종자를 얻기 위해서 비-자연 발생 담배 식물의 이전 세대를 그 자체 또는 또 다른 담배 식물과 교배시키는 단계; (d) 추가적인 비-자연 발생 담배 식물을 얻기 위해서 식물 성장 조건 하에서 단계 (c)의 후손 담배 종자를 성장시키는 단계 그리고 (e) 비-자연 발생 담배 식물의 추가적인 세대를 얻기 위해서 단계 (c)와 (d)를 여러번 계속 교차시키고 성장시키는 단계를 포함한다. 본 방법은 선택적으로 단계 (a) 이전에 특이적이고 돌연변이 또는 유전자전환 식물과 동일하지 않은 유전적 동일성을 가지는 부모식물을 제공하는 단계를 포함한다. 일부 구현예에서, 육종 프로그램에 따라서, 비-자연 발생 담배 식물의 세대를 생성하기 위해 교배 및 성장 단계를 0회 내지 2회, 0회 내지 3회, 0회 내지 4회, 0회 내지 5회, 0회 내지 6회, 0회 내지 7회, 0회 내지 8회, 0회 내지 9회, 또는 0회 내지 10회 반복한다. 역교배는 부모 중 하나의 그것과 가까운 유전적 동일성을 가지는 다음 세대에서의 후손 식물을 얻기 위해 후손이 그의 부모 또는 그의 부모와 유전적으로 동일한 또 다른 식물과 교배되는 방법의 예시이다. 식물 육종, 특히 담배 식물 육종을 위한 기술은 주지되어 있고 본 발명의 방법에 사용될 수 있다. 본 방법은 추가로 이러한 방법에 의해서 생성되는 비-자연 발생 담배 식물을 제공한다. 소정의 구현예들은 상기 식물을 선별하는 단계를 배제한다.
본원에서 설명하는 방법의 일부 구현예에서, 육종으로부터 발생하는 계통 및 변이체 유전자를 위한 스크리닝은 표준 현장 절차를 사용해서 현장에서 평가된다. 본래의 돌연변이를 유발하지 않는 부모를 포함하는 대조군 표현형이 포함되고 개체는 무작위의 완전한 블록 설계 또는 다른 적절한 현장 설계로 현장에 배열되어 있다. 담배의 경우, 표준 작물학적인 관행이 사용되는데 예를 들어 담배가 건조 이전과 그 동안의 화학적 및 다른 일반적인 테스트를 위해 수확되고, 계량되고, 그리고 시료링된다. 데이터의 통계학적인 분석이 수행되어서 부모 계통에 대한 선택된 계통의 유사성을 확인할 수 있다. 선택된 식물의 세포유전학적 분석은 경우에 따라서 수행되어서 염색체 조성 및 염색체 쌍 관계를 확인할 수 있다.
DNA 지문분석, 단일 뉴클레오티드 다형성, 마이크로새틀라이트 마커, 또는 유사한 기술은 본원에 기재된 바와 같은, 유전자의 돌연변이 대립유전자를 전달 또는 육종하기 위해서 마커-보조 선택(MAS) 육종 프로그램에 사용될 수 있다. 예를 들어, 육종자는 작물학상으로 바람직한 유전자형과 돌연변이를 포함하는 유전자형을 혼성화하여 분리된 개체군들을 형성할 수 있다. F2 또는 역교배 세대에서의 식물은 본원에 기재된 기술 중 하나를 이용해서, 유전체 서열 또는 그의 단편으로부터 개발되는 마커를 이용해서 스크리닝될 수 있다. 돌연변이 대립유전자를 가지는 것으로 확인된 식물은 역교배되거나 자가수분되어서 스크리닝될 두번째 개체군을 형성할 수 있다. 예상되는 유전 패턴 또는 사용되는 MAS 기술에 따라, 원하는 각각의 식물의 확인을 보조하기 위하여 역교배의 각각의 주기 전에 선택된 식물을 자가-수분하는 것이 필요하다. 역교배 또는 다른 육종 절차는 반복되는 부모의 원하는 표현형이 복구될 때까지 반복될 수 있다.
육종 프로그램에서, 성공적인 교배는 수정된 F1 식물을 생산한다. 선택된 F1 식물은 부모 중 하나와 교배될 수 있고, 그리고 첫번째 역교배 세대 식물은 변이체 유전자 발현(예를 들어, 유전자의 null 버전)을 위한 재검증된 개체군을 생산하기 위해서 자가수분 된다. 역교배, 자가 수분 및 스크리닝의 과정은 예를 들어, 마지막 스크리닝이 반복되는 부모에 생식력이 있고, 합리적으로 유사한 식물을 생산할 때까지 적어도 4번 반복된다. 바람직하다면, 식물은 자가수분되고 후손은 변이체 유전자 발현을 나타내는 식물을 확인하기 위해서 그 이후에 다시 스크리닝된다. 일부 구현예에서, F2 세대의 식물 개체군은 변이체 유전자 발현을 위해 스크리닝되고, 예를 들어, 본원에 기재된 폴리뉴클레오티드(또는 본원에 기재된 그의 임의의 조합)을 포함하는 폴리뉴클레오티드 서열 정보를 기초로 하여 프라이머를 가지는 PCR 방법을 사용해서, 표준 방법에 따라서 유전자의 부재로 인해, 예를 들면, 식물은 폴리펩티드를 발현하는 것이 실패하는 것으로 확인된다.
혼성체 담배 변이체는 첫번째 변이체의 교배모수(female parent) 식물(즉, 종자 부모(seed parent))의 자가수분을 방지함으로써, 교배모수 식물을 수정시키는 두번째 변이체의 웅성 부모 식물로부터의 수분을 허용함으로써, 그리고 F1 혼성체 종자를 교배모수 식물에 형성함시킴으로써 제조될 수 있다. 교배모수 식물의 자가수분은 꽃 발생의 초기단계에 꽃을 제거함으로써 억제될 수 있다. 선택적으로, 웅성불임성의 형태를 통해 교배모수 식물의 꽃가루 형성을 방지할 수 있다. 예를 들어, 웅성불임성은 세포질 웅성불임성(CMS) 또는 이식 유전자가 소포자 생성 및/또는 꽃가루 형성, 또는 자기 불화합성을 억제하는 유전자전환 웅성불임성에 의해 생성될 수 있다. CMS가 포함된 교배모수 식물은 특히 유용하다. 교배모수 식물이 CMS인 구현예에서, 꽃가루는 웅성가임 식물로부터 수확되고, 교배모수 식물의 암술머리에 수동적으로 적용된다. 그리고 얻어진 F1 종자가 수확된다.
본원에 기재된 변이체와 계통은 단일 교배 담배 F1 혼성체를 형성하는데 사용될 수 있다. 이러한 구현예에서, 부모 변이체의 식물은 웅성 친 식물에서 교배모수 식물로 자연적 교배수분을 촉진시키기 위해 실질적으로 동형인 인접한 단일 개체군으로써 자랄 수 있다. 교배모수 식물에서 형성된 F1 종자는 선택적으로 기존의 방법으로 수확된다. 대량으로 두 부모 식물 품종을 재배할 수 있고, 교배모수에 의해 형성된 F1 혼성체 종자 및 자가 수분의 결과로 인한 웅성 친에 형성된 종자와의 조합을 수확할 수 있다. 대안으로, 삼원 교혼성체는 단일 교배 F1 혼성체가 교배모수로써 사용되고, 다른 웅성 친과 교배되는 경우 수행될 수 있다. 다른 대안으로, 이중-교배 혼성체는 두 개의 다른 단일 교배의 F1 후손이 그들 스스로 교배되는 경우 생성된다.
돌연변이, 비-자연 발생 또는 유전자전환 식물의 개체는 원하는 특성이나 표현형을 가지는 개체군을 스크리닝하거나 또는 선별할 수 있다. 예를 들어, 단일 유전자전환 경우의 후손의 개체군은 그에 의해서 인코딩되는 폴리펩티드의 원하는 수준의 발현 또는 활성을 갖는 식물을 위해 스크리닝할 수 있다. 물리적, 생화학적 방법은 발현 또는 활성 수준을 식별하는 데 사용될 수 있다. 이것은 폴리뉴클레오티드의 탐지를 위한 서던 분석 또는 PCR 증폭; RNA 전사체를 탐지하기 위한 노던블롯, S1 RNase 보호, 프라이머 신장법 또는 RT-PCR 증폭; 폴리펩티드 및 폴리뉴클레오티드의 효소 또는 리보자임 활성을 탐지하기 위한 효소 분석법; 및 폴리펩티드를 검출하기 위한 단백질 겔 전기천공법, 웨스턴블롯, 면역침강법, 및 효소-연결 면역분석법을 포함한다. 가시적 분자결합화, 효소 염색, 및 면역 염색법과 같은 다른 기술들은 폴리펩티드 또는 폴리뉴클레오티드의 존재 또는 발현을 검출하는데 사용될 수 있다.
하나 이상의 재조합 폴리뉴클레오티드, 하나 이상의 폴리뉴클레오티드 구성체, 하나 이상의 이중가닥의 RNA, 하나 이상의 컨쥬게이트 또는 하니 이상의 벡터/발현 벡터를 포함하는 돌연변이, 비-자연 발생 또는 유전자전환 식물 세포 및 식물이 본원에 기재되어 있다.
제한 없이, 본원에 기재된 식물은 본 발명에 따라서 발현 또는 활성이 조절되기 전후에 다른 목적을 위해서 변형될 수 있다. 하나 이상의 다음 유전적 변형은 돌연변이, 비-자연 발생 또는 유전자전환 식물체에 존재할 수 있다. 한 구현예에서, 질소 대사 중간체의 변환에 관여하는 하나 이상의 유전자는 조절되어, 건조시, 대조군 식물보다, 적어도 하나의 담배 특이 니트로사민의 수준이 낮은 식물(예컨대 잎)을 생산한다. 조절될 수 있는 유전자의 비제한적인 예는 니코틴에서 노르니코틴으로의 변환에 참여하는 CYP82E4, CYP82E5 및 CYP82E10과 같은 니코틴 탈메틸효소를 인코딩하는 유전자를 포함하고, WO2006091194, WO2008070274, WO2009064771 및 PCT/US2011/021088에 기재되어 있으며 본원에 상세히 기재되어 있는 바와 같다. 한 구현예에서, 중금속 흡수 또는 중금속 전달에 관여하는 하나 이상의 유전자가 조절되어, 변형(들) 없는 대조군 식물 또는 그의 부분보다 낮은 중금속 함유량을 가지는 식물 또는 식물의 부분(잎과 같은)을 생산한다. 이들에만 제한하는 것은 아니지만, 예를 들어 양이온 확산 촉진자(CDF)와, Irt와 같은 단백질(ZIP)인 Zrt과, 양이온 교환체(CAX) 과, 구리 운반자(CORT), 중금속 P 형 ATP 분해효소(예를 들어, WO2009074325에 설명된 HMAs) 과, 자연적 저항성 관련 대식세포 단백질(NRAMP)의 동족체의 패밀리 및 카드뮴 같은 중금속의 수송에 관여하는 ATP 결합(ABC) 수송체(예를 들어, WO2012/028309에 설명된 MRPs)의 유전자를 포함하는데, 여기서 사용된 중금속의 용어는 전이 금속을 포함한다. 본원에서 사용되는 바와 같이 중금속이란 용어는 전이 금속을 포함한다. 다른 조절의 예는 제초제 저항성을 포함하며, 예를 들면, 글리포세이트는 광범위 스펙트럼의 제초제의 활성 성분이다. 글리포세이트 저항성 유전자전환 식물은 aroA 유전자(쥐티푸스균 및 E.coli에서 글리포세이트 EPSP 합성효소)를 전이시킴으로써 개발되었다. 술포닐우레아 저항성 식물은 애기장대의 돌연변이 ALS(아세토락테이트 합성효소)를 형질전환시킴으로써 생성되었다. 돌연변이 긴털비름에서 광계 II 의 OB 단백질은 식물에 형질전환되어 아트라진 저항성 유전자전환 식물을 생산하였다. 그리고 브로목시닐 내성 유전자전환 식물은 세균 폐렴간균에서 bxn 유전자를 삽입하여 생산된다. 다른 예시적인 변형에 의하여 곤충 저항성 식물이 야기된다. 바실러스 튜링겐시스(Bt) 독소는, 피라미드식 cry1Ac 및 cry1C Bt 유전자가 각각 단일 단백질에 저항성 있는 배추좀나방을 조절하여 저항성 곤충의 진화를 명백히 지연시키는 브로콜리에서 최근에 기술된 바와 같이, Bt 저항성 해충의 출현을 지연시키는 효과적인 방법을 제공할 수 있다. 또 다른 예시적인 변형은 병원체(예를 들어, 바이러스, 세균, 곰팡이)로 인한 질병에 저항하는 식물을 야기한다. Xa21 유전자(세균성 마름병에 저항성)를 발현하는 식물과 Bt 융합 유전자 및 키티나제 유전자(노란 줄기 나무좀에 저항성 및 다발에 내성) 둘 다 발현된 식물이 제조된 바 있다. 또 다른 예시적인 변형은 웅성불임성과 같은 생식 능력을 바꾸는 결과를 초래한다. 또 다른 예시적인 변형은 비 생물적 스트레스(예를 들면, 가뭄, 온도, 염도)에 내성이 있는 식물을 야기하고, 내성 유전자전환 식물은 애기장대로부터 아실 글리세롤 포스페이트 효소가 전이됨으로써 생산된다. 만니톨 및 소르비톨의 합성에 관여하는 만니톨 탈수소효소 및 소르비톨 탈수소효소를 코딩하는 유전자는 가뭄 저항성을 향상시킨다. 다른 예시적 변형은 저장 단백질과 기름이 증가된 식물, 광합성 효율이 향상된 식물, 저장수명이 늘어난 식물, 탄수화물 함량이 향상된 식물, 및 곰팡이 저항성 식물; 알칼로이드의 생합성에 관여하는 효소를 코딩하는 식물을 야기할 수 있다. S-아데노실-L-메티오닌(SAM) 및/또는 시스타티오닌 감마 합성효소(CGS)의 발현이 조절된 유전자전환 식물이 또한 고려된다.
하나 이상의 이러한 형질들은 다른 담배 재배종으로부터 돌연변이, 비-자연 발생 또는 유전자전환 담배 식물 내로 이입되거나 또는 곧바로 형질전환(transform)될 수 있다. 본 발명의 돌연변이, 비-자연 발생 또는 유전자전환 담배 식물 내로의 형질(들)의 이입은 본 기술분야에 공지된 모든 식물 육종 방법, 예를 들어, 계통육종법(pedigree breeding), 역교배(backcrossing), 반수체 육종(doubled-haploid breeding) 등(Wernsman, E. A, and Rufty, R. C. 1987. Chapter Seventeen. Tobacco. Pages 669-698 In: Cultivar Development. Crop Species. W. H. Fehr (ed.), MacMillan Publishing Co, Inc., New York, N.Y 761 pp. 참조)에 의하여 달성될 수 있다. 상기 언급한 분자생물학-기반의 기술들, 특히 RFLP 및 마이크로새틀라이트 마커들이 그러한 역교배에서 자손(progeny)들이 반복친(recurrent parent)과 가장 높은 유전적 동일성을 가지는지 확인하기 위하여 사용될 수 있다. 이는 반복친과 적어도 90%, 바람직하게는 적어도 95%, 더욱 바람직하게는 적어도 99% 유전적 동일성을 가진, 더욱더 바람직하게는 반복친과 유전적으로 동일한, 그리고 공여친(donor parent)으로부터 이입된 형질을 추가로 포함하는 담배 품종들의 생산을 가속화하게 해 준다. 그러한 유전적 동일성의 확인은 본 기술분야에 공지된 분자 마커들에 기초할 수 있다.
최종 역교배는 전이되는 핵산(들)의 순수한 육종 자손을 제공하기 위해 자가교배될 수 있다. 도출되는 식물들은 일반적으로 본 발명의 돌연변이, 비-자연 발생 또는 유전자전환 담배 식물들의 모든 형태학적 및 생리학적 특징들, 및 추가적으로 전이된 형질(들)을 본질적으로 가진다(예를 들어, 하나 이상의 단일 유전자 형질들). 적절한 시험 프로토콜을 결정하기 위해, 정확한 역교배 프로토콜은 바뀌는 형질에 의존할 것이다. 비록 전이되는 형질이 우성 대립 유전자일 경우 역교배 방법들이 단순화되지만, 열성 대립 유전자 역시 전이될 수 있다. 이 경우에, 원하는 형질이 성공적으로 전이되었는지 여부를 결정하기 위해 자손에 대해 시험을 진행할 필요가 있을 수 있다.
다양한 구현예가 노르니코틴 및/또는 NNN 함량 조절을 위해 폴리뉴클레오티드(또는 본원에 기재된 그의 임의의 조합)의 발현 정도가 조절된 돌연변이 식물들, 비-자연 발생 식물들 또는 유전자전환 식물들, 뿐만 아니라 바이오매스를 제공하고 있다.
그러한 식물들의 일부, 특히 담배 식물들, 그리고 더욱 특히 담배 식물들의 잎몸(leaf lamina) 및 주맥(midrib)이 에어로졸 형성 재료들, 에어로졸 형성 장치들, 흡연 물품, 흡연가능한 물품, 무연(smokeless) 제품, 및 담배 제품을 비제한적으로 포함하는 다양한 소비성 제품의 제조에 도입되거나 사용될 수 있다. 에어로졸 형성 재료들의 예는 비제한적으로 담배 조성물들, 담배들, 담배 추출물, 대담배(cut tobacco), 컷 필터(cut filter), 말린 담배, 팽창 담배(expanded tobacco), 균질화된 담배, 재구성(reconstituted) 담배, 및 파이프 담배들을 포함한다. 흡연 물품 및 흡연가능한 물품은 에어로졸 형성 장치들의 종류이다. 흡연 물품 또는 흡연가능한 물품의 예는 비제한적으로 궐련(cigarette), 소형엽궐련(cigarillos), 및 여송연(cigar)을 포함한다. 무연 제품의 예는 씹는 담배류 및 코담배류를 포함한다. 특정 에어로졸 형성 장치에서는, 연소 대신에, 담배 조성물 또는 다른 에어로졸 형성 재료가 하나 이상의 전기 가열 요소들에 의해 가열되어 에어로졸을 생성한다. 다른 종류의 가열 에어로졸 형성 장치에서는, 가연성 연료 또는 열원으로부터 물리적으로 분리되어 열원의 내부, 주위 또는 하류에 위치하는 에어로졸 형성 재료로 열이 전달되어 에어로졸이 생성된다. 무연 담배 제품 및 다양한 담배-함유 에어로졸 형성 재료들은 건조 입자, 세절, 과립, 분말 또는 슬러리의, 다른 재료 상에 증착된, 다른 재료와 혼합된, 다른 재료에 둘러싸인 또는 박편, 필름, 타블렛, 거품, 또는 구슬과 같은 모든 형상의 다른 재료들과 결합된 담배를 포함할 수 있다. 본원에서 사용되는 용어 '연기'는 흡연 물품, 예컨대 궐련에 의해서, 또는 에어로졸 형성 물질을 연소하여 생산되는 에어로졸의 유형을 설명하는 데 사용된다.
한 구현예에서, 본원에 기재된 돌연변이, 유전자전환 및 비-자연 발생 담배 식물들로부터 건조된 식물 재료가 또한 제공될 수 있다. 녹색 담뱃잎들을 건조하는 공정들은 음건(air-curing), 화건(fire-curing), 화력 건조(flue-curing) 및 양건(sun-curing)을 비제한적으로 포함하는 본 기술분야에 공지된 기술들이다. 녹색 담뱃잎들을 건조하는 공정은 수확된 담배의 종류에 의존한다. 예를 들어, 버지니아 플루(Virginia flue)(brignt) 담배는 일반적으로 열건하며, 버얼리(Burley) 및 특정 어두운 색깔의 종은 보통 공기-건조하고, 그리고 파이프 담배, 씹는 담배, 및 코담배는 보통 화건한다.
다른 구현예에서, 본원에 기재된 돌연변이 담배 식물, 유전자전환 담배 식물 또는 비-자연 발생 담배 식물의 잎들, 바람직하게는 건조된 잎을 포함하는 담배-함유 에어로졸 형성 재료를 포함하는 담배 제품이 기술된다. 본원에 기재된 담배 제품은 변형되지 않은 담배를 추가로 포함할 수 있는 혼합 담배 제품일 수 있다.
이들 흡연가능한 물품 및 무연 제품 그리고 이들의 에어로졸 내의 노르니코틴 양은 비-돌연변이, 비-자연 발생 또는 비-유전자전환 대조군들로부터 유도된 소비 제품과 비교할 때 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 및 100% 낮을 수도 있고- 예컨대 약 200% 또는 300% 낮을 수도 있다.
이들 흡연가능한 물품 및 무연 제품 그리고 이들의 에어로졸 내의 NNN 양은 비-돌연변이, 비-자연 발생 또는 비-유전자전환 대조군들로부터 유도된 소비 제품과 비교할 때 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 및 100% 낮을 수도 있고- 예컨대 약 200% 또는 300% 낮을 수도 있다.
이들 흡연가능한 물품 및 무연 제품 그리고 이들의 에어로졸 내의 니코틴 양은 비-돌연변이, 비-자연 발생 또는 비-유전자전환 대조군들로부터 유도된 소비 제품과 비교할 때 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 및 100% 낮을 수도 있고- 예컨대 약 200% 또는 300% 높을 수도 있다. 이들 흡연가능한 물품 및 무연 물품 그리고 이들의 에어로졸 내의 니코틴 양은 비-돌연변이, 비-자연 발생 또는 비-유전자전환 대조군들로부터 유도된 소비 제품과 비교할 때 대략 동일할 수도 있다.
이들 흡연가능한 물품 및 무연 물품 그리고 이들의 에어로졸 내의 총 TSNA 양은 비-돌연변이, 비-자연 발생 또는 비-유전자전환 대조군들로부터 유도된 소비 제품과 비교할 때 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 및 100% 낮을 수도 있고- 예컨대 약 200% 또는 300% 낮을 수도 있다.
돌연변이, 비-자연 발생 또는 유전자전환 식물들은 다른 용도들, 예를 들어, 농업에서 사용될 수 있다. 예를 들어, 본원에 기재된 돌연변이, 비-자연 발생 또는 유전자전환 식물들은 동물 사료 또는 인간 음식 제품을 만들기 위해 사용될 수 있다.
본 발명은 또한 본원에 기재된 돌연변이 식물, 비-자연 발생 식물, 또는 유전자전환 식물을 재배하고, 그리고 재배된 식물들로부터 종자를 채취하는 것을 포함하는 종자의 생산 방법들을 제공한다. 본원에 기재된 식물의 종자는 본 기술분야에 공지된 수단들에 의하여 유지되고 포장 재료에 의하여 포장되어 제조품을 형성할 수 있다. 종이 및 천과 같은 포장 재료들은 본 기술분야에 잘 알려져 있다. 종자의 포장은 라벨, 예를 들어, 내부의 종자의 유형을 기재한 포장 재료에 고정된 태그 또는 라벨, 포장 위에 프린트된 라벨을 포함할 수 있다.
식별, 선발, 또는 교배를 위한 식물의 유전자형 검사(genotyping)를 위한 조성물, 방법 및 키트는 폴리뉴클레오티드 시료 내 폴리뉴클레오티드(또는 본원에 기재된 그의 임의의 조합)의 존재를 감지하는 수단을 포함할 수 있다. 따라서, 하나 또는 그 이상의 폴리뉴클레오티드들의 적어도 일부를 특이적으로 증폭하기 위한 하나 이상의 프라이머들과 선택적으로 하나 이상의 탐침들 그리고 선택적으로 증폭 또는 감지를 수행하기 위한 하나 이상의 시약을 포함하는 것으로 기술된다.
따라서, 본원에 기재된 폴리뉴클레오티드에 상응하는 약 10 이상의 인접 폴리뉴클레오티드를 포함하는 유전자 특이적 올리고뉴클레오티드 프라이머들 또는 탐침들이 개시되었다. 상기 프라이머들 또는 탐침들은 본원에 기재된 폴리뉴클레오티드(들)에 혼성화(예를 들어, 특이적으로 혼성화)하는 약 15, 20, 25, 30, 40, 45 또는 50 이상의 인접 뉴클레오티드들을 포함하거나 이들로 구성될 수 있다. 일부 구현예들에서, 프라이머들 또는 탐침들은 유전자 식별(예를 들어, 서던(Southern) 혼성화) 또는 분리(예를 들어, 세균 콜로니 또는 박테리오파지 플라크들의 in situ 혼성화) 또는 유전자 탐지(예를 들어, 핵산 증폭 또는 탐지에서의 하나 이상의 증폭 프라이머들로서)에 사용될 수 있는 약 10 내지 50 인접 뉴클레오티드들, 약 10 내지 40 인접 뉴클레오티드들, 약 10 내지 30 인접 뉴클레오티드들 또는 약 15 내지 30 인접 뉴클레오티드들을 포함할 수 있다. 하나 이상의 특이적 프라이머들 또는 탐침들은 폴리뉴클레오티드(들)의 일부 또는 전체를 증폭하거나 탐지하기 위하여 디자인되고 사용될 수 있다. 구체적인 예시로서, 핵산- 예를 들어 DNA 또는 RNA를 인코딩하는 핵산 조각을 증폭하기 위한 중합효소 연쇄반응(PCR) 프로토콜에서 두 개의 프라이머가 사용될 수 있다. 중합효소 연쇄반응은 또한 핵산 서열에서 유래된 하나의 프라이머 및 핵산 서열의 상류 또는 하류의 서열- 예를 들어 프로모터 서열, mRNA 전구체의 3' 말단 또는 벡터로부터 유래된 서열에 혼성화하는 제2 프라이머를 사용하여 수행될 수 있다. 시험관 내(in vitro) 폴리뉴클레오티드의 증폭을 위하여 유용한 열적 및 등온 검사법(thermal and isothermal technique)의 예는 본 기술분야에 잘 알려져 있다. 시료는 본원에 기재된 식물, 식물 세포 또는 식물 재료 또는 식물, 식물 세포 또는 식물 재료로부터 유래된 담배 제품 또는 이들로부터 파생된 것일 수 있다.
추가적인 측면에서, (a) 폴리뉴클레오티드를 포함하거나 포함하는 것으로 간주되는 시료를 제공하고; (b) 뉴클레오티드(들)의 적어도 일부를 특이적으로 탐지하는 하나 이상의 프라이머들 또는 하나 이상의 탐침들과 상기 시료를 접촉시키고; 그리고 (c) 증폭된 산물의 존재를 탐지하는 단계를 포함하며, 상기 증폭된 산물의 존재는 시료 내의 폴리뉴클레오티드(들)의 존재를 나타내는 것인, 시료 내의 본원에 기재된 폴리뉴클레오티드(들)(또는 본원에 기재된 그의 임의의 조합)를 탐지하는 방법이 또한 제공된다. 추가적인 측면에서, 폴리뉴클레오티드(들)의 적어도 일부를 특이적으로 탐지하기 위한 하나 이상의 프라이머들 또는 탐침들의 용도가 또한 제공된다. 폴리뉴클레오티드(들)의 적어도 일부를 특이적으로 탐지하기 위한 하나 이상의 프라이머들 또는 탐침들을 포함하는, 폴리뉴클레오티드(들)의 적어도 일부를 탐지하기 위한 키트가 또한 제공된다. 키트는 폴리뉴클레오티드 증폭-예를 들어 중합효소 연쇄반응-을 위한 시약 또는 탐침 혼성-탐지 기술-예를 들어 서던 블롯, 노던 블롯, 인 시츄 혼성화, 또는 마이크로어레이를 위한 시약을 포함할 수 있다. 키트는 항체 결합-탐지 기술, 예를 들어, 웨스턴 블롯, ELISA, SELDI 질량 분석기 또는 테스트 스트립을 위한 시약을 포함할 수 있다. 키트는 DNA 서열 분석을 위한 시약을 포함할 수 있다. 키트는 적어도 NNN 함량 및/또는 니코틴 함량 및/또는 총 TSNA 함량 및/또는 노르니코틴 함량을 측정하기 위한 시약 및 설명을 포함할 수 있다. 적절하게는, 키트는 식물 재료, 건조 식물 재료 또는 건조 잎 내의 적어도 NNN 함량 및/또는 니코틴 함량 및/또는 총 TSNA 함량 및/또는 노르니코틴 함량을 측정하기 위한 시약 및 설명을 포함할 수 있다.
일부 구현예들에서, 키트는 기술된 방법들 하나 이상을 위한 설명을 포함할 수 있다. 기술된 키트는 유전적 동일성 측정, 계통발생학적 연구, 유전자형 검사, 하플로타이핑(haplotyping), 계통 분석 또는 식물 교배에서 특히 공우성 스코어링(co-dominant scoring)과 함께 유용할 수 있다.
본 발명은 또한 본원에 기재된 폴리뉴클레오티드를 포함하는 식물, 식물 세포 또는 식물 재료의 유전자형 검사 방법을 제공한다. 유전자형 검사는 염색체 쌍의 상동체들을 구분하는 수단을 제공하며 식물 개체들 내에서 분리 개체(segregant)들을 구분하는데 사용될 수 있다. 분자 마커 방법들은 계통발생학적 연구, 작물의 변이체들 간의 유전적 연관성 분석, 체세포 교잡종 또는 잡종(cross)의 판별, 단일 유전자 특질들에 영향을 미치는 염색체 분절들의 위치 판별, 맵(map)-기반 클로닝, 및 양적 유전 연구에 사용될 수 있다. 유전자형 분석의 구체적인 방법은 증폭산물 길이 다형성(AFLP)을 포함한 모든 분자 마커 분석 기술들이 사용될 수 있다. AFLP는 뉴클레오티드 길이의 다양성에 의해 유발되는 증폭 단편들 사이의 차이의 산물이다. 따라서, 본 발명은 AFLP 분석과 같은 기술들을 이용하여 하나 이상의 유전자들 또는 핵산들의 분리(segregation) 및 이들 유전자들 또는 핵산들과 유전적으로 연결된 염색체 서열들을 이해하는 수단을 제공할 수 있다.
한 구현예에서, 본원에서 기술한 돌연변이, 유전자전환 및 비자연적으로 발생한 식물들의 건조된 식물 재료가 또한 제공된다. 예를 들어, 담뱃잎들을 건조하는 공정들은 본 기술분야의 숙련자에게 알려져 있으며, 비제한적으로 음건, 화건, 화력 건조 및 양건을 포함한다. 녹색 담뱃잎들을 건조하는 공정은 수확된 담배의 종류에 의존한다. 예를 들어, 버지니아 플루(Virginia flue)(brignt) 담배는 일반적으로 열건하며, 버얼리(Burley) 및 특정 어두운 색깔의 종은 보통 공기-건조하고, 그리고 파이프 담배, 씹는 담배, 및 코담배는 보통 화건한다.
또 다른 구현예에서, 본원에 기재된 돌연변이, 유전자전환 및 비-자연 발생 식물 유래 식물 재료 - 예컨대 잎, 적절하게는 건조된 식물 재료를 포함하는 담배 제품을 포함하거나 또는 본원에 기재된 방법들에 의하여 생산되는 담배 제품이 기재되어 있다. 본원에 기재된 담배 제품은 변형되지 않은 담배를 추가로 포함할 수 있다.
또 다른 구현예에서, 본원에 기재된 돌연변이, 유전자전환 및 비-자연 발생 식물들의 식물 재료, 바람직하게는 잎들-예를 들어 말린 잎들-을 포함하는 담배 제품이 기술된다. 예를 들어, 식물 재료는 담배 제품의 내부 또는 외부에 추가될 수 있으며 연소에 의하여 희망하는 향이 발산된다. 이 구현예에 따른 담배 제품은 변형되지 않은 담배 또는 변형된 담배일 수 있다. 이 구현예에 따른 담배 제품은 본원에 기재된 유전자들 외에 하나 이상의 유전자들이 변형된 돌연변이, 유전자전환 또는 비자연적으로 발생한 식물로부터 파생된 것일 수 있다.
본 발명은 발명을 더 구체적으로 기술하기 위하여 제공되는 하기 실시예에서 추가적으로 기술된다. 본 발명을 수행하기 위하여 현재 고려되는 바람직한 형태를 제공하는 실시예들은 설명을 위한 것으로서, 발명을 한정하기 위한 것이 아니다.
실시예
실시예 1
NND3 발현 수준 분석
NND3의 기능 및 니코틴 변환에서의 그것의 역할을 판정하기 위해, NND3의 발현을 분석한다. 이를 위해, 온실 성장한 N. 타바쿰 var. TN90의 다른 조직들을 수확하고 정량 PCR을 통해 분석한다.
RNA 추출은 제조업체의 지시에 따라 RNeasy Mini kit (Qiagen)를 사용하여 수행한다. RNA 시료를 물에 희석시켜서 10㎕ 최종 부피에서 1㎍ RNA를 얻는다. 그런 다음 DNase 소화를 RQ1 RNase-Free DNase (Promega)로 수행한다. DNase 반응을 RQ1의 DNase 정지 용액 (Promega)를 사용하여 중지한다. 즉시, 역전사효소 (RT) 반응을 수행해서 상보적 DNA (cDNA) 내로 RNA을 변환시킨다. RT 반응의 경우, M-MLV 역전사효소, RNase H Minus, Point Mutant (Promega)를 oligo(dT)15 프라이머와 조합하여 사용하였다.
정량적 실시간 PCR은 Stratagene Mx3005P 및 대응하는 소프트웨어를 사용하여 수행한다. 각각의 표적에 대해, 다른 프라이머 쌍을 Mx3005P 사용자 안내서의 지침에 따라 설계한다. 프라이머 쌍을 프라이머 이량체 형성과 qPCR 실행에서의 그들의 성능을 시험한다. 그들의 효율성을 cDNA의 5배 희석을 가진 표준 곡선을 사용하여 시험한다. 프라이머가 특이적으로 그들의 표적 서열을 증폭하는지 확인하기 위해 PCR 산물을 시퀀싱한다. 다른 CYP82E 유전자들이 서열이 가까우므로, 프라이머 디자인은 복잡하고 선택한 프라이머가 항상 최적의 효율을 보여주지는 않는다.
효율의 불일치는 qPCR 실험 값들이 유전자 특이적이고 절대 발현 값을 나타내지 않는다는 것을 의미한다. 따라서, 발현 값들의 비교는 다양한 조직 사이의 각 유전자에는 유효하지만 유전자들 사이에는 유효하지 않다. 사용한 프라이머 쌍과 그들의 효율이 표 1에 나열되어 있다. ABsolute Blue QPCR SYBR Green low ROX Mix (Thermo Scientific)을 300nM의 프라이머 농도로 사용한다. qPCR 실행에서 95°C의 변성 온도를 사용하고, 처음에는 15분 동안, 그런 다음 각 사이클에서 15초 동안, 어닐링을 위해 60℃에서 15초, 신장을 위해 72℃에서 25초, 50 사이클 동안. 모든 시료를 3번 실행한다. 또한, 생물학적 3번반복을 채용한다. actin9 유전자 (하우스키핑 유전자)의 발현을 노멀라이저로 모든 시료에 대해 사용한다.
결과가 도 1에 도시되어 있으며 녹색 잎에서 CYP82E5 및 CYP82E10의 발현을 확인한다. 이 유전자들은 또한 테스트된 모든 다른 조직에서 고도로 발현된다. 그들은 비슷한 매우 유사한 발현 패턴을 보여준다. CYP82E4 및 NND3 각각이 꽃과 뿌리에서 발현을 보여주는 동안, NND3는 잎에서 검출가능한 수준으로 발현되지 않는 반면 CYP82E4는 노화 잎에서 독점적으로 발현을 보여준다. 프라이머 특이성 검증을 위해, PCR 생성물을 정제하고, 시퀀싱하였다. 뿌리에서 NND3에 대해 관찰된 낮은 신호는 NND3 및 CYP82E4의 혼합 산물을 함유하고 있는 반면 꽃 재료 유래 산물은 NND3 만을 함유했다.
실시예 2
NND3 가 기능성 니코틴 탈메틸효소에 대해 암호화함을 입증
예측된 단백질 서열이 CYP82E4, CYP82E5 및 CYP82E10 같은 공지의 탈메틸효소와 고도의 상동성을 제공하더라도, 몇몇 아미노산 차이가 기질 특이성을 변경하거나 완화하기에 충분하다는 사실이 시토크롬 P450 군에서 보여졌기 때문에 그 기능은 상동성으로부터 추론될 수 없다.
NND3의 기능을 담배에서의 과발현에 의해 확인한다. 이를 위해, 과발현 구성체를 NND3 코딩 서열 (서열 번호 1)을 가지고 설계해서 기능성 CYP82E4, CYP82E5CYP82E10 유전자가 결여된 초저 컨버터 벌리 식물 배경에서 MMV 프로모터의 제어 하에 구조적으로 발현시켰다.
20개의 독립적인 유전자전환 계통을 생성하였다. 일차 형질전환체(T0)를 토양에 옮기고, 성숙한 식물의 잎을 프라이머 NND3_F6 및 NND3_R7 (도 2a)를 사용하여 NND3 발현을 분석할 뿐만 아니라 니코틴과 노르니코틴 수준 (도 2b)를 분석하였다. 막대와 오차가 평균과 표준 편차를 나타내는 5개의 대조군 계통을 분석하였다.
발현 분석을 세 가지 기술적 복제물에서 수행하였다. 막대와 오차는 복제물들의 평균과 편차를 나타낸다(Stratagene의 MxPro 소프트웨어에 의해 계산).
발현 데이터는 아무런 신호가 검출될 수 없었기 때문에 NND3가 TN90 녹색 잎에서 발현되지 않는다는 것을 확인한다. 다른 T0 식물에서 측정한 NND3 발현 수준은 무작위로 선정한 NND3#3 식물에 대해 발현되었다. 상당한 변화가 다른 식물들의 발현에서 관찰된다. 각 식물이 독립적인 유전자전환 이벤트의 결과이기 때문에 T0 집단에서 유전자변형 발현을 조사하는 경우에 이러한 결과가 기대된다. 결과적으로 발현 수준은 유전자전환 카피 수 또는 유전자전환의 적절한 삽입 중 하나에 따라 식물 간에 크게 달라질 수 있다.
동일한 잎 시료들을 니코틴 및 노르니코틴에 대한 단일 측정에서 분석하였다.
시료들의 니코틴 및 노르니코틴 함량을 HILIC-UPLC-UV/MS로 분석하였다. 노르니코틴을 MS 검출로 정량하였다 (pos. ESI; MRM 모드; 내부 표준: 노르니코틴-d4); 니코틴 경우 260nm에서 UV 검출을 사용하였다. 변환은 [노르니코틴] / ([노르니코틴]+[니코틴]) x 100로 계산했다.
최고 NND3 발현을 보여준 유전자변형 계통 중 6개가 (#10, #3, #16, #15, #17, #20) 상승한 니코틴 변환을 나타냈다. 니코틴 변환은 TN90 cyp82e4/cyp82e5/cyp82e10 식물에서 0.5%이며, MMV:NND3 고도 발현 계통들에서 최대 4배 증가한다. 대조군 식물 수준과 구별가능하지 않은 일관성있게 낮은 수준의 변환이 유전자변형의 최저 발현을 보여주는 식물에서 관찰된다.
이 데이터들은 새로 식별된 NND3 유전자가 기능성 니코틴 N-탈메틸효소를 암호화한다는 것을 명확하게 입증한다.
Figure 112016110724051-pct00002
실시예 3
NND3 침묵(silencing)이 니코틴 변환 감소를 초래함을 입증
기능성 CYP82E4, CYP82E5CYP82E10 유전자가 결여된 초저 컨버터 벌리 식물 배경에서 MMV 프로모터의 제어 하에 구조적으로 발현되는 침묵 구성체를 설계한다. 침묵 구성체에 대해, 100bp 서열을 인트론 서열에 의해 분리된, 순방향 및 역방향으로 사용한다(서열번호 4). 결과에 의하면 꽃에서의 NND3의 침묵이 감소된 니코틴 변환을 초래하며, NND3 효소가 기능성일 뿐만 아니라, 식물에서 니코틴 변환에 기여한다는 점을 입증한다는 것을 나타낸다.
실시예 4
NND3 N. 타바쿰 var. 스텔라 잎에서 서로 다른 건조 시점에서 상대적 발현 수준
NND3 및 관련 기능성 CYP82E 유전자의 N. 타바쿰 var. 스텔라 잎에서 서로 다른 건조 시점에서 상대적 발현 수준을 분석한다. 시료를 수확 시간에 "녹색" 잎 (상부 줄기 위치)와 "완숙" 잎 (하부 줄기 위치)에서 취한다. 잎을 공기 건조 반으로 이송하고 건조가 시작할 때 시료를 취하고 ("0시간") 이후 다시 12시간 후("12시간"), 24시간 후("24시간"), 48시간 후("48시간")에 취한다. 시료를 몇 개의 잎의 풀(pool)에서 가져온다. 두 풀을 생물학적 복제물로서 분석한다 - 복제물 1 (도 3a) 및 2 (도 3b). 그 결과를 도 3에서 보여주고 있다. 막대는 세 가지 기술적 복제물의 평균 ± SD를 나타낸다. 상이한 PCR 효율로 인해 상이한 CYP82E 유전자의 발현 수준은 직접 비교해서가 아니라 단지 독립적으로 고려될 수 있다. CYP82E5CYP82E10이 모든 잎 시료에서 비슷한 정도로 발현된다. CYP82E4의 발현은 노화 잎에서 활성화되고 건조 조건에서 증가한다. NND3은 분석된 모든 조건에서 잎에서 발현되지 않는다.
본원에 인용된 또는 설명된 간행물은 이전에 본 출원의 출원일에 앞서 공개된 관련 정보를 제공한다. 본원에서 언급된 것은 그러한 공개에 선행하지 않음을 발명자가 인정하는 것으로 해석되지 않는다. 상기 명세서에서 언급된 모든 간행물은 본원에 참조로 인용된다. 발명의 다양한 조절 및 변형은 발명의 범위 및 의미에서 벗어나지 않으며 본 기술분야의 숙련자에게 명백할 것이다. 발명이 특정한 선호되는 구현예들과 관련하여 설명되었지만, 청구범위에 기재된 발명은 특정한 구현예들에 부당하게 한정되지 않아야 하는 것이 이해되어야 한다. 실제로, 세포적, 분자적 및 식물 생물학 또는 관련 분야의 본 기술분야의 숙련자에게 명백한 것을 포함하는, 본원 발명을 실시하기 위하여 기술된 모드들의 다양한 변형들이 이하의 청구범위에 포함된다.
서열
서열번호 1 ( N. 타바쿰 TN90 NND3-T 유전자의 폴리뉴클레오티드 서열. 인트론은 소문자로 표시되어 있고, 암호화 서열은 밑줄이 그어져 있음. 개시 및 정지 코돈은 회색으로 강조됨.)
ATGGTTTTTCCCATAGAAGCCATTGTAGGACTAGTAACCTTCACATTTCTCTTCTACTTCCTATGGACAAAAAAATCTCAAAAACCTTCAAAACCCTTACCACCGAAAATCCCCGGAGGATGGCCGGTAATTGGCCATCTTTTCCACTTCAATGACGACGGCAACGACCGTCCATTAGCTCGAAAACTCGGAGACTTAGCTGACAAATACGGCCCCGTTTTCACTTTTCGGCTAGGCCTTCCCCTTGTGTTAGTTGTAAGCAGTTACGAAGCTATAAAAGACTGTTTCTCTACAAATGATGCCATTTTCTCTAATCGTCCAGCTTTTCTTTACGGCGAATACCTTGGCTACAATAATGCCATGCTATTTTTGGCAAATTACGGACCTTACTGGCGAAAAAATCGTAAATTAGTTATTCAGGAAGTTCTCTCAGCTAGTCGTCTCAAAAAATTCAAACACGTGAGATTCGCCAGAATTCAAACGAGCATTAAGAATTTATACACTCGAATTGATAGAAATTCGAGTACGATAAATTTAACTGATTGGTTAGAAGAATTGAATTTTGGTCTCATCGTGAAGATGATAGCTGGGAAAAATTATGAATCCGGTAAAGGAGATGAACAAGTGGAGAGATTTAAGAAAGCGTTTAAGGATTTTATGATTATATCAATGGAGTTTGTGTTATGGGATGCATTTCCAATTCCATTATTTAAATGGGTGGATTTTCAAGGGCATGTTAAGGCTATGAAAAGGACATTTAAGGATATAGATTCTGTTTTTCAGAATTGGTTAGAGGAACATATTAACAAAAGAGAAAAAATGGAGGTTAATGCAGAAGGGAATGAACAAGATTTCATTGATGTGGTGCTTTCAAAAATGAGTAATGAATATCTTGGTGAAGGTTACTCTCGTGATACTGTCATAAAAGCAACAGTTTTTgtaagttcatctgtcactcccgaattctgcttgaatgcagacaccgagttgcctttttattagactatctaaatattaaggatgattatatatagcaaaaatatagtaggatttctcgggctttgggatagaagaatattcatcattatataacttttgatggtaaaagatgagatctaacctcttataattgcccaaccacgttgatatatagaacaaaacctttttactcccattgagcataacgaaaatgaaagcaaagggacttcttctcttttttaggaaaaaaatctttgattgcttgttgaatatacattcatgtttttctttttctatttctaataataatggtgcttgaatcaggttgcgtgcctcgtgacttttgagaaaaaaaaacaaattcattagtataatgaggtgtgcatacttgacaactactatactaactagaacaaggttcggcagataatgacgctaacctacttttatattgaattatcatttgtatttaactgtattctattttgtccacagAGTTTGGTCTTGGATGCTGCGGACACAGTTGCTCTTCACATAAATTGGGGTATGGCATTACTGATCAACAATCAAAATGCCTTGAAGAAAGCACAAGAAGAGATAGACACAAAAGTTGGCAAGGATAGATGGGTAGAAGAGAGTGATATTAAGGATTTGGTGTACCTCCAAGCTATTGTTAAAGAAGTGTTACGATTATATCCACCGGGACCTTTGTTAGTACCACATGAAAATATAGAGGATTGTGTTGTTAGTGGATATTACATTTCTAAAGGGACTAGACTATTCGCAAATGTTATGAAACTGCAGCGCGATCCTAAACTCTGGCCAAATCCTGATAATTTCGATCCAGAGAGATTTGTCGCTGCAGGTATTGACTTTCGTGGTCAGCATTATGAGTATATCCCGTTTGGTTCTGGAAGACGATCTTGTCCGGGGATGACTTATGCATTGCAAGTGGAACACTTAACAATGGCACATTTGATCCAGGGTTTCAATTACAGCACTCCAAATGACGAGCCCTTGGATATGAAGGAAGGTGCAGGTATAACTATACGTAAGGTAAATCCCGTGGAAGTGATAATTATGCCTCGCCTGGCACCTGAGCTTTATTAA
서열번호 2 (MMV 프로모터의 제어 하에 과발현 구성체에 사용된 NND3의 폴리뉴클레오티드 암호화 서열).
GAAAGCACAAGAAGAGATAGACACAAAAGTTGGCAAGGATAGATGGGTAGAAGAGAGTGATATTAAGGATTTGGTGTACCTCCAAGCTATTGTTAAAGAAGTGTTACGATTATATCCACCGGGACCTTTGTTAGTACCACATGAAAATATAGAGGATTGTGTTGTTAGTGGATATTACATTTCTAAAGGGACTAGACTATTCGCAAATGTTATGAAACTGCAGCGCGATCCTAAACTCTGGCCAAATCCTGATAATTTCGATCCAGAGAGATTTGTCGCTGCAGGTATTGACTTTCGTGGTCAGCATTATGAGTATATCCCGTTTGGTTCTGGAAGACGATCTTGTCCGGGGATGACTTATGCATTGCAAGTGGAACACTTAACAATGGCACATTTGATCCAGGGTTTCAATTACAGCACTCCAAATGACGAGCCCTTGGATATGAAGGAAGGTGCAGGTATAACTATACGTAAGGTAAATCCCGTGGAAGTGATAATTATGCCTCGCCTGGCACCTGAGCTTTATTAA
서열번호 3 ( N. 타바쿰 TN90 NND3 단백질의 폴리펩티드 서열)
MVFPIEAIVGLVTFTFLFYFLWTKKSQKPSKPLPPKIPGGWPVIGHLFHFNDDGNDRPLARKLGDLADKYGPVFTFRLGLPLVLVVSSYEAIKDCFSTNDAIFSNRPAFLYGEYLGYNNAMLFLANYGPYWRKNRKLVIQEVLSASRLKKFKHVRFARIQTSIKNLYTRIDRNSSTINLTDWLEELNFGLIVKMIAGKNYESGKGDEQVERFKKAFKDFMIISMEFVLWDAFPIPLFKWVDFQGHVKAMKRTFKDIDSVFQNWLEEHINKREKMEVNAEGNEQDFIDVVLSKMSNEYLGEGYSRDTVIKATVFSLVLDAADTVALHINWGMALLINNQNALKKAQEEIDTKVGKDRWVEESDIKDLVYLQAIVKEVLRLYPPGPLLVPHENIEDCVVSGYYISKGTRLFANVMKLQRDPKLWPNPDNFDPERFVAAGIDFRGQHYEYIPFGSGRRSCPGMTYALQVEHLTMAHLIQGFNYSTPNDEPLDMKEGAGITIRKVNPVEVIIMPRLAPELY
서열번호 4 (폴리뉴클레오티드 서열 IPMS2 유전자에서 발견된 인트론 서열에 의해 분리된, 순방향 및 역방향으로 NND3의 100bp 특이 서열을 이용한 RNAi 구성체. 인트론은 소문자로 표시되어 있음).
GCGATCCTAAACTCTGGCCAAATCCTGATAATTTCGATCCAGAGAGATTTGTCGCTGCAGGTATTGACTTTCGTGGTCAGCATTATGAGTATATCCCGTTtggtaacctttaatgtttaaccgttcacatttctaatatttacttatttgtaacatgtcgtcacgtgttagtttcattctttttatgaaccaaacatgcatgcaaagatatttttagatatttggacggcgagtgagatttgaaactaggaccgtttgcctgatacaatattaaaatatgtaaccattttatgtacaagtttaaactgttgatagtagcatattttttacttttatttaagtatactatattccaacaggtaagttaacAACGGGATATACTCATAATGCTGACCACGAAAGTCAATACCTGCAGCGACAAATCTCTCTGGATCGAAATTATCAGGATTTGGCCAGAGTTTAGGATCGC
서열번호 5 (CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Arg Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 6 (P38L 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Leu Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 7 (D171N 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asn Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 8 (E201K 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Lys Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 9 (R169Q 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Gln Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 10 (G459R 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Arg Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 11 (T427I 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Ile Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 12 (V376M 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Met Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 13 (W329Stop 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn
325
서열번호 14 (K364N 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Asn Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 15 (P382S 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Ser Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 16 (P458S 변이체 CYP82E4 니코틴 탈메틸효소의 단백질 서열)
Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe
1 5 10 15
Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln
145 150 155 160
Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg
420 425 430
Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Ser Gly Met Thr Tyr Ala Leu
450 455 460
Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 17 (CYP82E5 니코틴 탈메틸효소의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 18 (CYP82E5 니코틴 탈메틸효소의 P72L 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Leu Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 19 (CYP82E5 니코틴 탈메틸효소의 L143F 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Phe Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 20 (CYP82E5 니코틴 탈메틸효소의 S174L 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Leu Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 21 (CYP82E5 니코틴 탈메틸효소의 M224I 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Ile
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 22 (CYP82E5 니코틴 탈메틸효소의 P235S 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Ser Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 23 (CYP82E5 니코틴 탈메틸효소의 A410V 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Val Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
서열번호 24 (CYP82E5 니코틴 탈메틸효소의 W422Stop 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu
420
서열번호 25 (CYP82E5 니코틴 탈메틸효소의 P449L 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln
145 150 155 160
Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu
260 265 270
Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Leu Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu
450 455 460
Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu
500 505 510
Ala Pro Glu Leu Tyr
515
서열번호 26 (CYP82E10 니코틴 탈메틸효소의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 27 (CYP82E10 니코틴 탈메틸효소의 L148F 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Phe Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 28 (CYP82E10 니코틴 탈메틸효소의 G172R 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Arg Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 29 (CYP82E10 니코틴 탈메틸효소의 A344T 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Thr Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 30 (CYP82E10 니코틴 탈메틸효소의 A410T 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Thr Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 31 (CYP82E10 니코틴 탈메틸효소의 R417H 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
His Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 32 (CYP82E10 니코틴 탈메틸효소의 P419S 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Ser Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 33 (CYP82E10 니코틴 탈메틸효소의 G79S 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Ser Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 34 (CYP82E10 니코틴 탈메틸효소의 P107S 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Ser Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
서열번호 35 (CYP82E10 니코틴 탈메틸효소의 P382S 변이체의 단백질 서열)
Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu
1 5 10 15
Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro
20 25 30
Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe
35 40 45
Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly
50 55 60
Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu
65 70 75 80
Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe
85 90 95
Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly
100 105 110
Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly
115 120 125
Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys
130 135 140
Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln
145 150 155 160
Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr
165 170 175
Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val
180 185 190
Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln
195 200 205
Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met
210 215 220
Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val
225 230 235 240
Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile
245 250 255
Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu
260 265 270
Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val
275 280 285
Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg
290 295 300
Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala
305 310 315 320
Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn
325 330 335
Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val
340 345 350
Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr
355 360 365
Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Ser Gly Pro
370 375 380
Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr
385 390 395 400
His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln
405 410 415
Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg
420 425 430
Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met
450 455 460
Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr
465 470 475 480
Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu
485 490 495
Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu
500 505 510
Thr Pro Glu Leu Tyr
515
SEQUENCE LISTING <110> Philip Morris Products S.A. <120> Reduction of Nicotine to Nornicotine Conversion in Plants <130> P4362PC00 <150> EP 14167598.3 <151> 2014-05-08 <150> EP 14001645.2 <151> 2014-05-09 <160> 47 <170> PatentIn version 3.3 <210> 1 <211> 2088 <212> DNA <213> Nicotiana tabacum <400> 1 atggtttttc ccatagaagc cattgtagga ctagtaacct tcacatttct cttctacttc 60 ctatggacaa aaaaatctca aaaaccttca aaacccttac caccgaaaat ccccggagga 120 tggccggtaa ttggccatct tttccacttc aatgacgacg gcaacgaccg tccattagct 180 cgaaaactcg gagacttagc tgacaaatac ggccccgttt tcacttttcg gctaggcctt 240 ccccttgtgt tagttgtaag cagttacgaa gctataaaag actgtttctc tacaaatgat 300 gccattttct ctaatcgtcc agcttttctt tacggcgaat accttggcta caataatgcc 360 atgctatttt tggcaaatta cggaccttac tggcgaaaaa atcgtaaatt agttattcag 420 gaagttctct cagctagtcg tctcaaaaaa ttcaaacacg tgagattcgc cagaattcaa 480 acgagcatta agaatttata cactcgaatt gatagaaatt cgagtacgat aaatttaact 540 gattggttag aagaattgaa ttttggtctc atcgtgaaga tgatagctgg gaaaaattat 600 gaatccggta aaggagatga acaagtggag agatttaaga aagcgtttaa ggattttatg 660 attatatcaa tggagtttgt gttatgggat gcatttccaa ttccattatt taaatgggtg 720 gattttcaag ggcatgttaa ggctatgaaa aggacattta aggatataga ttctgttttt 780 cagaattggt tagaggaaca tattaacaaa agagaaaaaa tggaggttaa tgcagaaggg 840 aatgaacaag atttcattga tgtggtgctt tcaaaaatga gtaatgaata tcttggtgaa 900 ggttactctc gtgatactgt cataaaagca acagtttttg taagttcatc tgtcactccc 960 gaattctgct tgaatgcaga caccgagttg cctttttatt agactatcta aatattaagg 1020 atgattatat atagcaaaaa tatagtagga tttctcgggc tttgggatag aagaatattc 1080 atcattatat aacttttgat ggtaaaagat gagatctaac ctcttataat tgcccaacca 1140 cgttgatata tagaacaaaa cctttttact cccattgagc ataacgaaaa tgaaagcaaa 1200 gggacttctt ctctttttta ggaaaaaaat ctttgattgc ttgttgaata tacattcatg 1260 tttttctttt tctatttcta ataataatgg tgcttgaatc aggttgcgtg cctcgtgact 1320 tttgagaaaa aaaaacaaat tcattagtat aatgaggtgt gcatacttga caactactat 1380 actaactaga acaaggttcg gcagataatg acgctaacct acttttatat tgaattatca 1440 tttgtattta actgtattct attttgtcca cagagtttgg tcttggatgc tgcggacaca 1500 gttgctcttc acataaattg gggtatggca ttactgatca acaatcaaaa tgccttgaag 1560 aaagcacaag aagagataga cacaaaagtt ggcaaggata gatgggtaga agagagtgat 1620 attaaggatt tggtgtacct ccaagctatt gttaaagaag tgttacgatt atatccaccg 1680 ggacctttgt tagtaccaca tgaaaatata gaggattgtg ttgttagtgg atattacatt 1740 tctaaaggga ctagactatt cgcaaatgtt atgaaactgc agcgcgatcc taaactctgg 1800 ccaaatcctg ataatttcga tccagagaga tttgtcgctg caggtattga ctttcgtggt 1860 cagcattatg agtatatccc gtttggttct ggaagacgat cttgtccggg gatgacttat 1920 gcattgcaag tggaacactt aacaatggca catttgatcc agggtttcaa ttacagcact 1980 ccaaatgacg agcccttgga tatgaaggaa ggtgcaggta taactatacg taaggtaaat 2040 cccgtggaag tgataattat gcctcgcctg gcacctgagc tttattaa 2088 <210> 2 <211> 1554 <212> DNA <213> Nicotiana tabacum <400> 2 atggtttttc ccatagaagc cattgtagga ctagtaacct tcacatttct cttctacttc 60 ctatggacaa aaaaatctca aaaaccttca aaacccttac caccgaaaat ccccggagga 120 tggccggtaa ttggccatct tttccacttc aatgacgacg gcaacgaccg tccattagct 180 cgaaaactcg gagacttagc tgacaaatac ggccccgttt tcacttttcg gctaggcctt 240 ccccttgtgt tagttgtaag cagttacgaa gctataaaag actgtttctc tacaaatgat 300 gccattttct ctaatcgtcc agcttttctt tacggcgaat accttggcta caataatgcc 360 atgctatttt tggcaaatta cggaccttac tggcgaaaaa atcgtaaatt agttattcag 420 gaagttctct cagctagtcg tctcaaaaaa ttcaaacacg tgagattcgc cagaattcaa 480 acgagcatta agaatttata cactcgaatt gatagaaatt cgagtacgat aaatttaact 540 gattggttag aagaattgaa ttttggtctc atcgtgaaga tgatagctgg gaaaaattat 600 gaatccggta aaggagatga acaagtggag agatttaaga aagcgtttaa ggattttatg 660 attatatcaa tggagtttgt gttatgggat gcatttccaa ttccattatt taaatgggtg 720 gattttcaag ggcatgttaa ggctatgaaa aggacattta aggatataga ttctgttttt 780 cagaattggt tagaggaaca tattaacaaa agagaaaaaa tggaggttaa tgcagaaggg 840 aatgaacaag atttcattga tgtggtgctt tcaaaaatga gtaatgaata tcttggtgaa 900 ggttactctc gtgatactgt cataaaagca acagttttta gtttggtctt ggatgctgcg 960 gacacagttg ctcttcacat aaattggggt atggcattac tgatcaacaa tcaaaatgcc 1020 ttgaagaaag cacaagaaga gatagacaca aaagttggca aggatagatg ggtagaagag 1080 agtgatatta aggatttggt gtacctccaa gctattgtta aagaagtgtt acgattatat 1140 ccaccgggac ctttgttagt accacatgaa aatatagagg attgtgttgt tagtggatat 1200 tacatttcta aagggactag actattcgca aatgttatga aactgcagcg cgatcctaaa 1260 ctctggccaa atcctgataa tttcgatcca gagagatttg tcgctgcagg tattgacttt 1320 cgtggtcagc attatgagta tatcccgttt ggttctggaa gacgatcttg tccggggatg 1380 acttatgcat tgcaagtgga acacttaaca atggcacatt tgatccaggg tttcaattac 1440 agcactccaa atgacgagcc cttggatatg aaggaaggtg caggtataac tatacgtaag 1500 gtaaatcccg tggaagtgat aattatgcct cgcctggcac ctgagcttta ttaa 1554 <210> 3 <211> 517 <212> PRT <213> Nicotiana tabacum <400> 3 Met Val Phe Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Tyr Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asn Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Lys Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Arg Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Ile Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Asn Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Ile Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 Tyr Ile Ser Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Pro Asn Pro Asp Asn Phe Asp Pro Glu Arg 420 425 430 Phe Val Ala Ala Gly Ile Asp Phe Arg Gly Gln His Tyr Glu Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Ser Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Ile Ile Met Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 4 <211> 469 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Polynucleotide sequence an RNAi construct using a 100bp unique sequence of NND3 in forward and reverse direction separated by an intron sequence found in the IPMS2 gene <400> 4 gcgatcctaa actctggcca aatcctgata atttcgatcc agagagattt gtcgctgcag 60 gtattgactt tcgtggtcag cattatgagt atatcccgtt tggtaacctt taatgtttaa 120 ccgttcacat ttctaatatt tacttatttg taacatgtcg tcacgtgtta gtttcattct 180 ttttatgaac caaacatgca tgcaaagata tttttagata tttggacggc gagtgagatt 240 tgaaactagg accgtttgcc tgatacaata ttaaaatatg taaccatttt atgtacaagt 300 ttaaactgtt gatagtagca tattttttac ttttatttaa gtatactata ttccaacagg 360 taagttaaca acgggatata ctcataatgc tgaccacgaa agtcaatacc tgcagcgaca 420 aatctctctg gatcgaaatt atcaggattt ggccagagtt taggatcgc 469 <210> 5 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of CYP82E4 nicotine demethylase <400> 5 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Arg Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 6 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P38L variant CYP82E4 nicotine demethylase <400> 6 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Leu Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 7 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of D171N variant CYP82E4 nicotine demethylase <400> 7 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asn Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 8 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of E210K variant CYP82E4 nicotine demethylase <400> 8 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Lys Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 9 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of R169Q variant CYP82E4 nicotine demethylase <400> 9 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Gln Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 10 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of G459R variant CYP82E4 nicotine demethylase <400> 10 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Arg Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 11 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of T427I variant CYP82E4 nicotine demethylase <400> 11 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Ile Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 12 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of V376M variant CYP82E4 nicotine demethylase <400> 12 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Met Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 13 <211> 328 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of W329Stop variant CYP82E4 nicotine demethylase <400> 13 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn 325 <210> 14 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of K364N variant CYP82E4 nicotine demethylase <400> 14 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Asn Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 15 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P382S variant CYP82E4 nicotine demethylase <400> 15 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Ser Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 16 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P458S variant CYP82E4 nicotine demethylase <400> 16 Met Leu Ser Pro Ile Glu Ala Ile Val Gly Leu Val Thr Phe Thr Phe 1 5 10 15 Leu Phe Phe Phe Leu Trp Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 His Phe Asn Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Asp Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Ala Asn Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Phe Lys His Val Arg Phe Ala Arg Ile Gln 145 150 155 160 Ala Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Lys Lys Ala Phe Lys Asp Phe Met Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Ile Asn Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Gly Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Ile Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln Lys Ala Leu Thr Lys Ala Gln Glu Glu Ile Asp Thr Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asp Pro Asp Thr Phe Asp Pro Glu Arg 420 425 430 Phe Ile Ala Thr Asp Ile Asp Phe Arg Gly Gln Tyr Tyr Lys Tyr Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Ser Gly Met Thr Tyr Ala Leu 450 455 460 Gln Val Glu His Leu Thr Met Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Arg Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Ile 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Leu Ile Ile Ala Pro Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 17 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of CYP82E5 nicotine demethylase <400> 17 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 18 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P72L variant of CYP82E5 nicotine demethylase <400> 18 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Leu Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 19 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of L143F variant of CYP82E5 nicotine demethylase <400> 19 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Phe Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 20 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of S174L variant of CYP82E5 nicotine demethylase <400> 20 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Leu Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 21 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of M224I variant of CYP82E5 nicotine demethylase <400> 21 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Ile 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 22 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P235S variant of CYP82E5 nicotine demethylase <400> 22 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Ser Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 23 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of A410V variant of CYP82E5 nicotine demethylase <400> 23 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Val Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 24 <211> 421 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of W422Stop variant of CYP82E5 nicotine demethylase <400> 24 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu 420 <210> 25 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P449L variant of CYP82E5 nicotine demethylase <400> 25 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Leu Trp Pro Lys Lys Phe Gln Ile Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Gly Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Val Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Ser Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Ser 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Lys Ile Gln 145 150 155 160 Thr Ser Ile Lys Ser Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Arg Glu 260 265 270 Lys Met Glu Val Asn Ala Gln Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Glu Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Ala Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Asp Asp Ile Asp Tyr Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Leu Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Leu 450 455 460 Gln Ala Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Val Glu Val Thr Ile Thr Ala Arg Leu 500 505 510 Ala Pro Glu Leu Tyr 515 <210> 26 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of CYP82E10 nicotine demethylase <400> 26 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 27 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of L148F variant of CYP82E10 nicotine demethylase <400> 27 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Phe Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 28 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of G172R variant of CYP82E10 nicotine demethylase <400> 28 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Arg Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 29 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of A344T variant of CYP82E10 nicotine demethylase <400> 29 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Thr Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 30 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of A410T variant of CYP82E10 nicotine demethylase <400> 30 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Thr Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 31 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of R417H variant of CYP82E10 nicotine demethylase <400> 31 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 His Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 32 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P419S variant of CYP82E10 nicotine demethylase <400> 32 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Ser Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 33 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of G79S variant of CYP82E10 nicotine demethylase <400> 33 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Ser Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 34 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P107S variant of CYP82E10 nicotine demethylase <400> 34 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Ser Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Pro Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 35 <211> 517 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Protein sequence of P382S variant of CYP82E10 nicotine demethylase <400> 35 Met Val Ser Pro Val Glu Ala Ile Val Gly Leu Val Thr Leu Thr Leu 1 5 10 15 Leu Phe Tyr Phe Ile Arg Thr Lys Lys Ser Gln Lys Pro Ser Lys Pro 20 25 30 Leu Pro Pro Lys Ile Pro Gly Gly Trp Pro Val Ile Gly His Leu Phe 35 40 45 Tyr Phe Asp Asp Asp Ser Asp Asp Arg Pro Leu Ala Arg Lys Leu Gly 50 55 60 Asp Leu Ala Asp Lys Tyr Gly Pro Val Phe Thr Phe Arg Leu Gly Leu 65 70 75 80 Pro Leu Val Leu Val Val Ser Ser Tyr Glu Ala Ile Lys Asp Cys Phe 85 90 95 Ser Thr Asn Asp Ala Ile Phe Ser Asn Arg Pro Ala Phe Leu Tyr Gly 100 105 110 Glu Tyr Leu Gly Tyr Asn Asn Ala Met Leu Phe Leu Thr Lys Tyr Gly 115 120 125 Pro Tyr Trp Arg Lys Asn Arg Lys Leu Val Ile Gln Glu Val Leu Cys 130 135 140 Ala Ser Arg Leu Glu Lys Leu Lys His Val Arg Phe Gly Glu Ile Gln 145 150 155 160 Thr Ser Ile Lys Asn Leu Tyr Thr Arg Ile Asp Gly Asn Ser Ser Thr 165 170 175 Ile Asn Leu Thr Asp Trp Leu Glu Glu Leu Asn Phe Gly Leu Ile Val 180 185 190 Lys Met Ile Ala Gly Lys Asn Tyr Glu Ser Gly Lys Gly Asp Glu Gln 195 200 205 Val Glu Arg Phe Arg Lys Ala Phe Lys Asp Phe Ile Ile Leu Ser Met 210 215 220 Glu Phe Val Leu Trp Asp Ala Phe Pro Ile Pro Leu Phe Lys Trp Val 225 230 235 240 Asp Phe Gln Gly His Val Lys Ala Met Lys Arg Thr Phe Lys Asp Ile 245 250 255 Asp Ser Val Phe Gln Asn Trp Leu Glu Glu His Val Lys Lys Lys Glu 260 265 270 Lys Met Glu Val Asn Ala Glu Gly Asn Glu Gln Asp Phe Ile Asp Val 275 280 285 Val Leu Ser Lys Met Ser Asn Glu Tyr Leu Asp Glu Gly Tyr Ser Arg 290 295 300 Asp Thr Val Ile Lys Ala Thr Val Phe Ser Leu Val Leu Asp Ala Ala 305 310 315 320 Asp Thr Val Ala Leu His Met Asn Trp Gly Met Ala Leu Leu Ile Asn 325 330 335 Asn Gln His Ala Leu Lys Lys Ala Gln Glu Glu Ile Asp Lys Lys Val 340 345 350 Gly Lys Asp Arg Trp Val Glu Glu Ser Asp Ile Lys Asp Leu Val Tyr 355 360 365 Leu Gln Thr Ile Val Lys Glu Val Leu Arg Leu Tyr Pro Ser Gly Pro 370 375 380 Leu Leu Val Pro His Glu Asn Val Glu Asp Cys Val Val Ser Gly Tyr 385 390 395 400 His Ile Pro Lys Gly Thr Arg Leu Phe Ala Asn Val Met Lys Leu Gln 405 410 415 Arg Asp Pro Lys Leu Trp Ser Asn Pro Asp Lys Phe Asp Pro Glu Arg 420 425 430 Phe Phe Ala Ala Asp Ile Asp Phe Arg Gly Gln His Tyr Glu Phe Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ser Cys Pro Gly Met Thr Tyr Ala Met 450 455 460 Gln Val Glu His Leu Thr Ile Ala His Leu Ile Gln Gly Phe Asn Tyr 465 470 475 480 Lys Thr Pro Asn Asp Glu Pro Leu Asp Met Lys Glu Gly Ala Gly Leu 485 490 495 Thr Ile Arg Lys Val Asn Pro Ile Glu Val Val Ile Thr Pro Arg Leu 500 505 510 Thr Pro Glu Leu Tyr 515 <210> 36 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer NND3_F1 <400> 36 ttgatccagg gtttcaatta cagc 24 <210> 37 <211> 28 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer NND3_R2 <400> 37 aacgtaccaa attagaaaaa cgtgtacc 28 <210> 38 <211> 31 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer E4_F1 <400> 38 ttttcagaat tggttagagg aacatattaa t 31 <210> 39 <211> 26 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer E4_R1 <400> 39 tgtgtctatc tcttcttgtg ctttcg 26 <210> 40 <211> 29 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer E5_F1 <400> 40 agagattctt cgctgatgat attgactac 29 <210> 41 <211> 29 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer E5_R1 <400> 41 ccgtaattgt cacttctaca ggatttact 29 <210> 42 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer E10_F2 <400> 42 gctgatattg actttcgtgg tcaa 24 <210> 43 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer E10_R2 <400> 43 gcgaggcgta attaccactt ctat 24 <210> 44 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer PQ0014_F <400> 44 ctattctccg ctttggactt ggca 24 <210> 45 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer PQ0014_R <400> 45 aggacctcag gacaacggaa acg 23 <210> 46 <211> 27 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer NND3_F6 <400> 46 aattttggtc tcatcgtgaa gatgata 27 <210> 47 <211> 27 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer NND3_R7 <400> 47 tcactctctt ctacccatct atccttg 27

Claims (21)

  1. 재조합 구성체를 포함하는 유전자전환 담배 식물 세포로,
    상기 재조합 구성체는 상기 재조합 구성체를 포함하지 않는 대조군 담배 식물에 비하여 니코틴 N-탈메틸효소(NND3)의 발현을 감소 또는 억제시키는 폴리뉴클레오티드를 포함하고,
    상기 니코틴 N-탈메틸효소(NND3)는 서열번호 3의 서열을 갖는 폴리펩티드를 포함하는, 유전자전환 담배 식물 세포.
  2. 제1항에 있어서, CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 추가로 포함하고, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 12 내지 16 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; b) 서열번호 5의 위치 364에서 라이신 잔기에 대한 아스파라긴 치환; c) 서열번호 5의 위치 376에서 발린 잔기에 대한 메티오닌 치환; d) 서열번호 5의 위치 382에서 프롤린 잔기에 대한 세린 치환; d) 서열번호 5의 위치 458에서 프롤린 잔기에 대한 세린 치환; 및 e) 이들의 둘 이상의 임의의 조합으로 이루어진 군으로부터 선택되는, 유전자전환 담배 식물 세포.
  3. 제1항에 있어서, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 추가로 포함하고, 여기서 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 또는 25 또는 이들의 조합으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈; b) 서열번호 17의 위치 449에서 프롤린 잔기에 대해 치환된 류신; 및 c) 이들의 조합으로 이루어진 군으로부터 선택되는, 유전자전환 담배 식물 세포.
  4. 제1항에 있어서, CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 추가로 포함하고, 여기서 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 내지 35 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 26의 위치 79에서 글리신 잔기에 대한 세린 치환 ; b) 서열번호 26의 위치 107에서 프롤린 잔기에 대한 세린 치환 ; c) 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환 ; d) 서열번호 26의 위치 419에서 프롤린 잔기에 대한 세린 치환 ; e) 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 유전자전환 담배 식물 세포.
  5. 제1항에 있어서,
    (i) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 12 내지 16 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; b) 서열번호 5의 위치 364에서 라이신 잔기에 대한 아스파라긴 치환; c) 서열번호 5의 위치 376에서 발린 잔기에 대한 메티오닌 치환; d) 서열번호 5의 위치 382에서 프롤린 잔기에 대한 세린 치환; d) 서열번호 5의 위치 458에서 프롤린 잔기에 대한 세린 치환; 및 e) 이들의 둘 이상의 임의의 조합으로 이루어진 군으로부터 선택되고,
    (ii) CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고, 여기서 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 또는 25 또는 이들의 조합으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈; b) 서열번호 17의 위치 449에서 프롤린 잔기에 대해 치환된 류신; 및 c) 이들의 조합으로 이루어진 군으로부터 선택되고; 그리고
    (iii) CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고, 여기서 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 내지 35 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 26의 위치 79에서 글리신 잔기에 대한 세린 치환 ; b) 서열번호 26의 위치 107에서 프롤린 잔기에 대한 세린 치환 ; c) 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환 ; d) 서열번호 26의 위치 419에서 프롤린 잔기에 대한 세린 치환 ; e) 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 유전자전환 담배 식물 세포.
  6. 제1항에 있어서,
    (i) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함하고, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 33 (G79S)에 기재된 서열을 포함하고; 또는
    (ii) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함하고, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 34 (P107S)에 기재된 서열을 포함하고; 또는
    (iii) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함하고, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 35 (P382S)에 기재된 서열을 포함하고; 또는
    (iv) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이 및 CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이를 더 포함하고, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 13 (W329Stop)에 기재된 서열을 포함하고, 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 (W422Stop)에 기재된 서열을 포함하고, 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 (P419S)에 기재된 서열을 포함하는, 유전자전환 담배 식물 세포.
  7. 제2항에 있어서, 상기 돌연변이(들)은 이형접합 또는 동형접합 돌연변이인, 유전자전환 담배 식물 세포.
  8. 제1항에 있어서, 상기 식물 세포는 1% 미만의 니코틴의 노르니코틴으로의 변환을 가지는, 유전자전환 담배 식물 세포.
  9. 제1항 내지 제8항 중 어느 한 항에 따른 식물 세포를 포함하는 유전자전환 식물.
  10. 제1항 내지 제8항 중 어느 한 항에 따른 식물 세포를 포함하는 유전자전환 식물의 성분.
  11. 제10항의 식물로부터의 바이오매스, 종자, 줄기, 꽃 또는 잎을 포함하는 식물 재료.
  12. 제1항 내지 제8항 중 어느 한 항의 식물 세포; 제1항 내지 제8항 중 어느 한 항에 따른 식물 세포를 포함하는 유전자전환 식물의 적어도 일부분; 또는 제1항 내지 제8항 중 어느 한 항에 따른 식물 세포를 포함하는 유전자전환 식물로부터의 바이오매스, 종자, 줄기, 꽃 또는 잎을 포함하는 식물 재료를 포함하는 담배 제품.
  13. 노르니코틴 및 NNN 중 하나 이상의 수준이 감소된 담배 식물을 제조하기 위한 방법으로, 상기 방법은,
    (a) 니코틴 N-탈메틸효소를 암호화하는 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성되며 서열번호 2의 서열을 가지는 폴리뉴클레오티드를 포함하는 식물을 제공하는 단계;
    (b) 재조합 구성체를 상기 담배 식물의 상기 폴리뉴클레오티드 내로 삽입해서 유전자전환 담배 식물을 생성하는 단계로, 상기 재조합 구성체는 상기 재조합 구성체를 포함하지 않는 대조군 담배 식물에 비하여 니코틴 N-탈메틸효소의 발현을 감소 또는 억제시키는 폴리뉴클레오티드를 포함하는, 단계;
    (c) 상기 담배 식물 재료를 건조시키는 단계; 그리고
    (d) 상기 유전자전환 담배 식물 내에서의 노르니코틴 및 NNN 중 하나 이상의 수준을 측정하는 단계를 포함하고, 여기서 대조군 담배 식물에 비해 상기 유전자전환 담배 식물 내에서의 노르니코틴 및 NNN 중 하나 이상의 수준의 감소는 상기 유전자전환 담배 식물 내에서의 노르니코틴 및 NNN 중 하나 이상의 수준이 감소된 것이 표지인, 방법.
  14. 제13항에 있어서, (b) 단계에서 상기 유전자전환 담배 식물은 CYP82E4, CYP82E5 또는 CYP82E10 또는 이들의 둘 이상의 조합의 군으로 이루어진 유전자들에서 다음에서 선택되는 하나 이상의 추가 돌연변이를 가지는, 방법:
    (i) CYP82E4 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이로, 여기서 상기 CYP82E4 니코틴 탈메틸효소는 서열번호 12 내지 16 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 5의 위치 329에서 트립토판 잔기에 대한 정지 코돈 치환; b) 서열번호 5의 위치 364에서 라이신 잔기에 대한 아스파라긴 치환; c) 서열번호 5의 위치 376에서 발린 잔기에 대한 메티오닌 치환; d) 서열번호 5의 위치 382에서 프롤린 잔기에 대한 세린 치환; d) 서열번호 5의 위치 458에서 프롤린 잔기에 대한 세린 치환; 및 e) 이들의 둘 이상의 임의의 조합으로 이루어진 군으로부터 선택되고,
    (ii) CYP82E5 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이로, 여기서 상기 CYP82E5 니코틴 탈메틸효소는 서열번호 24 또는 25 또는 이들의 조합으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 17의 위치 422에서 트립토판 잔기에 대해 치환된 정지 코돈; b) 서열번호 17의 위치 449에서 프롤린 잔기에 대해 치환된 류신; 및 c) 이들의 조합으로 이루어진 군으로부터 선택되고; 그리고
    (iii) CYP82E10 니코틴 탈메틸효소를 암호화하는 유전자에서의 하나 이상의 돌연변이, 여기서 상기 CYP82E10 니코틴 탈메틸효소는 서열번호 32 내지 35 또는 이들의 둘 이상의 조합으로 이루어진 군으로부터 선택되며, 여기서 상기 돌연변이는 a) 서열번호 26의 위치 79에서 글리신 잔기에 대한 세린 치환 ; b) 서열번호 26의 위치 107에서 프롤린 잔기에 대한 세린 치환 ; c) 서열번호 26의 위치 382에서 프롤린 잔기에 대한 세린 치환 ; d) 서열번호 26의 위치 419에서 프롤린 잔기에 대한 세린 치환 ; e) 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
  15. 담배 식물에서, 담배 식물 재료에서, 또는 상기 식물 또는 식물 재료로부터 유래된 담배 연기에서의 낮은 노르니코틴 및 NNN 중 하나 이상의 수준을 초래하는 담배 식물에서의 하나 이상의 돌연변이를 식별하기 위한 방법으로, 상기 방법은,
    (a) 대조군 담배 식물에 비해 낮은 노르니코틴 및 NNN 중 하나 이상의 수준을 갖는 담배 식물을 식별하는 단계;
    (b) (a) 단계에서 식별된 담배 식물로부터 핵산 시료를 제공하는 단계;
    (c) 상기 대조군 식물에 존재하지 않는 서열번호 1의 서열에서 하나 이상의 돌연변이의 존재에 대해 (b) 단계로부터의 핵산 시료를 스크리닝하는 단계;
    (d) (c) 단계에서 식별된 하나 이상의 돌연변이를 담배 식물에서 상기 노르니코틴 및 NNN 중 하나 이상의 수준을 감소시키는 공지된 돌연변이와 비교하는 단계; 그리고
    (e) 낮은 노르니코틴 및 NNN 중 하나 이상의 수준을 초래하는 그 하나 이상의 돌연변이를 식별하는 단계를 포함하는, 방법.
  16. 대조군 식물 재료에 비해 감소된 노르니코틴의 수준 또는 대조군 식물 재료에 비해 감소된 적어도 NNN의 수준 또는 이들의 조합을 가지는, 건조 식물 재료, 또는 건조된 잎, 또는 꽃을 생산하기 위한 방법으로,
    (a) 제1항 내지 제8항 중 어느 한 항에 따른 식물 세포를 포함하는 유전자전환 식물; 또는 제1항 내지 제8항 중 어느 한 항에 따른 식물 세포를 포함하는 유전자전환 식물로부터의 바이오매스, 종자, 줄기, 꽃 또는 잎을 포함하는 식물 재료를 제공하는 단계;
    (b) 상기 식물 재료를 수확하는 단계; 그리고
    (c) 노르니코틴 또는 NNN의 수준이 대조군 건조 식물 재료 보다 낮게 될 때까지의 시간 동안 상기 식물 재료를 건조시키는 단계를 포함하는, 방법.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
KR1020167031693A 2014-05-08 2015-05-07 식물 내 니코틴의 노르니코틴으로의 변환 감소 KR102442802B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP14167598.3 2014-05-08
EP14167598 2014-05-08
EP14001645.2 2014-05-09
EP14001645 2014-05-09
PCT/EP2015/060124 WO2015169927A1 (en) 2014-05-08 2015-05-07 Reduction of nicotine to nornicotine conversion in plants

Publications (2)

Publication Number Publication Date
KR20170002444A KR20170002444A (ko) 2017-01-06
KR102442802B1 true KR102442802B1 (ko) 2022-09-14

Family

ID=53276066

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167031693A KR102442802B1 (ko) 2014-05-08 2015-05-07 식물 내 니코틴의 노르니코틴으로의 변환 감소

Country Status (11)

Country Link
US (1) US10415050B2 (ko)
EP (1) EP3140404A1 (ko)
JP (1) JP6871158B2 (ko)
KR (1) KR102442802B1 (ko)
CN (1) CN106459923B (ko)
BR (1) BR112016025234A2 (ko)
CA (1) CA2944965A1 (ko)
MX (1) MX2016014635A (ko)
PH (1) PH12016501718A1 (ko)
RU (1) RU2733837C2 (ko)
WO (1) WO2015169927A1 (ko)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106636146B (zh) * 2017-02-16 2019-09-13 云南省烟草农业科学研究院 一种降低尼古丁转化率的cyp82e5基因突变体及其应用
US11046969B2 (en) * 2017-05-24 2021-06-29 Epiplanta Biotech Ltd. Transgenic plant and the method for producing the same
WO2018222667A1 (en) * 2017-05-31 2018-12-06 22Nd Century Limited, Llc Genome editing methods for producing low-nicotine tobacco products
BR112020011386A2 (pt) 2017-12-07 2020-12-01 R.J. Reynolds Tobacco Company fatores de transcrição bzip regulam a conversão de nicotina em nornicotina
CN108192900B (zh) * 2018-01-16 2021-11-30 西南大学 烟草烟碱去甲基化酶基因cyp82e4的编辑失活载体及其应用
EP3772911A1 (en) 2018-03-28 2021-02-17 Philip Morris Products S.a.s. Modulating reducing sugar content in a plant
EP3775224A1 (en) 2018-03-28 2021-02-17 Philip Morris Products S.a.s. Modulating amino acid content in a plant
CN108424921B (zh) * 2018-04-20 2021-04-20 云南省烟草农业科学研究院 一种降低尼古丁转化率的cyp82e10基因错义突变体m594及其应用
US11384361B2 (en) 2018-07-26 2022-07-12 Altria Client Services Llc Compositions and methods based on PMT engineering for producing tobacco plants and products having altered alkaloid levels
JP2021532761A (ja) * 2018-08-02 2021-12-02 アンティドートゥ・セラピューティクス・インコーポレイテッド 新規ニコチン分解酵素変異体
EP3902390A1 (en) * 2018-12-30 2021-11-03 Philip Morris Products S.A. Modulation of nitrate levels in plants via mutation of nitrate reductase
JP2022550383A (ja) 2019-10-01 2022-12-01 フィリップ・モーリス・プロダクツ・ソシエテ・アノニム 植物における還元糖含有量の調節(inv)
KR20220071260A (ko) 2019-10-01 2022-05-31 필립모리스 프로덕츠 에스.에이. 식물 내 당 및 아미노산 (sultr3) 함량 조절
EP4069854A1 (en) * 2019-12-03 2022-10-12 Altria Client Services LLC Compositions and methods for producing tobacco plants and products having altered alkaloid levels
US11536685B2 (en) 2020-02-06 2022-12-27 Trustees Of Boston University High throughput assay for identifying microbial redox enzymes
US11331020B2 (en) 2020-02-06 2022-05-17 Trustees Of Boston University Enzyme-based electrochemical nicotine biosensor
CN115485386B (zh) * 2020-04-17 2024-03-29 日本烟草产业株式会社 低生物碱含量的烟草属植物体及其制备方法
CN111505158B (zh) * 2020-05-09 2022-09-23 云南省烟草农业科学研究院 一种基于孵化处理的尼古丁转化烟株色质快速筛查方法
WO2023036691A1 (en) 2021-09-10 2023-03-16 Philip Morris Products S.A. Modulating alkaloid profiles in nicotiana tabacum
CN113980978B (zh) * 2021-11-22 2023-12-26 云南中烟工业有限责任公司 一种烟草烟碱转运蛋白相关的基因及其应用
WO2023117661A1 (en) 2021-12-20 2023-06-29 Philip Morris Products S.A. Increasing anatabine in tobacco leaf by regulating methyl putrescine oxidase
WO2023117701A1 (en) 2021-12-21 2023-06-29 Philip Morris Products S.A. Modulation of nicotine production by alteration of nicotinamidase expression or function in plants
CN114540382B (zh) * 2022-02-18 2023-07-18 贵州省烟草科学研究院 烟草镉转运基因NtPLA1及应用
WO2024079137A1 (en) 2022-10-13 2024-04-18 Philip Morris Products S.A. Increasing leaf biomass and nitrogen use efficiency by regulating ntp2

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009064771A2 (en) 2007-11-12 2009-05-22 North Carolina State University Alteration of tobacco alkaloid content through modification of specific cytochrome p450 genes
US20100012137A1 (en) 2006-12-15 2010-01-21 U.S. Smokeless Tobacco Company Tobacco plants having reduced nicotine demethylase activity
WO2011088180A1 (en) 2010-01-15 2011-07-21 North Carolina State University Compositions and methods for minimizing nornicotine synthesis in tobacco

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5810020A (en) 1993-09-07 1998-09-22 Osmotek, Inc. Process for removing nitrogen-containing anions and tobacco-specific nitrosamines from tobacco products
US6202649B1 (en) 1996-12-02 2001-03-20 Regent Court Technologies Method of treating tobacco to reduce nitrosamine content, and products produced thereby
TR199903160T2 (xx) 1997-06-20 2000-10-23 Regent Court Technologies Nitrosamin i�eri�ini azaltmak i�in t�t�n i�leme y�ntemi.
US7700851B2 (en) * 2001-11-13 2010-04-20 U.S. Smokeless Tobacco Company Tobacco nicotine demethylase genomic clone and uses thereof
BRPI0519985B1 (pt) 2005-02-23 2018-01-30 University Of Kentucky Research Foundation Método para redução do nível de nornicotina ou n’-nitrosonornicotina em uma planta do gênero nicotiana ou parte desta ou em um produto de tabaco, cassete de expressão e método para a produção de uma planta do gênero nicotiana
WO2008070274A2 (en) 2006-10-13 2008-06-12 North Carolina State University Alteration of tobacco alkaloid content through modification of specific cytochrome p450 genes
RU2324737C1 (ru) * 2006-10-18 2008-05-20 Институт цитологии и генетики Сибирского отделения Российской академии наук (СО РАН) Способ получения трансгенных растений табака с повышенным содержанием пролина
AP3226A (en) 2007-12-13 2015-04-30 Philip Morris Products Sa Transgenic plants modifier for reducede cadmium transport, derivative products, and related methods
US7883371B1 (en) 2009-07-22 2011-02-08 Hon Hai Precision Ind. Co., Ltd. Electrical connector with improved contact footprints
WO2012028309A2 (en) 2010-09-03 2012-03-08 Philip Morris Products S.A. Heavy metal reduction in planta

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100012137A1 (en) 2006-12-15 2010-01-21 U.S. Smokeless Tobacco Company Tobacco plants having reduced nicotine demethylase activity
WO2009064771A2 (en) 2007-11-12 2009-05-22 North Carolina State University Alteration of tobacco alkaloid content through modification of specific cytochrome p450 genes
WO2011088180A1 (en) 2010-01-15 2011-07-21 North Carolina State University Compositions and methods for minimizing nornicotine synthesis in tobacco

Also Published As

Publication number Publication date
RU2016144409A3 (ko) 2018-11-29
US10415050B2 (en) 2019-09-17
JP6871158B2 (ja) 2021-05-12
CN106459923B (zh) 2020-08-11
CN106459923A (zh) 2017-02-22
US20170130239A1 (en) 2017-05-11
CA2944965A1 (en) 2015-11-12
MX2016014635A (es) 2017-02-23
WO2015169927A1 (en) 2015-11-12
RU2016144409A (ru) 2018-06-13
PH12016501718A1 (en) 2016-11-07
JP2017519519A (ja) 2017-07-20
BR112016025234A2 (pt) 2017-12-12
RU2733837C2 (ru) 2020-10-07
KR20170002444A (ko) 2017-01-06
EP3140404A1 (en) 2017-03-15

Similar Documents

Publication Publication Date Title
KR102442802B1 (ko) 식물 내 니코틴의 노르니코틴으로의 변환 감소
JP6693747B2 (ja) 植物体中のたばこ特異的ニトロソアミンの低減
KR102136088B1 (ko) 식물계에서의 중금속 감소
KR101965019B1 (ko) 식물에서의 베타-다마세논의 조절
JP6225108B2 (ja) ニコチアナ・タバカムからのトレオニン合成酵素ならびにその方法および使用
JP6810134B2 (ja) アスパラギン含有量を低減させた植物体
AU2012301349B2 (en) Isopropylmalate synthase from nicotiana tabacum and methods and uses thereof
US11685929B2 (en) Plants with shortened time to flowering
US20170145431A1 (en) Modulation of nitrate content in plants
JP7463284B2 (ja) 植物におけるアミノ酸含有量の調節
EP2586792A1 (en) Modulating beta-damascenone in plants

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant