KR20220038606A - 타바코 식물에서 알칼로이드 함량을 조정하는 방법 - Google Patents

타바코 식물에서 알칼로이드 함량을 조정하는 방법 Download PDF

Info

Publication number
KR20220038606A
KR20220038606A KR1020217043134A KR20217043134A KR20220038606A KR 20220038606 A KR20220038606 A KR 20220038606A KR 1020217043134 A KR1020217043134 A KR 1020217043134A KR 20217043134 A KR20217043134 A KR 20217043134A KR 20220038606 A KR20220038606 A KR 20220038606A
Authority
KR
South Korea
Prior art keywords
seq
plant
tobacco
domain
btb
Prior art date
Application number
KR1020217043134A
Other languages
English (en)
Inventor
사라 벤 칼레드
프란시스코 아나스타시오 데 아브뢰 에 리마
Original Assignee
브리티시 아메리칸 토바코 (인베스트먼츠) 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 브리티시 아메리칸 토바코 (인베스트먼츠) 리미티드 filed Critical 브리티시 아메리칸 토바코 (인베스트먼츠) 리미티드
Publication of KR20220038606A publication Critical patent/KR20220038606A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/12Leaves
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/82Solanaceae, e.g. pepper, tobacco, potato, tomato or eggplant
    • A01H6/823Nicotiana, e.g. tobacco
    • AHUMAN NECESSITIES
    • A24TOBACCO; CIGARS; CIGARETTES; SIMULATED SMOKING DEVICES; SMOKERS' REQUISITES
    • A24BMANUFACTURE OR PREPARATION OF TOBACCO FOR SMOKING OR CHEWING; TOBACCO; SNUFF
    • A24B15/00Chemical features or treatment of tobacco; Tobacco substitutes, e.g. in liquid form
    • A24B15/10Chemical features of tobacco products or tobacco substitutes
    • AHUMAN NECESSITIES
    • A24TOBACCO; CIGARS; CIGARETTES; SIMULATED SMOKING DEVICES; SMOKERS' REQUISITES
    • A24BMANUFACTURE OR PREPARATION OF TOBACCO FOR SMOKING OR CHEWING; TOBACCO; SNUFF
    • A24B15/00Chemical features or treatment of tobacco; Tobacco substitutes, e.g. in liquid form
    • A24B15/10Chemical features of tobacco products or tobacco substitutes
    • A24B15/12Chemical features of tobacco products or tobacco substitutes of reconstituted tobacco
    • AHUMAN NECESSITIES
    • A24TOBACCO; CIGARS; CIGARETTES; SIMULATED SMOKING DEVICES; SMOKERS' REQUISITES
    • A24BMANUFACTURE OR PREPARATION OF TOBACCO FOR SMOKING OR CHEWING; TOBACCO; SNUFF
    • A24B15/00Chemical features or treatment of tobacco; Tobacco substitutes, e.g. in liquid form
    • A24B15/18Treatment of tobacco products or tobacco substitutes
    • A24B15/24Treatment of tobacco products or tobacco substitutes by extraction; Tobacco extracts
    • AHUMAN NECESSITIES
    • A24TOBACCO; CIGARS; CIGARETTES; SIMULATED SMOKING DEVICES; SMOKERS' REQUISITES
    • A24BMANUFACTURE OR PREPARATION OF TOBACCO FOR SMOKING OR CHEWING; TOBACCO; SNUFF
    • A24B7/00Cutting tobacco
    • AHUMAN NECESSITIES
    • A24TOBACCO; CIGARS; CIGARETTES; SIMULATED SMOKING DEVICES; SMOKERS' REQUISITES
    • A24FSMOKERS' REQUISITES; MATCH BOXES; SIMULATED SMOKING DEVICES
    • A24F40/00Electrically operated smoking devices; Component parts thereof; Manufacture thereof; Maintenance or testing thereof; Charging means specially adapted therefor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Botany (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physiology (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Nutrition Science (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Manufacture Of Tobacco Products (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 식물 또는 이의 일부의 알칼로이드 함량을 조절하는 방법에 관한 것이며, 방법은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 상기 식물을 변형시키는 것을 포함한다. 본 발명은 또한 타바코에서 적어도 하나의 타바코 특이적 니트로사민(TSNA) 전구체의 함량을 감소시키는 방법에 관한 것이며, 방법은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하는 것을 포함한다.

Description

타바코 식물에서 알칼로이드 함량을 조정하는 방법
본 발명은 식물 또는 이의 일부 또는 세포 또는 세포 배양물의 알칼로이드 함량을 조절하는 방법에 관한 것이다. 본 발명은 또한 식물 내 알칼로이드 함량을 조절하는 폴리펩티드의 발현 및/또는 활성을 조절하는 방법으로 확장된다. 대안적으로, 본 발명은 식물 내 알칼로이드 함량을 조절하는 폴리펩티드를 인코딩하는 유전자의 발현 및/또는 활성을 조절하는 방법을 제공한다. 본 발명은 또한 폴리펩티드를 조절하는데 사용될 수 있는 작제물로 확장된다. 본 발명은 또한 알칼로이드 함량의 조절을 달성하도록 변형된 식물 세포 및 식물에 관한 것이다. 본 발명은 또한 이러한 조절된 식물로부터 가공되고 수확된 잎 및 가연성 흡연 물품을 포함하는 타바코 산업 제품에서의 이의 용도에 관한 것이다.
알칼로이드는 기본 질소 원자를 대부분 함유하고, 박테리아, 진균류, 식물 및 동물을 포함한 다양한 유기체에 의해 생성되는 자연 발생 화합물의 군이다.
알칼로이드는 탄소 골격의 유사성에 따라 예를 들어, 인돌-, 이소퀴놀린- 및 피리딘-형으로 분류될 수 있다. 피리딘 유도체는 모노머 알칼로이드의 한 부류이다; 이러한 부류는 피리딘의 단순 유도체, 폴리시클릭 축합 및 비축합 피리딘 유도체 및 세스퀴테르펜 피리딘 유도체를 포함한다. 예는 니코틴, 노르니코틴, 슈도옥시니코틴, 아나바신, 미오스민 및 아나타빈이다.
알칼로이드의 알려진 생물학적 기능의 대부분은 보호와 관련이 있다. 카페인, 코카인, 모르핀 및 니코틴과 같은 신경활성 분자는 침입성 포식자에 대한 방어 화합물로서 작용한다. 이러한 알칼로이드의 축적은 유전자 발현, 효소 활성 및 알칼로이드 농도를 모니터링하는 신호 전달 캐스케이드의 결과이다. 식물에서 알칼로이드 함량의 미세 조정에는 부정적인 피드백 루프와 분해 경로를 포함한다.
니코틴은 여러 종류의 식물에서 자연적으로 발생하지만 타바코 식물에서 가장 높은 수준으로 발견된다. 재배된 타바코는 총 건조 중량의 2-4% 알칼로이드를 생성한다. 니코틴은 야생 및 재배된 니코티아나(Nicotiana) 종에서 생성되며, 초식 동물 및 곤충에 대한 식물 방어에서 중요한 역할을 한다(Voelckel et al. (2001) Oecologia 127(2): 274-280, 인용으로 본원에 포함됨). 이는 총 알칼로이드 함량의 ~90%를 차지한다. 알칼로이드 풀의 나머지 10%는 대부분 구조적으로 관련된 화합물인 노르니코틴, 아나타빈, 아나바신 및 슈도옥시니코틴(PON)으로 구성된다.
타바코에서 알칼로이드 함량 조절은 복잡한다. 유전자형, 환경, 시비 및 농경 관행(예를 들어, 토핑)을 포함한 여러 요인이 타바코 식물의 알칼로이드 수준에 영향을 미친다. 니코틴 생합성의 일부 주요 조절인자는 잘 특성규명되어 있으며, 예를 들어 이 경로에서 중추적인 역할을 하는 푸트레신 N-메틸트랜스퍼라제(PMT)는 타바코 게놈에서 가장 큰 전사 인자 패밀리인 에틸렌 반응성 인자(ERF) 슈퍼패밀리의 구성원에 의해 활성화된다(본원에 인용으로 포함된 문헌 [Rushton et al. (2008) Plant Physiol. 147(1): 280-295]). 알칼로이드 생합성을 유도하는 다른 전사 인자는 MYC2-유사 염기성 헬릭스-루프-헬릭스(bHLH) 패밀리에 속한다. MYC2-유사 bHLH는 알칼로이드 구조 유전자의 Gbox-매개된 결합 및 활성화를 통해 직접적으로 및 ERF의 활성화를 통해 간접적으로 알칼로이드 수준을 조절한다.
타바코 피리딘 알칼로이드는 수확 후 잎 경화 중에 형성되는 타바코-특이적 니트로사민(TSN)의 전구체이다. 경화된 타바코 잎에서 발견되는 4가지 주요 TSNA는 N'-니트로소노르니코틴(NNN), N'니트로소아나타빈(NAT), N'-니트로소아나바신(NAB) 및 4-(메틸 니트로사미노)-1-(3-피리딜)-1-부타논(NNK)이다. 수확 후 잎이 경화되는 동안, 피리딘 알칼로이드와 니트로화 종 사이의 반응은 타바코-특이적 니트로사민(TSNA)의 형성으로 이어진다. PON은 TSNA NNK의 합성에서 직접적인 전구체로 기능할 가능성이 높다(인용으로 본원에 포함된 Bush et al., 2001). TSNA의 생성 및 축적을 줄이는 것은 매우 중요한다. 니코틴 데메틸라제 유전자의 CYP82E 계열은 니코틴에서 노르니코틴으로의 전환의 주요 조절인자 중 하나이며, 활성 또는 축적을 변경하면 NNN 수준이 감소할 수 있다. 그러나 지금까지 PON 생성을 담당하는 효소나 유전자는 확인되지 않았다.
실시예에 기재된 바와 같이, 본 발명자들은 식물에서 알칼로이드 함량을 조절하는, 예를 들어 타바코에서 TSNA 함량을 감소시킬 목적으로 알칼로이드 및/또는 TSNA 전구체 합성을 담당하는 유전자를 조사하고자 하였다.
발명의 개요
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 조절함으로써 식물의 알칼로이드 함량 및/또는 TSNA 함량 또는 TSNA의 전구체 함량이 조절될 수 있음을 놀랍게도 발견하였다. BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 본원에 교시된 유전자(들), 예를 들어 Nitab4.5_0000868g0020.2는 재배된 타바코에서 알칼로이드 및 TSNA 전구체 함량의 조절인자이다. 특히, 본원에 교시된 유전자(들), 예를 들어 Nitab4.5_0000868g0020.2는 재배된 타바코에서 알칼로이드 함량의 조절인자이다. Nitab4.5_0000868g0020.2.는 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질을 인코딩한다. Nitab4.5_0000651g0020.2, Nitab4.5_0009137g0040.2, Nitab4.5_0001772g0090.2, Nitab4.5_0003312g0050.2, Nitab4.5_0003151g0080.2, Nitab4.5_0002641g0190.2, Nitab4.5_0001876g0030.2, Nitab4.5_0000048g0280.2 및 Nitab4.5_0002006g0070.2는 본 발명에 따른 Nitab4.5_0000868g0020.2의 상동체이다.
본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및 NPH3 도메인으로 지칭되는 보존된 도메인을 함유할 수 있다.
본 발명에 따르면, 조절된 알칼로이드 함량 및 타바코 산업 제품의 소비자가 추구하는 상업적으로 바람직한 특성을 갖는 타바코 산업 제품이 생산될 수 있다. 일부 경우에, 소비자는 알칼로이드 함량 수준이 낮은 제품, 예를 들어, TSNA 전구체 수준이 낮은 제품을 원할 수 있다.
본 발명은 식물 분자 농업 분야에서 특히 유용할 수 있으며, 여기서 식물(예컨대, 타바코 및 기타 니코티아나 종)은 예를 들어, 항생제, 바이러스 유사 입자, 또는 기능식품 또는 소분자와 같은 치료제 및 의약품의 생산을 위한 단백질, 펩티드 및 대사산물의 생산에 사용된다. 타바코는 PharmPlant and Medicago Inc.로 불리는 EU 자금 지원 프로젝트에서 HIV-중화 항체의 개발에 사용되었으며, 캐나다는 독감 백신 제조를 위한 바이러스-유사 입자의 생산을 위한 타바코-기반 플랫폼에서 작업하였다.
따라서, 본 발명에 따른 식물은 니코틴 알칼로이드의 존재를 감소 또는 제거하기 위해 분자 농업에 사용될 수 있다. 저 니코틴 식물 또는 뿌리의 사용은 분자 농업에 유익하며, 정제와 관련된 다운스트림 처리 비용을 줄일 것이다.
본 발명자들은 놀랍게도 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 조절함으로써(예를 들어, 감소시킴으로써) 식물(예를 들어, 타바코 식물)의 알칼로이드 함량을 조절하는(예를 들어, 감소시키는) 방법을 결정하였다. 식물(예를 들어, 타바코 식물)의 알칼로이드 함량(예를 들어, PON, 노르니코틴, 아나바신, 아나타빈 또는 미오스민 중 하나 이상의 함량)은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 감소시킴으로써 감소될 수 있거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 증가시킴으로써 증가될 수 있다. 본 발명 전에, 본원에 기술된 바와 같은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현의 조절이 특히 알칼로이드 함량을 조절하거나 PON 함량을 조절하는데 사용될 수 있다는 것은 알려지지 않았다.
일 양태에서, 본 발명은 식물 또는 이의 일부 또는 세포에서 알칼로이드 함량을 조절하는(예를 들어, 감소시키는) 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
또 다른 양태에서, 본 발명은 타바코 식물 또는 이의 식물 일부 또는 세포에서 타바코-특이적 니트로사민(TSNA) 전구체의 함량을 조절하는(예를 들어, 감소시키는) 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 상기 식물 또는 세포를 변형시키는 것을 포함하는, 방법을 제공한다.
추가의 양태에서, 세포 또는 식물 또는 이의 일부의 알칼로이드 함량을 조절(예를 들어, 감소)하기 위한 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 용도를 제공한다.
또 다른 양태에서, 조절된(예를 들어, 감소된) 알칼로이드 함량을 갖는 식물 또는 이의 일부, 세포, 식물 번식 물질, 잎, 절단된 수확된 잎, 가공된 잎 또는 절단되고 가공된 잎을 생성하기 위한 방법으로서, 상기 식물 또는 세포를 변형시켜 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하는, 방법이 제공된다.
적합하게는, 알칼로이드 함량은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하기 위해 변형되지 않은 식물 또는 세포와 비교하여 감소될 수 있다.
일 양태에서, 본 발명은 비변형된 식물과 비교하여 알칼로이드 함량의 조절(예를 들어, 감소)을 달성하기 위해 변형된 식물 또는 이의 일부 또는 세포로서, 여기서 변형은 타바코로부터의 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현의 조절인, 변형된 식물 또는 이의 일부 또는 세포를 제공한다.
추가의 양태에서, 본 발명은 본 발명에 따른 방법에 의해 생성된 식물 또는 세포로부터 또는 본 발명에 따른 식물 또는 세포로부터 수득가능한 식물 번식 물질을 제공한다.
적합하게는, 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 1, SEQ ID NO. 4, SEQ ID NO. 7, SEQ ID NO. 10, SEQ ID NO. 13, SEQ ID NO. 16, SEQ ID NO. 19, SEQ ID NO. 22, SEQ ID NO. 25, SEQ ID NO. 28로 제시된 아미노산 서열 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30으로 제시된 뉴클레오티드 서열 또는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열을 포함한다.
적합하게는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 추가적인 유전자가 변형될 수 있은데, 여기서 추가적인 유전자는 SEQ ID NO. 1, SEQ ID NO. 4, SEQ ID NO. 7, SEQ ID NO. 10, SEQ ID NO. 13, SEQ ID NO. 16, SEQ ID NO. 19, SEQ ID NO. 22, SEQ ID NO. 25, SEQ ID NO. 28 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열로부터 선택되는 적어도 하나이거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열을 포함한다.
일 양태에서, 본 발명은 식물을 육종시키기 위한 본 발명에 따른 방법에 의해 생성된 식물 또는 본 발명에 따른 식물 또는 이의 일부의 용도를 제공한다.
일 양태에서, 본 발명은 제품의 생산을 위한 본 발명에 따른 방법에 의해 생성된 식물 또는 본 발명에 따른 식물 또는 이의 일부의 용도를 제공한다.
일 양태에서, 본 발명은 작물을 재배하기 위한 본 발명에 따른 방법에 의해 생성된 식물 또는 본 발명에 따른 식물 또는 이의 일부의 용도를 제공한다.
일 양태에서, 본 발명은 잎을 생성하기 위한 본 발명에 따른 방법에 의해 생성된 식물 또는 본 발명에 따른 식물 또는 이의 일부의 용도를 제공한다.
또 다른 양태에서, 본 발명은 본 발명에 따른 식물의 수확된 잎, 또는 본 발명에 따른 번식 물질로부터 번식된 식물로부터 수득가능한(예를 들어, 수득된), 또는 본 발명에 따른 용도에 의해 수득된 식물로부터 수득가능한(예를 들어, 수득된), 또는 본 발명에 따른 방법에 의해 생성된 식물로부터 수득가능한(예를 들어, 수득된) 식물의 수확된 잎을 제공한다.
적합하게는, 식물의 수확된 잎은 절단된 수확된 잎일 수 있다.
또 다른 양태에서, 본 발명은
본 발명에 따른 용도로부터 수득가능한(예를 들어, 수득된) 식물로부터 수득가능한(예를 들어, 수득된);
본 발명에 따른 식물을 가공함으로써 수득가능한(예를 들어, 수득된);
본 발명에 따른 식물 번식 물질로부터 번식된 식물로부터 수득가능한; 또는
본 발명에 따른 식물의 수확된 잎을 가공함으로써 수득가능한(예를 들어, 수득된); 또는
본 발명에 따른 방법에 의해 생성된 식물로부터 수득가능한(예를 들어, 수득된) 가공된 잎, 바람직하게는 가공된 타바코 잎, 바람직하게는 생육불가능한 가공된 타바코 잎을 제공한다.
적합하게는, 잎은 경화, 발효, 저온 살균 또는 이들의 조합에 의해 가공될 수 있으며, 바람직하게는 4-(메틸니트로사미노)-1-(3-피리딜)-1-부타논(NNK), N'-니트로소노르니코틴(NNN), N'-니트로소아나타빈(NAT) 및 N-니트로소아나바신(NAB)으로부터 선택되는 하나 이상의 TSNA의 함량이 감소되며, 바람직하게는 NNN 및/또는 NNK의 함량이 조절(감소)되고, 더욱 바람직하게는 NNK의 함량이 감소된다.
적합하게는, 가공된 잎은 절단된 가공된 잎일 수 있다.
추가의 양태에서, 본 발명은
본 발명에 따른 용도로부터 수득가능한 식물로부터 수득가능한(예를 들어, 수득된);
본 발명에 따른 식물을 가공함으로써 수득가능한(예를 들어, 수득된);
본 발명에 따른 식물 번식 물질로부터 번식된 식물로부터 수득가능한(예를 들어, 수득된); 또는
본 발명에 따른 식물의 수확된 잎을 가공함으로써 수득가능한(예를 들어, 수득된); 또는
본 발명에 따른 방법에 의해 생성된 식물로부터 수득가능한(예를 들어, 수득된) 식물 또는 이의 일부로부터 제조된 경화된 타바코 물질을 제공한다.
또 다른 양태에서, 본 발명은 본 발명에 따른 경화된 타바코 물질을 포함하는 타바코 블렌드를 제공한다.
또 다른 양태에서, 본 발명은
본 발명에 따른 식물 또는 본 발명에 따른 이의 일부로서, 상기 식물이 타바코 식물인, 식물 또는 이의 일부;
본 발명에 따른 타바코 식물 번식 물질로부터 번식된 타바코 식물 또는 이의 일부;
본 발명에 따른 식물의 수확된 잎으로서, 상기 식물이 타바코 식물인 수확된 잎;
본 발명에 따른 가공된 잎으로서, 상기 식물이 타바코 식물인, 가공된 잎; 또는
본 발명의 방법에 의해 생성된 식물로부터 제조된 타바코 산업 제품을 제공한다.
적합하게는, 타바코 산업 제품은 가연성 흡연 물품일 수 있다.
적합하게는, 타바코 산업 제품은 무연 타바코 제품일 수 있다.
적합하게는, 타바코 제품은 타바코 가열 장치 또는 에어로졸-발생 장치와 같은 불연성 에어로졸 공급 시스템일 수 있다.
또 다른 양태에서, 본 발명은 본 발명에 따른 식물 또는 이의 일부, 또는 세포 또는 이의 추출물(예를 들어, 타바코 추출물); 또는 본 발명에 따른 경화된 타바코 물질; 또는 본 발명에 따른 타바코 블렌드를 포함하는 가연성 흡연 물품, 불연성 에어로졸 공급 시스템, 무연 타바코 제품 또는 타바코 가열 장치를 제공한다.
본 발명은 조절된(예를 들어, 감소된) 알칼로이드 함량 및/또는 조절된(예를 들어, 감소된) 함량의 타바코 특이적 니트로사민(TSNA) 또는 TSNA의 전구체를 갖는 식물을 선택하기 위한 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 뉴클레오티드 서열의 용도를 제공하며, 여기에서 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질의 서열은 SEQ ID NO. 1, SEQ ID NO. 4, SEQ ID NO. 7, SEQ ID NO. 10, SEQ ID NO. 13, SEQ ID NO. 16, SEQ ID NO. 19, SEQ ID NO. 22, SEQ ID NO. 25, SEQ ID NO. 28 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28D에 대해 적어도 80% 동일성을 갖는 서열부터 선택되거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30으로서 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열을 포함한다.
또 다른 양태에서, 본 발명은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 뉴클레오티드 서열에서 유전성 돌연변이를 수반하는 식물의 돌연변이체를 제공하며, 바람직하게는, 여기서 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열로부터 선택되며; 상기 유전성 돌연변이는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하며(예를 들어, 감소시키며), 돌연변이체 식물은 상기 유전성 돌연변이를 수반하지 않는 유사한 식물과 비교하여 조절된(예를 들어, 감소된) 알칼로이드 함량, 바람직하게는 니코틴 함량 및/또는 조절된 함량의 타바코 특이적 니트로사민(TSNA) 또는 TSNA의 전구체를 갖는다.
또 다른 양태에서, 본 발명은 본 발명에 따른 유전성 돌연변이를 수반하는 돌연변이체 식물의 자손 또는 종자를 제공한다.
추가의 양태에서, 본 발명은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 뉴클레오티드 서열에서 변형을 포함하는 식물로부터 생성된, 수확된 잎, 가공된 잎 또는 경화된 타바코 물질을 제공하며, 여기서 적어도 하나의 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30; 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열로부터 선택되며; 상기 변형은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하며(예를 들어, 감소시키며), 상기 식물은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자에서 상기 변형을 수반하지 않는 유사한 식물과 비교하여 조절된(예를 들어, 감소된) 알칼로이드 함량, 바람직하게는 니코틴 함량, 및/또는 조절된 함량의 타바코 특이적 니트로사민(TSNA) 또는 TSNA의 전구체를 갖는다.
본 발명은 설명 및 도면을 참조하여 본원에 기재된 바와 같은 방법, 잎, 식물, 식물 번식 물질, 수확된 잎, 가공된 타바코, 타바코 제품, 용도 또는 이들의 조합을 제공한다 .
이제 본 발명의 구현예가 첨부 도면을 참조하여 단지 예로서 설명될 것이다.
도 1은 Nitab4.5_0000868g0020.2를 과발현하는 5주된 타바코 잎의 알칼로이드 함량을 보여준다. 알칼로이드 함량은 대조군과 관련하여 표시되며, 일원 ANOVA 및 Tukey의 다중 비교 사후 테스트로 분석된 두 가지 생물학적 복제를 나타낸다. 값은 평균 ± SEM으로 표시된다. 별표는 P 값 ≤ 0.05의 통계적 의미를 나타낸다.
도 2는 Nitab4.5_0000868g0020.2를 표적으로 하는 인공 miRNA를 발현하는 5주된 타바코 잎의 알칼로이드 함량을 보여준다. 알칼로이드 함량은 대조군과 관련하여 표시되며, 일원 ANOVA 및 Tukey의 다중 비교 사후 테스트로 분석된 세 가지 생물학적 복제를 포함한다. 값은 평균 ± SEM으로 표시된다. 별표는 P 값 ≤ 0.001의 통계적 의미를 나타낸다.
도 3은 Nitab4.5_0000868g0020.2의 아미노산 서열 - SEQ ID NO. 1 - 본 발명에 따른 니코티아나 타바쿰(Nicotiana tabacum)으로부터의 단백질을 보여준다.
도 4는 Nitab4.5_0000868g0020.2의 코딩 서열 - SEQ ID NO. 2 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 5은 Nitab4.5_0000868g0020.2의 게놈 서열 - SEQ ID NO. 3 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 6은 Nitab4.5_0000651g0020.2의 아미노산 서열 - SEQ ID NO. 4 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 7은 Nitab4.5_0000651g0020.2의 코딩 서열 - SEQ ID NO. 5 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 8은 Nitab4.5_0000651g0020.2의 게놈 서열 - SEQ ID NO. 6 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 9는 Nitab4.5_0009137g0040.2의 아미노산 서열 - SEQ ID NO. 7 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 10은 Nitab4.5_0009137g0040.2의 코딩 서열 - SEQ ID NO. 8 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 11은 Nitab4.5_0009137g0040.2의 게놈 서열 - SEQ ID NO. 9 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 12는 Nitab4.5_0001772g0090.2의 아미노산 서열 - SEQ ID NO. 10 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 13은 Nitab4.5_0001772g0090.2의 코딩 서열 - SEQ ID NO. 11 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 14는 Nitab4.5_0001772g0090.2의 게놈 서열 - SEQ ID NO. 12 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 15는 Nitab4.5_0003312g0050.2의 아미노산 서열 - SEQ ID NO. 13 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 16은 Nitab4.5_0003312g0050.2의 코딩 서열 - SEQ ID NO. 14 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 17은 Nitab4.5_0003312g0050.2의 게놈 서열 - SEQ ID NO. 15 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 18은 Nitab4.5_0003151g0080.2의 아미노산 서열 - SEQ ID NO. 16 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 19는 Nitab4.5_0003151g0080.2의 코딩 서열 - SEQ ID NO. 17 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 20은 Nitab4.5_0003151g0080.2의 게놈 서열 - SEQ ID NO. 18 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 21은 Nitab4.5_0002641g0190.2의 아미노산 서열 - SEQ ID NO. 19 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 22는 Nitab4.5_0002641g0190.2.의 코딩 서열 - SEQ ID NO. 20 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 23은 Nitab4.5_0002641g0190.2.의 게놈 서열 - SEQ ID NO. 21 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 24는 Nitab4.5_0001876g0030.2의 아미노산 서열 - SEQ ID NO. 22 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 25는 Nitab4.5_0001876g0030.2의 코딩 서열 - SEQ ID NO. 23 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 26은 Nitab4.5_0001876g0030.2의 게놈 서열 - SEQ ID NO. 24 -를 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 27은 Nitab4.5_0000048g0280.2의 아미노산 서열 - SEQ ID NO. 25 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 28은 Nitab4.5_0000048g0280.2의 코딩 서열 - SEQ ID NO. 26 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 29는 Nitab4.5_0000048g0280.2의 게놈 서열 - SEQ ID NO. 27 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 30은 Nitab4.5_0002006g0070.2의 아미노산 서열 - SEQ ID NO. 28 - 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 보여준다.
도 31은 Nitab4.5_0002006g0070.2의 코딩 서열 - SEQ ID NO. 29 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 32는 Nitab4.5_0002006g0070.2의 게놈 서열 - SEQ ID NO. 30 -을 보여주며, 본 발명에 따른 니코티아나 타바쿰으로부터의 단백질을 인코딩한다.
도 33은 BTB/POZ 동종이량체 도메인의 아미노산 서열(SEQ ID NO. 1의 잔기 39-136)에 상응하는 SEQ ID NO. 31을 보여준다.
도 34는 NPH3 도메인의 아미노산 서열(SEQ ID NO. 1의 잔기 218-492)에 상응하는 SEQ ID NO. 32를 보여준다.
도 35는 Nitab4.5_0000868g0020.2의 녹아웃이 알칼로이드 함량의 현저한 감소로 이어짐을 보여준다. Nitab4.5_0000868g0020.2이 녹아웃된 세 가지 TN90 라인의 알칼로이드 함량을 보여준다. 알칼로이드 함량은 대조군과 비교하여 표시된다. 결과는 t-테스트로 분석되었다. 값은 평균 ± SEM으로 표시된다. 별표는 P 값 ≤ 0.001의 통계적 의미를 나타낸다.
도 36은 SEQ ID NO. 33; Nitab4.5_0000842g0110.2의 게놈 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 37은 SEQ ID NO. 34; Nitab4.5_0000842g0110.2의 게놈 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 38은 SEQ ID NO. 35; Nitab4.5_0000842g0110.2의 게놈 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 39는 SEQ ID NO. 36; Nitab4.5_0001620g0100.2의 아미노산 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 40은 SEQ ID NO. 37; Nitab4.5_0001620g0100.2의 코딩 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 41은 SEQ ID NO. 38; Nitab4.5_0001620g0100.2의 게놈 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 42는 SEQ ID NO. 39; Nitab4.5_0001200g0070.2의 아미노산 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 43은 SEQ ID NO. 40; Nitab4.5_0001200g0070.2의 코딩 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 44는 SEQ ID NO. 41; Nitab4.5_0001200g0070.2의 게놈 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 45는 SEQ ID NO. 42; Nitab4.5_0005803g0040.2의 아미노산 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 46은 SEQ ID NO. 43; Nitab4.5_0005803g0040.2의 코딩 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
도 47은 SEQ ID NO. 44; Nitab4.5_0005803g0040.2의 게놈 서열, Nitab4.5_0000868g0020.2의 상호작용인자를 보여준다.
서열 목록
본 명세서 전체에 걸쳐 사용된 서열 식별자의 요약 및 대응하는 서열 목록이 제공된다.
SEQ ID NO. 1은 Nitab4.5_0000868g0020.2의 아미노산 서열에 상응한다.
SEQ ID NO. 2는 Nitab4.5_0000868g0020.2의 코딩 서열에 상응한다.
SEQ ID NO. 3은 Nitab4.5_0000868g0020.2의 게놈 서열에 상응한다.
SEQ ID NO. 4는 Nitab4.5_0000651g0020.2의 아미노산 서열에 상응한다.
SEQ ID NO. 5는 Nitab4.5_0000651g0020.2의 코딩 서열에 상응한다.
SEQ ID NO. 6은 Nitab4.5_0000651g0020.2의 게놈 서열에 상응한다.
SEQ ID NO. 7은 Nitab4.5_0009137g0040.2의 아미노산 서열에 상응한다.
SEQ ID NO. 8은 Nitab4.5_0009137g0040.2의 코딩 서열에 상응한다.
SEQ ID NO. 9는 Nitab4.5_0009137g0040.2의 게놈 서열에 상응한다.
SEQ ID NO. 10은 Nitab4.5_0001772g0090.2의 아미노산 서열에 상응한다.
SEQ ID NO. 11은 Nitab4.5_0001772g0090.2의 코딩 서열에 상응한다.
SEQ ID NO. 12는 Nitab4.5_0001772g0090.2의 게놈 서열에 상응한다.
SEQ ID NO. 13은 Nitab4.5_0003312g0050.2의 아미노산 서열에 상응한다.
SEQ ID NO. 14는 Nitab4.5_0003312g0050.2의 코딩 서열에 상응한다.
SEQ ID NO. 15는 Nitab4.5_0003312g0050.2의 게놈 서열에 상응한다.
SEQ ID NO. 16은 Nitab4.5_0003151g0080.2의 아미노산 서열에 상응한다.
SEQ ID NO. 17은 Nitab4.5_0003151g0080.2의 코딩 서열에 상응한다.
SEQ ID NO. 18은 Nitab4.5_0003151g0080.2의 게놈 서열에 상응한다.
SEQ ID NO. 19는 Nitab4.5_0002641g0190.2의 아미노산 서열에 상응한다.
SEQ ID NO. 20은 Nitab4.5_0002641g0190.2의 코딩 서열에 상응한다.
SEQ ID NO. 21은 Nitab4.5_0002641g0190.2의 게놈 서열에 상응한다.
SEQ ID NO. 22는 Nitab4.5_0001876g0030.2의 아미노산 서열에 상응한다.
SEQ ID NO. 23은 Nitab4.5_0001876g0030.2의 코딩 서열에 상응한다.
SEQ ID NO. 24는 Nitab4.5_0001876g0030.2의 게놈 서열에 상응한다.
SEQ ID NO. 25는 Nitab4.5_0000048g0280.2의 아미노산 서열에 상응한다.
SEQ ID NO. 26은 Nitab4.5_0000048g0280.2의 코딩 서열에 상응한다.
SEQ ID NO. 27은 Nitab4.5_0000048g0280.2의 게놈 서열에 상응한다.
SEQ ID NO. 28은 Nitab4.5_0002006g0070.2의 아미노산 서열에 상응한다.
SEQ ID NO. 29는 Nitab4.5_0002006g0070.2의 코딩 서열에 상응한다.
SEQ ID NO. 30은 Nitab4.5_0002006g0070.2의 게놈 서열에 상응한다.
SEQ ID NO. 31은 BTB/POZ 동종이량체 도메인의 아미노산 서열(SEQ ID NO. 1의 잔기 39-136)에 상응한다.
SEQ ID NO. 32는 NPH3 도메인의 아미노산 서열(SEQ ID NO. 1의 잔기 218-492)에 상응한다.
SEQ ID NO. 33은 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0000842g0110.2의 아미노산 서열에 상응한다.
SEQ ID NO. 34는 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0000842g0110.2의 코딩 서열에 상응한다.
SEQ ID NO. 35은 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0000842g0110.2의 게놈 서열에 상응한다.
SEQ ID NO. 36은 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0001620g0100.2의 아미노산 서열에 상응한다.
SEQ ID NO. 37은 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0001620g0100.2의 코딩 서열에 상응한다.
SEQ ID NO. 38은 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0001620g0100.2의 게놈 서열에 상응한다.
SEQ ID NO. 39는 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0001200g0070.2의 아미노산 서열에 상응한다.
SEQ ID NO. 40은 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0001200g0070.2의 코딩 서열에 상응한다.
SEQ ID NO. 41은 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0001200g0070.2의 게놈 서열에 상응한다.
SEQ ID NO. 42는 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0005803g0040.2의 아미노산 서열에 상응한다
SEQ ID NO. 43은 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0005803g0040.2의 코딩 서열에 상응한다
SEQ ID NO. 44는 Nitab4.5_0000868g0020.2의 상호작용인자인 Nitab4.5_0005803g0040.2의 게놈 서열에 상응한다
본원에 개시된 일부 서열은 뉴클레오티드 서열에서 "X" 또는 "N"을 함유한다. "X" 또는 "N"은 임의의 뉴클레오티드일 수 있거나 하나 이상의 뉴클레오티드의 결실 또는 삽입일 수 있다. 예를 들어, 어떤 경우에는 "X" 또는 "N"의 문자열이 표시된다. "X" 또는 "N"의 수는 해당 위치의 실제 뉴클레오티드 수와 반드시 상관관계가 있는 것은 아니다. 서열에서 "X" 또는 "N"으로 표시된 것보다 더 많거나 더 적은 뉴클레오티드가 있을 수 있다.
상세한 설명
처음으로 본 발명자들은 식물(예를 들어, 타바코 식물)에서 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 식물(또는 가공된 식물)의 알칼로이드 및/또는 TSNA 전구체 함량이 조절될 수 있음을 입증하였다.
본 발명은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써(예를 들어, 감소시킴으로써) 상기 식물을 변형시키는 것을 포함하는, 식물 또는 이의 일부의 알칼로이드 함량을 조절하는(예를 들어, 감소시키는) 방법을 제공한다.
또한, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써(예를 들어, 감소시킴으로써) 상기 식물을 변형시키는 것을 포함하는, 타바코 식물 또는 이의 식물 일부에서 타바코 특이적 니트로사민(TSNA) 전구체의 함량을 조절하는(예를 들어, 감소시키는) 방법을 제공한다.
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 제시된 바와 같은 아미노산 서열, 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자로부터 선택될 수 있거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함한다.
적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다. 일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 제시된 바와 같은 아미노산 서열 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하는 폴리펩티드를 인코딩하는 유전자의 군으로부터 선택되거나, BTB/POZ 도메인 및 NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 2개의 유전자는 변형된다.
일 구현예에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 3개, 예컨대 적어도 4개, 예컨대 적어도 5개, 예컨대 적어도 6개, 예컨대 적어도 7개, 예컨대 적어도 8개, 예컨대 적어도 9개, 예컨대 적어도 10개 유전자가 조절되는데, 여기서 유전자는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 제시된 바와 같은 아미노산 서열 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하는 폴리펩티드를 인코딩하는 것으로부터 선택되거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다. 일 양태에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 1에 제시된 바와 같은 아미노산 서열 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO.1에 대해 적어도 80%의 동일성을 갖는 서열을 포함하거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2 또는 3에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2 또는 3의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 2 또는 3에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, 폴리펩티드를 인코딩한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
일 양태에서, 적어도 하나의 추가 유전자의 활성 또는 발현이 조절된다. 적합하게는, SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 27 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열로부터 선택되는 적어도 2개(또는 적어도 3개 또는 적어도 4개 또는 적어도 5개 또는 적어도 6개 또는 적어도 7개 또는 적어도 8개 또는 적어도 9개)의 추가 유전자가 또한 조절될 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 "발현"은 전사, 번역, 즉 단백질 발현 수준을 지칭할 수 있다.
유전자 생성물의 수준 또는 양의 측정은 임의의 적합한 방법, 예를 들어 본 발명에 따른 변형된 식물과 변형되지 않는 유사한 식물 사이의 식물의 mRNA 전사 수준, 단백질 또는 펩티드 수준, 및/또는 표현형의 비교에 의해 수행될 수 있다.
본원에 정의된 바와 같은 용어 "유사한 생성물"은 본 발명에 따라 변형되지 않았지만, 모든 다른 관련 특징은 동일한(예를 들어, 식물 종, 성장 조건, 식물 예를 들어, 타바코 가공 방법, 등) 식물(예를 들어, 타바코 식물)로부터 유도된 것일 것이다. 본 발명에 따른 유사한 생성물은, 예를 들어, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 조절하기 위해 본 발명에 따라 변형되지 않은, 식물(예를 들어, 타바코 식물) 또는 이의 일부, 예컨대 잎(예를 들어, 타바코 잎), 수확된 잎(예를 들어, 수확된 타바코 잎), 절단된 수확된 잎(예를 들어, 절단된 수확된 타바코 잎), 가공된 잎(예를 들어, 가공된 타바코 잎) 또는 식물 번식 물질(예를 들어, 타바코 식물 번식 물질), 또는 상기 식물 또는 이의 일부를 포함하는 생성물, 예를 들어 식물로부터 수득가능하거나 수득된 타바코 산업 제품 또는 이의 조합물을 의미할 수 있다. 일 구현예에서, 유사한 생성물은 활성 또는 발현이 조절되지 않은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자를 포함하지 않는 것이다.
본원에 사용된 바와 같은 용어 "변형하는" 또는 "변형된"은 변경되거나 변화된 식물(예를 들어, 타바코 식물) 또는 핵산 서열을 의미한다. 본 발명은 식물의 유전자 변형 또는 식물의 비유전자 변형을 위한 기술을 사용하는 식물의 변형을 포함한다. 이러한 방법은 당업계에 잘 알려져 있으며, 유전자 변형 기술의 예는 형질전환, 유전자전이, 시스제닉 및 유전자 편집 방법을 포함한다. 비유전자 변형 기술의 예로는 고속 중성자 돌연변이 유발, 화학적 돌연변이 유발, 예를 들어, 에틸 메탄설포네이트(EMS) 돌연변이 유발 및 현대 집단 분석 접근 방식을 포함한다.
일 구현예에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 변형된 유전자를 갖는 천연 변이체가 선택되며, 그 형질 또는 유전자가 상업적으로 바람직한 형질을 가질 수 있는 제2 식물로 육종된다.
일 구현예에서, 본 발명에 따른 식물은 유전자전이 식물이다. 일 구현예에서, 본 발명에 따른 식물은 비-유전자전이 식물이다.
본원에 정의된 바와 같은 용어 "비변형된 식물"은 예를 들어, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 조절하기 위해 또는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 핵산 서열을 변형시키기 위해 본 발명에 따라 변형되지 않은 식물(예를 들어, 타바코 식물)일 것이며; 모든 다른 관련 특징은 동일하였다(예를 들어, 식물 종, 재배 조건, 타바코 가공 방법, 등). 일 구현예에서, 비변형된 식물은 활성 또는 발현이 조절된 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자를 포함하지 않는 것이다. 일 구현예에서, 비변형된 식물은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자를 인코딩하는 변형된 핵산 서열을 포함하지 않는 것이다.
BTB/POZ NPH3 도메인-함유 단백질
본원에 사용된 바와 같은 "BTB/POZ NPH3 도메인-함유 단백질"은 당업계의 통상적인 의미를 가지며, BTB/POZ 도메인 및 NPH3 도메인을 포함하는 단백질을 나타낸다. 타바코로부터의 BTB/POZ NPH3 도메인-함유 단백질의 예시적인 서열은 SEQ ID NO. 1에 제시된다.
본원에 사용된 바와 같은 "BTB/POZ 도메인"은 당업계의 통상적인 의미를 가지며, 공동의 단백질 구조 도메인을 나타낸다. BTB/POZ 도메인은 RNA 이량체화, 예컨대 동가동의 이량체화를 매개한다. BTB/POZ 단백질은 분자의 상단 및 하단에서 짧은 베타-시트에 측접한 알파-헬릭스의 클러스터를 포함한다.
BTB는 또한 bric a brac, Broad-Complex, 트램트랙(tramtrack), BR-C, ttk 및 bab로서 언급된다.
POZ는 또한 Pox 바이러스 및 아연 핑거로서 언급된다.
BTB 도메인은 전사 조절, 세포골격 역학, 이온 채널 어셈블리 및 유비퀴틴화를 위한 단백질 게이팅 및 표적화를 포함한 세포 기능에 참여하는 단백질-단백질 상호작용 모티프이다. BTB 폴드는 구조적으로 잘 보존된다.
BTB/POZ 도메인의 예시적인 서열은 SEQ ID NO. 1의 아미노산 39-136로 제시되며, SEQ ID NO. 31로서 또한 제공된다.
BTB/POZ 도메인은 해당 단백질을 SEQ ID NO. 31 및/또는 SEQ ID NO. 1과 비교함으로써 확인할 수 있다.
적합하게는, 본원에 사용된 바와 같은 BTB/POZ 도메인은 SEQ ID NO. 31에 제시된 서열 또는 그에 대해 적어도 80% 동일성을 갖는 서열을 나타낼 수 있다. 적합하게는, 본원에 사용된 바와 같은 BTB/POZ 도메인은 SEQ ID NO. 1과 정렬될 경우 SEQ ID NO. 1의 아미노산 39-156에 상응하는 서열을 나타낼 수 있다.
본원에 사용된 바와 같은 "NPH3 도메인"은 당업계의 통상의 의미를 가지며, 비-향광성 하이포코틸 3 도메인을 나타낸다. NPH3 도메인은 비향광성 하이포코틸 1 세린-트레오닌 단백질 키나제에 대한 어댑터 또는 스캐폴드 단백질로서 기능할 수 있다.
NPH3 도메인은 단백질-단백질 상호작용 모티프이다.
NPH3 도메인의 예시적인 서열은 SEQ ID NO. 1의 아미노산 218-492에 제시되며, 또한 SEQ ID NO. 32로서 제공된다.
NPH3 도메인은 해당 단백질을 SEQ ID NO. 32 및/또는 SEQ ID NO. 1과 비교함으로써 확인될 수 있다.
적합하게는, 본원에 사용된 바와 같은 NPH3 도메인은 SEQ ID NO. 32로 제시된 서열 또는 이에 대해 적어도 80% 동일성을 갖는 서열을 나타낼 수 있다. 적합하게는, 본원에 사용된 바와 같은 NPH3 도메인은 SEQ ID NO. 1과 정렬될 경우 SEQ ID NO. 1의 아미노산 218-492에 상응하는 서열을 나타낼 수 있다.
단백질의 아미노산 서열 내의 도메인은 당업계에 공지된 도메인 예측 소프트웨어를 사용하여 확인될 수 있다. 도메인은 또한 UniprotKB와 같은 단백질 데이터베이스에도 설명되어 있다. 이론에 얽매이지 않으면서, 식물 세포에서 BTB/POZ NPH3 도메인-함유 단백질의 함량을 조절하거나 식물에서 BTB/POZ NPH3 도메인-함유 단백질의 활성, 예컨대 동종이량체화 또는 UDP-글리코실트랜스퍼라제 활성을 조절하면 알칼로이드 및 TSNA 전구체, 예컨대 PON을 생성하는 대사 경로가 변경되어, 조절된 알칼로이드 함량을 발생시킬 것으로 가정된다.
일 구현예에서, BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 1로서 제시된 아미노산 서열 또는 이에 대해 적어도 80%의 동일성을 갖는 서열, 또는 이의 상동체를 포함한다. 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함한다. 적합하게는, SEQ ID NO. 1의 상동체는 SEQ ID NO. 4, 7, 10, 13, 16, 19, 22 25 또는 28, 또는 이에 대해 적어도 80% 동일성을 갖는 서열을 포함하는 군으로부터 선택될 수 있다. 적합하게는, SEQ ID NO. 1의 상동체는 SEQ ID NO. 4, 7, 10, 13, 16, 19, 22, 25 또는 28(여기서 상기 서열은 BTB/POZ 도메인 및 NPH3 도메인을 포함함), 또는 SEQ ID NO. 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하는 군으로부터 선택될 수 있으며, BTB/POZ 도메인 및 NPH3 도메인을 포함한다.
일 구현예에서, BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는, 이에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 일 구현예에서, BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는, 이에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함하며, BTB/POZ 도메인 및 NPH3 도메인을 포함한다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 1로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 4로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 7로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 10으로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 13으로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 16으로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 19로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 22로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 25로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
일 구현예에서, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질은 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로부터 선택된 아미노산 서열을 포함하거나 이로 구성된다.
적합하게는, 단백질은 니코티아나 타바쿰으로부터 유래될 수 있다.
일 구현예에서, 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩되고, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30으로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 2로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 3으로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 5로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 6으로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 8로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 9로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 11로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 12로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 14로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 15로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 17로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 18로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 20으로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 21로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 23으로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 24로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 26으로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 27로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 29로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
적합하게는, 본 발명에 따라 사용하기 위한 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩될 수 있으며, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 30으로서 제시된 서열; 또는 이에 대해 적어도 80% 서열 동일성(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 적어도, 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성)을 갖는 서열을 포함한다. 적합하게는, 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
일 구현예에서, 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질은 폴리뉴클레오티드 서열에 의해 인코딩되고, 여기서 유전자(돌연변이 전)는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30으로부터 선택된다.
적합하게는, 본 발명에 따라 사용하기 위한 단백질은 니코티아나 타바쿰으로부터의 폴리뉴클레오티드 서열에 의해 인코딩될 수 있다.
일 양태에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 감소시키는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키거나 억제시킴으로써 상기 식물을 변형시키는 것을 포함하는 방법을 제공한다.
일 양태에서, 본 발명은 식물 또는 이의 일부 또는 식물 세포의 알칼로이드 함량을 감소시키는 방법으로서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키거나 억제시킴으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
일 양태에서, 본 발명은 식물 또는 이의 일부(예를 들어, 잎)에서 타바코 특이적 니트로사민(TSNA) 전구체의 함량을 감소시키는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키거나 억제시킴으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
일 양태에서, 본 발명은 식물 또는 이의 일부(예를 들어, 잎)에서 타바코 특이적 니트로사민(TSNA) 전구체의 함량을 감소시키는 방법으로서, SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30으로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키거나 억제시킴으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
일 양태에서, 본 발명은 경화된 잎과 같은 가공된 잎에서 TSNA의 함량을 감소시키는 방법으로서,
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키거나 억제시킴으로써 식물을 변형시키는 단계;
상기 식물로부터 잎을 수확하는 단계; 및
상기 수확된 잎을 경화하는 단계를 포함하는, 방법을 제공한다.
적합하게는, 가공된 잎에서 TSNA 함량을 감소시키는 방법은 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30으로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키거나 억제시킴으로써 상기 식물을 변형시키는 것을 포함한다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
본원에 사용된 바와 같은 용어 "감소시키는" 또는 "억제시키는"(예를 들어, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 억제시키는)은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현이 유사 생성물 중 유전자의 활성 또는 발현과 비교하여 저하되거나 감소됨을 의미한다.
일 양태에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 증가시키는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 증가시키거나 향상시킴으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
일 양태에서, 본 발명은 식물 또는 이의 일부 또는 식물 세포의 알칼로이드 함량을 증가시키는 방법으로서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 증가시키거나 향상시킴으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및/또는 NPH3 도메인을 포함할 수 있다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 BTB/POZ 도메인 및 NPH3 도메인을 포함할 수 있다.
일 양태에서, 본 발명은 식물 또는 이의 일부(예를 들어, 잎)에서 타바코 특이적 니트로사민(TSNA) 전구체의 함량을 증가시키는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 증가시키거나 향상시킴으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
일 양태에서, 본 발명은 식물 또는 이의 일부(예를 들어, 잎)에서 타바코 특이적 니트로사민(TSNA) 전구체 함량을 증가시키는 방법으로서, SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30으로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 증가시키거나 향상시킴으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
본원에 사용된 바와 같은 용어 "증가시키는" 또는 "향상시키는"(예를 들어, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 증가시키는)은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현이 유사 생성물에서의 유전자의 활성 또는 발현과 비교하여 높아지거나 증가됨을 의미한다.
본 발명에 따라, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현이 조절된다.
일 양태에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 조절(즉, 증가 또는 감소)하는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성을 조절(즉, 증가 또는 감소)함으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
용어 "활성"은 적어도 하나의 유전자에 의해 인코딩된 BTB/POZ NPH3 도메인-함유 단백질의 임의의 기능성을 나타낸다. 활성의 예는 BTB/POZ NPH3 도메인-함유 단백질의 단백질:단백질 상호작용의 형성, 효소 활성 또는 국소화를 포함한다.
적합하게는, 활성은 또 다른 분자 또는 분자들과 상호작용하는 BTB/POZ NPH3 도메인-함유 단백질의 능력일 수 있다. 일부 구현예에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 조절(즉, 증가 또는 감소)하는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질이 또 다른 분자와 상호작용하는 능력을 조절(즉, 증가 또는 감소)함으로써 상기 식물을 변형시키는 것을 포함하는 방법을 제공한다.
적합하게는, BTB/POZ NPH3 도메인-함유 단백질이 다른 분자와 상호작용하는 능력은 다른 분자에 결합하는 능력일 수 있다. 다른 분자는 또 다른 BTB/POZ NPH3 도메인-함유 단백질과 같은 단백질일 수 있다. 적합하게는, 다른 분자는 하나 초과의 분자, 예컨대 하나 이상의 분자, 예컨대 2개 이상의 분자, 예컨대 3개 이상의 분자일 수 있다. 다른 분자가 하나 초과의 분자인 경우, 다른 분자는 동일한 분자일 수 있거나 상이한 분자일 수 있다.
적합하게는, 활성은 동종이량체화하는 BTB/POZ NPH3 도메인-함유 단백질의 능력일 수 있다. 일부 구현예에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 조절(즉, 증가 또는 감소)하는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질이 동종이량체화하는 능력을 조절(즉, 증가 또는 감소)함으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
적합하게는, 활성은 UDP-글리코실트랜스퍼라제로서 기능하는 BTB/POZ NPH3 도메인-함유 단백질의 능력일 수 있다. 일부 구현예에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 조절(즉, 증가 또는 감소)하는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질이 UDP-글리코실트랜스퍼라제로서 기능하는 능력을 조절(즉, 증가 또는 감소)함으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성의 조절은 BTB/POZ NPH3 도메인-함유 단백질의 활성을 증가 또는 감소시키는 것을 수반할 수 있다.
BTB/POZ NPH3 도메인-함유 단백질의 활성 증가는 본 발명에 따라 변형되지 않은 식물에서의 BTB/POZ NPH3 도메인-함유 단백질과 비교하여 특정 기능을 수행하는 BTB/POZ NPH3 도메인-함유 단백질의 능력을 향상 또는 증가시키는 것을 나타낸다.
BTB/POZ NPH3 도메인-함유 단백질의 활성 감소는 본 발명에 따라 변형되지 않은 식물에서의 BTB/POZ NPH3 도메인-함유 단백질과 비교하여 특정 기능을 수행하는 BTB/POZ NPH3 도메인-함유 단백질의 능력을 감소, 억제 또는 파괴하는 것을 나타낸다. BTB/POZ NPH3 도메인-함유 단백질의 활성은 활성이 방지되거나 제거될 정도로 감소될 수 있다.
일부 구현예에서, BTB/POZ NPH3 도메인-함유 단백질의 활성은 본 발명에 따라 변형되지 않은 식물(예를 들어, 타바코 식물)에서의 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성과 비교하여 적어도 약 10%, 20%, 30% 또는 40%, 적합하게는 적어도 약 50%, 60%, 70%, 더욱 적합하게는 적어도 약 80%, 90%, 95% 또는 100% 조절(즉, 증가 또는 감소)될 수 있다.
일부 구현예에서, 조절된 BTB/POZ NPH3 도메인-함유 단백질은 비변형된 BTB/POZ NPH3 도메인-함유 단백질과 비교하여 증가되거나 감소된 활성을 나타낸다. 조절된 BTB/POZ NPH3 도메인-함유 단백질은 비변형된 BTB/POZ NPH3 도메인-함유 단백질과 비교하여 적어도 약 1%, 적어도 약 3%, 적어도 약 5%, 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80% 또는 적어도 약 90% 증가된 또는 감소된 활성을 나타낼 수 있다.
단백질 활성을 측정하기 위한 기술은 당업계에 알려져 있다. 예를 들어, 단백질의 효소 활성을 측정하기 위한 검정법은 알려져 있으며, 단백질의 국소화는 현미경 기술을 사용하여 확인될 수 있다.
특히, 또 다른 분자에 결합하는 BTB/POZ NPH3 도메인-함유 단백질의 능력은 당업계에 공지된 기술을 사용하여 측정될 수 있다. 이러한 기술의 예로는 면역침전, 등온 열량계, 표면 플라즈몬 공명 및 마이크로규모 열영동을 포함한다. 예를 들어, 다른 분자에 결합하는 조절되거나 변이된 BTB/POZ NPH3 도메인-함유 단백질의 능력은 예를 들어, 조절된 또는 변이된 BTB/POZ NPH3 도메인-함유 단백질 및 상응하는 비변형된 또는 비변이된 BTB/POZ NPH3 도메인-함유 단백질을 사용하여 공동-면역침전 실험을 수행함으로써 결정될 수 있다. BTB/POZ NPH3 도메인-함유 단백질의 조절 또는 돌연변이가 다른 분자에 결합하는 BTB/POZ NPH3 도메인-함유 단백질의 능력을 감소, 억제 또는 제거하는 경우, 공동-면역침전은 조절되거나 변이된 BTB/POZ NPH3 도메인-함유 단백질이 더 적게 다른 분자에 결합한다는 것을 보여줄 것이다.
동종이량체화하는 BTB/POZ NPH3 도메인-함유 단백질의 능력은 당업계에 공지된 기술을 사용하여 측정될 수 있다. 이러한 기술의 예는 천연 조건 하의 겔 전기 영동, 크기 배제 크로마토그래피, 확산 핵 자기 공명(NMR) 또는 분석적 초원심분리와 같은 기술을 포함한다. 본 발명에 따르면, BTB/POZ NPH3 도메인-함유 단백질의 활성 또는 발현은 조절된다.
일 양태에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 조절(즉, 증가 또는 감소)하는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 발현을 조절(즉, 증가 또는 감소)함으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
유전자의 "발현"은 유전자에 인코딩된 정보가 기능으로 전환되는 정도를 나타낸다. 유전자의 발현 수준은 세포 또는 유기체에 존재하는 해당 유전자의 생성물의 양과 동등할 수 있다. 유전자의 발현을 조절(즉, 증가 또는 감소)하는 변형은 비변형된 식물 또는 세포와 비교하여 식물 또는 세포에서 해당 유전자의 생성물의 양을 증가시키는 변형이다.
일부 구현예에서, BTB/POZ NPH3 도메인-함유 단백질의 발현은 본 발명에 따라 변형되지 않은 식물(예를 들어, 타바코 식물)에서 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 발현과 비교하여 조절(즉, 증가 또는 감소)된다.
일부 구현예에서, BTB/POZ NPH3 도메인-함유 단백질의 발현은 본 발명에 따라 변형되지 않은 식물(예를 들어, 타바코 식물)에서 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 발현과 비교하여 적어도 약 10%, 20%, 30% 또는 40%, 적합하게는 적어도 약 50%, 60%, 70%, 더욱 적합하게는 적어도 약 80%, 90%, 95% 또는 100% 조절(즉, 증가 또는 감소)될 수 있다.
일부 구현예에서, 조절된 BTB/POZ NPH3 도메인-함유 단백질은 비변형된 BTB/POZ NPH3 도메인-함유 단백질과 비교하여 증가되거나 감소된 발현을 나타낸다. 조절된 BTB/POZ NPH3 도메인-함유 단백질은 비변형된 BTB/POZ NPH3 도메인-함유 단백질과 비교하여 적어도 약 1%, 적어도 약 3%, 적어도 약 5%, 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80% 또는 적어도 약 90% 증가된 또는 감소된 발현을 나타낼 수 있다.
일반적으로, 유전자는 mRNA로 전사되고, 이는 최종 유전자 생성물인 단백질로 번역된다. 단백질은 세포 저장소에 격리되고/거나 분해될 수 있다. 유전자의 발현은 이들 단계 중 일부 또는 전부를 조절함으로써 조절될 수 있다. 따라서, 일부 구현예에서 변형은 하기 방식 중 하나로 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 발현을 조절한다:
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자로부터의 전사를 조절;
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자로부터 mRNA의 번역을 조절;
세포내 저장으로부터 BTB/POZ NPH3 도메인-함유 단백질의 방출 조절; 및/또는
BTB/POZ NPH3 도메인-함유 단백질의 분해 속도 조절.
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 특정 유전자의 발현은 유전자의 전사 및/또는 번역을 측정함으로써 측정될 수 있다. 전사 측정 방법은 당업계에 잘 알려져 있으며, 특히 노던 블롯, RNA-Seq, 원위 혼성화, DNA 마이크로어레이 및 RT-PCR을 포함한다. 대안적으로, 유전자의 발현은 유전자 생성물, 예를 들어 상기 유전자에 의해 인코딩된 단백질의 수준을 측정함으로써 간접적으로 측정될 수 있다. 예를 들어, BTB/POZ NPH3 도메인-함유 단백질의 발현은 웨스턴 블롯에 의해 BTB/POZ NPH3 도메인-함유 단백질에 특이적인 항체(예를 들어, BTB/POZ, NPH3 도메인에 특이적인 항체)를 사용하여 단백질의 존재를 측정함으로써 결정될 수 있다.
변형
식물 또는 세포는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하는 임의의 방식으로 변형될 수 있다. 유전자의 활성 또는 발현을 조절하는 식물 및 세포에 대한 변형 유형은 물론 이러한 변형을 달성하는 기술은 당업계에 공지되어 있다.
일부 구현예에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 감소시키는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키거나 억제시킴으로써 상기 식물을 변형시키는 것을 포함하는, 방법을 제공한다.
일부 구현예에서, 본 발명은 타바코 식물 또는 이의 식물 일부에서 타바코 특이적 니트로사민(TSNA) 또는 TSNA의 전구체의 함량을 감소시키는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시킴으로써 상기 식물 또는 세포 배양물을 변형시키는 것을 포함하는, 방법을 제공한다.
유전자의 활성 또는 발현을 감소시키거나 억제하기 위해 당업계에 공지된 임의의 방법이 본 발명에 따른 방법에 사용될 수 있다.
적합하게는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 단백질 활성, 발현 또는 기능이 검출가능하지 않도록 감소, 부분적으로 불활성화, 억제, 제거, 녹아웃 또는 손실될 수 있다.
일 양태에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 녹아웃된다. 다시 말해, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자는 완전히 작동하지 않게 되었다.
예를 들어, 본 방법은 다음을 포함할 수 있다:
· SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산 서열에 돌연변이 제공;
· SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질의 발현 조절에 기여하는 조절 영역(예를 들어, 프로모터 또는 인핸서)에 돌연변이를 제공;
· SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산 서열의 수준을 감소시키는 안티센스 RNA, siRNA 또는 miRNA 제공.
상기 접근법 각각은 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, 단백질의 활성 또는 발현의 감소 또는 방지를 발생시킨다.
본원에 사용된 바와 같은 용어 "돌연변이"는 천연 유전자 변이체 또는 조작된 변이체를 포함한다. 특히, 용어 "돌연변이"는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 서열 또는 이에 대해 적어도 80%(바람직하게는 적어도 85%, 바람직하게는 적어도 90%, 바람직하게는 적어도 93%, 바람직하게는 적어도 95%, 바람직하게는 적어도 98%, 바람직하게는 적어도 99%) 서열 동일성을 갖는 아미노산 서열과 비교하여 아미노산 서열에서 또는 아미노산 서열을 인코딩하는 뉴클레오티드 서열에서의 변이를 나타낸다.
일 구현예에서, 돌연변이는 식물의 알칼로이드 함량을 감소시킨다. 또 다른 구현예에서, 돌연변이는 식물 또는 이의 일부, 또는 잎, 예컨대 수확된 또는 가공된 잎에서 적어도 하나의 TSNA 전구체의 함량을 감소시킨다. 일 구현예에서, 돌연변이는 NNK, NNN, NAT, NAB로부터 선택된 하나 이상의 TSNA의 함량을 감소시키고, 바람직하게는 NNK 함량은 가공된 잎에서 감소된다. 적합하게는, TSNA 함량은 유사한 생성물에 비해 감소된다.
일 구현예에서, 본 발명에 따른 방법은 핵산 서열을 식물 또는 이의 일부 또는 식물 세포에 제공하는 것을 포함할 수 있으며, 여기서 상기 핵산은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현의 감소 또는 제거를 발생시킨다.
일 구현예에서, 본 발명에 따른 방법은 핵산 서열을 식물 또는 이의 일부 또는 식물 세포에 제공하는 것을 포함할 수 있으며, 여기서 상기 핵산은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 핵산 서열의 변형을 발생시킨다.
적합하게는 상기 핵산 서열은 식물 또는 이의 일부 또는 세포에 도입될 수 있다. 적합하게는 식물 또는 이의 일부 또는 세포에서 내인성 핵산 서열이 본 발명에 따른 폴리펩티드를 인코딩하도록 변형될 수 있다(예를 들어, 유전자 편집에 의해). 예를 들어, 내인성 뉴클레오티드 서열은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키도록 변형될 수 있다.
바람직한 구현예에서, 식물에 존재하는, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 서열 또는 이에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, 단백질을 인코딩하는 핵산 서열을 각 복사체가 변형되며, 예를 들어, 본원에 정의된 바와 같이 변이된다(예를 들어, 식물에서 상기 단백질을 인코딩하는 유전자의 각 게놈 복사체가 변이된다). 예를 들어, 니코티아나 타바쿰의 이질사배체 게놈에 있는 유전자의 각 복사체가 변이될 수 있다.
바람직한 구현예에서, 본원에 기재된 BTB/POZ NPH3 도메인-함유 단백질의 상동체의 일부 또는 전부가 변형, 예를 들어 억제 또는 변이된다. 적합하게는, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 상응하는 서열의 일부 또는 모두가 변형, 예를 들어 억제 또는 변이된다.
일부 구현예에서, 본 발명에 따른 식물 또는 식물 세포는 동형접합성이다. 적합하게는, 식물 또는 식물 세포는 변형, 예를 들어, 억제 또는 돌연변이에 대해 동형접합성일 수 있다.
일부 구현예에서, 본 발명에 따른 식물 또는 식물 세포는 단지 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 변형된, 예를 들어, 변이된 핵산만을 발현한다. 다시 말해서, 일부 구현예에서, 내인성(또는 내인성 및 기능성 단백질)은 본 발명에 따른 식물에 존재하지 않는다. 즉, 임의의 내인성 단백질이 존재하는 경우, 이는 바람직하게는 불활성 형태로 존재한다.
일 구현예에서, 본 방법은 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30으로서 제시된 핵산, 또는 이에 대해 적어도 80% 동일성을 갖는 핵산 서열에 돌연변이를 제공하는 것을 포함할 수 있다.
돌연변이는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산 서열이 완전하게 또는 부분적으로 제거되거나 달리 변형되어 동종이량체화하는 BTB/POZ NPH3 도메인-함유 단백질의 능력을 억제하거나 결실되도록 식물 게놈을 변경시킬 수 있다. 일부 구현예에서, 돌연변이는 단백질의 수준 또는 발현을 변경하지 않지만, 동종이량체화하는 BTB/POZ NPH3 도메인-함유 단백질의 능력을 감소, 억제 또는 제거한다. 발현 "억제 또는 제거"는 BTB/POZ NPH3 도메인-함유 단백질이 모노머 형태에 우세하게 존재함을 의미한다.
적합하게는, 돌연변이는 BTB/POZ NPH3 도메인-함유 단백질의 BTB/POZ 도메인에 있을 수 있다. 적합하게는, 돌연변이는 BTB/POZ NPH3 도메인-함유 단백질의 NPH3 도메인에 있을 수 있다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질은 각각 상이한 도메인에 다중 돌연변이를 포함할 수 있다. 일부 구현예에서, BTB/POZ 도메인에서의 돌연변이는 BTB/POZ NPH3 도메인-함유 단백질이 동종이량체화하는 능력을 변형시킨다. 적합하게는, 돌연변이는 동종이량체화를 방지하거나 감소시킬 수 있다. 적합하게는, BTB/POZ 도메인에서의 돌연변이는 동종이량체화를 방지하거나 감소시키고, BTB/POZ NPH3 도메인-함유 단백질의 활성을 감소시킨다.
돌연변이는 BTB/POZ NPH3 도메인-함유 단백질의 하나 이상의 도메인, 예컨대 BTB/POZ 도메인 및/또는 NPH3 도메인에 있을 수 있다. 일부 구현예에서, BTB/POZ NPH3 도메인-함유 단백질의 하나 이상의 도메인, 예컨대 BTB/POZ 도메인 및/또는 NPH3 도메인은 변이되어 BTB/POZ NPH3가 동종이량체화하는 능력을 변형시킬 수 있다. 일부 구현예에서, 하나 이상의 도메인, 예컨대 BTB/POZ 도메인 및/또는 NPH3 도메인은 BTB/POZ NPH3 도메인-함유 단백질로부터 결실된다.
돌연변이는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산 서열을 중단시킬 수 있다.
중단으로 인해 핵산 서열은 전사되고/거나 번역되지 않을 수 있다.
핵산 서열은 예를 들어, 단백질의 번역이 감소되거나 방지되도록 핵산 서열의 ATG 시작 코돈을 결실시키거나 달리 변형시킴으로써 중단될 수 있다.
핵산 서열은 단백질의 발현을 감소 또는 방지하거나 단백질 트래피킹에 영향을 미치는 하나 이상의 뉴클레오티드 변화(들)를 포함할 수 있다. 예를 들어, 단백질의 발현은 오픈 리딩 프레임에서 하나 이상의 미성숙 정지 코돈, 프레임 이동, 스플라이스 돌연변이 또는 비내성 아미노산 치환의 도입에 의해 감소되거나 방지될 수 있다.
미성숙 정지 코돈은 정지 코돈을 오픈 리딩 프레임에 도입하고 전체 아미노산 서열의 번역을 방지하는 돌연변이를 나타낸다. 조기 정지 코돈은 TAG("앰버"), TAA("오커"), 또는 TGA("오팔" 또는 "엠버") 코돈일 수 있다.
프레임-이동 돌연변이(또한, 프레임 오류 또는 리딩 프레임 이동으로 불림)는 3으로 나눌 수 없는 핵산 서열에서 다수의 뉴클레오티드의 삽입결실(삽입 또는 결실)로 인해 초래되는 돌연변이이다. 코돈에 의한 유전자 발현의 삼중항 특성으로 인해, 삽입 또는 결실은 리딩 프레임을 변경하여 원래의 것과 완전히 상이한 번역을 발생시킬 수 있다. 프레임이동 돌연변이는 종종 돌연변이 후 코돈의 판독을 초래하여 상이한 아미노산을 코딩하게 할 것이다. 프레임이동 돌연변이는 일반적으로 조기 정지 코돈의 도입을 발생시킬 것이다.
스플라이스 돌연변이는 전구체 메신저 RNA가 성숙한 메신저 RNA로 프로세싱되는 동안 스플라이싱이 발생하는 특정 부위에서 다수의 뉴클레오티드를 삽입, 결실 또는 교체시킨다. 스플라이싱 부위의 결실은 하나 이상의 인트론이 성숙한 mRNA에 남아있게 하고, 비정상 단백질의 생성으로 이어질 수 있다.
비-내성(non-tolerated) 아미노산 치환은 단백질의 기능을 감소시키거나 제거하는 단백질에서의 비-동의 아미노산 치환을 초래하여 돌연변이를 지칭한다.
핵산 서열에서 돌연변이를 제공하기 위해 당업계에 공지된 임의의 방법이 본 발명에 따른 방법에 사용될 수 있다. 예를 들어, 관련 핵산 서열(들)이 변이되고 식물 또는 식물 세포를 형질전환시키는데 사용되는 벡터가 생성되는 상동 재조합이 이용될 수 있다. 그 후, 변이된 서열을 발현하는 재조합 식물 또는 식물 세포가 선택될 수 있다.
일 구현예에서, 돌연변이는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 단백질에서 비-내성 아미노산 치환을 도입한다.
일부 구현예에서, BTB/POZ 도메인은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 발현을 감소시키는 돌연변이를 함유할 수 있다.
일부 구현예에서, NPH3 도메인은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 발현을 감소시키는 돌연변이를 함유할 수 있다.
돌연변이는 결실, 스플라이스 돌연변이체 또는 비-내성 아미노산 치환을 인코딩하는 코돈일 수 있다.
일 구현예에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 핵산 서열은 전체적으로 또는 부분적으로 결실될 수 있다. 결실은 연속적일 수 있거나 서열의 복수 절편을 포함할 수 있다. 결실은 바람직하게는 핵산 서열이 더 이상 기능성 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하지 않도록 충분한 양의 뉴클레오티드 서열을 제거한다. 결실은 전체일 수 있으며, 이 경우 유사한 비변형된 식물의 상응하는 게놈와 비교하여 핵산 서열의 코딩 부분의 100%가 부재한다. 예를 들어, 결실은 핵산 서열의 코딩 부분의 적어도 50, 60, 70, 80 또는 90%를 제거할 수 있다. 적합하게는, 단백질의 적어도 일부가 결실될 수 있다. 예를 들어, 결실은 단백질의 코딩 부분의 적어도 10, 20, 30, 40, 50, 60, 70, 80 또는 90%를 제거할 수 있다.
결실은 BTB/POZ 도메인의 적어도 일부를 제거할 수 있다. 예를 들어, 결실은 BTB/POZ 도메인의 적어도 10, 20, 30, 40, 50, 60, 70, 80 또는 90%를 제거할 수 있다. 적합하게는, 결실은 BTB/POZ 도메인의 적어도 5개 아미노산, 적어도 10개 아미노산, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개 아미노산을 제거할 수 있다. 적합하게는, 결실은 NPH3 도메인의 적어도 5개 아미노산, 적어도 10개 아미노산, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개 아미노산을 제거할 수 있다.
결실은 NPH3 도메인의 적어도 일부를 제거할 수 있다. 예를 들어, 결실은 NPH3 도메인의 적어도 10, 20, 30, 40, 50, 60, 70, 80 또는 90%를 제거할 수 있다. 적합하게는, 결실은 BTB/POZ 도메인의 적어도 5개 아미노산, 적어도 10개 아미노산, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개 아미노산을 제거할 수 있다. 적합하게는, 결실은 NPH3 도메인의 적어도 5개 아미노산, 적어도 10개 아미노산, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개 아미노산을 제거할 수 있다.
식물에서 핵산 서열을 결실시키는 방법은 당업계에 공지되어 있다. 예를 들어, 관련 핵산 서열(들)이 소실되고 식물 또는 식물 세포를 형질전환시키는데 사용되는 벡터가 생성되는 상동 재조합이 이용될 수 있다. 그 후, 서열의 새로분 부분을 발현하는 재조합 식물 또는 식물 세포가 선택될 수 있다.
본원에 기술된 바와 같은 벡터로 형질전환된 식물 세포는 잘 알려진 조직 배양 방법, 예컨대 필요 성장 인자 예컨대, 아미노산, 식물 호르몬, 비타민 등이 보충된 적합한 배양 배지에서 세포를 배양함으로써 성장하고 유지될 수 있다.
핵산 서열의 변형은 표적화된 돌연변이유발 방법(또한, 표적화된 뉴클레오티드 교환(TNE) 또는 올리고-선택적 돌연변이유발(ODM)로서 언급됨)을 이용하여 수행될 수 있다. 표적화된 돌연변이유발 방법은 비제한적으로, 아연 핑거 뉴클레아제, TALEN(WO2011/072246 및 WO2010/079430 참조), Cas9-유사, Cas9/crRNA/tracrRNA, Cas9/gRNA, 또는 기타 CRISPR 시스템(WO 2014/071006 및 WO2014/093622 참조), 메가뉴클레아제(WO2007/047859 및 WO2009/059195 참조)를 사용하는 방법, 또는 유전자에 대한 서열 상보성으로 돌연변이유발을 향상시키기 위해 가능하게는, 화학적으로 변형된 뉴클레오티드를 식물 원형질체에 함유하는 돌연변이유발성 올리고뉴클레오티드를 사용하는 표적화된 돌연변이유발 방법을 포함한다(예를 들어, KeyBase® 또는 TALEN).
대안적으로, 돌연변이유발 시스템 예컨대, TILLING (Targeting Induced Local Lesions IN Genomics; McCallum et al. (2000) Nat. Biotech. 18:455, and McCallum et al. (2000) Plant Physiol. 123, 439-442, 둘 모두 본원에 인용으로 통합됨)은 돌연변이를 갖는 단백질을 인코딩하는 유전자를 포함하는 식물 계통을 생성하는데 사용될 수 있다. TILLING는 전통적인 화학적 돌연변이유발(예를 들어, 무작위 돌연변이를 생성하는 에틸 메탄설포네이트(EMS) 돌연변이유발) 이어서, 돌연변이를 위한 고처리량 스크리닝을 사용한다. 따라서, 요망되는 돌연변이를 갖는 유전자를 포함하는 식물, 종자, 세포 및 조직이 수득될 수 있다.
방법은 식물 종자의 돌연변이유발(예를 들어, EMS 돌연변이유발), 식물 개체 또는 DNA의 풀링, 관심 영역의 PCR 증폭, 이종이중체 형성 및 고처리량 검출, 돌연변이체 식물의 확인, 돌연변이체 PCR 생성물의 시퀀싱의 단계를 포함할 수 있다. 다른 돌연변이유발 및 선택 방법이 이러한 변형된 식물을 생성하기 위해 동등하게 사용될 수 있음이 이해된다. 종자는 예를 들어, 방사선 조사되거나 화학적으로 처리될 수 있으며, 식물은 변형된 표현형에 대해 스크리닝될 수 있다.
고속 중성자 결실 돌연변이유발은 내인성 유전자에 결실이 있는 식물 계통을 확인하기 위해 역유전학 센스(즉, PCR 사용)에 사용될 수 있다. 예를 들어, 본원에 인용으로 통합된 문헌 [Ohshima et al. (1998) Virology 213:472-481; Okubara et al. (1994) Genetics 137:867-874; and Quesada et al. (2000) Genetics 154:421-4315] 참조.
또 다른 접근법에서, 우성 돌연변이체는 유전자 역전 및 복제된 유전자좌의 재조합으로 인한 RNA 침묵을 촉발하는 데 사용될 수 있다. 예를 들어, 문헌 [Kusaba et al. (2003) Plant Cell 15:1455-1467] 참조 (인용으로 본원에 통합됨).
변형된 식물은 DNA에 존재하는 돌연변이(들)와 같은 분자 방법에 의해 및 변형된 표현형 특징에 의해 비변형된 식물, 즉 야생형 식물로부터 구별될 수 있다. 변형된 식물은 변형에 대해 동형접합성 또는 이형접합성일 수 있다. 바람직하게는, 변형된 식물은 변형에 대해 동형접합성이다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질의 활성 또는 발현을 감소시키거나 방지하는 방법은 식물을 확학물질(예를 들어, 농약)로 처리하는 것을 포함하지 않는다.
발현을 감소시키거나 방지하는 다른 방법은 당업자에게 명백할 것이며, 바이러스-유도된 유전자 침묵(VIG), 마이크로 RNA 침묵, RNAi, 안티센스, tDNA 삽입, 또는 우세한 음성 작제물(또는 반형 돌연변이)의 사용을 포함할 것이다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 바이러스 유도 유전자 침묵에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 마이크로RNA에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 RNAi에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 안티센스 억제에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 센스 억제에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 tDNA 삽입에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 우세한 음성 작제물(또는 반형 돌연변이)에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 표적화된 돌연변이유발 기반 시스템에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 CRISPR 기반 시스템에 의해 감소 또는 제거될 수 있다.
일 구현예에서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열, 또는 이에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질을 인코딩하는 유전자의 발현은 아연 핑거 뉴클레아제, TALEN, 메가뉴클레아제, 돌연변이유발 올리고뉴클레오티드 또는 TILLING에 의해 감소 또는 제거될 수 있다.
일부 구현예에서, 본 발명은 식물 또는 이의 일부 또는 세포(예를 들어, 식물 세포)의 알칼로이드 함량을 증가시키는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 증가시키거나 향상시킴으로써 상기 식물을 변형시키는 것을 포함하는 방법을 제공한다.
유전자의 활성 또는 발현을 증가시키거나 향상시키기 위해 당업계에 공지된 임의의 방법이 본 발명에 따른 방법에 사용될 수 있다.
일부 구현예에서, 방법은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자를 과발현하는 것을 포함할 수 있다. 적합하게는, 방법은 식물 또는 세포에서 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 하나 이상의 추가의 복사체를 발현하는 것을 포함할 수 있다. 적합하게는, 방법은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 내인성 복사체를 변형시켜 이의 발현을 증가시키는 것을 포함할 수 있다. 방법은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 코딩 서열을 변이시키는 것을 포함할 수 있다. 방법은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 발현을 조절하는 조절 서열을 변이시키는 것을 포함할 수 있다.
적합하게는, 방법은 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 제시된 바와 같은 아미노산 서열, 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하거나; 적어도 하나의 내인성 BTB/POZ NPH3 도메인-함유 단백질을 촉진하거나 증가시킬 수 있는 단백질을 인코딩하는 뉴클레오티드 서열을 포함하는 유전자 작제물로 식물(예를 들어, 타바코 식물)의 세포를 형질전환시키는 것을 포함할 수 있다. 이러한 옵셕 각각은 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질에 의해 인코딩된 폴리펩티드의 증가된 활성 및 발현을 발생시킬 것이라는 점이 이해될 것이다. 방법은 형질전환된 세포로부터 식물을 재생하는 것을 포함할 수 있다. 작제물로 형질전환된 식물 또는 이의 일부 또는 세포에서 알칼로이드 함량(예를 들어, 니코틴 함량)을 증가시키기 위해 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자에 의해 인코딩되는 폴리펩티드의 활성 및/또는 발현을 증가시킬 수 있는 유전자 작제물의 용도가 제공된다.
유전자 작제물은, 아미노산 서열 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28, 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, 폴리펩티드를 인코딩할 수 있다.
또 다른 구현예에서, 본 발명은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성을 증가시킴으로써 상기 식물 또는 세포를 변형시키는 것을 포함하는, 식물 또는 이의 일부 또는 세포의 알칼로이드 함량을 증가시키는 방법에 관한 것이다.
일 구현예에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자에 돌연변이를 도입(또는 제공)함으로써 증가될 수 있다.
적합하게는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성은, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 제시된 바와 같은 아미노산 서열, 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자에 돌연변이를 도입함으로써 증가될 수 있다.
일부 구현예에서, 변형은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 증가시키고 이에 의해 하기 중 하나에 의해 알칼로이드 함량을 증가시킨다:
BTB/POZ NPH3 도메인-함유 단백질을 코딩하는 적어도 하나의 유전자로부터의 전사 조절;
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자로부터 mRNA의 번역 조절;
세포내 저장으로부터 BTB/POZ NPH3 도메인-함유 단백질의 방출 조절; 및/또는
BTB/POZ NPH3 도메인-함유 단백질의 분해 속도 조절.
일 양태에서, BTB/POZ NPH3 도메인-함유 단백질의 활성 및/또는 발현은 상호작용인자 단백질의 활성 또는 발현을 조정함으로써 조절될 수 있으며, 예를 들어 감소될 수 있다.
이론에 얽매이지 않고, 일 양태에서, 상호작용인자 단백질은 상기 BTB/POZ NPH3 단백질의 활성 및/또는 발현을 감소 또는 차단할 수 있다. 예를 들어, 상호작용인자 단백질은 BTB/POZ NPH3 단백질에 결합되고/거나 격리할 수 있고; 따라서 상호작용인자 단백질의 활성 및/또는 발현을 증가시키는 것은 BTB/POZ NPH3 도메인-함유 단백질의 활성 및/또는 발현을 감소시킬 수 있다.
대안적 양태에서, 상호작용인자 단백질은 BTB/POZ NPH3 단백질의 활성 및/또는 발현을 증가 또는 향상시킬 수 있다. 예를 들어, 상호작용인자 단백질은 BTB/POZ NPH3 단백질에 대한 공동-인자로서 작용할 수 있고; 따라서 상호작용인자 단백질의 활성 및/또는 발현을 감소시키는 것은 BTB/POZ NPH3 도메인-함유 단백질의 활성 및/또는 발현을 감소시킬 수 있다.
일 양태에서, BTB/POZ NPH3 단백질의 활성 및/또는 발현은 상호작용인자 단백질의 활성 및/또는 발현을 조정함으로써 조절(예를 들어, 감소)될 수 있다.
적합하게는, 상호작용인자 단백질은 SEQ ID NO. 33, SEQ ID NO. 36, SEQ ID NO. 39, SEQ ID NO. 42 또는 이에 대해 적어도 80% 동일성(예컨대, 적어도 85% 동일성, 적어도 90% 동일성, 적어도 95% 동일성, 적어도 97% 동일성, 적어도 98% 동일성)을 갖는 이의 변이체로부터 선택될 수 있다.
적합하게는, 상호작용인자 단백질은 SEQ ID NO. 34, SEQ ID NO. 37. SEQ ID NO. 40, SEQ ID NO. 43 또는 이에 대해 적어도 80% 동일성(예컨대, 적어도 85% 동일성, 적어도 90% 동일성, 적어도 95% 동일성, 적어도 97% 동일성, 적어도 98% 동일성)을 갖는 이의 변이체로부터 선택되는 코딩 서열을 가질 수 있다.
적합하게는, 상호작용인자 단백질은 SEQ ID NO. 35, SEQ ID NO. 38. SEQ ID NO. 41, SEQ ID NO. 44 또는 이에 대해 적어도 80% 동일성(예컨대, 적어도 85% 동일성, 적어도 90% 동일성, 적어도 95% 동일성, 적어도 97% 동일성, 적어도 98% 동일성)을 갖는 이의 변이체로부터 선택되는 뉴클레오티드 서열에 의해 인코딩될 수 있다.
알칼로이드 함량
일 구현예에서, 본 발명은 식물(예를 들어, 타바코 식물) 또는 이의 일부의 알칼로이드 함량을 조절하는 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 상기 식물을 변형시키는 것을 포함하는 방법을 제공한다.
용어 "조절"은 증가 또는 감소를 의미하기 위해 본원에서 사용된다.
용어 "알칼로이드 함량 증가"는 본 발명의 생성물(예를 들어, 식물, 이의 일부(예를 들어, 잎), 가공된 잎 또는 식물로부터 제조된 제품(예를 들어, 타바코 산업 제품))에서 알칼로이드 함량이 본 발명에 따라 변형되지 않은 유사한 생성물과 비교하여 더 높음을 의미하고자 본원에서 사용된다.
용어 "알칼로이드 함량 감소"는 본 발명의 생성물(예를 들어, 식물, 이의 일부(예를 들어, 잎), 가공된 잎 또는 식물로부터 제조된 제품(예를 들어, 타바코 산업 제품))에서 알칼로이드 함량이 본 발명에 따라 변형되지 않은 유사한 생성물과 비교하여 더 낮음을 의미하고자 본원에서 사용된다.
일부 구현예에서, 알칼로이드 함량의 조절은 알칼로이드 함량의 증가를 나타내며, 여기서 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현이 증가된다(또는 다른 말로, 단백질이 과발현된다).
일부 구현예에서, 알칼로이드 함량의 조절은 알칼로이드 함량의 감소를 나타내며, 여기서 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 발현은 감소되거나 억제되거나 제거된다.
추가의 양태에서, 알칼로이드 함량은 잎으로부터 측정된다. 일 양태에서, 알칼로이드 함량은 녹색 잎으로부터 측정된다. 추가의 양태에서, 알칼로이드 함량은 경화된 잎, 예를 들어 공기-경화된, 연도(flue)-경화된, 화염-경화된 또는 태양-경화된 잎으로부터 측정된다. 추가의 양태에서, 알칼로이드 함량은 연도-경화된 잎으로부터 측정된다. 추가의 양태에서, 알칼로이드 함량은 공기-경화된 잎으로부터 측정된다.
용어 "알칼로이드 함량"은 알칼로이드로 분류되는 화합물의 전체 그룹의 농도 및/또는 총량 또는 알칼로이드로 분류되는 하나 이상의 화합물의 농도 및/또는 총량을 의미하기 위해 본원에서 사용된다. 타바코에 일반적으로 존재하는 알칼로이드에는 니코틴, 노르니코틴, PON, 아나타빈, 아나바신 및 미오스민이 포함된다. 일부 구현예에서, 니코틴, 노르니코틴, PON, 아나타빈, 아나바신 및 미오스민으로부터 선택되는 하나 이상의 알칼로이드, 예컨대 2개 이상의 알칼로이드, 예컨대 3개 이상의 알칼로이드, 예컨대 4개 이상의 알칼로이드, 예컨대 5개 이상의 알칼로이드, 예컨대 모두 6개의 알칼로이드의 함량이 조절된다. 일부 구현예에서, 니코틴, 노르니코틴, PON, 아나타빈, 아나바신 및 미오스민으로부터 선택되는 하나 이상의 알칼로이드, 예컨대 2개 이상의 알칼로이드, 예컨대 3개 이상의 알칼로이드, 예컨대 4개 이상의 알칼로이드, 예컨대 5개 이상의 알칼로이드, 예컨대 모두 6개의 알칼로이드의 함량이 증가된다. 일부 구현예에서, 니코틴, 노르니코틴, PON, 아나타빈, 아나바신 및 미오스민으로부터 선택되는 하나 이상의 알칼로이드, 예컨대 2개 이상의 알칼로이드, 예컨대 3개 이상의 알칼로이드, 예컨대 4개 이상의 알칼로이드, 예컨대 5개 이상의 알칼로이드, 예컨대 모두 6개의 알칼로이드의 함량이 감소된다. 일부 구현예에서, 식물 또는 세포의 총 알칼로이드 함량은 조절된다. 일부 구현예에서, 총 알칼로이드 함량은 증가된다. 일부 구현예에서, 총 알칼로이드 함량은 증가된다.
일 구현예에서, 니코틴 함량은 실질적으로 감소되지 않으나, PON, 노르니코틴, 아나타빈, 아나바신 및 미오스민으로부터 선택되는 하나 이상의 알칼로이드의 함량은 조절된다.
일 구현예에서, 니코틴 함량은 실질적으로 감소되지 않으나, PON, 노르니코틴, 아나타빈 및 아나바신으로부터 선택되는 하나 이상의 알칼로이드의 함량은 조절된다. 적합하게는, 니코틴의 함량은 조절되지 않을 수 있으나, PON의 함량은 조절된다. 적합하게는, 니코틴 함량은 실질적으로 감소되지 않을 수 있으나, PON의 함량은 감소된다.
알칼로이드의 농도 및/또는 총 함량을 결정하기 위한 당업계에 공지된 임의의 방법이 사용될 수 있다. 알칼로이드 함량을 분석하기 위한 한 바람직한 방법은 가스 크로마토그래피-불꽃 이온화 검출 방법(GC-FID) 또는 탠덤 질량 분광법을 이용한 역상 고성능 액체 크로마토그래피(LC-MS/MS)에 의한 분석을 포함한다.
일 구현예에서, 식물(예를 들어, 타바코 식물) 또는 이의 일부, 식물 번식 물질(예를 들어, 타바코 식물 번식 물질), 세포(예를 들어, 타바코 세포), 잎(예를 들어, 타바코 잎), 수확된 잎(예를 들어, 수확된 타바코 잎), 절단된 수확된 잎(예를 들어, 절단된 수확된 타바코 잎), 가공된 잎(예를 들어, 가공된 담배 잎), 절단되고 가공된 잎(예를 들어, 절단되고 가공된 타바코 잎), 알칼로이드 함량이 조절된 본 발명의 식물에 의해 수득가득하거나 수득된 상기 식물 또는 이의 일부(예를 들어, 타바코 산업 제품) 또는 이의 조합물을 포함하는 생성물을 생성하는 방법으로서, 상기 식물을 변형하여 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 조절하는 것을 포함하는 방법이 제공된다. 조절된 알칼로이드 함량은 식물(예를 들어, 타바코 식물) 또는 이의 일부, 식물 번식 물질(예를 들어, 타바코 식물 번식 물질), 세포(예를 들어, 타바코 세포), 잎(예를 들어, 타바코 잎), 수확된 잎(예를 들어, 수확된 타바코 잎), 절단된 수확된 잎(예를 들어, 절단된 수확된 타바코 잎), 가공된 잎(예를 들어, 가공된 타바코 잎), 절단되고 가공된 잎(예를 들어, 절단되고 가공된 타바코 잎), 본 발명의 식물 또는 이의 일부를 포함하는 생성물, 예를 들어, 타바코 산업 제품, 또는 이들의 조합의 알칼로이드 함량을 유사한 생성물과 비교함으로써 결정될 수 있다.
적합하게는, 알칼로이드 함량은 식물, 예를 들어 타바코 식물, 예를 들어 변형된 타바코 식물에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 잎(예를 들어, 타바코 잎, 예를 들어 변형된 타바코 식물로부터의 타바코 잎)에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 수확된 잎(예를 들어, 변형된 타바코 식물로부터의 수확된 타바코 잎)에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 절단된 수확된 잎(예를 들어, 변형된 타바코 식물로부터의 절단된 수확된 타바코 잎)에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 가공된 잎(예를 들어, 가공된 타바코 잎, 예를 들어 변형된 타바코 식물의 가공된 타바코 잎)에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 절단되고 가공된 잎(예를 들어, 절단되고 가공된 타바코 잎, 예를 들어 변형된 타바코 식물로부터의 절단되고 가공된 타바코 잎)에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 경화된 잎(예를 들어, 변형된 타바코 식물로부터의 경화된 타바코 잎)에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 녹색 잎(예를 들어, 변형된 타바코 식물로부터의 녹색 타바코 잎)의 추출물에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 본 발명의 식물 또는 이의 일부를 포함하는 제품(예를 들어, 타바코 산업 제품, 예를 들어 변형된 타바코 식물 또는 이의 일부로부터 생성된 타바코 산업 제품)에서 조절될 수 있다. 적합하게는, 알칼로이드 함량은 상기 제품 중 어느 하나 또는 이의 조합에서 조절될 수 있다. 적합하게는, 상기 기술된 알칼로이드 함량의 조절은 알칼로이드 함량의 증가일 수 있다. 적합하게는, 상기 기술된 알칼로이드 함량의 조절은 알칼로이드 함량의 감소(예를 들어, PON 함량의 감소)일 수 있다.
일 구현예에서, 노르니코틴, PON, 아나타빈 및 아나바신으로부터 선택되는 하나 이상의 알칼로이드의 함량이 감소된다. 일 구현예에서, PON의 함량이 감소된다. 일 구현예에서, 노르니코틴의 함량이 감소된다. 일 구현예에서, 아나타빈의 함량이 감소된다. 일 구현예에서, 아나바신의 함량이 감소된다.
일 구현예에서, 니코틴의 함량은 실질적으로 조절되지 않는다. 적합하게는, 상기 기술된 알칼로이드 함량의 조절은 노르니코틴, PON, 아나타빈 및 아나바신으로부터 선택된 하나 이상의 알칼로이드 함량의 감소일 수 있으나, 니코틴 함량의 감소는 아닐 수 있다.
일 구현예에서, 변형된 식물(예를 들어, 타바코 식물), 식물 번식 물질(예를 들어, 담배 식물 번식 물질), 잎(예를 들어, 타바코 잎), 수확된 잎(예를 들어, 수확된 타바코 잎), 절단된 수확된 잎(예를 들어, 절단된 수확된 타바코 잎), 가공된 잎(예를 들어, 가공된 타바코 잎), 절단되고 가공된 잎(예를 들어, 절단되고 가공된 타바코 잎) 또는 변형된 타바코 식물로부터의 담배 산업 제품의 니코틴 함량은 실질적으로 감소하지 않는다. 적합하게는, 니코틴 함량은 유사 생성물의 니코틴 함량의 적어도 85%(예컨대, 적어도 90%, 예컨대 적어도 95%, 예컨대 적어도 98%, 예컨대 적어도 99%)이다.
일 구현예에서, 식물(예를 들어, 타바코 식물) 또는 이의 일부의 알칼로이드 함량은, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하도록 변형되지 않으며, 유사한 성장 조건에서 성장한 식물(예를 들어, 타바코 식물) 또는 이의 일부의 알칼로이드 함량과 각각 비교할 경우 적어도 0.5, 1.5, 2, 3 또는 4배 조절될 수 있다. 적합하게는, 알칼로이드 함량은 약 0.5배 내지 약 4배 조절될 수 있다. 적합하게는, 알칼로이드 함량은 약 4배 조절될 수 있다. 적합하게는, 변형은 알칼로이드 함량의 증가 또는 감소일 수 있다. 적합하게는, 조절은 니코틴, 노르니코틴, PON, 아나타빈, 아나바신 및 미오스민으로부터 선택되는 하나 이상의 알칼로이드의 조절일 수 있다. 적합하게는, 조절은 니코틴, 노르니코틴, PON, 아나타빈 및 아나바신으로부터 선택되는 하나 이상의 알칼로이드의 조절일 수 있다. 적합하게는, 노르니코틴 함량이 감소될 수 있다. 적합하게는, PON 함량이 감소될 수 있다. 적합하게는, 아나타빈 함량이 감소될 수 있다. 적합하게는, 아나바신 함량이 감소될 수 있다.
본 발명의 일 구현예에서, 식물(예를 들어, 타바코 식물) 또는 이의 일부의 알칼로이드 함량은 본 발명에 따라 변형되지 않은 식물(예를 들어, 타바코 식물) 또는 이의 일부와 비교하여 적어도 1%, 2%, 5%, 8%, 10%, 12%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 조절될 수 있다. 일 구현예에서, 알칼로이드 함량은 비변형된 식물 또는 이의 일부와 비교하여 적어도 30% 조절될 수 있다. 일 구현예에서, 알칼로이드 함량은 비변형된 식물 또는 이의 일부와 비교하여 적어도 40% 조절될 수 있다. 일 구현예에서, 알칼로이드 함량은 비변형된 식물 또는 이의 일부와 비교하여 적어도 50% 조절될 수 있다. 일 구현예에서, 알칼로이드 함량은 비변형된 식물 또는 이의 일부와 비교하여 적어도 60% 조절될 수 있다. 조절은 비변형된 식물(예를 들어, 타바코 식물) 또는 이의 일부와 비교할 경우 알칼로이드 함량의 증가 또는 감소일 수 있다.
적합하게는, 조절은 총 알칼로이드 함량의 조절일 수 있다. 적합하게는, 조절은 니코틴, 노르니코틴, PON, 아나타빈, 아나바신 및 미오스민으로부터 선택되는 하나 이상의 알칼로이드의 조절일 수 있다. 적합하게는, 조절은 노르니코틴, 니코틴, PON, 아나타빈 및 아나바신으로부터 선택되는 하나 이상의 알칼로이드의 조절일 수 있다. 적합하게는, 조절은 노르니코틴 함량의 감소와 같은 노르니코틴 함량의 조절일 수 있다. 적합하게는, 조절은 아나바신 함량의 감소와 같은 아나바신 함량의 조절일 수 있다. 적합하게는, 조절은 PON 함량의 감소와 같은 PON 함량의 조절일 수 있다. 적합하게는, 조절은 아나타빈 함량의 감소와 같은 아나타빈 함량의 조절일 수 있다.
적합하게는, 조절은 니코틴, 노르니코틴, PON, 아나타빈, 아나바신 및 미오스민으로부터 선택되는 하나 초과의 알칼로이드, 예컨대 2개 이상의 알칼로이드, 예컨대 3개 이상의 알칼로이드, 예컨대 4개 이상의 알칼로이드, 예컨대 5개 이상의 알칼로이드, 예컨대 모두 6개의 알칼로이드의 조절일 수 있다.
일부 구현예에서, 식물의 알칼로이드 함량은 약 5% 내지 약 100%, 약 10% 내지 약 90%, 약 20% 내지 약 80%, 약 30% 내지 약 70%, 약 40% 내지 60%, 약 40% 내지 50%, 또는 약 50% 내지 60% 조절될 수 있다.
타바코-특이적 니트로사민(TSNA) 함량
일 구현예에서, 본 발명은 식물(예를 들어, 타바코 식물) 또는 이의 일부에서 적어도 하나의 타바코-특이적 니트로사민(TSNA) 전구체의 함량을 감소시키는 방법을 제공한다. 적합하게는, 방법은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 상기 식물을 변형시키는 것을 포함할 수 있다. 일 구현예에서, 본 발명은 (예를 들어, 유사한 생성물과 비교하여) 감소된 TSNA 함량을 갖는 가공된 잎을 생성하는 방법을 제공한다. 감소된 TSNA 함량을 갖는 가공된 잎을 생성하는 방법은
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소시키거나 억제시킴으로써 식물을 변형시키는 단계;
상기 식물로부터 잎을 수확하는 단계; 및
상기 수확된 잎을 경화하는 단계를 포함할 수 있다.
TSNA는 가공된 타바코, 예를 들어 경화된 타바코 또는 재구성된 타바코에서 측정될 수 있다. 일 구현예에서, TSNA 함량은 경화된 타바코 식물 또는 이의 일부(예를 들어, 경화된 타바코 잎에서)에서 측정 및/또는 조정(예를 들어, 감소)된다.
본원에 사용된 바와 같은 용어 "타바코-특이적 니트로사민" 또는 "TSNA"는 당업계의 통상적인 의미를 가지며, 즉 타바코 산업 제품 또는 기타 니코틴-함유 제품에서만 발견되는 니트로사민을 의미한다. 적합하게는, 적어도 하나의 타바코-특이적 니트로사민은 4-(메틸니트로사미노)-1-(3-피리딜)-1-부타논(NNK), N'-니트로소노르니코틴(NNN), N'-니트로소아나타빈(NAT) 또는 N-니트로소아나바신(NAB)일 수 있다.
적어도 하나의 타바코-특이적 니트로사민과 관련하여 사용되는 경우 용어 "이에 대한 전구체"는 타바코-특이적 니트로사민의 형성을 발생시키거나 니트로소화 반응과 관련되어 타바코-특이적 니트로사민 생성으로 이어지는 타바코 식물의 하나 이상의 화학물질 또는 화합물을 나타낸다.
일 구현예에서, TSNA는 N'-니트로소노르니코틴(NNN), N'니트로소아나타빈(NAT), N'-니트로소아나바신(NAB) 및 4-(메틸 니트로사미노)-1-(3-피리딜)-1-부타논(NNK)로부터 선택되는 군 중 하나 이상일 수 있다. 적합하게는, 적어도 하나의 타바코-특이적 니트로사민은 NNK 또는 NNN일 수 있다. 일 구현예에서, 타바코-특이적 니트로사민은 NNK이다.
일 구현예에서, TSNA의 전구체는 노르니코틴, 아나바신, 아나타빈 및 니코틴의 산화된 유도체, 예컨대 슈도옥시니코틴(PON)으로부터 선택되는 군 중 하나 이상이다.
일 구현예에서, TSNA는 4-(메틸니트로사미노)-1-(3-피리딜)-1-부타논(NNK))이고/거나 전구체는 PON이다. 일 구현예에서, NNK의 함량은 감소된다. 일 구현예에서, PON의 함량은 감소된다. 일 구현예에서, NNK 및 PON의 함량은 감소된다.
일 구현예에서, TSNA는 N'니트로소노르니코틴(NNN)이고/거나 전구체는 노르니코틴이다.
일 구현예에서, TSNA는 N'니트로소아나타빈(NAT)이고/거나 전구체는 아나타빈이다.
일 구현예에서, TSNA는 N'-니트로소아나바신(NAB)이고/이거나 전구체는 아나바신이다.
TSNA의 전구체(예를 들어, NNK, NNN, NAB 및/또는 NAT)는 예를 들어 가공 전, 예를 들어 경화 전에 녹색 타바코 잎에서 측정될 수 있다. 일 구현예에서, TSNA의 전구체(예를 들어, NNK, NNN, NAB 및/또는 NAT)는 예를 들어 가공 전에, 예를 들어 경화 전에 녹색 타바코 잎에서 측정 및/또는 변형(예를 들어 감소)된다.
일 구현에에서, 본 발명의 방법 및/또는 사용을 수행하는 것은 본 발명에 따라 변형되지 않은 타바고 식물(또는 이의 일부)과 비교할 경우 변형된 타바코 식물(또는 이의 일부)에서 적어도 하나의 TSNA 또는 이에 대한 전구체의 감소를 발생시킨다.
용어 "적어도 하나의 TSNA 또는 이에 대한 전구체를 감소시키는" 또는 "적어도 하나의 TSNA 또는 이에 대한 전구체의 감소"는, 본 발명의 생성물, 방법 또는 용도에서 적어도 하나의 TSNA 또는 이에 대한 전구체의 농도 및/또는 총 함량이 유사한 생성물, 방법 또는 용도와 관련하여 낮아짐을 의미하는 것으로 본원에 사용된다. 예를 들어, 유사한 타바코 산업 제품은 본 발명에 따라 변형되지 않으며, 모든 다른 관련 특징(예를 들어, 식물 종, 성장 조건, 가공 타바코 방법 등)은 동일한 타바코 식물로부터 유래될 것이다.
적어도 하나의 TSNA 또는 이에 대한 전구체의 농도 및/또는 수준을 결정하기 위한 당업계에 공지된 임의의 방법이 사용될 수 있다. 특히, 이러한 방법은 중수소 표지된 내부 표준의 첨가, 수성 추출 및 여과를 포함할 수 있으며, 이어서 탠덤 질량 분광법(LC-MS/MS)을 이용한 역상 고성능 액체 크로마토그래피(LC-MS/MS)을 사용하는 분석법이 이용될 수 있다. 타바코-특이적 니트로사민에 대한 전구체의 농도 및/또는 수준을 결정하기 위한 한 예는 CORESTA 권장 방법 CRM-72: LC-MS/MS에 의한 타바코 및 타바코 생성물 중 타바코 특이적 니트로사민의 결정(CRM은 ISO/DIS 21766으로 개발중임) 또는 문헌 [Wagner et al. (2005) Analytical Chemistry 77(4), 1001-1006] (이들 모두는 본원에 인용으로 포함됨)에 상세히 설명된 것과 같은 방법을 포함한다.
적합하게는, 적어도 하나의 타바코-특이적 니트로사민 또는 이에 대한 전구체의 농도 및/또는 총 함량은 본 발명의 방법 및/또는 용도를 수행함으로써 감소될 수 있다. 적합하게는, 적어도 하나의 타바코-특이적 니트로사민 또는 이에 대한 전구체의 농도 및/또는 수준은 본 발명에 따라 변형되지 않은 타바코 식물에서 적어도 하나의 타바코-특이적 니트로사민(들) 또는 이에 대한 전구체의 농도 및/또는 수준과 비교할 경우 본 발명의 타바코 식물(예를 들어, 본 발명의 방법 및/또는 용도에 의해 수득가능하거나 수득됨)에서 감소될 수 있다.
적어도 하나의 타바코-특이적 니트로사민(들) 또는 이에 대한 전구체의 농도 및/또는 총 함량은 본 발명에 따라 변형되지 않은 타바코 식물(또는 타바코 식물의 일부 또는 타바코 세포 배양물)로부터 수득가능하거나 수득된 타바코 잎, 수확된 잎, 가공된 타바코 잎, 타바코 산업 제품 또는 이의 조합과 비교할 경우 본 발명의 타바코 식물(또는 타바코 식물의 일부 또는 타바코 세포 배양물)로부터 수득가능하거나 수득되는 타바코 잎, 수확된 잎, 가공된 타바코 잎, 타바코 산업 제품 또는 이의 조합에서 감소될 수 있다.
적합하게는, 적어도 하나의 타바코-특이적 니트로사민 또는 이에 대한 전구체의 농도 및/또는 총 함량은 가공된 타바코 잎에서 감소될 수 있다.
적합하게는, 적어도 하나의 타바코-특이적 니트로사민 또는 이에 대한 전구체의 농도 및/또는 수준은 타바코 산업 제품에서 감소될 수 있다.
일 구현예에서, 적어도 하나의 타바코-특이적 니트로사민 또는 이에 대한 전구체는 적어도 약 1%, 적어도 약 3%, 적어도 약 5%, 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40% 또는 적어도 약 50% 감소될 수 있다. 일부 구현예에서, 적어도 하나의 타바코-특이적 니트로사민 또는 이에 대한 전구체는 약 5% 내지 약 50%, 약 10% 내지 약 50%, 약 20% 내지 약 50%, 약 30% 내지 약 50% 또는 약 40% 내지 50% 감소될 수 있다.
가공된(예를 들어, 경화된) 타바코 잎(예를 들어, 경화되거나 재구성됨)과 관련하여, 적어도 하나의 타바코-특이적 니트로사민 또는 이에 대한 전구체는 약 5000 ng/g 내지 약 50 ng/g, 약 4000 ng/g 내지 약 100 ng/g, 약 3000 ng/g 내지 500 ng/g 또는 2000 ng/g 내지 1000 ng/g 감소될 수 있다. 일부 구현예에서, 적어도 하나의 타바코-특이적 니트로사민 또는 이에 대한 전구체는 적어도 약 5000 ng/g, 적어도 약 4000 ng/g, 적어도 약 3000 ng/g, 적어도 약 2000 ng/g, 적어도 약 1000 ng/g, 적어도 약 500 ng/g, 적어도 약 100 ng/g 또는 적어도 약 50 ng/g 감소될 수 있다.
바이오매스 생성
일부 경우에, 높은 알칼로이드 수준, 예를 들어 높은 수준의 니코틴 함량을 갖는 식물 또는 바이오매스를 생성하여 예를 들어, 니코틴이 액체 함유 니코틴(예를 들어, e-담배)을 사용하는 장치 또는 타바코 가열 장치를 사용에 사용하기 위한 순수한 니코틴 생성물을 생성하도록 정제될 수 있는 것이 바람직할 수 있다. 예를 들어, 이러한 방식의 니코틴 생성은 e-담배용 e-액체의 생성을 위한 니코틴 추출 비용을 줄일 수 있다.
일 양태에서, 본 발명은 바이오매스를 생성하기 위한 조건 하에 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 조절(예를 들어, 증가)하도록 조작된 세포를 성장시키는 것을 포함하는 바이오매스를 생성하는 방법을 제공한다. 적합하게는, BTB/POZ NPH3 도메인-함유 단백질의 활성 또는 발현은 농도 및/또는 총 니코틴 함량을 증가시키기 위해 증가될 수 있다.
일 구현예에서, 본 발명은 니코틴의 변형된(예를 들어, 증가된) 농도 및/또는 총 함량을 갖는 바이오매스를 생성하는 방법으로서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 제시된 바와 같은 아미노산 서열, 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 증가시키도록 조작된 세포를 성장시키는 것을 포함하는 방법을 제공한다.
세포는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조정하기 위해 당업계에 공지된 임의의 방법에 의해 조작될 수 있다. 적합하게는, 세포는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 외인성 유전자를 발현하도록 조작될 수 있다. 적합하게는, 세포는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자를 과발현하도록 조작될 수 있다. 적합하게는, 세포는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 감소하도록 조작될 수 있다.
적합하게는, 바이오매스는 본 발명에 따라 변형되지 않은 유사한 세포에 의해 생성된 바이오매스와 비교하여 더 높은 농도 및/또는 총 함량의 니코틴을 함유할 수 있다.
적합하게는, 바이오매스 생성에 사용하기 위한 세포는 식물 세포, 예컨대 타바코 세포일 수 있다.
적합하게는, 바이오매스 생성에 사용하기 위한 세포는 효모 세포일 수 있다.
일 구현예에서, 세포(예를 들어, 효모 세포)는 니코틴성 알칼로이드 생합성을 증가시키는 하나 이상의 서열을 포함하도록 추가로 변형될 수 있다. 적합하게는, 이들 하나 이상의 서열은 세포(예를 들어, 효모 세포) 형질전환에 적합한 핵산 작제물에 혼입될 수 있다. 하나 이상의 서열은 세포(예를 들어, 효모 세포)에서 과발현될 수 있다. 서열은 하기 유전자 중 하나 이상으로부터 선택될 수 있다: MPO (또는 메틸푸트레신 옥시다제 또는 MPO1 또는 MPO2); A622 (또는 이소플라본 환원효소-유사 단백질 또는 이소플라본 환원효소 동족체 또는 이소플라본 환원효소-유사 단백질); BBL (또는 베르베린 브릿지 효소 또는 베르베린 브릿지 효소-유사 또는 BBE 또는 NBB1); PMT(또는 푸트레신 N-메틸트랜스퍼라제 또는 푸트레신 메틸트랜스퍼라제 또는 S-아데노실-L-메티오닌:푸트레신 N-메틸트랜스퍼라제 또는 PMT 또는 PMT1 또는 PMT2 또는 PMT3 또는 PMT4) 및 QPT(또는 퀴놀리네이트 포스포리보실트랜스퍼라제). 일 구현예에서, 서열은 하기 유전자 중 하나 이상으로부터 선택될 수 있다: BBL, A622, PMT 및 MPO (MPO1 또는 MPO2). 이러한 방식의 변형에 적합한 유전자는 예를 들어, 본원에 인용으로 포함되는 US2016032299에 교시될 수 있다.
상업적으로 바람직한 특성
일 구현예에서, 본 발명의 식물은 조정(즉, 증가 또는 감소)된 총 알칼로이드 함량 및/또는 조정(즉, 증가 또는 감소)된 하나 이상의 알칼로이드의 함량을 갖는 반면, 풍미 특성 및/또는 기타 상업적으로 바람직한 특성이 적어도 유지된다. 적합하게는, 본 발명의 식물은 감소된 총 알칼로이드 함량 및/또는 하나 이상의 알칼로이드의 감소된 함량을 갖는 반면, 풍미 특성 및/또는 기타 상업적으로 바람직한 특성은 적어도 유지된다.
일 구현예에서, 본 발명의 식물은 본 발명에 따라 변형되지 않은 식물과 유사한 등급 및/또는 품질의 잎을 생성한다.
일 구현예에서, 본 발명의 식물은 (예를 들어, 본 발명에 따라 변형되지 않은 동일한 식물과 비교하여) 식물의 풍미 특성에 현저한 변화 없이 감소된 노르니코틴 및/또는 PON 및/또는 아나바신 및/또는 아나타빈 함량을 갖는다.
일 구현예에서, 본 발명의 식물은 (예를 들어, 본 발명에 따라 변형되지 않은 동일한 식물과 비교하여) 니코틴 함량의 현저한 변화 없이 감소된 총 알칼로이드 함량을 갖는다. 일 구현예에서, 본 발명의 식물은 (예를 들어, 본 발명에 따라 변형되지 않은 동일한 식물과 비교하여) 니코틴 함량의 현저한 변화 없이 감소된 노르니코틴 및/또는 PON 및/또는 아나바신 및/또는 아나타빈 함량을 갖는다.
적합하게는, 본 발명에 따른 식물의 니코틴 함량은 (예를 들어, 본 발명에 따라 변형되지 않은 동일한 식물과 비교하여) 유사한 식물에 존재하는 니코틴 함량의 적어도 85%이다. 적합하게는, 본 발명에 따른 식물의 니코틴 함량은 유사한 식물에 존재하는 니코틴 함량의 적어도 90%이다. 적합하게는, 본 발명에 따른 식물의 니코틴 함량은 유사한 식물에 존재하는 니코틴 함량의 적어도 95%이다. 적합하게는, 본 발명에 따른 식물의 니코틴 함량은 유사한 식물에 존재하는 니코틴 함량의 적어도 98%이다. 적합하게는, 본 발명에 따른 식물의 니코틴 함량은 유사한 식물에 존재하는 니코틴 함량의 적어도 99%이다.
일 구현예에서, 본 발명의 식물은 (예를 들어, 본 발명에 따라 변형되지 않은 동일한 식물과 비교하여) 식물의 다른 상업적으로 바람직한 특성에서 현저한 변화(예를 들어, 감소) 없이 감소된 TSNA 전구체 함량을 갖는다. 특히, 변형된 식물의 수율은 바람직하게는 본 발명에 따라 변형되지 않은 동일한 식물과 비교하여 감소되지 않는다.
따라서, 일 구현예에서, 본 발명의 방법 및 용도는 TSNA 전구체 함량을 감소시키면서 풍미 특성 및/또는 다른 상업적으로 바람직한 특성(예를 들어, 수율)은 유지시키는 것에 관한 것이다.
본원에 사용된 바와 같은 용어 "상업적으로 바람직한 특성"은 수율, 성숙한 식물 높이, 수확 가능한 잎 수, 평균 마디 길이, 절단 잎 길이, 절단 잎 너비, 품질(예를 들어, 잎 품질, 적절하게 경화된 잎 품질), 비생물적(예를 들어, 가뭄) 스트레스 내성, 제초제 내성 및/또는 생물학적(예를 들어, 곤충, 박테리아 또는 진균류) 스트레스 내성과 같은 특성을 포함할 것이다.
잎 품질은 예를 들어, 미국 농무부(USDA) 등급 및 표준에 따라 경화된 잎의 색상, 질감 및 향을 기준으로 측정될 수 있다.
타바코 등급은 비제한적으로, 잎자루 위치, 잎 크기, 잎 색깔, 잎 균일성 및 온전성, 성숙도, 질감, 탄력성, 광택(잎의 색상의 강도 및 깊이는 물론 광택과 관련됨), 흡습성(타바코 잎이 주변 습기를 흡수하고 유지하는 능력), 및 녹색 뉘앙스 또는 캐스트를 포함하는 인자를 기반으로 하여 평가된다.
잎 등급은 예를 들어, 미국 농무부(7 U.S.C. §511)의 농업 마케팅 서비스(Agricultural Marketing Service)에서 발행한 공식 표준 등급(Official Standard Grade)을 사용하여 당업계에 알려진 표준 방법을 사용하여 결정될 수 있다. 예를 들어, 1990년 11월 5일 발효된 벌리 타바코(Burley Tobacco)의 공식 표준 등급(미국 유형 31 및 외국 유형 93)(55 F.R. 40645); 1989년 3월 27일 발효된 연도 경화된 타바코에 대한 공식 표준 등급(미국 유형 11, 12, 13, 14 및 외국 유형 92) (54 F.R. 7925); 1965년 1월 8일 발효된 펜실바니아 시드리프 타바코(Pennsylvania Seedleaf Tobacco)의 공식 표준 등급(미국 유형 41)(29 F.R. 16854); 1963년 12월 8일 발효된 오하이오 시가-리프 타바코(Ohio Cigar-Leaf Tobacco)의 공식 표준 등급(미국 유형 42, 43 및 44)(28 F.R. 11719 및 28 F.R. 11926); 1969년 11월 20일 발효된 위스콘신 시가-바인더 타바코(Wisconsin Cigar-Binder Tobacco)의 공식 표준 등급(미국 유형 54 및 55)(34 F.R. 17061); 1969년 11월 20일 발효된 위스콘신 시가-바인더 타바코의 공식 표준 등급(미국 유형 54 및 55)(34 F.R. 17061); 1971년 4월 발효된 조지아 및 플로리다 쉐이드그로운 시가-랩퍼 타바코(ShadeGrown Cigar-Wrapper Tobacco)의 공식 표준 등급(미국 유형 62) 참조. USDA 등급 지수 값은 업계에서 허용되는 등급 지수에 따라 결정될 수 있다. 예를 들어, 문헌 [Bowman et al. (1988) Tobacco Science, 32:39-40; Legacy Tobacco Document Library (Bates Document #523267826-523267833, July 1, 1988, Memorandum on the Proposed Burley Tobacco Grade Index); and Miller et al. (1990) Tobacco Intern., 192:55-57] 참조(위의 모든 인용은 그 전체가 본원에 인용됨).
일 양태에서, USDA 등급 지수는 수신된 연방 등급의 0-100 수치 표현이고, 모든 줄기 위치의 가중 평균이다. 더 높은 등급 지수는 더 높은 품질을 나타낸다. 대안적으로, 잎 등급은 하이퍼-스펙트럼 이미징을 통해 결정될 수 있다. 예를 들어, WO 2011/027315(본원에 인용으로 포함됨) 참조.
일 구현예에서, 본 발명의 타바코 식물은 상업적으로 허용되는 등급의 타바코를 제공한다.
적합하게는, 본 발명의 타바코 식물은 상업적으로 허용되는 등급의 경화된 타바코를 제공한다.
일 구현예에서, 본 발명의 타바코 식물은 유사한 성장 조건에서 성장할 경우 유사한 식물의 잎의 USDA 등급 지수의 적어도 약 70%의 USDA 등급 지수 값을 갖는 잎을 생성할 수 있다. 적합하게는, 본원에 개시된 타바코 식물은 유사한 성장 조건에서 성장하는 경우 대조군 식물의 USDA 등급 지수 값의 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 98%의 USDA 등급 지수 값을 갖는 잎을 생성할 수 있다. 적합하게는, 본원에 개시된 타바코 식물은 유사한 식물의 USDA 등급 지수 값의 65% 내지 130%, 70% 내지 130%, 75% 내지 130%, 80% 내지 130%, 85% 내지 130%, 90% 내지 130%, 95% 내지 130%, 100% 내지 130%, 105% 내지 130%, 110% 내지 130%, 115% 내지 130%, 또는 120% 내지 130%의 USDA 등급 지수 값을 갖는 잎을 생성할 수 있다.
일 양태에서, 본 발명의 타바코 식물은 적어도 50의 USDA 등급 지수 값을 갖는 잎을 생성할 수 있다. 적합하게는, 본원에 개시된 타바코 식물은 55 이상, 60 이상, 65 이상, 70 이상, 75 이상, 80 이상, 85 이상, 90 이상 및 95 이상의 USDA 등급 지수 값을 갖는 잎을 생성할 수 있다.
달리 명시되지 않는 한, 본원에 사용된 타바코 수율은 표준 농경학적 및 양생 관행에 따른 표준 현장 조건 하에 에이커 당 경화된 담배 잎의 중량을 기준으로 하여 계산된 경화된 잎 수율을 나타낸다.
일 양태에서, 본 발명의 식물(예를 들어, 타바코 식물)은 유사한 현장 조건에서 성장한 경우 유사한 식물의 수율의 50% 내지 150%, 55% 내지 145%, 60% 내지 140%, 65% 내지 135%, 70% 내지 130%, 75% 내지 125%, 80% 내지 120%, 85% 내지 115%, 90% 내지 110%, 95% 내지 105%, 50% 내지 100%, 55% 내지 100%, 60% 내지 100%, 65% 내지 100%, 70% 내지 100%, 75% 내지 100%, 80% 내지 100%, 85% 내지 100%, 90% 내지 100%, 95% 내지 100%, 100% 내지 150%, 105% 내지 150%, 110% 내지 150%, 115% 내지 150%, 120% 내지 150%, 125% 내지 150%, 130% 내지 150%, 135% 내지 150%, 140% 내지 150%, 또는 145% 내지 150%의 수율을 갖는다.
또 다른 양태에서, 본 발명의 식물(예를 들어, 담배 식물) 수율은 유사한 현장 조건에서 성장할 경우 유사한 식물의 수율의 약 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9 또는 3.0배이다.
또 다른 양태에서, 본 발명의 타바코 식물의 수율은 유사한 현장 조건에서 성장할 경우 연도 경화된 유사한 식물의 수율과 유사하다.
일 양태에서, 본 발명의 타바코 식물은 약 1200 내지 3500, 1300 내지 3400, 1400 내지 3300, 1500 내지 3200, 1600 내지 3100, 1700 내지 3000, 1800 내지 2900, 1900 내지 2800, 2000 내지 2700, 2100 내지 2600, 2200 내지 2500, 및 2300 내지 2400 lbs/acre로 구성된 군으로부터 선택되는 수율을 제공한다.
또 다른 양태에서, 본 발명의 타바코 식물은 약 1200 내지 3500, 1300 내지 3500, 1400 내지 3500, 1500 내지 3500, 1600 내지 3500, 1700 내지 3500, 1800 내지 3500, 1900 내지 3500, 2000 내지 3500, 2100 내지 3500, 2200 내지 3500, 2300 내지 3500, 2400 내지 3500, 2500 내지 3500, 2600 내지 3500, 2700 내지 3500, 2800 내지 3500, 2900 내지 3500, 3000 내지 3500, 및 3100 내지 3500 lbs/acre로 구성된 군으로부터 선택된 수율을 제공한다.
추가 양태에서, 본 발명의 타바코 식물은 약 1200 내지 3500, 1200 내지 3400, 1200 내지 3300, 1200 내지 3200, 1200 내지 3100, 1200 내지 3000, 1200 내지 2900, 1200 내지 2800, 1200 내지 2700, 1200 내지 2600, 1200 내지 2500, 1200 내지 2400, 1200 내지 2300, 1200 내지 2200, 1200 내지 2100, 1200 내지 2000, 1200 내지 1900, 1200 내지 1800, 1200 내지 1700, 1200 내지 1600, 1200 내지 1500, 및 1200 내지 1400 lbs/acre로 구성된 군으로부터 선택되는 수율을 제공한다.
식물 육종
일 구현예에서, 본 발명은 타바코 특이적 니트로사민(TSNA) 전구체의 조정된 함량 및/또는 조정된 알칼로이드 함량을 갖는 식물을 생성하는 방법으로서:
a. 조정된 니코틴 함량 및/또는 조정된 함량의 타바코 특이적 니트로사민(TSNA) 전구체를 갖는 도너 식물을, 조정된 니코틴 함량 또는 조정된 함량의 타바코 특이적 니트로사민(TSNA) 전구체를 갖지 않으며, 상업적으로 바람직한 특성을 갖는 수령체 타바코 식물과 교배하는 단계로서, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현이 본 발명에 따른 도너 식물에서 조절되는, 단계;
b. 상기 수령체 식물과 교배된 상기 도너 식물의 자손으로부터 유전자 물질을 분리하는 단계; 및
c. i. a에서 정의된 단백질을 인코딩하는 폴리뉴클레오티드 서열에서 돌연변이를 포함하는 유전자이입된 영역을 확인하는 것을 포함하는, 분자 마커를 이용하여 분자 마커 보조된 선택을 수행하는 단계를 포함하는 방법을 제공한다.
적합하게는, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 제시된 바와 같은 아미노산 서열, 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열을 포함하는 단백질; 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열에 의해 인코딩된 단백질의 활성 또는 발현이 유사한 식물과 비교할 경우 도너 식물에서 조절된다.
분자 마커 보조된 선택은 PCR을 수행하여 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28로서 제시된 아미노산 서열 또는 이에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 단백질의 활성 또는 발현을 조절하는 돌연변이를 포함하는 교배된 핵산 서열을 확인하는 것을 포함할 수 있다.
식물
일 구현예에서, 본 발명은 식물, 또는 이의 일부 또는 식물 세포에서 알칼로이드 함량을 조절하는(예를 들어, 감소시키는) 방법에 관한 것이다.
본 발명에 따른 적합한 식물은 예를 들어, 짐슨 잡초, 가지, 맨드레이크, 데들리 나이트쉐이드(deadly nightshade)(벨라돈나(belladonna)), 캅시쿰(capsicum)(파프리카, 칠리 페퍼), 감자 및 타바코를 포함하는 가지과 식물을 포함한다.
일 구체예에서, 솔라나세애(Solanaceae)의 적합한 속은 니코티아나, 예를 들어, 니코티아나 타바쿰 또는 니코티아나 루스티카이다.
니코티아나의 적합한 종은 니코티아나 타바쿰일 수 있다. 니코티아나의 종은 본원에서 타바코 식물 또는 단순히 타바코로서 지칭될 수 있다.
타바코 식물
본 발명은 식물(예를 들어, 타바코 식물) 뿐만 아니라 세포(예를 들어, 타바코 세포)에 관한 방법, 용도, 식물(예를 들어, 타바코 식물) 및 식물 번식 물질을 제공한다.
본원에 사용된 바와 같은 용어 "타바코 식물"은 타바코 산업 제품의 생성에 사용되는 니코티아나 속의 식물을 나타낸다. 적합한 "타바코" 식물의 비제한적 예는 N. 타바쿰 및 N. 루스티카(N. rustica)(예를 들어, N. 타바쿰 L., LA B21, LN KY171, Tl 1406, Basma, Galpao, Perique, Beinhart 1000-1 및 Petico)를 포함한다.
일 양태에서, 본 발명에 따른 타바코 식물은 비-천연 발생 타바코 식물이다. 적합하게는, 타바코 식물은 돌연변이, 비-천연 발생 타바코 식물일 수 있다. 적합하게는, 타바코 식물은 유전자전이 타바코 식물일 수 있다.
일 양태에서, 본 발명에 따른 타바코 식물은 본원에 정의된 바와 같은 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질의 활성 또는 발현을 조절(예를 들어, 감소)하는 비-천연 발생 돌연변이를 포함한다. 적합하게는, 타바코 식물은 도입된 돌연변이를 포함할 수 있다.
타바코 물질은 벌리 변종(Burley variety), 연도 또는 브라이트 변종 및 다크 변종으로 일반적으로 알려진 니코티아나 타바쿰 유형의 변종으로부터 유래되거나 수득될 수 있다. 일부 구현예에서, 타바코 물질은 벌리, 버지니아 또는 다크 타바코 식물로부터 유래된다. 타바코 식물은 벌리 타바코, 희귀 타바코, 특수 타바코, 확장 타바코 등으로부터 선택될 수 있다.
적합하게는, 식물은 니코티아나 벤타미아나(Nicotiana benthamiana)일 수 없다.
타바코 품종 및 엘리트 타바코 품종의 사용이 또한 본원에서 고려된다. 따라서, 본원에 사용하기 위한 타바코 식물은 타바코 변종 또는 엘리트 타바코 품종일 수 있다. 특히 유용한 니코티아나 타바쿰 변종은 연도-경화된 버지니아 유형, 벌리 유형 및 오리엔탈 유형을 포함한다.
일부 구현예에서, 타바코 식물은 예를 들어, 하기 변종 중 하나 이상으로부터 선택될 수 있다: L. cultivar(컬티바르) T.I. 1068, AA 37-1, B 13P, Xanthi(잔티) (미첼-모르(Mitchell-Mor)), KT D#3 하이브리드 107, Bel-W3, 79-615, 삼순 홀메스(Samsun Holmes) NN, 크로스 BU21 x 호야 파라도(Hoja Parado)로부터의 F4, 라인 97, KTRDC#2 하이브리드 49, KTRDC#4 하이브리드 1 10, 벌리(Burley) 21, PM016, KTRDC#5 KY 160 SI, KTRDC#7 FCA, KTRDC#6 TN 86 SI, PM021, K 149, K 326, K 346, K 358, K 394, K 399, K 730, KY 10, KY 14, KY 160, KY 17, KY 8959, KY 9, KY 907, MD 609, McNair 373, NC 2000, PG 01, PG 04, P01, P02, P03, RG 11, RG 17, RG 8, 스파이트(Speight) G-28, TN 86, TN 90, VA 509, AS44, 반케트(Banket) A1, 바스마 드라마(Basma Drama) B84/31, 바스마 I 지크나(Basma I Zichna) ZP4/B, 바스마 잔티 BX 2A, 바테크(Batek), 베수키 젬버(Besuki Jember), C104, 코커(Coker) 319, 코커 347, 크리올로 미시오네로(Criollo Misionero), PM092, 델크레스트(Delcrest), 드제벨(Djebel) 81, DVH 405, 갈파오 코뭄(Galpao Comum), HB04P, 힉스 브로드리프(Hicks Broadleaf), 카바쿠락 엘라스소나(Kabakulak Elassona), PM102, 쿠트세이지(Kutsage) E1 , KY 14 x L8, KY 171, LA BU 21, McNair 944, NC 2326, NC 71, NC 297, NC 3, PVH 03, PVH 09, PVH 19, PVH 21 10, 레드 러시안(Red Russian), 삼순, 사플락(Saplak), 심마바(Simmaba), 탈가르(Talgar) 28, PM132, 위슬리카(Wislica), 야얄닥(Yayaldag), NC 4, TR 마돌(TR Madole), 프릴렙(Prilep) HC-72, 프릴렙 P23, 프릴렙 PB 156/1, 프릴렙 P12-2/1, 야카(Yaka) JK-48, 야카 JB 125/3, TI-1068, KDH-960, TI-1070, TW136, PM204, PM205, 바스마, TKF 4028, L8, TKF 2002, TN 90, GR141, 바스마 잔티, GR149, GR153 및 페티트 하바나(Petit Havana).
변종 또는 품종의 비제한적인 예는 다음과 같다: BD 64, CC 101, CC 200, CC 27, CC 301, CC 400, CC 500, CC 600, CC 700, CC 800, CC 900, 코커(Coker) 176, 코커 319, 코커 371 골드, 코커 48, CD 263, DF911, DT 538 LC, 갈파오 타바코(Galpao tobacco), GL 26H, GL 350, GL 600, GL 737, GL 939, GL 973, HB 04P, HB 04P LC, HB3307PLC, 하이브리드 403LC, 하이브리드 404LC, 하이브리드 501 LC, K 149, K 326, K 346, K 358, K394, K 399, K 730, KDH 959, KT 200, KT204LC, KY10, KY14, KY 160, KY 17, KY 171, KY 907, KY907LC, KTY14xL8 LC, 리틀 크리텐덴(Little Crittenden), McNair 373, McNair 944, msKY 14xL8, 내로우 리프 마돌(Narrow Leaf Madole), 내로우 리프 마돌 LC, NBH 98, N-126, N-777LC, N-7371 LC, NC 100, NC 102, NC 2000, NC 291, NC 297, NC 299, NC 3, NC 4, NC 5, NC 6, NC7, NC 606, NC 71, NC 72, NC 810, NC BH 129, NC 2002, 닐 스미스 마돌(Neal Smith Madole), OXFORD 207, PD 7302 LC, PD 7309 LC, PD 7312 LC 'Periq'e' 타바코, PVH03, PVH09, PVH19, PVH50, PVH51, R 610, R 630, R 7-11, R 7-12, RG 17, RG 81, RG H51, RGH 4, RGH 51, RS 1410, 스파이트 168, 스파이트 172, 스파이트 179, 스파이트 210, 스파이트 220, 스파이트 225, 스파이트 227, 스파이트 234, 스파이트 G-28, 스파이트 G-70, 스파이트 H-6, 스파이트 H20, 스파이트 NF3, Tl 1406, Tl 1269, TN 86, TN86LC, TN 90, TN 97, TN97LC, TN D94, TN D950, TR (톰 로슨(Tom Rosson)) 마돌, VA 309, VA359, AA 37-1, B 13P, 잔티 (미첼-모르), Bel-W3, 79-615, 삼순 홀메스 NN, KTRDC 넘버 2 하이브리드 49, 벌리 21 , KY 8959, KY 9, MD 609, PG 01, PG 04, P01, P02, P03, RG 11, RG 8, VA 509, AS44, 반케트 A1, 바스마 드라마 B84/31, 바스마 I 지크나 ZP4/B, 바스마 잔티 BX 2A, 바테크, 베수키 젬버, C104, 코커 347, 크리올로 미시오네로, 델크레스트, 드제벨 81, DVH 405, 갈파오 코뭄, HB04P, 힉스 브로드리프, 카바쿠락 엘라스소나, 쿠트세이지 E1, LA BU 21, NC 2326, NC 297, PVH 21 10, 레드 러시안, 삼순, 사플락, 심마바, 탈가르 28, 위슬리카, 야얄닥, 프릴렙 HC-72, 프릴렙 P23, 프릴렙 PB 156/1, 프릴렙 P12-2/1 , 야카 JK-48, 야카 JB 125/3, TI-1068, KDH-960, Tl-1070, TW136, 바스마, TKF 4028, L8, TKF 2002, GR141, 바스마 잔티, GR149, GR153, 페티트 하바나. 본원에서 구체적으로 확인되지 않더라도 상기의 낮은 컨버터 아변종이 또한 고려된다.
타바코 식물은 벌리, 연도-경화된 버지니아 또는 오리엔탈일 수 있다.
일 구현예에서, 식물 번식 물질은 본 발명의 식물(예를 들어, 타바코 식물)로부터 수득가능할 수 있다.
본원에 사용된 바와 같은 "식물 번식 물질"은 추가의 식물이 생성될 수 있는 식물로부터 취해진 임의의 식물 물질을 나타낸다. 적합하게는, 식물 번식 물질은 종자, 식물 캘리(calli) 및 식물 덩어리로부터 선택될 수 있다. 적합하게는, 식물 번식 물질은 종자일 수 있다. 적합하게는, 식물 번식 물질은 식물 캘리일 수 있다. 적합하게는, 식물 번식 물질은 식물 무리일 수 있다.
일 구현예에서, 세포(예를 들어, 타바코 세포), 타바코 식물 및/또는 식물 번식 물질은 본 발명에 따른 방법에 의해 수득가능할 수 있다(예를 들어, 수득될 수 있다).
적합하게는, 본 발명에 따른 타바코 식물은 비변형된 타바코 식물과 비교할 경우 조절(예를 들어, 감소)된 니코틴 함량을 가질 수 있으며, 여기서 타바코 식물은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절(예를 들어, 감소)하도록 변형되었다.
적합하게는, 본 발명에 따른 타바코 식물은 비변형된 타바코 식물과 비교할 경우 조절(예를 들어, 감소)된 함량의 타바코 특이적 니트로사민(TSNA) 전구체를 가질 수 있으며, 여기서 타바코 식물은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절(예를 들어, 증가)하도록 변형되었다.
일 구현예에서, 본 발명에 따른 타바코 식물은 본 발명의 타바코 세포를 포함한다.
또 다른 구현예에서, 식물 번식 물질은 본 발명의 타바코 식물로부터 수득가능할 수 있다(예를 들어, 수득될 수 있다).
일 구현예에서, 타바코 식물을 육종하기 위해 본원에 기술된 바와 같은 타바코 식물의 용도가 제공된다.
본 발명은 또한 또 다른 구현예에서 타바코 산업 제품의 생성을 위한 상기 구현예의 타바코 식물의 용도를 제공한다.
또 다른 구현예에서, 작물을 재배하기 위한 본 발명의 타바코 식물의 용도가 제공된다.
일 구현예에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 조절된 활성 또는 발현을 갖는 세포, 예컨대 식물 세포, 예컨대 타바코 식물 세포가 제공된다. 적합하게는, 세포는 비-천연 발생 세포일 수 있다. 적합하게는, 세포는 돌연변이 세포일 수 있다. 적합하게는, 세포는 비-천연 발생 돌연변이 세포일 수 있다. 예를 들어, 세포는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하는(예를 들어, 감소시키는) 비-천연 발생 돌연변이를 포함할 수 있다.
일 구현예에서, 타바코 산업 제품의 생성을 위한 상기 구현예에서 제공된 바와 같은 세포의 사용이 제공된다.
일 구현예에서, 본 발명은 세포 배양물(예를 들어, 시험관내 배양물)을 제공한다.
타바코 세포 배양물은 세포 현탁 배양물일 수 있다. 시험관내 배양된 이들 세포는 예를 들어, 통상적인 타바코 입자, 조각, 미세 절단 또는 긴 절단 타바코 박판에 대한 대체물로서, 활성 성분으로서, 또는 대체물 및 첨가제 둘 모두로서 타바코 산업 제품에 포함될 수 있다. 적합하게는, 세포 배양물은 니코틴을 생성할 수 있다.
일 구현예에서, 타바코 산업 제품의 생성을 위한 본 발명에 따른 세포 배양물, 예를 들어 수확되고/거나 가공된 세포 배양물의 용도가 제공된다.
시험관내 배양물로부터 수확된 타바코 세포는 예를 들어, 분말을 생성하기 위해 건조, 예를 들어 동결-건조될 수 있다.
일 구현예에서, 세포 배양물은 타바코 세포 배양물이다. 당업자는 타바코 세포의 시험관내 배양물을 확립하기 위한 공지된 방법을 알고 있을 것이다. 단지 예로서, 다음과 같은 방법이 이용될 수 있다: 관심 타바코 식물에서 종자를 수집하고 원치 않는 유기체를 제거하기 위해 종자 외부를 살균하고, 관심 타바코 식물을 재배하기 위해 상기 종자를 심고, 외식편으로서 사용하기 위한 타바코 식물(예를 들어, 타바코 줄기)로부터 조직을 제거하고, 타바코 외식편으로부터 캘러스 배양물을 학립하고, 칼루스 배양물로부터 세포 현탁 배양물을 확립하고, 배양 물질(예를 들어, 타바코 세포 포함)을 수확하여 타바코 세포 배양물을 생성하기.
타바코 세포는 여과, 예를 들어 진공 여과를 포함하는 다양한 방법에 의해 수확될 수 있다. 샘플은 물을 추가로하여 필터에서 세척될 수 있으며, 잔여 액체는 여과, 예를 들어 진공 여과로 제거될 수 있다.
수확된 타바코 세포 배양물은 추가로 가공될 수 있으며, 예를 들어, 건조, 예컨대 공기-건조 및/또는 동결-건조될 수 있다. 수확된 타바코 세포 배양물 또는 건조된 수확된 타바코 세포 배양물 또는 이로부터의 추출물은 본 발명에 따른 타바코 산업 제품에 혼입될 수 있다.
일 구현예에서, 본 발명은 분자 농업에 사용하기 위한 식물(예를 들어, 타바코 식물) 또는 이의 일부를 제공한다. 적합하게는, 본 발명에 따라 변형된 식물 또는 이의 일부가 예컨대, 치료제, 예를 들어 항생제, 바이러스 유사 입자, 기능식품 또는 소분자와 같은 단백질의 제조에 사용될 수 있다.
일 구현예에서, 본 발명은 단백질(예를 들어, 치료학적 단백질)의 생성을 위한 방법으로서, SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 제시된 바와 같은 아미노산 서열, 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 갖거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자가 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 핵산 서열을 포함하는, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 상기 단백질(예를 들어, 치료학적 단백질)을 생성할 수 있는 식물 또는 이의 일부를 변형시키고, 상기 단백질(예를 들어, 치료학적 단백질)의 생성을 허용하기에 충분한 조건 하에서 식물을 배양하는 것을 포함하는, 방법을 제공한다.
생성물
본 발명은 또한 본 발명에 따른 식물로부터 수득가능하거나 수득된 생성물을 제공한다. BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현이 조절된 식물로부터 수득가능하거나 수득된 생성물이 제공된다.
일 구현예에서, 생성물은 본원에 정의된 바와 같은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하는 본 발명의 작제물을 포함할 수 있다. 일 구현예에서, 생성물은 본원에 정의된 바와 같은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 핵산 서열을 변형시키는 본 발명의 작제물을 포함할 수 있다.
본 발명은 또한 본 발명에 따른 타바코로부터 수득가능하거나 수득된 생성물을 제공한다.
일 구현예에서, 타바코 잎을 생성하기 위한 본 발명의 타바코 식물의 용도가 제공된다.
적합하게는, 타바코 잎은 가공과 같은 하류 적용으로 처리될 수 있다.
따라서, 일 구현예에서, 상기 구현예의 사용은 가공된 타바코 잎을 제공할 수 있다. 적합하게는, 타바코 잎은 경화, 발효, 저온살균 또는 이의 조합으로 처리될 수 있다. 또 다른 구현예에서, 타바코 잎은 절단될 수 있다. 일부 구현예에서, 타바코 잎은 경화, 발효, 저온 살균 또는 이의 조합으로 처리되기 전 또는 후에 절단될 수 있다.
일 구현예에서, 본 발명은 본 발명의 타바코 식물의 수확된 잎을 제공한다.
추가의 구현예에서, 수확된 잎은 본 발명의 번식 물질로부터 번식된 타바코 식물로부터 수득가능할 수 있다(예를 들어, 수득될 수 있다).
또 다른 구현예에서, 본 발명의 방법 또는 용도로부터 수득가능한 수확 잎이 제공된다.
적합하게는, 수확된 잎은 절단된 수확된 잎일 수 있다.
일부 구현예에서, 수확된 잎은 생존가능한 타바코 세포를 포함할 수 있다. 또 다른 구현예에서, 수확된 잎은 추가 가공으로 처리될 수 있다.
또한 가공된 타바코 잎이 제공된다.
가공된 타바코 잎은 본 발명의 타바코 식물로부터 수득가능할 수 있다. 적합하게는, 가공된 타바코 잎은 임의의 본 발명의 방법 및/또는 용도에 따라 수득된 타바코 식물로부터 수득가능할 수 있다.
적합하게는, 가공된 잎은 NNN, NNK, NAT 및 NAB로부터 선택된 하나 이상의 TSNA의 감소된 함량을 포함할 수 있다. 바람직하게는, NNK의 함량이 감소된다. 적합하게는, TSNA 함량 감소는 본 발명에 따라 변형되지 않은 유사한 생성물과 관련이 있다.
또 다른 구현예에서, 가공된 타바코 잎은 본 발명에 따른 타바코 식물 번식 물질로부터 번식된 타바코 식물로부터 수득가능할 수 있다.
본 발명의 가공된 타바코 잎은 본 발명의 수확된 잎을 가공함으로써 수득가능할 수 있다.
본원에 사용된 바와 같은 용어 "가공된 타바코 잎"은 타바코가 당업계에서 처리되는 하나 이상의 가공 단계를 거친 타바코 잎을 나타낸다. "가공된 타바코 잎"은 생존가능한 세포를 포함하지 않거나 실질적으로 포함하지 않는다.
용어 "생존가능한 세포"는 성장할 수 있고/있거나 대사적으로 활성인 세포를 나타낸다. 따라서, 세포가 생존할 수 없다고 한다면, 또한 "비생존"으로서 언급되는 경우, 세포는 생존 가능한 세포의 특성을 나타내지 않는다.
용어 "실질적으로 생존 가능한 세포가 없는"은 총 세포의 약 5% 미만이 생존가능함을 의미한다. 바람직하게는, 총 세포의 약 3% 미만, 더욱 바람직하게는 약 1% 미만, 더욱 더 바람직하게는 약 0.1% 미만이 생존가능하다.
일 구현예에서, 가공된 타바코 잎은 경화, 발효 및/또는 저온 살균 중 어느 하나에 의해 가공될 수 있다.
적합하게는, 가공된 타바코 잎은 경화에 의해 가공될 수 있다.
타바코 잎은 당업계에 공지된 임의의 방법에 의해 경화될 수 있다. 일 구현예어서, 타바코 잎은 공기 경화, 화염 경화, 연도 경화 및 태양 경화로 구성된 군으로부터 선택되는 경화 방법 중 하나 이상에 의해 경화될 수 있다.
적합하게는, 타바코 잎은 공기 경화될 수 있다.
전형적으로, 공기 경화는 통풍이 잘되는 창고에 타바코 잎을 매달아 건조시키는 방식으로 이루어진다. 이는 일반적으로 4주 내지 8주의 기간에 걸쳐 수행된다. 공기 경화는 특히 벌리 타바코에 적합하다.
적합하게는, 타바코 잎은 화염 경화될 수 있다. 화염 경화는 전형적으로 견목의 화염이 지속적으로 또는 간헐적으로 낮은 연기로 유지되는 대형 창고에서 타바코 잎을 매달아 놓아 달성되며, 일반적으로 공정 및 타바코에 따라 3일 내지 10주가 소요된다.
또 다른 구현예에서, 타바코 잎은 연도 경화될 수 있다. 연도 경화는 타바코 잎을 타바코 스틱에 묶고 경화 창고의 단층 기둥에 매달아 놓는 것을 포함할 수 있다. 창고는 일반적으로 외부 공급 화실로부터 나오는 굴뚝을 갖는다. 전형적으로, 이는 연기에 노출되지 않으면서 열-경화되는 타바코를 발생시킨다. 일반적으로, 온도는 경화 과정에 걸쳐 서서히 상승할 것이며, 전체 공정은 약 1주 소요된다.
적합하게는, 타바코 잎은 태양 경화될 수 있다. 이러한 방법은 전형적으로 덮개가 없는 타바코를 태양에 노출시키는 것을 포함한다.
적합하게는, 가공된 타바코 잎은 발효에 의해 가공될 수 있다.
발효는 당업계에 공지된 임의의 방식으로 수행될 수 있다. 전형적으로 발효 동안, 타바코 잎을 수분을 유지하기 위해 예를 들어, 삼베로 덮인 경화 타바코의 더미(벌크)에 쌓는다. 잎 내부에 남아있는 수분과 타바코의 무게의 조합은 타바코를 숙성시키는 천연 열을 발생시킨다. 벌크 중앙의 온도는 매일 모니터링된다. 일부 방법에서, 매주 전체 벌크가 개봉된다. 그 후, 잎을 제거하여 흔들어 축축하게 하고, 벌크를 회전시켜 내부 잎이 바깥으로 가고 바닥 잎은 벌크 상단에 놓이게 한다. 이는 벌크 전반에 걸쳐 균일한 발효를 보장한다. 잎에 추가적인 수분과 잎 자체의 실제 회전은 열을 발생시켜, 타바코의 천연 암모니아를 방출하고 니코틴을 감소시키면서 색상이 진해지게 하고 타바코의 향을 개선한다. 전형적으로, 발효 공정은 타바코의 변종, 잎의 줄기 위치, 잎의 두께 및 의도 용도에 따라 최대 6개월 동안 계속된다.
적합하게는, 가공된 타바코 잎은 저온살균에 의해 가공될 수 있다. 저온살균은 타바코 잎이 무연 타바코 산업 제품, 가장 바람직하게는 스누스를 만드는데 사용될 경우 특히 바람직할 수 있다.
타바코 잎 저온살균은 당업계에 공지된 임의의 방법에 의해 수행될 수 있다. 예를 들어, 저온살균은 문헌 [J Foulds, L Ramstrom, M Burke, K Fagerstrom. Effect of smokeless tobacco (snus) on smoking and public health in Sweden Tobacco Control (2003) 12: 349-359]에 자세히 설명된 대로 수행될 수 있으며, 이의 교시는 인용으로 본원에 포함된다.
스누스의 생성 동안, 저온살균은 전형적으로 타바코가 24-36시간 동안 스팀으로 열 처리되는 공정(약 100℃의 온도에 도달함)에 의해 수행된다. 이는 거의 멸균인 생성물을 발생시키고, 이론에 구속받지 않기를 바라면서, 이의 결과 중 하나는 추가 TSNA 형성의 제한으로 여겨진다.
일 구현예에서, 저온살균은 스팀 저온살균일 수 있다.
일부 구현예에서, 가공된 타바코 잎은 절단될 수 있다. 가공된 타바코 잎은 가공 전 또는 후에 절단될 수 있다. 적합하게는, 가공된 타바코 잎은 가공 후에 절단될 수 있다.
일 구현예에서, 상기 구현예의 사용은 재구성된 타바코를 제공할 수 있다.
일 구현예에서, 재구성된 타바코가 제공된다.
본원에 사용된 바와 같은 "재구성된"은 또한 레콘, 재활용 또는 균질화된 시트 타바코로서 언급될 수 있으며, 처리 후 타바코 잎의 잔여물로부터 생성된 타바코 물질을 나타낸다. 재구성된 타바코는 일관되고 고품질의 블렌드를 생성하게 하며, 개별 구성요소의 비율의 조정을 허용한다.
재구성된 타바코는 나노 섬유 레콘(나노섬유는 고체 또는 액체 형태로 추출될 수 있음), 제지 레콘(원료로서 줄기, 스크랩 및 주맥 등을 사용함) 또는 슬러리 유형 레콘(분말로 분쇄하고, 물과 식물성 결합제와 혼합된 타바코 줄기와 미세물의 혼합물을 사용; 물을 추출함으로써 가용성 잔류물이 시트로 형성됨)일 수 있다.
당업계에 공지된 임의의 방법은 재구성된 타바코를 제조하는데 사용될 수 있으며, 예를 들어, 문헌 [CORESTA Congress, Sapporo, 2012, Smoke Science/Product Technology Groups, SSPT 12](본원에 인용으로 포함됨)을 참조한다.
일부 구현예에서, 타바코 식물, 타바코 식물의 수확된 잎 및/또는 가공된 타바코 잎은 니코틴을 추출하는데 사용될 수 있다. 니코틴의 추출은 당업계에 공지된 임의의 방법을 이용하여 달성될 수 있다. 예를 들어, 타바코로부터 니코틴을 추출하기 위한 방법은 본원에 인용으로 포함되는 US 2,162,738에 교시된다.
일 양태에서, 본 발명은 본 발명에 따른 타바코 식물 또는 이의 일부로부터 제조된 경화된 타바코 물질을 제공한다.
적합하게는, 경화된 타바코는 NNK, NNN, NAT 및 NAB로부터 선택되는 하나 이상의 TSNA의 감소된 함량을 포함할 수 있다. 바람직하게는, NNK의 함량이 감소될 수 있다. 적합하게는, TSNA 함량 감소는 본 발명에 따라 변형되지 않은 유사한 생성물과 관련이 있다.
또 다른 양태에서, 본 발명은 본 발명에 따른 타바코 식물 또는 이의 일부, 또는 본 발명에 따른 타바코 세포 배양물로부터 제조된 타바코 물질을 포함하는 타바코 블렌드를 제공한다. 일 양태에서, 본 발명은 본 발명에 따른 경화된 타바코 물질을 포함하는 타바코 블렌드를 제공한다.
적합하게는, 본 발명에 따른 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% 또는 90% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 10% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 20% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 30% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 40% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 50% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 60% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 70% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 80% 타바코를 포함할 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터의 약 90% 타바코를 포함할 수 있다.
일 양태에서, 본 발명의 타바코 블렌드 생성물은 본 발명에 따른 타바코 식물 또는 이의 일부로부터 또는 본 발명에 따른 타바코 세포 배양물로부터 경화된 타바코를 건조 중량의 적어도 약 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 95 퍼센트 포함한다.
적합하게는, 경화된 타바코 물질은 공기 경화될 수 있다. 적합하게는, 경화된 타바코 물질은 연도 경화될 수 있다. 적합하게는, 경화된 타바코 물질은 태양 경화될 수 있다. 적합하게는, 경화된 타바코 물질은 화염 경화될 수 있다.
본 발명에 따른 타바코 산업 제품 또는 흡연 물품은 본 발명에 따른 타바코 물질(예를 들어, 경화된 타바코 물질 또는 재구성된 타바코 물질)을 포함할 수 있다.
또 다른 양태에서, 본 발명은 타바코 산업 제품을 제공한다.
일 구현예에서, 본 발명에 따른 타바코 산업 제품은 블렌딩된 타바코 산업 제품일 수 있다. 적합하게는, 타바코 블렌드는 본 발명에 따른 경화된 타바코 물질을 포함할 수 있다.
일 구현예에서, 타바코 산업 제품은 본 발명의 타바코 식물 또는 이의 일부로부터 제조될 수 있다.
적합하게는, 타바코 식물 또는 이의 일부는 본 발명에 따른 타바코 식물 번식 물질로부터 번식될 수 있다.
타바코 식물과 관련하여 본원에 사용된 바와 같은 용어 "이의 일부"는 타바코 식물의 일부를 나타낸다. 적합하게는, "이의 일부"는 타바코 식물의 잎, 뿌리 또는 줄기 또는 꽃일 수 있다. 적합하게는, "이의 일부"는 타바코 식물의 잎, 뿌리 또는 줄기일 수 있다.
전달 시스템
본원에서 사용된 바와 같이 용어 "전달 시스템"은 사용자에게 적어도 하나의 물질을 전달하는 시스템을 포함하도록 의도되며, 다음을 포함한다:
가연성 에어로졸 공급 시스템, 예컨대 담배, 시가릴롤, 시가, 및 파이프용 또는 말아피는 담배 또는 수제 담배용 타바코(타바코, 타바코 유도체, 확장된 타바고, 재구성된 타바코, 타바코 치환체 또는 기타 흡연 물질을 기반으로 하는지에 무관함);
에어로졸-발생 물질의 조합물을 사용하여 에어로졸을 발생시키기 위해, 에어로졸-발생 물질을 연소시키지 않으면서 에어로졸-발생 물질로부터 화합물을 방출시키는 불연성 에어로졸 공급 시스템, 예컨대 전자 담배, 타바코 가열 제품 및 하이브리드 시스템; 및
비제한적으로, 로젠지, 검, 패치, 흡입 가능한 분말을 포함하는 물품, 및 스누스 또는 습한 스너프(snuff)를 포함하는 경구 제품, 예컨대 경구 타바코를 포함하는, 에어로졸을 형성하지 않으면서 적어도 하나의 물질을 사용자에게 경구, 비강, 경피 또는 또 다른 방식으로 전달하는 에어로졸 비함유 전달 시스템으로서, 적어도 하나의 물질은 니코틴을 포함할 수 있거나 포함하지 않을 수 있는, 에어로졸 비함유 전달 시스템.
본 개시내용에 따르면, "가연성" 에어로졸 공급 시스템은 사용자에게 적어도 하나의 물질의 전달을 촉진하기 위해 에어로졸 공급 시스템(또는 이의 구성요소)의 구성적 에어로졸-발생 물질이 사용 중에 연소되거나 태워지는 것이다.
일부 구현예에서, 전달 시스템은 담배, 시가릴로 및 시가로 구성된 군으로부터 선택되는 시스템과 같은 가연성 에어로졸 공급 시스템이다.
일부 구현예에서, 본 개시내용은 가연성 에어로졸 공급 시스템, 예컨대 필터, 필터 봉, 필터 세그먼트, 타바코 봉, 스필, 에어로졸-조절제 방출 구성요소, 예컨대 캡슐, 실 또는 비드, 또는 종이, 예컨대 플러그 랩, 팁핑 페이퍼 또는 담배 페이퍼에서 사용하기 위한 구성요소에 관한 것이다.
본 개시내용에 따르면, "불연성" 에어로졸 공급 시스템은 사용자에게 적어도 하나의 물질의 전달을 촉진하기 위해 에어로졸 공급 시스템(또는 이의 구성요소)의 구성적 에어로졸-발생 물질이 연소되지 않거나 태워지지 않는 것이다.
일부 구현예에서, 전달 시스템은 불연성 에어로졸 공급 시스템, 예컨대 동력 이용 불연성 에어로졸 공급 시스템이다.
일부 구현예에서, 불연성 에어로졸 공급 시스템은 또한, 베이핑 장치 또는 전자 니코틴 전달 시스템(END)로서 공지된 전자 담배이며, 그러나, 에어로졸-발생 물질 중 니코틴이 존재해야 하는 것은 아님이 주지된다.
일부 구현예에서, 불연성 에어로졸 공급 시스템은 또한 히트-낫-번(heat-not-burn) 시스템으로서 또한 공지된 에어로졸-발생 물질 가열 시스템이다. 이러한 시스템의 예는 타바코 가열 시스템이다.
일부 구현예에서, 불연성 에어로졸 공급 시스템은 하나 또는 복수의 에어로졸-발생 물질이 가열될 수 있는 에어로졸-발생 물질의 조합을 이용하여 에어로졸을 발생시키는 하이브리드 시스템이다. 에어로졸-발생 물질 각각은 예를 들어, 고체, 액체 또는 겔 형태로 존재할 수 있으며, 니코틴을 함유하거나 함유하지 않을 수 있다. 일부 구현예에서, 하이브리드 시스템은 액체 또는 겔-발생 물질 및 고체 에어로졸-발생 물질을 포함한다. 고체 에어로졸-발생 물질은 예를 들어, 타바코 또는 비-타바코 제품을 포함할 수 있다.
전형적으로, 불연성 에어로졸 공급 시스템은 불연성 에어로졸 공급 장치 및 불연성 에어로졸 공급 장치와 사용하기 위한 소모품을 포함할 수 있다.
일부 구현예에서, 본 개시내용은 에어로졸-발생 물질을 포함하고 불연성 에어로졸 공급 장치와 함께 사용되도록 구성된 소모품에 관한 것이다. 이러한 소모품은 종종 본 개시내용 전반에 걸쳐 물품으로서 언급된다.
일부 구현예에서, 불연성 에어로졸 공급 시스템, 예컨대 이의 불연성 에어로졸 공급 장치는 동력원 및 제어기를 포함할 수 있다. 동력원은 예를 들어, 전원 또는 발열 동력원일 수 있다. 일부 구현예에서, 발열 동력원은 열의 형태로 동력을 에어로졸-발생 물질 또는 발열 동력원에 근접한 열 전달 물질에 분배하도록 에너지를 공급받을 수 있는 탄소 기재를 포함한다.
일부 구현예에서, 불연성 에어로졸 공급 시스템은 소모품을 수용하기 위한 영역, 에어로졸 발생기, 에어로졸 발생 영역, 하우징, 마우스피스, 필터 및/또는 에어로졸-조절제를 포함할 수 있다.
일부 구현예에서, 불연성 에어로졸 공급 장치와 함께 사용하기 위한 소모품은 에어로졸-발생 물질, 에어로졸-발생 물질 저장 영역, 에어로졸-발생 물질 전달 구성요소, 에어로졸 발생기, 에어로졸 발생 영역, 하우징, 랩퍼, 필터, 마우스피스 및/또는 에어로졸-조절제를 포함할 수 있다.
적합하게는, 전달 시스템은 본 발명에 따른 타바코 식물 또는 이의 일부로부터 제조될 수 있다(예를 들어, 이를 포함할 수 있다).
적합하게는, 전달 시스템은 본 발명에 따른 타바코 세포 배양물로부터 제조될 수 있다.
적합하게는, 전달 시스템은 본 발명에 따라 타바코 식물 번식 물질로부터 번식된 타바코 식물 또는 이의 일부로부터 제조될 수 있다(예를 들어, 이를 포함할 수 있다).
적합하게는, 전달 시스템은 본 발명에 따른 타바코 식물의 수확된 잎으로부터 제조될 수 있다(예를 들어, 이를 포함할 수 있다).
적합하게는, 전달 시스템은 본 발명에 따른 가공된 타바코 잎으로부터 제조될 수 있다(예를 들어, 이를 포함할 수 있다).
적합하게는, 전달 시스템은 본 발명에 따른 경화된 타바코 물질로부터 제조될 수 있다(예를 들어, 이를 포함할 수 있다).
적합하게는, 전달 시스템은 본 발명에 따른 타바코 블렌드로부터 제조될 수 있다(예를 들어, 이를 포함할 수 있다).
일 구현예에서, 전달 시스템은 담배, 시가릴로 및 시가로 구성된 군으로부터 선택된 가연성 흡연 물품이다.
일 구현예에서, 전달 시스템은, 가연성 흡연 물품의 하나 이상의 구성요소, 예컨대 필터, 필터 봉, 필터 봉 세그먼트, 타바코, 타바코 봉, 타바코 봉 세그먼트, 스필, 첨가제 방출 구성요소, 예컨대 캡슐, 실, 비드, 페이퍼 예컨대, 플러그 랩, 팁핑 페이퍼 또는 담배 페이퍼를 포함한다.
일 구현예에서, 전달 시스템은 불연성 에어로졸 공급 시스템이다.
일 구현예에서, 전달 시스템은 불연성 에어로졸 공급 시스템의 하나 이상의 구성요소, 예컨대 히터 및 에어로졸화 가능한 기재를 포함한다.
일 구현예에서, 에어로졸 공급 시스템은 베이핑 장치로서 또한 공지된 전자 담배이다.
일 구현예에서, 전자 담배는 히터, 히터에 전력을 공급할 수 있는 전원, 에어로졸화 가능한 기재, 예컨대 액체 또는 겔, 하우징 및 선택적으로 마우스피스를 포함한다.
일 구현예에서, 에어로졸 가능한 기재는 기재 용기에 함유된다. 일 구현예에서, 기재 용기는 히터와 조합되거나 이를 포함한다.
일 구현예에서, 전달 시스템은 기재 물질을 가열하나 연소시키지 않음으로써 하나 이상의 화합물을 방출하는 가열 제품이다. 기재 물질은 예를 들어, 타바코 또는 다른 비-전달 시스템일 수 있는 에어로졸화 가능한 물질이며, 이는 니코틴을 함유할 수 있거나 없다. 일 구현예에서, 가열 제품은 타바코 가열 제품이다.
일 구현예에서, 가열 제품은 전자 장치이다.
일 구현예에서, 타바코 가열 제품은 히터, 히터에 전력을 공급할 수 있는 전원, 에어로졸화 가능한 기재, 예컨대 고체 또는 겔 물질을 포함한다.
일 구현예에서, 가열 제품은 비-전자 물품이다.
일 구현예에서, 가열 제품은 고체 또는 겔 물질과 같은 에어로졸화 가능한 기재, 및 목탄과 같은 가연성 물질 연소시키는 것과 같은 임의의 전자 수단 없이 에어로졸화 가능한 기재에 열 에너지를 공급할 수 있는 열원을 포함한다.
일 구현예에서, 가열 제품은 또한 에어로졸화 가능한 기재를 가열함으로써 생성된 에어로졸을 여과할 수 있는 필터를 포함한다.
일부 구현예에서, 에어로졸화 가능한 기재 물질은 증기 또는 에어로졸 발생제 또는 습윤제, 예컨대 글리세롤, 프로필렌 글리콜, 트리아세틴 또는 디에틸렌 글리콜을 포함할 수 있다.
일 구현예에서, 전달 시스템은 기재 물질의 조합물을 가열하지만 연소시키지 않음으로써 에어로졸을 발생시키는 하이브리드 시스템이다. 기재 물질은 예를 들어, 니코틴을 함유할 수 있거나 없는 고체, 액체 또는 겔을 포함할 수 있다. 일 구현예에서, 하이브리드 시스템은 액체 또는 겔 기재 및 고체 기재를 포함한다. 고체 기재는 예를 들어, 타바코 또는 기타 비-전달 시스템일 수 있으며, 니코틴을 함유할 수 있거나 없다. 일 구현예에서, 하이브리드 시스템은 액체 또는 겔 기재 및 타바코를 포함한다.
또 다른 구현예에서, 제품은 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질의 활성 또는 발현을 조절하여 식물(예를 들어, 타바코 식물)에서 발현되는 경우 알칼로이드 함량을 감소시키는 본 발명의 작제물을 포함할 수 있다.
타바고 산업 제품
본원에 사용된 바와 같은 용어 "타바코 산업 제품"은 가연성 흡엽 물품, 예컨대 담배, 시가릴로, 시가, 파이프용 또는 롤 담배용 타바코(타바코, 타바코 유도체, 확장된 타바코, 재구성된 타바코, 타바코 치환물 또는 기타 흡연가능 물질을 기반으로 하든지), 불연성 에어로졸 공급 시스템, 연소 없이 기재 물질로부터 화합물을 방출하는 가열 제품, 예컨대 전자 담배, 타바코 가열 제품, 및 기재 물질의 조합물로부터 에어로졸을 생성하기 위한 하이브리드 시스템, 예를 들어 액체 또는 겔 또는 고체 기재를 함유하는 하이브리드 시스템은 물론 이들 에어로졸 공급 시스템 내에 사용되는 에어로졸화 가능한 기재 물질; 및 에어로졸 비함유 전달 물품, 예컨대 로젠지, 검, 패치, 호흡가능한 분말을 포함하는 물품 및 무연 타바코 산업 제품 예컨대, 스누스 및 스너프를 포함하는 것으로 의도되며, 에어로졸-비함유 전달 물품은 니코틴을 전달할 수 있거나 없다.
일 구현예에서, 타바코 산업 제품은 본 발명의 타바코 식물 또는 이의 일부로부터 제조될 수 있다(예를 들어, 포함할 수 있다).
적합하게는, 타바코 식물 또는 이의 일부는 본 발명에 따른 타바코 식물 번식 물질로부터 번식될 수 있다.
타바코 식물과 관련하여 본원에 사용된 바와 같은 용어 "이의 일부"는 타바코 식물의 일부를 나타낸다. 바람직하게는, "이의 일부"는 타바코 식물의 잎이다.
또 다른 구현예에서, 타바코 산업 제품은 본 발명의 수확된 잎으로부터 제조될 수 있다.
추가의 구현예에서, 타바코 산업 제품은 본 발명의 가공된 타바코 잎으로부터 제조될 수 있다.
적합하게는, 타바코 산업 제품은 경화, 발효 및/또는 저온살균 중 하나 이상에 의해 가공된 타바코 잎으로부터 제조될 수 있다.
적합하게는, 타바코 산업 제품은 임의적으로 상기 구현예에 따라 가공된 절단 타바코 잎을 포함할 수 있다.
또 다른 구현예에서, 타바코 산업 제품은 본 발명에 따라 타바코 세포 배양물로부터 제조될 수 있다.
또 다른 구현예에서, 타바코 산업 제품은 본 발명에 따른 경화된 타바코 물질로부터 제조될 수 있다(예를 들어, 이를 포함할 수 있다).
또 다른 구현예에서, 타바코 산업 제품은 본 발명에 따른 타바코 블렌드로부터 제조될 수 있다(예를 들어, 포함할 수 있다).
일 구현예에서, 타바코 산업 제품은 흡연 물품일 수 있다.
본원에 사용된 바와 같은 용어 "흡연 물품"은 타바코, 타바코 유도체, 확장된 타바고, 재구성된 타바코 또는 타바코 치환물을 기반으로 하든지 아니든지 흡연가능한 제품, 예컨대 롤링 타바코, 담배, 시가 및 시가릴로를 포함할 수 있다.
또 다른 구현예에서, 타바코 산업 제품은 무연 타바코 산업 제품일 수 있다.
본원에 사용된 바와 같이 용어 "무연 타바코 산업 제품"은 흡연 및/또는 연소 처리로 의도되지 않은 타바코 산업 제품을 나타낸다.
무연 타바코 산업 제품(히트-낫-번 물질 포함)은 플레이크, 필름, 탭, 폼 또는 비드와 같은 임의의 형태로 증착되거나, 혼합되거나, 이에 의해 둘러싸이거나 다른 성분과 조합되는 건조된 입자, 조각, 과립, 분말 또는 슬러리를 포함하는 임의의 형태의 타바코를 함유할 수 있다.
일 구현예에서, 무연 타바코 산업 제품은 스너스, 스너프, 씹는 타바코 등을 포함할 수 있다.
일 구현예에서, 타바코 산업 제품은 담배, 시가릴로 및 시가로 구성된 군으로부터 선택되는 가연성 흡연 물품이다.
일 구현예에서, 타바코 산업 제품은, 가연성 흡연 물품의 하나 이상의 구성요소, 예컨대 필터, 필터 봉, 필터 봉 세그먼트, 타바코, 타바코 봉, 타바코 봉 세그먼트, 스필, 첨가제 방출 구성요소, 예컨대 캡슐, 실, 비드, 페이퍼 예컨대, 플러그 랩, 팁핑 페이퍼 또는 담배 페이퍼를 포함한다.
일 구현예에서, 타바코 산업 제품은 불연성 에어로졸 공급 시스템이다.
일 구현예에서, 타바코 산업 제품은 불연성 에어로졸 공급 시스템의 하나 이상의 구성요소, 예컨대 히터 및 에어로졸화 가능한 기재를 포함한다.
일 구현예에서, 에어로졸 공급 시스템은 베이핑 장치로서 또한 공지된 전자 담배이다.
일 구현예에서, 전자 담배는 히터, 히터에 전력을 공급할 수 있는 전원, 에어로졸화 가능한 기재, 예컨대 액체 또는 겔, 하우징 및 선택적으로 마우스피스를 포함한다.
일 구현예에서, 에어로졸 가능한 기재는 기재 용기에 함유된다. 일 구현예에서, 기재 용기는 히터와 조합되거나 이를 포함한다.
일 구현예에서, 타바코 산업 제품은 기재 물질을 가열하나 연소시키지 않음으로써 하나 이상의 화합물을 방출하는 가열 제품이다. 기재 물질은 예를 들어, 니코틴을 함유할 수 있거나 없는 타바코 또는 다른 비-타바코 생성물일 수 있는 에어로졸화 가능한 물질이다. 일 구현예에서, 가열 제품은 타바코 가열 제품이다.
일 구현예에서, 가열 제품은 전자 장치이다.
일 구현예에서, 타바코 가열 제품은 히터, 히터에 전력을 공급할 수 있는 전원, 에어로졸화 가능한 기재, 예컨대 고체 또는 겔 물질을 포함한다.
일 구현예에서, 가열 제품은 비-전자 물품이다.
일 구현예에서, 가열 제품은 고체 또는 겔 물질과 같은 에어로졸화 가능한 기재, 및 목탄과 같은 가연성 물질 연소시키는 것과 같은 임의의 전자 수단 없이 에어로졸화 가능한 기재에 열 에너지를 공급할 수 있는 열원을 포함한다.
일 구현예에서, 가열 제품은 또한 에어로졸화 가능한 기재를 가열함으로써 생성된 에어로졸을 여과할 수 있는 필터를 포함한다.
일부 구현예에서, 에어로졸화 가능한 기재 물질은 증기 또는 에어로졸 발생제 또는 습윤제, 예컨대 글리세롤, 프로필렌 글리콜, 트리아세틴 또는 디에틸렌 글리콜을 포함할 수 있다.
일 구현예에서, 타바코 산업 제품은 기재 물질의 조합물을 가열하지만 연소시키지 않음으로써 에어로졸을 발생시키는 하이브리드 시스템이다. 기재 물질은 예를 들어, 니코틴을 함유하거나 함유하지 않을 수 있는 고체, 액체 또는 겔을 포함할 수 있다. 일 구현예에서, 하이브리드 시스템은 액체 또는 겔 기재 및 고체 기재를 포함한다. 고체 기재는 예를 들어, 타바코 또는 기타 비-타바코 제품일 수 있으며, 이는 니코틴을 함유할 수 있거나 없다. 일 구현예에서, 하이브리드 시스템은 액체 또는 겔 기재 및 타바코를 포함한다.
추가 구현예에서, 타바코 산업 제품은 타바코 가열 장치 또는 하이브리드 장치 또는 전자 담배 등일 수 있다.
전형적으로, 타바코 가열 장치 또는 하이브리드 장치에서 에어로졸은 열원으로부터 물리적으로 분리된 에어로졸-형성 기재 또는 물질로의 열 전달에 의해 생성되며, 이는 열원 내부, 주변 또는 하류에 위치할 수 있다. 흡연 동안, 휘발성 화합물은 열원으로부터의 열 전달에 의해 에어로졸-형성 기재로부터 방출되고, 흡연 물품을 통해 끌어당겨진 공기에 동반된다. 방출된 화합물이 냉각되면, 이들은 응축되어 사용자에 의해 흡입되는 에어로졸을 형성한다.
타바코 가열 장치를 소비하거나 흡연하기 위한 에어로졸-발생 물품 및 장치는 당업계에 공지되어 있다. 이들은 예를 들어, 전기 가열된 에어로졸-발생 장치를 포함할 수 있으며, 여기에서 에어로졸은 에어로졸-발생 장치의 하나 이상의 전기 가열 요소로부터 타바코 가열 장치의 에어로졸-형성 기재로의 열 전달에 의해 발생된다.
적합하게는, 타바코 가열 장치는 에어로졸-발생 장치일 수 있다.
바람직하게는, 타바코 가열 장치는 히트-낫-번 장치일 수 있다. 히트-낫-번 장치는 당업계에 공지되어 있으며, 타바코를 가열하지만 연소하지 않음으로써 화합물을 방출시킨다.
적합한 히트-낫-번 장치의 예는 인용으로 본원에 포함된 WO2013/034459 또는 GB2515502에 교시된 것일 수 있다.
일 구현예에서, 타바코 가열 장치의 에어로졸-형성 기재는 본 발명에 따른 담배 산업 제품일 수 있다.
일 구현예에서, 타바코 가열 장치는 하이브리드 장치일 수 있다.
폴리뉴클레오티드/폴리펩티드/작제물
본 발명의 특정 구현예에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 유전자의 활성 또는 발현을 조절하는 작제물은 적합하게는 프로모터의 지시 하에 식물 세포로 형질전환될 수 있다.
본 발명의 특정 구현예에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 감소(즉, 억제)시키는 작제물은 프로모터의 지시 하에 식물 세포로 형질전환될 수 있다. 예를 들어, 유전자 작제물은 유전자 편집 작제물일 수 있거나 RNAi 분자를 포함할 수 있으며, 이는 작은 간섭 RNA(siRNA) 분자 또는 짧은 헤어핀 루프(shRNA) 분자를 포함할 수 있다.
본 발명의 특정 구현예에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 증가시키는 작제물은 적합하게는 내인성 BTB/POZ NPH3 도메인-함유 단백질과 같은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자를 인코딩하는 프로모터, 예를 들어 작제물의 지시 하에 식물 세포로 형질전환될 수 있다.
작제물은 적합한 벡터, 예를 들어 식물 형질전환 벡터에 의해 본 발명에 따라 식물 내에 도입될 수 있다. 식물 형질전환 벡터는 5'-3' 전사 방향으로 프로모터 서열, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자를 표적으로 하는 작제물 서열, 및 임의적으로, RNA 중합효소를 위한 정지 신호 및 폴리아데닐라제를 위한 폴리아데닐화 신호를 포함하는 3' 비번역된 종결인자 서열을 포함하는 발현 카세트를 포함할 수 있다. 프로모터 서열은 하나 이상의 복사체에 존재할 수 있으며, 이러한 복사체는 상기 기재된 바와 같은 프로모터 서열과 동일할 수 있거나 이의 변이체일 수 있다. 종결인자 서열은 식물, 박테리아 또는 바이러스 유전자로부터 수득될 수 있다. 적합한 종결인자 서열은 예를 들어, 완두콩 rbcS E9 종결인자 서열, 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)의 노팔린 신타제 유전자로부터 유도된 nos 종결인자 서열 및 칼리플라워 모자이크 바이러스로부터의 35S 종결인자 서열이다. 당업자는 다른 적합한 종결인자 서열을 쉽게 알 것이다.
본 발명의 작제물은 또한 프로모터의 강도를 증가시키기 위해 유전자 발현 증강 메카니즘을 포함할 수 있다. 이러한 인핸서 요소의 예는 완두콩 플라스토시아닌(plastocyanin) 유전자의 프로모터의 일부로부터 유래된 것이며, 이는 본원에 인용으로 포함된 국제 특허 출원 번호 WO 97/20056의 대상이다. 적합한 인핸서 요소는 예를 들어, 아그로박테리움 투메파시엔스의 노팔린 신타제 유전자로부터 유래된 nos 인핸서 요소 및 콜리플라워 모자이크 바이러스로부터의 35S 인핸서 요소일 수 있다.
이들 조절 영역은 니코티아나 타바쿰 또는 기타 유기체, 예를 들어 솔라나세애 과 식물 또는 세스트로이데애(Cestroideae) 아과 식물로부터 프로모터 DNA 서열과 동일한 유전자로부터 유도될 수 있거나 상이한 유전자로부터 유도될 수 있다. 모든 조절 영역은 형질전환될 조직의 세포에서 작동될 수 있어야 한다.
프로모터 DNA 서열은 관심 유전자, 예를 들어 프로모터가 지시하는 유전자, 예를 들어, 본 발명에 사용되는 코딩 서열인 상이한 유전자, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자와 동일한 유전자로부터 유도될 수 있거나, 니코티아나 타바쿰 또는 또 다른 유기체, 예를 들어 솔라나세애 과 또는 세스트로이데애 아과의 식물로부터 유도될 수 있다.
발현 카세트는 기본 식물 형질전환 벡터, 예컨대 pBIN 19 Plus, pBI 101, pKYLX71:35S2, pCAMBIA2300 또는 당업계에 공지된 다른 적합한 식물 형질전환 벡터 내에 혼입될 수 있다. 발현 카세트에 더하여, 식물 형질전환 벡터는 형질전환 과정에 필요한 서열을 함유할 것이다. 이들은 아그로박테리움 vir 유전자, 하나 이상의 T-DNA 경계 서열 및 선택가능한 마커 또는 이식유전자 식물 세포를 확인하는 다른 수단을 포함할 수 있다.
용어 "발현 벡터 또는 식물 형질전환 벡터"는 생체내 또는 시험관내 발현이 가능한 작제물을 의미한다. 바람직하게는, 발현 벡터는 유기체의 게놈에 혼입된다. 일 구현예에서, 본 발명의 벡터는 단백질, 예를 들어 본원에 기재된 바와 같은 BTB/POZ NPH3 도메인-함유 단백질을 발현한다. 용어 "혼입된"은 바람직하게는 게놈으로의 안정적인 통합을 포함한다.
식물을 형질전환시키는 기술은 당업계에 잘 알려져 있으며, 예를 들어, 아그로박테리움-매개된 형질전환을 포함한다. 유전자 변형된 식물의 작제물에서 기본 원리는 삽입된 유전자 물질이 안정적으로 유지될 수 있도록 식물 게놈에 유전자 정보를 삽입하는 것이다. 일반 기술에 대한 검토는 본원에 인용으로 포함된 [Potrykus (Annu Rev Plant Physiol Plant Mol Biol [1991] 42:205-225) and Christon (AgroFood-Industry Hi-Tech March/April1994 17-27)]의 기사에서 찾아볼 수 있다.
전형적으로, 아그로박테리움-매개된 형질전환에서 관심 이종 DNA를 수반하는 바이너리 벡터, 즉 본 발명에 따른 작제물은 표적 식물로부터의 외식편과 아그로박테리움의 공동-배양에 의해 적절한 아그로박테리움 균주로부터 표적 식물로 전달된다. 그 후, 형질전환된 식물 조직은 선택 배지에서 재생되며, 이 선택 배지는 선택 가능한 마커 및 식물 성장 호르몬을 포함한다. 대안은 플로랄 딥(floral dip) 방법(Clough & Bent, 1998 Plant J. 1998 Dec;16(6):735-43, 본원에 인용으로 포함됨)이며, 이에 의해 온전한 식물의 꽃눈은 키메라 유전자를 함유하는 아그로박테리움 균주의 현탁액과 접촉되게 하며, 종자 세팅 후, 형질전환된 개체는 발아되고 선택 배지에서의 성장에 의해 확인된다. 아그로박테리움에 의한 식물 조직의 직접 감염은 본원에 인용으로 포함된 문헌 [Butcher et al. (1980) Tissue Culture Methods for Plant Pathologists, eds.: D. S. Ingrams and J.P. Helgeson, 203-208]에 기술되며 광범위하게 사용되는 단순한 기술이다.
추가의 적합한 형질전환 방법은 예를 들어, 폴리에틸렌 글리콜 또는 전기천공 기술, 입자 충격, 미세주입 및 탄화규소 섬유의 사용을 이용하여 원형질체로의 직접적인 유전자 전달을 포함한다. 충돌식 형질전환(ballistic transformation)을 이용한 식물 형질전환 및 탄화규소 휘스커-매개된 형질전환에 의한 비옥한 유전자전이 옥수수 식물의 생성은 본원에 인용으로 포함된 문헌 [Frame et al. (1994) The Plant Journal 6(6): 941-948]에 교시되어 있으며, 바이러스 형질전환 기술은 예를 들어, 본원에 인용으로 포함된 문헌 [Meyer et al. (1992) Mol. Gen. Genet. 231(3): 345-352]에 교시된다. 식물을 위한 벡터 시스템으로서 카사바 모자이크 바이러스의 사용은 본원에 인용으로 포함된 문헌 [Meyer et al. (1992) Gene 110: 213-217]에 교시된다. 식물 형질전환에 대한 추가 교시는 본원에 인용으로 포함된 EP-A-0449375에서 찾아볼 수 있다.
추가의 양태에서, 본 발명은 작제물을 운반하고, 이를 유기체, 예컨대 식물, 적합하게는 타바코 식물의 게놈 내로 도입하는 벡터 시스템에 관한 것이다. 벡터 시스템은 하나의 벡터를 포함할 수 있으나, 이는 2개의 벡터를 포함할 수 있다. 2개 벡터의 경우, 벡터 시스템은 일반적으로 바이너리 벡터 시스템으로 언급된다. 바이너리 벡터 시스템은 본원에 인용으로 포함된 문헌 [Gynheung et al. (1980) Binary Vectors, Plant Molecular Biology Manual A3, 1-19]에 추가로 상세히 기술된다.
식물 세포의 형질전환을 위해 광범위하게 사용되는 한 시스템은 본원에 인용으로 통합된 문헌 [An et al. (1986) Plant Physiol. 81, 301-305 and Butcher et al. (1980) Tissue Culture Methods for Plant Pathologists eds.: D. S. Ingrams and J.P. Helgeson, 203-208]에 기술된 아그로박테리움 리조게네스(Agrobacterium rhizogenes)로부터의 Ri 플라스미드 또는 아그로박테리움 투메파시엔스로부터의 Ti 플라스미드를 사용한다. 식물에서 본 발명에 따른 원하는 외인성 유전자의 각 도입 방법 후에, 추가 DNA 서열의 존재 및/또는 삽입이 필요할 수 있다. 식물 세포의 형질전환을 위한 T-DNA의 사용이 집중적으로 연구되었으며, 문헌 [EP-A-120516; Hoekema (1985) The Binary Plant Vector System, Offset-drukkerij Kanters B. B., Amsterdam Chapter V; Fraley et al. Crit. Rev. Plant Sci. 4:1-46; and An et al. (1985) EMBO J 4: 277-284]에 기술되며, 이들 모두는 본원에 인용으로 포함된다.
BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하는 작제물(들)로 형질전환된 식물 세포는 잘 공지된 조직 배양 방법에 따라, 예컨대 필요한 성장 인자, 예컨대 아미노산, 식물 호르몬, 비타민 등이 보충된 적합한 배양 배지에서 세포를 배양함으로써 성장되고 유지될 수 있다.
본 발명과 관련하여 용어 "유전자전이 식물"은 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하는 작제물을 포함하는 임의의 식물을 포함한다. 따라서, 유전자전이 식물은 본 발명에 따른 작제물로 형질전환된 식물이다. 바람직하게는, 유전자전이 식물은 본 발명에 따라 조절된 알칼로이드 함량 및/또는 조절된 TSNA 전구체 함량을 나타낸다. 용어 "유전자전이 식물"은 이의 자연 환경에 있는 또한 이들 고유의 프로모터의 제어 하에 있을 때 이들의 자연 환경에 있는 천연 뉴클레오티드 코딩 서열을 포괄하지 않는다.
일 양태에서, 본 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질, 작제물, 식물 형질전환 벡터 또는 식물 세포를 인코딩하는 유전자는 단리된 형태이다. 용어 "단리된"은 서열에 서열이 자연에서 발견되는 바와 같이 자연에서 자연적으로 연관되어 있는 적어도 하나의 다른 성분이 적어도 실질적으로 없다는 것을 의미한다.
일 양태에서, 발명에 따른 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자, 작제물, 식물 형질전환 벡터 또는 식물 세포는 정제된 형태이다. 용어 "정제된"은 비교적 순수한 상태, 예를 들어 적어도 약 90% 순수, 또는 적어도 약 95% 순수 또는 적어도 약 98% 순수 상태를 의미한다.
본원에 사용된 바와 같은 용어 "뉴클레오티드 서열"은 올리고뉴클레오티드 서열 또는 폴리뉴클레오티드 서열, 및 이의 변이체, 상동체, 단편 및 유도체(예컨대, 이의 일부)를 나타낸다. 뉴클레오티드 서열은 게놈 또는 합성 또는 재조합 기원일 수 있으며, 이는 센스 또는 안티-센스 가닥을 나타내는지의 여부와 무관하게 이중 가닥 또는 단일 가닥일 수 있다.
본 발명와 관련하여 용어 "뉴클레오티드 서열"은 게놈 DNA, cDNA, 합성 DNA 및 RNA를 포함한다. 바람직하게는, 이는 본 발명을 코딩하는 DNA, 더욱 바람직하게는 cDNA 서열을 의미한다.
바람직한 구현예에서, 본 발명의 범위와 관련이 있으며 이에 포함될 경우 뉴클레오티드 서열, 즉 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자는 이의 자연 환경에서 및 또한, 자연 환경에 있는 천연적으로 관련된 서열(들)에 연결되는 경우 천연 뉴클레오티드 서열을 포함한다. 참조의 편의를 위해, 본 발명자들은 이러한 바람직한 구현예를 "천연 뉴클레오티드 서열"이라고 부를 것이다. 이와 관련하여, 용어 "천연 뉴클레오티드 서열"은 천연 환경에 있고, 자연적으로 연관되어 있으며, 프로모터 또한 이의 천연 환경에 있는 전체 프로모터에 작동 가능하게 연결될 때 전체 뉴클레오티드 서열을 의미한다.
본 발명에 사용하기 위한 뉴클레오티드 서열은 벡터에 존재할 수 있으며, 여기에서 뉴클레오티드 서열은 적합한 숙주 유기체에 의해 뉴클레오티드 서열의 발현을 제공할 수 있는 조절 서열에 작동가능하게 연결된다. 본 발명에서 사용하기 위한 작제물은 본 발명의 폴리펩티드의 발현을 제공하기 위해 본원에 기재된 바와 같은 적합한 숙주 세포로 형질전환될 수 있다. 벡터, 예를 들어 플라스미드, 코스미드, 또는 파지 벡터의 선택은 종종 그것이 도입되는 숙주 세포에 의존적일 것이다. 벡터는 예를 들어, RNA의 생성을 위해 시험관 내에서 사용될 수 있거나, 숙주 세포를 형질감염, 형질전환, 형질도입 또는 감염시키는데 사용될 수 있다.
일부 적용에서, 본 발명에 사용하기 위한 뉴클레오티드 서열은 예컨대, 선택된 숙주 세포에 의해 뉴클레오티드 서열의 발현을 위해 제공될 수 있는 조절 서열에 작동가능하게 연결된다. 예로서, 본 발명은 이러한 조절 서열에 작동가능하게 연결된 본원에 기재된 바와 같은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 뉴클레오티드 서열을 포함하는 벡터로서, 즉 발현 벡터인 벡터를 포함한다.
용어 "작동가능하게 연결된"은 설명된 구성요소가 의도된 방식으로 기능하도록 허용하는 관계에 있는 병치를 나타낸다. 코딩 서열에 "작동가능하게 연결된" 조절 서열은 코딩 서열의 발현이 조절 서열과 양립가능한 조건 하에 달성되는 방식으로 결찰된다.
용어 "조절 서열"은 프로모터 및 인핸서 및 기타 발현 조절 신호를 포함한다. 용어 "프로모터"는 예를 들어 RNA 폴리머라제 결합 부위와 같은 당업계의 통상적인 의미로 사용된다. BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자를 인코딩하는 작제물 내의 뉴클레오티드 서열은 적어도 프로모터에 작동가능하게 연결될 수 있다.
용어 "카세트" 또는 "벡터"와 동의어인 용어 "작제물"은 프로모터에 직접적으로 또는 간접적으로 부착된 본 발명에 따라 사용하기 위한 뉴클레오티드 서열을 포함한다.
간접 부착의 예는 본 발명의 뉴클레오티드 서열과 프로모터를 매개하는 인트론 서열, 예컨대 Sh1-인트론 또는 ADH 인트론과 같은 적절한 스페이서 그룹을 제공한다. 직접 또는 간접 부착을 포함하는 본 발명과 관련하여 용어 "융합된"에 대해서도 마찬가지이다. 일부 경우에, 이 용어는 보통 야생형 유전자 프로모터와 연관된 단백질을 코딩하는 뉴클레오티드 서열의 자연적 조합 및 이 둘 모두가 자연 환경에 있을 때를 포괄하지 않는다. 작제물은 유전자 작제물의 선택을 허용하는 마커를 함유하거나 발현할 수도 있다.
일부 구현예에서, 프로모터는 세포 또는 세포 배양물 또는 타바코 식물 또는 이의 일부에서 니코틴의 농도 및/또는 총 함량을 조절하는 데 사용되는 작제물 또는 벡터에서 뉴클레오티드 서열에 작동가능하게 연결될 수 있다.
일부 구현예에서, 프로모터는 항시적 프로모터, 조직-특이적 프로모터, 발달적으로 조절되는 프로모터 및 유도성 프로모터로 구성된 군으로부터 선택될 수 있다.
일 구현예에서, 프로모터는 항시적 프로모터일 수 있다.
항시적 프로모터는 모든 세포 유형에서 유전자가 동일한 수준으로 발현되지 않을 수 있지만 식물 발달 동안 지속적으로 식물의 다양한 부분에 걸쳐 유전자의 발현을 지시한다. 공지된 항시적 프로모터의 예는 콜리플라워 모자이크 바이러스 35S 전사체(Odell JT, Nagy F, Chua NH. (1985). Identification of DNA sequences required for activity of the cauliflower mosaic virus 35S promoter. Nature. 313 810-2), 쌀 액틴 1 유전자(Zhang W, McElroy D, Wu R. (1991). Analysis of rice Act1 5' region activity in transgenic rice plants. Plant Cell 3 1155-65) 및 옥수수 유비퀴틴 1 유전자(Cornejo MJ, Luth D, Blankenship KM, Anderson OD, Blechl AE. (1993). Activity of a maize ubiquitin promoter in transgenic rice. Plant Molec. Biol. 23 567-81)와 관련된 프로모터를 포함한다. 항시적 프로모터, 예컨대 카네이션 에칭 링 바이러스(CERV) 프로모터(Hull R, Sadler J, LongstaffM(1986)(CaMV/35S), 무화과 모자이크 바이러스 35S 프로모터. 카네이션 에칭 링 바이러스 DNA의 서열: 콜리플라워 모자이크 바이러스 및 레트로바이러스와의 비교(EMBO Journal, 5(2):3083-3090).
항시적 프로모터는 카네이션 에칭 고리 바이러스(CERV) 프로모터, 콜리플라워 모자이크 바이러스(CaMV 35S 프로모터), 쌀 액틴 1 유전자 또는 옥수수 유비퀴틴 1 유전자로부터의 프로모터로부터 선택될 수 있다.
프로모터는 조직 특이적 프로모터일 수 있다. 조직 특이적 프로모터는 일반적으로 식물 부분의 일생 동안 식물의 한 (또는 몇) 부분에서 유전자 발현을 지시하는 프로모터이다. 조직 특이적 프로모터의 범주에는 또한, 일반적으로 특이성이 절대적이지 않은 프로모터도 포함되며, 즉, 선호하는 조직 이외의 조직에서 더 낮은 수준으로 발현을 지시할 수도 있다. 조직 특이적 프로모터에는 파세올린-프로모터, 레구민 b4-프로모터, usp-프로모터, sbp-프로모터, ST-LS1 프로모터, B33(파타틴 클래스 I 프로모터)이 포함된다.
또 다른 구현예에서, 프로모터는 발달 조절되는 프로모터일 수 있다.
발달 조절되는 프로모터는 식물 발달 중 특정 시간에 식물의 하나 이상의 부분에서 유전자 발현의 변화를 지시한다. 유전자는 다른 시간에 다른(보통 더 낮은) 수준으로 해당 식물 부분에서 발현될 수 있으며, 다른 식물 부분에서도 발현될 수 있다.
일 구현예에서, 프로모터는 유도성 프로모터일 수 있다.
유도성 프로모터는 유도인자에 대한 반응으로 유전자의 발현을 지시할 수 있다. 유도인자의 부재하에서는 유전자가 발현되지 않을 것이다. 유도인자는 프로모터 서열에 직접 작용할 수 있거나, 억제인자 분자의 효과를 중화하여 작용할 수 있다. 유도인자는 화학 제제, 예컨대 대사산물, 단백질, 성장 조절인자(예컨대, OCS 프로모터를 활성화시키는 옥신 및 살리실산), 또는 독성 요소, 생리적 스트레스 예컨대, 열, 빛(예컨대, 소이빈 SSU 프로모터), 상처(예를 들어, nos, 노팔린 신타제 프로모터), 또는 삼투압, 또는 병원체 또는 해충 작용의 간접적인 결과일 수 있다. 발달 조절되는 프로모터는 식물에 의해 생성된 내인성 유도인자 또는 식물의 수명 주기의 특정 지점에서 환경 자극에 반응하는 특정 유형의 유도성 프로모터로서 기술될 수 있다. 공지된 유도성 프로모터의 예는 문헌 [Warner SA, Scott R, Draper J. ((1993) Plant J. 3 191-201)]에 기술된 바와 같은 상처 반응와 관련된 것들, 문헌 [Benfey & Chua (1989) (Benfey, P.N., and Chua, N-H. ((1989) Science 244 174-181)]에 기재된 바와 같은 온도 반응, 및 문헌 [Gatz ((1995) Methods in Cell Biol. 50 411-424)]에 기재된 바와 같은 화학적으로 유도된 것들을 포함한다.
본원에 정의된 바와 같은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자로서 특이적 특성을 갖는 단백질 또는 변형에 적합한 단백질을 인코딩하는 뉴클레오티드 서열은 상기 단백질을 생성하는 임의의 세포 또는 유기체로부터 확인되고/거나 분리되고/거나 정제될 수 있다. 뉴클레오티드 서열의 확인 및/또는 분리 및/또는 정제를 위한 다양한 방법이 당업계에 잘 알려져 있다. 예로서, 적합한 서열이 확인되고/거나 분리되고/거나 정제되면 더 많은 서열을 제조하기 위한 PCR 증폭 기술이 사용될 수 있다.
추가의 또 다른 대안에서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 뉴클레오티드 서열은 확립된 표준 방법, 예를 들어 본원에 인용으로 포함된 문헌 [Beucage et al. (1981) Tetrahedron Letters 22, 1859-1869]에 기술된 포스포로아미디트 방법, 또는 본원에 인용으로 포함된 문헌 [Matthes et al. (1984) EMBO J. 3, 801-805]에 기술된 방법에 의해 합성에 의해 제조될 수 있다. 포스포로아미다이트 방법에서 올리고뉴클레오티드는 예를 들어 자동 DNA 합성기에서 합성되고, 정제되고, 어닐링되고, 결찰되고 적절한 벡터에서 클로닝된다.
본원에 사용된 바와 같은 용어 "아미노산 서열"은 용어 "폴리펩티드" 및/또는 용어 "단백질"과 동의어이다. 일부 경우에, 용어 "아미노산 서열"은 용어 "펩티드"와 동의어이다. 일부 경우에, 용어 "아미노산 서열"은 용어 "효소"와 동의어이다.
본 발명은 또한 본원에 정의된 특정 특성을 갖는 폴리펩티드의 아미노산 서열(들)과의 서열 동일성 또는 서열 상동성의 정도를 갖는 서열의 용도, 또는 임의의 뉴클레오티드 서열 즉, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자(이하에서는 "상동성 서열(들)"로 언급됨)의 용도를 포함한다. 여기서 용어 "상동체"는 대상 아미노산 서열 및 대상 뉴클레오티드 서열과 특정한 상동성을 갖는 실체를 의미한다. 여기서 용어 "상동성"은 "동일성"과 동일할 수 있다.
상동 아미노산 서열 및/또는 뉴클레오티드 서열 및/또는 단편은 기능적 활성을 유지하고/거나 BTB/POZ NPH3 도메인-함유 유전자의 활성을 향상시키는 폴리펩티드를 제공하고/거나 인코딩해야 할 것이다. 전형적으로, 상동 서열은 예를 들어, 대상 아미노산 서열로서 동일한 활성 부위 등을 포함하거나 동일한 활성 부위를 인코딩할 것이다. 상동성은 또한 유사성(즉, 유사한 화학적 특성/기능을 갖는 아미노산 잔기)의 관점에서 고려될 수 있지만, 본 발명의 맥락에 있어서, 서열 동일성의 관점에서 상동성을 표현하는 것이 바람직하다. 상동 서열은 일반적으로 기능성 도메인 또는 모티프를 유지한다.
일 구현예에서, 상동 서열은 대상 서열과 비교하여 1, 2 또는 수개의 추가, 결실 및/또는 치환을 갖는 아미노산 서열 또는 뉴클레오티드 서열을 포함하는 것으로 간주된다.
서열 동일성
서열 동일성 비교는 육안으로 또는 더욱 일반적으로는, 용이하게 입수가능한 서열 비교 프로그램의 도움으로 수행될 수 있다. 이러한 시중에서 입수가능한 컴퓨터 프로그램은 2개 이상의 서열 간의 상동성 %을 계산할 수 있다. 상동성 % 또는 동일성 %은 연속 서열에 대해 계산될 수 있으며, 즉 하나의 서열은 다른 서열과 정렬되고, 한 서열의 각 아미노산은 한 번에 하나의 잔기씩 다른 서열의 상응하는 아미노산과 직접 비교된다. 이는 "갭핑되지 않은" 정렬로 불린다. 전형적으로, 이러한 갭이 없는 정렬은 상대적으로 적은 수의 잔기에 대해서만 수행된다.
이는 매우 단순하고 일관된 방법이지만, 예를 들어, 다른 동일한 서열 쌍에서, 하나의 삽입 또는 결실은 다음의 아미노산 잔기가 정렬되지 않게 하고, 따라서 전체 정렬이 수행될 때 잠재적으로 상동성 %의 큰 감소를 발생시킨다는 것을 고려하지 못한다. 결과적으로, 대부분의 서열 비교 방법은 전체 상동성 스코어에 부당한 불이익을 주지 않으면서 가능한 삽입 및 결실을 고려하는 최적의 정렬을 생성하도록 설계된다. 이는 국소 상동성을 최대화하고자 하기 위해 서열 정렬에 "갭"을 삽입함으로써 달성된다.
그러나, 이러한 더 복잡한 방법은 정렬에서 발생하는 각 갭에 "갭 패널티"를 할당하여, 동일한 수의 동일한 아미노산에 있어서, 2개의 비교된 서열 사이의 더 높은 관련성을 반영하는 가능한 한 적은 갭을 갖는 서열 정렬이 많은 갭을 갖는 것보다 더 높은 스코어를 달성할 것이다. "아핀 갭 비용"은 일반적으로 갭의 존재에 대해 상대적으로 높은 비용을 부과하고 갭의 각 후속 잔류물에 대해 더 작은 패널티를 부과하는데 사용된다. 이는 가장 일반적으로 사용되는 갭 스코어링 시스템이다. 높은 갭 패널티는 물론 더 적은 갭을 갖는 최적화된 정렬을 생성할 것이다. 대부분의 정렬 프로그램은 갭 패널티를 수정하게 한다. 그러나, 서열 비교에 이러한 소프트웨어를 사용할 경우 기본 값을 사용하는 것이 바람직하다.
따라서, 최대 상동성 %의 계산은 먼저 갭 페널티를 고려하여 최적의 정렬 생성을 필요로 한다. 이러한 정렬을 수행하는 데 적합한 컴퓨터 프로그램은 Vector NTI(Invitrogen Corp.)이다. 서열 비교를 수행할 수 있는 소프트웨어의 예에는 비제한적으로, 예를 들어 BLAST 패키지(Ausubel et al.(1999) Short Protocols in Molecular Biology, 4th Ed - Chapter 18 참조), BLAST 2(FEMS Microbiol Lett 1999 174(2): 247-50; FEMS Microbiol Lett 1999 177(1): 187-8 and tatiana@ncbi.nlm.nih.gov 참조), FASTA(Altschul et al. 1990 J. Mol. Biol. 403-410) 및 AlignX를 포함한다. 적어도, BLAST, BLAST2 및 FASTA는 오프라인 및 온라인 검색에 사용가능하다(문헌 [Ausubel et al. (1999), pages 7-58 to 7-60] 참조).
최종 상동성 %는 동일성 측면에서 측정될 수 있지만, 정렬 프로세스 자체는 전형적으로 모두 또는 전무 쌍 비교를 기반으로 하지 않는다. 대신에, 화학적 유사성 또는 진화적 거리를 기반으로 하는 각 쌍별 비교에 스코어를 할당하는 스케일링된 유사성 스코어 매트릭스가 일반적으로 사용된다. 일반적으로 사용되는 이러한 매트릭스의 예는 BLOSUM62 매트릭스이다 - BLAST 프로그램 세트에 대한 기본 매트릭스. 벡터 NTI 프로그램은 일반적으로 공개 기본값 또는 제공되는 경우 사용자 지정 기호 비교 표를 사용한다(자세한 내용은 사용자 설명서 참조). 일부 응용 프로그램의 경우 Vector NTI 패키지에 대한 기본값을 사용하는 것이 바람직하다.
대안적으로, CLUSTAL(Higgins DG & Sharp PM(1988), Gene 73(1), 237-244)과 유사한 알고리즘을 기반으로 하는 벡터 NTI(Invitrogen Corp.)의 다중 정렬 특성을 사용하여 상동성 백분율을 계산할 수 있다. 소프트웨어가 최적의 정렬을 생성한다면, 상동성 %, 바람직하게는 서열 동일성 %를 계산하는 것이 가능하다. 소프트웨어는 전형적으로 서열 비교의 일부로서 이를 수행하고 수치 결과를 생성한다.
서열 동일성을 결정할 때 갭 패널티가 사용되어야 하는 경우, 바람직하게는 쌍별 정렬을 위해 다음 매개변수가 사용된다:
Figure pct00001
Figure pct00002
일 구현예에서, CLUSTAL은 상기에서 정의된 바와 같은 갭 패널티 및 갭 확장 세트와 함께 사용될 수 있다. 일부 구현예에서, BLAST 또는 CLUSTAL 정렬에 사용되는 갭 패널티는 상기 상세히 설명된 것과 상이할 수 있다. 당업자는, BLAST 및 CLUSTAL 정렬을 수행하기 위해 표준 파라미터가 주기적으로 변경될 수 있으며, 당시 BLAST 또는 CLUSTAL 정렬 알고리즘에 대해 상세히 설명된 표준 파라미터를 기반으로 하는 적절한 파라미터를 선택할 수 있을 것으로 이해할 것이다.
적합하게는, 뉴클레오티드 서열에 관한 동일성 정도는 적어도 50개 연속 뉴클레오티드, 바람직하게는 적어도 60개 연속 뉴클레오티드, 바람직하게는 적어도 70개 연속 뉴클레오티드, 바람직하게는 적어도 80개 연속 뉴클레오티드, 바람직하게는 적어도 90개 연속 뉴클레오티드, 바람직하게는 적어도 100개 연속 뉴클레오티드, 바람직하게는 적어도 150개 연속 뉴클레오티드, 바람직하게는 적어도 200개 연속 뉴클레오티드, 바람직하게는 적어도 250개 연속 뉴클레오티드, 바람직하게는 적어도 300개 연속 뉴클레오티드, 바람직하게는 적어도 350개 연속 뉴클레오티드, 바람직하게는 적어도 400개 연속 뉴클레오티드, 바람직하게는 적어도 450개 연속 뉴클레오티드, 바람직하게는 적어도 500개 연속 뉴클레오티드, 바람직하게는 적어도 550개 연속 뉴클레오티드, 바람직하게는 적어도 600개 연속 뉴클레오티드, 바람직하게는 적어도 650개 연속 뉴클레오티드, 또는 바람직하게는 적어도 700개 연속 뉴클레오티드에 걸쳐 결정된다.
적합하게는, 뉴클레오티드, cDNA, cds 또는 아미노산 서열에 관한 동일성 정도는 전체 서열에 걸쳐 결정될 수 있다.
서열은 또한 침묵 변화를 생성하는 아미노산 잔기의 결실, 삽입 또는 치환을 가질 수 있으며, 기능적으로 동등한 물질을 발생시킬 수 있다. 의도적인 아미노산 치환은 물질의 이차 결합 활성이 유지되는 한 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성 성질의 유사성에 기초하여 이루어질 수 있다. 예를 들어, 음으로 하전된 아미노산은 아스파르트산 및 글루탐산을 포함하며; 양으로 하전된 아미노산은 리신 및 아르기닌을 포함하며; 유사한 친수성 값을 갖는 비하전된 극성 헤드 기를 갖는 아미노산은 류신, 이소류신, 발린, 글리신, 알라닌, 아스파라긴, 글루타민, 세린, 트레오닌, 페닐알라닌 및 티로신을 포함한다.
예를 들어, 하기 표에 따라 보존적 치환이 이루어질 수 있다. 제2 열의 동일한 블록 및 바람직하게는, 제3 열의 동일한 라인에 있는 아미노산은 서로 치환될 수 있다:
Figure pct00003
본 발명은 또한 발생할 수 있는 상동성 치환(치환 및 대체는 모두 기존 아미노산 잔기의 대체 잔기로의 상호교환을 의미하기 위해 본원에 사용됨), 즉, 같은 것으로의 치환(like-for-like substitution), 예컨대 염기성을 염기성으로, 산성을 산성으로, 극성을 극성으로의 치환, 기타 등등을 포함한다. 비-상동성 치환은 또한 즉, 한 부류의 잔기로부터 또 다른 부류의 잔기로 발생할 수 있거나, 대안적으로 비천연 아미노산, 예컨대 오르니틴(이하에서는 Z로 지칭됨), 디아미노부티르산 오르니틴(이하에서는 B로 지칭됨), 노르류신 오르니틴(이하에서는 O로 지칭됨), 피릴알라닌, 티에닐알라닌, 나프틸알라닌 및 페닐글리신의 포함을 포함한다.
대체는 또한 하기를 포함하는 비천연 아미노산에 의해 이루어질 수 있다; 알파* 및 알파-이치환된* 아미노산, N-알킬 아미노산*, 락트산*, 천연 아미노산의 할라이드 유도체, 예컨대 트리플루오로티로신*, p-Cl-페닐알라닌*, p-Br-페닐알라닌*, p-I-페닐알라닌*, L-알릴-글리신*, β-알라닌*, L-α-아미노 부티르산*, L-γ-아미노 부티르산*, L-α-아미노 이소부티르산*, L-ε-아미노 카프로산#, 7-아미노 헵타노산*, L-메티오닌 설폰#*, L-노르류신*, L-노르발린*, p-니트로-L-페닐알라닌*, L-하이드록시프롤린#, L-티오프롤린*, 페닐알라닌(Phe)의 메틸 유도체, 예컨대 4-메틸-Phe*, 펜타메틸-Phe*, L-Phe (4-아미노)#, L-Tyr (메틸)*, L-Phe (4-이소프로필)*, L-Tic (1,2,3,4-테트라하이드로이소퀴놀린-3-카르복실산)*, L-디아미노프로피온산# 및 L-Phe (4-벤질)*을 포함한다. 표기법 *은 유도체의 소수성 성질을 나타내기 위해 상기 논의(상종 또는 비-상동 치환과 관련하여)의 목적으로 사용된 반면, #은 유도체의 친수성 성질을 나타내기 위해 사용되었으며, #*는 양친매성 특성을 나타낸다.
변이체 아미노산 서열은 글리신 또는 β-알라닌 잔기와 같은 아미노산 스페이서에 더하여 메틸, 에틸 또는 프로필 기와 같은 알킬 기를 포함하는 서열의 임의의 2개의 아미노산 잔기 사이에 삽입될 수 있는 적합한 스페이서 기를 포함할 수 있다. 추가 형태의 변형은 펩토이드 형태의 하나 이상의 아미노산 잔기의 존재를 포함하며, 이는 당업자에 의해 잘 이해될 것이다. 의심의 여지를 피하기 위해, "펩토이드 형태"는 α-탄소 치환기가 α-탄소보다는 잔기 질소 원자에 있는 변이체 아미노산 잔기를 나타내는데 사용된다. 펩토이드 형태의 펩티드를 제조하기 위한 방법은 당업계 예를 들어, 문헌 [Simon et al. (1992) PNAS 89(20), 9367-9371 and Horwell (1995) Trends Biotechnol. 13(4), 132-134]에 공지되어 있다.
본 발명에 사용하기 위한 뉴클레오티드 서열은 합성 또는 변형된 뉴클레오티드를 그 안에 포함할 수 있다. 올리고뉴클레오티드에 대한 다수의 상이한 유형의 변형이 당업계에 공지되어 있다. 이들로는 분자의 3' 및/또는 5' 말단에서 메틸포스포네이트 및 포스포로티오에이트 백본 및/또는 아크리딘 또는 폴리리신 사슬의 첨가를 포함한다. 본 발명의 목적에 있어서, 본원에 기재된 뉴클레오티드 서열은 당업계에 이용가능한 임의의 방법에 의해 변형될 수 있음을 이해해야 한다. 이러한 변형은 본 발명의 뉴클레오티드 서열의 생체내 활성 또는 수명을 향상시키기 위해 수행될 수 있다.
본 발명은 또한 본 발명의 핵산 서열에 상보적인 서열 또는 본 발명의 서열에 대해 혼성화될 수 있는 서열, 또는 이에 대해 상보적인 서열을 포함한다. 본원에 사용된 바와 같은 용어 "혼성화"는 "핵산 가닥이 염기 쌍을 통해 상보적 가닥과 연결되는 과정"은 물론 중합효소 연쇄 반응(PCR) 기술에서 수행되는 증폭 과정을 포함할 것이다.
본 발명은 또한 본 발명의 뉴클레오티드 서열에 혼성화될 수 있는 뉴클레오티드 서열(본원에 제시된 것들의 상보적 서열 포함)에 관한 것이다. 바람직하게는, 혼성화는 엄격한 조건(예를 들어, 50℃ 및 0.2xSSC {1xSSC = 0.15M NaCl, 0.015M Na3시트레이트 pH 7.0})에서 결정된다. 더욱 바람직하게는, 혼성화는 매우 엄격한 조건(예를 들어, 65℃ 및 0.1xSSC {1xSSC = 0.15M NaCl, 0.015M Na3시트레이트 pH 7.0})에서 결정된다.
식물 형질전환에 사용되는 일반적인 기술에 대한 검토는 기사, 예컨대 문헌 [Potrykus et al. (1991) Annu Rev Plant Physiol. Plant Mol. Biol. 42:205-225 and Christou et al. (1994) Agro-Food-Industry Hi-Tech March/April 17-27]에서 찾아볼 수 있으며, 이는 본원에 인용으로 포함된다. 식물 형질전환에 대한 추가 교시는 본원에 인용으로 포함된 EP-A-0449375에서 찾아볼 수 있다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 문헌 [Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 20 ED., John Wiley and Sons, New York (1994), and Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, NY (1991)]은 본 개시내용에 사용된 많은 용어의 일반적인 사전을 숙련자에게 제공한다.
본 개시내용은 본원에 개시된 예시적인 방법 및 재료에 의해 제한되지 않으며, 본원에 기재된 것과 유사하거나 등가인 임의의 방법 및 재료는 본 개시내용의 구체예의 실시 또는 시험에서 사용될 수 있다. 숫자 범위에는 범위를 정의하는 숫자가 포함된다. 달리 표시되지 않는 한, 임의의 핵산 서열은 5'에서 3' 방향으로 왼쪽에서 오른쪽으로 작성된다; 아미노산 서열은 각각 아미노에서 카르복시 방향으로 왼쪽에서 오른쪽으로 작성된다.
본원에 제공된 표제는 전체로서 명세서를 참조하여 본 개시내용의 다양한 양태 또는 구현예의 제한이 아니다. 따라서, 바로 아래에 정의되는 용어는 전체로서 명세서를 참조하여 보다 완전하게 정의된다.
아미노산은 아미노산의 명칭, 세 글자 약어 또는 한 글자 약어를 사용하여 본원에서 언급된다. 본원에 사용된 용어 "단백질"은 단백질, 폴리펩티드 및 펩티드를 포함한다. 본원에 사용된 바와 같은 용어 "아미노산 서열"은 용어 "폴리펩티드" 및/또는 용어 "단백질"과 동의어이다. 일부 경우에, 용어 "아미노산 서열"은 용어 "펩티드"와 동의어이다. 일부 경우에, 용어 "아미노산 서열"은 용어 "효소"와 동의어이다.
본 개시내용 및 청구범위에서, 아미노산 잔기에 대한 통상적인 한 글자 및 세 글자 코드가 사용될 수 있다. IUPACIUB Joint Commission on Biochemical Nomenclature(JCBN)에 따라 정의된 아미노산에 대한 3-글자 코드이다. 또한, 폴리펩티드는 유전자 코드의 축퇴성으로 인해 하나 초과의 뉴클레오티드 서열에 의해 코드화될 수 있는 것으로 이해된다.
용어의 다른 정의는 본 명세서 전반에 걸쳐 나타날 수 있다. 예시적인 구현예가 더 상세하게 설명되기 전에, 본 개시내용은 설명된 특정 구현예로 제한되지 않고, 물론 변할 수 있음을 이해해야 한다. 또한, 본원에 사용된 용어는 단지 특정 구현예를 설명하기 위한 목적이며, 본 개시내용의 범위는 단지 첨부된 청구범위에 의해서만 제한될 것이기 때문에 제한하려는 의도가 아님을 이해해야 한다.
값의 범위가 제공되는 경우, 문맥에서 명확하게 달리 지시하지 않는 한 해당 범위의 상한과 하한 사이의 각 중간 값이 하한 단위의 10분의 1까지 또한 구체적으로 개시되는 것으로 이해된다. 언급된 범위의 임의의 언급된 값 또는 중간 값과 해당 언급된 범위의 임의의 다른 언급된 또는 중간 값 사이의 각각의 더 작은 범위는 본 개시내용 내에 포함된다. 이러한 더 작은 범위의 상한 및 하한은 독립적으로 그 범위에 포함되거나 제외될 수 있으며, 더 작은 범위에 어느 하나의 한계가 포함되거나 어느 한계도 포함되지 않거나 두 한계 모두가 포함되는 각 범위 또한 본 개시내용 내에 포함되며, 상기 언급된 범위에서 임의의 구체적으로 배제된 한계가 적용된다. 언급된 범위가 한계 중 하나 또는 둘 모두를 포함하는 경우, 포함된 한계 중 하나 또는 둘 모두를 제외하는 범위도 본 개시내용에 포함된다.
본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥이 명백히 달리 지시하지 않는 한 복수의 지시대상을 포함하는 것으로 주지되어야 한다. 따라서, 예를 들어, "효소" 또는 "니트레이트 환원효소"에 대한 언급은 당해 분야의 숙련가에게 공지된 복수의 이러한 후보 제제 및 이의 등가물, 등등을 포함한다.
이점
놀랍게도 타바코에서 알칼로이드 함량의 양성 조절인자로서 작용하는 본원에 교시된 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써, 식물의 알칼로이드 및/또는 TSNA 전구체 함량이 조절될 수 있음이 발견되었다. 이에 의해, 조절(예를 들어, 감소)된 알칼로이드 함량 및/또는 감소된 TSNA 전구체 함량을 가지며, 타바코 산업 제품의 소비자가 추구하는 상업적으로 바람직한 특성을 갖는 타바코 산업 제품이 생성될 수 있다.
본 발명자들은 놀랍게도 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 조절함으로써 식물(예를 들어, 타바코 식물)의 알칼로이드 함량 및/또는 TSNA 전구체 함량을 조절하기 위한 방법을 결정하였다. 식물(예를 들어, 타바코 식물)의 알칼로이드 또는 TSNA 전구체 함량은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현을 감소 또는 억제함으로써 감소될 수 있다. 본 발명 전에, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 유전자의 활성 또는 발현의 조절이 알칼로이드(및/또는 식물의 TSNA 전구체 함량(예를 들어, 타바코 식물)를 조절하는데 사용될 수 있다는 것은 알려지지 않았다.
본원에서 논의된 간행물은 본 출원의 출원일 이전에 그들의 개시를 위해서만 제공된다. 본원에 있는 어떤 것도 상기 출판물이 본원에 첨부된 청구범위에 대한 선행 기술을 구성한다는 것을 인정하는 것으로 해석되어서는 안된다.
실시예
실시예 1 - BTB/POZ NPH3 도메인-함유 단백질의 일시적인 과발현은 잎의 알칼로이드 함량을 증가시킨다
방법 및 재료
BTB/POZ NPH3 도메인-함유 발현 벡터의 클로닝
Nitab4.5_0000868g0020.2 BTB/POZ NPH3 도메인-함유 단백질 유전자 서열(SEQ ID NO. 3)은 유전자 서열에 측접하는 제한 부위 외부에 위치한 프라이머를 사용하여 Gateway™ 호환 cDNA 라이브러리로부터 증폭하였다.
생성된 플라스미드는 열 충격에 의해 시퀀싱하고, 아그로박테리움 투메파시엔스 GV3101pMP90으로 형질전환시키고, 타바코 잎에서 일시적으로 발현시켰다.
일시적인 유전자 발현
관심 작제물을 수반하는 아그로박테리움 투메파시엔스 GV3101 균주를 적절한 항생제가 보충된 Luria-Bertani(LB) 배지에서 밤새 성장시켰다. 배양물을 회전시키고 OD600 = 0.6까지 10 mM MgCl2, 10 mM MES pH 5.6 및 100 μM 아세토시링곤을 함유하는 완충액에 재현탁하고, 실온에서 1시간 동안 인큐베이션하였다. 바늘 없는 주사기를 사용하여 타바코 잎에 침윤을 수행하였다. 샘플은 침윤 5일 후에 채취하였다.
테스트는 두 가지 생물학적 복제물에서 수행하였다.
알칼로이드 측정
피리딘 알칼로이드의 상대 함량은 탠덤 질량 분광법(LC-MS/MS)을 이용하여 역상 고성능 액체 크로마토그래피에 의해 결정하였다. Gemini-NX 컬럼(100 mm Х 3.0 mm, 입자 크기 3μm, Phenomenex)을 사용하여 크로마토그래피 분리를 달성하고, 구배 크로마토그래피 분리를 6.5 mM 암모늄 아세테이트 완충액(aq)(pH10) 및 메탄올을 사용하여 달성하였다.
질량 분광기는 예정된 MRM 데이터 수집을 사용하여 전자 분무(ESI) 양성 모드에서 작동한다. 두 개의 MRM 전이는 각 분석물에 대해 모니터링하고, 하나는 동위원소 표지된 내부 표준에 대해 모니터링하였다.
Figure pct00004
결과
Nitab4.5_0000868g0020.2 작제물을 발현하는 5주된 타바코 잎의 알칼로이드 함량은 도 1에 도시된다. 알칼로이드 함량은 대조군과 비교하여 표시되며, 일원 t-테스트로 분석된 2개의 생물학적 복제물을 포함한다. 값은 평균 ± SEM으로 표시된다. 별표는 P 값 ≤ 0.001의 통계적 의미를 나타낸다.
Nitab4.5_0000868g0020.2의 과발현은 잎의 알칼로이드 함량의 현저한 증가로 이어진다.
도 35는 Nitab4.5_0000868g0020.2의 녹아웃이 알칼로이드 함량의 유의한 감소로 이어짐을 보여준다. 녹아웃된 Nitab4.5_0000868g0020.2를 갖는 3개의 TN90 라인의 알칼로이드 함량이 도시된다. 알칼로이드 함량은 대조군과 비교하여 표시된다. 결과는 t-테스트로 분석하였다. 값은 평균 ± SEM으로 표시된다. 별표는 P 값 ≤ 0.001의 통계적 의미를 나타낸다.
결론
Nitab4.5_0000868g0020은 알칼로이드 함량의 양성 조절인자이며, 타바코의 피리딘 알칼로이드의 조절인자이다.
실시예 2 - Nitab4.5_0000868g0020.2를 표적으로 하는 안티센스 RNA의 일시적인 발현은 잎에서 알칼로이드 함량을 감소시킨다
재료 및 방법
Nitab4.5_0000868g0020.2 코딩 서열을 CERV 프로모터에 의해 구동되는 식물 발현 벡터에 역방향으로 클로닝하였다.
결과
Nitab4.5_0000868g0020.2 안티센스 RNA를 발현하는 5주된 타바코 잎의 알칼로이드 함량은 도 2에 도시된다. 알칼로이드 함량은 대조군과 비교하여 표시되며 t-테스트로 분석된 3개의 생물학적 복제물을 포함한다. 값은 평균 ± SEM으로 표시된다. 별표는 P 값 ≤ 0.001의 통계적 의미를 나타낸다.
안티센스 RNA를 사용하여 Nitab4.5_0000868g0020.2 발현을 억제하면 잎에서 알칼로이드 함량의 감소로 이어지며, 특히 PON, 노르니코틴, 아나바신 및 아나타빈 함량 감소로 이어진다.
결론
Nitab4.5_0000868g0020.2는 알칼로이드 함량, 특히 잎에서 알칼로이드 함량의 양성 조절인자이며, 타바코에서 피리딘 알칼로이드의 조절인자이다.
실시예 3 - 상동성 테스트
SEQ ID NO. 3의 상동체의 효과, 즉 SEQ ID NO 6, 9, 12, 15, 18, 21, 24, 27 및 30을 실시예 1 및 2에 기재된 바와 같은 검정법으로 시험하였다.
실시예 4 - Nitab4.5_0000868g0020.2의 상호작용인자 연구
방법:
Nitab4.5_0000868g0020.2의 삼중 공동-면역침전 샘플을 질량 분광 분석에 제공하였다. 샘플을 트립신으로 분해하고 Thermo Scientific™ Orbitrap Fusion™ 질량 분광기에서 분석하였다. 데이터는 5%의 잘못된 발견률을 사용하여 BAT 타바코 단백질체 데이터베이스 및 일반 오염물질 데이터베이스에 대해 Proteome Discoverer 2.1로 분석하였다. 단백질은 다음을 기준으로 분류하였다: 후보 샘플의 모든 복제물에서 확인; 후보 샘플에서 확인된 펩티드의 수; 및 대조군(GFP) 또는 다른 후보 샘플에는 존재하지 않음. 이러한 기준을 사용하여 Nitab4.5_0000868g0020.2에 대한 후보 상호작용인자 목록을 생성하였다.
결과 및 결론:
Nitab4.5_0000868g0020.2의 상호작용인자를 특성규명하였다(데이터 미도시됨). 가장 강력한 상호작용인자(SEQ ID NO)는 엽록체 또는 엽록체 막에 위치하며, 이는 가장 가까운 아라비돕시스 탈리아나(Arabidopsis thaliana) 동족체(AT5G67385, NCH1)와 마찬가지로 Nitab4.5_0000868g0020.2가 엽록체 운동 조절에 관여함을 시사한다. 엽록체 신호전달 경로는 옥신에 의해 엄격하게 조절되며, 이는 싹에서 타바코 식물의 장거리 신호 전달에 관여하고 뿌리에서 니코틴 합성을 조절한다. 이러한 발견은 타바코에서 니코틴 및 니코틴 알칼로이드 수준의 조절에 Nitab4.5_0000868g0020.2의 관련성에 대한 기작론적 통찰을 제공한다.
SEQUENCE LISTING <110> British American Tobacco (Investments) Limited <120> METHOD <130> P117234PCT <150> GB 1909562.9 <151> 2019-07-03 <160> 44 <170> PatentIn version 3.5 <210> 1 <211> 620 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0000868g0020.2 amino acid sequence <400> 1 Met Val Asp Leu Asp Ser Glu Gly Thr Glu Gln Pro Ser Thr Val Asn 1 5 10 15 Asn Met Ser Thr Lys Lys Lys Glu Leu Leu Ser Thr Ala Met Lys Arg 20 25 30 Thr Ser Asp Trp Ile Phe Ser Gln Glu Ile Pro Ser Asp Val Thr Val 35 40 45 Asn Ala Gly Gly Ser Ala Phe Ser Leu His Lys Phe Pro Leu Val Ser 50 55 60 Lys Ser Gly Tyr Ile Arg Lys Ile Ile Ser Glu Ser Asn Asp Ala Asp 65 70 75 80 Val Ser Ile Val Glu Ile Pro Asp Ile Pro Gly Gly Ser Asp Ala Phe 85 90 95 Glu Leu Ala Ala Lys Phe Cys Tyr Gly Ile Asn Phe Glu Ile Ser Thr 100 105 110 Glu Asn Ile Ala Leu Leu Arg Cys Thr Ala Glu Tyr Leu Glu Met Thr 115 120 125 Glu Asp Tyr Ala Val Gly Asn Leu Val Gly Arg Thr Glu Ala Tyr Leu 130 135 140 Asn Glu Val Ala Leu Lys Ser Leu Ala Gly Ala Val Ser Ile Leu His 145 150 155 160 Ser Ser Glu Ser Leu Leu Pro Ile Ala Glu Lys Val Lys Met Val Ser 165 170 175 Arg Cys Ile Asp Thr Ile Ala Tyr Ile Ala Cys Lys Asp Asn Gln Phe 180 185 190 Cys Thr Ser Gly Arg Ala Glu Ala Gly Thr Asn Gly Leu Asn Ser Ser 195 200 205 Thr Phe Ser Asn Pro Lys Pro Met Val Asp Trp Trp Ala Glu Asp Leu 210 215 220 Ala Val Leu Arg Ile Asp Phe Phe Gln Arg Val Leu Ile Ala Met Met 225 230 235 240 Gly Arg Gly Phe Lys Gln Tyr Ala Leu Gly Pro Ile Leu Met Leu Tyr 245 250 255 Ala Gln Lys Ser Leu Arg Gly Leu Glu Ile Phe Gly Lys Gly Arg Lys 260 265 270 Lys Ile Glu Pro Lys Gln Glu His Glu Lys Arg Val Val Leu Glu Thr 275 280 285 Ile Val Ser Leu Leu Pro Arg Glu Lys Asn Ala Leu Ser Val Ser Phe 290 295 300 Leu Ser Met Leu Leu Arg Ala Ala Ile Tyr Leu Glu Thr Thr Val Ala 305 310 315 320 Cys Arg Leu Asp Leu Glu Lys Arg Met Ala Leu Gln Leu Gly Gln Ala 325 330 335 Val Leu Asp Asp Leu Leu Ile Pro Ser Tyr Ser Phe Thr Gly Asp Thr 340 345 350 Leu Phe Asp Val Glu Thr Val Gln Arg Ile Ile Met Asn Phe Leu Asp 355 360 365 Asn Glu Met Asp Gly Ser Arg Leu Gly Asp Glu Glu Tyr Val Ser Pro 370 375 380 Ser Leu Ser Asp Met Glu Arg Val Gly Lys Leu Met Glu Asn Tyr Leu 385 390 395 400 Ala Glu Ile Ala Ser Asp Arg Asn Leu Ser Val Ser Lys Phe Ile Ser 405 410 415 Leu Ala Glu Val Ile Pro Glu Gln Ala Lys Ile Thr Glu Asp Gly Met 420 425 430 Tyr Arg Ala Ile Asp Ile Tyr Leu Lys Ala His Pro Ala Leu Ser Asp 435 440 445 Met Glu Arg Lys Lys Val Cys Gly Val Met Asp Cys Gln Lys Leu Ser 450 455 460 Arg Glu Ala Cys Ala His Ala Ala Gln Asn Asp Arg Leu Pro Val Gln 465 470 475 480 Thr Val Val Gln Val Leu Tyr Tyr Glu Gln Gln Arg Leu Arg Glu Val 485 490 495 Met Asp Gly Ser Gln Leu Val Ala Thr Glu Pro Pro Ala Leu Ile Pro 500 505 510 Ser Lys Thr Asn Gln Phe Ser Thr Asp Ile Arg Pro Ile Ser Asp Glu 515 520 525 Val Ser Ser Leu Lys Arg Glu Asn Gln Glu Leu Lys Phe Glu Leu Leu 530 535 540 Lys Met Lys Met Arg Leu Lys Glu Ile Glu Lys Pro Ser Asn Lys Ser 545 550 555 560 Ala Thr Ser Ser Pro Leu Val Ile Thr His Pro Ser Ala Asp Lys Pro 565 570 575 Pro Leu Pro Arg Lys Pro Ser Asn Phe Ile Ser Ser Val Ser Lys Lys 580 585 590 Leu Gly Lys Phe Ile Arg Ala Asp Gly Leu Thr Ala Asn Lys Gly Arg 595 600 605 Asn Lys Pro Ser Lys Asp Arg Arg His Ser Ile Ser 610 615 620 <210> 2 <211> 1863 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0000868g0020.2 coding sequence <400> 2 atggtggatc ttgattcaga ggggactgaa caaccctcta ctgttaacaa tatgtccact 60 aaaaagaagg agcttctttc cactgctatg aagaggacct ctgattggat tttctcccaa 120 gagatcccaa gtgatgtaac tgtaaatgca ggcggatccg ccttttcact gcacaagttc 180 cctttagttt caaagagtgg ctacataagg aagattatct cagaatccaa tgatgctgat 240 gtttctatag tcgaaatccc tgatataccc ggtggatcag atgcatttga acttgctgca 300 aaattttgtt atggaataaa ttttgagata agcacagaaa acattgcctt gctgagatgc 360 acagcggaat atcttgagat gacagaagac tatgcagttg ggaatttggt tggaagaact 420 gaggcctact taaatgaagt agctcttaaa agcctagctg gtgcagtttc aattttgcat 480 tcttcagaaa gccttcttcc cattgcagag aaagtaaaaa tggttagtcg atgcatcgac 540 acaattgcat atattgcatg caaggataac caattctgca catcaggtag agcagaggct 600 ggtactaacg gattgaattc gtccacgttt tcaaacccga agcctatggt tgattggtgg 660 gctgaggatt tagctgtcct tagaattgat tttttccaaa gggttctaat tgcaatgatg 720 ggaagaggat tcaagcagta tgcacttgga ccaatattaa tgctatatgc acagaagtct 780 cttcgaggtt tggaaatatt tggaaaggga aggaaaaaaa ttgagccaaa acaagaacat 840 gaaaagaggg ttgttttaga aacaattgtt agtcttctgc caagggagaa aaatgcattg 900 tcagttagct ttctgtcaat gctgctccga gctgcaatat atctagaaac cacagttgct 960 tgcaggcttg acttggagaa gaggatggca ttgcagcttg gacaggctgt gttagatgat 1020 ttattgattc cttcatattc cttcacaggg gacacattgt ttgatgttga aaccgtgcag 1080 cgtatcatca tgaatttcct tgacaatgaa atggatggaa gtcgattggg agatgaggag 1140 tatgtgtctc cttcattaag tgacatggag cgggttggga aacttatgga aaattacctt 1200 gctgaaatag cctcagaccg taatctatcc gtttcaaaat tcattagtct agctgaagtc 1260 atcccagagc aagcaaagat cactgaagat gggatgtaca gggcaattga tatttatttg 1320 aaggcacatc cagctctaag tgatatggaa agaaaaaaag tttgcggtgt tatggactgt 1380 caaaagctat ctagagaggc ttgtgctcat gctgctcaaa atgataggct ccctgttcag 1440 acagttgtgc aagtacttta ctacgagcag caacgccttc gtgaggtcat ggacgggagc 1500 caacttgtag caactgaacc tccagctcta attccttcta aaactaatca gttctccact 1560 gatatccgtc ctatttcaga tgaggtctct agtctaaaac gagaaaatca ggagctgaaa 1620 tttgagttgc taaagatgaa aatgaggttg aaagaaattg aaaaaccttc aaacaaatca 1680 gctactagca gccctttggt catcactcat ccatctgctg ataaacctcc tttgccaaga 1740 aaaccatcta atttcataag ctcagtatcc aaaaagcttg gaaaatttat tcgagcagat 1800 ggactcacag ccaacaaagg ccgaaataaa ccaagtaaag acaggcgtca ttctatatcc 1860 tga 1863 <210> 3 <211> 6688 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0000868g0020.2 genomic sequence <220> <221> misc_feature <222> (5212)..(5405) <223> n is a, c, g, or t <400> 3 ctgagctaaa tccttttcta ctctatttaa ccccaatcat tcacataata cctttaatac 60 cactcacatt tctgctgtag gggctcctca aacatgatct ttgttctgct aacattaagg 120 cctataatgg gaattgtacc aatgccttga ttgatagtga aagatgataa caataattca 180 attattaggg gccagatact gttgattaaa tgctcagaca ttgaactaac agaagcaaag 240 gaaaagaaca tgtctttctg gtttttgctc cataaggaaa cagcttaaga gaaacctcta 300 ccgtagaccg aatgtgatgg acatggttaa gaccctttaa agtttcaatc atggtggatc 360 ttgattcaga ggggactgaa caaccctcta ctgttaacaa tatgtccact aaaaagaagg 420 agcttctttc cactgctatg aagaggacct ctgattggta tgctctatat atcttgactt 480 cttattgtgc tttgtaaaag tagccagccc cttttatgta ctattattaa tctgtttctc 540 aagatactcg ctggaaggat aggtactgac aagtaaagtt acctatataa tcttaacagg 600 attttctccc aagagatccc aagtgatgta actgtaaatg caggcggatc cgccttttca 660 ctgcacaagg tgtggtgttc tctatgcttt tgtcataaga agttataact aaacttcact 720 cacaatccaa actgttgttg gttttagtta tattcctatt tggattgagt tatcagccct 780 ggtcacacct caatgagaat ctgaatttgg tgattttttc tcttttctga cgattgaatc 840 acaaggttca ataatgattt attgtgtacc atgcagttcc ctttagtttc aaagagtggc 900 tacataagga agattatctc agaatccaat gatgctgatg tttctatagt cgaaatccct 960 gatatacccg gtggatcaga tgcatttgaa cttgctgcaa aattttgtta tggaataaat 1020 tttgagataa gcacagaaaa cattgccttg ctgagatgca cagcggaata tcttgagatg 1080 acagaagact atgcagttgg gaatttggtt ggaagaactg aggcctactt aaatgaagta 1140 gctcttaaaa gcctagctgg tgcagtttca attttgcatt cttcagaaag ccttcttccc 1200 attgcagaga aagtaaaaat ggttagtcga tgcatcgaca caattgcata tattgcatgc 1260 aaggataacc aattctgcac atcaggtaga gcagaggctg gtactaacgg attgaattcg 1320 tccacgtttt caaacccgaa gcctatggtt gattggtggg ctgaggattt agctgtcctt 1380 agaattgatt ttttccaaag ggttctaatt gcaatgatgg gaagaggatt caagcagtat 1440 gcacttggac caatattaat gctatatgca cagaagtctc ttcgaggttt ggtgaggcct 1500 tgtcctataa tataatctgg attatttagt taaaatattt acgcagatag taattttttt 1560 gtttatcaca ggaaatattt ggaaagggaa ggaaaaaaat tgagccaaaa caagaacatg 1620 aaaagagggt tgttttagaa acaattgtta gtcttctgcc aagggagaaa aatgcattgt 1680 cagttagctt tctgtcaatg ctgctccgag ctgcaatata tctagaaacc acagttgctt 1740 gcaggcttga cttggagaag aggatggcat tgcagcttgg acaggctgtg ttagatgatt 1800 tattgattcc ttcatattcc ttcacagggg acacattgtt tgatgttgaa accgtgcagc 1860 gtatcatcat gaatttcctt gacaatgaaa tggatggaag tcgattggga gatgaggagt 1920 atgtgtctcc ttcattaagt gacatggagc gggttgggaa acttatggaa aattaccttg 1980 ctgaaatagc ctcagaccgt aatctatccg tttcaaaatt cattagtcta gctgaagtca 2040 tcccagagca agcaaagatc actgaagatg ggatgtacag ggcaattgat atttatttga 2100 aggtatgcgc gatgaaatac ttgattagtt ataaatttat ctatgcatat ttacacatac 2160 aggagcattt tcatagtttt agatcatgtt tagaaaagga gaaaaacttt tgctcccgac 2220 tgctacatgg taattggcat gctaaactta gtaatcttga ttgaaatgcc ttctacaaca 2280 atgtacctct tggtcctagc ataattatga ctgagagaag actttgggaa taaacaaaat 2340 cagaaaatat gtcaccaatg aagaaccagt cattttcaca aaatccttgc tcctcaatta 2400 ttttttttgc aggcattgct cggtccgcct catgattttg acccaagccc atgtcctata 2460 ctcctttacc ctacaaccat tttgtgagac tgatgttgtc tggagtttcg aatctcgttt 2520 cttcccctgt cctgaacatc tatctcatgg tgcatttatc ctgcacctgg tttgaacttt 2580 gaatatgtgt tcaattcaac tcaccgtgtc ttacttagac catatatata tatactagta 2640 gttttagcta agggatatgg tatgttagga agaagaacat tcctcatttc aaatggactt 2700 aaggggaagc tcccttagta tattacttag gtattatagt atgtttttgt gaggaataat 2760 ttggagtaaa gagtagctgt gaagcatgtt aaagcacatg actgaggtgg tactttaaat 2820 cgttgtgtcg ctcatcatta gggaatgcca gatcaggctt ttttaatttt tatattctgt 2880 ttccgagtat ataatttctt cttgatacag acggtataac aggacttaat cagggtaatt 2940 aattagtatc tgcacgtgca agatcaattt aaatgtaggt taaatatgtt agtacttagt 3000 accttctcat cattgaagaa attaatagag gacgaacata tatatatata tatatatata 3060 tatatatata tttctctgca cgtgtattgc atgtgtatgc caaattatat aatatctaat 3120 tttataacat aatattaata ttattaaaaa aaattccgaa caaataatta tacataaaat 3180 aaggtacaag tatttacgaa ttgatccatg taaatcagca tatattgact ttgaaagttc 3240 gtcccaaaca aacactttta actttgcaac cattcttaca cgaaacaaca taatatgtaa 3300 atgtagcttg gtggctaaac taacaaacca taaactcatt gctaatgtct tcgtaaaaaa 3360 atgtatgtca caaaaccgct taagttggta atttaatatt tcatgaaaag actttgtaag 3420 gctaattaac aaaatattta atttgaatta tcttatttag ggagtagtat ttaattttaa 3480 atattttatt ttgatgttat ttttgcaggt tcttttttct tttgacttaa aagtattaat 3540 tcaatttttc aagattcatc attaaaacac aatttaatag gctattcgag atatagggaa 3600 cttgaatatg aaaataactt ttaaataaga atatgagtag taattattta ttgcgagcga 3660 cacaatttta tttttttgtt aattttctta aagaaaaaaa gaaagagacc gccacttttg 3720 tataataaat actcttaatc tgattttaaa ttaattataa taattgaagt ttactacttg 3780 tttagtttca aaatctgtct gttaaagaaa aattataact gcttgaattt ggagatgaac 3840 gatctatgtg gaaaatagtt tttttatttg aatttaaaat aaatgactta tattgcaaca 3900 tgcaaacatt gcgtcgtctt gtctaaagca gccagtagga aagcattgtc taaataaaaa 3960 gccagtagaa aagccgaaaa cagtagataa atacaacaat cattttcttt ctccacttct 4020 taaaataatg atcacccaat agaaaaaaaa atatagattt ttttcgtaag ttaaatactt 4080 tagattatct caatatatgt gcagaatttt agcaccgttt gtgaattaaa atttgaagac 4140 tcgactaaac tttaaataaa aaggtcaaaa gaaaggtatg agtgcaattt aataacaaaa 4200 aaaaggcaca cagcaaaaga agaatacctt tcaatgatga attttataga attgctgatg 4260 agactaagta atcggggtgc gtttttaagt cactctctgc ttaactgtaa ataaatacat 4320 acttatttat tatcaagaag ttagaacact cttcgtcttc tattccttta gaatatatct 4380 gtgtgagttt atggaacaaa ggcttttttt tatttgaata gtaagccaat tgtttctcta 4440 tctattctaa aagatgccaa acggttgaaa gacaaaatca aatgggaacc ggtagaaact 4500 attttaagca ttattgacta atatgaaaga tcacatccct tcaaataaat ttggtattta 4560 cttaaaattt ttggtataaa taaaattaaa ttatttagaa aggcatttag gtaattcaac 4620 tttttggtta agagcttcct acatatatat atatatatat atatgtgcgt gtgtgcaaaa 4680 tattatagat attaagtttt gaacccataa tctaaaaaat ctcataacct tgaacccatt 4740 aaatttaaat cttggatccg cctccttttg cattgcatag atcattgcta caatgtggtg 4800 gctcttgttt tctcttgcct atgttgcagg gcttgctgtg cataggtctt catacttgag 4860 gtctttttct ataatttgac accttaatgt taaccagggt gaaataagga tctggtatct 4920 gctcgttgac ccttcgcttt ctcctttcaa ctgtaggtca aatttgtcat aacatcctaa 4980 agaatcttgt gtgccaatac atacttcgta tatggtatct catccaaaag aagaagctcg 5040 tttatatgct catatatatg caaactgcca cccccccccc cccggttact ctttctaatt 5100 taaaaggtaa gaatagactc aataggtttt tgctacagaa gctctgaatc ttattgctat 5160 tcagtcacgt cacataataa caagatctaa accatgtata ccatttgatc tnnnnnnnnn 5220 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5280 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5340 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5400 nnnnnttttt tttttttttt tttttttttg cttttggtgc caaagggtat taagtagcat 5460 ccattcattg cgtagtgttt cttgagtaca taatagtaat ctgtttgcct ctaacatctc 5520 taagacaatc ataggaagaa atccaaaatg tattatccta gtagactcct tcatcctacc 5580 accaaatttg gctaattgat ttgctacttt tgttctgctc cttgtaatta tgctcaatca 5640 gagggtctcc gagctggctg agaaatgata ttagaataat gtgaaatccc atttgatgat 5700 cttcacatat gttgttagta catcaaatat attcttgaac aatgagttga acttcatcag 5760 aaagtttaag ctttttaaaa tgcagaacaa aagtgtggaa cccttaaacc atgctaatga 5820 gcattatctt cataccggtt aaaactactt tcatctttct aatgtttttg ctgttgcata 5880 atttgaaggc acatccagct ctaagtgata tggaaagaaa aaaagtttgc ggtgttatgg 5940 actgtcaaaa gctatctaga gaggcttgtg ctcatgctgc tcaaaatgat aggctccctg 6000 ttcagacagt tgtgcaagta ctttactacg agcagcaacg ccttcgtgag gtcatggacg 6060 ggagccaact tgtagcaact gaacctccag ctctaattcc ttctaaaact aatcagttct 6120 ccactgatat ccgtcctatt tcagatgagg tctctagtct aaaacgagaa aatcaggagc 6180 tgaaatttga gttgctaaag atgaaaatga ggttgaaaga aattgaaaaa ccttcaaaca 6240 aatcagctac tagcagccct ttggtcatca ctcatccatc tgctgataaa cctcctttgc 6300 caagaaaacc atctaatttc ataagctcag tatccaaaaa gcttggaaaa tttattcgag 6360 cagatggact cacagccaac aaaggccgaa ataaaccaag taaagacagg cgtcattcta 6420 tatcctgatt tgagctagct atatttgtcg ttgggttgaa gaattattac tgcattgtct 6480 gaacatatat gatactggat tcaaatttta gtttttattt tagtcgtgcg agttgtatgg 6540 taaagtataa atttggtcag actttaatcc aaaaattgta tttagatgga cgtggacgac 6600 ttcctgtaca ttatctatga aagattttta atcttggttt ctcttatatg tatcttgaag 6660 aaagatttgc aatcttgaga tgtacaag 6688 <210> 4 <211> 620 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0000651g0020.2 amino acid sequence <400> 4 Met Ala Asp Leu Asp Ser Asp Gly Ile Glu Gln Pro Ser Gly Val Asn 1 5 10 15 Asn Met Ser Thr Thr Lys Lys Glu Leu Leu Ser Thr Ala Met Lys Arg 20 25 30 Thr Ser Asp Trp Ile Phe Ser Gln Glu Ile Pro Ser Asp Val Thr Val 35 40 45 Asn Ala Gly Gly Ser Ala Phe Ser Leu His Lys Phe Pro Leu Val Ser 50 55 60 Lys Ser Gly Tyr Ile Arg Lys Ile Ile Ser Glu Ser Asn Asp Ala Asp 65 70 75 80 Ala Ser Thr Val Glu Ile Pro Asp Ile Pro Gly Gly Ser Asp Ala Phe 85 90 95 Glu Leu Ala Ala Lys Phe Cys Tyr Gly Ile Asn Phe Glu Ile Ser Thr 100 105 110 Glu Asn Ile Ala Leu Leu Arg Cys Thr Ala Glu Tyr Leu Glu Met Thr 115 120 125 Glu Asp Tyr Ala Val Gly Asn Leu Val Gly Arg Thr Glu Ala Tyr Leu 130 135 140 Asn Glu Val Ala Leu Lys Ser Leu Ala Gly Ala Val Ser Ile Leu His 145 150 155 160 Ser Ser Glu Ser Leu Leu Pro Ile Ala Glu Lys Val Lys Leu Val Ser 165 170 175 Arg Cys Ile Asp Thr Ile Ala Tyr Ile Ala Cys Lys Asp Asn Gln Phe 180 185 190 Cys Thr Ser Gly Arg Ala Glu Pro Gly Thr Asn Gly Leu Asn Ser Ser 195 200 205 Thr Phe Ser Asn Pro Lys Pro Met Val Asp Trp Trp Ala Glu Asp Leu 210 215 220 Thr Val Leu Arg Ile Asp Phe Phe Gln Arg Val Leu Ile Ala Met Met 225 230 235 240 Gly Arg Gly Phe Lys Gln Tyr Ala Leu Gly Pro Ile Leu Met Leu Tyr 245 250 255 Ala Gln Lys Ser Leu Arg Gly Leu Glu Ile Phe Gly Lys Gly Arg Lys 260 265 270 Lys Ile Glu Pro Lys Gln Glu His Glu Lys Arg Val Val Leu Glu Thr 275 280 285 Ile Val Ser Phe Leu Pro Arg Glu Lys Asn Ala Leu Ser Val Ser Phe 290 295 300 Leu Ser Met Leu Leu Arg Ala Ala Ile Tyr Leu Glu Thr Thr Val Ala 305 310 315 320 Cys Arg Leu Asp Leu Glu Lys Arg Met Ser Leu Gln Leu Gly Gln Ala 325 330 335 Val Leu Asp Asp Leu Leu Ile Pro Ser Tyr Ser Phe Thr Gly Asp Thr 340 345 350 Leu Phe Asp Val Glu Thr Val Gln Arg Ile Ile Met Asn Phe Leu Asp 355 360 365 Asn Glu Met Asp Gly Ser Arg Leu Gly Asp Glu Glu Tyr Val Ser Pro 370 375 380 Ser Leu Ser Asp Met Glu Arg Val Gly Lys Leu Met Glu Asn Tyr Leu 385 390 395 400 Ala Glu Ile Ala Ser Asp Arg Asn Leu Ser Val Ser Lys Phe Ile Ser 405 410 415 Leu Ala Glu Val Ile Pro Glu Gln Ala Lys Ile Thr Glu Asp Gly Met 420 425 430 Tyr Arg Ala Ile Asp Ile Tyr Leu Lys Ala His Pro Ala Leu Ser Asp 435 440 445 Met Glu Arg Lys Lys Val Cys Gly Val Met Asp Cys Gln Lys Leu Ser 450 455 460 Arg Glu Ala Cys Ala His Ala Ala Gln Asn Asp Arg Leu Pro Val Gln 465 470 475 480 Thr Val Val Gln Val Leu Tyr Tyr Glu Gln Gln Arg Leu Arg Glu Val 485 490 495 Met Asp Gly Ser Gln Leu Val Ala Thr Glu Pro Pro Thr Leu Ile Pro 500 505 510 Ser Lys Thr Asn His Phe Ser Ile Asp Ile Pro Pro Val Ser Asp Glu 515 520 525 Val Ser Ser Leu Lys Arg Glu Asn Gln Glu Leu Lys Phe Glu Leu Leu 530 535 540 Lys Met Lys Met Arg Leu Lys Glu Ile Glu Lys Pro Ser Asn Lys Ser 545 550 555 560 Ala Ala Ser Ser Pro Leu Val Ile Thr His Pro Ser Ala Asp Lys Pro 565 570 575 Pro Leu Pro Arg Lys Pro Ser Asn Phe Ile Ser Ser Val Ser Lys Lys 580 585 590 Leu Gly Lys Phe Ile Arg Ala Asp Gly Leu Thr Ala Asn Lys Gly Arg 595 600 605 Asn Lys Pro Ser Lys Asp Arg Arg His Ser Ile Ser 610 615 620 <210> 5 <211> 1863 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0000651g0020.2 coding sequence <400> 5 atggcggatc ttgattcaga tgggattgaa caaccctctg gtgttaacaa tatgtccact 60 acaaagaagg agcttctttc cactgctatg aagaggacct ctgattggat tttctcccaa 120 gagatcccaa gtgatgtaac tgtaaatgca ggcggatccg ccttttcact gcacaagttc 180 cctttagtct caaagagtgg atacataagg aagattatct cagaatccaa cgatgctgat 240 gcttctacag tcgaaatccc tgatataccc ggtggatcag acgcatttga actggccgca 300 aaattttgtt atggaataaa ttttgagata agcacagaaa acattgcctt gctgagatgc 360 acagcggaat atcttgagat gacagaagac tatgcagttg ggaatttggt tggaagaact 420 gaggcctact taaatgaagt agctcttaaa agcctagctg gcgcagtttc aattttgcat 480 tcttccgaaa gccttcttcc cattgcagag aaagtaaaac tagttagtcg atgcatcgac 540 acaattgcat atattgcatg caaggataac caattctgca catcaggtcg agcagagcct 600 ggtactaacg gattgaattc gtccacgttt tcaaacccga agcctatggt tgattggtgg 660 gctgaggatt taactgtcct tagaattgat tttttccaaa gggttctaat tgcaatgatg 720 ggaagaggat tcaagcagta tgcacttgga ccaatattaa tgctctatgc acagaagtct 780 cttcgaggtt tggaaatatt tggaaaggga aggaaaaaaa ttgagccaaa acaagaacat 840 gaaaagaggg ttgttttaga aacaattgtt agttttctgc caagggagaa aaatgcattg 900 tcagttagct ttctgtcaat gctgctccga gctgcaatat atctagaaac cacggttgct 960 tgcagacttg acttggagaa gagaatgtca ttgcagcttg gtcaggctgt attagatgat 1020 ctgttaattc cttcatattc cttcacaggg gatacattgt ttgatgttga aaccgtgcag 1080 cgtatcatca tgaatttcct tgacaatgaa atggatggaa gtcgattggg agatgaggag 1140 tatgtgtctc cttcattaag tgacatggag cgggttggga aacttatgga aaattacctt 1200 gctgaaatag cctcagaccg taatctatcc gtttcaaaat tcattagtct tgctgaagtc 1260 atcccagagc aagcaaagat cactgaagat gggatgtaca gggctattga tatttatttg 1320 aaggcacatc cagctctaag tgacatggaa agaaaaaaag tttgcggtgt tatggactgt 1380 caaaagctat ctagagaggc ttgtgctcat gctgctcaaa atgataggct ccctgttcag 1440 acagttgtgc aagtacttta ctacgagcag caacgccttc gtgaggtcat ggacgggagc 1500 caacttgtag caactgaacc tccaactcta attccttcta aaacgaatca cttctccatt 1560 gatatccctc ctgtttcaga tgaggtctct agtctaaaac gagaaaatca ggagctgaaa 1620 tttgagttgc taaagatgaa aatgaggttg aaagaaattg aaaaaccttc aaacaaatca 1680 gctgctagca gccctttggt catcactcat ccatctgctg ataaacctcc tttgccaaga 1740 aaaccatcta atttcattag ctcagtatcc aaaaagcttg gaaaatttat tcgagcagat 1800 ggactcacag ccaacaaagg ccgaaataaa ccaagtaaag ataggcgtca ttctatatcc 1860 tga 1863 <210> 6 <211> 3998 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0000651g0020.2 genomic sequence <400> 6 cctacgtcca cacactgaac taaatccttt tccactctat ttaaccccaa tcattcacat 60 aataccttta ataccatgta ggggctcctc acatatgatc tttctcctgc taacattaag 120 gcctataatg ggaattgtac caatgccatg attgatagtg aaagatgata acaataatgc 180 aattattagg ggccagatac tgttgattaa atgctcagac attgaactaa cagaagcaaa 240 ggaaaagaac atatctttct gttttttgct ccataaggaa acagcttaag agaatcctct 300 accatagacc aaatgtgatg gagatggtta agacccttta aagtttcaat catggcggat 360 cttgattcag atgggattga acaaccctct ggtgttaaca atatgtccac tacaaagaag 420 gagcttcttt ccactgctat gaagaggacc tctgattggt atgctctata tatcttgact 480 tcttattgtg ctttctaata gtagcccctt ttatgtacta ttattgaatt attattaatc 540 tgtttctcaa gatactcact ggaaaggtaa ttgtaggtat tgataaatga gttacctgta 600 taatcttgac aggattttct cccaagagat cccaagtgat gtaactgtaa atgcaggcgg 660 atccgccttt tcactgcaca aggtgcgttg cgctctctgc ttttatcata attaagttac 720 aactaactcc gggttcaatc aaaattgttg ttggttttag ttaagttcct atttggattg 780 agttatcagc cctggtcaca cctcaatgag aatatgaatt tggtgatttt ttctcttttc 840 tgacgattga atcacaaggt tcaataatga tttattgtgt tccatgcagt tccctttagt 900 ctcaaagagt ggatacataa ggaagattat ctcagaatcc aacgatgctg atgcttctac 960 agtcgaaatc cctgatatac ccggtggatc agacgcattt gaactggccg caaaattttg 1020 ttatggaata aattttgaga taagcacaga aaacattgcc ttgctgagat gcacagcgga 1080 atatcttgag atgacagaag actatgcagt tgggaatttg gttggaagaa ctgaggccta 1140 cttaaatgaa gtagctctta aaagcctagc tggcgcagtt tcaattttgc attcttccga 1200 aagccttctt cccattgcag agaaagtaaa actagttagt cgatgcatcg acacaattgc 1260 atatattgca tgcaaggata accaattctg cacatcaggt cgagcagagc ctggtactaa 1320 cggattgaat tcgtccacgt tttcaaaccc gaagcctatg gttgattggt gggctgagga 1380 tttaactgtc cttagaattg attttttcca aagggttcta attgcaatga tgggaagagg 1440 attcaagcag tatgcacttg gaccaatatt aatgctctat gcacagaagt ctcttcgagg 1500 tttggtgagg ccttgtccta taatatactc tggattattt ggttaaaatg aaatatttat 1560 gcaaatagta aacttttttg tttatcacag gaaatatttg gaaagggaag gaaaaaaatt 1620 gagccaaaac aagaacatga aaagagggtt gttttagaaa caattgttag ttttctgcca 1680 agggagaaaa atgcattgtc agttagcttt ctgtcaatgc tgctccgagc tgcaatatat 1740 ctagaaacca cggttgcttg cagacttgac ttggagaaga gaatgtcatt gcagcttggt 1800 caggctgtat tagatgatct gttaattcct tcatattcct tcacagggga tacattgttt 1860 gatgttgaaa ccgtgcagcg tatcatcatg aatttccttg acaatgaaat ggatggaagt 1920 cgattgggag atgaggagta tgtgtctcct tcattaagtg acatggagcg ggttgggaaa 1980 cttatggaaa attaccttgc tgaaatagcc tcagaccgta atctatccgt ttcaaaattc 2040 attagtcttg ctgaagtcat cccagagcaa gcaaagatca ctgaagatgg gatgtacagg 2100 gctattgata tttatttgaa ggtatgcgcg atgataattt ttctaattat aatttttcta 2160 tgcatattta cacatacagg agcattttca tagatttaga tcatgtttag aaaaggagaa 2220 aaccttttgg tcctgattgc tacatggtaa ttggcatgct aaacttaatg atcttggttg 2280 ggataccttc tatagaaatg ttgttcttgg tgctaacaca attcagtccg agagatgatt 2340 ttgggaataa gcaaaatcag aaaatatgtc accaatgaag aaccattcgt catcacagaa 2400 tccttgcctt gcaggcattg ctcggccagc cttgtgattt tgacccaatc ccatgtctta 2460 tactccttta ccctacaacc attttatgag gctgatgttg tccggagttt caaatctcat 2520 attttcccct ttcccaaaca tctatctcat ggtgcatcta ttctgtacca gggcagacct 2580 atagttttga acatgggatc aattgaactc acaatttttt ttttaaaaaa aaattataaa 2640 ttttaaggtt tgaacccata atttcaaaaa actaagaaac ttggtagagg ttcatcacta 2700 cagtgtggtg gctttgtttt ctcttgtcta tgtgcaggcc ttgctgttta taggtattca 2760 tacttgaggt cttttctatc atttgaaacc ttaataagga tcttgagttt gcttgttgac 2820 gtggactttt ctcctttcag ttttaggtca aactagtaat aacatcctaa aaaatttggc 2880 atgccaatac atagttcata tatggtatct tatcctaaag aagaagctgt atatataagc 2940 tcatagatat gtaaactgca ctcccctgtt actctctcta atttaaaaaa agagataatg 3000 atggactcaa taggttctcg ctacagaagc tctgaatctt attgctgccc ggtcacgtaa 3060 taacaagatc ttattgtgaa atcccagttg atgatgttca catgtttggt cagtacatca 3120 aatatattct tgaacaaagt ttcaggtcgt taaaatgcag aataaaagtg tggaaccaag 3180 ctaacatgat attggtatca tcaattaaaa tcttgtgtaa tgtttttggt gttgcataat 3240 ttgaaggcac atccagctct aagtgacatg gaaagaaaaa aagtttgcgg tgttatggac 3300 tgtcaaaagc tatctagaga ggcttgtgct catgctgctc aaaatgatag gctccctgtt 3360 cagacagttg tgcaagtact ttactacgag cagcaacgcc ttcgtgaggt catggacggg 3420 agccaacttg tagcaactga acctccaact ctaattcctt ctaaaacgaa tcacttctcc 3480 attgatatcc ctcctgtttc agatgaggtc tctagtctaa aacgagaaaa tcaggagctg 3540 aaatttgagt tgctaaagat gaaaatgagg ttgaaagaaa ttgaaaaacc ttcaaacaaa 3600 tcagctgcta gcagcccttt ggtcatcact catccatctg ctgataaacc tcctttgcca 3660 agaaaaccat ctaatttcat tagctcagta tccaaaaagc ttggaaaatt tattcgagca 3720 gatggactca cagccaacaa aggccgaaat aaaccaagta aagataggcg tcattctata 3780 tcctgatttg agctagctat atttgtcgtt gggttgaaga attttactgc attatattgt 3840 ctgaacatat atgatactgg attcaaattt tagcttttat tttagtcgtg cgagttttat 3900 ggtaaagtat aaatttggtc atgctttaat ccaaaaattg tatttagatg gacgtggacg 3960 acttcctgta cattatctat gaaagatttg taatcttg 3998 <210> 7 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0009137g0040.2 amino acid sequence <400> 7 Met Val Asp Leu Gly Ser Asp Glu Thr Ala Gln Pro Ser Thr Thr Val 1 5 10 15 Asn Met Phe Thr Lys Lys Lys Glu Leu Leu Ser Asn Val Met Lys Arg 20 25 30 Thr Ser Glu Trp Ile Leu Ser Gln Glu Ile Pro Ser Asp Ile Thr Val 35 40 45 His Val Ala Gly Thr Ser Phe Ala Leu His Lys Phe Pro Leu Val Ser 50 55 60 Lys Cys Gly Tyr Ile Arg Lys Leu Val Ala Lys Ser Asn Asp Ala Asn 65 70 75 80 Leu Ser Val Phe Glu Ile Pro Asp Ile Pro Gly Gly Ala Glu Ala Phe 85 90 95 Glu Phe Ala Ala Lys Phe Cys Tyr Gly Ile Asn Phe Glu Ile Ser Ser 100 105 110 Gly Asn Val Ala Leu Leu Arg Cys Val Ala Glu Tyr Leu Asp Met Thr 115 120 125 Asp Asp Tyr Ala Val Gly Asn Leu Val Gly Leu Ser Glu Ala Tyr Leu 130 135 140 Asn Glu Leu Ala Leu Lys Ser Ile Ala Gly Ala Val Ser Val Leu His 145 150 155 160 Ser Ser Glu Lys Leu Leu Pro Ile Ala Glu Asn Ile Lys Leu Val Asn 165 170 175 Arg Ser Ile Asp Thr Ile Ala Tyr Met Val Cys Lys Asp Ser His Phe 180 185 190 Cys Lys Ser Gly Arg Ile Glu Val Asp Ala Asn Ser Leu Thr Asn Ser 195 200 205 Ser Thr Phe Ser Asn Pro Arg Thr Ile Val Val Asp Trp Trp Ala Glu 210 215 220 Asp Leu Thr Val Leu Arg Ile Asp Phe Phe Gln Arg Val Leu Ile Ala 225 230 235 240 Met Met Ala Arg Gly Tyr Lys Gln Tyr Ala Leu Gly Pro Val Leu Met 245 250 255 Leu Tyr Ser Gln Lys Ser Leu Gln Asn Leu Glu Ile Ser Gly Asn Glu 260 265 270 Arg Lys Met Thr Glu Leu Arg Gln Val His Glu Lys Arg Val Val Val 275 280 285 Glu Thr Ile Val Ser Leu Leu Pro Arg Glu Lys Asn Ala Leu Ser Val 290 295 300 Ser Phe Leu Ser Met Leu Leu Arg Ala Ala Ile Tyr Leu Glu Thr Thr 305 310 315 320 Val Ala Cys Arg Val Asp Leu Glu Arg Arg Ile Ala Leu Gln Leu Gly 325 330 335 Gln Ala Val Leu Asp Asp Leu Leu Ile Pro Ser Tyr Ser Ser Phe Thr 340 345 350 Glu Asp Thr Leu Phe Asp Val Glu Ile Val Gln Arg Ile Met Thr Tyr 355 360 365 Phe Ile Glu Tyr Glu Met Val Glu Asn Gln Phe Gly Phe Asn Asp Glu 370 375 380 Glu Tyr Val Pro Pro Leu Ala Thr Glu Met Glu Lys Val Gly Glu Leu 385 390 395 400 Met Glu Asp Tyr Leu Ala Lys Ile Ala Ser Asp Asn Asn Leu Ser Val 405 410 415 Ser Gln Phe Ile Ser Ile Ala Glu Val Ile Pro Glu Lys Ser Arg Ile 420 425 430 Thr Glu Asp Arg Met Tyr Lys Ala Ile Asp Thr Tyr Leu Lys Ala His 435 440 445 Pro Ala Leu Ser Asp Ile Glu Arg Lys Arg Val Cys Ser Val Met Asn 450 455 460 Cys Gln Lys Leu Thr Arg Glu Ala Cys Ala His Ala Ala Gln Asn Glu 465 470 475 480 Arg Leu Pro Val Gln Thr Val Val Gln Val Leu Tyr Phe Glu Gln Gln 485 490 495 Arg Leu Arg Gln Val Met Asp Gly Ser Leu Asp Gly Ala Asp Glu Ser 500 505 510 Ser Thr Asp Asn Asn Pro Val Thr Asp Glu Val Ser Ser Leu Lys Arg 515 520 525 Glu Asn Gln Asp Leu Lys Phe Glu Leu Val Lys Met Lys Thr Arg Leu 530 535 540 Asn Glu Ile Glu Lys Cys Gly Asp Ile Ser Ala Thr Ser Thr Pro Val 545 550 555 560 Glu Ile Thr Thr Pro Ile Ser Ser Asp Lys Pro Arg Leu Arg Arg Lys 565 570 575 Ser Phe Ile Ser Ser Val Ser Glu Thr Leu Gly Lys Leu Tyr Pro Ile 580 585 590 Ser Phe Gly Ala Asp His Val Ile Met Pro Ser Ala Ser Lys Gly Arg 595 600 605 Tyr Lys Pro Ile Ser Arg Asp Arg Arg Tyr Ser Ile Ser 610 615 620 <210> 8 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0009137g0040.2 coding sequence <400> 8 atggttgatc ttggttcaga cgagactgca caaccttcaa ctactgttaa catgttcact 60 aagaaaaaag agcttctttc caatgttatg aaaaggacct ccgaatggat tttatcccag 120 gagatcccaa gtgatataac tgttcatgtt gcaggaactt cctttgctct gcacaagttc 180 ccactagtct caaagtgcgg atatataagg aagttggtcg caaaatccaa tgatgctaat 240 ctttctgtat tcgaaatccc tgacattcct ggtggagcag aggcatttga atttgcagca 300 aaattttgtt atggaataaa ctttgagata agctcaggaa acgtcgcatt gcttagatgt 360 gtagcagaat atcttgatat gacagatgac tatgcagttg gaaatttggt aggattatca 420 gaagcctact taaacgagtt agcacttaag agcattgcag gtgcagtttc cgtcttgcac 480 tcttcagaaa aacttcttcc aattgcagaa aatataaaat tggtgaacag aagcatagat 540 acaattgcat acatggtttg caaggatagc catttttgta agtcaggtag aatagaggtc 600 gacgctaata gtttgacgaa ttcctccaca ttttcaaatc cgaggaccat tgttgttgat 660 tggtgggctg aggatttaac tgtccttaga attgattttt tccaaagggt tctaattgct 720 atgatggcta ggggatacaa acagtatgca cttggaccag tattgatgct ctattcgcag 780 aaatcccttc aaaatttgga aatatcagga aatgagagga aaatgactga gctgagacaa 840 gtacatgaaa agagggttgt tgttgaaacc atagttagtc ttctgccaag ggagaaaaat 900 gcattgtcag ttagttttct ctcaatgctt cttcgcgctg caatatatct tgaaaccaca 960 gttgcttgta gggttgatct ggagaggaga atcgcgttgc aacttggaca agctgtatta 1020 gatgatttgc taattccttc atattcttcc ttcacagaag acacattatt tgatgttgaa 1080 atcgtgcaac gtatcatgac gtatttcatt gagtatgaaa tggtggaaaa tcagtttggc 1140 ttcaacgatg aagagtatgt gccgccatta gcaactgaaa tggagaaagt tggggaactc 1200 atggaagatt accttgctaa aatagcctca gacaataatc tctctgtttc gcagtttatc 1260 agtattgctg aagtcattcc agagaaatca aggatcacag aagataggat gtacaaggcc 1320 attgacactt atttgaaggc acatccagct ctaagtgaca ttgagagaaa aagagtttgc 1380 agtgttatga actgtcaaaa gctaactcga gaagcttgtg ctcatgctgc tcagaatgag 1440 aggctccctg ttcagactgt tgtgcaagtg ctttactttg aacaacaacg ccttcgccaa 1500 gttatggatg gtagtctaga cggggcagat gagtcatcca ccgacaataa ccctgttaca 1560 gatgaagtct caagtctaaa aagagaaaat caagatctaa aattcgagct agtgaaaatg 1620 aaaacgaggt tgaatgaaat tgaaaaatgt ggtgatatat cagctactag tacccctgtg 1680 gagatcacca ctccaatatc ttctgataaa cctcgtctgc gaagaaaatc tttcataagc 1740 tcagtttccg aaacgcttgg gaaactgtat ccaatatcat ttggagctga tcatgtaatc 1800 atgccatcgg ccagcaaagg aagatataaa ccaattagta gagataggcg ttattcgata 1860 tcatga 1866 <210> 9 <211> 4169 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0009137g0040.2 genomic sequence <400> 9 ctatatccta atatatttaa ccccagtacc ttcacataaa catatgtaac actactcgtg 60 tcatgtgtct agtagaggct cactcgtaca caatctttcc actgccaact ttctggccta 120 taatgggaat tctgcaatct tatgattgat actggctgct gacagtaata tataatgcag 180 tttacggacc aacactgaag ttgtacttat tccctaactg ttgatctctt attcttttgt 240 gggtgaaaga gaattaatta aagaagcagg ggaaaggaca tagtacatac tagtttttgc 300 tttatcaaga attatataat aggccaatat ggttgatctt ggttcagacg agactgcaca 360 accttcaact actgttaaca tgttcactaa gaaaaaagag cttctttcca atgttatgaa 420 aaggacctcc gaatggtacg tagtctatct tcagttattt ctctctcttt tgttgtttcc 480 agcgtacttt tacgcgtctt tatgcaattt ttccgtgtaa catgatcagt agtggagggt 540 aaaatgtagg cattgatgaa tgagtgacct ttatattatc tgcaggattt tatcccagga 600 gatcccaagt gatataactg ttcatgttgc aggaacttcc tttgctctgc acaaggtaca 660 acctttttcc ttgttctaag aagttcctaa tatatttcaa ctagaacaca aatcaagatt 720 gttcttttca gtaactagtt acacttatta tggcagttac ctatagtcat ctaaaattat 780 tttatactgt cagtaagtag aagttaaact cttaactaaa aggtgaagtc tttgataatg 840 agtactttta tgttccatgc agttcccact agtctcaaag tgcggatata taaggaagtt 900 ggtcgcaaaa tccaatgatg ctaatctttc tgtattcgaa atccctgaca ttcctggtgg 960 agcagaggca tttgaatttg cagcaaaatt ttgttatgga ataaactttg agataagctc 1020 aggaaacgtc gcattgctta gatgtgtagc agaatatctt gatatgacag atgactatgc 1080 agttggaaat ttggtaggat tatcagaagc ctacttaaac gagttagcac ttaagagcat 1140 tgcaggtgca gtttccgtct tgcactcttc agaaaaactt cttccaattg cagaaaatat 1200 aaaattggtg aacagaagca tagatacaat tgcatacatg gtttgcaagg atagccattt 1260 ttgtaagtca ggtagaatag aggtcgacgc taatagtttg acgaattcct ccacattttc 1320 aaatccgagg accattgttg ttgattggtg ggctgaggat ttaactgtcc ttagaattga 1380 ttttttccaa agggttctaa ttgctatgat ggctagggga tacaaacagt atgcacttgg 1440 accagtattg atgctctatt cgcagaaatc ccttcaaaat ttggtgagtc ctcatcccat 1500 gagtttagat tatttggtta gagataataa caacaacaat aacaacaata acaacagtgg 1560 agtctgggga aggtaatacg tacgcagacc ttatccctac cctcagggag gattatttgg 1620 ttagagaaag taacataaat agtgatcttt tatgttaatc aaaattgaac acctatggcc 1680 gctgttatat ttaatacaca aaatgtgcgc agtttttttt tttaacacga aggactaaac 1740 ctgctcagtt gaatagttaa aggattattt tagaccaagg ctcaaacata agaaagtatt 1800 ttaggcatgt gctcaatttg gataattgaa atatttatgc atatgatttt cttgttattc 1860 caggaaatat caggaaatga gaggaaaatg actgagctga gacaagtaca tgaaaagagg 1920 gttgttgttg aaaccatagt tagtcttctg ccaagggaga aaaatgcatt gtcagttagt 1980 tttctctcaa tgcttcttcg cgctgcaata tatcttgaaa ccacagttgc ttgtagggtt 2040 gatctggaga ggagaatcgc gttgcaactt ggacaagctg tattagatga tttgctaatt 2100 ccttcatatt cttccttcac agaagacaca ttatttgatg ttgaaatcgt gcaacgtatc 2160 atgacgtatt tcattgagta tgaaatggtg gaaaatcagt ttggcttcaa cgatgaagag 2220 tatgtgccgc cattagcaac tgaaatggag aaagttgggg aactcatgga agattacctt 2280 gctaaaatag cctcagacaa taatctctct gtttcgcagt ttatcagtat tgctgaagtc 2340 attccagaga aatcaaggat cacagaagat aggatgtaca aggccattga cacttatttg 2400 aaggtatgca cgttgaatca ttcgcccggt ggagcaattt ttctatgtgc actagtacac 2460 ctacaagggc atgatcgtat atttaggtca tactaaatgt ttaatttaat atgtattata 2520 agcattcatt aactcctcca aaaacaaatc tttgaagcca actgctaaat agtaatggct 2580 taatcaactg ctttagtacc ttgattgaaa tatcaaattc tttaatgaca tatttttgat 2640 aggttgcacc taaacagtgg aaatattgtg gcttgggatg ttaagtggta tttgaatcct 2700 tatgatctct tgcataaatc cattaaaggc ataattcagt taagtgaaga tgttttttca 2760 atatacaagt gaaactaagg gttgaatttt acttctctgc tacagaagcc atcttatgtt 2820 agaattgccc tgcatcttag gttacgatat cacgtgtttc tgcctatgca tttacaggat 2880 attaaacatg ttatatgttg atgttctttc aagtgtgtca tctttagatc aaatgtacag 2940 tttaacaaac agttacattt gataataagc aggtttatag ctaagcagct tgtcatactg 3000 tggcaagaaa gacttttgaa acttcagatc atgcttagtt gatcttcgtc ataaataaag 3060 gattttaggt catatacact catagaaggg gagccttggc gtaactggta aagttactgc 3120 catgtgacca agaagtcatg ggttcgagcc gtgaaaatag cctcttgcag aatgtagggt 3180 aaggttacgc acaatagacc ctagtggtcc ggcccttccc cagaccccgc atatagcggg 3240 agcttagtgc accgggctgc cctttttata cactcatagc ctaaaaatct ttcatactct 3300 catctcaatt taatcggaaa taccaggtta ttactctatt ttttaggtta ctatatcagg 3360 cttgctatga atagctatct actggtctat gtcattttga cttgataatg taaaagaatt 3420 atgtaccgtt agtgtacaga acttactctt aaataataat aaatttaccg gagaatagtt 3480 gtctaatctt ctagcttttt caaaatttga aggcacatcc agctctaagt gacattgaga 3540 gaaaaagagt ttgcagtgtt atgaactgtc aaaagctaac tcgagaagct tgtgctcatg 3600 ctgctcagaa tgagaggctc cctgttcaga ctgttgtgca agtgctttac tttgaacaac 3660 aacgccttcg ccaagttatg gatggtagtc tagacggggc agatgagtca tccaccgaca 3720 ataaccctgt tacagatgaa gtctcaagtc taaaaagaga aaatcaagat ctaaaattcg 3780 agctagtgaa aatgaaaacg aggttgaatg aaattgaaaa atgtggtgat atatcagcta 3840 ctagtacccc tgtggagatc accactccaa tatcttctga taaacctcgt ctgcgaagaa 3900 aatctttcat aagctcagtt tccgaaacgc ttgggaaact gtatccaata tcatttggag 3960 ctgatcatgt aatcatgcca tcggccagca aaggaagata taaaccaatt agtagagata 4020 ggcgttattc gatatcatga tgcggctaaa tttgccataa agctgttggt tttggctgaa 4080 gtatttgaat ctttgggaaa gcagtaatgg atttagctat atttctgtct tttgttctcc 4140 tttgttttat gttatataag tgttttaac 4169 <210> 10 <211> 594 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0001772g0090.2 amino acid sequence <400> 10 Met Phe Thr Lys Lys Lys Glu Leu Leu Ser Asn Val Met Lys Arg Thr 1 5 10 15 Ser Glu Trp Ile Leu Ser Gln Glu Ile Pro Ser Asp Ile Thr Val His 20 25 30 Val Ala Gly Thr Ser Phe Ala Leu His Lys Phe Pro Leu Val Ser Lys 35 40 45 Cys Gly Tyr Ile Arg Lys Leu Val Ala Lys Ser Asn Asp Ala Asn Leu 50 55 60 Ser Glu Ile Glu Ile Pro Asp Ile Pro Gly Gly Ala Glu Ala Phe Glu 65 70 75 80 Phe Ala Ala Lys Phe Cys Tyr Gly Ile Asn Phe Glu Ile Ser Ser Gly 85 90 95 Asn Ile Ala Leu Leu Arg Cys Val Ala Glu Tyr Leu Asp Met Thr Asp 100 105 110 Asp Tyr Ala Val Gly Asn Leu Val Gly Leu Ser Glu Ser Tyr Leu Asn 115 120 125 Glu Val Ala Leu Lys Ser Ile Ala Gly Ala Val Ser Val Leu His Ser 130 135 140 Ser Glu Lys Leu Leu Pro Ile Ala Glu Asn Ile Lys Leu Val Asn Arg 145 150 155 160 Ser Ile Asp Thr Ile Ala Tyr Ile Val Cys Lys Asp Ser His Phe Cys 165 170 175 Lys Ser Gly Arg Ile Glu Val Asp Ala Asn Ser Leu Met Asn Ser Ser 180 185 190 Thr Leu Ser Asn Pro Arg Pro Ile Val Val Asp Cys Trp Ala Glu Asp 195 200 205 Leu Thr Val Leu Arg Ile Asp Phe Phe Gln Arg Val Leu Ile Ala Met 210 215 220 Met Ala Arg Gly Cys Lys Gln Tyr Ala Leu Gly Pro Val Leu Met Leu 225 230 235 240 Tyr Ser Gln Lys Ser Leu Gln Asn Leu Glu Ile Ser Gly Lys Glu Arg 245 250 255 Lys Leu Thr Glu Gln Arg Gln Val His Glu Lys Arg Val Val Val Glu 260 265 270 Thr Ile Val Ser Leu Leu Pro Arg Glu Lys Asn Ala Leu Ala Val Ser 275 280 285 Phe Leu Ser Met Leu Leu Arg Ala Ala Ile Tyr Leu Glu Thr Thr Val 290 295 300 Ala Cys Arg Val Asp Leu Glu Arg Arg Ile Ala Leu Gln Leu Gly Glu 305 310 315 320 Ala Val Leu Asp Asp Leu Leu Ile Pro Ser Tyr Ser Ser Phe Thr Lys 325 330 335 Asp Thr Leu Phe Asp Val Glu Ile Val Gln Arg Ile Met Thr Asn Phe 340 345 350 Ile Glu Tyr Glu Met Val Glu Asn Arg Leu Gly Phe Asn Asp Glu Glu 355 360 365 Tyr Ala Ser Pro Val Gly Glu Leu Met Glu Asp Tyr Leu Ala Lys Ile 370 375 380 Ala Ser Asp Asn Asn Leu Ser Val Ser Gln Phe Ile Ser Ile Ala Glu 385 390 395 400 Val Ile Pro Glu Gln Cys Glu Asp Arg Met Tyr Lys Ala Ile Asp Thr 405 410 415 Tyr Leu Lys Ala His Pro Ala Leu Ser Asp Asn Glu Arg Lys Arg Val 420 425 430 Cys Ser Val Met Asn Cys Gln Lys Leu Thr Arg Glu Ala Cys Ala His 435 440 445 Ala Ala Gln Asn Glu Arg Leu Pro Val Gln Thr Val Val Gln Val Leu 450 455 460 Tyr His Glu Gln Gln Arg Leu Arg Gln Val Met Asp Gly Ser Leu Ala 465 470 475 480 Asp Ala Asp Gln Ser Ser Ala Asp Asn Asn Pro Val Thr Asp Glu Phe 485 490 495 Ser Ser Leu Lys Arg Glu Asn Gln Asp Leu Lys Phe Glu Leu Val Lys 500 505 510 Met Lys Thr Arg Leu Lys Glu Ile Glu Lys Cys Gly Asp Lys Ser Ala 515 520 525 Ala Ser Thr Pro Leu Glu Ile Thr Thr Pro Ile Ser Ser Asp Lys Pro 530 535 540 Arg Leu Arg Arg Lys Ser Phe Ile Ser Ser Val Tyr Glu Lys Leu Gly 545 550 555 560 Lys Leu Tyr Pro Ile Ser Phe Gly Ala Asp His Val Val Met Pro Ser 565 570 575 Ala Ser Lys Gly Arg Tyr Lys Pro Ile Asn Arg Tyr Arg Arg Tyr Ser 580 585 590 Ile Ser <210> 11 <211> 1785 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0001772g0090.2 coding sequence <400> 11 atgttcacta agaaaaaaga gcttctttcg aatgttatga aaaggacctc cgaatggatt 60 ttatcccagg agatcccaag tgatataact gttcatgttg caggaacttc ctttgctctg 120 cacaagttcc cactagtctc aaagtgcgga tatataagga agttggtcgc aaaatccaat 180 gatgctaatc tttctgaaat tgaaatccct gacattcctg gtggagcaga ggcatttgaa 240 tttgcagcaa aattttgtta tggaataaac tttgagataa gctcaggaaa catcgcattg 300 cttagatgtg tagcagaata tcttgatatg acagatgact atgcagttgg aaatttggta 360 ggattatcag aatcctactt aaatgaagta gcacttaaga gcattgcagg tgcagtttcc 420 gttctgcact cttcagaaaa acttcttccc attgcagaaa atataaaatt ggtgaacaga 480 agcatagata caattgcata catagtttgc aaggatagcc atttttgtaa gtcaggtaga 540 atagaggtcg acgctaatag cttgatgaat tcctctacat tatcaaatcc gaggcctatt 600 gttgttgact gctgggctga ggatttaact gtccttagaa ttgatttttt ccaaagggtt 660 ctaattgcta tgatggctag gggatgcaaa cagtatgcgc ttggaccagt attgatgctc 720 tattcacaga aatcccttca aaatttggaa atatcaggaa aggaaaggaa attgactgag 780 caaagacaag tacatgaaaa gagggttgtt gttgaaacca ttgttagtct tttgccaagg 840 gagaaaaatg cattggcagt tagttttctc tcaatgcttc ttcgcgctgc tatatatctc 900 gaaaccacag ttgcttgtag agttgatctg gagaggagaa tcgcgttgca acttggagag 960 gctgtattag atgatttgtt gattccttca tattcttcct tcacaaaaga cacattattt 1020 gatgttgaaa tcgtgcaacg tatcatgacg aatttcattg agtatgaaat ggtggaaaat 1080 cggttgggct tcaacgatga agagtatgcg tctccagtag gggaactcat ggaagattac 1140 cttgctaaaa tagcctctga caataatctc tctgtttcgc agtttattag tattgctgaa 1200 gtgattccag agcaatgtga agataggatg tacaaggcca ttgacactta tttgaaggca 1260 catccagctc taagtgataa tgagagaaaa agagtttgca gtgttatgaa ctgtcaaaag 1320 ctaactcgag aagcttgtgc tcatgctgct cagaatgaga ggctccctgt tcagactgtt 1380 gtgcaagtgc tttaccatga acaacaacgc cttcgccaag ttatggatgg tagtctagcc 1440 gatgcagatc agtcatccgc cgacaataac cctgttacag atgaattctc aagtctaaaa 1500 agagaaaatc aagatctaaa attcgagcta gtgaaaatga aaacgagatt gaaagaaata 1560 gaaaaatgtg gtgacaaatc agctgctagc acccctttgg agatcaccac tccaatatct 1620 tctgataaac ctcgtttgcg aagaaaatct ttcataagct cagtttacga aaagcttggg 1680 aaactgtatc caatatcatt tggagctgat catgtagtca tgccatcagc cagcaaagga 1740 agatataaac caattaatag atataggcgt tattctatat catga 1785 <210> 12 <211> 4142 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0001772g0090.2 genomic sequence <400> 12 cctatttaac ccccgtatgt aacactactc gtgtcgtgtg tctactagag gctcactcgt 60 acacaatctt tccacttcca actttctggc ctatagcggg aattctgcca atcttatgat 120 tgatcgtggc tgctgacgat aagttgataa tatataatgc agtttacggt ccaacactga 180 ggctgtactt attccccaac tgttgatcac ttattctttt gttggttgaa agagaattaa 240 ttaaagaagc tagcaacgga accaaaagaa gcaggggaaa ggacatagta cattctagtt 300 tttgctttat caagaattat ataataggcc aatatgatgg atcttggttc ataggagact 360 gcacaacctt caactactgt taacatgttc actaagaaaa aagagcttct ttcgaatgtt 420 atgaaaagga cctccgaatg gtacgtagtc catcttcagt tatttttctt tctcttttgt 480 tgtttctcag cgtccttttc cacgtcttta tgcaatgagt gaccttttta atatctgcag 540 gattttatcc caggagatcc caagtgatat aactgttcat gttgcaggaa cttcctttgc 600 tctgcacaag gtacaacctt tttccttgtt ctaagaagtt tctaatataa tttcaactag 660 aacaccaatc aagattgttc tttaactagt tacacttatt atggcagtta cctatagtca 720 tcttaaatta atttgacact gtcagtgagt agaaattaaa ctcttaacta aaaggtgcaa 780 tctttgataa tgagtacttt atgtcccatg cagttcccac tagtctcaaa gtgcggatat 840 ataaggaagt tggtcgcaaa atccaatgat gctaatcttt ctgaaattga aatccctgac 900 attcctggtg gagcagaggc atttgaattt gcagcaaaat tttgttatgg aataaacttt 960 gagataagct caggaaacat cgcattgctt agatgtgtag cagaatatct tgatatgaca 1020 gatgactatg cagttggaaa tttggtagga ttatcagaat cctacttaaa tgaagtagca 1080 cttaagagca ttgcaggtgc agtttccgtt ctgcactctt cagaaaaact tcttcccatt 1140 gcagaaaata taaaattggt gaacagaagc atagatacaa ttgcatacat agtttgcaag 1200 gatagccatt tttgtaagtc aggtagaata gaggtcgacg ctaatagctt gatgaattcc 1260 tctacattat caaatccgag gcctattgtt gttgactgct gggctgagga tttaactgtc 1320 cttagaattg attttttcca aagggttcta attgctatga tggctagggg atgcaaacag 1380 tatgcgcttg gaccagtatt gatgctctat tcacagaaat cccttcaaaa tttggtgagt 1440 ccttatccca tgagtttgga ttatttggtt agagaaaata acaaagttat ggtcgctgtt 1500 atatttaaca cacaaaatgt gcgcagtttt tatgaacatg aaggactaaa actgctcagc 1560 tgtatagtta aaggattatt ttatacaaac gctcaaacat aagaaactat tttggtcatg 1620 tgctctattt gtccaaatga aatatttatg catatgattt tcttgtcatt ccaggaaata 1680 tcaggaaagg aaaggaaatt gactgagcaa agacaagtac atgaaaagag ggttgttgtt 1740 gaaaccattg ttagtctttt gccaagggag aaaaatgcat tggcagttag ttttctctca 1800 atgcttcttc gcgctgctat atatctcgaa accacagttg cttgtagagt tgatctggag 1860 aggagaatcg cgttgcaact tggagaggct gtattagatg atttgttgat tccttcatat 1920 tcttccttca caaaagacac attatttgat gttgaaatcg tgcaacgtat catgacgaat 1980 ttcattgagt atgaaatggt ggaaaatcgg ttgggcttca acgatgaaga gtatgcgtct 2040 ccagtagggg aactcatgga agattacctt gctaaaatag cctctgacaa taatctctct 2100 gtttcgcagt ttattagtat tgctgaagtg attccagagc aatgtgaaga taggatgtac 2160 aaggccattg acacttattt gaaggtatgc acgttgaatc attcgcccgg tggagcaatt 2220 tttctgtaca ctagtacacc tacaagggca tgatcgtata tttaggtcat actatatgtt 2280 taatttaata agtattataa gcattcatta actccataaa caaatctttg atgccaactg 2340 cgaaatagta atggcttaat caactgcttt agtaccttga ttgaaatatc aacttcttta 2400 atgacataat ttgataggtt gcacctgaac agtggaaatg ttgtggcttg ggatgttaag 2460 tggtatttga accattatga tctcttgcat aaatccatta aaggcttaat ttagttaagt 2520 gaaaatatgt ttcaatatac aagtgaaact aagggttgaa ttttactttt ctgttagaga 2580 agccatctta tcttagaatt gccctgcatc ttaggttatg atatcacgtg tttttgccta 2640 tgcatttaca ggattttaaa catgttctat gttgatgttc tctcaagtgt gtcatcttta 2700 gatcaaatgt acagtttaac aaacagttac atttgataat aagcaggttt atagctaagc 2760 agctcatctt cagaccatgc ttagttgatc ttcaacataa ataaaggatt ttaagtcata 2820 tacactcata gcctaaaaat ctttcatact ctcatatcag cctaaactat ttttttaggt 2880 tactatatca ggcttgctac gaatagctac ctacttctgt atgtcatttt gacttgaaaa 2940 tgcaaaagaa ttacgtacta tcagtgtaca gaacttactc ttatcaggtt actcttaata 3000 gctggagcaa cctttcccct gtaaatgatt aaattccatt tcaagatttt attagctctc 3060 tgtctttggc ttgattgcca accttaggct tctggttagc tcccggtgct tctggttagc 3120 tccctggtca gaactgcatt tttgtgtaaa tggagctaac caacctcttt tctaatgttt 3180 tgcatctttt tgatgccagt tatatagcat cttacttcat caaaaaaaga acttactctt 3240 aaataaacaa ctctaccaga gatagttgct ctgatggtaa gcaccctcca cttccaacca 3300 agaggttgtg agttcgaatt accccaagag caaggtgggg agtttttgga gggaaggatg 3360 ccgagggtct attggaaaca gcctctctac cccagggtag gggtaaggtc tgcgtataca 3420 ttaccctccc cagaccccac tagtgggatt atactttttt gttgttattg ttgttgttgt 3480 tgtaccagag atagttgtct aatcttgtag cttttgcaaa atttgaaggc acatccagct 3540 ctaagtgata atgagagaaa aagagtttgc agtgttatga actgtcaaaa gctaactcga 3600 gaagcttgtg ctcatgctgc tcagaatgag aggctccctg ttcagactgt tgtgcaagtg 3660 ctttaccatg aacaacaacg ccttcgccaa gttatggatg gtagtctagc cgatgcagat 3720 cagtcatccg ccgacaataa ccctgttaca gatgaattct caagtctaaa aagagaaaat 3780 caagatctaa aattcgagct agtgaaaatg aaaacgagat tgaaagaaat agaaaaatgt 3840 ggtgacaaat cagctgctag cacccctttg gagatcacca ctccaatatc ttctgataaa 3900 cctcgtttgc gaagaaaatc tttcataagc tcagtttacg aaaagcttgg gaaactgtat 3960 ccaatatcat ttggagctga tcatgtagtc atgccatcag ccagcaaagg aagatataaa 4020 ccaattaata gatataggcg ttattctata tcatgatgca gtaaaatttg ccattaagct 4080 gttggttttg gcagaagtag attgcactat ttgaactttt gggaaagcag taatgaattt 4140 ag 4142 <210> 13 <211> 606 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0003312g0050.2 amino acid sequence <400> 13 Met Asp Lys His His Ser Gln Leu Pro Leu Ala Lys Cys Ser Arg Gln 1 5 10 15 Arg Tyr Ser Glu Trp Val Phe Arg Asp Val Pro Ser Asp Ile Thr Ile 20 25 30 Glu Val Asp Gly Gly Thr Phe Ser Leu His Lys Phe Pro Leu Val Ser 35 40 45 Arg Ser Gly Arg Ile Arg Lys Leu Val Ala Gly His Arg Asp Ser Asp 50 55 60 Ile Ser Arg Ile Glu Leu Leu Ser Leu Pro Gly Gly Val Glu Ser Phe 65 70 75 80 Glu Leu Ala Ala Lys Phe Cys Tyr Gly Val Asn Phe Glu Ile Thr Ala 85 90 95 Ala Asn Val Ala Gln Leu Cys Cys Val Ser Asp Tyr Leu Glu Met Thr 100 105 110 Glu Asp Tyr Ser Lys Asn Asn Leu Gly Ser Arg Ala Glu Glu Tyr Leu 115 120 125 Asp Ile Val Ala Cys Lys Asn Leu Glu Met Cys Val Glu Val Leu Lys 130 135 140 Gln Cys Glu Asn Leu Leu Pro Leu Ala Asp Glu Leu Lys Ile Val Thr 145 150 155 160 Arg Cys Ile Asp Ala Ile Ala Ser Lys Ala Cys Ala Glu Gln Ile Ala 165 170 175 Ser Ser Phe Ser Arg Leu Glu Tyr Ser Ser Ser Gly Arg Leu His Met 180 185 190 Asn Arg Gln Ala Lys Cys Glu Gly Asp Trp Trp Ile Glu Asp Leu Ser 195 200 205 Val Leu Arg Ile Asp Leu Tyr Gln Arg Val Ile Thr Ala Met Lys Cys 210 215 220 Arg Gly Val Arg Pro Glu Ser Ile Ala Ala Ser Leu Val Asn Tyr Ala 225 230 235 240 Gln Lys Glu Leu Thr Lys Lys Ser Ser Ser Trp Asn Gln Ser Ser Gln 245 250 255 Pro Lys Val Asp Val Val Ser Gly Ser Asn Gly His Glu Lys Val Val 260 265 270 Val Glu Thr Ile Val Ser Leu Met Pro Val Glu Lys Leu Val Val Pro 275 280 285 Ile Thr Phe Leu Phe Gly Leu Leu Arg Ser Ala Val Met Leu Asp Cys 290 295 300 Thr Val Ala Cys Arg Leu Asp Leu Glu Arg Arg Ile Gly Ser Gln Leu 305 310 315 320 Asp Ile Ala Thr Leu Asp Asp Leu Leu Ile Pro Phe Phe Arg Asn Ala 325 330 335 Gly Asp Thr Leu Phe Asp Val Asp Thr Val His Arg Ile Leu Val Asn 340 345 350 Phe Phe Gln Gln Glu Asp Ser Asp Glu Asp Met Asp Asp Val Ser Val 355 360 365 Phe Glu Ser Gly Ser Pro Thr Ser Pro Ser Gln Thr Ala Leu Phe Lys 370 375 380 Val Ala Lys Leu Val Asp Asn Tyr Leu Ala Glu Ile Ala Pro Asp Ala 385 390 395 400 Asn Leu Lys Leu Asn Lys Phe Ile Ala Ile Ala Glu Ser Leu Pro Ala 405 410 415 His Ala Arg Thr Val His Asp Gly Leu Tyr Arg Ser Ile Asp Val Tyr 420 425 430 Leu Lys Ala His Gln Ala Leu Ser Asp Pro Asp Arg Arg Arg Leu Cys 435 440 445 Lys Leu Ile Asp Phe Gln Lys Leu Ser Gln Glu Ala Gly Ser His Ala 450 455 460 Ala Gln Asn Glu Arg Leu Pro Leu Gln Ser Ile Val Gln Val Leu Tyr 465 470 475 480 Phe Glu Gln Leu Arg Leu Arg Asn Ala Leu Phe Cys Ser Tyr His Asp 485 490 495 Asp Asp His Lys Pro Thr His Gln Ser Trp Arg Ile Asn Ser Gly Ala 500 505 510 Leu Ser Ala Ala Met Ser Pro Arg Asp Asn Tyr Ala Ser Leu Arg Arg 515 520 525 Glu Asn Arg Glu Leu Lys Leu Glu Leu Thr Arg Met Arg Met Arg Leu 530 535 540 Asn Asp Leu Glu Lys Asp His Val Cys Met Lys Lys Asn Met Glu Lys 545 550 555 560 Ser Asn Ser Gly Gly Phe Met Ser Asn Phe Ser Lys Lys Ile Gly Lys 565 570 575 Leu Asn Ile Phe Gly His Ser Ser Ser Arg Glu Ser Cys Ser Pro Ser 580 585 590 Lys Arg Ser Gln Val Thr Asp Ser Lys Leu Thr Glu Arg Thr 595 600 605 <210> 14 <211> 1821 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0003312g0050.2 coding sequence <400> 14 atggacaaac accattcgca attgcctctc gccaagtgtt cacggcagcg ttatagtgaa 60 tgggtgtttc gggatgttcc aagtgatata acgatagaag tagatggtgg cacattttca 120 ttgcacaagt ttcctctagt ctcgagaagt gggcgaatcc ggaagcttgt agcagggcac 180 agggattctg atatatcaag gatagagcta cttagcctac caggcggagt tgaatcattt 240 gagctggcag caaaattctg ctacggcgtt aactttgaga ttacagctgc aaatgttgct 300 cagctttgtt gtgtatcaga ttatcttgag atgactgagg actattcaaa gaacaatctt 360 ggttcccgag ctgaagaata tcttgatatt gttgcttgca agaatcttga aatgtgtgtt 420 gaagtcctga aacaatgcga aaatctactt cctttggctg atgagctgaa aatagttacc 480 cgatgcattg atgctatagc atctaaggct tgcgcggagc aaattgcctc aagtttctcg 540 cgcttggaat acagtagttc tggtagactt catatgaacc gccaagccaa gtgtgaagga 600 gactggtgga tagaggattt gtcagttctt cgtattgact tgtatcaacg agtcataaca 660 gcgatgaaat gtcgtggtgt taggcctgaa agtattgcag catcactagt gaactacgca 720 cagaaggagt tgacaaagaa gtccagttcc tggaatcaat cgagccaacc caaagttgac 780 gtggtttctg gttcaaacgg ccatgaaaag gttgtggtcg aaacaattgt tagccttatg 840 cctgttgaga aattggttgt tccaataacc tttctttttg ggttgctgag aagtgcagtg 900 atgcttgact gcacagttgc ttgtagactt gatcttgaga ggcggatagg atctcaatta 960 gacatagcta ctctcgatga tcttctaatt ccattctttc gcaatgctgg tgacacatta 1020 tttgacgttg acacagtgca tagaatcttg gttaattttt ttcagcagga ggatagtgat 1080 gaagatatgg acgatgtctc agtgttcgag tctggtagcc ctacttcgcc atcccaaact 1140 gcattattca aagtcgcaaa actggtggac aattaccttg ctgaaattgc acctgatgca 1200 aacctaaagc tgaacaagtt catagcaatt gccgaaagct taccagcaca tgctcgtact 1260 gtccatgatg gactttatcg atcaatcgat gtctacctca aagctcatca ggcgttatca 1320 gatccagata ggagaagact atgcaagctg attgattttc agaagctctc acaagaagct 1380 ggatcacacg ctgcacaaaa cgaacgcctc ccactccaat caatcgtgca ggttctatat 1440 ttcgagcaac tgaggcttcg aaatgcctta ttttgttctt atcatgatga tgatcataag 1500 ccaacgcacc aatcgtggag gatcaatagt ggtgctttaa gtgcagctat gtctccccgg 1560 gataattatg cttctctaag acgagaaaat agggaactaa aacttgaact aacacgaatg 1620 aggatgagat tgaatgacct ggagaaagat catgtttgta tgaagaaaaa tatggaaaaa 1680 tctaattccg ggggattcat gagtaacttc tcgaaaaaga ttggcaagtt aaacattttt 1740 ggacatagtt cttcaaggga gtcatgttct ccttcaaaga ggtcacaagt tactgattct 1800 aagctaactg aaagaacatg a 1821 <210> 15 <211> 4019 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0003312g0050.2 genomic sequence <400> 15 ctcatcttta gctgactgtt ttcttgactt tctctgtttc gactgaacca aagtttgcta 60 aacttgttcc ttttttggca cccctttatc tgctgctaaa catttatccc actcaaattt 120 tataacttca ttatacagca ataagaatat ataaaatgct acagaaagag agttaatggt 180 gggtatttta attattggta ctatcaagga catgacccac aaaagtggcc cattggtttg 240 gacaagtgta atctatgatt tgagcacaaa cagtttgact caaaaatggc caaagaagta 300 gaccaacacc aatattttcc actgtgtctt tgtcccccct tattacttgg cttctttaac 360 aaccttcacg ttctcctgtt ctgcttctca gaatttgcag ttttttcctc tggattttct 420 tcactacagc catggacaaa caccattcgc aattgcctct cgccaagtgt tcacggcagc 480 gttatagtga atggtttgta tttaatagtt ctattttttt tttggtctat ctggtcgctc 540 tggttcattt gtagttttgt atttggttta actgtacttt agtgattttt ttgtctctag 600 gaactggaag tgtaaaacag ggttcatttg ttgttatgta tttggtttat ctgtaattct 660 ttatgaattc tttttctgtg ggaattgcga agtgcagtcg gttcagatac cacaatagaa 720 gtgggacgag atagccatag actttgtctt tggattgctg aagatggcaa agcaagatga 780 tggccgttcg gggtgattat tgattggctg gccattagct cacttcctgc cgatgagtat 840 gacttacttt acggacaagt taatcccata tatatatata tatgggttgg cttttgaggg 900 gaggaggtgg gggacttcca ttcttttcct ctattatggt ttgttcataa aaagatagtt 960 tggtgcacaa aactctcgct acgtgcagga tcagggaagg attggaccat attgggtcta 1020 ttgtatgcag cgtacctgca atggcttatt tccacaactt gaactaggga cttcctggtc 1080 gcacgatgac tactcttacc attgcgttaa ggctcccttc tcatagctac cataggcaag 1140 gtgaaaatgt ttcaactttt aaaggattgt tgaagtggta ggggaagaca tgtagttaaa 1200 aaacacttga agctgtaggg acatctgaat gcatcatttt tgcttcagat tttaacagta 1260 gtagaaatct tattggcaat aatcgtttgg gtgtttttat gtgctccttt tttcatgttt 1320 cttctgcagt tttctttccc cactcctctt tcgtgctctg aattatagcc attagtatac 1380 ttaccaaaca taatgatttt ctagttgtga gcaatgttta aacgtggcat aaatgcttag 1440 atatctgctt ttataacttg ttgctgtctt atatttaatc aactattttg atctggtata 1500 gggtgtttcg ggatgttcca agtgatataa cgatagaagt agatggtggc acattttcat 1560 tgcacaaggt aaatctgtca attctcttat ttgcccactg cgaactggtg atagattttg 1620 cggagtaatt cgcattgtag aggtaatgaa acataacgaa aaaaagactt cttttggaga 1680 ggggattcgt gttagtccct ttcatactgt tatagctaag ccttcagaaa atgttaattt 1740 catgcctatg agcaagttca gagactataa tgtagcagag ctcctaacat agagacgtga 1800 tgtgatgcag tttcctctag tctcgagaag tgggcgaatc cggaagcttg tagcagggca 1860 cagggattct gatatatcaa ggatagagct acttagccta ccaggcggag ttgaatcatt 1920 tgagctggca gcaaaattct gctacggcgt taactttgag attacagctg caaatgttgc 1980 tcagctttgt tgtgtatcag attatcttga gatgactgag gactattcaa agaacaatct 2040 tggttcccga gctgaagaat atcttgatat tgttgcttgc aagaatcttg aaatgtgtgt 2100 tgaagtcctg aaacaatgcg aaaatctact tcctttggct gatgagctga aaatagttac 2160 ccgatgcatt gatgctatag catctaaggc ttgcgcggag caaattgcct caagtttctc 2220 gcgcttggaa tacagtagtt ctggtagact tcatatgaac cgccaagcca agtgtgaagg 2280 agactggtgg atagaggatt tgtcagttct tcgtattgac ttgtatcaac gagtcataac 2340 agcgatgaaa tgtcgtggtg ttaggcctga aagtattgca gcatcactag tgaactacgc 2400 acagaaggag ttgacaaaga agtccagttc ctggaatcaa tcgagccaac ccaaagttga 2460 cgtggtttct ggttcaaacg gccatgaaaa ggttgtggtc gaaacaattg ttagccttat 2520 gcctgttgag aaattggttg ttccaataac ctttcttttt gggttgctga gaagtgcagt 2580 gatgcttgac tgcacagttg cttgtagact tgatcttgag aggcggatag gatctcaatt 2640 agacatagct actctcgatg atcttctaat tccattcttt cgcaatgctg gtgacacatt 2700 atttgacgtt gacacagtgc atagaatctt ggttaatttt tttcagcagg aggatagtga 2760 tgaagatatg gacgatgtct cagtgttcga gtctggtagc cctacttcgc catcccaaac 2820 tgcattattc aaagtcgcaa aactggtgga caattacctt gctgaaattg cacctgatgc 2880 aaacctaaag ctgaacaagt tcatagcaat tgccgaaagc ttaccagcac atgctcgtac 2940 tgtccatgat ggactttatc gatcaatcga tgtctacctc aaagtatgta ctacaaattt 3000 cttgaaagat gttttagaaa aagcattaat ggtttgagtt aaagttttaa acttaaatgt 3060 caggagaaaa ctcatggtac ttgtcttttc gaaaaataac ctgtttgcta atggcttaaa 3120 tgaatatggt acccttatat gaggaggatt aagtacttta cattgagttt gattttgcct 3180 ttaatagaat cttctaacct aaatccatat ttctaaggaa gtaataaagc ttccttaggc 3240 atttccttaa gttaatactt ttgactaatc atcgacgttc attcatggaa attccaggct 3300 catcaggcgt tatcagatcc agataggaga agactatgca agctgattga ttttcagaag 3360 ctctcacaag aagctggatc acacgctgca caaaacgaac gcctcccact ccaatcaatc 3420 gtgcaggttc tatatttcga gcaactgagg cttcgaaatg ccttattttg ttcttatcat 3480 gatgatgatc ataagccaac gcaccaatcg tggaggatca atagtggtgc tttaagtgca 3540 gctatgtctc cccgggataa ttatgcttct ctaagacgag aaaataggga actaaaactt 3600 gaactaacac gaatgaggat gagattgaat gacctggaga aagatcatgt ttgtatgaag 3660 aaaaatatgg aaaaatctaa ttccggggga ttcatgagta acttctcgaa aaagattggc 3720 aagttaaaca tttttggaca tagttcttca agggagtcat gttctccttc aaagaggtca 3780 caagttactg attctaagct aactgaaaga acatgacagg caaacttcta gtgagtaatt 3840 gcgaatggta cttgtaatct atgttccatc gcgcaatcac tattttctgt cccacatctt 3900 gtatatgagc tttagagata tgctttagca actgagatga agaaaagtaa attttgagtt 3960 ttgatgaata tgatcaccat attgatatat ctcatattgg caaatatagc acttcatat 4019 <210> 16 <211> 598 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0003151g0080.2 amino acid sequence <400> 16 Met Asp Lys His Leu His Gln Leu Pro Leu Thr Lys Ser Thr Ser Arg 1 5 10 15 Gln Arg Tyr Asn Glu Trp Val Phe Arg Asp Val Pro Ser Asp Ile Thr 20 25 30 Ile Glu Val Asp Gly Gly Ile Phe Ser Leu His Lys Phe Pro Leu Val 35 40 45 Ser Arg Ser Gly Arg Ile Arg Lys Leu Val Ala Glu His Arg Asp Ser 50 55 60 Asp Ile Ser Arg Ile Glu Leu Val Ser Leu Pro Gly Gly Ala Glu Ser 65 70 75 80 Phe Glu Leu Ala Ala Lys Phe Cys Tyr Gly Val Asn Phe Glu Ile Thr 85 90 95 Ala Ala Asn Val Ala Gln Leu Cys Cys Val Ser Asp Tyr Leu Glu Met 100 105 110 Ser Glu Asp Tyr Ser Lys Asn Asn Leu Gly Ser Arg Ala Glu Glu Tyr 115 120 125 Leu Asp Ser Ile Val Cys Lys Asn Leu Glu Met Cys Val Glu Val Leu 130 135 140 Arg Gln Cys Glu Asn Leu Leu Pro Leu Ala Asp Glu Leu Lys Val Val 145 150 155 160 Ser Arg Cys Ile Asp Ala Val Ala Ser Lys Ala Cys Val Glu Gln Ile 165 170 175 Ala Ser Ser Phe Ser Arg Leu Glu Tyr Ser Ser Ser Gly Gly Arg Leu 180 185 190 His Met Asn Lys Gln Ala Asn Cys Glu Leu Asp Trp Trp Ile Glu Asp 195 200 205 Ile Ser Val Leu Arg Ile Asp Leu Tyr Gln Arg Val Ile Thr Ala Met 210 215 220 Lys Phe Arg Gly Val Arg Pro Glu Ser Ile Ala Ala Ser Leu Val Asn 225 230 235 240 Tyr Ala Gln Arg Glu Leu Ile Gln Lys Ser Leu Ser Gly Ser Asn Ile 245 250 255 Gln Glu Lys Leu Val Val Glu Thr Ile Val Ser Leu Met Pro Val Glu 260 265 270 Lys Phe Val Val Pro Leu Thr Phe Leu Phe Gly Leu Leu Arg Ser Ala 275 280 285 Val Met Leu Asp Cys Thr Val Ala Cys Arg Leu Asp Leu Glu Arg Arg 290 295 300 Ile Gly Ser Gln Leu Asp Thr Ala Thr Leu Asp Asp Ile Leu Ile Pro 305 310 315 320 Ser Phe Arg His Ala Gly Asp Thr Leu Phe Asp Val Asp Thr Val His 325 330 335 Arg Ile Leu Val Asn Phe Ser Gln Gln Glu Gly Asp Ser Asp Glu Asp 340 345 350 Met Glu Asp Val Ser Val Phe Glu Ser Asp Ser Pro Thr Thr Thr Pro 355 360 365 Ser Gln Thr Ala Leu Phe Lys Val Ser Lys Leu Val Asp Asn Tyr Leu 370 375 380 Ala Glu Ile Ala Pro Asp Ala Asn Leu Lys Leu Asn Lys Phe Ile Ala 385 390 395 400 Val Ala Glu Thr Leu Pro Ala His Ala Arg Thr Val His Asp Gly Leu 405 410 415 Tyr Arg Ala Ile Asp Val Tyr Leu Lys Ala His Gln Thr Leu Ser Asp 420 425 430 Pro Asp Lys Arg Arg Leu Cys Lys Leu Ile Asp Phe Gln Lys Leu Ser 435 440 445 Gln Glu Ala Gly Ala His Ala Ala Gln Asn Glu Arg Leu Pro Leu Gln 450 455 460 Ser Ile Val Gln Val Leu Tyr Phe Glu Gln Leu Arg Leu Arg Asn Ala 465 470 475 480 Leu Phe Cys Ser Tyr Pro Asp Asp Asp Ile Lys Pro Met His Gln Ser 485 490 495 Trp Arg Ile Asn Ser Gly Ala Leu Ser Ala Ala Met Ser Pro Lys Asp 500 505 510 Asn Tyr Ala Ser Leu Arg Arg Glu Asn Arg Glu Leu Lys Leu Glu Leu 515 520 525 Ala Arg Met Arg Met Arg Leu Asn Asp Leu Glu Lys Asp His Val Cys 530 535 540 Met Lys Arg Asn Met Gln Lys Ser Ser Ser Arg Arg Phe Met Lys Ser 545 550 555 560 Phe Ser Lys Arg Ile Gly Lys Lys Phe Asn Ile Phe Gly His Ser Phe 565 570 575 Ser Arg Asp Ser Asn Ser Pro Ser Ser Gln Ser Glu Arg Thr Glu Ser 580 585 590 Lys Ile Thr Glu Arg Thr 595 <210> 17 <211> 1797 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0003151g0080.2 coding sequence <400> 17 atggacaagc acctccacca actacctcta accaagtcta cttcacggca gcgttataac 60 gaatgggtat ttcgagatgt tcctagtgat ataacaatag aagtggatgg tggcatattt 120 tcattacaca agtttcccct tgtttcgaga agcggacgaa tccggaagct agtagcagag 180 cacagggatt ctgatatatc aagaattgag cttgttagtc taccaggtgg agcagaatca 240 tttgagctag cagccaaatt ctgttatggt gtcaactttg agatcacagc agcaaatgtt 300 gctcagcttt gttgtgtatc cgattacctc gagatgtcag aggactactc aaaaaacaat 360 cttggctcca gagctgaaga atatcttgac agcattgttt gcaagaatct tgaaatgtgt 420 gttgaagtct tgagacaatg tgaaaactta cttccacttg ctgatgagct gaaagttgtg 480 agccgctgta tcgatgctgt agcctccaaa gcttgtgtcg agcaaatcgc ctcaagtttc 540 tcgcgattgg agtatagtag ctcaggtgga agactacata tgaataaaca agccaattgt 600 gaattggact ggtggattga ggatatttct gttcttcgta tcgacttgta ccaacgtgtc 660 ataaccgcga tgaagtttcg tggggttagg cctgagagta ttgctgcatc actagtgaac 720 tatgcacaga gggaattgat acaaaaatcc ctttctggtt caaatatcca agaaaaactc 780 gtggttgaga cgatcgtgag cctaatgcct gttgaaaaat tcgtcgtgcc cttgaccttt 840 ctttttggat tgttgcgaag tgcagtgatg ttagattgca cggttgcttg taggcttgat 900 cttgagaggc ggataggatc tcaattggat acggctactc tggacgatat cctgattcct 960 tcctttcgac atgctggtga tacattgttt gatgttgaca cagtgcatag aatcttggtt 1020 aacttttcac agcaagaggg cgatagcgat gaagatatgg aagatgtctc ggtttttgaa 1080 tccgatagcc ctactacgac gccatcacaa actgcattgt tcaaagtatc aaagctggtt 1140 gacaattatc tagctgaaat tgcaccagat gcaaatctaa agctgaacaa gttcattgct 1200 gttgcagaaa cattaccagc acatgcgcgt actgtccacg atggacttta tcgagcaatc 1260 gatgtttacc tcaaagctca tcaaacctta tcagatccag acaagaggag actatgcaaa 1320 ttgattgatt tccaaaagct ctcacaggaa gctggtgcac atgctgcaca aaacgaacgc 1380 cttcccctcc aatcgatagt tcaagttctt tatttcgagc aattgaggct tcgaaacgcc 1440 ttgttttgtt cgtaccctga tgatgacatc aaaccaatgc accaatcttg gaggatcaat 1500 agtggtgctc ttagtgctgc aatgtctcct aaggacaatt atgcttcgtt gagacgagaa 1560 aatagggagc taaaacttga actagcgcgg atgaggatga gattaaacga cttggaaaaa 1620 gaccatgttt gtatgaagag gaatatgcaa aaatctagct cgcgacgatt catgaaatcc 1680 ttctccaaaa ggattggcaa aaagtttaat attttcggac atagtttttc cagggattct 1740 aattctccct caagtcagtc agaaagaact gaatctaaaa taactgaaag aacgtga 1797 <210> 18 <211> 4422 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0003151g0080.2 genomic sequence <400> 18 ttgaaaacaa aaaggtttga caaaaaaatg gccaaagaac tactcaacaa acagcaaaat 60 ctctcctatt gtgtctctgt ccccttattt tcttgtcttc tttaacaaac ctttcacatt 120 cttgtttctt ctttctctaa agatttcaaa tcttttcccc tggcttttct tcaccatatt 180 tgccatggac aagcacctcc accaactacc tctaaccaag tctacttcac ggcagcgtta 240 taacgaatgg tttgtattct gcagtacgta gttatataca atgacaatgt aaaaagattt 300 tgtagcatca atgcgattta atatgctata gttggttaaa tgtttattat acttagttat 360 acgtgtcata actcgttctc tcaactcaga atccacagct tctatctaaa ttcttgatcc 420 gctactacta gctcgtatgt gcaataccaa aatgtttgaa agttttaaag cattttgttt 480 tttggcttgt ctgtgaatct acctaccttc acagggtagg attaagatat gcgtacacat 540 tattcttctc agtactcact tgtgggacta tactgggtat gttggtgcta gtggtagtga 600 acctgcataa ttgtgtcata cttttacgtg cagttcaaaa tcagttgggg ctttggttac 660 atgcatctta gtaaaacttt tgatgaattt ttgtgtacac atatagtccg agccttcttt 720 ccttgagtcg agagtctatc tgaaataacc ttattctacc ttcacaaggt agggataagg 780 tctgcgtaca taatacactt tccagacctt acttgtggag ttacattggg tatgttgtcg 840 ttgttgttgt acacatagtc cgagcctaag acagtgaatg cacgtgctac cactacctct 900 atgttaaatc ttaccctaga agagaaagat caaaatgtta gtctttctgc taattggttg 960 atttgtatgt tatagggtat ttcgagatgt tcctagtgat ataacaatag aagtggatgg 1020 tggcatattt tcattacaca aggtaattct ctccattctc tattatctta taatcaattt 1080 ggccaagctt ctccaatcct agaaatactt tttttcaaag tttaattgtt tggcaatctt 1140 ttgtaaggaa aaaaattgtt tttgatgaga atcagaagct ttttttggaa aagcagaaaa 1200 aagtaggctc tccataaaaa cactttttta aagcactttt gataaaaaaa atatatttac 1260 gagcagtttt taaaagtttg gccaaatact aattgttgct cagaaatgtt tttcaaatta 1320 attagccaaa cacaaactct ttcttgccaa aagtacgttt gaaaaagcac ttttgagaaa 1380 aacgcttatc aaaataagct gatttttgca gctgccgtac ccgtatcaga ttattcaaaa 1440 atgcactact tttagtggat caaacatgca tgtgttggca tttctgaaga gcatgaacaa 1500 cataaactgc ttagtagtat tgctcactat gtcttgtttt cacacatttt atattgaagt 1560 gtttgaaatt tttaaaattt catgcctatg agttagttca gagaccataa tgtaatagaa 1620 aattccctaa catagaataa ttatgatgca gtttcccctt gtttcgagaa gcggacgaat 1680 ccggaagcta gtagcagagc acagggattc tgatatatca agaattgagc ttgttagtct 1740 accaggtgga gcagaatcat ttgagctagc agccaaattc tgttatggtg tcaactttga 1800 gatcacagca gcaaatgttg ctcagctttg ttgtgtatcc gattacctcg agatgtcaga 1860 ggactactca aaaaacaatc ttggctccag agctgaagaa tatcttgaca gcattgtttg 1920 caagaatctt gaaatgtgtg ttgaagtctt gagacaatgt gaaaacttac ttccacttgc 1980 tgatgagctg aaagttgtga gccgctgtat cgatgctgta gcctccaaag cttgtgtcga 2040 gcaaatcgcc tcaagtttct cgcgattgga gtatagtagc tcaggtggaa gactacatat 2100 gaataaacaa gccaattgtg aattggactg gtggattgag gatatttctg ttcttcgtat 2160 cgacttgtac caacgtgtca taaccgcgat gaagtttcgt ggggttaggc ctgagagtat 2220 tgctgcatca ctagtgaact atgcacagag ggaattgata caaaaatccc tttctggttc 2280 aaatatccaa gaaaaactcg tggttgagac gatcgtgagc ctaatgcctg ttgaaaaatt 2340 cgtcgtgccc ttgacctttc tttttggatt gttgcgaagt gcagtgatgt tagattgcac 2400 ggttgcttgt aggcttgatc ttgagaggcg gataggatct caattggata cggctactct 2460 ggacgatatc ctgattcctt cctttcgaca tgctggtgat acattgtttg atgttgacac 2520 agtgcataga atcttggtta acttttcaca gcaagagggc gatagcgatg aagatatgga 2580 agatgtctcg gtttttgaat ccgatagccc tactacgacg ccatcacaaa ctgcattgtt 2640 caaagtatca aagctggttg acaattatct agctgaaatt gcaccagatg caaatctaaa 2700 gctgaacaag ttcattgctg ttgcagaaac attaccagca catgcgcgta ctgtccacga 2760 tggactttat cgagcaatcg atgtttacct caaagtatgt attactaact tacttgaaat 2820 atgttcaaaa acgttttgct ggtttgaatg agagttcttc aaaatttcac aacaggagaa 2880 atatcatatg gtgcttatga ttccctttat agagctatat gtcctccttt gattagagaa 2940 aatgatcaaa ttaccacgtc tactatacga aatattttaa ctttaccctc cgttatattt 3000 tgaggtcatt catattcttg tggttagcaa attatcctgt attcacccat gaccctaacg 3060 gagctccaac caaagtataa cgaagggtaa tctttaacaa tagtacaaag tacagaggta 3120 aatttggacc tttctcctta agtattttgg cacctggatc catccaatcc gcgatggagc 3180 tatattaaag tgaaggacag atacgatata tattctaatg gacctcacgc ttcaattatg 3240 ctatcaccct gttaccttat cactttatct tgttgtcgtt actacttatt atgcctgctt 3300 cctttacttt taccttgagt cgggagttta tcggaaacag tctctctacc ttcacaaggt 3360 agtaaggtcc gtgtacactc tactcctccc agaccccact ttgtgggatt acaatgggtt 3420 tgttgttgtt gttgttaatg gtatgaatga cgtcaaagta taacattgag atatttcgta 3480 tgctatatgg gtaaatttgg acctttcaac cattaactaa gctaatagag tttctcatct 3540 cagattccta ttttttcatt taactaacca taacattgtt catgaatgca tattccaggc 3600 tcatcaaacc ttatcagatc cagacaagag gagactatgc aaattgattg atttccaaaa 3660 gctctcacag gaagctggtg cacatgctgc acaaaacgaa cgccttcccc tccaatcgat 3720 agttcaagtt ctttatttcg agcaattgag gcttcgaaac gccttgtttt gttcgtaccc 3780 tgatgatgac atcaaaccaa tgcaccaatc ttggaggatc aatagtggtg ctcttagtgc 3840 tgcaatgtct cctaaggaca attatgcttc gttgagacga gaaaataggg agctaaaact 3900 tgaactagcg cggatgagga tgagattaaa cgacttggaa aaagaccatg tttgtatgaa 3960 gaggaatatg caaaaatcta gctcgcgacg attcatgaaa tccttctcca aaaggattgg 4020 caaaaagttt aatattttcg gacatagttt ttccagggat tctaattctc cctcaagtca 4080 gtcagaaaga actgaatcta aaataactga aagaacgtga caatcgatct tccaggtaca 4140 tcaaattact cggataattt tggctgattc tgctgagtaa ctgcaagtct gtcaatatga 4200 gctgcagtct catattttct cccaaatgtt tgtatatgag atgcagtctg atatgcttcc 4260 ggaggcagag ggatttcaag cttatgggtt cggcattcta atcattttat gttactgggt 4320 tctaaattag taatttatac atattcaatg aattgtttaa gataaatcca tgattcgaac 4380 caaattactg ggtttgaccg aacccgctcc cggcactcta gc 4422 <210> 19 <211> 598 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0002641g0190.2 amino acid sequence <400> 19 Met Asp Lys His His His Gln Leu Pro Leu Thr Lys Ser Thr Ser Arg 1 5 10 15 Gln Arg Tyr Asn Glu Trp Val Phe Arg Asp Val Pro Ser Asp Ile Thr 20 25 30 Ile Glu Val Asp Gly Gly Ile Phe Ser Leu His Lys Phe Pro Leu Val 35 40 45 Ser Arg Ser Gly Arg Ile Arg Arg Leu Val Ala Glu His Arg Asp Ser 50 55 60 Asp Ile Ser Arg Ile Glu Leu Val Ser Leu Pro Gly Gly Thr Glu Ser 65 70 75 80 Phe Glu Leu Ala Ala Lys Phe Cys Tyr Gly Val Asn Phe Glu Ile Thr 85 90 95 Ala Ala Asn Val Ala Gln Leu Cys Cys Val Ser Asp Tyr Leu Glu Met 100 105 110 Ser Glu Asp Tyr Ser Lys Asn Asn Leu Gly Ser Arg Ala Glu Glu Tyr 115 120 125 Leu Asp Ser Ile Val Cys Lys Asn Leu Glu Met Cys Val Glu Val Leu 130 135 140 Arg Gln Cys Glu Asn Leu Leu Pro Leu Ala Asp Glu Leu Lys Ile Val 145 150 155 160 Ser Arg Cys Ile Asp Ala Val Ala Ser Lys Ala Cys Val Glu Gln Ile 165 170 175 Ala Ser Ser Phe Ser Arg Leu Glu Tyr Ser Ser Ser Gly Gly Arg Leu 180 185 190 His Met Ile Lys Gln Ala Asn Cys Glu Leu Asp Trp Trp Ile Glu Asp 195 200 205 Ile Ser Met Leu Arg Ile Asp Leu Tyr Gln Arg Val Ile Thr Ala Met 210 215 220 Lys Phe Arg Gly Val Arg Pro Glu Ser Ile Ala Ala Ser Leu Val Asn 225 230 235 240 Tyr Ala Gln Lys Glu Leu Ile Gln Lys Ser Leu Ser Gly Ser Asn Ile 245 250 255 Gln Glu Lys Leu Val Val Glu Thr Ile Val Ser Leu Met Pro Val Glu 260 265 270 Lys Phe Val Val Pro Leu Ser Phe Leu Phe Gly Leu Leu Arg Ser Ala 275 280 285 Val Met Leu Asp Cys Thr Val Ala Ser Arg Leu Asp Leu Glu Arg Arg 290 295 300 Ile Gly Ser Gln Leu Asp Thr Ala Thr Leu Asp Asp Ile Leu Ile Pro 305 310 315 320 Ser Phe Arg His Ala Gly Asp Thr Leu Phe Asp Val Asp Thr Val His 325 330 335 Arg Ile Leu Val Asn Phe Ser Gln Gln Glu Gly Asp Ser Asp Asp Asp 340 345 350 Met Glu Asp Val Ser Val Phe Glu Ser Asp Ser Pro Thr Thr Thr Pro 355 360 365 Ser Gln Asn Ala Leu Phe Lys Val Ser Lys Leu Val Asp Asn Tyr Leu 370 375 380 Ala Glu Ile Ala Pro Asp Ala Asn Leu Lys Leu Ser Lys Phe Ile Ala 385 390 395 400 Val Ala Glu Thr Leu Pro Ala His Ala Arg Thr Val His Asp Gly Leu 405 410 415 Tyr Arg Ala Ile Asp Val Tyr Leu Lys Ala His Gln Thr Leu Ala Asp 420 425 430 Pro Asp Lys Arg Arg Leu Cys Lys Leu Ile Asp Phe Gln Lys Leu Ser 435 440 445 Gln Glu Ala Gly Ala His Ala Ala Gln Asn Glu Arg Leu Pro Leu Gln 450 455 460 Ser Ile Val Gln Val Leu Tyr Phe Glu Gln Leu Arg Leu Arg Asn Ala 465 470 475 480 Leu Phe Cys Ser Tyr Pro Asp Asp Asp Ile Lys Pro Met His Gln Ser 485 490 495 Trp Arg Ile Asn Ser Gly Ala Leu Ser Ala Ala Met Ser Pro Lys Asp 500 505 510 Asn Tyr Ala Ser Leu Arg Arg Glu Asn Arg Glu Leu Lys Leu Glu Leu 515 520 525 Ala Arg Met Arg Met Arg Leu Asn Asp Leu Glu Lys Asp His Val Cys 530 535 540 Met Lys Arg Asn Met Gln Lys Ser Ser Ser Arg Arg Phe Met Lys Ser 545 550 555 560 Phe Ser Lys Arg Ile Gly Lys Lys Phe Asn Ile Phe Gly His Asn Phe 565 570 575 Ser Arg Asp Cys Ser Ser Pro Ser Ser Gln Ser Glu Arg Thr Glu Ser 580 585 590 Lys Ile Thr Glu Arg Thr 595 <210> 20 <211> 1797 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0002641g0190.2 coding sequence <400> 20 atggacaaac accaccatca actaccacta accaagtcta cttcgaggca gcgttataac 60 gaatgggtat ttcgagatgt tcctagtgat ataacaatag aagtggatgg tggcatattt 120 tcactccaca agtttcccct tgtttcgaga agcggacgaa tccggaggct agtagcagag 180 cacagggatt cagatatatc aagaattgag cttgttagtc taccaggtgg aacagaatca 240 tttgagctag cagccaaatt ctgttatggt gtcaactttg agatcacagc agcaaatgtt 300 gctcagcttt gttgcgtatc cgattatctc gagatgtcgg aggactactc gaaaaataat 360 cttggttcaa gagctgaaga atatcttgac agcattgttt gcaagaatct tgaaatgtgt 420 gttgaagtct tgagacaatg tgaaaactta cttccacttg ctgatgagct gaaaattgtt 480 agccggtgta tcgatgctgt agcctcgaaa gcttgtgtcg agcaaatcgc ctcaagtttc 540 tcacgattag agtatagtag ctctggagga agactacata tgattaaaca agccaattgt 600 gaattggact ggtggattga ggatatttca atgcttcgta tcgacttgta ccaacgcgtc 660 ataaccgcga tgaagtttcg tggggttagg cctgagagta ttgctgcatc actagtgaac 720 tatgcacaaa aagagttgat acaaaaatcc ctttctggtt caaatatcca agaaaaactc 780 gtggttgaga cgatcgtgag cctgatgcct gttgaaaaat tcgtcgtgcc cttgagcttt 840 ctttttggat tgttgcgaag tgcagtgatg ttagattgca cggttgctag taggcttgat 900 ctcgagaggc ggataggatc tcaattggat acggctaccc tggacgatat tctgattcct 960 tcctttcgac atgctggtga tacattgttt gatgttgaca cagtgcatag aatcttggtt 1020 aacttttcac agcaagaggg agatagtgat gatgatatgg aagatgtatc ggtttttgaa 1080 tccgatagcc ctactacgac gccatcacaa aatgcattgt tcaaagtatc aaagctggtt 1140 gacaattacc tagctgaaat tgcaccagat gcaaatctaa agctgagcaa gttcattgct 1200 gttgcagaaa cattaccagc acatgcgcgt actgtccacg atggacttta tcgagcaatc 1260 gacgtttacc tcaaggctca tcaaacctta gcagatccag acaagagaag actatgcaaa 1320 ttgatagatt tccaaaagct ctcacaggaa gctggtgcac acgctgcaca aaacgagcgc 1380 cttcctctcc aatccatcgt tcaagttctt tatttcgagc aattgaggct acgaaacgcc 1440 ttgttttgtt cataccctga tgatgacatt aagccaatgc accaatcctg gaggatcaat 1500 agtggtgctc ttagtgctgc aatgtctccc aaggacaatt atgcttcgtt gagacgagaa 1560 aatagagagc taaaacttga actagcgcgg atgaggatga gattaaacga cttggaaaaa 1620 gaccatgttt gtatgaagag gaatatgcaa aaatctagct cgcgacgatt catgaaatca 1680 ttctccaaaa ggataggcaa aaagttcaat attttcggac ataatttttc cagggattgt 1740 agttctccct caagccagtc agaaagaact gaatctaaaa taactgaaag aacttga 1797 <210> 21 <211> 4552 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0002641g0190.2 genomic sequence <400> 21 caaaatctct cctattgtgt ctctgtcccc ttattttctt gtcttcttta acaaaccttt 60 cacattcttc tttatttaga gattttcaat cttttccctt ggcttttctt caccatattg 120 gccatggaca aacaccacca tcaactacca ctaaccaagt ctacttcgag gcagcgttat 180 aacgaatggt ttgtattttg cagtacgtag ttatatacat cgacagtgta aaaagattaa 240 ttttgtagca tcaatgtgat ttaatatgct atagttgatt aaaaaaatgt gtacttggtt 300 atacgtgtca taactcgttc tctcaactca gaatccacag cttctaaatt cttgatctcg 360 tatatgcaat gccaaaatgt ttgaaagttt taaagcattt tttttggctt gtttgtgaac 420 ctacgtacct tcccaagtta gaggtaaggt ctgcgtacac attattcttc ccagaattca 480 cttgtgggac aatactgggt atgttgttgc tggtggtgat gaacctgcat attgtgtcat 540 acttttacgt gcagttcaaa atcacttggg gctttagtta catgcatctt agtaaaactt 600 ttgatgaatt tttgtacaca catatagtcc gagtgctctt tccttgagcc gatggtctac 660 cggaaacaac cttctacctt cacaaggtac aaggtagggg taaggtctgt gtatatacta 720 ccctctccag agtccacttg tgggattaca ttggatatgt tgtcgttgtt gttgtactac 780 acatagtccg agcctaagac agtgagtgca cgtgctccta ctacctctat gttaaatctt 840 cccctagaag agaaagatca aaattttagt ctttctgctt attattggct aatttatatg 900 ttatagggta tttcgagatg ttcctagtga tataacaata gaagtggatg gtggcatatt 960 ttcactccac aaggtaaatg ctcttcattc tctattattg atgctcgaac tcttcaaaaa 1020 tattgccaca cccgtattca ggggcggaac tagagtggcg aaatggggtt caaccgaatc 1080 aacttcgcca aaaaattata gagtatatat aaggttaaat ttatttttat gcataaatag 1140 taaatgttca atccccttgg catgttcgta agtttacctt ttaatatttc gaatcccctt 1200 ggtaaaagtc ctagctctgc tactgcccgt gtcggaccat tcaaaatgaa ctacttttgg 1260 aggatccgac actcaggtca gcatttttga agagttcgaa caacatagaa ttcttagcac 1320 tattcctcta tatgacttct tatctcacat attatattga aatgtttgaa attttttaaa 1380 tttcatgcct atgagtaagt ttagagacta taatgtaata gaaaattccc taacataaga 1440 taattatgat gtagtttccc cttgtttcga gaagcggacg aatccggagg ctagtagcag 1500 agcacaggga ttcagatata tcaagaattg agcttgttag tctaccaggt ggaacagaat 1560 catttgagct agcagccaaa ttctgttatg gtgtcaactt tgagatcaca gcagcaaatg 1620 ttgctcagct ttgttgcgta tccgattatc tcgagatgtc ggaggactac tcgaaaaata 1680 atcttggttc aagagctgaa gaatatcttg acagcattgt ttgcaagaat cttgaaatgt 1740 gtgttgaagt cttgagacaa tgtgaaaact tacttccact tgctgatgag ctgaaaattg 1800 ttagccggtg tatcgatgct gtagcctcga aagcttgtgt cgagcaaatc gcctcaagtt 1860 tctcacgatt agagtatagt agctctggag gaagactaca tatgattaaa caagccaatt 1920 gtgaattgga ctggtggatt gaggatattt caatgcttcg tatcgacttg taccaacgcg 1980 tcataaccgc gatgaagttt cgtggggtta ggcctgagag tattgctgca tcactagtga 2040 actatgcaca aaaagagttg atacaaaaat ccctttctgg ttcaaatatc caagaaaaac 2100 tcgtggttga gacgatcgtg agcctgatgc ctgttgaaaa attcgtcgtg cccttgagct 2160 ttctttttgg attgttgcga agtgcagtga tgttagattg cacggttgct agtaggcttg 2220 atctcgagag gcggatagga tctcaattgg atacggctac cctggacgat attctgattc 2280 cttcctttcg acatgctggt gatacattgt ttgatgttga cacagtgcat agaatcttgg 2340 ttaacttttc acagcaagag ggagatagtg atgatgatat ggaagatgta tcggtttttg 2400 aatccgatag ccctactacg acgccatcac aaaatgcatt gttcaaagta tcaaagctgg 2460 ttgacaatta cctagctgaa attgcaccag atgcaaatct aaagctgagc aagttcattg 2520 ctgttgcaga aacattacca gcacatgcgc gtactgtcca cgatggactt tatcgagcaa 2580 tcgacgttta cctcaaggta tgtattgaca atttaattga aatatgttca aaaatgtttt 2640 gctggtttgg atgagagtta cttcaaaatt tcacaacagg agaaatatca tatggtgctt 2700 atttttgata aaactatata gattgctaat gacttaattg aatatggtag ttctagaata 2760 agtccatcaa gagtattaag gttctttacc ttgagataat cataattatt cccattacag 2820 agtaatatgt cctcctttga ttagtgaaaa tggttaaatt acccttctat tatacgaaat 2880 atcttaactt tacactctgt tatattttgg agtcattcat attcttgtgg ttgggtcatg 2940 gtttatatcg atgtgaccta tgtgatctat aggtcatggg tacgaccgtg ggatcaacca 3000 cttatgtttg tattagggtg ggttccctac attacacccc ctttgggttg tggcccttcc 3060 ccaaatcccc cgtgaacgtg ggatgttttg tgcaccagac tgcccttttg ttcatttctt 3120 gtggttagca aattatcttg tattcgccga tgaccctaac tgagcaccaa ccaaaagtac 3180 gattaaaggt aatcttaacc atagtaaaaa ctggagaggt aaatttggac ctttttcctt 3240 aagtgttttg acacgcggaa tccatccaat ccgcaatgga gcttcgttaa agtgaaggac 3300 gaatacaaga tatttgctaa cagcaagggt atgtataacg tcaaagtgta acagagggta 3360 aattgagata ttatgtatgg tataggagta aactatgttg tgtggactct ccaaaatgct 3420 gtcgcagcat tatcagatcc tccaaaaatg cactattttt ggagtatcag acacgcaccc 3480 gatgatattt tcggagagtc cgagcaacat aggggggtaa atttggacct tttcaccttt 3540 tgttaagctg atagagcttc tcatctcaat tcctattttt tcatataact aaccataaca 3600 ttgttcatga atgcatattc caggctcatc aaaccttagc agatccagac aagagaagac 3660 tatgcaaatt gatagatttc caaaagctct cacaggaagc tggtgcacac gctgcacaaa 3720 acgagcgcct tcctctccaa tccatcgttc aagttcttta tttcgagcaa ttgaggctac 3780 gaaacgcctt gttttgttca taccctgatg atgacattaa gccaatgcac caatcctgga 3840 ggatcaatag tggtgctctt agtgctgcaa tgtctcccaa ggacaattat gcttcgttga 3900 gacgagaaaa tagagagcta aaacttgaac tagcgcggat gaggatgaga ttaaacgact 3960 tggaaaaaga ccatgtttgt atgaagagga atatgcaaaa atctagctcg cgacgattca 4020 tgaaatcatt ctccaaaagg ataggcaaaa agttcaatat tttcggacat aatttttcca 4080 gggattgtag ttctccctca agccagtcag aaagaactga atctaaaata actgaaagaa 4140 cttgacaatc gatgaagggg agccttggcg taactgataa agttgttgct atgcgaccat 4200 gaggtcacgg attcgagccg tggaaacagc ctcttgcaga aatgcagggt aagactgcgt 4260 acaatagacc gttgtggtcc ggcccttctc cggaccccgc gcatagcggg agcttagtgc 4320 actgggctgt ccttttttga acgtgacaat cgatcttcca ggtacatcaa attactcggg 4380 taattttggc tgattctgtt gttgagtgta actgcaagtt tttcagttgt aatctttttg 4440 ttccattcta caacacctta ttttctcccc aaatgtttgt atatgagctg cagtgagata 4500 tgcttttcat tgacatgata tatagagttt ttatgacttt gagttggtaa ag 4552 <210> 22 <211> 592 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0001876g0030.2 amino acid sequence <400> 22 Met Val Ser Pro Tyr Asn Ser Phe Thr Thr Arg Thr Ile Phe Ser Glu 1 5 10 15 Val Ala Gly Asp Ile Thr Ile Ala Ala Asn Gly Glu Ser Phe Leu Leu 20 25 30 His Lys Phe Pro Leu Val Ser Leu Ser Gly Lys Ile Arg Lys Met Val 35 40 45 Ala Asp Ala Asn Asp Pro Asn Leu Ser Glu Leu Asp Leu Asn His Val 50 55 60 Pro Gly Gly Pro Glu Thr Phe Glu Leu Ala Ala Lys Phe Cys Tyr Gly 65 70 75 80 Met Asn Phe Glu Ile Thr Thr Thr Asn Val Ala Arg Leu Arg Cys Val 85 90 95 Ala Glu Tyr Leu Glu Met Thr Glu Asp Tyr Arg Glu Glu Asn Leu Ile 100 105 110 Ala Arg Thr Glu Thr Phe Leu Asp Glu Val Val Ser Pro Ser Leu Glu 115 120 125 Lys Ser Val Gln Val Leu Ser Ser Cys Glu Ala Leu Leu Pro Thr Ala 130 135 140 Glu Glu Val Gly Ile Pro Asp Arg Cys Ile Asp Ala Ile Ala Arg Asn 145 150 155 160 Ala Cys Gln Glu Gln Leu Val Ser Ser Leu Ser Arg Leu Asp Cys Asp 165 170 175 Ser Gly Ser Leu Glu Leu Lys Asp Arg Cys Leu Glu Trp Trp Val Glu 180 185 190 Asp Phe Ser Val Leu Ser Ile Asp Phe Tyr Arg Arg Val Ile Met Ala 195 200 205 Met Gly His Ala Gly Val His Ile Asp Ser Ile Ile Ala Ser Leu Met 210 215 220 His Tyr Ala Gln Val Ser Leu Lys Gly Ile Gly Lys Pro Gln Ile Trp 225 230 235 240 Asn Pro Ala Arg Ser Tyr Pro Cys Lys Gly Glu Lys Gly Gln Arg Thr 245 250 255 Ile Ile Glu Thr Leu Val Ser Leu Leu Pro Pro Glu Lys Ser Ser Ser 260 265 270 Val Pro Leu Asn Phe Leu Phe Gly Met Leu Arg Ile Gly Ile Met Val 275 280 285 Asp Ala Thr Leu Ala Cys Arg Leu Glu Ile Glu Arg Arg Ile Ala Phe 290 295 300 Arg Leu Glu Met Val Leu Leu Asp Asp Leu Leu Ile Pro Ser Val Gln 305 310 315 320 Thr Thr Gly Asp Ser Leu Phe Asp Val Asp Thr Val Lys Arg Ile Leu 325 330 335 Ile His Phe Leu Gln Arg Ile Asp Gln Glu Glu Asn Glu Asp Cys Gly 340 345 350 Tyr Glu Ser Glu Gly Ile Asp Ser Pro Ser His Gly Ala Leu Leu Lys 355 360 365 Val Gly Arg Leu Ile Asp Thr Tyr Leu Ala Glu Ile Ala Pro Asp Pro 370 375 380 Tyr Leu Ser Leu Asp Lys Phe Thr Ala Met Ile Ser Met Leu Pro Asp 385 390 395 400 Tyr Ala Arg Val Ile Asp Asp Gly Leu Tyr Arg Ala Ile Asp Val Tyr 405 410 415 Leu Lys Ala His Pro Thr Leu Ser Glu His Gly Ala Lys Lys Leu Cys 420 425 430 Lys Phe Ile Asp Cys Gln Lys Leu Ser Gln Glu Ala Cys Asn His Ala 435 440 445 Ala Gln Asn Glu Arg Leu Pro Val Gln Met Thr Val Arg Val Leu Tyr 450 455 460 Phe Glu Gln Leu Arg Leu Lys Asn Ala Leu Ser Gly Ser Cys Gly Asp 465 470 475 480 Thr Phe Val Ser Gln Lys Ile Ser Ser Gly Leu Thr Ser Ala Ala Met 485 490 495 Ser Pro Arg Asp Thr Tyr Ala Ser Leu Arg Arg Glu Asn Arg Glu Leu 500 505 510 Lys Leu Glu Ile Ser Arg Met Arg Val Arg Leu Ser Asp Leu Glu Lys 515 520 525 Glu Gln Val Phe Met Lys Gln Gly Met Met Asp Lys Thr Gly His Gly 530 535 540 Lys Thr Phe Leu Thr Ser Leu Ser Arg Gly Ile Gly Arg Ile Gly Ile 545 550 555 560 Phe Gly Ser Pro Ser Gly Glu Lys His His Lys Ser Gly Arg Lys Ser 565 570 575 Arg Thr Ser Glu Gly Lys Thr Gly Arg Ser Arg Arg Tyr Ser Leu Ser 580 585 590 <210> 23 <211> 1779 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0001876g0030.2 coding sequence <400> 23 atggtgtctc cttacaactc atttaccact cgcactatat tctctgaagt tgctggggat 60 attacaattg ctgcaaatgg agagtctttc ctactgcata agtttcccct ggtatctttg 120 agtggaaaga tccggaagat ggtggcagat gccaacgatc caaatctctc agaattggat 180 ttgaatcacg taccaggagg acctgaaaca tttgaactgg ctgcaaagtt ttgttatggc 240 atgaactttg agatcacaac cacaaacgta gcacgtttgc gctgtgtggc agaatacttg 300 gaaatgacag aagattatcg tgaagagaat ctcattgcaa gaacagaaac tttccttgat 360 gaagttgtct ctccaagtct tgaaaaatcc gtgcaagtac tttcttcctg tgaagctctt 420 cttcctactg cagaggaggt tggtattcca gatagatgca ttgatgccat tgccaggaat 480 gcttgtcaag agcaacttgt atccagtcta tctcgtttag attgtgatag tggatctttg 540 gaacttaagg acaggtgtct tgaatggtgg gtcgaagatt tttctgttct gagtattgat 600 ttttatcgca gagttatcat ggcaatggga catgctgggg tacacataga cagcattatt 660 gcgtccttga tgcattatgc ccaggtctct ctaaagggta ttgggaaacc gcaaatttgg 720 aatccagcca gatcgtatcc ttgtaaggga gaaaaggggc agagaacaat aatagaaact 780 cttgttagtc tattgcctcc agaaaagagt tcatctgttc ctctgaattt tctttttggg 840 atgttgagga taggtatcat ggtggatgcc acgctagcct gcaggcttga aattgagagg 900 aggattgcct tccggctgga aatggtctta cttgatgatt tgcttatacc atctgtccag 960 actacaggtg attctttgtt tgatgttgac acggtcaagc ggatattgat acatttcctc 1020 caaaggattg accaggaaga aaatgaagat tgtggatatg aatcagaagg tattgattct 1080 ccaagccatg gcgctctatt gaaagttgga cggctgatag acacatatct tgctgaaata 1140 gctcctgatc catatttgag tctcgacaaa ttcactgcta tgatatcaat gttgcctgat 1200 tatgctcgtg taattgatga cggactttac agagctattg atgtttattt gaaggcccat 1260 ccaacgctaa gtgagcatgg cgcgaagaag ctgtgcaagt tcatagattg ccagaagctc 1320 tctcaagaag catgcaatca tgcagcacag aatgagagac tcccagttca aatgactgtc 1380 cgagttctct actttgagca gctccgcctt aagaatgctc tatctggaag ttgtggagat 1440 acttttgtat cacaaaagat cagtagtggt cttacaagtg cagctatgtc gcctagagat 1500 acttacgctt ctttaaggag agagaaccga gaactgaagc tggagatatc aagaatgagg 1560 gtaaggctca gtgacctgga gaaggaacaa gtgttcatga aacaaggtat gatggataaa 1620 acaggacatg ggaaaacatt cttaacttcc ctttctagag gcataggaag aattggtata 1680 tttggcagtc cttctggaga aaaacatcac aagtcgggtc gcaaatccag gacatcagaa 1740 ggtaaaactg gtaggagtag gaggtattct ctttcctag 1779 <210> 24 <211> 4139 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0001876g0030.2 genomic sequence <220> <221> misc_feature <222> (4114)..(4139) <223> n is a, c, g, or t <400> 24 ataagatcaa gcctttcctt gattttaata atattagaat agaattaagc aaagcatgca 60 cataccttcc aatattttac tactcaatca aataactagg ttttaatcct gaattagtta 120 gatgattatc tatatctgct tcacttgact ctactaatgt ttaaaagaat tcatcaaaat 180 ttgatactag tagattatag tttcgataat ggtgaatagg atgacaatat tggtaaggta 240 gagacaaagg aataaaaagc aaaaggggaa aaggtatttt gtgttgcagt agaacacttc 300 acatggccac ccatttctgt attctttagc tttttctctt tgcattattt atgtatcacc 360 attcctatgt cacactttcc cttttaggtc ttcttattgt tgcttgtatt gggatttgac 420 tgcaagagtg cttcatcaga tggtgctgct gctctaaagt ctaaagtgaa gctcatacaa 480 gaatggtgtc tccttacaac tcatttacca ctcggtaatc tccatcttct gggctacaca 540 tatataactg ttgatcaaga attattcggt tacagtatca aagacagttt ttttactgcg 600 aattatgtgt tggccttggt ttttgatcat catattctga atgacatgtt tgatgaatgt 660 acattttcaa tgaatttagt ctttcagctt gatttgagct accccacccc ctccagcagc 720 ccatcttggc tgccctgctt gatgattcat gctatgatta tattgtttcc tctctccaat 780 tattattttt tcagtacgca ttgcacctta caaacattat ccttataggg attacttaac 840 attatccttt ccaaattccc tccagtgaat agttacagga aggccttgtt agagtaactc 900 tttcttctga catttgaagg gtagccttgg cgcaattggt aaagttgctt ccatgtgacc 960 atgaggtcac gggttcgagc cgtggaaaca gcctcttgca gaaatgcagg gtaagactgc 1020 gaacgataga cccttccccg gacccgcgca tagtgggagc ttagttcacc ggaccaccct 1080 ttttttcttc tgacatttat atgctttctt tgcgtatgtc atactctctt tagtatacta 1140 tttcacataa tttgtcaaac atgtcaaagt gctactactg tgaacttgag tattggtgtc 1200 ctttcttatc atcttcttcg ttttcatcga taaacttgat ctgtcatgtc agtaggagga 1260 aatgcatcac tttacccccc aacacttcct aattcatctg ttatttcatg aataatgaac 1320 aaaacaccat aaaagcgtta atacttttta tgacatggta aatttattaa ggcaaataaa 1380 tactttgtca tgtcaaaatc attgcgataa atcaacttat tcgtgatgat attgatcagc 1440 actatattct ctgaagttgc tggggatatt acaattgctg caaatggaga gtctttccta 1500 ctgcataagg tactttcctg ttttcagaaa ctttctgcct ttggataatt taagaacgtt 1560 tgaacttcaa ataaggttag aaatatatat aaattatcag gatcatgcta aaggttcaag 1620 atcatgcata gtgggagagg gtggggtttt gtttaaagac acttgtttct ttcgtcttgg 1680 ttactaacta gatagattga gattgtgatg gtggtaaaat ttgaaattca gaggattatc 1740 agacttggtt gagaatgttc ctgtagtttg atagattatt aagattgaaa aaccaaagtt 1800 tccattaatg gtgtatttgg ctatcaagaa aaaaaaagca acaattgttg tagtgatggt 1860 atacgtaatg taagctaact ttaagatcac aattctggaa cacattgtag tttgaaaaga 1920 actccatctg ggcatgtaat gcagctaaaa ataatgacag tgaagtctgt catattaagg 1980 atactttagc aaatgattga aatggtcatt cttctaggag tagcattgcg acaaatgctt 2040 tccagaaatc aattttatga ttataacatg tgaatcttag ccttgtctag gcgtttcatc 2100 gtgaactatt taataattaa cttatctctt ccttattcga cattatactt cattcttgaa 2160 gttgataatt atgtgatgtt tacaatagtt tcccctggta tctttgagtg gaaagatccg 2220 gaagatggtg gcagatgcca acgatccaaa tctctcagaa ttggatttga atcacgtacc 2280 aggaggacct gaaacatttg aactggctgc aaagttttgt tatggcatga actttgagat 2340 cacaaccaca aacgtagcac gtttgcgctg tgtggcagaa tacttggaaa tgacagaaga 2400 ttatcgtgaa gagaatctca ttgcaagaac agaaactttc cttgatgaag ttgtctctcc 2460 aagtcttgaa aaatccgtgc aagtactttc ttcctgtgaa gctcttcttc ctactgcaga 2520 ggaggttggt attccagata gatgcattga tgccattgcc aggaatgctt gtcaagagca 2580 acttgtatcc agtctatctc gtttagattg tgatagtgga tctttggaac ttaaggacag 2640 gtgtcttgaa tggtgggtcg aagatttttc tgttctgagt attgattttt atcgcagagt 2700 tatcatggca atgggacatg ctggggtaca catagacagc attattgcgt ccttgatgca 2760 ttatgcccag gtctctctaa agggtattgg gaaaccgcaa atttggaatc cagccagatc 2820 gtatccttgt aagggagaaa aggggcagag aacaataata gaaactcttg ttagtctatt 2880 gcctccagaa aagagttcat ctgttcctct gaattttctt tttgggatgt tgaggatagg 2940 tatcatggtg gatgccacgc tagcctgcag gcttgaaatt gagaggagga ttgccttccg 3000 gctggaaatg gtcttacttg atgatttgct tataccatct gtccagacta caggtgattc 3060 tttgtttgat gttgacacgg tcaagcggat attgatacat ttcctccaaa ggattgacca 3120 ggaagaaaat gaagattgtg gatatgaatc agaaggtatt gattctccaa gccatggcgc 3180 tctattgaaa gttggacggc tgatagacac atatcttgct gaaatagctc ctgatccata 3240 tttgagtctc gacaaattca ctgctatgat atcaatgttg cctgattatg ctcgtgtaat 3300 tgatgacgga ctttacagag ctattgatgt ttatttgaag gtgaattttc aagtttttag 3360 ttatagacct gtatattgtt ctagcaatgc cttctaatga taacatgttc tttatattgg 3420 tggtttgaat attcttcttt gcgcatataa tgttgtgttt aaccctgaaa gctgtttaat 3480 gcttttagta aaatcacatc tcaacccctt ataaacatag ttttagttga atctgccatt 3540 tatctctttg tgaactttac taggcccatc caacgctaag tgagcatggc gcgaagaagc 3600 tgtgcaagtt catagattgc cagaagctct ctcaagaagc atgcaatcat gcagcacaga 3660 atgagagact cccagttcaa atgactgtcc gagttctcta ctttgagcag ctccgcctta 3720 agaatgctct atctggaagt tgtggagata cttttgtatc acaaaagatc agtagtggtc 3780 ttacaagtgc agctatgtcg cctagagata cttacgcttc tttaaggaga gagaaccgag 3840 aactgaagct ggagatatca agaatgaggg taaggctcag tgacctggag aaggaacaag 3900 tgttcatgaa acaaggtatg atggataaaa caggacatgg gaaaacattc ttaacttccc 3960 tttctagagg cataggaaga attggtatat ttggcagtcc ttctggagaa aaacatcaca 4020 agtcgggtcg caaatccagg acatcagaag gtaaaactgg taggagtagg aggtattctc 4080 tttcctagaa aaggttgtat gccacaatgt aaannnnnnn nnnnnnnnnn nnnnnnnnn 4139 <210> 25 <211> 663 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0000048g0280.2 amino acid sequence <400> 25 Met Ala Met His Pro Ser Ala Lys Cys Ala His Phe Cys Ile Asn Ser 1 5 10 15 Leu Ala Phe Ser Leu Cys Ile Ile Tyr His Ser His Phe Pro Phe Leu 20 25 30 Val Phe Phe Gln Arg Leu Leu Leu Leu Val Leu Gly Phe Asp Cys Lys 35 40 45 Ser Ala Ala Asp Gly Ala Ala Ala Leu Lys Ser Lys Val Lys Leu Lys 50 55 60 Phe Leu Thr Thr His Thr Arg Met Val Ser Pro Tyr Asn Ser Phe Thr 65 70 75 80 Thr Arg Thr Ile Phe Ser Glu Val Ala Gly Asp Ile Thr Ile Ala Ala 85 90 95 Asn Gly Glu Ser Phe Leu Leu His Lys Phe Pro Leu Val Ser Leu Ser 100 105 110 Gly Lys Ile Gln Lys Met Val Ala Asp Ala Asn Asp Pro Asn Leu Pro 115 120 125 Glu Leu Asp Leu Thr His Val Pro Gly Gly Pro Glu Thr Phe Glu Leu 130 135 140 Ala Ala Lys Phe Cys Tyr Gly Met Asn Phe Glu Ile Thr Thr Thr Asn 145 150 155 160 Val Ala Arg Leu Arg Cys Val Ala Glu Tyr Leu Glu Met Thr Glu Asp 165 170 175 Tyr Arg Glu Glu Asn Leu Ile Ala Arg Thr Glu Thr Phe Leu Asp Glu 180 185 190 Val Val Ser Pro Ser Leu Glu Lys Ser Val Gln Val Leu Ser Ser Cys 195 200 205 Glu Ala Leu Leu Pro Thr Ala Glu Glu Val Gly Ile Pro Asp Arg Cys 210 215 220 Ile Asp Ala Ile Ala Arg Asn Ala Cys Gln Glu Gln Leu Val Ser Gly 225 230 235 240 Leu Ser Arg Leu Asp Cys Asp Thr Gly Ser Leu Glu Leu Lys Asp Arg 245 250 255 Cys Leu Glu Trp Trp Val Glu Asp Leu Ser Ala Leu Ser Ile Asp Phe 260 265 270 Tyr Arg Arg Val Ile Met Ala Met Gly His Val Gly Val His Ile Asp 275 280 285 Ser Ile Ile Ala Ser Leu Met His Tyr Ala Gln Val Ser Leu Lys Gly 290 295 300 Ile Gly Lys Pro Gln Ile Trp Asn Pro Ala Arg Ser Tyr Pro Cys Lys 305 310 315 320 Gly Glu Lys Gly Gln Arg Thr Ile Ile Glu Thr Leu Val Ser Leu Leu 325 330 335 Pro Pro Glu Lys Ser Ser Ser Val Pro Leu Asn Phe Leu Phe Gly Val 340 345 350 Leu Arg Ile Gly Ile Met Val Asp Ala Thr Leu Ala Cys Arg Leu Glu 355 360 365 Ile Glu Arg Arg Ile Ala Phe Arg Leu Glu Met Val Leu Leu Asp Asp 370 375 380 Leu Leu Ile Pro Ser Val Gln Thr Thr Gly Asp Ser Leu Phe Asp Val 385 390 395 400 Asp Thr Val Lys Arg Ile Leu Ile His Phe Leu Gln Arg Ile Asp Gln 405 410 415 Glu Glu Asn Glu Asp Cys Gly Tyr Glu Ser Gln Gly Ile Asp Ser Pro 420 425 430 Ser His Gly Ala Leu Leu Lys Val Gly Arg Leu Ile Asp Thr Tyr Leu 435 440 445 Ala Glu Ile Ala Pro Asp Pro Tyr Leu Ser Leu Asp Lys Phe Thr Ala 450 455 460 Met Ile Ser Val Leu Pro Glu Tyr Ala Arg Val Ile Asp Asp Gly Leu 465 470 475 480 Tyr Arg Ala Ile Asp Val Tyr Leu Lys Ala His Pro Thr Leu Ser Glu 485 490 495 His Glu Ala Lys Lys Leu Cys Lys Phe Ile Asp Cys Gln Lys Leu Ser 500 505 510 Gln Glu Ala Cys Asn His Ala Ala Arg Asn Asp Arg Leu Pro Val Gln 515 520 525 Met Thr Val Arg Val Leu Tyr Phe Glu Gln Leu Arg Leu Lys Asn Ala 530 535 540 Leu Ser Gly Ser Cys Gly Asp Thr Phe Val Ser Gln Lys Ile Ser Ser 545 550 555 560 Gly Leu Thr Ser Ala Ala Met Ser Pro Arg Asp Thr Tyr Ala Ser Leu 565 570 575 Arg Arg Glu Asn Arg Glu Leu Lys Leu Glu Ile Ser Arg Met Arg Val 580 585 590 Arg Leu Ser Asp Leu Glu Lys Glu Gln Val Phe Met Lys Gln Gly Met 595 600 605 Met Asp Lys Thr Gly His Gly Lys Thr Phe Leu Thr Ser Leu Ser Arg 610 615 620 Gly Ile Gly Arg Ile Gly Ile Phe Ser Ser Pro Ser Gly Glu Lys His 625 630 635 640 His Lys Ser Gly Arg Lys Ser Arg Thr Ser Glu Gly Lys Thr Gly Arg 645 650 655 Ser Arg Lys Tyr Ser Leu Ser 660 <210> 26 <211> 1992 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0000048g0280.2 coding sequence <400> 26 atggccatgc acccttctgc caaatgtgcc catttctgta ttaattcttt agctttttct 60 ctttgtatta tttatcactc acatttcccc tttttggtct tctttcaacg cttattgttg 120 cttgtcttgg gatttgactg caagagtgct gcagatggtg ctgctgctct aaagtctaaa 180 gtgaagctca agtttcttac aactcataca agaatggtgt ctccttacaa ctcatttacc 240 actcgcacta tattctctga agttgctggg gatattacaa ttgctgcaaa tggagagtct 300 ttcctactgc ataagtttcc cctggtatct ttgagtggaa agatccagaa gatggtggcg 360 gatgccaacg atccaaatct cccagaattg gatttgactc acgtaccagg aggacctgaa 420 acatttgaac tggctgcaaa gttttgttat ggcatgaact ttgagatcac aaccacaaac 480 gtagcacgtt tgcgctgtgt ggcagaatac ttggaaatga cagaagatta tcgtgaagag 540 aatctcattg caagaacaga aactttcctt gatgaagttg tctctccaag tcttgaaaaa 600 tccgtgcaag tactttcttc ctgtgaagcc ctgcttccta ctgcagagga ggttggtatt 660 ccagatagat gcattgatgc cattgccagg aatgcttgtc aggagcaact tgtatccggt 720 ctatctcgtt tagattgtga tactggatct ttggaactta aggacaggtg tcttgaatgg 780 tgggtcgaag atctatctgc tctgagtatt gatttttatc gcagagttat catggcaatg 840 ggacatgttg gggtacacat cgacagcatt attgcgtcct tgatgcatta cgcccaggtc 900 tctctaaagg gtattgggaa accgcaaatt tggaatccag ccagatcgta tccttgtaag 960 ggagaaaagg ggcagagaac aataatagaa actcttgtta gtctattgcc tccagaaaag 1020 agttcatctg ttccgctgaa ttttcttttt ggggtgttga ggataggtat catggtggat 1080 gccacgctag cctgcaggct tgaaattgag aggaggattg ccttcaggct ggaaatggtc 1140 ttacttgatg atttgcttat accatctgtc cagactacag gtgattcttt gtttgatgtt 1200 gacactgtca agcggatatt gatacatttc ctccaaagga ttgaccagga agaaaatgaa 1260 gattgtggat atgaatcaca aggtattgat tctccaagcc atggcgctct attgaaagtt 1320 ggacggctga tagacacata tcttgctgaa atagctcctg atccatattt gagtcttgac 1380 aaattcactg ctatgatatc agtgttgcct gagtatgctc gtgtaattga tgacggactt 1440 tacagagcta ttgatgttta tttgaaggcc catccaacgc taagtgagca tgaagcgaag 1500 aagctgtgca agttcataga ttgccagaag ctctctcaag aagcatgcaa tcatgcagca 1560 cggaatgaca gactcccagt tcaaatgact gtccgagttc tctactttga gcagctccgc 1620 cttaagaatg ctctatccgg aagttgtgga gatacttttg tatcacaaaa gatcagtagt 1680 ggtcttacaa gtgcagctat gtcgcctaga gatacttatg cttctttaag gagagagaac 1740 cgagaactaa agctggagat atcaagaatg agggtaaggc tcagtgacct ggagaaggaa 1800 caagtgttca tgaaacaagg tatgatggat aaaacaggac atggaaaaac attcttaact 1860 tccctttcaa gaggtatagg aagaattggt atatttagca gtccttctgg agaaaaacat 1920 cacaagtcgg gtcgcaaatc caggacatca gaaggtaaaa ctggtaggag taggaagtat 1980 tctctttcct ag 1992 <210> 27 <211> 4246 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0000048g0280.2 genomic sequence <400> 27 caattaacta cgttttaatc ctaaaatagt tggatgatta tatgaattat ctatatctgc 60 ttcactctag ctactaatgt gtaaagaatt catcaaaatt tgatactagt ctactagtat 120 tagactaagt agattagagt ttcgataata taatgatgat ataaacattg gtaaggtaga 180 gacaaaggaa taaaaagcaa aaggggaaaa ggtattttgt gttgcagtaa aacacttcac 240 atggccatgc acccttctgc caaatgtgcc catttctgta ttaattcttt agctttttct 300 ctttgtatta tttatcactc acatttcccc tttttggtct tctttcaacg cttattgttg 360 cttgtcttgg gatttgactg caagagtgct gcagatggtg ctgctgctct aaagtctaaa 420 gtgaagctca agtttcttac aactcataca agaatggtgt ctccttacaa ctcatttacc 480 actcggtaat ctccatcttc atgtctctat gtggtacaca tgactgttga tcatcccttt 540 agaatttcaa gaattattcg gctacagtaa taaatagttt aacagagtaa tttgtttgga 600 taaatagttt aaaagaccta tttactgcaa attatgagtt ggccatggtt tttgatcatc 660 atattctgaa tgtccatttt caatgaattt agtctttgag cttgatttga gctaccccac 720 ctcctccagt agcccatctt ggctgccctg cttgatgatt catgctatga ttatattgtt 780 tcctcactcc aattattata ttttcagtat tcattgcacc ttacgaaaat ctctcttttg 840 ttttttttcc acggaatatt acttataggg attacttaac attatccttt ccaaattccc 900 tcctgtgaat agttacagga aggccttgct tatggaagta actctttctt ctgacattta 960 tatgctttct ttgagtatgt cattgtctct ttagtatgct atttcacata atttgaaagt 1020 gctactactg tgaacttgaa tatttgtgtc ctatcttatc atcttcttca ttttcaccga 1080 taaacttgat ctgtcattag gaggaaatgc atcactttac ccaagacttc ctaattcatc 1140 tgttatttca tgaataatta ataaaatacc acaaatttat gacatggtaa atttattatg 1200 gcaaatcaat actttgtcat gtcaaaatca ttgcgtaata aataaactta ttcgtgatga 1260 tattgatcag cactatattc tctgaagttg ctggggatat tacaattgct gcaaatggag 1320 agtctttcct actgcataag gtactttcct gtcttcactt tctccagtct ttctttcaga 1380 aactttgtgc ctttggataa tttatgaagg tttgaacttc aaataaggtt agcaatatat 1440 ataaatcatc aggatataat atgtgttcaa gatcatgcat agtaggagag ggtggggctt 1500 tgtttaaaga cacttgtttg tttcctcttg gttgctaact agatagattg agattgtgat 1560 ggtggtaaaa tttgaaattc agaggattat cagagttggt tgacaatgtt cctgtagttt 1620 gatggattat taagattgga aaaccaaagt ttccattaat ggtgtatttg actatcaaaa 1680 aaagctacaa tacaattgtt gtagtgatgg tatacgtaat gtaagctaac tttaagatca 1740 caattttgga acaaattgaa gtttgaaaag aactccagct ggcatgtaat gcagctaaaa 1800 ataattctgt atctagaagc aagccccttg taacttgttg ttgtctttag accaacttta 1860 tcatgcctcg tcaagggcac tactagatga gatgacgcat cttatacatt gaaactttta 1920 attcaagcac ccagtggtaa tgacagtgaa gtctgtcata ttaaggacac tttagcaaat 1980 gattgaaatg gtcattcttt taggagtagc attgcgacaa atgctttcca gaaatcaatt 2040 ttatgattat aacatgtgaa tcttagcctt gtctgggcgt ttcatcatga actatttaat 2100 aattaactta tctcttcctt attcgacatt attagttaat tgcatacatc attcttgaag 2160 ttgataatta tgtgatgttt acaatagttt cccctggtat ctttgagtgg aaagatccag 2220 aagatggtgg cggatgccaa cgatccaaat ctcccagaat tggatttgac tcacgtacca 2280 ggaggacctg aaacatttga actggctgca aagttttgtt atggcatgaa ctttgagatc 2340 acaaccacaa acgtagcacg tttgcgctgt gtggcagaat acttggaaat gacagaagat 2400 tatcgtgaag agaatctcat tgcaagaaca gaaactttcc ttgatgaagt tgtctctcca 2460 agtcttgaaa aatccgtgca agtactttct tcctgtgaag ccctgcttcc tactgcagag 2520 gaggttggta ttccagatag atgcattgat gccattgcca ggaatgcttg tcaggagcaa 2580 cttgtatccg gtctatctcg tttagattgt gatactggat ctttggaact taaggacagg 2640 tgtcttgaat ggtgggtcga agatctatct gctctgagta ttgattttta tcgcagagtt 2700 atcatggcaa tgggacatgt tggggtacac atcgacagca ttattgcgtc cttgatgcat 2760 tacgcccagg tctctctaaa gggtattggg aaaccgcaaa tttggaatcc agccagatcg 2820 tatccttgta agggagaaaa ggggcagaga acaataatag aaactcttgt tagtctattg 2880 cctccagaaa agagttcatc tgttccgctg aattttcttt ttggggtgtt gaggataggt 2940 atcatggtgg atgccacgct agcctgcagg cttgaaattg agaggaggat tgccttcagg 3000 ctggaaatgg tcttacttga tgatttgctt ataccatctg tccagactac aggtgattct 3060 ttgtttgatg ttgacactgt caagcggata ttgatacatt tcctccaaag gattgaccag 3120 gaagaaaatg aagattgtgg atatgaatca caaggtattg attctccaag ccatggcgct 3180 ctattgaaag ttggacggct gatagacaca tatcttgctg aaatagctcc tgatccatat 3240 ttgagtcttg acaaattcac tgctatgata tcagtgttgc ctgagtatgc tcgtgtaatt 3300 gatgacggac tttacagagc tattgatgtt tatttgaagg tgaattttca agtttttagt 3360 tatagacctg tatattattc tagcaatccc tgctaatgat aacatgttct ttatattggt 3420 ggtctgaata ttcttctttg cgcatataaa gtgcacaaaa agaatatgtt gtgttttaac 3480 cctgcaagct gtttaatgct ttaagtaaaa tcacatctca accccttata aacatagttt 3540 tagttgattc tgccatttat ctctttgtga acttcactag gcccatccaa cgctaagtga 3600 gcatgaagcg aagaagctgt gcaagttcat agattgccag aagctctctc aagaagcatg 3660 caatcatgca gcacggaatg acagactccc agttcaaatg actgtccgag ttctctactt 3720 tgagcagctc cgccttaaga atgctctatc cggaagttgt ggagatactt ttgtatcaca 3780 aaagatcagt agtggtctta caagtgcagc tatgtcgcct agagatactt atgcttcttt 3840 aaggagagag aaccgagaac taaagctgga gatatcaaga atgagggtaa ggctcagtga 3900 cctggagaag gaacaagtgt tcatgaaaca aggtatgatg gataaaacag gacatggaaa 3960 aacattctta acttcccttt caagaggtat aggaagaatt ggtatattta gcagtccttc 4020 tggagaaaaa catcacaagt cgggtcgcaa atccaggaca tcagaaggta aaactggtag 4080 gagtaggaag tattctcttt cctagaaaag cttgtatgcc acaatgtaaa ttaatgcatg 4140 actcaagagt tttgcaaaag tggctaatta ttggtgagtg ctcgtttaat ttcttgctgt 4200 cctagccaat ctcttagata tcatgcttca cattgttgaa cttgtt 4246 <210> 28 <211> 629 <212> PRT <213> Artificial Sequence <220> <223> Nitab4.5_0002006g0070.2 amino acid sequence <400> 28 Met Gly Val Val Thr Val Ser Glu Leu Lys Pro Ser Ile Ser Gly Lys 1 5 10 15 Arg Ser Phe Arg Pro Ser Ser Ser Ala Arg His Ile Thr Glu Trp Pro 20 25 30 Ile Ser Asp Val Ser Ser Asp Leu Thr Ile Glu Val Gly Ala Ala Ser 35 40 45 Phe Ala Leu His Lys Phe Pro Leu Val Ser Arg Ser Gly Arg Ile Arg 50 55 60 Lys Leu Leu Leu Glu Ala Lys Asp Thr Lys Ile Ser Arg Leu Asn Leu 65 70 75 80 Thr Gly Leu Pro Gly Gly Ser Asp Ala Phe Glu Leu Ala Ala Lys Phe 85 90 95 Cys Tyr Gly Val Asn Val Glu Ile Thr Ile Ser Asn Val Ala Met Leu 100 105 110 Arg Cys Ala Ser Lys Phe Met Glu Met Asn Glu Asp Ile Ser Glu Lys 115 120 125 Asn Leu Glu Ile Arg Thr Glu Val Phe Leu Lys Asp Thr Val Phe Thr 130 135 140 Asn Ile Ser Asn Ser Ile Ser Val Leu His Arg Cys Glu Thr Leu Leu 145 150 155 160 Pro Val Ser Glu Glu Val Asn Leu Val Ser Arg Leu Ile Asn Ala Ile 165 170 175 Ala Asn Asn Ala Cys Lys Glu Gln Leu Thr Ser Gly Leu Ser Lys Leu 180 185 190 Glu His Asn Phe Pro Pro Lys Pro Val Gln Ser Leu Asp Ser Glu Thr 195 200 205 Pro Ile Asp Trp Trp Gly Lys Ser Leu Thr Val Leu Asn Leu Asp Phe 210 215 220 Phe Gln Arg Val Val Ser Val Val Lys Ser Lys Gly Leu Lys Gln Asp 225 230 235 240 Ile Ile Ser Arg Ile Leu Ile Asn Tyr Ala Lys Asn Ser Leu Gln Gly 245 250 255 Leu Phe Ile Lys Asp Pro Gln Leu Val Lys Gly Ser Phe Leu Asp Leu 260 265 270 Asp Leu Gln Lys Arg Gln Arg Val Ile Val Glu Thr Ile Ala Ser Leu 275 280 285 Leu Pro Thr Gln Ser Arg Lys Ser Thr Val Pro Met Ala Phe Leu Ser 290 295 300 Ser Leu Leu Lys Ser Ala Ile Ala Ala Ser Ala Ser Thr Ser Cys Arg 305 310 315 320 Ser Asp Leu Glu Arg Arg Ile Gly Leu Gln Leu Asp Gln Ala Ile Leu 325 330 335 Glu Asp Ile Leu Ile Pro Ala Asn Pro His Gly Asn Asn His Ser Pro 340 345 350 Leu Tyr Asp Ile Asp Ser Ile Leu Arg Ile Phe Ser Phe Phe Leu Asn 355 360 365 Leu Asp Glu Asp Asp Glu Glu Asp Asn Thr Leu Arg Asp Glu Ser Glu 370 375 380 Met Val Tyr Asp Phe Asp Ser Pro Gly Ser Pro Lys His Ser Ser Ile 385 390 395 400 Val Lys Val Ser Lys Leu Leu Asp Asn Tyr Leu Ala Glu Val Ala Leu 405 410 415 Asp Ser Asn Leu Thr Pro Ser Lys Tyr Ile Ala Leu Ala Glu Leu Leu 420 425 430 Pro Asp His Ala Arg Leu Val Tyr Asp Gly Leu Tyr Arg Ala Val Asp 435 440 445 Ile Phe Leu Lys Val His Pro Asn Ile Lys Asp Ser Glu Arg Tyr Arg 450 455 460 Leu Cys Lys Thr Ile Asp Cys Gln Lys Leu Ser Gln Glu Ala Cys Ser 465 470 475 480 His Ala Ala Gln Asn Glu Arg Leu Pro Val Gln Met Ala Val Gln Val 485 490 495 Leu Tyr Phe Glu Gln Ile Arg Leu Arg Asn Ala Met Asn Gly Gly His 500 505 510 Asn Gln Phe Phe Gly Met Asn Asn Gln Phe Pro Gln Arg Ser Gly Ser 515 520 525 Gly Ala Gly Ser Gly Cys Ile Ser Pro Arg Asp Asn Tyr Ala Ser Val 530 535 540 Arg Arg Glu Asn Arg Glu Leu Lys Leu Glu Val Ala Arg Met Arg Met 545 550 555 560 Arg Leu Thr Asp Leu Glu Lys Asp His Val Ser Met Lys Gln Glu Leu 565 570 575 Val Lys Ser His Pro Ala Asn Lys Leu Phe Lys Ser Phe Thr Lys Lys 580 585 590 Leu Ser Lys Leu Asn Ala Leu Phe Arg Ile Lys Asp Leu Lys Pro Ile 595 600 605 Gly Gly Lys Ala Asn Ser Glu Ser Arg Leu Leu Phe Gln Lys Arg Arg 610 615 620 Arg His Ser Val Ser 625 <210> 29 <211> 1890 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0002006g0070.2 coding sequence <400> 29 atgggagttg tcactgtttc tgaactgaag ccaagcatat ctgggaaaag gtcttttcgt 60 ccaagttcca gtgccagaca tattactgaa tggccaatat ctgatgtttc tagtgatctt 120 acaatagaag taggagctgc cagttttgct cttcacaagt ttcctctagt ttcccgaagc 180 ggaagaatta gaaagctgct gctagaggca aaggatacaa agatttcaag actcaatctt 240 accggtcttc ctggcggatc tgatgcattt gaacttgctg ctaagttctg ttatggcgtg 300 aacgttgaga ttaccatatc aaacgtggcg atgctaagat gtgcatccaa gttcatggaa 360 atgaacgaag acatctccga gaaaaacctg gaaattcgta ctgaagtatt ccttaaagat 420 acagtattca caaacatatc caactcgata tctgttcttc atcgctgtga aacactacta 480 ccggtatctg aagaagtcaa tctcgttagt cgattaatca atgcaattgc aaacaatgct 540 tgtaaagagc aactaacatc tggtttgtca aagctggagc ataacttccc acccaaacct 600 gttcaaagcc ttgattctga gacaccaata gactggtggg gaaaatcatt gactgtgcta 660 aatctagatt ttttccagag agttgtatct gtagtgaagt caaaaggtct taaacaagac 720 attatcagca gaattttgat aaattatgcc aaaaattcac ttcagggact tttcatcaag 780 gatcctcagt tggttaaagg aagtttcttg gatttggatt tgcagaaaag gcaaagggtt 840 atcgtcgaaa caatagctag cttactacca acacaatcca ggaaaagtac agtcccaatg 900 gcttttcttt caagtttgtt aaaatctgca atagcagcat cagcatccac ttcttgcaga 960 tctgatctag agaggcgcat tggtctgcag ctagatcagg caattctaga agatattctc 1020 atacctgcaa atccacatgg gaacaaccac agccctctct acgacataga ttctattttg 1080 aggatctttt cctttttctt gaatttggat gaggatgatg aagaggacaa cacactaaga 1140 gatgaaagcg aaatggttta cgactttgat agtcctggat ctcccaaaca tagctcaatt 1200 gttaaggtgt caaagttatt ggacaattat ctagcagaag ttgcactcga ttctaacctc 1260 acgccatcga agtatatagc actggctgag ttacttccag accacgcgcg tctagtttat 1320 gatggattat atcgagctgt agatattttc ctcaaggttc atcccaacat taaggactcg 1380 gaacgctatc gtctctgtaa aactattgat tgccagaaac tatcacaaga agcttgcagt 1440 catgcagcac aaaatgaacg gttgcctgtg caaatggcgg tccaagtgct atacttcgaa 1500 caaatcaggc tgagaaatgc gatgaacggg ggacataacc aattctttgg aatgaataat 1560 cagttccccc agcgttcagg cagcggagca ggaagcggat gcatctctcc gagagataac 1620 tacgcatcag tcaggagaga aaatagagaa ctgaagctcg aggttgcaag aatgagaatg 1680 aggcttacag atttagagaa agatcatgtt tccatgaaac aggagctagt aaagtcacat 1740 cctgccaata agttattcaa gtcatttaca aagaaattaa gcaagctgaa tgcactattc 1800 cgaataaaag atttaaaacc aataggaggg aaagctaact cagaaagccg gttacttttt 1860 cagaagagaa ggcgccattc ggtttcttga 1890 <210> 30 <211> 4787 <212> DNA <213> Artificial Sequence <220> <223> Nitab4.5_0002006g0070.2 genomic sequence <220> <221> misc_feature <222> (1228)..(1241) <223> n is a, c, g, or t <220> <221> misc_feature <222> (1245)..(1245) <223> n is a, c, g, or t <220> <221> misc_feature <222> (1247)..(1247) <223> n is a, c, g, or t <400> 30 ggagtggtta atggttttgg ggaagttgag attctgctga gagaagatgg gagttgtcac 60 tgtttctgaa ctgaagccaa gcatatctgg gaaaaggtct tttcgtccaa gttccagtgc 120 cagacatatt actgaatggt atatttactc tctcttctat ctcaccaaac aactgctact 180 ttcacattac taatatttta tgcccagctt ttcatttgtg tcatattttc ttaaaagaat 240 ttacatggat agtactgtaa ggatattcca cagaccattt tgatgatgta tcaatttcta 300 caattaatat ttcctacaac acttaagacg tggaaaagtc catattggta tagctagatg 360 atagcatgaa ttcttgttag ttgggtactt gtgattgtca attatgctga gttctaataa 420 aaggctcagt cctagacaaa ggatacatct tttcttttgg catagtaaaa ttagctaact 480 tggttccccc cccccccccc agatactaat actatgagat tataaaaagg gagtttctgc 540 aatttatcac taaaagttcc acttagagga agaagtttac tggtaacaac taaatggatc 600 atagaagaat taatgcaagg aaaaaactaa actcttcaac caccaaagta tctgaattta 660 tgagttaggt gattggacag aatttagttt ccaacattta tgacaaacca tgttcaggtg 720 ctgactaagt ggaaatggca atatacttat agctttagaa attgattgtg atggaactta 780 tcttaaaatc taagaatcta aagttattat cagatcctaa agtaaataaa agaaaacagc 840 agagtatgag tatacatgag cagtttctag ggctgcaatc attgaaaatg acaaatcaaa 900 tatttgactt tttaccacct acaacaaatg atagtggccc tgattccaat gtgttcaagt 960 ttcttgtttc aacatgtggt gtgaacggtg tagacagcta ctccctccgt ttcaatttat 1020 gtgaacccat ttgagtgggc acgaaattta agaaaagaga gaacttttaa actgtgttgt 1080 aaaatgaggg cacatatatt ttgtgtggct ataaatcatt gcataaaggt aaataaacgg 1140 aggtagtata ttatttccct agttttcaac atatgtatct aatgagggcc ctctaccaag 1200 tacagatgag tcctgcaatt atctgttnnn nnnnnnnnnn naaangncac atatattttg 1260 tgtggctata aatcattgca taaaggtaaa ttgtttccaa ataaggaaag gtgtcattct 1320 ttttggcacg gaccaaaaag gaaataagtt cacataaatt gaaacggagg tagtatatta 1380 tttccctagt tttcaacata tgtatctaat gagggccctc taccaagtac agatgagtcc 1440 tgcaattatc tgttagatta ctacagacca caagataaat cacaaccagg aataaatttc 1500 aaagaaacca gaatatgact accacttgct atgttggatc taaacacatt gaataatctt 1560 tgtatccatt caagatattt gttttgagct tttccactca tagtgtccta tgatactttt 1620 ggtcgtaaat tgtggccgta tgtacaagcg ctagagcacg ataacatatg ctccccgaac 1680 cgttaaggtt tcatccgctt gaatttggat agctttaagg ttccaatatc cagcattaca 1740 gtgttgagat gtaagttgca ccatgtattg aaacttaggc taaaaatata aacagagaag 1800 tttattagta tatgtttttt tctcgacaca tttcctgttt ccggctttta atcattgacc 1860 atatattcta ttgcaggcca atatctgatg tttctagtga tcttacaata gaagtaggag 1920 ctgccagttt tgctcttcac aaggtacaaa tatgaagtat tagatcattc gtcttctcgt 1980 gtattttgat ctaccaatct tttcaaaatt ggaatgctca agtctatcaa aagcataaat 2040 tttgcaaaga aatggctgtc taatgtagct tgaaaatgat ttataagtta gctgttataa 2100 gtaggcaact gatattagga cagtcgtgtc cacatcggaa tttatttcat ggtgtcaaaa 2160 tagggaggga aaagaaaagt aaaaaggcag atgtaaaaac agaacttaag catcagtctg 2220 aaggtcagaa acaacagctg aagttgtttc aatgtagtgg atcttagact aagttatgtg 2280 cttcctgtta aaattaagaa aaatgaagga agaatacctt ggaaacattt ctaatgtgat 2340 tgctaatatc acactgtttg cagtttcctc tagtttcccg aagcggaaga attagaaagc 2400 tgctgctaga ggcaaaggat acaaagattt caagactcaa tcttaccggt cttcctggcg 2460 gatctgatgc atttgaactt gctgctaagt tctgttatgg cgtgaacgtt gagattacca 2520 tatcaaacgt ggcgatgcta agatgtgcat ccaagttcat ggaaatgaac gaagacatct 2580 ccgagaaaaa cctggaaatt cgtactgaag tattccttaa agatacagta ttcacaaaca 2640 tatccaactc gatatctgtt cttcatcgct gtgaaacact actaccggta tctgaagaag 2700 tcaatctcgt tagtcgatta atcaatgcaa ttgcaaacaa tgcttgtaaa gagcaactaa 2760 catctggttt gtcaaagctg gagcataact tcccacccaa acctgttcaa agccttgatt 2820 ctgagacacc aatagactgg tggggaaaat cattgactgt gctaaatcta gattttttcc 2880 agagagttgt atctgtagtg aagtcaaaag gtcttaaaca agacattatc agcagaattt 2940 tgataaatta tgccaaaaat tcacttcagg gacttttcat caaggatcct cagttggtta 3000 aaggaagttt cttggatttg gatttgcaga aaaggcaaag ggttatcgtc gaaacaatag 3060 ctagcttact accaacacaa tccaggaaaa gtacagtccc aatggctttt ctttcaagtt 3120 tgttaaaatc tgcaatagca gcatcagcat ccacttcttg cagatctgat ctagagaggc 3180 gcattggtct gcagctagat caggcaattc tagaagatat tctcatacct gcaaatccac 3240 atgggaacaa ccacagccct ctctacgaca tagattctat tttgaggatc ttttcctttt 3300 tcttgaattt ggatgaggat gatgaagagg acaacacact aagagatgaa agcgaaatgg 3360 tttacgactt tgatagtcct ggatctccca aacatagctc aattgttaag gtgtcaaagt 3420 tattggacaa ttatctagca gaagttgcac tcgattctaa cctcacgcca tcgaagtata 3480 tagcactggc tgagttactt ccagaccacg cgcgtctagt ttatgatgga ttatatcgag 3540 ctgtagatat tttcctcaag gtaagctgct taacctcatc cacattatct cactcacctg 3600 ttcaaaacaa ttagtatttc tcatatgagt agtctaacaa tggaaactac acatatacta 3660 ttttttatac ttttcgtata aataatagcc gacaaaatat atatttttta tatattaaca 3720 tgtaatatac atgttttata cataattagt atatactttt cgtatatttg gttagtcata 3780 aagttgctgc catgtgacca ggagatcacg ggttcgagcc gtggaagcaa cctcttgcag 3840 aaatgcaggg caaggctgtg tacaatagac ccttgtggtc cggccctttt ccagaccttg 3900 cgcgtagcgg gagcttaact gcccttttta tatttagcta gcggatgtaa ttatttttgg 3960 ctgatcggcc aaatgtgttt taatacaatg catgacattc tcacggcagg ttcatcccaa 4020 cattaaggac tcggaacgct atcgtctctg taaaactatt gattgccaga aactatcaca 4080 agaagcttgc agtcatgcag cacaaaatga acggttgcct gtgcaaatgg cggtccaagt 4140 gctatacttc gaacaaatca ggctgagaaa tgcgatgaac gggggacata accaattctt 4200 tggaatgaat aatcagttcc cccagcgttc aggcagcgga gcaggaagcg gatgcatctc 4260 tccgagagat aactacgcat cagtcaggag agaaaataga gaactgaagc tcgaggttgc 4320 aagaatgaga atgaggctta cagatttaga gaaagatcat gtttccatga aacaggagct 4380 agtaaagtca catcctgcca ataagttatt caagtcattt acaaagaaat taagcaagct 4440 gaatgcacta ttccgaataa aagatttaaa accaatagga gggaaagcta actcagaaag 4500 ccggttactt tttcagaaga gaaggcgcca ttcggtttct tgatgctcta ctctaatgtg 4560 aataagaaag agtatacagt gtttcacatt gctgaatttg gatgtgttga gagtgaagtt 4620 attgctttgc gttttgatcg tatccttgaa agaagagact cactcaaact tttactataa 4680 aggtatataa acaagtgtga gtttttttag cttcatgtag tttgcactac acgatcatcg 4740 agaaaatttt acaattgctc tttcccaata tttcttgtac tcatttg 4787 <210> 31 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> BTB/POZ homodimerization domain <400> 31 Ser Gln Glu Ile Pro Ser Asp Val Thr Val Asn Ala Gly Gly Ser Ala 1 5 10 15 Phe Ser Leu His Lys Phe Pro Leu Val Ser Lys Ser Gly Tyr Ile Arg 20 25 30 Lys Ile Ile Ser Glu Ser Asn Asp Ala Asp Val Ser Ile Val Glu Ile 35 40 45 Pro Asp Ile Pro Gly Gly Ser Asp Ala Phe Glu Leu Ala Ala Lys Phe 50 55 60 Cys Tyr Gly Ile Asn Phe Glu Ile Ser Thr Glu Asn Ile Ala Leu Leu 65 70 75 80 Arg Cys Thr Ala Glu Tyr Leu Glu Met Thr Glu Asp Tyr Ala Val Gly 85 90 95 Asn Leu <210> 32 <211> 275 <212> PRT <213> Artificial Sequence <220> <223> NPH3 domain sequence <400> 32 Asp Trp Trp Ala Glu Asp Leu Ala Val Leu Arg Ile Asp Phe Phe Gln 1 5 10 15 Arg Val Leu Ile Ala Met Met Gly Arg Gly Phe Lys Gln Tyr Ala Leu 20 25 30 Gly Pro Ile Leu Met Leu Tyr Ala Gln Lys Ser Leu Arg Gly Leu Glu 35 40 45 Ile Phe Gly Lys Gly Arg Lys Lys Ile Glu Pro Lys Gln Glu His Glu 50 55 60 Lys Arg Val Val Leu Glu Thr Ile Val Ser Leu Leu Pro Arg Glu Lys 65 70 75 80 Asn Ala Leu Ser Val Ser Phe Leu Ser Met Leu Leu Arg Ala Ala Ile 85 90 95 Tyr Leu Glu Thr Thr Val Ala Cys Arg Leu Asp Leu Glu Lys Arg Met 100 105 110 Ala Leu Gln Leu Gly Gln Ala Val Leu Asp Asp Leu Leu Ile Pro Ser 115 120 125 Tyr Ser Phe Thr Gly Asp Thr Leu Phe Asp Val Glu Thr Val Gln Arg 130 135 140 Ile Ile Met Asn Phe Leu Asp Asn Glu Met Asp Gly Ser Arg Leu Gly 145 150 155 160 Asp Glu Glu Tyr Val Ser Pro Ser Leu Ser Asp Met Glu Arg Val Gly 165 170 175 Lys Leu Met Glu Asn Tyr Leu Ala Glu Ile Ala Ser Asp Arg Asn Leu 180 185 190 Ser Val Ser Lys Phe Ile Ser Leu Ala Glu Val Ile Pro Glu Gln Ala 195 200 205 Lys Ile Thr Glu Asp Gly Met Tyr Arg Ala Ile Asp Ile Tyr Leu Lys 210 215 220 Ala His Pro Ala Leu Ser Asp Met Glu Arg Lys Lys Val Cys Gly Val 225 230 235 240 Met Asp Cys Gln Lys Leu Ser Arg Glu Ala Cys Ala His Ala Ala Gln 245 250 255 Asn Asp Arg Leu Pro Val Gln Thr Val Val Gln Val Leu Tyr Tyr Glu 260 265 270 Gln Gln Arg 275 <210> 33 <211> 374 <212> PRT <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0000842g0110.2 protein sequence <400> 33 Met Ala Ser Ser Ala Ile Phe His Phe Leu Pro Ser Ser Ser Ser Ser 1 5 10 15 Leu Thr Ser Leu Ser Phe Arg Asn Ser Arg Thr His Leu Ser Gln Thr 20 25 30 Pro Asn Phe Tyr Lys Pro Leu Leu Val Lys Ala Ser Thr Ser Val Asn 35 40 45 Phe Ser Ser Pro Ser Lys Ser Pro Thr Leu Thr Lys Asn Asn Asn Trp 50 55 60 Leu Trp Lys Tyr Lys Asp Asn Ser Val Asn Ile Tyr Tyr Glu Glu His 65 70 75 80 Asp Lys Gly Ser Asp Glu Pro Cys Lys Asn Val Leu Leu Ile Pro Thr 85 90 95 Ile Ser Asp Val Ser Thr Val Glu Glu Trp Arg Ser Val Ala Lys Asp 100 105 110 Ile Ala Gly Arg Ser Gly Lys Val Asn Tyr Arg Thr Thr Ile Val Asp 115 120 125 Trp Pro Gly Leu Gly Tyr Ser Asp Arg Pro Lys Leu Asp Tyr Asn Ala 130 135 140 Asp Val Met Glu Lys Phe Leu Ala Asp Phe Ile Asn Ala Pro Asn Ser 145 150 155 160 Pro Val Asn Asn Ser Asp Lys Asp Leu Val Val Phe Gly Gly Gly His 165 170 175 Ala Ala Thr Ile Ala Val Arg Ala Ala Lys Lys Gly Leu Val Lys Pro 180 185 190 Thr Ala Ile Ala Ala Ile Ala Pro Thr Trp Ala Gly Pro Leu Pro Ile 195 200 205 Val Phe Gly Arg Asp Ser Ser Met Glu Thr Arg Tyr Gly Leu Leu Arg 210 215 220 Gly Thr Leu Arg Ala Pro Ala Val Gly Trp Met Met Tyr Asn Val Leu 225 230 235 240 Val Ser Asn Glu Lys Ser Ile Gln Ser Gln Tyr Lys Ser His Val Tyr 245 250 255 Ser Asp Pro Glu Lys Val Thr Pro Asp Ile Ile Glu Ser Arg Tyr Ala 260 265 270 Leu Thr Lys Arg Gln Gly Ala Arg Tyr Val Pro Ala Ala Phe Leu Thr 275 280 285 Gly Leu Leu Asp Pro Val Lys Ser Arg Glu Glu Phe Val Gln Leu Phe 290 295 300 Ala Glu Leu Glu Gly Arg Ile Pro Val Leu Val Leu Ala Thr Ala Gly 305 310 315 320 Ser Pro Lys Arg Ser Lys Ala Glu Met Glu Ala Leu Met Glu Ala Lys 325 330 335 Gly Val Ser Lys Tyr Ile Glu Val Pro Gly Ala Leu Leu Pro Gln Glu 340 345 350 Glu Tyr Pro Glu Ile Val Ala Glu Gln Leu Tyr Arg Phe Leu Gln Glu 355 360 365 Lys Phe Glu Leu Gln Ala 370 <210> 34 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> interactor, Nita4.5_0000842g0110.2 coding sequence <400> 34 atggcatcct ctgctatttt ccactttctt ccatcatcat cttcttcctt gacttctctt 60 tccttcagaa acagcagaac ccatctttct caaaccccaa atttttacaa acccctttta 120 gtaaaagctt ctacttctgt caatttttct tccccctcca aatcacctac attgacaaag 180 aataataact ggctatggaa atacaaggac aattctgtga atatttatta cgaggaacac 240 gataagggaa gcgatgagcc ttgtaagaac gttttgctga ttcctactat ttcagatgtt 300 agtactgtgg aggaatggag atcagtggct aaagacattg ctggacgaag tggtaaagtt 360 aattacagaa ctaccattgt agattggcct ggtttaggct actctgatag acccaagctt 420 gattacaatg ctgatgtcat ggaaaaattc ttggccgact tcattaatgc tcctaatagt 480 ccagtgaaca attcggataa ggacttggtg gtgttcggag gaggacatgc tgctacaata 540 gcagttcgtg ctgcaaagaa gggcttggtg aagccaacag cgattgctgc tattgctccc 600 acctgggctg gtccacttcc tattgttttt ggaagagatt ccagcatgga aacgaggtat 660 ggtctcctta gagggacctt aagggcccct gctgttggtt ggatgatgta taatgtactt 720 gtcagcaatg agaaatcaat acaatcacaa tataagtccc atgtttattc agatcccgaa 780 aaggtaactc cagatatcat cgagagccga tacgcactca caaagcggca aggtgctcgc 840 tatgtgcctg ctgctttctt gactggtttg cttgacccgg taaagtccag ggaagaattt 900 gtccaactat ttgctgagtt agagggtagg ataccagttc tagttctggc aacagcaggt 960 tctccgaaga ggtcaaaagc agagatggaa gcacttatgg aggccaaagg ggtgagcaag 1020 tatatcgaag tgccaggtgc tctccttccc caggaagagt atcctgaaat agttgcagaa 1080 cagctttaca ggtttctgca agagaagttt gagcttcagg cttaa 1125 <210> 35 <211> 6057 <212> DNA <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0000842g0110.2 genomic sequence <400> 35 gagatttcac aaaaatatcc ggaaaaaaaa aagtttctcc aaaaatcatt taattattta 60 tctaagaact ttcctaccta caatttaagc tagaacagga aaataaaaat aaaaaagaaa 120 aaatcaacac cagcggcttc tctctttcac acatacacaa agtcgcatac ccagaaaaaa 180 agaaacaatt tttgtgttgc agaagttaag gtaaagcttc cataattcac acaatacaca 240 gagcctccat taatcattca attcatggca tcctctgcta ttttccactt tcttccatca 300 tcatcttctt ccttgacttc tctttccttc agaaacagca gaacccatct ttctcaaacc 360 ccaaattttt acaaacccct tttagtaaaa gcttctactt ctgtcaattt ttcttccccc 420 tccaaatcac ctacattgac aaaggtaaga cttaaaatta gtgaaactgt ttatctcaaa 480 atcaattttt tgaatttttt catattttgt ttttgcagaa taataactgg ctatggaaat 540 acaaggacaa ttctgtgaat atttattacg aggaacacga taagggaagc gatgagcctt 600 gtaagaacgt tttgctgatt cctactattt cagatgttag tactgtggag gaatggagat 660 cagtggctaa agacattgct ggacgaagtg gtaaagttaa ttacagaact accattgtag 720 attggcctgg tttaggctac tctgatagac ccaagcttga ttacaatgct gatgtcatgg 780 aaaaattctt ggccgacttc attaatgctc ctaatagtcc agtgaacaat tcgggtaagc 840 taaaagagcc ttcttgatat attttctgga taaattagag tacaatttct aattttgcac 900 tctttgcata aactattgat atagtgaaat taatctgttt gtctgtggac ataggccaaa 960 tcatatatat tatggtatca ctatttttgt tgttgttgtt gttgttgttg atgtcatatg 1020 ttgttgttct acataaatca agagtactac agaaatttct ttggagttaa atcgttaggt 1080 actctcttgg gaagaagatc caaggagcga ttctcaagga aatgtagcca aactctaggt 1140 gtaaatccag aaatagagat gttgaactta tgagtgctag gacatatttc caaaaaattt 1200 gtgaagttgg taaaaatgat gaactggaga agagaccaca actatgatca agatgttgaa 1260 gagaaggata acgccaatct tctttttgtg atggatgatt gtgcttgatt ggatgatgaa 1320 tgaatcatag atataggttg ttcgtactat atgtctcctt attgatactg gtttagccaa 1380 tatgaatctg ttagtagcgt caaaattttt ctgggaaaca acatcccaac caaaactatt 1440 acggattaat atggtgagaa tattgacgag agtttgacat attttcggac ccaacgaaag 1500 atttcatcta tctggatacc cttgattcta ataggtgcaa gttttcggcc aaaggttgtg 1560 tgatggtcat gaaggaggac ttattcatga tgaaggccag aaaagtcgaa agtttaatta 1620 ttttataacg tacccgtgtt atatgaattg ctgcaggctt ttcttctata cctgattatg 1680 aaattataac attgggatat atgaggttca gacatatgag cacgaagggg ctaattatgt 1740 tgaccaaatg tgaacttctt tgcgagcaaa ttacaagaaa ggtagagctt tgcgagctgt 1800 gcatctgaaa atcaagggag tcctaatttt agtattagta ttcataaaac aaaaggtatg 1860 ctagaccaca tcggagacct gcaagtgttt catgtaaagg tagaacgcaa tatttgctaa 1920 ccttttatat gattgctcaa caggaaaaga aaagtttacg tatatcttca gaaacactaa 1980 tatgaagctc tggacacttt taagaagtga aagaccttaa ttgagaagtc tgggaagcaa 2040 tcaaaaggct ttgatccatt aattttgtgt aagtgatttc aataaatgcc atgaggatca 2100 tgaaattggc agacacgtaa tgctataaaa gtttataaca gagtgacgtt gttgaacaca 2160 ttaatataac ctaattggag aaagaaaggt gtatgctgtc aaatgttcgt ctgcaaaggt 2220 ttctgagcta aaagctgtct ttatagcata ttacttggtg aactgcttac tgttcacggg 2280 tgttgagttc aaaacttaaa gaggtatggt ttggtctatc gggattattc aaatttgaaa 2340 accttggttg tcctgcttag atggatgtta gcggaggaaa gctagaacca agaaccaaaa 2400 attgtagttt ctttggttat gtattttggg gtgggagggc tgacgagcgc aaaacacaac 2460 acgaaattta tgcttgctag tcaaagatag tgtagttaag tgatcgtctc cacaggaaat 2520 ggatttaaac agtgttcgaa taatctttag ttaattacta tccaagaaaa ttaatacttg 2580 attcaatgat tatcaactac gattagctac taaaaattaa gcaattaata attgattacg 2640 gaagacacgg ttacaacaac aacaaaccca gtttgatctc ataaatgggg tctggggagg 2700 ggagggtagt gtgtacgcag accttacccc tagctcataa agatagagag gttgtttccg 2760 atagaccctc ggctcaagga acattgaaga taaagcaacg aagtagcaaa gaatattagc 2820 agcaatgtaa catggtaacg ggagtgaatg ccacaacatg cataataaag aacaataaat 2880 aggaaattac aaagatagtc ctagtactac tggtcggcct aggaggaaca cattacggaa 2940 gacacggttg agcaacaaaa aaatatcaat gagggaaata agggtaattg actagacagg 3000 tacacgacaa ttgactcggg atccaattct tgaatttgtt cactctataa tactgttgat 3060 tctcacgaat tcaacggata attagattac acttgaagtt aatgttcctc tttcgattaa 3120 acattaattt cagtaattaa tccaattgaa tcacagtgaa caattgcaac aaataaaatg 3180 acggttttag tcttaagggt aacttctcac gaatattttc ctattttcta gttcaattaa 3240 taattcaaga ggctttttcg attacctagt tgaatcacta atttaaacta gagcataaga 3300 tgtaaagaaa ttcaatataa agcttctctt ccgattaagc aaaataataa ataacttcac 3360 aatacgattt aaaactccat caattaattc aaacaattgt caagaatcta atccctaatc 3420 aagttgtcaa tacaccatat ctgtcaacac tctaagggaa attactccat agcaatggaa 3480 aaagtcatct caataaggtt taaaaacata gaaaacatca atgctaataa ttcgatacaa 3540 actcccgtat tgcaccgatt gttggttgaa atcttgatga attcttgtgt cttcttgcct 3600 tagttgtttc tcaattcttt tgtaggtcaa aagtcccttc aaaaacgtat ttttggtgta 3660 tttataccat gtagaagtgg acccggacaa aactacccct ttcaagctga aacagaaaaa 3720 tacgctggga aaattgcaca ggcgcgccgc gccgcgcctc gcgtcgcacc atgcggcgcg 3780 cttgtgggaa ttatcagagg cttgtcaatt ttgttagcag gcgcattata cactgccgca 3840 ccacgtctcg cggcgcccca tgcggtgcgg tagtgcttat ttcttagagt aatatctttc 3900 ttctacttta tgacatcccg acttggtcct cgacccccga acgcgatccc ggcttaattt 3960 cttgggcttt actcagatgt caaagctcca atttgttcga ttcagctcca aattaacttc 4020 ttacctcaga atcacttcct gcaaggcata aaacacgtaa taagtgtaat tcattgcagt 4080 aattagagtg taaaacgcgc taaatcatga gtttctagcc taccatcaag ggcatagctt 4140 gcggtgtcct ggtcctatat ctccaatttt gttaagatta gaaatgttat gttagttttg 4200 ctaaatctct taaggtgacc cggagcgggg ttcatctatt gccttttgag acctatcagg 4260 tagatagttt atcaaagaaa gtggagattg aagtttacaa tccacagctt tcatgaacag 4320 caaaaggggt cgtcagttgg ggtgaccagt gccagggggt tgtccattgc accgagaaac 4380 ttgtaaagta acatggacac atccaaagcg ccgtgagcca taattggaaa tggaaagtag 4440 gccatcctat atctactgtt ttcccctccc tcgttctgct gctaactctc tgtttttttt 4500 tttttttttt ttgtgtgtgt gtgtgcttgt gagatgtttc agttttgttt gctctctgca 4560 tctggaaatg atgttccaag ttcctttatt ttggtaaaga tatctcatct tacattttct 4620 tggaagttct cttgttaata atttcaaatg aataaattag ataaggactt ggtggtgttc 4680 ggaggaggac atgctgctac aatagcagtt cgtgctgcaa agaagggctt ggtgaagcca 4740 acagcgattg ctgctattgc tcccacctgg gctggtccac ttcctattgt ttttggaaga 4800 gattccagca tggaaacgag gtacgcatag atctttcctt ccgttgcact tttcttgacc 4860 tttttattta actaagagct ctgcagcttg ctaaataata cccattgcag ggctaggtcc 4920 aatatagaga acaaaaggac tacaagattc ggaagtttta agcagacatt aattcagttt 4980 ttgtaggaaa gaagcaaatg acatgagagt ctcctgcata gtaatgcatt ggataacaca 5040 atcagcaatc cacctttcaa aatatgaaat tttcatccga aaaaaataac aatagtattc 5100 aagattttca ccgtatttgc agaaatgata ttaccctact tcgtgattga tatttccttc 5160 tcattttcta caggtatggt ctccttagag ggaccttaag ggcccctgct gttggttgga 5220 tgatgtataa tgtacttgtc agcaatgaga aatcaataca atcacaatat aagtcccatg 5280 tttattcaga tcccgaaaag gtaactccag atatcatcga gagccgatac gcactcacaa 5340 agcggcaagg tgctcgctat gtgcctgctg ctttcttgac tggtttgctt gacccggtaa 5400 agtccaggga agaatttgtc caactatttg ctgagttaga gggtaggata ccagttctag 5460 ttctggcaac agcaggttct ccgaagaggt caaaagcaga gatggaagca cttatggagg 5520 ccaaaggggt gagcaagtat atcgaagtgc caggtgctct ccttccccag gaagagtatc 5580 ctgaaatagt tgcagaacag ctttacaggt ttctgcaaga gaagtttgag cttcaggctt 5640 aaaaatggtt atcagctcaa gacctaagta gtcaaaggta cagaattttc ccatgggcaa 5700 cagtgaggtt aagtggttaa atttgaaagt atgagatgac actggaagtg gctttatata 5760 tgataattca ggtgattaat gtatgaattt ttatctatat tgatagaggt tttccttctc 5820 ttaaaccaga cctagaatca cagaaagttg agtgctaaac cgatttatga caaacgatgt 5880 tcttattcaa tttgctgcta tggcagtttt atagtttttt ttaatttatt attacagata 5940 tattggttat ttagctgctc ttcatggctt tctatgagga gctgaatgtt acattgatct 6000 tttggttcat cataccatcg aggtcaattt tgatatttag caggtcagtt tgacttg 6057 <210> 36 <211> 1210 <212> PRT <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0001620g0100.2 protein sequence <400> 36 Met Gly Phe Ala Tyr Cys Leu Trp Gln Pro Asn Ala Ser His Cys Gly 1 5 10 15 Glu Ala Leu Asn Tyr Arg Ile Leu Asp Arg Lys Asn Ser Cys Asp Val 20 25 30 Gly Leu Asn His Lys Leu Leu Gly Asn Ala Arg Val Leu Cys Lys Asn 35 40 45 Arg Leu Gly Lys Arg Leu Lys Arg Ser Val Ala Cys Ser Asp Asn Ser 50 55 60 Leu Ala Tyr Ser Arg Ile Arg Phe Asn Cys Ala Leu Trp Lys Ser Asp 65 70 75 80 Ser Ser Gly Asn Leu Met Arg Arg Lys Ala Ser Arg Gly Val Lys Leu 85 90 95 Pro Arg Cys Gln Gly Asn Asp Ser Val Ala Phe Ile Asp Gly Asn Gly 100 105 110 Arg Asn Val Glu Ser Ser Glu Ser Ala Glu Asp Gly Ala Leu Ser Ala 115 120 125 Asn Thr Asn Gly Ile Ala Glu Ile Ser Cys Ala Ile Glu Leu Glu Glu 130 135 140 Asp Lys Glu Glu Glu Thr Glu Gly Asp Asn Leu Asp Glu Leu Arg Glu 145 150 155 160 Leu Leu Gln Lys Ala Leu Lys Asp Leu Glu Val Ala Gln Leu Asn Ser 165 170 175 Thr Met Phe Glu Glu Lys Ala Gln Lys Ile Ser Glu Ala Ala Ile Ala 180 185 190 Leu Lys Asp Glu Ala Ala Asn Ala Trp Asp Asp Val Asn Lys Gln Leu 195 200 205 Asp Ser Val Gln Glu Ile Val Ser Glu Glu Met Val Ala Lys Glu Ala 210 215 220 Val Gln Lys Ala Thr Met Ala Leu Ser Phe Ala Glu Ala Arg Leu Gln 225 230 235 240 Val Ala Leu Asp Ser Val Gln Ala Ala Lys Gln Arg Ile Met Ser Ser 245 250 255 Glu Thr Ser Glu Asp Ser Lys Gly Glu Asp Ser Thr Ser Leu Met Glu 260 265 270 Glu Glu Ala Ala Leu Leu Ala Ala Gln Glu Asp Ile Lys Glu Cys Leu 275 280 285 Asp Arg Phe Gly Ser Cys Glu Ala Glu Leu Arg Arg Leu Gln Asn Lys 290 295 300 Lys Glu Glu Leu Gln Lys Glu Val Asp Arg Leu Asn Glu Leu Ala Glu 305 310 315 320 Gln Ala Gln Asn Asn Ala Leu Lys Ala Glu Glu Asp Val Ala Asn Ile 325 330 335 Met Leu Leu Ala Glu Gln Ala Val Ala Tyr Glu Leu Glu Ala Thr Gln 340 345 350 Arg Val Ser Asp Ala Glu Ile Ala Leu Gln Lys Ala Glu Lys Asn Leu 355 360 365 Ala Val Ser Ile Val Asp Ser Pro Glu Thr Ser Val Leu Gln Asn Gly 370 375 380 Ser Ser Thr Gln Gly Gln Val Leu Val Asp Gly Thr Leu Ser Glu Asp 385 390 395 400 Glu Val Leu Pro Arg Asn Ser Val Asp Ser Val Ile Glu Ile Asp Arg 405 410 415 Glu Val Gln Leu Glu Asp Ala Trp Ala Ala Ser Gly Pro Leu Ser Thr 420 425 430 Glu Glu Ser Arg Ile Ser Asp Glu Ser Asp Glu Glu Asp Arg Lys Leu 435 440 445 Val Leu Asp Ser Ser Lys Asp Ser Asp Ser Asp Thr Glu Lys Pro Lys 450 455 460 Ser Val Gln Ser Leu Arg Gln Glu Val Asn Lys Glu Ser Ala Arg Asp 465 470 475 480 Ser Ser Leu Asn Ala Pro Lys Ala Leu Leu Lys Lys Ser Ser Arg Phe 485 490 495 Leu Pro Ala Ser Phe Phe Ser Phe Pro Thr Asp Gly Glu Glu Phe Thr 500 505 510 Pro Ala Ser Val Phe His Asn Leu Met Glu Ser Ala Arg Lys Gln Leu 515 520 525 Pro Lys Leu Val Val Gly Ser Leu Leu Met Gly Ala Gly Ile Ala Phe 530 535 540 Tyr Val Asn Arg Ser Glu Arg Ile Ser Gln Ser Phe Gln Gln Pro Asp 545 550 555 560 Ile Ile Thr Thr Ser Ile Asp Glu Val Ser Thr Asn Ala Arg Pro Leu 565 570 575 Val Arg Gln Ile Arg Lys Leu Pro Lys Lys Leu Lys Thr Leu Met Glu 580 585 590 Met Leu Pro His Gln Glu Ile Asn Glu Glu Glu Ala Ser Leu Phe Asp 595 600 605 Met Leu Trp Leu Leu Leu Ala Ser Val Ile Phe Val Pro Ile Phe Gln 610 615 620 Lys Ile Pro Gly Gly Ser Pro Val Leu Gly Tyr Leu Ala Ala Gly Ile 625 630 635 640 Leu Ile Gly Pro Tyr Gly Leu Ser Ile Ile Arg His Val His Gly Thr 645 650 655 Lys Ala Ile Ala Glu Phe Gly Val Val Phe Leu Leu Phe Asn Ile Gly 660 665 670 Leu Glu Leu Ser Val Glu Arg Leu Ser Ser Met Lys Lys Tyr Val Phe 675 680 685 Gly Leu Gly Thr Ala Gln Val Leu Val Thr Ala Val Val Val Gly Leu 690 695 700 Val Ala His Phe Val Ala Gly Gln Ala Gly Pro Ala Ala Ile Val Ile 705 710 715 720 Gly Asn Gly Leu Ala Leu Ser Ser Thr Ala Val Val Leu Gln Val Leu 725 730 735 Gln Glu Arg Gly Glu Ser Thr Ser Arg His Gly Arg Ala Thr Phe Ser 740 745 750 Val Leu Leu Phe Gln Asp Leu Ala Val Val Val Leu Leu Ile Leu Ile 755 760 765 Pro Leu Ile Ser Pro Asn Ser Ser Lys Gly Gly Val Gly Phe Arg Ala 770 775 780 Ile Ala Glu Ala Leu Gly Leu Ala Ala Val Lys Ala Ile Val Ala Ile 785 790 795 800 Thr Ala Ile Ile Ala Gly Gly Arg Leu Leu Leu Arg Pro Ile Tyr Lys 805 810 815 Gln Ile Ala Glu Asn Gln Asn Ala Glu Ile Phe Ser Ala Asn Thr Leu 820 825 830 Leu Val Ile Leu Gly Thr Ser Leu Leu Thr Ala Arg Ala Gly Leu Ser 835 840 845 Met Ala Leu Gly Ala Phe Leu Ala Gly Leu Leu Leu Ala Glu Thr Glu 850 855 860 Phe Ser Leu Gln Val Glu Ser Asp Ile Ala Pro Tyr Arg Gly Leu Leu 865 870 875 880 Leu Gly Leu Phe Phe Met Thr Val Gly Met Ser Ile Asp Pro Lys Leu 885 890 895 Leu Leu Ser Asn Phe Pro Val Ile Met Gly Ser Leu Gly Leu Leu Ile 900 905 910 Gly Gly Lys Thr Ile Leu Val Ala Leu Val Gly Lys Leu Phe Gly Ile 915 920 925 Ser Ile Val Ser Ala Ile Arg Val Gly Leu Leu Leu Ala Pro Gly Gly 930 935 940 Glu Phe Ala Phe Val Ala Phe Gly Glu Ala Val Asn Gln Gly Ile Met 945 950 955 960 Ser Pro His Leu Ser Ser Leu Leu Phe Leu Val Val Gly Ile Ser Met 965 970 975 Ala Leu Thr Pro Tyr Leu Ala Ala Gly Gly Gln Leu Ile Ala Ser Arg 980 985 990 Phe Glu Leu His Asp Val Arg Ser Leu Leu Pro Val Glu Ser Glu Thr 995 1000 1005 Asp Asp Leu Gln Asp His Ile Ile Ile Cys Gly Phe Gly Arg Val 1010 1015 1020 Gly Gln Ile Ile Ala Gln Leu Leu Ser Glu Arg Leu Ile Pro Phe 1025 1030 1035 Val Ala Leu Asp Val Arg Ser Glu Arg Val Ala Val Gly Arg Ala 1040 1045 1050 Leu Asp Leu Pro Val Tyr Phe Gly Asp Ala Gly Ser Arg Glu Val 1055 1060 1065 Leu His Lys Val Gly Ala Glu Arg Ala Cys Ala Ala Ala Ile Thr 1070 1075 1080 Leu Asp Thr Pro Gly Ala Asn Tyr Arg Thr Val Trp Ala Leu Ser 1085 1090 1095 Lys Tyr Phe Pro Asn Val Lys Thr Phe Val Arg Ala His Asp Val 1100 1105 1110 Asp His Gly Leu Asn Leu Glu Lys Ala Gly Ala Thr Ala Val Val 1115 1120 1125 Pro Glu Thr Leu Glu Pro Ser Leu Gln Leu Ala Ala Ala Val Leu 1130 1135 1140 Ala Gln Ala Lys Leu Pro Met Ser Glu Ile Ala Ala Thr Ile Asn 1145 1150 1155 Glu Phe Arg Ser Arg His Leu Ser Glu Leu Thr Glu Leu Cys Glu 1160 1165 1170 Thr Ser Gly Ser Ser Leu Gly Tyr Gly Phe Ser Arg Val Val Asn 1175 1180 1185 Lys Gly Lys Val Gln Pro Pro Asp Ser Ser Asp Glu Asn Gln Val 1190 1195 1200 Ser Glu Gly Thr Leu Ala Ile 1205 1210 <210> 37 <211> 3633 <212> DNA <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0001620g0100.2 coding sequence <400> 37 atgggctttg cttactgttt atggcagccg aatgcttcac attgtggtga agctttgaac 60 tacaggatat tagataggaa aaacagctgt gatgtagggt tgaatcataa attgcttgga 120 aatgctaggg ttttatgtaa gaataggctg gggaaaaggt tgaaacggag tgtggcctgt 180 agtgataata gtttagcata ttcaaggata cgatttaatt gtgctttgtg gaagtccgat 240 tcaagtggga atttgatgcg ccgtaaggct tctaggggag tgaaattgcc tcggtgtcag 300 ggaaatgatt cagttgcgtt tatcgatggt aatggtagaa atgtggagtc cagtgagagt 360 gctgaagatg gagctctgag tgctaatact aatggaatcg cggaaattag ttgcgcaatt 420 gagttggagg aagataaaga agaagaaaca gaaggagata atttggatga actaagggag 480 ttgttgcaga aggcactcaa ggatttggaa gttgcacagc tgaacagcac aatgtttgag 540 gaaaaagcac agaagatatc agaagctgct atagcgttaa aagatgaagc ggctaatgcc 600 tgggatgatg taaacaaaca acttgatagt gttcaagaga ttgtaagtga agagatggtc 660 gctaaagaag cagttcaaaa agcaacaatg gccctttctt ttgctgaggc aaggcttcag 720 gttgctcttg attcagtaca agctgcaaaa caaagaatta tgtcttcaga aacgtctgaa 780 gatagcaaag gggaagattc aacttcattg atggaggaag aggcagcact cttagctgct 840 caggaagata taaaggagtg tctggaccgt tttggaagtt gtgaggctga gttgaggcgt 900 ctgcagaata aaaaagaaga gctgcaaaag gaggttgaca gactgaatga gctagctgag 960 caagcacaaa acaatgcttt aaaagccgag gaagatgttg caaacataat gcttttagct 1020 gaacaagctg ttgcttatga gctggaggct actcaaaggg tcagtgacgc ggagatcgct 1080 ttgcagaaag ccgagaagaa cctagctgtg tcaattgttg actccccaga aacttcagtt 1140 ttacagaatg gatcatctac tcaagggcaa gtgttggtcg atgggaccct tagcgaggat 1200 gaggtactcc ctagaaattc agtcgatagt gttattgaaa tagataggga ggtacaactg 1260 gaggatgctt gggcggcaag tgggcctttg tcaactgagg agtcacgtat ctctgatgag 1320 agtgatgaag aagatagaaa gttagttcta gactcctcaa aagattctga ttctgataca 1380 gaaaaaccaa aaagtgttca aagtctgagg caggaggtca acaaggaatc agctagggac 1440 agttcactta atgctcccaa agcattattg aagaaatcat cccgtttctt gcctgcatct 1500 ttcttctcat ttcccacaga tggtgaagag ttcacacctg cttcagtttt ccacaatctc 1560 atggagtctg caaggaagca attgcccaag ctggtggttg gctcattact gatgggagca 1620 ggaattgcct tttacgtcaa tcgatcagag cgaatttctc agtcgtttca gcagccagac 1680 atcattacca ccagcattga tgaggtttca acaaatgcaa gacctctggt tcgacaaata 1740 agaaaactgc ccaagaaact taagacacta atggagatgc ttcctcatca agagataaat 1800 gaggaggaag cttctctttt tgacatgtta tggctattgc tcgcaagtgt tatctttgtg 1860 ccgatcttcc agaaaattcc aggaggaagt cctgttcttg ggtatttggc tgctggaatc 1920 ttgattggac cctatggtct ttctatcata cgtcatgtac atgggaccaa ggctatagct 1980 gaatttggag ttgtcttcct gctatttaac attggcctag agctttccgt tgagagacta 2040 agttcaatga agaaatacgt ttttgggttg ggtactgctc aggtcttagt gacagctgtt 2100 gtggtcgggt tagttgctca ttttgttgcc gggcaggctg gacctgctgc aatagtgatt 2160 gggaatggtc ttgccttatc ttccactgcg gttgtcctcc aggtattgca ggagcgaggt 2220 gagagcacat cacggcatgg acgagcgaca ttttctgtat tactctttca ggatctggcg 2280 gtggttgttc tactcatact gataccacta atttcaccaa attcatcaaa aggaggggtt 2340 ggtttcagag ccatagctga ggcccttggt ttggctgctg taaaggcaat tgtagccatc 2400 actgccatta ttgctggagg acgtctgctg ctgcggccta tttataagca gattgcagaa 2460 aaccaaaatg cagaaatatt ttcggcaaat acgcttcttg ttatccttgg gactagtctt 2520 ctgacagcca gggctggcct ctcaatggct ttaggtgcat ttttagctgg tttgcttctg 2580 gcagaaactg aattttcatt gcaagttgaa tcagatattg ctccatatcg tggactccta 2640 ttgggtctct ttttcatgac ggttggaatg tccattgatc ccaagcttct tctttcaaac 2700 tttccagtta ttatgggctc attgggactt ctaattggtg gcaagaccat cttggttgca 2760 ttagttggta aactgtttgg tatttcaatt gtatcggcaa taagagttgg tcttctactt 2820 gctcctggtg gagagtttgc ctttgtagct tttggtgaag ctgttaacca gggtataatg 2880 tctcctcact tgtcatctct gctatttctt gtggttggaa tttcaatggc cctcacgcca 2940 tatctagctg ctggaggcca attaatagca tctcgttttg agctgcacga tgtgcgaagt 3000 ttattgcctg tggaaagtga gacagatgat ttgcaggatc atatcattat ttgtggattt 3060 ggtcgtgttg gccagatcat tgcccaactt ctctccgagc gactgattcc gtttgttgca 3120 cttgatgtgc gaagtgaacg agttgcagtt ggtcgtgcac ttgaccttcc tgtatacttt 3180 ggtgatgctg gtagccgaga ggttctacat aaagttggag ctgaaagagc atgtgctgcc 3240 gcaataacat tagatactcc cggtgcaaat tacagaactg tttgggcctt gagcaagtac 3300 tttcccaatg tgaaaacatt tgtacgtgct catgatgtgg atcatggcct caatctagaa 3360 aaggctggag caacagcggt tgtgcctgag accttggaac caagcctgca gttggccgct 3420 gctgtccttg cacaagctaa gctgccaatg tcagagatag cggcaacaat caacgagttt 3480 aggtcccgcc acctctctga gcttacagag ctatgtgaaa ctagtggaag ttctctaggc 3540 tatggatttt ctcgtgtggt gaataaaggc aaagttcagc ctccagattc ttcggatgag 3600 aaccaagtca gtgaaggaac actagcaata tga 3633 <210> 38 <211> 12416 <212> DNA <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0001620g0100.2 genomic sequence <220> <221> misc_feature <222> (8239)..(8263) <223> n is a, c, g, or t <400> 38 gaagtttcca tcaaaacaat aagaagaagg gtaattgtgt aaatgcagaa aatggaatat 60 ccaccaataa accctctaat ccaattttgt catgttcccc aaatggaggg agaaaacaaa 120 acctgaaaaa gaaaaaaaag aaaagatttc ttctcattat ttcaactttt caagtaaccg 180 cagagtcgca aacgaaaggt tgttcttcgg acaaagctat aaaaaatcaa aactgatagg 240 aagagccaat aagcaaagtc aatccaatca ttttctgacc taattttccg ccatagatat 300 tcttctctca gaacttgaaa ctgtcacttc tatcggtata ttcaaacttc tctcttctgt 360 tttacttcat tttcactact gtcaacttta acttcagtat atgtatcgaa acggaatgtt 420 gattaatcgc gaaatcactt tcagtttttt cagcttgcaa atatttgttg tggtgatttt 480 aactgattgt ttgtggctcc tatgaattaa ttttcacttg tttgttgatt gaagttgaaa 540 acttgcttta tttgtttttt aggggtttga ttttgaggta atgagaattg gcggcattgt 600 tttggtgtat ttttgacgtt tagtgtgtta gaggagagga ggatgggctt tgcttactgt 660 ttatggcagc cgaatgcttc acattgtggt gaagctttga actacaggat attagatagg 720 aaaaacagct gtgatgtagg gttgaatcat aaattgcttg gaaatgctag ggttttatgt 780 aagaataggc tggggaaaag gttgaaacgg agtgtggcct gtagtgataa tagtttagca 840 tattcaagga tacgatttaa ttgtgctttg tggaagtccg attcaagtgg gaatttgatg 900 cgccgtaagg cttctagggg agtgaaattg cctcggtgtc agggaaatga ttcagttgcg 960 tttatcgatg gtaatggtag aaatgtggag tccagtgaga gtgctgaaga tggagctctg 1020 agtgctaata ctaatggaat cgcggaaatt agttgcgcaa ttgagttgga ggaagataaa 1080 gaagaagaaa cagaaggaga taatttggat gaactaaggg agttgttgca gaaggcactc 1140 aaggatttgg aagttgcaca gctgaacagc acaatgtttg aggaaaaagc acagaagata 1200 tcagaagctg ctatagcgtt aaaagatgaa gcggctaatg cctgggatga tgtaaacaaa 1260 caacttgata gtgttcaaga gattgtaagt gaagagatgg tcgctaaaga agcagttcaa 1320 aaagcaacaa tggccctttc ttttgctgag gcaaggcttc aggttgctct tgattcagta 1380 caagctgcaa aacaaagaat tatgtcttca gaaacgtctg aagatagcaa aggggaagat 1440 tcaacttcat tgatggagga agaggcagca ctcttagctg ctcaggaaga tataaaggag 1500 tgtctggacc gttttggaag ttgtgaggct gagttgaggc gtctgcagaa taaaaaagaa 1560 gagctgcaaa aggaggttga cagactgaat gagctagctg agcaagcaca aaacaatgct 1620 ttaaaagccg aggaagatgt tgcaaacata atgcttttag ctgaacaagc tgttgcttat 1680 gagctggagg ctactcaaag ggtcagtgac gcggagatcg ctttgcagaa agccgagaag 1740 aacctagctg tgtcaattgt tgactcccca gaaacttcag ttttacagaa tggatcatct 1800 actcaagggc aagtgttggt cgatgggacc cttagcgagg atgaggtact ccctagaaat 1860 tcagtcgata gtgttattga aatagatagg gaggtacaac tggaggatgc ttgggcggca 1920 agtgggcctt tgtcaactga ggagtcacgt atctctgatg agagtgatga agaagataga 1980 aagttagttc tagactcctc aaaagattct gattctgata cagaaaaacc aaaaagtgtt 2040 caaagtctga ggcaggaggt caacaaggaa tcagctaggg acagttcact taatgctccc 2100 aaagcattat tgaagaaatc atcccgtttc ttgcctgcat ctttcttctc atttcccaca 2160 gatggtgaag agttcacacc tgcttcagtt ttccacaatc tcatggagtc tgcaaggaag 2220 caattgccca agctggtggt tggctcatta ctgatgggag cagggtacaa ctactataaa 2280 actgttcatt ctttgttgct tttgaaagat gaagctattt ctttctagct gcatgtataa 2340 gtgcctcgtt aggatacaat ctttgtacca ttagattggt atagcttgtt tatggtactt 2400 gatatgcttt tgacgtctgt cacagaattg ccttttacgt caatcgatca gagcgaattt 2460 ctcagtcgtt tcagcagcca gacatcatta ccaccagcat tgatgaggtt tcaacaaatg 2520 caagacctct ggttcgacaa ataagaaaac tgcccaagaa acttaagaca ctaatggaga 2580 tgcttcctca tcaagaggca tgcttcttta actcccttta gtttaacgcc tgcaatcacc 2640 attttgttag gaaggggctt tacttctact tgctaatggt gttgttgctc atttcagata 2700 aatgaggagg aagcttctct ttttgacatg ttatggctat tgctcgcaag tgttatcttt 2760 gtgccgatct tccagaaaat tccaggaggt aattgaattt tgctaccttc ttttatcgca 2820 tgaggacagt gactaggggc ttcttatgtt aaattgttca ccaaacttgt tcttgatgta 2880 aaggtttcct cgtaggtctt tccttgaaca tgttctaaaa attgaaaaat gatatttgat 2940 tattagacac ttagttttcg gtgaccttga tgtatgtcac agatatgtgc cctttgctcc 3000 tctgtgacag acgtactctt gtttcttgtt aatggttcat cttctgtctg ctataatgtg 3060 taggaagtcc tgttcttggg tatttggctg ctggaatctt gattggaccc tatggtcttt 3120 ctatcatacg tcatgtacat gggaccaagg ctatagctga atttggagtt gtcttcctgc 3180 tatttaacat tggcctagag gtacagtcta ggaaaattga ctagtttatt tctttctgaa 3240 tgtgttacaa atactgcctt aataacctct gtttgtattc tctttgacag ctttccgttg 3300 agagactaag ttcaatgaag aaatacgttt ttgggttggg tactgctcag gtaattgaaa 3360 aaaattgagc acttgggagt tgttaagccc cctccataat gcttatagag tatggtctca 3420 acgttttagg tttccacact aattattaat atattcaaat gaacgcaggt cttagtgaca 3480 gctgttgtgg tcgggttagt tgctcatttt gttgccgggc aggctggacc tgctgcaata 3540 gtgattggga atggtcttgc cttatcttcc actgcggttg tcctccaggt aaatccttct 3600 atatatttag caggtcttcc ttgctggatg aatgatgggc gatttagctg gatgaatgat 3660 gggcgattta gcgtttgagt aatttgttgt actcattaag tacgttgatt tggtgaccgt 3720 ttcaacactc taattaaagt taatgcttaa gcaggcaata ttattatgct atgttcccca 3780 aaagtccaga agctataatg ctagataagg gttgatgccg agatatcaaa tcagcattgg 3840 agtttttctt atcatttcct tgttgattca ccatatttac tacaatcaag gaattgtagt 3900 ttatctataa ttggctttgt ctatgtgcct gtgaccctcc ctcttcgaaa aatgaaactt 3960 tagtaattaa tttattatgt tgcatatctg caggtattgc aggagcgagg tgagagcaca 4020 tcacggcatg gacgagcgac attttctgta ttactctttc aggtatctgc atagagacag 4080 tacaaaattg tcgcatcttt ctcctgagat gggtgaaact tggaatatta tgtgtatcta 4140 tgcatacacg cgaatcacat atatttactt gccatcacat ataggctgct ctcatgcact 4200 tgaaatgatg acagtcagtg ctgcggtact tttagatttt tctttctgat atgattaacc 4260 aaattcttcc ctttatcctc caggatctgg cggtggttgt tctactcata ctgataccac 4320 taatttcacc aaattcatca aaaggagggg tatagactct tgttaccgtc ttgtcttctg 4380 gaaaaattat ttaaaatttt tgtgtttatt ataattacga ttccagctat gtgaactgga 4440 cctgtaatat tcaccaaact gagagccaat agctaatccc ctaaagtcac acgtgaaaac 4500 aacattcttt gcttttgata gctgtgagtt acactatagc tgttttctca aactgccatt 4560 attataacag aacttatttc ttcttaggtt ggtttcagag ccatagctga ggcccttggt 4620 ttggctgctg taaaggcaat tgtagccatc actgccatta ttgctggagg acgtctggta 4680 aggtgtttgt tcatgtagaa tcacttccaa tattataaat gcttctgatt agtatataat 4740 ttttaagttc taactacatc tcttacgata ttttggactt tagtctttca tttgcttttg 4800 tctatacatt attaaagtag ggtttgatat ttatctattg caaaatataa ataggtttta 4860 attccgtttt tcactttgca agtcttgtaa gatacattgc tgtaatgtga ggacgttaat 4920 atttttgttc tctattccaa tttcagctgc tgcggcctat ttataagcag attgcagaaa 4980 accaaaatgc agaaatattt tcggcaaata cgcttcttgt tatccttggg actagtcttc 5040 tgacagccag ggtacttatg atcacattgt ttatgtgttc atgaatactg cccaattctg 5100 ttagaactgt tatcttgtta acgctatgat gtgttatctg atgtaaataa ttcaggctgg 5160 cctctcaatg gctttaggtg catttttagc tggtttgctt ctggcagaaa ctgaattttc 5220 attgcaagtt gaatcagata ttgctccata tcgtggactc ctattgggtc tctttttcat 5280 gacggtaggt gacaatcttg tttattgtac aatgtgaatg ctattttcta atcctacaat 5340 ttgtcatttg gagttaaggt aggataggtc ttggtaaggt gctatttaca tttaaagatt 5400 ctcactctgc aatctctagc accaacttgt agaccttagt tgtctctcct gagttgttct 5460 ctttgaatga atgtacttct cagtaacatt ttatctattt taatcaactt ttatccaggc 5520 tgaagggaga atcgtttatg aataaattat tataactagt gctactttgt gacttcaaaa 5580 ctgaacaatt atcatctggt tgcaggttgg aatgtccatt gatcccaagc ttcttctttc 5640 aaactttcca gttattatgg gctcattggg acttctaatt ggtggcaaga ccatcttggt 5700 tgcattagtt ggtaaactgt ttggtatttc aattgtatcg gcaataagag ttggtcttct 5760 acttgctcct ggtggagagt ttgcctttgt agcttttggt gaagctgtta accaggttta 5820 tctctgatag ctttaaccta ttacaagcaa ttctgagccg ttaataaaat tcttttattc 5880 catttctttt tctccgttct attgctatgc tgttcaaaca gcatcttcct ttatcaagga 5940 attgtggacc ttttctacaa ttgacctgtg tgctgaaatc aaatgttgag ctagtgagat 6000 cctgttattg gggaagtgga gacaaactac catcaaatcc ttccagtttc tatctatggc 6060 cgctgtctta cttctatttt acaaatcctc ttagagactt gttctttctc atagctaccc 6120 ttaaatagat tcagagctgc aacatatctg aacagtacaa tgctaagctc tctgaggatc 6180 tttgccccat gataaaaata tatcttatta gaataagttt attatcttat ttaattaaat 6240 tttctccatg attttgcttt tctttttcca gggtataatg tctcctcact tgtcatctct 6300 gctatttctt gtggttggaa tttcaatggc cctcacgcca tatctagctg ctggaggcca 6360 attaatagca tctcgttttg agctgcacga tgtgcgaagt ttattgcctg tggaaagtga 6420 ggtatagtct cctacttggg ggcacaatct ctcttctttg gttttaagcg agaataaacc 6480 atttacatgt tcgtaaaatc ttattttttg acagtttggt ttcaggttgt caatagtaac 6540 agggtattgg aattaaagga ttaaggttaa ggggtcttaa tagttaatac tattgttaaa 6600 aaaaaaaaca gttgtggaga ctaggaaaac tggaattttg gtgatagaaa agcttccttt 6660 ttctcctctt ccctacctca aatttcttca tcttcattct tcatccctgt ctgctttctc 6720 ctttcagtgc ctttctttga tcctggttca tctcttaagt tttgtgctct actttgttgt 6780 tgctatttaa gtcccatgcc tcagtgttat ggtactaagc cttttggacc ctcgcagttt 6840 ctctatgcaa agattttttt ttccttgaaa atattgtcta ttgaattata gcttcatatc 6900 atcatctgat taggtttccg ctgaacctta tgcctcactt tgttttcctt ccgagcttat 6960 ttaacataat ttttttcttc ttctaatttt aagtgttcaa tacttaattt gttctttaac 7020 ttattgcttc tttgctttaa atttaattgc tattggtaat gtcagccttt attacgaaga 7080 tcatttgtct gagaagtaac agatattcag ttaccaaagc tcattacttg aaggactaca 7140 tcatttaatg atatctttct ggattattac cttcgtaaat gtaatgaaga tttcactgac 7200 ttaaatttat tgcataataa aaggtgtaga ctgatagtac cttttttcct tcgcagacag 7260 atgatttgca ggatcatatc attatttgtg gatttggtcg tgttggccag gttttgcccc 7320 gtgcttcatg aattggttaa attgatcatt tgacagaatg attttcaaac tttggaacaa 7380 tgaagctatt tccatcttct gcctgttgaa ttagttttca tcttaacaga tcattgccca 7440 acttctctcc gagcgactga ttccgtttgt tgcacttgat gtgcgaaggt atgattctct 7500 ttttactcac attcaactga tttcagctcc tgtaggttca gtgaagattt catctgctgt 7560 ttgttaagct gacatagaat tttttcttcc atagtgtcat ttcctgatat ggtggttcta 7620 aaattttata tttttcgtaa aagaaaagaa aaaaagcagg aggaagaact tatatctttt 7680 gaggtgtaag tgactttctg cctcagatct ctatattcct atgccgtgct taagttttct 7740 caccactatg gttcttttca caacttacga agcagcacct ccactatcaa ctactcttaa 7800 aagccaccag atctttatag ctgaccaaat gcaagaaaat ggtttttctt tataagatat 7860 tatatagttt gttaattgtg agtcatcagt cattatcaac ctttaggata ttaaagtaaa 7920 agtttttgtt tttctctatc taaataaaat gttcatattc atgcatgcat ccaagggatg 7980 acagtgaaag agaagcagat gatggttttc ctgtaagagt gccagtgcca agccagagaa 8040 ctgaggaaac tggtctagaa cagagaagtc cttaattgaa cttgttaaat agttatgtgt 8100 aaatagtcct agtcccatat gtaggagtag aatatgtatc atatatagag ttcattgcag 8160 tgttttaaaa agcgatcgat ctttaagcga gaagggacgc gaagcgatgg ctgctcgctt 8220 ttccatgcct gaggcgacnn nnnnnnnnnn nnnnnnnnnn nnntatatat gtgtgtgtgt 8280 gtgtgtgtgc gtgtgtgtgt tatattttag tttatttgat ttttttaata tgtatttcag 8340 tttataaaat taattattat atatattata gtagctttga ttttgctttt cctatggttt 8400 gtggaggatt tggtggtacc tacttttgag tttttaaatt gaactttttg attatttata 8460 ttgtgtcttt gcaaggttta cattatattt tttaagaatt gcgcttcact tcaatgaagc 8520 gtgcgcttcg cttttgaagc gaggggagcc tctgtcgctt ttttgcgctt ctcactctca 8580 aaaacactgg ctcattgcat cattgttaaa aaatagattt ttcttccgtg cattctcgca 8640 tggtatcaga gcttcagtga gaattatcgt tgtgcgtcat tccaacgaca ttcgggaaga 8700 aagatctcat tgccgtgcaa ttttccggca atttcgtctt gttcccaggg ttcatcactg 8760 ctacaatggt actatgcata taccagtacc accatcagat ctgaaaccct tgtgcgacca 8820 aaccctaaaa attccagtcc catcggaaca gaaaagtcag taaccgtgcg tctttccggt 8880 tgacgattca agattgattt gcgttatctc ctcattggta agtgttgtgc gaaaaccaac 8940 actatcacct tgttcggaaa agtaagacga caaaacccca gtcaatcgct ccggcagaaa 9000 gtcacgtgcc gccagaacta gggtttcggc gagctacatt aacttttccg gcgcgtgtga 9060 gccatcccgg ccattttttg acaaaacttc tcaggacaac ttactcgtcc agtgattccg 9120 aacctaccca tataaattac atcaaattct gacaactttt atttttttgc gacatgaaca 9180 gtggttttcc ggcatgaaca gtaattccag aaaaagtttg tgtattctgg tggtgtttta 9240 gaatctattt tgtagtgtgg aattcggctt agtctcacta ttttcaaatt tttccggcaa 9300 ctgttcggcc aacttttgtt tatcagcaac cacctggttt tgttgctcag ggggagtcta 9360 gtggccttgt atgtcgaatg atcagcttgc agatattttc accaagtccc tcattggtcc 9420 tcatattagt tacatatgta acaacctcgg tacatatgat ttgtatgcac cggcttgagg 9480 gagagtgtta gatagttatg tgtaaatagt cttagtccta tatgtagtag gagtagaata 9540 tgtattatat atagagctca ttgcatcatt gttaaaaaat agatttttct tccgttcatt 9600 ctcacagaac ttttagatta tttcacaaat cagctatgtt gcgcggactc ctcatttcag 9660 cccgcacccg tgtctacatg acactagtaa gggtaagggt gtgagattca taccgaatgt 9720 ggtcaacccg acatcagata ctttgaccac aatccatgga caagtttgag gaaaaaaatg 9780 ggactttgat ttctcaagat aaaagttagt acatatttga agacatggga aatggcataa 9840 cttcaatagt cgacccgtat tcgtgaaatg tgtatccgta tctggatctt cacacctgat 9900 gatttaggat atttttataa atctatcttt agaattttga attatttttc gccgaatccc 9960 ctcacccgta tctggatccc gtatccccaa atcttttaga ttatgaagga tccgaccttt 10020 ggatccgcac ccggatcgga tacccgcacc cgagtccgag caacatagca aatcagatat 10080 gaattagaat caaagttggt tcccatccaa agcttgtaat gttgctctct atagtactct 10140 ttaactaaga tggattgtgt ggctgaatgc agtatcttat gtagacacgg ttacatgaat 10200 ttctcaaaaa cataaaaggg tactagagtt tccttatatg ctggagcttt gattgtaagt 10260 ggatcgtgac tatcatcata ttgctctaga gtactttgat attcagcagt tgattattag 10320 agcatcaaca agtattaact tgattactgc atctataaga aaggtttctt tgtggtggtg 10380 ggggcggagg gtgcaggaaa tgttgctttc acttaaattt tccaattgtt atcagttatc 10440 atgaatatcc tgaggctcat cttaatagat gtttctataa taaatgcagt gaacgagttg 10500 cagttggtcg tgcacttgac cttcctgtat actttggtga tgctggtagc cgagaggtaa 10560 agcaaattcc tgaacttaag attatcattt cggatatttt attttgacat tctgtgttcc 10620 gattactagg ttctacataa agttggagct gaaagagcat gtgctgccgc aataacatta 10680 gatactcccg gtgcaaatta cagaactgtt tgggccttga gcaagtactt tcccaatgtg 10740 aaaacatttg tacgtgctca tgatgtggat catggcctca atctagaaaa ggctggagca 10800 acagcggtat ctttcttatt ctaatttctg ctattgatct tttcgttgga aactcgttca 10860 tattttttca cttagcattc tgtatatctc ttgataacat ttggattctg agtcttgaaa 10920 attttgtttt attgctggtg tattatgttg tgctatggta aaattttgta gttgtaacat 10980 atcatgcata aaagaggaaa tagttgcaca tttgatggtt ggataaatga tgaacaatgc 11040 attaactgag gtggataaaa acttttacag gttgtgcctg agaccttgga accaagcctg 11100 cagttggccg ctgctgtcct tgcacaagta agtggatttg ataagcacca cttcatcaaa 11160 aaagtagatt tgataagcac ctcagttagg aaaaagaaaa gaaaagaaaa gaaaattgat 11220 ggcccttgtt tgtctcattt tgactgattt agtttttaag ctggtaagta attgatcagt 11280 ataaccaaat tctaatttga gaagtttcgt cccaatactg tagagtgata tggatgatga 11340 ttcaatagct tatcatcatg tatcattcta cactagtcct tcagaatggt atagcatatg 11400 gctttctcaa ggtatagcat atggctttca gaatggtata ctttaacatt cttgacggaa 11460 aggaccaatt gttggatctt ctgatgcaat aatcttgctg cgcactgcat tttgcgtctc 11520 gacctccttg tagtctactt ttggcaatct ataaccatca tgaagcaaat aaaattctaa 11580 gaatatattg tgtcttctag gctaagctgc caatgtcaga gatagcggca acaatcaacg 11640 agtttaggtc ccgccacctc tctgagctta cagaggtaaa ttatacatgc actacttgtc 11700 ttagcttttg gaacgttgta cgaggtttca tagttcagat tttgtcagat attttatgct 11760 gcccacggga ttttgttttg cagctatgtg aaactagtgg aagttctcta ggctatggat 11820 tttctcgtgt ggtgaataaa ggcaaagttc agcctccaga ttcttcggat gagaaccaag 11880 tcagtgaagg aacactagca atatgattac cattagaaga aacagggatt tgcgttgatt 11940 ggacccaaaa aagaagaaga aggaattgag aagggaagat actcctgata agtgtatagt 12000 gttttactta acccccctgt tcttgaaaat tgtacagaag aaatatagta cgtagcaagc 12060 aacaagctat gcaggagagc aaatctattg gcataaccca agggcagctc aaggggaggc 12120 tggttaagcc tttgctttag gctcccaaaa ttttggggcc cagaaaactt ttaagggcaa 12180 aagcgttttt gatccctgaa ttattatttt attctgattt tagtcctcaa tttaaatgtg 12240 tgatattgct cctttaactt tgacatatgt taataattaa ctttagtact gttagttgaa 12300 gaagtaaaag ggggagaaag gatactagat ccattgcttc aacctgatca tcaccattac 12360 tgatttaaga tttactttta aatataccat ctaataaggg agaatgcgca tcctag 12416 <210> 39 <211> 329 <212> PRT <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0001200g0070.2 protein sequence <400> 39 Met Ala Thr Lys Phe Gly Phe Thr Ile Thr Ser Pro Arg Leu Phe His 1 5 10 15 Gly Pro Phe Arg Lys Lys Pro Ile Phe Ser Ser Ser Ser Ala Ser Leu 20 25 30 Glu Asp Val Ser Phe Cys Ser Ser Asn Leu Lys Leu Ile Asn Phe Ala 35 40 45 Gly Arg Lys Leu Ala Ile Lys His Arg Val Leu Val Leu Ser Pro Lys 50 55 60 Ala Thr Thr Asp Gln Pro Gly Gln Leu Asn Glu Asp Glu Val Glu Asp 65 70 75 80 Ser Lys Ile Met Gln Tyr Cys Ser Ile Asp Gly Lys Gly Lys Lys Ser 85 90 95 Leu Gly Glu Met Glu Gln Glu Phe Leu Gln Ala Leu Gln Ser Phe Tyr 100 105 110 Tyr Glu Gly Lys Ala Thr Met Ser Asn Glu Glu Phe Asp Asn Leu Lys 115 120 125 Glu Glu Leu Met Trp Glu Gly Ser Ser Val Val Met Leu Ser Thr Asp 130 135 140 Glu Gln Lys Phe Leu Glu Ala Ser Met Ala Tyr Val Ser Gly Asn Pro 145 150 155 160 Ile Met Thr Asp Lys Glu Tyr Asp Lys Leu Lys Met Lys Leu Lys Arg 165 170 175 Asp Gly Ser Asp Ile Val Val Glu Gly Pro Arg Cys Ser Leu Arg Ser 180 185 190 Arg Lys Val Tyr Ser Asp Leu Ser Val Asp Tyr Leu Lys Met Phe Leu 195 200 205 Leu Asn Val Pro Ala Ala Val Val Ala Leu Gly Leu Phe Phe Phe Leu 210 215 220 Asp Asp Leu Thr Gly Phe Glu Ile Thr Tyr Leu Leu Glu Leu Pro Glu 225 230 235 240 Pro Phe Ser Phe Ile Phe Thr Trp Phe Ala Ala Leu Pro Leu Ile Leu 245 250 255 Tyr Leu Ser Phe Thr Ile Thr Asn Val Val Val Lys Asp Phe Leu Ile 260 265 270 Leu Lys Gly Pro Cys Pro Asn Cys Gly Ala Glu Asn Thr Ser Phe Phe 275 280 285 Gly Thr Ile Leu Ser Val Ser Ser Gly Gly Ser Thr Asn Lys Ile Lys 290 295 300 Cys Ser Gly Cys Gly Thr Asp Leu Val Tyr Asp Ser Asp Thr Arg Leu 305 310 315 320 Ile Thr Leu Pro Glu Gly Ile Ser Gly 325 <210> 40 <211> 990 <212> DNA <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0001200g0070.2 coding sequence <400> 40 atggccacta aatttggatt tactataact agccctcgcc tttttcatgg ccctttcagg 60 aaaaaaccaa tattttcttc atcttcagct tctttagaag atgtttcatt ctgttcttca 120 aatctcaaat taattaattt tgctggaaga aagttagcta taaaacatag ggtattggtt 180 ctctctccta aggccacaac tgaccagcca ggtcagctca atgaggatga ggttgaagac 240 agtaaaatca tgcaatattg tagcattgac gggaaaggaa agaaatcttt aggagaaatg 300 gagcaagagt ttcttcaagc actgcaatca ttctattatg aaggaaaggc gaccatgtca 360 aatgaagaat ttgataacct taaggaagaa ttaatgtggg aagggagcag cgtcgtcatg 420 ctaagcactg atgaacagaa gtttctggaa gcttctatgg cttatgtatc tgggaatcca 480 attatgactg ataaagagta tgacaagctg aagatgaaac ttaagaggga tggcagtgat 540 attgtggttg agggtcctcg gtgcagtctt cgaagtagaa aggtttatag cgatctttct 600 gttgattatc tgaagatgtt cttgttaaat gtccctgctg ctgttgttgc tcttggattg 660 ttctttttcc ttgacgattt aactggattt gagatcactt atcttttgga gcttccagag 720 cctttcagtt tcattttcac atggtttgct gctttgcctt tgatattgta tctatcgttt 780 acaatcacaa acgtcgttgt taaagatttt ctgatcttaa agggcccttg tccgaattgt 840 ggagcagaaa atacttcctt ctttggtacc atattatcag tatctagtgg tggttctacc 900 aacaaaataa aatgctcagg ttgtgggacg gatttggtct atgattcaga cacgcgtttg 960 atcacgttgc ctgaaggaat tagtggatga 990 <210> 41 <211> 5491 <212> DNA <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0001200g0070.2 genomic sequence <400> 41 tcaaaaaaca gttaaaaccg ggaaacgatt ttcttgaatt caaaaaaatc aagacaaaag 60 cttttcaaca ttcaacactc tccacacatt catacacata accttatctt catctcttat 120 caaaactcat caaattctcc atttttcagt tttttcacaa atgcaatatt cacttccact 180 tcactccctc caccaccacc actgctgccg ccgccgtcgc cgccgccgcc acaaatggcc 240 actaaatttg gatttactat aactagccct cgcctttttc atggcccttt caggaaaaaa 300 ccaatatttt cttcatcttc agcttcttta gaagatgttt cattctgttc ttcaaatctc 360 aaattaatta attttgctgg aagaaagtta gctataaaac atagggtatt ggttctctct 420 cctaaggcca caactgacca gccaggtaaa tcaatgagtt atcatctgca tgtccttctt 480 tatgaaatta cggattaatc ttatcgaaag attcacatgt aattttttat tagtgacatg 540 attgtgtaaa tatttttata ctagtccatg tatataactt aaactatttt tttttcttct 600 ttgatcaaag tttgattaaa ttataaaggg tttaagttgt gtaagctgac gatgtcaaga 660 atttgtactc tatcgttgga atttgactag ttatagtaga ttattactct atttttcatg 720 ttaccatatt aggtttgata tgtagagttg catattgtgg gtcaacgtaa tctgatagtg 780 taaatattct ttaaactgtt agtgcacaga acacaagctc tattttgaat atttttaaca 840 tgtagtcggc ctactataac acttctcctt taccggttaa cgtataggaa actccaatat 900 gtttaaaaga taaatcattt atcactatgg taattaaatg tgcttgaaaa aggtggaatg 960 gatatagaga attcatatag cagaacccaa ctagtttgaa cggaacgaac ctgaaatgaa 1020 gggaatggat acatagaatt catacagcgg actccaagta gattgagatt gaggaatagt 1080 tgttgattga catttgataa agtatattct tgctataggt aggcctgtta gttgctgctt 1140 ctttttctat aactcaaaga aagcaattat tatgtatcat tgatttattg caaggccaac 1200 ttgatgttgc tgcaaataat agtgattttc ttggcataac taactaaccg ccctaagctt 1260 gacaaagaag atgcaatcaa tctttccata atctgtctcg tgcttttgct atcgatcaat 1320 ttacaatgcc ttattcccaa acataggttc tttgtattct tgatgcttca atgaaataac 1380 aaacttcatt gaccctcaaa tgttggttct atacatgaca cagtcctaag ctcaatgagg 1440 aatcaacaaa tgaatagaga tagaaagaag taataaagtg agaccaatat agagacaatc 1500 aacaactgat gttttcatat gaactgaaaa acactcttat accttctctc tctctgtgta 1560 tgtttgctct atgtttgtat gttttttcct cttctccaat ttcttctttt tatggtggcg 1620 tataccacat catttgaaga ctcacttttg ctttcaggtc agctcaatga ggatgaggtt 1680 gaagacagta aaatcatgca atattgtagc attgacggga aaggaaagaa atctttagga 1740 gaaatggagc aagagtttct tcaagcactg caagtaatga agcagaatca gttactaatt 1800 cgtcgattgt tttcattctc attctactaa agttaactaa ctctttcttg gttctgtacc 1860 acagtcattc tattatgaag gaaaggcgac catgtcaaat gaagaatttg ataaccttaa 1920 ggaagaatta atgtgggaag ggagcagcgt cgtcatgcta agtaagtaag aatttctgtc 1980 tgtttatgtc tcattggcac ttaaaatagg tatagtaaga gcaaattcct aacaatgcag 2040 gcactgatga acagaagttt ctggaagctt ctatggctta tgtatctggg aatccaatta 2100 tgactgataa agagtatgac aagctgaaga tgaaacttaa ggtacttggt tattagcatt 2160 ataaagtcag acctctctat aacataatcg ctatataaca gtcattcact ataaaagtca 2220 agttttttta tggaatcaat ttttatatta tactataata tatgttctct ataacaccac 2280 ttcgttatat caaccaataa aattcggaac aaataaggct gttatagaga ggtttgactg 2340 tattatttat tgttcttgat aagataagag aagatccaat aaatgaaaaa gatttgttat 2400 tttgacagtt ttttcaaaaa aagcaactga ttttactgta taatactgaa tgtgttgtac 2460 tttcttttcc tatcaccatt taattggtag tttaagctta tcaatttatg aagtagttga 2520 actatgttag tcattgctat tcttcaactt attgccctta caaatatgaa caaatcaagt 2580 tagttgttac cgttctttct gttgctttct ttgtttctta taatatcgcg gacttatgta 2640 gtttttcctg tattgacatc tcttaatttt tcagagggat ggcagtgata ttgtggttga 2700 gggtcctcgg tgcagtcttc gaagtagaaa ggtttgtact acttttctgc tcaatgagac 2760 atttactagc tggttaatag gtactcatct tttatattgc atctgtgaaa atacttattt 2820 tgtgccatca tacattcgaa gaggatcctt ggagtctccg tgtgactata ggtcatgggt 2880 tcgagctgtg gaagcaacca ctaatgcttg tattagagta ggttgtctaa tacattagct 2940 tcagtctgcg gcagatctgc ggtctgcaga tcaattctgc aaccgcagaa acgccctgca 3000 cttccaaaat tatttttcaa ctccccaacg cactgttcaa cccaaaaagt cggaaccgat 3060 tatcaacgca taagtctacc tcggcatcat gaaaccccgg gttttaggtg aaatttttcg 3120 gggccttaca tcctccccgc ttaggatcat tcgtcctcga atgagggtca aaattcagta 3180 ttagcaccca atgtgactca gttgctatag ctcacaccgg cagttccaaa ttcgaagagg 3240 atgctttgtg cagcgggctg ccctttttag ccatcataca ttcgtgcaag atgtttatga 3300 ggttaagtgg ttaaatgaac tttacttgtt gcaggtttat agcgatcttt ctgttgatta 3360 tctgaagatg ttcttgttaa atgtccctgc tgctgttgtt gctcttggat tgtgagtact 3420 acttaaaact ctcagcatta taagttttca tttctttgta cattgtcatt agtttctcaa 3480 cccggttatg aagcaaccaa cattattatc ctctaataga tatgtttggc taatgtttgc 3540 taggttcttt ttccttgacg atttaactgg atttgagatc acttatcttt tggaggtaat 3600 catatcttgt tatctagcct ggttctttat tgtaatccct agattatcaa gtggttattt 3660 gcaaaagatc agagtattca ttaacctttg tcaaatgcta taattttgtc aattttgcag 3720 cttccagagc ctttcagttt cattttcaca tggtttgctg ctttgccttt gatattgtat 3780 ctatcgttta caatcacaaa cgtcgttgtt aaagattttc tgatcttaaa ggtaagattt 3840 cggaaacatt gtgcgcgtag tattatctta tatgctatgt gtttgatatt aacacacaat 3900 tttcagggcc cttgtccgaa ttgtggagca gaaaatactt ccttctttgg taccatatta 3960 tcagtatcta gtggtggttc taccaacaaa ataaaatgct cagggtaagt ccataagcct 4020 tagtttttag gtatttttca tctttctctg cttgatctgt tcatagtgta atcatcgcca 4080 tgatctttcg cagttgtggg acggatttgg tctatgattc agacacgcgt ttgatcacgt 4140 tgcctgaagg aattagtgga tgattcgagg tacctatgct ctttaaccta tttgtaacag 4200 ctcagctcac taatgatatt gtccgctttg gtcttaggct cgtactgctt taaacacgcg 4260 ttactaatgt cttaagcttg ctttcctacc agtatctttt ccgtgttttg cagatataga 4320 atttgcctag ggtgtaacac tattattgct gcttggaaaa ttataggcgt tttagttgtc 4380 attgctcact tatctttcaa ggcgactgct aatagaagca tacctatgtc taaccttgag 4440 gggtcacccg acctcgtaaa cttcggtaga aatcttatat tttacacctt gaaaatgatt 4500 taatttaaat cgcttggctc cctgaatact aaaaccttta gggggcacta gttgaacaga 4560 ataccggtgc tccccgtcgt gctaaagtcc tgggtccgcc tctaactgct aatgcttagt 4620 gtacaaaaat aggacttaaa cctaagaatg gtttcccttg atccttccca acaatttaga 4680 taaactaatc tatgatatta cctttctcat ttcacataag acttcttttc ggttcatatt 4740 tgaaaataga tccagcactt actttcaaaa agaaaaatat agatttccaa aatgcaaatt 4800 ttctagataa aattttaata ttcttaactc gttttatttt tcttgaaatg aattcaaata 4860 ctattgttct ccaacccaaa cgccacataa tagttcactt aagcaccatc ttttatgttc 4920 tcagacctca atttacacta tattacttaa atatgacctg ctctacatcc tcgtacctct 4980 gttgtccttg agttacagac tatgttgcgc gaactttaaa aaatgttgtt gcatccatgt 5040 cggaacctcc aaaaatacag tacttatgac ggatccaaca cacacttaga gacattttca 5100 gaaagtccga gcaacataga ttacatgtca ttttcgatct aggaaaaaag agcttttttc 5160 gcaagtttat ctgtatttta tcgcttgtat ggagaagtat aaccggtgag aactttcctc 5220 gtacaggaaa accattgcca tttactaata acttggagtt ggagttggag atctgcacaa 5280 tagattgcac tagaacaagt tgcctattgg aagagccaaa taacatacat gagtcaagtt 5340 tgtaaaaatg gaaagcactt tcagtgttga aattgtgaat gttttgctac ttgtattttg 5400 tccaatatat tatgtaatgt gtgagtataa gtatatcaat acaaaaaatt aacaaccttt 5460 aatcacaggt gatgaaagaa tatcaaggtt c 5491 <210> 42 <211> 989 <212> PRT <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0005803g0040.2 protein sequence <400> 42 Met Ile Val Arg Val Gly Leu Val Val Ala Ala Ser Ile Ala Ala Tyr 1 5 10 15 Ala Val Lys Gln Ile Asn Val Lys Pro Ser Lys Pro Ser Glu Asn Gly 20 25 30 Asp Ser Leu Pro Glu Lys Arg Ser Asp Glu Gly Asp Glu Lys Glu Glu 35 40 45 Gln Leu Leu Tyr Ser Thr Asp Gly Pro Lys Glu Val Val Asp Glu Glu 50 55 60 Glu Glu Lys Glu Glu Val Lys Leu Met Asn Gly Ile Ile Asn Pro Ala 65 70 75 80 Gln Gly Asn Gln Leu Asp Leu Asp Asp Asp Leu Phe Pro Glu Phe Glu 85 90 95 Asp Leu Leu Ser Gly Glu Ile Glu Phe Pro Leu Pro Ser Asp Lys Tyr 100 105 110 Asp Thr Glu Arg Glu Glu Arg Glu Lys Val Tyr Gln Asn Glu Met Ala 115 120 125 Asn Asn Glu Lys Glu Leu Glu Arg Leu Arg Asn Leu Val Lys Glu Leu 130 135 140 Glu Glu Arg Glu Val Lys Leu Glu Gly Glu Leu Leu Glu Tyr Tyr Gly 145 150 155 160 Leu Lys Glu Gln Glu Ser Asp Ile Ile Glu Leu Gln Lys Gln Leu Arg 165 170 175 Ile Lys Ser Val Glu Ile Asp Met Leu Asn Ile Thr Ile Asn Thr Leu 180 185 190 Gln Ala Glu Lys Gln Lys Leu Gln Glu Glu Val Phe Asn Gly Thr Thr 195 200 205 Ala Arg Lys Glu Leu Glu Ala Ala Arg Ser Lys Ile Lys Glu Leu Gln 210 215 220 Arg Gln Met Gln Leu Glu Ala Asn Gln Thr Lys Ala Gln Leu Leu Leu 225 230 235 240 Leu Lys Gln His Val Ser Gly Leu Gln Glu Lys Glu Glu Asp Ala Phe 245 250 255 Lys Arg Asp Val Glu Val Asp Lys Lys Leu Arg Leu Val Lys Glu Leu 260 265 270 Glu Val Glu Val Met Glu Leu Lys Arg Lys Asn Lys Glu Leu Gln His 275 280 285 Glu Lys Arg Glu Leu Val Ile Lys Leu Asp Ala Ala Glu Ser Lys Val 290 295 300 Ala Asn Leu Ser Asn Met Thr Glu Asn Glu Met Val Ala Gln Val Arg 305 310 315 320 Glu Glu Val Thr Asn Leu Lys His Thr Asn Glu Asp Leu Leu Lys Gln 325 330 335 Val Glu Gly Leu Gln Met Asn Arg Phe Ser Glu Val Glu Glu Leu Val 340 345 350 Tyr Leu Arg Trp Val Asn Ala Cys Leu Arg Phe Glu Leu Arg Asn Tyr 355 360 365 Gln Thr Pro Gln Gly Lys Val Ser Ala Arg Asp Leu Ser Lys Asn Leu 370 375 380 Ser Pro Arg Ser Gln Gln Lys Ala Lys Gln Leu Met Leu Glu Tyr Ala 385 390 395 400 Gly Ser Glu Arg Gly Gln Gly Asp Thr Asp Leu Glu Ser Asn Phe Ser 405 410 415 Gln Pro Ser Ser Pro Gly Ser Glu Asp Phe Asp Asn Ala Ser Ile Asp 420 425 430 Ser Ser Thr Ser Arg Phe Ser Ala Phe Ser Lys Lys Pro Gly Leu Ile 435 440 445 Gln Lys Leu Lys Arg Trp Gly Lys Ser Lys Asp Asp Ser Ser Val Met 450 455 460 Ser Ser Pro Ala Arg Ser Leu Gly Gly Ala Ser Pro Gly Arg Thr Ser 465 470 475 480 Val Ser Phe Arg Ser Arg Gly Pro Leu Glu Ser Leu Met Leu Arg Asn 485 490 495 Ala Gly Asp Gly Val Ala Ile Thr Ser Phe Gly Thr Ala Glu Gln Glu 500 505 510 Tyr Asp Ser Pro Glu Thr Pro Arg Leu Pro Pro Ile Arg Thr Gln Asp 515 520 525 Ser Ser Ala Glu Pro Leu Asn Ser Val Ala Ser Ser Phe Gln Leu Met 530 535 540 Ser Lys Ser Val Glu Gly Val Leu Asp Glu Lys Tyr Pro Ala Phe Lys 545 550 555 560 Asp Arg His Lys Leu Ala Val Glu Arg Glu Lys Gln Ile Lys Val Lys 565 570 575 Ala Glu Gln Ala Arg Ala Ala Arg Phe Glu Lys Ser Leu Pro Pro Lys 580 585 590 Leu Ser Gln Leu Lys Glu Lys Arg Val Ser Val Ser Ala Ser Ala Ser 595 600 605 Ala Pro Val Val Ser Ala Ser Gly Asp Ser Val Glu Gln Ser Gly Asp 610 615 620 Ser Lys Thr Asp Ser Gln Ala Val Ser Lys Met Lys Pro Ile Asn Ile 625 630 635 640 Glu Lys Arg Pro Pro Arg Thr Pro Arg Pro Pro Pro Thr Arg Ser Ala 645 650 655 Gly Gly Pro Ala Pro Ala Gly Asn Asn Val Thr Gly Gly Ala Pro Gly 660 665 670 Gly Pro Pro Pro Pro Pro Pro Pro Pro Gly Ala Pro Pro Pro Pro Pro 675 680 685 Pro Pro Gly Gly Gly Ala Pro Arg Pro Pro Pro Pro Pro Gly Ser Leu 690 695 700 Met Lys Gly Gly Ala Gly Gly Asp Lys Val His Arg Ala Pro Glu Leu 705 710 715 720 Val Glu Phe Tyr Gln Ser Leu Met Lys Arg Glu Ala Lys Lys Asp Thr 725 730 735 Ser Ser Pro Leu Ile Ser Ser Thr Ser Asn Thr Ser Asp Ala Arg Ser 740 745 750 Asn Met Ile Gly Glu Ile Glu Asn Arg Ser Thr Phe Leu Leu Ala Val 755 760 765 Lys Ala Asp Val Glu Ser Gln Gly Glu Phe Val Glu Ser Leu Ala Thr 770 775 780 Glu Val Arg Ala Ala Ser Phe Thr Asn Ile Glu Asp Leu Val Ser Phe 785 790 795 800 Val Asn Trp Leu Asp Glu Glu Leu Ser Phe Leu Val Asp Glu Arg Ala 805 810 815 Val Leu Lys His Phe Asp Trp Pro Glu Gly Lys Ala Asp Ala Leu Arg 820 825 830 Glu Ala Ala Phe Glu Tyr Gln Asp Leu Met Lys Leu Glu Lys His Val 835 840 845 Thr Ser Phe Val Asp Asp Pro Asn Leu Pro Cys Asp Ala Ala Leu Lys 850 855 860 Lys Met Tyr Lys Leu Leu Glu Lys Val Glu Gln Ser Val Tyr Ala Leu 865 870 875 880 Leu Arg Thr Arg Asp Met Ala Ala Ser Arg Tyr Arg Glu Phe Gly Ile 885 890 895 Pro Thr Asn Trp Leu Gln Asp Ser Gly Val Val Gly Lys Ile Lys Leu 900 905 910 Ser Ser Val Gln Leu Ala Arg Lys Tyr Met Lys Arg Val Ala Ser Glu 915 920 925 Leu Asp Ala Met Gly Gly Pro Glu Lys Glu Pro Asn Arg Glu Phe Leu 930 935 940 Ile Leu Gln Gly Val Arg Phe Ala Phe Arg Val His Gln Phe Ala Gly 945 950 955 960 Gly Phe Asp Ala Glu Ser Met Lys Ala Phe Glu Glu Leu Arg Ser Arg 965 970 975 Val Lys Ser Ser Gln Thr Glu Glu Thr Thr Gln Glu Gln 980 985 <210> 43 <211> 2970 <212> DNA <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0005803g0040.2 coding sequence <400> 43 atgatagtca gggtaggttt agtggttgct gcttctatag cagcctatgc agttaagcag 60 ataaatgtaa aaccctcaaa gccttcagaa aatggtgact cattgcctga aaaacgaagc 120 gatgaagggg atgaaaagga ggagcagctt ttgtattcta cagatggccc caaagaagtg 180 gttgatgagg aagaggagaa agaagaagtg aaattaatga atggaattat aaatccagca 240 cagggtaacc agcttgatct tgatgatgat cttttccctg aattcgaaga tcttttatct 300 ggggaaattg aatttccatt accaagtgac aagtatgata cagaaagaga agagagagag 360 aaggtgtacc aaaatgagat ggccaacaat gaaaaagaac ttgaaagatt gcgaaatctt 420 gttaaggagc tcgaggaaag ggaggtgaaa cttgaagggg agttgttgga atattatggt 480 ttgaaggaac aagaatcaga tatcatcgag ttacaaaagc agctcaggat taagtctgta 540 gagatcgaca tgctcaacat cactataaat actttacagg ccgagaaaca aaagcttcaa 600 gaggaggttt tcaatggaac tactgctcgg aaagagctag aagcagcaag gagcaagatc 660 aaggagttgc agaggcagat gcagcttgaa gctaaccaaa cgaaagctca gttgttgttg 720 ctgaagcaac atgttagtgg acttcaagaa aaggaagagg atgctttcaa gagagatgtc 780 gaggttgaca agaagcttag acttgtgaag gaattagaag tggaggttat ggagcttaag 840 aggaagaaca aagaacttca gcatgaaaag agagagttgg ttataaaatt ggatgccgct 900 gaatctaaag tagcaaactt atccaatatg acagagaatg aaatggttgc ccaggtcagg 960 gaagaggtaa ctaatttgaa gcatacaaat gaggatcttc taaaacaagt agaaggactt 1020 caaatgaaca gattcagtga agttgaagag ctagtgtatc ttcgttgggt caatgcatgc 1080 ttaagatttg aacttcggaa ctaccaaaca cctcaaggaa aggtatcagc tcgtgatctc 1140 agtaaaaacc tgagcccaag atctcaacag aaggccaaac agttgatgtt agaatacgca 1200 ggatcagaac gtggccaagg agatacagat cttgaaagca atttttcgca gccatcttct 1260 cccggtagtg aagactttga taatgcttct attgacagtt ccacaagcag atttagtgct 1320 ttcagtaaaa agcctggcct aatccagaag ttgaagagat ggggcaaaag taaagacgat 1380 tccagtgtta tgtcttcacc agcaagatct cttgggggag catctccggg ccggacaagt 1440 gtaagtttta gatcaagggg tcctctggaa tcactaatgc tcagaaatgc aggtgatggt 1500 gtagccatca ctagttttgg aacagctgag caggaatatg attcccctga aacaccgcgg 1560 cttccaccga ttaggacaca agattcttct gctgagccac tgaactcagt tgcatcatcc 1620 ttccagctaa tgtctaaatc agttgaagga gttctagatg agaagtatcc tgcattcaaa 1680 gataggcata agctggcagt agagcgagag aagcaaatta aggtaaaggc cgagcaagca 1740 agagcagcaa ggtttgagaa gtccttgccc ccgaaacttt ctcaattgaa agagaagcga 1800 gtatcagtat cagcatcagc atcagcgcca gtggtctctg cctctggtga ctcagttgag 1860 cagtccggtg atagcaaaac tgactctcaa gcagttagca aaatgaaacc aattaatatt 1920 gagaaaagac ctcctaggac tcctcgtcca cctcctacac gatcagcagg tggtcccgct 1980 ccagctggta ataatgttac aggtggggca cctggtggtc cacccccacc acctcctccg 2040 cctggtgctc caccaccgcc gccgccacct ggtggaggag ctcctagacc acctcctcct 2100 cctggatctc taatgaaagg aggagctgga ggtgataagg tccatcgcgc tcctgaatta 2160 gttgaattct accaatcatt gatgaaacgc gaggcgaaga aggatacatc atcacctttg 2220 atatcctcta cttcaaacac atcagatgca agaagcaaca tgatcggaga gatagagaac 2280 agatccacat tcctgttagc tgtgaaagct gatgtggaaa gtcaaggtga atttgtcgag 2340 tcattggcaa ctgaagttcg tgctgcttca tttaccaata tcgaggatct agtgtcattt 2400 gtgaactggc tagatgaaga actctccttc ttggttgatg aacgagctgt cctcaagcac 2460 tttgactggc cagagggaaa agcagatgca ctgagagagg ctgccttcga ataccaagat 2520 ctaatgaaac tagaaaagca tgtaacctcc tttgttgatg acccaaatct tccatgtgat 2580 gctgctttga aaaagatgta caagttgctt gagaaggtgg aacaaagtgt ttatgcacta 2640 ttgcgtactc gcgacatggc tgcatcaaga tacagagaat ttggcattcc tactaattgg 2700 ttgcaagatt caggtgttgt tggcaagatc aagctttcgt cggtacaatt ggcgaggaag 2760 tacatgaaac gtgtagcatc agagcttgat gccatgggtg gacctgagaa ggaaccaaac 2820 agagaattct tgattctaca aggggttcgt tttgctttta gagttcatca gtttgctgga 2880 ggatttgatg ctgaaagcat gaaggctttt gaagaattaa ggagtcgtgt caaaagttca 2940 caaacagaag agactacaca agaacaatga 2970 <210> 44 <211> 5952 <212> DNA <213> Artificial Sequence <220> <223> interactor, Nitab4.5_0005803g0040.2 genomic sequence <400> 44 agaatttcaa tcttgtttgg acaaagactg accactcaag aaattggtgg ttcttgtgcc 60 ctctatgtgt tcgacaattt gtctattaga ctttctagtt atcaacaaca ctttgcacat 120 aaccaaactt tttttttctt gataagatga tatagccatt aagttattca tagtgtccac 180 tttttaaaga attgtctaaa actgataatt ctctttcaag aattgcacct tttttgccat 240 ttttgatgag gccatgattt gagttttgag ctatggggtt tgagaaaaaa tgggtgggga 300 ttattttatg ttagtaaatg atttgaagct tcaatatttt ccattgaaaa tacctacatg 360 atagtcaggg taggtttagt ggttgctgct tctatagcag cctatgcagt taagcagata 420 aatgtaaaac cctcaaagcc ttcaggtaat tttctgtagt cagttgtatt tggactgttt 480 tattaaagtt gcaaataagt aaagaggctg ctaaattagt ataattggtt ttagacatat 540 tgataaaaca gtgtctataa agtttcaatt tttaatggag aaaatcatcc aagtgagtga 600 ctagagtgtt tttttgtggc taaattgtgt ttatcttatt gttttatgaa cgttggtgaa 660 cagaaaatgg tgactcattg cctgaaaaac gaagcgatga aggggatgaa aaggaggagc 720 agcttttgta ttctacagat ggccccaaag aagtggttgt aagtatttgt gtatagagaa 780 atttgtgtgc tttagaaaca aaaatttgtt agtcatttgg aaatttgttt aatatatgac 840 aacttgtagg atgaggaaga ggagaaagaa gaagtgaaat taatgaatgg aattataaat 900 ccagcacagg gtaaccagct tgatcttgat gatgatcttt tccctgaatt cgaagatctt 960 ttatctgggg aaattgaatt tccattacca agtgacaagt atgatacaga aagagaagag 1020 agagagaagg tgtaccaaaa tgagatggcc aacaatgaaa aagaacttga aagattgcga 1080 aatcttgtta aggagctcga ggaaagggag gtgaaacttg aaggggagtt gttggaatat 1140 tatggtttga aggaacaaga atcagatatc atcgagttac aaaagcagct caggattaag 1200 tctgtagaga tcgacatgct caacatcact ataaatactt tacaggccga gaaacaaaag 1260 cttcaagagg aggttttcaa tggaactact gctcggaaag agctagaagc agcaaggagc 1320 aagatcaagg agttgcagag gcagatgcag cttgaagcta accaaacgaa agctcagttg 1380 ttgttgctga agcaacatgt tagtggactt caagaaaagg aagaggatgc tttcaagaga 1440 gatgtcgagg ttgacaagaa gcttagactt gtgaaggaat tagaagtgga ggttatggag 1500 cttaagagga agaacaaaga acttcagcat gaaaagagag agttggttat aaaattggat 1560 gccgctgaat ctaaagtagc aaacttatcc aatatgacag aggtaaattt aactcctgat 1620 accagtattt ttcatgtaat tgatctttag gacaatcttt gtgtgtttcc tgcgtatagc 1680 ttttctttct ttaagcatct tctttctact tttcaagtct gcaaaaatgt tttggaaatg 1740 tagagccgac tctgagcacc ttattgaccc cctttttctg attacttccc tttttacgcc 1800 acgctcataa ggtagttgag tccgttgaat actccagtga aacatgccca cattatggtt 1860 tcttgtaatt atcgtaattg tcattgctat gttttgctgt ttattatgct cattaatttc 1920 ttctatgtta attatcgtgt tgagctccca ccacttaacc attggagatt cttagcttct 1980 gaagagcttc atttggtgat gcgtttggtt ggtgtgtgaa ctgatgctat ttaattactg 2040 acttgtcttt ggcatgctgc ttcagaatga aatggttgcc caggtcaggg aagaggtaac 2100 taatttgaag catacaaatg aggatcttct aaaacaagta gaaggacttc aaatgaacag 2160 attcagtgaa gttgaagagc tagtgtatct tcgttgggtc aatgcatgct taagatttga 2220 acttcggaac taccaaacac ctcaaggaaa ggtatcagct cgtgatctca gtaaaaacct 2280 gagcccaaga tctcaacaga aggccaaaca gttgatgtta gaatacgcag gatcagaacg 2340 tggccaagga gatacagatc ttgaaagcaa tttttcgcag ccatcttctc ccggtagtga 2400 agactttgat aatgcttcta ttgacagttc cacaagcaga tttagtgctt tcagtaaaaa 2460 gcctggccta atccagaagt tgaagagatg gggcaaaagt aaagacgatt ccagtgttat 2520 gtcttcacca gcaagatctc ttgggggagc atctccgggc cggacaagtg taagttttag 2580 atcaaggggt cctctggaat cactaatgct cagaaatgca ggtgatggtg tagccatcac 2640 tagttttgga acagctgagc aggaatatga ttcccctgaa acaccgcggc ttccaccgat 2700 taggacacaa gattcttctg ctgagccact gaactcagtt gcatcatcct tccagctaat 2760 gtctaaatca gttgaaggag ttctagatga gaagtatcct gcattcaaag ataggcataa 2820 gctggcagta gagcgagaga agcaaattaa ggtaaaggcc gagcaagcaa gagcagcaag 2880 gtttgagaag tccttgcccc cgaaactttc tcaattgaaa gagaagcgag tatcagtatc 2940 agcatcagca tcagcgccag tggtctctgc ctctggtgac tcagttgagc agtccggtga 3000 tagcaaaact gactctcaag cagttagcaa aatgaaacca attaatattg agaaaagacc 3060 tcctaggact cctcgtccac ctcctacacg atcagcaggt ggtcccgctc cagctggtaa 3120 taatgttaca ggtggggcac ctggtggtcc acccccacca cctcctccgc ctggtgctcc 3180 accaccgccg ccgccacctg gtggaggagc tcctagacca cctcctcctc ctggatctct 3240 aatgaaagga ggagctggag gtgataaggt ccatcgcgct cctgaattag ttgaattcta 3300 ccaatcattg atgaaacgcg aggcgaagaa ggatacatca tcacctttga tatcctctac 3360 ttcaaacaca tcagatgcaa gaagcaacat gatcggagag atagagaaca gatccacatt 3420 cctgttagct gtatgtacaa cttctctttt actcctttga ataatgcatg tgcttattaa 3480 cctattctga ctcaatggag acttgtgcaa aaccaggtga aagctgatgt ggaaagtcaa 3540 ggtgaatttg tcgagtcatt ggcaactgaa gttcgtgctg cttcatttac caatatcgag 3600 gatctagtgt catttgtgaa ctggctagat gaagaactct ccttcttggt atttcctctt 3660 accattatac cttcaagttc ctcttcctta aataggacat gaatatacct atattcttaa 3720 tcatactttt atatgaaaat tgttgcttac attaatcttg ctcgagcgac aaggaccatg 3780 cagtttctgc attaaatacc tggagcattc attaacattg tatcccgttg attcttttca 3840 aggttgatga acgagctgtc ctcaagcact ttgactggcc agagggaaaa gcagatgcac 3900 tgagagaggc tgccttcgaa taccaagatc taatgaaact agaaaagcat gtaacctcct 3960 ttgttgatga cccaaatctt ccatgtgatg ctgctttgaa aaagatgtac aagttgcttg 4020 agaagtaagt ctctactgat atctttatct cttgtcttta aactagagaa tttcagtcag 4080 gtaggatgtg aaaatggttg aatcttaaat caaactattt tcagaccata tttaaacttc 4140 cacttatttg gaattggtac cctttcattt catgtgtagt tgttccttct tatcatttct 4200 gtcttgtcta tcgctagctc attttttgtt actcctaagt cttaaaccct ttaatcttcg 4260 ggatgccagg gtggaacaaa gtgtttatgc actattgcgt actcgcgaca tggctgcatc 4320 aagatacaga gaatttggca ttcctactaa ttggttgcaa gattcaggtg ttgttggcaa 4380 ggtatgttct catatagaaa ctttgctatg ttgttctttg tgaaattgct tgaaccacaa 4440 taataaaaga aaaagaaaca aaataatcac actgcaagaa aaccttagaa tgtgatgttt 4500 tacttcatat tacttagaaa ttaggaaaac ttaccaacct ctttaactaa catgtactcc 4560 ctctatttca aaaagaacga acctatttga ttaggcaccg agtttaaaaa gaatgaaaga 4620 cttagatatt tgtgcggcat aaatcatctt attaggggta aaatgaaaag tttaaagtta 4680 cattatttcc aaatttagaa aggagtcaat ctatttgaat cgagttaaaa aggaaatagg 4740 ttcattcttt ttgaaacaga gggagtaaat ataatttctc ttcatcgtac ggacaataga 4800 aggaaaaaaa aaaggaagtg tgcagagaga tgatctatct atggcgtata agtatcgctg 4860 ttttcttctg cagatcaagc tttcgtcggt acaattggcg aggaagtaca tgaaacgtgt 4920 agcatcagag cttgatgcca tgggtggacc tgagaaggaa ccaaacagag aattcttgat 4980 tctacaaggg gttcgttttg cttttagagt tcatcaggta tacacacagc acctgcattt 5040 tgttcactta ccaaatctaa aaacaatacc aatctattta acaaattaaa catgttttag 5100 tagagttaca gattaatgaa tttacaactt tttctttttc ttttcagttt gctggaggat 5160 ttgatgctga aagcatgaag gcttttgaag aattaaggag tcgtgtcaaa agttcacaaa 5220 cagaagagac tacacaagaa caatgagaat atctgtattt tggttttggt cattgtaaat 5280 ttcatcattt tcttttctcc aagtatagca aacttactct atcttggact tctgtacaat 5340 tcaaaaggtg aataactcga ggagaatatc agatagcaca gattagttaa aagaaagttt 5400 aaaggataaa cattgtattg gaaaacacag agaaaactac attaaacaat gagtgaaatt 5460 tggaactgca taatcatgaa ttcacgagaa ggaaaaaatg cagcaagttg tcaaggtgtt 5520 ggatcatttg ttctgctttt ggggcaaaag tgaaaacctg tccctcttct ggggcctagt 5580 tgtactaggc aaaaaatcct catttctgtg aaatttaagt atattcatcc tagtacattt 5640 cagggtacaa gcattgtgca atagcaaaaa gaaaagaaga gaaactcata aaactgagtg 5700 ttcagcagct gctgtgaagt gactctctgt atgctcgtcg atgaacatgc aggtgaaggt 5760 tcttgatttc atctgttatc gcattgtaat aatgagattt ctgtctgcaa atttggcacc 5820 tccaaccttc ccttgaagtt gagatggtag acgaatgaca cgtctctgat caccagcctc 5880 taccaacaac tcagaccctc ctctaaactg caataaccag aattctgatt aatttcacct 5940 tttaatttga tt 5952

Claims (36)

  1. 식물 또는 이의 일부, 또는 세포의 알칼로이드 함량을 조절하는(예를 들어, 감소시키는) 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 상기 식물을 변형시키는 것을 포함하는, 방법.
  2. 타바코 식물 또는 이의 식물 일부, 또는 세포의 타바코-특이적 니트로사민(TSNA) 전구체의 함량을 조절하는(예를 들어, 감소시키는) 방법으로서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절함으로써 상기 식물 또는 세포를 변형시키는 것을 포함하는, 방법.
  3. 세포 또는 식물 또는 이의 일부의 알칼로이드 함량을 조절하기(예를 들어, 감소시키기) 위한 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 용도.
  4. 조절된(예를 들어, 감소된) 알칼로이드 함량을 갖는 식물 또는 이의 일부, 세포, 식물 번식 물질(plant propagation material), 잎, 절단된 수확 잎, 가공된 잎 또는 절단되고 가공된 잎을 생성하기 위한 방법으로서, 상기 식물 또는 세포를 변형시켜 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하는 것을 포함하는, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 알칼로이드 함량이 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하도록 변형되지 않은 식물 또는 세포와 비교하여 조절되는(예를 들어, 감소되는), 방법 또는 용도.
  6. 비변형된 식물과 비교하여 알칼로이드 함량의 조절(예를 들어, 감소)을 달성하기 위해 변형된 식물 또는 이의 일부 또는 세포로서, 변형은 타바코로부터의 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현의 조절인, 식물 또는 이의 일부 또는 세포.
  7. 제6항에 따른 식물 또는 세포 또는 제4항 또는 제5항의 방법에 의해 생성된 식물 또는 세포로부터 수득가능한 식물 번식 물질.
  8. 제1항 내지 제4항, 제6항 또는 제7항 중 어느 한 항에 있어서, 식물의 알칼로이드 함량이 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하도록 변형되지 않은 식물과 비교하여 감소되는, 방법 또는 용도, 식물 또는 이의 일부 또는 세포, 또는 식물 번식 물질.
  9. 제8항에 있어서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현이 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하도록 변형되지 않은 식물 또는 세포와 비교하여 감소되는, 방법 또는 용도, 식물 또는 이의 일부, 또는 식물 번식 물질.
  10. 제1항 내지 제7항 중 어느 한 항에 있어서, 식물의 알칼로이드 함량이 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하도록 변형되지 않은 식물 또는 세포와 비교하여 증가되는, 방법 또는 용도, 또는 식물 또는 이의 일부 또는 세포, 또는 식물 번식 물질.
  11. 제10항에 있어서, 식물이 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 증가시키도록 변형되며, 식물 또는 세포는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하도록 변형되지 않은 식물과 비교하여 증가된 알칼로이드 함량을 나타내는, 방법 또는 용도, 식물 또는 이의 일부 또는 세포, 또는 식물 번식 물질.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 식물의 총 알칼로이드 함량이 조절되는(예를 들어, 감소되는), 방법 또는 용도, 식물 또는 이의 일부 또는 세포, 또는 식물 번식 물질.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 노르니코틴, PON, 아나바신 및 아나타빈으로부터 선택되는 하나 이상의 알칼로이드의 함량이 조절되며(예를 들어, 감소되며), 바람직하게는 노르니코틴 및/또는 PON 및/또는 아나바신의 함량이 조절되는(예를 들어, 감소되는), 방법 또는 용도, 식물 또는 이의 일부, 또는 식물 번식 물질.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질이 SEQ ID NO. 1, SEQ ID NO. 4, SEQ ID NO. 7, SEQ ID NO. 10, SEQ ID NO. 13, SEQ ID NO. 16, SEQ ID NO. 19, SEQ ID NO. 22, SEQ ID NO. 25, SEQ ID NO. 28로 제시된 아미노산 서열 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열을 포함하거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30으로 제시된 뉴클레오티드 서열 또는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그, 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열을 포함하는, 방법 또는 용도, 식물 또는 이의 일부 또는 세포, 또는 식물 번식 물질.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 추가적인 유전자가 변형되는데, 여기서 추가적인 유전자는 SEQ ID NO. 1, SEQ ID NO. 4, SEQ ID NO. 7, SEQ ID NO. 10, SEQ ID NO. 13, SEQ ID NO. 16, SEQ ID NO. 19, SEQ ID NO. 22, SEQ ID NO. 25, SEQ ID NO. 28 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열로부터 선택되는 적어도 하나이거나; BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30에 제시된 바와 같은 뉴클레오티드 서열 또는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열을 포함하는, 방법 또는 용도, 식물 또는 이의 일부, 또는 식물 번식 물질.
  16. 식물을 육종하기 위한 제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물 또는 이의 일부, 또는 제4항, 제5항 또는 제8항 내지 제19항 중 어느 한 항의 방법에 의해 생성된 식물의 용도.
  17. 제품을 생성하기 위한 제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물 또는 이의 일부, 또는 제4항, 제5항 또는 제8항 내지 제19항 중 어느 한 항의 방법에 의해 생성된 식물의 용도.
  18. 작물을 성장시키기 위한 제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물 또는 이의 일부, 또는 제4항, 제5항 또는 제8항 내지 제19항 중 어느 한 항의 방법에 의해 생성된 식물의 용도.
  19. 잎을 생성하기 위한 제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물 또는 이의 일부, 또는 제4항, 제5항 또는 제8항 내지 제19항 중 어느 한 항의 방법에 의해 생성된 식물의 용도.
  20. 제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물의 수확된 잎, 또는 제6항 내지 제15항 중 어느 한 항에 따른 번식 물질로부터 번식된 식물로부터 수득가능하거나, 제2항 또는 제16항 내지 제19항 중 어느 한 항에 따른 용도에 의해 수득된 식물로부터 수득가능하거나, 제1항, 제2항, 제4항, 제5항, 또는 제8항 내지 제15항 중 어느 한 항의 방법에 의해 생성된 식물로부터 수득가능한 수확된 잎.
  21. 제20항에 있어서, 식물의 수확된 잎이 절단된 수확된 잎인, 식물의 수확된 잎.
  22. 제2항 또는 제16항 내지 제19항 중 어느 한 항에 따른 용도로부터 수득가능한(예를 들어, 수득된) 식물로부터 수득가능하거나(예를 들어, 수득되거나);
    제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물을 가공함으로써 수득가능하거나(예를 들어, 수득되거나);
    제7항 내지 제15항 중 어느 한 항에 따른 식물 번식 물질로부터 번식된 식물로부터 수득가능하거나;
    제20항 또는 제21항에 따른 식물의 수확된 잎을 가공함으로써 수득가능하거나(예를 들어, 수득되거나);
    제1항, 제2항, 제4항, 제5항 또는 제8항 내지 제15항 중 어느 한 항의 방법에 의해 생성된 식물로부터 수득가능한(예를 들어, 수득된)
    가공된 잎, 바람직하게는 가공된 타바코 잎, 바람직하게는 생육불가능한 가공된 타바코 잎.
  23. 제22항에 있어서, 잎이 경화, 발효, 저온살균 또는 이들의 조합에 의해 가공되며, 바람직하게는, 4-(메틸니트로사미노)-1-(3-피리딜)-1-부타논(NNK), N'-니트로소노르니코틴(NNN), N'-니트로소아나타빈(NAT) 및 N-니트로소아나바신(NAB)으로부터 선택되는 하나 이상의 TSNA의 함량이 감소되고, 바람직하게는 NNK 및/또는 NNN의 함량이 조절되고(예를 들어, 감소되고), 더욱 바람직하게는 NNK의 함량이 감소되는, 가공된 잎.
  24. 제22항 또는 제23항에 있어서, 가공된 잎이 절단된 가공된 잎인, 가공된 잎.
  25. 제2항 또는 제16항 내지 제19항 중 어느 한 항에 따른 용도로부터 수득가능한 식물로부터 수득가능하거나(예를 들어, 수득되거나);
    제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물을 가공함으로써 수득가능하거나(예를 들어, 수득되거나);
    제7항 내지 제15항 중 어느 한 항에 따른 식물 번식 물질로부터 번식된 식물로부터 수득가능하거나(예를 들어, 수득되거나);
    제20항 또는 제21항에 따른 식물의 수확된 잎을 가공함으로써 수득가능하거나(예를 들어, 수득되거나);
    제1항, 제2항, 제4항, 제5항 또는 제8항 내지 제15항 중 어느 한 항의 방법에 의해 생성된 식물로부터 수득가능한(예를 들어, 수득된)
    식물 또는 이의 일부로부터 제조된 경화된 타바코 물질.
  26. 제25항의 상기 경화된 타바코 물질을 포함하는 타바코 블렌드.
  27. 제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물 또는 제6항 또는 제8항 내지 제13항 중 어느 한 항에 따른 이의 일부로서, 상기 식물이 타바코 식물인, 식물 또는 이의 일부;
    제7항 내지 제15항 중 어느 한 항에 따른 타바코 식물 번식 물질로부터 번식된 타바코 식물 또는 이의 일부;
    제20항 또는 제21항에 따른 식물의 수확된 잎으로서, 상기 식물이 타바코 식물인, 수확된 잎;
    제26항 내지 제28항 중 어느 한 항에 따른 가공된 잎으로서, 상기 식물이 타바코 식물인, 가공된 잎; 또는
    제1항, 제2항, 제4항, 제5항 또는 제8항 내지 제15항 중 어느 한 항의 방법에 의해 생성된 식물로부터 제조된 전달 시스템.
  28. 제27항에 있어서, 시스템이 가연성 흡연 물품인, 전달 시스템.
  29. 제27항에 있어서, 시스템이 무연 타바코 산업 제품인, 전달 시스템.
  30. 제27항에 있어서, 시스템이 불연성 에어로졸 공급 시스템, 예컨대 타바코 가열 장치 또는 에어로졸 발생 장치인, 전달 시스템.
  31. 제6항 또는 제8항 내지 제15항 중 어느 한 항에 따른 식물 또는 이의 일부 또는 세포, 또는 이의 추출물(예를 들어, 타바코 추출물) 또는 제25항에 따른 경화된 타바코 물질, 또는 제26항에 따른 타바코 블렌드를 포함하는 가연성 흡연 물품, 불연성 에어로졸 공급 시스템, 무연 타바코 시스템 또는 타바코 가열 장치.
  32. 조절된(예를 들어, 감소된) 알칼로이드 함량 및/또는 조절된(예를 들어, 감소된) 함량의 타바코 특이적 니트로사민(TSNA) 또는 TSNA의 전구체를 갖는 식물을 선택하기 위한 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 뉴클레오티드 서열의 용도로서, 바람직하게는 적어도 하나의 BTB/POZ NPH3 도메인-함유 단백질의 서열은 SEQ ID NO. 1, SEQ ID NO. 4, SEQ ID NO. 7, SEQ ID NO. 10, SEQ ID NO. 13, SEQ ID NO. 16, SEQ ID NO. 19, SEQ ID NO. 22, SEQ ID NO. 25, SEQ ID NO. 28 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 1, 4, 7, 10, 13, 16, 19, 22, 25 또는 28에 대해 적어도 80% 동일성을 갖는 서열로부터 선택되거나, BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30에 제시된 바와 같은 뉴클레오티드 서열, 또는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열을 포함하는, 용도.
  33. BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 뉴클레오티드 서열에서 유전성 돌연변이를 수반하는 식물의 돌연변이체로서, 바람직하게는 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열로부터 선택되며, 상기 유전성 돌연변이는 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하며(예를 들어, 감소시키며), 돌연변이체 식물은 상기 유전성 돌연변이를 수반하지 않는 유사한 식물과 비교하여 조절된(예를 들어, 감소된) 알칼로이드 함량, 바람직하게는 니코틴 함량 및/또는 조절된 함량의 타바코 특이적 니트로사민(TSNA) 또는 TSNA의 전구체를 갖는, 식물의 돌연변이체.
  34. 제33항에 따른 유전성 돌연변이를 수반하는 돌연변이체 식물의 자손 또는 종자.
  35. BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 뉴클레오티드 서열에서 변형을 포함하는 식물로부터 생성된 수확된 잎, 가공된 잎 또는 경화된 타바코 물질로서, 적어도 하나의 유전자는 SEQ ID NO. 2, SEQ ID NO. 3, SEQ ID NO. 5, SEQ ID NO. 6, SEQ ID NO. 8, SEQ ID NO. 9, SEQ ID NO. 11, SEQ ID NO. 12, SEQ ID NO. 14, SEQ ID NO. 15, SEQ ID NO. 17, SEQ ID NO. 18, SEQ ID NO. 20, SEQ ID NO. 21, SEQ ID NO. 23, SEQ ID NO. 24, SEQ ID NO. 26, SEQ ID NO. 27, SEQ ID NO. 29, SEQ ID NO. 30 또는 이의 기능성 변이체 또는 기능성 단편 또는 오솔로그 또는 SEQ ID NO. 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29 또는 30에 대해 적어도 80% 동일성을 갖는 서열로부터 선택되며, 상기 변형은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자의 활성 또는 발현을 조절하며(예를 들어, 감소시키며), 상기 식물은 BTB/POZ NPH3 도메인-함유 단백질을 인코딩하는 적어도 하나의 유전자에서 상기 변형을 수반하지 않는 유사한 식물과 비교하여 조절된(예를 들어, 감소된) 알칼로이드 함량, 바람직하게는 니코틴 함량 및/또는 조절된 함량의 타바코 특이적 니트로사민(TSNA) 또는 TSNA의 전구체를 갖는, 수확된 잎, 가공된 잎 또는 경화된 타바코 물질.
  36. 설명 및 도면을 참조하여 본원에 기재된 바와 같은 방법, 잎, 식물, 식물 번식 물질, 수확된 잎, 가공된 타바코, 타바코 산업 제품, 용도 또는 이들의 조합.
KR1020217043134A 2019-07-03 2020-07-03 타바코 식물에서 알칼로이드 함량을 조정하는 방법 KR20220038606A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1909562.9 2019-07-03
GBGB1909562.9A GB201909562D0 (en) 2019-07-03 2019-07-03 Method
PCT/GB2020/051602 WO2021001658A1 (en) 2019-07-03 2020-07-03 Method for modulating the alkaloid content of a tobacco plant

Publications (1)

Publication Number Publication Date
KR20220038606A true KR20220038606A (ko) 2022-03-29

Family

ID=67539958

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217043134A KR20220038606A (ko) 2019-07-03 2020-07-03 타바코 식물에서 알칼로이드 함량을 조정하는 방법

Country Status (10)

Country Link
US (1) US20220340922A1 (ko)
EP (1) EP3993611A1 (ko)
JP (1) JP2022538482A (ko)
KR (1) KR20220038606A (ko)
CN (1) CN114341360A (ko)
BR (1) BR112021026333A2 (ko)
CA (1) CA3143411A1 (ko)
GB (1) GB201909562D0 (ko)
IL (1) IL288999A (ko)
WO (1) WO2021001658A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB202205149D0 (en) * 2022-04-07 2022-05-25 Nicoventures Trading Ltd Method
GB202205148D0 (en) * 2022-04-07 2022-05-25 Nicoventures Trading Ltd Method
GB202205561D0 (en) * 2022-04-14 2022-06-01 Nicoventures Trading Ltd Method
GB202206109D0 (en) * 2022-04-27 2022-06-08 Nicoventures Trading Ltd Method
GB202206107D0 (en) * 2022-04-27 2022-06-08 Nicoventures Trading Ltd Method

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2162738A (en) 1937-08-18 1939-06-20 Clarence E Mccoy Extracting nicotine from tobacco
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
KR100225087B1 (ko) 1990-03-23 1999-10-15 한스 발터라벤 피타아제의 식물내 발현
GB9524350D0 (en) 1995-11-29 1996-01-31 Lynxvale Ltd Enhancer-increased gene expression in plants
EP1781123A1 (en) * 2004-08-23 2007-05-09 U.S. Smokeless Tobacco Company Nicotiana compositions
EP2484758B1 (en) 2005-10-18 2013-10-02 Precision Biosciences Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity
US9102948B2 (en) 2006-11-17 2015-08-11 22Nd Century Limited, Llc Regulating alkaloids
CA2681661C (en) * 2007-03-23 2015-11-24 New York University Methods of increasing nitrogen-assimilation capacity in transgenic plants expressing cca1 and glk1
EP3098309B1 (en) 2007-10-31 2019-04-10 Precision Biosciences, Inc. Rationally-designed single-chain meganucleases with non-palindromic recognition sequences
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
WO2011027315A1 (en) 2009-09-04 2011-03-10 Moshe Danny S Grading of agricultural products via hyper spectral imaging and analysis
WO2011072246A2 (en) 2009-12-10 2011-06-16 Regents Of The University Of Minnesota Tal effector-mediated dna modification
EP2835427A3 (en) * 2010-08-24 2015-05-20 BASF Plant Science Company GmbH Plants having enhanced yield-related traits and a method for making the same
PL2753202T3 (pl) 2011-09-06 2016-11-30 Podgrzewanie materiału przeznaczonego do palenia
US20150291967A1 (en) 2012-10-31 2015-10-15 Luc Mathis Coupling herbicide resistance with targeted insertion of transgenes in plants
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
GB2515502A (en) 2013-06-25 2014-12-31 British American Tobacco Co Apparatus and method
WO2018067985A1 (en) * 2016-10-07 2018-04-12 Altria Client Services Llc Composition and methods for producing tobacco plants and products having reduced tobacco-specific nitrosamines (tsnas)
WO2018237107A1 (en) * 2017-06-23 2018-12-27 University Of Kentucky Research Foundation PROCESS
EP3675625A1 (en) * 2017-09-01 2020-07-08 Altria Client Services LLC Methods and compositions related to improved nitrogen utilization efficiency in tobacco

Also Published As

Publication number Publication date
WO2021001658A1 (en) 2021-01-07
CA3143411A1 (en) 2021-01-07
GB201909562D0 (en) 2019-08-14
BR112021026333A2 (pt) 2022-03-03
CN114341360A (zh) 2022-04-12
US20220340922A1 (en) 2022-10-27
IL288999A (en) 2022-02-01
EP3993611A1 (en) 2022-05-11
JP2022538482A (ja) 2022-09-02

Similar Documents

Publication Publication Date Title
KR20220038606A (ko) 타바코 식물에서 알칼로이드 함량을 조정하는 방법
RU2735254C2 (ru) Снижение табак-специфичных нитрозаминов в растениях
CN111793640A (zh) 烟草植物及使用此类植物的方法
US20220033837A1 (en) Methods and means for modifying the alkaloid content of plants
CN115485386A (zh) 低生物碱含量的烟草属植物体及其制备方法
US20220090112A1 (en) Method for decreasing the alkaloid content of a tobacco plant
WO2020025963A2 (en) Method
CN113227366A (zh) 调节植物的生物碱含量的方法
KR20220038605A (ko) 식물에서 알칼로이드 함량을 조정하는 방법
US20220170035A1 (en) Method
CN108473544A (zh) 修饰侧向出芽的方法
WO2023194746A1 (en) Method for modulating the alkaloid content of tobacco
WO2023194747A1 (en) Method of modulating the alkaloid content of tobacco
WO2023148476A1 (en) Method of modulating alkaloid content in tobacco plants
WO2023148478A1 (en) Method of modulating alkaloid content in tobacco plants
KR20220070305A (ko) 식물 내 환원당 (inv) 함량 조절
WO2023199065A1 (en) Method of modulating the alkaloid content of tobacco
WO2023209373A1 (en) Method of modulating the alkaloid content of tobacco
CN114514321A (zh) 调节植物中的糖和氨基酸含量(sultr3)
CN111818795A (zh) 调节植物中的还原糖含量