KR20240011835A - 재조합 단백질 생성 - Google Patents

재조합 단백질 생성 Download PDF

Info

Publication number
KR20240011835A
KR20240011835A KR1020237045030A KR20237045030A KR20240011835A KR 20240011835 A KR20240011835 A KR 20240011835A KR 1020237045030 A KR1020237045030 A KR 1020237045030A KR 20237045030 A KR20237045030 A KR 20237045030A KR 20240011835 A KR20240011835 A KR 20240011835A
Authority
KR
South Korea
Prior art keywords
ala
thr
sequence
cys
terminator
Prior art date
Application number
KR1020237045030A
Other languages
English (en)
Inventor
니콜라스 존 홀튼
엘보 도본 알론소
Original Assignee
리프 익스프레션 시스템즈 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 리프 익스프레션 시스템즈 리미티드 filed Critical 리프 익스프레션 시스템즈 리미티드
Publication of KR20240011835A publication Critical patent/KR20240011835A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/822Reducing position variability, e.g. by the use of scaffold attachment region/matrix attachment region (SAR/MAR); Use of SAR/MAR to regulate gene expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Peptides Or Proteins (AREA)

Abstract

조절 요소, 식물-기반 발현 시스템에서 단백질 생성을 향상시키기 위한 상기 조절 요소를 포함하는 발현 벡터, 및 이들의 생성 및 사용 방법이 개시된다.

Description

재조합 단백질 생성
발명의 분야
본 발명은 식물-기반 발현 시스템을 사용하여 단백질 생성을 향상시키기 위한 상기 조절 요소를 포함하는 조절 요소 발현 벡터, 및 이들의 제조 및 사용 방법에 관한 것이다.
발명의 배경
식물에서 재조합 단백질 발현은 전체 식물 및 세포 배양물 둘 모두에서 안정한 형질전환된 계통 또는 일시적 발현을 생성함으로써 달성될 수 있다. 단백질 생성의 수율은 발현 플랫폼의 상업적 생존 가능성에 중요하다. pEAQ 플라스미드(Sainsbury et al., 2009) (Sainsbury Frank and Lomonossoff George Peter, 2010) 및 magnICON 벡터(Gleba et al., 2005)와 같은 높은 단백질 생산 수율을 달성하기 위해 여러 시스템이 개발되었다. 모든 시스템은 강력한 프로모터 및 전사 종결자를 포함하는 여러 핵심 특징에 의존한다. 바이러스 복제 및 침묵의 억제를 제공하기 위해 일부 시스템에는 추가 특징이 존재한다.
단백질 생성을 향상시키는 방법 중 하나는 종결인자 영역을 포함하는 발현 시스템을 개발하는 것이다. 이는 오픈 리딩 프레임(ORF)의 3'에 위치한 종결인자 영역을 포함하는 진핵 시스템과 일치한다. 종결인자 영역은 전사 및 번역 과정에서 다수의 역할을 수행하므로, 단백질 생산 수준은 상이한 종결인자 간에 상당히 다양하다. 종결인자의 효율을 결정하는 서열 요소는 잘 알려져 있지 않다. 식물 발현 벡터에서 가장 일반적으로 사용되는 종결인자 중 하나는 증가된 단백질 생성과 관련된 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) T-DNA 노팔린 신타제(Tnos)로부터의 종결인자이다(Depicker et al., 1982). 솔라눔 투베로섬(Solarium tuberosum) PINII (An et al., 1989), 아라비돕시스 탈리아나(Arabidopsis thaliana) HSP18.2(Nagaya et al., 2010), 니코티아나 타바쿰 익스텐신(Nicotiana tabacum extensin) (Rosenthal et al., 2018), N. 벤타미아나(N. benthamiana) ACT3(Diamos and Mason, 2018)과 같은 다른 식물 종결인자가 Tnos 종결인자와 비교하여 개선된 단백질 생성을 초래하는 것으로 확인되었다.
단백질 생성을 향상시키기 위한 또 다른 수단은 탠덤 종결인자의 첨가이다(Beyene et al., 2011; Fuo and Chen, 2007). 식물에서, 단백질 생성의 향상은 안정한 형질전환체 및 일시적 발현 둘 모두에서 관찰되었다. 탠덤 종결인자의 여러 조합, 예를 들어, pEAQ 발현 시스템에서 동부콩 모자이크 바이러스 RNA-2 종결인자와 Tnos의 조합(Sainsbury et al., 2009) 및 지금까지 보고된 가장 높은 단백질 생성을 발생시키는(Diamos and Mason, 2018) 인트론리스 익스텐신과 ACT3의 조합이 연구되었다.
향상된 발현 및 감소된 유전자 침묵은 또한 매트릭스 부착 영역(MAR, 스캐폴드 부착 영역으로도 알려져 있음)을 함유하는 발현 벡터에서 관찰되었다. 발현에 대한 영향은 식물에서 안정한 형질전환체 및 일시적 발현 둘 모두에서 보고되었다. MAR은 숙주, MAR의 유형 및 발현 카세트에 따라 향상되거나 억제될 수 있거나 유전자 발현에 영향을 미치지 않을 수 있다(Dolgova and Dolgov, 2019). N. 타바쿰(N. tabacum) RB7 MAR은 유전자 발현을 향상시키기 위해 가장 일반적으로 사용되며 다수의 발현 시스템에서 널리 사용되어 왔다(Hall et al., 1991).
식물에서 재조합 단백질의 발현은 재조합 단백질의 대규모 생산을 위한 대안적인 비용 효율적인 플랫폼을 제공한다. 그러나, 식물 기반-재조합 발현 시스템은 포유동물 발현 시스템과 비교하여 더 낮은 수율의 단백질 생성을 제공한다. 이러한 발전에 비추어, 단백질 생성을 향상시키기 위해 식물-기반 발현 시스템을 개선하기 위한 수단을 확인할 필요가 여전히 존재하는 것이 명백하다.
발명의 개요
본 발명은 식물에서 관심 유전자의 단백질 발현을 향상시키기 위해 벡터를 형성하는데 이용되는, 식물 스트레스 유도된 유전자, 아라비돕시스 탈리아나 ECA1 유전자간 영역으로부터 유래된 신규한 MAR 및 이들의 조합으로부터의 다수의 신규한 종결인자에 관한 것이다.
제1 양태에 따르면, 본 발명은 스트레스 유도된 식물 유전자 또는 상기 서열의 단편 또는 변이체로부터의 핵산 서열 종결인자를 제공한다. 종결인자는 스트레스 유도된 유전자 생성물의 오픈 리딩 프레임에 대해 자연적으로 3'에 위치한다("본 발명의 종결인자"). 추가 구체예에서, 종결인자는 하기 유전자의 종결인자가 아니다: 솔라눔 투베로섬(서열 ID No 5), 아라비돕시스 탈리아나 HSP18.2 및 니코티아나 타바쿰 익스텐신. 일 구체예에서, 스트레스 유도된 식물 유전자는 니코티아나 종, 예를 들어, N. 벤타미아나 또는 N. 타바쿰으로부터 유래된다.
일 구체예에서, 종결인자는 서열 ID No 1 내지 4의 서열, 종결인자 상동체, 또는 상기 서열 또는 상동체의 단편, 또는 상기 서열 ID No 1 내지 4, 종결인자 상동체 또는 단편에 대해 80% 서열 동일성을 갖는 상동체 또는 변이체이다. 종결인자 상동체는 상동성 유전자의 종결인자이고, 여기서 상동성 유전자 생성물은 서열 ID No 8, 9, 10 또는 11에 대해 적어도 30%, 40%, 50%, 60%, 70%, 80% 또는 90% 아미노산 서열 동일성을 갖는다. 바람직한 구체예에서, 상동성 유전자 생성물은 50% 초과의 서열 동일성을 갖는다. 다른 구체예에서, 상동체는 Genbank와 같은 적합한 식물 뉴클레오티드 데이터베이스의 BLASTN에 의해 반환된 1e-10 미만의 쌍별 비교 E-값을 갖는 것으로 확인된다(Sayers et al 2021 [DOI: 10.1093/nar/gkaal023]).
일부 양태에서, 본 발명은 매트릭스 부착 영역 또는 적어도 300, 400, 500, 600, 700, 800, 900, 1000개 염기쌍의 단편 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체("본 발명의 매트릭스 부착 영역")를 포함하는 서열 ID No 7의 핵산을 제공한다.
다른 양태에서, 본 발명은 서열 ID No 1 내지 4의 서열, 종결인자 상동체, 또는 상기 서열 또는 상동체의 단편, 또는 상기 서열 ID No 1 내지 4, 종결인자 상동체 또는 단편에 대해 80% 서열 동일성을 갖는 변이체를 포함하는 발현 벡터를 제공한다. 다른 구체예에서, 발현 벡터는 서열 ID No 7의 핵산 또는 이에 대해 70% 동일성을 갖는 변이체를 포함한다. 일 구체예에서, 발현 벡터는 제2 종결인자 서열을 포함하고, 여기서 발현 벡터는 서열 ID 1 내지 4로부터 선택된 서열을 갖는 종결인자를 적어도 포함한다. 일부 구체예에서, 발현 벡터는 서열 ID No 1 내지 6, 상기 서열 ID No 1 내지 6의 상동체, 변이체 및 단편, 및 상기 서열 ID No. 1 내지 6, 상동체, 변이체 및 단편에 대해 70, 80, 90% 동일성을 갖는 종결인자으로부터 선택된 2개의 종결인자 서열을 포함한다. 2개의 종결인자는 탠덤 종결인자로 지칭된다.
다른 양태에서, 본 발명은 본 발명의 종결인자 또는 본 발명의 탠덤 종결인자 및 본 발명의 매트릭스 부착 영역을 포함하는 발현 벡터를 제공한다. 적합한 종결인자는 스트레스 유도된 식물 유전자의 오픈 리딩 프레임에 대해 3'에 위치한 핵산 서열을 포함하는 종결인자 또는 상기 종결인자의 단편 또는 변이체이다. 스트레스 유도된 식물 유전자로부터의 핵산을 포함하는 본 발명의 벡터에 사용하기 위한 종결인자는 서열 ID NO 1 내지 4로 제공되는 종결인자, 이의 종결인자 상동체, 또는 상기 서열 또는 상기 상동체의 단편, 또는 서열 No 1 내지 4 또는 이의 종결인자 상동체 중 임의의 것에 대해 80% 서열 동일성을 갖는 변이체이다. 추가 구체예에서, 본 발명의 벡터에 사용하기 위한 종결인자는 서열 ID No 1 내지 6으로부터 선택된다. 핵산은 전형적으로 N. 벤타미아나 또는 N. 타바쿰과 같은 니코티아나 식물로부터 유래된다.
일 구체예에서, 매트릭스 부착 영역은 서열 ID No 7로부터 유래되거나, 이는 적어도 300 bp의 단편 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체일 수 있다. 일부 구체예에서, MAR은 아라비돕시스 탈리아나로부터의 At5g36340과 At5g36350 사이의 ECA1 유전자간 영역으로서 확인된다. 다른 구체예에서, 발현 벡터는 종결인자 및 2개의 매트릭스 부착 영역을 포함한다. 2개의 매트릭스 부착 영역은 서열 ID No 7 또는 서열 ID No 7의 적어도 300개 염기쌍의 단편 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체로부터 선택된다.
일 양태에서, 본 발명은 프로모터, 오픈 리딩 프레임을 인코딩하는 폴리펩티드, 서열 ID No 6의 종결인자, 서열 ID No 1의 서열의 종결인자, 및 서열 ID No 7의 매트릭스 부착 영역을 포함하는 발현 벡터를 제공한다.
본 발명에 따른 발현 벡터는 상기 식물 또는 식물 세포에서 원하는 단백질을 발현시키기 위해 식물 또는 식물 세포를 형질전환시키는데 사용된다. 일 구체예에서, 단백질의 발현은 일시적 발현이다. 서열 ID 1 내지 6의 스트레스 유도된 종결인자의 핵산은 안정한 식물 또는 식물 세포의 생성에 사용될 수 있거나, 식물을 형질전환시켜 관심 단백질을 발현시키는 데 사용될 수 있고, 여기서 발현은 일시적 발현이다.
발명의 상세한 설명
본원에서 사용되는 "종결인자"는 DNA로부터 RNA 폴리머라제의 해리를 야기하여 DNA의 메신저 RNA로의 전사를 종결시키는 DNA 서열이다. "종결인자"는 RNA 전사체의 부위-특이적 절단을 허용하고 전사체의 3' 말단에서 폴리A 테일의 형성을 가능하게 하는 DNA 서열을 함유한다. "종결인자"는 또한 메신저 RNA의 단백질 번역을 촉진하는 단백질에 결합하는 서열을 함유한다.
본원에서 사용되는 용어 "상동체"는 종결인자의 맥락에서 사용될 때 상동성 유전자가 공통 조상 DNA 서열로부터의 후손에 의해 제2 유전자와 관련된 유전자인 상동성 유전자의 종결인자를 지칭한다. 용어 상동체는 종분화의 사건에 의해 분리된 유전자 사이의 관계(이종상동유전자) 또는 유전자 중복의 사건에 의해 분리된 유전자 사이의 관계(동종상동유전자)에 적용될 수 있다. 상동성 유전자의 종결인자는 정지 코돈 직후 및 제2 유전자의 임의의 오픈 리딩 프레임의 시작 전에 1000개 염기 서열에 위치한다.
본원에서 사용되는 "변이체"는 참조 서열의 생물학적 활성을 유지하면서 참조 서열의 전체 길이에 걸쳐 70, 80, 90, 95, 99% 동일성을 갖는 핵산 서열이다.
본원에서 사용되는 바와 같은 서열 동일성은 바람직하게는 정렬된 서열에서 동일한 위치에 있는 동일한 뉴클레오티드 또는 아미노산의 수에 의해 결정된다. 아미노산 퍼센트 동일성은 BLOSUM62 치환 매트릭스, 11의 갭 존재 패널티, 및 1의 갭 확장 패널티를 사용하여 BLASTP 정렬을 사용하여 결정된다. DNA 퍼센트 동일성은 1의 일치 점수, -2의 불일치 점수, 7의 워드 크기, 5의 갭 존재 패널티, 및 2의 갭 확장 패널티를 사용한 BLASTN 정렬을 이용하여 결정된다.
본원에서 사용되는 "단편"은 참조 서열의 생물학적 기능을 유지하는 핵산의 일부이다.
본원에서 사용되는 "매트릭스 부착 영역" 또는 스캐폴드 부착 영역은 핵 매트릭스가 부착되는 진핵 염색체의 DNA 내의 서열이다. 본 발명의 맥락에서, 이러한 영역은 아라비돕시스 탈리아나로부터의 At5g36340과 At5g36350 사이의 ECA1 유전자간 영역으로부터 유래되고, 핵 내의 염색질의 구조적 조직을 매개하고 유전자 발현을 촉진한다. MARS는 핵 매트릭스에 결합함으로써 확인되거나 AT-풍부 DNA의 존재에 의해 예측될 수 있다(>70%). MARS는 또한 SMARTest(Frisch et al 2002 [doi: 10.1101/gr.206602]) 또는 MAR-파인더(Singh et al 1997 [doi: 10.1093/nar/25.7.1419])와 같은 컴퓨터 알고리즘을 사용하여 예측될 수 있다.
용어 "일시적 발현"은 핵산, 가장 빈번하게는 발현 카세트를 인코딩하는 플라스미드 DNA 또는 플라스미드 단편이 식물 세포에 도입된 후 짧은 시간, 최대 4주 동안 발현되고 많은 세대에 걸쳐 단백질의 발현을 가능하게 하는 안정한 발현과 대조되는 관심 단백질을 생성하기 위한 유전자의 일시적 발현을 나타낸다.
본원에서 사용되는 "발현 벡터"는 세포에서 유전자 발현을 위해 설계된 플라스미드 또는 바이러스이다. 발현 벡터는 특정 관심 유전자를 표적 세포에 도입하는데 사용되며, 유전자에 의해 인코딩된 단백질을 생성하기 위해 세포의 메카니즘을 지휘할 수 있다. 본원에서 사용되는 발현 벡터는 적어도 하나의 발현 카세트를 포함한다.
본원에서 사용되는 "발현 카세트"는 발현을 위한 조절 서열의 제어 하에 관심 유전자를 함유하는 발현 벡터의 성분을 지칭한다. 본원에 기재된 바와 같은 발현 카세트는 프로모터 서열, 5'UTR(5' 비번역 영역), 예컨대, 타바코 식각 바이러스 오메가 5'UTR, 오픈 리딩 프레임, 및 종결인자를 포함한다. CaMV 35S는 콜리플라워 모자이크 바이러스로부터 유래된 프로모터이다. 다른 적합한 프로모터는 카사바 정맥 모자이크 바이러스 프로모터, 리불로스 바이포스페이트 카르복실라제의 작은 서브유닛의 프로모터, 플라스토시아닌 프로모터, 단자엽 및 쌍자엽으로부터의 유비퀴틴 프로모터, 및 액틴 프로모터를 포함한다. 프로모터는 항시적, 유도성 또는 조직 특이적일 수 있다.
일부 구체예에서, 제2 프로모터는 제1의 다운스트림에 존재할 수 있다. 일 접근법에서, 이는 이중 CaMV 35S 프로모터일 수 있다.
본원에서 사용되는 "비리디플란태(Viridiplantae)"는 니코티아나 종(예를 들어, 타바코(N.타바쿰) 및 N. 벤타미아나 등), 당근, 콩과 식물(예를 들어, 동부콩, 알팔파/루체른, 콩, 병아리콩, 땅콩, 완두콩), 파파야, 감자, 유채/캐놀라, 사과, 식물성 브라시카(예를 들어, 비트, 양배추, 콜리플라워, 브로콜리 등), 쌀, 옥수수, 대두, 토마토, 포도, 장미, 카네이션, 감귤류(레몬/라임, 오렌지, 그레이프프루트, 귤 및 기타 포함), 수수, 사탕수수, 보리, 바나나, 카사바, 지팡이 베리(루부스), 커피, 조롱박(오이, 멜론, 스쿼시, 수박 및 기타 포함), 헤이즐넛, 홉, 상추, 오크라, 올리브, 땅콩, 호밀, 딸기, 고구마, 배, 시클라멘, 임파티엔스, 칼랑코에, 제라늄, 거베라, 카텔리아, 국화, 시네라리아, 회향, 종자 콩나물, 아보카도, 키위, 귀리, 완두콩, 석류 과일(예를 들어, 아몬드, 자두, 살구, 체리, 복숭아/넥타린 및 기타), 패션 프루트, 후추, 셀러리, 타바코, 밀, 양파/마늘, 및 대마초를 포함하나 이에 제한되지 않는다. 이들은 또한 상기 기재된 종의 식물 세포 현탁액을 포함할 수 있다. 바람직하게는, 숙주는 하기로부터 선택된다: 니코티아나 종(예를 들어, N. 타바쿰 및 N.벤타미아나), 감자, 브라시카스, 쌀, 옥수수, 대두, 토마토, 상추 및 밀.
본 발명에 따른 발현 벡터는 표준 방법을 사용하여 식물 또는 식물 부분에 도입되어 사용된다. 본 발명에서 사용되는 형질전환은 많은 식물 종에서 널리 사용된다. 아그로박테리움 투메파시엔스(A. 투메파시엔스)는 식물을 감염시키기 위한 전달 벡터로 사용되는 그람 음성 토양 박테리아이다.
발현 벡터는 적어도 하나의 발현 카세트를 포함한다. 발현 카세트는 단일 스트레스 유도된 종결인자 또는 탠덤 종결인자("이중 종결인자"로도 지칭됨)를 포함한다. 단일 스트레스 유도된 종결인자는 발현 카세트의 오픈 리딩 프레임의 3'에 위치한다.
본원에서 사용되는 "쌍별 비교 E-값"은 2개의 관심 서열의 비교가 수행될 때 생성된 E-값이다.
본 발명에 따른 "Pfam"은 UniProt 릴리스 2020_06에 기반한 데이터베이스 Pfam 버전 34.0이며, 각각 다수의 서열 정렬 및 은닉 Markov 모델(HMM)로 표시되는 단백질 패밀리의 대규모 컬렉션이다(Jaina Mistry, Sara Chuguransky , Lowri Williams, Matloob Qureshi, Gustavo A Salazar, Erik LL Sonnhammer, Silvio CE Tosatto, Lisanna Paladin, Shriya Raj, Lorna J Richardson, Robert D Finn, Alex Bateman, Pfam: The protein family database in 2021, Nucleic Acids Research, Volume 49, Issue D1, 8 January 2021, Pages D412-D419, https://doi.org/10.1093/nar/gkaa913). 단백질은 도메인으로 일반적으로 지칭되는 하나 이상의 기능성 영역으로 일반적으로 구성된다. 도메인의 다양한 조합은 자연에서 발견되는 다양한 범위의 단백질을 발생시킨다. 따라서, 단백질 내에서 발생하는 도메인의 확인은 이들의 기능에 대한 통찰력을 제공할 수 있다.
스트레스 유도된 종결인자는 식물에 대한 생물적 또는 비생물적 스트레스 신호의 적용에 의해 전사체 및/또는 단백질 풍부도가 증가되는 것들이다. 유의한 증가는 유도되지 않은 상태로부터 전사체 또는 단백질의 >2배 증가로 정의된다. 전형적으로, 유전자 유도는 스트레스 신호의 3-5시간에 검출될 수 있다. 생물학적 스트레스는 박테리아, 진균, 선충, 곤충 및 바이러스 유기체 또는 이들 유기체로부터 유래된 화학물질 또는 단백질을 포함한다. 생물학적 스트레스는 또한 초식성 또는 타액 단백질 또는 화학물질을 통해 유도될 수 있다. 비생물적 스트레스는 상처, 극한 온도, 염도, 물 과잉 또는 결핍, 광 또는 자외선, 및 화학 독소, 예컨대, 비료 및 중금속에 의해 유도될 수 있다. 스트레스 신호는 전사체 및 단백질 생성의 수를 변경하는 유전자 발현을 조절한다. 이러한 스트레스에 반응하기 위해, 식물은 종종 스트레스로부터 식물을 보호하는데 관여하는 특정 단백질의 신속하고 높은 수준의 유도를 필요로 하는 방어 반응을 개시한다. 이는 병원체 감염에 대한 반응으로 NtPR1a의 유도에 의해 예시되며, 여기서 유전자 유도는 병원체 인식 3시간 이내에 시작되어 NtPR1a 단백질의 고수준 축적을 초래한다.
본 발명에 따르면, 스트레스 유도된 종결인자는 바람직한 구체예에서, 스트레스 유도된 유전자, 예컨대, N. 타바쿰 병인-관련 단백질 la(NtPR1a로 지칭됨), N. 벤타미아나 프로테이나제 억제제 타입-2(NbPINII로 지칭됨), 상처-유도 단백질(NbWIN1로 지칭됨), 및 디펜신-유사 단백질 14(NbPDF1.2로 지칭됨)로부터 유래된다. 이러한 스트레스 유도된 유전자의 종결인자는 이종성 재조합 단백질의 향상된 발현을 발생시킨다.
당업자에게 이미 공지된 단백질 생성을 개선시키는 종결인자는 아그로박테리움 투메파시엔스 T-DNA 노팔린 신타제(Tnos)로부터의 종결인자를 포함한다. 이는 식물 발현 벡터에서 통상적으로 사용되는 종결인자이다(Depicker et al., 1982). 확인된 다른 종결인자는 솔라눔 투베로섬 PINII(An et ak, 1989), 아라비돕시스 탈리아나 HSP18.2(Nagaya et ak, 2010), 니코티아나 타바쿰 익스텐신(Rosenthal et ak, 2018), N. 벤타미아나 ACT3(Diamos and Mason, 2018)를 포함한다.
본 발명에 의해 확인된 신규한 스트레스 유도된 종결인자는 N. 타바쿰 병인-관련 단백질 1a(Gen bank ID: XI2737.1)(NtPR1a로 지칭됨)(SEQ ID No: 1) 종결인자, N. 벤타미아나 프로테이나제 억제제 타입-2(Nibenl01Scf07757g00001.1)(NbPINII로 지칭됨)(SEQ ID No:2) 종결인자, 상처-유도된 단백질(Nibenl01Scf01015g01002.1)(NbWIN1로 지칭됨)(SEQ ID No:3) 종결인자, 및 디펜신-유사 단백질 14(Nibenl01Scf00761g00006.1)(NbPDF1.2로 지칭됨)(SEQ ID No:4) 종결인자이다. 각각의 경우에 종결인자 서열은 오픈 리딩 프레임의 정지 코돈의 3'에 위치한다.
상기 기재된 바와 같은 종결인자는 본 발명에 따라 탠덤 종결인자 조합의 일부로서 사용될 수 있고, 추가로 StPINII(SEQ ID NO: 5) 종결인자, Tnos(SEQ ID NO: 6) 종결인자는 또한 본 발명의 신규한 스트레스 유도된 종결인자와 조합될 수 있다.
추가로 예시하기 위해, 하기는 본 발명에 의해 제공되는 스트레스 유도된 종결인자의 목록이다:
NtPR1a
NtPR1a에 대해 >70% 동일성을 갖는 단백질(서열 ID No: 8)을 함유하고/거나 E-값이 <0.01인 Pfam 도메인 PF00188(시스테인-풍부 분비 단백질 슈퍼패밀리)에 대한 상동성을 함유하는 유전자의 식물 종결인자.
NbPINII
NbPINII에 대해 >70% 동일성을 갖는 단백질(서열 ID No: 9)을 함유하고/거나 E-값이 <0.01인 Pfam 도메인 PF02428(감자 유형 II 프로테이나제 억제제 패밀리)에 대한 상동성을 함유하는 유전자의 식물 종결인자.
NbWIN1
NbWIN1에 대해 >70% 동일성을 갖는 단백질(서열 No: 10)을 함유하고/거나 E-값이 <0.01인 Pfam 도메인 PF00967(Barwin) 및 PF00187(키틴 결합 1)에 대한 상동성을 함유하는 유전자의 식물 종결인자.
NbPDF1.2
NbPDF1.2에 대해 >70% 동일성을 갖는 단백질(서열 ID No: 11)을 함유하고/거나 E-값이 <0.01인 Pfam 도메인 PF00304(감마-티오닌 패밀리)에 대한 상동성을 함유하는 유전자의 식물 종결인자.
상기 언급된 바와 같은 E-값은 매치의 통계적 유의성 파라미터이다. E-값이 낮을수록 일치가 더 유의하다. 본 발명에 따르면, le-10 미만의 쌍별 비교 E-값으로 다른 종결인자를 확인하는 것이 바람직하다.
탠덤 종결인자는 함께 융합된 2개의 종결인자이다. 2개의 종결인자는 링커 서열 없이 함께 융합되거나, 2개의 종결인자는 링커 서열을 통해 연결된다. 일 구체예에서, 링커 서열은 최대 200개의 염기쌍을 포함할 수 있다. 탠덤 종결인자는 StPINII + StPINII와 같은 함께 융합된 동일한 종결인자 중 2개일 수 있거나, 이는 StPINII + NtPR1a와 같은 2개의 상이한 종결인자의 조합일 수 있다. 탠덤 종결인자는 둘 모두 발현 카세트의 오픈 리딩 프레임의 3'에 위치한다. 제2 종결인자는 제1 종결인자의 3'에서 결합된다. S. 투베로섬 PINII, N. 벤타미아나 PINII, WIN1, PDF1.2 및 N. 타바쿰 PR1a 종결인자 중 임의의 것이 Tnos, S. 투베로섬 PINII, N. 벤타미아나 PINII, WIN1, PDF1.2 및 N. 타바쿰 PR1a 중 임의의 것과 융합될 수 있다. 바람직하게는, 탠덤 종결인자는 하기 군으로부터 선택된다: NbPDF1.2 + Tnos, NbPINII + Tnos, NbWIN1 + Tnos, StPINII + EU, StPINII + HSP18, StPINII + Tnos, StPINII + StPINII, StPINII + NtPR1a, NtPR1a, NtPR1a StPINII, 및 NtPR1a + NtPR1a. 전술한 종결인자 쌍은 상기 열거된 바와 같이 배열되며, 예를 들어, NbPDF1.2는 제2 종결인자 Tnos의 업스트림에 배열된 제1 종결인자이고, 이러한 배열은 "NbPDF1.2 + Tnos"로 표시된다. 다른 구체예에서, 쌍은 상이한 순서로 배열될 수 있다. 더욱 바람직하게는, StPINII + NtPR1a의 조합이 바람직하다.
발현 카세트는 매트릭스 부착 영역(MAR)을 추가로 포함한다. MAR은 종결인자를 포함하는 발현 벡터의 5'UTR 및/또는 3'UTR에 위치할 수 있다. 일부 구체예에서, MAR은 단일 또는 탠덤 종결인자(들)를 포함하는 발현 카세트의 업스트림이다. 다른 구체예에서, MAR은 단일 또는 탠덤 종결인자를 포함하는 발현 카세트의 다운스트림이다. 바람직한 구체예에서, MAR은 발현 카세트의 어느 한 쪽에 측접함으로써, 단일 또는 탠덤 종결인자(들)를 함유하는 발현 카세트의 업스트림 및 다운스트림에 있다. 다수의 발현 시스템에서 가장 일반적으로 사용되는 MAR은 N. 타바쿰 RB7 MAR로 알려져 있다(Hall et ah, 1991). 본 발명은 아라비돕시스 탈리아나 At5g36340 번역 시작 코돈과 At5g36350 번역 종결 코돈 사이의 유전자간 영역인 신규한 MAR을 확인하였다(AtMAR1a로 지칭됨; Genbank ID: 염기 14331550 내지 14333550로부터의 CP002688.1). 일 구체예에서, 발현 벡터는 발현 카세트의 업스트림에 있는 MAR 및 탠덤 종결인자를 포함한다. 일 구체예에서, 발현 벡터는 발현 카세트의 다운스트림에 있는 MAR 및 탠덤 종결인자를 포함한다. 다른 구체예에서, 발현 벡터는 탠덤 종결인자 및 2개의 MAR을 포함하며, 여기서 각각의 MAR은 발현 카세트의 어느 한 측에 측접하고, 즉, 제1 MAR은 발현 카세트의 업스트림에 있고, 제2 MAR은 발현 카세트의 다운스트림에 있다. 일 구체예에서, MAR은 AtMAR1a이고, 이는 이중 종결인자, 예를 들어, StPINII + NtPR1a 또는 StPINII + Tnos를 함유하는 발현 카세트의 업스트림에 있다. 일 구체예에서, MAR은 AtMAR1a이고, 이는 이중 종결인자, 예를 들어, StPINII + NtPR1a 또는 StPINII + Tnos를 함유하는 발현 카세트의 업스트림에 있다. 다른 구체예에서, MAR은 AtMAR1a이고, 이는 이중 종결인자, 예를 들어, StPINII + NtPR1a를 함유하는 발현 카세트의 업스트림 및 다운스트림에 있다.
추가의 구체예는 하기를 포함한다:
다음의 5'에서 3' 순서로 다음 성분을 포함하는 발현 벡터;
a. 프로모터 및 임의적으로 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 6의 종결인자
d. 서열 ID No 1의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역
다음의 5'에서 3' 순서로 다음 성분을 포함하는 발현 벡터;
a. 프로모터 및 임의적으로 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 5의 종결인자
d. 서열 ID No 6의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역
다음의 5'에서 3' 순서로 다음 성분을 포함하는 발현 벡터;
a. 프로모터 및 임의적으로 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 5의 종결인자
d. 서열 ID No 6의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역
다음의 5'에서 3' 순서로 다음 성분을 포함하는 발현 벡터;
a. 이중 CaMV 35S 프로모터
b. 타바코 식각 바이러스 오메가 5'UTR(TEV 오메가)
c. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
d. 서열 ID No 5의 종결인자
e. 서열 ID No 6의 서열의 종결인자
f. 서열 ID No 7의 매트릭스 부착 영역
선택된 단일 스트레스 유도된 종결인자 또는 탠덤 종결인자의 존재는 발현 벡터로부터의 단백질 생성을 증가시킨다. 이러한 효과는 본 발명의 MAR의 존재 하에 추가로 향상되었다. 증가된 단백질 생성은 형광 강도의 방출에 의해 결정되는 GFP의 향상된 발현에 의해 결정된다. 본원에서 사용되는 발현 벡터는 단일 또는 탠덤 종결인자(들) 및/또는 MAR(들)의 존재 하에 단백질 생성을 측정하기 위해 리포터 유전자 GFP를 포함한다. 단백질 생성의 증가는 1.3배, 5배 또는 10배 초과이다.
P19는 토마토 부시 스턴트 바이러스로부터 유래된 RNA 침묵의 억제인자이다. pEAQ-HT 벡터 백본은 P19를 포함한다(Sainsbury, F., Thuenemann, E.C. and Lomonossoff, G.P. (2009), pEAQ: versatile expression vectors for easy and quick transient expression of heterologous proteins in plants. Plant Biotechnology Journal, 7: 682-693. ttps://doi.org/10.1111/j.1467-7652.2009.00434.x). 본 발명의 특정 구체예에서, 발현 벡터는 P19 유전자를 추가로 포함한다. 다른 적합한 침묵 억제인자는 포토스 잠복 아우레우스바이러스( Pothos latent aureusvirus)(P14), 순무 크링클 바이러스(Turnip crinkle virus)(P38), 토마토 황엽 컬 바이러스(tomato yellow leaf curl virus)(V2), 토마토 스페르미 쿠쿠모바이러스(Tomato aspermy cucumovirus)(2b), 타바코 식각 바이러스(Tobacco etch virus)(HC-Pro), 비트 황색 바이러스(Beet yellows virus)(P21), 폴레로바이러스(poleroviruse)(P0) 및 고구마 마일드 반점 아이포모바이러스(Sweet potato mild mottle ipomovirus)(P1)를 포함하나 이에 제한되지 않는다.
비-단백질 코딩 서열에 대한 진화적 제약이 단백질 코딩 서열보다 유의하게 낮은 것을 고려하면 상동성 종결인자의 확인은 어렵다. 따라서, 이종상동성 단백질 코딩 유전자의 프로모터와 종결인자 사이의 서열 동일성 정도는 높은 정도의 서열 변이를 가질 수 있다. 그러나, 서열 동일성의 이러한 차이에도 불구하고, 이들은 여전히 동일한 생물학적 기능을 수행할 수 있어, 단백질 발현의 유도 또는 조직 특이성이 프로모터 및 종결인자 서열에 의해 유지된다. 본 발명에 따르면, 상동성 종결인자는 종결인자 자체의 서열 동일성에 의존하지 않고, 오히려 종결인자에 연결된 단백질의 동일성에 의존하는 방법을 사용하여 확인된다. 이 방법의 첫 번째 단계는 관련 단백질 서열을 확인하는 것이며, 이는 관심 단백질 서열을 갖는 식물 서열을 함유하는 단백질 데이터베이스에 대해 BLASTP를 포함하나 이에 제한되지 않는 여러 서열 상동성 방법에 의해 수행될 수 있다. 이 검색은 > 30%의 바람직한 서열 동일성을 갖는 상동성 서열을 드러낼 것이다. 상동성 서열은 또한 단백질 부류에서 발견되는 정의된 서열 모티프를 사용하여 확인될 수 있다. 모티프는 UniProt 릴리스 2020_06에 기반한 Pfam 버전 34.0과 같은 데이터베이스에 기술되어 있다. 상동성 단백질 서열은 표준 생물정보학 방법을 사용하여 이러한 서열 모티프의 존재에 의해 확인될 수 있다. 표적은 이 목록으로부터 선택될 수 있고, 종결인자를 함유하는 게놈 서열은 표준 생물정보학 방법을 사용하여 확인될 수 있다. 종결인자 서열은 유전자의 정지 코돈의 서열 3'이고, 이는 적어도 300-2000개의 염기쌍 길이를 포함할 것이다.
도면
도 1은 종결인자 벡터의 개략도이다. 도 1a는 35SΩ-eGFP-종결인자 발현 카세트를 포함하는 단일 종결인자 벡터를 예시한다. 도 1b는 서로 융합된 2개의 종결인자를 갖는 35SΩ-eGFP-종결인자 발현 카세트를 포함하는 탠덤 종결인자 벡터를 예시한다. 도 1c는 2x35SΩ-eGFP-종결인자 발현 카세트의 어느 한쪽에 측접된 2개의 AtMAR1a를 포함하는 AtMAR1a 벡터를 예시한다. 도 1d는 2x35SΩ, PINII 종결인자, NOS 종결인자(Tnos) 및 AtMAR1a를 최적화된 발현 카세트를 예시한다. 도 1e는 35S 프로모터, CPMV 5'UTR 및 3'UTR, NOS 종결인자 및 P19 침묵 억제인자를 포함하는 pEAQ-HIT 발현 카세트를 예시한다.
도 2a 및 2b는 Tnos 및 pEAQ-HT를 포함하는 벡터와 비교하여 StPINII, NtPR1a, NbPINII, NbWIN1, NbPDF1.2로부터 선택된 단일 스트레스 유도된 종결인자를 포함하는 벡터에 의해 방출되는 GFP 형광의 강도를 보여준다. 스트레스-유도된 종결인자는 향상된 발현을 발생시켰다.
도 3은 탠덤 종결인자의 조합(NbPINII + Tnos, NbPDF1.2+ Tnos, 및 NbWINl + Tnos)을 포함하는 벡터에 의해 방출된 GFP 형광의 강도가 단일 스트레스 유도된 종결인자 단독(NbPINII, NbPDF1.2 및 NbWIN1) 및 EU-ACT를 포함하는 벡터와 비교하여 향상된 eGFP 발현을 나타내었음을 보여준다.
도 4는 StPINII, Tnos, HSP18.2, EU, 또는 NtPR1a와 조합된 StPINII 종결인자뿐만 아니라 Tnos, StPINII 및 제2 NtPR1a와 조합된 NtPR1a 종결인자의 탠덤 종결인자 조합을 포함하는 벡터에 의해 방출되는 GFP 형광의 강도를 보여준다. 탠덤 종결인자는 단일 스트레스 유도된 종결인자 단독, pEAQ-HT 및 EU-ACT를 포함하는 벡터와 비교하여 향상된 eGFP 발현을 나타내었다.
도 5는 AtMAR1a를 포함하는 벡터, AtMAR1a가 없는 벡터, Tnos 및 pEAQ-HT를 포함하는 벡터에 의해 방출되는 GFP 형광의 강도를 보여준다. AtMAR1a를 갖는 벡터는 AtMAR1a, Tnos 및 pEAQ-HT가 없는 벡터와 비교하여 증가된 형광 강도를 발생시켰다.
도 6은 서로 융합된 2개의 종결인자를 포함하는 35SΩ-eGFP-종결인자 발현 카세트의 어느 한 쪽에 측접된 AtMAR1a를 포함하는 벡터, 서로 융합된 2개의 종결인자를 포함하는 35SΩ-eGFP-종결인자 발현 카세트의 3'에 AtMAR1a를 포함하는 벡터, Tnos 및 pEAQ-HT를 포함하는 벡터에 의해 방출된 GFP 형광 강도를 보여준다. AtMAR1a를 갖는 벡터는 AtMAR1a, Tnos 및 pEAQ-HT가 없는 벡터와 비교하여 증가된 형광 강도를 발생시켰다.
도 7은 pEAQ-HT와 비교하여 AtMAR1a의 3'에 측접된 2x35SQ, PINII 및 NOS 종결인자를 함유하는 벡터에 의한 ELISA 결정된 GFP 축적을 보여준다. GFP 축적은 pEAQ-HT에 의해 생성된 것보다 높다.
도 8은 Rb7 또는 AtMAR1a 매트릭스 부착 영역을 함유하는 벡터에 의해 방출된 GFP 형광을 보여준다. 벡터는 또한 2x35SO, PINII 및 NOS 종결인자를 함유한다. AtMAR1a는 Rb7과 비교하여 증가된 형광을 발생시킨다.
도 9는 웨스턴 블롯에 의해 결정된 바와 같은 pEAQ-HT 또는 최적화된 발현 카세트(2x35SO, PINII 및 NOS 종결인자, AtMAR1a에 의해 3'에 측접됨)를 사용하여 Zika NSl-6xHIS 태그의 축적을 보여준다. 샘플은 침윤 후(dpi) 3일 6일째에 수집하였다. 모든 작제물은 P19 침묵 억제인자의 존재하에 발현되었다. 총 단백질은 SDS-PAGE 겔에서 진행시키고, 나일론 막에 옮기고, 항-HIS 항체를 사용하여 웨스턴 블롯을 수행하였다. 농도계에 의한 단백질 축적의 정량화.
도 10은 웨스턴 블롯에 의해 결정된 바와 같은 pEAQ-HT 또는 최적화된 발현 카세트 중 어느 하나를 이용하여 아라키스 하이포가에아 Ara h6-6xHIS 태그의 축적을 보여준다. 샘플을 침윤 후(dpi) 3 및 6일째에 수집하였다. 모든 작제물은 P19 침묵 억제인자의 존재하에 발현되었다. 총 단백질은 SDS-PAGE 겔에서 진행시키고, 나일론 막에 옮기고, 항-HIs 항체를 사용하여 웨스턴 블롯을 수행하였다. 농도계에 의한 단백질 축적의 정량화.
도 11은 웨스턴 블롯에 의해 결정된 바와 같은 pEAQ-HT 또는 최적화된 발현 카세트 중 어느 하나를 이용하여 인간 대식세포 콜로니-자극 인자(M-CSF-β) 6xHIS 태그의 축적을 보여준다. 샘플을 침윤 후(dpi) 3 및 6일째에 수집하였다. 모든 작제물은 P19 침묵 억제인자의 존재하에 발현되었다. 총 단백질은 SDS-PAGE 겔에서 진행시키고, 나일론 막에 옮기고, 항-HIs 항체를 사용하여 웨스턴 블롯을 수행하였다. 농도계에 의한 단백질 축적의 정량화.
실시예
본 발명의 특정 양태 및 구체예는 이제 예로서 그리고 상기 설명된 도면을 참조하여 예시될 것이다.
실시예 1: 단일 종결인자를 포함하는 발현 벡터
종결인자의 합성
N. 타바쿰 병인-관련 단백질 1a [PR1a](NtPR1a, X12737.1) 종결인자를 화학적으로 합성하여 서열 ID No: 1을 산출하였다. N. 벤타미아나 종결인자 프로테이나제 억제제 타입-2 [PINII](NbPINII, Niben101Scf07757g00001.1), 상처-유도 단백질 [PR4](NbWIN1, Niben101Scf01015g01002.1) 및 디펜신-유사 단백질 14[PDF1.2](NbPDF1.2, Niben101Scf00761g00006.1)을 표 1에 열거된 프라이머를 사용하여 N. 벤타미아나 게놈 DNA로부터 PCR에 의해 증폭시켰다. S. 투베로섬 PINII(StPINII) 종결인자를 합성하여 서열 ID No:5를 산출하였다. Tnos를 합성하여 서열 ID 번호: 6을 산출하였다.
표 1: NbPINII, NbWIN1 및 NbPDF1.2의 증폭을 위한 프라이머
유전자 정방향 프라이머 역방향 프라이머
NbPINII TGGACGAGCTGTACAAGTAATTATTTCTAATAAGTGATC GGATCCCCGGGTACCGAGCTTCCTTTCTTTTCTTCTTTG
NbWIN1 GGATCCCCGGGTACCGAGCTAGTTGACAGTTAAGTTAA TGGACGAGCTGTACAAGTAAGAAGCTATATACATATATA
NbPDF1.2 TGGACGAGCTGTACAAGTAATAATTGAAATTGGATTGAT GGATCCCCGGGTACCGAGCTTGCTAGACTTAGATGTCAA
단일 종결인자 발현 벡터의 생성
TEV 오메가 인핸서를 갖는 단일 CaMV 35S 프로모터로 구성된 프로모터를 포함하는 이원 벡터 플라스미드를 사용하여 발현 벡터를 생성하였다. eGFP를 pEAQ-HT에 클로닝하여 35SΩ-eGFP-종결인자 발현 벡터를 생성하였다. PR1a, PINII, NbPINII, NbWIN1, PDF1.2, StPINII 및 Tnos로부터 선택된 단일 종결인자를 개별 벡터로 클로닝하였다. 발현 벡터의 개략도는 도 1a에 도시되어 있다.
단일 종결인자 벡터로부터의 발현
P19가 벡터 상에 존재하는 pEAQ-HT 벡터를 제외하고, 종결인자를 갖는 이원 벡터를 함유하는 A. 투메파시엔스를 P19 침묵 억제인자를 운반하는 A. 투메파시엔스와 N. 벤타미아나 잎에 공동-침윤시켰다. 샘플을 채취하고 488 nm의 여기 및 507 nm의 방출을 갖는 형광 플레이트 리더를 사용하여 형광 측정에 의해 eGFP 발현이 모니터링되는 경우, 침윤 후 6일 동안 식물을 성장시켰다. eGFP의 ELISA 정량화는 제조 설명서에 따라 GFP ELISA 키트(Abcam)를 사용하여 수행하였다. 침윤 후(dpi) 6일째에, eGFP 발현을 상이한 종결인자 사이에서 비교하였다. StPINII, NtPR1a, NbPINII, NbWIN1, 및 NbPDF1.2 종결인자를 포함하는 벡터는 Tnos 또는 pEAQ-HT 벡터를 포함하는 벡터와 비교하여 증가된 형광 강도를 방출하였다(도 2a 및 도 2b). 증가된 형광 강도는 pEAQ-HT 및 Tnos를 포함하는 벡터와 각각 비교하여, 하기 종결인자 StPINII, NtPR1a, NbPINII, NbWIN1, 및 NbPDF1.2 중 하나를 포함하는 벡터에 의해 적어도 1.3배 및 적어도 1.5배 향상된 eGFP 발현을 입증한다 - 따라서, 단백질의 발현이 본 발명의 종결인자에 의해 향상됨을 입증한다.
실시예 2: 탠덤 종결인자를 포함하는 발현 벡터
탠덤 종결인자 발현 벡터의 생성
발현 벡터는 실시예 1에서 상기 기재된 바와 같이 생성되었다. NEB HiFi® DNA 어셈블리를 통해 제2 위치 종결인자에서 Tnos, HSP18.2, EU, StPINII 또는 NtPR1a와 스트레스 유도된 종결인자(NbPDF1.2, NbPINII, NbWIN1)의 융합에 의해 탠덤 종결인자를 생성하였다. 이러한 탠덤 종결인자를 콜리플라워 모자이크 바이러스(CaMV) 35S 프로모터, 및 eGFP를 갖는 이원 벡터 내에 클로닝하여 35SΩ-eGFP-종결인자 발현 카세트를 생성시켰다. 발현 벡터의 개략도는 도 1b에 도시되어 있다. eGFP를 pEAQ-HT에 클로닝하였다.
탠덤 종결인자를 함유하는 벡터로부터의 발현
P19가 벡터에 존재하는 A. 투메파시엔스 벡터. 샘플을 채취하고 488 nm의 여기 및 507 nm의 방출을 갖는 형광 플레이트 리더를 사용하여 형광 측정에 의해 eGFP 발현이 모니터링되는 경우, 침윤 후 6일 동안 식물을 성장시켰다. eGFP의 ELISA 정량화는 제조 설명서에 따라 GFP ELISA 키트(Abcam)를 사용하여 수행하였다. 단일 스트레스 유도된 종결인자를 포함하는 벡터와 탠덤 종결인자를 포함하는 벡터 사이에서 eGFP의 발현을 비교하였다. 스트레스 유도된 종결인자(NbPDF1.2, NbPINII, NbWIN1)와 제2 위치의 Tnos, HSP18.2, EU, StPINII 또는 NtPR1a의 탠덤 종결인자 조합의 다양한 조합이 생성되었다. EGFP의 발현을 6 dpi에서 pEAQ-HT 또는 최신 기술의 EU-ACT 탠덤 종결인자와 비교하였다(도 3).
탠덤 종결인자(NbPINII + Tnos, NbPDF1.2+ Tnos, 및 NbWIN1 + Tnos)을 포함하는 벡터는 단일 스트레스 유도된 종결인자 단독(NbPINII, NbPDF1.2 및 NbWIN1)을 포함하는 벡터와 비교하여 향상된 eGFP 발현을 나타내었다. NbPINII-Tnos, NbPDF1.2-Tnos 및 NbWIN1-Tnos로의 eGFP의 발현은 EU-ACT와 비교하여 동등하거나 향상되었다. NbPINII, NbPDF1.2 및 NbWIN1의 단일 및 탠덤 조합은 모두 pEAQ-HT보다 유의하게 더 높은 발현을 초래하였으며, 이는 본 발명의 벡터의 개선을 보여준다.
제2 위치에서 StPINII, Tnos, HSP18.2, EU, 또는 NtPR1a와 조합된 StPINII 종결인자를 벡터 내로 클로닝함으로써 탠덤 종결인자 조합을 생성하였다. 탠덤 종결인자 조합은 StPINII 종결인자 단독과 비교하여 eGFP의 증가된 발현을 발생시켰다(도 4). StPINII 또는 Tnos의 제2 복사체의 첨가에서는 유의한 향상이 관찰되지 않았다. StPINII 단독은 EU-ACT 및 pEAQ-HT 둘 모두에 비해 향상된 발현을 발생시켰다. 제2 위치에서 StPINII, Tnos 또는 NtPR1a와 조합된 NtPR1a 종결인자를 벡터 내로 클로닝함으로써 탠덤 종결인자 조합을 생성하였다. NtPR1a와의 탠덤 종결인자 조합은 NtPR1a 단독과 비교하여 발현을 유의하게 향상시키지 않았다(도 4).
실시예 3: MAR을 포함하는 발현 벡터
MAR의 합성
AtMAR1a를 아라비돕시스 탈리아나로부터 PCR에 의해 증폭시켜 서열 ID No: 6을 산출하였다.
MAR 및 탠덤 종결인자를 포함하는 발현 벡터의 생성
2개의 AtMAR1a를 표 2에 열거된 2세트의 프라이머(5'에서 클로닝하기 위한 프라이머 및 3'에서 클로닝하기 위한 프라이머)를 사용하여 클로닝하고, 이는 TEV 오메가 인핸서를 갖는 이중 인핸서 CaMV 35S 프로모터로 구성된 프로모터, eGFP 및 StPINII 및 Tnos를 포함하는 탠덤 종결인자를 함유하는 발현 카세트(2x35SΩ-eGFP-StPINII-Tnos)의 어느 한 측에 측접된다. 발현 벡터의 개략도는 도 1c에 도시되어 있다. 단일 AtMAR1a를 표 2에 열거된 단일 프라이머(3'에서 클로닝하기 위한 프라이머)를 사용하여 TEV 오메가 인핸서를 갖는 이중 인핸서 CaMV 35S 프로모터로 구성된 프로모터, eGFP 및 StPINII 및 Tnos를 포함하는 탠덤 종결인자를 함유하는 발현 카세트(2x35SΩ-eGFP-StPINII-Tnos)의 3'에서 클로닝하였다.
표 2: AtMAR1a 클로닝을 위한 프라이머
유전자 정방향 프라이머 역방향 프라이머
5'에서 AtMA1a CAGCTATGACCATGATTACAGAGTTGCCGGTGCAAC GCTCCACCATGTTGAGCTCTGATACATAGAACCGCTAG
3'에서 AtMA1a GAGTCGACCTGCAGGCATGCAGAGTTGCCGGTGCAAC GTAAAACGACGGCCAGTGCCTGATACATAGAACCGCTAG
MAR 함유 벡터에서의 발현
P19가 벡터 상에 존재하는 pEAQ-HT 벡터를 제외하고, 종결인자를 갖는 이원 벡터를 함유하는 A. 투메파시엔스를 N. 벤타미아나 잎에 P19 침묵 억제인자를 운반하는 A. 투메파시엔스와 공동-침윤시켰다. 샘플을 채취하고 488 nm의 여기 및 507 nm의 방출을 갖는 형광 플레이트 리더를 사용하여 형광 측정에 의해 eGFP 발현이 모니터링되는 경우, 침윤 후 6일 동안 식물을 성장시켰다. eGFP의 ELISA 정량화는 제조 설명서에 따라 GFP ELISA 키트(Abcam)를 사용하여 수행하였다. 2개의 AtMAR1a 또는 단일 AtMAR1a를 포함하는 벡터는 Tnos 종결인자 및 pEAQ-HT를 포함하는 벡터인 AtMAR1a가 없는 벡터와 비교하여 증가된 형광 강도를 발생시켰다(도 5 및 도 6). AtMAR1a의 첨가는 pEAQ-HT와 비교하여 발현에서 1.3배 초과의 증가 및 2.5배 초과의 증가를 초래하였다(도 5).
서열
SEQUENCE LISTING <110> Leaf Expression Systems LTD <120> Recombinant protein production <130> P34850WO1 <160> 22 <170> PatentIn version 3.5 <210> 1 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> NtPR1a terminator DNA sequence <400> 1 ttgaaacgac ctacgtccat ttcacgttaa tatgtatgga ttgttctgct tgatatcaag 60 aacttaaata attgctctaa aaagcaactt aaagtcaagt atatagtaat agtactatat 120 ttgtaatcct ctgaagtgga tctataaaaa gaccaagtgg tcataattaa ggggaaaaat 180 atgagttgat gatcagcttg atgtatgatc tgatattatt atgaacactt ttgtactcat 240 acgaatcatg tgttgatggt ctagctactt gcgatattac gagcaaaatt cttaactaca 300 tgccttagga acaagcttac acagttcata taatctacta gagggccaaa aacatgaaaa 360 ttaccaattt agatggtagg aggatattga aagtggagca gctagtttta ataactgacc 420 gttagtctta aaattgacgg tataaaaata tttacataat caggtcattt ataaggtaat 480 tataggtaaa tatttatgac gaattctcaa tagtaatctg aaaaaaaatt gtaactaacc 540 tattatacta aaactactat aataggttag attacattaa tcatgtcatt agaagatctt 600 <210> 2 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> NbPINII terminator DNA sequence <400> 2 ttgaaacgac ctacgtccat ttcacgttaa tatgtatgga ttgttctgct tgatatcaag 60 aacttaaata attgctctaa aaagcaactt aaagtcaagt atatagtaat agtactatat 120 ttgtaatcct ctgaagtgga tctataaaaa gaccaagtgg tcataattaa ggggaaaaat 180 atgagttgat gatcagcttg atgtatgatc tgatattatt atgaacactt ttgtactcat 240 acgaatcatg tgttgatggt ctagctactt gcgatattac gagcaaaatt cttaactaca 300 tgccttagga acaagcttac acagttcata taatctacta gagggccaaa aacatgaaaa 360 ttaccaattt agatggtagg aggatattga aagtggagca gctagtttta ataactgacc 420 gttagtctta aaattgacgg tataaaaata tttacataat caggtcattt ataaggtaat 480 tataggtaaa tatttatgac gaattctcaa tagtaatctg aaaaaaaatt gtaactaacc 540 tattatacta aaactactat aataggttag attacattaa tcatgtcatt agaagatctt 600 <210> 3 <211> 634 <212> DNA <213> Artificial Sequence <220> <223> NbWIN1 terminator DNA sequence <400> 3 gaagctatat acatatatat ggccatgttt accctttgac ggcccaaata aaagtaaaag 60 aacgatatgt aaaaggaaaa agaaaataaa gttgctttga ttgggttatg caattccaat 120 atctattcaa gaattaatgt ctttcgtttg ggaagaatga ggtgaagtgt gtattatctt 180 tgtgatttta aataaaaaaa tcacagtggg acagtatttg tgattatatt aggttgctgt 240 tgttgtattt tagtagttat tccttttagt ttttacccaa caccccaatt tgcaaaggat 300 tgcacaagct gagttcacac ctgctacttc caaacacaaa atgtcatcta cataagacaa 360 ctaatgtata taaagcaaaa atagaactac catcttttgg aagagatgta actagaacta 420 gctaggaaat aataacttgg aatatcagaa gaatgtattc cctaggttcg atggatgttt 480 gtattattgc tagaacatat tacatagatt atgaatatta aaataagcgc aggcagattt 540 tgactgaaat tctgaatgga taggactctg gaacattctc aatagtgagg gagttctttt 600 tttttttttt ttttttttaa cttaactgtc aact 634 <210> 4 <211> 633 <212> DNA <213> Artificial Sequence <220> <223> NbPDF1.2 terminator DNA sequence <400> 4 taattgaaat tggattgatg ctatgtatgc ccaaaaaagg gagatatgtg aagtttgtta 60 taataaggcg agagatgtaa attacaccaa taggtgtaag acttctttat attctcggta 120 tgtataactt aaatcatcgt gatagtgcac tcaaactaag tctcttccat aagaataaca 180 aataaataaa taaataaata aaatcttttt ttctttttgt ccaagaaaat aaataaaaac 240 tccacatacg cgacacgatt gccttgacaa atggaagaat attgaaggta gcatgcatgt 300 gaggcaatct tgacgacttc aaaaacttct taagatgttg aatggcatca gaaataacat 360 tttagtatgt gtttacataa gtttcatcac tttgcctaaa aacaaggaag ttgtgagttc 420 gagtcattct aagagcaagg tggagagttc ttcaaaggaa gaatgtcggg gatctatttg 480 gaaacaacct atctacccta tgatacgggt aaggtttgcg tatacactat tcttccagat 540 cccactttta aaattatact agcttgttat tatatttaat tatgttataa atttaagtaa 600 ttaaagaaag acttttgaca tctaagtcta gca 633 <210> 5 <211> 535 <212> DNA <213> Artificial Sequence <220> <223> StPINII terminator DNA sequence <400> 5 ccctagactt gtccatcttc tggattggcc aacttaatta atgtatgaaa taaaaggatg 60 cacacatagt gacatgctaa tcactataat gtgggcatca aagttgtgtg ttatgtgtaa 120 ttactaatta tctgaataag agaaagagat catccatatt tcttatccta aatgaatgtc 180 acgtgtcttt ataattcttt gatgaaccag atgcatttta ttaaccaatt ccatatacat 240 ataaatatta atcatatata attaatatca attgggttag caaaacaaat ctagtctagg 300 tgtgttttgc taattattgg gggatagtgc aaaaagaaat ctacgttctc aataattcag 360 atagaaaact taataaagtg agataattta catagattgc ttttatcctt tgatatatgt 420 gaaaccatgc atgatataag gaaaatagat agagaaataa ttttttacat cgttgaatat 480 gtaaacaatt taattcaaga agctaggaat ataaatattg aggagtttat gatta 535 <210> 6 <211> 551 <212> DNA <213> Artificial Sequence <220> <223> Tnos terminator DNA sequence <400> 6 agaaggagtg cgtcgaagca gatcgttcaa acatttggca ataaagtttc ttaagattga 60 atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg 120 taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 180 cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 240 tatcgcgcgc ggtgtcatct atgttactag atcgatcaaa cttcggcact gtgtaatgac 300 gatgagcaat cgagaggctg actaacaaaa ggtatgccca aaaacaacct ctccaaactg 360 tttcgaattg gaagtttctg ctcatgccga caggcataac ttagatattc gcgggctatt 420 cccactaatt cgtcctgctg gtttgcgcca agataaatca gtgcatctcc ttacaagttc 480 ctctgtcttg tgaaatgaac tgctgactgc cccccaagaa agcctcctca tctcccagtt 540 ggcggcggct g 551 <210> 7 <211> 1922 <212> DNA <213> Artificial Sequence <220> <223> AtMAR1a DNA sequence <400> 7 agagttgccg gtgcaactcc tcccatacca aaatagtgtt ttatcttatt tttaaaatag 60 ataacttttt caacttattt gtttaaaatt ttagcttacg ttacatgtta taataataat 120 taaaaaaaga agaagatata gtaataacat ttgagaagtt gcatttgggt tccatgttta 180 tacattcttc acttctaatg aataacacct tgaaacatcg agtccataat tgaatttagt 240 cttacaatgt tacagacctt caaattgttt ccataaatct ttgaaatatg tcataacaca 300 aaatctgaga gtggtttata attttattag ataagactcg tccaaatatg ctggtgtgag 360 aaatgttgtg atgatataaa aattctaaat agtaatcggt atttttcaaa agaatatttc 420 aattatatac attccatata ccatgccttt actaattata tataatacgg gatttctcaa 480 agtataaaag aaagataaga caaggaaaac atacaacatc tataaaagac gcaccagaca 540 gagcctctca ttgaattttg tggtaaacga atagaactct gtaattgaga aaaaaataaa 600 atgaaataat attaagaaat aaaaagagag acatatttaa gttacaaaat tagaaaatat 660 taaatcacgt attaatattt ttctaaaaca aaatagggaa cttttacttc tgttttgaat 720 atataaacga tttttaatag aatttgttca atattttaat atagtaaata aaaaatttgt 780 atatatgaac tatttttttt acttgtgtat atatccgatg gggttatgaa atttttctat 840 attttgtttt ttaaaaatat agggttttgt gcaaaacacc catctaactc atctagtttt 900 gcaattttac cctatatctc taacaaacac atattaatct tatgaagtct aaaataatac 960 gcaatatgac ccttatacgt atattgtaaa cttttttaca ctcccataga ttagattttt 1020 aatatttcga aggtcgattt gaacttttcg tcgagaaagc ttcgattaaa catattaaat 1080 atcaatatct tacaaaatat tgtcgtagaa aaatgacgaa aaggggttaa attgcgtatt 1140 attttagact tcatcggata attatgcatt ttttggaggt ggagaataaa gatgcaaaaa 1200 tagatgagtt agagggtttt attttgcaca aaaccctaaa aataacaaaa tttgatttga 1260 taagggtgga tatttcacta ataaatttga cacgtgtcat gatcacgtga gttaacaatt 1320 ttgaaagccc aactttatgt agatatttgg cacatatatt ggattatgtt cattgttttc 1380 atgccagatc cgaactgctc ttcccaaccg tttaacccgc tatccagaaa ctcttctcct 1440 ctaagattag tgttaacaag tcatggagaa cctcattgta tagaagtttt acaaactaaa 1500 cctttagatt gattcaaata atttcacgaa gaaaatatta taaatcgatt tatttgttta 1560 aatttggaga tataaaccga tgattgatta attatgtgaa gccattttac ttttattttc 1620 tctttgtagt caatatttct tagttaatgt tacgtgtttc acacatggag tttcaactat 1680 attaaatttc taaaacggct aatcaaatac ctaattaacg tattcaaaga tgttaaatta 1740 aaaaaaatta atatgacagt ttcacatttc aatccatata aataagcaag gattttattg 1800 ttattcatca atcaaaaaca aacgaagcat taagcatata gttgctatac taagactttt 1860 tactcaattt ctcattatgt ctatcaaaaa tgtgttttca cttctagcgg ttctatgtat 1920 ca 1922 <210> 8 <211> 1922 <212> PRT <213> Artificial Sequence <220> <223> NtPR1a protein sequence <400> 8 Ala Gly Ala Gly Thr Thr Gly Cys Cys Gly Gly Thr Gly Cys Ala Ala 1 5 10 15 Cys Thr Cys Cys Thr Cys Cys Cys Ala Thr Ala Cys Cys Ala Ala Ala 20 25 30 Ala Thr Ala Gly Thr Gly Thr Thr Thr Thr Ala Thr Cys Thr Thr Ala 35 40 45 Thr Thr Thr Thr Thr Ala Ala Ala Ala Thr Ala Gly Ala Thr Ala Ala 50 55 60 Cys Thr Thr Thr Thr Thr Cys Ala Ala Cys Thr Thr Ala Thr Thr Thr 65 70 75 80 Gly Thr Thr Thr Ala Ala Ala Ala Thr Thr Thr Thr Ala Gly Cys Thr 85 90 95 Thr Ala Cys Gly Thr Thr Ala Cys Ala Thr Gly Thr Thr Ala Thr Ala 100 105 110 Ala Thr Ala Ala Thr Ala Ala Thr Thr Ala Ala Ala Ala Ala Ala Ala 115 120 125 Gly Ala Ala Gly Ala Ala Gly Ala Thr Ala Thr Ala Gly Thr Ala Ala 130 135 140 Thr Ala Ala Cys Ala Thr Thr Thr Gly Ala Gly Ala Ala Gly Thr Thr 145 150 155 160 Gly Cys Ala Thr Thr Thr Gly Gly Gly Thr Thr Cys Cys Ala Thr Gly 165 170 175 Thr Thr Thr Ala Thr Ala Cys Ala Thr Thr Cys Thr Thr Cys Ala Cys 180 185 190 Thr Thr Cys Thr Ala Ala Thr Gly Ala Ala Thr Ala Ala Cys Ala Cys 195 200 205 Cys Thr Thr Gly Ala Ala Ala Cys Ala Thr Cys Gly Ala Gly Thr Cys 210 215 220 Cys Ala Thr Ala Ala Thr Thr Gly Ala Ala Thr Thr Thr Ala Gly Thr 225 230 235 240 Cys Thr Thr Ala Cys Ala Ala Thr Gly Thr Thr Ala Cys Ala Gly Ala 245 250 255 Cys Cys Thr Thr Cys Ala Ala Ala Thr Thr Gly Thr Thr Thr Cys Cys 260 265 270 Ala Thr Ala Ala Ala Thr Cys Thr Thr Thr Gly Ala Ala Ala Thr Ala 275 280 285 Thr Gly Thr Cys Ala Thr Ala Ala Cys Ala Cys Ala Ala Ala Ala Thr 290 295 300 Cys Thr Gly Ala Gly Ala Gly Thr Gly Gly Thr Thr Thr Ala Thr Ala 305 310 315 320 Ala Thr Thr Thr Thr Ala Thr Thr Ala Gly Ala Thr Ala Ala Gly Ala 325 330 335 Cys Thr Cys Gly Thr Cys Cys Ala Ala Ala Thr Ala Thr Gly Cys Thr 340 345 350 Gly Gly Thr Gly Thr Gly Ala Gly Ala Ala Ala Thr Gly Thr Thr Gly 355 360 365 Thr Gly Ala Thr Gly Ala Thr Ala Thr Ala Ala Ala Ala Ala Thr Thr 370 375 380 Cys Thr Ala Ala Ala Thr Ala Gly Thr Ala Ala Thr Cys Gly Gly Thr 385 390 395 400 Ala Thr Thr Thr Thr Thr Cys Ala Ala Ala Ala Gly Ala Ala Thr Ala 405 410 415 Thr Thr Thr Cys Ala Ala Thr Thr Ala Thr Ala Thr Ala Cys Ala Thr 420 425 430 Thr Cys Cys Ala Thr Ala Thr Ala Cys Cys Ala Thr Gly Cys Cys Thr 435 440 445 Thr Thr Ala Cys Thr Ala Ala Thr Thr Ala Thr Ala Thr Ala Thr Ala 450 455 460 Ala Thr Ala Cys Gly Gly Gly Ala Thr Thr Thr Cys Thr Cys Ala Ala 465 470 475 480 Ala Gly Thr Ala Thr Ala Ala Ala Ala Gly Ala Ala Ala Gly Ala Thr 485 490 495 Ala Ala Gly Ala Cys Ala Ala Gly Gly Ala Ala Ala Ala Cys Ala Thr 500 505 510 Ala Cys Ala Ala Cys Ala Thr Cys Thr Ala Thr Ala Ala Ala Ala Gly 515 520 525 Ala Cys Gly Cys Ala Cys Cys Ala Gly Ala Cys Ala Gly Ala Gly Cys 530 535 540 Cys Thr Cys Thr Cys Ala Thr Thr Gly Ala Ala Thr Thr Thr Thr Gly 545 550 555 560 Thr Gly Gly Thr Ala Ala Ala Cys Gly Ala Ala Thr Ala Gly Ala Ala 565 570 575 Cys Thr Cys Thr Gly Thr Ala Ala Thr Thr Gly Ala Gly Ala Ala Ala 580 585 590 Ala Ala Ala Ala Thr Ala Ala Ala Ala Thr Gly Ala Ala Ala Thr Ala 595 600 605 Ala Thr Ala Thr Thr Ala Ala Gly Ala Ala Ala Thr Ala Ala Ala Ala 610 615 620 Ala Gly Ala Gly Ala Gly Ala Cys Ala Thr Ala Thr Thr Thr Ala Ala 625 630 635 640 Gly Thr Thr Ala Cys Ala Ala Ala Ala Thr Thr Ala Gly Ala Ala Ala 645 650 655 Ala Thr Ala Thr Thr Ala Ala Ala Thr Cys Ala Cys Gly Thr Ala Thr 660 665 670 Thr Ala Ala Thr Ala Thr Thr Thr Thr Thr Cys Thr Ala Ala Ala Ala 675 680 685 Cys Ala Ala Ala Ala Thr Ala Gly Gly Gly Ala Ala Cys Thr Thr Thr 690 695 700 Thr Ala Cys Thr Thr Cys Thr Gly Thr Thr Thr Thr Gly Ala Ala Thr 705 710 715 720 Ala Thr Ala Thr Ala Ala Ala Cys Gly Ala Thr Thr Thr Thr Thr Ala 725 730 735 Ala Thr Ala Gly Ala Ala Thr Thr Thr Gly Thr Thr Cys Ala Ala Thr 740 745 750 Ala Thr Thr Thr Thr Ala Ala Thr Ala Thr Ala Gly Thr Ala Ala Ala 755 760 765 Thr Ala Ala Ala Ala Ala Ala Thr Thr Thr Gly Thr Ala Thr Ala Thr 770 775 780 Ala Thr Gly Ala Ala Cys Thr Ala Thr Thr Thr Thr Thr Thr Thr Thr 785 790 795 800 Ala Cys Thr Thr Gly Thr Gly Thr Ala Thr Ala Thr Ala Thr Cys Cys 805 810 815 Gly Ala Thr Gly Gly Gly Gly Thr Thr Ala Thr Gly Ala Ala Ala Thr 820 825 830 Thr Thr Thr Thr Cys Thr Ala Thr Ala Thr Thr Thr Thr Gly Thr Thr 835 840 845 Thr Thr Thr Thr Ala Ala Ala Ala Ala Thr Ala Thr Ala Gly Gly Gly 850 855 860 Thr Thr Thr Thr Gly Thr Gly Cys Ala Ala Ala Ala Cys Ala Cys Cys 865 870 875 880 Cys Ala Thr Cys Thr Ala Ala Cys Thr Cys Ala Thr Cys Thr Ala Gly 885 890 895 Thr Thr Thr Thr Gly Cys Ala Ala Thr Thr Thr Thr Ala Cys Cys Cys 900 905 910 Thr Ala Thr Ala Thr Cys Thr Cys Thr Ala Ala Cys Ala Ala Ala Cys 915 920 925 Ala Cys Ala Thr Ala Thr Thr Ala Ala Thr Cys Thr Thr Ala Thr Gly 930 935 940 Ala Ala Gly Thr Cys Thr Ala Ala Ala Ala Thr Ala Ala Thr Ala Cys 945 950 955 960 Gly Cys Ala Ala Thr Ala Thr Gly Ala Cys Cys Cys Thr Thr Ala Thr 965 970 975 Ala Cys Gly Thr Ala Thr Ala Thr Thr Gly Thr Ala Ala Ala Cys Thr 980 985 990 Thr Thr Thr Thr Thr Ala Cys Ala Cys Thr Cys Cys Cys Ala Thr Ala 995 1000 1005 Gly Ala Thr Thr Ala Gly Ala Thr Thr Thr Thr Thr Ala Ala Thr 1010 1015 1020 Ala Thr Thr Thr Cys Gly Ala Ala Gly Gly Thr Cys Gly Ala Thr 1025 1030 1035 Thr Thr Gly Ala Ala Cys Thr Thr Thr Thr Cys Gly Thr Cys Gly 1040 1045 1050 Ala Gly Ala Ala Ala Gly Cys Thr Thr Cys Gly Ala Thr Thr Ala 1055 1060 1065 Ala Ala Cys Ala Thr Ala Thr Thr Ala Ala Ala Thr Ala Thr Cys 1070 1075 1080 Ala Ala Thr Ala Thr Cys Thr Thr Ala Cys Ala Ala Ala Ala Thr 1085 1090 1095 Ala Thr Thr Gly Thr Cys Gly Thr Ala Gly Ala Ala Ala Ala Ala 1100 1105 1110 Thr Gly Ala Cys Gly Ala Ala Ala Ala Gly Gly Gly Gly Thr Thr 1115 1120 1125 Ala Ala Ala Thr Thr Gly Cys Gly Thr Ala Thr Thr Ala Thr Thr 1130 1135 1140 Thr Thr Ala Gly Ala Cys Thr Thr Cys Ala Thr Cys Gly Gly Ala 1145 1150 1155 Thr Ala Ala Thr Thr Ala Thr Gly Cys Ala Thr Thr Thr Thr Thr 1160 1165 1170 Thr Gly Gly Ala Gly Gly Thr Gly Gly Ala Gly Ala Ala Thr Ala 1175 1180 1185 Ala Ala Gly Ala Thr Gly Cys Ala Ala Ala Ala Ala Thr Ala Gly 1190 1195 1200 Ala Thr Gly Ala Gly Thr Thr Ala Gly Ala Gly Gly Gly Thr Thr 1205 1210 1215 Thr Thr Ala Thr Thr Thr Thr Gly Cys Ala Cys Ala Ala Ala Ala 1220 1225 1230 Cys Cys Cys Thr Ala Ala Ala Ala Ala Thr Ala Ala Cys Ala Ala 1235 1240 1245 Ala Ala Thr Thr Thr Gly Ala Thr Thr Thr Gly Ala Thr Ala Ala 1250 1255 1260 Gly Gly Gly Thr Gly Gly Ala Thr Ala Thr Thr Thr Cys Ala Cys 1265 1270 1275 Thr Ala Ala Thr Ala Ala Ala Thr Thr Thr Gly Ala Cys Ala Cys 1280 1285 1290 Gly Thr Gly Thr Cys Ala Thr Gly Ala Thr Cys Ala Cys Gly Thr 1295 1300 1305 Gly Ala Gly Thr Thr Ala Ala Cys Ala Ala Thr Thr Thr Thr Gly 1310 1315 1320 Ala Ala Ala Gly Cys Cys Cys Ala Ala Cys Thr Thr Thr Ala Thr 1325 1330 1335 Gly Thr Ala Gly Ala Thr Ala Thr Thr Thr Gly Gly Cys Ala Cys 1340 1345 1350 Ala Thr Ala Thr Ala Thr Thr Gly Gly Ala Thr Thr Ala Thr Gly 1355 1360 1365 Thr Thr Cys Ala Thr Thr Gly Thr Thr Thr Thr Cys Ala Thr Gly 1370 1375 1380 Cys Cys Ala Gly Ala Thr Cys Cys Gly Ala Ala Cys Thr Gly Cys 1385 1390 1395 Thr Cys Thr Thr Cys Cys Cys Ala Ala Cys Cys Gly Thr Thr Thr 1400 1405 1410 Ala Ala Cys Cys Cys Gly Cys Thr Ala Thr Cys Cys Ala Gly Ala 1415 1420 1425 Ala Ala Cys Thr Cys Thr Thr Cys Thr Cys Cys Thr Cys Thr Ala 1430 1435 1440 Ala Gly Ala Thr Thr Ala Gly Thr Gly Thr Thr Ala Ala Cys Ala 1445 1450 1455 Ala Gly Thr Cys Ala Thr Gly Gly Ala Gly Ala Ala Cys Cys Thr 1460 1465 1470 Cys Ala Thr Thr Gly Thr Ala Thr Ala Gly Ala Ala Gly Thr Thr 1475 1480 1485 Thr Thr Ala Cys Ala Ala Ala Cys Thr Ala Ala Ala Cys Cys Thr 1490 1495 1500 Thr Thr Ala Gly Ala Thr Thr Gly Ala Thr Thr Cys Ala Ala Ala 1505 1510 1515 Thr Ala Ala Thr Thr Thr Cys Ala Cys Gly Ala Ala Gly Ala Ala 1520 1525 1530 Ala Ala Thr Ala Thr Thr Ala Thr Ala Ala Ala Thr Cys Gly Ala 1535 1540 1545 Thr Thr Thr Ala Thr Thr Thr Gly Thr Thr Thr Ala Ala Ala Thr 1550 1555 1560 Thr Thr Gly Gly Ala Gly Ala Thr Ala Thr Ala Ala Ala Cys Cys 1565 1570 1575 Gly Ala Thr Gly Ala Thr Thr Gly Ala Thr Thr Ala Ala Thr Thr 1580 1585 1590 Ala Thr Gly Thr Gly Ala Ala Gly Cys Cys Ala Thr Thr Thr Thr 1595 1600 1605 Ala Cys Thr Thr Thr Thr Ala Thr Thr Thr Thr Cys Thr Cys Thr 1610 1615 1620 Thr Thr Gly Thr Ala Gly Thr Cys Ala Ala Thr Ala Thr Thr Thr 1625 1630 1635 Cys Thr Thr Ala Gly Thr Thr Ala Ala Thr Gly Thr Thr Ala Cys 1640 1645 1650 Gly Thr Gly Thr Thr Thr Cys Ala Cys Ala Cys Ala Thr Gly Gly 1655 1660 1665 Ala Gly Thr Thr Thr Cys Ala Ala Cys Thr Ala Thr Ala Thr Thr 1670 1675 1680 Ala Ala Ala Thr Thr Thr Cys Thr Ala Ala Ala Ala Cys Gly Gly 1685 1690 1695 Cys Thr Ala Ala Thr Cys Ala Ala Ala Thr Ala Cys Cys Thr Ala 1700 1705 1710 Ala Thr Thr Ala Ala Cys Gly Thr Ala Thr Thr Cys Ala Ala Ala 1715 1720 1725 Gly Ala Thr Gly Thr Thr Ala Ala Ala Thr Thr Ala Ala Ala Ala 1730 1735 1740 Ala Ala Ala Ala Thr Thr Ala Ala Thr Ala Thr Gly Ala Cys Ala 1745 1750 1755 Gly Thr Thr Thr Cys Ala Cys Ala Thr Thr Thr Cys Ala Ala Thr 1760 1765 1770 Cys Cys Ala Thr Ala Thr Ala Ala Ala Thr Ala Ala Gly Cys Ala 1775 1780 1785 Ala Gly Gly Ala Thr Thr Thr Thr Ala Thr Thr Gly Thr Thr Ala 1790 1795 1800 Thr Thr Cys Ala Thr Cys Ala Ala Thr Cys Ala Ala Ala Ala Ala 1805 1810 1815 Cys Ala Ala Ala Cys Gly Ala Ala Gly Cys Ala Thr Thr Ala Ala 1820 1825 1830 Gly Cys Ala Thr Ala Thr Ala Gly Thr Thr Gly Cys Thr Ala Thr 1835 1840 1845 Ala Cys Thr Ala Ala Gly Ala Cys Thr Thr Thr Thr Thr Ala Cys 1850 1855 1860 Thr Cys Ala Ala Thr Thr Thr Cys Thr Cys Ala Thr Thr Ala Thr 1865 1870 1875 Gly Thr Cys Thr Ala Thr Cys Ala Ala Ala Ala Ala Thr Gly Thr 1880 1885 1890 Gly Thr Thr Thr Thr Cys Ala Cys Thr Thr Cys Thr Ala Gly Cys 1895 1900 1905 Gly Gly Thr Thr Cys Thr Ala Thr Gly Thr Ala Thr Cys Ala 1910 1915 1920 <210> 9 <211> 197 <212> PRT <213> Artificial Sequence <220> <223> NbPINII protein sequence <400> 9 Met Ala Val His Lys Val Ser Phe Leu Ala His Leu Leu Val Leu Gly 1 5 10 15 Ile Phe Leu Leu Leu Val Asp Ala Lys Ala Cys Thr Lys Glu Cys Gly 20 25 30 Asn Phe Ala Tyr Gly Arg Cys Pro Arg Ser Gln Gly Thr Pro Asp Asp 35 40 45 Pro Ile Cys Thr Ser Cys Cys Ala Gly Tyr Lys Gly Cys Asn Tyr Tyr 50 55 60 Asn Ala Asn Gly Thr Phe Ile Cys Glu Gly Leu Ser Asp Pro Arg Lys 65 70 75 80 Pro Asn Phe Cys Pro Leu Phe Cys Asp Pro Asp Ile Ala Tyr Ser Lys 85 90 95 Cys Pro Arg Ser Glu Gly Glu Thr Ile Ile Asn Pro Thr Gly Cys Thr 100 105 110 Thr Cys Cys Thr Gly Tyr Lys Gly Cys Tyr Tyr Phe Gly Gln Asp Gly 115 120 125 Lys Phe Val Cys Glu Gly Glu Ser Asp Glu Pro Lys Ser Cys Thr Thr 130 135 140 Glu Cys Asp Pro Arg Val Ala Tyr Ile Ser Cys Pro Ile Ser Gly Leu 145 150 155 160 Val Lys Ile Asn Gln Glu Cys Ile Asn Cys Cys Asn Ala Asp Lys Gly 165 170 175 Cys Glu Leu Tyr Asp Asn Asp Gly Ser Leu Ile Cys Thr Gly Gly Glu 180 185 190 Pro Gln Ser Ala Ala 195 <210> 10 <211> 208 <212> PRT <213> Artificial Sequence <220> <223> NbWIN1 protein sequence <400> 10 Met Gly Lys Leu Ser Thr Val Leu Leu Ala Leu Ile Leu Phe Ile Ile 1 5 10 15 Ala Ala Gly Ala Asn Ala Gln Gln Cys Gly Arg Gln Arg Gly Gly Ala 20 25 30 Leu Cys Gly Gly Asn Leu Cys Cys Ser Gln Phe Gly Trp Cys Gly Ser 35 40 45 Thr Pro Glu Tyr Cys Ser Pro Ser Gln Gly Cys Gln Ser Gln Cys Ser 50 55 60 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Ala Gln Asn Val 65 70 75 80 Arg Ala Thr Tyr His Ile Tyr Asn Pro Gln Asn Val Gly Trp Asp Leu 85 90 95 Tyr Ala Val Ser Ala Tyr Cys Ser Thr Trp Asp Gly Asn Lys Pro Leu 100 105 110 Ala Trp Arg Arg Lys Tyr Gly Trp Thr Ala Phe Cys Gly Pro Val Gly 115 120 125 Pro Arg Gly Arg Asp Ser Cys Gly Lys Cys Leu Arg Val Thr Asn Thr 130 135 140 Gly Thr Gly Ala Gln Thr Thr Val Arg Ile Val Asp Gln Cys Ser Asn 145 150 155 160 Gly Gly Leu Asp Leu Asp Val Asn Val Phe Arg Gln Leu Asp Thr Asp 165 170 175 Gly Arg Gly Asn Gln Arg Gly His Leu Ile Val Asn Tyr Glu Phe Val 180 185 190 Asn Cys Gly Asp Asn Met Asn Val Leu Val Ser Pro Val Asp Lys Glu 195 200 205 <210> 11 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> NbPDF1.2 protein sequence <400> 11 Met Ala Lys Ser Gln Ile Gln Cys Ala Val Phe Leu Ala Leu Phe Phe 1 5 10 15 Cys Phe Leu Val Ala Ser Thr Glu Met Met Gln Lys Ala Glu Ala Leu 20 25 30 Gly Cys Glu Lys Pro Ser Thr Thr Trp Ser Gly Pro Cys Leu Phe Ser 35 40 45 Asp Asp Cys Asn Asn Gln Cys Ile Asn Trp Glu Gly Ala Val His Gly 50 55 60 Glu Cys Ser Phe Ala Leu Gly Pro Glu Cys Phe Cys Tyr Phe Cys 65 70 75 <210> 12 <211> 3937 <212> DNA <213> Artificial Sequence <220> <223> Expression vector with StPINII-NtPR1a - AtMAR1a DNA sequence <400> 12 caacatggtg gagcacgaca ctctcgtcta ctccaagaat atcaaagata cagtctcaga 60 agaccaaagg gctattgaga cttttcaaca aagggtaata tcgggaaacc tcctcggatt 120 ccattgccca gctatctgtc acttcatcaa aaggacagta gaaaaggaag gtggcaccta 180 caaatgccat cattgcgata aaggaaaggc tatcgttcaa gatgcctctg ccgacagtgg 240 tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg ttccaaccac 300 gtcttcaaag caagtggatt gatgtgataa catggtggag cacgacactc tcgtctactc 360 caagaatatc aaagatacag tctcagaaga ccaaagggct attgagactt ttcaacaaag 420 ggtaatatcg ggaaacctcc tcggattcca ttgcccagct atctgtcact tcatcaaaag 480 gacagtagaa aaggaaggtg gcacctacaa atgccatcat tgcgataaag gaaaggctat 540 cgttcaagat gcctctgccg acagtggtcc caaagatgga cccccaccca cgaggagcat 600 cgtggaaaaa gaagacgttc caaccacgtc ttcaaagcaa gtggattgat gtgatatctc 660 cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata 720 aggaagttca tttcatttgg agaggacacg ctgaaatcac cagtgtattt ttacaacaat 780 taccaacaac aacaaacaac aaacaacatt acaattacta tttacaatgg cgcgccccct 840 agacttgtcc atcttctgga ttggccaact taattaatgt atgaaataaa aggatgcaca 900 catagtgaca tgctaatcac tataatgtgg gcatcaaagt tgtgtgttat gtgtaattac 960 taattatctg aataagagaa agagatcatc catatttctt atcctaaatg aatgtcacgt 1020 gtctttataa ttctttgatg aaccagatgc attttattaa ccaattccat atacatataa 1080 atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag tctaggtgtg 1140 ttttgctaat tattggggga tagtgcaaaa agaaatctac gttctcaata attcagatag 1200 aaaacttaat aaagtgagat aatttacata gattgctttt atcctttgat atatgtgaaa 1260 ccatgcatga tataaggaaa atagatagag aaataatttt ttacatcgtt gaatatgtaa 1320 acaatttaat tcaagaagct aggaatataa atattgagga gtttatgatt attgaaacga 1380 cctacgtcca tttcacgtta atatgtatgg attgttctgc ttgatatcaa gaacttaaat 1440 aattgctcta aaaagcaact taaagtcaag tatatagtaa tagtactata tttgtaatcc 1500 tctgaagtgg atctataaaa agaccaagtg gtcataatta aggggaaaaa tatgagttga 1560 tgatcagctt gatgtatgat ctgatattat tatgaacact tttgtactca tacgaatcat 1620 gtgttgatgg tctagctact tgcgatatta cgagcaaaat tcttaactac atgccttagg 1680 aacaagctta cacagttcat ataatctact agagggccaa aaacatgaaa attaccaatt 1740 tagatggtag gaggatattg aaagtggagc agctagtttt aataactgac cgttagtctt 1800 aaaattgacg gtataaaaat atttacataa tcaggtcatt tataaggtaa ttataggtaa 1860 atatttatga cgaattctca atagtaatct gaaaaaaaat tgtaactaac ctattatact 1920 aaaactacta taataggtta gattacatta atcatgtcat tagaagatct tagctcggta 1980 cccggggatc ctctagagtc gacctgcagg catgcagagt tgccggtgca actcctccca 2040 taccaaaata gtgttttatc ttatttttaa aatagataac tttttcaact tatttgttta 2100 aaattttagc ttacgttaca tgttataata ataattaaaa aaagaagaag atatagtaat 2160 aacatttgag aagttgcatt tgggttccat gtttatacat tcttcacttc taatgaataa 2220 caccttgaaa catcgagtcc ataattgaat ttagtcttac aatgttacag accttcaaat 2280 tgtttccata aatctttgaa atatgtcata acacaaaatc tgagagtggt ttataatttt 2340 attagataag actcgtccaa atatgctggt gtgagaaatg ttgtgatgat ataaaaattc 2400 taaatagtaa tcggtatttt tcaaaagaat atttcaatta tatacattcc atataccatg 2460 cctttactaa ttatatataa tacgggattt ctcaaagtat aaaagaaaga taagacaagg 2520 aaaacataca acatctataa aagacgcacc agacagagcc tctcattgaa ttttgtggta 2580 aacgaataga actctgtaat tgagaaaaaa ataaaatgaa ataatattaa gaaataaaaa 2640 gagagacata tttaagttac aaaattagaa aatattaaat cacgtattaa tatttttcta 2700 aaacaaaata gggaactttt acttctgttt tgaatatata aacgattttt aatagaattt 2760 gttcaatatt ttaatatagt aaataaaaaa tttgtatata tgaactattt tttttacttg 2820 tgtatatatc cgatggggtt atgaaatttt tctatatttt gttttttaaa aatatagggt 2880 tttgtgcaaa acacccatct aactcatcta gttttgcaat tttaccctat atctctaaca 2940 aacacatatt aatcttatga agtctaaaat aatacgcaat atgaccctta tacgtatatt 3000 gtaaactttt ttacactccc atagattaga tttttaatat ttcgaaggtc gatttgaact 3060 tttcgtcgag aaagcttcga ttaaacatat taaatatcaa tatcttacaa aatattgtcg 3120 tagaaaaatg acgaaaaggg gttaaattgc gtattatttt agacttcatc ggataattat 3180 gcattttttg gaggtggaga ataaagatgc aaaaatagat gagttagagg gttttatttt 3240 gcacaaaacc ctaaaaataa caaaatttga tttgataagg gtggatattt cactaataaa 3300 tttgacacgt gtcatgatca cgtgagttaa caattttgaa agcccaactt tatgtagata 3360 tttggcacat atattggatt atgttcattg ttttcatgcc agatccgaac tgctcttccc 3420 aaccgtttaa cccgctatcc agaaactctt ctcctctaag attagtgtta acaagtcatg 3480 gagaacctca ttgtatagaa gttttacaaa ctaaaccttt agattgattc aaataatttc 3540 acgaagaaaa tattataaat cgatttattt gtttaaattt ggagatataa accgatgatt 3600 gattaattat gtgaagccat tttactttta ttttctcttt gtagtcaata tttcttagtt 3660 aatgttacgt gtttcacaca tggagtttca actatattaa atttctaaaa cggctaatca 3720 aatacctaat taacgtattc aaagatgtta aattaaaaaa aattaatatg acagtttcac 3780 atttcaatcc atataaataa gcaaggattt tattgttatt catcaatcaa aaacaaacga 3840 agcattaagc atatagttgc tatactaaga ctttttactc aatttctcat tatgtctatc 3900 aaaaatgtgt tttcacttct agcggttcta tgtatca 3937 <210> 13 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> NbPINII Forward Primer <400> 13 tggacgagct gtacaagtaa ttatttctaa taagtgatc 39 <210> 14 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> NbPINII Reverse Primer <400> 14 ggatccccgg gtaccgagct tcctttcttt tcttctttg 39 <210> 15 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> NbWIN1 Forward Primer <400> 15 ggatccccgg gtaccgagct agttgacagt taagttaa 38 <210> 16 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> NbWIN1 Reverse Primer <400> 16 tggacgagct gtacaagtaa gaagctatat acatatata 39 <210> 17 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> NbPDF1.2 Forward Primer <400> 17 tggacgagct gtacaagtaa taattgaaat tggattgat 39 <210> 18 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> NbPDF1.2 Reverse Primer <400> 18 ggatccccgg gtaccgagct tgctagactt agatgtcaa 39 <210> 19 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AtMA1a at the 5 Forward Primer <400> 19 cagctatgac catgattaca gagttgccgg tgcaac 36 <210> 20 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> AtMA1a at the 5 Reverse Primer <400> 20 gctccaccat gttgagctct gatacataga accgctag 38 <210> 21 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> AtMA1a at the 3 Forward Primer <400> 21 gagtcgacct gcaggcatgc agagttgccg gtgcaac 37 <210> 22 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> AtMA1a at the 3 Reverse Primer <400> 22 gtaaaacgac ggccagtgcc tgatacatag aaccgctag 39

Claims (27)

  1. 스트레스 유도된 식물 유전자 또는 이의 단편 또는 변이체로부터의 핵산 서열을 포함하는 종결인자로서, 단 종결인자는 유전자 솔라눔 투베로섬(Solanum tuberosum) (서열 ID No 5), 아라비돕시스 탈리아나(Arabidopsis thaliana) HSP18.2 및 니코티아나 타바쿰 익스텐신(Nicotiana tabacum extensin)의 종결인자가 아닌, 종결인자.
  2. 제1항에 있어서, 핵산 서열이 서열 ID No 1 내지 4의 서열, 이의 종결인자 상동체, 또는 상기 서열, 상동체의 단편, 또는 상기 서열 ID No 1 내지 4, 상동체 또는 단편에 대해 80% 서열 동일성을 갖는 변이체인, 종결인자.
  3. 제1항 또는 제2항에 있어서, 스트레스 유도된 식물 유전자가 니코티아나 종, 예를 들어, N. 벤타미아나(N. benthamiana) 또는 N.타바쿰(N.tabacum)으로부터 유래되는, 종결인자.
  4. 매트릭스 부착 영역 또는 적어도 300개 염기쌍의 단편 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체를 포함하는 서열 ID no 7의 핵산 서열.
  5. 제1항 내지 제4항 중 어느 한 항에 따른 핵산 서열을 포함하는 발현 벡터.
  6. 제5항에 있어서, 제2 종결인자 서열을 추가로 포함하는, 발현 벡터.
  7. 제5항에 있어서, 서열 ID No 1 내지 6, 상기 서열 ID No 1 내지 6의 상동체, 변이체 및 단편, 및 상기 서열 ID No. 1 내지 6, 상동체, 변이체 및 단편에 대해 80% 동일성을 갖는 종결인자로부터 선택된 2개의 종결인자 서열을 포함하는, 발현 벡터.
  8. 제1항 내지 제3항 중 어느 한 항의 종결인자 및 제4항의 매트릭스 부착 영역을 포함하는 발현 벡터.
  9. 제7항에 있어서, 서열 ID No 1 내지 6, 상기 서열 ID No 1 내지 6의 상동체, 변이체 및 단편, 및 상기 서열 ID No. 1 내지 6, 상동체, 변이체 및 단편에 대해 80% 동일성을 갖는 종결인자로부터 선택된 2개의 종결인자 서열을 포함하는, 발현 벡터.
  10. 제5항 내지 제9항 중 어느 한 항에 있어서, 2개의 매트릭스 부착 영역 서열을 포함하며, 상기 서열은 서열 ID No 7, 서열 ID no 7의 적어도 300개 염기쌍의 단편, 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체로부터 선택되는, 발현 벡터.
  11. 제5항 내지 제10항 중 어느 한 항에 있어서, 폴리펩티드를 인코딩하는 오픈 리딩 프레임 서열을 포함하는, 발현 벡터.
  12. 제11항에 있어서, 프로모터를 포함하는, 발현 벡터.
  13. 제5항 내지 제12항 중 어느 한 항에 있어서, P19와 같은 침묵 억제인자를 추가로 포함하는, 발현 벡터.
  14. 하기 성분을 하기 5' 내지 3' 순서로 포함하는 발현 벡터:
    a. 프로모터 및 임의적으로, 제2 프로모터
    b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
    c. 서열 ID No 6의 종결인자
    d. 서열 ID no 1의 서열의 종결인자
    e. 서열 ID No 7의 매트릭스 부착 영역.
  15. 하기 성분을 하기 5' 내지 3' 순서로 포함하는 발현 벡터:
    a. 프로모터 및 임의적으로, 제2 프로모터
    b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
    c. 서열 ID No 5의 종결인자
    d. 서열 ID no 6의 서열의 종결인자
    e. 서열 ID No 7의 매트릭스 부착 영역.
  16. 제13항에 있어서, 발현 벡터가 카세트의 5'에서 및 카세트의 3' 및 5' 말단 둘 모두에서 서열 ID No: 7의 매트릭스 부착 영역을 포함하는 발현 카세트를 추가로 포함하는, 발현 벡터.
  17. 제13항에 있어서, 발현 벡터가 카세트의 3'에서 서열 ID No: 7의 매트릭스 부착 영역을 포함하는 발현 카세트를 추가로 포함하는, 발현 벡터.
  18. 하기 성분을 하기 5' 내지 3' 순서로 포함하는 발현 벡터:
    a. 프로모터 및 임의적으로, 제2 프로모터
    b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
    c. 서열 ID No 5의 종결인자
    d. 서열 ID no 6의 서열의 종결인자
    e. 서열 ID No 7의 매트릭스 부착 영역.
  19. 하기 성분을 하기 5' 내지 3' 순서로 포함하는 발현 벡터:
    a. 이중 CaMV 35S 프로모터
    b. 타바코 식각 바이러스 오메가 5'UTR(TEV 오메가)
    c. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
    d. 서열 ID No 5의 종결인자
    e. 서열 ID no 6의 서열의 종결인자
    f. 서열 ID No 7의 매트릭스 부착 영역.
  20. 제1항 내지 제4항 중 어느 한 항의 핵산 서열을 함유하는 이종성 숙주.
  21. 제5항 내지 제19항 중 어느 한 항에 따른 벡터로 형질전환된 숙주.
  22. 제20항 또는 제21항에 있어서, 숙주가 비리디플란태(Viridiplantae)로부터 유래된, 숙주.
  23. 관심 단백질의 발현에서의 제1항 내지 제4항의 핵산 또는 제5항 내지 제19항의 벡터의 용도.
  24. 제23항에 있어서, 상기 발현이 일시적 또는 안정적 발현인, 용도.
  25. 안정한 식물 또는 식물 세포의 생산에서의 제1항 내지 제4항의 핵산 또는 제5항 내지 제19항의 벡터의 용도.
  26. 식물 또는 식물 세포에서 단백질을 발현시키는 방법으로서, 식물 숙주 세포를 제5항 내지 제19항 중 어느 한 항에 따른 벡터로 형질전환시키는 단계, 상기 단백질을 발현시키는 단계 및 상기 단백질을 수집하는 단계를 포함하는, 방법.
  27. 제24항에 있어서, 상기 발현이 일시적 발현인, 방법.
KR1020237045030A 2021-05-27 2022-05-26 재조합 단백질 생성 KR20240011835A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB2107598.1 2021-05-27
GBGB2107598.1A GB202107598D0 (en) 2021-05-27 2021-05-27 Recombinant protein production
PCT/GB2022/051350 WO2022248872A1 (en) 2021-05-27 2022-05-26 Recombinant protein production

Publications (1)

Publication Number Publication Date
KR20240011835A true KR20240011835A (ko) 2024-01-26

Family

ID=76741400

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237045030A KR20240011835A (ko) 2021-05-27 2022-05-26 재조합 단백질 생성

Country Status (6)

Country Link
EP (1) EP4347843A1 (ko)
KR (1) KR20240011835A (ko)
CA (1) CA3221453A1 (ko)
GB (1) GB202107598D0 (ko)
IL (1) IL308822A (ko)
WO (1) WO2022248872A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6750381B2 (en) * 1996-03-25 2004-06-15 National Institute Of Agrobiological Sciences Pathogen-resistant plants transformed with a DNA encoding sarcotoxin 1A linked to a signal peptide and a method for production thereof
BR112014002342A2 (pt) * 2011-08-01 2020-11-17 Basf Plant Science Company Gmbh moléculas terminais, método de identificação e isolamento de moléculas terminais, método de produção de moléculas terminais recombinantes, método de produção de plantas ou suas partes com expressão amplificada, construção de expressão recombinante, vetor de expressão recombinante, célula transgênica, planta transgênica ou sua parte, cultivo de células transgênicas, sementes trasngênicas, partes ou material de propagação derivados de uma célula ou planta transgênica ou sua parte, uso da molécula terminal e método de produção de produto agrícola
EP3083967A1 (en) * 2013-12-20 2016-10-26 BASF Plant Science Company GmbH Isolation of terminator sequences causing enhanced transcription
JP6850041B2 (ja) * 2017-05-31 2021-03-31 国立大学法人 筑波大学 植物細胞でのタンパク質発現システム及びその使用
CN112119160A (zh) * 2018-03-02 2020-12-22 亚利桑那州立大学董事会 用于在植物中生产重组蛋白的复制和非复制载体及其使用方法

Also Published As

Publication number Publication date
IL308822A (en) 2024-01-01
EP4347843A1 (en) 2024-04-10
WO2022248872A1 (en) 2022-12-01
GB202107598D0 (en) 2021-07-14
CA3221453A1 (en) 2022-12-01

Similar Documents

Publication Publication Date Title
EP2734623B1 (en) Plants resistant to insect pests
US10202612B2 (en) Compositions, organisms, systems, and methods for expressing a gene product in plants
JPH05508555A (ja) 新規なインベルターゼ遺伝子とその使用
MX2014009113A (es) Composiciones citricas resistentes a patogeno, organismos, sistemas y metodos.
Yevtushenko et al. Transgenic expression of antimicrobial peptides in plants: strategies for enhanced disease resistance, improved productivity, and production of therapeutics
KR20110023485A (ko) 번역 효율 증진용 dna 단편 및 이를 포함하는 재조합 벡터
WO2001007635A1 (en) Bs2 resistance gene
CA3150204A1 (en) METHODS FOR IMPROVING SEED SIZE AND QUALITY
WO2021141082A1 (ja) エンハンサー
EP0784421B1 (en) Pest trap plants and crop protection
CN105585623B (zh) 抗病转TaMYB-KW基因小麦的培育方法及相关生物材料与应用
KR20240011835A (ko) 재조합 단백질 생성
CN105713079A (zh) 蛋白质及其相关生物材料在提高植物产量中的应用
US6025544A (en) Processes for modifying plant flowering behavior
AU751370B2 (en) Improvements relating to protein accumulation
KR20190031881A (ko) 식물 호르몬 aba 유도성 최적화 프로모터 제작 방법 및 이의 용도
CN103614385B (zh) 一个基因kt525在提高植物耐逆性上的应用
CN103031303B (zh) 一种植物叶枕特异表达启动子ProCol1的鉴定和应用
US11319552B2 (en) Methods for improving transformation frequency
CN111217899A (zh) 一个参与桃芳樟醇合成调控的转录因子PpbHLH1及其应用
CN107513532B (zh) 一个梨组成型表达启动子PbTMT4P及其应用
CN114214342B (zh) NtFBA1基因在调控烟草PVY抗性方面的应用
CN102676457A (zh) 一个花特异表达启动子kt631p的功能和应用
Wu et al. Isolation and evaluation of three novel native promoters in Brassica napus
CN114196644A (zh) 一种蛋白棕榈酰化转移酶dhhc16及其在提高水稻耐盐方面的应用