KR20170044742A - 아그로박테리움 투메파시엔스의 유전자-결핍 균주 재조합을 위한 방법 및 조성물 - Google Patents

아그로박테리움 투메파시엔스의 유전자-결핍 균주 재조합을 위한 방법 및 조성물 Download PDF

Info

Publication number
KR20170044742A
KR20170044742A KR1020177008708A KR20177008708A KR20170044742A KR 20170044742 A KR20170044742 A KR 20170044742A KR 1020177008708 A KR1020177008708 A KR 1020177008708A KR 20177008708 A KR20177008708 A KR 20177008708A KR 20170044742 A KR20170044742 A KR 20170044742A
Authority
KR
South Korea
Prior art keywords
ala
leu
gene
arg
gly
Prior art date
Application number
KR1020177008708A
Other languages
English (en)
Inventor
만주 굽타
새라 베넷
산딥 쿠마르
도널드 메를로
나게쉬 사르데사이
Original Assignee
다우 아그로사이언시즈 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다우 아그로사이언시즈 엘엘씨 filed Critical 다우 아그로사이언시즈 엘엘씨
Publication of KR20170044742A publication Critical patent/KR20170044742A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/743Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Agrobacterium; Rhizobium; Bradyrhizobium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

본 개시내용은 모 균주에 비해 RecA 활성이 결핍되어 있는 아그로박테리움 투메파시엔스 균주 (예를 들어 LBA4404)의 생산 및 사용을 위한 신규 조성물 및 방법을 제공한다. 아그로박테리움 투메파시엔스의 다른 유전자-결핍-균주와의 조합이 또한 개시된다. 구체적으로, 2종의 예시적인 s recA 마이너스 균주인 UIA777 (여기서 클로람페니콜 저항성 유전자가 recA 유전자를 파괴함) 및 UIA770 (여기서 카나마이신 저항성 유전자가 recA 유전자를 파괴함)이 제공된다.

Description

아그로박테리움 투메파시엔스의 유전자-결핍 균주 재조합을 위한 방법 및 조성물 {METHODS AND COMPOSITIONS FOR RECOMBINATION A GENE-DEFICIENT STRAINS OF AGROBACTERIUM TUMEFACIENS}
관련 출원에 대한 상호 참조
본 출원은 2015년 9월 4일에 출원된 미국 가출원 일련 번호 62/045,947을 35 USC § 119(e) 하에 우선권 주장하며, 상기 가출원의 전체 개시내용은 본원에 참조로 포함된다.
전자적으로 제출된 서열 목록에 대한 참조
서열 목록의 공식 사본은 2015년 9월 2일에 생성되고 73.9 킬로바이트의 크기를 갖는 파일명 "76018_ST25.txt"의 ASCII 포맷화된 서열 목록으로서 EFS 웹을 통해 전자적으로 제출되고, 본 명세서와 공동으로 출원된다. 이러한 ASCII 포맷화된 문서에 함유된 서열 목록은 본 명세서의 일부이고, 그 전문이 본원에 참조로 포함된다.
식물의 아그로박테리움(Agrobacterium)-매개 형질전환은 식물 세포의 게놈 내 T-가닥의 통합을 유발한다. T-가닥은 프로모터를 관심 유전자에 연결시키도록 정확하게 조작된 유전자 조절 요소 및 3' 비번역 영역 (UTR)으로 구성된 유전자 발현 카세트를 함유한다. 서열은 관심 유전자의 발현을 최적으로 유도하여 단백질을 생산하도록 서로에 대해 정확하게 조작된다. 유전자 조절 요소의 안정성은 관심 유전자의 최적 발현에 중요하다. T-가닥 내에 함유된 폴리뉴클레오티드 서열의 부차적 변형은 관심 유전자의 발현을 감소시키거나 심지어 제거할 수 있다.
아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) (LBA4404) 균주는 식물 세포의 게놈 내에 T-가닥을 통합시키기 위해 통상적으로 사용된다. 문헌 [Ooms, G., Hooykaas, P. J. J., Van Veen, R. J. M., Van Beelen, P., Regensburg-Tuienk, T. J. G., and R. A. Schilperoort (1982 "Octopine Ti-plasmid deletion mutants of Agrobacterium tumefaciens with emphasis on the right side of the T-region." Plasmid 7: 15-29; Hoekema, A., Hirsch, P. R., Hooykaas, P. J. J., and R. A. Schilperoort (1983) "A binary plant vector strategy based on separation of vir- and T-region of the Agrobacterium tumefaciens Ti-plasmid." Nature 303:179-180; 및 de Frammond, A. J., Barton K. A., and M-D. Chilton (1983) "Mini-Ti: a new vector strategy for plant genetic engineering". Biotechnology 1: 262-269]을 참조한다.
지난 30년에 걸쳐 에이. 투메파시엔스 (LBA4404)의 광범위한 사용에도 불구하고, 이러한 균주 내에 형질전환된 플라스미드는 균주 내 형질전환 시에 불안정해지는 것으로 관찰되었다. 유전자 조절 요소, 특히 반복된 그러한 요소는 에이. 투메파시엔스 (LBA4404) 균주 내에 재조합되는 것으로 관찰되었다. 이러한 불안정성은 감소된 식물 형질전환 효율 및 변경되지 않은 T-가닥 서열에 대해 잠재적 트랜스제닉 식물을 철저히 스크리닝할 필요성을 유발한다. 이러한 균주 내에 형질전환된 플라스미드의 불안정성을 고려하면, 재조합 특성을 소유하지 않으며 플라스미드 내에 위치하는 유전 요소의 재배열 없이 플라스미드를 안정하게 유지할 수 있는 아그로박테리움 투메파시엔스 (LBA4404) 균주의 개발에 대한 필요성이 존재한다.
따라서, 개선된 플라스미드 안정성을 갖는 아그로박테리움 투메파시엔스의 균주에 대한 필요성이 남아있다. 특히, 유전자 재조합 경로의 결핍을 갖는 아그로박테리움 투메파시엔스의 균주에 대한 개발이 바람직할 것이다.
본 개시내용은 모 균주에 비해 RecA 활성이 결핍되어 있는 아그로박테리움 투메파시엔스 균주 (예를 들어 LBA4404)의 생산 및 사용을 위한 신규 조성물 및 방법을 제공한다. 아그로박테리움 투메파시엔스의 다른 유전자-결핍-균주와의 조합이 또한 개시된다. 구체적으로, 2종의 예시적인 s recA 마이너스 균주인 UIA777 (여기서 클로람페니콜 저항성 유전자가 recA 유전자를 파괴함) 및 UIA770 (여기서 카나마이신 저항성 유전자가 recA 유전자를 파괴함)이 제공된다.
한 측면에서, 아그로박테리움 투메파시엔스의 변형된 균주이며, 그의 모 균주에 비해 유전자 재조합 경로가 결핍되어 있는 변형된 균주가 제공된다.
한 실시양태에서, 변형된 균주는 RecA, RecB, RecD, RecF, RecG, RecJ, RecN, RecO, RecQ, RecR 및 RecX로 이루어진 군으로부터 선택된 적어도 1종의 재조합 경로가 결핍되어 있다. 또 다른 실시양태에서, 변형된 균주는 RecA 활성이 결핍되어 있다. 추가 실시양태에서, recA 유전자는 서열식별번호(SEQ ID NO): 10 또는 11과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 100% 서열 동일성을 갖는 폴리뉴클레오티드 서열을 포함한다. 또 다른 실시양태에서, 변형된 균주는 또한 RecB, RecD, RecF, RecG, RecJ, RecN, RecO, RecQ, RecR 및 RecX로 이루어진 군으로부터 선택된 활성이 결핍되어 있다.
recA 유전자 및 RecA 단백질 서열은 각각 서열식별번호: 10 및 12에 제시된다. recB 유전자 및 RecB 단백질 서열은 각각 서열식별번호: 13 및 14에 제시된다. recD 유전자 및 RecD 단백질 서열은 각각 서열식별번호: 15 및 16에 제시된다. recF 유전자 및 RecF 단백질 서열은 각각 서열식별번호: 17 및 18에 제시된다. recG 유전자 및 RecG 단백질 서열은 각각 서열식별번호: 19 및 20에 제시된다. recJ 유전자 및 RecJ 단백질 서열은 각각 서열식별번호: 21 및 22에 제시된다. recN 유전자 및 RecN 단백질 서열은 각각 서열식별번호: 23 및 24에 제시된다. recO 유전자 및 RecO 단백질 서열은 각각 서열식별번호: 25 및 26에 제시된다. recQ 유전자 및 RecQ 단백질 서열은 각각 서열식별번호: 27 및 28에 제시된다. recR 유전자 및 RecR 단백질 서열은 각각 서열식별번호: 29 및 30에 제시된다. recX 유전자 및 RecX 단백질 서열은 각각 서열식별번호: 31 및 32에 제시된다.
또 다른 실시양태에서, 게놈 recA 유전자는 recA 유전자에서 서열의 결실, 재배열 또는 삽입에 의해 변형된다. 또 다른 실시양태에서, 게놈 recA 유전자는 recA 유전자 내에 서열을 삽입함으로써 변형되며, 그에 의해 RecA 단백질의 발현을 파괴한다. 추가 실시양태에서, 삽입된 서열은 선택 마커 유전자를 포함한다. 또 다른 실시양태에서, 선택 마커는 클로람페니콜 저항성 유전자, 카나마이신 저항성 유전자, 스펙티노마이신 저항성 유전자, 겐타마이신 저항성 유전자 또는 그의 조합으로 이루어진 군으로부터 선택된 항생제 저항성 유전자를 포함한다. 추가 실시양태에서, 항생제 저항성 유전자는 클로람페니콜 저항성 유전자 또는 카나마이신 저항성 유전자를 포함한다.
변형된 균주의 한 실시양태에서, RecA 활성은 상기 균주로부터 제조된 추출물에서 검출불가능하다. 또 다른 실시양태에서, RecA 단백질은 웨스턴 블롯 분석을 사용하여 검출불가능하다. 또 다른 실시양태에서, RecA mRNA는 노던 블롯 분석을 사용하여 검출불가능하다. 또 다른 실시양태에서, recA 유전자는 서던 블롯 분석을 사용하여 검출불가능하다.
한 실시양태에서, recA 유전자는 서열식별번호: 12의 단백질을 코딩한다. 또 다른 실시양태에서, 균주는 Ti 플라스미드를 포함한다. 추가 실시양태에서, Ti 플라스미드는 pAL4404 Ti 플라스미드를 포함하거나, 또는 pAL4404 Ti 플라스미드로부터 유래된다.
한 실시양태에서, 균주는 2원 플라스미드를 포함한다. 추가 실시양태에서, 2원 플라스미드는 살곤충제 저항성 형질, 제초제 내성 형질, 질소 사용 효율 형질, 물 사용 효율 형질, 영양 품질 형질, DNA 결합 형질, 선택 마커 형질 및 그의 조합으로 이루어진 군으로부터 선택된 농경학적 형질의 유전자를 포함한다. 또 다른 실시양태에서, 균주는 3원 플라스미드를 포함한다. 또 다른 실시양태에서, 모 균주는 아그로박테리움 투메파시엔스 (LBA4404)이다.
또 다른 측면에서, 아그로박테리움 투메파시엔스로부터 변형된 recA 유전자를 포함하는 플라스미드가 제공되며, 여기서 recA 유전자는 변형 전에 서열식별번호: 10 또는 11에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 100% 서열 동일성을 갖고, 변형된 recA 유전자는 RecA 단백질의 발현이 결핍되어 있다.
한 실시양태에서, 변형은 recA 유전자 또는 서열식별번호: 10 또는 11 내 공여자 서열의 삽입을 포함한다. 추가 실시양태에서, 공여자 서열은 선택 마커 유전자를 포함한다. 또 다른 실시양태에서, 선택 마커 유전자는 클로람페니콜 저항성 유전자, 카나마이신 저항성 유전자, 스펙티노마이신 저항성 유전자, 겐타마이신 저항성 유전자 또는 그의 조합으로부터 선택된 항생제 저항성 유전자를 포함한다. 추가 실시양태에서, 항생제 저항성 유전자는 클로람페니콜 저항성 유전자 또는 카나마이신 저항성 유전자를 포함한다. 또 다른 실시양태에서, 공여자 서열의 적어도 한쪽 말단에 서열식별번호: 10 또는 11의 적어도 43개 염기 쌍 단편이 플랭킹되어 있다.
또 다른 측면에서, 모 균주에 비해 유전자 재조합 경로가 결핍되어 있는 아그로박테리움 투메파시엔스 균주를 생성하는 방법이 제공된다. 방법은
(a) recA 유전자에 대해 지시된 녹-아웃 플라스미드를 제공하는 단계;
(b) 녹-아웃 플라스미드를 아그로박테리움 투메파시엔스 균주 내로 도입하는 단계;
(c) 게놈 돌연변이를 포함하는 콜로니를 선택 및 스크리닝하는 단계; 및
(d) recA의 게놈 돌연변이를 갖는 적어도 1종의 돌연변이된 아그로박테리움 투메파시엔스를 확인하는 단계를 포함한다.
한 실시양태에서, recA 유전자는 서열식별번호: 10 또는 11에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 100% 서열 동일성을 갖는다. 또 다른 실시양태에서, 녹 아웃 플라스미드는 게놈 결실, 게놈 재배열, 게놈 삽입 및 그의 조합으로 이루어진 군으로부터 선택된 돌연변이를 유도한다. 추가 실시양태에서, 게놈 삽입은 선택 마커를 코딩하는 서열을 포함한다. 또 다른 실시양태에서, 선택 마커 유전자는 클로람페니콜 저항성 유전자, 카나마이신 저항성 유전자, 스펙티노마이신 저항성 유전자, 겐타마이신 저항성 유전자 또는 그의 조합으로부터 선택된 항생제 저항성 유전자를 포함한다. 추가 실시양태에서, 항생제 저항성 유전자는 클로람페니콜 저항성 유전자 또는 카나마이신 저항성 유전자를 포함한다.
또 다른 측면에서, (a) 상류 게놈 DNA 경계 서열이 플랭킹되어 있는 T-가닥 삽입물 및 (b) 하류 게놈 DNA 경계 서열을 포함하는 트랜스제닉 이벤트이며, 모 균주에 비해 유전자 재조합 경로가 결핍되어 있는 아그로박테리움 투메파시엔스의 변형된 균주로부터의 T-가닥의 통합을 포함하는 트랜스제닉 이벤트가 제공된다.
한 실시양태에서, 아그로박테리움 투메파시엔스의 변형된 균주로부터의 T-가닥은 트랜스제닉 이벤트를 재생시키는데 사용되는 표적화된 식물 세포의 게놈 내에 통합된다. 또 다른 실시양태에서, 트랜스제닉 이벤트는 농경학적 형질을 추가로 포함한다. 추가 실시양태에서, 농경학적 형질은 살곤충제 저항성 형질, 제초제 내성 형질, 질소 사용 효율 형질, 물 사용 효율 형질, 영양 품질 형질, DNA 결합 형질, 선택 마커 형질 및 그의 조합으로 이루어진 군으로부터 선택된다. 또 다른 실시양태에서, 트랜스제닉 이벤트는 쌍자엽 식물 또는 단자엽 식물이다.
또 다른 실시양태에서, 쌍자엽 식물 또는 단자엽 식물은 보리, 카놀라, 커피, 옥수수, 목화, 아마, 포도덩굴, 홉, 겨자, 견과, 귀리, 양귀비, 평지, 벼, 고무 식물, 호밀, 해바라기, 소르굼, 대두, 사탕수수, 차, 담배 및 밀로 이루어진 군으로부터 선택된다. 또 다른 실시양태에서, 쌍자엽 식물 또는 단자엽 식물은 옥수수, 밀, 목화, 벼, 대두 및 카놀라로 이루어진 군으로부터 선택된다. 또 다른 실시양태에서, 쌍자엽 식물 또는 단자엽 식물은 바나나, 파인애플, 감귤, 포도, 수박, 칸탈루프, 머스크멜론 및 다른 멜론, 사과, 복숭아, 배, 체리, 키위, 망고, 승도복숭아, 구아바, 파파야, 감, 석류, 아보카도, 무화과, 감귤 및 장과류로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 트랜스제닉 식물을 생산하는 방법이 제공된다. 방법은
(a) 표적화된 식물 세포를 모 균주에 비해 유전자 재조합 경로가 결핍되어 있는 아그로박테리움 투메파시엔스의 변형된 균주와 접촉시키는 단계;
(b) 표적화된 식물 세포의 게놈 내로 통합된 상기 아그로박테리움 균주로부터의 DNA를 포함하는 식물 세포를 선택 및 스크리닝하는 단계; 및
(c) 단계 (b)에서 선택/스크리닝된 식물 세포로부터 전체 트랜스제닉 식물을 재생시키는 단계를 포함한다.
한 실시양태에서, 선택 단계는 선택 마커를 사용하여 수행된다. 추가 실시양태에서, 선택 마커 유전자는 클로람페니콜 저항성 유전자, 카나마이신 저항성 유전자, 스펙티노마이신 저항성 유전자, 겐타마이신 저항성 유전자 또는 그의 조합으로부터 선택된 항생제 저항성 유전자를 포함한다. 또 다른 추가 실시양태에서, 항생제 저항성 유전자는 클로람페니콜 저항성 유전자 또는 카나마이신 저항성 유전자를 포함한다.
도 1은 recA 돌연변이유발에 사용된 플라스미드의 삽입물 단편 지도를 예시한다. 도 1A는 pWM-RecAnei에서의 recA 유전자 및 그의 이웃 서열을 제시한다. B, pCP-MMSR2에서의 LBA4404로부터의 DNA 단편의 XhoI 제한 지도. C, recA를 항생제 Cm 또는 Km에 대한 저항성을 코딩하는 카세트로 대체.
도 2는 에이. 투메파시엔스 (LBA4404)로부터 recA와 다른 아그로박테리움 균주로부터의 recA 유전자와의 관련성을 예시한다. 계통수는 phyML (월드 와이드 웹 phylogeny.fr에서 이용가능함.)을 사용하여 생성된다 (Dereeper A, Guignon V, Blanc G, Audic S, Buffet S, Chevenet F, Dufayard JF, Guindon S, Lefort V, Lescot M, Claverie JM, Gascuel O. (2008) Phylogeny.fr: robust phylogenetic analysis for the non-specialist. Nucleic Acids Research. 36 (Web Server Issue):W465-9). recA (34-1005 bp)의 내부 969 bp 단편은 이러한 정렬 분석을 수행하는데 사용된다. 다른 균주는 나타낸 바와 같은 아그로박테리움 속 및 관련 분류군에서 대표적인 recA 제노모바르 (G-)로부터 선택된다 (Costechareyre et al., 2010).
도 3은 야생형 및 보완된 균주와 비교하여 2종의 예시적인 에이. 투메파시엔스 (LBA4404) 돌연변이 recA 마이너스 균주 UIA777 및 UIA770의 성장 속도를 예시한다. 이들 검정을 위해 MGL 배지가 사용된다.
도 4는 구축물 내 제아 메이스(Zea mays) 유비퀴틴-1 프로모터의 구축물 설계 및 복제를 제시하는 2원 플라스미드 pDAB108700의 플라스미드 지도를 예시한다.
모 균주에 비해 RecA 활성이 결핍되어 있는 아그로박테리움 투메파시엔스 (LBA4404) 균주의 생산 및 사용을 위한 신규 조성물 및 방법이 본원에 개시된다. 아그로박테리움 투메파시엔스 (LBA4404)의 게놈 내 폴리뉴클레오티드 단편의 통합을 위한 염색체 통합 부위가 추가로 기재된다. 개시된 신규 조성물 및 방법은 식물 종을 사용한 트랜스제닉 이벤트의 생산에 유용하다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 과학 용어는 본 개시내용이 관련된 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 상충하는 경우에, 정의를 포함한 본 출원이 우선할 것이다. 문맥상 달리 요구되지 않는 한, 단수 용어는 복수형을 포함할 것이고, 복수 용어는 단수형을 포함할 것이다. 본원에 언급된 모든 공개, 특허 및 다른 참고문헌은, 특허 또는 특허 공개의 단지 특정 섹션만이 참조로 포함되는 것으로 나타내어지지 않는 한, 각각의 개별 공개 또는 특허 출원이 구체적으로 및 개별적으로 참조로 포함되는 것으로 나타내어지는 경우와 같이, 모든 목적을 위해 그 전문이 참조로 포함된다.
본 개시내용을 추가로 명확하게 하기 위해, 하기 용어, 약어 및 정의가 제공된다.
본원에 사용된 용어 "포함한다", "포함하는", "포괄한다", "포함한", "갖는다", "갖는", "함유한다" 또는 "함유하는", 또는 그의 임의의 다른 변형은 비-배타적이거나 또는 개방형인 것으로 의도된다. 예를 들어, 일련의 요소를 포함하는 조성물, 혼합물, 과정, 방법, 물품 또는 장치는 반드시 그러한 요소에만 제한되는 것은 아니며, 이러한 조성물, 혼합물, 과정, 방법, 물품 또는 장치에 대해 명백히 열거되지 않거나 내재되지 않은 다른 요소를 포함할 수 있다. 추가로, 달리 명백하게 언급되지 않는 한, "또는"은 포함적 논리합을 지칭하며 배타적 논리합을 지칭하지 않는다. 예를 들어, 조건 A 또는 B는 하기 중 어느 하나에 의해 충족된다: A는 참이고 (또는 존재하고) B는 거짓이고 (또는 존재하지 않고), A는 거짓이고 (또는 존재하지 않고) B는 참이고 (또는 존재하고), A 및 B는 둘 다 참이다 (또는 존재한다).
본원에 사용된 "내인성 서열"은 유기체 또는 유기체의 게놈에서 그의 자연 위치에 있는 천연 형태의 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 정의한다.
본원에 사용된 용어 "폴리뉴클레오티드", "핵산" 및 "핵산 분자"는 상호교환가능하게 사용되고, 단수의 핵산; 복수의 핵산; 그의 핵산 단편, 변이체 또는 유도체; 및 핵산 구축물 (예를 들어, 메신저 RNA (mRNA) 및 플라스미드 DNA (pDNA))을 포괄할 수 있다. 폴리뉴클레오티드 또는 핵산은 전장 cDNA 서열의 뉴클레오티드 서열, 또는 비번역 5' 및/또는 3' 서열 및 코딩 서열(들)을 포함한 그의 단편을 함유할 수 있다. 폴리뉴클레오티드 또는 핵산은 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드로 구성될 수 있고, 이는 비변형 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 변형된 리보뉴클레오티드 또는 데옥시리보뉴클레오티드를 포함할 수 있다. 예를 들어, 폴리뉴클레오티드 또는 핵산은 단일- 및 이중-가닥 DNA; 단일- 및 이중-가닥 영역의 혼합물인 DNA; 단일- 및 이중-가닥 RNA; 및 단일- 및 이중-가닥 영역의 혼합물인 RNA로 구성될 수 있다. DNA 및 RNA를 포함하는 하이브리드 분자는 단일-가닥, 이중-가닥, 또는 단일- 및 이중-가닥 영역의 혼합물일 수 있다. 상기 용어는 또한 폴리뉴클레오티드 또는 핵산의 화학적으로, 효소적으로 및 대사적으로 변형된 형태를 포함한다.
특정 DNA는 또한 데옥시리보뉴클레오티드 염기-쌍형성의 규칙에 따라 결정되는 서열을 갖는 그의 상보체를 지칭하는 것으로 이해된다.
본원에 사용된 용어 "유전자"는 기능적 산물 (RNA 또는 폴리펩티드/단백질)을 코딩하는 핵산을 지칭한다. 유전자는 기능적 산물을 코딩하는 서열의 앞 (5' 비-코딩 서열) 및/또는 뒤 (3' 비-코딩 서열)에 조절 서열을 포함할 수 있다.
본원에 사용된 용어 "코딩 서열"은 특정 아미노산 서열을 코딩하는 핵산 서열을 지칭한다. "조절 서열"은 연관된 코딩 서열의 전사, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 주는, 코딩 서열의 상류 (예를 들어, 5' 비-코딩 서열), 그 내부, 또는 하류 (예를 들어, 3' 비-코딩 서열)에 위치하는 뉴클레오티드 서열을 지칭한다. 조절 서열은, 예를 들어 비제한적으로 다음을 포함한다: 프로모터; 번역 리더 서열; 인트론; 폴리아데닐화 인식 서열; RNA 프로세싱 부위; 이펙터 결합 부위; 및 스템-루프 구조.
본원에 사용된 용어 "폴리펩티드"는 단수의 "폴리펩티드", 복수의 "폴리펩티드" 및 그의 단편을 포함한다. 이러한 용어는 아미드 결합 (또한 펩티드 결합으로도 공지됨)에 의해 선형으로 연결된 단량체 (아미노산)로 구성된 분자를 지칭한다. 용어 "폴리펩티드"는 2개 이상의 아미노산의 임의의 쇄 또는 쇄들을 지칭하고, 특정 길이 또는 크기의 산물을 지칭하지 않는다. 따라서, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, 단백질, 아미노산 쇄, 및 2개 이상의 아미노산의 쇄 또는 쇄들을 지칭하기 위해 사용되는 임의의 다른 용어는 "폴리펩티드"의 정의 내에 포함되고, 상기 용어는 본원에서 "폴리펩티드"와 상호교환가능하게 사용된다. 폴리펩티드는 자연 생물학적 공급원으로부터 단리되거나 재조합 기술에 의해 생산될 수 있지만, 특정 폴리펩티드가 반드시 특정 핵산으로부터 번역되는 것은 아니다. 폴리펩티드는, 예를 들어 비제한적으로 화학적 합성을 포함한 임의의 적절한 방식으로 생성될 수 있다.
대조적으로, 용어 "이종"은 참조 (숙주) 유기체 내의 그의 위치에서 정상적으로 발견되지 않는 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 지칭한다. 예를 들어, 이종 핵산은 참조 유기체 내의 상이한 게놈 위치에서 정상적으로 발견되는 핵산일 수 있다. 추가의 예로서, 이종 핵산은 참조 유기체에서 정상적으로 발견되지 않는 핵산일 수 있다. 이종 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 포함하는 숙주 유기체는 이종 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 숙주 유기체 내로 도입함으로써 생산될 수 있다. 특정한 예에서, 이종 폴리뉴클레오티드는 상응하는 천연 폴리뉴클레오티드와 상이한 형태로 공급원 유기체 내로 재도입된 천연 코딩 서열 또는 그의 부분을 포함한다. 특정한 예에서, 이종 유전자는 상응하는 천연 유전자와 상이한 형태로 공급원 유기체 내로 재도입된 천연 코딩 서열 또는 그의 부분을 포함한다. 예를 들어, 이종 유전자는 천연 숙주 내로 재도입된 비-천연 조절 영역을 포함한 키메라 유전자의 부분인 천연 코딩 서열을 포함할 수 있다. 특정한 예에서, 이종 폴리펩티드는 상응하는 천연 폴리펩티드와 상이한 형태로 공급원 유기체 내로 재도입된 천연 폴리펩티드이다.
이종 유전자 또는 폴리펩티드는 키메라 또는 융합 폴리펩티드, 또는 이를 코딩하는 유전자를 생산하기 위해 또 다른 유전자 또는 폴리펩티드에 융합된 기능적 폴리펩티드를 코딩하는 기능적 폴리펩티드 또는 핵산 서열을 포함하는 유전자 또는 폴리펩티드일 수 있다. 특정한 실시양태의 유전자 및 단백질은 구체적으로 예시된 전장 서열 및 이들 서열의 부분, 절편, 단편 (인접 단편 및 전장 분자와 비교하여 내부 및/또는 말단 결실을 포함함), 변이체, 돌연변이체, 키메라 및 융합체를 포함한다.
본원에 사용된 용어 "변형"은 폴리뉴클레오티드에 의해 코딩된 폴리펩티드의 활성을 감소시키거나, 실질적으로 제거하거나 또는 제거하는 본원에 개시된 폴리뉴클레오티드에서의 변화, 뿐만 아니라 폴리펩티드의 활성을 감소시키거나, 실질적으로 제거하거나 또는 제거하는 본원에 개시된 폴리펩티드에서의 변화를 지칭할 수 있다. 대안적으로, 용어 "변형"은 폴리뉴클레오티드에 의해 코딩된 폴리펩티드의 활성을 증가시키거나 또는 증진시키는 본원에 개시된 폴리뉴클레오티드에서의 변화, 뿐만 아니라 폴리펩티드의 활성을 증가시키거나 또는 증진시키는 본원에 개시된 폴리펩티드에서의 변화를 지칭할 수 있다. 이러한 변화는 결실, 돌연변이 (예를 들어, 자발적 돌연변이유발, 무작위 돌연변이유발, 돌연변이유발 유전자에 의해 초래된 돌연변이유발, 또는 트랜스포손 돌연변이유발), 치환, 삽입, 하향-조절, 세포 위치 변경, 폴리뉴클레오티드 또는 폴리펩티드의 상태 변경 (예를 들어, 메틸화, 인산화 또는 유비퀴틴화), 보조인자 제거, 안티센스 RNA/DNA의 도입, 간섭 RNA/DNA의 도입, 화학적 변형, 공유 변형, UV 또는 X선 조사, 상동 재조합, 유사분열 재조합, 프로모터 대체 방법, 및/또는 그의 조합을 포함하나 이에 제한되지는 않는 관련 기술분야에 널리 공지된 방법에 의해 이루어질 수 있다. 어떤 뉴클레오티드 또는 아미노산 잔기가 변형될 수 있는지 결정하는데 있어서의 지침은 특정한 폴리뉴클레오티드 또는 폴리펩티드의 서열을 상동 폴리뉴클레오티드 또는 폴리펩티드, 예를 들어 효모 또는 박테리아의 서열과 비교하고, 높은 상동성 영역 (보존된 영역) 또는 컨센서스 서열 내에서 이루어진 변형의 수를 최대화함으로써 찾을 수 있다.
본원에 사용된 용어 "유도체"는 본 개시내용에 제시된 서열의 변형을 지칭한다. 이러한 변형의 예는 작물 종에서 본원에 개시된 코딩 서열의 기능을 보존하거나, 경미하게 변경하거나 증가시키는, 본원에 개시된 코딩 서열의 핵산 서열에 관련된 1개 이상의 염기의 치환, 삽입 및/또는 결실일 것이다. 이러한 유도체는, 예를 들어 서열 구조를 예측하고 최적화하기 위한 컴퓨터 모델링 기술을 사용하여 관련 기술분야의 통상의 기술자에 의해 용이하게 결정될 수 있다. 따라서 용어 "유도체"는 또한 본원에 개시된 코딩 서열과 실질적인 서열 동일성을 가짐으로써 본 개시내용의 실시양태를 생성하는데 사용하기 위한 개시된 기능성을 가질 수 있는 핵산 서열을 포함한다.
용어 "프로모터"는 핵산 코딩 서열 또는 기능적 RNA의 발현을 제어할 수 있는 DNA 서열을 지칭한다. 예에서, 제어되는 코딩 서열은 프로모터 서열에 대해 3'에 위치한다. 프로모터는 그 전체가 천연 유전자로부터 유래될 수 있거나, 프로모터는 자연에서 발견된 상이한 프로모터로부터 유래된 상이한 요소로 구성될 수 있거나, 또는 프로모터는 심지어 합리적으로 설계된 DNA 절편을 포함할 수 있다. 관련 기술분야의 통상의 기술자는 상이한 프로모터가 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경적 또는 생리학적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 이해한다. 상기 모든 프로모터의 예는 공지되어 있고, 이종 핵산의 발현을 제어하기 위해 관련 기술분야에서 사용된다. 대부분의 시기에 대부분의 세포 유형에서 유전자의 발현을 지시하는 프로모터는 통상적으로 "구성적 프로모터"로 지칭된다. 추가로, 관련 기술분야의 통상의 기술자가 조절 서열의 정확한 경계를 설명하기 위해 시도해왔지만 (많은 경우에서 비성공적임), 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 이해되고 있다. 특정한 핵산의 프로모터 활성은 관련 기술분야의 통상의 기술자에게 친숙한 기술을 사용하여 검정될 수 있다.
용어 "작동가능하게 연결된"은 핵산 서열 중 하나의 기능이 또 다른 것에 의해 영향을 받는, 단일 핵산 상의 핵산 서열들의 회합을 지칭한다. 예를 들어, 프로모터가 코딩 서열의 발현에 영향을 줄 수 있는 경우에 프로모터는 코딩 서열과 작동가능하게 연결된다 (예를 들어, 코딩 서열은 프로모터의 전사 제어 하에 있다). 코딩 서열은 조절 서열에 센스 또는 안티센스 배향으로 작동가능하게 연결될 수 있다.
본원에 사용된 용어 "발현"은 DNA로부터 유래된 센스 (mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭할 수 있다. 발현은 또한 mRNA에서 폴리펩티드로의 번역을 지칭할 수 있다. 본원에 사용된 용어 "과다발현"은 동일한 유전자 또는 관련 유전자의 내인성 발현보다 더 높은 발현을 지칭한다. 따라서, 이종 유전자는 그의 발현이 필적하는 내인성 유전자의 발현보다 더 높은 경우에 "과다발현"된다.
본원에 사용된 용어 "형질전환" 또는 "형질전환시킴"은 유전적으로 안정한 유전을 유발하는, 핵산 또는 그의 단편의 숙주 유기체 내로의 전달 및 통합을 지칭한다. 형질전환 핵산을 함유하는 숙주 유기체는 "트랜스제닉", "재조합" 또는 "형질전환된" 유기체로서 지칭된다.
본원에 사용된 용어 "결합"은 거대분자 사이 (예를 들어, 단백질과 핵산 사이)의 서열-특이적 비-공유 상호작용을 지칭한다. 전체로서의 상호작용이 서열-특이적인 한, 결합 상호작용의 모든 성분이 서열-특이적일 필요는 없다 (예를 들어, DNA 백본 내의 포스페이트 잔기와의 접촉). 이러한 상호작용은 일반적으로 10-6 M-1 이하의 해리 상수 (Kd)를 특징으로 한다. "친화도"는 결합 강도를 지칭한다: 증가된 결합 친화도는 보다 낮은 Kd와 상관관계가 있다.
"결합 단백질"은 또 다른 분자에 비-공유적으로 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어 DNA 분자에 결합하고/거나 (DNA-결합 단백질), RNA 분자에 결합하고/거나 (RNA-결합 단백질), 단백질 분자에 결합할 수 있다 (단백질-결합 단백질). 단백질-결합 단백질의 경우에, 이는 자신에게 결합할 수 있고/있거나 (동종이량체, 동종삼량체 등을 형성), 상이한 단백질 또는 단백질들의 1종 이상의 분자에 결합할 수 있다. 결합 단백질은 1종 초과 유형의 결합 활성을 가질 수 있다. 예를 들어, 아연 핑거 단백질은 DNA-결합 활성, RNA-결합 활성 및 단백질-결합 활성을 갖는다.
본원에 사용된 용어 "플라스미드" 및 "벡터"는 세포의 핵심 대사의 일부가 아닌 1종 이상의 유전자(들)를 보유할 수 있는 염색체외 요소를 지칭한다. 플라스미드 및 벡터는 전형적으로 원형의 이중-가닥 DNA 분자이다. 그러나, 플라스미드 및 벡터는 단일- 또는 이중-가닥 DNA 또는 RNA의 선형 또는 원형 핵산일 수 있고, 프로모터 단편 및 코딩 DNA 서열을 임의의 적절한 3' 비번역 서열과 함께 세포 내로 도입할 수 있는 특유 구축으로 다수의 뉴클레오티드 서열이 연결되거나 재조합된, 본질적으로 임의의 공급원으로부터 유래된 DNA를 보유할 수 있다. 예에서, 플라스미드 및 벡터는 박테리아 숙주에서의 전파를 위한 자율 복제 서열을 포함할 수 있다.
폴리펩티드 및 "단백질"은 본원에서 상호교환가능하게 사용되고, 펩티드 결합을 통해 연결된 2개 이상의 아미노산의 분자 쇄를 포함한다. 용어는 특정 길이의 산물을 지칭하지 않는다. 따라서, "펩티드" 및 "올리고펩티드"는 폴리펩티드의 정의 내에 포함된다. 용어는 폴리펩티드의 번역후 변형, 예를 들어 글리코실화, 아세틸화, 인산화 등을 포함한다. 추가로, 단백질 단편, 유사체, 돌연변이된 또는 변이체 단백질, 융합 단백질 등은 폴리펩티드의 의미 내에 포함된다. 용어는 또한 공지된 단백질 조작 기술을 사용하여 합성되거나 재조합적으로 발현될 수 있음에 따라 1종 이상의 아미노산 유사체 또는 비-정규 또는 비천연 아미노산이 포함된 분자를 포함한다. 추가로, 본 발명의 융합 단백질은 본원에 기재된 바와 같이 널리 공지된 유기 화학 기술에 의해 유도체화될 수 있다.
용어 "융합 단백질"은 단백질이 1종 초과의 모 단백질 또는 폴리펩티드로부터 유래된 폴리펩티드 성분을 포함한다는 것을 나타낸다. 전형적으로, 융합 단백질은, 1종의 단백질로부터의 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열이 상이한 단백질로부터의 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열에 인 프레임으로 부가되고, 임의로는 링커에 의해 이로부터 분리되는 융합 유전자로부터 발현된다. 이어서, 융합 유전자가 재조합 숙주 세포에 의해 단일 단백질로서 발현될 수 있다.
표현 "제어 서열"은 집합적으로 프로모터 서열, 리보솜 결합 부위, 전사 종결 서열, 상류 조절 도메인, 인핸서 등을 지칭하며, 이는 집합적으로 숙주 세포에서 코딩 서열의 전사 및 번역을 제공한다. 목적하는 유전자가 전사 및 번역될 수 있는 한, 이들 제어 서열들 모두가 재조합 벡터 중에 항상 존재할 필요는 없다.
"재조합"은 2개의 DNA 또는 RNA 분자 사이의 DNA 또는 RNA 서열 섹션의 재편성을 지칭한다. "상동 재조합"은 각각의 DNA 분자에 존재하는 상동 또는 상보적 뉴클레오티드 서열에 의해 혼성화되는 2개의 DNA 분자 사이에 일어난다.
용어 "엄격한 조건" 또는 "엄격한 조건 하의 혼성화"는 프로브가 그의 표적 하위서열에 우선적으로 혼성화되고 다른 서열에는 보다 낮은 정도로 혼성화되거나 전혀 혼성화되지 않을 조건을 지칭한다. 핵산 혼성화 실험, 예컨대 서던 및 노던 혼성화와 관련하여 "엄격한 혼성화" 및 "엄격한 혼성화 세척 조건"은 서열 의존성이고, 상이한 환경적 파라미터 하에서 상이하다. 핵산의 혼성화에 대한 광범위한 지침은 문헌 [Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes part I chapter 2 Overview of principles of hybridization and the strategy of nucleic acid probe assays, Elsevier, New York]에서 발견된다. 일반적으로, 고도로 엄격한 혼성화 및 세척 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 융점 (Tm)보다 약 5℃ 더 낮도록 선택된다. Tm은 표적 서열의 50%가 완벽하게 매치된 프로브에 혼성화되는 온도 (정의된 이온 강도 및 pH 하)이다. 매우 엄격한 조건은 특정한 프로브에 대한 Tm과 동일하도록 선택된다.
서던 또는 노던 블롯에서 필터 상에 100개 초과의 상보적 잔기를 갖는 상보적 핵산의 혼성화를 위한 엄격한 혼성화 조건의 예는 42℃에서 1 mg의 헤파린과 함께 50% 포름아미드이고, 이때 혼성화는 밤새 수행된다. 고도로 엄격한 세척 조건의 예는 72℃에서 약 15분 동안 0.15 M NaCl이다. 엄격한 세척 조건의 예는 65℃에서 15분 동안 0.2xSSC 세척이다 (SSC 완충제의 설명에 대해 문헌 [Sambrook et al. (1989) Molecular Cloning--A Laboratory Manual (2nd ed.) Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor Press, NY] 참조). 종종, 고 엄격도 세척에 앞서서, 배경 프로브 신호를 제거하기 위해 저 엄격도 세척이 진행된다. 예를 들어 100개 초과의 뉴클레오티드의 듀플렉스에 대한 중간 엄격도 세척 예는 45℃에서 15분 동안 1xSSC이다. 예를 들어 100개 초과의 뉴클레오티드의 듀플렉스에 대한 저 엄격도 세척 예는 40℃에서 15분 동안 4-6xSSC이다. 일반적으로, 신호 대 잡음 비가 특정한 혼성화 검정에서 비관련 프로브에 대해 관찰되는 것보다 2x (또는 그 초과)라는 것은 특이적 혼성화의 검출을 나타낸다. 핵산이 코딩하는 폴리펩티드가 실질적으로 동일하다면, 엄격한 조건 하에서 서로 혼성화되지 못하는 핵산도 여전히 실질적으로 동일하다. 이는, 예를 들어 유전자 코드에 의해 허용되는 최대 코돈 축중성을 사용하여 핵산 카피가 생성되는 경우에 일어난다.
본 개시내용은 또한 엄격한 조건, 바람직하게는 고도로 엄격한 조건 하에서 본 개시내용의 것과 같은 폴리뉴클레오티드에 혼성화가능한 단리된 폴리뉴클레오티드에 관한 것이다.
본원에 사용된 용어 "혼성화"는 서로에 대해 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 보다 바람직하게는 적어도 약 80%, 보다 더 바람직하게는 적어도 약 85% 내지 90%, 가장 바람직하게는 적어도 95% 상동인 뉴클레오티드 서열이 전형적으로 서로에 대해 혼성화된 채로 남아있는 혼성화 및 세척을 위한 조건을 기재하는 것으로 의도된다.
한 실시양태에서, 본 개시내용의 핵산은 본 출원에 제시된 핵산 서열 또는 그의 상보체에 대해 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과 상동이다.
엄격한 혼성화 조건의 또 다른 비제한적 예는 약 45℃에서 6x 염화나트륨/시트르산나트륨 (SSC) 중에서 혼성화, 이어서 50℃, 바람직하게는 55℃, 보다 바람직하게는 60℃, 보다 더 바람직하게는 65℃에서 1xSSC, 0.1% SDS 중에서 1회 이상의 세척이다.
고도로 엄격한 조건은 표지된 DNA 프로브, 예컨대 디곡시게닌 (DIG)-표지된 DNA 프로브를 사용하여 42℃에서 수일의 기간 동안, 예컨대 2-4일 동안 인큐베이션, 이어서 실온에서 2xSSC, 0.1% SDS 중에서 1회 이상의 세척 및 65-68℃에서 0.5xSSC, 0.1% SDS 또는 0.1xSSC, 0.1% SDS 중에서 1회 이상의 세척을 포함할 수 있다. 특히, 고도로 엄격한 조건은, 예를 들어 용액, 예컨대 100 μg/ml 연어 정자 DNA를 함유하거나 함유하지 않는 DigEasyHyb 용액 (로슈 다이아그노스틱스 게엠베하(Roche Diagnostics GmbH), 독일 68298 만하임), 또는 50% 포름아미드, 5xSSC (150 mM NaCl, 15 mM 시트르산삼나트륨), 0.02% 소듐 도데실 술페이트, 0.1% N-라우로일사르코신 및 2% 차단 시약 (로슈 다이아그노스틱스 게엠베하)을 포함하는 용액 중에서 (예를 들어 DIG 표지 시스템 (로슈 다이아그노스틱스 게엠베하)을 사용하여 제조된) DIG-표지된 DNA 프로브를 사용하여 42℃에서 2시간 내지 4일 동안 인큐베이션, 이어서 실온에서 2xSSC 및 0.1% SDS 중에서 5 내지 15분 동안 2회 필터 세척, 이어서 65-68℃에서 0.5xSSC 및 0.1% SDS 또는 0.1xSSC 및 0.1% SDS 중에서 15-30분 동안 2회 세척을 포함한다.
일부 실시양태에서, 고도로 엄격한 조건 하에서 본 개시내용의 뉴클레오티드 서열에 혼성화되는 본 개시내용의 단리된 핵산 분자는 자연 발생 핵산 분자에 상응할 수 있다. 본원에 사용된 "자연 발생" 핵산 분자는 자연에서 발생하는 (예를 들어, 자연 단백질을 코딩하는) 뉴클레오티드 서열을 갖는 RNA 또는 DNA 분자를 지칭한다.
통상의 기술자는 어떤 조건이 엄격한 및 고도로 엄격한 혼성화 조건에 적용되는지를 알고 있을 것이다. 이러한 조건에 관한 추가의 지침은 관련 기술분야, 예를 들어 문헌 [Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y.; 및 Ausubel et al. (eds.), 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.)]에서 용이하게 이용가능하다. 용어 "상동성" 또는 "퍼센트 동일성"은 본원에서 상호교환가능하게 사용된다. 본 개시내용의 목적상, 본원에서 2개의 아미노산 서열 또는 2개의 핵산 서열의 퍼센트 동일성을 결정하기 위해, 서열들은 최적의 비교 목적으로 정렬되는 것으로 정의된다 (예를 들어, 제2 아미노산 서열 또는 핵산 서열과의 최적의 정렬을 위해 제1 아미노산 서열 또는 핵산 서열의 서열에 갭이 도입될 수 있음). 이어서, 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드를 비교한다. 제1 서열에서의 한 위치가 제2 서열에서의 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유되어 있는 경우에, 분자는 그 위치에서 동일하다. 2개의 서열 사이의 퍼센트 동일성은 서열이 공유하고 있는 동일한 위치의 수에 관한 함수이다 (즉, % 동일성 = 동일한 위치의 수/총 위치의 수 (즉, 중첩 위치) x 100). 바람직하게, 2개의 서열은 동일한 길이이다.
통상의 기술자는 2개의 서열 사이의 상동성을 결정하는데 여러 상이한 컴퓨터 프로그램이 이용가능하다는 사실을 알고 있을 것이다. 예를 들어, 2개의 서열 사이의 서열의 비교 및 퍼센트 동일성의 결정은 수학적 알고리즘을 사용함으로써 달성될 수 있다. 바람직한 실시양태에서, 2개의 아미노산 서열 사이의 퍼센트 동일성은 블로섬(Blossom) 62 매트릭스 또는 PAM250 매트릭스 및 갭 가중치 16, 14, 12, 10, 8, 6 또는 4 및 길이 가중치 1, 2, 3, 4, 5 또는 6을 사용하는 GCG 소프트웨어 패키지 (인터넷 상에서 엑셀리스 월드 와이드 웹 accelrys.com에서 이용가능함) 내의 GAP 프로그램 내에 혼입된 문헌 [Needleman and Wunsch (J. Mol. Biol. (48): 444-453 (1970))]의 알고리즘을 사용하여 결정된다. 통상의 기술자는 모든 이들 상이한 파라미터가 약간 상이한 결과를 생성할 것이지만, 2개의 서열의 전체 백분율 동일성은 상이한 알고리즘을 사용하는 경우에 유의하게 변경되지 않는다는 것을 인지할 것이다.
또 다른 실시양태에서, 2개의 뉴클레오티드 서열 사이의 퍼센트 동일성은 NWSgapdna.CMP 매트릭스 및 갭 가중치 40, 50, 60, 70 또는 80 및 길이 가중치 1, 2, 3, 4, 5 또는 6을 사용하는 GCG 소프트웨어 패키지 (인터넷 상에서 엑셀리스 월드 와이드 웹 accelrys.com에서 이용가능함) 내의 GAP 프로그램을 사용하여 결정된다. 또 다른 실시양태에서, 2개의 아미노산 또는 뉴클레오티드 서열 사이의 퍼센트 동일성은 PAM120 가중치 잔기 표, 갭 길이 페널티 12 및 갭 페널티 4를 사용하는 ALIGN 프로그램 (버전 2.0) (인터넷 상에서 베가 웹사이트, 보다 구체적으로 ALIGN - IGH 몽펠리어(Montpellier), 또는 보다 구체적으로 http://vega.igh.cnrs.fr/bin/align-guess.cgi에서 이용가능함) 내에 혼입된 문헌 [E. Meyers and W. Miller (CABIOS, 4: 11-17 (1989)]의 알고리즘을 사용하여 결정된다.
본 개시내용의 핵산 및 단백질 서열은 추가로, 예를 들어 다른 패밀리 구성원 또는 관련 서열을 확인하기 위해, 공공 데이터베이스에 대한 검색을 수행하기 위한 "질의 서열"로서 사용될 수 있다. 이러한 검색은 문헌 [Altschul, et al. (1990) J. Mol. Biol. 215:403-10]의 BLASTN 및 BLASTX 프로그램 (버전 2.0)을 사용하여 수행될 수 있다. BLAST 뉴클레오티드 검색은 본 개시내용의 핵산 분자에 상동인 뉴클레오티드 서열을 수득하기 위해 BLASTN 프로그램, 점수=100, 워드 길이=12를 사용하여 수행될 수 있다. BLAST 단백질 검색은 본 개시내용의 단백질 분자에 상동인 아미노산 서열을 수득하기 위해 BLASTX 프로그램, 점수=50, 워드 길이=3을 사용하여 수행될 수 있다. 비교 목적으로 갭이 있는 정렬을 수득하기 위해, 문헌 [Altschul et al., (1997) Nucleic Acids Res. 25 (17): 3389-3402]에 기재된 바와 같이 갭드(Gapped) BLAST가 이용될 수 있다. BLAST 및 갭드 BLAST 프로그램을 이용하는 경우에, 각각의 프로그램 (예를 들어, BLASTX 및 BLASTN)의 디폴트 파라미터가 사용될 수 있다. (인터넷 상에서 ncbi 웹사이트에서, 예를 들어 월드 와이드 웹 ncbi.nlm.nih.gov에서 이용가능함).
본원에 사용된 용어 "키메라"는 "재조합된" 서열로 구성된 것을 의미한다. 예를 들어 서열은 "재조합되고" 함께 자연에서 발견되지 않는다.
본원에 사용된 용어 "재조합한다"는 폴리뉴클레오티드를 연결하는 임의의 방법을 지칭한다. 용어는 말단 대 말단 연결 및 한 서열의 또 다른 서열 내로의 삽입을 포함한다. 용어는 점착성-말단 라이게이션 및 평활-말단 라이게이션과 같은 물리적 연결 기술을 포괄하도록 의도된다. 이러한 서열은 또한 재조합된 서열을 함유하도록 인공적으로 또는 재조합적으로 합성될 수 있다.
본 발명을 위한 적합한 식물은 꽃, 과일, 채소, 육묘, 잔디 및 관상 작물로 이루어진 군으로부터 선택될 수 있다. 추가의 실시양태에서, 과일은 아몬드, 사과, 아보카도, 바나나, 장과류 (딸기, 블루베리, 라즈베리, 블랙베리, 커런트 및 다른 유형의 장과류를 포함함), 카람볼라, 체리, 감귤 (오렌지, 레몬, 라임, 만다린, 그레이프프루트 및 다른 감귤을 포함함), 코코넛, 무화과, 포도, 구아바, 키위, 망고, 승도복숭아, 멜론 (칸탈루프, 머스크멜론, 수박 및 다른 멜론을 포함함), 올리브, 파파야, 패션푸르트, 복숭아, 배, 감, 파인애플, 자두 및 석류로 이루어진 군으로부터 선택된다. 추가 실시양태에서, 채소는 아스파라거스, 비트 (예를 들어 사탕무 및 사료용 비트), 콩, 브로콜리, 양배추, 당근, 카사바, 콜리플라워, 셀러리, 오이, 가지, 마늘, 저킨, 녹색잎 채소 (상추, 케일, 시금치 및 다른 녹색잎 채소), 리크, 렌틸, 버섯, 양파, 완두, 고추 (예를 들어 단고추, 종고추 또는 매운 고추), 감자, 호박, 고구마, 강낭콩, 스쿼시 및 토마토로 이루어진 군으로부터 선택된다. 또 다른 실시양태에서, 육묘 식물 또는 꽃 또는 꽃 일부는 안개꽃, 카네이션, 달리아, 수선화, 제라늄, 거베라, 백합, 난초, 작약, 야생 당근, 장미, 금어초 또는 다른 절화 또는 관상 꽃, 화분 꽃, 꽃 구근, 관목, 낙엽수 또는 침엽수로 이루어진 군으로부터 선택된다.
Ti 플라스미드 - 일부 실시양태에서, RecA 활성이 결핍되어 있는 아그로박테리움 투메파시엔스 (LBA4404)는 Ti 플라스미드를 포함한다. Ti 플라스미드 (또한 헬퍼 플라스미드로도 공지됨)는 T-DNA 영역의 생산 및 전달을 위해 필요한 vir 영역을 포함한다. Ti 플라스미드 (예를 들어, pAL4404, pTiBo542, pTiC58 [및 공통 유도체 pTi15955], pTiAch5 또는 pTiChry5)는, 다른 유전자 특색 중에서, 옥토핀 합성 유전자, 종양유전자, 병독성 유전자 (이하에서 vir 유전자) 및 T-가닥에 플랭킹하고 있는 불완전 반복 T-DNA 경계 서열을 포함한다. 식물 형질전환을 위한 아그로박테리움 균주에 사용되는 대부분의 Ti 플라스미드는 무력화된다. 따라서, 야생형, 병독성 아그로박테리움 균주의 T-가닥 내에 위치한 vir 및 onc 유전자 영역은 제거되거나 돌연변이되었다. 그러나, T-DNA 경계는 남아있고, 우측과 좌측 T-DNA 경계 사이에 폴리뉴클레오티드 서열을 포함하도록 변형된다. 무력화된 Ti 플라스미드는 여전히 식물 게놈 DNA 내에 T-가닥을 형질전환시킬 수 있지만, T-가닥은 야생형 및 병독성 T-가닥에서 발견된 종양원성 특성을 감소시키거나 제거하도록 변형된다. 한 실시양태에서, 폴리뉴클레오티드 서열을 재배열, 돌연변이, 결실, 부가, 역전 또는 전위시키도록 변형된 야생형 및 병독성 Ti 플라스미드는 Ti 플라스미드 유도체로서 본원에서 지칭된다. 한 실시양태에서, T-DNA 영역은 농경학적 형질을 발현하는 적어도 1종의 유전자 발현 카세트를 함유하도록 변형되었다. 기능적 vir 유전자를 갖고 있으며 모든 또는 실질적으로 모든 T-영역 및 연관된 요소가 결여되어 있는 이러한 Ti-유래 플라스미드는 한 실시양태로서 본원에 제공된다.
후속 실시양태에서, Ti 플라스미드는 pTiBo542 플라스미드이다. 한 실시양태에서, Ti 플라스미드는 pTiBo542 플라스미드의 유도체이다 (문헌 [Hood, E. E.; Helmer, G. C.; Fraley, R. T.; Chilton, M. D. The hypovirulence of Agrobacterium tumefaciens A281 is encoded in the region of PtiB0542 outside the T-DNA. J. Bacteriol. 168:1291-1301; 1986], 그 전문이 본원에 참조로 포함됨). 후속 실시양태에서, Ti 플라스미드는 pTiC58 플라스미드이다 (문헌 [Holsters et al., The Functional Organization of the Nopaline A. tumefaciens plasmid pTiC58. Plasmid 3(2); 212-230, 1980], 그 전문이 본원에 참조로 포함됨). 한 실시양태에서, Ti 플라스미드는 pTiC58 플라스미드의 유도체이다. 후속 실시양태에서, Ti 플라스미드는 pTiAch5 플라스미드이다 (문헌 [Gielen, J.; De Beuckeleer, M.; Seurinck , J.; Deboeck F.; De Greve H.; Lemmers, M.; Van Montagu M.; Schell J. The Complete Nucleotide Sequence of the TL-DNA of the Agrobacterium tumefaciens plasmid pTiAch5. The EMBO Journal. 3(4):835-846; 1984], 그 전문이 본원에 참조로 포함됨). 한 실시양태에서, Ti 플라스미드는 pTiAch5 플라스미드의 유도체이다. 후속 실시양태에서, Ti 플라스미드는 pTiChry5 플라스미드이다 (문헌 [Kovacs L.G.; Pueppke S.G. Mapping and Genetic Organization of pTiChry5, a Novel Ti Plasmid from a Highly Virulent Agrobacterium tumefaciens Strain, Mol Gen Genet 242(3):327-336, 1994], 그 전문이 본원에 참조로 포함됨). 한 실시양태에서, Ti 플라스미드는 pTiChry5 플라스미드의 유도체이다. 후속 실시양태에서, Ti 플라스미드는 pTi15995 플라스미드이다 (문헌 [Barker, R.F., Idler, K.B., Thompson, D.V. and Kemp, J.D. Nucleotide sequence of the T-DNA region from the Agrobacterium tumefaciens octopine Ti plasmid pTi15955, Plant Mol. Biol. 2 (6), 335-350, 1983], 그 전문이 본원에 참조로 포함됨). 한 실시양태에서, Ti 플라스미드는 pTi15995 플라스미드의 유도체이다. 추가 실시양태에서, Ti 플라스미드는 pAL4404 플라스미드의 유도체이다 (문헌 [van der Fits et al., (2000) Plant Molec. Biol. 43:495-502], 그 전문이 본원에 참조로 포함됨).
2원 벡터 - 일부 실시양태에서, RecA 활성이 결핍되어 있는 아그로박테리움 투메파시엔스 (LBA4404)는 2원 벡터를 포함한다. 다른 실시양태에서, 제2 플라스미드는 2원 벡터이다. 2원 벡터의 비제한적 예는 다음을 포함한다; pBIN 2원 벡터 (문헌 [Bevan M (1984) Binary Agrobacterium vectors for plant transformation. Nucleic Acids Res 12: 8711-872], 그 전문이 본원에 참조로 포함됨), pGA 2원 벡터 (문헌 [An G (1987) Binary Ti vectors for plant transformation and promoter analysis. Methods Enzymol 153: 292-305 An G, Watson BD, Stachel S, Gordon MP, Nester EW (1985) New cloning vehicles for transformation of higher plants. EMBO J 4: 277-284], 그 전문이 본원에 참조로 포함됨), SEV 2원 벡터 (문헌 [Fraley RT, Rogers SG, Horsch RB, Eichholtz DA, Flick JS, Fink CL, Hoffmann NL, Sanders PR (1985) The SEV system: a new disarmed Ti plasmid vector system for plant transformation. Biotechnology (N Y) 3: 629-635], 그 전문이 본원에 참조로 포함됨), pEND4K 2원 벡터 (문헌 [Klee HJ, Yanofsky MF, Nester EW (1985) Vectors for transformation of higher plants. Biotechnology (N Y) 3: 637-642], 그 전문이 본원에 참조로 포함됨), pBI 2원 벡터 (문헌 [Jefferson RA, Kavanagh TA, BevanMW (1987) GUS fusions: b-glucuronidase as a sensitive and versatile gene fusion marker in higher plants. EMBO J 6:3901-3907], 그 전문이 본원에 참조로 포함됨), pCIB10 2원 벡터 (문헌 [Rothstein SJ, Lahners KN, Lotstein RJ, Carozzi NB, Jayne SM, Rice DA (1987) Promoter cassettes, antibiotic-resistance genes, and vectors for plant transformation. Gene 53: 153-161], 그 전문이 본원에 참조로 포함됨), pMRK63 2원 벡터 (문헌 [Vilaine F, Casse-Delbart F (1987) A new vector derived from Agrobacterium rhizogenes plasmids: a micro-Ri plasmid and its use to construct a mini-Ri plasmid. Gene 55: 105-114], 그 전문이 본원에 참조로 포함됨), pGPTV 2원 벡터 (문헌 [Becker D (1990) binary vectors which allow the exchange of plant selectable markers and reporter genes. Nucleic Acids Res 18: 203], 그 전문이 본원에 참조로 포함됨), pCGN1547 2원 벡터 (문헌 [McBride KE, Summerfelt KR (1990) Improved binary vectors for Agrobacterium-mediated plant transformation. Plant Mol Biol 14: 269-276], 그 전문이 본원에 참조로 포함됨), pART 2원 벡터 (문헌 [Gleave AP (1992) A versatile binary vector system with a T-DNA organizational structure conducive to efficient integration of cloned DNA into the plant genome. Plant Mol Biol 20: 1203-1207], 그 전문이 본원에 참조로 포함됨), pGKB5 2원 벡터 (문헌 [Bouchez D, Camilleri C, Caboche M(1993) A binary vector based on Basta resistance for in planta transformation of Arabidopsis thaliana. C R Acad Sci Ser III Sci Vie 316: 1188-1193], 그 전문이 본원에 참조로 포함됨), pMJD80 2원 벡터 (문헌 [Day MJD, Ashurst JL, Dixon RA (1994) Plant expression cassettes forenhanced translational efficiency. Plant Mol Biol Rep 12: 347-357], 그 전문이 본원에 참조로 포함됨), pMJD81 2원 벡터 (문헌 [Day MJD, Ashurst JL, Dixon RA (1994) Plant expression cassettes forenhanced translational efficiency. Plant Mol Biol Rep 12: 347-357], 그 전문이 본원에 참조로 포함됨), pPZP 2원 벡터 (문헌 [Hajdukiewicz P, Svab Z, Maliga P (1994) The small, versatile pPZP family of Agrobacterium binary vectors for plant transformation. Plant Mol Biol 25: 989-994], 그 전문이 본원에 참조로 포함됨), pBINPLUS 2원 벡터 (문헌 [van Engelen FA,Molthoff JW, Conner AJ, Nap JP, Pereira A, StiekemaWJ (1995) pBINPLUS: an improved plant transformation vector based on pBIN19. Transgenic Res 4: 288-290], 그 전문이 본원에 참조로 포함됨), pRT100 2원 벡터 (문헌 [Uberlacker B, Werr W (1996) Vectors with rare-cutter restriction enzyme sites for expression of open reading frames in transgenic plants. Mol Breed 2: 293-295], 그 전문이 본원에 참조로 포함됨), pCB 2원 벡터 (문헌 [Xiang C, Han P, Lutziger I, Wang K, Oliver DJ (1999) A mini binary vector series for plant transformation. Plant Mol Biol 40: 711-717], 그 전문이 본원에 참조로 포함됨), pGreen 2원 벡터 (문헌 [Hellens RP, Edwards EA, Leyland NR, Bean S, Mullineaux PM (2000) pGreen: a versatile and flexible binary Ti vector for Agrobacteriummediated plant transformation. Plant Mol Biol 42: 819-832], 그 전문이 본원에 참조로 포함됨), pPZP-RCS2 2원 벡터 (문헌 [Goderis IJWM, De BolleMFC, Francois IEJA,Wouters PFJ, BroekaertWF, Cammue BPA (2002) A set of modular plant transformation vectors allowing flexible insertion of up to six expression units. Plant Mol Biol 50: 17-27], 그 전문이 본원에 참조로 포함됨), pMDC 2원 벡터 (문헌 [Curtis MD, Grossniklaus U (2003) A gateway cloning vector set for highthroughput functional analysis of genes in planta. Plant Physiol 133: 462-469], 그 전문이 본원에 참조로 포함됨), pRCS2 2원 벡터 (문헌 [Chung SM, Frankman EL, Tzfira T (2005) A versatile vector system for multiple gene expression in plants. Trends Plant Sci 10: 357-361], 그 전문이 본원에 참조로 포함됨), pEarleyGate 2원 벡터 (문헌 [Earley KW, Haag JR, Pontes O, Opper K, Juehne T, Song K, Pikaard CS (2006) Gateway-compatible vectors for plant functional genomics and proteomics. Plant J 45: 616-629], 그 전문이 본원에 참조로 포함됨), pGWTAC 2원 벡터 (문헌 [Chen QJ, Zhou HM, Chen J, Wang XC (2006) A Gateway-based platform for multigene plant transformation. Plant Mol Biol 62: 927-936], 그 전문이 본원에 참조로 포함됨), pORE 2원 벡터 (문헌 [Coutu C, Brandle J, Brown D, Brown K, Miki B, Simmonds J, Hegedus DD (2007) pORE: A modular binary vector series suited for both monocot and dicot plant transformation. Transgenic Res 16: 771-781], 그 전문이 본원에 참조로 포함됨), pSITE 2원 벡터 (문헌 [Chakrabarty R, Banerjee R, Chung SM, Farman M, Citovsky V, Hogenhout SA, Tzfira T, Goodin M (2007) pSITE vectors for stable integration or transient expression of autofluorescent protein fusions in plants: probing Nicotiana benthamiana-virus interactions. Mol Plant Microbe Interact 20: 740-750], 그 전문이 본원에 참조로 포함됨), pMSP 2원 벡터 (문헌 [Lee LY, Kononov ME, Bassuner B, Frame BR, Wang K, Gelvin SB (2007) Novel plant transformation vectors containing the superpromoter. Plant Physiol 145: 1294-1300], 그 전문이 본원에 참조로 포함됨), pCAMBIA 2원 벡터 (http://www.cambia.org/daisy/cambia/materials/vectors), 및 pGD 2원 벡터 (문헌 [Goodin MM, Dietzgen RG, Schichnes D, Ruzin S, Jackson AO (2002) pGD vectors: versatile tools for the expression of green and red fluorescent protein fusions in agroinfiltrated plant leaves. Plant J 31: 375-383], 그 전문이 본원에 참조로 포함됨). 그 전문이 본원에 참조로 포함된 것을 참조한다. 2원 벡터는 일반적으로 다수의 중요한 특색, 예컨대 T-DNA 경계 서열, 에스케리키아 콜라이(Escherichia coli) 및 아그로박테리움 균주 둘 다에 기능적인 복제 기점, pTi/pRi 플라스미드 및/또는 아그로박테리움 게놈이 보유하는 다른 항생제 저항성과 상용성인 항생제 저항성 유전자, 및 식물 형질전환 효율을 개선시키는 다른 특색 (예를 들어, 오버드라이브 서열)을 함유한다. 2원 벡터의 추가의 특색은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 예를 들어 2원 플라스미드/벡터 의 상기 기재된 특색 중 다수를 개시하는 문헌 [Lee and Gelvin (2008) Plant Physiology, 146;325-332] (본원에 참조로 포함됨)을 참조한다.
3원 벡터 - 일부 실시양태에서, RecA 활성이 결핍되어 있는 아그로박테리움 투메파시엔스 (LBA4404)는 3원 벡터를 포함한다. pTil5955로부터의 구성적 돌연변이 virGN54D 유전자의 카피가 무력화된 Ti 헬퍼 플라스미드 pAL4404 및 식물 형질전환을 위한 유전자를 보유하는 2원 벡터를 함유한 아그로박테리움 투메파시엔스 균주 LBA4404에서의 pBBRl-유래 플라스미드 상에 공존하는 "3원" (즉, 3-플라스미드) 벡터가 기재되었다. 문헌 [van der Fits et al., (2000) Plant Molec. Biol. 43:495-502] (그 전문이 본원에 참조로 포함됨)을 참조한다. 3원 벡터의 추가의 비제한적 예는, Ti 헬퍼 플라스미드를 보유하는 아그로박테리움 세포에 존재하는 경우에 3원 플라스미드 시스템의 추가의 예를 구성하는 코스미드 2원 벡터 및 "부스터" 플라스미드를 기재하는 유럽 특허 출원 번호 2042602A1 및 미국 특허 출원 번호 2010/0132068A1에 추가로 상세하게 기재되어 있다 (그 전문이 본원에 참조로 포함됨). 최종적으로, 국제 특허 출원 번호 2012016222A2는 아그로박테리움에 사용하기 위한 3원 플라스미드 시스템을 기재한다 (그 전문이 본원에 참조로 포함됨).
플라스미드 - 일부 실시양태에서, recA 유전자를 포함하는 플라스미드는 본 개시내용의 한 실시양태이다. 플라스미드는 플라스미드에 함유된 서열에 기초하여 비상용성 군으로 배정된다 (유전자형 표기: inc; 군 표기: Inc). inc 결정기는 전형적으로 동일하거나 관련된 비상용성 군의 다른 플라스미드가 동일한 숙주에 공존하지 않도록 하는 역할을 하고, 세포 내에서 특정 카피수의 플라스미드를 유지하는데 도움을 준다. 예를 들어, 문헌 [Fernandez-Lopez, et al. (2006) FEMS Microbiol. Rev. 30:942-66; 및 Adamczyk and Jagura-Burdzy (2003) Acta Biochim. Pol. 50:425-53]을 참조한다. 2개의 플라스미드는 그들 중 어느 하나가 그 혼자 존재할 때보다 다른 것의 존재 하에서 덜 안정한 경우에 비상용성이다. 동일한 비상용성 군의 2개의 플라스미드가 동일한 세포에서 발견되는 경우에 세포 자원에 대한 경쟁이 일어날 수 있다. 어느 플라스미드든 보다 빠르게 복제할 수 있는 것 또는 일부 다른 이점을 제공하는 것은 비상용성 시스템에 의해 허용되는 카피 중에서 불균등화 정도로 나타내어질 것이다. 놀랍게도, 플라스미드는 둘 다가 그 스스로를 딸세포로 분할하는 동일한 기능을 소유하고 있을 때에도 또한 비상용성일 수 있다.
플라스미드는 전형적으로 많은 기존 비상용성 군 중 단지 하나에만 속한다. 30개 초과의 비상용성 군이 공지되어 있다. 비상용성 군 IncP에 속하는 플라스미드가 철저히 연구되었고, 이러한 IncP 군으로부터 유래된 다수의 플라스미드가 구축되었다 (Schmidhauser et al. (1988) Biotechnology 10:287-332). IncP 비상용성 군에 함유되는 예시적인 플라스미드는 다음을 포함한다: pMP90RK, pRK2013, pRK290, pRK404 및 pRK415. 이들 플라스미드는 이. 콜라이 및 아그로박테리움 투메파시엔스를 포함한 수많은 박테리아 종에서 유지될 수 있다. 다른 비상용성 군의 예는 다음을 포함하나 이에 제한되지는 않는다: IncN, IncW, IncL/M, IncT, IncU, IncW, IncY, IncB/O, IncFII, IncII, IncK, IncCom9, IncFI, IncFII, IncFIII, IncHIl, IncHI2, IncX, IncA/C, IncD, IncFIV, IncFV/FO, IncFVI, IncHl 3, IncHII, Inc12, IncI, IncJ, IncV, IncQ 등 (예를 들어 실질적인 서열 또는 기능적 관계를 나타내는 그의 변이체를 포함함).
추가로, 본원에 기재된 방법을 사용하여 식물 세포를 형질전환시키는데 사용되는 적합한 플라스미드는 항생제 또는 제초제에 대한 저항성을 형질전환된 식물 세포에 부여하는 단백질을 코딩하는 선택 마커 유전자를 함유할 수 있다. 따라서, 개별적으로 사용되는 선택 마커 유전자는 형질전환된 세포의 선택을 허용할 수 있고 반면에 삽입된 DNA를 함유하지 않는 세포의 성장은 선택적 화합물에 의해 억제될 수 있다. 사용되는 특정한 선택 마커 유전자(들)는 실험 설계 또는 선호도에 좌우될 수 있지만, 하기 선택 마커 중 임의의 것, 뿐만 아니라 본원에 열거되어 있지는 않지만 선택 마커로서 기능할 수 있는 임의의 다른 유전자가 사용될 수 있다. 선택 마커의 예는 항생제, 예컨대 카나마이신, G418, 히그로마이신, 블레오마이신 및 메토트렉세이트, 또는 제초제, 예컨대 포스피노트리신 (비알라포스), 글리포세이트, 이미다졸리논, 술포닐우레아, 트리아졸로피리미딘, 클로로술푸론, 브로목시닐 및 달라폰에 대한 저항성 또는 내성을 제공하는 유전자를 포함하나 이에 제한되지는 않는다.
농경학적 형질을 코딩하는 유전자 발현 카세트 - 후속 실시양태에서, 식물 세포는 상기 세포로부터 식물을 재생시키기 위해 선택된다. 본 개시내용의 추가 실시양태에서, T-DNA는 농경학적 형질을 코딩하는 유전자 발현 카세트를 함유한다. 추가의 실시양태에서, 농경학적 형질은 범용 제품을 생산한다.
한 실시양태에서, 본 개시내용은 식물 게놈 내에 삽입된 1종 이상의 유전자 발현 카세트의 도입에 관한 것이다. 일부 실시양태에서, 유전자 발현 카세트는 코딩 서열을 포함한다. 코딩 서열은, 예를 들어 농경학적 형질을 부여하는 유전자를 코딩할 수 있다. 추가 실시양태에서, 농경학적 형질은 살곤충제 저항성 형질, 제초제 내성 형질, 질소 사용 효율 형질, 물 사용 효율 형질, 영양 품질 형질, DNA 결합 형질 및 선택 마커 형질로 이루어진 군으로부터 선택된다. 추가의 실시양태에서, 농경학적 형질은 식물 내에 발현된다. 본 개시내용의 한 실시양태는 1종 이상의 농경학적 형질을 포함하는 식물을 포함한다.
일부 실시양태에서, 트랜스제닉 식물은 유전자 발현 카세트를 포함한다. 본원에 사용된 바와 같은 유전자 발현 카세트의 구축을 위한 표준 재조합 DNA 및 분자 클로닝 기술은 관련 기술분야에 널리 공지되어 있으며, 예를 들어 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989); 및 Silhavy et al., Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1984); 및 Ausubel et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc. and Wiley-Interscience (1987)]에 기재되어 있다.
식물에서 유전자의 발현을 지시하는 다수의 프로모터가 유전자 발현 카세트에 사용될 수 있다. 이러한 프로모터는 구성적, 화학적-조절, 유도성, 조직-특이적 및 종자-선호 프로모터로부터 선택될 수 있다. 핵산의 발현을 지시하는데 사용되는 프로모터는 특정한 적용에 좌우된다. 예를 들어, 숙주 세포에 적합화된 강한 구성적 프로모터는 발현되는 단백질의 발현 및 정제에 전형적으로 사용된다.
바람직한 식물 프로모터의 비제한적 예는 에이. 탈리아나(A. thaliana) 유비퀴틴-10 (ubi-10) (Callis, et al., 1990, J. Biol. Chem., 265:12486-12493); 에이. 투메파시엔스 만노핀 신타제 (Δmas) (Petolino et al., 미국 특허 번호 6,730,824); 및/또는 카사바 베인 모자이크 바이러스 (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139)로부터 유래된 프로모터 서열을 포함한다. 다른 구성적 프로모터는, 예를 들어 코어 콜리플라워 모자이크 바이러스 35S 프로모터 (Odell et al. (1985) Nature 313:810-812); 벼 액틴 프로모터 (McElroy et al. (1990) Plant Cell 2:163-171); 메이즈 유비퀴틴 프로모터 (미국 특허 번호 5,510,474; Christensen et al. (1989) Plant Mol. Biol. 12:619-632 및 Christensen et al. (1992) Plant Mol. Biol. 18:675-689); pEMU 프로모터 (Last et al. (1991) Theor. Appl. Genet. 81:581-588); ALS 프로모터 (미국 특허 번호 5,659,026); 메이즈 히스톤 프로모터 (Chaboute et al. Plant Molecular Biology, 8:179-191 (1987)) 등을 포함한다.
다른 유용한 식물 프로모터는 조직 특이적 및 유도성 프로모터를 포함한다. 유도성 프로모터는 유도인자에 반응하여 1종 이상의 DNA 서열 또는 유전자의 전사를 직접적으로 또는 간접적으로 활성화시킬 수 있는 것이다. 유도인자의 부재 하에, DNA 서열 또는 유전자는 전사되지 않을 것이다. 전형적으로, 전사를 활성화시키기 위해 유도성 조절 요소에 특이적으로 결합하는 단백질 인자는 불활성 형태로 존재하며, 이는 나중에 유도인자에 의해 활성 형태로 직접적으로 또는 간접적으로 전환된다. 유도인자는 화학적 작용제, 예컨대 단백질, 대사물, 성장 조절제, 제초제 또는 페놀계 화합물, 또는 열, 저온, 염 또는 독성 요소에 의해 직접적으로 또는 병원체 또는 질병원, 예컨대 바이러스의 작용을 통해 간접적으로 부여되는 생리학적 스트레스일 수 있다. 전형적으로, 전사를 활성화시키기 위해 유도성 조절 요소에 특이적으로 결합하는 단백질 인자는 불활성 형태로 존재하며, 이는 나중에 유도인자에 의해 활성 형태로 직접적으로 또는 간접적으로 전환된다. 유도인자는 화학적 작용제, 예컨대 단백질, 대사물, 성장 조절제, 제초제 또는 페놀계 화합물, 또는 열, 저온, 염 또는 독성 요소에 의해 직접적으로 또는 병원체 또는 질병원, 예컨대 바이러스의 작용을 통해 간접적으로 부여되는 생리학적 스트레스일 수 있다. 유도성 조절 요소를 함유하는 식물 세포는 분무, 살수, 가열 또는 유사 방법과 같은 것에 의해 세포 또는 식물에 유도인자를 외부적으로 적용함으로써 유도인자에 노출될 수 있다.
임의의 유도성 프로모터가 본 개시내용의 실시양태에 사용될 수 있다. 문헌 [Ward et al., Plant Mol. Biol. 22: 361-366 (1993)]을 참조한다. 예시적인 유도성 프로모터는 엑디손 수용체 프로모터 (미국 특허 번호 6,504,082); 구리에 반응하는 ACE1 시스템으로부터의 프로모터 (Mett et al., Proc. Natl. Acad. Sci. 90: 4567-4571 (1993)); 벤젠술폰아미드 제초제 완화제에 반응하는 메이즈로부터의 In2-1 및 In2-2 유전자 (미국 특허 번호 5,364,780; Hershey et al., Mol. Gen. Genetics 227: 229-237 (1991) 및 Gatz et al., Mol. Gen. Genetics 243: 32-38 (1994)); Tn10으로부터의 Tet 리프레서 (Gatz et al., Mol. Gen. Genet. 227: 229-237 (1991)); 또는 전사 활성이 글루코코르티코스테로이드 호르몬에 의해 유도되는 스테로이드 호르몬 유전자로부터의 프로모터 (Schena et al., Proc. Natl. Acad. Sci. U.S.A. 88: 10421 (1991) 및 McNellis et al., (1998) Plant J. 14(2):247-257); 출아전 제초제로서 사용되는 소수성 친전자성 화합물에 의해 활성화되는 메이즈 GST 프로모터 (미국 특허 번호 5,965,387 및 국제 특허 출원, 공개 번호 WO 93/001294 참조); 및 살리실산에 의해 활성화되는 담배 PR-1a 프로모터 (문헌 [Ono S, Kusama M, Ogura R, Hiratsuka K., "Evaluation of the Use of the Tobacco PR-1a Promoter to Monitor Defense Gene Expression by the Luciferase Bioluminescence Reporter System," Biosci Biotechnol Biochem. 2011 Sep 23;75(9):1796-800] 참조)를 포함한다. 다른 관심 화학적-조절 프로모터는 테트라시클린-유도성 및 테트라시클린-억제성 프로모터를 포함한다 (예를 들어 문헌 [Gatz et al., (1991) Mol. Gen. Genet. 227:229-237] 및 미국 특허 번호 5,814,618 및 5,789,156 참조).
다른 관심 조절성 프로모터는, 각각 저온 또는 열에 대한 노출에 반응하여 전사가 일어날 수 있는 저온 반응성 조절 요소 또는 열 쇼크 조절 요소 (Takahashi et al., Plant Physiol. 99:383-390, 1992); 혐기성 조건에 의해 유도될 수 있는 알콜 데히드로게나제 유전자의 프로모터 (Gerlach et al., PNAS USA 79:2981-2985 (1982); Walker et al., PNAS 84(19):6624-6628 (1987)); 및 완두 rbcS 유전자 또는 완두 psaDb 유전자로부터 유래된 광-유도성 프로모터 (Yamamoto et al., (1997) Plant J. 12(2):255-265); 광-유도성 조절 요소 (Feinbaum et al., Mol. Gen. Genet. 226:449, 1991; Lam and Chua, Science 248:471, 1990; Matsuoka et al. (1993) Proc. Natl. Acad. Sci. USA 90(20):9586-9590; Orozco et al. (1993) Plant Mol. Bio. 23(6):1129-1138), 식물 호르몬 유도성 조절 요소 (Yamaguchi-Shinozaki et al., Plant Mol. Biol. 15:905, 1990; Kares et al., Plant Mol. Biol. 15:225, 1990) 등을 포함한다. 유도성 조절 요소는 또한 벤젠술폰아미드 제초제 완화제에 반응하는 메이즈 In2-1 또는 In2-2 유전자의 프로모터 (Hershey et al., Mol. Gen. Gene. 227:229-237, 1991; Gatz et al., Mol. Gen. Genet. 243:32-38, 1994) 및 트랜스포손 Tn10의 Tet 리프레서 (Gatz et al., Mol. Gen. Genet. 227:229-237, 1991)일 수 있다. 스트레스 유도성 프로모터는 염/물 스트레스-유도성 프로모터, 예컨대 P5CS (Zang et al., (1997) Plant Sciences 129:81-89); 저온-유도성 프로모터, 예컨대 cor15a (Hajela et al., (1990) Plant Physiol. 93:1246-1252), cor15b (Wilhelm et al., (1993) Plant Mol Biol 23:1073-1077), wsc1 (Ouellet et al., (1998) FEBS Lett. 423-324-328), ci7 (Kirch et al., (1997) Plant Mol Biol. 33:897-909), ci21A (Schneider et al., (1997) Plant Physiol. 113:335-45); 가뭄-유도성 프로모터, 예컨대 Trg-31 (Chaudhary et al., (1996) Plant Mol. Biol. 30:1247-57), rd29 (Kasuga et al., (1999) Nature Biotechnology 18:287-291); 삼투 유도성 프로모터, 예컨대 Rab17 (Vilardell et al., (1991) Plant Mol. Biol. 17:985-93) 및 오스모틴 (Raghothama et al., (1993) Plant Mol Biol 23:1117-28); 및 열 유도성 프로모터, 예컨대 열 쇼크 단백질 (Barros et al., (1992) Plant Mol. 19:665-75; Marrs et al., (1993) Dev. Genet. 14:27-41), smHSP (Waters et al., (1996) J. Experimental Botany 47:325-338), 및 파슬리 유비퀴틴 프로모터로부터의 열-쇼크 유도성 요소 (WO 03/102198)를 포함한다. 다른 스트레스-유도성 프로모터는 rip2 (미국 특허 번호 5,332,808 및 미국 공개 번호 2003/0217393) 및 rd29a (Yamaguchi-Shinozaki et al., (1993) Mol. Gen. Genetics 236:331-340)를 포함한다. 아그로박테리움 pMAS 프로모터 (Guevara-Garcia et al., (1993) Plant J. 4(3):495-505) 및 아그로박테리움 ORF13 프로모터 (Hansen et al., (1997) Mol. Gen. Genet. 254(3):337-343)를 포함한 특정 프로모터는 상처에 의해 유도될 수 있다.
조직-선호 프로모터는 특정한 식물 조직 내에서의 증진된 전사 및/또는 발현을 표적화하는데 이용될 수 있다. 우선적인 발현을 언급하는 경우에, 특정한 식물 조직에서의 발현 수준이 다른 식물 조직에서보다 더 높다는 것을 의미한다. 이들 유형의 프로모터의 예는 종자 선호 발현, 예컨대 파세올린 프로모터 (Bustos et al., (1989) The Plant Cell Vol. 1, 839-853) 및 메이즈 글로불린-1 유전자 (Belanger, et al. (1991) Genetics 129:863-972)에 의해 제공되는 것을 포함한다. 쌍자엽의 경우, 종자-선호 프로모터는 콩 β-파세올린, 나핀, β-콘글리시닌, 대두 렉틴, 크루시페린 등을 포함하나 이에 제한되지는 않는다. 단자엽의 경우, 종자-선호 프로모터는 메이즈 15 kDa 제인, 22 kDa 제인, 27 kDa 제인, γ-제인, 왁시, 슈렁큰 1, 슈렁큰 2, 글로불린 1 등을 포함하나 이에 제한되지는 않는다. 종자-선호 프로모터는 또한 종자 내의 특정 조직에 우세하게 유전자 발현을 지시하는 프로모터, 예컨대 예를 들어 γ-제인의 내배유-선호 프로모터, 담배로부터의 잠재 프로모터 (Fobert et al., (1994) T-DNA tagging of a seed coat-specific cryptic promoter in tobacco. Plant J. 4: 567-577), 메이즈로부터의 P-유전자 프로모터 (Chopra et al., (1996) Alleles of the maize P gene with distinct tissue specificities encode Myb-homologous proteins with C-terminal replacements. Plant Cell 7:1149-1158, Erratum in Plant Cell.1997, 1:109), 메이즈로부터의 글로불린-1 프로모터 (Belenger and Kriz (1991) Molecular basis for Allelic Polymorphism of the maize Globulin-1 gene. Genetics 129: 863-972), 및 메이즈 커넬의 종피 또는 껍질에 대한 발현을 지시하는 프로모터, 예를 들어 과피-특이적 글루타민 신테타제 프로모터 (Muhitch et al., (2002) Isolation of a Promoter Sequence From the Glutamine Synthetase1-2 Gene Capable of Conferring Tissue-Specific Gene Expression in Transgenic Maize. Plant Science 163:865-872)를 포함한다.
프로모터 이외에도, 유전자 발현 카세트 (예를 들어 벡터에 존재할 수 있음)는 전형적으로 원핵 또는 진핵 숙주 세포에서의 핵산의 발현에 요구되는 모든 추가의 요소를 함유하는 전사 단위 또는 발현 카세트를 함유한다. 따라서, 전형적인 발현 카세트는 유전자 산물 (예를 들어 단백질)을 코딩하는 핵산 서열에 작동가능하게 연결된 프로모터를 함유한다. 유전자 발현 카세트는 또한 관련 기술분야에 공지된 방법에 따라 작동가능하게 연결되는 추가의 요소를 포함할 수 있다: 전사체의 효율적인 폴리아데닐화, 전사 종결, 리보솜 결합 부위 또는 번역 종결에 요구되는 신호. 추가로, 발현 카세트는 인핸서 및/또는 이종 스플라이싱 신호를 포함할 수 있다.
유전자 발현 카세트의 다른 성분이 실시양태로서 제공된다. 예는 선택 마커, 표적화 또는 조절 서열, 통과 펩티드 서열, 예컨대 최적화된 통과 펩티드 서열 (미국 특허 번호 5,510,471 참조), 안정화 서열, 예컨대 RB7 MAR (문헌 [Thompson and Myatt, (1997) Plant Mol. Biol., 34: 687-692] 및 국제 특허 공개 번호 WO9727207 참조) 또는 리더 서열, 인트론 등을 포함한다. 식물 발현 벡터 및 리포터 유전자에 대한 일반적 설명 및 예는 문헌 [Gruber, et al., "Vectors for Plant Transformation" in Methods in Plant Molecular Biology and Biotechnology, Glick et al. eds; CRC Press pp. 89-119 (1993)]에서 찾을 수 있다. 적절한 발현 벡터의 선택은 숙주, 및 숙주 내로의 발현 벡터의 도입 방법에 좌우될 것이다. 유전자 발현 카세트는 또한 관심 이종 뉴클레오티드 서열의 3' 말단에 식물에서 기능적인 전사 및 번역 종결 영역을 포함할 것이다. 종결 영역은 본 개시내용의 실시양태의 프로모터 뉴클레오티드 서열 고유의 것일 수 있거나, 관심 DNA 서열 고유의 것일 수 있거나, 또는 또 다른 공급원으로부터 유래될 수 있다. 편리한 종결 영역은 에이. 투메파시엔스의 Ti-플라스미드로부터 이용가능하며, 예컨대 옥토핀 신타제 및 노팔린 신타제 (nos) 종결 영역이 있다 (Depicker et al., Mol. and Appl. Genet. 1:561-573 (1982) 및 Shaw et al. (1984) Nucleic Acids Research vol. 12, No. 20 pp7831-7846(nos)); 또한 문헌 [Guerineau et al. Mol. Gen. Genet. 262:141-144 (1991); Proudfoot, Cell 64:671-674 (1991); Sanfacon et al. Genes Dev. 5:141-149 (1991); Mogen et al. Plant Cell 2:1261-1272 (1990); Munroe et al. Gene 91:151-158 (1990); Ballas et al., Nucleic Acids Res. 17:7891-7903 (1989); Joshi et al. Nucleic Acid Res. 15:9627-9639 (1987)]을 참조한다.
유전자 발현 카세트는 추가로 5' 리더 서열을 함유할 수 있다. 이러한 리더 서열은 번역을 증진시키는 작용을 할 수 있다. 번역 리더는 관련 기술분야에 공지되어 있으며, 예로서 피코르나바이러스 리더, EMCV 리더 (뇌심근염 5' 비코딩 영역) (Elroy-Stein et al., Proc. Nat. Acad. Sci. USA 86:6126-6130 (1989)); 포티바이러스 리더, 예를 들어 TEV 리더 (담배 식각 바이러스) (Carrington and Freed Journal of Virology, 64:1590-1597 (1990)), MDMV 리더 (메이즈 왜성 모자이크 바이러스) (Allison et al., Virology 154:9-20 (1986)); 인간 이뮤노글로불린 중쇄 결합 단백질 (BiP) (Macejak et al., Nature 353:90-94 (1991)); 알팔파 모자이크 바이러스의 코트 단백질 mRNA로부터의 비번역 리더 (AMV RNA 4) (Jobling et al., Nature 325:622-625 (1987)); 담배 모자이크 바이러스 리더 (TMV) (Gallie et al., (1989) Molecular Biology of RNA, pages 237-256); 및 메이즈 황백화 얼룩 바이러스 리더 (MCMV) (Lommel et al., Virology 81:382-385 (1991))를 포함한다. 또한, 문헌 [Della-Cioppa et al., Plant Physiology 84:965-968 (1987)]을 참조한다.
유전자 발현 카세트 구축물은 또한 번역 및/또는 mRNA 안정성을 증진시키는 서열, 예컨대 인트론을 함유할 수 있다. 이러한 인트론의 한 예는 아라비돕시스 탈리아나(Arabidopsis thaliana)의 히스톤 H3.III 변이체의 유전자 II의 제1 인트론이다. 문헌 [Chaubet et al., Journal of Molecular Biology, 225:569-574 (1992)].
발현 카세트가 특정한 소기관, 특히 색소체, 전분체 또는 세포질 세망으로 지시되거나 또는 세포 표면 또는 세포외로 분비되는 유전자 산물을 발현하는 것이 바람직한 경우에, 발현 카세트는 추가로 통과 펩티드의 코딩 서열을 포함할 수 있다. 이러한 통과 펩티드는 관련 기술분야에 널리 공지되어 있으며, 아실 담체 단백질, RUBISCO의 작은 서브유닛, 식물 EPSP 신타제 및 헬리안투스 안누스(Helianthus annuus)에 대한 통과 펩티드 (미국 특허 번호 5,510,417), 제아 메이스 브리틀-1 엽록체 통과 펩티드 (Nelson et al., Plant Physiol 117(4):1235-1252 (1998); Sullivan et al., Plant Cell 3(12):1337-48; Sullivan et al., Planta (1995) 196(3):477-84; Sullivan et al., J. Biol. Chem. (1992) 267(26):18999-9004) 등을 포함하나 이에 제한되지는 않는다. 추가로, 키메라 엽록체 통과 펩티드, 예컨대 최적화된 통과 펩티드 (미국 특허 번호 5,510,471)가 관련 기술분야에 공지되어 있다. 추가의 엽록체 통과 펩티드는 이전에 미국 특허 번호 5,717,084 및 미국 특허 번호 5,728,925에 기재되었다. 관련 기술분야의 통상의 기술자는 산물을 특정한 소기관으로 발현시키는데 이용가능한 많은 옵션을 용이하게 인지할 것이다. 예를 들어, 보리 알파 아밀라제 서열은 종종 세포질 세망으로의 발현을 지시하는데 사용된다 (Rogers, J. Biol. Chem. 260:3731-3738 (1985)).
관련 기술분야의 통상의 기술자는 재조합 DNA 기술의 사용이, 예를 들어 숙주 세포 내에서의 핵산 분자의 카피수, 그러한 핵산 분자가 전사되는 효율, 생성된 전사체가 번역되는 효율, 및 번역후 변형의 효율을 조작하는 것에 의해 형질전환된 핵산 분자의 발현의 제어를 개선시킬 수 있다는 것을 인지할 것이다. 추가로, 프로모터 서열은 천연 프로모터와 비교하여 발현의 수준을 개선시키도록 유전자 조작될 수 있다. 핵산 분자의 발현을 제어하는데 유용한 재조합 기술은 1개 이상의 숙주 세포 염색체 내로의 핵산 분자의 안정한 통합, 플라스미드에의 벡터 안정성 서열의 부가, 전사 제어 신호 (예를 들어 프로모터, 오퍼레이터, 인핸서)의 치환 또는 변형, 번역 제어 신호 (예를 들어 리보솜 결합 부위, 샤인-달가노(Shine-Dalgarno) 또는 코작(Kozak) 서열)의 치환 또는 변형, 숙주 세포의 코돈 용법에 상응하도록 하는 핵산 분자의 변형, 및 전사체를 탈안정화시키는 서열의 결실을 포함하나 이에 제한되지는 않는다.
형질전환된 세포 또는 조직 또는 식물 부분 또는 식물의 선택을 위한 리포터 또는 마커 유전자가 형질전환 벡터에 포함될 수 있다. 선택 마커의 예는 제초제 또는 항생제와 같은 항-대사물에 대한 저항성을 부여하는 것, 예를 들어 메토트렉세이트에 대한 저항성을 부여하는 디히드로폴레이트 리덕타제 (문헌 [Reiss, Plant Physiol. (Life Sci. Adv.) 13:143-149, 1994]; 또한 문헌 [Herrera Estrella et al., Nature 303:209-213, (1983); Meijer et al., Plant Mol. Biol. 16:807-820, (1991)] 참조); 아미노글리코시드 네오마이신, 카나마이신 및 파로마이신에 대한 저항성을 부여하는 네오마이신 포스포트랜스퍼라제 (Herrera-Estrella, EMBO J. 2:987-995, 1983 및 Fraley et al., Proc. Natl. Acad. Sci USA 80:4803 (1983)) 및 히그로마이신에 대한 저항성을 부여하는 히그로마이신 포스포트랜스퍼라제 (문헌 [Marsh, Gene 32:481-485, (1984)]; 또한 문헌 [Waldron et al., Plant Mol. Biol. 5:103-108, (1985); Zhijian et al., Plant Science 108:219-227, (1995)] 참조); 세포가 트립토판 대신 인돌을 이용하는 것을 가능하게 하는 trpB; 세포가 히스티딘 대신 히스티놀을 이용하는 것을 가능하게 하는 hisD (Hartman, Proc. Natl. Acad. Sci., USA 85:8047, (1988)); 세포가 만노스를 이용하는 것을 가능하게 하는 만노스-6-포스페이트 이소머라제 (국제 특허 출원 번호 WO94/20627); 오르니틴 데카르복실라제 억제제인 2-(디플루오로메틸)-DL-오르니틴 (DFMO; McConlogue, 1987, In: Current Communications in Molecular Biology, Cold Spring Harbor Laboratory ed.)에 대한 저항성을 부여하는 오르니틴 데카르복실라제; 및 블라스티시딘 S에 대한 저항성을 부여하는 아스페르길루스 테레우스(Aspergillus terreus)로부터의 데아미나제 (Tamura, Biosci. Biotechnol. Biochem. 59:2336-2338, (1995))를 포함한다.
추가의 선택 마커는, 예를 들어 이미다졸리논 또는 술포닐우레아 저항성을 부여하는 돌연변이 아세토락테이트 신타제 (Lee et al., EMBO J. 7:1241-1248, (1988)), 아트라진에 대한 저항성을 부여하는 돌연변이 psbA (Smeda et al., Plant Physiol. 103:911-917, (1993)), 또는 돌연변이 프로토포르피리노겐 옥시다제 (미국 특허 번호 5,767,373 참조), 또는 글루포시네이트와 같은 제초제에 대한 저항성을 부여하는 다른 마커를 포함한다. 적합한 선택 마커 유전자의 예는 클로람페니콜 (Herrera Estrella et al., EMBO J. 2:987-992, (1983)); 스트렙토마이신 (Jones et al., Mol. Gen. Genet. 210:86-91, (1987)); 스펙티노마이신 (Bretagne-Sagnard et al., Transgenic Res. 5:131-137, (1996)); 블레오마이신 (Hille et al., Plant Mol. Biol. 7:171-176, (1990)); 술폰아미드 (Guerineau et al., Plant Mol. Biol. 15:127-136, (1990)); 브로목시닐 (Stalker et al., Science 242:419-423, (1988)); 글리포세이트 (Shaw et al., Science 233:478-481, (1986)); 포스피노트리신 (DeBlock et al., EMBO J. 6:2513-2518, (1987)) 등에 대한 저항성을 코딩하는 유전자를 포함하나 이에 제한되지는 않는다.
선택적 유전자의 사용을 위한 한 옵션은 글루포시네이트-저항성 코딩 DNA이며, 한 실시양태에서는 카사바 베인 모자이크 바이러스 프로모터의 제어 하의 포스피노트리신 아세틸 트랜스퍼라제 (pat), 메이즈 최적화 pat 유전자 또는 bar 유전자일 수 있다. 이들 유전자는 비알라포스에 대한 저항성을 부여한다. 문헌 [Wohlleben et al., (1988) Gene 70: 25-37; Gordon-Kamm et al., Plant Cell 2:603; 1990; Uchimiya et al., BioTechnology 11:835, 1993; White et al., Nucl. Acids Res. 18:1062, 1990; Spencer et al., Theor. Appl. Genet. 79:625-631, 1990; 및 Anzai et al., Mol. Gen. Gen. 219:492, 1989]을 참조한다. pat 유전자의 버전은 미국 특허 번호 6,096,947에 기재된 메이즈 최적화된 pat 유전자이다.
추가로, 마커를 코딩하는 폴리뉴클레오티드를 함유하는 식물 세포의 확인을 용이하게 하는 마커가 사용될 수 있다. 서열의 존재가 측정가능한 산물을 생산하며 식물 세포의 파괴 없이 산물을 생산할 있는 점수화 또는 스크리닝 마커가 유용하다. 예는 다양한 발색원성 기질이 공지되어 있는 효소를 코딩하는 β-글루쿠로니다제 또는 uidA 유전자 (GUS) (예를 들어, 미국 특허 번호 5,268,463 및 5,599,670); 클로람페니콜 아세틸 트랜스퍼라제 (Jefferson et al. The EMBO Journal vol. 6 No. 13 pp. 3901-3907); 및 알칼리성 포스파타제를 포함한다. 바람직한 실시양태에서, 사용되는 마커는 베타-카로틴 또는 프로비타민 A이다 (Ye et al., Science 287:303-305- (2000)). 상기 유전자는 벼의 영양을 증진시키기 위해 사용되었으나, 본 경우에서는 그것이 대신 스크리닝 마커로 사용되어, 관심 유전자에 연결된 유전자의 존재가 제공된 금색 색상에 의해 검출된다. 식물에 대한 그의 영양상 기여를 위해 유전자가 사용되는 상황과 달리, 마킹 목적으로는 보다 소량의 단백질이면 충분하다. 다른 스크리닝 마커는, 예를 들어 특히 식물 조직에서 안토시아닌 색소 (적색 색상)의 생산을 조절하는 산물을 코딩하는 R-유전자좌 유전자 (Dellaporta et al., in Chromosome Structure and Function, Kluwer Academic Publishers, Appels and Gustafson eds., pp. 263-282 (1988)); 플라보노이드 색소의 생합성을 제어하는 유전자, 예컨대 메이즈 C1 유전자 (Kao et al., Plant Cell (1996) 8: 1171-1179; Scheffler et al., Mol. Gen. Genet. (1994) 242:40-48) 및 메이즈 C2 (Wienand et al., Mol. Gen. Genet. (1986) 203:202-207); B 유전자 (Chandler et al., Plant Cell (1989) 1:1175-1183), p1 유전자 (Grotewold et al., Proc. Natl. Acad. Sci USA (1991) 88:4587-4591; Grotewold et al., Cell (1994) 76:543-553; Sidorenko et al., Plant Mol. Biol. (1999)39:11-19); 브론즈 유전자좌 유전자 (Ralston et al., Genetics (1988) 119:185-197; Nash et al., Plant Cell (1990) 2(11): 1039-1049)를 포함한, 일반적으로 안토시아닌/플라보노이드 유전자 (문헌 [Taylor and Briggs, The Plant Cell (1990)2:115-127]에서의 논의 참조)를 포함한다.
적합한 마커의 추가의 예는 시안 형광 단백질 (CYP) 유전자 (Bolte et al., (2004) J. Cell Science 117: 943-54 및 Kato et al., (2002) Plant Physiol 129: 913-42), 황색 형광 단백질 유전자 (에브로겐(Evrogen)으로부터의 PHIYFP™; 문헌 [Bolte et al., (2004) J. Cell Science 117: 943-54] 참조); 예를 들어 X선 필름, 섬광 계수, 형광 분광광도측정법, 저조도 비디오 카메라, 광자 계수 카메라 또는 멀티웰 발광측정법을 사용하여 존재가 검출될 수 있는 루시페라제를 코딩하는 lux 유전자 (Teeri et al. (1989) EMBO J. 8:343); 녹색 형광 단백질 (GFP) 유전자 (Sheen et al., Plant J. (1995) 8(5):777-84); 및 마커 유전자로 형질전환된 식물 세포가 적색이며, 이에 따라 시각적으로 선택할 수 있는 DsRed2 (Dietrich et al., (2002) Biotechniques 2(2):286-293)를 포함한다. 추가의 예는 다양한 발색원성 기질 (예를 들어, PADAC, 발색원성 세팔로스포린)이 공지되어 있는 효소를 코딩하는 β-락타마제 유전자 (Sutcliffe, Proc. Nat'l. Acad. Sci. U.S.A. (1978) 75:3737); 발색원성 카테콜을 전환시킬 수 있는 카테콜 디옥시게나제를 코딩하는 xylE 유전자 (Zukowsky et al., Proc. Nat'l. Acad. Sci. U.S.A. (1983) 80:1101); α-아밀라제 유전자 (Ikuta et al., Biotech. (1990) 8:241); 및 티로신을 DOPA 및 도파퀴논 (이들은 차례로 축합되어 용이하게 검출가능한 화합물 멜라닌을 형성함)으로 산화시킬 수 있는 효소를 코딩하는 티로시나제 유전자 (Katz et al., J. Gen. Microbiol. (1983) 129:2703)를 포함한다. 분명히, 많은 이러한 마커가 이용가능하며, 관련 기술분야의 통상의 기술자에게 공지되어 있다.
특정 실시양태에서, 발현 카세트 중 유전자 산물을 코딩하는 트랜스진의 뉴클레오티드 서열은 임의로 카세트 및/또는 식물 중 또 다른 관심 뉴클레오티드 서열과 조합될 수 있다. 예를 들어, 특정 실시양태에서, 트랜스진은 글리포세이트 또는 또 다른 제초제에 대한 추가의 저항성 또는 내성을 제공하고/거나, 선택 곤충 또는 질병에 대한 저항성, 및/또는 영양 증진, 및/또는 개선된 농경학적 특징, 및/또는 사료, 식품, 산업, 제약 또는 다른 용도에 유용한 단백질 또는 다른 산물을 제공하는 또 다른 관심 뉴클레오티드 서열과 조합되거나 "스태킹"될 수 있다. 식물 게놈 내에서의 2개 이상 관심 핵산 서열의 "스태킹"은, 예를 들어 2개 이상의 이벤트를 사용한 통상적인 식물 육종, 관심 서열을 함유하는 구축물을 사용한 식물의 형질전환, 트랜스제닉 식물의 재형질전환, 또는 상동 재조합에 의한 통합을 통한 새로운 형질의 부가에 의해 달성될 수 있다.
이러한 관심 뉴클레오티드 서열은 (1) 해충 또는 질병에 대한 저항성, (2) 제초제에 대한 저항성 및 (3) 하기에 제공되는 가치 부가 형질을 부여하는 유전자 또는 코딩 서열의 예를 포함하나 이에 제한되지는 않는다:
1. 해충 또는 질병에 대한 저항성을 부여하는 유전자 또는 코딩 서열 (예를 들어 iRNA)
(A) 식물 질병 저항성 유전자. 식물 방어는 종종 식물 내 질병 저항성 유전자 (R)의 산물과 병원체 내의 상응하는 비병독성 (Avr) 유전자의 산물 사이의 특정 상호작용에 의해 활성화된다. 특정 병원체 균주에 대한 저항성을 갖는 식물을 조작하기 위해, 식물 변종이 클로닝된 저항성 유전자로 형질전환될 수 있다. 이러한 유전자의 예는 클라도스포리움 풀붐(Cladosporium fulvum)에 대한 저항성의 경우 토마토 Cf-9 유전자 (Jones et al., 1994 Science 266:789), 슈도모나스 시린가에(Pseudomonas syringae) 병원체변종 토마토에 대한 저항성의 경우 단백질 키나제를 코딩하는 토마토 Pto 유전자 (Martin et al., 1993 Science 262:1432), 및 슈도모나스 시린가에에 대한 저항성의 경우 아라비돕시스 RSSP2 유전자 (Mindrinos et al., 1994 Cell 78:1089)를 포함한다.
(B) 바실루스 투린기엔시스(Bacillus thuringiensis) 단백질, 그의 유도체, 또는 그에 대해 모델링된 합성 폴리펩티드, 예컨대 Bt δ-내독소 유전자의 뉴클레오티드 서열 (Geiser et al., 1986 Gene 48:109), 및 영양 살곤충 (VIP) 유전자 (예를 들어, 문헌 [Estruch et al., (1996) Proc. Natl. Acad. Sci. 93:5389-94] 참조). 더욱이, δ-내독소 유전자를 코딩하는 DNA 분자는 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (메릴랜드주 록빌)으로부터 ATCC 수탁번호 40098, 67136, 31995 및 31998로 구입할 수 있다.
(C) 렉틴, 예컨대 여러 클리비아 미니아타(Clivia miniata) 만노스-결합 렉틴 유전자의 뉴클레오티드 서열 (Van Damme et al., 1994 Plant Molec. Biol. 24:825).
(D) 곤충 해충에 대한 살유충제로서 유용한 비타민 결합 단백질, 예컨대 아비딘 및 아비딘 상동체. 미국 특허 번호 5,659,026 참조.
(E) 효소 억제제, 예를 들어 프로테아제 억제제 또는 아밀라제 억제제. 이러한 유전자의 예는 벼 시스테인 프로테이나제 억제제 (Abe et al., 1987 J. Biol. Chem. 262:16793), 담배 프로테이나제 억제제 I (Huub et al., 1993 Plant Molec. Biol. 21:985) 및 α-아밀라제 억제제 (Sumitani et al., 1993 Biosci. Biotech. Biochem. 57:1243)를 포함한다.
(F) 곤충-특이적 호르몬 또는 페로몬, 예컨대 엑디스테로이드 및 유충 호르몬, 그의 변이체, 그에 기초한 모방체, 또는 그의 길항제 또는 효능제, 예컨대 유충 호르몬의 불활성화제인 클로닝된 유충 호르몬 에스테라제의 바큘로바이러스 발현 (Hammock et al., 1990 Nature 344:458).
(G) 발현 시에 침범한 해충의 생리학을 파괴하는 곤충-특이적 펩티드 또는 뉴로펩티드 (J. Biol. Chem. 269:9). 이러한 유전자의 예는 곤충 이뇨 호르몬 수용체 (Regan, 1994), 디플로프테라 푼크타타(Diploptera punctata)에서 확인된 알로스타틴 (Pratt, 1989), 및 곤충-특이적, 마비성 신경독소 (미국 특허 번호 5,266,361)를 포함한다.
(H) 뱀, 말벌 등에 의해 자연에서 생산되는 곤충-특이적 독, 예컨대 전갈 곤충독성 펩티드 (Pang, (1992) Gene 116:165).
(I) 모노테르펜, 세스퀴테르펜, 스테로이드, 히드록삼산, 페닐프로파노이드 유도체 또는 살곤충 활성을 갖는 또 다른 비-단백질 분자의 과축적을 담당하는 효소.
(J) 자연인지 합성인지에 관계 없이, 생물학적으로 활성인 분자의 번역후 변형을 포함한 변형에 수반되는 효소; 예를 들어 당분해 효소, 단백질분해 효소, 지질분해 효소, 뉴클레아제, 시클라제, 트랜스아미나제, 에스테라제, 히드롤라제, 포스파타제, 키나제, 포스포릴라제, 폴리머라제, 엘라스타제, 키티나제 및 글루카나제. 이러한 유전자의 예는 callas 유전자 (PCT 공개 출원 WO93/02197), 키티나제-코딩 서열 (ATCC로부터 수탁번호 3999637 및 67152 하에 얻을 수 있음), 담배 구충 키티나제 (Kramer et al., (1993) Insect Molec. Biol. 23:691), 및 파슬리 ubi4-2 폴리유비퀴틴 유전자 (Kawalleck et al., (1993) Plant Molec. Biol. 21:673)를 포함한다.
(K) 신호 전달을 자극하는 분자. 이러한 분자의 예는 녹두 칼모듈린 cDNA 클론에 대한 뉴클레오티드 서열 (Botella et al., (1994) Plant Molec. Biol. 24:757) 및 메이즈 칼모듈린 cDNA 클론에 대한 뉴클레오티드 서열 (Griess et al., (1994) Plant Physiol. 104:1467)을 포함한다.
(L) 소수성 모멘트 펩티드. 미국 특허 번호 5,659,026 및 5,607,914 참조; 후자는 질병 저항성을 부여하는 합성 항미생물 펩티드를 교시한다.
(M) 막 퍼미아제, 채널 형성제 또는 채널 차단제, 예컨대 트랜스제닉 담배 식물을 슈도모나스 솔라나세아룸(Pseudomonas solanacearum)에 대한 저항성을 갖도록 만드는 세크로핀-β 용해 펩티드 유사체 (Jaynes et al., (1993) Plant Sci. 89:43).
(N) 바이러스-침습성 단백질 또는 그로부터 유래된 복합 독소. 예를 들어, 형질전환된 식물 세포에서의 바이러스 코트 단백질의 축적은 코트 단백질 유전자가 유래하는 바이러스, 뿐만 아니라 관련 바이러스에 의해 영향을 받는 바이러스 감염 및/또는 질병 발생에 대한 저항성을 부여한다. 코트 단백질-매개 저항성은 알팔파 모자이크 바이러스, 오이 모자이크 바이러스, 담배 줄무늬 바이러스, 감자 바이러스 X, 감자 바이러스 Y, 담배 식각 바이러스, 담배 얼룩무늬 바이러스 및 담배 모자이크 바이러스에 대하여 형질전환된 식물에 부여되었다. 예를 들어, 문헌 [Beachy et al., (1990) Ann. Rev. Phytopathol. 28:451]을 참조한다.
(O) 곤충-특이적 항체 또는 그로부터 유래된 면역독소. 따라서, 곤충 장에서의 중요한 대사 기능에 표적화된 항체는 영향을 받은 효소를 불활성화시켜 곤충을 사멸시키게 된다. 예를 들어, 문헌 [Taylor et al., (1994) Abstract #497, Seventh Int'l. Symposium on Molecular Plant-Microbe Interactions]은 단일-쇄 항체 단편의 생산에 의한 트랜스제닉 담배에서의 효소적 불활성화를 제시한다.
(P) 바이러스-특이적 항체. 예를 들어, 재조합 항체 유전자를 발현하는 트랜스제닉 식물이 바이러스 공격으로부터 보호된다는 것을 제시하는 문헌 [Tavladoraki et al., (1993) Nature 266:469]을 참조한다.
(Q) 병원체 또는 기생충에 의해 자연에서 생산되는 발생-정지 단백질. 따라서, 진균 엔도 α-1,4-D-폴리갈락투로나제는 식물 세포벽 호모-α-1,4-D-갈락투로나제를 가용화함으로써 진균 콜로니화 및 식물 영양소 방출을 용이하게 한다 (Lamb et al., (1992) Bio/Technology 10:1436). 콩 엔도폴리갈락투로나제-억제 단백질을 코딩하는 유전자의 클로닝 및 특징화는 문헌 [Toubart et al., (1992) Plant J. 2:367]에 기재되어 있다.
(R) 식물에 의해 자연에서 생산되는 발생-정지 단백질, 예컨대 진균성 질병에 대한 증가된 저항성을 제공하는 보리 리보솜-불활성화 유전자 (Longemann et al., (1992). Bio/Technology 10:3305).
(S) RNA 분자를 코딩하는 DNA 폴리뉴클레오티드가 표적 유전자의 발현을 억제하는데 사용되는 RNA 간섭. 한 예에서, RNA 분자는 부분적으로 또는 완전히 이중 가닥이며, 이는 침묵 반응을 촉발하여, dsRNA를 소형 간섭 RNA로 절단하며, 이는 이어서 상동 mRNA를 파괴하는 표적화 복합체 내로 혼입된다. 예를 들어, 미국 특허 번호 6,506,559 (Fire et al.); 미국 특허 번호 6,573,099 (Graham et al.)를 참조한다.
2. 제초제에 대한 저항성을 부여하는 유전자 또는 코딩 서열
(A) 성장점 또는 분열조직을 억제하는 제초제, 예컨대 이미다졸리논, 술폰아닐리드 또는 술포닐우레아 제초제에 대한 저항성 또는 내성을 코딩하는 유전자. 또한 AHAS 효소로도 공지되어 있는 (Miki et al., (1990) Theor. Appl. Genet. 80:449) 돌연변이 ALS 효소에 대한 이러한 카테고리 코드에서의 예시적인 유전자 (Lee et al., (1988) EMBOJ. 7:1241).
(B) 돌연변이 EPSP 신타제 및 aroA 유전자에 의해 부여되거나, 또는 GAT (글리포세이트 아세틸트랜스퍼라제) 또는 GOX (글리포세이트 옥시다제)와 같은 유전자 및 다른 포스포노 화합물, 예컨대 글루포시네이트 (pat 및 bar 유전자; DSM-2), 및 아릴옥시페녹시프로피온산 및 시클로헥산디온 (ACCase 억제제 코딩 유전자)에 의한 대사 불활성화를 통해 부여되는 글리포세이트에 대한 저항성 또는 내성을 코딩하는 1종 이상의 추가의 유전자. 예를 들어, 글리포세이트 저항성을 부여할 수 있는 EPSP의 형태의 뉴클레오티드 서열을 개시하는 미국 특허 번호 4,940,835를 참조한다. 돌연변이 aroA 유전자를 코딩하는 DNA 분자는 ATCC 수탁번호 39256 하에 얻을 수 있고, 돌연변이 유전자의 뉴클레오티드 서열은 미국 특허 번호 4,769,061에 개시되어 있다. 유럽 특허 출원 번호 0 333 033 및 미국 특허 번호 4,975,374는 제초제, 예컨대 L-포스피노트리신에 대한 저항성을 부여하는 글루타민 신테타제 유전자의 뉴클레오티드 서열을 개시한다. 포스피노트리신 아세틸-트랜스퍼라제 유전자의 뉴클레오티드 서열은 유럽 특허 출원 번호 0 242 246에 제공되어 있다. 문헌 [De Greef et al., (1989) Bio/Technology 7:61]은 포스피노트리신 아세틸 트랜스퍼라제 활성을 코딩하는 키메라 bar 유전자를 발현하는 트랜스제닉 식물의 생산을 기재한다. 아릴옥시페녹시프로피온산 및 시클로헥산디온, 예컨대 세톡시딤 및 할록시포프에 대한 저항성을 부여하는 유전자의 예는 문헌 [Marshall et al., (1992) Theor. Appl. Genet. 83:435]에 기재된 Accl-S1, Accl-S2 및 Accl-S3 유전자이다.
(C) 광합성을 억제하는 제초제, 예컨대 트리아진에 대한 저항성 또는 내성을 코딩하는 유전자 (psbA 및 gs+ 유전자) 및 벤조니트릴에 대한 저항성 또는 내성을 코딩하는 유전자 (니트릴라제 유전자). 문헌 [Przibilla et al., (1991) Plant Cell 3:169]은 클라미도모나스(Chlamydomonas)를 형질전환시키기 위한, 돌연변이 psbA 유전자를 코딩하는 플라스미드의 용도를 기재한다. 미국 특허 번호 4,810,648에서의 니트릴라제 유전자에 대한 뉴클레오티드 서열, 및 이들 유전자를 함유하는 DNA 분자는 ATCC 수탁번호 53435, 67441 및 67442 하에 이용가능하다. 글루타티온 S-트랜스퍼라제를 코딩하는 DNA의 클로닝 및 발현은 문헌 [Hayes et al., (1992) Biochem. J. 285:173]에 기재되어 있다.
(D) 파라-히드록시페닐피루베이트 (HPP)가 호모겐티세이트로 변환되는 반응을 촉매하는 효소인 히드록시페닐피루베이트 디옥시제나제 (HPPD)에 결합하는 제초제에 대한 저항성 또는 내성을 코딩하는 유전자. 이것은 제초제, 예컨대 이속사졸 (유럽 특허 번호 418175, 유럽 특허 번호 470856, 유럽 특허 번호 487352, 유럽 특허 번호 527036, 유럽 특허 번호 560482, 유럽 특허 번호 682659, 미국 특허 번호 5,424,276), 특히 메이즈에 대한 선택적 제초제인 이속사플루톨, 디케토니트릴 (유럽 특허 번호 496630 및 유럽 특허 번호 496631), 특히 2-시아노-3-시클로프로필-1-(2-SO2CH3-4-CF3 페닐) 프로판-1,3-디온 및 2-시아노-3-시클로프로필-1-(2-SO2CH3-4-2,3Cl2페닐) 프로판-1,3-디온, 트리케톤 (유럽 특허 번호 625505, 유럽 특허 번호 625508, 미국 특허 번호 5,506,195), 특히 술코트리온 및 피라졸리네이트를 포함한다. 예를 들어 미국 특허 번호 6,268,549 및 6,245,968 및 미국 특허 공개 번호 20030066102에 기재된 유전자를 포함한, 식물에서 과다한 HPPD를 생산하는 유전자는 이러한 제초제에 대한 내성 또는 저항성을 제공할 수 있다.
(E) 페녹시 옥신 제초제, 예컨대 2,4-디클로로페녹시아세트산 (2,4-D)에 대한 저항성 또는 내성을 코딩하며, 또한 아릴옥시페녹시프로피오네이트 (AOPP) 제초제에 대한 저항성 또는 내성을 부여할 수 있는 유전자. 이러한 유전자의 예는 미국 특허 번호 7,838,733에 기재된 α-케토글루타레이트-의존성 디옥시게나제 효소 (aad-1) 유전자를 포함한다.
(F) 페녹시 옥신 제초제, 예컨대 2,4-디클로로페녹시아세트산 (2,4-D)에 대한 저항성 또는 내성을 코딩하며, 또한 피리딜옥시 옥신 제초제, 예컨대 플루록시피르 또는 트리클로피르에 대한 저항성 또는 내성을 부여할 수 있는 유전자. 이러한 유전자의 예는 WO 2007/053482 A2에 기재된 α-케토글루타레이트-의존성 디옥시게나제 효소 유전자 (aad-12)를 포함한다.
(G) 디캄바에 대한 저항성 또는 내성을 코딩하는 유전자 (예를 들어 미국 특허 공개 번호 20030135879 참조).
(H) 프로토포르피리노겐 옥시다제 (PPO)를 억제하는 제초제에 대한 저항성 또는 내성을 제공하는 유전자 (미국 특허 번호 5,767,373 참조).
(I) 광화학계 II 반응 중심 (PS II)의 코어 단백질에 결합하는 트리아진 제초제 (예컨대 아트라진) 및 우레아 유도체 (예컨대 디우론) 제초제에 대한 저항성 또는 내성을 제공하는 유전자 (문헌 [Brussian et al., (1989) EMBO J. 1989, 8(4): 1237-1245] 참조).
3. 가치-부가 형질을 부여하거나 이에 기여하는 유전자
(A) 예를 들어 식물의 스테아르산 함량을 증가시키기 위해 스테아로일-ACP 데새투라제의 안티센스 유전자로 메이즈 또는 브라시카(Brassica)를 형질전환시킴으로써 변형된 지방산 대사 (Knultzon et al., (1992) Proc. Nat. Acad. Sci. USA 89:2624).
(B) 감소된 피테이트 함량.
(1) 피타제-코딩 유전자, 예컨대 아스페르길루스 니거(Aspergillus niger) 피타제 유전자의 도입 (Van Hartingsveldt et al., (1993) Gene 127:87)은 피테이트의 파괴를 증진시켜, 보다 많은 유리 포스페이트를 형질전환된 식물에 부가한다.
(2) 피테이트 함량을 감소시키는 유전자가 도입될 수 있다. 메이즈에서, 이것은, 예를 들어 낮은 수준의 피트산을 특징으로 하는 메이즈 돌연변이체에 대한 원인이 되는 단일 대립유전자와 연관된 DNA를 클로닝한 후 재도입함으로써 달성될 수 있다 (Raboy et al., (1990) Maydica 35:383).
(C) 예를 들어 전분의 분지화 패턴을 변경하는 효소를 코딩하는 유전자로 식물을 형질전환시킴으로써 수행된 변형된 탄수화물 조성. 이러한 효소의 예는 스트렙토코쿠스 무쿠스(Streptococcus mucus) 프룩토실트랜스퍼라제 유전자 (Shiroza et al., (1988) J. Bacteriol. 170:810), 바실루스 서브틸리스(Bacillus subtilis) 레반수크라제 유전자 (Steinmetz et al., (1985) Mol. Gen. Genel. 200:220), 바실루스 리케니포르미스(Bacillus licheniformis) α-아밀라제 (Pen et al., (1992) Bio/Technology 10:292), 토마토 인버타제 유전자 (Elliot et al., (1993)), 보리 아밀라제 유전자 (Sogaard et al., (1993) J. Biol. Chem. 268:22480) 및 메이즈 내배유 전분 분지화 효소 II (Fisher et al., (1993) Plant Physiol. 102:10450)를 포함한다.
범용 제품 - 본 개시내용의 추가 실시양태에서, 트랜스제닉 식물은 범용 제품을 생산한다. 한 실시양태에서, 범용 제품은 단백질 농축물, 단백질 단리물, 곡물, 분말, 가루, 오일 또는 섬유로 이루어진 군으로부터 선택된다.
범용 제품은 식물 또는 식물 종자로부터 유래된 물질로 구성되어 있으며 소비자에게 판매되는 임의의 제품을 지칭한다. 작물 식물은 소비를 위한 단백질, 탄수화물 및 식물성 오일의 가장 큰 공급원이다. 트랜스제닉 식물은 범용 제품을 제조하는데 사용될 수 있다. 식물 및/또는 식물 종자는 분말, 가루 또는 오일로 가공될 수 있을 뿐만 아니라, 육생 및 수생 동물 둘 다를 위한 동물 사료에서 단백질 또는 오일 공급원으로서 사용될 수 있다. 대두 및 대두 오일은 많은 상이한 제품, 비제한적으로 전체 또는 가공된 종자, 동물 사료, 식물성 오일, 분말, 가루, 비독성 플라스틱, 인쇄 잉크, 윤활제, 왁스, 유압 유체, 전기 변압기 유체, 용매, 화장품, 모발 관리 제품, 낫토, 템페, 단백질 농축물, 단백질 단리물, 질감처리 및 가수분해된 단백질, 및 바이오디젤의 제조에 사용될 수 있다.
식물 분류 - 추가의 실시양태에서, 본 개시내용은 트랜스제닉 식물에 관한 것이며, 여기서 트랜스제닉 식물은 쌍자엽 식물 또는 단자엽 식물로 이루어진 군으로부터 선택된다. 추가 실시양태에서, 본 개시내용은 작물 식물 및 오일, 단백질 또는 탄수화물을 위해 사용되는 식물을 포함한 소비재 식물에 관한 것이다. 따라서, 임의의 식물 종 또는 식물 세포가 하기에 추가로 기재되는 바와 같이 선택될 수 있다.
일부 실시양태에서, 본 개시내용에 따라 유전자 변형된 식물 (예를 들어, 식물 숙주 세포)은 쌍자엽 및 단자엽 식물 둘 다를 포함한 임의의 고등 식물, 및 특히 작물 식물을 포함한 소비재 식물을 포함하나 이에 제한되지는 않는다. 이러한 식물은, 예를 들어 다음을 포함할 수 있으나 이에 제한되지는 않는다: 알팔파, 대두, 목화, 평지씨 (또한 카놀라로 기재됨), 아마인, 옥수수, 벼, 브라키아리아, 밀, 홍화, 소르굼, 사탕무, 해바라기, 담배 및 잔디풀. 따라서, 임의의 식물 종 또는 식물 세포가 선택될 수 있다. 실시양태에서, 본원에 사용된 식물 세포 및 그로부터 성장하거나 유래된 식물은 평지씨 (브라시카 나푸스(Brassica napus)); 인도 겨자 (브라시카 준세아(Brassica juncea)); 에티오피아 겨자 (브라시카 카리나타(Brassica carinata)); 순무 (브라시카 라파(Brassica rapa)); 양배추 (브라시카 올레라세아(Brassica oleracea)); 대두 (글리신 맥스(Glycine max)); 아마인/아마 (리눔 우시타티시뭄(Linum usitatissimum)); 메이즈 (또한 옥수수로 기재됨) (제아 메이스(Zea mays)); 홍화 (카르타무스 틴크토리우스(Carthamus tinctorius)); 해바라기 (헬리안투스 안누스(Helianthus annuus)); 담배 (니코티아나 타바쿰(Nicotiana tabacum)); 아라비돕시스 탈리아나(Arabidopsis thaliana); 브라질 넛 (베톨레티아 엑셀사(Betholettia excelsa)); 피마자 콩 (리시누스 콤뮤니스(Ricinus communis)); 코코넛 (코쿠스 누시페라(Cocus nucifera)); 코리안더 (코리안드룸 사티붐(Coriandrum sativum)); 목화 (고시피움 종(Gossypium spp.)); 땅콩 (아라키스 히포가에아(Arachis hypogaea)); 호호바 (심몬드시아 키넨시스(Simmondsia chinensis)); 기름 야자 (엘라에이스 구이니이스(Elaeis guineeis)); 올리브 (올레아 에우르파에아(Olea eurpaea)); 벼 (오리자 사티바(Oryza sativa)); 스쿼시 (쿠쿠르비타 막시마(Cucurbita maxima)); 보리 (호르데움 불가레(Hordeum vulgare)); 사탕수수 (사카룸 오피시나룸(Saccharum officinarum)); 벼 (오리자 사티바(Oryza sativa)); 밀 (트리티쿰 두룸(Triticum durum) 및 트리티쿰 아에스티붐(Triticum aestivum)을 포함한 트리티쿰 종(Triticum spp.)); 및 좀개구리밥 (렘나세아에 종(Lemnaceae sp.))으로부터 수득하능한 세포를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 식물 종 내의 유전적 배경은 달라질 수 있다.
식물 세포 내로 도입된 핵산을 사용하여 본질적으로 임의의 식물에 목적하는 형질을 부여할 수 있다. 본 개시내용의 유전자 발현 구축물 및 상기 언급된 다양한 형질전환 방법을 사용하여 본원에 기재된 목적하는 생리학적 및 농경학적 특징에 대해 폭넓게 다양한 식물 및 식물 세포 시스템을 조작할 수 있다. 실시양태에서, 조작하기 위한 표적 식물 및 식물 세포는 단자엽 및 쌍자엽 식물, 예컨대 곡실 작물을 포함한 작물 (예를 들어, 밀, 메이즈, 벼, 기장, 보리), 과실 작물 (예를 들어, 토마토, 사과, 배, 딸기, 오렌지), 사료용 작물 (예를 들어, 알팔파), 뿌리 채소 작물 (예를 들어, 당근, 감자, 사탕무, 참마), 잎 채소 작물 (예를 들어, 상추, 시금치); 현화 식물 (예를 들어, 페튜니아, 장미, 국화), 침엽수 및 소나무 (예를 들어, 전나무, 가문비나무); 식물환경복원에 사용되는 식물 (예를 들어, 중금속 축적 식물); 오일 작물 (예를 들어, 해바라기, 평지 종자) 및 실험적 목적을 위해 사용되는 식물 (예를 들어, 아라비돕시스)을 포함하나 이에 제한되지는 않는다. 따라서, 개시된 방법 및 조성물은 아스파라거스(Asparagus), 아베나(Avena), 브라시카(Brassica), 시트러스(Citrus), 시트룰루스(Citrullus), 캅시쿰(Capsicum), 쿠쿠르비타(Cucurbita), 다우쿠스(Daucus), 에리게론(Erigeron), 글리신(Glycine), 고시피움(Gossypium), 호르데움(Hordeum), 락투카(Lactuca), 롤리움(Lolium), 리코페르시콘(Lycopersicon), 말루스(Malus), 만니호트(Manihot), 니코티아나(Nicotiana), 오리코프라그무스(Orychophragmus), 오리자(Oryza), 페르세아(Persea), 파세올루스(Phaseolus), 피숨(Pisum), 피루스(Pyrus), 프루누스(Prunus), 라파누스(Raphanus), 세칼레(Secale), 솔라눔(Solanum), 소르굼(Sorghum), 트리티쿰(Triticum), 비티스(Vitis), 비그나(Vigna) 및 제아 메이스(Zea mays) 속으로부터의 종을 포함하나 이에 제한되지는 않는 광범위한 식물에 걸쳐 사용된다.
본 개시내용의 추가 측면에서, 본원에 개시된 시스템, 조성물 및 방법은 트랜스제닉 식물 또는 식물 세포에 관한 것이다. 다른 실시양태에서, 트랜스제닉 식물 또는 식물 세포는 식물 세포를 RecA 활성이 결핍되어 있는 에이. 투메파시엔스 (LBA4404) 균주와 접촉시킴으로써 생산된다.
시험관내 검정 - 한 실시양태에서, 본 개시내용은 에이. 투메파시엔스 (LBA4404) 균주 내 RecA 활성을 평가하기 위한 시험관내 검정에 관한 것이다. 다양한 시험관내 검정은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 여러 예시적인 방법이 하기에 추가로 기재된다.
분자 비콘이 서열 검출에 사용하기 위한 것으로 기재되었다. 간략하게, 플랭킹 게놈 및 삽입 DNA 접합부에 중첩되는 FRET 올리고뉴클레오티드 프로브를 설계한다. FRET 프로브의 특유 구조로 인해 이는 형광 및 켄칭 모이어티를 매우 근접한 상태로 유지하는 2차 구조를 함유하게 된다. FRET 프로브 및 PCR 프라이머 (삽입 DNA 서열에 하나의 프라이머 및 플랭킹 게놈 서열에 하나의 프라이머)를 열안정성 폴리머라제 및 dNTP의 존재 하에 사이클링한다. 성공적인 PCR 증폭 후에, FRET 프로브(들)의 표적 서열에 대한 혼성화는 프로브 2차 구조의 제거 및 형광 및 켄칭 모이어티의 공간 분리를 일으킨다. 형광 신호는 성공적인 증폭 및 혼성화로 인한 플랭킹 게놈/트랜스진 삽입 서열의 존재를 나타낸다. 증폭 반응으로서의 검출을 위한 이러한 분자 비콘 검정은 본 개시내용의 한 실시양태이다.
택맨(TAQMAN)® (라이프 테크놀로지스(Life Technologies), 캘리포니아주 포스터 시티)으로 달리 공지된 가수분해 프로브 검정은 DNA 서열의 존재를 검출 및 정량화하는 방법이다. 간략하게, 이벤트-특이적 검출을 위해 트랜스진 내에 하나의 올리고 및 플랭킹 게놈 서열에 하나의 올리고를 갖도록 FRET 올리고뉴클레오티드 프로브를 설계한다. FRET 프로브 및 PCR 프라이머 (삽입 DNA 서열에 하나의 프라이머 및 플랭킹 게놈 서열에 하나의 프라이머)를 열안정성 폴리머라제 및 dNTP의 존재 하에 사이클링한다. FRET 프로브의 혼성화는 FRET 프로브 상의 켄칭 모이어티로부터 형광 모이어티의 절단 및 방출을 일으킨다. 형광 신호는 성공적인 증폭 및 혼성화로 인한 플랭킹/트랜스진 삽입 서열의 존재를 나타낸다. 증폭 반응으로서의 검출을 위한 이러한 가수분해 프로브 검정은 본 개시내용의 한 실시양태이다.
KASPar® 검정은 DNA 서열의 존재를 검출 및 정량화하는 방법이다. 간략하게, KASPar® 검정 시스템으로 공지된 폴리머라제 연쇄 반응 (PCR) 기반 검정을 사용하여 통합된 유전자 발현 카세트 폴리뉴클레오티드를 포함하는 게놈 DNA 샘플을 스크리닝한다. 본 개시내용의 실시에 사용된 KASPar® 검정은 다중 프라이머를 함유하는 KASPar® PCR 검정 혼합물을 이용할 수 있다. PCR 검정 혼합물에 사용된 프라이머는 적어도 1개의 정방향 프라이머 및 적어도 1개의 역방향 프라이머를 포함할 수 있다. 정방향 프라이머는 DNA 폴리뉴클레오티드의 특정 영역에 상응하는 서열을 함유하고, 역방향 프라이머는 게놈 서열의 특정 영역에 상응하는 서열을 함유한다. 추가로, PCR 검정 혼합물에 사용된 프라이머는 적어도 1개의 정방향 프라이머 및 적어도 1개의 역방향 프라이머를 포함할 수 있다. 예를 들어, KASPar® PCR 검정 혼합물은 2개의 상이한 대립유전자에 상응하는 2개의 정방향 프라이머 및 1개의 역방향 프라이머를 사용할 수 있다. 정방향 프라이머 중 하나는 내인성 게놈 서열의 특정 영역에 상응하는 서열을 함유한다. 제2 정방향 프라이머는 DNA 폴리뉴클레오티드의 특정 영역에 상응하는 서열을 함유한다. 역방향 프라이머는 게놈 서열의 특정 영역에 상응하는 서열을 함유한다. 증폭 반응의 검출을 위한 이러한 KASPar® 검정은 본 개시내용의 한 실시양태이다.
일부 실시양태에서, 형광 신호 또는 형광 염료는 HEX 형광 염료, FAM 형광 염료, JOE 형광 염료, TET 형광 염료, Cy 3 형광 염료, Cy 3.5 형광 염료, Cy 5 형광 염료, Cy 5.5 형광 염료, Cy 7 형광 염료 및 ROX 형광 염료로 이루어진 군으로부터 선택된다.
다른 실시양태에서, 증폭 반응은 유동 세포측정법에 의해 검출가능한 농도 범위에서 세포 DNA를 염색할 수 있는 적합한 제2 형광 DNA 염료를 사용하여 실행되며, 실시간 써모사이클러에 의해 검출가능한 형광 방출 스펙트럼을 갖는다. 관련 기술분야의 통상의 기술자는 다른 핵산 염료가 공지되어 있으며 계속해서 확인되고 있다는 것을 인지할 것이다. 적절한 여기 및 방출 스펙트럼을 갖는 임의의 적합한 핵산 염료, 예컨대 YO-PRO-1®, SYTOX 그린(Green)®, SYBR 그린 I®, SYTO11®, SYTO12®, SYTO13®, BOBO®, YOYO® 및 TOTO®가 사용될 수 있다. 한 실시양태에서, 제2 형광 DNA 염료는 10 μM 미만, 4 μM 미만 또는 2.7 μM 미만으로 사용되는 SYTO13®이다.
추가 실시양태에서, 차세대 서열분석 (NGS)이 검출에 사용될 수 있다. 문헌 [Brautigma et al., 2010]에 기재되어 있는 바와 같이, DNA 서열 분석을 사용하여 단리 및 증폭된 단편의 뉴클레오티드 서열을 결정할 수 있다. 증폭된 단편을 단리하고, 벡터 내로 서브-클로닝하고, 쇄-종결인자 방법 (또한 생어(Sanger) 서열분석으로도 지칭됨) 또는 염료-종결인자 서열분석을 사용하여 서열분석할 수 있다. 추가로, 차세대 서열분석을 사용하여 앰플리콘을 서열분석할 수 있다. NGS 기술은 서브-클로닝 단계가 요구되지 않고, 다중 서열분석 판독물을 단일 반응으로 완료할 수 있다. 3종의 NGS 플랫폼인 454 라이프 사이언시스(Life Sciences) / 로슈(Roche)로부터의 게놈 시퀀서 FLX(Genome Sequencer FLX)™, 솔렉사(Solexa)로부터의 일루미나 게놈 애널라이저(Illumina Genome Analyser)™ 및 어플라이드 바이오시스템즈(Applied Biosystems)의 SOLiD™ ('올리고 라이게이션 및 검출에 의한 서열분석(Sequencing by Oligo Ligation and Detection)'의 두문자어임)가 상업적으로 입수가능하다. 추가로, 현재 개발되고 있는 2종의 단일 분자 서열분석 방법이 존재한다. 이들은 헬리코스 바이오사이언스(Helicos Bioscience)로부터의 트루 싱글 몰레큘 시퀀싱(true Single Molecule Sequencing; tSMS)™ 및 퍼시픽 바이오사이언시스(Pacific Biosciences)로부터의 싱글 몰레큘 리얼 타임 시퀀싱(Single Molecule Real Time sequencing; SMRT)™을 포함한다.
454 라이프 사이언시스/로슈에 의해 시판되는 게놈 시퀀서 FLX™는 긴 판독물 NGS이며, 이는 에멀젼 PCR 및 파이로시퀀싱을 사용하여 서열분석 판독물을 생성한다. 300 - 800 bp의 DNA 단편 또는 3 - 20 kbp의 단편을 함유하는 라이브러리가 사용될 수 있다. 반응은 총 산출량 250 내지 400개 메가염기를 위해 실행당 약 250 내지 400개 염기의 100만개 초과의 판독물을 생산할 수 있다. 이러한 기술은 최장 길이의 판독물을 생산할 수 있지만, 실행당 총 서열 산출량은 다른 NGS 기술과 비교하여 낮다.
솔렉사에 의해 시판되는 일루미나 게놈 애널라이저™는 형광 염료-표지된 가역적 종결인자 뉴클레오티드를 사용한 합성 접근법에 의한 서열분석을 사용하며 고체-상 가교 PCR에 기반하는 짧은 판독물 NGS이다. 최대 10 kb의 DNA 단편을 함유하는 쌍형성된 말단 서열분석 라이브러리의 구축이 사용될 수 있다. 반응은 길이가 35 - 76개 염기인 짧은 판독물을 1억개 초과로 생산한다. 이러한 데이터는 실행당 3 - 6개 기가염기로부터 얻어질 수 있다.
어플라이드 바이오시스템즈에 의해 시판되는 올리고 라이게이션 및 검출에 의한 서열분석 (SOLiD)™ 시스템은 짧은 판독물 기술이다. 이러한 NGS 기술은 길이가 최대 10 kbp인 단편화된 이중 가닥 DNA를 사용한다. 시스템은 염료-표지된 올리고뉴클레오티드 프라이머의 라이게이션 및 에멀젼 PCR에 의한 서열분석을 사용함으로써 10억개의 짧은 판독물을 생성하여 이를 통해 실행당 최대 30개 기가염기의 총 서열 산출량을 얻는다.
헬리코스 바이오사이언스의 tSMS™ 및 퍼시픽 바이오사이언시스의 SMRT™는 서열 반응을 위해 단일 DNA 분자를 사용하는 상이한 접근법을 적용한다. tSMS™ 헬리코스 시스템은 최대 8억개의 짧은 판독물을 생산하여 이를 통해 실행당 21개 기가염기가 생성된다. 이들 반응은 '합성에 의한 서열분석' 접근법으로 기재되는 형광 염료-표지된 가상 종결인자 뉴클레오티드를 사용하여 완료된다.
퍼시픽 바이오사이언시스에 의해 시판되는 SMRT™ 차세대 서열분석 시스템은 합성에 의한 실시간 서열분석을 사용한다. 이러한 기술은 가역적 종결인자에 의해 제한되지 않는 것에 대한 결과로서 길이가 최대 1,000 bp인 판독물을 생산할 수 있다. 이러한 기술을 사용하여 1일에 이배체 인간 게놈의 1배 커버리지와 동등한 원시 판독물 처리량이 생산될 수 있다.
또 다른 실시양태에서, 검출은 웨스턴 블롯, 노던 블롯 및 서던 블롯을 포함한 블롯팅 검정을 사용하여 완료될 수 있다. 이러한 블롯팅 검정은 생물학적 샘플의 확인 및 정량화를 위한 생물학적 연구에서 통상적으로 사용되는 기술이다. 이들 검정은 먼저 샘플 성분을 겔에서 전기영동 수단에 의해 분리하고, 이어서 전기영동에 의해 분리된 성분을 겔로부터 니트로셀룰로스, 폴리비닐리덴 플루오라이드 (PVDF) 또는 나일론과 같은 물질로 만들어진 전달 막으로 전달하는 것을 포함한다. 분석물은 또한 이들 지지체 상에 직접 스폿팅되거나, 또는 선행 분리 없이 진공, 모세관 작용 또는 압력을 적용하여 지지체 상의 특정 영역에 대해 지시될 수 있다. 이어서 전달 막에 통상적으로 전달후 처리를 적용하여 분석물이 시각적으로 또는 자동화 판독기에 의해 서로 구별되고 검출되는 능력을 증진시킨다.
추가 실시양태에서, 검출은 액체 샘플 또는 습윤 샘플에서 물질, 통상적으로 항원의 존재를 검출하기 위해 고체-상 효소 면역검정을 사용하는 ELISA 검정을 사용하여 완료될 수 있다. 샘플로부터의 항원은 플레이트의 표면에 부착된다. 이어서, 추가의 특정 항체가 항원에 결합할 수 있도록 표면 위에 적용된다. 이러한 항체는 효소에 연결되고, 최종 단계에서, 효소의 기질을 함유하는 물질이 첨가된다. 후속 반응은 검출가능함 신호, 가장 통상적으로는 기질의 색 변화를 가져온다.
형질전환 - 에이. 투메파시엔스 LBA (4404) 숙주 세포를 본원에 개시된 벡터(들)로 형질전환시키는 것은 관련 기술분야에 공지된 임의의 형질전환 기술을 사용하여 수행될 수 있고, 박테리아 숙주 세포는 무손상 세포 또는 원형질체 (즉 세포질을 포함함)로서 형질전환될 수 있다. 예시적인 형질전환 방법론은 천공 방법론, 예를 들어 전기천공, 원형질체 융합, 박테리아 접합, 및 2가 양이온 처리 (염화칼슘 CaCl2 처리 또는 CaCl2/Mg2+ 처리), 또는 관련 기술분야에 널리 공지된 다른 방법을 포함한다. 예를 들어 문헌 [Morrison, J. Bact., 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology, 101:347-362 (Wu et al., eds, 1983), Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 및 Current Protocols in Molecular Biology (Ausubel et al., eds., 1994))]을 참조한다. 다른 공지된 특정 형질전환 방법은 문헌 [Guerout-Fleury, A.M., Frandsen, N. and Stragier,P. (1996) Plasmids for ectopic integration in Bacillus subtilis. Gene 180 (1-2), 57-61]에 기재되어 있다.
통합 부위 - 본 개시내용의 실시양태는 에이. 투메파시엔스 (LBA4404)의 게놈 유전자좌 내 폴리뉴클레오티드 단편을 확인 및 통합시키는 방법을 포함한다. recA 게놈 유전자좌 내 또는 recA 게놈 유전자좌의 바로 상류 또는 하류에 있는 폴리뉴클레오티드 단편 내의 통합이 본원에 제공된다. 폴리뉴클레오티드 단편을 통합시키기 위한 게놈 유전자좌는 서열식별번호: 11로 제공된다. 관련 기술분야의 통상의 기술자는 개시된 게놈 폴리뉴클레오티드 서열의 대립유전자 변이가 에이. 투메파시엔스 (LBA4404)의 서열식별번호: 11 내에서 관찰될 수 있다는 것을 인지할 것이다. 따라서, 본 개시내용은 서열식별번호: 11과 80%, 82.5%, 85%, 87.5%, 90%, 92.5%, 95%, 97.5%, 99%, 99.5% 또는 99.9% 서열 동일성을 갖는 폴리뉴클레오티드 서열에 관한 것이다.
본 개시내용의 다른 실시양태는 폴리뉴클레오티드를 에이. 투메파시엔스 (LBA4404) 게놈 내로 recA 게놈 유전자좌에 통합시키고, 이후 제2 폴리뉴클레오티드를 동일한 위치에 스태킹하는 것을 포함할 수 있다. 여기서, 에이. 투메파시엔스 (LBA4404) 게놈 내 게놈 유전자좌는 추가의 폴리뉴클레오티드를 도입하기 위한 바람직한 유전자좌로서 이용된다. 한 실시양태에서, 서열식별번호: 11 내 임의의 위치는 폴리뉴클레오티드의 에이. 투메파시엔스 (LBA4404) 게놈 내로의 통합을 위한 중성 통합 부위로서의 역할을 한다.
본 개시내용의 다른 실시양태는 유전자 발현 카세트를 함유하는 폴리뉴클레오티드를 에이. 투메파시엔스 (LBA4404) 게놈 내로 recA 게놈 유전자좌에 통합시키고, 이후 통합된 폴리뉴클레오티드로부터 선택 마커 발현 카세트를 제거하는 것을 포함할 수 있다. 여기서, 선택 마커 발현 카세트를 제거하는데 사용되는 방법은 관련 기술분야에 공지된 다른 절제 방법 이외에도, 이중 교차 방법, CRE-LOX를 사용하는 절제 방법, FLP-FRT를 사용하는 절제 방법, 또는 RED/ET 레콤비네이션(RED/ET RECOMBINATION)® 키트 (진브리지스(Genebridges), 독일 하이델베르크)를 사용하는 절제 방법이다.
본 개시내용의 다른 실시양태는 외래 반복 플라스미드의 사용에 대한 대안으로서 폴리뉴클레오티드를 에이. 투메파시엔스 (LBA4404) 게놈 내로 recA 게놈 유전자좌에 통합시키는 것을 포함할 수 있다. 여기서, 1개 이상의 외래 반복 플라스미드는 유사한 복제 기점의 존재, 비상용성 군, 과잉 선택 마커 또는 다른 유전자 요소로 인해 비사용성이다. 여기서, 1개 이상의 외래 반복 플라스미드는 에이. 투메파시엔스 (LBA4404) 제한 변형 시스템의 특이성으로 인해 에이. 투메파시엔스 (LBA4404)에서 기능적이지 않다. 여기서, 1개 이상의 외래 반복 플라스미드는 에이. 투메파시엔스 (LBA4404) 게놈 내에서 이용가능하지 않거나 기능적이지 않거나 용이하게 형질전환가능하지 않다.
본 개시내용의 다른 실시양태는 원핵 세포에서 상동 재조합의 효율을 증가시키는 방법을 포함할 수 있다. 도입된 효소에 의해 매개되는 상동 재조합에 의존하는 방법, 예컨대 람다 red '재조합조작' 및 유사 접근법은 제한된 수의 박테리아 부류, 특히 에스케리키아 (Datsenko and Wanner (2000) Proc Natl Acad Sci U S A. 97: 6640-5) 및 살모넬라(Salmonella)에 유용하다. 도입된 효소에 의해 매개되는 부위-특이적 재조합에 의존하는 방법, 예컨대 파지 인테그라제, FLP/FRT 또는 Cre/loxP가 또한 사용될 수 있지만, 표적 DNA 내 기존 부위의 존재에 의존한다 (Wirth et al. (2007) Current Opinions in Biotechnology 18, 411-419). 대안적 방법은 바이러스 또는 이동 요소 또는 그의 성분 (예를 들어 파지, 트랜스포손 또는 이동 인트론)을 이용한다.
그러나, 숙주-매개 상동 재조합에 의존하는 방법은 단연코 가장 통상적으로 사용되는 염색체 DNA 변형 유형이다. 숙주-매개 상동 재조합의 전형적인 미생물 적용에서, 염색체와 서열 동일성의 단일 영역을 갖는 플라스미드는 때때로 '캠벨(Campbell)-유사 통합'으로 지칭되는 단일-교차 통합에 의해 염색체 내로 통합된다. 이러한 이벤트 후에, 도입된 플라스미드 상의 유전자는 염색체의 일부로 복제되며, 이는 플라스미드 복제보다 더 신속할 수 있다. 따라서, 플라스미드-매개 선택 마커 유전자에 대한 선택 하의 배지에서의 성장은 통합에 대한 선택적 압력을 제공할 수 있다. 캠벨-유사 통합을 사용하여, 관심 유전자의 내부 단편을 플라스미드 상에 배치함으로써 염색체 유전자를 불활성화시킬 수 있어, 통합 후에 염색체가 유전자의 전장 카피를 함유하지 않을 것이다. 캠벨-유사 구성요소 세포의 염색체는 안정하지 않은데, 이는 통합된 플라스미드에 통합을 지시한 상동 서열이 플랭킹되어 있기 때문이다. 이들 서열 사이에 추가의 상동 재조합 이벤트는 플라스미드의 절제 및 염색체의 야생형으로의 역전으로 이어진다. 이러한 이유로, 플라스미드-매개 선택 마커 유전자에 대한 선택을 유지하여 구성요소 클론을 유지하는 것이 필요할 수 있다.
염색체 변형의 기초적 단일-교차 통합 방법에 대한 개선은 2개의 재조합 이벤트를 수반하는, 대립유전자 교환으로도 또한 지칭되는 이중 교차 상동 재조합이다. 목적하는 변형된 대립유전자는 염색체 내 표적 대립유전자에 플랭킹된 영역에 대한 상동성의 영역 ('상동성 아암')이 플랭킹되어 있는 플라스미드에 상에 위치한다. 제1 통합 이벤트는 상동성 아암의 어느 쌍에서 일어나, 캠벨-유사 통합과 동일한 방식으로 플라스미드를 염색체 내로 통합시킬 수 있다. 제1 교차 이벤트 후에, 염색체는 제2 재조합 이벤트를 지시할 수 있는 상동 서열의 2개의 대안적 세트를 함유한다. 제1 이벤트를 지시한 동일한 서열이 재조합되면, 플라스미드는 절제될 것이고, 세포는 야생형으로 복귀할 것이다. 제2 재조합 이벤트가 다른 상동성 아암에 의해 지시되면, 플라스미드는 절제될 것이지만, 원래 염색체 대립유전자는 플라스미드 상에 도입된 변형된 대립유전자로 교환될 것이며; 목적하는 염색체 변형이 달성될 것이다. 캠벨-유사 통합에서와 같이, 제1 재조합 이벤트는 전형적으로 검출되고, 구성요소는 플라스미드-매개 선택 마커 유전자의 통합에 의해 부여된 선택적 이점을 사용하여 단리된다.
본 개시내용의 실시양태는 하기 실시예에서 추가로 예시된다. 이들 실시예는 단지 예시적으로 주어진 것으로 이해되어야 한다.
실시예
실시예 1 아그로박테리움 투메파시엔스 (LBA4404) 게놈 라이브러리의 구축 및 recA 플러스 코스미드 클론의 단리
아그로박테리움 투메파시엔스 (LBA4404)로부터 이전에 특징화되지 않은 recA 유전자를 단리 및 확인하기 위해 게놈 DNA 라이브러리를 구축한다. 에이. 투메파시엔스 (LBA4404)로부터의 게놈 DNA를 제한 효소 Sau3A1 (뉴잉글랜드 바이오랩스(New England Biolabs), 매사추세츠주 입스위치)로 부분적으로 소화시키고, 완충제 (20mM 트리스-HCl, pH 8.0; 10mM EDTA; 및 50mM NaCl) 중 10-40% 불연속적 수크로스 구배로 원심분리에 의해 분획화한다. 약 20-40 kb의 범위에 걸친 크기를 갖는 게놈 DNA 단편을 함유하는 분획을 풀링하고, 넓은-숙주-범위 코스미드 벡터인 pCP13/B (테트라시클린-저항성) 내로 라이게이션한다 (Dessaux Y, Tempe J, Farrand SK. 1987. Genetic analysis of mannityl opine catabolism in octopine-type Agrobacterium tumefaciens strain 15955. Mol Gen Genet. 208(1-2):301-8). 이러한 코스미드 벡터를 BamHI 및 알칼리성 포스파타제로 처리한 후에 라이게이션 반응에 사용한다. 라이게이션 혼합물을 프로메가(Promega)의 패키젠(Packagene)® 람다 DNA 패키징 시스템 (프로메가, 위스콘신주 매디슨)을 사용하여 가공하고, 에스케리키아 콜라이 (HB101) 내로 형질감염시킨다. 생성된 라이브러리 뱅크는 에이. 투메파시엔스 (LBA4404) 게놈 커버리지의 약 20배를 나타내는 약 5,000개 테트라시클린-저항성 코스미드 형질도입체를 함유한다.
에이. 투메파시엔스 (LBA4404)의 recA 유전자를 보유하는 코스미드 클론을 단리하기 위해, 이. 콜라이 (HB101) 박테리아 균주를 라이브러리로부터 단리하고, 0.01% 메탄술폰산 메틸 에스테르 (MMS)를 함유하는 루리아(Luria) 브로쓰 플레이트 상에 스프레딩한다. 이. 콜라이 (HB101)는 recA 돌연변이체이고 따라서 MMS에 대해 감수성이기 때문에, 배지 상에서 성장한 MMS-저항성 콜로니는 에이. 투메파시엔스 (LBA4404)의 recA 유전자를 코딩하는 코스미드를 함유하는 것으로 가정한다 (Farrand SK, O'Morchoe SP, McCutchan J. 1989. Construction of an Agrobacterium tumefaciens C58 recA mutant. J Bacteriol. 171(10):5314-21). 수백개의 MMS-저항성 코스미드 클론을 수득하고, 이들 중 24개를 추가로 정제하고, XhoI를 사용한 제한 효소 소화에 의해 분석한다. XhoI 단편의 공통 하위세트를 공유한 콜로니 중 9개를 프라이머; pCP13/B left 및 pCP13/B right (표 1)를 사용하는 말단 서열분석에 제출한다. 에이. 투메파시엔스 (LBA4404)의 염색체와 에이. 투메파시엔스 (C58)의 서열분석된 균주 사이의 신테니를 가정하면서, recA가 삽입물의 가운데에 위치할 것으로 예상되는 접합부 서열에 대해 코스미드를 조사한다. 하나의 이러한 코스미드인 pCP-MMSR2를 표 1에 추가로 기재된 바와 같은 프라이머를 사용하여 추가의 서열분석에 적용하여 추정적으로 확인된 recA 유전자의 존재를 확인한다.
Figure pct00001
실시예 2 에이. 투메파시엔스 (LBA4404)로부터의 recA 유전자의 클로닝, 특징화 및 서열 분석
에이. 투메파시엔스 (LBA4404)의 recA 유전자 녹-아웃 균주를 구축하기 위해, recA 유전자의 위치를 평가하여 recA 유전자의 위치가 아그로박테리움 및 리조비움(Rhizobium) 종으로부터의 다른 recA 유전자 단리물과 동일한 게놈 문맥에 존재하는지를 결정한다 (Goodner B et al., 2001. Genome sequence of the plant pathogen and biotechnology agent Agrobacterium tumefaciens C58. Science 2942323-2328; 및 Slater SC et al., 2009. Genome sequences of three Agrobacterium biovars help elucidate the evolution of multi-chromosome genomes in bacteria. J Bacteriol. 191(8):2501-11). 따라서, 프라이머 (표 1에서 F-recAnei 및 R-RecAnei)를 설계하기 위해 에이. 투메파시엔스 (C58), 에이. 비티스(A. vitis) (S4), 에이. 라디오박터(A. radiobacter) (K84), 리조비움 레구미노사룸(Rhizobium leguminosarum) 및 리조비움 종(Rhizobium sp.) NGR234로부터의 recA의 상류 및 하류에 위치한 이웃 서열을 고도로 보존된 서열에 대해 검색한다. 이들 서열은 recA 유전자로부터 약 1.5 kb 상류 및 하류에 위치한다. 이들 서열을 에이. 투메파시엔스 (LBA4404)로부터의 recA 유전자를 함유하는 영역과 경계를 이루는 프라이머를 사용하여 PCR에 의해 증폭시킨다. 생성된 3.7 kb PCR 단편을 pWM91 플라스미드 내로 클로닝하여, pWM-recAnei로 표지되는 새로운 플라스미드를 생성한다 (도 1 참조) (Metcalf WW, Jiang W, Daniels LL, Kim SK, Haldimann A, Wanner BL. 1996. Conditionally replicative and conjugative plasmids carrying lacZ alpha for cloning, mutagenesis, and allele replacement in bacteria. Plasmid. 35(1):1-13). PCR 증폭된 recA 유전자 단편을 표 1에 열거된 바와 같은 recAnei 프라이머를 사용하는 서열분석에 제출한다. 서열분석 데이터는 서열식별번호: 10으로 제시되는 에이. 투메파시엔스 (LBA4404)로부터의 recA 유전자를 확인시켜 주었다. 게다가, 서열분석 데이터는 에이. 투메파시엔스로부터의 recA 유전자가 다른 관련 균주와 동일한 게놈 문맥을 함유하며; 그것은 하류 방향으로 alaS 및 상류 방향으로 탄수화물 키나제인 Atu1875가 플랭킹되어 있다는 것을 나타냈다 (recA 유전자 및 상류 및 하류 플랭킹 서열을 함유하는 게놈 서열은 또한 서열식별번호: 11로 제공됨).
에이. 투메파시엔스 (LBA4404)의 recA 유전자는 생물변이형 1 아그로박테리움 균주의 제노모바르-1 단리물, 예컨대 S 377, TT111 및 ATCC4720으로부터의 recA 유전자와 서열에 있어서 거의 동일하다. 추가로, 에이. 투메파시엔스 (LBA4404)의 recA 유전자는 제노모바르-8 균주, 즉 C58의 recA 유전자와 핵산 서열에 있어서 92% 동일성을 공유한다 (Costechareyre et al., 2010). 다른 아그로박테리움 균주 및 관련 분류군으로부터의 recA 유전자와 비교하여 에이. 투메파시엔스 (LBA4404)의 recA 유전자의 전체 관련성을 비교할 수 있고, 이러한 비교의 계통수는 도 2에 제시되어 있다. 에이. 투메파시엔스 (LBA4404)의 recA 유전자의 서열 비교 결과는 에이. 투메파시엔스 (LBA4404) 게놈의 상당수 영역이 에이. 투메파시엔스 (C58)의 경우와 무관한 게놈 DNA 서열을 함유하였다는 것을 시사한다. 추가의 서열 비교는 심지어 아그로박테리움 종의 밀접하게 관련된 생물변이형 1 단리물 중에서도 염색체 다형성이 존재한다는 것을 나타냈다.
실시예 3 MMS-저항성 코스미드에서 카나마이신 또는 클로람페니콜-저항성 카세트를 사용한 recA 유전자의 대체 및 파괴
박테리오파지 λ-기반 red 재조합을 사용하여, 항생제 저항성 카세트를 pCP-MMSR2 상에 보유된 에이. 투메파시엔스 (LBA4404)의 recA 유전자 내로 도입한다 (Datsenko KA, Wanner BL. 2000. One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc Natl Acad Sci U S A. 97(12):6640-5). 간략하게, 표 1에 열거된 프라이머 F-recA-frt 및 R-RecA-frt를 사용하여, 클로람페니콜 및 카나마이신 항생제 저항성 유전자를 코딩하는 DNA 단편을 각각 pKD3 및 pKD4로부터 증폭시킨다. 항생제 카세트를 코딩하는 이들 증폭된 PCR 단편은 recA 유전자의 상류 및 하류에 위치한 43 bp 서열과 플랭킹되어 있다. 서열은 추가로 recA 유전자의 각 말단으로부터의 9 bp를 포함하였다. 생성된 선형 PCR 증폭 산물을 red-매개 재조합을 위해 MMS-저항성 코스미드인 pCP-MMSR2 및 pKD20을 보유한 이. 콜라이 (HB101) 균주 내로 전기천공한다. 플라스미드 pKD20은 red 레콤비나제를 제공하며, 42℃에서 형질전환된 균주의 성장에 의해 재조합 후 치유될 수 있다. 다음에, 코스미드 내 recA 유전자의 파괴는 그것이 이. 콜라이 (HB101)의 MMS 저항성을 회복시킬 수 없을 것임을 시험함으로써 및 프라이머 F3-recAnei 및 R2-RecAnei (표 1)를 사용하는 서열 분석에 의해 확인한다. 여러 이러한 구축물은 이. 콜라이 (HB101)에서 recA 돌연변이를 보완할 수 없을 것이라는 요건을 충족시켰다. 각각의 항생제 저항성 부류 pCP-MMSRΔrecAkan 및 pCP-MMSRΔrecACm 중 하나는 에이. 투메파시엔스 (LBA4404)의 recA 녹-아웃 균주를 구축하기 위해 유지된다.
실시예 4 에이. 투메파시엔스 (LBA4404)의 염색체에서 카나마이신 또는 클로람페니콜-저항성 카세트를 사용한 recA 유전자의 대체 및 파괴
상기 기재된 2종의 recA-파괴된 코스미드 클론을 에이. 투메파시엔스 (LBA4404) 내로 형질전환시켜, 코스미드의 파괴된 recA 유전자를 에이. 투메파시엔스 (LBA4404) 염색체 recA 유전자 내로 마커-교환한다. 간략하게, 에이. 투메파시엔스 (LBA4404) 내로의 recA-파괴된 코스미드의 전기천공 후에, 테트라시클린 및 카나마이신 또는 클로람페니콜을 함유하는 영양 한천 플레이트 상에서 형질전환체를 선택 및 정제한다. 다음에, 단지 카나마이신 또는 클로람페니콜만을 함유하는 액체 배양물에 형질전환체를 접종한다. 이들 배양물을 3회 계대배양하여 이중 교차 이벤트의 확률 및 코스미드 클론의 손실을 증가시킨다. 1000배 희석된 배양물의 50 마이크로리터 부피를 적절한 항생제를 함유하는 플레이트 상에 스프레딩하고, 약 100-200개 콜로니를 골라 카나마이신 또는 클로람페니콜에 대한 저항성 및 테트라시클린 및 MMS 둘 다에 대한 감수성에 대해 시험함으로써 이중 교차에 대해 스크리닝한다. 생성된 후보 recA 녹-아웃 아그로박테리움 균주를 단리하고, UIA777 (Cm) 및 UIA770 (Kan)으로 표지한다. 단리된 recA 녹-아웃 균주를 표 1에 열거된 프라이머를 사용하여 PCR 및 서열 분석에 의해 추가로 확인한다. 에이. 투메파시엔스에서 recA 유전자 녹-아웃을 구축하는 전체 과정은 도 1에 예시되어 있다.
실시예 5 에이. 투메파시엔스 (LBA4404) 균주의 recA 녹-아웃 균주의 성장 특성의 특징화
2종의 에이. 투메파시엔스 (LBA4404) 녹-아웃 recA 균주인 UIA777 및 UIA770을 박테리아 성장 속도에 대해 관찰한다. recA 녹-아웃 균주는 MGL 액체 배지에 접종하였을 때 야생형 균주와 비교하여 1시간 성장 지연을 나타낸 것으로 관찰된다 (도 3 참조). 추가의 관찰은 recA 녹-아웃 균주가 둘 다 고체 영양 한천 플레이트 상에서 훨씬 더 천천히 성장하였다는 것을 나타낸다. 예를 들어, recA 녹-아웃 균주는 콜로니가 직경 약 1-2mm에 도달하는데 3일 넘게 요구된 반면에 야생형 균주는 약 2일 내에 동일한 1-2mm 직경의 크기로 성장한 것으로 관찰된다.
2종의 에이. 투메파시엔스 (LBA4404) 녹-아웃 recA 균주인 UIA777 및 UIA770은 메틸 메탄술포네이트 (MMS) 및 자외선 (UV) 조사에 대한 감수성이 관찰된다. MMS 및 UV 조사에 대한 감수성은 박테리아 recA 녹-아웃 균주의 공통 특징이다 (Farrand SK, O'Morchoe SP, McCutchan J. 1989. Construction of an Agrobacterium tumefaciens C58 recA mutant. J Bacteriol. 171(10):5314-21). 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주의 밤샘 배양물을 MGL 배지 3 ml 내로 100배 희석하고, 진탕하면서 초기 정지기로 성장시킨다. 이어서, 생성된 배양물을 0.9% NaCl 중에 10배 연속 희석하고, 5-μl 샘플을 영양 한천 플레이트의 표면 상에 스팟팅한다. MMS 처리를 위해, 0.01% MMS를 배지 내로 포함시킨다. UV 조사를 위해, 플레이트를 UV 광원 (아머샴-파마시아 바이오테크(Amersham-Pharmacia Biotech), 펜실베니아주 피츠버그)에 노출시켜 내부 UV 선량계에 의해 측정된 바와 같은 정확한 선량의 UV를 전달한다. 노출 직후에, 플레이트를 덮고, 24시간 동안 28℃에서 차광 흑색 상자에서 인큐베이션한다. 제로 희석의 배양물의 역가를 사용하여 MMS의 존재 하 또는 다양한 선량의 UV 조사에 대한 노출 후 세포의 생존을 결정한다. 표 2에 제시된 바와 같이, 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770은 야생형 에이. 투메파시엔스 (LBA4404)와 비교하여 MMS 및 UV 조사 둘 다에 대해 감수성이다.
Figure pct00002
실시예 6 recA 녹-아웃 에이. 투메파시엔스 (LBA4404) 균주의 상보성
C58로부터의 recA 유전자를 함유하는 pCP13/B의 유도체인 플라스미드 pSOM301 (Farrand SK, O'Morchoe SP, McCutchan J. 1989. Construction of an Agrobacterium tumefaciens C58 recA mutant. J Bacteriol. 171(10):5314-21)을 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA770의 느린 성장, MMS 및 UV 감수성을 보완하는 그의 능력에 대해 시험한다. pSOM301 플라스미드는 UIA770의 성장 지연 및 작은 콜로니 표현형을 회복시켰다 (도 3). 그것은 또한 UIA770의 MMS 및 UV 조사에 대한 저항성을 야생형 에이. 투메파시엔스 (LBA4404)에 의해 제시된 경우와 유사한 수준으로 회복시킬 수 있다 (표 2).
실시예 7 recA 녹-아웃 에이. 투메파시엔스 (LBA4404) 균주로부터의 단리된 플라스미드의 특징화
야생형 에이. 투메파시엔스 (LBA4404) 균주는 vir 헬퍼 플라스미드 pAL4404를 보유한다 (Hoekema A, Hirsch PR, Hooykaas PJJJ, Schilperoort, 1983. A binary plant vector strategy based on separation of vir and T-region of the Agrobacterium tumefaciens Ti-plasmid. Nature 303:179-180). pAL4404 헬퍼 플라스미드 (즉, Ti 플라스미드)를 recA 녹-아웃 균주로부터 단리한다. 다음에, 헬퍼 플라스미드를 겔 전기영동 분석에 적용한다. 생성된 겔 분석은 에이. 투메파시엔스 (LBA4404) UIA777 및 UIA770 균주로부터의 단리된 플라스미드가 둘 다 pAL4404와 동일한 이동성으로 이동하는 단일 플라스미드를 보유하였다는 것을 나타냈다.
실시예 8 recA 녹-아웃 에이. 투메파시엔스 (LBA4404) 균주로부터의 3원 플라스미드의 도입
본원에 참조로 포함된 국제 특허 출원 번호 PCT/US2011/046028에 이전에 기재된 바와 같은 3원 플라스미드 (pDAB9292)를 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 내로 형질전환시킨다. 아그로박테리움 균주 내로의 3원 플라스미드의 도입을 분자 확인 검정 (즉, 제한 효소 소화 및 서열분석)에 의해 확인한다.
실시예 9 recA 녹-아웃 에이. 투메파시엔스 (LBA4404) 균주에서 반복 유전자 요소를 함유하는 2원 플라스미드의 안정성
에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주를 시험하여 반복 유전자 요소를 함유하는 2원 플라스미드의 안정성을 평가한다. 이전 실험에서 2원 플라스미드 내 반복 유전자 요소의 사용은 2원 플라스미드를 에이. 투메파시엔스 (LBA4404) 내로 클로닝할 때 재배열되는 것으로 관찰되어 있다. 2원 플라스미드인 pDAB108700 (서열식별번호: 12)는 도 4에 예시되어 있다. 제시된 바와 같이, pDAB108700은 동일한 프로모터에 의해 둘 다 구동되는 2종의 유전자 발현 카세트를 함유한다. 제1 유전자 발현 카세트는 제아 메이스 유비퀴틴-1 프로모터 (Zm Ubi1 프로모터 v2)를 함유하며, 여기에 phi-황색 형광 단백질 (PhiYPF v3) 유전자 서열이 연결되어 있고, 제아 메이스 퍼옥시다제 5 3' UTR (ZmPer5 3'UTR v2)로 종결된다. 제2 유전자 발현 카세트는 제아 메이스 유비퀴틴-1 프로모터 (Zm Ubi1 프로모터 v2)를 함유하며, 여기에 포스피노트리신 아세틸 트랜스퍼라제 (PAT v9) 유전자 서열이 연결되어 있고, 제아 메이스 리파제 3' UTR (ZmLip 3'UTR v1)로 종결된다.
Figure pct00003
2원 플라스미드인 pDAB108700을 표 3의 에이. 투메파시엔스 균주 내로 형질전환시킨다. 형질전환 후에, 2개의 박테리아 콜로니를 각각의 박테리아 균주의 형질전환으로부터 단리한다. 각각의 콜로니를 성장시키고, 2원 플라스미드 DNA를 일련의 제한 효소 소화 (즉, NotI, EcoRI, FsoI 및 PstI 소화)를 사용한 검증을 위해 단리한다. 다음에, 제1 실험으로부터의 1개의 특정 콜로니를 선택하여 고체 배지 상에 스트리킹한다. 고체 배지 상에서 성장한 콜로니 중 10개를 골라 성장시킨다. 2원 플라스미드 DNA를 일련의 제한 효소 소화 (즉, NotI, EcoRI, FsoI 및 PstI 소화)를 사용한 또 다른 회차의 검증을 위해 단리한다. 예상된 크기의 플라스미드-DNA 단편의 생산에 대해 제한 효소 소화의 밴딩 패턴이 관찰한다. 플라스미드-DNA 단편의 이상한 예상외의 크기를 갖는 밴딩 패턴이 생성된 콜로니를 불안정한 것으로 확인한다. 플라스미드-DNA 단편의 예상된 크기를 갖는 밴딩 패턴이 생성된 콜로니를 안정한 것으로 확인한다. 각각의 상이한 균주에 대한 임의의 재배열을 나타내지 않은 플라스미드의 총 백분율을 계산하며, 결과는 표 3에 제시되어 있다.
실시예 10 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주를 사용한 식물-매개 형질전환
식물 종을 관련 기술분야에 공지된 기술을 사용하여 본 개시내용의 실시양태에 따라 형질전환시킨다. 2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770을 식물-매개 형질전환에 사용한다. 형질전환의 결과로서, 선택 마커를 함유하는 유전자 발현 카세트를 식물 염색체 내 게놈 유전자좌 내로 T-가닥으로서 통합시킨다. 상류 및 하류 게놈 플랭킹 서열 내 T-가닥의 통합은 트랜스제닉 식물의 게놈 내에 안정하게 통합된 트랜스제닉 이벤트를 가져온다.
WO 2007/053482의 실시예 #8에 이전에 기재된 동일한 기술을 이용함으로써 2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 중 어느 것을 사용하여 옥수수 식물을 형질전환시킬 수 있다. 일어난 형질전환은 식물 염색체 내 게놈 유전자좌 내로 T-가닥으로서 통합되는 농경학적 형질을 함유하는 유전자 발현 카세트를 혼입시킨다.
WO 2007/053482의 실시예 #11 또는 실시예 #13에 이전에 기재된 동일한 기술을 이용함으로써 2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 중 어느 것을 사용하여 대두 식물을 형질전환시킬 수 있다. 일어난 형질전환은 식물 염색체 내 게놈 유전자좌 내로 T-가닥으로서 통합되는 농경학적 형질을 함유하는 유전자 발현 카세트를 혼입시킨다.
특허 출원 미국 특허 번호 7,838,733의 실시예 #14 또는 WO 2007/053482 (Wright et al.)의 실시예 #12에 이전에 기재된 동일한 기술을 이용함으로써 2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 중 어느 것을 사용하여 목화 식물을 형질전환시킬 수 있다. 일어난 형질전환은 식물 염색체 내 게놈 유전자좌 내로 T-가닥으로서 통합되는 농경학적 형질을 함유하는 유전자 발현 카세트를 혼입시킨다.
특허 출원 미국 특허 번호 7,838,733의 실시예 #26 또는 WO 2007/053482 (Wright et al.)의 실시예 #22에 이전에 기재된 동일한 기술을 이용함으로써 2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 중 어느 것을 사용하여 카놀라 식물을 형질전환시킬 수 있다. 일어난 형질전환은 식물 염색체 내 게놈 유전자좌 내로 T-가닥으로서 통합되는 농경학적 형질을 함유하는 유전자 발현 카세트를 혼입시킨다.
호밀의 아그로박테리움-매개 형질전환에 대해, 예를 들어 문헌 [Popelka JC, Xu J, Altpeter F., "Generation of rye with low transgene copy number after biolistic gene transfer and production of (Secale cereale L.) plants instantly marker-free transgenic rye," Transgenic Res. 2003 Oct;12(5):587-96]을 참조한다. 소르굼의 아그로박테리움-매개 형질전환에 대해, 예를 들어 문헌 [Zhao et al., "Agrobacterium-mediated sorghum transformation," Plant Mol Biol. 2000 Dec;44(6):789-98]을 참조한다. 보리의 아그로박테리움-매개 형질전환에 대해, 예를 들어 문헌 [Tingay et al., "Agrobacterium tumefaciens-mediated barley transformation," The Plant Journal, (1997) 11: 1369-1376]을 참조한다. 밀의 아그로박테리움-매개 형질전환에 대해, 예를 들어 문헌 [Cheng et al., "Genetic Transformation of Wheat Mediated by Agrobacterium tumefaciens," Plant Physiol. 1997 Nov;115(3):971-980]을 참조한다. 벼의 아그로박테리움-매개 형질전환에 대해, 예를 들어 문헌 [Hiei et al., "Transformation of rice mediated by Agrobacterium tumefaciens," Plant Mol. Biol. 1997 Sep;35(1-2):205-18]을 참조한다.
이들 및 다른 식물에 대한 라틴어 명칭이 하기에 주어진다. 2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 중 어느 것을 사용하여 식물을 형질전환시킬 수 있다는 것은 명백할 것이다. 그 결과 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 중 어느 것을 사용하여 농경학적 형질을 이들 및 다른 식물 내로 형질전환시킬 수 있다. 예는 다음을 포함하나 이에 제한되지는 않는다; 메이즈 (제아 메이스(Zea mays)), 밀 (트리티쿰 종(Triticum spp.)), 벼 (오리자 종(Oryza spp.) 및 지자니아 종(Zizania spp.)), 보리 (호르데움 종(Hordeum spp.)), 목화 (아브로마 아우구스타(Abroma augusta) 및 고시피움 종(Gossypium spp.), 대두 (글리신 맥스(Glycine max)), 사탕무 및 테이블 비트 (베타 종(Beta spp.)), 사탕수수 (아렌가 핀나타(Arenga pinnata)), 토마토 (리코페르시콘 에스쿨렌툼(Lycopersicon esculentum) 및 다른 종, 피살리스 이속카르파(Physalis ixocarpa), 솔라눔 인카눔(Solanum incanum) 및 다른 종, 및 시포만드라 베타세아(Cyphomandra betacea)), 감자 (솔라눔 투베로숨(Solanum tuberosum)), 고구마 (이포모에아 바타타스(Ipomoea batatas)), 호밀 (세칼레 종(Secale spp.)), 페퍼 (캅시쿰 안눔(Capsicum annuum), 키넨세(chinense) 및 프루테센스(frutescens)), 상추 (락투카 사티바(Lactuca sativa), 페렌니스(perennis) 및 풀첼라(pulchella)), 양배추 (브라시카 종(Brassica spp.)), 셀러리 (아피움 그라베올렌스(Apium graveolens)), 가지 (솔라눔 멜롱게나(Solanum melongena)), 땅콩 (아라키스 히포가에아(Arachis hypogaea)), 소르굼 (소르굼 종(Sorghum spp.)), 알팔파 (메디카고 사티바(Medicago sativa)), 당근 (다우쿠스 카로타(Daucus carota)), 콩 (파세올루스 종(Phaseolus spp.) 및 다른 속), 귀리 (아베나 사티바(Avena sativa) 및 스트리고사(strigosa)), 완두 (피숨(Pisum), 비그나(Vigna) 및 테트라고놀로부스(Tetragonolobus) 종), 해바라기 (헬리안투스 안누스(Helianthus annuus)), 스쿼시 (쿠쿠르비타 종(Cucurbita spp.)), 오이 (쿠쿠미스 사티바(Cucumis sativa)), 담배 (니코티아나 종(Nicotiana spp.)), 아라비돕시스 (아라비돕시스 탈리아나(Arabidopsis thaliana)), 잔디 (롤리움(Lolium), 아그로스티스(Agrostis), 포아(Poa), 시노돈(Cynodon) 및 다른 속), 클로버 (트리폴리움(Trifolium)), 야생 완두 (비시아(Vicia)). 예를 들어 2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 중 어느 것을 사용한 상기 식물의 형질전환은 본 개시내용의 한 실시양태로 고려된다.
2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770은 많은 낙엽수 및 상록수 재목 경작 시스템의 형질전환에 사용될 수 있다. 트랜스제닉 재목 종은 손상 우려 없이 이들 제초제의 과다 사용의 유연성을 증가시킬 것이다. 이들 종은 다음을 포함하나 이에 제한되지는 않는다; 알더 (알누스 종(Alnus spp.)), 애쉬 (프락시누스 종(Fraxinus spp.)), 백양나무 및 포플러 종 (포풀루스 종(Populus spp.)), 너도밤나무 (파구스 종(Fagus spp.)), 자작나무 (베툴라 종(Betula spp.)), 체리 (프루누스 종(Prunus spp.)), 유칼립투스 (유칼립투스 종(Eucalyptus spp.)), 히코리 (카리아 종(Carya spp.)), 단풍나무 (에이서 종(Acer spp.)), 오크 (퀘르쿠스 종(Quercus spp.)) 및 소나무 (피누스 종(Pinus spp.)).
관상 및 과실-보유 종의 형질전환을 위한, 2원 플라스미드를 함유하는 2종의 에이. 투메파시엔스 (LBA4404) recA 녹-아웃 균주인 UIA777 및 UIA770 중 어느 쪽의 사용은 또한 본 개시내용의 실시양태의 범주 내에 있다. 예는 다음을 포함하나 이에 제한되지는 않는다; 장미 (로사 종(Rosa spp.)) 버닝 부시 (유오니무스 종(Euonymus spp.)), 페튜니아 (페튜니아 종(Petunia spp.)), 베고니아 (베고니아 종(Begonia spp.)), 로도덴드론 (로도덴드론 종(Rhododendron spp.)), 크랩애플 또는 사과 (말루스 종(Malus spp.)), 배 (피루스 종(Pyrus spp.)), 복숭아 (프루누스 종(Prunus spp.)) 및 마리골드 (타게테스 종(Tagetes spp.)). 본 발명의 측면이 특정 실시양태에서 기재되었지만, 이들은 본 개시내용의 취지 및 범주 내에서 추가로 변형될 수 있다.
따라서, 본 출원은 그의 일반적 원리를 사용하는 본 발명의 실시양태의 임의의 변형, 용도 또는 적응을 포함하는 것으로 의도된다. 추가로, 본 출원은, 이들 실시양태가 관련되어 있으며 첨부된 청구범위의 제한 내에 속하는 관련 기술분야의 공지된 또는 통상의 실시 내에 있는 한, 본 개시내용으로부터의 이러한 이탈을 포함하는 것으로 의도된다.
SEQUENCE LISTING <110> Dow AgroSciences LLC GUPTA, Manju BENNETT, Sara KUMAR, Sandeep MERLO, Donald SARDESAI, Nagesh N. <120> METHODS AND COMPOSITIONS FOR RECOMBINATION A GENE-DEFICIENT STRAINS OF AGROBACTERIUM TUMEFACIENS <130> 14764-240069 <150> 62/045947 <151> 2014-09-04 <160> 32 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 1 ggcattcttg gcatagtggt 20 <210> 2 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 2 gctgaagcca gttaccttcg 20 <210> 3 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 3 ccggatcccc gcgttccagc gtcttgcgga aacg 34 <210> 4 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 4 ccggatccgg atagggcatg ccgtgggtga tgatgg 36 <210> 5 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 5 cgttccagcg tcttgcggaa acg 23 <210> 6 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 6 ccgtttcagt ctcgatcatg c 21 <210> 7 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 7 gcattggtga acatcagtgt cgg 23 <210> 8 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 8 ccaccggacg cgaacgcccg gaccttcgaa tgcatcagcc ctcgtgtagg ctggagctgc 60 ttc 63 <210> 9 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Primer used to identify and isolate the recA gene from A. tumefaciens <400> 9 cctgtgcggc ttcaataacc taaaggtgga tcggatggca caacatatga atatcctcct 60 tag 63 <210> 10 <211> 1092 <212> DNA <213> Agrobacterium tumefaciens <400> 10 atggcacaaa attctttgcg tctcgtagag gataaatcgg tggataaaag caaggcactg 60 gaagcggcgc tctcccagat cgaacggtcg ttcggcaagg gatcgatcat gaagctcggt 120 tccaatgaaa acgtggttga agtagagacc atttcgacgg gttctctcag cctggatata 180 gcgctcggta tcggcggcct gccgaagggg cgtatcgttg agatttacgg cccggaaagc 240 tccggtaaga cgacgcttgc gttgcagacg atcgcggaag cccagaaaaa gggcggcatc 300 tgcgccttcg tggatgccga gcacgcgctc gatccggtct atgcccgcaa gctcggtgtg 360 gatttgcaga accttctgat ctcgcagccg gatacgggcg agcaggcgct tgaaatcacc 420 gatacgctgg tgcgctccgg tgccgtcgac attctggtcg tggactcggt tgcggcgctg 480 acgccgcgtg ccgaaatcga aggcgagatg ggtgacagcc tgccgggcct tcaggcacgt 540 ctgatgagcc aggcgctgcg caagctgacc gcctcgatct ccaagtcgaa gtgcatggtg 600 atcttcatca accagatccg catgaagatc ggcgtcatgt tcggttcgcc ggaaacgacg 660 acgggcggta atgcgcttaa attctacgcc tcggtgcgtc tcgacattcg ccgtatcggc 720 gccgtcaagg agcgtgaaga ggttgtcggc aaccagaccc gcgtcaaggt cgtcaagaac 780 aagatggcac cgcctttcaa gcaggtggaa ttcgacatca tgtatggtga aggcgtttcc 840 aagaccggcg agcttgtcga tctcggcgtg aaagccggta tcgtcgagaa atccggtgca 900 tggttctcct ataacagcca gcgtttgggg caggggcgtg aaaatgccaa gactttcctg 960 cgcgacaatc cggaaatggc aagcgagatc gaactggcgc tgcgccagaa cgccggtctg 1020 atcgccgatc ggttcctgca gaatggcggc ccggaagctg gcgaaagcga cgacggtccc 1080 gacgagggct ga 1092 <210> 11 <211> 3680 <212> DNA <213> Agrobacterium tumefaciens <400> 11 agcgcgacga tcggcgcgcc gcgctgtttg gcagcggcaa cctcttgcga atagatgatg 60 gttaggagcg gggagatggg gcgggtcatt ctgtttgttc cagactataa aaaaacgggt 120 tcatgccagc atttcggcct tggggacaag ccccaacatg gtctcgacac tgtcttttga 180 caggtcttgg gcggtggcga aaggcgattg cacggtgatg gcggccgccg cggcacccaa 240 tcgcagggcc tcagtgatgg ctttgccctc cgtaatcgcc gcgagataac ctgacgccat 300 ggcgtctccg gccccggtta cgtctttcac ctcgcggatg atgggtgggt ggaggcttgc 360 ggtttgcgtc gcgttgaagg ctaccacttc gcttgcgcca cgggtgatga cgccgccggc 420 aaggcctgcc ctgcggagaa tgcccggcca gtcgcgaaca ttgtctgccg tctgtccggt 480 cagcgcgcgc gcctctgcct ggttcatgaa gagaatgtcg atatcggcga gcatgtcctt 540 cagcttcacc gccttggcgg gcgaaatggc gatggccgcg agcggctttt ggcaggcgcg 600 ggcaatgaga ccgagcgcct tcaacgtatc ctccggcaga ttggcatcgc aaagcagaag 660 gtcgctcgcg gtaatcgctt cacgcaccgc gcgaactttg aggcggcgcg gcgaaaacag 720 cttgtaaagg tccatatccg caagtgcgat gacaagattg ccgtcgcgct ccagaatggc 780 ggtgtagctt ggcgtgcggc gatcgaggaa aacgaagggc gtatcttcca cgcccgcctg 840 ccttgctgcc tctgccaccg cttcgccggt cacgtcgccg ccgcgcggtg cgatgatacg 900 gacggcaaaa ccgagccggg aaagattgcg cgccgcattg aaaccgccgc cgccagcctc 960 ttccatccat gagccaggat tgctgggcgc cgggcgccgt ttcagtctcg atcatgccgc 1020 gcctgtcata tgcgcgccgc ccagaacgag tatcttcttc acgcttgtgt ttccctcttt 1080 cgcggatgga aaaggtggac gattcgtccc aatcttctgt ttgttcccct tcacatccgg 1140 ttcgcagcga taggccggac acggaaaaac gaaagcagaa caaaccactt atcgctattt 1200 gttttcaata tgctggctgc gccttgcgat atgagaacaa atagagtaca tcctatttcc 1260 atactgcttc attgcctgtg cggcttcaat aacctaaagg tggatcggat ggcacaaaat 1320 tctttgcgtc tcgtagagga taaatcggtg gataaaagca aggcactgga agcggcgctc 1380 tcccagatcg aacggtcgtt cggcaaggga tcgatcatga agctcggttc caatgaaaac 1440 gtggttgaag tagagaccat ttcgacgggt tctctcagcc tggatatagc gctcggtatc 1500 ggcggcctgc cgaaggggcg tatcgttgag atttacggcc cggaaagctc cggtaagacg 1560 acgcttgcgt tgcagacgat cgcggaagcc cagaaaaagg gcggcatctg cgccttcgtg 1620 gatgccgagc acgcgctcga tccggtctat gcccgcaagc tcggtgtgga tttgcagaac 1680 cttctgatct cgcagccgga tacgggcgag caggcgcttg aaatcaccga tacgctggtg 1740 cgctccggtg ccgtcgacat tctggtcgtg gactcggttg cggcgctgac gccgcgtgcc 1800 gaaatcgaag gcgagatggg tgacagcctg ccgggccttc aggcacgtct gatgagccag 1860 gcgctgcgca agctgaccgc ctcgatctcc aagtcgaagt gcatggtgat cttcatcaac 1920 cagatccgca tgaagatcgg cgtcatgttc ggttcgccgg aaacgacgac gggcggtaat 1980 gcgcttaaat tctacgcctc ggtgcgtctc gacattcgcc gtatcggcgc cgtcaaggag 2040 cgtgaagagg ttgtcggcaa ccagacccgc gtcaaggtcg tcaagaacaa gatggcaccg 2100 cctttcaagc aggtggaatt cgacatcatg tatggtgaag gcgtttccaa gaccggcgag 2160 cttgtcgatc tcggcgtgaa agccggtatc gtcgagaaat ccggtgcatg gttctcctat 2220 aacagccagc gtttggggca ggggcgtgaa aatgccaaga ctttcctgcg cgacaatccg 2280 gaaatggcaa gcgagatcga actggcgctg cgccagaacg ccggtctgat cgccgatcgg 2340 ttcctgcaga atggcggccc ggaagctggc gaaagcgacg acggtcccga cgagggctga 2400 tgcattcgaa ggtccgggcg ttcgcgtccg gtggctttgc cggcatgagc cggtatggat 2460 caaaagggtc gtgcgatttt cctcgcgtgg ccctttttct ttgcctagac gccttggtgc 2520 gcctccatgg ctggacaggg caggatgcgg acgataaaag cctttgattt tgcaagatag 2580 ccatcattcg ggatggcggt gatggactcc agctgtgagc ggtgtgtggg catgagcggt 2640 gtgaatgaaa ttcggtcgac ctttctcgac tacttcaaga agaacggaca cgagattgtg 2700 ccctccagcc cgctggtgcc gcgcaacgat ccgacgctga tgttcaccaa tgccggcatg 2760 gtgcagttca agaacgtctt caccggtctc gaaagccgtc cttattccac cgccgcctcg 2820 gcgcagaaat gcgtgcgcgc cggtggcaag cataacgacc tggacaatgt cggttatacg 2880 gcccgtcacc atacgttctt cgaaatgctc ggcaatttct cctttggcga ctatttcaag 2940 gaagaggcga ttacccatgc ctggaacctg atcaccaagg aattcggcat cgaccgcaac 3000 cgtctgctgg tcacggtcta tcacaccgac gacgaggctt ttaatctctg gaagaagatc 3060 gccggtttct ccgacgatcg catcatccgt attccgacca gcgataattt ctgggccatg 3120 ggcgataccg gtccgtgcgg tccctgctcg gaaatcttct atgaccacgg cgatcatatc 3180 tggggcggac cgcccggttc gccggaagag gatggcgacc gtttcatcga aatctggaac 3240 ctcgtcttca tgcaatatga gcagctgacg aaggaagagc gcatcgatct gccgcgcccg 3300 tctatcgaca ccggcatctc gagcgcattt cggcgttgtt gcagggcaaa cacgacaatt 3360 acgacaccga tctgttccgg gcgctgattt cggcctccgt cgaagcgacc ggcgttccgg 3420 cagagggcga gaagcgcgcc agccatcgcg tcattgccga tcatctgcgc tcctccgctt 3480 tcctgatcgc cgatggcgtc ctgccgtcaa atgagggccg tggttacgtt ctgcgccgca 3540 tcatgcgccg cgccatgcgc catgccgagc ttctcggttc gcgcgagccg ctgatctaca 3600 agctgctgcc ggcgctgata cagcagatgg gccgcgccta tccggaactg gttcgcgccg 3660 aggcgctgat ctccgagacg 3680 <210> 12 <211> 363 <212> PRT <213> Agrobacterium tumefaciens <400> 12 Met Ala Gln Asn Ser Leu Arg Leu Val Glu Asp Lys Ser Val Asp Lys 1 5 10 15 Ser Lys Ala Leu Glu Ala Ala Leu Ser Gln Ile Glu Arg Ser Phe Gly 20 25 30 Lys Gly Ser Ile Met Lys Leu Gly Ser Asn Glu Asn Val Val Glu Val 35 40 45 Glu Thr Ile Ser Thr Gly Ser Leu Ser Leu Asp Ile Ala Leu Gly Ile 50 55 60 Gly Gly Leu Pro Lys Gly Arg Ile Val Glu Ile Tyr Gly Pro Glu Ser 65 70 75 80 Ser Gly Lys Thr Thr Leu Ala Leu Gln Thr Ile Ala Glu Ala Gln Lys 85 90 95 Lys Gly Gly Ile Cys Ala Phe Val Asp Ala Glu His Ala Leu Asp Pro 100 105 110 Val Tyr Ala Arg Lys Leu Gly Val Asp Leu Gln Asn Leu Leu Ile Ser 115 120 125 Gln Pro Asp Thr Gly Glu Gln Ala Leu Glu Ile Thr Asp Thr Leu Val 130 135 140 Arg Ser Gly Ala Val Asp Ile Leu Val Val Asp Ser Val Ala Ala Leu 145 150 155 160 Thr Pro Arg Ala Glu Ile Glu Gly Glu Met Gly Asp Ser Leu Pro Gly 165 170 175 Leu Gln Ala Arg Leu Met Ser Gln Ala Leu Arg Lys Leu Thr Ala Ser 180 185 190 Ile Ser Lys Ser Lys Cys Met Val Ile Phe Ile Asn Gln Ile Arg Met 195 200 205 Lys Ile Gly Val Met Phe Gly Ser Pro Glu Thr Thr Thr Gly Gly Asn 210 215 220 Ala Leu Lys Phe Tyr Ala Ser Val Arg Leu Asp Ile Arg Arg Ile Gly 225 230 235 240 Ala Val Lys Glu Arg Glu Glu Val Val Gly Asn Gln Thr Arg Val Lys 245 250 255 Val Val Lys Asn Lys Met Ala Pro Pro Phe Lys Gln Val Glu Phe Asp 260 265 270 Ile Met Tyr Gly Glu Gly Val Ser Lys Thr Gly Glu Leu Val Asp Leu 275 280 285 Gly Val Lys Ala Gly Ile Val Glu Lys Ser Gly Ala Trp Phe Ser Tyr 290 295 300 Asn Ser Gln Arg Leu Gly Gln Gly Arg Glu Asn Ala Lys Thr Phe Leu 305 310 315 320 Arg Asp Asn Pro Glu Met Ala Ser Glu Ile Glu Leu Ala Leu Arg Gln 325 330 335 Asn Ala Gly Leu Ile Ala Asp Arg Phe Leu Gln Asn Gly Gly Pro Glu 340 345 350 Ala Gly Glu Ser Asp Asp Gly Pro Asp Glu Gly 355 360 <210> 13 <211> 3186 <212> DNA <213> Agrobacterium tumefaciens <400> 13 atgactttca cccatcacgc aaagcgcgtc ctgacgatcg ctgcgggaac accgttcctc 60 aaaacgctcg cggaaacgct gtgtgacggg acactgacag ccggctataa atacgaccct 120 gcggatccgc tttcgcttgc caaggtgacg atctatgttc cgacccggcg ctccgcccgc 180 gtgctgcgct cagagtttgt cgatcttctg ggcggccgtt ccgccatttt gccactgatc 240 cggccgctcg gcgaaaccga tgacgacagc ggcttcttcg agatcgaaaa tcctgagatc 300 atggatctgg cgccgccgat ttccggcacc ggccggcaaa tcgagctggc gcgcctcatt 360 ctggcatggc gcaacagcct gcccgacgcc atcagggcca tccattcgga ctcaccactt 420 gtcgcccccg ccagccctgc cgacgccata tggctggcgc gcgcgcttgg cgaagtgatc 480 gatgcgatgg atacggaaga aaaagaatgg gaggcgctcg cgcatctcga taccggcgat 540 cacgcccaat ggtggcagct gacggcggat ttcctgaaaa tcgccagcgt gttctggccc 600 gcccgtcttg ccgaactcaa tcgaacttcc gcaggccgac atcgcaacgg catcctgagg 660 gcagaggcga accggcttgc caacctgccg gacaccggac caatcatcgt tgcgggctcc 720 acgggctcaa ttccggcagc agcagacctt atcgcctctg tcgcctccct gccccagggc 780 gtcgtcgtgc ttccgggcct cgatcttacg atgccggagg aacaatggga ggctattgcc 840 gaggacccta ccgatccttc aagccgcacc cattcgcaat acggactcta catgctgttg 900 cagaagctcg atatcatgcg agacgatgtc gttcagattg gcgctatcga tagcgatctt 960 gaaaaacgcg cggcggtttt ttcggcagca cttgctcctg ccaaatccac cagcgactgg 1020 aaccgctggc gtgaggacaa gcaacccgga tttttcgacg atgcttttgc ggcagcgacc 1080 ctgatagaag ctgcaaacga gcgcgaagag gcaaccgcaa ttgcggtggc gctgcggctg 1140 gcgcttgaag cgccgggcgc tggccgcccg tctcaggccg cgctgatcac gcccgatcgc 1200 ggactggcca ggcgcgtggc gacggaattg caacgcttcg gtatcgaagc cgacgattcc 1260 gccggtacgc cgctttccgc cacgccgcag gccggactga cgcaactcgc actggaagct 1320 atcctcaggc ccggagatcc ggtgccggtc atttcccttc tgaaacatcc gctcagccgt 1380 ttcgggcttt cgctggaggc ttttacaaaa gcatcaaagg cgctggaatt gatcgcactt 1440 agaggcggcc gcgtcgaaac ggaaatcggc aatctggagg cggttctcga tgcgcaactg 1500 gcggcgcagc gtgatgaccg gcatccgcct gcctggaggc tggcactgcc cgagggaagc 1560 gtagacgccg cgcgcgatct ggcacgccgg atcgccgttt cgacagagcc gcttggcagc 1620 gcattcgttc gtagcgaccg ctcaggccgg tctttcacgg acaaattgcc gctttccgat 1680 tgggccgagc ggacgggccg ggtgatcgaa gccatctgcg cggatgacaa caacgatctt 1740 gccactctct ggtccggcga ggcaggcgac aagctttccg gcctgtttgg cgaattgatg 1800 gaaagcggcg aaatcctgga tgcggatggt ccgcaatggg ctgatatctt cgcggcactg 1860 gtggctggcg aatcgatcaa gccgcgatcc atgcgccatc cgcgcatttt cattttcggt 1920 gcccttgagg cacgactgca aagcgtcgac actgtcgtga tcggcggtct caatgaaggg 1980 ctttggccgg gccagacggc aaacaacccg tttctgtccc gcaacatgaa gacagccatc 2040 ggtctggaac cgccggagcg gcgcatcggc cagctggcgc acgatttcga gatggcgaac 2100 gggacacggc agattttcta cagccgcgcg ctcagacagg gctcgacacc cgcagtcgca 2160 tcgcgctggc tgcagcgatt gctggcactc ggcggcgagg attttgccga acagctgaag 2220 aagcgcggcg agacctatcg ccactgggca gccctgatgg atgcgaccat cgaccaggaa 2280 gcagcaaagc gccctgcccc caaaccgccg gccgacttgc agccgaagag ctattccttc 2340 agcgaagtgg gcaggctgcg ccgtgacccc tattcgatct acgcgcggcg tatcctgaag 2400 ctcaacccgc ttgatggctt caaccgcgat cccaatgccg ccgaccgtgg cacgctctat 2460 catgcaatca ttgagcgcta ttcccgcgag gggcatattc ccggcacacc ggcatcgctc 2520 gaggccatgc agcgtattct ggatgagagt ttcgacgcgg aagatcttcc tgcacatgtc 2580 gatgtcatct ggcgcccgcg attcgaggcg gtggcacgcg cctttatcga ctgggagaaa 2640 gaacgacatc catccatccg ccgcagcttt ttcgaggcgc gtgccggaca ggaaatcccc 2700 gaggcaggca taaggctgac cggcatcgcc gaccgcatag atatcaagac cggcggtcag 2760 gcggatatta tcgactacaa aacggggctt gcgccttcag tcaatcaggc gcgcgcgctg 2820 ctcgacccgc agctcgcgct ggaagcggca gcactgatgc ggggcgcctt ccgcgaggcg 2880 ggttcgcaga caccggaaaa ccttatctat gtgcgcctgc ggccgggtac ccgttttttt 2940 gccgaccagg tgaataacga acactccaac cggggtggca aaaaagcacc gaaatcggca 3000 attgagctgg caaccgaatc aatcgatcag ctggccaagt tcgtgcgttc gctgcgtgat 3060 ggcgagaacg gttttgcctc gcggctggtg ccggaggagc agcagtccta tgggggggaa 3120 tatgaccacc tcgcccgcgt ttcggaatgg tcgacggcag aaccgggaga cggcgatgat 3180 gattga 3186 <210> 14 <211> 1061 <212> PRT <213> Agrobacterium tumefaciens <400> 14 Met Thr Phe Thr His His Ala Lys Arg Val Leu Thr Ile Ala Ala Gly 1 5 10 15 Thr Pro Phe Leu Lys Thr Leu Ala Glu Thr Leu Cys Asp Gly Thr Leu 20 25 30 Thr Ala Gly Tyr Lys Tyr Asp Pro Ala Asp Pro Leu Ser Leu Ala Lys 35 40 45 Val Thr Ile Tyr Val Pro Thr Arg Arg Ser Ala Arg Val Leu Arg Ser 50 55 60 Glu Phe Val Asp Leu Leu Gly Gly Arg Ser Ala Ile Leu Pro Leu Ile 65 70 75 80 Arg Pro Leu Gly Glu Thr Asp Asp Asp Ser Gly Phe Phe Glu Ile Glu 85 90 95 Asn Pro Glu Ile Met Asp Leu Ala Pro Pro Ile Ser Gly Thr Gly Arg 100 105 110 Gln Ile Glu Leu Ala Arg Leu Ile Leu Ala Trp Arg Asn Ser Leu Pro 115 120 125 Asp Ala Ile Arg Ala Ile His Ser Asp Ser Pro Leu Val Ala Pro Ala 130 135 140 Ser Pro Ala Asp Ala Ile Trp Leu Ala Arg Ala Leu Gly Glu Val Ile 145 150 155 160 Asp Ala Met Asp Thr Glu Glu Lys Glu Trp Glu Ala Leu Ala His Leu 165 170 175 Asp Thr Gly Asp His Ala Gln Trp Trp Gln Leu Thr Ala Asp Phe Leu 180 185 190 Lys Ile Ala Ser Val Phe Trp Pro Ala Arg Leu Ala Glu Leu Asn Arg 195 200 205 Thr Ser Ala Gly Arg His Arg Asn Gly Ile Leu Arg Ala Glu Ala Asn 210 215 220 Arg Leu Ala Asn Leu Pro Asp Thr Gly Pro Ile Ile Val Ala Gly Ser 225 230 235 240 Thr Gly Ser Ile Pro Ala Ala Ala Asp Leu Ile Ala Ser Val Ala Ser 245 250 255 Leu Pro Gln Gly Val Val Val Leu Pro Gly Leu Asp Leu Thr Met Pro 260 265 270 Glu Glu Gln Trp Glu Ala Ile Ala Glu Asp Pro Thr Asp Pro Ser Ser 275 280 285 Arg Thr His Ser Gln Tyr Gly Leu Tyr Met Leu Leu Gln Lys Leu Asp 290 295 300 Ile Met Arg Asp Asp Val Val Gln Ile Gly Ala Ile Asp Ser Asp Leu 305 310 315 320 Glu Lys Arg Ala Ala Val Phe Ser Ala Ala Leu Ala Pro Ala Lys Ser 325 330 335 Thr Ser Asp Trp Asn Arg Trp Arg Glu Asp Lys Gln Pro Gly Phe Phe 340 345 350 Asp Asp Ala Phe Ala Ala Ala Thr Leu Ile Glu Ala Ala Asn Glu Arg 355 360 365 Glu Glu Ala Thr Ala Ile Ala Val Ala Leu Arg Leu Ala Leu Glu Ala 370 375 380 Pro Gly Ala Gly Arg Pro Ser Gln Ala Ala Leu Ile Thr Pro Asp Arg 385 390 395 400 Gly Leu Ala Arg Arg Val Ala Thr Glu Leu Gln Arg Phe Gly Ile Glu 405 410 415 Ala Asp Asp Ser Ala Gly Thr Pro Leu Ser Ala Thr Pro Gln Ala Gly 420 425 430 Leu Thr Gln Leu Ala Leu Glu Ala Ile Leu Arg Pro Gly Asp Pro Val 435 440 445 Pro Val Ile Ser Leu Leu Lys His Pro Leu Ser Arg Phe Gly Leu Ser 450 455 460 Leu Glu Ala Phe Thr Lys Ala Ser Lys Ala Leu Glu Leu Ile Ala Leu 465 470 475 480 Arg Gly Gly Arg Val Glu Thr Glu Ile Gly Asn Leu Glu Ala Val Leu 485 490 495 Asp Ala Gln Leu Ala Ala Gln Arg Asp Asp Arg His Pro Pro Ala Trp 500 505 510 Arg Leu Ala Leu Pro Glu Gly Ser Val Asp Ala Ala Arg Asp Leu Ala 515 520 525 Arg Arg Ile Ala Val Ser Thr Glu Pro Leu Gly Ser Ala Phe Val Arg 530 535 540 Ser Asp Arg Ser Gly Arg Ser Phe Thr Asp Lys Leu Pro Leu Ser Asp 545 550 555 560 Trp Ala Glu Arg Thr Gly Arg Val Ile Glu Ala Ile Cys Ala Asp Asp 565 570 575 Asn Asn Asp Leu Ala Thr Leu Trp Ser Gly Glu Ala Gly Asp Lys Leu 580 585 590 Ser Gly Leu Phe Gly Glu Leu Met Glu Ser Gly Glu Ile Leu Asp Ala 595 600 605 Asp Gly Pro Gln Trp Ala Asp Ile Phe Ala Ala Leu Val Ala Gly Glu 610 615 620 Ser Ile Lys Pro Arg Ser Met Arg His Pro Arg Ile Phe Ile Phe Gly 625 630 635 640 Ala Leu Glu Ala Arg Leu Gln Ser Val Asp Thr Val Val Ile Gly Gly 645 650 655 Leu Asn Glu Gly Leu Trp Pro Gly Gln Thr Ala Asn Asn Pro Phe Leu 660 665 670 Ser Arg Asn Met Lys Thr Ala Ile Gly Leu Glu Pro Pro Glu Arg Arg 675 680 685 Ile Gly Gln Leu Ala His Asp Phe Glu Met Ala Asn Gly Thr Arg Gln 690 695 700 Ile Phe Tyr Ser Arg Ala Leu Arg Gln Gly Ser Thr Pro Ala Val Ala 705 710 715 720 Ser Arg Trp Leu Gln Arg Leu Leu Ala Leu Gly Gly Glu Asp Phe Ala 725 730 735 Glu Gln Leu Lys Lys Arg Gly Glu Thr Tyr Arg His Trp Ala Ala Leu 740 745 750 Met Asp Ala Thr Ile Asp Gln Glu Ala Ala Lys Arg Pro Ala Pro Lys 755 760 765 Pro Pro Ala Asp Leu Gln Pro Lys Ser Tyr Ser Phe Ser Glu Val Gly 770 775 780 Arg Leu Arg Arg Asp Pro Tyr Ser Ile Tyr Ala Arg Arg Ile Leu Lys 785 790 795 800 Leu Asn Pro Leu Asp Gly Phe Asn Arg Asp Pro Asn Ala Ala Asp Arg 805 810 815 Gly Thr Leu Tyr His Ala Ile Ile Glu Arg Tyr Ser Arg Glu Gly His 820 825 830 Ile Pro Gly Thr Pro Ala Ser Leu Glu Ala Met Gln Arg Ile Leu Asp 835 840 845 Glu Ser Phe Asp Ala Glu Asp Leu Pro Ala His Val Asp Val Ile Trp 850 855 860 Arg Pro Arg Phe Glu Ala Val Ala Arg Ala Phe Ile Asp Trp Glu Lys 865 870 875 880 Glu Arg His Pro Ser Ile Arg Arg Ser Phe Phe Glu Ala Arg Ala Gly 885 890 895 Gln Glu Ile Pro Glu Ala Gly Ile Arg Leu Thr Gly Ile Ala Asp Arg 900 905 910 Ile Asp Ile Lys Thr Gly Gly Gln Ala Asp Ile Ile Asp Tyr Lys Thr 915 920 925 Gly Leu Ala Pro Ser Val Asn Gln Ala Arg Ala Leu Leu Asp Pro Gln 930 935 940 Leu Ala Leu Glu Ala Ala Ala Leu Met Arg Gly Ala Phe Arg Glu Ala 945 950 955 960 Gly Ser Gln Thr Pro Glu Asn Leu Ile Tyr Val Arg Leu Arg Pro Gly 965 970 975 Thr Arg Phe Phe Ala Asp Gln Val Asn Asn Glu His Ser Asn Arg Gly 980 985 990 Gly Lys Lys Ala Pro Lys Ser Ala Ile Glu Leu Ala Thr Glu Ser Ile 995 1000 1005 Asp Gln Leu Ala Lys Phe Val Arg Ser Leu Arg Asp Gly Glu Asn 1010 1015 1020 Gly Phe Ala Ser Arg Leu Val Pro Glu Glu Gln Gln Ser Tyr Gly 1025 1030 1035 Gly Glu Tyr Asp His Leu Ala Arg Val Ser Glu Trp Ser Thr Ala 1040 1045 1050 Glu Pro Gly Asp Gly Asp Asp Asp 1055 1060 <210> 15 <211> 1128 <212> DNA <213> Agrobacterium tumefaciens <400> 15 atgttatttt caccgcaaca ggacgaagcg ctcaaggctg tttcccgctg gctgaaggaa 60 ggccggacgc cggtttttcg gttgttcggt tatgccggaa ccggcaagac gacgcttgcc 120 aaacatttcg cggaaaatgt cgatggcgaa gtgctgtttg cggccttcac cggcaaggcg 180 gcgcaggtgc tgcgctcgcg cggggcgacc aatgcccgca ccatccattc gctgatctac 240 cgcccgcgcg gcgaagagac cgtggaagac gaggagaccg gcaagacctc ggtcgcgcca 300 atgttttcca tcaaccgcca gagcccgctc gccaaggcgg cactcatcat catcgatgaa 360 tgttcgatgg tggatgagca gctcggcaag gatctgatga gcttcggcac gcctatcctg 420 gtgctcggcg atcccgggca gttgccgcca gtttcaggcg gtggcttctt cacggagcag 480 gagcctgatt acctgctctc cgaaattcat cggcaggcca aggacaatcc catcatccac 540 cttgccatgg atgtgcggga aggccgcgag atcatgcgtg gcgattacgg tgccgcgcag 600 gtgatttcca agtccgaggt gacacagtcg ctcgtgctcg atgccgatca ggtgctcgtc 660 ggcacaaatc gcacgcgacg ccgttataac cagcggcttc gcgagctgaa gggatttacg 720 gccgattatc cgcaatccgg cgacaagctg gtttgcttga ggaacgatcc ggccaagggc 780 ctgctgaacg gctctctctg gcaggtcatg agttcgtcgc gcgagacggt gaaacccggc 840 atcaacctga tgatccggcc tgaagacgac gatatggatc ggggcgcggc caagatcaaa 900 ttgctgaagg cggctttcga ggatgtggaa acggaaattc cgtggaccac ccgcaagcgt 960 tatgacgagt tcgatttcgg ctatgcgctg accgtgcaca aggcgcaggg ttcgcagtgg 1020 aacaatgtgg ttctctttga cgagagctat gccttccgcg attcgcgcga gcggtggctt 1080 tacaccgcca tcacccgcgc cgcagaaaca ctcacaatcg ttcgctga 1128 <210> 16 <211> 375 <212> PRT <213> Agrobacterium tumefaciens <400> 16 Met Leu Phe Ser Pro Gln Gln Asp Glu Ala Leu Lys Ala Val Ser Arg 1 5 10 15 Trp Leu Lys Glu Gly Arg Thr Pro Val Phe Arg Leu Phe Gly Tyr Ala 20 25 30 Gly Thr Gly Lys Thr Thr Leu Ala Lys His Phe Ala Glu Asn Val Asp 35 40 45 Gly Glu Val Leu Phe Ala Ala Phe Thr Gly Lys Ala Ala Gln Val Leu 50 55 60 Arg Ser Arg Gly Ala Thr Asn Ala Arg Thr Ile His Ser Leu Ile Tyr 65 70 75 80 Arg Pro Arg Gly Glu Glu Thr Val Glu Asp Glu Glu Thr Gly Lys Thr 85 90 95 Ser Val Ala Pro Met Phe Ser Ile Asn Arg Gln Ser Pro Leu Ala Lys 100 105 110 Ala Ala Leu Ile Ile Ile Asp Glu Cys Ser Met Val Asp Glu Gln Leu 115 120 125 Gly Lys Asp Leu Met Ser Phe Gly Thr Pro Ile Leu Val Leu Gly Asp 130 135 140 Pro Gly Gln Leu Pro Pro Val Ser Gly Gly Gly Phe Phe Thr Glu Gln 145 150 155 160 Glu Pro Asp Tyr Leu Leu Ser Glu Ile His Arg Gln Ala Lys Asp Asn 165 170 175 Pro Ile Ile His Leu Ala Met Asp Val Arg Glu Gly Arg Glu Ile Met 180 185 190 Arg Gly Asp Tyr Gly Ala Ala Gln Val Ile Ser Lys Ser Glu Val Thr 195 200 205 Gln Ser Leu Val Leu Asp Ala Asp Gln Val Leu Val Gly Thr Asn Arg 210 215 220 Thr Arg Arg Arg Tyr Asn Gln Arg Leu Arg Glu Leu Lys Gly Phe Thr 225 230 235 240 Ala Asp Tyr Pro Gln Ser Gly Asp Lys Leu Val Cys Leu Arg Asn Asp 245 250 255 Pro Ala Lys Gly Leu Leu Asn Gly Ser Leu Trp Gln Val Met Ser Ser 260 265 270 Ser Arg Glu Thr Val Lys Pro Gly Ile Asn Leu Met Ile Arg Pro Glu 275 280 285 Asp Asp Asp Met Asp Arg Gly Ala Ala Lys Ile Lys Leu Leu Lys Ala 290 295 300 Ala Phe Glu Asp Val Glu Thr Glu Ile Pro Trp Thr Thr Arg Lys Arg 305 310 315 320 Tyr Asp Glu Phe Asp Phe Gly Tyr Ala Leu Thr Val His Lys Ala Gln 325 330 335 Gly Ser Gln Trp Asn Asn Val Val Leu Phe Asp Glu Ser Tyr Ala Phe 340 345 350 Arg Asp Ser Arg Glu Arg Trp Leu Tyr Thr Ala Ile Thr Arg Ala Ala 355 360 365 Glu Thr Leu Thr Ile Val Arg 370 375 <210> 17 <211> 1128 <212> DNA <213> Agrobacterium tumefaciens <400> 17 atgacgaata aggtgtcgct tttacggctg aaactcacgg acttccgcaa ctatgcggcg 60 gcgtcgcttg cgctggatga ccgccacgtg gtgctgacgg gtgacaacgg ttccggcaag 120 accaatctcc tggaggctgt ttcgtttctg tcgcccggaa ggggcctgcg ccgcgccacc 180 ctgtccgatg tgacgcgagt gggggcggag gccgccggtt tttcgatttt tgcggatgtc 240 gacggcatgg acggcgaggt cgccatcgga accgggatcg agggtgacgg cgaggtagtg 300 tcgcgccgcc tgaggctgaa cgggacatcg gtgaagtcgg tcgatgaatt gacggatcat 360 ctgcgggtgc tgtggctgac gcctgccatg gatgggcttt ttaccggttc atcctcggat 420 cgccggcgtt ttctcgatcg gttggtgctc tcgctcgatc ccgcgcatgg gcggcgggca 480 agcgacttcg aaaaggccat gcgcggccgc aaccgtctgc tttcggaagg ccgtttcgat 540 ccggtctggc tggacggtat cgagaagcag atggcggaac tcggcatttc catggcgctc 600 gcgcgctatg aaatgttggg tcttttgaaa agcctcatcg aaggccgttc cggcaatgct 660 gccttcccct ctgcagcgct ggcgctctcg ggtttcatgg acgacacgct caaccggccg 720 gctgtcgatc tggaagacga gtataggctt atgctgcgcg aaggccggta tcgagacgcg 780 gcggcgggcc gcacgcttga tggaccgcac cgtgtcgatc tgttcgtgcg ccatgcggaa 840 aagaacatgg aggcagagcg ttgctcgacc ggagaacaga aggcgctgct ggtgggattg 900 gtgcttgcgc atgcccagct caccgccaac atgaccggcc atgcgccggt tctgctgctc 960 gacgaaattg ccgcgcatct ggatgagggc aggcgggcgg ctctgttcga tctcattcac 1020 gcgctcggtg gtcagagttt catgaccgga acggatgcgg caatgttctc cgcccttggc 1080 gacagggcgc aattcttcaa tgtctcccac gggggcatca cggcatga 1128 <210> 18 <211> 375 <212> PRT <213> Agrobacterium tumefaciens <400> 18 Met Thr Asn Lys Val Ser Leu Leu Arg Leu Lys Leu Thr Asp Phe Arg 1 5 10 15 Asn Tyr Ala Ala Ala Ser Leu Ala Leu Asp Asp Arg His Val Val Leu 20 25 30 Thr Gly Asp Asn Gly Ser Gly Lys Thr Asn Leu Leu Glu Ala Val Ser 35 40 45 Phe Leu Ser Pro Gly Arg Gly Leu Arg Arg Ala Thr Leu Ser Asp Val 50 55 60 Thr Arg Val Gly Ala Glu Ala Ala Gly Phe Ser Ile Phe Ala Asp Val 65 70 75 80 Asp Gly Met Asp Gly Glu Val Ala Ile Gly Thr Gly Ile Glu Gly Asp 85 90 95 Gly Glu Val Val Ser Arg Arg Leu Arg Leu Asn Gly Thr Ser Val Lys 100 105 110 Ser Val Asp Glu Leu Thr Asp His Leu Arg Val Leu Trp Leu Thr Pro 115 120 125 Ala Met Asp Gly Leu Phe Thr Gly Ser Ser Ser Asp Arg Arg Arg Phe 130 135 140 Leu Asp Arg Leu Val Leu Ser Leu Asp Pro Ala His Gly Arg Arg Ala 145 150 155 160 Ser Asp Phe Glu Lys Ala Met Arg Gly Arg Asn Arg Leu Leu Ser Glu 165 170 175 Gly Arg Phe Asp Pro Val Trp Leu Asp Gly Ile Glu Lys Gln Met Ala 180 185 190 Glu Leu Gly Ile Ser Met Ala Leu Ala Arg Tyr Glu Met Leu Gly Leu 195 200 205 Leu Lys Ser Leu Ile Glu Gly Arg Ser Gly Asn Ala Ala Phe Pro Ser 210 215 220 Ala Ala Leu Ala Leu Ser Gly Phe Met Asp Asp Thr Leu Asn Arg Pro 225 230 235 240 Ala Val Asp Leu Glu Asp Glu Tyr Arg Leu Met Leu Arg Glu Gly Arg 245 250 255 Tyr Arg Asp Ala Ala Ala Gly Arg Thr Leu Asp Gly Pro His Arg Val 260 265 270 Asp Leu Phe Val Arg His Ala Glu Lys Asn Met Glu Ala Glu Arg Cys 275 280 285 Ser Thr Gly Glu Gln Lys Ala Leu Leu Val Gly Leu Val Leu Ala His 290 295 300 Ala Gln Leu Thr Ala Asn Met Thr Gly His Ala Pro Val Leu Leu Leu 305 310 315 320 Asp Glu Ile Ala Ala His Leu Asp Glu Gly Arg Arg Ala Ala Leu Phe 325 330 335 Asp Leu Ile His Ala Leu Gly Gly Gln Ser Phe Met Thr Gly Thr Asp 340 345 350 Ala Ala Met Phe Ser Ala Leu Gly Asp Arg Ala Gln Phe Phe Asn Val 355 360 365 Ser His Gly Gly Ile Thr Ala 370 375 <210> 19 <211> 2106 <212> DNA <213> Agrobacterium tumefaciens <400> 19 atgcgtcccg ccattctcga tccgctattt gcttccgtct ccacccttgc cggtgtgggg 60 ccgaagcttg ccgaccttct ggccaaactg ctgagccggg aaaatgccga cgacacccgc 120 gtgatcgatc ttctgttcca cgcgccatca aacgtcatcg accggcgcaa ccgcccgggc 180 atcgcgcttg ccgctcccgg cgccattgtc accatccagg gacgtgtcga ccggcatcag 240 ccagctccac caggcaatcg ttccgcgccc taccgtgttt tcctgcatga cgagaccggg 300 gaactggcgc tgaccttctt ccgcgccaag ggagactggc tttccaaggc cttacccgtc 360 gatgaagagg ttctcgtcag cggcaaggtg gactggttca acggccgcgc ctccatggtg 420 catccggatt tcatggtgaa gctctccgag gccgagaacc tgccgctggt cgaagccgtt 480 tatccgatga cagccgggct gtctccgaag gtgctgcggc gggcaattga aggcgggctt 540 tcgaaactgc cggtctttcc cgaatggatc gacgaaacgc tcaagacccg tcagggtttc 600 ggcgacgtgg catcgagctt ccgtgagttg cacgatccgc gcgacagcgc cgatatcgat 660 cctcaggccc cggcacgcag acggctcgcc tacgacgaat tcctggccgg gcagctgtca 720 ctggcgctgg tgcggcaaag actgcgcaag gtcgcgggcc agccgatccg cgccaagggg 780 gacattgctg caaaaatcct gtcgcaactg cccttctccc tgacgccgag ccagaatgcc 840 tcggtgaaag atatcctgac cgatatggcc agcgaggacc gtatgttgcg gctgttgcaa 900 ggcgatgtcg gcgcgggcaa gacgctggtg gcgctgatgg ctatggcaac cgccgtcgag 960 gccggagggc aggcggtgtt gatggccccg accgaaattc ttgcccggca gcatttcgcc 1020 accatctcca aactcgccaa tgccgtgggc attacggttg aggtgctgac cggccgcacc 1080 aagggcaagg agcgtcgcga gatcgaagaa cgcgtggcct ccggtgaggc acagatcgtc 1140 atcggcaccc acgcgctgtt ccaggacagc gtgagttaca agaacctcgt gctggccgtg 1200 gtggatgagc agcaccgttt cggcgtacac cagcgcctgc gtctcaccgc caagggcatc 1260 acgccgcata tgcttgttat gaccgccacg cccattccgc gcacgctggt gctggccgcc 1320 ttcggcgaca tggatgtgtc gaaactcacc gaaaaaccgg ccggccgaaa accgatccag 1380 accgtgacaa tccccacaga gcgcatcggc gacatcgtcg agcggctgcg cgccgcgctg 1440 aaggagggca agaaggccta ctggatctgc ccgctggtgg aggagacgga agagtccgac 1500 ctgatgtcgg cggaagaacg acatgcggtt ctctcgcaga tgctcggtgc caatatcggt 1560 ctcatccatg ggcgcatgag cggccctgag aaggacgccg ccatgctggc tttcaagaac 1620 ggcgaaaccc ggctgctggt tgcaacgaca gtggtggaag tgggtgtcga cgttccggac 1680 gccacgatca tggtcatcga acatgccgaa cgtttcggcc tggcccagct tcaccagctg 1740 cgtggccggg ttggacgcgg tgacgaggcc tccacctgca tcctgctcta taaggggccg 1800 ctcagcgaaa acggccgcgc ccgactttcc atcctgcgcg acagcgagga cggcttcctg 1860 attgccgaag aggatttgaa gctgcgcggc gaaggcgaac tcctcggcac ccgccagtcc 1920 ggaaccccgg gcttccgcat cgccagcctc gaagcccatg ccgatctcct ggaaatcgcc 1980 cgcaaggacg ccgcctatgt catcgagcgc gaccccgaac tgaccggccc gcgcggcgaa 2040 agcctgcgca ccctgctcta tctgcaccgc cgcgacgaag ctatccgctt cctgcacgcc 2100 ggctga 2106 <210> 20 <211> 701 <212> PRT <213> Agrobacterium tumefaciens <400> 20 Met Arg Pro Ala Ile Leu Asp Pro Leu Phe Ala Ser Val Ser Thr Leu 1 5 10 15 Ala Gly Val Gly Pro Lys Leu Ala Asp Leu Leu Ala Lys Leu Leu Ser 20 25 30 Arg Glu Asn Ala Asp Asp Thr Arg Val Ile Asp Leu Leu Phe His Ala 35 40 45 Pro Ser Asn Val Ile Asp Arg Arg Asn Arg Pro Gly Ile Ala Leu Ala 50 55 60 Ala Pro Gly Ala Ile Val Thr Ile Gln Gly Arg Val Asp Arg His Gln 65 70 75 80 Pro Ala Pro Pro Gly Asn Arg Ser Ala Pro Tyr Arg Val Phe Leu His 85 90 95 Asp Glu Thr Gly Glu Leu Ala Leu Thr Phe Phe Arg Ala Lys Gly Asp 100 105 110 Trp Leu Ser Lys Ala Leu Pro Val Asp Glu Glu Val Leu Val Ser Gly 115 120 125 Lys Val Asp Trp Phe Asn Gly Arg Ala Ser Met Val His Pro Asp Phe 130 135 140 Met Val Lys Leu Ser Glu Ala Glu Asn Leu Pro Leu Val Glu Ala Val 145 150 155 160 Tyr Pro Met Thr Ala Gly Leu Ser Pro Lys Val Leu Arg Arg Ala Ile 165 170 175 Glu Gly Gly Leu Ser Lys Leu Pro Val Phe Pro Glu Trp Ile Asp Glu 180 185 190 Thr Leu Lys Thr Arg Gln Gly Phe Gly Asp Val Ala Ser Ser Phe Arg 195 200 205 Glu Leu His Asp Pro Arg Asp Ser Ala Asp Ile Asp Pro Gln Ala Pro 210 215 220 Ala Arg Arg Arg Leu Ala Tyr Asp Glu Phe Leu Ala Gly Gln Leu Ser 225 230 235 240 Leu Ala Leu Val Arg Gln Arg Leu Arg Lys Val Ala Gly Gln Pro Ile 245 250 255 Arg Ala Lys Gly Asp Ile Ala Ala Lys Ile Leu Ser Gln Leu Pro Phe 260 265 270 Ser Leu Thr Pro Ser Gln Asn Ala Ser Val Lys Asp Ile Leu Thr Asp 275 280 285 Met Ala Ser Glu Asp Arg Met Leu Arg Leu Leu Gln Gly Asp Val Gly 290 295 300 Ala Gly Lys Thr Leu Val Ala Leu Met Ala Met Ala Thr Ala Val Glu 305 310 315 320 Ala Gly Gly Gln Ala Val Leu Met Ala Pro Thr Glu Ile Leu Ala Arg 325 330 335 Gln His Phe Ala Thr Ile Ser Lys Leu Ala Asn Ala Val Gly Ile Thr 340 345 350 Val Glu Val Leu Thr Gly Arg Thr Lys Gly Lys Glu Arg Arg Glu Ile 355 360 365 Glu Glu Arg Val Ala Ser Gly Glu Ala Gln Ile Val Ile Gly Thr His 370 375 380 Ala Leu Phe Gln Asp Ser Val Ser Tyr Lys Asn Leu Val Leu Ala Val 385 390 395 400 Val Asp Glu Gln His Arg Phe Gly Val His Gln Arg Leu Arg Leu Thr 405 410 415 Ala Lys Gly Ile Thr Pro His Met Leu Val Met Thr Ala Thr Pro Ile 420 425 430 Pro Arg Thr Leu Val Leu Ala Ala Phe Gly Asp Met Asp Val Ser Lys 435 440 445 Leu Thr Glu Lys Pro Ala Gly Arg Lys Pro Ile Gln Thr Val Thr Ile 450 455 460 Pro Thr Glu Arg Ile Gly Asp Ile Val Glu Arg Leu Arg Ala Ala Leu 465 470 475 480 Lys Glu Gly Lys Lys Ala Tyr Trp Ile Cys Pro Leu Val Glu Glu Thr 485 490 495 Glu Glu Ser Asp Leu Met Ser Ala Glu Glu Arg His Ala Val Leu Ser 500 505 510 Gln Met Leu Gly Ala Asn Ile Gly Leu Ile His Gly Arg Met Ser Gly 515 520 525 Pro Glu Lys Asp Ala Ala Met Leu Ala Phe Lys Asn Gly Glu Thr Arg 530 535 540 Leu Leu Val Ala Thr Thr Val Val Glu Val Gly Val Asp Val Pro Asp 545 550 555 560 Ala Thr Ile Met Val Ile Glu His Ala Glu Arg Phe Gly Leu Ala Gln 565 570 575 Leu His Gln Leu Arg Gly Arg Val Gly Arg Gly Asp Glu Ala Ser Thr 580 585 590 Cys Ile Leu Leu Tyr Lys Gly Pro Leu Ser Glu Asn Gly Arg Ala Arg 595 600 605 Leu Ser Ile Leu Arg Asp Ser Glu Asp Gly Phe Leu Ile Ala Glu Glu 610 615 620 Asp Leu Lys Leu Arg Gly Glu Gly Glu Leu Leu Gly Thr Arg Gln Ser 625 630 635 640 Gly Thr Pro Gly Phe Arg Ile Ala Ser Leu Glu Ala His Ala Asp Leu 645 650 655 Leu Glu Ile Ala Arg Lys Asp Ala Ala Tyr Val Ile Glu Arg Asp Pro 660 665 670 Glu Leu Thr Gly Pro Arg Gly Glu Ser Leu Arg Thr Leu Leu Tyr Leu 675 680 685 His Arg Arg Asp Glu Ala Ile Arg Phe Leu His Ala Gly 690 695 700 <210> 21 <211> 1809 <212> DNA <213> Agrobacterium tumefaciens <400> 21 atggcaatga tggagccggc cgataccgtg gtccgcgcat ttcttagcgt ggagcggtcg 60 gcgacagagc aacgttgggt ttcgcggctg gatcaggccg cacagaaccg tgcgctggcc 120 atgtcccaga tccatgccat tcccgaactg attgcccggg tgctggccgg gcgaggggtg 180 ggggtggatg aggctctcgc tttcctcgat ccgaccattc gctcattgat gcccgacccg 240 catgtgctga cagattgcga aaaggctgcc gaaaggctgg tccgcgccat tgagaccggc 300 gagaaggtgg cgatcttcgg cgattatgac gttgatggcg ccgcgtcttc cgcgctgatg 360 tatcggtttc tcgcacattt cgggctgacg ccggaaatct atattccaga tcgtattttc 420 gagggttatg ggccgaaccc ggcggcgatg cagcagcttg ccgccaatgg cgcgaccctg 480 atcgtgacgg ttgattgcgg ctccaccagc catgaatcgc tgaatgccgc aaaggatgcg 540 ggaacagatg tggtggtgat cgatcaccac caggtcggtt cggaactgcc gccggcggtg 600 gcgttggtca atcccaaccg cgaagacgat ctttcggggc aggggcatct ctgcgccgca 660 ggcgtggtgt ttctggttct ggtcgccacc ctcaggctgt tgaaggacag gcgcaacaga 720 caggcgttca cgatcgatct gctggcgctg ctggatatag tcgcactcgc aaccgtatgc 780 gacgtggtgc ccttgaaggg gctgaaccgc gcctatgtgg taaaggggtt gattgccgcg 840 cgccatatga acaacgccgg gctggcggcg ctgttcagaa aggcggggtt gggcgggccg 900 gtgacaccgt atcatttcgg tttcctgatc gggccacgca tcaatgccgg tggccgtatt 960 ggcgatgccg cactgggtag ccgtctgctt acactcgacg actcgtcaca ggcggacgtg 1020 attgccgaaa agctggatga gctcaaccgc gagcgacagg cgatggaagc cgtgatgctg 1080 gcggaagccg aagcggaagc gctttatgag tatggcgacg gctctggcgc tggcgtcatc 1140 gttaccgcac gggaaaactg gcatccgggg atcgttggcc tgcttgcctc acgcctcaag 1200 gaccgtttcc gccgcccggc ctttgcaatc gctttcgatc cctctggcaa gggcacaggc 1260 tccggccgct cgatcaatgg tttcgatatg ggcagaatgg tccgcgccgc tgtggatgcc 1320 ggcctgctgg tcaagggtgg cggtcacgcc atggccgcgg gcctgacggt ggaacgcgcc 1380 aatctcggca aactccggac cttcttcgag gaagccgccg caaagacggt gagcgagctg 1440 gtggaaagca gcgtgcttaa gatcgacggc gcaatcggcg cgtccggtgc gaccctgcag 1500 cttgtcgatc agctggaaca ggctggtcct tatggctccg gccattctca gcccattttt 1560 gccgtgcctg cccaccggct gcgcgatgtg cgtctggtcg gcacctccca cgtcaagatc 1620 acgctggagg ccatggatgg ctcacggctg gacggcatcg cattccgcgc cgcagaggcc 1680 cctctggggc agatgctgct gaatgcgcgt ggcaggtcta tccacgtggc aggcaccgtg 1740 ggtgccgatc tctggcaggg ccagaggcgt gtgcagctgc gtgttctgga cgcggctttc 1800 gcgccctga 1809 <210> 22 <211> 602 <212> PRT <213> Agrobacterium tumefaciens <400> 22 Met Ala Met Met Glu Pro Ala Asp Thr Val Val Arg Ala Phe Leu Ser 1 5 10 15 Val Glu Arg Ser Ala Thr Glu Gln Arg Trp Val Ser Arg Leu Asp Gln 20 25 30 Ala Ala Gln Asn Arg Ala Leu Ala Met Ser Gln Ile His Ala Ile Pro 35 40 45 Glu Leu Ile Ala Arg Val Leu Ala Gly Arg Gly Val Gly Val Asp Glu 50 55 60 Ala Leu Ala Phe Leu Asp Pro Thr Ile Arg Ser Leu Met Pro Asp Pro 65 70 75 80 His Val Leu Thr Asp Cys Glu Lys Ala Ala Glu Arg Leu Val Arg Ala 85 90 95 Ile Glu Thr Gly Glu Lys Val Ala Ile Phe Gly Asp Tyr Asp Val Asp 100 105 110 Gly Ala Ala Ser Ser Ala Leu Met Tyr Arg Phe Leu Ala His Phe Gly 115 120 125 Leu Thr Pro Glu Ile Tyr Ile Pro Asp Arg Ile Phe Glu Gly Tyr Gly 130 135 140 Pro Asn Pro Ala Ala Met Gln Gln Leu Ala Ala Asn Gly Ala Thr Leu 145 150 155 160 Ile Val Thr Val Asp Cys Gly Ser Thr Ser His Glu Ser Leu Asn Ala 165 170 175 Ala Lys Asp Ala Gly Thr Asp Val Val Val Ile Asp His His Gln Val 180 185 190 Gly Ser Glu Leu Pro Pro Ala Val Ala Leu Val Asn Pro Asn Arg Glu 195 200 205 Asp Asp Leu Ser Gly Gln Gly His Leu Cys Ala Ala Gly Val Val Phe 210 215 220 Leu Val Leu Val Ala Thr Leu Arg Leu Leu Lys Asp Arg Arg Asn Arg 225 230 235 240 Gln Ala Phe Thr Ile Asp Leu Leu Ala Leu Leu Asp Ile Val Ala Leu 245 250 255 Ala Thr Val Cys Asp Val Val Pro Leu Lys Gly Leu Asn Arg Ala Tyr 260 265 270 Val Val Lys Gly Leu Ile Ala Ala Arg His Met Asn Asn Ala Gly Leu 275 280 285 Ala Ala Leu Phe Arg Lys Ala Gly Leu Gly Gly Pro Val Thr Pro Tyr 290 295 300 His Phe Gly Phe Leu Ile Gly Pro Arg Ile Asn Ala Gly Gly Arg Ile 305 310 315 320 Gly Asp Ala Ala Leu Gly Ser Arg Leu Leu Thr Leu Asp Asp Ser Ser 325 330 335 Gln Ala Asp Val Ile Ala Glu Lys Leu Asp Glu Leu Asn Arg Glu Arg 340 345 350 Gln Ala Met Glu Ala Val Met Leu Ala Glu Ala Glu Ala Glu Ala Leu 355 360 365 Tyr Glu Tyr Gly Asp Gly Ser Gly Ala Gly Val Ile Val Thr Ala Arg 370 375 380 Glu Asn Trp His Pro Gly Ile Val Gly Leu Leu Ala Ser Arg Leu Lys 385 390 395 400 Asp Arg Phe Arg Arg Pro Ala Phe Ala Ile Ala Phe Asp Pro Ser Gly 405 410 415 Lys Gly Thr Gly Ser Gly Arg Ser Ile Asn Gly Phe Asp Met Gly Arg 420 425 430 Met Val Arg Ala Ala Val Asp Ala Gly Leu Leu Val Lys Gly Gly Gly 435 440 445 His Ala Met Ala Ala Gly Leu Thr Val Glu Arg Ala Asn Leu Gly Lys 450 455 460 Leu Arg Thr Phe Phe Glu Glu Ala Ala Ala Lys Thr Val Ser Glu Leu 465 470 475 480 Val Glu Ser Ser Val Leu Lys Ile Asp Gly Ala Ile Gly Ala Ser Gly 485 490 495 Ala Thr Leu Gln Leu Val Asp Gln Leu Glu Gln Ala Gly Pro Tyr Gly 500 505 510 Ser Gly His Ser Gln Pro Ile Phe Ala Val Pro Ala His Arg Leu Arg 515 520 525 Asp Val Arg Leu Val Gly Thr Ser His Val Lys Ile Thr Leu Glu Ala 530 535 540 Met Asp Gly Ser Arg Leu Asp Gly Ile Ala Phe Arg Ala Ala Glu Ala 545 550 555 560 Pro Leu Gly Gln Met Leu Leu Asn Ala Arg Gly Arg Ser Ile His Val 565 570 575 Ala Gly Thr Val Gly Ala Asp Leu Trp Gln Gly Gln Arg Arg Val Gln 580 585 590 Leu Arg Val Leu Asp Ala Ala Phe Ala Pro 595 600 <210> 23 <211> 1674 <212> DNA <213> Agrobacterium tumefaciens <400> 23 atgctggtcc agctctcgat tcgtgacatc gttctgattg aaaggctcga cctcggcttt 60 gaggcgggcc tttccgtgtt gacgggtgag acgggcgcgg gcaaatccat tctgcttgac 120 agcctgtcgc tggccctcgg gggccgcggc gatggcggtc tggtgcgcca cggtgaagag 180 aagggacagg tcactgccac tttcgaagtt ccgaacagcc accccacacg gcatctcctg 240 cgcgaaaacg gcctcgatga cgatggcgac ctgattttcc gccgcgtgca atccgcagac 300 ggacgcacca aggcctatat caacgatcag gccatcagcg tgcagatgat gcgtcagctg 360 gggcagctat tggtcgaaat tcacggccag cacgacgacc gcgctcttgt cgataccgat 420 gcccaccgca cgctgctgga tgctttcgcc gggctgagcg acgatgcccg tgccgttcag 480 ggtttctacc gcacatggaa ggacgccgag cgggcattga aaactcatcg tgccaaggtt 540 gaggctgctg cccgagaggc ggactatctg cgttcctccg tcgaggagct tgaggtgctc 600 tcgccgcgcg acggcgagga ggaggagctt gccgaacgtc gggcggtgat gcagaaatcc 660 gaacgtattg ccggtgatat cgccgaagcg agcgagttcc tgaacggcaa cgcctcgcca 720 gtgcccatga tcgcatccat gatgcggcgc ctggaacgca agagccacga ggcgccggga 780 ttgctggaag acaccgtgca attgttggat gccgcgctcg acagcctttc caacgcgcag 840 atggaagtgg aggccgcact tcgccgcacc gagttcgatc cacgcgagct ggagcgggtg 900 gaggaacggc tgtttgcgct acgcgccgcc ggacgcaaat ataatgtcgc ggtgcctgat 960 ctgccggcga ttgcggaaaa aatggtcgcg gatcttgccg acctcgatgc gggcgaagaa 1020 aagctcggca aacttgaagc caatctcggc gttgtgaaag ccaatttcga ccacgcggcc 1080 aaatcgcttt ccgaaaaacg ccacaatgcg gcgaacgcgc tttccgaagc tgtcatggcg 1140 gagcttccgg cgctcaagct ggagcgggca cgttttaccg tcgaagtcag ctccgacccg 1200 gagcaagcga cggctgacgg tatcgacatc gtggaattcc acgttcagac caatcctgga 1260 acgcggcccg gcccgatcat gaaagtcgct tctggcggcg aattgtcccg tttcctgctg 1320 gcgcttaaag tcgcgctggc ggatcgtggt tcggcaccga cactggtgtt cgacgaaatc 1380 gacacgggcg ttggcggcgc tgtggcagat gccattggcc aaaggctgcg tcgtctgtcg 1440 aaaaccgtgc aggttctgtc cgtcacccac gcgccccagg tggccgcgcg ggcggccaca 1500 catcttctca tttccaaagg cccctccggc gacggcaccg agcgcatcgc cacgcgtgtc 1560 gctaccatgg agccgaaaca tcgcaccgaa gaaatcgccc gcatgcttgc cggtgcctcg 1620 gtgacagatg aggcgagggc tgctgccgcc cgcctgcttg ccgccaagga ttaa 1674 <210> 24 <211> 557 <212> PRT <213> Agrobacterium tumefaciens <400> 24 Met Leu Val Gln Leu Ser Ile Arg Asp Ile Val Leu Ile Glu Arg Leu 1 5 10 15 Asp Leu Gly Phe Glu Ala Gly Leu Ser Val Leu Thr Gly Glu Thr Gly 20 25 30 Ala Gly Lys Ser Ile Leu Leu Asp Ser Leu Ser Leu Ala Leu Gly Gly 35 40 45 Arg Gly Asp Gly Gly Leu Val Arg His Gly Glu Glu Lys Gly Gln Val 50 55 60 Thr Ala Thr Phe Glu Val Pro Asn Ser His Pro Thr Arg His Leu Leu 65 70 75 80 Arg Glu Asn Gly Leu Asp Asp Asp Gly Asp Leu Ile Phe Arg Arg Val 85 90 95 Gln Ser Ala Asp Gly Arg Thr Lys Ala Tyr Ile Asn Asp Gln Ala Ile 100 105 110 Ser Val Gln Met Met Arg Gln Leu Gly Gln Leu Leu Val Glu Ile His 115 120 125 Gly Gln His Asp Asp Arg Ala Leu Val Asp Thr Asp Ala His Arg Thr 130 135 140 Leu Leu Asp Ala Phe Ala Gly Leu Ser Asp Asp Ala Arg Ala Val Gln 145 150 155 160 Gly Phe Tyr Arg Thr Trp Lys Asp Ala Glu Arg Ala Leu Lys Thr His 165 170 175 Arg Ala Lys Val Glu Ala Ala Ala Arg Glu Ala Asp Tyr Leu Arg Ser 180 185 190 Ser Val Glu Glu Leu Glu Val Leu Ser Pro Arg Asp Gly Glu Glu Glu 195 200 205 Glu Leu Ala Glu Arg Arg Ala Val Met Gln Lys Ser Glu Arg Ile Ala 210 215 220 Gly Asp Ile Ala Glu Ala Ser Glu Phe Leu Asn Gly Asn Ala Ser Pro 225 230 235 240 Val Pro Met Ile Ala Ser Met Met Arg Arg Leu Glu Arg Lys Ser His 245 250 255 Glu Ala Pro Gly Leu Leu Glu Asp Thr Val Gln Leu Leu Asp Ala Ala 260 265 270 Leu Asp Ser Leu Ser Asn Ala Gln Met Glu Val Glu Ala Ala Leu Arg 275 280 285 Arg Thr Glu Phe Asp Pro Arg Glu Leu Glu Arg Val Glu Glu Arg Leu 290 295 300 Phe Ala Leu Arg Ala Ala Gly Arg Lys Tyr Asn Val Ala Val Pro Asp 305 310 315 320 Leu Pro Ala Ile Ala Glu Lys Met Val Ala Asp Leu Ala Asp Leu Asp 325 330 335 Ala Gly Glu Glu Lys Leu Gly Lys Leu Glu Ala Asn Leu Gly Val Val 340 345 350 Lys Ala Asn Phe Asp His Ala Ala Lys Ser Leu Ser Glu Lys Arg His 355 360 365 Asn Ala Ala Asn Ala Leu Ser Glu Ala Val Met Ala Glu Leu Pro Ala 370 375 380 Leu Lys Leu Glu Arg Ala Arg Phe Thr Val Glu Val Ser Ser Asp Pro 385 390 395 400 Glu Gln Ala Thr Ala Asp Gly Ile Asp Ile Val Glu Phe His Val Gln 405 410 415 Thr Asn Pro Gly Thr Arg Pro Gly Pro Ile Met Lys Val Ala Ser Gly 420 425 430 Gly Glu Leu Ser Arg Phe Leu Leu Ala Leu Lys Val Ala Leu Ala Asp 435 440 445 Arg Gly Ser Ala Pro Thr Leu Val Phe Asp Glu Ile Asp Thr Gly Val 450 455 460 Gly Gly Ala Val Ala Asp Ala Ile Gly Gln Arg Leu Arg Arg Leu Ser 465 470 475 480 Lys Thr Val Gln Val Leu Ser Val Thr His Ala Pro Gln Val Ala Ala 485 490 495 Arg Ala Ala Thr His Leu Leu Ile Ser Lys Gly Pro Ser Gly Asp Gly 500 505 510 Thr Glu Arg Ile Ala Thr Arg Val Ala Thr Met Glu Pro Lys His Arg 515 520 525 Thr Glu Glu Ile Ala Arg Met Leu Ala Gly Ala Ser Val Thr Asp Glu 530 535 540 Ala Arg Ala Ala Ala Ala Arg Leu Leu Ala Ala Lys Asp 545 550 555 <210> 25 <211> 765 <212> DNA <213> Agrobacterium tumefaciens <400> 25 atgcagtggc aggacgaggc aatcattctc ggcgtaaagc gtcatggcga gaccagcgtc 60 atcgccgagg tgatgacccg tttgcgcggc cgccatctgg ggatggtgcg cggcgggcgc 120 tcccgcagca tgcagccggt gctgcaggcg ggaaaccggg tggatgtgat ctggcgggcg 180 cggcttgacg accatctcgg cgaattccgc attgagcctt tgcagttgcg ggcagcgcaa 240 ttgatggaaa cggcaaccgc cgtgtatggc gtgcaggcca tgggcgcgct gctgcggctt 300 ctgccggagc gtgacccgca tccgcatctc tatcaggcgc tcgacgtcat tctcgacaat 360 ctccatgatc cggtcgatgc tggcgaattg ttcgtacggt tcgagctggc ggtgctgaac 420 gatcttggtt tcggtctcga tctcacggaa tgcgcggcaa cgggcctgcg caccgatctc 480 atctatgtat cgcccaaaac gggcagggcg gtctgtagta cggcgggcgc gccctatgcg 540 gcgcgtatgc tttcgcttcc cgctttcctg agcgaaggtc agtcgaaggc ggccgaccgc 600 gacagcctcg cggcagcctt tcgcctgacc ggccattttc tccaccggca tgtctatgat 660 ccgcgcggcc tcaatgaaaa cgccgcccgc gacggtttcg tgcaggcggc gttgaaggca 720 ctggagcgca aggcggtgct gcctgcgctc gataaggcgg tatag 765 <210> 26 <211> 254 <212> PRT <213> Agrobacterium tumefaciens <400> 26 Met Gln Trp Gln Asp Glu Ala Ile Ile Leu Gly Val Lys Arg His Gly 1 5 10 15 Glu Thr Ser Val Ile Ala Glu Val Met Thr Arg Leu Arg Gly Arg His 20 25 30 Leu Gly Met Val Arg Gly Gly Arg Ser Arg Ser Met Gln Pro Val Leu 35 40 45 Gln Ala Gly Asn Arg Val Asp Val Ile Trp Arg Ala Arg Leu Asp Asp 50 55 60 His Leu Gly Glu Phe Arg Ile Glu Pro Leu Gln Leu Arg Ala Ala Gln 65 70 75 80 Leu Met Glu Thr Ala Thr Ala Val Tyr Gly Val Gln Ala Met Gly Ala 85 90 95 Leu Leu Arg Leu Leu Pro Glu Arg Asp Pro His Pro His Leu Tyr Gln 100 105 110 Ala Leu Asp Val Ile Leu Asp Asn Leu His Asp Pro Val Asp Ala Gly 115 120 125 Glu Leu Phe Val Arg Phe Glu Leu Ala Val Leu Asn Asp Leu Gly Phe 130 135 140 Gly Leu Asp Leu Thr Glu Cys Ala Ala Thr Gly Leu Arg Thr Asp Leu 145 150 155 160 Ile Tyr Val Ser Pro Lys Thr Gly Arg Ala Val Cys Ser Thr Ala Gly 165 170 175 Ala Pro Tyr Ala Ala Arg Met Leu Ser Leu Pro Ala Phe Leu Ser Glu 180 185 190 Gly Gln Ser Lys Ala Ala Asp Arg Asp Ser Leu Ala Ala Ala Phe Arg 195 200 205 Leu Thr Gly His Phe Leu His Arg His Val Tyr Asp Pro Arg Gly Leu 210 215 220 Asn Glu Asn Ala Ala Arg Asp Gly Phe Val Gln Ala Ala Leu Lys Ala 225 230 235 240 Leu Glu Arg Lys Ala Val Leu Pro Ala Leu Asp Lys Ala Val 245 250 <210> 27 <211> 1809 <212> DNA <213> Agrobacterium tumefaciens <400> 27 gtgaccaccg atcccttgca gattctcaag accgtgtatg gctacgatac gtttcgtgga 60 cagcaggccg aaatcatccg gcatgtgatg gcaggcaaca atgcatttgt attgatgcca 120 acagggggcg ggaagtcgct ttgttaccag attccggcgc tcgcccgtaa gggaatgggg 180 ctggttgttt cgcccctgat cgcgctgatg gttgatcagg tcgccgcctt gcgtcaggca 240 ggtgtgcggg cagaagctct caactccgat ctttccccag aagagcggcg gatactctgg 300 caggatatgc gggctggcaa ggtcgatatt ctctatgccg cgccggagac ccttctcaag 360 ccggatgttc tggatgcgct tcaacctatc agcctgtcgc tgatcgccat cgacgaagct 420 cattgcctgt cgcagtgggg gcacgatttc cgtccccctt accgccagct agacacgttg 480 atcgagcgct ttccggatac gccacgcatg gcgctcacgg cgactgcgga cgagccaacc 540 cgcgccgaaa ttctgggtca tctcgggatc aacggaagcg acgccttcat agccggattc 600 gatcggccaa atatccgcta tgcgatcatg gaaaaggata atccacgtac gcagctgaag 660 cgcttcctga cgggtcgcga ggacgaaagc ggcatcgtct attgcctttc caaacgcaag 720 gtagatgaga cggcggcctg gctgcgtgag gaggggcgcg atgcgctgcc ctatcacgcc 780 ggcatggaca aggccgcccg cgaggcgaac cagacccact tccagcatgg tgaagctgtc 840 atcatggttg caaccgtggc tttcggtatg ggcatcgaca aaccggatgt gcgcttcgtt 900 gtgcatatcg atctgcccag cagcatcgaa gcctattatc aggaaaccgg ccgtgccggc 960 cgtgacggtc tgccgtccga cgtgcttatg ctttacggtt atgaagacat cgcattgcgc 1020 aaccgcttta tcgaagagtc ggatgcgggc gaccagcgca agaacatgga gcgccggaag 1080 ctcgatgcgt tgcttggcct cgcggaaaca gccggttgcc gtcggcgggt gcttttgtct 1140 tatttcggcg accattgtga gccctgcggc aattgcgaca cctgtgcgga gccgccggac 1200 ctgtttgatg gtgccattgc cgcgcagaag ttgctgtcct gcatttaccg cacgggagaa 1260 cgtttcggcc aggcctatgt catccgcgta ttgctgggca tggaagatga acggatatcg 1320 aactttggtc acgatcggat cacgacctac ggcatcggca aagagcacga caatcgcacc 1380 tggcgggcca tcctgcgcca gatggttgcg ctgcgcctga tcgaggttga tctggccggt 1440 cacgggggat tgtccatttc cgaagaaggg aggcggttcc tgcgcgaaaa gccgtccctg 1500 atgttgagga taccgtccgc tccccgttcg gcgcgacaac agacgaatcg caagcccacc 1560 gccattgttc taccggatgc cgatcgtagt ctctttgagg cgctgcgtgc gaagcgcatg 1620 gaaattgccc gcgcacagaa cgttccgccc tatgtgattt ttcacgacaa gacactcatt 1680 gagcttgcgg catcaagacc ggcctctgtg ggggaaatgg cgcagatacc tggagtggga 1740 gacacaaagc tggaacgata cggccctgct tttctggcgg cgatcatgga acatgccgcc 1800 agcgagtga 1809 <210> 28 <211> 602 <212> PRT <213> Agrobacterium tumefaciens <400> 28 Val Thr Thr Asp Pro Leu Gln Ile Leu Lys Thr Val Tyr Gly Tyr Asp 1 5 10 15 Thr Phe Arg Gly Gln Gln Ala Glu Ile Ile Arg His Val Met Ala Gly 20 25 30 Asn Asn Ala Phe Val Leu Met Pro Thr Gly Gly Gly Lys Ser Leu Cys 35 40 45 Tyr Gln Ile Pro Ala Leu Ala Arg Lys Gly Met Gly Leu Val Val Ser 50 55 60 Pro Leu Ile Ala Leu Met Val Asp Gln Val Ala Ala Leu Arg Gln Ala 65 70 75 80 Gly Val Arg Ala Glu Ala Leu Asn Ser Asp Leu Ser Pro Glu Glu Arg 85 90 95 Arg Ile Leu Trp Gln Asp Met Arg Ala Gly Lys Val Asp Ile Leu Tyr 100 105 110 Ala Ala Pro Glu Thr Leu Leu Lys Pro Asp Val Leu Asp Ala Leu Gln 115 120 125 Pro Ile Ser Leu Ser Leu Ile Ala Ile Asp Glu Ala His Cys Leu Ser 130 135 140 Gln Trp Gly His Asp Phe Arg Pro Pro Tyr Arg Gln Leu Asp Thr Leu 145 150 155 160 Ile Glu Arg Phe Pro Asp Thr Pro Arg Met Ala Leu Thr Ala Thr Ala 165 170 175 Asp Glu Pro Thr Arg Ala Glu Ile Leu Gly His Leu Gly Ile Asn Gly 180 185 190 Ser Asp Ala Phe Ile Ala Gly Phe Asp Arg Pro Asn Ile Arg Tyr Ala 195 200 205 Ile Met Glu Lys Asp Asn Pro Arg Thr Gln Leu Lys Arg Phe Leu Thr 210 215 220 Gly Arg Glu Asp Glu Ser Gly Ile Val Tyr Cys Leu Ser Lys Arg Lys 225 230 235 240 Val Asp Glu Thr Ala Ala Trp Leu Arg Glu Glu Gly Arg Asp Ala Leu 245 250 255 Pro Tyr His Ala Gly Met Asp Lys Ala Ala Arg Glu Ala Asn Gln Thr 260 265 270 His Phe Gln His Gly Glu Ala Val Ile Met Val Ala Thr Val Ala Phe 275 280 285 Gly Met Gly Ile Asp Lys Pro Asp Val Arg Phe Val Val His Ile Asp 290 295 300 Leu Pro Ser Ser Ile Glu Ala Tyr Tyr Gln Glu Thr Gly Arg Ala Gly 305 310 315 320 Arg Asp Gly Leu Pro Ser Asp Val Leu Met Leu Tyr Gly Tyr Glu Asp 325 330 335 Ile Ala Leu Arg Asn Arg Phe Ile Glu Glu Ser Asp Ala Gly Asp Gln 340 345 350 Arg Lys Asn Met Glu Arg Arg Lys Leu Asp Ala Leu Leu Gly Leu Ala 355 360 365 Glu Thr Ala Gly Cys Arg Arg Arg Val Leu Leu Ser Tyr Phe Gly Asp 370 375 380 His Cys Glu Pro Cys Gly Asn Cys Asp Thr Cys Ala Glu Pro Pro Asp 385 390 395 400 Leu Phe Asp Gly Ala Ile Ala Ala Gln Lys Leu Leu Ser Cys Ile Tyr 405 410 415 Arg Thr Gly Glu Arg Phe Gly Gln Ala Tyr Val Ile Arg Val Leu Leu 420 425 430 Gly Met Glu Asp Glu Arg Ile Ser Asn Phe Gly His Asp Arg Ile Thr 435 440 445 Thr Tyr Gly Ile Gly Lys Glu His Asp Asn Arg Thr Trp Arg Ala Ile 450 455 460 Leu Arg Gln Met Val Ala Leu Arg Leu Ile Glu Val Asp Leu Ala Gly 465 470 475 480 His Gly Gly Leu Ser Ile Ser Glu Glu Gly Arg Arg Phe Leu Arg Glu 485 490 495 Lys Pro Ser Leu Met Leu Arg Ile Pro Ser Ala Pro Arg Ser Ala Arg 500 505 510 Gln Gln Thr Asn Arg Lys Pro Thr Ala Ile Val Leu Pro Asp Ala Asp 515 520 525 Arg Ser Leu Phe Glu Ala Leu Arg Ala Lys Arg Met Glu Ile Ala Arg 530 535 540 Ala Gln Asn Val Pro Pro Tyr Val Ile Phe His Asp Lys Thr Leu Ile 545 550 555 560 Glu Leu Ala Ala Ser Arg Pro Ala Ser Val Gly Glu Met Ala Gln Ile 565 570 575 Pro Gly Val Gly Asp Thr Lys Leu Glu Arg Tyr Gly Pro Ala Phe Leu 580 585 590 Ala Ala Ile Met Glu His Ala Ala Ser Glu 595 600 <210> 29 <211> 606 <212> DNA <213> Agrobacterium tumefaciens <400> 29 atggcaaaac gagtcaccgg tcccgaaatc gaaaaactga tccagctgct tgcaaaagtg 60 ccggggcttg ggccccgctc ggcgcggcgg gcggcgctgc atctcatcaa gaagaaggaa 120 cagcttcttg gaccgctggg ccacgcgatg ggtgaagcct atgacaaggt gaagatctgc 180 tcgtgctgcg gcaatgtcga taccatcgat ccctgcacgg tctgcgccga tgatagacgt 240 gaccagtcgg tcatcatcgt ggtggaagac gtgtcggatc tgtgggcgct ggagcgagca 300 ggcgcaatga ataccgcata tcatgtgctt ggtggcacgc tatcgccgct cgatggcgtc 360 gggccggaag atctgaacat caagggactg atcgatcgcg tcagcgccgg cggtattcgc 420 gagctcatca tcgccgtcaa tgcgacggtg gagggacagg caacagccca ttacatcacc 480 gaccgcctgg ccgatctcgg catcaagatc acccggcttg cgcatggcgt gcctgttggc 540 ggcgagctgg actatctcga cgagggcaca ttgacggcgg cgctgcgcgc tcgcacaacg 600 atctga 606 <210> 30 <211> 201 <212> PRT <213> Agrobacterium tumefaciens <400> 30 Met Ala Lys Arg Val Thr Gly Pro Glu Ile Glu Lys Leu Ile Gln Leu 1 5 10 15 Leu Ala Lys Val Pro Gly Leu Gly Pro Arg Ser Ala Arg Arg Ala Ala 20 25 30 Leu His Leu Ile Lys Lys Lys Glu Gln Leu Leu Gly Pro Leu Gly His 35 40 45 Ala Met Gly Glu Ala Tyr Asp Lys Val Lys Ile Cys Ser Cys Cys Gly 50 55 60 Asn Val Asp Thr Ile Asp Pro Cys Thr Val Cys Ala Asp Asp Arg Arg 65 70 75 80 Asp Gln Ser Val Ile Ile Val Val Glu Asp Val Ser Asp Leu Trp Ala 85 90 95 Leu Glu Arg Ala Gly Ala Met Asn Thr Ala Tyr His Val Leu Gly Gly 100 105 110 Thr Leu Ser Pro Leu Asp Gly Val Gly Pro Glu Asp Leu Asn Ile Lys 115 120 125 Gly Leu Ile Asp Arg Val Ser Ala Gly Gly Ile Arg Glu Leu Ile Ile 130 135 140 Ala Val Asn Ala Thr Val Glu Gly Gln Ala Thr Ala His Tyr Ile Thr 145 150 155 160 Asp Arg Leu Ala Asp Leu Gly Ile Lys Ile Thr Arg Leu Ala His Gly 165 170 175 Val Pro Val Gly Gly Glu Leu Asp Tyr Leu Asp Glu Gly Thr Leu Thr 180 185 190 Ala Ala Leu Arg Ala Arg Thr Thr Ile 195 200 <210> 31 <211> 591 <212> DNA <213> Agrobacterium tumefaciens <400> 31 atgaccgatg attccagccc cttcctgacc gacgacatgg cactggatgg cgaaacgcag 60 gctatcgaac ccaccagccg catgctgtca tgggcgcgca attccgctct ctaccggctg 120 gaacagcgca tgatgacgga aaagcagctg cgcgatgcga tcacccgcaa ggcgcgggaa 180 aaattcgagg atatcagccc cgctcagata aaggcgcttg gcgaattcgc cgtgaccttc 240 gcctatggca tcaaggcgct cgacgatacg gcttatgcag aaattgccgt gcgaagtggc 300 cagcgcagcg gcaagtcgaa gcgcgggctt gcgcagaaac ttcagatcaa gggcattgat 360 cgggaaacgg ccgcagtcgc actgcaggaa accaacgatc tggtggcggc cgtcatcttt 420 gcgcgcaagc gcgccttcgg tccctttcgc cgtgtcgagc ttgatgaaaa acgcaagtcg 480 aaggaatttt ctgccttcgc ccgcaacggc ttcggcttcg aaatcggcgc gaaggtgatg 540 gcgatgacgg tggaagaggc agaagagatc gtctcggaag caccgcttta a 591 <210> 32 <211> 196 <212> PRT <213> Agrobacterium tumefaciens <400> 32 Met Thr Asp Asp Ser Ser Pro Phe Leu Thr Asp Asp Met Ala Leu Asp 1 5 10 15 Gly Glu Thr Gln Ala Ile Glu Pro Thr Ser Arg Met Leu Ser Trp Ala 20 25 30 Arg Asn Ser Ala Leu Tyr Arg Leu Glu Gln Arg Met Met Thr Glu Lys 35 40 45 Gln Leu Arg Asp Ala Ile Thr Arg Lys Ala Arg Glu Lys Phe Glu Asp 50 55 60 Ile Ser Pro Ala Gln Ile Lys Ala Leu Gly Glu Phe Ala Val Thr Phe 65 70 75 80 Ala Tyr Gly Ile Lys Ala Leu Asp Asp Thr Ala Tyr Ala Glu Ile Ala 85 90 95 Val Arg Ser Gly Gln Arg Ser Gly Lys Ser Lys Arg Gly Leu Ala Gln 100 105 110 Lys Leu Gln Ile Lys Gly Ile Asp Arg Glu Thr Ala Ala Val Ala Leu 115 120 125 Gln Glu Thr Asn Asp Leu Val Ala Ala Val Ile Phe Ala Arg Lys Arg 130 135 140 Ala Phe Gly Pro Phe Arg Arg Val Glu Leu Asp Glu Lys Arg Lys Ser 145 150 155 160 Lys Glu Phe Ser Ala Phe Ala Arg Asn Gly Phe Gly Phe Glu Ile Gly 165 170 175 Ala Lys Val Met Ala Met Thr Val Glu Glu Ala Glu Glu Ile Val Ser 180 185 190 Glu Ala Pro Leu 195

Claims (38)

  1. 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)의 변형된 균주이며, 그의 모 균주에 비해 유전자 재조합 경로가 결핍되어 있는 변형된 균주.
  2. 제1항에 있어서, RecA, RecB, RecD, RecF, RecG, RecJ, RecN, RecO, RecQ, RecR 및 RecX로 이루어진 군으로부터 선택된 적어도 1종의 재조합 경로가 결핍되어 있는 변형된 균주.
  3. 제2항에 있어서, RecA 활성이 결핍되어 있는 변형된 균주.
  4. 제2항에 있어서, recA 유전자가 서열식별번호: 10 또는 11과 적어도 85% 서열 동일성을 갖는 폴리뉴클레오티드 서열을 포함하는 것인 변형된 균주.
  5. 제3항에 있어서, RecB, RecD, RecF, RecG, RecJ, RecN, RecO, RecQ, RecR 및 RecX로 이루어진 군으로부터 선택된 활성이 또한 결핍되어 있는 변형된 균주.
  6. 제3항에 있어서, 게놈 recA 유전자가 recA 유전자에서 서열의 결실, 재배열 또는 삽입에 의해 변형된 것인 변형된 균주.
  7. 제3항에 있어서, 게놈 recA 유전자가 recA 유전자를 포함하는 게놈 서열을 결실시킴으로써 변형된 것인 변형된 균주.
  8. 제3항에 있어서, 게놈 recA 유전자가 recA 유전자 내에 서열을 삽입함으로써 변형되며, 그에 의해 RecA 단백질의 발현을 파괴하는 것인 변형된 균주.
  9. 제8항에 있어서, 삽입된 서열이 선택 마커 유전자를 포함하는 것인 변형된 균주.
  10. 제9항에 있어서, 선택 마커가 클로람페니콜 저항성 유전자, 카나마이신 저항성 유전자, 스펙티노마이신 저항성 유전자, 겐타마이신 저항성 유전자 또는 그의 조합으로 이루어진 군으로부터 선택된 항생제 저항성 유전자를 포함하는 것인 변형된 균주.
  11. 제3항에 있어서, RecA 활성이 균주로부터 제조된 추출물에서 검출불가능한 것인 변형된 균주.
  12. 제3항에 있어서, RecA 단백질이 웨스턴 블롯 분석을 사용하여 검출불가능한 것인 변형된 균주.
  13. 제3항에 있어서, RecA mRNA가 노던 블롯 분석을 사용하여 검출불가능한 것인 변형된 균주.
  14. 제3항에 있어서, recA 유전자가 서던 블롯 분석을 사용하여 검출불가능한 것인 변형된 균주.
  15. 제4항에 있어서, recA 유전자가 서열식별번호: 12의 단백질을 코딩하는 것인 변형된 균주.
  16. 제1항에 있어서, Ti 플라스미드를 포함하는 변형된 균주.
  17. 제16항에 있어서, Ti 플라스미드가 pAL4404 Ti 플라스미드를 포함하거나, 또는 pAL4404 Ti 플라스미드로부터 유래된 것인 변형된 균주.
  18. 제1항에 있어서, 2원 플라스미드를 포함하는 변형된 균주.
  19. 제18항에 있어서, 2원 플라스미드가 살곤충제 저항성 형질, 제초제 내성 형질, 질소 사용 효율 형질, 물 사용 효율 형질, 영양 품질 형질, DNA 결합 형질, 선택 마커 형질 및 그의 조합으로 이루어진 군으로부터 선택된 농경학적 형질의 유전자를 포함하는 것인 변형된 균주.
  20. 제1항에 있어서, 3원 플라스미드를 포함하는 변형된 균주.
  21. 제1항에 있어서, 모 균주가 아그로박테리움 투메파시엔스 (LBA4404)인 변형된 균주.
  22. 아그로박테리움 투메파시엔스로부터의 변형된 recA 유전자를 포함하는 플라스미드이며, 여기서 recA 유전자는 변형 전에 서열식별번호: 10 또는 11에 대해 적어도 85% 서열 동일성을 갖고, 변형된 recA 유전자는 RecA 단백질의 발현이 결핍되어 있는 것인 플라스미드.
  23. 제22항에 있어서, 변형이 recA 유전자 또는 서열식별번호: 10 또는 11 내 공여자 서열의 삽입을 포함하는 것인 플라스미드.
  24. 제23항에 있어서, 공여자 서열이 선택 마커 유전자를 포함하는 것인 플라스미드.
  25. 제24항에 있어서, 선택 마커 유전자가 클로람페니콜 저항성 유전자, 카나마이신 저항성 유전자, 스펙티노마이신 저항성 유전자, 겐타마이신 저항성 유전자 또는 그의 조합으로부터 선택된 항생제 저항성 유전자를 포함하는 것인 플라스미드.
  26. 제23항에 있어서, 공여자 서열의 적어도 한쪽 말단에 서열식별번호: 10 또는 11의 적어도 43개 염기 쌍 단편이 플랭킹되어 있는 것인 플라스미드.
  27. (a) recA 유전자에 대해 지시된 녹-아웃 플라스미드를 제공하는 단계;
    (b) 녹-아웃 플라스미드를 아그로박테리움 투메파시엔스 균주 내로 도입하는 단계;
    (c) 게놈 돌연변이를 포함하는 콜로니를 선택 및 스크리닝하는 단계; 및
    (d) recA의 게놈 돌연변이를 갖는 적어도 1종의 돌연변이된 아그로박테리움 투메파시엔스를 확인하는 단계
    를 포함하는, 모 균주에 비해 유전자 재조합 경로가 결핍되어 있는 아그로박테리움 투메파시엔스 균주를 생성하는 방법.
  28. 제27항에 있어서, recA 유전자가 서열식별번호: 10 또는 11에 대해 적어도 85% 서열 동일성을 갖는 것인 방법.
  29. 제27항에 있어서, 녹 아웃 플라스미드가 게놈 결실, 게놈 재배열, 게놈 삽입 및 그의 조합으로 이루어진 군으로부터 선택된 돌연변이를 유도하는 것인 방법.
  30. 제29항에 있어서, 게놈 삽입이 선택 마커를 코딩하는 서열을 포함하는 것인 방법.
  31. 제30항에 있어서, 선택 마커 유전자가 클로람페니콜 저항성 유전자, 카나마이신 저항성 유전자, 스펙티노마이신 저항성 유전자, 겐타마이신 저항성 유전자 또는 그의 조합으로부터 선택된 항생제 저항성 유전자를 포함하는 것인 방법.
  32. (a) 상류 게놈 DNA 경계 서열이 플랭킹되어 있는 T-가닥 삽입물 및
    (b) 하류 게놈 DNA 경계 서열
    을 포함하는 트랜스제닉 이벤트이며,
    모 균주에 비해 유전자 재조합 경로가 결핍되어 있는 아그로박테리움 투메파시엔스의 변형된 균주로부터의 T-가닥의 통합을 포함하는 트랜스제닉 이벤트.
  33. 제32항에 있어서, 아그로박테리움 투메파시엔스의 변형된 균주로부터의 T-가닥이 트랜스제닉 이벤트를 재생시키는데 사용되는 표적화된 식물 세포의 게놈 내에 통합되는 것인 트랜스제닉 이벤트.
  34. 제32항에 있어서, 농경학적 형질을 추가로 포함하는 트랜스제닉 이벤트.
  35. 제34항에 있어서, 농경학적 형질이 살곤충제 저항성 형질, 제초제 내성 형질, 질소 사용 효율 형질, 물 사용 효율 형질, 영양 품질 형질, DNA 결합 형질, 선택 마커 형질 및 그의 조합으로 이루어진 군으로부터 선택되는 것인 트랜스제닉 이벤트.
  36. 제32항에 있어서, 쌍자엽 식물 또는 단자엽 식물인 트랜스제닉 이벤트.
  37. (a) 표적화된 식물 세포를 모 균주에 비해 유전자 재조합 경로가 결핍되어 있는 아그로박테리움 투메파시엔스의 변형된 균주와 접촉시키는 단계;
    (b) 표적화된 식물 세포의 게놈 내로 통합된 상기 아그로박테리움 균주로부터의 DNA를 포함하는 식물 세포를 선택 및 스크리닝하는 단계; 및
    (c) 단계 (b)에서 선택/스크리닝된 식물 세포로부터 전체 트랜스제닉 식물을 재생시키는 단계
    를 포함하는, 트랜스제닉 식물을 생산하는 방법.
  38. 제37항에 있어서, 선택하는 단계가 클로람페니콜 저항성 유전자, 카나마이신 저항성 유전자, 스펙티노마이신 저항성 유전자, 겐타마이신 저항성 유전자 또는 그의 조합으로부터 선택된 항생제 저항성 유전자를 포함하는 선택 마커를 사용하여 수행되는 것인 방법.
KR1020177008708A 2014-09-04 2015-09-03 아그로박테리움 투메파시엔스의 유전자-결핍 균주 재조합을 위한 방법 및 조성물 KR20170044742A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462045947P 2014-09-04 2014-09-04
US62/045,947 2014-09-04
PCT/US2015/048273 WO2016036923A1 (en) 2014-09-04 2015-09-03 Methods and compositions for recombination a gene-deficient strains of agrobacterium tumefaciens

Publications (1)

Publication Number Publication Date
KR20170044742A true KR20170044742A (ko) 2017-04-25

Family

ID=55436960

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177008708A KR20170044742A (ko) 2014-09-04 2015-09-03 아그로박테리움 투메파시엔스의 유전자-결핍 균주 재조합을 위한 방법 및 조성물

Country Status (12)

Country Link
US (1) US9765350B2 (ko)
EP (1) EP3189144A4 (ko)
JP (1) JP2017527292A (ko)
KR (1) KR20170044742A (ko)
CN (1) CN107075528A (ko)
AU (1) AU2015311918A1 (ko)
BR (1) BR102015021321A2 (ko)
CA (1) CA2959646A1 (ko)
IL (1) IL250915A0 (ko)
MX (1) MX2017002867A (ko)
PH (1) PH12017500410A1 (ko)
WO (1) WO2016036923A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105886632A (zh) * 2016-05-10 2016-08-24 四川农业大学 一种禾谷镰刀菌中亚油酸合成酶基因功能的研究方法
CN113201555A (zh) * 2021-04-01 2021-08-03 云南师范大学 一种含有eGFP标记和潮霉素抗性双元载体的构建方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3868730A (en) 1973-09-24 1975-03-04 Howmedica Knee or elbow prosthesis
CH632151A5 (de) 1978-10-06 1982-09-30 Sulzer Ag Endoprothese fuer ein kniegelenk.
US5147405A (en) 1990-02-07 1992-09-15 Boehringer Mannheim Corporation Knee prosthesis
US6117175A (en) 1994-08-22 2000-09-12 Bosredon; Jean Spherical knee joint prosthesis
WO1997008331A1 (en) * 1995-08-30 1997-03-06 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Stimulation of homologous recombination in eukaryotic organisms or cells by recombination promoting enzymes
DE60336013D1 (de) 2002-12-20 2011-03-24 Smith & Nephew Inc Hochleistungsknieprothese
US20040220675A1 (en) 2003-04-30 2004-11-04 Lewis Ralph Harrison Total elbow replacement for dogs
US20110179523A1 (en) * 2008-09-30 2011-07-21 Basf Plant Science Gmbh Method for Producing a Transgenic Plant Cell, a Plant or a Part Thereof with Increased Resistance Biotic Stress
UA112968C2 (uk) * 2010-07-29 2016-11-25 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Штам agrobacterium, модифікований для збільшення частоти трансформації рослин

Also Published As

Publication number Publication date
US20160068851A1 (en) 2016-03-10
EP3189144A1 (en) 2017-07-12
AU2015311918A1 (en) 2017-03-23
CN107075528A (zh) 2017-08-18
EP3189144A4 (en) 2019-02-20
WO2016036923A1 (en) 2016-03-10
MX2017002867A (es) 2017-05-30
CA2959646A1 (en) 2016-03-10
JP2017527292A (ja) 2017-09-21
BR102015021321A2 (pt) 2016-09-20
PH12017500410A1 (en) 2017-07-17
US9765350B2 (en) 2017-09-19
IL250915A0 (en) 2017-04-30

Similar Documents

Publication Publication Date Title
RU2687369C2 (ru) Универсальная донорная система для направленного воздействия на гены
JP6242345B2 (ja) グリホサート抵抗性植物および関連する方法
KR102240135B1 (ko) 부위 특이적 뉴클레아제 활성에 대한 dna 검출 방법
AU2003236475B2 (en) Genes involved in tolerance to environmental stress
TW201542826A (zh) 用於在作物中判定供體插入之快速靶向分析
AU2017265034B2 (en) Cytokinin synthase enzymes, constructs, and related methods
CA3147794A1 (en) Promoters for regulation of gene expression in plants
US9765350B2 (en) Methods and compositions for recombination a gene-deficient strains of Agrobacterium tumefaciens
EP3051940A1 (en) Soybean transformation method
US20160319291A1 (en) Use of agrobacterium vir genes in plasmids
WO2016095124A1 (en) Compositions and methods for increasing drought tolerance in plants
WO2016095123A1 (en) Compositions and methods for increasing drought tolerance in plants
MXPA01002195A (en) A new method of identifying non-host plant disease resistance genes