KR20160079156A - 최적 대두 유전자좌 - Google Patents

최적 대두 유전자좌 Download PDF

Info

Publication number
KR20160079156A
KR20160079156A KR1020167014637A KR20167014637A KR20160079156A KR 20160079156 A KR20160079156 A KR 20160079156A KR 1020167014637 A KR1020167014637 A KR 1020167014637A KR 20167014637 A KR20167014637 A KR 20167014637A KR 20160079156 A KR20160079156 A KR 20160079156A
Authority
KR
South Korea
Prior art keywords
seq
sequence
dna
ogl
soy
Prior art date
Application number
KR1020167014637A
Other languages
English (en)
Other versions
KR102269374B1 (ko
Inventor
라크쉬미 사스트리-덴트
제후이 차오
쉬리드하란 스리람
스티븐 알 웹
데브라 엘 캠퍼
마이클 더블유 에인리
Original Assignee
다우 아그로사이언시즈 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다우 아그로사이언시즈 엘엘씨 filed Critical 다우 아그로사이언시즈 엘엘씨
Publication of KR20160079156A publication Critical patent/KR20160079156A/ko
Application granted granted Critical
Publication of KR102269374B1 publication Critical patent/KR102269374B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/54Leguminosae or Fabaceae, e.g. soybean, alfalfa or peanut
    • A01H6/542Glycine max [soybean]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

본원에 개시된 바와 같이, 외인성 서열의 표적화 삽입을 위한 최고 부위를 나타내는 대두 식물의 최적 천연 게놈 유전자좌가 확인되었다.

Description

최적 대두 유전자좌 {OPTIMAL SOYBEAN LOCI}
관련 출원에 대한 상호 참조
본 출원은 2013년 11월 4일에 출원된 미국 특허 가출원 번호 61/899,602를 35 U.S.C. § 119(e) 하에 우선권 주장하며, 상기 가출원의 내용은 그 전문이 본 출원에 참조로 포함된다.
전자적으로 제출된 서열 목록에 대한 참조
서열 목록의 공식 사본은, 2014년 11월 3일에 작성되고 크기가 13.4 메가바이트이며 파일명이 "75608232324seqlist.txt"인 ASCII 포맷화된 서열 목록으로서 EFS-Web을 통해 전자적으로 제출되고, 본 명세서와 함께 출원된다. 이 ASCII 포맷화된 문서에 함유된 서열 목록은 본 명세서의 일부이고, 그 전문이 본원에 참조로 포함된다.
전자적으로 제출된 표 목록에 대한 참조
표 목록의 공식 사본은, 2014년 11월 3일에 작성되고 크기가 11.6 메가바이트이며 파일명이 "표 3"인 .PDF 포맷화된 표 목록으로서 EFS-Web을 통해 전자적으로 제출되고, 본 명세서와 함께 출원된다. 이 .PDF 포맷화된 문서에 함유된 표 목록은 본 명세서의 일부이고, 그 전문이 본원에 참조로 포함된다.
수많은 유형의 쌍자엽 식물, 예를 들어 대두 식물의 게놈은 1990년대 초반에 트랜스진에 의해 성공적으로 형질전환되었다. 지난 20년에 걸쳐, 트랜스진을 쌍자엽 식물의 게놈 내로 안정하게 통합시키는, 쌍자엽 식물, 예컨대 대두의 게놈을 형질전환시키기 위한 수많은 방법론이 개발되었다. 이러한 쌍자엽 형질전환 방법론의 진화로 농경학적 형질을 포함하는 트랜스진을 쌍자엽 식물, 예컨대 대두의 게놈 내에 성공적으로 도입할 수 있게 되었다. 1990년대 후반에 곤충 저항성 및 제초제 내성 형질을 쌍자엽 식물 내에 도입하여 재배 농업 방법에서 견줄데 없는, 곤충 및 광범위한 잡초의 방제를 위한 새롭고 편리한 기술적 혁신을 생산자에게 제공하였다. 현재, 트랜스제닉 쌍자엽 식물은 전세계적으로 상업적으로 입수가능하고, 새로운 트랜스제닉 제품, 예컨대 엔리스트(Enlist)™ 대두는 계속 증가하는 잡초 도전과제에 대한 개선된 해결책을 제공한다. 현대 농경학적 실시에 있어서 트랜스제닉 쌍자엽 식물의 이용은 형질전환 방법론의 개발 및 개선이 없었다면 가능하지 않았을 것이다.
그러나, 현재 형질전환 방법론은 쌍자엽 식물, 예컨대 대두의 게놈 내의 트랜스진의 무작위 삽입에 의존한다. 게놈 내로의 유전자의 무작위 삽입에 대한 의존은 여러 단점을 갖는다. 트랜스제닉 사례가 유전자 전사 서열 내에 무작위로 통합되어, 그로 인해 내인성 형질의 발현을 방해하고 식물의 성장 및 발달을 변경시킬 수 있다. 추가로, 트랜스제닉 사례가 유전자 침묵에 감수성인 게놈의 위치 내로 무차별적으로 통합되어, 트랜스제닉 식물의 제1 또는 후속 세대에서 트랜스진 발현의 감소된 또는 완전한 억제에 이를 수 있다. 최종적으로, 식물 게놈 내의 트랜스진의 무작위 통합은 트랜스제닉 사례의 위치를 확인하고 식물에 대한 농경학적 영향 없이 설계된 대로 수행되는 트랜스제닉 사례를 선택하는데 있어서 상당한 노력 및 비용을 요구한다. 신규 검정은 각각의 트랜스제닉 사례, 예컨대 대두 트랜스제닉 사례에 대한 통합된 트랜스진의 정확한 위치를 결정하기 위해 계속해서 개발되어야 한다. 식물 형질전환 방법론의 무작위 성질은 형질전환 방법론의 유효성 및 효율을 방해하는, 통합된 트랜스진의 "위치-효과"를 유발한다.
식물의 표적화 게놈 변형은 응용 연구 및 기초 연구 둘 다의 장기간 달성하기 어려운 목표가 되어 왔다. 쌍자엽 식물, 예컨대 대두 식물의 게놈에서의 특정 위치에 대한 유전자 및 유전자 스택의 표적화는 트랜스제닉 사례의 품질을 개선시키고, 트랜스제닉 사례의 생산과 연관된 비용을 감소시키며, 트랜스제닉 식물 제품을 제조하는 신규 방법, 예컨대 순차적 유전자 스택킹을 제공할 것이다. 전체적으로, 특정 게놈 부위에 대한 트랜스진 표적화가 상업적으로 유익할 가능성이 있다. 미리 결정된 게놈 유전자좌 내에서 표적화 돌연변이유발을 유도하고 세포 DNA 서열의 표적화 결실을 유도하며 외인성 공여자 DNA 폴리뉴클레오티드의 표적화 재조합을 용이하게 하기 위해 부위 특이적 뉴클레아제 (예를 들어, 아연 핑거 뉴클레아제 (ZFN), 메가뉴클레아제, 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN) 및 조작된 crRNA/tracr RNA를 갖는 클러스터링된 규칙적 간격의 짧은 회문식 반복부/CRISPR-연관 뉴클레아제 (CRISPR/Cas))에 의해 게놈 DNA를 표적화하고 절단하는 방법 및 조성물의 개발에 대하여 지난 몇 년간 유의한 진보가 이루어져 왔다. 예를 들어, 미국 특허 공개 번호 20030232410; 20050208489; 20050026157; 20050064474; 및 20060188987, 및 국제 특허 공개 번호 WO 2007/014275 (상기 특허의 개시내용은 그 전문이 모든 목적을 위해 참조로 포함됨)를 참조한다. 미국 특허 공개 번호 20080182332에는 식물 게놈의 표적화 변형을 위한 비-정규 아연 핑거 뉴클레아제 (ZFN)의 용도가 기재되어 있고, 미국 특허 공개 번호 20090205083에는 식물 EPSP 게놈 유전자좌의 ZFN-매개 표적화 변형이 기재되어 있다. 외인성 DNA의 표적화 삽입을 위한 현재 방법은 전형적으로 적어도 하나의 트랜스진을 함유하는 공여자 DNA 폴리뉴클레오티드, 및 활발히 전사되는 코딩 서열의 특정 게놈 유전자좌에 결합하여 그를 절단하도록 설계된 부위 특이적 뉴클레아제 (예를 들어, ZFN)를 사용한 식물 조직의 공동-형질전환을 수반한다. 이것은 공여자 DNA 폴리뉴클레오티드가 절단된 게놈 유전자좌 내에 안정하게 삽입되도록 하여 활발히 전사되는 코딩 서열을 포함하는 특정된 게놈 유전자좌에서의 표적화 유전자 부가를 일으킨다.
대안적 접근법은 쌍자엽 식물, 예컨대 대두의 게놈 내의 미리 선택된 표적 비유전자 유전자좌에 트랜스진을 표적화하는 것이다. 최근 수년간, 쌍자엽 식물, 예컨대 대두의 게놈 내의 트랜스진의 표적화 전달을 위한 여러 기술이 개발되었고 식물 세포에 적용되었다. 그러나, 표적화에 적합한 게놈 부위의 속성에 관해서는 매우 덜 알려져 있다. 이력상, 게놈에서의 비-본질적 유전자 및 병원체 (바이러스) 통합 부위가 표적화를 위한 유전자좌로서 사용되었다. 게놈에서의 이러한 부위의 수는 오히려 제한적이고, 따라서 공여자 폴리뉴클레오티드 서열의 표적화에 사용될 수 있는 표적화가능한 최적 게놈 유전자좌의 확인 및 특징화에 대한 필요성이 존재한다. 표적화를 잘 받아들이는 것에 추가로, 최적 게놈 유전자좌는 트랜스진 발현 및 육종 적용을 지지할 수 있는 중립적 부위일 것으로 예상된다. 표적화 트랜스진 통합을 위해 쌍자엽 식물, 예를 들어 대두 식물의 게놈 내에 최적 비유전자 유전자좌를 확인하기 위한 기준을 정의하는 조성물 및 방법에 대한 필요성이 존재한다.
한 실시양태에서, 본 개시내용은 soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137), soy_OGL_4625 (서열 76), soy_OGL_6362 (서열 440), soy_OGL_308 (서열 43), soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는, 적어도 1 Kb의 핵산 서열을 포함하는 재조합 서열에 관한 것이다. 한 실시양태에서, 관심 DNA의 삽입은, 예를 들어 비유전자 유전자좌 서열의 결실, 역위, 삽입 및 중복을 포함한, 삽입 부위에 근접한 비유전자 유전자좌 서열의 변경에 의해 비유전자 유전자좌의 본래 서열을 변형시킨다. 추가 측면에서, 한 실시양태는 상기 비유전자 서열에 삽입되는 관심 DNA에 관한 것이다. 또 다른 측면에서, 한 실시양태는 관심 DNA가 아연 핑거 표적 부위에 근접하게 삽입되는 재조합 서열을 포함한다. 또 다른 측면에서, 한 실시양태는 관심 DNA가 아연 핑거 표적 부위에 삽입되는 재조합 서열을 포함한다. 또 다른 실시양태에서, 재조합 서열은 분석 도메인을 추가로 포함하는 삽입된 관심 DNA를 포함한다. 또 다른 실시양태에서, 재조합 서열은 펩티드를 코딩하지 않는 삽입된 관심 DNA를 포함한다. 추가 실시양태에서, 재조합 서열은 펩티드를 코딩하는 관심 DNA를 포함한다. 또 다른 실시양태에서, 재조합 서열은 유전자 발현 카세트를 추가로 포함하는 삽입된 관심 DNA를 포함한다. 한 실시양태에서, 유전자 발현 카세트는 살곤충제 저항성 유전자, 제초제 내성 유전자, 질소 사용 효율 유전자, 물 사용 효율 유전자, 영양 품질 유전자, DNA 결합 유전자 및 선택 마커 유전자를 포함하는 유전자를 함유한다. 추가 실시양태에서, 재조합 서열은 2개 이상의 유전자 발현 카세트를 포함한다. 또 다른 실시양태에서, 재조합 서열은 동일한 염색체 상에 위치하는 상기 비유전자 서열 중 2개 이상을 포함한다. 추가 실시양태에서, 재조합 서열은 관심 DNA의 비유전자 서열 내로의 삽입 동안에 변형되는 상기 관심 DNA 및/또는 비유전자 서열을 포함한다. 또 다른 실시양태에서, 본 개시내용은 재조합 서열을 포함하는 대두 식물, 대두 식물 부분 또는 대두 식물 세포에 관한 것이다.
추가 실시양태에서, 본 개시내용은 관심 DNA를 포함하는 트랜스제닉 식물 세포를 제조하는 방법에 관한 것이다. 본 개시내용의 또 다른 측면에서, 방법은 soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137), soy_OGL_4625 (서열 76), soy_OGL_6362 (서열 440), soy_OGL_308 (서열 43), soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로 이루어진 군으로부터 선택된 표적 비유전자 대두 게놈 유전자좌와 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 표적 비유전자 대두 게놈 유전자좌를 선택하는 단계; 상기 표적 비유전자 대두 게놈 유전자좌에 특이적으로 결합하여 그를 절단하는 부위 특이적 뉴클레아제를 선택하는 단계; 상기 부위 특이적 뉴클레아제를 대두 식물 세포 내로 도입하는 단계; 관심 DNA를 식물 세포 내로 도입하는 단계; 관심 DNA를 상기 표적 비유전자 대두 게놈 유전자좌 내로 삽입하는 단계; 및 상기 비유전자 유전자좌에 대해 표적화된 관심 DNA를 포함하는 트랜스제닉 식물 세포를 선택하는 단계를 포함한다. 추가 측면에서, 한 실시양태는 트랜스제닉 식물 세포를 제조하는 방법에 관한 것이다. 또 다른 실시양태에서, 관심 DNA는 분석 도메인을 포함한다. 한 실시양태에서, 관심 DNA는 펩티드를 코딩하지 않는다. 또 다른 실시양태에서, 관심 DNA는 펩티드를 코딩한다. 추가 실시양태에서, 관심 DNA는 트랜스진을 포함하는 유전자 발현 카세트를 포함한다. 또 다른 실시양태에서, 관심 DNA는 2개 이상의 유전자 발현 카세트를 포함한다. 후속 실시양태에서, 부위 특이적 뉴클레아제는 아연 핑거 뉴클레아제, CRISPR 뉴클레아제, TALEN, 귀소 엔도뉴클레아제 또는 메가뉴클레아제로 이루어진 군으로부터 선택된다. 한 실시양태에서, 상기 관심 DNA는 상동성 지정 복구 통합 방법을 통해 상기 비유전자 유전자좌 내에 통합된다. 또 다른 실시양태에서, 상기 관심 DNA는 비-상동 말단 연결 통합 방법을 통해 상기 비유전자 유전자좌 내에 통합된다. 추가 실시양태에서, 트랜스제닉 식물 세포를 제조하는 방법은 상기 표적 비유전자 대두 게놈 유전자좌 중 2개 이상 내로 삽입되는 상기 관심 DNA 중 2개 이상을 제공한다. 또 다른 실시양태에서, 트랜스제닉 식물 세포를 제조하는 방법은 동일한 염색체 상에 위치하는 상기 표적 비유전자 대두 게놈 유전자좌 중 2개 이상을 포함한다. 추가 실시양태에서, 트랜스제닉 식물 세포를 제조하는 방법은 관심 DNA의 비유전자 서열 내로의 삽입 동안에 변형되는 상기 관심 DNA 및/또는 비유전자 서열을 포함한다.
한 실시양태에 따르면, 정제된 대두 폴리뉴클레오티드 유전자좌가 본원에 개시되며, 여기서 정제된 서열은 적어도 1 Kb의 비유전자 서열을 포함한다. 한 실시양태에서, 비유전자 서열은 저메틸화되고, 재조합의 증거를 예시하며, 대두 게놈에서의 발현 유전자 영역에 근접한 위치에 위치한다. 한 실시양태에서, 비유전자 서열은 길이가 약 1 Kb 내지 약 8.4 Kb의 범위이다. 한 실시양태에서, 관심 DNA는, 예를 들어 조절 서열, 제한 절단 부위, RNA 코딩 영역 또는 단백질 코딩 영역을 포함한 외인성 DNA 서열을 포함한다. 한 실시양태에서, 관심 DNA는 하나 이상의 트랜스진을 포함하는 유전자 발현 카세트를 포함한다. 또 다른 실시양태에서, 정제된 서열은 soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137), soy_OGL_4625 (서열 76), soy_OGL_6362 (서열 440), soy_OGL_308 (서열 43), soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 비유전자 서열을 포함한다. 추가 실시양태에서, 정제된 비유전자 대두 게놈 유전자좌는 관심 DNA를 포함하며, 여기서 상기 관심 DNA는 상기 비유전자 서열 내로 삽입된다. 또 다른 측면에서, 한 실시양태는 정제된 비유전자 대두 게놈 유전자좌를 포함하며, 여기서 상기 관심 DNA는 아연 핑거 표적 부위에 근접하게 삽입된다. 다른 측면에서, 한 실시양태는 정제된 비유전자 대두 게놈 유전자좌를 포함하며, 여기서 상기 관심 DNA는 한 쌍의 아연 핑거 표적 부위 사이에 삽입된다. 또 다른 측면에서, 한 실시양태는 정제된 비유전자 대두 게놈 유전자좌를 포함하며, 여기서 상기 관심 DNA는 분석 도메인을 포함한다. 또 다른 측면에서, 한 실시양태는 정제된 비유전자 대두 게놈 유전자좌를 포함하며, 여기서 상기 관심 DNA는 펩티드를 코딩하지 않는다. 후속 측면에서, 한 실시양태는 정제된 비유전자 대두 게놈 유전자좌를 포함하며, 여기서 상기 관심 DNA는 펩티드를 코딩한다. 한 실시양태에서, 유전자 발현 카세트는 살곤충제 저항성 유전자, 제초제 내성 유전자, 질소 사용 효율 유전자, 물 사용 효율 유전자, 영양 품질 유전자, DNA 결합 유전자 및 선택 마커 유전자를 포함하는 유전자를 함유한다. 후속 실시양태에서, 부위 특이적 뉴클레아제는 아연 핑거 뉴클레아제, CRISPR 뉴클레아제, TALEN, 귀소 엔도뉴클레아제 또는 메가뉴클레아제로 이루어진 군으로부터 선택된다. 한 실시양태에서, 상기 관심 DNA는 상동성 지정 복구 통합 방법을 통해 상기 비유전자 서열 내에 통합된다. 또 다른 실시양태에서, 상기 관심 DNA는 비-상동 말단 연결 통합 방법을 통해 상기 비유전자 서열 내에 통합된다. 추가 실시양태에서, 관심 DNA는 2개 이상의 유전자 발현 카세트를 포함한다. 추가 실시양태에서, 정제된 비유전자 대두 게놈 유전자좌는 상기 표적 비유전자 대두 게놈 유전자좌 중 2개 이상 내로 삽입되는 상기 관심 DNA 중 2개 이상을 제공한다. 또 다른 실시양태에서, 정제된 비유전자 대두 게놈 유전자좌는 동일한 염색체 상에 위치하는 상기 표적 비유전자 대두 게놈 유전자좌 중 2개 이상을 제공한다. 추가 실시양태에서, 정제된 비유전자 대두 게놈은 관심 DNA의 비유전자 서열 내로의 삽입 동안에 변형되는 상기 관심 DNA 및/또는 비유전자 서열을 포함한다. 또 다른 실시양태에서, 관심 DNA는 상동성 지정 복구 또는 비-상동 말단 연결 복구 메카니즘을 통해 삽입된다.
또 다른 실시양태에서, 본 개시내용은, 재조합 서열을 포함하는 식물이며, 상기 재조합 서열은 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 핵산 서열; 및 관심 DNA를 포함하며, 여기서 관심 DNA는 상기 비유전자 서열 내로 삽입되는 것인 식물을 제공한다. 또 다른 실시양태에서, 비유전자 서열은 soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137), soy_OGL_4625 (서열 76), soy_OGL_6362 (서열 440), soy_OGL_308 (서열 43), soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로 이루어진 군으로부터 선택된다. 추가 실시양태에서, 식물은 상기 재조합 서열 중 2개 이상을 포함한다. 추가 측면에서, 한 실시양태는 상기 재조합 서열이 동일한 염색체 상에 위치하는 것인 식물을 포함한다. 또 다른 측면에서, 한 실시양태는 상기 관심 DNA가 아연 핑거 표적 부위에 근접하게 삽입되는 것인 식물을 포함한다. 후속 측면에서, 한 실시양태는 상기 관심 DNA가 한 쌍의 아연 핑거 표적 부위 사이에 삽입되는 것인 식물을 포함한다. 한 실시양태에서, 상기 관심 DNA는 분석 도메인을 포함한다. 추가 실시양태에서, 상기 관심 DNA는 펩티드를 코딩하지 않는다. 또 다른 실시양태에서, 상기 관심 DNA는 펩티드를 코딩한다. 후속 실시양태에 있어서, 상기 관심 DNA는 살곤충제 저항성 유전자, 제초제 내성 유전자, 질소 사용 효율 유전자, 물 사용 효율 유전자, 영양 품질 유전자, DNA 결합 유전자 및 선택 마커 유전자를 포함하는 유전자 발현 카세트를 포함한다. 또 다른 측면에서, 한 실시양태는 상기 관심 DNA 및/또는 상기 비유전자 서열이 상기 관심 DNA의 상기 비유전자 서열 내로의 삽입 동안에 변형되는 것인 식물을 포함한다.
또 다른 실시양태에서, 정제된 서열은 soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137), soy_OGL_308 (서열 43), soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 비유전자 서열을 포함한다.
또 다른 실시양태에서, 정제된 서열은 soy_OGL_1423 (서열 639) 및 soy_OGL_1434 (서열 137)로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 비유전자 서열을 포함한다.
또 다른 실시양태에서, 정제된 서열은 soy_OGL_308 (서열 43), soy_OGL_307 (서열 566) 및 soy_OGL_310 (서열 4236)으로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 비유전자 서열을 포함한다.
또 다른 실시양태에서, 정제된 서열은 soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 비유전자 서열을 포함한다.
또 다른 실시양태에서, 정제된 서열은 soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137), soy_OGL_308 (서열 43), soy_OGL_307 (서열 566) 및 soy_OGL_310 (서열 4236)으로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 비유전자 서열을 포함한다.
또 다른 실시양태에서, 정제된 서열은 soy_OGL_308 (서열 43), soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 비유전자 서열을 포함한다.
또 다른 실시양태에서, 정제된 서열은 soy_OGL_4625 (서열 76), soy_OGL_6362 (서열 440) 및 soy_OGL_308 (서열 43)로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90%, 95% 또는 99% 서열 동일성을 갖는 비유전자 서열을 포함한다.
도 1. 32개의 클러스터로 클러스터링된 7,018개의 선택 게놈 유전자좌의 3차원 그래프를 나타낸다. 클러스터는 3차원으로 그래프화될 수 있고, 색 또는 다른 지시자에 의해 구별될 수 있다. 가시화가 용이하도록 각각의 클러스터에 고유한 식별자를 배정하였으며, 여기서 동일한 식별자를 갖는 모든 선택 게놈 유전자좌는 동일한 클러스터에 속한다. 클러스터링 과정 후에, 대표적인 선택 게놈 유전자좌를 각각의 클러스터로부터 선택하였다. 이것은 각각의 클러스터 내에서 그 클러스터의 중심에 최근접한 선택 게놈 유전자좌를 선택함으로써 진행하였다.
도 2. 32개 각 클러스터의 각각의 중심에 최근접한 것으로 선택된 최적 게놈 유전자좌의 염색체 분포를 나타내는 개략적 도면을 제공한다.
도 3. 표적화 검증을 위해 선택된 최적 게놈 유전자좌의 대두 염색체 위치를 나타내는 개략적 도면을 제공한다.
도 4. 비-상동 말단 연결 (NHEJ)을 통한 통합을 위한 범용 공여자 폴리뉴클레오티드 서열의 표현. 2개의 제안된 벡터가 제공되며, 여기서 관심 DNA (DNA X)는 하나 이상 (즉, "1-N")의 아연 핑거 결합 부위 (ZFN BS)를 관심 DNA의 어느 한쪽 말단에 포함한다. 수직 화살표는 고유한 제한 부위를 보여주고, 수평 화살표는 잠재적 PCR 프라이머 부위를 나타낸다.
도 5. 상동-지정 복구 (HDR)를 통한 통합을 위한 범용 공여자 폴리뉴클레오티드 서열의 표현. 관심 DNA (DNA X)는 관심 DNA에 플랭킹된 2개 영역의 상동 서열 (HA)을 포함하고, 여기서 아연 핑거 뉴클레아제 결합 부위 (ZFN)가 DNA X 및 HA 서열을 함께 묶는다. 수직 화살표는 고유한 제한 부위를 보여주고, 수평 화살표는 잠재적 PCR 프라이머 부위를 나타낸다.
도 6. NHEJ 기반 신속 표적화 분석 (RTA) 방법을 사용하는 대두 선택된 게놈 유전자좌 표적의 검증.
도 7. pDAB124280 (서열 7561)의 플라스미드 맵. 넘버링된 요소 (즉, GmPPL01ZF391R 및 GMPPL01ZF391L)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열과 상응한다. 이들 아연 핑거 결합 서열 및 주석달린 "UZI 서열" (이는 프라이머 설계 또는 코딩 서열을 위한 제한 부위 및 DNA 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 조립 (즉, 깁슨(Gibson) 조립을 통함)을 위해 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 이 플라스미드 설계에 추가로 포함된다.
도 8. pDAB124281 (서열 7562)의 플라스미드 맵. 넘버링된 요소 (즉, GmPPL02ZF411R 및 GMPPL02ZF411L)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열과 상응한다. 이들 아연 핑거 결합 서열 및 주석달린 "UZI 서열" (이는 프라이머 설계 또는 코딩 서열을 위한 제한 부위 및 DNA 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 조립 (즉, 깁슨 조립을 통함)을 위해 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 이 플라스미드 설계에 추가로 포함된다.
도 9. pDAB121278 (서열 7563)의 플라스미드 맵. 넘버링된 요소 (즉, GmPPL18_4 및 GMPPL18_3)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열과 상응한다. 이들 아연 핑거 결합 서열 및 주석달린 "UZI 서열" (이는 프라이머 설계 또는 코딩 서열을 위한 제한 부위 및 DNA 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 조립 (즉, 깁슨 조립을 통함)을 위해 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 이 플라스미드 설계에 추가로 포함된다.
도 10. pDAB123812 (서열 7564)의 플라스미드 맵. 넘버링된 요소 (즉, ZF538R 및 ZF538L)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열과 상응한다. 이들 아연 핑거 결합 서열 및 주석달린 "UZI 서열" (이는 프라이머 설계 또는 코딩 서열을 위한 제한 부위 및 DNA 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 조립 (즉, 깁슨 조립을 통함)을 위해 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 이 플라스미드 설계에 추가로 포함된다.
도 11. pDAB121937 (서열 7565)의 플라스미드 맵. 넘버링된 요소 (즉, GmPPL34ZF598L, GmPPL34ZF598R, GmPPL36ZF599L, GmPPL36ZF599R, GmPPL36ZF600L 및 GmPPL36ZF600R)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열과 상응한다. 이들 아연 핑거 결합 서열 및 주석달린 "UZI 서열" (이는 프라이머 설계 또는 코딩 서열을 위한 제한 부위 및 DNA 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 조립 (즉, 깁슨 조립을 통함)을 위해 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 이 플라스미드 설계에 추가로 포함된다.
도 12. pDAB123811 (서열 7566)의 플라스미드 맵. 넘버링된 요소 (즉, ZF 560L 및 ZF 560R)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열과 상응한다. 이들 아연 핑거 결합 서열 및 주석달린 "UZI 서열" (이는 프라이머 설계 또는 코딩 서열을 위한 제한 부위 및 DNA 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 조립 (즉, 깁슨 조립을 통함)을 위해 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 이 플라스미드 설계에 추가로 포함된다.
도 13. pDAB124864 (서열 7567)의 플라스미드 맵. 넘버링된 요소 (즉, ZF631L 및 ZF631R)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열과 상응한다. 이들 아연 핑거 결합 서열 및 주석달린 "UZI 서열" (이는 프라이머 설계 또는 코딩 서열을 위한 제한 부위 및 DNA 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 조립 (즉, 깁슨 조립을 통함)을 위해 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 이 플라스미드 설계에 추가로 포함된다.
도 14. pDAB7221 (서열 7569)의 플라스미드 맵. 이 플라스미드는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) (AtuORF 24 3'UTR)가 플랭킹되어 있는 GFP 단백질을 구동하는 카사바 베인 모자이크 바이러스 프로모터(Cassava Vein Mosaic Virus Promoter) (CsVMV)를 함유한다.
도 15a-15c. 확인된 최적 비유전자 대두 유전자좌에 대한 특징 (길이, 40 Kb의 유전자좌 내의 코딩 영역의 발현 및 재조합 빈도)의 히스토그램. 도 15a는 최적 게놈 유전자좌 (OGL)의 폴리뉴클레오티드 서열 길이의 분포를 도시한다. 도 15b는 최적 비유전자 메이즈 유전자좌의 그의 재조합 빈도 대비 분포를 도시한다. 도 15c는 발현된 핵산 서열의 최적 게놈 유전자좌 (OGL)에 대한 그의 근접성 (log 스케일) 대비 분포를 도시한다.
정의
본 발명을 기재하고 청구함에 있어서, 하기 용어는 이하에서 설명된 정의에 따라 사용될 것이다.
본원에 사용된 용어 "약"은 언급된 값 또는 값의 범위에서 10 퍼센트 초과 또는 미만을 의미하지만, 임의의 값 또는 값의 범위를 단지 이 광범위한 정의로 지정하는 것으로 의도되지는 않는다. 용어 "약"이 선행하는 각각의 값 또는 값의 범위는 또한 언급된 절대값 또는 값의 범위의 실시양태를 포괄하는 것으로 의도된다.
본원에 사용된 용어 "식물"은 전체 식물 및 식물의 임의의 자손, 세포, 조직 또는 부분을 포함한다. 용어 "식물 부분"은 예를 들어 비제한적으로 다음을 포함하는 식물의 부분(들)을 포함한다: 종자 (성숙 종자 및 미성숙 종자를 포함함); 식물 삽목; 식물 세포; 식물 세포 배양물; 식물 기관 (예를 들어, 화분, 배아, 꽃, 과실, 싹, 잎, 뿌리, 줄기 및 외식편). 식물 조직 또는 식물 기관은 종자, 캘러스, 또는 구조적 또는 기능적 단위로 조직화된 식물 세포의 임의의 다른 군일 수 있다. 식물 세포 또는 조직 배양물은 세포 또는 조직이 수득된 식물의 생리학적 및 형태학적 특징을 갖는 식물을 재생시킬 수 있고, 식물과 실질적으로 동일한 유전자형을 갖는 식물을 재생시킬 수 있다. 대조적으로, 일부 식물 세포는 식물을 생산하도록 재생될 수 없다. 식물 세포 또는 조직 배양물에서 재생가능한 세포는 배아, 원형질체, 분열조직 세포, 캘러스, 화분, 잎, 꽃밥, 뿌리, 근단, 수염, 꽃, 커넬, 이삭, 속대, 껍질 또는 자루일 수 있다.
식물 부분은 수확가능한 부분 및 자손 식물의 번식에 유용한 부분을 포함한다. 번식에 유용한 식물 부분은, 예를 들어 비제한적으로 다음을 포함한다: 종자; 과실; 삽목; 묘목; 괴경; 및 근경. 식물의 수확가능한 부분은, 예를 들어 비제한적으로 다음을 포함하는, 식물의 임의의 유용한 부분일 수 있다: 꽃; 화분; 묘목; 괴경; 잎; 줄기; 과실; 종자 및 뿌리.
식물 세포는 식물의 구조적 및 생리학적 단위이다. 본원에 사용된 식물 세포는 원형질체 및 세포벽 내의 원형질체를 포함한다. 식물 세포는 단리된 단일 세포, 또는 세포의 응집체 (예를 들어, 이쇄성 캘러스 및 배양된 세포)의 형태일 수 있고, 보다 고도로 조직화된 단위 (예를 들어, 식물 조직, 식물 기관 및 식물)의 부분일 수 있다. 따라서, 식물 세포는 원형질체, 생식자 생산 세포, 또는 전체 식물로 재생될 수 있는 세포 또는 세포의 집합물일 수 있다. 이에 따라, 다중 식물 세포를 포함하고 전체 식물로 재생될 수 있는 종자는 본원의 실시양태에서 "식물 부분"으로 간주된다.
본원에 사용된 용어 "원형질체"는 세포벽이 완전히 또는 부분적으로 제거되었으며 그의 지질 이중층 막이 네이키드인 식물 세포를 지칭한다. 전형적으로, 원형질체는 세포 배양물 또는 전체 식물로의 재생 효력을 갖는, 세포벽이 없는 단리된 식물 세포이다.
본원에 사용된 용어 "천연" 또는 "자연"은 자연에서 발견된 상태를 정의한다. "천연 DNA 서열"은 자연적인 수단 또는 전통적인 육종 기술에 의해 생산된 것으로 유전자 조작 (예를 들어, 분자 생물학/형질전환 기술을 사용함)에 의해 생성된 것이 아닌, 자연에 존재하는 DNA 서열이다.
본원에 사용된 "내인성 서열"은 유기체 또는 유기체의 게놈에서 그의 자연 위치에 있는 천연 형태의 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 정의한다.
본원에 사용된 용어 "단리된"은 그의 자연 환경에서 제거되었음을 의미한다.
본원에 사용된 용어 "정제된"은 천연 또는 자연 환경에서 분자 또는 화합물과 정상적으로 회합되어 있는 오염물이 실질적으로 없는 형태로 분자 또는 화합물을 단리하는 것에 관한 것이고, 본래 조성물의 다른 성분으로부터 분리된 결과로서 순도가 증가된 것을 의미한다. 용어 "정제된 핵산"은 본원에서 폴리펩티드, 지질 및 탄수화물을 포함하나 이에 제한되지는 않는 다른 화합물로부터 분리된 핵산 서열을 기재하는 것으로 사용된다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 지칭하는 것으로 상호교환가능하게 사용된다. 상기 용어는 또한 하나 이상의 아미노산이 상응하는 자연 발생 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에 적용된다.
본원에 사용된 "최적 쌍자엽 게놈 유전자좌", "최적 비유전자 쌍자엽 유전자좌", "최적 비유전자 유전자좌" 또는 "최적 게놈 유전자좌 (OGL)"는 하기 특성을 갖는, 쌍자엽 식물의 핵 게놈에서 발견된 천연 DNA 서열이다: 비유전자, 저메틸화, 표적화가능, 및 유전자 영역에 근접한 위치 (여기서 최적 쌍자엽 게놈 유전자좌 주위의 게놈 영역은 재조합의 증거를 예시함).
본원에 사용된 "최적 대두 게놈 유전자좌", "최적 비유전자 대두 유전자좌", "최적 비유전자 유전자좌" 또는 "최적 게놈 유전자좌 (OGL)"는 하기 특성을 갖는, 쌍자엽 식물의 핵 게놈에서 발견된 천연 DNA 서열이다: 비유전자, 저메틸화, 표적화가능, 및 유전자 영역에 근접한 위치 (여기서 최적 쌍자엽 게놈 유전자좌 주위의 게놈 영역은 재조합의 증거를 예시함).
본원에 사용된 "비유전자 쌍자엽 서열" 또는 "비유전자 쌍자엽 게놈 서열"은, 적어도 1 Kb의 길이를 갖고 임의의 오픈 리딩 프레임, 유전자 서열 또는 유전자 조절 서열이 결여되어 있는, 쌍자엽 식물의 핵 게놈에서 발견된 천연 DNA 서열이다. 게다가, 비유전자 쌍자엽 서열은 어떠한 인트론 서열도 포함하지 않는다 (즉, 인트론은 비유전자의 정의에서 제외됨). 비유전자 서열은 전사되거나 단백질로 번역될 수 없다. 많은 식물 게놈은 비유전자 영역을 함유한다. 게놈 중 많게는 95%가 비유전자일 수 있고, 이들 영역은 주로 반복 DNA로 구성될 수 있다.
본원에 사용된 "비유전자 대두 서열" 또는 "비유전자 대두 게놈 서열"은, 적어도 1 Kb의 길이를 갖고 임의의 오픈 리딩 프레임, 유전자 서열 또는 유전자 조절 서열이 결여되어 있는, 대두 식물의 핵 게놈에서 발견된 천연 DNA 서열이다. 게다가, 비유전자 대두 서열은 어떠한 인트론 서열도 포함하지 않는다 (즉, 인트론은 비유전자의 정의에서 제외됨). 비유전자 서열은 전사되거나 단백질로 번역될 수 없다. 많은 식물 게놈은 비유전자 영역을 함유한다. 게놈 중 많게는 95%가 비유전자일 수 있고, 이들 영역은 주로 반복 DNA로 구성될 수 있다.
본원에 사용된 "유전자 영역"은 RNA 및/또는 폴리펩티드를 코딩하는 오픈 리딩 프레임을 포함하는 폴리뉴클레오티드 서열로 정의된다. 유전자 영역은 또한, 코딩 영역의 최대 약 2 Kb 상류 및 코딩 영역의 최대 약 1 Kb 하류의 오픈 리딩 프레임의 발현의 조절에 수반되는 임의의 확인가능한 인접한 5' 및 3' 비-코딩 뉴클레오티드 서열을 포괄할 수 있다. 유전자 영역은 유전자 영역에 존재할 수 있는 임의의 인트론을 추가로 포함한다. 추가로, 유전자 영역은 단일 유전자 서열, 또는 짧은 범위 (1 Kb 미만)의 비유전자 서열이 사이에 배치된 다중 유전자 서열을 포함할 수 있다.
본원에 사용된 "관심 핵산", "관심 DNA" 또는 "공여자"는 쌍자엽 게놈, 예컨대 대두 게놈 내로의 부위 지정된 표적화 삽입을 위해 선택된 핵산/DNA 서열로 정의된다. 관심 핵산은 임의의 길이일 수 있고, 예를 들어 2 내지 50,000개 뉴클레오티드 길이 (또는 이들 사이의 임의의 정수 값 또는 그 초과), 바람직하게는 약 1,000 내지 5,000개 뉴클레오티드 길이 (또는 이들 사이의 임의의 정수 값)일 수 있다. 관심 핵산은 활발히 전사되고/거나 번역된 유전자 서열을 추가로 포함하는 하나 이상의 유전자 발현 카세트를 포함할 수 있다. 반대로, 관심 핵산은 기능적 유전자 발현 카세트 또는 전체 유전자를 포함하지 않는 폴리뉴클레오티드 서열을 포함할 수 있거나 (예를 들어, 단순히 조절 서열, 예컨대 프로모터를 포함할 수 있음), 또는 임의의 확인가능한 유전자 발현 요소 또는 임의의 활발히 전사되는 유전자 서열을 함유하지 않을 수 있다. 관심 핵산은 임의로 분석 도메인을 함유할 수 있다. 예를 들어 대두의 쌍자엽 게놈 내로의 관심 핵산의 삽입 시에, 삽입된 서열은 "삽입된 관심 DNA"로 지칭된다. 추가로, 관심 핵산은 DNA 또는 RNA일 수 있고, 선형 또는 원형일 수 있고, 단일 가닥 또는 이중 가닥일 수 있다. 그것은 세포에 네이키드 핵산으로서, 하나 이상의 전달 작용제 (예를 들어, 리포솜, 폴록사머, 단백질로 캡슐화된 T-가닥 등)와의 복합체로서 전달될 수 있거나, 또는 박테리아 또는 바이러스 전달 비히클, 예컨대, 예를 들어 아그로박테리움 투메파시엔스 또는 아데노바이러스 또는 아데노-연관 바이러스 (AAV)에 각각 함유될 수 있다.
본원에 사용된 용어 "분석 도메인"은 핵산 서열의 표적화 삽입을 보조하는 기능적 요소를 함유하는 핵산 서열을 정의한다. 예를 들어, 분석 도메인은 특이적으로 설계된 제한 효소 부위, 아연 핑거 결합 부위, 조작된 랜딩 패드 또는 조작된 트랜스진 통합 플랫폼을 함유할 수 있고, 유전자 조절 요소 또는 오픈 리딩 프레임을 포함하거나 포함하지 않을 수 있다. 예를 들어, 미국 특허 공개 번호 20110191899 (그 전문이 본원에 참조로 포함됨)를 참조한다.
본원에 사용된 용어 "선택된 쌍자엽 서열"은 서열이 최적 비유전자 쌍자엽 게놈 유전자좌로서의 자격이 있는지를 결정하기 위한 분석용으로 선택된 쌍자엽 식물의 천연 게놈 DNA 서열을 정의한다.
본원에 사용된 용어 "선택된 대두 서열"은 서열이 최적 비유전자 대두 게놈 유전자좌로서의 자격이 있는지를 결정하기 위한 분석용으로 선택된 대두 식물의 천연 게놈 DNA 서열을 정의한다.
DNA 서열에 관하여 본원에 사용된 용어 "저메틸화" 또는 "저메틸화된"은 주어진 DNA 서열에서 감소된 상태의 메틸화 DNA 뉴클레오티드 잔기를 정의한다. 전형적으로, 감소된 메틸화는 쌍자엽 식물, 예컨대 대두 식물의 게놈에 존재하는 비유전자 서열에서 발견된 메틸화의 평균 수준에 대비한 메틸화 아데닌 또는 시토신 잔기의 수에 관한 것이다.
본원에 사용된 "표적화가능한 서열"은 관심 핵산의 하나의 특정 서열 내로의 부위 특이적 표적화 삽입을 가능케 하는, 핵 게놈에서 충분히 고유한 폴리뉴클레오티드 서열이다.
본원에 사용된 용어 "비-반복" 서열은 쌍자엽 식물, 예컨대 대두의 게놈 내의 임의의 다른 서열에 대해 40% 미만의 동일성을 공유하는, 적어도 1 Kb 길이의 서열로 정의된다. 서열 동일성의 계산은, 예를 들어 쌍자엽 게놈, 예를 들어 대두 재배품종 윌리암스82(Williams82) 게놈에 대하여 선택된 게놈 서열을 디폴트 파라미터 세팅을 사용하여 실행되는 NCBI 블라스트(BLAST)™+ 소프트웨어 (버전 2.2.25)를 사용하는 블라스트™ 기반 상동성 검색을 사용하여 스캐닝하는 것을 포함한, 관련 기술분야의 통상의 기술자에게 알려져 있는 임의의 표준 기술을 사용하여 결정될 수 있다 (Stephen F. Altschul et al. (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402). 예를 들어, 선택된 대두 서열 (글리신 맥스(Glycine max) 재배품종 윌리암스82 게놈)을 분석하였을 때, 이러한 검색으로부터 확인된 제1 블라스트™ 히트는 쌍자엽 서열, 예를 들어 대두 재배품종 윌리암스82 서열 그 자체를 나타낸다. 각각의 선택된 대두 서열에 대한 제2 블라스트™ 히트를 확인하고, 히트의 정렬 커버리지 (블라스트™ 히트에 의해 커버된 선택된 대두 서열의 퍼센트로 나타내어짐)를 쌍자엽 식물, 예컨대 대두의 게놈 내의 선택된 대두 서열의 고유성의 척도로서 사용하였다. 제2 블라스트™ 히트에 대한 이들 정렬 커버리지 값은 최소 0% 내지 최대 39.97% 서열 동일성의 범위였다. 보다 높은 수준의 서열 동일성에서 정렬된 어떠한 서열도 고려하지 않았다.
용어 "유전자 영역에 근접한 위치"는 비유전자 서열에 관하여 사용되는 경우에 유전자 영역에 대한 비유전자 서열의 상대 위치를 정의한다. 구체적으로, 40 Kb 인접부 내 (즉, 선택된 최적 대두 게놈 유전자좌 서열의 어느 한쪽 말단 상의 40 Kb 내) 유전자 영역의 수가 분석된다. 이 분석은 단자엽 게놈 데이터베이스, 예를 들어 소이빈 게놈 데이터베이스(Soybean Genome Database)로부터 얻은 알려져 있는 쌍자엽, 예컨대 대두의 게놈에서의 알려져 있는 유전자의 유전자 주석달린 정보 및 위치를 검정함으로써 완결되었다. 각각의 최적 비유전자 대두 게놈 유전자좌, 예를 들어 7,018개의 최적 비유전자 대두 게놈 유전자좌에 대해, 최적 게놈 유전자좌 서열 주위의 40 Kb 윈도우가 정의되었고, 이 윈도우에 중첩되는 위치를 갖는 주석달린 유전자의 수가 계수되었다. 유전자 영역의 수는 40 Kb 인접부 내에서 최소 1개 유전자 내지 최대 18개 유전자의 범위였다.
본원에 사용된 용어 "알려져 있는 대두 코딩 서열"은, 인트론 서열의 프로세싱 전 또는 후에 오픈 리딩 프레임을 포함하고 mRNA로 전사되며 임의로는 적절한 유전자 조절 요소의 제어 하에 배치되는 경우에 단백질 서열로 번역되는, 소이빈 게놈 데이터베이스를 포함한 임의의 쌍자엽 게놈 데이터베이스 (www.soybase.org, Shoemaker, R.C. et al. SoyBase, the USDA-ARS soybean genetics and genomics database. Nucleic Acids Res. 2010 Jan;38(Database issue):D843-6.)로부터 확인된 임의의 폴리뉴클레오티드 서열에 관한 것이다. 알려져 있는 대두 코딩 서열은 cDNA 서열 또는 게놈 서열일 수 있다. 일부 경우에, 알려져 있는 대두 코딩 서열은 기능적 단백질로서 주석달릴 수 있다. 다른 경우에, 알려져 있는 대두 코딩 서열은 주석달리지 않을 수 있다.
본원에 사용된 용어 "예측된 쌍자엽 코딩 서열"은 쌍자엽 게놈 데이터베이스, 예를 들어 소이빈 게놈 데이터베이스에 기재된 임의의 발현된 서열 태그 (EST) 폴리뉴클레오티드 서열에 관한 것이다. EST는 역전사효소에 의해 제1 가닥 합성을 지시하기 위해 올리고(dT) 프라이머를 사용하여 구축된 cDNA 라이브러리로부터 확인된다. 생성된 EST는 cDNA 삽입물의 5' 또는 3' 말단으로부터 수득된 500 bp 미만의 단일-통과 서열분석 판독물이다. 다중 EST는 단일 콘티그로 정렬될 수 있다. 확인된 EST 서열은 쌍자엽 게놈 데이터베이스, 예를 들어 소이빈 게놈 데이터베이스로 업로드되고, 생물정보학 방법을 통해 검색되어, mRNA로 전사되며 임의로는 적절한 유전자 조절 요소의 제어 하에 배치되는 경우에 단백질 서열로 번역되는 코딩 서열을 포함하는 상응하는 게놈 폴리뉴클레오티드 서열을 예측할 수 있다.
본원에 사용된 용어 "예측된 대두 코딩 서열"은 대두 게놈 데이터베이스, 예를 들어 소이빈 게놈 데이터베이스에 기재된 임의의 발현된 서열 태그 (EST) 폴리뉴클레오티드 서열에 관한 것이다. EST는 역전사효소에 의해 제1 가닥 합성을 지시하기 위해 올리고(dT) 프라이머를 사용하여 구축된 cDNA 라이브러리로부터 확인된다. 생성된 EST는 cDNA 삽입물의 5' 또는 3' 말단으로부터 수득된 500 bp 미만의 단일-통과 서열분석 판독물이다. 다중 EST는 단일 콘티그로 정렬될 수 있다. 확인된 EST 서열은 대두 게놈 데이터베이스, 예를 들어 소이빈 게놈 데이터베이스로 업로드되고, 생물정보학 방법을 통해 검색되어, mRNA로 전사되며 임의로는 적절한 유전자 조절 요소의 제어 하에 배치되는 경우에 단백질 서열로 번역되는 코딩 서열을 포함하는 상응하는 게놈 폴리뉴클레오티드 서열을 예측할 수 있다.
본원에 사용된 용어 "재조합의 증거"는 선택된 대두 서열을 포함하는 염색체 영역에 걸쳐 쌍자엽 게놈 마커, 예를 들어 대두 게놈 마커의 임의의 쌍 사이의 감수분열 재조합 빈도에 관한 것이다. 재조합 빈도는 마커 사이의 물리적 거리 (메가베이스 (Mb) 단위)에 대한 마커 사이의 유전적 거리 (센티모르간 (cM) 단위)의 비를 기초로 계산되었다. 재조합의 증거를 갖는 것으로 선택된 대두 서열에 대해, 선택된 대두 서열은 다중 맵핑 집단으로부터 생성된 고해상 마커 데이터세트를 사용하여 검출된 바와 같이 선택된 대두 서열에 플랭킹된 2개 마커 사이에 적어도 하나의 재조합 사례를 함유하여야 한다.
본원에 사용된 용어 "상대 위치 값"은 게놈 유전자좌의 그의 상응하는 염색체 동원체로부터의 거리를 정의하는 계산된 값이다. 각각의 선택된 대두 서열에 대해, 선택된 대두 서열의 천연 위치로부터 그것이 위치하고 있는 염색체의 동원체까지의 게놈 거리 (Bp 단위)가 측정된다. 염색체 내의 선택된 대두 서열의 상대 위치는 그것이 놓여있는 특정 염색체 아암의 길이 (Bp로 측정됨) 대비 동원체까지의 그의 게놈 거리의 비로 나타내어진다. 최적 비유전자 대두 게놈 유전자좌에 대한 이들 상대 위치 값은 상이한 쌍자엽 식물로부터 생성될 수 있고, 대두 데이터세트에 대한 상대 위치 값은 게놈 거리의 비 최소 0 내지 최대 0.99682의 범위였다.
본원에 사용된 용어 "외인성 DNA 서열"은 그의 천연 위치로부터 제거되고 새로운 위치 내로 삽입되어 이동된 핵산 서열에 플랭킹된 서열을 변경시키는 임의의 핵산 서열이다. 예를 들어, 외인성 DNA 서열은 또 다른 종으로부터의 서열을 포함할 수 있다.
"결합"은 거대분자 사이의 (예를 들어, 단백질과 핵산 사이의) 서열-특이적 상호작용을 지칭한다. 전체로서의 상호작용이 서열-특이적인 한, 결합 상호작용의 모든 성분이 서열-특이적 (예를 들어, DNA 백본 내의 포스페이트 잔기와의 접촉)일 필요는 없다. 이러한 상호작용은 일반적으로 해리 상수 (Kd)를 특징으로 한다. "친화도"란 결합 강도를 지칭하며: 증가된 결합 친화도는 보다 낮은 결합 상수 (Kd)와 상관관계가 있다.
"결합 단백질"은 또 다른 분자와 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어 DNA 분자에 결합할 수 있고/거나 (DNA-결합 단백질), RNA 분자에 결합할 수 있고/거나 (RNA-결합 단백질), 단백질 분자에 결합할 수 있다 (단백질-결합 단백질). 단백질-결합 단백질의 경우에, 그것은 자체에 결합 (동종이량체, 동종삼량체 등을 형성)할 수 있고/거나 상이한 단백질 또는 단백질들의 하나 이상의 분자에 결합할 수 있다. 결합 단백질은 하나 초과의 유형의 결합 활성을 가질 수 있다. 예를 들어, 아연 핑거 단백질은 DNA-결합 활성, RNA-결합 활성 및 단백질-결합 활성을 갖는다.
본원에 사용된 용어 "아연 핑거"는 아연 이온의 배위를 통해 구조가 안정화되는 DNA 결합 단백질 결합 도메인 내의 아미노산 서열의 영역을 정의한다.
"아연 핑거 DNA 결합 단백질" (또는 결합 도메인)은 하나 이상의 아연 핑거를 통해 서열-특이적 방식으로 DNA에 결합하는 단백질 또는 보다 큰 단백질 내의 도메인이고, 상기 아연 핑거는 아연 이온의 배위를 통해 구조가 안정화되는 결합 도메인 내의 아미노산 서열의 영역이다. 용어 아연 핑거 DNA 결합 단백질은 종종 아연 핑거 단백질 또는 ZFP로 약기된다. 아연 핑거 결합 도메인은 미리 결정된 뉴클레오티드 서열에 결합하도록 "조작"될 수 있다. 아연 핑거 단백질을 조작하는 방법의 비제한적 예는 설계 및 선택이다. 설계된 아연 핑거 단백질은 주로 합리적 기준에 의해 설계/조성이 이루어지는, 자연에서 발생하지 않는 단백질이다. 설계를 위한 합리적 기준은 기존 ZFP 설계 및 결합 데이터의 정보가 저장된 데이터베이스에서 정보를 처리하기 위한 치환 규칙 및 컴퓨터 알고리즘의 적용을 포함한다. 예를 들어, 미국 특허 번호 6,140,081; 6,453,242; 6,534,261 및 6,794,136을 참조하고; 또한, WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496을 참조한다.
"TALE DNA 결합 도메인" 또는 "TALE"은 하나 이상의 TALE 반복 도메인/단위를 포함하는 폴리펩티드이다. 반복 도메인은 TALE의 그의 동족 표적 DNA 서열에 대한 결합에 수반된다. 단일 "반복 단위" (또한 "반복체"로도 지칭됨)는 전형적으로 33-35개 아미노산 길이이고, 자연 발생 TALE 단백질 내의 다른 TALE 반복 서열과 적어도 일부의 서열 상동성을 나타낸다. 예를 들어, 미국 특허 공개 번호 20110301073 (그 전문이 본원에 참조로 포함됨)을 참조한다.
CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)/Cas (CRISPR 연관) 뉴클레아제 시스템. 간략하게, "CRISPR DNA 결합 도메인"은 CAS 효소와 관련하여 작용함으로써 게놈 DNA를 선택적으로 인식하고 결합하며 절단할 수 있는 짧은 가닥 RNA 분자이다. CRISPR/Cas 시스템은 게놈에서의 목적하는 표적에 이중 가닥 파괴 (DSB)를 생성하도록 조작될 수 있고, DSB의 복구는 오류 유발 복구의 증가를 야기하는 복구 억제제의 사용에 의해 영향받을 수 있다. 예를 들어 문헌 [Jinek et al. (2012) Science 337, p. 816-821, Jinek et al., (2013), eLife 2:e00471, 및 David Segal, (2013) eLife 2:e00563)]을 참조한다.
아연 핑거, CRISPR 및 TALE 결합 도메인은, 예를 들어 자연 발생 아연 핑거의 인식 나선 영역의 조작 (하나 이상의 아미노산의 변경)을 통해 미리 결정된 뉴클레오티드 서열에 결합하도록 "조작"될 수 있다. 유사하게, TALE는, 예를 들어 DNA 결합에 수반되는 아미노산 (반복 가변 이잔기 또는 RVD 영역)의 조작에 의해 미리 결정된 뉴클레오티드 서열에 결합하도록 "조작"될 수 있다. 따라서, 조작된 DNA 결합 단백질 (아연 핑거 또는 TALE)은 비-자연 발생 단백질이다. DNA-결합 단백질을 조작하는 방법의 비제한적 예는 설계 및 선택이다. 설계된 DNA 결합 단백질은 주로 합리적 기준에 의해 설계/조성이 이루어지는, 자연에서 발생하지 않는 단백질이다. 설계를 위한 합리적 기준은 기존 ZFP 및/또는 TALE 설계 및 결합 데이터의 정보가 저장된 데이터베이스에서 정보를 처리하기 위한 치환 규칙 및 컴퓨터 알고리즘의 적용을 포함한다. 예를 들어, 미국 특허 6,140,081; 6,453,242; 및 6,534,261을 참조하고; 또한, WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496 및 미국 공개 번호 20110301073, 20110239315 및 20119145940을 참조한다.
"선택된" 아연 핑거 단백질, CRISPR 또는 TALE은 주로 실험적 과정, 예컨대 파지 디스플레이, 상호작용 트랩 또는 하이브리드 선택에 의해 생산이 이루어지는, 자연에서 발견되지 않는 단백질이다. 예를 들어, 미국 특허 번호 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197 및 WO 02/099084 및 미국 공개 번호 20110301073, 20110239315 및 20119145940을 참조한다.
"재조합"은 비-상동 말단 연결 (NHEJ) 및 상동 재조합에 의한 공여자 포획을 포함하나 이에 제한되지는 않는, 2개 폴리뉴클레오티드 사이의 유전자 정보의 교환 과정을 지칭한다. 본 개시내용의 목적을 위해, "상동 재조합 (HR)"은, 예를 들어 상동성-지정 복구 메카니즘을 통한 세포에서의 이중 가닥 파괴의 복구 동안에 발생하는 상기 교환의 특수한 형태를 지칭한다. 이 과정은 뉴클레오티드 서열 상동성을 요구하고, "표적" 분자 (즉, 이중 가닥 파괴를 겪은 뉴클레오티드 서열)의 주형 복구를 위해 "공여자" 분자를 사용하며, "비-교차 유전자 전환" 또는 "숏트랙 유전자 전환"으로 다양하게 알려져 있는데, 이는 그것이 공여자로부터 표적으로의 유전자 정보 전달을 일으키기 때문이다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 이러한 전달은 파괴된 표적과 공여자 사이에 형성되는 헤테로듀플렉스 DNA의 미스매치 수정, 및/또는 표적의 일부가 될 유전자 정보를 재합성하는데 공여자가 사용되는 "합성-의존적 가닥 어닐링", 및/또는 관련 과정을 수반할 수 있다. 이러한 특수한 HR은 공여자 폴리뉴클레오티드의 서열의 일부 또는 전부가 표적 폴리뉴클레오티드 내로 혼입되도록 표적 분자의 서열의 변경을 종종 유발한다. HR-지정 통합을 위해, 공여자 분자는 적어도 50-100개 염기 쌍 길이를 갖는, 게놈에 대한 적어도 2개 상동성 영역 ("상동성 아암")을 함유한다. 예를 들어, 미국 특허 공개 번호 20110281361을 참조한다.
본 개시내용의 방법에서, 본원에 기재된 바와 같은 하나 이상의 표적화 뉴클레아제는 미리 결정된 부위에서의 표적 서열 (예를 들어, 세포 염색질)에 이중 가닥 파괴를 생성하고, HR 매개된 통합을 위한 파괴 영역에서의 뉴클레오티드 서열에 대해 상동성을 갖거나 또는 NHEJ 매개된 통합을 위한 파괴 영역에서의 뉴클레오티드 서열에 대해 상동성을 갖는 "공여자" 폴리뉴클레오티드가 세포 내로 도입될 수 있다. 이중 가닥 파괴의 존재는 공여자 서열의 통합을 용이하게 하는 것으로 밝혀졌다. 공여자 서열은 물리적으로 통합될 수 있거나, 또는 대안적으로, 공여자 폴리뉴클레오티드는 상동 재조합을 통한 파괴의 복구를 위한 주형으로서 사용되어 공여자에서와 같은 뉴클레오티드 서열의 전부 또는 일부의 세포 염색질 내로의 도입을 유발한다. 따라서, 세포 염색질에서의 제1 서열은 변경될 수 있고, 특정 실시양태에서, 공여자 폴리뉴클레오티드에 존재하는 서열로 전환될 수 있다. 따라서, 용어 "대체하다" 또는 "대체"의 사용은 하나의 뉴클레오티드 서열의 또 다른 서열로의 대체 (즉, 정보제공 의미에서 서열의 대체)를 나타내는 것으로 이해될 수 있고, 반드시 하나의 폴리뉴클레오티드 서열의 또 다른 서열로의 물리적 또는 화학적 대체를 요구하는 것은 아니다.
본원에 기재된 임의의 방법에서, 아연 핑거 단백질, CRISPRS 또는 TALEN의 추가의 쌍은 세포 내의 추가의 표적 부위의 추가의 이중 가닥 절단을 위해 사용될 수 있다.
본원에 기재된 임의의 방법은 임의의 크기의 공여자의 삽입 및/또는 관심 유전자(들)의 발현을 파괴하는 공여자 서열의 표적화 통합에 의한 세포 내의 하나 이상의 표적 서열의 부분적 또는 완전한 불활성화를 위해 사용될 수 있다. 또한, 부분적으로 또는 완전히 불활성화된 유전자를 갖는 세포주도 제공된다.
게다가, 본원에 기재된 바와 같은 표적화 통합 방법은 하나 이상의 외인성 서열을 통합하는데 사용될 수도 있다. 외인성 핵산 서열은, 예를 들어 하나 이상의 유전자 또는 cDNA 분자, 또는 임의의 유형의 코딩 또는 비코딩 서열, 뿐만 아니라 하나 이상의 제어 요소 (예를 들어, 프로모터)를 포함할 수 있다. 추가로, 외인성 핵산 서열 (트랜스진)은 하나 이상의 RNA 분자 (예를 들어, 소형 헤어핀 RNA (shRNA), 억제 RNA (RNAi), 마이크로RNA (miRNA) 등) 또는 단백질을 생산할 수 있다.
본원에 사용된 "절단"은 DNA 분자의 포스페이트-당 백본의 파괴를 정의한다. 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 제한되지는 않는 다양한 방법에 의해 절단이 개시될 수 있다. 단일 가닥 절단 및 이중 가닥 절단 둘 다가 가능하고, 이중 가닥 절단은 2개의 구별되는 단일 가닥 절단 사례의 결과로서 발생할 수 있다. DNA 절단은 평활 말단 또는 엇갈림 말단의 생산을 유발할 수 있다. 특정 실시양태에서, 융합 폴리펩티드가 표적화 이중 가닥 DNA 절단에 사용된다. "절단 도메인"은 DNA 절단을 위한 촉매 활성을 보유하는 하나 이상의 폴리펩티드 서열을 포함한다. 절단 도메인은 단일 폴리펩티드 쇄에 함유될 수 있거나, 또는 절단 활성은 2개 (또는 그 초과)의 폴리펩티드의 회합으로부터 유발될 수 있다.
"절단 절반-도메인"은, 제2 폴리펩티드 (동일하거나 상이함)와 함께, 절단 활성 (바람직하게는 이중 가닥 절단 활성)을 갖는 복합체를 형성하는 폴리펩티드 서열이다. 용어 "제1 및 제2 절단 절반-도메인", "+ 및 - 절단 절반-도메인" 및 "우측 및 좌측 절단 절반-도메인"은 이량체화되는 절단 절반-도메인의 쌍을 지칭하는 것으로 상호교환가능하게 사용된다.
"조작된 절단 절반-도메인"은 또 다른 절단 절반-도메인 (예를 들어, 또 다른 조작된 절단 절반-도메인)과 절대적 이종이량체를 형성하도록 변형된 절단 절반-도메인이다. 또한, 미국 특허 공개 번호 2005/0064474, 20070218528, 2008/0131962 및 2011/0201055 (그 전문이 본원에 참조로 포함됨)를 참조한다.
"표적 부위" 또는 "표적 서열"은 결합을 위한 충분한 조건이 존재하는 한 결합 분자가 결합할 핵산의 일부분을 지칭한다.
핵산은 DNA 및 RNA를 포함하고, 단일 가닥 또는 이중 가닥일 수 있으며; 선형, 분지형 또는 원형일 수 있고; 임의의 길이일 수 있다. 핵산은 듀플렉스를 형성할 수 있는 것, 뿐만 아니라 트리플렉스-형성 핵산을 포함한다. 예를 들어, 미국 특허 번호 5,176,996 및 5,422,251을 참조한다. 단백질은 DNA 결합 단백질, 전사 인자, 염색질 재형성 인자, 메틸화 DNA 결합 단백질, 폴리머라제, 메틸라제, 데메틸라제, 아세틸라제, 데아세틸라제, 키나제, 포스파타제, 인테그라제, 레콤비나제, 리가제, 토포이소머라제, 기라제 및 헬리카제를 포함하나, 이에 제한되지는 않는다.
"외인성 핵산의 산물"은 폴리뉴클레오티드 및 폴리펩티드 산물 둘 다, 예를 들어 전사 산물 (폴리뉴클레오티드, 예컨대 RNA) 및 번역 산물 (폴리펩티드)을 포함한다.
"융합" 분자는 2개 이상의 서브유닛 분자가 연결된, 예를 들어 공유 연결된 분자이다. 서브유닛 분자는 동일한 화학적 유형의 분자일 수 있거나, 또는 상이한 화학적 유형의 분자일 수 있다. 제1 유형의 융합 분자의 예는, 융합 단백질 (예를 들어, ZFP DNA-결합 도메인과 절단 도메인 사이의 융합체) 및 융합 핵산 (예를 들어, 상기 기재된 융합 단백질을 코딩하는 핵산)을 포함하나, 이에 제한되지는 않는다. 제2 유형의 융합 분자의 예는, 트리플렉스-형성 핵산과 폴리펩티드 사이의 융합체, 및 작은 홈 결합제와 핵산 사이의 융합체를 포함하나, 이에 제한되지는 않는다. 세포에서의 융합 단백질의 발현은 융합 단백질을 세포에 전달하여 일어날 수 있거나, 또는 융합 단백질을 코딩하는 폴리뉴클레오티드를 세포에 전달하여 일어날 수 있으며, 여기서 상기 폴리뉴클레오티드가 전사되고 전사체가 번역되어 융합 단백질이 생성된다. 트랜스-스플라이싱, 폴리펩티드 절단 및 폴리펩티드 라이게이션이 또한 세포에서의 단백질의 발현에 수반될 수 있다. 폴리뉴클레오티드 및 폴리펩티드를 세포에 전달하는 방법은 본 개시내용의 다른 곳에서 제시된다.
본 개시내용의 목적을 위해, "유전자"는 유전자 산물을 코딩하는 DNA 영역 (하기 참조), 뿐만 아니라 조절 서열이 코딩 서열 및/또는 전사된 서열에 인접하는지 또는 그에 작동가능하게 연결되어 있는지 여부와는 상관없이, 유전자 산물의 생산을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 프로모터 서열, 종결인자, 번역 조절 서열, 예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 사일렌서, 인슐레이터, 경계 요소, 복제 기점, 매트릭스 부착 부위 및 유전자좌 제어 영역을 포함하나, 이에 제한되지는 않는다.
"유전자 발현"은 유전자에 함유된 정보가 유전자 산물로 전환되는 것을 지칭한다. 유전자 산물은 유전자의 직접적인 전사 산물 (예를 들어, mRNA, tRNA, rRNA, 안티센스 RNA, 간섭 RNA, 리보자임, 구조 RNA 또는 임의의 다른 유형의 RNA) 또는 mRNA의 번역에 의해 생산된 단백질일 수 있다. 유전자 산물은, 캡핑, 폴리아데닐화, 메틸화 및 편집과 같은 과정에 의해 변형된 RNA, 및 예를 들어 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화 및 글리코실화에 의해 변형된 단백질을 또한 포함한다.
서열 동일성: 2개의 핵산 또는 폴리펩티드 서열과 관련하여 본원에 사용된 용어 "서열 동일성" 또는 "동일성"은 명시된 비교 윈도우에 걸쳐 최대 상응도로 정렬하는 경우에 2개의 서열에서의 동일한 잔기를 지칭한다.
본원에 사용된 용어 "서열 동일성의 백분율"은 비교 윈도우에 걸쳐 2개의 최적으로 정렬된 서열 (예를 들어, 핵산 서열 및 아미노산 서열)을 비교함으로써 결정된 값을 지칭하며, 여기서 비교 윈도우에서의 서열의 부분은, 두 서열의 최적 정렬을 위해 (부가 또는 결실을 포함하지 않는) 참조 서열과 비교하여 부가 또는 결실 (즉, 갭)을 포함할 수 있다. 백분율은, 두 서열에서 동일한 뉴클레오티드 또는 아미노산 잔기가 발생하는 위치의 수를 결정하여 매치된 위치의 수를 산출하고, 매치된 위치의 수를 비교 윈도우에서의 위치의 총수로 나눈 다음, 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산된다.
비교를 위해 서열을 정렬하는 방법은 관련 기술분야에 널리 알려져 있다. 다양한 프로그램 및 정렬 알고리즘은, 예를 들어 다음의 문헌에 기재되어 있다: [Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman and Wunsch (1970) J. Mol. Biol. 48:443; Pearson and Lipman (1988) Proc. Natl. Acad. Sci. U.S.A. 85:2444; Higgins and Sharp (1988) Gene 73:237-44; Higgins and Sharp (1989) CABIOS 5:151-3; Corpet et al. (1988) Nucleic Acids Res. 16:10881-90; Huang et al. (1992) Comp. Appl. Biosci. 8:155-65; Pearson et al. (1994) Methods Mol. Biol. 24:307-31; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247-50]. 서열 정렬 방법 및 상동성 계산의 상세한 고찰은, 예를 들어 문헌 [Altschul et al. (1990) J. Mol. Biol. 215:403-10]에서 찾아볼 수 있다. 국립 생물 정보 센터 (NCBI) 베이식 로컬 얼라인먼트 서치 툴(Basic Local Alignment Search Tool) (블라스트™; Altschul et al. (1990))은 여러 서열 분석 프로그램과 함께 사용하기 위해 국립 생물 정보 센터 (메릴랜드주 베테스다)를 비롯한 여러 공급원으로부터 및 인터넷 상에서 입수가능하다. 이 프로그램을 사용하여 서열 동일성을 결정하는 방법의 설명은 인터넷 상에서 블라스트™에 대한 "도움" 섹션 하에 입수가능하다. 핵산 서열의 비교를 위해, 블라스트™ (Blastn(블라스트엔)) 프로그램의 "블라스트 2 서열" 기능은 디폴트 파라미터를 사용하여 이용될 수 있다. 참조 서열에 대해 보다 큰 유사성을 갖는 핵산 서열은 이 방법에 의해 평가하는 경우에 증가하는 동일성 백분율을 나타낼 것이다.
특이적으로 혼성화가능한/특이적으로 상보적인: 본원에 사용된 용어 "특이적으로 혼성화가능한" 및 "특이적으로 상보적인"은 핵산 분자와 표적 핵산 분자 사이에 안정하고 특이적인 결합이 이루어지도록 하는 충분한 정도의 상보성을 나타내는 용어이다. 두 핵산 분자 사이의 혼성화는 두 핵산 분자의 핵산 서열 사이의 역평행 정렬 형성을 수반한다. 이어서, 두 분자는 대향하는 가닥 상의 상응하는 염기와 수소 결합을 형성하여, 충분히 안정한 경우에 관련 기술분야에 널리 알려져 있는 방법을 사용하여 검출가능한 듀플렉스 분자를 형성할 수 있다. 핵산 분자는 특이적으로 혼성화가능한 그의 표적 서열에 대해 100% 상보적이어야 할 필요는 없다. 그러나, 특이적인 혼성화를 위해 존재해야 하는 서열 상보성의 양은 사용되는 혼성화 조건의 함수이다.
특정한 정도의 엄격도를 가져오는 혼성화 조건은 선택 혼성화 방법의 성질 및 혼성화 핵산 서열의 조성과 길이에 따라 달라질 것이다. 일반적으로, 혼성화 온도 및 혼성화 완충제의 이온 강도 (특히, Na+ 및/또는 Mg++ 농도)가 혼성화의 엄격도를 결정할 것이지만, 세척 시간 또한 엄격도에 영향을 미친다. 특정한 정도의 엄격도를 달성하는데 요구되는 혼성화 조건에 관한 계산은 관련 기술분야의 통상의 기술자에게 알려져 있으며, 예를 들어 문헌 [Sambrook et al. (ed.) Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, chapters 9 and 11; 및 Hames and Higgins (eds.) Nucleic Acid Hybridization, IRL Press, Oxford, 1985]에 논의되어 있다. 핵산 혼성화에 관한 추가의 상세한 지침 및 안내는, 예를 들어 문헌 [Tijssen, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," in Laboratory Techniques in Biochemistry and Molecular Biology- Hybridization with Nucleic Acid Probes, Part I, Chapter 2, Elsevier, NY, 1993; 및 Ausubel et al., Eds., Current Protocols in Molecular Biology, Chapter 2, Greene Publishing and Wiley-Interscience, NY, 1995]에서 찾아볼 수 있다.
본원에 사용된 바와 같이, "엄격한 조건"은 혼성화 분자와 표적 핵산 분자 내의 서열 사이에 20% 미만의 미스매치가 존재하는 경우에만 단지 혼성화가 일어나게 되는 조건을 포괄한다. "엄격한 조건"은 추가의 특정한 수준의 엄격도를 포함한다. 따라서, 본원에 사용된 바와 같이, "중간 엄격도" 조건은 20% 초과의 서열 미스매치를 갖는 분자는 혼성화되지 않을 조건이고; "고 엄격도" 조건은 10% 초과의 미스매치를 갖는 서열은 혼성화되지 않을 조건이고; "초고 엄격도" 조건은 5% 초과의 미스매치를 갖는 서열은 혼성화되지 않을 조건이다. 하기는 대표적인 비제한적 혼성화 조건이다:
고 엄격도 조건 (적어도 90% 서열 동일성을 공유하는 서열을 검출함): 16시간 동안 65℃에서 5x SSC 완충제 (여기서 SSC 완충제는 세제, 예컨대 SDS, 및 추가의 시약, 예컨대 연어 정액 DNA, EDTA 등)에서의 혼성화; 각각 15분 동안 실온에서 2x SSC 완충제 (여기서 SSC 완충제는 세제, 예컨대 SDS, 및 추가의 시약, 예컨대 연어 정액 DNA, EDTA 등)에서의 2회 세척; 및 각각 20분 동안 65℃에서 0.5x SSC 완충제 (여기서 SSC 완충제는 세제, 예컨대 SDS, 및 추가의 시약, 예컨대 연어 정액 DNA, EDTA 등)에서의 2회 세척.
중간 엄격도 조건 (적어도 80% 서열 동일성을 공유하는 서열을 검출함): 16-20시간 동안 65-70℃에서 5x-6x SSC 완충제 (여기서 SSC 완충제는 세제, 예컨대 SDS, 및 추가의 시약, 예컨대 연어 정액 DNA, EDTA 등)에서의 혼성화; 각각 5-20분 동안 실온에서 2x SSC 완충제 (여기서 SSC 완충제는 세제, 예컨대 SDS, 및 추가의 시약, 예컨대 연어 정액 DNA, EDTA 등)에서의 2회 세척; 및 각각 30분 동안 55-70℃에서 1x SSC 완충제 (여기서 SSC 완충제는 세제, 예컨대 SDS, 및 추가의 시약, 예컨대 연어 정액 DNA, EDTA 등)에서의 2회 세척.
비-엄격한 대조군 조건 (적어도 50% 서열 동일성을 공유하는 서열이 혼성화될 것임): 16-20시간 동안 실온 내지 55℃에서 6x SSC 완충제 (여기서 SSC 완충제는 세제, 예컨대 SDS, 및 추가의 시약, 예컨대 연어 정액 DNA, EDTA 등)에서의 혼성화; 각각 20-30분 동안 실온 내지 55℃에서 2x-3x SSC 완충제 (여기서 SSC 완충제는 세제, 예컨대 SDS, 및 추가의 시약, 예컨대 연어 정액 DNA, EDTA 등)에서의 적어도 2회 세척.
본원에 사용된 바와 같이, 인접 핵산 서열과 관련하여 용어 "실질적으로 상동성인" 또는 "실질적 상동성"은 인접 뉴클레오티드 서열이 엄격한 조건 하에서 참조 핵산 서열에 혼성화된다는 것을 지칭한다. 예를 들어, 참조 핵산 서열에 실질적으로 상동성인 핵산 서열은 엄격한 조건 (예를 들어, 상기 설명된 중간 엄격도 조건) 하에서 참조 핵산 서열에 혼성화되는 핵산 서열이다. 실질적으로 상동성인 서열은 적어도 80%의 서열 동일성을 가질 수 있다. 예를 들어, 실질적으로 상동성인 서열은 약 80% 내지 100% 서열 동일성, 예컨대 약 81%; 약 82%; 약 83%; 약 84%; 약 85%; 약 86%; 약 87%; 약 88%; 약 89%; 약 90%; 약 91%; 약 92%; 약 93%; 약 94% 약 95%; 약 96%; 약 97%; 약 98%; 약 98.5%; 약 99%; 약 99.5%; 및 약 100%를 가질 수 있다. 실질적 상동성의 특성은 특이적인 혼성화와 밀접한 관련이 있다. 예를 들어, 핵산 분자는 특이적 결합이 요망되는 조건 하에서, 예를 들어 엄격한 혼성화 조건 하에서 핵산의 비-표적 서열에 대한 비-특이적 결합을 피할 수 있는 충분한 정도의 상보성이 존재하는 경우에 특이적으로 혼성화가능하다.
일부 경우에 "상동"은 공통의 조상 DNA 서열로부터 유래한 제2 유전자에 대한 제1 유전자의 관계를 지칭하는 것으로 사용될 수 있다. 이러한 경우에, 용어 상동체는 종분화 사례에 의해 분리된 유전자 사이의 관계를 나타내거나 (오르토로그 참조), 또는 유전자 중복의 사례에 의해 분리된 유전자 사이의 관계를 나타낸다 (파라로그 참조). 다른 경우에 "상동"은 하나 이상의 폴리뉴클레오티드 서열 사이의 서열 동일성의 수준을 지칭하는데 사용될 수 있으며, 이러한 경우에 하나 이상의 폴리뉴클레오티드 서열이 반드시 공통 조상 DNA 서열에서 유래하는 것은 아니다. 관련 기술분야의 통상의 기술자는 용어 "상동"이 상호교환가능하다는 것을 알 것이며 그 용어의 적절한 적용을 인지한다.
본원에 사용된 용어 "오르토로그" (또는 "오르토로고스")는 공통 조상 뉴클레오티드 서열로부터 진화하였으며 2개 이상의 종에서 동일한 기능을 보유할 수 있는 2개 이상의 종 중의 유전자를 지칭한다.
본원에 사용된 용어 "파라로고스"는 게놈 내의 중복과 관련된 유전자를 지칭한다. 오르토로그는 진화의 도중에 동일한 기능을 보유하는 반면에, 파라로그는 새로운 기능이 본래 유전자 기능과 무관할지라도 이들 새로운 기능을 진화시킨다.
본원에 사용된 바와 같이, 2개의 핵산 서열 분자는, 5' → 3' 방향으로 판독된 서열의 모든 뉴클레오티드가 3' → 5' 방향으로 판독되었을 때의 다른 서열의 모든 뉴클레오티드와 상보적인 경우에 "완전한 상보성"을 나타낸다고 말할 수 있다. 참조 뉴클레오티드 서열에 상보적인 뉴클레오티드 서열은 참조 뉴클레오티드 서열의 역 상보체 서열과 동일한 서열을 나타낼 것이다. 이들 용어 및 설명은 관련 기술분야에 널리 정의되어 있으며, 통상의 기술자에 의해 용이하게 이해된다.
아미노산 서열 사이의 서열 동일성의 백분율을 결정하는 경우에, 정렬에 의해 제공된 주어진 위치에서의 아미노산의 동일성은 정렬된 서열을 포함하는 폴리펩티드의 목적하는 특성에 영향을 미치지 않으면서 상이할 수 있다는 것이 관련 기술분야의 통상의 기술자에게 널리 알려져 있다. 이들 경우에, 퍼센트 서열 동일성은 보존적으로 치환된 아미노산 사이의 유사성을 고려하여 조정될 수 있다. 이들 조정은 널리 알려져 있으며, 통상의 기술자에 의해 통상적으로 사용된다. 예를 들어, 문헌 [Myers and Miller (1988) Computer Applications in Biosciences 4:11-7]을 참조한다. 통계적 방법은 관련 기술분야에 알려져 있고, 확인된 7,018개의 최적 게놈 유전자좌의 분석에 사용될 수 있다.
한 실시양태로서, 7,018개의 개별 최적 게놈 유전자좌 서열을 포함하는 확인된 최적 게놈 유전자좌는 F-분포 검정을 통해 분석될 수 있다. 확률 이론 및 통계에서, F-분포는 연속 확률 분포이다. F-분포 검정은 F-분포를 갖는 통계적 유의성 검정이고, 데이터 세트에 피팅된 통계적 모델과 비교하는 경우에 최고-피팅 모델을 확인하는데 사용된다. F-분포는 연속 확률 분포이고, 또한 스네데코르(Snedecor)의 F-분포 또는 피셔(Fisher)-스네데코르 분포로 알려져 있다. F-분포는 가장 주목할만하게는 분산 분석에서 검정 통계의 귀무 분포로서 빈번하게 발생한다. F-분포는 우경 분포이다. F-분포는 0의 최소 값을 갖지만 최대 값은 갖지 않는 비대칭 분포이다. 곡선은 0의 우측으로 멀지 않은 피크에 도달한 다음, F 값이 커짐에 따라 수평축에 점차적으로 접근한다. F-분포는 수평축에 접근하지만, 결코 수평축에 상당히 접촉하지는 않는다. 다른 실시양태에서, 이 방정식 또는 실제로 상이한 방정식 상의 변형이 통상의 기술자에 의해 유도되고 사용될 수 있으며, 7,018개의 개별 최적 게놈 유전자좌 서열의 분석에 적용가능하다.
작동가능하게 연결됨: 제1 뉴클레오티드 서열이 제2 뉴클레오티드 서열과 기능적 관계에 있을 때, 제1 뉴클레오티드 서열은 제2 뉴클레오티드 서열과 "작동가능하게 연결"된다. 예를 들어, 프로모터가 코딩 서열의 전사 또는 발현에 영향을 미치는 경우에, 프로모터는 코딩 서열에 작동가능하게 연결된다. 재조합적으로 생산되었을 때, 작동가능하게 연결된 뉴클레오티드 서열은 동일한 리딩 프레임에서 일반적으로 인접해 있고, 필요한 경우에 두 단백질-코딩 영역을 연결시킨다. 그러나, 뉴클레오티드 서열은 작동가능하게 연결되기 위해 인접할 필요는 없다.
용어 "작동가능하게 연결된"은 조절 서열 및 코딩 서열과 관련하여 사용되는 경우에, 조절 서열이 연결된 코딩 서열의 발현에 영향을 미친다는 것을 의미한다. "조절 서열", "조절 요소" 또는 "제어 요소"는 전사의 시기 및 수준/양, RNA 프로세싱 또는 안정성, 또는 회합된 코딩 서열의 번역에 영향을 미치는 뉴클레오티드 서열을 지칭한다. 조절 서열은 프로모터; 번역 리더 서열; 인트론; 인핸서; 스템-루프 구조; 리프레서 결합 서열; 종결 서열; 폴리아데닐화 인식 서열 등을 포함할 수 있다. 특정한 조절 서열은 그에 작동가능하게 연결된 코딩 서열의 상류 및/또는 하류에 위치할 수 있다. 또한, 코딩 서열에 작동가능하게 연결된 특정한 조절 서열은 이중 가닥 핵산 분자의 회합된 상보적 가닥 상에 위치할 수 있다.
2개 이상의 아미노산 서열에 관하여 사용되는 경우에, 용어 "작동가능하게 연결된"은 제1 아미노산 서열이 추가의 아미노산 서열 중 적어도 하나와 기능적 관계에 있음을 의미한다.
개시된 방법 및 조성물은, DNA-결합 도메인 (예를 들어, ZFP)에 작동가능하게 연결된 절단 도메인을 포함하는 융합 단백질을 포함하며, 여기서 DNA-결합 도메인은 대두 최적 게놈 유전자좌에서의 서열에 결합함으로써 절단 도메인의 활성을 상기 서열 부근으로 지시하여 최적 게놈 유전자좌에서의 이중 가닥 파괴를 유도한다. 본 개시내용의 다른 곳에서 설명된 바와 같이, 아연 핑거 도메인은 사실상 임의의 목적하는 서열에 결합하도록 조작될 수 있다. 따라서, 하나 이상의 DNA-결합 도메인은 최적 게놈 유전자좌에서의 하나 이상의 서열에 결합하도록 조작될 수 있다. 세포에서 DNA-결합 도메인 및 절단 도메인을 포함하는 융합 단백질이 발현되면 표적 부위에서 또는 그 근처에서 절단이 이루어진다.
실시양태
쌍자엽 식물, 예컨대 대두 식물의 게놈에서의 특정 위치에 대한 트랜스진 및 트랜스진 스택의 표적화는 트랜스제닉 사례의 품질을 개선시키고, 트랜스제닉 사례의 생산과 연관된 비용을 감소시키며, 트랜스제닉 식물 제품을 제조하는 신규 방법, 예컨대 순차적 유전자 스택킹을 제공할 것이다. 전체적으로, 특정 게놈 부위에 대한 트랜스진 표적화가 상업적으로 유익할 가능성이 있다. 식물 및 다른 게놈에서의 미리-선택된 부위에 공여자 폴리뉴클레오티드의 부가를 용이하게 할 수 있는 부위-특이적 뉴클레아제, 예컨대 ZFN, CRISPR 및 TALEN의 개발을 향한 유의한 진보가 지난 수년간 이루어졌다. 그러나, 표적화에 적합한 게놈 부위의 속성에 관해서는 매우 덜 알려져 있다. 이력상, 게놈에서의 비-본질적 유전자 및 병원체 (바이러스) 통합 부위가 표적화를 위한 유전자좌로서 사용되었다. 게놈에서의 이러한 부위의 수는 오히려 제한적이고, 따라서 공여자 폴리뉴클레오티드 서열의 표적화에 사용될 수 있는 최적 게놈 유전자좌의 확인 및 특징화에 대한 필요성이 존재한다. 표적화를 잘 받아들이는 것에 추가로, 최적 게놈 유전자좌는 트랜스진 발현 및 육종 적용을 지지할 수 있는 중립적 부위일 것으로 예상된다.
출원인은 추가의 기준이 삽입 부위에 요망된다는 것을 인식하였고, 외인성 서열의 삽입을 위해 쌍자엽 게놈, 예컨대 대두 게놈에서의 최적 부위를 확인하고 선택하기 위해 이들 기준을 합하였다. 표적화 목적을 위해, 선택된 삽입 부위는 고유할 필요가 있고 쌍자엽 식물, 예컨대 대두 식물의 게놈에서의 비-반복 영역에 있을 필요가 있다. 마찬가지로, 삽입을 위한 최적 게놈 부위는 최소의 바람직하지 않은 표현형 효과를 보유하여야 하고, 전통적인 육종 기술을 사용하여 농경학상 우량 계통으로의 유전자이입을 용이하게 하기 위해 재조합 사례에 감수성이어야 한다. 열거된 기준을 충족하는 게놈 유전자좌를 확인하기 위해, 대두 식물의 게놈은 폴리뉴클레오티드 공여자 서열의 통합 및 삽입된 코딩 서열의 후속 발현에 유익한 신규 게놈 유전자좌 보유 특징을 확인하기 위해 맞춤형 생물정보학 접근법 및 게놈 규모 데이터세트를 사용하여 스캐닝되었다.
I. 비유전자 대두 게놈 유전자좌의 확인
한 실시양태에 따르면, 외인성 서열의 삽입을 위한 최적 비유전자 대두 게놈 서열을 확인하는 방법이 제공된다. 방법은 먼저 저메틸화된 적어도 1 Kb 길이의 대두 게놈 서열을 확인하는 단계를 포함한다. 한 실시양태에서, 저메틸화 게놈 서열은 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 10, 11, 12, 13, 14, 15, 16 또는 17 Kb 길이이다. 한 실시양태에서 저메틸화 게놈 서열은 약 1 내지 약 5.7 Kb 길이이고, 추가 실시양태에서 약 2 Kb 길이이다. 서열은 그것이 서열 내에 1% 미만의 DNA 메틸화를 갖는 경우에 저메틸화된 것으로 간주된다. 한 실시양태에서, 메틸화 상태는 정상 대조군 DNA 샘플 내 상응하는 CpG 디뉴클레오티드, CHG 또는 CHH 트리뉴클레오티드에서 발견된 총 시토신의 양 대비, 선택된 대두 서열 내 하나 이상의 CpG 디뉴클레오티드, CHG 또는 CHH 트리뉴클레오티드에서의 5-메틸시토신의 존재를 기초로 측정된다. 보다 특히, 한 실시양태에서, 선택된 대두 서열은 선택된 대두 서열의 500개 뉴클레오티드당 1, 2 또는 3개 미만의 메틸화 뉴클레오티드를 갖는다. 한 실시양태에서, 선택된 대두 서열은 선택된 대두 서열의 500개 뉴클레오티드당 1, 2 또는 3개 미만의 CpG 디뉴클레오티드에서의 5-메틸시토신을 갖는다. 한 실시양태에서, 선택된 대두 서열은 1 내지 4 Kb 길이이고, 5-메틸시토신 결여된 1 Kb 서열을 포함한다. 한 실시양태에서, 선택된 대두 서열은 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5 또는 6 Kb 길이이고, 그의 전체 길이에 1 또는 0개의 메틸화 뉴클레오티드를 포함한다. 한 실시양태에서, 선택된 대두 서열은 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5 또는 6 Kb 길이이고, 그의 전체 길이 내에 CpG 디뉴클레오티드에서의 5-메틸시토신을 함유하지 않는다. 한 실시양태에 따르면, 선택된 대두 서열의 메틸화는 공급원 조직을 기초로 달라질 수 있다. 이러한 실시양태에서, 서열이 저메틸화된 것인지를 결정하는데 사용된 메틸화 수준은 2개 이상의 조직 (예를 들어, 뿌리 및 싹)으로부터 단리된 서열에서의 메틸화의 평균 양을 나타낸다.
최적 게놈 부위가 저메틸화되어야 하는 요건에 추가로, 선택된 대두 서열은 또한 비유전자여야 한다. 따라서, 모든 저메틸화 게놈 서열은 유전자 영역을 함유하는 저메틸화 서열을 제거하기 위해 추가로 스크리닝된다. 이것은 전사체가 단백질을 코딩하는지 여부에 상관없이 임의의 오픈 리딩 프레임을 포함한다. 오픈 리딩 프레임의 발현의 조절에 수반되는 임의의 확인가능한 인접한 5' 및 3' 비-코딩 뉴클레오티드 서열 및 유전자 영역에 존재할 수 있는 임의의 인트론을 포함한 유전자 영역을 포함하는 저메틸화 게놈 서열은, 본 개시내용의 최적 비유전자 대두 게놈 유전자좌에서 제외된다.
최적 비유전자 대두 게놈 유전자좌는 또한 재조합의 증거를 입증하는 서열이어야 한다. 한 실시양태에서, 선택된 대두 서열은 다중 맵핑 집단으로부터 생성된 고해상 마커 데이터세트를 사용하여 검출된 바와 같이 선택된 대두 서열에 플랭킹된 2개 마커 사이에 적어도 하나의 재조합 사례를 함유하여야 한다. 한 실시양태에서, 0.5, 1, 1.5 Mb 쌍자엽 게놈 서열, 예컨대 선택된 대두 서열을 포함하는 대두 게놈 서열에 플랭킹된 마커 쌍은 선택된 대두 서열에 대한 재조합 빈도를 계산하는데 사용된다. 마커 사이의 게놈 물리적 거리 (Mb 단위)에 대한 각각의 마커 쌍 사이의 재조합 빈도 (센티모르간 (cM)으로 측정)는 0.0157 cM/Mb 초과여야 한다. 한 실시양태에서, 선택된 대두 서열을 포함하는 1 Mb 대두 게놈 서열에 대한 재조합 빈도는 약 0.01574 cM/Mb 내지 약 83.52 cM/Mb의 범위이다. 한 실시양태에서, 최적 게놈 유전자좌는 선택된 대두 서열 내에서 재조합 사례가 검출된 곳이다.
최적 비유전자 대두 게놈 유전자좌는 또한 표적화가능한 서열, 즉 선택된 대두 서열을 표적화하는 유전자가 단지 대두 게놈의 하나의 위치에만 삽입되도록 대두 게놈에서 비교적 고유한 서열일 것이다. 한 실시양태에서, 최적 게놈 서열의 전체 길이는 대두 게놈에 함유된 유사한 길이의 또 다른 서열과 30%, 35% 또는 40% 미만의 서열 동일성을 공유한다. 따라서, 한 실시양태에서, 선택된 대두 서열은 대두 게놈에 함유된 또 다른 1 Kb 서열과 25%, 30%, 35% 또는 40% 초과의 서열 동일성을 공유하는 1 Kb 서열을 포함할 수 없다. 추가 실시양태에서, 선택된 대두 서열은 대두 게놈에 함유된 또 다른 500 bp 서열과 30%, 35% 또는 40% 초과의 서열 동일성을 공유하는 500 bp 서열을 포함할 수 없다. 한 실시양태에서, 선택된 대두 서열은 쌍자엽 식물, 예컨대 대두 식물의 게놈에 함유된 또 다른 1 Kb 서열과 40% 초과의 서열 동일성을 공유하는 1 Kb 서열을 포함할 수 없다.
최적 비유전자 대두 게놈 유전자좌는 또한 유전자 영역에 근접할 것이다. 보다 특히, 선택된 대두 서열은 유전자 영역 부근에 위치하여야 한다 (예를 들어, 유전자 영역은 천연 게놈에서 발견된 바와 같이 선택된 대두의 어느 한쪽 말단과 플랭킹 및 인접되는 40 Kb의 게놈 서열 내에 위치하여야 함). 한 실시양태에서, 유전자 영역은 천연 대두 게놈에서 발견된 바와 같이 선택된 대두 서열의 어느 한쪽 말단에 위치한 10, 20, 30 또는 40 Kb의 인접 게놈 서열 내에 위치한다. 한 실시양태에서, 2개 이상의 유전자 영역은 선택된 대두 서열의 두 말단에 플랭킹된 10, 20, 30 또는 40 Kb의 인접 게놈 서열 내에 위치한다. 한 실시양태에서, 1-18개의 유전자 영역은 선택된 대두 서열의 두 말단에 플랭킹된 10, 20, 30 또는 40 Kb의 인접 게놈 서열 내에 위치한다. 한 실시양태에서, 2개 이상의 유전자 영역은 선택된 대두 서열을 포함하는 20, 30 또는 40 Kb 게놈 서열 내에 위치한다. 한 실시양태에서, 1-18개의 유전자 영역은 선택된 대두 서열을 포함하는 40 Kb 게놈 서열 내에 위치한다. 한 실시양태에서, 선택된 대두 서열에 플랭킹된 10, 20, 30 또는 40 Kb의 인접 게놈 서열 내에 위치한 유전자 영역은 쌍자엽 식물, 예컨대 대두 식물의 게놈에 알려져 있는 유전자를 포함한다.
한 실시양태에 따르면, 변형된 비유전자 대두 게놈 유전자좌가 제공되며, 여기서 유전자좌는 적어도 1 Kb 길이이고, 비유전자이고, 어떠한 메틸화 시토신 잔기도 포함하지 않고, 대두 게놈 유전자좌를 포괄하는 1Mb 게놈 영역에 걸쳐 0.01574 cM/Mb 초과의 재조합 빈도를 갖고, 대두 게놈 유전자좌의 1 Kb 서열은 쌍자엽 게놈에 함유된 임의의 다른 1 Kb 서열과 40% 미만의 서열 동일성을 공유하며, 여기서 비유전자 대두 게놈 유전자좌는 관심 DNA의 비유전자 대두 게놈 유전자좌 내로의 삽입에 의해 변형된다.
최적 비유전자 대두 게놈 유전자좌를 확인하는 방법이 제공된다. 일부 실시양태에서, 방법은 먼저 1 Kb의 최소 길이를 갖고 저메틸화된 (임의로 여기서 게놈 서열은 1% 미만의 메틸화를 갖고, 임의로 여기서 게놈 서열은 임의의 메틸화 시토신 잔기가 결여되어 있음) 선택된 대두 서열의 제1 풀을 생성하기 위해 쌍자엽 게놈을 스크리닝하는 것을 포함한다. 이 선택된 대두 서열의 제1 풀은 최적 비유전자 대두 게놈 유전자좌의 요건을 충족하지 않는 유전자좌를 제거하기 위해 추가로 스크리닝될 수 있다. 쌍자엽 전사체를 코딩하는 쌍자엽 게놈 서열, 예컨대 대두로부터 수득된 것은 유사한 길이의 또 다른 서열과 40% 초과 또는 그보다 높은 서열 동일성을 공유하고, 재조합의 증거를 나타내지 않고, 선택된 대두 서열의 40 Kb 내에 알려져 있는 오픈 리딩 프레임을 갖지 않고, 제1 서열 풀로부터 제거되어, 최적 비유전자 대두 유전자좌로서의 자격이 있는 제2 서열 풀을 남긴다. 한 실시양태에서, 상기 비유전자 서열의 한 말단의 40 Kb 내에, 알려져 있는 쌍자엽 유전자 (즉, 대두 유전자) 또는 알려져 있는 쌍자엽 유전자의 2 Kb 상류 및/또는 1 Kb 하류 영역을 포함하는 서열을 갖지 않는 임의의 선택된 대두 서열은 제1 서열 풀로부터 제거된다. 한 실시양태에서, 선택된 대두 서열의 40 Kb 내에 단백질을 발현하는 알려져 있는 유전자를 함유하지 않는 임의의 선택된 대두 서열은 제거된다. 한 실시양태에서, 0.01574 cM/Mb 초과의 재조합 빈도를 갖지 않는 임의의 선택된 대두 서열은 제거된다.
이들 선택 기준을 사용하여 출원인은 서열 1 - 서열 7,018로서 서열이 개시된 최적 비유전자 대두 게놈 유전자좌로서의 역할을 하는 쌍자엽, 예컨대 대두의 선택 최적 게놈 유전자좌를 확인하였다. 본 개시내용은 또한 확인된 최적 비유전자 대두 게놈 유전자좌의 자연 변이체 또는 변형된 유도체를 포괄하며, 여기서 변이체 또는 유도체 유전자좌는 서열 1 - 서열 7,018의 임의의 서열과 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 뉴클레오티드가 상이한 서열을 포함한다. 한 실시양태에서, 본 개시내용에 따라 사용하기 위한 최적 비유전자 대두 게놈 유전자좌는 서열 1 - 서열 7,018로부터 선택된 서열, 또는 서열 1 - 서열 7,018로부터 선택된 서열과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 공유하는 서열을 포함한다.
또 다른 실시양태에서, 본 개시내용에 따라 사용하기 위한 쌍자엽 식물은 대두 식물, 카놀라 식물, 평지 식물, 브라시카(Brassica) 식물, 목화 식물 및 해바라기 식물로 이루어진 군으로부터 선택된 임의의 식물을 포함한다. 사용될 수 있는 쌍자엽 식물의 예는 카놀라, 목화, 감자, 퀴노아, 아마란스, 메밀, 홍화, 대두, 사탕무, 해바라기, 카놀라, 평지, 담배, 아라비돕시스(Arabidopsis), 브라시카 및 목화를 포함하나, 이에 제한되지는 않는다.
또 다른 실시양태에서, 본 개시내용에 따라 사용하기 위한 최적 비유전자 대두 게놈 유전자좌는 대두 식물로부터 선택된 서열을 포함한다. 추가 실시양태에서, 본 개시내용에 따라 사용하기 위한 최적 비유전자 대두 게놈 유전자좌는 글리신 맥스 근교체로부터 선택된 서열을 포함한다. 따라서, 글리신 맥스 근교체는 그의 농경학상 우량 품종을 포함한다. 후속 실시양태에 있어서, 본 개시내용에 따라 사용하기 위한 최적 비유전자 대두 게놈 유전자좌는 형질전환가능한 대두 계통으로부터 선택된 서열을 포함한다. 한 실시양태에서, 대표적인 형질전환가능한 대두 계통은 매버릭(Maverick), 윌리암스82, 메릴 잭페킹(Merrill JackPeking), 수주유타카(Suzuyutaka), 파예트(Fayette), 엔레이(Enrei), 미카와시마(Mikawashima), 와세미도리(WaseMidori), 잭(Jack), 레쿨루스(Leculus), 모로코(Morocco), 세레나(Serena), 메이플 프레스트(Maple prest), 쏘르네(Thorne), 베르트(Bert), 정게리(Jungery), A3237, 윌리암스, 윌리암스79, AC 콜리브리(Colibri), 헤펭(Hefeng) 25, 동농(Dongnong) 42, 히에농(Hienong) 37, 질린(Jilin) 39, 지유(Jiyu) 58, A3237, 켄터키 원더(Kentucky Wonder), 미니도카(Minidoka) 및 그의 유도체를 포함한다. 관련 기술분야의 통상의 기술자는 계통발생학적 분기의 결과로서 다양한 유형의 대두 계통이 동일한 게놈 DNA 서열을 함유하지 않고 다형성 또는 대립유전자 변이가 게놈 서열 내에 존재할 수 있다는 것을 인지할 것이다. 한 실시양태에서, 본 개시내용은 확인된 최적 비유전자 대두 게놈 유전자좌의 이러한 다형성 또는 대립유전자 변이를 포괄하며, 여기서 다형성 또는 대립유전자 변이는 서열 1 - 서열 7,018의 임의의 서열과 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 뉴클레오티드가 상이한 서열을 포함한다. 추가 실시양태에서, 본 개시내용은 확인된 최적 비유전자 대두 게놈 유전자좌의 이러한 다형성 또는 대립유전자 변이를 포괄하며, 여기서 다형성 또는 대립유전자 변이를 포함하는 서열은 서열 1 - 서열 7,018의 임의의 서열과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 공유한다.
7,018개의 개별 서열을 포함하는 확인된 최적 게놈 유전자좌는 다변량 분석 방법을 사용하는 추가의 분석에 의해 다양한 하위군으로 분류될 수 있다. 임의의 다변량 분석 통계 프로그램의 적용이 일련의 변수의 잠재성 구조 (차원)를 알아내는데 사용된다. 수많은 상이한 유형의 다변량 알고리즘이 사용될 수 있으며, 예를 들어 데이터 세트는 다중 회귀 분석, 로지스틱 회귀 분석, 판별 분석, 다변량 분산 분석 (MANOVA), 인자 분석 (공통 인자 분석 및 주성분 분석 둘 다를 포함함), 클러스터 분석, 다차원 척도법, 대응 분석, 컨조인트 분석, 정규 분석, 정규 상관관계 및 구조적 방정식 모델링을 사용하여 분석될 수 있다.
한 실시양태에 따르면, 최적 비유전자 대두 게놈 유전자좌는 다변량 데이터 분석, 예컨대 주성분 분석 (PCA)을 사용하여 추가로 분석된다. 단지 간단한 설명만이 본원에 제공될 것이고, 보다 많은 정보는 문헌 [H. Martens, T. Naes, Multivariate Calibration, Wiley, N.Y., 1989]에서 찾을 수 있다. PCA는 데이터의 기저 차원수 (잠재성 변수)를 평가하고, 데이터에서 우세한 패턴 및 주요 경향의 개관을 제공한다. 한 실시양태에서, 최적 비유전자 대두 게놈 유전자좌는 주성분 분석 (PCA) 통계적 방법을 통해 클러스터로 분류될 수 있다. PCA는 직교 변환을 사용하여 일련의 가능한 상관 변수의 관찰치를 일련의 선형 비상관 변수 (주성분으로 불림)의 값으로 전환시키기는 수학적 절차이다. 주성분의 수는 본래 변수의 수 이하이다. 이 변환은 제1 주성분이 가능한 가장 큰 분산을 갖고 (즉, 가능한 한 데이터에서의 많은 가변성을 설명함) 차례로 각각의 계속되는 성분이 선행 성분에 대해 직교인 (즉, 그와 상관관계가 없는) 제약 하에 가능한 가장 높은 분산을 갖는 방식으로 정의된다. 주성분은 데이터 세트가 함께 정규 분포되는 경우에 독립적인 것으로 보장된다. PCA는 본래 변수의 상대 척도법에 민감하다. 개체의 특색을 기초로 일련의 개체를 클러스터링하기 위한 PCA의 사용의 예는 다음을 포함한다; 문헌 [Ciampitti, I. et al., (2012) Crop Science, 52(6); 2728-2742, Chemometrics: A Practical Guide, Kenneth R. Beebe, Randy J. Pell, and Mary Beth Seasholtz, Wiley-Interscience, 1 edition, 1998], 미국 특허 번호 8,385,662, 및 유럽 특허 번호 2,340,975.
한 실시양태에 따르면, 주성분 분석 (PCA)은 각각의 확인된 최적 대두 게놈 유전자좌에 대한 하기 10개의 특색을 사용하여 7,018개의 최적 대두 게놈 유전자좌에 대해 수행되었다:
1. 최적 대두 게놈 유전자좌 (OGL) 주위의 저메틸화 영역의 길이
a. 쌍자엽 식물, 예를 들어 글리신 맥스 재배품종 윌리암스82로부터 단리된 뿌리 및 싹 조직의 DNA 메틸화 프로파일을 고처리량 전체 게놈 서열분석 접근법을 사용하여 구축하였다. 추출된 DNA를, 비메틸화 시토신을 우라실로 전환시키지만 메틸화 시토신에는 영향을 미치지 않는 비술파이트 처리에 적용한 다음, 일루미나(Illumina) HiSeq 기술을 사용하여 서열분석하였다 (Krueger, F. et al. DNA methylome analysis using short bisulfite sequencing data. Nature Methods 9, 145-151 (2012)). 미가공 서열분석 판독물을 비스마크(Bismark)™ 맵핑 소프트웨어 (문헌 [Krueger F, Andrews SR (2011) Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. (Bioinformatics 27: 1571-1572)]에 기재된 바와 같은 것)를 사용하여 쌍자엽 참조 서열, 예를 들어 글리신 맥스 참조 서열에 대해 맵핑하였다. 각각의 OGL의 주위의 저메틸화 영역의 길이를 기재된 메틸화 프로파일을 사용하여 계산하였다.
2. OGL 주위의 1MB 영역에서의 재조합 비율
a. 각각의 OGL에 대해, 1Mb 윈도우 내에 있는 OGL의 어느 한쪽 측면 상의 마커 쌍을 확인하였다. 염색체에 걸친 각각의 마커 쌍 사이의 재조합 빈도를 마커 사이의 게놈 물리적 거리 (Mb 단위)에 대한 마커 사이의 유전적 거리 (센티모르간 (cM) 단위)의 비를 기초로 계산하였다.
3. OGL 서열 고유성의 수준
a. 각각의 OGL에 대해, OGL의 뉴클레오티드 서열을 블라스트 기반 상동성 검색을 사용하여 쌍자엽 식물의 게놈, 예를 들어 대두 재배품종 윌리암스82 게놈에 대하여 스캐닝하였다. 이들 OGL 서열을 쌍자엽 식물의 게놈, 예를 들어 대두 재배품종 윌리암스82 게놈으로부터 확인하였을 때, 이 검색을 통해 확인된 제1 블라스트 히트는 OGL 서열 그 자체를 나타낸다. 각각의 OGL에 대한 제2 블라스트 히트를 확인하고, 히트의 정렬 커버리지를 쌍자엽 게놈, 예를 들어 대두 게놈 내의 OGL 서열의 고유성의 척도로서 사용하였다.
4. OGL로부터 그의 인접부에서의 최근접 유전자까지의 거리
a. 쌍자엽 게놈, 예를 들어 대두 재배품종 윌리암스82 게놈에서 알려져 있는 유전자의 유전자 주석달린 정보 및 위치를 알려져 있는 쌍자엽 게놈 데이터베이스, 예를 들어 소이빈 게놈 데이터베이스 (www.soybase.org)로부터 얻었다. 각각의 OGL에 대해, 그의 상류 또는 하류 인접부의 최근접 주석달린 유전자를 확인하고, OGL 서열과 유전자 사이의 거리를 측정하였다 (bp 단위).
5. OGL 인접부에서의 GC%
a. 각각의 OGL에 대해, 뉴클레오티드 서열을 분석하여 존재하는 구아닌 및 시토신 염기의 수를 추정하였다. 이 계수를 각각의 OGL의 서열 길이의 백분율로 나타내었으며, 이는 GC%에 대한 척도를 제공한다.
6. OGL 주위의 40 Kb 인접부에서의 유전자의 수
a. 쌍자엽 게놈, 예를 들어 대두 재배품종 윌리암스82 게놈에서의 알려져 있는 유전자의 유전자 주석달린 정보 및 위치를 알려져 있는 쌍자엽 게놈 데이터베이스, 예를 들어 소이빈 게놈 데이터베이스 (www.soybase.org)로부터 얻었다. 각각의 OGL에 대해, OGL 주위의 40 Kb 윈도우를 정의하고, 이 윈도우에 중첩되는 위치를 갖는 주석달린 유전자의 수를 계수하였다.
7. OGL 주위의 40 Kb 인접부에서의 평균 유전자 발현
a. 쌍자엽 유전자, 예를 들어 대두 유전자의 전사체 수준 발현을 RNAseq 기술을 사용하여 쌍자엽 식물 조직, 예를 들어 대두 재배품종 윌리암스82 뿌리 및 싹 조직으로부터 생성된 트랜스크립톰 프로파일링 데이터를 분석함으로써 측정하였다. 각각의 OGL에 대해, OGL 주위의 40 Kb 인접부에 존재하는 쌍자엽 게놈인 대두 재배품종 윌리암스82 게놈 내의 주석달린 유전자를 확인하였다. 윈도우에서의 각각의 유전자에 대한 발현 수준을 트랜스크립톰 프로파일로부터 얻고, 평균 유전자 발현 수준을 계산하였다.
8. OGL 주위의 뉴클레오솜 점유도 수준
a. 특정한 뉴클레오티드 서열에 대한 뉴클레오솜 점유도 수준을 식별하는 것은 염색체 기능 및 서열의 게놈 문맥에 관한 정보를 제공한다. NuPoP™ 통계 패키지는 임의의 크기의 게놈 서열에 대한 뉴클레오솜 점유도 및 가장 개연성 있는 뉴클레오솜 위치지정 맵을 예측하기 위한 사용자-친근 소프트웨어 도구를 제공한다 (Xi, L., Fondufe-Mittendor, Y., Xia, L., Flatow, J., Widom, J. and Wang, J.-P., Predicting nucleosome positioning using a duration Hidden Markov Model, BMC Bioinformatics, 2010, doi:10.1186/1471-2105-11-346). 각각의 OGL에 대해, 뉴클레오티드 서열을 NuPoP™ 소프트웨어에 제출하고, 뉴클레오솜 점유도 점수를 계산하였다.
9. 염색체 내의 상대 위치 (동원체에 대한 근접성)
a. 각각의 쌍자엽 염색체, 예를 들어 대두 염색체에서의 동원체의 위치 및 염색체 아암의 길이에 대한 정보를 쌍자엽 게놈 데이터베이스, 예를 들어 소이빈 게놈 데이터베이스 (www.soybase.org)로부터 얻었다. 각각의 OGL에 대해, OGL 서열로부터 그것이 위치하는 염색체의 동원체까지의 게놈 거리를 측정한다 (bp 단위). 염색체 내의 OGL의 상대 위치는 그것이 놓여있는 특정 염색체 아암의 길이 대비 동원체까지의 그의 게놈 거리의 비로 나타내어진다.
10. OGL 주위의 1 Mb 영역에서의 OGL의 수
a. 각각의 OGL에 대해, OGL 위치 주위의 1 Mb 게놈 윈도우를 정의하고, 이 윈도우와 중첩되는 게놈 위치를 갖는, 쌍자엽 1 Kb OGL 데이터세트에서의 OGL의 수를 집계하였다.
각각의 최적 비유전자 대두 게놈 유전자좌의 특색 및 속성의 점수에 대한 결과 또는 값은 실시예 2의 표 3에 추가로 기재되어 있다. 생성된 데이터세트를 PCA 통계적 방법에 사용하여 7,018개의 확인된 최적 비유전자 대두 게놈 유전자좌를 클러스터로 클러스터링하였다. 클러스터링 과정 동안, 최적 게놈 유전자좌의 "p" 주성분을 추정한 후에, 최적 게놈 유전자좌를 32개의 클러스터 중 하나로 배정하는 것은 "p" 차원 유클리드 공간에서 진행하였다. 각각의 "p" 축을 "k" 간격으로 분할하였다. 동일한 간격으로 배정된 최적 게놈 유전자좌를 함께 군별화하여 클러스터를 형성하였다. 이 분석을 사용하여, 각각의 PCA 축을 2개의 간격으로 분할하였으며, 이는 실험 검증에 요구되는 클러스터의 수에 관한 선험 정보를 기초로 선택하였다. 생성된 클러스터의 모든 분석 및 가시화는 케미칼 컴퓨팅 그룹 인크.(Chemical Computing Group Inc.) (캐나다 퀘백 몬트리올)로부터의 몰레큘라 오퍼레이팅 인바이런먼트(Molecular Operating Environment)™ (MOE) 소프트웨어로 수행하였다. PCA 접근법을 사용하여 7,018개의 최적 대두 게놈 유전자좌의 세트를 상기 기재된 그의 특색 값을 기초로 32개의 구별되는 클러스터로 클러스터링하였다.
PCA 과정 동안, 5개의 주성분 (PC)이 생성되었으며, 여기서 상위 3개의 PC는 데이터세트에서의 총 변동의 약 90%를 함유하였다 (표 4). 이들 세 PC를 사용하여 3차원 플롯에서 32개의 클러스터를 그래프로 나타내었다 (도 1 참조). 클러스터링 과정이 완결된 후에, 하나의 대표적인 최적 게놈 유전자좌를 각각의 클러스터로부터 선택하였다. 이것은 컴퓨터 방법에 의해, 각각의 클러스터 내에서 그 클러스터의 중심에 최근접한 선택 최적 게놈 유전자좌를 선택함으로써 수행하였다 (표 4). 32개의 대표적인 최적 게놈 유전자좌의 염색체 위치는 도 2에 도시된 바와 같이 대두 염색체 중에 균일하게 분포된다.
한 실시양태에 따르면, 최적 비유전자 대두 게놈 유전자좌가 변형되고 하나 이상의 뉴클레오티드 치환, 결실 또는 삽입을 포함하는 변형된 최적 비유전자 대두 게놈 유전자좌가 제공된다. 한 실시양태에서, 최적 비유전자 대두 게놈 유전자좌는 관심 DNA의 삽입에 의해 변형된다.
한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 실시예 7의 표 7 및 8에 기재된 임의의 서열로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137), soy_OGL_4625 (서열 76), soy_OGL_6362 (서열 440), soy_OGL_308 (서열 43), soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_1423 (서열 639)으로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_1434 (서열 137)로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_4625 (서열 76)로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_6362 (서열 440)로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_308 (서열 43)로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_307 (서열 566)로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_310 (서열 4236)으로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_684 (서열 47)로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_682 (서열 2101)로부터 선택된 게놈 서열이다. 한 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_685 (서열 48)로부터 선택된 게놈 서열이다.
추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137) 및 soy_OGL_4625 (서열 76)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_6362 (서열 440) 및 soy_OGL_308 (서열 43)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47) 및 soy_OGL_682 (서열 2101)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236) 및 soy_OGL_684 (서열 47)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_307 (서열 566) 및 soy_OGL_310 (서열 4236)으로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_310 (서열 4236), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_682 (서열 2101) 및 soy_OGL_685 (서열 48)로부터 선택된 게놈 서열이다.
추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_307 (서열 566), soy_OGL_310 (서열 4236) 및 soy_OGL_308 (서열 566)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_6362 (서열 440), soy_OGL_4625 (서열 76) 및 soy_OGL_308 (서열 566)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_1423 (서열 639) 및 soy_OGL_1434 (서열 137)로부터 선택된 게놈 서열이다. 추가 실시양태에서, 변형될 최적 비유전자 대두 게놈 유전자좌는 유전자좌 soy_OGL_682 (서열 47), soy_OGL_684 (서열 2101) 및 soy_OGL_85 (서열 48)로부터 선택된 게놈 서열이다.
한 실시양태에서, 최적 비유전자 대두 게놈 유전자좌는 soy_ogl_2474 (서열 1), soy_ogl_768 (서열 506), soy_ogl_2063 (서열 2063), soy_ogl_1906 (서열 1029), soy_ogl_1112 (서열 1112), soy_ogl_3574 (서열 1452), soy_ogl_2581 (서열 1662), soy_ogl_3481 (서열 1869), soy_ogl_1016 (서열 2071), soy_ogl_937 (서열 2481), soy_ogl_6684 (서열 2614), soy_ogl_6801 (서열 2874), soy_ogl_6636 (서열 2970), soy_ogl_4665 (서열 3508), soy_ogl_3399 (서열 3676), soy_ogl_4222 (서열 3993), soy_ogl_2543 (서열 4050), soy_ogl_275 (서열 4106), soy_ogl_598 (서열 4496), soy_ogl_1894 (서열 4622), soy_ogl_5454 (서열 4875), soy_ogl_6838 (서열 4888), soy_ogl_4779 (서열 5063), soy_ogl_3333 (서열 5122), soy_ogl_2546 (서열 5520), soy_ogl_796 (서열 5687), soy_ogl_873 (서열 6087), soy_ogl_5475 (서열 6321), soy_ogl_2115 (서열 6520), soy_ogl_2518 (서열 6574), soy_ogl_5551 (서열 6775) 및 soy_OGL_4563 (서열 6859)의 게놈 서열로부터 선택된다.
한 실시양태에서, 최적 비유전자 대두 게놈 유전자좌는 soy_ogl_308 (서열 43), soy_ogl_307 (서열 566), soy_ogl_2063 (서열 748), soy_ogl_1906 (서열 1029), soy_ogl_262 (서열 1376), soy_ogl_5227 (서열 1461), soy_ogl_4074 (서열 1867), soy_ogl_3481 (서열 1869), soy_ogl_1016 (서열 2071), soy_ogl_937 (서열 2481), soy_ogl_5109 (서열 2639), soy_ogl_6801 (서열 2874), soy_ogl_6636 (서열 2970), soy_ogl_4665 (서열 3508), soy_ogl_6189 (서열 3682), soy_ogl_4222 (서열 3993), soy_ogl_2543 (서열 4050), soy_ogl_310 (서열 4326), soy_ogl_2353 (서열 4593), soy_ogl_1894 (서열 4622), soy_ogl_3669 (서열 4879), soy_ogl_3218 (서열 4932), soy_ogl_5689 (서열 5102), soy_ogl_3333 (서열 5122), soy_ogl_2546 (서열 5520), soy_ogl_1208 (서열 5698), soy_ogl_873 (서열 6087), soy_ogl_5957 (서열 6515), soy_ogl_4846 (서열 6571), soy_ogl_3818 (서열 6586), soy_ogl_5551 (서열 6775), soy_ogl_7 (서열 6935), soy_OGL_684 (서열 47), soy_OGL_682 (서열 2101), soy_OGL_685 (서열 48), soy_OGL_1423 (서열 639), soy_OGL_1434 (서열 137), soy_OGL_4625 (서열 76) 및 soy_OGL_6362 (서열 440)의 게놈 서열로부터 선택된다.
한 실시양태에서, 최적 비유전자 대두 게놈 유전자좌는 관심 DNA에 의해 표적화되며, 여기서 관심 DNA는 아연 핑거 뉴클레아제 표적 부위 내에 또는 그에 근접하게 통합된다. 한 실시양태에 따르면, 최적 메이즈 선택 게놈 유전자좌의 예시적인 아연 핑거 표적 부위는 표 8에 제공되어 있다. 한 실시양태에 따르면, 관심 DNA의 통합은 다음 서열의 예시적인 표적 부위 내에 또는 그에 근접하게 발생한다: 서열 7363 및 서열 7364, 서열 7365 및 서열 7366, 서열 7367 및 서열 7368, 서열 7369 및 서열 7370, 서열 7371 및 서열 7372, 서열 7373 및 서열 7374, 서열 7375 및 서열 7376, 서열 7377 및 서열 7378, 서열 7379 및 서열 7380, 서열 7381 및 서열 7382, 서열 7383 및 서열 7384, 서열 7385 및 서열 7386, 서열 7387 및 서열 7388, 서열 7389 및 서열 7390, 서열 7391 및 서열 7392, 서열 7393 및 서열 7394, 서열 7395 및 서열 7396, 서열 7397 및 서열 7398, 서열 7399 및 서열 7400, 서열 7401 및 서열 7402, 서열 7403 및 서열 7404, 서열 7405 및 서열 7406, 서열 7407 및 서열 7408, 서열 7409 및 서열 7410, 서열 7411 및 서열 7412, 서열 7413 및 서열 7414, 서열 7415 및 서열 7416, 서열 7417 및 서열 7418, 서열 7419 및 서열 7420, 서열 7421 및 서열 7422, 서열 7423 및 서열 7424, 서열 7425 및 서열 7426.
한 실시양태에서, 최적 비유전자 대두 게놈 유전자좌는 관심 DNA에 의해 표적화되며, 여기서 관심 DNA는 아연 핑거 뉴클레아제 표적 부위 내에 또는 그에 근접하게 통합된다. 한 실시양태에 따르면, 아연 핑거 뉴클레아제는 아연 핑거 표적 부위에 결합하고, 고유한 대두 게놈 폴리뉴클레오티드 표적 부위를 절단하며, 이때 관심 DNA가 대두 게놈 폴리뉴클레오티드 표적 부위 내에 또는 그에 근접하게 통합된다. 한 실시양태에서, 관심 DNA의 통합은 아연 핑거 표적 부위 내에서 재배열과 함께 발생할 수 있다. 한 실시양태에 따르면, 재배열은 결실, 삽입, 역위 및 반복을 포함할 수 있다. 한 실시양태에서, 관심 DNA의 통합은 아연 핑거 표적 부위에 근접하게 일어난다. 실시양태의 한 측면에 따르면, DNA의 통합은 아연 핑거 표적 부위에 근접하게 일어나고, 아연 핑거 표적 부위에 대해 1.5 Kb, 1.25 Kb, 1.0 Kb, 0.75 Kb, 0.5 Kb 또는 0.25 Kb 내에 통합될 수 있다. 아연 핑거 표적 부위에 근접한 게놈 영역 내의 삽입은 관련 기술분야에 알려져 있으며, 미국 특허 공개 번호 2010/0257638 A1 (그 전문이 본원에 참조로 포함됨)을 참조한다.
한 실시양태에 따르면, 선택된 비유전자 서열은 하기 특징을 포함한다:
a) 비유전자 서열은 서열 내에 1% 초과의 DNA 메틸화를 함유하지 않음;
b) 비유전자 서열은 대두 염색체 동원체로부터의 게놈 거리의 비 0.211 내지 0.976의 상대 위치 값을 가짐;
c) 비유전자 서열은 25.62 내지 43.76%의 구아닌/시토신 퍼센트 함량 범위를 가짐; 및
d) 비유전자 서열은 약 1 Kb 내지 약 4.4 Kb 길이임.
II. 확인된 최적 비유전자 대두 게놈 유전자좌의 재조합 유도체
한 실시양태에 따르면, 쌍자엽 식물, 예컨대 대두 식물의 게놈 유전자좌를 확인한 후에, 폴리뉴클레오티드 공여자 서열을 삽입하기 위한 매우 바람직한 위치로서, 하나 이상의 관심 핵산이 확인된 게놈 유전자좌 내로 삽입될 수 있다. 한 실시양태에서, 관심 핵산은 외인성 유전자 서열 또는 다른 바람직한 폴리뉴클레오티드 공여자 서열을 포함한다. 또 다른 실시양태에서, 쌍자엽 식물, 예컨대 대두 식물의 게놈 유전자좌를 확인한 후에, 폴리뉴클레오티드 공여자 서열을 삽입하기 위한 매우 바람직한 위치로서, 하나 이상의 관심 핵산 또는 최적 비유전자 대두 게놈 유전자좌가 임의로 결실되거나, 절제되거나 또는 제거될 수 있으며, 이후 관심 DNA가 확인된 게놈 유전자좌 내로 통합된다. 한 실시양태에서, 관심 핵산의 최적 비유전자 대두 게놈 유전자좌 내로의 삽입은 외인성 유전자 서열 또는 다른 바람직한 폴리뉴클레오티드 공여자 서열의 제거, 결실 또는 절제를 포함한다.
본 개시내용은 추가로 ZFN 및 폴리뉴클레오티드 공여자 구축물을 사용한 선택 대두 게놈 유전자좌 내로의 표적화 통합을 위한 방법 및 조성물에 관한 것이다. 관심 핵산 서열을 최적 비유전자 대두 게놈 유전자좌 내로 삽입하는 방법은, 달리 나타내지 않는 한, 관련 기술분야의 기술 내에 있는 바와 같은 분자 생물학, 생화학, 염색질 구조 및 분석, 세포 배양, 재조합 DNA 및 관련 분야에서의 통상적인 기술을 사용한다. 이들 기술은 문헌에 충분히 설명되어 있다. 예를 들어, 문헌 [Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolfe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P. M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; 및 METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P. B. Becker, ed.) Humana Press, Totowa, 1999]을 참조한다.
대두 게놈 내로의 핵산 삽입을 위한 방법
DNA 구축물로서의 폴리뉴클레오티드 공여자 서열 및 뉴클레아제 서열을 숙주 세포 내로 도입하기 위한 임의의 널리 알려져 있는 절차가 본 개시내용에 따라 사용될 수 있다. 이들은 인산칼슘 형질감염, 폴리브렌, 원형질체 융합, PEG, 전기천공, 초음파 방법 (예를 들어, 초음파천공), 리포솜, 미세주사, 네이키드 DNA, 플라스미드 벡터, 바이러스 벡터 (에피솜성 및 통합성 둘 다), 및 클로닝된 게놈 DNA, cDNA, 합성 DNA 또는 다른 외래 유전자 물질을 숙주 세포 내로 도입하기 위한 임의의 다른 널리 알려져 있는 방법을 사용하는 것을 포함한다 (예를 들어, 상기 문헌 [Sambrook et al.] 참조). 단지 사용된 특정한 핵산 삽입 절차가 적어도 하나의 유전자를 선택된 단백질을 발현할 수 있는 숙주 세포 내로 성공적으로 도입할 수 있는 것만이 필요하다.
상기 나타낸 바와 같이, DNA 구축물은 다양한 통상적인 기술에 의해 목적하는 식물 종의 게놈 내로 도입될 수 있다. 이러한 기술의 검토를 위해, 예를 들어 문헌 [Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463; 및 Grierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9]을 참조한다. DNA 구축물은 탄화규소 섬유와의 교반에 의한 식물 세포 원형질체의 전기천공 및 미세주사와 같은 기술을 사용하여 식물 세포의 게놈 DNA 내로 직접 도입될 수 있거나 (예를 들어, 미국 특허 5,302,523 및 5,464,765 참조), 또는 DNA 구축물은 DNA 입자 충격과 같은 바이오리스틱 방법을 사용하여 식물 조직에 직접 도입될 수 있다 (예를 들어, 문헌 [Klein et al. (1987) Nature 327:70-73] 참조). 대안적으로, DNA 구축물은 나노입자 형질전환을 통해 식물 세포 내로 도입될 수 있다 (예를 들어, 미국 특허 공개 번호 20090104700 (그 전문이 본원에 참조로 포함됨) 참조). 대안적으로, DNA 구축물은 적합한 T-DNA 경계/플랭킹 영역과 조합될 수 있고, 통상적인 아그로박테리움 투메파시엔스 숙주 벡터 내로 도입될 수 있다. 디스아암잉 및 이원 벡터의 사용을 포함한 아그로박테리움 투메파시엔스-매개 형질전환 기술은 과학 문헌에 널리 기재되어 있다. 예를 들어, 문헌 [Horsch et al. (1984) Science 233:496-498, 및 Fraley et al. (1983) Proc. Nat'l. Acad. Sci. USA 80:4803]을 참조한다.
추가로, 유전자 전달은 비-아그로박테리움 박테리아 또는 바이러스, 예컨대 리조비움(Rhizobium) 종 NGR234, 시노리조비움 멜리로티(Sinorhizoboium meliloti), 메소리조비움 로티(Mesorhizobium loti), 감자 바이러스 X, 콜리플라워 모자이크 바이러스 및 카사바 베인 모자이크 바이러스 및/또는 담배 모자이크 바이러스를 사용하여 달성될 수 있다. 예를 들어, 문헌 [Chung et al. (2006) Trends Plant Sci. 11(1):1-4]을 참조한다. 아그로박테리움 투메파시엔스 숙주의 병독성 기능은, 세포가 이원 T DNA 벡터를 사용하여 박테리아에 의해 감염되거나 (Bevan (1984) Nuc. Acid Res. 12:8711-8721) 또는 공동-배양 절차에 의해 감염되는 경우에 (Horsch et al. (1985) Science 227:1229-1231), 구축물 및 인접한 마커를 함유하는 T-가닥이 식물 세포 DNA 내로 삽입되도록 지시할 것이다. 일반적으로, 쌍자엽 식물을 조작하는데 아그로박테리움 형질전환 시스템이 사용된다 (Bevan et al. (1982) Ann. Rev. Genet. 16:357-384; Rogers et al. (1986) Methods Enzymol. 118:627-641). 아그로박테리움 형질전환 시스템은 또한 단자엽 식물 및 식물 세포에 DNA를 형질전환시키는데 뿐만 아니라 전달하는데 사용될 수 있다. 미국 특허 번호 5,591,616; 문헌 [Hernalsteen et al. (1984) EMBO J. 3:3039-3041; Hooykass-Van Slogteren et al. (1984) Nature 311:763-764; Grimsley et al. (1987) Nature 325:1677-179; Boulton et al. (1989) Plant Mol. Biol. 12:31-40; 및 Gould et al. (1991) Plant Physiol. 95:426-434]을 참조한다.
대안적 유전자 전달 및 형질전환 방법은 네이키드 DNA의 칼슘-, 폴리에틸렌 글리콜 (PEG)- 또는 전기천공-매개 흡수를 통한 원형질체 형질전환 (문헌 [Paszkowski et al. (1984) EMBO J. 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82:5824-5828; 및 Shimamoto (1989) Nature 338:274-276] 참조) 및 식물 조직의 전기천공 (D'Halluin et al. (1992) Plant Cell 4:1495-1505)을 포함하나, 이에 제한되지는 않는다. 식물 세포를 형질전환시키기 위한 추가의 방법은 미세주사, 탄화규소 매개 DNA 흡수 (Kaeppler et al. (1990) Plant Cell Reporter 9:415-418), 및 미세발사체 충격 (문헌 [Klein et al. (1988) Proc. Nat. Acad. Sci. USA 85:4305-4309; 및 Gordon-Kamm et al. (1990) Plant Cell 2:603-618] 참조)을 포함한다.
한 실시양태에서, 게놈 내로의 표적화 삽입을 위해 숙주 세포 내로 도입된 관심 핵산은 관심 표적화 핵산의 한쪽 말단 또는 양쪽 말단 상에 상동 플랭킹 서열을 포함한다. 이러한 한 실시양태에서, 상동 플랭킹 서열은 쌍자엽 게놈 서열, 예컨대 대두로부터의 게놈 서열에 대해 충분한 수준의 서열 동일성을 함유하여, 그와 그가 상동성을 갖는 게놈 서열과의 상동 재조합을 지지한다. 공여자와 게놈 서열 사이에 70% 내지 100%의 범위인, 대략 25, 50, 100, 200, 500, 750, 1000, 1500 또는 2000개의 뉴클레오티드 또는 그 초과 (또는 10 내지 200개 사이의 임의의 정수 값 또는 그 초과)의 서열 동일성은 이들 사이의 상동 재조합을 지지할 것이다.
또 다른 실시양태에서, 관심 표적화 핵산은 상동 플랭킹 서열이 결여되어 있고, 관심 표적화 핵산은 게놈 서열과 낮은 수준 내지 매우 낮은 수준의 서열 동일성을 공유한다.
세포 염색질 내 관심 영역에서의 서열의 표적화 재조합 및/또는 대체 및/또는 변경의 다른 실시양태에서, 염색체 서열은 외인성 "공여자" 뉴클레오티드 서열을 사용한 상동 재조합에 의해 변경된다. 이러한 상동 재조합은, 파괴 영역에 대해 상동인 서열이 존재하는 경우에, 세포 염색질에서 이중 가닥 파괴의 존재로 인해 자극된다. 세포 염색질에서의 이중 가닥 파괴는 또한 비-상동 말단 연결의 세포 메카니즘을 자극할 수 있다. 본원에 기재된 임의의 방법에서, 제1 뉴클레오티드 서열 ("공여자 서열")은 관심 영역에서의 게놈 서열에 대해 상동이지만 동일하지는 않은 서열을 함유할 수 있으며, 그로 인해 관심 영역에 비-동일 서열을 삽입하는 상동 재조합을 자극한다. 따라서, 특정 실시양태에서, 관심 영역에서의 서열에 대해 상동인 공여자 서열의 부분은 대체된 게놈 서열에 대해 약 80, 85, 90, 95, 97.5, 내지 99% (또는 그 사이의 임의의 정수) 서열 동일성을 나타낸다. 다른 실시양태에서, 공여자와 게놈 서열 사이의 상동성은, 예를 들어 공여자와 100개의 인접 염기 쌍에 걸친 게놈 서열 사이에 단지 1개의 뉴클레오티드만이 상이한 경우에, 99%보다 높다.
특정 경우에서, 공여자 서열의 비-상동 부분은, 새로운 서열이 관심 영역 내로 도입되도록, 관심 영역에 존재하지 않는 서열을 함유할 수 있다. 이들 경우에서, 비-상동 서열은 일반적으로 50 내지 2,000개 염기 쌍의 서열 (또는 그 사이의 임의의 정수 값) 또는 관심 영역에서의 서열에 대해 상동이거나 동일한 2,000개 초과의 임의의 수의 염기 쌍이 플랭킹된다. 다른 실시양태에서, 공여자 서열은 제1 서열에 대해 비-상동이고, 비-상동 재조합 메카니즘에 의해 게놈 내로 삽입된다.
한 실시양태에 따르면, 아연 핑거 뉴클레아제 (ZFN)는 관심 핵산의 삽입을 용이하게 하기 위해 표적화 게놈 유전자좌에 이중 가닥 파괴를 도입하는데 사용된다. 아연 핑거 도메인에 의한 결합을 위한 선택된 게놈 유전자좌 내의 표적 부위의 선택은, 예를 들어 아연 핑거 단백질 (ZFP)이 선택된 서열에 결합하도록 설계하는 방법을 또한 개시하는 미국 특허 6,453,242 (이의 개시내용은 본원에 포함됨)에 개시되어 있는 방법에 따라 달성될 수 있다. 뉴클레오티드 서열의 간단한 육안 검사가 표적 부위의 선택에 또한 사용될 수 있다는 것이 통상의 기술자에게 명백할 것이다. 따라서, 표적 부위 선택을 위한 임의의 수단이 본원에 기재된 방법에서 사용될 수 있다.
ZFP DNA-결합 도메인의 경우, 표적 부위는 일반적으로 복수의 인접한 표적 하위부위로 구성된다. 표적 하위부위는 통상적으로 개별 아연 핑거에 의해 결합되는 뉴클레오티드 삼중자 또는 인접한 사중자와 1개 뉴클레오티드가 중첩될 수 있는 뉴클레오티드 사중자의 서열을 지칭한다. 예를 들어, WO 02/077227 (그의 개시내용은 본원에 포함됨)을 참조한다. 표적 부위는 일반적으로 길이가 적어도 9개의 뉴클레오티드이고, 따라서 적어도 3개의 아연 핑거를 포함하는 아연 핑거 결합 도메인에 의해 결합된다. 그러나, 예를 들어 4개-핑거 결합 도메인의 12개-뉴클레오티드 표적 부위에의 결합, 5개-핑거 결합 도메인의 15개-뉴클레오티드 표적 부위에의 결합, 또는 6개-핑거 결합 도메인의 18개-뉴클레오티드 표적 부위에의 결합이 또한 가능하다. 분명히, 보다 큰 결합 도메인 (예를 들어, 7개-, 8개-, 9개-핑거 및 그 초과의 것)의 보다 긴 표적 부위에의 결합이 또한 본 개시내용과 일치한다.
한 실시양태에 따르면, 표적 부위가 반드시 3개 배수의 뉴클레오티드일 필요는 없다. 교차 가닥 상호작용이 발생하는 경우 (예를 들어, 미국 특허 6,453,242 및 WO 02/077227 참조), 다중-핑거 결합 도메인의 개별 아연 핑거 중 하나 이상이 중첩 사중자 하위부위에 결합할 수 있다. 그 결과, 3개-핑거 단백질은, 제10 뉴클레오티드가 말단 핑거에 의해 결합된 사중자의 일부인 10개-뉴클레오티드 서열에 결합할 수 있고, 4개-핑거 단백질은 제13 뉴클레오티드가 말단 핑거에 의해 결합된 사중자의 일부인 13개-뉴클레오티드 서열에 결합할 수 있는 등이다.
다중-핑거 결합 도메인에서의 개별 아연 핑거 사이의 아미노산 링커 서열의 길이 및 성질이 또한 표적 서열에의 결합에 영향을 미친다. 예를 들어, 다중-핑거 결합 도메인에서의 개별 아연 핑거 사이의 소위 "비-정규 링커", "긴 링커" 또는 "구조화 링커"의 존재는 그러한 핑거들이 바로 인접하지 않은 하위부위에 결합하도록 할 수 있다. 이러한 링커의 비제한적인 예는, 예를 들어 미국 특허 번호 6,479,626 및 WO 01/53480에 기재되어 있다. 따라서, 아연 핑거 결합 도메인에 대한 표적 부위에서의 하나 이상의 하위부위가 1, 2, 3, 4, 5개 또는 그 초과의 뉴클레오티드에 의해 서로로부터 분리될 수 있다. 하나의 비제한적 예는, 2개의 인접 3개-뉴클레오티드 하위부위, 개재 뉴클레오티드 및 2개의 인접 삼중자 하위부위를 순서대로 포함하는 13개-뉴클레오티드 표적 부위에 결합하는 4개-핑거 결합 도메인일 것이다.
자연에 존재하는 단백질로부터 확인된 DNA-결합 폴리펩티드는 전형적으로 별개의 뉴클레오티드 서열 또는 모티프 (예를 들어, 컨센서스 인식 서열)에 결합하므로, 상이한 뉴클레오티드 서열 또는 모티프를 인식하기 위해 많은 이러한 DNA-결합 폴리펩티드를 변형시키는 방법이 존재하며 관련 기술분야에 알려져 있다. DNA-결합 폴리펩티드는, 예를 들어 비제한적으로 다음을 포함한다: 아연 핑거 DNA-결합 도메인; 류신 지퍼; UPA DNA-결합 도메인; GAL4; TAL; LexA; Tet 리프레서; LacR; 및 스테로이드 호르몬 수용체.
일부 예에서, DNA-결합 폴리펩티드는 아연 핑거이다. 개별 아연 핑거 모티프는 임의의 광범위한 DNA 부위를 표적화하고 그에 특이적으로 결합하도록 설계될 수 있다. 정규 Cys2His2 (뿐만 아니라 비-정규 Cys3His) 아연 핑거 폴리펩티드는 표적 DNA 이중 나선의 큰 홈 내로 α-나선을 삽입함으로써 DNA에 결합한다. 아연 핑거에 의한 DNA의 인식은 모듈형이며; 각각의 핑거는 주로 표적에서의 3개 연속적 염기 쌍과 접촉하고, 폴리펩티드에서의 소수의 핵심 잔기는 인식을 매개한다. 표적화 엔도뉴클레아제에 다중 아연 핑거 DNA-결합 도메인을 포함시킴으로써, 표적화 엔도뉴클레아제의 DNA-결합 특이성이 추가로 증가될 수 있다 (및 그에 따라 그에 의해 부여되는 임의의 유전자 조절 효과의 특이성이 또한 증가될 수 있음). 예를 들어 문헌 [Urnov et al. (2005) Nature 435:646-51]을 참조한다. 따라서, 하나 이상의 아연 핑거 DNA-결합 폴리펩티드는 숙주 세포 내로 도입된 표적화 엔도뉴클레아제가 숙주 세포의 게놈 내의 고유한 DNA 서열과 상호작용하도록 조작되고 이용될 수 있다. 바람직하게는, 아연 핑거 단백질은 선택 표적 부위에 결합하도록 조작되었다는 점에서 비-자연 발생적이다. 예를 들어, 문헌 [Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; 미국 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공개 번호 2005/0064474; 2007/0218528; 2005/0267061 (이들 모두는 그 전문이 본원에 참조로 포함됨)을 참조한다.
조작된 아연 핑거 결합 도메인은 자연 발생 아연 핑거 단백질과 비교하여 신규 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계 및 다양한 유형의 선택을 포함하나, 이에 제한되지는 않는다. 합리적 설계는, 예를 들어 삼중 (또는 사중) 뉴클레오티드 서열 및 개별 아연 핑거 아미노산 서열을 포함하는 데이터베이스의 사용을 포함하며, 여기서 각각의 삼중 또는 사중 뉴클레오티드 서열은 특정한 삼중 또는 사중 서열에 결합하는 아연 핑거의 하나 이상의 아미노산 서열과 연관된다. 예를 들어, 공동 소유의 미국 특허 6,453,242 및 6,534,261 (그 전문이 본원에 참조로 포함됨)을 참조한다.
대안적으로, DNA-결합 도메인은 뉴클레아제로부터 유래될 수 있다. 예를 들어, 귀소 엔도뉴클레아제 및 메가뉴클레아제, 예컨대 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII의 인식 서열이 알려져 있다. 또한, 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; 문헌 [Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 the New England Biolabs catalogue]을 참조한다. 추가로, 귀소 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성은 비-자연 표적 부위에 결합하도록 조작될 수 있다. 예를 들어, 문헌 [Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66]; 미국 특허 공개 번호 20070117128을 참조한다.
또 다른 대안으로서, DNA-결합 도메인은 류신 지퍼 단백질로부터 유래될 수 있다. 류신 지퍼는 유전자 발현과 연관된 중요한 전사 인자인 많은 진핵 조절 단백질에서 단백질-단백질 상호작용에 수반되는 단백질 부류이다. 류신 지퍼는 동물, 식물, 효모 등을 포함한 여러 계에 걸쳐 이들 전사 인자에 공유된 공통 구조적 모티프를 지칭한다. 류신 지퍼는, 류신 잔기가 α-나선을 통해 균일하게 이격되어 두 폴리펩티드의 류신 잔기가 나선의 동일한 면 상에서 종결되도록 하는 방식으로 특정 DNA 서열에 결합하는 두 폴리펩티드 (동종이량체 또는 이종이량체)에 의해 형성된다. 류신 지퍼의 DNA 결합 특이성은 본원에 개시된 DNA-결합 도메인에 이용될 수 있다.
일부 실시양태에서, DNA-결합 도메인은 식물 병원체 크산토모나스(Xanthomonas)로부터 유래된 TAL 이펙터로부터 조작된 도메인이다 (문헌 [Miller et al. (2011) Nature Biotechnology 29(2):143-8; Boch et al., (2009) Science 29 Oct 2009 (10.1126/science.117881) and Moscou and Bogdanove, (2009) Science 29 Oct 2009 (10.1126/science.1178817)]; 및 미국 특허 공개 번호 20110239315, 20110145940 및 20110301073 참조).
CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)/Cas (CRISPR 연관) 뉴클레아제 시스템은 게놈 조작에 사용될 수 있는 박테리아 시스템을 기초로 최근에 조작된 뉴클레아제 시스템이다. 이는 많은 박테리아 및 고세균의 적응 면역 반응의 일부를 기초로 한다. 바이러스 또는 플라스미드가 박테리아에 침입할 때, 침입자의 DNA의 절편은 '면역' 반응에 의해 CRISPR RNA (crRNA)로 전환된다. 이어서, 이 crRNA는 "프로토스페이서"로 불리는 표적 DNA에서의 crRNA에 상동인 영역으로 Cas9 뉴클레아제를 가이드하기 위해 tracrRNA로 불리는 또 다른 유형의 RNA와 부분 상보성의 영역을 통해 회합한다. Cas9는 crRNA 전사체 내에 함유된 20개-뉴클레오티드 가이드 서열에 의해 특정된 부위에서 DSB에 평활 말단을 생성하기 위해 DNA를 절단한다. Cas9는 부위 특이적 DNA 인식 및 절단을 위해 crRNA 및 tracrRNA 둘 다를 요구한다. 이 시스템은 본 발명에 이르러 crRNA 및 tracrRNA가 하나의 분자 ("단일 가이드 RNA")로 조합될 수 있도록 조작되었고, 단일 가이드 RNA의 crRNA 동등 부분은 임의의 목적하는 서열을 표적화하기 위해 Cas9 뉴클레아제를 가이드하도록 조작될 수 있다 (문헌 [Jinek et al. (2012) Science 337, p. 816-821, Jinek et al., (2013), eLife 2:e00471, 및 David Segal, (2013) eLife 2:e00563] 참조). 따라서, CRISPR/Cas 시스템은 게놈에서의 목적하는 표적에 이중 가닥 파괴 (DSB)를 생성하도록 조작될 수 있고, DSB의 복구는 오류 유발 복구의 증가를 야기하는 복구 억제제의 사용에 의해 영향받을 수 있다.
특정 실시양태에서, Cas 단백질은 자연 발생 Cas 단백질의 "기능적 유도체"일 수 있다. 천연 서열 폴리펩티드의 "기능적 유도체"는 천연 서열 폴리펩티드와 공통인 정성적 생물학적 특성을 갖는 화합물이다. "기능적 유도체"는 상응하는 천연 서열 폴리펩티드와 공통인 생물학적 활성을 갖는다면, 천연 서열의 단편 및 천연 서열 폴리펩티드의 유도체 및 그의 단편을 포함하나, 이에 제한되지는 않는다. 본원에서 고려되는 생물학적 활성은 DNA 기질을 단편으로 가수분해하는 기능적 유도체의 능력이다. 용어 "유도체"는 폴리펩티드의 아미노산 서열 변이체, 공유 변형체 및 그의 융합체 모두를 포괄한다. Cas 폴리펩티드의 적합한 유도체 또는 그의 단편은 Cas 단백질의 돌연변이체, 융합체, 공유 변형체 또는 그의 단편을 포함하나, 이에 제한되지는 않는다. Cas 단백질 또는 그의 단편, 뿐만 아니라 Cas 단백질의 유도체 또는 그의 단편을 포함하는 Cas 단백질은 세포로부터 수득가능할 수 있거나, 또는 화학적으로 합성될 수 있거나, 또는 이들 두 절차의 조합에 의할 수 있다. 세포는 Cas 단백질을 자연적으로 생산하는 세포일 수 있거나, 또는 Cas 단백질을 자연적으로 생산하고 내인성 Cas 단백질을 보다 높은 발현 수준으로 생산하도록 또는 내인성 Cas와 동일하거나 상이한 Cas를 코딩하는 외인성으로 도입된 핵산으로부터 Cas 단백질을 생산하도록 유전자 조작된 세포일 수 있다. 일부 경우에서, 세포는 Cas 단백질을 자연적으로 생산하지 않고, Cas 단백질을 생산하도록 유전자 조작된다. Cas 단백질은 Cas 뉴클레아제와 가이드 RNA를 공동-발현시킴으로써 포유동물 세포에 (및 추정상 식물 세포 내에) 배치된다. 가이드 RNA의 두 형태가 문헌 [Le Cong, F., et al., (2013) Science 339(6121):819-823]에 개시된 바와 같이 Cas-매개 게놈 절단을 용이하게 하기 위해 사용될 수 있다.
다른 실시양태에서, DNA-결합 도메인은 절단 (뉴클레아제) 도메인과 회합될 수 있다. 예를 들어, 귀소 엔도뉴클레아제는 뉴클레아제 기능을 보유하면서 그의 DNA-결합 특이성을 변형시킬 수 있다. 추가로, 아연 핑거 단백질은 또한 절단 도메인과 융합되어 아연 핑거 뉴클레아제 (ZFN)를 형성할 수도 있다. 본원에 개시된 융합 단백질의 절단 도메인 부분은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 수득될 수 있다. 절단 도메인이 유래될 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제를 포함하나, 이에 제한되지 않는다. 예를 들어, 문헌 [2002-2003 Catalogue, New England Biolabs, Beverly, MA; 및 Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388]을 참조한다. DNA를 절단하는 추가의 효소가 알려져 있다 (예를 들어, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 미크로코쿠스 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한, 문헌 [Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993] 참조). 귀소 엔도뉴클레아제 및 메가뉴클레아제의 비제한적 예는 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII을 포함하며 알려져 있다. 또한, 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; 문헌 [Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 the New England Biolabs catalogue]을 참조한다. 이들 효소 (또는 그의 기능적 단편) 중 하나 이상은 절단 도메인 및 절단 절반-도메인의 공급원으로서 사용될 수 있다.
제한 엔도뉴클레아제 (제한 효소)는 많은 종에 존재하고, DNA에 (인식 부위에서) 서열-특이적으로 결합할 수 있고, 결합 부위에서 또는 결합 부위 근처에서 DNA를 절단할 수 있다. 특정 제한 효소 (예를 들어, IIS형)는 인식 부위로부터 떨어진 부위에서 DNA를 절단하고, 분리가능한 결합 도메인 및 절단 도메인을 갖는다. 예를 들어, IIS형 효소 FokI는 한 가닥 상의 그의 인식 부위로부터 9개 뉴클레오티드에서 및 다른 가닥 상의 그의 인식 부위로부터 13개 뉴클레오티드에서 DNA의 이중 가닥 절단을 촉매한다. 예를 들어, 미국 특허 5,356,802; 5,436,150 및 5,487,994; 뿐만 아니라 문헌 [Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982]을 참조한다. 따라서, 한 실시양태에서, 융합 단백질은 적어도 하나의 IIS형 제한 효소로부터의 절단 도메인 (또는 절단 절반-도메인), 및 조작될 수 있거나 조작되지 않을 수 있는 하나 이상의 아연 핑거 결합 도메인을 포함한다.
절단 도메인이 결합 도메인으로부터 분리가능한 예시적인 IIS형 제한 효소는 FokI이다. 이 특정한 효소는 이량체로서 활성이다. 문헌 [Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575]. 따라서, 본 개시내용의 목적을 위해, 개시된 융합 단백질에 사용된 FokI 효소의 부분이 절단 절반-도메인으로 간주된다. 따라서, 아연 핑거-FokI 융합체를 사용한 세포 서열의 표적화 이중 가닥 절단 및/또는 표적화 대체의 경우, 각각 FokI 절단 절반-도메인을 포함하는 2개의 융합 단백질은 촉매적으로 활성인 절단 도메인을 재구성하는데 사용될 수 있다. 대안적으로, 아연 핑거 결합 도메인 및 2개의 FokI 절단 절반-도메인을 함유하는 단일 폴리펩티드 분자가 또한 사용될 수 있다. 아연 핑거-FokI 융합체를 사용한 표적화 절단 및 표적화 서열 변경에 대한 파라미터는 본 개시내용의 다른 곳에서 제공된다.
절단 도메인 또는 절단 절반-도메인은 절단 활성을 보유하거나 또는 기능적 절단 도메인을 형성하기 위해 다량체화 (예를 들어, 이량체화)하는 능력을 보유하는 단백질의 임의의 부분일 수 있다. 예시적인 IIS형 제한 효소는 국제 공개 WO 2007/014275 (그 전문이 본원에 참조로 포함됨)에 기재되어 있다.
절단 특이성을 증강시키기 위해, 절단 도메인은 또한 변형될 수 있다. 특정 실시양태에서, 절단 절반-도메인의 변이체가 이용되며, 이들 변이체는 절단 절반-도메인의 동종이량체화를 최소화하거나 방지한다. 이러한 변형된 절단 절반-도메인의 비제한적 예는 WO 2007/014275 (그 전문이 본원에 참조로 포함됨)에 상세히 기재되어 있다. 특정 실시양태에서, 절단 도메인은 동종이량체화를 최소화하거나 방지하는 조작된 절단 절반-도메인 (또한 이량체화 도메인 돌연변이체로 지칭됨)을 포함한다. 이러한 실시양태는 통상의 기술자에게 알려져 있으며, 예를 들어 미국 특허 공개 번호 20050064474; 20060188987; 20070305346 및 20080131962 (이들 모두의 개시내용은 그 전문이 본원에 참조로 포함됨)에 기재되어 있다. FokI의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 및 538에서의 아미노산 잔기는 FokI 절단 절반-도메인의 이량체화에 영향을 미치기 위한 모든 표적이다.
절대 이종이량체를 형성하는 FokI의 추가의 조작된 절단 절반-도메인이 또한 본원에 기재된 ZFN에 사용될 수 있다. 절대 이종이량체를 형성하는 Fok I의 예시적인 조작된 절단 절반-도메인은 제1 절단 절반-도메인이 Fok I의 위치 490 및 538에서의 아미노산 잔기에 돌연변이를 포함하고 제2 절단 절반-도메인이 아미노산 잔기 486 및 499에서의 돌연변이를 포함하는 쌍을 포함한다. 한 실시양태에서, 490에서의 돌연변이는 Glu (E)를 Lys (K)로 대체하고; 538에서의 돌연변이는 Iso (I)를 Lys (K)로 대체하고; 486에서의 돌연변이는 Gln (Q)을 Glu (E)로 대체하고; 위치 499에서의 돌연변이는 Iso (I)를 Lys (K)로 대체한다. 구체적으로, 본원에 기재된 조작된 절단 절반-도메인은 "E490K:I538K"로 지정된 조작된 절단 절반-도메인을 생산하기 위해 하나의 절단 절반-도메인에서 위치 490 (E→K) 및 538 (I→K)을 돌연변이시키고, "Q486E:I499L"로 지정된 조작된 절단 절반-도메인을 생산하기 위해 또 다른 절단 절반-도메인에서 위치 486 (Q→E) 및 499 (I→L)를 돌연변이시킴으로써 제조되었다. 본원에 기재된 조작된 절단 절반-도메인은 이상 절단이 최소화되거나 제거된 절대 이종이량체 돌연변이체이다. 예를 들어, 미국 특허 공개 번호 2008/0131962 (모든 목적을 위해 그의 개시내용은 그 전문이 참조로 포함됨)를 참조한다. 특정 실시양태에서, 조작된 절단 절반-도메인은 위치 486, 499 및 496 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들어 위치 486에서의 야생형 Gln (Q) 잔기를 Glu (E) 잔기로, 위치 499에서의 야생형 Iso (I) 잔기를 Leu (L) 잔기로, 및 위치 496에서의 야생형 Asn (N) 잔기를 Asp (D) 또는 Glu (E) 잔기로 대체한 돌연변이 (또한, 각각 "ELD" 및 "ELE" 도메인으로 지칭됨)를 포함한다. 다른 실시양태에서, 조작된 절단 절반-도메인은 위치 490, 538 및 537 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들어 위치 490에서의 야생형 Glu (E) 잔기를 Lys (K) 잔기로, 위치 538에서의 야생형 Iso (I) 잔기를 Lys (K) 잔기로, 및 위치 537의 야생형 His (H) 잔기를 Lys (K) 잔기 또는 Arg (R) 잔기로 대체한 돌연변이 (또한, 각각 "KKK" 및 "KKR" 도메인으로 지칭됨)를 포함한다. 다른 실시양태에서, 조작된 절단 절반-도메인은 위치 490 및 537 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들어 위치 490에서의 야생형 Glu (E) 잔기를 Lys(K) 잔기로, 및 위치 537의 야생형 His (H) 잔기를 Lys (K) 잔기 또는 Arg (R) 잔기로 대체한 돌연변이 (또한, 각각 "KIK" 및 "KIR" 도메인으로 지칭됨)를 포함한다. (미국 특허 공개 번호 20110201055 참조). 다른 실시양태에서, 조작된 절단 절반 도메인은 "Sharkey" 및/또는 "Sharkey'" 돌연변이를 포함한다 (문헌 [Guo et al., (2010) J. Mol. Biol. 400(1):96-107] 참조).
본원에 기재된 조작된 절단 절반-도메인은 임의의 적합한 방법을 사용하여, 예를 들어 미국 특허 공개 번호 20050064474; 20080131962; 및 20110201055에 기재된 바와 같은 야생형 절단 절반-도메인 (Fok I)의 부위-지정 돌연변이유발에 의해 제조될 수 있다. 대안적으로, 뉴클레아제는 소위 "분할-효소" 기술을 사용하여 핵산 표적 부위에서 생체내 조립될 수 있다 (예를 들어, 미국 특허 공개 번호 20090068164 참조). 이러한 분할 효소의 성분은 별도의 발현 구축물 상에서 발현될 수 있거나, 또는 개별 성분이, 예를 들어 자기-절단 2A 펩티드 또는 IRES 서열에 의해 분리되는 하나의 오픈 리딩 프레임에서 연결될 수 있다. 성분은 개별 아연 핑거 결합 도메인 또는 메가뉴클레아제 핵산 결합 도메인의 도메인일 수 있다.
뉴클레아제는, 예를 들어 WO 2009/042163 및 20090068164에 기재된 바와 같이 효모-기반 염색체 시스템에서 사용하기 전에 활성에 대해 스크리닝될 수 있다. 뉴클레아제 발현 구축물은 관련 기술분야에 알려져 있는 방법을 사용하여 용이하게 설계될 수 있다. 예를 들어, 미국 특허 공개 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; 및 국제 공개 WO 07/014275를 참조한다. 뉴클레아제의 발현은 구성적 프로모터 또는 유도성 프로모터, 예를 들어 라피노스 및/또는 갈락토스의 존재 하에 활성화되고 (탈억제되고) 글루코스의 존재 하에 억제되는 갈락토키나제 프로모터의 제어 하에 이루어질 수 있다.
표적 부위 사이의 거리는 서로 가장 근처에 있는 서열의 가장자리로부터 측정 시에 두 표적 부위 사이에 개재되어 있는 뉴클레오티드 또는 뉴클레오티드 쌍의 수를 지칭한다. 절단이 2개의 아연 핑거 도메인/절단 절반-도메인 융합 분자가 별도의 표적 부위에 결합하는 것에 좌우되는 특정 실시양태에서, 2개의 표적 부위는 대향하는 DNA 가닥 상에 있을 수 있다. 다른 실시양태에서, 표적 부위 둘 다는 동일한 DNA 가닥 상에 있다. 최적 게놈 유전자좌 내로의 표적화 통합을 위해, 하나 이상의 ZFP는 미리 결정된 절단 부위에서 또는 그 근처에서 표적 부위에 결합하도록 조작되고, 조작된 DNA 결합 도메인 및 절단 도메인을 포함하는 융합 단백질은 세포에서 발현된다. 융합 단백질의 아연 핑거 부분이 표적 부위에 결합하면, DNA는, 바람직하게는 이중 가닥 파괴를 통해, 절단 도메인에 의해 표적 부위 근처에서 절단된다.
최적 게놈 유전자좌에 이중 가닥 파괴의 존재는 상동 재조합을 통한 외인성 서열의 통합을 용이하게 한다. 따라서, 한 실시양태에서, 표적화 게놈 유전자좌에 삽입될 관심 핵산 서열을 포함하는 폴리뉴클레오티드는 상동 재조합을 용이하게 하기 위한 표적화 게놈 유전자좌와의 상동성의 하나 이상의 영역을 포함할 것이다.
본원에 기재된 융합 분자에 추가로, 선택된 게놈 서열의 표적화 대체는 또한 공여자 서열의 도입을 수반한다. 폴리뉴클레오티드 공여자 서열은 융합 단백질(들)의 발현 전에, 그와 동시에 또는 그 후에 세포 내로 도입될 수 있다. 공여자 폴리뉴클레오티드는 최적 게놈 유전자좌에 대해 충분한 상동성을 함유하여, 그와 그가 상동성을 갖는 최적 게놈 유전자좌 게놈 서열과의 상동 재조합을 지지한다. 공여자와 게놈 서열 사이에 대략 25, 50, 100, 200, 500, 750, 1,000, 1,500, 2,000개의 뉴클레오티드 또는 그 초과, 또는 10 내지 2,000개 사이의 임의의 정수 값의 뉴클레오티드 또는 그 초과의 서열 상동성이 상동 재조합을 지지할 것이다. 특정 실시양태에서, 상동성 아암은 1,000개 미만의 염기쌍 길이이다. 다른 실시양태에서, 상동성 아암은 750개 미만의 염기쌍 길이이다. 추가적으로, 공여자 폴리뉴클레오티드 서열은 세포 염색질에서의 관심 영역에 대해 상동이 아닌 서열을 함유하는 벡터 분자를 포함할 수 있다. 공여자 폴리뉴클레오티드 분자는 세포 염색질에 대한 여러 불연속 상동성 영역을 함유할 수 있다. 예를 들어, 정상적으로는 관심 영역에 존재하지 않는 서열의 표적화 삽입을 위해, 상기 서열은 공여자 핵산 분자에 존재할 수 있고, 관심 영역에서의 서열에 대한 상동성 영역이 플랭킹될 수 있다. 공여자 폴리뉴클레오티드는 DNA 또는 RNA, 단일 가닥 또는 이중 가닥일 수 있고, 선형 또는 원형 형태로 세포 내로 도입될 수 있다. 예를 들어, 미국 특허 공개 번호 20100047805, 20110281361, 20110207221 및 미국 출원 번호 13/889,162를 참조한다. 선형 형태로 도입되는 경우에, 통상의 기술자에게 알려져 있는 방법에 의해 공여자 서열의 말단이 (예를 들어, 엑소뉴클레오리틱 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 디데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 부가되고/거나, 자기-상보적 올리고뉴클레오티드가 한쪽 또는 양쪽 말단에 라이게이션된다. 예를 들어, 문헌 [Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889]을 참조한다. 외인성 폴리뉴클레오티드를 분해로부터 보호하기 위한 추가의 방법은 말단 아미노 기(들)의 부가, 및 변형된 뉴클레오티드간 연결, 예컨대, 예를 들어 포스포로티오에이트, 포스포르아미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기의 사용을 포함하나, 이에 제한되지는 않는다.
한 실시양태에 따르면, 관심 DNA가 최적 비유전자 대두 게놈 유전자좌 내로 삽입된 트랜스제닉 쌍자엽 식물, 예컨대 대두 식물을 제조하는 방법이 제공된다. 방법은 하기 단계를 포함한다:
a. 관심 핵산의 삽입을 위한 표적으로서 최적 비유전자 대두 유전자좌를 선택하는 단계;
b. 부위 특이적 뉴클레아제를 쌍자엽 식물 세포, 예컨대 대두 식물 세포 내로 도입하며, 여기서 부위 특이적 뉴클레아제는 비유전자 서열을 절단하는 것인 단계;
c. 관심 DNA를 식물 세포 내로 도입하는 단계; 및
d. 상기 비유전자 서열에 표적화된 관심 DNA를 포함하는 트랜스제닉 식물 세포를 선택하는 단계.
한 실시양태에 따르면, 관심 DNA가 최적 비유전자 대두 게놈 유전자좌 내로 삽입된 트랜스제닉 쌍자엽 원형질체 세포, 예컨대 대두 원형질체 세포를 제조하는 방법이 제공된다. 방법은 하기 단계를 포함한다:
a. 관심 핵산의 삽입을 위한 표적으로서 최적 비유전자 대두 유전자좌를 선택하는 단계;
b. 부위 특이적 뉴클레아제를 쌍자엽 원형질체 세포, 예컨대 대두 원형질체 세포 내로 도입하며, 여기서 부위 특이적 뉴클레아제는 비유전자 서열을 절단하는 것인 단계;
c. 관심 DNA를 쌍자엽 원형질체 세포, 예컨대 대두 원형질체 세포 내로 도입하는 단계; 및
d. 상기 비유전자 서열에 표적화된 관심 DNA를 포함하는 트랜스제닉 쌍자엽 원형질체 세포, 예컨대 대두 원형질체 세포를 선택하는 단계.
한 실시양태에서, 부위 특이적 뉴클레아제는 아연 핑거 뉴클레아제, CRISPR 뉴클레아제, TALEN 뉴클레아제 또는 메가뉴클레아제로 이루어진 군으로부터 선택되고, 보다 특히 한 실시양태에서, 부위 특이적 뉴클레아제는 아연 핑거 뉴클레아제이다. 한 실시양태에 따르면, 관심 DNA는 상동성 지정 복구 통합 방법을 통해 상기 비유전자 서열 내에 통합된다. 대안적으로, 일부 실시양태에서, 관심 DNA는 비-상동 말단 연결 통합 방법을 통해 상기 비유전자 서열 내에 통합된다. 추가 실시양태에서, 관심 DNA는 이전에 기재되지 않은 통합 방법을 통해 상기 비유전자 서열 내에 통합된다. 한 실시양태에서, 방법은 하기 특징을 갖는, 관심 DNA의 표적화 삽입을 위한 최적 비유전자 대두 게놈 유전자좌를 선택하는 것을 포함한다:
a. 비유전자 서열은 적어도 1 Kb 길이이고, 서열 내에 1% 초과의 DNA 메틸화를 함유하지 않음;
b. 비유전자 서열은 쌍자엽 게놈, 예컨대 대두 게놈 내에 0.01574 내지 83.52 cM/Mb 비율의 재조합을 나타냄;
c. 비유전자 서열은 쌍자엽 게놈, 예컨대 대두 게놈의 0 내지 0.494 수준의 뉴클레오솜 점유도를 나타냄;
d. 비유전자 서열은 쌍자엽 게놈, 예컨대 대두 게놈에 함유된 임의의 다른 서열과 40% 미만의 서열 동일성을 공유함;
e. 비유전자 서열은 대두와 같은 쌍자엽 염색체 동원체로부터의 게놈 거리의 비 0 내지 0.99682의 상대 위치 값을 가짐;
f. 비유전자 서열은 14.4 내지 45.9%의 구아닌/시토신 퍼센트 함량 범위를 가짐;
g. 비유전자 서열은 유전자 서열에 근접하게 위치함; 및
h. 상기 비유전자 서열을 포함하는 쌍자엽 게놈 서열, 예컨대 대두 게놈 서열의 1 Mb 영역은 하나 이상의 추가의 비유전자 서열을 포함한다. 한 실시양태에서, 최적 비유전자 대두 유전자좌는 클러스터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 2, 3, 4, 5, 6, 7, 8, 9, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 또는 32의 유전자좌로부터 선택된다.
전달
본원에 개시된 공여자 분자는 표적화, 상동성-독립적 및/또는 상동성-의존적 방법을 통해 세포의 게놈 내로 통합된다. 이러한 표적화 통합을 위해, 게놈은 뉴클레아제, 예를 들어 DNA-결합 도메인 (예를 들어, 아연 핑거 결합 도메인, CRISPR 또는 TAL 이펙터 도메인은 미리 결정된 절단 부위에서 또는 그 근처에서 표적 부위에 결합하도록 조작됨)과 뉴클레아제 도메인 (예를 들어, 절단 도메인 또는 절단 절반-도메인) 사이의 융합체를 사용하여 목적하는 위치 (또는 위치들)에서 절단된다. 특정 실시양태에서, 각각 DNA-결합 도메인 및 절단 절반-도메인을 포함하는 2개의 융합 단백질이 세포에서 발현되고, 기능적 절단 도메인이 재구성되고 DNA가 표적 부위 부근에서 절단되는 방식으로 병치된 표적 부위에 결합한다. 한 실시양태에서, 절단은 2개의 DNA-결합 도메인의 표적 부위 사이에서 발생한다. DNA-결합 도메인 중 하나 또는 둘 다가 조작될 수 있다. 또한, 미국 특허 번호 7,888,121; 미국 특허 출원 공개 20050064474 및 국제 특허 공개 WO05/084190, WO05/014791 및 WO 03/080809를 참조한다.
본원에 기재된 바와 같은 뉴클레아제는 폴리펩티드 및/또는 폴리뉴클레오티드로서 도입될 수 있다. 예를 들어, 각각 상기 언급된 폴리펩티드 중 하나를 코딩하는 서열을 포함하는 2개의 폴리뉴클레오티드가 세포 내로 도입될 수 있고, 폴리펩티드가 발현되어 각각 그의 표적 서열에 결합하는 경우에, 절단이 표적 서열에서 또는 그 근처에서 발생한다. 대안적으로, 융합 폴리펩티드 둘 다를 코딩하는 서열을 포함하는 단일 폴리뉴클레오티드가 세포 내로 도입될 수 있다. 폴리뉴클레오티드는 DNA, RNA 또는 임의의 변형된 형태 또는 유사체 또는 DNA 및/또는 RNA일 수 있다.
관심 영역에 이중 가닥 파괴의 도입 후에, 트랜스진은 본원에 기재된 바와 같은 이중 가닥 공여자 분자의 선형화 후에 비-상동성 의존적 방법 (예를 들어, 비-상동 말단 연결 (NHEJ))을 통해 표적화 방식으로 관심 영역 내로 통합된다. 이중 가닥 공여자는 바람직하게는 뉴클레아제, 예를 들어 이중 가닥 파괴를 게놈에 도입하기 위해 사용되는 하나 이상의 동일하거나 상이한 뉴클레아제를 사용하여 생체내에서 선형화된다. 세포에서 염색체 및 공여자의 동기화된 절단은 (세포 내로의 도입 전 공여자 분자의 선형화와 비교하여) 공여자 DNA 분해를 제한할 수 있다. 공여자의 선형화를 위해 사용된 뉴클레아제 표적 부위는 바람직하게는 트랜스진(들) 서열(들)을 파괴하지 않는다.
트랜스진은 뉴클레아제 오버행의 간단한 라이게이션에 의해 예상된 방향 ("정방향" 또는 "AB" 배향으로 지정됨)으로 또는 교대 방향 ("역방향" 또는 "BA" 배향로 지정됨)으로 게놈 내로 통합될 수 있다. 특정 실시양태에서, 트랜스진은 공여자 및 염색체 오버행의 정확한 라이게이션 후에 통합된다. 다른 실시양태에서, BA 또는 AB 배향의 트랜스진의 통합은 여러 뉴클레오티드의 결실을 일으킨다.
이들과 같은 기술의 적용을 통해, 사실상 임의의 종의 세포는 안정하게 형질전환될 수 있다. 일부 실시양태에서, 형질전환 DNA는 숙주 세포의 게놈 내로 통합된다. 다세포 종의 경우에, 트랜스제닉 세포는 트랜스제닉 유기체로 재생될 수 있다. 이들 기술 중 임의의 것을 사용하여, 예를 들어 트랜스제닉 식물의 게놈에 하나 이상의 공여자 폴리뉴클레오티드 산 서열을 포함하는 트랜스제닉 식물을 생산할 수 있다.
핵산의 전달은, 예를 들어 비제한적으로 원형질체의 형질전환 (예를 들어, 미국 특허 5,508,184 참조); 건조/억제-매개 DNA 흡수 (예를 들어, 문헌 [Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8] 참조); 전기천공 (예를 들어, 미국 특허 5,384,253 참조); 탄화규소 섬유와 함께 교반 (예를 들어, 미국 특허 5,302,523 및 5,464,765 참조); 아그로박테리움-매개 형질전환 (예를 들어, 미국 특허 5,563,055, 5,591,616, 5,693,512, 5,824,877, 5,981,840 및 6,384,301 참조); DNA-코팅된 입자의 가속 (예를 들어, 미국 특허 5,015,580, 5,550,318, 5,538,880, 6,160,208, 6,399,861 및 6,403,865 참조) 및 DNA, RNA, 펩티드 및/또는 단백질 또는 핵산 및 펩티드의 조합물을 식물 세포 내로 전달하는 방법에서 나노입자, 나노담체 및 세포 관통 펩티드 (WO201126644A2; WO2009046384A1; WO2008148223A1)에 의한 것을 포함한, 통상의 기술자에게 알려져 있는 임의의 방법에 의해 본 발명의 실시양태에서, 식물 세포 내로 도입될 수 있다.
발현 벡터를 식물 내로 도입하기 위한 가장 광범위하에 이용되는 방법은 아그로박테리움의 자연 형질전환 시스템을 기초로 한다. 에이. 투메파시엔스 및 에이. 리조게네스(A. rhizogenes)는 식물 세포를 유전자 형질전환시키는 식물 병원성 토양 박테리아이다. 에이. 투메파시엔스 및 에이. 리조게네스의 Ti 및 Ri 플라스미드는 각각 식물의 유전자 형질전환을 담당하는 유전자를 운반한다. Ti (종양-유도)-플라스미드는 형질전환된 식물로 전달되는, T-DNA로서 알려져 있는 큰 절편을 함유한다. Ti 플라스미드의 또 다른 절편인 vir 영역은 T-DNA 전달을 담당한다. T-DNA 영역은 각각 말단 반복 뉴클레오티드 서열로 구성되는 좌측 및 우측 경계에 의해 접경되어 있다. 일부 변형된 이원 벡터에서, 종양-유도 유전자는 결실되어 있으며, vir 영역의 기능은 T-DNA 경계 서열에 의해 접경되어 있는 외래 DNA를 전달하는데 이용된다. T-영역은 또한, 예를 들어 트랜스제닉 식물 및 세포의 효율적인 회수를 위한 선택 마커, 및 본 발명의 융합 단백질을 코딩하는 핵산과 같은 전달용 서열을 삽입하기 위한 다중 클로닝 부위를 함유할 수 있다.
따라서, 일부 실시양태에서, 식물 형질전환 벡터는 에이. 투메파시엔스의 Ti 플라스미드 (예를 들어, 미국 특허 번호 4,536,475, 4,693,977, 4,886,937 및 5,501,967; 및 유럽 특허 EP 0 122 791 참조) 또는 에이. 리조게네스의 Ri 플라스미드로부터 유래된다. 추가의 식물 형질전환 벡터는, 예를 들어 비제한적으로 문헌 (Herrera-Estrella et al. (1983) Nature 303:209-13; Bevan et al. (1983), supra; Klee et al. (1985) Bio/Technol. 3:637-42)에 의해; 및 유럽 특허 EP 0 120 516에 기재된 것들, 및 상기한 것 중 임의의 것으로부터 유래된 것들을 포함한다. 자연에서 식물과 상호작용하는 다른 박테리아, 예컨대 시노리조비움, 리조비움 및 메소리조비움이 수많은 다양한 식물로의 유전자 전달을 매개하도록 변형될 수 있다. 이들 식물-연관 공생 박테리아는 디스아암드 Ti 플라스미드 및 적합한 이원 벡터 둘 다의 획득에 의해 유전자 전달에 적격으로 만들 수 있다.
관심 핵산
쌍자엽 식물, 예컨대 대두 식물의 게놈 유전자좌 내로의 표적화 삽입을 위한 폴리뉴클레오티드 공여자 서열은 전형적으로 약 10 내지 약 5,000개 뉴클레오티드 길이의 범위이다. 그러나, 약 5, 6, 7, 8, 9, 10, 11 및 12 Kb 길이의 서열을 포함한, 실질적으로 보다 긴 뉴클레오티드, 최대 20,000개 뉴클레오티드가 사용될 수 있다. 추가로, 공여자 서열은 대체된 영역에 상동이 아닌 서열을 함유하는 벡터 분자를 포함할 수 있다. 한 실시양태에서, 관심 핵산은 표적화 게놈 유전자좌와 상동성을 공유하는 하나 이상의 영역을 포함할 것이다. 일반적으로, 관심 핵산 서열의 상동 영역(들)은 재조합이 요망되는 게놈 서열에 대해 적어도 50% 서열 동일성을 가질 것이다. 특정 실시양태에서, 관심 핵산의 상동 영역(들)은 표적화 게놈 유전자좌에 위치한 서열과 60%, 70%, 80%, 90%, 95%, 98%, 99%, 또는 99.9% 서열 동일성을 공유한다. 그러나, 관심 핵산의 길이에 따라, 1% 내지 100% 사이의 임의의 값의 서열 동일성이 존재할 수 있다.
관심 핵산은 세포 염색질에 대해 비교적 높은 서열 동일성을 공유하는 서열의 여러 불연속 영역을 함유할 수 있다. 예를 들어, 정상적으로는 표적화 게놈 유전자좌에 존재하지 않는 서열의 표적화 삽입을 위해, 고유한 서열은 공여자 핵산 분자에 존재할 수 있고, 표적화 게놈 유전자좌에 존재하는 서열에 대해 비교적 높은 서열 동일성을 공유하는 서열의 영역이 플랭킹될 수 있다.
관심 핵산은 또한 나중의 사용을 위한 저장소로서의 역할을 하기 위해 표적화 게놈 유전자좌 내로 삽입될 수 있다. 예를 들어, 쌍자엽 식물, 예컨대 대두 식물의 게놈의 비유전자 영역에 상동인 서열을 포함하며 관심 핵산 (임의로 유도성 프로모터의 제어 하에 ZFN을 코딩하는 것)을 함유하는 제1 핵산 서열은 표적화 게놈 유전자좌에 삽입될 수 있다. 다음에, 제2 핵산 서열은 쌍자엽 식물, 예컨대 대두 식물의 최적 비유전자 게놈 유전자좌 내로의 관심 DNA의 삽입을 유도하기 위해 세포 내로 도입된다. 제1 핵산 서열은 최적 비유전자 대두 게놈 유전자좌에 특이적인 ZFN을 포함하고, 제2 핵산 서열은 관심 DNA 서열을 포함하거나, 또는 그 반대의 경우이다. 한 실시양태에서, ZFN은 최적 비유전자 대두 게놈 유전자좌 및 관심 핵산 둘 다를 절단할 것이다. 이어서, 게놈에서의 생성된 이중 가닥 파괴는 최적 게놈 유전자좌로부터 방출된 관심 핵산에 대한 통합 부위가 될 수 있다. 대안적으로, 게놈에 이미 위치하는 ZFN의 발현은 관심 DNA의 도입 후에 유도되어 게놈에서의 이중 가닥 파괴를 유도할 수 있으며 이는 이어서 도입된 관심 핵산에 대한 통합 부위가 될 수 있다. 이러한 방식으로, 임의의 관심 영역에서의 관심 DNA의 표적화 통합 효율은 개선될 수 있는데, 이는 상기 방법이 ZFN을 코딩하는 핵산 및 관심 DNA 둘 다의 동시 흡수에 의존하지 않기 때문이다.
관심 핵산은 또한 후속 삽입을 위한 표적 부위로서의 역할을 하기 위해 최적 비유전자 대두 게놈 유전자좌 내로 삽입될 수 있다. 예를 들어, 추가의 ZFN 설계에 대한 인식 부위를 함유하는 DNA 서열로 구성된 관심 핵산이 유전자좌 내로 삽입될 수 있다. 이후, 추가의 ZFN 설계가 생성될 수 있고, 이는 본래 관심 핵산이 절단되고 복구 또는 상동 재조합에 의해 변형되도록 세포에서 발현될 수 있다. 이런 방식으로, 관심 핵산의 반복적 통합은 쌍자엽 식물, 예컨대 대두 식물의 최적 비유전자 게놈 유전자좌에서 발생할 수 있다.
최적 비유전자 대두 게놈 유전자좌 내로 삽입될 수 있는 예시적인 외인성 서열은 임의의 폴리펩티드 코딩 서열 (예를 들어, cDNA), 프로모터, 인핸서 및 다른 조절 서열 (예를 들어, 간섭 RNA 서열, shRNA 발현 카세트, 에피토프 태그, 마커 유전자, 절단 효소 인식 부위 및 다양한 유형의 발현 구축물)을 포함하나, 이에 제한되지는 않는다. 이러한 서열은 표준 분자 생물학적 기술 (클로닝, 합성 등)을 사용하여 용이하게 수득될 수 있고/거나 상업적으로 입수가능하다.
ZFN을 발현시키기 위해, 융합 단백질을 코딩하는 서열은 전형적으로는 전사를 지시하는 프로모터를 함유하는 발현 벡터 내로 서브클로닝된다. 적합한 원핵 및 진핵 프로모터는 관련 기술분야에 널리 알려져 있고, 예를 들어 문헌 [Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3.sup.rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 및 Current Protocols in Molecular Biology (Ausubel et al., supra)]에 기재되어 있다. 예를 들어, 이. 콜라이(E. coli), 바실루스 종(Bacillus sp.) 및 살모넬라(Salmonella)에서, ZFN을 발현시키기 위한 박테리아 발현 시스템이 이용가능하다 (Palva et al., Gene 22:229-235 (1983)). 이러한 발현 시스템을 위한 키트는 상업적으로 입수가능하다. 포유동물 세포, 효모 및 곤충 세포를 위한 진핵생물 발현 시스템은 관련 기술분야의 통상의 기술자에게 널리 알려져 있고, 또한 상업적으로 입수가능하다.
유전 물질을 세포 내로 수송하는데 사용되는 특정한 발현 벡터는 융합 단백질의 의도된 용도, 예를 들어 식물, 동물, 박테리아, 진균, 원충 등에서의 발현과 관련하여 선택된다 (하기 기재되는 발현 벡터 참조). 표준 박테리아 및 동물 발현 벡터는 관련 기술분야에 알려져 있고, 예를 들어 미국 특허 공개 20050064474A1 및 국제 특허 공보 WO05/084190, WO05/014791 및 WO03/080809에 상세히 기재되어 있다.
다량의 단백질을 발현시키는 박테리아, 포유동물, 효모 또는 곤충 세포주를 생산하는데 표준 형질감염 방법이 사용될 수 있으며, 이어서 단백질은 표준 기술을 사용하여 정제될 수 있다 (예를 들어, 문헌 [Colley et al., J. Biol. Chem. 264:17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)] 참조). 진핵 및 원핵 세포의 형질전환은 표준 기술에 따라 수행된다 (예를 들어, 문헌 [Morrison, J. Bact. 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds., 1983)] 참조).
개시된 방법 및 조성물은 폴리뉴클레오티드 공여자 서열을 미리 결정된 위치, 예컨대 최적 비유전자 대두 게놈 유전자좌 중 하나 내로 삽입하는데 사용될 수 있다. 이것은 대두 게놈 내로 도입된 트랜스진의 발현이 결정적으로는 그의 통합 부위에 좌우된다는 점을 고려해 볼 때 유용하다. 따라서, 제초제 내성, 곤충 저항성, 영양소, 항생제 또는 치료 분자를 코딩하는 유전자는 표적화 재조합에 의해 삽입될 수 있다.
한 실시양태에서, 관심 핵산은 글리포세이트 또는 또 다른 제초제에 대한 추가의 저항성 또는 내성을 제공하고/거나, 선택 곤충 또는 질병에 대한 저항성 및/또는 영양 증진 및/또는 개선된 농경학적 특징 및/또는 사료, 식품, 산업, 제약 또는 다른 용도에 유용한 단백질 또는 다른 산물을 제공하는 유전자 코딩 서열과 조합되거나 또는 "스택킹"될 수 있다. 식물 게놈 내에의 2개 이상의 관심 핵산 서열의 "스택킹"은, 예를 들어 2개 이상의 사례를 사용한 통상적인 식물 육종, 식물을 관심 서열을 함유하는 구축물로 형질전환시키는 것, 트랜스제닉 식물을 재형질전환시키는 것, 또는 상동 재조합을 통한 표적화 통합을 통해 새로운 형질을 부가하는 것을 통해 달성될 수 있다.
이러한 관심 폴리뉴클레오티드 공여자 뉴클레오티드 서열은 하기 제공된 예를 포함하나, 이에 제한되지는 않는다:
1. 해충 또는 질병에 대한 저항성을 부여하는 유전자 또는 코딩 서열 (예를 들어 iRNA)
(A) 식물 질병 저항성 유전자. 식물 방어는 종종, 식물에서의 질병 저항성 유전자 (R)의 산물과 병원체에서의 상응하는 비병독성 (Avr) 유전자의 산물 사이의 특이적 상호작용에 의해 활성화된다. 식물 품종을 클로닝된 저항성 유전자로 형질전환시켜, 특정 병원체 균주에 저항성인 식물을 조작할 수 있다. 이러한 유전자의 예는 클라도스포리움 풀붐(Cladosporium fulvum)에 대한 저항성의 경우 토마토 Cf-9 유전자 (Jones et al., 1994 Science 266:789); 슈도모나스 시린가에(Pseudomonas syringae) 병원체변종 토마토에 대한 저항성의 경우 단백질 키나제를 코딩하는 토마토 Pto 유전자 (Martin et al., 1993 Science 262:1432); 및 슈도모나스 시린가에에 대한 저항성의 경우 아라비돕시스 RSSP2 유전자 (Mindrinos et al., 1994 Cell 78:1089)를 포함한다.
(B) 바실루스 투린기엔시스(Bacillus thuringiensis) 단백질, 그의 유도체, 또는 이를 모델로 한 합성 폴리펩티드, 예컨대 Bt δ-내독소 유전자의 뉴클레오티드 서열 (Geiser et al., 1986 Gene 48:109), 및 영양 살곤충 (VIP) 유전자 (예를 들어, 문헌 [Estruch et al. (1996) Proc. Natl. Acad. Sci. 93:5389-94] 참조). 더욱이, δ-내독소 유전자를 코딩하는 DNA 분자는 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (메릴랜드주 록빌)으로부터 ATCC 수탁번호 40098, 67136, 31995 및 31998 하에 구입할 수 있다.
(C) 렉틴, 예컨대 여러 클리비아 미니아타(Clivia miniata) 만노스-결합 렉틴 유전자의 뉴클레오티드 서열 (Van Damme et al., 1994 Plant Molec. Biol. 24:825).
(D) 곤충 해충에 대한 살유충제로서 유용한 비타민 결합 단백질, 예컨대 아비딘 및 아비딘 상동체. 미국 특허 번호 5,659,026 참조.
(E) 효소 억제제, 예를 들어 프로테아제 억제제 또는 아밀라제 억제제. 이러한 유전자의 예는 벼 시스테인 프로테이나제 억제제 (Abe et al., 1987 J. Biol. Chem. 262:16793), 담배 프로테이나제 억제제 I (Huub et al., 1993 Plant Molec. Biol. 21:985), 및 α-아밀라제 억제제 (Sumitani et al., 1993 Biosci. Biotech. Biochem. 57:1243)를 포함한다.
(F) 곤충-특이적 호르몬 또는 페로몬, 예컨대 엑디스테로이드 및 유충 호르몬, 그의 변이체, 그에 기초한 모방체, 또는 그의 길항제 또는 효능제, 예컨대 유충 호르몬의 불활성인자인, 클로닝된 유충 호르몬 에스테라제의 바큘로바이러스 발현 (Hammock et al., 1990 Nature 344:458).
(G) 발현 시에 침범한 해충의 생리학을 교란시키는 곤충-특이적 펩티드 또는 뉴로펩티드 (J. Biol. Chem. 269:9). 이러한 유전자의 예는 곤충 이뇨 호르몬 수용체 (Regan, 1994), 디플로프테라 푼크타타(Diploptera punctata)에서 확인된 알로스타틴 (Pratt, 1989), 및 곤충-특이적 마비성 신경독소 (미국 특허 번호 5,266,361)를 포함한다.
(H) 뱀, 말벌 등에 의해 자연에서 생산된 곤충-특이적 독, 예컨대 전갈 곤충독성 펩티드 (Pang, 1992 Gene 116:165).
(I) 모노테르펜, 세스퀴테르펜, 스테로이드, 히드록삼산, 페닐프로파노이드 유도체 또는 살충 활성을 갖는 또 다른 비-단백질 분자의 과축적을 담당하는 효소.
(J) 생물학적 활성 분자의 변형 (번역후 변형 포함)에 수반되는 효소; 예를 들어, 자연이든 합성이든 관계없이, 당분해 효소, 단백질분해 효소, 지질분해 효소, 뉴클레아제, 시클라제, 트랜스아미나제, 에스테라제, 히드롤라제, 포스파타제, 키나제, 포스포릴라제, 폴리머라제, 엘라스타제, 키티나제 및 글루카나제. 이러한 유전자의 예는 칼라스 유전자 (PCT 공개 출원 WO93/02197), 키티나제-코딩 서열 (이는, 예를 들어 ATCC로부터 수탁번호 3999637 및 67152 하에 수득할 수 있음), 담배 구충 키티나제 (Kramer et al., 1993 Insect Molec. Biol. 23:691), 및 파슬리 ubi4-2 폴리유비퀴틴 유전자 (Kawalleck et al., 1993 Plant Molec. Biol. 21:673)를 포함한다.
(K) 신호 전달을 자극하는 분자. 이러한 분자의 예는 녹두 칼모듈린 cDNA 클론에 대한 뉴클레오티드 서열 (Botella et al., 1994 Plant Molec. Biol. 24:757) 및 대두 칼모듈린 cDNA 클론의 뉴클레오티드 서열 (Griess et al., 1994 Plant Physiol. 104:1467)을 포함한다.
(L) 소수성 모멘트 펩티드. 미국 특허 번호 5,659,026 및 5,607,914 참조; 후자의 특허는 질병 저항성을 부여하는 합성 항미생물 펩티드를 교시한다.
(M) 막 퍼미아제, 채널 형성제 또는 채널 차단제, 예컨대 트랜스제닉 담배 식물이 슈도모나스 솔라나세아룸(Pseudomonas solanacearum)에 대해 저항성이 되도록 하는 세크로핀-β 용해 펩티드 유사체 (Jaynes et al., 1993 Plant Sci. 89:43).
(N) 바이러스-침습성 단백질 또는 그로부터 유래된 복합 독소. 예를 들어, 형질전환된 식물 세포에서의 바이러스 코트 단백질의 축적은, 코트 단백질 유전자가 유래되는 바이러스 뿐만 아니라 관련 바이러스에 의한 바이러스 감염 및/또는 그에 의해 유발된 질병 발생에 대해 저항성을 부여한다. 코트 단백질-매개 저항성은 알팔파 모자이크 바이러스, 오이 모자이크 바이러스, 담배 줄무늬 바이러스, 감자 바이러스 X, 감자 바이러스 Y, 담배 식각 바이러스, 담배 얼룩무늬 바이러스 및 담배 모자이크 바이러스 대하여 형질전환된 식물에 부여되어 왔다. 예를 들어 문헌 [Beachy et al. (1990) Ann. Rev. Phytopathol. 28:451]을 참조한다.
(O) 곤충-특이적 항체 또는 그로부터 유래된 면역독소. 따라서, 곤충 장에서의 결정적 대사 기능을 표적화하는 항체는 침범된 효소를 불활성화시켜 곤충을 사멸시킬 것이다. 예를 들어, 문헌 [Taylor et al. (1994) Abstract #497, Seventh Int'l. Symposium on Molecular Plant-Microbe Interactions]에는 단일-쇄 항체 단편의 생산을 통한 트랜스제닉 담배에서의 효소적 불활성화가 제시되어 있다.
(P) 바이러스-특이적 항체. 예를 들어, 재조합 항체 유전자를 발현하는 트랜스제닉 식물이 바이러스 공격으로부터 보호된다는 것을 제시하는 문헌 [Tavladoraki et al. (1993) Nature 266:469]을 참조한다.
(Q) 병원체 또는 기생충에 의해 자연에서 생산된 발달-정지 단백질. 따라서, 진균 엔도 α-1,4-D 폴리갈락투로나제는 식물 세포벽 호모-α-1,4-D-갈락투로나제를 가용화시킴으로써 진균 콜로니화 및 식물 영양소 방출을 용이하게 한다 ((Lamb et al., 1992) Bio/Technology 10:1436). 콩 엔도폴리갈락투로나제-억제 단백질을 코딩하는 유전자의 클로닝 및 특징화는 문헌 [Toubart et al. (1992 Plant J. 2:367)]에 기재되어 있다.
(R) 식물에 의해 자연에서 생산된 발달-정지 단백질, 예컨대 진균성 질병에 대한 증가된 저항성을 제공하는 보리 리보솜-불활성화 유전자 ((Longemann et al., 1992). Bio/Technology 10:3305).
(S) RNA 분자를 사용하여 표적 유전자의 발현을 억제하는 RNA 간섭. 한 예에서 RNA 분자는 부분 또는 완전 이중 가닥이고, 이는 침묵 반응을 촉발하여 dsRNA를 소형 간섭 RNA로 절단하고, 이어서 이는 상동 mRNA를 파괴하는 표적화 복합체 내로 혼입된다. 예를 들어, 미국 특허 6,506,559 (Fire et al.); 미국 특허 6,573,099 (Graham et al.)를 참조한다.
2. 제초제에 대한 저항성을 부여하는 유전자
(A) 성장점 또는 분열조직을 억제하는 제초제, 예컨대 이미다잘리논, 술폰아닐리드 또는 술포닐우레아 제초제에 대한 저항성 또는 내성을 코딩하는 유전자. 이 카테고리에서의 예시적인 유전자는 아세토히드록시산 신타제 (AHAS) 효소로서 또한 알려져 있는 (Miki et al., 1990 Theor. Appl. Genet. 80:449) 돌연변이체 아세토락테이트 신타제 (ALS)를 코딩한다 (Lee et al., 1988 EMBOJ. 7:1241).
(B) 돌연변이체 EPSP 신타제 및 aroA 유전자에 의해 부여되거나, 또는 유전자, 예컨대 DGT-28, 2mEPSPS, GAT (글리포세이트 아세틸트랜스퍼라제) 또는 GOX (글리포세이트 옥시다제) 및 다른 포스포노 화합물, 예컨대 글루포시네이트 (pat, bar 및 dsm-2 유전자), 및 아릴옥시페녹시프로피온산 및 시클로헥산디온 (ACCase 억제제 코딩 유전자)에 의한 대사 불활성화를 통해 부여된 글리포세이트에 대한 저항성 또는 내성을 코딩하는 하나 이상의 추가의 유전자. 예를 들어, 글리포세이트 저항성을 부여할 수 있는 EPSP의 형태의 뉴클레오티드 서열을 개시하고 있는 미국 특허 번호 4,940,835를 참조한다. 돌연변이체 aroA 유전자를 코딩하는 DNA 분자는 ATCC 수탁번호 39256 하에 수득할 수 있고, 돌연변이체 유전자의 뉴클레오티드 서열은 미국 특허 번호 4,769,061에 개시되어 있다. 유럽 특허 출원 번호 0 333 033 및 미국 특허 번호 4,975,374에는 L-포스피노트리신과 같은 제초제에 대한 저항성을 부여하는 글루타민 신테타제 유전자의 뉴클레오티드 서열이 개시되어 있다. 포스피노트리신아세틸-트랜스퍼라제 유전자의 뉴클레오티드 서열은 유럽 출원 번호 0 242 246에 제공된다. 문헌 [De Greef et al. (1989) Bio/Technology 7:61]에는 포스피노트리신 아세틸 트랜스퍼라제 활성을 코딩하는 키메라 bar 유전자를 발현하는 트랜스제닉 식물의 생산이 기재되어 있다. 아릴옥시페녹시프로피온산 및 시클로헥산디온, 예컨대 세톡시딤 및 할록시포프에 대한 저항성을 부여하는 예시적인 유전자는 문헌 [Marshall et al. (1992) Theor. Appl. Genet. 83:435]에 기재된 Accl-S1, Accl-S2 및 Accl-S3 유전자이다.
(C) 광합성을 억제하는 제초제, 예컨대 트리아진에 대한 저항성 또는 내성을 코딩하는 유전자 (psbA 및 gs+ 유전자) 및 벤조니트릴에 대한 저항성 또는 내성을 코딩하는 유전자 (니트릴라제 유전자). 문헌 [Przibilla et al. (1991) Plant Cell 3:169]에는 클라미도모나스(Chlamydomonas)를 형질전환시키기 위해 돌연변이체 psbA 유전자를 코딩하는 플라스미드의 사용이 기재되어 있다. 니트릴라제 유전자에 대한 뉴클레오티드 서열은 미국 특허 번호 4,810,648에 개시되어 있고, 이들 유전자를 함유하는 DNA 분자는 ATCC 수탁번호 53435, 67441 및 67442 하에 입수가능하다. 글루타티온 S-트랜스퍼라제를 코딩하는 DNA의 클로닝 및 발현은 문헌 [Hayes et al. (1992) Biochem. J. 285:173]에 기재되어 있다.
(D) 파라-히드록시페닐피루베이트 (HPP)를 호모겐티세이트 내로 형질전환시키는 반응을 촉매하는 효소인 히드록시페닐피루베이트 디옥시게나제 (HPPD)에 결합하는 제초제에 대한 저항성 또는 내성을 코딩하는 유전자. 이것은 제초제, 예컨대 이속사졸 (EP418175, EP470856, EP487352, EP527036, EP560482, EP682659, 미국 특허 번호 5,424,276), 특히 대두에 대한 선택적 제초제인 이속사플루톨, 디케토니트릴 (EP496630, EP496631), 특히 2-시아노-3-시클로프로필-1-(2-SO2CH3-4-CF3 페닐)프로판-1,3-디온 및 2-시아노-3-시클로프로필-1-(2-SO2CH3-4-2,3Cl2페닐)프로판-1,3-디온, 트리케톤 (EP625505, EP625508, 미국 특허 번호 5,506,195), 특히 술코트리온 및 피라졸리네이트를 포함한다. 예를 들어 미국 특허 번호 6,268,549 및 6,245,968 및 미국 특허 출원 공개 번호 20030066102에 기재된 유전자를 포함한, 식물에서 과잉의 HPPD를 생산하는 유전자가 이러한 제초제에 대한 내성 또는 저항성을 제공할 수 있다.
(E) 페녹시 옥신 제초제, 예컨대 2,4-디클로로페녹시아세트산 (2,4-D)에 대한 저항성 또는 내성을 코딩하며, 또한 아릴옥시페녹시프로피오네이트 (AOPP) 제초제에 대한 저항성 또는 내성을 부여할 수 있는 유전자. 이러한 유전자의 예는 미국 특허 번호 7,838,733에 기재된 α-케토글루타레이트-의존성 디옥시게나제 효소 (aad-1) 유전자를 포함한다.
(F) 페녹시 옥신 제초제, 예컨대 2,4-디클로로페녹시아세트산 (2,4-D)에 대한 저항성 또는 내성을 코딩하며, 또한 피리딜옥시 옥신 제초제, 예컨대 플루록시피르 또는 트리클로피르에 대한 저항성 또는 내성을 부여할 수 있는 유전자. 이러한 유전자의 예는 WO 2007/053482 A2에 기재된 α-케토글루타레이트-의존성 디옥시게나제 효소 유전자 (aad-12)를 포함한다.
(G) 디캄바에 대한 저항성 또는 내성을 코딩하는 유전자 (예를 들어 미국 특허 공개 번호 20030135879 참조).
(H) 프로토포르피리노겐 옥시다제 (PPO)를 억제하는 제초제에 대한 저항성 또는 내성을 제공하는 유전자 (미국 특허 번호 5,767,373 참조).
(I) 광화학계 II 반응 중심 (PS II)의 코어 단백질에 결합하는 트리아진 제초제 (예컨대 아트라진) 및 우레아 유도체 (예컨대 디우론) 제초제에 대한 저항성 또는 내성을 제공하는 유전자 (문헌 [Brussian et al., (1989) EMBO J. 1989, 8(4): 1237-1245] 참조).
3. 가치-부가된 형질을 부여하거나 이에 기여하는 유전자
(A) 예를 들어, 대두 또는 브라시카를 안티센스 유전자 또는 스테아로일-ACP 데새투라제로 형질전환시켜 식물의 스테아르산 함량을 증가시킴으로써 변형된 지방산 대사 ((Knultzon et al., 1992) Proc. Nat. Acad. Sci. USA 89:2624).
(B) 감소된 피테이트 함량
(1) 피타제-코딩 유전자, 예컨대 아스페르길루스 니거(Aspergillus niger) 피타제 유전자 (Van Hartingsveldt et al., 1993 Gene 127:87)의 도입은 피테이트의 파괴를 증진시켜 보다 많은 유리 포스페이트를 형질전환된 식물에 부가한다.
(2) 피테이트 함량을 감소시키는 유전자가 도입될 수 있다. 쌍자엽에서, 이것은 예를 들어 낮은 수준의 피트산을 특징으로 하는 대두 돌연변이체를 담당하는 단일 대립유전자와 연관된 DNA를 클로닝한 다음 재도입함으로써 달성될 수 있다 (Raboy et al., 1990 Maydica 35:383).
(C) 예를 들어 식물을, 전분의 분지화 패턴을 변형시키는 효소를 코딩하는 유전자로 형질전환시킴으로써 달성된 변형된 탄수화물 조성. 이러한 효소의 예는 스트렙토코쿠스 무쿠스(Streptococcus mucus) 프룩토실트랜스퍼라제 유전자 ((Shiroza et al., 1988) J. Bacteriol. 170:810), 바실루스 서브틸리스(Bacillus subtilis) 레반수크라제 유전자 (Steinmetz et al., 1985 Mol. Gen. Genel. 200:220), 바실루스 리케니포르미스(Bacillus licheniformis) α-아밀라제 (Pen et al., 1992 Bio/Technology 10:292), 토마토 인버타제 유전자 (Elliot et al., 1993), 보리 아밀라제 유전자 (Sogaard et al., 1993 J. Biol. Chem. 268:22480), 및 대두 내배유 전분 분지화 효소 II (Fisher et al., 1993 Plant Physiol. 102:10450)를 포함한다.
III. 재조합 구축물
본원에 개시된 바와 같이 본 개시내용은 적어도 1 Kb의 최적 비유전자 대두 게놈 서열 및 관심 DNA를 포함하는 재조합 게놈 서열을 제공하며, 여기서 삽입된 관심 DNA는 상기 비유전자 서열 내로 삽입된다. 한 실시양태에서, 관심 DNA는 분석 도메인, 해충 또는 질병에 대한 저항성을 부여하는 유전자 또는 코딩 서열 (예를 들어 iRNA), 제초제에 대한 저항성을 부여하는 유전자, 또는 가치-부가된 형질을 부여하거나 이에 기여하는 유전자이고, 최적 비유전자 대두 게놈 서열은 하기 특징을 포함한다:
a. 비유전자 서열은 약 1 Kb 내지 약 5.7 Kb 길이이고, 메틸화 폴리뉴클레오티드를 함유하지 않음;
b. 비유전자 서열은 쌍자엽 식물, 예컨대 대두 식물의 게놈 내에 0.01574 내지 83.52 cM/Mb 비율의 재조합을 나타냄;
c. 비유전자 서열은 쌍자엽 게놈, 예컨대 대두 게놈에서 0 내지 0.494 수준의 뉴클레오솜 점유도를 나타냄;
d. 비유전자 서열은 쌍자엽 게놈, 예컨대 대두 게놈에 함유된 임의의 다른 서열과 40% 미만의 서열 동일성을 공유함;
e. 비유전자 서열은 쌍자엽 염색체 동원체, 예컨대 대두 염색체 중심으로부터의 게놈 거리의 비 0 내지 0.99682의 상대 위치 값을 가짐;
f. 비유전자 서열은 14.4 내지 45.9%의 구아닌/시토신 퍼센트 함량 범위를 가짐;
g. 비유전자 서열은 천연 비유전자 서열을 포함하는 인접 게놈 DNA의 40 Kb 내에 알려져 있는 또는 예측된 쌍자엽 코딩 서열, 예컨대 대두 코딩 서열을 포함하는 유전자 서열에 근접하게 위치함; 및
h. 비유전자 서열은 적어도 제2 비유전자 서열을 포함하는 쌍자엽 게놈 서열, 예컨대 게놈 서열의 1 Mb 영역에 위치함.
한 실시양태에서, 최적 비유전자 대두 게놈 서열은 천연 비유전자 서열을 포함하는 인접 게놈 DNA의 40 Kb 내에 1 내지 18개의 알려져 있는 또는 예측된 대두 코딩 서열을 포함하는 유전자 영역을 갖는 것으로 추가로 특징화된다. 한 실시양태에서, 최적 비유전자 대두 유전자좌는 클러스터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 2, 3, 4, 5, 6, 7, 8, 9, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 또는 32의 유전자좌로부터 선택된다.
IV. 트랜스제닉 식물
재조합 최적 비유전자 대두 유전자좌를 포함하는 트랜스제닉 식물이 또한 본 개시내용의 한 실시양태에 따라 제공된다. 이러한 트랜스제닉 식물은 관련 기술분야의 통상의 기술자에게 알려져 있는 기술을 사용하여 제조될 수 있다.
형질전환된 쌍자엽 식물 세포, 캘러스, 조직 또는 식물 (즉, 대두 세포, 캘러스, 조직 또는 식물)은 조작된 식물 물질을 형질전환 DNA 상에 존재하는 마커 유전자에 의해 코딩되는 형질에 대해 선택 또는 스크리닝함으로써 확인 및 단리될 수 있다. 예를 들어, 선택은 형질전환 유전자 구축물이 저항성을 부여하는 항생제 또는 제초제를 억제량으로 함유하는 배지 상에서 조작된 식물 물질을 성장시킴으로써 수행될 수 있다. 추가로, 형질전환된 세포는 또한 재조합 핵산 구축물 상에 존재할 수 있는 임의의 가시적 마커 유전자 (예를 들어, 황색 형광 단백질, 녹색 형광 단백질, 적색 형광 단백질, 베타-글루쿠로니다제, 루시페라제, B 또는 C1 유전자)의 활성에 대해 스크리닝함으로써 확인될 수 있다. 이러한 선택 및 스크리닝 방법론은 관련 기술분야의 통상의 기술자에게 널리 알려져 있다.
물리적 및 생화학적 방법을 또한 사용하여, 삽입된 유전자 구축물을 함유하는 식물 또는 식물 세포 형질전환체를 확인할 수 있다. 이들 방법은 다음을 포함하나, 이에 제한되지는 않는다 1) 재조합 DNA 삽입물의 구조를 검출하고 결정하기 위한 서던 분석 또는 PCR 증폭; 2) 유전자 구축물의 RNA 전사체를 검출하고 조사하기 위한 노던 블롯, S1 RNase 보호, 프라이머-연장 또는 역전사효소-PCR 증폭; 3) 상기 유전자 산물이 유전자 구축물에 의해 코딩되는 경우에, 효소 또는 리보자임 활성을 검출하기 위한 효소적 검정; 4) 유전자 구축물 산물이 단백질인 경우에, 단백질 겔 전기영동, 웨스턴 블롯 기술, 면역침전 또는 효소-연결된 면역검정 (ELISA). 추가의 기술, 예컨대 계내 혼성화, 효소 염색 및 면역염색을 또한 사용하여, 특정 식물 기관 및 조직에서의 재조합 구축물의 존재 또는 발현을 검출할 수 있다. 모든 이들 검정을 행하기 위한 방법은 관련 기술분야의 통상의 기술자에게 널리 알려져 있다.
본원에 개시된 방법을 사용하는 유전자 조작의 효과는, 예를 들어 관심 조직으로부터 단리된 RNA (예를 들어, mRNA)의 노던 분석에 의해 관찰될 수 있다. 전형적으로, mRNA가 존재하거나 mRNA 양이 증가하였다면, 상응하는 트랜스진이 발현되고 있는 것으로 가정될 수 있다. 유전자 및/또는 코딩된 폴리펩티드 활성을 측정하는 다른 방법이 사용될 수 있다. 사용된 기질 및 반응 산물 또는 부산물의 증가 또는 감소를 검출하는 방법에 따라, 상이한 유형의 효소적 검정이 사용될 수 있다. 추가로, 발현된 폴리펩티드의 수준은 면역화학적으로, 즉 ELISA, RIA, EIA 및 관련 기술분야의 통상의 기술자에게 널리 알려져 있는 다른 항체 기반 검정, 예컨대 전기영동 검출 검정 (염색 또는 웨스턴 블롯팅과 병행)에 의해 측정될 수 있다. 하나의 비제한적인 예로서, ELISA 검정을 사용하여 AAD-12 (아릴옥시알카노에이트 디옥시게나제; WO 2011/066360 참조) 및 PAT (포스피노트리신-N-아세틸-트랜스퍼라제 (PAT)) 단백질을 검출하는 것은 미국 특허 공개 번호 20090093366 (그 전문이 본원에 참조로 포함됨)에 기재되어 있다. 트랜스진이 식물의 일부 조직에서 또는 일부 발달 단계에서 선택적으로 발현될 수 있거나, 또는 트랜스진이 실질적으로 모든 식물 조직에서, 실질적으로 그의 전체 생활 주기를 따라 발현될 수 있다. 그러나, 임의의 조합 발현 방식이 또한 적용가능하다.
관련 기술분야의 통상의 기술자는, 외인성 폴리뉴클레오티드 공여자 서열이 트랜스제닉 식물에 안정하게 혼입되고 작동가능한 것으로 확증된 후에, 그것이 유성 교배에 의해 다른 식물 내로 도입될 수 있다는 것을 인식할 것이다. 교배될 종에 따라, 임의의 수많은 표준 육종 기술이 사용될 수 있다.
본 개시내용은 또한 트랜스진 또는 유전자 구축물을 갖는, 상기 기재된 트랜스제닉 식물의 종자를 포괄한다. 본 개시내용은 추가로 트랜스진 또는 유전자 구축물을 갖는, 상기 기재된 트랜스제닉 식물의 자손, 클론, 세포주 또는 세포를 포괄한다.
임의의 상기 형질전환 기술에 의해 생산된 형질전환된 식물 세포를 배양하여, 형질전환된 유전자형을 보유하고 따라서 목적하는 표현형을 보유하는 전체 식물을 재생시킬 수 있다. 이러한 재생 기술은 목적하는 뉴클레오티드 서열과 함께 도입된 살생물제 및/또는 제초제 마커에 전형적으로 의존하는, 조직 배양 성장 배지에서의 특정 피토호르몬의 조작에 의존한다. 배양된 원형질체로부터의 식물 재생은 문헌 [Evans, et al., "Protoplasts Isolation and Culture" in Handbook of Plant Cell Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983; 및 Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985]에 기재되어 있다. 식물 캘러스, 외식편, 기관, 화분, 배아 또는 그의 부분으로부터 재생이 또한 수득될 수 있다. 이러한 재생 기술은 일반적으로 문헌 [Klee et al. (1987) Ann. Rev. of Plant Phys. 38:467-486]에 기재되어 있다.
폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 트랜스제닉 식물 또는 식물 물질은 일부 실시양태에서 하기 특징 중 하나 이상을 나타낼 수 있다: 식물의 세포에서 폴리펩티드 발현; 식물의 세포의 색소체에서 폴리펩티드의 일부분 발현; 식물 세포의 세포질로부터 세포의 색소체 내로의 폴리펩티드 이입; 식물의 세포에서 폴리펩티드의 색소체-특이적 발현; 및/또는 식물의 세포에서 폴리펩티드의 국재화. 이러한 식물은 코딩된 폴리펩티드의 발현 이외에 하나 이상의 바람직한 형질을 추가로 가질 수 있다. 이러한 형질은, 예를 들어 곤충, 다른 해충 및 질병-야기제에 대한 저항성; 제초제에 대한 내성; 증진된 안정성, 수율 또는 보관-수명; 환경상의 내성; 제약 생산; 산업 제품 생산; 및 영양 증진을 포함할 수 있다.
한 실시양태에 따르면, 재조합 최적 비유전자 대두 유전자좌를 포함하는 트랜스제닉 쌍자엽 원형질체 (즉, 대두 원형질체)가 제공된다. 보다 특히, 쌍자엽 원형질체 (즉, 대두 원형질체)의 최적 비유전자 대두 게놈 유전자좌 내로 삽입된 관심 DNA를 포함하는 쌍자엽 원형질체, 예컨대 대두 원형질체가 제공되며, 여기서 상기 비유전자 대두 게놈 유전자좌는 약 1 Kb 내지 약 5.7 Kb 길이이고, 임의의 메틸화 뉴클레오티드가 결여되어 있다. 한 실시양태에서, 트랜스제닉 쌍자엽 원형질체 (즉, 트랜스제닉 대두 원형질체)는 최적 비유전자 대두 게놈 유전자좌 내로 삽입된 관심 DNA를 포함하며, 여기서 관심 DNA는 분석 도메인 및/또는 오픈 리딩 프레임을 포함한다. 한 실시양태에서 삽입된 관심 DNA는 펩티드를 코딩하고, 추가 실시양태에서 관심 DNA는 트랜스진을 포함하는 적어도 하나의 유전자 발현 카세트를 포함한다.
한 실시양태에 따르면, 재조합 최적 비유전자 대두 유전자좌를 포함하는 트랜스제닉 쌍자엽 식물, 쌍자엽 식물 부분 또는 쌍자엽 식물 세포 (즉, 트랜스제닉 대두 식물, 대두 식물 부분 또는 대두 식물 세포)가 제공된다. 보다 특히, 쌍자엽 식물, 쌍자엽 식물 부분 또는 쌍자엽 식물 세포 (즉, 대두 식물, 대두 식물 부분 또는 대두 식물 세포)의 최적 비유전자 대두 게놈 유전자좌 내로 삽입된 관심 DNA를 포함하는 쌍자엽 식물, 쌍자엽 식물 부분 또는 쌍자엽 식물 세포 (즉, 대두 식물, 대두 식물 부분 또는 대두 식물 세포)가 제공되며, 여기서 상기 비유전자 대두 게놈 유전자좌는 약 1 Kb 내지 약 5.7 Kb 길이이고, 임의의 메틸화 뉴클레오티드가 결여되어 있다. 한 실시양태에서, 트랜스제닉 쌍자엽 식물, 쌍자엽 식물 부분 또는 쌍자엽 식물 세포 (즉, 트랜스제닉 대두 식물, 대두 식물 부분 또는 대두 식물 세포)는 최적 비유전자 대두 게놈 유전자좌 내로 삽입된 관심 DNA를 포함하며, 여기서 관심 DNA는 분석 도메인 및/또는 오픈 리딩 프레임을 포함한다. 한 실시양태에서 삽입된 관심 DNA는 펩티드를 코딩하고, 추가 실시양태에서 관심 DNA는 트랜스진을 포함하는 적어도 하나의 유전자 발현 카세트를 포함한다.
실시예
실시예 1: 대두에서의 표적화가능한 게놈 유전자좌의 확인
폴리뉴클레오티드 공여자의 표적화를 위한 최적 게놈 유전자좌를 선택하기 위한 특정 기준을 사용하는 생물정보학 접근법에 의해 대두 게놈을 스크리닝하였다. 게놈 유전자좌를 선택하기 위해 사용된 특정 기준은 식물 게놈 내의 트랜스진의 최적 발현에 대한 고려사항, 부위 특이적 DNA-결합 단백질에 의한 게놈 DNA의 최적 결합에 대한 고려사항 및 트랜스제닉 식물 제품 개발 요건을 사용하여 개발되었다. 게놈 유전자좌를 확인하고 선택하기 위해, 생물정보학 접근법을 사용하여 대두 게놈의 게놈 및 에피게놈 데이터세트를 스캐닝하였다. 게놈 및 에피게놈 데이터세트를 스크리닝하여 하기 기준을 충족하는 선택 유전자좌에 이르렀다: 1) 저메틸화 및 1 Kb 초과의 길이; 2) 폴리뉴클레오티드 공여자의 부위 특이적 뉴클레아제-매개 통합을 통한 표적화가능; 3) 농경학상 중립 또는 비유전자; 4) 통합된 트랜스진을 발현시킬 수 있는 영역; 및 5) 유전자좌 내에/주위에 재조합을 갖는 영역. 따라서, 이들 특정 기준을 사용하여 총 7,018개의 게놈 유전자좌 (서열 1 - 서열 7,018)를 확인하였다. 특정 기준은 이하에서 상세히 추가로 기재된다.
저메틸화
DNA 저메틸화된 1 Kb 초과의 최적 게놈 유전자좌를 선택하기 위해 대두 게놈을 스캐닝하였다. 글리신 맥스 재배품종 윌리암스82로부터 단리된 뿌리 및 싹 조직의 DNA 메틸화 프로파일을 고처리량 전체 게놈 서열분석 접근법을 사용하여 구축하였다. 추출된 DNA를, 비메틸화 시토신을 우라실로 전환시키지만 메틸화 시토신에는 영향을 미치지 않는 비술파이트 처리에 적용한 다음, 일루미나 HiSeq 기술을 사용하여 서열분석하였다 (Krueger, F. et al. DNA methylome analysis using short bisulfite sequencing data. Nature Methods 9, 145-151 (2012)). 미가공 서열분석 판독물을 수집하고, 문헌 [Krueger F, Andrews SR (2011) Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics 27: 1571-1572]에 기재된 바와 같은 비스마크™ 맵핑 소프트웨어를 사용하여 대두 재배품종 윌리암스82 참조 게놈에 맵핑하였다.
비술파이트 전환 과정 동안, 메틸화된 DNA 서열에서의 시토신이 우라실로 전환되지 않기 때문에, 서열분석 데이터에서의 시토신 염기의 발생은 DNA 메틸화의 존재를 나타낸다. 참조 서열에 대해 맵핑된 판독물을 분석하여 시토신 잔기의 게놈 위치와 함께 DNA 메틸화에 대한 지지를 확인하였다. 게놈에서 각각의 시토신 염기에 대한 메틸화 수준을 특정한 시토신 염기 위치에 대해 맵핑된 판독물의 총수에 대한 그 위치에 맵핑된 메틸화 판독물의 수의 백분율로서 계산하였다. 하기 가설은 대두 게놈 내의 각각의 염기에 대해 얼마의 메틸화 수준이 계산되었는지를 설명한다. 예를 들어, 대두 재배품종 윌리암스82 참조 서열의 염색체 1 내 위치 100에 시토신 염기가 존재하는 것으로 간주하자. 위치 100에서의 시토신 염기에 대해 맵핑된 총 20개의 판독물이 존재하고, 이들 판독물 중 10개가 메틸화된 것이라면, 염색체 1 내 위치 100에서의 시토신 염기에 대한 메틸화 수준은 50%인 것으로 추정된다. 따라서, 대두의 뿌리 및 싹 조직으로부터 수득된 게놈 DNA 염기 쌍 모두에 대한 메틸화 수준의 프로파일을 계산하였다. 대두 게놈에서의 고유한 위치에 정확하게 맵핑될 수 없는 판독물은 대두 게놈에 만연한 반복 서열에 매치되었고, 우세하게 메틸화된 것으로 관련 기술분야에 알려져 있다.
상기 기재된 프로토콜을 사용하여, 대두 재배품종 윌리암스82 게놈에 대한 메틸화 수준을 측정하였다. 이에 따라, 메틸화 판독물을 함유하는 대두 게놈의 영역은 이들 대두 게놈 영역이 메틸화되었다는 것을 나타냈다. 반대로, 메틸화 판독물이 부재하는 대두 게놈의 영역은 이들 대두 게놈 영역이 비-메틸화되었다는 것을 나타냈다. 비-메틸화되고 어떠한 메틸화 판독물도 함유하지 않은 뿌리 및 싹 조직으로부터의 대두 게놈의 영역은 "저메틸화" 영역으로 간주한다. 가시화에 이용가능한 뿌리 및 싹 메틸화 프로파일을 제조하기 위해, 각각의 대두 재배품종 윌리암스82 염색체에 대해 위글 플롯 (http://useast.ensembl.org/info/website/upload/wig.html)을 작성하였다.
상기 기재된 바와 같이, 뿌리 및 싹 조직에서의 단일 염기 쌍의 해상에서 DNA 메틸화 수준을 수득한 후에, 100 bp 윈도우를 사용하여 대두 게놈을 스크리닝하여 메틸화된 게놈 영역을 확인하였다. 게놈에서 스크리닝된 각각의 윈도우에 대해, DNA 메틸화 수준은 그 윈도우에서의 모든 시토신 염기에서의 메틸화의 평균 수준을 계산함으로써 수득하였다. 1% 초과의 DNA 메틸화 수준을 갖는 게놈 윈도우는 메틸화된 게놈 영역으로 칭하였다. 뿌리 및 싹 프로파일에서 확인된 메틸화 윈도우를 합하여 컨센서스 메틸화 프로파일을 생성하였다. 반대로, 이들 기준을 충족하지 않고 컨센서스 프로파일에서 메틸화 영역으로 확인되지 않은 게놈에서의 영역은 저메틸화 영역으로 칭하였다. 표 1은 확인된 저메틸화 영역을 요약한다.
<표 1> 대두 재배품종 윌리암스82 게놈의 저메틸화 프로파일
Figure pct00001
대두 재배품종 윌리암스82 게놈의 이들 저메틸화 영역을, 이들 영역의 메틸화 부재 문맥이 개방 염색질의 존재를 나타내는 것처럼 특정 게놈 유전자좌를 확인하고 선택하기 위해 추가로 특징화하였다. 이에 따라, 모든 후속 분석을 확인된 저메틸화 영역에 대해 수행하였다.
표적화가능성
대두 재배품종 윌리암스82에서 확인된 저메틸화 부위를 추가로 분석하여 어느 부위가 폴리뉴클레오티드 공여자의 부위 특이적 뉴클레아제-매개 통합을 통해 표적화가능한지를 결정하였다. 글리신 맥스는 그의 게놈 이력에서 게놈 중복을 겪은 원시배수성 작물인 것으로 알려져 있다 (Jackson et al. Genome sequence of the palaeopolyploid soybean, Nature 463, 178-183 (2010)). 대두 게놈은, 메틸화되고 높은 수준의 서열 중복을 갖는 고도 반복 DNA의 긴 스트레치를 함유하는 것으로 관련 기술분야에 알려져 있다. 대두 게놈에서의 알려져 있는 반복 영역의 주석달린 정보는 소이빈 게놈 데이터베이스로부터 수집하였다 (www.soybase.org, Shoemaker, R.C. et al. SoyBase, the USDA-ARS soybean genetics and genomics database. Nucleic Acids Res. 2010 Jan;38(Database issue):D843-6.).
따라서, 상기 확인된 저메틸화 부위를 스크리닝하여 대두 게놈 상에 주석달린 알려져 있는 반복 영역과 정렬되는 임의의 부위를 제거하였다. 이 제1 스크린을 통과한 남아있는 저메틸화 부위는 후속적으로, 디폴트 파라미터 세팅을 사용하여 실행되는 NCBI 블라스트™+ 소프트웨어 (버전 2.2.25)를 통해 대두 게놈 데이터베이스의 블라스트™ 기반 상동성 검색을 사용하여 스캐닝하였다 (Stephen F. Altschul et al. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25:3389-3402). 블라스트™ 스크린의 결과로서, 40% 초과의 서열 정렬 커버리지로 게놈 내 다른 곳에서 유의한 매치를 갖는 임의의 저메틸화 부위를 추가의 분석에서 제거하였다.
농경학상 중립 또는 비유전자
대두 재배품종 윌리암스82에서 확인된 저메틸화 부위를 추가로 분석하여 어느 부위가 농경학상 중립 또는 비유전자인지를 결정하였다. 이에 따라, 상기 기재된 저메틸화 부위를 스크리닝하여 임의의 알려져 있는 또는 예측된 내인성 대두 재배품종 윌리암스82 코딩 서열과 중첩되거나 이를 함유하는 임의의 부위를 제거하였다. 이 목적을 위해, 알려져 있는 유전자의 주석달린 데이터 및 발현된 서열 태그 (EST) 데이터의 맵핑 정보를 소이빈 게놈 데이터베이스로부터 수집하였다 (www.soybase.org - version 1.1 gene models were used, Jackson et al. Genome sequence of the palaeopolyploid soybean Nature 463, 178-183 (2010)). 오픈 리딩 프레임의 바로 2 Kb 상류 및 1 Kb 하류에 있는 임의의 게놈 영역을 또한 고려하였다. 이들 상류 및 하류 영역은 유전자 기능에 본질적인 알려져 있는 또는 알려져 있지 않은 보존된 조절 요소를 함유할 수 있다. 상기 이전에 기재된 저메틸화 부위를 알려져 있는 유전자 (2 Kb 상류 및 1 Kb 하류 영역을 포함함) 및 EST의 존재에 대해 분석하였다. 알려져 있는 유전자 (2 Kb 상류 및 1 Kb 하류 영역을 포함함) 또는 EST와 정렬되거나 이와 중첩되는 임의의 저메틸화 부위를 하류 분석에서 제거하였다.
발현
대두 재배품종 윌리암스82에서 확인된 저메틸화 부위를 추가로 분석하여 어느 부위가 발현된 대두 유전자에 대한 근접부 내에 있는지를 결정하였다. 대두 유전자의 전사체 수준 발현은 문헌 [Mortazavi et al., Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 2008;5(7):621-628, 및 Shoemaker RC et al., RNA-Seq Atlas of Glycine max: a guide to the soybean Transcriptome. BMC Plant Biol. 2010 Aug 5;10:160]에 기재된 바와 같이 RNAseq™ 기술을 사용하여 대두 재배품종 윌리암스82 뿌리 및 싹 조직으로부터 생성된 트랜스크립톰 프로파일링 데이터를 분석함으로써 측정하였다. 각각의 저메틸화 부위에 대해, 분석을 완결하여 저메틸화 부위에 근접한 40 Kb 영역 내에 존재하는 임의의 주석달린 유전자, 및 저메틸화 부위에 근접하게 위치하는 주석달린 유전자(들)의 평균 발현 수준을 확인하였다. 0이 아닌 평균 발현 수준을 갖는 주석달린 유전자로부터 40 Kb 초과에 위치하는 저메틸화 부위는 발현된 대두 유전자에 근접하지 않는 것으로 결정하고 추가의 분석에서 제거하였다.
재조합
대두 재배품종 윌리암스82에서 확인된 저메틸화 부위를 추가로 분석하여 어느 부위가 재조합의 증거를 가지며 통상적인 육종을 통해 다른 계통의 대두 내로의 최적 게놈 유전자좌의 유전자이입을 용이하게 할 수 있는지를 결정하였다. 농경학적 관심 형질을 함유하는 새롭고 개선된 대두 계통을 개발하기 위해 다양한 대두 유전자형을 통상적인 육종 동안 상용적으로 교배하였다. 이에 따라, 트랜스진의 식물-매개 형질전환을 통해 대두 계통 내의 최적 게놈 유전자좌 내로 유전자이입된 농경학적 형질은 통상적인 식물 육종 동안 감수분열 재조합을 통해 다른 대두 계통, 특히 우량 계통 내로 추가로 유전자이입될 수 있어야 한다. 상기 기재된 저메틸화 부위를 스크리닝하여 일부 수준의 감수분열 재조합을 보유하는 부위를 확인하고 선택하였다. 재조합 "콜드-스팟"을 특징으로 하는 염색체 영역 내에 존재하는 임의의 저메틸화 부위를 확인하고 제거하였다. 대두에서, 이들 콜드 스팟은 재조합 근교 맵핑 집단으로부터 생성된 마커 데이터세트를 사용하여 정의하였다 (윌리암스 82 x PI479752). 이 데이터세트는 글리신 맥스 참조 게놈 서열에 대해 물리적으로 맵핑될 수 있는 ~16,600 SNP 마커로 이루어졌다.
염색체에 걸친 임의의 대두 게놈 마커 쌍 사이의 감수분열 재조합 빈도는 마커 사이의 물리적 거리 (메가베이스 (Mb) 단위)에 대한 마커 사이의 유전적 거리 (센티모르간 (cM) 단위)의 비를 기초로 계산하였다. 예를 들어, 한 쌍의 마커 사이의 유전적 거리가 1 cM이고 동일한 쌍의 마커 사이의 물리적 거리가 2 Mb라면, 계산된 재조합 빈도는 0.5 cM/Mb인 것으로 결정되었다. 상기 확인된 각각의 저메틸화 부위에 대해, 적어도 1 Mb 떨어진 한 쌍의 마커를 선택하고, 재조합 빈도를 계산하였다. 이 방법의 배치를 사용하여 저메틸화 부위의 재조합 빈도를 계산하였다. 0 cM/Mb의 재조합 빈도를 갖는 임의의 저메틸화 부위를 확인하고 추가의 분석에서 제거하였다. 0 cM/Mb 초과의 재조합 빈도를 포함하는 남아있는 저메틸화 영역을 추가의 분석을 위해 선택하였다.
최적 게놈 유전자좌의 확인
상기 기재된 선택 기준의 적용은 대두 게놈으로부터 총 90,325개의 최적 게놈 유전자좌를 확인시켜 주었다. 표 2는 확인된 최적 게놈 유전자좌의 길이를 요약한다. 이들 최적 게놈 유전자좌는 하기 특징을 보유한다: 1) 1 Kb 초과의 길이의 저메틸화 게놈 유전자좌; 2) 폴리뉴클레오티드 공여자의 부위 특이적 뉴클레아제-매개 통합을 통한 표적화가능한 게놈 유전자좌; 3) 농경학상 중립 또는 비유전자인 게놈 유전자좌; 4) 트랜스진을 발현시킬 수 있는 게놈 유전자좌; 및 5) 게놈 유전자좌 내의 재조합의 증거. 표 2에 기재된 모든 최적 게놈 유전자좌 중에서, 단지 1 Kb 초과인 최적 게놈 유전자좌만을 추가로 분석하고, 공여자 폴리뉴클레오티드 서열의 표적화에 이용하였다. 이들 최적 게놈 유전자좌의 서열은 서열 1 - 서열 7,018로서 개시된다. 총괄적으로, 이들 최적 게놈 유전자좌는 본원 이하에서 추가로 입증된 바와 같이 공여자 폴리뉴클레오티드 서열로 표적화될 수 있는 대두 게놈 내의 위치이다.
<표 2> 저메틸화되고, 재조합의 증거, 표적화가능성, 농경학상 중립 또는 비유전자를 나타내며, 발현된 내인성 유전자에 근접하는, 대두 게놈에서 확인된 최적 게놈 유전자좌의 크기 범위의 목록
Figure pct00002
실시예 2: 대두로부터의 최적 게놈 유전자좌를 클러스터링하기 위한 F-분포 및 주성분 분석
최적 게놈 유전자좌의 군별화를 위한 대표적인 집단 및 클러스터를 정의하기 위해 F-분포 및 주성분 분석 통계적 방법을 사용하여 7,018개의 확인된 최적 게놈 유전자좌 (서열 1 - 서열 7,018)를 추가로 분석하였다.
F-분포 분석
확인된 7,018개의 최적 게놈 유전자좌를 연속 확률 분포 통계적 분석을 사용하여 통계적으로 분석하였다. 연속 확률 분포 통계적 분석의 한 실시양태로서, F-분포 검정을 완결하여 최적 게놈 유전자좌의 대표적인 수를 결정하였다. F-분포 검정 분석은 관련 기술분야의 통상의 기술자에게 알려져 있는 방정식 및 방법을 사용하여 완결하였다. 보다 많은 안내를 위해, 문헌 [K.M Remund, D. Dixon, DL. Wright and LR. Holden. Statistical considerations in seed purity testing for transgenic traits. Seed Science Research (2001) 11, 101-119] (본원에 참조로 포함됨)에 기재된 바와 같은 F-분포 검정 분석은 F-분포 검정의 비제한적 예이다. F-분포 검정은, 임의의 비-유효 유전자좌가 7,018개의 최적 게놈 유전자좌에 걸쳐 균일하게 분포되고, 최적 게놈 유전자좌의 수가 7,018개의 최적 게놈 유전자좌의 총 집단의 10% 이하이도록, 최적 게놈 유전자좌의 무작위 샘플링을 가정한다.
F-분포 분석은 7,018개의 최적 게놈 유전자좌 중 32개가 95% 신뢰 수준에서 7,018개의 최적 게놈 유전자좌의 대표적인 수를 제공하였다는 것을 나타냈다. 따라서, F-분포 분석은, 32개의 최적 게놈 유전자좌를 검정하고 모두가 공여자 폴리뉴클레오티드 서열로 표적화가능하였다면, 이들 결과는 7,018개의 최적 게놈 유전자좌 중 91개 이상이 95% 신뢰 수준에서 양성임을 나타낼 것임을 제시하였다. 7,018개의 최적 게놈 유전자좌의 총 백분율을 검증하는 최고 추정은 32개의 검정된 최적 게놈 유전자좌 중 100%가 표적화가능하였는지 여부일 것이다. 따라서, 91%는 실제로 95% 신뢰 수준에서 검증된 참 퍼센트의 하한계이다. 이 하한계는 95% 신뢰 수준에서 F-분포의 0.95 분위수를 기초로 한다 (Remund K, Dixon D, Wright D, and Holden L. Statistical considerations in seed purity testing for transgenic traits. Seed Science Research (2001) 11, 101-119).
주성분 분석
다음에, 표적화 검증을 위한 다양한 유전자좌의 샘플링을 가능하게 하기 위해 7,018개의 확인된 최적 게놈 유전자좌를 포함하는 데이터 세트의 유사성 및 차이를 추가로 평가 및 가시화하는 주성분 분석 (PCA) 통계적 방법을 완결하였다. PCA는 보다 큰 수의 상관 변수를 보다 작은 수의 비상관 변수 (주성분으로 불림)로 변환하는 수학적 알고리즘을 수반한다.
7,018개의 확인된 최적 게놈 유전자좌를 기재하는데 사용될 수 있는 일련의 계산가능한 특색 또는 속성을 생성함으로써 7,018개의 확인된 최적 게놈 유전자좌에 대해 PCA를 완결하였다. 각각의 특색은 수치로 계산가능하고, 구체적으로 7,018개의 확인된 최적 게놈 유전자좌의 게놈 및 에피게놈 문맥을 포착하는 것으로 정의된다. 각각의 대두 최적 게놈 유전자좌에 대한 일련의 10개 특색을 확인하였고, 이하에서 보다 상세히 기재한다.
1. 최적 게놈 유전자좌의 길이
a. 이 데이터 세트에서의 최적 게놈 유전자좌의 길이는 최소 1,000 Bp 내지 최대 5,713 Bp의 범위였다.
2. 최적 게놈 유전자좌 주위의 1 MB 영역에서의 재조합 빈도
a. 대두에서, 염색체 위치에 대한 재조합 빈도는 다중 맵핑 집단으로부터 생성된 내부 고해상 마커 데이터세트를 사용하여 정의하였다.
b. 염색체에 걸친 임의의 마커 쌍 사이의 재조합 빈도는 마커 사이의 물리적 거리 (Mb 단위)에 대한 마커 사이의 유전적 거리 (센티모르간 (cM) 단위)의 비를 기초로 계산하였다. 예를 들어, 한 쌍의 마커 사이의 유전적 거리가 1 cM이고 동일한 쌍의 마커 사이의 물리적 거리가 2 Mb라면, 계산된 재조합 빈도는 0.5 cM/Mb이다. 각각의 최적 게놈 유전자좌에 대해, 적어도 1 Mb 떨어진 한 쌍의 마커를 선택하고, 재조합 빈도를 이 방식으로 계산하였다. 이들 재조합 값은 최소 0.01574 cM/Mb 내지 최대 83.52 cM/Mb의 범위였다.
3. 최적 게놈 유전자좌 서열 고유성의 수준
a. 각각의 최적 게놈 유전자좌에 대해, 최적 게놈 유전자좌의 뉴클레오티드 서열을, 디폴트 파라미터 세팅을 사용하여 실행되는 NCBI 블라스트™+ 소프트웨어 (버전 2.2.25)를 사용하여 블라스트™ 기반 상동성 검색을 사용하여 대두 재배품종 윌리암스82 게놈에 대하여 스캐닝하였다 (Stephen F. Altschul et al. (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402). 이들 최적 게놈 유전자좌 서열을 대두 재배품종 윌리암스82 게놈으로부터 확인하였을 때, 이 검색을 통해 확인된 제1 블라스트™ 히트는 대두 재배품종 윌리암스82 서열 그 자체를 나타낸다. 각각의 최적 게놈 유전자좌 서열에 대한 제2 블라스트™ 히트를 확인하고, 히트의 정렬 커버리지 (블라스트™ 히트에 의해 커버된 최적 게놈 유전자좌의 퍼센트로 나타내어짐)를 대두 게놈 내 최적 게놈 유전자좌 서열의 고유성의 척도로서 사용하였다. 제2 블라스트™ 히트에 대한 이들 정렬 커버리지 값은 최소 0% 내지 최대 39.97% 서열 동일성의 범위였다. 보다 높은 수준의 서열 동일성에서 정렬된 어떠한 서열도 고려하지 않았다.
4. 최적 게놈 유전자좌로부터 그의 인접부에서의 최근접 유전자까지의 거리
a. 대두 게놈에서 알려져 있는 유전자의 유전자 주석달린 정보 및 위치를 소이빈 게놈 데이터베이스 (다음에서 입수가능함: www.soybase.org - version 1.1 gene models were used, Jackson et al. Genome sequence of the palaeopolyploid soybean, Nature 463, 178-183 (2010))로부터 얻었다. 각각의 최적 게놈 유전자좌에 대해, 상류 및 하류 위치 둘 다를 고려하여 최근접 주석달린 유전자를 확인하고, 최적 게놈 유전자좌 서열과 유전자 사이의 거리를 측정하였다 (Bp 단위). 예를 들어, 최적 게놈 유전자좌가 염색체 Gm01에서 위치 2,500 내지 위치 3,500에 위치하고 이 최적 게놈 유전자좌에 대한 최근접 유전자가 염색체 Gm01에서 위치 5,000 내지 위치 6,000에 위치하는 경우에, 최적 게놈 유전자좌로부터 이 최근접 유전자까지의 거리는 1500 Bp인 것으로 계산된다. 모든 7,018개의 최적 게놈 유전자좌 데이터세트에 대한 이들 값은 최소 1,001 Bp 내지 최대 39,482 Bp의 범위였다.
5. 최적 게놈 유전자좌 서열에서의 GC%
a. 각각의 최적 게놈 유전자좌에 대해, 뉴클레오티드 서열을 분석하여 존재하는 구아닌 및 시토신 염기의 수를 추정하였다. 이 계수를 각각의 최적 게놈 유전자좌의 서열 길이의 백분율로 나타내었으며, 이는 GC%에 대한 척도를 제공한다. 대두 최적 게놈 유전자좌 데이터세트에 대한 이들 GC% 값은 14.4% 내지 45.9%의 범위였다.
6. 최적 게놈 유전자좌 서열 주위의 40 Kb 인접부에서의 유전자의 수
a. 대두 재배품종 윌리암스82 게놈에서의 알려져 있는 유전자의 유전자 주석달린 정보 및 위치를 소이빈 게놈 데이터베이스로부터 얻었다. 각각의 7,018개의 최적 게놈 유전자좌 서열에 대해, 최적 게놈 유전자좌 서열 주위의 40 Kb 윈도우를 정의하고, 이 윈도우에 중첩되는 위치를 갖는 주석달린 유전자의 수를 계수하였다. 이들 값은 40 Kb 인접부 내에 최소 1개 유전자 내지 최대 18개 유전자의 범위였다.
7. 최적 게놈 유전자좌 주위의 40 Kb 인접부에서의 평균 유전자 발현
a. 대두 유전자의 전사체 수준 발현을 RNAseq™ 기술을 사용하여 대두 재배품종 윌리암스82 뿌리 및 싹 조직으로부터 생성된 이용가능한 트랜스크립톰 프로파일링 데이터를 분석함으로써 측정하였다. 대두 재배품종 윌리암스82 게놈에서의 알려져 있는 유전자의 유전자 주석달린 정보 및 위치는 소이빈 게놈 데이터베이스로부터 얻었다. 각각의 최적 게놈 유전자좌에 대해, 최적 게놈 유전자좌 주위의 40 Kb 인접부에 존재하는 대두 재배품종 윌리암스82 게놈 내의 주석달린 유전자를 확인하였다. 각각의 유전자에 대한 발현 수준은 상기 언급된 인용에 기재된 트랜스크립톰 프로파일로부터 얻고, 평균 유전자 발현 수준을 계산하였다. 대두의 게놈 내의 모든 유전자의 발현 값은 매우 다르다. 모든 7,018개의 최적 게놈 유전자좌 데이터세트에 대한 평균 발현 값은 최소 0.000415 내지 최대 872.7198의 범위였다.
8. 최적 게놈 유전자좌 주위의 뉴클레오솜 점유도 수준
a. 특정한 뉴클레오티드 서열에 대한 뉴클레오솜 점유도 수준을 이해하는 것은 염색체 기능 및 서열의 게놈 문맥에 관한 정보를 제공한다. NuPoP™ 통계 패키지를 사용하여, 임의의 크기의 게놈 서열에 대한 뉴클레오솜 점유도 및 가장 개연성 있는 뉴클레오솜 위치지정 맵을 예측하였다 (Xi, L., Fondufe-Mittendor, Y., Xia, L., Flatow, J., Widom, J. and Wang, J.-P., Predicting nucleosome positioning using a duration Hidden Markov Model, BMC Bioinformatics, 2010, doi:10.1186/1471-2105-11-346.). 각각의 7,018개의 최적 게놈 유전자좌에 대해, 뉴클레오티드 서열을 NuPoP™ 소프트웨어를 사용한 분석에 제출하고, 뉴클레오솜 점유도 점수를 계산하였다. 대두 최적 게놈 유전자좌 데이터세트에 대한 이들 뉴클레오솜 점유도 점수는 최소 0 내지 최대 0.494의 범위였다.
9. 염색체 내의 상대 위치 (동원체에 대한 근접성)
a. 동원체는 2개의 자매 염색분체를 연결하는 염색체 상의 영역이다. 동원체의 어느 한쪽 측면 상의 염색체의 부분은 염색체 아암으로 알려져 있다. 모든 20개의 대두 염색체 상의 동원체의 게놈 위치는 공개된 대두 재배품종 윌리암스82 참조 서열에서 확인되었다 (Jackson et al. Genome sequence of the palaeopolyploid soybean Nature 463, 178-183 (2010)). 각각의 대두 염색체에서의 동원체의 위치 및 염색체 아암의 길이에 대한 정보는 소이빈 게놈 데이터베이스로부터 얻었다. 각각의 최적 게놈 유전자좌에 대해, 최적 게놈 유전자좌 서열로부터 그것이 위치하는 염색체의 동원체까지의 게놈 거리를 측정하였다 (Bp 단위). 염색체 내의 최적 게놈 유전자좌의 상대 위치는 그것이 놓여있는 특정 염색체 아암의 길이 대비 동원체까지의 그의 게놈 거리의 비로 나타내어진다. 대두 최적 게놈 유전자좌 데이터세트에 대한 이들 상대 위치 값은 게놈 거리의 비 최소 0 내지 최대 0.99682의 범위였다.
10. 1 Mb 영역에서의 최적 게놈 유전자좌의 수
a. 각각의 최적 게놈 유전자좌에 대해, 최적 게놈 유전자좌 위치 주위의 1 Mb 게놈 윈도우를 정의하고, 고려 하의 최적 게놈 유전자좌를 포함한, 이 영역 내에 존재하거나 이 영역과 중첩되는 다른 추가의 최적 게놈 유전자좌의 수를 계산하였다. 1 Mb에서의 최적 게놈 유전자좌의 수는 최소 1 내지 최대 49의 범위였다.
모든 7,018개의 최적 게놈 유전자좌를 상기 기재된 특색 및 속성을 사용하여 분석하였다. 각각의 최적 게놈 유전자좌의 특색 및 속성의 점수에 대한 결과 또는 값은 표 3에 추가로 기재되어 있다 (별도의 전자 문서로서 본원에 참조로 포함됨). 생성된 데이터세트를 PCA 통계적 방법에 사용하여 7,018개의 확인된 최적 게놈 유전자좌를 클러스터로 클러스터링하였다. 클러스터링 과정 동안, 최적 게놈 유전자좌의 "p" 주성분을 추정한 후에, 최적 게놈 유전자좌를 32개의 클러스터 중 하나로 배정하는 것은 "p" 차원 유클리드 공간에서 진행하였다. 각각의 "p" 축을 "k" 간격으로 분할하였다. 동일한 간격으로 배정된 최적 게놈 유전자좌를 함께 군별화하여 클러스터를 형성하였다. 이 분석을 사용하여, 각각의 PCA 축을 2개의 간격으로 분할하였으며, 이는 실험 검증에 요구되는 클러스터의 수에 관한 선험 정보를 기초로 선택하였다. 생성된 클러스터의 모든 분석 및 가시화는 케미칼 컴퓨팅 그룹 인크. (캐나다 퀘백 몬트리올)로부터의 몰레큘라 오퍼레이팅 인바이런먼트™ (MOE) 소프트웨어로 수행하였다.
PCA 접근법을 사용하여 7,018개의 확인된 최적 대두 게놈 유전자좌의 세트를 상기 기재된 그의 특색 값을 기초로 32개의 구별되는 클러스터로 클러스터링하였다. PCA 과정 동안, 5개의 주성분 (PC)이 생성되었으며, 여기서 상위 3개의 PC는 데이터세트에서의 총 변동의 약 90%를 함유하였다 (표 4). 이들 세 PC를 사용하여 3차원 플롯에서 32개의 클러스터를 그래프로 나타내었다 (도 1). 클러스터링 과정이 완결된 후에, 하나의 대표적인 최적 게놈 유전자좌를 각각의 클러스터로부터 선택하였다. 이것은 각각의 클러스터 내에서 그 클러스터의 중심에 최근접한 선택 최적 게놈 유전자좌를 선택함으로써 수행하였다 (표 4). 32개의 대표적인 최적 게놈 유전자좌의 염색체 위치는 도 2에 도시된 바와 같이 20개의 대두 염색체 중에 균일하게 분포되고 임의의 특정한 게놈 위치를 향해 편재되지 않는다.
<표 4> PCA로부터 확인된 32개의 대두의 대표적인 최적 게놈 유전자좌의 기재
Figure pct00003
폴리뉴클레오티드 공여자 폴리뉴클레오티드 서열의 표적화를 위한 게놈 유전자좌의 최종 선택
32개의 구별되는 클러스터 내에 클러스터링된 7,018개의 게놈 유전자좌로부터, 공여자 폴리뉴클레오티드 서열로의 표적화를 위한 총 32개의 게놈 유전자좌를 확인하고 선택하였다. 각각의 32개의 클러스터에 대해, 대표적인 게놈 유전자좌 (표 4에서 상기 기재된 바와 같은 클러스터의 중심에 최근접한 것) 또는 표적화 계통에 대한 상동성을 갖는 추가의 유전자좌를 선택하였다. 먼저 글리신 맥스 재배품종 매버릭 (형질전환 및 표적 스크리닝 계통) 및 글리신 맥스 재배품종 윌리암스82 (참조 계통) 둘 다에 대한 게놈 DNA 서열 데이터로 이루어진 전체 게놈 데이터베이스에 대하여 모든 7,018개의 선택된 최적 게놈 서열을 스크리닝하여 두 계통으로부터의 게놈에서 커버리지 (얼마나 많은 최적 게놈 유전자좌가 두 게놈에 존재하였는지) 및 서열 동일성의 백분율을 결정함으로써 추가의 최적 게놈 유전자좌를 선택하였다. 윌리암스82 게놈 데이터베이스에서 100% 커버리지 (두 게놈 사이에 정렬된 최적 유전자좌의 전체 서열 길이) 및 100% 동일성을 갖는 최적 게놈 유전자좌를 표적화 검증을 위해 선택하였다. 다른 기준, 예컨대 최적 게놈 유전자좌의 게놈 유전자좌 크기, 고유성의 정도, GC% 함량 및 염색체 분포를 또한 추가의 최적 게놈 유전자좌를 선택하는데 있어서 고려하였다. 32개의 선택된 최적 게놈 유전자좌의 염색체 위치 및 각각의 대두 최적 게놈 유전자좌의 특정 게놈 구성은 각각 도 3 및 표 5에 제시되어 있다.
<표 5> 표적화 검증을 위해 선택된 32개의 대두 선택된 최적 게놈 유전자좌의 기재. 이 표에 열거된 이들 최적 게놈 유전자좌에서, 32개의 대두 최적 게놈 유전자좌의 절단 및 표적화의 예시는 확인된 총 7,018개의 대두 선택된 최적 게놈 유전자좌를 대표한다.
Figure pct00004
정밀 게놈 조작 기술을 사용하여 공여자 폴리뉴클레오티드 서열로의 표적화를 위한 최적 게놈 유전자좌로서 큰 묶음의 7,018개의 게놈 위치를 대두 게놈에서 확인하였다. 통계적 분석 접근법을 배치하여 7,018개의 선택된 게놈 유전자좌를 유사한 게놈 문맥을 갖는 32개의 클러스터로 군별화하고 7,018개의 선택된 게놈 유전자좌의 세트를 대표하는 32개의 선택된 게놈 유전자좌의 하위세트를 확인하였다. 32개의 대표적인 유전자좌를 공여자 폴리뉴클레오티드 서열로의 표적화를 통해 최적 게놈 유전자좌로서 검증하였다. 상기 기재된 특색 또는 속성의 10개 세트에 대해 생성된 수치에 대해 PCA 통계적 분석을 수행함으로써, 10개 특색 또는 속성을 보다 적은 치수의 PCA 성분으로 컴퓨팅하였다. 이에 따라, PCA 성분은 상기 기재된 10개 특색 또는 속성을 대표하는 5개 치수로 감소하였다 (표 6). 각각의 PCA 성분은 상기 기재된 10개 특색 또는 속성의 조합과 동등하다. 5개 치수를 포함하는 이들 PCA 성분으로부터, PCA 통계적 분석을 사용하여 컴퓨팅된 바와 같이, 32개의 클러스터를 결정하였다.
<표 6> 32개의 클러스터 및 각각의 클러스터를 구성하는 서열 (서열 1 - 서열 7,018) 각각을 정의하는 5개의 PCA 성분 (PCA1, PCA2, PCA3, PCA4 및 PCA5). 이들 5개 치수는 최적 게놈 유전자좌를 확인하는데 사용된 상기 기재된 10개 특색 또는 속성을 대표한다. 각각의 PCA 성분에 대한 최소 (Min), 평균, 중앙값 및 최대 (Max)의 값이 제공된다.
Figure pct00006
Figure pct00007
실시예 3: 대두에서 게놈 유전자좌에 결합하는 아연 핑거의 설계
대표적인 게놈 유전자좌의 확인된 DNA 서열에 대하여 지시된 아연 핑거 단백질을 이전에 기재된 바와 같이 설계하였다. 예를 들어, 문헌 [Urnov et al., (2005) Nature 435:646-551]을 참조한다. 예시적인 표적 서열 및 인식 나선은 표 7 (인식 나선 영역 설계) 및 표 8 (표적 부위)에 제시되어 있다. 표 8에서, ZFP 인식 나선이 접촉하는 표적 부위에서의 뉴클레오티드를 대문자로 나타내고, 비-접촉된 뉴클레오티드를 소문자로 나타내었다. 아연 핑거 뉴클레아제 (ZFN) 표적 부위를 이전에 기재된 32개의 선택된 최적 게놈 유전자좌 모두에 대해 설계하였다. 상기 기재된 바와 같이 대두에서 확인되고 선택된 32개의 상이한 대표적인 게놈 유전자좌 표적 부위와 최고 수준의 효율로 결합하는 핑거를 확인하기 위해 수많은 ZFP 설계를 개발하고 시험하였다. 대두 게놈 내의 공여자 서열의 표적화 및 통합을 위해 아연 핑거 인식 서열에 최고 수준의 효율로 결합하는 특이적 ZFP 인식 나선 (표 7)을 사용하였다.
<표 7> 대두 선택된 게놈 유전자좌에 대한 아연 핑거 설계 (N/A는 "적용가능하지 않음"을 나타냄)
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
<표 8> 대두 선택된 게놈 유전자좌의 아연 핑거 표적 부위
Figure pct00013
Figure pct00014
Figure pct00015
대두의 대표적인 게놈 유전자좌 아연 핑거 설계를 CCHC 구조를 가진 적어도 하나의 핑거를 갖는 단백질을 코딩하는 아연 핑거 발현 벡터 내로 혼입시켰다. 미국 특허 공개 번호 2008/0182332를 참조한다. 특히, 각각의 단백질에서의 마지막 핑거는 인식 나선에 대한 CCHC 백본을 가졌다. 비-정규 아연 핑거-코딩 서열을, 대두에 대해 최적화된 4개의 아미노산 ZC 링커 및 opaque-2 핵 국재화 신호를 통해 IIS형 제한 효소 FokI의 뉴클레아제 도메인 (문헌 [Wah et al., (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569]의 서열의 아미노산 384-579)에 융합시켜 아연 핑거 뉴클레아제 (ZFN)를 형성하였다. 미국 특허 번호 7,888,121을 참조한다. 다양한 기능적 도메인에 대한 아연 핑거를 생체내 사용을 위해 선택하였다. 추정 게놈 표적 부위에 결합하도록 설계, 생산 및 시험된 수많은 ZFN 중에서, 상기 표 8에 기재된 ZFN이 생체내 활성을 갖는 것으로 확인되었고, 식물체에서 고유한 대두 게놈 폴리뉴클레오티드 표적 부위에 효율적으로 결합하여 그를 절단할 수 있다는 것을 특징으로 하였다.
ZFN 구축물 조립
ZFN 유전자 발현 구축물을 함유하는 플라스미드 벡터를 관련 기술분야에 통상적으로 알려져 있는 기법 및 기술을 사용하여 설계하고 완결하였다 (예를 들어, 문헌 [Ausubel or Maniatis] 참조). 각각의 ZFN-코딩 서열을 아연 핑거 뉴클레아제의 상류에 위치한 opaque-2 핵 국재화 신호를 코딩하는 서열 (Maddaloni et al., (1989) Nuc. Acids Res. 17:7532)에 융합시켰다. 비-정규 아연 핑거-코딩 서열을 IIS형 제한 효소 FokI의 뉴클레아제 도메인 (문헌 [Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569]의 서열의 아미노산 384-579)에 융합시켰다. 융합 단백질의 발현은 카사바 베인 모자이크 바이러스로부터의 강한 구성적 프로모터에 의해 구동하였다. 발현 카세트는 또한 아그로박테리움 투메파시엔스 ORF23으로부터의 3' UTR을 포함한다. 토세아 아시그나(Thosea asigna) 바이러스로부터의 뉴클레오티드 서열을 코딩하는 자기-가수분해 2A (Szymczak et al., (2004) Nat Biotechnol. 22:760-760)를 구축물 내로 클로닝된 2개의 아연 핑거 뉴클레아제 융합 단백질 사이에 부가하였다.
플라스미드 벡터를 인-퓨전(IN-FUSION)™ 어드밴티지 테크놀로지(Advantage Technology) (클론테크(Clontech), 캘리포니아주 마운틴 뷰)를 사용하여 조립하였다. 제한 엔도뉴클레아제를 뉴 잉글랜드 바이오랩스(New England BioLabs) (매사추세츠주 입스위치)로부터 입수하였고, T4 DNA 리가제 (인비트로젠(Invitrogen), 캘리포니아주 칼스배드)를 DNA 라이게이션을 위해 사용하였다. 플라스미드 제제를 공급업체의 지침에 따라 뉴클레오스핀(NUCLEOSPIN)? 플라스미드 키트 (마슈레-나겔 인크.(Macherey-Nagel Inc.), 펜실베니아주 베들레헴) 또는 플라스미드 미디 키트 (퀴아젠(Qiagen))를 사용하여 수행하였다. DNA 단편을 아가로스 트리스-아세테이트 겔 전기영동 후에 퀴아퀵 겔 추출 키트(QIAQUICK GEL EXTRACTION KIT)™ (퀴아젠)를 사용하여 단리하였다. 모든 라이게이션 반응의 콜로니를 초기에 미니프렙 DNA의 제한 소화에 의해 스크리닝하였다. 선택된 클론의 플라스미드 DNA를 상업적 서열분석 업체 (유로핀스 MWG 오페론(Eurofins MWG Operon), 앨라배마주 헌츠빌)에 의해 서열분석하였다. 서열 데이터를 조립하고, 시퀀처(SEQUENCHER)™ 소프트웨어 (진 코드스 코포레이션(Gene Codes Corp.), 미시간주 앤 아버)를 사용하여 분석하였다. 플라스미드를 구축하고, 제한 효소 소화 및 DNA 서열분석을 통해 확증하였다.
자동화 워크플로우를 통한 아연 핑거 클로닝
아연 핑거 뉴클레아제 벡터의 하위세트를 자동화 DNA 구축 파이프라인을 통해 클로닝하였다. 전체적으로, 자동화 파이프라인은 이전에 기재된 바와 같은 동일한 ZFN 아키텍처를 갖는 벡터 구축을 생성하였다. ZFN의 DNA 결합 특이성을 부여하는 각각의 아연 핑거 단량체를 KPF 아미노산 모티프에서 2-3개의 고유한 서열로 나누었다. ZFN 단편의 5' 및 3' 말단 둘 다는 BsaI 인식 부위 (GGTCTCN) 및 유도된 오버행을 포함시켜 변형시켰다. 오버행은 6-8개의 부분 조립이 단지 목적하는 전장 발현 클론을 생성하도록 분포되었다. 변형된 DNA 단편을 신생 합성하였다 (신테틱 게노믹스 인코포레이티드(Synthetic Genomics Incorporated), 캘리포니아주 라 졸라). 단일 쌍자엽 백본, pDAB118796을 모든 대두 ZFN 구축물에 사용하였다. 그것은 카사바 모자이크 바이러스 프로모터 및 Opaque2 NLS 뿐만 아니라 FokI 도메인 및 아그로박테리움 투메파시엔스로부터의 Orf23 3'UTR을 함유하였다. 바실루스 서브틸리스로부터의 BsaI 플랭킹된 SacB 유전자를 Opaque 2 NLS와 FokI 도메인 사이에 클로닝하였다. 추정 라이게이션 사례를 수크로스 함유 배지 상에 플레이팅하였을 때, SacB 카세트는 벡터 백본 오염을 감소 또는 제거하는 음성 선택제로서 작용하였다. 모든 구축물에서 반복적으로 이용된 제2 부분은 pDAB117443이었다. 이 벡터는 제1 단량체 Fok1 도메인, T2A 스터터 서열 및 제2 단량체 Opaque2 NLS (모두 BsaI 부위가 플랭킹됨)를 함유하였다.
이들 물질을 ZFN DNA 부분 라이브러리로서 사용하여, 프리덤 에보 150(Freedom Evo 150)? (테칸(TECAN), 스위스 마네도르프)은 2D 바코딩된 튜브로부터 75-100ng의 각각의 DNA 플라스미드 또는 합성된 단편을 PCR 플레이트 (써모피셔(ThermoFisher), 매사추세츠주 월섬)로 첨가하는 것을 다루었다. 소 혈청 알부민 단백질 (NEB, 매사추세츠주 입스위치) 및 T4 DNA 리가제 완충제 (NEB, 매사추세츠주 입스위치)로 보충된 BsaI (NEB, 매사추세츠주 입스위치) 및 T4 DNA 리가제 (NEB, 매사추세츠주 입스위치)를 반응에 첨가하였다. 반응을 C1000 터치 써모 사이클러(C1000 Touch Thermo Cycler)? (바이오라드(BioRad), 캘리포니아주 허큘레스)로 37℃에서 3분 동안 및 16℃에서 4분 동안 인큐베이션하면서 사이클링 (25X)하였다. 라이게이션된 물질을 형질전환시키고, 탑10 셀즈(Top10 cells)? (라이프 테크놀로지스(Life Technologies), 캘리포니아주 칼스배드)에서 수동으로 또는 Qpix460 콜로니 픽커 및 랩칩 GX(LabChip GX)? (퍼킨 엘머(Perkin Elmer), 매사추세츠주 월섬)를 사용하여 스크리닝하였다. 정확하게 소화되는 콜로니는 식물 형질전환에 제공되는 것으로 확증된 서열이었다.
범용 공여자 구축물 조립
다수의 표적 유전자좌의 신속한 시험을 지지하기 위해, 신규 가요성 범용 공여자 시스템 서열을 설계하고, 구축하였다. 범용 공여자 폴리뉴클레오티드 서열은 고처리량 벡터 구축 방법론 및 분석과 상용성이었다. 범용 공여자 시스템은 적어도 3개의 모듈 도메인: 가변 ZFN 결합 도메인, 비-가변 분석 및 사용자 정의 특색 도메인, 및 벡터 규모확대를 위한 단순 플라스미드 백본으로 구성되었다. 비-가변 범용 공여자 폴리뉴클레오티드 서열은 모든 공여자에 공통적이었고, 모든 대두 표적 부위에 걸쳐 사용될 수 있는 유한 세트의 검정의 설계를 허용하여, 표적화 평가에서의 균일성을 제공하고 분석 사이클 시간을 감소시킨다. 이들 도메인의 모듈 성질은 고처리량 공여자 조립을 가능하게 하였다. 추가적으로, 범용 공여자 폴리뉴클레오티드 서열은 하류 분석을 단순화하고 결과의 해석을 증진시키는 것을 목표로 하는 다른 고유한 특색을 갖는다. 이는 진단적으로 예측된 크기로의 PCR 산물의 소화를 가능하게 하는 비대칭 제한 부위 서열을 함유하였다. PCR 증폭에서 문제가 될 것으로 예상된 2차 구조를 포함하는 서열을 제거하였다. 범용 공여자 폴리뉴클레오티드 서열은 크기가 작았다 (3.0 Kb 미만). 최종적으로, 범용 공여자 폴리뉴클레오티드 서열은 다량의 시험 DNA가 시기적절한 방식으로 벌크화되도록 하는 고 카피 pUC19 백본 상에 구축하였다.
한 실시양태로서, 범용 공여자 폴리뉴클레오티드 서열을 포함하는 플라스미드 예가 pDAB124280 (서열 7561 및 도 7)로서 제공된다. 추가 실시양태에서, 범용 공여자 폴리뉴클레오티드 서열은 다음과 같이 제공된다: pDAB124281, 서열 7562, 도 8; pDAB121278, 서열 7563, 도 9; pDAB123812, 서열 7564, 도 10; pDAB121937, 서열 7565, 도 11; pDAB123811, 서열 7566, 도 12; 및 pDAB124864, 서열 7567, 도 13. 또 다른 실시양태에서, 기능적 발현 코딩 서열 또는 무기능 (프로모터가 없는) 발현 코딩 서열을 갖는 범용 공여자 폴리뉴클레오티드 서열을 포함하는 추가의 서열이 구축될 수 있다 (표 11).
<표 11> 대두의 게놈 내 공여자 매개 통합을 위한 식물 세포 원형질체 내로 형질전환된 다양한 범용 도메인 서열이 제공된다. 범용 도메인 플라스미드 시스템의 다양한 요소가 기재되고, 수반되는 서열 번호에서 염기 쌍 위치에 의해 확인된다. "N/A"는 적용가능하지 않음을 의미한다.
Figure pct00016
범용 공여자 폴리뉴클레오티드 서열은 플라스미드로서 전달된 작은 2-3 Kb 모듈 공여자 시스템이었다. 이것은 1, 2, 3, 4, 5, 6, 7, 8, 9개 또는 그 초과의 ZFN 결합 부위, 프라이머 설계 또는 코딩 서열을 위한 제한 부위 및 DNA 서열을 보유하는 "DNA X" 또는 "UZI 서열" (서열 7568)로 지칭되는 짧은 100-150 bp 주형 영역, 및 단순 플라스미드 백본을 포함하는 최소 공여자였다 (도 4). 전체 플라스미드는 적절한 ZFN 결합 부위에서 DNA 이중 가닥 파괴 후에 NHEJ를 통해 삽입되고; ZFN 결합 부위는 탠덤 혼입될 수 있다. 범용 공여자 폴리뉴클레오티드 서열의 이 실시양태는 표적 부위 및 ZFN의 신속한 스크리닝에 가장 적합하고, 증폭시키기 어려운 서열은 공여자에서 최소화된다. "UZI" 서열 없이 하나 이상의 ZFN 부위를 보유하는 범용 공여자가 또한 생성되었다.
추가 실시양태에서, 범용 공여자 폴리뉴클레오티드 서열은 적어도 4개의 모듈로 구성되고, ZFN 결합 부위, 상동성 아암, 단지 대략 100 bp 분석 조각 또는 코딩 서열을 갖는 DNA X를 보유하였다. 범용 공여자 폴리뉴클레오티드 서열의 이 실시양태는 여러 ZFN을 사용하여 다양한 표적 부위에서의 HDR 매개 유전자 삽입을 조사하는데 적합하였다 (도 5).
범용 공여자 폴리뉴클레오티드 서열은 2가지 방식의 표적화 공여자 삽입 (NHEJ/HDR)으로, 정의된 DNA 결합 도메인을 갖는 모든 표적화 분자와 함께 사용될 수 있다. 이에 따라, 범용 공여자 폴리뉴클레오티드 서열이 적절한 ZFN 발현 구축물과 공동-전달된 경우에, 공여자 벡터 및 대두 게놈은 특정한 ZFN의 결합에 의해 지시된 하나의 특정 위치에서 절단되었다. 선형화되면, 공여자는 NHEJ 또는 HDR에 의해 게놈 내로 혼입될 수 있다. 이어서, 벡터 설계에서의 상이한 분석 고려사항을 이용하여 표적화 통합의 효율적 전달을 최대화하는 아연 핑거를 결정할 수 있다.
실시예 4: 대두 형질전환 절차
글리신 맥스 재배품종 매버릭 원형질체로의 전달 전에, 각각의 ZFN 구축물에 대한 플라스미드 DNA를 공급업체의 지침에 따라 퓨어 일드 플라스미드 맥시프렙 시스템(PURE YIELD PLASMID MAXIPREP SYSTEM)? (프로메가 코포레이션(Promega Corporation), 위스콘신주 매디슨) 또는 플라스미드 맥시 키트(PLASMID MAXI KIT)? (퀴아젠, 캘리포니아주 발렌시아)를 사용하여 이. 콜라이의 배양물로부터 제조하였다.
원형질체 단리
원형질체를 잎 체외이식편으로부터 생산된 캘러스로부터 유래된 매버릭 현탁 배양물로부터 단리시켰다. 현탁액을 3% (w/v) 수크로스, 0.5 mg/L 2,4-D 및 7 g의 박토 한천 (pH 5.7)을 함유하는 신선한 LS 배지 (Linsmaier and Skoog 1965)에서 7일마다 계대배양하였다. 단리를 위해, 계대배양 7일 후 30 밀리리터의 매버릭 현탁 배양물을 50 ml 원추형 튜브로 옮기고, 3분 동안 200 g로 원심분리하여, 튜브당 약 10 ml의 침강된 세포 부피 (SCV)를 생성하였다. 상청액을 제거하고, MMG 용액 (4 mM MES, 0.6 M 만니톨, 15 mM MgCl2, pH 6.0) 중 효소 용액 (0.3% 펙토리아제 (320952; MP 바이오메디칼스(MP Biomedicals)), 3% 셀룰라제 ("오노주카(Onozuka)" R10™; 야쿠르트 파마슈티칼스(Yakult Pharmaceuticals), 일본) 20 밀리리터를 4 SCV의 현탁 세포마다 첨가하고, 튜브를 파라필름(Parafilm)™으로 랩핑하였다. 튜브를 밤새 (약 16-18시간) 플랫폼 로커 상에 배치하고, 소화된 세포의 분취물을 현미경으로 관찰하여 세포벽의 소화가 충분하였다는 것을 확인하였다.
원형질체 정제
계대배양 7일 후 30 밀리리터의 대두 재배품종 매버릭 현탁 배양물을 50 ml 원추형 원심분리 튜브로 옮기고, 3분 동안 200 g로 원심분리하여, 튜브당 약 10 ml의 침강된 세포 부피 (SCV)를 생성하였다. 세포 펠릿을 건드리지 않으면서 상청액을 제거하였다. MMG 용액 (4 mM MES, 0.6 M 만니톨, 15 mM MgCl2, pH 6.0) 중 효소 용액 (0.3% 펙토리아제 (320952; MP 바이오메디칼스), 3% 셀룰라제 ("오노주카" R10™; 야쿠르트 파마슈티칼스, 일본) 20 밀리리터를 4 SCV의 현탁 세포마다 첨가하고, 튜브를 파라필름™으로 랩핑하였다. 튜브를 밤새 (약 16-18시간) 플랫폼 로커 상에 배치하였다. 다음날 아침, 소화된 세포의 분취물을 현미경으로 관찰하여 세포벽의 소화가 충분하였다는 것을 확인하였다.
원형질체 정제
세포/효소 용액을 100 μM 세포 스트레이너를 통해 천천히 여과하였다. 세포 스트레이너를 10 ml의 W5+ 배지 (1.82 mM MES, 192 mM NaCl, 154 mM CaCl2, 4.7 mM KCl, pH 6.0)로 헹구었다. 여과 단계를 70 μM 스크린을 사용하여 반복하였다. 10 ml의 W5+ 배지를 첨가함으로써 최종 부피를 40 ml로 만들었다. 튜브를 역전시킴으로써 세포를 혼합하였다. 원형질체는 8 ml의 수크로스 쿠션 용액 (500 mM 수크로스, 1 mM CaCl2, 5 mM MES-KOH, pH 6.0) 상에, 그 쿠션 용액을 세포를 함유하는 50 ml 원추형 원심분리 튜브의 하부에 첨가함으로써 천천히 층상화되었다. 튜브를 흔들리는 버킷 로터에서 15분 동안 350 x g로 원심분리하였다. 5 ml 피펫 팁을 사용하여 원형질체 밴드 (약 7-8 ml)를 천천히 제거하였다. 이어서, 원형질체를 50 ml 원추형 튜브로 옮기고, 25 ml의 W5+ 세척액을 첨가하였다. 튜브를 천천히 역전시키고, 10분 동안 200 g로 원심분리하였다. 상청액을 제거하고, 10 ml의 MMG 용액을 첨가하고, 튜브를 천천히 역전시켜 원형질체를 재현탁시켰다. 원형질체 밀도를 혈구계 또는 유동 세포측정기를 사용하여 결정하였다. 전형적으로, 4 PCV의 세포 현탁액은 약 2백만개의 원형질체를 생성하였다.
PEG를 사용한 원형질체의 형질전환
원형질체 농도를 MMG를 사용하여 1.6백만개/ml로 조정하였다. 300 μl의 원형질체 분취물 (약 500,000개의 원형질체)을 2 ml 멸균 튜브 내로 옮겼다. 원형질체를 튜브 내로 옮기는 동안 원형질체 현탁액을 규칙적으로 혼합하였다. 플라스미드 DNA를 실험 설계에 따라 원형질체 분취물에 첨가하였다. 원형질체의 튜브를 함유하는 랙을 각각 1분 동안 3회 천천히 역전시켜 DNA 및 원형질체를 혼합하였다. 원형질체를 실온에서 5분 동안 인큐베이션하였다. 300 마이크로리터의 폴리에틸렌 글리콜 (PEG 4000) 용액 (40% 에틸렌 글리콜 (81240-시그마 알드리치(Sigma Aldrich)), 0.3 M 만니톨, 0.4 M CaCl2)을 원형질체에 첨가하고, 튜브의 랙을 1분 동안 혼합하고, 5분 동안 인큐베이션하고, 인큐베이션 동안 2회 부드럽게 역전시키켰다. 1 밀리리터의 W5+를 천천히 튜브에 첨가하고, 튜브의 랙을 15-20회 역전시켰다. 이어서, 튜브를 5분 동안 350 g로 원심분리하고, 펠릿을 건드리지 않으면서 상청액을 제거하였다. 1 밀리리터의 WI 배지 (4 mM MES, 0.6 M 만니톨, 20 mM KCl, pH 6.0)를 각각의 튜브에 첨가하고, 랙을 부드럽게 역전시켜 펠릿을 재현탁시켰다. 랙을 알루미늄 호일로 덮고, 기울여 놓아 23℃에서 밤새 인큐베이션하였다.
형질전환 빈도 측정 및 원형질체 수거
원형질체 및 형질전환 효율의 정량화는 양자 유동 세포측정기(Quanta Flow Cytometer)™ (베크만-쿨터 인크(Beckman-Coulter Inc))를 사용하여 측정하였다. 형질전환 대략 16-18시간 후, 각각의 반복으로부터 100 μl를 샘플링하고, 96 웰 플레이트에 배치하고, WI 용액을 사용하여 1:1로 희석시켰다. 반복물을 3회 재현탁시키고, 100 μl를 유동 세포측정법을 사용하여 정량화하였다. 분석을 위한 샘플을 제출하기 전에, 샘플을 5분 동안 200 g로 원심분리하고, 상청액을 제거하고, 샘플을 액체 질소에서 급속 동결시켰다. 이어서, 샘플을 분자 분석을 위해 처리할 때까지, -80℃ 동결기에 배치하였다.
ZFN 및 공여자의 형질전환
표 5의 각각의 선택된 게놈 유전자좌에 대해, 대두 원형질체를 녹색 형광 단백질 (gfp) 유전자 발현 대조군, ZFN 단독, 공여자 단독 및 1:10 (중량 기준) 비의 ZFN과 공여자 DNA의 혼합물을 포함하는 구축물로 형질감염시켰다. 0.5백만개의 원형질체의 형질감염을 위한 DNA의 총량은 80 μg이었다. 모든 처리를 3회 반복으로 수행하였다. 사용된 gfp 유전자 발현 대조군은 카사바 베인 모자이크 바이러스 프로모터 - 녹색 형광 단백질 코딩 서열 - 아그로박테리움 투메파시엔스 ORF24 3'UTR 유전자 발현 카세트를 함유하는 pDAB7221 (도 14, 서열 7569)이었다. 형질감염당 총 DNA의 일관된 양을 제공하기 위해, gfp 유전자를 함유하는 연어 정액 또는 플라스미드를 필요한 경우에 충전제로서 사용하였다. 전형적인 표적화 실험에서, 4 μg ZFN을 단독으로 또는 36 μg의 공여자 플라스미드와 함께 형질감염시키고, 적절한 양의 연어 정액 또는 pUC19 플라스미드 DNA를 첨가하여 DNA의 전체 양이 80 μg의 최종 양이 되도록 하였다. 충전제로서 gfp 유전자 발현 플라스미드를 포함시키는 것은 다중 유전자좌에 걸친 형질감염 품질의 평가 및 반복 처리를 가능하게 한다.
실시예 5: 아연 핑거 뉴클레아제를 통한 대두에서의 게놈 유전자좌의 절단
선택 게놈 유전자좌에서의 표적화는 원형질체 기반 신속 표적화 시스템 (RTA)을 사용하여 ZFN 유도된 DNA 절단 및 공여자 삽입에 의해 입증하였다. 각각의 대두 선택 유전자좌에 대해, 최대 6개의 ZFN 설계를 생성하고, 이를 단독으로 또는 범용 공여자 폴리뉴클레오티드와 함께 원형질체 내로 형질전환시켰으며, ZFN 매개 절단 및 삽입을 각각 차세대 서열분석 (NGS) 또는 접합 (인-아웃) PCR을 사용하여 측정하였다.
ZFN 형질감염된 대두 원형질체를 형질감염 24시간 후에 2 ml 에펜도르프(EPPENDORF)™ 튜브에서 1600 rpm으로 원심분리하여 수거하고, 상청액을 완전히 제거하였다. 게놈 DNA를 퀴아젠 식물 DNA 추출 키트(QIAGEN PLANT DNA EXTRACTION KIT)™ (퀴아젠, 캘리포니아주 발렌시아)를 사용하여 원형질체 펠릿으로부터 추출하였다. 단리된 DNA를 50 μL의 물 중에 재현탁시키고, 농도를 나노드롭(NANODROP)? (인비트로젠, 뉴욕주 그랜드 아일랜드)에 의해 결정하였다. DNA의 완전성은 0.8% 아가로스 겔 전기영동 상에 샘플을 전개시킴으로써 추정하였다. 서열분석 (일루미나, 인크., 캘리포니아주 샌디에고)을 위한 앰플리콘을 생성하기 위한 PCR 증폭을 위해 모든 샘플을 정규화하였다 (20-25 ng/μL). 처리된 샘플 및 대조군 샘플로부터의 각각의 시험 ZFN 인식 서열을 포괄하는 영역을 증폭시키기 위한 바코딩된 PCR 프라이머를 설계하고 IDT (아이오와주 코랄빌, HPLC 정제됨)로부터 구입하였다. 최적 증폭 조건을 23.5 μL 반응물 중 0.2 μM의 적절한 바코딩된 프라이머, 아큐프라임 PFX 슈퍼믹스(ACCUPRIME PFX SUPERMIX)™ (인비트로젠, 캘리포니아주 칼스배드) 및 100 ng의 주형 게놈 DNA를 사용하여 구배 PCR에 의해 확인하였다. 사이클링 파라미터는 95℃에서의 초기 변성 (5분), 이어서 변성 (95℃, 15초), 어닐링 (55-72℃, 30초), 연장 (68℃, 1분)의 35회 사이클, 및 최종 연장 (68℃, 7분)이었다. 증폭 산물을 3.5% TAE 아가로스 겔 상에서 분석하고, 각각의 프라이머 조합에 적절한 어닐링 온도를 결정하고, 이를 사용하여 상기 기재된 바와 같은 대조군 및 ZFN 처리된 샘플로부터 앰플리콘을 증폭시켰다. 모든 앰플리콘을 3.5% 아가로스 겔 상에서 정제하고, 물 중에서 용리시키고, 농도를 나노드롭™에 의해 결정하였다. 차세대 서열분석을 위해, ZFN 처리된 및 상응하는 비처리된 대두 원형질체 대조군으로부터의 100 ng의 PCR 앰플리콘을 함께 모으고, 일루미나 차세대 서열분석 (NGS)을 사용하여 서열분석하였다.
각각의 대두 최적 게놈 유전자좌에서의 적절한 ZFN의 절단 활성을 검정하였다. ZFN 절단 부위를 포괄하는 짧은 앰플리콘을 게놈 DNA로부터 증폭시키고, ZFN 처리된 원형질체 및 대조군 원형질체로부터 일루미나 NGS에 적용하였다. ZFN 유도된 절단 또는 DNA 이중 가닥 파괴는 절단 부위에서의 뉴클레오티드의 삽입 또는 결실 (indel)에 의한 세포 NHEJ 복구 경로에 의해 해상하였으며, 따라서 절단 부위에서의 indel의 존재는 ZFN 활성의 척도이고, 이를 NGS에 의해 결정하였다. 표적 특이적 ZFN의 절단 활성은 NGS 분석 소프트웨어 (특허 공개 2012-0173,153, DNA 서열의 데이터 분석)를 사용하여 1백만개의 고품질 서열당 indel을 갖는 서열의 수로 추정하였다. 활성을 대두 선택된 게놈 유전자좌 표적에 대해 관찰하고, 추가로 각각의 ZFN 절단 부위에서 indel의 다양한 발자국을 보여주는 서열 정렬에 의해 확증하였다. 이 데이터는 대두 선택된 게놈 유전자좌가 ZFN에 의한 절단을 잘 받아들였다는 것을 시사한다. 각각의 표적에서의 차등 활성은 그의 염색질 상태 및 절단에 대한 순응성 뿐만 아니라 각각의 ZFN의 발현의 효율을 반영하였다.
실시예 6: 폴리뉴클레오티드 공여자의 통합의 신속 표적화 분석
비-상동 말단 연결 (NHEJ) 매개 공여자 삽입을 통한 대두 선택된 게놈 유전자좌 표적 내의 범용 공여자 폴리뉴클레오티드 서열의 표적화의 검증을 반-처리량 원형질체 기반 신속 시험 분석 방법을 사용하여 수행하였다. 각각의 대두 선택된 게놈 유전자좌 표적에 대해, 주위의 3-6개의 ZFN 설계를 시험하고, 표적화를 차세대 서열분석 방법에 의한 ZFN 매개 절단의 측정 및 접합 인-아웃 PCR에 의한 공여자 삽입의 측정에 의해 평가하였다 (도 6). 두 검정에서 양성인 대두 선택된 게놈 유전자좌를 표적화가능한 유전자좌로서 확인하였다.
ZFN 공여자 삽입 신속 시험 분석
대두 선택된 게놈 유전자좌 표적이 공여자 삽입을 위해 표적화될 수 있는지를 결정하기 위해, ZFN 구축물 및 범용 공여자 폴리뉴클레오티드 구축물을 대두 원형질체로 공동-전달하고, 이를 24시간 동안 인큐베이션한 후에, 분석을 위해 게놈 DNA를 추출하였다. 발현된 ZFN이 대두 선택된 게놈 유전자좌 표적 및 공여자 둘 다에서 표적 결합 부위를 절단할 수 있었다면, 선형화된 공여자는 비-상동 말단 연결 (NHEJ) 경로를 통해 대두 게놈에서의 절단된 표적 부위 내로 삽입되었을 것이다. 대두 선택된 게놈 유전자좌 표적에서의 표적화 통합의 확인은, "인" 프라이머가 천연 최적 게놈 유전자좌에서의 서열을 인식하고, "아웃" 프라이머가 공여자 DNA 내의 서열에 결합하는 "인-아웃" PCR 전략을 기초로 완결하였다. 공여자 DNA가 대두 선택된 게놈 유전자좌 표적에 삽입된 경우에만 PCR 검정이 예상된 크기를 갖는 증폭 산물을 생산하는 방식으로 프라이머를 설계하였다. 인-아웃 PCR 검정을 삽입 접합부의 5'- 및 3'-말단 둘 다에서 수행하였다. 통합된 폴리뉴클레오티드 공여자 서열의 분석에 사용된 프라이머는 표 9에 제공된다.
네스티드 "인-아웃" PCR을 사용하는 표적 유전자좌에서의 ZFN 공여자 삽입
모든 PCR 증폭은 타카라(TAKARA) EX TAQ HS™ 키트 (클론테크, 캘리포니아주 마운틴 뷰)를 사용하여 수행하였다. 제1 인-아웃 PCR을 1X 타카라 EX TAQ HS™ 완충제, 0.2 mM dNTP, 0.2 μM "아웃" 프라이머, 0.05 μM "인" 프라이머 (상기 기재된 범용 공여자 카세트로부터 설계됨), 0.75 단위의 타카라 EX TAQ HS™ 폴리머라제 및 6 ng의 추출된 대두 원형질체 DNA를 함유하는 25 μL의 최종 반응 부피로 수행하였다. 이어서, 반응을 3분 동안 94℃; 12초 동안 98℃, 30초 동안 60℃ 및 1분 동안 72℃의 14회 사이클; 이어서 10분 동안 72℃ 및 4℃에서의 유지로 이루어진 PCR 프로그램을 사용하여 완결하였다. 최종 PCR 산물을 가시화를 위해 1KB 플러스 DNA 래더(1KB PLUS DNA LADDER)™ (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)와 함께 아가로스 겔 상에 전개시켰다.
네스티드 인-아웃 PCR을 1X 타카라 EX TAQ HS™ 완충제, 0.2 mM dNTP, 0.2 μM "아웃" 프라이머 (표 9), 0.1 μM "인" 프라이머 (상기 기재된 범용 공여자 카세트로부터 설계됨, 표 10), 0.75 단위의 타카라 EX TAQ HS™ 폴리머라제 및 1 μL의 제1 PCR 산물을 함유하는 25 μL 최종 반응 부피로 수행하였다. 이어서, 반응을 3분 동안 94℃; 12초 동안 98℃, 30초 동안 60℃ 및 45초 동안 72℃의 30회 사이클; 이어서 10분 동안 72℃ 및 4℃에서의 유지로 이루어진 PCR 프로그램을 사용하여 완결하였다. 최종 PCR 산물을 가시화를 위해 1KB 플러스 DNA 래더™ (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)와 함께 아가로스 겔 상에 전개시켰다.
<표 9> 최적 게놈 유전자좌의 네스티드 인-아웃 PCR 분석을 위한 모든 "아웃" 프라이머의 목록
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
<표 10> 최적 게놈 유전자좌의 네스티드 인-아웃 PCR 분석을 위한 모든 "인" 프라이머의 목록
Figure pct00023
원형질체 표적화 시스템에의 인-아웃 PCR 검정의 배치는, 다량의 플라스미드 DNA가 형질감염에 사용되었고 다량의 DNA가 원형질체 표적화 시스템에 남아 후속적으로 세포 게놈 DNA 함께 추출되기 때문에 특히 도전과제가 되어 왔다. 잔류 플라스미드 DNA는 게놈 DNA의 상대 농도를 희석시키고 검출의 전체 감수성을 감소시킬 수 있으며 또한 비-특이적인 이상 PCR 반응의 유의한 원인이 될 수 있다. ZFN 유도된 NHEJ-기반 공여자 삽입은 전형적으로 정방향 배향 또는 역방향 배향으로 일어난다. 정방향 배향 삽입에 대한 DNA의 인-아웃 PCR 분석은, 아마도 표적에서의 ZFN 결합 부위 주위의 상동성의 공유 영역, 및 증폭 과정 동안 비통합 공여자 DNA의 프라이밍 및 연장을 일으킬 수 있는 공여자로 인해 종종 가양성 밴드를 나타냈다. 가양성은 역방향 배향 삽입 산물에 대해 프로빙하는 분석에서는 나타나지 않았으며, 따라서 모든 표적화 공여자 통합 분석은 RTA에서 역방향 공여자 삽입을 조사하도록 수행하였다. 특이성을 추가로 증가시키고 배경을 감소시키기 위해, 네스티드 PCR 전략을 또한 이용하였다. 네스티드 PCR 전략은 제1 PCR 반응의 제1 증폭 산물 내의 보다 짧은 영역을 증폭시키는 제2 PCR 증폭 반응을 사용하였다. 비대칭 양의 "인" 및 "아웃" 프라이머의 사용은 선택된 게놈 유전자좌에서의 신속 표적화 분석에 대해 접합 PCR을 추가로 최적화하였다.
인-아웃 PCR 분석 결과를 아가로스 겔 상에서 가사화하였다. 표 12의 모든 대두 선택된 게놈 유전자좌에 대해, "ZFN + 공여자 처리"는 5' 및 3' 말단에서 거의 예상된 크기의 밴드를 생산하였다. 대조군 ZFN 또는 공여자 단독 처리는 PCR에서 음성이었으며, 이는 상기 방법이 적어도 32개의 최적 비유전자 대두 게놈 유전자좌의 표적 부위에서의 공여자 통합에 대해 특이적으로 점수화되었다는 것을 시사한다. 모든 처리는 3 내지 6회 반복으로 수행하였고, 다중 반복 (두 말단에서 ≥ 1)에서 예상되는 PCR 산물의 존재를 사용하여 표적화를 확증하였다. NHEJ를 통한 공여자 삽입은 표적 및/또는 공여자 ZFN 부위에서 선형화된 말단의 프로세싱으로 인해 생성되는 보다 낮은 강도의 부산물을 종종 생산한다. 추가로, 일부 ZFN은 일관되게 높은 수준의 공여자 통합을 생산하고 일부 ZFN은 보다 덜 일관된 수준의 공여자 통합을 생산하며 다른 ZFN은 어떠한 통합도 일으키지 않으면서, 상이한 ZFN이 표적화 통합에 대해 상이한 수준의 효율을 나타냈음이 관찰되었다. 전체적으로, 시험된 각각의 대두 선택된 게놈 유전자좌 표적에 대해, 하나 이상의 ZFN에 의해 대두의 대표적인 게놈 유전자좌 표적 내에서 표적화 통합이 입증되었으며, 이는 각각의 이들 유전자좌가 표적화가능하였음을 확증한다. 게다가, 각각의 대두 선택된 게놈 유전자좌 표적은 정밀 유전자 형질전환에 적합하였다. 이들 대두 선택된 게놈 유전자좌 표적의 검증을 다수회 반복하였고, 매번 유사한 결과가 얻어졌으며, 이로써 플라스미드 설계 및 구축물, 원형질체 형질전환, 샘플 프로세싱 및 샘플 분석을 포함하는 검증 방법의 재현성이 확증된다.
결론
공여자 플라스미드, 및 대두 선택된 게놈 유전자좌 표적을 특이적으로 절단하도록 설계된 하나의 ZFN을 대두 원형질체 내로 형질감염시키고, 세포를 24시간 후에 수거하였다. 인-아웃 접합 PCR에 의한 대조군, ZFN 처리된 원형질체 및 ZFN과 공여자 처리된 원형질체로부터 단리된 게놈 DNA의 분석은 ZFN에 의한 게놈 DNA 절단의 결과로서 범용 공여자 폴리뉴클레오티드의 표적화 삽입을 제시하였다 (표 12). 이들 연구는 범용 공여자 폴리뉴클레오티드 시스템이 내인성 부위에서의 표적화를 평가하고 후보 ZFN을 스크리닝하는데 사용될 수 있다는 것을 제시한다. 최종적으로, 원형질체 기반 신속 표적화 분석 및 신규 범용 공여자 폴리뉴클레오티드 서열 시스템은 식물에서의 정밀 게놈 조작 노력을 위해 게놈 표적 및 ZFN을 스크리닝하기 위한 신속한 길을 제공한다. 상기 방법은 DNA 이중 또는 단일 가닥 파괴를 도입하는 임의의 뉴클레아제를 사용한 임의의 관심 시스템 내 게놈 표적에서의 부위 특이적 절단 및 공여자 삽입을 평가하기 위해 확장될 수 있다.
7,018개 초과의 선택된 게놈 유전자좌를 상기 상술된 다양한 기준에 의해 확인하였다. 선택된 게놈 유전자좌를 정의하는데 사용된 10개의 파라미터를 기초로 하는 주성분 분석을 사용하여 선택된 게놈 유전자좌를 클러스터링하였다. 일부 다른 관심 유전자좌에 추가로 대표적인 클러스터가 표적화가능한 것으로 입증되었다.
<표 12> 대두 선택된 게놈 유전자좌 표적 내의 범용 공여자 폴리뉴클레오티드 서열의 통합의 결과를 설명함
Figure pct00024
Figure pct00025
실시예 7: 트랜스진 통합을 위한 최적 비유전자 대두 게놈 유전자좌
유전자 발현 카세트의 부위 특이적 표적화 및 통합을 위한 다중 유전자좌를 선택하기 위해 및 단일 염색체 내 유전자 발현 카세트의 스택을 생성하기 위해 7,018개의 최적 비유전자 대두 게놈 유전자좌로부터 최적 비유전자 대두 게놈 유전자좌의 묶음을 확인하였다. 생성된 3개의 최적 비유전자 대두 게놈 유전자좌의 세트는 "메가 유전자좌"로서 본원에 지칭된다. 하기 기준을 사용하여 최적 비유전자 대두 게놈 유전자좌의 풀을 여과하고 최적 비유전자 대두 게놈 유전자좌의 묶음을 선택하였다:
1) 동일한 염색체 상에서 서로에 대해 근접한 (중심 최적 비유전자 대두 게놈 유전자좌의 500 Kb 이내) 적어도 3개의 최적 비유전자 대두 게놈 유전자좌의 위치;
2) 2 Kb 초과의 길이이고 서로 50 Kb 이내의 최적 비유전자 대두 게놈 유전자좌; 및
3) 중심/중간 최적 비유전자 대두 게놈 유전자좌는 4 Kb 초과의 길이임.
각각의 상기 기재된 기준을 적용하여 최적 비유전자 대두 게놈 유전자좌의 묶음을 선택하였다. 확인된 최적 비유전자 대두 게놈 유전자좌는 표 13에 제시된다.
<표 13> 유전자 발현 카세트로의 표적화를 위해 확인 및 선택된 최적 비유전자 대두 게놈 유전자좌
Figure pct00026
*는 OGL이 2개의 별도의 유전자 발현 카세트에 의해 표적화되기에 충분히 길다는 것을 나타냄.
T-가닥 삽입물의 무작위 통합을 통해 생산된 알려져 있는 트랜스제닉 게놈 사례 (예를 들어, AAD-12 사례 416: 국제 특허 출원 번호 WO2011066384A1에 기재된 바와 같이 대두 염색체 위치, Gm04:46002956..46005750에 위치함)에 대해 500 Kb 이내이고 2 Kb 초과인 2개의 추가의 최적 비유전자 대두 게놈 유전자좌를 또한 표적화 유전자 스택킹을 위해 선택하였다. 선택된 최적 비유전자 대두 게놈 유전자좌는 표 14에 제시된다.
<표 14> 유전자 발현 카세트로의 표적화를 위해 확인 및 선택된 최적 비유전자 대두 게놈 유전자좌
Figure pct00027
유전자 발현 카세트의 부위 특이적 표적화 및 통합을 위한 유전자좌의 묶음을 선택하기 위해 및 유전자 발현 카세트의 스택을 생성하기 위해 7,018개의 최적 비유전자 대두 게놈 유전자좌로부터 최적 비유전자 대두 게놈 유전자좌의 제3 묶음을 확인하였다. 하기 기준을 사용하여 최적 비유전자 대두 게놈 유전자좌의 풀을 여과하고 최적 비유전자 대두 게놈 유전자좌의 묶음을 선택하였다:
1) 3 Kb 초과의 길이의 최적 비유전자 대두 게놈 유전자좌를 확인함;
2) 뿌리 및 싹 조직에서 40 Kb 영역 내의 인접하는 유전자의 평균 발현은 7.46 초과이며, 이는 모든 최적 비유전자 대두 게놈 유전자좌의 47.7% 백분위수임;
3) 재조합 빈도 0.5 - 4, 이는 모든 최적 비유전자 대두 게놈 유전자좌에 대한 평균/중앙값 미만임;
4) 25% 초과의 GC 함량.
각각의 상기 기재된 기준을 적용하여 최적 비유전자 대두 게놈 유전자좌의 묶음을 선택하였다. 확인된 최적 비유전자 대두 게놈 유전자좌는 표 15에 제시된다. 모든 선택된 최적 비유전자 대두 유전자좌를 알려져 있는 대두 QTL에의 근접성에 대해 스크리닝하였다. 3 Kb 초과인 유전자좌는 내인성 서열에서 순차적으로 표적화가능할 수 있다.
<표 15> 유전자 발현 카세트로의 표적화를 위해 확인 및 선택된 최적 비유전자 대두 게놈 유전자좌
Figure pct00028
상기 기재된 기준을 사용하여 선택된 최적 비유전자 대두 게놈 유전자좌는 선택가능한/보고가능한 마커를 함유하는 유전자 발현 구축물을 통합시킴으로써 검증하였다. 이 유전자 발현 카세트를 부위 특이적 뉴클레아제를 사용한 게놈 표적화를 통해 대두 식물 내로 안정하게 통합시켰다. 발현가능한 트랜스진을 함유하는 생산된 표적화 최적 비유전자 대두 게놈 유전자좌를 분석하여 전장 통합된 유전자 발현 카세트를 함유하는 단일 카피 사례를 확인하였다. 최적 비유전자 대두 게놈 유전자좌의 발현 프로파일을 qRT-PCR, 웨스턴 블롯, ELISA, LC-MS MS 및 다른 알려져 있는 RNA 또는 단백질 검출 방법을 통해 다중 식물 세대 (예를 들어, T1 및 T2 세대)에 대해 분석하였다. 추가로, 인접하는 유전자 발현에 대한 최적 비유전자 대두 게놈 유전자좌 내의 트랜스진 발현 카세트 통합의 효과를 검정하였다. 최종적으로, 대두 식물의 농경학적 특성에 대한 최적 비유전자 대두 게놈 유전자좌 내의 트랜스진 발현 카세트 통합의 효과를 검정하였다.
<표 3>
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
Figure pct00065
Figure pct00066
Figure pct00067
Figure pct00068
Figure pct00069
Figure pct00070
Figure pct00071
Figure pct00072
Figure pct00073
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
Figure pct00078
Figure pct00079
Figure pct00080
Figure pct00081
Figure pct00082
Figure pct00083
Figure pct00084
Figure pct00085
Figure pct00086
Figure pct00087
Figure pct00088
Figure pct00089
Figure pct00090
Figure pct00091
Figure pct00092
Figure pct00093
Figure pct00094
Figure pct00095
Figure pct00096
Figure pct00097
Figure pct00098
Figure pct00099
Figure pct00100
Figure pct00101
Figure pct00102
Figure pct00103
Figure pct00104
Figure pct00105
Figure pct00106
Figure pct00107
Figure pct00108
Figure pct00109
Figure pct00110
Figure pct00111
Figure pct00112
Figure pct00113
Figure pct00114
Figure pct00115
Figure pct00116
Figure pct00117
Figure pct00118
Figure pct00119
Figure pct00120
Figure pct00121
Figure pct00122
Figure pct00123
Figure pct00124
Figure pct00125
Figure pct00126
Figure pct00127
Figure pct00128
Figure pct00129
Figure pct00130
Figure pct00131
Figure pct00132
Figure pct00133
Figure pct00134
Figure pct00135
Figure pct00136
Figure pct00137
Figure pct00138
Figure pct00139
Figure pct00140
Figure pct00141
Figure pct00142
Figure pct00143
Figure pct00144
Figure pct00145
Figure pct00146
Figure pct00147
Figure pct00148
Figure pct00149
Figure pct00150
Figure pct00151
Figure pct00152
Figure pct00153
Figure pct00154
Figure pct00155
Figure pct00156
Figure pct00157
Figure pct00158
Figure pct00159
Figure pct00160
Figure pct00161
Figure pct00162
Figure pct00163
Figure pct00164
Figure pct00165
Figure pct00166
Figure pct00167
Figure pct00168
Figure pct00169
Figure pct00170
Figure pct00171
Figure pct00172
Figure pct00173
Figure pct00174
Figure pct00175
Figure pct00176
Figure pct00177
Figure pct00178
Figure pct00179
Figure pct00180
Figure pct00181
Figure pct00182
Figure pct00183
Figure pct00184
Figure pct00185
Figure pct00186
Figure pct00187
Figure pct00188
Figure pct00189
Figure pct00190
Figure pct00191
Figure pct00192
Figure pct00193
Figure pct00194
Figure pct00195
Figure pct00196
Figure pct00197
Figure pct00198
Figure pct00199
Figure pct00200
Figure pct00201
Figure pct00202
Figure pct00203
Figure pct00204
Figure pct00205
Figure pct00206
Figure pct00207
Figure pct00208
Figure pct00209
Figure pct00210
Figure pct00211
Figure pct00212
Figure pct00213
Figure pct00214
Figure pct00215
Figure pct00216
Figure pct00217
Figure pct00218
Figure pct00219
Figure pct00220
Figure pct00221
Figure pct00222
Figure pct00223
Figure pct00224
Figure pct00225
Figure pct00226
Figure pct00227
Figure pct00228
Figure pct00229
Figure pct00230
Figure pct00231
Figure pct00232
Figure pct00233
Figure pct00234
Figure pct00235
Figure pct00236
Figure pct00237
Figure pct00238
Figure pct00239
Figure pct00240
Figure pct00241
Figure pct00242
Figure pct00243
Figure pct00244
Figure pct00245
Figure pct00246
Figure pct00247
Figure pct00248
Figure pct00249
Figure pct00250
Figure pct00251
Figure pct00252
Figure pct00253
Figure pct00254
Figure pct00255

Claims (50)

  1. soy_OGL_1423 (서열 639),
    soy_OGL_1434 (서열 137),
    soy_OGL_4625 (서열 76),
    soy_OGL_6362 (서열 440),
    soy_OGL_308 (서열 43),
    soy_OGL_307 (서열 566),
    soy_OGL_310 (서열 4236),
    soy_OGL_684 (서열 47),
    soy_OGL_682 (서열 2101),
    soy_OGL_685 (서열 48)
    로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90% 서열 동일성을 갖는, 적어도 1 Kb의 핵산 서열, 및
    관심 DNA
    를 포함하는 재조합 서열이며, 여기서 관심 DNA는 상기 비유전자 서열 내로 삽입되어 상기 재조합 서열을 생산하는 것인 재조합 서열.
  2. 제1항에 있어서, 상기 관심 DNA가 아연 핑거 표적 부위에 근접하게 삽입되는 것인 재조합 서열.
  3. 제1항에 있어서, 상기 관심 DNA가 한 쌍의 아연 핑거 표적 부위 사이에 삽입되는 것인 재조합 서열.
  4. 제1항에 있어서, 상기 관심 DNA가 분석 도메인을 포함하는 것인 재조합 서열.
  5. 제1항에 있어서, 상기 관심 DNA가 펩티드를 코딩하지 않는 것인 재조합 서열.
  6. 제1항에 있어서, 상기 관심 DNA가 펩티드를 코딩하는 것인 재조합 서열.
  7. 제1항에 있어서, 상기 관심 DNA가 살곤충제 저항성 유전자, 제초제 내성 유전자, 질소 사용 효율 유전자, 물 사용 효율 유전자, 영양 품질 유전자, DNA 결합 유전자 및 선택 마커 유전자를 포함하는 유전자 발현 카세트를 포함하는 것인 재조합 서열.
  8. 제1항에 있어서, 상기 관심 DNA가 2개 이상의 유전자 발현 카세트를 포함하는 것인 재조합 서열.
  9. 제1항에 있어서, 상기 비유전자 서열 중 2개 이상이 각각 삽입된 관심 DNA를 포함하여 2개 이상의 재조합 서열을 생산하며, 여기서 2개 이상의 재조합 서열은 동일한 염색체 상에 위치하는 것인 재조합 서열.
  10. 제1항에 있어서, 상기 관심 DNA 및/또는 상기 비유전자 서열이 상기 관심 DNA의 상기 비유전자 서열 내로의 삽입 동안에 변형되는 것인 재조합 서열.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 비유전자 대두 게놈 유전자좌가
    soy_OGL_1423 (서열 639),
    soy_OGL_1434 (서열 137),
    soy_OGL_4625 (서열 76),
    soy_OGL_6362 (서열 440),
    soy_OGL_308 (서열 43),
    soy_OGL_307 (서열 566), 및
    soy_OGL_310 (서열 4236)
    으로 이루어진 군으로부터 선택된 서열과 적어도 90% 서열 동일성을 갖는 것인 재조합 서열.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서, 비유전자 대두 게놈 유전자좌가
    soy_OGL_308 (서열 43),
    soy_OGL_307 (서열 566), 및
    soy_OGL_310 (서열 4236)
    으로 이루어진 군으로부터 선택된 서열과 적어도 90% 서열 동일성을 갖는 것인 재조합 서열.
  13. 제1항 내지 제10항 중 어느 한 항의 재조합 서열을 포함하는 대두 식물, 대두 식물 부분 또는 대두 식물 세포.
  14. a. soy_OGL_1423 (서열 639),
    soy_OGL_1434 (서열 137),
    soy_OGL_4625 (서열 76),
    soy_OGL_6362 (서열 440),
    soy_OGL_308 (서열 43),
    soy_OGL_307 (서열 566),
    soy_OGL_310 (서열 4236),
    soy_OGL_684 (서열 47),
    soy_OGL_682 (서열 2101), 및
    soy_OGL_685 (서열 48)
    로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90% 서열 동일성을 갖는 표적 비유전자 대두 게놈 유전자좌를 선택하는 단계;
    b. 상기 표적 비유전자 대두 게놈 유전자좌에 특이적으로 결합하여 그를 절단하는 부위 특이적 뉴클레아제를 선택하는 단계;
    c. 상기 부위 특이적 뉴클레아제를 대두 식물 세포 내로 도입하는 단계;
    d. 관심 DNA를 식물 세포 내로 도입하는 단계;
    e. 관심 DNA를 상기 표적 비유전자 대두 게놈 유전자좌 내로 삽입하는 단계; 및
    f. 상기 비유전자 유전자좌에 표적화된 관심 DNA를 포함하는 트랜스제닉 식물 세포를 선택하는 단계
    를 포함하는, 관심 DNA를 포함하는 트랜스제닉 식물 세포를 제조하는 방법.
  15. 제14항에 있어서, 상기 관심 DNA가 분석 도메인을 포함하는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  16. 제14항에 있어서, 상기 관심 DNA가 펩티드를 코딩하지 않는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  17. 제14항에 있어서, 상기 관심 DNA가 펩티드를 코딩하는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  18. 제14항에 있어서, 상기 관심 DNA가 트랜스진을 포함하는 유전자 발현 카세트를 포함하는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  19. 제14항에 있어서, 상기 관심 DNA가 2개 이상의 유전자 발현 카세트를 포함하는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  20. 제14항에 있어서, 상기 부위 특이적 뉴클레아제가 아연 핑거 뉴클레아제, CRISPR 뉴클레아제, TALEN, 귀소 엔도뉴클레아제 또는 메가뉴클레아제로 이루어진 군으로부터 선택되는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  21. 제14항에 있어서, 상기 관심 DNA가 상동성 지정 복구 통합 방법을 통해 상기 비유전자 유전자좌 내에 통합되는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  22. 제14항에 있어서, 상기 관심 DNA가 비-상동 말단 연결 통합 방법을 통해 상기 비유전자 유전자좌 내에 통합되는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  23. 제14항에 있어서, 상기 관심 DNA 중 2개 이상이 상기 표적 비유전자 대두 게놈 유전자좌 중 2개 이상 내로 삽입되는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  24. 제23항에 있어서, 상기 표적 비유전자 대두 게놈 유전자좌 중 2개 이상이 동일한 염색체 상에 위치하는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  25. 제14항에 있어서, 상기 관심 DNA 및/또는 상기 표적 비유전자 대두 게놈 유전자좌가 상기 관심 DNA의 상기 표적 비유전자 대두 게놈 유전자좌 내로의 삽입 동안에 변형되는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  26. 제14항 내지 제25항 중 어느 한 항에 있어서, 비유전자 대두 게놈 유전자좌가
    soy_OGL_1423 (서열 639),
    soy_OGL_1434 (서열 137),
    soy_OGL_4625 (서열 76),
    soy_OGL_6362 (서열 440),
    soy_OGL_308 (서열 43),
    soy_OGL_307 (서열 566), 및
    soy_OGL_310 (서열 4236)
    으로 이루어진 군으로부터 선택된 서열과 적어도 90% 서열 동일성을 갖는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  27. 제14항 내지 제25항 중 어느 한 항에 있어서, 비유전자 대두 게놈 유전자좌가
    soy_OGL_308 (서열 43),
    soy_OGL_307 (서열 566), 및
    soy_OGL_310 (서열 4236)
    으로 이루어진 군으로부터 선택된 서열과 적어도 90% 서열 동일성을 갖는 것인, 트랜스제닉 식물 세포를 제조하는 방법.
  28. soy_OGL_1423 (서열 639),
    soy_OGL_1434 (서열 137),
    soy_OGL_4625 (서열 76),
    soy_OGL_6362 (서열 440),
    soy_OGL_308 (서열 43),
    soy_OGL_307 (서열 566),
    soy_OGL_310 (서열 4236),
    soy_OGL_684 (서열 47),
    soy_OGL_682 (서열 2101), 및
    soy_OGL_685 (서열 48)
    로 이루어진 군으로부터 선택된 비유전자 서열과 적어도 90% 서열 동일성을 갖는, 적어도 1 Kb의 정제된 비유전자 대두 게놈 유전자좌.
  29. 제28항에 있어서, 관심 DNA를 포함하며, 여기서 상기 관심 DNA는 상기 비유전자 서열 내로 삽입되는 것인 정제된 비유전자 대두 게놈 유전자좌.
  30. 제29항에 있어서, 상기 관심 DNA가 아연 핑거 표적 부위에 근접하게 삽입되는 것인 정제된 비유전자 대두 게놈 유전자좌.
  31. 제29항에 있어서, 상기 관심 DNA가 한 쌍의 아연 핑거 표적 부위 사이에 삽입되는 것인 정제된 비유전자 대두 게놈 유전자좌.
  32. 제29항에 있어서, 상기 관심 DNA가 분석 도메인을 포함하는 것인 정제된 비유전자 대두 게놈 유전자좌.
  33. 제29항에 있어서, 상기 관심 DNA가 펩티드를 코딩하지 않는 것인 정제된 비유전자 대두 게놈 유전자좌.
  34. 제29항에 있어서, 상기 관심 DNA가 펩티드를 코딩하는 것인 정제된 비유전자 대두 게놈 유전자좌.
  35. 제29항에 있어서, 상기 관심 DNA가 살곤충제 저항성 유전자, 제초제 내성 유전자, 질소 사용 효율 유전자, 물 사용 효율 유전자, 영양 품질 유전자, DNA 결합 유전자 및 선택 마커 유전자를 포함하는 유전자 발현 카세트를 포함하는 것인 정제된 비유전자 대두 게놈 유전자좌.
  36. 제29항에 있어서, 상기 관심 DNA가 2개 이상의 유전자 발현 카세트를 포함하는 것인 정제된 비유전자 대두 게놈 유전자좌.
  37. 제29항에 있어서, 상기 비유전자 서열 중 2개 이상이 각각 삽입된 관심 DNA를 포함하여 2개 이상의 재조합 서열을 생산하며, 여기서 2개 이상의 재조합 서열은 동일한 염색체 상에 위치하는 것인 정제된 비유전자 대두 게놈 유전자좌.
  38. 제29항에 있어서, 상기 관심 DNA 및/또는 상기 비유전자 서열이 상기 관심 DNA의 상기 비유전자 서열 내로의 삽입 동안에 변형되는 것인 정제된 비유전자 대두 게놈 유전자좌.
  39. 제29항에 있어서, 상기 관심 DNA가 상동성 지정 복구 또는 비-상동 말단 연결 복구 메카니즘을 통해 삽입되는 것인 정제된 비유전자 대두 게놈 유전자좌.
  40. 재조합 서열을 포함하는 식물이며, 상기 재조합 서열은
    비유전자 서열과 적어도 90% 서열 동일성을 갖는 핵산 서열, 및
    관심 DNA를 포함하며, 여기서 관심 DNA는 상기 비유전자 서열 내로 삽입되는 것인 식물.
  41. 제40항에 있어서, 상기 비유전자 서열이
    soy_OGL_1423 (서열 639),
    soy_OGL_1434 (서열 137),
    soy_OGL_4625 (서열 76),
    soy_OGL_6362 (서열 440),
    soy_OGL_308 (서열 43),
    soy_OGL_307 (서열 566),
    soy_OGL_310 (서열 4236),
    soy_OGL_684 (서열 47),
    soy_OGL_682 (서열 2101), 및
    soy_OGL_685 (서열 48)
    로 이루어진 군으로부터 선택되는 것인 식물.
  42. 제40항에 있어서, 상기 재조합 서열 중 2개 이상을 포함하는 식물.
  43. 제42항에 있어서, 상기 재조합 서열이 동일한 염색체 상에 위치하는 것인 식물.
  44. 제40항에 있어서, 상기 관심 DNA가 아연 핑거 표적 부위에 근접하게 삽입되는 것인 식물.
  45. 제40항에 있어서, 상기 관심 DNA가 한 쌍의 아연 핑거 표적 부위 사이에 삽입되는 것인 식물.
  46. 제40항에 있어서, 상기 관심 DNA가 분석 도메인을 포함하는 것인 식물.
  47. 제40항에 있어서, 상기 관심 DNA가 펩티드를 코딩하지 않는 것인 식물.
  48. 제40항에 있어서, 상기 관심 DNA가 펩티드를 코딩하는 것인 식물.
  49. 제40항에 있어서, 상기 관심 DNA가 살곤충제 저항성 유전자, 제초제 내성 유전자, 질소 사용 효율 유전자, 물 사용 효율 유전자, 영양 품질 유전자, DNA 결합 유전자 및 선택 마커 유전자를 포함하는 유전자 발현 카세트를 포함하는 것인 식물.
  50. 제40항에 있어서, 상기 관심 DNA 및/또는 상기 비유전자 서열이 상기 관심 DNA의 상기 비유전자 서열 내로의 삽입 동안에 변형되는 것인 식물.
KR1020167014637A 2013-11-04 2014-11-03 최적 대두 유전자좌 KR102269374B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361899602P 2013-11-04 2013-11-04
US61/899,602 2013-11-04
PCT/US2014/063739 WO2015066643A1 (en) 2013-11-04 2014-11-03 Optimal soybean loci

Publications (2)

Publication Number Publication Date
KR20160079156A true KR20160079156A (ko) 2016-07-05
KR102269374B1 KR102269374B1 (ko) 2021-06-28

Family

ID=53005275

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167014637A KR102269374B1 (ko) 2013-11-04 2014-11-03 최적 대두 유전자좌

Country Status (19)

Country Link
US (4) US9909131B2 (ko)
EP (2) EP3862434A1 (ko)
JP (2) JP6560205B2 (ko)
KR (1) KR102269374B1 (ko)
CN (1) CN106232821A (ko)
AR (1) AR098300A1 (ko)
AU (3) AU2014341934B2 (ko)
BR (1) BR102014027466B1 (ko)
CA (2) CA2926536C (ko)
CL (5) CL2016001063A1 (ko)
IL (2) IL245304B (ko)
MX (1) MX358066B (ko)
NZ (3) NZ746567A (ko)
RU (1) RU2016120636A (ko)
TW (1) TWI672378B (ko)
UA (1) UA121459C2 (ko)
UY (1) UY35816A (ko)
WO (1) WO2015066643A1 (ko)
ZA (1) ZA201602546B (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8424520B2 (en) 2008-09-23 2013-04-23 Covidien Lp Safe standby mode for ventilator
MX2013010911A (es) 2011-03-23 2015-03-03 Pioneer Hi Bred Int Metodos para producir un locus de rasgo transgenico complejo.
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
EA038924B1 (ru) 2012-05-25 2021-11-10 Те Риджентс Оф Те Юниверсити Оф Калифорния Способы и композиции рнк-специфической модификации днк-мишени и рнк-специфической модуляции транскрипции
KR102531576B1 (ko) 2012-12-06 2023-05-11 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US10093940B2 (en) * 2013-11-04 2018-10-09 Dow Agrosciences Llc Optimal maize loci
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CA2956487A1 (en) 2014-09-12 2016-03-17 E. I. Du Pont De Nemours And Company Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use
CN107250148B (zh) 2014-12-03 2021-04-16 安捷伦科技有限公司 具有化学修饰的指导rna
KR102648489B1 (ko) 2015-04-06 2024-03-15 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna
JP7109784B2 (ja) 2015-10-23 2022-08-01 プレジデント アンド フェローズ オブ ハーバード カレッジ 遺伝子編集のための進化したCas9蛋白質
US20180258438A1 (en) * 2015-11-06 2018-09-13 Pioneer Hi-Bred International, Inc. Generation of complex trait loci in soybean and methods of use
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018071868A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
KR20190127797A (ko) 2017-03-10 2019-11-13 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 시토신에서 구아닌으로의 염기 편집제
CA3057192A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
WO2019023707A1 (en) * 2017-07-28 2019-01-31 Organic Genomics, Inc. METHODS AND AUTOMATED SYSTEMS FOR GENETICALLY IMPROVING GENOMES IN COMPUTER-CONTROLLED ENVIRONMENTS USING RECURRENTLY SEGMENTED NUCLEOTIDE REPLICATIONS
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CA3082251A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. Uses of adenosine base editors
MX2021011426A (es) 2019-03-19 2022-03-11 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleótidos.
IL297761A (en) 2020-05-08 2022-12-01 Broad Inst Inc Methods and compositions for simultaneously editing two helices of a designated double-helix nucleotide sequence
AU2022343300A1 (en) 2021-09-10 2024-04-18 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011066384A1 (en) * 2009-11-24 2011-06-03 Dow Agrosciences Llc Aad-12 event 416, related transgenic soybean lines, and event-specific identification thereof
JP2013534417A (ja) * 2010-06-14 2013-09-05 アイオワ ステート ユニバーシティ リサーチ ファウンデーション,インコーポレーティッド Talエフェクターとfokiの融合タンパク質のヌクレアーゼ活性

Family Cites Families (151)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4693977A (en) 1982-08-23 1987-09-15 Queen's University At Kingston Enzyme immobilization for producing cephalosporin antibiotics
US4536475A (en) 1982-10-05 1985-08-20 Phytogen Plant vector
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
NZ207765A (en) 1983-04-15 1987-03-06 Lubrizol Genetics Inc Plant expression of transferred dna(t-dna)from plasmids associated with agrobacterium sp
US4886937A (en) 1985-05-20 1989-12-12 North Carolina State University Method for transforming pine
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
ES2018274T5 (es) 1986-03-11 1996-12-16 Plant Genetic Systems Nv Celulas vegetales resistentes a los inhibidores de glutamina sintetasa, preparadas por ingenieria genetica.
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
US5422251A (en) 1986-11-26 1995-06-06 Princeton University Triple-stranded nucleic acids
ATE87032T1 (de) 1986-12-05 1993-04-15 Ciba Geigy Ag Verbessertes verfahren zur transformation von pflanzlichen protoplasten.
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
EP0333033A1 (en) 1988-03-09 1989-09-20 Meiji Seika Kaisha Ltd. Glutamine synthesis gene and glutamine synthetase
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
DE3834738A1 (de) 1988-10-12 1990-04-19 Basf Lacke & Farben Verfahren zur herstellung eines mehrschichtigen ueberzuges, waessrige beschichtungszusammensetzungen, wasserverduennbare polyacrylatharze und verfahren zur herstellung von wasserverduennbaren polyacrylatharzen
US5176996A (en) 1988-12-20 1993-01-05 Baylor College Of Medicine Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use
US5302523A (en) 1989-06-21 1994-04-12 Zeneca Limited Transformation of plant cells
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5550318A (en) 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
GB8920519D0 (en) 1989-09-11 1989-10-25 Rhone Poulenc Ltd New compositions of matter
GB9017539D0 (en) 1990-08-10 1990-09-26 Rhone Poulenc Agriculture New compositions of matter
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
JP3209744B2 (ja) 1990-01-22 2001-09-17 デカルブ・ジェネティクス・コーポレーション 結実能力のある遺伝子変換コーン
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
JP2859427B2 (ja) 1990-11-21 1999-02-17 株式会社東芝 超電導コイル装置
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
GB9310203D0 (en) 1993-05-18 1993-06-30 Rhone Poulenc Agriculture Compositions of new matter
GB9101659D0 (en) 1991-01-25 1991-03-06 Rhone Poulenc Agriculture Compositions of matter
GB9101660D0 (en) 1991-01-25 1991-03-06 Rhone Poulenc Agriculture New compositions of matter
GB9115377D0 (en) 1991-07-17 1991-09-04 Rhone Poulenc Agriculture New compositions of matter
GB9115909D0 (en) 1991-07-23 1991-09-04 Nickerson Int Seed Recombinant dna
GB9116834D0 (en) 1991-08-05 1991-09-18 Rhone Poulenc Agriculture Compositions of new matter
US5420032A (en) 1991-12-23 1995-05-30 Universitge Laval Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence
US5334753A (en) 1992-03-12 1994-08-02 Rhone-Poulenc Agriculture Ltd Processes for preparing ortho-substituted benzoic acids
DK39692D0 (da) 1992-03-25 1992-03-25 Danisco Biologisk materiale
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5792632A (en) 1992-05-05 1998-08-11 Institut Pasteur Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
ATE398679T1 (de) 1992-07-07 2008-07-15 Japan Tobacco Inc Verfahren zur transformation einer monokotyledon pflanze
EP0652965A1 (en) 1992-07-27 1995-05-17 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5607914A (en) 1993-01-13 1997-03-04 Pioneer Hi-Bred International, Inc. Synthetic antimicrobial peptides
GB9302071D0 (en) 1993-02-03 1993-03-24 Rhone Poulenc Agriculture Compositions of matter
ES2141559T3 (es) 1993-05-18 2000-03-16 Rhone Poulenc Agriculture Derivados de 2-ciano-1-sulfonamidofenil-1,3-diona y su uso como herbicidas.
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
CA2681922C (en) 1994-01-18 2012-05-15 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US5767373A (en) 1994-06-16 1998-06-16 Novartis Finance Corporation Manipulation of protoporphyrinogen oxidase enzyme activity in eukaryotic organisms
EP2022856B1 (en) 1994-08-20 2011-09-14 Gendaq Limited Improvements in or relating to binding proteins for recognition of DNA
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
US5506195A (en) 1994-11-01 1996-04-09 Zeneca Limited Selective 1,3-cyclohexanedione corn herbicide
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US5994627A (en) 1995-03-31 1999-11-30 Common Wealth Scientific And Industrial Research Organisation Genetic sequences conferring nematode resistance in plants and uses therefor
FR2734842B1 (fr) 1995-06-02 1998-02-27 Rhone Poulenc Agrochimie Sequence adn d'un gene de l'hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant un gene de l'hydroxy-phenyl pyruvate dioxygenase, tolerantes a certains herbicides
US5693512A (en) 1996-03-01 1997-12-02 The Ohio State Research Foundation Method for transforming plant tissue by sonication
HUP9904093A2 (hu) 1996-06-27 2000-04-28 E.I.Dupont De Nemours And Co. p-Hidroxifenilpiruvát-dioxigenázt kódoló növényi gén
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
US7105724B2 (en) 1997-04-04 2006-09-12 Board Of Regents Of University Of Nebraska Methods and materials for making and using transgenic dicamba-degrading organisms
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6245968B1 (en) 1997-11-07 2001-06-12 Aventis Cropscience S.A. Mutated hydroxyphenylpyruvate dioxygenase, DNA sequence and isolation of plants which contain such a gene and which are tolerant to herbicides
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
EP1060261B1 (en) 1998-03-02 2010-05-05 Massachusetts Institute of Technology Poly zinc finger proteins with improved linkers
AUPP249298A0 (en) 1998-03-20 1998-04-23 Ag-Gene Australia Limited Synthetic genes and genetic constructs comprising same I
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
EP1141346A2 (en) 1999-01-14 2001-10-10 Monsanto Co. Soybean transformation method
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
WO2001040798A2 (en) 1999-12-06 2001-06-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
WO2001053480A1 (en) 2000-01-24 2001-07-26 Sangamo Biosciences, Inc. Nucleic acid binding polypeptides characterized by flexible linkers connected nucleic acid binding modules
WO2001059450A2 (en) 2000-02-08 2001-08-16 Sangamo Biosciences, Inc. Cells expressing zinc finger protein for drug discovery
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
WO2001088197A2 (en) 2000-05-16 2001-11-22 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
US20040224385A1 (en) 2001-08-20 2004-11-11 Barbas Carlos F Zinc finger binding domains for cnn
AU2002360986A1 (en) 2001-12-20 2003-07-09 Sungene Gmbh And Co. Kgaa Methods for the transformation of vegetal plastids
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
US8106255B2 (en) 2002-01-23 2012-01-31 Dana Carroll Targeted chromosomal mutagenasis using zinc finger nucleases
AU2003218382B2 (en) 2002-03-21 2007-12-13 Sangamo Therapeutics, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
AU2003298574B2 (en) 2002-09-05 2008-04-24 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
BRPI0409816B8 (pt) 2003-04-29 2022-12-06 Pioneer Hi Bred Int Genes de glifosato-n-acetiltransferase (gat), construtos os compreendendo, célula bacteriana, polipeptídeo tendo atividade de gat, bem como método para a produção de uma planta transgênica resistente ao glifosato e métodos para controlar ervas daninhas em um campo contendo uma safra
WO2005003359A1 (ja) 2003-07-08 2005-01-13 Japan Science And Technology Corporation トランスジェニック生物を作製する方法およびシステム
CA2534296C (en) 2003-08-08 2013-03-26 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
CA2562193A1 (en) 2004-04-08 2005-10-27 Sangamo Biosciences, Inc. Treatment of neuropathic pain with zinc finger proteins
EP1732614B1 (en) 2004-04-08 2008-12-24 Sangamo Biosciences Inc. Compositions for treating neuropathic and neurodegenerative conditions
SI2308977T2 (sl) 2004-04-30 2017-07-31 Dow Agrosciences Llc Novi geni z rezistenco na herbicide
AU2005287278B2 (en) 2004-09-16 2011-08-04 Sangamo Biosciences, Inc. Compositions and methods for protein production
US6992239B2 (en) * 2005-01-31 2006-01-31 Pioneer Hi-Bred International, Inc. Soybean variety 92M61
EP1877583A2 (en) 2005-05-05 2008-01-16 Arizona Board of Regents on behalf of the Unversity of Arizona Sequence enabled reassembly (seer) - a novel method for visualizing specific dna sequences
KR101419729B1 (ko) 2005-07-26 2014-07-17 상가모 바이오사이언스 인코포레이티드 외래 핵산 서열의 표적화된 통합 및 발현
JP4670539B2 (ja) 2005-08-08 2011-04-13 ブラザー工業株式会社 画像読取装置
CA2626262C (en) 2005-10-18 2015-09-08 Homme W. Hellinga Rationally-designed meganucleases with altered sequence specificity and dna-binding affinity
WO2011066360A1 (en) 2009-11-24 2011-06-03 Dow Agrosciences Llc Detection of aad-12 soybean event 416
ES2612119T3 (es) 2005-10-28 2017-05-12 Dow Agrosciences Llc Nuevos genes de resistencia a herbicidas
US7629455B2 (en) 2005-12-07 2009-12-08 Monsanto Technology Llc Zea mays NFB2 promoter
CA2652598A1 (en) 2006-05-17 2007-11-29 Pioneer Hi-Bred International, Inc. Artificial plant minichromosomes
CA2651494C (en) 2006-05-25 2015-09-29 Sangamo Biosciences, Inc. Engineered cleavage half-domains
CN105296527B (zh) 2006-08-11 2020-11-27 陶氏益农公司 锌指核酸酶介导的同源重组
WO2008076290A2 (en) 2006-12-14 2008-06-26 Dow Agrosciences Llc Optimized non-canonical zinc finger proteins
JP2010532159A (ja) 2007-06-07 2010-10-07 アグリカルチャー アンド アグリ−フード カナダ ナノキャリアに基づいたトランスフェクション及び形質導入植物
CA2691440A1 (en) * 2007-06-29 2009-01-08 Pioneer Hi-Bred International, Inc. Methods for altering the genome of a monocot plant cell
CA2937438C (en) 2007-09-27 2020-07-07 Dow Agrosciences Llc Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes
CA2700231C (en) 2007-09-27 2018-09-18 Sangamo Biosciences, Inc. Rapid in vivo identification of biologically active nucleases
CA2701636C (en) 2007-10-05 2019-10-15 Dow Agrosciences Llc Methods for transferring molecular substances into plant cells
AU2008317354B2 (en) 2007-10-25 2014-04-10 Ospedale San Raffaele S.R.L. Methods and compositions for targeted integration
DE102007056956B4 (de) 2007-11-27 2009-10-29 Moosbauer, Peter, Dipl.-Ing.(FH) Schaltung zur Regelung der Stromversorgung eines Verbrauchers und Verfahren zum Betrieb einer Schaltung
WO2009099580A2 (en) * 2008-02-05 2009-08-13 Monsanto Technology, Llc Isolated novel nucleic acid and protein molecules from soy and methods of using those molecules to generate transgenic plants with enhanced agronomic traits
AU2009238629C1 (en) 2008-04-14 2015-04-30 Sangamo Therapeutics, Inc. Linear donor constructs for targeted integration
US8703489B2 (en) 2008-08-22 2014-04-22 Sangamo Biosciences, Inc. Methods and compositions for targeted single-stranded cleavage and targeted integration
WO2010050344A1 (ja) 2008-10-28 2010-05-06 株式会社アドヴィックス 車両の走行制御装置
JP2012511926A (ja) 2008-12-17 2012-05-31 ダウ・アグロサイエンス・エル・エル・シー Zp15遺伝子座内への標的組込み
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US8385662B1 (en) 2009-04-30 2013-02-26 Google Inc. Principal component analysis based seed generation for clustering analysis
KR102262704B1 (ko) 2009-08-11 2021-06-09 상가모 테라퓨틱스, 인코포레이티드 표적화 변형에 대한 동형접합성 유기체
WO2011022469A2 (en) * 2009-08-19 2011-02-24 Dow Agrosciences Llc Aad-1 event das-40278-9, related transgenic corn lines, and event-specific identification thereof
ES2710179T3 (es) 2009-09-07 2019-04-23 Nobel Biocare Services Ag Conjunto de implantación
MY174390A (en) 2009-10-22 2020-04-15 Sangamo Biosciences Inc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis
PL2510096T5 (pl) 2009-12-10 2018-06-29 Regents Of The University Of Minnesota Modyfikacja DNA zależna od efektora TAL
GB201000184D0 (en) 2010-01-07 2010-02-24 Plant Bioscience Ltd Methods and compositions for altering temperature sensing in eukaryotic organisms
JP5874949B2 (ja) * 2010-01-15 2016-03-02 トヨタ自動車株式会社 変異体植物、その製造方法及び遺伝的組換え頻度を上昇させる方法
GEP20176628B (en) 2010-01-22 2017-02-27 Sangamo Biosciences Inc Targeted genomic alteration
BR112012018108A2 (pt) 2010-01-22 2015-10-20 Bayer Ip Gmbh combinações acaricidas e/ou inseticidas de ingredientes ativos
KR101948941B1 (ko) 2010-01-22 2019-04-22 다우 아그로사이언시즈 엘엘씨 식물에서 유전자 표적화를 위한 조작된 랜딩 패드
EP2529027A1 (en) * 2010-01-26 2012-12-05 Pioneer-Hi-Bred International, Inc. Hppd-inhibitor herbicide tolerance
EP2615106B1 (en) 2010-02-08 2018-04-25 Sangamo Therapeutics, Inc. Engineered cleavage half-domains
CA2788850C (en) * 2010-02-09 2019-06-25 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
CA2798988C (en) 2010-05-17 2020-03-10 Sangamo Biosciences, Inc. Tal-effector (tale) dna-binding polypeptides and uses thereof
CN103403022A (zh) 2010-12-21 2013-11-20 纳幕尔杜邦公司 来自玉米的植物基因表达调节序列
CA2823061A1 (en) 2010-12-29 2012-07-05 Dow Agrosciences Llc Data analysis of dna sequences
AU2013217079B2 (en) * 2012-02-08 2018-04-19 Dow Agrosciences Llc Data analysis of DNA sequences
WO2013144663A2 (en) 2012-03-27 2013-10-03 Rudjer Boskovic Institute Method of determination of neutral dna sequences in the genome, system for targeting sequences obtained thereby and methods for use thereof
EA038924B1 (ru) * 2012-05-25 2021-11-10 Те Риджентс Оф Те Юниверсити Оф Калифорния Способы и композиции рнк-специфической модификации днк-мишени и рнк-специфической модуляции транскрипции
US11039586B2 (en) 2013-03-15 2021-06-22 Monsanto Technology Llc Creation and transmission of megaloci
AU2014341925B2 (en) * 2013-11-04 2017-06-29 Corteva Agriscience Llc Optimal soybean loci
US10648951B2 (en) 2017-11-14 2020-05-12 Ge Sensing & Inspection Technologies Gmbh Classification of ultrasonic indications using pattern recognition

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011066384A1 (en) * 2009-11-24 2011-06-03 Dow Agrosciences Llc Aad-12 event 416, related transgenic soybean lines, and event-specific identification thereof
JP2013534417A (ja) * 2010-06-14 2013-09-05 アイオワ ステート ユニバーシティ リサーチ ファウンデーション,インコーポレーティッド Talエフェクターとfokiの融合タンパク質のヌクレアーゼ活性

Also Published As

Publication number Publication date
BR102014027466B1 (pt) 2022-09-27
JP6560205B2 (ja) 2019-08-14
CL2018001339A1 (es) 2018-07-06
EP3066202B1 (en) 2021-03-03
CA2926536C (en) 2024-01-30
JP6738468B2 (ja) 2020-08-12
JP2019193667A (ja) 2019-11-07
TW201518502A (zh) 2015-05-16
AU2020204194B2 (en) 2022-06-02
AU2014341934A1 (en) 2016-04-07
CL2018001338A1 (es) 2018-07-06
AU2020204194A1 (en) 2020-07-16
US9909131B2 (en) 2018-03-06
WO2015066643A1 (en) 2015-05-07
MX358066B (es) 2018-08-03
BR102014027466A8 (pt) 2021-09-14
BR102014027466A2 (pt) 2016-09-20
EP3066202A1 (en) 2016-09-14
EP3862434A1 (en) 2021-08-11
US20180371478A1 (en) 2018-12-27
IL245304B (en) 2021-09-30
UY35816A (es) 2015-05-29
AU2014341934B2 (en) 2017-12-07
AU2018201613A1 (en) 2018-03-29
RU2016120636A (ru) 2017-12-06
CL2016001063A1 (es) 2016-12-09
IL245304A0 (en) 2016-06-30
JP2016534729A (ja) 2016-11-10
CL2018001340A1 (es) 2018-07-06
NZ746567A (en) 2019-09-27
UA121459C2 (uk) 2020-06-10
TWI672378B (zh) 2019-09-21
CN106232821A (zh) 2016-12-14
US20150128308A1 (en) 2015-05-07
US20180142250A1 (en) 2018-05-24
MX2016005877A (es) 2016-10-13
US20210230617A1 (en) 2021-07-29
KR102269374B1 (ko) 2021-06-28
IL285988A (en) 2021-10-31
RU2016120636A3 (ko) 2018-07-05
NZ735257A (en) 2018-09-28
AU2018201613B2 (en) 2020-03-26
CA3226233A1 (en) 2015-05-07
CL2018001223A1 (es) 2018-07-20
US10106804B2 (en) 2018-10-23
CA2926536A1 (en) 2015-05-07
NZ718117A (en) 2017-09-29
US11098316B2 (en) 2021-08-24
AR098300A1 (es) 2016-05-26
ZA201602546B (en) 2018-08-29
EP3066202A4 (en) 2017-08-16

Similar Documents

Publication Publication Date Title
US11149287B2 (en) Optimal soybean loci
US20210230617A1 (en) Optimal soybean loci
US20220162624A1 (en) Optimal maize loci
US11098317B2 (en) Optimal maize loci

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant