KR20040081139A - 가축화된 식물 및 동물에서 폴리뉴클레오타이드 및폴리펩티드 시퀀스의 진화론적으로 유의한 변화를동정하는 방법 - Google Patents

가축화된 식물 및 동물에서 폴리뉴클레오타이드 및폴리펩티드 시퀀스의 진화론적으로 유의한 변화를동정하는 방법 Download PDF

Info

Publication number
KR20040081139A
KR20040081139A KR10-2004-7011241A KR20047011241A KR20040081139A KR 20040081139 A KR20040081139 A KR 20040081139A KR 20047011241 A KR20047011241 A KR 20047011241A KR 20040081139 A KR20040081139 A KR 20040081139A
Authority
KR
South Korea
Prior art keywords
seq
polynucleotide
polypeptide
plant
polynucleotides
Prior art date
Application number
KR10-2004-7011241A
Other languages
English (en)
Inventor
월터메시에
Original Assignee
에보류셔너리 제노믹스 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/079,042 external-priority patent/US7252966B2/en
Application filed by 에보류셔너리 제노믹스 엘엘씨 filed Critical 에보류셔너리 제노믹스 엘엘씨
Publication of KR20040081139A publication Critical patent/KR20040081139A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 가축화된 식물 또는 동물에서 상업적으로 또는 심미적으로 관련있는 특질들과 연관될 수도 있는 폴리뉴클레오타이드 및 폴리펩티드 시퀀스를 동정하는 방법을 제공한다. 이 방법은 가축화된 생물체 및 그의 선조로부터 나온 상동성 유전자들의 비교를 이용하여 진화적으로 의미 있는 변화 및 진화적으로 중성인 변화를 동정한다. 이렇게 동정된 시퀀스들은 가축화된 생물체 또는 그들의 야생 선조들에 있어서 상업적으로 또는 심미적으로 소망되는 특질들을 강화시키는데 유용할 수도 있다.

Description

가축화된 식물 및 동물에서 폴리뉴클레오타이드 및 폴리펩티드 시퀀스의 진화론적으로 유의한 변화를 동정하는 방법{Method to Identify Evolutionary Significant Changes in Polynucleotide and Polypeptide Sequences in Domesticated Plants and Animals}
인간은 상업적 가치 및/또는 심미적 특질을 선택하기 위해 수천년 동안 식물과 동물을 키워왔다. 가축화된 식물들은 산출량, 짧은 개화 일광일, 단백질 및/또는 오일 함량, 추수의 용이성, 맛, 질병저항성 및 내한발성과 같은 특질들에 있어서 그들의 야생 선조들과는 상이하다. 가축화된 동물들은 지방 및/또는 단백질 함량, 우유 생산량, 온순성, 다산력 및 성숙시간과 같은 특성들에 있어서 그들의 야생 선조들과는 상이하다. 현재에 있어서, 상기 차이들의 기본을 이루는 대부분의 유전자는 알려져 있지도 않으며, 중요하게도, 이들 능력을 제공하는 유전자에서 진화되어온 특이적 변화들이 아니다. 가축화된 식물과 동물 및 이들의 야생 선조들 사이의 차이점들의 근거를 이해함으로써 그들의 특성을 유지하고 향상시키기 위한유용한 정보들을 제공할 수 있을 것이다. 곡물 식물의 경우에, 원하는 특성을 제어하는 특정 유전자들의 동정은 이전에는 가능하지 않았던 방식으로 직접적이고 신속한 향상을 가능하게 할 것이다.
비록 가축화된 종들과 그들의 야생 선조들 사이에서 상동 유전자 또는 프로테인의 비교가 보존된 분자 시퀀스 및 기능적 특색에 관하여 유용한 정보들을 제공할 수도 있지만, 이런 접근법은 인간이 강제한 선택압(selection pressure)으로 인하여 변화된 시퀀스의 유전자를 동정하는데 이용하기에는 제한이 따른다. 정교한 알고리즘과 분석학적 방법의 출현으로, 어떤 유전자가 명확하게 선정되었는지에 관해 DNA 시퀀스 변화로부터 더 많은 정보를 뽑아낼 수 있었다. 이들 중에서 가장 강력한 방법인 “KA/KS"는 하기 비율의 정렬된 단백질-코딩 뉴클레오타이드 시퀀스 사이의 일대일(pairwise) 비교를 포함한다:
비동질성 사이트 당 비동질성 뉴클레오타이드 치환 (KA) / 동질성 사이트 당 동질성 뉴클레오타이드 치환 (KS)
(여기서, 비동질성(nonsynonymous)은 인코딩된 아미노산을 변화시키는 치환을 의미하고, 동질성(synonymous)이란 인코딩된 아미노산을 변화시키지 않는 치환을 의미함). “KA/KS-타입 방법”은 상기 및 유사한 방법들을 포함한다.
이들 방법들은, 상동 단백질에서 아미노산 차이로 결과되는, 분자-레벨에서의다윈식(즉 자연적) 양성 선택의 발현을 입증한다. 몇몇 그룹들이 이러한 방법을 사용하여, 특별한 단백질이 중성 치환율보다 더욱 급속하게 진화되었음을 문서화하였으며, 따라서 분자-레벨에서의 다윈식 양성 선택의 존재를 뒷받침한다.
예를 들면, 맥도날드 & 크라이트만 [McDonald and Kreitman (1991) Nature 351: 652-654]은 하나의 로커스(locus, 유전자좌)의 코딩 영역에서 동질성 치환에 대한 아미노산 대체 치환의 수를 비교한 것을 근거로 중성 단백질 진화 가설의 통계학적 테스트를 제안하였다. 그들은 상기 테스트를 3종의Drosophilaspecies의 Adh 로커스에 적용했을 때, 그 로커스는 선택적으로 유리한 변이의 적응성 고정을 이행한다는 것을 대신에 보여준다는 것과, 적응성 변이의 선택적 고정이 대부분의 단백질 진화의 설명으로서 중성 변이의 시계같은 축적에 대해 생존 가능한 대안이라는 것을 결론지었다. 젠킨스 등 [Jenkinset al .(1995) PROC. R. SOC. LOND. B 261 : 203-207]은 맥도날드 & 크라이트만 테스트를 사용하여 적응진화가 시퀀스-제어 전사 (비-코딩 시퀀스)에서 출현하고 있는지를 조사하였다.
나카시마 등 [Nakashimaet al .(1995)Proc. Natl . Acad . Sci USA92: 5606-5609]은 미야타 & 야스나가 (Miyata and Yasunaga)의 방법을 사용하여 2개의 뱀종으로부터 10개의 PLA2 아이소자임 유전자의 뉴클레오타이드 시퀀스의 일대일 비교(pairwise comparison)를 수행하였는데; 이 방법은 인트론(KN) 및 KA와 KS를 포함한 비코딩 영역용 부위에 대해 뉴클레오타이드 치환의 수를 비교하는 것을 포함한다. 그들은 단백질 코딩 영역이 인트론을 포함하는 비코딩 영역에 비해 훨씬 더 높은 비율로 진화되었다고 결론지었다. 상당히 가속된 치환율은, 먹이감을 포획하거나 포식자에 대한 방어에 유리한 강력한 선택을 제공해야만 하는 새로운 생리학적 활동성을 만들기 위해 PLA2 아이소자임의 분자-레벨에서의 다윈식 진화에 책임이 있다. 엔도 등 [Endoet al ., (1996)Mol . Biol . Evol .13 (5):685-690]은, 유전자 상의 자연 선택을 문서화하기 위해 네이 & 고조보리 (Nei and Gojobori)의 방법을 사용하는데, 여기서 dN은 비동질성 치환의 수이고, dS는 동질성 치환의 수이다. 메츠 및 팔룸비 [Metz and Palumbi (1996)Mol . Biol . Evol .13 (2): 397-406] 는 맥도날드 앤 크라이트만 [전게서] 테스트 및 또한 네이 & 고조보리 (Nei and Gojobori), 네이 & 진 (Nei and Jin), 그리고 쿠마르, 타무라 & 네이 (Kumar, Tamura, and Nei)가 공헌한 방법을 사용하였는데; 섬게(sea urchins)의 바인딩 유전자 상의 양성 선택의 증거를 찾아내서 그들이 종 형성 전조(prelude)로서 급속하게 진화하였는지를 조사하기 위하여 Pn 평균 비율, 대체 사이트 당 대체 치환의 수, 그리고 Ps, 사일런트 사이트 당 사일런트 치환을 관찰하였다. 굳윈 등 [Goodwinet al ., (1996)Mol . Biol . Evol .13 (2):346-358]은 유사한 방법을 사용하여 특별한 쥐과 유전자군의 진화를 관찰하고, 그 방법은 실험적으로 교묘히 다룰 수 있는 시스템에서 선택(selection)이 유전적 발산성을 어떻게 유도하는지에 대한 중요한 근본적 인식을 제공한다고 결론내렸다. 에드워드 등 [Edwardset al ., (1995)]은 변질된 프라이머를 사용하여 여러 종의 새 및 하나의 악어종으로부터 MHC 로커스를 뽑아내고, 다음으로 이것을 네이 & 고조보리 (Nei and Gojobori)방법 (dN:dS 비)에 의해 분석하여 MHC연구를 비포유류 척추동물들로 확장하였다. 화이트필드 등 [Whitfieldet al ., (1993)Nature364: 713-715]는 KA/KS분석법을 사용하여 SRY 유전자 (남성의 성별을 결정함)에서 보존 영역을 보호하는 영역에서의 지향성 선택을 탐구하였다. 그들은 SRY의 급속한 진화는, 새로운 종으로 이끄는 생식적 격리의 중요한 요인일 수 있다는 것을 암시하였다. 웨세틴 등 [Wettsetinet al .(1996)Mol . Biol . Evol .13 (1):56-66]은 쿠마르 등 (Kumar, Tamura 및 Nei)의 MEGA 프로그램 및 계통발생론적 분석을 적용하여 다람쥐와 관련 설치동물들에서 MHC 클래서 I 유전자의 다양성을 조사하였다. 파람과 오타 [Parham and Ohta (1996)Science272:67-74]는 개체군 생물학 접근법이, 선택에 대한 테스트 및 유전자 역전 및 중성 드리프트에 대한 테스트를 포함하여, 인간 MHC 클래스 I 다형성의 발생 및 유지를 분석하는데 필요하다고 언급하였다. 휴 [Hughes (1997)Mol . Biol. Evol.14 (1):1-5]는 인간 및 설치류 사이에 100개에 걸친 오르토로거스(orthologous) 면역글로부린 C2 영역들을 비교하였는데, 네이 및 고조보리 (Nei and Gojobori) 방법 (dN:dS비율)을 사용하여 척추동물 면역 시스템에서 발현한 프로테인은 평소와는 달리 급속하게 진화한다는 가설을 테스트하였다. 스완손 및 박퀴어 [Swanson and Vacquier (1998)Science281:710-712]는 dN:dS비율을 사용하여 리신 및 리신용 에그 리셉터 사이의 일치된 진화를 입증하고 새로운 종의 형성 (종형성(speciation))에서 그러한 일치된 진화의 역할을 논의하였다. 메시어 및 스튜어트 [Messier and Stewart (1997)Nature385:151-154]는 KA/KS를 사용하여 영장류 리소자임에서 양성 선택을 입증하였다.
가축화와 연관된 유전성 변화는 옥수수(maize)(maize는 옥수수(corn)의 바람직한 농업적 용어임)에서 가장 광범위하게 조사되었다(Dorweiler (1993)Science262: 232-235). 예를 들면, (Zea maysssp.mays), 소수의 단일-유전자 변화가 현재 가축화된 옥수수 및 이의 야생 선조, 테오신테(Zea mayssspparviglumis) 사이의 모든 차이점들에 대해 외관적으로 산정된다(Dorweiler, 1993). QTL (정량적 특질 로커스, quantitative trait locus) 분석법은 15개 이하의 유전자가 옥수수에서 흥미있는 특질들을 제어한다는 것을 입증하였고(Doebley (1990)PNAS USA87:9888-9892), 옥수수와 테오신테 사이의 형태학에서의 깊은 차이들을 설명한다(Wang (1999) Nature 398: 236-239).
중요하게도, 유사하게 작은 수의 유전자들이 쌀, 밀, 기장 및 사탕수수를 포함하는 다른 초본-유래의 곡물 식물에서 흥미있는 특질들을 제어할 수도 있다 (Paterson (1995)Science269: 1714-1718). 사실, 옥수수에서 이들 관련된 유전자들에 대해서, 상동 유전자는 다른 초본-유래의 곡물 식물들에서 유사한 특질들을 제어할 수도 있다 (Paterson, 1995). 따라서, 하나의 초본-유래의 곡물 식물들에서 이들 유전자들의 동정은 다른 것들 모두에서 상동 유전자의 동정을 용이하게 해준다.
상기 언급된 논문들로부터 알 수 있는 바와 같이, 급속하게 진화한 유전자를 동정하는 분자 진보 측정 방법 (KA/KS-타입 방법)을 적용하여 많은 여러 가지 목적들을 달성할 수 있으며, 가장 보편적으로는 다윈식 분자-레벨 양성 선택의 존재를 확인하였으며, 그러나 또한 다윈식 분자-레벨 양성 선택의 주기를 평가하고, 새로운 종들에 의한 메카니즘을 석명하고, 또는 특정 유전자 다형성에 대해 단일 또는 다중 기원설을 확립한다. 상기 인용된 논문들 및 그 문헌에 있는 다른 것들로부터 분명한 것은 그 저자들 중의 어느 누구도 인공적 선택압에 의해 진행해 온 가축화된 식물 및 동물에 있어서 진화적 변화를 동정하기 위해 KA/KS-타입 방법을 적용해보지 않았다는 것이다. 투르시치 등[Turcichet al ., (1996)Sexual Plant Reproduction9: 65-74]은 식물 유전자 상에 KS분석법의 사용을 기술한 반면에, 가축화된 식물과 동물에서 바라는 상업적 또는 심미적 특질들의 발전, 유지 또는 증강 시에 개발되어 이용될 수 있는 진화적으로 의미있는 시퀀스 변화를 함유하는 그들의 유전자를 동정하기 위한 체계적인 도구로서 KA/KS-타입 분석 방법을 사용한 사람은 없는 것으로 믿어진다.
가축화된 종들에서 동족체 조상 유전자에 비교된 독특한, 강화된 또는 변경된 기능들을 부여하도록 진화된 유전자의 동정은 이들 기능들을 조절하는 약제들을 개발하는데 사용될 수 있다. 근원적인 가축화된 종들의 유전자 및 진화해온 특정 뉴클레오타이드 변화의 동정, 및 이들 진화된 유전자에 의해 인코딩된 단백질에서 물리학적 및 생물학적 변화의 추가적인 특성화는, 원하는 특질들의 기초가 되는 메카니즘에 관한 가치있는 정보를 제공할 수 있다. 상기 가치있는 정보는 목적 단백질의 기능을 더욱 강화시키는 약제를 개발하는데 적용될 수 있다. 또 다르게는, 책임있는 유전자의 추가적인 교묘한 처리는 원하는 특질을 개량 또는 보강할 수 있다. 추가적으로, 동정된 유전자들은 다른 가축화된 식물들에 있어서 관심있는 특질들을 제어하는 역할을 하는 것으로 발견될 수도 있다. 유사한 과정으로 가축화된 동물들에 있어서 관심있는 특질들에 대해 유전자를 동정할 수 있다.
여기서 인용된 모든 참고문헌들은 여기에 그들 전체가 참고로 혼입되어 있다.
본 발명은 가축화된 식물 및 동물에서 상업적으로 또는 심미적으로 관련된 특질들에 대응하는 폴리뉴클레오타이드 및 폴리펩티드 시퀀스를 동정하기 위한 분자 및 진화적 기법 사용에 관한 것이다.
도 1a 및 1b는 EG307에 대한O. sativa cv. Nipponbare 및O. rufipogon(NSGC5953)의 뉴클레오타이드 정렬을 보여준다. 상기 정렬은 5' 말단 상의 미번역 영역 (UTP)을 포함하며 상기 유전자에 대한 출발 및 중지 코돈을 유념한다.
도 2는 EG307에 대한O. sativa cv. Nipponbare 및O. rufipogon(NSGC5953)의 단백질 정렬을 보여준다. 상기 정렬은 완전 코딩 (CDS) 영역을 포함한다.
도 3a 및 3b는 유전자의 코딩 영역에 대한Zea mays maysZea mays parviglumis(테오신테, 계통 Benz967)에서의 EG307의 뉴클레오타이드 시퀀스를 보여준다. 출발 및 중지 코돈이 동정되었다.
도 4는Zea mays maysZea mays parviglumisEG307의 단백질 정렬을 보여준다. 이 정렬은 전체-길이 추론된 단백질 시퀀스를 포함한다.
도 5는 5개의 상이한 유전자 쌀 맵으로 맵핑된 마커 CDO1387 및 RZ672를 보여주며, 이들 마커의 범위가 5개의 맵에서 일관성이 있음을 지적한다. EG307은CD01387 (about 200kb)의 업스트림쪽에 있고 1000 낟알 중량에 대한 QTL은 마커 RZ672과 연관된다.
도 6a 및 6b는 EG117에 대한O. sativa (계통 Nipponbare) 및O. rufipogon(계통 5498)의 뉴클레오타이드 정렬을 보여주며, 3개의 비동질성 변화가 있음을 지적한다.
도 7은 EG117에 대한O. sativa (계통 Nipponbare) 및O. rufipogon(계통 5498)의 딘백질 정렬을 보여준다. 이 정렬은 중지 코돈을 갖는 분획성 CDS 영역을 포함한다.O. sativa O. rufipogon사이의 상이한 3개의 아미노산은 볼드체로 보여진다.
도 8은 EG117에 대한O. sativa(계통 Nipponbare) 및ArabidopsisPTR2-B(히스티딘 수송 단백질, NP_178313)의 단백질 정렬을 보여준다.
본 발명은 가축화된 식물 또는 동물들에서 상업적으로 가치있는 특질들을 제어하는 폴리뉴클레오타이드를 동정하는 방법에 관한 것이다. 본 발명의 방법에 따르면, 상업적으로 가치있는 특질들을 제어하는 것으로 발견된 이들 폴리뉴클레오타이드는 그들 특질들을 더욱 강화시키는데 사용될 수 있다. 내한발성, 내질병성 또는 내스트레스성 또는 산출량, 단백질 함량, 짧은 개화 일광일, 오일 함량, 추수 용이성, 맛 등과 같은 상업적으로 가치있는 특질들을 제어하는 것으로 동정된 폴리뉴클레오타이드는 가축화된 식물의 상업적인 가치를 더욱 강화시키는 조성물과 방법을 개발하는데 사용될 수 있다. 가치있는 특질들을 제어하는 폴리뉴클레오타이드를 동정하는 것이 소망스러운 반면, 식물 및 동물 게놈에 있는 수 만개의 유전자들 중에서 이러한 폴리뉴클레오타이드를 동정하는 것은 모험적인 일이다. 본 발명은, KA/KS비가 전형적으로 1.0이상으로 지시되는, 진화적으로 의미있는 뉴클레오타이드 변화를 함유하는 그들 시퀀스를 선택하기 위하여 가축화된 생물체와 그 조상의 대응하는 폴리뉴클레오타이드 시퀀스를 비교함으로써, 그와 같은 폴리뉴클레오타이드에 대한 검색을 축소시키는 것으로 이루어진다. 예를 들면, KA/KS비가 1.0인 조상-현대 식물 폴리뉴클레오타이드 쌍의 부분집합은 중성 진화에 의해 영향받는 폴리뉴클레오타이드를 함유해야 하는데, 즉 이들은 보존되거나 변화할 것을 압력받지 않았거나 사람이나 자연에 의해 강요받지 않았던 것들이다. 다음으로, 그와 같은 폴리뉴클레오타이드는 내한발성, 내질병성 또는 내스트레스성과 같은 그들 인코딩 특질들에 대해 테스트를 받았는데, 이들 기능들은 가축화에 의해 극적으로 보충되어져 왔고, 이들 폴리뉴클레오타이드에 대한 자연 선택압을 경감시켰기 때문이다. KA/KS비가 1.0보다 큰 조상-현대 식물 폴리뉴클레오타이드 쌍의 부분집합은 선택에 의해 영향을 받은 폴리뉴클레오타이드를 함유해야 한다. 이와 같은 폴리뉴클레오타이드는 다음으로 산출량, 단백질 함량, 짧은 개화 일광일, 오일 함량, 추수 용이성, 맛 등과 같은 그들 인코딩 특질들에 대해 테스트를 받았는데, 이들 기능들은 식량 곡물과 같은 식물들의 가축화 과정에서 인간에 의해 강렬하고 단일방향성이고 끊임없는 선택압을 받아왔기 때문이다.
따라서, 하나의 구현예에 있어서, 본 발명은, 식물과 동물을 포함하여 가축화된 생물체에서 상업적 또는 심미적 특질과 관련되어 있는, 진화적으로 의미있는 변화를 갖는 폴리뉴클레오타이드 및 폴리펩티드 시퀀스를 동정하는 방법을 제공한다. 본 발명은 비교 게놈학(genomics)을 사용하여, 상업적 또는 심미적으로 연관있는 특질들과 같은 구조적, 생화학적 또는 생물리학적 상태들에 연관이 있을 수 있는, 따라서 이들에 책임이 있는 특정 유전자 변화를 동정하며, 그리고 이들 폴리뉴클레오타이드 또는 폴리펩티드 시퀀스로부터 수득된 정보를 사용하여 흥미있는강화된 특질들을 갖는 가축화된 생물체들을 개발한다.
하나의 바람직한 구현예에 있어서, 가축화된 식물 또는 동물의 폴리뉴클레오타이드 또는 폴리펩티드를, 가축화된 종들에는 존재하지만 야생 선조에게는 존재하지 않는 진화적으로 의미있는 변화들로 결과되는 인공 선택에 이행시킨다. 그 폴리뉴클레오타이드 또는 폴리펩티드가 선조들과 비교할 때보다 강화된 곡물 산출량과 관련이 있을 수 있다는 것이 이러한 구현예의 한 예이다. 다른 예들은 짧은 개화 일광일(즉, 일광일이 어떤 임계 길이보다 더 짧아지면 꽃을 피움), 프로테인 함량, 오일 함량, 추수 용이성 및 맛을 포함한다. 따라서, 본 발명은 가축화된 생물체에서 기능 또는 특질들의 근간을 이루는 유전자 및/또는 분자 메카니즘에 대한 통찰력을 획득하는데 유용할 수 있다. 이런 정보는 기능 또는 특질들을 더욱 강화시키도록 폴리뉴클레오타이드를 설계하는데 유용하다. 예를 들면, 향상된 곡물 산출량에 책임이 있다고 결정된 폴리뉴클레오타이드에 랜덤 또는 지향적 돌연변이를 일으키고, 이어서 돌연변이체 유전자를 테스트하여 그 특질이 더욱 강화되었는지를 동정한다.
따라서, 하나의 국면에 있어서, 가축화된 생물체(예, 식물 또는 동물)의 폴리펩티드를 인코딩하는 폴리뉴클레오타이드 시퀀스를 동정하는 방법이 제공되는데, 여기서 폴리펩티드는 가축화된 생물체에서 그 가축화된 생물체의 선조들과 비교하였을 때 독특한, 강화된 또는 변경된 상업적으로 또는 심미적으로 관련있는 특질들과 연관이 있을 수도 있으며, 다음 단계로 이루어져 있다: a) 전술한 가축화된 생물체의 단백질-코딩 뉴클레오타이드 시퀀스를 전술한 야생 선조의 단백질-코딩 뉴클레오타이드 시퀀스와 비교하고; 및 b) 야생 선조에 있는 대응 시퀀스와 비교할 때 뉴클레오타이드 변화를 함유하는 전술한 가축화된 생물체에서의 폴리뉴클레오타이드 시퀀스를 선택함, 여기서 전술한 변화는 진화적으로 의미있는 것임.
본 발명의 또 다른 국면에 있어서, 가축화된 생물체(예, 식물 또는 동물)의 단백질-코딩 뉴클레오타이드 시퀀스에서 진화적으로 의미있는 변화를 동정하는 방법이 제공되는데, 다음 단계로 이루어진다 : a) 가축화된 생물체의 단백질-코딩 뉴클레오타이드 시퀀스를 가축화된 생물체의 야생 선조의 대응하는 시퀀스와 비교하고; 및 b) 야생 선조에 있는 대응 시퀀스와 비교할 때 뉴클레오타이드 변화를 함유하는 전술한 가축화된 생물체에서의 폴리뉴클레오타이드 시퀀스를 선택함, 여기서 전술한 변화는 진화적으로 의미있는 것임.
몇몇 구현예에 있어서, 여기서 기술된 방법들 중 임의의 것에 의해 동정된 뉴클레오타이드 변화는 비동질성 치환이다. 몇몇 구현예에 있어서, 뉴클레오타이드 변화의 진화적인 의미는 뉴클레오타이드 시퀀스의 비동질성 치환률(KA)에 따라서 정해진다. 몇몇 구현예에 있어서, 가축화된 생물체 폴리뉴클레오타이드 및 대응하는 선조 폴리뉴클레오타이드 사이의 KA/KS비를 결정함으로써 평가된다. 몇몇 구현예에 있어서, 바람직하게는 그 비가 적어도 약 0.75, 또는 더욱 바람직하게는 1.0이다. 더 바람직하게는, 그 비는 적어도 약 1.0, 1.25, 1.50, 2.00 또는 그 이상이다.
또 다른 국면에 있어서, 본 발명은 가축화된 생물체에서 관련 특질을 조절할수도 있는 약제를 동정하는 방법을 제공하는데, 전술한 방법은 적어도 하나의 후보 약제를 진화적으로 의미있는 변화를 갖는 폴리뉴클레오타이드 시퀀스를 발현하는 세포, 모델 시스템 또는 이식 식물 또는 동물과 접촉시키는 것으로 이루어지는데, 여기서 그 약제는 그 폴리펩티드의 기능 또는 합성을 조절하는 능력에 의해 동정된다.
가축화된 생물체의 단백질-코딩 뉴클레오타이드 시퀀스 및 야생 선조의 단백질-코딩 시퀀스 사이의 대규모 시퀀스 비교 방법이 제공되는데, 전술한 방법은 다음으로 이루어진다 : a) 가축화된 생물체 시퀀스를 야생 선조의 대응하는 시퀀스와 함께 시퀀스 상동관계에 따라 정렬하고; 및 b) 야생 생물체의 상동 시퀀스와 비교할 때 가축화된 생물체의 시퀀스 내에서의 뉴클레오타이드 변화를 동정함.
또 다른 국면에 있어서, 본 발명은 진화적으로 의미있는 뉴클레오타이드 변화를 가축화된 생물체에서 독특한, 강화된 또는 변경된 상업적으로 또는 심미적으로 연관된 특질에 상호관련시키는 방법을 제공하는데, 전술한 방법은 다음으로 이루어진다 : a) 여기서 기술된 방법에 따라 진화적으로 의미있는 변화를 갖는 뉴클레오타이드 시퀀스를 동정하고; 및 b) 가축화된 생물체 또는 모델 시스템에 있어서 동정된 시퀀스의 존재 또는 부재의 기능적 효과를 분석함.
본 방법에서 사용되는 가축화된 식물은 옥수수, 쌀, 토마토, 감자 또는 그의 선조들이 현존하거나 알려져 있는 임의의 가축화된 식물일 수 있다. 예를 들면, 옥수수의 선조는 테오신테(Z. mays parviglumis)이며; 밀의 선조는Triticum monococcum,T. speltoidesAegilops tauschii이고; 및 쌀의 선조는O.rufipogon이다. 관련 특질은 산출량, 짧은 개화 일광일, 단백질 함량, 오일 함량, 내한발성, 맛, 추수 용이성 또는 질병저항성과 같은 상업적으로 또는 심미적으로 관련된 특질일 수 있다. 바람직한 구현예에 있어서, 가축화된 식물은 쌀이고, 관련 특질은 산출량이다.
본 발명의 또 다른 구현예에 있어서, 선조 생물체에서의 내스트레스성과 연관된 폴리뉴클레오타이드의 동정 방법이 제공된다. 이 구현예에 있어서, 가축화된 생물체에서의 폴리뉴클레오타이드는 내스트레스성과 연관되거나 연관된 것으로 의심받는 선조의 폴리뉴클레오타이드에 비하여 중성 진화에 이행시키며, 이에 의해 돌연변이들이 가축화된 생물체의 폴리뉴클레오타이드에 축적된다. 선조에서의 내스트레스성 특질은 가축화된 생물체에 비해 독특하거나, 강화되거나 또는 변경될 수도 있다.
폴리뉴클레오타이드 시퀀스의 동정 방법은 다음으로 이루어진다 : a) 가축화된 생물체의 폴리펩티드-코딩 뉴클레오타이드 시퀀스를 야생 선조의 폴리펩티드-코딩 뉴클레오타이드 시퀀스와 비교하고; 및 b) 가축화된 생물체에서의 대응하는 시퀀스에 비교하여 적어도 하나의 뉴클레오타이드 변화를 함유하는 선조 생물체에서의 폴리뉴클레오타이드 시퀀스를 선택함, 여기서 그 변화는 진화적으로 중성임. 내스트레스성 특질은 내한발성, 질병저항성, 해충저항성, 고염도 저항성 또는 상업적으로 흥미있는 다른 내스트레스성 특질일 수도 있다.
가축화된 생물체의 야생 선조의 폴리펩티드-코딩 폴리뉴클레오타이드 시퀀스에서의 진화적으로 중성인 변화를 동정하는 방법이 또한 제공되는데, 다음으로 이루어져 있다 : a) 전술한 야생 선조의 폴리펩티드-코딩 폴리뉴클레오타이드 시퀀스를 전술한 가축화된 생물체의 대응하는 시퀀스와 비교하고; 및 b) 야생 선조의 대응하는 시퀀스에 비교하여 뉴클레오타이드 변화를 함유하는 가축화된 생물체에서의 폴리뉴클레오타이드 시퀀스를 선택함, 여기서 그 변화는 진화적으로 중성이고 폴리뉴클레오타이드는 야생 선조에서의 내스트레스성과 연관이 있다.
중성 진화는 전형적으로 약 0.75 내지 1.25 사이, 더욱 바람직하게는 약 0.9 내지 1.1 사이, 가장 바람직하게는 약 1.0의 KA/KS비에 의해 지시된다. KA/KS비교는 선조 생물체 대 가축화된 생물체, 또는 가축화된 생물체 대 선조 생물체로서 계산될 수도 있다.
또 다른 국면에 있어서, 본 발명은 하나의 생물체 (선조 또는 가축화된 생물체)에서의 내스트레스성 특질을 조절할 수도 있는 약제를 동정하는 방법을 제공하는데, 여기서 적어도 하나의 후보 약제를 선조, 가축화된 생물체와 또는 내스트레스성과 연관된 폴리뉴클레오타이드 시퀀스를 발현한 세포 또는 이식 생물체와 접촉시키며, 여기서 그 약제는 폴리뉴클레오타이드에 의해 인코딩된 폴리펩티드의 기능을 조절시키는 그의 능력에 의해 동정된다.
야생 선조의 폴리펩티드-코딩 뉴클레오타이드 시퀀스 및 가축화된 생물체의 것들 사이의 대규모 시퀀스 비교 방법이 또한 제공되는데, 여기서 선조 폴리펩티드는 가축화된 생물체에 비교할 때 야생 선조에서의 독특한, 강화된 또는 변경된 스트레스-관련 특질을 부여하거나 부여하는 것으로 의심받으며, 전술한 방법은 다음으로 이루어진다 : a) 선조 및 가축화된 시퀀스를 상동관계에 따라 정렬하고; 및 b) 선조 상동 시퀀스와 비교할 때 가축화된 생물체 시퀀스에서의 임의의 뉴클레오타이드 변화를 동정함, 여기서 전술한 변화는 진화적으로 중성이다.
또 다른 국면에 있어서, 본 발명은 진화적으로 중성인 뉴클레오타이드 변화를 가축화된 생물체에서 독특한, 강화된 또는 변경된 상업적으로 또는 심미적으로 관련된 특질에 상호관련시키는 방법을 제공하는데, 전술한 방법은 다음으로 이루어진다 : a) 여기서 기술된 방법에 따라 진화적으로 중성인 변화를 갖는 뉴클레오타이드 시퀀스를 동정하고; 및 b) 가축화된 생물체 또는 모델 시스템에 있어서 동정된 시퀀스의 존재 또는 부재의 기능적 효과를 분석함.
하나의 구현예에 있어서, 본 발명은 비교 게놈학을 활용하여 양성 선택된 유전자 및 특이적 유전자 변화를 동정하는데, 이들은 가축화된 생물체 (예. 식물 및 동물)에서 상업적으로 또는 심미적으로 관련있는 특질에 연관되고 따라서 이들에 기여하거나 또는 책임이 있다.
또 다른 구현예에 있어서, 본 발명은 가축화된 생물체의 선조에 있어서 진화적으로 중성인 유전자들과 내스트레스성과 연관된 유전자 변화를 동정한다.
본 발명의 실시는, 다르게 지시되지 않는다면, 분자생물학, 유전학 및 분자 진화학의 전통적인 기법을 이용하며, 이들은 당업계의 기술 내에 있다. 이러한 기법들은 문헌에 완전히 설명되어 있으며, 예를 들면 다음과 같다:"Molecular Cloning: A Laboratory Manual", second edition (Sambrooket al ., 1989); "Oligonucleotide Synthesis" (M. J. Gait, ed., 1984); "Current Protocols inMolecular Biology" (F. M. Ausubelet al ., eds., 1987); "PCR: The Polymerase Chain Reaction", (Mulliset al ., eds., 1994); "Molecular Evolution", (Li, 1997).
I. 정의
여기서 사용된 바처럼, "폴리뉴클레오타이드"는 임의 길이의 뉴클레오타이드의 중합체성 형태, 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드의 어느 하나, 또는 이의 유사체를 지칭한다. 이 용어는 그 분자의 일차 구조를 지칭하며, 따라서 이중- 및 단일-스트랜드 DNA, 뿐만 아니라 이중- 및 단일-스트랜드 RNA을 포함한다. 그것은 메틸화 및/또는 캐핑된 폴리뉴클레오타이드, 개질된 염기를 함유하는 폴리뉴클레오타이드, 백본 개질 등과 같은 개질된 폴리뉴클레오타이드를 또한 포함한다. 용어 “폴리뉴클레오타이드” 및 “뉴클레오타이드 시퀀스”는 상호 교환하여 사용된다.
여기서 사용된 바처럼, “유전자”는 폴리뉴클레오타이드 또는 단백질을 인코딩하는 시퀀스로 된 폴리뉴클레오타이드의 일부를 지칭한다. 당업계에서, 유전자는 비코딩 시퀀스, 예를 들면 5' 및 3' 플랭킹 시퀀스 (예를 들면 프로모터, 인핸서, 리프레서, 및 다른 조절성 시퀀스) 및 또한 인트론을 또한 포함하는 것이 잘 이해되고 있다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 여기서 서로 교환하여 사용되며 임의 길이의 아미노산 중합체를 지칭한다. 이들 용어들은 글리코실화, 아세틸화 및 포스포릴화를 포함하는 반응을 통해 후-번역적으로 개질되는 프로테인을 또한포함한다.
용어 “가축화된 생물체(domesticated organism)”는 개개의 살아있는 생물체 또는 동일한 개체군, 종, 아종, 변종, 품종 또는 계통을 지칭하며, 인공 선택압에 이행되어져 상업적으로 또는 심미적으로 관련있는 특질을 개발한 것이다. 몇몇 바람직한 구현예에 있어서, 가축화된 생물체는 옥수수, 밀, 쌀, 사탕수수, 토마토 또는 감자, 또는 상업적으로 흥미있는 가축화된 식물로 구성된 군에서 선택되는 식물로서, 선조가 알려져 있다. “식물”은 임의 발육 단계에 있는 임의의 식물이며, 특히 종자 식물이다.
하나의 바람직한 구현예에 있어서, 가축화된 생물체는 소, 말, 돼지, 고양이 및 개로 구성된 군에서 선택되는 동물이다. 가축화된 생물체 및 이의 선조는 여러 가지 종, 아종, 변종, 품종 또는 계통 또는 이들의 임의의 조합으로서 관련될 수도 있다.
용어 “야생 선조 (wild ancestor)” 또는 “선조”는 조상 또는 선구 생물체, 종, 아종, 변종, 품종 또는 계통을 의미하며, 이로부터 가축화된 생물체, 종, 아종, 변종, 품종 또는 계통이 진화되었다. 가축화된 생물체는 선조가 하나이거나 하나 이상이다. 전형적으로, 가축화된 식물은 하나 또는 다수의 선조들을 가지고 있는 반면, 가축화된 동물은 대개 단일 선조만을 가지고 있다.
용어 “상업적으로 또는 심미적으로 관련있는 특질(commercially or aesthetically relevant trait)”은 동물과 식물과 같은 가축화된 생물체에 존재하는 특질을 지칭하기 위해 여기서 사용되는데, 이를 분석하면 개량된 생물체의 개발또는 그 특질에 책임이 있는 폴리펩티드를 조절할 수 있는 약제의 개발에 관련된 정보 (예. 물리적 또는 생화학적 데이터)를 제공할 수 있다. 상업적으로 또는 심미적으로 관련있는 특질은 선조에 비해 독특한, 강화된 또는 변경된 것일 수 있다. “변경된 (altered)”이란, 관련있는 특질이 선조에게서 관찰될 수 있는 특질과 정성적으로 또는 정량적으로 차이가 있음을 의미한다.
용어 “KA/KS-타입 방법”이란 상동 유전자에 있어서 비동질성 치환 및 동질성 치환의 개수 사이의 차이 (빈번하게는 비로서 기재됨, 그러나 항상은 아님)를 평가하는 방법(비동질성 및 동질성 사이트를 결정하는 더욱 엄격한 방법들을 포함함) 을 의미한다. 이들 방법들은 여러 가지 명명 시스템을 사용하여 표시되는데, KA/KS, dN/dS, DN/DS를 비제한적으로 포함한다.
용어 “진화적으로 의미있는 변화 (evolutionarily significant change)” 및 “적응성 진화상 변화 (adaptive evolutionary change)”는 두 개의 생물체, 종, 아종, 변종, 품종 및/또는 계통 사이에서 선택압의 이완 또는 양성 선택압 중의 어느 하나에 기인할 수도 있는 하나 이상의 뉴클레오타이드 또는 펩티드 시퀀스 차이를 지칭한다. 진화적으로 의미있는 변화의 존재를 결정하는 하나의 방법은 KA/KS-타입 분석적 방법을 적용하는 것으로, 예를 들면 KA/KS비율을 측정하는 것이다. 전형적으로, 1.0이상의 KA/KS비율은 진화적으로 의미있는 변화로 간주된다.
엄밀히 말하자면, 정확히 1.0의 KA/KS비율은 선택압 이완의 지표이며 (중성진화), 1.0이상의 KA/KS비율은 양성 선택의 지표이다. 그렇지만, GenBank의 EST 및 다른 공용 데이터베이스는 어느 정도의 시퀀싱 에러를 종종 받으며, 심지어 몇몇 부정확한 뉴클레오타이드들이 KA/KS비율에 영향을 끼칠 수 있다는 것은 통상적으로 용인되고 있다. 이런 이유로, 0.75만큼 낮은 KA/KS비율을 갖는 폴리뉴클레오타이드를 조심스럽게 재시퀀싱하고, 선택압의 이완(중성 진화적으로 의미있는 변화), 양성 선택압(양성 진화적으로 의미있는 변화) 또는 음성 선택압(양성 진화적으로 의미있는 변화)에 대해 재평가한다.
용어 “양성 진화적으로 의미있는 변화(positive evolutionarily significant change)”는 특별한 생물체, 종, 아종, 변종, 품종 또는 계통에 있어서, 다른 관련된 생물체에 비교할 때 양성 적응성 변화로 결과되는, 진화적으로 의미있는 변화를 의미한다. 양성 진화적으로 의미있는 변화의 한 예는 곡물 식물에서 향상된 산출량으로 결과되는 변화이다. 상기 진술된 바처럼, 양성 선택은 1.0이상의 KA/KS비율에 의해 지시된다. 더욱 바람직하게는, KA/KS비율은 1.25, 1.5 및 2.0이상이다.
용어 “중성 (neutral) 진화적으로 의미있는 변화”는 가축화된 생물체에서 그의 선조 생물체에 비교하여 출현하고 중성 조건 하에서 발전된 폴리뉴클레오타이드 또는 폴리펩티드 변화를 지칭한다. 중성 진화적으로 의미있는 변화는 약 0.75-1.25사이, 바람직하게는 약 0.9 내지 1.1사이, 더욱 바람직하게는 약 1.0의 KA/KS비율이 증거이다. 또, 중성 진화에 있어서, 추론되는 “방향성(directionality)”은 없다. 유전자는 강제 없이 변화를 자유롭게 축적하며, 그래서 선조 및 가축화된 생물체 둘다는 서로에 관하여 변화하고 있는 중이다.
용어 “내성이 있는(resistant)”은 생물체가, 비-내성 생물체에 비교했을 때, 질병 상태 및/또는 질병의 발전을 피하거나 그 정도를 감소시키는 능력이 있음을 의미한다.
용어 “감수성(susceptibility)”은 생물체가, 내성인 것으로 알려진 생물체에 비교했을 때, 질병 상태 및/또는 질병 상태의 발전을 피하거나 그 정도를 감소시키지 않음을 의미한다.
내성 및 감수성은 개별 개체 마다 변한다는 것, 본 발명을 위해서, 이런 용어들은 하나의 종 내에 있는 개체들의 집단에 또한 적용된다는 것, 그리고 비록 종 내부 비교를 사용할 수도 있지만 일반적으로는 내성 및 감수성의 비교는 이종간의 차이를 전체로서 지칭한다는 것이 이해된다. 야생 친척들의 분류학적 분류는 꽤나 가변적이다. 따라서, 분류학적 분류를 근거로 하는 종의 차이는 만일 분류학적 분류가 변한다면 이종간 차이로 변경될 수도 있다.
용어 “내스트레스성(stress-resistance)은 한발, 질병, 해충 (곤충, 초식동물, 및 미생물을 비제한적으로 포함), 고염분 수준, 및 식물의 항상성을 교란하는 경향이 있고 교정되지 않으면 장애, 질병 또는 죽음까지 도달하게 할 수도 있는 다른 다양한 내부 또는 외부 자극들을 견뎌내는 능력을 지칭한다.
용어 “상동성(homologous)” 또는 “상동체(homologue, 또는 동족체)” 또는 “정형체(ortholog)”는 당업계에 공지이며 잘 이해되어 있고 공통 선조를 공유하고 시퀀스 동일성의 정도를 근거로 결정되는 관련된 시퀀스들을 지칭한다. 이들 용어들은 하나의 종, 아종, 변종, 품종 또는 계통에서 발견되는 유전자 및 다른 종, 아종, 변종, 품종 또는 계통에 있는 대응하는 또는 동등한 유전자 사이의 (친척)관계를 기술한다. 본 발명을 위해서, 상동성 시퀀스들이 비교된다. “상동성 시퀀스” 또는 “정형체”들은 기능적으로 (친척)관계가 있는 것으로 생각되고, 믿어지고, 또는 알려져 있다. 기능적 (친척)관계는 (a) 시퀀스 동일성의 정도; (b) 동일 또는 유사한 생물학적 기능을 비제한적으로 포함하는 다수의 방법들 중의 어떤 하나에서 지적될 수도 있다. 시퀀스 동일성의 정도는 변할 수도 있는데, 그러나 바람직하게는 적어도 50% (당업계에 공지된 표준 시퀀스 정렬 프로그램을 사용할 때), 더욱 바람직하게는 적어도 60%, 더욱 바람직하게는 적어도 75%, 더욱 바람직하게는 적어도 85%이다.
상동관계 (Homology)는 당업계에서 용이하게 입수가능한 소프트웨어 프로그램을 사용하여 정해질 수 있는데, 예를 들면 문헌 [Current Protocols In Molecular Biology(F. M. Ausubelet al ., eds., 1987) Supplement 30, section 7.718, Table 7.71]에서 논의된 것들이다. 바람직한 정렬 프로그램은 맥벡터 [MacVector (Oxford Molecular Ltd, Oxford, U. K.)] 및 얼라인 플러스 [ALIGN Plus (Scientific and Educational Software, Pennsylvania)]이다. 또 다른 바람직한 정렬 프로그램은 시컨처 [Sequencher (Gene Codes, Ann Arbor, Michigan)]이며, 디폴트 프로그램을 사용한다.
용어 “뉴클레오타이드 변화 (nucleotide change)”는 뉴클레오타이드 치환, 제거, 및/또는 삽입을 의미하며, 당업계에 잘 이해된 바와 같다.
"하우스키핑 유전자 (Housekeeping genes)”는 당업계에 주지된 용어이며 성장, 분열, 중지, 대사 및/또는 사망을 포함하나 이들로 한정되지 않는 일반적인 세포 기능과 연관된 유전자들을 의미한다. “하우스키핑” 유전자는 일반적으로 하나 이상의 세포 유형에서 발견되는 기능들을 수행한다. 대조적으로, 세포-특이성 유전자들은 일반적으로 특별한 세포 유형 및/또는 부류에서 기능들을 수행한다.
용어 “약제(agent)”는, 여기서 사용된 바처럼, 폴리뉴클레오타이드 또는 폴리펩티드의 기능을 조절하는 단순한 또는 복잡한 유기 또는 무기 분자, 펩티드, 프로테인, 올리고뉴클레오타이드와 같은 생물학적 또는 화학적 화합물을 의미한다. 광대한 배열의 화합물들이 합성될 수 있는데, 예를 들면 올리고펩티드 또는 올리고뉴클레오타이드와 같은 올리고머, 각종 핵 구조를 근간으로 하는 합성 유기 및 무기 화합물들이 있는데, 이들은 또한 용어 “약제”에 포함된다. 게다가, 각종 자연원들이 스크리닝용 화합물을 제공할 수 있는데, 예를 들면 식물 또는 동물 추출물 등이다. 화합물들은 단독으로 또는 서로 배합하여 테스트될 수 있다.
폴리뉴클레오타이드 또는 폴리펩티드의 “기능을 조절한다(to modulate function)”는 용어는 폴리뉴클레오타이드 또는 폴리펩티드의 기능이 약체를 첨가하지 않을 때와 비교할 때 변경된다는 것을 의미한다. 조절은 기능에 영향을 끼치는 임의의 수준으로 발행할 수도 있다. 폴리뉴클레오타이드 또는 폴리펩티드 기능은 직접적 또는 간접적일 수도 있으며 직접적으로 또는 간접적으로 측정될 수도 있다.
"폴리뉴클레오타이드의 기능(function of a polypeptide)”은 복제; 번역; 발현 패턴(들)을 이들로 한정되지 않고 포함한다. 폴리뉴클레오타이드 기능은 또한 폴리뉴클레오타이드 내에 인코딩된 폴리펩티드와 연관된 기능을 포함한다. 예를 들면, 폴리뉴클레오타이드 상에 작용하며 프로테인 발현, 배좌(conformation), 폴딩 (또는 다른 물리적인 특성들), 다른 부위(예를들면 리간드)에의 바인딩, 활성도 (또는 다른 기능적 특성들), 조정(regulation) 및/또는 프로테인 구조 또는 기능의 다른 양상들에 영향을 끼치는 약제는 조절된 폴리뉴클레오타이드 기능을 가지고 있는 것으로 간주된다.
"폴리펩티드의 기능”은 배좌, 폴딩(또는 다른 물리적인 특성들), 다른 부위(예를 들면 리간드)에의 바인딩, 활성도(또는 다른 기능적 특성들), 및/또는 프로테인 구조 또는 기능의 다른 양상들을 이들로 한정되지 않고 포함한다. 예를 들면, 폴리펩티드 상에 작용하며 배좌, 폴딩(또는 다른 물리적인 특성들), 다른 부위(예를 들면 리간드)에의 바인딩, 활성도(또는 다른 기능적 특성들), 및/또는 프로테인 구조 또는 기능의 다른 양상들에 영향을 끼치는 약제는 조절된 폴리펩티드 기능을 가지고 있는 것으로 간주된다. 효능있는 약제가 작용하여 폴리펩티드의 기능을 조절하는 방식은 1) 배좌, 폴딩 또는 다른 물리적인 특성들을 변화시키는 것; 2) 그의 자연산 리간드에의 바인딩 강도를 변화시키는 것 또는 리간드에의 바인딩 특이성을 변화시키는 것; 및 3) 폴리펩티드의 활성도를 변경시키는 것을 이들로 한정되지 않고 포함한다.
용어 “타겟 사이트(target site)”는 단일 아미노산일 수 있는 및/또는 구조적 및/또는 기능적 반복단위, 예를들면 바인딩 부위, 이량체 영역 또는 촉매적 활성화 부위의 일부일 수 있는 폴리펩티드에 있는 지역을 의미한다. 타겟 사이트는 치료 약제와 같은 약제와 직접 또는 간접 상호작용을 위해 유용할 수도 있다.
용어 “분자 차이(molecular difference)”는 임의의 구조적 및/또는 기능적 차이를 포함한다. 이러한 차이를 검출하는 방법, 또한 이러한 차이의 예들은 여기서 기술된다.
"기능적 효과(functional effect)”는 당업계 주지의 용어이며, 직접 또는 간접적인 임의 수준의 활성도를 나타내는 임의의 효과를 의미한다.
용어 “추수의 용이성(ease of harvest)”이란 소비 또는 다른 상업적 가공을 위해 구조물 또는 부분들 (예를 들면, 과일, 잎, 뿌리)의 수동식 또는 기계화된 채집을 용이하게 해주는 식물 특성 또는 특질을 칭한다.
용어 “산출량(yield)”은 인간에 의해 식량, 치료, 수의학 또는 다른 시장용으로 사용하기 위해 이용가능한 식물 또는 동물 조직 또는 재료의 양을 칭한다.
용어 “향상된 경제적 생산성(enhanced economic productivity)”은 바라는 특색을 향상시키도록 상업적으로 또는 심미적으로 관련있는 특질을 조절하는 능력을 지칭한다. 증가된 산출량 및 향상된 내스트레스성은 향상된 경제적 생산성의 두가지 예이다.
II . 당업계에 공지된 일반 절차
본 발명을 위해, 가축화된 식물 또는 동물 또는 그의 선조들로부터의 폴리뉴클레오타이드 원천은 임의의 적절한 원천, 예를들면 게놈성 시퀀스 또는 cDNA 시퀀스일 수 있다. 바람직하게는, cDNA 시퀀스들을 비교한다. 단백질-코딩 시퀀스는 이용가능한 사설, 공설 및/또는 여기서 기술된 것들과 같은 상업 데이터베이스로부터 수득될 수 있다. 이들 데이터베이스는 진행중인 연구노력에 의해 발생되는 분자적 시퀀스 데이터의 저장고로로 작용한다. 또 다르게는, 단백질-코딩 시퀀스들은, 예를 들면, 세포들 내에 발현된 mRNA로부터 역전사된 cDNA의 시퀀싱으로부터, 또는 PCR증폭 후 수득될 수도 있다. 대안으로서, 인간 시퀀스를 시퀀스 비교를 위해 사용할 수도 있다. 인간 시퀀스는 이용가능한 공설, 사설 및/또는 상업 데이터베이스로부터 또는 인간 DNA 라이버러리로부터 또는 인간 DNA로부터, PCR 후에 수득될 수 있다.
몇몇 구현예에 있어서, cDNA는 정해진 발생 단계에서의 조직, 또는 생물체가 어떤 환경적 상태를 거친 후에 수득된 조직으로부터 수득된 mRNA로부터 제조된다. 본 발명의 시퀀스 비교에 사용되는 cDNA 라이브러리는, 당업계의 문헌에 완전히 설명되어 있는 전통적인 cDNA 라이버러리 구축 기법을 사용하여 구축될 수 있다. 전체 mRNA을 템플레이트로서 사용하여 cDNA를 역전사한다. 전사된 cDNA를 적절한 벡터 내로 서브클론시켜 cDNA 라이버러리를 확립한다. 확립된 cDNA 라이버러리는, 비록 전체-길이 이하의 cDNA가 사용될 수도 있지만, 전체-길이 cDNA 함량에 대해 최대화될 수 있다. 더나가서, 시퀀스 주기는 예를 들어 문헌 [Bonaldoet al .(1996)Genome Research6:791-806]에 따라서 정규화될 수 있다. 구축된 cDNA 라이버러리로부터 랜덤하게 선택된 cDNA 클론들은 표준 자동 시퀀싱 기법을 사용하여시퀀싱될 수 있다. 바람직하게는, 전체-길이 cDNA 클론을 시퀀싱용으로 사용한다. cDNA 라이버러리로부터 나온 cDNA 클론의 전체 또는 대부분을 시퀀싱할 수 있지만, 단일 cDNA 만큼 작게 또는 여러개의 cDNA 클론을 시퀀싱함으로써 본 발명의 몇몇 구현예를 실시하는 것도 가능하다.
본 발명의 하나의 바람직한 구현예에 있어서, 시퀀싱될 cDNA 클론들은 그들의 발현 특이성에 따라 예비선택된다. 특이적으로 발현되는 활성 유전자들에 대응하는 cDNA를 선택하기 위하여, 동일한 동물의 다른 기관, 조직 또는 세포에서 수득된 mRNA를 사용하여 cDNA를 공제성 혼성화에 이행시킨다. 적절한 엄중함 및 집중력이 있는 어떤 혼성화 조건 하에서, 비조직 특이성 mRNA와 혼성화하고 따라서 “하우스키핑” 유전자를 표현할 것 같은 cDNA를 cDNA 풀에서 배제시킬 것이다. 이에 따라, 시퀀싱될 나머지 cDNA는 조직-특이성 기능들과 더 많이 연관되었을 것이다. 공제 혼성화를 위해, 비조직-특이성 mRNA를 하나의 기관에서, 바람직하게는 다른 기관들 및 세포들의 조합으로부터 수득할 수 있다. 비조직-특이성 mRNA의 양을 최대화하여 조직-특이성 cDNA를 포화시킨다.
또 다르게는, 온라인 데이터베이스에서 나온 정보를 사용하여 특이적 기능들에 더 많이 연관되어 있을 cDNA을 선택하거나 우선권을 준다. 예를 들면, 시퀀싱을 위한 조상 cDNA 후보는 후보 가축화된 생물체 cDNA 시퀀스로부터 설계된 프라이머를 사용하는 PCR에 의해 선택될 수 있다. 후보 가축화된 생물체 cDNA 시퀀스는, 예를 들면, 골격근과 같은 특정 조직에서만 발견되는 것들이며, 또는 특이적 기능에서 중요할 것으로 보이는 유전자에 대응한다. 이러한 조직-특이성 cDNA 시퀀스는, cDNA 시퀀스에 대해 발현 프로파일 및/또는 생물학적 활성도에 관한 정보를 상세화할 수도 있는 온라인 시퀀스 데이터베이스를 검색함으로써 수득될 수 있다.
공지된 가축화된 생물체의 유전자에 대한 조상 상동체의 시퀀스는 당업계에 표준인 방법, 예를 들면 PCR 방법(예를 들면, GeneAmp PCR System 9700 thermocyclers (Applied Biosystems, Inc.)를 사용함)을 사용하여 수득될 수도 있다. 예를 들면, 시퀀싱용 조상 cDNA 후보는 후보 가축화된 생물체 cDNA 시퀀스로부터 설계된 프라이머를 사용하는 PCR에 의해 선택될 수 있다. 후보 가축화된 생물체 cDNA 시퀀스는, 예를 들면, 골격근과 같은 특정 조직에서만 발견되는 것들이며, 또는 특이적 기능에서 중요할 것으로 보이는 유전자에 대응한다. PCR에 대해서, 프라이머들은 당업계에서 표준 방법을 사용하여 가축화된 생물체의 시퀀스로부터 만들어질 수 있는데, 공식적으로 입수가능한 PRIMERS(R)(Whitehead Institute)와 같은 프라이머 설계 프로그램을 포함한다. 증폭된 조상 시퀀스는 다음으로 당업계의 표준 방법 및 장치, 예를 들면 자동화된 시퀀서(Applied Biosystems, Inc.)를 사용하여 시퀀싱될 수도 있다. 마찬가지로, 조상 유전자 모사체(mimics)를 사용하여 가축화된 생물체에서 대응하는 유전자를 수득할 수 있다.
III. 가축화된 생물체에서 양성 선택된 폴리뉴클레오타이드의 동정
바람직한 구현예에 있어서, 여기서 기술된 방법들 적용하여 농업적으로 중요한 가축화된 식물에서 흥미있는 특질들을 제어하는 유전자를 동정할 수 있다.
인간은 이들 특질들을 제어하는 유전자에 대한 지식 없이도 수천년 동안 가축화된 식물들을 키워왔다. 개입되는 특정한 유전적 메카니즘에 대한 지식은 분자수준에서 더욱 신속하고 직접적인 간섭을 가능하게 하여 원하는 또는 향상된 특질들을 갖는 식물들을 창출한다.
인간들은, 인공적인 선택을 통해, 곡물 식물들에 강렬한 선택압을 제공해왔다. 이 압력은 가축화된 생물체 및 그들의 야생 선조의 상동성 유전자들 사이의 진화적으로 의미있는 변화에 반영된다. 불과 몇 개의 유전자들만이, 예를 들면 하나의 종에 대해 10-15개가 가축화된 곡물 식물에서 상업적으로 흥미있는 특질들을 제어하는 것으로 밝혀졌다. 이들 몇 개의 유전자들은 식물 분자 생물학의 표준 방법들을 통해서는 동정하는 것이 대단히 어려웠었다. 여기서 기술된 KA/KS및 관련된 분석법은 흥미있는 특질을 제어하는 유전자들을 동정할 수 있다.
흥미있는 임의의 곡물 식물에 대해서, 가축화된 종 또는 아종 및 그의 야생 선조로부터 cDNA 라이버러리를 구축할 수 있다. 1999년 1월 29일 출원된 USSN 09/240,915에서 기술된 바에 따르면, 각각의 cDNA 라이버러리는 서로에 대해서 “블라스트(BLAST)되어” 상동성 폴리뉴클레오타이드를 동정한다. 또 다르게는, 숙련된 기술자는 cDNA 라이버러리를 구축하는 것보다는 상업적으로 또는 공식적으로 이용가능한 게놈 또는 cDNA 데이터베이스에 접근할 수 있다.
다음으로, KA/KS또는 관련된 분석법을 수행하여 선택압 하에 급속하게 진화되어온 선택된 유전자를 동정한다. 다음으로 이들 유전자들은, 그들이 상업적 또는 심미적 흥미가 있는 특질들에서 중요한 역할을 하는지를 결정할 표준 분자 및 이식 식물 방법을 사용하여 평가된다. 그런 다음, 흥미있는 유전자를 예를 들어랜덤 또는 사이트-지향성 돌연변이에 의해 조작하여, 새롭고 향상된 변종, 아종, 계통 또는 품종을 개발한다.
본 발명의 일반 방법은 다음과 같다. 간단하게는, 뉴클레오타이드 시퀀스를 가축화된 생물체 및 야생 선조로부터 수득한다. 가축화된 생물체 및 선조의 뉴클레오타이드 시퀀스를 서로 비교하여 상동성인 시퀀스들을 동정한다. 상동성 시퀀스들을 분석하여 가축화된 생물체 및 선조 사이에서 핵산 시퀀스 차이가 있는 것들을 동정한다. 그런 다음, 분자 진화 분석법을 수행하여 그 차이들의 진화적 의미를 정량 및 정성적으로 평가한다. 양성 선택된 유전자에 대해서는, 외집단 분석법(outgroup analysis)을 수행하여 가축화된 생물체에서(또는 야생 선조에서) 양성 선택되어진 유전자들을 동정할 수 있다. 다음으로, 시퀀스를 분자/유전자 동일성 및 생물학적 기능의 항목으로 특성화한다. 마지막으로, 그 유전자로 인코딩된 폴리펩티드의 생물학적 기능을 조절할 수 있는 약제들을 동정하기 위해 그 정보를 사용할 수 있다.
본 발명의 일반 방법들은 선조 및 가축화된 생물체의 단백질-코딩 뉴클레오타이드 시퀀스들을 비교하는 것을 수반한다. 생물정보학(Bioinformatics)을 그 비교에 적용하고 진화적으로 의미있는 변화(들)인 뉴클레오타이드 변화(들)을 함유하는 시퀀스들을 선택한다. 본 발명은 몇몇 진화적 이점 및 특정한 진화된 변화의 동정을 부여하도록 진화된 유전자의 동정을 가능하게 한다. 바람직한 구현예에 있어서, 가축화된 생물체는Oryza sativa이고 야생 선조는Oryza rufipogon이다. 본 발명의 경우에 있어서, 단백질-코딩 뉴클레오타이드 시퀀스들은O. rufipogon클론으로부터 표준 시퀀싱 기법에 의해 수득되었다.
가축화된 생물체 및 이의 선조의 단백질-코딩 시퀀스를 비교하여 상동성 시퀀스를 동정한다. 상기 비교를 완결하기 위한 적절한 메카니즘은 본 발명에 의해 예측된다. 정렬은 수동으로 또는 소프트웨어 (적절한 정렬 프로그램의 예들은 당업계에 공지임)에 의해 수행될 수도 있다. 바람직하게는, 선조로부터 나온 프로테인-코딩 시퀀스를, 데이터베이스 검색을 통해, 예를 들면 BLAST 검색을 통해 가축화된 종 시퀀스와 비교한다. 고득점 “히트” 즉, 상당한 유사성을 BLAST 분석 후에 보이는 시퀀스들을 검색하여 분석할 것이다. 상당한 유사성을 보이는 시퀀스들은 적어도 약 60%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90% 시퀀스 동일성을 갖는 것들일 수 있다. 바람직하게는, 약 80% 이상의 동일성을 보여주는 시퀀스들을 더욱 분석한다. 데이터베이스 검색을 통해 동정되는 상동성 시퀀스는 당업계에 공지되고 입수가능한 시퀀스 정렬 방법 및 프로그램들을 사용하여 그들 전체를 온전히 정렬할 수 있는데, 예를 들면 보통 사용되는 간단한 정렬 프로그램 클러스탈 브이 [CLUSTAL V, by Higginset al .(1992) CABIOS 8:189-191]을 사용한다.
본 발명은 가축화된 생물체의 폴리펩티드를 인코딩하는 폴리뉴클레오타이드 시퀀스를 동정하는 방법을 제공하는데, 여기서 전술한 폴리펩티드는 전술한 가축화된 생물체의 야생 선조에 비교할 때 전술한 가축화된 생물체에서의 개선된 산출량과 연관이 있거나 있는 것으로 의심을 받고 있으며, 전술한 방법을 다음 단계들을 포함한다 : a) 전술한 가축화된 생물체의 폴리펩티드-코딩 뉴클레오타이드 시퀀스를 전술한 야생 선조의 폴리펩티드-코딩 뉴클레오타이드 시퀀스와 비교하고; 및 b) 야생 선조에 있는 대응 시퀀스에 비교할 때 뉴클레오타이드 변화를 함유하는 가축화된 생물체에서의 폴리뉴클레오타이드 시퀀스를 선택함, 여기서 전술한 변화는 진화적으로 의미있는 것이며, 이에 의해 가축화된 생물체의 폴리뉴클레오타이드 시퀀스는 동정된다. 바람직한 구현예에 있어서, 개선된 산출량과 연관있는 폴리펩티드는 EG307 폴리펩티드이다.
현재의 경우에 있어서, 예를 들면,O. rufipogon로부터 수득된 뉴클레오타이드 시퀀스를 GenBank에서의O. sativa EST들의 검색에서 쿼리(query) 시퀀스로서 사용하여 상동성 시퀀스를 동정하였다. 완전한 단백질-코딩 뉴클레오타이드 시퀀스는 요구되지 않는다는 것을 유념해야 한다. 실제로, 일부분의 cDNA 시퀀스를 비교할 수도 있다. 일단 흥미있는 시퀀스가 아래에 기술된 방법에 의해 동정되면, 추가의 클로닝 및/또는 생물정보학적 방법을 사용하여 흥미있는 유전자 또는 프로테인에 대한 전체 코딩 시퀀스를 수득할 수 있다.
또 다르게는, 가축화된 생물체 및 이의 선조 사이의 단백질-코딩 시퀀스의 시퀀싱 및 상동관계 비교는 새로이 개발된 시퀀싱 칩 기술을 사용하여 동시에 수행될 수도 있다. 예를 들면 문헌 [Ravaet al .US Patent 5,545, 531]을 참조한다.
가축화된 생물체 및 선조의 정렬된 단백질-코딩 시퀀스를 분석하여 특별한 사이트에서의 뉴클레오타이드 시퀀스 차이들을 동정한다. 다시, 상기 분석을 달성하는 적절한 방법은 본 발명에 의해 예측된다. 만일 뉴클레오타이드 시퀀스 차이가 없다면, 선조 단백질 코딩 시퀀스들 대개 더 분석하지 않는다. 검출된 시퀀스변화들이 일반적으로, 그리고 바람직하게는, 정확성을 위해 초기에 체크된다. 바람직하게는, 초기 체크는 하기 단계들 중의 하나 이상을 수행하는 것을 포함하며, 이들은 모두 당업계에 공지되어 있다 : (a) 선조 및 가축화된 생물체 시퀀스 사이에 변화가 있는 경우에느 그 지점들을 찾아내고; (b) 선조 또는 가축화된 생물체에 독특하게 보이는 염기들이 그 호명된 염기에 특이성인 강력하고 명백한 신호들에 대응하는지를 결정하기 위해 시퀀스 크로마토그램 (fluorogram)을 체크하고; (c) 가축화된 생물체 히트를 체크하여 시퀀스 변화에 대응하는 가축화된 생물체 시퀀스가 하나 이상이 있는지를 봄. 선조 시퀀스에서 상이한 뉴클레오타이드가 있는 위치에서 동일한 뉴클레오타이드를 갖는 동일한 유전자에 대해 다중 가축화된 생물체 시퀀스 엔트리는 가축화된 시퀀스가 정확하고 그 변화는 의미가 있다는 독립적인 지원을 제공한다. 데이터베이스 정보 및 유전적 코드를 사용하여 이와 같은 변화를 검사하여, 이들 뉴클레오타이드 시퀀스 변화가 인코딩된 단백질의 아미노산 시퀀스에서의 변화로 결과되었는지를 결정한다. 정의 “뉴클레오타이드 변화”가 명확한 바처럼, 본 발명은, 선조로부터의 대응 시퀀스에 비교될 때, 가축화된 생물체의 단백질-코딩 폴리뉴클레오타이드 시퀀스에 있는, 적어도 하나의 뉴클레오타이드 변화, 치환, 삭제 또는 삽입을 포괄한다. 바람직하게는 그 변화는 뉴클레오타이드 치환이다. 더욱 바람직하게는, 하나 이사의 치환이 동정된 시퀀스에 존재하며 분자 진화 분석되었다.
여러 가지 상이한 분자 진화 분석법 또는 KA/KS-타입 방법 중의 어느 것을이용하여 가축화된 종 유전자 시퀀스 및 대응하는 선조들의 것들 사이에 동정된 뉴클레오타이드 변화의 진화적 유의성을 정성적이고 정량적으로 평가할 수 있다. 문헌 [Kreitman and Akashi (1995)Annu . Rev. Ecol . Syst. 26: 403-422 ; Li,Molecular Evolution, Sinauer Associates, Sunderland, MA, 1997]. 예를 들면, 단백질에의 양성 선택 (즉, 분자-수준의 적응성 진화)는 단백질-코딩 유전자에서 비동질성 사이트에 대한 비동질성 뉴클레오타이드 치환 개수(KA) 대 동질성 사이트에 대한 동질성 뉴클레오타이드 치환 개수(KS) 의 비율을 일대일 비교함으로써 검출될 수 있다 (Liet al ., 1985 ; Li, 1993). KA및 KS의 모든 비교법을 사용할 수 있지만, 이들 두 변수들을 비율로 비교하는 것이 특히 편리하고 가장 효과적이다. 표준 통계학적 방법을 사용하여 KA및 KS사이에 통계적으로 의미있는 차이를 나타냄으로써 시퀀스들을 동정한다.
본 발명의 경우에 있어서,O. rufipogonO. sativa에서나온 상동성 시퀀스들을 동정하였다. GenBank에서O. rufipogon클론, PBI0307H9, SEQ ID NO:31, andO. sativa의 시퀀스들의 비교는 높은 KA/KS비율을 나타내었다. 더나가서, 온전한 유전자, 즉 EG307을 수득하기 위해, 여러 가지 상이한 계통의O. sativa의 클로닝 및 PCR을 완결하여, 온전한 유전자 시퀀스를 KA/KS분석할 수 있었다. 이들 절차들은 실시예 10에 상술되어 있다.O. rufipogon, SEQ ID NO:28, 및O. sativa cv. Nipponbare 1, SEQ ID NO:25에 있는 EG307의 완전한 시퀀스들은 도 1에 보여진다. 대응하는 단백질 시퀀스, SEQ ID NO:30, 및 SEQ ID NO:27 들은 도 2에 보여진다. KA/KS비율의 요약은 실시예 11의 표 1에 보여진다. 몇몇 계통들은O. rufipogon및 가축 계통 사이의 교차-교배로 인해O. rufipogon에 더욱 유사하였다. 몇몇 계통들에 대해 높은 KA/KS비율은 진화적으로 의미있는 변화를 지적한다.
바람직하게는, 리 등 (Liet al .)에 의한 KA/KS분석 컴퓨터 프로그램을 사용하여 본 발명을 수행하지만, 종들 사이에서 양성 선택된 유전자를 검출할 수 있는 다른 분석 프로그램을 또한 사용할 수 있다. [Liet al .(1985)Mol . Biol . Evol.2:150-174; Li (1993); 또한 다음을 참조한다.J. Mol . Evol .36:96-99; Messier and Stewart (1997)Nature385:151-154; Nei (1987)Molecular Evolutionary Genetics(New York, Columbia University Press)]. KA/KS방법은, 유전자의 상동성 프로테인-코딩 영역들 사이에 비동질성 사이트에 대한 비동질성 치환의 속도를 동질성 사이트에 대한 동질성 치환의 속도와 비율의 항목으로 비교하는 것으로 이루어지는데, 이를 사용하여 진화 도중에 적응성 선택에 의해 또는 중성 선택에 의해 유도될 수도 있는 시퀀스 치환을 동정한다. 동질성 (“사일런트”) 치환은, 유전자 코드의 쇠퇴로 인해, 코딩된 아미노산 시퀀스에 아무런 변화도 만들지 않은 것이며; 비동질성 치환은 아미노산 대체로 결과된다. 각 유형의 변화의 정도는 각각 비동질성 사이트에 대한 비동질성 치환의 수 및 동질성 사이트에 대한 동질성 치환의 수인 KA및 KS로서 예측된다. KA/KS의 계산은 수동으로 또는소프트웨어를 사용하여 수행될 수도 있다. 적절한 프로그램의 예는 메가 [MEGA (Molecular Genetics Institute, Pennsylvania State University)]이다.
KA및 KS를 예측하기 위하여, 완전하거나 부분적인 단백질-코딩 시퀀스를 사용하여 동질성 및 비동질성 치환 및 아울러 비동질성 및 동질성 사이트의 총수를 계산한다. 분석된 폴리뉴클레오타이드의 길이는 임의의 적절한 길이일 수 있다. 바람직하게는, 어떠한 그리고 모든 의미있는 변화를 결정하기 위하여, 온전한 코딩 시퀀스를 비교한다. 모든 일대일 비교에 대한 KA및 KS값을 계산하기 위하여, 공식적으로 이용가능한 컴퓨터 프로그램, 예를 들면 Li93 [Li (1993)J. Mol . Evol .36: 96-99] 또는 INA를 사용할 수 있다. 상기 분석을 더욱 순응시켜서 소수의 중요한 변화가 전체 시퀀스에 의해 마스크되지 않도록 “슬라이딩 윈도우 (sliding window)” 패션으로 시퀀스를 검사할 수 있다. “슬라이딩 윈도우”는 유전자의 연속적이고 중복된 치환들의 검사를 지칭한다 (치환은 임의의 길이일 수 있다).
예를 들어 동정된 유전자 EG307의 슬라이딩 윈도우 KA/KS분석은,O. rufipogon와 비교할 때O. sativa계통들의 많은 것들에 있어서 EG307의 5'-말단에 다수의 비동질성 변화들이 있음을 보여주었다. 그 유전자의 3'-말단은 모든 계통들에 있어서 낮은 비율을 가졌다. 이들 절차 및 결과는 실시예 1 및 표 2-7에 상술되어 있다.
비동질성 및 동질성 치환 속도의 비교는 KA/KS비율에 의해 표현된다. KA/KS은 연구중인 시퀀스에서 적응성 진화가 작동하고 있었던 정도를 반영하는 것으로보여졌다. 코딩 시퀀스의 전체 길이 또는 부분적인 세그먼트를 KA/KS분석을 위해 사용할 수 있다. KA/KS비율이 높을수록, 시퀀스가 적응성 진화를 더 많이 이행하고 비동질성 치환들이 진화적으로 의미있는 것으로 보인다. 예를 들어 문헌 [Messier and Stewart (1997)]을 참조한다.
바람직하게는, KA/KS비율은 적어도 약 0.75, 더욱 바람직하게는 적어도 약 1.0, 더욱 바람직하게는 적어도 약 1.25, 더욱 바람직하게는 적어도 약 1. 50, 또는 더욱 바람직하게는 적어도 약 2.00이다. 바람직하게는, 모든 상승된 KA/KS비율에 대해서 통계학적 분석을 수행하였는데, 표준 방법 [예를 들면, student's t-test and likelihood ratio tests, Yang (1998)Mol . Biol Evol .37:441-456에 의해 기술됨]을 비제한적으로 포함한다.
상동성 시퀀스의 일대일 비교에 대해, 1보다 의미있게 큰 KA/KS비율은, 우연성 단독의 결과로 예상되는 것보다 더 큰 개수의 아미노산 대체를 양성선택이 고정시켰음을, 그리고 그 비율이 1보다 적은, 통상적으로 관측되는 패턴과는 반대임을 암시한다. [Nei (1987); Hughes and Hei (1988)Nature335:167-170; Messier and Stewart (1994)Current Biol .4:911-913; Kreitman and Akashi (1995)Ann. Rev. Ecol . Syst .26:403-422; Messier and Stewart (1997)]. 1보다 적은 비율은 일반적으로 음성 또는 정제된 선택의 역할을 의미하는데: 기능성이고 효과적인 단백질의 일차 구조에 대해 미변화로 잔존하려는 강력한 압력이 있다. 약 1의 비율은 중성 조건 하의 진화를 지적한다.
KA/KS비율을 계산하기 위한 모든 방법들은 선조 및 가축화된 생물체들로부터의 상동성 유전자들의 단백질-코딩 영역에 대하여 비동질성 사이트에 대한 비동질성 치환의 개수와 동질성 사이트에 대한 동질성 치환의 개수와의 일대일 비교를 근거로 한다. 각각의 방법은 “다중 히트”(즉 동일 사이트에서 하나 이상의 뉴클레오타이드 치환)을 산정하기 위한 여러 가지 보정을 이행한다. 각각의 방법은 DNA 시퀀스가 진화 시간에 걸쳐서 어떻게 변화하는지에 대해 여러 가지 모델들을 사용한다. 따라서, 바람직하게는, 상이한 알고리듬의 결과들의 조합을 사용하여 양성-선택된 유전자를 검출하기 위한 감도의 수준 및 결과의 신뢰성을 증가시킨다.
바람직하게는, KA/KS비율은 파라로거스(paralogous) 유전자 쌍(즉, 종 형성으로부터 결과되는 유전자, 유전자 복제로부터 결과되는 유전자와는 대조적임)과는 반대로 오르토로거스(orthologous) 유전자 쌍에 대해서 계산되어야 한다. [Messier and Stewart (1997)]. 이러한 차이점은 다른 선조들과의 추가의 비교를 수행함으로써 만들어질 수도 있는데, 이것은 계통수-건설을 허용한다. 오르토로거스 유전자들이 계통수-건설에서 사용될 때, 공지의 “종의 나무(species tree)”를 산출할 것인데, 즉 공지의 생물학적 나무를 복구하는 나무를 만들 것이다. 대조적으로, 파라로거스 유전자는 공지의 생물학적 나무를 침해하는 나무를 산출할 것이다.
여기서 기술된 방법들은 단백질-코딩 시퀀스에 기능적으로 연관이 있는 선조또는 가축화된 생물체 폴리뉴클레오타이드 시퀀스를 동정할 수 있게 해준다는 것이 이해된다. 그와 같은 시퀀스들은 단백질을 코딩하지 않는 비코딩 시퀀스 또는 코딩 시퀀스를 비제한적으로 포함할 수도 있다. 이들 관련 시퀀스들은, 예를 들면, 인트론 또는 5'- 및 3'-플랭크링 시퀀스(프로모터 및 인핸서와 같은 제어 요소들을 포함함)와 같이 게놈에서 단백질-코딩 시퀀스에 물리적으로 인접하게 있을 수 있다. 이들 관련 시퀀스들은 이용가능한 공설, 사설 및/또는 상업적 게놈 데이터베이스의 검색을 통해서, 대안적으로, 프로브로서 단백질-코딩 시퀀스를 갖는 생물체의 게놈 라이브러리를 스크리닝하고 시퀀싱함으로써 수득될 수도 있다. 관련있는 코딩 시퀀스를 사용하여 비코딩 시퀀스를 수득하는 방법 및 기법은 당업계 숙련인에게 잘 알려져 있다.
진화적으로 의미있는 뉴클레오타이드 변화들은, KA/KS분석과 같은 분자 진화 분석에 의해 검출되며, 가축화된 생물체에서 그들의 독특한 출현 또는 이들 변화들이 가축화된 생물체에서 독특하게 있는 정도에 대해서 더 평가받을 수 있다. 예를 들면, 가축화된 유전자에서 동정된 변화들은 관련 종, 아종 또는 그 가축화된 생물체와 공통 조상을 갖는 다른 생물체들의 다른 시퀀스에서의 존재/부재에 대해 테스트될 수 있다. 이러한 비교(“외집단 분석”)는 양성 선택된 유전자가 논쟁 중인 가축화된 생물체에 있어서(선조와는 대조적으로) 양성 선택되고 있는지를 결정할 수 있게 해준다.
예를 들면, EG307 유전자에서의 동정된 변화들은 여러 가지 정도로 다수의O. sativa계통들에서도 동정되었다. 표 2-7을 참조한다. 추가적으로, EG307의 상대편은 옥수수,Zea mays mays, 이의 야생 선조, 테오신테,Z. mays parviglumis, 그리고 또한 옥수수,Zea diploperennisZea luxurians의 야생 친척들에서 동정되었다. 실시예 13 및 표 9를 참조한다. 쌀 및 옥수수에 있는 EG307가 뉴클레오타이드 레벨에서 다소 차이가 있는 반면, 단백질 시퀀스들은 더욱 유사하다. 쌀과 옥수수가 독립적으로 그들의 야생 선조들로부터 가축화된 것을 관찰한다면, 일관성 있는 패턴이 분명해진다 : 현대의 곡물(옥수수 또는 쌀)에서 아미노산 대체분의 대다수는, 그 선조 식물(테오신테 또는 조상 쌀)과 비교된다면, 증가된 대전/극성, 증가된 용해도, 및 감소된 소수성으로 결과된다. 이러한 패턴은 이들 두가지 독립적이 가축화 사건에서 우연성에 의해 거의 일어나지 않았다. 이것은 이들 대체들은 인간이 강요한 가축화에 대한 유사한 응답임을 암시한다. 이것은 EG307이 이들 두 곡물의 인간 가축화의 결과로서 선택되었다는 강력한 증거이다.
가축화된 생물체 및 그의 선조 사이에 적어도 하나의 진화적으로 의미있는 변화를 갖는 시퀀스들은 다른 조상 단백질-코딩 시퀀스의 PCR 분석을 위한 프라이머로서 사용될 수 있으며, 결과된 폴리뉴클레오타이드를 시퀀싱하여 동일한 변화가 다른 선조들에게도 존재하는지를 본다. 이들 비교는 그 적응성 진화적 변화가 다른 선조들과 비교하여 가축화된 혈통에게 독특한지 아닌지 또는 적응성 변화가 가축화된 종들 및 다른 선조들과 비교하여 그 선조에게 독특한지 아닌지에 관해 그 이상의 구별을 할 수 있게 해준다. 가축화된 생물체에서 검출되었지만 다른 선조들에서는 검출되지 않은 뉴클레오타이드 변화는 가축화된 생물체에서 적응성 진화적 변화를 더 많이 표현할 것 같다. 대안적으로, 선조에게서는 검출되었지만 가축화된 생물체 또는 다른 선조들에게서 검출되지 않은 뉴클레오타이드변화는 선조의 적응성 진화적 변화를 더많이 표현할 것 같다. 비교에 사용된 다른 선조들은 가축화된 생물체와 그들의 계통발생적 친척관계를 근거로 선택될 수 있다. 그와 같은 비교의 통계학적 유의성은 확립된 이용가능한 프로그램[예. t-test; Messier and Stewart (1997)Nature385:151-154]을 사용하여 결정될 수도 있다. 통계적으로 높은 KA/KS비율을 보이는 유전자들은 적응성 진화를 상당히 이행할 것 같다.
의미있는 변화들을 갖는 시퀀스들을 상이한 가축화된 개체군으로부터 나온 게놈에서 프로브로서 사용하여, 그 시퀀스 변화가 하나 이상의 가축화된 개체군에 의해 공유되는지 아닌지를 볼 수 있다. 상이한 가축화된 개체군들로부터 나온 유전자 시퀀스는 데이터베이스로부터 수득될 수 있거나, 대안적으로, 다수의 관련없는 다양한 가축화 개체군들로부터 나온 PCR-증폭된 DNA의 직접 시퀀싱으로부터 수득될 수 있다. 상이한 가축화된 개체군에서 동정된 변화들의 존재는 그 변화들의 진화적인 유의성을 지적한다.
종들 사이에 의미있는 변화들을 갖는 시퀀스들은 분자/유전자 동일성 및 생물학적 기능의 항목으로 더욱 특성화될 수 있으며, 당업계에 통상의 기술을 갖는 자들에게 공지된 방법과 기법을 사용한다. 예를 들면, 그 시퀀스들은 유전학적 및 물리적으로 생물체의 게놈 내에 위치할 수 있으며, 공식적으로 입수가능한 생물정보학 프로그램을 사용한다. 뉴클레오타이드 시퀀스 내의 새로이 동정된 의미있는 변화들은 생물체의 진화에서 유전자의 잠재적인 역할 및 독특하고, 향상되고 또는 변경된 기능성 역량과의 잠재적 연관을 암시한다.
본 발명의 기법을 사용하여, 이제까지 알려져 있지 않았던 진화적으로 의미있는 쌀에 있는 유전자 (명칭 EG307)를 실시예 10에서 상세히 기재된 바와 같이 발견하였다. KA/KS 분석법은,O. rufipogon및 몇몇O. sativa계통 사이에서 실시예 11에서 기술된 바처럼 수행되었는데, 표 1에 나타낸 바와 같이 진화적으로 의미있는 변화를 지적하였다. 여러가지 상이한 쌀 지도를 사용하여, 실시예 12에서 기술된 바와 같이, EG307은 마커 RZ672의 약 10cM이내이고, 1000 낟알 중량에 대한 QTL과 연관된 마커는 크로모솜 3에 거주하는 것으로 발견되었다. (1000-낟알 중량은 세가지 다른 시료의 무작위로 추출된 완전히 충만한 쌀 낟알 1000개의 중량이다.) 이것은 산출량의 민감한 계측이며, 쌀 낟알 중에서 출현하는 개별적인 중량 편차를 산정한다. 따라서, RZ672 마커를 EG307로부터 단일 세대에서의 이종교배에 대해 분리될 기회가 약 10% 만 있으며, EG307은 증가된 산출량을 조절하는데 중요한 역할을 하고 있음을 강력히 암시한다.
또한 본 발명의 기법을 사용하여, 이제까지 알려져 있지 않았던 진화적으로 의미있는 쌀에 있는 유전자(명칭 EG3117)를 실시예 14에서 상세히 기재된 바와 같이 발견하였다. KA/KS분석은,O. rufipogon및 어떤O. sativa계통 사이에서 실시예 14에서 기술된 바와 같이 수행되었는데, 표 10에 나타낸 바와 같이 진화적으로 의미있는 변화를 지적하였다. 유전자는 양성 선택되었다. 여러가지 상이한 쌀 지도를 사용하여, 실시예 13 및 14에서 기술된 바와 같이, EG1117은 마커 RZ672와 동일한 BAC상에 놓여 있고, 1000 낟알 중량에 대한 QTL과 연관된 마커는 크로모솜 3에 거주하는 것으로 발견되었다. EG1117은 EG307로부터 약 2-3 cM에 놓여있다.
진화적으로 의미있는 KA/KS 값 및 맵핑 데이터의 비교로부터, 당업계 기술자는 EG307 및 EG1117이 산출량-관련 유전자라는 것을 합리적으로 추정할 수 있다. EG307 및 EG1117의 산출량-증가 기능은 돌연변이 또는 이식유전자 식물을 만들고 재배함으로써 쉽게 확인될 수 있었다. 대안적인 방법은 쌀로부터 유도된 EG307 및 EG1117 시퀀스를 사용한 교배분석 및 계통분석을 포함하며, 옥수수 및 그의 야생 선조들로부터의 EG307 및 EG1117 유전자는 실시예 13에서 상술된 바처럼 수득되었다.
동정된 시퀀스를 갖는 추정 유전자는 더나가서, 예를 들면 상동체 검색에 의해 특징화될 수도 있다. 공지 유전자를 갖는 추정 유전자의 공유된 상동관계(homology)는 유사한 생물학적 역할 또는 기능을 지적할 수도 있다. 추정 유전자 시퀀스를 특징화하는 또 다른 전형적인 방법은 공지의 시퀀스 모티브를 기반으로 한다. 어떤 시퀀스 패턴은 신호 시퀀스, DNA 바인딩 영역 또는 통과막 영역과 같은 특이적 생물학적 특성들을 갖는 단백질의 영역들로 코딩하는 것으로 알려져 있다.
의미있는 변화를 갖는 동정된 시퀀스는 또한 그 유전자가 조직- 또는 세포형-특이성과 관련하여 발현되는 곳을 고찰함으로써 더욱 평가될 수 있다. 예를 들면, 동정된 코딩 시퀀스는 그 시퀀스의 발현 패턴을 드러낼 현장 mRNA 혼성화를 수행하는데 프로브(probe)로서 사용될 수 있다. 어떤 조직에서 발현된 유전자는 그 조직과 관련된, 예를 들면 내배유 조직을 발전시키는, 중요한 기능과 연관된 유망한 후보일 수도 있다. 그 종 구성원의 각각의 발전 단계 동안 유전자 발현의 타이밍을 또한 정할 수 있다.
시퀀스 특성화의 또 다른 전형적인 방법으로서, 의미있는 변화를 갖는 동정된 뉴클레오타이드 시퀀스의 기능적 역할이 감염된 가축화된 생물체에서, 예를들면 이식된 식물 또는 동물에서, 동정된 유전자의 여러 가지 대립 유전자에 대한 기능적 어세이를 수행함으로써 평가될 수 있다. 식물의 기능적 어세이의 통상적인 예들은 미크로어레이의 사용 [참조: Seki, et al., Monitoring the Expression Pattern of 1300 Arabidopsis Genes Under Drought and Cold Stresses Using a Full-Length cDNA Microarray.Plant Cell13:61-72 (2001)], 및 대사산물 프로파일링(metabolite profiling) [참조: Roessner, et al., Metabolic Profiling Allows Comprehensive Phenotyping of Genetically or Environmentally Modified Plant Systems.Plant Cell13:11-29 (2001)] 을 포함한다.
시퀀스 특성화의 또 다른 전형적인 방법으로서, 컴퓨터 프로그램의 사용은 가축화된 생물체 및 선조의 상동 단백질의 3차원적 구조를 모델링하고 가시화할 수 있게 해준다. 조상 단백질에서 어떤 아미노산이 대체되었는지를 특정적이고 정확하게 아는 것은 기능 차이와 연관될 수도 있는 구조적 변화를 검출할 수 있게 해준다. 따라서, 모델링 기법의 사용은 앞 문장에서 논의된 기능적 역할의 동정과 밀접하게 연관되어 있다. 이들 기법들의 개개의 또는 조합된 사용은 본 발명의 일부를 구성한다.
본 발명의 방법에 의해 동정된 가축화된 생물체의 유전자는 공통 조상을 공유하는 다른 종들에 있어서의 상동 유전자를 동정하는데 사용될 수 있다. 예를 들면, 옥수수, 쌀, 밀, 기장, 사탕수수 및 다른 곡물들은 공통 조상을 공유하며, 쌀에서 동정된 유전자들은 이들 다른 초본들에 있어서 상동 유전자로 직접 유도될 수 있다. 마찬가지로, 토마토와 감자는 공통 조상을 공유하며, 본 발명의 방법에 의해 토마토에서 동정된 유전자는 감자에서 상동체를 갖는 것으로 기대되며, 그 역도 마찬가지다.
본 발명은 또한 하기를 포함하는 식물 세포에 있는 산출량-증가 유전자를 검출하는 방법을 제공한다:
a) 길이 12개의 뉴클레오타이드, 바람직하게는 30개의 뉴클레오타이드보다 더큰 EG307 유전자 또는 이의 부위를, SEQ ID NO:1, SEQ ID NO:91, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:34, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:55, SEQ IDNO:57, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:63, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:74, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:59, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:81, SEQ ID NO:82, SEQ ID NO:84 및 SEQ ID NO:85 및 b) 로 구성된 군에서 선택되는 핵산 분자에 대해 약 50% 또는 그 이상의 시퀀스 동일성을 갖는 핵산 분자 시퀀스의 검출을 제공하는 혼성화 조건 하에서, 식물세포에서 나온 게놈 DNA 제제와 접촉시키고: 및
b) 혼성화를 검출하고, 이에 의해 산출량-증가 유전자를 동정할 수도 있음.
본 발명은 또한 재조합 식물 세포 라이브러리로부터 산출량-관련 유전자를 단리하는 방법을 제공하는데, a) 식물세포 DNA 또는 재조합 식물세포 라이버러리의 제제를 제공하고; b) 그 제제 또는 식물세포 라이버러리를, 50% 또는 그 이상의 시퀀스 동일성을 갖는 유전자의 검출을 제공하는 혼성화 조건 하에서 검출가능하게-라벨링된 EG307 보존된 올리고뉴클레오타이드와 접촉시키고; 및 c) 산출량-관련 유전자를 검출가능한 라벨과의 결합에 의해 단리하는 것을 포함한다.
본 발명은 또한 식물세포 DNA로부터 산출량-관련 유전자를 단리하는 방법을 제공하는데, a) 식물세포 DNA 시료를 제공하고; b) EG307 유전자의 보존 영역과 시퀀스 상동관계를 갖는 올리고뉴클레오타이드 한 쌍을 제공하고; c) 폴리머라제 사슬반응-개재된 DNA 증폭에 적합한 조건 하에서 올리고뉴클레오타이드 한 쌍을 식물세포 DNA 시료와 결합시키고; 및 d) 증폭된 산출량-관련 유전자 또는 그의 단편을 단리하는 것을 포함한다.
여기서 기술된 방법에 의해 동정된 시퀀스는 가축화된 생물체-특유의, 강화되거나 변경된 기능적 역량을 조절하고 및/또는 이들 시퀀스를 사용하는 이들 역량에서의 결함을 정정하는데 유용한 약제를 동정하는데 사용할 수 있다.
이들 방법들은, 예를 들면, 생체외 시스템, 세포-기반 발현 시스템 및 이식 동물 및 식물과 같이, 당업계에 공지된 스크리닝 기법을 사용한다. 본 발명에 의해 제공되는 접근법은 진화된 유전자를 신속히 동정할 뿐만 아니라 또 다른 종에 존재하기 때문에 지나치게 독성이 아닐 수도 있는 단백질로 만들어질 수 있는 모듈레이션을 지적한다.
본 발명은 또한 EG307 폴리펩티드의 생산 방법을 제공하는데, a) 세포에서 발현 위치에 있는 EG307 폴리펩티드를 인코딩하는 폴리뉴클레오타이드로 트랜스팩션된 세포를 제공하고; b) 트랜스팩션된 세포를 폴리뉴클레오타이드를 발현시키는 조건 하에 배양하고; 및 c) EG307 폴리펩티드를 단리하는 것을 포함한다.
본 발명은 또한 하기를 포함하는 식물 세포에 있는 산출량-증가 유전자를 검출하는 방법을 제공한다:
a) 길이 12개의 뉴클레오타이드, 바람직하게는 30개의 뉴클레오타이드보다 더큰 EG307 또는 EG1117유전자 또는 이의 부위를, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:97, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:113, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:117, SEQ ID NO:119, SEQ IDNO:120, SEQ ID NO:121, SEQ ID NO:122, SEQ ID NO:123, SEQ ID NO:124, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:128, SEQ ID NO:129, SEQ ID NO:130, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:136, SEQ ID NO:137, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:141, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:145, SEQ ID NO:146, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:150, SEQ ID NO:151, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:161, SEQ ID NO:162, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:166, SEQ ID NO:167, 및 SEQ ID NO:168 로 구성된 군에서 선택되는 핵산 분자에 대해 약 50% 또는 그 이상의 시퀀스 동일성을 갖는 핵산 분자 시퀀스의 검출을 제공하는 혼성화 조건 하에서, 식물세포에서 나온 게놈 DNA 제제와 접촉시키고: 및
b) 혼성화를 검출하고, 이에 의해 산출량-증가 유전자를 동정할 수도 있음.
본 발명은 또한 재조합 식물 세포 라이브러리로부터 산출량-관련 유전자를 단리하는 방법을 제공하는데, a) 식물세포 DNA 또는 재조합 식물세포 라이버러리의 제제를 제공하고; b) 그 제제 또는 식물세포 라이버러리를, 50% 또는 그 이상의 시퀀스 동일성을 갖는 유전자의 검출을 제공하는 혼성화 조건 하에서 검출가능하게-표지된 EG307 또는 EG1117 보존된 올리고뉴클레오타이드와 접촉시키고; 및 c) 산출량-관련 유전자를 검출가능한 표지와 그의 결합에 의해 단리하는 것을 포함한다.
본 발명은 또한 식물세포 DNA로부터 산출량-관련 유전자를 단리하는 방법을 제공하는데, a) 식물세포 DNA 시료를 제공하고; b) EG307 또는 EG1117 유전자의 보존 영역과 시퀀스 상동관계를 갖는 올리고뉴클레오타이드 한 쌍을 제공하고; c) 폴리머라제 사슬반응-개재된 DNA 증폭에 적합한 조건 하에서 올리고뉴클레오타이드 한 쌍을 식물세포 DNA 시료와 결합시키고; 및 d) 증폭된 산출량-관련 유전자 또는 그의 단편을 단리하는 것을 포함한다.
여기서 기술된 방법에 의해 동정된 시퀀스는 가축화된 생물체-특유의, 강화되거나 변경된 기능적 역량을 조절하고 및/또는 이들 시퀀스를 사용하는 이들 역량에서의 결함을 정정하는데 유용한 약제를 동정하는데 사용할 수 있다. 이들 방법들은, 예를 들면, 생체외 시스템, 세포-기반 발현 시스템 및 이식 동물 및 식물과 같이, 당업계에 공지된 스크리닝 기법을 사용한다. 본 발명에 의해 제공되는 접근법은 진화된 유전자를 신속히 동정할 뿐만 아니라 또 다른 종에 존재하기 때문에 지나치게 독성이 아닐 수도 있는 단백질로 만들어질 수 있는 모듈레이션을 지적한다.
본 발명은 또한 EG307 또는 EG1117 폴리펩티드의 생산 방법을 제공하는데, a) 세포에서 발현 위치에 있는 EG307 또는 EG1117 폴리펩티드를 인코딩하는 폴리뉴클레오타이드로 트랜스팩션된 세포를 제공하고; b) 트랜스팩션된 세포를 폴리뉴클레오타이드를 발현시키는 조건 하에 배양하고; 및 c) EG307 또는 EG1117 폴리펩티드를 단리하는 것을 포함한다.
A. EG307 폴리펩티드
본 발명의 하나의 구현예는 단리된 식물 EG307 폴리펩티드이다. 여기서 사용된 바처럼, EG307 폴리펩티드는, 하나의 구현예에서는, 약 447 아미노산의O. sativa폴리펩티드에 관련되고 (즉 구조적 유사성을 내포하고) 도 2에 서술된 시퀀스 (SEQ ID NO:6)을 갖는 폴리펩티드이다. 이러한 폴리펩티드의 독창적인 동정은 실시예들에 상술되어 있다. 바람직한 EG307 폴리펩티드는 엄중한 혼성화 조건하에서 혼성화하는 폴리뉴클레오타이드에 의해 다음 유전자들 중의 하나로 인코딩된다: (a)O. sativaEG307 폴리펩티드를 인코딩하는 유전자 (즉,O. sativa유전자); (b)O. rufipogonEG307 폴리펩티드를 인코딩하는 유전자 (즉,O. rufipogon유전자); (c)Zea mays maysEG307를 인코딩하는 유전자; (d)Zea mays parviglumisEG307 폴리펩티드를 인코딩하는 유전자 (즉,Z. mays parviglumis유전자); (e)Zea diploperennisEG307 폴리펩티드를 인코딩하는 유전자 (즉,Z. diploperennis유전자); 및 (f)Zea luxuriansEG307 폴리펩티드를 인코딩하는 유전자 (즉,Z. luxuriansgene). 용어 “한” 또는 “하나의” 실체는 그 실체의 하나 또는 그 이상을 지칭하며; 예를 들면, 하나의 유전자는 하나 또는 그 이상의 유전자 또는 적어도 하나의 유전자를 지칭한다. 이처럼, 용어 “한”(또는 “하나의”), “하나 또는 그 이상” 및 “적어도 하나”는 여기서 서로 교환해서 사용될 수 있음을 유의한다. 또한 용어 “이루어진(comprising)”, “포함하는(including)”, “갖는(having)”도 서로 교환해서 사용될 수 있다.
여기서 사용된 바처럼, 엄중한 혼성화 조건은 올리고뉴클레오타이드를 포함하여 폴리뉴클레오타이드가 유사한 핵산 시퀀스를 갖는 분자들을 동정하는데 사용되는 표준 혼성화 조건을 지칭한다. 이러한 표준 조건은, 예를 들면, 문헌 [Sambrook et AL., MOLECULAR CLONING: A LABORATORY MANUAL, Cold Spring HarborLabs Press, 1989]에 기재되어 있다. 이러한 조건의 실시예들은 본 발명의 실시예 섹션에 제공된다.
여기서 사용된 바처럼,O. sativaEG307 유전자는 그 유전자에 의해 인코딩되는O. sativa EG307 폴리펩티드의 생산량을 제어하는 조절성 영역(예를 들면, 이로 한정되지는 않지만, 번역 또는 전-번역 제어 영역)과 같은 자연산O. sativaEG307 유전자와 관련된 모든 핵산 시퀀스, 뿐만 아니라 코딩 영역 그 자체를 포함한다. 하나의 구현예에 있어서,O. sativaEG307 유전자는 핵산 시퀀스 SEQ ID NO:4를 포함한다.
핵산 시퀀스 SEQ ID NO:4는 cDNA(상보 DNA) 폴리뉴클레오타이드의 추론된 시퀀스를 나타내며, 이의 제조는 실시예에 개시되어 있다. 핵산 시퀀싱 기법은 전적으로 무오류성이 아니기 때문에 SEQ ID NO:4(또한 여기서 표현된 다른 시퀀스)는, 기껏해야, 본 발명의O. sativaEG307 폴리펩티드를 인코딩하는 폴리뉴클레오타이드의 외관상 핵산 시퀀스를 나타낸다는 것을 유념해야 한다.
또 다른 구현예에 있어서,O. sativa EG307 유전자는 SEQ ID NO:4에 유사하지만 동일하지는 않은 시퀀스를 포함하는 대립유전자 변체일 수 있다. SEQ ID NO:1을 포함하는 O. sativa EG307 유전자는 대립유전자 변체는 그의 활성도가 동일한 생화학적 또는 발생학적 과정에 관계하고 있는 게놈에 있는 로커스(들), 및/또는 그것이 SEQ ID NO:4를 포함하는 유전자와 반드시 동일한 로커스에서 출현하는 유전자일 수 있으며, 그러나 이것은, 예를 들어 돌연변이 또는 재조합에 의해 야기되는 자연 변체들로 인해 유사하지만 동일하지 않은 시퀀스를 갖는다. 게놈은 재배열을 이행하기 때문에, 대립유전자의 물리적 배열은 항상 동일하지 않다. 대립유전자 변체들은 전형적으로, 비교되고 있는 유전자에 의해 인코딩되는 폴리펩티드에 유사한 활성도를 갖는 폴리펩티드를 인코딩한다. 대립유전자 변체는 또한 그 유전자의 5' 또는 3' 비번역 영역에서의(예를 들면, 조절성 콘트롤 영역에서의) 변경으로 이루어질 수 있다. 대립유전자 변체들은 또한 당업계 숙련인들에게 주지되어 있으며, 게놈이 배수체이고 및/또는 둘 이상의 쌀 품종 또는 계통으로 이루어진 집단들 중에 있기 때문에 주어진 쌀 품종 또는 계통 내에 발견될 것으로 기대된다. 예를 들면, SEQ ID NO:18로 표현되는 핵산 시퀀스를 갖는O. sativa폴리뉴클레오타이드는, 하기에 더욱 상세히 기술될 것이지만,O. sativa의 카살라트 계통(Kasalath strain)의 대립유전자 변체를 나타낸다.
유사하게,Zea mays maysEG307 유전자는 그 유전자자에 의해 인코딩되는Z. mays mays EG307 폴리펩티드의 생산을 콘트롤하는 조절성 영역과 같은 자연산Z. mays maysEG307 유전자에 연관된 모든 핵산 시퀀스 뿐만 아니라 코딩 영역 그 자체를 포함한다. 하나의 구현예에 있어서,Zea mays maysEG307 유전자는 핵산 시퀀스 SEQ ID NO:66 를 포함한다. 핵산 시퀀스 SEQ ID NO:66 은 cDNA 폴리뉴클레오타이드의 추론 시퀀스를 나타내며, 이의 제조는 실시예들에 개시되어 있다. 또 다른 구현예에 있어서,Zea mays maysEG307 유전자는 유사하지만 동일하지 않은 시퀀스 SEQ ID NO:66을 포함하는 대립유전자 변체일 수 있다.
본 발명에 따르면, 단리된, 또는 생물학적으로 순수한 폴리펩티드는 자연 환경으로부터 제거된 폴리펩티드이다. 이와 같이, “단리된” 및 “생물학적으로 순수한”은 폴리펩티드가 정제되어진 정도를 반드시 반영하는 것은 아니다. 본 발명의 단리된 EG307 폴리펩티드는 그의 자연 근원으로부터 수득될 수 있으며, 재조합 DNA 기법을 사용하여 제조될 수 있거나 화학적 합성법에 의해 제조될 수 있다. 본 발명의 EG307 폴리펩티드는 기능 어세이에서 자연산 EG307 의 기능을 수행하는 그의 능력에 의해 동정될 수도 있다. “자연산 EG307 폴리펩티드”란,O. sativa,O. rufipogon,Z. mays mays및/또는Z. mays parviglumis의 전체 길이 EG307 폴리펩티드를 의미한다. 구절 “기능 어세이에서 자연산 EG307 의 기능을 수행할 능력이 있는”이라는 것은 그 폴리펩티드가 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 10%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, EG307 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 20%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, EG307 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 30%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, EG307 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 40%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, EG307 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 50%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 60%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 70%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 80%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 90%를 갖는다는 것을 의미한다. 기능 어세이의 예들은 항체-바인딩 어세이, 또는 산출량-증가 어세이를 포함하며, 본 명세서에서 다른 곳에서 상술된 바와 같다.
여기서 사용된 바처럼, 단리된 식물 EG307 폴리펩티드는 전체-길이의 폴리펩티드 또는 이러한 폴리펩티드의 모든 상동체일 수 있다. EG307 상동체의 예들은, 이러한 상동체들이 자연산 EG307 활성도를 가지고 있도록 아미노산들이 (예를들면 글리코실화, 포스포릴화, 아세틸화, 미리스틸화, 프레닐화, 팔미토일화, 아미드화 및/또는 글리세로포스파티딜 이노시톨의 첨가에 의해) 삭제되거나(예를들면, 폴리펩티드의 잘려진 이형체, 예를들면 펩티드), 삽입되거나, 역전되거나, 치환되거나 및/또는 유도화된 EG307 폴리펩티드를 포함한다.
하나의 구현예에 있어서, 상동체들은 당업계 숙련인들에게 공지된 기법을 사용하여 면역원으로서 동물에 투여될 때, 동물들은 적어도 하나의 자연산 EG307 폴리펩티드에 대해 인간 및/또는 세포 면역반응을 생성할 것이다. EG307 상동체들은 또한 기능 어세이에서 EG307 의 기능을 수행하는 그들의 능력에 의해 선택될 수 있다.
식물 EG307 폴리펩티드 상동체들은 자연산 대립유전자 변체 또는 자연 돌연변이의 결과일 수 있다. 폴리펩티드로의 직접 개질 또는 예를 들면 랜덤 또는 타겟화된 돌연변이를 실현하는 전통적인 또는 재조합 DNA 기법을 사용하여 폴리펩티드를 인코딩하는 유전자로의 변조를 포함하는, 그러나 이들로 한정되지는 않는, 당업계에 공지된 기법을 사용하여, 본 발명의 EG307 폴리펩티드 상동체들을 또한 제조할 수 있다.
본 발명에 따르면, 미메토프(mimetope)는 기능 어세이에서 본 발명의 EG307 폴리펩티드의 기능을 수행하는 본 발명의 단리된 식물 EG307 폴리펩티드의 능력을 모사할 수 있는 임의의 화합물을 지칭한다. 미메토프의 예들은, 이들로 한정되지는 않지만, 본 발명의 단리된 폴리펩티드의 하나 이상의 에피토프를 모사하는 적어도 하나의 바인딩 사이트를 포함하는, 항이디오타잎 항체 또는 이의 단편; 단리된 폴리펩티드의 비폴리펩티드성 면역원성 부위 (예. 카보하이드레이트 구조); 및 본 발명의 단리된 폴리펩티드의 적어도 하나의 에피토프에 유사한 구조를 갖는, 핵산을 포함한 합성 또는 자연산 유기 분자를 포함한다. 이러한 미메토프들은 본 발명의 폴리펩티드의 컴퓨터-생성된 구조를 사용하여 설계될 수 있다. 미메토프들은 올리고뉴클레오타이드, 펩타이드 또는 다른 유기 분자와 같은 분자들의 랜덤 시료를 발생시키고, 이러한 시료들을 대응하는 결합쌍을 사용하는 친화적 크로마토그래피 기법에 의해 스크리닝함으로써 또한 수득될 수 있다.
본 발명의 EG307 폴리펩티드 상동체의 최소 크기는 대응하는 자연산 폴리펩티드를 인코딩하는 폴리뉴클레오타이드의 상보 시퀀스와 안정한 하이브리드를 형성할 수 있는 폴리뉴클레오타이드에 의해 인코딩되는데 충분한 크기이다. 이와 같이, 그러한 폴리펩티드 상동체를 인코딩하는 폴리뉴클레오타이드의 크기는 폴리뉴클레오타이드 및 상보 시퀀스 사이의 핵산 조성 및 백분율 상동관계에 의존하며 아울러 혼성화 조건 그 자체(예. 온도, 염농도, 및 포름아미드 농도)에 의존한다. 안정한 하이브리드를 형성하는데 요구되는 동족관계의 정도는 상동 시퀀스들이 폴리뉴클레오타이드 전반에 걸쳐 산재되어 있는지 또는 폴리뉴클레오타이드의 별개의 영역에 뭉쳐있는지에 (즉 편재화되어 있는지에) 상당히 의존할 수 있음을 유념해야 한다. 그와 같은 폴리뉴클레오타이드의 최소 크기는 전형적으로, 만일 폴리뉴클레오타이드가 GC-풍부하다면 길이가 적어도 약 12 내지 약 15개의 뉴클레오타이드들이고, 만일 AT-풍부하다면 길이가 적어도 약 12 내지 17개의 염기들이다. 바람직하게는, 폴리뉴클레오타이드는 길이가 적어도 약 12개의 염기들이다.
이와 같이, 본 발명의 EG307 폴리펩티드 상동체를 인코딩하는데 사용되는 폴리뉴클레오타이드의 최소 크기는 길이가 약 12 내지 약 18의 뉴클레오타이드들이다. 폴리뉴클레오타이드는 유전자의 일부, 전체 유전자, 또는 다중 유전자 또는 이의 일부를 포함할 수 있다는 점에서, 그러한 폴리뉴클레오타이드의 최소 크기에 대한 제한은 실용적인 제한 이외에는 없다. 유사하게, 본 발명의 EG307 폴리펩티드 상동체의 최소 크기는 길이가 약 4 내지 약 6개의 아미노산이며, 바람직한 크기는 그러한 폴리펩티드의 전체 길이, 융합, 다가 또는 기능성 부위들이 소망스러운지에 의존된다. 바람직하게는, 폴리펩티드는 길이 약 30개의 아미노산이다.
임의의 식물 EG307 폴리펩티드는 본 발명의 적절한 폴리펩티드이다.
EG307 폴리펩티드를 단리하기 위해(자연산 폴리펩티드의 단리 또는 재조합 또는 합성 기법에 의한 폴리펩티드의 제조를 포함함) 적절한 식물들은 옥수수, 밀, 보리, 호밀, 기장, 병아리콩, 렌즈콩, 아마, 올리브, 무화과, 피스타치오, 호두,사탕무, 그리고 오렌지, 레몬, 라임, 그레이프프루트, 탕헤르 오렌지, 민네올라 및 탄젤로를 포함하는, 그러나 이들로 한정되지 않는 감귤류, 고구마, 강낭콩, 완두콩, 치코리, 상추, 양배추, 꽃양배추, 브로커리, 순무, 무, 시금치, 아스파라거스, 양파, 마늘, 후추, 샐러리, 스쿼시(squash), 호박, 대마, 서양호박, 사과, 배, 모과, 멜런, 서양자두, 버찌, 복숭아, 승도복숭아, 아프리코트, 스트로베리, 포도, 나무딸기, 검은딸기, 파인애플, 아보카도, 파파야, 망고, 바나나, 대두, 토마토, 사탕수수(sorghum), 사탕수수(sugarcane), 사탕무, 해바라기, 평지씨, 클로버, 담배, 당근, 면화, 알파파, 쌀, 감자, 가지, 오이, 아라비돕시스, 그리고 침엽수와 낙엽수와 같은 목본성 식물을 포함하는데, 쌀과 옥수수가 바람직하다. EG307 폴리펩티드를 단리하기 위해 적절한 쌀 식물은O. sativa의 니폰바레 (Nipponbare) l 및 2, 레몬트 (Lemont), IR64, 테킹(Teqing), 아즈세나(Azucena), 및 카살라트(Kasalath) 1,2, 3 및 4 계통들이다.
본 발명의 바람직한 식물 EG307 폴리펩티드는 식물에서 발현되거나 조절되었을 때 식물의 산출량을 증가시키는 능력이 있는 화합물이다.
본 발명의 하나의 구현예는 융합 세그먼트에 첨부된 EG307 폴리펩티드-함유 영역을 포함하는 융합 폴리펩티드이다. 본 발명의 EG307 폴리펩티드의 일부로서 융합 세그먼트의 혼입은 생산, 저장 및/또는 사용 도중에 폴리펩티드의 안정성을 향상시킬 수 있다. 그 세그먼트의 특성들에 의존하여, 융합 세그먼트는 또한 면역보강제(immunopotentiator)로서 작용하여 그러한 융합 세그먼트를 함유하는 EG307 폴리펩티드로써 면역된 동물에 의해 설정된 면역반응을 강화시킬 수 있다. 더나가서, 융합 세그먼트는 EG307 폴리펩티드의 정제를 단순화시키는 도구로서 기능할 수 있으며, 예를 들면 결과된 융합 폴리펩티드의 정제를 친화 크로마토그래피를 사용하여 가능하게 한다. 적절한 융합 세그먼트는 원하는 기능을 갖는 임의의 크기의 영역일 수 있다 (예를 들면, 폴리펩티드에 증가된 면역원성을 부여하고 및/또는 폴리펩티드의 정제를 단순화시킴). 하나 이상의 융합 세그먼트를 사용하는 것도 본 발명의 범주 내이다. 융합 세그먼트는 폴리펩티드의 EG307-함유 영역의 아미노 및/또는 카르복실 말단에 접합될 수 있다. 융합 세그먼트 및 융합 폴리펩티드의 EG307-함유 영역 사이의 연결은 그러한 폴리펩티드의 EG307-함유 영역의 똑바른 회복을 가능하게 하기 위하여 분열을 받아들일 수 있다. 융합 세그먼트들은 EG307-함유 영역의 카르복실 및/또는 아미노 말단 중의 어느 하나에 첨부된 융합 세그먼트를 포함하는 폴리펩티드를 인코딩하는 융합 폴리뉴클레오타이드로 전환되는 재조합 세포를 배양함으로써 바람직하게 제조된다.
본 발명에서 사용하기에 바람직한 융합 세그먼트는 글루타티온 바인딩 영역; 금속 바인딩 영역, 예를 들면 이가 금속 이온에 바인딩할 수 있는 폴리히스티딘 세그먼트; 면역글로불린 바인딩 영역, 예를 들면 폴리펩티드 A, 폴리펩티드 G, T 세포, B 세포, Fc 수용체 또는 상보 폴리펩티드 항체-바인딩 영역; 말토스 바인딩 폴리펩티드로부터 나온 말토스 바인딩 영역과 같은 당 바인딩 영역; 및/또는 “태그” 영역(예. β-칼락토시다제의 적어도 일부, 스트렙 태그 펩티드, 이 영역에 바인딩하는 화합물을 사용하여 정제될 수 있는 다른 영역, 예를 들면 모노클로날 항체)을 포함한다. 더욱 바람직한 융합 세그먼트는 금속 바인딩 영역, 예를 들면 폴리히스티딘 세그먼트; 말토스 바인딩 영역; 스트렙 태그 펩티드를 포함한다.
본 발명의 바람직한 식물 EG307 폴리펩티드는 쌀 EG307 폴리펩티드 및 옥수수 EG307 폴리펩티드이다. 더욱 바람직한 EG307 폴리펩티드는O. sativa,O. rufipogon,Z. mays mays,Zea mays parviglumis,Z. diploperennis Z. luzuriansEG307 폴리펩티드들이다.O. sativa계통주는 니폰바레 (Nipponbare), 아즈세나(Azucena), 및 카살라트(Kasalath) 1, 2, 3 및 4, 테킹(Teqing), 레몬트 (Lemont) 및 IR64이다.Z. mays parviglumis계통주들은 Benz, BK4, IA19 및 윌크스(Wilkes),를 포함한다.Zea mays mays계통주들은 BS7, 후오바이 (HuoBai), 마끼(Makki), 민(Min) 13, 피라(Pira), 사리(Sari), 스메나(Smena), 및 W22를 포함한다.
본 발명의 하나의 바람직한O. sativaEG307 폴리펩티드는 SEQ ID NO:1, SEQ ID NO:91, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:17, 및/또는 SEQ ID NO:18로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는O. sativa폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다. 이러한 EG307 폴리펩티드는 핵산 시퀀스 SEQ ID NO:1, SEQ ID NO:91, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:17, 및/또는 SEQ ID NO:18을 갖는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩된다.
EG307 게놈성 핵산 시퀀스의 조사는, 그 유전자가 제 1 엑손 영역, 제 1 인트론 영역, 제 2 엑손 영역, 제 2 인트론 영역, 및 제 3 엑손 영역을 포함하는 여러 개의 영역으로 이루어진다는 것을 지적한다.
폴리뉴클레오타이드 SEQ ID NO:4 및 SEQ ID NO:91 는O. sativa(cv. Nipponbare)에서 EG307 유전자의 5' 및 3' 말단을 나타낸다. SEQ ID NO:4 및 SEQ ID NO:91 은 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로인해 알려져 있지 않지만, 약 6인 것으로 믿어진다. SEQ ID NO:4 및 SEQ ID NO:91의 번역은O. sativaEG307 폴리뉴클레오타이드가 오픈 리딩 프레임(open reading frame)을 포함한다는 것을 암시한다. 리딩 프레임은 약 447 아미노산의O. sativaEG307 폴리펩티드를 인코딩하며, 이의 추론된 아미노산 시퀀스는 SEQ ID NO:6으로서 여기서 나타내는데, SEQ ID NO:4의 대략 뉴클레오타이드 37에서 대략 뉴클레오타이드 39에 걸친 구간을 갖는 개시(출발) 코돈 및 SEQ ID NO:4의 대략 뉴클레오타이드 2278에서 대략 뉴클레오타이드 2280에 걸친 구간을 갖는 종결(중지) 코돈을 갖는 오픈 리딩 프레임을 가정하는데, 제 1 엑손은 SEQ ID NO:4의 뉴클레오타이드 1-126의 구간이고, 제 1 인트론은 SEQ ID NO:91의 뉴클레오타이드 9-822의 구간이고, 제 2 엑손은 SEQ ID NO:91의 뉴클레오타이드 823-1141의 구간이고, 제 2 인트론은 SEQ ID NO:91의 뉴클레오타이드 1142-1222의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:91의 뉴클레오타이드 1223-2157의 구간이다. SEQ ID NO:4의 뉴클레오타이드 37에서부터 대략 뉴클레오타이드 2280에 걸쳐있는 오픈 리딩 프레임은 여기서 SEQ ID NO:5로 나타낸다.
유사하게,O. sativa(Azucena 계통) 폴리뉴클레오타이드 SEQ ID NO:1의 번역은 SEQ ID NO:1의 대략 뉴클레오타이드 3에서 대략 뉴클레오타이드 2410까지의 오픈 리딩 프레임을 암시하는데, 제 1 엑손은 SEQ ID NO:1의 뉴클레오타이드 1-92의 구간이고, 제 1 인트론은 SEQ ID NO:1의 뉴클레오타이드 93-1075의 구간이고, 제 2 엑손은 SEQ ID NO:1의 뉴클레오타이드 1076-1394의 구간이고, 제 2 인트론은 SEQ ID NO:1의 뉴클레오타이드 1395-1475의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:1의 뉴클레오타이드 1476-2441의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:2로서 나타내어지며, 여기서 SEQ ID NO:3으로 나타내는 폴리펩티드를 인코딩한다.
유사하게,O. sativa(Teqing 계통) 폴리뉴클레오타이드 SEQ ID NO:7의 번역은 SEQ ID NO:7의 대략 뉴클레오타이드 21에서 대략 뉴클레오타이드 2421까지의 오픈 리딩 프레임을 암시하는데, 제 1 엑손은 SEQ ID NO:7의 뉴클레오타이드 1-110의 구간이고, 제 1 인트론은 SEQ ID NO:7의 뉴클레오타이드 111-1089의 구간이고, 제 2 엑손은 SEQ ID NO:7의 뉴클레오타이드 1090-1405의 구간이고, 제 2 인트론은 SEQ ID NO:7의 뉴클레오타이드 1406-1486의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:7의 뉴클레오타이드 1487-2461의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:8로서 나타내어지며, 여기서 SEQ ID NO:9으로 나타내는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:10 및 SEQ ID NO:11은O. sativa(cv. Lemont)에서 EG307 유전자의 5' 및 3' 말단을 나타낸다. SEQ ID NO:10 및SEQ ID NO:11은 알 수 없는 개수의 뉴클레오타이드들에 의해 접합된다. 게놈 시퀀스에 있어서, 유전자의 비코딩 부위에서 잠재적 삽입/삭제가 있을 수도 있으며, 따라서 뉴클레오타이드의 실제 개수는 알려져 있지 않지만, 약 10인 것으로 믿어진다.O. sativa(cv. Lemont) 폴리뉴클레오타이드 SEQ ID NO:10 및 SEQ ID NO:11의 번역은 SEQ ID NO:10의 대략 뉴클레오타이드 166으로부터 SEQ ID NO:11의 대략 뉴클레오타이드 1547까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:10의 뉴클레오타이드 1-255의 구간이고, 제 1 인트론은 SEQ ID NO:10의 뉴클레오타이드 255-451 및 SEQ ID NO:11의 뉴클레오타이드 1-212의 구간이고, 제 2 엑손은 SEQ ID NO:11의 뉴클레오타이드 213-531의 구간이고, 제 2 인트론은 SEQ ID NO:11의 뉴클레오타이드 532-612의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:11의 뉴클레오타이드 613-616의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:12로 표현되며, 여기서 SEQ ID NO:13으로서 표현되는 폴리펩티드를 인코딩한다.
유사하게,O. sativa(IR64 계통) 폴리뉴클레오타이드 SEQ ID NO:14의 번역은 대략 뉴클레오타이드 1에서 대략 뉴클레오타이드 2400까지의 오픈 리딩 프레임을 암시하는데, 제 1 엑손은 SEQ ID NO:14의 뉴클레오타이드 1-90의 구간이고, 제 1 인트론은 SEQ ID NO:14의 뉴클레오타이드 91-1068의 구간이고, 제 2 엑손은 SEQ ID NO:14의 뉴클레오타이드 1069-1384의 구간이고, 제 2 인트론은 SEQ ID NO:14의 뉴클레오타이드 1385-1465의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:14의 뉴클레오타이드 1466-2459의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:14로서 나타내어지며, 여기서 SEQ ID NO:15으로 나타내는 폴리펩티드를 인코딩한다.
유사하게,O. sativa(Kasalath 계통) 폴리뉴클레오타이드 SEQ ID NO:17의 번역은 대략 뉴클레오타이드 2에서 대략 뉴클레오타이드 2402까지의 오픈 리딩 프레임을 암시하는데, 제 1 엑손은 SEQ ID NO:17의 뉴클레오타이드 1-91의 구간이고, 제 1 인트론은 SEQ ID NO:17의 뉴클레오타이드 92-1070의 구간이고, 제 2 엑손은 SEQ ID NO:17의 뉴클레오타이드 1071-1386의 구간이고, 제 2 인트론은 SEQ ID NO:17의 뉴클레오타이드 1387-1467의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:17의 뉴클레오타이드 1468-2432의 구간이다.
오픈 리딩 프레임은 여기서 SEQ ID NO:18로서 표현되며, 여기서 SEQ ID NO:19로 표현되는 폴리펩티드를 인코딩한다. SEQ ID NO:18에서, Kasalath 1 계통에 대해, 889 위치의 “N”은 “G”이고, 971 위치의 “N”은 “A”이며, SEQ ID NO:19에서의 아미노산 잔기 297을 발린으로, 아미노산 잔기 324를 글루타민으로 만든다. SEQ ID NO:18에서, Kasalath 2 계통에 대해, 889 위치의 “N”은 “G”이고, 971 위치의 “N”은 “T”이며, SEQ ID NO:19에서의 아미노산 잔기 297을 발린으로, 아미노산 잔기 324를 류이신으로 만든다. SEQ ID NO:18에서, Kasalath 3 계통에 대해, 889 위치의 “N”은 “C”이고, 971 위치의 “N”은 “A”이며, SEQ ID NO:19에서의 아미노산 잔기 297을 류이신으로, 아미노산 잔기 324를 글루타민으로 만든다. SEQ ID NO:18에서, Kasalath 4 계통에 대해, 889 위치의 “N”은 “C”이고, 971 위치의 “N”은 “A”이며, SEQ ID NO:19에서의 아미노산 잔기 297을 류이신으로, 아미노산 잔기 324를 류이신으로 만든다.
본 발명의 바람직한O. sativaEG307 폴리펩티드는 SEQ ID NO:1, SEQ IDNO:91, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:17, 및/또는 SEQ ID NO:18로 표현되는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
본 발명의 바람직한O. rufipogonEG307 폴리펩티드는 SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, 및/또는 SEQ ID NO:31로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는O. rufipogon폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다. 그와같은 EG307 폴리펩티드는 핵산 시퀀스 SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, 및/또는 SEQ ID NO:31을 갖는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩된다.
폴리뉴클레오타이드 SEQ ID NO:27 및 SEQ ID NO:28은O. rufipogon(5953 계통)에서 EG307 유전자의 5' 및 3' 말단을 나타낸다. SEQ ID NO:27 및 SEQ ID NO:28은 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 23인 것으로 믿어진다. SEQ ID NO:27 및 SEQ ID NO:28의 번역은O. rufipogonEG307 폴리뉴클레오타이드가 오픈 리딩 프레임을 포함한다는 것을 암시한다. 리딩 프레임은 약 446 아미노산의O. rufipogonEG307 폴리펩티드를 인코딩하며, 이의 추론된 아미노산시퀀스는 SEQ ID NO:30으로서 여기서 표현되는데, SEQ ID NO:27의 대략 뉴클레오타이드 18에서 대략 뉴클레오타이드 20에 걸친 구간을 갖는 개시(출발) 코돈 및 SEQ ID NO:28의 대략 뉴클레오타이드 1330에서 대략 뉴클레오타이드 1332에 걸친 구간을 갖는 종결(중지) 코돈을 갖는 오픈 리딩 프레임을 가정하는데, 제 1 엑손은 SEQ ID NO:27의 뉴클레오타이드 1-107의 구간이고, 제 1 인트론은 없으며, 제 2 엑손은 SEQ ID NO:28의 뉴클레오타이드 1-316의 구간이고, 제 2 인트론은 SEQ ID NO:28의 뉴클레오타이드 317-397의 구간이고, 제 3 엑손은 SEQ ID NO:28의 뉴클레오타이드 398-1332의 구간이다. SEQ ID NO:27의 뉴클레오타이드 18에서부터 SEQ ID NO:28의 대략 뉴클레오타이드 1332에 걸쳐있는 오픈 리딩 프레임은 여기서 SEQ ID NO:29로 표현된다.
유사하게,O. rufipogon(5948 계통) 폴리뉴클레오타이드 SEQ ID NO:20의 번역은 뉴클레오타이드 1의 대략 15 뉴클레오타이드 5'로부터 대략 뉴클레오타이드 2385까지의 오픈 리딩 프레임을 암시하는데, 제 1 엑손은 표현되지 않고, 제 1 인트론은 SEQ ID NO:20의 뉴클레오타이드 1-1053의 구간이고, 제 2 엑손은 SEQ ID NO:20의 뉴클레오타이드 1054-1369의 구간이고, 제 2 인트론은 SEQ ID NO:20의 뉴클레오타이드 1370-1450의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:20의 뉴클레오타이드 1451-2447의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:21로서 나타내어지며, 여기서 SEQ ID NO:22로 표현된 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:23 및 SEQ ID NO:24은O. rufipogon(5949 계통)에서 EG307 유전자의 5' 및 3'말단을 나타낸다. SEQ IDNO:23 및 SEQ ID NO:24은 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 13인 것으로 믿어진다. SEQ ID NO:23 및 SEQ ID NO:24의 번역은 SEQ ID NO:23의 대략 뉴클레오타이드 57로부터 SEQ ID NO:24의 대략 뉴클레오타이드 1562까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:23의 뉴클레오타이드 1-146의 구간이고, 제 1 인트론은 SEQ ID NO:24의 뉴클레오타이드 1-230의 구간이고, 제 2 엑손은 SEQ ID NO:24의 뉴클레오타이드 231-546의 구간이고, 제 2 인트론은 SEQ ID NO:24의 뉴클레오타이드 547-627의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:24의 뉴클레오타이드 628-1615의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:25로 표현되며, 여기서 SEQ ID NO:26으로서 표현되는 폴리펩티드를 인코딩한다.
유사하게,O. rufipogon(IRCG 105491 계통) 폴리뉴클레오타이드 SEQ ID NO:90의 번역은 대략 뉴클레오타이드 1에서 대략 뉴클레오타이드 1341까지의 오픈 리딩 프레임을 암시한다. 오픈 리딩 프레임은 여기서 SEQ ID NO:32로 표현되는 폴리펩티드를 인코딩하는 SEQ ID NO:31로서 여기서 표현된다.
본 발명의 바람직한O. rufipogonEG307 폴리펩티드는 SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, 및/또는 SEQ ID NO:31로 표현되는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
본 발명의 바람직한Zea mays parviglumisEG307 폴리펩티드는 SEQ IDNO:66, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:74, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:59, 및/또는 SEQ ID NO:78로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는Zea mays parviglumis폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다. 그와 같은 EG307 폴리펩티드는 핵산 시퀀스 SEQ ID NO:66, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:74, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:59, 및/또는 SEQ ID NO:78을 갖는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩된다.
SEQ ID NO:66의 번역은Zea mays parviglumisEG307 폴리뉴클레오타이드(Benz 계통)가 오픈 리딩 프레임을 포함한다는 것을 암시한다. 리딩 프레임은 약 448 아미노산의Zea mays parviglumisEG307 폴리펩티드를 인코딩하며, 이의 추론된 아미노산 시퀀스는 SEQ ID NO:68로서 여기서 표현되는데, SEQ ID NO:66의 대략 뉴클레오타이드 1에서 대략 뉴클레오타이드 3에 걸친 구간을 갖는 개시(출발) 코돈 및 SEQ ID NO:66의 대략 뉴클레오타이드 2569에서 대략 뉴클레오타이드 2571에 걸친 구간을 갖는 종결(중지) 코돈을 갖는 오픈 리딩 프레임을 가정하는데, 제 1 엑손은 SEQ ID NO:66의 뉴클레오타이드 1-81의 구간이고, 제 1 인트론은 SEQ ID NO:66의 뉴클레오타이드 82-1204의 구간이고, 제 2 엑손은 SEQ ID NO:66의 뉴클레오타이드 1205-1517의 구간이고, 제 2 인트론은 SEQ ID NO:66의 뉴클레오타이드 1518-1618의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:66의 뉴클레오타이드 1619-2644의 구간이다. SEQ ID NO:66의 뉴클레오타이드 3으로부터 대략 뉴클레오타이드 2571에 걸쳐있는 오픈 리딩 프레임은 여기서 SEQ ID NO:67로 표현된다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:69 및 SEQ ID NO:70은Z. mays parviglumis(BK4 계통)에서 EG307 유전자의 5' 및 3'말단을 표현한다. SEQ ID NO:69 및 SEQ ID NO:70은 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 10인 것으로 믿어진다.Z. mays parviglumis(BK4 계통) 폴리뉴클레오타이드 SEQ ID NO:69 및 SEQ ID NO:70의 번역은 SEQ ID NO:69의 대략 뉴클레오타이드 10으로부터 SEQ ID NO:70의 대략 뉴클레오타이드 1728까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:69의 뉴클레오타이드 1-90의 구간이고, 제 1 인트론은 SEQ ID NO:69의 뉴클레오타이드 91-586 및 SEQ ID NO:70의 뉴클레오타이드 1-361의 구간이고, 제 2 엑손은 SEQ ID NO:70의 뉴클레오타이드 362-674의 구간이고, 제 2 인트론은 SEQ ID NO:70의 뉴클레오타이드 675-775의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:11의 뉴클레오타이드 776-1775의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:71로 표현되며, 여기서 SEQ ID NO:72로서 표현되는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:73 및 SEQ ID NO:74은Z. mays parviglumis(IA19 계통)에서 EG307 유전자의 5' 및 3'말단을 표현한다. SEQ ID NO:73 및 SEQ ID NO:74은 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만,약 12인 것으로 믿어진다.Z. mays parviglumis(IA19 계통) 폴리뉴클레오타이드 SEQ ID NO:73 및 SEQ ID NO:74의 번역은 SEQ ID NO:73의 대략 뉴클레오타이드 69으로부터 SEQ ID NO:74의 대략 뉴클레오타이드 1280까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:73의 뉴클레오타이드 1-149의 구간이고, 제 1 인트론은 SEQ ID NO:73의 뉴클레오타이드 150-305의 구간이고, 제 2 엑손은 SEQ ID NO:74의 뉴클레오타이드 1-266의 구간이고, 제 2 인트론은 SEQ ID NO:74의 뉴클레오타이드 227-327의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:74의 뉴클레오타이드 328-1309의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:75로 표현되며, 여기서 SEQ ID NO:76으로서 표현되는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:77 및 SEQ ID NO:59은Z. mays parviglumis(Wilkes 계통)에서 EG307 유전자의 5' 및 3'말단을 표현한다. SEQ ID NO:77 및 SEQ ID NO:59은 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 14인 것으로 믿어진다.Z. mays parviglumis(Wilkes 계통) 폴리뉴클레오타이드 SEQ ID NO:77 및 SEQ ID NO:59의 번역은 SEQ ID NO:77의 대략 뉴클레오타이드 36으로부터 SEQ ID NO:74의 대략 뉴클레오타이드 1598까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:77의 뉴클레오타이드 1-86의 구간이고, 제 1 인트론은 SEQ ID NO:59의 뉴클레오타이드 1-231의 구간이고, 제 2 엑손은 SEQ ID NO:59의 뉴클레오타이드 232-544의 구간이고, 제 2 인트론은 SEQ ID NO:59의 뉴클레오타이드 545-645의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:59의 뉴클레오타이드 656-1640의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:78로 표현되며, 여기서 SEQ ID NO:79로서 표현되는 폴리펩티드를 인코딩한다.
본 발명의 바람직한 EG307 폴리펩티드는 SEQ ID NO:33, SEQ ID NO:34, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:63, 및/또는 SEQ ID NO:64로 표현되는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
본 발명의 하나의 바람직한Zea mays maysEG307 폴리펩티드는 엄중한 혼성화 조건 하에서 SEQ ID NO:33, SEQ ID NO:34, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:63, 및/또는 SEQ ID NO:64로 나타내는 폴리뉴클레오타이드의 상보물과 혼성화되는Zea mays mays폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다. 그와 같은 EG307 폴리펩티드는 핵산 시퀀스 SEQ ID NO:33, SEQ ID NO:34, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:54, SEQ IDNO:55, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:59, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:63, 및/또는 SEQ ID NO:64 를 갖는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩된다.
폴리뉴클레오타이드 SEQ ID NO:33 및 SEQ ID NO:34 는 Zea mays mays(BS 7 계통)에서 EG307 유전자의 5' 및 3'말단을 표현한다. SEQ ID NO:33 및 SEQ ID NO:34는 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 21인 것으로 믿어진다. SEQ ID NO:33 및 SEQ ID NO:34의 번역은Zea mays maysEG307 폴리뉴클레오타이드가 오픈 리딩 프레임을 포함한다는 것을 암시한다. 리딩 프레임은 약 448 아미노산의Zea mays maysEG307 폴리펩티드를 인코딩하며, 이의 추론된 아미노산 시퀀스는 SEQ ID NO:36으로서 여기서 표현되는데, SEQ ID NO:33의 대략 뉴클레오타이드 3에서 대략 뉴클레오타이드 5에 걸친 구간을 갖는 개시(출발) 코돈 및 SEQ ID NO:34의 대략 뉴클레오타이드 1396에서 대략 뉴클레오타이드 1398에 걸친 구간을 갖는 종결(중지) 코돈을 갖는 오픈 리딩 프레임을 가정하는데, 제 1 엑손은 SEQ ID NO:33의 뉴클레오타이드 1-83의 구간이고, 제 1 인트론은 SEQ ID NO:33의 뉴클레오타이드 84-180 및 SEQ ID NO:34의 뉴클레오타이드 1-31의 구간이고, 제 2 엑손은 SEQ ID NO:34의 뉴클레오타이드 32-344의 구간이고, 제 2 인트론은 SEQ ID NO:34의 뉴클레오타이드 345-445의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:34의 뉴클레오타이드 446-1447의 구간이다. SEQ ID NO:33의 뉴클레오타이드 3에서부터 SEQ ID NO:34의 대략 뉴클레오타이드 1398에 걸쳐있는 오픈 리딩 프레임은 여기서 SEQ IDNO:35로 표현된다.
유사하게,Zea mays mays(HuoBai 계통) 폴리뉴클레오타이드 SEQ ID NO:37 의 번역은 대략 뉴클레오타이드 28으로부터 대략 뉴클레오타이드 2599까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:37의 뉴클레오타이드 1-108의 구간이고, 제 1 인트론은 SEQ ID NO:37의 뉴클레오타이드 109-1232의 구간이고, 제 2 엑손은 SEQ ID NO:37의 뉴클레오타이드 1233-1545의 구간이고, 제 2 인트론은 SEQ ID NO:37의 뉴클레오타이드 1546-1646의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:37의 뉴클레오타이드 1647-2646의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:38로 표현되며, 여기서 SEQ ID NO:39으로서 표현되는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:40 및 SEQ ID NO:41은Z. mays mays (Makki 계통)에서 EG307 유전자의 5' 및 3' 말단을 표현한다. SEQ ID NO:40 및 SEQ ID NO:41은 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 20인 것으로 믿어진다.Z. mays mays (Makki 계통) 폴리뉴클레오타이드 SEQ ID NO:40 및 SEQ ID NO:41의 번역은 SEQ ID NO:40의 대략 뉴클레오타이드 61으로부터 SEQ ID NO:41의 대략 뉴클레오타이드 2263까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:40의 뉴클레오타이드 1-141의 구간이고, 제 1 인트론은 SEQ ID NO:40의 뉴클레오타이드 142-262 및 SEQ ID NO:41의 뉴클레오타이드 1-896의 구간이고, 제 2 엑손은 SEQ ID NO:41의 뉴클레오타이드 897-1209의 구간이고, 제 2 인트론은SEQ ID NO:41의 뉴클레오타이드 1210-1310의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:41의 뉴클레오타이드 1311-2311의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:42로 표현되며, 여기서 SEQ ID NO:43로서 표현되는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:44, SEQ ID NO:45 및 SEQ ID NO:46 은Z. mays mays(Min13 계통)에서 EG307 유전자의 5' 및 3' 말단을 표현한다. SEQ ID NO:44, SEQ ID NO:45 및 SEQ ID NO:46은 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, SEQ ID NO:44 및 SEQ ID NO:45 사이는 19, 그리고 SEQ ID NO:45 및 SEQ ID NO:46 사이는 17인 것으로 믿어진다.Z. mays mays(Min13 계통) 폴리뉴클레오타이드 SEQ ID NO:44, SEQ ID NO:45 및 SEQ ID NO:46의 번역은 SEQ ID NO:44의 대략 뉴클레오타이드 45으로부터 SEQ ID NO:46의 대략 뉴클레오타이드 1741까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:44의 뉴클레오타이드 1-125의 구간이고, 제 1 인트론은 SEQ ID NO:45의 뉴클레오타이드 1-198 및 SEQ ID NO:46의 뉴클레오타이드 1-374의 구간이고, 제 2 엑손은 SEQ ID NO:46의 뉴클레오타이드 375-687의 구간이고, 제 2 인트론은 SEQ ID NO:46의 뉴클레오타이드 688-788의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:46의 뉴클레오타이드 789-1787의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:47로 표현되며, 여기서 SEQ ID NO:48으로서 표현되는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:49 및 SEQ ID NO:50는Zea maysmays(Pira 계통)에서 EG307 유전자의 5' 및 3'말단을 표현한다. SEQ ID NO:49 및 SEQ ID NO:50는 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않다.Zea mays mays(Pira 계통) EG307 폴리뉴클레오타이드 SEQ ID NO:49 및 SEQ ID NO:50의 번역은 SEQ ID NO:49의 대략 뉴클레오타이드 31로부터 SEQ ID NO:50의 대략 뉴클레오타이드 1722까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:49의 뉴클레오타이드 1-111의 구간이고, 제 1 인트론은 SEQ ID NO:49의 뉴클레오타이드 112-495 및 SEQ ID NO:50의 뉴클레오타이드 1-355의 구간이고, 제 2 엑손은 SEQ ID NO:50의 뉴클레오타이드 356-668의 구간이고, 제 2 인트론은 SEQ ID NO:50의 뉴클레오타이드 669-769의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:50의 뉴클레오타이드 770-1768의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:51로 표현되며, 여기서 SEQ ID NO:52으로서 표현되는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:53 및 SEQ ID NO:54는Zea mays mays(Sari 계통)에서 EG307 유전자의 5' 및 3'말단을 표현한다. SEQ ID NO:53 및 SEQ ID NO:54는 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 22인 것으로 믿어진다.Zea mays mays(Sari 계통) EG307 폴리뉴클레오타이드 SEQ ID NO:53 및 SEQ ID NO:54의 번역은 SEQ ID NO:53의 대략 뉴클레오타이드 19로부터 SEQ ID NO:54의 대략 뉴클레오타이드 1756까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:53의 뉴클레오타이드 1-99의 구간이고, 제 1 인트론은 SEQ IDNO:53의 뉴클레오타이드 100-212 및 SEQ ID NO:54의 뉴클레오타이드 1-389의 구간이고, 제 2 엑손은 SEQ ID NO:54의 뉴클레오타이드 390-702의 구간이고, 제 2 인트론은 SEQ ID NO:54의 뉴클레오타이드 703-803의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:54의 뉴클레오타이드 804-1803의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:55로 표현되며, 여기서 SEQ ID NO:56으로서 표현되는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:57 및 SEQ ID NO:58는Zea mays mays(Smena 계통)에서 EG307 유전자의 5' 및 3'말단을 표현한다. SEQ ID NO:57 및 SEQ ID NO:58는 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 14인 것으로 믿어진다.Zea mays mays(Smena 계통) EG307 폴리뉴클레오타이드 SEQ ID NO:57 및 SEQ ID NO:58의 번역은 SEQ ID NO:57의 대략 뉴클레오타이드 68로부터 SEQ ID NO:58의 대략 뉴클레오타이드 2199까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:57의 뉴클레오타이드 1-148의 구간이고, 제 1 인트론은 SEQ ID NO:57의 뉴클레오타이드 149-305 및 SEQ ID NO:58의 뉴클레오타이드 1-834의 구간이고, 제 2 엑손은 SEQ ID NO:58의 뉴클레오타이드 835-1147의 구간이고, 제 2 인트론은 SEQ ID NO:58의 뉴클레오타이드 1148-1248의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:58의 뉴클레오타이드 1249-2208의 구간이다. 부가적으로, 시퀀스 SEQ ID NO:59는 SEQ ID NO:59의 뉴클레오타이드 738 이후에 출발시 삭제를 함유한다. 오픈 리딩 프레임은 여기서 SEQ ID NO:60로 표현되며, 여기서 SEQ ID NO:61으로서표현되는 폴리펩티드를 인코딩한다.
유사하게, 폴리뉴클레오타이드 SEQ ID NO:62 및 SEQ ID NO:63는Zea mays mays(W22 계통)에서 EG307 유전자의 5' 및 3' 말단을 표현한다. SEQ ID NO:62 및 SEQ ID NO:63는 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 22인 것으로 믿어진다.Zea mays mays(W22 계통) 폴리뉴클레오타이드 SEQ ID NO:62 및 SEQ ID NO:63의 번역은 SEQ ID NO:62의 대략 뉴클레오타이드 1부터 SEQ ID NO:63의 대략 뉴클레오타이드 1367까지의 오픈 리딩 프레임을 암시하며, 제 1 엑손은 SEQ ID NO:62의 뉴클레오타이드 1-81의 구간이고, 제 1 인트론은 SEQ ID NO:62의 뉴클레오타이드 82-893의 구간이고, 제 2 엑손은 SEQ ID NO:63의 뉴클레오타이드 1-313의 구간이고, 제 2 인트론은 SEQ ID NO:63의 뉴클레오타이드 314-414의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:63의 뉴클레오타이드 415-1411의 구간이다. 오픈 리딩 프레임은 여기서 SEQ ID NO:64로 표현되며, 여기서 SEQ ID NO:65로서 표현되는 폴리펩티드를 인코딩한다.
본 발명의 하나의 바람직한Z. mays maysEG307 폴리펩티드는 SEQ ID NO:33, SEQ ID NO:34, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:63, 및/또는 SEQ ID NO:64로 표현되는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
본 발명의 하나의 바람직한O. rufipogonEG307 폴리펩티드는 SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, 및/또는 SEQ ID NO:31로 표현되는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리펩티드이다.
본 발명의 하나의 바람직한Zea diploperennisEG307 폴리펩티드는 SEQ ID NO:80, SEQ ID NO:81, 및/또는 SEQ ID NO:82로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는Zea mays parviglumis폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다. 그와 같은 EG307 폴리펩티드는 핵산 시퀀스 SEQ ID NO:80, SEQ ID NO:81, 및/또는 SEQ ID NO:82를 갖는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩된다.
폴리뉴클레오타이드 SEQ ID NO:80 및 SEQ ID NO:81는Zea diploperennis에서 EG307 유전자의 5' 및 3' 말단을 표현한다. SEQ ID NO:80 및 SEQ ID NO:81는 다수의 뉴클레오타이드들에 의해 접합되며, 이의 정확한 개수는 유전자의 비코딩 부위에서 잠재적 삽입/삭제로 인해 알려져 있지 않지만, 약 24인 것으로 믿어진다. 본 발명의 하나의 바람직한Zea diploperennisEG307 폴리펩티드는 SEQ ID NO:80 및 SEQ ID NO:81로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는Zea diploperennis폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다. 그와 같은 EG307 폴리펩티드는 핵산 시퀀스 SEQ ID NO:80 및 SEQ IDNO:81를 갖는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩된다.
SEQ ID NO:80 및 SEQ ID NO:81의 번역은Zea mays diploperennisEG307 폴리뉴클레오타이드가 오픈 리딩 프레임을 포함한다는 것을 암시한다. 리딩 프레임은 약 448 아미노산의Zea diploperennisEG307 폴리펩티드를 인코딩하며, 이의 추론된 아미노산 시퀀스는 SEQ ID NO:83으로서 여기서 표현되는데, SEQ ID NO:80의 대략 뉴클레오타이드 21에서 대략 뉴클레오타이드 23에 걸친 구간을 갖는 개시(출발) 코돈 및 SEQ ID NO:81의 대략 뉴클레오타이드 1656에서 대략 뉴클레오타이드 1658에 걸친 구간을 갖는 종결(중지) 코돈을 갖는 오픈 리딩 프레임을 가정하는데, 제 1 엑손은 SEQ ID NO:80의 뉴클레오타이드 1-101의 구간이고, 제 1 인트론은 SEQ ID NO:80의 뉴클레오타이드 102-225 및 SEQ ID NO:81의 뉴클레오타이드 1-291의 구간이고, 제 2 엑손은 SEQ ID NO:81의 뉴클레오타이드 292-313의 구간이고, 제 2 인트론은 SEQ ID NO:81의 뉴클레오타이드 314-705의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:81의 뉴클레오타이드 706-1672의 구간이다. SEQ ID NO:80의 뉴클레오타이드 21에서부터 SEQ ID NO:81의 대략 뉴클레오타이드 1658에 걸쳐있는 오픈 리딩 프레임은 여기서 SEQ ID NO:82로 표현된다.
본 발명의 하나의 바람직한Z. diploperennisEG307 폴리펩티드는 SEQ ID NO:80, SEQ ID NO:81, 및/또는 SEQ ID NO:82로 표현되는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
본 발명의 하나의 바람직한Zea luxuriansEG307 폴리펩티드는 SEQ ID NO:84 및/또는 SEQ ID NO:85로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는Z. luxurians폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다. 그와 같은 EG307 폴리펩티드는 핵산 시퀀스 SEQ ID NO:84 및/또는 SEQ ID NO:85를 갖는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩된다.
SEQ ID NO:84의 번역은Zea luxuriansEG307 폴리뉴클레오타이드가 오픈 리딩 프레임을 포함한다는 것을 암시한다. 리딩 프레임은 약 448 아미노산의Zea luxuriansEG307 폴리펩티드를 인코딩하며, 이의 추론된 아미노산 시퀀스는 SEQ ID NO:86으로서 여기서 표현되는데, SEQ ID NO:84의 대략 뉴클레오타이드 5에서 대략 뉴클레오타이드 7에 걸친 구간을 갖는 개시(출발) 코돈 및 SEQ ID NO:84의 대략 뉴클레오타이드 2365에서 대략 뉴클레오타이드 2367에 걸친 구간을 갖는 종결(중지) 코돈을 갖는 오픈 리딩 프레임을 가정하는데, 제 1 엑손은 SEQ ID NO:84의 뉴클레오타이드 1-85의 구간이고, 제 1 인트론은 SEQ ID NO:84의 뉴클레오타이드 86-998의 구간이고, 제 2 엑손은 SEQ ID NO:84의 뉴클레오타이드 999-1311의 구간이고, 제 2 인트론은 SEQ ID NO:84의 뉴클레오타이드 1312-1314의 구간이고, 그리고 제 3 엑손은 SEQ ID NO:84의 뉴클레오타이드 1415-2423의 구간이다. SEQ ID NO:84의 뉴클레오타이드 5에서부터 대략 뉴클레오타이드 2367에 걸쳐있는 오픈 리딩 프레임은 여기서 SEQ ID NO:85로 표현된다.
본 발명의 하나의 바람직한Zea luxuriansEG307 폴리펩티드는 SEQ ID NO:84및/또는 SEQ ID NO:85로 표현되는 폴리뉴클레오타이드와 엄중한 혼성화 조건 하에서 혼성화되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
각종O. sativa,O. rufipogon,Z. mays mays,Z. mays parviglumis,Z. diploperennisZ. luxuriansEG307 핵산 시퀀스 및 아미노산 시퀀스의 비교는 이들 식물 종들이 유사한 EG307 유전자 및 폴리펩티드들을 보유하고 있음을 지적하고 있다.O. sativaO. rufipogon의 여러 계통들로부터 나온 EG307의 코딩 영역의 뉴클레오타이드 시퀀스는, 서로 비교될 때, 99.0% 시퀀스 동일성을 갖는데, 이것은 이들이 상동성임을 명백하게 한다. 모든 쌀 시퀀스는, 선조와 현생 둘다, 동일한 중지 코돈 (TAG)을 공유하며, 그리고 (지금까지 우리가 수집해왔던 5' UTR에 대해), 5' UTR 시퀀스들은 98.4% 시퀀스 동일성을 갖는다.O. sativaO. rufipogon의 여러 계통들의 프로테인 시퀀스들은 98.2% 시퀀스 동일성을 가지며, 이들이 상동성 시퀀스임을 다시 입증한다. 쌀로부터 나온 EG307의 프로테인 시퀀스들은 옥수수에서 나온 EG307의 프로테인 시퀀스에 대략 94% 동일하며, 그들의 상동관계를 입증한다. 옥수수 EG307 및 테오신테(teosinte) EG307의 프로테인 시퀀스들은 99.8% 시퀀스 동일성을 갖는다.
O. sativa,O. rufipogon,Z. mays mays,Z. mays parviglumis,Z. diploperennisZ. luxuriansEG307 핵산 시퀀스 및 아미노산 시퀀스들 사이의 동일성 정도를 알아낸다는 것은, 여기서 개시된 폴리펩티드 및 핵산 시퀀스가 주어진 임의의 식물 EG307 폴리펩티드 및 폴리뉴클레오타이드를 수득하는 능력을 뒷받침한다. 이들 식물 EG307 폴리펩티드들 및 이들을 인코딩하는 폴리뉴클레오타이드는 식물에서 산출량을 증가시키는 유용성을 갖는 신규 화합물을 나타낸다.
본 발명의 바람직한 식물 EG307 폴리펩티드는 본 발명의O. sativa,O. rufipogon,Z. mays mays,Z. mays parviglumis,Z. diploperennisZ. luxuriansEG307 폴리펩티드에 대해 여기서 개시된 아미노산 시퀀스들의 하나 또는 그 이상에 대해 적어도 대략 30%, 바람직하게는 적어도 대략 50%, 더욱 바람직하게는 적어도 대략 75%, 더욱 바람직하게는 적어도 대략 80%, 더욱 바람직하게는 적어도 대략 85%, 더욱 바람직하게는 적어도 대략 90%, 더욱 바람직하게는 적어도 대략 95%, 더욱 바람직하게는 적어도 대략 98%가 동일한 아미노산 시퀀스로 이루어진 폴리펩티드를 포함한다. 본 발명의 더욱 바람직한 식물 EG307 폴리펩티드들은 다음을 포함한다 : SEQ ID NO. 1 및/또는 SEQ ID NO:2의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:3의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:4, SEQ ID NO:81 및/또는 SEQ ID NO:5 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:6의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:7 및/또는 SEQ ID NO:8 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:9의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:10, SEQ ID NO:11, 및/또는 SEQ ID NO:12 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:13의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:14 및/또는 SEQ ID NO:15 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:16의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐;
SEQ ID NO:17 및/또는 SEQ ID NO:18 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:19의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:20 및/또는 SEQ ID NO:21 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:21의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:23, SEQ ID NO:24, 및/또는 SEQ ID NO:25 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:26의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:27, SEQ ID NO:28 및/또는 SEQ ID NO:29 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:30의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:90 및/또는 SEQ ID NO:31 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:32의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:33, SEQ ID NO:34 및/또는 SEQ ID NO:35 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:36의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:37 및/또는 SEQ ID NO:38 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:39의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:40, SEQ ID NO:41, 및/또는 SEQ ID NO:42 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:43의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, 및/또는 SEQ ID NO:47 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:48의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:49, SEQ ID NO:50, 및/또는 SEQ ID NO:51 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:52의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:53, SEQ ID NO:54, 및/또는 SEQ ID NO:55 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:56의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:57, SEQ ID NO:58, 및/또는 SEQ ID NO:60 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:61 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:62, SEQ ID NO:63, 및/또는 SEQ ID NO:64 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:65의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:66, 및/또는 SEQ ID NO:67 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:68의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:69, SEQ ID NO:70, 및/또는 SEQ ID NO:71 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:72의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:73, SEQ ID NO:74, 및/또는 SEQ ID NO:75 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:76의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:77, SEQ ID NO:59, 및/또는 SEQ ID NO:78 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:79의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:80, SEQ ID NO:81, 및/또는 SEQ ID NO:82 의 적어도일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:83 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; 그리고 SEQ ID NO:84, 및/또는 SEQ ID NO:85 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:86의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐. 여기서 사용된 바처럼, 폴리뉴클레오타이드 또는 폴리펩티드의 “적어도 일부분”이란, 상술한 바와 같이 그러한 시퀀스의 최소 크기 특성을 갖은 일부분, 또는 전체 길이 분자까지 및 이를 포함하는, 전체 길이 분자의 임의의 더큰 단편을 의미한다. 예를 들면, 폴리뉴클레오타이드의 일부분은 12 뉴클레오타이드, 13 뉴클레오타이드, 14 뉴클레오타이드, 15 뉴클레오타이드, 등등에서 전체 길이 폴리뉴클레오타이드 까지 될 수 있다. 유사하게, 폴리펩티드의 일부분은 4 아미노산, 5 아미노산, 6 아미노산, 7 아미노산, 등등에서 전체 길이 폴리펩티드까지 될 수 있다. 상기 논의된 바처럼, 혼성화 프로브로서 유용한 폴리뉴클레오타이드의 일부분은 12 뉴클레오타이드처럼 짧을 수도 있다. 에피토프로서 유용한 폴리펩티드는 4 아미노산처럼 짧을 수도 있다. 전체-길이 폴리펩티드의 기능을 수행하는 폴리펩티드의 일부는 일반적으로 4 아미노산보다 더 길 것이다.
본 발명의 특히 바람직한 식물 EG1117 폴리펩티드들은 SEQ ID NO:3, SEQ ID NO:6, SEQ ID NO:9, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:19, SEQ ID NO:22, SEQ ID NO:26, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:36, SEQ ID NO:39, SEQ ID NO:43, SEQ ID NO:48, SEQ ID NO:52, SEQ ID NO:56, SEQ ID NO:61, SEQ ID NO:65, SEQ ID NO:68. SEQ ID NO:72, SEQ ID NO:76, SEQ ID NO:79, SEQ ID NO:83 및/또는SEQ ID NO:86 (이들로 제한되지는 않지만, 이의 인코딩된 폴리펩티드, 전체-길이 폴리펩티드, 가공된 폴리펩티드, 융합 폴리펩티드 및 다가 폴리펩티드를 포함함) 및 상술한 SEQ ID NO들의 적어도 일부를 포함하는 폴리펩티드의 절단된 상동체들인 폴리펩티드를 포함하는 폴리펩티드들이다. 그와 같은 폴리펩티드를 제조하는 방법의 예들은 실시예 섹션을 포함하여 여기에 개시되어 있다.
B. EG1117 폴리펩티드
본 발명의 한 구현예는 단리된 식물 EG1117 폴리펩티드이다. 여기서 사용된 바처럼, EG307 폴리펩티드는, 한 구현예에 있어서, 약 552 아미노산의O. rufipogon폴리펩티드에 관련되고 도 7에 서술된 시퀀스 (SEQ ID NO:95)을 갖는 폴리펩티드이다. 이러한 폴리펩티드의 독창적인 동정은 실시예들에 상술되어 있다. 바람직한 EG1117 폴리펩티드는 엄중한 혼성화 조건하에서 다음 유전자들 중의 하나로 혼성화되는 폴리뉴클레오타이드에 의해 인코딩된다: (a)O. sativaEG1117 폴리펩티드를 인코딩하는 유전자 (즉,O. sativagene); (b)O. rufipogonEG1117 폴리펩티드를 인코딩하는 유전자 (즉,O. rufipogongene); (c)Zea mays maysEG1117를 인코딩하는 유전자; (d) aZea mays parviglumisEG1117 폴리펩티드를 인코딩하는 유전자 (즉,Z. mays parviglumisgene).
여기서 사용된 바처럼,O. sativaEG1117 유전자는 그 유전자에 의해 인코딩되는O. sativa EG1117 폴리펩티드의 생산량을 제어하는 조절성 영역 (예를 들면, 이로 한정되지는 않지만, 번역 또는 전-번역 제어 영역)과 같은 자연산O. sativaEG307 유전자와 관련된 모든 핵산 시퀀스, 뿐만 아니라 코딩 영역 그 자체를 포함한다. 하나의 구현예에 있어서,O. sativaEG1117 유전자는 핵산 시퀀스 SEQ ID NO:4를 포함한다.
핵산 시퀀스 SEQ ID NO:4 는 cDNA (상보 DNA) 폴리뉴클레오타이드의 추론된 시퀀스를 나타내며, 이의 제조는 실시예에 개시되어 있다. 핵산 시퀀싱 기법은 전적으로 무오류성이 아니기 때문에 SEQ ID NO:4 (또한 여기서 표현된 다른 시퀀스)는, 기껏해야, 본 발명의O. sativaEG307 폴리펩티드를 인코딩하는 폴리뉴클레오타이드의 외관상 핵산 시퀀스를 나타낸다는 것을 유념해야 한다.
또 다른 구현예에 있어서,O. sativa EG1117 유전자는 SEQ ID NO:92 및/또는 SEQ ID NO:93에 유사하지만 동일하지는 않은 시퀀스를 포함하는 대립유전자 변체일 수 있다.
본 발명의 EG1117 폴리펩티드는 기능 어세이에서 자연산 EG1117 의 기능을 수행하는 그의 능력에 의해 동정될 수도 있다. “자연산 EG1117 폴리펩티드”란,O. sativa,O. rufipogon,Z. mays mays및/또는Z. mays parviglumis의 전체 길이 EG1117 폴리펩티드를 의미한다. 구절 “기능 어세이에서 자연산 EG1117 의 기능을 수행할 능력이 있는”이라는 것은 그 폴리펩티드가 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 10%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, EG1117 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 20%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, EG1117 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 30%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, EG1117 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 40%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, EG1117 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 50%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 60%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 70%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 80%를 갖는다는 것을 의미한다. 다른 바람직한 구현예에 있어서, 폴리펩티드는 기능 어세이에서 자연산 폴리펩티드의 활성도의 적어도 약 90%를 갖는다는 것을 의미한다. 기능 어세이의 예들은 항체-바인딩 어세이, 또는 산출량-증가 어세이를 포함하며, 본 명세서에서 다른 곳에서 상술된 바와 같다.
여기서 사용된 바처럼, 단리된 식물 EG1117 폴리펩티드는 전체-길이의 폴리펩티드 또는 이러한 폴리펩티드의 모든 상동체일 수 있다. 하나의 구현예에 있어서, 상동체들은 당업계 숙련인들에게 공지된 기법을 사용하여 면역원으로서 동물에 투여될 때, 동물들은 적어도 하나의 자연산 EG1117 폴리펩티드에 대해 인간 및/또는 세포 면역반응을 생성할 것이다. EG1117 상동체들은 또한 기능 어세이에서 EG1117 의 기능을 수행하는 그들의 능력에 의해 선택될 수 있다.
식물 EG1117 폴리펩티드 상동체들은 자연산 대립유전자 변체 또는 자연 돌연변이의 결과일 수 있다. 폴리펩티드로의 직접 개질 또는 예를 들면 랜덤 또는 타겟화된 돌연변이를 실현하는 전통적인 또는 재조합 DNA 기법을 사용하여 폴리펩티드를 인코딩하는 유전자로의 개질을 포함하는, 그러나 이들로 한정되지는 않는, 당업계에 공지된 기법을 사용하여, 본 발명의 EG307 폴리펩티드 상동체들을 또한 제조할 수 있다.
본 발명에 따르면, 미메토프(mimetope)는 기능 어세이에서 본 발명의 EG307 폴리펩티드의 기능을 수행하는 본 발명의 단리된 식물 EG307 폴리펩티드의 능력을 모사할 수 있는 임의의 화합물을 지칭한다.
미메토프의 예들은, 이들로 한정되지는 않지만, 본 발명의 단리된 폴리펩티드의 하나 이상의 에피토프를 모사하는 적어도 하나의 바인딩 사이트를 포함하는, 항이디오타잎 항체 또는 이의 단편; 단리된 폴리펩티드의 비폴리펩티드성 면역원성 부위 (예. 카보하이드레이트 구조); 및 본 발명의 단리된 폴리펩티드의 적어도 하나의 에피토프에 유사한 구조를 갖는, 핵산을 포함한 합성 또는 자연산 유기 분자를 포함한다. 이러한 미메토프들은 본 발명의 폴리펩티드의 컴퓨터-생성된 구조를 사용하여 설계될 수 있다. 미메토프들은 올리고뉴클레오타이드, 펩타이드 또는 다른 유기 분자와 같은 분자들의 랜덤 시료를 발생시키고, 이러한 시료들을 대응하는 결합쌍을 사용하는 친화적 크로마토그래피 기법에 의해 스크리닝함으로써 또한 수득될 수 있다.
본 발명의 EG307 폴리펩티드 상동체의 최소 크기는 대응하는 자연산 폴리펩티드를 인코딩하는 폴리뉴클레오타이드의 상보 시퀀스와 안정한 하이브리드를 형성할 수 있는 폴리뉴클레오타이드에 의해 인코딩되는데 충분한 크기이다. 최소 크기특성은 여기서 개시된다.
임의의 식물 EG1117 폴리펩티드는 본 발명의 적절한 폴리펩티드이다. EG1117 폴리펩티드를 단리하기 위해 (자연산 폴리펩티드의 단리 또는 재조합 또는 합성 기법에 의한 폴리펩티드의 제조를 포함함) 적절한 식물들은 제목 “EG307 폴리펩티드”의 섹션에서 기술된 것들을 포함한다.
본 발명의 바람직한 식물 EG1117 폴리펩티드는 식물에서 발현되거나 조절되었을 때 식물의 산출량을 증가시키는 능력이 있는 화합물이다.
본 발명의 하나의 구현예는 융합 세그먼트에 첨부된 EG307 폴리펩티드-함유 영역을 포함하는 융합 폴리펩티드이다.
본 발명의 바람직한 식물 EG1117 폴리펩티드는 쌀 EG1117 폴리펩티드 및 옥수수 EG1117 폴리펩티드이다. 더욱 바람직한 EG1117 폴리펩티드는O. sativa,O. rufipogon,Z. mays mays, 및Zea mays parviglumisEG1117 폴리펩티드들이다.O. sativa계통주는 니폰바레 (Nipponbare), 아즈세나(Azucena), 및 카살라트(Kasalath) 1, 2, 3 및 4, 테킹(Teqing), 레몬트 (Lemont) 및 IR64를 포함한다.Z. mays parviglumis계통주들은 Benz, BK4, IA19 및 윌크스(Wilkes)를 포함한다.Z. mays mays계통주들은 BS7, 후오바이 (HuoBai), 마끼(Makki), 민(Min) 13, 피라(Pira), 사리(Sari), 스메나(Smena), 및 W22를 포함한다.
본 발명의 하나의 바람직한O. rufipogonEG1117 폴리펩티드는 SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:97, 및/또는 SEQ ID NO:98로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는O. rufipogon폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
본 발명의 하나의 바람직한O. sativaEG1117 폴리펩티드는 SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:113, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:117로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는O. sativa폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
본 발명의 하나의 바람직한Z. mays maysEG1117 폴리펩티드는 SEQ ID NO:119, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:123, SEQ ID NO:124, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:128, SEQ ID NO:129, SEQ ID NO:130, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:136, SEQ. ID NO:137, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:141, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:145, SEQ ID NO:146, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:150, SEQ ID NO:151, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:155 로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는 Zea mays mays폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
본 발명의 하나의 바람직한Z. mays parviglumisEG1117 폴리펩티드는 SEQ ID NO:157, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:161, SEQ ID NO:162, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:166, SEQ ID NO:167, 및/또는 SEQ ID NO:168 로 표현되는 폴리뉴클레오타이드의 상보물과 엄중한 혼성화 조건 하에서 혼성화되는Z. mays parviglumis폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드이다.
쌀에 대한 EG1117 게놈성 핵산 시퀀스의 조사는, 그 유전자가 제 1 엑손 영역, 제 1 인트론 영역, 제 2 엑손 영역, 제 2 인트론 영역, 제 3 엑손 영역, 제 3 인트론 영역, 및 제 4 엑손 영역을 포함하는 여러 개의 영역으로 이루어진다는 것을 지적한다. EG1117 쌀 및 쌀 조상 게놈성 핵산 시퀀스의 각각에 있어서 이들 영역들의 위치는 하기 표에 요약한다:
게놈성 시퀀스의 번역은O. rufipogonO. sativaEG1117 폴리뉴클레오타이드가 오픈 리딩 프레임을 포함한다는 것을 암시한다.O. sativa니폰바레 계통주의 추론된 단백질 시퀀스는 BLAST 검색을 수행하는데 사용되었다. 아라비돕시스 PTR2-B (히스티딘 수송 단백질, NP_178313)에 대한 매우 강력한 단백질 BLAST 히트는, 불과 약 30 코돈의 코딩 시퀀스 (CDS)가 쌀 시퀀스에서 누락되었음을 암시한다(도 8)
마지막으로, 추론된 코딩 시퀀스 및 단백질 시퀀스는 다음과 같이 표현된다:
EG1117의 부분 시퀀스가 옥수수 및 테오신테(teosinte)에서 또한 정해졌다.이 정보는 하기 표에 요약되어 있다.
게놈성 시퀀스의 번역은Z. mays maysZ. mays parviglumisEG1117 폴리뉴클레오타이드가 오픈 리딩 프레임을 포함한다는 것을 암시한다.O. sativa니폰바레 계통주의 추론된 단백질 시퀀스는 BLAST 검색을 수행하는데 사용되었다. 오픈 리딩 프레임 정보의 요약은 하기 표에 나타낸다:
본 발명의 바람직한 식물 EG1117 폴리펩티드는 본 발명의O. sativa,O. rufipogon,Z. mays maysZ. mays parviglumisEG1117 폴리펩티드에 대해 여기서 개시된 아미노산 시퀀스들의 하나 또는 그 이상에 대해 적어도 대략 30%, 바람직하게는 적어도 대략 50%, 더욱 바람직하게는 적어도 대략 75%, 더욱 바람직하게는 적어도 대략 80%, 더욱 바람직하게는 적어도 대략 85%, 더욱 바람직하게는 적어도 대략 90%, 더욱 바람직하게는 적어도 대략 95%, 더욱 바람직하게는 적어도 대략 98%가 동일한 아미노산 시퀀스로 이루어진 폴리펩티드를 포함한다. 본 발명의 더욱 바람직한 식물 EG307 폴리펩티드들은 다음을 포함한다 : SEQ ID NO. 92, SEQ ID NO. 93, 및/또는 SEQ ID NO:94 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:95의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:96, SEQ ID NO:97 및/또는 SEQ ID NO:98 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:99의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:100 및/또는 SEQ ID NO:101 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:102의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:103, 및/또는 SEQ ID NO:104 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:105의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:106 및/또는 SEQ ID NO:107 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:108 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:09 및/또는 SEQ ID NO:110 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:111 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:112, SEQ ID NO:113 및/또는 SEQ ID NO:114 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:115의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:116 및/또는 SEQ ID NO:117 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:118 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:119 및/또는 SEQ ID NO:120 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:121 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:122, SEQ ID NO:123 SEQ ID NO:124 및/또는 SEQ ID NO:125 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:126의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:127, SEQ ID NO:128, SEQ ID NO:129 및/또는 SEQ ID NO:130 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:131 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:132 및/또는 SEQ ID NO:133 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:134의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:135, SEQ ID NO:136, SEQ ID NO:137, 및/또는 SEQ ID NO:138 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:139 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:140, SEQ ID NO:141, 및/또는 SEQ ID NO:142 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:143의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:144, SEQ ID NO:145, SEQ ID NO:146 및/또는 SEQ ID NO:147 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:148의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:149, SEQ ID NO:150, SEQ ID NO:151, 및/또는 SEQ ID NO:152 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:153의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:154 및/또는 SEQ ID NO:155 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:156 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:157, 및/또는 SEQ ID NO:158 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:159 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; SEQ ID NO:160, SEQ ID NO:161, SEQ ID NO:162, 및/또는 SEQ ID NO:163 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:164 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐; 및 SEQ ID NO:165, SEQ IDNO:166, SEQ ID NO:167, 및/또는 SEQ ID NO:168 의 적어도 일부분에 의해 인코딩되는 폴리펩티드, 및 그 자체로서, SEQ ID NO:169 의 적어도 일부분을 포함하는 아미노산 시퀀스를 가짐. 여기서 사용된 바처럼, 폴리뉴클레오타이드 또는 폴리펩티드의 “적어도 일부분”이란, 상술한 바와 같이 그러한 시퀀스의 최소 크기 특성을 갖은 일부분, 또는 전체 길이 분자까지 및 이를 포함하는, 전체 길이 분자의 임의의 더큰 단편을 의미한다. 예를 들면, 폴리뉴클레오타이드의 일부분은 12 뉴클레오타이드, 13 뉴클레오타이드, 14 뉴클레오타이드, 15 뉴클레오타이드, 등등에서 전체 길이 폴리뉴클레오타이드 까지 될 수 있다. 유사하게, 폴리펩티드의 일부분은 4 아미노산, 5 아미노산, 6 아미노산, 7 아미노산, 등등에서 전체 길이 폴리펩티드까지 될 수 있다. 상기 논의된 바처럼, 혼성화 프로브로서 유용한 폴리뉴클레오타이드의 일부분은 12 뉴클레오타이드처럼 짧을 수도 있다. 에피토프로서 유용한 폴리펩티드는 4 아미노산처럼 짧을 수도 있다. 전체-길이 폴리펩티드의 기능을 수행하는 폴리펩티드의 일부는 일반적으로 4 아미노산보다 더 길 것이다.
본 발명의 특히 바람직한 식물 EG1117 폴리펩티드들은 SEQ ID NO:95, SEQ ID NO:99, SEQ ID NO:102, SEQ ID NO:105, SEQ ID NO:108, SEQ ID NO:111, SEQ ID NO:115, SEQ ID NO:118, SEQ ID NO:121, SEQ ID NO:126, SEQ ID NO:131, SEQ ID NO:134, SEQ ID NO:139, SEQ ID NO:143, SEQ ID NO:148, SEQ ID NO:153, SEQ ID NO:156, SEQ ID NO:159, SEQ ID NO:164, SEQ, ID NO:169, 및/또는 SEQ ID NO:170 (이들로 제한되지는 않지만, 이의 인코딩된 폴리펩티드, 전체-길이 폴리펩티드, 가공된 폴리펩티드, 융합 폴리펩티드 및 다가 폴리펩티드를 포함함) 및 상술한 SEQID NO들의 적어도 일부를 포함하는 폴리펩티드의 절단된 상동체들인 폴리펩티드를 포함하는 폴리펩티드들이다. 그와 같은 폴리펩티드를 제조하는 방법의 예들은 실시예 섹션을 포함하여 여기에 개시되어 있다.
C. EG307 폴리뉴클레오타이드
본 발명의 하나의 구현예는 다음 유전자:O. sativaEG307 유전자,O. rufipogonEG307 유전자,Zea mays maysEG307 유전자,Z. mays parviglumisEG307 유전자,Z. diploperennisEG307 유전자, 및Z. luxurians유전자 중의 적어도 하나와 엄중한 혼성화 조건 하에서 혼성화되는 단리된 식물 폴리뉴클레오타이드이다. 이러한 유전자들의 동일화된 특성들은 지금까지 기술되었다. 본 발명의 폴리뉴클레오타이드는 단리된 자연산 식물 EG307 유전자 또는 그의 상동체를 포함할 수 있는데, 후자는 아래에 더욱 상세히 기술된다. 본 발명의 폴리뉴클레오타이드는 하나 또는 그 이상의 조절성 영역, 전체-길이 또는 부분적 코딩 영역 또는 이들의 조합을 포함할 수 있다. 본 발명의 폴리뉴클레오타이드는 본 발명의 폴리뉴클레오타이드의 최소 크기는 상술한 유전자들 중의 하나와 엄중한 혼성화 조건 하에서 안정한 하이브리드를 형성할 수 있는 최소 크기이다. 적절하고 바람직한 식물은 상기 개시되었다.
본 발명에 따르면, 단리된 폴리뉴클레오타이드는 자연 환경에서 제거되어진 (즉, 인간의 조작이 이행되어진) 폴리뉴클레오타이드이다. 그 자체로, “단리된”이란 그 폴리뉴클레오타이드가 정제되어진 정도를 반영하는 것은 아니다. 단리된 폴리뉴클레오타이드는 DNA, RNA, 또는 DNA 또는 RNA의 유도체를 포함할 수 있다.
본 발명의 단리된 식물 EG307 폴리뉴클레오타이드는 그의 자연 출처로부터 전체(즉, 완전한) 유전자 또는 그 유전자와 안정한 하이브리드를 형성할 수 있는 그의 일부로서 수득될 수 있다. 단리된 식물 EG307 폴리뉴클레오타이드는 재조합 DNA 기법(예. 폴리머라제 사슬 반응(PCR)) 또는 화학적 합성법을 사용하여 제조될 수 있다. 단리된 식물 EG307 폴리뉴클레오타이드는 자연산 폴리뉴클레오타이드 및 그의 상동체를 포함하며, 이들로 제한되지는 않지만, 뉴클레오타이드가 그러한 변경에 의해서도 본 발명의 EG307 폴리펩티드를 인코딩하고 엄중한 조건하에서 자연산 유전자 단리체들과 안정한 하이브리드를 형성하는 폴리뉴클레오타이드의 능력을 실질적으로 간섭하지 않도록 삽입, 삭제, 치환 및/또는 역전되어져 있는 자연산 대립유전자 변체 및 변경된 폴리뉴클레오타이드를 포함한다.
식물 EG307 폴리뉴클레오타이드 상동체들은 당업계에 공지된 다수의 방법(참조, 예를 들면 Sambrook et al.,ibid.) 을 사용하여 제조될 수 있다. 예를 들면, 폴리뉴클레오타이드는 폴리뉴클레오타이드의 다양한 기법들을 사용하여 변경될 수 있는데, 그들로 제한되지는 않지만, 고전적인 돌연변이 기법 및 재조합 DNA 기법을 있으며, 예를 들면, 부위-지향적 돌연변이, 변이를 야기하는 폴리뉴클레오타이드의 화학적 처리, 핵산 단편의 한정효소절단, 핵산 단편의 결찰(ligation), 폴리머라제 사슬반응 (PCR) 증폭 및/또는 핵산 시퀀스의 선택 영역들의 돌연변이, 올리고뉴클레오타이드 혼합물의 합성 및 폴리뉴클레오타이드 및 그의 조합의 혼합물을 “구축”하는 혼합물 그룹들의 결찰이 있다. 폴리뉴클레오타이드 상동체들은 핵산에 의해 인코딩된 폴리펩티드의 기능(예. EG307 폴리펩티드의 하나 이상의 에피토프에대해 면역반응하는 능력, EG307 유전자를 함유하는 이식 식물에서 산출량을 증가시키는 능력) 을 대해 스크리닝함으로써, 및/또는O. sativa유전자와,O. rufipogon유전자와,Z. mays maysEG307 유전자와,Z. mays parviglumisEG307 유전자와,Z. diploperennisEG307 유전자와, 및/또는Z. luxuriansEG307 유전자와 혼성화함으로써 개질된 핵산 혼합물로부터 선택될 수 있다.
본 발명의 단리된 폴리뉴클레오타이드는 본 발명의 적어도 하나의 식물 EG307 폴리펩티드를 인코딩하는 핵산 시퀀스를 포함하며, 이와 같은 폴리펩티드의 예들은 여기에 개시되어 있다. 비록 문구 “폴리뉴클레오타이드”가 물리적인 폴리뉴클레오타이드를 일차적으로 지칭하고 문구 “핵산 시퀀스”가 폴리뉴클레오타이드 상에 있는 뉴클레오타이드의 시퀀스를 일차적으로 지칭하지만, 이 두 개의 문구는, 특히 EG307 폴리펩티드를 인코딩하는 능력이 있는 폴리뉴클레오타이드 또는 핵산 시퀀스에 관해서는, 상호교환적으로 사용될 수 있다. 지금까지 개시된 바처럼, 본 발명의 식물 EG307 폴리펩티드는 전체-길이 식물 EG307 코딩 영역, 분획상 식물 EG307 코딩 영역을 갖는 폴리펩티드, 융합 폴리펩티드, 다가 보호성 폴리펩티드 및 이들의 조합을 이들로만 제한되지 않고 포함한다.
본 발명의 적어도 어떤 폴리뉴클레오타이드는 폴리뉴클레오타이드가 단리된 EG307 폴리펩티드로써 면역되어진 동물로부터 유도된 면역혈청에 선택적으로 바인딩하는 폴리펩티드를 인코딩한다.
본 발명의 바람직한 폴리뉴클레오타이드는, 적절한 식물에서 발현될 때, 식물의 산출량을 증가시키는 능력이 있다. 하기에 더욱 상세히 개시될 것이지만, 그와 같은 폴리뉴클레오타이드는 안티센스 RMA, 삼중 헬릭스 형성이 가능한 분자, 리보자임, 또는 다른 핵산-기반 화합물이거나 이들을 인코딩할 수 있다.
본 발명의 하나의 구현예는 본 발명의 EG307 폴리뉴클레오타이드에, 또는 그와 같은 EG307 폴리뉴클레오타이드의 상동체에, 또는 그와 같은 폴리뉴클레오타이드의 상보물에 엄중한 혼성화 조건 하에서 혼성화되는 식물 EG307 폴리뉴클레오타이드이다. 본 발명의 임의의 핵산 시퀀스의 폴리뉴클레오타이드 상보물은 그 시퀀스가 인용되는 스트랜드에 상보하는(즉, 이것과 완전한 이중 나선을 형성할 수 있는) 폴리뉴클레오타이드의 핵산 시퀀스를 지칭한다. 핵산 시퀀스가 하나의 스트랜드에 대해 결정되어 있는, 즉 SEQ ID NO로 표현되는 본 발명의 이중-스트랜드 핵산 분자는 그 SEQ ID NO 의 상보물인 시퀀스를 갖는 상보성 스트랜드로 또한 이루어진다는 것이 유념된다. 이와 같이, 본 발명의 폴리뉴클레오타이드는 이중-스트랜드 또는 단일-스트랜드 중의 어느 하나 일 수 있으며, 엄중한 혼성화 조건 하에서 여기서 표시된 주어진 SEQ ID NO와 및/또는 여기서 표시되거나 표시되지 않을 수도 있는 상기 SEQ ID NO의 상보물과 안정한 하이브리드를 혀성하는 폴리뉴클레오타이드를 포함한다. 상보 시퀀스를 추론하는 방법은 당업계 숙련인들에게 공지이다. EG307 폴리펩티드의 적어도 일부를 인코딩하는 핵산 시퀀스의 대응 영역과의 상동관계가 적어도 약 65%, 바람직하게는 적어도 약 70%, 더욱 바람직하게는 적어도 약 75%, 더욱 바람직하게는 적어도 약 80%, 더욱 바람직하게는 적어도 약 85%, 더욱 바람직하게는 적어도 약 90% 및 더더욱 바람직하게는 적어도 약 95%가 되는 핵산 시퀀스를 포함하는 EG307 폴리뉴클레오타이드가 바람직하다. 식물에서 자연적으로존재하는 EG307 폴리펩티드의 적어도 일부를 인코딩하는 능력이 있는 EG307 폴리뉴클레오타이드가 특히 바람직하다.
본 발명의 특히 바람직한 EG307 폴리뉴클레오타이드는 엄중한 혼성화 조건하에 하기 폴리뉴클레오타이드들 중의 적어도 하나에, 또는 그러한 폴리뉴클레오타이드의 상동체 또는 상보물에 혼성화된다: SEQ ID NO:1, SEQ ID NO:91, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:90, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:34, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:63, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:74, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:59, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:81, SEQ ID NO:82, SEQ ID NO:84, 및/또는 SEQ ID NO:85.
본 발명의 바람직한 폴리뉴클레오타이드는, 본 발명의O. sativaEG307 유전자에,O. rufipogonEG307 유전자에,Zea mays maysEG307 유전자에,Z. mays parviglumisEG307 유전자에,Z. diploperennisEG307 유전자에 및/또는Z.luxurians유전자에 혼성화 가능한 (즉, 엄중한 혼성화 조건 하에서 혼성화되는) 핵산 시퀀스 SEQ ID NO:1, SEQ ID NO:91, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:34, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:63, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:74, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:59, 및/또는 SEQ ID NO:78의 적어도 일부, 뿐만 아니라 그 폴리뉴클레오타이드의 임의의 것의 대립유전자 변체인 폴리뉴클레오타이드를 포함한다. 그러한 바람직한 폴리뉴클레오타이드는 SEQ ID NO들에 포함된 것들에 더하여, 예를 들면, 그러나 이들로 제한되지 않는, 전체-길이 유전자, 전체-길이 코딩 영역, 융합 폴리펩티드를 인코딩하는 폴리뉴클레오타이드 및/또는 다가 보호성 화합물을 인코딩하는 폴리뉴클레오타이드와 같은 폴리뉴클레오타이드를 포함할 수 있다.
본 발명은 또한 SEQ ID NO:3의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:3의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:6의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:9의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:13의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:16의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:19의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:22의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:26의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:30의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:36의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:39의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:43의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:48의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:52의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:56의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:61의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:65의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:68의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:72의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:76의 적어도 일부를포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:79의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO:83의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO:86의 적어도 일부를 포함하는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드을 포함하며, 그러한 폴리뉴클레오타이드가 발현되어질 세포의 코돈 사용법 성질들을 수용하도록 개질된 폴리뉴클레오타이드를 포함한다.
본 발명의 어떤 식물 EG307 폴리뉴클레오타이드의 핵산 시퀀스를 안다는 것은, 당업계 숙련인들이, 예를 들면 (a) 폴리뉴클레오타이드의 카피들을 만들고, (b) 폴리뉴클레오타이드의 적어도 일부분(예. 전체-길이 유전자, 전체-길이 코딩 영역, 조절성 콘트롤 시퀀스, 절단된 코딩 영역을 포함하는 폴리뉴클레오타이드)을 포함하는 폴리뉴클레오타이드를 수득하고, 및 (c) 다른 식물에 대한 EG307 폴리뉴클레오타이드를 수득하는 것을 가능하게 해준다는 것으로, 특별하게는, 실시예 섹션에서 상세히 기술된 바와 같이, 본 발명의O. sativaEG307 폴리뉴클레오타이드의 지식은O. rufipogon,Zea mays mays,Zea mays parviglumis,Z. diploperennisZ. luxuriansEG307 폴리뉴클레오타이드의 단리를 가능하게 하기 때문이다. 이러한 폴리뉴클레오타이드는 본 발명의 항체와 함께 적절한 발현 라이브러리를 스크리닝하는 방법; 본 발명의 올리고뉴클레오타이드 프로브를 사용하여 적절한 라이브러리 또는 DNA를 스크리닝하는 전통적인 클로닝 기법; 및 본 발명의 올리고뉴클레오타이드 프라이머를 사용하는 적절한 라이브러리 또는 DNA의 PCR 증폭법을 포함하여 여러 가지 방법으로 수득될 수 있다.
폴리뉴클레오타이드를 스크리닝하거나 이로부터 폴리뉴클레오타이드를 증폭하기 위한 바람직한 라이브러리는 게놈성 DNA 라이브러리, BAC 라이브러리, YAC 라이브러리, 단리된 식물조직, 예를 들면, 이들로 제한되지는 않지만 줄기, 생식 구조/조직, 잎, 뿌리 및 새싹으로부터 제조된 cDNA 라이브러리; 및 상기 나열된 조직 중의 임의의 것 또는 모두로부터 나온 cDNA 풀(pool)로 구축된 라이브러리와 같은 라이브러리들을 포함한다. 쌀의 경우에, 클렘손 대학(Clemson University)으로부터 입수가능한 BAC 라이브러리가 바람직하다. 유사하게, 폴리뉴클레오타이드를 스크리닝하거나 이로부터 폴리뉴클레오타이드를 증폭하기 위한 바람직한 DNA 원은 식물 게놈성 DNA를 포함한다. 유전자를 클로닝하고 증폭하기 위한 기법은 예를 들면 문헌 [Sambrook et al.,ibid. 및 Galun & Breiman, TRANSGENIC PLANTS, Imperial College Press, 1997]에 개시되어 있다.
본 발명은 엄중한 혼성화 조건 하에 식물 EG307 유전자 또는 다른 식물 EG307 폴리뉴클레오타이드로 이루어진 것들과 같은 본 발명의 다른, 바람직하게는 더긴 폴리뉴클레오타이드의 상보성 영역과 혼성화 가능한 올리고뉴클레오타이드인 폴리뉴클레오타이드를 또한 포함한다. 본 발명의 올리고뉴클레오타이드는 RNA, DNA 또는 이들중 어느 하나의 유도체일 수 있다. 이러한 올리고뉴클레오타이드의 최소 크기는 본 발명의 또 다른 폴리뉴클레오타이드 상에 주어진 올리고뉴클레오타이드 및 상보성 시퀀스 사이에 안정한 하이브리드를 형성하는데 요구되는 크기이다. 최소 크기 특성은 여기에 개시된다. 또 올리고뉴클레오타이드의 크기는 본 발명에 따라 올리고뉴클레오타이드를 사용하기 위해 충분한 크기이어야 한다. 본발명의 올리고뉴클레오타이드는, 예를 들면, 그러나 이들로 한정되지는 않지만, 추가의 폴리뉴클레오타이드를 동정하기 위한 프로브로서, 폴리뉴클레오타이드를 증폭하고 확장하기 위한 프라이머로서, 발현 분석용 목적물로서, 목적으로 하는 돌연변이 및/또는 회복을 위한 후보자로서, 또는 EG307 폴리펩티드생산성 또는 활성도를 변경하는 농업적 용도에서와 같이, 다양한 용도에서 사용될 수 있다. 이러한 농업적 용도들은 그와 같은 올리고뉴클레오타이드의, 예를 들면 안티센스(antisense)-, 3배체 형성-, 리보자임- 및/또는 RMA 약물-기반 기법에서의 사용을 포함한다. 따라서, 본 발명은 그와 같은 올리고뉴클레오타이드 및 그와 같은 기법들 중의 하나 또는 그 이상을 사용함으로써 식물에 있어서 경제적 생산성을 강화시키는 방법을 포함한다.
D. EG1117 폴리뉴클레오티드
본 발명의 한 실시태양은 엄격한 혼성화 조건하에서 하나 이상의 하기 유전자로 혼성화하는 단리된 식물 폴리뉴클레오타이드이다:O. sativaEG1117 유전자,O. rufpogonEG1117 유전자,Z mays mays EG1117 유전자 및Z mays parviglumisEG1117 유전자. 이러한 유전자의 특징을 동정화하는 것이 이전에 기술되었다. 본 발명의 폴리뉴클레오티드는 단리된 천연 식물 EG1117 유전자 또는 그의 상동체를 포함할 수 있다. 본 발명의 폴리뉴클레오타이드는 하나 이상의 조절 영역, 전체 길이(full-length) 또는 부분 암호화 영역, 또는 그의 조합을 포함할 수 있다. 본 발명의 폴리뉴클레오타이드의 최소 사이즈는 엄격한 혼성화 조건하에서 전술한 유전자의 하나와 안정한 혼성물을 형성할 수 있다. 안정하고 바람직한 식물이 상술되어 있다. 단리된 EG1117 유전자 및 그의 동족체의 특성들이 "EG307 폴리뉴클레오티드"라고 표제화된 섹션에서 상술되어 있다.
본 발명의 한 실시태양은 엄격한 혼성화 조건하에서 본 발명의 EG1117 폴리뉴클레오타이드, 또는 이러한 EG1117 폴리뉴클레오타이드의 상동체, 또는 이러한 뉴클레오티드의 상보물(complement)로 혼성화되는 식물 EG1117 폴리뉴클레오타이드이다. 바람직한 것은 EG1117 폴리펩티드의 최소한 일부분을 인코딩하는 핵산 서열의 상응하는 영역(들)과, 적어도 약 65%, 바람직하게는 적어도 약 70%, 보다 바람직하게는 적어도 약 75%, 더욱 바람직하게는 적어도 약 80%, 보다 바람직하게는 적어도 약 85%, 더욱 바람직하게는 적어도 약 90% 및 더더욱 바람직하게는 적어도 약 95% 상동관계를 갖는 핵산 서열을 포함하는 EG1117 폴리뉴클레오타이드이다. 특히 바람직한 것은 식물에서 천연적으로 존재하는 EG1117 폴리펩티드의 적어도 일부분을 인코딩할 수 있는 EG1117 폴리뉴클레오타이드이다.
본 발명의 특히 바람직한 EG1117 폴리뉴클레오타이드는 엄격한 혼성화 조건하에서 하나 이상의 하기 폴리뉴클레오타이드, 또는 이러한 폴리뉴클레오타이드의 상동체 또는 보상물로 혼성화된다.
본 발명의 바람직한 폴리뉴클레오타이드는 핵산 서열 SEQ ID NO: 92의 적어도 일부분(이 서열 동정 번호: 92는 본 발명의O. sativaEG1117 유전자,O. rufipogonEG1117 유전자,Z mays maysEG1117 유전자, 및/또는Z. mays parviglumisEG1117 유전자로 혼성화(즉, 엄격한 혼성화 조건하에서 혼성화함)할 수 있다.) 및 상기 임의의 폴리뉴클레오타이드의 대립유전자 변이체인 폴리뉴클레오타이드를 포함한다. 이러한 바람직한 폴리뉴클레오타이드는 전장 유전자, 전장 코딩 영역, 폴리뉴클레오티드 인코딩 융합 폴리펩티드, 및/또는 다가 보호 화합물을 인코딩하는 폴리펩티드와 같은 그러나 이에 한정되는 것은 아닌 것들을 포함하는 것 이외에 뉴클레오타이드를 포함할 수 있다.
본 발명의 바람직한 폴리뉴클레오타이드는,O. sativaEG1117 유전자,O. rufpogonEG1117 유전자,Z. mays maysEG1117 유전자, 및/또는Z. mays parviglumisEG1117 유전자, 본 발명의 유전자로 혼성화할 수 있는 핵산 서열 SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 104, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQID NO: 116, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID N0: 120, SEQ ID NO: 121, SEQ ID NO: 122, SEQ ID NO: 123, SEQ ID NO: 124, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 136, SEQ ID NO: 137, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 141, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 145, SEQ ID NO: 146, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 150, SEQ ID NO: 151, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 166, SEQ ID NO: 167, 및/또는 SEQ ID NO: 168 의 적어도 일부분,및 상기 임의의 폴리뉴클레오타이드의 대립유전자 변이체인 폴리뉴클레오티드를 포함한다. 이러한 바람직한 폴리뉴클레오타이드는 전장 유전자, 전장 코딩 영역, 폴리뉴클레오티드 인코딩 융합 폴리펩티드, 및/또는 폴리뉴클레오타이드 인코딩 다가 보호 화합물 등의 그러나, 이에 한정되지는 않는 SEQ ID NO들에 포함된 것 이외에, 뉴클레오타이드를 포함할 수 있다.
본 발명은 또한 , 하기 폴리펩티드가 발현되어지는 세포의 코돈 사용 성질을 수용하도록 변형된 폴리뉴클레오타이드를 비롯한, SEQ ID NO: 95의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 99의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 102의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 105의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 108의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 111의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 115의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 118의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리펩티드, SEQ ID NO: 121의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 126의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 131의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 134의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 139의 적어도 일부분을 갖는 폴리펩티드를인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 143의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 148의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리펩티드, SEQ ID NO: 153의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 156의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 159의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 164의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드, SEQ ID NO: 169의 적어도 일부분을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드를 포함한다.
본 발명의 특정 식물 EG1117 폴리뉴클레오타이드의 핵산 서열을 인지하는 것은 실시예 섹션에서 상세히 설명한 바와 같이, 특히 본 발명의O.rufpogonEG117 폴리뉴클레오타이드의 인지가 본 발명의O. sativa,Zea mays mays, 및Zeamays parviglumisEG1117 폴리뉴클레오타이드의 단리를 가능하게 하기 때문에, 예를 들면, (a) 상기 폴리뉴클레오타이드를 복제하는 것, (b) 이러한 폴리뉴클레오타이드의 적어도 일부분을 포함하는 폴리뉴클레오타이드를 얻는것 (예를 들면, 전장 유전자, 전장 코딩 영역, 조절 제어 서열, 끝을 자른(truncate) 코딩 영역을 비롯한 폴리뉴클레오타이드), 및 (c) 다른 식물을 위하여 EG117 폴리뉴클레오타이드를 얻는 것을 당업자에게 허여한다. 이러한 폴리뉴클레오타이드는 본 발명의 항체로 적절한 발현 라이브러리를 스크린하는 것, 적절한 라이브러리 또는 DNA를 스크린하기 위하여 본 발명의 올리고뉴클레오타이드 프로브를 사용하는 전통적인 클로닝 기술, 및 본 발명의 올리고뉴클레오타이드 프라이머를 사용하여 적절한 라이브러리 또는DNA의 PCR증폭을 비롯한 다양한 방법으로 수득될 수 있다. 바람직한 라이브러리는 "EG307 폴리뉴클레오타이드"라고 표제된 영역에서 전술된다.
본 발명은 또한 엄격한 혼성화 조건하에서 식물 EG1117 유전자 또는 다른 식물 EG1117 폴리뉴클레오타이드를 포함하는 것 등의 기타, 바람직하게는 보다 긴, 본 발명의 폴리뉴클레오타이드의 상보 영역을 갖는 혼성화할 수 있는 올리고뉴클레오타이드인 폴리뉴클레오타이드를 포함한다. 본 발명의 올리고뉴클레오타이드는 RNA, DNA, 또는 이들의 유도체일 수 있다. 이러한 올리고뉴클레오타이드의 최소 사이즈는 소정의 올리고뉴클레오타이드 및 본 발명의 또 다른 폴리뉴클레오타이드에 대한 상보적인 서열 사이에 안정한 혼성화를 형성하기에 필요한 사이즈이다. 최소 사이즈 특성이 본원에서 개시되어 있다. 또한 올리고뉴클레오타이드의 사이즈는 본 발명에 따라 올리고뉴클레오타이드의 사용에 충분하여야 한다. 이러한 적용은 "EG307 폴리뉴클레오타이드" 표제의 섹션에서 전술되어 있다.
E. 재조합 분자
본 발명은 또한 숙주 세포 내에 폴리뉴클레오티드를 운반할 수 있는 임의의 벡터 내로 삽입된, 본 발명의 하나 이상의 EG307 또는 EG1117 폴리뉴클레오타이드를 포함하는, 재조합 벡터를 포함한다. 이러한 벡터는, 본 발명의 폴리뉴클레오타이드에 인접하여 천연적으로 발견될 수 없고, 폴리뉴클레오타이드(들)가 유래되는 종 이외의 종으로부터 유래되는 핵산 서열인, 이종 기원의 핵산 서열을 포함한다. 본원에서 사용된 바처럼, 유래된 폴리뉴클레오타이드는 서열에서 폴리뉴클레오타이드 또는 폴리뉴클레오타이드의 일부분과 동일 또는 유사한 것이나, 변형된 염기, 골격 변형물, 뉴클레오타이드 변화물 등의 변형물을 포함할 수 있다. 벡터는 RNA 또는 DNA, 또는 원핵생물 또는 진핵생물, 및 전형적으로 바이러스 또는 플라스미드일 수 있다. 재조합 벡터는 클로닝, 서열화, 및/또는 그렇지 않다면 본 발명의 식물 EG307 또는 EG1117 폴리뉴클레오타이드의 조작 등에 사용될 수 있다. 본원에서 재조합 분자로서 언급되고, 하기에서 더 상세히 설명되는 재조합 벡터의 한 종류는 본 발명의 폴리뉴클레오타이드의 발현에 사용될 수 있다. 바람직한 재조합 벡터는 형질전환된 세포에서 복제될 수 있다.
본 발명의 재조합 벡터에 포함되는 적당한 그리고 바람직한 폴리뉴클레오타이드는 그 자체로 적당한 그리고 바람직한 식물 EG307 또는 EG1117 폴리뉴클레오타이드로 본원에서 개시된 것이다. 본 발명의 재조합 분자에서 구체적으로, 재조합 백터에 포함되는 것으로 특히 바람직한 폴리뉴클레오타이드는 SEQ ID NO: 1, SEQ ID NO: 91, SEQ ID. NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID. NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 55, SEQ IDNO: 57, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 59, 및/또는 SEQ ID NO: 78을 포함한다. 본 발명의 재조합 벡터, 구체적으로 재조합 분자내에 포함되는 택일적인 바람직한 폴리뉴클레오타이드는 SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 104, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 120, SEQ ID NO: 121, SEQ ID NO: 122, SEQ ID NO: 123, SEQ ID NO: 124, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 136, SEQ ID N0: 137, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 141, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 145, SEQ ID NO: 146, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 150, SEQ ID NO: 151, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID N0: 157, SEQ ID N0: 158, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 166, SEQ ID NO: 167, 및/또는 SEQ ID NO: 168을 포함한다.
본 발명의 단리된 식물 EG307 또는 EG1117 폴리펩티드는 천연 폴리펩티드, 재조합 폴리펩티드의 생산 및 회수, 및 폴리펩티드의 화학 합성을 비롯한 다양한방법으로 생산될 수 있다. 한 실시 태양에서, 본 발명의 단리된 폴리펩티드는 폴리펩티드를 생산하기에 효과적인 조건하에서 폴리펩티드를 발현하고 폴리펩티드를 회수할 수 있는 세포를 배양함으로써 생산된다. 배양하기에 바람직한 세포는 폴리펩티드를 발현할 수 있는 재조합 세포이고, 재조합 세포는 본 발명의 하나 이상의 폴리펩티드로 숙주 세포를 형질전환함에 의해 생산된다. 세포로의 폴리뉴클레오타이드의 형질 전환은 세포 내로 삽입될 수 있는 폴리뉴클레오타이드에 의한 임의의 방법에 의해 수행될 수 있다. 형질 전환 기술은 이에 한정되지는 않으나, 트랜스펙션(transfection), 엘렉트로포레이션(electroporation), 마이크로인젝션(microinjection), 리포펙션(lipofection), 흡착(adsorption) 및 프로토플라스트 융합(protoplast fusion)을 포함한다. 재조합 세포는 단세포로 남아있거나, 조직, 기관 또는 다세포 유기물로 성장할 수 있다. 형질전환된 본 발명의 폴리뉴클레오타이드는 염색체외에서 남아있거나, 발현되어야 할 그들의 성능이 유지되는 방식으로 형질전환된(즉, 재조합) 세포의 염색체 내의 하나 이상의 자리에 병합할 수 있다. 세포를 형질전환시키기 위하여 적당한 그리고 바람직한 폴리뉴클레오타이드는 적당하고 바람직한 식물 EG307 또는 EG1117 폴리뉴클레오타이드 자체로서 본원에서 개시되어 있는 바이다. 본 발명의 재조합 세포에 포함되는 특히 바람직한 폴리뉴클레오타이드는 SEQ ID NO: 1, SEQ ID N0:91, SEQ ID. N0 : 2,SEQ ID N0 : 4,SEQ ID NO :5, SEQ ID NO : 7,SEQ ID NO : 10, SEQ ID NO : 11,SEQ ID N0 : 12,SEQ ID N0 : 14,SEQ ID NO : 15,SEQ ID N0 : 17, SEQ ID NO : 18, SEQ ID NO : 20, SEQ ID NO :21, SEQ ID. N0 : 23,SEQ ID NO : 24, SEQ ID NO : 25, SEQ ID NO: 27,SEQ ID N0 : 28, SEQ ID NO : 29,SEQ ID N0 : 30, SEQ ID NO : 31, SEQ ID NO : 33, SEQ ID NO : 34, SEQ ID. NO : 35, SEQ ID NO : 37,SEQ ID NO :38, SEQ ID N0 : 40, SEQ ID NO : 41, SEQ ID N0 : 42, SEQ ID NO : 44, SEQ ID NO : 45,SEQ ID N0 : 46, SEQ ID NO : 47, SEQ ID NO : 49,SEQ ID. NO : 50, SEQ ID NO : 51,SEQ ID NO : 53, SEQ ID NO : 54,SEQ ID NO : 55, SEQ ID NO : 57, SEQ ID NO : 58,SEQ ID N0 : 60, SEQ ID NO : 62, SEQ ID NO : 63,SEQ ID N0 : 64, SEQ ID NO : 66, SEQ ID NO : 67,SEQ ID NO : 69, SEQ ID. NO : 70, SEQ ID NO : 71, SEQ ID NO : 73, SEQ ID NO : 74, SEQ ID NO : 75, SEQ ID NO : 77, SEQ ID NO : 59, SEQ ID NO : 78, SEQ ID NO : 80, SEQ ID NO : 81, SEQ ID NO : 82, SEQ ID NO : 84, 및/또는 SEQ ID NO : 85를 포함한다. 본 발명의 재조합 세포에 포함되는 택일적인 바람직한 폴리뉴클레오타이드는 SEQ ID NO : 92, SEQ ID NO : 93, SEQ ID NO : 94, SEQ ID NO : 96, SEQ ID NO : 97, SEQ ID NO : 98, SEQ ID NO : 100, SEQ ID NO :101, SEQ ID NO : 102, SEQ ID NO : 103, SEQ ID NO : 104, SEQ ID NO : 104, SEQ ID NO : 106, SEQ ID NO : 107, SEQ ID NO : 109, SEQ ID NO :110, SEQ ID NO :112, SEQ ID NO : 113, SEQ ID NO : 114, SEQ ID NO : 116, SEQ ID NO : 117, SEQ ID NO : 119, SEQ ID NO : 120, SEQ ID NO :121, SEQ ID NO : 122, SEQ ID NO : 123, SEQ ID NO : 124, SEQ ID NO : 125, SEQ ID NO : 127, SEQ ID NO : 128, SEQ ID NO : 129, SEQ ID NO : 130, SEQ ID NO :131, SEQ ID NO :133, SEQ ID NO :135, SEQ ID NO : 136, SEQ ID NO :137, SEQ ID NO :138, SEQ ID NO : 140, SEQ ID NO :141, SEQ ID NO : 142, SEQ ID NO : 144, SEQ ID NO : 145, SEQ ID NO : 146, SEQID NO : 147, SEQ ID NO : 149, SEQ ID NO : 150, SEQ ID NO :151, SEQ ID NO : 152, SEQ ID NO : 154, SEQ ID NO: 155, SEQ ID NO : 157, SEQ ID NO : 158, SEQ ID NO : 160, SEQ ID NO :161, SEQ ID NO : 162, SEQ ID NO : 163, SEQ ID NO : 165, SEQ ID NO : 166, SEQ ID NO : 167, 및/또는 SEQ ID NO : 168을 포함한다.
형질전환하기에 적당한 숙주 세포는 본 발명의 폴리뉴클레오타이드를 사용하여 형질전환될 수 있는 임의의 세포를 포함한다. 숙주 세포는 형질전환되지 않은 세포이거나 적어도 하나의 폴리뉴클레오타이드로 이미 형질전환된 세포일 수 있다. 본 발명의 숙주 세포는 내생적(즉, 천연적으로)으로 본 발명의 식물 EG307 또는 EG1117 폴리펩티드를 생산할 수 있거나, 또는 본 발명의 하나 이상의 폴리뉴클레오타이드로 형질전환한 후 이러한 폴리뉴클레오타이드를 생산할 수 있다. 본 발명의 숙주 세포는 본 발명의 하나 이상의 폴리펩티드를 생산할 수 있는 임의의 세포일 수 있으며, 박테리아, 균류(효소 및 라이스 블라스트,Magnaporthe grisea포함), 기생충(선충류, 특히 Xiphinema, Helicotylenchus, 및 Tylenchlohynchus 종 포함), 곤충, 다른 동물 및 식물 세포를 포함한다.
형질전환시키기 위한 적당한 숙주 바이러스는 라이스 스트라이프 바이러스, 및 에치노크로아 브란카 바이러스(echinochloa hoja blanca virus)를 포함하나 이에 한정되지는 않는 본 발명의 폴리뉴클레오타이드를 사용하여 형질전환될 수 있는 임의의 바이러스를 포함한다.
바람직한 실시태양에서, 식물 조직에서 살면서 복제할 수 있는 비병원성 공생 박테리아, 소위 내부 기생 식물, 또는 필로스피어(phyllosphere) 또는 리조스피어(rhizosphere)를 콜리닝할 수 있는 비병원성 공생 박테리아, 소위 착색식물이 사용된다. 이러한 박테리아는 아그로박테리움, 알칼리겐스, 아조토박터, 바실리우스, 글라비박터, 엔테로박터, 에루비니아, 플라보박터, 클렙시에라, 슈도모나스, 리조비윰, 세라티아, 스트렙토마이스 및 잔토모나스 종(Agrobacterium, Alcaligenes, Azospirillum, Azotobacter, Bacillus, Clavibacter, Enterobacter, Erwinia, Flavobacter, Klebsiella, Pseudomonas, Rhizobium, Serratia, Streptomyces 및 Xanthomonas)의 박테리아를 포함한다. 트리코데마(Trichoderma) 및 글리오클라디운즈(Gliocladiunz) 등의 공생 균류가 또한 동일한 목적을 위한 본 발명의 뉴클레오타이드 서열의 발현을 위한 가능한 숙주이다.
또한,TrichodermaGliocladium은 동일한 목적을 위한 본 발명의 뉴클레오티드 시퀀스의 발현을 위한 숙주가 될 가능성이 있다.
재조합 세포는 하나 이상의 전사조절 시퀀스를 함유하는 발현벡터에 작용적으로 연결되는 본 발명의 하나 이상의 뉴클레오티드로 이루어지는 각각의 하나 이상의 재조합 분자로 숙주 세포를 변형함으로써 생성되는 것이 바람직하다. 상기 용어 "작용적으로 연결된"의 의미는 분자가 숙주 세포로 변형될 때, 정확한 리딩(reading) 프레임에서 발현될 수 있도록 하는 것과 같은 방법으로 폴리뉴클레오티드를 발현벡터 내로 삽입하는 것을 의미한다. 여기서 사용된 바와 같이, 발현 벡터는 숙주 세포를 변형시킬 수 있고, 특정된 폴리뉴클레오티드의 발현에 영향을 줄 수 있는 DNA 또는 RNA 벡터이다. 또한, 바람직하게 발현벡터는 호스트 세포 내에서 복제할 수 있다. 발현벡터는 원핵세포 또는 진핵세포일 수 있으며, 전형적인바이러스 또는 플라스미드일 수 있다. 본 발명의 발현벡터는 박테리아 세포, 균류 세포, 기생 세포, 곤충 세포, 다른 동물 및 식물 세포를 포함하는 본 발명의 재조합 세포 내에서 작용하는(예, 유전자 발현을 명령) 벡터를 포함한다. 본 발명의 바람직한 발현벡터는 박테리아 세포, 효모 세포, 균류 세포, 곤충 세포 및 동물 세포 내에서, 더욱 바람직하게는 지금까지 공지된 세포형 내에서, 유전자 발현을 명령할 수 있다.
또한, 본 발명의 재조합 분자는 (a) 본 발명의 발현된 EG307 또는 EG1117 폴리펩타이드가 폴리펩타이드를 생성하는 셀로부터 분비되도록 하는 분비신호를 포함할 수 있으며, 및/또는 (b) 결합 폴리펩타이드로서 본 발명의 폴리뉴클레오티드의 발현을 유도하는 결합 시퀀스를 포함할 수 있다. 결합 부분 뉴클레익산에 의하여 암호화되는 적합한 신호 부분 및 결합 부분의 예는 여기에 게재되어 있다. 진핵 재조합 분자는 본 발명의 폴리뉴클레오티드의 뉴클레익산 시퀀스 주위 및/또는 내에서 중재 및/또는 번역되지 않은 시퀀스를 포함할 수 있다. 적합한 신호 부분은 본 발명의 폴리펩타이드의 분비를 명령할 수 있는 자연적 신호 부분 또는 어느 이종 신호 부분을 포함한다. 조직 및 세포기관 특정 발현을 향상시키는데 사용되는 바람직한 신호 및 결합 시퀀스는 arcelin-5를 포함하지만 이에 한정되지 않는다(Goossens, A. et.al. 참조). 파세오루스 불가리스(Phaseolus vulgaris)의 상기 arcelin-5 유전자는 이식유전자Phaseolus acutifoliusArabidopsis식물내에서 높은 시드(seed)-특정 발현을 명령한다. Plant Physiology(1999) 120:1095-1104, phaseolin, Sengupta-Gopalan, C. et. al. 참조. 콩 베타-파세오인 유전자는 담배종자에서 개발적으로 규정된다. PNAS(1985) 82:3320-3324, hydroxyproline-rich glycoprotein, serpin, Yan, X. et. al. 참조. 변형된 베타-글루쿠로니다제(beta-glucuronidase) 유전자와 함께 신호 시퀀스의 유전자 결합은 분비 경로/플라즈마 막내에 베타-글루쿠로니다제 단백질의 보유를 초래한다. Plant Physiology(1997) 115:915-924, N-acetyl glucosaminyl transferase 1, Essl, D. et. al. 참조. 담배 N-아세틸글루코사미닐트랜스퍼라제(acetylglucosaminyltransferase) I로 부터 N-터미널 77 아미노산은 니코티아나 벤타미아나 세포의 골기(Golgi) 장치내에 보고 단백질을 유지시키기에 충분하다. Febs Letters(1999)453(1-2);169-73, albumin, Vandekerckhove, J. et. al. 참조. 엔케프아린스는 변형된 2S 시드 저장 단백질을 사용하는 이식유전자 식물에서 생산되었다. BioTechnology 7;929-932(1989) and PR1, see Pen, J. et. al. 식물에서 활성적 공업적 효소의 효율적인 생산. Industrial Crops and Prod.(1993) 1:241-250.
본 발명의 폴리뉴클레오티드는 재조합 세포와 양립할 수 있고, 본 발명의 폴리뉴클레오티드의 발현을 조절하는 전사조절 시퀀스, 번역조절 시퀀스, 복제의 원점, 및 다른 규정하는 시퀀스와 같은 규정 시퀀스를 포함하는 발현벡터에 작용적으로 연결될 수 있다. 특히, 본 발명의 재조합 분자는 전사 조절 시퀀스를 포함한다. 전사조절 시퀀스는 전사의 개시, 연장 및 종점을 조절하는 시퀀스이다. 외부신호 또는 에이전트에 의하여 세포형 특성, 조직 특성, 또는 유도성에 대하여 프로모터-종속 유전자 발현을 하게 하는데 충분한 이들 전사조절 시퀀스가 포함된다;이와 같은 구성성분은 본래 유전자의 5' 또는 3' 영역 내에 위치될 수 있다. 특히, 중요한 전사 조절 시퀀스는 프로모터, 인헨서, 작용자 및 리프레서 시퀀스와 같은 전사개시를 조절하는 것들이다. 적합한 전사조절 시퀀스는 본 발명의 재조합 세포 중에 적어도 하나에서 작용할수 있는 어느 전사조절 시퀀스를 포함한다. 이와 같은 전사조절 시퀀스의 다양성은 당업자에게 알려져있다. 바람직한 전사조절 시퀀스는 tac, lac, trp, trc, oxy-pro, omp/lpp, rrnB, 박테리오파지 람다(λ)(이와 같은 프로모터를 포함하는 λPL및 λPR및 이와 같은 프로모터를 포함하는 결합), 박테리오파지 T7, T7lac, 박테리오파지 T3, 박테리오파지 SP6, 박테리오파지 SP01, 메탈로티오네인, α-메이팅(mating) 인자, 피치아(Pichia) 알콜 옥시다제, 알파바이러스 서브게놈 프로모터(신드비스 바이러스 서브게놈 프로모터와 같은), 안티바이오틱 저항 유전자, 바큐로바이러스, 헬리오디스 지아(Heliothis zea) 곤충 바이러스, 벡시니아 바이러스, 헐페스바이러스, 폭스바이러스, 아데노바이러스, 사이토메갈로바이러스(중간물 초기 프로모터와 같은), 시미안 바이러스 40, 레트로바이러스, 엑틴, 레트로바이랄 롱 터미널 반복, 라오스(Rous) 살코마 바이러스, 열충격, 인산염, 및 질산염 전사 조절 시퀀스 뿐만 아니라 원핵세포 또는 진핵세포 내에 유전자 발현을 조절할 수 있는 다른 시퀀스와 같은 그러나 이에 한정하지 않는 박테리아 세포, 효모세포, 균류세포, 곤충세포, 동물세포에서 작용하는 것들을 포함한다.
특히, 바람직한 전사조절 시퀀스는 식물 전사조절 시퀀스들이다. 전사조절시퀀스의 선택은 발현을 위한 일시적인 또는 공간적인 요구에 따라, 그리고 또한 목표 종에 따라 변할 것이다. 따라서, 어느 식물조직(잎, 뿌리, 묘목, 미성숙 또는 성숙 재생산구조 등)내에서, 또는 식물개발의 어느 단계에서의 본 발명의 뉴클레오티드 시퀀스의 발현이 바람직하다. 비록 디코틸레돈으로부터 많은 전사조절 시퀀스가 모노코틸레돈스 및 이의 반대로 작용하는 것이 나타났지만, 이상적인 디코틸레도노스 전사조절 시퀀스는 디코틸레돈, 및 모노코틸레돈스에서 발현하기 위한 모노코틸레도노스 프로모터에서 발현하기 위해 선택된다. 그러나 선택된 전사조절 시퀀스의 출처에 대한 한정은 없다; 이들은 바람직한 세포 내에 뉴클레오티드 시퀀스의 발현을 작동시키는 작용을 하는데 충분하다.
구조적으로 발현되는 바람직한 전사조절 시퀀스는 유전자 암호화 엑틴 또는 유비퀴틴으로부터의 프로모터 및 CaMV 35S 및 19S 프로모터를 포함하나 이에 한정되는 것은 아니다. 또한, 본 발명의 뉴클로티드 시퀀스는 화학적으로 규정되는 프로모터의 규정 하에서 발현될 수 있다. 이것은 EG307 또는 EG1117 폴리펩타이드가 단지 옥수수 식물이 유도 화학물질로 처리될 때 합성될 수 있도록 한다. 유전자 발현의 화학적 도입을 위한 바람직한 기술은 유럽특허공개공보 제0 330 104호 및 미국특허 제5,614,395호에 상세히 기재되어 있다. 화학적 도입을 위한 바람직한 프로모터는 담배 PR-1a 프로모터이다.
바람직한 프로모터의 카테고리는 식물의 생리적인 상태에 의하여 유도된다(예, 상처 유도성, 물-스트레스 유도성, 소금-스트레스 유도성, 병유도성 등). 수많은 프로모터들은 상처부위 또는 피토파코겐 감염부위에서 발현되는 것이 설명되었다. 이상적으로 이와 같은 프로모터는 오직 감염부위에서 지엽적으로 활성화하며, EG307 또는 EG1117 폴리펩티드 단지 축적이 바람직한 세포내에 축적된다. 이와 같은 종류의 바람직한 프로모터는 Stanford et al. Mol. Gen. Genet. 215: 200-208(1989), Xu et al. Plant Molec. Biol. 22: 573-588(1993), Logemann et al. Plant Cell 1: 151-158(1989), Rohrmeier & Lehle, Plant Molec. Biol. 22: 783-792(1993), Firek et al. Plant Molec. Biol. 22: 129-142(1993), 및 Warner et al. Plant J. 3: 191-201(1993)에 의하여 설명된 것들을 포함한다.
바람직한 조직-특성 발현패턴은 녹색조직 특성, 뿌리 특성, 줄기 특성, 및 꽃 특성을 포함하나 이에 한정되지 않는다. 녹색조직에서 발현을 위해 적합한 프로모터는 광합성에 속하는 유전자를 조절하는 것들을 포함하며, 이들중에 많은 수는 모노코틸에돈스 및 이코틸에돈스 둘 다로부터 복제되었다. 바람직한 프로모터는 포스페놀 카르복실라제 유전자(Hudspeth & Grula, Plant Molec. Biol. 12: 579-589(1989))로부터의 옥수수 PEPC 프로모터이다. 뿌리 특정 발현을 위한 바람직한 프로모터는 데 프라몬드(de Framond)(FEBS 290: 103-106(1991); 유럽특허 제0 452 269호 to Ciba-Geigy)에 의하여 설명되어 있다. 바람직한 줄기 특정 프로모터는 미국특허 제5,625,136호(to Ciba-Geigy)에 기술되어 있으며, 이들은 옥수수 trpA 유전자의 발현을 촉진한다.
본 발명의 재조합 분자는 여기에 개시되는 예에서 변형되는 세포에서 폴리뉴클레오티드의 발현을 효율적으로 조절할 수 있는 어느 전사조절 시퀀스 중에서 적어도 하나에 작용적으로 연결되는 것이 설명되어진 이전까지 어느 폴리뉴클레오티드 중에서 적어도 하나를 포함할 수 있는 분자이다.
본 발명의 재조합 세포는 본 발명의 어느 폴리뉴클레오티드 중에서 적어도 하나로 변형되는 어느 세포를 포함한다. 적합하고 바람직한 폴리뉴클레오티드 뿐만 아니라 적합하고 바람직한 세포로 이동시키는 재조합 분자들이 여기에 게재된다.
또한, 본 발명의 재조합 세포는 본 발명의 하나 이상의 폴리펩티드 및 식물에서 발현시 유용한 하나 이상의 다른 폴리펩티드를 암호화하는 식물 EG307 또는 EG1117 폴리뉴클레오티드를 포함하는 하나 이상의 재조합 분자와 함께 동시에 변형될 수 있다. 재조합 DNA 기술의 사용은, 예를 들어 숙주 세포 내에서 폴리뉴클레오티드의 수많은 복사, 이들 폴리뉴클레오티드가 전사되는 효율, 결과물 전사를 번역하는 효율, 및 후-번역 변형의 효율을 조절함으로써 변형된 폴리뉴클레오티드의 발현을 향상시킬 수 있다. 본 발명의 폴리뉴클레오티드의 발현을 증가시키기 위하여 유용한 재조합 기술은 높은-복사 수 플라스미드에 작용적으로 연결하는 뉴클레오티드, 하나 이상의 숙주 세포 크로모솜 내에 뉴클레오티드의 통합, 벡터 안정 시퀀스를 플라스미드에 추가, 전사 조절신호의 대체 또는 변형(예, 프로모터, 오퍼레이터, 인헨서), 번역조절 신호의 대체 또는 변형(예, 리보좀 연결 사이트, 샤인-달가르노 시퀀스), 숙주 세포의 코돈 사용에 연관되도록 하는 본 발명의 폴리뉴클레오티드의 변형, 전사를 불안정하게 하는 시퀀스의 삭제, 및 발효동안에 재조합 효소 생성으로부터 재조합 세포 성장을 시간적으로 분리하는 조절신호의 사용을 포함하지만, 이에 한정되지 않는다. 본 발명의 발현된 제조합 폴리펩티드의 활성은 폴리펩티드와 같은 폴리뉴클레오티드 암호화를 분해하거나, 변형하거나 또는 유도체를 만듬에 의해서 향상될 수 있다.
본 발명의 재조합 세포는 폴리펩티드와 같은 것을 생산하기 위한 효율적 조건하에서 그와 같은 세포를 배양시킴으로써 그리고 폴리펩티드를 회복시킴으로써 본 발명의 폴리펩티드를 하나 이상 생산하기 위해서 사용될 수 있다. 폴리펩티드를 생산하기 위한 효율적인 조건은 적절한 배양기, 바이오반응기, 온도, pH 및 폴리펩티드 생산을 허락하는 산소조건을 포함하지만, 이에 한정되지 않는다. 적절한 또는 효율적인 배양기는 배양될 때 본 발명의 세포가 본 발명의 EG307 또는 EG1117 폴리펩티드를 생산할 수 있는 어느 배양기를 말하는 것이다. 이와 같은 배양기는 흡수할 수 있는 탄소, 질소, 및 인산염 원천뿐만 아니라 적절한 소금, 미네랄, 금속 및 비타민과 같은 다른 영양분으로 이루어지는 전형적인 수성 배양기이다. 상기 배양기는 복합 영양분으로 이루어질 수 있거나 정의된 최소 배양기일 수 있다. 본 발명의 세포는 배치(batch), 페드-배치(fed-batch), 세포 리사이클, 및 연속 발효기를 포함하나 이에 한정되지 않는 종래의 발효 바이오반응기 내에서 배양될 수 있다. 또한, 배양하는 것은 쉐이크 플라스크(shake flasks) 테스트 튜브, 마이크로티터 디쉬(microtiter dishes) 및 페트리 플레이트(petri plates) 내에서 실행될 수 있다. 배양은 재조합 세포를 위하여 적절한 온도, pH 및 산소 함유량에서 실행될 수 있다. 이와 같은 배양조건은 당 분야에 종사하는 통상의 지식을 가진 자의 전문기술 내에서 잘 알려진 것이다.
생산을 위해 사용되는 벡터 및 숙주 시스템에 따라, 본 발명의 결과물인 폴리펩티드는 재조합 세포 내에 남거나; 발효배양기 내로 분비되거나;E. coli내에 페리플라스믹 공간과 같은 두 세포막 사이에 공간 내로 분비되거나; 또는 세포 또는 바이러스 막의 외부 표면상에 남게될 수 있다.
상기 용어 "폴리펩티드를 회복하여"는 폴리펩티드를 함유하는 전체 발효 중간물을 모은다는 단순한 의미이며, 분리 및 정제의 추가단계를 포함할 필요는 없다. 본 발명의 폴리펩티드는 어피니티(affinity) 크로마토그라피, 이온교환 크로마토그라피, 여과, 일렉트로포레시스, 소수성 상호작용 크로마토그래피. 겔 여과, 역 상 크로마토그래피, 콘카나바린 A 크로마토그래피, 크로마토포커싱, 및 차등 가용화와 같은 여러 종류의 일반적인 폴리펩티드 정제기술을 사용하여 정제될 수 있다.
본 발명의 폴리펩티드는 바람직하게 "실질적으로 순수한" 형태로 회수되는 것이 바람직하다. 여기서 사용된 것과 같이 "실질적으로 순수한"은 진단 또는 토스트 화합물과 같이 폴리펩티드의 효율적인 사용을 허용하는 순도를 언급하는 것이며, 선호도 증가와 함께 적어도 50%, 60%, 70%, 80%, 90%, 95%, 또는 98% 균등질을 의미하는 것이다.
F. 세포 트랜스팩션 식물세포 및 이식유전자 식물
EG307 및 EG1117와 관련하여, 특히 바람직한 재조합 세포는 식물세포이다. 반투과성 막에 의하여 둘러싸인 어느 자체-증식 세포는 "식물세포"를 의미하며, 플라스티드를 함유한다. 또한 이와 같은 세포는 만약 추가 증식이 바람직하면 세포벽을 요구한다. 식물세포는 알게(algae), 시아노박테리아(cyanobacteria), 종자,현탁배양, 싹, 메리스테메틱(meristematic) 영역, 유합조직, 잎, 뿌리, 슈트(shoot), 배우체, 포자체, 꽃가루 및 소포자를 포함하지만 이에 한정되는 것은 아니다.
특히 바람직한 실시태양에서, 본 발명의 EG307 또는 EG1117 폴리펩티드, 또는 그의 대립유전자 또는 돌연변이체의 적어도 하나(또는 둘)가 고등 유기체, 예를 들면, 식물에서 발현된다. 이 경우에, 효과적인 양의 폴리펩티드를 발현하는 유전자 도입 식물은 경제적인 생산성이 개선됨을 보여준다. 본 발명의 뉴클레오티드 서열은 발현 카세트(cassette)에 삽입되며, 그후 상기 식물의 게놈에서 바람직하게 안정하게 통합된다. 또다른 바람직한 실시태양에서, 뉴클레오티드 서열은 비병원성 자가 복제 바이러스에 포함된다. 본 발명에 따라 형질변환된 식물은 모노콧(monocot) 또는 디콧(dicot)일 수 있으며, 마이즈(maize), 밀(wheat), 보리(barley), 호밀(rye), 기장(millet), 병아리콩(chickpea), 렌틸(lentil), 플랙스(flax), 올리브(olive), 피그 아몬드(fig almond), 피스타치오(pistachio), 월넛(walnut), 비트(beet), 파스닙(parsnip), 감귤류 과일(citrus fruits) [오렌지, 레몬, 라임, 그레이프프루트(grapefruit), 탠져린(tangerine), 미네오라(minneola), 및 탄젤로(tangelo)을 포함하나 이에 한정되지는 않음], 고구마(sweet potato), 콩(bean), 완두(pea), 치커러(chicory), 레터스(lettuce), 캐비지(cabbage), 컬리플라우어(cauliflower), 브로콜리(broccoli), 터닙(turnip), 래디쉬(radish), 스피나크(spinach), 아스파라거스(asparagus), 양파(onion), 마늘(garlic), 고추(pepper), 셀러리(celery), 스쿼시(squash), 호박(pumpkin),삼(hemp), 주키니(zucchini), 사과(apple), 배(pear), 퀸스(quince), 메론(melon), 플럼(plum), 체리(cherry), 피치(peach), 넥타린(nectarine), 아프리콧(apricot), 딸기(strawberry), 포도(grape), 라습베리(raspberry), 블랙베리(blackberry), 파인애플(pineapple), 아보카도(avocado), 파파야(papaya), 망고(mango), 바나나(banana), 대두(soybean), 토마토(tomato), 소르검(sorghum), 슈가케인(sugarcane), 슈거비트(sugarbeet), 선플라워(sunflower), 레이프시드(rapeseed), 클로버(clover), 타바코(tobacco), 캐롯(carrot), 코튼(cotton), 알파파(alfalfa), 벼(rice), 감자(potato), 에그플랜트(eggplant), 커컴버(cucumber), 아라비돕시스(Arabidopsis), 및 목질 식물(woody plants)을 포함하나 이에 한정되는 것은 아니다.
일단 바람직한 뉴클레오티드 서열이 특정 식물 종으로 형질전환되면, 그 종안에서 전파되거나, 전통적인 번식 기법을 사용하여, 특히 시판되는 종류를 포함하여 동일 종의 다른 종류로 옮겨질 수 있다. .
따라서, 본 발명은
a) 식물 세포를 세포에 트랜스팩션시켜 단백질을 암호화하고, 상기 세포에 고유의 것이 아닌 EG307 및/또는 EG1117 폴리뉴클레오티드(여기서 상기 폴리뉴클레오티드는 유전자도입 단백질의 발현에 대해 효과적으로 사용될 수 있는 프로모터에 실시가능하게 연결된다)로부터 유래된, 이종기원 DNA 세그먼트를 함유시키는 단계 (폴리뉴클레오티드는 실제로 고유의 것일 수 있으나, 발현 패턴은 발달상으로 변할 수 있되 여전히 바람직한 효과에 이른다),
b) 경우에 따라, 유전자 도입 식물이 그로부터 재생되는 조건하에서 상기 세포를 성장시키고 유지시키는 단계;
c) 경우에 따라 상기 DNA가 발현되는 조건하에 상기 유전자도입 식물을 성장시켜 상기 식물 중의 EG307 및/또는 EG1117 폴리펩티드의 총량을 변화시키는 단계
를 포함하여 이루어지는 세포에 트랜스팩션된 식물 세포 또는 유전자도입 식물을 생산하는 방법을 제공한다. 바람직한 실시태양에서, 본 방법은 상기 이종기원 DNA 세그먼트가 발현되는 상기 이종기원 DNA 세그먼트를 포함하는 상기 유전자도입 식물의 후손의 추가의 세대를 얻고 성장시키는 단계를 더 포함한다. 본원에서 사용된 바와 같이, "이종기원 DNA", 또는 일부 경우에 "유전자도입"은 특별한 방식으로 식물의 장점을 변화시키기 위하여 이종(foreign) 유전자 또는 폴리뉴클레오티드, 또는 고유(native) 또는 내생적인 유전자 또는 폴리뉴클레오티드의 부가적인, 또는 변형된 버젼을 지칭한다(아마도 상이한 프로모터에 의해 구동됨)
본 발명은 또한 EG307 및/또는 EG1117 폴리펩티드를 엔코딩하는 이종 조직의 DNA를 포함하는 식물 세포를 제공한다. 바람직한 실시예에서, 유전자 도입 식물 세포는 유전자 도입 식물의 증식제(propagation material)이다. 본 발명은 또한 프로모터, 인핸서 또는 진화론적으로 중요한 EG307 및/또는 EG1117 폴리뉴클레오타이드의 인트론 폴리뉴클레오타이드를 포함하는 구성체로 트랜스펙션된 숙주 세포 및 리포터 단백질을 엔코딩하는 폴리뉴클레오타이드를 포함하는 트랜스펙션된 숙주 세포를 제공한다.
본 발명은 또한 a) EG307 및/또는 EG1117 폴리펩티드를 엔코딩하는 유전자전이를 갖는 트랜스펙션된 식물 세포를 생산시켜서 상기 식물 세포 내에서 EG307 및/또는 EG1117 발현을 변경시키는 단계; 및 b) 상기 트랜스펙션된 식물 세포의 유전자 도입 식물을 성장시키는 것으로서, 상기 EG307 및/또는 EG1117 유전자 전이는 상기 유전자 도입 식물 내에서 발현되는 단계를 포함하는 것을 특징으로 하는 향상된 경제적인 생산성을 제공하는 방법을 제공한다. 몇 실시예에서는 유전자 전이의 발현으로 원래의 EG307 및/또는 EG1117 유전자를 방해할 수 있는 RNA를 생산시켜 원래 유전자의 발현이 제거되거나 감소되어 유용한 결과를 얻는다.
본 발명은 또한 식물 조직 내에서 발현된 EG307 및/또는 EG1117 폴리펩티드를 엔코딩하는 이종 조직의 DNA를 포함하며 상기 식물 내로 도입된 벡터 내에서의 발현을 포함하는 유전자 도입 식물을 제공한다.
본 발명은 또한 식물 조직 내에서 EG307 및/또는 EG1117 유전자를 엔코딩하는 폴리뉴클레오타이드에 실시 가능하게 연결된 전사 조절 요소(transcription control element)를 포함하는 분리 폴리뉴클레오타이드를 제공한다. 바람직한 실시예에서, 전자 조절 요소는 EG307 및/또는 EG1117 유전자 본래의 프로모터이다.
본 발명은 또한 a) 가축화된 식물 내에서 진화론적으로 중요한 EG307 및/또는 EG1117 폴리뉴클레오타이드를 확인시키는 단계; b) 상기 EG307 및/또는 EG1117 폴리뉴클레오타이드를 사용하여 전사 및 번역 조절 요소, 인핸서, 인트론 또는 다른 5' 또는 3' 플랭킹 서열일 수 있는 비-폴리펩티드 코딩 서열을 확인시키는 단계; c) 상기 비-폴리펩티드 코딩 서열 및 리포터 단백질을 엔코딩하는 폴리뉴클레오타이드를 포함하는 구성체를 회합시키는 단계; 및 d) 상기 구성체를 숙주 세포에트랜스펙션시키는 단계를 포함하는 트랜스펙션된 세포를 제조하는 방법을 제공한다. 본 발명은 또한 이 방법에 따라 생산된 트랜스펙션된 세포를 제공한다. 한 실시예에서, 상기 숙주 세포는 식물 세포이고, 상기 방법은 유전자 도입 식물을 재생시키기에 적합한 조건하에서 상기 세포를 성장시키고 유지시키는 단계를 더 포함한다. 또한 상기 방법에 의하여 생산된 유전자 도입 식물을 제공한다.
본 발명의 뉴클레오타이드 시퀀스는 유전자 도입 식물에서 발현되어, 유전자 도입 식물 안에 상응하는 EG307 및/또는 EG1117의 생합성을 유발한다. 이러한 방법에서, 향상된 경제적 생산성과 연관된 특질을 가진 이식식물이 제조된다. 이식식물에서 그들의 발현을 위해, 본 발명의 뉴클레오타이드 시퀀스는 수정(modification) 및 최적화를 요구한다. 비록 바람직한 유전자 시퀀스는 모노코틸레도노오스(monocotyledonous) 및 디코틸레도노오스(dicotyledonous) 식물 종에서 발현되지만, 시퀀스는 그들의 성향(기호)가 다른 것으로 보여지기 때문에 모노코틸레도노오스(monocotyledonous) 또는 디코틸레도노오스(dicotyledonous)의 GC 함량 성향 및 특이 코돈 성향을 설명하기 위하여 수정될 수 있다(Murray et al. Nucl. Acids Res. 17.477-498(1989)).
상기 언급된 것과 같은 뉴클레오타이드 시퀀스 내에서 만들어지기 위해 요구되는 모든 변화는 유럽특허공개공보 제0 385 962호(to Monsanto) 및 제0 359 472호(to Lubrizol), 및 PCT 공개공보 제WO 93/07278호(to Ciba-Geigy)에 공개된 방법을 사용하는 사이트 명령된 돌연변이, PCR, 및 중합 유전자 구조물의 공지 기술을 사용하여 만들어진다.
번역의 시작을 위해서, 초기 메티오닌에 근접한 시퀀스는 수정을 요구한다. 예를 들어, 식물에서 유용하게 알려진 시퀀스의 함유물에 의해 수정될 수 있다. Joshi는 식물을 위해 적합한 일치를 제시하였으며(NAR 15: 6643-6653(1987)), Clontech는 일치 번역 개시제를 제시했다(1993/1994 catalog, page 210). 상기 일치 본 발명의 뉴클레오타이드 시퀀스 사용을 위해 적당하다. 시퀀스는 ATG를 포함하는(변형되지 않은 제2 아미노산을 남기는 반면에), 또는 선택적으로 ATG에 수반하는 GTC를 포함하는(도입유전자의 제2 아미노산을 변형할 가능성을 갖는) 뉴클레오티드 시퀀스로 이루어지는 구조에 통합된다.
유전자 도입 식물에서 뉴클레오타이드 시퀀스의 발현은 식물에서 기능적으로 보이는 전사조절 요소에 의해 유도된다. 상기 조절요소의 조절 하에 뉴클레오타이드를 식물의 형질전환은 형질전환된 식물에서 조절된 발현을 제공한다. 상기 전사조절요소는 위에 언급되었다. 전사의 적당한 개시제의 선택에 더하여, 식물에서 EG307 및/또는 EG1117의 발현을 위한 구조물은 이동성 뉴클레오타이드 시퀀스의 하부에 부착되기 위하여 적합한 전사 종결자를 요구한다. 여러개의 전사 종결자와 이용가능하며 종래 기술에 알려져 있다(예, tm l from CaMV, E9 from rbcS). 식물에서 작용하는 것으로 알려진 다른 이용가능한 종결자는 본 발명에서 사용될 수 있다.
수많은 다른 시퀀스는 본 발명에 설명된 발현 카셋트(cassettes) 내로 통합될 수 있다. 이들은 인트론 시퀀스(예, Adhl 및 bronzel로부터) 및 바이러스 리더(leader) 시퀀스(예, TMV, MCMV, 및 AMV)와 같이 발현을 보여줬던 시퀀스를 포함한다.
또한, 본 발명은 a) EG307 및/또는 EG1117 폴리펩티드를 암호화하는 도입 유전자를 갖는 유전자 도입 식물세포를 생성하는 것 및 상기 도입 유전자는 유전자의 조절된 발현을 위해 적합한 규정 시퀀스의 조절하에 있다; 및 b) EG307 및/또는 EG1117 도입 유전자가 도입 유전자 식물에서 발현되는 도입 유전자 식물 세포로부터 도입 유전자 식물을 성장시키는 것으로 이루어지는 식물내에서 산출량을 증가시키는 방법을 제공한다.
또한, 본 발명은 a) EG307 및/또는 EG1117 유전자의 구조적인 발현을 제공하는 프로모터의 조절 하에서 EG307 및/또는 EG1117 유전자를 함유하는 도입 유전자를 갖는 세포감염 식물을 생산하는 것; 및 b) EG307 및/또는 EG1117 도입 유전자는 도입 유전자 식물에서 구조적으로 발현되는 도입 유전자 식물세포로부터 도입 유전자 식물을 성장시키는 것으로 이루어지는 식물내에서 산출량을 증가시키는 방법을 제공한다.
또한, 본 발명은 a) EG307 및/또는 EG1117 유전자의 조절가능한 발현을 제공하는 프로모터의 조절하에 EG307 및/또는 EG1117 유전자를 포함하는 유전자 전이(transgene)를 갖는 트랜스펙션된 식물 세포를 생산하는 단계; 및 b) 유전자 조작 식물 세포로부터 유전자 조작 식물을 생장시키는 단계로서, 상기 EG307 및/또는 EG1117 유전자 전이는 상기 유전자 조작 식물 내에서 조절 가능하게 발현되는 것을 특징으로 하는 유전자 조작 식물 내에서 조절가능한 수율을 제공하는 방법을 제공한다. 본 발명의 한 실시예에서는 조직-특이성 또는 세포형-특이성 프로모터를 이용하여, 또는 화학적 신호 또는 작용제와 같은 외부 신호 또는 작용제를 도입함으로써 활성화되는 프로모터에 의하여 EG307 및/또는 EG1117 유전자는 발현된다.
본 발명에 의한 핵산 서열의 발현을 식물에서의 다른 세포 편재화로 목적을 삼는 것이 바람직할 수 있다. 어떤 경우들에서는, 사이토졸(cytosol)에서의 편재화는 바람직할 수 있는 반면에, 어떤 경우들에서는 몇몇의 세포 이하의 세포 기관에서의 편재화가 바람직할 수 있다. 폴리펩티드가 인코딩된 이동성(heterologous) DNA의 세포 이하의 편재화는 종래 기술에서 잘 알려진 기술을 이용하여 실시된다. 일반적으로, 알려진 세포기관이 타겟팅된 유전자 생성물로부터의 DNA을 인코딩하는 타겟 펩티드는 핵산 서열의 상류에서 처리되고 융합된다. 많은 이러한 타겟 서열은 엽록체에 대하여 알려져 있으며, 그들의 이종 조직 구조물에서의 기능은 알려져 있다. 본 발명에 의한 핵산 서열의 발현 또한 숙주 세포의 소포체 또는 액포로 타겟화되어 있다. 이를 달성하기 위한 기술은 종래기술로 알려져 있다.
식물 형질전환에 적합한 벡터는 본 명세서의 다른 곳에 기재되어 있다. 아그로박테리움에 의해 조절되는(Agrobacterium-mediated) 형질전환에서, 바이너리 벡터 또는 적어도 하나의 T-DNA 보더 서열을 운반시키는 벡터가 적합한 반면에, 직접 유전자를 운반하는 것에 대해서는 모든 벡터가 적합하고, 관심있는 구조만을 포함하는 선형 DNA가 바람직할 수 있다. 직접적인 유전자 운반의 경우에서는 단일 DNA종에 의한 형질전환 또는 공-형질전환(co-transformation)이 사용될 수 있다(Schocher et al. Biotechnology 4: 1093-1096 (1986)). 직접적인 유전자 운반 및 아그로박테리움에 의해 조절되는 운반에서, 형질전환은 대개(그러나 반드시는 아닌) 항생제(카나마이신(kanamycin), 히그로마이신(hygromycin) 또는 메토트렉사트(methotrexate)) 또는 제초제(바스타(basta))에 대한 내성을 제공할 수 있는 선택 가능한 마커를 이용하여 실시된다. 그러나 선택 가능한 마커의 선택은 본 발명에서 결정적인 요인은 아니다.
또 다른 바람직한 실시예에서, 본 발명에 의한 핵산 서열은 색소체 게놈으로 직접적으로 형질전환된다. 색소체 형질전환의 주요한 이점은 색소체는 단일 프로모터의 조절하에서 다중의 오픈 리딩 프레임을 발현시킬 수 있다는 것이다. 색소체 형질전환 기술은 미국특허 제5,451,513호, 제 5,545,817호 및 제5,545,818호, 및 국제특허출원 WO 96/16783호, 및 McBride 등의 문헌(1994) Proc. Natl. Acad. Sci. USA 91, 7301-7305에 광범위하게 기재되어 있다. 엽록체 형질전환에 대한 기초 기술은 관심의 대상이 되는 유전자와 함께 적합한 타겟 조직으로 선택 가능한 마커를 플랭킹(flanking) 클론화된 색소체 DNA의 부위를 도입시키는 것, 즉 바이오리스틱스(biolistics) 또는 원생동물 형질전환(곧, 칼슘클로라이드 또는 PEG이 조절된 형질전환)을 이용하는 것을 포함하고 있다. 타겟팅 서열로 명명된, 1 내지 1.5kb의 플랭킹 부위는 색소체 게놈에 의한 동종 조직의 재조합을 용이하게 하여 플라스톰(plastome)의 특정 부위에 대한 교체 또는 수정을 가능하게 한다. 초기에는, 스펙티노마이신(spectinomycin) 및/또는 스트렙토마이신(streptomycin)에 대한 내성을 주는 염색체 16S rRNA 및 rps12 유전자에서의 점 돌연변이들은 형질전환에서의 선택 가능한 마커로서 이용된다(Svab, Z., Hajdukiewicz, P., and Maliga, P. (1990) Proc. Natl. Acad. Sci. USA 87, 8526-8530; Staub, J. M., and Maliga, P.(1992) Plant Cell 4, 39-45). 타겟 리브(target leaves)의 100 봄바드먼트(bombardment) 당 대략 하나의 안정한 호모프라스믹(homoplasmic) 형질전환체를 얻었다. 이들 마커 사이의 클로닝 위치가 존재하는 것은 외부 유전자의 도입에 대한 색소체 타겟팅 벡터가 생성되게 한다(Staub, J.M., and Maliga, P. (1993) EMBO J. 12, 601-606). 열성 rRNA 또는 r-폴리펩티드 항생제 내성 유전자를 우세한 선택 마커, 스텍티노마이신을 해독시키는 효소 아미노글리코시드-3’-아데닐트랜스퍼라제(aminoglycoside-3’-adenyltransferase)를 인코딩하는 박테리아의 aadA 유전자로 교체함으로써 형질전환 빈도가 실질적으로 증가된다(Svab, Z., and Maliga, P.(1993) Proc. Natl. Acad. Sci. USA 90, 913-917). 이전에는 이 마커는 녹조류 클라미도모나스 레인하드티(Chlamydomonas reinhardtii)의 고빈도의 색소체 게놈 형질전환에 성공적으로 사용되었었다(Goldschmidt-Clermont, M. (1991) Nucl. Acids Res. 19: 4083-4089). 색소체 형질전환에 이용할 수 있는 다른 선택 가능한 마커는 종래기술에 알려져 있으며 본 발명의 범위에도 포함된다. 일반적으로 호모플라스티딕(homoplastidic) 상태에 이르기 위하여 형질전환 후에 약 15-20 세포 분열 사이클이 요구된다. 색소체 안에서, 각 식물 세포 내에 존재하는 수천 개의 원형 색소체 게놈 복사체 전부로 동종 조직 재조합에 의하여 유전자가 삽입되고, 그 색소체 발현은 핵-발현 유전자에 대하여 수많은 복사체 수를 가짐으로써 발현 레벨이 총 용해 가능한 식물 폴리펩티드의 10%를 쉽게 능가할 수 있게 해주는 이점이 있다. 한 바람직한 실시예에서, 본 발명에 의한 핵산 서열은 벡터를 타겟팅하는 색소체에 삽입되고 바람직한 식물 숙주의 색소체 게놈으로 형질전환된다. 본 발명에 의한 핵산 서열을 포함하는 색소체 게놈을 위한 식물 호모플라스틱을 얻고, 우선적으로 핵산 서열의 발현이 잘 일어나게 할 수 있다.
또한, 본 발명은 a) 식물 조직 샘플을 제공하는 단계; b) 상기 식물 조직 샘플로 식물 산출량과 연관된 유전자 후보를 도입하는 단계; c) 상기 식물 산출량과 연관된 유전자 후보를 상기 식물 조직 샘플 내에서 발현시키는 단계; 및 d) 상기 식물 조직 샘플이 산출량 반응에 변화를 나타내는지의 여부를 결정하여 반응에서의 변화로 식물 산출량과 연관된 유전자를 확인하는 단계를 포함하는 것을 특징으로 하는 식물 산출량이 연관된 유전자를 확인하는 방법을 제공한다. 또한, 본 발명은 상기 방법에 의하여 분리된 식물 산출량과 연관된 유전자를 제공한다.
상기에 사용된 산출량 반응은 당업계의 기술에 잘 알려진 기술에 의하여 측정된다. 예를 들면 메트릭스(metrics), 곡물 중량, 곡물 길이, 곡물 중량/1000 그레인, 원추화서(panicle)의 크기, 원추화서의 수, 곡물/원추화서의 수 중에서 하나 또는 그 이상에 의하여 곡물에서 산출량 반응은 결정된다.
G. EG307 또는 EG1117 항체
또한 본 발명은, 본 발명에 의한 EG307 또는 EG1117 폴리펩티드 또는 그 미메토프(mimetope)에 선택적으로 결합할 수 있는 분리 항체를 포함한다. 이러한 항체도 역시 여기에서는 항-EG307 또는 항-EG1117 항체로 기재되어 있다. 특히 본 실시예의 바람직한 항체는 항-O. sativaEG307 항체, 항-O. rufipogonEG307 항체, 항-Z. maysEG307 항체, 항-O. sativa EG1117 항체, 항-O. rufipogon EG1117 항체, 항-Z. maysEG117 항체를 포함한다.
분리된 항체는 자연 환경으로부터 제거된 항체이다. “분리”라는 용어는 이러한 항체의 순수한 상태를 말하지 않는다. 그와 같은 것으로서, 분리된 항체는 이러한 항체를 포함하는 항-혈청, 또는 다양한 정도로 정제된 항체를 포함할 수 있다.
여기에 기재된“선택적으로 결합하는”이란 용어는 특정화된 폴리펩티드 및 본 발명에 의한 그 미메토프에 우선적으로 결합하는 본 발명에 의한 항체의 능력을 나타낸다. 결합은 이뮤노블롯 에세이(immunoblot assay), 면역침강 에세이(immunoprecipitation assays), 방사면역에세이(radioimmunoassay), 효소 면역에세이법(enzyme immunoassays, ELISA), 면역형광 항체 에세이(immunofluorescent antibody assays) 및 면역전자 현미경 측정법(ummunoelectron microscopy)을 포함한 당업계의 기술에서 숙련자에게 알려진 다양한 방법에 의하여 측정할 수 있다: 예를 들면, Sambrook et al., ibid., and Harlow & Lane, 1990, ibid.이 있다.
본 발명의 항체는 폴리클로날 또는 모노클로날 항체 중 하나일 수 있다. 본 발명의 항체는 단쇄 항체를 포함하는, 상기 항체를 얻기 위하여 사용된 적어도 하나의 폴리펩티드 에피토프 또는 미메토프에 선택적으로 결합할 수 있는 항체 분절 및 유전적으로 처리된 항체와 같은 기능성 동등물을 포함한다. 바람직하게는 항체는 적어도 부분적으로 본 발명에 의한 폴리뉴클레오타이드에 의하여 인코딩된 폴리펩티드 또는 그 미메토프에 반응하여 재배된다.
본 발명의 항체를 생산하는 바람직한 방법은 (a) 본 발명에 의한 폴리펩티드또는 미메토프의 효과적인 양을 동물에 주입시키는 단계; (b) 상기 항체를 회복시키는 단계를 포함한다. 또 다른 방법에서, 본 발명에 의한 항체는 본 발명의 EG307 또는 EG1117 폴리펩티드를 생산하기 위한 이제까지 개시된 기술을 이용하여 재조합적으로 생산된다.
본 발명에 의한 항체는 본 발명의 범위 내에서 다양한 잠재적인 용도를 가지고 있다. 예를 들면, 이러한 항체는 (a) 식물에 의한 EG307 또는 EG1117의 발현을 감지하기 위한 에세이에 사용되는 시약으로서, 및/또는 (b) 라이브러리의 발현을 스크리닝하기 위한 도구 및/또는 폴리펩티드 혼합물 또는 다른 불순물들로부터 본 발명의 바람직한 폴리펩티드를 회복시키기 위한 도구로서 사용될 수 있다. 더욱이, 본 발명에 의한 항체는 이러한 식물들을 직접 죽이기 위하여 식물에 대한 사이토톡식 약제(cytotoxic agents)를 타겟팅하기 위하여 사용될 수 있다. 타겟팅은 당업계에서 숙련자에게 알려진 기술을 이용하여 상기 항체를 사이토톡식 약제에 접합시킴으로써 완성될 수 있다. 적절한 사이토톡식 약제는 본 기술의 당업자들에게 알려져 있다. 적절한 사이토톡식 약제는 하기의 물질을 포함하나, 이에 한정되는 것은 아니다: 디프테리아(diphtheria) 독소, 리신(ricin) 독소, 슈도모나스(Pseudomonas) 외독소, 모데친(modeccin) 독소, 아브린(abrin) 독소, 및 시가(shiga) 독소와 같은 이중쇄 폴리펩티드(즉, A 및 B쇄를 갖는 독소); 미국자리공(pokeweed) 항바이러스성 폴리펩티드, α-아마니틴(α-amanitin) 및 폴리펩티드를 저해시키는 리보좀과 같은 단쇄 독소; 및 멜파란(melphalan), 메토트렉사트, 질소 머스터드(nitrogen mustard), 독소루비신(doxorubicin) 및다우노마이신(daunomycin)과 같은 화학적 독소이다. 바람직한 이중쇄 독소는 독소 도메인 및 상기 독소 도메인의 전좌(translocation)을 포함하도록 수정되나, 독소의 내재하는 세포 결합 도메인이 모자란다.
H. 성장-강화 조성물의 제형화
본 발명은 또한 본 발명에 의한 EG307 또는 EG1117 폴리펩티드 중 적어도 하나 또는 둘을 포함하는 조성물을 포함한다. 효과적으로 성장을 조절하기 위하여 상기 조성물은 바람직하게는 효과적인 양의 폴리펩티드를 포함한다. 상기 양은 타겟 곡류, 습도, 온도 또는 토양의 형태와 같은 주위의 조건에 따라 달라진다. 바람직한 실시예에서는, EG307 및/또는 EG1117 폴리펩티드는 포함하는 조성물은 부가의 정제 과정 없이 폴리펩티드를 발현시키는 숙주 세포를 포함한다. 또 다른 바람직한 실시예에서는, EG307 및/또는 EG1117 폴리펩티드는 성장-강화제로 사용되기에 앞서 동결건조된다. 또 다른 실시예에서는 EG307 또는 EG1117 폴리펩티드는 상기 숙주 세포로부터 분비되도록 가공된다. 발현이 바람직하게 이루어지는 숙주 세포의 폴리펩티드를 정제하는 경우에는 EG307 또는 EG1117 폴리펩티드의 다양한 정도의 정제가 이루어진다.
더욱이 본 발명은, 본 발명의 의한 적어도 하나의 EG307 또는 EG1117 폴리펩티드에서 하나 또는 그 이상의 화합물 또는 여기에 기재된 화합물의 군으로 균질하게 혼합된 조성물의 제조를 포함한다. 또한 본 발명은 EG307 또는 EG1117 폴리펩티드 또는 EG307 또는 EG1117 폴리펩티드를 포함하는 조성물을 식물에 응용하는 것을 포함하는 식물 처리방법에 관한 것이다. EG307 또는 EG1117 폴리펩티드는 동시에 또는 연속적으로 다른 화합물로 처리될 조성물 또는 식물의 형태로 농작물 분야에 응용될 수 있다. 이들 화합물들은 비료 또는 미량영양소 제공자 또는 식물 성장에 영향을 줄 수 있는 다른 조제품일 수 있다. 이들은 또한 선택적인 제초제, 살충제, 곰팡이 제거제, 살균제, 네마티사이드(nematicides), 살달팽이제(molluscides) 또는 몇몇의 이들 조제품의 혼합물일 수 있으며, 바람직하다면 제형화 분야에서 습관적으로 사용되는 캐리어 계면활성제 또는 응용-촉진 보조제를 더 사용할 수 있다. 적절한 캐리어와 보조제 고상 또는 액상일 수 있으며, 제형화 기술에서 흔히 사용되는 물질, 곧 자연 또는 재생 미네랄 물질, 용매, 분산제, 습윤제, 점착부여제(tackifiers), 바인더(binders) 또는 비료에 해당된다.
본 발명에 의한 EG307 또는 EG1117 폴리펩티드를 적용하는 바람직한 방법은 토양, 물 또는 식물의 군엽에 스프레이하는 것이다. 적용예의 수 및 속도는 식물의 타입 및 바람직한 수율 증가에 달려있다. 또한 EG307 또는 EG1117 폴리펩티드는 식물 로커스에 액체 조성물이 스며들게 하거나 고체 형태, 즉 과립 형태의 화합물을 토양에 적용(토양 적용)시킴으로써 뿌리를 지나서 토양을 경유하여 식물을 침투할 수 있다(침투성 작용). EG307 또는 EG1117 폴리펩티드는 또한 EG307 또는 EG1117 폴리펩티드를 포함하는 액체 제형을 종자에 스며들게 하거나 또는 종자에 고체 제형을 코팅시킴으로써 종자(코팅)에 적용될 수 있다. 특별한 경우에는, 다른 형태의 응용 또한 가능한데, 예를 들면 식물의 줄기 또는 싹에 선택적으로 처리하는 것이다.
EG307 또는 EG1117 폴리펩티드는 수정되지 않는 형태로 사용될 수 있고, 바람직하게는 제형화에 대한 종래 기술에 사용된 보조제와 함께 사용될 수 있으며, 그럼으로써 유제(emulsifiable concentrates), 코팅할 수 있는 페이스트, 직접 스프레이 또는 희석시킬 수 있는 용액, 희석 에멀젼, 수화제(wettable powders), 수용제(soluble powders), 분말(dusts), 과립화, 또한, 예를 들면 고분자 물질 내로의 캡슐화에 대한 알려진 방식으로 제형화한다. 조성물의 성질처럼, 스프레잉, 오토마이징(atomizing), 살분법(dusting), 산란법(scattering) 또는 푸어링(pouring)과 같은 적용 방법들은 의도하는 목적물과 우세한 환경에 따라서 선택된다.
EG307 또는 EG1117 폴리펩티드 및 적절하다면, 고체 또는 액체 보조제를 포함하는 제형, 조성물 또는 조제품은 알려진 방식, 예를 들면 균질적으로 혼합 및/또는 EG307 또는 EG1117 폴리펩티드를 희석제(extenders), 예를 들면 용매, 고체 캐리어 및, 적절하다면 표면 활성 화합물(계면활성제)와 함께 분쇄시킴으로써 제조한다.
적절한 용매는 방향족 탄화수소, 바람직하게는 8 내지 12의 탄소 원자수를 갖는 단편, 예를 들면 크실렌 혼합물 또는 치환된 나프탈렌, 디부틸 프탈레이트 또는 디옥틸 프탈레이트와 같은 프탈레이트, 시클로헥산 또는 파라핀과 같은 지방족 탄화수소, 에탄올, 에틸렌글리콜 모노에틸 또는 모노에틸 에테르와 같은 알코올 및 글리콜 및 그 에테르 및 에스테르, 시클로헥산온과 같은 케톤, N-메틸-2-피롤리돈, 디메틸설폭사이드 또는 디메틸 포름아마이드와 같은 강한 극성 용매, 뿐만 아니라 에폭시화된 코코넛 오일 또는 대두 오일과 같은 에폭시화된 식물 오일 또는 물을 포함한다.
고체 캐리어, 즉 분말 및 분산 파우더를 위해 사용된 고체 캐리어는 일반적으로 방해석(calcite), 활석(talcum), 고령토(kaolin), 몬모릴로나이트(montmorillonite) 또는 에타펄자이트(attapulgite)와 같은 천연 미네랄 필터가 사용된다. 물리적인 성질을 향상시키기 위하여 고분산된 규산(silicic acid) 또는 고분산된 흡수제 고분자를 첨가하는 것 또한 가능하다. 적절한 과립화된 흡착 캐리어는 다공형인데, 예를 들면 경석(pumice), 깨진 벽돌, 해포석(sepiolite) 또는 벤토나이트(bentonite)이며, 적절한 비흡수제 캐리어는 방해석 또는 모래와 같은 미네랄이다. 더욱이, 많은 수의 예비 과립화된 무기 또는 유기성의 물질들, 즉, 특히 백운석(dolomite) 또는 분쇄된 식물 잔기들이 사용될 수 있다.
적절한 표면-활성 화합물은 우수한 에멀젼화, 분산화 및 습윤화 성질을 갖는 비이온성, 양이온성 및/또는 음이온성 계면활성제이다. “계면활성제”라는 용어는 또한 게면활성제의 혼합물 또한 포함할 수 있다. 적절한 음이온성 계면활성제는 수용성 비누 및 수용성 합성 표면-활성 화합물 둘 다 될 수 있다.
적절한 비누는 알칼리 금속염, 알칼리 토금속염 또는 고급 지방산(10 내지 22의 탄소수의 사슬)의 비치환된 또는 치환된 암모늄염, 예를 들면 올레인산 또는 스테아르산의, 또는 예를 들면 코코넛 오일 또는 탤로우 오일(tallow oil)로부터 얻을 수 있는 천연 지방산 혼합물의 소듐 또는 포타슘염들이다. 지방산 메틸타우린 염도 사용될 수 있다.
그러나 보다 흔하게 소위 합성 계면활성제가 사용되며, 특히 지방 설포네이트(fatty sulfonates), 지방 설페이트(fatty sulfates), 설포네이트화된 벤즈이미다졸 유도체 또는 알킬아릴설포네이트(alkylarylsulfonate)가 사용된다.
지방 설포네이트 또는 설페이트는 일반적으로 알칼리 금속염, 알칼리 토금속염 또는 비치환된 또는 치환된 암모늄염의 형태이며, 알킬라디칼의 알킬기 일부분(alkyl moiety)도 포함하는, 8 내지 22개의 탄소의 알킬라디칼을 가지며, 예를 들면 리그노설포닉 에시드(lignosulfonic acid), 도데실설페이트 또는 천연 지방산으로부터 얻은 지방 알코올 설페이트 혼합물의 소듐 또는 칼슘염이 있다. 이들 화합물들도 설퍼릭 에시드 에스테르(sulfuric acid esters) 및 지방 알코올/에틸렌 옥사이드 부가물의 설포닉 에시드(sulfonic acids)의 염들을 포함한다. 설포네이트화된 벤즈이미다졸 유도체는 바람직하게는 2개의 설포닉 에시드기 및 8 내지 22개의 탄소수를 갖는 하나의 지방산 라디칼을 포함한다. 알킬아릴설포네이트의 예는 도데실벤젠설포닉 에시드, 디부틸나프탈렌설포닉 에시드, 또는 나프탈렌설포닉 에시드/포름알데히드 축합 생성물의 소듐, 칼슘 또는 트리에탄올아민염이다. 또한 대응되는 포스페이트의 적절한 예는 4 내지 14몰의 에틸렌 옥사이드를 갖는 p-노닐페놀(p-nonylphenol)의 부가물의 인산에스테르염이다.
비이온성 계면활성제는 바람직하게는 지방족 또는 고리지방족 알코올, 또는 포화 또는 불포화 지방산 및 알킬페놀의 폴리글리콜 에스테르 유도체이며, 상기 유도체는 3 내지 30개의 글리콜 에테르기 및 (지방족) 탄화수소 일부분에 8 내지 20개의 탄소수를 및 알킬페놀의 알킬기의 일부분에 6 내지 18개의 탄소수를 갖는다.
더 적절한 비이온성 계면활성제는 알킬기 사슬에 1 내지 10개의 탄소수를갖는 폴리프로필렌 글리콜, 에틸렌디아민 프로필렌 글리콜 및 알킬폴리프로필렌 글리콜과 함께 폴리에틸렌옥사이드의 수용성 부가물이 사용되는데, 상기 부가물은 20 내지 250개의 에틸렌 글리콜 에테르기 및 10 내지 100개의 프로필렌 글리콜 에테르기를 가진다. 이들 화합물들은 일반적으로 프로필렌 글리콜 유니트 당 1 내지 5개의 에틸렌 글리콜 유니트를 가진다.
비이온성 계면활성제의 대표적인 예는 노닐페놀폴리에톡시에탄올(nonylphenolpolyethoxyethanols), 피마자유(castor oil) 폴리글리콜 에테르, 폴리프로필렌/폴리에틸렌 옥사이드 부가물, 트리부틸페녹시폴리에톡시에탄올, 폴리에틸렌 글리콜 및 옥틸페녹시에톡시에탄올이다. 폴리옥시에틸렌 소르비탄(polyoxyethylene sorbitan) 및 폴리옥시에틸렌 소르비탄 트리올레아에이트(polyoxyethylene sorbitan trioleate)의 지방산 에스테르 또한 적절한 비이온성 계면활성제이다.
양이온성 계면활성제는 바람직하게는 N-치환체로서 적어도 하나의 C8-C22의 알킬 라디칼을 가지며, 다른 치환체로서는 저급 비치환된 또는 할로겐화된 알킬, 벤질 또는 저급 하이드록시알킬 라디칼을 갖는 4차 암모늄 염이다. 염은 할라이드, 메틸설페이트 또는 에틸설페이트, 즉 스테아릴트리메틸암모늄 클로라이드 또는 벤질디(2-클로로에틸)에틸암모늄 브로마이드의 형태인 것이 바람직하다. 제형화 기술에서 일반적으로 사용되는 계면활성제는 예를 들면, “McCutcheon’s Detergents and Emulsifiers Annual, “MC Publishing Corp. Ringwood, N.J.,1979, and Sisely and Wood, “Encyclopedia of Surface Active Agents,” Chemical Publishing Co., Inc. New York, 1980의 문헌에 기재되어 있다.
IV . 중성 조건하에서 유전자 진화의 확인
여기 상세하게 기재된 것처럼, KA/KS분석은 궁극적으로 선택된 단백질-코딩 유전자의 확인을 가능하게 해준다. 그러나 이러한 형태의 분석은 또한 다른 일련의 진화론적으로 중요한 유전자, 중성 조건하에서 진화하는 이들 유전자를 확인하기 위하여 사용될 수 있다.
KA/KS비가 1보다 크다는 것은 궁극적인 선택의 역할을 의미하는 것이고, 반면 그 반대의 경우, 즉 KA/KS비가 1보다 작은 것은 단백질-코딩 유전자가 부정적으로 선택되었다(유지되었다)는 것을 의미한다. 여기 어느 곳에서 기재되었듯이, 대부분의 유전자(사실, 막대한 대다수)가 유지된다. 거의 유전자들이 궁극적으로 선택되지 않기 때문에, 거의 유전자가 KA/KS비 > 1를 나타내지 않는다. 여기에 기재되어 있듯이, (다른 곡류뿐만 아니라) 곡물이 재배되는 동안에 궁극적으로 선택된 유전자는 상업적으로 중요한 가치를 갖는다. 그러나 재배된 식물의 게놈 내에 포함된 다른 일련의 유전자는 (재배된 자손에서 바람직하고 강화된 특성을 생산하기 위하여) 궁극적으로 선택되지도, 부정적으로 선택되지도(유지되지도) 않았다. 식물 유전자의 이 부분도 상기에서 나타낸 것처럼 상업적으로 중요한 가치를 지니며, 이 일련의 유전자들은 KA/KS분석을 이용함으로써 확인될 수 있고 여기 기재할 것이다.
이들 유전자에는 내한발성, 질병, (곤충, 초식동물 및 미생물을 포함하나, 이것에 한정되는 것은 아닌) 해충, 높은 염 수준, 및 다른 스트레스에 대한 저항성을 식물에 주는 것들이 포함된다. 해충에 의한 공격, 및 가뭄 또는 높은 염 수준 등에 의한 피해는 농부, 종자 회사 및 큰 농업회사에 연간 수억 달러의 손실을 준다. 그리하여 야생 식물에 이들 스트레스에 대한 저항성을 주는 유전자의 확인은 (식량난의 세계에) 사회적으로나 경제적으로 중요한 가치를 지닌다.
상기 유전자들을 검색하는 방법은 다음과 같다. 우선 식물이 재배된 후(결과적으로, 파생종이 더욱 도입되었을 때), 그것은 “응석받이(pamperd)"이었다. 예를 들면 인간이 식물의 요구를 충족시키기 위하여 충분한 양으로 물을 공급하는 것이다. 그러므로, 식물은 ”단독으로(on its own)" 가뭄 스트레스를 처리할 것이 요구되지 않는다. 유사하게, 인간이 해충을 제거하며(물리적으로 또는 살충제의 사용을 통해서), 재배된 식물을 초식동물로부터 분리한다. 그래서, 재배된 식물은 상기 해충을 다루는 문제에 항상 직면하지는 않는다. 사실, 예를 들면 재배된 곡식이 그들의 상대적인 야생종/원종에 비하여 내한발성, 고 염분, 해충, 및 다른 스트레스에 훨씬 공격받기 쉬운 것으로 기록되어져 왔다. 이것은 일반적으로 조직체가 생존을 위하여 요구되지 않는 능력을 유지하지 못하기 때문이다. 인간이 이러한 역할을 하기 때문에, 스트레스와 연관된 특징을 암호화하는 유전자를 유지하기 위하여 높은 물질대사 양(물질대사 낭비(extravagance))을 절약할 수 있다.
저항의 손실은 원종과 이것의 응석받이 재배종 사이의 유전적 차이(예를들면, 변화들)로부터 발생하는 것이 분명하다. 기능의 손실을 야기하는 상기 유전적 변화들은 3가지 다른 메카니즘을 통하여 발생할 수 있다. 상기 특징을 암호화하는 유전자가 실질적으로 후손 곡물의 게놈으로부터 상실된다. 유전자 상실은 기록되어 왔으며 잘 알려진 현상이다. 유사하게, 후손 곡물에 있어서 “필요하지 않은(unneeded)" 특징을 암호화하는 유전자는 게놈에 여전히 존재하지만, 예를 들어 프로모터(promoter) 변화와 같은 결과로써 더 이상 발현되지 않는다. 대체적으로, 상기 필요하지 않은 특징을 암호화하는 유전자는 게놈의 일부분이며 여전히 발현되지만, 상기 유전자는 원종 상동성(homolog)보다 비기능적 또는 덜 기능적인 단백질 생성물을 만드는 뉴클레오타이드 치환을 축적하여 왔다. 그러므로, 상기 유전자는 중립적으로 진화하고 있다.
중립 아미노산 교체(replacement)는 선택적 압력(양성 또는 음성)으로부터 자유로운 유전자의 단백질 생성물에서 축적된다. 관심있는 유전자에 관한 기능적 단백질 생성물을 유지하기 위하여 필요한 것으로부터 자유로운 재배된 식물을 위하여, 분자 중립성의 조건이 존재한다. 이것은 해충, 질병, 가뭄, 염, 및 저항과 같은 특징을 암호화하는 유전자를 포함한다. 중립적으로 진화한 유전자는 이상적으로 KA/KS비=1이기 때문에, 강요되지 않고(unconstrained), 중립적으로 진화한 유전자는 원종 및 후손 식물로부터 상동성을 비교할 때, KA/KS분석에 의한 검출에 관하여 완벽한 후모물질이다.
그러므로 발명되고 여기에 설명된 방법은 후손 식물에 관한 cDNA 라이브러리의 고-산출량 시퀀싱, 현대 후손종으로부터 ESTs의 데이터베이스에 대한 BLASTING결과 ESTs, 및 상동체에 관한 KA/KS분석 수행을 포함한다.
상기 공정의 세부사항은 본 출원의 다른 부분에 양성적으로 선택된 유전자의 경우에 관하여 설명된다. KA/KS비=1인 유전자는 중요한 스트레스 저항 특징을 조절하는 유전자의 세트(set)이며, 상기 유전자는 효과적 및 신속하게 이 비율의 사용에 의하여 동정될 수 있다. 상업적으로 가치있는 유전자의 세트는 해충, 질병, 내한발성, 고염분과 같은 요구되는 특징을 인코딩는 것을 포함한다. 상기 유전자를 잘 동정하기 위해서는, 최근 가축화된 및 선조으로부터 EST 시퀀싱이 매우 높은 정확성으로 주의깊게 수행되어야 한다. GenBank에서 이용가능한 곡물 EST 데이터베이스의 사용을 만들 수 있는 반면, 상기 목적을 위하여 특별히 준비된 cDNA 라이브러리로부터 EST를 재시퀸싱할 수 있다. KA/KS비이 동일한 선조 및 현대 상동종 사이의 유전자 상 비교에서 매우 근접한 분포를 발생시키기 때문에, 시퀀싱의 정확성은 중요하다. 이것은 거짓 양성의 수를 최소로 감소시켜서 공정을 촉진시킬 수 있다.
시퀀싱 공정의 정확성이 엄격하게 조절되지 않거나 이것이 알려지지 않을 때는, 시퀀싱 오류가 1.0의 KA/KS비이 불명료하게 될 수 있으며, 이러한 이유로 0.75 내지 1.25사이의 KA/KS값이 중립 진화의 증거를 위하여 주의깊게 체크되어야 한다.
중립 조건하에서 진화되는 폴리뉴클레오타이드는 알려진 양적 특징 유전자로커스 또는 QTL위에 만들어질 수 있으며, 이로 인하여 폴리뉴클레오타이드에 의하여 조절되는 특정 스트레스-저항 특징이 신속 및 결정적으로 동정될 수 있다.
V. 약제의 동정을 위한 스크리닝 방법
본 발명은 상기 언급된 방법에 의하여 동정되고 특성화된 폴리뉴클레오타이드 및 폴리펩티드를 사용하는 스크리닝 방법을 제공한다. 상기 스크리닝 방법은 가축화된 또는 선조 생물체에서 특징들을 향상시키거나 감소시키는데 어느 정도 유용한 폴리뉴클레오타이드 또는 폴리펩티드의 기능을 조절하는 약제을 동정하는데 유용하다. 일반적으로, 상기 방법은 가축화된 생물체, 선조 생물체, 또는 유전자 도입 생물체 또는 상기 언급된 방법 또는 시퀀스에 의해 인코딩된 폴리펩티드의 준비에 의하여 동정된 폴리뉴클레오타이드 시퀀스에 의해 감염된 세포로 시험된 약제와 접촉이 수반될 수 있으며, 여기서 약제는 폴리뉴클레오타이드 또는 폴리펩티드의 기능을 조절하는 능력에 의하여 동정된다. 예를 들면, 약제는 요구되는 시간에서 동정된 유전자의 발현을 유도하기 위하여 가축화된 식물 또는 동물에 적용 또는 접촉되는 화합물일 수 있다. 식물에 관하여 특별히, 예를 들면 정확한 시간에 개화를 유도하는 약제가 사용될 수 있다.
여기서 사용되는 “약제(agent)"는 단일 또는 복합 유기적 또는 무기적 분자, 펩타이드, 단백질 또는 올리고뉴클레오타이드와 같은 생물학적 또는 화학적 화합물을 의미한다. 화합물의 광대한 배열은 중합될 수 있다. 예를 들면, 올리고펩타이드 및 올리고뉴클레오타이드, 및 다양한 핵 구조에 기초를 한 중합 유기물 또는 무기물과 같은 올리고머(oligomer)이며, 이것은 ”약품“이라는 용어에 포함된다. 게다가, 다양한 천연 원료가 스크리닝을 위한 식물 또는 동물 추출물과 같은 화합물을 공급할 수 있다. 화합물은 단독 또는 다른 것과 혼합으로 시험될 수 있다.
폴리뉴클레오타이드 또는 폴리펩티드의“조절 기능”약제이 첨가되지 않은 것과 비교할 때, 폴리뉴클레오타이드 또는 폴리펩티드의 기능이 변화한다는 것을 의미한다. 조절은 기능에 영향을 미치는 수준에서 발생한다. 폴리뉴클레오타이드 또는 폴리펩티드 기능은 직접적 또는 간접적이며, 직접적 또는 간접적으로 측정될 수 있다. 폴리뉴클레오타이드의 “기능”은 복제, 번역, 및 발현 유형을 포함하지만, 이에 한정되지는 않는다. 또한, 폴리뉴클레오타이드 기능은 폴리뉴클레오타이드내에서 인코딩되는 폴리펩타이드와 연관된 기능을 포함한다. 예를 들면, 폴리뉴클레오타이드에 영향을 주며, 단백질 발현, 배좌(conformation), 폴딩(folding)(또는 다른 물리적 특징들), 다른 부분(리간드와 같은)과의 결합, 활성(또는 다른 기능적 특징), 조절 및/또는 단백질 구조 또는 기능의 다른 면에 영향을 주는 약제는 폴리뉴클레오타이드 기능을 조절하는 것으로 고려된다. 효과적인 약품이 폴리뉴클레오타이드의 발현을 조절하는 방법은 1) 폴리뉴클레오타이드에 있어서 전사 요소의 전사 요소 반응 물질로의 바인딩의 변경; 2) 폴리뉴클레오타이드의 발현을 위하여 필수적인 2개의 전사 요소사이의 상호작용의 변경; 3) 핵으로 들어가기 위한 폴리뉴클레오타이드의 발현을 위하여 필수적인 2개의 전사 요소 능력의 변환; 4)폴리뉴클레오타이드의 전사에 연관된 전사 요소의 활성 억제; 5) 정상적으로 리간드와 상호작용하며, 리간드에의 결합이 폴리뉴클레오타이드의 발현을 야기하는 세포-표면 수용체의 변경; 6) 폴리뉴클레오타이드의 발현을 유도하는 단일 형질전환 단계의 구성성분의 비활성 억제; 및 7) 폴리뉴클레오타이드의 전사에 연관된 전사 요소의 활성 강화를 포함하지만, 이에 한정되지는 않는다.
폴리펩티드의 “기능”은 배좌, 폴딩(또는 다른 물리적 특징), 다른 부분(리간드와 같은)에의 결합, 활성(또는 다른 기능적 특징), 및/또는 단백질 구조 또는 기능의 다른 면을 포함하지만, 이에 한정되지는 않는다. 예를 들면, 폴리펩티드에 작용하며, 단백질 발현, 배좌(conformation), 폴딩(folding)(또는 다른 물리적 특징들), 다른 부분(리간드와 같은)과의 결합, 활성(또는 다른 기능적 특징), 조절 및/또는 단백질 구조 또는 기능의 다른 면에 영향을 주는 약품은 폴리뉴클레오타이드 기능을 조절하는 것으로 고려된다. 효과적인 약제가 폴리펩티드의 기능을 조절하는 방법은 1) 배좌, 폴딩 또는 다른 물리적 특징의 변경; 2) 자연적 리간드의결합 세기 변경 또는 리간드의 결합 특이성의 변경; 및 3) 폴리펩티드의 활성의 변화를 포함하지만, 이에 한정되지는 않는다.
일반적으로, 선별하기 위한 약제의 선택은 특정 폴리뉴클레오타이드 또는 폴리펍티드 타겟(target), 그것의 인지된 기능, 그것의 3차원 구조(알려지거나 예상되는), 및 다른 추측되는 화합물 모양의 면과 같은 여러 가지 매개변수에 의해 지배된다. 조합 화학의 기술이 후보물질의 수많은 변경을 제조하기 위하여 사용될 수있다. 이러한 기술은 시험에 적합한 약제를 고안 및/또는 획득할 수 있다.
여기에 언급되어 있는 생체내에서의 선별분석은 전통적인 약제 스크리닝 분석을 넘어서는 장점을 가진다; 1) 약제가 의도하는 치료효과를 달성하기 위하여 세포내로 들어가야 한다면, 생체내에서의 분석은 약물이 세포로 들어갈 수 있는지에 관한 지표를 줄 수 있다; 2) 생체내에서의 스크리닝 분석은 약품이 분석 시스템에 첨가된 상태에서는 폴리뉴클레오타이드 또는 폴리펩티드 기능의 조절과 연관된 적어도 하나의 특징을 도출하는데 비효율적이지만, 세포내에서는 세포의 구성성분에 의하여 효율적인 약제로 변형되는 약제를 동정할 수 있다; 3) 가장 중요하게는, 생체내에서의 분석 시스템은 폴리뉴클레오타이드 또는 폴리펩티드 기능과 연관된 특징들을 궁극적으로 가져오는 경로의 구성성분에 영향을 주는 약제의 동정이 가능하다.
일반적으로, 스크리닝은 본 발명의 방법을 사용하고, 폴리뉴클레오타이드 및 폴리뉴클레오타이드 내에서 인코딩된 폴리펩티드의 기능 조절과 같은 영향을 모니터링(monitoring)하면서 동정된 폴리뉴클레오타이드가 트랜스펙션된 적당한 세포 샘플에 약제를 첨가하는 것으로 수행될 수 있다. 상기 실험은 바람직하게는 후보 약제를 수용할 수 없는 대조 샘플을 포함한다. 그 후, 처리된 및 처리되지 않은 세포는 현미경 분석, 비아에빌리티(viability) 시험, 복제 능력, 조직학 시험, 세포와 연관된 특정 RNA 또는 폴리펩티드의 수준, 세포 또는 세포 라이세이트(lysate)에 의해 발현되는 효소적 활성의 수준, 트랜스펙션 약제에 노출되었을 때의 세포 상호작용, 및 다른 세포 또는 화합물과의 상호작용을 위한 세포 능력을 포함하지만 이에 한정되지 않는 적합한 표현형적 기준에 의하여 비교된다. 처리 및 처리되지 않은 세포 사이의 차이는 후보 약제에 기인하는 영향을 나타낸다. 적합한 숙주 세포는 진핵 세포, 바람직하게는 식물 또는 동물 세포를 포함하지만 이에 한정되지는않는다. 세포의 선택은 최소한 부분적으로 예상되는 분석의 성질에 의존할 수 있다.
폴리뉴클레오타이드의 발현을 조절하기 위한 약제을 시험하기 위하여, 적합한 숙주 세포가 관심있는 폴리뉴클레오타이드로 트랜스펙션되었으며, 그 폴리뉴클레오타이드는 시험되기 위한 약제와 접촉되었다(전사 및/또는 번역을 포함하여 여기에 언급된 것처럼).
mRNA 및/또는 폴리펩티드의 증가된 발현을 만들기 위한 약제의 능력에 관하여 시험되었다. 벡터 제작 및 감염의 방법은 발명의 기술분야에 잘 알려져 있다. “트랜스펙션”은 예를 들면, 리포펙션(lipofection), 형질도입, 트랜스펙션 또는 엘렉트로포레이션(electroporation)을 포함하는 외인성(exogenous) 시퀀스를 도입하는 방법을 포함한다. 상기 외인성 폴리뉴클레오타이드는 비-통합된 벡터(플라스미드와 같은)로 유지될 수 있거나 ,숙주 게놈에 통합될 수 있다.
전사를 특이적으로 활성화시키는 약제를 동정하기 위하여, 전사 조절 지역이 수용체 유전자 및 적당한 숙주 세포에 첨가된 구조물에 연결될 수 있다. 여기에 언급한 바와 같이, “수용체 유전자”라는 용어는 동정될 수 있는 유전자 생성물을 인코딩하는 유전자(수용체 단백질 등)를 의미한다. 수용체 유전자는 알카라인 포스파타아제(alkaline phosphatase), 클로람페니콜 아세틸트랜스퍼라제(chloramphenicol acetyl transferase), β-갈락토시다아제(β-galactosidase), 루시페라제(luciferase), 및 그린 형광 단백질(GFP)를 포함하지만 이에 한정되지는 않는다. 수용체 유전자의 생성물에 관한 동정 방법은 효소적 분석 및 플루오릭메트릭(fluorimetric) 분석을 포함하지만 이에 한정되지는 않는다. 수용체 유전자 및 그들의 생성물을 감지하기 위한 분석은 기술분야에서 잘 알려져 있으며, 예를 들어 Ausubel et al.(1987)에 언급되어 있으며, 주기적으로 갱신된다. 수용체 유전자, 수용체 유전자 분석, 및 시약 키트(kits)는 상업적 원료로부터 이용가능하다.
적합한 세포의 견본은 식물, 균류, 효모 포유동물, 및 다른 진핵세포를 포함하지만 이에 한정되지는 않는다. 종래 기술에서의 당업자는 바이러스 벡터와 같은 적당한 벡터의 준비를 포함하는 진핵세포의 트랜스펙션; 엘렉트로포레이션과 같은 방법에 의한 벡터의 세포로의 운반; 및 수용체 또는 약제 민감성 요소의 사용과 같은 방법에 의해 변형된 세포의 선택의 기술을 잘 인지할 것이다. 상기 구조물의 조절 부위로부터 전사에 관한 약제의 영향은 수용체 유전자 생성물의 활성을 통하여 평가될 수 있었다.
위에 언급된 상태하에서 발현의 증가외에, 발현은 정상적으로 발현되었을 때, 감소할 수 있었다. 약제는 전사 속도의 감소를 통하여 이것을 달성할 수 있었으며, 위에 언급된 수용체 유전자 시스템은 이것에 관한 분석을 의미하였다. 상기 약제를 평가하기 위한 숙주 세포는 발현에 관한 허용을 필요로 하였다.
mRNA를 복사(관심있는 폴리뉴클레오타이드로부터)하는 세포는 특별히 mRNA의 반감기 및/또는 mRNA의 전사를 조절하는 약제로 동정될 수 있었다. 상기 세포는 공정 및/또는 폴리펩티드의 후-전사적 변형에 관한 약품의 영향을 평가하는데 사용될 수 있었다. 약품은 폴리펩티드의 턴-오버(turn-over)(반감기의 증가 또는 감소)를 수정함으로써 세포에서 폴리펩티드의 양을 조절할 수 있었다. mRNA 및 폴리펩티드에 관한 약제의 특이성은 약제 부재 상태에서의 생성물 시험 및 관련되지 않은 mRNA 및 폴리펩티드의 생성물 시험에 의하여 결정될 수 있었다. mRNA의 반감기, 단백질 공정, 및 단백질 턴-오버(turn-over)의 시험 방법은 당해 기술분야에서 잘 알려져 있다.
또한, 생체내에서의 선별방법은 직접적으로 폴리펩티드와의 상호작용을 통하여 폴리펩티드 기능을 조절하는 약제의 동정에서 유용할 수 있었다. 상기 약제은 정상적인 폴리펩티드-리간드 상호작용을 차단하거나, 그러한 상호작용을 향상시키거나 안정화시킬 수 있었다. 상기 약제는 또한 폴리펩티드의 배좌를 변경할 수 있었다. 약제의 영향은 면역침전(immunoprecipitation) 반응을 사용하여 결정될 수 있었다. 적당한 항체가 폴리펩티드 및 이와 강하게 연관된 단백질을 침전시키기 위하여 사용될 수 있었다. 처리된 세포 및 처리되지 않은 세포로부터 침전된 폴리펩티드를 비교함으로써, 약제는, 만일 존재한다면, 폴리펩티드-리간드 상호작용을 증가시키거나 억제하는 것으로 동정될 수 있었다. 폴리펩티드-리간드 상호작용은 또한 근접(close)으로 전환, 그러나 폴리펩티드 사이에 비공유 작용의 공유작용으로의 전환하는 크로스 링킹(cross-linking) 시약을 사용하여 평가될 수 있다. 단백질-단백질 상호작용을 시험하기 위한 기술은 당해 기술분야에서 잘 알려져 있다. 단백질 배좌를 평가하기 위한 기술 또한 당해 기술분야에서 잘 알려져 있다.
스크리닝 방법은 생체외에서 세포 자유 전사 또는 번역 시스템과 같은 방법을 포함할 수 있다고 이해된다. 상기 시스템에서, 전사 또는 번역은 발생될 것이며, 약제는 기능을 조절하기 위한 능력을 위하여 시험될 것이다. 약제가 mRNA 또는 폴리뉴클레오타이드의 전사를 조절하는지를 결정하는 분석을 위하여, 생체외에서 전사/번역 시스템이 사용될 수 있다. 상기 시스템은 상업적으로 이용가능하며, 생체외에서 관심있는 폴리뉴클레오타이드 시퀀스에 상응하는 mRNA를 생산하는 수단을 제공한다. mRNA가 제작된 후에, 생체외에서 번역될 수 있으며, 번역 생성물이 비교된다. 어떠한 약제도 포함하지 않는(음성 대조군) 생체외에서의 발현 시스템과 약제를 포함하는 생체외에서의 발현 시스템의 번역 생성물의 비교는 약제가 번역에 영향을 주는지 여부를 나타낸다. 대조 및 시험 폴리뉴클레오타이드 사이의 번역 생성물의 비교는 만일 이 수준에서 작용한다면, 약제가 선택적으로 번역에 영향을 주는지를 나타낸다. 폴리펩티드 기능의 조절은 생체외에서의 단백질 준비(preparations)를 사용하는 분석뿐만 아니라, 언급된 생체내 및 생체외 분석을 포함하지만 이에 한정되지 않는 방법으로 달성될 수 있다. 폴리펩티드는 단백질 준비를 제조하기 위하여 천연 또는 재조합 원료로부터 추출 및/또는 정제될 수 있다.
약제는 단백질 준비 샘플에 첨가될 수 있으며, 영향이 모니터된다; 즉, 약제의 폴리펩티드에 작용하는지 여부 및 어떻게 작용하는지와 그것의 배좌, 폴딩(또는 다른 물리적 특징), 다른 부분(리간드와 같은)에의 결합, 활성(또는 다른 기능적 특징), 및/또는 단백질 구조 또는 기능의 다른 면에 영향을 주는지 및 어떻게 주는지는 폴리펩티드 기능을 조절하는 것으로 고려된다.
여기에 언급된 방법에 의하여 동정되는 폴리뉴클레오타이드에 의하여 인코딩되는 폴리펩티드에 결합하는 약제에 관한 분석에서, 폴리펩티드(위에 언급된 바와 같이 동정된 폴리뉴클레오타이드에 의해 인코딩된)가 잘 특정화된 에피토프(epitope) 또는 단백질과 접합하는 융합 단백질 또는 천연(native)로써 원핵 또는 진핵 발현에서 재조합적으로 발현된다. 재조합 폴리펩티드는 적합한 항체 또는 항-에피토프 항체를 사용하는 면역침전 또는 접합(conjugate)의 고정된 리간드에 결합으로써 정제된다. 폴리펩타이드 또는 융합 단백질로 구성된 유연 컬럼(affinity column)은 적당하게 라벨(label)된 화합물의 혼합물을 선별하기 위하여 사용된다.
적합한 라벨(label)은 형광색소(fluorochromes), 방사성 동위원소, 효소 및 화학발광(chemiluminescent) 화합물을 포함하지만 이에 한정되지는 않는다. 범위밖(unbound) 및 범위내(bound) 화합물은 기술분야의 당업자에 의해 일상적으로 이용되는 다양한 조건(예를 들면, 고염, 세정제)을 사용하는 세척에 의하여 분리될 수 있다. 유연 컬럼에의 비-특이적 결합은 단지 접합 또는 에피토프를 포함하는 유연 컬럼을 사용하는 화합물 혼합물의 예비-세척(clearing)에 의해 최소화될 수 있다. 유사의 방법이 폴리펩티드에 결합하기 위하여 경쟁하는 약제를 선별하는데 사용될 수 있다. 유연 크로마토그래피에 더하여, 녹는점의 변화 또는 다른 분자에 결합하면 변화하는 단백질의 형광 이방성(anisotropy) 측정과 같은 다른 기술이 있다. 예를 들면, 폴리펩티드에 공유적으로 결합하는 센서 칩(Parmacia Biosensor, Stitt et al. (1995) Cell 80:661-670에 의해 제공되는)을 사용하는 비아코어(BIAcore) 분석은 다른 약제의 결합 활성을 결정하기 위하여 사용될 수 있다.
생체외에서 본 발명의 방법은 구조적, 추정적(rational) 또는 약물 고안(design)을 포함하며, 폴리펩타이드의 아미노산 시퀀스, 3-차원 원자 구조 또는 다른 특징(또는 특징들)은 폴리펩티드에 결합하는 것으로 기대되는 약제를 고안하기 위한 기초를 제공한다. 일반적으로, 약제의 고안 및/또는 선택은 가축화된 생물체 및 상동 선조 구조의 사이드-바이-사이드(side-by-side) 비교, 폴리펩티드 타겟(target)의 인지된 기능, 이것의 3차원적 구조(알려진 또는 예상되는), 및 추정 약제 고안의 다른 면과 같은 여러 가지 매개변수에 의해 통제된다. 조합 화학의 기술은 후보 약제의 수많은 변경을 제조하는데 사용될 수 있다.
본 발명의 스크리닝 방법에서 주형은 기술분야에서 알려진 유전자 도입동물 또는 식물이다.
상기 스크리닝 방법은 폴리뉴클레오타이드 또는 폴리펩티드의 기능을 조절하는 활성을 보여주는 약제를 감지하기 위하여 고안된 1차적 스크리닝을 나타낸다. 당업자는 약제를 더욱 향상시키기 위하여 2차적 시험이 필수적이라는 것을 인식할 것이다. 예를 들면, 2차적 스크리닝은 쥐 또는 기술분야 또는 가축화된 또는 선조식물 또는 동물 자체에서 알려진 다른 동물 모델(rat)을 사용하는 분석에서 약제를 시험하는 것을 포함한다. 게다가, 세포파괴(cytotoxicity) 분석은 1차적 스크리닝에서 양성이었던 약품이 살아있는 유기체에서 사용에 적합하다는 확증으로 수행될 수 있었다. 세포파괴 분석은 예를 들면, MTT 분석(Promega)을 포함하는 이러한 목적에 적합하였다.
명세서에 이미 설명된 스크리닝방법은 특히 EG307 또는 EG1117에 적용될 수 있다. 따라서, 본 발명은 수용체 유전자 코딩(coding) 부위에 연결되는 실시가능하게 연결되는 비-폴리펩티드 코딩 부위를 포함하는 구조물(construct)로 트랜스펙션된 숙주 세포와 접촉을 포함하는 EG307 또는 EG1117 폴리뉴클레오타이드의 비-폴리펩티드 코딩 부위의 기능을 조절하는 약제 동정하는 방법을 포함한다. 약제는 전사 또는 상기 수용체 폴리뉴클레오타이드의 번역을 조절하기 위한 능력에 의하여 확인된다. 또한, 본 발명은 상기 방법에 의해 확인된 약제를 제공한다.
또한, 본 발명은 최소 하나의 후보 약제와 EG307 또는 EG1117 폴리뉴클레오타이드를 포함하는 접촉 식물(contacting plant) 또는 유전자 도입 식물을 포함하는 진화적으로 중요한 EG307 또는 EG1117 폴리뉴클레오타이드의 비-폴리펩티드 코딩 부위의 기능을 조절하는 약제를 확인는 방법을 제공한다. 여기서 약제는 전사 또는 상기 수용체 폴리뉴클레오타이드의 번역을 조절하는 능력에 의하여 확인될 수 있다. 본 발명은 또한 상기 방법에 의해 확인된 약제를 제공한다.
또한, 본 발명은 최소 하나의 후보 약제가 EG307 또는 EG1117 유전자로 이루어진 식물 또는 세포와 접촉하는 것으로 이루어지는 상기 방법을 조정하는 약제를 확인하는 방법을 제공한다. 여기서 약제는 산출량을 조절하는 능력에 의해 확인된다. 실시예에서 식물 또는 세포는 폴리뉴클레오타이드 암호화 및 EG307 또는 EG1117 유전자로 트랜스펙션된다. 또한, 본 발명은 상기 방법에 의해 확인되는 약제를 제공한다. 실시예에서, 확인된 약제는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드의 기능을 조절함으로써 생산량을 조절한다. 다른 실시예에서, 확인된 약제는 폴리펩타이드의 기능을 조절함으로써 생산량을 조절한다.
또한, 본 발명은 여기에 언급된 스크리닝 방법에 의해 확인되는 약제를 포함한다.
다음의 실시예는 기술분야에서 당업자의 이해를 돕기 위하여 제공된다. 이러한 실시예는 설명하기 위한 것이며, 발명의 범위로 간주되지 않는다. 전형적인 변형 및 변화가 본 출원에서 언급되었으며, 기술분야에서 당업자에게 명백할 것이다. 상기 변화는 청구항 및 명세서에서 언급된 발명의 범위내로 고려될 것이다.
실시예 1: cDNA 라이브러리 구조
가축화된 식물 또는 동물 cDNA 라이브러리는 식물 또는 동물로부터 적절한 조직을 사용하여 구성된다. 당 분야의 통상적인 지식을 가진 자는 관심의 특징에 따라 분석하기 위한 적절한 조직 또는 조직들을 알고 있다. 다시 말해서, 전체 생명체를 사용할 수 있다. 예를 들면, 하루가 지난 식물의 묘목은 대부분의 식물유전자를 발현하는 것으로 알려졌다.
전체 RNA는 조직(RNeasy kit, Quiagen; RNAse-fee Rapid Total RNA kit, 5 Prime--3Prime, Inc., 또는 어떤 유사하고 적합한 생산품)으로부터 추출되며, 상기RNA의 인테그리티(integrity) 및 순도는 종래의 분자 클로닝(cloning) 방법에 따라 결정된다. 폴리(Poly) A+RNA는 분리되어(Mini-Oligo(dt) Cellulose Spin Columns, 5 Prime--3 Prime, Inc., 또는 어떤 유사하고 적합한 생산품), 프라이머(primer)로서 올리고(dT)와 함께 cDNA의 역전사를 위한 주형으로서 사용된다. 상기 합성된 cDNA는 통상적인 키트(kit)를 사용하여 클로닝을 위하여 처리되고 변형된다. 그리고 재조합형들은 숙주 세포 라인에 팩캐지(package)되어 번식된다. 팩캐지되는 혼합물의 일부분은 증폭되고, 나머지는 증폭 전에 유지된다. 라이브러리는 표준화될 수 있으며, 라이브러리 내에 독립적인 재조합형의 수를 결정한다.
실시예 2: 시퀀스 (sequence) 대비
cDNA 라이브러리으로부터 무작위로 선택된 선조 cDNA 클론(clone)은 ABUI 377 또는 MegaBACE 1000 또는 어느 유사하고 적합한 생산품과 같은 시퀀스(sequencer)를 사용하여 연속된다. M13 유니버설(universal) 및 역 프라이머와 같이 일반적으로 클로닝 벡터상에 사용되는 일반적인 프라이머는 시퀀싱(sequencing)을 실시하는데 사용된다. 말단(end) 시퀀싱에 의하여 완전히 시퀀싱되지 않는 삽입물을 위하여, 염색-라벨된 터미네이터(terminator) 또는 커스텀(custom) 프라이머(primer)는 나머지 갭(gap)을 채우기 위하여 사용될 수 있다.
검출된 시퀀스 차이는 하기 예에 의하여 정확성을 위하여 초기에 체크된다: 예를 들면, 가축화된 종의 시퀀스와 선조의 시퀀스 사이에 차이점이 존재하는 포인트를 찾음으로써; 만약 가축화된 생명체에 유일하게 나타나는 염기가 특히 상기 염기에 대하여 강하고 분명한 신호와 연관되는 경우를 결정하기 위하여, 시퀀스 플루오로그램(fluorogram)(클로마토그램(chromatogram)) 체크함으로써; 만약 시퀀스 변경에 연관되는 하나 이상의 시퀀스가 있다면 도입된 조직체의 히트(hit)를 체크함으로써; 그리고 필요에 따라 당 분야에 알려진 다른 방법에 의하여 체크된다. 다른 선조 뉴클레오티드(nucleotide)가 있는 위치에 동일한 뉴클레오티드를 갖는 동일한 유전자에 대한 다중 가축화된 시퀀스 엔트리스(entries)는 가축화된 시퀀스가 정확하고 가축화된/선조 차이가 진정한 독립적인 지지체를 제공한다. 이와 같은 변화는 공공의 일반적인 데이터베이스 정보 및 이들 DNA 시퀀스 변화가 암호화된 단백질의 아미노산 시퀀스에 변화를 초래하는지를 결정하기 위한 유전상의 코드를 사용하여 검사된다.
실시예 3: 분자 진화 분석
가축화된 식물 또는 동물과 야생 선조 시퀀스를 대비하는 것은 KA/KS분석에 따른다. 이 분석에서, 일반적으로 사용되는 Li 93 과 INA와 같은 컴퓨터 프로그램은 상기에서 설명한 바와 같은 연구 하에서 사이트(KA) 당 동일하지 않은 변화의 수를 각 시퀀스에 대하여 사이트(KS) 당 동일한 변화의 수로 나누어서 결정하는데 사용된다. 전체 길이 코딩 영역 또는 부분 조각들이 사용될 수 있다. KA/KS비율이 높아질수록, 시퀀스가 적응성 진화를 더 경험한다. KA/KS값의 통계적인 중요성은 확립된 통계적 방법 및 t-테스트와 같은 상용 프로그램을 사용하여 결정된다.
높은 KA/KS비율의 중요성을 더 지원하기 위하여, 연구를 하여 상기 가축화된 종의 시퀀스는 다른 진화적인 가까운 종과 대비할 수 있다. 이와 같은 비교는 적응성 진화 변화가 다른 가까운 관련 종과 대비하여 가축화된 식물 또는 동물 계통에 유일한 것인지에 대하여 더 구별하도록 해준다. 또한, 상기 시퀀스들은 어느 정도의 시퀀스가 가축화된 식물 또는 동물에 보존되는지를 평가하기 위하여 여러 다양한 가축화된 개체수의 대표들로부터 관심 유전자의 직접적인 시퀀싱에 의하여 검사될 수 있다.
실시예 4: cDNA 라이브러리 구조
테오신테(teosinte) cDNA 라이브러리는 전체 테오신테 하루 지난 묘목 또는 다른 적절한 식물조직을 사용하여 구성된다. 전체 RNA는 묘목조직으로부터 추출되며, 상기 RNA의 인테그리티(integrity) 및 순도는 종래의 분자 클로닝 방법에 따라 결정된다. 폴리(Poly) A + RNA는 프라이머(primer)로서 올리고(olygo) (dT)와 함께 cDNA의 역전사를 위한 주형으로서 선택되어 사용된다. 합성된 cDNA는 상용 키트(kit)를 사용하여 클로닝을 위하여 처리되어 변형된다. 그리고 재조합은 숙주 세포 라인(host cell line)에서 팩캐지되고 번식된다. 재조합 DNA는 확립된 방법을 사용하여 E. coli 숙주 세포를 세포로 감염시키기 위하여 사용된다. 상기 라이브러리는 표준화될 수 있으며, 라이브러리 내에 독립적인 재조합의 수가 결정된다.
실시예 5: 시퀀스 (sequence) 대비
cDNA 라이브러리로부터 무작위로 선택되는 테오신테(teosinte) 묘목 cDNA 클론은 ABI 377과 같은 자동화된 시퀀서(sequencer)를 사용하여 시퀀싱된다. M13 유니버설(universal) 및 역 프라이머(reverse primers)와 같은 클로닝(cloning)벡터(vector) 상에 일반적으로 사용되는 프라이머는 시퀀싱을 실시하기 위하여 사용된다. 끝 시퀀싱에 의하여 완전히 시퀀스되지 않은 삽입물에 대하여, 염색-라벨된 터미네이터를 나머지 갭(gap)에 채우는데 사용된다.
결과물 테오신테 시퀀스는 데이터베이스 검색을 통하여 가축화된 옥수수(maize) 시퀀스와 비교한다. 게놈(genome) 데이터베이스는 옥수수를 포함하여 다수의 종에 대하여 공개적으로 상용된다. 옥수수 데이터베이스의 한 예는 미조리(Missouri) 대학교에 옥수수 DB 웹사이트에서 찾아볼 수 있다. 옥수수 DB는 옥수수 게놈 및 이의 발현에 관한 현재의 지식에 대한 공공의 인터넷 게이트웨이(gateway)이다. 다른 적절한 옥수수 EST(발현된 시퀀스 테그(tag)) 데이터베이스는 사적으로 소유되고 유지되고 있다. 상동체(homology) 분석후에 중요한 동일성(예, >80%)을 나타내는 시퀀스, 높은 스코어링(scoring) "히트(hits)"는 회수되어 분석된다. 상기 두 상동 시퀀스는 히긴스 등(Higgins et. al)에 의하여 개발된 정렬 프로그램 CLUSTAL V를 사용하여 정렬된다. 어느 뉴클레오티드 대체, 삽입 및 삭제를 포함하는 시퀀스 분기는 정렬에 의하여 검출되어 기록될 수 있다.
검출된 시퀀스 차이는 하기에 의하여 정확성을 위하여 초기에 체크된다: 테오신테와 옥수수 시퀀스 사이에 차이점이 있는 위를 찾음으로써; 만약 옥수수에 유일하게 나타나는 염기가 상기 염기에 대하여 특히 강하고 분명한 신호에 연관되는 경우를 결정하기 위하여 시퀀스 플루오로그램(크로마토그램)을 체크함으로써; 만약 시퀀스 변화와 상관되는 하나 이상의 옥수수 시퀀스가 있는 경우를 보기 위한 옥수수 히트(hits)를 체크함으로써; 그리고 필요에 따라 당 분야에 알려진 다른 방법에의하여 체크된다. 다른 테오신테 뉴클레오타이드(teosinte nucleotide)가 있는 위치에 동일한 뉴클레오타이드를 갖는 동일한 유전자를 위한 다중 옥수수 시퀀스 엔트리(entries)는 옥수수 시퀀스는 정확하고 테오신테/옥수수 차이는 진정한 독립적인 지지체를 제공한다. 이와 같은 변화는 공개적인 상용 데이터베이스 정보 및 이들 DNA 시퀀스 변화가 암호화된 단백질의 아미노산 시퀀스 내의 변화를 초래하는지를 결정하기 위한 유전자 코드를 사용하여 조사된다. 또한, 상기 시퀀스는 암호화된 단백질의 직접적인 시퀀스에 의하여 조사될 수 있다.
실시예 6: 분자 진화 분화
테오신테와 옥수수 시퀀스의 비교는 KA/KS분석에 따른다. 이 분석에서 공적으로 상용되는 Li 93 및 INA와 같은 컴퓨터 프로그램은 상기에서 설명한 바와 같은 연구 하에서 사이트(KA) 당 동일하지 않은 변화의 수를 각 시퀀스에 대하여 사이트(KS) 당 동일한 변화의 수로 나누어서 결정하는데 사용된다. 상기 KA/KS비는 적용성 진화, 예를 들면 양성(positive) 선택은 연구 중인 시퀀스에서 진행된 정도의 반영을 나타낸다. 또한, 전형적으로 전체-길이 코딩 영역은 이들의 비교 분석에 사용된다. 그러나 코딩 영역의 부분 조각은 효율적으로 사용될 수 있다. KA/KS비가 높아질수록, 시퀀스는 적용성 진화를 더 갖는다. KA/KS값의 통계적인 중요성은 t-테스트와 같은 상용 프로그램 및 확립된 통계방법을 사용하여 결정된다. 테오신테(teosinte) 및 옥수수(maize) 유전자 사이에 통계적으로 높은 KA/KS비를 나타내는 이들의 유전자는 적용성 진화가 진행되는 것을 매우 선호한다.
높은 KA/KS비의 중요성에 대한 지지체를 더 제공하기 위하여, 연구 중인 시퀀스는 다른 조상 옥수수 종에서 비교될 수 있다. 이들 비교는 적용성 진화변화가 다른 조상과 비교되는 가축화된 옥수수 계통에 유일한지에 대하여 더 구별할 수 있도록 한다. 또한, 상기 시퀀스는 어느 정도의 시퀀스가 옥수수 종내에서 보존되는지를 평가하기 위한 여러 다른 옥수수 게체수의 대표들로부터 관심 유전자를 직접 시퀀싱(sequencing)함으로써 조사될 수 있다.
실시예 7: 데이터베이스로부터 얻어진 옥수수와 테오신테 ( teosinte ) 유사성 시퀀스에 대한 K A /K S 방법의 적용
Genbank에서 이용할 수 있는 재배종 옥수수와 테오신테 시퀀스의 비교(바이오테크놀로지 정보 웹사이트에서 엔트레즈(Entrez Nucleotide 데이터베이스를 통하여 접근가능)는 적어도 4개의 상동 유전자임이 밝혀졌다:waxy, Al * , Al globulin, 이들의 시퀀스는 옥수수와 테오신테 둘다로부터 이용할 수 있다. 옥수수와 테오신테 둘 다에 대하여 이들 유전자를 위한 모든 이용가능한 시퀀스가 대비되었으며, 상기 KA/KS비는 Li93 및/또는 INA를 사용하여 결정되었다.
비록 옥수수에서 관찰되는 디형성(polymorphism)(다중 알레익(allelic) 복사체) 및/또는 폴리플로이디(polyploidy)(셀(cell) 당 둘 이상의 크로모좀(chromosome) 세트)는 KA/KS분석을 복잡하게 하거나 어렵게 하지만, 이것은 그런 경우는 아니라는 것이 밝혀졌다.
상기 KA/KS값은 이들 유전자가 궁국적으로 선택된 것이 아니라는 것은 가리키는 반면에, 이와 같은 예는 KA/KS방법이 데이터베이스로부터 얻어지는 옥수수 및 이의 테오신테 시퀀스에 적용될 수 있다.
실시예 8: 유전자 도입 식물을 사용한 단백질 기능의 연구
실시예 4-7의 방법에 따라 얻어진 실용적으로 선택된 옥수수 유전자의 기능적 역할은 유전자 도입 옥수수 식물에 유전자의 각 대립유전자(allele)의 평가를 실시함으로써 평가될 수 있다. 유전자 도입식물은 팽(Peng et. al) 등 (1999) 네이쳐(Nature) 400:256-261에 설명되어 있는 방법의 적합을 사용하여 창조될 수 있다. 유전자 도입 식물 또는 이의 단백질 추출물의 생리학적, 형태학적 및/또는 생화학적 검사는 특정 표현형과 함께 각 대립유전자의 교제를 허락한다.
실시예 9: 실용적으로 선택된 유전자로부터 QTLs 의 지도제작
QTL(quantitative trait locus) 분석은 식물높이 및 오일 함유량을 포함하는 옥수수내에 여러 표현형 특징을 조절하는 유전자를 포함하는 크로모조멀(chromosomal) 영역을 정의하였다.
이미 알려진 QTLs 중에 하나 상에 이 방법에 의하여 확인된 각 실용적으로선택된 유전자를 물리적으로 지도 제작함으로써, 각 실용적으로 선택된 유전자에 의하여 조절되는 특정한 특징은 빠르게 결정적으로 확인될 수 있다.
실시예 10: 새로운 유전자 EG307의 발견
표준화된 cDNA 라이브러리는 조상 쌀로부터 현대 쌀까지로 알려진 종인Oryza rufipogon의 풀드(pooled) 조직(잎, 원추 화서 및 줄기를 포함)으로부터 구성되었다. PBI0307H9로 지정된 클론(clone)은 MegaBACE 1000 시퀀서(AP 바이오텍)에 높은 작업 처리량 시퀀싱(sequencing) 프로젝트(project)의 일부분으로서 첫번째로 시퀀스 된다. (SEQ ID NO:89) 이 클론의 시퀀스는 GeneBank 데이터베이스의 블라스트(BLAST) 검색에서 질문 시퀀스로서 사용된다. 4개의 다른 익명의 쌀 ESTs(접근번호 AU093345, C29145, ISAJ0161, AU056792) 는 히트(hits) 처럼 회수되었다. 추가적 시퀀스는 PBI307H9는 부분 cDNA 클론이었음이 확인되었다. PBI307H9는 진뱅크에 재배종(Oryza sativa) ESTs과 비교할 때 높은 KA/KS비를 갖었다. cDNA 증폭 및 시퀀싱은 하기와 같이 완성되었다: 전체 RNA는O. rufipogon(strain NSGC5953) 및O. sativacv. 니폰베어(Nipponbare)(Qiagen Rneasy Plant Mini Kit: cat #74903)으로부터 분리되었다. 첫번째 스트렌드(strand) cDNA는 dT 프라이머(AP Biotech Ready-to-Go T-Primed First-Strand Kit: cat#27-9263-01)를 사용하여 합성되었으며, 그리고 PCR 분석(Qiagen HotStar Taq Master Mix Kit: cat#203445)을 위하여 사용되었다.
쉬운 명명법을 위하여, 클론 PBI0307H9 내에 포함되는 유전자는 여기와 전체에서 EG307로 명명한다. 초기에 마지막 시퀀스를 확인하기 전에 현대 쌀(O. sativa) 및 조상쌀(O. rufipogon) EG307에 대한 KA/KS비는 1.7 이었다.
이들 부분적 시퀀스들은O. sativaO. rufipogon둘다에서 확인되었으며, 5' RACE(Clontech SMART RACE cDNA Amplification Kit: cat#K1811-1)는 이 유전자의 5' 끝을 얻기 위하여 유전자 특정 프라이머와 함께 실행된다. EG307로 명명된 완전한 유전자는 부호화 영역 1344 bp long을 갖는다.O. sativaO. rufipogon내에 완전한 EG307 CDS(1344 bp)의 마지막 확인은O. rufipogonO. sativa의 다수의 스트레인스(strains)의 페어와이즈(pairwise) 비교를 허락하였다. 많은 이들의 비교는 하나 이상의 KA/KS비를 산출하여, 몇몇은 통계적으로 중요하다. 이것은 EG307 유전자 상에 궁극적인 선택의 역할을 위한 증거를 강요한다. 조상 쌀에 부과되는 선택적 압력이 인간에게 부과됨으로써, 이것은 쌀의 인간재배 동안에 선택되는 유전자이다. EG307에 상동체(homologs)는 GeneBank의 비여분 부분에 대한 BLAST 검색에 의하여 확인되지 않았으며, 상기에서 설명한 바와 같이 단지 4개의 쌀 유전자만이 GeneBank(AU093345, AU056792, C29145 및 ISA0161)의 EST 부분에서 BLAST에 의하여 확인되었다. 모든 4개의 ESTs는 기본적으로 특성을 나타내지는 않았다.
실시예 11: EG307의 추가 K A /K S 분석
EG307 유전자에 대한O. sativa내에 제시된 유전자 다양성의 영역을 확실히 하기 위하여, 유전자 DNA는 퀴아젠(Qiagen)의 프로토콜(protocol)(DNeasy PlantMini Kit: cat#69103)을 사용하여O. sativa(the National Small Grains Collection, U.S.D.A, Aberdeen, Idaho로부터 얻음)의 여러 다른 균주로부터 분리된다. 그리고 EG307은 6개의 다른O. sativa균주로부터 게놈(genomic) DNA 내에서 시퀀싱되었다: Nipponbare, Lemont, IR64, Teqing, Azucena 및 Kasalath. 이들 균주 각각에 대한 상기 KA/KS비는O. rufipogon과 비교할 때 변한다. 표 1은 부호와 영역의 전체 1344 염기에 대한 결과를 나타낸 것이다,
[표 1]
O. rufipogon(균주 IRGC105491) 대 모든 검색된O. sativa균주에 대한 전체 CDS KA/KS
O. rufipogon(균주 IRGC105491) 대 모든 검색된O. sativa균주 사이에 비번역된(UTR) 영역 내에 차이가 존재하였다. KA/KS비의 넓은 범위는O. sativa균주 중에서 크로스 브리딩(cross breeding)의 다른 정도 때문인 것으로 판단된다. 몇몇은O. rufipogon과 가축화된 균주 사이의 크로스 브리딩 때문에 다른것 보다는O. rufipogon에 대하여 더 유사하였다. 슬라이딩 윈도우(sliding window) 분석은우리가 시퀀스한O. sativa균주 각각의 단백질 부호화 영역에 대한O. rufipogonEG307의 단백질 부호화 영역 사이에 모든 일대일(pairwise) 비교에 대하여 실시되었다. 이는 가축화하는 동안에 선택되었던 단백질의 특정 영역의 확인을 하도록 한다. 이와 같은 핀포인팅(pinpointing)은 선조 단백질 및 가축화된 후세 농작 식물의 단백질 사이에서 중요한 변화의 특징에 대하여 목표로하는 접근을 허락할 것이다. 이것은 산출량 증가를 목표로 단백질의 이들 바이탈 도메인(vital domains)을 목표로 하는 약제의 개발을 할 수 있도록 한다.
"원도우"의 길이는 인접창과 겹치는 50bp와 함께 대부분의 경우 150bp였다.(그래서 예로서, 만약 CDS의 5' 끝으로부터 읽는다면, 제1 윈도우는 3' 쪽에 인접한 제2 윈도우였던 것처럼, 길이방향으로 150bp이었다. 또한, 길이가 150인 제2 윈도우는 제2 윈도우의 5' 끝에서 50bp에 의하여 제1 창에 겹쳤고, 그리고 또한 150bp인 제3 윈도우는 제3 윈도우의 5' 끝에서 50bp에 의해서 제2 윈도우에 겹쳤다. 그리고 제2 윈도우는 50bp에 의하여 각각 인접 이웃에 겹쳐졌다.) 더군다나, 제2 윈도우 분석은 CDS가 거의 둘로 나누어져 완성되었다. 이것은 뉴클레오타이드(nucleotide)의 시편 크기를 더 크게 하도록 하며, 그러므로 정확한 통계적 샘플링(sampling)이 착수될 수 있다. 또한, 비록 종래에 비로 표현되었던 KA/KS는 "Ka 값이 통계학적으로 중요한 양에 의하여 Ks 값을 초과하는가?"로 묻는 진정한 방법인가를 유념해야 한다.
N 그리하여, Ks=0일 때, 선조 쌀에서 현대 쌀까지를 비교할 때 흔히 일어나는 것처럼(7,000 내지 8,000년의 재배된 것만 있기 때문에), 그 분획의 분모는 0이므로, 그 비율은 계산될 수 없다. 그러나 (Ka-Ks) 차이가 통계적으로 중요하다면, 이러한 비교는 양성 선택(positive selection)을 여전히 감지할 수 있다. 그리하여 하기의 표들에서 나타낸 몇몇의 비교에서 그 비교가 통계적으로 중요한 한, 궁극적인 선택이 감지될 수 있다. Ka/Ks 비율이 중요한 이러한 비교와 같이, 이들을 굵은 글씨체로 나타내었다.
특히O. rufipogon과 현대O. sativa사이에 몇몇의 이종 교배(cross breeding)이 발생하는 것으로 알려져 있기 때문에, 핵산 치환 공정의 확률론적인 성질의 결과와 같이, 현대 쌀 균주에 이르기까지의 모든 비교가 양의 선택의 증거를 나타내는 것으로 예상되는 것은 아니라는 것에 주목해야 한다.
[표 2]
O. rufipogon(균주 NSGC 5948) 대O. sativa(균주 "니폰베어(Nipponbare)"의 슬라이딩 윈도우 Ka/Ks 비율. 모든 통계적으로 중요한 비교는굵은 글씨체로 표시하였다.
여기에서, 1차 대형 윈도우가 사용되었을 때O. rufipogon과 니폰베어 사이의 비교에서 나타낸 궁극적인 선택에 대한 통계적인 뒷받침이 있다는 것을 주목하는 것은 중요하다. 선조O. rufipogon과 가축화된O. sativa(균주 니폰베어) EG307 상동체 사이에서 (인간 가축화의 결과로서) 궁극적인 선택이 발생한다는 좋은 증거이다. 상기에 나타낸 바와 같이, 핵산 치환 공정의 확률론적인 성질의 결과로서, 현대 쌀 균주에 대한 모든 비교가 궁극적인 선택의 증거를 나타낼 것으로 보이지는 않는다. 더욱이, 상기에서 나타낸 바와 같이,O. rufipogon과 몇몇 가축화된 균주 사이에서 이종 교배가 일어나며, 이는 선택의 신호를 희미하게 한다. 그러나 이 분석을 명확하게 하는 것은 궁극적인 선택이 EG307 유전자 상에서 발생한다는 것이다.
[표 3]
O. rufipogon(균주 NSGC 5948) 대O. sativa(균주 "레몬트(Lemont)"의 슬라이딩 윈도우 Ka/Ks 비율. 모든 통계적으로 중요한 비교는굵은 글씨체로 표시하였다.
여기에서, 1차 대형 윈도우가 사용되었을 때O. rufipogon과 레몬트 사이의 비교에서 나타낸 궁극적인 선택에 대한 통계적인 뒷받침이 있다는 것을 주목하는 것은 중요하다. 선조O. rufipogon과 가축화된O. sativa(균주 레몬트) EG307 tk상동체 사이에서 (인간 가축화의 결과로서) 궁극적인 선택이 발생한다는 좋은 증거이다. 상기에 나타낸 바와 같이, 핵산 치환 공정의 확률론적인 성질의 결과로서, 현대 쌀 균주에 대한 모든 비교가 궁극적인 선택의 증거를 나타낼 것으로 보이지는 않는다. 더욱이, 상기에서 나타낸 바와 같이,O. rufipogon과 몇몇 가축화된 균주사이에서 이종 교배가 일어나며, 이는 선택의 신호를 희미하게 한다. 그러나 이 분석을 명확하게 하는 것은 궁극적인 선택이 EG307 유전자 상에서 발생한다는 것이다.
[표 4]
O. rufipogon(균주 NSGC 5948) 대O. sativa(균주 "IR64"의 슬라이딩 윈도우 Ka/Ks 비율. 모든 통계적으로 중요한 비교는굵은 글씨체로 표시하였다.
O. rufipogon O. sativa균주 IR64의 EG307의 단백질 코딩 부위 서열은 동일하여 Ka/Ks 값이 거의 영에 가깝다는 것에 주목하기 바란다. 야생형O. rufipogon과 동종교배(interbreeding)한 광대한 양을 추측해보면, IR64는 낮은 수율의 현대 균주이다(텍사스 보몬트 USDA-ARS 벼 연구부, 제네티시스트 연구소, 샤논 핀슨, 퍼스널 커뮤니케이션).
[표 5]
O. rufipogon(균주 NSGC 5948) 대O. sativa(균주 "테킹(Teqing)"의 슬라이딩 윈도우 Ka/Ks 비율. 모든 통계적으로 중요한 비교는굵은 글씨체로 표시하였다.
O. rufipogon O. sativa균주 테킹의 EG307 서열간의 어떤 비교도 1보다 큰 Ka/Ks 비를 나타내지 않는다는 것을 주목하기 바란다. 그러나, 상기에 나타낸 바와 같이, 핵산 치환 공정의 확률론적인 성질의 결과로서, 현대 쌀 균주에 대한 모든 비교가 궁극적인 선택의 증거를 나타낼 것으로 보이지는 않는다. 더욱이, 상기에서 나타낸 바와 같이,O. rufipogon과 몇몇 가축화된 균주 사이에서 이종 교배가 일어나며, 이는 선택의 신호를 희미하게 한다.
[표 6]
O. rufipogon(균주 NSGC 5948) 대O. sativa(균주 "아쥬세나(Azucena)"의 슬라이딩 윈도우 Ka/Ks 비율. 모든 통계적으로 중요한 비교는굵은 글씨체로 표시하였다.
여기에서, 1차 대형 윈도우가 사용되었을 때O. rufipogon Azucena 사이의 비교에서 나타낸 궁극적인 선택에 대한 통계적인 뒷받침이 있다는 것을 주목하는 것은 중요하다. 선조O. rufipogon과 가축화된O. sativa(균주 레몬트) EG307 상동체 사이에서 (인간 가축화의 결과로서) 궁극적인 선택이 발생한다는 좋은 증거이다. 상기에 나타낸 바와 같이, 핵산 치환 공정의 확률론적인 성질의 결과로서, 현대 쌀 균주에 대한 모든 비교가 궁극적인 선택의 증거를 나타낼 것으로 보이지는 않는다. 더욱이, 상기에서 나타낸 바와 같이,O. rufipogon과 몇몇 가축화된 균주 사이에서 이종 교배가 일어나며, 이는 선택의 신호를 희미하게 한다. 그러나 이분석을 다시 한번 명확하게 하는 것은 궁극적인 선택이 EG307 유전자 상에서 발생한다는 것이다.   
[표 7]
O. rufipogon(균주 NSGC 5948) 대O. sativa(균주 "캐살라쓰4(Kasalath 4)"의 슬라이딩 윈도우 Ka/Ks 비율. 모든 통계적으로 중요한 비교는굵은 글씨체로 표시하였다.
슬라이딩 윈도우는 캐살라쓰(Kasalath) 4에서만 보여짐을 주목하기 바란다. 이 서열에서 4개의 대립 유전자(캐살라쓰 1, 2, 3 및 4로 명명)의 차이가 있으며, 단일 핵산만이 다름으로, 명확하게 하기 위한 목적으로 하나만을 보여주었다. 그러나 완전 CDS 서열의 각각에 대한 Ka/Ks 비율을 나타내었다.O. rufipogon O. sativa 균주 캐살라쓰의 EG307 서열 간의 어떤 비교도 1보다 큰 Ka/Ks 비를 나타내지 않는다는 것을 주목하기 바란다. 그러나, 상기에 나타낸 바와 같이, 핵산 치환 공정의 확률론적인 성질의 결과로서, 현대 쌀 균주에 대한 모든 비교가 궁극적인 선택의 증거를 나타낼 것으로 보이지는 않는다. 더욱이, 상기에서 나타낸 바와 같이,O. rufipogon과 몇몇 가축화된 균주 사이에서 이종 교배가 일어나며, 이는 선택의 신호를 희미하게 한다.
O. rufipogon의 NSGC 5953 균주에서의 EG307의 시퀀싱을 완성하는 데에 있어서, 프라이머를 증폭시키기 위하여 완전 서열이 사용되었다. 그리고 나서 이들 프라이머는 NSGC 5948, NSGC 5949 및 IRGC105491를 포함하여 몇몇 다른O. rufipogon균주의 EG307 유전자를 증폭시키기 위하여 중합효소연쇄반응(Polymerase Chain Reaction, PCR)에 사용되었다. 그 후에 증폭된 EG307 유전자는 이들 균주 각각에 대하여 시퀀싱하였다.
실시예 12: EG307 맵핑
그리고 나서 EG307을 쌀에서 물리적으로 맵핑하였다. 클렘슨 대학은 라이스 니폰베어 박테리아의 인공 염색체(Rice Nipponbare bacterial artificial chromosome, BAC) 라이브러리를 개발하였다: 텍사스의 텍사스 A & M 대학, 컬리지 스테이션, 박사학위 논문, Budiman, M.A. 1999, “Construction and characterization of deep coverage BAC libraries for two model crops: Tomato and rice, and initiation of a chromosome walk to jointless-2 in tomato”. 라이브러리 클론은 혼성화 필터의 형태로 클렘슨 대학으로부터 부여받았다.
스크리닝에 사용된 두 개의 다른 쌀 BAC 라이브러리는 클렘슨 대학 게노믹 연구소(Clemson University Genomics Institute, CUGI)로부터 구입하였다. OSJNBa 라이브러리는 자포니카 쌀 균주(japonica rice strain, 니폰베어 품종)의 게놈 DNA의 CUGI에 구성하였고, 130kb의 평균 인서트 크기를 가지며, 11 게놈 동등물을 커버한다. 이는 국제 쌀 게놈 시퀀싱 프로젝트에 대한 라이브러리로 가장 널리 사용되는 것 중의 하나이다. pBeloBAC11의 HindⅢ 부위에 구성하였으며, 36,864 클론을 포함하고 있다. OSJNBb 라이브러리도 역시 자포니카 쌀 균주(니폰베어 품종)의 게놈 DNA의 CUGI에 구성하였고, 120kb의 평균 인서트 크기를 가지며, 15 게놈 동등물을 커버한다. 이는 국제 쌀 게놈 시퀀싱 프로젝트에 대한 라이브러리로 가장 널리 사용되는 것 중의 또 다른 하나이다. pIndigoBac536의 EcoR1 부위에 구성하였으며, 55,296 클론을 포함하고 있다.
DIG 프로토콜(BMB-로커 PCR DIG 프로브 합성 키트 cat#1636090)은 유일한 EG307 494bp PCR 생성물(프라이머: 5’-GAGTTCACAGGACAGCAGCA-3’(SEQ ID NO:87) 및 5’-CAATTCTCTGAGATGCCTTGG-3’(SEQ ID NO:88)을 성공적으로 라벨링하여 벼 BAC 필터를 스크리닝하였다. DIG 프로토콜(BMB-로케 DIG 형광감지법 키트: cat#1636090)에 따른 화학발광법(chemiluminescence)을 이용하여 블롯은 쉽게 감지하였다. 두 개의 다른O.savita라이브러리, OSJNBa 및 OSJNBb는 총 5개의 다른 필터, 3개의 커버링 OSJNBb 및 2개의 커버링 OSJNBa 라이브러리에 대하여 스크리닝하였다. 표 8은 3개의 모든 스크린에 의하여 확인된 BAC 각각을 나타낸다.
[표 8]
EG307 494bp PCR 생성물로 실시한 BAC 라이브러리의 모든 스크린에서 확인된 각각의 BACs
특정 콘티그(conting) 또는 크로모좀에 대한 유전자의 물리적인 맵핑을 가능하게 하는 참조 데이터는 당업자에게는 알려져 있으며, CUGI의 필터 세트 또는 라이브러리를 구매자들에게 알려지도록 만들어진 웹페이지를 통하여 이용할 수 있다. 또한 콘팅 113에 대한 중요한 혼성화가 아닌, 역시 염색체 3 상에 있는 몇몇의 희미한 것이 있었다.
쌀 콘티그 80은 염색체 3상에 있으며, 66개의 BAC 및 7개의 마커를 포함하고 있다. 콘티그 80 내에 이들 모든 BAC이 중첩되는 것으로 판단해보건대, EG307은 염색체 3의 숏트암(short arm) 상에서 마커 CDO1387의 상류 쪽으로 약 200kb이다.
RiceGene의 이전 데이터에서, USDA-ARS에 의하여 개발되고 관리되며, 공개적으로 접근 가능한 게놈 데이터베이스는 현재 그레멘(Gramene)에서 통합되었다. 그레멘은 잡곡에서의 상대적인 게놈 분석에 대한 관리, 공개-소스 및 웹으로의 접근이 가능한 데이터 자원을 제작하기 위하여 최근에 USDA IFAFS 프로그램에 의하여 기금을 조성하였다. 코넬 대학, 일본 쌀 게놈 연구소 프로그램(Japanese Rice Genome Research Program, JRGP) 및 한국 쌀 게놈 연구소 프로그램(Korea Rice Genome Research Program, KRGRP)이 다른 잡곡(옥수수, 귀리 및 밀)의 맵상의 비교 뿐만 아니라 쌀 유전자 맵의 집합물을 제공하였다. CDO1387 마커는 RiceGenes 웹사이트를 이용하여 몇몇의 다른 쌀 맵을 제작하였다.
또한, 이들 부위에 맵핑된 몇몇의 QTL들이 있으나, 이들 중 다수는 다소 넓은 범위로 거의 모든 염색체를 커버하였다. 문서화가 잘된 하나의 1000 입중(grain weight)의 QTL를 염색체 3의 이 부위에 맵팽하였으며, 마커 RZ672에 연결되어 있다(S.R. McCouch, et al. Genetics 150:899-909 Oct 98). 30.4cM에 맵핑된 하나의 맵(R3) CDO1387 및 39cM에 맵핑된 RZ672 상에서, 유사한 범위에서 이들 두 개의 마커 모두 네 개의 다른 쌀 맵(Rice-CU-3, 3RC94, 3RC00 및 3RW99)에 맵핑되었다(도 5). 그리하여 EG307는 이 QTL 마커의 ~10cM 내에 있다. R3 맵도 BAC, OSJNBa0091P11를 가지며, 21.45cM-21.95cM에 맵핑하였다. EG307는 이 BAC 및 벼 BAC 라이브러리를 스크리닝할 때 동일한 콘팅에서 다른 것들에 대하여 음의 값을 갖는다. 벼의 QTL 부위의 입중도 역시 쌀 염색체 3S 및 옥수수 염색체 1S와 9L 사이의 신테니(synteny)를 나타내는 쌀과 옥수수의 신테니 연구에 포함되었었다(W.A. Wilson, et al. Genetics 153(1): 453-473 Sep 99).
실시예 13: 옥수수 및 테오신트 ( teosinte ) 에서의 EG307의 동정
블라스트(BLAST)에 의한 GenBank에서의 옥수수 게놈을 조사(라이스 EG307 서열을 사용)하여 상동체인 것으로 보이는, 접근(accession) 번호 BE511288 및 BG320985인 2개의 옥수수 EST를 동정하였다. 옥수수(Zea mays) 및 테오신트(Zea maysparviglumis) EG307 상동체(SEQ ID NO : 33 및 SEQ ID NO : 34, SEQ ID NO : 35으로 표시되는 제안된 오픈 리딩 프레임을 가짐, 및 SEQ ID NO : 66, SEQ ID NO : 67에 의해 표시되는 제안된 오픈 리딩 프레임을 가짐)의 성공적인 증폭을 허용하는 프라이머를 설계하였다. (옥수수 및 테오신트의 단백질 서열이 추론되었으며, 이를 SEQ ID NO : 36 및 SEQ ID NO : 68로 표시한다.) 표 9는 옥수수 및 테오신트 사이의 비교를 위하여 Ka/Ks 값을 나타낸다.
[표 9]
테오신트(Zeamays parviglumis) 대 현대 옥수수(Zea mays)의 Ka/Ks 비
상기 Ka/Ks 값이 1 보다 큰 비를 나타내지 않더라도, 여전히 긍정적으로 선택할 증거는 된다. 선조 쌀 및 그의 현대 가축화된 자손(its modern domesticated descendant) 사이의 모든 아미노산 대체물(replacement)이 특성화되었고, 테오신트 및 그의 자손, 현대 옥수수에 대해 동일한 분석이 수행되었다. 가축화된 종의 (독립적인) 양자의 경우, 일정한 패턴이 관찰된다: 선조 식물(테오신트 또는 선조 쌀)와 비교하여, 현대 농작물에서 거의 모든 아미노산 대체물은 전하/극성도 및 용해도가 증가하게 되고, 소수성(hydrophobicity)은 감소하게 된다. 이 패턴이 상기 2개의 독립적인 가축화된 이벤트에서 우연히 일어나는 것은 가장 가능성이 없다. 이런 것은 상기 대체물이 인간 부과 가축화에 대한 유사한 반응성(response)이 있음을 암시한다. 이것은 EG307이 두개의 곡물의 인간 가축화의 결과로서 선택되고 있다는 것에 대한 강력한 증거이다.
테오신트의 한 균주에서 EG307의 서열화를 완결하자마자, 완결된 서열은 증폭 프라이머를 설계하는데 사용되었다. 그후, 이들 프라이머는 PCR에서 사용되어 여러개의 다른 테오신트 균주 및 현대 옥수수의 여러 균주로부터 EG307 유전자를 증폭시켰다. 다음에 증폭된 EG307 유전자를 이들 각각의 균주에 대해 서열화시켰다.
비록 전술한 발명이 본 발명의 명확화 및 이해의 목적으로 예시 및 실시예를 통하여 어느 정도 상세히 설명되어진다 해도, 임의의 변화 및 변형이 실시될 수 있다는 것은 당업자에게는 명백할 것이다. 따라서, 기술 및 실시예는 첨부된 특허청구범위에 의해 윤관이 그려지는, 본 발명의 범위를 한정하고자 의도되는 것은 아니다.
실시예 14: 신규한 유전자 EG1117의 발견 및 K A K S 분석
MegaBACE 1000 서열화기(AP Biotech)에서 실행된 EG의 고생산(throughput) 서열화 프로젝트를 거쳐 클론 IWF1117H5 (이하에서 EG1117라고 명칭함)를 먼저 서열화시켰다. 이 클론을 선조 쌀,Oryzarufpogon로부터 얻은 재료로부터 제작된 표준화된 cDNA 라이브러리(library)(Incyte Genomics)로붜 서열화시켰다. GenBankBLAST 결과는 3개의 익명의 쌀 EST(AU055884, AU055885,BI808367), 2개의 익명의 옥수수 EST(AI783000, AW000223), 및 2개의 익명의 밀 EST(BE444456, BE443845)를 타겟화하였다. 추가의 서열화는 IWF1117H5가 부분적인 cDNA 클론임을 밝혀내었다. 이것은 가축화된 쌀,Oryza sativa, GenBank에서의 EST와 비교하였을 때 0으로 나눌 수 있는 Ka/Ks비를 가졌다.
게놈 DNA를0. sativa후의 퀴아겐(Qiagen)의 프로토콜(DNeasy Plant Mini Kit: cat # 69103)의 여러 상이한 품종으로부터 단리하였다. 총 RNA는0. rufpogon 0. sativa cv . Nipponbare(Qiagen RNeasy Plant Mini Kit : cat # 74903)으로부터 단리하였다. 제1 스트랜드 cDNA를 dT 프라이머(AP Biotech Ready-To-Go T-Primed First-Strand Kit: cat# 27-9263-01)을 사용하여 합성하였으며, 그후 PCR 분석(Qiagen HotStarTaq Master Mix Kit: cat# 203445)을 위하여 사용하였다. 또한 이들 프로토콜을Zea mays(옥수수),Zea maysparviglumis(테오신트), 및Triticum aestivum(현대 밀)에 수행하였다.
일단 이들 일부 서열들을0. rufpogon0. sativa에서 확인하고, 유전 특이성 프라이머로 역(inverse) PCR 을 수행하여 상기 유전자의 5' 말단을 수득하려고 시도하였다. 지금까지,0. rufpogon0. sativa(도 6 및 7)에서 CDS의 1659 bp가 동정되었다. 상기 부분 서열은 정지 코돈을 포함한다.
그 후 EG1117를 6개의 상이한0. sativa균주(Nipponbare, Lemont, IR64, Teqing, Azucena, 및 Kasalath)로부터 얻은 게놈 DNA에서 부분적으로 서열화하였다. 다음에0. rufipogon균주 5948과 비교할 때 이들 각각의 균주에 대한 Ka/Ks비율은 변하였다. 코딩 영역의 1656 염기에 대한 Ka/Ks 비율은 다음과 같다:
[표 10]
0. rufipogon, 균주 NSGC 5948 대0. sativa의 여러 균주에 대한 Ka/Ks 비율
Ka/Ks 비율의 넓은 범위는 0. sativa 균주 중의 교차 교배의 양으로 인한 것으로 예측된다. 일부는 가축화된 균주와0. rufipogon사이의 교차 교배로 인해0.rufpogon을 닯는다.
0. sativa균주 Nipponbare의 추론된 단백질 서열을 사용하여 BLAST 조사를 수행하였다.Arabidopsis thalianaPTR2-B (히스티딘 운반 단백질, NP_178313) (SEQ ID NO : 170) 에 대한 매우 강한 단백질 BLAST 히드(hit)는 CDS의 단지 약 30 코돈만이 쌀 서열로부터 미싱(missing)됨을 암시한다(도 8).
상동관계 조사 결과는, 펩티드 운반(transport) 단백질의 패밀리와 매우 유사한 단백질에 대한 EG1117 유전자 코드가, 균류, 식물, 곤충 및 포유류를 비롯한 넓은 범위의 종에서 발견된다는 것을 암시한다. (참고: Koh, et al. (2002)Arabidopsis. Plant Physiol. 128: 21-29; Hauser, et al. (2001)Mol.Membr . Biol.18: 105-12; Hauser, et al. (2000)J. Biol . Chem .275: 3037-42;Lubkowitz, et al. (1997)Microbiology143-387-96; Steiner, et al. (1995)Mol . Microbiol16 : 825-34). 577 아미노산의 단백질에 대한 EG1117 코드는 12개의 추정 트랜스막 도메인 영역을 가지는 것으로 보인다. EG1117의 KA/KS분석은 EG1117 유전자의 적어도 일부분이 쌀의 가축화 동안에 강력하게 선택되었다는 것을 암시한다.
상기 구체적인 단백질이 다수의 잘 특성화된 펩티드 운반 단백질에 대해 분명한 구조적인 상관관계를 보여준다 할지라도 이것이 유니크하다는 것은 분명하다 (Steiner, et al. (1995)). 서열은 상기 단백질 패밀리의 예측된 12 통과막 도메인 특성을 암호화하는 것으로 보인다. 명백하게 EG1117 단백질은 펩티드 운반 단백질 뿐만 아니라 올리고펩티드 운반 단백질 및 니트레이트 운반 단백질과 상동관계를 갖는다 (Lubkowitz, et al. (1997); Lin, et al. (2000)PlantPhysiol .122:379-88 ; West, et al. (1998)Plant J.15 : 221229). 운반 단백질의 기타 타입에 대한 상동관계는 없다.
다이/트리펩티드 운반체의 경우에 펩티드 운반 단백질은 전형적으로 12개의 통과막 도메인을 포함하고 올리고펩티드 운반체의 경우에 12와 14 사기의 통과막 도메인을 포함할 수 있는 통합 막 단백질이다. 펩티드 운반 단백질 패밀리(PTR 패밀리)는 효소 및 식물에서 광범위하게 연구되어졌다. 전형적으로, 상기 단백질은 단백질 의존 패션에서 세포 막을 가로질러 다이/트리펩티드의 운반을 도와준다. 상기 담체들은, 내부 방향으로 향해진 전기화학 프로톤 구배 아래로 막을 가로질러펩티드 운동을 프로톤의 운동에 연결하여 펩티드의 운반이 기질구배에 대항하여 발생하게 한다 (Nakazono, et al. (1996)Curr . Genet .29: 412-16; Matsukura, et al. (2000)Plant Physiol .124: 85-93; Toyofuku, et al. , (2000)Plant Cell Physiol.41: 940-47; Hirose, et al. (1997)Plant Cell Pl 1 ysiol .38 : 1389-1396 ; Horie, et al.(2001) PlantJ. 27 :129-38). 펩티드 운반체는 전형적으로 모든 가능한 다이- 및 트리펩티드의 서열 독립 운반을 수행한다. 모든 것은 D-에난티오머 함유 펩티드 보다 결합에 대해 더 높은 친화성을 갖는 아미노산의 L-에난티오머 함유 펩티드와의 입체선택성을 보여준다. 현재는 다양한 운반체의 구조와 이들의 기질 특이성 또는 이들의 친화성을 관련시키는 것이 가능하지 않다.
많은 상이한 펩티드 운반 단백질이 다양한 종에서 동정되었다.
상기 단백질의 전체 배열은 전형적으로 상기 패밀리의 모든 멤버에서 발견되는 1차 아미노산 서열에서 모티프를 동정하기 위한 러서쳐(researcher)를 허용하였다. 펩티드 운반체 패밀리의 PTR-2 멤버에서, 제5 통과막 도메인(TMD5)에 있는 보존된 F-Y-x-x-I-N-x-G-S-L 로 명명된 "FYING" 모티프의 잔기, 및 트랜스막 도메인 10(TMD 10)에 있는 W-Q-I-P-Q- Y 모티프 또는 E-x-C-E-R-F-x-Y-Y-G 모티프가 동정되었다(Becket, et al.(2001) in PEPTIDES: THE WAVE OF THE FUTURE, M. Lebl and R. A. Houghten, eds. American Peptide Society, 957-58). 흥미롭게도,S. cerevisiae중의 FYING 모티프의 자리 유도 뮤타제니시스(site directed mutagenesis)는 펩티드에 대한 성장을 감소시키고, 독성 이펩티드에 대한 감도를 감소시키고, 방사성표지된 디류신의 제거를 감소시킨다. 이들 데이터는 FYING 모티프가 기질 인식 및/또는 전위에서 결정적인 역할을 한다는 것을 제시한다.
식물의 경우, 문헌에는 펩티드의 운반체가 펩티드 및 니트레이트의 영양물 섭취에서 중요할 뿐만 아니라 이들 운반체가 옥신, 병원성 톡신 및 다른 발달 과정에 대한 반응성에 영향을 미친다는 것에 대한 증거가 있다.Arabidopsis펩티드 운반체, AtPRT2의 경우에, 이러한 특별한 운반 단백질에 의해 전사되는 것으로 생각되는 뿌리 성장이 독성 에티오닌-함유 펩티드에 의해 영향을 받는다는 것이 입증되었다(Steiner, et al. (1994)Plant Cell6 : 1289-99). 최근의 연구에서, AtPTR2-B 유전자의 센스(sense) 또는 안티센스(antisense)의 재조합 발현에 의해 AtPTR2-B 단백질의 과발현 또는 발현억제가 유전자도입 Arabidopsis 식물에서 발화를 지연시키고 종자 발달을 멈추는 결과가 되었다(Song, et al. (1997)Plant Physiol. 114: 927-935). 이것은 펩티드 운반체가 식물의 성장 및 발달에 매우 심대한 영향을 가진다는 것을 알려준다.
추정되는 EG1117 펩티드 운반체의 추가의 분석은 FYING 모티프가 다른 대표적인 식물 PTR-2 타입 단백질과 비교하여 실제로 EG1117의 TMD5에 존재한다는 것을 예증한다. 부가하여, EG1117는 다른 대표적인 식물 PTR-2 타입 단백질과 동일한 TMD 10 내의 WQVPQY 모티프를 가진다. DIALIGN 국소 배열 프로그램(Morgenstern(1999) Bioinformatics 15: 211-218)에 의해 만들어진 다중 서열 배열은 아미노산 수준에서 약 70% 상관관계를 갖는 라이스 EG1117 단백질과 역 PTR-2 타입 식물 단백질 서열의 거의 95% 배열이 존재한다는 것을 예증한다.0. sativa0. rufpogen단백질에서, 단지 3개의 비동질성 아미노산 대체물이 존재한다. 이들 대체물은 추정되는 펩티드 운반 단백질의 기능 또는 특이성을 급격하게 변경시킬 수 있는 구조적으로 의미있는 대체물이다. 한 경우에, 본 발명자들은 글루타민(전하가 없는 극성)에서 히스티딘(염기) 아미노산으로의 변화를 가진다. 기타 2개의 위치에서, 본 발명자들은 산성 아스파르트산으로부터 비전하성 글라이신으로의 변화 및 산성 글루타민산으로부터 비전하성 글라이신으로의 변화를 본다. 일반적으로, 3개의 모든 변화들은 좀더 염기성인 전하 프로파일 쪽으로 이동한다.
실시예 15: EG1117의 지도화
다음으로 EG1117를 쌀에서 물리적으로 지도화하였다. DIG 프로토콜(BMB-Roche PCR DIG Probe Synthesis Kit cat # 1636090)은 성공적으로 유니크한 EG1117 657bp PCR 생성물(프라이머: 5'-TCCTGCATCCCTCTCAACTT-3' 및 5'- GCATTGGATTCGATGAATGT-3')을 라벨화하여 크렘손 대학(Clemson University)에서 얻은 쌀 BAC 필터에 대해 스크린하였다. 블롯은 DIG 프로토콜(BMB-Roche DIG Luminescent Detection Kit: cat # 1636090)로서 화학루미니센스를 사용하여 한정적으로 검출하였다. 2개의 상이한0. sativa라이브러리(OSJNBa 및 OSJNBb)를 총 2개의 상이한 필터에 대해 스크린하였다. 아래는 양 스크린에 의해 동정된 BAC이다.
[표 11]
EG1117 PCR 생성물로 BAC 라이브러리의 모든 스크린에서 동정된 각각의 BAC
쌀 콘티그 58은 염색체 3 상에 있고 181 BAC 및 15 마커를 포함한다. EG1117는 마커 CD01387, C236, C875, R2778 및 R2015로서 동일한 BAC로 지도화된다. 이들 모든 지도는 지도 3RJ98 상에 35.8 cM으로 지도화된다. 이 마커는 RiceGenes 또는 Gramene 웹사이트를 통하여 접근되는 것과 같이, 여러 다양한 라이스 지도로 지도화된다. 또한 상기 영역에 대해 지도화된 여러 QTL이 존재한다. 1000-곡물 무게의 경우 하나의 잘-문서화된 QTL이 염색체 3의 상기 영역안에 존재하고, 마커 RZ672와 결합된다(McCouch, S. R. et al. Genetics 150: 899- 909). 하나의 지도상에서 CD01387는 30.4 cM 및 RZ672 지도로 지도화되고, 이들 양자 마커는 유사한 범위 내에서 4개의 다른 쌀 지도로 지도화된다. 쌀의 상기 영역은 또한 쌀 염색체 3S 및 마이즈 염색체 1S 및 9L 사이의 신테니(synteny)를 지시하는 쌀과 옥수수 사이의 몇가지 연구에 관련되어 있다(Wilson, W. A. et al. Genetics 153 (1): 453-473).
실시예 16: EG307 및 EG1117의 관계
동일한 Clemson BAC 콘티그 58에 대한 EG1117 및 이전에 기술된 유전자,EG307 지도는 EG307의 약 3 cM 상류 p-암(arm)의 말단쪽으로 놓여진다. 콘티그 58에 대한 많은 마커처럼 EG1117은 동일한 BAC로 지도화되고, EG307은 동일한 콘티그로 지도화되거나, 마커는 그의 포지티브 BAC로 직접 지도화되지 않는다.
다음[Rice Genome Project (RGP), a joint project of the National Institute of Agrobiological Sciences (NIAS) and the Institute of the Society for Techno-innovation of Agriculture, Forestry and Fisheries (STAFF) and a part of the Japanese Ministry of Agriculture, Forestry and Fisheries (MAFF) Genome Research Program]에서 얻은 쌀에 대한 공개된 YAC 지도로부터의 데이터를 사용하여 별도의 분석을 수행하였다.
RGP 데이터베이스는 이들 2개의 유전자(EG1117 및 EG307)를 염색체 3 상에 2 cM 떨어져 놓는다. 상기 YAC 지도는 Plant Cell에서 간행물로서 채택되었다(Wu, J. , et al., 2002 Plant Cell, prepublication copy). BLAST 조사를 기초로(상기 참조), EG1117는 AU055884 및 AU055885를 타격하였다. 이들 두개의 GenBank EST 엔트리는 YACs Y2533 및 Y5488로 지도화되는 클론 S20126으로부터 나온다. 이들 YAC는 33.5 cM에서 염색체 3으로 지도화되는, S10968를 사용하여 고정시킨다.
상기 2개의 유전자의 비예측된 근접성은 가능한 관능성 링크를 제시한다. EG307 및 EG1117는 수율을 증가시키기 위하여 함께 작업할 수 있다. 본 발명자들은 EG307이 EG1117의 전사 요소여서 식물 오페론을 만들 수 있다는 것을 추측한다. 모든 지표들은 EG307 및 EG1117 모두가 다음을 기본으로 한 농업적으로 중요한 특성에 대한 영향을 가질 수 있는 유전자에 대한 논리적인 후보다라는 것을 보여준다: 1) 라이스 재배종 및 조상 종에 대한 KA/KS분석, 2) 곡물 무게 QTL에 대한 연결(linkage), 및 3) 선조 및 가축화된 종 사이의 아미노산 대체물의 진화론적인 패턴. EG1117는 또한 쌀 내에서의 KA/KS분석을 기초로 가축화 동안 강한 포지티브 선택에 대한 증거를 보여준다. EG1117는 펩티드 운반체의 패밀리에 대한 단백질 상동관계에 대해 코드한다. 이 패밀리의 다른 멤버는 성장, 발화 및 종자 발달에 영향을 미치는 식물 중에 보여진다. EG1117는 또한 곡물 무게를 위해 QTL에 연결된다. 이것이 동시에 일어나는 것은 매우 가능성이 없다. 이것들은 농업적으로 관련되는 것으로 유전자를 모두 유효화하기 위해 이 제안의 목표에서 사용하기 위한 이상적인 유전자이다.
실시예 17. 산출량 후보물질의 확인: 군집 분석 & 혈통 분석
곡물 산출량을 조절하는데 있어서 EG307 및 EG1117의 역할은, 본 명세서의 다른 부분에 언급한 바와 같이, 유전자 도입식물(transgenic plant)의 제작에 의하여 확인될 수 있다; 추가적인 확인 서포트(support)는 군집분석 및 혈통분석으로부터 나온다.
군집분석은 유전자가 알려진 특성과 연관되어 있는지 알기 위하여, 잘 특성화된 부 균주(well-characterized rich strains)의 다수에 있어서, 각 유전자의 시퀀싱(sequencing)을 포함한다. EG307은 13 잘 특성화된 부 균주(well-characterized rich strains)에서 시퀀스되었고, 상기 선조 대립유전자(ancestral allele)는 4개의 최저의 산출량 균주에 존재하는 반면, 상기 유래되고,양성적(positively)으로 선택된 대립유전자는 6개의 최대 산출량 균주에 존재하는 것이 결정되었다. 표 12의 시험에 의해 관찰된 패턴은 매우 인상적인 것이다. 이것은 EG307이 산출량에 영향을 준다는 증거를 추가한다. 즉, 이것은 소위 “산출량”유전자일 수 있다.
[표 12]
고 산출량 쌀 균주를 위한 양성 선택된 EG307 대립유전자 부분
혈통분석은 두 개의 중요한 자료 세트(set)의 이점을 이용한다. 이용가능한 곡물 중량 자료에 더하여, 많은 부 균주의 기원(예를들면, 혈통)이 잘 알려져 있다. 이것은 산출량과 연관된 후보 유전자가 알려진 부 균주 혈통에 의해 계획된다는 확인 계획을 허락한다. 각 균주에 관하여, EG307 및 EG1117의 대립유전자(유래, 변형, 최근 대립유전자 등)의 알려진 1000-곡물 중량 및 형태가 언급되었다. 변형된 대립유전자의 유전(transmission) 패턴은 상기 자료로부터 추측될 수 있다.
실시예 18. 옥수수 및 테오신테 ( teosinte )에 있어서 EG1117의 동정
실시예 13에 언급된 기술분야에서 잘 알려진 방법을 사용하여, EG1117이 다수의 옥수수 균주(Zea mays mays)(SEQ ID NOs 119, 122, 123, 124, 127, 128, 129, 132, 135, 136, 137, 140, 141, 144, 145, 146, 149, 150, 151, 154) 및 다수의 테오신테 균주(Zea mays parviglumis)(SEQ ID NOs 157, 160, 161, 162, 165, 166, 167)에서 증대되었다.
실시예 19. 유전자 후보물질 EG307의 결정
상기 EG307 단백질의 기능을 확인하기 위하여, 이것과 상호작용하는 부(rich) 단백질이 결정될 것이다. 상기 “길트-바이 어소시에이션(guilt-by-association)" 접근은 알려지지 않은 단백질와 연관이 있는 잠재적인 경로(pathway) 또는 기능을 확인하기 원하는 상황에서 유용하다(Editorial (2001) Nature 410). 상호작용하는 단백질들을 결정하기 위한 두 가지 방법은 상호작용의 유사성(affinity)에 기초를 둔 상호작용하는 단백질들을 분리하기 위하여, 알려지지 않은 단백질의 재조합적으로 발현된 형태를 사용하는 좀 더 직접적인 접근뿐만 아니라, 효모 2-하이브리드(yeast two-hybrid) 접근과 같은 포괄적인 스크리닝(screening) 접근을 포함한다. 실험적인 방법 및 계획의 간략한 개요는 두 가지 방법을 위하여 나타내어진다.
A. 효모 2- 하이브리드 ( YTH ) 스크린(screen)
상호작용하는 단백질에 관한 YTH 스크린 방법은 전사 활성 요소 단백질 결합 범위(domain)의 1/2과 연관되는 단백질의 재조합 융합(the bite)의 제조 및 전사 활성 요소 활성 범위의 나머지 1/2과 융합되는 잠재적인 단백질 암호화 부분의cDNA 라이브러리(library)(target protein)의 사용에 의존한다. 상기 바이트가 목표 단백질과 상호작용 한다면, 전사 요소의 2 1/2(결합 범위 및 활성 범위)가 함께 이끌어지며, 하나는 리포터(reporter) 유전자 전사의 개시를 유발한다. 전통적으로 사용되는 YTH 시스템의 두 가지 기본 타입이 있는데, GAL4은 표준 YTH에 관한 시스템에 기초하며(Fields, et al. 1997), Lex4는 “상호작용-트렙(Interaction- Trap)"(IT) 방법에 기초한다(Golemis, et al. 1997. in CURRENT PROTOCOLS IN MOLECULAR BIOLOGY F.M. Asubel, et al., eds., John Wiley & Sons, NY; Golemis, et al 1997. in cell: A LABORATORY MANUAL D.L. SpSeptor, R. Goldman, and L.Leinwand, eds., Cold Spring Harbor Laboratory Press).
두 개의 부 YTH cDNA 라이브러리(L cv Mil-Yang)는 Eugentech, Inc.(유성 대전, 한국)로부터 상업적으로 사용가능하다. 상기 라이브러리는 스트래다진 하이브리잽(Stratagene HybriZAP)(GAL4 기초한 시스템)에서 길이가 2cm이상 또는 2cm이하인 쌀 이삭으로부터 분리된 mRNA를 사용하여 제조된 cDNA로부터 제조된다. 상기 라이브러리는 초기 및 후(late) 배아 발생에 있어서 중요한 단백질을 암호화한다. 우리는 EG307 발현 RT-PCR 분석으로부터 EG307 단백질이 상기 조직에 존재한다는 것을 알아냈다. 그러므로, 상기 라이브러리는 EG307 단백질과 상호작용하는 단백질을 발현시킬 것이다.
실험적 세부사항
하이브리드잽 YTH 시스템에 특이적인 표준 시약, 효모 균주, 벡터 및 DNA 분리/시퀀싱은 스트래타진으로부터 얻어질 수 있다. EG307의 암호화 부위는 O.sativa 뿌리 mRNA의 RT-PCR 증폭기를 사용하여 클론닝될 수 있다. 상기 증폭된 PCR은 선형 피비디-갈4 캄 파지미드(pBD-GAL4 Cam phagemid) 벡터에 클로닝될 수 있고, 주입물을 운반하는 변형물(transformanat)은 상기 “바이트(bait)" 플라스미드를 제조하기 위하여 클로람페니콜 플레이트(chloramphenicol plates)에서 선택될 수 있다. EG307의 클로닝 접합점 및 암호화 부위는 정확한 리딩 플래임(reading frame)의 사용을 보장하기 위하여 EG의 표준 시퀀싱 기술을 사용하여 시퀀싱될 수 있고, EG307의 증폭동안 돌연변이는 도입되지 않았다.
Eugentech의 상업적 라이브러리는 1차적 라이브러리로부터 증폭된 단일 라운드(round)로 보고되었고, 2× 10pfu에서 공급된다. 라이브러리Ⅰ(2cm 이하의 이삭)은 1× 10pfu의 초기 복잡성 및 3.6× 10pfu/ml의 증폭된 라이브러리 역가를 가진다. 라이브러리Ⅰ에서 주입물 크기는 0.5 내지 3.0kb의 범위이다. 라이브러리Ⅱ(2cm 이상의 이삭)는 5× 10pfu의 초기 복잡성 및 4× 10pfu/ml의 증폭된 라이브러리 역가를 가진다. 라이브러리Ⅱ에서 주입물 크기는 0.5 내지 1.6kb의 범위이다. 상기 예비적으로 만들어진 라이브러리는 적당한 가격에서 상업적으로 이용이 가능하기 때문에, 상기 특정한 시스템을 사용하여 초기 YTH 탐구(hunt)를 하는 것은 바람직한 것이다.
바이트(bait) 플라스미드 및 목표 플라스미드 라이브러리는 스트라타진의 YRG-2 효모 competent 세포 라이브러리 킷(kit)을 사용하여 효모 균주 YRG-2에 상호 트랜스펙션될 수 있다. 양 플라스미드를 운반하는 효모는 상기 YRG-2 영양요구성 돌연변이의 보충물에 의하여 선택될 수 있다. 이러한 경우에 상기 바이트 및목표 플라스미드는 YRG-2 균주의 트립토판 및 루신 영양요구(auxotrophy)를 보완하여야 한다. 상기 상호 트랜스펙션으로부터 성장하는 콜로니(colonies)는 히스티딘은 결여되고 X-gal은 포함하고 있는 플레이트에서 추가적 선별에 의해 목표 단백질과 상호작용하는 단백질에 위하여 추후에 선별될 수 있는 효모 라이브러리를 제조하기 위하여 사용될 수 있다. 상기 YRG-2 균주는 두개의 추가적인 리포터(reporter) 플라스미드를 운반하다. 하나는 HIS 유전자의 GAL4 결합 시퀀스 상부를 운반하며, YRG-2 히스티딘 영양요구성 돌연변이를 보완하는데 사용된다. 다른 하나의 플라스미드는 LacZ 리포터 유전자의 GAL4 결합 시퀀스 상부를 운반한다. 이것은 X-gal을 포함하는 플레이트에 효모가 배양되었을 때, 리포터 유전자 발현과 관련하여 블루/화이트 선별을 할 수 있게 한다. 상호작용 선별 시기동안, 단지 바이트;목표 혼합물을 포함하는 효모만이 히스티딘 영양요구를 보완할 수 있으며, LacZ의 발현 및 X-gal 기질에서 블루 생성물로의 전환을 일으킬 수 있다. 상호작용에 관한 상기 이중 선별은 확인되는 거짓 양성 콜로니의 수를 제한하는 것을 도와준다. 게다가, 어느 정도에 있어서 블루 기질 생산의 강도는 바이트 및 목표 단백질간의 상호작용의 세기의 지표가 된다.
상호작용하는 콜로니는 시퀀스는 단백질 콜로니에 대하여 ESTs로부터 총 길이 암호화 부위 및 잠재적인 오픈 리딩 플레임으로 번역 및 조사될 수 있다. 다수의 동일 시퀀스가 목표로 확인되었을 때, 상기 단백질은 우선적으로 선택되었으며 상호작용을 하는 단백질을 나타낸다. 만일 시퀀스가 한번 또는 몇배로 나타내어지면, 비 특이적 상호작용하는 단백질 또는 cDNA에서 제한된 수로 나타내어지는 전사이다.
상호작용하는 단백질의 다수 클래스(classes)는 상기의 방법으로 동정되어야 한다. 이상적으로는, 알려진 기능의 단백질이 고도로 나타날 수 있으며, 논리적인 기능 또는 경로가 쉽게 확인될 수 있다. 만일 상호작용하는 단백질들이 알려지지 않았다면, 그러나 알려진 단백질들과 상동이라면, 일반적인 영역에 있어서 알려진 정보에 기초하는 상호작용의 관련성을 확정하기 위한 실험을 고안하는 것이 가능할 것이다.
예상되는(suspected) 단백질-단백질 상호작용은 추가의 생체내 및 생체외 연구에 의해 확인될 수 있다. 상호작용을 확정하기 위한 보다 간단한 분석은 만일 시간이 허락된다면, PhaseⅠ동안 수행될 수 있다. 유연(affinity) 풀-다운(pull-down) 및 파-웨스턴(far-western)과 같은 분석은 항체와 같은 추가적인 시약으로 수행될 수 있으며, 재조합 단백질이 만들어진다. 추정되는 상호작용하는 단백질뿐만 아니라 바이트 단백질(EG307)에 관한 재조합 단백질의 발생은 태그된 융합 단백질(GST, myc, V5, biotin tags)를 필요로하여 이루어진다. 둘 사이의 형광 에너지 이전은 적절하게 녹색의 형광성 단백질 융합을 제조하는 것과 같은 생체내에서의 상호작용과 관련된 추가적인 증거는 생체내에서의 상호작용을 최종적으로 증명하기 위하여 필요하며, 상기 상호작용에 영향을 주는 요소를 측정한다. 그러나, 상기 실험은 PhaseⅠ의 범위를 명확하게 넘어선다.
YTH 헌트(hunt)는 바이트 단백질이 그 자체로 GAL4 전사 활성 시퀀스에 결합하며, 리포터 시스템의 활성을 야기한다는 것을 확인할 수 있다. 만일 이런 현상이 발생하면, EG307 단백질을 독립적으로 발현하는 두개의 바이트 구성체(construct)가 제조될 수 있다. 상기 구성체는 YRG-2에 있어서 GAL4 리포터의 직접적인 활성에 관하여 시험될 수 있다. 만일 직접적인 활성에 관하여 음성이라면, cDNA 타겟 라이브러리는 바이트:타켓 상호작용에 관하여 재선별될 수 있다.
만일 어떠한 상호작용하는 단백질도 상업적으로 미리 만들어진 YTH 라이브러리로부터 동정되지 않는다면, 상기 라이브러리가 질이 나쁘거나, GAL4 YTH 시스템이 실질적인 상호작용하는 단백질의 동정을 위하여 충분히 민감하지 않을 수 있다.
상기의 경우, 상호작용-트랩 (interaction-trap, LexA) 시스템에서 제조되는 대체적인 라이브러리가 고려될 수 있다. 상기 라이브러리는 알려지지 않은 후보 단백질의 추가적인 특징에 관하여 기초로 작용한다.
실시예 20. 물리적 방법을 사용한 상호작용하는 단백질의 직접적인 분리 및 동정
직접적으로 식물 조직으로부터 상호작용하는 단백질을 분리하기 위하여, 다양한 가용화된 식물 조직에 존재하는 단백질의 유연(affinity) 분리가 수행될 수 있다. 분리된 상호작용하는 단백질은 제한된 단백질 가수분해를 겪게 되며, 결과적인 펩티드 분절은 질량 스펙트라(mass spectral) 분석에 의해 알려진 또는 예상되는 단백질을 표시하는 펩티드 분절 패턴이 제조되었는지 확인하기 위하여 분석될 수 있다.
상기 EG307 단백질은 파마시아(Pharmacia)의 pGEX-5X-1(Amersham Pharmacia)를 사용하여 GST-EG307 융합 단백질을 제조하기 위하여 박테리아 발현 시스템에 클로닝될 수 있다. 발현이 IPTG에 의해 유도되는 배지의 박테리아 라이세이트(lysates)는 글루타치온 세파로즈 비즈(glutathione sepharose beads)에 있어서 융합 단백질을 정제하기 위하여 사용될 수 있다. 용해된 단백질은 컬럼 위의 자유 글루타치온의 통과에 의하여 고형에 바인딩하기 위한 경쟁에 의하여 비즈로부터 배출된다. 재조합 GST-EG307은 신규 글루타치온 세파로즈 비즈와 다시 연결되었을 때, 유연 리간드(ligand)로 사용될 수 있다. 대체적으로, 프리(free) EG307 단백질은 요소(Factor) Xa와 융합 단백질의 처리에 의한 GST 영역의 제거에 의하여 얻어질 수 있다. 예상되는 EG307 단백질에는 요소 Xa 프로테아제 부위가 없다.
다수의 O.sativa 묘목(200-300 그램)로부터 분리된 식물 세포 라이세이트는 표준 특이 조직 분열 및 정화 기술에 의하여 제조될 수 있다. 시토졸릭(cytosolic) 단백질의 분리를 위해서, 세포는 프로테아제 억제 혼합물의 존재하에 조직 라이세이트를 차갑게 유지하는 동안 폴리트론 조직 호모게나이저(polytron tissue homogenizer) 및 초음파기(sonicator)를 사용하여 기계적인 절단에 의하여 파괴될 수 있다. 상기 용해된 시토졸릭 라이세이트는 파편을 제거하기 위한 낮은 속도의 차별적 원심분리와 그 후의 용해되지 않은 응집 단백질을 제거하기 위한 높은 속도의 원심분리에 의해 정화될 수 있다. 용해되지 않은 파편에 있어서 단백질을 분리하기 위하여, NP-40, Brij35, 및 데옥시초레이트(deoxycholate)와 같은 다양한 세정제가 상기 용해되지 않은 막 파편으로부터 분리된 막 경계 단백질을 용해시키는데 사용될 수 있다. 용해되지 않은 물질은 원심분리기에 의해 제거될 수 있다.
상기 식물 세포 라이세아테는 개별적으로 글루타치온-세파로오즈:GST-EG307 비즈를 통과할 수 있다. 상기 비즈는 경계 단백질을 제거하기 위하여 다양한 이온 강도(strength)의 버퍼(buffer)로 세척될 수 있다. 그 후, 경계 단백질은 낮은 pH, 고 염 또는 변성 세정제로 분리될 수 있다. 순수한 단백질은 SDS-PAGE 겔에 이동되며, 밴드(bands)는 질량 분광학(spectroscopy) 융화성(compatible) 은 염색 시약 또는 코메시에 블루(commassie blue)로 염색될 수 있다. 밴드는 겔로부터 분리되어 추후의 분석을 위하여 냉동될 수 있다. 상기 단백질은 상호작용하는 단백질의 동일성 및 단백질 가수분해 펩티드 시그니쳐(signature)를 결정하기 위하여 질량 분광이 뒤따르는 단백질 가수분해에 관한 질량 분광학 시설로 보내질 수 있다.
상기 기술은 상호작용의 유연이 특이적이며 EG307 단백질 및 잠재적인 상호작용하는 단백질 사이의 단단한 결합을 보장하기에 충분한 정도로 강력한 한도에서, 상호작용하는 딘백질의 동정을 가능하게 한다. 그 후, 상기 테이타는 상기 단백질이 다른 단백질과 상동이라면, 상호작용하는 단백질의 동정이 가능하게 한다. EG307 단백질에 대한 유연의 부족 때문에, 상기 방법에 의하여 어떠한 단백질도 동정할 수 없다는 것이 가능하다. 대체적으로, 상기 개설된 방법에 의하여 제조되는 라이세아테에 있어서, 상호작용하는 단백질이 존재하지 않는다는 것이 가능하다.
만일 너무 많은 단백질이 글루타치온-세파:GST-EG307 비즈에 결합한 것으로 나타나면, 상기 단백질들은 세파로오즈, 글루타치온, 글루타치온신세스타제(synthestase) 또는 EG307과 N 말단 GST 융합의 제조에 의하여 생산되는 인공적인 에피토프(epitope)에 비 특이적인 결합이다. 상기 비 특이적 상호작용을 제거하기 위해서는, 라이세아테가 글루타치온 비즈와 연관된 무관한 GST-융합 단백질뿐만 아니라, 세파로오제 비즈, 글루타치온-세파로오제로 전-정화될 수 있다. 만일 비 특이적 밴드가 상기 전-정화 단계 후에도 존재한다면, 더욱 강력한 세척 및 고 염, 저 염, 증가된 pH 또는 감소된 pH, Tween-20과 같은 비 이온 세정제의 첨가와 같은 결합 조건이 바이트 단백질과 결합한 단백질을 제한하기 위하여 도입될 수 있다.
실시예 21. 추정 펩티드 운반 기능의 신규 단백질을 코딩하는 유전자 후보 EG1117의 기능의 결정
PTR-2 패밀리(family)의 구성이라면, EG307 단백질은 실리코(silico) 동상(homology) 데이터에 기초한 펩티드 운반 단백질의 형태를 암호화하기 때문에, 상기 특이한 기능에 직접적으로 접근하는 실험이 수행될 수 있다. 두 가지의 보완적이지만, 상호 독립적인 접근이 사용될 수 있다. 우선, 효모에 있어서 이종 펩타이드 운반 단백질 기능을 시험하는 방법이 세포막을 통과하는 펩티드의 운반 및 효모의 PTR-2 결실 변이에서 영양요구성 아미노산 요구사항을 보충하기 위하여 EG1117의 가축화된 종 및 선조 종의 능력을 시험하기 위하여 사용된다. 두 번째로, 독성 에치오닌(ethionine) 포함 펩티드의 존재하에 쌀 묘목의 도입 및 원조 종의 성장 특징은 잠재적인 펩티드 운반 단백질 돌연변이를 쌀의 도입 및 원조 종 사이의 예측가능한 표현형의 차이와 연관하기 위하여 사용될 수 있다.
영양요구성 효모에 있어서 이종 펩티드 운반 기능의 보완(complementation) 분석
상기 연구에 있어서, 다이/트리 펩티드를 운반하는 능력에 있어서 돌연변이를 운반하는 특이적으로 고안된 영양요구성 변종 효모 균주를 사용하여, 신규Arabidopsis펩티드 운반 단백질을 확인하기 위하여 사용되는 이전에 언급한 방법을 사용한다(Steiner, et al., 1994). 이 이종 시스템은 식물 펩티드 운반 단백질들이 효모 세포에 클로닝될 수 있으며, 재조합적으로 발현된 단백질 기능이 효모 균주의 영양요구성 아미노산 요구물의 보완에 의해 측정될 수 있다는 것을 나타내었다. 두 가지 EG1117 형태의 기능에 관한 정보를 생산할 수 있다는 것은 간단하지만 강력한 분석이다.
모(parental) 효모 균주 BY4742[Matα, his3-, leu2-, lys2-, ura2-] 및 PTR-2 유전자가 결실된 ATCC로부터 이용가능한 “완전 효모 결실 배열 콜렉션(complete yeast deletion array collection)"이 BY4742-ptr2를 고안하였다. 양 균주는 ATCC로부터 이용가능하다. EG1117의 도입 및 원조 형태는 효모의 BYY4742-ptr2 영양요구성 균주에 있어서 추정의 PTR-2 단백질의 재조합 발현을 가능하게 하는 pYES2.1-TOPO-TA 벡터(Invitrogen,Inc.)로 클로닝될 수 있다. 트렌스팩턴트(transfectant)의 선택은 우라실(uracil)이 없는 플레이트에서 수행될 수 있다. 플라스미트 DNA는 트렌스팩턴트에서 재분리될 수 있으며, 균주가 정확한 플라스미드를 운반한다는 것을 확정하기 위하여 EG1117 특이 프라이머(primer)에 의해 분석될 수 있다. 단백질 발현은 배양액(media)에 있어서 갈락토스(galactose)의존재에 의하여 조절된다. 트랜스팸턴트는 갈락토스를 함유하는 배양액에서 성장할 수 있으며, EG1117 단백질 발현은 벡터에 의해 첨가된 C-말단 V5 에피토프 꼬리(tag)의 웨스턴 블럿 분석(wetern blot analysis)에 의해 모니터될 수 있다. 다음은 보완물(complementation) 및 뿌리 성장 분석에서 사용되는 펩티드를 보여준다.
Eth=에치오닌(ethionine)은 메치오닌(methionine)의 독성 유도체이다. 영양요구성 표현형의 모든 선택은 루신(leucine)이 부족한 플레이트에서 행해질 수 있다.
EG1117이 펩티드 운반 단백질을 암호화하는지 시험하기 위하여, 상기 언급된 펩티드가 상업적으로 중합 및 정제될 수 있다. 각각의 펩티드가 루신을 운반하기 때문에, 만일 기능적 펩티드 운반 단백질에 감염되고 갈락토오스의 존재하에 성장하는 루신 영양요구성 균주 BY4742-ptr2로 도입된다면, 상기 균주는 성장가능하다.
수행될 수 있는 두 번째 분석은 억제 분석이다. 이 경우, 대조군으로 BY4742 parental 및 BY4742-ptr2 결실 돌연변이뿐만 아니라, BY4742-ptr2 EG307 트렌스펙턴트가 YPG(효모 추출액, 펩톤, 갈락토스) 플레이트에 론(lawn)으로써 배양될 수 있으며, 독성 에치오닌-펩티드 유도체는 막 디스크위에 스팟(spot)될 수 있으며 효모 론(lawn)위에 위치할 수 있다(Steiner, et al.,1994). 드스크 주위에깨끗한 영역은 효모가 세포를 죽이는, 세포안으로의 독성 펩티드의 운반이 가능한 효모의 기능적 운반 단백질을 발현시키는 것을 나타낸다.
EG1117의 가축화 및 선조 형태가 기능적 운반 단백질이며, 아미노산 영양요구성 돌연변이를 보충한다면, 다음의 실험이 수행될 수 있다. pH 또는 양이존 의존성에 평가하기 위하여, 배양액의 pH 또는 이온 강도가 다양해질 수 있으며, 보완적(complementary) 펩티드의 존재하에서 성장하거나 독성 펩티드의 존재하에서 사멸하는 EG1117 단백질을 운반하는 트랜스펙턴트의 능력이 결정될 수 있다. 그렇지 않으면, 펩티드의 유연성의 잠재적인 차이에 평가하기 위하여, 용량 반응(dose response)이 특정 펩티드 또는 효모 변형체의 성장에서 상기 펩티드의 독성 변형에 영향을 미치는 것이 평가될 수 있다.
우리는 쉽게 EG1117 단백질이 펩티드 운반 단백질을 암호화하는 것을 발견했다. 상기 단백질의 두가지 형태가 상기 기능에서의 예측가능한 차이를 나타낼 것이다. 아마도 특이성/선택성, pH 최적조건 또는 유연성에 있어서의 변화가 증거가 될 것이다. 비록 산 또는 좀 더 염기적인 특징들로부터 아미노산 시퀀스의 비-동질성(non-synonymous)인 변화가 존재하면, 상기 변화들이 단백질의 중요하지 않은 지역에서 존재하는 것이 가능하다. 대체적으로, 상기 변화들은 단백질의 기능을 충분하게 변화시키기 위하여 단백질의 3차원 구조를 변화시키지 않는 것이 가능하다.
상기 단백질들은 펩티드를 운반하기 않을 가망성이 있지만, EG1117 단백질은 다른 어떤 기질을 위하여 단백질을 운반할 가능성 있다. 이런 경우, EG1117 단백질이 펩티드를 운반한다는 어떠한 증거가 없는 경우, 다른 기능을 가려내기 위하여 동일한 시스템 또는 적어도 감염된 효모를 사용하는 것이 가능하다. 예를들면, 단당류 또는 다당류 운반 능력에 관한 시험이 적당한 양양요구성 균주에서 가능하다. 대체적으로, 타켓이 된(targeted) 운반 기능을 위하여 다른 효모 결실 돌연변이가 존재하는 트랜스펙턴트와 매이트(mate)될 수 있었다 이런 경우, 선택 플레이트에서 매이트된 효모의 성장은 특정한 결실 돌연변이의 보완물(complementation)의 지시하는 것이 되었다. 이런 전략을 사용하여, 다수의 다른 효모 결실 돌연변이가 이용가능한지 검사하는 것이 가능하였다(Barchman, et al.(1998) Yeast 14:115-132).
실시예 22. 선조 및 가축화된 쌀 묘목의 에치오닌을 포함하는 독성 펩타이드에 대한 차별적 민감도
이 연구는 도입 및 원조 쌀 균주에 있어서, 생체내에서의 EG1117 단백질 기능을 차별적으로 보여주는 시도를 나타낸다. 독성 펩티드를 운반하는 능력은 독성 펩티드를 차지하는 세포의 죽음을 가져온다. 기능의 부족은 묘목 뿌리의 연속적인 성장에 있어서 독성 펩티드의 영향에 대한 저항으로써 발현될 수 있었다. 표현형의 부족은 EG1117 단백질이 발현되지 않았거나, 다른 운반 단백질이 선택된 EG1117 단백질의 변화된 기능을 보충하는 것으로 암시한다.
Arabidopsis에 사용되는 방법의 변화는 상기 연구에서 사용될 수 있다(Steiner, et al., 1994).O. savitaO.rufipogen의 쌀 종자는 싹이 날 수 있으며, 그 후 묘목은 어둡고, 습한 컨테이너에서 부 배지(media)에서 성장을 계속할 수 있다. 상기 묘목은 에치오닌을 포함하는 대조군으로써 독성 펩티드 또는 비독성 펩티드가 주입된 디스크에 놓여질 수 있다. 초기 실험은 독성 펩티드에 대한 민감성에서의 극적인 차이가 존재하는지를 결정하는데 집중될 것이다. 만일 극적인 차이가 감지되지 않는다면, 독성 펩티드의 용량 범위를 사용하여 추가적인 실험이 독성 펩티드 용량에 대한 민감성 차이가 존재하는지 결정하기 위하여 좀 거대한 실험에서 사용될 수 있다. 이것은 두가지 쌀 균주에 있어서 펩티드 운반자 존재의 기능적인 활성의 차이를 암시하는 것이다.
상기 연구로부터의 결과는 EG1117 암호화된 단백질에 있어서 가정된 차이를 보충하는 다른 펩티드 운반 메카니즘이 있는지 여부에 달려있을 것이다. EG1117이 쌀에서 사용되는 1차적 펩티드 운반 단백질이거나 쌀의 성장에 결정적인 독특한 기능을 가지고 있는 한, 가축화 및 선조 형태 사이에서 EG1117 기능의 차이는 독성 펩티드에 대한 민감성의 차이에 의해 증명될 수 있다.Arabidopsis에 있어서의 유사 실험은 단일 PTR-2 단백질이 단일 펩티드 운반 시스템의 일부라는 것을 성공적으로 보여주었다(Steiner, et al., 1994). 그러므로, 단일 펩티드 운반자의 돌연변이는 성장 억제에 있어서 극적인 결과를 나타내었다. 특히, 상기 연구들은 초기 배아에서 PTR-2 발현에서의 발생상의 장애 때문에 PTR-2 단백질의 결실 또는 PTR-2 단백질 발현 부족이 주위 배지에서의 독성 펩티드의 존재에 대한 식물의 저항성을 가져왔다. 쌀 묘목 성장은 유사할 것이며, 쌀 묘목 성장에 있어서 변화에 의하여 EG1117의 기능의 차이를 쉽게 드러낼 것이다.

Claims (78)

  1. 가축화된 생물체의 폴리펩티드를 코딩하는 폴리뉴클레오타이드 시퀀스를 동정하는 방법으로서, 전술한 폴리펩티드는 전술한 가축화된 생물체의 야생 선조에 비교될 때 전술한 가축화된 생물체에서 증가된 산출량과 연관이 있거나 있다고 의심받으며, 다음 단계를 포함하는 방법:
    a) 전술한 가축화된 생물체의 폴리펩티드-코딩 뉴클레오타이드 시퀀스를 전술한 야생 선조의 폴리펩티드-코딩 뉴클레오타이드 시퀀스와 비교하고; 및
    b) 야생 선조에서 대응하는 시퀀스에 비교될 때 뉴클레오타이드 변화를 함유하는 가축화된 생물체에서의 폴리뉴클레오타이드 시퀀스를 선택함,
    여기서 전술한 변화는 진화적으로 의미있으며, 이에 의해 가축화된 생물체의 폴리뉴클레오타이드 시퀀스는 동정됨.
  2. 제 1 항에 있어서, 향상된 산출량과 연관이 있는 전술한 폴리펩티드는 EG307 또는 EG1117 폴리펩티드인 방법.
  3. 다음 단계들을 포함하는, 트랜스팩션된 식물 세포 또는 유전자도입 식물의 제조 방법:
    a) 폴리펩티드를 코딩하고 그 세포를 출처로 하지 않는 EG307 또는 EG1117 폴리뉴클레오타이드에서 유도된 헤테로로거스(heterologous) DNA 세그먼트를 함유하는 식물 세포를 트랜스팩션시키고; 여기서 전술한 폴리뉴클레오타이드는 이식 프로테인의 발현을 위해 효과적으로 사용될 수 있는 프로모터에 조종 가능하도록 링크되며;
    b) 경우에 따라서, 유전자도입 식물이 재생되는 조건 하에 전술한 세포를 성장 및 유지시키고;
    c) 경우에 따라서, 전술한 DNA가 발현되는 조건 하에 전술한 유전자도입 식물을 성장시키고, 이에 의해 전술한 식물에서 EG307 또는 EG1117 폴리펩티드의 총량이 증가됨.
  4. 제 3 항에 있어서, 전술한 헤테로로거스 DNA 세그먼트를 포함하는 전술한 유전자도입 식물의 후손들의 추가 세대들을 수득 및 성장시키는 단계를 추가로 포함하며, 여기서 전술한 헤테로로거스 DNA 세그먼트가 발현되는 것을 특징으로 하는 방법.
  5. EG307 또는 EG1117 폴리펩티드를 코딩하는 헤테로로거스 DNA를 포함하는, 식물 세포.
  6. 제 5 항에 따른 유전자도입 식물세포를 포함하는, 유전자도입 식물세포의 증식 물질.
  7. 식물 조직에서 발현되는 EG307 또는 EG1117 폴리펩티드를 인코딩하는 헤테로로거스 DNA를 함유하는 유전자도입 식물.
  8. 식물 조직에서 EG307 또는 EG1117 유전자를 인코딩하는 폴리뉴클레오타이드에 실시가능하게 링크된 프로모터를 포함하는 단리된 폴리뉴클레오타이드.
  9. 제 8 항에 있어서, 전술한 폴리뉴클레오타이드가 재조합 폴리뉴클레오타이드인 것을 특징으로 하는 단리된 폴리뉴클레오타이드.
  10. 제 8 항에 있어서, 프로모터가 EG307 또는 EG1117 유전자를 출처로 하는 프로모터인 것을 특징으로 하는 단리된 폴리뉴클레오타이드.
  11. 하기를 포함하는 트랜스팩션된 세포의 제조 방법:
    a) 가축화된 식물의 선조에 있는 진화적으로 의미있는 EG307 또는 EG1117 폴리뉴클레오타이드 또는 가축화된 식물에 있는 대응하는 폴리뉴클레오타이드를 동정하고;
    b) 전술한 EG307 또는 EG1117 폴리뉴클레오타이드를 사용하여 전사 또는 번역 조절성 요소, 인핸서, 인트론 또는 다른 5' 또는 3' 플랭킹 시퀀스일 수도 있는 비-폴리펩티드 코딩 영역을 동정하고;
    C) 리포터 단백질을 인코딩하는 폴리뉴클레오타이드에 실시가능하게 링크된전술한 비-폴리펩티드 코딩 영역을 포함하는 구축물을 조립하고; 및
    d) 전술한 구축물을 숙주 세포 내로 트랜스팩션시킴.
  12. 제 11 항의 방법에 따라 제조된 트랜스팩션된 세포.
  13. 전술한 숙주 세포가 식물 세포이며, 전술한 세포를 전술한 유전자도입 식물이 재생되는 조건 하에서 성장 및 유지시키는 단계를 더 포함하는 것을 특징으로 하는, 제 11 항의 방법을 포함하는 유전자도입 식물의 제조 방법.
  14. 제 12 항의 방법에 의해 제조된 유전자도입 식물.
  15. 제 11 항의 트랜스팩션된 숙주 세포를 적어도 하나의 후보 약제와 접촉시키는 것을 포함하며, 여기서 그 약제는 전술한 리포터 폴리뉴클레오타이드의 전사 또는 번역을 조절하는 그의 능력에 의해 동정되는, 진화적으로 의미있는 EG307 또는 EG1117 폴리뉴클레오타이드의 비-폴리펩티드 코딩 영역의 기능을 조절하는 약제를 동정하는 방법.
  16. 제 15 항의 방법에 의해 동정된 약제.
  17. 제 13 항의 유전자도입 식물을 적어도 하나의 후보 약제와 접촉시키는 것을포함하며, 여기서 그 약제는 전술한 리포터 폴리뉴클레오타이드의 전사 또는 번역을 조절하는 그의 능력에 의해 동정되는, 진화적으로 의미있는 EG307 또는 EG1117 폴리뉴클레오타이드의 비-폴리펩티드 코딩 영역의 기능을 조절하는 약제를 동정하는 방법.
  18. 제 17 항의 방법에 의해 동정된 약제.
  19. 진화적으로 의미있는 EG307 또는 EG1117 폴리뉴클레오타이드에서 나온 프로모터, 인핸서 또는 인트론 폴리뉴클레오타이드 또는 이들의 조합을 포함하고 리포터 단백질을 인코딩하는 폴리뉴클레오타이드에 실시가능하게 링크된 구축물로써 트랜스팩션된 숙주 세포를 포함하는, 트랜스팩션된 숙주 세포.
  20. 적어도 하나의 후보 약제를 EG307 또는 EG1117 유전자를 포함하는 식물 또는 세포와 접촉시키는 것을 포함하며, 여기서 약제는 산출량을 조절하는 그의 능력에 의해 동정된 것인, 산출량을 조절할 수도 있는 약제를 동정하는 방법.
  21. 제 20 항에 있어서, 식물 또는 세포는 EG307 또는 EG1117 유전자를 인코딩하는 폴리뉴클레오타이드로 트랜스팩션된 것을 특징으로 하는 방법.
  22. 제 20 항의 방법에 따라 동정된 약제.
  23. 제 20 항에 있어서, 전술한 동정된 약제는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드의 기능을 조절함으로써 산출량을 조절하는 것을 특징으로 하는 방법.
  24. 제 20 항에 있어서, 전술한 동정된 약제는 폴리펩티드의 기능을 조절함으로써 산출량을 조절하는 것을 특징으로 하는 방법.
  25. 하기 단계를 포함하는, 식물에서 증가된 산출량을 제공하는 방법:
    a) EG307 또는 EG1117 폴리펩티드를 인코딩하는 헤테로로거스 DNA를 갖는 트랜스팩션된 식물 세포를 제조하고, 이에 의해 전술한 식물 세포에서 EG307 또는 EG1117를 발현시키고; 및
    b) 트랜스팩션된 식물 세포로부터 유전자도입 식물을 성장시키고, 여기서 EG307 또는 EG1117 트랜스젠(transgene)을 유전자도입 식물에서 발현시킴.
  26. 제 25 항에 있어서, 트랜스젠은 그 트랜스젠의 통제된 발현에 적절한 조절성 시퀀스의 통제 하에 있는 것을 특징으로 하는 방법.
  27. 하기 단계를 포함하는, EG307 또는 EG1117 폴리펩티드의 제조 방법:
    a) 세포에서 발현 위치에 있는 EG307 또는 EG1117 폴리펩티드를 인코딩하는 폴리뉴클레오타이드로써 트랜스팩션된 세포를 제조하고;
    b) 트랜스팩션된 세포를 폴리뉴클레오타이드를 발현시키기 위한 조건 하에 배양하고; 및
    c) EG307 또는 EG1117 폴리펩티드를 단리함.
  28. 제 25 항에 있어서, EG307 또는 EG1117 유전자를 인코딩하는 전술한 헤테로로거스 DNA는 EG307 또는 EG1117 유전자의 구성적인 발현을 제공하는 프로모터의 통제 하에 있는 것을 특징으로 하는 방법.
  29. 제 25 항에 있어서, EG307 또는 EG1117 유전자를 인코딩하는 전술한 헤테로로거스 DNA는 EG307 또는 EG1117 유전자의 제어가능한 발현을 제공하는 프로모터의 통제 하에 있는 것을 특징으로 하는 방법.
  30. 제 29 항에 있어서, EG307 또는 EG1117 유전자는 조직-특이성 또는 세포형-특이성 프로모터를 사용하여 또는 화학 신호 또는 약제와 같은 외부 신호 또는 약제의 도입에 의해 활성화되는 프로모터를 사용하여 발현되는 것을 특징으로 하는 방법.
  31. 하기 단계를 포함하는, 식물 세포로부터 산출량-관련 유전자 또는 그의 단편을 단리하는 방법:
    a) 식물 세포 폴리뉴클레오타이드의 시료를 제공하고;
    b) EG307 또는 EG1117 유전자의 보존 영역에 대해 시퀀스 상동관계를 갖는 한 쌍의 올리고뉴클레오타이드를 제공하고;
    c) 폴리머라제 사슬 반응-개입된 폴리뉴클레오타이드 증폭에 적절한 조건 하에서 올리고뉴클레오타이드의 쌍을 식물 세포 폴리뉴클레오타이드 시료와 결합시키고; 및
    d) 증폭된 산출량-관련 폴리뉴클레오타이드 또는 그의 단편을 단리함.
  32. 제 31 항의 방법에 따라 단리된 식물 산출량-관련 폴리뉴클레오타이드.
  33. 하기 단계를 포함하는, 산출량-관련 폴리뉴클레오타이드를 단리하는 방법:
    a) 게놈성 식물세포 DNA 및 재조합 식물 세포 라이버러리 폴리뉴클레오타이드로 구성된 군에서 선택되는 폴리뉴클레오타이드의 제제를 제공하고;
    b) 그 제제를, 50% 또는 그 이상의 시퀀스 동일성을 갖는 폴리뉴클레오타이드의 검출을 제공하는 혼성화 조건 하에서 EG307 또는 EG1117 올리고뉴클레오타이드와 접촉시키고; 및
    c) 산출량-관련 폴리뉴클레오타이드를 EG307 또는 EG1117 올리고뉴클레오타이드와 그의 결합에 의해 단리함.
  34. 제 33 항에 있어서, EG307 또는 EG1117 올리고뉴클레오타이드는 검출가능하게 표지되어 있고 산출량-관련 유전자는 검출가능한 표지(label)과 결합에 의해 단리되는 것을 특징으로 하는 방법.
  35. 제 33 항에 있어서, EG307 또는 EG1117 올리고뉴클레오타이드는 길이가 적어도 12개 임을 특징으로 하는 방법.
  36. 제 33 항에 있어서, EG307 또는 EG1117 올리고뉴클레오타이드는 길이가 적어도 30개 임을 특징으로 하는 방법.
  37. 하기 단계를 포함하는, 산출량-관련 폴리뉴클레오타이드를 동정하는 방법:
    a) 식물 조직 시료를 제공하고;
    b) 식물 조직 시료를 후보 식물-산출량 관련 유전자 내에 도입하고;
    c) 후보 식물 산출량-관련 유전자를 식물 조직 시료 내에서 발현시키고; 및
    d) 식물 조직 시료가 산출량 응답에서 변화를 표출하는지를 결정하고, 이에 의해 응답에서의 변화가 식물 산출량-관련 유전자를 동정함.
  38. 제 37 항의 방법에 따라 단리된 식물 산출량-관련 유전자.
  39. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드:
    a) SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:97, 및 SEQ ID NO:98로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  40. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드:
    a) SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:113, SEQ ID NO:114, SEQ ID NO:116, 및 SEQ ID NO:117로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  41. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드 :
    a) SEQ ID NO:119, SEQ ID NO:120, SEQ ID NO:121, SEQ ID NO:122, SEQ ID NO:123, SEQ ID NO:124, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:128, SEQ ID NO:129, SEQ ID NO:130, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:136, SEQ ID NO:137, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:141, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:145, SEQ ID NO:146, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:150, SEQ ID NO:151, SEQ ID NO:152, SEQ ID NO:154, and SEQ ID NO:155로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  42. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드 :
    a) SEQ ID NO:157, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:161, SEQ ID NO:162, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:166, SEQ ID NO:167, and SEQ ID NO:168로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  43. 하기로 구성된 군에서 선택되는, 단리된 폴리펩티드:
    a) SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:97, 및 SEQ ID NO:98로 구성된 군에서 선택되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드.
  44. 하기로 구성된 군에서 선택되는, 단리된 폴리펩티드:
    a) SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:110, SEQ ID NO:112, SEQ IDNO:113, SEQ ID NO:114, SEQ ID NO:116, 및 SEQ ID NO:117 로 구성된 군에서 선택되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드.
  45. 하기로 구성된 군에서 선택되는, 단리된 폴리펩티드 :
    a) SEQ ID NO:119, SEQ ID NO:120, SEQ ID NO:121, SEQ ID NO:122, SEQ ID NO:123, SEQ ID NO:124, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:128, SEQ ID NO:129, SEQ ID NO:130, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:136, SEQ ID NO:137, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:141, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:145, SEQ ID NO:146, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:150, SEQ ID NO:151, SEQ ID NO:152, SEQ ID NO:154, 및 SEQ ID NO:155로 구성된 군에서 선택되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드.
  46. 하기로 구성된 군에서 선택되는, 단리된 폴리펩티드:
    a) SEQ ID NO:157, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:161, SEQ ID NO:162, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:166, SEQ ID NO:167, 및 SEQ ID NO:168로 구성된 군에서 선택되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드.
  47. 야생 선조 또는 가축화된 생물체의 폴리펩티드를 인코딩하는 폴리뉴클레오타이드 시퀀스를 동정하는 방법으로서, 여기서 전술한 폴리펩티드는 전술한 야생 선조 또는 전술한 가축화된 생물체에서의 향상된 경제적 생산성과 연관이 있거나 있는 것으로 의심을 받고 있는 것으로, 하기 단계들을 포함하는 방법:
    a) 전술한 야생 선조 및 전술한 가축화된 생물체의 폴리펩티드-코딩 뉴클레오타이드 시퀀스들을 비교하고; 및
    b) 야생 선조 또는 가축화된 생물체 각각에 있는 대응 시퀀스에 비교할 때 뉴클레오타이드 변화를 함유하는 가축화된 생물체 또는 야생 선조 중의 어느 하나에 있는 폴리뉴클레오타이드 시퀀스를 선택함,
    여기서 전술한 변화는 진화적으로 중성이거나 양성 진화적으로 의미있는 것이며, 이에 의해 향상된 경제적 생산성과 연관이 있는 폴리펩티드를 인코딩하는 폴리뉴클레오타이드가 동정됨.
  48. 가축화된 생물체의 야생 선조의 폴리펩티드를 인코딩하는 폴리뉴클레오타이드 시퀀스를 동정하는 방법으로서, 여기서 전술한 폴리펩티드는 가축화된 생물체에 비교할 때 가축화된 생물체의 야생 선조에서의 독특한, 강화된 또는 변경된 내스트레스성 특질과 연관이 있거나 있는 것으로 의심을 받고 있는 것으로, 하기 단계들을 포함하는 방법:
    a) 전술한 가축화된 생물체의 폴리펩티드-코딩 뉴클레오타이드 시퀀스를 전술한 야생 선조의 폴리펩티드-코딩 뉴클레오타이드 시퀀스와 비교하고; 및
    b) 가축화된 생물체에 있는 대응 시퀀스에 비교할 때 뉴클레오타이드 변화를 함유하는 야생 선조에서의 폴리뉴클레오타이드 시퀀스를 선택함, 여기서 전술한 변화는 진화적으로 중성이며, 이에 의해 야생 선조의 폴리뉴클레오타이드 시퀀스는 동정됨.
  49. 제 48 항에 있어서, 가축화된 생물체는 옥수수, 쌀, 토마토 및 그의 선조가 알려져 있는 다른 가축화된 식물로 구성된 군에서 선택되는 것을 특징으로 하는 방법.
  50. 제 49 항에 있어서, 전술한 가축화된 식물은 옥수수이고 전술한 야생 선조는 테오신테인 것을 특징으로 하는 방법.
  51. 제 48 항에 있어서, 전술한 가축화된 종의 프로테인-코딩 뉴클레오타이드 시퀀스는 cDNA에 대응하는 것을 특징으로 하는 방법.
  52. 제 48 항에 있어서, 뉴클레오타이드 변화는 비동질성 치환인 것을 특징으로 하는 방법.
  53. 제 48 항에 있어서, 가축화된 생물체는 식물이고 내스트레스성 특질은 내한발성, 질병 저항성, 해충 저항성, 고염수준 저항성 및 상업적으로 흥미있는 다른 스트레스성 특질로 구성된 군에서 선택되는 것을 특징으로 하는 방법.
  54. 가축화된 생물체의 야생 선조에서 내스트레스성 특질을 조절할 수도 있는 약제를 동정하는 방법으로서, 적어도 하나의 후보 약제를 야생 선조, 가축화된 생물체와, 또는 제 48 항에서 동정된 폴리뉴클레오타이드 시퀀스를 발현하는 세포 또는 유전자이식 생물체와 접촉시키는 것을 포함하며, 그 약제는 폴리뉴클레오타이드의 기능 또는 그 동정된 폴리뉴클레오타이드 시퀀스에 의해 인코딩되는 폴리펩티드의 기능을 조절하는 능력에 의해 동정되는 방법.
  55. 제 54 항의 약제를 투여함으로써 가축화된 생물체의 야생 선조에서 내스트레스성을 조절하는 방법.
  56. 제 48 항의 야생 선조 내스트레스성 폴리뉴클레오타이드 시퀀스에 대응하는 가축화된 생물체에서의 폴리뉴클레오타이드 시퀀스에 의해 인코딩되는 폴리펩티드 시퀀스에 대한 약제를 동정하는 방법으로서, 적어도 하나의 후보 약제를 가축화된 생물체, 조상 생물체와, 또는 그 폴리뉴클레오타이드 시퀀스를 발현하는 세포 또는 유전자이식 생물체와 접촉시키는 것을 포함하며, 이에 의해 그 약제는 폴리펩티드 시퀀스의 기능을 조절하는 능력에 의해 동정되는 방법.
  57. 제 56항의 약제를 투여함으로써 가축화된 생물체에서 내스트레스성을 조절하는 방법.
  58. 가축화된 생물체의 야생 선조의 폴리펩티드-코딩 폴리뉴클레오타이드 시퀀스에서의 진화적으로 중성인 변화를 동정하는 방법으로서, 하기 단계를 포함하는 방법:
    a) 전술한 야생 선조의 폴리펩티드-코딩 폴리뉴클레오타이드 시퀀스를 전술한 가축화된 생물체의 대응하는 시퀀스와 비교하고; 및
    b) 야생 선조의 대응하는 시퀀스에 비교하여 뉴클레오타이드 변화를 함유하는 가축화된 생물체에서의 폴리뉴클레오타이드 시퀀스를 선택함,
    여기서 그 변화는 진화적으로 중성이고 폴리뉴클레오타이드는 가축화된 생물체의 야생 선조에서의 내스트레스성 특질과 연관이 있으며, 이에 의해 폴리뉴클레오타이드에서 진화적으로 중성인 변화를 동정함.
  59. 제 58 항에 있어서, 가축화된 생물체는 옥수수, 쌀, 토마토 및 그의 선조가 알려져 있는 다른 가축화된 식물로 구성된 군에서 선택되는 것을 특징으로 하는 방법.
  60. 제 58 항에 있어서, 전술한 가축화된 식물은 옥수수이고 전술한 야생 선조는 테오신테인 것을 특징으로 하는 방법.
  61. 제 58 항에 있어서, 전술한 가축화된 종의 단백질-코딩 뉴클레오타이드 시퀀스는 cDNA에 대응하는 것을 특징으로 하는 방법.
  62. 제 58 항에 있어서, 뉴클레오타이드 변화는 비동질성 치환인 것을 특징으로 하는 방법.
  63. 제 58 항에 있어서, 가축화된 생물체는 식물이고 내스트레스성 특질은 내한발성, 질병 저항성, 해충 저항성, 고염수준 저항성 및 상업적으로 흥미있는 다른 스트레스성 특질로 구성된 군에서 선택되는 것을 특징으로 하는 방법.
  64. 가축화된 생물체의 야생 선조의 폴리펩티드-코딩 뉴클레오타이드 시퀀스 및 전술한 가축화된 생물체에서 나온 폴리펩티드-코딩 시퀀스 사이의 대규모 시퀀스비교 방법으로서, 여기서 야생 선조 생물체 폴리펩티드는 가축화된 생물체와 비교할 때 야생 선조에서 독특한, 강화된 또는 변경된 내스트레스성 특질을 부여하거나 부여하는 것으로 의심받고 있으며, 하기 단계를 포함하는 방법:
    a) 야생 시퀀스를 가축화된 생물체로부터 나온 대응 시퀀스와 함께 시퀀스 상동관계에 따라 정렬하고; 및
    b) 야생 선조 또는 가축화된 생물체 각각으로부터 나온 상동성 시퀀스와 비교할 때, 가축화된 생물체 시퀀스 또는 야생 선조 시퀀스 내에서의 임의의 뉴클레오타이드 변화를 동정함.
  65. 제 64 항에 있어서, 가축화된 생물체는 옥수수, 쌀, 토마토 및 그의 선조가 알려져 있는 다른 가축화된 식물로 구성된 군에서 선택되는 것을 특징으로 하는 방법.
  66. 제 65 항에 있어서, 전술한 가축화된 식물은 옥수수이고 전술한 야생 선조는 테오신테인 것을 특징으로 하는 방법.
  67. 제 64 항에 있어서, 전술한 가축화된 종의 단백질-코딩 뉴클레오타이드 시퀀스는 cDNA에 대응하는 것을 특징으로 하는 방법.
  68. 하기 단계들을 포함하는, 가축화된 생물체의 야생 선조에서 독특한, 강화된또는 변경된 내스트레스성 특질에 진화적으로 중성인 뉴클레오타이드 변화를 상호관련시키는 방법:
    a) 청구항 48에 따라 뉴클레오타이드 시퀀스를 동정하고; 및
    b) 가축화된 생물체 또는 선조 생물체에서 동정된 시퀀스의 존재 또는 부재의 기능적인 효과를 분석함.
  69. 하기의 단계들을 포함하는, 트랜스팩션된 식물 세포 또는 유전자도입 식물의 제조 방법:
    a) 청구항 48의 야생 선조의 내스트레스성 폴리펩티드를 인코딩하는 폴리뉴클레오타이드를 함유하는 식물 세포를 변형시키고, 여기서 전술한 폴리뉴클레오타이드는 유전자도입 단백질의 발현을 위해 효과적으로 사용될 수 있는 프로모터에 실시가능하게 링크되어 있고;
    b) 경우에 따라서는, 유전자도입 식물이 재생되는 조건 하에 전술한 세포를 성장 및 유지시킴.
  70. 제 69 항의 방법에 의하여 생성된 트랜스팩션된 세포.
  71. 제 69 항의 방법에 의하여 생성된 유전자도입 식물.
  72. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드:
    a) SEQ ID NO:1, SEQ ID NO:91, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:15, 및 SEQ ID NO:17, 및 SEQ ID NO:18로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  73. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드:
    a) SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, 및 SEQ ID NO:90로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  74. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드:
    a) SEQ ID NO:33, SEQ ID NO:34, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:63, 및 SEQ ID NO:64로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  75. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드:
    a) SEQ ID NO:66, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:74, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:59, 및 SEQ ID NO:78로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  76. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드:
    a) SEQ ID NO:80, SEQ ID NO:81, 및 SEQ ID NO:82로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  77. 하기로 구성된 군에서 선택되는, 단리된 폴리뉴클레오타이드:
    a) SEQ ID NO:84 및 SEQ ID NO:85로 구성된 군에서 선택되는 폴리뉴클레오타이드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드.
  78. 하기로 구성된 군에서 선택되는, 단리된 폴리펩티드:
    a) SEQ ID NO:1, SEQ ID NO:91, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:15, AND SEQ ID NO:17, AND SEQ ID NO:18로 구성된 군에서 선택되는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드 ; 및
    b) 상기 a)의 폴리뉴클레오타이드에 85% 상동관계를 가지며 a)의 폴리뉴클레오타이드와 실질적으로 동일한 산출량을 부여하는 폴리뉴클레오타이드에 의해 인코딩되는 폴리펩티드.
KR10-2004-7011241A 2002-01-16 2003-01-16 가축화된 식물 및 동물에서 폴리뉴클레오타이드 및폴리펩티드 시퀀스의 진화론적으로 유의한 변화를동정하는 방법 KR20040081139A (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US34908802P 2002-01-16 2002-01-16
US60/349,088 2002-01-16
US34966102P 2002-01-17 2002-01-17
US60/349,661 2002-01-17
US10/079,042 2002-02-19
US10/079,042 US7252966B2 (en) 1999-01-29 2002-02-19 EG307 polynucleotides and uses thereof
US36854102P 2002-03-29 2002-03-29
US60/368,541 2002-03-29
PCT/US2003/001460 WO2003062382A2 (en) 2002-01-16 2003-01-16 Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals

Publications (1)

Publication Number Publication Date
KR20040081139A true KR20040081139A (ko) 2004-09-20

Family

ID=27617766

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7011241A KR20040081139A (ko) 2002-01-16 2003-01-16 가축화된 식물 및 동물에서 폴리뉴클레오타이드 및폴리펩티드 시퀀스의 진화론적으로 유의한 변화를동정하는 방법

Country Status (9)

Country Link
EP (1) EP1501942A4 (ko)
JP (1) JP2005518199A (ko)
KR (1) KR20040081139A (ko)
CN (1) CN1630731A (ko)
AU (2) AU2003217221B2 (ko)
BR (1) BR0306968A (ko)
CA (1) CA2473555A1 (ko)
IL (1) IL162897A0 (ko)
WO (1) WO2003062382A2 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006230352A1 (en) * 2005-03-29 2006-10-05 Evolutionary Genomics Llc EG1117 and EG307 polynucleotides and uses thereof
US20080256659A1 (en) * 2005-09-02 2008-10-16 Evolutionary Genomics, Inc. Eg8798 and Eg9703 Polynucleotides and Uses Thereof
CN102888398B (zh) * 2011-07-22 2014-03-05 中国农业科学院生物技术研究所 转基因水稻品系Bar68-1的外源插入片段的旁侧序列及其应用
CN102934548B (zh) * 2011-08-15 2014-07-02 东北农业大学 辅助鉴定抗旱玉米的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6245969B1 (en) * 1997-06-24 2001-06-12 Joanne Chory Receptor kinase, Bin1
AU769931B2 (en) * 1998-01-30 2004-02-12 Evolutionary Genomics Llc Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions
US6274319B1 (en) * 1999-01-29 2001-08-14 Walter Messier Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals
DE60036645T2 (de) * 1999-08-05 2008-07-17 Evolutionary Genomics LLC, Lafayette Methoden zur identifizierung evolutionär signifikanter änderungen in polynukleotid- und polypeptidsequenzen in domestizierten pflanzen und tieren

Also Published As

Publication number Publication date
WO2003062382A3 (en) 2004-12-09
EP1501942A2 (en) 2005-02-02
EP1501942A4 (en) 2006-06-07
CN1630731A (zh) 2005-06-22
AU2003217221B2 (en) 2008-11-27
WO2003062382A2 (en) 2003-07-31
BR0306968A (pt) 2006-04-11
CA2473555A1 (en) 2003-07-31
AU2009200805A1 (en) 2009-03-26
IL162897A0 (en) 2005-11-20
JP2005518199A (ja) 2005-06-23

Similar Documents

Publication Publication Date Title
US7901935B2 (en) Nucleic acid compositions conferring disease resistance
US20060248613A1 (en) Implementation of a mitochondrial mutator
Lu et al. Comparative gene expression analysis reveals mechanism of Pinus contorta response to the fungal pathogen Dothistroma septosporum
US20060248614A1 (en) Implementation of a mitochondrial mutator
AU2009200805A1 (en) Methods to identify evolutionary significant changes in polynucleotides and polypeptide sequences in domesticated plants and animals
US20110083229A1 (en) EG1117 And EG307 Polynucleotides And Uses Thereof
US7252966B2 (en) EG307 polynucleotides and uses thereof
US7439018B2 (en) EG1117 Polynucleotides and uses thereof
Sanghera et al. Sugarcane improvement in genomic era: opportunities and complexities
AU2003217221A1 (en) Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals
Caldas et al. Functional genomics of biotic and abiotic stresses in Phaseolus vulgaris
Sanghera et al. Recent genomic approaches for sugarcane improvement: Opportunities and challenges
KR101949903B1 (ko) 옥수수 노균병 저항성 개체 선별용 마커 및 이를 이용한 선별방법
US20090133164A1 (en) EG1117 polynucleotides and uses thereof
EP1947201A2 (en) Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals
Fliege Genomic changes underlying disease resistance and high protein QTL
WO2004031397A9 (en) Detection of evolutionary bottlenecking by dna sequencing as a method to discover genes of value
JP2009297039A (ja) 栽培用植物および家畜化動物中のポリヌクレオチドおよびポリペプチド配列における進化的に有意の変化を同定するための方法
Cheng et al. Cytogenetic characterization and molecular marker development of a novel wheat-Thinopyrum ponticum 5E (5D) disomic substitution line with resistance to powdery mildew and stripe rust
Peacock et al. The impact of gene technologies on the use of genetic resources.
US20080256659A1 (en) Eg8798 and Eg9703 Polynucleotides and Uses Thereof
Mackenzie et al. IMPLEMENTATION OF A MITOCHONDRIAL MUTATOR
Souza Rosanne E. Casu, Carlos Takeshi Hotta2 and
AU2002244668A1 (en) Oomycete FtsZ-mt as a target for antimicrobial-specific biocides
EP1356300A2 (en) Oomycete ftsz-mt as a target for antimicrobial-specific biocides

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
NORF Unpaid initial registration fee