KR20080049150A - 식물 스테롤 아실전달효소 - Google Patents

식물 스테롤 아실전달효소 Download PDF

Info

Publication number
KR20080049150A
KR20080049150A KR1020087012160A KR20087012160A KR20080049150A KR 20080049150 A KR20080049150 A KR 20080049150A KR 1020087012160 A KR1020087012160 A KR 1020087012160A KR 20087012160 A KR20087012160 A KR 20087012160A KR 20080049150 A KR20080049150 A KR 20080049150A
Authority
KR
South Korea
Prior art keywords
leu
val
ser
gly
phe
Prior art date
Application number
KR1020087012160A
Other languages
English (en)
Inventor
마이클 라스너
에넨남 앨리슨 밴
Original Assignee
몬산토 테크놀로지 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 몬산토 테크놀로지 엘엘씨 filed Critical 몬산토 테크놀로지 엘엘씨
Publication of KR20080049150A publication Critical patent/KR20080049150A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition

Abstract

본 발명은 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드 (LCAT) 및 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드 (ACAT)에 관한 것이다. 본 발명은 그러한 콜레스테롤:아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드, 그러한 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드, 및 식물 및 숙주 세포에서 스테롤 조성 및 오일 생산을 변경하는 그러한 폴리뉴클레오티드의 용도를 제공한다. 또한 제공되는 것은 폴리뉴클레오티드 및 식품 제품을 포함한 식물 및 숙주 세포에 의해 생산되는 오일, 영양 보조제, 및 본 발명의 식물 또는 오일을 함유한 약학 조성물이다. 본 발명의 폴리뉴클레오티드는 식물 공급원으로부터 유래되는 것을 포함한다.
레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드, 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드, 스테롤 조성

Description

식물 스테롤 아실전달효소 {PLANT STEROL ACYLTRANSFERASES}
본 출원은 1999.8.30 에 출원되고 모든 목적으로 전체로서 본원에 참고로 포함된 미국 예비 출원 일련번호 제 60/152,493 에 대해 우선권을 주장한다.
본 발명은 식물 아실전달효소 유사 핵산 및 아미노산 서열 및 구축물, 및 숙주 세포 및 식물에서 스테롤 조성 및/또는 함량, 및 오일 조성 및/또는 함량을 변경할 때 이들 용도에 관련된 방법에 관한 것이다.
식물 유전공학 기술의 개발을 통해, 현재 식물 종의 형질전환 변종을 제조하여 신규의 바람직한 특성을 가지는 식물을 제공하는 것이 가능하다. 예를 들면, 현재 병원균 저항성 및 제초제 내성과 같은, 환경 스트레스에 대한 내성 식물을 유전적으로 조작하는 것이 가능하다. 또한 식물의 영양학적 특성을 개선시키는 것이 가능한데, 예를 들면 개선된 지방산, 카로티노이드, 스테롤 및 토코페롤 조성을 제공하는 것이다. 그러나, 그러한 특성의 조작에 유용한 핵산 서열의 수는 꽤 제한된다.
생합성 또는 천연 식물 유래의 스테롤 조성물을 수득하거나 처리할 개선된 수단에 대한 필요가 있다. 식물에서 스테롤 생산을 증가시키거나 스테롤 조성을 변경시킬 능력은 인간 및 동물 영양에 사용하기 위한 스테롤의 신규 공급원을 제공할 것이다.
스테롤 생합성은 이소프레노이드 경로에서 파르네실 디포스페이트 중간체로부터 갈라진다. 스테롤 생합성은 포유동물 및 고등식물에서 메발로네이트 의존 경로를 통해 일어나는 반면에 (Goodwin, (1981) Biosynthesis of Isoprenoid Compounds, vol 1 (Porter, J.W. & Spurgeon, S.L. 저) pp.443-480, John Wiley and Sons, New York), 녹조류에서의 스테롤 생합성은 메발로네이트 독립 경로를 통해 일어나는 것으로 생각된다 (Schwender, 등 (1997) Physiology, Biochemistry, 및 Molecular Biology of Plant Lipids, (Williams, J.P., Khan, M.U., 및 Lem, N.W.,저) pp.180-182, Kluwer Academic Publishers, Norwell, MA).
스테롤 에스테르의 용해도 특성은, 이것이 스테롤의 저장 형태라는 것을 제안한다 (Chang, 등 (1997) Annu. Rev. Biochem., 66:613-638). 아실 CoA:콜레스테롤 아실전달효소 (ACAT) 및 레시틴:콜레스테롤 아실전달효소 (LCAT)와 같은 스테롤 O-아실전달효소는 콜레스테롤 에스테르의 형성을 촉매하므로, 세포내 콜레스테롤 저장을 조절하는 열쇠이다. 효모에서, 인간 LCAT의 유사체인 LRO1 및 인지질:디아실글리세롤 아실전달효소의 과발현으로 지질 합성이 증가했다고 보고되었다 (Oelkers 등, (2000) J. Biol. Chem., 26:15609-15612; Dahlqvist 등, (2000) Proc. Natl. Acad. Sci. USA, 97:6487-6492).
다양한 아실전달효소 단백질의 특성규명이 추가의 식물 스테롤 합성 시스템 연구 및 신규 및/또는 대안적인 스테롤 공급원의 개발에 유용하다. 식물 기작의 연구는 식물 세포의 스테롤 조성을 추가로 향상시키고, 조절하고, 변형시키고, 또는 그렇지 않으면 변경하는 수단을 제공할 수 있다. 더욱이, 스테롤 함량 및/또는 조성에서의 그러한 변경은 스트레스 및 곤충 손상에 대한 내성을 수득하는 수단을 제공할 수 있다. 특히 관심 있는 것은 유전공학에서 적용하기에 유용할 수 있는 단백질을 코딩하는 유전자의 핵산 서열이다.
발명의 개요
본 발명은 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드 (또한 본원에서 LCAT로 언급됨) 및 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드 (또한 본원에서 ACAT로 언급됨)에 관한 것이다. 특히 발명은 그러한 스테롤:아실전달효소를 코딩하는 폴리뉴클레오티드, 그러한 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드, 및 스테롤 조성 및 오일 생산을 변경하는 그러한 폴리뉴클레오티드의 용도에 관한 것이다. 본 발명의 폴리뉴클레오티드는 식물 공급원으로부터 유래된 것을 포함한다.
그러므로, 본 발명의 한 면은 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드, 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드의 절편, 식물 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드 또는 식물 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드의 절편을 코딩하는 분리된 핵산 서열이다.
다른 면은 서열 번호 2, 4, 6, 8, 10-29, 43-51, 73 또는 75로 본질적으로 구성된 분리된 핵산 서열을 제공한다. 또한 서열 번호 2, 4, 6, 8, 10-29, 43-51, 73 또는 75로 구성된 분리된 핵산 서열이 제공된다.
여전히 또다른 면은 서열 번호 3 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 3의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 2; 서열 번호 2와 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 2와 극한 조건하에 혼성화하는 10개 아미노산 이상의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 2와 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된 폴리뉴클레오티드를 함유하는 분리된 핵산 서열을 제공한다.
여전히 또다른 면은 하기 식의 폴리뉴클레오티드로 본질적으로 구성된 분리된 핵산 서열을 제공한다:
5' X-(R1)n-(R2)n-(R3)n-Y 3'
(식 중, X는 수소, Y는 수소 또는 금속, R1 및 R3는 임의의 핵산, n은 0 내지 3000의 정수, R2는 서열 번호 3 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 3의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 2; 서열 번호 2와 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 2와 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 2와 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된다.)
또다른 면은 서열 번호 5 또는 하나 이상의 보존된 아미노산 치환을 가진 서 열 번호 5의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 4; 서열 번호 4와 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 4와 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 4와 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된 폴리뉴클레오티드를 함유하는 분리된 핵산 서열을 제공한다.
또다른 면은 하기 식의 폴리뉴클레오티드로 본질적으로 구성된 분리된 핵산 서열을 제공한다:
5' X-(R1)n-(R2)n-(R3)n-Y 3'
(식 중, X는 수소, Y는 수소 또는 금속, R1 및 R3는 임의의 핵산, n은 0 내지 3000의 정수, R2는 서열 번호 5 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 5의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 4; 서열 번호 4와 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 4와 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 4와 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된다.)
또다른 면은 서열 번호 7 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 7의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 6; 서열 번호 6과 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 6과 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 6과 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된 폴리뉴클레오티드를 함유하는 분리된 핵산 서열을 제공한다.
또다른 면은 하기 식의 폴리뉴클레오티드로 본질적으로 구성된 분리된 핵산 서열을 제공한다:
5' X-(R1)n-(R2)n-(R3)n-Y 3'
(식 중, X는 수소, Y는 수소 또는 금속, R1 및 R3는 임의의 핵산, n은 0 내지 3000의 정수, R2는 서열 번호 7 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 7의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 6; 서열 번호 6과 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 6과 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 6과 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된 다.)
또다른 면은 서열 번호 9 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 9의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 8; 서열 번호 8과 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 8과 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 8과 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된 폴리뉴클레오티드를 함유하는 분리된 핵산 서열을 제공한다.
또다른 면은 하기 식의 폴리뉴클레오티드로 본질적으로 구성된 분리된 핵산 서열을 제공한다:
5' X-(R1)n-(R2)n-(R3)n-Y 3'
(식 중, X는 수소, Y는 수소 또는 금속, R1 및 R3는 임의의 핵산, n은 0 내지 3000의 정수, R2는 서열 번호 9 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 9의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 8; 서열 번호 8과 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 8과 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 8과 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된다.)
또다른 면은 서열 번호 74 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 74의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 73; 서열 번호 73과 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 73과 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 73과 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된 폴리뉴클레오티드를 함유하는 분리된 핵산 서열을 제공한다.
또다른 면은 하기 식의 폴리뉴클레오티드로 본질적으로 구성된 분리된 핵산 서열을 제공한다:
5' X-(R1)n-(R2)n-(R3)n-Y 3'
(식 중, X는 수소, Y는 수소 또는 금속, R1 및 R3는 임의의 핵산, n은 0 내지 3000의 정수, R2는 서열 번호 74 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 74의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 73; 서열 번호 73과 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 73과 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티 드; 및 서열 번호 73과 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된다.)
또다른 면은 서열 번호 76 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 76의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 75; 서열 번호 75와 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 75와 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 75와 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된 폴리뉴클레오티드를 함유하는 분리된 핵산 서열을 제공한다.
또다른 면은 하기 식의 폴리뉴클레오티드로 본질적으로 구성된 분리된 핵산 서열을 제공한다:
5' X-(R1)n-(R2)n-(R3)n-Y 3'
(식 중, X는 수소, Y는 수소 또는 금속, R1 및 R3는 임의의 핵산, n은 0 내지 3000의 정수, R2는 서열 번호 76 또는 하나 이상의 보존된 아미노산 치환을 가진 서열 번호 76의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드; 서열 번호 75; 서열 번호 75와 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 75와 극한 조건하에 혼성화하는 10개 이상의 아미노산 의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 75와 극한 조건하에 혼성화하고 식물 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된다.)
또다른 면은 서열 번호 42 또는 이의 축중(degenerate) 변이체; 서열 번호 42와 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 42와 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 42와 극한 조건하에 혼성화하고 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된 폴리뉴클레오티드를 함유하는 분리된 핵산 서열을 제공한다.
또다른 면은 하기 식의 폴리뉴클레오티드로 본질적으로 구성된 분리된 핵산 서열을 제공한다:
5' X-(R1)n-(R2)n-(R3)n-Y 3'
(식 중, X는 수소, Y는 수소 또는 금속, R1 및 R3는 임의의 핵산, n은 0 내지 3000의 정수, R2는 서열 번호 42 또는 이의 축중 변이체; 서열 번호 42와 70%, 80%, 90%, 또는 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 서열 번호 42와 극한 조건하에 혼성화하는 10개 이상의 아미노산의 분리된 폴리뉴클레오티드; 임의의 전술한 것과 상보적인 분리된 폴리뉴클레오티드; 및 서열 번호 42와 극한 조건하에 혼성화하고 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드로 구성된 군으로부터 선택된다.)
또한 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드 및/또는 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 함유한 재조합 핵산 구축물이 제공된다. 하나의 구현예에서, 스테롤 아실전달효소는 식물 스테롤 아실전달효소이다. 또다른 구현예에서, 재조합 핵산 구축물은 추가로 종결 서열을 함유한다. 조절 서열은 구성 프로모터, 유도성 프로모터, 발생적으로 조절된 프로모터, 조직 특이성 프로모터, 기관 특이성 프로모터, 종자 특이성 프로모터 또는 전술한 것의 임의의 조합일 수 있다. 또한 상기 재조합 핵산 구축물을 포함한 식물 및 그러한 식물의 종자 및 자손이 제공된다. 상기 재조합 핵산 구축물은 또한 적당한 숙주 세포내로 도입되어 본 발명의 또다른 면을 제공할 수 있다. 숙주 세포가 식물 숙주 세포라면, 세포는 본 발명의 또다른 면을 제공하기 위한 식물을 생산하기 위해 사용될 수 있다. 추가의 면은 그러한 식물의 종자 및 자손을 포함한다.
또다른 면은 서열 번호 3, 서열 번호 5, 서열 번호 7, 서열 번호 9, 서열 번호 74, 서열 번호 76, 또는 하나 이상의 보존된 아미노산 치환을 가진 임의의 이전 서열을 함유하는 정제된 폴리펩티드이다.
여전히 또다른 면은 서열 번호 3, 5, 7, 9, 74, 76 및 하나 이상의 보존된 아미노산 치환을 포함한 임의의 이전의 서열로 구성된 군으로부터 선택된 아미노산 서열로부터 10개 이상의 연속적인 아미노산을 함유하는 정제된 면역원성 폴리펩티 드를 제공한다. 또한 이전의 면역원성 폴리펩티드를 특이적으로 결합하는 다중클론 또는 단클론 항체가 제공된다.
하나의 면은 상기 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드 또는 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드의 발현이 허용되는 조건하에 본 발명의 임의의 재조합 핵산 구축물을 포함한 숙주 세포를 배양하는 것을 포함한 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드 또는 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드의 제조 방법을 제공한다.
또다른 면은 숙주 세포를 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함한 재조합 구축물로써 형질전환시키고, 상기 숙주 세포가 재조합 구축물이 없는 숙주 세포에 비하여 변형된 스테롤 조성을 가지도록, 상기 숙주 세포가 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 발현하는 조건하에 상기 숙주 세포를 배양하는 것을 포함한, 숙주 세포의 스테롤 함량을 변형시키는 방법을 제공한다.
부가적인 면은 숙주 세포를 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함한 재조합 구축물로써 형질전환시키고, 상기 숙주 세포가 재조합 구축물이 없는 숙주 세포에 비하여 변형된 스테롤 조성을 가지도록, 상기 숙주 세포가 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 발현하는 조건하에 상기 숙주 세포를 배양하는 것을 포함한, 숙주 세포의 스테롤 함량을 변형시키는 방법이다.
추가의 면은 상기 재조합 구축물의 발현이 상기 재조합 구축물이 없는 동일 한 식물에 비하여 상기 식물의 변형된 스테롤 조성을 초래하는, 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함한 재조합 구축물을 함유하는 식물이다.
또다른 면은 상기 재조합 구축물의 발현이 상기 재조합 구축물이 없는 동일한 식물에 비하여 상기 식물의 변형된 스테롤 조성을 초래하는, 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함한 재조합 구축물을 함유하는 식물을 제공한다.
추가의 면에서 본 발명의 임의의 식물 또는 숙주 세포로부터 수득된 오일이 제공된다.
여전히 또다른 면에서 본 발명의 임의의 식물 또는 숙주 세포를 제공하고, 임의의 공지의 방법에 의해 식물로부터 오일을 추출하는 것을 포함한 변형된 스테롤 조성을 가진 오일의 제조 방법이 제공된다. 또한 이전의 방법에 의해 제조된 오일이 제공된다.
여전히 또다른 면은 숙주 세포를 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함한 재조합 구축물로써 형질전환시키고, 상기 숙주 세포가 재조합 구축물이 없는 숙주 세포에 비하여 변경된 오일 생산을 가지도록, 상기 숙주 세포가 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 발현하는 조건하에 상기 숙주 세포를 배양하는 것을 포함한, 숙주 세포에 의한 오일 생산의 변경 방법을 제공한다.
또다른 면은 숙주 세포를 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티 드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함한 재조합 구축물로써 형질전환시키고, 상기 숙주 세포가 재조합 구축물이 없는 숙주 세포에 비하여 변경된 오일 생산을 가지도록, 상기 숙주 세포가 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 발현하는 조건하에 상기 숙주 세포를 배양하는 것을 포함한, 숙주 세포에 의한 오일 생산의 변경 방법을 제공한다.
또한 상기 재조합 구축물의 발현이 상기 재조합 구축물이 없는 동일한 식물에 비하여 상기 식물의 변경된 오일 생산을 초래하는, 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함한 재조합 구축물을 함유하는 식물이다.
추가의 면에서 상기 재조합 구축물의 발현이 상기 재조합 구축물이 없는 동일한 식물에 비하여 상기 식물의 변경된 오일 생산을 초래하는, 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함한 재조합 구축물을 함유하는 식물이 제공된다.
부가적인 면은 본 발명의 임의의 오일, 식물 또는 숙주 세포를 함유한 식품, 식품 성분 또는 식품 산물; 본 발명의 임의의 오일, 식물 또는 숙주 세포를 함유한 영양 또는 식이 보조제; 및 적당한 희석제, 담체 또는 부형제와 더불어 본 발명의 임의의 오일, 식물 또는 숙주 세포를 함유한 약학 조성물을 제공한다.
부가적인 면은 하기의 설명 및 실시예로부터 명확해질 것이다.
[발명의 상세한 설명]
하기 상세한 설명이 본 발명을 실시할 때 당업자를 돕기 위해 제공된다. 그런 경우에조차, 본원에서 논의된 구현예의 변형 및 변이가 본 발명의 정신 또는 범위를 벗어나지 않고 당업자에 의해 행해질 수 있기 때문에, 상세한 설명이 본 발명을 부당하게 제한하는 것으로 해석되어서는 안된다.
본 출원에 인용된 모든 공개, 특허, 특허 출원 및 다른 참고문헌은, 각 개개의 공개, 특허, 특허 출원 또는 다른 참고문헌이 구체적으로, 개별적으로 참고로 포함되도록 나타난 것처럼, 전체로서 본원에 참고로 포함된다.
본 발명은 레시틴:콜레스테롤 아실전달효소, 특히 식물 유래의 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드 (LCAT)를 코딩하는 분리된 핵산 서열 및 아실 CoA:콜레스테롤 아실전달효소, 특히 식물 유래의 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드 (ACAT)를 코딩하는 분리된 핵산 서열에 관한 것이다. 본원에 사용된 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드는 세포 유래로부터 수득가능한 단백질, 폴리펩티드 또는 펩티드와 같은, 식물 유래의 아미노산 서열을 코딩하는 임의의 핵산 서열을 포함하는데, 이는 스테롤 또는 글리세리드의 아실화를 위해 아실 증여자로서 레시틴 (포스파티딜 콜린)을 이용하여 그러한 단백질, 폴리펩티드 및 펩티드와 더불어 효소 반응 조건하에 에스테르를 형성하는 능력을 증명한다. 본원에 사용된 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드는 세포 유래로부터 수득가능한 단백질, 폴리펩티드 또는 펩티드와 같은, 식물 유래의 아미노산 서열을 코딩하는 임의의 핵산 서열을 포함하는데, 이는 스테롤 또는 글리세리드의 아실화를 위해 아실 증여자로서 아실 CoA를 이용하여 그러한 단백질, 폴리펩티드 및 펩티드와 더불어 효소 반응 조건하에 에스테르를 형성하는 능력을 증 명한다. "효소 반응 조건"은 효소가 기능하도록 허용하는 환경 (즉, 온도, pH, 저해 물질의 결여와 같은 인자)에서 임의의 필요한 조건이 유용한 것을 의미한다.
식물에 적용한 용어 "스테롤"은 트랜스(trans)-신(syn)-트랜스-안티(anti)-트랜스-안티 배열, 예를 들면, 프로토스테로이드 양이온과 유사한 입체화학을 가지면서 전이 상태를 통해 스쿠알렌 옥시드의 고리화에 의해 형성될 수 있고, C-3에 극성기 (히드록실 또는 케토), 고리 시스템에 올(all)-트랜스-안티 입체화학, 및 측쇄 20R 배열을 보유하는 임의의 키랄 테트라시클릭 이소펜테노이드를 언급한다 (Parker, 등 (1992) In Nes 등 저, Regulation of Isopentenoid Metabolism, ACS Symposium Series 제 497호, p. 110; American Chemical Society, Washington, D.C.).
생합성 경로에서 늦게 도입된 특징이기 때문에, 스테롤은 C-5-C-6 이중 결합을 포함하거나 포함하지 않을 수 있다. 스테롤은 C-17 위치에 C8-C10 측쇄를 포함한다.
유일하게 식물에서 발견되는 스테롤에 적용하는 용어 "피토스테롤"은 C-5, 일부의 경우에 C-22 이중 결합을 함유하는 스테롤을 언급한다. 피토스테롤은 추가로 C-24 위치의 메틸 또는 에틸 치환체로써 C-17 측쇄를 알킬화하는 특징이 있다. 주요 피토스테롤은 이에 제한되지 않고, 시토스테롤, 스티그마스테롤, 캄페스테롤, 브라시카스테롤 등을 포함한다. C-24 메틸 또는 에틸 측쇄가 부족한 콜레스테롤이 식물에서 발견되나, 여기에 유일하지 않고, "피토스테롤"이 아니다.
"피토스탄올"은 C-5 및 존재할 경우, C-22 이중 결합이 환원되고, 이에 제한되지 않고, 시토스탄올, 캄페스탄올, 및 22-디히드로브라시카스탄올을 포함하는 피토스테롤의 포화된 형태이다.
"스테롤 에스테르"는 C-3 위치에 히드록실기보다 오히려 지방산 또는 페놀산 부분의 존재의 추가의 특징이 있다.
용어 "스테롤"은 스테롤, 피토스테롤, 피토스테롤 에스테르, 피토스탄올, 및 피토스탄올 에스테르를 포함한다.
용어 "스테롤 화합물"은 스테롤, 피토스테롤, 피토스테롤 에스테르, 피토스탄올, 및 피토스탄올 에스테르를 포함한다.
용어 "피토스테롤 화합물"은 하나 이상의 피토스테롤, 하나 이상의 피토스테롤 에스테르, 또는 이들의 혼합물을 언급한다.
용어 "피토스탄올 화합물"은 하나 이상의 피토스탄올, 하나 이상의 피토스탄올 에스테르, 또는 이의 혼합물을 언급한다.
용어 "글리세리드"는 글리세롤의 지방산 에스테르를 언급하고 모노-, 디-, 및 트리- 아실글리세롤을 포함한다.
본원에 사용된, "재조합 구축물"은 이의 제조 방법 또는 이의 구조에 의해 정의된다. 이의 제조 방법에 관하여, 예를 들면, 하나의 생성물은 하나의 방법에 의해 제조되고, 방법은 예를 들면, 핵산 서열에서 인간 중재, 전형적으로 선택 또는 제조가 관여된 재조합 핵산 기술의 이용이다. 대안적으로, 구조의 면에서, 서로에게 천연적으로 인접하거나 작용하게 연결되지 않은 두 개 이상의 핵산 서열의 융합을 포함한 서열일 수 있다.
본원에 사용된, "조절 서열"은 유전자, 예를 들면, 프로모터, 작동유전자 및 감쇠조절자의 발현을 조절하는데 관련된 DNA 서열을 의미한다. "이종 조절 서열"은 유전자와 천연적으로 연관된 조절 서열과 상이한 것이다.
본원에 사용된, "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호교환하여 사용되고 인산디에스테르 결합에 의해 연결된 두 개 이상의 뉴클레오티드의 중합체를 의미하고 리보뉴클레오티드 또는 데옥시뉴클레오티드로 구성될 수 있다.
본원에 사용된, "서열"은 중합체에서 단량체가 나타나는 선형 순서, 예를 들면, 폴리펩티드에서 아미노산의 순서 또는 폴리뉴클레오티드에서 뉴클레오티드의 순서를 의미한다.
본원에 사용된, "폴리펩티드", "펩티드", 및 "단백질"은 상호교환하여 사용되고 펩티드 결합을 통해 연결된 두 개 이상의 아미노산으로 구성된 화합물을 의미한다.
본원에 사용된, 용어 "상보적인" 또는 "상보성"은 이중 가닥 핵산에서 수소 결합을 통해 결합하는 염기, 퓨린 및 피리미딘의 쌍을 언급한다. 예를 들면, 하기 염기 쌍은 상보적이다: 구아닌 및 시토신; 아데닌 및 티민; 및 아데닌 및 우라실. 본원에 사용된, 용어는 완전한 및 부분적인 상보성을 포함한다.
분리된 단백질, 폴리펩티드 및 폴리뉴클레오티드
본 발명의 제 1 측면은 분리된 LCAT 폴리뉴클레오티드에 관한 것이다. 본 발명의 폴리뉴클레오티드 서열은 서열 목록에 설명된 서열 및 그러한 서열 및 이의 변이체와 밀접하게 관련된 다른 폴리뉴클레오티드 서열 군으로부터 선택된 연역된 아미노산 서열을 가지는 본 발명의 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드를 포함한다.
본 발명은 서열 목록에서 설명된 것처럼, 각 코딩 서열과 전체 길이에 걸쳐 동일한 폴리뉴클레오티드 서열을 제공한다. 본 발명은 또한 성숙한 폴리펩티드 또는 이의 절편에 대한 코딩 서열뿐만 아니라, 선도 또는 분비 서열, 프리-, 프로-, 또는 프리프로- 단백질 서열을 코딩하는 것과 같은, 다른 코딩 서열과 함께 해독틀로 성숙한 폴리펩티드 또는 이의 절편에 대한 코딩 서열을 제공한다. 폴리뉴클레오티드는 또한 이에 제한되지 않지만, 예를 들면 전사되고, 번역되지 않는 서열, 종결 신호, 리보좀 결합 자리, mRNA를 안정화시키는 서열, 인트론, 폴리아데닐화 신호와 같은, 비코딩 5' 및 3' 서열을 포함하는, 비코딩 서열, 및 추가의 아미노산을 코딩하는 추가의 코딩 서열을 포함할 수 있다. 예를 들면, 마커 서열이 융합 폴리펩티드의 정제를 용이하게 하기 위해 포함될 수 있다. 본 발명의 폴리뉴클레오티드는 또한 구조 유전자 및 유전자 발현을 조절하는 천연적으로 관련된 서열을 포함한 폴리뉴클레오티드를 포함한다.
본 발명은 또한 하기 식의 폴리뉴클레오티드를 포함한다:
X-(R1)n-(R2)-(R3)n-Y
(식 중, 5' 말단의 X는 수소이고, 3' 말단의 Y는 수소 또는 금속이고, R1 및 R3는 임의의 핵산 잔기이고, n은 0 내지 3000, 바람직하게는 1 내지 1000 의 정수이 고 R2는 본 발명의 핵산 서열, 특히 서열 목록에 설명된 군, 바람직하게는 서열 번호 2, 4, 6, 8, 10-29, 33, 42-51, 73 및 75로부터 선택된 핵산 서열이다). 식에서, R2는 이의 5' 말단 잔기가 왼쪽에서 R1에 결합하고, 이의 3' 말단 잔기가 오른쪽에서 R3에 결합하도록 배향된다. R이 1 초과인 각 R 군에 의해 나타난 임의의 핵산 잔기의 연속은 이형중합체 또는 단독중합체, 바람직하게는 이형중합체일 수 있다.
본 발명은 또한 본 발명의 폴리펩티드의 변이체를 코딩하는 본원에 기재된 폴리뉴클레오티드의 변이체에 관한 것이다. 본 발명의 폴리뉴클레오티드의 절편인 변이체는 본 발명의 전체 길이 폴리뉴클레오티드를 합성하기 위해 사용될 수 있다. 바람직한 구현예는 본 발명의 폴리펩티드 서열의 5 내지 10, 1 내지 5, 1 내지 3, 2, 1, 또는 0 아미노산 잔기가 임의로 조합하여, 치환되고, 첨가되거나 삭제되는 폴리펩티드 변이체를 코딩하는 폴리뉴클레오티드이다. 특히 바람직한 것은, 폴리뉴클레오티드 또는 폴리펩티드의 성질 또는 활성을 변경하지 않도록하는 잠재성인 치환, 첨가, 및 삭제이다.
본 발명의 추가의 바람직한 구현예는 본 발명의 폴리펩티드를 코딩하는 폴리뉴클레오티드 및 그러한 폴리뉴클레오티드에 상보적인 폴리뉴클레오티드에 대해 전체 길이에 걸쳐 50%, 60%, 또는 70% 이상 동일한 부위를 포함하는 폴리뉴클레오티드이다. 더욱 바람직한 것은 본 발명의 폴리펩티드를 코딩하는 폴리뉴클레오티드 및 거기에 상보적인 폴리뉴클레오티드에 대해 전체 길이에 걸쳐 80% 이상 동일한 부위를 포함하는 폴리뉴클레오티드이다. 이에 대해, 그들의 전체 길이에 걸쳐 90% 이상 동일한 폴리뉴클레오티드가 특히 바람직하고, 95% 이상 동일한 것이 특히 바람직하다. 더욱이, 97% 이상 동일한 것이 매우 바람직하고, 98% 및 99% 이상의 동일성을 가진 것이 특히 매우 바람직하고, 99% 이상인 것이 가장 매우 바람직하다.
바람직한 구현예는 본원에 기재된 방법에 의해 결정된 것처럼, 서열 목록에서 설명된 폴리뉴클레오티드에 의해 코딩되는 성숙한 폴리펩티드와 실질적으로 동일한 생물학적 기능 또는 활성을 보유하는 폴리펩티드를 코딩하는 폴리뉴클레오티드이다.
본 발명은 추가로 상기 기재된 서열에 혼성화하는 폴리뉴클레오티드에 관한 것이다. 특히, 본 발명은 극한 조건하에 상기 기재된 폴리뉴클레오티드에 혼성화하는 폴리뉴클레오티드에 관한 것이다. 극한 혼성화 조건의 예는 50% 포름아미드, 5xSSC (150mM NaCl, 15mM 트리소듐 시트레이트), 50mM 소듐 포스페이트 (pH 7.6), 5x Denhardt 용액, 10% 덱스트란 술페이트, 및 20 ㎍/mL 변성되고, 전단된 연어 정자 DNA를 함유한 용액에서 42℃에서 밤새 인큐베이션에 이은, 대략 65℃에서 0.1x SSC에서 혼성화 지지체를 세척하는 것이다. 0.1X SSC 또는 0.1X SSPE (50℃에서) 의 세척 스트린전시(stringency)하에 혼성화하는 폴리뉴클레오티드가 또한 포함된다. 다른 혼성화 및 세척 조건이 주지되고 [Sambrook, 등, Molecular Cloning: A Laboratory Manual, 제 2판, Cold Spring Harbor, NY (1989), 특히 11장]에 예시된다.
본 발명은 또한 상기 폴리뉴클레오티드 서열 또는 이의 절편의 서열을 가진 프로브로써 극한 혼성화 조건하에 서열 목록에서 설명된 폴리뉴클레오티드 서열에 대한 완전한 유전자를 함유한 적당한 라이브러리를 스크리닝하고; 상기 폴리뉴클레오티드 서열을 분리함으로써 수득될 수 있는 폴리뉴클레오티드 서열로 본질적으로 구성된 폴리뉴클레오티드를 제공한다. 라이브러리의 스크리닝 방법이 당업계에 주지되어 있고, 예를 들면 [Sambrook, 등, Molecular Cloning: A Laboratory Manual, 제2판, Cold Spring Harbor, NY (1989), 특히 8장] 및 [Ausubel 등, Short Protocols in Molecular Biology, 제3판, Wiley and Sons, 1995, 6장]에서 발견될 수 있다. 그러한 폴리뉴클레오티드를 수득하기에 유용한 핵산 서열은 예를 들면, 본원에 기재된 프로브 및 프라이머, 특히 서열 번호 2, 4, 6, 8, 10-29, 33, 42-51, 73 및 75를 포함한다. 상기 서열은 레시틴:콜레스테롤 아실전달효소 및 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 서열에 대해 아라비돕시스, 대두 및 옥수수로부터 수득된 라이브러리를 스크리닝하고, 아실 CoA:콜레스테롤 아실전달효소 및 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 서열에 대해 라이브러리를 스크리닝하는데 특히 유용하다.
본 발명의 폴리뉴클레오티드 검정에 관해 본원에 논의된 바와 같이, 예를 들면, 본 발명의 폴리뉴클레오티드는 RNA, cDNA, 또는 게놈 DNA의 혼성화 프로브로서 이용되어 폴리펩티드를 코딩하는 전체 길이 cDNA 또는 게놈 클론을 분리하고, 서열 목록에서 설명된 폴리뉴클레오티드, 특히 서열 번호 2, 4, 6, 8, 10-29, 33, 42-51, 73 및 75와 높은 서열 유사성을 가지는 다른 유전자의 cDNA 또는 게놈 클론을 분리할 수 있다. 그러한 프로브는 일반적으로 15 염기 이상을 함유할 것이다. 바람직하게는 그러한 프로브는 30 염기 이상을 가질 것이고, 50 염기 이상을 가질 수 있다. 특히 바람직한 프로브는 30 염기 내지 50 염기일 것이다.
서열 목록에서 설명된 폴리뉴클레오티드 서열을 포함하거나 서열에 의해 포함된 각 유전자의 코딩 부위를 올리고뉴클레오티드 프로브를 합성하기 위해 서열 목록에 제공된 DNA 서열을 사용하여 스크리닝함으로써 분리할 수 있다. 본 발명의 유전자의 것과 서열 상보성을 가지는 표지된 올리고뉴클레오티드를 이어서 cDNA, 게놈 DNA 또는 mRNA 라이브러리를 스크리닝하는데 이용하여 프로브에 혼성화하는 라이브러리의 일원을 확인할 수 있다. 예를 들면, LCAT EST 서열에 해당하는 합성 올리고뉴클레오티드를 제조한다. 올리고뉴클레오티드는 중합효소 연쇄반응 (PCR) 기술에서 프라이머로서 이용되어 LCAT 유전자의 5' 및 3' 말단 서열을 수득한다. 대안적으로, 저 축중 올리고뉴클레오티드가 특정 LCAT 펩티드로부터 제조될 수 있을 경우, 그러한 프로브는 직접 사용되어 LCAT 유전자 서열에 대한 유전자 라이브러리를 스크리닝할 수 있다. 특히, 파아지 벡터내에서 cDNA 라이브러리의 스크리닝은 낮은 수준의 배경 혼성화로 인한 그러한 방법에 유용하다.
전형적으로, 핵산 프로브의 사용으로부터 수득될 수 있는 LCAT 서열은 표적 LCAT 서열 및 프로브로서 사용된 코딩 서열 사이에 60-70% 서열 동일성을 보여 줄 것이다. 그러나, 50-60% 정도의 적은 서열 동일성을 가진 긴 서열이 또한 수득될 수 있다. 핵산 프로브는 핵산 서열의 긴 절편일 수 있거나, 또한 짧은 올리고뉴클레오티드 프로브일 수 있다. 긴 핵산 절편이 프로브로서 사용될 경우에 (약 100bp 초과), 낮은 스트린전시에서 스크리닝하여 표적 시료로부터 프로브로서 사용된 서열과 20-50% 편차 (즉, 50-80% 서열 유사성)를 가지는 서열을 수득할 수 있다. 올리고뉴클레오티드 프로브는 LCAT 효소를 코딩하는 전체 핵산 서열보다 상당히 짧을 수 있으나, 약 10 이상이어야 하고, 바람직하게는 약 15 이상, 더욱 바람직하게는 약 20 뉴클레오티드 이상이어야 한다. 더 짧은 부위가 긴 부위와 반대로 사용될 경우에, 더 높은 정도의 서열 동일성이 요구된다. 그리하여 다른 관련된 LCAT 유전자를 검출하고 회수하기 위한 올리고뉴클레오티드 프로브를 고안하기 위해 매우 보존된 아미노산 서열 부위를 확인하는 것이 바람직할 수 있다. 더 짧은 프로브가 특히 매우 보존된 서열이 확인될 수 있을 경우에, 종종 중합효소 연쇄반응 (PCR)에 특히 유용하다 (Gould, 등, PNAS USA (1989) 86:1934-1938 참조).
본 발명의 또다른 면은 LCAT 폴리펩티드에 관한 것이다. 그러한 폴리펩티드는 서열 목록에서 설명된 분리된 폴리펩티드뿐만 아니라, 폴리펩티드 및 이의 절편, 특히 LCAT 활성을 나타내는 폴리펩티드 및 또한 서열 목록에서 설명된 서열 군으로부터 선택된 폴리펩티드 서열과 50%, 60% 또는 70% 이상의 동일성, 바람직하게는 80% 이상 동일성, 더욱 바람직하게는 90% 이상 동일성, 가장 바람직하게는 95% 이상의 동일성을 가지는 폴리펩티드를 포함하고, 또한 바람직하게는 30개 이상의 아미노산, 더욱 바람직하게는 50개 이상의 아미노산을 포함하는, 그러한 폴리펩티드의 부분을 포함한다.
당업계에서 잘 이해되는, "동일성"은 서열을 비교함으로써 결정되는, 두 개 이상의 폴리펩티드 서열 또는 두 개 이상의 폴리뉴클레오티드 서열 사이의 관계이 다. 당업계에서, "동일성"은 또한 일련의 그러한 서열 사이의 부합에 의해 결정된, 폴리펩티드 또는 폴리뉴클레오티드 서열 사이의 서열 관련성의 정도를 의미한다. "동일성"은 이에 제한되지 않고, [Computational Molecular Biology, Lesk, A.M., 저, Oxford University Press, New York (1988); Biocomputing: Informatics 및 Genome Projects, Smith, D.W., 저, Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A.M. 및 Griffin, H.G. 저, Humana Press, New Jersey (1994); Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press (1987); Sequence Analysis Primer, Gribskov, M. 및 Devereux, J., 저, Stockton Press, New York (1991); 및 Carillo, H., 및 Lipman, D., SIAM J Applied Math, 48:1073(1988)]에 기재된 것을 포함한, 공지의 방법에 의해 쉽게 계산될 수 있다. 동일성을 결정하기 위한 방법은 시험 서열 사이의 가장 큰 부합을 제공하도록 고안된다. 더욱이, 동일성을 결정하기 위한 방법이 시판되는 프로그램으로 정리되어 있다. 두 서열 사이의 동일성을 결정하기 위해 사용될 수 있는 컴퓨터 프로그램은 이에 제한되지 않고, GCG를 포함한다 (Devereux, J., 등, Nucleic Acids Research 12(1):387 (1984); 한벌의 5 개 BLAST 프로그램, 3개는 핵산 서열 조회용으로 고안되고 (BLASTN, BLASTX, 및 TBLASTX) 2개는 단백질 서열 조회용으로 고안된다 (BLASTP 및 TBLASTN) (Coulson, Trends in Biotechnology, 12:76-80 (1994); Birren, 등, Genome Analysis, 1:543-559(1997)). BLAST X 프로그램은 NCBI 및 다른 공급원으로부터 시판된다 (BLAST Manual, Altschul, S., 등, NCBI NLM NIH, Bethesda, MD 20894; Altschul, S., 등, J. Mol. Biol., 215:403-410 (1990)). 주지의 Smith Waterman 알고리즘이 또한 동일성을 결정하기 위해 사용될 수 있다.
폴리펩티드 서열 비교를 위한 변수는 전형적으로 하기를 포함한다:
알고리즘: Needleman 및 Wunsch, J. Mol. Biol. 48:443-453 (1970)
비교 매트릭스: Hentikoff and Hentikoff 로부터의 BLOSSUM62, Proc. Natl. Acad. Sci. USA 89:10915-10919 (1992)
간격 벌점(gap penalty): 12
간격 길이 벌점: 4
이러한 변수와 함께 사용될 수 있는 프로그램이 위스콘신주 매디슨의 유전학 컴퓨터 그룹의 "간격" 프로그램으로서 시판된다. 말단 간격에 대한 벌점이 없는 상기 변수는 펩티드 비교를 위한 디폴트(default) 변수이다.
폴리뉴클레오티드 서열 비교를 위한 변수는 하기를 포함한다:
알고리즘: Needleman 및 Wunsch, J. Mol. Biol. 48:443-453 (1970)
비교 매트릭스: 부합=+10; 비부합=0
간격 벌점: 50
간격 길이 벌점: 3
이러한 변수와 함께 사용될 수 있는 프로그램이 위스콘신주 매디슨의 유전학 컴퓨터 그룹의 "간격" 프로그램으로서 시판된다. 상기 변수는 핵산 서열 비교를 위한 디폴트 변수이다.
본 발명은 또한 하기 식의 폴리펩티드를 포함한다:
X-(R1)n-(R2)-(R3)n-Y
(식 중, 아미노 말단의 X는 수소이고, 카르복시 말단의 Y는 수소 또는 금속이고, R1 및 R3는 임의의 아미노산 잔기이고, n은 0 내지 1000의 정수이고, R2는 본 발명의 아미노산 서열, 특히 서열 목록에 설명된 군, 바람직하게는 서열 번호 3, 5, 7, 9, 74 및 76으로부터 선택된 아미노산 서열이다). 식에서, R2는 이의 아미노 말단 잔기가 왼쪽에서 R1에 결합하고, 이의 카르복시 말단 잔기가 오른쪽에서 R3에 결합하도록 배향된다. R이 1 초과인 각 R 군에 의해 나타난 임의의 아미노산 잔기의 연속은 이형중합체 또는 단독중합체, 바람직하게는 이형중합체일 수 있다.
본 발명의 폴리펩티드는 서열 번호 2, 4, 6, 8, 73 및 75에 포함된 서열 군으로부터 선택된 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 분리된 폴리펩티드를 포함한다.
본 발명의 폴리펩티드는 성숙 단백질 또는 융합 단백질의 부분일 수 있다.
폴리펩티드의 절편 및 변이체는 또한 본 발명의 부분으로 고려된다. 절편은 이전에 기재된 폴리펩티드의 아미노산 서열의 부분과는 전적으로 동일하나 전체와는 동일하지 않은 아미노산 서열을 가지는 변이체 폴리펩티드이다. 절편은 "자유로이 서 있는" 또는 이의 절편이 부분 또는 부위, 가장 바람직하게는 단일 연속 부위를 형성하는 큰 폴리펩티드 내에 포함될 수 있다. 바람직한 절편은 유사한 활성 또는 개선된 활성 또는 감소된 활성을 가지는 것을 포함한, 본 발명의 폴리펩티드의 활성을 중재하는 그러한 절편인 생물학적으로 활성인 절편이다. 또한 동 물, 특히 인간에서 항원성 또는 면역원성인 폴리펩티드 및 폴리펩티드 절편, 및 항원 절편을 특이적으로 결합하는 다중클론 또는 단클론 항체가 포함된다. 하나의 바람직한 구현예에서, 그러한 항원성 또는 면역원성 절편은 본원에 개시된 아미노산 서열의 10개 이상의 연속적인 아미노산 또는 한개 이상의 보존된 아미노산 치환을 가진 그러한 서열을 포함한다. 부가적인 구현예에서, 그러한 항원성 또는 면역원성 절편은 본원에 개시된 아미노산 서열의 15개 이상, 25개 이상, 50개 이상 또는 100개 이상의 연속적인 아미노산 또는 한개 이상의 보존된 아미노산 치환을 가진 그러한 서열을 포함한다. 폴리펩티드 및 담체 분자에 접합된 폴리펩티드로부터 항체의 제조 방법이 당업계에 주지되어 있고, 예를 들면 [Ausubel 등, Short Protocols in Molecular Biology, 제3판, Wiley & Sons, 1995, 특히 11장]에서 발견될 수 있다.
폴리펩티드의 변이체는 또한 보존된 아미노산 치환, 유사한 특성을 가진 또다른 것에 의한 잔기의 치환에 의해 서열 목록에서 설명된 서열과 다른 폴리펩티드를 포함한다. 당업자는 펩티드, 폴리펩티드, 또는 단백질의 아미노산 서열에서 변형이 원래 아미노산 서열과 비교하여 동등하거나 월등한 기능적 특성을 나타내는 동등한, 또는 아마도 개선된, 2세대 펩티드 등을 초래할 것이라고 인식한다. 따라서, 본 발명은 그러한 변형된 아미노산 서열을 포함한다. 변경은 그러한 변형에 의해 생성된 펩티드 서열이 본원에 개시된 천연적으로 발생하는 짝 서열과 실질적으로 동일한 기능적 성질을 가진다면, 아미노산 삽입, 삭제, 치환, 절단, 융합, 서브유닛 서열의 셔플링(shuffling) 등을 포함할 수 있다.
그러한 변화를 만들 때 고려될 수 있는 하나의 인자는 아미노산의 히드로파티 지수 (hydropathic index)이다. 단백질에 상호작용하는 생물학적 기능을 부여할 때 히드로파티 아미노산 지수의 중요성은 Kyte 및 Doolittle에 의해 논의된다 (J. Mol. Biol., 157:105-132, 1982). 아미노산의 상대적인 히드로파티 특성이 생성된 단백질의 2차 구조에 기여한다고 받아 들여진다. 이것은 차례로, 단백질과 효소, 기질, 수용체, DNA, 항체, 항원 등과 같은 분자의 상호작용에 영향을 미친다.
이의 소수성 및 전하 특성에 기초하여, 각 아미노산은 하기와 같이 히드로파티 지수가 할당된다:이소류신 (+4.5); 발린(+4.2); 류신 (+3.8); 페닐알라닌 (+2.8); 시스테인/시스틴 (+2.5); 메티오닌 (+1.9); 알라닌 (+1.8); 글리신 (-0.4); 트레오닌 (-0.7); 세린 (-0.8); 트립토판 (-0.9); 티로신 (-1.3); 프롤린 (-1.6); 히스티딘 (-3.2); 글루타메이트/글루타민/아스파르테이트/아스파라긴 (-3.5); 리신 (-3.9); 및 아르기닌 (-4.5).
당업계에 공지된 바와 같이, 펩티드 또는 단백질에서 특정 아미노산을 유사한 히드로파티 지수 또는 득점을 가지는 다른 아미노산으로 대체할 수 있고, 유사한 생물학적 활성, 즉 여전히 생물학적 기능성을 보유하는 결과되는 펩티드 또는 단백질을 생산할 수 있다. 그러한 변화시에, ±2 내의 히드로파티 지수를 가지는 아미노산이 상호간에 치환되는 것이 바람직하다. 더욱 바람직한 치환은 아미노산이 ±1 내의 히드로파티 지수를 가지는 것이다. 가장 바람직한 치환은 아미노산이 ±0.5 내의 히드로파티 지수를 가지는 것이다.
마찬가지로 아미노산은 또한 친수성 기초로 치환될 수 있다. 미국 특허 제 4,554,101호에는 이의 인접한 아미노산의 친수성에 의해 좌우되는, 단백질의 가장 큰 국부 평균 친수성이 단백질의 생물학적 성질과 관련된다는 것이 개시된다. 하기 친수성 값이 아미노산에 할당된다: 아르기닌/리신 (+3.0); 아스파르테이트/글루타메이트 (+3.0±1); 세린 (+0.3); 아스파라긴/글루타민 (+0.2); 글리신 (0); 트레오닌 (-0.4); 프롤린 (-0.5±1); 알라닌/히스티딘 (-0.5); 시스테인 (-1.0); 메티오닌 (-1.3); 발린 (-1.5); 류신/이소류신 (-1.8); 티로신 (-2.3); 페닐알라닌 (-2.5); 및 트립토판 (-3.4). 그리하여, 펩티드, 폴리펩티드, 또는 단백질에서 하나의 아미노산은 유사한 친수성 득점을 가지는 또다른 아미노산에 의해 치환될 수 있고, 여전히 유사한 생물학적 활성, 즉, 여전히 올바른 생물학적 기능을 보유하는 결과되는 단백질을 생산할 수 있다. 그러한 변화시에, ±2 내의 히드로파티 지수를 가지는 아미노산이 상호간에 바람직하게 치환되고, ±1 내의 것이 더욱 바람직하고, ±0.5 내의 것이 가장 바람직하다.
상기에 요약된 바와 같이, 본 발명의 펩티드에서 아미노산 치환은 아미노산 측쇄 치환체의 상대적인 유사성, 예를 들면, 이의 소수성, 친수성, 전하, 크기 등에 기초할 수 있다. 본 펩티드 등내에 잠재성 변화를 초래하는 보존된 아미노산 변화를 생성하기 위해 다양한 이전의 특성을 고려하는 전형적인 치환은 천연적으로 발생하는 아미노산이 속하는 부류의 다른 일원으로부터 선택될 수 있다. 아미노산을 하기 4가지 군으로 분류할 수 있다: (1) 산성 아미노산; (2) 염기성 아미노산; (3) 중성 극성 아미노산; 및 (4) 중성 비극성 아미노산. 이러한 다양한 군내 에 대표적인 아미노산은 이에 제한되지 않고, 하기를 포함한다: (1) 아스파르트산 및 글루탐산과 같은 산성 (음전하의) 아미노산; (2) 아르기닌, 히스티딘, 및 리신과 같은 염기성 (양전하의) 아미노산; (3) 글리신, 세린, 트레오닌, 시스테인, 시스틴, 티로신, 아스파라긴, 및 글루타민과 같은 중성 극성 아미노산; 및 (4) 알라닌, 류신, 이소류신, 발린, 프롤린, 페닐알라닌, 트립토판, 및 메티오닌과 같은 중성 비극성 아미노산. 유리하다고 기대되지 않는 변화가 또한, 이것이 기능성 서열의 생성을 초래한다면 유용할 수 있다는 것이 주목되어야 한다.
본 발명의 폴리펩티드의 절편인 변이체가 펩티드 합성에 의해 해당하는 전체 길이 폴리펩티드를 제조하기 위해 사용될 수 있다. 그러므로, 이러한 변이체는 본 발명의 전체 길이 폴리펩티드를 제조하기 위한 중간물질로서 사용될 수 있다.
본 발명의 폴리뉴클레오티드 및 폴리펩티드는 추가로 본원에 논의된 바와 같이, 예를 들면, 식물세포, 동물세포, 효모세포, 세균, 박테리오파아지, 및 바이러스와 같은, 숙주세포의 형질전환에서 사용될 수 있다.
본 발명은 또한 성숙 단백질외에 부가적인 아미노 또는 카르복시 말단 아미노산, 또는 성숙 폴리펩티드내의 아미노산 (예를 들면, 단백질의 성숙 형태가 하나 이상의 폴리펩티드 사슬을 가질 경우)인 폴리펩티드를 코딩하는 폴리뉴클레오티드를 제공한다. 그러한 서열은 예를 들면, 전구체에서 성숙 형태로의 단백질의 프로세싱에 역할을 할 수 있고, 단백질 수송을 허용하고, 단백질 반감기를 짧게 하거나 길게 할 수 있거나, 검정 또는 제조에서 단백질의 조작을 용이하게 할 수 있다. 세포 효소가 성숙 단백질로부터 임의의 부가적인 아미노산을 제거하기 위해 사용 될 수 있다고 생각된다.
하나 이상의 프로서열(prosequence)과 융합된 폴리펩티드의 성숙 형태를 가지는, 전구체 단백질은 폴리펩티드의 불활성 형태일 수 있다. 불활성 전구체는 일반적으로 프로서열이 제거될 경우 활성화된다. 프로서열의 일부 또는 전부가 활성화전에 제거될 수 있다. 그러한 전구체 단백질은 일반적으로 프로단백질이라 불린다.
발현 구축물의 제조 및 이용 방법
관심 있는 것은 숙주 세포내에서 본 발명의 아실전달효소 서열의 전사 또는 전사 및 번역(발현)을 이끌기 위한 재조합 DNA 구축물에서 뉴클레오티드 서열의 용도이다. 특별히 관심 있는 것은 숙주 식물 세포내에서 본 발명의 아실전달효소 서열의 전사 또는 전사 및 번역(발현)을 이끌기 위한 재조합 DNA 구축물에서 본 발명의 폴리뉴클레오티드 서열의 용도이다.
발현 구축물은 일반적으로 본 발명의 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드 또는 아실 CoA:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 핵산 서열에 작동가능하게 연결된 숙주 세포내에서 기능성인 조절 서열 및 숙주 식물 세포내에서 기능성인 전사 종결 부위를 포함한다. 특히 관심 있는 것은 식물 숙주 세포내에서 기능성인 프로모터 (또한 전사 개시 부위로 일컬어짐)의 용도이다.
당업자는 식물 세포에서 기능성이며 구성성, 유도성, 조직 특이성, 기관 특이성, 발생적으로 조절된 및 환경적으로 조절된 프로모터를 포함하여 문헌에 기재 되어 있는 수 많은 프로모터가 존재한다는 것을 인식한다. 엽록체 및 색소체 특이성 프로모터, 엽록체 또는 색소체 기능성 프로모터, 및 엽록체 또는 색소체 작동가능한 프로모터가 또한 기대된다.
한 세트의 프로모터는 대부분의 식물 기관에서 고 수준의 발현을 낳는 CaMV35S 또는 FMV35S 프로모터와 같은 구성 프로모터이다. CaMV35S 및 FMV35S 프로모터의 향상된 또는 중복된 판이 본 발명의 실시에서 유용하다 (Odell, 등 (1985) Nature 313:810-812; Rogers, 미국 특허 번호 5,378,619). 다른 유용한 구성 프로모터는 이에 제한되지 않고, 만노파인 합성효소 (mas) 프로모터, 노팔린 합성효소 (nos) 프로모터, 및 옥토파인 합성효소 (ocs) 프로모터를 포함한다.
유용한 유도성 프로모터는 열 충격 프로모터 (Ou-Lee 등 (1986) Proc. Natl. Acad. Sci. USA 83:6815; Ainley 등 (1990) Plant Mol. Biol. 14:949), 시금치 아질산염 환원효소 유전자로부터 유도된 질산염 유도성 프로모터 (Back 등 (1991) Plant Mol. Biol. 17:9), 호르몬 유도성 프로모터 (Yamaguchi-Shinozaki 등 (1990) Plant Mol. Biol. 15:905; Kares 등 (1990) Plant Mol. Biol. 15:905), 및 RuBP 카르복시화효소의 작은 서브유닛 및 LHCP 유전자 군과 연관된 광 유도성 프로모터 (Kuhlemeier 등 (1989) Plant Cell 1:471; Feinbaum 등 (1991) Mol. Gen. Genet. 226:449; Weisshaar 등 (1991) EMBO J. 10:1777; Lam 및 Chua (1990) Science 248: 471; Castresana 등 (1988) EMBO J. 7:1929; Schulze-Lefert 등 (1989) EMBO J. 8:651)를 포함한다.
게다가, 잎, 줄기, 뿌리, 괴경, 종자, 과육 등과 같은, 식물의 특정 조직에 서 아실전달효소 유전자의 발현을 야기하는 것이 또한 바람직할 수 있고, 선택된 프로모터는 원하는 조직 및 발생적 특이성을 가져야 한다. 유용한 조직 특이성, 발생적으로 조절된 프로모터의 예는 E4 프로모터 (Cordes 등 (1989) Plant Cell 1:1025), E8 프로모터 (Deikman 등 (1988) EMBO J. 7:3315), 키위 악티니딘 프로모터 (Lin 등 (1993) PNAS 90:5939), 2A11 프로모터 (Houck 등, 미국 특허 4,943,674), 및 토마토 pZ130 프로모터 (미국 특허 5,175,095 및 5,530,185)와 같은 과육 특이성 프로모터; β-콘글리시닌 7S 프로모터 (Doyle 등 (1986) J. Biol. Chem. 261:9228; Slighton 및 Beachy (1987) Planta 172:356), 및 종자 특이성 프로모터 (Knutzon 등 (1992) Proc. Natl. Acad. Sci. USA 89:2624; Bustos 등 (1991) EMBO J. 10:1469; Lam 및 Chua (1991) J. Biol. Chem. 266: 17131; Stayton 등 (1991) Aust. J. Plant Physiol. 18:507)를 포함한다. 과육 특이성 유전자 조절은 미국 특허 5,753,475에 논의된다. 다른 유용한 종자 특이성 프로모터는 이에 제한되지 않고, 나핀, 파세올린, 제인, 대두 트립신 저해제, 7S, ADR12, ACP, 스테아로일-ACP 탈포화효소, 올레오신, 라스퀘렐라 (Lasquerella) 히드록실라아제, 및 보리 알도오스 환원효소 프로모터 (Bartels (1995) Plant J. 7:809-822), EA9 프로모터 (미국 특허 5,420,034), 및 Bce4 프로모터 (미국 특허 5,530,194)를 포함한다. 유용한 배 특이성 프로모터는 옥수수 글로불린 1 및 올레오신 프로모터를 포함한다. 유용한 배젖 특이성 프로모터는 벼 글루텔린-1 프로모터, 낮은 pI β아밀라아제 유전자 (Amy32b) (Rogers 등 (1984) J. Biol. Chem. 259:12234), 높은 pI β아밀라아제 유전자 (Amy64) (Khurseed 등 (1988) J. Biol. Chem. 263:18953) 에 대한 프로모터, 보리 티올 프로테아제 유전자 ("알류레인(Aleurain)")에 대한 프로모터 (Whittier 등 (1987) Nucleic Acids Res. 15:2515)를 포함한다.
특히 관심 있는 것은 식물 종자 조직에서 우선적으로 발현되는 전사 개시 부위로부터 본 발명의 핵산 서열의 발현이다. 그러한 종자 우선적인 전사 개시 서열의 예는 식물 저장 단백질 유전자를 코딩하는 서열 또는 오일종자에서 지방산 생합성에 관련된 유전자로부터 유도된 서열을 포함한다. 그러한 프로모터의 예는 나핀 (Kridl 등, Seed Sci. Res. 1:209:219 (1991)), 파세올린, 제인, 대두 트립신 저해제, ACP, 스테아로일-ACP 탈포화효소, β콘글리시닌의 대두 α' 서브유닛 (soy 7s, (Chen 등, Proc. Natl. Acad. Sci., 83:8560-8564 (1986))) 및 올레오신과 같은 그러한 유전자로부터의 5' 조절 부위를 포함한다. 종자 특이성 유전자 조절은 EP 0 255 378 B1 및 미국 특허 5,420,034 및 5,608,152에서 논의된다. 프로모터 하이브리드가 전사 활성을 증가시키기 위해(Hoffman, 미국 특허 제 5,106,739호), 또는 원하는 전사 활성 및 조직 특이성을 결합하기 위해 또한 구축될 수 있다.
LCAT에 특정 준세포(subcellular) 구획, 예를 들면, 미토콘드리아, 소포체, 액포, 엽록체 또는 다른 색소체 구획을 부여하는 단백질의 배치를 이끄는 것이 유리할 수 있다. 예를 들면, 본 발명의 관심 있는 유전자가 엽록체와 같은, 색소체를 표적으로 하는 곳에서, 발현을 위해, 구축물은 또한 유전자를 색소체로 이끄는 서열을 사용할 것이다. 그러한 서열은 본원에 엽록체 통과 펩티드 (CTP) 또는 색소체 통과 펩티드 (PTP)라 언급된다. 이러한 방식으로, 관심 있는 유전자가 직접 색소체 내로 삽입되지 않는 곳에서, 발현 구축물은 부가적으로 관심 있는 유전자를 색소체로 이끄는 통과 펩티드를 코딩하는 유전자를 포함할 것이다. 엽록체 통과 펩티드는 관심 있는 유전자로부터 유도될 수 있거나, CTP를 가지는 이종 서열로부터 유도될 수 있다. 그러한 통과 펩티드는 당업계에 공지되어 있다. 예를 들면, [Von Heijne 등 (1991) Plant Mol. Biol. Rep. 9:104-126; Clark 등 (1989) J. Biol. Chem. 264:17544-17550; della-Cioppa 등 (1987) Plant Physiol. 84:965-968; Romer 등 (1993) Biochem. Biophys. Res Commun. 196:1414-1421; 및, Shah 등 (1986) Science 233:478-481]을 참조.
의도한 용도에 의존하면서, 구축물은 전체 LCAT 단백질, LCAT 단백질의 부분, 전체 ACAT 단백질, 또는 ACAT 단백질의 부분을 코딩하는 핵산 서열을 포함할 수 있다. 예를 들면, 제시된 LCAT 또는 ACAT 단백질의 안티센스 저해가 목적인 곳에서, 전체 서열은 요구되지 않는다. 더욱이, 구축물에 사용된 LCAT 또는 ACAT 서열이 프로브로서 사용될 의도인 곳에서, 단지 LCAT 또는 ACAT 코딩 서열의 단지 특정 부분, 예를 들면 매우 보존된 부위를 코딩하는 것으로 발견된 서열을 함유한 구축물을 제조하는 것이 유리할 수 있다.
당업자는 숙주 세포에 내재하는 서열의 발현 저해에 대한 다양한 방법이 존재하는 것을 인식할 것이다. 그러한 방법은 이에 제한되지 않고, 안티센스 억제 (Smith, 등 (1988) Nature 334:724-726), 동시 억제 (Napoli, 등 (1989) Plant Cell 2:279-289), 리보자임 (PCT 공개 WO 97/10328), 및 센스 및 안티센스의 조합 (Waterhouse, 등 (1998) Proc. Natl. Acad. Sci. USA 95:13959-13964)을 포함한다. 숙주 세포에서 내재하는 서열의 억제 방법은 전형적으로 억제되는 서열의 부분 이 상의 전사 또는 전사 및 번역을 사용한다. 그러한 서열은 내재하는 서열의 코딩뿐만 아니라 비코딩 부위와 유사할 수 있다.
조절 전사체 종결 부위는 또한 본 발명의 식물 발현 구축물에서 제공될 수 있다. 전사체 종결 부위는 디아실글리세롤 아실전달효소를 코딩하는 DNA 서열에 의해 제공될 수 있거나 상이한 유전자 공급원으로부터 유도된 편리한 전사 종결부위, 예를 들면, 전사체 개시 부위와 천연적으로 연관된 전사체 종결 부위일 수 있다. 당업자는 식물 세포에서 전사를 종결할 수 있는 임의의 편리한 전사체 종결 부위가 본 발명의 구축물에서 사용될 수 있다는 것을 인식할 것이다.
대안적으로, 숙주 식물 세포 색소체로부터 직접 LCAT 또는 ACAT 서열의 발현을 이끄는 구축물을 제조할 수 있다. 그러한 구축물 및 방법이 당업계에 공지되어 있고, 일반적으로 예를 들면, [Svab, 등 (1990) Proc. Natl. Acad. Sci. USA 87:8526-8530] 및 [Svab 및 Maliga (1993) Proc. Natl. Acad. Sci. USA 90:913-917] 및 미국 특허 제 5,693,507호에 기재된다.
발현 구축물을 포함한 재조합 DNA 구축물이 도입된 식물 세포, 조직, 기관, 또는 식물은 형질전환된(transformed), 트랜스펙션된(transfected), 또는 트랜스제닉(transgenic)으로 고려된다. 트랜스제닉 (transgenic) 또는 형질전환된(transformed) 세포 또는 식물은 또한 세포 또는 식물의 자손 및 교배에서 부모로서 그러한 트랜스제닉 식물을 사용하고, LCAT 핵산 서열의 존재로 인한 변경된 표현형을 나타내는 육종 프로그램으로부터 제조된 자손을 포함한다.
이의 증가된 또는 감소된 발현을 위해 관심 있는 DNA 서열로서 식물 LCAT 를 가지는 식물 발현 또는 전사 구축물은 다양한 식물 생활, 특히 식용 및 산업적 용도의 식물성 오일의 제조에 관련된 식물 생활에 대해 사용될 수 있다. 특히 가장 바람직한 것은 온대 오일종자 작물이다. 관심 있는 식물은 이에 제한되지 않고, 평지의 씨 (캐놀라 및 고급 에루크산 변종), 해바라기, 잇꽃, 목화, 대두, 땅콩, 코코넛 및 오일 종려, 및 옥수수를 포함한다. 재조합 구축물을 숙주 세포내로 도입하는 방법에 의존하면서, 다른 DNA 서열이 요구될 수 있다. 중요하게, 본 발명은 쌍자엽 및 단자엽 유사 종에 적용가능하고 신규 및/또는 개선된 형질전환 및 조절 기술에 쉽게 적용가능할 것이다.
특히 관심 있는 것은, 이에 제한되지 않고, 변형된 함량의 지질 및/또는 스테롤 에스테르를 가진 잎, 줄기, 뿌리, 생식기관, 및 종자를 포함한 식물 또는 식물 부분을 제조하고 그러한 식물에 의한 오일 생산을 변경하기 위한 식물에서 식물 LCAT 및 ACAT 구축물의 용도이다.
본 발명에서 특히 관심 있는 것은, 종자의 스테롤 함량을 증가시키기 위해 LCAT 서열과 함께 결합한 ACAT 유전자의 용도이다. 그리하여, 오일종자 작물에서 ACAT 및 LCAT를 코딩하는 핵산 서열의 과발현은 식물 조직에서 스테롤 수준을 증가시키고/증가시키거나 오일 생산을 증가시키기 위해 본 발명에서 용도를 발견할 수 있다.
특히 식물이 선호하는 서열을 제공하는 것이 바람직한 곳에서, 유전자 서열이 완전히 또는 부분적으로 합성될 수 있다고 생각된다. 그리하여, 원하는 구조 유전자의 모든 또는 부분을 (LCAT 또는 ACAT 단백질을 코딩하는 유전자의 부분) 선 택된 숙주가 선호하는 코돈을 사용하여 합성할 수 있다. 숙주가 선호하는 코돈은 예를 들면, 원하는 숙주 종에서 발현되는 단백질에서 가장 흔히 사용되는 코돈으로부터 결정될 수 있다.
당업자는 항체 제제, 핵산 프로브 (DNA 및 RNA)등이 제조될 수 있고, "유사한" 또는 "관련된" 서열을 다양한 식물 공급원으로부터 스크리닝하고 회수하는데 사용할 수 있다는 것을 쉽게 인식할 것이다. 서열의 동일성이 존재할 경우에 유사한 서열이 발견되고, 이는 서열 정보, 핵산 또는 아미노산의 비교시, 또는 공지의 LCAT 및 후보 공급원 사이의 혼성화 반응을 통해 결정될 수 있다. Glu/Asp, Val/Ile, Ser/Thr, Arg/Lys 및 Gln/Asn 과 같은 보존된 변화가 또한 서열 유사성을 결정할 때 고려될 수 있다. 아미노산 서열은 두 개의 완전한 성숙 단백질 사이에 25%만큼이나 적은 서열 동일성에 의해 유사하다고 고려된다 (일반적으로, (Doolittle, R.F., OF URFS 및 ORFS (University Science Books, CA, 1986)을 참조).
그리하여, 본원에 제공된 특정 서열로부터 다른 LCAT 가 수득될 수 있다. 더욱이, 예시된 LCAT 및 ACAT 서열 및 그러한 예시된 서열의 사용을 통해 수득되는 서열로부터 합성 단백질 모델링에 대한 변형된 아미노산 서열 및 출발 물질을 포함한, 천연 및 합성 서열을 수득할 수 있는 것이 명백할 것이다. 변형된 아미노산 서열은 이러한 서열이 부분적으로 또는 전적으로 합성되든지 간에, 돌연변이되고, 잘리고, 증가되는 등의 서열을 포함한다. 식물 제제로부터 실제로 정제되거나 거기에 동일하거나 동일한 단백질을 코딩하는 서열은, 단백질 또는 서열을 수득하기 위해 사용된 방법에 무관하게, 동일하게 천연유래로 고려된다.
면역학적 스크리닝을 위해, 단백질에 대한 항체는 정제된 단백질 또는 이의 부분으로써 토끼 또는 마우스를 주입함으로써 제조될 수 있고, 그러한 항체 제조 방법은 당업자에 주지되어 있다. 전형적으로 다중클론 항체가 유전자 분리에 더욱 유용하지만, 단클론 또는 다중클론 항체가 제조될 수 있다. 코딩된 단백질에 대한 항체와 교차반응에 의해 결정된 바와 같이, 관련된 단백질이 원하는 식물 종의 조 추출물에 존재하는지를 결정하기 위해 웨스턴 분석을 수행할 수 있다. 교차반응성이 관찰될 경우, 관련된 단백질을 코딩하는 유전자를, 원하는 식물 종을 나타내는 발현 라이브러리를 스크리닝함으로써 분리한다. 발현 라이브러리는 [Sambrook, 등 (Molecular Cloning: A Laboratory Manual, 제 2판 (1989) Cold Spring Harbor Laboratory, Cold Spring Harbor, New York)]에 기재된 바와 같이, 람다 gt11을 포함한 다양한 시판되는 벡터내에 구축될 수 있다.
아실전달효소로서 확인된 핵산 서열에 의해 코딩된 단백질의 활성 및 특이성을 확인하기 위해, 시험관내 검정이 바큘로바이러스(baculovirus) 발현 시스템을 사용한 곤충 세포 배양물에서 수행된다. 그러한 바큘로바이러스 발현 시스템이 당업계에 공지되어 있고, 그것의 전부가 참고로 본원에 포함된 [Lee, 등 미국 특허 제 5,348,886호]에 기재된다.
게다가, 다른 발현 구축물을 상이한 발현 시스템을 이용한 단백질 활성을 검정하기 위해 제조할 수 있다. 그러한 발현 구축물을 효모 또는 원핵 숙주내로 형질전환하여 아실전달효소 활성에 대해 검정할 수 있다. 그러한 발현 시스템은 당 업계에 공지되어 있고, 상업적 공급원을 통해 쉽게 유용하다.
그러한 트랜스제닉 식물을 수득할 때의 형질전환 방법은 본 발명에 중요하지 않고, 다양한 식물 형질전환 방법이 현재 유용하다. 더욱이, 더 새로운 방법이 작물을 형질전환시키기 위해 유용하기 때문에, 이들을 또한 하기에 직접 적용할 수 있다. 예를 들면, 아그로박테리움 (Agrobacterium) 감염에 천연적으로 감수성인 많은 식물 종은 아그로박테리움 매개 형질전환의 삼분자 또는 바이너리(binary) 벡터 방법을 통해 성공적으로 형질전환될 수 있다. 많은 경우에, T-DNA에 의해 한쪽 또는 양쪽에 경계한 구축물, 특히 왼쪽 및 오른쪽 경계, 더욱 특히 오른쪽 경계를 가진 것이 바람직할 것이다. T-DNA 경계가 다른 형질전환 방식에 대해 용도를 발견할 수 있지만, 이것은 형질전환 방식으로서 구축물이 아그로박테리움 투머파시엔스 (A. tumefaciens) 또는 아그로박테리움 라이조게네스 (A. rhizogenes)를 사용할 경우에 특히 유용하다. 게다가, 다양한 단자엽 및 쌍자엽 식물 종의 형질전환을 허용하는 현미 주입법, DNA 입자 충격법, 및 전기천공법의 기술이 개발되었다.
일상적으로, DNA 구축물에 포함된 것은 숙주에서 발현을 위해 필요한 조절 부위를 가지며 형질전환 세포의 선택을 제공할 구조 유전자일 것이다. 유전자는 세포독성 물질, 예를 들면, 항생제, 중금속, 독소 등에 대한 저항성, 영양요구 숙주에 대한 원영양성을 제공하는 상보성, 바이러스 면역등을 제공할 것이다. 발현 구축물 또는 이의 성분이 도입된 상이한 숙주 종의 수에 의존하면서, 상이한 숙주에 대해 상이한 선택 조건이 사용되는 곳에서, 하나 이상의 마커가 사용될 수 있다.
적당한 선택 마커의 비제한적인 예는 블레오마이신, 겐타마이신, 글리포제이트, 하이그로마이신, 카나마이신, 메토트렉세이트, 플레오마이신, 포스피노트리신, 스펙티노마이신, 스트렙토마이신, 술폰아미드 및 술포닐유레아에 내성을 부여하는 유전자를 포함한다 (Maliga 등, Methods in Plant Molecular Biology, Cold Spring Harbor Laboratory Press, 1995, p. 39). 마커의 예는 이에 제한되지 않고, 알칼라인 포스파타아제 (AP), 믹 (myc), 헴아글루티닌 (HA), β글루쿠로니다아제 (GUS), 루시퍼라아제 및 녹색 형광 단백질 (GFP)를 포함한다.
아그로박테리움이 식물 세포 형질전환에 대해 사용될 경우, 아그로박테리움 숙주 내에 존재하는 T-DNA 또는 Ti- 또는 Ri-플라스미드와 상동재조합을 위해 아그로박테리움 숙주내로 도입될 수 있는 벡터가 사용될 수 있다. 재조합을 위해 T-DNA를 함유한 Ti- 또는 Ri-플라스미드가 무장되거나 (혹(gall) 형성을 야기할 수 있는) 무장해제될 수 있고 (혹 형성을 야기할 수 없는), 후자는 vir 유전자가 형질전환된 아그로박테리움 숙주에 존재하는 한, 허용가능하다. 무장된 플라스미드는 정상적인 식물 세포 및 혹의 혼합물을 제공할 수 있다.
아그로박테리움이 숙주 식물 세포를 형질전환하는 운반체로서 사용되는 일부 경우에, T-DNA 경계 부위에 의해 경계되는 발현 또는 전사 구축물은 대장균 및 아그로박테리움에서 복제할 수 있는 광대한 숙주 범위 벡터내로 삽입될 것이고, 문헌에 기재된 광대한 숙주 범위 벡터가 있다. 흔히 사용되는 것은 pRK2 또는 이의 유도체이다. 예를 들면, 본원에 참고로 포함된, [Ditta, 등, (Proc. Nat. Acad. Sci., U.S.A. (1980) 77:7347-7351)] 및 유럽 특허 출원 0 120 515를 참조. 대안 적으로, 별개의 복제 서열을 포함한 벡터내로 식물 세포에서 발현되는 서열을 삽입할 수 있고, 그것의 하나는 대장균내에서, 다른 것은 아그로박테리움내에서 벡터를 안정화시킨다. 예를 들면, [McBride 및 Summerfelt (Plant Mol. Biol. (1990) 14:269-276)]을 참조하고, 여기에서 pRiHRI (Jouanin, 등, Mol. Gen. Genet. (1985) 201:370-374) 복제 원점이 이용되고 숙주 아그로박테리움 세포내에서 식물 발현 벡터의 부가된 안정성을 제공한다.
발현 구축물 및 T-DNA에 포함된 것은 형질전환된 아그로박테리움 및 형질전환된 식물 세포의 선택을 허용하는 하나 이상의 마커일 수 있다. 클로람페니콜, 카나마이신, 아미노글리코시드 G418, 하이그로마이신 등에 내성과 같은, 식물 세포에 사용하기 위한 수 많은 마커가 개발되었다. 사용된 특정 마커가 본 발명에 필수적이지는 않고, 하나 또는 또다른 마커가 특정 숙주 및 구축 방식에 의존하여 바람직하다.
아그로박테리움을 사용한 식물 세포의 형질전환에 대해, 절편 (explant)이 형질전환의 충분한 시간 동안 형질전환된 아그로박테리움과 결합되고 인큐베이션되고, 세균을 죽이고, 식물 세포를 적당한 선택 배지에서 배양할 수 있다. 일단 칼루스(callus)가 형성되면, 줄기 형성이 공지의 방법에 따라서 적당한 식물 호르몬을 사용함으로써 촉진될 수 있고, 줄기를 식물의 재분화를 위해 뿌리 형성 배지로 이식한다. 식물은 이어서 종자로 자랄 수 있고, 종자는 반복 세대의 확립 및 식물성 오일의 분리를 위해 사용될 수 있다.
그리하여, 본 발명의 또다른 면에서, 숙주 세포의 스테롤 및/또는 스탄올 조 성을 변형시키는 방법. 특히 관심 있는 것은 식물 숙주 세포의 스테롤 및/또는 스탄올 조성을 변형시키는 방법이다. 일반적으로 방법은 총 스테롤 화합물의 비율로서 스테롤 에스테르 화합물의 수준을 증가시키는 것이 관여된다. 방법은 일반적으로 숙주 세포에서 본 발명의 폴리뉴클레오티드의 발현을 이끌기 위해 발현 구축물의 용도를 포함한다.
또한 제공되는 것은 숙주 식물 세포에서 총 스테롤 화합물의 백분율로서 스테롤 에스테르 화합물의 비율을 감소시키는 방법이다. 방법은 일반적으로 숙주 세포에서 내재하는 아실전달효소 단백질의 억제를 이끌기 위한 발현 구축물의 용도를 포함한다.
특히 관심 있는 것은 숙주 식물 세포에서 스테롤 화합물의 수준을 변형시키기 위한 발현 구축물의 용도이다. 가장 특히, 방법은 식물 종자로부터 수득된 종자 오일에서 스테롤 화합물의 수준을 변형시킬 때 용도를 발견한다.
또한 관심 있는 것은 숙주 세포에서 오일 생산을 변경시키기 위한, 특히 오일 생산을 증가시키기 위한 본 발명의 발현 구축물의 용도이다. 특히 관심 있는 것은 숙주 식물 세포를 형질전환시키고 이러한 숙주 세포를 이용하여 발현 구축물을 포함하지 않은 동일한 식물에 비하여 오일 생산이 증가된 전체 식물을 재분화하기 위한 LCAT 및/또는 ACAT 폴리펩티드를 코딩하는 핵산 서열을 포함한 발현 구축물의 용도이다.
변형된 스테롤 화합물 함량을 가진 트랜스제닉 식물로부터 수득된 오일은 다양한 적용에서 용도를 발견한다. 본 발명에서 특히 관심 있는 것은 인간 영양 및 심혈관 건강을 개선시키는데 관여한 적용에서 변형된 수준의 스테롤 화합물을 포함한 오일의 용도이다. 예를 들면, 피토스탄올이 혈청 콜레스테롤을 낮추는데 유리하다 (Ling, 등 (1995) Life Sciences 57:195-206).
콜레스테롤을 낮추는 조성물은 본 발명의 방법을 사용하여 수득된 오일 및 스테롤 에스테르 화합물 조성을 포함한다. 그러한 콜레스테롤을 낮추는 조성물은 이에 제한되지 않고, 식품, 식품 제품, 가공 식품, 식품 성분, 식품 첨가제 조성물, 또는 오일 및/또는 지방을 포함하는 식이/영양 보조제를 포함한다. 비제한적인 예는 마아가린; 버터; 쇼트닝; 쿠킹 오일; 프라잉 오일; 샐러드 드레싱과 같은, 드레싱; 스프레드; 마요네즈; 및 비타민/미네랄 보조제를 포함한다. 그러한 조성물에 관한 특허 문헌은 미국 특허 4,588,717 및 5,244,887, 및 PCT 국제 공개 번호 WO 96/38047, WO 97/42830, WO 98/06405, 및 WO 98/06714를 포함한다. 부가적인 비제한적인 예는 토핑; 치즈 및 가공 치즈와 같은 유제품; 가공육; 파스타; 소스; 곡류; 냉동 및 선반 안정한 디저트를 포함한, 디저트; 딥; 칩; 구운 제품; 파스트리; 쿠키; 스낵 바; 과자; 초코렛; 음료; 미추출 종자; 및 분쇄되고, 금이 가고, 제분되고, 롤링되고, 압출되고, 펠렛되고, 탈지되고, 탈수되고, 또는 그렇지 않으면 가공되나, 여전히 본원에 개시된 오일 등을 포함하는 미추출 종자를 포함한다.
콜레스테롤을 낮추는 조성물은 약학적으로 허용가능한 담체, 부형제, 또는 희석제와 함께, 또한 본 발명의 방법을 사용하여 수득된 오일 또는 스테롤 화합물 조성물의 콜레스테롤을 낮추는 효과적인 양을 포함한 약학 조성물의 형태를 취할 수 있다. 이러한 약학 조성물은 액체 또는 고체 형태일 수 있다. 액체는 용액 또는 현탁액일 수 있고; 고체는 분말, 과립, 알약, 정제, 겔, 또는 압출물일 수 있다. 미국 특허 5,270,041은 스테롤을 함유한 약학 조성물에 관한 것이다.
그리하여, 숙주 세포에서 본 발명의 아실전달효소 유사 서열을 코딩하는 핵산 서열의 발현에 의해, 숙주 세포의 지질 함량 및/또는 조성뿐만 아니라 스테롤 함량 및/또는 조성을 변경시키는 것이 가능하다.
본 발명은 지금 일반적으로 기재되고, 단지 설명의 목적으로 포함되고 본 발명을 제한할 의도가 아닌 하기 실시예를 참고하여 더욱 쉽게 이해될 것이다.
본 발명은 식물 아실전달효소 유사 핵산 및 아미노산 서열 및 구축물, 및 숙주 세포 및 식물에서 스테롤 조성 및/또는 함량, 및 오일 조성 및/또는 함량을 변경할 때 이들 용도에 관련된 방법에 관한 것이다.
실시예 1: RNA 분리
아라비돕시스 탈리아나 (Arabidopsis thaliana)의 꽃 및 발생 종자로부터 총 RNA를 상보적인 (cDNA) 라이브러리의 구축에 사용하기 위해 분리하였다. 절차는 Webb 및 Knapp (D.M. Webb 및 S.J. Knapp, (1990) Plant Molec. Reporter, 8, 180-185)의 DNA 분리 절차의 적응이었다. 하기 기재는 1g의 신선한 조직 중량의 사용을 가정한다. 냉동 종자 조직을 액체 질소하에 분쇄에 의해 분말화하였다. 분말을 0.2g 불용성 폴리비닐폴리피롤리돈과 함께 10 ml REC 완충액 (50mM Tris-HCl, pH 9, 0.8M NaCl, lOmM EDTA, 0.5% w/v CTAB (세틸트리메틸-암모늄 브로마이드))에 첨가하고, 실온에서 분쇄하였다. 균질액을 12,000xg 에서 5분 동안 원심분리하여 불용성 물질을 펠렛하였다. 생성된 상청액 분획을 클로로포름으로써 추출하고, 최상층을 회수하였다.
RNA를 이어서 1 부피의 RecP (5OmM Tris-HCL, pH9, 10mM EDTA 및 0.5% (w/v) CTAB)의 첨가에 의해 침전시키고, 이전처럼 간단한 원심분리에 의해 수집하였다. RNA 펠렛을 0.4 ml의 1M NaCl에 재용해시켰다. RNA 펠렛을 물에 재용해시키고 페놀/클로로포름으로써 추출하였다. 충분한 3M 포타슘 아세테이트 (pH 5)를 첨가하여 아세테이트 중에 0.3M 화합물을 만들고, 두 부피의 에탄올의 첨가에 의해 RNA를 침전시켰다. 에탄올로 세척 후에, 이 최종 RNA 침전물을 물에 용해시키고 냉동 보관하였다.
대안적으로, 총 RNA를 제조자의 절차에 따라 TRIzol 시약 (BRL-Lifetechnologies, Gaithersburg, MD)을 사용하여 수득할 수 있다. RNA 침전물을 물에 용해시키고 냉동 보관하였다.
실시예 2: LCAT 서열의 확인
조사를 실리콘 그래픽스 유닉스 (Silicon Graphics Unix) 컴퓨터상에서 Compugen Ltd.가 공급한 부가적인 Bioaccellerator 하드웨어 및 GenWeb 소프트웨어를 이용하여 수행하였다. 이 소프트웨어 및 하드웨어는 조회로서 프로필을 사용하여 DNA 및 단백질 데이타베이스를 조사할 때 Smith-Waterman 알고리즘의 이용을 가능하게 하였다. 단백질 데이타베이스를 조회하기 위해 사용된 프로그램은 profilesearch 였다. 이것은 조회가 단일 서열이 아니고 아미노산 또는 핵산 서 열의 다중 정렬에 기초한 프로필인 조사이다. 프로필을 서열 데이타 세트, 즉 서열 데이타베이스를 조회하기 위해 사용하였다. 프로필은 실제로 표준 조회 조사에 대해 사용된 "스코링 매트릭스 (scoring matrix)"를 대체하면서, 서열에서 각 위치를 기록하기 위한 모든 타당한 정보를 포함했다. 단백질 프로필을 가진 핵산 데이타베이스를 조회하기 위해 사용된 프로그램은 tprofilesearch 였다. Tprofilesearch는 아미노산 프로필 조회를 사용하여 핵산 데이타베이스를 조사한다. 조사를 행할 때, 데이타베이스 내의 서열은 6개의 해독틀로 아미노산 서열로 번역된다. tprofilesearch에 대한 산출 파일은 최상의 정렬이 일어난 틀을 나타내는 부가적인 칼럼을 제외하고는 profilesearch에 대한 산출 파일과 동일하다.
Smith-Waterman 알고리즘 (Smith 및 Waterman (1981) J. Molec. Biol. 147:195-197)을 조회로부터의 하나의 서열 및 데이타베이스에 포함된 서열 군 사이의 유사성을 조사하기 위해 사용하였다.
인간의 레시틴:콜레스테롤 아실전달효소의 단백질 서열 (McLean J, 등 (1986) Nucleic Acids Res. 14(23):9397-406 서열 번호 1))을 BLAST를 사용하여 NCBI 중복되지 않는 단백질 데이타베이스를 조사하기 위해 사용하였다. 3개 서열이 아라비돕시스, GenBank 접수번호 AC004557 (본원에서 LCAT1, 서열 번호 2로서 언급됨), AC003027 (본원에서 LCAT2, 서열 번호 4로서 언급됨), 및 AL024486 (본원에서 LCAT3, 서열 번호 6으로서 언급됨)으로부터 확인되었다. 연역된 아미노산 서열이 각각 서열 번호 3, 5, 및 7에서 제공된다.
PSI-BLAST를 사용하여 조회로부터 생성된 프로필을 하이퍼 텍스트 마크업 언 어 (html) 파일로부터 잘라냈다. ncbi에서 psiblast에 대한 월드와이드 웹(www)/html 인터페이스는 psiblast의 각 순회 후에 되돌아오는 html 파일에서 감춰진 분야로 현재 생성된 프로필 매트릭스를 저장한다. 그러나, 이 매트릭스는 html을 통한 각 수송에 대해 string62(s62) 포맷으로 코딩되었다. String62 포맷은 매트릭스 값의 html 합법적인 아스키 문자로의 간단한 전환이다.
코딩된 매트릭스 폭 (x 축)은 26 문자이고, 공통 문자, A, B, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, X, Y, Z 순서의 각 아미노산의 확률 (여기서 B는 D 및 N을 나타내고, Z는 Q 및 E를 나타내고, X는 임의의 아미노산을 나타낸다), 간격 생성값, 및 간격 연장값을 포함한다.
매트릭스의 길이 (Y 축)는 PSI-BLAST에 의해 확인된 서열의 길이에 해당한다. 아미노산의 순서는 매트릭스의 상단에 N 말단을 가지고, PSI-BLAST를 사용하여 확인된 서열의 보존된 아미노산 서열에 해당한다. 그 위치에서 다른 아미노산의 확률은 각각의 단일 글자 아미노산 약자 아래에, x 축을 따라 각 아미노산에 대해 나타난다.
그리하여, 프로필의 각 열은 최고 득점(공통)의 아미노산, 이은 서열 매트릭스의 그 위치에서 각 가능한 아미노산에 대한 득점, 그 위치에서 간격을 여는 득점, 및 그 위치에서 간격을 계속하는 득점으로 구성된다.
string62 파일은 부차적인 조사에서 사용하기 위한 프로필로 다시 전환된다. 간격 열린 분야를 11로 설정하고 간격 연장 분야를 x 축을 따라 1로 설정한다. 간격 생성 및 간격 연장값은 PSI-BLAST 알고리즘에 제시된 설정값에 기초하여, 공 지된다. 매트릭스는 표준 GCG 프로필 형태로 보내진다. 이 포맷은 GenWeb에 의해 읽혀질 수 있다.
string62 포맷된 파일을 매트릭스로 전환하기 위해 사용된 알고리즘이 표 1에 요약된다.
1. 코딩된 문자가 z라면, 값은 최소 blast 득점이다 2. 코딩된 문자가 Z라면, 값은 최대 blast 득점이다 3. 그 밖에 코딩된 문자가 대문자라면, 이의 값은 (64-(문자의 아스키 #이다)) 4. 그 밖에 코딩된 문자가 한자리 숫자라면, 값은 ((문자의 아스키 #)-48)이다 5. 그 밖에 코딩된 문자가 대문자가 아니라면, 값은 ((문자의 아스키 #)-87)이다 6. 모든 B 위치는 서열 매트릭스의 그 열에서 D 및 N 아미노산의 최소치로 설정된다 7. 모든 Z 위치는 서열 매트릭스의 그 열에서 Q 및 E 아미노산의 최소치로 설정된다 8. 모든 X 위치는 서열 매트릭스의 그 열에서 모든 아미노산의 최소치로 설정된다 9. kBLAST_SCORE_MAX=999; 10. kBLAST_SCORE_MIN=-999; 11. 모든 간격 열림은 11로 설정된다 12. 모든 간격 렌즈는 1로 설정된다
LCAT1, LCAT2, 및 LCAT3 뿐만 아니라 PSI-BLAST 프로필의 단백질 서열이 부가적인 LCAT 서열에 대한 공유 및 독점 데이타베이스를 조사하기 위해 사용되었다. 각각 LCAT1 및 LCAT3와 동일하게 나타난 두 개의 EST 서열이 확인되었다. 하나의 부가적인 아라비돕시스 서열이 독점 데이타베이스로부터 확인되었다, LCAT4 (서열 번호 8). LCAT4의 연역된 단백질 서열이 서열 번호 9에 제공된다. 두 개의 부가적인 게놈 서열이 아라비돕시스 생태형 콜럼비아 및 랜드스버그의 라이브러리로부터 PSI-BLAST 프로필을 사용하여 확인되었다, LCAT7 (서열 번호 10) 및 LCAT8 (서열 번호 11). LCAT7 서열은 콜럼비아 및 랜드스버그 게놈 라이브러리 양자에서 존재한 반면에, LCAT8 서열은 단지 콜럼비아 라이브러리에서 존재하였다.
개방형 해독틀은 아라비돕시스 공유 데이타베이스에서 LCAT7의 게놈 서열로부터 예상되었고, 이 서열은 MSH12라 불렸다 (본원에서 LCAT5, 서열 번호 73으로서 언급됨). LCAT5의 연역된 단백질 서열이 서열 번호 74에 제공된다.
PSI-BLAST 프로필 및 LCAT 서열이 공유 효모 데이타베이스 및 옥수수 및 대두 EST 서열을 포함한 독점 라이브러리를 조회하기 위해 사용되었다. 효모 게놈은 인간 LCAT와 특유의 유사성을 가진 단지 하나의 유전자인 LRO1 (LCAT 관련된 개방형 해독틀, YNR008W, 도 1)을 포함한다. LRO1의 DNA 서열은 서열 번호 75에 제공되고 단백질 서열은 서열 번호 76에 제공된다. 7개의 EST 서열은 LCAT 서열인 것으로 대두 라이브러리로부터 확인되었다. 대두로부터의 2개의 서열 (서열 번호 12 및 13)이 아라비돕시스 LCAT1 서열과 가장 밀접하게 관련되었고, 하나의 서열은 LCAT2 (서열 번호 14)와 가장 밀접하게 관련된 것으로 확인되었고, 3개는 LCAT3 (서열 번호 15-17)와 밀접하게 관련되었고, 부가적인 하나의 서열이 확인되었다 (서열 번호 18). 총 11개의 옥수수 EST 서열이 아라비돕시스 LCAT 서열과 관련된 것으로 확인되었다. 2개의 옥수수 EST 서열 (서열 번호 19 및 20)이 LCAT1과 가장 밀접하게 관련되었고, 2개의 서열이 LCAT2 (서열 번호 21 및 22)와 밀접하게 관련된 것으로 확인되었고, 4개의 옥수수 EST 서열이 LCAT3 (서열 번호 23-26)와 밀접하게 관련된 것으로 확인되었고, 부가적인 3개의 옥수수 EST 서열이 확인되었다 (서열 번호 27-29).
실시예 3: ACAT 서열의 확인
식물 ACAT가 당업계에 미지이기 때문에, 조사를 공유 데이타베이스로부터 포유동물 유래의 공지 및 관련된 ACAT 서열을 확인하기 위해 수행하였다. 이러한 서열은 이어서 공유 및 독점 EST 데이타베이스를 조사하기 위해 사용되어 식물 ACAT 유사 서열을 확인하였다.
마우스 발현된 서열 태그 (Expressed Sequence Tag: EST) 서열을 포함한 공유 데이타베이스 (dBEST)를 ACAT 유사 서열에 대해 조사하였다. 조사로 공지의 ACAT 서열과 관련되나 (대략 20% 동일), 다른 두 개의 서열 (서열 번호 30 및 31)을 확인하였다.
다른 생물로부터 ACAT 유사 서열을 확인하기 위해, 두 개의 마우스 ACAT 서열을 사용하여 인간 및 래트 조직으로부터 EST 서열을 포함한 공유 및 독점 데이타베이스를 조사하였다. 조사의 결과는 인간 데이타베이스 및 마우스 서열과 밀접하게 관련된 래트 데이타베이스로부터 몇개의 서열을 확인하였다. 인간 및 래트 ACAT 유사 EST 서열을 GCG 조립 프로그램을 사용하여 조립하여, 중복된 서열 (서열 번호 각각 32 및 33)을 확인함으로써 완전한 유추된 cDNA 서열을 구축하였다.
인간 ACAT 유사 서열의 단백질 서열을 MacVector(Oxford Molecular, Inc.)를 사용하여 인간 유래 (Chang, 등 (1993) J. Biol. Chem. 268:20747-20755, 서열 번호 34), 마우스 유래 (Uelmen, 등 (1995) J. Biol. Chem. 270:26192-26201 서열 번호 35) 및 효모 유래 (Yu, 등 (1996) J. Biol. Chem. 271:24157-24163, 서열 번호 36 및 Yang, 등 (1996) Science 272:1353-1356, 서열 번호 37) 의 공지의 ACAT 서열과 함께 정렬하였다. 정렬의 결과는 서열이 공지의 서열과 연관되나, 연관된 서열은 공지의 서열과 단지 약 25% 유사하다는 것을 증명했다.
인간 스테롤 O-아실전달효소 (ACAT, 아실 CoA:콜레스테롤 아실전달효소, 접수 번호 A48026) 관련 서열의 단백질 서열이 사용되어 단백질 및 핵산 Genbank 데이타베이스를 조사하였다. 단일 식물 유사체가 공유 아라비돕시스 EST 데이타베이스에서 확인되었다 (접수 번호 A042298, 서열 번호 38). 단백질 서열 (서열 번호 39)이 EST 서열로부터 번역되고, 포유동물 및 효모 ACAT에서 보존된 펩티드 서열을 포함하는 것으로 발견되었다 (Chang 등 (1997) Ann. Rev. Biochem., 66:613-638).
아라비돕시스 ACAT 유사 EST 에 해당하는 전체 코딩 부위를 수득하기 위해, 합성 올리고뉴클레오티드 프라이머를 고안하여 ACAT 유사 서열을 포함한 부분적인 cDNA 클론의 5' 및 3' 말단을 증폭하였다. 프라이머는 아라비돕시스 ACAT 유사 EST 서열에 따라 고안되었고, cDNA 말단의 신속한 증폭 (RACE) 반응에 사용되었다 (Frohman 등 (1988) Proc. Natl. Acad. Sci. USA 85:8998-9002).
프라이머를 고안하여 (5'-TGCAAATTGACGAGCACACCAACCCCTTC-3' (서열 번호 40) 및 5'-AAGGATGCTTTGAGTTCCTGACAATAGG-3'(서열 번호 41)) 아라비돕시스 ACAT EST 서열로부터 5' 말단을 증폭하였다. cDNA 클론으로부터의 측면 서열의 증폭은 Marathon cDNA 증폭 키트 (Clontech, CA)를 사용하여 수행하였다.
5'-RACE 증폭으로부터 유도된 서열을 사용하여 독점 아라비돕시스 EST 라이브러리를 조사하였다. 5'-RACE 서열과 동일한 서열을 포함하는, 단일 EST 접수 번호, LIB25-088-C7 (서열 번호 42)이 확인되었다. 더욱이, LIB25-088-C7 은 아라비돕시스 ACAT 유사 산물에 대한 완전한 가상의 코딩 서열을 포함하는 것으로 발견되었다.
A042298의 핵산뿐만 아니라 가상의 번역 산물 서열이 공유 및 독점 데이타베이스를 조사하기 위해 사용되었다. 4개의 EST 서열이 대두 (서열 번호 43-46) 및 옥수수 (서열 번호 47-50) 독점 데이타베이스 양자에서 확인되었고, 단일 ACAT 유사 서열이 모르티에렐라 알피나 (Mortierrella alpina) EST 서열 (서열 번호 51)로부터 확인되었다.
몇 개의 상이한 유래의 ACAT 서열 사이의 서열 정렬이 서열 사이의 유사성을 확인하기 위해 비교되었다. 공지의 인간 및 마우스 ACAT 유래의 뉴클레오티드 서열뿐만 아니라, 공지의 효모 ACAT 유래의 뉴클레오티드 서열이 인간 및 아라비돕시스 유래의 ACAT 유사 EST 서열과 비교되었다.
서열 정렬의 분석은 서열 유사성에 기초하여 몇 개의 ACAT 부류를 드러냈다. 뉴클레오티드 서열에서 88% 유사한, 공지의 인간 및 마우스 ACAT가 하나의 부류의 ACAT를 형성하였다. 다른 부류의 ACAT는 공지의 인간 및 마우스 부류 ACAT와 20% 미만으로 유사한 효모 ACAT를 포함했다.
ACAT의 최종 부류는 본 발명에서 개시된 아라비돕시스 및 인간 서열을 포함했다. 이 부류는 공지의 인간 및 마우스 ACAT 부류와 대략 22% 유사하고 효모 ACAT 부류와 대략 23% 유사하다. 그리하여, 본 발명에서 개시된 ACAT 서열은 신규 부류의 ACAT 효소를 나타낸다. 이 부류의 부분적인 마우스 서열이 또한 제공된다.
실시예 4: 발현 구축물 제조
식물 및 배양된 곤충 세포에서 LCAT1, LCAT2, LCAT3, LCAT4, LCAT5 및 효모 LRO1 서열의 발현을 이끌기 위해 구축물을 제조하였다. 각 LCAT의 전체 코딩 부위를 적당한 EST 클론 또는 아라비돕시스 게놈 cDNA 라이브러리로부터 중합효소 연쇄반응 (PCR)에서 하기 올리고뉴클레오티드 프라이머를 사용하여 증폭하였다. LCAT1 코딩 서열을 EST 클론 Lib25-082-Ql-El-G4 로부터 프라이머 5'-GGATCCGCGGCCGCACAATGAAAAAAATATCTTCACATTATTCGG-3' (서열 번호 52) 및 5'-GGATCCCCTGCAGGTCATTCATTGACGGCATTAACATTGG-3' (서열 번호 53)을 사용하여 증폭하였다. LCAT2 코딩 서열을 아라비돕시스 게놈 cDNA 라이브러리로부터 합성 올리고뉴클레오티드 프라이머 5'-GGATCCGCGGCCGCACAATGGGAGCGAATTCGAAATCAGTAACG-3' (서열 번호 54) 및 5'-GGATCCCCTGCAGGTTAATACCCACTTTTATCAAGCTCCC-3' (서열 번호 55)를 사용하여 증폭하였다. LCAT3 코딩 서열을 EST 클론 LIB22-004-Q1-E1-B4 로부터 합성 올리고뉴클레오티드 프라이머 5'-GGATCCGCGGCCGCACAATGTCTCTATTACTGGAAGAGATC-3'(서열 번호 56) 및 5'-GGATCCCCTGCAGGTTATGCATCAACAGAGACACTTACAGC-3' (서열 번호 57)을 사용하여 증폭하였다. LCAT4 코딩 서열을 EST 클론 LIB23-007-Ql-El-B5 로부터 합성 올리고뉴클레오티드 프라이머 5'-GGATCCGCGGCCGCACAATGGGCTGGATTCCGTGTCCGTGC-3' (서열 번호 58) 및 5'-GGATCCCCTGCAGGTTAACCAGAATCAACTACTTTGTG-3' (서열 번호 59)를 사용하여 증폭하였다. LCAT5 코딩 서열을 LIB23-053-Q1-El-E3 로부터 합성 올리고뉴클레오티드 프라이머 5'-GGATCCGCGGCCGCACAATGCCCCTTATTCATCGG-3' (서열 번호 77) 및 5'-GGATCCCCTGCAGGTCACAGCTTCAGGTCAATACG-3' (서열 번호 78)을 사용하여 증폭하였다.
효모 LRO1 코딩 서열을 게놈 효모 DNA로부터 합성 올리고뉴클레오티드 프라이머 5'GGATCCGCGGCCGCACAATGGGCACACTGTTTCGAAG3' (서열 번호 79) 및 5'GGATCCCCTGCAGGTTACATTGGGAAGGGCATCTGAG3' (서열 번호 80)을 사용하여 증폭하였다.
아라비돕시스 ACAT 서열 (서열 번호 42)의 완전한 코딩 부위를 EST 클론 LIB25-088-C7 로부터 중합효소 연쇄반응 (PCR)에서 올리고뉴클레오티드 프라이머 5'-TCGACCTGCAGGAAGCTTAGAAATGGCGATTTTGGATTC-3' (서열 번호 60) 및 5'-GGATCCGCGGCCGCTCATGACATCGATCCTTTTCGG-3' (서열 번호 61)을 사용하여 증폭하였다.
각각의 생성된 PCR 산물을 pCR2.1 Topo (Invitrogen)내로 서브클로닝하고 pCGN9964 (LCAT1), pCGN9985 (LCAT2), pCGN9965 (LCAT3), pCGN9995 (LCAT4), pCGN10964 (LCAT5), pCGN10963 (LRO1), 및 pCGN8626 (ACAT) 로 표지하였다. 이중 가닥 DNA 서열이 PCR 증폭에 의해 어떠한 오류도 도입되지 않았다는 것을 확인하기 위해 수득되었다.
4A. 바큘로바이러스 발현 구축물 (Baculovirus Expression Constructs)
배양된 곤충 세포에서 아라비돕시스 LCAT 및 효모 LCAT 서열의 발현을 이끌기 위해 구축물을 제조하였다. LCAT 단백질의 완전한 코딩 부위를 각각의 구축물로부터 NotI 및 Sse8387I로써 절단하고, 이어 겔 전기영동 및 겔 정제에 의해 제거하였다. LCAT 코딩 서열을 포함한 절편을 NotI 및 PstI 절단된 바큘로바이러스 발현 벡터 pFastBac1 (Gibco-BRL, Gaithersburg, MD)내로 클로닝하였다. 생성된 바큘로바이러스 발현 구축물은 pCGN9992 (LCAT1), pCGN9993 (LCAT2), pCGN9994 (LCAT3), pCGN10900 (LCAT4), pCGN10967 (LCAT5), 및 pCGN10962 (LRO1)으로서 언급되었다.
4B. 식물 발현 구축물 제조
pCGN3223 (이의 전부가 본원에 참고로 포함된, 미국 특허 제 5,639,790에 기재)으로부터 유도된 나핀 카세트를 포함한 플라스미드를 변형하여 다중 제한효소 자리를 포함한 큰 DNA 절편을 클로닝하기에 더욱 유용하게 하고, 다중 나핀 융합 유전자의 식물 바이너리 형질전환 벡터내로의 클로닝을 허용하였다. 자가 복원된 올리고뉴클레오티드 서열 5'-CGCGATTTAAATGGCGCGCCCTGCAGGCGGCCGCCTGCAGGGCGCGCCATTTAAAT-3' (서열 번호 62)로 구성된 어댑터를 제한효소 BssHII로 절단 후에 클로닝 벡터 pBC SK+ (Stratagene)에 연결하여 벡터 pCGN7765를 구축하였다. 플라스미드 pCGN3223 및 pCGN7765를 NotI으로 절단하고 연결하였다. 생성된 벡터 pCGN7770 은 pCGN3223 로부터 나핀 종자 특이성 발현 카세트와 함께 pCGN7765 골격을 포함했다.
클로닝 카세트 pCGN7787 은 pCGN7770 의 나핀 조절 부위가 이중 CAMV 35S 프로모터 및 tml 폴리아데닐화 및 전사 종결 부위로써 대체된 것을 제외하고는, pCGN7770 과 본질적으로 동일한 조절 원소를 포함했다.
식물 형질전환용 바이너리 벡터 pCGN5139를 pCGN1558로부터 구축하였다 (McBride 및 Summerfelt, (1990) Plant Molecular Biology, 14:269-276). pCGN5139에서, pCGN1558의 폴리링커를 단일 제한효소 자리 AscI, PacI, XbaI, SwaI, BamHI, 및 NotI을 포함한 폴리링커를 가진 HindIII/Asp7l8 절편으로서 대체하였다. Asp7l8 및 HindIII 제한효소 자리는 pCGN5139에서 보유하였다.
일련의 터보 바이너리 벡터를 구축하여 DNA 서열의 전사 개시 부위(프로모터) 및 전사 종결 부위를 포함한 바이너리 벡터내로의 신속한 클로닝을 허용하였다.
플라스미드 pCGN8618은 올리고뉴클레오티드 5'-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3' (서열 번호 63) 및 5'-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3' (서열 번호 64)를 SalI/XhoI 절단된 pCGN7770에 연결함으로써 구축되었다. 나핀 프로모터, 폴리링커 및 나핀 3' 부위를 포함한 절편을 Asp718I로써 절단하여 pCGN8618로부터 잘라내고; 절편을 Klenow 절편으로써 5' 오버행 (overhang)을 채움으로써 평활말단화하고, 이어서 Asp718I 및 HindIII로써 절단된 pCGN5139에 연결하고, Klenow 절편으로써 5' 오버행 (overhang)을 채움으로써 평활말단화하였다. 나핀 프로모터가 pCGN5139의 평활말단화된 Asp718I 자리에 가장 인접하고, 나핀 3'이 평활말단된 HindIII 자리에 가장 인접하도록 배향된 인서트를 포함한 플라스미드의 서열분석으로 인서트 배향 및 클로닝 접합의 완전성을 확인하였다. 생성된 플라스미드는 pCGN8622으로 표시되었다.
플라스미드 pCGN8619는 올리고뉴클레오티드 5'-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3' (서열 번호 65) 및 5'-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3' (서열 번호 66)을 SalI/XhoI 절단된 pCGN7770에 연결함으로써 구축되었다. 나핀 프로모터, 폴리링커 및 나핀 3' 부위를 포함한 절편을 Asp718I로써 절단하여 pCGN8619로부터 제거하고; 절편을 Klenow 절편으로써 5' 오버행을 채움으로써 평활말단화하고, 이어서 Asp718I 및 HindIII로써 절단된 pCGN5139에 연결하고, Klenow 절편으로써 5' 오버행을 채움으로써 평활말단화하였다. 나핀 프로모터가 pCGN5139의 평활말단화된 Asp718I 자리에 가장 인접하고, 나핀 3'이 평활말단화된 HindIII 자리에 가장 인접하도록 배향된 인서트를 포함한 플라스미드의 서열분석으로 인서트 배향 및 클로닝 접합의 완전성을 확인하였다. 생성된 플라스미드는 pCGN8623으로 표시되었다.
플라스미드 pCGN8620은 올리고뉴클레오티드 5'-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGGAGCT-3' (서열 번호 67) 및 5'-CCTGCAGGAAGCTTGCGGCCGCGGATCC-3'(서열 번호 68)을 SalI/SacI 절단된 pCGN7787에 연결함으로써 구축되었다. d35S 프로모터, 폴리링커 및 tml 3' 부위를 포함한 절편을 Asp7l8I로써 완전한 절단 및 NotI으로써 부분적인 절단으로 pCGN8620으로부터 제거하였다. 절편을 Klenow 절편으로써 5' 오버행을 채움으로써 평활말단화하고, 이어서 Asp718I 및 HindIII로써 절단된 pCGN5139에 연결하고, Klenow 절편으로써 5' 오버행을 채움으로써 평활말단화하였다. d35S 프로모터가 pCGN5139의 평활말단화된 Asp718I 자리에 가장 인접하고, tml 3'이 평활말단화된 HindIII 자리에 가장 인접하도록 배향된 인서트를 포함한 플라스미드의 서열분석으로 인서트 배향 및 클로닝 접합의 완전성을 확인하였다. 생성된 플라스미드는 pCGN8624로 표시되었다.
플라스미드 pCGN8621은 올리고뉴클레오티드 5'-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCCAGCT-3' (서열 번호 69) 및 5'-GGATCCGCGGCCGCAAGCTTCCTGCAGG-3' (서열 번호 70)을 SalI/SacI 절단된 pCGN7787에 연결함으로써 구축되었다. d35S 프로모터, 폴리링커 및 tml 3' 부위를 포함한 절편을 Asp7l8I로써 완전한 절단 및 NotI으로써 부분적인 절단으로 pCGN8621로부터 제거하였다. 절편을 Klenow 절편으로써 5' 오버행을 채움으로써 평활말단화하고, 이어서 Asp718I 및 HindIII로써 절단된 pCGN5139에 연결하고, Klenow 절편으로써 5' 오버행을 채움으로써 평활말단화하였다. d35S 프로모터가 pCGN5139의 평활말단화된 Asp718I 자리에 가장 인접하고, tml 3'이 평활말단화된 HindIII 자리에 가장 인접하도록 배향된 인서트를 포함한 플라스미드의 서열분석으로 인서트 배향 및 클로닝 접합의 완전성을 확인하였다. 생성된 플라스미드는 pCGN8625로 표시되었다.
플라스미드 구축물 pCGN8640은 상기에 기재된 pCGN8624의 변형물이다. 대장균 및 아그로박테리움 선택의 결정자인 박테리아 스펙티노마이신 및 스트렙토마이신 내성 (Fling 등 (1985), Nucleic Acids Research 13(19):7095-7106)을 코딩하는 트랜스포존 Tn7으로부터 분리된 938bp PstI 절편을 Pfu 중합효소로써 평활말단화하였다. 평활말단화된 절편을 SpeI으로써 절단된 pCGN8624에 연결하고 Pfu 중합효소로써 평활말단화하였다. PstI 절편을 포함한 부위의 서열을 결정하여 인서트 배향 및 클로닝 접합의 완전성을 확인하였다.
스펙티노마이신 저항성 마커를 하기와 같이 pCGN8622 및 pCGN8623에 도입하였다. pCGN8640의 7.7 Kbp AvrIl-SnaBI 절편을 상기에 기재된 pCGN8623 또는 pCGN8622의 10.9 Kbp AvrIl-SnaBI 절편에 연결하였다. 생성된 플라스미드는 각각 pCGN8641 및 pCGN8643 이었다.
플라스미드 pCGN8644는 올리고뉴클레오티드 5'-GATCACCTGCAGGAAGCTTGCGGCCGCGGATCCAATGCA-3' (서열 번호 71) 및 5'-TTGGATCCGCGGCCGCAAGCTTCCTGCAGGT-3' (서열 번호 72)를 BamHI-PstI 절단된 pCGN8640에 연결함으로써 구축되었다.
4C. 식물 LCAT 발현 구축물 제조
LCAT1의 코딩 서열을 pCGN9964으로부터 NotI/Sse8387I 절편으로서 pCGN8640, pCGN8641, pCGN8643, 및 pCGN8644내로 클로닝하여 발현 구축물 각각 pCGN9960, pCGN9961, pCGN9962, 및 pCGN9963을 생성하였다. 구축물 pCGN9960을 구성 프로모터 CaMV 35S로부터 센스 배향으로 LCAT1 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9961을 나핀 프로모터로부터 안티센스 배향으로 LCAT1 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9962를 나핀 프로모터로부터 센스 배향으로 LCAT1 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9963을 구성 프로모터 CaMV 35S로부터 안티센스 배향으로 LCAT1 코딩 서열을 발현하도록 고안하였다.
LCAT2의 코딩 서열을 pCGN9985로부터 NotI/Sse8387I 절편으로서 pCGN8640, pCGN8641, pCGN8643, 및 pCGN8644내로 클로닝하여 발현 구축물 각각 pCGN9981, pCGN9982, pCGN9983, 및 pCGN9984를 생성하였다. 구축물 pCGN9981을 구성 프로모터 CaMV 35S로부터 센스 배향으로 LCAT2 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9982를 나핀 프로모터로부터 안티센스 배향으로 LCAT2 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9983을 나핀 프로모터로부터 센스 배향으로 LCAT2 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9984를 구성 프로모터 CaMV 35S로부터 안티센스 배향으로 LCAT2 코딩 서열을 발현하도록 고안하였다.
LCAT3의 코딩 서열을 pCGN9965로부터 NotI/Sse8387I 절편으로서 pCGN8640, pCGN8641, pCGN8643, 및 pCGN8644내로 클로닝하여 발현 구축물 각각 pCGN9966, pCGN9967, pCGN9968, 및 pCGN9969를 생성하였다. 구축물 pCGN9966을 구성 프로모터 CaMV 35S로부터 센스 배향으로 LCAT3 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9967을 나핀 프로모터로부터 안티센스 배향으로 LCAT3 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9968을 나핀 프로모터로부터 센스 배향으로 LCAT3 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9969를 구성 프로모터 CaMV 35S로부터 안티센스 배향으로 LCAT3 코딩 서열을 발현하도록 고안하였다.
LCAT4의 코딩 서열을 pCGN9995로부터 NotI/Sse8387I 절편으로서 pCGN8640, pCGN8641, pCGN8643, 및 pCGN8644내로 클로닝하여 발현 구축물 각각 pCGN9996, pCGN9997, pCGN9998, 및 pCGN9999를 생성하였다. 구축물 pCGN9996을 구성 프로모터 CaMV 35S로부터 센스 배향으로 LCAT4 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9997을 나핀 프로모터로부터 안티센스 배향으로 LCAT4 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9998을 나핀 프로모터로부터 센스 배향으로 LCAT4 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN9999를 구성 프로모터 CaMV 35S로부터 안티센스 배향으로 LCAT4 코딩 서열을 발현하도록 고안하였다.
LCAT5의 코딩 서열을 pCGN10964로부터 NotI/Sse8387I 절편으로서 pCGN9977 및 pCGN9979내로 클로닝하여 발현 구축물 각각 pCGN10965, 및 pCGN10966을 생성하였다. 구축물 pCGN10965를 구성 프로모터 CaMV 35S로부터 센스 배향으로 LCAT5 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN10966을 나핀 프로모터로부터 센스 배향으로 LCAT5 코딩 서열을 발현하도록 고안하였다.
LRO1의 코딩 서열을 pCGN10963으로부터 NotI/Sse8387I 절편으로서 pCGN9977 및 pCGN9979내로 클로닝하여 발현 구축물 각각 pCGN10960, 및 pCGN10961을 생성하였다. 구축물 pCGN10960을 구성 프로모터 CaMV 35S로부터 센스 배향으로 LRO1 코딩 서열을 발현하도록 고안하였다. 구축물 pCGN10961을 나핀 프로모터로부터 센스 배향으로 LRO1 코딩 서열을 발현하도록 고안하였다.
4D. 식물 ACAT 발현 구축물 제조
아라비돕시스 ACAT 유사 코딩 부위를 포함한 절편을 pCGN8626으로부터 Sse8387I 및 NotI으로 절단하여 제거하였다. ACAT 유사 서열을 포함한 절편을 PstI-NotI 절단된 pCGN8622에 연결하였다. 생성된 플라스미드를 pCGN8627로 표시하였다. DNA 서열 분석으로 클로닝 접합의 완전성을 확인하였다.
아라비돕시스 ACAT 유사 코딩 부위 (서열 번호 42)를 포함한 절편을 pCGN8626으로부터 Sse8387I 및 NotI으로 절단하여 제거하였다. 절편을 PstI-NotI 절단된 pCGN8623에 연결하였다. 생성된 플라스미드를 pCGN8628로 표시하였다. DNA 서열 분석으로 클로닝 접합의 완전성을 확인하였다.
아라비돕시스 ACAT 유사 코딩 부위를 포함한 절편을 pCGN8626으로부터 Sse8387I 및 NotI으로 절단하여 제거하였다. 절편을 PstI-NotI 절단된 pCGN8624에 연결하였다. 생성된 플라스미드를 pCGN8629라 표시하였다. DNA 서열 분석으로 클로닝 접합의 완전성을 확인하였다.
아라비돕시스 ACAT 유사 코딩 부위를 포함한 절편을 pCGN8626으로부터 Sse8387I 및 NotI으로 절단하여 제거하였다. 절편을 PstI-NotI 절단된 pCGN8625에 연결하였다. 생성된 플라스미드를 pCGN8630이라 표시하였다. DNA 서열 분석으로 클로닝 접합의 완전성을 확인하였다.
내재하는 ACAT 유사 활성의 억제를 위한 부가적인 발현 구축물을 또한 제조하였다. 구축물 pCGN8660을 나핀 전사 개시 서열의 조절하에 센스 배향으로 pCGN8626으로부터 아라비돕시스 ACAT 유사 코딩 부위의 대략 1Kb를, 안티센스 배향으로 전체 길이 아라비돕시스 ACAT 유사 코딩 부위를 클로닝함으로써 구축하였다.
식물에서 래트 ACAT 유사 서열의 발현을 위해, pCGN8592의 NotI-Sse8387I 절편을 NotI-PstI 절단된 바이너리 벡터 pCGN8621, pCGN8622, 및 pCGN8624 내에 클로닝하여 각각 플라스미드 pCGN9700, pCGN9701, 및 pCGN9702를 생성하였다. 플라스미드 pCGN9700은 나핀 프로모터의 조절하에 래트 ACAT 유사 cDNA 의 센스 전사체를 발현하고, 플라스미드 pCGN9701은 나핀 프로모터의 조절하에 래트 ACAT 유사 cDNA 의 안티센스 전사체를 발현하고, 플라스미드 pCGN9702는 이중 35S 프로모터의 조절하에 래트 ACAT 유사 cDNA 의 센스 전사체를 발현한다. 플라스미드 pCGN9700, pCGN9701, 및 pCGN9702를 아그로박테리움 투머파시엔스 EHA101에 도입하였다.
대두의 종자 배 및 옥수수의 배젖에서 래트 ACAT 유사 서열의 발현을 이끌기 위한 구축물을 제조하였다. 대두에서 래트 ACAT 유사 DNA 서열의 발현을 위해, 래트 ACAT 유사 서열의 코딩 서열을 포함한 pCGN8592의 1.5 kb NotI/Sse8387I 절편을 멍빈(Mung bean) 핵산가수분해효소를 사용하여 평활말단화하고, 터보 7S 바이너리/클로닝 벡터 pCGN8809의 SmaI 자리에 연결하여 입자 충격법에 의해 대두내로의 형질전환용 벡터 pCGN8817을 생성하였다. 벡터 pCGN8817은 대두 β-콘글리시닌의 α' 서브유닛의 프로모터 부위의 작동가능하게 연결된 성분 (7S 프로모터, (Chen 등, (1986), Proc. Natl. Acad. Sci. USA 83:8560-8564), 전체 래트 ACAT 유사 단백질을 코딩하는 DNA 서열, 및 E9 3'으로서 언급되는, 완두 RuBisCo 작은 서브유닛의 전사 종결 부위 (Coruzzi, 등 (1984) EMBO J. 3:1671-1679 및 Morelli, 등 (1985) Nature 315:200-204)를 포함했다. 이 구축물은 추가로 현삼속 (figwort) 모자이크 바이러스 (FMV) 프로모터 (미국 특허 제 5,378,619호) 및 E9의 전사 종결 부위의 조절하에 발현되는 CP4 EPSPS (미국 특허 5,633,435)를 사용하여 글리포제이트에 대한 저항성을 스크리닝함으로써 양성 형질전환된 식물의 선택을 위한 서열을 포함했다.
옥수수 배젖에서 래트 ACAT 유사 서열의 발현을 위해, 래트 ACAT 유사 서열의 코딩 서열을 포함한 pCGN8592의 1.5 kb NotI/Sse8387I 절편을 멍빈(Mung bean) 핵산가수분해효소를 사용하여 평활말단화하고, pGt1 프로모터 (Leisy, D.J. 등, Plant Mol. Biol. 14 (1989) 41-50) 및 HSP70 인트론 서열 (미국 특허 제 5,593,874호)로부터 발현을 위해 벼 pGt1 발현 카세트 pCGN8592의 BamHI 자리에 연결하였다. 이 카세트는 또한 노팔린 합성효소인 nos 3' (Depicker 등, J. Molec. Appl. Genet. (1982) 1: 562-573)의 클로닝 자리의 하류에 전사 종결 부위를 포함했다. pGt1 프로모터, 래트 ACAT 유사 단백질을 코딩하는 DNA 서열, 및 nos 전사 종결 서열을 포함한 7.5 kb 절편을 바이너리 벡터 pCGN8816에 클로닝하여 옥수수의 형질전환용 벡터 pCGN8818을 생성하였다. 이 구축물은 또한 CAMV 35S 프로모터 및 tml 전사 종결 부위의 조절하에 Tn5 박테리아의 카나마이신 내성 유전자를 사용하여 카나마이신으로써 양성 형질전환체의 선택을 위한 서열을 포함했다.
실시예 5: 곤충 세포 배양에서 발현
배양된 곤충 세포에서 LCAT cDNA 를 발현하기 위해 바큘로바이러스 발현 시스템을 사용하였다.
바큘로바이러스 발현 구축물 pCGN9992, pCGN9993, pCGN9994, pCGN10900, pCGN10962, 및 pCGN10967을 형질전환하고 제조자의 지시에 따라서 BAC-to-BAC 바큘로바이러스 발현 시스템 (Baculovirus Expression System) (Gibco-BRL, Gaithersburg, MD)을 사용하여 발현하였다.
형질전환된 곤충 세포를 당업계에 공지된 방법을 사용하여 아실전달효소 활성을 검정하기 위해 사용하였다 (실시예 8 참조).
실시예 6: 식물 형질전환
표현형 변화에 영향을 주기 위해 서열의 전사 또는 전사 및 번역을 수득하기 위해 관심 있는 DNA 서열을 식물 숙주의 게놈내로 삽입하기 위한 다양한 방법이 개발되었다. 트랜스제닉 식물은 Radke 등에 의해 기재된 아그로박테리움 매개 형질전환 방법에 의해 수득되었다 (Theor. Appl. Genet. (1988) 75:685-694; Plant Cell Reports (1992) 11:499-505). 대안적으로, Klein 등에 의해 기재된 것 (Bio/Technology 10:286-291)과 같은, 미세사출 충격 방법을 또한 사용하여 핵 형질전환된 식물을 수득할 수 있다. 다른 식물 종이 관련된 기술을 사용하여 유사하게 형질전환될 수 있다.
상기에 기재된 식물 바이너리 구축물이 식물 조직에서의 스테롤 아실전달효소의 발현을 이끌기 위해 식물 형질전환에 사용되었다. 바이너리 벡터 구축물을 Holsters 등 (Mol. Gen. Genet. (1978) 163:181-187)의 방법에 의해, 균주 EHA101 아그로박테리움 세포 (Hood 등, J. Bacteriol (1986) 168:1291-1301)내로 형질전환하였다. 형질전환 아라비돕시스 탈리아나 식물은 Valverkens 등 (Proc. Nat. Acad. Sci. (1988) 85:5536-5540), Bent 등 ((1994), Science 265:1856-1860), 및 Bechtold 등 ((1993), C. R. Acad. Sci., Life Sciences 316:1194-1199)에 기재된 아그로박테리움 매개 형질전환에 의해 수득되었다.
실시예 7: 변형된 스테롤 함량/프로필에 대한 식물 검정
7A: T2 종자의 NMR
나핀 프로모터의 조절하에 LCAT 1 내지 4를 발현하는 식물의 종자를 NMR에 의해 분석하였다. 트랜스제닉 식물의 아라비돕시스 종자를 광구 (wide-mouth) MAS NMR 시료 튜브내로 직접 위치하였다.
고 해상도 스펙트럼을 11.7 T (1H=500 MHz, 13C=125 mHz)에서 탄소 관찰 (carbon-observe) MAS NanoprobesTM 으로 장착된 Varian NMR 장치(Palo Alto, CA) InovaTM NMR 분광계를 사용하여 측정하였다. 13C 스펙트럼은 하기 조건을 사용하여 14시간 동안 주위 온도 (대략 21-22℃)에서 전계 주파수 잠금 없이 수득되었다: 스펙트럼 폭=29.996 kHz, 포착 시간 (acquisition time) = 2.185 초, 이완 지연이 없는 p/2 펄스 (3.8 ms), 1H g B2 = 왈츠 감결합(Waltz decoupling)과 함께 2.5 kHz. 데이타 가공 조건은 전형적으로 디지탈 해상도 = 0.11 Hz, 처음 3개 데이타 포인트의 0.3 내지 1.5 Hz 라인 확대 및 시간 전환 선형 예상이었다. 화학적 이동은 순수한 테트라메틸실란 (TMS)를 아라비돕시스 종자에 첨가하고, 부차적인 스펙트럼을 위해 생성된 기준 변수를 사용함으로써 참고되었다. 13C 해상도는 가장 좁은 종자 공명에 대해 2-3 Hz 이었다. 스펙트럼 해상도는 MAS 스핀 속도(1.5-3.5 kHz)에 무관하고 데이타는 전형적으로 1.5 kHz 스핀 속도로써 수득되었다. 스핀 측면밴드는 주 공명의 대략 1% 이었다. 피토스테롤 13C 지정은 트리올레인, β-시토스테롤 및 콜레스테롤 올레에이트로 구성된 모델 시료에 기초하였다. 트리아실글리세롤 13C 지정은 문헌 지정 또는 13C NMR 데이타베이스로부터 계산된 이동과의 비교로부터 행해졌다 (Advanced Chemical Development, Inc., version 3.50, Toronto Canada).
이 분석 결과는 도 2에 도시되고 나핀 프로모터의 조절하에 LCAT4 유전자 (pCGN9998)를 발현하는 식물 라인 5로부터 유래된 종자에서 피토스테롤의 대략 2배의 증가의 경향이 있다는 것을 보여준다. 이 분석 과정 동안 또한 나핀 프로모터의 조절하에 LCAT2 구축물 (pCGN9983)을 발현하는 식물의 종자의 평균 오일 함량이 대조군의 것보다 높다는 것이 주목되었다. 이것은 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 핵산 서열의 과발현이 오일 함량을 증가시킬 수 있다는 개념을 지지하는 식물에서 첫 증거이다.
7B: T2 종자의 HPLC/MS
나핀 프로모터의 조절하에 LCAT1 내지 4를 발현하는 T2 식물의 종자 오일을 가속화된 용매 추출기 (ASE) 방법을 사용하여 추출하였다. 종자 시료를 막자 사발 및 막자를 사용하여 분쇄하여 미세 균질 곡식을 수득하였다. 오일을 디오넥스(Dionex) 가속화된 용매 추출기 (ASE)를 사용하여 수득하였다. 깨끗한 분쇄 종자를 동일한 양의 규조토에 첨가하였다. 분쇄한 종자 시료 및 규조토를 균질감이 수득될 때까지 철저히 혼합하였다. 시료를 이어서 장치에 로딩하고 오일 추출을 인증된 실험실 절차아래 헥산을 사용하여 수행하였다.
이러한 종자 시료의 오일을 이어서 유리 캄페스테롤, 스티그마스테롤, 및 시토스테롤에 대해 HPLC/MS를 사용하여 스테롤 에스테르 및 이의 지방산 에스테르 분석을 실시하였다. 대략 0.1g 오일을 함유한 자동시료장치(autosampler) 바이알에 0.3 mL CDCl3을 첨가하였다. 100㎕의 상기 용액을 900㎕의 CHCl3 에 첨가하였다. 5㎕의 상기 희석된 시료를 이어서 양이온 대기압 이온화를 가진 HPLC/MS에 주입하였다. 오일 중의 개개의 성분을 시리즈로 두 개의 4.6 x 50 mm C8 Zorbax 칼럼 및 아세토니트릴 및 40% CHCl3를 가진 아세토니트릴을 사용한 구배를 사용하여 분리하였다. 스테롤 농도는 각 스테롤 및 이의 지방산이 동일한 몰 반응을 가지는 것으로 하여 계산되었다. 이것은 콜레스테롤 및 이의 에스테르의 경우에 관찰되었고 캄페스테롤, 스티그마스테롤, 및 시토스테롤의 경우에는 가정되었다. 본 연구에서, 스티그마스테롤로서 확인된 스테롤은 실제로 상기 화합물의 이성질체였다.
상기 분석 결과는 도 3 및 4에 도시되고 나핀 프로모터의 조절하에 LCAT3 (pCGN9968)을 발현하는 7개 T2 식물 라인 중에서 6개로부터 유래된 종자에서 50%의 정도로 스테롤 에스테르 증가가 있었다는 것을 보여준다.
실시예 8: 스테롤 에스테르화 활성을 위한 바큘로바이러스 곤충 세포 배양
바큘로바이러스 발현 구축물 pCGN9992, pCGN9993, pCGN9994, 및 pCGN10900 (실시예 4 참조)을 형질전환하고 재조합 바이러스를 트랜스펙션 후 5일에 수확하는 것을 제외하고는 제조자의 지시에 따라서 BAC-to-BAC 바큘로바이러스 발현 시스템 (Baculovirus Expression System) (Gibco-BRL, Gaithersburg, MD)을 사용하여 발현하였다. 트랜스펙션 혼합물의 상징액을 차례로 검정에서 Sf9 세포를 감염시키기 위해 사용되는 바이러스 스톡을 생성하기 위해 사용하였다.
형질전환된 세포를 본원에 기재된 방법을 사용하여 레시틴:스테롤 아실전달효소 활성을 검정하였다. 곤충 세포를 원심분리하고 생성된 세포 펠렛을 즉시 사용하거나 이후 분석을 위해 -70℃에 저장하였다. 세포를 배지 A (100 mM Tricine/NaOH, pH7.8, 10%(w/v) 글리세롤, 0.1 μM 아프로티닌 (Aprotinin), 1 μM 루펩틴, 및 100 μM Pefabloc 를 가진 280 mM NaCl (모두 Boehringer Mannheim, Germany 공급))에 재현탁시키고 음파처리(2x 10초)에 의해 용혈시켰다. 세포벽 및 다른 찌꺼기를 원심분리 (14,000 x g , 10분, 4℃)하여 침전시켰다. 상징액을 새로운 바이알로 옮기고 막을 원심분리에 의해 (100,000 x g, Ti 70.1 로터, 4℃에서 1시간 동안 46,000 rpm) 침전시켰다. 총 막을 배지 A에 재현탁시켰다. 레시틴:스테롤 아실전달효소 활성을 100 mM Tris/HCl, pH 7, 28 mM NaCl, 0.03% Triton X-100, 0.1 mM 시토스테롤, 20μM 1,2-[14C]-팔미토일-포스파티딜 콜린 (246420 dpm/nmole), 및 0.05-20 mg 의 막 단백질을 포함한 0.1ml 반응 혼합물에서 검정하였다. 30℃에서 15분 후에, 냉각 담체로서 100㎍ 콜레스테롤 및 콜레스테롤 에스테르를 함유한 0.5 ml 용액의 메틸렌 클로라이드:메탄올 (4:1, v/v)의 첨가로 반응을 종결시켰다. 바닥 유기층의 일부 (0.1ml)를 제거하고 질소 기체하에 증발시켰다. 농축된 추출물을 30㎕의 헥산에 재현탁시키고 실리카 겔-G 박층 크로마토그래피 플레이트상에 스폿하였다. 플레이트를 헥산:디에틸 에테르:아세트산 (80:20:1)에서 상단으로 이동시키고 이어서 공기 건조시켰다. 방사능을 저 에너지 포스포르 이미징 스크린(Low Energy Phosphor-imaging Screen)에 노출하여 결정하였다. 노출에 이어, 스크린을 포스포르이미저상에서 해독하였다.
바큘로바이러스 막에서 pCGN10900의 LCAT4 단백질은 콜레스테롤 에스테르가 이동한 TLC 플레이트의 부위에 방사능 스폿을 보여주었는데, 이는 LCAT4가 레시틴 (PC)에서 시토스테롤로의 아실기의 전이를 촉매하여 시토스테롤 에스테르를 만드는 능력을 가지는 것을 나타낸다.
실시예 9: 변형된 지질 함량에 대한 식물 검정
Nir (적외선 근처 분광학 스펙트럼 스캐닝)를 스펙트럼 보정 곡선이 개발되고 종자 오일 함량에 대해 인증된다면, 비파괴적인 방식으로 아라비돕시스 종자의 총 오일 함량을 결정하기 위해 사용될 수 있다. 종자 오일 스펙트럼 보정 곡선이 85 아라비돕시스 식물로부터의 종자 시료를 사용하여 개발되었다. 종자를 깨끗이 하고 Foss NIR 모델 6500 (Foss-Nirs Systems, Inc.)를 사용하여 스캔하였다. 시료당 대략 50 내지 100 밀리그램의 전체 종자를 미니-인서트 [IH-0337]로 구성된 석영 렌즈 [IH-0307]과 함께 미니 시료 링 컵에 팩킹하고 스펙트럼 데이타를 수득하기 위해 반사율 방식으로 스캔하였다. 종자 시료를 이어서 막자 사발 및 막자를 사용하여 분쇄하여 미세 균질 곡식을 수득하였다. 분쇄 시료를 가속화된 용매 추출기 (ASE)를 사용하여 오일을 측정하였다.
총 오일 함량의 측정을 디오넥스 가속화된 용매 추출기 (ASE)상에서 수행하였다. 대략 500mg의 깨끗한 분쇄 종자를 9 x 9 cm 무게 접시상에 거의 0.1mg까지 무게를 달았다. 동일한 양의 규조토를 거의 0.01g 까지 정확하게 톱-로딩 저울을 사용하여 첨가하였다. 분쇄 종자 시료 및 규조토를 균질감이 수득될 때까지 철저히 혼합하였다. 시료를 장치상에 로딩하고 오일 추출을 인증된 실험실 절차아래 헥산을 사용하여 수득하였다. 표준 평지의 씨 시료를 Community Bureau of Reference (BCR)로부터 수득하였다. ASE 추출 방법은 BCR 기준 표준을 사용하여 인증되었다. 99% 내지 100%의 총 오일% 회수가 달성되었다. "As-is" 오일 함량은 하기 식을 사용하여 거의 0.01 질량% 까지 계산되었다:
오일 함량 = 100% x (바이알 + 추출된 오일 중량 - 초기 바이알 중량) / (시료 중량)
ASE에 의해 생성된 분석 데이타를 스펙트럼 보정을 수행하기 위해 사용하였다. Nir 보정식은 NirSytems winisi 소프트웨어내에서 짜 넣은 통계 팩키지를 사용하여 생성되었다. 소프트웨어의 스펙트럼 보정 부분은 보정 및 자가 인증을 할 수 있다. 총 85개의 시료로부터, 57개의 시료를 총 오일% 보정을 생성하기 위해 사용하였다. 남은 시료를 오일 보정을 인증하기 위해 사용하였다. 최적화된 다듬질, 편차 크기, 및 수학적 처리 (변형된 부분적인 최소 제곱)를 보정을 생성하기 위해 이용하였다. 각각의 보정을 생성하는데 사용하지 않은 시료를 인증 세트로서 사용하였다. 상관계수 (R), 결정계수 (R2), 표준 오차 예상치 (SEP), 바이어스에 대해 보정된 표준 오차 예상치(SEPC)와 같은 통계적인 도구를 사용하여 보정식을 평가하였다.
LCAT 유전자로써 형질전환된 식물의 T2 종자를 깨끗이 하고 Foss NIR 모델 6500 (Foss-Nirs Systems, Inc.)를 사용하여 스캔하였다. 시료당 대략 50 내지 100 밀리그램의 전체 종자를 미니-인서트 [IH-0337]로 구성된 석영 렌즈 [IH-0307]과 함께 미니 시료 링 컵에 팩킹하고 스펙트럼 데이타를 수득하기 위해 반사율 방식으로 스캔하였다. 각 종자 시료 중의 오일%는 상기에 기재된 종자 오일 스펙트럼 보정 곡선을 사용하여 결정하였다.
상기 분석 결과는 도 5 및 표 2에 나타나고, LCAT2 유전자를 발현하는 T2 식물의 종자의 오일 수준의 현저한 증가가 있었다는 것을 보여준다. 오일에서 이 증가는 LCAT2가 35S 구성 프로모터 또는 종자 특이성 나핀 프로모터에 의해 유도될 경우에 식물에서 관찰되었다. 이 결과는 레시틴:콜레스테롤 아실전달효소 유사 폴리펩티드를 코딩하는 핵산 서열의 과발현이 식물에서 종자 오일 생산을 증가시킬 수 있다는 것을 보여준다.
Figure 112008036079300-PAT00001
상기에 제시된 본 발명의 상세한 설명 및 실시예의 견지에서, 본 발명의 몇 가지 면이 달성되었다고 인식될 수 있다.
본 발명은 설명 및 실시예에 의해 상세히 기재되어 당업자로 하여금 본 발명, 이의 원리, 및 이의 실질적인 적용을 알게 한다고 이해된다. 본 발명의 특정 제제 및 방법은 제시된 특정 구현예의 설명에 제한되지 않고, 오히려 설명 및 실시예는 따르는 청구항 및 이의 균등물의 견지에서 보아야 한다. 상기 실시예 및 설명의 일부가 본 발명이 기능할 수 있는 방법에 관한 일부 결론을 포함하지만, 발명자는 그러한 결론 및 기능에 구속되지 않고, 이들을 단지 가능한 설명으로서 제시할 의도이다.
설명된 본 발명의 특정 구현예는 본 발명을 총망라 또는 제한한 의도는 아니고, 많은 대안, 변형, 및 변이가 전술한 실시예 및 상세한 설명의 견지에서 당업자에게 명백할 것이라는 것이 추가로 이해되어야 한다. 따라서, 본 발명은 하기 청구항의 정신 및 범위내에 해당하는 모든 그러한 대안, 변형, 및 변이를 포함할 의도이다.
본 발명의 상기 및 다른 특징, 면, 및 이점이 하기 설명, 첨부된 청구항 및 첨부 도면에 관하여 더욱 잘 이해될 것이다:
도 1은 효모, 인간 및 래트의 레시틴:콜레스테롤 아실전달효소 단백질 서열과 아라비돕시스 (Arabidopsis) LCAT1, LCAT2, LCAT3, 및 LCAT4 연역된 아미노산 서열의 정렬을 보여준다.
도 2는 나핀 (napin) 프로모터 (pCGN9998) 조절하에 LCAT4를 발현하는 식물의 T2 종자에 대한 NMR 스테롤 에스테르 분석 결과를 보여준다.
도 3은 나핀 프로모터의 조절하에 대조군 라인(pCGN8640) 및 LCAT3 (pCGN9968)을 발현하는 라인의 T2 종자로부터 추출된 오일에 대한 HPLC/MS 스테롤 분석 결과를 보여준다.
도 4는 나핀 프로모터의 조절하에 대조군 라인(pCGN8640), 및 LCAT1 (pCGN9962), LCAT2 (pCGN9983), LCAT3 (pCGN9968) 및 LCAT4 (pCGN9998)을 발현하는 식물 라인의 T2 종자로부터 추출된 오일에 대한 HPLC/MS 스테롤 분석 결과를 보여준다. 부가적으로, 35S 프로모터(pCGN9996)의 조절하에 LCAT4를 발현하는 3개 라인의 데이타를 보여준다.
도 5는 나핀 프로모터의 조절하에 대조군 라인(pCGN8640), 및 LCAT1 (pCGN9962), LCAT2 (pCGN9983), 및 LCAT3 (pCGN9968)을 발현하는 식물 라인의 T2 종자의 오일 함량의 Nir 분석 결과를 보여준다. 부가적으로, 35S 프로모터(pCGN9981)의 조절하에 LCAT2를 발현하는 16개 라인의 데이타를 보여준다.
SEQUENCE LISTING <110> Monsanto Company <120> PLANT STEROL ACYLTRANSFERASES <130> MTC6718 <140> <141> <150> 60/152,493 <151> 1999-08-30 <160> 80 <170> PatentIn Ver. 2.1 <210> 1 <211> 440 <212> PRT <213> Homo sapiens <400> 1 Met Gly Pro Pro Gly Ser Pro Trp Gln Trp Val Thr Leu Leu Leu Gly 1 5 10 15 Leu Leu Leu Pro Pro Ala Ala Pro Phe Trp Leu Leu Asn Val Leu Phe 20 25 30 Pro Pro His Thr Thr Pro Lys Ala Glu Leu Ser Asn His Thr Arg Pro 35 40 45 Val Ile Leu Val Pro Gly Cys Leu Gly Asn Gln Leu Glu Ala Lys Leu 50 55 60 Asp Lys Pro Asp Val Val Asn Trp Met Cys Tyr Arg Lys Thr Glu Asp 65 70 75 80 Phe Phe Thr Ile Trp Leu Asp Leu Asn Met Phe Leu Pro Leu Gly Val 85 90 95 Asp Cys Trp Ile Asp Asn Thr Arg Val Val Tyr Asn Arg Ser Ser Gly 100 105 110 Leu Val Ser Asn Ala Pro Gly Val Gln Ile Arg Val Pro Gly Phe Gly 115 120 125 Lys Thr Tyr Ser Val Glu Tyr Leu Asp Ser Ser Lys Leu Ala Gly Tyr 130 135 140 Leu His Thr Leu Val Gln Asn Leu Val Asn Asn Gly Tyr Val Arg Asp 145 150 155 160 Glu Thr Val Arg Ala Ala Pro Tyr Asp Trp Arg Leu Glu Pro Gly Gln 165 170 175 Gln Glu Glu Tyr Tyr Arg Lys Leu Ala Gly Leu Val Glu Glu Met His 180 185 190 Ala Ala Tyr Gly Lys Pro Val Phe Leu Ile Gly His Ser Leu Gly Cys 195 200 205 Leu His Leu Leu Tyr Phe Leu Leu Arg Gln Pro Gln Ala Trp Lys Asp 210 215 220 Arg Phe Ile Asp Gly Phe Ile Ser Leu Gly Ala Pro Trp Gly Gly Ser 225 230 235 240 Ile Lys Pro Met Leu Val Leu Ala Ser Gly Asp Asn Gln Gly Ile Pro 245 250 255 Ile Met Ser Ser Ile Lys Leu Lys Glu Glu Gln Arg Ile Thr Thr Thr 260 265 270 Ser Pro Trp Met Phe Pro Ser Arg Met Ala Trp Pro Glu Asp His Val 275 280 285 Phe Ile Ser Thr Pro Ser Phe Asn Tyr Thr Gly Arg Asp Phe Gln Arg 290 295 300 Phe Phe Ala Asp Leu His Phe Glu Glu Gly Trp Tyr Met Trp Leu Gln 305 310 315 320 Ser Arg Asp Leu Leu Ala Gly Leu Pro Ala Pro Gly Val Glu Val Tyr 325 330 335 Cys Leu Tyr Gly Val Gly Leu Pro Thr Pro Arg Thr Tyr Ile Tyr Asp 340 345 350 His Gly Phe Pro Tyr Thr Asp Pro Val Gly Val Leu Tyr Glu Asp Gly 355 360 365 Asp Asp Thr Val Ala Thr Arg Ser Thr Glu Leu Cys Gly Leu Trp Gln 370 375 380 Gly Arg Gln Pro Gln Pro Val His Leu Leu Pro Leu His Gly Ile Gln 385 390 395 400 His Leu Asn Met Val Phe Ser Asn Leu Thr Leu Glu His Ile Asn Ala 405 410 415 Ile Leu Leu Gly Ala Tyr Arg Gln Gly Pro Pro Ala Ser Pro Thr Ala 420 425 430 Ser Pro Glu Pro Pro Pro Pro Glu 435 440 <210> 2 <211> 1299 <212> DNA <213> Arabidopsis thaliana <400> 2 atgaaaaaaa tatcttcaca ttattcggta gtcatagcga tactcgttgt ggtgacgatg 60 acctcgatgt gtcaagctgt gggtagcaac gtgtaccctt tgattctggt tccaggaaac 120 ggaggtaacc agctagaggt acggctggac agagaataca agccaagtag tgtctggtgt 180 agcagctggt tatatccgat tcataagaag agtggtggat ggtttaggct atggttcgat 240 gcagcagtgt tattgtctcc cttcaccagg tgcttcagcg atcgaatgat gttgtactat 300 gaccctgatt tggatgatta ccaaaatgct cctggtgtcc aaacccgggt tcctcatttc 360 ggttcgacca aatcacttct atacctcgac cctcgtctcc gagatgccac atcttacatg 420 gaacatttgg tgaaagctct agagaaaaaa tgcgggtatg ttaacgacca aaccatccta 480 ggagctccat atgatttcag gtacggcctg gctgcttcgg gccacccgtc ccgtgtagcc 540 tcacagttcc tacaagacct caaacaattg gtggaaaaaa ctagcagcga gaacgaagga 600 aagccagtga tactcctctc ccatagccta ggaggacttt tcgtcctcca tttcctcaac 660 cgtaccaccc cttcatggcg ccgcaagtac atcaaacact ttgttgcact cgctgcgcca 720 tggggtggga cgatctctca gatgaagaca tttgcttctg gcaacacact cggtgtccct 780 ttagttaacc ctttgctggt cagacggcat cagaggacct ccgagagtaa ccaatggcta 840 cttccatcta ccaaagtgtt tcacgacaga actaaaccgc ttgtcgtaac tccccaggtt 900 aactacacag cttacgagat ggatcggttt tttgcagaca ttggattctc acaaggagtt 960 gtgccttaca agacaagagt gttgccttta acagaggagc tgatgactcc gggagtgcca 1020 gtcacttgca tatatgggag aggagttgat acaccggagg ttttgatgta tggaaaagga 1080 ggattcgata agcaaccaga gattaagtat ggagatggag atgggacggt taatttggcg 1140 agcttagcag ctttgaaagt cgatagcttg aacaccgtag agattgatgg agtttcgcat 1200 acatctatac ttaaagacga gatcgcactt aaagagatta tgaagcagat ttcaattatt 1260 aattatgaat tagccaatgt taatgccgtc aatgaatga 1299 <210> 3 <211> 432 <212> PRT <213> Arabidopsis thaliana <400> 3 Met Lys Lys Ile Ser Ser His Tyr Ser Val Val Ile Ala Ile Leu Val 1 5 10 15 Val Val Thr Met Thr Ser Met Cys Gln Ala Val Gly Ser Asn Val Tyr 20 25 30 Pro Leu Ile Leu Val Pro Gly Asn Gly Gly Asn Gln Leu Glu Val Arg 35 40 45 Leu Asp Arg Glu Tyr Lys Pro Ser Ser Val Trp Cys Ser Ser Trp Leu 50 55 60 Tyr Pro Ile His Lys Lys Ser Gly Gly Trp Phe Arg Leu Trp Phe Asp 65 70 75 80 Ala Ala Val Leu Leu Ser Pro Phe Thr Arg Cys Phe Ser Asp Arg Met 85 90 95 Met Leu Tyr Tyr Asp Pro Asp Leu Asp Asp Tyr Gln Asn Ala Pro Gly 100 105 110 Val Gln Thr Arg Val Pro His Phe Gly Ser Thr Lys Ser Leu Leu Tyr 115 120 125 Leu Asp Pro Arg Leu Arg Asp Ala Thr Ser Tyr Met Glu His Leu Val 130 135 140 Lys Ala Leu Glu Lys Lys Cys Gly Tyr Val Asn Asp Gln Thr Ile Leu 145 150 155 160 Gly Ala Pro Tyr Asp Phe Arg Tyr Gly Leu Ala Ala Ser Gly His Pro 165 170 175 Ser Arg Val Ala Ser Gln Phe Leu Gln Asp Leu Lys Gln Leu Val Glu 180 185 190 Lys Thr Ser Ser Glu Asn Glu Gly Lys Pro Val Ile Leu Leu Ser His 195 200 205 Ser Leu Gly Gly Leu Phe Val Leu His Phe Leu Asn Arg Thr Thr Pro 210 215 220 Ser Trp Arg Arg Lys Tyr Ile Lys His Phe Val Ala Leu Ala Ala Pro 225 230 235 240 Trp Gly Gly Thr Ile Ser Gln Met Lys Thr Phe Ala Ser Gly Asn Thr 245 250 255 Leu Gly Val Pro Leu Val Asn Pro Leu Leu Val Arg Arg His Gln Arg 260 265 270 Thr Ser Glu Ser Asn Gln Trp Leu Leu Pro Ser Thr Lys Val Phe His 275 280 285 Asp Arg Thr Lys Pro Leu Val Val Thr Pro Gln Val Asn Tyr Thr Ala 290 295 300 Tyr Glu Met Asp Arg Phe Phe Ala Asp Ile Gly Phe Ser Gln Gly Val 305 310 315 320 Val Pro Tyr Lys Thr Arg Val Leu Pro Leu Thr Glu Glu Leu Met Thr 325 330 335 Pro Gly Val Pro Val Thr Cys Ile Tyr Gly Arg Gly Val Asp Thr Pro 340 345 350 Glu Val Leu Met Tyr Gly Lys Gly Gly Phe Asp Lys Gln Pro Glu Ile 355 360 365 Lys Tyr Gly Asp Gly Asp Gly Thr Val Asn Leu Ala Ser Leu Ala Ala 370 375 380 Leu Lys Val Asp Ser Leu Asn Thr Val Glu Ile Asp Gly Val Ser His 385 390 395 400 Thr Ser Ile Leu Lys Asp Glu Ile Ala Leu Lys Glu Ile Met Lys Gln 405 410 415 Ile Ser Ile Ile Asn Tyr Glu Leu Ala Asn Val Asn Ala Val Asn Glu 420 425 430 <210> 4 <211> 1641 <212> DNA <213> Arabidopsis thaliana <400> 4 atgggagcga attcgaaatc agtaacggct tccttcaccg tcatcgccgt ttttttcttg 60 atttgcggtg gccgaactgc ggtggaggat gagaccgagt ttcacggcga ctactcgaag 120 ctatcgggta taatcattcc gggatttgcg tcgacgcagc tacgagcgtg gtcgatcctt 180 gactgtccat acactccgtt ggacttcaat ccgctcgacc tcgtatggct agacaccact 240 aagcttcttt ctgctgtcaa ctgctggttt aagtgtatgg tgctagatcc ttataatcaa 300 acagaccatc ccgagtgtaa gtcacggcct gacagtggtc tttcagccat cacagaattg 360 gatccaggtt acataacagg tcctctttct actgtctgga aagagtggct taagtggtgt 420 gttgagtttg gtatagaagc aaatgcaatt gtcgctgttc catacgattg gagattgtca 480 ccaaccaaat tggaagagcg tgacctttac tttcacaagc tcaagttgac ctttgaaact 540 gctttaaaac tccgtggcgg cccttctata gtatttgccc attcaatggg taataatgtc 600 ttcagatact ttctggaatg gctgaggcta gaaattgcac caaaacatta tttgaagtgg 660 cttgatcagc atatccatgc ttatttcgct gttggagctc ctcttcttgg ttctgttgag 720 gcaatcaaat ctactctctc tggtgtaacg tttggccttc ctgtttctga gggaactgct 780 cggttgttgt ccaattcttt tgcgtcgtca ttgtggctta tgccattttc aaagaattgc 840 aagggtgata acacatcctg gacgcatttt tctgggggtg ctgcaaagaa agataagcgc 900 gtataccact gtgatgaaga ggaatatcaa tcaaaatatt ctggctggcc gacaaatatt 960 attaacattg aaattccttc cactagcgtt acagaaacag ctctagtcaa catgaccagc 1020 atggaatgtg gccttcccac ccttttgtct ttcacagccc gtgaactagc agatgggact 1080 cttttcaaag caatagaaga ctatgaccca gatagcaaga ggatgttaca ccagttaaag 1140 aagttgtatc atgatgaccc tgtttttaat cctctgactc cttgggagag accacctata 1200 aaaaatgtat tttgcatata tggtgctcat ctaaagacag aggttggtta ttactttgcc 1260 ccaagtggca aaccttatcc tgataattgg atcatcacgg atatcattta cgaaactgaa 1320 ggttccctcg tgtcaaggtc tggaactgtg gttgatggga acgctggacc tataactggg 1380 gatgagacgg taccctatca ttcactctct tggtgcaaga attggctcgg acctaaagtt 1440 aacataacaa tggctcccca gccagaacac gatggaagcg acgtacatgt ggaactaaat 1500 gttgatcatg agcatgggtc agacatcata gctaacatga caaaagcacc aagggttaag 1560 tacataacct tttatgaaga ctctgagagc attccgggga agagaaccgc agtctgggag 1620 cttgataaaa gtgggtatta a 1641 <210> 5 <211> 546 <212> PRT <213> Arabidopsis thaliana <400> 5 Met Gly Ala Asn Ser Lys Ser Val Thr Ala Ser Phe Thr Val Ile Ala 1 5 10 15 Val Phe Phe Leu Ile Cys Gly Gly Arg Thr Ala Val Glu Asp Glu Thr 20 25 30 Glu Phe His Gly Asp Tyr Ser Lys Leu Ser Gly Ile Ile Ile Pro Gly 35 40 45 Phe Ala Ser Thr Gln Leu Arg Ala Trp Ser Ile Leu Asp Cys Pro Tyr 50 55 60 Thr Pro Leu Asp Phe Asn Pro Leu Asp Leu Val Trp Leu Asp Thr Thr 65 70 75 80 Lys Leu Leu Ser Ala Val Asn Cys Trp Phe Lys Cys Met Val Leu Asp 85 90 95 Pro Tyr Asn Gln Thr Asp His Pro Glu Cys Lys Ser Arg Pro Asp Ser 100 105 110 Gly Leu Ser Ala Ile Thr Glu Leu Asp Pro Gly Tyr Ile Thr Gly Pro 115 120 125 Leu Ser Thr Val Trp Lys Glu Trp Leu Lys Trp Cys Val Glu Phe Gly 130 135 140 Ile Glu Ala Asn Ala Ile Val Ala Val Pro Tyr Asp Trp Arg Leu Ser 145 150 155 160 Pro Thr Lys Leu Glu Glu Arg Asp Leu Tyr Phe His Lys Leu Lys Leu 165 170 175 Thr Phe Glu Thr Ala Leu Lys Leu Arg Gly Gly Pro Ser Ile Val Phe 180 185 190 Ala His Ser Met Gly Asn Asn Val Phe Arg Tyr Phe Leu Glu Trp Leu 195 200 205 Arg Leu Glu Ile Ala Pro Lys His Tyr Leu Lys Trp Leu Asp Gln His 210 215 220 Ile His Ala Tyr Phe Ala Val Gly Ala Pro Leu Leu Gly Ser Val Glu 225 230 235 240 Ala Ile Lys Ser Thr Leu Ser Gly Val Thr Phe Gly Leu Pro Val Ser 245 250 255 Glu Gly Thr Ala Arg Leu Leu Ser Asn Ser Phe Ala Ser Ser Leu Trp 260 265 270 Leu Met Pro Phe Ser Lys Asn Cys Lys Gly Asp Asn Thr Ser Trp Thr 275 280 285 His Phe Ser Gly Gly Ala Ala Lys Lys Asp Lys Arg Val Tyr His Cys 290 295 300 Asp Glu Glu Glu Tyr Gln Ser Lys Tyr Ser Gly Trp Pro Thr Asn Ile 305 310 315 320 Ile Asn Ile Glu Ile Pro Ser Thr Ser Val Thr Glu Thr Ala Leu Val 325 330 335 Asn Met Thr Ser Met Glu Cys Gly Leu Pro Thr Leu Leu Ser Phe Thr 340 345 350 Ala Arg Glu Leu Ala Asp Gly Thr Leu Phe Lys Ala Ile Glu Asp Tyr 355 360 365 Asp Pro Asp Ser Lys Arg Met Leu His Gln Leu Lys Lys Leu Tyr His 370 375 380 Asp Asp Pro Val Phe Asn Pro Leu Thr Pro Trp Glu Arg Pro Pro Ile 385 390 395 400 Lys Asn Val Phe Cys Ile Tyr Gly Ala His Leu Lys Thr Glu Val Gly 405 410 415 Tyr Tyr Phe Ala Pro Ser Gly Lys Pro Tyr Pro Asp Asn Trp Ile Ile 420 425 430 Thr Asp Ile Ile Tyr Glu Thr Glu Gly Ser Leu Val Ser Arg Ser Gly 435 440 445 Thr Val Val Asp Gly Asn Ala Gly Pro Ile Thr Gly Asp Glu Thr Val 450 455 460 Pro Tyr His Ser Leu Ser Trp Cys Lys Asn Trp Leu Gly Pro Lys Val 465 470 475 480 Asn Ile Thr Met Ala Pro Gln Pro Glu His Asp Gly Ser Asp Val His 485 490 495 Val Glu Leu Asn Val Asp His Glu His Gly Ser Asp Ile Ile Ala Asn 500 505 510 Met Thr Lys Ala Pro Arg Val Lys Tyr Ile Thr Phe Tyr Glu Asp Ser 515 520 525 Glu Ser Ile Pro Gly Lys Arg Thr Ala Val Trp Glu Leu Asp Lys Ser 530 535 540 Gly Tyr 545 <210> 6 <211> 1608 <212> DNA <213> Arabidopsis thaliana <400> 6 atgtctctat tactggaaga gatcattaga tcagtagagg ctttgctgaa gctcagaaat 60 cggaatcaag aaccctatgt tgacccgaat ctaaacccgg ttcttctagt tccaggaatc 120 gctggatcaa ttctaaacgc cgttgatcat gagaacggga acgaagaacg tgtttgggtt 180 aggatctttg gtgctgatca tgagtttcga acaaagatgt ggtctcgatt tgatccttca 240 actggtaaaa cgatatctct tgatccaaaa acgagtattg ttgttcctca agacagagct 300 gggctacatg caattgatgt cttagaccct gatatgattg ttggccgtga gtctgtgtac 360 tatttccatg agatgattgt tgagatgatc ggatggggat ttgaagaagg gaaaaccctt 420 tttggttttg gttatgattt ccgccaaagc aacagactgc aggaaacgtt ggaccagttt 480 gctaaaaagt tggaaactgt ttataaagcc tcaggagaga agaagattaa tgttattagt 540 cattctatgg gaggactatt ggtgaaatgt ttcatgggtc tgcatagtga tatattcgag 600 aagtatgtac agaattggat tgctattgct gctccatttc gaggtgctcc tggatatatc 660 acatcgactt tattgaatgg aatgtcgttt gtcaatggtt gggaacagaa ctttttcgtc 720 tctaagtgga gcatgcatca gctgcttatt gagtgtccat ccatatatga gctgatgtgt 780 tgtccgtatt ttaaatggga gctccctccc gtcttagagc tgtggagaga gaaagagagc 840 aatgatggag ttggaacctc tgatgttgtt cttgagtctt accgtagcct ggagagcctt 900 gaagttttta cgaaatctct ttcgaataat acagctgatt attgtggaga gtcgatcgat 960 cttcctttta actggaagat catggagtgg gctcacaaaa ccaagcaagt attagcctct 1020 gccaagctgc ctccgaaagt taaattctat aacatatatg ggaccaatct agaaacccct 1080 catagtgttt gctatgggaa tgagaagatg cccgttaaag atctaacgaa tctaagatac 1140 ttccagccga catatatatg cgtggatggt gatggcacag tcccgatgga atctgccatg 1200 gcggatgggc ttgaagcagt agcaagagtt ggagtccctg gtgagcaccg aggaatcctc 1260 aacgatcacc gtgtcttccg aatgctcaaa aaatggctaa atgtaggcga accagacccg 1320 ttctacaacc cagtaaacga ttatgtcatc cttcccacca catatgaatt tgagaaattc 1380 catgagaatg gactcgaggt tgcttccgtg aaagaatcgt gggacatcat atcagatgac 1440 aacaatatcg gcacaaccgg gtcaaccgtg aactccatat cagtctctca acctggagat 1500 gatcaaaacc ctcaagctga agctcgtgca accttaaccg tccaaccaca aagcgatggt 1560 agacaacatg tagagctcaa tgctgtaagt gtctctgttg atgcataa 1608 <210> 7 <211> 535 <212> PRT <213> Arabidopsis thaliana <400> 7 Met Ser Leu Leu Leu Glu Glu Ile Ile Arg Ser Val Glu Ala Leu Leu 1 5 10 15 Lys Leu Arg Asn Arg Asn Gln Glu Pro Tyr Val Asp Pro Asn Leu Asn 20 25 30 Pro Val Leu Leu Val Pro Gly Ile Ala Gly Ser Ile Leu Asn Ala Val 35 40 45 Asp His Glu Asn Gly Asn Glu Glu Arg Val Trp Val Arg Ile Phe Gly 50 55 60 Ala Asp His Glu Phe Arg Thr Lys Met Trp Ser Arg Phe Asp Pro Ser 65 70 75 80 Thr Gly Lys Thr Ile Ser Leu Asp Pro Lys Thr Ser Ile Val Val Pro 85 90 95 Gln Asp Arg Ala Gly Leu His Ala Ile Asp Val Leu Asp Pro Asp Met 100 105 110 Ile Val Gly Arg Glu Ser Val Tyr Tyr Phe His Glu Met Ile Val Glu 115 120 125 Met Ile Gly Trp Gly Phe Glu Glu Gly Lys Thr Leu Phe Gly Phe Gly 130 135 140 Tyr Asp Phe Arg Gln Ser Asn Arg Leu Gln Glu Thr Leu Asp Gln Phe 145 150 155 160 Ala Lys Lys Leu Glu Thr Val Tyr Lys Ala Ser Gly Glu Lys Lys Ile 165 170 175 Asn Val Ile Ser His Ser Met Gly Gly Leu Leu Val Lys Cys Phe Met 180 185 190 Gly Leu His Ser Asp Ile Phe Glu Lys Tyr Val Gln Asn Trp Ile Ala 195 200 205 Ile Ala Ala Pro Phe Arg Gly Ala Pro Gly Tyr Ile Thr Ser Thr Leu 210 215 220 Leu Asn Gly Met Ser Phe Val Asn Gly Trp Glu Gln Asn Phe Phe Val 225 230 235 240 Ser Lys Trp Ser Met His Gln Leu Leu Ile Glu Cys Pro Ser Ile Tyr 245 250 255 Glu Leu Met Cys Cys Pro Tyr Phe Lys Trp Glu Leu Pro Pro Val Leu 260 265 270 Glu Leu Trp Arg Glu Lys Glu Ser Asn Asp Gly Val Gly Thr Ser Asp 275 280 285 Val Val Leu Glu Ser Tyr Arg Ser Leu Glu Ser Leu Glu Val Phe Thr 290 295 300 Lys Ser Leu Ser Asn Asn Thr Ala Asp Tyr Cys Gly Glu Ser Ile Asp 305 310 315 320 Leu Pro Phe Asn Trp Lys Ile Met Glu Trp Ala His Lys Thr Lys Gln 325 330 335 Val Leu Ala Ser Ala Lys Leu Pro Pro Lys Val Lys Phe Tyr Asn Ile 340 345 350 Tyr Gly Thr Asn Leu Glu Thr Pro His Ser Val Cys Tyr Gly Asn Glu 355 360 365 Lys Met Pro Val Lys Asp Leu Thr Asn Leu Arg Tyr Phe Gln Pro Thr 370 375 380 Tyr Ile Cys Val Asp Gly Asp Gly Thr Val Pro Met Glu Ser Ala Met 385 390 395 400 Ala Asp Gly Leu Glu Ala Val Ala Arg Val Gly Val Pro Gly Glu His 405 410 415 Arg Gly Ile Leu Asn Asp His Arg Val Phe Arg Met Leu Lys Lys Trp 420 425 430 Leu Asn Val Gly Glu Pro Asp Pro Phe Tyr Asn Pro Val Asn Asp Tyr 435 440 445 Val Ile Leu Pro Thr Thr Tyr Glu Phe Glu Lys Phe His Glu Asn Gly 450 455 460 Leu Glu Val Ala Ser Val Lys Glu Ser Trp Asp Ile Ile Ser Asp Asp 465 470 475 480 Asn Asn Ile Gly Thr Thr Gly Ser Thr Val Asn Ser Ile Ser Val Ser 485 490 495 Gln Pro Gly Asp Asp Gln Asn Pro Gln Ala Glu Ala Arg Ala Thr Leu 500 505 510 Thr Val Gln Pro Gln Ser Asp Gly Arg Gln His Val Glu Leu Asn Ala 515 520 525 Val Ser Val Ser Val Asp Ala 530 535 <210> 8 <211> 1344 <212> DNA <213> Arabidopsis thaliana <400> 8 atgggctgga ttccgtgtcc gtgctgggga accaacgacg atgaaaacgc cggcgaggtg 60 gcggatcgtg atccggtgct tctagtatct ggaattggag gctctattct gcattctaag 120 aagaagaatt caaagtctga aattcgggtt tgggtccgaa tatttctagc taaccttgcc 180 tttaagcaga gcctctggtc tctctataat cccaaaactg gttatacaga gccgttggat 240 gataatattg aagtattggt ccctgatgat gaccatggac tctatgcaat tgacattcta 300 gatccctctt ggtttgtaaa gctttgtcac ttgacggagg tttatcactt tcacgatatg 360 atagaaatgc tggttggatg cggttataag aaggggacta cattattcgg ttatggttac 420 gatttccgtc aaagcaatag gatcgatcta cttatactag gtctgaagaa gaagctggaa 480 actgcatata aacgttcagg ggggagaaaa gtcactatca tctcccattc aatgggagga 540 cttatggttt catgtttcat gtatctccat ccggaggcat tttccaagta tgtaaataaa 600 tggattacaa ttgcaacacc tttccaagga gcaccagggt gcatcaatga ttcaatcttg 660 actggagtgc aatttgtgga agggttagaa agtttctttt ttgtgtcacg ttggacgatg 720 caccaactgt tggtcgaatg cccatctata tatgagatga tggcaaatcc agactttaag 780 tggaaaaagc aaccagagat tcgagtttgg cgtaagaaat ctgaaaacga cgttgatact 840 tctgtagaac tggaatcatt tggcttaatc gagagtattg atctattcaa cgatgcatta 900 aaaaataacg agctaagcta tggtgggaat aaaatagctt tgccctttaa ctttgctatc 960 ctcgactggg ctgctaagac aagagaaatt ctcaacaaag cgcaacttcc tgatggagtg 1020 tccttctata acatatatgg agtgtcactt aatacaccct ttgatgtttg ttatggcaca 1080 gagacttctc cgatagacga tttgtctgaa atatgtcaaa ctatgcctga gtatacatat 1140 gtagatggag atggaactgt ccctgctgaa tcagctgcag ctgctcagtt taaagcagtt 1200 gctagcgtag gagtttcggg tagccaccgc gggcttctcc gtgatgaaag agtgtttgag 1260 ctcattcaac aatggttagg agttgagccc aagaaggcta aacggaagca tttaaggact 1320 cacaaagtag ttgattctgg ttaa 1344 <210> 9 <211> 447 <212> PRT <213> Arabidopsis thaliana <400> 9 Met Gly Trp Ile Pro Cys Pro Cys Trp Gly Thr Asn Asp Asp Glu Asn 1 5 10 15 Ala Gly Glu Val Ala Asp Arg Asp Pro Val Leu Leu Val Ser Gly Ile 20 25 30 Gly Gly Ser Ile Leu His Ser Lys Lys Lys Asn Ser Lys Ser Glu Ile 35 40 45 Arg Val Trp Val Arg Ile Phe Leu Ala Asn Leu Ala Phe Lys Gln Ser 50 55 60 Leu Trp Ser Leu Tyr Asn Pro Lys Thr Gly Tyr Thr Glu Pro Leu Asp 65 70 75 80 Asp Asn Ile Glu Val Leu Val Pro Asp Asp Asp His Gly Leu Tyr Ala 85 90 95 Ile Asp Ile Leu Asp Pro Ser Trp Phe Val Lys Leu Cys His Leu Thr 100 105 110 Glu Val Tyr His Phe His Asp Met Ile Glu Met Leu Val Gly Cys Gly 115 120 125 Tyr Lys Lys Gly Thr Thr Leu Phe Gly Tyr Gly Tyr Asp Phe Arg Gln 130 135 140 Ser Asn Arg Ile Asp Leu Leu Ile Leu Gly Leu Lys Lys Lys Leu Glu 145 150 155 160 Thr Ala Tyr Lys Arg Ser Gly Gly Arg Lys Val Thr Ile Ile Ser His 165 170 175 Ser Met Gly Gly Leu Met Val Ser Cys Phe Met Tyr Leu His Pro Glu 180 185 190 Ala Phe Ser Lys Tyr Val Asn Lys Trp Ile Thr Ile Ala Thr Pro Phe 195 200 205 Gln Gly Ala Pro Gly Cys Ile Asn Asp Ser Ile Leu Thr Gly Val Gln 210 215 220 Phe Val Glu Gly Leu Glu Ser Phe Phe Phe Val Ser Arg Trp Thr Met 225 230 235 240 His Gln Leu Leu Val Glu Cys Pro Ser Ile Tyr Glu Met Met Ala Asn 245 250 255 Pro Asp Phe Lys Trp Lys Lys Gln Pro Glu Ile Arg Val Trp Arg Lys 260 265 270 Lys Ser Glu Asn Asp Val Asp Thr Ser Val Glu Leu Glu Ser Phe Gly 275 280 285 Leu Ile Glu Ser Ile Asp Leu Phe Asn Asp Ala Leu Lys Asn Asn Glu 290 295 300 Leu Ser Tyr Gly Gly Asn Lys Ile Ala Leu Pro Phe Asn Phe Ala Ile 305 310 315 320 Leu Asp Trp Ala Ala Lys Thr Arg Glu Ile Leu Asn Lys Ala Gln Leu 325 330 335 Pro Asp Gly Val Ser Phe Tyr Asn Ile Tyr Gly Val Ser Leu Asn Thr 340 345 350 Pro Phe Asp Val Cys Tyr Gly Thr Glu Thr Ser Pro Ile Asp Asp Leu 355 360 365 Ser Glu Ile Cys Gln Thr Met Pro Glu Tyr Thr Tyr Val Asp Gly Asp 370 375 380 Gly Thr Val Pro Ala Glu Ser Ala Ala Ala Ala Gln Phe Lys Ala Val 385 390 395 400 Ala Ser Val Gly Val Ser Gly Ser His Arg Gly Leu Leu Arg Asp Glu 405 410 415 Arg Val Phe Glu Leu Ile Gln Gln Trp Leu Gly Val Glu Pro Lys Lys 420 425 430 Ala Lys Arg Lys His Leu Arg Thr His Lys Val Val Asp Ser Gly 435 440 445 <210> 10 <211> 3107 <212> DNA <213> Arabidopsis thaliana <400> 10 cctttttgat ctttcagctc aatgagcttt tctcaatttt ttgggggaac tgaatatgtg 60 aatttcaaag tttccacatc gagtttattc acacgtcttg aatttcgtcc atcctcgttc 120 tgttatccag ctttgaactc ctcccgaccc tgctatggat atattaaaaa aaaagtgttt 180 tgtgggttgc atctttgtta cgatctgcat cttcttcttt cggctcagtg ttcatgtttt 240 tgctatggta gagatgggca atgttattgt tgatggtaac agtggtatag ttgatagtat 300 cttaactaat caattatctc tttgattcag gcctctatgt tgggtggaac acatgtcact 360 tgacaatgaa actgggttgg atccagctgg tattagagtt cgagctgtat caggactcgt 420 ggctgctgac tactttgctc ctggctactt tgtctgggca gtgctgattg ctaaccttgc 480 acatattgga tatgaagaga aaaatatgta catggctgca tatgactggc ggctttcgtt 540 tcagaacaca gaggttcttt tctcatcgtt ctttctatta ttctgttcca tgttacgttt 600 ctttcttcat tacttaaggc ttaaatatgt ttcatgttga attaataggt acgtgatcag 660 actcttagcc gtatgaaaag taatatagag ttgatggttt ctaccaatgg tggaaaaaaa 720 gcagttatag ttccgcattc catgggggtc ttgtattttc tacattttat gaagtgggtt 780 gaggcaccag ctcctctggg tggcgggggt gggccagatt ggtgtgcaaa gtatattaag 840 gcggtgatga acattggtgg accatttctt ggtgttccaa aagctgttgc agggcttttc 900 tctgctgaag caaaggatgt tgcagttgcc aggtattgaa tatctgctta tacttttgat 960 gatcagaacc ttggctctgg aactcaaagt tattctacta aatatcaatt ctaataacat 1020 tgctatatta tcgctgcaac tgacattggt tgattatttt gctgcttatg taactgaaac 1080 tctcttgaga ttagacaaat gatgaattga taattcttac gcattgctct gtgatgacca 1140 gtttcttagc ttcgacgata acatttgtca tactgtcttt tggagggcat tgaattttgc 1200 tatggaaagc gctggagctt ccatgcttgc attctttacc aattagcatt attctgcttc 1260 tttcaatttt cttgtatatg catctatggt cttttatttc ttcttaatta aagactcgtt 1320 ggagtagttg ctctattagt cgcttggttc cttaatatag aactttactt tcttcgaaaa 1380 ttgcagagcg attgccccag gattcttaga caccgatata tttagacttc agaccttgca 1440 gcatgtaatg agaatgacac gcacatggga ctcaacaatg tctatgttac cgaagggagg 1500 tgacacaata tggggcgggc ttgattggtc accggagaaa ggccacacct gttgtgggaa 1560 aaagcaaaag aacaacgaaa cttgtggtga agcaggtgaa aacggagttt ccaagaaaag 1620 tcctgttaac tatggaagga tgatatcttt tgggaaagaa gtagcagagg ctgcgccatc 1680 tgagattaat aatattgatt ttcgagtaag gacatataaa tcataataaa ccttgtacat 1740 tttgtgattg tatgatgaat atctgtacat tttatctggt gaagggtgct gtcaaaggtc 1800 agagtatccc aaatcacacc tgtcgtgacg tgtggacaga gtaccatgac atgggaattg 1860 ctgggatcaa agctatcgct gagtataagg tctacactgc tggtgaagct atagatctac 1920 tacattatgt tgctcctaag atgatggcgc gtggtgccgc tcatttctct tatgggattg 1980 ctgatgattt ggatgacacc aagtatcaag atcccaaata ctggtcaaat ccgttagaga 2040 caaagtaagt gatttcttga ttccaactgt atccttcgtc ctgatgcatt atcagtcttt 2100 ttgttttcgg tcttgttgga tatggttttc agctcaaagc ttacaaagct gtttctgagc 2160 ctttctcaaa aaggcttgct cagttatatt gaggtgctaa agttgataca tgtgactctt 2220 gcttataaat cctccgtttg gtttgttctg ctttttcaga ttaccgaatg ctcctgagat 2280 ggaaatctac tcattatacg gagtggggat accaacggaa cgagcatacg tatacaagct 2340 taaccagtct cccgacagtt gcatcccctt tcagatattc acttctgctc acgaggagga 2400 cgaagatagc tgtctgaaag caggagttta caatgtggat ggggatgaaa cagtacctgt 2460 cctaagtgcc gggtacatgt gtgcaaaagc gtggcgtggc aagacaagat tcaacccttc 2520 cggaatcaag acttacataa gagaatacaa tcactctccg ccggctaacc tgttggaagg 2580 gcgcgggacg cagagtggtg cccatgttga tatcatggga aactttgctt tgatcgaaga 2640 tatcatgagg gttgccgccg gaggtaacgg gtctgatata ggacatgacc aggtccactc 2700 tggcatattt gaatggtcgg agcgtattga cctgaagctg tgaatatcat gatctcttta 2760 agctgtcctg tcagcttatg tgaatccaat actttgaaag agagatcatc atcaattcat 2820 catcatcgtc atcatcatga tgctcaactc acaaagaagc ctgagaatga tactttggtg 2880 cgaaattctc aatacctctt taatattctt attgaatgta aattatacaa tcctatctaa 2940 tgtttgaacg ataacgcaaa acttgctgcg ccatgtttgt ttgtcttgtc aaaagcatca 3000 atttgtgggt tatacgtagt gtagaggatg attcaaattt gtgataaatt tggtaatcaa 3060 agttaattct gaaaatgcaa caccacatga actatgtcac taaggcc 3107 <210> 11 <211> 1680 <212> DNA <213> Arabidopsis thaliana <220> <221> unsure <222> (694) <223> n=unkown <400> 11 cgcataaggt gttcgagtgt ttgcagcttg agaagttccg agtccaagag acctggagcc 60 aaagatctga accataaaaa tgaccaatca aaatccatta agccaattca aatattcact 120 aaaaatgtta tagttctcat gaatactaac ataacaagtg aaagtaaatt taaaaatgtt 180 catggaccta acctggcgta acggtatgtc tttgccttca gcagaaagta aattactgac 240 ggctttaggg acacctaaaa aggcgggtcc aatgttgacg acggatttga tgtgtttggc 300 acaccaacct ggaccacccc caccgcctcc atcaggaaga ggtgtttcta cccatttaag 360 gaagtgaagg aaatagatag cccccattga atgcggaacc accacaactt tcttaaaccc 420 attggtggca tacattagct cgattttgct cttcagtcta cttaacgatt ggtcacgtac 480 ctgctcggtt tcaatccaaa aactatagat tagtccaaag ctctacaaca atatgtaatt 540 acatacacta aagtagctaa tcatggaggt cttatagtat atcattatca tcattctcta 600 gaccaccagt gttgtcaatg tgatcatata ggtattaata acgactaatc tgagcatacc 660 tcggtgttat ggaaagagag tctccaatca taangaggcc atgtgaaggt tcttgccttc 720 atatccaatt tttgccaaat tctctatgag aactgcccaa gcaaagtagc atggtgcgaa 780 atagtctgca gccactagtc ctgggactgc tcggacacgg attcccggtg gatcgagacc 840 ggtctcactg tctagagata agtgctccaa ccagcacaat ggcctataaa tcaaattaca 900 acaattaaac gaccaagtat acacttcaaa ctaattcaga attgagaaaa tcgaaatgct 960 aaccagaaaa tcatgtaaat caaaaaccgt aacaatcaat atatatatat atattttcca 1020 gaatccatgt taaaaccata accaaaaata tatgaaaatt tagaaatact aaaataatat 1080 gttaaaactg atattctaaa tttagtaagt tttaaaatgc aatgaaatcg tcattcatgt 1140 tttgaacata aatatatttt atagttttgt aggacgattt tctacttcct atatagaaat 1200 caaaacttac ggtttccatt tccaaattcg aatgacattt aaaaacatat cccaaaaatc 1260 acgattaatt attaatttcc taaaaccatc catcattact tagaaaataa tattttcata 1320 aactagttgc aaaacaataa caaaacccaa agaaccatct ccacccatta accaaaatga 1380 aaatccaaag accatccata acaacaacag tataacacta cgtaaagcca attcaagaag 1440 aaaccaagct taaccaatta tacatacccc taaccagacg aaccaaacca atatctgacc 1500 gggtctataa aaatatctcg aaccgaacat aacggtctaa tgtgttacct tctaagaatc 1560 tcggagaagc tagcacccca aagacgttta cgaaagagtc cttcagcgca aggccgacct 1620 tcccaaagct cgagcccgcc ggttacaatc cccggaacaa gaatcaccgg atgaaacgcc 1680 <210> 12 <211> 264 <212> DNA <213> Glycine max <220> <221> unsure <222> (39) <223> n=unknown <220> <221> unsure <222> (175) <223> n=unknown <220> <221> unsure <222> (241) <223> n=unknown <400> 12 ccaagaactc gatgattact tcaacactcc tggggttgng acccgggtcc ctcactttgg 60 ttccaccaac tctcttctct catctcaatc ctcgtctcaa gcatatcacc ggatacatgg 120 cacccctggt agattcatta caaaagcttg gctacgctga tggtgagact ctgtntggag 180 ccccttatga ctttagatat ggtctagctg ctgaaggtca cccttcacaa gtgggttcca 240 ngttcctcaa agatctaaag aatt 264 <210> 13 <211> 273 <212> DNA <213> Glycine max <220> <221> unsure <222> (12) <223> n=unknown <220> <221> unsure <222> (33) <223> n=unknown <220> <221> unsure <222> (252) <223> n=unknown <220> <221> unsure <222> (265)..(266) <223> n=unknown <220> <221> unsure <222> (272) <223> n=unknown <400> 13 ccaacatctg anaggggtag agtaggtatt tcnatctatt atccatattg tgatgaagaa 60 ggaacaagaa gagggtctca agattgaggt tgctacactc acagttacag tagttgttgt 120 gatgctgtca ttgctatgca catgtggggc aagcaacctc gaccctttga ttctaatacc 180 aggtaacgga gggaaccaac tagaagcaag gttgaccaat cagtacaagc cctctacttt 240 catctgcgat cntggtaccc tctcannaag ana 273 <210> 14 <211> 419 <212> DNA <213> Glycine max <220> <221> unsure <222> (99) <223> n=unknown <220> <221> unsure <222> (346) <223> n=unknown <220> <221> unsure <222> (352) <223> n=unknown <220> <221> unsure <222> (392) <223> n=unknown <220> <221> unsure <222> (405) <223> n=unknown <220> <221> unsure <222> (418) <223> n=unknown <400> 14 gctgcatatg attggagaat agcatttcag aacactgagg tgagggatca aacactaagt 60 cggataaaaa gcaacataga acttatggtt gctactaang gtggaaataa ggcagttatt 120 attccacatt caatgggggt cttgtacttc ctacatttta tgaaatgggt tgaagcacca 180 gctccaatgg gtggtggggg aggaccagat tggtgctcca aatatataaa ggcagttgta 240 aacattggtg gaccattttt aggtgttccc aaggctatag cagggctatt ctcagctgag 300 gccaaggata ttgctgttgc caggacgata gctccaggat ttttanataa cnatctgttt 360 ccgcattcaa acccttgcaa catgtaatga anatgaaccc gttcnttggg actcaacna 419 <210> 15 <211> 272 <212> DNA <213> Glycine max <220> <221> unsure <222> (1)..(272) <223> n=unknown <400> 15 tganttgatc ntgngaagtn attctgtgta ttanttccat gacatgaccg ttnnagatnc 60 gtaagtgang ggtntgaaga gggaaagacg ctttttggtn ttngatatga ttttcgccaa 120 agcaacaggt tgcaggaaac aatggatcgg ttggctgcna agttagaatc aanttataat 180 gccgcaggnn ggaagacaat aaacattata nttcattcta tgggcggtct tttccnngan 240 atgtttcntg tgcctgcaaa gcgatatttt ga 272 <210> 16 <211> 237 <212> DNA <213> Glycine max <220> <221> unsure <222> (1)..(237) <223> n=unknown <400> 16 gattttcgcc aaagcaacag gttgcaggaa acaatggatc ggttggctgc aaagttagaa 60 tcaatntata atgcngcagg agggaagana ataaacatta taactcattc tatgggcggt 120 cttttggtga aatgnttcat gtgcctgcaa agcgatattt ttgagaaata tgttaagaat 180 tgggttgcaa tttgtgcgcc attccagggt gcaccaggaa ccatcaattc naccttt 237 <210> 17 <211> 244 <212> DNA <213> Glycine max <220> <221> unsure <222> (1)..(244) <223> n=unknown <400> 17 gattttcgcc aaagcaacag gttgcaggaa acaatggatc ggtnggctgc aaagttagaa 60 tgcaatttat aatgctgcag gagggaagaa aataaacatt ataactcatt ctatgggcgg 120 tcttttggtg aaatgtttca tgtgcctgca aagcgatatt tttgagaaat atgttaagaa 180 ttgggttgca atttgtgcgc cattccaggg tgcaccagga accatcaatt ctaccttttt 240 aaat 244 <210> 18 <211> 263 <212> DNA <213> Glycine max <400> 18 gatgaaacta aaccgtgggc gactaagctt gtttactcgg ttgatttatg gcaagatcaa 60 gttcgttgct tcatagaaga ggtcattggt gaaccagtct atcttgtggg caactcacta 120 ggaggattgg ttgcattgta ttttgcggca aacaaccctc atttagtgaa aggtgtcgca 180 ttgcttaagc aacacctttt tgggggtttc tgccaaatcc cataaaaagt ccaagactag 240 cgaaaatatt tccatgggcc gga 263 <210> 19 <211> 311 <212> DNA <213> Zea mays <220> <221> unsure <222> (1)..(311) <223> n=unknown <400> 19 cggacgctgg ncatgttcgg agccccctac gacttccgct acgcgccgcc gtcccccggc 60 cagacgtccg aggtgtactc ccgctacttc aaggagctga tggagctggt cgaggccgcg 120 agcgagagga cccggaagaa ggccgtcatc ctcggccaca gcttcggcgg catggtcgcg 180 ctcgagttcg tccggaacac tccgccggcg tggcggcgcg agcacatcga gcgcctcgtc 240 ctggtcgcgc cgacgctccc cggcgggttc ctggagccgg tgcgcaactt cgcgtccggg 300 acggacatcc t 311 <210> 20 <211> 1155 <212> DNA <213> Zea mays <400> 20 tcgacccacg cgtccggcca caagaaccct ctcaagtcag actggtgcct cggaaagctg 60 agagccgcac tggaagacat gggataccga gacggagaca ccatgttcgg agccccctac 120 gacttccgct acgcgccgcc gtcccccggc cagacgtccg aggtgtactc ccgctacttc 180 aaggagctga tggagctggt cgaggccgca agcgagagga cccggaagaa ggccgtcatc 240 ctcggccaca gcttcggcgg catggtcgcg ctcgagttcg tccggaacac tccgccggcg 300 tggcggcgcg agcacatcga gcgcctcgtc ctggtcgcgc cgacgctccc cggcgggttc 360 ctggagccgg tgcgcaactt cgcgtccggg acggacatcc tmtacgtgcc agcgacgacg 420 ccgctggcca cgcgagccat gtgragragc ttcgagagcg ccatcgtgaa cttcccgtcg 480 ccggccgtgt tcgggcgcct gcaggcgccg ctcgtggtca ccagggagcg gaactactcc 540 gcgtccgcgc acgacatgga gcgcttcctc gccgccgtcg gctccggcga ggccgcggag 600 cccttcagga gacgggccgt ccccaagatg ggcagcttcg cggcgccgat ggtgcccatg 660 acgtacatca gcggggtcgg caacaggacg ccgctgcggc tggtgttctg gggcgacgac 720 ttcgacgcgg ccccggaggt ggcggcgtac ggggacggag atggcaagat caatttgatc 780 agcgtcttgg cgtttgagaa ggagatgcgt cggcagccgg agcagaagaa gcagttcaaa 840 tccatcaaga tcgataaggc ccagcattct acgatcgtca cggatgattt tgccctgcac 900 agggtcattc aagaaattgt tgaggccaat aatcagaaga ttccatccta aattcttcat 960 gtcatgtatg cattaccgag ctgtgggggc caatagtggg ttgggagttg ggacatcggt 1020 tccgtgctta aaacggtcgt ggtgtggtct caattcaatc gattagttat ttgttaacgt 1080 caattgcttg cctcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1140 aaaaaaaaar gggcg 1155 <210> 21 <211> 328 <212> DNA <213> Zea mays <400> 21 gttggaatgc tcttcaactt tcttacgctc atttacattg cttttctctg cggtaaattg 60 ctggcttaaa tgcatgctgc ttgaacccta taatcagata gaccatcccg aatgcaagtc 120 aaggcctgat agtggtcttc tgcaattaca gagctggacc ctggttatat aacaggtcct 180 ctctcttcag tatggaaaga atgggtcaaa tggtgtgtag agtttggcat tgaagctaat 240 gcaattatcg ctgttccgta tgattggaga ctgcccccat caatgcttga ggagagagat 300 ctgtactttc acaattaaac aggatcag 328 <210> 22 <211> 356 <212> DNA <213> Zea mays <400> 22 gtctttctgc aattacagag ctggaccctg gttatataac aggtttcagg tcctctctct 60 tcagtatgga aagaatgggt caaatggtgt gtagagtttg gcattgaagc taatgcaatt 120 atcgctgttc cgtatgattg gagactgccc ccatcaatgc ttgaggagag agatctgtac 180 tttcacaaat taaagtttgt aacacttgcc tcaacttgtt atgaagcaac caatgctata 240 catctgttag gatcagtaag agttaatggc ccatgacgga ttcaggttcc tgctcaccaa 300 cagatcccac aagcatacgg ttaccgccaa tgcctgcagt tggacagtac caaccc 356 <210> 23 <211> 1552 <212> DNA <213> Zea mays <400> 23 tcgacccacg cgtccgcaga catgatcatt ggtgatgaca ctgtgtacta ctatcatgac 60 atgatagtgg aaatgattaa atggggatat caagaaggaa aaactctctt tggatttggt 120 tatgatttcc gtcaaagcaa caggctctca gagacacttg acagattttc taaaaagctg 180 gagtcagtgt acacagcttc tggtggaaag aagatcaatc tcattactca ttcaatgggg 240 ggattacttg tgaaatgttt catctcactg cacagtgata tatttgaaaa atatgtcaar 300 agttggatcg caattgctgc accattccar ggtgcccctg ggtamataac taccaktytg 360 ctgaatggaa tgtcttttgt craaggatgg gaaycaagat tctttatttc caaawkgkgt 420 atgcascaat tgctacttga gtgcccatca atctatgagk tgctgscaam ccctaacttt 480 ccagtggaga gacatcccac tgctacagat ttggagagag aatttggata mcagtggcaa 540 gaaaagtgcc ctgttagagt cgtatgagcc tgaggaagca ataaagatga ttaaagaggc 600 tctttccagt aatgagatca ttgctgatgg catgcatatt ccggtgcccc ttaatttgga 660 tatattgaat tgggcaaaga aacttatgat cttttatgca gtacaaagct tccggaatca 720 gtgaaattct acaacattta tgggattgat tatgatactc cacatactgt ctgctatggc 780 agtgaacagc agccggtttc aagtcttagt agcctcttat atgctcaggg aaaatacgtc 840 tatgttgatg gcgacggatc tgttcccgca gaatcagcaa aggctgacgg atttaatgca 900 gtggcaaggg ttggggttgc tcctgaccac cggggaatcg tgtgcagtcg ccgcgcgttc 960 cggatcgtcc agcactggct gcacgccgga gaacctgacc cgttctacga cccgctgagc 1020 gactatgtca tactcccaac acgcttacga aatcgagaag catcgtgaga aacacgggga 1080 tgtcacgtca gtagcggagg actgggagat catctcccct aacgacggca agaccatrrg 1140 gccaggcgag cttcctccta tggtcagcac actgaccacg agccgggaag gcaaggaggg 1200 agcactggaa gaggcgcatg ccaccgtggt cgttcacccg gagaagaagg gacggcagca 1260 tgtgcaagtt agggctgtgg gtgtcagcca tggtggctaa agccgtagga gccacgttgg 1320 ttgtctactc tatctagcag tagcagctat acctctgtgc acgcactgta aaattggatg 1380 tacatatatg gctatgacct ctgtagggat ctggttttag aagtataaat gggcaccctg 1440 cctgcttgta aatgttcaga accgaaaaca caggccctgt tctttttttt cctttttaaa 1500 aaaaataaaa agatggtaaa ggattccatt aaaaaaaaaa aaaaaaaagg cg 1552 <210> 24 <211> 227 <212> DNA <213> Zea mays <220> <221> unsure <222> (1)..(227) <223> n=unknown <400> 24 ttggttatga tttccgtcaa agcaacaggc tctcagagac acttgacaga ttttctaaaa 60 agctggagtc agtgtacaca gcttctggtg gaaagaagat caatctcatt actcattcaa 120 tggggggatt acttgtgaaa tgtntcatct cactgcacag tgatatatnt gaaaaatatg 180 tcaagagttg gntcgcaatt gcngcaccat tccaaggtgc ccctggg 227 <210> 25 <211> 1587 <212> DNA <213> Zea mays <220> <221> unsure <222> (1)..(1587) <223> n=unknown <400> 25 ggagattgtc gtgccggagg acgaccacgg cctgtttgcc atcgacattc ttgatccttc 60 ctggtttgta gaactcgacc cacgcgtccg cccaccgtcc gggagattgt cgtgccggag 120 gacgaccacg gcctgtttgc catcgacatt cttgatcctt cctggtttgt agaacttctc 180 catctgtcta tggtgtatca cttccatgat atgattgata tgctcataaa ctgtggatat 240 gagaaaggga ccacactatt tggatatggt tatgattttc gccaaagcaa caggatagac 300 aaagcgatgg ctggtttgag agcaaaactt gagacagctc ataagacctc tggagggaaa 360 aaagttaatt taatctcaca ttctatgggt ggattgctag tacgctgctt catgtctatg 420 aatcatgatg tattcactaa gtatgtcaac aaatggattt gcattgcttg tccattccaa 480 ggtgcccccg gatgcatcaa tgattctcta cttactggat tgcaatttgt ttatggtttt 540 gagagcttct ttttcgtatc tagatgggca atgcaccaat tgcttgtcga atgcccatca 600 atctatgaaa tgttaccaaa tccagaattc aagtggaagg aaaaaccaat tattcaggtt 660 tggcgtaaga accctgaaaa ggatggaact gtggagcttg ttcaatatga agcaactgat 720 tgtgtgtcct tgttcgaaga agctttaagg aataatgagc tcacgtataa cggaaagaaa 780 gtagcactac cattcaatat gtcagtcttc aaatgggcca ccaagactcg ccaaatccta 840 gacaatgctg aattaccaga tactgtgagc ttttacaata tatacgggac atcttatgaa 900 actccatacg atgtatgcta tggctcagaa agctctccga ttggagattt gtcagaagtg 960 tgtcacacag tgccggcata cacttatgtg gatggagatt gcacggttcc catagaatcg 1020 gcacgggctg atgggttctc tgcgaaagaa agagttggcg tcaaggcgga ccaccgtggc 1080 ctgctgtccg atgagaacgt attcaagctt ctcaagaaat ggctcggtgt gagcgagaag 1140 aagtcagagt ggcgttgcgt gtctaaatcc tactccaaag tgacctaatt gggttgcctg 1200 tagttcttca ggaagactgt tattttggcc tttcctcctg aagagaagat gaaacaaaat 1260 tctggtgatt gtattgtatg tctgcacgat gtaaatctct gcaagctgca cggaacaagg 1320 gattagtgcc cttgtacgat gtatcattgg caggcatttn tttttgaacc tangggcata 1380 tttntttgnc cttccactct ggacntagta aagaatatnt gaatcgacct tanttnnaan 1440 nngtctgnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1500 nnnnnnnnnn nnaaaaaaaa awgkgaagcc gntnntnntt tnaaaagnnt tttnnnaaaa 1560 aaaaaaaaaa aaaaaaaaaa aaaaaaa 1587 <210> 26 <211> 300 <212> DNA <213> Zea mays <220> <221> unsure <222> (1)..(300) <223> n=unknown <400> 26 gacaaagcga tggctggttt gagagcaaaa cttgagacag ctcataagac ctctggaggg 60 aaaaaagtta atttaatctc acattctatg ggtggattgc tagtacgctg cttcatgtct 120 atgaatcatg atgtgagttt tcatgttttc tgtgtttttt ttgcttttgc ataaatatcc 180 atgtcaattt cccccatttt ctaggtattc actangtatg tcaacaaatg gatttgcatt 240 gcttgtccat tccaaggtaa cttatgggac atttcaattg tttattanat natggggncc 300 <210> 27 <211> 1240 <212> DNA <213> Zea mays <220> <221> unsure <222> (1)..(1240) <223> n=unknown <400> 27 tcgacccacg cgtccggttc ccagttccca ccgtgtagat ggttctggta taaaatgtat 60 tgccatattt gtaacacaga ttactatata caggttcgtg atcaaacttt gagcagaata 120 aagascaata ttgaactcat agwagsgaca aatggtggaa atagggtggt ggkmgatccc 180 acnactccat ggggtcnttn attttntgcn ttttacgnaa tggntcgaag ccctcctccg 240 tgggggcagt gggtccgaac tggntgtaga accatataaa gctgtaatga atattggagg 300 atctttctta ggagttccta aggctgttgc tgggcttttt ttcttctaag caaaagatgt 360 tgccggttgc taggtataag taatgattca tttatttaaa gcaaaaggga atagcaaaag 420 aatgaatatt attggatgct cgacaagctt gcggagcttt tgctcccaag ccatcttctg 480 gacctcacaa gtccagggag tgcctgcctc tgatcctcat catcaggaac aggctcaagt 540 atgcaccgac ggtaccgtga ggtcatttct atcctgatgc aacaccatgt acttgttgat 600 ggcaaggtca ggactgacaa gacctaccct gctgggttca tggatgtcat ttccatccct 660 aagacaaacg agaactacag gctgctttcg tcttcaccca atcagggatg aggatgccaa 720 gttcaagctc tacaaggtga ggtctgttca gtttggccag aaagacatcc cctatctgaa 780 cacctacgac gaccgcacca tccgctaccc cgacccgctc atcaaggcca acgacaccat 840 caagatcgat ctggagacca acaagatcat ggacttcatc atgtttgacg tcggcaacgt 900 ggtcatggtg atcggcagga ggaataccgg gcgtgtagga gtgatcaara taagggagaa 960 gcataagggc aacttcgaga ccatccacgt gctgcttgra gctttttgct atgtctagtt 1020 ttctcctatt tgttgtacag gaaaacatag aatgaaattc aaatttggtg gccacaaaag 1080 tgtggagact tgatttcata taaagttagg cttaacatta gtgcaaacag ttgtatttta 1140 gtttagattt agagtacact atgtatgcgt tgtttgacaa tgcttattta tgatatattg 1200 aatggtactt atttatatta attaattaaa aaaaaaaaaa 1240 <210> 28 <211> 324 <212> DNA <213> Zea mays <400> 28 cgaatgctcc tgacatggaa atattttcca tgtacggagt aggcattcct actgaaaggg 60 catatgtcta taagttggcc ccacaggcag aatgttatat acctttccga attgacacct 120 cggctgaagg cggggaggaa aatagctgct tgaaaggggg tgtttactta gccgatggtg 180 atgaaactgt tccagttctt agtgcgggct acatgtgtgc aaaaggatgg cgtggcaaaa 240 ctcgtttcaa ccctgccggc agcaagactt acgtgagaga atacagccat tcaccaccct 300 ctactctcct ggaaggcagg ggca 324 <210> 29 <211> 254 <212> DNA <213> Zea mays <400> 29 gaataaagag caacattgaa ctcatggtag caacaaatgg tggaaatagg gtggtggtga 60 tcccacactc catgggggtc ctctattttt tgcattttat gaaatgggtc gaagcacctc 120 ctcccatggg gggtggcggt ggtccagact ggtgtgagaa gcatattaaa gctgtaatga 180 atattggagg acctttctta ggagttccta aggctgttgc tggccttttc tcatctgaag 240 ccaaagatgt tgcc 254 <210> 30 <211> 518 <212> DNA <213> Mus musculus <400> 30 tggaggacaa cgcggggtct gatacgactc actataggga atttggccct cgagcagtag 60 attcggcacg atgggcacga ggactccatc atgttcctca agctttattc ctaccgggat 120 gtcaacctgt ggtgccgcca gcgaagggtc aaggccaaag ctgtctctac agggaagaag 180 gtcagtgggg ctgctgcgag caagctgtga gctatccaga caacctgacc taccgagatc 240 tcgattactt catctttgct cctactttgt gttatgaact caactttcct cggtcccccc 300 gaatacgaga gcgctttctg ctacgacgag ttcttgagat gctctttttt acccagcttc 360 aagtggggct gatccaacag tggatggtcc ctactatcca gaactccatg gaagcccttt 420 caagagcttc tgcagttttg gagaccgcga gttctacaga gattggtgga atgctgagtc 480 tgtcaccgac ttttggcaga actggaatat ccccgtgg 518 <210> 31 <211> 299 <212> DNA <213> Mus musculus <400> 31 ccatgatggc tcaggtccca ctggcctgga ttgtgggccg attcttccaa gggaactatg 60 gcaatgcagc tgtgtgggtg acactcatca ttgggcaacc ggtggctgtc tcatgtatgt 120 ccacgactac tacgtgctca actacgatgc cccagtgggt catgagctac tgccaaaggc 180 agccctccct aacctgggcc tggagttctg gaggggttcc tggctgcctg cacactcctc 240 ctagtctggg aggcctctct gcccctatgc gctactcctg ctcttgggga tggcatttg 299 <210> 32 <211> 1895 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Inferred cDNA sequence <220> <221> unsure <222> (1)..(1895) <223> n=unknown <400> 32 gtctggtgtg atggggacag ggagggactt ccccttaccc agcactggtg ttggctgagg 60 tgggtgctga gtctcagagc ttggcatgga gaccagacag ggctgggtct gcaagcctga 120 ggctgccgcc ctgagctcgg gctgggacgt gcccagaggt gttgggagga tctggggtga 180 gtaccctgtg gccaggacta aaggggctnc accctcctgt ccatccctcg cagatcttga 240 gcaatgcccg gttatttctg gagaacctca tcaagtatgg catcctggtg gaccccatcc 300 aggtggtttc tctgttcctg aaggatccct atagctggcc cgccccatgc ctggttattg 360 cggccaatgt ctttgctgtg gctgcattcc aggttgagaa gcgcctggcg gtgggtgccc 420 tgacggagca ggcgggactg ctgctgcacg tggccaacct ggccaccatt ctgtgtttcc 480 cagcggctgt ggtcttactg gttgagtcta tcactccagt gggctccctg ctggcgctga 540 tggcgcacac catcctcttc ctcaagctct tctcctaccg cgacgtcaac tcatggtgcc 600 gcagggccag ggccaaggct gcctctgcag ggaagaaggc cagcagtgct gctgccccgc 660 acaccgtgag ctacccggac aatctgacct accgcgatct ctactacttc ctcttcgccc 720 ccaccttgtg ctacgagctc aactttcccc gctctccccg catccggaag cgctttctgc 780 tgcgacggat ccttgagatg ctgttcttca cccagctcca ggtggggctg atccagcagt 840 ggatggtccc caccatccag aactccatga agcccttcaa ggacatggac tactcacgca 900 tcatcgagcg cctcctgaag ctggcggtcc ccaatcacct catctggctc atcttcttct 960 actggctctt ccactcctgc ctgaatgccg tggctgagct catgcagttt ggagaccggg 1020 agttctaccg ggactggtgg aactccgagt ctgtcaccta cttctggcag aactggaaca 1080 tccctgtgca caagtggtgc atcagacact tctacaagcc catgcttcga cggggcagca 1140 gcaagtggat ggccaggaca ggggtgttcc tggcctcggc cttcttccac gagtacctgg 1200 tgagcgtccc tctgcgaatg ttccgcctct gggcgttcac gggcatgatg gctcagatcc 1260 cactggcctg gttcgtgggc cgctttttcc agggcaacta tggcaacgca gctgtgtggc 1320 tgtcgctcat catcggacag ccaatagccg tcctcatgta cgtccacgac tactacgtgc 1380 tcaactatga ggccccagcg gcagaggcct gagctgcacc tgagggcctg gcttctcact 1440 gccacctcac acccgctgcc agagcccacc tctcctccta ggcctcgagt gctggggatg 1500 ggcctggctg cacagcatcc tcctctggtc ccagggaggc ctctctgccc ctatggggct 1560 ctgtcctgca cccctcaggg atggcgacag caggccagac acagtctgat gccagctggg 1620 agtcttgctg accctgcccc gggtccgagg gtgtcaataa agtgctgtcc agtgacctct 1680 tcagcctgcc aggggcctgg ggcctggtgg ggggtatggc cacacccaca agggcgagtg 1740 ccagagctgt gtggacagct gtcccaggac ctgccgggga gcagcagctc cactgcagca 1800 gggcgggcat ggccggtagg gggagtgcaa ggccaggcag acgcccccat tccccacact 1860 cccctaccta gaaaagctca gctcaggcgt cctct 1895 <210> 33 <211> 1766 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Inferred cDNA sequence <400> 33 cacgactggg ccgcgacgtg gtgcgggccg aagccatggg cgaccgcgga ggcgcgggaa 60 gctctcggcg tcggaggacc ggctcgcggg tttccatcca gggtggtagt gggcccatgg 120 tagacgaaga ggaggtgcga gacgccgctg tgggccccga cttgggcgcc gggggtgacg 180 ctccggctcc ggctccggtt ccggctccag cccacacccg ggacaaagac cggcagacca 240 gcgtgggcga cggccactgg gagctgaggt gccatcgtct gcaagactct ttgttcagct 300 cagacagcgg tttcagcaat taccgtggta tcctgaattg gtgcgtggtg atgctgatcc 360 tgagtaatgc aaggttattt ttagagaatc ttatcaagta tggcatcctg gtggatccca 420 tccaggtggt gtctctgttt ctgaaggacc cctacagctg gcctgcccca tgcttgatca 480 ttgcatccaa tatctttatt gtggctacat ttcagattga gaagcgcctg tcagtgggtg 540 ccctgacaga gcagatgggg ctgctgctac atgtggttaa cctggccaca attatctgct 600 tcccagcagc tgtggcctta ctggttgagt ctatcactcc agtgggttcc ctgtttgctc 660 tggcatcata ctccatcatc ttcctcaagc ttttctccta ccgggatgtc aatctgtggt 720 gccgccagcg aagggtcaag gccaaagctg tgtctgcagg gaagaaggtc agtggggctg 780 ctgcccagaa cactgtaagc tatccggaca acctgaccta ccgagatctc tattacttca 840 tctttgctcc tactttgtgt tatgaactca actttcctcg atccccccga atacgaaagc 900 gctttctgct acggcgggtt cttgagatgc tctttttcac ccagcttcaa gtggggctga 960 tccagcagtg gatggtccct actatccaga actccatgaa gcccttcaag gacatggact 1020 attcacgaat cattgagcgt ctcttaaagc tggcggtccc caaccatctg atatggctca 1080 tcttcttcta ttggcttttc cactcatgtc tcaatgctgt ggcagagctc ctgcagtttg 1140 gagaccgcga gttctacagg gactggtgga atgctgagtc tgtcacctac ttttggcaga 1200 actggaatat ccccgtgcac aagtggtgca tcagacactt ctacaagcct atgctcagac 1260 tgggcagcaa caaatggatg gccaggactg gggtcttttt ggcgtcagcc ttcttccatg 1320 agtacctagt gagcattccc ctgaggatgt tccgcctctg ggcattcaca gccatgatgg 1380 ctcaggtccc actggcctgg attgtgaacc gcttcttcca agggaactat ggcaatgcag 1440 ctgtgtgggt gacactcatc attgggcaac cggtggctgt gctcatgtat gtccacgact 1500 actacgtgct caactatgat gccccagtgg gggcctgagc tactgccaaa ggccagccct 1560 ccctaacctg ggcctggagt tctggagggc ttcctggctg cctgcacact cctcctagtc 1620 tgggaggcct ctctgcccct atggggccta ctcctgctct tggggatggc acctgagtcc 1680 agctggtatg agccagtgct gggagtctgt gctgaccagg ggctgaggat atcaataaag 1740 agctatctaa aaaaaaaaaa aaaaaa 1766 <210> 34 <211> 409 <212> PRT <213> Homo sapiens <400> 34 Arg Arg Ser Leu Leu Asp Glu Leu Leu Glu Val Asp His Ile Arg Thr 1 5 10 15 Ile Tyr His Met Phe Ile Ala Leu Leu Ile Leu Phe Ile Leu Ser Thr 20 25 30 Leu Val Val Asp Tyr Ile Asp Glu Gly Arg Leu Val Leu Glu Phe Ser 35 40 45 Leu Leu Ser Tyr Ala Phe Gly Lys Phe Pro Thr Val Val Trp Thr Trp 50 55 60 Trp Ile Met Phe Leu Ser Thr Phe Ser Val Pro Tyr Phe Leu Phe Gln 65 70 75 80 His Trp Arg Thr Gly Tyr Ser Lys Ser Ser His Pro Leu Ile Arg Ser 85 90 95 Leu Phe His Gly Phe Leu Phe Met Ile Phe Gln Ile Gly Val Leu Gly 100 105 110 Phe Gly Pro Thr Tyr Val Val Leu Ala Tyr Thr Leu Pro Pro Ala Ser 115 120 125 Arg Phe Ile Ile Ile Phe Glu Gln Ile Arg Phe Val Met Lys Ala His 130 135 140 Ser Phe Val Arg Glu Asn Val Pro Arg Val Leu Asn Ser Ala Lys Glu 145 150 155 160 Lys Ser Ser Thr Val Pro Ile Pro Thr Val Asn Gln Tyr Leu Tyr Phe 165 170 175 Leu Phe Ala Pro Thr Leu Ile Tyr Arg Asp Ser Tyr Pro Arg Asn Pro 180 185 190 Thr Val Arg Trp Gly Tyr Val Ala Met Lys Phe Ala Gln Val Phe Gly 195 200 205 Cys Phe Phe Tyr Val Tyr Tyr Ile Phe Glu Arg Leu Cys Ala Pro Leu 210 215 220 Phe Arg Asn Ile Lys Gln Glu Pro Phe Ser Ala Arg Val Leu Val Leu 225 230 235 240 Cys Val Phe Asn Ser Ile Leu Pro Gly Val Leu Ile Leu Phe Leu Thr 245 250 255 Phe Phe Ala Phe Leu His Cys Trp Leu Asn Ala Phe Ala Glu Met Leu 260 265 270 Arg Phe Gly Asp Arg Met Phe Tyr Lys Asp Trp Trp Asn Ser Thr Ser 275 280 285 Tyr Ser Asn Tyr Tyr Arg Thr Trp Asn Val Val Val His Asp Trp Leu 290 295 300 Tyr Tyr Tyr Ala Tyr Lys Asp Phe Leu Trp Phe Phe Ser Lys Arg Phe 305 310 315 320 Lys Ser Ala Ala Met Leu Ala Val Phe Ala Val Ser Ala Val Val His 325 330 335 Glu Tyr Ala Leu Ala Val Cys Leu Ser Phe Phe Tyr Pro Val Leu Phe 340 345 350 Val Leu Phe Met Phe Phe Gly Met Ala Phe Asn Phe Ile Val Asn Asp 355 360 365 Ser Arg Lys Lys Pro Ile Trp Asn Val Leu Met Trp Thr Ser Leu Phe 370 375 380 Leu Gly Asn Gly Val Leu Leu Cys Phe Tyr Ser Gln Glu Trp Tyr Ala 385 390 395 400 Arg Arg His Cys Pro Leu Lys Asn Pro 405 <210> 35 <211> 409 <212> PRT <213> Mus musculus <400> 35 Arg Gln Ser Leu Leu Asp Glu Leu Phe Glu Val Asp His Ile Arg Thr 1 5 10 15 Ile Tyr His Met Phe Ile Ala Leu Leu Ile Leu Phe Val Leu Ser Thr 20 25 30 Ile Val Val Asp Tyr Ile Asp Glu Gly Arg Leu Val Leu Glu Phe Asn 35 40 45 Leu Leu Ala Tyr Ala Phe Gly Lys Phe Pro Thr Val Ile Trp Thr Trp 50 55 60 Trp Ala Met Phe Leu Ser Thr Leu Ser Ile Pro Tyr Phe Leu Phe Gln 65 70 75 80 Pro Trp Ala His Gly Tyr Ser Lys Ser Ser His Pro Leu Ile Tyr Ser 85 90 95 Leu Val His Gly Leu Leu Phe Leu Val Phe Gln Leu Gly Val Leu Gly 100 105 110 Phe Val Pro Thr Tyr Val Val Leu Ala Tyr Thr Leu Pro Pro Ala Ser 115 120 125 Arg Phe Ile Leu Ile Leu Glu Gln Ile Arg Leu Ile Met Lys Ala His 130 135 140 Ser Phe Val Arg Glu Asn Ile Pro Arg Val Leu Asn Ala Ala Lys Glu 145 150 155 160 Lys Ser Ser Lys Asp Pro Leu Pro Thr Val Asn Gln Tyr Leu Tyr Phe 165 170 175 Leu Phe Ala Pro Thr Leu Ile Tyr Arg Asp Asn Tyr Pro Arg Thr Pro 180 185 190 Thr Val Arg Trp Gly Tyr Val Ala Met Gln Phe Leu Gln Val Phe Gly 195 200 205 Cys Leu Phe Tyr Val Tyr Tyr Ile Phe Glu Arg Leu Cys Ala Pro Leu 210 215 220 Phe Arg Asn Ile Lys Gln Glu Pro Phe Ser Ala Arg Val Leu Val Leu 225 230 235 240 Cys Val Phe Asn Ser Ile Leu Pro Gly Val Leu Ile Leu Phe Leu Ser 245 250 255 Phe Phe Ala Phe Leu His Cys Trp Leu Asn Ala Phe Ala Glu Met Leu 260 265 270 Arg Phe Gly Asp Arg Met Phe Tyr Lys Asp Trp Trp Asn Ser Thr Ser 275 280 285 Tyr Ser Asn Tyr Tyr Arg Thr Trp Asn Val Val Val His Asp Trp Leu 290 295 300 Tyr Tyr Tyr Val Tyr Lys Asp Leu Leu Trp Phe Phe Ser Lys Arg Phe 305 310 315 320 Lys Ser Ala Ala Met Leu Ala Val Phe Ala Leu Ser Ala Val Val His 325 330 335 Glu Tyr Ala Leu Ala Ile Cys Leu Ser Tyr Phe Tyr Pro Val Leu Phe 340 345 350 Val Leu Phe Met Phe Phe Gly Met Ala Phe Asn Phe Ile Val Asn Asp 355 360 365 Ser Arg Lys Arg Pro Ile Trp Asn Ile Met Val Trp Ala Ser Leu Phe 370 375 380 Leu Gly Tyr Gly Leu Ile Leu Cys Phe Tyr Ser Gln Glu Trp Tyr Ala 385 390 395 400 Arg Gln His Cys Pro Leu Lys Asn Pro 405 <210> 36 <211> 429 <212> PRT <213> Saccharomyces cerevisiae <400> 36 Asp Lys Ala Asp Ala Pro Pro Gly Glu Lys Leu Glu Ser Asn Phe Ser 1 5 10 15 Gly Ile Tyr Val Phe Ala Trp Met Phe Leu Gly Trp Ile Ala Ile Arg 20 25 30 Cys Cys Thr Asp Tyr Tyr Ala Ser Tyr Gly Ser Ala Trp Asn Lys Leu 35 40 45 Glu Ile Val Gln Tyr Met Thr Thr Asp Leu Phe Thr Ile Ala Met Leu 50 55 60 Asp Leu Ala Met Phe Leu Cys Thr Phe Phe Val Val Phe Val His Trp 65 70 75 80 Leu Val Lys Lys Arg Ile Ile Asn Trp Lys Trp Thr Gly Phe Val Ala 85 90 95 Val Ser Ile Phe Glu Leu Ala Phe Ile Pro Val Thr Phe Pro Ile Tyr 100 105 110 Val Tyr Tyr Phe Asp Phe Asn Trp Val Thr Arg Ile Phe Leu Phe Leu 115 120 125 His Ser Val Val Phe Val Met Lys Ser His Ser Phe Ala Phe Tyr Asn 130 135 140 Gly Tyr Leu Trp Asp Ile Lys Gln Glu Leu Glu Tyr Ser Ser Lys Gln 145 150 155 160 Leu Gln Lys Tyr Lys Glu Ser Leu Ser Pro Glu Thr Arg Glu Ile Leu 165 170 175 Gln Lys Ser Cys Asp Phe Cys Leu Phe Glu Leu Asn Tyr Gln Thr Lys 180 185 190 Asp Asn Asp Phe Pro Asn Asn Ile Ser Cys Ser Asn Phe Phe Met Phe 195 200 205 Cys Leu Phe Pro Val Leu Val Tyr Gln Ile Asn Tyr Pro Arg Thr Ser 210 215 220 Arg Ile Arg Trp Arg Tyr Val Leu Glu Lys Val Cys Ala Ile Ile Gly 225 230 235 240 Thr Ile Phe Leu Met Met Val Thr Ala Gln Phe Phe Met His Pro Val 245 250 255 Ala Met Arg Cys Ile Gln Phe His Asn Thr Pro Thr Phe Gly Gly Trp 260 265 270 Ile Pro Ala Thr Gln Glu Trp Phe His Leu Leu Phe Asp Met Ile Pro 275 280 285 Gly Phe Thr Val Leu Tyr Met Leu Thr Phe Tyr Met Ile Trp Asp Ala 290 295 300 Leu Leu Asn Cys Val Ala Glu Leu Thr Arg Phe Ala Asp Arg Tyr Phe 305 310 315 320 Tyr Gly Asp Trp Trp Asn Cys Val Ser Phe Glu Glu Phe Ser Arg Ile 325 330 335 Trp Asn Val Pro Val His Lys Phe Leu Leu Arg His Val Tyr His Ser 340 345 350 Ser Met Gly Ala Leu His Leu Ser Lys Ser Gln Ala Thr Leu Phe Thr 355 360 365 Phe Phe Leu Ser Ala Val Phe His Glu Met Ala Met Phe Ala Ile Phe 370 375 380 Arg Arg Val Arg Gly Tyr Leu Phe Met Phe Gln Leu Ser Gln Phe Val 385 390 395 400 Trp Thr Ala Leu Ser Asn Thr Lys Phe Leu Arg Ala Arg Pro Gln Leu 405 410 415 Ser Asn Val Val Phe Ser Phe Gly Val Cys Ser Gly Pro 420 425 <210> 37 <211> 432 <212> PRT <213> Saccharomyces cerevisiae <400> 37 Glu Thr Val Val Thr Val Glu Thr Thr Ile Ile Ser Ser Asn Phe Ser 1 5 10 15 Gly Leu Tyr Val Ala Phe Trp Met Ala Ile Ala Phe Gly Ala Val Lys 20 25 30 Ala Leu Ile Asp Tyr Tyr Tyr Gln His Asn Gly Ser Phe Lys Asp Ser 35 40 45 Glu Ile Leu Lys Phe Met Thr Thr Asn Leu Phe Thr Val Ala Ser Val 50 55 60 Asp Leu Leu Met Tyr Leu Ser Thr Tyr Phe Val Val Gly Ile Gln Tyr 65 70 75 80 Leu Cys Lys Trp Gly Val Leu Lys Trp Gly Thr Thr Gly Trp Ile Phe 85 90 95 Thr Ser Ile Tyr Glu Phe Leu Phe Val Ile Phe Tyr Met Tyr Leu Thr 100 105 110 Glu Asn Ile Leu Lys Leu His Trp Leu Ser Lys Ile Phe Leu Phe Leu 115 120 125 His Ser Leu Val Leu Leu Met Lys Met His Ser Phe Ala Phe Tyr Asn 130 135 140 Gly Tyr Leu Trp Gly Ile Lys Glu Glu Leu Gln Phe Ser Lys Ser Ala 145 150 155 160 Leu Ala Lys Tyr Lys Asp Ser Ile Asn Asp Pro Lys Val Ile Gly Ala 165 170 175 Leu Glu Lys Ser Cys Glu Phe Cys Ser Phe Glu Leu Ser Ser Gln Ser 180 185 190 Leu Ser Asp Gln Thr Gln Lys Phe Pro Asn Asn Ile Ser Ala Lys Ser 195 200 205 Phe Phe Trp Phe Thr Met Phe Pro Thr Leu Ile Tyr Gln Ile Glu Tyr 210 215 220 Pro Arg Thr Lys Glu Ile Arg Trp Ser Tyr Val Leu Glu Lys Ile Cys 225 230 235 240 Ala Ile Phe Gly Thr Ile Phe Leu Met Met Ile Asp Ala Gln Ile Leu 245 250 255 Met Tyr Pro Val Ala Met Arg Ala Leu Ala Val Arg Asn Ser Glu Trp 260 265 270 Thr Gly Ile Leu Asp Arg Leu Leu Lys Trp Val Gly Leu Leu Val Asp 275 280 285 Ile Val Pro Gly Phe Ile Val Met Tyr Ile Leu Asp Phe Tyr Leu Ile 290 295 300 Trp Asp Ala Ile Leu Asn Cys Val Ala Glu Leu Thr Arg Phe Gly Asp 305 310 315 320 Arg Tyr Phe Tyr Gly Asp Trp Trp Asn Cys Val Ser Trp Ala Asp Phe 325 330 335 Ser Arg Ile Trp Asn Ile Pro Val His Lys Phe Leu Leu Arg His Val 340 345 350 Tyr His Ser Ser Met Ser Ser Phe Lys Leu Asn Lys Ser Gln Ala Thr 355 360 365 Leu Met Thr Phe Phe Leu Ser Ser Val Val His Glu Leu Ala Met Tyr 370 375 380 Val Ile Phe Lys Lys Leu Arg Phe Tyr Leu Phe Phe Phe Gln Met Leu 385 390 395 400 Gln Met Pro Leu Val Ala Leu Thr Asn Thr Lys Phe Met Arg Asn Arg 405 410 415 Thr Ile Ile Gly Asn Val Ile Phe Trp Leu Gly Ile Cys Met Gly Pro 420 425 430 <210> 38 <211> 1942 <212> DNA <213> Arabidopsis thaliana <400> 38 ctctcgtgaa tcctttttcc tttcttcttc ttcttctctt cagagaaaac tttgcttctc 60 tttctataag gaaccagaca cgaatcccat tcccaccgat ttcttagctt cttccttcaa 120 tccgctcttt ccctctccat tagattctgt ttcctctttc aatttcttct gcatgcttct 180 cgattctctc tgacgcctct tttctcccga cgctgtttcg tcaaacgctt ttcgaaatgg 240 cgattttgga ttctgctggc gttactacgg tgacggagaa cggtggcgga gagttcgtcg 300 atcttgatag gcttcgtcga cggaaatcga gatcggattc ttctaacgga cttcttctct 360 ctggttccga taataattct ccttcggatg atgttggagc tcccgccgac gttagggatc 420 ggattgattc cgttgttaac gatgacgctc agggaacagc caatttggcc ggagataata 480 acggtggtgg cgataataac ggtggtggaa gaggcggcgg agaaggaaga ggaaacgccg 540 atgctacgtt tacgtatcga ccgtcggttc cagctcatcg gagggcgaga gagagtccac 600 ttagctccga cgcaatcttc aaacagagcc atgccggatt attcaacctc tgtgtagtag 660 ttcttattgc tgtaaacagt agactcatca tcgaaaatct tatgaagtat ggttggttga 720 tcagaacgga tttctggttt agttcaagat cgctgcgaga ttggccgctt ttcatgtgtt 780 gtatatccct ttcgatcttt cctttggctg cctttacggt tgagaaattg gtacttcaga 840 aatacatatc agaacctgtt gtcatctttc ttcatattat tatcaccatg acagaggttt 900 tgtatccagt ttacgtcacc ctaaggtgtg attctgcttt tttatcaggt gtcactttga 960 tgctcctcac ttgcattgtg tggctaaagt tggtttctta tgctcatact agctatgaca 1020 taagatccct agccaatgca gctgataagg ccaatcctga agtctcctac tacgttagct 1080 tgaagagctt ggcatatttc atggtcgctc ccacattgtg ttatcagcca agttatccac 1140 gttctgcatg tatacggaag ggttgggtgg ctcgtcaatt tgcaaaactg gtcatattca 1200 ccggattcat gggatttata atagaacaat atataaatcc tattgtcagg aactcaaagc 1260 atcctttgaa aggcgatctt ctatatgcta ttgaaagagt gttgaagctt tcagttccaa 1320 atttatatgt gtggctctgc atgttctact gcttcttcca cctttggtta aacatattgg 1380 cagagcttct ctgcttcggg gatcgtgaat tctacaaaga ttggtggaat gcaaaaagtg 1440 tgggagatta ctggagaatg tggaatatgc ctgttcataa atggatggtt cgacatatat 1500 acttcccgtg cttgcgcagc aagataccaa agacactcgc cattatcatt gctttcctag 1560 tctctgcagt ctttcatgag ctatgcatcg cagttccttg tcgtctcttc aagctatggg 1620 cttttcttgg gattatgttt caggtgcctt tggtcttcat cacaaactat ctacaggaaa 1680 ggtttggctc aacggtgggg aacatgatct tctggttcat cttctgcatt ttcggacaac 1740 cgatgtgtgt gcttctttat taccacgacc tgatgaaccg aaaaggatcg atgtcatgaa 1800 acaactgttc aaaaaatgac tttcttcaaa catctatggc ctcgttggat ctccgttgat 1860 gttgtggtgg ttctgatgct aaaacgacaa atagtgttat aaccattgaa gaagaaaaga 1920 caattagagt tgttgtatcg ca 1942 <210> 39 <211> 520 <212> PRT <213> Arabidopsis thaliana <400> 39 Met Ala Ile Leu Asp Ser Ala Gly Val Thr Thr Val Thr Glu Asn Gly 1 5 10 15 Gly Gly Glu Phe Val Asp Leu Asp Arg Leu Arg Arg Arg Lys Ser Arg 20 25 30 Ser Asp Ser Ser Asn Gly Leu Leu Leu Ser Gly Ser Asp Asn Asn Ser 35 40 45 Pro Ser Asp Asp Val Gly Ala Pro Ala Asp Val Arg Asp Arg Ile Asp 50 55 60 Ser Val Val Asn Asp Asp Ala Gln Gly Thr Ala Asn Leu Ala Gly Asp 65 70 75 80 Asn Asn Gly Gly Gly Asp Asn Asn Gly Gly Gly Arg Gly Gly Gly Glu 85 90 95 Gly Arg Gly Asn Ala Asp Ala Thr Phe Thr Tyr Arg Pro Ser Val Pro 100 105 110 Ala His Arg Arg Ala Arg Glu Ser Pro Leu Ser Ser Asp Ala Ile Phe 115 120 125 Lys Gln Ser His Ala Gly Leu Phe Asn Leu Cys Val Val Val Leu Ile 130 135 140 Ala Val Asn Ser Arg Leu Ile Ile Glu Asn Leu Met Lys Tyr Gly Trp 145 150 155 160 Leu Ile Arg Thr Asp Phe Trp Phe Ser Ser Arg Ser Leu Arg Asp Trp 165 170 175 Pro Leu Phe Met Cys Cys Ile Ser Leu Ser Ile Phe Pro Leu Ala Ala 180 185 190 Phe Thr Val Glu Lys Leu Val Leu Gln Lys Tyr Ile Ser Glu Pro Val 195 200 205 Val Ile Phe Leu His Ile Ile Ile Thr Met Thr Glu Val Leu Tyr Pro 210 215 220 Val Tyr Val Thr Leu Arg Cys Asp Ser Ala Phe Leu Ser Gly Val Thr 225 230 235 240 Leu Met Leu Leu Thr Cys Ile Val Trp Leu Lys Leu Val Ser Tyr Ala 245 250 255 His Thr Ser Tyr Asp Ile Arg Ser Leu Ala Asn Ala Ala Asp Lys Ala 260 265 270 Asn Pro Glu Val Ser Tyr Tyr Val Ser Leu Lys Ser Leu Ala Tyr Phe 275 280 285 Met Val Ala Pro Thr Leu Cys Tyr Gln Pro Ser Tyr Pro Arg Ser Ala 290 295 300 Cys Ile Arg Lys Gly Trp Val Ala Arg Gln Phe Ala Lys Leu Val Ile 305 310 315 320 Phe Thr Gly Phe Met Gly Phe Ile Ile Glu Gln Tyr Ile Asn Pro Ile 325 330 335 Val Arg Asn Ser Lys His Pro Leu Lys Gly Asp Leu Leu Tyr Ala Ile 340 345 350 Glu Arg Val Leu Lys Leu Ser Val Pro Asn Leu Tyr Val Trp Leu Cys 355 360 365 Met Phe Tyr Cys Phe Phe His Leu Trp Leu Asn Ile Leu Ala Glu Leu 370 375 380 Leu Cys Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp Trp Asn Ala Lys 385 390 395 400 Ser Val Gly Asp Tyr Trp Arg Met Trp Asn Met Pro Val His Lys Trp 405 410 415 Met Val Arg His Ile Tyr Phe Pro Cys Leu Arg Ser Lys Ile Pro Lys 420 425 430 Thr Leu Ala Ile Ile Ile Ala Phe Leu Val Ser Ala Val Phe His Glu 435 440 445 Leu Cys Ile Ala Val Pro Cys Arg Leu Phe Lys Leu Trp Ala Phe Leu 450 455 460 Gly Ile Met Phe Gln Val Pro Leu Val Phe Ile Thr Asn Tyr Leu Gln 465 470 475 480 Glu Arg Phe Gly Ser Thr Val Gly Asn Met Ile Phe Trp Phe Ile Phe 485 490 495 Cys Ile Phe Gly Gln Pro Met Cys Val Leu Leu Tyr Tyr His Asp Leu 500 505 510 Met Asn Arg Lys Gly Ser Met Ser 515 520 <210> 40 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 40 tgcaaattga cgagcacacc aaccccttc 29 <210> 41 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonuclotide primer <400> 41 aaggatgctt tgagttcctg acaatagg 28 <210> 42 <211> 1942 <212> DNA <213> Arabidopsis thaliana <400> 42 ctctcgtgaa tcctttttcc tttcttcttc ttcttctctt cagagaaaac tttgcttctc 60 tttctataag gaaccagaca cgaatcccat tcccaccgat ttcttagctt cttccttcaa 120 tccgctcttt ccctctccat tagattctgt ttcctctttc aatttcttct gcatgcttct 180 cgattctctc tgacgcctct tttctcccga cgctgtttcg tcaaacgctt ttcgaaatgg 240 cgattttgga ttctgctggc gttactacgg tgacggagaa cggtggcgga gagttcgtcg 300 atcttgatag gcttcgtcga cggaaatcga gatcggattc ttctaacgga cttcttctct 360 ctggttccga taataattct ccttcggatg atgttggagc tcccgccgac gttagggatc 420 ggattgattc cgttgttaac gatgacgctc agggaacagc caatttggcc ggagataata 480 acggtggtgg cgataataac ggtggtggaa gaggcggcgg agaaggaaga ggaaacgccg 540 atgctacgtt tacgtatcga ccgtcggttc cagctcatcg gagggcgaga gagagtccac 600 ttagctccga cgcaatcttc aaacagagcc atgccggatt attcaacctc tgtgtagtag 660 ttcttattgc tgtaaacagt agactcatca tcgaaaatct tatgaagtat ggttggttga 720 tcagaacgga tttctggttt agttcaagat cgctgcgaga ttggccgctt ttcatgtgtt 780 gtatatccct ttcgatcttt cctttggctg cctttacggt tgagaaattg gtacttcaga 840 aatacatatc agaacctgtt gtcatctttc ttcatattat tatcaccatg acagaggttt 900 tgtatccagt ttacgtcacc ctaaggtgtg attctgcttt tttatcaggt gtcactttga 960 tgctcctcac ttgcattgtg tggctaaagt tggtttctta tgctcatact agctatgaca 1020 taagatccct agccaatgca gctgataagg ccaatcctga agtctcctac tacgttagct 1080 tgaagagctt ggcatatttc atggtcgctc ccacattgtg ttatcagcca agttatccac 1140 gttctgcatg tatacggaag ggttgggtgg ctcgtcaatt tgcaaaactg gtcatattca 1200 ccggattcat gggatttata atagaacaat atataaatcc tattgtcagg aactcaaagc 1260 atcctttgaa aggcgatctt ctatatgcta ttgaaagagt gttgaagctt tcagttccaa 1320 atttatatgt gtggctctgc atgttctact gcttcttcca cctttggtta aacatattgg 1380 cagagcttct ctgcttcggg gatcgtgaat tctacaaaga ttggtggaat gcaaaaagtg 1440 tgggagatta ctggagaatg tggaatatgc ctgttcataa atggatggtt cgacatatat 1500 acttcccgtg cttgcgcagc aagataccaa agacactcgc cattatcatt gctttcctag 1560 tctctgcagt ctttcatgag ctatgcatcg cagttccttg tcgtctcttc aagctatggg 1620 cttttcttgg gattatgttt caggtgcctt tggtcttcat cacaaactat ctacaggaaa 1680 ggtttggctc aacggtgggg aacatgatct tctggttcat cttctgcatt ttcggacaac 1740 cgatgtgtgt gcttctttat taccacgacc tgatgaaccg aaaaggatcg atgtcatgaa 1800 acaactgttc aaaaaatgac tttcttcaaa catctatggc ctcgttggat ctccgttgat 1860 gttgtggtgg ttctgatgct aaaacgacaa atagtgttat aaccattgaa gaagaaaaga 1920 caattagagt tgttgtatcg ca 1942 <210> 43 <211> 234 <212> DNA <213> Glycine max <220> <221> unsure <222> (1)..(234) <223> n=unknown <400> 43 gtaagcttca agagcttagc atanttcctg gttgccccta ncattatgtt accagccaan 60 ctatcctcgc acaccttata ttcgaaaggg ttggctgttt cgccaacttg tcaactgata 120 atatttacag gagttatggg atttataata gaacaataca ttaatcccat tgtacaaaat 180 tcacagcatc ctctcaaggg aaaccttctt tacgccatcg agagagttct gaag 234 <210> 44 <211> 267 <212> DNA <213> Glycine max <400> 44 ctgcttttgt atctggtgtc acgttgatgc tattaacttg cattgtgtgg ttaaaattgg 60 tgtcatatgc acatacaaac tatgatatga gagcacttac tgtttcgaat gaaaagggag 120 aaacattacc caatactttg atatggagta tccgtacact gtgaccttca ggagtttggc 180 atacttcatg gttgctccta cattatgcta tcagacaagc tatcctcgca caccttcagt 240 tcgaaagggt tgggtgtttc gtcaact 267 <210> 45 <211> 275 <212> DNA <213> Glycine max <220> <221> unsure <222> (1)..(275) <223> n=unknown <400> 45 gtggaatgcc aaaactgttg aagattattg gaggatgtgg aatatgcctg ttcacaaatg 60 gatgatccgc cacctatatt ttccatgttt aaggcacggt ataccaaagg ccgttgctct 120 tttaattgcc ttcctggttc tgctttattc catgagctgt gcatcgctgt tccttgccca 180 catattcaag tngtgggttt cngnggaatt nagtttcagg tnccttgggt ttcnaccnna 240 attnntnggc naaaaaattc cnngaacccc ggggg 275 <210> 46 <211> 257 <212> DNA <213> Glycine max <400> 46 aacggaattg agactccaga gaatatgcca aaatgtatta ataattgtca caacttggaa 60 ggcttttgga aaaactggca tgcttccttc aacaagtggc ttgtgaggta tatatacatt 120 cctcttgggg gatctaagaa aaagctacta aatgtgtggg ttgttttcac atttgttgca 180 atctggcatg atttagagtg gaagcttctt tcatgggcat ggttgacgtg tttattcttc 240 atccctgagt tggtttt 257 <210> 47 <211> 253 <212> DNA <213> Zea mays <400> 47 agaaaatgga acatgcctgt gcataaatgg attgttcgtc atatatattt tccttgcatg 60 cgaaatggta tatcaaagga agttgctgtt tttatatcgt tcttgtttct gctgtacttc 120 atgagttatg tgttgctgtt ccctgccaca tactcaagtt ctgggctttt tttaggaatc 180 atgcttcaga ttcccctcat catattgaca tcatacctca aaaataaatt cagtgacaca 240 atggttggca ata 253 <210> 48 <211> 254 <212> DNA <213> Zea mays <400> 48 tgaagtatgg cttattaata agatctggct tttggtttaa tgctacatca ttgcgagact 60 ggccactgct aatgtgttgc cttagtctac ccatatttcc ccttggtgca tttgcagtcg 120 aaaagttggc attcaacaat ctcattagtg atcctgctac tacctgtttt cacatccttt 180 ttacaacatt tgaaattgta tatccagtgc tcgtgattct taagtgtgat tctgcagttt 240 tatcaggctt tgtg 254 <210> 49 <211> 262 <212> DNA <213> Zea mays <400> 49 gaagtatggc ttattaataa gatctggctt ttggtttaat gctacatcat tgcgagactg 60 gccactgcta atgtgttgcc ttagtctacc catatttccc cttggtgcat ttgcagtcga 120 aaagttggca ttcaacaatc tcattagtga tcctgctact acctgttttc acatcctttt 180 tacaacattt gaaattgtat atccagtgct cgtgattctt aagtgtgatt ctgcagtttt 240 acaggctttg tgttgatgtt ta 262 <210> 50 <211> 325 <212> DNA <213> Zea mays <220> <221> unsure <222> (1)..(325) <223> n=unknown <400> 50 taatcnaacc tcgntncngg ttcagctgta tnccatgaga tatgtaatgc ggtgccgtgc 60 cacatantca natctnggca tnncngggat catngttcag ataccgntgg nattcttgac 120 aagatatctc catgctacgt tcaagcatgt aatggtgggc aacatgatan tttggntctn 180 cagtatagtc ggacagccga tgtnnnnnna tctatactac catgacgtca tgaacaggca 240 ggcccaggca agtagatagt ncggcagaga catgtacttc aacatcganc atcagnagca 300 nacngagcga gcggcangaa ncagc 325 <210> 51 <211> 519 <212> DNA <213> Mortierrella alpina <220> <221> unsure <222> (1)..(519) <223> n=unknown <400> 51 gagnnnngna acgtttagcc tnccgtagcc gccaaaatcc aagggncnac cnaccctncg 60 ttanactnaa ttngaaaatn cnnncccaac ttnaggnact tnnagncccc ccnacttgac 120 aacggagcac tatatttacc ccgtggtngt tcaacccagc catctcaccc ttgcgagcat 180 tggtgctgct cttgataccc ttcatgctta actatctcat gatcttttac atcattttcg 240 agtgcatctg caacgccttt gcggaactaa gttgctttgc ggatcgcaac ttttacgagg 300 attggtggaa ctgcgtcagc tttgatgagt gggcacgcaa atggaacaag cctgtgcaac 360 acttcttgct ccgccacgtg tacgactcga gcatccgagt ccttccactt gtccgaaatc 420 caatgccgcn aattgcaaac gttccttccc ggtcgtcaat gcgttcaacg aacctgggtg 480 aagaatgggt ggtgacaacg ttaaagtgcg cccggtatc 519 <210> 52 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Oligonucleotide primer <400> 52 ggatccgcgg ccgcacaatg aaaaaaatat cttcacatta ttcgg 45 <210> 53 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Oligonucleotide primer <400> 53 ggatcccctg caggtcattc attgacggca ttaacattgg 40 <210> 54 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 54 ggatccgcgg ccgcacaatg ggagcgaatt cgaaatcagt aacg 44 <210> 55 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 55 ggatcccctg caggttaata cccactttta tcaagctccc 40 <210> 56 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 56 ggatccgcgg ccgcacaatg tctctattac tggaagagat c 41 <210> 57 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 57 ggatcccctg caggttatgc atcaacagag acacttacag c 41 <210> 58 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 58 ggatccgcgg ccgcacaatg ggctggattc cgtgtccgtg c 41 <210> 59 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 59 ggatcccctg caggttaacc agaatcaact actttgtg 38 <210> 60 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Oligonucleotide primer <400> 60 tcgacctgca ggaagcttag aaatggcgat tttggattc 39 <210> 61 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Oligonucleotide primer <400> 61 ggatccgcgg ccgctcatga catcgatcct tttcgg 36 <210> 62 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Annealed oligonucleotide adapter <400> 62 cgcgatttaa atggcgcgcc ctgcaggcgg ccgcctgcag ggcgcgccat ttaaat 56 <210> 63 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 63 tcgaggatcc gcggccgcaa gcttcctgca gg 32 <210> 64 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 64 tcgacctgca ggaagcttgc ggccgcggat cc 32 <210> 65 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 65 tcgacctgca ggaagcttgc ggccgcggat cc 32 <210> 66 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 66 tcgaggatcc gcggccgcaa gcttcctgca gg 32 <210> 67 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 67 tcgaggatcc gcggccgcaa gcttcctgca ggagct 36 <210> 68 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 68 cctgcaggaa gcttgcggcc gcggatcc 28 <210> 69 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 69 tcgacctgca ggaagcttgc ggccgcggat ccagct 36 <210> 70 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 70 ggatccgcgg ccgcaagctt cctgcagg 28 <210> 71 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 71 gatcacctgc aggaagcttg cggccgcgga tccaatgca 39 <210> 72 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Ligating oligonucleotide <400> 72 ttggatccgc ggccgcaagc ttcctgcagg t 31 <210> 73 <211> 2013 <212> DNA <213> Arabidopsis thaliana <400> 73 atgcccctta ttcatcggaa aaagccgacg gagaaaccat cgacgccgcc atctgaagag 60 gtggtgcacg atgaggattc gcaaaagaaa ccacacgaat cttccaaatc ccaccataag 120 aaatcgaacg gaggagggaa gtggtcgtgc atcgattctt gttgttggtt cattgggtgt 180 gtgtgtgtaa cctggtggtt tcttctcttc ctttacaacg caatgcctgc gagcttccct 240 cagtatgtaa cggagcgaat cacgggtcct ttgcctgacc cgcccggtgt taagctcaaa 300 aaagaaggtc ttaaggcgaa acatcctgtt gtcttcattc ctgggattgt caccggtggg 360 ctcgagcttt gggaaggcaa acaatgcgct gatggtttat ttagaaaacg tttgtggggt 420 ggaacttttg gtgaagtcta caaaaggcct ctatgttggg tggaacacat gtcacttgac 480 aatgaaactg ggttggatcc agctggtatt agagttcgag ctgtatcagg actcgtggct 540 gctgactact ttgctcctgg ctactttgtc tgggcagtgc tgattgctaa ccttgcacat 600 attggatatg aagagaaaaa tatgtacatg gctgcatatg actggcggct ttcgtttcag 660 aacacagagg tacgtgatca gactcttagc cgtatgaaaa gtaatataga gttgatggtt 720 tctaccaacg gtggaaaaaa agcagttata gttccgcatt ccatgggggt cttgtatttt 780 ctacatttta tgaagtgggt tgaggcacca gctcctctgg gtggcggggg tgggccagat 840 tggtgtgcaa agtatattaa ggcggtgatg aacattggtg gaccatttct tggtgttcca 900 aaagctgttg cagggctttt ctctgctgaa gcaaaggatg ttgcagttgc cagagcgatt 960 gccccaggat tcttagacac cgatatattt agacttcaga ccttgcagca tgtaatgaga 1020 atgacacgca catgggactc aacaatgtct atgttaccga agggaggtga cacgatatgg 1080 ggcgggcttg attggtcacc ggagaaaggc cacacctgtt gtgggaaaaa gcaaaagaac 1140 aacgaaactt gtggtgaagc aggtgaaaac ggagtttcca agaaaagtcc tgttaactat 1200 ggaaggatga tatcttttgg gaaagaagta gcagaggctg cgccatctga gattaataat 1260 attgattttc gaggtgctgt caaaggtcag agtatcccaa atcacacctg tcgtgacgtg 1320 tggacagagt accatgacat gggaattgct gggatcaaag ctatcgctga gtataaggtc 1380 tacactgctg gtgaagctat agatctacta cattatgttg ctcctaagat gatggcgcgt 1440 ggtgccgctc atttctctta tggaattgct gatgatttgg atgacaccaa gtatcaagat 1500 cccaaatact ggtcaaatcc gttagagaca aaattaccga atgctcctga gatggaaatc 1560 tactcattat acggagtggg gataccaacg gaacgagcat acgtatacaa gcttaaccag 1620 tctcccgaca gttgcatccc ctttcagata ttcacttctg ctcacgagga ggacgaagat 1680 agctgtctga aagcaggagt ttacaatgtg gatggggatg aaacagtacc cgtcctaagt 1740 gccgggtaca tgtgtgcaaa agcgtggcgt ggcaagacaa gattcaaccc ttccggaatc 1800 aagacttata taagagaata caatcactct ccgccggcta acctgttgga agggcgcggg 1860 acgcagagtg gtgcccatgt tgatatcatg ggaaactttg ctttgatcga agatatcatg 1920 agggttgccg ccggaggtaa cgggtctgat ataggacatg accaggtcca ctctggcata 1980 tttgaatggt cggagcgtat tgacctgaag ctg 2013 <210> 74 <211> 671 <212> PRT <213> Arabidopsis thaliana <400> 74 Met Pro Leu Ile His Arg Lys Lys Pro Thr Glu Lys Pro Ser Thr Pro 1 5 10 15 Pro Ser Glu Glu Val Val His Asp Glu Asp Ser Gln Lys Lys Pro His 20 25 30 Glu Ser Ser Lys Ser His His Lys Lys Ser Asn Gly Gly Gly Lys Trp 35 40 45 Ser Cys Ile Asp Ser Cys Cys Trp Phe Ile Gly Cys Val Cys Val Thr 50 55 60 Trp Trp Phe Leu Leu Phe Leu Tyr Asn Ala Met Pro Ala Ser Phe Pro 65 70 75 80 Gln Tyr Val Thr Glu Arg Ile Thr Gly Pro Leu Pro Asp Pro Pro Gly 85 90 95 Val Lys Leu Lys Lys Glu Gly Leu Lys Ala Lys His Pro Val Val Phe 100 105 110 Ile Pro Gly Ile Val Thr Gly Gly Leu Glu Leu Trp Glu Gly Lys Gln 115 120 125 Cys Ala Asp Gly Leu Phe Arg Lys Arg Leu Trp Gly Gly Thr Phe Gly 130 135 140 Glu Val Tyr Lys Arg Pro Leu Cys Trp Val Glu His Met Ser Leu Asp 145 150 155 160 Asn Glu Thr Gly Leu Asp Pro Ala Gly Ile Arg Val Arg Ala Val Ser 165 170 175 Gly Leu Val Ala Ala Asp Tyr Phe Ala Pro Gly Tyr Phe Val Trp Ala 180 185 190 Val Leu Ile Ala Asn Leu Ala His Ile Gly Tyr Glu Glu Lys Asn Met 195 200 205 Tyr Met Ala Ala Tyr Asp Trp Arg Leu Ser Phe Gln Asn Thr Glu Val 210 215 220 Arg Asp Gln Thr Leu Ser Arg Met Lys Ser Asn Ile Glu Leu Met Val 225 230 235 240 Ser Thr Asn Gly Gly Lys Lys Ala Val Ile Val Pro His Ser Met Gly 245 250 255 Val Leu Tyr Phe Leu His Phe Met Lys Trp Val Glu Ala Pro Ala Pro 260 265 270 Leu Gly Gly Gly Gly Gly Pro Asp Trp Cys Ala Lys Tyr Ile Lys Ala 275 280 285 Val Met Asn Ile Gly Gly Pro Phe Leu Gly Val Pro Lys Ala Val Ala 290 295 300 Gly Leu Phe Ser Ala Glu Ala Lys Asp Val Ala Val Ala Arg Ala Ile 305 310 315 320 Ala Pro Gly Phe Leu Asp Thr Asp Ile Phe Arg Leu Gln Thr Leu Gln 325 330 335 His Val Met Arg Met Thr Arg Thr Trp Asp Ser Thr Met Ser Met Leu 340 345 350 Pro Lys Gly Gly Asp Thr Ile Trp Gly Gly Leu Asp Trp Ser Pro Glu 355 360 365 Lys Gly His Thr Cys Cys Gly Lys Lys Gln Lys Asn Asn Glu Thr Cys 370 375 380 Gly Glu Ala Gly Glu Asn Gly Val Ser Lys Lys Ser Pro Val Asn Tyr 385 390 395 400 Gly Arg Met Ile Ser Phe Gly Lys Glu Val Ala Glu Ala Ala Pro Ser 405 410 415 Glu Ile Asn Asn Ile Asp Phe Arg Gly Ala Val Lys Gly Gln Ser Ile 420 425 430 Pro Asn His Thr Cys Arg Asp Val Trp Thr Glu Tyr His Asp Met Gly 435 440 445 Ile Ala Gly Ile Lys Ala Ile Ala Glu Tyr Lys Val Tyr Thr Ala Gly 450 455 460 Glu Ala Ile Asp Leu Leu His Tyr Val Ala Pro Lys Met Met Ala Arg 465 470 475 480 Gly Ala Ala His Phe Ser Tyr Gly Ile Ala Asp Asp Leu Asp Asp Thr 485 490 495 Lys Tyr Gln Asp Pro Lys Tyr Trp Ser Asn Pro Leu Glu Thr Lys Leu 500 505 510 Pro Asn Ala Pro Glu Met Glu Ile Tyr Ser Leu Tyr Gly Val Gly Ile 515 520 525 Pro Thr Glu Arg Ala Tyr Val Tyr Lys Leu Asn Gln Ser Pro Asp Ser 530 535 540 Cys Ile Pro Phe Gln Ile Phe Thr Ser Ala His Glu Glu Asp Glu Asp 545 550 555 560 Ser Cys Leu Lys Ala Gly Val Tyr Asn Val Asp Gly Asp Glu Thr Val 565 570 575 Pro Val Leu Ser Ala Gly Tyr Met Cys Ala Lys Ala Trp Arg Gly Lys 580 585 590 Thr Arg Phe Asn Pro Ser Gly Ile Lys Thr Tyr Ile Arg Glu Tyr Asn 595 600 605 His Ser Pro Pro Ala Asn Leu Leu Glu Gly Arg Gly Thr Gln Ser Gly 610 615 620 Ala His Val Asp Ile Met Gly Asn Phe Ala Leu Ile Glu Asp Ile Met 625 630 635 640 Arg Val Ala Ala Gly Gly Asn Gly Ser Asp Ile Gly His Asp Gln Val 645 650 655 His Ser Gly Ile Phe Glu Trp Ser Glu Arg Ile Asp Leu Lys Leu 660 665 670 <210> 75 <211> 1986 <212> DNA <213> Saccharomyces cerevisiae <400> 75 atgggcacac tgtttcgaag aaatgtccag aaccaaaaga gtgattctga tgaaaacaat 60 aaagggggtt ctgttcataa caagcgagag agcagaaacc acattcatca tcaacaggga 120 ttaggccata agagaagaag gggtattagt ggcagtgcaa aaagaaatga gcgtggcaaa 180 gatttcgaca ggaaaagaga cgggaacggt agaaaacgtt ggagagattc cagaagactg 240 attttcattc ttggtgcatt cttaggtgta cttttgccgt ttagctttgg cgcttatcat 300 gttcataata gcgatagcga cttgtttgac aactttgtaa attttgattc acttaaagtg 360 tatttggatg attggaaaga tgttctccca caaggtataa gttcgtttat tgatgatatt 420 caggctggta actactccac atcttcttta gatgatctca gtgaaaattt tgccgttggt 480 aaacaactct tacgtgatta taatatcgag gccaaacatc ctgttgtaat ggttcctggt 540 gtcatttcta cgggaattga aagctgggga gttattggag acgatgagtg cgatagttct 600 gcgcattttc gtaaacggct gtggggaagt ttttacatgc tgagaacaat ggttatggat 660 aaagtttgtt ggttgaaaca tgtaatgtta gatcctgaaa caggtctgga cccaccgaac 720 tttacgctac gtgcagcaca gggcttcgaa tcaactgatt atttcatcgc agggtattgg 780 atttggaaca aagttttcca aaatctggga gtaattggct atgaacccaa taaaatgacg 840 agtgctgcgt atgattggag gcttgcatat ttagatctag aaagacgcga taggtacttt 900 acgaagctaa aggaacaaat cgaactgttt catcaattga gtggtgaaaa agtttgttta 960 attggacatt ctatgggttc tcagattatc ttttacttta tgaaatgggt cgaggctgaa 1020 ggccctcttt acggtaatgg tggtcgtggc tgggttaacg aacacataga ttcattcatt 1080 aatgcagcag ggacgcttct gggcgctcca aaggcagttc cagctctaat tagtggtgaa 1140 atgaaagata ccattcaatt aaatacgtta gccatgtatg gtttggaaaa gttcttctca 1200 agaattgaga gagtaaaaat gttacaaacg tggggtggta taccatcaat gctaccaaag 1260 ggagaagagg tcatttgggg ggatatgaag tcatcttcag aggatgcatt gaataacaac 1320 actgacacat acggcaattt cattcgattt gaaaggaata cgagcgatgc tttcaacaaa 1380 aatttgacaa tgaaagacgc cattaacatg acattatcga tatcacctga atggctccaa 1440 agaagagtac atgagcagta ctcgttcggc tattccaaga atgaagaaga gttaagaaaa 1500 aatgagctac accacaagca ctggtcgaat ccaatggaag taccacttcc agaagctccc 1560 cacatgaaaa tctattgtat atacggggtg aacaacccaa ctgaaagggc atatgtatat 1620 aaggaagagg atgactcctc tgctctgaat ttgaccatcg actacgaaag caagcaacct 1680 gtattcctca ccgaggggga cggaaccgtt ccgctcgtgg cgcattcaat gtgtcacaaa 1740 tgggcccagg gtgcttcacc gtacaaccct gccggaatta acgttactat tgtggaaatg 1800 aaacaccagc cagatcgatt tgatatacgt ggtggagcaa aaagcgccga acacgtagac 1860 atcctcggca gcgcggagtt gaacgattac atcttgaaaa ttgcaagcgg taatggcgat 1920 ctcgtcgagc cacgccaatt gtctaatttg agccagtggg tttctcagat gcccttccca 1980 atgtaa 1986 <210> 76 <211> 661 <212> PRT <213> Saccharomyces cerevisiae <400> 76 Met Gly Thr Leu Phe Arg Arg Asn Val Gln Asn Gln Lys Ser Asp Ser 1 5 10 15 Asp Glu Asn Asn Lys Gly Gly Ser Val His Asn Lys Arg Glu Ser Arg 20 25 30 Asn His Ile His His Gln Gln Gly Leu Gly His Lys Arg Arg Arg Gly 35 40 45 Ile Ser Gly Ser Ala Lys Arg Asn Glu Arg Gly Lys Asp Phe Asp Arg 50 55 60 Lys Arg Asp Gly Asn Gly Arg Lys Arg Trp Arg Asp Ser Arg Arg Leu 65 70 75 80 Ile Phe Ile Leu Gly Ala Phe Leu Gly Val Leu Leu Pro Phe Ser Phe 85 90 95 Gly Ala Tyr His Val His Asn Ser Asp Ser Asp Leu Phe Asp Asn Phe 100 105 110 Val Asn Phe Asp Ser Leu Lys Val Tyr Leu Asp Asp Trp Lys Asp Val 115 120 125 Leu Pro Gln Gly Ile Ser Ser Phe Ile Asp Asp Ile Gln Ala Gly Asn 130 135 140 Tyr Ser Thr Ser Ser Leu Asp Asp Leu Ser Glu Asn Phe Ala Val Gly 145 150 155 160 Lys Gln Leu Leu Arg Asp Tyr Asn Ile Glu Ala Lys His Pro Val Val 165 170 175 Met Val Pro Gly Val Ile Ser Thr Gly Ile Glu Ser Trp Gly Val Ile 180 185 190 Gly Asp Asp Glu Cys Asp Ser Ser Ala His Phe Arg Lys Arg Leu Trp 195 200 205 Gly Ser Phe Tyr Met Leu Arg Thr Met Val Met Asp Lys Val Cys Trp 210 215 220 Leu Lys His Val Met Leu Asp Pro Glu Thr Gly Leu Asp Pro Pro Asn 225 230 235 240 Phe Thr Leu Arg Ala Ala Gln Gly Phe Glu Ser Thr Asp Tyr Phe Ile 245 250 255 Ala Gly Tyr Trp Ile Trp Asn Lys Val Phe Gln Asn Leu Gly Val Ile 260 265 270 Gly Tyr Glu Pro Asn Lys Met Thr Ser Ala Ala Tyr Asp Trp Arg Leu 275 280 285 Ala Tyr Leu Asp Leu Glu Arg Arg Asp Arg Tyr Phe Thr Lys Leu Lys 290 295 300 Glu Gln Ile Glu Leu Phe His Gln Leu Ser Gly Glu Lys Val Cys Leu 305 310 315 320 Ile Gly His Ser Met Gly Ser Gln Ile Ile Phe Tyr Phe Met Lys Trp 325 330 335 Val Glu Ala Glu Gly Pro Leu Tyr Gly Asn Gly Gly Arg Gly Trp Val 340 345 350 Asn Glu His Ile Asp Ser Phe Ile Asn Ala Ala Gly Thr Leu Leu Gly 355 360 365 Ala Pro Lys Ala Val Pro Ala Leu Ile Ser Gly Glu Met Lys Asp Thr 370 375 380 Ile Gln Leu Asn Thr Leu Ala Met Tyr Gly Leu Glu Lys Phe Phe Ser 385 390 395 400 Arg Ile Glu Arg Val Lys Met Leu Gln Thr Trp Gly Gly Ile Pro Ser 405 410 415 Met Leu Pro Lys Gly Glu Glu Val Ile Trp Gly Asp Met Lys Ser Ser 420 425 430 Ser Glu Asp Ala Leu Asn Asn Asn Thr Asp Thr Tyr Gly Asn Phe Ile 435 440 445 Arg Phe Glu Arg Asn Thr Ser Asp Ala Phe Asn Lys Asn Leu Thr Met 450 455 460 Lys Asp Ala Ile Asn Met Thr Leu Ser Ile Ser Pro Glu Trp Leu Gln 465 470 475 480 Arg Arg Val His Glu Gln Tyr Ser Phe Gly Tyr Ser Lys Asn Glu Glu 485 490 495 Glu Leu Arg Lys Asn Glu Leu His His Lys His Trp Ser Asn Pro Met 500 505 510 Glu Val Pro Leu Pro Glu Ala Pro His Met Lys Ile Tyr Cys Ile Tyr 515 520 525 Gly Val Asn Asn Pro Thr Glu Arg Ala Tyr Val Tyr Lys Glu Glu Asp 530 535 540 Asp Ser Ser Ala Leu Asn Leu Thr Ile Asp Tyr Glu Ser Lys Gln Pro 545 550 555 560 Val Phe Leu Thr Glu Gly Asp Gly Thr Val Pro Leu Val Ala His Ser 565 570 575 Met Cys His Lys Trp Ala Gln Gly Ala Ser Pro Tyr Asn Pro Ala Gly 580 585 590 Ile Asn Val Thr Ile Val Glu Met Lys His Gln Pro Asp Arg Phe Asp 595 600 605 Ile Arg Gly Gly Ala Lys Ser Ala Glu His Val Asp Ile Leu Gly Ser 610 615 620 Ala Glu Leu Asn Asp Tyr Ile Leu Lys Ile Ala Ser Gly Asn Gly Asp 625 630 635 640 Leu Val Glu Pro Arg Gln Leu Ser Asn Leu Ser Gln Trp Val Ser Gln 645 650 655 Met Pro Phe Pro Met 660 <210> 77 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 77 ggatccgcgg ccgcacaatg ccccttattc atcgg 35 <210> 78 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 78 ggatcccctg caggtcacag cttcaggtca atacg 35 <210> 79 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 79 ggatccgcgg ccgcacaatg ggcacactct ttcgaag 37 <210> 80 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide primer <400> 80 ggatcccctg caggttacat tgggcacact gtttcgaag 39

Claims (21)

  1. 하기로 구성된 군으로부터 선택된 폴리뉴클레오티드를 포함하는 코딩 서열을 포함하는 분리된 핵산 서열:
    (a) 서열 번호 4 또는 6의 핵산 서열과 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 및
    (b) 서열 번호 4 또는 6의 핵산 서열에 5X SSC, 50% 포름아미드 및 42℃의 조건 하에 혼성화하는 분리된 폴리뉴클레오티드;
    여기서 상기 코딩 서열은 식물 아실전달효소 폴리펩티드를 코딩하고, 상기 코딩 서열은 식물에서 기능성인 이종 조절 서열에 작동가능하게 연결됨.
  2. 제 1 항의 폴리뉴클레오티드에 작동가능하게 연결된 이종 조절 서열을 포함하고 종결 서열을 추가로 포함하는 재조합 핵산 구축물.
  3. 제 2 항에 있어서, 상기 조절 서열이 식물 세포에서 기능성인 재조합 핵산 구축물.
  4. 제 2 항에 있어서, 상기 조절 서열이 구성 프로모터를 포함하는 재조합 핵산 구축물.
  5. 제 2 항에 있어서, 상기 조절 서열이 유도성 프로모터를 포함하는 재조합 핵산 구축물.
  6. 제 2 항에 있어서, 상기 조절 서열이 조직 특이성 프로모터, 발생적으로 조절된 프로모터, 기관 특이성 프로모터, 및 종자 특이성 프로모터로 구성된 군으로부터 선택된 재조합 핵산 구축물.
  7. 제 2 항의 재조합 핵산 구축물을 함유하는 숙주 세포.
  8. 제 7 항에 있어서, 상기 숙주 세포가 식물 세포 및 박테리오파아지로 구성된 군으로부터 선택된 숙주 세포.
  9. 제 7 항에 있어서, 상기 숙주 세포가 식물 세포인 숙주 세포.
  10. 제 7 항에 있어서, 상기 숙주 세포가 제 2 항의 재조합 핵산 구축물에 의해 코딩되는 폴리펩티드를 발현하는 숙주 세포.
  11. 제 7 항의 하나 이상의 숙주 세포를 포함하는 식물.
  12. 제 2 항의 재조합 핵산 구축물을 함유하는, 제 11 항의 식물의 자손 식물.
  13. 제 2 항의 재조합 핵산 구축물을 함유하는, 제 11 항의 식물 유래의 종자.
  14. 제 2 항의 재조합 핵산 구축물을 포함하는 식물.
  15. 제 2 항의 재조합 핵산 구축물을 함유하는, 제 14 항의 식물의 자손.
  16. 제 2 항의 재조합 핵산 구축물을 함유하는, 제 14 항의 식물 유래의 종자.
  17. 하기로 구성된 군으로부터 선택된 폴리뉴클레오티드에 작동가능하게 연결된 이종 조절 서열을 함유하는 재조합 구조물을 포함하는 식물:
    (a) 서열 번호 4 또는 6의 핵산 서열과 95% 이상의 서열 동일성을 가지는 분리된 폴리뉴클레오티드; 및
    (b) 서열 번호 4 또는 6의 핵산 서열에 5X SSC, 50% 포름아미드 및 42℃의 조건 하에 혼성화하는 분리된 폴리뉴클레오티드;
    여기서 상기 재조합 구조물의 발현은 상기 재조합 구조물이 없는 동일한 식물에 비교하여 상기 식물에 의하여 오일의 증가된 생산을 야기함.
  18. 제 17 항에 있어서, 상기 조절 서열이 조직 특이성 프로모터인 식물.
  19. 제 17 항에 있어서, 상기 조절 서열이 종자 특이성 프로모터인 식물.
  20. 제 1 항에 있어서, 상기 핵산이 서열 번호 4 또는 6의 핵산 서열과 95% 이상의 서열 동일성을 가지는 분리된 핵산 서열.
  21. 제 1 항에 있어서, 상기 핵산이 5X SSC, 50% 포름아미드 및 42℃의 조건 하에 서열 번호 4 또는 6의 핵산 서열에 혼성화하는 분리된 핵산 서열.
KR1020087012160A 1999-08-30 2000-08-30 식물 스테롤 아실전달효소 KR20080049150A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15249399P 1999-08-30 1999-08-30
US60/152,493 1999-08-30

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020027002789A Division KR100854607B1 (ko) 1999-08-30 2000-08-30 식물 스테롤 아실전달효소

Publications (1)

Publication Number Publication Date
KR20080049150A true KR20080049150A (ko) 2008-06-03

Family

ID=22543170

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020087012160A KR20080049150A (ko) 1999-08-30 2000-08-30 식물 스테롤 아실전달효소
KR1020027002789A KR100854607B1 (ko) 1999-08-30 2000-08-30 식물 스테롤 아실전달효소

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020027002789A KR100854607B1 (ko) 1999-08-30 2000-08-30 식물 스테롤 아실전달효소

Country Status (12)

Country Link
EP (2) EP1210417A2 (ko)
JP (1) JP4790952B2 (ko)
KR (2) KR20080049150A (ko)
CN (1) CN1372599A (ko)
AT (1) ATE484595T1 (ko)
AU (1) AU7092900A (ko)
BR (1) BRPI0014154B1 (ko)
CA (1) CA2381901C (ko)
DE (1) DE60045117D1 (ko)
MX (1) MXPA02002248A (ko)
WO (1) WO2001016308A2 (ko)
ZA (1) ZA200201410B (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6936289B2 (en) 1995-06-07 2005-08-30 Danisco A/S Method of improving the properties of a flour dough, a flour dough improving composition and improved food products
ATE362315T1 (de) 2001-05-18 2007-06-15 Danisco Verfahren zur herstellung von teig mit einem enzym
AU2003223975A1 (en) * 2002-03-30 2003-10-13 Basf Plant Science Gmbh Expression of phospholipid:diacylglycerine acyltransferase (pdat) for the production of plant storage lipids with polyunsaturated fatty acids
EP3323887A3 (en) 2003-01-17 2018-09-12 DuPont Nutrition Biosciences ApS Method for the in situ production of an emulsifier in a foodstuff
AU2004238892B8 (en) * 2003-05-16 2009-03-26 Agresearch Limited Modification of fatty acid biosynthesis using recombinant diacylglycerol acyltransferase sequences from ryegrass (Lolium) and fescue (Festuca)
AU2003902413A0 (en) 2003-05-16 2003-06-05 Agresearch Limited Modification of fatty acid biosynthesis
JP5697294B2 (ja) 2003-12-24 2015-04-08 デュポン ニュートリション バイオサイエンシーズ エーピーエス 糖脂質アシル基転移酵素変異体及びその製造方法
BRPI0513438A2 (pt) 2004-07-16 2011-01-04 Danisco método enzimático para degomagem de óleo
CA2603151A1 (en) * 2005-03-30 2006-10-05 Jitao Zou Identification of a sterol acyltransferase gene
CA2638739A1 (en) 2006-03-01 2007-09-13 Pioneer Hi-Bred International, Inc. Compositions related to the quantitative trait locus 6 (qtl6) in maize and methods of use
AU2007220007B2 (en) 2006-03-01 2013-02-21 E.I. Du Pont De Nemours And Company Compositions related to the quantitative trait locus 6 (QTL6) in maize and methods of use
JP5509094B2 (ja) 2007-12-21 2014-06-04 デュポン ニュートリション バイオサイエンシーズ エーピーエス 脂質アシルトランスフェラーゼを用いる食用油精製のためのプロセス
GB0905367D0 (en) * 2009-03-27 2009-05-13 Danisco Method
WO2010134035A1 (en) 2009-05-19 2010-11-25 Danisco A/S Use
GB0920089D0 (en) 2009-11-17 2009-12-30 Danisco Method
WO2011114251A1 (en) 2010-03-18 2011-09-22 Danisco A/S Foodstuff
MX2013011617A (es) 2011-04-08 2013-11-21 Danisco Us Inc Composiciones.
WO2014063097A1 (en) 2012-10-19 2014-04-24 Danisco Us Inc. Stabilization of biomimetic membranes
DK3083936T3 (en) 2013-12-19 2018-10-22 Danisco Us Inc USE OF HYDROPHOBINES TO INCREASE GAS TRANSFER IN AEROBE FERMENTATION PROCESSES
WO2019224187A1 (en) * 2018-05-22 2019-11-28 Dsm Ip Assets B.V. Modified sterol acyltransferases

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA00012100A (es) * 1998-06-05 2003-04-22 Calgene Llc Secuencias de acidos nucleicos relacionados con acil coenzima a: colesterol aciltransferasa.
AU2163000A (en) * 1998-12-03 2000-06-19 E.I. Du Pont De Nemours And Company Plan lecithin:cholesterol acyltransferases
DE60033793T2 (de) * 1999-04-01 2007-12-06 Basf Plant Science Gmbh Enzyme des triacylglycerol-biosynthesewegs und dafür kodierende rekombinante dna moleküle

Also Published As

Publication number Publication date
BRPI0014154B1 (pt) 2017-03-28
JP2003508052A (ja) 2003-03-04
ATE484595T1 (de) 2010-10-15
BR0014154A (pt) 2002-05-07
CA2381901A1 (en) 2001-03-08
CA2381901C (en) 2015-11-17
KR20020040797A (ko) 2002-05-30
EP1932917B1 (en) 2010-10-13
WO2001016308A2 (en) 2001-03-08
WO2001016308A3 (en) 2002-01-17
DE60045117D1 (de) 2010-11-25
EP1932917A2 (en) 2008-06-18
MXPA02002248A (es) 2002-09-30
JP4790952B2 (ja) 2011-10-12
KR100854607B1 (ko) 2008-08-27
EP1210417A2 (en) 2002-06-05
CN1372599A (zh) 2002-10-02
ZA200201410B (en) 2003-08-27
AU7092900A (en) 2001-03-26
EP1932917A3 (en) 2009-01-28

Similar Documents

Publication Publication Date Title
KR100854607B1 (ko) 식물 스테롤 아실전달효소
AU2017201411B2 (en) Production of long chain polyunsaturated fatty acids in plant cells
CA2109580C (en) Plant medium-chain thioesterases
US5455167A (en) Medium-chain thioesterases in plants
US7041872B2 (en) Acyl CoA:cholesterol acyltransferase related nucleic acid sequences
US5639790A (en) Plant medium-chain thioesterases
US6476294B1 (en) Plant phosphatidic acid phosphatases
US5304481A (en) Plant thioesterase having preferential hydrolase activity toward C12 acyl-acp substrate
US5807893A (en) Plant thioesterases and use for modification of fatty acid composition in plant seed oils
CN111154724A (zh) 包含二十二碳六烯酸的提取的植物脂质
US7601890B2 (en) Plant sterol acyltransferases
EP2006385A2 (en) Limnanthes oil genes
JP2017537633A (ja) 低飽和脂肪酸または無飽和脂肪酸トランスジェニックキャノーラの生成
AU1787101A (en) Oleoyl-acyl-carrier-protein thioesterases in plants

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application