KR20050059197A - Acc 유전자 - Google Patents

Acc 유전자 Download PDF

Info

Publication number
KR20050059197A
KR20050059197A KR1020057005191A KR20057005191A KR20050059197A KR 20050059197 A KR20050059197 A KR 20050059197A KR 1020057005191 A KR1020057005191 A KR 1020057005191A KR 20057005191 A KR20057005191 A KR 20057005191A KR 20050059197 A KR20050059197 A KR 20050059197A
Authority
KR
South Korea
Prior art keywords
leu
ala
val
glu
gly
Prior art date
Application number
KR1020057005191A
Other languages
English (en)
Other versions
KR101196180B1 (ko
Inventor
다쓰오 호시노
가즈유키 오지마
유타카 세토구치
Original Assignee
디에스엠 아이피 어셋츠 비.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디에스엠 아이피 어셋츠 비.브이. filed Critical 디에스엠 아이피 어셋츠 비.브이.
Publication of KR20050059197A publication Critical patent/KR20050059197A/ko
Application granted granted Critical
Publication of KR101196180B1 publication Critical patent/KR101196180B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P23/00Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)

Abstract

본 발명은 미생물성 카로테노이드의 생산을 증가시키는 방법에 유용한 유전자에 관한 것이다. 카로테노이드 아스타잔틴은 다양한 유기체, 예컨대 동물, 조류 및 미생물에 분포한다. 이는 활성 산소 종에 대해서 강력한 항산화 특성을 갖는다. 아스타잔틴은 착색제로서, 특히 어류, 예컨대 연어 양식업에 유용한데, 이는 아스타잔틴이 동물에 특유의 오렌지색-적색을 부여해서 시장에서 소비자의 호감을 끄는데 기여하기 때문이다.

Description

ACC 유전자{ACC GENE}
본 발명은 미생물성 카로테노이드를 생산을 증가시키는 방법에서 유용한 유전자에 관한 것이다.
카로테노이드 아스타잔틴은 다양한 유기체, 예컨대 동물, 조류 및 미생물에 분포한다. 이는 활성 산소 종에 대해 강력한 항산화 특성을 갖는다. 아스타잔틴은 착색제로서, 특히 어류 양식업, 예컨대 연어에서 유용하고, 이 아스타잔틴을 동물에 특유의 오렌지색-적색을 부여해서 시장에서 소비자의 호감을 끄는데 기여하기 때문이다.
예를 들어 파피아 로도지마(Phaffia rhodozyma)의 카로테노이드성 경로에서 제 1 단계의 하나는 아세틸-CoA의 두 개의 분자의 축합이고, 효소중 하나는 지방산 생합성에 관련된다.
도 1은 파피아 로도지마내에서 아세틸-CoA로부터 아스타잔틴을 생합성하는 연역적 경로를 도시하고 있다.
도 2는 파피아 로도지마의 염색체상의 ACC 유전자 영역을 포함하는 클로닝된 DNA 단편을 도시하고 있다.
하나의 측면에서, 본 발명은 아세틸-CoA 카복실화효소를 코딩하는 유전자를 포함하는 신규한 DNA 단편을 제공한다.
보다 특히, 본 발명은 조절 영역, 예컨대 프로모터 및 개방형 해독 구조를 함유하는 DNA를 제공한다.
본 발명은 파피아 로도지마에서 아세틸-CoA 카복실화효소를 코딩하는 DNA 단편을 제공한다. 상기 DNA는 이의 5' 내지 3'-비전사 영역내에 짧은 단편 사이에 측면의 개방형 해독 구조만을 함유하는 cDNA, 및 파피아 로도지마내에 아세틸-CoA 유전자의 발현에 필수적인 이의 조절 서열, 예컨대 이의 프로모터 및 종결인자를 함유하는 게놈 DNA를 의미한다.
따라서, 본 발명은
(a) 적어도 서열 번호 3으로 표시된 폴리펩타이드의 성숙한 형태를 코딩하는 핵산 분자;
(b) 서열 번호 2로 표시된 코딩 서열을 포함하는 핵산 분자;
(c) 뉴클레오타이드 서열이 (a) 또는 (b)의 뉴클레오타이드 서열에 대한 유전적 코드의 결과로서 변성된 핵산 분자;
(d) (a) 내지 (c)의 뉴클레오타이드에 의해 코딩된 폴리펩타이드의 아미노산 서열의 하나 이상의 아미노산을 치환, 제거 및/또는 첨가함으로써 (a) 내지 (c)의 폴리뉴클레오타이드에 의해 코딩된 폴리펩타이드로부터 유래하는 폴리펩타이드를 코딩하는 핵산 분자;
(e) 서열이 (a) 또는 (b)의 핵산 분자에 의해 코딩된 폴리펩타이드의 아미노산 서열과 56.3% 이상의 동일성을 갖는 폴리펩타이드로부터 유래하는 폴리펩타이드를 코딩하는 핵산 분자;
(f) (a) 내지 (e)중 어느 하나의 핵산 분자에 의해 코딩된 단편을 포함하고 아세틸-CoA 카복실화효소 활성을 갖는 핵산 분자;
(g) 서열 번호 4 내지 6으로 표시된 프라이머를 사용하여 파피아(Phaffia) 핵산 라이브러리로부터 증폭된 핵산 분자의 서열을 갖는 폴리뉴클레오타이드를 포함하는 핵산 분자;
(h) 아세틸-CoA 카복실화효소 활성을 갖고 (a) 내지 (g)중 어느 하나에 의해 코딩된 폴리펩타이드의 단편인 폴리펩타이드를 코딩하는 핵산 분자;
(i) (a) 내지 (d)중 어느 하나의 폴리뉴클레오타이드의 15개 이상의 뉴클레오타이드를 포함하는 핵산 분자;
(j) 아세틸-CoA 카복실화효소 활성을 갖고 (a) 내지 (h)중 어느 하나의 핵산 분자에 의해 코딩된 폴리펩타이드에 대해서 발생하는 항체에 의해 인식되는 폴리펩타이드를 코딩하는 핵산 분자;
(k) 엄중한 조건하에서 적당한 라이브러리를 (a) 내지 (j)중 어느 하나의 핵산 분자의 서열을 갖는 탐침으로 스크리닝함으로써 수득가능하고 아세틸-CoA 카복실화효소 활성을 갖는 폴리펩타이드를 코딩하는 핵산 분자; 및
(l) 엄중한 조건하에서 상보적 가닥을 (a) 내지 (k)중 어느 하나의 핵산 분자와 하이브리드화(hybridization)되고, 아세틸-CoA 카복실화효소 활성을 갖는 폴리펩타이드를 코딩하는 핵산 분자
로 구성된 군에서 선택된 하나 이상의 핵산 분자를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다.
본원에서 사용된 바와 같은 용어 "유전자", "폴리뉴클레오타이드", "핵산 서열", "뉴클레오타이드 서열", "DNA 서열" 또는 "핵산 분자"는 임의의 길이의 뉴클레오타이드, 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드의 중합 형태에 관한 것이다. 이 용어는 분자의 1차 구조에 관한 것이다.
따라서, 이 용어는 이중- 또는 단일-가닥 DNA 및 RNA를 포함한다. 또한 공지된 유형의 개질, 예를 들어 메틸화, 천연의 하나 이상의 뉴클레오타이드를 유사체와의 "캡" 치환을 포함한다. 바람직하게, 본 발명의 DNA 서열은 상기 정의된 폴리펩타이드를 코딩하는 코딩 서열을 포함한다.
"코딩 서열"은 적당한 조절 서열의 조절하에 위치할 때 mRNA로 전사되거나 및/또는 폴리펩타이드내로 번역되는 뉴클레오타이드 서열이다. 코딩 서열의 경계는 5'-말단에서 번역 시작 코돈 및 3'-말단에서 번역 종결 코돈에 의해 결정된다. 코딩 서열은 mRNA, cDNA, 재조합 뉴클레오타이드 서열 또는 게놈 DNA를 포함하지만 이에 제한되지 않고 이때 인트론이 또한 특정한 환경하에서 존재할 수 있다. 서열 번호 1은 인트론 서열이 파피아 로도지마로부터 아세틸-CoA 카복실화효소에 대한 코딩 서열내에 삽입되는 게놈 DNA를 설명하고 있다.
일반적으로, 유전자는 서로 상이한 기능을 갖는 몇몇의 부분으로 구성된다. 진핵생물에서, 상응하는 단백질을 코딩하는 유전자가 리보좀 RNA(rRNA), 작은 핵성 RNA(snRNA) 및 트랜스퍼 RNA(tRNA)에 대한 유전자와 상이한 예비-성숙 메신저 RNA(pre-mRNA)로 전사된다. 비록 RNA 중합효소 II(PolII)가 이 전사 시에 중심적인 역할을 할지라도, PolII가 프로모터 및 업스트림 활성 서열(UAS)를 포함하는 업스트림 및 트랜스 작동 단백질 인자를 포함하는 업스트림 영역을 포괄하는 시스 요소 없이 단독으로 전사를 시작할 수 없다. 먼저, 몇몇의 근본적인 단백질 성분으로 구성된 전사 개시 복합체가 발현된 유전자의 5'-인접 영역에 프로모터 서열을 인식한다. 이 사건에서, 일부의 특정한 조절, 예컨대 열 충격 반응 또는 양분 고갈에 적응 등에서 발현되는 유전자의 경우에 일부의 추가적인 참가자가 필요하다. 이러한 경우에, UAS는 프로모터 서열 주변에 5'-비전사된 업스트림 영역에 존재할 필요가 있고 일부의 양성 또는 음성 조절자 단백질은 UAS를 인식하고 결합한다. 프로모터 서열에 전사 개시 복합체의 결합 길이는 프로모터 주변에 트랜스-작용 인자의 이러한 결합에 의해 영향을 받고 이것이 전사 활성을 조절할 수 있다.
인산화에 의해 전사 개시 복합체의 활성 후, 전사 개시 복합체는 전사 출발 위치로부터 개시한다. 전사 개시 복합체의 일부분은 프로모터로부터 유전자의 3'방향으로 연장 복합체로서 분리되고(이 단계가 프로모터 제거 사건으로서 불린다) 연장 복합체는 이것이 유전자의 3'-인접 다운스트림 영역에 위치하는 종결 서열에 도달할 때까지 전사를 지속한다. 따라서 생성된 예비-mRNA는 대부분이 전사 출발 위치에 상응하는 캡 위치에서 캡 구조의 첨가하도록 핵에서 개질되고 폴리 A의 첨가에 의해 3'-인접한 다운스크림 영역에 위치한 폴리A 신호에까지 미친다. 다음으로, 인트론 구조는 코딩 영역로부터 제거되고 엑손 부분은 상응하는 단백질의 1차 아미노산 서열에 상응하는 서열의 개방형 해독 구조를 산출하여 합해진다. 성숙한 mRNA가 발생하는 이 개질은 안정한 유전자 발현을 위해 필수적이다. 일반적인 용어 cDNA는 이 성숙한 mRNA 서열로부터 역전사되는 DNA 서열에 상응한다. 주형으로서 성숙한 mRNA를 사용하여 바이러스 종으로부터 유래하는 역전사효소에 의해 실험적으로 합성할 수 있다.
진핵생물로부터 유래하는 유전자를 발현하기 위해 cDNA가 이. 콜라이(E. coli)에 대한 발현 벡터내로 클로닝되는 과정을 종종 사용한다. 이는 인트론 구조의 특이성이 유기체에서 다양하고 다른 종으로부터 인트론 서열을 인식할 수 없는 사실에서 기인한다. 사실, 원핵생물은 그 자체의 유전적 배경에 인트론 구조를 가지지 않는다. 효모조차도, 유전적 배경이 사카로마이세스 세레비지애(Saccharomyces cerevisiae)가 속하는 아스코마이세테스(Ascomycetes) 및 파피아 로도지마가 속하는 바시디오마이세테스(Basidiomycetes), 예를 들어 파피아 로도지마로부터 액틴 유전자의 인트론 구조는 아스코마이세테스 효모, 사카로마이세스 세레비지애에 의해 인식되거나 스프라이싱될 수 없다.
일종의 유전자의 인트론 구조는 이들의 유전자의 발현을 조절하는데 관련되는 것으로 나타난다. 인트론 구조가 이들 자체의 유전자 발현의 이러한 조절에 관련된 목적의 유전자의 자가-클로닝의 경우에 그의 인트론을 갖는 게놈 단편을 사용하는 것이 중요할 수 있다.
균주 향상 연구에 대해서 유전자 조작 방법을 적용하기 위해서, 사건, 예컨대 전사 및 번역에서 유전적 기전을 연구하는데 필수적이다. 유전적 서열, 예컨대 UAS, 프로모터, 인트론 구조 및 종결인자를 결정하고 유전적 기전을 연구하는데 중요하다.
본 발명에 따라서, 파피아 로도지마로부터 그의 5'- 및 3'-인접한 영역 뿐만 아니라 그의 인트론 구조를 포함하는 에세틸-CoA 카복실레이즈(ACC) 유전자를 코딩하는 유전자를 결정하였다.
추가로 본 발명은 유전적 코드의 축퇴성 때문에 서열 번호 2에서 제시된 뉴클레오타이드 서열( 및 그의 부분)에 의해 코딩된 하나로부터 상이하고 서열 번호 2에서 제시된 뉴클레오타이드 서열에 의해 코딩된 아세틸-CoA 카복실화효소를 코딩하는 폴리뉴클레오타이드를 포함한다. 추가로 본 발명의 폴리뉴클레오타이드는 서열 번호 3에 제시된 아미노산 서열을 갖는 단백질을 코딩하는 뉴클레오타이드 서열을 갖는다. 추가의 양태에서, 본 발명의 폴리뉴클레오타디드는 서열 번호 3의 아미노산 서열에 제시된 아미노산 서열을 갖는 단백질을 코딩하는 뉴클레오타이드 서열을 갖는다. 추가의 양태에서, 본 발명의 폴리뉴클레오타이드는 서열 번호 3의 아미노산 서열에 실질적으로 상동성이 있는 파피아 로도지마의 총 길이를 코딩하고 있다.
추가로, 아미노산 서열내에 변화를 초래하는 DNA 서열 다형성(polymorphism)이 개체군(예를 들어, 파피아 로도지마 개체군)내에 존재할 수 있음을 당업자가 숙지하고 있다. 아세틸-CoA 카복실화효소내에 이러한 유전적 다형성은 자연적 변이 때문에 개체군내에서 개별적으로 존재할 수 있다.
본원에서 사용된 바와 같이 용어 "유전자" 및 "재조합 유전자"는 아세틸-CoA 카복실화효소, 바람직하게는 파피아 로도지마로부터 아세틸-CoA 카복실화효소의 개방형 해독 구조를 포함하는 핵산 분자를 지칭한다.
이러한 자연적 변이는 전형적으로 아세틸-CoA 카복실화효소 유전자의 뉴클레오타이드 서열내에서 1 내지 5% 변이를 초래한다. 자연적 변이를 초래하고 아세틸-CoA 카복실화효소의 기능적인 활성을 변화되지 않는 아세틸-CoA 카복실화효소에서 임의의 및 모든 이러한 뉴클레오타이드 변이 및 생성된 아미노산 다형성은 본 발명의 범위내에서 시도된다.
본 발명의 아세틸-CoA 카복실화효소 cDNA의 자연적인 변이체 및 비-파피아 로도지마 상동물에 상응하는 폴리뉴클레오타이드를 본 발명의 폴리뉴클레오타이드를 사용하는 본원에서 개질된 파피아 로도지마 아세틸-CoA 카복실화효소 폴리뉴클레오타이드에 이들의 상동성 또는 엄중한 하이브리드화 조건하에서 표준 하이브리드화 기법에 따른 하이브리드화 탐침으로서 이의 부분에 의해 단리할 수 있다. 따라서, 또다른 양태에서 본 발명의 폴리뉴클레오타이드는 길이가 15개 이상의 뉴클레오타이드이다. 바람직하게 본 발명의 폴리뉴클레오타이드의 뉴클레오타이드 서열, 예를 들어 서열 번호 2를 포함하는 핵산 분자와 엄중한 조건하에서 하이브리드화된다. 다른 양태에서, 핵산은 20개, 30개, 50개, 100개, 250개 이상의 뉴클레오타이드 길이이다. 용어 "엄중한 조건하에서 하이브리드화"은 상기에서 정의되고 전형적으로 서로 60% 이상 동일한 뉴클레오타이드 서열이 서로 하이브리드화를 유지하는 하에서 하이브리드화하고 세척하기 위한 조건을 의미한다. 바람직하게는, 전형적으로 약 65% 또는 70% 이상, 보다 바람직하게는 75% 또는 80% 이상, 훨씬 더욱 바람직하게는 약 85%, 90% 또는 95% 이상 서로 동일한 서열이 서로 하이브리드화를 유지하는 이러한 조건이다. 바람직하게는, 엄중한 조건하에서 서열 번호 2와 하이브리드화되는 본 발명의 폴리뉴클레오타이드는 천연 핵산 분자에 상응한다.
본 발명에서, 폴리뉴클레오타이드 서열은 서열 번호 2에 특이적인 결합과 충분히 동일한 엄중한 조건하에서 서열 번호 2와 하이브리드화되는 폴리뉴클레오타이드 서열을 갖는 서열 번호 2 및 이의 단편을 포함한다. 예를 들어, 하기 하이브리드화 및 세척 조건의 임의의 조합이 요구되는 특정 결합을 달성하는데 사용될 수 있다.
높게 엄중한 하이브리드화: 6 X SSC, 0.5% SDS, 100㎍/㎖ 변성된 연어 정자 DNA, 50% 포름아미드를 가볍게 교반하면서 42℃에서 밤새도록 배양한다.
높게 엄중한 세척: 1을 2 X SSC, 0.5% SDS를 실온에서 15분동한 세척한 후 0.1 X SSC, 0.5% SDS중에서 실온에서 15분동안 세척한다.
낮게 엄중한 하이브리드화: 6 X SSC, 0.5% SDS, 100㎍/㎖ 변성된 연어 정자 DNA, 50% 포름아미드를 가볍게 교반하면서 37℃에서 밤새도록 배양한다.
낮게 엄중한 세척: 1을 0.1 X SSC, 0.5% SDS중에 실온에서 15분동안 세척한다.
보통의 엄중한 조건은 하이브리드화 반응이 발생하는 다양한 온도 및/또는 상기에서 설정된 세척 조건에서 수득할 수 있다. 본 발명에서, 파피아 로도지마로부터 아세틸-CoA 카복실화효소 유전자에 대한 안티센스 활성을 정의하는 높게 엄중한 하이브리드화 및 세척 조건을 사용하는 것이 바람직하다.
용어 "상동성"은 각각 핵산 분자 또는 코딩된 단백질이 기능적으로 및/또는 구조적으로 동등함을 의미한다. 상기에 기술된 핵산 분자와 상동성이고 상기 핵산 분자에서 유도된 핵산 분자는 예를 들어 동일한 생물학적 기능을 갖는 개질을 나타내고 특히 동일하거나 또는 실질적으로 동일한 생물학적 기능을 갖는 단백질을 코딩하는 상기 핵산 분자의 변이이다. 이들은 자연적으로 발생하는 변이, 예컨대 다른 식물 변이체 또는 종 또는 돌연변이일 수 있다. 이들 돌연변이는 자연적으로 발생할 수 있거나 또는 돌연변이화 기법에 의해 수득할 수 있다. 대립 변이는 자연적으로 대립 변이체뿐만 아니라 합성적으로 제조되거나 또는 유전자 조작된 변이체일 수 있다. 예를 들어 상기 폴리펩타이드가 항체에 결합을 시험함에 의해 구조적인 동등물을 동정할 수 있다. 구조적 동등물은 유사한 면역적 특성을 가지고, 예를 들어 유사한 에피토프를 포함한다.
본원에서 사용된 바와 같이, "천연" 핵산 분자는 자연적으로 발생하는(예를 들어, 자연적인 단백질을 코딩한다) 뉴클레오타이드 서열을 갖는 RNA 또는 DNA 분자를 지칭한다. 바람직하게는, 폴리뉴클레오타이드는 야생형 파피아 로도지마 아세틸-CoA 카복실화효소를 코딩한다.
또한, 개체군내에 존재할 수 있는 아세틸-CoA 카복실화효소 서열의 자연적으로-발생한 변이체는 개체군내에 존재할 수 있고 당업자는 또한 아세틸-CoA 카복실화효소를 코딩하는 폴리뉴클레오타이드의 뉴클레오타이드 서열내로 돌연변이를 도입할 수 있고, 따라서 아세틸-CoA 카복실화효소의 기능적 능력을 변화시키지 않고 코딩된 아세틸-CoA 카복실화효소의 아미노산 서열에서 변화를 초래할 수 있다. 예를 들어, "비필수" 아미노산 잔기에서 아미노산 치환을 초래하는 뉴클레오타이드 치환은 아세틸-CoA 카복실화효소를 코딩하는 폴리뉴클레오타이드의 서열, 예를 들어 서열 번호 2에서 제조될 수 있다. "비필수" 아미노산 잔기는 상기 아세틸-CoA 카복실화효소의 활성의 변화 없이 아세틸-CoA 카복실화효소중 하나의 야생형 서열로부터 변화될 수 있는 잔기이고, 반면에 "필수" 아미노산 잔기는 아세틸-CoA 카복실화효소 활성을 요구한다. 그러나, 다른 아미노산 잔기(예를 들어, 아세틸-CoA 카복실화효소 활성을 갖는 도메인내에 보존적이지 않거나 또는 반-보존적이다)는 활성에 필수적이지 않을 수 있고 따라서 아세틸-CoA 카복실화효소 활성을 변화시키지 않고 변화에 따르는 쉽다.
따라서, 본 발명은 아세틸-CoA 카복실화효소 활성에 필수적이지 않은 아미노산 잔기에서 변화를 갖는 아세틸-CoA 카복실화효소를 코딩하는 폴리뉴클레오타이드에 관한 것이다. 이러한 아세틸-CoA 카복실화효소는 서열 번호 3이 갖는 서열과 아미노산 서열이 상이하지만 본원에서 기술된 아세틸-CoA 카복실화효소 활성을 유지한다. 폴리뉴클레오타이드는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하고 있고, 이때 폴리펩타이드는 서열 번호 3의 아미노산 서열에 약 60% 이상 동일한 아미노산 서열을 포함하고 아세틸-CoA 카복실화효소 활성을 갖는다. 바람직하게는, 핵산 분자에 의해 코딩된 단백질은 서열 번호 3에 서열에 약 60% 내지 65% 이상, 더욱 바람직하게는 약 60% 내지 70% 이상, 훨씬 더욱 바람직하게는 약 70% 내지 80%, 80% 내지 90%, 90% 내지 95% 이상, 가장 바람직하게는 약 96%, 97%, 98% 또는 99% 동일하다.
두 개의 아미노산 서열(예를 들어, 서열 번호 3의 서열 및 이의 돌연변이 유형중 하나) 또는 두 개의 핵산의 %상동성을 결정하기 위해서 최적의 비교 목적에 대해 정렬시킨다(예를 들어 간격을 다른 단백질 또는 핵산과 최적의 정렬을 위해 하나의 단백질 또는 핵산의 서열내에 도입할 수 있다). 그 후 상응하는 아미노산 위치 또는 핵산 위치에서 아미노산 잔기 또는 뉴클레오타이드를 비교한다. 하나의 서열(예를 들어 서열 번호 2 또는 3의 서열중 하나)내에 위치가 다른 서열(예를 들어, 선택된 서열의 돌연변이 형태)내에 상응하는 위치로서 동일한 아미노산 잔기 또는 뉴클레오타이드로 채워질 때, 분자는 그 위치(즉, 본원에서 사용되는 바와 같은 아미노산 또는 핵산 "상동성"이 아미노산 또는 핵산 "동일성"과 동등하다)에 상동성이다. 두 서열 사이에 %상동성은 서열에 의해 공유된 동일한 위치의 수의 함수이다(즉, %상동성= 동일한 위치의 수/위치의 총 수 x 100). 상동성을 블라스트(Blast) 2.0과 같은 컴퓨터 프로그램으로 결정할 수 있다(문헌[Altschul, Nuc. Acid. Res., 25:3389-3402(1997)]. 본 발명에서, GENETYX-SV/RC 소프트웨어(소프트웨어 디벨롭먼트 캄파니 리미티드(Software Development Co., Ltd.), 일본 도쿄)가 이러한 상동성 분석 소프트웨어로서 그의 디폴트 알고리즘을 사용한다. 이 소프트웨어는 그의 분석적 알고리즘을 위해서 립맨-피어슨(Lipman-Pearson) 방법을 사용한다.
아세틸-CoA 카복실화효소를 코딩하는 핵산에 상동성인 단백질과 서열 번호 3의 아미노산 서열과 단백질이 상동성인 본 발명의 폴리뉴클레오타이드내에 하나 이상의 뉴클레오타이드 치환, 첨가 또는 제거하여 만들 수 있고, 특히 서열 번호 2의 뉴클레오타이드 서열내로 하나 이상의 아미노산 치환, 첨가 또는 제거는 코딩된 단백질내로 도입된다. 돌연변이는 표준 기법, 예컨대 위치-특이적 돌연변이화 및 PCR-매개 돌연변이화에 의해 예를 들어 서열 번호 2의 서열내로 도입할 수 있다. 바람직하게는, 보존적인 아미노산 치환이 하나 이상의 예상된 비필수 아미노산 잔기에서 만들어진다. "보존적인 아미노산 치환"은 아미노산 잔기를 유사한 측쇄를 갖는 아미노산 잔기로 치환하는 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 가계는 당해분야에서 정의되었다. 이들 가계는 염기성 측쇄(예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄(예를 들어, 아스파르트산, 글루탐산), 비전하 극성 측쇄(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄(예를 들어, 알라닌, 발린, 류신, 아이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지된 측쇄(예를 들어, 트레오닌, 발린, 아이소류신) 및 방향족 측쇄(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)의 아미노산을 포함한다. 따라서, 아세틸-CoA 카복실화효소에서 예상된 비필수 아미노산 잔기는 바람직하게 동일한 가계로부터 또다른 아미노산 잔기로 치환된다. 다르게는, 또다른 양태에서, 돌연변이는 아세틸-CoA 카복실화효소 코딩 서열의 전체 또는 부분, 예컨대 포화 돌연변이화에 의해 무작위로 도입될 수 있고 생성된 돌연변이는 본원에서 기술된 아세틸-CoA 카복실화효소 활성을 스크리닝하여 아세틸-CoA 카복실화효소 활성을 유지하는 돌연변이를 동정할 수 있다. 서열 번호 2의 서열중 하나의 돌연변이화에 따라서, 코딩된 단백질을 재조합으로 발현할 수 있고 단백질의 활성은 예를 들어 본원에서 기술된 분석을 사용하여 결정할 수 있다.
본 발명의 폴리뉴클레오타이드, 예를 들어 서열 번호 2의 뉴클레오타이드 서열을 갖는 핵산 또는 이의 부분을 표준 분자 생물학 기법 및 본원에서 제시된 서열 정보를 사용하여 단리할 수 있다. 예를 들어, 아세틸-CoA 카복실화효소 cDNA를 하이브리드화 탐침 및 표준 하이브리드화 기법으로서 본 발명의 폴리뉴클레오타이드의 서열중 하나의 전체 또는 부분을 사용하여 라이브러리로부터 단리할 수 있다. 게다가, 본 발명의 폴리뉴클레오타이드의 서열중 하나의 전체 또는 부분을 포함하는 폴리뉴클레오타이드를 이 서열(예를 들어, 본 발명의 폴리뉴클레오타이드의 서열의 하나의 전체 또는 부분을 포함하는 핵산 분자가 본 발명의 폴리뉴클레오타이드의 이 동일한 서열을 기준으로 고안된 예를 들어 서열 번호 4, 5 또는 6의 올리고뉴클레오타이드 프라이머를 사용하여 중합 연쇄 반응으로 단리할 수 있다)을 기준으로 고안된 올리고뉴클레오타이드 탐침을 사용하여 중합 연쇄 반응으로 단리할 수 있다. 예를 들어, mRNA는 세포로부터 단리되고, 예를 들어 파피아(예를 들어, 치르그윈(Chirgwin) 등의 구아니디늄-싸이오시아네이트 추출 과정)로부터 단리하고 cDNA는 역전사효소를 사용하여 제조할 수 있다(예를 들어, 몰로니 MLV 역전사효소 또는 AMV 역전사효소가 프로메가(Promega)(미국 메디슨)로부터 시판된다). 연쇄 중합 반응 증폭을 위한 합성된 올리고뉴클레오타이드 프라이머는 서열 번호 2에서 제시된 뉴클레오타이드 서열중 하나를 기준으로 고안할 수 있다. 본 발명의 폴리뉴클레오타이드는 cDNA 또는 다르게는 게놈 DNA를 표준 PCR 증폭 기법에 따라서 주형 및 적당한 올리고뉴클레오타이드 프라이머로서 사용하여 증폭할 수 있다. 그렇게 증폭된 폴리뉴클레오타이드는 적당한 벡터내에 클로닝되고 DNA 서열 분석에 의해 규명된다. 게다가, 표준 합성 기법에 의해, 예를 들어 자동화된 DNA 합성기를 사용하여 아세틸-CoA 카복실화효소 뉴클레오타이드 서열에 상응하는 올리고뉴클레오타이드를 제조할 수 있다.
용어 "단편", "서열의 단편" 또는 "서열의 부분"은 지칭된 본래의 서열의 절단된 서열을 의미한다. 절단된 서열(핵산 또는 단백질 서열)은 길이가 널리 다양하고; 최소의 크기가 지칭된 본래의 서열의 최소한의 비교가능한 기능 및/또는 활성을 갖는 서열을 제공하기 충분한 크기의 서열이고, 반면에 최대 크기는 중요하지 않다. 일부의 적용에서, 최대 크기는 통상적으로 요구되는 것보다 실질적으로 크지 않고 본래의 서열의 목적 활성 및/또는 기능을 제공한다.
전형적으로 절단된 아미노산 서열은 약 5개 내지 약 60개 아미노산 길이의 범위이다. 그러나, 더욱 전형적으로 서열은 약 50개 아미노산이 최대이고 바람직하게는 약 30개 아미노산이 최대이다. 이는 통상적으로 약 10개, 12개 또는 15개 이상의 아미노산, 최대 약 20개 또는 25개 이하의 아미노산 서열을 선택하는 것이 바람직하다.
용어 "에피토프"는 항원성 결정자로서 공지된 항원내에 특이적인 면역활성 위치에 관한 것이다. 이들 에피토프는 중합체 조성물내에-예컨대 단백질내에 아미노산- 단량체의 선형의 배열이거나 보다 복잡한 이차 또는 삼차 구조로 구성되거나 포함할 수 있다. 당업자는 모든 면역원이 항원임을 인식하지만(즉, 면역 반응을 유도할 수 있는 물질), 일부 항원, 예컨대 헵텐은 면역원이 아니고 담체 분자와 커플링하여 면역원성을 제조할 수 있다. 용어 "항원"은 항체가 발생 및 /또는 항체가 특이적으로 면역활성적인 물질을 참조하여 포함한다.
용어 "하나 이상의 아미노산"은 하나 이상의 아미노산에 관한 것이지만 60% 동일성 나의 상동성을 초래하는 아미노산의 수 이상은 아니다. 바람직하게, 동일성이 70% 또는 80%, 더욱 바람직하게는 85%, 90% 또는 95%, 훨씬 더욱 바람직하게는 96%, 97%, 98% 또는 99%이다.
용어 "아세틸-CoA 카복실화효소" 또는 "아세틸-CoA 카복실화효소 활성"은 다음에 기술된 폴리펩타이드의 효소 활성에 관한 것으로 효소 분석 방법을 결정할 수 있다. 게다가, 본원에 분석에서 불활성이지만 아세틸-CoA 카복실화효소에 특이적으로 결합하는 항체에 의해 인지되는 즉, 하나 이상의 아세틸-CoA 카복실화효소 에피토프를 갖는 폴리펩타이드이지만 또한 용어 "아세틸-CoA 카복실화효소"를 포함한다. 이 경우에 활성은 이들의 면역학적 활성을 지칭한다.
용어 "폴리펩타이드" 및 "핵산 분자"는 또한 "단리된" 폴리뉴클레오타이드 또는 핵산 분자에 관한 것이다. "단리된" 핵산 분자는 핵산의 자연적인 원료내에 존재하는 다른 핵산 분자로부터 분리된 것이다. 바람직하게, "단리된" 핵산은 핵산이 유래하는 유기체의 게놈 DNA내에 자연적으로 핵산 측면에 위치하는 서열(즉, 핵산의 5' 및 3'에 위치하는 서열)에서 유리되었다.
예를 들어, 다양한 양태에서, PNO 폴리뉴클레오타이드는 핵산이 유래하는(예를 들어 파피아 세포)세포의 게놈 DNA내에 자연적으로 핵산 분자에 측면에 위치하는 뉴클레오타이드 서열의 약 5kb, 4kb, 3kb, 2kb, 1kb, 0.5kb 또는 0.1kb 미만을 함유할 수 있다. 게다가, 본 발명의 폴리뉴클레오타이드, 특히 "단리된" 핵산 분자, 예컨대 cDNA 분자는 재조합 기법 또는 화학적 과정 또는 다른 화학물질에 의해 제조될 때 또는 화학적으로 합성될 때 다른 세포성 물질 또는 배지에서 실질적으로 유리되었다.
바람직하게, 본 발명의 폴리펩타이드는 서열 번호 2에서 제시된 뉴클레오타이드 서열중 하나를 포함한다. 서열 번호 2의 서열은 본 발명의 파피아 로도지마 아세틸-CoA 카복실화효소 cDNA에 상응한다.
추가로, 본 발명의 폴리펩타이드는 상기 폴리뉴클레오타이드 또는 이의 부분의 뉴클레오타이드 서열중 하나에 상보적 핵산 분자를 포함한다. 서열 번호 2에 제시된 뉴클레오타이드 서열중 하나에 상보적 핵산 분자는 서열 번호 2에 제시된 뉴클레오타이드 서열중 하나에 충분히 상보적 것이고, 서열 번호 2에 제시된 뉴클레오타이드 서열중 하나와 하이브리드화하여 안정한 이중 나선을 형성한다.
본 발명의 폴리뉴클레오타이드는 약 60% 이상, 바람직하게는 약 65% 내지 70%, 더욱 바람직하게는 약 70% 내지 80%, 80% 내지 90% 또는 90% 내지 95%, 훨씬 더욱 바람직하게는 약 95%, 96%, 97%, 98%, 99% 이상 또는 서열 번호 2 또는 이의 부분에 제시된 뉴클레오타이드 서열에 더욱 상동성인 뉴클레오타이드 서열을 포함한다. 본 발명의 폴리뉴클레오타이드는 하이브리드화되는 뉴클레오타이드 서열을 포함하고, 예를 들어 서열 번호 2 또는 이의 부분에 제시된 뉴클레오타이드 서열중 하나와 본원에서 정의된 바와 같이 엄중한 조건하에서 하이브리드화된다.
게다가, 본 발명의 폴리뉴클레오타이드는 서열 번호 2내에 서열중 하나의 코딩 영역의 부분만을, 예를 들어 아세틸-CoA 카복실화효소의 생물학적으로 활성 부부분을 코딩하는 단편만을 포함할 수 있다. 파피아 로도지마로부터 아세틸-CoA 카복실화효소 유전자의 클로닝으로부터 결정된 뉴클레오타이드 서열은 다른 세포 유형 및 유기체내에 아세틸-CoA 카복실화효소 상동물을 동정 및/또는 클로닝하는데 사용하기 위해 고안된 탐침 및 프라이머를 발생하게한다. 전형적으로, 탐침/프라이머는 실질적으로 정제된 올리고뉴클레오타이드를 포함한다. 전형적으로, 올리고뉴클레오타이드는 엄중한 조건하에서 약 12개, 15개, 바람직하게는 약 20개 또는 25개, 더욱 바람직하게는 약 40개, 50개 또는 75개 이상의 서열중 예를 들어 서열 번호 2에서 설명한 하나의 센스 가닥, 예를 들어 서열 번호 2에서 설명한 서열중 하나의 안티-센스 서열 또는 자연적으로 발생하는 이의 돌연변이의 연속적인 뉴클레오타이드와 엄중한 조건하에서 하이브리드화되는 뉴클레오타이드의 영역을 포함한다. 본 발명의 뉴클레오타이드를 기준으로 하는 프라이머는 PCR을 사용하여 아세틸-CoA 카복실화효소 상동물을 클로닝한다. 아세틸-CoA 카복실화효소 뉴클레오타이드 서열을 기준으로 하는 탐침은 동일하거나 상동성인 단백질을 코딩하는 전사체 또는 게놈 서열을 검출하는데 사용될 수 있다. 탐침은 추가로 그에 결합된 표지된 기를 포함하고, 예를 들어 표지된 기는 방사선 동위 원소, 형광 화합물, 효소 또는 효소 보조인자일 수 있다. 이러한 탐침은 아세틸-CoA 카복실화효소를 발현하는 세포를 동정하기 위한 게놈 표지 시험 키트의 부분으로서 사용될 수 있고, 예컨대 세포의 시료내에 아세틸-CoA 카복실화효소-코딩 핵산 분자의 수준을 측정하여, 예를 들어 아세틸-CoA 카복실화효소 mRNA 수준을 검출하거나 또는 게놈 아세틸-CoA 카복실화효소 유전자가 돌연변이되거나 또는 결실된 것을 결정할 수 있다.
본 발명의 폴리뉴클레오타이드는 서열 번호 3의 아미노산 서열에 충분히 상동성인 아미노산 서열을 함유하는 폴리펩타이드 또는 이의 부분을 코딩하고 이의 단백질 또는 부분은 아세틸-CoA 카복실화효소, 특히 미생물 또는 식물내에 실시예에서 기술된 바와 같은 아세틸-CoA 카복실화효소 활성을 유지한다. 본원에서 사용된 바와 같이, 용어 "충분하게 상동성인"은 동일하거나 또는 동등한 최소의 수를 포함하는 아미노산 서열을 갖는 이의 단백질 또는 부분을 지칭한다(예를 들어 이의 단백질 또는 부분이 아세틸-CoA 카복실화효소 활성을 갖는 이러한 서열 번호 3의 아미노산 서열에 본 발명의 아미노산 잔기의 폴리펩타이드의 서열중 하나에서 아미노산 잔기로서 유사한 측쇄를 갖는 아미노산 잔기).
단백질은 서열 번호 3의 전체적인 아미노산 서열과 약 60% 내지 65% 이상, 바람직하게는 66% 내지 70% 이상, 더욱 바람직하게는 약 70% 내지 80%, 80% 내지 90%, 90% 내지 95% 이상, 가장 바람직하게는 약 96%, 97%, 98%, 99% 이상 상동성이 있다.
본 발명의 아세틸-CoA 카복실화효소 폴리뉴클레오타이드에 의해 코딩된 단백질의 부분은 바람직하게 아세틸-CoA 카복실화효소중 하나의 생물학적으로 활성 부분이다.
상기에서 언급된 바와 같이, 용어 "아세틸-CoA 카복실화효소의 생물학적인 활성 부분"은 예를 들어 아세틸-CoA 카복실화효소 활성을 갖고 아세틸-CoA 카복실화효소에 특이적으로 결합하는 항체와 결합하는 이러한 면역학적 활성을 갖는 도메인/모티프 부분을 포함한다. 아세틸-CoA 카복실화효소 또는 이의 생물학적 활성 부분이 효소 활성의 대사 분석에 참여할 수 있는지를 결정하는 것이 수행될 수 있다. 이러한 분석 방법은 당업자에게 잘 공지되고, 실시예에서 상술하고 있다. 아세틸-CoA 카복실화효소의 생물학적 활성 부분을 서열 번호 2에서 서열중 하나의 부분을 단리하는 단계, 코딩하는 추가의 핵산 단편은 아세틸-CoA 카복실화효소 또는 펩타이드의 코딩 부분를 발현하는 단계(예를 들어 시험관내에서 재조합 발현에 의해서) 및 아세틸-CoA 카복실화효소 또는 펩타이드의 코딩 부분의 활성을 평가하는 단계로 제조할 수 있다.
먼저, 부분적인 유전자 단편을 축퇴성 PCR 방법을 사용하여 ACC 유전자의 부분을 포함하여 클로닝하였다. 상기 축퇴성 PCR은 동일하거나 또는 유사한 기능을 갖는 다른 종으로부터 공지된 효소에 아미노산 서열의 높은 상동성을 갖는 목적 유전자를 클로닝하는 방법이다. 축퇴성 PCR에서 프라이머로서 사용되는 축퇴성 프라이머를 상응하는 뉴클레오타이드("축퇴된")에서 아미노산 서열을 역전사하여 고안하였다. 이러한 축퇴성 프라이머에서, 임의의 A, C, G 또는 T 또는 애매한 코드에 이노신을 함유하는 프라이머로 구성된 혼합된 프라이머를 일반적으로 사용한다. 본 발명에서, 이러한 혼합된 프라이머를 상기 유전자를 클로닝하는 축퇴성 프라이머에 대해 사용하였다.
이의 인트론 뿐만 아니라 조절 영역, 예컨대 프로모터 또는 종결인자와 함께 그의 코딩 영역을 함유하는 전체적인 유전자는 탐침으로서 상기에서 기술된 바와 같은 축퇴성 PCR에 의해 수득된 부분적 DNA 단편을 방사선 표지한 후 사용하여, 적당한 숙주내에 파지 벡터 또는 플라스미드 벡터내에 구축된 게놈 라이브러리의 스크리닝에 의해 염색체로부터 클로닝될 수 있다. 일반적으로, 숙주 균주로서 이. 콜라이, 파지 벡터, 예컨대 λ 파지 벡터 또는 플라스미드 벡터, 예컨대 pUC 벡터로 라이브러리를 구축 및 다음 유전자 조작, 예컨대 시퀀싱, 제한 효소 절단, 연결 등에서 종종 사용된다. 본 발명에서, 파피아 로도지마의 EcoRI 게놈 라이브러리는 λ벡터, λZAPII의 유도체에서 구축된다. 삽입물 크기, 삽입물에 어떤 길이가 클론되었는지 라이브러리의 구축 전에 유전자를 위한 서든 블랏 하이브리드화에 의해 결정하였다. 본 발명에서, 탐침으로 사용된 DNA는 통상적으로 32P 표지된 대신 스테로이드 헵텐인 디오시게닌(DIG)으로 공급자에 의해 제공된 프로토콜(보링거-만하임(Boehringer-Manheim), 독일 만하임)에 따라서 표지하였다. 파피아 로도지마의 염색체로부터 구축된 게놈 라이브러리는 탐침으로서 목적 유전자의 부분을 갖는 DIG-표지된 DNA 단편을 사용하여 스크리닝하였다. 하이브리드화된 플라크를 취해서 추가의 연구에 사용하였다. λZAPII(삽입물 크기가 9kb 미만이었다)을 게놈 라이브러리의 구조내에 사용할 때, 생체내 절단 프로토콜은 단일 사슬의 M13 파지, Ex 보조 파지(스트라타진(Stratagene), 미국 라욜라)의 유도체를 사용하여 플라스미드 벡터내로 클로닝하는 계속적인 단계를 위해 용이하게 사용하였다. 따라서 수득된 플라스미드 DNA를 서열을 조사하였다.
본 발명에서, 발명자는 Taq DNA 중합효소가 시퀀싱의 대부분의 경우에 사용되는 자동순환 시퀀싱 프로토콜을 사용하는 자동화된 형광 DNA 서열기, 알프레드(ALFred) 시스템(파마시아, 스웨덴 웁살라)를 사용하였다.
게놈 서열을 결정한 후, 코딩 영역의 서열을 상응하는 유전자의 cDNA의 클로닝을 위해서 사용하였다. PCR 방법을 또한 cDNA 단편을 클로닝하는데 이용하였다. 개방형 해독 구조(ORF)의 5' 내지 3' 말단에서 서열을 동정하는 PCR 프라이머를 적당한 제한 효소 자리를 첨가하여 합성하고 이들 PCR 프라이머를 사용하여 PCR을 수행하였다. 본 발명에서, cDNA 풀을 cDNA의 PCR 클로닝에 주형으로 사용하였다. 상기 cDNA 풀은 주형으로서 파피아 로도지마로부터 수득된 mRNA를 사용하여 바이러스 역전사효소 및 Taq 중합효소(클론테크(Clontech)로부터 제조된 캡파인더 키트, 미국 팔로 알토)로 시험관내에서 합성하였다. 따라서 수득된 목적 cDNA는 그 서열을 확인하였다. 게다가, 따라서 수득된 cDNA를 강력한 프로머터 활성, 예컨대 lac 또는 T7 발현 시스템하에 이. 콜라이에서 기능을 하는 발현 벡터내로 cDNA 단편의 클로닝한 후 이 효소 활성을 확인하기 위해서 사용하였다.
또다른 양태에서, 본 발명은 벡터내로 본 발명의 폴리뉴클레오타이드를 삽입하는 단계를 포함하는 재조합 벡터의 제조방법에 관한 것이다.
또한, 본 발명은 본 발명의 폴리뉴클레오타이드를 함유하거나 본 발명의 상기 방법에 의해 제조된 재조합 벡터에 관한 것이다.
본원에서 사용된 바와 같이, 용어 "벡터"는 그것이 연결된 폴리펩타이드를 전달할 수 있는 핵산 분자를 지칭한다. 벡터의 하나의 유형은 "플라스미드"이고, 이때 추가의 DNA 단편이 바이러스 게놈내로 연결될 수 있다. 특정 벡터는 이들이 도입되는(예를 들어, 복제의 세균성 기원을 갖는 세균성 벡터 및 에피좀성 포유류성 벡터) 숙주 세포내에서 자동적으로 복제할 수 있다. 다른 벡터(예를 들어, 비-에피좀성 포유류 벡터)는 숙주 세포내로 도입시 숙주세포의 게놈내로 융합되고, 따라서 숙주 게놈과 함께 복제된다. 또한, 특정 벡터는 이들이 효과적으로 연결된 유전의 발현하게 할 수 있다. 이러한 벡터는 본원에서 "발현 벡터"로서 지칭된다. 일반적으로, 재조합 DNA 기법에서 이용성의 발현 벡터는 종종 플라스미드의 형태이다. 본원에서, "플라스미드" 및 "벡터"는 교환적으로 사용될 수 있고, 플라스미드가 벡터의 형태로 가장 일반적으로 사용된다. 그러나, 본 발명은 발현 벡터의 이러한 다른 형태, 예컨대 바이러스 벡터(예를 들어, 복제 결손된 레트로바이러스, 아데노바이러스 및 아데노-수반 바이러스)를 포함하고자하고, 동등한 기능을 제공한다.
본 발명은 또한 본 발명에 따른 핵산 분자를 포함하는 코스미드, 바이러스, 박테리오파지 및 다른 유전자 조작에서 통상적으로 사용되는 다른 벡터에 관한 것이다. 당업자에게 잘 공지된 방법을 다양한 플라스미드 및 벡터를 구축하는데 사용할 수 있다. 다르게는, 본 발명의 핵산 분자 및 벡터는 표적 세포내로 전달하기 위해서 리포좀내로 재구성될 수 있다.
본 발명은 추가로 본 발명의 폴리뉴클레오타이드가 원핵 숙주 세포 또는 진핵 숙주 세포내에서 발현하게하는 발현 조절 서열과 효과적으로 연결된 벡터에 관한 것이다. 이러한 조절 서열의 특성은 숙주 유기체에 따라서 상이하다. 원핵생물에서, 조절 서열은 일반적으로 프로모터, 종결인자 및 일부의 경우에 증폭제, 트란스활성자 또는 전사 인자를 포함한다.
용어 "조절 서열"은 발현을 위해 필수적으로 존재하는 최소의 성분을 포함하고자하고 또한 추가의 유리한 성분을 포함할 수 있다.
용어 "실시가능하게 연결된"은 인접한 위치를 지칭하고, 이때 그렇게 기술된 성분은 이들을 의도된 방식에서 기능하도록 허용하는 관계이다. 조절 서열이 코딩 서열에 "실시가능하게 연결된" 것은 코딩 서열의 발현이 조절 서열과 비교가능한 조건 하에서 달성되는 이러한 방식으로 연결된다. 이 경우에 조절 서열은 프로모터이고, 이중 나선의 핵산을 사용하는 것이 당업자에게 명백하다.
조절 서열은 숙주 세포의 많은 유형에서 뉴클레오타이드 서열의 구성적 발현 및 특정한 숙주 세포 또는 특정한 조건에서만 뉴클레오타이드 서열의 발현을 포함한다. 발현 벡터의 고안은 형질전화되는 숙주 세포의 선택, 목적 단백질의 발현 수준 등과 같은 요소에 의존할 수 있음을 당업자들은 평가하고 있다. 본 발명의 발현 벡터를 숙주 세포내로 도입함에 의해서 본원에서 기술된 바와 같이 폴리뉴클레오타이드에 의해 코딩된 융합 단백질 또는 펩타이드를 포함하는 단백질 또는 펩타이드를 제조할 수 있다.
본 발명의 재조합 발현 벡터는 원핵 세포 또는 진핵 세포내에 아세틸-CoA 카복실화효소의 발현하기 위해서 고안하였다. 예를 들어 본 발명의 폴리뉴클레오타이드를 코딩하는 유전자를 세균 세포, 예컨대 이. 콜라이, 곤충 세포(바큘로바이러스 발현 벡터를 사용함), 효모 및 다른 균류 세포, 조류, 다음 유형의 섬모충: 홀로트라키아, 페리트리키아, 포토마쿠스, 슈도코닐렘부스, 에우프로테스, 엔겔마니엘라 및 시틸로니키아, 특히 제 WO9801572 호에 기술된 바와 같은 형질전환 방법에 따른 벡터와 함께 시틀로니키아 렘내(Stylonychia lemnae) 및 다세포성 식물 세포에서 발현시킬 수 있다. 다르게는, 재조합 발현 벡터가 시험관내에서 전사 및 발현될 수 있고, 예를 들어 T7 프로모터 조절 서열 및 T7 중합효소를 사용한다.
원핵생물에서 단백질 발현은 융합 또는 비융합 단백질의 발현하게하는 구성적 또는 유도성 프로모터를 포함하는 벡터와 함께 대부분 수행된다. 융합 벡터는 많은 아미노산을 거기에 코딩된 단백질에, 통상적으로는 C 말단 또는 단백질내에 적당한 영역내에 용융을 제외하고 재조합 단백질의 아미노 말단에 첨가한다. 이러한 융합 벡터는 전형적으로 3가지 목적을 제공한다:
(1) 재조합 단백질의 발현을 증가시키고;
(2) 재조합 단백질의 용해성을 증가시키고;
(3) 흡착 정제에서 리간드로서 작용하여 재조합 단백질을 정제하는 것을 돕는다. 종종 융합 발현 벡터에서, 진핵 절단 위치를 융합 부분의 접합점에 도입하고 융합 부분으로부터 이후에 융합 단백질의 정제하여 재조합 단백질을 분리할 수 있다. 이러한 효소 및 이들의 동족의 인식 서열은 요소 Xa, 트롬빈 및 에테로카이네이즈를 포함한다.
전형적인 융합 발현 벡터는 pGEX(파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc.)), pMAL(뉴 잉글랜드 바이오랩(New England Biolab), 미국 비버리) 및 pRIT5(파마시아, 미국 피스카타웨이)를 포함하고 이는 글루타치온 S-트랜스퍼라제(GST), 말토스 E 결합 단백질 또는 단백질 A 각각을 표적 재조합 단백질에 융합한다. 하나의 양태에서, 본 발명의 폴리뉴클레오타이드에 의해 코딩된 폴리펩타이드의 코딩 서열은 pGEX 발현벡터내로 클로닝되어 N-말단으로부터 C-말단, GST-트롬빈 절단 자리-X 단백질을 포함하는 융합 단백질을 코딩하는 벡터를 제조한다. 융합 단백질은 글루타치온-아가로스 수지를 사용하여 흡착 크로마토그래피에 의해 정제할 수 있고, 예를 들어 트롬핀으로 융합 단백질을 절단하여 GST에 융합되지 않은 재조합 아세틸-CoA 카복실화효소를 회수할 수 있다.
적당한 유도성 비-융합 이. 콜라이 발현 벡터의 예로는 pTrc 및 pET 11d를 포함한다. pTrc 벡터로부터 표적 유전자 발현은 하이브리드 trp-lac 융합 프로모터로부터 숙주 RNA 중합효소 전사에 의존한다. pET 11d 벡터로부터 표적 유전자 발현은 함께 발현되는 바이러스 RNA 중합효소(T7 gnl)에 의해 매개되는 T7-gn10-lac 융합 프로모터로부터 전사에 의존한다. 이 바이러스 중합효소는 lacUV 5 프로모터의 전사 조절하에서 T7 gnl 유전자를 갖는 내재된 λ 프로파지로부터 숙주 균주 BL21(DE3) 또는 HMS174(DE3)에 의해 공급된다.
재조합 단백질 발현을 최대로하는 하나의 전략은 대조합 단백질을 가수분해 절단하는 능력이 손상된 숙주 세균에서 단백질을 발현하는 것이다. 다른 전략은 발현 벡터내로 삽입된 핵산의 서열을 변화시켜 각각의 아미노산에 대한 개별적인 코돈이 바람직하게발현을 위해서 선택된 세균(예컨대 이. 콜라이)에서 이용되는 것이다. 본 발명의 핵산 서열의 이러한 변화는 표준 DNA 합성 기법에 의해 수행될 수 있다.
추가로, 아세틸-CoA 벡터는 효모 발현 벡터일 수 있다. 효모 사카로마이세스 세레비지애내에 발현을 위한 멕터의 예로는 pYepSec1, pMFa, pJRY88 및 pYES2(인비트로젠(Invitrogen), 미국 산디에고)가 포함된다. 다른 균류, 예컨대 사상형 균류에서 사용되는 적당한 벡터의 구조를 위한 벡터 및 방법이 당업자에게 공지되어 있다.
다르게는, 본 발명의 폴리뉴클레오타이드를 바큘로바이러스 발현 벡터를 사용하여 곤충 세포내로 도입할 수 있다. 배양된 곤충 세포(예를 들어, Sf9 세포)내에서 단백질의 발현이 가능한 바큘로바이러스 벡터는 pAc 종류 및 pVL 종류를 포함한다.
다르게는, 본 발명의 폴리뉴클레오타이드를 포유류의 발현 벡터를 사용하여 포유류로 세포내에 도입한다. 포유류 발현 벡터의 예로는 pCDM8 및 pMT2PC가 포함된다. 포유류 세포내에 사용될 때, 발현 벡터의 대조구 기능은 종종 바이러스 조절 인자에 의해 제공된다. 예를 들어, 통상적으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 시토메갈로바이러스 및 시미언 바이러스 40으로부터 유도된다.
재조합 포유류 발현 벡터는 바람직하게 특정 세포 유형에서(예를 들어, 조직 특이적 조절 인자가 핵산을 발현하는데 사용된다) 핵산의 발현을 지시할 수 있다. 조직-특이적 조절 인자는 당업자에게 공지되어 있다. 조직-특이적인 프로모터의 비제한적 예로는 알부민 프로모터(간-특이적), 임파성-특이적 프로모터, 특히 T 세포 수용체의 프로모터 및 면역글로블린, 뉴론-특이적 프로모터(예를 들어, 뉴로필라멘트 프로머터), 췌장-특이적 프로모터 및 유방 선-특이적 프로모터(예를 들어, 우유 유장 프로모터; 미국 특허 제 4,873,316 호 및 유럽 특허 제 EP 264,166 호)가 포함된다. 발생학적으로 조절된 프로모터는 또한 예를 들어 뮤린 혹스 프로모터 및 태아단백질 프로모터를 포함한다.
따라서, 발현된 ACC 유전자는 그의 활성, 예를 들어 효소 분석 방법에 의해 입증될 수 있다. 다음은 아세틸-CoA 카복실화요소 활성의 결정을 위해 사용되는 방법중 하나이다: 20분동안 5분 간격에 역상 HPLC를 사용하여 아세틸-CoA의 감소 및/또는 말로닐-CoA의 제조를 측정하여 분석을 수행한다. 아세틸-CoA를 말로닐-CoA의 전화율은 20분동안 선형으로 관찰되고 속도는 시간당 말로닐-CoA 농도의 선형의 역행 분석으로 측정한다. 반응 혼합물은 50mM 트리스, pH 7.5, 6μM 아세틸-CoA, 2mM ATP, 7mM KHCO3, 8mM MgCl2, 1mM 다이싸이오트레이톨 및 1mg/㎖ 소 혈청 알부민을 포함한다. 효소를 소 혈청 알부민(2mg/㎖) 및 칼륨 시트레이트(10mM)과 예비배양한다(30분, 25℃). 반응을 예비배양된 효소 50㎕를 반응 혼합물로 옮겨 개시하고 5 내지 20분동안 25℃에서 배양한다. 반응을 50㎕ 10% 과염소산을 첨가하여 종결시킨다. 반응을 종결시킨 후, 시료를 원심분리(3분, 10,000 x g)하고 HPLC로 분석한다. 10mM KH2PO4, pH 6.7(용매 A)의 유동상 및 MeOH(용매 B)를 사용한다. 유속은 1.0㎖/분이고 구배는 다음과 같다: 100% 용매 A에서 1분동안 유지한 후 선형 구배로 30% 용매 B를 다음 5분동안 유지한 후 30% 용매 B에서 5분동안 유지한다. 이 방법을 사용하여 지연 시간은 각각 말로닐-CoA 및 아세틸-CoA에서 7.5 내지 9.0분이었다. 사카로마이세스 세레비지애에 대한 발현 벡터가 사용될 때, 상보성 분석은 그의 활성 확인에 대해 숙주 균주로서 사카로마이세스 세레비지애로부터 유래하는 조건적인 아세틸-CoA 카복실화효소 널(null) 돌연변이 균주를 사용하여 용이하게 개발될 수 있다.
효소 활성의 확인을 계속하기 위해서, 발현된 단백질을 정제하고 정제된 효소에 대한 항체를 발생시키기 위해 사용할 수 있다. 따라서, 제조된 항체는 균주 향상 연구에서 상응하는 효소의 발현, 배양 조건의 최적 연구 등을 규정하는데 사용될 수 있다.
추가의 양태에서, 본 발명은 본 발명의 폴리펩타이드 또는 부분, 즉 이러한 단백질의 특이적 단편 또는 에피토프에 특이적으로 결합하는 항체에 관한 것이다.
본 발명의 항체는 다른 아세틸-CoA 카복실화 효소 및 유전자를 동정하고 단리하는데 사용될 수 있다. 이들 항체는 단일클론성 항체, 다클론성 항체 또는 합성적 항체 뿐만 아니라 항체의 단편, 예컨대 Fab, Fv 또는 scFv 단편 등일 수 있다. 단일클론성 항체가 예를 들어 코러(Kohler) 및 밀스테인(Milstein)에 의해 처음 기술된 기법에 의해 제조될 수 있고, 면역된 포유류로부터 유래하는 비장 세포에 마우스 마이엘로마 세포의 융합을 포함한다.
게다가, 상기 펩타이드에 항체 또는 이의 단편을 당업자에게 공지된 방법을 사용하여 수득할 수 있다. 이들 항체는 예를 들어, 본 발명에 따른 단백질의 면역침강 및 면역위치(immunolocalization)뿐만 아니라 예를 들어 재조합 유기체내에서 이러한 단백질의 합성의 모니터링을 위해서 및 본 발명에 따른 단백질과 반응하는 화합물을 동정하기 위해서 사용될 수 있다. 예를 들어, 비아코어 시스템에서 사용되는 표면 플라스몬 공명은 파지 항체 선택의 효율을 증가시키고 본 발명의 단백질의 에피토프에 결합하는 파지 항체의 단일의 라이브러리로부터 활성의 높은 증가를 수득하는데 사용될 수 있다. 많은 경우에, 항체가 항원에 결합하는 현상은 다른 리간드/항-리간드 결합과 동등히다.
본 발명에서, 아세틸-CoA 카복실화효소에 대한 유전자 단편은 클로닝된 유전자 단편을 사용하는 유전적 방법에 의해 파피아 로도지마에서 그의 발현 수준을 감소시키는 목적으로 파피아 로도지마로부터 클로닝된다.
유전적 방법으로 유전자 발현을 감소시키기 위해서, 일부의 전략은 유전자-파괴 방법중 하나를 사용할 수 있다. 이 방법에서, 파괴될 목적 유전자의 부분적인 단편이 숙주 유기체에서 복제될 수 없는 융합 벡터상에 약제 내성 카세트와 결합된다. 독성의 항생제의 존재하에 숙주가 생존할 수 있게하는 효소를 코딩하는 약제 내성 유전자는 종종 선택가능한 표지로서 사용된다. pGB-Ph9내에 있는 G418 저항 유전자는(웨리(Wery) 등의 문헌[Gene, 184, 89-97, 1997]) 파피아 로도지마내에 기능을 하는 약제 저항성 유전자의 예이다. 영양 보충 표지는 또한 적당한 영양 요구체 표지를 갖는 숙주내에서 사용될 수 있다. 그의 성장을 위해 시티딘을 필요로하는 파피아 로도지마 ATCC24221 균주는 영양 요구체의 하나의 예이다. ATCC24221을 위한 공여체 DNA로서 CTP 합성효소를 사용하여, 영양 보충을 사용하는 숙주 벡터 시스템일 구축할 수 있다.
벡터상에 목적 유전자 단편과 숙주 유기체의 염색체상에 그의 상응하는 유전자 단편 사이에 숙주 유기체 및 재조합의 형질전환 후, 융합 벡터는 단일 교차 재조합에 의해 숙주 염색체내로 융합한다. 재조합의 결과로서, 약제 내성 카세트를 목적 유전자에 삽입하여 그의 번역된 생성물이 효소적 기능을 갖지 않는 절단된 형태로 유일하게 합성된다. 유사한 방식으로, 목적 유전자의 두 개의 부분이 또한 약제 내성 유전자가 융합 벡터상에 목적 유전자의 이러한 두 개의 단편 사이에 삽입되는 유전자 파괴 연구에서 사용된다. 이 유형의 벡터의 경우에, 융합 벡터상에 위치하는 유전자 단편과 숙주의 염색체상에 상응하는 유전자 단편 사이에 이중의 재조합 사건이 기대된다. 이 이중 교차 재조합의 빈도는 단일 교차 재조합보다 낮고, 이중 교차 재조합에 의한 목적 유전자의 널 표현형은 단일의 교차 재조합에 의해서 보다 더 안정하다.
반면, 이 전략은 그의 기능이 필수적이고 파괴가 숙주 유기체에 치명적인, 예컨대 아세틸-CoA 카복실화효소 유전자의 경우에 어렵다. 아세틸-CoA 카복실화효소의 기능은 지방산의 생합성에서 보다 다른 숙주 생존에 필수적이다. 이러한 관점에서, 이 유전자 파괴 방법에 의한 파피아 로도지마로부터 아세틸-CoA 카복실화효소를 구축하기 어렵다는 것을 의미한다.
이러한 경우에, 다른 전략은 아세틸-CoA 카복실화효소의 발현이 감소하는 돌연변이를 선별하는 통상적인 돌연변이유발 방법중 하나로 유전자 발현은 감소시키도록(파괴시키지 않음) 적용될 수 있다. 이 방법에서, 적당한 리포터 유전자가 숙주 유기체로부터 아세틸-CoA 카복실화효소 유전자의 프로모터 영역과 융합하는 적당한 재조합체는 돌연변이화되고 리포터 유전자 생성물의 보다 약한 활성을 나타내는 돌연변이가 스크리닝될 수 있다. 이러한 돌연변이체에서, 아세틸-CoA 카복실화효소 활성의 발현이 프로모터 유전자 그자체에 위치하는 돌연변이 보다 다른 아세틸-CoA 카복실화효소의 발현에 영향을 줄 수 있는 리포터 유전자의 프로모터 영역 또는 트란스-작용 영역에 위치한 돌연변이에 의해서 감소하였다. 리포터 융합의 프로모터 영역에서 발생하는 돌연변이의 경우에, 이러한 돌연변이는 상응하는 영역의 서열에 의해 단리될 수 있다. 따라서 단리된 돌연변이는 다양한 카로테노이드, 특히 아스타잔틴 제조 돌연변이체내로 도입될 수 있고 이는 염색체상에 아세틸-CoA 카복실화효소 유전자를 위한 본래의 프로모터와 변이된 프로모터 단편 사이에 재조합에 의해 파피아 로도지마로부터 유래한다. 트란스-작용 영역에서 발생하는 돌연변이를 배제하기 위해서, 프로모터 영역내에 시스 요소의 시험관내 돌연변이화에 의해 돌연변이를 또한 유도할 수 있다. 이 접근에서, 그의 5'-말단에 목적 유전자로부터 유래하는 프로모터 영역 및 그의 3'-말단에서 목적 유전자로부터 종결인자 유전자 카세트와 융합된 리포터 유전자를 함유하는 유전자 카세트는 돌연변이화 후 파피아 로도지마내로 도입된다. 리포터 유전자의 활성의 차이를 탐지하여 효과적인 돌연변이를 스크리닝 할 수 있다. 이러한 돌연변이는 생체내 돌연변이 접근의 경우에서와 동일한 방법으로 염색체상에 본래의 프로모터 영역의 서열내로 도입될 수 있다. 그러나, 이들 방법은 약간의 시간 소모적인 공정이라는 약간의 결점을 갖는다.
유전자 발현을 감소시키는 또다른 전략은 안티센스 방법이다. 이 방법은 텔레모프성(telemorphic) 유기체, 예컨대 파피아 로도지마가 숙주 유기체로서 사용할 때 조차도 유전자 발현을 감소시키는데 자주 적용되고 돌연변이 및 유전자 파괴 방법이 통상적으로 적용하기 어렵다. 안티-센스 방법은 인공적인 유전자 단편을 도입하여 목적 유전자의 발현을 감소시키는 방법으로 이 서열은 목적 유전자의 cDNA 단편에 상보적이다. 이러한 안티-센스 유전자 단편은 생체내에서 목적하는 유전자의 성숙한 mRNA 단편과 복합체를 형성하고 결과로서, mRNA로부터 효과적인 번역을 저해한다.
"안티센스" 핵산 분자는 단백질을 코딩하는 "센스" 핵산 분자에 상보적, 예를 들어 이중-나선 cDNA 분자의 코딩 사슬에 상보적이거나 또는 mRNA 서열에 상보적 핵산 서열을 포함한다. 따라서, 안티센스 핵산 분자는 센스 핵산 분자와 수소결합할 수 있다. 안티센스 핵산 분자는 전체적인 아세틸-CoA 카복실화효소-코딩 사슬 또는 이의 부분에만 상보적일 수 있다. 따라서, 안티센스 핵산 분자는 아세틸-CoA 카복실화효소를 코딩하는 뉴클레오타이드 서열의 코딩 사슬의 "코딩 영역"에 안티센스일 수 있다. 용어 "코딩 영역"는 아미노산 잔기내로 번역되는 코돈을 포함하는 뉴클레오타이드 서열의 영역을 지칭한다. 추가로, 안티센스 핵산 분자는 아세틸-CoA 카복실화효소를 코딩하는 뉴클레오타이드 서열의 코딩 사슬의 "비코딩 영역"에 인티센스이다. 용어 "비코딩 영역"는 폴리펩타이드내로 번역되지 않는 코딩 영역 주변인 5' 내지 3' 서열을 지칭한다(즉, 5' 내지 3' 비번역 영역을 또한 지칭한다).
본원에서 개시된 아세틸-CoA를 코딩하는 코딩 사슬 서열이 제시될 때, 본 발명의 안티센스 핵산 분자는 왓슨과 크릭 염기 쌍의 법칙에 따라서 고안될 수 있다. 안티센스 핵산 분자는 아세틸-CoA 카복실화효소 mRNA의 전체적인 코딩 영역에 상보적이지만 아세틸-CoA 카복실화효소 mRNA의 코딩 또는 비코딩 영역의 일부에만 안티센스인 올리고뉴클레오타이드일 수 있다. 예를 들어, 안티센스 올리고뉴클레오타이드는 아세틸-CoA 카복실화효소 mRNA의 번역 개시 지점 주변에 영역에 상보적일 수 있다. 안티센스 올리고뉴클레오타이드는 예를 들어, 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개 또는 50개 뉴클레오타이드 길이일 수 있다. 본 발명의 안티센스 핵산 분자는 화학적 합성을 사용하고 당해분야에 공지된 과정을 사용하여 효소적 결합 반응으로 구축될 수 있다. 예를 들어, 안티센스 핵산 분자(예를 들어, 안티센스 올리고뉴클레오타이드)는 천연 뉴클레오타이드 또는 다양하게 개질된 뉴클레오타이드를 사용하여 화학적으로 합성하여 분자의 생물학적 안정성을 증가시키거나 또는 안티센스와 센스 핵산 사이에 형성된 이중나선의 물리적 안정성을 증가시키고, 예를 들어 포스포로싸이오에이트 유도체 및 아크리딘 치환된 뉴클레오타이드가 사용될 수 있다. 안티센스 핵산을 발생시키는데 사용될 수 있는 개질된 뉴클레오타이드의 예로는 5-플루오로우라실, 5-브로모우라실, 5-클로로우라실, 5-요오도우라실, 하이포-크산틴, 크산틴, 4-아세틸시토신, 5-(카복시하이드록시메틸)우라실, 5-카복실메틸-아미노메틸-2-싸이오우리딘, 5-카복시메틸아미노메틸우라실, 다이하이드로우라실, 베타-D-갈락토실쿠에오신, 이노신, N6-아이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-다이메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸-시토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메틸옥시아미노-메틸-2-싸이오우라실, 베타-D-만노실쿠에오신, 5'-메톡시카복시메틸우라실, 5-메톡시우라실, 2-메틸싸이오-N6-아이소펜테닐아데닌, 우라실-5-옥시아세트산(v), 위부톡소신, 슈도우라실, 쿠에오신, 2-싸이오시토신, 5-메틸-2-싸이오우라실, 2-싸이오우라실, 4-싸이오우라실, 5-메틸우라실, 우라실-5-옥시아세트산 메틸에스터, 우라실-5-옥시아세트산(v), 5-메틸-2-싸이오우라실, 3-(3-아미노-3-N-2-카복시프로필) 우라실, (acp3)w 및 2,6-다이아미노퓨린이 포함된다. 다르게는, 폴리뉴클레오타이드가 안티센스 방향으로 서브클로닝된 발현 벡터를 사용하여 생물학적으로 안티센스 핵산을 제조할 수 있다(즉, 삽입된 폴리뉴클레오타이드로부터 전사된 RNA가 다음에서 추가로 표시된, 목적의 표적 폴리뉴클레오타이드에 안티센스 방향일 수 있다).
본 발명의 안티센스 핵산 분자는 전형적으로 세포로 투여하거나 또는 제자리에서 발생해서, 이들이 아세틸-CoA 카복실화효소를 코딩하는 세포성 mRNA 및/또는 게놈성 DNA와 함께 하이브리드화되거나 또는 결합함에 따라서 단백질 발현을 저해하고, 예를 들어 전사 및/또는 번역을 저해한다. 하이브리드화는 통상적인 뉴클레오타이드 상보성에 의해 안정한 이중나선을 형성하거나 또는 예를 들어 DNA 이중나선에 결합하는 안티센스 핵산의 경우에 이중 나선의 두 홈과 특이적인 결합을 통해서 형성할 수 있다. 안티-센스 분자는 선택된 세포 표면상에 발현되는 수용체 또는 항원에 특이적으로 결합하도록 개질될 수 있고, 예를 들어 안티센스 핵산 분자를 세포 표면 수용체 또는 항원에 결합하는 펩타이드 또는 항체와 연결함에 의해서 이다. 안티센스 핵산 분자는 또한 본원에서 기술된 벡터를 사용하여 세포에 전달될 수 있다. 안티센스 핵산 분자가 강력한 원핵성, 바이러스 또는 식물 프로모터를 포함하는 진핵 세포의 조절하에서 놓이는 안티센스 분자, 벡터 구조의 충분한 세포내 농도를 달성하는 것이 바람직하다.
본 발명의 안티센스 핵산 분자는 예를 들어 α-아노머 핵산 분자일 수 있다. α-아노머성 핵산 분자는 통상적인 β-단위에 반대인 사슬이 서로 평행하는 상보적 RNA와 특이적인 이중나선 하이브리드를 형성한다. 안티센스 핵산 분자는 2'-o-메틸리보뉴클레오타이드 또는 키메릭 RNA-DNA 유사체를 포함할 수 있다.
본 발명의 추가의 안티센스 핵산분자는 리보자임이다. 리보자임은 단일-사슬 핵산, 예컨대 이들이 상보적 영역을 갖는 mRNA를 절단할 수 있는 리보뉴클레이즈 활성을 갖는 촉매성 RNA 분자이다. 따라서, 리보자임(예를 들어, 해머해드 리보자임)은 아세틸-CoA 카복실화효소 mRNA 전사체를 촉매적으로 절단하여 mRNA의 번역을 저해하는데 사용될 수 있다. 아세틸-CoA 코딩 핵산 분자에 특이성을 갖는 리보자임을 본원에서 개시된 아세킬-CoA 카복실화효소 cDNA의 뉴클레오타이드 서열을 기준으로 또는 본 발명에서 교시된 방법에 따라서 단리된 이종의 서열을 기준으로 고안될 수 있다. 예를 들어, 테트라히메나 L-19 IVS RNA의 유도체는 활성 지점의 뉴클레오타이드 서열이 mRNA를 코딩하는 절단된 뉴클레오타이드 서열에 상보적으로 구축될 수 있다(예를 들어, 미국 특허 제 4,987,071 호 및 미국 특허 제 5,116,742 호 참조). 다르게는, 아세틸-CoA 카복실화효소 mRNA가 RNA 분자의 풀로부터 특이적인 리보뉴클레이즈 활성을 갖는 촉매성 RNA를 선별하는데 사용될 수 있다.
파피아 로도지마로부터 카로테노이드 과생산 균주를 구축하는 안티센스 방법의 적용인 유럽 특허 제 EP 1,158,051 호에 개시되어 있다.
하나의 양태에서, 본 발명은 본 발명의 벡터 또는 폴리뉴클레오타이드를 숙주 세포내로 도입하는 단계를 포함하는 재조합 숙주 세포를 제조하는 방법에 관한 것이다.
벡터 DNA를 통상적인 형질전환 또는 형질감염 기법에 의해 원핵 또는 진핵 세포로 도입할 수 있다. 본원에서 사용된 바와 같이, 용어 "형질전환" 및 "형질감염", 접합 및 형질도입은 외래의 핵산(예를 들어 DNA)을 숙주세포내로 도입하기 위한 당해분야에 인지된 다양한 기법을 지칭하고자 하고, 칼슘 포스페이트 또는 염화 칼슘 공-침전, DEAE-텍스트란-매개된 형질감염, 리포펙팩션, 자연적 수용능, 화학적 매개 전달 또는 전기충격을 포함한다. 식물을 포함하는 숙주 세포를 형질전환 또는 형질감염 하기 위한 적당한 방법은 당업자에게 공지되어 있다.
포유류 세포의 안정한 형질감염에 대해서, 사용되는 발현 벡터 및 형질감염 기법에 따라서 세포의 작은 분획만을 이들의 게놈내로 외부의 DNA를 융합할 수 있다. 이들 구성요소를 동정하고 선택하기 위해서 선택가능한 표지(예를 들어 항생제 내성)를 코딩하는 유전자를 일반적으로 목적 유전자에 함께 숙주세포내로 도입할 수 있다. 바람직한 선택가능한 표지는 약제, 예컨대 G418, 하이드로마이신 및 메토트레세이트에 내성을 갖는 것을 포함한다. 선택가능한 표지를 코딩하는 핵산은 본 발명의 폴리펩타이드를 코딩하거나 또는 분리된 벡터상에 도입될 수 있는 동일한 벡터상에서 숙주세포내로 도입할 수 있다. 도입된 핵산과 함께 안정적으로 형질감염 세포는 예를 들어, 약제 선택에 의해 동정될 수 있다(예를 들어, 선택가능한 표지 유전자를 혼입한 세포는 생존하고 반면에 다른 세포는 죽는다).
상동성 재조합 미생물을 제조하기 위해서, 결실, 첨가 또는 치환으로써 변화를 도입하는 본 발명의 폴리뉴클레오타이드의 부분 이상을 함유하여 벡터를 제조하고, 예를 들어 기능적으로 아세틸-CoA 카복실화효소 유전자를 파괴시킨다. 바람직하게, 이 아세틸-CoA 카복실화효소 유전자는 파피아 로도지마 아세틸-CoA 카복실화효소 유전자이지만 관련되거나 또는 상이한 원천과 상동성일 수 있다. 다르게는, 벡터는 상동성 제조합, 내인성 아세틸-CoA 카복실화효소 유전자가 변이되거나 또는 달리 말하자면 여전히 기능적 단백질을 코딩하는 것으로 고안될 수 있다(예를 들어, 업스트림 조절 영역이 변화됨에 따라서 내인성 아세틸-CoA 카복실화효소의 발현을 변화시킨다). 상동성 재조합에 의해 점 돌연변이를 제조하기 위해서, 또한 DNA-RNA 하이브리드는 콜-스트라우쓰(Cole-Strauss) 등의 문헌[Nucl. Aci. Res., 27, 5, 1323-1330, 1990] 및 크미엑(Kmiec)의 문헌[Gene Thearpy., American Scientist. 87, 3, 240-247. 1990]에서 공지된 키메라플라스티(chimeraplasty)로서 공지되어 사용될 수 있다.
벡터는 도입된 폴리뉴클레오타이드 유전자가 내인성 아세틸-CoA 카복실화효소 유전자와 상동성으로 재조합된 세포는 당해분야에 공지된 기법을 사용하여 선별된다.
추가의 숙주 세포는 도입된 유전자의 조절된 발현을 허용하는 선별 시스템을 함유하여 제조될 수 있다. 예를 들어, lac 오페론의 조절하에서 위치하는 벡터상에 본 발명의 폴리뉴클레오타이드를 함유하는 것은 IPTG의 존재하에서만이 폴리뉴클레오타이드의 발현을 허용한다. 이러한 조절 시스템은 당해분야에 잘 공지되어 있다.
바람직하게는 도입된 핵산 분자는 숙주 세포에 외래이다.
"외래"는 핵산 분자가 숙주에 대해 이종임을 의미하고, 이는 상이한 게놈성 배경을 갖는 세포 또는 유기체로부터 유래하거나 또는 상기 핵산 분자의 천연적으로 발생하는 상대물보다 상이한 게놈성 환경에 위치하는 것을 제외하고 숙주 세포에 대해 상동성임을 의미한다. 이는 핵산 분자가 숙주 세포에 대해 상동성이라면, 상기 숙주 세포의 게놈내에 그의 천연적인 위치에 위치하지 않고, 특히 상이한 유전자에 의해 둘러쌓이는 것을 의미한다. 이 경우에, 핵산 분자는 자신의 프로모터 또는 이종 프로모터의 조절하일 수 있다. 숙주 세포가 존재하는 본 발명에 따른 벡터 또는 핵산 분자는 숙주 세포의 게놈내로 융합되거나 또는 염색체 외부의 형태로 유지될 수 있다. 이점에서, 또한 본 발명의 핵산 분자가 상동성 재조합에 의해 돌연변이 유전자를 회복하거나 또는 만들 수 있음이 이해된다.
따라서, 또다른 양태에서 본 발명은 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터와 유전자 조작으로 처리된 숙주 세포에 관한 것이다.
용어 "숙주 세포" 및 "재조합 숙주 세포"는 본원에서 교환적으로 사용된다. 이러한 용어는 세포의 자손 또는 잠재적인 자손을 제외하고 특정 대상 세포만은 지칭하지 않는다고 이해된다. 특정 개질이 돌연변이 또는 환경적인 영향 때문에 계속되는 세대에서 발생할 수 있기 때문에, 이러한 자손은 사실 모체 세포와 동일하지만 본원에서 사용되는 용어의 범위내에 포함된다.
예를 들어, 본 발명의 폴리뉴클레오타이드를 세균 세포 뿐만 아니라 균류 세포 또는 포유류 세포(예컨대 차이니즈 햄스터 난소 세포(CHO) 또는 COS 세포), 조류, 섬모충, 식물 세포, 균류 또는 이. 콜라이와 같은 다른 미생물내로 도입할 수 있다. 다른 적당한 숙주 세포는 당해분야에서 공지되어 있다. 이. 콜라이가 바람직하고 바큘로바이러스, 아그로박테리움 또는 균류 세포는 예를 들어 사카로마이세스 속 예를 들어 사카로마이세스 세레비지애 종 또는 파피아 로도지마(크산토필로마이세스 덴드로우스) 종이다.
또한, 하나의 양태에서, 본 발명은 본 발명의 폴리뉴클레오타이드 또는 벡터를 상기 균류 세포의 게놈내로 도입하는 단계를 포함하는 균류 형질전환체의 제조방법에 관한 것이다.
식물 세포내에 센스 또는 안티센스 방향으로 본 발명에 따른 핵산 분자의 발현을 위해서, 분자는 균류 세포내에 발현을 보장하는 조절 인자의 제어하에서 놓인다. 이들 조절 인자는 형질전환되는 균류 종에 대해 발현되는 핵산 분자와 이종이거나 또는 상동성일 수 있다.
일반적으로 이러한 조절 인자는 균류 세포내에서 활성인 프로모터를 포함한다. 균류 세포에서 구성적인 발현을 유지하기 위해서, 바람직하게는 구성적 프로모터는 예를 들어 파피아 로도지마로부터 유래하는 글리세르알데하이드-3-탈수소화효소 프로모터에서 사용된다(제 WO 97/23,633 호). 유도성 프로모터는 정확하게 발현을 조절할 수 있기 위해 사용될 수 있다. 유도성 프로모터에 대한 예는 열 충격 단백질을 코딩하는 유전자의 프로모터이다. 또한 이러한 유도성 프로모터를 위한 후보인 아밀라제 효소 프로모터를 기술하였다(유럽 특허 제 EP 1,035,206 호). 조절 인자는 추가로 균류 세포에서 전사 및/또는 번역 증폭제 기능을 포함할 수 있다. 게다가, 조절 인자는 전사 종결 신호, 예컨대 폴리-A 신호를 포함하고 그의 안정성을 향상시킬 수 있는 전사체에 폴리 A 꼬리의 첨가를 유도한다.
외래 DNA를 균류 세포에 도입하는 방법은 당해분야에서 또한 잘 공지되어 있다. 예를 들어, 이들은 LiCl 방법으로 형질전환하고, 원형질체의 융합, 전기충격, 당해분야에 공지된 다른 방법인 입자 폭격과 같은 바이오리스틱 방법을 포함한다. 바이오리스틱 방법을 사용하는 형질전환 방법은 당업자에게 잘 공지되어 있다.
본원에서 사용된 바와 같이 용어 "형질전환"은 전송에 사용되는 방법에 상관없이 외인성 폴리뉴클레오타이드를 숙주 세포내로 전달을 지칭한다. 폴리뉴클레오타이드를 숙주 세포내로 순식간에 또는 안정적으로 도입하고 비-융합된, 예를 들어 플라스미드로서 또는 키메릭 연결을 유지할 수 있거나 또는 다르게는 숙주 게놈내로 융합될 수 있다.
일반적으로, 본 발명에 따라 개질될 수 있고 본 발명에 따른 단백질의 과발현 또는 이러한 단백질의 합성의 감소를 나타내는 균류는 임의의 목적 균류 종으로부터 유래할 수 있다.
추가로, 하나의 양태에서, 본 발명은 벡터 또는 본 발명의 방법에 의해 수득가능한 폴리뉴클레오타이드를 포함하는 균류에 관한 것이다.
따라서, 본 발명은 또한 균류 세포내에 폴리뉴클레오타이드의 발현하게된 조절 인자와 연결된 본 발명에 따른 폴리뉴클레오타이드를 함유하는(바람직하게는 안정하게 게놈내로 융합된다) 형질전환성 균류 세포에 관한 것이고, 이때 폴리뉴클레오타이드는 형질전환된 균류 세포에 대해 외래이다. 외래의 의미에 대해서는 상기를 참조한다.
따라서, 본 발명은 또한 본 발명에 따른 형질전환된 균류 세포에 관한 것이다.
따라서, 아세틸-CoA 카복실화효소의 변화된 발현 때문에, 세포 대사 경로는 제조 산출량 및/또는 제조 효율을 조절한다.
용어 "생산" 또는 "생산성"은 당해분야에서 인지되고 주어진 시간 및 주어진 발효 부피(예를 들어 시간당 리터당 kg 생성물)내에 형성된 발효 생성물(예를 들어, 지방산, 카로테노이드, (폴리)사카라이드, 지방, 비타민, 아이소프레노이드, 왁스 에스터 및/또는 폴리하이드록시알카노에이트와 같은 중합체 및/또는 그의 대사 생성물 또는 본원에서 언급된 바와 같은 추가의 목적 미세 화학물질)의 농도를 포함한다.
생성의 용어 "효율성"은 달성된 생산의 특정 수준을 위해 요구된 시간을 포함한다(예를 들어, 세포가 상기 변화된 수율, 특히 카로테노이드, (폴리)사카라이드, 지방, 비타민, 아이소프레노이드 등으로의 산출량의 특정 속도를 달성하는데 얼마의 시간을 소요하는가)
용어 "수득량" 또는 "생성물/탄소 수득량"은 당해분야에서 인지되고 탄소 원료를 생성물(즉, 아세틸-CoA, 지방산, 비타민, 카로테노이드, 아이소프레노이드, 지방 등 및/또는 상기 정의된 바와 같은 추가의 화합물 및 생합성은 상기 생성물을 기준으로 한다)로 전환시키는 효율을 포함한다. 이는 일반적으로 예를 들어 kg 탄소원료 당 kg 생성물로 기록된다. 화합물의 수득량 또는 생산을 증가시킴에 의해, 회수된 분자의 양 또는 제시된 시간당 제시된 배양의 양에서 화합물의 유용한 회수 분자의 양은 증가한다.
용어 "생합성"(세포, 식물 조직 등에서 "생물학적인 생산"의 "합성"을 위한 동의어로 사용된다) 또는 "생합성 경로"는 당해분야에 인지되고, 다단계 및 높게 조절된 공정에서 중간대사 화합물로부터 세포에 의해 화합물, 바람직하게는 유기 화합물의 합성을 포함한다.
용어 "대사"는 당해분야에서 인지되고, 유기체에서 발생하는 생화학적 반응의 전체를 포함한다. 그러면 특정 화합물의 대사는(예를 들어, 아세틸-CoA, 지방산, 헥소스, 아이소프레노이드, 비타민, 카로테노이드, 지방 등의 대사) 총체적인 생합성, 개질 및 분해 경로를 포함하고 세포는 이 화합물에 관여한다.
이러한 유전자 조작된 파피아 로도지마는 적당한 배지에서 배양되고 그의 카로테노이드, 특히 아스타잔틴의 생산성을 평가한다. 따라서 선택된 아스타잔틴의 과도한 제조자를 이러한 유전자 조작 방법에 의해 도입된 유전자 또는 단백질의 생산성과 발현 수준 사이의 관계의 관점에서 확인하였다.
추가로 본 발명은 다음에 기술된 실시예에서 예시하고 있다.
실시예에서 사용된 물질 및 방법을 다음에서 기술하고 있다:
균주
파피아 로도지마 ATCC96594(부다페스트 협약에 따라 1998년 4월 8일에 도달 번호 제 ATCC74438로 재기탁됨)
이. 콜라이DH5α: F-, φ80d, lacZ△M15, △(lacZYA-argF)U169, hsd(rK -, mK +), recAl, endAl, deoR, thi-1, supE44, gyrA96, relAl(도요보, 일본 오사카)
이. 콜라이XL1-Blue MRF': △(mcrA)183, △(mcrCB-hsdSMR-mrr)173, endAl, supE44, thi-l, recAl, gyrA96, relAl, lac[F'proAB, ladIqZ△M15, TnlO(tetr)] (스트라타진, 미국 라욜라)
이. 콜라이SOLR: el4-(mcrA), △(mcrCB-hsdSMR-mrr)171, sbcC, recB, recJ, umuC :: Tn5(kanr), uvrC, lac, gyrA96, relA1, thi-1, endAl, △R, [F'proAB, lacIqZ△M15] Su-(비억제)(스트라타진)
이. 콜라이TOP10: F-, mcrA, △mrr-hsdRMS-mcrBC), φ80, △lacZ M15, △lacX74, recAl, deoR, araD139, (ara-leu)7697, galU, galK, rpsL(Strr), endAl, nupG(인비트로젠, 미국 칼스바드)
벡터
λZAPII(스트라타진) pBluescriptII KS-(스트라타진)
pMOSBlue T-벡터(아머샴(Amersham), 영국 버킹컴쉐어)
pCR2.1-TOPO(인비트로젠)
배지
파피아 로도지마 균주는 YPD 배지(디프코(DIFCO), 미국 디트로이트)에서 주로 배양하였다. 이. 콜라이 균주는 LB 배지(리터당 10g 박토-트립톤, 5g 효모 추출물(디프코) 및 5g NaCl)에서 배양하였다. NZY 배지(리터당 5g NaCl, 2g MgSO4-7H2O, 5g 효모 추출물(디프코), 10g NZ 아민 유형 A(와코(WAKO), 일본 오사카))를 λ파지가 연질의 한천(0.7% 한천(와코))내에 침입을 위해서 사용하였다. 한천 배지를 사용할 때 한천(와코) 1.5%를 보충하였다.
방법
제한 효소 및 T4 DNA 리가제는 타카라 슈조(Takara Shuzo)(일본 오추)에서 구입하였다. 파피아 로도지마로부터 염색체 DNA의 단리는 제조자에 의해 공급된 프로토콜에 따라서 큐아젠(QIAGEN) 게놈 키트(큐아젠, 독일 힐덴)을 사용하여 수행하였다. 형질전환된 이. 콜라이로부터 플라스미드 DNA의 미니-프렙은 자동 DNA 단리 시스템(PI-50, 쿠라보 캄파니 리미티드(Kurabo Co., Ltd.), 일본 오사카)으로 수행하였다. 이. 콜라이 형질전환체로부터 플라스미드 DNA의 미디-프렙은 큐아젠 칼럼(큐아젠)을 사용하여 수행하였다. λDNA의 단리는 제조자에 의해 제작된 프로토콜에 따라서 위자드(Wizard) 람다 프렙 DNA 정제 시스템(프로메가(Promega), 미국 메디슨)으로 수행하였다. DNA 단편을 큐아퀵 또는 큐아엑스 II(큐아젠)을 사용하여 아가로스로부터 단리하고 정제하였다. λ 파지 유사체의 증폭은 제조자에 의해 제작된 프로토콜을 수행하였다(스트라타진).
파피아 로도지마로부터 총 RNA의 단리는 아이소진(Isogen)(니폰 진(Nippon Gene), 일본 도야마)을 사용하여 페놀 방법으로 수행하였다. mRNA를 총 RNA로부터 정제하고 mRNA 분리 키트(클론테크(Clontech))를 사용하여 수득하였다. cDNA를 캡파인더(CapFinder) cDNA 구조 키트(클론테크)를 사용하여 합성하였다.
시험관내 패키징은 지나팩 III 골드 패키징 추출물(스트라타진)을 사용하여 수행하였다.
중합 연쇄 반응(PCR)은 퍼킨 엘머(Perkin Elmer) 모델 2400의 열 순환기로 수행하였다. 각각의 PCR 조건은 실시예에서 기술하고 있다. PCR 프라이머는 시판된 공급체로부터 구입하였다. DNA 시퀀싱을 위해 형광성 DNA 프라이머를 파마시아(Pharmacia)로부터 구입하였다. DNA 시퀀싱은 자동화된 형광성 DNA 서열기(알프레드(ALFred), 파마시아)에서 수행하였다
DH5α의 수용능 세포는 도요보(일본)로부터 구입하였다.
실시예 1
파피아 로도지마로부터 mRNA의 단리 및 cDNA 라이브러리의 구축
파피아 로도지마의 cDNA 라이브러리를 구축하기 위해서 총 RNA를 세포를 파쇄한 후 바로 페놀 추출 방법으로 단리하고 파피아 로도지마 ATCC96594 균주로부터 mRNA를 m RNA 분리 키트(클론테크)를 사용하여 정제하였다.
먼저, YPD 배지에서 2일 배양한 10㎖로부터 ATCC96594 균주를 원심분리(1500 x g에서 10분)에 의해 수집하고 추출 완충액(10mM Na-시트레이트/0.7M KCl을 함유하는 HCl(pH6.2))으로 1회 세척하였다. 추출 완충액 2.5㎖에서 현탁시킨 후, 세포를 프렌치 프레스 균질화기(오타케 워크 코포레이션(Ohtake Works Corp.), 일본 도쿄)에 의해 1500kgf/cm2에서 분쇄하고 즉시 제조자에 의해 구체화된 방법에 따라서 아이소겐(니폰 진)의 부피로 2회 혼합하였다. 이 단계에서, 총 RNA 400㎍을 회수하였다.
그 후, 이 총 RNA를 제조자에 의해 구체화된 방법에 따라서 mRNA 분리 키트(클론테크)를 사용하여 정제하였다. 마지막으로 파피아 로도지마 ATCC96594 균주로부터 mRNA 16㎍을 수득하였다.
cDNA 라이브러리를 구축하기 위해서, 캡파인더 PCR cDNA 구조 키트(클론테크)를 제조자에 의해 구체화된 방법에 따라서 사용하였다. 정제된 mRNA 1㎍dfm 척 가닥 합성에 대해서 적용한 후 PCR 증폭하였다. PCR에 의한 증폭 후, cDNA 1mg을 수득하였다.
실시예 2
파피아 로도지마로부터 부분적인 ACC(아세틸-CoA 카복실화효소) 유전자의 클로닝
파피아 로도지마로부터 부분적인 ACC 유전자를 클로닝하기 위해서, 축퇴성 PCR 방법을 사용하였다. 아세틸-CoA 카복실화효소에 대한 서열이 복합적인 정렬 분석에 대해서 사용되는 데이터베이스에 종 및 도달 번호는 다음과 같다.
아라비돕시스 쌀리아나(Arabidopsis thaliana) D34630(DDBJ)
에머리셀라 니둘란스(Emericella nidulans) Y15996(EMBL)
갈루스 갈루스(Gallus gallus) P11029(스위스-프로트)
글리신 맥스(Glycine max) L48995(진뱅크)
호모 사피엔스(Homo sapiens) S41121(PIR)
메디카고사티바(Medicago sativa) L25042(진뱅크)
오비스 아리에스(Ovis aries) Q28559(스위스-프로트)
루투스 노르베기쿠스(Rattus norvegicus) P11497(스위스-프로트)
사카로마이세스 세레비지애(Saccharomyces cerevisiae) Q00955(스위스-프로트)
시조사카로마이세스 폼베(Schizosaccharomyces pombe) P78820(스위스-프로트)
우스틸라고 마이디스(Ustilago maydis) S49991(PIR)
뉴클레오타이드 서열을 다른 종으로부터 공지된 아세틸-CoA 카복실화효소의 일반적인 서열을 기준으로 고안하고 합성된 두 개의 혼합된 프라이머는 acc9(센스 프라이머)(서열 번호 4) 및 acc13(안티센스 프라이머)(서열 번호 5)(서열에서 "n"은 뉴클레오타이드 a, c, g 또는 t를 의미하고, "h"는 뉴클레오타이드 a, c 또는 t를 의미하고 "m"은 뉴클레오타이드 a 또는 c를 의미하고, "k"는 뉴클레오타이드 g 또는 t를 의미하고, "y"는 뉴클레오타이드 c 또는 t를 의미한다)이다. DNA 중합효소로서 ExTaq(타카라 슈조) 및 주형으로서 실시예 1에서 수득된 cDNA 풀을 사용하여 95℃에서 30초, 45℃에서 30초 및 72℃에서 15초를 25주기로 PCR 반응한 후, 반응 혼합물을 아가로스 젤 전기영동을 실시하였다. 목적하는 길이(0.8kb)를 갖는 하나의 PCR 밴드를 아가로스 겔로부터 회수하고 제조자에 의한 방법에 따라서 큐아퀵(큐아젠)에 의해 정제한 후 pMOSBlue-T 벡터(아머샴)에 연결하였다. 수용능 이. 콜라이 DH5α에 형질전환시킨 후, 6개의 백색의 집락을 선별하여 플라스미드를 자동화 DNA 단리 시스템으로 단리하였다. 시퀀싱의 결과로서, 3개의 클론이 축퇴된 아미노산 서열이 공지된 아세틸-CoA 카복실화효소 유전자와 유사한 서열을 갖는 것을 관찰하였다. 이들 단리된 cDNA 클론을 pACC1014로서 고안되고 추가의 스크리닝 연구에 사용하였다.
실시예 3
파피아 로도지마로부터 게놈 DNA의 단리
파피아 로도지마로부터 게놈 DNA를 단리하기 위해서, 제조자에 의해 구체화된 방법에 따라서 큐아젠 게놈 키트를 사용하였다.
먼저, YPD 배지에서 밤새도록 배양액 100㎖로부터 파피아 로도지마 ATCC96594 균주를 원심분리(1500 x g에서 10분동안)로 수집하고 TE 완충액(10mM 트리스/1mM EDTA를 함유하는 HCl(pH 8.0))으로 1회 세척하였다. 큐아젠 게놈 키트의 Y1 완충액 8㎖중에 현탁한 후 리티카제(시그마(Sigma), 미국 세인트 루이스)를 효소 분해에 의해 파쇄된 세포에 2mg/㎖의 농도로 첨가하고 반응 혼합물을 30℃에서 90분동안 배양한 후 다음 추출 단계를 실시하였다. 마지막으로 게놈 DNA 20㎍을 수득하였다.
실시예 4
탐침으로서 pACC1014를 사용하여 서던 블랏 하이브리드화
파피아 로도지마로부터 ACC 유전자를 함유하는 게놈 단편을 클로닝하는데 서던 블랏 하이브리드화를 사용하였다. 게놈 DNA 2㎍을 EcoRI에 의해 절단하고 아가로스 겔 전기 영동을 실시한 후 산 및 알칼리 처리하였다. 변성된 DNA를 나일론 막(하이본드(Hybond) N+, 아마샴)에 트랜스블롯(요토 리카(Joto Rika), 일본 도쿄)을 사용하여 1시간동안 전달하였다. 나일론 막으로 전달된 DNA는 열 처리하여 고정하였다(80℃, 90분). 주형 DNA(EcoRI 및 SalI으로 절단된 pACC1014)를 DIG 멀티프라이밍 방법(보링거 만하임)으로 표지화하여 탐침을 제조하였다. 제조자에 의해 구체화된 방법으로 하이브리드화를 수행하였다. 그 결과로서, 하이브리드화된 밴드를 2.0 내지 2.3kb 범위로 시각화하였다.
실시예 5
ACC 유전자를 함유하는 게놈 단편의 클로닝
게놈 DNA 4㎍을 EcoRI으로 절단하고 아가로스 겔 전기영동을 실시하였다. 그 후, 1.5 내지 2.7kb의 범위내의 길이을 갖는 DNA를 제조자에 의해 구체화된 방법에 따라서 큐아엑스(QIAEX) II 겔 추출 키트(큐아젠)에 의해 회수하였다. 정제된 DNA를 EcoRI-절단 및 CIAP(소 소장 알칼라인 포스파테이즈)-처리된 λZAPII(스트라타진) 0.5㎍으로 16℃에서 밤새도록 결합시키고, 기가팩 III(Gigapack III) 골드 패키징 추출(스트라타진)르로 패키징하였다. 패키징된 추출물을 이. 콜라이MRF' 균주에 감염시키고 LB 한천 배지를 쏟아부어 NZY 배지로 겹층을 만들었다. 약 500 플라크를 탐침으로서 EcoRI 및 SalI 절단된 pACC1014를 사용하여 스크리닝하였다. 5개의 플라크가 표지된 탐침과 하이브리드화하였다.
생체내에서 절단 프로토콜은 교육 매뉴얼(스트라타진)에 따라서 파피아 로도지마의 ACC 유전자로 추정된 것을 함유하는 이들 λZAPII 유도체에 적용하고 삽입 단편을 이. 콜라이 클로닝 벡터인 pBluescript SK 내에 클로닝하였다. 5개의 양성 플라크로부터 회수된 각각의 클론을 시퀀싱 분석을 실시하여 이들중 3개가 pACC1014의 삽입단편이 동일한 서열을 가짐을 관찰하였다. 클론중 하나를 pACC1224로 명명하고 추가의 연구에 사용하였다. pACC1224내의 삽입 단편의 전체 영역의 총 시퀀싱 결과, 이 클론이 ACC 유전자의 5' 또는 3' 말단을 함유하지 않음을 시사하였다.
실시예 6
게놈 워킹 방법에 의해 파피아 로도지마의 게놈으로부터 pACC1224내에 삽입 단편의 측면 영역의 클로닝
2개의 PCR 프라이머를 pACC1224의 내부 서열을 기준으로 합성하고 게놈 워킹 방법에 사용하였다: acc17(시열 번호 6) 및 acc18(서열 번호 7). 게놈 워킹 방법을 위해 공급자(클론텍)로부터 제공된 교육 매뉴얼의 프로토콜에 따랐다. acc17 프라이머를 사용하여 PCR 반응에서, 2.8kb PCR 밴드가 StuI 라이브러리로부터 나타났다. 이들 PCR 밴드를 pCR2.1-TOPO(인비트로젠)내로 클로닝하고 2.8kb PCR 밴드가 ACC 유전자의 5' 단편 및 ACC 유전자의 3' 단편을 각각 함유하는 것으로 나타났다. 2.8kb 및 2.2kb PCR 단편을 함유하는 클론을 pACCStu107 및 pACCPvd107로 각각 명명하고 추가의 연구에 사용하였다.
실시예 7
탐침으로서 pACCStu107 및 pACCPvd107을 사용한 서던 블랏 하이브리드화
서던 블랏 하이브리드화를 수행하여 파피아 로도지마로부터 ACC 유전자를 갖는 게놈 DNA 클로닝하였다. 게놈 DNA 2㎍을 EcoRI으로 절단하고 아가로스 겔 전기영동한 후 산 및 알카리 처리하였다. 변성된 DNA를 트랜스블롯(요토 리카, 일본 도쿄)을 사용하여 나일론 막(하이본드 N+, 아마샴)에 1시간동안 전달하였다. 나일론 막으로 전달한 DNA를 열처리(80℃, 90분)에 의해 고정하였다. DNA(EcoRI 절단된 pACCStu107 및 pACCPvd107)를 DIG 멀티프라이밍 방법(보링거 만하임)으로 표지화하여 탐침을 제조하였다. 제조자에 의해 구체화된 방법으로 하이브리드화를 수행하였다. 결과로서, pACCStu107내에 삽입 단편이 탐침으로서 사용할 때 그 크기가 2.0kb, 0.9kb 및 0.6kb에 가까운 몇몇의 하이브리드화된 밴드로 시각화하였다. pACCPvd107내에 삽입 단편을 탐침으로서 사용하는 경우에 하이브리드화된 밴드를 6.0kb 내지 6.5kb의 범위로 시각화하였다.
실시예 8
ACC 유전자를 갖는 게놈 클론의 클로닝
실시예 5와 유사한 방법으로 pACCStu107 및 pACCPvd107내에 삽입 서열을 함유하는 게놈 단편을 플라크 하이브리드화에 의해 클로닝하였다. 게놈 DNA의 4㎍을 EcoRI으로 절단하고 아가로스 겔 전기영동을 실시하였다. 그 후, 하기 범위내에 길이를 갖는 DNA를 제조자에 의해 구체화된 방법에 따라서 큐아엑스 II 겔 추출 키트(큐아젠)에 의해 회수하였다:(1) 2.7 내지 5.0kb; (2) 1.4 내지 2.7kb; 및 (3) 0.5 내지 1.4kb.
각각의 정제된 DNA를 EcoRI-절단되고 CIAP(소 소장 알칼라인 포스파테이즈)-처리된 λZAP II(스트라타진) 0.5㎍과 16℃에서 밤새도록 결합시키고 기가팩 III 골드 패키징 추출(스트라타진)에 의해 패키징하였다. 패키징된 추출물을 이. 콜라이 MRF' 균주에 감염시키고 LB 한천 배지상에 쏟아부어 NZY로 겹층을 만들었다. 약 5000 플라크를 EcoRI-절단된 pACCStu107 및 pACCPvd107을 탐침으로서 사용하여 스크리닝하였다. 다음 참가자는 플라크 하이브리드화 연구 후에 단리하였다.
(1) 탐침으로서 pACCPvd107의 삽입물을 사용하여 2.7 내지 6.0kb 라이브러리로부터 3개의 플라크.
(2) 탐침으로서 pACCPvd107의 삽입물을 사용하여 1.4 내지 2.7kb 라이브러리로부터 3개의 플라크.
(3) 탐침으로서 pACCPvd107의 삽입물을 사용하여 0.5 내지 1.4kb 라이브러리로부터 21개의 플라크.
생체내 절단 프로토콜을 파피아 로도지마의 ACC 유전자로 추정된 것을 포함하는 이들 λZAP II 유도체에 적용한 후 교육 매뉴얼(스트라타진)에 따라서 이. 콜라이내로 클로닝 벡터 pBluescript SK에 삽입 단편을 클로닝하였다. 양성 플라크로부터 회수된 각각의 클론을 시퀀싱 분석을 실시하였다. 하나 이상의 각각의 클론은 블라스트 분석으로부터 ACC 유전자로 추정된 것을 갖는다(http://www.blast.genome.ad.jp/). 다음 클론을 선별하고 추가의 분석에 사용하였다:
6kb 삽입물을 갖고 및 ACC 유전자의 3' 말단을 포함하는 pACC199-18;
pACC1224 삽입 단편의 5' 말단 측면에 위치하는 0.6kb 삽입물을 갖는 pACC119-17-0.6;
pACC119-17-2 삽입 단편의 5' 말단 측면에 위치하는 2kb 삽입물을 갖는 pACC119-17-2; 및
pACC119-17-2 삽입 단편의 5' 말단 측면에 위치하는 0.9kb 삽입물을 갖는 pACC127-17-0.9.
pACC119-18, pACC119-17-0.6, pACC119-17-2 및 pACC127-17-0.9내에 삽입 단편의 전체적인 영역의 총 시퀀싱의 결과로서, 이들 클론은 ACC 유전자의 5' 말단을 포함하지 않음을 시사하였다.
실시예 9
게놈 워킹 방법에 의해 파피아 로도지마의 게놈으로부터 pACC127-17-0.9내에 삽입 단편의 측면 영역의 클로닝
PCR 프라이머 acc26(서열 번호 8)은 pACC127-17-0.9의 내부 서열을 기준으로 합성하고 게놈 워킹 방법을 사용하였다. acc26 프라이머를 사용하는 PCR 반응에서, 2.6kb PCR 밴드가 게놈성 PvuII 라이브러리로부터 나타났다. 이 PCR 밴드를 pCR2.1-TOPO(인비트로젠)내에 클로닝하고 이 클론은 블라스트 X 분석의 결과로서 ACC 유전자의 5' 단편을 포함하는 것으로 나타났다.
실시예 10
탐침으로서 pACCPvu126을 사용한 서던 블랏 하이브리드화
서던 블랏 하이브리드화를 수행하여 파피아 로도지마로부터 ACC 유전자의 5' 말단을 포함하는 게놈 단편을 클로닝하였다. 실시예 7과 유사한 방법으로, 서던 블랏 하이브리드화를 수행하였다. DIG 멀티프라이밍 방법(보링거 만하임)으로 주형 DNA(EcoRI-절단된 pACCPvu116)를 표지하여 탐침을 제조하였다. 하이브리드화는 제조자에 의해 구체화된 방법으로 수행하였다. 결과로서, 크기가 5.0kb에 인접한 하이브리드화된 밴드를 시각화하였다.
실시예 11
ACC 유전자의 5' 말단을 포함하는 게놈 클론의 클로닝
실시예 8에 유사한 방법으로 pACCPvu126내에 삽입 단편을 포함하는 게놈 단편을 플라크 하이브리드화에 의해 클로닝하였다. 실시예 8에서 제조된 2.7 내지 6.0kb 길이를 포함하는 게놈 라이브러리를 또한 사용하였다. DIG로 표지된 pACCPvu126의 삽입 단편에 하이브리드화된 12개의 양성 플라크를 생체내에서 절단을 실시하여 플라스미드 DNA를 수득하였다. 따라서 단리된 플라스미드에 대한 시퀀싱의 결과로서 대부분의 플라스미드를 pACCPvu1126의 삽입 단편에 동일한 서열을 가졌다. 클론중 하나를 pACC204로 명명하고 추가의 분석에 사용하였다.
실시예 12
pACC204와 pACC127-17-0.9 사이의 간격 영역의 클로닝
pACC204내에 삽입 단편의 3' 말단 및 pACC127-17-0.9내에 삽입 단편의 5' 말단의 시퀀싱 연구에 계속해서 공지된 에세틸-CoA 카복실라제 유전자 블라스트 X 분석의 결과로서 전체적인 ACC 유전자의 범위에서 약 0.3kb 단편이 결실될 수 있음을 시사하였다. 다음 PCR 프라이머를 pACC204 및 pACC127-17-0.9: acc43(센스 프라이머)(서열 번호 9) 및 acc44(안티센스 프라이머)(서열 번호 10)의 내부 서열을 기준으로 합성하였다. DNA 중합효소로서 HF 중합효소(클론테크) 및 주형으로서 실시예 3에서 수득된 게놈 DNA를 사용하여 94℃에서 15초동안, 55℃에서 30초 동안 및 72℃에서 15초동안 25주기로 PCR 반응시킨 후, 반응 혼합물을 아가로스 겔 전기 영동에 적용하였다. 목적 길이(0.3kb)를 갖는 하나의 PCR 밴드를 아가로스 겔로부터 회수하고 제조자에 의한 방법에 따라서 큐아퀵(큐아젠)에 의해 정제한 후 pCR2.1-TOPO(인비트로젠)내로 클로닝하였다. 수용능 이. 콜라이 TOP10의 형질전환 후, 6개의 백색의 콜로니를 선별하고 플라스미드를 자동화된 DNA 분리 시스템으로 단리하였다. 시퀀싱의 결과로서, 5개의 클론이 서로 동일한 서열을 가지는 것을 관찰하였다. 단리된 클론중 하나는 pACC210으로서 나타냈다.
실시예 13
ACC 유전자를 포함하는 완전한 게놈 단편의 시퀀싱
pACC204, pACC210, pACC127-17-0.9, pACC119-17-2, pACC119-17-0.6, pACC1224 및 pACC119-18을 오토리드(AutoRead) 시퀀싱 키트(파마시아)를 사용하여 프라이머 워킹 과정으로 시퀀싱하였다. 시퀀싱의 결과로서, 그의 프로모터(1445개의 염기 쌍) 및 종결인자(1030개의 염기 쌍)를 포함하는 파피아 로도지마로부터 ACC 유전자를 포함하는 게놈 단편의 10561개의 염기 쌍을 포함하는 뉴클레오타이드 서열을 결정하였다(서열 번호 1). 코딩 영역은 8086개의 염기 쌍 길이이고 19개의 엑손 및 18개의 인트론으로 구성한다. 인트론은 5' 또는 3' 바이어스 없이 코딩 영역을 통해서 전체로 분산된다. 개방형 해독 구조(서열 번호 2)는 2187개의 아미노산(서열 번호 3)으로 구성되고 그의 서열이 GENETYX-SV/RC 소프트웨어(소프트웨어 디벨롭먼트 캄파니 리미티드, 일본 도쿄)에 의해 상동성 조사의 결과로서 다른 종(에머리셀라 니두란스(Emericella nidulans)로부터 아세틸-CoA 카복실화효소에 56.28% 동일성)의 아세틸-CoA 카복실화효소의 공지된 아미노산 서열과 상당히 유사하다. 도 1은 피 로도지마의 염색체상에 ACC 유전자 영역을 포함하는 DNA 단편을 클로닝을 도시한다.
실시예 14
ACC 유전자에 대한 안티센스 플라스미드의 구축
ACC 유전자에 대한 전체적인 구조 유전자를 포함하는 안티센스 유전자 단편을 PCR에 의해 증폭한 후 안티센스 ACC 유전자가 파피아 로도지마내에 그 자신의 ACC 프로모터에 의해 전사되는 통합 벡터내로 클로닝한다. 프라이머를 SfiI(GGCCNNNNNGGCC) 제한 효소에 대한 비대칭적 인식 서열을 포함하지만 이들의 비대칭적인 행-오버 서열과 상이하게 고안하였다. 이는 이들의 결합 서열에서 동일한 비대칭 서열을 갖는 표현 발현내로 직접 클로닝할 수 있다. 이러한 구축의 용도는 유럽 특허 제 EP 1,158,051 호에 개시되어 있다.
안티센스 ACC 유전자의 전사를 유도할 수 있는 프로모터 및 종결인자 단편에 대해서, ACC 프로모터 및 종결인자를 서열 번호 1에서 나열된 서열 정보를 사용하여 염색체로부터 클로닝하였다. ACC 종결인자 단편을 포함하는 DNA 단편을 적당한 벡터, 예컨대 pBluescriptII KS-(스트라타진)에 pG418Sa330(유럽 특허 제 EP 1,035,206 호)의 G418 저항 카세트와 연결하여 G418 저항 카세트와 융합한다. 그 후 리보좀 DNA(rDNA) 자리를 포함하는 SacI 단편의 301kb(웨리(Wery) 등의 문헌[Gene, 184, 89-97, 1997])을 따라서 제조된 플라스미드상에 G418 카세트의 다운스트림을 삽입하였다. rDNA 단편은 사용된 숙주의 염색체상에 멀티카피로 통합되고 이는 발현 벡터내에 갖는 외래 유전자를 과발현하게 하였다. 그 후, ACC 프로모터를 ACC 종결인자의 업스트림에 삽입하여 파피아 로도지마내에서 기능하는 발현 벡터를 구축하였다. 최종적으로, 안티센스 ACC 구조를 파피아 로도지마내에서 기능을 하는 제조된 발현 벡터내로 안티센스 ACC를 포함하는 SfiI 단편 1.5kb를 삽입하여 완료하였다. 유사한 플라스미드 구조는 유럽 특허 제 EP 1,158,051 호에 개시되어 있다.
실시예 15
ACC-안티센스 벡터에 의한 파피아 로도지마의 형질전환
따라서 제조된 ACC-안티센스 벡터를 파피아 로도지마 야생형 균주, ATCC96594내로 형질전환하였다. 바이오리스틱 형질전화에 대한 프로토콜은 유럽 특허 제 EP 1,158,051 호에 개시되어 있다.
실시예 16
파피아 로도지마의 안티센스 ACC 재조합체의 규명
파피아 로도지마, ATCC96594의 안티센스 ACC 재조합체를 시험관내에 YPD 배지 10㎖내에서 20℃에서 3일동안 배양한 이들의 씨드 배양액을 사용하여 20℃에서 3일동안 500㎖들이 엘렌마이어 플라스크에 YPD 배지 50㎖내에서 배양하였다. 제조된 카로테노이드의 분석을 위해서, 배양액의 적당한 부피를 제거하고 이들의 성장, 카로테노이드, 특히 아스타잔틴의 생산성 분석을 위해 사용하였다. 성장을 분석하기 위해서, 660nm 광학 밀도를 UV-1200 광도계(시마주 코포레이션, 일본 교토)를 사용하여 측정하고, 추가로 하루동안 100℃에서 미세원심분리한 후 배양액의 1㎖로부터 유래하는 세포를 건조하여 이들의 건조된 세포 질량의 결정하였다. 아스타잔틴 및 총 카로테노이드의 함량의 분석을 위해 세포를 배양액 1.0㎖로부터 회수하고 미세원심분리한 후 글래스 비드로 파쇄시킨 파피아 로도지마의 세포로부터 케로테노이드를 추출하여 사용하였다. 추출한 후, 파쇄한 세포를 원심분리에 의해 제거하고 HPLC로 생성물 카로테노이드 함량을 분석하였다. 사용된 HPLC 조건을 다음과 같다: HPLC 칼럼: 크롬팩 리크로솔브 si-60(4.6mm, 250mm), 온도: 실온, 용리액: 아세톤/헥세인(18/82)을 용리액에 물 1㎖/ℓ를 첨가, 주입 부피: 10㎕, 유속: 2.0㎖/분, 검출: 450nm UV에서, 아스타잔틴의 대조 시료를 호프만 라-로슈(스위스 바젤)로부터 수득할 수 있다.
<110> DSM IP ASSETS B.V. <120> ACC gene <130> NDR5217 <140> PCT/EP03/10683 <141> 2003-09-25 <150> EP 02021625.5 <151> 2002-09-27 <160> 10 <170> PatentIn version 3.2 <210> 1 <211> 10561 <212> DNA <213> Phaffia rhodozyma <220> <221> 5'UTR <222> (1221)..(1222) <220> <221> exon <222> (1446)..(1482) <220> <221> Intron <222> (1483)..(1675) <220> <221> exon <222> (1676)..(1758) <220> <221> Intron <222> (1759)..(1832) <220> <221> exon <222> (1833)..(1957) <220> <221> Intron <222> (1958)..(2030) <220> <221> exon <222> (2031)..(2171) <220> <221> Intron <222> (2172)..(2243) <220> <221> exon <222> (2244)..(2641) <220> <221> Intron <222> (2642)..(2745) <220> <221> exon <222> (2746)..(2991) <220> <221> Intron <222> (2992)..(3074) <220> <221> exon <222> (3075)..(3443) <220> <221> Intron <222> (3444)..(3517) <220> <221> exon <222> (3518)..(3552) <220> <221> Intron <222> (3553)..(3625) <220> <221> exon <222> (3626)..(3750) <220> <221> Intron <222> (3751)..(3827) <220> <221> exon <222> (3828)..(4026) <220> <221> Intron <222> (4027)..(4095) <220> <221> exon <222> (4096)..(4911) <220> <221> Intron <222> (4912)..(4983) <220> <221> exon <222> (4984)..(5384) <220> <221> Intron <222> (5385)..(5455) <220> <221> exon <222> (5456)..(5608) <220> <221> Intron <222> (5609)..(5673) <220> <221> exon <222> (5674)..(5805) <220> <221> Intron <222> (5806)..(5870) <220> <221> exon <222> (5871)..(6832) <220> <221> Intron <222> (6833)..(6898) <220> <221> exon <222> (6899)..(6976) <220> <221> Intron <222> (6977)..(7047) <220> <221> exon <222> (7048)..(7227) <220> <221> Intron <222> (7228)..(7295) <220> <221> exon <222> (7296)..(9160) <220> <221> Intron <222> (9161)..(9230) <220> <221> exon <222> (9231)..(9530) <220> <221> polyA_site <222> (9813)..(9814) <400> 1 caacagacag acaaaggaac ttacgtgtac atactggtct ttccaatgtc gcggcgtcga 60 gattaactag aacaatactt gacaatcgaa tctcttattc tgccctagtt gaaggcgtct 120 gttcaaattg atcaagatct tccaatcatt gacatccagg tattcgcatt cgactctgct 180 cgtatgtact gttccgattt tcttatggcc accagatttc aactctgata tacattggtt 240 caccctgtct ttgtctcttt gcctttcgtt ccatctagcg ctgttcaacg gatcactcag 300 tcggcttgac tcaactccct ctggaacgtg tgccttatct caggttctga tttctcctca 360 gccagtatgc gcacaaagca gcgatcgtga ctttttgctc cataagacct ctcagcgggg 420 aatatatgac actcatacat cgatagctcg tatgttttct ttgatcactt cctaaaatgt 480 aacggcaact gacattcaac atgatgcgct ttcatagatc aactacttcc gactacgatg 540 accgttcttc tatacagccc agtcagctcg tcgacctcac ataaagtgac tgagaccgcg 600 atctcgaaca tcttattcct tccaccgtta gctgagaagt ggattacacc atcaatagaa 660 tcatctaccc cgttcttgcc tggactaatg cgtcaggagc tcttggataa aggagaaata 720 gctgagcaga ccatcacctt ggatgatgtc cgtctgtggc tgaactccgg aggtcgagtg 780 gcgtgctgca acgcacttcg aggaatttgg gaagtgaacc tcgtttggag tgataaatga 840 gattacgaaa gtctgttcga aacatccatg cttcatgata accgataacg cttaaatctt 900 gagagtgcgc acatcgatcg ccttttatat atggggttgg ggaaacataa agtgttcata 960 gactattgtt catatatctt aaagtacaaa gacgcatcta accctaagcc tgaatgattg 1020 gcaaaatcct agtaagaccg tgaaattccg aagaatacgc agttcattaa taaagatata 1080 gcttaggtaa gcagcggttg ctcccccaac caacctcatc cgaaattccc cagggggttg 1140 agattctcaa ggctttgaat ccccatcccg tcaagttggt cttaaaccct tcatctctac 1200 ttgttacttc ttttcttctt gacctccttc ccccactccc tcctattctc tgaacgaact 1260 cgcctccctg tccatctact cttcttcggt tttcttttgg gtttttactt ttctcgttcc 1320 tcctccatct ttccatctct tttcgtatct gtgggtaact ttgcatccaa gggccctcac 1380 acataaccct atatccatct tcctccattc acacacatct gtactcaacc aacaaagctc 1440 acaag atg gtt gtc gat cac gag agc gta agg cat ttc atc g 1482 Met Val Val Asp His Glu Ser Val Arg His Phe Ile 1 5 10 gtaagcgttc ttgttctttt ccttgtctgg ctccctgcat tttcttaaac gatctaggaa 1542 gagagggaaa ttacatctgg tcaattttcc gcgctctttt ccttggggac aaaagaatgc 1602 ctttctgtga tcggagatcg gttgctgatc tcttttgtct tgttcttttt gctctttccc 1662 tcccctttac cag gt gga aac gca ctt gag aac gcc cct ccg tca agc 1710 Gly Gly Asn Ala Leu Glu Asn Ala Pro Pro Ser Ser 15 20 gtc acc gat ttc gtt aga agt caa gat ggt cac acg gtc atc acc aaa 1758 Val Thr Asp Phe Val Arg Ser Gln Asp Gly His Thr Val Ile Thr Lys 25 30 35 40 gtcagtaatt ttcatttttt ccttcacgta gcctcagggc caaggagcta aattgcttct 1818 gtatcatttc tcag gtc ctc att gcc aac aac gga atc gct gct gta aaa 1868 Val Leu Ile Ala Asn Asn Gly Ile Ala Ala Val Lys 45 50 gag atc cga tca gtt cgt aaa tgg gct tac gag acg ttt gga gat gag 1916 Glu Ile Arg Ser Val Arg Lys Trp Ala Tyr Glu Thr Phe Gly Asp Glu 55 60 65 cga gcc atc gaa ttt acg gta atg gcc act cca gaa gat tt 1957 Arg Ala Ile Glu Phe Thr Val Met Ala Thr Pro Glu Asp Leu 70 75 80 gttcgtacca atcacataag ctttccttga gtcagggaca tcctctaatt aattcaactt 2017 gagcgccata cag g aag gtg aac tgc gac tat att cga atg gct gat cga 2067 Lys Val Asn Cys Asp Tyr Ile Arg Met Ala Asp Arg 85 90 gtc gtc gaa gtt cct gga gga act aac aac aac aat cac tct aac gtc 2115 Val Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn His Ser Asn Val 95 100 105 110 gac ctc atc gtt gac att gcc gag cga ttc aat ata cat gct gtt tgg 2163 Asp Leu Ile Val Asp Ile Ala Glu Arg Phe Asn Ile His Ala Val Trp 115 120 125 gct gga tg gtaagtaaaa taggacctta acatgttgga agaagagtgt 2211 Ala Gly Trp ccacttaaac gcgctttctt tccatccgac ag g ggt cac gct tcg gaa aac ccc 2265 Gly His Ala Ser Glu Asn Pro 130 135 aga ctt ccc gag tct ctc gcc gcc tca aag aac aag atc gtc ttc att 2313 Arg Leu Pro Glu Ser Leu Ala Ala Ser Lys Asn Lys Ile Val Phe Ile 140 145 150 ggt cct ccc gga tcc gct atg cga tcc ctt gga gac aag att tct tcg 2361 Gly Pro Pro Gly Ser Ala Met Arg Ser Leu Gly Asp Lys Ile Ser Ser 155 160 165 acc atc gtt gcc cag tct gcc cag gtg ccg tgt atg gcc tgg tct gga 2409 Thr Ile Val Ala Gln Ser Ala Gln Val Pro Cys Met Ala Trp Ser Gly 170 175 180 tca ggc atc act gat aca gag ctc agc cct cag ggc ttc gtg act gtg 2457 Ser Gly Ile Thr Asp Thr Glu Leu Ser Pro Gln Gly Phe Val Thr Val 185 190 195 200 ccc gat ggg cca tat cag gct gct tgt gta aag acg gtg gag gat ggt 2505 Pro Asp Gly Pro Tyr Gln Ala Ala Cys Val Lys Thr Val Glu Asp Gly 205 210 215 ttg gtg cga gcc gag aag atc ggt ttg cca gtt atg atc aag gcc tct 2553 Leu Val Arg Ala Glu Lys Ile Gly Leu Pro Val Met Ile Lys Ala Ser 220 225 230 gag gga gga gga gga aag ggt atc cga atg gtt cac agc atg gac aca 2601 Glu Gly Gly Gly Gly Lys Gly Ile Arg Met Val His Ser Met Asp Thr 235 240 245 ttc aag aac tcc tac aac tcc gtc gct tcc gag gtg cca g gtaagttcac 2651 Phe Lys Asn Ser Tyr Asn Ser Val Ala Ser Glu Val Pro 250 255 260 tctgtttgac tggagatttg agcacaatct ctaccatggg agttcaagaa ggaataccca 2711 ctcatgaatt gacgactgcg ttcttgacct ctag ga tct ccg att ttc atc atg 2765 Gly Ser Pro Ile Phe Ile Met 265 gcc ttg gct gga tct gct cga cat ttg gag gtc cag ctc ctt gct gat 2813 Ala Leu Ala Gly Ser Ala Arg His Leu Glu Val Gln Leu Leu Ala Asp 270 275 280 cag tac gga aac gct atc tct ttg ttc ggt cga gat tgc tct gtt cag 2861 Gln Tyr Gly Asn Ala Ile Ser Leu Phe Gly Arg Asp Cys Ser Val Gln 285 290 295 300 cga cga cat cag aag atc att gag gag gct ccc gtc acg atc gct cgt 2909 Arg Arg His Gln Lys Ile Ile Glu Glu Ala Pro Val Thr Ile Ala Arg 305 310 315 cca gag aga ttc gaa gag atg gag aag gct gct gtc agg ttg gcc aag 2957 Pro Glu Arg Phe Glu Glu Met Glu Lys Ala Ala Val Arg Leu Ala Lys 320 325 330 tta gta gga tat gtt agt gcc ggt acc gtc gaa t gtaaggaaca 3001 Leu Val Gly Tyr Val Ser Ala Gly Thr Val Glu 335 340 aacagctacc tctcattctg ttttttcgag atagtcaact tacatcactt ttcttttgcc 3061 ggattttctt tag ac ctc tac tct cac gcc gac gac tca ttc ttc ttc 3109 Tyr Leu Tyr Ser His Ala Asp Asp Ser Phe Phe Phe 345 350 355 ctc gaa ctc aac cct cga ctt caa gtc gag cac cct act acc gag atg 3157 Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Thr Thr Glu Met 360 365 370 gtc tcg ggt gtc aac ctt ccc gct gct cag ctt cag att gct atg ggt 3205 Val Ser Gly Val Asn Leu Pro Ala Ala Gln Leu Gln Ile Ala Met Gly 375 380 385 atc cct ctt tct cga att cgg gat att cga gtc ctc tac ggt ctc gat 3253 Ile Pro Leu Ser Arg Ile Arg Asp Ile Arg Val Leu Tyr Gly Leu Asp 390 395 400 ccc cac act gtt tcc gag atc gac ttc gac agc agc aga gcg gag tct 3301 Pro His Thr Val Ser Glu Ile Asp Phe Asp Ser Ser Arg Ala Glu Ser 405 410 415 gtc cag act cag agg aag cct agg ccc aag ggt cac gtc att gcc tgt 3349 Val Gln Thr Gln Arg Lys Pro Arg Pro Lys Gly His Val Ile Ala Cys 420 425 430 435 cga atc acg agt gaa aac ccc gat gag ggg ttc aag ccg tct gcc gga 3397 Arg Ile Thr Ser Glu Asn Pro Asp Glu Gly Phe Lys Pro Ser Ala Gly 440 445 450 gat atc caa gag ttg aac ttc aga agt aat act aac gtc tgg gga t 3443 Asp Ile Gln Glu Leu Asn Phe Arg Ser Asn Thr Asn Val Trp Gly 455 460 465 gtgagtacag aggcttctca aagattctta tgtggaacaa atctctgact cttaaattgt 3503 gtttgacttt caag ac ttc tct gtt gga gct act gga gga att cat agt 3552 Tyr Phe Ser Val Gly Ala Thr Gly Gly Ile His Ser 470 475 gtaagtttct tcgccaacaa tataatcaca ctagatccct atctaatctg aactggctta 3612 tctcttgtta tag ttc gcc gat tct caa ttc ggt cac gtg ttt gct tat 3661 Phe Ala Asp Ser Gln Phe Gly His Val Phe Ala Tyr 480 485 490 ggc tcc gac cga acg act gcc aga aag aat atg gtt atc gcc ttg aaa 3709 Gly Ser Asp Arg Thr Thr Ala Arg Lys Asn Met Val Ile Ala Leu Lys 495 500 505 gag ctt tcc att cga gga gac ttc cga acc act gtc gag ta 3750 Glu Leu Ser Ile Arg Gly Asp Phe Arg Thr Thr Val Glu Tyr 510 515 gtgcgtatag cctggtacat ctcctttcaa tcacttacga tgaactgacc gatctgtctc 3810 gatcacgttt aatctag t ctt atc act ctt ctt gag acg agc gat ttc gag 3861 Leu Ile Thr Leu Leu Glu Thr Ser Asp Phe Glu 525 530 cag aac gcc att acc acc gct tgg ttg gat ggg ttg atc act aac aag 3909 Gln Asn Ala Ile Thr Thr Ala Trp Leu Asp Gly Leu Ile Thr Asn Lys 535 540 545 ctt aca tct gag agg cct gat cca tca ctg gcc gtt att tgt ggt gca 3957 Leu Thr Ser Glu Arg Pro Asp Pro Ser Leu Ala Val Ile Cys Gly Ala 550 555 560 att gtg aaa gct cac gtg gct tct gag aac tgt tgg gcc gaa tac cga 4005 Ile Val Lys Ala His Val Ala Ser Glu Asn Cys Trp Ala Glu Tyr Arg 565 570 575 cga gta ttg gac aag gga cag gtaagctctg tttctcatga agtttttgac 4056 Arg Val Leu Asp Lys Gly Gln 580 585 tgaggcactc accactccgt acatgtttcc tgtttttag gtt ccc tcc aag gac 4110 Val Pro Ser Lys Asp 590 act ctc aag aca gtg ttc act ctt gat ttc atc tat gag ggt gtt cgg 4158 Thr Leu Lys Thr Val Phe Thr Leu Asp Phe Ile Tyr Glu Gly Val Arg 595 600 605 tac aat ttc acc gct gct cga gcc tcc ctc aac act tac cga ttg tat 4206 Tyr Asn Phe Thr Ala Ala Arg Ala Ser Leu Asn Thr Tyr Arg Leu Tyr 610 615 620 cta aac gga gga aag acc gtg gtg tcc atc cga cct ttg gcc gat ggt 4254 Leu Asn Gly Gly Lys Thr Val Val Ser Ile Arg Pro Leu Ala Asp Gly 625 630 635 gga atg ctc gtt ctt ctc gat ggc cga tcc cac act ctc tac tgg agg 4302 Gly Met Leu Val Leu Leu Asp Gly Arg Ser His Thr Leu Tyr Trp Arg 640 645 650 655 gag gaa gtc ggt acc ctc cga att cag gta gac gca aag act tgc ctg 4350 Glu Glu Val Gly Thr Leu Arg Ile Gln Val Asp Ala Lys Thr Cys Leu 660 665 670 att gag cag gag aac gac ccc act cag ctc cga tca ccc tcg cct gga 4398 Ile Glu Gln Glu Asn Asp Pro Thr Gln Leu Arg Ser Pro Ser Pro Gly 675 680 685 aag atc atc cgg ttt ttg gtc gaa agc gga gat cac atc tcc tcc gga 4446 Lys Ile Ile Arg Phe Leu Val Glu Ser Gly Asp His Ile Ser Ser Gly 690 695 700 gat atc tat gct gag gtt gag gtc atg aag atg atc ttg ccc ttg att 4494 Asp Ile Tyr Ala Glu Val Glu Val Met Lys Met Ile Leu Pro Leu Ile 705 710 715 gcc cag gag tcc ggt cac gtt cag ttt gtc aag caa gcc ggt gtg acc 4542 Ala Gln Glu Ser Gly His Val Gln Phe Val Lys Gln Ala Gly Val Thr 720 725 730 735 gtc gat cct gga gcg att att ggg atc ttg agt ctt gat gac cct acg 4590 Val Asp Pro Gly Ala Ile Ile Gly Ile Leu Ser Leu Asp Asp Pro Thr 740 745 750 cga gtg aag aag gcg aag ccc ttc gag ggt ctc ctg cct gtg act ggt 4638 Arg Val Lys Lys Ala Lys Pro Phe Glu Gly Leu Leu Pro Val Thr Gly 755 760 765 ctc cct aac ctg ccc ggt aac aga cct cac cag cgg cta cag ttc cag 4686 Leu Pro Asn Leu Pro Gly Asn Arg Pro His Gln Arg Leu Gln Phe Gln 770 775 780 ctt gag tcg ata tac tcg gtc ttg gat gga tac gag agt gac tcc act 4734 Leu Glu Ser Ile Tyr Ser Val Leu Asp Gly Tyr Glu Ser Asp Ser Thr 785 790 795 gca aca atc ctc cga tca ttc tct gaa aac ctt tat gat cct gat ctt 4782 Ala Thr Ile Leu Arg Ser Phe Ser Glu Asn Leu Tyr Asp Pro Asp Leu 800 805 810 815 gct ttc gga gag gct tta tcc atc att tcc gtc ctt tct ggg aga atg 4830 Ala Phe Gly Glu Ala Leu Ser Ile Ile Ser Val Leu Ser Gly Arg Met 820 825 830 cct gcc gat ctt gag gag agc att cga gag gtc atc agc gaa gct cag 4878 Pro Ala Asp Leu Glu Glu Ser Ile Arg Glu Val Ile Ser Glu Ala Gln 835 840 845 tcg aag cct cac gcc gag ttc cct gga tca aag gtgtgtagtt gatcgcagag 4931 Ser Lys Pro His Ala Glu Phe Pro Gly Ser Lys 850 855 ttatgactgt atacatcgac cagaagctta cccatctctt tcgtgtgcac ag atc ctc 4989 Ile Leu 860 aaa gtc gtc gag cgg tac atc gat aat ttg cga cct cag gag agg gct 5037 Lys Val Val Glu Arg Tyr Ile Asp Asn Leu Arg Pro Gln Glu Arg Ala 865 870 875 atg gtc cga act cag atc gaa ccc atc gtt ggt att gct gag aag aac 5085 Met Val Arg Thr Gln Ile Glu Pro Ile Val Gly Ile Ala Glu Lys Asn 880 885 890 gtt ggc ggt cct aag ggt tac gcc tct tac gtc tta gct acc atc ctt 5133 Val Gly Gly Pro Lys Gly Tyr Ala Ser Tyr Val Leu Ala Thr Ile Leu 895 900 905 caa aag ttc ttg gcc gtt gag gcc gtt ttt gct act ggt agt gaa gag 5181 Gln Lys Phe Leu Ala Val Glu Ala Val Phe Ala Thr Gly Ser Glu Glu 910 915 920 gcc att gtt ctc caa ctt cga gat gaa aac cga gaa tct ttg aac gac 5229 Ala Ile Val Leu Gln Leu Arg Asp Glu Asn Arg Glu Ser Leu Asn Asp 925 930 935 940 gtc ctt ggt ctc gtc ctg gct cac tcg cgt ctc agc gct cga tcc aag 5277 Val Leu Gly Leu Val Leu Ala His Ser Arg Leu Ser Ala Arg Ser Lys 945 950 955 ctt gtt ctc tcc gtc ttt gat ctg atc aag tct atg cag ctc ctc aac 5325 Leu Val Leu Ser Val Phe Asp Leu Ile Lys Ser Met Gln Leu Leu Asn 960 965 970 aac act gag ggt tct ttc ctt cat aag act atg aaa gcg ctt gcc gac 5373 Asn Thr Glu Gly Ser Phe Leu His Lys Thr Met Lys Ala Leu Ala Asp 975 980 985 atg ccc acc aa gtaggtttcc tcttgtagtt tacaaactat tgttgcgatg 5424 Met Pro Thr Lys 990 tgttgacaaa gactctgttt ccgatctata g g gct cct ttg gcc agc aag gtg 5477 Ala Pro Leu Ala Ser Lys Val 995 tct ttg aag gct cgg gaa att ctt atc tct tgc tct ctt ccc tct 5522 Ser Leu Lys Ala Arg Glu Ile Leu Ile Ser Cys Ser Leu Pro Ser 1000 1005 1010 tac gag gag agg ttg ttc cag atg gaa aag atc ctt aac tct tct 5567 Tyr Glu Glu Arg Leu Phe Gln Met Glu Lys Ile Leu Asn Ser Ser 1015 1020 1025 gtc acc act tct tac tac gga gag act gga ggt gga cac ag 5608 Val Thr Thr Ser Tyr Tyr Gly Glu Thr Gly Gly Gly His Arg 1030 1035 1040 gtttgtcctc tcccatgtgt ttctagttca tagctctctg ctgactctga tccgattttc 5668 aacag a aac cct tcg gtt gat gtt ctg act gag atc tca aac tct 5713 Asn Pro Ser Val Asp Val Leu Thr Glu Ile Ser Asn Ser 1045 1050 1055 cga ttc acc gtc tac gat gtc ctg tcc tcc ttc ttc aag cac gat 5758 Arg Phe Thr Val Tyr Asp Val Leu Ser Ser Phe Phe Lys His Asp 1060 1065 1070 gat cct tgg att gtt ctt gct agt ttg acc gtc tac gtt ctt cga 5803 Asp Pro Trp Ile Val Leu Ala Ser Leu Thr Val Tyr Val Leu Arg 1075 1080 1085 gc gtaagtgatc gttcttctcc tcttgcccaa acaatgactg acagttctat 5855 Ala ctattccatc tgcag t tac cga gag tac agt att ctt gat atg caa cat 5904 Tyr Arg Glu Tyr Ser Ile Leu Asp Met Gln His 1090 1095 gag caa ggt cag gat ggc gct gct gga gtc atc act tgg cga ttc 5949 Glu Gln Gly Gln Asp Gly Ala Ala Gly Val Ile Thr Trp Arg Phe 1100 1105 1110 aag ctc aac cag ccc atc gct gag tct tct act ccc cga gtt gac 5994 Lys Leu Asn Gln Pro Ile Ala Glu Ser Ser Thr Pro Arg Val Asp 1115 1120 1125 tcg aat cga gac gtt tac cga gtc ggt tcg ctt tct gat ttg acc 6039 Ser Asn Arg Asp Val Tyr Arg Val Gly Ser Leu Ser Asp Leu Thr 1130 1135 1140 tac aag atc aag cag agt cag acc gag ccc ctc cga gct ggt gtc 6084 Tyr Lys Ile Lys Gln Ser Gln Thr Glu Pro Leu Arg Ala Gly Val 1145 1150 1155 atg acg agc ttc aac aac ttg aag gag gtt cag gac gga ctc ttg 6129 Met Thr Ser Phe Asn Asn Leu Lys Glu Val Gln Asp Gly Leu Leu 1160 1165 1170 aat gtt ctg tct ttc ttc cct gct tac cat cat caa gat ttc act 6174 Asn Val Leu Ser Phe Phe Pro Ala Tyr His His Gln Asp Phe Thr 1175 1180 1185 caa cga cat ggt cag gac agt gcc atg ccc aac gtt ctc aac att 6219 Gln Arg His Gly Gln Asp Ser Ala Met Pro Asn Val Leu Asn Ile 1190 1195 1200 gct atc cgg gct ttc gag gag aag gac gac atg tct gat ctt gat 6264 Ala Ile Arg Ala Phe Glu Glu Lys Asp Asp Met Ser Asp Leu Asp 1205 1210 1215 tgg gcc aag agt gtt gag tcg ctg gta atg cag atg tct gcc gag 6309 Trp Ala Lys Ser Val Glu Ser Leu Val Met Gln Met Ser Ala Glu 1220 1225 1230 atc cag aag aag gga att cga cga gtt acc ttc ttg gtt tgc cga 6354 Ile Gln Lys Lys Gly Ile Arg Arg Val Thr Phe Leu Val Cys Arg 1235 1240 1245 aag ggc gtt tac ccc tcc tac ttc acc ttc aga caa gag ggt gcc 6399 Lys Gly Val Tyr Pro Ser Tyr Phe Thr Phe Arg Gln Glu Gly Ala 1250 1255 1260 cag ggc ccc tgg aga gag gag gag aag att cga aac atc gag cct 6444 Gln Gly Pro Trp Arg Glu Glu Glu Lys Ile Arg Asn Ile Glu Pro 1265 1270 1275 gct cta gcc agt cag ctt gag ctc aac cga ctc tcg aat ttc aag 6489 Ala Leu Ala Ser Gln Leu Glu Leu Asn Arg Leu Ser Asn Phe Lys 1280 1285 1290 gtc acc cct atc ttc gta gac aac aga cag atc cac atc tac aag 6534 Val Thr Pro Ile Phe Val Asp Asn Arg Gln Ile His Ile Tyr Lys 1295 1300 1305 gga gtg ggt aag gag aac tct tcc gat gtt cga ttc ttt atc cgg 6579 Gly Val Gly Lys Glu Asn Ser Ser Asp Val Arg Phe Phe Ile Arg 1310 1315 1320 gct ttg gtt cga cct gga cgg gtc cag gga tcg atg aag gct gcc 6624 Ala Leu Val Arg Pro Gly Arg Val Gln Gly Ser Met Lys Ala Ala 1325 1330 1335 gag tat ctc atc tcc gag tgc gat cga ctg ctc act gat atc ctg 6669 Glu Tyr Leu Ile Ser Glu Cys Asp Arg Leu Leu Thr Asp Ile Leu 1340 1345 1350 gac gcc ttg gag gtt gtt gga gcc gag act cga aac gcc gat tgc 6714 Asp Ala Leu Glu Val Val Gly Ala Glu Thr Arg Asn Ala Asp Cys 1355 1360 1365 aac cat gtt gga att aac ttc atc tat aac gtt ctt gtc gac ttc 6759 Asn His Val Gly Ile Asn Phe Ile Tyr Asn Val Leu Val Asp Phe 1370 1375 1380 gac gac gtc cag gag gcc ctt gcc ggg ttc att gag agg cac gga 6804 Asp Asp Val Gln Glu Ala Leu Ala Gly Phe Ile Glu Arg His Gly 1385 1390 1395 aag agg ctt tgg cga ctt cga gtg acc g gtaagtgttc tctcggcatt 6852 Lys Arg Leu Trp Arg Leu Arg Val Thr 1400 1405 gaattcagca atgagctgtg actaacgggt ttcttcggta tattag ct tct gaa 6906 Ala Ser Glu 1410 atc cga atg gtt ctt gag gac gac gag ggt aac gtc acc ccc atc 6951 Ile Arg Met Val Leu Glu Asp Asp Glu Gly Asn Val Thr Pro Ile 1415 1420 1425 cga tgc tgc att gag aac gtt tct g gtaagcagtc caaaataact 6996 Arg Cys Cys Ile Glu Asn Val Ser 1430 gataatccta ttcagtctag acattgtaac tgatgcattt ctcgttctta g gt ttc 7052 Gly Phe 1435 gtc gtg aag tac cac gcc tac cag gag gtt gag acc gag aag ggt 7097 Val Val Lys Tyr His Ala Tyr Gln Glu Val Glu Thr Glu Lys Gly 1440 1445 1450 act acc atc ttg aag tca atc gga gac ctt gga cct ctt cac ctt 7142 Thr Thr Ile Leu Lys Ser Ile Gly Asp Leu Gly Pro Leu His Leu 1455 1460 1465 cag cct gtc aac cat gct tac cag acc aag aac agt ctt cag ccc 7187 Gln Pro Val Asn His Ala Tyr Gln Thr Lys Asn Ser Leu Gln Pro 1470 1475 1480 cga cga tac cag gct cac ttg gtt gga acg act tac gtc t 7227 Arg Arg Tyr Gln Ala His Leu Val Gly Thr Thr Tyr Val 1485 1490 gttagtcaca tttcatgctc tggttttctg accgtcactg gttattgacg ttctgtttgg 7287 cgtcacag ac gac tac ccc gat ctc ttc gtt cag agt ttg cgc aag 7333 Tyr Asp Tyr Pro Asp Leu Phe Val Gln Ser Leu Arg Lys 1495 1500 1505 gtt tgg gct gag gct gct gct aag att cct cac ctc cgg gtg cct 7378 Val Trp Ala Glu Ala Ala Ala Lys Ile Pro His Leu Arg Val Pro 1510 1515 1520 agc gag cct ctt acc gct acc gag ttg gtt ctc gat gag aac aac 7423 Ser Glu Pro Leu Thr Ala Thr Glu Leu Val Leu Asp Glu Asn Asn 1525 1530 1535 gag ctt cag gag gtc gag cga cct ccg ggt tcc aac tcg tgt ggt 7468 Glu Leu Gln Glu Val Glu Arg Pro Pro Gly Ser Asn Ser Cys Gly 1540 1545 1550 atg gtc gcc tgg atc ttc act atg ctc act ccc gag tat ccc aag 7513 Met Val Ala Trp Ile Phe Thr Met Leu Thr Pro Glu Tyr Pro Lys 1555 1560 1565 ggt cga cga gta gtt gcc att gcc aac gat atc acc ttc aag att 7558 Gly Arg Arg Val Val Ala Ile Ala Asn Asp Ile Thr Phe Lys Ile 1570 1575 1580 gga tcc ttt ggt cct aag gaa gac gat tac ttc ttc aag gct act 7603 Gly Ser Phe Gly Pro Lys Glu Asp Asp Tyr Phe Phe Lys Ala Thr 1585 1590 1595 gaa att gcc aag aag ctg ggc ctt cct cga att tac ctc tct gcc 7648 Glu Ile Ala Lys Lys Leu Gly Leu Pro Arg Ile Tyr Leu Ser Ala 1600 1605 1610 aac agt gga gct aga ctc ggt atc gcg gag gag ctc ttg cac atc 7693 Asn Ser Gly Ala Arg Leu Gly Ile Ala Glu Glu Leu Leu His Ile 1615 1620 1625 ttc aag gcg gcc ttc gtt gac ccc gca aag cct tcc atg ggt att 7738 Phe Lys Ala Ala Phe Val Asp Pro Ala Lys Pro Ser Met Gly Ile 1630 1635 1640 aag tat cta tac ttg acc cct gaa act tta tcc act ctt gcc aag 7783 Lys Tyr Leu Tyr Leu Thr Pro Glu Thr Leu Ser Thr Leu Ala Lys 1645 1650 1655 aag gga tcc agc gtc acc act gag gag atc gag gat gac ggc gag 7828 Lys Gly Ser Ser Val Thr Thr Glu Glu Ile Glu Asp Asp Gly Glu 1660 1665 1670 cga cga cac aag atc acc gcc atc atc ggt ctt gca gag ggt ttg 7873 Arg Arg His Lys Ile Thr Ala Ile Ile Gly Leu Ala Glu Gly Leu 1675 1680 1685 gga gtt gag tct ctt cga gga tcc ggt ctt att gct gga gcc acc 7918 Gly Val Glu Ser Leu Arg Gly Ser Gly Leu Ile Ala Gly Ala Thr 1690 1695 1700 act cga gct tac gag gag gga atc ttc acc atc tct ctc gtt act 7963 Thr Arg Ala Tyr Glu Glu Gly Ile Phe Thr Ile Ser Leu Val Thr 1705 1710 1715 gcc cga tcg gtc ggt atc gga gct tac ttg gtt cga ttg ggt cag 8008 Ala Arg Ser Val Gly Ile Gly Ala Tyr Leu Val Arg Leu Gly Gln 1720 1725 1730 cga gct att cag gtt gaa ggc aac cct atg atc ctt act gga gct 8053 Arg Ala Ile Gln Val Glu Gly Asn Pro Met Ile Leu Thr Gly Ala 1735 1740 1745 cag tct ctc aac aag gtg ctt gga cga gag gtt tac act tcc aac 8098 Gln Ser Leu Asn Lys Val Leu Gly Arg Glu Val Tyr Thr Ser Asn 1750 1755 1760 ctt cag ctt gga gga acc cag att atg gcc cga aac ggt acc acg 8143 Leu Gln Leu Gly Gly Thr Gln Ile Met Ala Arg Asn Gly Thr Thr 1765 1770 1775 cat ctc gtc gct gaa tct gat ctc gat ggt gct ctc aag gtc atc 8188 His Leu Val Ala Glu Ser Asp Leu Asp Gly Ala Leu Lys Val Ile 1780 1785 1790 cag tgg ctc tcg tat gtg ccc gag cga aag ggc aag gcc att cct 8233 Gln Trp Leu Ser Tyr Val Pro Glu Arg Lys Gly Lys Ala Ile Pro 1795 1800 1805 atc tgg cct tcc gag gac cct tgg gac cga act gtg acc tac gag 8278 Ile Trp Pro Ser Glu Asp Pro Trp Asp Arg Thr Val Thr Tyr Glu 1810 1815 1820 cct ccc cga ggt cct tac gat cct cga tgg ttg ctt gaa gga aag 8323 Pro Pro Arg Gly Pro Tyr Asp Pro Arg Trp Leu Leu Glu Gly Lys 1825 1830 1835 ccg gat gaa ggc ttg act ggt ctt ttc gac aag gga tct ttc atg 8368 Pro Asp Glu Gly Leu Thr Gly Leu Phe Asp Lys Gly Ser Phe Met 1840 1845 1850 gag acc ctt gga gat tgg gcc aag act atc gtc acc ggt cga gcc 8413 Glu Thr Leu Gly Asp Trp Ala Lys Thr Ile Val Thr Gly Arg Ala 1855 1860 1865 cga ctg gga ggc att cct atg ggt gtt att gct gtc gaa acc agg 8458 Arg Leu Gly Gly Ile Pro Met Gly Val Ile Ala Val Glu Thr Arg 1870 1875 1880 acg acc gag aag atc atc gct gcc gat cct gcc aac cct gca gct 8503 Thr Thr Glu Lys Ile Ile Ala Ala Asp Pro Ala Asn Pro Ala Ala 1885 1890 1895 ttc gag caa aag att atg gag gct ggt cag gtt tgg aac ccc aac 8548 Phe Glu Gln Lys Ile Met Glu Ala Gly Gln Val Trp Asn Pro Asn 1900 1905 1910 gct gct tac aag acc gct caa tcc atc ttt gat atc aac aag gag 8593 Ala Ala Tyr Lys Thr Ala Gln Ser Ile Phe Asp Ile Asn Lys Glu 1915 1920 1925 ggt ctt cct ttg atg atc ctt gcc aac atc cga ggt ttc tct gga 8638 Gly Leu Pro Leu Met Ile Leu Ala Asn Ile Arg Gly Phe Ser Gly 1930 1935 1940 gga cag ggt gat atg ttt gac gct atc ctc aag cag ggt tct aag 8683 Gly Gln Gly Asp Met Phe Asp Ala Ile Leu Lys Gln Gly Ser Lys 1945 1950 1955 atc gtt gac ggt ctc tcg aac ttc aag cag cca gtg ttc gtc tat 8728 Ile Val Asp Gly Leu Ser Asn Phe Lys Gln Pro Val Phe Val Tyr 1960 1965 1970 gtt gtc ccc aac gga gag ctt cgt gga gga gct tgg gtc gtg ttg 8773 Val Val Pro Asn Gly Glu Leu Arg Gly Gly Ala Trp Val Val Leu 1975 1980 1985 gat cct act atc aac ctt gcc aag atg gag atg tac gct gat gaa 8818 Asp Pro Thr Ile Asn Leu Ala Lys Met Glu Met Tyr Ala Asp Glu 1990 1995 2000 acc gct cga gga gga att ctc gag ccg gaa ggt atc gtt gag atc 8863 Thr Ala Arg Gly Gly Ile Leu Glu Pro Glu Gly Ile Val Glu Ile 2005 2010 2015 aag ttc cga cga gac aag gtc atc gct acc atg gag cga ttg gac 8908 Lys Phe Arg Arg Asp Lys Val Ile Ala Thr Met Glu Arg Leu Asp 2020 2025 2030 gag acc tat gcc tct ctc aaa gct gcc tcg aac gac tca acc aag 8953 Glu Thr Tyr Ala Ser Leu Lys Ala Ala Ser Asn Asp Ser Thr Lys 2035 2040 2045 tct gcg gag gag cga gct aag agt gct gag cta ctc aag gca aga 8998 Ser Ala Glu Glu Arg Ala Lys Ser Ala Glu Leu Leu Lys Ala Arg 2050 2055 2060 gag act cta ctt caa ccg acg tac ttg cag att gca cac ctt tac 9043 Glu Thr Leu Leu Gln Pro Thr Tyr Leu Gln Ile Ala His Leu Tyr 2065 2070 2075 gct gat ctc cat gat cgt gtc gga cga atg gag gcc aag ggt tgc 9088 Ala Asp Leu His Asp Arg Val Gly Arg Met Glu Ala Lys Gly Cys 2080 2085 2090 gcg aag cga gct gtc tgg gct gag gct cga cga ttc ttc tac tgg 9133 Ala Lys Arg Ala Val Trp Ala Glu Ala Arg Arg Phe Phe Tyr Trp 2095 2100 2105 cga ctt cga cga cgt ctc aac gat gag gtgagccgtc ccattcactc 9180 Arg Leu Arg Arg Arg Leu Asn Asp Glu 2110 2115 tttcgttgca aggttcagta gtactaaccg cttctttctt tatctatcag cac atc 9236 His Ile ctg tct aag ttc gct gct gcc aac ccg gat ctt act ctc gag gag 9281 Leu Ser Lys Phe Ala Ala Ala Asn Pro Asp Leu Thr Leu Glu Glu 2120 2125 2130 cga caa aac att ctc gac tct gtc gtc cag act gac ctc act gat 9326 Arg Gln Asn Ile Leu Asp Ser Val Val Gln Thr Asp Leu Thr Asp 2135 2140 2145 gac cga gcc acc gct gaa tgg att gag cag tct gca gaa gag att 9371 Asp Arg Ala Thr Ala Glu Trp Ile Glu Gln Ser Ala Glu Glu Ile 2150 2155 2160 gct gct gcc gtt gcc gaa gtc cga tcc acc tac gtg tcg aat aag 9416 Ala Ala Ala Val Ala Glu Val Arg Ser Thr Tyr Val Ser Asn Lys 2165 2170 2175 att atc agc ttc gcc gag acg gag cga gct gga gcg ttg cag ggc 9461 Ile Ile Ser Phe Ala Glu Thr Glu Arg Ala Gly Ala Leu Gln Gly 2180 2185 2190 ttg gtc gct gtc ttg agc act ttg aat gcg gaa gac aag aag gcc 9506 Leu Val Ala Val Leu Ser Thr Leu Asn Ala Glu Asp Lys Lys Ala 2195 2200 2205 ctt gtt tct agc ctt ggt ctc taa attttaattt tttttgtcga tgctattctt 9560 Leu Val Ser Ser Leu Gly Leu 2210 cctatcttta gtctttgatt aacttttgaa tatccttcat agatctttcc ttgcatacat 9620 tgatattatt tcctcacccg tttttatgta cttccatacg agtttccatt tttttctgct 9680 tttatatttc gactacacgt cgactgttca cctgcctctc ttttgttctt tctgttctgt 9740 tttcttctgt tctttcgcct cttgggattc tatattctcc ttcgcattta catatgctca 9800 tgttaatgtc tgactcagag ttcactagga tatgtcgtga gagcccgaaa caagttgcac 9860 aacatatatt gataatgatc agaacactct aagaccaccc agtccatgat cagccgcatc 9920 gccagtttcg atctcttctc cattctcatc aacctcaatc tcctcccgga tcgtcctgcc 9980 cagcagactg ccgaataact cgtcgacctg ctcctcctgc cacaagtctt ccgttcgctc 10040 aggaaccatg aagttcatga tcttttcttg gggggtatat cgaagcttgc gacctttaga 10100 agctcgtgta tcgagggtgg gcttgtgctt tttgggtccg taattggaaa aggttgcttg 10160 gcctatttca aaataaacga aattgatgat tatacaccgc cgtagaccgt ttctggtcag 10220 gattttgtgt tggacgatga tataccgatc gatgtttgag cagacaaggg agttaggaag 10280 agactactta ccactcatag cgccgactcc agcacctcca cctcttcgct cgatgacgtc 10340 tctgaccaag ctctggtaaa actctttgtc atcaccccaa acggcggcct cacattcagc 10400 ctcatcctga gagacgagtc ccatgaaccg atctactttt ttcctaccct ctagaccctc 10460 aagggaagct ccaatttgct cgacgactcc gatcttgacg gatttaaact tttcacctcg 10520 aagattctga aggccttgag cggtcataat cttggaagac c 10561 <210> 2 <211> 6645 <212> DNA <213> Phaffia rhodozyma <220> <221> CDS <222> (1)..(6645) <400> 2 atg gtt gtc gat cac gag agc gta agg cat ttc atc ggt gga aac gca 48 Met Val Val Asp His Glu Ser Val Arg His Phe Ile Gly Gly Asn Ala 1 5 10 15 ctt gag aac gcc cct ccg tca agc gtc acc gat ttc gtt aga agt caa 96 Leu Glu Asn Ala Pro Pro Ser Ser Val Thr Asp Phe Val Arg Ser Gln 20 25 30 gat ggt cac acg gtc atc acc aaa gtc ctc att gcc aac aac gga atc 144 Asp Gly His Thr Val Ile Thr Lys Val Leu Ile Ala Asn Asn Gly Ile 35 40 45 gct gct gta aaa gag atc cga tca gtt cgt aaa tgg gct tac gag acg 192 Ala Ala Val Lys Glu Ile Arg Ser Val Arg Lys Trp Ala Tyr Glu Thr 50 55 60 ttt gga gat gag cga gcc atc gaa ttt acg gta atg gcc act cca gaa 240 Phe Gly Asp Glu Arg Ala Ile Glu Phe Thr Val Met Ala Thr Pro Glu 65 70 75 80 gat ttg aag gtg aac tgc gac tat att cga atg gct gat cga gtc gtc 288 Asp Leu Lys Val Asn Cys Asp Tyr Ile Arg Met Ala Asp Arg Val Val 85 90 95 gaa gtt cct gga gga act aac aac aac aat cac tct aac gtc gac ctc 336 Glu Val Pro Gly Gly Thr Asn Asn Asn Asn His Ser Asn Val Asp Leu 100 105 110 atc gtt gac att gcc gag cga ttc aat ata cat gct gtt tgg gct gga 384 Ile Val Asp Ile Ala Glu Arg Phe Asn Ile His Ala Val Trp Ala Gly 115 120 125 tgg ggt cac gct tcg gaa aac ccc aga ctt ccc gag tct ctc gcc gcc 432 Trp Gly His Ala Ser Glu Asn Pro Arg Leu Pro Glu Ser Leu Ala Ala 130 135 140 tca aag aac aag atc gtc ttc att ggt cct ccc gga tcc gct atg cga 480 Ser Lys Asn Lys Ile Val Phe Ile Gly Pro Pro Gly Ser Ala Met Arg 145 150 155 160 tcc ctt gga gac aag att tct tcg acc atc gtt gcc cag tct gcc cag 528 Ser Leu Gly Asp Lys Ile Ser Ser Thr Ile Val Ala Gln Ser Ala Gln 165 170 175 gtg ccg tgt atg gcc tgg tct gga tca ggc atc act gat aca gag ctc 576 Val Pro Cys Met Ala Trp Ser Gly Ser Gly Ile Thr Asp Thr Glu Leu 180 185 190 agc cct cag ggc ttc gtg act gtg ccc gat ggg cca tat cag gct gct 624 Ser Pro Gln Gly Phe Val Thr Val Pro Asp Gly Pro Tyr Gln Ala Ala 195 200 205 tgt gta aag acg gtg gag gat ggt ttg gtg cga gcc gag aag atc ggt 672 Cys Val Lys Thr Val Glu Asp Gly Leu Val Arg Ala Glu Lys Ile Gly 210 215 220 ttg cca gtt atg atc aag gcc tct gag gga gga gga gga aag ggt atc 720 Leu Pro Val Met Ile Lys Ala Ser Glu Gly Gly Gly Gly Lys Gly Ile 225 230 235 240 cga atg gtt cac agc atg gac aca ttc aag aac tcc tac aac tcc gtc 768 Arg Met Val His Ser Met Asp Thr Phe Lys Asn Ser Tyr Asn Ser Val 245 250 255 gct tcc gag gtg cca gga tct ccg att ttc atc atg gcc ttg gct gga 816 Ala Ser Glu Val Pro Gly Ser Pro Ile Phe Ile Met Ala Leu Ala Gly 260 265 270 tct gct cga cat ttg gag gtc cag ctc ctt gct gat cag tac gga aac 864 Ser Ala Arg His Leu Glu Val Gln Leu Leu Ala Asp Gln Tyr Gly Asn 275 280 285 gct atc tct ttg ttc ggt cga gat tgc tct gtt cag cga cga cat cag 912 Ala Ile Ser Leu Phe Gly Arg Asp Cys Ser Val Gln Arg Arg His Gln 290 295 300 aag atc att gag gag gct ccc gtc acg atc gct cgt cca gag aga ttc 960 Lys Ile Ile Glu Glu Ala Pro Val Thr Ile Ala Arg Pro Glu Arg Phe 305 310 315 320 gaa gag atg gag aag gct gct gtc agg ttg gcc aag tta gta gga tat 1008 Glu Glu Met Glu Lys Ala Ala Val Arg Leu Ala Lys Leu Val Gly Tyr 325 330 335 gtt agt gcc ggt acc gtc gaa tac ctc tac tct cac gcc gac gac tca 1056 Val Ser Ala Gly Thr Val Glu Tyr Leu Tyr Ser His Ala Asp Asp Ser 340 345 350 ttc ttc ttc ctc gaa ctc aac cct cga ctt caa gtc gag cac cct act 1104 Phe Phe Phe Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Thr 355 360 365 acc gag atg gtc tcg ggt gtc aac ctt ccc gct gct cag ctt cag att 1152 Thr Glu Met Val Ser Gly Val Asn Leu Pro Ala Ala Gln Leu Gln Ile 370 375 380 gct atg ggt atc cct ctt tct cga att cgg gat att cga gtc ctc tac 1200 Ala Met Gly Ile Pro Leu Ser Arg Ile Arg Asp Ile Arg Val Leu Tyr 385 390 395 400 ggt ctc gat ccc cac act gtt tcc gag atc gac ttc gac agc agc aga 1248 Gly Leu Asp Pro His Thr Val Ser Glu Ile Asp Phe Asp Ser Ser Arg 405 410 415 gcg gag tct gtc cag act cag agg aag cct agg ccc aag ggt cac gtc 1296 Ala Glu Ser Val Gln Thr Gln Arg Lys Pro Arg Pro Lys Gly His Val 420 425 430 att gcc tgt cga atc acg agt gaa aac ccc gat gag ggg ttc aag ccg 1344 Ile Ala Cys Arg Ile Thr Ser Glu Asn Pro Asp Glu Gly Phe Lys Pro 435 440 445 tct gcc gga gat atc caa gag ttg aac ttc aga agt aat act aac gtc 1392 Ser Ala Gly Asp Ile Gln Glu Leu Asn Phe Arg Ser Asn Thr Asn Val 450 455 460 tgg gga tac ttc tct gtt gga gct act gga gga att cat agt ttc gcc 1440 Trp Gly Tyr Phe Ser Val Gly Ala Thr Gly Gly Ile His Ser Phe Ala 465 470 475 480 gat tct caa ttc ggt cac gtg ttt gct tat ggc tcc gac cga acg act 1488 Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Ser Asp Arg Thr Thr 485 490 495 gcc aga aag aat atg gtt atc gcc ttg aaa gag ctt tcc att cga gga 1536 Ala Arg Lys Asn Met Val Ile Ala Leu Lys Glu Leu Ser Ile Arg Gly 500 505 510 gac ttc cga acc act gtc gag tat ctt atc act ctt ctt gag acg agc 1584 Asp Phe Arg Thr Thr Val Glu Tyr Leu Ile Thr Leu Leu Glu Thr Ser 515 520 525 gat ttc gag cag aac gcc att acc acc gct tgg ttg gat ggg ttg atc 1632 Asp Phe Glu Gln Asn Ala Ile Thr Thr Ala Trp Leu Asp Gly Leu Ile 530 535 540 act aac aag ctt aca tct gag agg cct gat cca tca ctg gcc gtt att 1680 Thr Asn Lys Leu Thr Ser Glu Arg Pro Asp Pro Ser Leu Ala Val Ile 545 550 555 560 tgt ggt gca att gtg aaa gct cac gtg gct tct gag aac tgt tgg gcc 1728 Cys Gly Ala Ile Val Lys Ala His Val Ala Ser Glu Asn Cys Trp Ala 565 570 575 gaa tac cga cga gta ttg gac aag gga cag gtt ccc tcc aag gac act 1776 Glu Tyr Arg Arg Val Leu Asp Lys Gly Gln Val Pro Ser Lys Asp Thr 580 585 590 ctc aag aca gtg ttc act ctt gat ttc atc tat gag ggt gtt cgg tac 1824 Leu Lys Thr Val Phe Thr Leu Asp Phe Ile Tyr Glu Gly Val Arg Tyr 595 600 605 aat ttc acc gct gct cga gcc tcc ctc aac act tac cga ttg tat cta 1872 Asn Phe Thr Ala Ala Arg Ala Ser Leu Asn Thr Tyr Arg Leu Tyr Leu 610 615 620 aac gga gga aag acc gtg gtg tcc atc cga cct ttg gcc gat ggt gga 1920 Asn Gly Gly Lys Thr Val Val Ser Ile Arg Pro Leu Ala Asp Gly Gly 625 630 635 640 atg ctc gtt ctt ctc gat ggc cga tcc cac act ctc tac tgg agg gag 1968 Met Leu Val Leu Leu Asp Gly Arg Ser His Thr Leu Tyr Trp Arg Glu 645 650 655 gaa gtc ggt acc ctc cga att cag gta gac gca aag act tgc ctg att 2016 Glu Val Gly Thr Leu Arg Ile Gln Val Asp Ala Lys Thr Cys Leu Ile 660 665 670 gag cag gag aac gac ccc act cag ctc cga tca ccc tcg cct gga aag 2064 Glu Gln Glu Asn Asp Pro Thr Gln Leu Arg Ser Pro Ser Pro Gly Lys 675 680 685 atc atc cgg ttt ttg gtc gaa agc gga gat cac atc tcc tcc gga gat 2112 Ile Ile Arg Phe Leu Val Glu Ser Gly Asp His Ile Ser Ser Gly Asp 690 695 700 atc tat gct gag gtt gag gtc atg aag atg atc ttg ccc ttg att gcc 2160 Ile Tyr Ala Glu Val Glu Val Met Lys Met Ile Leu Pro Leu Ile Ala 705 710 715 720 cag gag tcc ggt cac gtt cag ttt gtc aag caa gcc ggt gtg acc gtc 2208 Gln Glu Ser Gly His Val Gln Phe Val Lys Gln Ala Gly Val Thr Val 725 730 735 gat cct gga gcg att att ggg atc ttg agt ctt gat gac cct acg cga 2256 Asp Pro Gly Ala Ile Ile Gly Ile Leu Ser Leu Asp Asp Pro Thr Arg 740 745 750 gtg aag aag gcg aag ccc ttc gag ggt ctc ctg cct gtg act ggt ctc 2304 Val Lys Lys Ala Lys Pro Phe Glu Gly Leu Leu Pro Val Thr Gly Leu 755 760 765 cct aac ctg ccc ggt aac aga cct cac cag cgg cta cag ttc cag ctt 2352 Pro Asn Leu Pro Gly Asn Arg Pro His Gln Arg Leu Gln Phe Gln Leu 770 775 780 gag tcg ata tac tcg gtc ttg gat gga tac gag agt gac tcc act gca 2400 Glu Ser Ile Tyr Ser Val Leu Asp Gly Tyr Glu Ser Asp Ser Thr Ala 785 790 795 800 aca atc ctc cga tca ttc tct gaa aac ctt tat gat cct gat ctt gct 2448 Thr Ile Leu Arg Ser Phe Ser Glu Asn Leu Tyr Asp Pro Asp Leu Ala 805 810 815 ttc gga gag gct tta tcc atc att tcc gtc ctt tct ggg aga atg cct 2496 Phe Gly Glu Ala Leu Ser Ile Ile Ser Val Leu Ser Gly Arg Met Pro 820 825 830 gcc gat ctt gag gag agc att cga gag gtc atc agc gaa gct cag tcg 2544 Ala Asp Leu Glu Glu Ser Ile Arg Glu Val Ile Ser Glu Ala Gln Ser 835 840 845 aag cct cac gcc gag ttc cct gga tca aag atc ctc aaa gtc gtc gag 2592 Lys Pro His Ala Glu Phe Pro Gly Ser Lys Ile Leu Lys Val Val Glu 850 855 860 cgg tac atc gat aat ttg cga cct cag gag agg gct atg gtc cga act 2640 Arg Tyr Ile Asp Asn Leu Arg Pro Gln Glu Arg Ala Met Val Arg Thr 865 870 875 880 cag atc gaa ccc atc gtt ggt att gct gag aag aac gtt ggc ggt cct 2688 Gln Ile Glu Pro Ile Val Gly Ile Ala Glu Lys Asn Val Gly Gly Pro 885 890 895 aag ggt tac gcc tct tac gtc tta gct acc atc ctt caa aag ttc ttg 2736 Lys Gly Tyr Ala Ser Tyr Val Leu Ala Thr Ile Leu Gln Lys Phe Leu 900 905 910 gcc gtt gag gcc gtt ttt gct act ggt agt gaa gag gcc att gtt ctc 2784 Ala Val Glu Ala Val Phe Ala Thr Gly Ser Glu Glu Ala Ile Val Leu 915 920 925 caa ctt cga gat gaa aac cga gaa tct ttg aac gac gtc ctt ggt ctc 2832 Gln Leu Arg Asp Glu Asn Arg Glu Ser Leu Asn Asp Val Leu Gly Leu 930 935 940 gtc ctg gct cac tcg cgt ctc agc gct cga tcc aag ctt gtt ctc tcc 2880 Val Leu Ala His Ser Arg Leu Ser Ala Arg Ser Lys Leu Val Leu Ser 945 950 955 960 gtc ttt gat ctg atc aag tct atg cag ctc ctc aac aac act gag ggt 2928 Val Phe Asp Leu Ile Lys Ser Met Gln Leu Leu Asn Asn Thr Glu Gly 965 970 975 tct ttc ctt cat aag act atg aaa gcg ctt gcc gac atg ccc acc aag 2976 Ser Phe Leu His Lys Thr Met Lys Ala Leu Ala Asp Met Pro Thr Lys 980 985 990 gct cct ttg gcc agc aag gtg tct ttg aag gct cgg gaa att ctt atc 3024 Ala Pro Leu Ala Ser Lys Val Ser Leu Lys Ala Arg Glu Ile Leu Ile 995 1000 1005 tct tgc tct ctt ccc tct tac gag gag agg ttg ttc cag atg gaa 3069 Ser Cys Ser Leu Pro Ser Tyr Glu Glu Arg Leu Phe Gln Met Glu 1010 1015 1020 aag atc ctt aac tct tct gtc acc act tct tac tac gga gag act 3114 Lys Ile Leu Asn Ser Ser Val Thr Thr Ser Tyr Tyr Gly Glu Thr 1025 1030 1035 gga ggt gga cac aga aac cct tcg gtt gat gtt ctg act gag atc 3159 Gly Gly Gly His Arg Asn Pro Ser Val Asp Val Leu Thr Glu Ile 1040 1045 1050 tca aac tct cga ttc acc gtc tac gat gtc ctg tcc tcc ttc ttc 3204 Ser Asn Ser Arg Phe Thr Val Tyr Asp Val Leu Ser Ser Phe Phe 1055 1060 1065 aag cac gat gat cct tgg att gtt ctt gct agt ttg acc gtc tac 3249 Lys His Asp Asp Pro Trp Ile Val Leu Ala Ser Leu Thr Val Tyr 1070 1075 1080 gtt ctt cga gct tac cga gag tac agt att ctt gat atg caa cat 3294 Val Leu Arg Ala Tyr Arg Glu Tyr Ser Ile Leu Asp Met Gln His 1085 1090 1095 gag caa ggt cag gat ggc gct gct gga gtc atc act tgg cga ttc 3339 Glu Gln Gly Gln Asp Gly Ala Ala Gly Val Ile Thr Trp Arg Phe 1100 1105 1110 aag ctc aac cag ccc atc gct gag tct tct act ccc cga gtt gac 3384 Lys Leu Asn Gln Pro Ile Ala Glu Ser Ser Thr Pro Arg Val Asp 1115 1120 1125 tcg aat cga gac gtt tac cga gtc ggt tcg ctt tct gat ttg acc 3429 Ser Asn Arg Asp Val Tyr Arg Val Gly Ser Leu Ser Asp Leu Thr 1130 1135 1140 tac aag atc aag cag agt cag acc gag ccc ctc cga gct ggt gtc 3474 Tyr Lys Ile Lys Gln Ser Gln Thr Glu Pro Leu Arg Ala Gly Val 1145 1150 1155 atg acg agc ttc aac aac ttg aag gag gtt cag gac gga ctc ttg 3519 Met Thr Ser Phe Asn Asn Leu Lys Glu Val Gln Asp Gly Leu Leu 1160 1165 1170 aat gtt ctg tct ttc ttc cct gct tac cat cat caa gat ttc act 3564 Asn Val Leu Ser Phe Phe Pro Ala Tyr His His Gln Asp Phe Thr 1175 1180 1185 caa cga cat ggt cag gac agt gcc atg ccc aac gtt ctc aac att 3609 Gln Arg His Gly Gln Asp Ser Ala Met Pro Asn Val Leu Asn Ile 1190 1195 1200 gct atc cgg gct ttc gag gag aag gac gac atg tct gat ctt gat 3654 Ala Ile Arg Ala Phe Glu Glu Lys Asp Asp Met Ser Asp Leu Asp 1205 1210 1215 tgg gcc aag agt gtt gag tcg ctg gta atg cag atg tct gcc gag 3699 Trp Ala Lys Ser Val Glu Ser Leu Val Met Gln Met Ser Ala Glu 1220 1225 1230 atc cag aag aag gga att cga cga gtt acc ttc ttg gtt tgc cga 3744 Ile Gln Lys Lys Gly Ile Arg Arg Val Thr Phe Leu Val Cys Arg 1235 1240 1245 aag ggc gtt tac ccc tcc tac ttc acc ttc aga caa gag ggt gcc 3789 Lys Gly Val Tyr Pro Ser Tyr Phe Thr Phe Arg Gln Glu Gly Ala 1250 1255 1260 cag ggc ccc tgg aga gag gag gag aag att cga aac atc gag cct 3834 Gln Gly Pro Trp Arg Glu Glu Glu Lys Ile Arg Asn Ile Glu Pro 1265 1270 1275 gct cta gcc agt cag ctt gag ctc aac cga ctc tcg aat ttc aag 3879 Ala Leu Ala Ser Gln Leu Glu Leu Asn Arg Leu Ser Asn Phe Lys 1280 1285 1290 gtc acc cct atc ttc gta gac aac aga cag atc cac atc tac aag 3924 Val Thr Pro Ile Phe Val Asp Asn Arg Gln Ile His Ile Tyr Lys 1295 1300 1305 gga gtg ggt aag gag aac tct tcc gat gtt cga ttc ttt atc cgg 3969 Gly Val Gly Lys Glu Asn Ser Ser Asp Val Arg Phe Phe Ile Arg 1310 1315 1320 gct ttg gtt cga cct gga cgg gtc cag gga tcg atg aag gct gcc 4014 Ala Leu Val Arg Pro Gly Arg Val Gln Gly Ser Met Lys Ala Ala 1325 1330 1335 gag tat ctc atc tcc gag tgc gat cga ctg ctc act gat atc ctg 4059 Glu Tyr Leu Ile Ser Glu Cys Asp Arg Leu Leu Thr Asp Ile Leu 1340 1345 1350 gac gcc ttg gag gtt gtt gga gcc gag act cga aac gcc gat tgc 4104 Asp Ala Leu Glu Val Val Gly Ala Glu Thr Arg Asn Ala Asp Cys 1355 1360 1365 aac cat gtt gga att aac ttc atc tat aac gtt ctt gtc gac ttc 4149 Asn His Val Gly Ile Asn Phe Ile Tyr Asn Val Leu Val Asp Phe 1370 1375 1380 gac gac gtc cag gag gcc ctt gcc ggg ttc att gag agg cac gga 4194 Asp Asp Val Gln Glu Ala Leu Ala Gly Phe Ile Glu Arg His Gly 1385 1390 1395 aag agg ctt tgg cga ctt cga gtg acc gct tct gaa atc cga atg 4239 Lys Arg Leu Trp Arg Leu Arg Val Thr Ala Ser Glu Ile Arg Met 1400 1405 1410 gtt ctt gag gac gac gag ggt aac gtc acc ccc atc cga tgc tgc 4284 Val Leu Glu Asp Asp Glu Gly Asn Val Thr Pro Ile Arg Cys Cys 1415 1420 1425 att gag aac gtt tct ggt ttc gtc gtg aag tac cac gcc tac cag 4329 Ile Glu Asn Val Ser Gly Phe Val Val Lys Tyr His Ala Tyr Gln 1430 1435 1440 gag gtt gag acc gag aag ggt act acc atc ttg aag tca atc gga 4374 Glu Val Glu Thr Glu Lys Gly Thr Thr Ile Leu Lys Ser Ile Gly 1445 1450 1455 gac ctt gga cct ctt cac ctt cag cct gtc aac cat gct tac cag 4419 Asp Leu Gly Pro Leu His Leu Gln Pro Val Asn His Ala Tyr Gln 1460 1465 1470 acc aag aac agt ctt cag ccc cga cga tac cag gct cac ttg gtt 4464 Thr Lys Asn Ser Leu Gln Pro Arg Arg Tyr Gln Ala His Leu Val 1475 1480 1485 gga acg act tac gtc tac gac tac ccc gat ctc ttc gtt cag agt 4509 Gly Thr Thr Tyr Val Tyr Asp Tyr Pro Asp Leu Phe Val Gln Ser 1490 1495 1500 ttg cgc aag gtt tgg gct gag gct gct gct aag att cct cac ctc 4554 Leu Arg Lys Val Trp Ala Glu Ala Ala Ala Lys Ile Pro His Leu 1505 1510 1515 cgg gtg cct agc gag cct ctt acc gct acc gag ttg gtt ctc gat 4599 Arg Val Pro Ser Glu Pro Leu Thr Ala Thr Glu Leu Val Leu Asp 1520 1525 1530 gag aac aac gag ctt cag gag gtc gag cga cct ccg ggt tcc aac 4644 Glu Asn Asn Glu Leu Gln Glu Val Glu Arg Pro Pro Gly Ser Asn 1535 1540 1545 tcg tgt ggt atg gtc gcc tgg atc ttc act atg ctc act ccc gag 4689 Ser Cys Gly Met Val Ala Trp Ile Phe Thr Met Leu Thr Pro Glu 1550 1555 1560 tat ccc aag ggt cga cga gta gtt gcc att gcc aac gat atc acc 4734 Tyr Pro Lys Gly Arg Arg Val Val Ala Ile Ala Asn Asp Ile Thr 1565 1570 1575 ttc aag att gga tcc ttt ggt cct aag gaa gac gat tac ttc ttc 4779 Phe Lys Ile Gly Ser Phe Gly Pro Lys Glu Asp Asp Tyr Phe Phe 1580 1585 1590 aag gct act gaa att gcc aag aag ctg ggc ctt cct cga att tac 4824 Lys Ala Thr Glu Ile Ala Lys Lys Leu Gly Leu Pro Arg Ile Tyr 1595 1600 1605 ctc tct gcc aac agt gga gct aga ctc ggt atc gcg gag gag ctc 4869 Leu Ser Ala Asn Ser Gly Ala Arg Leu Gly Ile Ala Glu Glu Leu 1610 1615 1620 ttg cac atc ttc aag gcg gcc ttc gtt gac ccc gca aag cct tcc 4914 Leu His Ile Phe Lys Ala Ala Phe Val Asp Pro Ala Lys Pro Ser 1625 1630 1635 atg ggt att aag tat cta tac ttg acc cct gaa act tta tcc act 4959 Met Gly Ile Lys Tyr Leu Tyr Leu Thr Pro Glu Thr Leu Ser Thr 1640 1645 1650 ctt gcc aag aag gga tcc agc gtc acc act gag gag atc gag gat 5004 Leu Ala Lys Lys Gly Ser Ser Val Thr Thr Glu Glu Ile Glu Asp 1655 1660 1665 gac ggc gag cga cga cac aag atc acc gcc atc atc ggt ctt gca 5049 Asp Gly Glu Arg Arg His Lys Ile Thr Ala Ile Ile Gly Leu Ala 1670 1675 1680 gag ggt ttg gga gtt gag tct ctt cga gga tcc ggt ctt att gct 5094 Glu Gly Leu Gly Val Glu Ser Leu Arg Gly Ser Gly Leu Ile Ala 1685 1690 1695 gga gcc acc act cga gct tac gag gag gga atc ttc acc atc tct 5139 Gly Ala Thr Thr Arg Ala Tyr Glu Glu Gly Ile Phe Thr Ile Ser 1700 1705 1710 ctc gtt act gcc cga tcg gtc ggt atc gga gct tac ttg gtt cga 5184 Leu Val Thr Ala Arg Ser Val Gly Ile Gly Ala Tyr Leu Val Arg 1715 1720 1725 ttg ggt cag cga gct att cag gtt gaa ggc aac cct atg atc ctt 5229 Leu Gly Gln Arg Ala Ile Gln Val Glu Gly Asn Pro Met Ile Leu 1730 1735 1740 act gga gct cag tct ctc aac aag gtg ctt gga cga gag gtt tac 5274 Thr Gly Ala Gln Ser Leu Asn Lys Val Leu Gly Arg Glu Val Tyr 1745 1750 1755 act tcc aac ctt cag ctt gga gga acc cag att atg gcc cga aac 5319 Thr Ser Asn Leu Gln Leu Gly Gly Thr Gln Ile Met Ala Arg Asn 1760 1765 1770 ggt acc acg cat ctc gtc gct gaa tct gat ctc gat ggt gct ctc 5364 Gly Thr Thr His Leu Val Ala Glu Ser Asp Leu Asp Gly Ala Leu 1775 1780 1785 aag gtc atc cag tgg ctc tcg tat gtg ccc gag cga aag ggc aag 5409 Lys Val Ile Gln Trp Leu Ser Tyr Val Pro Glu Arg Lys Gly Lys 1790 1795 1800 gcc att cct atc tgg cct tcc gag gac cct tgg gac cga act gtg 5454 Ala Ile Pro Ile Trp Pro Ser Glu Asp Pro Trp Asp Arg Thr Val 1805 1810 1815 acc tac gag cct ccc cga ggt cct tac gat cct cga tgg ttg ctt 5499 Thr Tyr Glu Pro Pro Arg Gly Pro Tyr Asp Pro Arg Trp Leu Leu 1820 1825 1830 gaa gga aag ccg gat gaa ggc ttg act ggt ctt ttc gac aag gga 5544 Glu Gly Lys Pro Asp Glu Gly Leu Thr Gly Leu Phe Asp Lys Gly 1835 1840 1845 tct ttc atg gag acc ctt gga gat tgg gcc aag act atc gtc acc 5589 Ser Phe Met Glu Thr Leu Gly Asp Trp Ala Lys Thr Ile Val Thr 1850 1855 1860 ggt cga gcc cga ctg gga ggc att cct atg ggt gtt att gct gtc 5634 Gly Arg Ala Arg Leu Gly Gly Ile Pro Met Gly Val Ile Ala Val 1865 1870 1875 gaa acc agg acg acc gag aag atc atc gct gcc gat cct gcc aac 5679 Glu Thr Arg Thr Thr Glu Lys Ile Ile Ala Ala Asp Pro Ala Asn 1880 1885 1890 cct gca gct ttc gag caa aag att atg gag gct ggt cag gtt tgg 5724 Pro Ala Ala Phe Glu Gln Lys Ile Met Glu Ala Gly Gln Val Trp 1895 1900 1905 aac ccc aac gct gct tac aag acc gct caa tcc atc ttt gat atc 5769 Asn Pro Asn Ala Ala Tyr Lys Thr Ala Gln Ser Ile Phe Asp Ile 1910 1915 1920 aac aag gag ggt ctt cct ttg atg atc ctt gcc aac atc cga ggt 5814 Asn Lys Glu Gly Leu Pro Leu Met Ile Leu Ala Asn Ile Arg Gly 1925 1930 1935 ttc tct gga gga cag ggt gat atg ttt gac gct atc ctc aag cag 5859 Phe Ser Gly Gly Gln Gly Asp Met Phe Asp Ala Ile Leu Lys Gln 1940 1945 1950 ggt tct aag atc gtt gac ggt ctc tcg aac ttc aag cag cca gtg 5904 Gly Ser Lys Ile Val Asp Gly Leu Ser Asn Phe Lys Gln Pro Val 1955 1960 1965 ttc gtc tat gtt gtc ccc aac gga gag ctt cgt gga gga gct tgg 5949 Phe Val Tyr Val Val Pro Asn Gly Glu Leu Arg Gly Gly Ala Trp 1970 1975 1980 gtc gtg ttg gat cct act atc aac ctt gcc aag atg gag atg tac 5994 Val Val Leu Asp Pro Thr Ile Asn Leu Ala Lys Met Glu Met Tyr 1985 1990 1995 gct gat gaa acc gct cga gga gga att ctc gag ccg gaa ggt atc 6039 Ala Asp Glu Thr Ala Arg Gly Gly Ile Leu Glu Pro Glu Gly Ile 2000 2005 2010 gtt gag atc aag ttc cga cga gac aag gtc atc gct acc atg gag 6084 Val Glu Ile Lys Phe Arg Arg Asp Lys Val Ile Ala Thr Met Glu 2015 2020 2025 cga ttg gac gag acc tat gcc tct ctc aaa gct gcc tcg aac gac 6129 Arg Leu Asp Glu Thr Tyr Ala Ser Leu Lys Ala Ala Ser Asn Asp 2030 2035 2040 tca acc aag tct gcg gag gag cga gct aag agt gct gag cta ctc 6174 Ser Thr Lys Ser Ala Glu Glu Arg Ala Lys Ser Ala Glu Leu Leu 2045 2050 2055 aag gca aga gag act cta ctt caa ccg acg tac ttg cag att gca 6219 Lys Ala Arg Glu Thr Leu Leu Gln Pro Thr Tyr Leu Gln Ile Ala 2060 2065 2070 cac ctt tac gct gat ctc cat gat cgt gtc gga cga atg gag gcc 6264 His Leu Tyr Ala Asp Leu His Asp Arg Val Gly Arg Met Glu Ala 2075 2080 2085 aag ggt tgc gcg aag cga gct gtc tgg gct gag gct cga cga ttc 6309 Lys Gly Cys Ala Lys Arg Ala Val Trp Ala Glu Ala Arg Arg Phe 2090 2095 2100 ttc tac tgg cga ctt cga cga cgt ctc aac gat gag cac atc ctg 6354 Phe Tyr Trp Arg Leu Arg Arg Arg Leu Asn Asp Glu His Ile Leu 2105 2110 2115 tct aag ttc gct gct gcc aac ccg gat ctt act ctc gag gag cga 6399 Ser Lys Phe Ala Ala Ala Asn Pro Asp Leu Thr Leu Glu Glu Arg 2120 2125 2130 caa aac att ctc gac tct gtc gtc cag act gac ctc act gat gac 6444 Gln Asn Ile Leu Asp Ser Val Val Gln Thr Asp Leu Thr Asp Asp 2135 2140 2145 cga gcc acc gct gaa tgg att gag cag tct gca gaa gag att gct 6489 Arg Ala Thr Ala Glu Trp Ile Glu Gln Ser Ala Glu Glu Ile Ala 2150 2155 2160 gct gcc gtt gcc gaa gtc cga tcc acc tac gtg tcg aat aag att 6534 Ala Ala Val Ala Glu Val Arg Ser Thr Tyr Val Ser Asn Lys Ile 2165 2170 2175 atc agc ttc gcc gag acg gag cga gct gga gcg ttg cag ggc ttg 6579 Ile Ser Phe Ala Glu Thr Glu Arg Ala Gly Ala Leu Gln Gly Leu 2180 2185 2190 gtc gct gtc ttg agc act ttg aat gcg gaa gac aag aag gcc ctt 6624 Val Ala Val Leu Ser Thr Leu Asn Ala Glu Asp Lys Lys Ala Leu 2195 2200 2205 gtt tct agc ctt ggt ctc taa 6645 Val Ser Ser Leu Gly Leu 2210 <210> 3 <211> 2214 <212> PRT <213> Phaffia rhodozyma <400> 3 Met Val Val Asp His Glu Ser Val Arg His Phe Ile Gly Gly Asn Ala 1 5 10 15 Leu Glu Asn Ala Pro Pro Ser Ser Val Thr Asp Phe Val Arg Ser Gln 20 25 30 Asp Gly His Thr Val Ile Thr Lys Val Leu Ile Ala Asn Asn Gly Ile 35 40 45 Ala Ala Val Lys Glu Ile Arg Ser Val Arg Lys Trp Ala Tyr Glu Thr 50 55 60 Phe Gly Asp Glu Arg Ala Ile Glu Phe Thr Val Met Ala Thr Pro Glu 65 70 75 80 Asp Leu Lys Val Asn Cys Asp Tyr Ile Arg Met Ala Asp Arg Val Val 85 90 95 Glu Val Pro Gly Gly Thr Asn Asn Asn Asn His Ser Asn Val Asp Leu 100 105 110 Ile Val Asp Ile Ala Glu Arg Phe Asn Ile His Ala Val Trp Ala Gly 115 120 125 Trp Gly His Ala Ser Glu Asn Pro Arg Leu Pro Glu Ser Leu Ala Ala 130 135 140 Ser Lys Asn Lys Ile Val Phe Ile Gly Pro Pro Gly Ser Ala Met Arg 145 150 155 160 Ser Leu Gly Asp Lys Ile Ser Ser Thr Ile Val Ala Gln Ser Ala Gln 165 170 175 Val Pro Cys Met Ala Trp Ser Gly Ser Gly Ile Thr Asp Thr Glu Leu 180 185 190 Ser Pro Gln Gly Phe Val Thr Val Pro Asp Gly Pro Tyr Gln Ala Ala 195 200 205 Cys Val Lys Thr Val Glu Asp Gly Leu Val Arg Ala Glu Lys Ile Gly 210 215 220 Leu Pro Val Met Ile Lys Ala Ser Glu Gly Gly Gly Gly Lys Gly Ile 225 230 235 240 Arg Met Val His Ser Met Asp Thr Phe Lys Asn Ser Tyr Asn Ser Val 245 250 255 Ala Ser Glu Val Pro Gly Ser Pro Ile Phe Ile Met Ala Leu Ala Gly 260 265 270 Ser Ala Arg His Leu Glu Val Gln Leu Leu Ala Asp Gln Tyr Gly Asn 275 280 285 Ala Ile Ser Leu Phe Gly Arg Asp Cys Ser Val Gln Arg Arg His Gln 290 295 300 Lys Ile Ile Glu Glu Ala Pro Val Thr Ile Ala Arg Pro Glu Arg Phe 305 310 315 320 Glu Glu Met Glu Lys Ala Ala Val Arg Leu Ala Lys Leu Val Gly Tyr 325 330 335 Val Ser Ala Gly Thr Val Glu Tyr Leu Tyr Ser His Ala Asp Asp Ser 340 345 350 Phe Phe Phe Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Thr 355 360 365 Thr Glu Met Val Ser Gly Val Asn Leu Pro Ala Ala Gln Leu Gln Ile 370 375 380 Ala Met Gly Ile Pro Leu Ser Arg Ile Arg Asp Ile Arg Val Leu Tyr 385 390 395 400 Gly Leu Asp Pro His Thr Val Ser Glu Ile Asp Phe Asp Ser Ser Arg 405 410 415 Ala Glu Ser Val Gln Thr Gln Arg Lys Pro Arg Pro Lys Gly His Val 420 425 430 Ile Ala Cys Arg Ile Thr Ser Glu Asn Pro Asp Glu Gly Phe Lys Pro 435 440 445 Ser Ala Gly Asp Ile Gln Glu Leu Asn Phe Arg Ser Asn Thr Asn Val 450 455 460 Trp Gly Tyr Phe Ser Val Gly Ala Thr Gly Gly Ile His Ser Phe Ala 465 470 475 480 Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Ser Asp Arg Thr Thr 485 490 495 Ala Arg Lys Asn Met Val Ile Ala Leu Lys Glu Leu Ser Ile Arg Gly 500 505 510 Asp Phe Arg Thr Thr Val Glu Tyr Leu Ile Thr Leu Leu Glu Thr Ser 515 520 525 Asp Phe Glu Gln Asn Ala Ile Thr Thr Ala Trp Leu Asp Gly Leu Ile 530 535 540 Thr Asn Lys Leu Thr Ser Glu Arg Pro Asp Pro Ser Leu Ala Val Ile 545 550 555 560 Cys Gly Ala Ile Val Lys Ala His Val Ala Ser Glu Asn Cys Trp Ala 565 570 575 Glu Tyr Arg Arg Val Leu Asp Lys Gly Gln Val Pro Ser Lys Asp Thr 580 585 590 Leu Lys Thr Val Phe Thr Leu Asp Phe Ile Tyr Glu Gly Val Arg Tyr 595 600 605 Asn Phe Thr Ala Ala Arg Ala Ser Leu Asn Thr Tyr Arg Leu Tyr Leu 610 615 620 Asn Gly Gly Lys Thr Val Val Ser Ile Arg Pro Leu Ala Asp Gly Gly 625 630 635 640 Met Leu Val Leu Leu Asp Gly Arg Ser His Thr Leu Tyr Trp Arg Glu 645 650 655 Glu Val Gly Thr Leu Arg Ile Gln Val Asp Ala Lys Thr Cys Leu Ile 660 665 670 Glu Gln Glu Asn Asp Pro Thr Gln Leu Arg Ser Pro Ser Pro Gly Lys 675 680 685 Ile Ile Arg Phe Leu Val Glu Ser Gly Asp His Ile Ser Ser Gly Asp 690 695 700 Ile Tyr Ala Glu Val Glu Val Met Lys Met Ile Leu Pro Leu Ile Ala 705 710 715 720 Gln Glu Ser Gly His Val Gln Phe Val Lys Gln Ala Gly Val Thr Val 725 730 735 Asp Pro Gly Ala Ile Ile Gly Ile Leu Ser Leu Asp Asp Pro Thr Arg 740 745 750 Val Lys Lys Ala Lys Pro Phe Glu Gly Leu Leu Pro Val Thr Gly Leu 755 760 765 Pro Asn Leu Pro Gly Asn Arg Pro His Gln Arg Leu Gln Phe Gln Leu 770 775 780 Glu Ser Ile Tyr Ser Val Leu Asp Gly Tyr Glu Ser Asp Ser Thr Ala 785 790 795 800 Thr Ile Leu Arg Ser Phe Ser Glu Asn Leu Tyr Asp Pro Asp Leu Ala 805 810 815 Phe Gly Glu Ala Leu Ser Ile Ile Ser Val Leu Ser Gly Arg Met Pro 820 825 830 Ala Asp Leu Glu Glu Ser Ile Arg Glu Val Ile Ser Glu Ala Gln Ser 835 840 845 Lys Pro His Ala Glu Phe Pro Gly Ser Lys Ile Leu Lys Val Val Glu 850 855 860 Arg Tyr Ile Asp Asn Leu Arg Pro Gln Glu Arg Ala Met Val Arg Thr 865 870 875 880 Gln Ile Glu Pro Ile Val Gly Ile Ala Glu Lys Asn Val Gly Gly Pro 885 890 895 Lys Gly Tyr Ala Ser Tyr Val Leu Ala Thr Ile Leu Gln Lys Phe Leu 900 905 910 Ala Val Glu Ala Val Phe Ala Thr Gly Ser Glu Glu Ala Ile Val Leu 915 920 925 Gln Leu Arg Asp Glu Asn Arg Glu Ser Leu Asn Asp Val Leu Gly Leu 930 935 940 Val Leu Ala His Ser Arg Leu Ser Ala Arg Ser Lys Leu Val Leu Ser 945 950 955 960 Val Phe Asp Leu Ile Lys Ser Met Gln Leu Leu Asn Asn Thr Glu Gly 965 970 975 Ser Phe Leu His Lys Thr Met Lys Ala Leu Ala Asp Met Pro Thr Lys 980 985 990 Ala Pro Leu Ala Ser Lys Val Ser Leu Lys Ala Arg Glu Ile Leu Ile 995 1000 1005 Ser Cys Ser Leu Pro Ser Tyr Glu Glu Arg Leu Phe Gln Met Glu 1010 1015 1020 Lys Ile Leu Asn Ser Ser Val Thr Thr Ser Tyr Tyr Gly Glu Thr 1025 1030 1035 Gly Gly Gly His Arg Asn Pro Ser Val Asp Val Leu Thr Glu Ile 1040 1045 1050 Ser Asn Ser Arg Phe Thr Val Tyr Asp Val Leu Ser Ser Phe Phe 1055 1060 1065 Lys His Asp Asp Pro Trp Ile Val Leu Ala Ser Leu Thr Val Tyr 1070 1075 1080 Val Leu Arg Ala Tyr Arg Glu Tyr Ser Ile Leu Asp Met Gln His 1085 1090 1095 Glu Gln Gly Gln Asp Gly Ala Ala Gly Val Ile Thr Trp Arg Phe 1100 1105 1110 Lys Leu Asn Gln Pro Ile Ala Glu Ser Ser Thr Pro Arg Val Asp 1115 1120 1125 Ser Asn Arg Asp Val Tyr Arg Val Gly Ser Leu Ser Asp Leu Thr 1130 1135 1140 Tyr Lys Ile Lys Gln Ser Gln Thr Glu Pro Leu Arg Ala Gly Val 1145 1150 1155 Met Thr Ser Phe Asn Asn Leu Lys Glu Val Gln Asp Gly Leu Leu 1160 1165 1170 Asn Val Leu Ser Phe Phe Pro Ala Tyr His His Gln Asp Phe Thr 1175 1180 1185 Gln Arg His Gly Gln Asp Ser Ala Met Pro Asn Val Leu Asn Ile 1190 1195 1200 Ala Ile Arg Ala Phe Glu Glu Lys Asp Asp Met Ser Asp Leu Asp 1205 1210 1215 Trp Ala Lys Ser Val Glu Ser Leu Val Met Gln Met Ser Ala Glu 1220 1225 1230 Ile Gln Lys Lys Gly Ile Arg Arg Val Thr Phe Leu Val Cys Arg 1235 1240 1245 Lys Gly Val Tyr Pro Ser Tyr Phe Thr Phe Arg Gln Glu Gly Ala 1250 1255 1260 Gln Gly Pro Trp Arg Glu Glu Glu Lys Ile Arg Asn Ile Glu Pro 1265 1270 1275 Ala Leu Ala Ser Gln Leu Glu Leu Asn Arg Leu Ser Asn Phe Lys 1280 1285 1290 Val Thr Pro Ile Phe Val Asp Asn Arg Gln Ile His Ile Tyr Lys 1295 1300 1305 Gly Val Gly Lys Glu Asn Ser Ser Asp Val Arg Phe Phe Ile Arg 1310 1315 1320 Ala Leu Val Arg Pro Gly Arg Val Gln Gly Ser Met Lys Ala Ala 1325 1330 1335 Glu Tyr Leu Ile Ser Glu Cys Asp Arg Leu Leu Thr Asp Ile Leu 1340 1345 1350 Asp Ala Leu Glu Val Val Gly Ala Glu Thr Arg Asn Ala Asp Cys 1355 1360 1365 Asn His Val Gly Ile Asn Phe Ile Tyr Asn Val Leu Val Asp Phe 1370 1375 1380 Asp Asp Val Gln Glu Ala Leu Ala Gly Phe Ile Glu Arg His Gly 1385 1390 1395 Lys Arg Leu Trp Arg Leu Arg Val Thr Ala Ser Glu Ile Arg Met 1400 1405 1410 Val Leu Glu Asp Asp Glu Gly Asn Val Thr Pro Ile Arg Cys Cys 1415 1420 1425 Ile Glu Asn Val Ser Gly Phe Val Val Lys Tyr His Ala Tyr Gln 1430 1435 1440 Glu Val Glu Thr Glu Lys Gly Thr Thr Ile Leu Lys Ser Ile Gly 1445 1450 1455 Asp Leu Gly Pro Leu His Leu Gln Pro Val Asn His Ala Tyr Gln 1460 1465 1470 Thr Lys Asn Ser Leu Gln Pro Arg Arg Tyr Gln Ala His Leu Val 1475 1480 1485 Gly Thr Thr Tyr Val Tyr Asp Tyr Pro Asp Leu Phe Val Gln Ser 1490 1495 1500 Leu Arg Lys Val Trp Ala Glu Ala Ala Ala Lys Ile Pro His Leu 1505 1510 1515 Arg Val Pro Ser Glu Pro Leu Thr Ala Thr Glu Leu Val Leu Asp 1520 1525 1530 Glu Asn Asn Glu Leu Gln Glu Val Glu Arg Pro Pro Gly Ser Asn 1535 1540 1545 Ser Cys Gly Met Val Ala Trp Ile Phe Thr Met Leu Thr Pro Glu 1550 1555 1560 Tyr Pro Lys Gly Arg Arg Val Val Ala Ile Ala Asn Asp Ile Thr 1565 1570 1575 Phe Lys Ile Gly Ser Phe Gly Pro Lys Glu Asp Asp Tyr Phe Phe 1580 1585 1590 Lys Ala Thr Glu Ile Ala Lys Lys Leu Gly Leu Pro Arg Ile Tyr 1595 1600 1605 Leu Ser Ala Asn Ser Gly Ala Arg Leu Gly Ile Ala Glu Glu Leu 1610 1615 1620 Leu His Ile Phe Lys Ala Ala Phe Val Asp Pro Ala Lys Pro Ser 1625 1630 1635 Met Gly Ile Lys Tyr Leu Tyr Leu Thr Pro Glu Thr Leu Ser Thr 1640 1645 1650 Leu Ala Lys Lys Gly Ser Ser Val Thr Thr Glu Glu Ile Glu Asp 1655 1660 1665 Asp Gly Glu Arg Arg His Lys Ile Thr Ala Ile Ile Gly Leu Ala 1670 1675 1680 Glu Gly Leu Gly Val Glu Ser Leu Arg Gly Ser Gly Leu Ile Ala 1685 1690 1695 Gly Ala Thr Thr Arg Ala Tyr Glu Glu Gly Ile Phe Thr Ile Ser 1700 1705 1710 Leu Val Thr Ala Arg Ser Val Gly Ile Gly Ala Tyr Leu Val Arg 1715 1720 1725 Leu Gly Gln Arg Ala Ile Gln Val Glu Gly Asn Pro Met Ile Leu 1730 1735 1740 Thr Gly Ala Gln Ser Leu Asn Lys Val Leu Gly Arg Glu Val Tyr 1745 1750 1755 Thr Ser Asn Leu Gln Leu Gly Gly Thr Gln Ile Met Ala Arg Asn 1760 1765 1770 Gly Thr Thr His Leu Val Ala Glu Ser Asp Leu Asp Gly Ala Leu 1775 1780 1785 Lys Val Ile Gln Trp Leu Ser Tyr Val Pro Glu Arg Lys Gly Lys 1790 1795 1800 Ala Ile Pro Ile Trp Pro Ser Glu Asp Pro Trp Asp Arg Thr Val 1805 1810 1815 Thr Tyr Glu Pro Pro Arg Gly Pro Tyr Asp Pro Arg Trp Leu Leu 1820 1825 1830 Glu Gly Lys Pro Asp Glu Gly Leu Thr Gly Leu Phe Asp Lys Gly 1835 1840 1845 Ser Phe Met Glu Thr Leu Gly Asp Trp Ala Lys Thr Ile Val Thr 1850 1855 1860 Gly Arg Ala Arg Leu Gly Gly Ile Pro Met Gly Val Ile Ala Val 1865 1870 1875 Glu Thr Arg Thr Thr Glu Lys Ile Ile Ala Ala Asp Pro Ala Asn 1880 1885 1890 Pro Ala Ala Phe Glu Gln Lys Ile Met Glu Ala Gly Gln Val Trp 1895 1900 1905 Asn Pro Asn Ala Ala Tyr Lys Thr Ala Gln Ser Ile Phe Asp Ile 1910 1915 1920 Asn Lys Glu Gly Leu Pro Leu Met Ile Leu Ala Asn Ile Arg Gly 1925 1930 1935 Phe Ser Gly Gly Gln Gly Asp Met Phe Asp Ala Ile Leu Lys Gln 1940 1945 1950 Gly Ser Lys Ile Val Asp Gly Leu Ser Asn Phe Lys Gln Pro Val 1955 1960 1965 Phe Val Tyr Val Val Pro Asn Gly Glu Leu Arg Gly Gly Ala Trp 1970 1975 1980 Val Val Leu Asp Pro Thr Ile Asn Leu Ala Lys Met Glu Met Tyr 1985 1990 1995 Ala Asp Glu Thr Ala Arg Gly Gly Ile Leu Glu Pro Glu Gly Ile 2000 2005 2010 Val Glu Ile Lys Phe Arg Arg Asp Lys Val Ile Ala Thr Met Glu 2015 2020 2025 Arg Leu Asp Glu Thr Tyr Ala Ser Leu Lys Ala Ala Ser Asn Asp 2030 2035 2040 Ser Thr Lys Ser Ala Glu Glu Arg Ala Lys Ser Ala Glu Leu Leu 2045 2050 2055 Lys Ala Arg Glu Thr Leu Leu Gln Pro Thr Tyr Leu Gln Ile Ala 2060 2065 2070 His Leu Tyr Ala Asp Leu His Asp Arg Val Gly Arg Met Glu Ala 2075 2080 2085 Lys Gly Cys Ala Lys Arg Ala Val Trp Ala Glu Ala Arg Arg Phe 2090 2095 2100 Phe Tyr Trp Arg Leu Arg Arg Arg Leu Asn Asp Glu His Ile Leu 2105 2110 2115 Ser Lys Phe Ala Ala Ala Asn Pro Asp Leu Thr Leu Glu Glu Arg 2120 2125 2130 Gln Asn Ile Leu Asp Ser Val Val Gln Thr Asp Leu Thr Asp Asp 2135 2140 2145 Arg Ala Thr Ala Glu Trp Ile Glu Gln Ser Ala Glu Glu Ile Ala 2150 2155 2160 Ala Ala Val Ala Glu Val Arg Ser Thr Tyr Val Ser Asn Lys Ile 2165 2170 2175 Ile Ser Phe Ala Glu Thr Glu Arg Ala Gly Ala Leu Gln Gly Leu 2180 2185 2190 Val Ala Val Leu Ser Thr Leu Asn Ala Glu Asp Lys Lys Ala Leu 2195 2200 2205 Val Ser Ser Leu Gly Leu 2210 <210> 4 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer acc9 <220> <221> misc_feature <222> (6)..(6) <223> n is a, c, g or t <220> <221> misc_feature <222> (9)..(9) <223> n is a, c, g or t <220> <221> misc_feature <222> (15)..(15) <223> n is a, c, g or t <220> <221> misc_feature <222> (18)..(18) <223> n is a, c, g or t <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g or t <220> <221> misc_feature <222> (24)..(24) <223> n is a, c, g or t <400> 4 athggngcnt ayytngynmg nytngg 26 <210> 5 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer acc13 <220> <221> misc_feature <222> (3)..(3) <223> n is a, c, g or t <220> <221> misc_feature <222> (6)..(6) <223> n is a, c, g or t <220> <221> misc_feature <222> (12)..(12) <223> n is a, c, g or t <220> <221> misc_feature <222> (15)..(15) <223> n is a, c, g or t <220> <221> misc_feature <222> (18)..(18) <223> n is a, c, g or t <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g or t <220> <221> misc_feature <222> (24)..(24) <223> n is a, c, g or t <400> 5 acnacnaccc angcnccncc nckna 25 <210> 6 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer acc17 <400> 6 ttaccctcgt cgtcctcaag aaccat 26 <210> 7 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer acc18 <400> 7 tggatcctac tatcaacctg ccaaga 26 <210> 8 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer acc26 <400> 8 gtgaacactg tcttgagagt gtcctt 26 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer acc43 <400> 9 ccgctgctca gcttcagatt 20 <210> 10 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer acc44 <400> 10 gattagatag ggatctagt 19

Claims (26)

  1. (a) 적어도 서열 번호 3으로 표시된 폴리펩타이드의 성숙한 형태를 코딩하는 핵산 분자;
    (b) 서열 번호 2로 표시된 코딩 서열을 포함하는 핵산 분자;
    (c) 뉴클레오타이드 서열이 (a) 또는 (b)의 뉴클레오타이드 서열에 대한 유전적 코드의 결과로서 변성된 핵산 분자;
    (d) (a) 내지 (c)의 뉴클레오타이드에 의해 코딩된 폴리펩타이드의 아미노산 서열의 하나 이상의 아미노산을 치환, 제거 및/또는 첨가함으로써 (a) 내지 (c)의 폴리뉴클레오타이드에 의해 코딩된 폴리펩타이드로부터 유래하는 폴리펩타이드를 코딩하는 핵산 분자;
    (e) 서열이 (a) 또는 (b)의 핵산 분자에 의해 코딩된 폴리펩타이드의 아미노산 서열과 56.3% 이상의 동일성을 갖는 폴리펩타이드로부터 유래하는 폴리펩타이드를 코딩하는 핵산 분자;
    (f) (a) 내지 (e)중 어느 하나의 핵산 분자에 의해 코딩된 단편을 포함하고 아세틸-CoA 카복실화효소 활성을 갖는 핵산 분자;
    (g) 서열 번호 4 내지 6으로 표시된 프라이머를 사용하여 파피아(Phaffia) 핵산 라이브러리로부터 증폭된 핵산 분자의 서열을 갖는 폴리뉴클레오타이드를 포함하는 핵산 분자;
    (h) 아세틸-CoA 카복실화효소 활성을 갖고 (a) 내지 (g)중 어느 하나에 의해 코딩된 폴리펩타이드의 단편인 폴리펩타이드를 코딩하는 핵산 분자;
    (i) (a) 내지 (d)중 어느 하나의 폴리뉴클레오타이드의 15개 이상의 뉴클레오타이드를 포함하는 핵산 분자;
    (j) 아세틸-CoA 카복실화효소 활성을 갖고 (a) 내지 (h)중 어느 하나의 핵산 분자에 의해 코딩된 폴리펩타이드에 대해서 발생하는 항체에 의해 인식되는 폴리펩타이드를 코딩하는 핵산 분자;
    (k) 엄중한 조건하에서 적당한 라이브러리를 (a) 내지 (j)중 어느 하나의 핵산 분자의 서열을 갖는 탐침으로 스크리닝함으로써 수득가능하고 아세틸-CoA 카복실화효소 활성을 갖는 폴리펩타이드를 코딩하는 핵산 분자; 및
    (l) 엄중한 조건하에서 상보적 가닥이 (a) 내지 (k)중 어느 하나의 핵산 분자와 하이브리드화되고, 아세틸-CoA 카복실화효소 활성을 갖는 폴리펩타이드를 코딩하는 핵산 분자
    로 구성된 군에서 선택된 하나 이상의 핵산 분자를 포함하는 단리된 폴리뉴클레오타이드.
  2. (m) 서열 번호 1로 표시된 뉴클레오타이드 서열을 포함하는 핵산 분자;
    (n) 뉴클레오타이드 서열이 (m)의 뉴클레오타이드 서열에 대한 유전적 코드의 결과로서 변성된 핵산 분자;
    (o) (m) 또는 (n)의 뉴클레오타이드에 의해 코딩된 폴리펩타이드의 아미노산 서열의 하나 이상의 아미노산을 치환, 제거 및/또는 첨가함으로써 (m) 또는 (n)의 폴리뉴클레오타이드에 의해 코딩된 폴리펩타이드로부터 유도된 폴리펩타이드를 코딩하는 핵산 분자;
    (p) 서열이 (m)의 핵산 분자에 의해 코딩된 폴리펩타이드의 아미노산 서열과 56.3% 이상의 동일성을 갖는 폴리펩타이드로부터 유도된 폴리펩타이드를 코딩하는 핵산 분자;
    (q) (m) 내지 (p)중 어느 하나의 핵산 분자에 의해 코딩된 단편을 포함하고 아세틸-CoA 카복실화효소 활성을 갖는 핵산 분자;
    (r) 서열 번호 4 내지 6으로 표시된 프라이머를 사용하여 파피아 핵산 라이브러리로부터 증폭된 핵산 분자의 서열을 갖는 폴리뉴클레오타이드를 포함하는 핵산 분자;
    (s) 아세틸-CoA 카복실화효소 활성을 갖고 (m) 내지 (r)중 어느 하나에 의해 코딩된 폴리펩타이드 단편인 폴리펩타이드를 코딩하는 핵산 분자;
    (t) (m) 내지 (o)중 어느 하나의 폴리뉴클레오타이드의 15개 이상의 뉴클레오타이드를 포함하는 핵산 분자;
    (u) 아세틸-CoA 카복실화효소 활성을 갖고 (m) 내지 (s)중 어느 하나의 핵산 분자에 의해 코딩된 폴리펩타이드에 대해서 발생한 항체에 의해 인식되는 폴리펩타이드를 코딩하는 핵산 분자;
    (v) 엄중한 조건하에서 적당한 라이브러리를 (m) 내지 (u)중 어느 하나의 핵산 분자의 서열을 갖는 탐침으로 스크리닝함으로써 수득가능하고 아세틸-CoA 카복실화효소 활성을 갖는 폴리펩타이드를 코딩하는 핵산 분자; 및
    (w) 엄중한 조건하에서 상보적 가닥이 (m) 내지 (v)중 어느 하나의 핵산 분자와 하이브리드화되고, 아세틸-CoA 카복실화효소 활성을 갖는 폴리펩타이드를 코딩하는 핵산 분자
    로 구성된 군에서 선택된 하나 이상의 핵산 분자를 포함하는 단리된 폴리뉴클레오타이드.
  3. 제 1 항 또는 제 2 항에 있어서,
    폴리뉴클레오타이드가 서열 번호 3과 동일하거나 또는 56.3% 이상의 동일성을 갖는 아미노산 서열을 코딩하는 단리된 폴리뉴클레오타이드.
  4. 제 1 항 내지 제 3 항중 어느 한 항에 있어서,
    폴리뉴클레오타이드가 파피아 로도지마(Phaffia rhodozyma) 또는 크산토필로마이세스 덴드로우스(Xanthophylomyces dendrorhous) 균주로부터 유래하는 단리된 폴리뉴클레오타이드.
  5. 벡터내에 제 1 항 내지 제 4 항중 어느 한 항의 폴리뉴클레오타이드를 삽입하는 단계를 포함하는 재조합 벡터의 제조방법.
  6. 제 1 항 내지 제 4 항중 어느 한 항의 폴리뉴클레오타이드를 함유하거나 또는 제 5 항의 방법에 의해 제조되는 재조합 벡터.
  7. 제 6 항에 있어서,
    제 1 항 내지 제 4 항중 어느 한 항의 폴리뉴클레오타이드가 원핵 또는 진핵 세포내에서 발현하는 발현 조절 서열과 효과적으로 연결된 벡터.
  8. 제 6 항 또는 제 7 항의 벡터를 숙주 유기체내로 도입하는 단계를 포함하는 재조합 유기체의 제조방법.
  9. 제 8 항에 있어서,
    숙주 유기체가 이. 콜라이(E. coli), 바큘로바이러스 또는 사카로마이세스 세레비지애(S. cerevisiae)로부터 선택된 방법.
  10. 제 6 항 또는 제 7 항의 벡터를 함유하거나 또는 제 8 항 또는 제 9 항의 방법에 의해 제조된 재조합 유기체.
  11. 제 10 항의 재조합 유기체를 배양하는 단계 및 상기 재조합 유기체의 배양으로부터 폴리펩타이드를 회수하는 단계를 포함하는 아세틸-CoA 카복실화효소 활성을 갖는 폴리펩타이드의 제조방법.
  12. 제 11 항의 방법에 의해 수득가능한 폴리펩타이드.
  13. 제 12 항의 폴리펩타이드에 특이적으로 결합하는 항체.
  14. 제 1 항 내지 제 4 항중 어느 한 항의 폴리뉴클레오타이드에 대한 안티센스 폴리뉴클레오타이드.
  15. 제 14 항의 폴리뉴클레오타이드를 벡터내에 삽입하는 단계를 포함하는 재조합 벡터의 제조방법.
  16. 제 14 항의 폴리뉴클레오타이드를 함유하거나 또는 제 15 항의 방법에 의해 제조된 재조합 벡터.
  17. 제 16 항에 있어서,
    제 14 항의 폴리뉴클레오타이드가 원핵 또는 진핵 세포내에서 발현하는 발현 조절 서열과 효과적으로 연결된 벡터.
  18. 제 16 항 또는 제 17 항의 벡터를 숙주 유기체내로 도입하는 단계를 포함하는 재조합 유기체의 제조방법.
  19. 제 18 항에 있어서,
    숙주 유기체가 파피아 로도지마 또는 크산토필로마이세스 덴드로우스 균주에 속하는 방법.
  20. 제 16 항 또는 제 17 항의 벡터를 함유하거나 또는 제 18 항 또는 제 19 항의 방법에 의해 제조된 재조합 유기체.
  21. 제 20 항에 있어서,
    아세틸-CoA 카복실화효소의 유전자 발현이 숙주 유기체와 비교시 감소하는 특징이 있고, 그 때문에 숙주 유기체에 비해 증강된 수준에서 카로테노이드를 생산할 수 있는 재조합 유기체.
  22. 제 21 항에 있어서,
    아세틸-CoA 카복실화효소의 유전자 발현이 안티센스 기법, 특정부위 돌연변이유발, 오차 경향 PCR 및 화학적 돌연변이유발로 구성된 군에서 선택된 기법에 의해 감소되는 재조합 유기체.
  23. 제 21 항의 재조합 유기체를 배양하는 단계를 포함하는 카로테노이드의 제조방법.
  24. 제 23 항에 있어서,
    카로테노이드가 아스타잔틴, β-카로텐, 리코펜, 제아잔틴 및 칸타잔틴으로 구성된 군에서 선택된 하나 이상인 방법.
  25. 제 23 항에 있어서,
    아세틸-CoA 카복실화효소의 유전자 발현이 안티센스 기법, 특정부위 돌연변이유발, 오차 경향 PCR 또는 화학적 돌연변이유발로 구성된 군에서 선택된 기법에 의해 제 21 항의 재조합 유기체내에서 감소되는 방법.
  26. 적당한 조건하에서 미생물을 배양하는 단계 및 선택적으로 생성된 카로테노이드를 회수하는 단계에 의해 카로테노이드를 제조하는 방법으로서, 이때 미생물은 아세틸-CoA 카복실화효소의 유전자 발현이 예를 들어, 안티센스 기법, 특정부위 돌연변이유발, 오차 경향 PCR 및 화학적 돌연변이유발로 구성된 군에서 선택된 기법에 의해 감소됨을 특징으로 하는 방법.
KR1020057005191A 2002-09-27 2003-09-25 Acc 유전자 KR101196180B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02021625.5 2002-09-27
EP02021625 2002-09-27
PCT/EP2003/010683 WO2004029232A2 (en) 2002-09-27 2003-09-25 Acc gene

Publications (2)

Publication Number Publication Date
KR20050059197A true KR20050059197A (ko) 2005-06-17
KR101196180B1 KR101196180B1 (ko) 2012-11-01

Family

ID=32039109

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057005191A KR101196180B1 (ko) 2002-09-27 2003-09-25 Acc 유전자

Country Status (9)

Country Link
US (1) US7288395B2 (ko)
EP (1) EP1543123A2 (ko)
JP (1) JP2006500058A (ko)
KR (1) KR101196180B1 (ko)
CN (1) CN100425698C (ko)
AU (1) AU2003277902A1 (ko)
CA (1) CA2498381C (ko)
NO (1) NO20052073L (ko)
WO (1) WO2004029232A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2371967B1 (en) 2005-03-18 2015-06-03 DSM IP Assets B.V. Production of carotenoids in oleaginous yeast and fungi
AU2006243052B2 (en) * 2005-05-04 2010-07-08 Tmo Renewables Limited Thermophilic microorganisms with inactivated lactate dehydrogenase gene (LDH) for ethanol production
US8691555B2 (en) 2006-09-28 2014-04-08 Dsm Ip Assests B.V. Production of carotenoids in oleaginous yeast and fungi

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9726897D0 (en) 1997-12-20 1998-02-18 Zeneca Ltd Process
WO2000011199A1 (en) 1998-08-20 2000-03-02 Pioneer Hi-Bred International, Inc. COMPOSITIONS AND METHODS FOR ALTERING AN ACETYL-CoA METABOLIC PATHWAY OF A PLANT
DE60005871T2 (de) * 1999-03-09 2004-05-06 Dsm Ip Assets B.V. Astaxanthin Synthetase
ATE312928T1 (de) 2000-05-24 2005-12-15 Dsm Ip Assets Bv Verfahren zur herstellung von astaxanthin

Also Published As

Publication number Publication date
CA2498381C (en) 2013-04-16
WO2004029232A3 (en) 2004-10-14
AU2003277902A8 (en) 2004-04-19
KR101196180B1 (ko) 2012-11-01
CN1685042A (zh) 2005-10-19
US20060172372A1 (en) 2006-08-03
CN100425698C (zh) 2008-10-15
US7288395B2 (en) 2007-10-30
NO20052073L (no) 2005-06-27
AU2003277902A1 (en) 2004-04-19
WO2004029232A2 (en) 2004-04-08
EP1543123A2 (en) 2005-06-22
JP2006500058A (ja) 2006-01-05
CA2498381A1 (en) 2004-04-08
NO20052073D0 (no) 2005-04-27

Similar Documents

Publication Publication Date Title
KR100626511B1 (ko) 이소프레노이드의 향상된 생산 방법
CA2498800C (en) Sqs gene
AU2022200938A1 (en) Increasing lipid production and optimizing lipid composition
AU725340B2 (en) Improved methods for transforming Phaffia strains, transformed Phaffia strains so obtained and recombinant DNA in said methods
EP0955363A2 (en) Dna sequences encoding enzymes involved in production of isoprenoids
JP2000507451A (ja) カロテノイド生合成および代謝の遺伝子ならびにかかる遺伝子の選別システム
CN114395500A (zh) 酵母中的油酸生产
CA3104848A1 (en) Enzymes of luciferin biosynthesis and use thereof
CA2298869C (en) Astaxanthin synthetase
AU680551B2 (en) Glycerin-3-phosphate-dehydrogenase (GPDH)
KR101196180B1 (ko) Acc 유전자
Macrae et al. The ornithine decarboxylase gene of Caenorhabditis elegans: cloning, mapping and mutagenesis.
KR20220062331A (ko) 알파-이오논 및 베타-이오논의 생합성
Obara et al. Identification of a possible stem-cell-maintenance gene homologue in the unicelluler eukaryote Paramecium caudatum
US20030033627A1 (en) Lipoxygenase genes from Vitis vinifera
EP1546314A1 (en) Bhyd gene
CA2457807A1 (en) Ashbya gossypii enzymes

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150918

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160921

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee