KR101125448B1 - 모스 발현 증진 영역 - Google Patents

모스 발현 증진 영역 Download PDF

Info

Publication number
KR101125448B1
KR101125448B1 KR1020067002926A KR20067002926A KR101125448B1 KR 101125448 B1 KR101125448 B1 KR 101125448B1 KR 1020067002926 A KR1020067002926 A KR 1020067002926A KR 20067002926 A KR20067002926 A KR 20067002926A KR 101125448 B1 KR101125448 B1 KR 101125448B1
Authority
KR
South Korea
Prior art keywords
mepr
nucleic acid
expression
acid molecule
isolated nucleic
Prior art date
Application number
KR1020067002926A
Other languages
English (en)
Other versions
KR20060109869A (ko
Inventor
마르타 로드리귀즈프란코
볼프강 조스트
안드레아스 비이제
길버트 골르
Original Assignee
그리노파티온 바이오테크 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 그리노파티온 바이오테크 게엠베하 filed Critical 그리노파티온 바이오테크 게엠베하
Publication of KR20060109869A publication Critical patent/KR20060109869A/ko
Application granted granted Critical
Publication of KR101125448B1 publication Critical patent/KR101125448B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

본 발명은 야생형 핵 유래된 모스 발현 증진 영역 (MEPR)을 엔코딩하는 분리된 핵산 분자, 및 이러한 MEPR을 사용하여 재조합 폴리펩티드를 생성시키는 방법에 관한 것이다.

Description

모스 발현 증진 영역 {MOSS EXPRESSING PROMOTING REGIONS}
본 발명은 유전자적으로 변형된 진핵 숙주 세포에서 폴리펩티드의 발현을 증진시키는 단리된 핵산 분자에 관한 것이다.
유전자적으로 변형된 세포에서 단백질계 물질 (단백질, 펩티드, 폴리펩티드, 이들의 단편 및 이들 분자의 번역후 변형된 형태가 "폴리펩티드"로서 언급되었음(예를 들어, 실시예 부분에서는 유사어로 "단백질"과 함께 사용됨))의 발현은 이러한 진귀하고 가치있는 물질을 제조하기 위한 주요 근원이 된다. 유전자적으로 변형된 숙주 세포에서 이러한 폴리펩티드를 발현시키기 위한 DNA 영역이 존재해야하며, 이는 이러한 발현을 양성적으로 조절("활성화", "증진")한다. 이러한 영역의 중요한 예로는 프로모터가 있으며, 이는 RNA 폴리머라아제가 DNA에 결합하게 하여 mRNA로의 전사를 개시시킨다 (Watson et al., "Recombinant DNA" (1992), Chapter I. 1 and 2).
모스는 이들의 단순한 성질 (모스는 고등 식물 진화물의 기부(base)에 해당함)로 인해 고등 식물의 복잡한 생물학을 통찰할 수 있게 하기 때문에 식물 생리학 및 발생학을 연구하기 위한 유용한 물질로서 관심을 받아왔다. 모스의 단순한 형태 및 유리한 배양 가능성으로 인해 이들은 식물 생태학 및 발생 생물학 연구를 위한 인기있는 유기체 모델이다: 모스 종은 페트리 디쉬에서의 무균 배양 뿐만 아니라 예를 들어, 생반응기에서의 액체 배양을 포함하는 실험관내 기법을 이용하여 조절된 조건하에서 어려움 없이 배양될 수 있다. 반수성 배우체는 무균 배양으로 광자동영양적으로 성장 수 있으며, 배양 수준이 용이하게 관찰될 수 있다.
모스의 또 다른 주요 이점은 이들의 형질전환 능력이다: 수많은 연구에도 불구하고, 식물에서 표적화된 인테그레이션 비율은 10-4에 거의 도달하지 않으며, 이는 식물 작용성 유전체학을 위한 유전자 표적화 방법의 일반적인 이용을 어렵게 한다. 지금까지 연구되어 왔던 모든 기타 식물과 반대로, 모스 게놈(특히, 확립된 모스 모델 유기체 예컨대, 피스코미트렐라 파텐스(이의 분자적 유전적 특질의 재검토를 위해: Reski, 1999)에서 상동성 DNA의 인테그레이션이 상동성 재조합에 의한 표적화된 위치에서 우세하게 발생한다. 모스의 형질전환은 원형질체에 의한 플라스미드 DNA의 PEG-매개된 흡수, 유전자총 충격(microprojectile bombardment)에 의한 DNA 이송, 전기 천공법 및 미세주입을 통해 일반적이고 용이하게 수행된다(Cove et al., 1997). 형질전환 작제물의 디자인에 따라, 우세하게 불규칙하거나 표적화된 인테그레이션이 발생한다.
식물 생태학 연구를 위한 과학적 도구로서 모스의 사용에도 불구하고, 모스 세포에서 재조합 이종성 폴리펩티드를 생성시키는데 있어서의 모스의 사용은 효과적인 생성 방법을 이용가능하게 하지만 이는 지금까지 다소 제한되어 왔다 (예를 들어, EP 1 206 561 A에 기술된 바와 같은 원사체 모스 조직 배양).
진핵 숙주 세포 특히, 동물 세포 또는 고등 식물의 세포에서 형질전환 기법의 큰 한계는 항상 이러한 유전자이식 숙주 세포에서 외부 유전자의 항시적 고발현을 위한 효과적인 프로모터의 결여이다. 콜리플라워 모자이크 바이러스(CaMV) 35S 프로모터는 많은 형질전환 시스템에서 이러한 목적으로 널리 사용되어 왔으나 (예를 들어, WO 01/25456 A), CaMV 35S 프로모터는 일부 식물 종에서 낮은 활성을 나타냈다(특히, 모노코트, 예컨대, 벼(MaElroy et al., 1991.)). 모노코트 형질전환에 있어서, 벼 액틴 1 5' 영역은 단백질의 이종 발현에 사용되었다(McElroy et al., 1991.). 그럼에도 불구하고, 유전자적으로 변형된 진핵 숙주 세포에서 재조합(외부) 폴리펩티드를 발현시키기 위한 신규한 발현 증진 수단을 제공할 필요성이 여전히 존재한다.
모스, 특히 피스코미트렐라 파텐스에 있어서, 현재까지 어떠한 상동성(상동성의 경우, 모스 유래된 것으로 규정됨)의 적합한 핵 유래된 발현 프로모터 또는 기타 핵 유래된 발현 증진 서열이 공개되지 않았다(Holtdorf et al., 2002.). 따라서, 연구가들은 선택 마커 유전자 및 기타 대상 유전자의 발현을 위한 이종성 (이종성의 경우, 모스 유래되지 않은 것으로 규정됨) 프로모터를 사용하였다. 그러나, 이러한 프로모터중 단지 몇몇개만이 특정 모스에서 신뢰성 있게 작용하는 것으로 보고되었다(예를 들어, CaMV 35S-프로모터; [Holtdorf et al., 2002]에 요약됨; CaMV 35S-프로모터는 특정한 다른 종에서는 작용하지 않음 (Zeidler et al., 1999); TET-프로모터(Reski (1998)에서 검토됨)). 따라서, 모스를 유전적으로 조작하기 위한 다른 수단은 당해분야 예를 들어, 유전자-트랩 및 인핸서 트랩 시스템에서 개발되었다 (Hiwatashi et al., 2001; 그러나, 또한 짧아진 버젼의 CaMV 35S 프로모터를 사용하여, 저자는 일시적 발현 실험에서, 이렇게 짧아진 버젼의 35S 프로모터가 약한 프로모터로서 작용한다는 것을 보여주었으며; 사실상 상기 문헌은 인핸서-트랩 스트레인에서 리포터 유전자의 발현에 관한 것이며, 모스의 조정 엘리먼트에 대한 이들 발현 관계에 대해서는 나타내지 않았다).
반면, 상기 언급된 연구에 있어서, 상동성 재조합을 이용한 모스에서, 이종성 프로모터의 사용이 필요하며 (따라서, 상동성 프로모터는 필요하지 않으며, 게다가 대부분의 경우에 유용하지 않음), 재조합 폴리펩티드의 생성 또는 상동성 폴리펩티드의 과다발현을 위해 산업적으로 사용하기 위해 적합한 모스 유래된 발현 증진 수단이 필요하며, 이는 여전히 미해결책으로 있다. 이러한 발현 증진 수단은 적용된 배양 조건하에 안정적이고 항시적인 발현을 허용해야 하며, 바람직하게는, CaMV 35S 프로모터에 상응하거나 심지어 더 높은 발현이 수행되게 해야 한다.
따라서, 본 발명은 모스 발현 증진 영역(MEPR), 즉 야생형 모스로부터의 발현 증진 영역을 엔코딩하는 분리된 핵산 분자를 제공한다. 본 발명에 있어서, 모스 유래된 발현 영역(즉, 야생형 모스로부터의 기원하는 핵 유래된 영역)이 유전적으로 조작된 숙주 세포 특히, 모스에서 항시적 발현이 허용되도록 제공되어, 종래 기술에서 증가되는 이러한 도구의 필요에 부합하게 된다 (Holtdorf et al., 2002; Schaefer et al., 2002).
또한, 본 발명에 따른 MEPR의 필수적인 특징은 MEPR의 발현 증진 활성이 특이적 숙주 세포에서 작용하는 이종성 프로모터(예를 들어, 피스코미트렐라 파텐스에서 재조합 폴리펩티드의 발현에 있어서, CaMV 35S) 의 발현 증진 활성의 30% 이상, 바람직하게는 50% 이상이라는 점인데, 그 이유는 이러한 발현 증진 활성을 갖지 않는 모스 프로모터가 본 발명의 목적을 해결하는데 적합하게 사용될 수 없으며, 따라서 MERP로서 간주되지 않기 때문이다.
따라서, 본 발명에 따른 MEPR은 야생형 모스 즉, 비모스 종으로부터의 프로모터(예를 들어, 고등 식물 또는 (식물) 병원체의 프로모터 예컨대, CaMV 35S 프로모터, 또는 TET 프로모터)의 유입에 의해 유전적으로 변형되지 않은 모스의 핵으로부터 분리된다. 또한, 예를 들어, 자연적 스트레인 서열의 변이성 또는 MEPR의 분리 동안의 사건으로 인해 발생할 수 있는 마이너 서열 변이부 (예를 들어, 발현 증진 활성에 부정적으로 영향을 끼치지 않는 영역에서의 1, 2, 3, 4 또는 5개 염기의 변화)를 갖는 MEPR이 본 발명에 따른 MEPR로서 간주됨이 분명하다. 발현 증진 활성을 분석하거나 이러한 활성에 대한 마이너 서열 변이 효과를 분석하기 위한 방법은 당업자에게 이용가능하며(예를 들어, 공지된 CaMV 35S 작제물과의 비교에 의해), 또한 하기 실시예 부분에 기술되어 있다.
본 발명에 있어서, 이배체(sphorophyte) 특이적이지 않은 발현을 증진하는 MEPR은 항시적 MEPR, 바람직하게는 배우체 유래된 세포에서 발현을 증진하는 MEPR, 더욱 바람직하게는 원사체 세포에서 발현을 증진하는 MEPR로서 규정된다.
본 발명에 있어서, 항시적 발현은 바람직하게는, 광자동영양적으로 성장한 모스에 일반적으로 사용된 액체 배양 조건 예를 들어, 플라스크 배양, 생반응기 배양 (EP 1 206 561 A), 하기 기술된 일시적 발현 시스템에 사용된 조건하에 검출가능한 양의 단백질을 유도하는 단백질 발현으로서 규정된다. 따라서, 본 발명에 따른 MERP에 대한 항시적 발현은 바람직하게는, 배양 배지중의 특이적 배양 첨가물 없이, 또한 바람직하게는, 당, 피토호르몬 또는 이러한 물질의 혼합물 없이 유도되어야 한다. 항시적 발현은 안정된 모드로 수행되어야 하나; 이는 일시적일 수 있다.
본 명세서에 사용된 바와 같은 용어 "모스" 또는 "모스들"은 모든 비로파이트(bryophytes)(헤파틱스(hepatics) 또는 리버워츠(liverworts), 호른워츠(hornworts) 및 모스(mosses))를 포함한다. 모스에 대한 특징은 이들의 이형성 제너레이션스웨츠셀(Generationswechsel), 즉, 핵 DNA 양 및 형태학에 있어서 서로 구별되는 두개 세대의 변형이다. 이배체 포자체는 이의 초반기에만 광합성적으로 활성적이며, 지배적인 그린 반수성 배우체(green, haploid gametophyte)로부터 공급되어야 한다. 배우체는 두개의 형태학적으로 구별되는 형태로 존재한다: 주버나일 배우체(juvenile gametophyte) 소위, 원사체 및 어덜트 배우체(adult gametophyte) 소위, 가메토포(gametophor)로 존재한다. 원사체와 반대로, 어덜트 배우체(가메토포)는 성 기관을 갖는다.
본 발명에서, 일시적 발현은 하기 기술된 바와 같은 에피솜 핵산-기재 작제물의 모스 원형질체로의 유입으로서 규정되며, 벡터로부터의 일시적 발현을 유도하거나 허용하여 바람직하게는, 배지로 세포외 단백질을 분비한다. 원형질체는 모스 세포 바람직하게는, 배우체형 세포 더욱 바람직하게는, 원사체 세포로부터 유래된다.
본 발명에 따른 MEPR은 임의의 모스 종으로부터 취해지지만, MEPR은 바람직하게는 통상적 모델의 모스 종으로부터 단리된다. 따라서, MEPR은 바람직하게는, 피스코미트렐라, 푸나리아(Funaria), 스파그넘(Sphagnum), 세라토돈(Ceratodon), 마르찬티아(Marchantia) 및 스파에로카르포스(Sphaerocarpos), 특히 피스코미트렐라 파텐스, 푸나리아 히그로메트리카 및 마르찬티아 폴리모르파로부터 분리된다.
본 발명에 따른 적합한 MEPR은 SEQ ID Nos. 1 내지 27 또는 이의 발현 증진 단편으로부터 선택된다. "발현 증진 단편"은 특이적 숙주 세포에서 작용하는 이종성 프로모터(예를 들어, 피스코미트렐라 파텐스에서 재조합 폴리펩티드의 발현을 위한 CaMV)의 발현 증진 활성의 30% 이상, 바람직하게는 50% 이상의 MEPR의 발현 증진 활성을 갖는 MEPR의 단편이다.
본 발명에 따른 MEPR은 특이적 영역 예컨대, 프로모터 영역("프로모터"), 5' 비번역된 영역("5'-UTR"), 5'-인트론 또는 3'-UTR을 포함할 수 있다. 일부 MEPR에 있어서, 단지 5'-인트론만 함유하는 발현 증진 단편이 존재한다. 일반적으로, 프로모터는 발현 증진 단편으로서 단독으로 항상 활성적이다. 따라서, 본 발명에 따른 MEPR은 바람직하게는, 모스 프로모터 및 바람직하게는 5'-UTR 영역 및/또는 5'-인트론 및/또는 3'-UTR을 포함한다.
아직도 종종 충분하지만, 특정 항시적 발현에 도달하는 경우, 특히 재조합 폴리펩티드를 산업적으로 생성시키기 위한 높은 발현 속도를 달성하는 것이 많은 경우에 바람직하다. 본 발명에 따른 대부분의 MEPR은 특히, 상동성 시스템(예를 들어, 피스코미트렐라에서 폴리펩티드의 발현을 위한 피스코미트렐라 MEPR)에서의 CaMV 35S 프로모터 보다 주어진 재조합 폴리펩티드에 대한 현저하게 더 높은 발현율을 허용하는 것으로 입증되었다. 따라서, 본 발명에 따른 바람직한 MEPR은 특히, MEPR이 분리되는 모스 종 (이로 제한되는 것은 아님)에서 콜리플라워 모자이크 바이러스(CaMV)의 발현 증진 활성과 적어도 동일한 발현 증진 활성을 갖는다. 더욱 바람직한 MEPR은 특히, 이에 제한되는 것은 아니지만 MEPR이 분리되는 모스 종에서 콜리플라워 모자이크 바이러스(CaMV) 35S 프로모터의 발현 증진 활성의 200% 이상, 바람직하게는 500% 이상, 특히 1000% 이상의 발현 증진 활성을 갖는다.
바람직하게는, 본 발명에 따른 분리된 핵산은 바람직하게는 이에 제한되는 것은 아니지만 산업적 규모로 재조합 유전자이식 폴리펩티드를 생성시키기 위해 특이적 숙주 세포를 형질전환시키는데 사용된다. 따라서, 핵산 분자는 숙주 세포에서 이식유전자의 발현 및 형질 전환을 허용하는 적합한 벡터로서 제공된다. 본 발명에 따른 MEPR이 모스의 천연 프로모터를 대체하여 사용되어, 모스 게놈에 정위된 MPER의 조절하에 야생형 스트레인중에 일반적으로 존재하지 않는 상동성 모스 폴리펩티드를 발현시키는 가능성 중에, 본 MEPR의 보급된 산업적 적용가능성은 생성 숙주 세포 특히, 식물 세포 특히, 모스 세포에서 이종성("외종") 유전자의 발현 조정에 있다. 따라서, 본 발명에 따른 핵산 분자는 재조합 폴리펩티드 생성물을 위한 코딩 영역을 포함하며, 이러한 코딩 영역은 MEPR의 조정하에 있다.
본 발명에 따른 분리된 핵산 분자가 선택된 적합한 형질전환 방법을 가능하게 하는데 필요한 선택 마커 및/또는 추가의 영역을 추가로 포함하는 것 또한 유리하다(예를 들어, [Cove et al., 1997; Schaefer, 2002] 참조). 예를 들어, 표적화된 인테그레이션이 바람직한 경우, 본 발명에 따른 핵산 분자는 추가로 형질전환되는 종의 게놈 서열에 상동성인 서열을 추가로 포함해야 한다. 따라서, 분리된 핵산 분자는 형질전환될 종의 게놈으로 상동 재조합에 의해 표적화 인테그레이션이 가능하게 된다.
게다가, 본 발명에 따른 분리된 핵산 분자는 발현 증진 영역에 대한 콘센서스 서열을 스크리닝하고 규정하는데 사용될 수 있다. 발현 증진 활성에 중요하고/거나 필수적인 이러한 콘센서스 서열(영역, 박스)을 발견하고 스크리닝하는 것은, 특히 모스를 이용한 산업적 생물공학에 있어서 재조합 DNA 기법에 가치있는 자산이다.
또 다른 양태에 있어서, 본 발명은 또한, 하기 단계를 포함하는 진핵 숙주 세포에서 재조합 폴리펩티드 생성물을 발현시키는 방법에 관한 것이다:
- 본 발명에 따른 MEPR을 엔코딩하는 분리된 핵산 분자 및 선택적으로 재조합 폴리펩티드 생성물에 대한 코딩 영역을 포함하는 재조합 DNA 클로닝 비히클을 제공하는 단계로서, 상기 코딩 서열은 숙주중의 핵산 분자의 MEPR의 조정하에 있는 단계,
- MEPR의 조정하에 코딩 서열을 천연적으로 내포하고 있지 않은 상기 진핵 숙주 세포를 형질전환시키는 단계,
- 적합한 배양 배지에서 형질전환된 진핵 숙주 세포를 배양하는 단계,
- 상기 재조합 폴리펩티드를 발현시키는 단계, 및
- 발현된 재조합 폴리펩티드를 분리하는 단계.
상기 언급된 바와 같이, 원칙적으로 본 발명에 따른 MEPR은 다양한 세포 유형에서 항시적 발현을 달성할 수 있는 능력을 가지며, 숙주 세포는 식물 세포, 바람직하게는 모스 세포 특히, 피스코미트렐라 파텐스 세포로부터 바람직하게는 선택 된다.
본 발명에 특히 바람직한 시스템은 모스 원사체 배양물중의 배양이다 (원사체 모스 조직). EP 1 206 561 A 및 이의 바람직한 구체예에 기술된 방법은 본원에 참고문헌으로 인용되며, 본 발명에 즉식 적용가능하다.
본 발명에 따른 수단을 갖는 폴리펩티드의 항시적 발현은 배양 배지중의 다양한 첨가제 없이 특히, 특이적 분화를 위한 첨가제 또는 상이한 조직 성장을 증진시키기 위한 첨가제 없이 가능하다. 따라서, 전해질, 선택제 및 배지 안정제 이외에, 배양 배지는 바람직하게는 세포 공급을 위한 추가의 첨가제를 함유하지 않는다. 안정적으로 형질전환된 식물을 위한 배양 배지는 바람직하게는, 첨가 당, 피토호르몬 또는 이들의 혼합물을 첨가하지 않는 것이다. 일시적으로 형질전환된 원형질체를 위한 배양 배지는 바람직하게는, 피토호르몬을 첨가할 필요가 없다.
바람직한 모스 세포는 특히, 원사체 배양물중 피스코미트렐라, 푸나리아, 스파그넘, 세라토돈, 마르찬티아 및 스파에로카르포스 군의 모스 세포이다.
또 다른 양태에 있어서, 본 발명은 또한 폴리펩티드를 산업적으로 생성하기 위한 특히, 상기 폴리펩티드를 생성하는 재조합 세포를 제공하기 위한, MEPR을 엔코딩하는 분리된 핵산 분자의 용도를 제공한다. 산업적 생성은 예를 들어, 그램 양 또는 심지어 더 많은 양(대량 생산 수득량)으로 생반응기중의 주어진 대상 폴리펩티드의 대규모 제조를 가능하게 한다. 이는 연구 용도(mg 양) 또는 분석 목적 (㎍ 양)에 충분한 생성과 반대되며, 물론 본 발명에 의해서도 수행될 수 있다. 일시적 발현 시스템에서, 이러한 분석 목적에 충분한 양의 단백질은 본 DNA 분자로 용이하게 수득될 수 있다.
따라서, 본 발명은 또한, 모스 폴리펩티드의 발현을 위한 특히, 폴리펩티드를 발현하는 재조합 모스 세포를 제공하기 위한 MEPR을 엔코딩하는 분리된 핵산 분자의 용도를 포함하며, 이러한 모스 폴리펩티드의 발현은 MEPR에 의해 자연적으로 조절되지 않는다. 이러한 용도는 모스 폴리펩티드의 산업적 규모의 생성 및 연구 목적 둘 모두를 실행하는 것으로 감소될 수 있다.
또 다른 양태에 있어서, 본 발명은 또한, 특이적 번역후 변형과 관련된 단백질 (예를 들어, 글리코실트랜스퍼라아제) 발현을 위한 특히, 비형질전환된 모스 세포에서의 일반적으로 존재하지 않거나 일반적으로 또 다른 비로 존재하는 번역후 변형된 폴리펩티드를 발현하는 재조합 모스 세포를 제공하기 위한, MEPR을 엔코딩하는 분리된 핵산 분자의 용도를 제공한다.
또 다른 양태에 있어서, 본 발명은 대사 방식으로 관련된 단백질을 발현시키기 위한, 특히 대사물 예를 들어, 이차 대사물의 함량이 변형된 재조합 모스 세포를 제공하기 위한 MEPR을 엔코딩하는 분리된 핵산 분자의 용도를 제공한다.
또 다른 양태에 있어서, 본 발명은 또한 안티센스 분자, siRNA 분자 또는 리보자임의 발현을 위한 특히, 예를 들어, 형태학적으로 생화학적으로 변형된 표현형을 유도하는 감소된 양의 특이적 단백질을 갖는 재조합 모스 세포를 제공하기 위한 MEPR을 엔코딩하는 분리된 핵산 분자의 용도를 제공한다.
또 다른 바람직한 양태에 있어서, 본 발명은 또한 번역후 변형되는 단백질의 재조합 발현을 위한 특히, 번역후 변형된 단백질을 생성시키기 위한 본 발명에 따 른 MEPR을 엔코딩하는 분리된 핵산 분자의 용도에 관한 것이다. 이러한 기법으로, 천연 숙주 세포에서보다 다르게 특이적으로 번역후 변형되어 예를 들어, 식물 세포 또는 모스 배양물이 예를 들어, 포유동물 또는 심지어 사람 글리코실화 패턴을 갖는 단백질의 생성을 가능하게 하는 단백질을 생성시킬 수 있다. 특이적 글리코실트랜스퍼라아제가 적용되는 이러한 기법의 예로는 예를 들어, WO 00/49153 및 WO 01/64901 A에 기술되어 있다.
본 발명에 따른 MEPR을 엔코딩하는 분리된 핵산 분자의 또 다른 바람직한 용도는 재조합 단백질의 실험관내 발현에 관한 것이다. 실험관내 번역 기법은 숙주 세포로의 연결에 대한 불확실성을 수용해야할 필요성 없이 재조합 생성물의 더욱 조정된 생성을 가능하게 한다.
본 발명에 따른 핵산 분자의 또 다른 바람직한 용도는 대사 변형 단백질 예를 들어, 번역된 아미노산 사슬의 (번역후) 변형을 변화시키는 대사 변형 단백질의 재조합 발현을 위한 용도이다(예를 들어, [Berlin et al., 1994] 참조).
본 발명은 이에 제한되는 것은 아니지만 하기 실시예 및 도면에 의해 추가로 설명된다.
도면:
도 1. 피스코미트렐라 파텐스중의 β-투불린 유전자.
도 2. 피스코미트렐라 파텐스중의 β-투불린의 발현 증진 영역의 검정.
도 3. rhVEGF 작제물의 일시적 형질전환에 의한 Pptub 1의 발현 증진 영역의 검정.
도 4. rhVEGF 작제물의 일시적 형질전환에 의한 Pptub 2의 발현 증진 영역의 검정.
도 5. rhVEGF 작제물의 일시적 형질전환에 의한 Pptub 3의 발현 증진 영역의 검정.
도 6. rhVEGF 작제물의 일시적 형질전환에 의한 Pptub 4의 발현 증진 영역의 검정.
도 7. 피스코미트렐라 파텐스 액틴 유전자의 게놈 구조.
도 8. 상이한 5' 액틴 영역의 발현 활성 비교.
도 9. Ppact1 작제물.
도 10. Ppact 5 작제물.
도 11. Ppact 7 작제물.
도 12. Ppact3:: vegf 작제물.
도 13. Ppact1 프로모터:5' 인트론 치환.
도 14. Ppact1 프로모터: vegf 결실 작제물.
도 15. Ppact3 프로모터: vegf 결실 작제물.
도 16. Ppact5 프로모터: vegf 결실 작제물.
도 17. Ppact7 프로모터: vegf 결실 작제물.
도 18. 다양한 모스 종에서의 액틴 유전자, 및
도 19. 피스코미트렐라 파텐스 및 푸나리아 히그로메트리카로부터의 상동성 액틴 유전자의 프로모터 서열의 비교.
재료 및 방법
식물 재료
피스코미트렐라 파텐스(Hedw.) B.S.G.은 이전에 특성 결정되었다 (Reski et al. 1994). 문헌[H.L.K. Whitehouse in Gransden Wood, Huntingdonshire, UK]에 의해 수집되었던 스트레인 16/14의 2차 배양물이며, 엔겔(Engel(1968; Am J Bot 55, 438-446))에 의해 증식되었다.
표준 배양 조건
식물을 무기액 변형된 Knop 평면 배지(1000mg/l Ca(NO3)2 x 4H2O 250mg/l KCl, 250mg/l KH2PO4, 250mg/l MgSO4 x 7 H2O 및 12.5 mg/l FeSO4 X 7 H2O; pH 5.8 (Reski and Abel (1985) Planta 165, 354-358))에서 멸균 조건하에 무균적으로 성장시켰다. 식물을 200ml의 배양 배지를 함유하는 500ml의 에를렌마이어 플라스크(Erlenmeyer flask) 또는 고형화된 Knop 배지를 갖는 9cm 페트리 디쉬(10g/l 아가)에서 성장시켰다. 플라스크를 120rpm으로 세팅시킨 세르토매트 R 쉐이커 (Certomat R shaker :B.Braun Biotech International, Germany)에서 쉐이킹하였다. 성장 챔버의 조건을 25 +/-3℃ 및 16:8h의 명-암 기간으로 하였다. 배양물을 35 마이크로몰/m-2s-1을 제공하는 두개의 형광 튜브 (Osram L 58W/25)에 의해 위에서 조사시켰다. 액체 배양물의 2차 배양은 울트라-투락스 균질화 (Ultra-Turrax homogenizer: IKA, Staufen, Germany)를 이용한 분열 및 100ml의 새로운 Knop 배지를 함유하는 두개의 신규한 500ml의 에를렌마이어 플라스크의 접종에 의해 주 1회 수행하였다. 추가적으로, 배양물을 분열후 3 또는 4일에 여과시키고, 새로운 Knop 배지로 이동시켰다.
생반응기 배양물을 각각 5리터의 작업 용적 (문헌[Hohe and Reski, Plant Sci. 2002, 163, 69-74]에 기술된 바와 같음)을 갖는 교반된 탱크 유리 생반응기 (Aplikon, Schiedam, The Netherlands)에서 Knop 배지 또는 1/10 Knop 배지중에 성장시켰다. 500rpm의 속도로 마린 임펠러로 교반을 수행하였으며, 배양물을 0.3vvm [(통기 용적)/(배지 용적)/분] 공기로 통기시켰다. 용기중의 25℃의 배양 온도를 이중 자켓 냉각 시스템으로 조절하였다. 16/8h의 명/암 리듬을 갖는 형광 튜브 (Osram L 8W/25)로 50 마이크로몰/m-2s-1의 조명도를 제공하였다. 배양물의 pH 값 (pH 6.5-7.0)은 조절하지 않았다.
원형질체 분리
원형질체 분리를 위한 상이한 프로토콜 (Grimsley et al. 1977; Schaefer et al. 1991; Rother et al. 1994; Zeidler et al. 1999; Hohe and Reski 2002; Schaefer 2001)이 피스코미트렐라 파텐스에 대해 기술되어 있다. 본원에 제시된 작업을 위해서, 이전에 기술된 방법을 변형/조합시켜 이용하였다:
모스 조직을 감소된 (10%) Ca(NO3)2 함량을 갖는 Knop 배지중에서 7일 동안 배양하였다. 배양물을 분열 후 3 또는 4일에 여과시키고, 감소된 (10%) Ca(NO3)2 함량을 갖는 새로운 Knop 배지로 이동시켰다. 여과 후, 모스 원사체를 0.5M 만니톨중에서 사전배양하였다. 30분 후, 4% 드리셀라아제 (Sigma, Deisenhofen, Germany)를 현탁액에 첨가하였다. 드리셀라아제를 0.5M 만니톨 (pH 5.6-5.8)중에서 3600rpm으로 10분 동안 원심분리하고, 0.22㎛ 필터를 통해 통과시켜 멸균시켰다 (Millex GP, Millipore Corporation, USA). 1% 드리셀라아제 (최종 농도)를 함유하는 현탁액을 암실에서 실온하에 배양하고, 완만하게 진탕시켰다 (원형질체의 최대 수율이 배양 2시간 후에 달성되었다). 현탁액을 100 마이크로미터 및 50 마이크로미터 세공 크기를 갖는 체 (Wilson, GLF, Germany)를 통해 통과시켰다. 현탁액을 멸균 원심분리 튜브에서 원심분리하고, 원형질체는 실온에서 10분 동안 55g로 침전시켰다 (3의 가속; 3에서 감속; 멀티퓨즈 3 S-R, Kendro, Germany). 원형질체를 W5 배지중에 완만하게 재현탁시켰다 (125mM CaCl2 x 2 H2O; 137mM NaCl; 5.5mM 글루코오스; 10mM KCl; pH 5.6; 660-680 mOsm; 멸균 여과시킴; Menczel et al. 1981). 현탁액을 실온에서 10분 동안 55g에서 다시 원심분리하였다 (3의 가속; 3에서 감속; 멀티퓨즈 3 S-R, Kendro, Germany). 원형질체를 W5 배지중에서 완만하게 재현탁시켰다. 원형질체를 계수하기 위해, 소량의 현탁액을 푸치스-로센탈-챔버(Fuchs-Rosenthal-chamber)로 이송시켰다.
일시적 형질전환
형질전환을 위한 상이한 프로토콜 (Schaefer et al. 1991; Reutter and Reski 1996, Schaefer 2001)이 피스코미트렐라 파텐스에 대해 기술되어 있다. 본원에 제시된 작업을 위해, 이전에 기술된 방법을 변형/조합시켜 이용하였다:
형질전환을 위해, 원형질체를 암실 얼음위에서 30분 동안 인큐베이션하였다. 후속하여, 원형질체를 실온에서 10분 동안 55g로 원심분리하여 침전시켰다 (3의 가속; 3에서 감속; 멀티퓨즈 3 S-R, Kendro, Germany). 원형질체를 1.2 x 106 원형질체/ml의 농도로 3M 배지 (15mM CaCl2 x 2 H2O; 0.1% MES; 0.48M 만니톨; pH 5.6; 540mOsm; 멸균 여과됨, Schaefer et al. (1991) MolGen Genet 226, 418-424)중에 재현탁시켰다. 이러한 원형질체 현탁액 250마이크로리터를 새로운 멸균 원심분리 튜브에 분배시키고, 50 마이크로리터의 DNA 용액 (H2O중의 칼럼 정제된 DNA (Qiagen, Hilden, Germany, Hilden, Germany)); 10-100마이크로리터 광학 DNA 60 마이크로그램을 첨가하고, 최종적으로 250 마이크로리터의 PEG-용액 (40% PEG 4000; 0.4M 만니톨; 0.1M Ca(NO3)2; 오토클레이브 후 pH 6)을 첨가하였다. 현탁액을 즉시 그러나 완만하게 혼합한 후, 때때로 완만하게 혼합하면서 실온에서 6분 동안 인큐베이션시켰다. 1, 2, 3 및 4ml의 3M 배지를 첨가하면서 현탁액을 점진적으로 희석하였다. 현탁액을 20℃에서 10분 동안 55g로 원심분리하였다 (3의 가속; 3에서 감속; 멀티퓨즈 3 S-R, Kendro, Germany). 펠렛을 400 마이크로리터 3M 배지에 재현탁시켰다. 형질전환된 원형질체를 48 웰 플레이트에서 배양하였다 (Cellstar, greiner bio-one, Frickenhausen, Germany).
일시적 형질전환물을 25℃에서 희미한 불빛 (4.6마이크로몰-1m-2)에서 배양하였다. 샘플을 24h 및 48h 후에 각각 배지의 반 (200 마이크로리터)을 새로운 배지로 대체시키므로써 취하였다. 원형질체가 액체중에 유지되어야 하기 때문에 배지를 완전하게 대체시키지는 않았다. 제거된 배지 (재조합 단백질 포함)를 -20℃에서 보관하였다. 48h 샘플을 ELISA에서 측정하였다.
안정적인 형질전환
형질전환을 위한 상이한 프로토콜 (Schaefer et al. 1991; Reutter and Reski 1996, Protocol Schaefer 2001)은 피스코미트렐라 파텐스에 대해 기술되어 있다. 본원에 제시된 작업을 위해, 이전에 기술된 방법을 변형/조합시켜 이용하였다:
형질전환을 위해, 원형질체를 암실 얼음위에서 30분 동안 인큐베이션하였다. 후속하여, 원형질체를 실온에서 10분 동안 55g로 원심분리하여 침전시켰다 (3의 가속; 3에서 감속; 멀티퓨즈 3 S-R, Kendro, Germany). 원형질체를 1.2 x 106 원형질체/ml의 농도로 3M 배지 (15mM CaCl2 x 2 H2O; 0.1% MES; 0.48M 만니톨; pH 5.6; 540mOsm; 멸균 여과됨, Schaefer et al. (1991) MolGen Genet 226, 418-424)중에 재현탁시켰다. 이러한 원형질체 현탁액 250마이크로리터를 새로운 멸균 원심분리 튜브에 분배시키고, 50 마이크로리터의 DNA 용액 (H2O중의 칼럼 정제된 DNA (Qiagen, Hilden, Germany, Hilden, Germany)); 10-100마이크로리터 광학 DNA 60 마이크로그램을 첨가하고, 최종적으로 250 마이크로리터의 PEG-용액 (40% PEG 4000; 0.4M 만니톨; 0.1M Ca(NO3)2; 오토클레이브 후 pH 6)을 첨가하였다. 현탁액을 즉시 그러나 완만하게 혼합한 후, 때때로 완만하게 혼합하면서 실온에서 6분 동안 인큐베이션시켰다. 1, 2, 3 및 4ml의 3M 배지를 첨가하면서 현탁액을 점진적으로 희석하였다. 현탁액을 20℃에서 10분 동안 55g로 원심분리하였다 (3의 가속; 3에서 감속; 멀티퓨즈 3 S-R, Kendro, Germany). 펠렛을 3ml의 재생성 배지중에서 재현탁시켰다. 선택 공정을 문헌[Strepp et al. (1998)]에 기술된 바와 같이 수행하였다.
ELISA
일시적 형질전환된 모스 원형질체에 의해 발현된 재조합 VEGF121을 ELISA에 의해 정량하였다 (R&D Systems, Wiesbaden, Germany). 제조업자의 지시에 따라 ELISA를 수행하였다. 샘플을 정량을 위해 희석하였다.
박테리아 스트레인 및 클로닝 벡터
모든 클로닝 및 증식 실험에 있어서, 에스체리치아 콜리 스트레인 탑10(Escherichia coli strain Top10: Invitrogen, Karlsruhe, Germany)을 사용하였다. DNA-단편의 클로닝을 위해, pCR2.1-TOPO (Invitrogen, Karlsruhe, Germany), pCR4-TOPO (Invitrogen, Karlsruhe, Germany), pZErO-2(Invitrogen, Karlsruhe, Germany) 또는 pRT101 (Toepfet et al. (1987), NAR, 15, p5890)을 벡터로서 사용하였다.
게놈 DNA: 제조, 분해, 결찰
피스코미트렐라 파텐스 게놈 DNA를 CTAB 프로토콜에 따라 13일된 올드 원사체로부터 분리하였다 (Schlink and Reski, 2002).
게놈 DNA (3-5 마이크로그램)를 분해당 하나의 엔도누클레아제를 사용하여 37℃에서 2시간 동안 총 30 마이크로리터 용적의 30 유닛의 다양한 제한 엔도누클레아제 (예를 들어, BamHI, EcoRI, HindIII, KpnI, NcoI, NdeI, PaeI, PagI, XbaI; 모든 MBI Fermentas, St. Leon-Rot, Germany)로 분해하였다. 분해된 DNA를 공급업자의 매뉴얼에 따라 (30 마이크로리터 분해 + 200 마이크로리터 완충액 PB) PCR 정제 칼럼 (QIAGEN, Hilden, Germany)을 이용하여 정제하였다. 용출을 50 마이크로리터 용출 완충액 (EB; Qiagen, Hilden, Germany)중에서 수행하였다. 추가의 처리 전에, 10 마이크로리터의 용출물을 아가로스 겔(0.5%)상에서 검정하였다.
나머지 DNA를 300 마이크로리터의 총 용적으로 실온에서 2시간 동안 및 4℃에서 추가로 2일 동안 5 유닛 T4 리가아제 (MBI Fermentas, St. Leon-Rot, Germany)로 재결찰시켰다. 효소의 첨가 전에, 결찰 혼합물을 고정성을 띠는 말단 염기쌍을 용융시키기 위해 5분 동안 50℃에서 위치시킨 후, 얼음상에 위치시켰다. 0.3M Na-아세테이트 (pH 4.8)로 에탄올 침전시키고, 70% 에탄올로 2회 세척한 후, 재결찰된 DNA를 20 마이크로리터 EB중에 재현탁시켰다. 이러한 재결찰된 게놈 DNA 1 내지 3 마이크로리터를 I-PCR에 사용하였다.
RNA 제조
피스코미트렐라 파텐스 총 RNA를 액체 질소하에 조직을 분쇄하고, 공급업자 매뉴얼에 따라 E.Z.N.A. 플랜트 RNA Kit (PeqLab) 또는 RNeasy 플랜트 미니 키트 (Qiagne, Hilden, Germany)를 사용하여 제조하였다. 총 RNA를 겔 검정하고, 정량하고 (OD260), 각각 -20℃ 또는 -80℃에서 각각 저장하였다.
DNase 처리 및 첫 번째 스트랜드 cDNA 합성
1 마이크로그램의 총 RNA는 공급업자의 매뉴얼에 따라 11 마이크로리터의 총 용적중의 DNase (GIBCO BRL)로 분해하였다. 공급업자 매뉴얼에 따라 4,5 마이크로리터의 이러한 DNase 처리된 총 RNA (~400ng)를 올리고 dT(12-18) 프라이머 및 슈퍼스크립 II RNase H 역전사효소 (SUPERSCRIPT II RNase H Reverse Transcriptase : GIBCO BRL)와 함께 사용하여 첫번째 스트랜드 cDNA를 제조하였다. 생성된 cDNA를 멸균 ddH2O로 10배 희석시키고, -20℃에서 저장하였다.
일반적인 PCR
특별하게 지적되지 않는 한, PCR을 어드밴티지 cDNA 폴리머라아제 Mix (Advantage cDNA Polymerase Mix: BD Biosciences Clontech, Heidelberg, Germany)로 수행하였다. 모든 기타 PCR-방법에 있어서, 하기 DNA 폴리머라아제를 이용하였다: Taq 재조합 폴리머라아제 (MBI Fermentas, St. Leon-Rot, Germany), Pfu 천연 폴리머라아제 (MBI Fermentas, St. Leon-Rot, Germany), 플라티늄 Pfx DNA 폴리머라아제 (Invitrogen, Karlsruhe, Germany) 또는 트리플마스터 PCR 시스템 (Triplemaster PCR System: Eppendorf, Hamburg, Germany). 허가된 써모-사이클러 (Thermo-cyclers)는 마스터사이클러 그라디언트 (Mastercycler gradient (Eppendoft, Hamburg, Germany))이다. 모든 프라이머는 MWG 바이오테크 AG (MWG Biotech AG, Ebersberg, Germany)에 의해 합성하였다. PCR 생성을 위해, 공급업자의 매뉴얼에 따라 정제 또는 겔 용출 GFX PCR DNA 및 겔 밴드 정제 키트 (Amersham Bioscience, Freiburg, Germany)를 사용하였다.
재조합 플라스미드의 작제 및 클로닝
통상적인 분자 생물학 프로토콜은 문헌[Sambrook et al. (1989), Molecular Cloning: A Laboratory Manual, 2nd edn. Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press]에 실질적으로 기술되어 있다.
역 PCR (I-PCR) 및 이중 PCR
I-PCR을 총 25 마이크로리터중 0.25 마이크로리터의 어드벤티즈 cDNA 폴리머라아제 Mix 및 완충액 (3.5 mM Mg(0Ac)2 포함, 둘 모두 BD Biosciences Clontech, Heidelberg, Germany), 0.2mM의 각각의 프라이머, 0.2mM dNTP 및 1 내지 3 마이크로리터의 게놈 재결찰물 (상기 참조)로 수행하였다. 순환 조건은 다음과 같다: 초기 단계로서 96℃에서 2분 그 후, 이차 단계로서 96℃에서 20초, 초기에 67℃에서 10초 (터치다운: -0.15℃/사이클) 및 68℃에서 10분, 이를 35 내지 40회 반복, 종결 단계로서 68℃에서 20분 및 프로그램의 말미에 4℃로 냉각. PCR 생성물을 아가로스 겔로부터 용출시켰다. 30 마이크로리터로 용출을 수행하였다. 용출된 PCR 생성물을 TOPO TA 벡터 (pCR4-TOPO, Invitrogen, Karlsruhe, Germany)에서 직접적으로 클로닝하거나, 이중 PCR에서 재확인을 위해 템플레이트로서 사용하였다. 후속의 경우에, 겔 용출된 이중 PCR 생성물을 TOPO TA 벡터 (pCR4-TOPO, Invitrogen, Karlsruche, Germany)로 클로닝하였다. 이중 PCR의 순환 조건은 다음과 같다: 초기 단계로서 96℃에서 1분 그 후, 이차 단계로서 94℃에서 20초, 56℃에서 10초 및 68℃에서 4분, 이를 25회 반복하고, 종료 단계로서 68℃에서 10분.
증폭된 프로모터 단편의 클로닝을 위한 pRT101new의 생성
pRT101p21 (Gorr 1999)를 프라이머 320 및 321을 이용하여 Pfu 천연 폴리머라아제 (MBI Fermentas, St. Leon-Rot, Germany) (이러한 프라이머 및 모든 후속 프라이머에 있어서는 표 1 참조)로 재증폭시켰다. 프라이머 320 (전방향)은 VEGF 시그널 펩티드의 2nd 코돈(5'-(atg)acc...)에서 출발하였다. 프라이머 321 (역방향)은 35S 프로모터 (5'-gac...) 앞의 다중 클로닝 부위내에서 HincII 부위의 중간에서 출발하였다. 부가적인 XhoI 부위를 프라이머 321로 유입시켰다. PCR 생성물의 재결찰은 35S 프로모터의 손실 및 HincII 부위의 재구성을 유도하였다. VEGF의 서열을 시퀀싱에 의해 확인하였다. 이러한 신규한 벡터를 pRT101new로 칭하였으며, 리포트 유전자 앞의 각각의 XhoI 또는 HincII 부위를 통해 발현 증진 영역을 클로닝하는데 사용하였다.
시퀀싱
모든 서열 반응을 SEQLAB 시퀀스 라보라토리스 (SEQLAB Sequence Laboratories, Goettingen, Germany)에 의해 수행하였다.
소프트웨어
Sci Ed Central, Clone Manager Suite를 프라이머 설계, 페어와이즈(pairwaise) 및 다중 서열 정렬에 이용하였다. 레이저젠(Lasergene), DNASTAR (버젼 5) 메갈리긴 (Megalign) 및 SeqMan을 시퀀싱 데이타 검정에 사용하였다. 상동성 서치를 BLAST 2 (Altschul et al., 1997)에 의해 수행하였다.
본 발명은 모스 발현 증진 영역에 대해 네개의 실시예에 의해 설명된다: 먼저, 피스코미트렐라 파텐스의 다양한 수의 투불린 발현 증진 영역 패밀리의 분리 및 검정. 두번째 실시예에서, 다양한 상이한 모스로부터의 액틴 유전자 패밀리에 대한 발현 증진 영역이 제공되었다. 세번째 및 네번째 실시예는 유비퀴닌 발현 증 진 영역 및 RBCS 발현 증진 영역에 관한 것이다.
실시예 1: 피스코미트렐라 파텐스 β-투불린 유전자 및 이들의 발현 증진 영역의 클로닝 및 검정
개관
제 1 단계에서 피스코미트렐라 파텐스 (Pp)로부터의 β-투불린 (tub) 조절/프로모터 서열을 수득하기 위해, β-투불린 상동체의 코딩 서열을 폴리머라아제연쇄반응 (PCR)에 의해 분리하였다. 따라서, 아라비도프시스 탈리아나 (Arabidopsis thaliana : Attub 1-9)로부터의 모든 9개의 공개된 β-투불린 게놈 서열의 정열을 이용하여 고도로 보존된 코딩 영역내에 프라이머를 설계하였다 (8F, 9F 및 10R; 이러한 프라이머 및 모든 후속 프라이머는 표 1 참조). 또한, 피스코미트렐라 파텐스로부터의 공개 EST 데이타의 서열 정보를 이용하였으며, 단지 3개만이 β-투불린에 대한 상동성을 나타내었다. 이들중 하나는 예견된 코딩 영역의 업스트림의 유전자-특이적 프라이머 (F7)를 설계하는데 사용하였다. 상기 언급된 프라이머 및 EST 데이타로 유도된 모든 클로닝된 PCR 생성물의 서열을 비교하여 클론의 3 그룹으로 나누었으며, 이는 동일한 DNA를 가지나, 반드시 그런 것은 아니나 주로 인트론내의 차이로 인해 그룹간에 차이가 있다. 이러한 β-투불린 오쏘로그를 각각 Pptub1, Pptub 2 및 Pptub 3으로 칭하였다.
게다가, 이러한 작업을 수행하는 동안, 더 많은 EST 데이타가 이용가능하기 때문에 (2002년 초반에서 NCBI/dbEST에서 50000 초과의 새로운 엔트리), β-투불린에 대해 높은 유사성을 갖는 모든 121개 피스코미트렐라 파텐스 EST의 상세한 검정은 EST의 3개의 추가적인 새로운 업스트림 및 3개의 다운스트림 그룹을 유도하며, 이는 그룹내에서는 동일하나 다른 그룹 또는 Pptub 1-3과는 동일하지 않다. 각각의 새로운 그룹으로부터 예견된 비코딩 업스트림 및 다운스트림 영역 (하기 참조)으로부터 유래된 프라이머를 사용하고, 모든 프라이머 조합을 변화시킨 PCR은 특정 로커스 즉, Pptub 4, Pptub 5 및 Pptub 6으로의 상응하는 업스트림 및 다운스트림 그룹을 상호 관련시켰다. 모든 3개의 새로운 로커스의 게놈 및 cDNA 증폭물을 클로닝하고 시퀀싱하여, 피스코미트렐라 파텐스중의 β-투불린 오쏘로그의 수를 6개로 증가시켰다.
Pptub 1 내지 4 (Pptub 5 및 6에 상반됨)는 EST 데이타베이스에서 더욱 빈번하게 나타내어 진다. 상응하는 cDNA 라이브러리는 주로 원사체 및 어린 가메토포 (gametophore)로부터의 RNA를 사용하여 생성하였다. 이러한 4가지 유전자에 있어서, 수득된 서열 데이타에 기초하여 역 PCR 방법 (I-PCR)을 플랭킹 게놈 영역으로 워킹(walk)되도록 수행하였다.
Pptub 1
제 1 단계에서 이미 언급된 바와 같이, 프라이머 8F 및 10R을 사용하여 피스코미트렐라 파텐스 게놈 DNA에 대한 두개의 독립적인 PCR로부터의 Taq (MBI Fermentas, St. Leon-Rot, Germany) PCR 단편을 클로닝하였다. 각각의 PCR로부터의 하나의 클론 (2-1) 및 두개의 클론 (8-1, 8-2)을 부분적으로 시퀀싱하였으며, 동일한 것으로 밝혀졌다. 상응하는 로커스는 Pptub 1으로 칭하였다.
Pptub 1의 플랭킹 영역으로의 게놈 워크(walk)를 수행하기 위해, 재결찰된 EcoR I 및 Hind III 게놈 분해에 대해 I-PCR 방법을 이용하여 이러한 예비 서열 정보로 프라이머를 설계하였다 (프라이머 35, 36). 생성물의 재확인을 이중 PCR에 의해 수행하였다 (프라이머 40, 38). 이중 PCR 생성물 (E#1 및 H 1.7)에 의해 생성된 두개의 클론을 완전하게 시퀀싱하였다.
Hind III 클론 H 1.7은 가장 가능하게는 효소의 스타형 활성 또는 불규칙 ds 절단물의 결찰에 의해 내부 Hind III 부위를 내포하지 않는다. 그러나, 제 1 EcoR I 부위의 서열 업스트림을 게놈 DNA에 대한 두개의 독립적인 PCR에 의해 확인하였다 (프라이머 113, 67 및 113, 90). 또한, 추가적인 cDNA (89, 91; Pfu 천연 (MBI Fermentas, St. Leon-Rot, Germany)) PCR 생성물을 클로닝하였다.
모든 언급된 클론은 서열 데이타를 생성시키고 재확인하는 것을 돕는다. 총괄적으로, 개시 코돈의 ~1500 bp 업스트림 및 종료 코돈의 ~1500 bp 다운스트림을 수득하였다.
Pptub 2
상기 이미 기술된 바와 같이, 피스코미트렐라 파텐스로부터의 공개된 EST의 서열 정보를 사용하여 예견된 코딩 영역의 유전자-특이적 프라이머 (F7) 업스트림을 설계하였다. 피스코미트렐라 파텐스 게놈 DNA (프라이머 F7, 10R)에 대한 PCR 및 PCR 생성물의 후속적 클로닝 및 시퀀싱은, 이러한 생성물이 지금까지 공개된 Pptub EST (Pptub EST 1-3) 세개 모두와 함께 하나의 로커스 소위 Pptub 2에 속한다는 것을 입증해준다. 인트론 위치는 EST를 게놈 서열과 비교하므로써 입증될 수 있다.
Pptub 2의 인접한 게놈 영역으로의 게놈 워크를 수행하기 위해, 재결찰된 Pag I, BamH I 및 Nde I 게놈 분해에 대해 I-PCR 방법을 이용하여 이러한 예비 서열 정보로 인트론내의 유전자-특이적 프라이머 (프라이머 95 및 71)를 설계하였다. 이중 PCR 생성에 의해 PCR 생성물을 재확인하였다 (프라이머 38, 35). 이중 PCR에 의해 생성된 두개의 클론 (C#2Pag 및 D#2Nde)을 완전하게 시퀀싱하였다. Nde I 클론 D#2는 가장 가능하게는, 불규칙 ds 절단물의 결찰 또는 효소의 스타형 활성으로 인해 내부 Nde I 부위를 내포하지 않는다. 그러나, 서열 데이타는 C#2Pag 및 제 3 I-PCR 클론 (95#8BamHI; 프라이머 149 및 71)에 의해 확인하였다. 또한, 게놈 DNA에 대한 두개의 독립적인 PCR (프라이머 205, 149; Taq (MBI Fermentas, St. Leon-Rot, Germany) 및 프라이머 205, 206)로 생성물 길이를 확인하였다. 205-206 PCR 생성물 및 추가의 게놈 다운스트림 PCR 생성물 (프라이머 71, 206; Pfu 천연 (MBI Fermentas, St.Leon-Rot, Germany))을 클로닝하였으며, 이는 서열 데이타를 입증하는 것을 돕는다.
모든 언급된 클론은 서열 데이타를 생성시키고 재확인시키는 것을 돕는다. 총괄적으로, 개시코돈의 ~1400bp 업스트림 내지 종료코돈의 ~1400bp 다운스트림을 수득하였다.
Pptub 3
제 1 단계에서 상기 언급된 바와 같이, 프라이머 9F 및 10R을 사용하여 피스코미트렐라 파텐스 게놈 및 cDNA에 대한 두개의 독립적인 PCR로부터 Taq (MBI Fermentas, St. Leon-Rot, Germany) PCR 단편을 클로닝하였다. 각각의 PCR로부터의 클론 (#3-3 게놈, #4-3 cDNA)을 부분적으로 시퀀싱한 결과, 동일한 것으로 밝혀졌다. 상응하는 로커스를 Pptub 3로 칭하였다.
Pptub 3의 인접한 영역으로의 게놈 워크를 수행하기 위해, 재결찰된 Pag I 및 Nco I 게놈 분해물에 대한 I-PCR 방법을 이용하여 이러한 예비 서열 정보로 인트론내의 유전자-특이적 프라이머 (프라이머 69 및 70)를 설계하였다. 이중 PCR에 의해 PCR 생성물을 재확인하였다 (프라이머 38, 35). 두개의 클론 (A#1Nco 및 #4-1Pag)을 완전하게 시퀀싱하였다. A#1Nco가 이중 PCR 생성물 (38, 35)에 의해 생성된 클론인 반면, #4-1PagI은 원래의 I-PCR 생성물 (69,70)에 의해 생성되었다. 또한, 게놈 PCR 생성물 (프라이머 203, 204)을 클로닝하였으며, 이는 서열 데이타 입증을 돕는다.
모든 언급된 클론은 서열 데이타를 생성시키고 재확인시키는 것을 돕는다. 총괄적으로, 개시코돈의 ~1900bp 업스트림 내지 종료코돈의 ~1100bp 다운스트림을 수득하였다.
Pptub 4
이미 언급된 바와 같이, Pptub 4의 경우에, 게놈 및 cDNA 클론을 생성시키기 위해 EST 데이타를 이용하여 유전자-특이적 다운스트림 및 업스트림 프라이머 (297, 299)를 설계하였다. 천연 Pfu 폴리머라아제 (MBI Fermentas, St. Leon-Rot, Germany)를 사용한 추가적인 게놈 클론은 서열 데이타를 입증하는 것을 돕는다.
프라이머 297 및 299를 역으로 하고 (프라이머 337 및 383), 이를 재결찰된 Nde I 및 Nco I 게놈 절단에 대해 I-PCR 방법을 이용하여 Pptub 4의 인접한 게놈 영역으로의 워크를 수행하는데 사용하였다. 두개의 클론 (48#2Nco 및 A02#3Nde) 및 추가적인 게놈 클론 (프라이머 547 및 374; 어드밴티지 cDNA 폴리머라아제 Mix (BD Biosciences Clontech, Heidelberg, Germany) 및 트리플 마스터 (Triple Master: Eppendorf, Hamburg, Germany))을 생성시켰다.
모든 언급된 클론은 서열 데이타를 생성시키고 재확인시키는 것을 돕는다. 총괄적으로, 개시코돈의 ~2300bp 업스트림 내지 종료코돈의 ~1100bp 다운스트림을 수득하였다.
Pptub 5 및 6
이미 언급된 바와 같이, Pptub 5 및 6의 경우에, 각각의 유전자의 게놈 및 cDNA 클론을 생성시키기 위해 EST 데이타를 사용하여 유전자-특이적 다운스트림 및 업스트림 프라이머 (Pptub 5: 298, 300 및 Pptub 6: 296, 336)를 설계하였다. Pptub 5의 경우에, 천연 Pfu 폴리머라아제 (MBI Fermentas, St.Leon-Rot, Germany)를 사용한 추가적인 게놈 클론은 서열 데이타를 입증하는 것을 돕는다.
모든 언급된 클론은 서열 데이타를 생성시키고 재확인하는 것을 돕는다. 총괄적으로, Pptub 5에 대한 2031bp 게놈 서열 및 Pptub 6에 대한 3161 bp 게놈 서열을 수득하였다.
클로닝 방법
Taq 재조합 폴리머라아제로 예비 Pptub 1 (2-1, 8-1, 8-1; 모두 게놈) 및 Pptub 3 (3-3 게놈, 4-3 cDNA) 클론을 생성시켰다. PCR 생성물을 TOPO TA 벡터로 결찰시켰다 (pCR4-TOPO, Invitrogen, Karlsruhe, Germany). PCR 조건은 다음과 같다: 25 마이크로리터 총 부피중의 2.5 유닛 Taq 재조합 폴리머라아제, 효소 완충제, 3.3mM MgCl2 (모든 MBI Fermentas, St. Leon-Rot, Germany), 각각의 0.4mM 프라이머, 템플레이트로서의 100 나노그램의 cDNA 또는 게놈 DNA. 순환 조건은 다음과 같다: 초기 단계로서 95℃에서 5분, 2 단계로서 95℃에서 45초, 60℃ (프라이머 8F) 또는 65℃(프라이머 9F)에서 10초, 및 72℃에서 1분, 이를 30 내지 35회 반복, 그 후, 종료 단계로서 72℃에서 5분 및 프로그램 끝에 4℃로 냉각.
모든 다른 기타 게놈 및 cDNA 클론은 다음과 같다:
Pptub 1: 113-67, 113-90, 89-90, 89-91 cDNA
Pptub 2: F7/R10, 205-206, 71-206
Pptub 3: 203-204
Pptub 4: 547-374 (+ 트리플마스터(TrippleMaster), 297-299 cDNA + 게놈 (+Pfu)
Pptub 5: 298-300 cDNA + 게놈 (+Pfu)
Pptub 6: 296-336 cDNA + 게놈
상기 밑줄친 클론을 20 마이크로리터 PCR 당 0.25 마이크로리터 효소 혼합물, 완충제 (3.5 mM Mg(OAc)2 포함, 둘 모두 BD Biosciences Clontech, Heidelberg, Germany), 각각의 0.25mM 프라이머, 0.25mM dNTP 및 10-20 나노그램의 템플레이트를 사용한 어드밴티지 cDNA 폴리머라아제 믹스 (Advantage cDNA polymerase Mix)로 생성시켰다. 순환 조건은 다음과 같다: 초기 단계로서 96℃에서 2분 그 후, 이차 단계로서 96℃에서 20초, 60℃에서 10초 및 68℃에서 2분/kb, 이를 35회 내지 40회 반복, 종료 단계로서 68℃에서 15분 및 프로그램 끝에 4℃로 냉각. 적합한 길이의 PCR 생성물을 아가로스 겔로부터 용출시켰다. 용출은 증폭의 양에 따라 30-50 마이크로리터중에서 수행하였다. 용출된 PCR 생성물은 TOPO TA 벡터에서 클로닝하였다 (pCR4-TOPO, Invitrogen, Karlsruhe, Germany).
두개의 추가적인 게놈 클론 297-299 및 298-300으로서의 모든 다른 클론을, 20 마이크로리터 PCR 당 0.3 마이크로리터의 폴리머라아제 (=0.75 유닛), 완충제, 2-4mM MgSO4(모두 MBI Fermentas, St. Leon-Rot, Germany), 각각의 0.25mM 프라이머, 0.2mM dNTP 및 10-20 나노그램의 템플레이트를 이용하여, Pfu 천연 폴리머라아제로 생성시켰다. 순환 조건은 다음과 같다: 초기 단계로서 96℃에서 2분, 이차 단계로서 96℃에서 20초, 60℃에서 10초 및 72℃에서 2분/kb, 이를 35회 내지 40회 반복, 종료 단계로서 72℃에서 10분 및 프로그램 끝에 4℃로 냉각. 적합한 길이의 PCR 생성물을 아가로스 겔로부터 용출시켰다. 용출은 증폭물의 양에 따라 30-50 마이크로리터로 수행하였다. 용출된 PCR 생성물을 EcoRV로 선형화된 pZErO-2 (Invitrogen, Karlsruhe, Germany)에 클로닝하였다.
20 마이크로리터 PCR 당 0.25 마이크로리터의 폴리머라아제 혼합물 (=1.25 유닛), 튜닝 완충제 (2.5mM Mg2+ 포함, 둘 모두 Eppendor, Hamburg, Germany), 각각의 0.2mM 프라이머, 0.2mM dNTP 및 10-20 나노그램의 템플레이트를 이용하여 547-374의 추가적인 클론을 트리플마스터 (TripleMaster) PCR 시스템으로 생성시켰다. 순환 조건은 다음과 같다: 초기 단계로서 96℃에서 2분, 그 후, 이차 단계로서 96℃에서 20초, 60℃에서 20초 및 72℃에서 3분, 이를 40회 반복, 종료 단계로서 72℃에서 10분 및 프로그램 끝에 4℃로 냉각. 적합한 길이의 PCR 생성물을 아가로스 겔로부터 용출시켰다. 용출은 증폭물의 양에 따라 30-50 마이크로리터중에서 수행하였다. 용출된 PCR 생성물은 TOPO TA 벡터에 클로닝하였다 (pCR4-TOPO, Invitrogen, Karlsruhe, Germany).
요약하면, 피스코미트렐라 파텐스의 게놈 DNA에 대한 PCR 및 PCR 생성물의 클로닝은 6개의 전사된 피스코미트렐라 파텐스 β-투불린 유전자의 서열 정보를 유도한다. 또한, EST 및 cDNA 데이타를 게놈 서열 데이타 및 인트론/엑손 경계를 확인하는데 사용하였다. Pptub 1 내지 4의 경우, 역 PCR은 비전사된 플랭킹 5' 및 3' 게놈 서열을 유도한다. 모두 6개의 게놈 영역의 일반적인 개관이 도 1에 제공되어 있다.
유전자 구조 및 보존
이미 강조된 바와 같이, Pptub 1 내지 4는 EST 데이타베이스에서 가장 풍부하게 나타난다. 또한, 이들의 상응하는 EST의 대부분은 전장 cDNA 라이브러리로부터 발생한다. 이러한 두가지 사실은 인 실리코에서 Pptub 1 내지 4의 전사 출발 부위 (TSS)를 측정하는데 도움을 준다. 상응하는 업스트림 게놈 영역에 대한 5' EST의 다중 정렬은 Pptub 1 내지 3이 정확한 전사 개시부를 갖는다는 것을 보여준다: Pptub 1에 있어서는 27개 5' EST중 20개, Pptub 2에 있어서는 20개 5' EST중에서 16개, 및 Pptub 3에 있어서는 14개 5' EST중에서 9개는 +1로 표시한 동일한 가장 업스트림 위치에서 개시된다 (도 3-6). 또한, 모든 3개의 TSS는 콘센서스 서열에 의해 둘러쌓여진다 (하기 참조). Pptub 4의 경우에, 23개의 5' EST는 100bp내 의 다중 TSS를 나타낸다. 가장 업스트림 5' EST의 개시 부위는 +1로 나타내었다.
상응하는 다운스트림 게놈 영역에 대한 3' EST의 유사한 다중 정렬은, 식물 유전자가 하나 초과의 폴리(A)를 거의 항상 동반하며, 콘센서스 서열은 예를 들어, 서열 AAUAAA가 긴밀하게 편재된 포유동물에서 보다 더욱 덜 첨예하게 규정된다는 것을 재확인시켜 준다 (참조를 위해 [Rothnie et al., 1996] 참고).
피스코미트렐라 파텐스의 6개의 클로닝된 로커스는 어떠한 넌센스 종료-코돈을 나타내지 않았으며, 공지된 β-투불린과 높은 유사성을 갖는 적합한 단백질이 예견될 수 있다. 일반적으로 코딩 영역 이외에서는, 유사성은 즉시적이고 현저하게 하락된다. 5' 추정 조절 엘리먼트에 있어서, 모든 4개의 업스트림 영역의 상세한 비교는 유전자 패밀리내의 또는 기타 공지된 식물 β-투불린 유전자의 5' 영역에 대한 전반적인 보존은 나타나지 않는다. 그러나, 유전자 패밀리내의 보존의 일부 흥미로운 매치가 검출될 수 있다.
a) 모든 3가지의 경우에서 Pptub 1 내지 3의 측정된 TSS는 콘센서스 서열 T/C C A(+1) G/C T G T G C 내에 속하며, C/T-풍부 영역에 포함된다 (171 비관련 TATA 식물 프로모터의 콘센서스 비교: http://mendel.cs.rhul.ac.uk/mendel.php?topic=plantprom의 plantProm 데이타베이스 T/C C A(+1) N M N).
b) TSS-이는 식물 TATA 프로모터에 대한 전형적 간격내에 위치함 (plantProm DB 참조)-의 22-24bp 업스트림인, 20-25bp의 보존된 스트레치내에 포함된 약한 8bp TATA 박스는 Pptub 1 내지 3에 발견될 수 있다. 171 비관련된 식물 프로모터로부터의 TATA 박스 콘센서스는: T96 A95 T96 A100 A62/T38 A97 T61/A38 A73 (plantProm DB 참조)이며, Pptub 1-3에 있어서는: T t T A T c T c/t/A이며, 대문자는 콘센서스와의 상호관계를 나타낸다.
c) 모든 4개의 유전자는 이들의 5' UTR에서 매우 낮은 등급의 아데노신 (9-16%)을 갖는다.
d) Pptub 4의 5' UTR은 74%의 전반적인 C/T 함량을 가지며, 또한 최단의 가장 다운스트림의 5' EST의 개시 지점 바로 뒤에 C/T 스트레치 (~50 bp)를 내포한다.
e) Pptub 2는 TSS의 약 450 bp 업스트림의 40bp 폴리A 스트레치를 내포한다 (-450번에서 -489번까지).
f) Pptub 1 및 4에서, A/T-풍부한 긴 영역이 약 -420번 위치의 업스트림에서 개시되며 (Pptub 1: 대략 900bp에 대한 80% 초과의 A/T, Pptub 4: 1750bp에 대한 75% A/T), 이는 이러한 유전자의 업스트림의 위치 골격/매트릭스 부착된 영역 (S/MAR; (Liebich et al., 2002) 이러한 유전자의 업스트림)에 대한 가능성이 열려있음을 나타낸다.
β-투불린 프로모터의 작용적 특징화 및 정량화
최대 프로모터 활성을 제공하는 최소 프로모터-단편의 규정은 발현 시스템으로서 비재생 피스코미트렐라 파텐스 원사체를 이용하여, 일시적 발현 시스템에서 Pptub 1 내지 4의 추정 5' 조절 서열의 기능적 정량화에 의해 수행된다. 각각의 프로모터에 있어서, 업스트림 영역 및 5' UTR을 포함하는 상이한 길이의 여러 작제물은 리포터 유전자의 개시코돈 앞으로 정확하게 유도된다. 리포터 유전자로서, 사람 단백질 (재조합 사람 혈관내피세포 성장 인자 121: rhVEGF121; Gorr 1999)을 이의 고유의 시그널펩티드를 통해 배지로 분비되었다. 모스 배양물의 상청액중의 rhVEGF121의 양은 ELISA에 의해 정량화되고, 시스템에서 프로모터 또는 프로모터 단편의 강도를 반영한다. 값은 35S 프로모터에 의해 수득된 값과 관련이 있다. 각각의 작제물을 2 내지 3개의 상이한 형질전환 실험에서 최소 6배 형질전화시켰다. 샘플을 각각 24시간 및 48시간 후에 취하고, 48시간짜리 샘플은 ELISA중에서 적합하게 희석시켜 두번 측정하였다. 전반적인 결과는 도 2에 도시되어 있다.
Pptub 1 내지 4의 발현 증진 영역이 SEQ ID NO. 1 내지 8에 기재되어 있다.
Pptub 1 내지 4의 증폭된 프로모터 단편의 pRT101new로의 클로닝
Pptub 1: 1-0 (프라이머 364XhoI, 363cat)
1-1 (프라이머 219XhoI, 363cat)
1-3 (프라이머 549XhoI, 363cat)
1-4 (프라이머 226XhoI, 363cat)
1-5 (프라이머 550XhoI, 363cat)
Pptub 2: 2-0 (프라이머 291, 225cat)
Pptub 3: 3-0 (프라이머 292, 223cat)
Pptub 4: 4-0 (프라이머 373XhoI, 374cat)
4-1 (프라이머 548XhoI, 374cat)
상기 제공된 프로모터 단편을 ATG 개시 코돈 (cat ...)의 역 상보적 서열로 개시되는 역방향 프라이머, 및 부분적으로 XhoI 부위를 함유하는 전방향 프라이머를 이용하여 게놈 DNA상에서 Pfu 천연 폴리머라아제 (MBI Fermentas, St. Leon-Rot, Germany)로 증폭시켰다. PCR 생성물을 XhoI로 절단하고, XhoI/HincII으로 결찰시키거나, 모두 절단하지 않고, HincII 개방된 pRT101new로 각각 결찰시켰다. 생성된 클론을 시퀀싱에 의해 입증하였다. 클론 1-2(XhoI/EcoRI), 2-1(BglII), 2-2(SalI), 2-3(EcoRI/SalI), 2-4(EcoRI/SalI), 3-2(SalI), 3-3(Eco147I/HincII), 3-4(XhoI/SalI)를 더 긴 클론의 내부 결실에 의해 생성시켰다. 나머지 벡터를 겔 용출시키고 재결찰시켰다. 단일 스트랜드 오버행(overhang)이 맞춰지지 않는 경우, 공급업자의 매뉴얼에 따라 클레나우 단편(Klenow Fragment: MBI Fermentas, St. Leon-Rot, Germany)으로 오목한 3'-말단을 충전시킨 후 결찰을 수행하였다.
Pptub 1
6개의 상이한 프로모터 길이를 리포터 유전자 앞에서 형질전환 벡터 pRT101p21로 클로닝하였다. 모든 작제물의 데이타는 도 3에 제공되어 있다 (5' UTR = +1 (TSS)에서 +226까지, +227=ATG).
1-0 -1307bp (Pptub 1의 1533 bp 5' 영역)
1-1 -985bp (Pptub 1의 1211 bp 5' 영역)
1-2 -416bp (Pptub 1의 642 bp 5' 영역)
1-3 -248bp (Pptub 1의 474 bp 5' 영역)
1-4 -83bp (Pptub 1의 309 bp 5' 영역)
1-5 -71bp (Pptub 1의 297 bp 5' 영역)
프로모터 단편 1-2는 높은 발현율을 제공하는 가장 짧은 프로모터 단편으로서 규정될 수 있다. 발현율은 35S 프로모터로 유도된 값을 100%라고 할때, 이 값과 비교하여 약 150%이다. 최소 프로모터 단편 1-2의 업스트림인 긴 A/T 풍부 영역이 개시되었음을 주목하라 (약 900bp에 있어서 80% 초과의 A/T).
Pptub 2
5개의 상이한 프로모터 길이를 리포터 유전자 앞에서 형질전환 벡터 pRT101p21로 클로닝하였다. 모든 작제물의 데이타는 도 4에 제공되어 있다. (5' UTR = +1 (TSS)에서 +122까지, +123 = ATG).
2-0 -1075bp (Pptub 2의 1197bp 5' 영역)
2-1 -676bp (Pptub 2의 798bp 5' 영역)
2-2 -425bp (Pptub 2의 547bp 5' 영역)
2-3 -245bp (Pptub 2의 367bp 5' 영역)
2-4 -67bp (Pptub 2의 189bp 5' 영역)
프로모터 단편 2-2는 높은 발현율을 제공하는 가장 짧은 프로모터 단편으로서 규정될 수 있다. 발현율은 35S 프로모터로 유도된 값에 필적한다 (100%).
Pptub 3
상이한 프로모터 길이를 리포터 유전자 앞에서 형질전환 벡터 pRT101p21로 클로닝하였다. 4개의 작제물의 데이타는 도 5에 제공되어 있다 (5' UTR = +1 (TSS)에서 +112까지, +113=ATG).
3-0 -1274bp (Pptub 3의 1386bp 5' 영역)
3-2 -765bp (Pptub 3의 879bp 5' 영역)
3-3 -272bp (Pptub 3의 384bp 5' 영역)
3-4 +52bp (Pptub 3의 60bp 5' UTR)
프로모터 단편 3-2는 높은 발현율을 제공하는 가장 짧은 프로모터 단편으로서 규정될 수 있다. 발현율은 35S 프로모터로 유도된 값을 100%라고 할 때, 이 값과 비교하여 약 300%이다.
Pptub 4
두개의 상이한 프로모터 길이를 리포터 유전자 앞에서 형질전환 벡터 pRT101p21로 클로닝하였다. 데이타는 도 6에 제공되어 있다 (5' UTR = TSS (+1에서 +103까지)에서 +205까지, +206=ATG).
4-0 -419bp (Pptub 4의 624bp 5' 영역)
4-1 -1bp (Pptub 4의 206bp 5' 영역)
프로모터 단편 4-1은 35S 프로모터로 유도된 값을 100%라고 할 때, 이 값과 비교하여 약 250%이다. 이러한 최소 프로모터 단편 (4-0)의 업스트림인 긴 A/T 풍부 영역이 개시되었음을 주목하라 (1750bp에 있어서 75% A/T).
요약하면, Pptub 1 내지 4 게놈 업스트림 영역의 일시적 프로모터 활성을 특징화하였다. 최대 프로모터 활성을 나타내는 최소 프로모터 단편을 규정하고, 수득량은 35S 프로모터 활성의 3배 이하였다.
Pptub-작제물 요약 (또한, 서열 목록 참조).
Pptub1 업스트림
-1533에서 -1까지 (+1 = 개시 코돈)
-1533에서 -644까지 = 81% AT
-1533 VEGF 1-0 (프라이머 364)
-1211 VEGF 1-1 (프라이머 219)
-642 VEGF 1-2 (EcoRI/XhoI)
-474 VEGF 1-3 (프라이머 549)
-309 VEGF 1-4 (프라이머 226)
-297 VEGF 1-5 (프라이머 550: 추정되는 TATA 박스 없이; -304에서 -295까지)
-226 TSS (5' UTR의 개시)
Pptub 1 다운스트림
1에서 1539까지 (1= 종료 코돈 바로 뒤)
332 가장 긴 EST 말단 (3' UTR)
1539 프라이머 90의 개시
Pptub 2 업스트림
-1197에서 -1까지 (+1 = 개시 코돈)
-1197 VEGF 2-0 (프라이머 291)
-789 VEGF 2-1 (BglII)
-547 VEGF 2-2 (SalI)
-450에서 -489까지 = 폴리 A 스트레치
-367 VEGF 2-3 (EcoRI/SalI)
-189 VEGF 2-4 (XhoI/SalI)
-122 TSS(5' UTR의 개시)
Pptub2 다운스트림
1에서 1012까지 (1 = 종료 코돈 바로 뒤)
297 가장 긴 EST의 말단 (3' UTR)
1012 프라이머 206의 개시
Pptub3 업스트림
-1386에서 -1까지 (+1 = 개시 코돈)
-1386 VEGF 3-0 (프라이머 292)
-879 VEGF 3-2 (SalI)
-384 VEGF 3-3 (Eco147I/HincII)
-112 TSS (5' UTR의 개시)
-60 VEGF 2-4 (XhoI/SalI)
Pptub3 다운스트림
1에서 997까지 (1 = 종료 코돈 바로 뒤)
203 가장 긴 EST의 말단 (3' UTR)
1012 프라이머 204의 개시
Pptub4 업스트림
-624에서 -1까지 (+1 = 개시 코돈)
-624 VEGF 4-1 (프라이머 373)
-206 VEGF 4-2 (프라이머 548)
-205에서 -103까지 TSS의 영역 (5'UTR의 개시)
-55에서 -93까지 CT 스트레치
Pptub4 다운스트림
1에서 1146까지 (1 = 종료 코돈 바로 뒤)
466 가장 긴 EST의 말단 (3' UTR)
1141에서 1164까지 NcoI
실시예 2: 상이한 모스 종 및 이들의 발현 증진 영역으로부터의 액틴 유전자의 클로닝 및 검정
2.1. 피스코미트렐라 파텐스 액틴 유전자의 게놈 구조
모스에서 사용하기 위한 발현 벡터를 작제하기 위해, 모스 피스코미트렐라 파텐스의 4개의 액틴 유전자 및 프로모터 영역 및 푸나리아 히그로메트리카 및 리버워츠 마르찬티아 폴리모르파로부터 3개를 분리하였다.
공개 데이타베이스에 존재하는 피스코미트렐라 EST 서열로부터 설계된 특이적 올리고를 사용하여, 4개의 액틴 유전자 (Ppact1, Ppact3, Ppact5 및 Ppact7)를 게놈 DNA로부터의 여러번의 iPCR로 분리하고 시퀀싱하였다.
피스코미트렐라에서, 분리된 유전자의 구조는, 한 경우 (Ppact1)에는 고등 식물의 액틴 유전자의 보존된 구조적 구성을 닮았다. 비번역된 리더는 개시인자 ATG의 14 nt 업스트림에 위치한 비교적 긴 (955bp) 인트론에 의해 중단된다. 코딩 영역은 기타 식물 종의 액틴 유전자의 인트론과 동일한 위치에 정위되는 3개의 더 작은 인트론을 제공한다. 첫번째 인트론은 코돈 20번(lys)과 21번(ala) 사이에 위치하며, 두번째 인트론은 스플릿팅 코돈(152)(gly)에 위치하며, 세번재 코돈은 코돈 356번(gln)과 357번(met) 사이에 위치한다. 이러한 일반적인 구조는 분리된 세개의 다른 피스코미트렐라 액틴 유전자에 있어서 상이한 것으로 나타났다 (Ppact3, Ppact5 및 Ppact7). 이들의 경우, 5' UTR 인트론 (각각 434bp, 1006bp 및 1055bp)은 또한 ATG 전의 14nt에 위치하나, 코딩 영역은 코돈 21번(lys)과 22번(ala) 사이에 위치한 하나의 인트론에 의해서만 중단된다 (도 7).
2.2. 액틴 유전자의 발현 증진 영역의 활성 연구
상이한 피스코미트렐라 액틴 발현 증진 영역 (SEQ ID NO. 5 내지 8)의 활성 및 상이한 유전자의 5'UTR의 효과를 연구하기 위해, 연구시 5' 영역의 조절하에 hVEGF 단백질이 발현하도록 상이한 벡터를 설계하였다.
전사 개시 부위의 업스트림의 약 2kb 게놈 영역을 게놈 DNA로부터 iPCR에 의해 분리하고, 시퀀싱하고, 프로모터에 의해 유도된 사람 VEGF의 cDNA를 함유하고, 5' 인트론을 포함하는 정확한 리더 서열을 함유하는 벡터를 모스 원형질체의 일시적 트랜스펙션을 위해 작제하였다. 완전한 5' 증진 발현 영역을 Ppact1에 있어서 프라이머 395 및 332, Ppact3에 있어서 프라이머 408 및 333, Ppact5에 있어서 프라이머 511 및 334, 및 Ppact7에 있어서 프라이머 413 및 335를 사용하여 프루프 리딩 PCR에 의해 증폭하였다.
원형질체의 형질전환을 CaMV 35S 프로모터의 조정하에 hVEGF cDNA를 수반하는 작제물과 함께 시험할 각각의 작제물에 대한 동일한 수의 분자를 이용하여 수행하였다. hVEGF 단백질은 배지로의 재조합 단백질의 분비를 허용하는 26 aa 시그널 펩티드를 N-말단에서 함유한다. 형질전환의 검정은 원형질체를 형질전환 후 48시간 인큐베이션한 배지를 상이하게 희석하면서, ELISA에 의해 수행하였다.
상이한 피스코미트렐라 5' 액틴 영역의 발현을 구동하는 능력은 항시적 35S 프로모터의 활성에 필적하다.
모든 검정된 경우에, 액틴 유전자의 5' 영역은 35S 프로모터 보다 더 높은 활성에 도달하였다. 그러나, 상이한 액틴 조절 서열에 대해 발현 수준이 변하였다. 이와 같이, Ppact3의 5' 서열은 단지 35S 프로모터 보다 VEGF의 발현을 약 2배 증진시켰다. Ppact1 및 Ppact7의 5' 영역을 함유하는 벡터가 형질전환에 사용되는 경우 더 높은 수준의 VEGF가 측정되었다. 이러한 경우, 35S 값의 4배 내지 8배의 값이 수득되었다. 그럼에도 불구하고, 가장 극적인 차이는 5' Ppact5 유전자의 경우에 관찰되었으며, 여기서 35S와 비교하여 11배 까지의 더 높은 발현 값이 일부 경우에 수득되었다 (도 8).
높은 활성의 피스코미트렐라 액틴 유전자의 5' UTR 영역의 역할을 추가로 연구하기 위해, 5'UTR 인트론이 결실, 조합 및 치환된 벡터를 제조하였으며, 모스 원형질체에서 일시적 검정에 사용하였다.
Ppact1 5' 인트론의 결실은 Ppact1의 본래의 5' 영역을 사용하여 수득된 발현 수준과 비교하여 일시적 발현 수준을 현격하게 감소시켰다. 이러한 경우, 원형질체 배지에서 검출될 수 있는 분비된 VEGF 단백질의 양은 CaMV 35S 프로모터에 의해 수득된 것과 매우 유사하다. 이는 Ppact1의 5' 인트론이 Ppact1 프로모터로부터의 효과적인 유전자 발현에 필수적이라는 것을 나타낸다. 리더 인트론을 포함하는 5'UTR 이 35S 프로모터 다운스트림에 융합될 경우 동일한 결과가 수득되었다. 이러한 작제물이 본래의 35S 프로모터와 동일한 양의 분비된 단백질을 생성시킨다는 것은, 5'UTR 영역이 Ppact1 프로모터 이외의 프로모터의 활성에 현격한 영향을 끼치지 않는다는 것을 나타낸다. 단지 5'UTR Ppact1 영역을 수반하는 작제물이 35S 프로모터 단독 보다 30% 더 적은 양으로 단백질 생성을 증진시킬 수 있음을 나타내는 것이 중요하다. 이는 유전자의 이러한 영역에서 작은 프로모터 활성, 또는 벡터의 백본 서열에 존재하는 프로모터 활성의 휴지를 암시한다 (도 9).
동일한 방법이 Ppact5 및 Ppact7 유전자에 함유된 5' UTR 인트론의 프로모터 활성에 대한 영향을 조사하는데 사용되었다. 5' 인트론이 결실된 작제물을 검정하면, Ppact1의 경우와 유사한 결과가 수득되었으며, 즉 도달된 단백질의 양이 Ppact5의 경우에서 35S 프로모터와 대략적으로 동일하고, Ppact7의 경우에는 약간 적었으며, 이는 5'UTR에서 인트론의 존재가 프로모터의 효과적인 활성에 필수적이라는 것을 시사한다. 또한, 일부 잔여 증진 활성이 ATG 까지 5'전사된 영역만을 함유하는 작제물로 형질전환을 수행할 경우 관찰되었다. 게다가, 이러한 두개의 유전자의 경우에, 35S 프로모터의 다운스트림의 5'UTR의 융합은 35S 프로모터 단독과 비교할 경우 VEGF 단백질의 발현율을 더 높이 증가시켰다 (2 내지 7배) (도 10, 11). 유사한 결과가 Ppact3의 경우에 관찰되며, 여기서 5'UTR은 단독으로 또는 CaMV 35S의 다운스트림에 융합된 상태로 각각 35S와 비교하여 각각 약 2 내지 3배의 발현율을 유도하였다 (도 12). 이는, 이러한 세개의 유전자가 상이한 프로모터하에 위치하지만 이러한 세개의 유전자에 대한 5'전사된 영역에서 인핸서 활성의 존재를 시사한다.
추가적으로, Ppact1, Ppact5 및 Ppact7 유전자에 존재하는 5'인트론의 역할을 연구하기 위해, Ppact1 유전자의 리더 인트론의 Ppact5 및 Ppact7의 5'인트론으로의 치환을 일시적 형질전환을 위한 벡터에서 조작하였다. Ppact1 5'인트론의 유전자의 코딩 영역에 존재하는 Ppact1 인트론으로의 평형 치환을 수행하였다.
Ppact1 코딩 영역 인트론 1 및 3에 의한 Ppact1 5'인트론의 치환은 약 25%의 발현 수준의 감소를 초래하였다. 그래도 여전히 검출된 단백질의 양은 CaMV 35S 프로모터로 수득된 것 보다 약 2-3배 많았다. 코딩 영역의 인트론 2에 의한 5'인트론의 치환은 놀랍게도 프로모터의 활성을 유도하지 못하였다 (도 13). 그러나, 작제물을 체크하면, 서열은 인트론에 대한 스플라이싱 부위가 정확하지 않다는 것을 나타내었다. 정확한 스플라이싱 서열을 수반하는 신규한 작제물을 제조하고, 모스 형질전환 후의 결과는 인트론 2의 효과가 기타 치환과 동일하다는 것을 나타내었다.
단백질 발현의 감소는 또한, 치환이 Ppact5 및 Ppact7 유전자에 상응하는 5'인트론으로 수행할 경우 관찰되며, 이러한 경우 감소는 약간 더 작았다.
2.3. 액틴 유전자의 발현 증진 영역의 결실 작제물
상이한 액틴 유전자 프로모터의 추가의 특징은 5'비전사된 영역의 작제물을 삭제하고, 모스 원형질체의 일시적 형질전환을 통해 이들을 검정하므로써 수행하였다.
이와 같이, Ppact1에 있어서, 전사 개시부(+1)의 업스트림에 상이한 게놈 영역 길이 (-1823bp, -992bp, -790bp, -569bp, -383bp, -237bp, 및 -82bp)를 수반하는 작제물을 제조였다. 원칙적으로, -82bp를 제외한 모든 작제물은 충분한 프로모터 활성을 가질 수 있다. 그러나, -383bp 작제물은 활성의 감소를 나타내며, -82bp 작제물과 유사한 수준에 도달하였다 (도 14).
Ppact3의 프로모터 영역의 결실 작제물의 검정은 일부 흥미로운 특징을 나타내었다. 기술된 바와 같이, 이러한 프로모터는 비록 CaMV 35S와 관련하여 약간 더욱 활성적이었으나, 기타 액틴 유전자 프로모터와 비교하여 더 낮은 활성을 나타내는 것으로 기술되어 있다. 이러한 경우, 하기 5'비전사된 영역을 시험하였다: -2210bp, -995bp, -821bp, -523bp, -323bp, -182bp 및 -81bp. 놀랍게도, 프로모터의 활성은 -821bp 까지의 프로모터 영역을 함유하는 작제물에 대해서 CaMV 35S와 대략적으로 동일하였다. 그러나, bp -523번으로부터 전사 개시부쪽으로의 더 짧은 영역을 함유하는 작제물은 2배 과량의 재조합 단백질을 생성시켰다. 이는 일시적 형질전환 검정 동안 이러한 유전자의 전사를 하향 조절하는 -523bp 영역의 업스트림에 위치한 시스-액팅 영역을 나타낼 수 있다 (도 15).
Ppact5의 경우, 유전자의 전사 개시부의 업스트림의 -1872bp, -758bp, -544bp, -355bp 및 -121bp 단편을 함유하는 작제물을 생성시켰다. 일시적 검정으로부터 수득된 결과는 프로모터의 충분한 활성이 전사 개시부(+1)로부터 -758번 내지 -121번 사이의 영역에 위치한다는 것을 나타낸다 (도 16).
Ppact7의 5'비전사된 영역에 대한 하기 결실 작제물을 검정하였다: -1790bp, -1070bp, -854bp, -659bp, -484bp, -299bp 및 -66bp. 수득된 결과는 -484bp 내지 -299bp에 포함된 영역이 일시적인 실험 검정 동안 프로모터의 충분한 활성에 필수적이라는 것을 나타낸다 (도 17).
피스코미트렐라 액틴 유전자의 이종성 프로모터 세트를 수득하기 위해, 다른 두개의 종인 모스 푸나리아 히그로메트리카 및 리버워츠 마르찬티아 폴리모르파를 사용하여 액틴 유전자를 함유하는 게놈 DNA 단편을 분리하였다. 이를 위해, 상이한 정도로 퇴화된 올리고를 설계하여 두개의 종으로부터 분리된 게놈 DNA를 템플레이트로 사용하여 PCR 반응을 수행하였다.
2.4. 상이한 모스 종 피스코미트렐라 파텐스, 푸나리아 히그로메트리카 및 마르찬티아 폴리모르파로부터의 상이한 액틴 유전자의 비교
피스코미트렐라 파텐스
피스코미트렐라 파텐스로부터 분리된 4개의 상이한 게놈 액틴 서열은 5'프로모터 서열, 5'UTR + 5'인트론, ORF + 내부 인트론 및 3'UTR 및 추가의 3'다운스트림 서열을 포함하는 유전자의 전체적인 작용성 서열을 나타내는 것으로 여겨진다. 전체적으로 Ppact1에 있어서는 5809bp, Ppact3에 있어서는 5633bp, Ppact5에 있어서는 8653bp 및 Ppact7에 있어서는 6351bp의 게놈 서열을 분리하였다 (도 18A). 분리된 피스코미트렐라 액틴 cDNA의 코딩 영역은 1134bp의 ORF를 갖는 Ppact1을 제외한 대략적으로 모두 1137bp 길이를 갖는다. 상응하는 단백질은 377개 아미노산을 갖는 Ppact1을 제외하고는 378개 아미노산 길이를 갖는다. 누클레오티드 수준에 대해서는, 코딩 서열은 86.6 내지 98.9%의 상동성을 공유한다. 단백질 서열은 97.1 내지 99.7%의 동일성을 갖는다 (DNA STAR, MegAlign Program, Clustal V (weighted) sequence alignment).
모든 4개의 피스코미트렐라 액틴 유전자에 있어서, ATG 개시 코돈의 연장된 5' 게놈 DNA 서열을 iPCR에 의해 분리하고, 시퀀싱하였다: Ppact1에 있어서는 2973nt, Ppact3에 있어서는 3091nt, Ppact5에 있어서는 3095nt 및 Ppact7에 있어서는 3069nt. Ppact1, Ppact5 및 Ppact7에 있어서, 단지 전장 cDNA의 증폭만을 허용하는 진 레이서 키트 (Gene Racer Kit: Invitrogen)를 사용하여 5' 레이스를 수행하여 유전자의 5'UTR를 측정하였다. Ppact3에 있어서, 5'UTR을 데이타베이스로부터의 상이한 EST 길이에 의해 측정하였다. cDNA와 게놈 iPCR 단편을 비교하므로써, 큰 5'인트론의 존재를 나타낼 수 있다. -14번 위치 내지 ATG 개시 코돈에 모두 위치하는 5'인트론의 길이는 Ppact1, Ppact3, Ppact5 및 Ppact7에 대해 각각 955bp, 434bp, 1006bp 및 1055bp이다 (도 18A). ORF 내부 인트론의 위치를 게놈 서열 및 유래된 단백질 서열을 아라비도프시스 탈리아나로부터의 액틴 유전자의 cDNA 서열 및 단백질 서열과 비교하므로써 측정하였다. 피스코미트렐라 액틴 유전자의 이용가능한 5' 프로모터 서열은 Ppact1에 있어서 1824nt, Ppact3에 있어서 2270nt, Ppact5에 있어서 1909bp 및 Ppact7에 있어서 1805bp이다 (도 18A).
총괄적으로, 푸나리아 히그로메트리카로부터의 4개의 상이한 액틴 유전자 (발현 증진 영역: SEQ ID NO. 9 내지 12) 및 마르찬티아 폴르모르파로부터의 3개의 상이한 유전자 (발현 증진 영역: SEQ ID NO. 13 내지 15)는 게놈 DNA에 대한 퇴행성 (degenerated) PCR에 의해 확인될 수 있다. 목적은 상이한 모스 종으로부터 추정되는 상이한 액틴 유전자 상동체의 5' 프로모터 영역을 우세하게 분리하는 것이기 때문에, 대부분의 서열은 지금까지 3' 말단에서 불완전하였다 (도 18 B/C).
푸나리아 히그로메트리카
푸나리아에 있어서, 확인된 액틴 유전자는 Fhact1, Fhact4.4, Fhact5 및 Fhact5b로 칭하였다. 3951bp의 Fhact1, 2417bp의 Fhact4.4, 4432bp의 Fhact5 및 722bp의 Fhact5b의 게놈 서열은 상이한 액틴 유전자에 있어서 iPCR에 의해 분리될 수 있다. 완전한 코딩 cDNA 서열을 1134개 누클레오티드의 코딩 서열을 갖는 Fhact1 유전자에 대해 분리할 수 있다. 기타 푸나리아 액틴 유전자에 있어서, 3'말단이 결여된 부분적 서열은 바로 당시에는 입수가능하다: Fhact4.4에 있어서는 906bp, Fhact5에 있어서는 965bp 및 Fhact5b에 있어서는 722bp (도 18B). 분리된 코딩 서열은 누클레오티드 수준에서 87.4% 및 99.2% 범위의 상동성을 공유한다. 유래된 단백질 서열은 90.8 내지 99.2% 동일성을 갖는다 (DNA STAR, MegAlign Program, clustal V (weighted) sequence alignment).
Fhact5b를 제외하고는, ATG 개시 코돈의 5'서열 업스트림을 iPCR에 의해 분리하고 시퀀싱할 수 있다. Fhact1의 경우에는 1824bp, Fhact4.4에 있어서는 1333bp 및 Fhact5에 있어서는 3289bp가 이용가능하다. 상이한 5'UTR의 길이를 진 레이서 키트 (Gene Racer Kit: Invitrogen)를 사용하여 5'레이스에 의해 측정하였다. 인트론-엑손 구조를 iPCR에 의해 수득된 게놈 서열과 cDNA 서열을 비교하고, 피스코미트렐라 유전자와 비교하므로써 결정하였다. 피스코미트렐라 액틴 유전자의 경우에서, 확인된 푸나리아 액틴 유전자는 cDNA의 -14번 위치에 정위된 큰 5'인트론을 Fhact1, Fhact4.4 및 Fhact5 각각의 경우에 928bp, 1015bp 및 656bp 길이로 함유한다. 지금까지, 5'프로모터 서열의 Fhact1에 있어서는 700bp, Fhact4.4에 있어서는 145bp 및 Fhact5에 있어서는 2515bp를 분리하고 시퀀싱하였다. Fhact1에 있어서는, 419bp의 3'영역을 분리하였다. 푸나리아 액틴 유전자의 5' 영역 또는 3' 영역을 Fhact1의 5' 영역에 대한 프라이머 908 및 909, Fhact1의 3' 영역에 대한 프라이머 983 및 984, Fhact4.4의 5' 영역에 있어서는 프라이머 1000 및 1001, 및 Fhact5의 5' 영역에 있어서는 프라이머 611 및 612를 사용하여 푸나리아 히그로메트리카로부터 게놈 DNA상에서의 PCR에 의해 증폭하였다.
마르찬티아 폴리모르파
마르찬티아에 있어서, 확인된 액틴 유전자를 Mpact1, Mpact4 및 Mpact15로 칭하였다. 모든 세개의 서열에 있어서, 3' 말단을 결여시켰다. 지금까지, Mpact1에 있어서는 2229bp, Mpact4에 있어서는 3987bp 및 Mpact15에 있어서는 2174bp를 분리하고 시퀀싱하였다. 분리된 코딩 cDNA 서열의 길이는 Mpact1, Mpact4 및 Mpact15 각각에 있어서 997nt, 962nt 및 995nt이다 (도 18C). 마르찬티아 액틴 유전자내의 서열 상동성은 기타 두 모스 종과 비교하여 누클레오티드 수준에 있어서는 78.3 내지 85.5% 및 아미노산 수준에 있어서는 94.7 내지 96.1%로 다소 낮다 (DNA STAR, MegAlign Program, Clustal V (weighted) sequence alignment). 모든 3개의 확인된 상이한 마르찬티아 액틴 유전자에 대한 ATG의 5'업스트림 서열을 iPCR에 의해 분리하고, 시퀀싱하였다: Mpact1에 있어서는 937bp, Mpact4에 있어서는 3025bp, 및 Mpact15에 있어서는 910bp. 마르찬티아 액틴 유전자 상동체의 5'영역을 5'Mpact1에 있어서는 프라이머 950 및 951, Mpact4에 있어서는 프라이머 960 및 961 및 Mpact15에 있어서는 프라이머 970 및 971을 사용하여 마르찬티아 폴리모르파로부터 게놈 DNA에 대한 PCR에 의해 증폭하였다. ORF의 인트론-엑손 구조를 상이한 모스 종으로부터의 상이한 액틴 유전자 서열을 비교하므로써 수득하였다. Mpact1의 분리된 5' 서열은 -14번 위치에서 인트론 스플라이스 부위 (aggt)에 대한 콘센서스 서열을 나타내며, 이는 기타 피스코미트렐라 및 푸나리아 유전자의 경우에서와 같이 5'인트론이 존재한다는 것을 암시한다. Mpact4 및 Mpact15의 5'업스트림 서열내에, 어떠한 인트론 스플라이스 부위 콘센서스 서열도 존재하지 않으며, 이는 5'인트로의 결여를 나타낸다 (도 18c).
P. 파텐스, F. 히그로메트리카 및 M. 폴리모르파 액틴 유전자의 비교
일반적으로 상기 언급된 바와 같이, 한 종내의 상이한 분리된 액틴 유전자에 대한 누클레오티드 및 단백질 서열의 상동성은 특히 단백질 수준에 있어서 매우 높다. 밀접하게 관련된 모스 종인 피스코미트렐라 파텐스와 푸나리아 히그로메트리카 간의 상동성 또한 매우 높은 것으로 여겨진다. 누클레오티드 수준에 있어서, 액틴 유전자는 86.9 내지 96.3%의 상동성을 나타내며, 아미노산 수준의 경우에는 95.5 내지 99.7%의 상동성을 나타낸다.
이와 반대로, 이러한 두종에 대한 리버워츠 마르찬티아 폴리모르파의 더 적은 관련성은 누클레오티드 수준에 대한 유전자의 더 낮은 상동성에 반영된다. 피스코미트렐라와 마르찬티아 액틴 유전자간의 상동성은 단지 75.2% 내지 78.8%이며, 푸나리아와 마르찬티아간의 상동성은 75.5% 내지 80.4%이다. 아미노산 수준에 있어서는, 마르찬티아 액틴 유전자의 상동성은 피스코미트렐라와 비교할 경우 93.0% 내지 96.1%이며, 푸나리아와 비교할 경우 93.4% 내지 96.7%이다.
인트론-엑손 구조 (도 18 A/B/C)
이전에 지적한 바와 같이, 특정 범위에 대한 피스코미트렐라 액틴 유전자의 인트론-엑손 구조는 고등 식물의 구조와 유사하나, 명백한 차이를 갖는다. 모든 분리된 피스코미트렐라 액틴 유전자는 5'비번역된 영역에서 큰 5'인트론을 함유하며, 조사된 고등 식물 액틴 거의 대부분이 그렇다. 단지 Ppact1은 ORF내의 3개의 내부 인트론을 함유하며, 이는 예를 들어, 아라비도프시스 탈리아나로부터의 모든 분리된 액틴 유전자에 대한 상황을 반영한다. Ppact1의 ORF 내부 인트론 위치는 또한 고등 식물 액틴 유전자와 비교하여 보존된다. 이와 반대로, Ppact3, Ppact5 및 Ppact7은 ORF내의 단지 하나의 내부 인트론을 함유한다.
동일한 게놈 구조가 5'UTR내의 하나의 연장된 5'인트론을 갖는 분리된 푸나리아 액틴 유전자에서 발견될 수 있다. Fhact1은 Ppact1과 동일하게 보존된 인트론-엑손 구조를 갖는 반면, Fhact4.4 및 Fhact5는 ORF 서열내의 단지 하나의 내부 인트론을 함유한다. 더욱 정확히 말하면, Fhact5b의 분리된 서열은 인트론-엑손 구조에 대해 짧으나, 적어도 이는 Fhact1 또는 Ppact1과 비교하여 내부 인트론2를 함유하지 않는다.
마르찬티아에서, 분리된 액틴 유전자의 게놈 구조는 더욱 상이한 것으로 여겨진다. 그렇지만, 3개의 상이한 모스 종에서 상이한 액틴 유전자의 수는 공지되어 있지 않으며, 마르찬티아로부터의 3개의 분리된 액틴 유전자가 개별적으로 작용하는 상동성 유전자를 의미하지 않음을 나타내는 것이 중요하다. 마르찬티아에는 3개 보다 많은 액틴 유전자 및 피스코미트렐라 및 푸나리아에는 4개보다 많은 액틴 유전자가 존재하는 것으로 여겨진다.
그러나, Mpact1의 인트론-엑손 구조는 5'UTR 및 ORF 내부 인트론 1 및 2의 보존된 위치내의 5'인트론을 갖는 Ppact1 및 Fhact1의 경우와 동일한 것으로 여겨진다. Mpact15는 또한, 보존된 ORF 내부 인트론1 및 인트론2를 함유하나, 5'UTR내의 -14번 위치 또는 피스코미트렐라에 대한 발견되 바와 같은 또는 일부 아르비도프시스 액틴 5'인트론에 대한 -10번 위치에서 보존된 인트론 스플라이스 부위를 갖지 않으며, 이는 5'인트론의 결여를 입증한다. 동일한 상황이 Mpact4에 있어서 발견되었으며, 아마도 5'인트론이 결여된 것으로 여겨진다. 또한, Mpact4는 ORF내의 인트론1 또는 인트론2를 갖지 않으며, 이는 지금까지 모든 분리된 모스 액틴 유전자와 상이하다.
추정되는 상동성 모스 액틴 유전자
피스코미트렐라 및 푸나리아로부터 분리된 상이한 액틴 유전자의 인트론-엑손 구조가 두개의 종간의 상동성 유전자에 대한 결론을 제시할 수 있으나, 게놈 구조로부터 이러한 결론을 내릴 수 없다. 예를 들어, Ppact1 및 Fhact1은 동일한 보존된 인트론-엑손 구조를 공유하나, 이전에 지적한 바와 같이, 동일한 게놈 구조를 가질 수 도 있는 두 식물의 게놈에 더 많은 유전자가 존재하는 지의 여부가 정확하지 않다. 상동성 유전자에 대한 내용을 제공하기 위해, 또한 발현 데이타가 작용적 상동성을 제시하는데 요구될 것이다. 또한, 단백질 또는 코딩 cDNA 서열의 서열 상동성으로부터, 이들은 일반적으로 너무 유사하기 때문에, 종간의 상응하는 상동성 유전자에 대한 임의의 가설을 만드는 것이 불가능하다.
그러나, 피스코미트렐라와 푸나리아의 경우에, UTR 서열, 인트론 서열 및 프로모터 서열에 대한 비코딩 서열내에 매우 높은 서열 상동성이 발견된 것이 흥미로왔다. 따라서, Ppact1과 Fhact1 및 Ppact3과 Fhact5 간의 높은 상동성을 발견하였다. 두 경우에, 인트론 서열은 일반적인 높은 보존성을 나타낸다. Ppact1과 Fhact1의 경우에, 상동성은 다음과 같다: 5'인트론:58%; 인트론1: 64%, 인트론2:52% 및 인트론3:55%. Ppact3 및 Fhact5의 경우에, 상동성은 5'인트론의 경우 51%이며, 인트론1의 경우 48%의 동일성을 나타낸다.
두 경우에 있어서, 또한 분리된 5' 프로모터 서열은 높은 상동성을 나타낸다. 도 19A는 Ppact1 및 Fhact1의 분리된 프로모터 영역의 개략적인 비교를 나타낸다. 전사 개시부는 1번 위치이며, 5'프로모터 영역의 첫번째 nt는 -1번 위치이다. Fhact1의 5'프로모터 영역의 분리된 267bp는 Ppact1 5'프로모터 영역의 첫번째 267bp에 대해서 58%의 전반적인 상동성을 나타내었다. 이러한 서열내에는, 관찰가능한 다른 상동체을 차단한다. -267번 내지 -129번간의 서열은 51%의 상동성을 나타낸다. 그 이후의 26bp는 62% 동일성을 나타내며, -100번 및 -1번 위치내의 상동성은 거의 70%이다. Ppact1 및 Fhact1 인트론과 프로모터 서열간의 높은 서열 동일성에 있어서, 이들 두 유전자를 두 모스의 상동성 유전자로서 간주는 것이 합당하다. 또 다른 흥미로운 양태는 상이한 Ppact1:vegf 결실 작제물간에 관찰된 발현 하강이다 (도 15). 발현의 극적인 하강은 -237번 내지 -82번 결실 작제물에서 나타났다. 이는 -129번 내지 -1번간의 5'프로모터 영역의 중요한 작용을 주장하는데, Ppact1 및 Fhact1의 프로모터 영역의 서열이 방금 언급된 바와 같이 고도로 보존되며, -81번 결실 작제물은 고도도 보존된 서열을 전혀 함유하지 않지만, -237번 결실 작제물은 함유한다.
Ppact3 및 Fhact5의 프로모터내의 고도로 보존된 영역이 또한 관찰될 수 있다. 이러한 경우, 분리된 두 유전자에 대한 프로모터 영역이 더욱 길다. 따라서, 더욱 많은 상동성 영역이 두개의 5'프로모터 영역 사이에 발견된다 (도 19B). 이러한 경우, -1번부터 -2270번까지의 Ppact3 및 -64번부터 -2325번까지의 Fhact5의 프로모터 영역은 일부 흥미로운 상동 특성을 나타낸다. TS 위치에서의 차이는 Fhact5의 5'UTR이 실험적으로 측정되며, Ppact3중 하나가 데이타베이스로부터 EST 검정에 의해 측정되기 때문일 수 있다.
-2270번 내지 -1876번간의 Ppact3의 서열은 -2325번 내지 -1948번에 위치한 Fhact5의 동일한 서열 영역에 대하여 단지 29%의 낮은 상동성을 나타낸다. 그 후, 약 1100nt의 확장된 영역은 82%의 매우 높은 상동성을 나타낸다. 다음의 Ppact3 프로모터의 140nt와 Fhact5 프로모터의 152nt는 "단지" 53%의 낮은 상동성을 나타낸다. -641번 내지 -463번간에 위치한 Ppact3의 서열은 Fhact5의 -705번 내지 -528번의 영역에 76%의 높은 보존성을 나타낸다. 이어서 약 180nt는 다시 53%의 낮은 상동성을 나타낸다. 그 후, Ppact3 프로모터 서열의 마지막 288bp는 다시 Fhact5의 다음 280bp에 대해 73%의 더 높은 상동성을 나타낸다. 두개의 상동 유전자간의 이러한 상이한 정도의 상동 영역은 5'프로모터 영역내의 조절성 활성 엘리먼트의 존재를 암시할 수 있다.
본원의 Ppact1 및 Fhact1의 경우에, 상이한 Ppact3:vegf 결실 작제물의 발현 검정은 이에 관련하여 흥미롭다 (도 17). 여기서, -523번 결실 작제물과 비교하여 -2210번, -995번, -821번 결실 작제물들의 vegf 발현 수준의 현저한 증가가 관찰되었다. Ppact3 및 Fhact5에서 발견된 -1876번 내지 -779번의 연장된 상동 영역의 적어도 일부를 함유하는 세개의 결실 작제물은 35S 프로모터의 발현 수준과 유사한 수준에 도달한 반면, -523번 결실 작제물은 35S 프로모터 또는 더 긴 결실 작제물과 비교하여 2 1/2 배의 발현 증가를 나타내었다. 이는, Ppact3 및 Fhact5간의 82% 상동성 영역내에 부정적 조정인자가 존재함을 입증할 수 있다.
마르찬티아의 경우, 피스코미트렐라와 푸나리아로부터의 여러 액틴 유전자간 에 어떠한 비교가능한 서열 상동성이 발견되지 않았다.
Fhact5 유전자에 있어서, hVEGF cDNA에 융합된 5'비전사된 영역의 1157bp를 함유하는 작제물을 제조하고, 피스코미트렐라 원형질체에 대한 일시적 형질전환 실험에 사용하였다. 이러한 경우 검출된 단백질의 양은 작은 범위이나, CaMV 35S 프로모터와 함께 할 경우 약간 더 높다 (2배 이하). Fhact5 유전자는 PpAct3 유전자에 대한 가장 높은 상동성을 나타내며, 흥미롭게도 두 프로모터는 일시적 검정 동안 피스코미트렐라 원형질체에서 유사한 활성을 나타낸다.
2.5. 안정적인 유전자이식 주 (transgenic lines)
VEGF cDNA의 발현을 유도하는 Ppact1, Ppact5 및 Ppact7 5' MEPR을 함유하는 카세트를 피스코미트렐라 식물의 게놈에 유입시켰다. 각각의 MEPR에 있어서, 5 내지 10개의 안정적으로 형질전환된 식물을 회수하고, rhVEGF의 발현에 대해 시험하였다. 시험한 이들 3개의 MEPR에 있어서, 발현되고 분비된 모스 유래된 rhVEGF를 식물이 성장하는 배양물 (표준 Knop 배지)의 상청액에서 검출하고, 이는 MEPR이 게놈의 다른 부분에 인테그레이션될 경우, 비유도 조건 (표준 조건)하에 단백질 발현을 증진시킴을 나타낸다. 이러한 주에서 측정될 수 있는 단백질의 양은 작제물 및 안정적인 주에 따라 7ngVEGF/mg 모스 건조 중량에서 53ngVEGF/mg 모스 건조 중량이다.
Ppact5의 조절하에 VEGF cDNA를 함유하는 한 유전자이식 모스 균주를 사용하여 생반응기 배양을 수행하였다. ELISA에 의해 측정된 생반응기 배양물의 상청액중의 모스 유래된 재조합 VEGF의 양은 40-50ngVEGF/mg 모스 건조 중량이다.
실시예 3: 피스코미트렐라 파텐스 및 푸나리아 히그로메트리카 유비퀴틴 유전자 및 이들의 발현 증진 영역의 클로닝 및 검정
피스코니트렐라의 폴리유비퀴틴 유전자에 상응하는 여러 EST 서열의 존재를 이용하여, 데이타베이스에서 유비퀴틴 유전자 상동성 서열의 가장 빈번하게 존재하는 EST의 상응하는 게놈 서열 소위 Ppubq1이 분리되도록 특이적 올리고를 설계하였다. Ppubq1의 5'영역의 2146bp는 iPCR에 의해 확인할 수 있다. 129bp 전사된 5'리더는 5'레이스에 의해 측정된 ORF 개시부 전에 위치한다. Ppubq1의 5'영역은 프라이머 777 및 602를 사용하여 피스코미트렐라 파텐스로부터의 게놈 DNA에 대한 PCR에 의해 증폭된다.
hVEGF cDNA의 발현을 유도하는 5'UTR 영역 및 프로모터의 상이한 부분을 수반하는 벡터를 작제하여 피스코미트렐라 원형질체의 일시적 형질전환 동안 프로모터의 활성을 검정하였다.
결과는 이러한 프로모터에 대해 Ppact5 프로모터와 유사한 (또는 심지어 더 높은) 활성을 나타내었다. 시험한 작제물인 1.6Kb 및 1.4Kb 프로모터 단편은 CaMV 35S 보다 약 4배 내지 약 7배 높은 발현 수준에 도달하였다. 푸나리아로부터 유비퀴틴 유전자인 Fhubq1을 Ppubq1 코딩 서열로부터 유래된 프라이머로 푸나리아 총 RNA에 대한 5'레이스 PCR을 수행하므로써 확인하였다. 분리된 5'UTR 서열 및 일부 코딩 서열을 사용하여 푸나리아 히그로메트리카의 게놈 결찰에 대한 iPCR에 대한 프라이머를 설계하였다. 이러한 방식으로 5'UTR의 5'업스트림을 확인하였다. 5'영역을 프라이머 943 및 944를 사용하여 푸나리아 히그로메트리카로부터의 게놈 DNA에 대한 PCR에 의해 증폭하였다.
실시예 4: 피스코미트렐라 파텐스 RBCS 발현 증진 영역의 클로닝 및 검정
액틴, 투불린 및 유비퀴틴 유전자 다음의 추정되는 후보로서, 리불로스-1,5-비스포페이트 카르복실라아제/옥시게나아제 작은 서브유닛(rbcS) 유전자를 고려하였다. 상이한 rbcS 유전자를 핵 게놈에 대해 엔코딩하였다. rbcS 유전자는 유전자 패밀리의 구성원이다. rbcS 유전자는 원래 CO2를 고정할 수 있는 식물의 모든 녹색 부분에서 발현된다. 따라서, 이러한 유전자 패밀리는 상이한 모스로부터 상이한 rbcS 유전자의 5' 및 3' 플랭킹 발현 증진 영역을 수득하는데 중요하다. 첫번째 단계로서, 피스코미트렐라 EST 데이타베이스를 분석하였다. 피스코미트렐라 파텐스로부터의 rbcS 유전자가 12개 유전자로 이루어진 유전자 패밀리로 구성된다는 것을 발견하였다. rbcS 유전자의 가장 빈전하게 존재하는 EST 소위, PprbcS12를 후보로서 취하여 이의 5' 및 3' 발현 증진 서열을 발견하였다. EST 서열 데이타로 개시하면, 이러한 유전자의 5' 및 3' 플랭킹 영역을 iPCR에 의해 확인하고, 클로닝된 5' 내지 3' 영역을 시퀀싱하였다. 5'영역을 프라이머 839 및 858을 사용하여 피스코미트렐라 파텐스로부터 게놈 DNA에 대하여 PCR에 의해 증폭하였다. 3'영역을 프라이머 904 및 901을 사용하여 PCR에 의해 증폭하였다.
첨부된 서열 목록에서, 하기 서열이 제공된다 (SEQ ID NO./ 서열 명칭 / 단백질 엔코딩 영역에 대한 5' 또는 3' 영역):
1 Pptub1 5'
2 Pptub1 3'
3 Pptub2 5'
4 Pptub2 3'
5 Pptub3 5'
6 Pptub3 3'
7 Pptub4 5'
8 Pptub4 3'
9 Ppact1 5'
10 Ppact1 3'
11 Ppact3 5'
12 Ppact3 3'
13 Ppact5 5'
14 Ppact5 3'
15 Ppact7 5'
16 Ppact7 3'
17 Fhact1 5'
18 Fhact1 3'
19 Fhact4.4 5'
20 Fhact5 3'
21 Mpact1 5'
22 Mpact4 5'
23 Mpact15 5'
24 Ppubq1 5'
25 Fhubq1 5'
26 PprbcS12 5'
27 PprbcS12 3'
표 1. 프라이머 리스트
Figure 112006010168545-pct00001
참고 문헌:
Figure 112006010168545-pct00002
SEQUENCE LISTING <110> greenovation Biotech GmbH <120> Bryophyte expression promoting regions <130> R 42095 <160> 27 <170> PatentIn version 3.1 <210> 1 <211> 1533 <212> DNA <213> Physcomitrella patens <400> 1 tagcataaga taaagatgtt ctctacctaa tttattttta tttatcacta ataactcata 60 tcaatctaaa atatataaat gcctttaaca atagaagaat atgattcaac aaacccaatt 120 ctatcattaa aaatatatct aagattagat atgataaaaa tagataataa tattaataaa 180 tcattttaag gttgtaatgc aactataata atttttaata ttataacttt ttagtttttt 240 aaaataaaaa taaaatgtta aaatattata aaataattat actttatata tttatgatca 300 agttagtaca ttgatacatt taaagtccaa aataatttaa tgataccaac ttgcaaaaaa 360 tttaatatta ttaaaatatt ttaaaaagtt aagagcaaga aaaattattc taaatagaat 420 tcataccatg gtattataaa gatacaaaga atcaatgtgt atttatttat tttacataca 480 ttacttgcaa tatatggttt atactacaaa tgactatata ttgaagatac taaccacaaa 540 aataaaaatc cagcactaga taattctaaa aacatgaaat acaataaaac attacattac 600 tagcttatat ggttactaaa tatttttaaa ttatacaaat aaaaaataaa aataaaacaa 660 aaaaatccta tagtgacaag aaataaaata aaataaaaaa attataattg accaatccct 720 aaaacattaa tatttaaggg atattcatat gacaataaag ataatttatt tcatggaacc 780 ttgattattt tatcttttaa aggtggtatt tttaaaattg tttaatggta cttaaaatat 840 tgtatttata tagagaaaat cctccaaaaa aattctctca caagggaata gaattcctca 900 agtttttctc ttgactaaat tgaccaacca ccaaacaacc cacgtcatcc atccatccaa 960 cccccacaca acccaattgt ttctccattg tagacatcga caaatgaaaa tcatccgatg 1020 acgtatacac ttcatcctct ggtccctcca gggtgccatg agccacatcc cgaccgccta 1080 tttcagatcc gacggcacag ggtgacagag cagcggtctc agaccacgcc atttggaact 1140 cgccagccct gccccagcta acagtttcaa agctgcccgc cataacccgg tcctcccagg 1200 gccgttagat cgtccatcct acgggagcac atataatact gccctagtgc cctaatccga 1260 tgggaacggg gagtccttta tctctctcgg aaagcgactc attcgccagt gtgcgcatcg 1320 cccgtgtccc aaggcaccgg gccagactct cgcatcggct ctacccacac tcacccccac 1380 tcaccctgtg ttttctctgc ccccttcgcg ctcttcgtgt gtgtgtgttt tttcacggtc 1440 gattggcgag ttgcgaagga gggcaagggt gctgtggtgc agcatcagct ggtagtaagt 1500 cagtcagggt tcgggtcgcg gtagttggac aag 1533 <210> 2 <211> 1539 <212> DNA <213> Physcomitrella patens <400> 2 atgtatttcg gagcgatttc gtgtgctgtt ggtgtctttt ggttggaagc gatttaaaca 60 ggagagtctg tttggtggct tagggtaatt cggtggagcc tgaaagatat tgctacgtct 120 tgaaatacca tcttgtttca gtgcgcattg cttgcaaaag cattgatagt tgtagcggga 180 tatggtgctg tttatggttg tatttgagca tatgtttcgt gacatctgtg ttgcttgttg 240 ggcttgccat actggtagtg tcttgttgag tatcatattt actttccaat gtaatattca 300 acattttctc ctagcattac tataccattt ccatctattc ccaatggcgc tatcgtctcc 360 ctgggataca tttaacccat atttgtagtc cagtgcatta aatgcatgtg aaatcgcatt 420 tatagatgcg catatttaat gtcaaattag acatcttcac tcatataata cattttacca 480 aaaaatgaaa tgtacacaca gaatattttc aaactgccga ctatctcaaa aacctataca 540 ttatcaatct cattgacata cctcattgaa atactcctca ttgaaatact acataatttt 600 cattgtcaat attgccaaca ttcaaccatg agaagctgat tattatttct tttatactgc 660 ttactctctt aatgcaaatt caccattcct catgagagca gctgtatcta ctcccctgat 720 caatattact actaacttct caggaatagt actcgatatg ttgcgctggt tcagttacgc 780 aattataaag tccatcgtgt aaaccataat cgtcacaact ggatatctga tgccagaatt 840 tcagcaaatt ttagtgccga tccgaccagt tcaatgcaga agaggaatat aactatctag 900 aggttgttca caatcttttt cattacagtg cagccaaagt tctgcaacga agatacattc 960 gcaacttgca tgcaaggtga agacacatat cgcggctaga tcctcagttc gttgttaata 1020 cctgggaaag aaaatcaaca aatcgaattt ttctgcatca aatagccatg acaaagatta 1080 gtacttccag tgcaagtata gtctgcggaa atatatcgca gtcctcgtac tacagcttca 1140 aaatttgggt acatgacgag gatttcgacg cacaagaaca gaattaaccc gatcgtatcg 1200 agcgttacag taaacgagac gaagtgcctg tgtcttcaaa ccggcagatc tctacgaagt 1260 aagaatctac tcagcagtga gagcgagagc atctggtgtg gcagaatcta ctatgattac 1320 aagtgcccta tactgaatgt agaagcctgt atccacctca tataggaaac gaagtaatcc 1380 ataccgacat gttacatatc tccactgaag cagttccgta tgggcataca ggaaatgatg 1440 aagcacaacg cgtataccaa ttttttatca gatacacaat cacccaattc aaaacgcacg 1500 tttatacaac caacacgcca tactcaagat gagcaggca 1539 <210> 3 <211> 1197 <212> DNA <213> Physcomitrella patens <400> 3 tccttagtcg agaaggcgcg ggacgtgagt gagctctgaa gataagcttc caatttgcca 60 ctgcaagtgt aacctgctcc atcgggcgcg agtccgtagg gatcatgaac acctcatttc 120 acttggcgtt agtgcactct agcggcattg aagcaatcca tgccctcaga atgagtcgcg 180 gggggcagtg aacgaactag ttaagaaatc cagtaatgac ggcaccacat cggcagatcc 240 agatccattg cagattatcc tcttcagccg gaccgaataa accatgccta aataaccacc 300 ggaatgtgtc ctgtgcggga ctgattgttt tccaaagaaa cactaactaa ttatatccag 360 acagtgggat gtatgcgggt atccgtgaag ccagatatga gatctctgat aaacctgagg 420 aagatgtctt acatggcggc acgggaaaca cgaagaaaag ccgaggagaa ggtattgaaa 480 gctgagcata gccattggct ggtgaggaaa gggcatgcaa caactcatcg aaagcggagt 540 aaactttgaa atcccgtagg cttcatgcga tgttctaaat tcttagcctc gacgacgatt 600 tcaaggtctg attcgaagct tccgagcggg gctccggaac tgtcacttca gtcgactttg 660 aaatgtgaag cgactttgct cacttgtgac acagcaattc aactccacaa tataaaaaaa 720 tcgcgaaaca aaaaaaaaaa aaaaaaaatc tactttactc gtcgatgttc cactcgaaga 780 caaacagctt taaagcgttt acctgtggta gagatagatt tcggcgaagg aattcaaatc 840 cagcaaccct cccactcgta ccgcagacct tgagtttgaa cggttctgtt gctgtttgcg 900 gtgagttcaa aactcgactg acctctctga aaccaaaagt ttaccttgag ctgcccgaga 960 atctccgaac gttcgatata agatccaacg gtctcaagaa attctccctc gaggaacacc 1020 tatgcccagg ggcagggggt tcctttatct ttctccctct gccgcaatcc atttcattgt 1080 gcttgcagga ctgtcatccc tccccttgtt gccagtggta tccggaggtt cccgcgacac 1140 cttctggtgc cggaactaag gtctgttgtt cctttcgtga ggtagagcac actgaag 1197 <210> 4 <211> 1012 <212> DNA <213> Physcomitrella patens <400> 4 atgcgacccg aaggatgagt acacgcgttt tggttttacg ttactgactt ttagctcctc 60 cattcacact gcaggccctg gtttactgtt gaaagcacgg ttataccctc cgtaaactga 120 acattctgtt tcagcgcgtc gtgtcttagt tgtcctttgg ttcacttttt agtttggaag 180 caagtcgttg tatagatgat acttagcaca tatagttgct gtcgatttgt tttaagttca 240 gcattccgct gcctgaattt cagtaaatac cttgtccaac ttcgatgcaa tataagttgg 300 cttcagtatc cagtcttgcc ttactccttc attgcaatct tggtggcggt ctggtgcgcc 360 tcgtccactt tcacgatgta cctcgtcagc ttgtttgaac acttcctttc tcctactgag 420 tatggcgttg gcctcttttt ccaagctctg ttgatgtagg tcctaccttg tcaaaacatc 480 acccacagag atttgacgac aatcgtaatt ttaatccgat tgtatggggt tcctgtcata 540 gtcaatatat taacgcccat cctctcactt accaacgtct gttaccaact ggacaataat 600 gcattcacaa ccaaagtgca atttttgtat gagttggaaa tatcgaaaca gttagtgcca 660 gtaattcacg caaatagttg tgtcatggaa actttttttt aactttctgt tgtccaatca 720 tcgtgctgaa acatttagaa atgtggcaga cagttgcatt tgatgtatca actgctgtgg 780 tagtaacact tgttgaaact gtaagataga catgccaact ttctggtgct atgtgctaat 840 tgtttatatc ttcctgaaga atggtacaat tcaaatgaaa gtgggtggga gaattgatat 900 cattgatagt ggaataggtt attgcaatca gtgagtcctt ttttcagggt agctaatatt 960 ccttactgat tatccattga ccaccagtgt ggcttgtgga atgcgtgaag tt 1012 <210> 5 <211> 1386 <212> DNA <213> Physcomitrella patens <400> 5 ccgtgggact tagttgtctt cacttcatta ggaaatctgt ttgagcctct ttccattcca 60 atcttctcga caaaataggt tttttcagtg actcataact tattgtgctt tgcaaaattc 120 ccactaatcc gaaatgtatg gtgtgatcac cgagctttta aattgattgt gtttgggcag 180 tctacgaaaa atccagacgt ggagccttcg aggaacaggt tgttcgcgca ccgctacttc 240 tgaacttcac aacgccgcgt ctatgtcgct ctaactcaga ggctataaca caagttagcg 300 atgtccatcc ctctagtctt catatttgca acattaggag gaggcacacg ctggtcgaga 360 tgcccgtgga actcttccag attgctacca tcaatgcact cgtagacaga tccaaaagtc 420 attccacatt attcaacatt aagggatccc caactgacca accaagagca ggtgctatga 480 gtggaacttg ttattttcca aatgagcgtc gactacatat gcccaggcag aaggatatgc 540 cgaggtatct gggggggcag gcatgtgttt tgtgtaaagt acccccgagg taagaacttt 600 taagcggcgg cactggattc agaaacagtg gacagatata tccattgcca atgtattgat 660 tggctggcga agaactgttg caaaccacga ccagccgtag gggcgtaaaa tttgaatcca 720 ctgtttaaat ttcaaatttc aaacctcgac ggagtttcct ttagcttttc agatgggcgc 780 agaacggtta ggaaactgtc ccgtcgcccg aatttgaatt taaaaaataa atcaaaacgc 840 tagagcttcg attagtatgg gcttttttca ctcttctgtc caattctttt tgttttttac 900 ctcatgcaag gcggtcggct aaagtgactt acagggagga atattactga gagcaagagt 960 tttaccacgt tgtaggatct ggagaaatcc aacgatgcta ggcctacgca acgagtgtga 1020 ttcaacgcca gctataatct cattcgtgcc gtcgatcccg ccatccaacg gcgcagacgc 1080 tttgcgtggg aattgtacct tgcctacgat tggaatttga ctggcagctc ttgagctgga 1140 atttacttgt ctgcctgaga aagttgaagc gtaagatgct cgatccaacg atgggcagaa 1200 agtgttcgtg ggcaggaacc aaagccctag ggcgggctcc tccttttatc tatctctctg 1260 gcatatctct tctcagtgtg cccccaggga cgtcttcttc tctccttttg ttcagcgtct 1320 cagtgctcga gggacggttt gccgtctttg tttcttcgtt ctcgttgtag atcatcctta 1380 gcgaag 1386 <210> 6 <211> 997 <212> DNA <213> Physcomitrella patens <400> 6 ttgtgacctc tcctctcgtt atcattacgt agcacgctac gaacaggaca ttctgtttca 60 gcgtctaggg tctttcattc agcatttaga accaaatcat tgtatagatt tcacccagca 120 taccaagtag ctattgattt gttgtgagtt cagcatgctg ctgtctgatc cgaagattat 180 ttgtaattga ctgttatatt tgagcatttc tgttcaatca tgtggtgtgg gtttgaattt 240 taattagcag gcactgagtt ccgtgacccg aaaagaattt tctgagaata gccaggtgag 300 ttgcttcctc ttttgctgtc ggggatattt cttccgaaat atgggttatc cagcgctcta 360 tccgcttctg ctctgtgcta tgtgaacatg aatgcaattg atattcttcc aacatccata 420 taactaatgc atacttcata agaaagcaga ccgtcacgga taatgggaga aacattttcc 480 agtcatctcc gtgtccacat ttctctcaca cgctaaccat gttagtaaac cgcaaggact 540 gttattaagc aatgaatatg tctgaaaatc gtatgtgatc tgttgtcaaa gtgtcatagt 600 acccgtcatc gccgcattgt gcactgctgt cagatccgca gtaaataccc gctaacgaaa 660 ggaagagaaa gatgagagaa gatgagattg tcaccgggag agaatcagac gcagtcatca 720 gtgatactat tcgacggacc taacctcgtc cgtaaaatgc aagaatttaa cgaggcagta 780 aaatcagctt aaaacctccc cgcacgctta acgtaaccat ggctgtgcta aacatccacc 840 aagagaggaa acaccgcaca tgaacaactc ttctgaacta cacgtgaagc agagattgag 900 gcgaaaagaa agccacagat cgctgctcct caagtggtga atttattttc ccttggaaca 960 aaaatggagg tgtggaggcc aagcagcaat ttcgatc 997 <210> 7 <211> 624 <212> DNA <213> Physcomitrella patens <400> 7 ctcgagtgca gtagacgaca aaatggaagg atgcgaccag ggatgaacgg gaagagtatc 60 attaatgcga gacccttgga gttgaaggcc acgagtggga cagcgatgcc gagaaaaatt 120 tgaaaatcgc tcatcccaga caaaatatct gtgggccagc cagggtttcc cagccagctg 180 ctctgccgtg ccagccgtag atctgctcat ccgacggcca ctgcgcccca tcctggactt 240 gtaccctccg gcatttggaa agtgtcagcc tctccctgac gaacatttca cctcggctgc 300 ccgggaggcc aggagcgtca gatgggagat ctgacggcgg ggcggaggag agacctgaac 360 cggcgggcag gggaacgatg tcgttgcttg ttcttctggc tgaggcgtcc atccccttta 420 cctccgctgt gtgtttcaaa ggccgatatc tgcgcttccc ttgcggaccg agctctgtcc 480 cgctcgctta cttctctccc accgagcttc cgaggttggg cattcccacc cttccttctc 540 ttctcctctc cttctctgct cttcttctct gttgtctgcg gattaggtct tgtggtcttt 600 cgagcttcgc acagcttgag caag 624 <210> 8 <211> 1146 <212> DNA <213> Physcomitrella patens <400> 8 gcgcgcggtt ggctggaaga agagtcgaga agcgatgtgc ggcagcggca gcagcaggag 60 gggcaggcag tcaggtgcag cacgtcgctg gggtgatgcg gagggacttt gccggttggc 120 tggggtacag aagcgagggg taaatatagt aagattacgc gcggcggaag gacgcgatgg 180 ccaacgaggt ggaggggttg gggcggtttt acgtgtacag tatgagactg acactgacgt 240 tgatcctgcg cgaaccaccg gggctagcgg tagtagatag ttggagcgag agttcgggag 300 cgttgttgcg gataagctcc ggcgtttgac cccagggtgc aaccgtagtt gcatgggggt 360 ggtgggggga ttgaaattgg aaccggactt ggagttgaga agttcgggtt gtttttggag 420 gcagttgaaa gacgttttta agaagtttga gctgttggaa atacattgtt accctgagct 480 taagcagtgt gtagtggcga tgtgtttaat tgtctgattc ctgtatgttg gtgtgtgcga 540 ggcgtgtgag tgcgtggttg tgtgcttgac gtggcggtta tgggccgtgc tgtcggaatg 600 atttactgga ttatttggtc cattggtttc gtggactgga gacggtggat gtttgtagtg 660 cttgtgtgaa caaggcgggc atgcagatga tgggctcgca ataaagacag ggtcatgtcg 720 ggtattgccc agatgaaagt ctcttttggt gatgccgata cggaaaatgg aagttggtac 780 agtcgcacgt tcaggcgtca tgggttgcct tggaagtttg cattggaaga gagagttgag 840 ggtgtcctgg atgatgtcca cgaggtggtg tttgaatcga tgttgtgcga agtagacctg 900 agcaccgatg tgtgacaccg gaatggtgag tttgtgtcaa tgaactgtga gcgttttgat 960 tgaggcagac attccaaggg gatggttttt cggttttgtc ttttaaggct ggcgcctgcc 1020 tagcctcctt tgtccttcag cgcatgtttg cttgtgacgt ttgcgttggg attgttagta 1080 ttggtctgga tggaaatttt atcgtttcta tcggcagcaa ctaagtgcgt cttgtcattc 1140 ccatgg 1146 <210> 9 <211> 2973 <212> DNA <213> Physcomitrella patens <400> 9 ggatccattc aacggaggat aagtatgtag ggtgatactt aggctcattc attcattcaa 60 ggcgtattta attaactact aaagaaaaaa agggggttaa ttggggtgat tgggttatgg 120 aatgaataaa tgaataaatg ggtccccccc ctccccttcc tttcccttcc ctgcattaca 180 tatatatata tatatatggc atgcggtgct gagggtgtgc atgtgggggg gggggtgtgt 240 tgagagtgtc aacggtgcca gccacactct ccggacccct tcccattttc ctttcctttc 300 ctgccctgtt ccctgtccct gctcccaccc actttccatg cccttgaaca cttcctgata 360 aaggccctcc atccctccct ttcccttctc aacccattta attctatggc ttaaacatct 420 aaatcattac attcttatgt actaaaattt tatttataga ttgataattt tcttttaatg 480 aattaagttt gaattttatc tatgttttag ttccacaaga tttgttttat ttattacatg 540 aaacttcaaa agggatttga atatattaaa aatttccatt tataaatgaa tattcgagtg 600 agtttaatta aaattatttt tagcgtatat atatatatat atatagatat ggataaaata 660 caattgaatt aacctaggtt taatttttat aacaatgttg aagtgacctt catgtagtgt 720 gagtgcaagg atgtatttgg atatggatgt acttcaaaaa aaacatgata aataattgca 780 tagtattaaa gtttatgcaa taaagaagct agaaatgact aaaaattatc acaagcttat 840 taactcacaa acaaatcaat gatatttcat atcaagtgaa actgttaaca aaagaaagaa 900 ttacgtgtat atttcatgat catattcttt tgataattaa tggtagggta acactatgaa 960 cataaaatta ttgctctcta caatttatca aaagtataat aaaacaaaaa taaaacagaa 1020 atcataattt atgagtctct acagggattc actgtcaaat attgtaagta aagtgtgtac 1080 tattaattga ggggattgtg gtatgccatt ggaatacgtg gatcaaaagc tgaaacacaa 1140 gaattttgaa actcaaaatt acattaaaat gtttgaaaaa taaacacaaa atacaatttc 1200 ttcagaaaaa aaaaaaaaaa accatcgtca ataatgacag tcaacaaagt cagcatgcat 1260 gacgagctca ttgtatttcc tccaaaaaaa aaaaaaaaaa gaagaaaaag tgggccctca 1320 gttaaatcag agaatgccac atggtgatag gagaagagcc gatcataggt gatacgtggt 1380 catgggatca tcgtttccat gcgcggaaat agatcgaacc cctctcagtg tctgacgggt 1440 caacacgggt gatcgggtgg acccaccctg accagcccaa caaaacgcag ggaggaagag 1500 gtggcaagta agtaagtccc acgtggattc gagacaaaac gttgtacgaa taatatacga 1560 agtgagaaaa aaccacagag cgggtggcag tcacgaagtc gcagacacaa accgggctgc 1620 ttgacacggc gacccgttcc ctgttctgcc gcccgttccg tcgccatctt tgtctcattc 1680 gcacaaggtt ccttttccag tgccttctgc gcgggtccca ccctctccat ctgacccggc 1740 ccgggctaac ccgttccgga gcagatgatg atcgacccgt ctcgcaggct ccttttgtgc 1800 accgcgtggc ttcgtgattg ggccattgtt gctgtttgct gtttgttgct ctgctttctg 1860 tgtccgggcg gcattcctga gaggcgattt gcatgcgcag gctcgttgta gagcagcagc 1920 agcgctgagg gtctcgtcta ggcttagtct gcttctatcc ttcgctgctg tcgcctctgc 1980 ttcatcgtcg ccgtctcttc tcaggttaga gcactttcaa gtgttggcca ggactgagta 2040 taggaaggag ggtttattta tttatttatt tatttattta tttttctgtt atttttattg 2100 ctggctgatg tccatcttcc gacgcgatcg tcgttttttt ttttttgttt gtttgtttca 2160 ttgtgttgga ggagtgtaag atttaatcgg atgcataggt tgtgtgtttt gcatgcgttt 2220 agagcgttta catgtgcgat gcacgagctc tggtgtcgtt tagaggccac tgatttagta 2280 gtttcttgtg cgagggggat tagatcttgt accgcaagat gttgctccgg ggttgtggtg 2340 gcgatggcgt tttataatta acatatagtt caatggtgat gatttaatta gcagtggtgc 2400 atgagttagg tacggatcgg gcgattgtgg atccggactc gtgttcaaca ataggctgga 2460 ttctcttcta ttgcgattgg ccagttctta catgcaatcg ggtacacgat cgctgaagta 2520 gaacaaatta aactcatcga ctgaattttt gccgtctcct gaactgtcga aatagagctt 2580 gaaaatttga ttgatagtga ttgtttagtt ctctgcgaaa tcgttctaca taatctttaa 2640 attctgaatt aatctcaatg tattttgaca tcagctgatc gcttgtccgc tcgctcagtt 2700 caattcgatt gagtattgcc tgcagatttt tcagaaaaat ttaagtaatt tgatagtaag 2760 aacttgactt cctgtggatt ttaaacagta tagcatatga agtgccaggt tttctgaatc 2820 ctccatttct tctaatcgct atttccgaag acttctatac agtatggagg gcgttctgta 2880 ctgtcctgat tgcgagacat gttttacgac gaaaatttac tgctccttag aactaaaatc 2940 ttctgaaatg gttgggcagg tcggtattaa gaa 2973 <210> 10 <211> 1128 <212> DNA <213> Physcomitrella patens <400> 10 agcagtgcga cacatctttt gcttttttca gcacgtctct tagctcggct tattgaactt 60 cgattgctaa cgtttgtggc caccgaatta ggcctgctag cgtagatcaa ttagaggtcc 120 atgttgcaga aagcttttgt ttgtaaaaat agctgatatc tggacgcata cgactggctg 180 atataattca gtgccattca cattatttgt taacaggtcc agggttgttt gtagagtcgg 240 acagcatttc tcgtcggaat gttggcgccg ttttgtgaaa tgaaaggtga ttatgggtaa 300 aatgcataca tagtcctgtt gactatggct gagtggataa gatatatttc catcacaggt 360 tagatttcct gcggagtgtg aactgtgacg taaaatcaca gagtgcgtcg tcttagccct 420 agcccccgaa tcatccttta cgatggatgc atgttcggat gttataattt gatttttttt 480 ttttttcgtt gtttacggat ttttgaccag tttaccattt gttgtttcag ttgtgatggt 540 ttggttctgc gtagataagt ttgagttgag tatatttcgt gagacgtcct acgccactgg 600 atatgtatcg ctgaagcaga atactgagta ttgtaattgt atgttccaga cgtttcagta 660 gttagtgaca gtggaatgaa gcaacttggt ttttctcttc tatggtcttg ccaatcgttt 720 ccgtcgcgag attgagcgta cctggtcaag ttgtgttatt ggtgagctca atgtgcttgt 780 gattggtcaa tttccatata taagtgaagc gccattttca aggagacaag gagctctatt 840 ctaggcattc accagtcctc ggctccaggg gcactcggga gatgaggtca agtctcattg 900 ctagagtcgg ttggtgacca ctctgaggtg gctcattact tgggatatat tccatggcga 960 ggtttggttt tgcatgctat cgacgaagcg gctagaactc tgggaatcta attattttgt 1020 ctaatccgtt gcaggacgat cagccgtgaa acagatacct atattttaag aatgtttatt 1080 cttgtgtgcc atgtgtttgt tattgaagaa taatcttcgg tgacggtg 1128 <210> 11 <211> 3035 <212> DNA <213> Physcomitrella patens <400> 11 cgagatcggt ctgtaagccc tgtatttggc atggaatatc ttttaacaaa gaagatccat 60 cttttagttt ctcataatgt tgaacaacgt acttaaggat ttagaaagtg tgtttcgttg 120 cttctcttgt tagaatggcg ttatgagcct gtgctgtgtt cttcttttta gctggatgaa 180 ctgtacaatg tttcacaact gtagcctagt tgatcgtgca tatttgcgtc atgactcccg 240 gcaagttgat gtgttttttt cttgcttttg aatcccttca acctgtattt ggtggctcgg 300 acagtaactg ctacgatata cgtcagtctt tagtaagtaa tatgttcctt tttctctcgc 360 ctcacgtatg tcatatttcc tgagatagtt ttttaatttt cgctctgtgg tttcttgtag 420 tcctttcact gcgtgccgct atcacagctt ggtcatagag gaggccacat ttccagcgga 480 ccaacttgag gttacagcat ggactgagga cgggcttgtg atgggagtcc gtcacaaagt 540 ctacaagcac attcaaggag tgcaatttca tcctgagagc atccgaactc aaaacgggat 600 gcagatcgtc ggaaactttc ttaagatttt agatagaaag gagacggctg acaagaagga 660 gttgaaacac aaattttgga gagtgtttga gtgatgagtg atactgggat ccttttttat 720 gggaaagatt gccagcagca gtaagcttgc ttttgttaga ttcctctccc tacagcgtgt 780 acctcctcga atatgcactc aagcaagcct agaggttgct gctatagatt tctcggtaag 840 acagggtatt attgaggcat tttttgcgct tccagatgga gctactacca caagtatcta 900 tcctattatt atctttaact tcgatggatt tgccatgatc actgaggtac gtcgaagttg 960 tgattggact tgtagtgatc acttccagag cgagctatca aactggtgcc tagaggagca 1020 acgcaaggag tgctgaatta ttctaatgat ctcatttagc ctaagttttc cgtcaaacat 1080 agtgatgttt ttaagttcat ctcgttagtg aaacatctca aagaaggtac accattaaat 1140 tattgcaggg gttgtgatga ctttatttaa tagttgacct cttcaattga gaacgcgttg 1200 ctctcctttt gtatagtttc aatcatatca aagctctatt tgttctctgt accttaagcc 1260 ttgtgtaagg catttaaata atctcttcca cgattaagat ggtagttatg tcgccggttg 1320 caacttccaa gatgtcctaa tgctatagtt ctcattcaca actcaggagg tttgttgttt 1380 tatgtttttg aaagtgacga aggaaattgt ttacttttcg ctttgtgtct gtgtatttta 1440 gaatagtacc ttaacttctt acacaatggt gtctaatttg ttattcttgt gtatcacgag 1500 cgttaatcgg tttggacgtc ggaccctttt aaccaatctc aattgcttct gttctaatcc 1560 acgcgtccca cgaatggcag gtcaaatacc gattattgcc cgactctaat cgtgacagtc 1620 actgagacta ataacgggag gtcactatct tgtgacgttc tcgttatttt aaaatctgta 1680 taatggcaat ccctttctgc accacggcga actcatgatg attcttatcg agtcctgctc 1740 accaacttta tcacaagacc ctacggatct aactatgatg accaaaagct tgttctacgc 1800 atgcatgagt cccttcgttt gggagatttt agaattctta ggaactcaca cgttgtccat 1860 aaattttaac caccgggcaa cataggatgt tgacatgtag tcacaaattt agaaaaaccg 1920 acttcaaaag gttgcccacg tagacaaaac aactcgaacg cagaaatcca ggcgaccggt 1980 gaaattggaa cattcacaac aaagcgagaa gaggttcaaa aaaaccgcag agtaaaccct 2040 atgcgccaga ggggaatggg agatccacgg gattcggaga tgaaaaggca tcgcgcgagt 2100 aaaaacaaag agtgcgggga gcaagggcat ccagaagagt ttcactgaga tctacagtgt 2160 aactcagaaa gggagccact ggtacaaatg ccagctttgc aacgcagaac gaacgcggga 2220 gagctaacag atccgggctc aaaatctcct tcttctacct ctcaagccgt ccacaaccct 2280 cattctccat tctcgcacta ttctcctcaa accagttgca tctgcggttc cctccatctc 2340 caaccctacg gctttcgtgc gagcttattt gttgcctata ctaaggttaa acccactcac 2400 tttgttgcct atactttgct ttgctatttg gttgctttcg tcttcgcttt tgttctttgg 2460 tttatctcaa gtgcacatgt tctcgcgacg ctgtgccgct gtaggggctg gtgggcttat 2520 agacctgagc accgaggcgt gggtttgctt cgactggctg tggttgttag caaggtgttc 2580 tcgtaaggta gttgtgttca gagctagatc ttgtgacggt gatgcgaaaa atgcgttcat 2640 cagagttaag tgatagaggg gcttttcgtg agatctgctt ctgtgatgga tctgctgtga 2700 aagcggtccg cgttctcctt tatcttcagc tctgtgtctg atgtttggga aatgcatcct 2760 ttggatacgg tgcgattcag gctgtatatt gaatccccga gttttggaaa tctttatgac 2820 ctcacttaat ccgaaagcta atgggctgta ttgagtgagg ctaatacaca tctctccata 2880 ccgcgcttcg gtttcgactc gtcttaccga ccacattgat tcacatgcgg agacatcagt 2940 gttggatcac ttacagtctg acctaaatag cacgtgtgct acacatagtt tcaatgccag 3000 taacagtctt ttgatgtgca gagtatttct tctcc 3035 <210> 12 <211> 1221 <212> DNA <213> Physcomitrella patens <400> 12 gctagtgcat acctgtctcc tgaaatgcta tcacaccttg tcaggtgggg ttatggagtt 60 tatttgtagt agctaagcag ctcgaagagg ccagtgagag actgattttt caggggttgc 120 aagggaatgg ttactcgagt aaagagccag cgctgtcgag accttcttgg tgcaattcca 180 tctttgaaag tatgcatcac aagttagatt cgtggctttt gagcttgtcc tcattatttt 240 gcctaccatt tatgtttttg tggatttagc atccgcggcg tttaagtttt tgttttaaca 300 ttctttcttg taggttcgga tagaatgttg gggacatttt atgcttgaag agcgtcttgc 360 actgtcggac tgtaatgcaa tgcttgtgga cctcagcctg gcctgcaata cttgtatatt 420 cgtgaaaaca atcatagcga ctctgtgtta ttcttcccat gtcattcact ggctctcgaa 480 ctttgtcgaa tacatctgat gggcacgcgt gcagaagccg ttctttaacc tcgatgggat 540 ggattagtac gatttgctgt catttaaaac tatttgctat ccgtatttgt cttctgttcg 600 gaaatttgtg tagcttgtta ttttatggta tgttgtagga aatcagcttt ggtgagaaat 660 ttgtttcata acgacacaat ggaatgatga attaaattgt tgccagacca atatcgtatg 720 tgtcaatctg attcctcaat gcagatatgg ttgtggagcg tctgctgtac ctccttgttt 780 taaccgccgt atctgaacca actcgaacgt agtttgaaaa atgcactaaa tgatgcatat 840 tcaatcggtc aagtcatatt aaacacgcgg ttttgaaagg tagcaggtgt atataatata 900 aacatgtata tcgcaaaggc ccattcctga cattggatgg tgctaattaa gatctaatga 960 accgttcctg gcaatgtatc tatcaagcaa actgaagaca caatgaatcg ttgagtgtat 1020 gtagaaacac aaaacgatct tgtatttcct tttcatgtgc cagagtgagc ctcatcgatg 1080 tacactgata ggactcaact ttgatatttt ttgaagattc ttatgcctga ataaggtact 1140 tggaatcata gttctttgtc tcatggctta acttgattaa gatttgggga tttggaacct 1200 ttgtaaggag gcaatgaatt c 1221 <210> 13 <211> 3060 <212> DNA <213> Physcomitrella patens <220> <221> misc_feature <222> (1)..(2301) <223> a, t, g or c <400> 13 agactctact aattgacaag tatgtgacta caaaaggcca caagactctc tctgcactat 60 aactataagg ctcatatttt ttgtccatgt agcttgtata tatatatata tatatatata 120 tgtatattta aatcaaaata tttttattca aaaacaaaat acaataaaaa accaaaaaat 180 attttaaaaa taaataaaaa attattaata cttttatgaa gctattattc aaatttattt 240 ttaatttcta atttaagatt tattattttt tcttaaattt attaaacttt ggaatttatt 300 tttaaaataa ataacaataa aataatttat agtgttttta ttgataagta aaattaagag 360 ctaaatttgg atcattatta caaagttata atacttaaat atttattgag atatatttaa 420 atttaattaa tattttttat taagttatat atatatatat atacacatat tatgaaatta 480 tttaaaagaa gttagtagac ttttaaatat tttttaccat gttttaattc tagtacaatg 540 tatttaaatt atcttattaa gttatggaaa agaagttagt aggttattaa atgttttgtt 600 agattggttg taaaggtttt atgataatct tgtatgataa ggttgtttag catagtttat 660 tttgcttaat taaaaaaaat tacatcttgt tacatttaaa tttaaaaaat acatactata 720 cacatatctg tatttagatt gcttttacaa tttttatctt tttgtttttt gcatatttca 780 aagaaagccc agcatgtgta taataatttg tataaccctt agaaattaat aatatttaag 840 taaataatnc ttatttataa ataaattact gtttggtttt taatncaaga atttaaaaga 900 cccaattgtt tattccaaag taatagtagc ncattaataa aaatccttca aaaatgaaac 960 taaacaaacc aatgcatctc aaatgaaaag gagaagaatg atcttacata gacanccaca 1020 aggagggaca tgacaactta attagactat gggtttagga acatcaacca ttccctacta 1080 ccaaaaaagc ttacatgatt ttaaataaca caatattcct tgtgactttt gtgcattatt 1140 gaggatatcc atctatctag attttggaca atgttttact gcccaaattt caataagaac 1200 cattcacata ttttgaaaca catttgatac actctacatt catgtctaga gtatagggac 1260 ttgggtttaa gattagggtt tcagattagg gcttgcaggg ttacagttaa aagttaggat 1320 taaagattta gatggagtct tggttcagag agaaaaaagg atttggggta aagtttttat 1380 gaaagagaat catcgcccaa acaagtagcg ggactgctga atgccttttg caatgaatga 1440 aaatttatca acgtccgtca atatgtacaa gaccatcaca taatggcccc cctgaccaca 1500 atttgaaaaa cacacacttc ctgcctggaa ccagtaatac aagtcattgt aggggagaga 1560 gagagaggga gagagagctg tagctgcgta taataagggc ctcgcagatt cagtgctacg 1620 tcgtatggat acaccgtatc acttctggtg tacaggttac taaatactac tcgacacggg 1680 gcgggccgat ctgcggaacg cgccggggcc atgtcccagg gccctaggcc cgccatattt 1740 ctctcgtcca cccgggccta cgcaaacttt cccttctcac tttcccagct cacgctctct 1800 gttcaacgca caacaacgcg tagccgagac gggttcggag cacaaagtca cccagcccgg 1860 cccgacccgt gcccgtctgg cgcctatctc tctccgcctc tgggcccgtt tcgctcctgt 1920 ccttgtgtgc tctgtctggc ccttcaccgc gcttcattgc ttcttcgacc gagagcctct 1980 tagctccgtc ttgttcacca ctgccgcggc actccgaccc cttgcatact ctcttctgcg 2040 gtgcctgctt ctccccatct cctgcatcgg tgccctgttg tgtttttttt taaaggtcag 2100 tccctctatc acgtcagtgt ttcgcatttc cgtgaagtgc tcagggtttt ttttgctgcg 2160 aactgtcggt ggagatgtgc tttttgtcgt gtttgatgtg tgtgcggtgc agcgatggtg 2220 ggtttcttgg aggaggaggg agagtcttat tttagtcttg ttgcccggtg tgctcggggc 2280 gcgaatgtgg gtttatggta ncgcacaggt ctgcgtttgc gatatgtgtg tagaaccctg 2340 tgccgagcga tcatcataat agtagtttct cgtttcggag gggctgggct tgtcaagtgg 2400 aacgcagagt cgtagttttg agagttccag acgcgcatcg cgcagctgta gtgagatgta 2460 gcttctcggt gtgtttagtc aaggtttcgc ttttccgatc tcggatcatg tttacgtccg 2520 tcctttaagc tggatctctt gttctttaca gaacttgttc atcgccctga ctaagttgct 2580 ccagtgttgg tctgaagacg acaagcctct ttctttcttg aatagtaaga agaggaattt 2640 aatctgaagg cttgttttgt acagtagttg gtcgtttatt ctttgatgtt taacttagcg 2700 tttcgttgta cttctactaa tgtactcttt agcttggtcc gaggctatta tttaatgagt 2760 catgccctga agtcgggaac agcgggttgc acctacaatc atatggatat gaggattcgg 2820 gtcgagtatt aacttgtagt cctttgttca ttgtttttga ttgcggggtt tagctggtgc 2880 aactgcctga atagcacgca ctgctttccc tgcgttcgaa tcgtcatcaa cattactatt 2940 gtgtaatcca catggctaca gctgctgtaa ggttctgcgt caagggcgtt cttcaagaaa 3000 taacctatgt cttccttgaa attaaatatt ggtggttgtt gtgcaggtcc gtattaaata 3060 <210> 14 <211> 4124 <212> DNA <213> Physcomitrella patens <400> 14 attgtccatg tgcactacta aacatttttc agcacactcc cttccccggg attgagctct 60 tgctgtgtag aactctcgtt gcaagtatca gtgattgcag actttgactg gtgagcacag 120 attcaacaga ggtttatttc gcagatgact atggtttgta aaaatagcag atatctgggc 180 tcaattctaa cggctggtat atgtcagtac ctataaactt aactgtttgt agctctagat 240 cggtgtggta aagtccggta ccaattcttg tcccttttcg tattaaataa agggtatttt 300 atttcatata tcgtcttttc cttttgtcat cacatctcta tcctgtgcat atcatggttg 360 tattctcagt cgtaatggtc tttcaagtgg aatgatggct ttgatgatgt gcacctggtt 420 gtgtctctgg gcgtcatggg cttcacatga gctgcggtta cagatcacgt ccagcctcac 480 acaattaact aggcatgctt tccatttcct tctgacgtaa atgacaggct ctgacaacaa 540 tgcctggcac ttcctgacgt gggacccgtc gattggtgcc gaagtcgagc aaaattctaa 600 cctccacaac tggtatcgtg aatattctag cctcttcctg agaacagtgc cggtcgatct 660 cgaattacct cgtaatagtc gtcaggcatg tatgtatgtt taaaaatact ccatgcggct 720 aaattatttt ttaaaattta tctttggatt tgaaatgaat ttctaccttt ttttacttta 780 agttacgagc tgcgattcca actaatgaag ttttacatac taatcagaag aatgtcgttt 840 tttgaaatta acaggttaag tgttttgaag aattaaagta tgatgattcg tcttttttat 900 atcaaatgag ttttgaatga ttcgtcgttg cattttttaa atcttggaat gaattgcgtg 960 tatgtgacgt gtatggaaag atacaaatct catgtagtcg agtacaagac aattacacct 1020 cttatgttta tggttcattt gtacatagtc tacgttagct taaggtcatc gtgtgtgagt 1080 atagtatatc tcattaccta atttgaagtc cagtaaatgt tagttatgtt accatcgacc 1140 agttatcacc gatgttgctg agaagcaatg tgaatcttag gaaacgagtg atatttgaac 1200 tggatattaa ttcatccgta atctataaac agacatgctc tactagcgtt aaaacataag 1260 ctacagcaca aaatgatcta aaaaaatgtc atcaatcata agctgtgtat aatacatccc 1320 atgaatatca acagtatgag tttgggtgtt tgtgcacacg taaaaacgaa ccctcgaatc 1380 gaaatgtgta ttactgaatt cacatgcaaa tgaattgttt ggatcattta ctgattaggt 1440 ctgtactcta ttaatgaaac atataataga tttaagactg tccagtcagt tttgaattaa 1500 gccttgggat ttgtggtctc ttcctcttcg gccactaaaa gtttaattca cattgatgtg 1560 aaagaaaaag tcacaactca gccttcgctg tgttagaaaa gctgcacgtg tgaggacttc 1620 tcaggcagcc tttccttttt cagttgagtg tcgaagtagg agcacacgtc gtcggtaacc 1680 ggctacagga ggtgtgcact gtccctttac cggatgtggg aagtcaccct atcctgagta 1740 tggctcacac ccaacgttgc tactccatcg cacagacagt tccacatgat agactgctcc 1800 gcgagaagcg tcactctcgt gcggtctcac ggcttctgtt gcggccgatt cagtgcaggg 1860 agtcgttttc gagcttgcga agtggctctc ttgtcattcc cctgcttctt ccggcggcca 1920 ttttgatgca gaattgcgaa ttctgcagaa tatgttgaga actcgtcttg ggggttttcg 1980 gatgaggagc taaaacccta gagggacgga caattctgtg gagcttgctt gtaatcctgc 2040 agtacaatag aataatagag cgacatgtcg acgctttcga ctcatgctcg cgtgtcgtca 2100 ctgtcatcag tgtcgacagc gtcgaatgtg gtggcaaatg tggctgtgag gccgtgtatg 2160 atagtatctc ttctgccggt tgcgagaggg ttgtgctcta ggaaggggtt gatgtcgcgt 2220 ggacctctcc gaagacattc ttgtatgaag agtgtttcag taatgccgag agcttctctc 2280 ggtcaactgc ctgaccctga acaggtggac ttgtacatta atgcgttgtc ccagacgccg 2340 gacgccctgc agggattgct ttcgcggacc gaggggctct ttttcacatt ggcggatgtt 2400 gctgtggcga ctgatcccag ccaggtcacc gacgctgtag tgcagaaaca ggacggaggc 2460 tggcttggag gtgtctcgaa ttctcttgag atagctctta ccgtaagctc tttttatttt 2520 tatttttata tatttttgtt tcttttttga actgtgaatt gtgtatattg ttttcctctg 2580 aaattttctt tcagaatcta ggtggtaaaa cattctgata cttatgctta ttgcacggtt 2640 tatctaattt actaagattt agtgtgaatg tgatgatata attttactaa aatttaagat 2700 ttttctaaaa tttaattgca gctagtgtta tctttcgagt cgatgctaaa acattcctgt 2760 tgacacgatg atcatgaaag ttagatgtgg cttaataaca aatgcaggaa ttaatgaatt 2820 ttatttattt atttattttt gcagtttttg aaggatacca ttgctaagct aggcatacct 2880 tattcgtatg gtttcgcaat tattctttta actattttag tgaaggcagc tacttatcct 2940 cttacaaaaa agcaggtttg ttgttctact gattttctta ttttgtgctt tctttctttc 3000 actttttgcg tacaaatcat ttttgtgata tactaattta ttgtgtaaaa ctaaaagaat 3060 tactatattt ttcagctaaa tatctgtcga tgtcctgtat ttactcataa gttttatggg 3120 tttaagatag tacccagaca ggactgagtt ccattggtag gtcagtactc ctgttagatt 3180 agggaggctt ctattgttgt atatctaatt gaaagtggtt atgtttaaca ggtagaatca 3240 actttagcta tgcaaaactt acaacctaag ataaaagcta ttcagactcg ctatcagggg 3300 gatcaagagc gcattcaatt agagactgca agattgtata agcaggctgg agtcaaccct 3360 ctcgcaggtg caattttgtc gaagtcctcg aagcattaat gttaagaatg cttgcagatc 3420 actttccggt ttttgacgga cacaaaatac agtcgaaggg actaatactc aataacttgg 3480 ttctgtatgg tagctcataa gggttgtggt ttatgatttt acagggtgtc tgcctactct 3540 cgcaacccta ccagtatgga ttggattgta tcgtgctcta tcaaatgttg ctaatgaggt 3600 attgcatcat gaactggagt gcttgaaaca gttgtccttg tgcggcatgt tgttccacct 3660 tagtttattg tgaaacatag gcgtcattag acaatccaca tttagagtaa tacaggaagg 3720 tcttaccata tattcatttc aaagaggttc aacagacatc gtaatgcaaa gttctgtaca 3780 ttttctcttg acttcaacgg gagaatatct attcttaaat gagatatttt ctgtggtact 3840 ggtattcaag tatgaatgta tgtaactatg atttacttat gcagttctgg ctttgcaggg 3900 gctcttgact gaggggttct tctggattcc atccttggca ggccctacaa cgattgctgc 3960 tcgttccagt gggagtggca tttcgtggct atttcccttt gtggttagtt agtcccttca 4020 gatgcttgtc ttcgttattt tttttccata tcaaatgtaa tgatgctggt catacagtaa 4080 catatagtga atttgttgat caaaatggtt gtccatggaa gctt 4124 <210> 15 <211> 3053 <212> DNA <213> Physcomitrella patens <400> 15 ttgttgaatc atgttaattg ccaatggtta ttaatgacca tcatattgta cctggaatgc 60 attggaaaag taatgttcca ctaaataaaa gttgatccac caaatattgt tgtctagtca 120 tatcgacaaa tagattcaaa ataaattaaa attaaaattg aaaatgtata aacattggca 180 tgaaaatgat attaatttaa aacaattcaa aacttataca attatttaaa atacattagt 240 caccgggtta aaggagacag actgacagaa ttggattgcg gcaatcagta gcactgcaca 300 aataaattta acatgaaaac attatgattg ctaatactct gtttgcatgc acttctacaa 360 caacaaaaac aaaaaataca atcaaacaaa acaagcaaac aataaatgat tttagatttt 420 gcatgataca agcaccagag ataattatga ccatgtgata aatacaattt ggaccattta 480 tatcctacaa aaaaaagaaa aaagaaaaaa gaaaagtttt tgtttgtatt tgatatcttt 540 attttgttac caaaattaga taattgcaag ccttgtattg tctgagatgg aatgtatatg 600 taacacattt gagcaaaaaa ttaaattaaa ttaaattaaa taagattttt ttatatatag 660 taaattgtaa aattgaccca aacatttact aaatcaaccc acccattcta accatcataa 720 gaagaattcc gctatcaaat ccaggttggt tgaaaaccaa tgaaaaaatg gttggcttct 780 caaccaatga taatggatgg gttaatttaa taaattcatg ggtcaattta aaaattccat 840 atatataatt aaaaatcaat tgcaaaaaat attttgacac aatcacacgt gttttgaaaa 900 tcatacatgg acaaaaatac aaagagattt tttaaccaat attttggaaa cacatttagc 960 aaggtgtcca atgcccttcg atacccacaa gaacacacct tactttgccc atatttaccg 1020 atatatgctg cagtcagtta gggttgaatc cctgagggag gggggctccc gtgtgaacaa 1080 agtccaatgt ggggccgccc aggattaggg caccaggtgt gaacgaggct ccacccgagc 1140 gagagccagg aatttgaaac tggcatggga aagggggttg gttccacctg atggcacctg 1200 cccaccacca ctagtaaaga ttcaatgccc accacactgg tttttgaata taggatcttc 1260 cttctccttc taattcttct cttgatggat gaataatata accgatgaat gagtgggcac 1320 atggacgggc ctcgccccct ctctactctc tgcaatacat tacaaaatac atacatgtat 1380 acatagggat ttgatgactt caatacatac acactacaaa accgggtcag gaggggggta 1440 taaccaggca agcccgagtg gcgggcagta acaaatacac acccccaaat cgtatgggcc 1500 ggacacgtct gagcgacacg cgggtgccct gccctcctgc cccttccctc gccccttttc 1560 tctcgaccgc ctgtcgccgg cccggcccag actcctgcca acctgggaac caacccccct 1620 ttttggtgag tgctcttcac ttccctcgca ctcgctgctc aagttgaggg agggagggag 1680 taggagtagt cactcacccg gcctggcccg gtccggttcc ggtccgcggg ggctgcgttg 1740 cgcgacccgt tctcgtgggg ttatctctgg ttctctatcg ctcgctcttg tgcatcgtac 1800 tgctcctact ttttcccatt gttgctatgc tcgctgccct gcgctgcttg gccgtccgtt 1860 gtgcccctcg ctcgtcaacc aagcactgca gttcgctccc gcattccttt ctgcagcacg 1920 gtgtatctct ctctctctct ctctctctcc tcatctgttt agcgctggtg ccggttctct 1980 taaggtgaga gcttctgttc tatcggtgtt ctcggttttg gtatgtgtgg tgaccgacga 2040 tcggtttgtt gtgcacggtc gctggatgta tggtcgtctt tgttcttgtt tagttctgtg 2100 tggcgattaa cgtgttcttg gaggagtatt tttggccttt gtctgctgat gcgctcagca 2160 gcgttgcgtt agtgtaggct tgtgcttcac atgagcgtgc cgcgcgtcta ggcgtggtgt 2220 ttgagttgaa tcttttgccg aatgactata gttattgatt tcttgttatc tgaagatctt 2280 gtgctgagat atgtggtgta gggattcgag aagtgctatc cccttgttgt gatgaacagt 2340 tttcatttga tgtggttatc atactttgga gccttgcatt ccggatcgtc attagcttca 2400 tctacgtggc tggatttttc cgtcaaccgt aggctgaagt gccttaaggg gttacatgtg 2460 ctgagttgac tacatgtaac aatggcatgc aaactgattg cgtgcacttc atacttgtat 2520 tcagttcgtt gtagagtccg ggatatatgt taggtagaat aaagaatctt atctctcggc 2580 attcgaataa aaatttcatc ctttttgaat gcaccttgtt tgaaaggtcg ccccatgccc 2640 acggttgact gagaacaatg tctgcgcatc agttactgat ggtcgcacct gttgtcacta 2700 atttgagtga ttaaggtttc ctaccggctt tttcttttcc actgatttag tttattcttc 2760 atcaagttta caaatattgc tctgtatatc acggtttttg ttagtctttg atgtaatcat 2820 attacctggg tttattatct agtgaactat gactgatatg ctggcgcata ttctcctact 2880 taatttgacc ttattagaag atgttcgtac ttagagtacc ttttacttaa tgtaactgaa 2940 tctatcattg ctttcgttct taatcgtgct acaaaattta actcattctc tcgttaacta 3000 atgtttttga gcacttgcac tgtttttgaa ctcctgtagg atcattctaa aaa 3053 <210> 16 <211> 1879 <212> DNA <213> Physcomitrella patens <400> 16 atctgtactg cacagtttta catttttcag gcttgcattt tgctgggatt gagttcttgt 60 tttgatagaa ctctggacgc aaatgtcttt gactgcttag ttgggctggc gagcacacag 120 taagaagtgg tacatgttgc cgaaactatg gatttgtaaa aatgaaacgt atctgggcgc 180 ataacgaact gcttatatat gtcgctgtct gttaacttca atctctacat gtccagatcg 240 atgcggtaga acccgaccat tttttgatcg atgtttgaac ctttttatgt taaataaaag 300 gtaccatgtt ttcagcgcat taatcatatt tattttggtc actatggact tgatgtacac 360 cggatgttac agctcagttc tacttcacag ttattcactg acttgccctg aaaaagtcgg 420 agtgcagatc tcgttgtgtt ttggtaatct ggttggccag tctcagagct ctattttttg 480 atgaatccag ttgattggca ctcaatgttt ttttttattt tttactttta tcatagtgtc 540 aaggttgcta cgccaggaat gctgtgaggc acattctacc cgtatgaatt tcctcgttcg 600 caatagctgc aagctcaatt taggtttttc tgagcaagtt gtagaactat cgtgtactct 660 caccagattt cagcctctca gtgctgagtg ctttcgtcac gttaactaat tgtggaagat 720 ttggaatcat ggttgcatcc cttagtttga cagaattcac agtcgttagt tgacctctct 780 atcttggtcc accatatgtc aacctgttca agagggctgt gctcggttag gtaatcactc 840 agaagtttct tcctacagaa aacttgtttt gtgggcatca tctacgtgga agaattgttt 900 gagcattaaa tcattcaaca ccttcagtta catgaagtag gttggaagca gtgccttgaa 960 gagatccttc acagaaagcc tctcaattct catgaagtct gcatctaact tcttttgaag 1020 tttgtacacg tgtgggcaga attgaagttg gttttgtgtt gtttgaaaca actgtaattt 1080 aataaatccc aaacaagact aaggccatct aacgttttca catgttttaa aaaattacat 1140 tgaactttgg gctaccgtag ttttagacag atgcaattaa aaataaaaag aaaaaaatga 1200 aaagaaaaaa gtcttgtttg ttttagttgt ctgttttgta cagttttgtg acctatttta 1260 gagtgtcatg tatcgaacat ttgactcaca attataaggt tttatatttt aaatgagtct 1320 tgttgtcttt tattttattt tgttctacat tctgtaatat taaaacttct attgaaaaca 1380 caacaaacat ttaatttcaa gtttttcaaa tttatatatg catattttgt atgtaaattg 1440 tacaaatgtt cataatgcaa attgaaatat ttaatgtaag attatagcac ttaaacctga 1500 tccaaaagat aataattttg ggcaaataat taaaattatg atagacaaag tttagaatgt 1560 tgtaataaaa atttatggta agtgctaaag tatgtaaaac aaatttcata aagaattgct 1620 tgtagcattt tcaagagaaa aaaataaata cttacgacta tttttaaaat gacacaaata 1680 gtaaataaca atatattgat gaggatatat atatataatc aaaattaacc attagtgatt 1740 tttaacctgc atagtattaa tgtatgggac cgcaaggtag acacctacct ctactggata 1800 gcacctctca tatacacaat aaaactttta ccttgctaaa agtccaaggg aatttacaaa 1860 agaaattctt ttaaaaact 1879 <210> 17 <211> 1823 <212> DNA <213> Funaria hygrometrica <400> 17 ctttcgtgtt gcctcaagag tgcctcgcga agaaagaagg ttccagcaac aactagagaa 60 tgggtacagc attcataaaa ctacagataa ttatccttca aataagtaag aaaaaagaag 120 gaaggaattg ataaataagc aagaaattaa gcaaagcagc cactcggcta gacaaaagag 180 actgcacacg ggtggccaag gaaagcgccg gtcatagggg atatgcggtc atggggtcac 240 tgtttccggc agccggaatc gattgcaccc tcgcagtggc tgacgagtca gaaccgggtg 300 ccaagtggac ccagctcagt cgcgggcagg ccgaggtggc accgaagcct ggtcaacgtg 360 gaatggatac gaatgtactg gatacgagat acgaatacga tacagtagag aaagaacgcg 420 gcgagggtgg cacgaattcg cagacacaac cgagtcggcc tgacaaggcg ccccgcctgt 480 tctgccgccc cttccatcac ccgctttgtc tcattcatcc acggctcctt tttagtgtct 540 ctgcgcgggt cccaccccct ctcactggac tcgagatgcc gccctgcgct gcctgactcc 600 acctggcccg gcccgacccg ccccgacccg ttccatggca gatgttgatc gccccgtctc 660 gcagctcctt ttgtgcaccg cgtggcttcg tacttggcca ttgttgctgt tgctgttgcc 720 ggtgctctgc tctgtcttcg cgaggcactc ttgaggcgat tttttttgta gtagcgcaag 780 ctcgttgtgg agccgcgccc agtaaatcat ctaggcttag tctgtatcca ctaccctccg 840 ctgcgatcac ccctgcttcg ttgtcggcgt ctatttctca ggttcgagtg tttctgagtg 900 ttggcgagga ttgagtgtag gagcgggagg ggtttgctgt tgtttttgtc gctggcggat 960 gtcgatcttt cgacgcgatc gcatttttct tttgattgtt ctgttttgga gaacggaatc 1020 ttttgattgg atatatagat tgtgtgtttt gcatgcgttt agaacgttta cacgggcgat 1080 gcatgagtcc tggtgtcgtt tggaggccac ggatttagta gtttcttgtg caaggtggct 1140 tagatcttgt actacgagat gtttctccat gattgtggtg gcgatgactt tgtatacttg 1200 acgtgtagtt taatggtgat gattcaatta tcagtggtgc atgattttgt tacggatcgg 1260 atgatcctgg atccctgatg attctttttc aagtaggttt aattctctgc aagcgcgaac 1320 ggttggtcgt ctcattctaa tggtggcatg atcgcttatt aaattacgtc gactgaattt 1380 tctccgtctc ctgaattgtt ggagtagcgc ctggaaattt gttagatgga gatttttcca 1440 ttatccggga aattattcta ttaattcttt tagactcact cgctcataac gcatattgaa 1500 ataaaccaca gatgattgct tgatcactta ttcatttgaa tttgacagaa tacttcccct 1560 tcctgtttcg gtgaattaaa ttatttcgat atttagaatt taatttaata ttatttttac 1620 acagtacaac gaatgcaaag tggaggagtt gtcaggacaa ctgaatccct cagtttttct 1680 agtctatatt tctgaagact tccacacaat atagtagacg ttctgtgcta tcctgactgc 1740 aagacaaaat ttacgacgca aagtaacatc tcctttttta atctgagatc tcttcaaatg 1800 gttgggcagg tccgtattaa gaa 1823 <210> 18 <211> 419 <212> DNA <213> Funaria hygrometrica <400> 18 aggagtgtta cacatctttt acttttttca gcacgcctct tcgctcggct tattgaactt 60 cgattacaaa cttgtgtggg taccgaacta ggccggctag cgtagatcga gtagaggtcc 120 ttgttgcagg aagttttcgt ttgtaaaaat agctgatatc tggacacata cgagtggctg 180 attggattca gtgacattca cattatttgt taacaggtcc agggttgttc gtagagtctg 240 gccccatttc tcgtcggaat gttggcgccg ttttgtgtga aatgatggtg attatggtta 300 aaatgcatgc gtagtcctgt tgactatggc tgaatggata agatatattt ccatcatagg 360 ttagatttca agcggagcgt gaactgtgac gctcaatcac agaatgcgtc gtcttagcc 419 <210> 19 <211> 1333 <212> DNA <213> Funaria hygrometrica <400> 19 ggatccgaga ggaaagagag agaagaggga gcgactcatc tagccaggcc cggtccggtc 60 ctctgccctg cctggcgcga cccgttctcg tgcctatctg tggttctcta tcgctcttgt 120 gcctcgccct gcacctcctt ttcccattgt tgctgctttc tgccctgtgc tgcttggccg 180 ttcgttgtgc ccctcacctg tacactctcg cagccaagca ctgcagtggc agttcgcctc 240 cgcattcctt tcgtggccgc gtatcccccc cgtcatcttt ttcgtcggtg acagttcttt 300 gaaggttaga gcctctgtcc tgctgccgtt ctcgctgtgc ttgtgttgtg gccgacgatc 360 gggtttgttg tgcaaggtcg ctgtgcgcat cgtcttgttt agtattgtat gtcgattact 420 gtgttgtagg agcagtggct aagctttgtc cgctgatgtg gcacccaacg gcgtcgctca 480 agtgtaggct ttttctttac acgagcttgg tccgcgttta tggtgtttgg atgttacttt 540 tttcccgaat gacgatatgt tgtgatttct ttacaacaag agattttgtg acgtgaactg 600 tagtttgtgg attcgaaaag tgttgtttcc tcgtttttga tggacattac ttatgccttt 660 tagttgtcac ggttggtggc tttgcattct tggtcgtcat tagtttcatc cgatgctgga 720 cattcgctac catcccaagc tgaagtgctg aagttgattt catatgttca gtttgctgtg 780 tgcaccagta tgagtcaaaa ctgattggat gtccttcaca acttcattct cttcatctta 840 aagtcgagta caaatcaata ggtacaggac tcctatattt tggtgttccg ccatagttat 900 cgtctttcgt caaaattacc ttattgagag gacttttcct tgcaaaggtc tcatcgagac 960 caatctctca gagtcagata cctatggtcg cagcagaaat ctctagtcaa tgtttctaag 1020 ctctcctaag gattttcgct ctttcatcag atgtattcta tccaactcca agttcgcaac 1080 aatttcttca tacatcattg tcttctggtc tttctgttct gatactgcac cgattcattt 1140 taggatctta taatccgtgc ttgatgtgcg gatatgtgaa ttccctgagt gttcacctca 1200 acgtactcaa agttgttcta ctttcagcat ctttcagcca atgcggcaga tgcgatcact 1260 tccgaggact ttaaaattct gtactgtttc tttaaaacgc ctttttcgat tctatgcagg 1320 atcattgtaa gcg 1333 <210> 20 <211> 3289 <212> DNA <213> Funaria hygrometrica <400> 20 atgcatggca aaacatcccc tgtcttccat gatgagaaag gcgaacctgg actgcttgat 60 ggtcttccca ggtatctcat tgtgcttcgg tagttgttga cgtcttcact tctgcttctt 120 tcgcttcctc ttcttcttct tcttcttctt ctttctctct ctctctctct ctctcccaaa 180 ccttccttct gtcttccttc ctcttatttt cctatgtcaa tgaagtttag cacctcctaa 240 aatttttgga tgctgttttt taaatagaag ggacgggatc aaaggacgag tgagtgtcgg 300 cttttgcatt gcttccgttt tataacaacc tattaaggac gtagatcgtg tctgtaaagt 360 catctcttat agccttttat agtcttttta agagagaaga gccacctctg agtttcttat 420 agattcggac aagagatgtg acgacttagg aagtgtcttt cggaattttt cttgtgataa 480 tggcgttgca tttcttgtcc tgtcttattt ttaactgaac agtatgtacc atttttccgt 540 atagtcctta ctttataata tgtcctcttt tctttcgcct cacgttcatc atattctttg 600 atatgtacta ttaactttcg ctatctgttt tcttgtagtc ctttcaccgc gtgccgctat 660 cacagcttgg tcatagagga ggcctcattt ccagctgacc aactcgagat tacagcatgg 720 actgaggacg ggcttgtgat gggggttcgt cacaaagtct acaagcacat ccaaggagtg 780 caatttcatc ctgagagcat ccggactcaa aatgggatgc agatcgttgg aaattttctc 840 aagattttag atagaaaaga ggcggctgac aaggaaggag ctgaaatgaa aattttggag 900 agtgtttgag tgatgagttg tactggtata tcttttcttg tgcaagattg ccagcatttg 960 tcagcttgct tttgttagag tcctgacccc cagcgtataa ctccttgagt atatgcccaa 1020 gcaggcctag atgctgctgc aataaccttc tcggtgagac agggtagttt ttgaggtatt 1080 tttgcacttc cagatggagc tactactaca aatatctatc cttatcttac gttaaactac 1140 gatggaattg ccatgatcac tcaggtacgt ttaagttgtg attggacttt tagtgattac 1200 tttcagagcg agctatcaaa ctggtgcttg gaggagcaac gcaaggaatg ctgaattttt 1260 ctaatgatct aattcagctt aagtttttcg tcaaacttag tgatattttg aagttcatct 1320 cgttagtgaa acatctcaaa gaagtacgcc attaaattat tgcagggctt gtgatgacat 1380 tatttgatag tttacctctt aaactgagaa cgcattgctc tcctttgtat agttccagtc 1440 atttgaaagc tctatttgct ctctgtaact taagccttgt tcaaggcatt taaattccct 1500 cttccacgat aaaaatggta gttatgttgc tggttggaac tttcaagata ccataacatt 1560 gtggttctca ttcacaacgc aggaagtttg ttgacctata tttttgaaag tggcgagtga 1620 aattgtttac tcatcacttt atgtgtgttt ctagtatgtc acttcaattc cttcctcaac 1680 tgtgcctaat ttttcatctc tgtgtgtcac gagcgtaatt tggcttagac gttggaacat 1740 tctaaggttc cagtaaccag ttttcattta ttatttttaa attcacagcg cctcaagtaa 1800 tgaaaggaca aacgccgatc attgcgcaac tctaattgtg acggtcttca agacaactaa 1860 cggcaggtca ctctcttgtg atgttctcgt tgttgtcaaa cctgtataat ggcaattcat 1920 ttcgacatca cggcaaactc atgatggttt ttaacgtgat ttgctcacca cctttcattc 1980 aaagttatca ccgacaccct atgggtttaa ccatgttatc tgaaagcttt ctctacgtat 2040 gtatgaatct gctcattagg gtgaatttgg aacttaaaga atctcacacg atgtccatga 2100 attttgttac tggacaacat atactgttga ccacatagat atgcatgttt agaactgcaa 2160 aaaagtttgt tcacgaagac agaacgacta gaacgcagaa tacctgcgat cggtggaatg 2220 ggatcatttg cagtaaagct agtaaaggat cgaaatagac gcagagtaaa cccgatgcgt 2280 tagaggggaa tgggagatcc acaggactcg gagagaaaat gcaaccctgc gggtaaaaat 2340 agagaacgcg aggaggaagg gtagccagaa gagtttcacc gggatctaca gtataagccg 2400 caaagggagc cacgggtact agtgccagct ttgcagcaga gagcgaacgc gagggagcga 2460 acagatccgg gccccaaatc cccttcttct atctctcaag ccgtccacag ccttcattct 2520 ccatcctcgc actattctcc tcacagcagt tgcatttgtg gttctctcca tcttcaaccc 2580 ttcgactttg gtgcaagccc gcttgttatc tatcccaagg tttcacgcac tccccccttc 2640 gctgtgtgtt tcgttgcaat atttttggct ttagttttta ggtttataca tagtgcacat 2700 gctctcgcaa aaccgtgccg cttcagggga tcgtggttct gtagacttga gcacagagat 2760 gcgggtgaac tcttagtggt cgccgctgca tccccagagt agttatgcta cctaaagaag 2820 cgtgctcgta cggtcgatat gtttagagat ggatatttag acgatggtgc gtgtcctgcg 2880 gtcatcagag taggtgaagg gatttttcgt aagatctgct tttgtgacgg atctgcaatg 2940 caggaggtct gcgtctttct ttttcttcag cttcgtgccc aatgcgtcaa atgcgcaccc 3000 attgcacaga gtgctattaa ggcggcttca tgaagctccc agttttgtga atcatgttaa 3060 cttgtccact gatcagaacg ttcgggctgg catacgtgaa gcgaatacac atttttctac 3120 agcatgttcc ttattttagt cttcatactc actgcttcga ttgccggagg gcctccatgt 3180 tcgaccacat cttcacacgg ggcttatcat ctgacctaaa tcgcacgtgg cctctgtatt 3240 gtgtcaatgc cagtaacagt ctttttgatg cgcagaacat ttcatctcc 3289 <210> 21 <211> 937 <212> DNA <213> Marchantia polymorpha <400> 21 catatgcgta cggagttgtg gtccccgatc gccgtagttg ctgttggtgt ctggtcacag 60 aggattcttt gcttcgcttc ctaatgtagg tggccagggg tggatcgtct tcctcctacg 120 cttcgtttgg acacatacat ctggatcttg agaggaacac gtgaattaga gttacatgcg 180 gtattgcgtc atctttgcga ggtaacggcc gcgccgcaga cctagcggtt gcttctgcgc 240 gactcaagga atcttccctc tcctgctcca tcactggaat gagagttgca gtctgatctt 300 tgggaaatct ttcatcttgt tgaccatcga ctctgtcctc tcgatgaggt ctgggatgat 360 tctgcatgtg atactagcgc agtcttcatg attgtcacat gcatccagat gcgacatctg 420 gcgcgctttg tgcttggtca tagccgcctt cttttatctt gatttgccta atgagcccca 480 tttccagacg tggacggcag atcggtcata aggtccaaga gcaggaaatg ctatgaggcc 540 gtttgcgtgg tctacctctg ctggcctgcg aaaagactgc ctgtccgact tcaatatctt 600 taaacattag gctcttcagt tgtctcgctc agaccattat tatgagttat tgttaccgta 660 gtgtgttgct atgtcagccc gtgtagtctc gtcaatttct ggagggtaat gcgaacttgt 720 tcatgacggc acgtatctcg tcgccccgaa gatcaccctt gttgagaagg atttcatgcg 780 tctgcgtcct cgttcatgtt gacatgaatg atagaagccg ttctgaagac acgaaatgtg 840 gttgacatat acattgtgat gctcatgtct tttgtcgagt caccaagatc cgcaaccatc 900 tcatcttctt tcattttggt taggtaactt cgcgaaa 937 <210> 22 <211> 3025 <212> DNA <213> Marchantia polymorpha <400> 22 tcatgatgtt aagcgttttc ataatccaaa gaggttttgt atatagataa aatttacttt 60 ctgaatatgc aagcatcata ttctaaattt aatcgaacat aattttttct gagctttctc 120 tttctttttc tttaaattaa atttccttca ctgcaatttt tttattacga ctcccacgag 180 gagtattttc cgactataga tcttagggta tataactata tatcacgctc gttctaaaca 240 ttttttctaa ttttatgaaa agagataaat atattaataa tataggttat ttagattatt 300 gaaattcaca gaaaatacca tttttgtctc attcgatatg ttctagatgt gtgtgcgtat 360 atggtcatat acttgggata tttttaaatt gtgaatacaa gattataaca aagttatcat 420 tgcaaaatac taaagataag ttatctttgg tgagaagaca tgatatacca tctgcatatt 480 acttattcac caattgacca aagatttaca atctaccttg atgaaccata aatttgagaa 540 ttttatatgc agatatttgc ggatctttcc aatcattatc tagctcttgt ttacattttt 600 gctttcacaa aaatgcaata atgtgaaagt tgatgcaata atccctttag gttttttgac 660 tcataacaat tttctctcca aagcattgag attcaatgtg gacgtgatac ataaattcac 720 atcttgatta gttacatata aatgtggaac tgccgtattt gtcggaaagt tcatacaatt 780 ttttttgttc atttgaagat cataagatag ctgcatatat caccattagt gatgatatga 840 tatatgacat gagaaaaata taacttaata tgaaggaagt cttgatatgc cttgctatcc 900 ctaggttggg gtaggtcttt ctttcatttg cgattattat tactgtgagg aatattcggt 960 agaatggatt ccttggaagt gttgtatttt tgacctctca taattaagca cagattaatc 1020 ccttcatttg tggtctatca atcaagtggt ctacgaatga ctctaatttt aagattattt 1080 ttgtagttgt gtggtgtttt agtagttacc aatcttatac ttgaaagaaa atgaaagcaa 1140 tgattactca tactactcaa tgccaagatc ggaggctaaa tccaatgtat acaagtatag 1200 aaatttgtaa agagttaagc tctttctttg ttcatgtagc tttgaggctt tgtaaaaata 1260 tggacattga ttcggatata gaggtgagtt gtgcacaaga gatgaccata cttggtgtca 1320 aggtgtagca tttttttcag attatttata agaaaataat caggaaagga aaataagtag 1380 tattcatcct agatataaca tttgtcgaga aatctacgag ataaacattt tttcagacga 1440 gaacaattct tcaaattttc agatgcaagg gtacgcattt agcattgcgc tgatattaga 1500 gctagtctcc tattgcatgt ttgatttcat acatgtacca cccattcttg ttactgcagt 1560 gtgtgaaact tgttgaataa gaagttccgc aattatttca aattattgag agtcttctta 1620 cataattttt acttatccaa aattcttaag aaccccacaa taaattcagt gatacgcttt 1680 gaatggctca ccagttactg gactgccaca attcgcagca ttggagactt ggccaactca 1740 accagagaag ggaccacgtc gaacgatcta cctccctccc agtgagtgag tgagtcttcg 1800 ggtgcagtat tgtccaagtc ctggaatgtc gatccagccg caggaccagg aagatcgggc 1860 cgggtacagt aaagttgcca taacaatccg gcaacgaacc acagatccgg gacgatctag 1920 cgggaagttg aagtccaagg ctcggggcac atctccctgg tagaattaga atccatagcc 1980 agaattctat ctcgaaacct tgtttcgcca gcgttatgat tataatcaag cgtccccgtt 2040 aatctgattc ctgtgaaagt tagttagtaa cttcataccc cagcattatg attataatca 2100 agtgtctcag ttagtctgat tcctgtgaat gttagttagt aagttcaggc cttctcgtaa 2160 tagcttcttg cgtataatct gaactgttga taatggttaa actcttgaat tacgacatat 2220 cagtcccggg agattaatct gcttccgcta agctcgagga tgcacagcag taattttggg 2280 tcgtttggga tttgataaaa cggacgggaa tatgcgtcgc gagttccgag taggagtgag 2340 gaggaatgca aaccagcgga ccacgtaaag aggcccacga cagtccagca gcccagctgt 2400 gagacacaag ggggacgaaa gggaccgccc aggccgacca cctgatgtca gggggagctg 2460 gtgcgagcgg cgacggacat ggatcggcgt ttggttgcgg tccagaagcg ggcgaggagg 2520 gatccgcatg agtgacacag tgggggcaga attgggagaa gatcgtgggg gtaattgaga 2580 ggggagattc gggttggggc cgagacaggt aaggaacacc gatgatgctg aggaaaatat 2640 gaggaattcg tgagaatgcg acagggcgag agcactgtgg ggcagaatgg aaggggggcc 2700 agcgatattc gagcaataaa ataagagcgg gggacattcg aaaagaggcc ccatataaag 2760 ccgatcttcc attctgtttt cacagagctc ttcgtcgaac agagcctctc aaactcgctt 2820 tgtgctccca gtgcttctgt ctcggatctg ctctgctcgg cttcgcgctt gttgttcttg 2880 tgaccatcac cgccttcagg acgctcacgc ccaacgcaag aatttcgagt cgaagtaagc 2940 gagcagctca atcgcttcgt taacgcgttt gcggagatct tcgaggtttc gcgttcgaag 3000 ttcttcggac acctccttcg ttaac 3025 <210> 23 <211> 909 <212> DNA <213> Marchantia polymorpha <400> 23 aagcttagca agcagctctc gcagcggatc tgctcttctg ctgctccctc tgcttcctcg 60 tgctacacgg tcttcgtcct cgcttcctcc acgcttcctc gcgctctctc caggtactcg 120 tcgcctcgcg ctctttcttc ttcctagttc gtccgttcct cgtaccggga tagggcggtc 180 gcgggtctcg tgagggtttt ttcgagcaag gtgcgtgagc aagttcatat cggtgggcaa 240 tgcatggggc gaacctggtc gggccctttt ccgaggccgc cggagagcct agtctccaag 300 ctgtagtatc ggtgttctcg aagatcggtc ggtgtctgca tctctccatc tcgattcgtt 360 tcgtctgagc tgatccgccg gtcgattttg acgatgtcgt gtcctcacct acgcaagttt 420 ggttccgagg attagttttg aagatgctgt caatgggaag tttagctctt ggttcgtgat 480 tagtttggac acggtcacat gaatcgtagg gacccaggtg tcgggcggaa tcttcagcag 540 tcatttcggt ttccgtaacg ctggatttaa gctgaaaacg ttcatcgatg gattgcggat 600 accatgacct aatggatcgt ccagcttatt cttctggaag tatagacgtg tgatggctgt 660 ggcctgtggt agggttggac acgcccgcag tggtctctcc gaatttgaat gtcgcaatgg 720 tcgatgtgct ctgccgattt ggggaatcga agtggcaaac cggtcgttcg gactgtcgag 780 tgtatgcctg ctgcttgtgc gatgtagtgt ggatttttcc tccgatgttt tccaaacgtg 840 gtcgggattg cagttcttca atctaccagc ggagctaatt tcgtctttgg cttgcagtct 900 atcgtcgat 909 <210> 24 <211> 2146 <212> DNA <213> Physcomitrella patens <400> 24 atacaagagt tataaatcat atacaatgat tactttcata taattgttga atattattgt 60 tacaacctaa gtaacaataa cattcaatta aacattcatt gtggttttca agcatattaa 120 tcattctttc ttctctaccc tatagtgatg ggaaattatc ccaaactcaa tgtcatactc 180 caggcaattc agaaatatag tgagatgaat accaggaata tttattcaca tcgaccccta 240 tcgccgggca atgccactcc caccgcggaa tgagaaactc cttgaaaaaa caagtccctt 300 cccagctgcc cgaaatcggc cgcctggtca gcacggcacg acactgccca cgtgcaatcc 360 tgacgtggcc tctacgtccg gaaggcggcg ccgttagcga tgtcctccta tgcaagttcc 420 tcttgtggcg gggcagtgtg cccgccaact tcaccgtcac cctccacccc aacaagtggc 480 ccaaattact caggggcagc ccagcttcga aattttaagc ggtgaccgcc ccttctcatc 540 gtcacgcgtt acttcttttt cactcaatcg agtctgttta ttattggccg ctaggaaatt 600 gcagcttcca actccgcatc accgcgtgca gtacagtgga gatcttcaag agtgtcctca 660 ccaggaattt gcaacttgct ccttgcaatt tgtaataaat ggacagagaa gcctagattc 720 cgcatccaca gtgatgggtc acgtatcaat aagcgaagct gcgttggcaa ctatggcaat 780 tggtttggtg tcttcgttcc tgtcaagttt gaaaagaaga gggagatctg atttcttaat 840 aagtgtcgac ttgtctgggt agtggattgc gtggggcgtg tcgtagtgcg acgcgatcgc 900 atcaaattca tcgcctcaaa atttgtcacg ttgttgggtc aattgcaacg aactgcgatt 960 gaaggattct tctcggtggc cttcaaattt gctttagtat gacagaagtt ttgcagctgt 1020 actcggcgtt tggaaggagt ggaagtgagg tggatcacca cgcaccggag ttggtgaatt 1080 gtttactgca gaaaaaaatg gctttgatca catcagaatg attgatgttt cagcttgaat 1140 ttcacctcaa gatgtgttct catcatgaaa tttttattgg gccaggatgt actttcattg 1200 ttttgaaaga atattttaag acgcttgtgt tttacaacct ttcggaagat gcgtccttga 1260 ttgaaagtgg ttaatgtttt gtacatcatt actggatatg aaaataccaa taaaatgaaa 1320 tacaataaaa tatttttttg aaatgaaaat tggtttaaat aagcatgtaa ataatagacg 1380 gtggagtaaa gaaaaggtaa taaaaaaaaa agtatgaatt ctattactct tcaatataaa 1440 agtaagaggt gtccgtttgc aagcaataaa aattcagtaa ttgctagata aattcaaaag 1500 ccaaccaata cacaccattg ttttgctgca aagctagggt ttctaaggcc acaattcaat 1560 gactagtgac ttacatatta cttccaaacc gaagcaaagc aagggtactc cacgattgta 1620 tatatactca cttgtttatt tttaaaccat ctgaaatcac acaaaaatgt tgtgaccctg 1680 cttcattatg ataattaagt gacgttttaa tctcattaaa tttaatgcca ccgtaggtta 1740 tggacggaaa tggatggatg taaatggaaa gatcggcggc aaaaagacca aattccatac 1800 tactgcccga gtccgataaa gacggaaaca atgcgataaa agtaaaagtg agcagaagaa 1860 agtgcacggt cgaaggcggc gtttgtttac atttacttca ccaaaaccga gcaggatatc 1920 gggcacacgg tcaggaagaa attgttcatg acggtcagaa cattctggat ggttggcgtg 1980 cttgctataa gaacactgct cctccgatct aaacctcgga ttgtgcgctt ctagatactg 2040 aatttgtttc gaccctgcct tgttgagtgg ccgtagaggc tcgacagtta ggatcagtgt 2100 gccgttgaat ttagtgattg tgtagcgacc agtacgtcct gtaagg 2146 <210> 25 <211> 524 <212> DNA <213> Funaria hygrometrica <400> 25 gaattcattt ccattaacga gaatatgaca gtgggaagag cttccacgtc atccaaactc 60 aaagtatccg acgtggtcaa tccaagtgcc agtgccacct cagctccttc accagtccat 120 ctcgcggata agggtgacag caaggcgcgg tattactgga taagagaagc ggccaaggcg 180 gcagccactg tggtccactt tgctgcgtca ctacctactg cgattgtaat gacgagcggc 240 agcgtcgtgt gacaggcttg aaccgaccgc tgcttcagcc gcaggcagac tagaaaagtt 300 tactcgctgt cccactcgtt ttctgggtgt gcatccgaag tttctggatg gttgcccgtc 360 gttcaataaa ttgtcgcgcg tcgagctagc ggacactttt gtcaccgttc ttctctgttt 420 attctggacc agaggtgctg ttagctttgt tgtgtgtgag tccttgggga aatccctgcg 480 cgtcacgaga gtttattgca gggaagtgat aaagcgttgt gaag 524 <210> 26 <211> 2088 <212> DNA <213> Physcomitrella patens <400> 26 atgcatgtaa gataattcca attagaatct ataaatttct tattataatt ttttaaaaac 60 aaagtaccaa aatattatta ttttaatatc ctctaagtta aatccatata ttaagtagaa 120 acaattattc taataaataa tgataaaaat tagacatctt gcaataaaat ttctttttaa 180 aaatagatac ataacatgaa aaatatccca taaatagcta acaccatcaa aacatttgac 240 caaatatgca cttttagatg tgtcaagaca aaaagaaata tttgcaagat tttggagtat 300 ctaaactaat gtttgtcctc tttgcactat gagtaggatt tcttttattt tgtttagtga 360 aaagatacat tgcaatttgt tttcataata aaaactatac taatgaaata gtgctaaaaa 420 ataacaagat taaaaaaaca taacccttct tacaacctta aatccttcta attagactac 480 ctcaaagttg tgccatttag cacaaaaacc attcttttaa atctacttaa ccctccaatt 540 tccaatgagc ttcatgtgca tacacaagca tgctttcttt ctttctttct tgaagaaaac 600 ttatctgaac aaacgttaat actctacttg ttgatgaaag tggaactttg accacataca 660 ggcttggtga tgtactttgt atatctcctc acagttagtc tggtgcaatc caaccatgca 720 catagaatat gaatggggac atgcttccag ccactcgggt gtgcagaaaa cttgacaagc 780 gagattcaag caacggcgac tacgacgccg atcacgcaat acaaagcatt gttagtatgt 840 gataaaccag agaaagagat cgagtatgtg cacacaaaaa cacacagatc cacaggtatt 900 gtctacggcg ccaccaccat ccgtcaaagc taccatctcg tcgaggaaga atggtatttc 960 taaaactagc aatacaaccg ctgatggaaa caaccgaaag ctatgtcatt ggagagggcg 1020 cacgagttca tggaatacac agtgagaaga gataaagaaa taaaataata taaaatacaa 1080 gtgtgcatca gcaagacatg gccgaaatct aacaactgtc tgcacatgct gtggtgggtt 1140 gtatccacgc gctggaggaa gtaactttcc tacatgcaca gaaaaacatt ttcagattag 1200 aaagctcttc tgttctagct aatctctagt accaagctca gacgtgtagc cgacgaagcc 1260 aatagcagct gggtatgcta gtcactgatt ctgaagcggc cggtgtgtcg attgcgatgt 1320 atctcagttc ggcgaaggcc tgtgtctgga acatgggaag agggtcttct tgcactcgtc 1380 aatctctcac agcaactggg cagggttgta tccgaacgtg gaaaacgcag caaccgttgt 1440 tgaaccaaag gatggtattt ttctccgaga aaaacgccgt ggcttatctg gtgtagacga 1500 tccctaatcc ggacatgacc gccgctgtgc aggtgttggg aaaccacaat gcgcaagaga 1560 tgcgagagat ggaggagtgc aagaagtacg actgcgaagc tacatgcttc atcgagcaat 1620 gaagtctggg ttttctccaa cttccgcatg cacacacttt tctcgacgac atccgtttca 1680 aggtacgcat cgggaaactg acgattctct gcactggtgt tcagactctc cggagaggcg 1740 gtgtcatgtt ctgagctctt tttcgataag gtgctgttga agtccagaat aatggggtct 1800 ggattatcct ctggacggct ccgcttctgg tcgaaaaaat ttcatcccaa aaaaggactt 1860 atctgttgac tgaaaatgtt taattgtggt gaggattgca tgcagcgacg tcgtaaagat 1920 agggtgacaa ggagcgttcc agagctcagc tcggggcatg ccccggcact ccctagcata 1980 taaacatacc gggtggaatt tgtacccacc aggtcttgct cggtgtcccc tgtgcccaag 2040 ctgttggctg cattgccctt gcgattcgag tgtggagaga ttttagca 2088 <210> 27 <211> 500 <212> DNA <213> Physcomitrella patens <400> 27 ggaacgaatt tgtcgagctc tctggttctg ggtcgggtag cagtagcttt gatggtgagg 60 cactgacagt cagtcgctca cacggcaaag tagcctggat gtgcttcgca acgaactctt 120 gaatttgagt atgtgagttc actttgaaca tcccagaagc aaaagaatgg gttttttcat 180 gtttgaattt tattttgtat agttgtgttg agccgcgatt tctatctgtc acttggcttg 240 atattctgag tttctccgat acgaatagcg aagtccactt gaacatctgt aacggcagca 300 attgcgtcag gtcaatcctc tcagattctt tcggtgcttt tgtcgtaaac tagcttgatt 360 gttgtccatt aagcttggtt gcttttcgtg agaaagcatg aaacttctat gacgaaaccc 420 ggttgattgt aatgtaacta gtttgattgt agtttgaatt tggtaattgc gttgtatgat 480 acataatgaa agtttcatga 500

Claims (26)

  1. 야생형 핵 유래된 모스 발현 증진 영역(Moss Expression Promoting Region, MEPR)을 엔코딩하는 분리된 핵산 분자로서, 상기 MEPR이 SEQ ID NO. 1 내지 27 또는 이들의 발현 증진 단편으로부터 선택된 것임을 특징으로 하는 분리된 핵산 분자.
  2. 제 1항에 있어서, 상기 MEPR이 피스코미트렐라(Physcomitrella), 푸나리아(Funaria), 스파그넘(Sphagnum), 세라토돈(Ceratodon), 마르찬티아(Marchantia) 및 스파에로카르포스(Sphaerocarpos)의 MEPR로부터 선택된 것임을 특징으로 하는 분리된 핵산 분자.
  3. 삭제
  4. 제 1항에 있어서, 모스 프로모터를 추가로 포함함을 특징으로 하는 분리된 핵산 분자.
  5. 제 1항에 있어서, 상기 MEPR의 발현 증진 활성이 콜리플라워 모자이크 바이러스(CaMV) 35S 프로모터의 발현 증진 활성과 동일 또는 유사함을 특징으로 하는 분리된 핵산 분자.
  6. 제 1항에 있어서, 상기 MEPR의 발현 증진 활성이 콜리플라워 모자이크 바이러스(CaMV) 35S 프로모터의 발현 증진 활성의 200% 내지 1000%임을 특징으로 하는 분리된 핵산 분자.
  7. 제 1항에 있어서, 상기 MEPR의 조정하에 있는, 재조합 폴리펩티드 생성물을 위한 코딩 영역을 추가로 포함함을 특징으로 하는 분리된 핵산 분자.
  8. 제 1항에 있어서, 선택 마커를 추가로 포함함을 특징으로 하는 분리된 핵산 분자.
  9. 제 1항에 있어서, 형질전환시킬 종의 게놈 서열에 대한 상동성을 가져 이러한 종에서의 표적화된 인테그레이션을 허용하는 서열을 추가로 포함함을 특징으로 하는 분리된 핵산 분자.
  10. 제 1항에 있어서, 안티센스 또는 리보자임 분자로서 제공됨을 특징으로 하는 분리된 핵산 분자.
  11. 진핵 숙주 세포에서 재조합 폴리펩티드 생성물을 발현시키는 방법으로서,
    - 제 1항, 제 2항, 또는 제 4항 내지 제 10항중 어느 한 항에 따른 MEPR을 엔코딩하는 분리된 핵산 분자 및 선택적으로 상기 재조합 폴리펩티드 생성물에 대한 코딩 영역을 포함하는 재조합 DNA 클로닝 비히클을 제공하는 단계로서, 상기 코딩 서열이 상기 숙주 세포에서 상기 핵산 분자의 MEPR의 조정하에 있는 단계,
    - 자연적으로는 상기 코딩 서열을 내포하지 않는 상기 진핵 숙주 세포를 상기 MEPR의 조정하에 있도록 형질전환시키는 단계,
    - 적합한 배양 배지에서 형질전환된 진핵 숙주 세포를 배양하는 단계,
    - 상기 재조합 폴리펩티드를 발현시키는 단계, 및
    - 발현된 재조합 폴리펩티드를 분리하는 단계를 포함하는 방법.
  12. 제 11항에 있어서, 진핵 숙주 세포가 식물 세포에서 유래된 것임을 특징으로 하는 방법.
  13. 제 11항에 있어서, 숙주 세포가 원사체 모스 조직 세포임을 특징으로 하는 방법.
  14. 제 11항에 있어서, 배양 배지에 피토호르몬을 첨가하지 않음을 특징으로 하는 방법.
  15. 제 11항에 있어서, 세포가 피스코미트렐라, 푸나리아, 스파그넘, 세라토돈, 마르찬티아 및 스파에로카르포스의 모스 세포로부터 선택됨을 특징으로 하는 방법.
  16. 제 11항에 있어서, 숙주 세포가 일시적으로 재조합 폴리펩티드 생성물을 발현시킴을 특징으로 하는 방법.
  17. 폴리펩티드의 산업적 생산, 또는 폴리펩티드를 생산하는 재조합 세포의 제공을 위해 사용되는, 제 1항, 제 2항, 또는 제 4항 내지 제 10항중 어느 한 항에 따른 MEPR을 엔코딩하는 분리된 핵산 분자.
  18. MEPR에 의해 자연적으로는 조정되지 않은 모스 폴리펩티드의 발현, 또는 MEPR에 의해 자연적으로는 조정되지 않은 모스 폴리펩티드를 발현하는 재조합 모스 세포의 제공을 위해 사용되는, 제 1항, 제 2항, 또는 제 4항 내지 제 10항중 어느 한 항에 따른 MEPR을 엔코딩하는 분리된 핵산 분자.
  19. 발현 증진 영역의 콘센서스 서열을 스크리닝하고 규정하기 위해 사용되는, 제 1항, 제 2항, 또는 제 4항 내지 제 10항중 어느 한 항에 따른 MEPR을 엔코딩하는 분리된 핵산 분자.
  20. 번역후 변형되는 단백질의 재조합 발현, 또는 번역후 변형된 단백질의 생성을 위해 사용되는, 제 1항, 제 2항, 또는 제 4항 내지 제 10항중 어느 한 항에 따른 MEPR을 엔코딩하는 분리된 핵산 분자.
  21. 재조합 단백질의 실험관내 발현을 위해 사용되는, 제 1항, 제 2항, 또는 제 4항 내지 제 10항중 어느 한 항에 따른 MEPR을 엔코딩하는 분리된 핵산 분자.
  22. 대사 변형 단백질의 재조합 발현을 위해 사용되는, 제 1항, 제 2항, 또는 제 4항 내지 제 10항중 어느 한 항에 따른 MEPR을 엔코딩하는 분리된 핵산 분자.
  23. 제 2항에 있어서, 상기 MEPR이 피스코미트렐라 파텐스(Physcomitrella patens), 푸나리아 히그로메트리카(Funaria hygrometrica) 및 마르찬티아 폴리모르파(Marchantia polymorpha)의 MEPR로부터 선택된 것임을 특징으로 하는 분리된 핵산 분자.
  24. 제 4항에 있어서, 5'-UTR 영역, 5'-인트론 및 3'-UTR로 구성된 군에서 선택된 어느 하나 또는 2개 이상을 추가로 포함하는, 분리된 핵산 분자.
  25. 제 12항에 있어서, 상기 식물세포가 모스 세포에서 유래된 것임을 특징으로 하는 방법.
  26. 제 25항에 있어서, 상기 모스 세포가 피스코미트렐라 파텐스 세포에서 유래된 것임을 특징으로 하는 방법.
KR1020067002926A 2003-08-11 2004-07-30 모스 발현 증진 영역 KR101125448B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03450184A EP1510584B1 (en) 2003-08-11 2003-08-11 Expression promoting sequences from mosses and their uses
EP03450184.1 2003-08-11
PCT/EP2004/008580 WO2005014807A2 (en) 2003-08-11 2004-07-30 Moss expressing promoting regions

Publications (2)

Publication Number Publication Date
KR20060109869A KR20060109869A (ko) 2006-10-23
KR101125448B1 true KR101125448B1 (ko) 2012-07-05

Family

ID=34089803

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067002926A KR101125448B1 (ko) 2003-08-11 2004-07-30 모스 발현 증진 영역

Country Status (11)

Country Link
US (2) US7538259B2 (ko)
EP (2) EP1510584B1 (ko)
JP (1) JP4750028B2 (ko)
KR (1) KR101125448B1 (ko)
CN (3) CN101555479B (ko)
AT (1) ATE426033T1 (ko)
AU (1) AU2004262676B2 (ko)
CA (1) CA2533860C (ko)
DE (1) DE60326716D1 (ko)
ES (1) ES2322140T3 (ko)
WO (1) WO2005014807A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7741539B2 (en) 2005-07-12 2010-06-22 Greenovation Biotech Gmbh Transformed plant cell expressing five mammalian proteins involved in sialylation and a protein involved in galactosylation
CN103709241B (zh) * 2014-01-02 2015-11-18 中国农业科学院生物技术研究所 来源于苔藓植物的抗旱蛋白PpLEA3-25及其编码基因和应用
CA2962852A1 (en) 2017-03-31 2018-09-30 Chuanxin Sun Carbohydrate producing plant material

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6047683A (ja) * 1983-08-24 1985-03-15 Kirin Brewery Co Ltd プロモ−タ−
WO1999050428A2 (en) * 1998-04-01 1999-10-07 Mogen International N.V. Pathogen-inducible promoter
AT408446B (de) 1999-02-18 2001-11-26 Altmann Friedrich Dr Fucosyltransferase-gen
DE19947290A1 (de) * 1999-10-01 2001-04-19 Greenovation Pflanzenbiotechno Verfahren zur Herstellung proteinöser Substanzen
AT409381B (de) 2000-03-03 2002-07-25 Gloessl Josef Dr Xylosyltransferase-gen

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Plank Cell Reports, Vol. 21(4), p. 341-346 (November 2002)

Also Published As

Publication number Publication date
ATE426033T1 (de) 2009-04-15
CA2533860C (en) 2015-11-03
JP4750028B2 (ja) 2011-08-17
DE60326716D1 (de) 2009-04-30
CN101962643A (zh) 2011-02-02
US20090111187A1 (en) 2009-04-30
US20060236432A1 (en) 2006-10-19
CN1836046B (zh) 2011-04-06
US7834167B2 (en) 2010-11-16
AU2004262676B2 (en) 2009-03-12
CN101555479B (zh) 2010-11-03
AU2004262676A1 (en) 2005-02-17
EP1510584A1 (en) 2005-03-02
CN101555479A (zh) 2009-10-14
WO2005014807A2 (en) 2005-02-17
EP1510584B1 (en) 2009-03-18
JP2007501619A (ja) 2007-02-01
CN1836046A (zh) 2006-09-20
CA2533860A1 (en) 2005-02-17
EP1654369A2 (en) 2006-05-10
KR20060109869A (ko) 2006-10-23
US7538259B2 (en) 2009-05-26
WO2005014807A3 (en) 2005-05-06
ES2322140T3 (es) 2009-06-17

Similar Documents

Publication Publication Date Title
ES2584316T3 (es) Promotores preferidos del cámbium/xilema y usos de los mismos
WO2021048316A1 (en) Regulatory nucleic acid molecules for enhancing gene expression in plants
KR101125448B1 (ko) 모스 발현 증진 영역
WO2021110582A1 (en) Regulatory nucleic acid molecules for enhancing gene expression in plants
WO2021069387A1 (en) Regulatory nucleic acid molecules for enhancing gene expression in plants
AU2005229721A1 (en) Expression cassettes for seed-preferential expression in plants
CN105316334B (zh) 植物花药特异表达启动子pTaASG019的鉴定和应用
AU2015202476B2 (en) Cambium/xylem-preferred promoters and uses thereof
US20030167520A1 (en) Use of a nucleotide sequence for enhancing protein synthesis and expression of proteins
JP3711564B2 (ja) 種子用発現プラスミド
CN116322314A (zh) 具有改变的大麻素含量的大麻
CN104975021B (zh) 植物花药特异表达启动子的鉴定和应用
CN105274105B (zh) 植物花药特异表达启动子pTaASG050的鉴定和应用
JP2002272469A (ja) 高等植物のdna損傷応答性遺伝子発現制御能を示すシス制御配列

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150225

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160229

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170221

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180213

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190221

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20200212

Year of fee payment: 9