KR20220023984A - 응집이 적은 피피알 단백질 및 그의 이용 - Google Patents

응집이 적은 피피알 단백질 및 그의 이용 Download PDF

Info

Publication number
KR20220023984A
KR20220023984A KR1020217040376A KR20217040376A KR20220023984A KR 20220023984 A KR20220023984 A KR 20220023984A KR 1020217040376 A KR1020217040376 A KR 1020217040376A KR 20217040376 A KR20217040376 A KR 20217040376A KR 20220023984 A KR20220023984 A KR 20220023984A
Authority
KR
South Korea
Prior art keywords
misc
feature
sequence
ppr
amino acids
Prior art date
Application number
KR1020217040376A
Other languages
English (en)
Inventor
유스케 야지
타카요시 이마이
타카유키 타마이
타카히로 나카무라
타카마사 테라모토
Original Assignee
에딧포스 인코포레이티드
고쿠리쓰다이가쿠호진 규슈다이가쿠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에딧포스 인코포레이티드, 고쿠리쓰다이가쿠호진 규슈다이가쿠 filed Critical 에딧포스 인코포레이티드
Publication of KR20220023984A publication Critical patent/KR20220023984A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/06Linear peptides containing only normal peptide links having 5 to 11 amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Analytical Chemistry (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Environmental Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

 PPR 단백질의 응집성을 개선하기 위하여, N-말단으로부터 1번째 PPR 모티프(M1)의 A6 아미노산을 보다 친수성이 되도록 하고, M1의 A9 아미노산을 친수성 아미노산 또는 글리신이 되도록 한다. A6 아미노산은 바람직하게는 아스파라긴 또는 아스파라긴산이고, A9 아미노산은 바람직하게는 글루타민, 글루타민산, 리신 또는 글리신이다. 이러한 PPR 모티프를 M1 모티프로 하여 포함하는 단백질은 응집성이 개선될 뿐만 아니라, 표적 핵산에 대한 높은 결합력을 가질 수 있다.

Description

응집이 적은 피피알 단백질 및 그의 이용
본 발명은 의도하는 핵산에 결합 가능한 단백질을 사용하는 핵산 조작기술에 관한 것이다. 본 발명은 의료(창약지원, 치료), 농업(농수축산물의 생산, 육종), 화학(생물학적 물질의 생산) 등과 같은 폭넓은 분야에서 유용하다.
피피알(PPR) 단백질은 약 35개 아미노산으로 구성된 PPR 모티프의 반복을 포함하는 단백질로서, PPR 모티프 하나가 하나의 염기와 특이하게 결합할 수 있다. PPR 모티프 중 1번, 4번, (ii)번(다음 모티프 이전 끝으로 부터 2번째) 아미노산의 조합에 따라, 아데닌, 시토신, 구아닌, 우라실(또는 티민) 중 어느 것에 결합하는가가 결정된다(참조: 특허문헌 1, 2).
천연 RNA 결합 PPR 모티프 중 가장 많이 출현하는 각각의 염기에 대응되는 조합은, 아데닌(A)은 1번이 발린, 4번이 트레오닌, (ii)번이 아스파라긴; 시토신(C)은 1번이 발린, 4번이 아스파라긴, (ii)번이 세린; 구아닌(G)은 1번이 발린, 4번이 트레오닌, (ii)번이 아스파라긴산; 우라실(U)은 1번이, 발린, 4번이 아스파라긴, (ii)번이 아스파라긴산이다(참조: 비특허문헌 1~5). 이들 아미노산의 조합을 이용함으로써, 임의 서열에 특이적으로 결합할 수 있는 PPR 단백질의 설계가 가능하다.
특허문헌 1: 국제공개 WO2013/058404 특허문헌 2: 국제공개 WO2014/175284 특허문헌 3: 일본국 특허출원 제2019-100551호
1. Coquille, S. et al. An Artificial PPR Scaffold for Programmable RNA Recognition. Nature Communications 5, Article number: 5729 (2014) 2. Shen, C. et al. Specific RNA Recognition by Designer Pentatricopeptide Repeat Protein. Molecular Plant 8, 667-670 (2015) 3. Shen, C. et al. Structural basis for Specific Single-stranded RNA Recognition by Designer Pentatricopeptide Repeat Proteins. Nature Communications, Volume 7, Article number: 11285 (2016) 4. Miranda, R. G. et al. RNA-binding Specificity Landscapes of Designer Pentatricopeptide Repeat Proteins Elucidate Principles of PPR-RNA Interactions. Nucleic Acids Research, 46 (5), 2613-2623 (2018) 5. Yan, J. et al. Delineation of Pentatricopeptide Repeat Codes for Target RNA Prediction. Nucleic Acids Research, gkz 075 (2019)
본 발명자들은 상기 아미노산의 조합을 이용하고 높은 성능을 지니며, 또한, 예를 들어 15개 이상의 많은 PPR 모티프를 연결한 PPR 단백질을 작제하는 것을 검토하였다(참조: 특허문헌 3). 본 발명자들의 검토에 따르면, 이러한 방법으로 작제한 PPR 단백질의 일부에서 응집성(aggregation property)이 나타나는 것을 알 수 있었다. 특히, PPR 단백질을 동물 배양세포에서 발현시킨 경우 응집이 나타났다.
이에, 이러한 점을 PPR 모티프 내의 아미노산 변이로 해결하는 것을 검토하였다. 그리고, PPR 단백질의 1번째 모티프(N-말단 측)의 6번째, 바람직하게는 6번째와 9번째의 아미노산을 친수성 아미노산(hydrophilic amino acid)으로 배치함으로써 PPR의 응집성을 개선할 수 있음을 알아내고, 본 발명을 완성하게 되었다.
본 발명은 이하를 제공한다.
[1] 다음 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성(sequence identity)을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
[2] 다음 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루탐산인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루타민인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 리신인 조합
·6번 위치의 아미노산이 아스파라긴산이고, 9번 위치의 아미노산이 글리신인 조합.
[3] 다음 중 어느 하나인 [1] 또는 [2]에 기재된 PPR 모티프:
(C-4) 서열번호 4의 서열로 구성되는 PPR 모티프;
(A-4) 서열번호 58의 서열로 구성되는 PPR 모티프;
(G-4) 서열번호 59의 서열로 구성되는 PPR 모티프;
(U-4) 서열번호 60의 서열로 구성되는 PPR 모티프.
[4] [1]~[3]의 어느 하나에 기재된 PPR 모티프의, PPR 단백질의 N-말단으로부터 1번째 PPR 모티프로서 사용하기 위한 용도.
[5] PPR 단백질의 응집성을 감소시키기 위한 [4]에 기재된 용도.
[6] 하기 일반식(1)로 나타내는 PPR 모티프를 1개 내지 30개 포함하고 특정 염기서열을 가지는 표적핵산과 결합 가능하며, N-말단 측으로부터 1번째 PPR 모티프(M1)의 A6 아미노산이 친수성 아미노산인 단백질:
Figure pct00001
상기 일반식(1)에서,
Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
Figure pct00002
 (상기 일반식(2)에서, A1 ~ A12는 각각 독립적으로 아미노산을 나타낸다)
  X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 구성되며;
  Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
  L은 2개 내지 7개 아미노산 길이의, 하기 일반식(3)으로 나타내는 부분이다.
Figure pct00003
   (상기 일반식(3)에서, 각 아미노산은 C-말단 측으로부터 "i"(-1), "ii"(-2)으로 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
[7] M1의 A9 아미노산이 친수성 아미노산 또는 글리신인, [6]에 기재된 단백질.
[8] M1의 A6 아미노산이 아스파라긴 또는 아스파라긴산인, [6] 또는 [7]에 기재된 단백질.
[9] M1의 A9 아미노산이 글루타민, 글루타민산, 리신 또는 글리신인, [6]~[8]의 어느 하나에 기재된 단백질.
[10] M1의 A6 아미노산 및 M1의 A9 아미노산이 다음 중 어느 하나의 조합인, [6]~[9]의 어느 하나에 기재된 단백질:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합.
[11] 형광 단백질, 핵이행 신호 펩티드 및 태그 단백질로 이루어진 군에서 선택되는 적어도 하나와, [1]~[3]의 어느 하나에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 또는 [6]~[10]의 어느 하나에 기재된 단백질과의 융합 단백질.
[12] [6]에 정의한 PPR 모티프를 포함하는 특정 염기서열을 가지는 표적 핵산과 결합 가능한 PPR 단백질의 개질방법에 있어서, N-말단으로부터 1번째 PPR 모티프(M1)의 A6 아미노산을 보다 친수성으로 만드는 방법.
[13] [1]~[3]의 어느 하나에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, [6]~[10]의 어느 하나에 기재된 단백질, 또는 [11]에 기재된 융합 단백질을 사용하는 것을 특징으로 하는 핵산의 검출방법.
[14] [1]~[3]의 어느 하나에 기재된 PPR 모티프, [1]~[3]의 어느 하나에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 [6]~[10]의 어느 하나에 기재된 단백질을 암호화하는 핵산.
[15] [14]에 기재된 핵산을 포함하는 벡터.
[16] [15]에 기재된 벡터를 포함하는 세포(인간 개체는 제외).
[17] [1]~[3]의 어느 하나에 기재된 PPR 모티프, [1]~[3]의 어느 하나에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 [6]~[10]의 어느 하나에 기재된 단백질, 또는 [15]에 기재된 벡터를 이용하는 핵산 조작방법(인간 개체에서의 실시를 제외한다).
[18] [17]에 기재된 조작 방법을 포함하는 생물의 생산방법.
또한, 본 발명은 다음을 제공한다.
[1] 아래 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
[2] 아래 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루탐산인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루타민인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 리신인 조합
·6번 위치의 아미노산이 아스파라긴산이고, 9번 위치의 아미노산이 글리신인 조합.
[3] [1] 또는 [2]에 기재된 PPR 모티프의, PPR 단백질의 N-말단으로부터 1번째 PPR 모티프로서 사용하기 위한 용도.
[4] PPR 단백질의 응집성을 감소시키기 위한 [3]에 기재된 용도.
[5] 하기 일반식(1)로 나타내는 PPR 모티프를 1개 내지 30개 포함하고 특정 염기서열을 가지는 표적핵산과 결합 가능하며, N-말단 측으로부터 1번째 PPR 모티프(M1)의 A6 아미노산이 친수성 아미노산인 단백질:
Figure pct00004
상기 일반식(1)에서,
Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
Figure pct00005
 (상기 일반식(2)에서, A1 ~ A12는 각각 독립적으로 아미노산을 나타낸다)
  X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 구성되며;
  Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
  L은 2개 내지 7개 아미노산 길이의, 하기 일반식(3)으로 나타내는 부분이며;
Figure pct00006
(상기 일반식(3)에서, 각 아미노산은 C-말단 측으로부터 "i"(-1), "ii"(-2)으로 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
[6] M1의 A9 아미노산이 친수성 아미노산 또는 글리신인, [5]에 기재된 단백질.
[7] M1의 A6 아미노산이 아스파라긴 또는 아스파라긴산인, [5] 또는 [6]에 기재된 단백질.
[8] M1의 A9 아미노산이 글루타민, 글루타민산, 리신 또는 글리신인, [5]~[7]의 어느 하나에 기재된 단백질.
[9] M1의 A6 아미노산 및 M1의 A9 아미노산이 다음 중 어느 하나의 조합인, [5]~[8]의 어느 하나에 기재된 단백질:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합.
[10] 형광 단백질, 핵이행 신호 펩티드 및 태그 단백질로 이루어진 군에서 선택되는 적어도 하나와, [1] 또는 [2]에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 또는 [5]~[9]의 어느 하나에 기재된 단백질과의 융합 단백질.
[11] [3]에 정의한 PPR 모티프를 포함하는 특정 염기서열을 가지는 표적 핵산과 결합 가능한 PPR 단백질의 개질방법에 있어서, N-말단으로부터 1번째 PPR 모티프(M1)의 A6 아미노산을 보다 친수성으로 만드는 방법.
[12] [1] 또는 [2]에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, [5]~[9]의 어느 하나에 기재된 단백질, 또는 [10]에 기재된 융합 단백질을 사용하는 것을 특징으로 하는 핵산의 검출방법.
[13] [1] 또는 [2]에 기재된 PPR 모티프, [1] 또는 [2]에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 [5]~[9]의 어느 하나에 기재된 단백질을 암호화하는 핵산.
[14] [13]에 기재된 핵산을 포함하는 벡터.
[15] [14]에 기재된 벡터를 포함하는 세포(인간 개체는 제외).
[16] [1] 또는 [2]에 기재된 PPR 모티프, [1] 또는 [2]에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 [5]~[9]의 어느 하나에 기재된 단백질, 또는 [15]에 기재된 벡터를 이용하는, 핵산의 조작방법(인간 개체에서의 실시를 제외한다).
[17] [16]에 기재된 조작방법을 포함하는 생물의 생산방법.
도 1은 PPR 모티프의 설계방법을 도시한다.
A: 1번째 모티프의 6번째 및 9번째 아미노산은 바깥쪽으로 노출된다.
B: 시토신을 인식하는 1번째 모티프의 6번째, 9번째 아미노산은, 전형적인 조합으로서 류신과 글리신(C_6L9G), 변이형으로서 류신과 글루탐산(C_6L9E), 아스파라긴과 글루타민(C_6N9Q), 아스파라긴과 글루탐산(C_6N9Q), 아스파라긴과 글루탐산 (C_6N9Q), 아스파라긴과 글루탐산(C_6N9E), 아스파라긴과 리신(C_6N9K), 아스파라긴산과 글리신(C_6D9G)을 선택하였다.
   도 2는 각 PPR 단백질의 응집성 및 핵내로의 이행을 도시한다.
GFP 및 핵이행 신호서열을 융합한 PPR 세포 내에서의 발현을 형광현미경 화상으로 확인하였다. EGFP를 융합한 경우, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하지 않고, 핵 주위에서 강하게 응집하는 모습이 확인되었다. 한편, PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 응집성이낮기는 하지만, 핵에 국재하지 않았다. mClover3을 융합한 경우, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하나, 핵내에서 응집하는 모습이 확인되었다. PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 핵에 국재하며 응집성을 찾아볼 수 없었다.
   도 3은 PPR 단백질과 RNA의 결합실험 결과를 나타낸다.
6번째 및 9번째 아미노산 변이를 포함하는 모든 PPR에서 표적인 CAG x 6에 특이적으로 결합함을 알 수 있었다. 표적서열에 대한 결합력은 PPRcag_1과 비교하여 PPRcag_2는 같은 정도, PPRcag_3은 80% 정도, PPRcag_4는 60% 정도, PPRcag_5는 120% 정도, PPRcag_6은 130% 정도였다.
도 4는 N-말단 측으로부터 제1번째 PPR 모티프의 응집에 미치는 영향을 나타낸다.
각각의 PPR 단백질을 대장균 발현계로 작성하여 정제하고, 겔 여과 크로마토그래피로 분리하였다. 용출분획(Elution vol)이 적을수록 분자 크기가 크다. v2에서는 8mL 내지 10mL의 용출분획에서 용출된 반면, v3.2에서는 12mL 내지 14mL의 용출분획에서 피크가 나타났다. 이러한 점에서 v2에서는 단백질 사이즈가 커지고 있다는 점에서 응집하고 있을 가능성이 시사되며, 그 응집은 v3.2에서 개선되고 있음을 알 수 있었다.
[PPR 모티프, PPR 단백질]
(정의)
본 발명에서는 'PPR 모티프'는 특히 기재한 경우를 제외하고 Web 상의 단백질 도메인 검색 프로그램에서 아미노산 서열을 분석하였을 때, Pfam에서 PF01535, Prosite에서 PS51375로 얻을 수 있는 E값이 소정값 이하(바람직하게는 E-03)의 아미노산 서열을 갖는 30개 내지 38개 아미노산으로 구성되는 폴리펩티드를 의미한다. 본 발명에서 정의하는 PPR 모티프를 구성하는 아미노산의 위치번호는 PF01535와 거의 같은 의미이며, PS51375의 아미노산 위치에서 2를 뺀 수(예; 본 발명의 1번→PS51375의 3번)에 상당한다. 단, "ii"(-2)번 아미노산이라고 할 때는 PPR 모티프를 구성하는 아미노산 뒤(C 말단 쪽)에서 2번째 아미노산, 또는 다음 PPR 모티프의 1번째 아미노산에 대해 2개 N-말단 쪽, 즉 -2번째 아미노산을 의미한다. 다음의 PPR 모티프가 명확하게 동정되지 않는 경우, 다음 헬릭스 구조의 첫번째 아미노산에 대하여 2개 이전의 아미노산을 "ii"라 한다. Pfam에 대해서는 http://pfam. Sanger.ac.uk/, Prosite 에 대해서는, http://www.expasy.org/prosite/ 를 참조할 수 있다.
PPR 모티프의 보존된(conserved) 아미노산 서열은 아미노산 수준에서의 보존성은 낮지만, 2차 구조상으로 2개의 α-헬릭스는 잘 보존되어 있다. 전형적인 PPR 모티프는 35개 아미노산으로 구성되는데, 그 길이는 30개 내지 38개 아미노산의 범위에서 가변적이다.
보다 구체적으로, 본 발명의 PPR 모티프는 하기 일반식(1)로 나타내는 30개 내지 38개 아미노산 길이의 폴리펩티드로 이루어진다.
Figure pct00007
 상기 일반식(1)에서,
  Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
Figure pct00008
 (상기 일반식(2)에서, A1 ~ A12는 각각 독립적으로 아미노산을 나타낸다)
  X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 구성되며;
  Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
L은 2개 내지 7개 아미노산 길이의, 하기 일반식(3)으로 나타내는 부분이다.
Figure pct00009
(상기 일반식(3)에서, 각 아미노산은 "i"(-1), "ii"(-2), C-말단 측으로부터 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
본 명세서에서 "PPR 단백질"이라 함은, 특별히 기재한 경우를 제외하고 상술한 PPR 모티프를 1개 이상, 바람직하게는 2개 이상 갖는 PPR 단백질을 의미한다. 본 명세서에서 "단백질"이라 함은, 특별히 기재한 경우를 제외하고 폴리펩티드(복수의 아미노산이 펩티드 결합한 사슬)로 이루어진 물질을 의미하고, 비교적 저분자인 폴리펩티드로 이루어진 것도 포함된다. 본 발명에서는 "아미노산"이라 함은, 통상의 아미노산 분자를 의미하며, 펩티드 사슬을 구성하고 있는 아미노산 잔기를 가리키는 경우도 있다. 어느 쪽을 의미하는지는 문맥상 당업자에게 명백하다.
본 명세서에서 PPR 모티프의 표적 핵산에서의 염기와의 결합성에 관하여 "특이성(specificity)/특이적(specific)"이라 함은, 특별히 기재한 경우를 제외하고 4종의 염기 중 어느 하나의 염기에 대한 결합 활성이 다른 염기에 대한 결합 활성보다 높은 것을 의미한다.
본 명세서에서는 "핵산"이라 함은 RNA 또는 DNA를 의미한다. 또한, PPR 단백질은 RNA 또는 DNA 속의 염기에 대해 특이성을 가질 수 있으나, 핵산 단량체에 결합하지는 않는다.
PPR 모티프는 1, 4, (ii)번의 3가지 아미노산의 조합이 염기와의 특이한 결합을 위해 중요하며, 이들의 조합에 의해 결합하는 염기가 어느 것인지 결정할 수 있다(참조: 특허문헌 1, 2).
구체적으로, RNA 결합성의 PPR 모티프에 관해서는 1, 4, (ii)번의 3가지 아미노산의 조합과 결합 가능한 염기와의 관계는 다음과 같다(참조: 특허문헌 1).
(3-1) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 아스파라긴 및 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음으로 C에, 그 다음은 A 또는 G에 대하여 결합하는 선택적인 RNA 염기결합능을 가진다.
(3-2) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하고 다음으로 G에, 그 다음은 C에 대해 결합하나 U에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-3) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 아스파라긴, 아스파라긴의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음으로 A 또는 U에 대하여 결합하나 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-4) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 글루탐산, 글리신, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하나 A, U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-5) A1, A4 및 Lii의 3가지 아미노산 조합이 순서대로 이소류신, 아스파라긴, 아스파라긴의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음은 U에, 그 다음은 A에 대해 결합하나 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-6) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하고 다음은 U에 대하여 결합하나 A와 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-7) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 리신, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하고 다음은 A에 대해 결합하나 U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-8) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 셀린, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하고 다음으로 C에, 그 다음은 G 및 U에 대하여 결합하는 선택적인 RNA 염기결합능을 가진다.
(3-9) A1, A4 및 Lii의 3가지 아미노산 조합이 순서대로 바린, 아스파라긴, 셀린의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음은 U에 대해 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-10) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하나 G, U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-11) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 이소류신, 아스파라긴, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음은 A에 대해 결합하나 G 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-12) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 트레오닌, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하나 G, U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-13) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 이소류신, 메티오닌, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음은 C에 대해 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-14) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 프롤린, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음은 C에 대하여 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-15) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 티로신, 프롤린, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하나 A, G 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-16) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 류신, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하나 A, U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
구체적으로, DNA 결합성의 PPR 모티프에 관해서는 1, 4, (ii)번의 3가지 아미노산의 조합과 결합 가능한 염기의 관계는 다음과 같다(참조: 특허문헌 2):
(2-1) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 글리신, 아스파라긴산인 경우, 그 PPR 모티프는 G에 선택적으로 결합하고;
(2-2) A1, A4 및 Lii의 3개 아미노산이 순서대로 글루탐산, 글리신, 아스파라긴산인 경우, 그 PPR 모티프는 G에 선택적으로 결합하며;
(2-3) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 글리신, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-4) A1, A4 및 Lii의 3개 아미노산이 순서대로 글루탐산, 글리신, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하며;
(2-5) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 글리신, 세린인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-6) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 이소류신, 임의의 아미노산인 경우, 그 PPR 모티프는 T 및 C에 선택적으로 결합하며;
(2-7) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 이소류신, 아스파라긴인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-8) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 류신, 임의의 아미노산인 경우, 그 PPR 모티프는 T 및 C에 선택적으로 결합하며;
(2-9) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 류신, 아스파라긴산인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-10) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 류신, 리신인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-11) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 메티오닌, 임의의 아미노산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-12) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 메티오닌, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-13) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 메티오닌, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-14) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 임의의 아미노산인 경우, 그 PPR 모티프는 C 및 T에 선택적으로 결합하며;
(2-15) A1, A4 및 Lii 세 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-16) A1, A4 및 Lii의 3개 아미노산이 순서대로 페닐알라닌, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-17) A1, A4 및 Lii의 3개 아미노산이 순서대로 글리신, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-18) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-19) A1, A4 및 Lii의 3개 아미노산이 순서대로 트레오닌, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-20) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하며;
(2-21) A1, A4 및 Lii의 3개 아미노산이 순서대로 티로신, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-22) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 아스파라긴인 경우, 그 PPR 모티프는 C에 선택적으로 결합하며;
(2-23) A1, A4 및 Lii 3개 아미노산이 순서대로 이소류신, 아스파라긴, 아스파라긴인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-24) A1, A4 및 Lii의 3개 아미노산이 순서대로 세린, 아스파라긴, 아스파라긴인 경우, 그 PPR 모티프는 C에 선택적으로 결합하며;
(2-25) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 아스파라긴, 아스파라긴인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-26) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 세린인 경우, 그 PPR 모티프는 C에 선택적으로 결합하며;
(2-27) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 아스파라긴, 세린인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-28) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 트레오닌인 경우, 그 PPR 모티프는 C에 선택적으로 결합하며;
(2-29) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 아스파라긴, 트레오닌인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-30) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 트립토판인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고, 다음으로 T에 결합하며;
(2-31) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 아스파라긴, 트립토판인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-32) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 프롤린, 임의의 아미노산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-33) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 프롤린, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-34) A1, A4 및 Lii의 3개 아미노산이 순서대로 페닐알라닌, 프롤린, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-35) A1, A4 및 Lii의 3개 아미노산이 순서대로 티로신, 프롤린, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-36) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 세린, 임의의 아미노산인 경우, 그 PPR 모티프는 A 및 G에 선택적으로 결합하며;
(2-37) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 세린, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-38) A1, A4 및 Lii의 3개 아미노산이 순서대로 페닐알라닌, 세린, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하며;
(2-39) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 세린, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-40) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 트레오닌, 임의의 아미노산인 경우, 그 PPR 모티프는 A와 G에 선택적으로 결합하며;
(2-41) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 트레오닌, 아스파라긴산인 경우, 그 PPR 모티프는 G에 선택적으로 결합하고;
(2-42) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 트레오닌, 아스파라긴산인 경우, 그 PPR 모티프는 G에 선택적으로 결합하며;
(2-43) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 트레오닌, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-44) A1, A4 및 Lii의 3개 아미노산이 순서대로 페닐알라닌, 트레오닌, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하며;
(2-45) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 트레오닌, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-46) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 트레오닌, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하며;
(2-47) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 발린, 임의의 아미노산인 경우, 그 PPR 모티프는 A, C 및 T에 결합하지만 G에는 결합하지 않고;
(2-48) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 발린, 아스파라긴산인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고, 다음으로 A에 결합하며;
(2-49) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 발린, 글리신인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고; 및,
(2-50) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 발린, 트레오닌인 경우, 그 PPR 모티프는 T에 선택적으로 결합한다
(3가지 아미노산의 특히 바람직한 조합)
RNA 결합성 PPR 모티프는 각 염기를 인식하고 특이하게 결합 가능한 대표적인 1번, 4번, (ii)번 아미노산의 조합이 있다: 구체적으로, 아데닌(A)을 인식하는 조합은 1번이 발린, 4번이 발린, (ii)번이 아스파라긴; 시토신(C)을 인식하는 조합은 1번이 발린, 4번이 아스파라긴, (ii)번이 세린; 구아닌(G)을 인식하는 조합은 1번이 발린, 4번이 트레오닌, (ii)번이 아스파라긴산; 우라실(U)을 인식하는 조합은 1번이 발린, 4번이 아스파라긴, (ii)번이 아스파라긴산이다(참조: 비특허문헌 1~5).
본 발명의 바람직한 실시태양의 하나에서는 이들 조합이 이용된다.
(응집성의 개선)
본 발명자들은 천연으로 존재하는 기존 PPR 모티프의 아미노산 정보에서 PPR 모티프의 6번째 위치의 아미노산은 소수성(특히, 류신), 9번째 위치의 아미노산은 비친수성 아미노산(특히, 글리신)인 경우가 매우 많음을 찾아냈다. 이미 결정구조가 알려진 PPR 단백질의 구조(비특허문헌 6: Coquille et al., 2014 Nat. Commun.; PDB ID: 4PJQ, 4WSL, 4PJR; 비특허문헌 7: Shen et al., 2015 Nat. Commun., PDB ID: 5I9D, 5I9F, 5I9G, 5I9H)에서 1번째 모티프(N-말단 측)의 6번째, 9번째 아미노산은 밖으로 노출되기 때문에, 그 노출된 소수성 아미노산이 원인으로 응집성을 나타낼 것으로 추정하였다(도 1A). 한편, 2번째 모티브 이후에서는 6번째, 9번째 아미노산은 단백질 내에 묻혀 소수성 코어(hydrophobic core)를 형성하기 때문에, 모든 모티브의 6번째, 9번째에 친수성 잔기를 넣으면 단백질 구조가 붕괴될 것으로 예상하였다. 따라서, 1번째 모티프에서만 6번째 아미노산을, 바람직하게는 6번째 및 9번째 아미노산을 친수성 아미노산(아스파라긴, 아스파라긴산, 글루타민, 글루탐산, 리신, 아르기닌, 세린, 트레오닌)으로 배치함으로써, PPR의 응집성을 감소시키고자 하였다.
구체적으로는 다음과 같이 한다.
  특정 염기서열을 가지는 표적 핵산과 결합 가능한 단백질에서 N-말단으로부터 1번째 PPR 모티프(M1)에서 :
(1) A6 아미노산을 친수성 아미노산, 바람직하게는 A6 아미노산을 아스파라긴 또는 아스파라긴산으로 하고;
(2) 또한, A9 아미노산을 친수성 아미노산 또는 글리신, 바람직하게는 글루타민, 글루타민산, 리신 또는 글리신으로 하거나, 또는
(3) A6 아미노산 및 A9 아미노산을 다음 중 어느 하나의 조합으로 한다.
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합
(신규한 PPR 모티프)
본 발명은 위에서 도출된 응집성이 개선된 신규한 PPR 모티프 및 이를 포함하는 신규한 PPR 단백질을 제공한다.
  본 발명에 의해 제공되는 신규한 PPR 모티프는 다음과 같다.
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산을 아스파라긴 또는 아스파라긴산으로 치환한 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산을 아스파라긴 또는 아스파라긴산으로 치환한 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
이러한 PPR 모티프 중 특히 바람직한 경우는 다음과 같다:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산을 아래에 정의된 조합 중 어느 하나를 만족하도록 치환한 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산을 아래에 정의된 조합 중 어느 하나를 만족하도록 치환한 서열로 구성되는 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산을 아래에 정의된 조합 중 어느 하나를 만족하도록 치환한 서열로 구성되는 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루탐산인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루타민인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 리신인 조합
·6번 위치의 아미노산이 아스파라긴산이고, 9번 위치 아미노산이 글리신인 조합
  서열번호 4 내지 10의 구체적인 서열은 도 1 및 서열목록에 나타나 있다.
  이러한 PPR 모티프 중 좀 더 바람직한 것은 다음과 같다.
(C-4) 서열번호 4의 서열로 구성되는 PPR 모티프;
(A-4) 서열번호 58의 서열로 구성되는 PPR 모티프;
(G-4) 서열번호 59의 서열로 구성되는 PPR 모티프;
(U-4) 서열번호 60의 서열로 구성되는 PPR 모티프.
서열번호 58 내지 60의 서열은 아래 및 서열목록에 나타나 있다.
서열번호 58의 서열 VTYTTNIDQLCKAGKVDEALELFKEMRSKGVKPNV
서열번호 59의 서열 VTYTTNIDQLCKAGKVDEALELFDEMKERGIKPDV
서열번호 60의 서열 VTYNTNIDQLCKAGRLDEAEELLEEMEEKGIKPDV
(응집성이 개선된 PPR 단백질)
또한, 본 발명은 상기에 의해 도출된 응집성이 개선된 PPR 단백질을 제공한다.
본 발명의 바람직한 실시태양 중 하나는, M1의 A9 아미노산이 M1의 다른 아미노산이 어떤 경우든, 또한 M1 이외 모티프의 아미노산 서열이 어떤 경우든, 비소수성(non-hydrophobic) 아미노산 또는 글리신이다. 비소수성 아미노산은 친수성(hydrophilic) 아미노산 또는 시스테인 혹은 히스티딘이고; 바람직하게는 친수성 아미노산, 즉 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 글루타민, 리신, 세린 또는 트레오닌이며; 보다 바람직하게는 글루타민, 글루타민산, 글루타민, 리신이다.
  본 발명의 바람직한 실시태양 중 하나는, M1의 A9 아미노산이 M1의 다른 아미노산이 어떤 경우든, 또한 M1 이외의 모티프의 아미노산 서열이 어떤 경우든, 글루타민, 글루탐산, 리신 또는 글리신이다.
  본 발명의 바람직한 실시태양 중 하나는, M1의 A9 아미노산이 M1의 다른 아미노산이 어떤 경우든, 또한 M1 이외의 모티프의 아미노산 서열이 어떤 경우든, 비소수성(non-hydrophobic) 아미노산이다. 비소수성 아미노산은, 예를 들어 친수성 아미노산 또는 시스테인 혹은 히스티딘이고; 바람직하게는 친수성 아미노산 즉 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 리신, 세린 또는 트레오닌이다.
  본 발명의 가장 바람직한 실시태양의 하나는, M1의 A9 아미노산이 M1의 다른 아미노산이 어떤 경우든, 또한 M1 이외의 모티프의 아미노산 서열이 어떤 경우든, 다음 중 어느 하나의 조합이다:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합
  RNA 결합성 단백질의 바람직한 실시태양 중 어느 하나로는 M1의 A6 아미노산 및 A9 아미노산이 상기 조건을 충족하며 또한, 함유된 PPR 모티프 중 적어도 하나, 바람직하게는 반 이상, 더 바람직하게는 모두가 다음 중 어느 하나를 만족시킨다:
·결합하는 염기가 시토신인 경우, A1이 발린이고, A4가 아스파라긴이며, Aii가 세린이다.
·결합하는 염기가 아데닌인 경우, A1이 발린이고, A4가 트레오닌이고, Aii가 아스파라긴이다.
·결합하는 염기가 구아닌일 경우, A1이 발린이고, A4가 트레오닌이며, Aii가 아스파라긴산이다.
·결합하는 염기가 우라실 또는 티민일 경우, A1이 발린이고, A4가 아스파라긴이고, Aii가 아스파라긴산이다.
 RNA 결합성 단백질의 바람직한 하나의 실시태양에 따르면, M1은 상술한 신규한 PPR 모티프이다.
 특히 바람직한 하나의 실시태양에 따르면, M1은 다음 중 어느 하나의 폴리펩티드로 이루어진 PPR 모티프이고,
· 결합하는 염기가 시토신인 경우, 서열번호 4 내지 7 중 어느 하나의 서열로 구성된 폴리펩티드
· 결합하는 염기가 아데닌인 경우, 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산을 이하에서 정의한 조합 중 어느 하나를 만족하도록 치환한 폴리펩티드
· 결합하는 염기가 구아닌인 경우, 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산을 이하에서 정의한 조합 중 어느 하나를 만족하도록 치환한 폴리펩티드
· 결합하는 염기가 우라실인 경우, 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산을 이하에서 정의한 조합 중 어느 하나를 만족하도록 치환한 폴리펩티드
  M1 이외의 PPR 모티프 중 적어도 하나가 다음 중 어느 하나의 폴리펩티드로 이루어진 PPR 모티프이다:
·결합하는 염기가 시토신인 경우, 서열번호 2의 서열로 구성된 폴리펩티드
·결합하는 염기가 아데닌인 경우, 서열번호 8의 서열로 구성된 폴리펩티드
·결합하는 염기가 구아닌인 경우, 서열번호 9의 서열로 구성된 폴리펩티드
·결합하는 염기가 우라실인 경우, 서열번호 10의 서열로 구성된 폴리펩티드
  상술한 조합은 아래 중 어느 하나이다:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합
  본 발명의 특히 바람직한 하나의 실시태양은 M1이 다음 중 어느 하나의 폴리펩티드로 이루어진 PPR 모티프이고,
·결합하는 염기가 시토신인 경우, 서열번호 4의 서열로 구성된 폴리펩티드
·결합하는 염기가 아데닌인 경우, 서열번호 58의 서열로 구성된 폴리펩티드
·결합하는 염기가 구아닌인 경우, 서열번호 59의 서열로 구성된 폴리펩티드
·결합하는 염기가 우라실인 경우, 서열번호 60의 서열로 구성된 폴리펩티드
M1 이외의 PPR 모티프 중 적어도 하나가 다음 중 어느 하나의 폴리펩티드로 이루어진 PPR 모티프이다:
·결합하는 염기가 시토신인 경우, 서열번호 2의 서열로 구성된 폴리펩티드
·결합하는 염기가 아데닌인 경우, 서열번호 8의 서열에 있어서 15번 위치의 아미노산이 리신으로 치환된 서열로 구성된 폴리펩티드
·결합하는 염기가 구아닌인 경우, 서열번호 9의 서열로 구성된 폴리펩티드
·결합하는 염기가 우라실인 경우, 서열번호 10의 서열로 구성된 폴리펩티드
(고성능 PPR 모티프의 골격 이용)
  본 발명의 한가지 바람직한 실시태양에 따르면, 시토신, 아데닌, 구아닌, 우라실(또는 티민) 각각에 대한 PPR 모티프에서 1, 4, 6, 9, (ii)번 이외의 아미노산을 특정 아미노산으로 배치한다. 구체적으로, 아기장대(Arabidopsis thaliana)의 PPR 모티프 서열 중, 1, 4, 및 (ii)번 위치의 아미노산 조합이 아데닌(A)을 인식하는 PPR 모티프를 위해서는 VTN, 시토신(C)을 인식하는 PPR 모티프를 위해서는 VSN, 구아닌(G)을 인식하는 PPR 모티프를 위해서는 VTD, 우라실(U)을 인식하는 PPR 모티프를 위해서는 VND인 것을 모아, 각 위치에 출현하는 아미노산의 종류 및 그 수를 정리하였을 때, 각 위치에서 높은 빈도로 출현하는 아미노산을 선택함으로써 PPR 모티프의 성능을 높일 수 있다.
1, 4, 6, 9, (ii)번 이외의 아미노산을 상술한 바와 같이 높은 빈도로 출현하는 아미노산으로 이용한다 하였을 경우, RNA 결합성의 PPR 단백질을 얻기 위해서는 다음과 같은 PPR 모티프의 아미노산 서열을 참고할 수 있다:
  시토신에 대응하는 PPR 모티프로는 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
 아데닌에 대응하는 PPR 모티프로는 서열번호 8의 서열로 구성되는 PPR 모티프;
 구아닌에 대응하는 PPR 모티프로는 서열번호 9의 서열로 구성되는 PPR 모티프;
 우라실에 대응하는 PPR 모티프로는 서열번호 10의 서열로 구성되는 PPR 모티프.
(용어의 설명 등)
  본 발명에서 염기서열(뉴클레오티드서열이라고도 함) 또는 아미노산 서열에 관하여 "동일성(identity)"이라 함은, 특별히 기재한 경우를 제외하고는 두 서열을 최적의 실시태양으로 정렬시킨 경우, 두 서열간에 공유하는 일치된 염기 또는 아미노산 개수의 백분율을 의미한다. 즉, 동일성=(일치한 위치의 수/위치의 전수)×100으로 산출할 수 있고, 시판되는 알고리즘을 이용해 계산할 수 있다. 또한, 이러한 알고리즘은 [Altschul et al., J. Mol. Biol. 215(1990) 403-410]에 기재된 NBLAST 및 XBLAST 프로그램에 포함되어 있다. 구체적으로, 염기서열 또는 아미노산 서열의 동일성에 관한 검색 및 분석은 당업계에 알려진 알고리즘 또는 프로그램(예를 들어, BLASTN, BLASTP, BLASTX, Clustal W)으로 수행할 수 있다. 프로그램을 이용할 경우의 파라미터는 해당 업체라면 적절하게 설정할 수 있고, 각 프로그램의 디폴트 파라미터(default parameter)를 이용해도 된다. 이들 분석 방법의 구체적인 기법도 당업자에 널리 알려져 있다.
본 명세서에서 염기서열 또는 아미노산 서열에 관해 동일성이 있다(또는 동일성이 높다)함은, 특별히 기재한 경우를 제외하고는 어느 경우나 최소한 70%, 바람직하게는 80% 이상, 보다 바람직하게는 85% 이상, 보다 더 바람직하게는 90% 이상, 보다 더 바람직하게는 95% 이상, 보다 더 바람직하게는 97.5% 이상, 가장 바람직하게는 99% 이상의 동일성을 가지는 경우를 일컫는다.
 
또한, 본 발명의 PPR 모티프 또는 단백질에 관하여, '치환, 결실 또는 부가된 서열'이라고 할 경우, 치환 등이 되는 아미노산의 개수는 특히 기재하였을 경우를 제외하고, 어느 모티프 또는 단백질에서도 그 아미노산 서열로 구성된 모티프 또는 단백질이 원하는 기능을 가지는 한 특별히 한정되는 것은 아니나, 1개 내지 9개 또는 1개 내지 4개 정도이다. 이러한 아미노산 서열과 관련된 폴리뉴클레오티드 또는 단백질을 제조하기 위한 수단은 당업자에게 잘 알려져 있다.
  성질이 비슷한 아미노산은 하이드로파시(hydropathy), 하전(charge), pKa, 용해도(solubility) 등 물성이 유사한 아미노산을 의미하며, 예를 들어 다음과 같은 것을 가리킨다.
소수성(hydrophobic) 아미노산: 알라닌, 발린, 글리신, 이소류신, 류신, 페닐알라닌, 프롤린, 트립토판, 티로신
비소수성(non-hydrophobic) 아미노산: 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 리신, 세린, 트레오닌, 시스테인, 히스티딘;
친수성(hydrophilic) 아미노산: 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 리신, 세린, 트레오닌;
산성(acidic) 아미노산: 아스파라긴산, 글루탐산
염기성(basic) 아미노산: 리신, 아르기닌, 히스티딘
중성(neutral) 아미노산: 알라닌, 아스파라긴, 시스테인, 글루타민, 글리신,이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트립토판, 티로신, 발린
함황(sulfur-containing) 아미노산: 메티오닌, 시스테인
함방향환(aromatic ring-containing) 아미노산: 티로신, 트립토판, 페닐알라닌.
  유전자, 핵산, 폴리뉴클레오티드, 단백질 및 모티프 등에 관하여, '작제(preparation)'라 함은 '생산(production)' 또는 '제조(manufacturing)'로 바꿔 말할 수 있다. 또한, 유전자 등과 관련하여 파트를 조합하여 작제하는 경우 '구축(construction)'이라고 할 수 있으나 '구축'도 '생산' 또는 '제조'라고도 말할 수 있다.
본 발명의 PPR 모티프, 그를 포함하는 단백질, 또는 이들을 암호화하는 핵산은 당업자라면 종래기술 및 본 명세서의 실시예의 기재를 이용하여 제조할 수 있다.
[PPR 단백질의 특성 및 용도]
(PPR 단백질 응집성 개선)
본 발명의 신규한 PPR 모티프를 사용하여 작제한 PPR 단백질은 세포 내에서의 감소된 응집성(aggregation property)을 나타낸다. PPR 단백질의 응집성은 당업자라면 PPR 단백질을 세포 내에서 발현시켜 응집 여부를 확인하는 것으로 평가할 수 있다. 확인은 PPR 단백질을 형광 단백질과 융합시켜서 발현하면 더욱 쉽다. 본 발명자들의 검토에 따르면, PPR 단백질의 첫번째 모티프에서 아미노산의 적절한 개변에 의해 PPR 단백질의 세포 내 응집성이 개선되어 핵으로의 이행성(localization)이 향상된다.
(결합력)
본 발명의 신규한 PPR 모티프를 사용하여 작제한 PPR 단백질은 세포 내에서 응집성이 감소되었을 뿐만 아니라, 동일한 표적 RNA에 대한 기존의 PPR 모티프를 사용하여 작제한 PPR 단백질과 동등하거나 그보다 높은 RNA 결합능을 갖는다. '동등(equivalent)'이란 55% 이상인 것을 의미하며, 바람직하게는 75% 정도인 것을 의미한다.
표적서열에 대한 결합력은 EMSA(Electrophoretic Mobility Shift Assay)나 Biacore를 이용한 방법에 따라 평가할 수 있다. EMSA는 단백질과 핵산이 결합된 시료를 전기영동시 핵산분자의 이동도가 결합되지 않은 경우와 비교하여 변화하는 성질을 이용하는 방법이다. Biacore로 대표되는 분자간 상호작용 분석기기는 반응속도론적 분석이 가능하므로, 상세한 단백질-핵산결합 분석이 가능하다.
  표적서열에 대한 결합력은 또한 고상화된(solid-phased) 표적핵산에 후보 단백질을 포함하는 용액을 제공하여, 표적핵산에 결합한 단백질을 검출 또는 정량하는 것에 의해서도 분석할 수 있다. 이 방법은 ELISA(Enzyme-Linked Immuno Sorbent Assay)를 응용하므로, RPB-ELISA(RNA-protein binding ELISA)법이라 칭하는 경우가 있다. 고상화된 표적핵산에 후보 단백질을 포함하는 용액을 제공하는 공정은, 구체적으로는 플레이트에 고정된 표적핵산 분자에 대상결합 단백질을 포함하는 용액을 흘려보냄으로써 수행한다. 표적핵산 분자의 고정화는 기존의 여러가지 고정화 방법을 이용할 수 있는데, 예를 들어 스트렙토아비딘(streptoavidine)이 코팅된 웰 플레이트에 비오틴 수식된 표적핵산 분자를 포함하는 핵산 프로브를 부여함으로써 달성할 수 있다. 상세한 실험조건은 본 발명의 실시예에 상술한 실험방법을 참고할 수 있다. RPB-ELISA에서는 대상 PPR 단백질과 그 표적 RNA를 가한 시료의 발광량으로부터 백그라운드 시그널(표적 RNA를 가하지 않고 대상 PPR 단백질을 가하였을 때의 발광 시그널 값)을 공제한 값을 대상 PPR 단백질과 그 표적 RNA와의 결합력으로 할 수 있다.
[PPR 단백질의 이용]
(복합체, 융합 단백질)
본 발명에 의해 제공되는 PPR 모티프 또는 PPR 단백질은 기능성 영역(functional region)을 연결하여 복합체(complex)로 만들 수 있다. 또한, 단백질성의 기능성 영역을 연결하여 융합 단백질(fusion protein)로 만들 수 있다. 기능성 영역은 생체 내 또는 세포 내에서 특정한 생물학적 기능, 예를 들어 효소기능, 촉매기능, 저해기능, 항진기능 등의 기능을 가진 부분 또는 표지로서의 기능을 가진 부분을 의미한다. 이런 영역은 예를 들어, 단백질, 펩티드, 핵산, 생리활성물질, 약재로 이뤄진다. 이하에서는 본 발명을 복합체에 관하여 융합 단백질을 예로 들어 설명하였으나, 당업자라면 그 설명에 준하여 융합 단백질 이외의 복합체인 경우에 대해서도 이해할 수 있을 것이다.
본 발명의 바람직한 실시태양의 하나로서, 기능성 영역은 리보핵산 가수분해효소(RNase)이다. RNase의 예는 RNase A(예를 들어, bovine pancreatic ribonuclease A: PDB 2AAS), RNase H이다.
또 다른 바람직한 실시태양의 하나로서, 기능성 영역은 형광 단백질이다. 형광 단백질의 예로서는 mCherry, EGFP, GFP, Sirius, EBFP, ECFP, mTurquoise, TagCFP, AmCyan, mTFP 1, MidoriishiCyan, CFP, TurboGFP, AcGFP, TagGFP, Azami-Green, ZsGreen, EmGFP, HyPer, TagYFP, EYFP, Venus, YFP, PhiYFP, PhiYFP-m, TurboYFP, ZsYellow, mBanana, KusabiraOrange, mOrange, TurboRFP, DsRed-Express, DsRed 2, TagRFP, DsRed-Monomer, AsRed 2, mStrawberry, TurboFP 602, mRFP 1, JRed, KillerRed, HcRed, KeimaRed, mRasberry, mPlum, PS-CFP, Dendra 2, Kaede, EosFP, KikumeGR이다. 융합 단백질로서의 응집성 개선 및/또는 핵에 대한 효율적인 국재화(localization)의 관점에서 바람직한 예는 mClover3이다.
또 다른 바람직한 실시태양의 하나로서, 기능성 영역(functional region)은 표적이 mRNA인 경우 표적 mRNA에서의 단백질 발현량을 향상시키는 기능성 도메인(functional domain)이다(WO 2017/209122). mRNA로부터의 단백질 발현량을 향상시키는 기능성 도메인의 예로서는 mRNA의 번역을 직접적 또는 간접적으로 촉진하는 것으로 알려져 있는 단백질의 기능성 도메인이 있다. 보다 구체적으로, mRNA 리보솜을 유도하는 도메인, mRNA의 번역 시작 또는 번역 촉진과 관련된 도메인, mRNA의 핵 외부로의 수송과 관련된 도메인, 소포체(endoplasmic reticulum, ER) 막으로의 결합과 관련된 도메인, 소포체 잔류 신호(ER retention signal) 서열을 포함하는 도메인, 또는 소포체 신호서열을 포함하는 도메인 등을 예로 들 수 있다. 좀 더 구체적으로, 상기 mRNA 리보솜을 유도하는 도메인은, DENR(Density-regulated protein), MCT-1(Malignant T-cell amplified sequence 1), TPT1(Translationally-controlled tumor protein), 및 Lerepo4(Zinc finger CCCH-domain)로 이루어진 군에서 선택되는 폴리펩티드의 전부 또는 기능적 부분을 포함하는 도메인일 수 있다. 또한, 상기 mRNA 번역개시 또는 번역촉진에 관련된 도메인은 eIF4E 및 eIF4G로 이루어진 군으로부터 선택되는 폴리펩티드의 전부 또는 기능적인 부분을 포함하는 도메인일 수 있다. 또한, 상기 mRNA 핵 외부로의 수송과 관련된 도메인은 SLBP(Stem-loop binding protein)의 전부 또는 기능적 부분을 포함하는 도메인일 수 있다. 또한, 상기 소포체막으로의 결합과 관련된 도메인은 SEC61B, TRAP-alpha(Translocon associated protein alpha), SR-alpha, Dia1(Cytochrome b5 reductase 3), 및 p180로 이루어진 군으로부터 선택되는 폴리펩티드의 전부 또는 기능성 부분을 포함하는 도메인일 수 있다. 또한, 상기 소포체 잔류 신호서열은 KDEL(서열번호 55) 또는 KEEL(서열번호 56) 서열을 포함하는 신호서열이다. 또한, 상기 소포체 신호서열은 MGWSCIILFLVATATGAHS(서열번호 57)를 포함하는 신호서열일 수 있다.
본 발명의 기능성 영역은 PPR 단백질의 N-말단 측에 융합되어도 좋고, C-말단 측에 융합되어도 좋으며, N-말단 측과 C-말단 측의 양쪽에 융합되어도 무방하다. 또한, 복합체 또는 융합 단백질은 복수의 기능성 영역(예를 들어, 2개 내지 5개)을 포함해도 좋다. 또한, 본 발명의 복합체 또는 융합 단백질은 기능성 영역과 PPR 단백질이 링커 등을 통해 간접적으로 융합되어도 좋다.
(PPR 단백질 등을 암호화하는 핵산, 벡터, 세포)
본 발명은 상술한 PPR 모티프, PPR 단백질 또는 융합 단백질을 암호화하는 핵산, 핵산을 포함하는 벡터(예를 들어, 증폭을 위한 벡터, 발현 벡터)도 제공한다. 증폭을 위한 벡터는 대장균이나 효모를 숙주로 사용할 수 있다. 본 명세서에서 발현 벡터란, 예를 들어 상류에 프로모터 서열을 가지는 DNA, 원하는 단백질을 암호화하는 DNA 및 터미네이터 서열을 가지는 DNA를 포함하는 벡터를 의미하나, 원하는 기능을 발휘하는 한 반드시 이 순서로 서열화될 필요는 없다. 본 발명에서는 당업자가 통상 사용할 수 있는 여러가지 벡터를 재조합하여 사용할 수 있다.
본 발명의 PPR 단백질 또는 융합 단백질은 진핵생물(예를 들어, 동물, 식물, 미생물(효모 등), 원생생물)의 세포에서 기능할 수 있다. 본 발명의 융합 단백질은 특히 동물세포 내(실험실 조건 또는 생체 내 조건)에서 기능할 수 있다. 본 발명의 PPR 단백질 또는 융합 단백질, 또는 이를 발현하는 벡터를 도입할 수 있는 동물세포로는, 예를 들어 사람, 원숭이, 돼지, 소, 말, 개, 고양이, 마우스, 래트 유래의 세포를 들 수 있다. 또한, 본 발명의 PPR 단백질, 또는 융합 단백질, 또는 이를 발현하는 벡터를 도입할 수 있는 배양세포로는, 예를 들어 차이니즈 햄스터 난소(CHO) 세포, COS-1 세포, COS-7 세포, VERO(ATC CCL-81) 세포, BHK 세포, 개의 신장 유래 MDCK 세포, 햄스터 AV-12-664 세포, HeLa 세포, WI38 세포, 293 세포, 293T 세포, PER.C6 세포를 들 수 있지만, 이에 한정되는 것은 아니다.
(용도)
본 발명의 PPR 단백질, 또는 융합 단백질은 생체 내 또는 세포 내에 핵산서열 특이적으로 기능성 영역을 전달하고 기능을 발휘하게 할 수 있다. GFP 등의 마커 부분과 연결된 복합체는 원하는 RNA를 생체 내에서 가시화하기 위해 이용할 수 있다.
또한, 본 발명의 PPR 단백질 또는 융합 단백질은 세포 내 또는 생체 내에서 핵산서열 특이적으로 개변, 파괴할 수 있고 새로운 기능을 부여할 수 있다. 특히, RNA 결합성 PPR 단백질은 오르가넬(organelle)에서 볼 수 있는 RNA의 모든 가공 단계, 즉 절단(cleavage), RNA 편집(edition), 번역(translation), 접합(splicing), RNA 안정화(stabilization)에 관여한다. 따라서, 본 발명에 의해 제공되는 PPR 단백질의 개질과 관련된 방법 및 본 발명에 의해 제공되는 PPR 모티프 및 PPR 단백질은 다양한 분야에서 다음과 같은 이용을 기대할 수 있다.
(1) 의료
특정 질환과 관련된 특정 RNA를 인식하고 결합하는 PPR 단백질을 작제한다. 또한, 특정 RNA에 관하여 표적서열을 분석하고 부수되는 단백질을 분석한다. 이들 분석 결과는 질환의 치료를 위한 화합물 탐색에 이용될 수 있다.
예를 들어, 동물에서는 LRPPRC로 일컫어지는 PPR 단백질의 이상이 Leigh Syndrome French Canadian type(LSFC; 레이증후군, 아급성 괴사성 뇌척수증)을 일으키는 것으로 알려져 있다. 본 발명은 LSFC의 처치(예방, 치료, 진행 억제)에 기여할 수 있다. 기존의 PPR 단백질의 대부분은 RNA 조작(RNA 상에서의 유전정보 변환; 많은 경우 C→U)의 편집부위의 지정에 작용한다. 이런 타입의 PPR 단백질은 RNA 편집효소와 상호작용할 것으로 예상되는 부가적인 모티프가 C-말단 측에 존재한다. 이러한 구조를 가진 PPR 단백질로 염기다형(polymorphism)을 도입하거나 염기다형에 기인한 질환 또는 상태를 치료할 수 있을 것으로 기대된다.
·RNA의 억제·발현을 조절하는 세포를 작제한다. 이러한 세포에는 분화, 미분화 상태를 모니터링하는 줄기세포(예를 들어 iPS 세포), 화장품 평가용 모델세포, 신약개발 메커니즘 규명 및 약리시험을 목적으로 기능성 RNA의 발현을 ON/OFF할 수 있는 세포가 포함된다.
- 특정 질환과 관련된 특정 RNA에 특이적으로 결합하는 PPR 단백질을 작제한다. 이러한 PPR 단백질을 플라스미드, 바이러스 벡터, mRNA, 정제 단백질을 이용하여 세포에 도입하고, 그 PPR 단백질이 세포 내에서 표적 RNA와 결합함으로써 질환의 원인인 RNA 기능을 변화(개선)시킬 수 있다. 기능 변화 수단은 예를 들어 결합에 의한 RNA 구조의 변화, 분해(decomposition)에 따른 녹다운, 접합(splicing)에 의한 접합 반응의 변화, 염기치환 등을 들 수 있다.
(2) 농림수산업
·농작물, 임산물, 수산물 등에 있어서, 수량이나 품질을 개선한다.
·내병성의 향상, 환경내성의 향상, 향상되었거나 새로운 기능성을 가진 생물을 육종한다.
예를 들어, 잡종 제1대(F1) 작물에 관해 PPR 단백질에 의한 미토콘드리아 RNA의 안정화나 번역제어를 사용하여 인공적으로 F1 작물을 만들어 수율이나 품질을 개선할 수 있다. PPR 단백질에 의한 RNA 조작 및 게놈 편집은 이전 기술보다 정확하고 신속하게 생물의 품종 개량, 육종(생물을 유전적으로 개량하는 것)이 가능하다. 또한, PPR 단백질에 의한 RNA 조작과 게놈 편집은 유전자 조작처럼 외래 유전자에 의해 형질을 전환하는 것이 아니라, 원래 동식물이 갖는 RNA나 게놈을 취급하는 기술이라는 점에서, 변이체의 선발이나 되돌림 교잡(backcrossing)이라는 종래의 육종방법에 가깝다고 할 수 있다. 따라서, 전 지구 차원의 식량 문제, 환경 문제에도 확실하고 신속하게 대응할 수 있다.
(3) 화학
미생물, 배양세포, 식물체, 동물체(예를 들면, 곤충)를 이용한 유용물질 생산에서 DNA, RNA의 조작에 의해 단백질 발현량을 제어한다. 이로써, 유용 물질의 생산성을 개선할 수 있다. 유용물질의 예로는 항체, 백신, 효소 등의 단백질성 물질 외에 의약품의 중간체, 향료, 색소 등의 비교적 저분자 화합물이다.
·조류나 미생물의 대사경로 변경에 의해, 바이오 연료의 생산효율을 개선한다.
형광 단백질 융합 PPR 단백질의 세포 내 분석
(모티프 설계)
CAG 서열이 6회 반복된 CAGCAGCAGCAGCAGCAG(서열번호 1)을 표적서열로 하였다. PPR 모티프는 1번, 4번, (ii)번 아미노산 서열에 따라 인식되는 염기가 결정된다. 시토신(C)을 인식하는 PPR 모티프는 1번이 발린, 4번이 아스파라긴, (ii)번이 세린을, 아데닌(A)을 인식하는 PPR 모티프는 1번이 발린, 4번이 트레오닌, (ii)번이 아스파라긴을, 구아닌(G)을 인식하는 PPR 모티프는 1번이 아스파라긴, 4번이 트레오닌, (ii)번에는 아스파라긴산을 각각 배치하였다. 또한, 우라실(U)을 인식하는 PPR 모티프에는 1번이 발린, 4번이 아스파라긴, (ii)번에는 아스파라긴산을 배치하였다.
이어, 시토신을 인식하는 1번째 모티프(도 1A, Mutated motif)의 6번째, 9번째 아미노산에 관해서는 전형적인 조합으로, 류신과 글리신(C_6L9G, PPRcag_1, 서열번호 2), 변이체로서는 류신과 글루타민산(C_6L9E, PPRcag_2, 서열번호 3), 아스파라긴과 글루타민(C_6N9Q, PPRcag_3, 서열번호 4), 아스파라긴과 글루타민산(C_ 6N9E, PPRcag_4, 서열번호 5), 아스파라긴과 리신(C_6N9K, PPRcag_5, 서열번호 6), 아스파라긴산과 글리신(C_6D9G, PPRcag_6, 서열번호 7)을 선택하였다(도 1의 B). 이들의 PPR 모티프 서열을 이용하여, 상술한 CAGCAGCAGCAGCAGCAG(서열번호 1)에 결합하도록 나열하여 PPR 유전자를 작제하였다(서열번호 11 내지 16). 또한, 각각의 PPR 모티프를 암호화하는 18개의 DNA를 효율적이고 정확하게 연결시키기 위하여, 시토신, 아데닌, 구아닌 각각에 대한 PPR 모티프에서 1, 4, 6, 9, (ii)번 이외의 아미노산을 상술한 바와 같이 높은 빈도로 발견되는 아미노산으로 선택하였다(참조: 서열번호 8 내지 9, 특허문헌 1).
(플라스미드의 작제)
PPR 유전자를 포함하는 플라스미드를 Golden Gate법을 이용하여 구축하였다.구체적으로, 순서대로 매끄럽게(seamlessly) 연결되도록 설계된 10종의 중간 벡터 Dest-a, b, c, d, e, f, g, h, i, j를 준비하고, 1개 모티프 및 2개 모티프(A, C, G, U에 대응하는 1개의 PPR 모티프, AA, AC, AG, AU, CA, CC, CG, CU, GA, GC, GG, GU, UA, UC, UG, UU 각각의 염기조합을 인식하는 2개의 PPR 모티프)의 20종의 모티프 각각을 10가지 벡터에 삽입함으로써, 200가지 파트(part)를 작제하였다.
Dest-a는 gaagacataaactccgtggtcacATACagagaccaaggtctcaGTGGtcacatacatgtcttc(서열번호 43)
Dest-b는 gaagacatATACagagaccaaggtctcaGTGGtgacataatgtcttc(서열번호 44)
Dest-c는 gaagacatcATACagagaccaaggtctcaGTGGttacatatgtcttc(서열번호 45)
Dest-d는 gaagacatacATACagagaccaaggtctcaGTGGttacaatgtcttc(서열번호 46)
Dest-e는 gaagacattacATACagagaccaaggtctcaGTGGtgacatgtcttc(서열번호 47)
Dest-f는 gaagacattgacATACagagaccaaggtctcaGTGGttaatgtcttc(서열번호 48)
Dest-g는 gaagacatgttacATACagagaccaaggtctcaGTGGtcatgtcttc(서열번호 49)
Dest-h는 gaagacatggtcacATACagagaccaaggtctcaGTGGtatgtcttc(서열번호 50)
Dest-i는 gaagacattggttacATACagagaccaaggtctcaGTGGatgtcttc (서열번호 51)
Dest-j는 gaagacatgtggtgacATACagagaccaaggtctcaGTGGtcttc (서열번호 52)
를 각각 유전자 합성기술로 작제하고, pUC57-kan에 클로닝하였다.
표적 염기서열에 따라 Dest-a 내지 Dest-j를 선택하고, Golden Gate반응으로 벡터로 클로닝하였다. 여기서 사용하는 벡터는 18개의 연결된 PPR 서열의 N-말단에 MGNSV(서열번호 53), C-말단에 ELTYNTLISGLGKAGRARDPPV(서열번호 54)의 아미노산 서열이 부가되도록 설계하였다. 올바른 크기의 유전자가 클로닝된 것을 확인하고, 클로닝된 유전자의 서열을 확인하였다.
(세포 내 발현의 검출)
동물 배양세포에서의 발현 플라스미드 pcDNA 3.1은 CMV 프로모터와 SV40 poly A 신호서열을 포함하여 이들 사이에 발현시키고자 하는 유전자를 삽입할 수 있다. 세포 내에서의 PPR 단백질 발현을 검출하기 위하여, 형광 단백질을 융합한 PPR 단백질을 발현시켜 그 형광화상(fluorescent image)에서 세포 내에서의 응집성 및 핵으로의 이행성을 분석하기로 하였다. N-말단 측에서 EGFP, 핵이행 신호서열(nuclear localization signal sequence), PPR 단백질, FLAG 에피토프 태그(epitope tag)의 순서로 융합된 단백질 유전자를 pcDNA 3.1에 삽입하였다(서열번호 17 내지 22). 또한, N-말단 측에서 mClover3, PPR 단백질, 핵이행 신호서열, FLAG 에피토프 태그의 순서로 융합한 단백질 유전자 컨트롤로서 PPR을 포함하지 않는 플라스미드도 작제하였다(서열번호 35 내지 36).
HEK293T 세포를 9mL DMEM, 1mL FBS가 함유된 10cm 디쉬에 1 x 106 cells/well의 밀도로 파종하였다. 37℃, 5% CO2 환경 하에서 2일간 배양한 후 세포를 회수하였다. 회수한 세포를 PLL 코팅된 96웰 플레이트로 웰 당 4 x 104 cells/well의 밀도로 파종하고, 37℃, 5% CO2 조건으로 1일간 배양하였다. 200ng 플라스미드 DNA, 0.6μL Fugene(등록상표)-HD(Promega, E2311), 200μL Opti-MEM을 혼합하여 전량 웰에 가한 다음, 37℃, 5% CO2 환경 하에서 하루 동안 배양하였다. 배양 후 배지를 제거하고 50μL의 PBS로 1회 세정한 다음, 1μL의 Hoechst(1mg/mL, 동인화학, 346-07951), 50μL의 PBS를 가하고, 37℃, 5% CO2 환경 하에서 10분간 방치하였다. 이후, 50μL의 PBS로 1회 세척한 후, 50μL의 PBS를 가하고 각 웰의 GFP 형광 및 Hoechst 형광 이미지를 형광 현미경 DMi8(Leica)를 사용하여 획득하였다.
그 결과를 도 2에 나타내었다. EGFP 및 핵이행 신호서열을 융합한 PPR의 세포 내 발현을 확인한 결과, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하지 않고, 핵 주위에서 강하게 응집하는 모습이 관찰되었다. 한편, PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 응집성은 낮기는 하지만, 핵에 국재하지 않았다. mClover3을 융합한 경우, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하나, 핵 안에서 응집하는 모습이 확인되었다. PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 핵에 국재하고 또한 응집성을 볼 수 없었다. 따라서, 응집성을 개선하기 위해서는 6N9E, 6N9Q, 6N9K, 6D9G 변이가 바람직하고, 또한 핵에 효율적으로 국재화시키기 위해서는 EGFP보다 mClover3을 이용하는 것이 바람직함을 알 수 있었다.
CAG 결합 PPR 단백질의 RNA 결합 분석
PPRcag_1, PPRcag_2, PPRcag_3, PPRcag_4, PPRcag_5, PPRcag_6에 대해 표적 RNA와의 결합을 확인하기 위하여, 재조합 단백질을 작제하고 결합실험을 실시하였다.
각각의 PPR 단백질의 N-말단 측에 루시퍼라제, C-말단 측에 6x 히스티딘 태그 서열을 융합한 단백질 유전자를 설계하고, 대장균 발현 플라스미드로 클로닝하였다(서열번호 29 내지 34). 또한, 대조구로서 PPR 단백질을 포함하지 않는 Nluc-Hisx6 단백질 유전자도 작제하였다(서열번호 39).
완성된 플라스미드를 대장균 Rosetta(DE3)주로 형질전환하였다. 이 대장균을 2mL의 100μg/mL 앰피실린이 함유된 LB 배지에서 37℃에서 12시간 배양하고, OD600 값이 0.5에서 0.8에 도달하였을 때 15℃ 인큐베이터로 배양액을 옮겨 30분간 정치시켰다. 그런 다음 100μL의 IPTG(최종농도 0.1mM IPTG)를 가하고, 15℃에서 16시간 동안 배양하였다. 5,000 x g, 4℃의 조건으로 10분간 원심분리하여 대장균 펠렛을 회수하고, 1.5mL의 용해용 완충용액(20mM Tris-HCl, pH 8.0, 150mM NaCl, 0.5% NP-40, 1mM MgCl2, 2mg/ml 라이소자임, 1mM PMSF, 2μL의 DNase)을 가하여 -80℃에서 20분간 동결시켰다. 25℃에서 30분간 침투하면서 세포동결 파쇄시켰다. 이어, 3,700rpm, 4℃의 조건으로 15분간 원심분리하여 가용성 PPR 단백질을 포함하는 상등액(대장균 용균체)을 회수하였다.
PPR 단백질과 RNA의 결합실험은 스트렙토아비딘 플레이트 상에서의 PPR 단백질과 비오틴화 RNA의 결합실험 방법으로 수행하였다.
표적(target) CAGx6 서열, 비표적(untargeted) CGGx6, CUGx6, CCGx6, 및 D1b(UGGUGUAUCUUGUCUUUA) 서열(서열번호 42의 8 내지 25)을 포함하는 30개 염기의 RNA(각각 순서대로, 서열번호 38 내지 42)의 5'-말단에 비오틴 수식한 RNA 프로브를 합성하였다(Grainer). 2.5pmol의 비오틴화 RNA 프로브를 스트렙토아비딘 코팅 플레이트(Cat No. 15502, Thermo Fisher)에 가하고 30분간 실온에서 반응시킨 다음, 프로브 세척용 완충용액(20mM Tris-HCl(pH 7.6), 150mM NaCl, 5mM MgCl2, 0.5% NP-40, 1mM DTT, 0.1% BSA)으로 세척하였다. 백그라운드 측정을 위해 비오틴화 RNA를 가하지 않고, 용해용 완충용액을 가한 웰도 준비하였다(-Probe). 그 후, 정지용 완충용액(20mM Tris-HCl (pH 7.6), 150mM NaCl, 5mM MgCl2, 0.5% NP-40, 1mM DTT, 1% BSA)을 가하고, 실온에서 30분간 플레이트 표면의 블로킹을 행하였다. 그런 다음, 1.5 x 108 LU/μL의 발광량을 가진 루시퍼라제 융합 PPR 단백질이 포함된 대장균 용균체를 100μL 가하고, 30분간 실온에서 결합반응을 실시하였다. 이후, 200μL의 세척용 완충용액(20mM Tris-HCl(pH 7.6), 150mM NaCl, 5mM MgCl2, 0.5% NP-40, 1mM DTT)으로 5회 세척하였다. 세척용 완충용액으로 2,500배 희석한 루시퍼라제 기질(Promega, E151A) 40μL을 웰에 가하고 5분간 반응시킨 후, 발광량을 플레이트 리더기(Perkin Elmer, Cat No. 5103-35)로 측정하였다.
그 결과를 도 3에 나타내었다. 모든 PPR에서 표적인 CAG x 6에 특이적으로 결합함을 알 수 있었다. 표적서열에 대한 결합력은 PPRcag_1과 비교할때 PPRcag_2는 같은 정도, PPRcag_3은 80% 정도, PPRcag_4는 60% 정도, PPRcag_5는 120% 정도, PPRcag_6은 130% 정도였다. PPRcag_4 이외에는 거의 변이에 의한 결합능의 변화는 나타나지 않음을 알 수 있었다.
PPR 단백질의 응집 제어
v2 모티프를 이용한 PPR 단백질(염기서열은 서열번호 61, 아미노산 서열은 서열번호 62)과 v3.2 모티프를 이용한 PPR 단백질(염기서열은 서열번호 63, 아미노산 서열은 서열번호 64) 각각을 대장균 발현계에서 제조하고 정제하여 겔여과 크로마토그래피로 분리하였다. 여기서 v2 모티프는 서열번호 2 및 서열번호 8 내지 10중 어느 하나의 서열을 가지는 PPR 모티프를 의미하고; v3.2 모티프는 N-말단으로부터 첫번째 모티프의 경우는 서열번호 4, 서열번호 58 내지 60의 서열을 가지는 PPR 모티프를 의미하며, 그 이외의 경우는 아데닌에 대해서는 서열번호 8에 있어서 15번째 아스파라긴산이 리신으로 치환된 것이고, 아데닌 이외의 염기에 대해서는 서열번호 2, 9, 10으로부터 선택되는 서열을 가지는 PPR 모티프를 의미한다.
(단백질의 발현·정제)
목적으로 하는 PPR 단백질을 암호화하는 DNA 서열을 포함하는 pE-SUMOpro Kan 플라스미드를 이용하여 대장균 Rosetta주를 형질전환시켜 37℃에서 배양한 다음, OD600 값이 0.6에 이르렀을 때 20℃로 온도를 낮추어 최종농도 0.5mM이 되도록 IPTG를 가하고, 목적하는 PPR 단백질을 SUMO 융합 단백질로 하여 대장균 내에서 발현시켰다. 하룻밤 배양 후 균체를 원심분리하여 집균하고, 용혈용 완충용액(50mM Tris-HCl pH 8.0, 500mM NaCl)에 재현탁시켰다. 초음파 파쇄를 통해 대장균을 파쇄하여 17,000g로 30분간 원심분리한 상등액 분획을 Ni-Agarose 컬럼에 적용하고 20mM 이미다졸을 함유하는 용혈용 완충용액으로 컬럼을 세척한 다음, 400mM 이미다졸을 함유하는 용혈용 완충용액으로 SUMO 단백질 융합(SUMO-fused) 목적 PPR 단백질을 용출시켰다. 용출 후 Ulp1에 의한 SUMO 단백질을 목적 PPR 단백질에서 떼어내는 동시에, 투석으로 이온교환 완충용액(50mM Tris-Hcl pH 8.0, 200mM NaCl)으로 단백질 용액을 치환하였다. 그런 다음, SP 컬럼을 이용한 양이온 교환 크로마토그래피를 실시하였다. 컬럼 공여 후 NaCl 농도를 200mM에서 1M까지 서서히 높임으로써 단백질을 용출시켰다. 목적하는 PPR 단백질을 포함하는 분획을 Superdex200 컬럼을 이용한 겔여과 크로마토그래피로 최종 정제하였다. 겔여과 완충용액(25mM HEPES pH 7.5, 200mM NaCl, 0.5mM tris(2-carboxyethyl)phosphine(TCEP))으로 평형화한 겔여과 컬럼에, 이온교환에서 용출된 목적 PPR 단백질을 공여하였다. 끝으로, 목적하는 PPR 단백질을 포함하는 분획을 농축하여 액체 질소로 동결하고, 다음 분석에 사용할 때까지 -80℃에서 보존하였다.
(겔여과 크로마토그래피)
정제한 재조합 PPR 단백질을 농도 1mg/ml로 조정하였다. 겔여과 크로마토그래피는 Superdex 200 increase 10/300 GL(GE Healthcare)를 이용하였다. 25mM HEPES pH 7.5, 200mM NaCl, 0.5mM tris(2-carboxyethyl)phosphine(TCEP)으로 평형화된 겔여과 컬럼에, 제조된 단백질을 공여하고 겔여과 컬럼에서 용출되는 용액을 280nm에서의 흡광도를 측정함으로써, 단백질의 성질을 분석하였다.
(결과)
결과를 도 4 에 나타내었다. 용출분획(Elution vol)이 적을수록 분자 크기가 크다. v2에서는 8mL 내지 10mL의 용출분획으로 용출된 반면, v3.2에서는 12mL 내지 14mL의 용출분획에 피크가 나타났다. 이러한 결과로부터, v2에서는 단백질 크기가 커지고 있다는 점에서 응집하고 있을 가능성이 시사되며, 그 응집은 v3.2에서 개선되고 있음을 알 수 있었다.
SEQUENCE LISTING <110> EditForce Inc. Kyushu University <120> Low-cohesive PPR Proteins and Use thereof <130> F20689K <150> JP2019-100553 <151> 2019-05-29 <160> 64 <170> PatentIn version 3.5 <210> 1 <211> 18 <212> DNA <213> Artificial sequence <220> <223> target sequence <400> 1 cagcagcagc agcagcag 18 <210> 2 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif <400> 2 Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile 1 5 10 15 Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr 20 25 30 Pro Ser Val 35 <210> 3 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif <400> 3 Val Thr Tyr Asn Thr Leu Ile Asp Glu Leu Cys Lys Ser Gly Lys Ile 1 5 10 15 Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr 20 25 30 Pro Ser Val 35 <210> 4 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif, 1st_U (v3.2_U) <400> 4 Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ser Gly Lys Ile 1 5 10 15 Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr 20 25 30 Pro Ser Val 35 <210> 5 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif <400> 5 Val Thr Tyr Asn Thr Asn Ile Asp Glu Leu Cys Lys Ser Gly Lys Ile 1 5 10 15 Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr 20 25 30 Pro Ser Val 35 <210> 6 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif <400> 6 Val Thr Tyr Asn Thr Asn Ile Asp Lys Leu Cys Lys Ser Gly Lys Ile 1 5 10 15 Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr 20 25 30 Pro Ser Val 35 <210> 7 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif <400> 7 Val Thr Tyr Asn Thr Asp Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile 1 5 10 15 Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr 20 25 30 Pro Ser Val 35 <210> 8 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif <400> 8 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val 1 5 10 15 Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys 20 25 30 Pro Asn Val 35 <210> 9 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif <400> 9 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val 1 5 10 15 Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys 20 25 30 Pro Asp Val 35 <210> 10 <211> 35 <212> PRT <213> Artificial sequence <220> <223> PPR motif <400> 10 Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg Leu 1 5 10 15 Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys 20 25 30 Pro Asp Val 35 <210> 11 <211> 2303 <212> DNA <213> Artificial sequence <220> <223> PPR gene <220> <221> misc_feature <222> (1894)..(1894) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1935)..(1935) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1963)..(1963) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2004)..(2004) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2032)..(2032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2073)..(2073) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2101)..(2101) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2142)..(2142) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2170)..(2170) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2211)..(2211) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2239)..(2239) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2280)..(2280) <223> n is a, c, g, t or u <400> 11 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 60 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600 atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440 atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680 gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860 atgaaggaga ggggcatcaa gcccgacgag vtyntdgcks gkakkmkgts vvtyttdgck 1920 agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980 vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040 akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100 ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160 krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220 kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280 vvtyttdgck agkvdadmkr gkd 2303 <210> 12 <211> 2302 <212> DNA <213> Artificial sequence <220> <223> PPR gene <220> <221> misc_feature <222> (1894)..(1894) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1934)..(1934) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1962)..(1962) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2003)..(2003) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2031)..(2031) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2072)..(2072) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2100)..(2100) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2141)..(2141) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2169)..(2169) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2210)..(2210) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2238)..(2238) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2279)..(2279) <223> n is a, c, g, t or u <400> 12 gtcacataca acaccctgat cgacgaactg tgcaagagcg gcaagatcga ggaggccctg 60 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600 atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440 atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680 gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860 atgaaggaga ggggcatcaa gcccgacgag vtyntdcksg kakkmkgtsv vtyttdgcka 1920 gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv 1980 tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka 2040 kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn 2100 tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk 2160 rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck 2220 agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv 2280 vtyttdgcka gkvdadmkrg kd 2302 <210> 13 <211> 2303 <212> DNA <213> Artificial sequence <220> <223> PPR gene <220> <221> misc_feature <222> (1894)..(1894) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1896)..(1896) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1935)..(1935) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1963)..(1963) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2004)..(2004) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2032)..(2032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2073)..(2073) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2101)..(2101) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2142)..(2142) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2170)..(2170) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2211)..(2211) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2239)..(2239) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2280)..(2280) <223> n is a, c, g, t or u <400> 13 gtcacataca acaccaacat cgaccagctg tgcaagagcg gcaagatcga ggaggccctg 60 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600 atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440 atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680 gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860 atgaaggaga ggggcatcaa gcccgacgag vtyntndcks gkakkmkgts vvtyttdgck 1920 agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980 vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040 akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100 ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160 krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220 kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280 vvtyttdgck agkvdadmkr gkd 2303 <210> 14 <211> 2303 <212> DNA <213> Artificial sequence <220> <223> PPR gene <220> <221> misc_feature <222> (1894)..(1894) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1896)..(1896) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1935)..(1935) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1963)..(1963) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2004)..(2004) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2032)..(2032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2073)..(2073) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2101)..(2101) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2142)..(2142) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2170)..(2170) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2211)..(2211) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2239)..(2239) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2280)..(2280) <223> n is a, c, g, t or u <400> 14 gtcacataca acaccaacat cgacgaactg tgcaagagcg gcaagatcga ggaggccctg 60 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600 atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440 atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680 gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860 atgaaggaga ggggcatcaa gcccgacgag vtyntndcks gkakkmkgts vvtyttdgck 1920 agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980 vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040 akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100 ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160 krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220 kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280 vvtyttdgck agkvdadmkr gkd 2303 <210> 15 <211> 2304 <212> DNA <213> Artificial sequence <220> <223> PPR gene <220> <221> misc_feature <222> (1894)..(1894) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1896)..(1896) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1936)..(1936) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1964)..(1964) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2005)..(2005) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2033)..(2033) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2074)..(2074) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2102)..(2102) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2143)..(2143) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2171)..(2171) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2212)..(2212) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2240)..(2240) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2281)..(2281) <223> n is a, c, g, t or u <400> 15 gtcacataca acaccaacat cgacaaactg tgcaagagcg gcaagatcga ggaggccctg 60 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600 atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440 atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680 gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860 atgaaggaga ggggcatcaa gcccgacgag vtyntndkck sgkakkmkgt svvtyttdgc 1920 kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks gkakkmkgts 1980 vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg 2040 kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt 2100 yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad 2160 mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 2220 ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 2280 nvvtyttdgc kagkvdadmk rgkd 2304 <210> 16 <211> 2304 <212> DNA <213> Artificial sequence <220> <223> PPR gene <220> <221> misc_feature <222> (1894)..(1894) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1936)..(1936) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1964)..(1964) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2005)..(2005) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2033)..(2033) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2074)..(2074) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2102)..(2102) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2143)..(2143) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2171)..(2171) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2212)..(2212) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2240)..(2240) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2281)..(2281) <223> n is a, c, g, t or u <400> 16 gtcacataca acaccgatat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 60 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600 atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440 atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680 gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860 atgaaggaga ggggcatcaa gcccgacgag vtyntddgck sgkakkmkgt svvtyttdgc 1920 kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks gkakkmkgts 1980 vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg 2040 kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt 2100 yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad 2160 mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 2220 ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 2280 nvvtyttdgc kagkvdadmk rgkd 2304 <210> 17 <211> 3481 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2858)..(2858) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2914)..(2914) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2926)..(2926) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2934)..(2934) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2939)..(2939) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2941)..(2941) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2944)..(2944) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2952)..(2952) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2956)..(2956) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2960)..(2960) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2969)..(2969) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2976)..(2976) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2986)..(2986) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3023)..(3023) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3029)..(3029) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3070)..(3070) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3098)..(3098) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3139)..(3139) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3167)..(3167) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3208)..(3208) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3236)..(3236) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3277)..(3277) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3305)..(3305) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3346)..(3346) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3374)..(3374) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3415)..(3415) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3441)..(3441) <223> n is a, c, g, t or u <400> 17 atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720 aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780 atgggaaact ccgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 840 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200 atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500 atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620 gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680 gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920 atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980 tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460 atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700 ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760 gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820 gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880 vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940 nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000 dykkkkrkvs hgsggsgggh mgnsvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd 3060 akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120 dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180 gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240 ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300 vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360 dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420 tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480 r 3481 <210> 18 <211> 3480 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2858)..(2858) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2914)..(2914) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2926)..(2926) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2934)..(2934) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2939)..(2939) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2941)..(2941) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2944)..(2944) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2952)..(2952) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2956)..(2956) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2960)..(2960) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2969)..(2969) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2976)..(2976) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2986)..(2986) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3023)..(3023) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3029)..(3029) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3069)..(3069) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3097)..(3097) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3138)..(3138) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3166)..(3166) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3207)..(3207) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3235)..(3235) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3276)..(3276) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3304)..(3304) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3345)..(3345) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3373)..(3373) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3414)..(3414) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3440)..(3440) <223> n is a, c, g, t or u <400> 18 atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720 aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780 atgggaaact ccgtggtcac atacaacacc ctgatcgacg aactgtgcaa gagcggcaag 840 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200 atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500 atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620 gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680 gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920 atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980 tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460 atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700 ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760 gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820 gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880 vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940 nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000 dykkkkrkvs hgsggsgggh mgnsvvtynt dcksgkakkm kgtsvvtytt dgckagdvda 3060 kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk gtsvvtyttd 3120 gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc ksgkakkmkg 3180 tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 3240 sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 3300 vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 3360 admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3420 dgckagkvda dmkrgkdtyn tsggkagrar dvssgdykdh dgdykdhddy kddddkmagr 3480 <210> 19 <211> 3481 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2858)..(2858) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2914)..(2914) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2926)..(2926) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2934)..(2934) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2939)..(2939) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2941)..(2941) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2944)..(2944) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2952)..(2952) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2956)..(2956) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2960)..(2960) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2969)..(2969) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2976)..(2976) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2986)..(2986) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3023)..(3023) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3029)..(3029) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3031)..(3031) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3070)..(3070) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3098)..(3098) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3139)..(3139) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3167)..(3167) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3208)..(3208) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3236)..(3236) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3277)..(3277) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3305)..(3305) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3346)..(3346) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3374)..(3374) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3415)..(3415) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3441)..(3441) <223> n is a, c, g, t or u <400> 19 atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720 aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780 atgggaaact ccgtggtcac atacaacacc aacatcgacc agctgtgcaa gagcggcaag 840 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200 atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500 atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620 gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680 gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920 atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980 tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460 atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700 ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760 gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820 gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880 vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940 nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000 dykkkkrkvs hgsggsgggh mgnsvvtynt ndcksgkakk mkgtsvvtyt tdgckagdvd 3060 akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120 dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180 gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240 ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300 vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360 dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420 tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480 r 3481 <210> 20 <211> 3481 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2858)..(2858) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2914)..(2914) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2926)..(2926) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2934)..(2934) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2939)..(2939) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2941)..(2941) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2944)..(2944) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2952)..(2952) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2956)..(2956) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2960)..(2960) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2969)..(2969) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2976)..(2976) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2986)..(2986) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3023)..(3023) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3029)..(3029) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3031)..(3031) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3070)..(3070) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3098)..(3098) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3139)..(3139) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3167)..(3167) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3208)..(3208) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3236)..(3236) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3277)..(3277) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3305)..(3305) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3346)..(3346) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3374)..(3374) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3415)..(3415) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3441)..(3441) <223> n is a, c, g, t or u <400> 20 atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720 aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780 atgggaaact ccgtggtcac atacaacacc aacatcgacg aactgtgcaa gagcggcaag 840 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200 atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500 atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620 gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680 gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920 atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980 tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460 atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700 ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760 gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820 gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880 vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940 nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000 dykkkkrkvs hgsggsgggh mgnsvvtynt ndcksgkakk mkgtsvvtyt tdgckagdvd 3060 akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120 dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180 gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240 ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300 vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360 dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420 tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480 r 3481 <210> 21 <211> 3482 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2858)..(2858) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2914)..(2914) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2926)..(2926) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2934)..(2934) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2939)..(2939) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2941)..(2941) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2944)..(2944) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2952)..(2952) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2956)..(2956) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2960)..(2960) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2969)..(2969) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2976)..(2976) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2986)..(2986) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3023)..(3023) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3029)..(3029) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3031)..(3031) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3071)..(3071) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3099)..(3099) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3140)..(3140) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3168)..(3168) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3209)..(3209) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3237)..(3237) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3278)..(3278) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3306)..(3306) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3347)..(3347) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3375)..(3375) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3416)..(3416) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3442)..(3442) <223> n is a, c, g, t or u <400> 21 atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720 aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780 atgggaaact ccgtggtcac atacaacacc aacatcgaca aactgtgcaa gagcggcaag 840 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200 atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500 atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620 gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680 gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920 atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980 tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460 atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700 ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760 gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820 gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880 vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940 nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000 dykkkkrkvs hgsggsgggh mgnsvvtynt ndkcksgkak kmkgtsvvty ttdgckagdv 3060 dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3120 tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3180 kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3240 cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3300 dvvtyntdgc ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk 3360 vdadmkrgkd vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty 3420 ttdgckagkv dadmkrgkdt yntsggkagr ardvssgdyk dhdgdykdhd dykddddkma 3480 gr 3482 <210> 22 <211> 3482 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2858)..(2858) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2914)..(2914) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2926)..(2926) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2934)..(2934) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2939)..(2939) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2941)..(2941) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2944)..(2944) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2952)..(2952) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2956)..(2956) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2960)..(2960) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2969)..(2969) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2976)..(2976) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2986)..(2986) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3023)..(3023) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3029)..(3029) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3071)..(3071) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3099)..(3099) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3140)..(3140) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3168)..(3168) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3209)..(3209) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3237)..(3237) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3278)..(3278) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3306)..(3306) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3347)..(3347) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3375)..(3375) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3416)..(3416) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3442)..(3442) <223> n is a, c, g, t or u <400> 22 atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720 aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780 atgggaaact ccgtggtcac atacaacacc gatatcgacg gcctgtgcaa gagcggcaag 840 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200 atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500 atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620 gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680 gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740 gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920 atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980 tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160 gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280 ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460 atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580 gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700 ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760 gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820 gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880 vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940 nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000 dykkkkrkvs hgsggsgggh mgnsvvtynt ddgcksgkak kmkgtsvvty ttdgckagdv 3060 dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3120 tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3180 kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3240 cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3300 dvvtyntdgc ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk 3360 vdadmkrgkd vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty 3420 ttdgckagkv dadmkrgkdt yntsggkagr ardvssgdyk dhdgdykdhd dykddddkma 3480 gr 3482 <210> 23 <211> 3551 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2912)..(2912) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2982)..(2982) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2990)..(2990) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2995)..(2996) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3007)..(3007) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3011)..(3011) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3015)..(3015) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3025)..(3025) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3032)..(3032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3042)..(3042) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3066)..(3066) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3072)..(3072) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3113)..(3113) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3141)..(3141) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3182)..(3182) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3210)..(3210) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3251)..(3251) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3279)..(3279) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3320)..(3320) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3348)..(3348) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3389)..(3389) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3417)..(3417) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3458)..(3458) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3484)..(3484) <223> n is a, c, g, t or u <400> 23 atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60 ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120 acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180 cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240 atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300 atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360 acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420 ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480 aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540 ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600 aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660 atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720 aagagccggc tccatatggg aaactccgtg gtcacataca acaccctgat cgacggcctg 780 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380 gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220 gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400 atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640 ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700 gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760 gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820 aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880 aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940 gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000 ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060 srhmgnsvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120 gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180 knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240 dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300 tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360 kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420 cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480 dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540 kmakkkrkvg r 3551 <210> 24 <211> 3550 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2912)..(2912) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2982)..(2982) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2990)..(2990) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2995)..(2996) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3007)..(3007) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3011)..(3011) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3015)..(3015) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3025)..(3025) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3032)..(3032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3042)..(3042) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3066)..(3066) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3072)..(3072) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3112)..(3112) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3140)..(3140) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3181)..(3181) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3209)..(3209) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3250)..(3250) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3278)..(3278) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3319)..(3319) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3347)..(3347) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3388)..(3388) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3416)..(3416) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3457)..(3457) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3483)..(3483) <223> n is a, c, g, t or u <400> 24 atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60 ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120 acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180 cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240 atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300 atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360 acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420 ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480 aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540 ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600 aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660 atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720 aagagccggc tccatatggg aaactccgtg gtcacataca acaccctgat cgacgaactg 780 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380 gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220 gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400 atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640 ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700 gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760 gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820 aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880 aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940 gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000 ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060 srhmgnsvvt yntdcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 3120 ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 3180 nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd 3240 akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3300 dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3360 gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3420 ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3480 tyntsggkag rardvsskkk rkvdkkkrkv dkkkrkvgsd ykdhdgdykd hddykddddk 3540 makkkrkvgr 3550 <210> 25 <211> 3551 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2912)..(2912) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2982)..(2982) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2990)..(2990) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2995)..(2996) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3007)..(3007) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3011)..(3011) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3015)..(3015) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3025)..(3025) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3032)..(3032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3042)..(3042) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3066)..(3066) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3072)..(3072) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3074)..(3074) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3113)..(3113) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3141)..(3141) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3182)..(3182) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3210)..(3210) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3251)..(3251) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3279)..(3279) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3320)..(3320) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3348)..(3348) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3389)..(3389) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3417)..(3417) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3458)..(3458) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3484)..(3484) <223> n is a, c, g, t or u <400> 25 atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60 ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120 acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180 cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240 atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300 atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360 acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420 ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480 aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540 ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600 aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660 atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720 aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgaccagctg 780 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380 gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220 gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400 atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640 ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700 gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760 gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820 aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880 aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940 gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000 ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060 srhmgnsvvt yntndcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120 gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180 knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240 dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300 tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360 kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420 cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480 dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540 kmakkkrkvg r 3551 <210> 26 <211> 3551 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2912)..(2912) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2982)..(2982) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2990)..(2990) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2995)..(2996) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3007)..(3007) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3011)..(3011) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3015)..(3015) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3025)..(3025) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3032)..(3032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3042)..(3042) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3066)..(3066) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3072)..(3072) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3074)..(3074) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3113)..(3113) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3141)..(3141) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3182)..(3182) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3210)..(3210) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3251)..(3251) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3279)..(3279) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3320)..(3320) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3348)..(3348) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3389)..(3389) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3417)..(3417) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3458)..(3458) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3484)..(3484) <223> n is a, c, g, t or u <400> 26 atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60 ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120 acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180 cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240 atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300 atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360 acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420 ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480 aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540 ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600 aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660 atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720 aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgacgaactg 780 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380 gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220 gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400 atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640 ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700 gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760 gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820 aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880 aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940 gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000 ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060 srhmgnsvvt yntndcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120 gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180 knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240 dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300 tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360 kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420 cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480 dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540 kmakkkrkvg r 3551 <210> 27 <211> 3552 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2912)..(2912) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2982)..(2982) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2990)..(2990) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2995)..(2996) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3007)..(3007) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3011)..(3011) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3015)..(3015) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3025)..(3025) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3032)..(3032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3042)..(3042) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3066)..(3066) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3072)..(3072) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3074)..(3074) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3114)..(3114) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3142)..(3142) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3183)..(3183) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3211)..(3211) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3252)..(3252) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3280)..(3280) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3321)..(3321) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3349)..(3349) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3390)..(3390) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3418)..(3418) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3459)..(3459) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3485)..(3485) <223> n is a, c, g, t or u <400> 27 atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60 ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120 acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180 cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240 atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300 atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360 acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420 ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480 aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540 ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600 aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660 atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720 aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgacaaactg 780 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380 gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220 gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400 atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640 ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700 gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760 gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820 aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880 aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940 gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000 ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060 srhmgnsvvt yntndkcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3120 dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3180 vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3240 vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty 3300 ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk 3360 mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd 3420 gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg 3480 kdtyntsggk agrardvssk kkrkvdkkkr kvdkkkrkvg sdykdhdgdy kdhddykddd 3540 dkmakkkrkv gr 3552 <210> 28 <211> 3552 <212> DNA <213> Artificial sequence <220> <223> PPR vector <220> <221> misc_feature <222> (2912)..(2912) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2982)..(2982) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2990)..(2990) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2995)..(2996) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3007)..(3007) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3011)..(3011) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3015)..(3015) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3025)..(3025) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3032)..(3032) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3042)..(3042) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3066)..(3066) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3072)..(3072) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3114)..(3114) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3142)..(3142) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3183)..(3183) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3211)..(3211) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3252)..(3252) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3280)..(3280) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3321)..(3321) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3349)..(3349) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3390)..(3390) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3418)..(3418) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3459)..(3459) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3485)..(3485) <223> n is a, c, g, t or u <400> 28 atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60 ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120 acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180 cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240 atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300 atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360 acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420 ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480 aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540 ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600 aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660 atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720 aagagccggc tccatatggg aaactccgtg gtcacataca acaccgatat cgacggcctg 780 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960 gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140 atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380 gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440 aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500 ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560 atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620 tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680 atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740 atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800 gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860 gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920 ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980 atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040 tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100 atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160 gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220 gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280 gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340 ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400 atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460 tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520 gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580 gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640 ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700 gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760 gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820 aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880 aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940 gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000 ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060 srhmgnsvvt yntddgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3120 dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3180 vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3240 vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty 3300 ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk 3360 mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd 3420 gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg 3480 kdtyntsggk agrardvssk kkrkvdkkkr kvdkkkrkvg sdykdhdgdy kdhddykddd 3540 dkmakkkrkv gr 3552 <210> 29 <211> 3189 <212> DNA <213> Artificial sequence <220> <223> NL_PPRcag_1 <220> <221> misc_feature <222> (2626)..(2626) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2634)..(2634) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2644)..(2644) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2678)..(2678) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2698)..(2698) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2700)..(2700) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2704)..(2704) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2711)..(2711) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2740)..(2740) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2746)..(2746) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2787)..(2787) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2815)..(2815) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2856)..(2856) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2884)..(2884) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2953)..(2953) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2994)..(2994) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3022)..(3022) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3063)..(3063) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3091)..(3091) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3132)..(3132) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3158)..(3158) <223> n is a, c, g, t or u <400> 29 atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60 aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120 agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180 cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240 ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300 ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360 atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420 atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480 ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540 cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780 agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200 gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260 agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320 cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380 gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440 tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500 ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620 gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740 cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040 agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460 gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520 gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580 gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640 vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700 kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntdgc ksgkakkmkg 2760 tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820 sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880 vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940 admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000 dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060 vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120 vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180 ghhhhhhgr 3189 <210> 30 <211> 3188 <212> DNA <213> Artificial sequence <220> <223> NL_PPRcag_2 <220> <221> misc_feature <222> (2626)..(2626) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2634)..(2634) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2644)..(2644) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2678)..(2678) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2698)..(2698) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2700)..(2700) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2704)..(2704) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2711)..(2711) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2740)..(2740) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2746)..(2746) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2786)..(2786) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2814)..(2814) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2855)..(2855) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2883)..(2883) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2924)..(2924) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2952)..(2952) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2993)..(2993) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3021)..(3021) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3062)..(3062) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3090)..(3090) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3131)..(3131) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3157)..(3157) <223> n is a, c, g, t or u <400> 30 atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60 aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120 agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180 cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240 ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300 ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360 atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420 atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480 ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540 cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600 tacaacaccc tgatcgacga actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780 agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200 gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260 agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320 cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380 gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440 tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500 ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620 gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740 cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040 agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460 gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520 gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580 gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640 vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700 kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntdck sgkakkmkgt 2760 svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks 2820 gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv 2880 tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda 2940 dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3000 gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3060 knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3120 dakmrskgvk nvvtyttdgc kagkvdadmk rgkdtyntsg gkagrardvs sgsggsgggg 3180 hhhhhhgr 3188 <210> 31 <211> 3189 <212> DNA <213> Artificial sequence <220> <223> NL_PPRcag_3 <220> <221> misc_feature <222> (2626)..(2626) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2634)..(2634) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2644)..(2644) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2678)..(2678) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2698)..(2698) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2700)..(2700) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2704)..(2704) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2711)..(2711) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2740)..(2740) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2746)..(2746) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2748)..(2748) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2787)..(2787) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2815)..(2815) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2856)..(2856) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2884)..(2884) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2953)..(2953) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2994)..(2994) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3022)..(3022) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3063)..(3063) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3091)..(3091) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3132)..(3132) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3158)..(3158) <223> n is a, c, g, t or u <400> 31 atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60 aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120 agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180 cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240 ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300 ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360 atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420 atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480 ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540 cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600 tacaacacca acatcgacca gctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780 agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200 gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260 agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320 cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380 gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440 tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500 ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620 gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740 cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040 agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460 gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520 gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580 gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640 vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700 kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndc ksgkakkmkg 2760 tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820 sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880 vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940 admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000 dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060 vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120 vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180 ghhhhhhgr 3189 <210> 32 <211> 3189 <212> DNA <213> Artificial sequence <220> <223> NL_PPRcag_4 <220> <221> misc_feature <222> (2626)..(2626) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2634)..(2634) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2644)..(2644) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2678)..(2678) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2698)..(2698) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2700)..(2700) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2704)..(2704) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2711)..(2711) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2740)..(2740) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2746)..(2746) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2748)..(2748) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2787)..(2787) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2815)..(2815) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2856)..(2856) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2884)..(2884) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2925)..(2925) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2953)..(2953) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2994)..(2994) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3022)..(3022) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3063)..(3063) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3091)..(3091) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3132)..(3132) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3158)..(3158) <223> n is a, c, g, t or u <400> 32 atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60 aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120 agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180 cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240 ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300 ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360 atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420 atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480 ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540 cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600 tacaacacca acatcgacga actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780 agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200 gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260 agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320 cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380 gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440 tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500 ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620 gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740 cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040 agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460 gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520 gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580 gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640 vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700 kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndc ksgkakkmkg 2760 tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820 sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880 vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940 admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000 dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060 vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120 vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180 ghhhhhhgr 3189 <210> 33 <211> 3190 <212> DNA <213> Artificial sequence <220> <223> NL_PPRcag_5 <220> <221> misc_feature <222> (2626)..(2626) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2634)..(2634) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2644)..(2644) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2678)..(2678) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2698)..(2698) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2700)..(2700) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2704)..(2704) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2711)..(2711) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2740)..(2740) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2746)..(2746) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2748)..(2748) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2788)..(2788) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2816)..(2816) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2857)..(2857) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2885)..(2885) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2926)..(2926) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2954)..(2954) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2995)..(2995) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3023)..(3023) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3064)..(3064) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3092)..(3092) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3133)..(3133) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3159)..(3159) <223> n is a, c, g, t or u <400> 33 atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60 aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120 agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180 cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240 ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300 ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360 atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420 atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480 ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540 cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600 tacaacacca acatcgacaa actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780 agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200 gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260 agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320 cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380 gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440 tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500 ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620 gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740 cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040 agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460 gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520 gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580 gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640 vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700 kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndk cksgkakkmk 2760 gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 2820 ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 2880 vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 2940 dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3000 tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk 3060 gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag 3120 dvdakmrskg vknvvtyttd gckagkvdad mkrgkdtynt sggkagrard vssgsggsgg 3180 gghhhhhhgr 3190 <210> 34 <211> 3190 <212> DNA <213> Artificial sequence <220> <223> NL_PPRcag_1 <220> <221> misc_feature <222> (2626)..(2626) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2634)..(2634) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2644)..(2644) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2678)..(2678) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2698)..(2698) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2700)..(2700) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2704)..(2704) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2711)..(2711) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2740)..(2740) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2746)..(2746) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2788)..(2788) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2816)..(2816) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2857)..(2857) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2885)..(2885) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2926)..(2926) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2954)..(2954) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2995)..(2995) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3023)..(3023) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3064)..(3064) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3092)..(3092) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3133)..(3133) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (3159)..(3159) <223> n is a, c, g, t or u <400> 34 atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60 aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120 agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180 cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240 ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300 ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360 atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420 atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480 ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540 cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600 tacaacaccg atatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780 agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200 gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260 agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320 cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380 gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440 tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500 ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620 gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740 cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040 agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100 gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160 cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400 gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460 gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520 gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580 gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640 vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700 kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntddg cksgkakkmk 2760 gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 2820 ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 2880 vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 2940 dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3000 tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk 3060 gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag 3120 dvdakmrskg vknvvtyttd gckagkvdad mkrgkdtynt sggkagrard vssgsggsgg 3180 gghhhhhhgr 3190 <210> 35 <211> 1066 <212> DNA <213> Artificial sequence <220> <223> GFPnls <220> <221> misc_feature <222> (878)..(878) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (934)..(934) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (946)..(946) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (954)..(954) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (959)..(959) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (961)..(961) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (964)..(964) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (972)..(972) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (976)..(976) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (980)..(980) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (989)..(989) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (996)..(996) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1006)..(1006) <223> n is a, c, g, t or u <400> 35 atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720 aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg aggtagcggg 780 gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 840 gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 900 vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 960 nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 1020 dykkkkrkvs hgsggsgggs gdykdhdgdy kdhddykddd dkmagr 1066 <210> 36 <211> 1170 <212> DNA <213> Artificial sequence <220> <223> mClover3nls <220> <221> misc_feature <222> (959)..(959) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (972)..(972) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1029)..(1029) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1037)..(1037) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1042)..(1043) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1054)..(1054) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1058)..(1058) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1062)..(1062) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1072)..(1072) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1079)..(1079) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (1089)..(1089) <223> n is a, c, g, t or u <400> 36 atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60 ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120 acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180 cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240 atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300 atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360 acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420 ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480 aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540 ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600 aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660 atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720 aagagccggc tccatatggg atccggcgga ctcagtagcc ccaagaagaa acgcaaagtc 780 gaggatccaa agaagaaaag gaaggttgaa gaccccaaga aaaagaggaa ggtgggttcc 840 gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 900 gataagatgg ccccaaagaa gaagcggaag gtcggacgct agmagvskgt gvvvdgdvng 960 hksvrgggda tngktkcttg kvwtvttgyg vacsrydhmk hdksamgyvr tskddgtykt 1020 ravkgdtvnr kgdkdgnghk ynnshyvyta dkknckankr hnvdgsvadh yntgdgvdnh 1080 yshskskdnk rdhmvvtaag thgmdyksrh mgsggsskkk rkvdkkkrkv dkkkrkvgsd 1140 ykdhdgdykd hddykddddk makkkrkvgr 1170 <210> 37 <211> 862 <212> DNA <213> Artificial sequence <220> <223> NL control <220> <221> misc_feature <222> (674)..(674) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (730)..(730) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (742)..(742) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (750)..(750) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (755)..(755) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (757)..(757) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (760)..(760) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (768)..(768) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (772)..(772) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (776)..(776) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (785)..(785) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (792)..(792) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (802)..(802) <223> n is a, c, g, t or u <400> 37 atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60 aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120 agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180 cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240 ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300 ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360 atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420 atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480 ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540 cccagaggat ccggcggagg cggctccagc cggctccata tgggatccgg cggactcagt 600 agcggctccg gcggcagcgg gggaggcggg catcatcacc atcaccacgg acgctagmag 660 vskgtgvvvd gdvnghksvs gggdatygkt kcttgkvwtv tttygvcsry dhmkhdksam 720 gyvrtkddgn yktravkgdt vnrkgdkdgn ghkynynshn vymadkkngk vnkrhndgsv 780 adhyntgdgv dnhystsask dnkrdhmvvt aagtgmdykk kkrkvshgsg gsgggsgdyk 840 dhdgdykdhd dykddddkma gr 862 <210> 38 <211> 30 <212> DNA <213> Artificial sequence <220> <223> RNA probe <400> 38 gacaugccag cagcagcagc agcaggacug 30 <210> 39 <211> 30 <212> DNA <213> Artificial sequence <220> <223> RNA probe <400> 39 gacaugccgg cggcggcggc ggcgggacug 30 <210> 40 <211> 30 <212> DNA <213> Artificial sequence <220> <223> RNA probe <400> 40 gacacugcug cugcugcugc ugcugaugca 30 <210> 41 <211> 30 <212> DNA <213> Artificial sequence <220> <223> RNA probe <400> 41 gacaccgccg ccgccgccgc cgccggacug 30 <210> 42 <211> 30 <212> DNA <213> Artificial sequence <220> <223> RNA probe <400> 42 gacaugcugg uguaucuugu cuuuagacug 30 <210> 43 <211> 63 <212> DNA <213> Artificial sequence <220> <223> Dest-a <400> 43 gaagacataa actccgtggt cacatacaga gaccaaggtc tcagtggtca catacatgtc 60 ttc 63 <210> 44 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Dest-b <400> 44 gaagacatat acagagacca aggtctcagt ggtgacataa tgtcttc 47 <210> 45 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Dest-c <400> 45 gaagacatca tacagagacc aaggtctcag tggttacata tgtcttc 47 <210> 46 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Dest-d <400> 46 gaagacatac atacagagac caaggtctca gtggttacaa tgtcttc 47 <210> 47 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Dest-e <400> 47 gaagacatta catacagaga ccaaggtctc agtggtgaca tgtcttc 47 <210> 48 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Dest-f <400> 48 gaagacattg acatacagag accaaggtct cagtggttaa tgtcttc 47 <210> 49 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Dest-g <400> 49 gaagacatgt tacatacaga gaccaaggtc tcagtggtca tgtcttc 47 <210> 50 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Dest-h <400> 50 gaagacatgg tcacatacag agaccaaggt ctcagtggta tgtcttc 47 <210> 51 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Dest-i <400> 51 gaagacattg gttacataca gagaccaagg tctcagtgga tgtcttc 47 <210> 52 <211> 45 <212> DNA <213> Artificial sequence <220> <223> Dest-j <400> 52 gaagacatgt ggtgacatac agagaccaag gtctcagtgg tcttc 45 <210> 53 <211> 5 <212> PRT <213> Artificial sequence <220> <223> signal sequence <400> 53 Met Gly Asn Ser Val 1 5 <210> 54 <211> 22 <212> PRT <213> Artificial sequence <220> <223> signal sequence <400> 54 Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly Leu Gly Lys Ala Gly Arg 1 5 10 15 Ala Arg Asp Pro Pro Val 20 <210> 55 <211> 4 <212> PRT <213> Artificial sequence <220> <223> signal sequence <400> 55 Lys Asp Glu Leu 1 <210> 56 <211> 4 <212> PRT <213> Artificial sequence <220> <223> signal sequence <400> 56 Lys Glu Glu Leu 1 <210> 57 <211> 19 <212> PRT <213> Artificial sequence <220> <223> signal sequence <400> 57 Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly 1 5 10 15 Ala His Ser <210> 58 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> 1st_A (v3.2_A) <400> 58 Val Thr Tyr Thr Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Lys Val 1 5 10 15 Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys 20 25 30 Pro Asn Val 35 <210> 59 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> 1st_G (v3.2_G) <400> 59 Val Thr Tyr Thr Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Lys Val 1 5 10 15 Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys 20 25 30 Pro Asp Val 35 <210> 60 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> 1st_U (v3.2_U) <400> 60 Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Arg Leu 1 5 10 15 Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys 20 25 30 Pro Asp Val 35 <210> 61 <211> 2271 <212> DNA <213> Artificial Sequence <220> <223> v2_polypucleotide <400> 61 atgggtcatc accatcatca tcacgggtcc ctgcaggact cagaagtcaa tcaagaagct 60 aagccagagg tcaagccaga agtcaagcct gagactcaca tcaatttaaa ggtgtccgat 120 ggatcttcag agatcttctt caagatcaaa aagaccactc ctttaagaag gctgatggaa 180 gcgttcgcta aaagacaggg taaggaaatg gactccttaa gattcttgta cgacggtatt 240 agaattcaag ctgatcaggc ccctgaagat ttggacatgg aggataacga tattattgag 300 gctcaccgcg aacagattgg aggtatggga aactccgtgg tcacatacaa caccctgatc 360 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 420 gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 480 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 540 cccaacgtgg tgacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 600 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 660 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 720 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg ttacatacac cacactgatc 780 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 840 agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 900 gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 960 cccgacgtgg ttacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 1020 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtcaca 1080 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1140 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tgacatacac caccctgatc 1200 gacggcctgt gcaaggccgg caaagtggac gaggccctgg agctgttcga cgagatgaag 1260 gagaggggca tcaagcccga cgtggtcaca tacaacaccc tgatcgacgg cctgtgcaag 1320 agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1380 cccagcgtgg ttacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1440 gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtcaca 1500 tacaccaccc tgatcgacgg cctgtgcaag gccggcaagg tggatgaggc cctggagctg 1560 ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1620 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1680 gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 1740 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1800 cccaacgtgg ttacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 1860 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1920 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1980 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tgacatacac cacactgatc 2040 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2100 agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 2160 gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2220 cccgacgagc tgacctacaa caccctgatc agcggcctgg gcaaggccgg c 2271 <210> 62 <211> 757 <212> PRT <213> Artificial Sequence <220> <223> v2_protein <400> 62 Met Gly His His His His His His Gly Ser Leu Gln Asp Ser Glu Val 1 5 10 15 Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr 20 25 30 His Ile Asn Leu Lys Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys 35 40 45 Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys 50 55 60 Arg Gln Gly Lys Glu Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile 65 70 75 80 Arg Ile Gln Ala Asp Gln Ala Pro Glu Asp Leu Asp Met Glu Asp Asn 85 90 95 Asp Ile Ile Glu Ala His Arg Glu Gln Ile Gly Gly Met Gly Asn Ser 100 105 110 Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys 115 120 125 Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile 130 135 140 Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys 145 150 155 160 Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser 165 170 175 Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly 180 185 190 Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu 195 200 205 Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu 210 215 220 Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu 225 230 235 240 Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr 245 250 255 Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala 260 265 270 Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val 275 280 285 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val 290 295 300 Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys 305 310 315 320 Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser 325 330 335 Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys 340 345 350 Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu 355 360 365 Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met 370 375 380 Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile 385 390 395 400 Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe 405 410 415 Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn 420 425 430 Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu 435 440 445 Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val 450 455 460 Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp 465 470 475 480 Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro 485 490 495 Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly 500 505 510 Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly 515 520 525 Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys 530 535 540 Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu 545 550 555 560 Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp 565 570 575 Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys 580 585 590 Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr 595 600 605 Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu 610 615 620 Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr 625 630 635 640 Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu 645 650 655 Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser 660 665 670 Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp 675 680 685 Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val 690 695 700 Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys 705 710 715 720 Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu 725 730 735 Arg Gly Ile Lys Pro Asp Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly 740 745 750 Leu Gly Lys Ala Gly 755 <210> 63 <211> 2274 <212> DNA <213> Artificial Sequence <220> <223> v3.2_polypucleotide <400> 63 atgggtcatc accatcatca tcacgggtcc ctgcaggact cagaagtcaa tcaagaagct 60 aagccagagg tcaagccaga agtcaagcct gagactcaca tcaatttaaa ggtgtccgat 120 ggatcttcag agatcttctt caagatcaaa aagaccactc ctttaagaag gctgatggaa 180 gcgttcgcta aaagacaggg taaggaaatg gactccttaa gattcttgta cgacggtatt 240 agaattcaag ctgatcaggc ccctgaagat ttggacatgg aggataacga tattattgag 300 gctcaccgcg aacagattgg aggtatggga aactccgtgg tcacatacaa caccaacatc 360 gaccagctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 420 gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 480 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 540 cccaacgtgg tgacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 600 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 660 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 720 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg ttacatacac cacactgatc 780 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 840 agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 900 gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 960 cccgacgtgg ttacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 1020 gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtcaca 1080 tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1140 ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tgacatacac caccctgatc 1200 gacggcctgt gcaaggccgg caaagtggac gaggccctgg agctgttcga cgagatgaag 1260 gagaggggca tcaagcccga cgtggtcaca tacaacaccc tgatcgacgg cctgtgcaag 1320 agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1380 cccagcgtgg ttacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1440 gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtcaca 1500 tacaccaccc tgatcgacgg cctgtgcaag gccggcaagg tggatgaggc cctggagctg 1560 ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1620 gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1680 gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 1740 gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1800 cccaacgtgg ttacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 1860 gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1920 tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1980 ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tgacatacac cacactgatc 2040 gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2100 agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 2160 gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2220 cccgacgagg agctgaccta caacaccctg atcagcggcc tgggcaaggc cggc 2274 <210> 64 <211> 757 <212> PRT <213> Artificial Sequence <220> <223> v3.2_protein <400> 64 Met Gly His His His His His His Gly Ser Leu Gln Asp Ser Glu Val 1 5 10 15 Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr 20 25 30 His Ile Asn Leu Lys Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys 35 40 45 Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys 50 55 60 Arg Gln Gly Lys Glu Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile 65 70 75 80 Arg Ile Gln Ala Asp Gln Ala Pro Glu Asp Leu Asp Met Glu Asp Asn 85 90 95 Asp Ile Ile Glu Ala His Arg Glu Gln Ile Gly Gly Met Gly Asn Ser 100 105 110 Val Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ser Gly Lys 115 120 125 Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile 130 135 140 Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys 145 150 155 160 Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser 165 170 175 Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly 180 185 190 Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu 195 200 205 Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu 210 215 220 Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu 225 230 235 240 Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr 245 250 255 Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala 260 265 270 Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val 275 280 285 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val 290 295 300 Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys 305 310 315 320 Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser 325 330 335 Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys 340 345 350 Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu 355 360 365 Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met 370 375 380 Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile 385 390 395 400 Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe 405 410 415 Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn 420 425 430 Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu 435 440 445 Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val 450 455 460 Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp 465 470 475 480 Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro 485 490 495 Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly 500 505 510 Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly 515 520 525 Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys 530 535 540 Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu 545 550 555 560 Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp 565 570 575 Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys 580 585 590 Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr 595 600 605 Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu 610 615 620 Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr 625 630 635 640 Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu 645 650 655 Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser 660 665 670 Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp 675 680 685 Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val 690 695 700 Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys 705 710 715 720 Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu 725 730 735 Arg Gly Ile Lys Pro Asp Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly 740 745 750 Leu Gly Lys Ala Gly

Claims (18)

  1. 다음 중 어느 하나의 PPR 모티프:
    (C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
    (C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
    (C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성(sequence identity)을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
    (A-1) 서열번호 8의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
    (A-2)(A-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
    (A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
    (G-1) 서열번호 9의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
    (G-2)(G-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
    (G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
    (U-1) 서열번호 10의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
    (U-2)(U-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
    (U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
  2. 다음 중 어느 하나의 PPR 모티프:
    (C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
    (C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
    (C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
    (A-1) 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 PPR 모티프;
    (A-2)(A-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
    (A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
    (G-1) 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
    (G-2)(G-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
    (G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
    (U-1) 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
    (U-2)(U-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
    (U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프
    ·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루탐산인 조합
    ·6번 위치의 아미노산이 아스파라긴이며, 9번 위치의 아미노산이 글루타민인 조합
    ·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 리신인 조합
    ·6번 위치의 아미노산이 아스파라긴산이며, 9번 위치의 아미노산이 글리신인 조합.
  3. 제1항 또는 제2항에 있어서,
    다음 중 어느 하나인 PPR 모티프:
    (C-4) 서열번호 4의 서열로 구성되는 PPR 모티프;
    (A-4) 서열번호 58의 서열로 구성되는 PPR 모티프;
    (G-4) 서열번호 59의 서열로 구성되는 PPR 모티프;
    (U-4) 서열번호 60의 서열로 구성되는 PPR 모티프.
  4. 제1항 내지 제3항의 어느 한 항에 기재된 PPR 모티프의, PPR 단백질의 N-말단으로부터 1번째 PPR 모티프로서 사용하기 위한 용도.
  5. 제4항에 있어서,
    PPR 단백질의 응집성을 감소시키기 위한 것을 특징으로 하는 용도.
  6. 하기 일반식(1)로 나타내는 PPR 모티프를 1개 내지 30개 포함하고 특정 염기서열을 가지는 표적핵산과 결합 가능하며, N-말단 측으로부터 1번째 PPR 모티프(M1)의 A6 아미노산이 친수성 아미노산인 단백질:
    Figure pct00010
    .... (1)
    상기 일반식(1)에서,
    Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
    Figure pct00011
    .... (2)
     (상기 일반식(2)에서, A1 ~ A12는 각각 독립적으로 아미노산을 나타낸다)

      X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 구성되며;
      Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
      L은 2개 내지 7개 아미노산 길이의, 하기 일반식(3)으로 나타내는 부분이다.
    Figure pct00012
    .... (3)
     (상기 일반식(3)에서, 각 아미노산은 C-말단 측으로부터 "i"(-1), "ii"(-2)으로 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
  7. 제6항에 있어서,
    M1의 A9 아미노산이 친수성 아미노산 또는 글리신인 것을 특징으로 하는 단백질.
  8. 제6항 또는 제7항에 있어서,
    M1의 A6 아미노산이 아스파라긴 또는 아스파라긴산인 것을 특징으로 하는 단백질.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서,
    M1의 A9 아미노산이 글루타민, 글루타민산, 리신 또는 글리신인 것을 특징으로 하는 단백질.
  10. 제6항 내지 제9항 중 어느 한 항에 있어서,
    M1의 A6 아미노산 및 M1의 A9 아미노산이 다음 중 어느 하나의 조합인 것을 특징으로 하는 단백질:
    ·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
    ·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
    ·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
    ·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합.
  11. 형광 단백질, 핵이행 신호 펩티드 및 태그 단백질로 이루어진 군에서 선택되는 적어도 하나와, 제1항 내지 제3항 중 어느 한 항에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 제6항 내지 제10항 중 어느 한 항에 기재된 단백질과의 융합 단백질.
  12. 제6항에 정의한 PPR 모티프를 포함하는 특정 염기서열을 가지는 표적 핵산과 결합 가능한 PPR 단백질의 개질방법에 있어서, N-말단으로부터 1번째 PPR 모티프(M1)의 A6 아미노산을 보다 친수성으로 만드는 것을 특징으로 하는 방법.
  13. 제1항 내지 제3항 중 어느 한 항에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 제6항 내지 제10항 중 어느 한 항에 기재된 단백질, 또는 제11항에 기재된 융합 단백질을 사용하는 것을 특징으로 하는 핵산의 검출방법.
  14. 제1항 내지 제3항 중 어느 한 항에 기재된 PPR 모티프, 제1항 내지 제3항 중의 어느 한 항에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 또는 제6항 내지 제10항 중 어느 한 항에 기재된 단백질을 암호화하는 핵산.
  15. 제14항에 기재된 핵산을 포함하는 벡터.
  16. 제15항에 기재된 벡터를 포함하는 세포(인간 개체는 제외).
  17. 제1항 내지 제3항 중 어느 한 항에 기재된 PPR 모티프, 제1항 내지 제3항 중어느 한 항에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 또는 제6항 내지 제10항 중 어느 한 항에 기재된 단백질, 또는 제15항에 기재된 벡터를 이용하는, 핵산의 조작방법(인간 개체에서의 실시를 제외한다).
  18. 제17항에 기재된 조작방법을 포함하는 생물의 생산방법.





KR1020217040376A 2019-05-29 2020-05-29 응집이 적은 피피알 단백질 및 그의 이용 KR20220023984A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2019-100553 2019-05-29
JP2019100553 2019-05-29
PCT/JP2020/021473 WO2020241877A1 (ja) 2019-05-29 2020-05-29 凝集の少ないpprタンパク質及びその利用

Publications (1)

Publication Number Publication Date
KR20220023984A true KR20220023984A (ko) 2022-03-03

Family

ID=73552159

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217040376A KR20220023984A (ko) 2019-05-29 2020-05-29 응집이 적은 피피알 단백질 및 그의 이용

Country Status (11)

Country Link
US (1) US20220220166A1 (ko)
EP (1) EP3977849A4 (ko)
JP (2) JP7308468B2 (ko)
KR (1) KR20220023984A (ko)
CN (1) CN113966340A (ko)
AU (1) AU2020283367A1 (ko)
BR (1) BR112021023937A2 (ko)
CA (1) CA3142303A1 (ko)
IL (2) IL288417B1 (ko)
SG (1) SG11202113057XA (ko)
WO (1) WO2020241877A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7125727B1 (ja) 2021-09-07 2022-08-25 国立大学法人千葉大学 核酸配列改変用組成物および核酸配列の標的部位を改変する方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013058404A1 (ja) 2011-10-21 2013-04-25 国立大学法人九州大学 Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用
WO2014175284A1 (ja) 2013-04-22 2014-10-30 国立大学法人九州大学 Pprモチーフを利用したdna結合性タンパク質およびその利用
KR20190100551A (ko) 2018-02-19 2019-08-29 삼성디스플레이 주식회사 표시 장치, 이를 포함하는 적층 기판, 및 표시 장치 제조방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006188507A (ja) * 2004-12-10 2006-07-20 Tokyo Univ Of Agriculture & Technology 蛋白質の溶解度向上方法
KR102407776B1 (ko) 2016-06-03 2022-06-10 고쿠리쓰다이가쿠호진 규슈다이가쿠 표적 mRNA로부터의 단백질 발현량을 향상시키기 위한 융합 단백질
EP3498726A4 (en) * 2016-08-10 2020-03-25 Fujifilm Wako Pure Chemical Corporation DNA-BINDING PROTEIN WITH PPR MOTIF AND USE OF THE DNA-BINDING PROTEIN
JP6918686B2 (ja) 2017-11-28 2021-08-11 東芝ライフスタイル株式会社 冷蔵庫
SG11202113055UA (en) * 2019-05-29 2021-12-30 Editforce Inc Efficient method for preparing ppr protein and use of the same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013058404A1 (ja) 2011-10-21 2013-04-25 国立大学法人九州大学 Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用
WO2014175284A1 (ja) 2013-04-22 2014-10-30 国立大学法人九州大学 Pprモチーフを利用したdna結合性タンパク質およびその利用
KR20190100551A (ko) 2018-02-19 2019-08-29 삼성디스플레이 주식회사 표시 장치, 이를 포함하는 적층 기판, 및 표시 장치 제조방법

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
1. Coquille, S. et al. An Artificial PPR Scaffold for Programmable RNA Recognition. Nature Communications 5, Article number: 5729 (2014)
2. Shen, C. et al. Specific RNA Recognition by Designer Pentatricopeptide Repeat Protein. Molecular Plant 8, 667-670 (2015)
3. Shen, C. et al. Structural basis for Specific Single-stranded RNA Recognition by Designer Pentatricopeptide Repeat Proteins. Nature Communications, Volume 7, Article number: 11285 (2016)
4. Miranda, R. G. et al. RNA-binding Specificity Landscapes of Designer Pentatricopeptide Repeat Proteins Elucidate Principles of PPR-RNA Interactions. Nucleic Acids Research, 46 (5), 2613-2623 (2018)
5. Yan, J. et al. Delineation of Pentatricopeptide Repeat Codes for Target RNA Prediction. Nucleic Acids Research, gkz 075 (2019)

Also Published As

Publication number Publication date
US20220220166A1 (en) 2022-07-14
JP7308468B2 (ja) 2023-07-14
JPWO2020241877A1 (ko) 2020-12-03
EP3977849A4 (en) 2023-06-28
WO2020241877A1 (ja) 2020-12-03
IL312349A (en) 2024-06-01
AU2020283367A1 (en) 2022-01-06
BR112021023937A2 (pt) 2022-04-19
IL288417A (en) 2022-01-01
JP2023036848A (ja) 2023-03-14
IL288417B1 (en) 2024-06-01
EP3977849A1 (en) 2022-04-06
SG11202113057XA (en) 2021-12-30
CA3142303A1 (en) 2020-12-03
CN113966340A (zh) 2022-01-21

Similar Documents

Publication Publication Date Title
Versele et al. Protein–protein interactions governing septin heteropentamer assembly and septin filament organization in Saccharomyces cerevisiae
Grozdanov et al. SHQ1 is required prior to NAF1 for assembly of H/ACA small nucleolar and telomerase RNPs
CN112004932B (zh) 一种CRISPR/Cas效应蛋白及系统
BR122020018292B1 (pt) Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr
CN112105728A (zh) CRISPR/Cas效应蛋白及系统
Cornell et al. Detection of specific protein–protein interactions in nanocages by engineering bipartite FlAsH binding sites
Turnšek et al. Proximity proteomics in a marine diatom reveals a putative cell surface-to-chloroplast iron trafficking pathway
JP2023036848A (ja) 凝集の少ないpprタンパク質及びその利用
JP2023145672A (ja) 効率的なpprタンパク質の作製方法及びその利用
KR20210062639A (ko) 신규 뉴클레아제 도메인 및 그 이용
ES2525573T3 (es) Trampas de SUMO de alta afinidad
JP2000508174A (ja) タンパク質の相互作用を検出するための相互作用トラップシステム
KR20080113247A (ko) 단백질 가용화를 위한 단백질 s 융합물의 용도
KR102407776B1 (ko) 표적 mRNA로부터의 단백질 발현량을 향상시키기 위한 융합 단백질
CN114057861A (zh) 一种靶向UBE2C的bio-PROTAC人工蛋白
CA2830805A1 (fr) Constructions et procede pour reguler l&#39;expression des genes ou pour detecter et controler un locus d&#39;adn chez les eucaryotes
US7879578B2 (en) Self-assembled proteins and related methods and protein structures
US20130023643A1 (en) Nuclear localization signal peptides derived from vp2 protein of chicken anemia virus and uses of said peptides
US20230295638A1 (en) Modular platform for programmable spatiotemporal biomolecule clustering with applications including enhanced metabolic yield
JP5371306B2 (ja) 負の超らせんdna結合ドメイン
CN115261359A (zh) 一种新型crispr酶和系统以及应用
CN115786373A (zh) 一种用于检测protac分子的重组核酸分子
Fischer Initial characterization of the ribosome-associated ATP binding cassette (ABC) protein YHIH from E. Coli
CN114703215A (zh) 使用真核细胞发酵表达血管紧张素转化酶2的方法
Witosch Structural characterization of the Timeless-Tipin-RPA Complex and its interaction with ssDNA

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal