CN113966340A - 凝聚少的ppr蛋白及其应用 - Google Patents

凝聚少的ppr蛋白及其应用 Download PDF

Info

Publication number
CN113966340A
CN113966340A CN202080040065.2A CN202080040065A CN113966340A CN 113966340 A CN113966340 A CN 113966340A CN 202080040065 A CN202080040065 A CN 202080040065A CN 113966340 A CN113966340 A CN 113966340A
Authority
CN
China
Prior art keywords
sequence
misc
ppr
feature
amino acids
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080040065.2A
Other languages
English (en)
Inventor
八木祐介
今井崇喜
玉井乔之
中村崇裕
寺本岳大
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japanese Gene Editing Co ltd
Kyushu University NUC
Original Assignee
Japanese Gene Editing Co ltd
Kyushu University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japanese Gene Editing Co ltd, Kyushu University NUC filed Critical Japanese Gene Editing Co ltd
Publication of CN113966340A publication Critical patent/CN113966340A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/06Linear peptides containing only normal peptide links having 5 to 11 amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Analytical Chemistry (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Environmental Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

为了改善PPR蛋白的凝聚性,使从N末端起的第1个PPR基序(M1)的A6氨基酸更具有亲水性。进一步使M1的A9氨基酸为亲水性氨基酸或甘氨酸。A6氨基酸优选为天冬酰胺或天冬氨酸,A9氨基酸优选为谷氨酰胺、谷氨酸、赖氨酸或甘氨酸。包含这样的PPR基序作为M1基序的蛋白质不仅改善了凝聚性,而且对靶核酸可具有高结合力。

Description

凝聚少的PPR蛋白及其应用
技术领域
本发明涉及使用能够与所期望的核酸结合的蛋白质的核酸操作技术。本发明在医疗(创新药物研发、疾病的治疗)、农业(农产品生产、育种)、化学(生物学物质生产)等广泛的领域中有用。
背景技术
PPR蛋白是包含由长度约35个氨基酸构成的PPR基序的重复基序的蛋白质,1个PPR基序能够与1个碱基特异性结合。通过PPR基序内的第1位、第4位、第ii位(比下一个基序靠前2个碱基)氨基酸的组合来决定与腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶(或胸腺嘧啶)中的哪一个结合(专利文献1、2)。
天然存在的RNA结合PPR基序中,出现最多的与各个碱基对应的组合为:对于腺嘌呤,第1位为缬氨酸、第4位为苏氨酸、第ii位为天冬酰胺;对于胞嘧啶,第1位为缬氨酸、第4位为天冬酰胺、第ii位为丝氨酸;对于鸟嘌呤,第1位为缬氨酸、第4位为苏氨酸、第ii位为天冬氨酸;对于尿嘧啶,第1位为缬氨酸、第4位为天冬酰胺、第ii位为天冬氨酸(非专利文献1~5)。通过利用这些氨基酸的组合,能够设计出可与任意序列特异性结合的PPR蛋白。
现有技术文献
专利文献
专利文献1:国际公开WO2013/058404
专利文献2:国际公开WO2014/175284
专利文献3:日本特愿2019-100551
非专利文献
非专利文献1:Coquille,S.et al.An artificial PPR scaffold forprogrammable RNA recognition.Nature Communications 5,Article number:5729(2014)
非专利文献2:Shen,C.et al.Specific RNA Recognition by DesignerPentatricopeptide Repeat Protein.Molecular Plant 8,667-670(2015)
非专利文献3:Shen,C.et al.Structural basis for specific single-stranded RNA recognition by designer pentatricopeptide repeat proteins.NatureCommunications volume7,Article number:11285(2016)
非专利文献4:Miranda,R.G.et al.RNA-binding specificity landscapes ofdesigner pentatricopeptide repeat proteins elucidate principles of PPR-RNAinteractions.Nucleic Acids Research,46(5),2613-2623(2018)
非专利文献5:Yan,J.et al.Delineation of pentatricopeptide repeat codesfor target RNAprediction.Nucleic Acids Research,gkz075(2019)
发明内容
发明所要解决的课题
本发明人进行了利用上述氨基酸的组合来制作具有高性能且将多个(例如15个以上的)PPR基序连结而成的PPR蛋白的研究(专利文献3)。另一方面,根据本发明人的研究可知,利用这样的方法制作的PPR蛋白有一部分显示出凝聚性。特别是在利用动物培养细胞表达PPR蛋白的情况下,有时会观察到凝聚。
用于解决课题的手段
因此,进行了通过PPR基序内的氨基酸变异来解决这一点的研究。并且发现,通过使PPR蛋白的第1基序(N末端侧)的第6位、优选第6位和第9位的氨基酸为亲水性的氨基酸,能够改善PPR的凝聚性,从而完成了本发明。
本发明提供下述方案。
[1]一种PPR基序,其为下述任一种PPR基序:
(C-1)由序列号4~7中的任一序列构成的PPR基序;
(C-2)由序列号4~7中的任一序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为胞嘧啶结合性的PPR基序;
(C-3)与序列号4~7中的任一序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为胞嘧啶结合性的PPR基序;
(A-1)由序列号8的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(A-2)由(A-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为腺嘌呤结合性的PPR基序;
(A-3)与(A-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为腺嘌呤结合性的PPR基序;
(G-1)由序列号9的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(G-2)由(G-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为鸟嘌呤结合性的PPR基序;
(G-3)与(G-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为鸟嘌呤结合性的PPR基序;
(U-1)由序列号10的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(U-2)由(U-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为尿嘧啶结合性的PPR基序;
(U-3)与(U-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为尿嘧啶结合性的PPR基序。
[2]一种PPR基序,其为下述任一种PPR基序:
(C-1)由序列号4~7中的任一序列构成的PPR基序;
(C-2)由序列号4~7中的任一序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为胞嘧啶结合性的PPR基序;
(C-3)与序列号4~7中的任一序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为胞嘧啶结合性的PPR基序;
(A-1)序列号8的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的PPR基序;
(A-2)由(A-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为腺嘌呤结合性的PPR基序;
(A-3)与(A-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为腺嘌呤结合性的PPR基序;
(G-1)由序列号9的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的序列构成的PPR基序;
(G-2)由(G-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为鸟嘌呤结合性的PPR基序;
(G-3)与(G-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为鸟嘌呤结合性的PPR基序;
(U-1)由序列号10的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的序列构成的PPR基序;
(U-2)由(U-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为尿嘧啶结合性的PPR基序;
(U-3)与(U-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为尿嘧啶结合性的PPR基序。
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为谷氨酸的组合
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为谷氨酰胺的组合
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为赖氨酸的组合
·位置6的氨基酸为天冬氨酸、且位置9的氨基酸为甘氨酸的组合
[3]如1或2所述的PPR基序,其中,所述PPR基序为下述任一种PPR基序:
(C-4)由序列号4的序列构成的PPR基序;
(A-4)由序列号58的序列构成的PPR基序;
(G-4)由序列号59的序列构成的PPR基序;
(U-4)由序列号60的序列构成的PPR基序。
[4]1~3中任一项所述的PPR基序作为PPR蛋白中的从N末端起的第1个PPR基序的应用。
[5]如4所述的应用,其用于减小PPR蛋白的凝聚性。
[6]一种蛋白质,其是包含1~30个下述式1所表示的PPR基序、能够与具有特定碱基序列的靶核酸结合的蛋白质,其中,从N末端起的第1个PPR基序(M1)的A6氨基酸为亲水性氨基酸。
[化1]
(螺旋A)-X-(螺旋B)-L(式1)
(式中:
螺旋A为长度12个氨基酸的能够形成α螺旋结构的部分,由式2表示,
[化2]
A1-A2-A3-A4-A5-A6-A7-A8-A9-A10-A11-A12 (式2)
式2中,A1~A12各自独立地表示氨基酸;
X不存在或者是由长度1~9个氨基酸构成的部分;
螺旋B是由长度11~13个氨基酸构成的能够形成α螺旋结构的部分;
L为长度2~7个氨基酸的由式3所表示的部分;
[化3]
Lvii-Lvi-Lv-Liv-Liii-Lii-Li (式3)
式3中,各氨基酸从C末端侧起被编号为“i”(-1)、“ii”(-2),
其中Liii~Lvii有不存在的情况。)
[7]如6所述的蛋白质,其中,M1的A9氨基酸为亲水性氨基酸或甘氨酸。
[8]如6或7所述的蛋白质,其中,M1的A6氨基酸为天冬酰胺或天冬氨酸。
[9]如6~8中任一项所述的蛋白质,其中,M1的A9氨基酸为谷氨酰胺、谷氨酸、赖氨酸或甘氨酸。
[10]如6~9中任一项所述的蛋白质,其中,M1的A6氨基酸以及M1的A9氨基酸为下述任一种组合。
·A6氨基酸为天冬酰胺、且A。氨基酸为谷氨酸的组合
·A6氨基酸为天冬酰胺、且A。氨基酸为谷氨酰胺的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为赖氨酸的组合
·A6氨基酸为天冬氨酸、且A9氨基酸为甘氨酸的组合
[11]一种融合蛋白,其是选自由荧光蛋白、核转运信号肽以及标签蛋白组成的组中的至少一者与包含1~3中任一项所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白或者6~10中任一项所述的蛋白质的融合蛋白。
[12]一种改性方法,其是包含6中定义的PPR基序、能够与具有特定碱基序列的靶核酸结合的PPR蛋白的改性方法,其中,使从N末端起的第1个PPR基序(M1)的A6氨基酸更具有亲水性。
[13]一种核酸的检测方法,其特征在于,使用包含1~3中任一项所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、6~10中任一项所述的蛋白质、或者11所述的融合蛋白。
[14]一种核酸,其编码1~3中任一项所述的PPR基序、包含1~3中任一项所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、或者6~10中任一项所述的蛋白质。
[15]一种载体,其包含14所述的核酸。
[16]一种细胞(不包括人个体细胞),其包含15所述的载体。
[17]一种核酸的操作方法(不包括在人个体中实施),其使用1~3中任一项所述的PPR基序、包含1~3中任一项所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、或者6~10中任一项所述的蛋白质、或者15所述的载体。
[18]一种生物的生产方法,其包括17所述的操作方法。
本发明还提供下述方案。
[1]一种PPR基序,其为下述任一种PPR基序:
(C-1)由序列号4~7中的任一序列构成的PPR基序;
(C-2)由序列号4~7中的任一序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为胞嘧啶结合性的PPR基序;
(C-3)与序列号4~7中的任一序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为胞嘧啶结合性的PPR基序;
(A-1)由序列号8的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(A-2)由(A-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为腺嘌呤结合性的PPR基序;
(A-3)与(A-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为腺嘌呤结合性的PPR基序;
(G-1)由序列号9的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(G-2)由(G-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为鸟嘌呤结合性的PPR基序;
(G-3)与(G-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为鸟嘌呤结合性的PPR基序;
(U-1)由序列号10的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(U-2)由(U-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为尿嘧啶结合性的PPR基序;
(U-3)与(U-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为尿嘧啶结合性的PPR基序。
[2]一种PPR基序,其为下述任一种PPR基序:
(C-1)由序列号4~7中的任一序列构成的PPR基序;
(C-2)由序列号4~7中的任一序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为胞嘧啶结合性的PPR基序;
(C-3)与序列号4~7中的任一序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为胞嘧啶结合性的PPR基序;
(A-1)序列号8的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的PPR基序;
(A-2)由(A-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为腺嘌呤结合性的PPR基序;
(A-3)与(A-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为腺嘌呤结合性的PPR基序;
(G-1)由序列号9的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的序列构成的PPR基序;
(G-2)由(G-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为鸟嘌呤结合性的PPR基序;
(G-3)与(G-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为鸟嘌呤结合性的PPR基序;
(U-1)由序列号10的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的序列构成的PPR基序;
(U-2)由(U-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为尿嘧啶结合性的PPR基序;
(U-3)与(U-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为尿嘧啶结合性的PPR基序。
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为谷氨酸的组合
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为谷氨酰胺的组合
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为赖氨酸的组合
·位置6的氨基酸为天冬氨酸、且位置9的氨基酸为甘氨酸的组合
[3]1或2所述的PPR基序作为PPR蛋白中的从N末端起的第1个PPR基序的应用。
[4]如3所述的应用,其用于减少PPR蛋白的凝聚性。
[5]一种蛋白质,其是包含1~30个下述式1所表示的PPR基序、能够与具有特定碱基序列的靶核酸结合的蛋白质,其中,从N末端起的第1个PPR基序(M1)的A6氨基酸为亲水性氨基酸。
[化4]
(螺旋A)-X-(螺旋B)-L (式1)
(式中:
螺旋A为长度12个氨基酸的能够形成α螺旋结构的部分,由式2表示,
[化5]
A1-A2-A3-A4-A5-A6-A7-A8-A9-A10-A11-A12 (式2)
式2中,A1~A12各自独立地表示氨基酸;
X不存在或者是由长度1~9个氨基酸构成的部分;
螺旋B是由长度11~13个氨基酸构成的能够形成α螺旋结构的部分;
L为长度2~7个氨基酸的由式3所表示的部分;
[化6]
Lvli-Lvi-Lv-Liv-Liii-Lii-Li (式3)
式3中,各氨基酸从C末端侧起编号为“i”(-1)、“ii”(-2),
其中Liii~Lvii有不存在的情况。)
[6]如5所述的蛋白质,其中,M1的A9氨基酸为亲水性氨基酸或甘氨酸。
[7]如5或6所述的蛋白质,其中,M1的A6氨基酸为天冬酰胺或天冬氨酸。
[8]如5~7中任一项所述的蛋白质,其中,M1的A9氨基酸为谷氨酰胺、谷氨酸、赖氨酸或甘氨酸。
[9]如5~8中任一项所述的蛋白质,其中,M1的A6氨基酸以及M1的A9氨基酸为下述任一种组合。
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酸的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酰胺的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为赖氨酸的组合
·A6氨基酸为天冬氨酸、且A9氨基酸为甘氨酸的组合
[10]一种融合蛋白,其是选自由荧光蛋白、核转运信号肽以及标签蛋白组成的组中的至少一者与包含1或2所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、或者5~9中任一项所述的蛋白质的融合蛋白。
[11]一种改性方法,其是包含3中定义的PPR基序、能够与具有特定碱基序列的靶核酸结合的PPR蛋白的改性方法,其中,使从N末端起的第1个PPR基序(M1)的A6氨基酸更具有亲水性。
[12]一种核酸的检测方法,其特征在于,使用包含1或2所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、5~9中任一项所述的蛋白质、或者10所述的融合蛋白。
[13]一种核酸,其编码1或2所述的PPR基序、包含1或2所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、或者5~9中任一项所述的蛋白质。
[14]一种载体,其包含13所述的核酸。
[15]一种细胞(不包括人个体细胞),其包含14所述的载体。
[16]一种核酸的操作方法(不包括在人个体中实施),其使用1或2所述的PPR基序、包含1或2所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、或者5~9中任一项所述的蛋白质、或者14所述的载体。
[17]一种生物的生产方法,其包括16所述的操作方法。
附图说明
图1是PPR基序的设计方法。A:第1基序的第6位和第9位的氨基酸露出到外侧。B:关于识别胞嘧啶的第1基序的第6位、第9位的氨基酸,作为代表性的组合,选择亮氨酸和甘氨酸(C_6L9G),作为变异型,选择亮氨酸和谷氨酸(C_6L9E)、天冬酰胺和谷氨酰胺(C_6N9Q)、天冬酰胺和谷氨酸(C_6N9E)、天冬酰胺和赖氨酸(C_6N9K)、天冬氨酸和甘氨酸(C_6D9G)。
图2是各PPR蛋白的凝聚性以及向核内的转运。通过荧光显微镜图像确认到融合有GFP和核转运信号序列的PPR在细胞内的表达。在融合有EGFP的情况下,确认到PPRcag_1(6L9G)和PPRcag_2(6L9E)未定位在核中而在核的周围显著凝聚的状态。另一方面,PPRcag_3(6N9Q)、PPRcag_4(6N9E)、PPRcag_5(6N9K)、PPRcag_6(6D9G)虽然凝聚性低,但未定位在核中。在融合有mClover3的情况下,确认到PPRcag_1(6L9G)和PPRcag_2(6L9E)定位在核中、但在核中发生凝聚的状态。PPRcag_3(6N9Q)、PPRcag 4(6N9E)、PPRcag_5(6N9K)、PPRcag_6(6D9G)定位在核中,并且未观察到凝聚性。
图3是PPR蛋白与RNA的结合实验。可知包含第6位以及第9位的氨基酸变异的全部PPR与作为靶的CAGx6特异性结合。关于与靶序列的结合力,与PPRcag_1相比,PPRcag_2为同等程度,PPRcag_3为80%左右,PPRcag_4为60%左右,PPRcag 5为120%左右,PPRcag_6为130%左右。
图4是从N末端起的第1个PPR基序对凝聚的影响。利用大肠杆菌表达系统制作各PPR蛋白并进行纯化,利用凝胶过滤色谱法进行分离。洗脱级分(Elution vol.)越少,分子尺寸越大。v2在8至10mL的洗脱级分中洗脱,另一方面,v3.2在12至14mL的洗脱级分中观察到峰。由此可知,v2的情况下,由于蛋白质尺寸变大而暗示出发生凝聚的可能性,该凝聚在v3.2中得到了改善。
具体实施方式
[PPR基序、PPR蛋白]
(定义)
在本发明中提到PPR基序时,除特别记载的情况以外,是指具有下述氨基酸序列的由30~38个氨基酸构成的多肽,所述氨基酸序列在利用网络上的蛋白质结构域检索程序对氨基酸序列进行分析时,利用Pfam中的PF01535、Prosite中的PS51375得到的E值为规定值以下(优选为E-03)。构成本发明中定义的PPR基序的氨基酸的位置编号与PF01535大致同义,另一方面,其相当于从PS51375的氨基酸的位置减去2而得到的数(例如,本发明的1位→PS51375的3位)。其中,在提到“ii”(-2)位的氨基酸时,是从构成PPR基序的氨基酸的最后位(C末端侧)起的第2位氨基酸;或者是相对于下一个PPR基序的1位氨基酸向N末端侧数2个、即第-2位的氨基酸。在未明确鉴定出下一个PPR基序的情况下,将相对于下一个螺旋结构的第1位氨基酸靠前2个的氨基酸作为“ii”。关于Pfam可以参考http://pfam.sanger.ac.uk/,关于Prosite可以参考http://www.expasy.org/prosite/。
PPR基序的保守氨基酸序列在氨基酸水平上的保守性低,但在二级结构上2个α螺旋是非常保守的。代表性的PPR基序由35个氨基酸构成,但其长度在30~38个氨基酸的范围内可变。
更具体地说,本发明中提到的PPR基序由式1所表示的长度30~38个氨基酸的多肽构成。
[化7]
(螺旋A)-X-(螺旋B)-L (式1)
式中:
螺旋A为长度12个氨基酸的能够形成α螺旋结构的部分,由式2表示,
[化8]
A1-A2-A3-A4-A5-A6-A7-A8-Ag-A10-A11-A12 (式2)
式2中,A1~A12各自独立地表示氨基酸;
X不存在或者为由长度1~9个氨基酸构成的部分;
螺旋B为由长度11~13个氨基酸构成的能够形成α螺旋结构的部分;
L为长度2~7个氨基酸的由式3表示的部分;
[化9]
Lvii-Lvi-Lv-Llv-Liii-Lii-Li (式3)
式3中,各氨基酸从C末端侧起被编号为“i”(-1)、“ii”(-2),
其中,Liii~Lvii有不存在的情况。
在本发明中提到PPR蛋白时,除特别记载的情况以外,是指具有1个以上、优选2个以上的上述PPR基序的PPR蛋白。本说明书中提到蛋白质时,除特别记载的情况以外,是指由多肽(2个以上的氨基酸经肽键结合而成的链)构成的所有物质,也包括由较低分子的多肽构成的物质。在本发明中提到氨基酸的情况下,有时是指通常的氨基酸分子,此外有时还指构成肽链的氨基酸残基。本领域技术人员根据上下文可明确所指的是哪一者。
本发明中,关于PPR基序与靶核酸中的碱基的结合性,在提到特异性/特异的时,除特别记载的情况以外,是指对4种碱基中的任意一种碱基的结合活性高于对其他碱基的结合活性。
本发明中在提到核酸时,是指RNA或DNA。需要说明的是,PPR蛋白可以对RNA或DNA中的碱基具有特异性,但并非与核酸单体结合。
PPR基序的第1、4、ii位的3个氨基酸的组合对于与碱基的特异性结合是很重要的,通过它们的组合,能够决定所结合的碱基是哪一种(上述专利文献1、2)。
具体地说,对于RNA结合性的PPR基序而言,第1、4、ii位的3个氨基酸的组合与所能结合的碱基的关系如下所述(参见上述专利文献1)。
(3-1)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、天冬酰胺及天冬氨酸的情况下,该PPR基序具有与U强结合、其次与C结合、再次与A或G结合这样选择性的RNA碱基结合能力。
(3-2)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、苏氨酸、天冬酰胺的情况下,该PPR基序具有与A强结合、其次与G结合、再次与C结合、但不与U结合这样选择性的RNA碱基结合能力。
(3-3)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、天冬酰胺、天冬酰胺的情况下,该PPR基序具有与C强结合、其次与A或U结合、但不与G结合这样选择性的RNA碱基结合能力。
(3-4)A1、A4以及Lii这3个氨基酸的组合依次为谷氨酸、甘氨酸、天冬氨酸的情况下,该PPR基序具有与G强结合、但不与A、U及C结合这样选择性的RNA碱基结合能力。
(3-5)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、天冬酰胺、天冬酰胺的情况下,该PPR基序具有与C强结合、其次与U结合、再次与A结合、但不与G结合这样选择性的RNA碱基结合能力。
(3-6)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、苏氨酸、天冬氨酸的情况下,该PPR基序具有与G强结合、其次与U结合、但不与A和C结合这样选择性的RNA碱基结合能力。
(3-7)A1、A4以及Lii这3个氨基酸的组合依次为赖氨酸、苏氨酸、天冬氨酸的情况下,该PPR基序具有与G强结合、其次与A结合、但不与U及C结合这样选择性的RNA碱基结合能力。
(3-8)A1、A4以及Lii这3个氨基酸的组合依次为苯丙氨酸、丝氨酸、天冬酰胺的情况下,该PPR基序具有与A强结合、其次与C结合、再次与G及U结合这样选择性的RNA碱基结合能力。
(3-9)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、天冬酰胺、丝氨酸的情况下,该PPR基序具有与C强结合、其次与U结合、但不与A和G结合这样选择性的RNA碱基结合能力。
(3-10)A1、A4以及Lii这3个氨基酸的组合依次为苯丙氨酸、苏氨酸、天冬酰胺的情况下,该PPR基序具有与A强结合、但不与G、U及C结合这样选择性的RNA碱基结合能力。
(3-11)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、天冬酰胺、天冬氨酸的情况下,该PPR基序具有与U强结合、其次与A结合、但不与G及C结合这样选择性的RNA碱基结合能力。
(3-12)A1、A4以及Lii这3个氨基酸的组合依次为苏氨酸、苏氨酸、天冬酰胺的情况下,该PPR基序具有与A强结合、但不与G、U及C结合这样选择性的RNA碱基结合能力。
(3-13)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、蛋氨酸、天冬氨酸的情况下,该PPR基序具有与U强结合、其次与C结合、但不与A和G结合这样选择性的RNA碱基结合能力。
(3-14)A1、A4以及Lii这3个氨基酸的组合依次为苯丙氨酸、脯氨酸、天冬氨酸的情况下,该PPR基序具有与U强结合、其次与C结合、但不与A和G结合这样选择性的RNA碱基结合能力。
(3-15)A1、A4以及Lii这3个氨基酸的组合依次为酪氨酸、脯氨酸、天冬氨酸的情况下,该PPR基序具有与U强结合、但不与A、G及C结合这样选择性的RNA碱基结合能力。
(3-16)A1、A4以及Lii这3个氨基酸的组合依次为亮氨酸、苏氨酸、天冬氨酸的情况下,该PPR基序具有与G强结合、但不与A、U及C结合这样选择性的RNA碱基结合能力。
对于DNA结合性的PPR基序而言,第1、4、ii位的3个氨基酸的组合与所能结合的碱基的关系具体如下所述(参见上述专利文献2)。
(2-1)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、甘氨酸、天冬氨酸时,该PPR基序与G选择性结合;
(2-2)A1、A4以及Lii这3个氨基酸的组合依次为谷氨酸、甘氨酸、天冬氨酸时,该PPR基序与G选择性结合;
(2-3)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、甘氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-4)A1、A4以及Lii这3个氨基酸的组合依次为谷氨酸、甘氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-5)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、甘氨酸、丝氨酸时,该PPR基序与A选择性结合、其次与C结合;
(2-6)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、异亮氨酸、任意氨基酸时,该PPR基序与T及C选择性结合;
(2-7)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、异亮氨酸、天冬酰胺时,该PPR基序与T选择性结合、其次与C结合;
(2-8)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、亮氨酸、任意氨基酸时,该PPR基序与T及C选择性结合;
(2-9)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、亮氨酸、天冬氨酸时,该PPR基序与C选择性结合;
(2-10)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、亮氨酸、赖氨酸时,该PPR基序与T选择性结合;
(2-11)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、蛋氨酸、任意氨基酸时,该PPR基序与T选择性结合;
(2-12)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、蛋氨酸、天冬氨酸时,该PPR基序与T选择性结合;
(2-13)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、蛋氨酸、天冬氨酸时,该PPR基序与T选择性结合、其次与C结合;
(2-14)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、天冬酰胺、任意氨基酸时,该PPR基序与C及T选择性结合;
(2-15)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性结合;
(2-16)A1、A4以及Lii这3个氨基酸的组合依次为苯丙氨酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性结合;
(2-17)A1、A4以及Lii这3个氨基酸的组合依次为甘氨酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性结合;
(2-18)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性结合;
(2-19)A1、A4以及Lii这3个氨基酸的组合依次为苏氨酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性结合;
(2-20)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性结合、其次与C结合;
(2-21)A1、A4以及Lii这3个氨基酸的组合依次为酪氨酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性结合、其次与C结合;
(2-22)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、天冬酰胺、天冬酰胺时,该PPR基序与C选择性结合;
(2-23)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、天冬酰胺、天冬酰胺时,该PPR基序与C选择性结合;
(2-24)A1、A4以及Lii这3个氨基酸的组合依次为丝氨酸、天冬酰胺、天冬酰胺时,该PPR基序与C选择性结合;
(2-25)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、天冬酰胺、天冬酰胺时,该PPR基序与C选择性结合;
(2-26)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、天冬酰胺、丝氨酸时,该PPR基序与C选择性结合;
(2-27)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、天冬酰胺、丝氨酸时,该PPR基序与C选择性结合;
(2-28)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、天冬酰胺、苏氨酸时,该PPR基序与C选择性结合;
(2-29)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、天冬酰胺、苏氨酸时,该PPR基序与C选择性结合;
(2-30)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、天冬酰胺、色氨酸时,该PPR基序与C选择性结合、其次与T结合;
(2-31)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、天冬酰胺、色氨酸时,该PPR基序与T选择性结合、其次与C结合;
(2-32)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、脯氨酸、任意氨基酸时,该PPR基序与T选择性结合;
(2-33)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、脯氨酸、天冬氨酸时,该PPR基序与T选择性结合;
(2-34)A1、A4以及Lii这3个氨基酸的组合依次为苯丙氨酸、脯氨酸、天冬氨酸时,该PPR基序与T选择性结合;
(2-35)A1、A4以及Lii这3个氨基酸的组合依次为酪氨酸、脯氨酸、天冬氨酸时,该PPR基序与T选择性结合;
(2-36)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、丝氨酸、任意氨基酸时,该PPR基序与A和G选择性结合;
(2-37)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、丝氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-38)A1、A4以及Lii这3个氨基酸的组合依次为苯丙氨酸、丝氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-39)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、丝氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-40)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、苏氨酸、任意氨基酸时,该PPR基序与A和G选择性结合;
(2-41)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、苏氨酸、天冬氨酸时,该PPR基序与G选择性结合;
(2-42)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、苏氨酸、天冬氨酸时,该PPR基序与G选择性结合;
(2-43)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、苏氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-44)A1、A4以及Lii这3个氨基酸的组合依次为苯丙氨酸、苏氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-45)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、苏氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-46)A1、A4以及Lii这3个氨基酸的组合依次为缬氨酸、苏氨酸、天冬酰胺时,该PPR基序与A选择性结合;
(2-47)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、缬氨酸、任意氨基酸时,该PPR基序与A、C及T结合、但不与G结合;
(2-48)A1、A4以及Lii这3个氨基酸的组合依次为异亮氨酸、缬氨酸、天冬氨酸时,该PPR基序与C选择性结合、其次与A结合;
(2-49)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、缬氨酸、甘氨酸时,该PPR基序与C选择性结合;
(2-50)A1、A4以及Lii这3个氨基酸的组合依次为任意氨基酸、缬氨酸、苏氨酸时,该PPR基序与T选择性结合;基于上述关系决定的蛋白质具有选择性DNA碱基结合能力。
(3个氨基酸的特别优选的组合)
在RNA结合性的PPR基序中,存在识别各碱基并能够特异性结合的代表性的第1位、第4位、第ii位的氨基酸的组合。具体地说,在识别腺嘌呤的组合中,第1位为缬氨酸、第4位为苏氨酸、第ii位为天冬酰胺;在识别胞嘧啶的组合中,第1位为缬氨酸、第4位为天冬酰胺、第ii位为丝氨酸;在识别鸟嘌呤的组合中,第1位为缬氨酸、第4位为苏氨酸、第ii位为天冬氨酸;在识别尿嘧啶的组合中,第1位为缬氨酸、第4位为天冬酰胺、第ii位为天冬氨酸(上述非专利文献1~5)。本发明的一个优选方式中使用这些组合。
(凝聚性的改善)
本发明人根据天然存在的现有PPR基序的氨基酸信息发现,PPR基序的第6位的位置的氨基酸为疏水性(特别是亮氨酸)、第9位的位置的氨基酸为非亲水性的氨基酸(特别是甘氨酸)的情况非常多。根据已经获得了晶体结构的PPR蛋白的结构(非专利文献6:Coquille et al.,2014Nat.Commun.;PDB ID:4PJQ、4WN4、4WSL、4PJR;非专利文献7:Shenet al.,2015Nat.Commun.,PDB ID:5I9D、5I9F、5I9G、5I9H),第1基序(N末端侧)的第6位、第9位露出于外侧,因此可以想象由于该露出的疏水性氨基酸而表现出凝聚性(图1A)。另一方面,在第2基序以后,第6位、第9位的氨基酸埋入蛋白质内,形成疏水性核,因此认为若在全部基序的第6位、第9位加入亲水性残基,则蛋白质结构可能会破坏。因此,决定通过仅使第1基序的第6位、优选第6位及第9位的氨基酸为亲水性的氨基酸(天冬酰胺、天冬氨酸、谷氨酰胺、谷氨酸、赖氨酸、精氨酸、丝氨酸、苏氨酸)来减少PPR的凝聚性。
具体地说,如下所述。
在能够与具有特定碱基序列的靶核酸结合的蛋白质中,在从N末端起的第1个PPR基序(M1)中:
(1)使A6氨基酸为亲水性氨基酸,优选使A6氨基酸为天冬酰胺或天冬氨酸。
(2)进而使A9氨基酸为亲水性氨基酸或甘氨酸,优选为谷氨酰胺、谷氨酸、赖氨酸或甘氨酸。
(3)或者使A6氨基酸和A9氨基酸为下述任一种组合。
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酸的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酰胺的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为赖氨酸的组合
·A6氨基酸为天冬氨酸、且A9氨基酸为甘氨酸的组合
(新的PPR基序)
本发明提供通过上述方案发现的改善了凝聚性的新的PPR基序、以及包含其的新的PPR蛋白。
由本发明提供的新的PPR基序如下所述。
(C-1)由序列号4~7中的任一序列构成的PPR基序;
(C-2)由序列号4~7中的任一序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为胞嘧啶结合性的PPR基序;
(C-3)与序列号4~7中的任一序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为胞嘧啶结合性的PPR基序;
(A-1)由序列号8的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(A-2)由(A-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为腺嘌呤结合性的PPR基序;
(A-3)与(A-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为腺嘌呤结合性的PPR基序;
(G-1)由序列号9的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(G-2)由(G-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为鸟嘌呤结合性的PPR基序;
(G-3)与(G-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为鸟嘌呤结合性的PPR基序;
(U-1)由序列号10的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(U-2)由(U-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为尿嘧啶结合性的PPR基序;
(U-3)与(U-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为尿嘧啶结合性的PPR基序。
这样的PPR基序中,特别优选为下述PPR基序。
(C-1)由序列号4~7中的任一序列构成的PPR基序;
(C-2)由序列号4~7中的任一序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为胞嘧啶结合性的PPR基序;
(C-3)与序列号4~7中的任一序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为胞嘧啶结合性的PPR基序;
(A-1)序列号8的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的PPR基序;
(A-2)由(A-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为腺嘌呤结合性的PPR基序;
(A-3)与(A-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为腺嘌呤结合性的PPR基序;
(G-1)由序列号9的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的序列构成的PPR基序;
(G-2)由(G-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为鸟嘌呤结合性的PPR基序;
(G-3)与(G-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为鸟嘌呤结合性的PPR基序;
(U-1)由序列号10的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的序列构成的PPR基序;
(U-2)由(U-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为尿嘧啶结合性的PPR基序;
(U-3)与(U-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为尿嘧啶结合性的PPR基序。
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为谷氨酸的组合
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为谷氨酰胺的组合
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为赖氨酸的组合
·位置6的氨基酸为天冬氨酸、且位置9的氨基酸为甘氨酸的组合
序列号4~10的具体序列如图1以及序列表所示。
这样的PPR基序中,进一步优选为下述PPR基序。
(C-4)由序列号4的序列构成的PPR基序;
(A-4)由序列号58的序列构成的PPR基序;
(G-4)由序列号59的序列构成的PPR基序;
(U-4)由序列号60的序列构成的PPR基序。
序列号58~60的序列如下述序列以及序列表所示。
序列号58的序列VTYTTNIDQLCKAGKVDEALELFKEMRSKGVKPNV
序列号59的序列VTYTTNIDQLCKAGKVDEALELFDEMKERGIKPDV
序列号60的序列VTYNTNIDQLCKAGRLDEAEELLEEMEEKGIKPDV
(改善了凝聚性的PPR蛋白)
本发明还提供通过上述方案发现的改善了凝聚性的PPR蛋白。
在一个优选方式中,关于M1的A9氨基酸,不论M1的其他氨基酸为何种氨基酸、并且不论M1以外的基序的氨基酸序列如何,该M1的A9氨基酸均为非疏水性氨基酸或甘氨酸。非疏水性氨基酸为亲水性氨基酸、或者半胱氨酸或组氨酸;优选为亲水性氨基酸,即精氨酸、天冬酰胺、天冬氨酸、谷氨酸、谷氨酰胺、赖氨酸、丝氨酸或苏氨酸;更优选为谷氨酰胺、谷氨酸、赖氨酸。
在一个优选方式中,关于M1的A9氨基酸,不论M1的其他氨基酸为何种氨基酸、并且不论M1以外的基序的氨基酸序列如何,该M1的A9氨基酸均为谷氨酰胺、谷氨酸、赖氨酸或甘氨酸。
在一个优选方式中,关于M1的A6氨基酸,不论M1的其他氨基酸为何种氨基酸、并且不论M1以外的基序的氨基酸序列如何,该M1的A6氨基酸均为非疏水性氨基酸。非疏水性氨基酸例如为亲水性氨基酸、或者半胱氨酸或组氨酸;优选为亲水性氨基酸,即精氨酸、天冬酰胺、天冬氨酸、谷氨酸、谷氨酰胺、赖氨酸、丝氨酸或苏氨酸;更优选为天冬酰胺或天冬氨酸。
在一个特别优选的方式中,关于M1的A6氨基酸和A9氨基酸,不论M1的其他氨基酸为何种氨基酸、并且不论M1以外的基序的氨基酸序列如何,该M1的A6氨基酸和A9氨基酸均为下述任一种组合:
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酸的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酰胺的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为赖氨酸的组合
·A6氨基酸为天冬氨酸、且A9氨基酸为甘氨酸的组合
在RNA结合性的蛋白质的一个优选方式中,M1的A6氨基酸和A9氨基酸满足上述条件,并且所包含的PPR基序中的至少一个、优选半数以上、更优选全部PPR基序满足下述任一条件:
·所结合的碱基为胞嘧啶的情况下,A1为缬氨酸、A4为天冬酰胺、且Aii为丝氨酸
·所结合的碱基为腺嘌呤的情况下,A1为缬氨酸、A4为苏氨酸、且Aii为天冬酰胺
·所结合的碱基为鸟嘌呤的情况下,A1为缬氨酸、A4为苏氨酸、Aii为天冬氨酸
·所结合的碱基为尿嘧啶或胸腺嘧啶的情况下,A1为缬氨酸、A4为天冬酰胺、Aii为天冬氨酸
在RNA结合性的蛋白质的一个优选方式中,M1为上述新的PPR基序。
在一个特别优选的方式中,M1为由下述任一种多肽构成的PPR基序,
·所结合的碱基为胞嘧啶的情况下,由SEQ ID NOs:4-7中的任一序列构成的多肽
·所结合的碱基为腺嘌呤的情况下,SEQ ID NO:8的序列中的位置6和9的氨基酸按照满足下述段落所定义的任一种组合的方式发生了置换的多肽
·所结合的碱基为鸟嘌呤的情况下,SEQ ID NO:9的序列中的位置6和9的氨基酸按照满足下述段落所定义的任一种组合的方式发生了置换的多肽
·所结合的碱基为尿嘧啶的情况下,SEQ ID NO:10的序列中的位置6和9的氨基酸按照满足下述段落所定义的任一种组合的方式发生了置换的多肽
M1以外的PPR基序中的至少一个为由下述任一种多肽构成的PPR基序:
·所结合的碱基为胞嘧啶的情况下,由SEQ ID NO:2的序列构成的多肽
·所结合的碱基为腺嘌呤的情况下,由SEQ ID NO:8的序列构成的多肽
·所结合的碱基为鸟嘌呤的情况下,由SEQ ID NO:9的序列构成的多肽
·所结合的碱基为尿嘧啶的情况下,由SEQ ID NO:10的序列构成的多肽
上述段落中提到的组合为下述任一种组合:
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酸的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酰胺的组合
·A6氨基酸为天冬酰胺、且A9氨基酸为赖氨酸的组合
·A6氨基酸为天冬氨酸、且A9氨基酸为甘氨酸的组合
在一个特别优选的方式中,M1为由下述任一种多肽构成的PPR基序,
·所结合的碱基为胞嘧啶的情况下,由SEQ ID NOs:4的序列构成的多肽
·所结合的碱基为腺嘌呤的情况下,由SEQ ID NO:58的序列构成的多肽
·所结合的碱基为鸟嘌呤的情况下,由SEQ ID NO:59的序列构成的多肽
·所结合的碱基为尿嘧啶的情况下,由SEQ ID NO:60的序列构成的多肽
M1以外的PPR基序中的至少一个为由下述任一种多肽构成的PPR基序:
·所结合的碱基为胞嘧啶的情况下,由SEQ ID NO:2的序列构成的多肽
·所结合的碱基为腺嘌呤的情况下,由SEQ ID NO:8的序列中的位置15的氨基酸置换成赖氨酸的序列构成的多肽
·所结合的碱基为鸟嘌呤的情况下,由SEQ ID NO:9的序列构成的多肽
·所结合的碱基为尿嘧啶的情况下,由SEQ ID NO:10的序列构成的多肽
(性能高的PPR基序的骨架的应用)
在本发明的一个优选方式中,在针对胞嘧啶、腺嘌呤、鸟嘌呤、尿嘧啶(或胸腺嘧啶)各碱基的PPR基序中,可以使第1、4、6、9、ii位以外的氨基酸为特定的氨基酸。详细地说,在收集拟南芥的PPR基序序列中的位置1、4以及ii的氨基酸的组合为VTN(为了成为识别腺嘌呤的PPR基序)、VSN(为了成为识别胞嘧啶的PPR基序)、VTD(为了成为识别鸟嘌呤的PPR基序)、VND(为了成为识别尿嘧啶的PPR基序)的序列并对各位置出现的氨基酸的种类及其数目进行归纳时,通过选择在各位置以高频率出现的氨基酸,能够提高PPR基序的性能。
从使第1、4、6、9、ii位以外的氨基酸为如上所述以高频率出现的氨基酸的方面出发,为了得到RNA结合性的PPR蛋白,可以参考下述PPR基序的氨基酸序列。
作为对应于胞嘧啶的PPR基序,由SEQ ID NOs:4-7中的任一序列构成的PPR基序;
作为对应于腺嘌呤的PPR基序,由SEQ ID NO:8中的任一序列构成的PPR基序;
作为对应于鸟嘌呤的PPR基序,由SEQ ID NO:9中的任一序列构成的PPR基序;
作为对应于尿嘧啶的PPR基序,由SEQ ID NO:10中的任一序列构成的PPR基序。
(术语的说明等)
本发明中,在关于碱基序列(有时也称为核苷酸序列)或氨基酸序列提到“同一性”时,除了特别记载的情况以外,是指将两个序列以最佳方式比对时,两个序列间共有的一致的碱基或氨基酸的个数的百分率。即,可以通过同一性=(一致的位置的数量/位置的总数)×100来算出,可以使用市售的算法进行计算。另外,这样的算法被并入到Altschul etal.,J.Mol.Biol.215(1990)403-410中记载的NBLAST和XBLAST程序中。更详细地说,碱基序列或氨基酸序列的同一性的相关检索/分析可由本领域技术人员通过公知的算法或程序(例如BLASTN、BLASTP、BLASTX、ClustalW)来进行。使用程序时的参数可以由本领域技术人员适当地设定,另外也可以使用各程序的默认参数。这些分析方法的具体方法也是本领域技术人员公知的。
本说明书中,在关于碱基序列或氨基酸序列提到具有同一性(或同一性高)时,除了特别记载的情况以外,在任一情况下均是指具有至少70%、优选80%以上、更优选85%以上、进一步优选90%以上、进而优选95%以上、进而优选97.5%以上、进而优选99%以上的同一性的情况。
另外,本发明中,在关于PPR基序或蛋白质提到“置换、缺失或添加的序列”时,关于进行置换等的氨基酸的个数,除了特别记载的情况以外,在任一基序或蛋白质中,只要由该氨基酸序列构成的基序或蛋白质具有所期望的功能就均没有特别限定,为1~9个或1~4个左右,或者,若是置换为性质相似的氨基酸,则可以具有更多个数的置换等。用于制备与这样的氨基酸序列相关的多核苷酸或蛋白质的手段是本领域技术人员熟知的。
性质相似的氨基酸是指疏/亲水性、荷电、pKa、溶解性等物性相似的氨基酸,例如是指下述氨基酸。
疏水性氨基酸:丙氨酸、缬氨酸、甘氨酸、异亮氨酸、亮氨酸、苯丙氨酸、脯氨酸、色氨酸、酪氨酸
非疏水性氨基酸:精氨酸、天冬酰胺、天冬氨酸、谷氨酸、谷氨酰胺、赖氨酸、丝氨酸、苏氨酸、半胱氨酸、组氨酸;
亲水性氨基酸:精氨酸、天冬酰胺、天冬氨酸、谷氨酸、谷氨酰胺、赖氨酸、丝氨酸、苏氨酸;
酸性氨基酸:天冬氨酸、谷氨酸;
碱性氨基酸:赖氨酸、精氨酸、组氨酸;
中性氨基酸:丙氨酸、天冬酰胺、半胱氨酸、谷氨酰胺、甘氨酸、异亮氨酸、亮氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸;
含硫氨基酸:蛋氨酸、半胱氨酸;
含芳香环氨基酸:酪氨酸、色氨酸、苯丙氨酸。
关于基因、核酸、多核苷酸、蛋白质以及基序等,“制作”可以替换成“生产”或“制造”。另外,关于基因等,在将元件(parts)组合来进行制作的情况下,有时称为“构建”,“构建”也可以替换成“生产”或“制造”。
本发明的PPR基序、包含该PPR基序的蛋白质、或者编码它们的核酸可以由本领域技术人员利用现有技术以及本说明书实施例项的记载来制造。
[PPR蛋白的特征、用途]
(PPR蛋白凝聚性的改善)
使用本发明的新的PPR基序制作的PPR蛋白在细胞内的凝聚性减小。PPR蛋白的凝聚性可以由本领域技术人员通过在细胞内表达PPR蛋白并确认有无凝聚来进行评价。若使PPR蛋白与荧光蛋白融合来表达,则更容易进行确认。根据本发明人的研究,通过PPR蛋白的第一个基序中的氨基酸的适当改变,PPR蛋白在细胞内的凝聚性得到改善,向核中的转运性提高。
(结合力)
使用本发明的新的PPR基序制作的PPR蛋白不仅在细胞内的凝聚性减小,而且具有与使用针对相同的靶RNA的现有PPR基序制作的PPR蛋白同等或者比其更高的RNA结合性能。同等是指55%以上,优选是指75%左右。
对靶序列的结合力可以通过使用EMSA(电移位切试验,ElectrophoreticMobility Shift Assay)或Biacore的方法来评价。EMSA是利用下述性质的方法:在对蛋白质与核酸结合而成的样品进行电泳时,核酸分子的迁移率与未结合时相比发生变化。以Biacore为代表的分子间相互作用分析设备可以进行反应速度论分析,因此可进行详细的蛋白质-核酸结合分析。
对靶序列的结合力还可以通过向固相化的靶核酸供给包含候选蛋白的溶液、检测或定量与靶核酸结合的蛋白质来进行分析。该方法应用了ELISA(酶联免疫吸附试验,Enzyme-Linked Immuno Sorbent Assay),因此有时称为RPB-ELISA(RNA-蛋白质结合ELISA,RNA-protein binding ELISA)法。向固相化的靶核酸供给包含候选蛋白的溶液的步骤具体地说可以通过使包含对象结合蛋白的溶液流经固定于板上的靶核酸分子来实施。靶核酸分子的固定可以利用现有的各种固定方法,例如可以通过对涂布有链霉亲和素的孔板提供包含生物素修饰的靶核酸分子的核酸探针来实现。详细的实验条件可以参考本发明实施例项中详细说明的实验方法。在RPB-ELISA中,可以将加入了对象PPR蛋白和其靶RNA的样品的发光量减去背景信号(不加入靶RNA而加入对象PPR蛋白时的发光信号值)所得到的值作为对象PPR蛋白与其靶RNA的结合力。
[PPR蛋白的应用]
(复合体、融合蛋白)
由本发明提供的PPR基序或PPR蛋白可以连结功能性区域而制成复合体。还可以连结蛋白质性的功能性区域而制成融合蛋白。功能性区域是指在生物体内或细胞内具有特定的生物学功能例如酶功能、催化功能、抑制功能、亢进功能等功能的部分、或者具有作为标记的功能的部分。这样的区域例如由蛋白质、肽、核酸、生理活性物质、药剂构成。需要说明的是,下文中以融合蛋白为例对本发明的复合体进行说明,但本领域技术人员根据该说明也能够理解融合蛋白以外的复合体的情况。
在一个优选方式中,功能性区域为核糖核酸酶(RNase)。RNase的示例为RNase A(例如牛胰核糖核酸酶A:PDB 2AAS)、RNase H。
在一个优选方式中,功能性区域为荧光蛋白。荧光蛋白的示例为mCherry、EGFP、GFP、Sirius、EBFP、ECFP、mTurquoise、TagCFP、AmCyan、mTFP1、MidoriishiCyan、CFP、TurboGFP、AcGFP、TagGFP、Azami-Green、ZsGreen、EmGFP、HyPer、TagYFP、EYFP、Venus、YFP、PhiYFP、PhiYFP-m、TurboYFP、ZsYellow、mBanana、KusabiraOrange、mOrange、TurboRFP、DsRed-Express、DsRed2、TagRFP、DsRed-Monomer、AsRed2、mStrawberry、TurboFP602、mRFP1、JRed、KillerRed、HcRed、KeimaRed、mRasberry、mPlum、PS-CFP、Dendra2、Kaede、EosFP、KikumeGR。从改善作为融合蛋白的凝聚性和/或向核中有效转运的方面出发,优选例为mClover3。
在一个优选方式中,在靶为mRNA的情况下,功能性区域是提高来自靶mRNA的蛋白表达量的功能结构域(WO2017/209122)。提高来自mRNA的蛋白表达量的功能结构域的示例例如可以为已知直接或间接地促进mRNA的翻译的蛋白质的功能结构域的全部或具有功能性的一部分。更具体地说,可以为向mRNA诱导核糖体的结构域、与mRNA的翻译开始或翻译促进相关的结构域、与mRNA向核外的转运相关的结构域、与向内质网膜的结合相关的结构域、包含内质网驻留信号(ER retention signal)序列的结构域、或者包含内质网信号序列的结构域。更具体地说,上述向mRNA诱导核糖体的结构域可以为包含选自由DENR(密度调节蛋白,Density-regulated protein)、MCT-1(恶性T细胞扩增序列1,Malignant T-cellamplified sequence 1)、TPT1(翻译调控肿瘤蛋白,Translationally-controlled tumorprotein)、以及Lerepo4(锌指CCCH-结构域,Zinc finger CCCH-domain)组成的组中的多肽的全部或具有功能性的一部分的结构域。另外,上述与mRNA的翻译开始或翻译促进相关的结构域可以为包含选自由eIF4E及eIF4G组成的组中的多肽的全部或具有功能性的一部分的结构域。另外,上述与mRNA向核外的转运相关的结构域可以为包含SLBP(茎环结合蛋白,Stem-loop binding protein)的全部或具有功能性的一部分的结构域。另外,上述与向内质网膜的结合相关的结构域可以是包含选自由SEC61B、TRAP-alpha(易位子相关蛋白α,Translocon associated protein alpha)、SR-alpha、Dia1(细胞色素b5还原酶3,Cytochrome b5 reductase 3)以及p180组成的组中的多肽的全部或具有功能性的一部分的结构域。另外,上述内质网驻留信号(ER retention signal)序列可以为包含KDEL(SEQID NO:55)或KEEL(SEQ ID NO:56)序列的信号序列。另外,上述内质网信号序列可以为包含MGWSCIILFLVATATGAHS(SEQ ID NO:57)的信号序列。
本发明中,功能性区域可以融合在PPR蛋白的N末端侧,也可以融合在C末端侧,还可以融合在N末端侧和C末端侧两末端侧。另外,复合体或融合蛋白可以包含2个以上的功能性区域(例如2~5个)。此外,本发明的复合体或融合蛋白中,功能性区域与PPR蛋白可以通过接头等间接地融合。
(编码PPR蛋白等的核酸、载体、细胞)
本发明还提供编码上述PPR基序、PPR蛋白或融合蛋白的核酸、包含核酸的载体(例如用于扩增的载体、表达载体)。用于扩增的载体可以使用大肠杆菌或酵母作为宿主。本说明书中,表达载体是指例如从上游起包含具有启动子序列的DNA、编码所期望的蛋白质的DNA、以及具有终止子序列的DNA的载体,但只要发挥出所期望的功能,不一定必须按该顺序排列。本发明中,可以将本领域技术人员通常可使用的各种载体重组来使用。
本发明的PPR蛋白或融合蛋白可以在真核生物(例如动物、植物、微生物(酵母等)、原生生物)的细胞中发挥功能。本发明的融合蛋白特别是可在动物细胞内(体外或体内)发挥功能。作为可导入本发明的PPR蛋白或融合蛋白、或者表达其的载体的动物细胞,例如可以举出来源于人、猴、猪、牛、马、狗、猫、小鼠、大鼠的细胞。另外,作为可导入本发明的PPR蛋白或融合蛋白、或者表达其的载体的培养细胞,例如可以举出中国仓鼠卵巢(CHO)细胞、COS-1细胞、COS-7细胞、VERO(ATCC CCL-81)细胞、BHK细胞、犬肾来源的MDCK细胞、仓鼠AV-12-664细胞、HeLa细胞、WI38细胞、293细胞、293T细胞、PER.C6细胞,但并不限定于这些。
(用途)
本发明的PPR蛋白或融合蛋白具有能够将功能性区域以核酸序列特异性的方式输送到生物体内或细胞内而使其发挥功能的可能性。连结有GFP等标记部分的复合体可用于将所期望的RNA在生物体内可视化。
另外,本发明的PPR蛋白或融合蛋白具有能够在细胞内或生物体内进行核酸序列特异性的改造/破坏、并且能够赋予新功能的可能性。特别是RNA结合性的PPR蛋白参与了在细胞器中观察到的全部的RNA加工的步骤、切割、RNA编辑、翻译、剪接、RNA稳定化。因此,由本发明提供的PPR蛋白的改性的相关方法、以及由本发明提供的PPR基序及PPR蛋白可期待在各种领域中的下述应用。
(1)医疗
·制作识别并结合与特定疾病相关的特定RNA的PPR蛋白。另外,关于特定RNA,对靶序列进行分析,并对伴随的蛋白质进行分析。这些分析结果可在用于疾病治疗的化合物的探索中使用。
例如,在动物中,已知被鉴定为LRPPRC的PPR蛋白的异常会引起法国加拿大型Leigh氏综合征(Leigh syndrom French Canadian)(LSFC;Leigh氏综合征、亚急性坏死性脑脊髄病)。本发明可有助于LSFC的处置(预防、治疗、进展的抑制)。现有的PPR蛋白大多起到指定RNA操作(RNA上的遗传信息的转化;多数情况下为C→U)的编辑位点的作用。这种类型的PPR蛋白在C末端侧存在被提示与RNA编辑酶相互作用的附加基序。通过具有这样的结构的PPR蛋白,可期待导入碱基多态性、或者对起因于碱基多态性的疾病或状态进行处置。
·制作对RNA的抑制/表达进行了调控的细胞。这样的细胞包括对分化/未分化状态进行了监控的干细胞(例如iPS细胞);化妆品评价用模型细胞;以阐明药物创制的机理或药理试验为目的、能够进行功能性RNA表达的开/关的细胞。
·制作对与特定疾病相关的特定RNA特异性结合的PPR蛋白。将这样的PPR蛋白使用质粒、病毒载体、mRNA、纯化蛋白导入到细胞中,该PPR蛋白在细胞内与其靶RNA结合,由此能够改变(改善)作为疾病原因的RNA功能。改变功能的手段例如可以举出由结合引起的RNA结构的变化、由分解所致的基因敲低、由剪接所致的剪接反应的变化、碱基置换等。
(2)农林水产业
·在农作物、林产物、水产物等中,改善产量、品质。
·培育耐病性提高、环境耐性提高、具有提高的功能性或新的功能性的生物。
例如,关于杂交第一代(F1)作物,利用基于PPR蛋白的线粒体RNA的稳定化或翻译调控,人工制作出F1作物,具有改善产率、品质的可能性。基于PPR蛋白的RNA操作及基因组编辑能够比现有技术更准确且迅速地进行生物的品种改良、育种(对生物进行遗传性改良)。另外,基于PPR蛋白的RNA操作及基因组编辑不是像基因重组那样利用外来基因进行性状转化,而是对动植物本来具有的RNA或基因组进行处理的技术,从这一点出发可以说与突变体的筛选、回交之类的以往的育种方法相近。因此,对于全球规模的粮食问题、环境问题也可确实且迅速地应对。
(3)化学
·在利用微生物、培养细胞、植物体、动物体(例如昆虫体)的有用物质生产中,通过DNA、RNA的操作来调控蛋白表达量。由此可以提高有用物质的生产率。有用物质的示例除了抗体、疫苗、酶等蛋白质性的物质以外,还有药品的中间体、香料、色素等较低分子量的化合物。
·通过改变藻类、微生物的代谢途径来改善生物燃料的产生效率。
[实施例]
[实施例1:荧光蛋白融合PPR蛋白的细胞内分析]
(基序的设计)
使靶序列为CAG序列重复6次而成的CAGCAGCAGCAGCAGCAG(SEQ ID NO:1)。PPR基序通过第1位、第4位、第ii位的氨基酸序列来决定所识别的碱基。在识别胞嘧啶的PPR基序中,在第1位配置缬氨酸、在第4位配置天冬酰胺、在第ii位配置丝氨酸;在识别腺嘌呤的PPR基序中,在第1位配置缬氨酸、在第4位配置苏氨酸、在第ii位配置天冬酰胺;在识别鸟嘌呤的PPR基序中,在第1位配置缬氨酸、在第4位配置苏氨酸、在第ii位配置天冬氨酸。另外,在识别尿嘧啶的PPR基序中,第1位配置缬氨酸、第4位配置天冬酰胺、第ii位配置天冬氨酸即可。
此外,关于识别胞嘧啶的第1基序(图1A的变异基序(Mutated motif))的第6位、第9位的氨基酸,作为代表性的组合,选择亮氨酸和甘氨酸(C_6L9G、PPRcag_1、上述SEQ IDNO:2);作为变异型,选择亮氨酸和谷氨酸(C_6L9E、PPRcag_2、SEQ ID NO:3)、天冬酰胺和谷氨酰胺(C_6N9Q、PPRcag_3、SEQ ID NO:4)、天冬酰胺和谷氨酸(C6N9E、PPRcag_4、SEQ IDNO:5)、天冬酰胺和赖氨酸(C_6N9K、PPRcag_5、SEQ ID NO:6)、天冬氨酸和甘氨酸(C_6D9G、PPRcag_6、SEQ ID NO:7)(图1B)。使用这些PPR基序序列,按照与CAGCAGCAGCAGCAGCAG序列(上述SEQ ID NO:1)结合的方式排列,制作PPR基因(SEQ ID NOs:11-16)。需要说明的是,为了将编码各个PPR基序的18个DNA高效且准确地连结,在针对胞嘧啶、腺嘌呤、鸟嘌呤各碱基的PPR基序中,使第1、4、6、9、ii位以外的氨基酸为如上所述以高频率出现的氨基酸(SEQ IDNOs:8-9、参见上述专利文献1)。
(质粒的制作)
利用Golden Gate法构建包含PPR基因的质粒。更详细地说,准备按照依次无缝连结的方式设计的10种中间载体Dest-a、b、c、d、e、f、g、h、i、j,将1基序和2基序(A、C、G、U所对应的PPR基序、识别AA、AC、AG、AU、CA、CC、CG、CU、GA、GC、GG、GU、UA、UC、UG、UU各碱基组合的2个PPR基序)的20种基序分别插入到10种载体中,由此制作出200种元件。
Dest-a通过利用基因合成技术制作gaagacataaactccgtggtcacATACagagaccaaggtctcaGTGGtcacatacatgtcttc(SEQ ID NO:43)并克隆至pUC57-kan中来制备;
Dest-b通过利用基因合成技术制作gaagacatATACagagaccaaggtctcaGTGGtgacataatgtcttc(SEQ ID NO:44)并克隆至pUC57-kan中来制备;
Dest-c通过利用基因合成技术制作gaagacatcATACagagaccaaggtctcaGTGGttacatatgtcttc(SEQ ID NO:45)并克隆至pUC57-kan中来制备;
Dest-d通过利用基因合成技术制作gaagacatacATACagagaccaaggtctcaGTGGttacaatgtcttc(SEQ ID NO:46)并克隆至pUC57-kan中来制备;
Dest-e通过利用基因合成技术制作gaagacattacATACagagaccaaggtctcaGTGGtgacatgtcttc(SEQ ID NO:47)并克隆至pUC57-kan中来制备;
Dest-f通过利用基因合成技术制作gaagacattgacATACagagaccaaggtctcaGTGGttaatgtcttc(SEQ ID NO:48)并克隆至pUC57-kan中来制备;
Dest-g通过利用基因合成技术制作gaagacatgttacATACagagaccaaggtctcaGTGGtcatgtcttc(SEQ ID NO:49)并克隆至pUC57-kan中来制备;
Dest-h通过利用基因合成技术制作gaagacatggtcacATACagagaccaaggtctcaGTGGtatgtcttc(SEQ ID NO:50)并克隆至pUC57-kan中来制备;
Dest-i通过利用基因合成技术制作gaagacattggttacATACagagaccaaggtctcaGTGGatgtcttc(SEQ ID NO:51)并克隆至pUC57-kan中来制备;
Dest-j通过利用基因合成技术制作gaagacatgtggtgacATACagagaccaaggtctcaGTGGtcttc(SEQ ID NO:52)并克隆至pUC57-kan中来制备。
根据靶碱基序列选择Dest-a至Dest-j,通过Golden Gate反应克隆到载体中。此处使用的载体按照在18个连结的PPR序列的N末端附加MGNSV(SEQ ID NO:53)的氨基酸序列、在C末端附加ELTYNTLISGLGKAGRARDPPV(SEQ ID NO:54)的氨基酸序列的方式来设计。确认到能够克隆出正确大小的基因,并且通过测序确认了克隆得到的基因的序列。
(在细胞内的表达的检测)
动物培养细胞中的表达质粒pcDNA3.1包含CMV启动子和SV40多聚A信号序列,可以在它们之间插入希望表达的基因。为了检测PPR蛋白在细胞内的表达,决定使融合有荧光蛋白的PPR蛋白进行表达,根据其荧光图像对细胞内的凝聚性及向核中的转运性进行分析。向pcDNA3.1中插入从N末端侧起依次融合有EGFP、核转运信号序列、PPR蛋白、FLAG表位标签的蛋白基因(SEQ ID NOs:17-22)。另外,向pcDNA3.1中插入从N末端侧起依次融合有mClover3、PPR蛋白、核转运信号序列、FLAG表位标签的蛋白基因(SEQ ID NOs:23-28)。作为对照,还制作了不含PPR的质粒(SEQ ID NOs:35-36)。
将HEK293T细胞以1×106细胞/孔接种在加入有9mL DMEM、1mL FBS的10cm培养皿中。在37℃、5%CO2环境下培养2天后,将细胞回收。将回收的细胞以每1孔中4×104细胞/孔接种在包被有PLL的96孔板中,在37℃、5%CO2环境下培养1天。将200ng质粒DNA、0.6μLFugene(注册商标)-HD(Promega、E2311)、200μL Opti-MEM混合,全部加入到孔中,在37℃、5%CO2环境下培养1天。培养后除去培养基,用50μLPBS清洗1次后,加入1μL Hoechst(1mg/mL、同仁化学、346-07951)、50μL PBS,在37℃、5%CO2环境下放置10分钟,之后用50μL PBS清洗1次。清洗后加入50μL PBS,使用荧光显微镜DMi8(Leica)获取各孔的GFP荧光及Hoechst荧光图像。
将结果示于图2。对融合有EGFP及核转运信号序列的PPR在细胞内的表达进行确认的结果是,确认到PPRcag_1(6L9G)和PPRcag_2(6L9E)未定位在核中而在核的周围显著凝聚的状态。另一方面,PPRcag_3(6N9Q)、PPRcag_4(6N9E)、PPRcag_5(6N9K)、PPRcag_6(6D9G)虽然凝聚性低,但未定位在核中。在融合有mClover3的情况下,确认到PPRcag_1(6L9G)和PPRcag_2(6L9E)定位在核中、但在核中发生凝聚的状态。PPRcag_3(6N9Q)、PPRcag_4(6N9E)、PPRcag_5(6N9K)、PPRcag_6(6D9G)定位在核中,并且未观察到凝聚性。因此可知,为了改善凝聚性,优选6N9E、6N9Q、6N9K、6D9G变异,另外为了有效地定位在核中,使用mClover3比EGFP更好。
[实施例2:CAG结合PPR蛋白的RNA结合分析]
为了确认PPRcag_1、PPRcag_2、PPRcag_3、PPRcag_4、PPRcag_5、PPRcag_6与靶RNA的结合,制作重组蛋白质,进行了结合实验。
设计在各PPR蛋白的N末端侧融合有荧光素酶、在C末端侧融合有6×组氨酸标签序列的蛋白基因,克隆到大肠杆菌表达质粒中(SEQ ID NOs:29-34)。另外,作为对照,还制作了不包含PPR蛋白的Nluc-Hisx6蛋白基因(SEQ ID NO:37)。
将所完成的质粒转化到大肠杆菌Rosetta(DE3)株中。将该大肠杆菌在2mL的加入有100μg/mL氨苄青霉素的LB培养基中在37℃培养12小时,在OD600从0.5达到0.8时,将培养液转移到15℃的温箱中,静置30分钟。之后加入100μL(最终浓度0.1mM)的IPTG,在15℃进行16小时培养。通过5,000×g、4℃、10分钟的离心回收大肠杆菌团块,加入1.5mL裂解缓冲液(20mM Tris-HCl pH8.0、150mM NaCl、0.5%NP-40、1mM MgCl2、2mg/ml溶菌酶、1mM PMSF、2ul DNase),在-80℃冷冻20分钟。一边在25℃渗透30分钟,一边进行细胞的冷冻破碎。接着进行3700rpm、4℃、15分钟的离心操作,回收包含可溶性PPR蛋白的上清(大肠杆菌裂解液)。
PPR蛋白与RNA的结合实验通过链霉亲和素板上的PPR蛋白与生物素化RNA的结合实验的方法来进行。
合成对包含作为靶的CAGx6序列、以及非靶的CGGx6、CUGx6、CCGx6和D1b(UGGUGUAUCUUGUCUUUA)序列(SEQ ID NO:42的8-25位)的30碱基的RNA(依次分别为SEQ IDNOs:38-42)进行5’末端生物素修饰而得到的RNA探针Grainer)。将2.5pmol生物素化RNA探针添加到链霉亲和素包被板(Cat No.15502、Thermo fisher)中,在室温反应30分钟,利用探针清洗缓冲液(20mM Tris-HCl(pH7.6)、150mM NaCl、5mM MgCl2、0.5%NP-40、1mM DTT、0.1%BSA)进行清洗。为了测定背景,还准备了不加入生物素化RNA但加入了裂解缓冲液的孔(-探针(Probe))。之后加入封闭缓冲液(20mM Tris-HCl(pH 7.6)、150mM NaCl、5mMMgCl2、0.5%NP-40、1mM DTT、1%BSA),在室温对板表面进行30分钟的封闭。向其中加入100μL包含具有1.5×108LU/μL发光量的荧光素酶融合PPR蛋白的大肠杆菌裂解液,在室温进行30分钟的结合反应。之后用200μL的清洗缓冲液(20mM Tris-HCl(pH7.6)、150mM NaCl、5mMMgCl2、0.5%NP-40、1mM DTT)进行5次清洗。将利用清洗缓冲液进行了2500倍稀释的荧光素酶底物(Promega、E151A)40μL加入到孔中,反应5分钟后,用酶标仪(PerkinElmer、CatNo.5103-35)测定发光量。
将其结果示于图3。可知全部PPR均与作为靶的CAGx6特异性地结合。关于与靶序列的结合力,与PPRcag_1相比,PPRcag_2为同等程度,PPRcag_3为80%左右,PPRcag_4为60%左右,PPRcag_5为120%左右,PPRcag_6为130%左右。由这些结果可知,除了PPRcag_4以外,几乎未观察到因变异所致的结合性能的变化。
[实施例3:PPR蛋白的凝聚的调控]
利用大肠杆菌表达系统分别制作使用V2基序的PPR蛋白(碱基序列为SEQ ID NO:61、氨基酸序列为SEQ ID NO:62)、以及使用v3.2基序的PPR蛋白(碱基序列为SEQ ID NO:63、氨基酸序列为SEQ ID NO:64)并进行纯化,利用凝胶过滤色谱法进行分离。需要说明的是,v2基序是指具有SEQ ID NO:2、SEQ ID NOs:8~10的序列的PPR基序,关于v3.2基序,在从N末端起的第1个基序的情况下,是指具有SEQ ID NO:4、SEQ ID NOs:58~60中的任一序列的PPR基序,除此以外的情况下,对于腺嘌呤,是指具有将SEQ ID NO:8中的第15位的天冬氨酸置换成赖氨酸的序列的PPR基序;对于腺嘌呤以外的碱基,是指具有选自SEQ ID NOs:2、9、10中的序列的PPR基序。
(蛋白质的表达/纯化)
使用包含编码目标PPR的DNA序列的pE-SUMOpro Kan质粒,对大肠杆菌Rosetta株进行转化,在37度进行培养,之后在OD600达到0.6时将温度降至20度,加入IPTG使最终浓度达到0.5mM,使目标PPR蛋白以SUMO融合蛋白的形式在大肠杆菌内表达。培养1夜后,通过离心进行菌体的集菌,用裂解缓冲液(50mM Tris-HCl pH8.0、500mM NaCl)重悬。通过超声波破碎将大肠杆菌破碎,在17000g离心30分钟后,将上清级分供给至Ni-琼脂糖柱上,用包含20mM咪唑的裂解缓冲液进行柱清洗,之后利用包含400mM咪唑的裂解缓冲液来洗脱SUMO融合目标PPR蛋白。洗脱后,利用Ulp1从目标PPR蛋白上切除SUMO蛋白,同时通过透析将蛋白溶液置换成离子交换缓冲液(50mM Tris-Hcl pH8.0、200mM NaCl)。之后进行使用SP柱的阳离子交换层析。供给至柱上后,使NaCl浓度从200mM缓慢地升至1M,由此进行蛋白质的洗脱。通过使用Superdex200柱的凝胶过滤色谱法对包含目标PPR蛋白的级分进行最终纯化。将由离子交换洗脱的目标PPR蛋白供给至利用凝胶过滤缓冲液(25mM HEPES pH7.5、200mM NaCl、0.5mM三(2-羧基乙基)膦(TCEP))平衡后的凝胶过滤柱上。最后将包含目标PPR蛋白的级分浓缩,用液氮冷冻,在-80度进行保存,直至用于下次分析。
(凝胶过滤色谱法)
将纯化后的重组PPR蛋白调整为1mg/ml的浓度。凝胶过滤色谱法使用Superdex200increase 10/300GL(GE Helthcare)。将调整后的蛋白质供给至利用25mM HEPESpH7.5、200mM NaCl、0.5mM三(2-羧基乙基)膦(TCEP)平衡后的凝胶过滤柱上,测定由凝胶过滤柱洗脱出的溶液的280nm的吸光度,由此对蛋白质的性质进行分析。
(结果)
将结果示于图4。洗脱级分(Elution vol.)越少,分子尺寸越大。v2在8至10mL的洗脱级分中洗脱,另一方面,v3.2在12至14mL的洗脱级分中观察到峰。由此可知,v2中,由于蛋白质尺寸增大而暗示出发生凝聚的可能性,该凝聚在v3.2中得到了改善。
序列表
<110> 日商基因编辑力股份有限公司(EditForce Inc.)
国立大学法人九州大学(Kyushu University)
<120> 凝聚少的PPR蛋白及其应用(Low-cohesive PPR Proteins and Use thereof)
<130> F20689K
<150> JP2019-100553
<151> 2019-05-29
<160> 64
<170> PatentIn version 3.5
<210> 1
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 靶序列(target sequence)
<400> 1
cagcagcagc agcagcag 18
<210> 2
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif)
<400> 2
Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 3
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif)
<400> 3
Val Thr Tyr Asn Thr Leu Ile Asp Glu Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 4
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif), 1st_U (v3.2_U)
<400> 4
Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 5
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif)
<400> 5
Val Thr Tyr Asn Thr Asn Ile Asp Glu Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 6
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif)
<400> 6
Val Thr Tyr Asn Thr Asn Ile Asp Lys Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 7
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif)
<400> 7
Val Thr Tyr Asn Thr Asp Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 8
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif)
<400> 8
Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val
1 5 10 15
Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys
20 25 30
Pro Asn Val
35
<210> 9
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif)
<400> 9
Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val
1 5 10 15
Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys
20 25 30
Pro Asp Val
35
<210> 10
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基序(PPR motif)
<400> 10
Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg Leu
1 5 10 15
Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys
20 25 30
Pro Asp Val
35
<210> 11
<211> 2303
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基因(PPR gene)
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1935)..(1935)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1963)..(1963)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2004)..(2004)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2032)..(2032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2073)..(2073)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2101)..(2101)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2142)..(2142)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2170)..(2170)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2211)..(2211)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2239)..(2239)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2280)..(2280)
<223> n为a、c、g、t或u
<400> 11
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntdgcks gkakkmkgts vvtyttdgck 1920
agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980
vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040
akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100
ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160
krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220
kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280
vvtyttdgck agkvdadmkr gkd 2303
<210> 12
<211> 2302
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基因(PPR gene)
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1934)..(1934)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1962)..(1962)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2003)..(2003)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2031)..(2031)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2072)..(2072)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2100)..(2100)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2141)..(2141)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2169)..(2169)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2210)..(2210)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2238)..(2238)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2279)..(2279)
<223> n为a、c、g、t或u
<400> 12
gtcacataca acaccctgat cgacgaactg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntdcksg kakkmkgtsv vtyttdgcka 1920
gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv 1980
tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka 2040
kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn 2100
tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk 2160
rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck 2220
agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv 2280
vtyttdgcka gkvdadmkrg kd 2302
<210> 13
<211> 2303
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基因(PPR gene)
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1896)..(1896)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1935)..(1935)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1963)..(1963)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2004)..(2004)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2032)..(2032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2073)..(2073)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2101)..(2101)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2142)..(2142)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2170)..(2170)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2211)..(2211)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2239)..(2239)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2280)..(2280)
<223> n为a、c、g、t或u
<400> 13
gtcacataca acaccaacat cgaccagctg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntndcks gkakkmkgts vvtyttdgck 1920
agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980
vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040
akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100
ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160
krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220
kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280
vvtyttdgck agkvdadmkr gkd 2303
<210> 14
<211> 2303
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基因(PPR gene)
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1896)..(1896)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1935)..(1935)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1963)..(1963)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2004)..(2004)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2032)..(2032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2073)..(2073)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2101)..(2101)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2142)..(2142)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2170)..(2170)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2211)..(2211)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2239)..(2239)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2280)..(2280)
<223> n为a、c、g、t或u
<400> 14
gtcacataca acaccaacat cgacgaactg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntndcks gkakkmkgts vvtyttdgck 1920
agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980
vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040
akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100
ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160
krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220
kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280
vvtyttdgck agkvdadmkr gkd 2303
<210> 15
<211> 2304
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基因(PPR gene)
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1896)..(1896)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1936)..(1936)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1964)..(1964)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2005)..(2005)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2033)..(2033)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2074)..(2074)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2102)..(2102)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2143)..(2143)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2171)..(2171)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2212)..(2212)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2240)..(2240)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2281)..(2281)
<223> n为a、c、g、t或u
<400> 15
gtcacataca acaccaacat cgacaaactg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntndkck sgkakkmkgt svvtyttdgc 1920
kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks gkakkmkgts 1980
vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg 2040
kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt 2100
yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad 2160
mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 2220
ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 2280
nvvtyttdgc kagkvdadmk rgkd 2304
<210> 16
<211> 2304
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR基因(PPR gene)
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1936)..(1936)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1964)..(1964)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2005)..(2005)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2033)..(2033)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2074)..(2074)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2102)..(2102)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2143)..(2143)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2171)..(2171)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2212)..(2212)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2240)..(2240)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2281)..(2281)
<223> n为a、c、g、t或u
<400> 16
gtcacataca acaccgatat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntddgck sgkakkmkgt svvtyttdgc 1920
kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks gkakkmkgts 1980
vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg 2040
kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt 2100
yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad 2160
mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 2220
ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 2280
nvvtyttdgc kagkvdadmk rgkd 2304
<210> 17
<211> 3481
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3070)..(3070)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3098)..(3098)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3139)..(3139)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3167)..(3167)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3208)..(3208)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3236)..(3236)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3277)..(3277)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3305)..(3305)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3346)..(3346)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3374)..(3374)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3415)..(3415)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3441)..(3441)
<223> n为a、c、g、t或u
<400> 17
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd 3060
akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120
dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420
tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480
r 3481
<210> 18
<211> 3480
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3069)..(3069)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3097)..(3097)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3138)..(3138)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3166)..(3166)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3207)..(3207)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3235)..(3235)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3276)..(3276)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3304)..(3304)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3345)..(3345)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3373)..(3373)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3414)..(3414)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3440)..(3440)
<223> n为a、c、g、t或u
<400> 18
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc ctgatcgacg aactgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt dcksgkakkm kgtsvvtytt dgckagdvda 3060
kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk gtsvvtyttd 3120
gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc ksgkakkmkg 3180
tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 3240
sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 3300
vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 3360
admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3420
dgckagkvda dmkrgkdtyn tsggkagrar dvssgdykdh dgdykdhddy kddddkmagr 3480
<210> 19
<211> 3481
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3031)..(3031)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3070)..(3070)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3098)..(3098)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3139)..(3139)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3167)..(3167)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3208)..(3208)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3236)..(3236)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3277)..(3277)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3305)..(3305)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3346)..(3346)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3374)..(3374)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3415)..(3415)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3441)..(3441)
<223> n为a、c、g、t或u
<400> 19
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc aacatcgacc agctgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt ndcksgkakk mkgtsvvtyt tdgckagdvd 3060
akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120
dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420
tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480
r 3481
<210> 20
<211> 3481
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3031)..(3031)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3070)..(3070)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3098)..(3098)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3139)..(3139)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3167)..(3167)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3208)..(3208)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3236)..(3236)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3277)..(3277)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3305)..(3305)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3346)..(3346)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3374)..(3374)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3415)..(3415)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3441)..(3441)
<223> n为a、c、g、t或u
<400> 20
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc aacatcgacg aactgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt ndcksgkakk mkgtsvvtyt tdgckagdvd 3060
akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120
dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420
tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480
r 3481
<210> 21
<211> 3482
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3031)..(3031)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3071)..(3071)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3099)..(3099)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3140)..(3140)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3168)..(3168)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3209)..(3209)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3237)..(3237)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3278)..(3278)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3306)..(3306)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3347)..(3347)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3375)..(3375)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3416)..(3416)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3442)..(3442)
<223> n为a、c、g、t或u
<400> 21
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc aacatcgaca aactgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt ndkcksgkak kmkgtsvvty ttdgckagdv 3060
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3120
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3180
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3240
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3300
dvvtyntdgc ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk 3360
vdadmkrgkd vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty 3420
ttdgckagkv dadmkrgkdt yntsggkagr ardvssgdyk dhdgdykdhd dykddddkma 3480
gr 3482
<210> 22
<211> 3482
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3071)..(3071)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3099)..(3099)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3140)..(3140)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3168)..(3168)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3209)..(3209)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3237)..(3237)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3278)..(3278)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3306)..(3306)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3347)..(3347)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3375)..(3375)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3416)..(3416)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3442)..(3442)
<223> n为a、c、g、t或u
<400> 22
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc gatatcgacg gcctgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt ddgcksgkak kmkgtsvvty ttdgckagdv 3060
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3120
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3180
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3240
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3300
dvvtyntdgc ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk 3360
vdadmkrgkd vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty 3420
ttdgckagkv dadmkrgkdt yntsggkagr ardvssgdyk dhdgdykdhd dykddddkma 3480
gr 3482
<210> 23
<211> 3551
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3113)..(3113)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3141)..(3141)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3182)..(3182)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3210)..(3210)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3251)..(3251)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3279)..(3279)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3320)..(3320)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3348)..(3348)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3389)..(3389)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3417)..(3417)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3458)..(3458)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3484)..(3484)
<223> n为a、c、g、t或u
<400> 23
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccctgat cgacggcctg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120
gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180
knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480
dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540
kmakkkrkvg r 3551
<210> 24
<211> 3550
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3112)..(3112)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3140)..(3140)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3181)..(3181)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3209)..(3209)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3250)..(3250)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3278)..(3278)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3319)..(3319)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3347)..(3347)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3388)..(3388)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3416)..(3416)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3457)..(3457)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3483)..(3483)
<223> n为a、c、g、t或u
<400> 24
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccctgat cgacgaactg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntdcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 3120
ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 3180
nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd 3240
akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3300
dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3360
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3420
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3480
tyntsggkag rardvsskkk rkvdkkkrkv dkkkrkvgsd ykdhdgdykd hddykddddk 3540
makkkrkvgr 3550
<210> 25
<211> 3551
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3074)..(3074)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3113)..(3113)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3141)..(3141)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3182)..(3182)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3210)..(3210)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3251)..(3251)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3279)..(3279)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3320)..(3320)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3348)..(3348)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3389)..(3389)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3417)..(3417)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3458)..(3458)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3484)..(3484)
<223> n为a、c、g、t或u
<400> 25
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgaccagctg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntndcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120
gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180
knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480
dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540
kmakkkrkvg r 3551
<210> 26
<211> 3551
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3074)..(3074)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3113)..(3113)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3141)..(3141)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3182)..(3182)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3210)..(3210)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3251)..(3251)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3279)..(3279)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3320)..(3320)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3348)..(3348)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3389)..(3389)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3417)..(3417)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3458)..(3458)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3484)..(3484)
<223> n为a、c、g、t或u
<400> 26
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgacgaactg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntndcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120
gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180
knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480
dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540
kmakkkrkvg r 3551
<210> 27
<211> 3552
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3074)..(3074)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3114)..(3114)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3142)..(3142)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3183)..(3183)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3211)..(3211)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3252)..(3252)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3280)..(3280)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3321)..(3321)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3349)..(3349)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3390)..(3390)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3418)..(3418)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3459)..(3459)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3485)..(3485)
<223> n为a、c、g、t或u
<400> 27
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgacaaactg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntndkcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3120
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3180
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3240
vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty 3300
ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk 3360
mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd 3420
gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg 3480
kdtyntsggk agrardvssk kkrkvdkkkr kvdkkkrkvg sdykdhdgdy kdhddykddd 3540
dkmakkkrkv gr 3552
<210> 28
<211> 3552
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PPR载体(PPR vector)
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3114)..(3114)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3142)..(3142)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3183)..(3183)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3211)..(3211)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3252)..(3252)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3280)..(3280)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3321)..(3321)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3349)..(3349)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3390)..(3390)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3418)..(3418)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3459)..(3459)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3485)..(3485)
<223> n为a、c、g、t或u
<400> 28
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccgatat cgacggcctg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntddgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3120
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3180
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3240
vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty 3300
ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk 3360
mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd 3420
gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg 3480
kdtyntsggk agrardvssk kkrkvdkkkr kvdkkkrkvg sdykdhdgdy kdhddykddd 3540
dkmakkkrkv gr 3552
<210> 29
<211> 3189
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NL_PPRcag_1
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2787)..(2787)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2815)..(2815)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2856)..(2856)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2884)..(2884)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2953)..(2953)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2994)..(2994)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3022)..(3022)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3063)..(3063)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3091)..(3091)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3132)..(3132)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3158)..(3158)
<223> n为a、c、g、t或u
<400> 29
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntdgc ksgkakkmkg 2760
tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820
sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880
vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940
admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120
vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180
ghhhhhhgr 3189
<210> 30
<211> 3188
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NL_PPRcag_2
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2786)..(2786)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2814)..(2814)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2855)..(2855)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2883)..(2883)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2924)..(2924)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2993)..(2993)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3021)..(3021)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3062)..(3062)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3090)..(3090)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3131)..(3131)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3157)..(3157)
<223> n为a、c、g、t或u
<400> 30
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacaccc tgatcgacga actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntdck sgkakkmkgt 2760
svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks 2820
gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv 2880
tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda 2940
dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3000
gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3060
knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3120
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdtyntsg gkagrardvs sgsggsgggg 3180
hhhhhhgr 3188
<210> 31
<211> 3189
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NL_PPRcag_3
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2748)..(2748)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2787)..(2787)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2815)..(2815)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2856)..(2856)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2884)..(2884)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2953)..(2953)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2994)..(2994)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3022)..(3022)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3063)..(3063)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3091)..(3091)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3132)..(3132)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3158)..(3158)
<223> n为a、c、g、t或u
<400> 31
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacacca acatcgacca gctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndc ksgkakkmkg 2760
tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820
sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880
vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940
admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120
vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180
ghhhhhhgr 3189
<210> 32
<211> 3189
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NL_PPRcag_4
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2748)..(2748)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2787)..(2787)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2815)..(2815)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2856)..(2856)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2884)..(2884)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2953)..(2953)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2994)..(2994)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3022)..(3022)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3063)..(3063)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3091)..(3091)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3132)..(3132)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3158)..(3158)
<223> n为a、c、g、t或u
<400> 32
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacacca acatcgacga actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndc ksgkakkmkg 2760
tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820
sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880
vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940
admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120
vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180
ghhhhhhgr 3189
<210> 33
<211> 3190
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NL_PPRcag_5
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2748)..(2748)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2788)..(2788)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2816)..(2816)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2857)..(2857)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2885)..(2885)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2954)..(2954)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2995)..(2995)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3064)..(3064)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3092)..(3092)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3133)..(3133)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3159)..(3159)
<223> n为a、c、g、t或u
<400> 33
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacacca acatcgacaa actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndk cksgkakkmk 2760
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 2820
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 2880
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 2940
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3000
tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk 3060
gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag 3120
dvdakmrskg vknvvtyttd gckagkvdad mkrgkdtynt sggkagrard vssgsggsgg 3180
gghhhhhhgr 3190
<210> 34
<211> 3190
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NL_PPRcag_1
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2788)..(2788)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2816)..(2816)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2857)..(2857)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2885)..(2885)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2954)..(2954)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (2995)..(2995)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3064)..(3064)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3092)..(3092)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3133)..(3133)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (3159)..(3159)
<223> n为a、c、g、t或u
<400> 34
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacaccg atatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntddg cksgkakkmk 2760
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 2820
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 2880
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 2940
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3000
tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk 3060
gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag 3120
dvdakmrskg vknvvtyttd gckagkvdad mkrgkdtynt sggkagrard vssgsggsgg 3180
gghhhhhhgr 3190
<210> 35
<211> 1066
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> GFPnls
<220>
<221> misc_feature
<222> (878)..(878)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (934)..(934)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (946)..(946)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (954)..(954)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (959)..(959)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (961)..(961)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (964)..(964)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (972)..(972)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (976)..(976)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (980)..(980)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (989)..(989)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (996)..(996)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1006)..(1006)
<223> n为a、c、g、t或u
<400> 35
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg aggtagcggg 780
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 840
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 900
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 960
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 1020
dykkkkrkvs hgsggsgggs gdykdhdgdy kdhddykddd dkmagr 1066
<210> 36
<211> 1170
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> mClover3nls
<220>
<221> misc_feature
<222> (959)..(959)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (972)..(972)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1029)..(1029)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1037)..(1037)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1042)..(1043)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1054)..(1054)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1058)..(1058)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1062)..(1062)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1072)..(1072)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1079)..(1079)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (1089)..(1089)
<223> n为a、c、g、t或u
<400> 36
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg atccggcgga ctcagtagcc ccaagaagaa acgcaaagtc 780
gaggatccaa agaagaaaag gaaggttgaa gaccccaaga aaaagaggaa ggtgggttcc 840
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 900
gataagatgg ccccaaagaa gaagcggaag gtcggacgct agmagvskgt gvvvdgdvng 960
hksvrgggda tngktkcttg kvwtvttgyg vacsrydhmk hdksamgyvr tskddgtykt 1020
ravkgdtvnr kgdkdgnghk ynnshyvyta dkknckankr hnvdgsvadh yntgdgvdnh 1080
yshskskdnk rdhmvvtaag thgmdyksrh mgsggsskkk rkvdkkkrkv dkkkrkvgsd 1140
ykdhdgdykd hddykddddk makkkrkvgr 1170
<210> 37
<211> 862
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NL对照(NL control)
<220>
<221> misc_feature
<222> (674)..(674)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (730)..(730)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (742)..(742)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (750)..(750)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (755)..(755)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (757)..(757)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (760)..(760)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (768)..(768)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (772)..(772)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (776)..(776)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (785)..(785)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (792)..(792)
<223> n为a、c、g、t或u
<220>
<221> misc_feature
<222> (802)..(802)
<223> n为a、c、g、t或u
<400> 37
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggatccgg cggactcagt 600
agcggctccg gcggcagcgg gggaggcggg catcatcacc atcaccacgg acgctagmag 660
vskgtgvvvd gdvnghksvs gggdatygkt kcttgkvwtv tttygvcsry dhmkhdksam 720
gyvrtkddgn yktravkgdt vnrkgdkdgn ghkynynshn vymadkkngk vnkrhndgsv 780
adhyntgdgv dnhystsask dnkrdhmvvt aagtgmdykk kkrkvshgsg gsgggsgdyk 840
dhdgdykdhd dykddddkma gr 862
<210> 38
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> RNA探针(RNA probe)
<400> 38
gacaugccag cagcagcagc agcaggacug 30
<210> 39
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> RNA探针(RNA probe)
<400> 39
gacaugccgg cggcggcggc ggcgggacug 30
<210> 40
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> RNA探针(RNA probe)
<400> 40
gacacugcug cugcugcugc ugcugaugca 30
<210> 41
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> RNA探针(RNA probe)
<400> 41
gacaccgccg ccgccgccgc cgccggacug 30
<210> 42
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> RNA探针(RNA probe)
<400> 42
gacaugcugg uguaucuugu cuuuagacug 30
<210> 43
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-a
<400> 43
gaagacataa actccgtggt cacatacaga gaccaaggtc tcagtggtca catacatgtc 60
ttc 63
<210> 44
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-b
<400> 44
gaagacatat acagagacca aggtctcagt ggtgacataa tgtcttc 47
<210> 45
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-c
<400> 45
gaagacatca tacagagacc aaggtctcag tggttacata tgtcttc 47
<210> 46
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-d
<400> 46
gaagacatac atacagagac caaggtctca gtggttacaa tgtcttc 47
<210> 47
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-e
<400> 47
gaagacatta catacagaga ccaaggtctc agtggtgaca tgtcttc 47
<210> 48
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-f
<400> 48
gaagacattg acatacagag accaaggtct cagtggttaa tgtcttc 47
<210> 49
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-g
<400> 49
gaagacatgt tacatacaga gaccaaggtc tcagtggtca tgtcttc 47
<210> 50
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-h
<400> 50
gaagacatgg tcacatacag agaccaaggt ctcagtggta tgtcttc 47
<210> 51
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-i
<400> 51
gaagacattg gttacataca gagaccaagg tctcagtgga tgtcttc 47
<210> 52
<211> 45
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Dest-j
<400> 52
gaagacatgt ggtgacatac agagaccaag gtctcagtgg tcttc 45
<210> 53
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 信号序列(signal sequence)
<400> 53
Met Gly Asn Ser Val
1 5
<210> 54
<211> 22
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 信号序列(signal sequence)
<400> 54
Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly Leu Gly Lys Ala Gly Arg
1 5 10 15
Ala Arg Asp Pro Pro Val
20
<210> 55
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 信号序列(signal sequence)
<400> 55
Lys Asp Glu Leu
1
<210> 56
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 信号序列(signal sequence)
<400> 56
Lys Glu Glu Leu
1
<210> 57
<211> 19
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 信号序列(signal sequence)
<400> 57
Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly
1 5 10 15
Ala His Ser
<210> 58
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 1st_A (v3.2_A)
<400> 58
Val Thr Tyr Thr Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Lys Val
1 5 10 15
Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys
20 25 30
Pro Asn Val
35
<210> 59
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 1st_G (v3.2_G)
<400> 59
Val Thr Tyr Thr Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Lys Val
1 5 10 15
Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys
20 25 30
Pro Asp Val
35
<210> 60
<211> 35
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 1st_U (v3.2_U)
<400> 60
Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Arg Leu
1 5 10 15
Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys
20 25 30
Pro Asp Val
35
<210> 61
<211> 2271
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> v2_多核苷酸(v2_polypucleotide)
<400> 61
atgggtcatc accatcatca tcacgggtcc ctgcaggact cagaagtcaa tcaagaagct 60
aagccagagg tcaagccaga agtcaagcct gagactcaca tcaatttaaa ggtgtccgat 120
ggatcttcag agatcttctt caagatcaaa aagaccactc ctttaagaag gctgatggaa 180
gcgttcgcta aaagacaggg taaggaaatg gactccttaa gattcttgta cgacggtatt 240
agaattcaag ctgatcaggc ccctgaagat ttggacatgg aggataacga tattattgag 300
gctcaccgcg aacagattgg aggtatggga aactccgtgg tcacatacaa caccctgatc 360
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 420
gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 480
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 540
cccaacgtgg tgacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 600
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 660
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 720
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg ttacatacac cacactgatc 780
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 840
agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 900
gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 960
cccgacgtgg ttacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 1020
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtcaca 1080
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1140
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tgacatacac caccctgatc 1200
gacggcctgt gcaaggccgg caaagtggac gaggccctgg agctgttcga cgagatgaag 1260
gagaggggca tcaagcccga cgtggtcaca tacaacaccc tgatcgacgg cctgtgcaag 1320
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1380
cccagcgtgg ttacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1440
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtcaca 1500
tacaccaccc tgatcgacgg cctgtgcaag gccggcaagg tggatgaggc cctggagctg 1560
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1620
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1680
gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 1740
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1800
cccaacgtgg ttacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 1860
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1920
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1980
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tgacatacac cacactgatc 2040
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2100
agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 2160
gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2220
cccgacgagc tgacctacaa caccctgatc agcggcctgg gcaaggccgg c 2271
<210> 62
<211> 757
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> v2_蛋白(v2_protein)
<400> 62
Met Gly His His His His His His Gly Ser Leu Gln Asp Ser Glu Val
1 5 10 15
Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr
20 25 30
His Ile Asn Leu Lys Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys
35 40 45
Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys
50 55 60
Arg Gln Gly Lys Glu Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile
65 70 75 80
Arg Ile Gln Ala Asp Gln Ala Pro Glu Asp Leu Asp Met Glu Asp Asn
85 90 95
Asp Ile Ile Glu Ala His Arg Glu Gln Ile Gly Gly Met Gly Asn Ser
100 105 110
Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys
115 120 125
Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile
130 135 140
Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys
145 150 155 160
Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser
165 170 175
Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly
180 185 190
Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu
195 200 205
Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu
210 215 220
Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu
225 230 235 240
Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr
245 250 255
Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala
260 265 270
Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val
275 280 285
Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val
290 295 300
Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys
305 310 315 320
Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser
325 330 335
Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys
340 345 350
Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu
355 360 365
Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met
370 375 380
Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile
385 390 395 400
Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe
405 410 415
Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn
420 425 430
Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu
435 440 445
Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val
450 455 460
Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp
465 470 475 480
Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro
485 490 495
Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly
500 505 510
Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly
515 520 525
Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys
530 535 540
Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu
545 550 555 560
Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp
565 570 575
Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys
580 585 590
Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr
595 600 605
Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu
610 615 620
Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr
625 630 635 640
Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu
645 650 655
Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser
660 665 670
Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp
675 680 685
Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val
690 695 700
Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys
705 710 715 720
Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu
725 730 735
Arg Gly Ile Lys Pro Asp Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly
740 745 750
Leu Gly Lys Ala Gly
755
<210> 63
<211> 2274
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> v3.2_多核苷酸(v3.2_polypucleotide)
<400> 63
atgggtcatc accatcatca tcacgggtcc ctgcaggact cagaagtcaa tcaagaagct 60
aagccagagg tcaagccaga agtcaagcct gagactcaca tcaatttaaa ggtgtccgat 120
ggatcttcag agatcttctt caagatcaaa aagaccactc ctttaagaag gctgatggaa 180
gcgttcgcta aaagacaggg taaggaaatg gactccttaa gattcttgta cgacggtatt 240
agaattcaag ctgatcaggc ccctgaagat ttggacatgg aggataacga tattattgag 300
gctcaccgcg aacagattgg aggtatggga aactccgtgg tcacatacaa caccaacatc 360
gaccagctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 420
gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 480
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 540
cccaacgtgg tgacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 600
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 660
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 720
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg ttacatacac cacactgatc 780
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 840
agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 900
gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 960
cccgacgtgg ttacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 1020
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtcaca 1080
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1140
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tgacatacac caccctgatc 1200
gacggcctgt gcaaggccgg caaagtggac gaggccctgg agctgttcga cgagatgaag 1260
gagaggggca tcaagcccga cgtggtcaca tacaacaccc tgatcgacgg cctgtgcaag 1320
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1380
cccagcgtgg ttacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1440
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtcaca 1500
tacaccaccc tgatcgacgg cctgtgcaag gccggcaagg tggatgaggc cctggagctg 1560
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1620
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1680
gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 1740
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1800
cccaacgtgg ttacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 1860
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1920
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1980
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tgacatacac cacactgatc 2040
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2100
agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 2160
gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2220
cccgacgagg agctgaccta caacaccctg atcagcggcc tgggcaaggc cggc 2274
<210> 64
<211> 757
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> v3.2_蛋白(v3.2_protein)
<400> 64
Met Gly His His His His His His Gly Ser Leu Gln Asp Ser Glu Val
1 5 10 15
Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr
20 25 30
His Ile Asn Leu Lys Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys
35 40 45
Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys
50 55 60
Arg Gln Gly Lys Glu Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile
65 70 75 80
Arg Ile Gln Ala Asp Gln Ala Pro Glu Asp Leu Asp Met Glu Asp Asn
85 90 95
Asp Ile Ile Glu Ala His Arg Glu Gln Ile Gly Gly Met Gly Asn Ser
100 105 110
Val Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ser Gly Lys
115 120 125
Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile
130 135 140
Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys
145 150 155 160
Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser
165 170 175
Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly
180 185 190
Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu
195 200 205
Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu
210 215 220
Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu
225 230 235 240
Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr
245 250 255
Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala
260 265 270
Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val
275 280 285
Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val
290 295 300
Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys
305 310 315 320
Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser
325 330 335
Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys
340 345 350
Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu
355 360 365
Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met
370 375 380
Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile
385 390 395 400
Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe
405 410 415
Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn
420 425 430
Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu
435 440 445
Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val
450 455 460
Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp
465 470 475 480
Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro
485 490 495
Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly
500 505 510
Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly
515 520 525
Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys
530 535 540
Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu
545 550 555 560
Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp
565 570 575
Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys
580 585 590
Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr
595 600 605
Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu
610 615 620
Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr
625 630 635 640
Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu
645 650 655
Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser
660 665 670
Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp
675 680 685
Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val
690 695 700
Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys
705 710 715 720
Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu
725 730 735
Arg Gly Ile Lys Pro Asp Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly
740 745 750
Leu Gly Lys Ala Gly

Claims (18)

1.一种PPR基序,其为下述任一种PPR基序:
(C-1)由序列号4~7中的任一序列构成的PPR基序;
(C-2)由序列号4~7中的任一序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为胞嘧啶结合性的PPR基序;
(C-3)与序列号4~7中的任一序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为胞嘧啶结合性的PPR基序;
(A-1)由序列号8的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(A-2)由(A-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为腺嘌呤结合性的PPR基序;
(A-3)与(A-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为腺嘌呤结合性的PPR基序;
(G-1)由序列号9的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(G-2)由(G-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为鸟嘌呤结合性的PPR基序;
(G-3)与(G-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为鸟嘌呤结合性的PPR基序;
(U-1)由序列号10的序列构成的PPR基序中的位置6的氨基酸置换成天冬酰胺或天冬氨酸的PPR基序;
(U-2)由(U-1)的序列中的位置1、4、6以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为尿嘧啶结合性的PPR基序;
(U-3)与(U-1)的序列具有至少80%的序列同一性、其中位置1、4、6以及34的氨基酸相同、且为尿嘧啶结合性的PPR基序。
2.一种PPR基序,其为下述任一种PPR基序:
(C-1)由序列号4~7中的任一序列构成的PPR基序;
(C-2)由序列号4~7中的任一序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为胞嘧啶结合性的PPR基序;
(C-3)与序列号4~7中的任一序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为胞嘧啶结合性的PPR基序;
(A-1)序列号8的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的PPR基序;
(A-2)由(A-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为腺嘌呤结合性的PPR基序;
(A-3)与(A-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为腺嘌呤结合性的PPR基序;
(G-1)由序列号9的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的序列构成的PPR基序;
(G-2)由(G-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为鸟嘌呤结合性的PPR基序;
(G-3)与(G-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为鸟嘌呤结合性的PPR基序;
(U-1)由序列号10的序列中的位置6和9的氨基酸按照满足下述定义的任一种组合的方式进行了置换的序列构成的PPR基序;
(U-2)由(U-1)的序列中的位置1、4、6、9以及34的氨基酸以外的1~9个氨基酸发生了置换、缺失或添加的序列构成且为尿嘧啶结合性的PPR基序;
(U-3)与(U-1)的序列具有至少80%的序列同一性、其中位置1、4、6、9以及34的氨基酸相同、且为尿嘧啶结合性的PPR基序,
所述组合为:
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为谷氨酸的组合;
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为谷氨酰胺的组合;
·位置6的氨基酸为天冬酰胺、且位置9的氨基酸为赖氨酸的组合;
·位置6的氨基酸为天冬氨酸、且位置9氨基酸为甘氨酸的组合。
3.如权利要求1或2所述的PPR基序,其中,所述PPR基序为下述任一种PPR基序:
(C-4)由序列号4的序列构成的PPR基序;
(A-4)由序列号58的序列构成的PPR基序;
(G-4)由序列号59的序列构成的PPR基序;
(U-4)由序列号60的序列构成的PPR基序。
4.权利要求1~3中任一项所述的PPR基序作为PPR蛋白中的从N末端起的第1个PPR基序的应用。
5.如权利要求4所述的应用,其用于减小PPR蛋白的凝聚性。
6.一种蛋白质,其是包含1~30个下述式1所表示的PPR基序、能够与具有特定碱基序列的靶核酸结合的蛋白质,其中,从N末端起的第1个PPR基序(M1)的A6氨基酸为亲水性氨基酸,
[化1]
(螺旋A)-X-(螺旋B)-L (式1)
式中:
螺旋A为长度12个氨基酸的能够形成α螺旋结构的部分,由式2表示,
[化2]
A1-A2-A3-A4-A5-A6-A7-A8-A9-A10-A11-A12 (式2)
式2中,A1~A12各自独立地表示氨基酸;
X不存在或者是由长度1~9个氨基酸构成的部分;
螺旋B是由长度11~13个氨基酸构成的能够形成α螺旋结构的部分;
L为长度2~7个氨基酸的由式3所表示的部分;
[化3]
Lvii-Lvi-Lv-Liv-Liii-Lii-Li (式3)
式3中,各氨基酸从C末端侧起被编号为“i”(-1)、“ii”(-2),
其中Liii~Lvii有不存在的情况。
7.如权利要求6所述的蛋白质,其中,M1的A9氨基酸为亲水性氨基酸或甘氨酸。
8.如权利要求6或7所述的蛋白质,其中,M1的A6氨基酸为天冬酰胺或天冬氨酸。
9.如权利要求6~8中任一项所述的蛋白质,其中,M1的A9氨基酸为谷氨酰胺、谷氨酸、赖氨酸或甘氨酸。
10.如权利要求6~9中任一项所述的蛋白质,其中,M1的A6氨基酸以及M1的A9氨基酸为下述任一种组合:
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酸的组合;
·A6氨基酸为天冬酰胺、且A9氨基酸为谷氨酰胺的组合;
·A6氨基酸为天冬酰胺、且A9氨基酸为赖氨酸的组合;
·A6氨基酸为天冬氨酸、且A9氨基酸为甘氨酸的组合。
11.一种融合蛋白,其是选自由荧光蛋白、核转运信号肽以及标签蛋白组成的组中的至少一者与包含权利要求1~3中任一项所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白或者权利要求6~10中任一项所述的蛋白质的融合蛋白。
12.一种改性方法,其是包含权利要求6中定义的PPR基序、能够与具有特定碱基序列的靶核酸结合的PPR蛋白的改性方法,其中,使从N末端起的第1个PPR基序(M1)的A6氨基酸更具有亲水性。
13.一种核酸的检测方法,其特征在于,使用包含权利要求1~3中任一项所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、权利要求6~10中任一项所述的蛋白质、或者权利要求11所述的融合蛋白。
14.一种核酸,其编码权利要求1~3中任一项所述的PPR基序、包含权利要求1~3中任一项所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、或者权利要求6~10中任一项所述的蛋白质。
15.一种载体,其包含权利要求14所述的核酸。
16.一种不包括人个体细胞的细胞,其包含权利要求15所述的载体。
17.一种不包括在人个体中实施的核酸的操作方法,其使用权利要求1~3中任一项所述的PPR基序、包含权利要求1~3中任一项所述的PPR基序作为从N末端起的第1个PPR基序的PPR蛋白、或者权利要求6~10中任一项所述的蛋白质、或者权利要求15所述的载体。
18.一种生物的生产方法,其包括权利要求17所述的操作方法。
CN202080040065.2A 2019-05-29 2020-05-29 凝聚少的ppr蛋白及其应用 Pending CN113966340A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019-100553 2019-05-29
JP2019100553 2019-05-29
PCT/JP2020/021473 WO2020241877A1 (ja) 2019-05-29 2020-05-29 凝集の少ないpprタンパク質及びその利用

Publications (1)

Publication Number Publication Date
CN113966340A true CN113966340A (zh) 2022-01-21

Family

ID=73552159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080040065.2A Pending CN113966340A (zh) 2019-05-29 2020-05-29 凝聚少的ppr蛋白及其应用

Country Status (11)

Country Link
US (1) US20220220166A1 (zh)
EP (1) EP3977849A4 (zh)
JP (2) JP7308468B2 (zh)
KR (1) KR20220023984A (zh)
CN (1) CN113966340A (zh)
AU (1) AU2020283367A1 (zh)
BR (1) BR112021023937A2 (zh)
CA (1) CA3142303A1 (zh)
IL (2) IL288417B1 (zh)
SG (1) SG11202113057XA (zh)
WO (1) WO2020241877A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7125727B1 (ja) 2021-09-07 2022-08-25 国立大学法人千葉大学 核酸配列改変用組成物および核酸配列の標的部位を改変する方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006188507A (ja) * 2004-12-10 2006-07-20 Tokyo Univ Of Agriculture & Technology 蛋白質の溶解度向上方法
CN109563137A (zh) * 2016-08-10 2019-04-02 富士胶片和光纯药株式会社 利用了ppr基序的dna结合性蛋白质及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9513283B2 (en) * 2011-10-21 2016-12-06 Kyushu University, National University Corporation Method for designing RNA binding protein utilizing PPR motif, and use thereof
KR20160007541A (ko) 2013-04-22 2016-01-20 고쿠리쓰다이가쿠호진 규슈다이가쿠 피피알 모티프를 이용한 디앤에이 결합성 단백질 및 그의 이용
AU2017275184B2 (en) 2016-06-03 2021-05-06 Kyushu University, National University Corporation Fusion protein for improving protein expression from target mRNA
JP6918686B2 (ja) 2017-11-28 2021-08-11 東芝ライフスタイル株式会社 冷蔵庫
KR102568600B1 (ko) 2018-02-19 2023-08-23 삼성디스플레이 주식회사 표시 장치, 이를 포함하는 적층 기판, 및 표시 장치 제조방법
CN114729017A (zh) * 2019-05-29 2022-07-08 日商基因编辑力股份有限公司 Ppr蛋白的有效制作方法及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006188507A (ja) * 2004-12-10 2006-07-20 Tokyo Univ Of Agriculture & Technology 蛋白質の溶解度向上方法
CN109563137A (zh) * 2016-08-10 2019-04-02 富士胶片和光纯药株式会社 利用了ppr基序的dna结合性蛋白质及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LEILA K. MOSAVI ET AL.: "Structure-based substitutions for increased solubility of a designed protein", 《PROTEIN ENGINEERING, DESIGN AND SELECTION》, vol. 16, no. 10, 1 October 2003 (2003-10-01), pages 739 - 745, XP055768008, DOI: 10.1093/protein/gzg098 *
SANDRINE COQUILLE ET AL.: "An artificial PPR scaffold for programmable RNA recognition", 《NATURE COMMUNICATIONS》, no. 5, 17 December 2014 (2014-12-17), pages 5729 *
TING BAN ET AL.: "Structure of a PLS-class Pentatricopeptide Repeat Protein Provides Insights into Mechanism of RNA Recognition", 《JOURNAL OF BIOLOGICAL CHEMISTRY》, vol. 288, no. 4, 18 September 2013 (2013-09-18), pages 31540 - 31548 *

Also Published As

Publication number Publication date
US20220220166A1 (en) 2022-07-14
AU2020283367A1 (en) 2022-01-06
BR112021023937A2 (pt) 2022-04-19
EP3977849A4 (en) 2023-06-28
EP3977849A1 (en) 2022-04-06
JPWO2020241877A1 (zh) 2020-12-03
WO2020241877A1 (ja) 2020-12-03
JP7308468B2 (ja) 2023-07-14
CA3142303A1 (en) 2020-12-03
JP2023036848A (ja) 2023-03-14
KR20220023984A (ko) 2022-03-03
IL312349A (en) 2024-06-01
SG11202113057XA (en) 2021-12-30
IL288417B1 (en) 2024-06-01
IL288417A (en) 2022-01-01

Similar Documents

Publication Publication Date Title
JP7290233B2 (ja) Pprモチーフを利用したdna結合性タンパク質およびその利用
JP2023156355A (ja) 細胞または生物のゲノムへのDNA配列の標的化組み込みのためのCas9レトロウイルスインテグラーゼおよびCas9レコンビナーゼ系
Birkenbihl et al. Functional dissection of the plant-specific SBP-domain: overlap of the DNA-binding and nuclear localization domains
CN112004932B (zh) 一种CRISPR/Cas效应蛋白及系统
WO2015042393A9 (en) Evolved sortases and uses thereof
Fang et al. Host casein kinase 1-mediated phosphorylation modulates phase separation of a rhabdovirus phosphoprotein and virus infection
CA3179365A1 (en) Method for editing target rna
Ruan et al. Conversion of the molecular chaperone Spy into a novel fusion tag to enhance recombinant protein expression
JP2023145672A (ja) 効率的なpprタンパク質の作製方法及びその利用
JP2023036848A (ja) 凝集の少ないpprタンパク質及びその利用
KR20210062639A (ko) 신규 뉴클레아제 도메인 및 그 이용
CN112279921A (zh) 用于胞内递送分子的复合物
US10370776B2 (en) Antibody like protein
CN114057861A (zh) 一种靶向UBE2C的bio-PROTAC人工蛋白
JP2023509578A (ja) ポリペプチドタグ及び体外タンパク質合成におけるその使用
CN114277015A (zh) 新型crispr酶以及应用
US10870926B2 (en) Antibody like protein
CN114703215A (zh) 使用真核细胞发酵表达血管紧张素转化酶2的方法
Fischer Initial characterization of the ribosome-associated ATP binding cassette (ABC) protein YHIH from E. Coli
Barreto A genetic screen to isolate “lariat” peptide inhibitors of protein function

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40061571

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination