CN114921439A - CRISPR-Cas效应子蛋白、其基因编辑系统及应用 - Google Patents

CRISPR-Cas效应子蛋白、其基因编辑系统及应用 Download PDF

Info

Publication number
CN114921439A
CN114921439A CN202210681597.5A CN202210681597A CN114921439A CN 114921439 A CN114921439 A CN 114921439A CN 202210681597 A CN202210681597 A CN 202210681597A CN 114921439 A CN114921439 A CN 114921439A
Authority
CN
China
Prior art keywords
nucleic acid
crispr
lys
gene editing
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210681597.5A
Other languages
English (en)
Other versions
CN114921439B (zh
Inventor
张红玲
任文丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaotang Shanghai Biotechnology Co ltd
Original Assignee
Yaotang Shanghai Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaotang Shanghai Biotechnology Co ltd filed Critical Yaotang Shanghai Biotechnology Co ltd
Priority to CN202210681597.5A priority Critical patent/CN114921439B/zh
Publication of CN114921439A publication Critical patent/CN114921439A/zh
Priority to PCT/CN2023/100529 priority patent/WO2023241669A1/zh
Application granted granted Critical
Publication of CN114921439B publication Critical patent/CN114921439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • A61P13/12Drugs for disorders of the urinary system of the kidneys
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/14Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/06Antihyperlipidemics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/06Antianaemics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0684Cells of the urinary tract or kidneys
    • C12N5/0686Kidney cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Neurology (AREA)
  • Epidemiology (AREA)
  • Urology & Nephrology (AREA)
  • Neurosurgery (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Diabetes (AREA)
  • Immunology (AREA)
  • Oncology (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Psychology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)

Abstract

本发明提供了一种CRISPR‑Cas效应子蛋白、其基因编辑系统及应用。其中,CRISPR‑Cas效应子蛋白包括与SEQ ID NO:1至5中任一项所述的氨基酸序列具有至少70%同一性的蛋白。能够解决现有技术中的CRISPR/Cas系统切割效率低的问题,适用于基因编辑领域。

Description

CRISPR-Cas效应子蛋白、其基因编辑系统及应用
技术领域
本发明涉及基因编辑领域,具体而言,涉及一种CRISPR-Cas效应子蛋白、其基因编辑系统及应用。
背景技术
Clustered regularly interspaced short palindromic repeats(CRISPR)系统,是细菌和古细菌为了防御入侵噬菌体的DNA而形成的。CRISPR系统的免疫干扰过程主要包括3个阶段:适应、表达和干扰。适应阶段,CRISPR系统会将来自噬菌体或质粒的DNA短片段整合到前导序列和第一段重复序列之间,每一次整合都伴随着重复序列的复制,进而形成一个新的重复-间隔序列单元。表达阶段,CRISPR基因座会被转录成一段CRISPR RNA(crRNA)前体(pre-crRNA),该前体在Cas蛋白和tracrRNA的存在下会在重复序列处被进一步加工成小的crRNA。成熟的crRNA与Cas蛋白形成Cas/crRNA复合体。干扰阶段,crRNA通过其与靶序列互补的区域引导Cas/crRNA复合体寻找靶点,并在靶点位置通过Cas蛋白的核酸酶活性造成靶点位置的双链DNA断裂,从而使靶标DNA失去原有功能。
CRISPR系统分为I,II,III型三个家族,其中II型系统最常见的为CRISPR/Cas9系统,Cas9蛋白可在反式编码小RNA(trans-encoded small RNA,tracrRNA)的协助下将pre-crRNA加工成与tracrRNA结合的成熟crRNA。之后,人们发现通过人工构建模拟crRNA:tracrRNA复合体的单链嵌合体引导RNA(guide RNA),即可有效的介导Cas9蛋白对靶点的识别和切割。其中与靶点3′端紧邻的3个碱基必须是5′-NGG-3′的形式,从而构成Cas/crRNA复合体识别靶点所需的PAM(protospacer adjacent motif)结构。然而目前存在的不同的CRISPR/Cas各有不同的优点和缺陷。例如Cas9,C2c1和CasX均需要两条RNA进行向导RNA。常见的Cas9,C2c1,CasY和Cpf1通常大小在1300个氨基酸左右。此外,Cas9,Cpf1,CasX,CasY的PAM序列都复杂多样。且现有的CRISPR/Cas系统均存在脱靶效应严重、切割效率低等问题,因此开发脱靶效应低、切割效率高的新型CRISPR/Cas系统具有重要意义。
发明内容
本发明的主要目的在于提供一种CRISPR-Cas效应子蛋白、其基因编辑系统及应用,以解决现有技术中的CRISPR/Cas系统切割效率低的问题。
为了实现上述目的,根据本发明的第一个方面,提供了一种CRISPR-Cas效应子蛋白,该CRISPR-Cas效应子蛋白包括与SEQ ID NO:1至5中任一项的氨基酸序列具有至少70%同一性的蛋白。
进一步地,CRISPR-Cas效应子蛋白包括与SEQ ID NO:1至5中任一项的氨基酸序列具有80%以上,优选90%以上,更优选95%以上,进一步优选99%以上同一性的蛋白;优选地,CRISPR-Cas效应子蛋白包括RuvC结构域。
进一步地,CRISPR-Cas效应子蛋白包括:a)SEQ ID NO:1至5中任一项所示的蛋白;或b)以SEQ ID NO:1所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:N21X,N23X,R25X,K26X,Q482X,S484X,R486X,S489X,R493X,H511X,C513X,H515X,N516X,R518X,R540X,K558X,Y560X,K562X,K565X,T600X,T672X,D676X,Q680X,Y683X,L686X,D693X,Y731X,G767X,R772X,K832X,K833X,Q836X,M896X;或c)以SEQ ID NO:2所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:R19X,R28X,R32X,K512X,N527X,W531X,R553X,K581X,K589X,I590X,R605X,K611X,R612X,R615X,Y777X,E877X,R931X;或d)以SEQ ID NO:3所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:K8X,F15X,N17X,K20X,K471X,W483X,H502X,R505X,K557X,K556X,R560X,Y673X,L676X,Y723X,N822X,K823X,E826X,K827X,K830X,K880X,L887X;或e)以SEQ ID NO:4所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:K317X,W330X,Y351X,K354X,D392X,F395X,N399X,Y509X,V512X,Y568X,N662X,K663X,E666X,R667X,K670X,K719X,L726X;或f)以SEQ ID NO:5所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:M9X,V16X,D18X,K21X,K518X,W531X,F550X,K553X,R609X,Y612X,R616X,Y730X,L733X,Y781X,N879X,K880X,E883X,K884X,K887X,K936X,F943X;其中X为任意氨基酸。
为了实现上述目的,根据本发明的第二个方面,提供了一种CRISPR-Cas效应子融合蛋白,该CRISPR-Cas效应子融合蛋白包括上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子蛋白的衍生物或CRISPR-Cas效应子蛋白的功能片段,以及异源功能结构域。
进一步地,异源功能结构域位于CRISPR-Cas效应子融合蛋白的N端、C端或内部;优选地,异源功能结构域包括定位信号、报告蛋白、CRISPR-Cas效应子蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC、裂解活性多肽、连接酶中的一种或多种;优选地,定位信号包括核定位信号和/或核输出信号;优选地,核输出信号包括人类蛋白酪氨酸激酶2;优选地,报告蛋白包括谷胱甘肽-S-转移酶、辣根过氧化物酶、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡糖醛酸糖苷酶或自发荧光蛋白中的一种或多种;优选地,自发荧光蛋白包括绿色荧光蛋白、HcRed、DsRed、青荧光蛋白、黄色荧光蛋白或蓝色荧光蛋白中的一种或多种;优选地,DNA结合域包括甲基化结合蛋白、Lex A DBD或Gal4 DBD中的一种或多种;优选地,表位标签包括组氨酸标签、V5标签、FLAG标签、流感病毒血凝素标签、Myc标签、VSV-G标签或硫氧还蛋白标签中的一种或多种;优选地,转录激活域包括VP64和/或VPR;优选地,转录抑制域包括KRAB和/或SID;优选地,核酸酶包括FokI;优选地,脱氨结构域包括ADAR1、ADAR2、APOBEC、AID或TAD中的一种或多种;优选地,裂解活性多肽包括具有单链RNA裂解活性的多肽、具有双链RNA裂解活性的多肽、具有单链DNA裂解活性的多肽或具有双链DNA裂解活性的多肽;优选地,连接酶包括DNA连接酶和/或RNA连接酶。
为了实现上述目的,根据本发明的第三个方面,提供了一种DNA分子,该DNA分子编码上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白。
进一步地,DNA分子为根据宿主细胞的密码子偏好性进行密码子优化的DNA分子;优选地,宿主细胞包括原核细胞或真核细胞;优选地,DNA分子包括与SEQ ID NO:6至10中任一项的核苷酸序列具有70%以上,优选90%以上,更优选95%以上,进一步优选99%,更进一步优选为100%同一性的核苷酸。
为了实现上述目的,根据本发明的第四个方面,提供了一种重组载体,该重组载体包含上述DNA分子。
进一步地,DNA分子与启动子连接;优选地,启动子包括诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种;优选地,启动子包括T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种;优选地,重组载体包括逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹载体、质粒载体或噬菌粒载体;优选地,所述重组载体包括质粒载体。
为了实现上述目的,根据本发明的第五个方面,提供了一种宿主细胞,该宿主细胞转化有上述重组载体。
为了实现上述目的,根据本发明的第六个方面,提供了一种基因编辑系统,该基因编辑系统包括:a)RNA指导物或编码RNA指导物的核酸,RNA指导物包括直接重复序列和间隔子序列,间隔子序列用于与靶核酸杂交;b)上述CRISPR-Cas效应子蛋白,或CRISPR-Cas效应子融合蛋白,或DNA分子,或重组载体,或宿主细胞;DNA分子、重组载体或宿主细胞能够表达CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,在基因编辑系统中,CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,与RNA指导物结合后,靶向作用于间隔子序列与靶核酸杂交形成的杂交序列。
进一步地,基因编辑系统不包含tracrRNA。
进一步地,RNA指导物包括1种或多种。
进一步地,靶核酸包括DNA;优选地,DNA包括来源于真核生物的DNA或来源于原核生物的DNA;优选地,真核生物包括动物或植物;优选地,DNA包括非人类哺乳动物DNA、人类DNA、昆虫DNA、鸟类DNA、爬行动物DNA、两栖动物DNA、啮齿动物DNA、鱼类DNA、蠕虫DNA、线虫DNA或酵母DNA;优选地,非人类哺乳动物DNA包括非人类灵长类DNA。
进一步地,直接重复序列的3’端包含茎环结构,茎环结构包括依次连接的第一茎核苷酸链、环核苷酸链和第二茎核苷酸链,第一茎核苷酸链和第二茎核苷酸链彼此杂交形成茎环结构的茎,环核苷酸链形成茎环结构的环;优选地,第一茎核苷酸链的长度为5或6个核苷酸;优选地,第二茎核苷酸链的长度为5个核苷酸;优选地,环核苷酸链的长度为6、7或8个核苷酸。
进一步地,茎环结构包括SEQ ID NO:25、28、31、34或37的核苷酸序列。
进一步地,直接重复序列包括与SEQ ID NO:24、27、30、33或36的核苷酸序列具有至少80%同一性的核苷酸序列;优选地,直接重复序列包括与SEQ ID NO:24、27、30、33或36的核苷酸序列具有至少85%以上,更优选90%以上,进一步优选95%以上同一性的核苷酸序列;优选地,直接重复序列包括SEQ ID NO:24、27、30、33或36的核苷酸序列。
进一步地,间隔子序列的80%以上与靶核酸互补;优选地,间隔子序列的90%以上,更优选95%以上,进一步优选99%以上,更进一步优选100%与靶核酸互补;优选地,间隔子序列的长度为18-41nt;优选地,间隔子序列的长度为18-37nt;优选地,间隔子序列长度为18-26或34-36nt;优选地,间隔子序列长度为20nt。
进一步地,直接重复序列包括第一直接重复序列和第二直接重复序列;优选地,RNA指导物包括按顺序依次连接的第一直接重复序列、间隔子序列以及第二直接重复序列;优选地,第一直接重复序列与第二直接重复序列相同。
进一步地,靶核酸包含前间隔子相邻基序,CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白能够识别前间隔子相邻基序,前间隔子相邻基序包含核酸序列5’-TTN-3’,其中N是任何核苷酸;优选地,N为A、C或T。
进一步地,CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,与RNA指导物结合,形成蛋白-核酸复合物;优选地,蛋白-核酸复合物是非天然存在的或经修饰的;优选地,蛋白-核酸复合物中的至少一个组分是非天然存在的或经修饰的。
进一步地,通过CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白和RNA指导物对靶核酸的靶向作用,对靶核酸进行修饰;优选地,修饰包括切割或切口;优选地,修饰导致:(1)细胞包含至少一种基因产物表达的改变;或(2)细胞包含至少一种基因产物的表达的改变,其中至少一种基因产物的表达增加;或(3)细胞包含至少一种基因产物的表达的改变,其中至少一种基因产物的表达减少;或(4)细胞包含经编辑的基因组;优选地,修饰导致细胞毒性;优选地,上述修饰导致抑制基因表达、降低基因表达或增强基因表达。
进一步地,基因编辑系统包括目标核酸或编码目标核酸的核酸目标核酸包括同源臂片段和供体模板核酸;优选地,目标核酸包含能够与间隔子序列杂交的序列;优选地,同源臂片段包括5’同源臂和3’同源臂,目标核酸由5’同源臂、供体模板核酸和3’同源臂顺序连接组成。
进一步地,基因编辑系统以可递送的形式存在,利用递送系统使基因编辑系统与靶核酸接触;优选地,递送系统将基因编辑系统递送入含有靶核酸的细胞中;优选地,可递送的形式包括纳米颗粒、脂质体、外泌体、微泡、蛋白衣壳或基因枪所用的颗粒。
为了实现上述目的,根据本发明的第七个方面,提供了一种基因编辑载体,该基因编辑载体包含上述编码RNA指导物的核酸。
进一步地,基因编辑载体还包含上述DNA分子;优选地,DNA分子与编码RNA指导物的核酸位于相同或不同的载体上;优选地,DNA分子与第一调节元件连接;优选地,编码RNA指导物的核酸与第二调节元件连接;优选地,第一调节元件和第二调节元件分别独立选自诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种;优选地,第一调节元件和第二调节元件分别独立选自T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种。
为了实现上述目的,根据本发明的第八个方面,提供了一种上述基因编辑系统与细胞中靶核酸结合的方法,该方法包括:将基因编辑系统递送至细胞中,细胞包括靶核酸;使CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,与RNA指导物结合,使间隔子序列与靶核酸结合。
进一步地,靶核酸为双链DNA或单链DNA;优选地,基因编辑系统与细胞中靶核酸的结合,导致靶核酸的表达状态改变;优选地,基因编辑系统与细胞中靶核酸的结合,导致靶核酸被切割;优选地,靶核酸被切割导致靶核酸破坏、或靶核酸特定位点替换、或靶核酸位点的移除、或靶核酸区域功能的改变、或靶核酸上两个位点之间的序列倒置。
为了实现上述目的,根据本发明的第九个方面,提供了一种含有基因编辑系统的细胞,该含有基因编辑系统的细胞包括上述基因编辑系统、或基因编辑载体。
进一步地,含有基因编辑系统的细胞包含经修饰的目的靶基因座,目的靶基因座为利用基因编辑系统修饰的基因座;优选地,目的靶基因座的修饰导致:(1)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变;或(2)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变,其中至少一种基因产物的表达增加;或(3)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变,其中至少一种基因产物的表达减少;或(4)含有基因编辑系统的细胞包含经编辑的基因组;优选地,含有基因编辑系统的细胞包括真核细胞或原核细胞;优选地,真核细胞包括动物细胞、植物细胞或人类细胞;优选地,动物细胞包括哺乳动物细胞。
为了实现上述目的,根据本发明的第十个方面,提供了一种靶向和编辑靶核酸的方法,该方法包括使靶核酸与上述基因编辑系统接触。
为了实现上述目的,根据本发明的第十一个方面,提供了一种在识别靶核酸后非特异性降解单链DNA的方法,该方法包括使靶核酸与上述基因编辑系统接触。
为了实现上述目的,根据本发明的第十二个方面,提供了一种在识别双链靶DNA的间隔子互补链后靶向双链靶DNA的非间隔子互补链并使其产生切口的方法,该方法包括使双链靶DNA与上述基因编辑系统接触。
为了实现上述目的,根据本发明的第十三个方面,提供了一种靶向和切割双链靶DNA的方法,该方法包括使双链靶DNA与上述基因编辑系统接触。
进一步地,在使双链DNA的间隔子互补链产生切口之前,使双链靶DNA的非间隔子互补链产生切口。
为了实现上述目的,根据本发明的第十四个方面,提供了一种特异性编辑双链核酸的方法,该方法包括在充分的条件下使以下进行接触充分的时间量,(1)上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白、另一具有序列特异性切口活性的酶,以及RNA指导物,RNA指导物指导CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,相对于另一序列特异性切口酶的活性使相对链产生切口;以及(2)双链核酸;方法导致双链断裂的形成。
为了实现上述目的,根据本发明的第十五个方面,提供了一种编辑双链核酸的方法,该方法包括在充分的条件下使以下进行接触充分的时间量:(1)上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白,和具有DNA修饰活性的蛋白质结构域的融合蛋白,以及靶向双链核酸的RNA指导物;以及(2)双链核酸;融合蛋白的CRISPR-Cas效应子被修饰以使双链核酸的非靶链产生切口。
进一步地,双链核酸的两条链在不同的位点被切割,导致交错切割;优选地,双链核酸的两条链在同一位点被切割,导致平双链断裂。
为了实现上述目的,根据本发明的第十六个方面,提供了一种靶向并切割单链靶DNA的方法,该方法包括使靶核酸与上述基因编辑系统接触。
为了实现上述目的,根据本发明的第十七个方面,提供了一种诱导细胞状态改变的方法,该方法包括使上述基因编辑系统与细胞中的靶核酸接触。
进一步地,细胞状态包括凋亡或休眠;优选地,细胞包括真核细胞或原核细胞;优选地,细胞包括哺乳动物细胞或植物病变细胞;优选地,细胞包括癌细胞;优选地,细胞包括感染性细胞或被感染原感染的细胞;优选地,细胞包括被病毒感染的细胞、被朊病毒感染的细胞;优选地,细胞包括真菌细胞、原生动物或寄生虫细胞。
为了实现上述目的,根据本发明的第十八个方面,提供了一种上述基因编辑系统在制备治疗受试者病症或疾病的药物中的应用。
进一步地,应用包括向受试者或受试者的离体细胞施用基因编辑系统;优选地,间隔子序列与跟病症或疾病相关的靶核酸的至少15个核苷酸互补,CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白切割靶核酸;优选地,病症或疾病包括癌症或感染性疾病;优选地,癌症包括维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤或尿膀胱癌中的一种或多种;优选地,病症或疾病包括囊性纤维化、进行性假肥大性肌营养不良、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、额颞叶痴呆、遗传性慢性肾脏病、高脂血症、高胆固醇血症、莱伯氏先天性黑蒙、镰状细胞病或β地中海贫血中的一种或多种;优选地,感染性疾病的感染原包括人类免疫缺陷病毒、单纯疱疹病毒-1或单纯疱疹病毒-2中的一种或多种。
为了实现上述目的,根据本发明的第十九个方面,提供了一种真核细胞系,该真核细胞系包含上述含有基因编辑系统的细胞,或为含有基因编辑系统的细胞的后代。
为了实现上述目的,根据本发明的第二十个方面,提供了一种多细胞生物体,该多细胞生物体包含上述含有基因编辑系统的细胞。
进一步地,多细胞生物体包括模型动物或模型植物。
为了实现上述目的,根据本发明的第二十一个方面,提供了一种获得目的性状的植物的方法,利用上述基因编辑系统与植物细胞接触,对植物细胞的基因进行修饰或引入目的基因,修饰或目的基因能够表达目的性状,获得修饰后的植物细胞,利用修饰后的植物细胞进行再生,获得目的性状的植物。
为了实现上述目的,根据本发明的第二十二个方面,提供了一种鉴定植物中目的性状的方法,植物细胞中的目的基因能够表达目的性状,利用上述基因编辑系统与植物细胞接触,从而鉴定目的基因。
为了实现上述目的,根据本发明的第二十三个方面,提供了一种试剂盒,该试剂盒包括一种或多种选自下列的组分:上述CRISPR-Cas效应子蛋白、DNA分子、重组载体、宿主细胞、基因编辑系统、基因编辑载体、含有基因编辑系统的细胞、真核细胞系、或多细胞生物体;试剂盒的组分在相同或不同的容器中。
为了实现上述目的,根据本发明的第二十四个方面,提供了一种容器,该容器包含上述试剂盒。
进一步地,容器包括无菌容器;优选地,容器包括注射器。
为了实现上述目的,根据本发明的第二十五个方面,提供了一种可植入装置,该可植入装置包括上述基因编辑系统。
进一步地,基因编辑系统在基质内;优选地,基因编辑系统在储库内。
应用本发明的技术方案,利用上述CasY1、CasY2、CasY3、CasY4和CasY5,均能够发挥Cas蛋白的切割活性,相较于现有的CRISPR/Cas系统切割效率高。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例1的CasY1-CasY5的蛋白结构域示意图,其中D、E、D代表RuvC结构域的三个保守基序Ⅰ、Ⅱ、Ⅲ的催化残基,h表示桥螺旋结构。
图2示出了根据本发明实施例1的CasY1、CasY2、CasY3、CasY4和CasY5的直接重复序列的二级结构分析结果示意图。
图3示出了根据本发明实施例2的体内筛选效应子和文库质粒设计的示意图。
图4示出了根据本发明实施例2的负选择筛选工作流程的示意图。
图5示出了根据本发明实施例2的CasY1、CasY2、CasY3、CasY4、CasY5的PAM结构域分析结果图。
图6示出了根据本发明实施例3的CasY1、CasY2、CasY3、CasY4、CasY5靶向切割质粒示意图。
图7示出了根据本发明实施例3的CasY1、CasY2、CasY3、CasY4、CasY5的细菌切割结果图。
图8示出了根据本发明实施例4的CasY1、CasY2、CasY3、CasY4、CasY5的体外切割结果图,其中,图a示出了CasY1的体外切割结果图,图b示出了CasY2的体外切割结果图,图c示出了CasY3的体外切割结果图,图d示出了CasY4的体外切割结果图,图e示出了CasY5的体外切割结果图。
图9示出了根据本发明实施例5的CasY1、CasY2、CasY3、CasY4、CasY5和Lbcpf1对293T细胞不同靶基因切割活性统计图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
术语解释:
本发明所用的术语“切割”是指由本文所述CRISPR系统的核酸酶产生的靶核酸中的DNA断裂。在一些实施例中,切割事件是双链DNA断裂。在一些实施例中,切割是单链DNA断裂。在一些实施例中,切口是双链DNA的某一条DNA链断裂。
本发明中使用的术语“CRISPR-Cas系统”是指V-I型CRISPR-Cas效应子蛋白(即,Cas12i效应子蛋白)和一种或多种RNA指导物,和/或编码上述CRISPR-Cas效应子蛋白或一种或多种RNA指导物的核酸,以及任选地与CRISPR-Cas效应子的表达或与RNA指导物或两者可操作地连接的启动子。
本发明中使用的术语“直接重复序列”或“直接重复”是指多个短的直接重复序列,其在CRISPR阵列中显示出非常小的序列变化或没有序列变化。适当地,Cas12i的直接重复序列可以形成茎环结构。
本发明所使用的术语“茎环结构”是指具有二级结构的核酸,所述二级结构包括已知或预测形成双链(茎部分)的核苷酸区域,所述双链(茎部分)在一侧由主要为单链核苷酸的区域(环部分)连接。术语“发夹”和“折回”结构在本发明中也用于指茎环结构。这样的结构在本领域中是公知的,并且这些术语与其在本领域中的公知含义一致地使用。如本领域已知的,茎环结构不需要精确的碱基配对。因此,茎可以包括一个或多个碱基错配。
可替代地,碱基配对可以是精确的,即不包括任何错配。直接重复序列具有茎环结构。RNA指导物中包含的直接重复的茎由5个互相杂交的互补核碱基组成,并且环长度是6、7或9个核苷酸。
发明中使用的术语“CRISPR RNA”、“crRNA”或是指包含由CRISPR效应子用于靶向特定核酸序列的指导物序列的RNA分子。典型地,crRNA包含介导靶识别的间隔子序列和与CRISPR-Cas效应子蛋白形成复合物的直接重复序列(或称为直接重复或“DR”序列)。
本发明中所用的术语“供体模板核酸”是指在本文所述的CRISPR酶改变了靶核酸之后,一种或多种细胞蛋白质可以使用其来改变靶核酸的结构的核酸分子。
在一些实施例中,供体模板核酸是双链核酸。
在一些实施例中,供体模板核酸是单链核酸。
在一些实施例中,供体模板核酸是线性的。
在一些实施例中,供体模板核酸是环状的(例如,环状质粒)。在一些实施例中,供体模板核酸是外源核酸分子。在一些实施例中,供体模板核酸是内源核酸分子(例如,染色体)。
本发明中使用的术语“CRISPR-Cas效应子”、“CRISPR效应子”、“效应子”、“CRISPR相关蛋白”或“CRISPR酶”、“CRISPR-Cas效应子蛋白”、或“Cas效应子蛋白”是指执行酶活性或结合RNA指导物指定的核酸上的靶位点的蛋白。
在CRISPR-Cas系统内相关联的CRISPR-Cas效应子蛋白在本发明中也可称为“Cas”或“Cas酶”、“Cas蛋白”。Cas酶可以识别与靶DNA附近相关联的短基序,称为前间隔子相邻基序(PAM)。
本发明中的CasY1、CasY2、CasY3、CasY4和CasY5蛋白可以识别包含TTN或由TTN组成的PAM,其中N表示任何核苷酸。
例如,PAM可以是TTA、TTC、TTT或TTG。
在一些实施例中,CRISPR-Cas效应子蛋白具有核酸内切酶活性、切口酶活性和/或核酸外切酶活性。
本发明所使用的术语“RNA指导物”是指促进本发明中所述蛋白质靶向于靶核酸的任何RNA分子。示例性“RNA指导物”包括但不限于crRNA、前crRNA(例如DR-间隔子-DR)和成熟crRNA(例如成熟DR-间隔子,成熟DR-间隔子-成熟DR)。
如本发明中所用的术语“靶向”是指与不具有与靶核酸相同或相似序列的其他核酸相比,包括CRISPR相关蛋白和RNA指导物(如crRNA)的复合物优先或特异性结合到例如杂交到特定靶核酸的能力。
本发明中所用的术语“靶核酸”是指特定的核酸底物,其包含与RNA指导物中间隔子的全部或部分互补的核酸序列。在一些实施例中,靶核酸包含基因或基因内的序列。在一些实施例中,靶核酸包含非编码区(例如,启动子)。在一些实施例中,靶核酸是单链的或双链的。
本说明书,使用“数值A~数值B”表示的数值范围是指包含端点数值A、B的范围。
本发明中,使用“至少数值A”表示的数值是指包含大于、等于数值A的范围。
本发明中,使用“基本上”或“实质上”表示与理论模型或理论数据的标准偏差在5%、优选为3%、更优选为1%范围以内。
本发明中,使用“可以”表示的含义包括了进行某种处理以及不进行某种处理两方面的含义。
本发明中,“任选的”或“任选地”是指接下来描述的事件或情况可发生或可不发生,并且该描述包括该事件发生的情况和该事件不发生的情况。
本说明书中,所提及的“一些具体/优选的实施方案”、“另一些具体/优选的实施方案”、“实施方案”等是指所描述的与该实施方案有关的特定要素(例如,特征、结构、性质和/或特性)包括在此处所述的至少一种实施方案中,并且可存在于其它实施方案中或者可不存在于其它实施方案中。另外,应理解,所述要素可以任何合适的方式组合在各种实施方案中。
如本发明所使用的,术语“核酸”和“核酸分子”是指包含核碱基和酸性部分的化合物,例如核苷、核苷酸或核苷酸的聚合物。通常,聚合核酸,例如包含三个或更多个核苷酸的核酸分子是线性分子,其中相邻核苷酸通过磷酸二酯键相互连接。在一些实施方案中,“核酸”是指单个核酸残基(例如核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含三个或更多个单独核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可互换使用以指核苷酸的聚合物(例如,至少三个核苷酸的串)。在一些实施方案中,“核酸”包括RNA以及单链和/或双链DNA。核酸可以是天然存在的,例如在基因组、转录物、mRNA、tRNA、rRNA、siRNA、snRNA、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的上下文中。另一方面,核酸分子可以是非天然存在的分子,例如重组DNA或RNA、人工染色体、工程基因组或其片段,或合成的DNA、RNA、DNA/RNA杂交体、或包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物,例如具有除磷酸二酯骨架之外的其他骨架的类似物。核酸可以从天然来源纯化、使用重组表达系统产生和任选地纯化、化学合成等。在合适的情况下,例如在化学合成分子的情况下,核酸可以包含核苷类似物,例如具有化学修饰碱基的类似物或糖和骨架修饰。
如发明所使用的,术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的,它可以包含修饰的氨基酸,并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,如以标记组分缀合)的氨基酸聚合物。
如本发明所使用的,“CRISPR-Cas效应子融合蛋白”是指包含来自至少两种不同蛋白质的蛋白质结构域的杂化多肽。一种蛋白质可位于CRISPR-Cas效应子融合蛋白的氨基-末端(N-末端,N端)部分或羧基-末端(C-末端,C端)蛋白处,因此分别形成“氨基-末端CRISPR-Cas效应子融合蛋白”或“羧基-末端CRISPR-Cas效应子融合蛋白”。本文提供的任何蛋白质可通过本领域已知的任何方法产生。例如,本文提供的蛋白质可经由重组蛋白质表达和纯化来产生,这尤其适合于包含肽接头的CRISPR-Cas效应子融合蛋白。用于重组蛋白质表达和纯化的方法是公知的,并且包括以下中所述的那些,例如,可参见Green andSambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.(2012))。
本领域技术人员清楚,可以改变蛋白质的结构而不对其活性和功能性产生不利影响,例如,可以在蛋白质氨基酸序列中引入一个或多个保守性氨基酸取代,而不会对蛋白质分子的活性和/或三维结构产生不利影响。本领域技术人员清楚保守性氨基酸取代的实例以及实施方式。具体的说,可以用与待取代位点属于相同组的另一氨基酸残基取代该氨基酸残基,即用非极性氨基酸残基取代另一非极性氨基酸残基,用极性不带电荷的氨基酸残基取代另一极性不带电荷的氨基酸残基,用碱性氨基酸残基取代另一碱性氨基酸残基,和用酸性氨基酸残基取代另一酸性氨基酸残基。这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的。只要取代不导致蛋白质生物活性的失活,则一种氨基酸被属于同组的其他氨基酸替换的保守取代落在本发明的范围内。因此,本发明涉及的蛋白可以在氨基酸序列中包含一个或多个保守性取代,只要该非保守取代不显著影响本发明的蛋白质的所需功能和生物活性即可。
保守氨基酸置换可以在一个或多个预测的非必需氨基酸残基处进行。“非必需”氨基酸残基是可以发生改变(缺失、取代或置换)而不改变生物活性的氨基酸残基,而“必需”氨基酸残基是生物活性所需的。“保守氨基酸置换”是其中氨基酸残基被具有类似侧链的氨基酸残基替代的置换。氨基酸置换可以在上述Cas蛋白的非保守区域中进行。一般而言,此类置换不对保守的氨基酸残基,或者不对位于保守基序内的氨基酸残基进行,其中此类残基是蛋白质活性所需的。然而,本领域技术人员应当理解,功能变体可以具有较少的在保守区域中的保守或非保守改变。
如本发明所使用的,术语“CRISPR”是指成簇、规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeats),其来自微生物的免疫系统。
如本发明所使用的,术语“靶序列”是指目标核酸中与crRNA互补或至少部分互补的核苷酸序列,Cas蛋白、crRNA与靶序列形成三元复合物后,Cas蛋白发挥对目标核酸中靶核酸链和/或非核苷酸链的特异性切割活性。在本公开中,“靶序列”与“靶核酸”、“靶多核苷酸”、“目标序列”、“目标核酸序列”可以互换地使用。
如本发明所使用的,术语“靶标链”(target strand)是指目标核酸中与crRNA杂交的核苷酸链;术语“非靶标链”(non-target strand)是指目标核酸中与crRNA不发生杂交配对的核苷酸链。
如本发明所使用的,术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或酶。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺嘌呤水解脱氨为次黄嘌呤。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺苷或腺嘌呤(A)水解脱氨为肌苷(I)。
如本公开所使用的,“碱基编辑器(Base Editor,BE)”或“核碱基编辑器”是指结合多核苷酸并具有核碱基修饰活性的试剂。在各种实施方案中,碱基编辑器包含核碱基修饰多肽(例如,脱氨酶)和与引导多核苷酸(例如,引导RNA)结合的核酸可编程核苷酸结合结构域(例如,核酸可编程DNA结合蛋白)。在各种实施方案中,所述试剂是包含具有碱基编辑活性的蛋白质结构域的生物分子复合物,即能够修饰核酸分子(例如,DNA、RNA)内的碱基(例如,A、T、C、G或U)。在一些实施方案中,所述多核苷酸可编程DNA结合结构域与脱氨酶结构域融合或连接。在一个实施方案中,所述试剂是包含具有碱基编辑活性的结构域的CRISPR-Cas效应子融合蛋白。在一些实施方案中,具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨基。在一些实施方案中,所述碱基编辑器能够使DNA分子内的一个或多个碱基脱氨基。在一些实施方案中,所述碱基编辑器是腺苷碱基编辑器(ABE)。
如本文可互换使用的术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸片段。该区域或序列在靠近5'端的地方有一个起始密码子,在靠近3'端的地方有一个终止密码子。编码序列也可称为开放阅读框。
术语“核定位序列”、“核定位信号(Nuclear Localization Signal,NLS)”是指促进蛋白质输入细胞核的氨基酸序列。核定位序列是本领域已知的并且描述于例如Plank等人的国际PCT申请,PCT/EP2000/011690,2000年11月23日提交,2001年5月31日作为WO/2001/038547公布,其内容以引用方式并入本文以用于它们对示例性核定位序列的公开。在一些实施方案中,所述NLS是优化的NLS,例如由Koblan等人,Nature Biotech.2018doi:10.1038/nbt.4172所描述。
如本公开所使用的,术语“互补的”或“杂交的”用于指与碱基配对规则相关的“多核苷酸”和“寡核苷酸”(它们是可互换的术语,指的是核苷酸序列)。例如,序列“CAGT”与序列“GTCA”互补。互补可以是“部分的”或“全部的”。“部分”互补是指一个或多个核酸碱基根据碱基配对规则错配,核酸之间的“全部”或“完全”互补是指每个核酸碱基在碱基配对下均与另一个碱基匹配规则。核酸链之间的互补程度对核酸链之间的杂交效率和强度具有重要影响。这在扩增反应以及取决于核酸之间结合的检测方法中特别重要。
如本文所用,术语“杂交”是指使用核酸链通过碱基配对与互补链结合以形成杂交复合物的任何过程来配对互补核酸。
如本公开所使用的,术语“核酸序列”和“核苷酸序列”是指寡核苷酸或多核苷酸及其片段或部分,并且是指可以是单链或双链的基因组或合成来源的DNA或RNA,和代表有义或反义链。
如本公开所使用的,术语“序列同一性”和“同一性百分比”指两个或更多个多核苷酸或多肽之间相同(即同一)的核苷酸或氨基酸的百分比。两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定:将多核苷酸或多肽的核苷酸或氨基酸序列对准且经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分,将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸(即取代或突变)或缺失核苷酸(即一个或两个多核苷酸中的核苷酸插入或核苷酸缺失)而在一个位置处不同。多肽可例如通过含有不同氨基酸(即取代或突变)或缺失氨基酸(即一个或两个多肽中的氨基酸插入或氨基酸缺失)而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言,可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。
示例性的,当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时,两个或多个序列或子序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%核苷酸的“序列同一性”或“同一性百分比”。在某些实施方案中,所述序列在任一或两个相比较的生物聚合物(例如,多核苷酸)的整个长度上基本相同。
术语“载体”是指将核酸序列引入细胞中从而产生转化细胞的手段。载体包括质粒、转座子、噬菌体、病毒、脂质体和附加体。“重组载体”、“表达载体”是包含待在受体细胞中表达的核苷酸序列的核酸序列。表达载体可以包括额外的核酸序列以促进和/或促进引入序列的表达,例如起始、终止、增强子、启动子和分泌序列。
如本公开所使用的,术语“个体”和“受试者”可互换地使用,是指哺乳动物。哺乳动物包括但不限于驯化动物(例如,奶牛、绵羊、猫、犬和马)、灵长类(例如,人和非人灵长类如猴)、兔和啮齿类(例如,小鼠和大鼠)。特别地,个体是人。
本文公开的方法可以在体外、离体、或体内进行,或者产品可以以体外、离体、或体内形式存在。术语“体外”是指在实验室条件或培养液中使用材料、生物物质、细胞和/或组织的实验;而术语“体内”是指使用完整多细胞有机体的实验和工序。在一些实施方案中,体内进行的方法可以在非人动物上进行。“离体”是指存在于有机体外或发生在有机体外,例如在人或动物体外的事件,例如可以在取自有机体的组织(例如整个器官)或细胞上存在或发生的事件。
如本公开所使用的,术语“药学上可接受的载体”是指药学上可接受的材料、组合物或媒介物,例如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如,润滑剂、滑石粉、硬脂酸镁、钙或锌或硬脂酸)或溶剂包封材料,涉及将化合物从身体的一个部位(例如,递送部位)运送或运输到另一个部位(例如,器官、组织或身体的一部分)。药学上可接受的载体是“可接受的”,意思是与制剂的其他成分相容并且对受试者的组织无害(例如,生理学相容的、无菌的、生理学的pH等)。可以充当药学上可接受的载体的材料的一些实例包括:(1)糖,例如乳糖、葡萄糖和蔗糖;(2)淀粉,如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素;(4)粉末黄蓍胶;(5)麦芽;(6)明胶;(7)润滑剂,如硬脂酸镁、十二烷基硫酸钠和滑石粉;(8)赋形剂,如可可脂和栓剂蜡;(9)油,如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和豆油;(10)二醇,如丙二醇;(11)多元醇,如甘油、山梨糖醇、甘露醇和聚乙二醇(PEG);(12)酯类,如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格氏液;(19)乙醇;(20)pH缓冲溶液;(21)聚酯,聚碳酸酯和/或聚酸酐;(22)增量剂(bulking agent),如多肽和氨基酸(23)血清成分,如血清白蛋白、高密度脂蛋白(high density lipoprotein,HDL)和低密度脂蛋白(low density lipoprotein,LDL);(22)C2-C12醇,如乙醇;和(23)药物制剂中采用的其他无毒相容物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于制剂中。诸如“赋形剂”、“药学上可接受的载体”等术语在本文中可互换使用。
如本文所用,术语“有效量”是指足以引起期望的生物学反应的生物活性剂的量。例如,在一些实施方案中,碱基编辑器的有效量可以指足以诱导由碱基编辑器突变的特异性结合的靶位点的突变的碱基编辑器的量。如本领域技术人员将理解的,试剂,例如碱基编辑器CRISPR-Cas效应子融合蛋白、脱氨酶、多核苷酸等的有效量可以随各种因素而变化,例如随期望的生物学反应,例如随待编辑的特定等位基因、基因组或靶位点,随靶定的细胞或组织和使用的试剂而变化。
术语“治疗”、“处理”是指如本文所述旨在逆转、缓解疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作或抑制疾病或病症或其一种或多种症状进展的临床干预。如本文所用,术语“治疗”、“处理”是指如本文所述旨在逆转、缓解疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作或抑制疾病或病症或其一种或多种症状进展的临床干预。在一些实施方案中,可以在一种或多种症状已经得以形成之后和/或疾病已经得到诊断之后施用治疗。在其他实施方案中,可以在没有症状的情况下施用治疗,例如用于预防或延迟症状的发作或抑制疾病的发作或进展。例如,可以在症状发作之前(例如,鉴于症状的历史和/或鉴于遗传或其他易感性因素)施用治疗于易感个体。治疗也可以在症状消退后继续进行,例如以预防或延迟其复发。
如背景技术所提到的,现有技术中的CRISPR/Cas系统切割效率较低。因而,在本申请中发明人尝试开发新型Cas蛋白和CRISPR/Cas系统,从而丰富CRISPR/Cas系统,提高切割效率和靶向性,以适应在实际使用中的需求。因而提出了本申请的一系列保护方案。
在本申请第一种典型的实施方式中,提供了一种CRISPR-Cas效应子蛋白,该CRISPR-Cas效应子蛋白包括与SEQ ID NO:1至5中任一项的氨基酸序列具有至少70%同一性的蛋白(例如,70%,71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)。
在一种优选的实施例中,CRISPR-Cas效应子蛋白包括与SEQ ID NO:1至5中任一项的氨基酸序列具有80%以上,优选90%以上,更优选95%以上,进一步优选99%以上同一性的蛋白;优选地,CRISPR-Cas效应子蛋白包括RuvC结构域。
在一种优选的实施例中,CRISPR-Cas效应子蛋白包括:
a)SEQ ID NO:1至5中任一项所示的蛋白;或
b)以SEQ ID NO:1所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:N21X,N23X,R25X,K26X,Q482X,S484X,R486X,S489X,R493X,H511X,C513X,H515X,N516X,R518X,R540X,K558X,Y560X,K562X,K565X,T600X,T672X,D676X,Q680X,Y683X,L686X,D693X,Y731X,G767X,R772X,K832X,K833X,Q836X,M896X;或
c)以SEQ ID NO:2所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:R19X,R28X,R32X,K512X,N527X,W531X,R553X,K581X,K589X,I590X,R605X,K611X,R612X,R615X,Y777X,E877X,R931X;或
d)以SEQ ID NO:3所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:K8X,F15X,N17X,K20X,K471X,W483X,H502X,R505X,K557X,K556X,R560X,Y673X,L676X,Y723X,N822X,K823X,E826X,K827X,K830X,K880X,L887X;或
e)以SEQ ID NO:4所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:K317X,W330X,Y351X,K354X,D392X,F395X,N399X,Y509X,V512X,Y568X,N662X,K663X,E666X,R667X,K670X,K719X,L726X;或
f)以SEQ ID NO:5所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:M9X,V16X,D18X,K21X,K518X,W531X,F550X,K553X,R609X,Y612X,R616X,Y730X,L733X,Y781X,N879X,K880X,E883X,K884X,K887X,K936X,F943X;其中X为任意氨基酸。
上述CRISPR-Cas效应子蛋白具有剪切活性,能够特异性或非特异性剪切核苷酸链,实现CRISPR-Cas系统的活性。上述同一性限定范围内的同源蛋白和点突变蛋白,相较于SEQ ID NO:1至5中任一项所示的蛋白,氨基酸的改变可以发生在蛋白活性位点或非活性位点处,包括RuvC结构域内或结构域外。氨基酸改变得到的蛋白,仍具有CRISPR-Cas效应子蛋白的剪切活性。
在本申请第二种典型的实施方式中,提供了一种CRISPR-Cas效应子融合蛋白,该CRISPR-Cas效应子融合蛋白包括上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子蛋白的衍生物或CRISPR-Cas效应子蛋白的功能片段,以及异源功能结构域。
功能片段的序列少于全长序列但保留了上述CRISPR-Cas效应子蛋白的切割功能,功能片段中的缺失残基可以在N末端、C末端和/或内部。衍生物是指与上述CRISPR-Cas效应子蛋白至少约80%的序列同一性,且拥有至少一种相同功能,例如与一个包含至少一个DR序列的crRNA结合并形成复合物的能力。衍生物形成的原因包括但不限于保守氨基酸残基取代。
通过向具有剪切活性的CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子蛋白的衍生物、或CRISPR-Cas效应子蛋白的功能片段上,融合异源功能结构域,获得CRISPR-Cas效应子融合蛋白,能够在正常发挥剪切活性的基础上,具有异源功能结构域的活性。在具体使用中,可以灵活选择现有技术中的异源功能结构域,增加该融合蛋白的功能。异源功能结构域与CRISPR-Cas效应子蛋白(包括衍生物和功能片段)的连接,可灵活选用现有技术中不同长度的融合蛋白接头(Linker),也可不利用Linker而直接相连,均不影响CRISPR-Cas效应子蛋白(包括衍生物和功能片段)和异源功能结构域的活性发挥。
在一种优选的实施例中,异源功能结构域位于CRISPR-Cas效应子融合蛋白的N端、C端或内部;优选地,异源功能结构域包括但不限于定位信号、报告蛋白、CRISPR-Cas效应子蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC(组蛋白去乙酰化酶)、裂解活性多肽、连接酶中的一种或多种;优选地,定位信号包括但不限于核定位信号和/或核输出信号;优选地,核输出信号包括但不限于人类蛋白酪氨酸激酶2;优选地,报告蛋白包括但不限于谷胱甘肽-S-转移酶、辣根过氧化物酶、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、或荧光蛋白中的一种或多种;优选地,荧光蛋白包括但不限于但不限于绿色荧光蛋白、HcRed、DsRed、青荧光蛋白、黄色荧光蛋白或蓝色荧光蛋白中的一种或多种;优选地,DNA结合域包括但不限于甲基化结合蛋白、LexA DBD(LexA蛋白的DNA结合结构域)或Gal4 DBD(GAL4蛋白的DNA结合结构域)中的一种或多种;优选地,表位标签包括但不限于组氨酸标签、V5标签、FLAG标签、流感病毒血凝素标签、Myc标签、VSV-G标签或硫氧还蛋白标签中的一种或多种;优选地,转录激活域包括但不限于VP64和/或VPR;优选地,转录抑制域包括但不限于KRAB和/或SID;优选地,核酸酶包括但不限于FokI;优选地,脱氨结构域包括但不限于ADAR1、ADAR2、APOBEC、AID或TAD中的一种或多种;优选地,裂解活性多肽包括但不限于具有单链RNA裂解活性的多肽、具有双链RNA裂解活性的多肽、具有单链DNA裂解活性的多肽或具有双链DNA裂解活性的多肽;优选地,连接酶包括但不限于DNA连接酶和/或RNA连接酶。
灵活选用上述异源功能结构域,能够实现融合蛋白的多种功能与活性。上述脱氨结构域包括脱氨酶或脱氨酶的功能片段,将上述脱氨结构域与利用上述异源功能结构域与CRISPR-Cas效应子蛋白融合,能够实现碱基编辑器的效果。包含核定位信号的融合蛋白,能够能与入核载体相互作用,使蛋白能被运进细胞核。DNA结合域(DBD)能够识别特定的DNA序列,从而提高融合蛋白的靶向性。
在本申请第三种典型的实施方式中,提供了一种DNA分子,该DNA分子编码上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白。
在一种优选的实施例中,DNA分子为根据宿主细胞的密码子偏好性进行密码子优化的DNA分子;优选地,宿主细胞包括原核细胞或真核细胞;优选地,DNA分子包括与SEQ IDNO:6至10中任一项的核苷酸序列具有70%以上(例如,70%,71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%),优选90%以上,更优选95%以上,进一步优选99%,更进一步优选为100%同一性的核苷酸。
上述DNA分子,包括分离的DNA分子。能够通过转录、翻译,编码上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白。上述DNA分子包括单链或双链DNA,均能够携带遗传信息,从而实现编码蛋白的作用。根据DNA分子所处的、或编码发生的宿主细胞的密码子偏好性,灵活进行密码子优化,能够实现DNA分子的高效表达。上述SEQ ID NO:6至10所示的核苷酸,分别能够编码SEQ ID NO:1至5所示的蛋白。
在本申请第四种典型的实施方式中,提供了一种重组载体,该重组载体包含上述DNA分子。
在一种优选的实施例中,DNA分子与启动子连接;优选地,启动子包括但不限于诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种;优选地,启动子包括但不限于T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种;优选地,重组载体包括但不限于逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹载体或噬菌粒载体;优选地,所述重组载体包括质粒载体。
在本申请第五种典型的实施方式中,提供了一种宿主细胞,该宿主细胞转化有上述重组载体。
将上述DNA分子整合到上述重组载体中,获得能够在宿主细胞中复制、表达的重组载体,从而实现DNA分子的大规模复制和表达,进而实现上述CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白的表达、纯化,或在宿主细胞中发挥蛋白活性。
在本申请第六种典型的实施方式中,提供了一种基因编辑系统,该基因编辑系统包括:a)RNA指导物或编码RNA指导物的核酸,RNA指导物包括直接重复序列和间隔子序列,间隔子序列用于与靶核酸杂交;b)上述CRISPR-Cas效应子蛋白,或CRISPR-Cas效应子融合蛋白,或DNA分子,或重组载体,或宿主细胞;DNA分子、重组载体或宿主细胞能够表达CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,在基因编辑系统中,CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,与RNA指导物结合后,靶向作用于间隔子序列与靶核酸杂交形成的杂交序列。
上述基因编辑系统,包括RNA指导物或编码RNA指导物的核酸,以及CRISPR-Cas效应子蛋白,或CRISPR-Cas效应子融合蛋白,或能够表达上述蛋白的DNA分子、重组载体或宿主细胞。该基因编辑系统,通过RNA指导物与靶核酸杂交结合,形成杂交序列;杂交序列上的RNA指导物能够与上述蛋白结合形成复合物,从而使得蛋白靠近靶核酸完成定位,蛋白从而发挥活性,靶向或非靶向地对上述靶核酸进行切割、切口等修饰。
在一种优选的实施例中,基因编辑系统不包含tracrRNA。
tracrRNA是trans-activating crRNA的简写,在涉及Cas9蛋白的基因编辑系统中单独转录,并与crRNA结合形成gRNA(guide RNA),从而与Cas9蛋白结合而引导蛋白定位。上述基因编辑系统中不包含tracrRNA,则引导蛋白定位的gRNA长度和分子量更小,gRNA与Cas蛋白的结合域更小,从而实现Cas蛋白分子量和尺寸的减小,丰富了CRISPR-Cas系统的应用场景。
在一种优选的实施例中,RNA指导物包括1种或多种。
上述RNA指导物包括1种、2种、3种、4种、5种乃至更多种。基因编辑系统中包括多种RNA指导物,及能够同时与多个靶核酸杂交,进而在多个靶核酸位点发挥该基因编辑系统的活性,能够大大提高基因编辑的效率,降低基因编辑、细胞传代、编辑结果验证等实验所需时间。在现有技术中,同时利用多个gRNA的情况在实际实验过程中也较为常见,例如进行基因敲除或检测应用时,均可会采用多个gRNA。
在一种优选的实施例中,靶核酸包括DNA;优选地,DNA包括来源于真核生物的DNA或来源于原核生物的DNA;优选地,真核生物包括但不限于动物或植物;优选地,DNA包括但不限于非人类哺乳动物DNA、人类DNA、昆虫DNA、鸟类DNA、爬行动物DNA、两栖动物DNA、啮齿动物DNA、鱼类DNA、蠕虫DNA、线虫DNA或酵母DNA;优选地,非人类哺乳动物DNA包括但不限于非人类灵长类DNA。
利用上述基因编辑系统,RNA指导物能够与不同来源的DNA进行杂交,从而实现对于多物种的基因编辑。
在一种优选的实施例中,直接重复序列的3’端包含茎环结构,茎环结构包括依次连接的第一茎核苷酸链、环核苷酸链和第二茎核苷酸链和,第一茎核苷酸链和第二茎核苷酸链彼此杂交形成茎环结构的茎,环核苷酸链形成茎环结构的环;优选地,第一茎核苷酸链的长度为5或6个核苷酸;优选地,第二茎核苷酸链的长度为5个核苷酸;优选地,环核苷酸链的长度为6、7或8个核苷酸。
在一种优选的实施例中,茎环结构包括SEQ ID NO:25、28、31、34或37的核苷酸序列。
上述RNA指导物中包括直接重复序列和间隔子序列,其中直接重复序列的3’端为具有二级结构的茎环结构。在茎环结构中,包括能够彼此杂交的第一茎核苷酸链、第二茎核苷酸链,杂交形成双链,环核苷酸链形成环状结构。该茎环结构能够与CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白结合,从而发挥引导蛋白定位的作用。序列上的N表示所有碱基。
在本申请实施例中,SEQ ID NO:25所述的核苷酸对应的茎环结构,能够与CasY1蛋白结合;SEQ ID NO:28所述的核苷酸对应的茎环结构,能够与CasY2蛋白结合;SEQ ID NO:31所述的核苷酸对应的茎环结构,能够与CasY3蛋白结合;SEQ ID NO:34所述的核苷酸对应的茎环结构,能够与CasY4蛋白结合;SEQ ID NO:37所述的核苷酸对应的茎环结构,能够与CasY5蛋白结合。对于茎环结构序列的选择,蛋白可以与上述茎环结构自由组合,也可以如上述的同一性进行灵活选用,而不影响蛋白与RNA指导物的结合。
在一种优选的实施例中,直接重复序列包括与SEQ ID NO:24、27、30、33或36的核苷酸序列具有至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的核苷酸序列;优选地,直接重复序列包括与SEQ ID NO:24、27、30、33或36的核苷酸序列具有至少85%以上,更优选90%以上,进一步优选95%以上同一性的核苷酸序列;优选地,直接重复序列包括SEQ ID NO:24、27、30、33或36的核苷酸序列。
在一种优选的实施例中,间隔子序列包括80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)以上与靶核酸互补;优选地,间隔子序列包括90%以上,更优选95%以上,进一步优选99%以上,更进一步优选100%与靶核酸互补;优选地,间隔子序列的长度为18-41nt;优选地,间隔子序列的长度为18-37nt;优选地,间隔子序列长度为18-26nt或34-36nt;优选地,间隔子序列长度为20nt。
上述间隔子序列包括80%以上与靶核酸互补的片段,通过至少80%的碱基互补配对,带有间隔子序列的RNA指导物能够与靶核酸牢固结合,从而实现该基因编辑系统对靶核酸的修饰。间隔子序列的长度可在一定范围内灵活选择,若长度过短则形成的互补链长度较短,结合力差,且结合特异性较弱,影响基因编辑效率和脱靶率;若长度过长,则增加RNA引导物的长度,且互补配对难度,也会对基因编辑效率产生影响。
在一种优选的实施例中,直接重复序列包括第一直接重复序列和第二直接重复序列;优选地,RNA指导物包括按顺序依次连接的第一直接重复序列、间隔子序列以及第二直接重复序列;优选地,第一直接重复序列与第二直接重复序列相同。
本申请中的RNA指导物是指促进本发明中蛋白质靶向于靶核酸的任何RNA分子,包括但不限于crRNA、前crRNA(例如DR-间隔子-DR)和成熟crRNA(例如成熟DR-间隔子,成熟DR-间隔子-成熟DR)。如本申请实施例中所用的RNA指导物即为前crRNA,直接重复序列包括位于间隔子序列两端的第一直接重复序列和第二直接重复序列,茎环结构在第一和第二直接重复序列均存在。在细胞后续对于RNA指导物的加工中,能够进一步获得发挥活性的RNA指导物,如对于DR-间隔子-DR组成的前crRNA,在加工后其中一个直接重复序列被删除。
在一种优选的实施例中,靶核酸包含前间隔子相邻基序,CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白能够识别前间隔子相邻基序(PAM),前间隔子相邻基序包含核酸序列5’-TTN-3’,其中N是任何核苷酸;优选地,N为A、C或T。
在CRISPR-Cas系统中,Cas酶可以识别与靶核酸附近相关联的短基序,从而完成对特异性位点的剪切、修饰。上述基因编辑系统中的CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,能够特异性识别的PAM为5’-TTN-3’,其中N是任何核苷酸。且对5’-TTA-3’、5’-TTC-3’和5’-TTT-3’识别效率最高。
在一种优选的实施例中,CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,与RNA指导物结合,形成蛋白-核酸复合物;优选地,蛋白-核酸复合物是非天然存在的或经修饰的;优选地,蛋白-核酸复合物中的至少一个组分是非天然存在的或经修饰的。
在基因编辑系统中,RNA指导物与Cas蛋白能够形成蛋白-核酸复合物。可以对RNA指导物进行修饰或对Cas蛋白进行修饰,或者直接采用不修饰的蛋白-核酸复合物(即RNA指导物与Cas蛋白均为天然的),均能够发挥基因编辑的作用。
在一种优选的实施例中,通过CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白和RNA指导物对靶核酸的靶向作用,对靶核酸进行修饰;优选地,修饰包括但不限于切割或切口;优选地,修饰导致:(1)细胞包含至少一种基因产物的表达的改变;或(2)细胞包含至少一种基因产物的表达的改变,其中至少一种基因产物的表达增加;或(3)细胞包含至少一种基因产物的表达的改变,其中至少一种基因产物的表达减少;或(4)细胞包含经编辑的基因组;优选地,修饰导致细胞毒性;优选地,修饰导致抑制基因表达,降低基因表达,或增强基因表达。
利用上述CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白和RNA指导物对靶核酸的靶向作用,能够对靶核酸进行修饰,包括切割或切口。切割是单链DNA或双链DNA的断裂。切口是双链DNA的某一条DNA链断裂。上述作用于细胞基因的修饰,能够导致细胞中基因产物表达的改变,这种改变包括增加或减少,也能够导致细胞基因组被编辑。上述修饰可以作用于细胞自身的基因组,也可以作用于细胞中的如质粒等外源基因。上述修饰能够导致细胞毒性,抑制基因表达,降低基因表达,或增强基因表达等情况的出现。
在一种优选的实施例中,基因编辑系统包括目标核酸或编码目标核酸的核酸,目标核酸包括同源臂片段和供体模板核酸;优选地,目标核酸包含能够与间隔子序列杂交的序列;优选地,同源臂片段包括5’同源臂和3’同源臂,目标核酸由5’同源臂、供体模板核酸和3’同源臂顺序连接组成。
上述基因编辑系统中,还可以包括目标核酸或编码目标核酸的核酸,目标核酸包含能够与间隔子序列杂交的序列,即能够将目标核酸定位在特定的核酸位点(如靶核酸)上。在本申请中,靶核酸为基因编辑系统所修饰的核酸;供体模板核酸为对靶核酸进行修饰、修改时的模版。进一步地,目标核酸包括同源臂片段和供体模板核酸,同源臂片段能够与特定的核酸位点周围的核酸进行特异性结合,供体模板核酸则携带有特定的遗传信息,能够通过同源重组或其他机制,在上述CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白对靶核酸进行切割后,将特定的遗传信息整合到靶核酸的位置,从而完成对于靶核酸的修饰,包括碱基的插入、删除或替换,从而完成基因编辑。
“供体模板核酸”是指在Cas酶改变(修饰,包括碱基的插入、删除或替换)了靶核酸之后,一种或多种细胞蛋白质(如同源重组酶)可以使用其来改变靶核酸的结构的核酸分子。举例说明,利用Cas蛋白对靶核酸进行修饰后,利用同源重组酶,以供体模板核酸为模版,对于靶核酸进行插入、删除或替换等修饰、改变。供体模板核酸可以是双链核酸、单链核酸;供体模板核酸可以是线性的、环状的(例如可以采用质粒);供体模板核酸可以是外源核酸分子。供体模板核酸包括DNA或RNA。
在一种优选的实施例中,基因编辑系统以可递送的形式存在,利用递送系统,使基因编辑系统与靶核酸接触;优选地,递送系统将基因编辑系统递送入含有靶核酸的细胞中;优选地,可递送的形式包括但不限于纳米颗粒、脂质体、外泌体、微泡、蛋白衣壳或基因枪所用的颗粒。
对于存在于细胞内的靶核酸,通过上述递送系统能够将基因编辑系统递送入细胞中,从而完成基因编辑系统与靶核酸的接触。递送系统也可以进一步地定位于特定的细胞种类、细胞内部结构等位置,达到基因编辑系统精确递送的目的,提高基因编辑的精确性。
在本申请第七种典型的实施方式中,提供了一种基因编辑载体,该基因编辑载体包含上述编码RNA指导物的核酸。
在一种优选的实施例中,基因编辑载体还包含上述DNA分子;优选地,DNA分子与编码RNA指导物的核酸位于相同或不同的载体上;优选地,DNA分子与第一调节元件连接;优选地,编码RNA指导物的核酸与第二调节元件连接;优选地,第一调节元件和第二调节元件分别独立选自诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种;优选地,第一调节元件和第二调节元件分别独立选自包括但不限于T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种。
上述基因编辑载体包含能够编码RNA指导物的核酸,能够复制编码RNA指导物的核酸,并在细胞中编码RNA指导物。利用上述包含DNA分子的重组载体与该基因编辑载体,能够分别表达CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白与RNA指导物,即能表达上述基因编辑系统。在该基因编辑载体中,也可以包含上述DNA分子,DNA分子与编码RNA指导物的核酸位于相同或不同的载体上。若位于相同载体上,则基因编辑载体包括一个载体;若位于不同载体上,则多个载体组成基因编辑载体。利用上述基因编辑载体,能够在细胞中表达上述基因编辑系统。在基因编辑载体上,可以各自独立地灵活设置多种如启动子等调节元件,帮助RNA指导物和/或蛋白完成转录、翻译、纯化等工作。
在本申请第八种典型的实施方式中,提供了一种上述基因编辑系统与细胞中靶核酸结合的方法,该方法包括:将基因编辑系统递送至细胞中,细胞包括靶核酸;使CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,与RNA指导物结合,使间隔子序列与靶核酸结合。
在一种优选的实施例中,靶核酸为双链DNA或单链DNA;优选地,基因编辑系统与细胞中靶核酸的结合,导致靶核酸的表达状态改变;优选地,基因编辑系统与细胞中靶核酸的结合,导致靶核酸被切割;优选地,靶核酸被切割导致靶核酸破坏、或靶核酸特定位点替换、或靶核酸位点的移除、或靶核酸区域功能的改变、或靶核酸上两个位点之间的序列倒置。
靶核酸破坏,例如靶标突变,例如导致基因敲除;靶核酸替换,例如导致靶标校正;靶位点的移除,例如导致靶标缺失;功能的改变,例如,靶核酸活性或可及性,导致例如(转录的和/或表观遗传的)基因或基因组区域激活或者基因或基因组区域沉默。靶核酸上两个位点之间的序列倒置,例如通过切割靶核酸包括在两个位点,再利用Donor序列或Cre-loxP重组酶系统即可实现。
上述递送包括但不限于质粒转化、显微注射、纳米颗粒、脂质体、外泌体、微泡、蛋白衣壳或基因枪等现有技术。靶核酸破坏包括靶核酸突变或基因敲除,靶核酸特定位点替换包括靶核酸中错误碱基被纠正,靶核酸位点的移除能够导致靶核酸位点缺失,区域功能的改变包括但不限于靶核酸表达活性重新激活,或靶核酸表达活性失活,或表达量的调高,或表达量的调低,或表达产物改变。靶核酸的表达状态改变,包括但不限于基因沉默或基因表达激活。
在本申请第九种典型的实施方式中,提供了一种含有基因编辑系统的细胞,含有基因编辑系统的细胞包括上述基因编辑系统、或基因编辑载体。
在一种优选的实施例中,含有基因编辑系统的细胞包含经修饰的目的靶基因座,目的靶基因座为利用基因编辑系统修饰的基因座;优选地,目的靶基因座的修饰导致:(1)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变;或(2)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变,其中至少一种基因产物的表达增加;或(3)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变,其中至少一种基因产物的表达减少;或(4)含有基因编辑系统的细胞包含经编辑的基因组;优选地,含有基因编辑系统的细胞包括真核细胞或原核细胞;优选地,真核细胞包括但不限于动物细胞、植物细胞或人类细胞;优选地,动物细胞包括但不限于哺乳动物细胞。
上述含有基因编辑系统的细胞中含有上述基因编辑系统或基因编辑载体,处于基因编辑未发生、基因编辑正在发生、基因编辑已完成等多种状态的细胞均属于上述含有基因编辑系统的细胞。处于基因编辑正在发生和基因编辑已完成的上述细胞中,含有经修饰的目的靶基因座。能够导致细胞中基因产物表达的改变,这种改变包括增加或减少,也能够导致细胞基因组被编辑。上述修饰可以作用于细胞自身的基因组,也可以作用于细胞中的如质粒等外源基因。上述修饰能够导致细胞毒性,抑制基因表达,降低基因表达,或增强基因表达等情况的出现。
术语“靶基因座”包含期望编辑的多核苷酸的任何DNA区段或区域。在一些实施例中,靶基因座为基因组座位。靶基因座对于细胞可为天然的,或另选地可包含异源或外源DNA区段。异源或外源DNA区段可包括转基因、表达盒、编码选择标记的多核苷酸,或者异源或外源DNA区域。在具体的实施例中,所靶向基因座可包含来自原核生物、真核生物、动物或植物,包括非人哺乳动物、非人细胞、啮齿动物、人、鼠、灵长类动物或任何其他目标生物体,或者它们的组合的天然、异源或外源基因组核酸序列。
在本申请第十种典型的实施方式中,提供了一种靶向和编辑靶核酸的方法,该方法包括使靶核酸与上述基因编辑系统接触。
在本申请第十一种典型的实施方式中,提供了一种在识别靶核酸后非特异性降解单链DNA的方法,该方法包括使靶核酸与上述基因编辑系统接触。利用近似于Cas12i的旁切效应的活性,能够实现上述方法。Cas12i蛋白可具有附带活性,即在某些环境中,激活的Cas12i蛋白在结合靶序列后仍然保持活性,并继续非特异性地切割非靶寡核苷酸。该附带活性被称为“旁切活性”或“乱切活性”,利用该活性,能够使用Cas12i系统检测特定靶寡核苷酸的存在。比如,将Cas12i系统工程化以非特异性切割ssDNA或转录物。比如,Cas12i在体外系统或细胞中瞬时或稳定地提供或表达,并靶向或触发以非特异性地切割细胞核酸,例如ssDNA,例如病毒ssDNA。
在现有技术中,上述旁切活性能够应用于称为SHERLOCK的高灵敏度和特异性核酸检测平台,该平台可用于许多临床诊断。利用“旁切活性”进行检测时,会用到报告核酸,“报告核酸”是指可被激活的CRISPR系统蛋白切割或以其他方式减活的分子。报告核酸包含可被CRISPR蛋白切割的核酸元件。核酸元件的切割释放出剂或产生构象变化,从而允许产生可检测的信号。在切割之前,或者当报告核酸处于“活性”状态时,报告核酸阻止阳性可检测信号的产生或检测。比如,在存在活性报告核酸的情况下可产生最小的背景信号。阳性可检测信号可以是可使用光学、荧光、化学发光、电化学或本领域已知的其他检测方法检测的任何信号。例如,在某些实施方式中,当存在报告核酸时,可检测到第一信号(即阴性可检测信号),然后在检测到靶分子以及通过激活的CRISPR蛋白切割或减活后将其转换为第二信号(例如阳性可检测信号)。利用上述方法或上述CRISPR-Cas效应子蛋白,能够实现上述应用。
在本申请第十二种典型的实施方式中,提供了一种在识别双链靶DNA的间隔子互补链后靶向双链靶DNA的非间隔子互补链并使其产生切口的方法,该方法包括使双链靶DNA与上述基因编辑系统接触。
在本申请第十三种典型的实施方式中,提供了一种靶向和切割双链靶DNA的方法,该方法包括使双链靶DNA与上述基因编辑系统接触。
在一种优选的实施例中,在使双链DNA的间隔子互补链产生切口之前,使双链靶DNA的非间隔子互补链产生切口。
在本申请第十四种典型的实施方式中,提供了一种特异性编辑双链核酸的方法,该方法包括在充分的条件下使以下进行接触充分的时间量,(1)上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白、另一具有序列特异性切口活性的酶,以及RNA指导物,RNA指导物指导CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白,相对于另一序列特异性切口酶的活性使相对链产生切口;以及(2)双链核酸;上述方法导致双链断裂的形成。
在上述方法中,可以将两种上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白、或者一种上述蛋白和另一种具有切口活性的Cas蛋白(两种Cas蛋白被一对RNA指导物靶向到靶基因座的相对链)可以产生具有突出端的双链断裂。这种方法可降低脱靶修饰的可能性,因为双链断裂预计只发生在两种酶都产生切口的基因座处,从而增加基因组编辑特异性。该方法也称为“双切口”或“配对切口酶”策略。
在本申请第十五种典型的实施方式中,提供了一种编辑双链核酸的方法,该方法包括在充分的条件下使以下进行接触充分的时间量:(1)上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白,和具有DNA修饰活性的蛋白质结构域的融合蛋白,以及靶向双链核酸的RNA指导物;以及(2)双链核酸;融合蛋白的CRISPR-Cas效应子被修饰以使双链核酸的非靶链产生切口。利用近似于Cas12i的旁切效应的活性,能够实现上述方法。上述双链核酸包括但不限于病毒DNA(例如,巴氏病毒、肝炎病毒、疱疹病毒、腺病毒、痘病毒、细小病毒等)。
在一种优选的实施例中,双链核酸的两条链在不同的位点被切割,导致交错切割;优选地,双链核酸的两条链在同一位点被切割,导致平双链断裂(DSB)。
在本申请第十六种典型的实施方式中,提供了一种靶向并切割单链靶DNA的方法,该方法包括使靶核酸与上述基因编辑系统接触。
上述基因编辑系统与靶核酸接触,能够利用基因编辑系统对靶核酸进行编辑。在充分的接触时间内,基因编辑系统能够靶核酸进行编辑。上述接触在细胞内、外均能实现。充分的条件和接触充分的时间量,表示上述方法能够进行或进行完全的反应条件和反应时间,根据上述方法的具体实施可进行灵活调整。上述基因编辑系统与靶核酸接触,能够利用基因编辑系统对靶核酸进行编辑,实现不同的基因编辑效果。在充分的接触时间内,基因编辑系统能够靶核酸进行编辑。上述接触在细胞内、外均能实现,靶核酸包括但不限于基因组、分离的单链或双链DNA。
在本申请第十七种典型的实施方式中,提供了一种诱导细胞状态改变的方法,上述方法保守使上述基因编辑系统与细胞中的靶核酸接触。
在一种优选的实施例中,细胞状态包括但不限于凋亡或休眠;优选地,细胞包括真核细胞或原核细胞;优选地,细胞包括但不限于哺乳动物细胞或植物病变细胞;优选地,细胞包括但不限于癌细胞;优选地,细胞包括但不限于感染性细胞或被感染原感染的细胞;优选地,细胞包括但不限于被病毒感染的细胞、被朊病毒感染的细胞;优选地,细胞包括但不限于真菌细胞、原生动物或寄生虫细胞。
上述诱导细胞状态改变的方法,通过基因编辑系统接触细胞中调控生长、代谢等功能的靶核酸,从而时间对靶核酸的修饰,进而诱导细胞状态改变。如对癌细胞、寄生虫细胞等中的特征靶核酸进行修饰,从而改变细胞的状态,使之凋亡或休眠,达到清除此类细胞的目的。
在本申请第十八种典型的实施方式中,提供了一种利用上述基因编辑系统在制备治疗受试者病症或疾病的药物中的应用。
在一种优选的实施例中,应用包括向受试者或受试者的离体细胞施用基因编辑系统;优选地,间隔子序列与跟病症或疾病相关的靶核酸的至少15个核苷酸互补,CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白切割靶核酸;优选地,病症或疾病包括但不限于癌症或感染性疾病;优选地,癌症包括但不限于维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤或尿膀胱癌中的一种或多种;优选地,病症或疾病包括但不限于囊性纤维化、进行性假肥大性肌营养不良、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、额颞叶痴呆、遗传性慢性肾脏病、高脂血症、高胆固醇血症、莱伯氏先天性黑蒙、镰状细胞病或β地中海贫血中的一种或多种;优选地,感染性疾病的感染原包括但不限于人类免疫缺陷病毒、单纯疱疹病毒-1或单纯疱疹病毒-2中的一种或多种。
利用上述基因编辑系统,能够应用于制备治疗受试者病症或疾病的药物。此种应用包括对受试者或其离体细胞施用基因编辑系统,对于受试者的施用包括局部施用、全身施用或靶向施用等,进而达到药物的作用。间隔子序列与跟病症或疾病相关的靶核酸的至少15个核苷酸互补,能够保证间隔子序列与靶核酸实现稳定的特异性结合,防止脱靶情况的发生。上述病症或疾病包括但不限于癌症或感染性疾病,通过该应用能够对癌细胞基因组或受试者缺陷基因等靶核酸进行修饰,进而达到药物的作用。
在本申请第十九种典型的实施方式中,提供了一种真核细胞系,该真核细胞系包含上述含有基因编辑系统的细胞,或为含有基因编辑系统的细胞的后代。
在本申请第二十种典型的实施方式中,提供了一种多细胞生物体,该多细胞生物体包含上述含有基因编辑系统的细胞。
在一种优选的实施例中,多细胞生物体包括但不限于模型动物或模型植物。
上述多细胞生物体为利用上述基因编辑系统修饰过的多细胞生物体,在上述基因编辑系统的作用下获得可遗传或不可遗传的基因修饰。上述基因修饰包括利用基因编辑系统进行的基因插入、删除或替换,基因修饰的结果,及该多细胞生物体的基因修饰为可控制和可预期的。
在本申请第二十一种典型的实施方式中,提供了一种获得目的性状的植物的方法,利用上述基因编辑系统与植物细胞接触,对植物细胞的基因进行修饰或引入目的基因,修饰或目的基因能够表达目的性状,获得修饰后的植物细胞,利用修饰后的植物细胞进行再生,获得目的性状的植物。
在本申请第二十二种典型的实施方式中,提供了一种鉴定植物中目的性状的方法,植物细胞中的目的基因能够表达目的性状,利用上述基因编辑系统与植物细胞接触,从而鉴定目的基因。
在本申请第二十三种典型的实施方式中,提供了一种试剂盒,该试剂盒包括一种或多种选自下列的组分:上述CRISPR-Cas效应子蛋白、CRISPR-Cas效应子融合蛋白、DNA分子、重组载体、宿主细胞、基因编辑系统、基因编辑载体、含有基因编辑系统的细胞、真核细胞系、多细胞生物体;试剂盒的组分分布在在相同或不同的容器中。
在本申请第二十四种典型的实施方式中,提供了一种容器,该容器包含上述试剂盒。
在一种优选的实施例中,容器包括无菌容器;优选地,容器包括注射器。
在本申请第二十五种典型的实施方式中,提供了一种可植入装置,该可植入装置包括上述基因编辑系统。
在一种优选的实施例中,基因编辑系统在基质内;优选地,基因编辑系统在储库内。
可使用可植入装置将本发明的CRISPR-Cas效应子蛋白、CRISPR-Cas效应子融合蛋白、本公开的RNP、本公开的核酸(例如,上述DNA分子、重组载体、基因编辑载体、CRISPR-Cas效应子指导RNA、编码CRISPR-Cas效应子指导RNA的核酸、编码CRISPR-Cas效应子蛋白的核酸、供体模板等)或本公开的CRISPR-Cas效应子系统递送至靶细胞(例如,体内靶细胞,其中靶细胞是循环中的靶细胞、组织中的靶细胞、器官中的靶细胞等)。适用于将本公开的CRISPR-Cas效应子多肽、本公开的CRISPR-Cas效应子融合多肽、本公开的RNP、本公开的核酸或本公开的CRISPR-Cas效应子系统递送至靶细胞(例如,体内靶细胞,其中靶细胞是循环中的靶细胞、组织中的靶细胞、器官中的靶细胞等)的可植入装置可包括容器(例如,储库、基质等),所述容器包含CRISPR-Cas效应子蛋白、CRISPR-Cas效应子CRISPR-Cas效应子融合蛋白、RNP或CRISPR-Cas效应子系统(或其组分,例如本公开的核酸)。
合适的可植入装置可包括例如用作装置主体的聚合物基底(诸如基质),并且在一些情况下包括另外的支架材料(诸如金属或另外的聚合物),以及增强可见性和成像的材料。可植入递送装置可有利于在局部和长时间内提供释放,其中待递送的多肽和/或核酸直接释放至靶位点,例如细胞外基质(ECM)、肿瘤周围的脉管系统、病变组织等。合适的可植入递送装置包括适用于递送至腔(诸如腹腔)和/或其中药物递送系统未锚定或附接的任何其他类型的施用的装置,所述装置包括生物稳定的和/或可降解的和/或生物可吸收的聚合物基底,其可以例如任选地是基质。
上述基质包括在与生物环境接触后被有效加工和/或改型而不形成生物学活性、毒性和/或有害的副产物的材料。包括但不限于生物可吸收基质,可用于生物可吸收基质的材料包括例如生物聚合物(例如蛋白质、肽、碳水化合物、多核苷酸等)、合成聚合物、蛋白质、多糖、丝、聚癸二酸甘油酯(PGS)、聚二恶烷酮、聚乳酸-羟基乙酸共聚物(PLGA)、聚乳酸(PLA)、胶原、壳聚糖、丝蛋白及其组合。可用于生物可吸收基质的丝材料包括例如蚕丝蛋白、改性蚕丝蛋白、蜘蛛丝、昆虫丝、重组丝及其任意组合。上述储库储库组合物包括可生物侵蚀、可生物相容的聚合物的基质,包括但不限于高分子凝胶储库或膜控储库。
在一些情况下,合适的可植入药物递送装置包含可降解聚合物,其中主要释放机制是整体侵蚀(bulkerosion)。在一些情况下,合适的可植入药物递送装置包含不可降解或缓慢降解的聚合物,其中主要释放机制是扩散而不是整体侵蚀,使得外部部分用作膜并且其内部部分用作药物储库,实际上,所述药物储库长时间内(例如约一周至约几个月)不会受到周围环境的影响。也可任选地使用具有不同释放机制的不同聚合物的组合。在总释放期的有效期内,浓度梯度可保持有效恒定,并且因此扩散速率是有效恒定的(称为“零模式”扩散)。术语“恒定”意指扩散速率维持高于治疗有效性的下阈值,但其仍然任选地以初始突发为特征并且/或者可波动,例如增加和降低到某一程度。扩散速率可长时间这样维持,并且可认为扩散速率恒定到某一水平以优化治疗有效期,例如有效的沉默期。
在一些情况下,可植入递送系统被设计成保护基于核苷酸的治疗剂免于降解,无论是化学性质还是由于受试者体内酶和其他因素的攻击而引起的降解。可选择装置的植入位点或靶位点,用于获得最大的治疗功效。
下面将结合具体的实施例来进一步详细解释本申请的有益效果。
实施例1
CasY1、CasY2、CasY3、CasY4和CasY5(即CasY1-CasY5)基因和RNA指导物的获取。
下载NCBI和JGI数据库的微生物基因组和宏基因组数据,总共得到了20TB的高质量数据。
用TBLASTN(https://blast.ncbi.nlm.nih.gov/)对宏基因组数据进行本地比对,获得了5种全新的CRISPR-Cas效应子蛋白,即CasY1(SEQ ID NO:1)和CasY2(SEQ ID NO:2)、CasY1(SEQ ID NO:3)、CasY4(SEQ ID NO:4)、CasY5(SEQ ID NO:5)。
SEQ ID NO 1:
MNKMKKTKKLDVRKSYSGRLNPNDRKREHLQRSLRALRKGSEFFFDLVQAWCGGLTPEMLEENAKADDLIDLWCAIYWFRPVSTTVATHPINQNDLVATFENYYGGKASSLVNEYLTAPIGEEFLWNDCRQKYEHFCRDFGADFTNDLRTLLRNNLIAVASNKSELETSTISSLFGTGVKASRSVKVEVLEKILNAVQNLEKIPDDCRSIQKIILESAQANDLNEFKIVYSGGNKSNKDGTTKKGNGRPSFLEEFLKLNGDEKLTPSKFKEFFEKLIEEIKKKKQDMSWDHAQRLREYIENNTATKYDAWAWEEMLKSGQTPLKSKATRNYSFTKERAEQFVEIQKNQDLEIVNDLNGFFESEFFNGEYKFVICQFHIGNDDLEKLFKFWNETDADVWNEDTELILNDFCDDLKNSFNRTPIKNVLKYLFQ FRKKYTAKQLVNAAKYNEQFDKYKNRKVHPSVLGNQGFTWPNALIPPDKAQRSDRENSLDLRIWLYIKLLHEDGTWKKHHVCFHNSRFFSEVYAAGSNEIEPVKFRTPRFGTTLPKLTAQTPIRVAKKYVKIAKREAKVRLAAQQGLLPKISIPLNELSAVINDSLGVTIPVKFKVDQPSRIPKLNDIILGYDQNQTASHAYSLWQVVEENTPDSFYYEGKGWECHVKFLRSGDVTSLTKTKKDDVIDQLSYEGLDYKNYADWKRTAKRFADNWTISKGKEITPAVDRFESIERWQPRLYRFNKDYAYILRDIVRGKSLAELQQIRPEIFRFITQGFGVCRLGSLSLDALEAVKAAKGVVYSYFSTALNGSKENPISDEQRKEFDPELFKLLEKLEFIRTKKKQQKVDRIGNSVLSIALENQAKFIRGEESLPTTNKSTKKKQNGRSMDWLARGVANKIRQLAEMHEIGLLNVDPRFTSHQDPLVHNNPNKAMKCRYTAAPISEIGDNVLAKLSANLKNKNRGTTGEYYHQGMKEFLEHYGLQNIENDLLKWRKKRPTIQCWELQKILAEKFGNEETVIYFPAKGGRKYFATHKVASDAVSMMFNGKNVWLCNSDHVAAANIALSELNKISLPRLWTKSEQPDEPSDDEKTDATPRNS。
SEQ ID NO 2:
MEAGKVGKKGKTNKKFIIRPYLTELNLREDGRLAFQKTFDYMDEQQAALFILGGSVMSHLDESIIRRLGLHKGSKKDLPQRLRVSLHLAIARFRLVSVNYHLDAKAISRMSPTARLAHEQLAEAHRASLIKSPISVWRNRHGVPDEAVHAYLDGNYDPETYAWQDTAMLAKKLCGILKLSPEDFKEASEAMMRNVNFLGCSGSTGSGSSVSNLFGQNEKEDSRNQARIESKTAKVIGKLLESRRPIPMERAVSLVCKSLGHPDAEAAGEDHGGQTDKSTFRQFMRGDYGGSLKELAKKLQKDAHKHRNKSIIPHRETIGAFIKQCASGEFYNKATSESWKDFNAMMNGKYKHNIIFVTEKIALGNAMRKLESNEKAVKASKQLEKLIDKYEMDGNKRFVPKVASVNGLEAYRDVIQDNPQEDDESVKDWLKRLWTTFSEGNDRRLKTPFRWLVESLARLETPESAIKDGCRLMSIRHKHESQRPHPFVRVQSRFTVGDSNIAGSINKPTELKPNRDGRSPEDYWGGNPVVWMSCRLLNGNRWQDMRIPIHNSRYINEVYYTRMGPDGNHALPLKEHARDVKHDYEAETKISRTAARRVNENRMLRRGKPSKRFERVKANSTHNVVFDPKTTASFNRRQDDIYGTINHRHPMVPLAPDGFFAVGGNVIGIDLGESVPLAAGILQKCTSTDSEAVRYACGHWKVVGMGKPGQLLDRQTSANRRKQPHTIIDPMSNMGEPFSSPICQKFIAKCRKFVRAKGSEEDNKAFDDMVKREPSLYSFHGRWGWLLKQMMKAAKGARLDPFREHLEWLLFRTKYGPTNRKSLNLNSMASTKNVISAIDSYMSRRGWKTVEQRQRRDGRLQAARSSLQSNLVNRRLERIKKEESQCIRLAHLFAVTTHLVLEDNLPKQNGASSRADNGRKADWRSRHLAQRLCGIKNDSGSCAIAGVRARRIDPVMTSHMDPFVYSLDNKWAMRARYTKVSLSSMTDYHANLIRSILLEKPGKRQTTEYYQRAVQDFARLHGLDVDEMRKVREARWYKKRIKAKTLYIPCRGGRVFLSTHRLQSDTPHTDSSGAVLWEQDADQVAALNVALRYIDQCYRSNKKGLAKVKKPK。
SEQ ID NO 3:
MSEITAIKTYNSNLFANSEKNIKYLRDTGVALKNTTNVFRGLLVAFYGGITPEIARENIKIIKKEKSLDMDLIYAINRFRPVRSNSDLAKYQIPQPVMRGKFESVVGHEASELAAEFLNSPIGEDYVWIDGLRAYEDLKSQIGDFDYDLKVMVRENILPIYNFPNIEASASISRIFGNGKKEDREFKVGVVKKIKELILNSDLGDDYSVLQQIILSAAGAKDMKEFSKTYVGKAAGRRGKIQNILLENSNKKLGANTIQSVLEKCDEIVCEKSSKLIWKNNQGLLKYIEIQSDLSYDPKAYSECFKAALAEIQPKNTVNYNFAVKRLQNKKDLESNVQAMQNSAMLNNYFDSHYFQGSNNFVICPYHLGGENLSQLFKIYKNIGDSTEAVKEYCSELRGSVKDPIPSLCEYVLTLRDLSCKQIIGAASYNQLIQRYKDHKVHPTKDGNNNYTFSTGSAMYGCLIPPNKAKKTDRPGSPDSRIWMILRVLNGKKWEDHHYYIHNVRFLEEVYAHNPEFKGDPVAIRGGRFGGIGKKICESSLQSLRENPQKYRKTKKRLLRLQESIKNNSLPNINWNEKIASIGVRFDHNNFKATINFKIKVNHKKFEGLKVGDKIMSYDQNQTQSHAYAVMNVCNSFDSGAIPFRGHYVQVNETGKIRSNIQVGQNNYDPLSYSGLSFEKYENWRNQRKNFVSKYRFIIGKNNENCDMLEELEKIESRKPSLYEYNYKYSAILRKIVRGTSGVKLDECRKEIISFLAKEQASIRNVSSLNHHSFSAFRSAKSLISAYFAASTGLNISTDEQKQDNDPEIFEIRKDLERSRKNKCREKINKISNTIVTIANMEGCNIICGEFGLSSTGSKNNTKKQNNKNMDWLARGVEKKIKEMCLLHNIHFKDAPPHYTSHQDPFVYNNTLLKVESVDHMKARFAYLSVDDVEEWHLKKLSSYLKNNKNGTAYYYNSATKQFLDHYGLVEHEEKITKNKLSLSKFKDILIKNFGNVNIVMPLRGGRYYLASKNVVTGAVPFSFGGSCYLSDADEVAAINVGLTIFPQQNS。
SEQ ID NO 4:
MLMLGDIVPYDSVGEIDGWGAVSRTFGKDKKADIAVQKKFCDEVLSKINEENCKTFEDYKKIIFEIFNASTIKELKNTWNSGAGVRSAKVIDNLGKDTDPEFTFEKERKNWESVQEEKSFIPNRPNYWAIIHYMEGKIGDEVDNSSWAVMYQNAIIDICSKITRNHNFSYEQTERKKELSKCDTSALELVNGYFKSTYFKSGNEFIIENRHVPNIGRLIELYSELTVVNDDNINEIIEIVDSETKVNENTTGDNQLKKYILSISGFATVHQIEQAMKYNKIKDDIEQTKAHPFVSGNASFTVGNSALKGSIASQNSKHKGKIAGQSAKIWLYIHLYHKDIKEWREHHIPFYHAKFFEEVYYFDPALTETVKIRNKKMKTNITKENIVRDGIDPRFAEKNIRTAAVRQNCRANVAMIPSSLELTKKNGEFTITISQRFPKGLKRKKSDIRLNDIVMAYDQNQTRPNTYSILRVTSTTKDKDGRYPCEFIKGGDIRSFINTKIGDIDVINYDGVDNTTTFFVDFVRGRTEFIHSVCNLDAFKKTNDNNLKYDFNCLGELARTNREQTKLYRWQNWYLRLLLTMMKLSKGSIPGLRSEIIYVVRFMDEKSSLSQICIENIRSMKKIINSWFSYEMKNQDATNEEKELHDKEMYALLKRIEQRRSNKNKERIRKIASAIVAIAQQEGANIIVGEKELDTKKKGKNKASNNRAMDWCPGQVSEKVKHGVDLLDISFFTMPAFYTSHQDPFVYSDSNREMRPRMDEINPEAPNAERKIKSFVTLAKMKPKKETMTQYYSDGVDRFCVHNNITRAELKKIKTRNDWIARLGSEKCLVPVRGGRYYLSAKVAASGATQIVYAGETRYLSSADHIAATNIGLSFLVPYDPEKQKKKKGKNQTAVDKTSTVA。
SEQ ID NO 5:
MASDVTSYMTYRANLVPDARKKKLLNDTYAFYRKGEELFFDAFFDILGGVSPQLINTLVNDGTIKAENDATDEEKNDITEEDKNNTSKKKLDPKLLCAILWFRLVKKEKNTCEILNVKLLKEKFSAYYGAEANDTVISYFSANYDVENYMWVDCRVRCLSFCNKLGTSLDVLAIDLESMLRAKNIAFFGGVGKADKAISNIFIRSEKRGKSNVKKLHEYAVNTIDILEKTEVINSDQYLDVLLRVFGAANIDELQNICKKENGGSKLVKPIGQFLNSKFVFDPKKVKKSWVDLAKEKSYAPNYPSCDKLKIYIENKLGKLGQLTKPKNKVSDDDEQGSNKGLWSSMFRNAITSICAAVTHNYSFSIGQTDRQEKLSILRKSNGSIANEINENFPQKDQYTIMPYHVPDLKNTIRLYNGLNQKTDEEIAGILNTINNNEKAKRKKHGDVRAQAYILSLYTSNSTKYTEKSITDALKINKIEDTIKNQKVHPFVLGNAGMRFGGDDNCVGRIERPSVFVKELGCYAGESDKMWITIKVIDEGRWKTHHIPFFQAKYYEELYAFDPDPEKKETVNIRMNKTNTLAKKGNTSNAGMFNESFYEGNDEETKMKRKKYRQKRVRNKVALENLKYNVDFVDPTFVLFKNSEGFGINISQNIQDPTGLKGEITTGQNIMGIDQNRDRSNSYSIWRITGDQANGIYPAEFVKSGDISSLIKTNKKDEKGNKKEYDVFTYDGLNTDSEKLNSFFADRKAFIYGLDPAVFNTSEYNIFFEYEKIKNEKKKIYQWNGSYLSLLRKVLTMSKGNTEKLKNEIRKEIINVIRLIDGKSSLSHCCIMNMQGMIKVINSWFAYTMGENSSTEDQKKEYDSEMYNLLLYVRKRRKNKKTEKINKMANAIICTAIENNVKHIILEALDKKGDKGNSRQNNASNMDWCAKGIIDKVITGCRFVDINVRKVNPAYTSHQDPMVHNKNNPAMKPRIAKIDMVEKNNWAVEKLVSISSMDPKENSAEIHYFNFIDVFCRQYKIDRKDLNKIKKISDLQDLMAEKHSFIYVPSRGGQYYLSTHRVTSCDDDIQILYDGKNVWLANSDHIAAANIVLRGLDYSPSPKKKNKTDLDLAAVGG。
图1示出了CasY1-CasY5的蛋白结构域示意图,其中D、E、D代表RuvC结构域的三个保守基序Ⅰ、Ⅱ、Ⅲ的催化残基,h表示桥螺旋结构。D-E-D表示Asp-Glu-Asp氨基酸,是RuvC结构域的保守氨基酸残基。
CasY1的编码DNA序列如SEQ ID NO:6所示,CasY2的编码DNA序列如SEQ ID NO:7所示,CasY3的编码DNA序列如SEQ ID NO:8所示,CasY4的编码DNA序列如SEQ ID NO:9所示,CasY5的编码DNA序列如SEQ ID NO:10所示。
CasY1-CasY5所对应的直接重复序列分别如SEQ ID NO:24、27、30、33、36所示,茎环结构的序列分别SEQ ID NO:25、28、31、34、37,RNA指导物(前crRNA序列)分别如SEQ IDNO:26、29、32、35、38所示。
对于CasY1、CasY2、CasY3、CasY4和CasY5的直接重复序列的二级结构进行分析,结果如图2所示。
实施例2
CasY1-CasY5基因的PAM序列的确定。
1.将CasY1蛋白的核酸序列(SEQ ID NO:6)和CasY1 crRNA-TTR序列(SEQ ID NO:11)克隆到表达载体pACYCDuet-1(SEQ ID NO:16)中,构建出重组质粒pACYCDuet1-CasY1-crRNA,所述重组质粒序列如SEQ ID NO:17所示。
同样地,将CasY2蛋白的核酸序列(SEQ ID NO:7)和CasY2 crRNA-TTR序列(SEQ IDNO:12)克隆到表达载体pACYCDuet-1中,构建出重组质粒pACYCDuet1-CasY2-crRNA,所述重组质粒序列如SEQ ID NO:18所示。
将CasY3蛋白的核酸序列(SEQ ID NO:8)和CasY3 crRNA-TTR序列(SEQ ID NO:13)克隆到表达载体pACYCDuet-1中,构建出重组质粒pACYCDuet1-CasY3-crRNA,所述重组质粒序列如SEQ ID NO:19所示。
将CasY4蛋白的核酸序列(SEQ ID NO:9)和CasY4 crRNA-TTR序列(SEQ ID NO:14)克隆到表达载体pACYCDuet-1中,构建出重组质粒pACYCDuet1-CasY4-crRNA,所述重组质粒序列如SEQ ID NO:20所示。
将CasY5蛋白的核酸序列(SEQ ID NO:10)和CasY5 crRNA-TTR序列(SEQ ID NO:15)克隆到表达载体pACYCDuet-1中,构建出重组质粒pACYCDuet1-CasY5-crRNA,所述重组质粒序列如SEQ ID NO:21所示。
2.将合成的PAM文库序列克隆到pUC19载体上,重组质粒pUC19-PAM如SEQ ID NO:22所示。
本申请在SEQ ID NO:22中的随机序列包括6个随机碱基(n),即最终所构建的随机碱基序列种类达到46,共4096种排列组合。
3.将pACYCDuet1-CasY1-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中,对照组为pACYCDuet-1和pUC19-PAM文库质粒共转。
同样地,也将pACYCDuet1-CasY2-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中;将pACYCDuet1-CasY3-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中;将pACYCDuet1-CasY4-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中;将pACYCDuet1-CasY5-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中。
转化有2种质粒的DH5α细胞,37℃条件下处理1小时后,抽提质粒并对PAM区域序列进行PCR扩增和高通量测序。
图3是体内筛选效应子和文库质粒设计的示意图,pACYC-Effector-crRNA质粒即为SEQ ID NO:17-21所示质粒(效应子质粒),并设计了靶向PAM文库的pUC19-PAM文库质粒。
对于负选择筛选实验流程如下:
1)构建效应子质粒;
2)将效应子质粒和文库质粒转化到大肠杆菌中,然后生长,进行抗生素筛选;
3)利用靶向测序鉴定耗减的文库质粒,并利用小RNA测序鉴定成熟的crRNA。
图4是负选择筛选工作流的示意图。
4.分别统计实验组和对照组中4096种组合的PAM序列出现次数,并用PAM序列数目进行标准化,对于一条PAM序列,当log2(对照组标准化值/实验组标准化值)>3.5时,即认为该条PAM序列被显著消耗,通过显著被消耗的PAM序列预测得到PAM结构域。
通过实验结果,观察到CasY1-CasY5对带有5’-TTA、5’-TTT、5’-TTC PAM的靶标序列进行有效编辑,CasY1-CasY5蛋白的PAM序列为5’-TTN结构。通过统计发现,CRISPR/CasY1、CRISPR/CasY2、CRISPR/CasY3、CRISPR/CasY4、CRISPR/CasY5系统对于5’-TTA、5’-TTT、5’-TTC的编辑活性远高于5’-TTG。CasY1、CasY2、CasY3、CasY4、CasY5的PAM结构域分析结果如图5所示。图5中的“Bits”即为“比特”,“Position”为“位置”。
实施例3
细菌体内切割活性确定
1.构建ccdb毒性质粒,ccdb毒性质粒如SEQ ID:23所示。将ccdb毒性质粒(SEQ IDNO:23)转入Top10感受态细胞中,通过梯度实验,发现当平板中加入64mM L-阿拉伯糖(L-ara)时,细菌致死,说明该剂量是致死剂量。
2.将pACYCDuet1-CasY1-crRNA重组质粒(SEQ ID NO:17)和ccdb毒性质粒共转到Top10感受态细胞中,再加入64mM L-阿拉伯糖(L-ara)时,部分细菌存活,说明在存活部分的细菌中CasY1蛋白对ccdb毒性质粒进行了切割。
同样地,将pACYCDuet1-CasY2-crRNA重组质粒(SEQ ID NO:18)、pACYCDuet1-CasY3-crRNA重组质粒(SEQ ID NO:19)、pACYCDuet1-CasY4-crRNA重组质粒(SEQ ID NO:20)、pACYCDuet1-CasY5-crRNA重组质粒(SEQ ID NO:21)分别和ccdb毒性质粒共转到Top10感受态细胞中,再加入64mM L-阿拉伯糖(L-ara)时,部分细菌存活,说明在存活部分的细菌中,CasY2-CasY5蛋白分别对ccdb毒性质粒进行了切割。
CasY1-CasY5蛋白在细菌体内的切割示意图如图6所示,切割活性鉴定结果如图7所示。
实施例4
CasY1-CasY5蛋白的体外切割活性
1.CasY1-CasY5蛋白的表达纯化
将分别表达CasY1-CasY5的Rosetta(DE3)pLyseS(EMD Millipore)细胞分别接种于10ml LB培养基中37℃过夜培养。待细菌的OD600达到0.2时,将培养温度降至21℃继续培养,直到OD600达到0.6,然后加入终浓度是500μM的IPTG以诱导Cas蛋白表达。诱导培养14-18小时后收集细胞,将细胞重悬于200ml裂解缓冲液(50mM HEPES[pH7],2M NaCl,5mM MgCl,20mM imidazole),其中含有蛋白酶抑制剂(Roche complete,EDTA-free,COEDTAF-RO)和溶菌酶(Sigma,10837059001),进行匀浆。用超声处理(Branson Sonifier 450)裂解细胞。以10000×g离心1小时以清除裂解物。裂解物通过0.22μm过滤器(Millipore,Stericup)过滤,之后转移到镍柱(HisTrap FF,5ml)上,用咪唑梯度洗脱。将含有预期大小的蛋白质合并在一起,加入TEV蛋白酶(Sigma,T4455-10KU),并将样品在TEV缓冲液中透析过夜(500mMNaCl,50mM HEPES[pH为7],5mM MgCl,2mM DTT)。透析后将样品浓缩至500μl,在-80℃下冷冻储存。
2.体外切割测定
将纯化的蛋白质(25nM)在切割缓冲液(NEBuffer 3,5mM DTT)中37℃反应20分钟。分别使用500ng合成的TTR-2crRNA(pre-crRNA,SEQ ID NO:40、43、46、49、52)(南京金斯瑞生物科技有限公司合成)和200ng的靶DNA(dsDNA,如SEQ ID NO:57所示)进行裂解反应,蛋白质浓度分别为0nM,50nM,100nM,200nM,500nM和1μM。反应产物用纯化回收试剂盒回收(QIAGEN)。在TBE-尿素6%聚丙烯酰胺凝胶(Invitrogen)上检测切割效率。
SEQ ID NO:57:tagacaccaaatcttactggaaggcacttggcatctccccattccatgagcatgcagagg。
37℃条件下CasY1-CasY5蛋白具有明显切割活性。图8示出了体外切割活性结果,其中CasY1、CasY2、CasY3、CasY4、CasY5对靶dsDNA的体外切割活性分别如图8中的图a、图b、图c、图d、图e所示。
实施例5
293T细胞切割活性
1.将HEK293T细胞(购自ATCC)接种于添加了10%FBS(v/v)的DMEM培养基中(Gibco,11965092),其中含1%Penicillin Streptomycin(v/v)(Gibco,15140122),在含有5%CO2的37℃细胞培养箱中进行培养。利用LONZA转染试剂(Lonza,Cat#V4XP-3032)按照说明书转染,细胞通过计数得2×106个。
将CasY1蛋白:crRNA(金斯瑞生物科技有限公司化学合成)按照3μg:1.5μg的质量混合。同样地,将CasY2-CasY5蛋白和Lbcpf1蛋白(QRU95066.1,利用现有技术表达纯化后获得)均按照上述方式分别与多种crRNA(金斯瑞生物科技有限公司化学合成)按照上述比例混合,如表1所示。
表1
Figure BDA0003698605750000331
Figure BDA0003698605750000341
电转48h后分别收集细胞检测切割效率。
细胞进行基因组抽提(TIANGEN,DP304-03)。以基因组为模板,对靶点附近序列进行PCR扩增,扩增的PCR产物用于高通量深度测序(金唯智生物科技有限公司)。用于目标位点序列扩增的体系如下:2×Taq Master Mix(Vazyme,P112-03)25μL;Primer-F(10pmol/μL)1μL;Primer-R(10pmol/μL)1μL;模板1μL;ddH2O补齐到50μL。
2.在293T细胞中CasY1、CasY2、CasY3、CasY4、CasY5蛋白和LbCpf1的切割活性,参见图9所示,indel表示插入缺失率。显示了在瞬时转染效应子蛋白和RNA指导物48小时后,由靶向293T细胞系中TTR基因座和PCSK9的CasY1-CasY5和LbCpf1 CRISPR效应子诱导的插入缺失活性。对不同的RNA指导物设计进行了测定,并显示出不同程度的功效。误差线表示3个重复情况下的S.E.M.。
说明在293T细胞中CasY1-CasY5蛋白可以实现不同位点的高效切割,并且切割效率优于LbCpf1。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:上述CasY1、CasY2、CasY3、CasY4、CasY5蛋白,能够用于以靶向方式操纵核酸的系统、方法和组合物。由上述蛋白和RNA引导物组成的用于靶向修饰核酸(例如DNA)的非天然存在的工程改造的CRISPR-Cas系统,每个系统包括一起靶向核酸的一种或多种蛋白质组分和一种或多种核酸组分,能够在细胞内和外均发挥CRISPR-Cas系统的功能与活性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 尧唐(上海)生物科技有限公司
<120> CRISPR-Cas效应子蛋白、其基因编辑系统及应用
<130> PN185203YTSW
<160> 57
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1089
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> VARIANT
<222> (1)..(1089)
<223> CasY1
<400> 1
Met Asn Lys Met Lys Lys Thr Lys Lys Leu Asp Val Arg Lys Ser Tyr
1 5 10 15
Ser Gly Arg Leu Asn Pro Asn Asp Arg Lys Arg Glu His Leu Gln Arg
20 25 30
Ser Leu Arg Ala Leu Arg Lys Gly Ser Glu Phe Phe Phe Asp Leu Val
35 40 45
Gln Ala Trp Cys Gly Gly Leu Thr Pro Glu Met Leu Glu Glu Asn Ala
50 55 60
Lys Ala Asp Asp Leu Ile Asp Leu Trp Cys Ala Ile Tyr Trp Phe Arg
65 70 75 80
Pro Val Ser Thr Thr Val Ala Thr His Pro Ile Asn Gln Asn Asp Leu
85 90 95
Val Ala Thr Phe Glu Asn Tyr Tyr Gly Gly Lys Ala Ser Ser Leu Val
100 105 110
Asn Glu Tyr Leu Thr Ala Pro Ile Gly Glu Glu Phe Leu Trp Asn Asp
115 120 125
Cys Arg Gln Lys Tyr Glu His Phe Cys Arg Asp Phe Gly Ala Asp Phe
130 135 140
Thr Asn Asp Leu Arg Thr Leu Leu Arg Asn Asn Leu Ile Ala Val Ala
145 150 155 160
Ser Asn Lys Ser Glu Leu Glu Thr Ser Thr Ile Ser Ser Leu Phe Gly
165 170 175
Thr Gly Val Lys Ala Ser Arg Ser Val Lys Val Glu Val Leu Glu Lys
180 185 190
Ile Leu Asn Ala Val Gln Asn Leu Glu Lys Ile Pro Asp Asp Cys Arg
195 200 205
Ser Ile Gln Lys Ile Ile Leu Glu Ser Ala Gln Ala Asn Asp Leu Asn
210 215 220
Glu Phe Lys Ile Val Tyr Ser Gly Gly Asn Lys Ser Asn Lys Asp Gly
225 230 235 240
Thr Thr Lys Lys Gly Asn Gly Arg Pro Ser Phe Leu Glu Glu Phe Leu
245 250 255
Lys Leu Asn Gly Asp Glu Lys Leu Thr Pro Ser Lys Phe Lys Glu Phe
260 265 270
Phe Glu Lys Leu Ile Glu Glu Ile Lys Lys Lys Lys Gln Asp Met Ser
275 280 285
Trp Asp His Ala Gln Arg Leu Arg Glu Tyr Ile Glu Asn Asn Thr Ala
290 295 300
Thr Lys Tyr Asp Ala Trp Ala Trp Glu Glu Met Leu Lys Ser Gly Gln
305 310 315 320
Thr Pro Leu Lys Ser Lys Ala Thr Arg Asn Tyr Ser Phe Thr Lys Glu
325 330 335
Arg Ala Glu Gln Phe Val Glu Ile Gln Lys Asn Gln Asp Leu Glu Ile
340 345 350
Val Asn Asp Leu Asn Gly Phe Phe Glu Ser Glu Phe Phe Asn Gly Glu
355 360 365
Tyr Lys Phe Val Ile Cys Gln Phe His Ile Gly Asn Asp Asp Leu Glu
370 375 380
Lys Leu Phe Lys Phe Trp Asn Glu Thr Asp Ala Asp Val Trp Asn Glu
385 390 395 400
Asp Thr Glu Leu Ile Leu Asn Asp Phe Cys Asp Asp Leu Lys Asn Ser
405 410 415
Phe Asn Arg Thr Pro Ile Lys Asn Val Leu Lys Tyr Leu Phe Gln Phe
420 425 430
Arg Lys Lys Tyr Thr Ala Lys Gln Leu Val Asn Ala Ala Lys Tyr Asn
435 440 445
Glu Gln Phe Asp Lys Tyr Lys Asn Arg Lys Val His Pro Ser Val Leu
450 455 460
Gly Asn Gln Gly Phe Thr Trp Pro Asn Ala Leu Ile Pro Pro Asp Lys
465 470 475 480
Ala Gln Arg Ser Asp Arg Glu Asn Ser Leu Asp Leu Arg Ile Trp Leu
485 490 495
Tyr Ile Lys Leu Leu His Glu Asp Gly Thr Trp Lys Lys His His Val
500 505 510
Cys Phe His Asn Ser Arg Phe Phe Ser Glu Val Tyr Ala Ala Gly Ser
515 520 525
Asn Glu Ile Glu Pro Val Lys Phe Arg Thr Pro Arg Phe Gly Thr Thr
530 535 540
Leu Pro Lys Leu Thr Ala Gln Thr Pro Ile Arg Val Ala Lys Lys Tyr
545 550 555 560
Val Lys Ile Ala Lys Arg Glu Ala Lys Val Arg Leu Ala Ala Gln Gln
565 570 575
Gly Leu Leu Pro Lys Ile Ser Ile Pro Leu Asn Glu Leu Ser Ala Val
580 585 590
Ile Asn Asp Ser Leu Gly Val Thr Ile Pro Val Lys Phe Lys Val Asp
595 600 605
Gln Pro Ser Arg Ile Pro Lys Leu Asn Asp Ile Ile Leu Gly Tyr Asp
610 615 620
Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu Trp Gln Val Val Glu
625 630 635 640
Glu Asn Thr Pro Asp Ser Phe Tyr Tyr Glu Gly Lys Gly Trp Glu Cys
645 650 655
His Val Lys Phe Leu Arg Ser Gly Asp Val Thr Ser Leu Thr Lys Thr
660 665 670
Lys Lys Asp Asp Val Ile Asp Gln Leu Ser Tyr Glu Gly Leu Asp Tyr
675 680 685
Lys Asn Tyr Ala Asp Trp Lys Arg Thr Ala Lys Arg Phe Ala Asp Asn
690 695 700
Trp Thr Ile Ser Lys Gly Lys Glu Ile Thr Pro Ala Val Asp Arg Phe
705 710 715 720
Glu Ser Ile Glu Arg Trp Gln Pro Arg Leu Tyr Arg Phe Asn Lys Asp
725 730 735
Tyr Ala Tyr Ile Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Ala Glu
740 745 750
Leu Gln Gln Ile Arg Pro Glu Ile Phe Arg Phe Ile Thr Gln Gly Phe
755 760 765
Gly Val Cys Arg Leu Gly Ser Leu Ser Leu Asp Ala Leu Glu Ala Val
770 775 780
Lys Ala Ala Lys Gly Val Val Tyr Ser Tyr Phe Ser Thr Ala Leu Asn
785 790 795 800
Gly Ser Lys Glu Asn Pro Ile Ser Asp Glu Gln Arg Lys Glu Phe Asp
805 810 815
Pro Glu Leu Phe Lys Leu Leu Glu Lys Leu Glu Phe Ile Arg Thr Lys
820 825 830
Lys Lys Gln Gln Lys Val Asp Arg Ile Gly Asn Ser Val Leu Ser Ile
835 840 845
Ala Leu Glu Asn Gln Ala Lys Phe Ile Arg Gly Glu Glu Ser Leu Pro
850 855 860
Thr Thr Asn Lys Ser Thr Lys Lys Lys Gln Asn Gly Arg Ser Met Asp
865 870 875 880
Trp Leu Ala Arg Gly Val Ala Asn Lys Ile Arg Gln Leu Ala Glu Met
885 890 895
His Glu Ile Gly Leu Leu Asn Val Asp Pro Arg Phe Thr Ser His Gln
900 905 910
Asp Pro Leu Val His Asn Asn Pro Asn Lys Ala Met Lys Cys Arg Tyr
915 920 925
Thr Ala Ala Pro Ile Ser Glu Ile Gly Asp Asn Val Leu Ala Lys Leu
930 935 940
Ser Ala Asn Leu Lys Asn Lys Asn Arg Gly Thr Thr Gly Glu Tyr Tyr
945 950 955 960
His Gln Gly Met Lys Glu Phe Leu Glu His Tyr Gly Leu Gln Asn Ile
965 970 975
Glu Asn Asp Leu Leu Lys Trp Arg Lys Lys Arg Pro Thr Ile Gln Cys
980 985 990
Trp Glu Leu Gln Lys Ile Leu Ala Glu Lys Phe Gly Asn Glu Glu Thr
995 1000 1005
Val Ile Tyr Phe Pro Ala Lys Gly Gly Arg Lys Tyr Phe Ala Thr His
1010 1015 1020
Lys Val Ala Ser Asp Ala Val Ser Met Met Phe Asn Gly Lys Asn Val
1025 1030 1035 1040
Trp Leu Cys Asn Ser Asp His Val Ala Ala Ala Asn Ile Ala Leu Ser
1045 1050 1055
Glu Leu Asn Lys Ile Ser Leu Pro Arg Leu Trp Thr Lys Ser Glu Gln
1060 1065 1070
Pro Asp Glu Pro Ser Asp Asp Glu Lys Thr Asp Ala Thr Pro Arg Asn
1075 1080 1085
Ser
<210> 2
<211> 1112
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> VARIANT
<222> (1)..(1112)
<223> CasY2
<400> 2
Met Glu Ala Gly Lys Val Gly Lys Lys Gly Lys Thr Asn Lys Lys Phe
1 5 10 15
Ile Ile Arg Pro Tyr Leu Thr Glu Leu Asn Leu Arg Glu Asp Gly Arg
20 25 30
Leu Ala Phe Gln Lys Thr Phe Asp Tyr Met Asp Glu Gln Gln Ala Ala
35 40 45
Leu Phe Ile Leu Gly Gly Ser Val Met Ser His Leu Asp Glu Ser Ile
50 55 60
Ile Arg Arg Leu Gly Leu His Lys Gly Ser Lys Lys Asp Leu Pro Gln
65 70 75 80
Arg Leu Arg Val Ser Leu His Leu Ala Ile Ala Arg Phe Arg Leu Val
85 90 95
Ser Val Asn Tyr His Leu Asp Ala Lys Ala Ile Ser Arg Met Ser Pro
100 105 110
Thr Ala Arg Leu Ala His Glu Gln Leu Ala Glu Ala His Arg Ala Ser
115 120 125
Leu Ile Lys Ser Pro Ile Ser Val Trp Arg Asn Arg His Gly Val Pro
130 135 140
Asp Glu Ala Val His Ala Tyr Leu Asp Gly Asn Tyr Asp Pro Glu Thr
145 150 155 160
Tyr Ala Trp Gln Asp Thr Ala Met Leu Ala Lys Lys Leu Cys Gly Ile
165 170 175
Leu Lys Leu Ser Pro Glu Asp Phe Lys Glu Ala Ser Glu Ala Met Met
180 185 190
Arg Asn Val Asn Phe Leu Gly Cys Ser Gly Ser Thr Gly Ser Gly Ser
195 200 205
Ser Val Ser Asn Leu Phe Gly Gln Asn Glu Lys Glu Asp Ser Arg Asn
210 215 220
Gln Ala Arg Ile Glu Ser Lys Thr Ala Lys Val Ile Gly Lys Leu Leu
225 230 235 240
Glu Ser Arg Arg Pro Ile Pro Met Glu Arg Ala Val Ser Leu Val Cys
245 250 255
Lys Ser Leu Gly His Pro Asp Ala Glu Ala Ala Gly Glu Asp His Gly
260 265 270
Gly Gln Thr Asp Lys Ser Thr Phe Arg Gln Phe Met Arg Gly Asp Tyr
275 280 285
Gly Gly Ser Leu Lys Glu Leu Ala Lys Lys Leu Gln Lys Asp Ala His
290 295 300
Lys His Arg Asn Lys Ser Ile Ile Pro His Arg Glu Thr Ile Gly Ala
305 310 315 320
Phe Ile Lys Gln Cys Ala Ser Gly Glu Phe Tyr Asn Lys Ala Thr Ser
325 330 335
Glu Ser Trp Lys Asp Phe Asn Ala Met Met Asn Gly Lys Tyr Lys His
340 345 350
Asn Ile Ile Phe Val Thr Glu Lys Ile Ala Leu Gly Asn Ala Met Arg
355 360 365
Lys Leu Glu Ser Asn Glu Lys Ala Val Lys Ala Ser Lys Gln Leu Glu
370 375 380
Lys Leu Ile Asp Lys Tyr Glu Met Asp Gly Asn Lys Arg Phe Val Pro
385 390 395 400
Lys Val Ala Ser Val Asn Gly Leu Glu Ala Tyr Arg Asp Val Ile Gln
405 410 415
Asp Asn Pro Gln Glu Asp Asp Glu Ser Val Lys Asp Trp Leu Lys Arg
420 425 430
Leu Trp Thr Thr Phe Ser Glu Gly Asn Asp Arg Arg Leu Lys Thr Pro
435 440 445
Phe Arg Trp Leu Val Glu Ser Leu Ala Arg Leu Glu Thr Pro Glu Ser
450 455 460
Ala Ile Lys Asp Gly Cys Arg Leu Met Ser Ile Arg His Lys His Glu
465 470 475 480
Ser Gln Arg Pro His Pro Phe Val Arg Val Gln Ser Arg Phe Thr Val
485 490 495
Gly Asp Ser Asn Ile Ala Gly Ser Ile Asn Lys Pro Thr Glu Leu Lys
500 505 510
Pro Asn Arg Asp Gly Arg Ser Pro Glu Asp Tyr Trp Gly Gly Asn Pro
515 520 525
Val Val Trp Met Ser Cys Arg Leu Leu Asn Gly Asn Arg Trp Gln Asp
530 535 540
Met Arg Ile Pro Ile His Asn Ser Arg Tyr Ile Asn Glu Val Tyr Tyr
545 550 555 560
Thr Arg Met Gly Pro Asp Gly Asn His Ala Leu Pro Leu Lys Glu His
565 570 575
Ala Arg Asp Val Lys His Asp Tyr Glu Ala Glu Thr Lys Ile Ser Arg
580 585 590
Thr Ala Ala Arg Arg Val Asn Glu Asn Arg Met Leu Arg Arg Gly Lys
595 600 605
Pro Ser Lys Arg Phe Glu Arg Val Lys Ala Asn Ser Thr His Asn Val
610 615 620
Val Phe Asp Pro Lys Thr Thr Ala Ser Phe Asn Arg Arg Gln Asp Asp
625 630 635 640
Ile Tyr Gly Thr Ile Asn His Arg His Pro Met Val Pro Leu Ala Pro
645 650 655
Asp Gly Phe Phe Ala Val Gly Gly Asn Val Ile Gly Ile Asp Leu Gly
660 665 670
Glu Ser Val Pro Leu Ala Ala Gly Ile Leu Gln Lys Cys Thr Ser Thr
675 680 685
Asp Ser Glu Ala Val Arg Tyr Ala Cys Gly His Trp Lys Val Val Gly
690 695 700
Met Gly Lys Pro Gly Gln Leu Leu Asp Arg Gln Thr Ser Ala Asn Arg
705 710 715 720
Arg Lys Gln Pro His Thr Ile Ile Asp Pro Met Ser Asn Met Gly Glu
725 730 735
Pro Phe Ser Ser Pro Ile Cys Gln Lys Phe Ile Ala Lys Cys Arg Lys
740 745 750
Phe Val Arg Ala Lys Gly Ser Glu Glu Asp Asn Lys Ala Phe Asp Asp
755 760 765
Met Val Lys Arg Glu Pro Ser Leu Tyr Ser Phe His Gly Arg Trp Gly
770 775 780
Trp Leu Leu Lys Gln Met Met Lys Ala Ala Lys Gly Ala Arg Leu Asp
785 790 795 800
Pro Phe Arg Glu His Leu Glu Trp Leu Leu Phe Arg Thr Lys Tyr Gly
805 810 815
Pro Thr Asn Arg Lys Ser Leu Asn Leu Asn Ser Met Ala Ser Thr Lys
820 825 830
Asn Val Ile Ser Ala Ile Asp Ser Tyr Met Ser Arg Arg Gly Trp Lys
835 840 845
Thr Val Glu Gln Arg Gln Arg Arg Asp Gly Arg Leu Gln Ala Ala Arg
850 855 860
Ser Ser Leu Gln Ser Asn Leu Val Asn Arg Arg Leu Glu Arg Ile Lys
865 870 875 880
Lys Glu Glu Ser Gln Cys Ile Arg Leu Ala His Leu Phe Ala Val Thr
885 890 895
Thr His Leu Val Leu Glu Asp Asn Leu Pro Lys Gln Asn Gly Ala Ser
900 905 910
Ser Arg Ala Asp Asn Gly Arg Lys Ala Asp Trp Arg Ser Arg His Leu
915 920 925
Ala Gln Arg Leu Cys Gly Ile Lys Asn Asp Ser Gly Ser Cys Ala Ile
930 935 940
Ala Gly Val Arg Ala Arg Arg Ile Asp Pro Val Met Thr Ser His Met
945 950 955 960
Asp Pro Phe Val Tyr Ser Leu Asp Asn Lys Trp Ala Met Arg Ala Arg
965 970 975
Tyr Thr Lys Val Ser Leu Ser Ser Met Thr Asp Tyr His Ala Asn Leu
980 985 990
Ile Arg Ser Ile Leu Leu Glu Lys Pro Gly Lys Arg Gln Thr Thr Glu
995 1000 1005
Tyr Tyr Gln Arg Ala Val Gln Asp Phe Ala Arg Leu His Gly Leu Asp
1010 1015 1020
Val Asp Glu Met Arg Lys Val Arg Glu Ala Arg Trp Tyr Lys Lys Arg
1025 1030 1035 1040
Ile Lys Ala Lys Thr Leu Tyr Ile Pro Cys Arg Gly Gly Arg Val Phe
1045 1050 1055
Leu Ser Thr His Arg Leu Gln Ser Asp Thr Pro His Thr Asp Ser Ser
1060 1065 1070
Gly Ala Val Leu Trp Glu Gln Asp Ala Asp Gln Val Ala Ala Leu Asn
1075 1080 1085
Val Ala Leu Arg Tyr Ile Asp Gln Cys Tyr Arg Ser Asn Lys Lys Gly
1090 1095 1100
Leu Ala Lys Val Lys Lys Pro Lys
1105 1110
<210> 3
<211> 1051
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> VARIANT
<222> (1)..(1051)
<223> CasY3
<400> 3
Met Ser Glu Ile Thr Ala Ile Lys Thr Tyr Asn Ser Asn Leu Phe Ala
1 5 10 15
Asn Ser Glu Lys Asn Ile Lys Tyr Leu Arg Asp Thr Gly Val Ala Leu
20 25 30
Lys Asn Thr Thr Asn Val Phe Arg Gly Leu Leu Val Ala Phe Tyr Gly
35 40 45
Gly Ile Thr Pro Glu Ile Ala Arg Glu Asn Ile Lys Ile Ile Lys Lys
50 55 60
Glu Lys Ser Leu Asp Met Asp Leu Ile Tyr Ala Ile Asn Arg Phe Arg
65 70 75 80
Pro Val Arg Ser Asn Ser Asp Leu Ala Lys Tyr Gln Ile Pro Gln Pro
85 90 95
Val Met Arg Gly Lys Phe Glu Ser Val Val Gly His Glu Ala Ser Glu
100 105 110
Leu Ala Ala Glu Phe Leu Asn Ser Pro Ile Gly Glu Asp Tyr Val Trp
115 120 125
Ile Asp Gly Leu Arg Ala Tyr Glu Asp Leu Lys Ser Gln Ile Gly Asp
130 135 140
Phe Asp Tyr Asp Leu Lys Val Met Val Arg Glu Asn Ile Leu Pro Ile
145 150 155 160
Tyr Asn Phe Pro Asn Ile Glu Ala Ser Ala Ser Ile Ser Arg Ile Phe
165 170 175
Gly Asn Gly Lys Lys Glu Asp Arg Glu Phe Lys Val Gly Val Val Lys
180 185 190
Lys Ile Lys Glu Leu Ile Leu Asn Ser Asp Leu Gly Asp Asp Tyr Ser
195 200 205
Val Leu Gln Gln Ile Ile Leu Ser Ala Ala Gly Ala Lys Asp Met Lys
210 215 220
Glu Phe Ser Lys Thr Tyr Val Gly Lys Ala Ala Gly Arg Arg Gly Lys
225 230 235 240
Ile Gln Asn Ile Leu Leu Glu Asn Ser Asn Lys Lys Leu Gly Ala Asn
245 250 255
Thr Ile Gln Ser Val Leu Glu Lys Cys Asp Glu Ile Val Cys Glu Lys
260 265 270
Ser Ser Lys Leu Ile Trp Lys Asn Asn Gln Gly Leu Leu Lys Tyr Ile
275 280 285
Glu Ile Gln Ser Asp Leu Ser Tyr Asp Pro Lys Ala Tyr Ser Glu Cys
290 295 300
Phe Lys Ala Ala Leu Ala Glu Ile Gln Pro Lys Asn Thr Val Asn Tyr
305 310 315 320
Asn Phe Ala Val Lys Arg Leu Gln Asn Lys Lys Asp Leu Glu Ser Asn
325 330 335
Val Gln Ala Met Gln Asn Ser Ala Met Leu Asn Asn Tyr Phe Asp Ser
340 345 350
His Tyr Phe Gln Gly Ser Asn Asn Phe Val Ile Cys Pro Tyr His Leu
355 360 365
Gly Gly Glu Asn Leu Ser Gln Leu Phe Lys Ile Tyr Lys Asn Ile Gly
370 375 380
Asp Ser Thr Glu Ala Val Lys Glu Tyr Cys Ser Glu Leu Arg Gly Ser
385 390 395 400
Val Lys Asp Pro Ile Pro Ser Leu Cys Glu Tyr Val Leu Thr Leu Arg
405 410 415
Asp Leu Ser Cys Lys Gln Ile Ile Gly Ala Ala Ser Tyr Asn Gln Leu
420 425 430
Ile Gln Arg Tyr Lys Asp His Lys Val His Pro Thr Lys Asp Gly Asn
435 440 445
Asn Asn Tyr Thr Phe Ser Thr Gly Ser Ala Met Tyr Gly Cys Leu Ile
450 455 460
Pro Pro Asn Lys Ala Lys Lys Thr Asp Arg Pro Gly Ser Pro Asp Ser
465 470 475 480
Arg Ile Trp Met Ile Leu Arg Val Leu Asn Gly Lys Lys Trp Glu Asp
485 490 495
His His Tyr Tyr Ile His Asn Val Arg Phe Leu Glu Glu Val Tyr Ala
500 505 510
His Asn Pro Glu Phe Lys Gly Asp Pro Val Ala Ile Arg Gly Gly Arg
515 520 525
Phe Gly Gly Ile Gly Lys Lys Ile Cys Glu Ser Ser Leu Gln Ser Leu
530 535 540
Arg Glu Asn Pro Gln Lys Tyr Arg Lys Thr Lys Lys Arg Leu Leu Arg
545 550 555 560
Leu Gln Glu Ser Ile Lys Asn Asn Ser Leu Pro Asn Ile Asn Trp Asn
565 570 575
Glu Lys Ile Ala Ser Ile Gly Val Arg Phe Asp His Asn Asn Phe Lys
580 585 590
Ala Thr Ile Asn Phe Lys Ile Lys Val Asn His Lys Lys Phe Glu Gly
595 600 605
Leu Lys Val Gly Asp Lys Ile Met Ser Tyr Asp Gln Asn Gln Thr Gln
610 615 620
Ser His Ala Tyr Ala Val Met Asn Val Cys Asn Ser Phe Asp Ser Gly
625 630 635 640
Ala Ile Pro Phe Arg Gly His Tyr Val Gln Val Asn Glu Thr Gly Lys
645 650 655
Ile Arg Ser Asn Ile Gln Val Gly Gln Asn Asn Tyr Asp Pro Leu Ser
660 665 670
Tyr Ser Gly Leu Ser Phe Glu Lys Tyr Glu Asn Trp Arg Asn Gln Arg
675 680 685
Lys Asn Phe Val Ser Lys Tyr Arg Phe Ile Ile Gly Lys Asn Asn Glu
690 695 700
Asn Cys Asp Met Leu Glu Glu Leu Glu Lys Ile Glu Ser Arg Lys Pro
705 710 715 720
Ser Leu Tyr Glu Tyr Asn Tyr Lys Tyr Ser Ala Ile Leu Arg Lys Ile
725 730 735
Val Arg Gly Thr Ser Gly Val Lys Leu Asp Glu Cys Arg Lys Glu Ile
740 745 750
Ile Ser Phe Leu Ala Lys Glu Gln Ala Ser Ile Arg Asn Val Ser Ser
755 760 765
Leu Asn His His Ser Phe Ser Ala Phe Arg Ser Ala Lys Ser Leu Ile
770 775 780
Ser Ala Tyr Phe Ala Ala Ser Thr Gly Leu Asn Ile Ser Thr Asp Glu
785 790 795 800
Gln Lys Gln Asp Asn Asp Pro Glu Ile Phe Glu Ile Arg Lys Asp Leu
805 810 815
Glu Arg Ser Arg Lys Asn Lys Cys Arg Glu Lys Ile Asn Lys Ile Ser
820 825 830
Asn Thr Ile Val Thr Ile Ala Asn Met Glu Gly Cys Asn Ile Ile Cys
835 840 845
Gly Glu Phe Gly Leu Ser Ser Thr Gly Ser Lys Asn Asn Thr Lys Lys
850 855 860
Gln Asn Asn Lys Asn Met Asp Trp Leu Ala Arg Gly Val Glu Lys Lys
865 870 875 880
Ile Lys Glu Met Cys Leu Leu His Asn Ile His Phe Lys Asp Ala Pro
885 890 895
Pro His Tyr Thr Ser His Gln Asp Pro Phe Val Tyr Asn Asn Thr Leu
900 905 910
Leu Lys Val Glu Ser Val Asp His Met Lys Ala Arg Phe Ala Tyr Leu
915 920 925
Ser Val Asp Asp Val Glu Glu Trp His Leu Lys Lys Leu Ser Ser Tyr
930 935 940
Leu Lys Asn Asn Lys Asn Gly Thr Ala Tyr Tyr Tyr Asn Ser Ala Thr
945 950 955 960
Lys Gln Phe Leu Asp His Tyr Gly Leu Val Glu His Glu Glu Lys Ile
965 970 975
Thr Lys Asn Lys Leu Ser Leu Ser Lys Phe Lys Asp Ile Leu Ile Lys
980 985 990
Asn Phe Gly Asn Val Asn Ile Val Met Pro Leu Arg Gly Gly Arg Tyr
995 1000 1005
Tyr Leu Ala Ser Lys Asn Val Val Thr Gly Ala Val Pro Phe Ser Phe
1010 1015 1020
Gly Gly Ser Cys Tyr Leu Ser Asp Ala Asp Glu Val Ala Ala Ile Asn
1025 1030 1035 1040
Val Gly Leu Thr Ile Phe Pro Gln Gln Asn Ser
1045 1050
<210> 4
<211> 902
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> VARIANT
<222> (1)..(902)
<223> CasY4
<400> 4
Met Leu Met Leu Gly Asp Ile Val Pro Tyr Asp Ser Val Gly Glu Ile
1 5 10 15
Asp Gly Trp Gly Ala Val Ser Arg Thr Phe Gly Lys Asp Lys Lys Ala
20 25 30
Asp Ile Ala Val Gln Lys Lys Phe Cys Asp Glu Val Leu Ser Lys Ile
35 40 45
Asn Glu Glu Asn Cys Lys Thr Phe Glu Asp Tyr Lys Lys Ile Ile Phe
50 55 60
Glu Ile Phe Asn Ala Ser Thr Ile Lys Glu Leu Lys Asn Thr Trp Asn
65 70 75 80
Ser Gly Ala Gly Val Arg Ser Ala Lys Val Ile Asp Asn Leu Gly Lys
85 90 95
Asp Thr Asp Pro Glu Phe Thr Phe Glu Lys Glu Arg Lys Asn Trp Glu
100 105 110
Ser Val Gln Glu Glu Lys Ser Phe Ile Pro Asn Arg Pro Asn Tyr Trp
115 120 125
Ala Ile Ile His Tyr Met Glu Gly Lys Ile Gly Asp Glu Val Asp Asn
130 135 140
Ser Ser Trp Ala Val Met Tyr Gln Asn Ala Ile Ile Asp Ile Cys Ser
145 150 155 160
Lys Ile Thr Arg Asn His Asn Phe Ser Tyr Glu Gln Thr Glu Arg Lys
165 170 175
Lys Glu Leu Ser Lys Cys Asp Thr Ser Ala Leu Glu Leu Val Asn Gly
180 185 190
Tyr Phe Lys Ser Thr Tyr Phe Lys Ser Gly Asn Glu Phe Ile Ile Glu
195 200 205
Asn Arg His Val Pro Asn Ile Gly Arg Leu Ile Glu Leu Tyr Ser Glu
210 215 220
Leu Thr Val Val Asn Asp Asp Asn Ile Asn Glu Ile Ile Glu Ile Val
225 230 235 240
Asp Ser Glu Thr Lys Val Asn Glu Asn Thr Thr Gly Asp Asn Gln Leu
245 250 255
Lys Lys Tyr Ile Leu Ser Ile Ser Gly Phe Ala Thr Val His Gln Ile
260 265 270
Glu Gln Ala Met Lys Tyr Asn Lys Ile Lys Asp Asp Ile Glu Gln Thr
275 280 285
Lys Ala His Pro Phe Val Ser Gly Asn Ala Ser Phe Thr Val Gly Asn
290 295 300
Ser Ala Leu Lys Gly Ser Ile Ala Ser Gln Asn Ser Lys His Lys Gly
305 310 315 320
Lys Ile Ala Gly Gln Ser Ala Lys Ile Trp Leu Tyr Ile His Leu Tyr
325 330 335
His Lys Asp Ile Lys Glu Trp Arg Glu His His Ile Pro Phe Tyr His
340 345 350
Ala Lys Phe Phe Glu Glu Val Tyr Tyr Phe Asp Pro Ala Leu Thr Glu
355 360 365
Thr Val Lys Ile Arg Asn Lys Lys Met Lys Thr Asn Ile Thr Lys Glu
370 375 380
Asn Ile Val Arg Asp Gly Ile Asp Pro Arg Phe Ala Glu Lys Asn Ile
385 390 395 400
Arg Thr Ala Ala Val Arg Gln Asn Cys Arg Ala Asn Val Ala Met Ile
405 410 415
Pro Ser Ser Leu Glu Leu Thr Lys Lys Asn Gly Glu Phe Thr Ile Thr
420 425 430
Ile Ser Gln Arg Phe Pro Lys Gly Leu Lys Arg Lys Lys Ser Asp Ile
435 440 445
Arg Leu Asn Asp Ile Val Met Ala Tyr Asp Gln Asn Gln Thr Arg Pro
450 455 460
Asn Thr Tyr Ser Ile Leu Arg Val Thr Ser Thr Thr Lys Asp Lys Asp
465 470 475 480
Gly Arg Tyr Pro Cys Glu Phe Ile Lys Gly Gly Asp Ile Arg Ser Phe
485 490 495
Ile Asn Thr Lys Ile Gly Asp Ile Asp Val Ile Asn Tyr Asp Gly Val
500 505 510
Asp Asn Thr Thr Thr Phe Phe Val Asp Phe Val Arg Gly Arg Thr Glu
515 520 525
Phe Ile His Ser Val Cys Asn Leu Asp Ala Phe Lys Lys Thr Asn Asp
530 535 540
Asn Asn Leu Lys Tyr Asp Phe Asn Cys Leu Gly Glu Leu Ala Arg Thr
545 550 555 560
Asn Arg Glu Gln Thr Lys Leu Tyr Arg Trp Gln Asn Trp Tyr Leu Arg
565 570 575
Leu Leu Leu Thr Met Met Lys Leu Ser Lys Gly Ser Ile Pro Gly Leu
580 585 590
Arg Ser Glu Ile Ile Tyr Val Val Arg Phe Met Asp Glu Lys Ser Ser
595 600 605
Leu Ser Gln Ile Cys Ile Glu Asn Ile Arg Ser Met Lys Lys Ile Ile
610 615 620
Asn Ser Trp Phe Ser Tyr Glu Met Lys Asn Gln Asp Ala Thr Asn Glu
625 630 635 640
Glu Lys Glu Leu His Asp Lys Glu Met Tyr Ala Leu Leu Lys Arg Ile
645 650 655
Glu Gln Arg Arg Ser Asn Lys Asn Lys Glu Arg Ile Arg Lys Ile Ala
660 665 670
Ser Ala Ile Val Ala Ile Ala Gln Gln Glu Gly Ala Asn Ile Ile Val
675 680 685
Gly Glu Lys Glu Leu Asp Thr Lys Lys Lys Gly Lys Asn Lys Ala Ser
690 695 700
Asn Asn Arg Ala Met Asp Trp Cys Pro Gly Gln Val Ser Glu Lys Val
705 710 715 720
Lys His Gly Val Asp Leu Leu Asp Ile Ser Phe Phe Thr Met Pro Ala
725 730 735
Phe Tyr Thr Ser His Gln Asp Pro Phe Val Tyr Ser Asp Ser Asn Arg
740 745 750
Glu Met Arg Pro Arg Met Asp Glu Ile Asn Pro Glu Ala Pro Asn Ala
755 760 765
Glu Arg Lys Ile Lys Ser Phe Val Thr Leu Ala Lys Met Lys Pro Lys
770 775 780
Lys Glu Thr Met Thr Gln Tyr Tyr Ser Asp Gly Val Asp Arg Phe Cys
785 790 795 800
Val His Asn Asn Ile Thr Arg Ala Glu Leu Lys Lys Ile Lys Thr Arg
805 810 815
Asn Asp Trp Ile Ala Arg Leu Gly Ser Glu Lys Cys Leu Val Pro Val
820 825 830
Arg Gly Gly Arg Tyr Tyr Leu Ser Ala Lys Val Ala Ala Ser Gly Ala
835 840 845
Thr Gln Ile Val Tyr Ala Gly Glu Thr Arg Tyr Leu Ser Ser Ala Asp
850 855 860
His Ile Ala Ala Thr Asn Ile Gly Leu Ser Phe Leu Val Pro Tyr Asp
865 870 875 880
Pro Glu Lys Gln Lys Lys Lys Lys Gly Lys Asn Gln Thr Ala Val Asp
885 890 895
Lys Thr Ser Thr Val Ala
900
<210> 5
<211> 1117
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> VARIANT
<222> (1)..(1117)
<223> CasY5
<400> 5
Met Ala Ser Asp Val Thr Ser Tyr Met Thr Tyr Arg Ala Asn Leu Val
1 5 10 15
Pro Asp Ala Arg Lys Lys Lys Leu Leu Asn Asp Thr Tyr Ala Phe Tyr
20 25 30
Arg Lys Gly Glu Glu Leu Phe Phe Asp Ala Phe Phe Asp Ile Leu Gly
35 40 45
Gly Val Ser Pro Gln Leu Ile Asn Thr Leu Val Asn Asp Gly Thr Ile
50 55 60
Lys Ala Glu Asn Asp Ala Thr Asp Glu Glu Lys Asn Asp Ile Thr Glu
65 70 75 80
Glu Asp Lys Asn Asn Thr Ser Lys Lys Lys Leu Asp Pro Lys Leu Leu
85 90 95
Cys Ala Ile Leu Trp Phe Arg Leu Val Lys Lys Glu Lys Asn Thr Cys
100 105 110
Glu Ile Leu Asn Val Lys Leu Leu Lys Glu Lys Phe Ser Ala Tyr Tyr
115 120 125
Gly Ala Glu Ala Asn Asp Thr Val Ile Ser Tyr Phe Ser Ala Asn Tyr
130 135 140
Asp Val Glu Asn Tyr Met Trp Val Asp Cys Arg Val Arg Cys Leu Ser
145 150 155 160
Phe Cys Asn Lys Leu Gly Thr Ser Leu Asp Val Leu Ala Ile Asp Leu
165 170 175
Glu Ser Met Leu Arg Ala Lys Asn Ile Ala Phe Phe Gly Gly Val Gly
180 185 190
Lys Ala Asp Lys Ala Ile Ser Asn Ile Phe Ile Arg Ser Glu Lys Arg
195 200 205
Gly Lys Ser Asn Val Lys Lys Leu His Glu Tyr Ala Val Asn Thr Ile
210 215 220
Asp Ile Leu Glu Lys Thr Glu Val Ile Asn Ser Asp Gln Tyr Leu Asp
225 230 235 240
Val Leu Leu Arg Val Phe Gly Ala Ala Asn Ile Asp Glu Leu Gln Asn
245 250 255
Ile Cys Lys Lys Glu Asn Gly Gly Ser Lys Leu Val Lys Pro Ile Gly
260 265 270
Gln Phe Leu Asn Ser Lys Phe Val Phe Asp Pro Lys Lys Val Lys Lys
275 280 285
Ser Trp Val Asp Leu Ala Lys Glu Lys Ser Tyr Ala Pro Asn Tyr Pro
290 295 300
Ser Cys Asp Lys Leu Lys Ile Tyr Ile Glu Asn Lys Leu Gly Lys Leu
305 310 315 320
Gly Gln Leu Thr Lys Pro Lys Asn Lys Val Ser Asp Asp Asp Glu Gln
325 330 335
Gly Ser Asn Lys Gly Leu Trp Ser Ser Met Phe Arg Asn Ala Ile Thr
340 345 350
Ser Ile Cys Ala Ala Val Thr His Asn Tyr Ser Phe Ser Ile Gly Gln
355 360 365
Thr Asp Arg Gln Glu Lys Leu Ser Ile Leu Arg Lys Ser Asn Gly Ser
370 375 380
Ile Ala Asn Glu Ile Asn Glu Asn Phe Pro Gln Lys Asp Gln Tyr Thr
385 390 395 400
Ile Met Pro Tyr His Val Pro Asp Leu Lys Asn Thr Ile Arg Leu Tyr
405 410 415
Asn Gly Leu Asn Gln Lys Thr Asp Glu Glu Ile Ala Gly Ile Leu Asn
420 425 430
Thr Ile Asn Asn Asn Glu Lys Ala Lys Arg Lys Lys His Gly Asp Val
435 440 445
Arg Ala Gln Ala Tyr Ile Leu Ser Leu Tyr Thr Ser Asn Ser Thr Lys
450 455 460
Tyr Thr Glu Lys Ser Ile Thr Asp Ala Leu Lys Ile Asn Lys Ile Glu
465 470 475 480
Asp Thr Ile Lys Asn Gln Lys Val His Pro Phe Val Leu Gly Asn Ala
485 490 495
Gly Met Arg Phe Gly Gly Asp Asp Asn Cys Val Gly Arg Ile Glu Arg
500 505 510
Pro Ser Val Phe Val Lys Glu Leu Gly Cys Tyr Ala Gly Glu Ser Asp
515 520 525
Lys Met Trp Ile Thr Ile Lys Val Ile Asp Glu Gly Arg Trp Lys Thr
530 535 540
His His Ile Pro Phe Phe Gln Ala Lys Tyr Tyr Glu Glu Leu Tyr Ala
545 550 555 560
Phe Asp Pro Asp Pro Glu Lys Lys Glu Thr Val Asn Ile Arg Met Asn
565 570 575
Lys Thr Asn Thr Leu Ala Lys Lys Gly Asn Thr Ser Asn Ala Gly Met
580 585 590
Phe Asn Glu Ser Phe Tyr Glu Gly Asn Asp Glu Glu Thr Lys Met Lys
595 600 605
Arg Lys Lys Tyr Arg Gln Lys Arg Val Arg Asn Lys Val Ala Leu Glu
610 615 620
Asn Leu Lys Tyr Asn Val Asp Phe Val Asp Pro Thr Phe Val Leu Phe
625 630 635 640
Lys Asn Ser Glu Gly Phe Gly Ile Asn Ile Ser Gln Asn Ile Gln Asp
645 650 655
Pro Thr Gly Leu Lys Gly Glu Ile Thr Thr Gly Gln Asn Ile Met Gly
660 665 670
Ile Asp Gln Asn Arg Asp Arg Ser Asn Ser Tyr Ser Ile Trp Arg Ile
675 680 685
Thr Gly Asp Gln Ala Asn Gly Ile Tyr Pro Ala Glu Phe Val Lys Ser
690 695 700
Gly Asp Ile Ser Ser Leu Ile Lys Thr Asn Lys Lys Asp Glu Lys Gly
705 710 715 720
Asn Lys Lys Glu Tyr Asp Val Phe Thr Tyr Asp Gly Leu Asn Thr Asp
725 730 735
Ser Glu Lys Leu Asn Ser Phe Phe Ala Asp Arg Lys Ala Phe Ile Tyr
740 745 750
Gly Leu Asp Pro Ala Val Phe Asn Thr Ser Glu Tyr Asn Ile Phe Phe
755 760 765
Glu Tyr Glu Lys Ile Lys Asn Glu Lys Lys Lys Ile Tyr Gln Trp Asn
770 775 780
Gly Ser Tyr Leu Ser Leu Leu Arg Lys Val Leu Thr Met Ser Lys Gly
785 790 795 800
Asn Thr Glu Lys Leu Lys Asn Glu Ile Arg Lys Glu Ile Ile Asn Val
805 810 815
Ile Arg Leu Ile Asp Gly Lys Ser Ser Leu Ser His Cys Cys Ile Met
820 825 830
Asn Met Gln Gly Met Ile Lys Val Ile Asn Ser Trp Phe Ala Tyr Thr
835 840 845
Met Gly Glu Asn Ser Ser Thr Glu Asp Gln Lys Lys Glu Tyr Asp Ser
850 855 860
Glu Met Tyr Asn Leu Leu Leu Tyr Val Arg Lys Arg Arg Lys Asn Lys
865 870 875 880
Lys Thr Glu Lys Ile Asn Lys Met Ala Asn Ala Ile Ile Cys Thr Ala
885 890 895
Ile Glu Asn Asn Val Lys His Ile Ile Leu Glu Ala Leu Asp Lys Lys
900 905 910
Gly Asp Lys Gly Asn Ser Arg Gln Asn Asn Ala Ser Asn Met Asp Trp
915 920 925
Cys Ala Lys Gly Ile Ile Asp Lys Val Ile Thr Gly Cys Arg Phe Val
930 935 940
Asp Ile Asn Val Arg Lys Val Asn Pro Ala Tyr Thr Ser His Gln Asp
945 950 955 960
Pro Met Val His Asn Lys Asn Asn Pro Ala Met Lys Pro Arg Ile Ala
965 970 975
Lys Ile Asp Met Val Glu Lys Asn Asn Trp Ala Val Glu Lys Leu Val
980 985 990
Ser Ile Ser Ser Met Asp Pro Lys Glu Asn Ser Ala Glu Ile His Tyr
995 1000 1005
Phe Asn Phe Ile Asp Val Phe Cys Arg Gln Tyr Lys Ile Asp Arg Lys
1010 1015 1020
Asp Leu Asn Lys Ile Lys Lys Ile Ser Asp Leu Gln Asp Leu Met Ala
1025 1030 1035 1040
Glu Lys His Ser Phe Ile Tyr Val Pro Ser Arg Gly Gly Gln Tyr Tyr
1045 1050 1055
Leu Ser Thr His Arg Val Thr Ser Cys Asp Asp Asp Ile Gln Ile Leu
1060 1065 1070
Tyr Asp Gly Lys Asn Val Trp Leu Ala Asn Ser Asp His Ile Ala Ala
1075 1080 1085
Ala Asn Ile Val Leu Arg Gly Leu Asp Tyr Ser Pro Ser Pro Lys Lys
1090 1095 1100
Lys Asn Lys Thr Asp Leu Asp Leu Ala Ala Val Gly Gly
1105 1110 1115
<210> 6
<211> 3267
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(3267)
<223> CasY1的编码DNA序列
<400> 6
atgaacaaaa tgaaaaagac gaaaaagttg gatgtcagga agtcttactc tggccggctg 60
aatccaaatg acaggaagag agagcacctg cagcggtctc tgagggccct caggaagggc 120
tctgagttct tcttcgatct ggtgcaggca tggtgcggcg ggctgacccc cgaaatgctg 180
gaggagaacg ccaaagctga tgacctgatc gacctctggt gtgctatcta ttggtttagg 240
cctgtctcca ccactgtagc cacgcatcca atcaatcaaa acgatcttgt tgcaacgttt 300
gagaattatt acggggggaa agccagttca ctggttaatg aatacctcac cgcccctatt 360
ggggaagaat ttctgtggaa cgactgccgc caaaaatacg aacacttttg tcgcgatttc 420
ggggccgatt ttactaacga tctgagaacc ctcctgcgca ataacctgat cgcagtggcc 480
tccaacaagt ctgaactcga gacatccaca atttctagcc ttttcggcac cggcgtcaaa 540
gcctctcgca gcgtgaaggt ggaggtgctg gagaagatcc tgaacgcggt acagaacttg 600
gagaagattc cagatgattg tcggtctatc cagaagatca ttcttgaatc agcccaggcc 660
aacgacctga atgagttcaa gattgtgtat tcaggcggga acaagagcaa caaggatgga 720
acaaccaaga aggggaatgg ccgcccaagt ttcttggagg agtttctcaa attgaatggt 780
gacgagaagc tgactccctc taagttcaag gagttttttg agaagctgat agaagagatc 840
aaaaagaaga aacaggacat gtcttgggac cacgcccagc gacttagaga gtatatcgag 900
aacaacacag caaccaagta cgatgcatgg gcctgggaag agatgctgaa gtcaggccag 960
actcctctga agtccaaagc tacgagaaat tacagtttca caaaagagag ggccgagcag 1020
tttgtcgaga tccagaagaa tcaagacctg gagattgtga acgacttgaa cggatttttt 1080
gagagcgaat tctttaacgg tgagtataag ttcgttattt gccaatttca catcggcaat 1140
gacgatctcg aaaagctgtt caagttctgg aacgagaccg acgctgatgt ctggaacgag 1200
gacaccgaac tgatcttgaa tgatttctgc gacgatctca agaattcttt taatcggact 1260
cctatcaaga atgtcctgaa atatctgttc cagttcagga agaagtacac cgccaagcaa 1320
cttgtgaatg ccgcgaagta taacgagcag tttgataaat ataagaatcg caaggtgcat 1380
ccctccgtgc tgggcaatca gggctttacc tggcctaatg cgctgatccc ccctgataag 1440
gcccagagat ctgatagaga aaatagcctg gacctgcgga tctggctgta cattaaactg 1500
ctgcatgagg atggaacttg gaagaaacat catgtgtgtt tccacaactc tcgcttcttt 1560
tctgaggtat acgcagcggg gagtaacgag atcgagcccg tgaagtttcg caccccacgc 1620
ttcggcacca ctctccccaa acttaccgca cagactccaa tccgggtcgc caagaagtac 1680
gttaagatcg ccaagcggga ggcgaaagtg agactggccg ctcaacaggg gctgttgcct 1740
aaaattagca tacctctcaa cgaactgagt gctgtaataa acgactcact tggcgtgacc 1800
attcccgtga agttcaaggt tgaccagcct tcaagaatcc caaagctgaa cgacataatc 1860
ttgggttacg accagaatca gactgccagt cacgcatact ccctgtggca agttgtagag 1920
gagaacacac ccgatagttt ttactacgag ggaaaggggt gggaatgcca tgtgaaattt 1980
ttgcgctcag gagatgttac cagccttaca aaaactaaga aagatgatgt gatcgaccag 2040
ctgtcatatg agggactcga ctacaaaaat tatgctgact ggaaacggac cgccaagagg 2100
ttcgccgaca actggactat ctcaaaaggt aaggagatta cccccgccgt agaccgcttc 2160
gaaagcattg agaggtggca gccccgcttg tatcggttca acaaagatta cgcatatatt 2220
cttcgcgaca ttgtccgcgg taagtccctt gctgagttgc agcaaatcag acccgagatt 2280
tttcgcttta tcacacaggg gttcggcgta tgcagacttg gcagtctttc actggatgca 2340
ctggaagccg tgaaggctgc taagggcgtc gtctacagtt acttttccac tgccctgaat 2400
gggagtaaag aaaatcctat aagtgatgag cagagaaaag agttcgatcc cgaactgttt 2460
aagttgctcg agaaactgga gtttatccgc accaagaaga agcaacagaa agtcgaccgg 2520
atcggtaatt ccgttctttc catagcactt gagaatcaag cgaagttcat ccgcggtgag 2580
gagagcctgc ctaccacaaa taagagtacc aaaaaaaaac agaacggtcg cagcatggat 2640
tggctggcac gcggagtggc taataagatc agacagttgg cagaaatgca cgagattgga 2700
ctgctgaatg tcgatccaag atttaccagc caccaggatc ctctcgtgca taacaatccc 2760
aataaggcta tgaagtgcag gtacacagct gcacccataa gcgaaattgg cgacaacgtg 2820
cttgccaagt tgtccgccaa cctgaaaaat aaaaacagag gtacaaccgg agagtattat 2880
caccaaggaa tgaaggaatt tcttgagcat tatgggcttc agaatattga gaacgacttg 2940
ctcaagtggc gcaagaagcg accaactatc cagtgctggg agctgcagaa gattctggcg 3000
gagaaattcg ggaacgaaga gactgtgatc tatttccctg ctaagggggg ccggaagtat 3060
tttgccaccc ataaagttgc gagtgatgcc gtgagcatga tgttcaacgg aaaaaacgtg 3120
tggctctgca atagcgacca cgtggcagct gccaatatcg cactgtcaga gctcaacaag 3180
attagcttgc ccagactgtg gacaaagtcc gagcaaccag atgagccttc cgatgacgaa 3240
aaaacggacg ctacccctcg aaactcc 3267
<210> 7
<211> 3336
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(3336)
<223> CasY2的编码DNA序列
<400> 7
atggaagctg gtaaagtagg taaaaaggga aagacaaata aaaagtttat cattagaccc 60
tacctgaccg agctgaattt gcgagaagac ggccgccttg ccttccagaa gactttcgat 120
tatatggatg aacagcaggc cgctctgttt attttgggag gttccgtgat gtctcatctg 180
gacgagtcca ttatcaggag gcttggactg cacaagggat caaaaaaaga tctccctcag 240
agactccgcg tctcactgca cctggctatc gctaggtttc ggctggtgtc tgttaattat 300
cacctggatg ccaaggccat atctcggatg tctcctacag ccaggctcgc gcacgagcag 360
ctcgctgagg cccacagggc aagcctgatc aagagcccca tctctgtatg gaggaacaga 420
cacggggtac ccgatgaggc tgtgcacgcc tacctggacg gaaattatga cccagagaca 480
tacgcctggc aggataccgc catgctcgca aagaagctgt gtggtatcct caaactgtct 540
ccagaagatt tcaaggaggc ctctgaagca atgatgagaa atgtcaattt tttgggctgc 600
tccggatcta ccggctcagg gagctctgtc agcaacctct ttggccagaa tgagaaagaa 660
gatagccgca accaagctcg catcgaaagt aagactgcca aagtgattgg caagctgctg 720
gagagccgcc gcccgatacc gatggagcga gccgtgtccc tggtatgcaa atctcttgga 780
caccccgatg ctgaagccgc cggggaggat catggtggcc agactgacaa gagcacattt 840
cgacagttta tgaggggaga ctacggagga agccttaagg agcttgcaaa aaagttgcag 900
aaagatgcac acaagcatcg gaataaaagc atcattccac acagagagac tataggtgca 960
ttcataaagc agtgcgcctc cggggagttc tacaacaagg caacttcaga gagctggaag 1020
gacttcaacg ccatgatgaa cgggaagtac aaacacaata taatattcgt cacagagaaa 1080
atcgcgctgg gcaatgcaat gaggaaactt gagagtaacg agaaggcagt gaaagcatct 1140
aagcagttgg agaagctgat cgacaaatac gaaatggatg ggaataagcg cttcgtgccc 1200
aaggtagctt ctgtcaacgg actcgaggct tatcgggatg ttattcaaga taacccgcaa 1260
gaggatgacg agagcgtgaa ggattggctc aagcggctgt ggaccacttt ttcagagggg 1320
aacgaccgaa gactgaagac ccctttcaga tggttggtcg aatcacttgc ccgcctggag 1380
accccggagt ccgccatcaa agacgggtgc cggcttatgt ctattaggca taaacacgag 1440
agtcagagac cccatccctt cgtgcgcgtg cagtctaggt ttactgtggg cgatagcaac 1500
attgctggtt ctatcaacaa acccacggag ttgaagccta atcgcgacgg acgatcccct 1560
gaggattact gggggggcaa ccccgtcgtg tggatgtcat gccgcctcct gaacgggaac 1620
agatggcagg atatgcgcat ccctatccac aactctcgct atattaacga agtttactac 1680
actcggatgg ggccggatgg aaatcatgca ctgcccctca aagaacacgc cagagacgtg 1740
aaacatgatt atgaggccga gactaagatc agtaggacgg ccgcgagaag ggtaaacgaa 1800
aaccgcatgc ttcgccgcgg taaaccaagc aagcggttcg agagagtaaa agcgaactcc 1860
acccacaacg tggtgttcga tcccaagaca accgccagtt ttaaccggcg gcaggacgac 1920
atctacggca ctatcaatca caggcaccca atggtgcctc ttgctcctga cggcttcttc 1980
gctgtgggag ggaatgtgat aggtattgat ctgggtgagt cagtcccact ggcagccggc 2040
atcctgcaga agtgcacttc tacagattca gaagcagttc gctacgcatg tgggcattgg 2100
aaggtggtcg ggatggggaa accgggccag ctgctcgaca gacagacaag cgccaaccga 2160
cgcaagcaac cacacacgat cattgaccca atgagtaata tgggagagcc ctttagctcc 2220
ccgatctgcc agaagtttat cgccaaatgt cgaaaatttg tccgggcaaa aggctcagaa 2280
gaggacaaca aggccttcga cgacatggtg aagcgcgagc cttcactgta cagctttcac 2340
ggcagatggg gctggctcct taaacagatg atgaaggccg ccaaaggcgc caggctggac 2400
ccttttagag agcatttgga gtggctcctt ttccggacta aatacggccc aaccaacaga 2460
aaaagcctta acctcaatag tatggcgtct acaaagaacg tcatttcagc cattgactca 2520
tatatgagcc ggagaggttg gaaaaccgtg gagcagaggc agagacgcga cggaagactg 2580
caggcagcta gatcaagcct tcaaagcaac ttggtgaacc ggcgcctgga gcgaatcaaa 2640
aaagaggagt cccagtgtat tagattggcc cacctttttg ccgttaccac ccacttggta 2700
ctggaggata accttccgaa gcaaaatgga gctagctccc gagccgacaa cgggcgaaag 2760
gcagactgga gaagtcgaca cctggcccag cgattgtgcg gaatcaaaaa tgactccgga 2820
tcttgtgcga ttgccggagt cagagcccgc aggatcgatc ctgtgatgac tagccacatg 2880
gatccttttg tgtattcttt ggataataag tgggctatgc gcgccaggta caccaaggtg 2940
agcttgtcta gtatgaccga ttaccatgcc aacctcatta ggagcatact gctcgagaaa 3000
ccaggcaaga gacagacgac tgaatattat cagcgcgctg tacaggactt tgcccgcctg 3060
catggactgg atgttgatga gatgaggaaa gtccgcgagg ctcggtggta taaaaaacgc 3120
attaaggcta agacgctgta catcccatgc aggggcggac gcgtctttct gtccactcac 3180
aggctgcagt ctgacactcc ccataccgat tccagcgggg ctgtcctttg ggagcaggac 3240
gcagatcagg tggctgcact gaatgtagct ctcaggtata ttgaccagtg ctaccggagt 3300
aataagaaag ggcttgccaa agtgaagaag cctaag 3336
<210> 8
<211> 3153
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(3153)
<223> CasY3的编码DNA序列
<400> 8
atgagtgaga tcaccgccat taaaacctat aatagcaatc tgttcgccaa tagcgagaag 60
aatatcaaat acctgcgcga caccggagtt gcgctcaaga acaccacaaa tgtgttccgc 120
gggctgttgg tggcctttta tggaggaatc acccctgaga ttgccagaga gaacataaag 180
attattaaaa aggaaaagag cctcgacatg gacctgatat atgcgatcaa tcgattcaga 240
cccgtgcggt caaattctga ccttgcaaag taccagatcc cccagcccgt gatgcggggc 300
aagtttgaga gcgttgttgg ccacgaggcc tcagagctgg cggccgagtt ccttaattcc 360
cctatcggag aggactatgt gtggattgat gggttgagag cctatgagga cctcaaatcc 420
caaatcggcg atttcgacta tgacttgaag gtgatggtga gagaaaatat attgccaata 480
tacaacttcc caaacatcga ggcatcagca agcatatcac gaatatttgg caatggcaag 540
aaggaagacc gcgaattcaa agtgggcgtt gtgaagaaaa tcaaggagtt gatcctgaac 600
agcgacctgg gagacgacta ctctgtcctc cagcagataa ttttgagcgc ggccggcgct 660
aaagacatga aggaatttag taaaacgtat gtgggaaagg ctgccggtcg ccgcggcaag 720
atccagaata tcttgctgga gaactcaaac aaaaagcttg gcgccaacac aatccagtca 780
gtcctggaaa agtgtgatga gatcgtctgc gaaaaaagta gcaagctgat ctggaaaaat 840
aaccagggcc tgctcaaata tattgagatt cagagtgacc tgagttacga tcccaaggct 900
tattcagaat gtttcaaagc cgcactggcc gaaatccagc caaagaatac ggtgaactac 960
aatttcgcgg tgaaaaggtt gcagaacaag aaggaccttg agtccaacgt gcaagcaatg 1020
cagaattccg caatgctgaa taactatttt gattcacact acttccaggg ctccaataac 1080
ttcgtcatct gtccttatca cttggggggc gagaacctct cccaactgtt taagatatat 1140
aagaacattg gggattccac agaagcagta aaagagtatt gtagcgagct tagggggagc 1200
gtgaaagacc ctattccgag tctgtgcgag tacgtcctga cactccgcga tctgtcctgc 1260
aaacagatta taggggccgc atcttacaac cagctcatcc agagatataa ggaccataaa 1320
gtgcacccaa caaaagatgg caacaacaat tatacatttt caaccggctc cgctatgtac 1380
ggctgcctga tacctcccaa caaggctaag aaaaccgatc gaccagggtc tcccgacagc 1440
aggatctgga tgatcctccg ggtgctgaac ggcaagaagt gggaggatca tcattactat 1500
atccacaatg tgcgcttcct ggaggaggtc tatgcgcata atcctgagtt caagggggac 1560
ccggttgcca tccgcggggg gaggtttggc ggtatcggaa agaagatctg cgaatctagc 1620
cttcagagcc tgagggaaaa cccccagaag tatagaaaaa ctaaaaagcg cctcctgcgg 1680
ctccaggagt ctatcaagaa taactccctg cccaacatca actggaatga aaagattgca 1740
tccattggcg tcagatttga tcacaataat ttcaaggcta ccatcaattt caaaattaag 1800
gtcaatcaca aaaaattcga gggcctcaaa gtcggcgaca aaattatgtc ttatgatcag 1860
aaccaaactc agagccacgc ctatgcagtg atgaatgtat gcaatagttt cgattcaggc 1920
gccattcctt tccgcggcca ctacgtgcag gtgaatgaaa caggaaagat tcgatccaac 1980
attcaagtgg gacagaataa ttatgatccc cttagctaca gcggtctgtc ctttgagaaa 2040
tatgagaact ggcgcaacca gaggaaaaac ttcgtgagta aatataggtt cattatcggg 2100
aagaataatg agaattgcga tatgctcgag gagctggaaa aaattgagtc ccgcaaaccg 2160
tccctgtatg agtacaatta caagtactct gctatccttc gaaagatcgt caggggcacc 2220
agcggggtta aactggacga atgccgaaag gaaattatca gttttttggc aaaggagcag 2280
gccagcattc gcaatgtcag ctccctcaat catcattcct tcagtgcatt tagaagtgcc 2340
aaaagtctca tttcagccta ctttgctgcc tcaaccggtc tcaacatcag cacggacgaa 2400
cagaagcaag acaacgatcc cgaaattttt gaaatacgga aggacctcga gcgcagccgg 2460
aaaaataagt gtagggagaa gattaataag atttctaata ctatagtaac tatcgctaat 2520
atggagggat gtaatattat ctgcggcgag tttggcctta gttccactgg gagcaagaac 2580
aacaccaaga agcaaaacaa caaaaacatg gattggctcg cgcgaggcgt tgagaaaaag 2640
atcaaagaaa tgtgcttgct gcataatatc catttcaagg atgccccccc acattatacc 2700
agtcaccagg atccttttgt ttataataac acgcttctca aggtggagag cgtcgatcac 2760
atgaaagcaa ggttcgctta cctgagcgtg gatgatgtgg aggaatggca tttgaaaaag 2820
cttagcagtt acctgaagaa caacaagaac gggactgcct actattataa tagtgcaacc 2880
aaacagtttc tggaccacta cggcctggtt gagcatgagg aaaagatcac taaaaataag 2940
ctgtccctgt ctaagttcaa ggatatcctc atcaaaaact ttgggaatgt taatatcgtc 3000
atgccacttc ggggaggcag atattacctt gcctctaaga acgtggtgac cggcgccgtt 3060
cctttctcct tcggaggatc ttgctatctg tcagatgctg acgaagtggc agctataaat 3120
gtgggtttga caatcttccc acagcagaac tcc 3153
<210> 9
<211> 2706
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(2706)
<223> CasY4的编码DNA序列
<400> 9
atgctgatgc tgggagacat agtaccatat gacagcgtcg gggagattga cggttggggg 60
gctgtctccc ggactttcgg taaggacaaa aaagcagaca tagccgtcca gaaaaagttc 120
tgtgatgaag tcctcagcaa aatcaacgag gagaactgca aaacgttcga ggattacaag 180
aagattattt ttgaaatttt caacgcctcc acaattaaag agctgaaaaa cacttggaac 240
agtggtgccg gcgtgaggtc agcaaaagtg atcgacaatt tgggaaaaga cactgatccc 300
gagttcacat tcgaaaagga gcggaaaaat tgggagagtg tccaggagga gaagagcttc 360
attccaaatc gccctaacta ttgggccatc atacattaca tggagggaaa aatcggagac 420
gaggtggaca atagctcttg ggctgtaatg taccaaaacg ccatcattga tatttgttct 480
aaaatcaccc gaaaccacaa tttttcctac gagcagacag aacggaagaa agagctgagc 540
aaatgtgaca caagcgctct ggagctggta aatggctatt ttaaaagcac gtacttcaag 600
tctggcaatg aatttattat cgaaaaccgc cacgtgccaa atatcgggag actgatcgag 660
ctgtacagcg agctgactgt cgttaacgac gacaacatta atgaaatcat cgagatagtg 720
gacagtgaaa ctaaggtcaa tgaaaatact actggcgata atcagttgaa aaaatacatc 780
ctctccatca gcggctttgc aacggtgcat cagatcgaac aggcaatgaa atataacaag 840
atcaaagatg atattgaaca gaccaaagcc catccctttg ttagcggcaa cgcaagcttt 900
actgtcggaa actcagctct gaagggtagc atcgcatctc agaattcaaa gcacaaggga 960
aaaattgccg ggcagtccgc aaagatatgg ctctatattc acctgtatca caaggatatt 1020
aaagagtgga gggagcacca catacccttt tatcacgcca agttcttcga agaggtatat 1080
tatttcgacc ctgcactgac agagacagtc aaaatcagga ataaaaagat gaagacaaat 1140
attactaagg aaaacatcgt tagggatggc attgaccctc gatttgcaga aaaaaacatc 1200
cgcactgcag ccgtaagaca gaattgtaga gctaatgtgg ctatgattcc ttcttctctt 1260
gagctgacca agaaaaacgg cgaattcacc atcaccatca gccagagatt tcctaaaggg 1320
ctcaagcgaa agaagagtga cattagactg aatgatattg tgatggccta cgatcaaaat 1380
cagacaaggc caaatacata tagcatactc agagtgacaa gtaccaccaa ggacaaggac 1440
ggcaggtatc cttgtgaatt cattaagggg ggcgacatcc gatcatttat caacacaaag 1500
ataggcgaca tcgatgtgat taattacgat ggggttgaca atacgaccac atttttcgtg 1560
gacttcgtgc ggggacgcac tgagtttatc cacagcgtgt gcaacctgga cgcctttaag 1620
aagaccaacg acaacaacct taaatatgat tttaactgcc tgggcgagct ggctcgcaca 1680
aatagagaac agacaaaact ctaccggtgg cagaattggt atctgcgctt gttgttgacg 1740
atgatgaagc tgagcaaggg ctcaattcca gggttgagat ctgaaattat ttacgtagtg 1800
cggttcatgg acgagaaatc cagcctgagc cagatctgca tcgagaacat tcgatcaatg 1860
aagaaaatta taaacagctg gttcagctac gagatgaaaa accaggacgc tactaatgaa 1920
gaaaaagaac ttcacgacaa agagatgtat gccctgttga aacggataga acagaggcgc 1980
tccaataaga acaaagagcg aattaggaaa atcgcctctg ccatcgtcgc cattgctcag 2040
caagaggggg caaacattat tgtgggcgag aaagagctgg acaccaaaaa aaaaggaaag 2100
aataaggctt caaataacag ggccatggac tggtgccccg gtcaggttag cgaaaaggtg 2160
aaacacgggg tagacctgct ggatatcagc ttttttacaa tgcctgcttt ctacacttcc 2220
caccaggatc cttttgtgta tagcgactct aatcgagaga tgcggccgag gatggatgag 2280
atcaaccccg aggccccgaa tgccgaacgc aagattaagt ccttcgtcac actggccaaa 2340
atgaaaccaa agaaggaaac catgacacag tactattctg acggggtgga ccggttctgc 2400
gtccataaca acattaccag ggcagaactg aagaagatca agacacgcaa tgactggatt 2460
gccagactgg gctccgaaaa atgcctggtt cctgtgaggg ggggaagata ctacctgagc 2520
gctaaagtag ctgcaagtgg agccacacag atcgtgtacg caggtgaaac cagatatctt 2580
tcatctgccg atcatatcgc cgccactaac attggactgt cctttctcgt cccttatgac 2640
cctgagaaac agaagaaaaa gaaggggaaa aaccagacag ccgtggataa gacgtcaaca 2700
gttgcc 2706
<210> 10
<211> 3351
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(3351)
<223> CasY5的编码DNA序列
<400> 10
atggcctctg acgttacgtc ttacatgacc tacagggcca acctggtgcc tgatgcaaga 60
aaaaagaaat tgcttaatga cacttacgcg ttttacagga aaggcgagga gctgttcttc 120
gatgccttct ttgatatcct gggtggggtg agtccacagc tgatcaatac cctggtcaat 180
gacgggacaa tcaaagccga gaatgatgcc accgacgagg aaaagaacga tataaccgag 240
gaggacaaaa acaacacttc taaaaagaag ctcgatccaa agctcctgtg cgccattctg 300
tggttcagac tcgtgaagaa ggagaagaat acctgtgaaa tccttaatgt gaagctgttg 360
aaagagaagt tctctgctta ttatggggct gaggcaaatg acacagtaat ctcatatttc 420
agtgcaaatt acgacgtgga aaactacatg tgggtagatt gcagagtgcg gtgtctttca 480
ttctgcaaca agctggggac cagtcttgat gtgctggcca tcgatctgga gtctatgttg 540
cgggccaaaa acattgcttt cttcggaggc gttggcaagg ctgataaagc gattagcaac 600
atctttatcc ggtctgaaaa gcggggcaaa tcaaatgtga aaaaactgca tgagtacgcc 660
gtgaacacca tcgacatcct cgaaaagacc gaagtcatta acagcgacca gtacttggac 720
gtcttgctca gggtgtttgg cgccgccaac atcgacgagc tgcagaacat ctgcaaaaag 780
gaaaacgggg gttccaaact cgtcaagcca atcggccagt ttctgaacag taagttcgtc 840
tttgatccaa agaaggttaa gaagagttgg gtggatcttg ccaaagagaa gagctatgcc 900
cccaattacc cttcctgcga taaactcaaa atctacatcg agaacaagct gggcaagctc 960
ggtcagttga ctaaaccaaa aaacaaagtt tctgacgacg acgagcaagg atccaataag 1020
gggctctggt catcaatgtt tcggaacgca ataacctcta tctgtgctgc cgtgacacat 1080
aattactcat tctctatcgg tcagaccgat aggcaggaaa agttgagcat acttaggaaa 1140
agtaatgggt ctatcgccaa tgagatcaat gagaattttc cgcagaaaga tcagtacaca 1200
atcatgcctt atcacgtgcc agatttgaag aatactatcc ggctgtataa tggcttgaat 1260
cagaagacag atgaggagat cgctggcatc ctgaacacca tcaacaataa tgagaaggct 1320
aaaagaaaaa aacatggcga tgttagagcc caggcgtaca ttttgagctt gtacacctca 1380
aactccacca agtatacaga gaaatctatc acggacgcgc tgaagatcaa caagatcgag 1440
gacaccatca aaaatcaaaa ggtccatcct tttgtgctgg gtaacgcagg catgagattt 1500
ggtggagacg acaattgcgt gggaaggatt gagagaccca gtgtgtttgt gaaggagctt 1560
ggttgctatg caggcgagag tgataaaatg tggattacca tcaaggtcat cgacgaagga 1620
cgatggaaaa cccaccatat cccattcttt caggctaagt actatgaaga actctatgct 1680
tttgacccag accctgaaaa aaaggagact gtgaacatca gaatgaataa gacaaataca 1740
ttggctaaga agggtaatac gtctaacgca ggcatgttca atgagtcctt ttatgaaggc 1800
aacgacgaag aaaccaaaat gaagagaaaa aagtatagac agaaaagagt gaggaataag 1860
gtcgcgctgg aaaatttgaa atataacgtc gactttgtgg atcctacgtt cgttctgttc 1920
aaaaatagtg agggattcgg aattaatatc tcacagaata tccaagaccc aactgggctg 1980
aagggagaga ttaccaccgg ccagaatatc atggggattg accagaaccg ggataggtct 2040
aattcataca gtatctggcg cattacagga gaccaggcaa acggcatcta tcccgctgag 2100
ttcgtgaaat ctggcgatat ctccagcctg attaaaacaa ataaaaagga tgagaaaggt 2160
aacaagaaag agtacgacgt gttcacatac gacggcttga atacagactc tgaaaagctg 2220
aattcatttt ttgcagatcg gaaagctttc atctacgggc tggatcccgc cgtcttcaat 2280
acgtcagagt ataacatctt ctttgaatac gaaaagatca agaatgagaa gaaaaaaatc 2340
taccagtgga atgggtccta tctgtctttg ctgcgaaagg tgctcacgat gagtaaaggc 2400
aacactgaaa agctgaaaaa tgaaatcaga aaggagatca tcaatgtgat cagactgatc 2460
gatggaaaat cttcccttag ccactgctgt atcatgaaca tgcagggtat gataaaagtg 2520
atcaattcct ggttcgccta cacaatgggt gagaactctt ctacagaaga ccaaaaaaaa 2580
gaatacgaca gcgagatgta taatctcctc ctctacgtac gcaaaagacg caaaaacaaa 2640
aagactgaga agatcaataa gatggctaac gccattatct gtaccgctat tgagaacaat 2700
gtaaaacaca tcatcctgga agctctcgac aagaagggcg acaagggcaa ctcaagacag 2760
aataatgcct ccaacatgga ctggtgcgct aaaggcatta ttgacaaggt gatcaccggc 2820
tgtcgattcg tggatatcaa cgtgaggaag gtgaatccag cttacaccag tcatcaagat 2880
ccaatggtac ataataagaa caacccagct atgaagccgc gcattgctaa gatcgacatg 2940
gtggagaaga acaattgggc tgtcgagaag cttgtatcca ttagcagtat ggaccctaag 3000
gagaactctg cggagataca ttacttcaat ttcattgatg tgttttgcag gcagtataaa 3060
attgaccgaa aggatcttaa taagataaaa aagatctctg atcttcagga cctgatggca 3120
gaaaagcata gttttatata tgtccccagc aggggggggc agtactatct gagcacacac 3180
cgcgtgacca gctgtgacga tgacatccag attctgtacg acggaaagaa tgtgtggttg 3240
gcgaacagcg atcatattgc agccgctaac attgtcctgc ggggactgga ctactcacca 3300
agccccaaga aaaagaataa gaccgacctc gacttggccg ccgtcggagg g 3351
<210> 11
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(55)
<223> CasY1 crRNA-TTR
<400> 11
ttgcaacggc tgagaattgc gtcttccatt gacgcgcatc tccccattcc atgag 55
<210> 12
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(57)
<223> CasY2 crRNA-TTR
<400> 12
actcgactag atttagaatg cccacgatga ttgggcagca tctccccatt ccatgag 57
<210> 13
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(57)
<223> CasY3 crRNA-TTR
<400> 13
tttgcaatca ccaaaaattg tgtccttcgt tgacacagca tctccccatt ccatgag 57
<210> 14
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(56)
<223> CasY4 crRNA-TTR
<400> 14
ctcgaagagg gcgaagaact gtgactccta tgtcacgcat ctccccattc catgag 56
<210> 15
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(56)
<223> CasY5 crRNA-TTR
<400> 15
ctcgaagagg cgaagcatag tgaccgatgg cgtcacgcat ctccccattc catgag 56
<210> 16
<211> 4008
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(4008)
<223> pACYCDuet-1
<400> 16
ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60
gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120
ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180
taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240
gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300
tggcagatct caattggata tcggccggcc acgcgatcgc tgacgtcggt accctcgagt 360
ctggtaaaga aaccgctgct gcgaaatttg aacgccagca catggactcg tctactagcg 420
cagcttaatt aacctaggct gctgccaccg ctgagcaata actagcataa ccccttgggg 480
cctctaaacg ggtcttgagg ggttttttgc tgaaacctca ggcatttgag aagcacacgg 540
tcacactgct tccggtagtc aataaaccgg taaaccagca atagacataa gcggctattt 600
aacgaccctg ccctgaaccg acgaccgggt cgaatttgct ttcgaatttc tgccattcat 660
ccgcttatta tcacttattc aggcgtagca ccaggcgttt aagggcacca ataactgcct 720
taaaaaaatt acgccccgcc ctgccactca tcgcagtact gttgtaattc attaagcatt 780
ctgccgacat ggaagccatc acagacggca tgatgaacct gaatcgccag cggcatcagc 840
accttgtcgc cttgcgtata atatttgccc atagtgaaaa cgggggcgaa gaagttgtcc 900
atattggcca cgtttaaatc aaaactggtg aaactcaccc agggattggc tgagacgaaa 960
aacatattct caataaaccc tttagggaaa taggccaggt tttcaccgta acacgccaca 1020
tcttgcgaat atatgtgtag aaactgccgg aaatcgtcgt ggtattcact ccagagcgat 1080
gaaaacgttt cagtttgctc atggaaaacg gtgtaacaag ggtgaacact atcccatatc 1140
accagctcac cgtctttcat tgccatacgg aactccggat gagcattcat caggcgggca 1200
agaatgtgaa taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag 1260
gccgtaatat ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc 1320
tcaaaatgtt ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt 1380
ttctccattt tagcttcctt agctcctgaa aatctcgata actcaaaaaa tacgcccggt 1440
agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc aacgtctcat 1500
tttcgccaaa agttggccca gggcttcccg gtatcaacag ggacaccagg atttatttat 1560
tctgcgaagt gatcttccgt cacaggtatt tattcggcgc aaagtgcgtc gggtgatgct 1620
gccaacttac tgatttagtg tatgatggtg tttttgaggt gctccagtgg cttctgtttc 1680
tatcagctgt ccctcctgtt cagctactga cggggtggtg cgtaacggca aaagcaccgc 1740
cggacatcag cgctagcgga gtgtatactg gcttactatg ttggcactga tgagggtgtc 1800
agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc ggtgcgtcag cagaatatgt 1860
gatacaggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 1920
ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 1980
ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 2040
caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 2100
ataccaggcg tttcccctgg cggctccctc gtgcgctctc ctgttcctgc ctttcggttt 2160
accggtgtca ttccgctgtt atggccgcgt ttgtctcatt ccacgcctga cactcagttc 2220
cgggtaggca gttcgctcca agctggactg tatgcacgaa ccccccgttc agtccgaccg 2280
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gaaagacatg caaaagcacc 2340
actggcagca gccactggta attgatttag aggagttagt cttgaagtca tgcgccggtt 2400
aaggctaaac tgaaaggaca agttttggtg actgcgctcc tccaagccag ttacctcggt 2460
tcaaagagtt ggtagctcag agaaccttcg aaaaaccgcc ctgcaaggcg gttttttcgt 2520
tttcagagca agagattacg cgcagaccaa aacgatctca agaagatcat cttattaatc 2580
agataaaata tttctagatt tcagtgcaat ttatctcttc aaatgtagca cctgaagtca 2640
gccccatacg atataagttg taattctcat gttagtcatg ccccgcgccc accggaagga 2700
gctgactggg ttgaaggctc tcaagggcat cggtcgagat cccggtgcct aatgagtgag 2760
ctaacttaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 2820
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgcca 2880
gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc accgcctggc 2940
cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga aaatcctgtt 3000
tgatggtggt taacggcggg atataacatg agctgtcttc ggtatcgtcg tatcccacta 3060
ccgagatgtc cgcaccaacg cgcagcccgg actcggtaat ggcgcgcatt gcgcccagcg 3120
ccatctgatc gttggcaacc agcatcgcag tgggaacgat gccctcattc agcatttgca 3180
tggtttgttg aaaaccggac atggcactcc agtcgccttc ccgttccgct atcggctgaa 3240
tttgattgcg agtgagatat ttatgccagc cagccagacg cagacgcgcc gagacagaac 3300
ttaatgggcc cgctaacagc gcgatttgct ggtgacccaa tgcgaccaga tgctccacgc 3360
ccagtcgcgt accgtcttca tgggagaaaa taatactgtt gatgggtgtc tggtcagaga 3420
catcaagaaa taacgccgga acattagtgc aggcagcttc cacagcaatg gcatcctggt 3480
catccagcgg atagttaatg atcagcccac tgacgcgttg cgcgagaaga ttgtgcaccg 3540
ccgctttaca ggcttcgacg ccgcttcgtt ctaccatcga caccaccacg ctggcaccca 3600
gttgatcggc gcgagattta atcgccgcga caatttgcga cggcgcgtgc agggccagac 3660
tggaggtggc aacgccaatc agcaacgact gtttgcccgc cagttgttgt gccacgcggt 3720
tgggaatgta attcagctcc gccatcgccg cttccacttt ttcccgcgtt ttcgcagaaa 3780
cgtggctggc ctggttcacc acgcgggaaa cggtctgata agagacaccg gcatactctg 3840
cgacatcgta taacgttact ggtttcacat tcaccaccct gaattgactc tcttccgggc 3900
gctatcatgc cataccgcga aaggttttgc gccattcgat ggtgtccggg atctcgacgc 3960
tctcccttat gcgactcctg cattaggaaa ttaatacgac tcactata 4008
<210> 17
<211> 7354
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(7354)
<223> pACYCDuet1-CasY1-crRNA
<400> 17
ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60
gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120
ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180
taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240
gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300
tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatgaa taaaatgaaa 360
aaaacgaaaa agttggatgt tcgtaaatct tattctggtc gactgaaccc caatgaccgc 420
aagagagaac atctacagcg ctctcttaga gcgctcagaa agggttcgga attctttttt 480
gatctggttc aggcttggtg tggcggtctg acacctgaaa tgctagaaga aaatgcaaaa 540
gcagatgatc taattgattt gtggtgtgcc atctactggt tccgaccagt ttctacaaca 600
gttgctacac acccaatcaa tcaaaatgat ctcgttgcta cgtttgaaaa ttactacggc 660
ggaaaagcat ccagccttgt caatgaatat ttgaccgctc caattggaga agaattttta 720
tggaatgatt gtcgacagaa atatgaacac ttctgtcgag actttggagc tgattttacg 780
aatgatcttc gtactctctt aagaaacaat ttgattgccg tggcttctaa taaatcagag 840
ttagaaacat ctacaatttc aagtttgttt ggaactggag ttaaggcaag tcgatcagtc 900
aaagttgaag tcttagagaa aatcttgaat gctgtgcaaa atttggaaaa aattccagat 960
gattgcagat caattcaaaa aatcattttg gaatccgctc aagctaatga tttaaatgaa 1020
ttcaaaattg tttactctgg cggaaacaag agtaacaaag atggcaccac gaaaaaggga 1080
aatggtagac cttctttttt ggaagaattc ttgaaattaa atggtgatga aaaactcacc 1140
cccagtaaat tcaaggaatt ttttgaaaaa cttattgaag aaattaaaaa gaaaaaacaa 1200
gatatgtctt gggaccacgc ccaacgactt cgggaatata ttgaaaacaa tacagcaact 1260
aaatatgatg cttgggcatg ggaagaaatg ctgaaaagtg ggcaaacacc gctcaaaagc 1320
aaagcaacta gaaattatag tttcacaaag gaacgggcag agcaatttgt agaaattcaa 1380
aaaaatcagg atcttgaaat tgtcaatgat ctcaatggat tttttgaaag tgaatttttc 1440
aacggagaat ataaatttgt catctgccaa ttccatattg ggaatgatga tcttgagaaa 1500
ttgttcaaat tctggaatga aaccgacgca gacgtatgga atgaagatac tgaattaatc 1560
ctgaatgatt tttgtgatga tttgaaaaat agtttcaatc gcacgccaat caaaaatgtg 1620
ctgaaatatc tctttcaatt ccgtaaaaag tatacggcta aacaacttgt caatgccgcc 1680
aaatataacg aacaatttga caaatataaa aatcgaaaag ttcatccgtc tgttcttggc 1740
aatcaaggat ttacctggcc aaatgcttta atcccgcccg ataaagctca acgttctgat 1800
cgagaaaatt ctctcgattt gagaatttgg ctgtatatca aattgctcca tgaagatggg 1860
acatggaaaa aacaccatgt ttgttttcat aattcacgct tcttttcaga agtctatgcc 1920
gcaggctcaa atgaaattga acctgtgaaa ttccgcacgc cacgctttgg aacgacattg 1980
ccgaaactca cggcacaaac tccaatccgt gtggcgaaaa aatatgttaa aatcgcaaag 2040
cgtgaagcga aagttcgact cgccgctcaa caaggattgc tccctaagat cagcattccg 2100
ttgaatgaat tgtcggctgt aattaatgat tcgctgggag ttacaatccc tgtgaaattt 2160
aaagtcgatc aaccatcaag aattccgaaa ctaaatgata ttattcttgg gtatgaccaa 2220
aaccaaaccg caagtcatgc ttatagccta tggcaagttg ttgaagaaaa cacgccagat 2280
tcattctatt atgaaggaaa aggctgggaa tgccatgtga aattcctccg ctcaggagat 2340
gtcacgtccc tgactaaaac aaaaaaagat gatgtaattg accaactctc atacgaaggt 2400
cttgattata agaactatgc cgattggaaa agaactgcta agagatttgc tgacaattgg 2460
acaatctcta aaggaaaaga aattactccc gctgtagata gatttgaatc aattgaaaga 2520
tggcaaccac gactctatcg cttcaataag gattatgcat atatcctccg agatattgtt 2580
cgtggaaaat ctcttgctga attacagcaa attcgaccgg aaatctttcg gtttattaca 2640
caaggttttg gagtctgtcg acttggatct ctctcgcttg atgccctcga agctgtaaag 2700
gccgctaagg gagttgttta tagctatttc tcaactgccc taaatggcag caaagaaaat 2760
ccgatctcgg atgaacaacg taaagagttt gatcctgaat tgttcaaact tttggaaaaa 2820
ttggaattca ttcggacaaa aaagaaacaa caaaaagttg accgaatcgg aaactctgtt 2880
ttgagtatcg ctttggaaaa tcaagcgaaa ttcatccgtg gtgaagaaag tttgcccacg 2940
actaataagt caacaaagaa aaaacaaaat ggacgaagca tggattggtt ggcacgaggc 3000
gttgcgaaca aaattcgaca actggcagaa atgcacgaaa ttggtttgct aaatgtcgat 3060
ccacgattca ctagccacca agacccattg gtacacaaca acccaaataa agcaatgaaa 3120
tgccgatata ctgctgctcc gatttctgaa atcggagata atgtactggc aaaactctcg 3180
gctaatttga aaaataaaaa tcgtggaaca actggagaat attaccatca aggaatgaaa 3240
gaattcctgg aacactatgg actccaaaat atcgaaaatg atctcctgaa atggagaaaa 3300
aaacgaccaa caattcaatg ctgggaattg caaaaaattc ttgctgaaaa atttggcaat 3360
gaagaaactg taatctactt cccggcaaaa ggaggacgta aatatttcgc aacacataaa 3420
gtagcgtcag atgctgtatc catgatgttc aatgggaaaa atgtctggtt gtgcaactct 3480
gatcatgtgg cggcagcaaa cattgctctc tctgaattga ataaaatctc gttgccgaga 3540
ttgtggacta aaagtgaaca gccagacgaa ccctccgatg acgaaaaaac tgatgcgact 3600
cctcgcaatt cggtaccctc gagtctggta aagaaaccgc tgctgcgaaa tttgaacgcc 3660
agcacatgga ctcgtctact agcgcagctt aattaaccta ggctgctgcc acctaatacg 3720
actcactata gggaattgca acggctgaga attgcgtctt ccattgacgc gcatctcccc 3780
attccatgag tttttgctga gcaataacta gcataacccc ttggggcctc taaacgggtc 3840
ttgaggggtt ttttgctgaa acctcaggca tttgagaagc acacggtcac actgcttccg 3900
gtagtcaata aaccggtaaa ccagcaatag acataagcgg ctatttaacg accctgccct 3960
gaaccgacga ccgggtcgaa tttgctttcg aatttctgcc attcatccgc ttattatcac 4020
ttattcaggc gtagcaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc 4080
cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 4140
gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 4200
cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 4260
taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 4320
aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 4380
gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 4440
ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 4500
tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 4560
ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 4620
ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 4680
acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccattttagc 4740
ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc 4800
attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt 4860
ggcccagggc ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc 4920
ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca acttactgat 4980
ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc agctgtccct 5040
cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga catcagcgct 5100
agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg aagtgcttca 5160
tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata caggatatat 5220
tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg 5280
gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa cagggaagtg 5340
agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag catcacgaaa 5400
tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac caggcgtttc 5460
ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 5520
gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 5580
gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 5640
gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg gcagcagcca 5700
ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 5760
aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa agagttggta 5820
gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 5880
attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 5940
tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 6000
aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg actgggttga 6060
aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa cttacattaa 6120
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 6180
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt ggtttttctt 6240
ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg agagagttgc 6300
agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat ggtggttaac 6360
ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga gatgtccgca 6420
ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg 6480
gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt ttgttgaaaa 6540
ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg attgcgagtg 6600
agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa tgggcccgct 6660
aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag tcgcgtaccg 6720
tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc aagaaataac 6780
gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc cagcggatag 6840
ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc tttacaggct 6900
tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg atcggcgcga 6960
gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg 7020
ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg aatgtaattc 7080
agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg gctggcctgg 7140
ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac atcgtataac 7200
gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta tcatgccata 7260
ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc ccttatgcga 7320
ctcctgcatt aggaaattaa tacgactcac tata 7354
<210> 18
<211> 7425
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(7425)
<223> pACYCDuet1-CasY2-crRNA
<400> 18
ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60
gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120
ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180
taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240
gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300
tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatgga agctggtaaa 360
gtaggtaaaa agggaaagac aaataaaaag tttatcatta gaccctacct gaccgagctg 420
aatttgcgag aagacggccg ccttgccttc cagaagactt tcgattatat ggatgaacag 480
caggccgctc tgtttatttt gggaggttcc gtgatgtctc atctggacga gtccattatc 540
aggaggcttg gactgcacaa gggatcaaaa aaagatctcc ctcagagact ccgcgtctca 600
ctgcacctgg ctatcgctag gtttcggctg gtgtctgtta attatcacct ggatgccaag 660
gccatatctc ggatgtctcc tacagccagg ctcgcgcacg agcagctcgc tgaggcccac 720
agggcaagcc tgatcaagag ccccatctct gtatggagga acagacacgg ggtacccgat 780
gaggctgtgc acgcctacct ggacggaaat tatgacccag agacatacgc ctggcaggat 840
accgccatgc tcgcaaagaa gctgtgtggt atcctcaaac tgtctccaga agatttcaag 900
gaggcctctg aagcaatgat gagaaatgtc aattttttgg gctgctccgg atctaccggc 960
tcagggagct ctgtcagcaa cctctttggc cagaatgaga aagaagatag ccgcaaccaa 1020
gctcgcatcg aaagtaagac tgccaaagtg attggcaagc tgctggagag ccgccgcccg 1080
ataccgatgg agcgagccgt gtccctggta tgcaaatctc ttggacaccc cgatgctgaa 1140
gccgccgggg aggatcatgg tggccagact gacaagagca catttcgaca gtttatgagg 1200
ggagactacg gaggaagcct taaggagctt gcaaaaaagt tgcagaaaga tgcacacaag 1260
catcggaata aaagcatcat tccacacaga gagactatag gtgcattcat aaagcagtgc 1320
gcctccgggg agttctacaa caaggcaact tcagagagct ggaaggactt caacgccatg 1380
atgaacggga agtacaaaca caatataata ttcgtcacag agaaaatcgc gctgggcaat 1440
gcaatgagga aacttgagag taacgagaag gcagtgaaag catctaagca gttggagaag 1500
ctgatcgaca aatacgaaat ggatgggaat aagcgcttcg tgcccaaggt agcttctgtc 1560
aacggactcg aggcttatcg ggatgttatt caagataacc cgcaagagga tgacgagagc 1620
gtgaaggatt ggctcaagcg gctgtggacc actttttcag aggggaacga ccgaagactg 1680
aagacccctt tcagatggtt ggtcgaatca cttgcccgcc tggagacccc ggagtccgcc 1740
atcaaagacg ggtgccggct tatgtctatt aggcataaac acgagagtca gagaccccat 1800
cccttcgtgc gcgtgcagtc taggtttact gtgggcgata gcaacattgc tggttctatc 1860
aacaaaccca cggagttgaa gcctaatcgc gacggacgat cccctgagga ttactggggg 1920
ggcaaccccg tcgtgtggat gtcatgccgc ctcctgaacg ggaacagatg gcaggatatg 1980
cgcatcccta tccacaactc tcgctatatt aacgaagttt actacactcg gatggggccg 2040
gatggaaatc atgcactgcc cctcaaagaa cacgccagag acgtgaaaca tgattatgag 2100
gccgagacta agatcagtag gacggccgcg agaagggtaa acgaaaaccg catgcttcgc 2160
cgcggtaaac caagcaagcg gttcgagaga gtaaaagcga actccaccca caacgtggtg 2220
ttcgatccca agacaaccgc cagttttaac cggcggcagg acgacatcta cggcactatc 2280
aatcacaggc acccaatggt gcctcttgct cctgacggct tcttcgctgt gggagggaat 2340
gtgataggta ttgatctggg tgagtcagtc ccactggcag ccggcatcct gcagaagtgc 2400
acttctacag attcagaagc agttcgctac gcatgtgggc attggaaggt ggtcgggatg 2460
gggaaaccgg gccagctgct cgacagacag acaagcgcca accgacgcaa gcaaccacac 2520
acgatcattg acccaatgag taatatggga gagcccttta gctccccgat ctgccagaag 2580
tttatcgcca aatgtcgaaa atttgtccgg gcaaaaggct cagaagagga caacaaggcc 2640
ttcgacgaca tggtgaagcg cgagccttca ctgtacagct ttcacggcag atggggctgg 2700
ctccttaaac agatgatgaa ggccgccaaa ggcgccaggc tggacccttt tagagagcat 2760
ttggagtggc tccttttccg gactaaatac ggcccaacca acagaaaaag ccttaacctc 2820
aatagtatgg cgtctacaaa gaacgtcatt tcagccattg actcatatat gagccggaga 2880
ggttggaaaa ccgtggagca gaggcagaga cgcgacggaa gactgcaggc agctagatca 2940
agccttcaaa gcaacttggt gaaccggcgc ctggagcgaa tcaaaaaaga ggagtcccag 3000
tgtattagat tggcccacct ttttgccgtt accacccact tggtactgga ggataacctt 3060
ccgaagcaaa atggagctag ctcccgagcc gacaacgggc gaaaggcaga ctggagaagt 3120
cgacacctgg cccagcgatt gtgcggaatc aaaaatgact ccggatcttg tgcgattgcc 3180
ggagtcagag cccgcaggat cgatcctgtg atgactagcc acatggatcc ttttgtgtat 3240
tctttggata ataagtgggc tatgcgcgcc aggtacacca aggtgagctt gtctagtatg 3300
accgattacc atgccaacct cattaggagc atactgctcg agaaaccagg caagagacag 3360
acgactgaat attatcagcg cgctgtacag gactttgccc gcctgcatgg actggatgtt 3420
gatgagatga ggaaagtccg cgaggctcgg tggtataaaa aacgcattaa ggctaagacg 3480
ctgtacatcc catgcagggg cggacgcgtc tttctgtcca ctcacaggct gcagtctgac 3540
actccccata ccgattccag cggggctgtc ctttgggagc aggacgcaga tcaggtggct 3600
gcactgaatg tagctctcag gtatattgac cagtgctacc ggagtaataa gaaagggctt 3660
gccaaagtga agaagcctaa ggtaccctcg agtctggtaa agaaaccgct gctgcgaaat 3720
ttgaacgcca gcacatggac tcgtctacta gcgcagctta attaacctag gctgctgcca 3780
cctaatacga ctcactatag ggaaactcga ctagatttag aatgcccacg atgattgggc 3840
agcatctccc cattccatga gtttttgctg agcaataact agcataaccc cttggggcct 3900
ctaaacgggt cttgaggggt tttttgctga aacctcaggc atttgagaag cacacggtca 3960
cactgcttcc ggtagtcaat aaaccggtaa accagcaata gacataagcg gctatttaac 4020
gaccctgccc tgaaccgacg accgggtcga atttgctttc gaatttctgc cattcatccg 4080
cttattatca cttattcagg cgtagcacca ggcgtttaag ggcaccaata actgccttaa 4140
aaaaattacg ccccgccctg ccactcatcg cagtactgtt gtaattcatt aagcattctg 4200
ccgacatgga agccatcaca gacggcatga tgaacctgaa tcgccagcgg catcagcacc 4260
ttgtcgcctt gcgtataata tttgcccata gtgaaaacgg gggcgaagaa gttgtccata 4320
ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg gattggctga gacgaaaaac 4380
atattctcaa taaacccttt agggaaatag gccaggtttt caccgtaaca cgccacatct 4440
tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt attcactcca gagcgatgaa 4500
aacgtttcag tttgctcatg gaaaacggtg taacaagggt gaacactatc ccatatcacc 4560
agctcaccgt ctttcattgc catacggaac tccggatgag cattcatcag gcgggcaaga 4620
atgtgaataa aggccggata aaacttgtgc ttatttttct ttacggtctt taaaaaggcc 4680
gtaatatcca gctgaacggt ctggttatag gtacattgag caactgactg aaatgcctca 4740
aaatgttctt tacgatgcca ttgggatata tcaacggtgg tatatccagt gatttttttc 4800
tccattttag cttccttagc tcctgaaaat ctcgataact caaaaaatac gcccggtagt 4860
gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac gtctcatttt 4920
cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt tatttattct 4980
gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa gtgcgtcggg tgatgctgcc 5040
aacttactga tttagtgtat gatggtgttt ttgaggtgct ccagtggctt ctgtttctat 5100
cagctgtccc tcctgttcag ctactgacgg ggtggtgcgt aacggcaaaa gcaccgccgg 5160
acatcagcgc tagcggagtg tatactggct tactatgttg gcactgatga gggtgtcagt 5220
gaagtgcttc atgtggcagg agaaaaaagg ctgcaccggt gcgtcagcag aatatgtgat 5280
acaggatata ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt cgactgcggc 5340
gagcggaaat ggcttacgaa cggggcggag atttcctgga agatgccagg aagatactta 5400
acagggaagt gagagggccg cggcaaagcc gtttttccat aggctccgcc cccctgacaa 5460
gcatcacgaa atctgacgct caaatcagtg gtggcgaaac ccgacaggac tataaagata 5520
ccaggcgttt cccctggcgg ctccctcgtg cgctctcctg ttcctgcctt tcggtttacc 5580
ggtgtcattc cgctgttatg gccgcgtttg tctcattcca cgcctgacac tcagttccgg 5640
gtaggcagtt cgctccaagc tggactgtat gcacgaaccc cccgttcagt ccgaccgctg 5700
cgccttatcc ggtaactatc gtcttgagtc caacccggaa agacatgcaa aagcaccact 5760
ggcagcagcc actggtaatt gatttagagg agttagtctt gaagtcatgc gccggttaag 5820
gctaaactga aaggacaagt tttggtgact gcgctcctcc aagccagtta cctcggttca 5880
aagagttggt agctcagaga accttcgaaa aaccgccctg caaggcggtt ttttcgtttt 5940
cagagcaaga gattacgcgc agaccaaaac gatctcaaga agatcatctt attaatcaga 6000
taaaatattt ctagatttca gtgcaattta tctcttcaaa tgtagcacct gaagtcagcc 6060
ccatacgata taagttgtaa ttctcatgtt agtcatgccc cgcgcccacc ggaaggagct 6120
gactgggttg aaggctctca agggcatcgg tcgagatccc ggtgcctaat gagtgagcta 6180
acttacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 6240
gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg 6300
tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc gcctggccct 6360
gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa tcctgtttga 6420
tggtggttaa cggcgggata taacatgagc tgtcttcggt atcgtcgtat cccactaccg 6480
agatgtccgc accaacgcgc agcccggact cggtaatggc gcgcattgcg cccagcgcca 6540
tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg 6600
tttgttgaaa accggacatg gcactccagt cgccttcccg ttccgctatc ggctgaattt 6660
gattgcgagt gagatattta tgccagccag ccagacgcag acgcgccgag acagaactta 6720
atgggcccgc taacagcgcg atttgctggt gacccaatgc gaccagatgc tccacgccca 6780
gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat gggtgtctgg tcagagacat 6840
caagaaataa cgccggaaca ttagtgcagg cagcttccac agcaatggca tcctggtcat 6900
ccagcggata gttaatgatc agcccactga cgcgttgcgc gagaagattg tgcaccgccg 6960
ctttacaggc ttcgacgccg cttcgttcta ccatcgacac caccacgctg gcacccagtt 7020
gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg 7080
aggtggcaac gccaatcagc aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg 7140
gaatgtaatt cagctccgcc atcgccgctt ccactttttc ccgcgttttc gcagaaacgt 7200
ggctggcctg gttcaccacg cgggaaacgg tctgataaga gacaccggca tactctgcga 7260
catcgtataa cgttactggt ttcacattca ccaccctgaa ttgactctct tccgggcgct 7320
atcatgccat accgcgaaag gttttgcgcc attcgatggt gtccgggatc tcgacgctct 7380
cccttatgcg actcctgcat taggaaatta atacgactca ctata 7425
<210> 19
<211> 7242
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(7242)
<223> pACYCDuet1-CasY3-crRNA
<400> 19
ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60
gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120
ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180
taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240
gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300
tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatgag tgagatcacc 360
gccattaaaa cctataatag caatctgttc gccaatagcg agaagaatat caaatacctg 420
cgcgacaccg gagttgcgct caagaacacc acaaatgtgt tccgcgggct gttggtggcc 480
ttttatggag gaatcacccc tgagattgcc agagagaaca taaagattat taaaaaggaa 540
aagagcctcg acatggacct gatatatgcg atcaatcgat tcagacccgt gcggtcaaat 600
tctgaccttg caaagtacca gatcccccag cccgtgatgc ggggcaagtt tgagagcgtt 660
gttggccacg aggcctcaga gctggcggcc gagttcctta attcccctat cggagaggac 720
tatgtgtgga ttgatgggtt gagagcctat gaggacctca aatcccaaat cggcgatttc 780
gactatgact tgaaggtgat ggtgagagaa aatatattgc caatatacaa cttcccaaac 840
atcgaggcat cagcaagcat atcacgaata tttggcaatg gcaagaagga agaccgcgaa 900
ttcaaagtgg gcgttgtgaa gaaaatcaag gagttgatcc tgaacagcga cctgggagac 960
gactactctg tcctccagca gataattttg agcgcggccg gcgctaaaga catgaaggaa 1020
tttagtaaaa cgtatgtggg aaaggctgcc ggtcgccgcg gcaagatcca gaatatcttg 1080
ctggagaact caaacaaaaa gcttggcgcc aacacaatcc agtcagtcct ggaaaagtgt 1140
gatgagatcg tctgcgaaaa aagtagcaag ctgatctgga aaaataacca gggcctgctc 1200
aaatatattg agattcagag tgacctgagt tacgatccca aggcttattc agaatgtttc 1260
aaagccgcac tggccgaaat ccagccaaag aatacggtga actacaattt cgcggtgaaa 1320
aggttgcaga acaagaagga ccttgagtcc aacgtgcaag caatgcagaa ttccgcaatg 1380
ctgaataact attttgattc acactacttc cagggctcca ataacttcgt catctgtcct 1440
tatcacttgg ggggcgagaa cctctcccaa ctgtttaaga tatataagaa cattggggat 1500
tccacagaag cagtaaaaga gtattgtagc gagcttaggg ggagcgtgaa agaccctatt 1560
ccgagtctgt gcgagtacgt cctgacactc cgcgatctgt cctgcaaaca gattataggg 1620
gccgcatctt acaaccagct catccagaga tataaggacc ataaagtgca cccaacaaaa 1680
gatggcaaca acaattatac attttcaacc ggctccgcta tgtacggctg cctgatacct 1740
cccaacaagg ctaagaaaac cgatcgacca gggtctcccg acagcaggat ctggatgatc 1800
ctccgggtgc tgaacggcaa gaagtgggag gatcatcatt actatatcca caatgtgcgc 1860
ttcctggagg aggtctatgc gcataatcct gagttcaagg gggacccggt tgccatccgc 1920
ggggggaggt ttggcggtat cggaaagaag atctgcgaat ctagccttca gagcctgagg 1980
gaaaaccccc agaagtatag aaaaactaaa aagcgcctcc tgcggctcca ggagtctatc 2040
aagaataact ccctgcccaa catcaactgg aatgaaaaga ttgcatccat tggcgtcaga 2100
tttgatcaca ataatttcaa ggctaccatc aatttcaaaa ttaaggtcaa tcacaaaaaa 2160
ttcgagggcc tcaaagtcgg cgacaaaatt atgtcttatg atcagaacca aactcagagc 2220
cacgcctatg cagtgatgaa tgtatgcaat agtttcgatt caggcgccat tcctttccgc 2280
ggccactacg tgcaggtgaa tgaaacagga aagattcgat ccaacattca agtgggacag 2340
aataattatg atccccttag ctacagcggt ctgtcctttg agaaatatga gaactggcgc 2400
aaccagagga aaaacttcgt gagtaaatat aggttcatta tcgggaagaa taatgagaat 2460
tgcgatatgc tcgaggagct ggaaaaaatt gagtcccgca aaccgtccct gtatgagtac 2520
aattacaagt actctgctat ccttcgaaag atcgtcaggg gcaccagcgg ggttaaactg 2580
gacgaatgcc gaaaggaaat tatcagtttt ttggcaaagg agcaggccag cattcgcaat 2640
gtcagctccc tcaatcatca ttccttcagt gcatttagaa gtgccaaaag tctcatttca 2700
gcctactttg ctgcctcaac cggtctcaac atcagcacgg acgaacagaa gcaagacaac 2760
gatcccgaaa tttttgaaat acggaaggac ctcgagcgca gccggaaaaa taagtgtagg 2820
gagaagatta ataagatttc taatactata gtaactatcg ctaatatgga gggatgtaat 2880
attatctgcg gcgagtttgg ccttagttcc actgggagca agaacaacac caagaagcaa 2940
aacaacaaaa acatggattg gctcgcgcga ggcgttgaga aaaagatcaa agaaatgtgc 3000
ttgctgcata atatccattt caaggatgcc cccccacatt ataccagtca ccaggatcct 3060
tttgtttata ataacacgct tctcaaggtg gagagcgtcg atcacatgaa agcaaggttc 3120
gcttacctga gcgtggatga tgtggaggaa tggcatttga aaaagcttag cagttacctg 3180
aagaacaaca agaacgggac tgcctactat tataatagtg caaccaaaca gtttctggac 3240
cactacggcc tggttgagca tgaggaaaag atcactaaaa ataagctgtc cctgtctaag 3300
ttcaaggata tcctcatcaa aaactttggg aatgttaata tcgtcatgcc acttcgggga 3360
ggcagatatt accttgcctc taagaacgtg gtgaccggcg ccgttccttt ctccttcgga 3420
ggatcttgct atctgtcaga tgctgacgaa gtggcagcta taaatgtggg tttgacaatc 3480
ttcccacagc agaactccgt accctcgagt ctggtaaaga aaccgctgct gcgaaatttg 3540
aacgccagca catggactcg tctactagcg cagcttaatt aacctaggct gctgccacct 3600
aatacgactc actataggga atttgcaatc accaaaaatt gtgtccttcg ttgacacagc 3660
atctccccat tccatgagtt tttgctgagc aataactagc ataacccctt ggggcctcta 3720
aacgggtctt gaggggtttt ttgctgaaac ctcaggcatt tgagaagcac acggtcacac 3780
tgcttccggt agtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgac 3840
cctgccctga accgacgacc gggtcgaatt tgctttcgaa tttctgccat tcatccgctt 3900
attatcactt attcaggcgt agcaccaggc gtttaagggc accaataact gccttaaaaa 3960
aattacgccc cgccctgcca ctcatcgcag tactgttgta attcattaag cattctgccg 4020
acatggaagc catcacagac ggcatgatga acctgaatcg ccagcggcat cagcaccttg 4080
tcgccttgcg tataatattt gcccatagtg aaaacggggg cgaagaagtt gtccatattg 4140
gccacgttta aatcaaaact ggtgaaactc acccagggat tggctgagac gaaaaacata 4200
ttctcaataa accctttagg gaaataggcc aggttttcac cgtaacacgc cacatcttgc 4260
gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt cactccagag cgatgaaaac 4320
gtttcagttt gctcatggaa aacggtgtaa caagggtgaa cactatccca tatcaccagc 4380
tcaccgtctt tcattgccat acggaactcc ggatgagcat tcatcaggcg ggcaagaatg 4440
tgaataaagg ccggataaaa cttgtgctta tttttcttta cggtctttaa aaaggccgta 4500
atatccagct gaacggtctg gttataggta cattgagcaa ctgactgaaa tgcctcaaaa 4560
tgttctttac gatgccattg ggatatatca acggtggtat atccagtgat ttttttctcc 4620
attttagctt ccttagctcc tgaaaatctc gataactcaa aaaatacgcc cggtagtgat 4680
cttatttcat tatggtgaaa gttggaacct cttacgtgcc gatcaacgtc tcattttcgc 4740
caaaagttgg cccagggctt cccggtatca acagggacac caggatttat ttattctgcg 4800
aagtgatctt ccgtcacagg tatttattcg gcgcaaagtg cgtcgggtga tgctgccaac 4860
ttactgattt agtgtatgat ggtgtttttg aggtgctcca gtggcttctg tttctatcag 4920
ctgtccctcc tgttcagcta ctgacggggt ggtgcgtaac ggcaaaagca ccgccggaca 4980
tcagcgctag cggagtgtat actggcttac tatgttggca ctgatgaggg tgtcagtgaa 5040
gtgcttcatg tggcaggaga aaaaaggctg caccggtgcg tcagcagaat atgtgataca 5100
ggatatattc cgcttcctcg ctcactgact cgctacgctc ggtcgttcga ctgcggcgag 5160
cggaaatggc ttacgaacgg ggcggagatt tcctggaaga tgccaggaag atacttaaca 5220
gggaagtgag agggccgcgg caaagccgtt tttccatagg ctccgccccc ctgacaagca 5280
tcacgaaatc tgacgctcaa atcagtggtg gcgaaacccg acaggactat aaagatacca 5340
ggcgtttccc ctggcggctc cctcgtgcgc tctcctgttc ctgcctttcg gtttaccggt 5400
gtcattccgc tgttatggcc gcgtttgtct cattccacgc ctgacactca gttccgggta 5460
ggcagttcgc tccaagctgg actgtatgca cgaacccccc gttcagtccg accgctgcgc 5520
cttatccggt aactatcgtc ttgagtccaa cccggaaaga catgcaaaag caccactggc 5580
agcagccact ggtaattgat ttagaggagt tagtcttgaa gtcatgcgcc ggttaaggct 5640
aaactgaaag gacaagtttt ggtgactgcg ctcctccaag ccagttacct cggttcaaag 5700
agttggtagc tcagagaacc ttcgaaaaac cgccctgcaa ggcggttttt tcgttttcag 5760
agcaagagat tacgcgcaga ccaaaacgat ctcaagaaga tcatcttatt aatcagataa 5820
aatatttcta gatttcagtg caatttatct cttcaaatgt agcacctgaa gtcagcccca 5880
tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga aggagctgac 5940
tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag tgagctaact 6000
tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 6060
gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gccagggtgg 6120
tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag 6180
agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg 6240
tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc actaccgaga 6300
tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct 6360
gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt 6420
gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat 6480
tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg 6540
ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc 6600
gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa 6660
gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca 6720
gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt 6780
tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat 6840
cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg 6900
tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa 6960
tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc 7020
tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat 7080
cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc 7140
atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg acgctctccc 7200
ttatgcgact cctgcattag gaaattaata cgactcacta ta 7242
<210> 20
<211> 6794
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(6794)
<223> pACYCDuet1-CasY4-crRNA
<400> 20
ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60
gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120
ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180
taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240
gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300
tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatgct gatgctggga 360
gacatagtac catatgacag cgtcggggag attgacggtt ggggggctgt ctcccggact 420
ttcggtaagg acaaaaaagc agacatagcc gtccagaaaa agttctgtga tgaagtcctc 480
agcaaaatca acgaggagaa ctgcaaaacg ttcgaggatt acaagaagat tatttttgaa 540
attttcaacg cctccacaat taaagagctg aaaaacactt ggaacagtgg tgccggcgtg 600
aggtcagcaa aagtgatcga caatttggga aaagacactg atcccgagtt cacattcgaa 660
aaggagcgga aaaattggga gagtgtccag gaggagaaga gcttcattcc aaatcgccct 720
aactattggg ccatcataca ttacatggag ggaaaaatcg gagacgaggt ggacaatagc 780
tcttgggctg taatgtacca aaacgccatc attgatattt gttctaaaat cacccgaaac 840
cacaattttt cctacgagca gacagaacgg aagaaagagc tgagcaaatg tgacacaagc 900
gctctggagc tggtaaatgg ctattttaaa agcacgtact tcaagtctgg caatgaattt 960
attatcgaaa accgccacgt gccaaatatc gggagactga tcgagctgta cagcgagctg 1020
actgtcgtta acgacgacaa cattaatgaa atcatcgaga tagtggacag tgaaactaag 1080
gtcaatgaaa atactactgg cgataatcag ttgaaaaaat acatcctctc catcagcggc 1140
tttgcaacgg tgcatcagat cgaacaggca atgaaatata acaagatcaa agatgatatt 1200
gaacagacca aagcccatcc ctttgttagc ggcaacgcaa gctttactgt cggaaactca 1260
gctctgaagg gtagcatcgc atctcagaat tcaaagcaca agggaaaaat tgccgggcag 1320
tccgcaaaga tatggctcta tattcacctg tatcacaagg atattaaaga gtggagggag 1380
caccacatac ccttttatca cgccaagttc ttcgaagagg tatattattt cgaccctgca 1440
ctgacagaga cagtcaaaat caggaataaa aagatgaaga caaatattac taaggaaaac 1500
atcgttaggg atggcattga ccctcgattt gcagaaaaaa acatccgcac tgcagccgta 1560
agacagaatt gtagagctaa tgtggctatg attccttctt ctcttgagct gaccaagaaa 1620
aacggcgaat tcaccatcac catcagccag agatttccta aagggctcaa gcgaaagaag 1680
agtgacatta gactgaatga tattgtgatg gcctacgatc aaaatcagac aaggccaaat 1740
acatatagca tactcagagt gacaagtacc accaaggaca aggacggcag gtatccttgt 1800
gaattcatta aggggggcga catccgatca tttatcaaca caaagatagg cgacatcgat 1860
gtgattaatt acgatggggt tgacaatacg accacatttt tcgtggactt cgtgcgggga 1920
cgcactgagt ttatccacag cgtgtgcaac ctggacgcct ttaagaagac caacgacaac 1980
aaccttaaat atgattttaa ctgcctgggc gagctggctc gcacaaatag agaacagaca 2040
aaactctacc ggtggcagaa ttggtatctg cgcttgttgt tgacgatgat gaagctgagc 2100
aagggctcaa ttccagggtt gagatctgaa attatttacg tagtgcggtt catggacgag 2160
aaatccagcc tgagccagat ctgcatcgag aacattcgat caatgaagaa aattataaac 2220
agctggttca gctacgagat gaaaaaccag gacgctacta atgaagaaaa agaacttcac 2280
gacaaagaga tgtatgccct gttgaaacgg atagaacaga ggcgctccaa taagaacaaa 2340
gagcgaatta ggaaaatcgc ctctgccatc gtcgccattg ctcagcaaga gggggcaaac 2400
attattgtgg gcgagaaaga gctggacacc aaaaaaaaag gaaagaataa ggcttcaaat 2460
aacagggcca tggactggtg ccccggtcag gttagcgaaa aggtgaaaca cggggtagac 2520
ctgctggata tcagcttttt tacaatgcct gctttctaca cttcccacca ggatcctttt 2580
gtgtatagcg actctaatcg agagatgcgg ccgaggatgg atgagatcaa ccccgaggcc 2640
ccgaatgccg aacgcaagat taagtccttc gtcacactgg ccaaaatgaa accaaagaag 2700
gaaaccatga cacagtacta ttctgacggg gtggaccggt tctgcgtcca taacaacatt 2760
accagggcag aactgaagaa gatcaagaca cgcaatgact ggattgccag actgggctcc 2820
gaaaaatgcc tggttcctgt gaggggggga agatactacc tgagcgctaa agtagctgca 2880
agtggagcca cacagatcgt gtacgcaggt gaaaccagat atctttcatc tgccgatcat 2940
atcgccgcca ctaacattgg actgtccttt ctcgtccctt atgaccctga gaaacagaag 3000
aaaaagaagg ggaaaaacca gacagccgtg gataagacgt caacagttgc cgtaccctcg 3060
agtctggtaa agaaaccgct gctgcgaaat ttgaacgcca gcacatggac tcgtctacta 3120
gcgcagctta attaacctag gctgctgcca cctaatacga ctcactatag ggaactcgaa 3180
gagggcgaag aactgtgact cctatgtcac gcatctcccc attccatgag tttttgctga 3240
gcaataacta gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgctgaa 3300
acctcaggca tttgagaagc acacggtcac actgcttccg gtagtcaata aaccggtaaa 3360
ccagcaatag acataagcgg ctatttaacg accctgccct gaaccgacga ccgggtcgaa 3420
tttgctttcg aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaccag 3480
gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc cactcatcgc 3540
agtactgttg taattcatta agcattctgc cgacatggaa gccatcacag acggcatgat 3600
gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatag 3660
tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac 3720
tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg 3780
ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat 3840
cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt 3900
aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacggaact 3960
ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 4020
tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 4080
tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 4140
caacggtggt atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc 4200
tcgataactc aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac 4260
ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt ggcccagggc ttcccggtat 4320
caacagggac accaggattt atttattctg cgaagtgatc ttccgtcaca ggtatttatt 4380
cggcgcaaag tgcgtcgggt gatgctgcca acttactgat ttagtgtatg atggtgtttt 4440
tgaggtgctc cagtggcttc tgtttctatc agctgtccct cctgttcagc tactgacggg 4500
gtggtgcgta acggcaaaag caccgccgga catcagcgct agcggagtgt atactggctt 4560
actatgttgg cactgatgag ggtgtcagtg aagtgcttca tgtggcagga gaaaaaaggc 4620
tgcaccggtg cgtcagcaga atatgtgata caggatatat tccgcttcct cgctcactga 4680
ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg gcttacgaac ggggcggaga 4740
tttcctggaa gatgccagga agatacttaa cagggaagtg agagggccgc ggcaaagccg 4800
tttttccata ggctccgccc ccctgacaag catcacgaaa tctgacgctc aaatcagtgg 4860
tggcgaaacc cgacaggact ataaagatac caggcgtttc ccctggcggc tccctcgtgc 4920
gctctcctgt tcctgccttt cggtttaccg gtgtcattcc gctgttatgg ccgcgtttgt 4980
ctcattccac gcctgacact cagttccggg taggcagttc gctccaagct ggactgtatg 5040
cacgaacccc ccgttcagtc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5100
aacccggaaa gacatgcaaa agcaccactg gcagcagcca ctggtaattg atttagagga 5160
gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa aggacaagtt ttggtgactg 5220
cgctcctcca agccagttac ctcggttcaa agagttggta gctcagagaa ccttcgaaaa 5280
accgccctgc aaggcggttt tttcgttttc agagcaagag attacgcgca gaccaaaacg 5340
atctcaagaa gatcatctta ttaatcagat aaaatatttc tagatttcag tgcaatttat 5400
ctcttcaaat gtagcacctg aagtcagccc catacgatat aagttgtaat tctcatgtta 5460
gtcatgcccc gcgcccaccg gaaggagctg actgggttga aggctctcaa gggcatcggt 5520
cgagatcccg gtgcctaatg agtgagctaa cttacattaa ttgcgttgcg ctcactgccc 5580
gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 5640
agaggcggtt tgcgtattgg gcgccagggt ggtttttctt ttcaccagtg agacgggcaa 5700
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 5760
ttgccccagc aggcgaaaat cctgtttgat ggtggttaac ggcgggatat aacatgagct 5820
gtcttcggta tcgtcgtatc ccactaccga gatgtccgca ccaacgcgca gcccggactc 5880
ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg gcaaccagca tcgcagtggg 5940
aacgatgccc tcattcagca tttgcatggt ttgttgaaaa ccggacatgg cactccagtc 6000
gccttcccgt tccgctatcg gctgaatttg attgcgagtg agatatttat gccagccagc 6060
cagacgcaga cgcgccgaga cagaacttaa tgggcccgct aacagcgcga tttgctggtg 6120
acccaatgcg accagatgct ccacgcccag tcgcgtaccg tcttcatggg agaaaataat 6180
actgttgatg ggtgtctggt cagagacatc aagaaataac gccggaacat tagtgcaggc 6240
agcttccaca gcaatggcat cctggtcatc cagcggatag ttaatgatca gcccactgac 6300
gcgttgcgcg agaagattgt gcaccgccgc tttacaggct tcgacgccgc ttcgttctac 6360
catcgacacc accacgctgg cacccagttg atcggcgcga gatttaatcg ccgcgacaat 6420
ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg ccaatcagca acgactgttt 6480
gcccgccagt tgttgtgcca cgcggttggg aatgtaattc agctccgcca tcgccgcttc 6540
cactttttcc cgcgttttcg cagaaacgtg gctggcctgg ttcaccacgc gggaaacggt 6600
ctgataagag acaccggcat actctgcgac atcgtataac gttactggtt tcacattcac 6660
caccctgaat tgactctctt ccgggcgcta tcatgccata ccgcgaaagg ttttgcgcca 6720
ttcgatggtg tccgggatct cgacgctctc ccttatgcga ctcctgcatt aggaaattaa 6780
tacgactcac tata 6794
<210> 21
<211> 7439
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(7439)
<223> pACYCDuet1-CasY5-crRNA
<400> 21
ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60
gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120
ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180
taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240
gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300
tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatggc ctctgacgtt 360
acgtcttaca tgacctacag ggccaacctg gtgcctgatg caagaaaaaa gaaattgctt 420
aatgacactt acgcgtttta caggaaaggc gaggagctgt tcttcgatgc cttctttgat 480
atcctgggtg gggtgagtcc acagctgatc aataccctgg tcaatgacgg gacaatcaaa 540
gccgagaatg atgccaccga cgaggaaaag aacgatataa ccgaggagga caaaaacaac 600
acttctaaaa agaagctcga tccaaagctc ctgtgcgcca ttctgtggtt cagactcgtg 660
aagaaggaga agaatacctg tgaaatcctt aatgtgaagc tgttgaaaga gaagttctct 720
gcttattatg gggctgaggc aaatgacaca gtaatctcat atttcagtgc aaattacgac 780
gtggaaaact acatgtgggt agattgcaga gtgcggtgtc tttcattctg caacaagctg 840
gggaccagtc ttgatgtgct ggccatcgat ctggagtcta tgttgcgggc caaaaacatt 900
gctttcttcg gaggcgttgg caaggctgat aaagcgatta gcaacatctt tatccggtct 960
gaaaagcggg gcaaatcaaa tgtgaaaaaa ctgcatgagt acgccgtgaa caccatcgac 1020
atcctcgaaa agaccgaagt cattaacagc gaccagtact tggacgtctt gctcagggtg 1080
tttggcgccg ccaacatcga cgagctgcag aacatctgca aaaaggaaaa cgggggttcc 1140
aaactcgtca agccaatcgg ccagtttctg aacagtaagt tcgtctttga tccaaagaag 1200
gttaagaaga gttgggtgga tcttgccaaa gagaagagct atgcccccaa ttacccttcc 1260
tgcgataaac tcaaaatcta catcgagaac aagctgggca agctcggtca gttgactaaa 1320
ccaaaaaaca aagtttctga cgacgacgag caaggatcca ataaggggct ctggtcatca 1380
atgtttcgga acgcaataac ctctatctgt gctgccgtga cacataatta ctcattctct 1440
atcggtcaga ccgataggca ggaaaagttg agcatactta ggaaaagtaa tgggtctatc 1500
gccaatgaga tcaatgagaa ttttccgcag aaagatcagt acacaatcat gccttatcac 1560
gtgccagatt tgaagaatac tatccggctg tataatggct tgaatcagaa gacagatgag 1620
gagatcgctg gcatcctgaa caccatcaac aataatgaga aggctaaaag aaaaaaacat 1680
ggcgatgtta gagcccaggc gtacattttg agcttgtaca cctcaaactc caccaagtat 1740
acagagaaat ctatcacgga cgcgctgaag atcaacaaga tcgaggacac catcaaaaat 1800
caaaaggtcc atccttttgt gctgggtaac gcaggcatga gatttggtgg agacgacaat 1860
tgcgtgggaa ggattgagag acccagtgtg tttgtgaagg agcttggttg ctatgcaggc 1920
gagagtgata aaatgtggat taccatcaag gtcatcgacg aaggacgatg gaaaacccac 1980
catatcccat tctttcaggc taagtactat gaagaactct atgcttttga cccagaccct 2040
gaaaaaaagg agactgtgaa catcagaatg aataagacaa atacattggc taagaagggt 2100
aatacgtcta acgcaggcat gttcaatgag tccttttatg aaggcaacga cgaagaaacc 2160
aaaatgaaga gaaaaaagta tagacagaaa agagtgagga ataaggtcgc gctggaaaat 2220
ttgaaatata acgtcgactt tgtggatcct acgttcgttc tgttcaaaaa tagtgaggga 2280
ttcggaatta atatctcaca gaatatccaa gacccaactg ggctgaaggg agagattacc 2340
accggccaga atatcatggg gattgaccag aaccgggata ggtctaattc atacagtatc 2400
tggcgcatta caggagacca ggcaaacggc atctatcccg ctgagttcgt gaaatctggc 2460
gatatctcca gcctgattaa aacaaataaa aaggatgaga aaggtaacaa gaaagagtac 2520
gacgtgttca catacgacgg cttgaataca gactctgaaa agctgaattc attttttgca 2580
gatcggaaag ctttcatcta cgggctggat cccgccgtct tcaatacgtc agagtataac 2640
atcttctttg aatacgaaaa gatcaagaat gagaagaaaa aaatctacca gtggaatggg 2700
tcctatctgt ctttgctgcg aaaggtgctc acgatgagta aaggcaacac tgaaaagctg 2760
aaaaatgaaa tcagaaagga gatcatcaat gtgatcagac tgatcgatgg aaaatcttcc 2820
cttagccact gctgtatcat gaacatgcag ggtatgataa aagtgatcaa ttcctggttc 2880
gcctacacaa tgggtgagaa ctcttctaca gaagaccaaa aaaaagaata cgacagcgag 2940
atgtataatc tcctcctcta cgtacgcaaa agacgcaaaa acaaaaagac tgagaagatc 3000
aataagatgg ctaacgccat tatctgtacc gctattgaga acaatgtaaa acacatcatc 3060
ctggaagctc tcgacaagaa gggcgacaag ggcaactcaa gacagaataa tgcctccaac 3120
atggactggt gcgctaaagg cattattgac aaggtgatca ccggctgtcg attcgtggat 3180
atcaacgtga ggaaggtgaa tccagcttac accagtcatc aagatccaat ggtacataat 3240
aagaacaacc cagctatgaa gccgcgcatt gctaagatcg acatggtgga gaagaacaat 3300
tgggctgtcg agaagcttgt atccattagc agtatggacc ctaaggagaa ctctgcggag 3360
atacattact tcaatttcat tgatgtgttt tgcaggcagt ataaaattga ccgaaaggat 3420
cttaataaga taaaaaagat ctctgatctt caggacctga tggcagaaaa gcatagtttt 3480
atatatgtcc ccagcagggg ggggcagtac tatctgagca cacaccgcgt gaccagctgt 3540
gacgatgaca tccagattct gtacgacgga aagaatgtgt ggttggcgaa cagcgatcat 3600
attgcagccg ctaacattgt cctgcgggga ctggactact caccaagccc caagaaaaag 3660
aataagaccg acctcgactt ggccgccgtc ggaggggtac cctcgagtct ggtaaagaaa 3720
ccgctgctgc gaaatttgaa cgccagcaca tggactcgtc tactagcgca gcttaattaa 3780
cctaggctgc tgccacctaa tacgactcac tatagggaac tcgaagaggc gaagcatagt 3840
gaccgatggc gtcacgcatc tccccattcc atgagttttt gctgagcaat aactagcata 3900
accccttggg gcctctaaac gggtcttgag gggttttttg ctgaaacctc aggcatttga 3960
gaagcacacg gtcacactgc ttccggtagt caataaaccg gtaaaccagc aatagacata 4020
agcggctatt taacgaccct gccctgaacc gacgaccggg tcgaatttgc tttcgaattt 4080
ctgccattca tccgcttatt atcacttatt caggcgtagc accaggcgtt taagggcacc 4140
aataactgcc ttaaaaaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt 4200
cattaagcat tctgccgaca tggaagccat cacagacggc atgatgaacc tgaatcgcca 4260
gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catagtgaaa acgggggcga 4320
agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg 4380
ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt 4440
aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac 4500
tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac 4560
tatcccatat caccagctca ccgtctttca ttgccatacg gaactccgga tgagcattca 4620
tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg 4680
tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg 4740
actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc 4800
cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa 4860
atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat 4920
caacgtctca ttttcgccaa aagttggccc agggcttccc ggtatcaaca gggacaccag 4980
gatttattta ttctgcgaag tgatcttccg tcacaggtat ttattcggcg caaagtgcgt 5040
cgggtgatgc tgccaactta ctgatttagt gtatgatggt gtttttgagg tgctccagtg 5100
gcttctgttt ctatcagctg tccctcctgt tcagctactg acggggtggt gcgtaacggc 5160
aaaagcaccg ccggacatca gcgctagcgg agtgtatact ggcttactat gttggcactg 5220
atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa aaggctgcac cggtgcgtca 5280
gcagaatatg tgatacagga tatattccgc ttcctcgctc actgactcgc tacgctcggt 5340
cgttcgactg cggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgc 5400
caggaagata cttaacaggg aagtgagagg gccgcggcaa agccgttttt ccataggctc 5460
cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg aaacccgaca 5520
ggactataaa gataccaggc gtttcccctg gcggctccct cgtgcgctct cctgttcctg 5580
cctttcggtt taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg 5640
acactcagtt ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt 5700
cagtccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat 5760
gcaaaagcac cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc 5820
atgcgccggt taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca 5880
gttacctcgg ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc 5940
ggttttttcg ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca 6000
tcttattaat cagataaaat atttctagat ttcagtgcaa tttatctctt caaatgtagc 6060
acctgaagtc agccccatac gatataagtt gtaattctca tgttagtcat gccccgcgcc 6120
caccggaagg agctgactgg gttgaaggct ctcaagggca tcggtcgaga tcccggtgcc 6180
taatgagtga gctaacttac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 6240
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 6300
attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt 6360
caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg 6420
aaaatcctgt ttgatggtgg ttaacggcgg gatataacat gagctgtctt cggtatcgtc 6480
gtatcccact accgagatgt ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat 6540
tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt 6600
cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc 6660
tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc 6720
cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag 6780
atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt 6840
ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat 6900
ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag 6960
attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac 7020
gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg 7080
cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg 7140
tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt 7200
tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc 7260
ggcatactct gcgacatcgt ataacgttac tggtttcaca ttcaccaccc tgaattgact 7320
ctcttccggg cgctatcatg ccataccgcg aaaggttttg cgccattcga tggtgtccgg 7380
gatctcgacg ctctccctta tgcgactcct gcattaggaa attaatacga ctcactata 7439
<210> 22
<211> 2690
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(2690)
<223> 重组质粒pUC19-PAM
<220>
<221> misc_feature
<222> (400)..(406)
<223> n表示a,t,c或g
<400> 22
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt nnnnnngcat ctccccattc 420
catgagtcta gagtcgacct gcaggcatgc aagcttggcg taatcatggt catagctgtt 480
tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 540
gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 600
gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 660
ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 720
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 780
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 840
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 900
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 960
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 1020
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 1080
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 1140
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 1200
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 1260
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt 1320
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 1380
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 1440
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 1500
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 1560
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 1620
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 1680
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 1740
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 1800
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 1860
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 1920
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 1980
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 2040
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 2100
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 2160
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 2220
accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 2280
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 2340
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 2400
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 2460
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 2520
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 2580
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 2640
tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 2690
<210> 23
<211> 4102
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(4102)
<223> ccdb毒性质粒
<400> 23
cgtcgacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 60
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 120
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 180
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 240
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 300
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 360
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 420
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 480
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 540
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 600
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 660
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 720
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 780
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 840
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 900
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 960
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1020
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1080
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagtgt 1140
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1200
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1260
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1320
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1380
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1440
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1500
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1560
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1620
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1680
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1740
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1800
gctggccttt tgctcacatg tgaagatcat cttattaatc agataaaata tttctaggct 1860
catgagcccg aagtggttgg catctcccca ttccatgagc gagcccgatc ttccccatcg 1920
gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gccggccacg 1980
atgcgtccgg cgtagaggat ctgctcatgt ttgacagctt atcatcgatg cataatgtgc 2040
ctgtcaaatg gacgaagcag ggattctgca aaccctatgc tactccgtca agccgtcaat 2100
tgtctgattc gttaccaatt atgacaactt gacggctaca tcattcactt tttcttcaca 2160
accggcacgg aactcgctcg ggctggcccc ggtgcatttt ttaaataccc gcgagaaata 2220
gagttgatcg tcaaaaccaa cattgcgacc gacggtggcg ataggcatcc gggtggtgct 2280
caaaagcagc ttcgcctggc tgatacgttg gtcctcgcgc cagcttaaga cgctaatccc 2340
taactgctgg cggaaaagat gtgacagacg cgacggcgac aagcaaacat gctgtgcgac 2400
gctggcgata tcaaaattgc tgtctgccag gtgatcgctg atgtactgac aagcctcgcg 2460
tacccgatta tccatcggtg gatggagcga ctcgttaatc gcttccatgc gccgcagtaa 2520
caattgctca agcagattta tcgccagcag ctccgaatag cgcccttccc cttgcccggc 2580
gttaatgatt tgcccaaaca ggtcgctgaa atgcggctgg tgcgcttcat ccgggcgaaa 2640
gaaccccgta ttggcaaata ttgacggcca gttaagccat tcatgccagt aggcgcgcgg 2700
acgaaagtaa acccactggt gataccattc gcgagcctcc ggatgacgac cgtagtgatg 2760
aatctctcct ggcgggaaca gcaaaatatc acccggtcgg caaacaaatt ctcgtccctg 2820
atttttcacc accccctgac cgcgaatggt gagattgaga atataacctt tcattcccag 2880
cggtcggtcg ataaaaaaat cgagataacc gttggcctca atcggcgtta aacccgccac 2940
cagatgggca ttaaacgagt atcccggcag caggggatca ttttgcgctt cagccatact 3000
tttcatactc ccgccattca gagaagaaac caattgtcca tattgcatca gacattgccg 3060
tcactgcgtc ttttactggc tcttctcgct aaccaaaccg gtaaccccgc ttattaaaag 3120
cattctgtaa caaagcggga ccaaagccat gacaaaaacg cgtaacaaaa gtgtctataa 3180
tcacggcaga aaagtccaca ttgattattt gcacggcgtc acactttgct atgccatagc 3240
atttttatcc ataagattag cggatcctac ctgacgcttt ttatcgcaac tctctactgt 3300
ttctccatac ccgttttttt gggctagcga attcgagctc atgcagttta aggtttacac 3360
ctataaaaga gagagccgtt atcgtctgtt tgtggatgta cagagtgata ttattgacac 3420
gcccgggcga cggatggtga tccccctggc cagtgcacgt ctgctgtcag ataaagtctc 3480
ccgtgaactt tacccggtgg tgcatatcgg ggatgaaagc tggcgcatga tgaccaccga 3540
tatggccagt gtgccggtat ccgttatcgg ggaagaagtg gctgatctca gccaccgcga 3600
aaatgacatc aaaaacgcca ttaacctgat gttctgggga atataatcta gagtcgacct 3660
gcaggcatgc aagcttggct gttttggcgg atgagagaag attttcagcc tgatacagat 3720
taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca gtagcgcggt 3780
ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt 3840
ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt 3900
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga 3960
caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag 4020
gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc 4080
tttttgcgtt tctacaaact ct 4102
<210> 24
<211> 35
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(35)
<223> CasY1直接重复序列
<400> 24
uugcaacggc ugagaauugc gucuuccauu gacgc 35
<210> 25
<211> 17
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(17)
<223> CasY1直接重复序列茎环序列
<220>
<221> misc_feature
<222> (6)..(11)
<223> n为a,g,c或u
<400> 25
gcgucnnnnn nugacgc 17
<210> 26
<211> 90
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(90)
<223> CasY1前crRNA序列
<220>
<221> misc_feature
<222> (36)..(55)
<223> n为a,g,c或u
<400> 26
uugcaacggc ugagaauugc gucuuccauu gacgcnnnnn nnnnnnnnnn nnnnnuugca 60
acggcugaga auugcgucuu ccauugacgc 90
<210> 27
<211> 37
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(37)
<223> CasY2直接重复序列
<400> 27
acucgacuag auuuagaaug cccacgauga uugggca 37
<210> 28
<211> 19
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(19)
<223> CasY2直接重复序列茎环序列
<220>
<221> misc_feature
<222> (7)..(12)
<223> n为a,g,c或u
<400> 28
ugcccannnn nnuugggca 19
<210> 29
<211> 94
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(94)
<223> CasY2前crRNA序列
<220>
<221> misc_feature
<222> (38)..(57)
<223> n为a,g,c或u
<400> 29
acucgacuag auuuagaaug cccacgauga uugggcannn nnnnnnnnnn nnnnnnnacu 60
cgacuagauu uagaaugccc acgaugauug ggca 94
<210> 30
<211> 37
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(37)
<223> CasY3直接重复序列
<400> 30
uuugcaauca ccaaaaauug uguccuucgu ugacaca 37
<210> 31
<211> 19
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(19)
<223> CasY1直接重复序列茎环序列
<220>
<221> misc_feature
<222> (7)..(12)
<223> n为a,g,c或u
<400> 31
ugugucnnnn nnugacaca 19
<210> 32
<211> 94
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(94)
<223> CasY3前crRNA序列
<220>
<221> misc_feature
<222> (38)..(57)
<223> n为a,g,c或u
<400> 32
uuugcaauca ccaaaaauug uguccuucgu ugacacannn nnnnnnnnnn nnnnnnnuuu 60
gcaaucacca aaaauugugu ccuucguuga caca 94
<210> 33
<211> 36
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(36)
<223> CasY4直接重复序列
<400> 33
cucgaagagg gcgaagaacu gugacuccua ugucac 36
<210> 34
<211> 17
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(17)
<223> CasY4直接重复序列茎环序列
<220>
<221> misc_feature
<222> (6)..(11)
<223> n为a,g,c或u
<400> 34
gugacnnnnn nugucac 17
<210> 35
<211> 92
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(92)
<223> CasY4前crRNA序列
<220>
<221> misc_feature
<222> (37)..(56)
<223> n为a,g,c或u
<400> 35
cucgaagagg gcgaagaacu gugacuccua ugucacnnnn nnnnnnnnnn nnnnnncucg 60
aagagggcga agaacuguga cuccuauguc ac 92
<210> 36
<211> 36
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(36)
<223> CasY5直接重复序列
<400> 36
cucgaagagg cgaagcauag ugaccgaugg cgucac 36
<210> 37
<211> 16
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(16)
<223> CasY5直接重复序列茎环序列
<220>
<221> misc_feature
<222> (6)..(11)
<223> n为a,g,c或u
<400> 37
gugacnnnnn ngucac 16
<210> 38
<211> 92
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(92)
<223> CasY5前crRNA序列
<220>
<221> misc_feature
<222> (37)..(56)
<223> n为a,g,c或u
<400> 38
cucgaagagg cgaagcauag ugaccgaugg cgucacnnnn nnnnnnnnnn nnnnnncucg 60
aagaggcgaa gcauagugac cgauggcguc ac 92
<210> 39
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(55)
<223> TTR-1 crRNA-CasY1
<400> 39
ttgcaacggc tgagaattgc gtcttccatt gacgcaccat cagaggacac ttgga 55
<210> 40
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(55)
<223> TTR-2 crRNA-CasY1
<400> 40
ttgcaacggc tgagaattgc gtcttccatt gacgcgcatc tccccattcc atgag 55
<210> 41
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(56)
<223> PCSK9 crRNA-CasY1
<400> 41
ttgcaacggc tgagaattgc gtcttccatt gacgcgccca gagcatcccg tggaac 56
<210> 42
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(57)
<223> TTR-1 crRNA-CasY2
<400> 42
actcgactag atttagaatg cccacgatga ttgggcaacc atcagaggac acttgga 57
<210> 43
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(57)
<223> TTR-2 crRNA-CasY2
<400> 43
actcgactag atttagaatg cccacgatga ttgggcagca tctccccatt ccatgag 57
<210> 44
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(58)
<223> PCSK9 crRNA-CasY2
<400> 44
actcgactag atttagaatg cccacgatga ttgggcagcc cagagcatcc cgtggaac 58
<210> 45
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(57)
<223> TTR-1 crRNA-CasY3
<400> 45
tttgcaatca ccaaaaattg tgtccttcgt tgacacaacc atcagaggac acttgga 57
<210> 46
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(57)
<223> TTR-2 crRNA-CasY3
<400> 46
tttgcaatca ccaaaaattg tgtccttcgt tgacacagca tctccccatt ccatgag 57
<210> 47
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(58)
<223> PCSK9 crRNA-CasY3
<400> 47
tttgcaatca ccaaaaattg tgtccttcgt tgacacagcc cagagcatcc cgtggaac 58
<210> 48
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(56)
<223> TTR-1 crRNA-CasY4
<400> 48
ctcgaagagg gcgaagaact gtgactccta tgtcacacca tcagaggaca cttgga 56
<210> 49
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(56)
<223> TTR-2 crRNA-CasY4
<400> 49
ctcgaagagg gcgaagaact gtgactccta tgtcacgcat ctccccattc catgag 56
<210> 50
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(57)
<223> PCSK9 crRNA-CasY4
<400> 50
ctcgaagagg gcgaagaact gtgactccta tgtcacgccc agagcatccc gtggaac 57
<210> 51
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(56)
<223> TTR-1 crRNA-CasY5
<400> 51
ctcgaagagg cgaagcatag tgaccgatgg cgtcacacca tcagaggaca cttgga 56
<210> 52
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(56)
<223> TTR-2 crRNA-CasY5
<400> 52
ctcgaagagg cgaagcatag tgaccgatgg cgtcacgcat ctccccattc catgag 56
<210> 53
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(57)
<223> PCSK9 crRNA-CasY5
<400> 53
ctcgaagagg cgaagcatag tgaccgatgg cgtcacgccc agagcatccc gtggaac 57
<210> 54
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(41)
<223> TTR-1 crRNA-LbCpf1
<400> 54
taatttctac taagtgtaga taccatcaga ggacacttgg a 41
<210> 55
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(41)
<223> TTR-2 crRNA- LbCpf1
<400> 55
taatttctac taagtgtaga tgcatctccc cattccatga g 41
<210> 56
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(42)
<223> PCSK9 crRNA- LbCpf1
<400> 56
taatttctac taagtgtaga tgcccagagc atcccgtgga ac 42
<210> 57
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(60)
<223> 靶DNA
<400> 57
tagacaccaa atcttactgg aaggcacttg gcatctcccc attccatgag catgcagagg 60

Claims (54)

1.一种CRISPR-Cas效应子蛋白,其特征在于,所述CRISPR-Cas效应子蛋白包括与SEQID NO:1至5中任一项所述的氨基酸序列具有至少70%同一性的蛋白。
2.根据权利要求1所述的CRISPR-Cas效应子蛋白,其特征在于,所述CRISPR-Cas效应子蛋白包括与SEQ ID NO:1至5中任一项所述的氨基酸序列具有80%以上,优选90%以上,更优选95%以上,进一步优选99%以上同一性的蛋白;
优选地,所述CRISPR-Cas效应子蛋白包括RuvC结构域。
3.根据权利要求2所述的CRISPR-Cas效应子蛋白,其特征在于,所述CRISPR-Cas效应子蛋白包括:
a)SEQ ID NO:1至5中任一项所示的蛋白;或
b)以SEQ ID NO:1所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:
N21X,N23X,R25X,K26X,Q482X,S484X,R486X,S489X,R493X,H511X,C513X,H515X,N516X,R518X,R540X,K558X,Y560X,K562X,K565X,T600X,T672X,D676X,Q680X,Y683X,L686X,D693X,Y731X,G767X,R772X,K832X,K833X,Q836X,M896X;或
c)以SEQ ID NO:2所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:
R19X,R28X,R32X,K512X,N527X,W531X,R553X,K581X,K589X,I590X,R605X,K611X,R612X,R615X,Y777X,E877X,R931X;或
d)以SEQ ID NO:3所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:
K8X,F15X,N17X,K20X,K471X,W483X,H502X,R505X,K557X,K556X,R560X,Y673X,L676X,Y723X,N822X,K823X,E826X,K827X,K830X,K880X,L887X;或
e)以SEQ ID NO:4所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:
K317X,W330X,Y351X,K354X,D392X,F395X,N399X,Y509X,V512X,Y568X,N662X,K663X,E666X,R667X,K670X,K719X,L726X;或
f)以SEQ ID NO:5所示的氨基酸序列为基础,进行如下一种或多种点突变的蛋白:
M9X,V16X,D18X,K21X,K518X,W531X,F550X,K553X,R609X,Y612X,R616X,Y730X,L733X,Y781X,N879X,K880X,E883X,K884X,K887X,K936X,F943X;
其中X为任意氨基酸。
4.一种CRISPR-Cas效应子融合蛋白,其特征在于,所述CRISPR-Cas效应子融合蛋白包括权利要求1至3中任一项所述的CRISPR-Cas效应子蛋白、或所述CRISPR-Cas效应子蛋白的衍生物或所述CRISPR-Cas效应子蛋白的功能片段,以及异源功能结构域。
5.根据权利要求4所述的CRISPR-Cas效应子融合蛋白,其特征在于,所述异源功能结构域位于所述CRISPR-Cas效应子融合蛋白的N端、C端或内部;
优选地,所述异源功能结构域包括定位信号、报告蛋白、CRISPR-Cas效应子蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC、裂解活性多肽、连接酶中的一种或多种;
优选地,所述定位信号包括核定位信号和/或核输出信号;
优选地,所述核输出信号包括人类蛋白酪氨酸激酶2;
优选地,所述报告蛋白包括谷胱甘肽-S-转移酶、辣根过氧化物酶、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡糖醛酸糖苷酶或自发荧光蛋白中的一种或多种;
优选地,所述自发荧光蛋白包括绿色荧光蛋白、HcRed、DsRed、青荧光蛋白、黄色荧光蛋白或蓝色荧光蛋白中的一种或多种;
优选地,所述DNA结合域包括甲基化结合蛋白、Lex A DBD或Gal4 DBD中的一种或多种;
优选地,所述表位标签包括组氨酸标签、V5标签、FLAG标签、流感病毒血凝素标签、Myc标签、VSV-G标签或硫氧还蛋白标签中的一种或多种;
优选地,所述转录激活域包括VP64和/或VPR;
优选地,所述转录抑制域包括KRAB和/或SID;
优选地,所述核酸酶包括FokI;
优选地,所述脱氨结构域包括ADAR1、ADAR2、APOBEC、AID或TAD中的一种或多种;
优选地,所述裂解活性多肽包括具有单链RNA裂解活性的多肽、具有双链RNA裂解活性的多肽、具有单链DNA裂解活性的多肽或具有双链DNA裂解活性的多肽;
优选地,所述连接酶包括DNA连接酶和/或RNA连接酶。
6.一种DNA分子,其特征在于,所述DNA分子编码权利要求1至3中任一项所述的CRISPR-Cas效应子蛋白、或权利要求4或5所述的CRISPR-Cas效应子融合蛋白。
7.根据权利要求6所述的DNA分子,其特征在于,所述DNA分子为根据宿主细胞的密码子偏好性进行密码子优化的DNA分子;
优选地,宿主细胞包括原核细胞或真核细胞;
优选地,所述DNA分子包括与SEQ ID NO:6至10中任一项所述的核苷酸序列具有70%以上,优选90%以上,更优选95%以上,进一步优选99%,更进一步优选为100%同一性的核苷酸。
8.一种重组载体,其特征在于,所述重组载体包含权利要求6或7所述的DNA分子。
9.根据权利要求8所述的重组载体,其特征在于,所述DNA分子与启动子连接;
优选地,所述启动子包括诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种;
优选地,所述启动子包括T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种;
优选地,所述重组载体包括逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹载体或噬菌粒载体;
优选地,所述重组载体包括质粒载体。
10.一种宿主细胞,其特征在于,所述宿主细胞转化有权利要求8或9所述的重组载体。
11.一种基因编辑系统,其特征在于,所述基因编辑系统包括:
a)RNA指导物或编码所述RNA指导物的核酸,所述RNA指导物包括直接重复序列和间隔子序列,所述间隔子序列用于与靶核酸杂交;
b)权利要求1至3中任一项所述的CRISPR-Cas效应子蛋白,或权利要求4或5的CRISPR-Cas效应子融合蛋白,或权利要求6或7所述的DNA分子,或权利要求8或9所述的重组载体,或权利要求10所述的宿主细胞;
所述DNA分子、所述重组载体或所述宿主细胞能够表达所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白,
在所述基因编辑系统中,所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白,与所述RNA指导物结合后,靶向作用于所述间隔子序列与所述靶核酸杂交形成的杂交序列。
12.根据权利要求11所述的基因编辑系统,其特征在于,所述基因编辑系统不包含tracrRNA。
13.根据权利要求11所述的基因编辑系统,其特征在于,所述RNA指导物包括1种或多种。
14.根据权利要求11所述的基因编辑系统,其特征在于,所述靶核酸包括DNA;
优选地,所述DNA包括来源于真核生物的DNA或来源于原核生物的DNA;
优选地,所述真核生物包括动物或植物;
优选地,所述DNA包括非人类哺乳动物DNA、人类DNA、昆虫DNA、鸟类DNA、爬行动物DNA、两栖动物DNA、啮齿动物DNA、鱼类DNA、蠕虫DNA、线虫DNA或酵母DNA;
优选地,所述非人类哺乳动物DNA包括非人类灵长类DNA。
15.根据权利要求11所述的基因编辑系统,其特征在于,所述直接重复序列的3’端包含茎环结构,所述茎环结构包括依次连接的第一茎核苷酸链、环核苷酸链和第二茎核苷酸链,所述第一茎核苷酸链和所述第二茎核苷酸链彼此杂交形成所述茎环结构的茎,所述环核苷酸链形成所述茎环结构的环;
优选地,所述第一茎核苷酸链的长度为5或6个核苷酸;
优选地,所述第二茎核苷酸链的长度为5个核苷酸;
优选地,所述环核苷酸链的长度为6、7或8个核苷酸。
16.根据权利要求15所述的基因编辑系统,其特征在于,所述茎环结构包括SEQ ID NO:25、28、31、34或37所述的核苷酸序列。
17.根据权利要求11所述的基因编辑系统,其特征在于,所述直接重复序列包括与SEQIDNO:24、27、30、33或36所述的核苷酸序列具有至少80%同一性的核苷酸序列;
优选地,所述直接重复序列包括与SEQ ID NO:24、27、30、33或36所述的核苷酸序列具有至少85%以上,更优选90%以上,进一步优选95%以上同一性的核苷酸序列;
优选地,所述直接重复序列包括SEQ ID NO:24、27、30、33或36所述的核苷酸序列。
18.根据权利要求11所述的基因编辑系统,其特征在于,所述间隔子序列的80%以上与所述靶核酸互补;
优选地,所述间隔子序列的90%以上,更优选95%以上,进一步优选99%以上,更进一步优选100%与所述靶核酸互补;
优选地,所述间隔子序列的长度为18-41nt;
优选地,所述间隔子序列的长度为18-37nt;
优选地,所述间隔子序列长度为18-26或34-36nt;
优选地,所述间隔子序列长度为20nt。
19.根据权利要求11所述的基因编辑系统,其特征在于,所述直接重复序列包括第一直接重复序列和第二直接重复序列;
优选地,所述RNA指导物包括按顺序依次连接的所述第一直接重复序列、所述间隔子序列以及所述第二直接重复序列;
优选地,所述第一直接重复序列与所述第二直接重复序列相同。
20.根据权利要求11所述的基因编辑系统,其特征在于,所述靶核酸包含前间隔子相邻基序,所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白能够识别所述前间隔子相邻基序,所述前间隔子相邻基序包含核酸序列5’-TTN-3’,其中N是任何核苷酸;
优选地,所述N为A、C或T。
21.根据权利要求11所述的基因编辑系统,其特征在于,CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白,与所述RNA指导物结合,形成蛋白-核酸复合物;
优选地,所述蛋白-核酸复合物是非天然存在的或经修饰的;
优选地,所述蛋白-核酸复合物中的至少一个组分是非天然存在的或经修饰的。
22.根据权利要求11所述的基因编辑系统,其特征在于,通过所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白和所述RNA指导物对所述靶核酸的所述靶向作用,对所述靶核酸进行修饰;
优选地,所述修饰包括切割或切口;
优选地,所述修饰导致:
(1)细胞包含至少一种基因产物表达的改变;或
(2)所述细胞包含至少一种基因产物的表达的改变,其中所述至少一种基因产物的表达增加;或
(3)所述细胞包含至少一种基因产物的表达的改变,其中所述至少一种基因产物的表达减少;或
(4)所述细胞包含经编辑的基因组;
优选地,所述修饰导致细胞毒性;
优选地,上述修饰导致抑制基因表达、降低基因表达或增强基因表达。
23.根据权利要求11所述的基因编辑系统,其特征在于,所述基因编辑系统包括目标核酸或编码所述目标核酸的核酸,所述目标核酸包括同源臂片段和供体模板核酸;
优选地,所述目标核酸包含能够与所述间隔子序列杂交的序列;
优选地,所述同源臂片段包括5’同源臂和3’同源臂,所述目标核酸由所述5’同源臂、所述供体模板核酸和所述3’同源臂顺序连接组成。
24.根据权利要求11所述的基因编辑系统,其特征在于,所述基因编辑系统以可递送的形式存在,利用递送系统使所述基因编辑系统与所述靶核酸接触;
优选地,所述递送系统将所述基因编辑系统递送入含有所述靶核酸的细胞中;
优选地,所述可递送的形式包括纳米颗粒、脂质体、外泌体、微泡、蛋白衣壳或基因枪所用的颗粒。
25.一种基因编辑载体,其特征在于,所述基因编辑载体包含权利要求11至24中任一项所述的基因编辑系统中的编码所述RNA指导物的核酸。
26.根据权利要求25所述的基因编辑载体,其特征在于,所述基因编辑载体还包含权利要求6或7所述的DNA分子;
优选地,所述DNA分子与编码所述RNA指导物的核酸位于相同或不同的载体上;
优选地,所述DNA分子与第一调节元件连接;
优选地,编码所述RNA指导物的核酸与第二调节元件连接;
优选地,所述第一调节元件和所述第二调节元件分别独立选自诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种;
优选地,所述第一调节元件和所述第二调节元件分别独立选自T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种。
27.一种权利要求11至24中任一项所述的基因编辑系统与细胞中靶核酸结合的方法,其特征在于,所述方法包括:
将所述基因编辑系统递送至所述细胞中,所述细胞包括所述靶核酸;
使所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白,与所述RNA指导物结合,
使所述间隔子序列与所述靶核酸结合。
28.根据权利要求27所述的方法,其特征在于,所述靶核酸为双链DNA或单链DNA;
优选地,所述基因编辑系统与所述细胞中靶核酸的结合,导致所述靶核酸的表达状态改变;
优选地,所述基因编辑系统与所述细胞中靶核酸的结合,导致所述靶核酸被切割;
优选地,所述靶核酸被切割导致靶核酸破坏、或靶核酸特定位点替换、或靶核酸位点的移除、或靶核酸区域功能的改变、或靶核酸上两个位点之间的序列倒置。
29.一种含有基因编辑系统的细胞,其特征在于,所述含有基因编辑系统的细胞包括权利要求11至24中任一项所述的基因编辑系统、或权利要求25或26所述的基因编辑载体。
30.根据权利要求29所述的含有基因编辑系统的细胞,其特征在于,所述含有基因编辑系统的细胞包含经修饰的目的靶基因座,所述目的靶基因座为利用所述基因编辑系统修饰的基因座;
优选地,所述目的靶基因座的所述修饰导致:
(1)所述含有基因编辑系统的细胞包含至少一种基因产物的表达的改变;或
(2)所述含有基因编辑系统的细胞包含至少一种基因产物的表达的改变,其中所述至少一种基因产物的表达增加;或
(3)所述含有基因编辑系统的细胞包含至少一种基因产物的表达的改变,其中所述至少一种基因产物的表达减少;或
(4)所述含有基因编辑系统的细胞包含经编辑的基因组;
优选地,所述含有基因编辑系统的细胞包括真核细胞或原核细胞;
优选地,所述真核细胞包括动物细胞、植物细胞或人类细胞;
优选地,所述动物细胞包括哺乳动物细胞。
31.一种靶向和编辑靶核酸的方法,其特征在于,所述方法包括使所述靶核酸与权利要求11至24中任一项所述的基因编辑系统接触。
32.一种在识别靶核酸后非特异性降解单链DNA的方法,其特征在于,所述方法包括使所述靶核酸与权利要求11至24中任一项所述的基因编辑系统接触。
33.一种在识别双链靶DNA的间隔子互补链后靶向所述双链靶DNA的非间隔子互补链并使其产生切口的方法,其特征在于,所述方法包括使所述双链靶DNA与权利要求11至24中任一项所述的基因编辑系统接触。
34.一种靶向和切割双链靶DNA的方法,其特征在于,所述方法包括使所述双链靶DNA与权利要求11至24中任一项所述的基因编辑系统接触。
35.根据权利要求34所述的方法,其特征在于,在使所述双链DNA的间隔子互补链产生切口之前,使所述双链靶DNA的非间隔子互补链产生切口。
36.一种特异性编辑双链核酸的方法,其特征在于,
所述方法包括在充分的条件下使以下进行接触充分的时间量,
(1)权利要求11至24中任一项所述的CRISPR-Cas效应子蛋白、或权利要求4或5所述的CRISPR-Cas效应子融合蛋白、另一具有序列特异性切口活性的酶,以及所述RNA指导物,所述RNA指导物指导所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白,相对于所述另一序列特异性切口酶的活性使相对链产生切口;以及
(2)所述双链核酸;
所述方法导致双链断裂的形成。
37.一种编辑双链核酸的方法,其特征在于,所述方法包括在充分的条件下使以下进行接触充分的时间量:
(1)权利要求11至24中任一项所述的CRISPR-Cas效应子蛋白、或权利要求4或5所述的CRISPR-Cas效应子融合蛋白,和具有DNA修饰活性的蛋白质结构域的融合蛋白,以及靶向所述双链核酸的所述RNA指导物;以及
(2)所述双链核酸;
所述融合蛋白的CRISPR-Cas效应子被修饰以使所述双链核酸的非靶链产生切口。
38.根据权利要求37所述的方法,其特征在于,所述双链核酸的两条链在不同的位点被切割,导致交错切割。
39.根据权利要求37所述的方法,其特征在于,所述双链核酸的两条链在同一位点被切割,导致平双链断裂。
40.一种靶向并切割单链靶DNA的方法,其特征在于,所述方法包括使靶核酸与权利要求11至24中任一项所述的基因编辑系统接触。
41.一种诱导细胞状态改变的方法,其特征在于,所述方法包括使权利要求11至24中任一项所述的基因编辑系统与细胞中的所述靶核酸接触。
42.根据权利要求41所述的方法,其特征在于,所述细胞状态包括凋亡或休眠;
优选地,所述细胞包括真核细胞或原核细胞;
优选地,所述细胞包括哺乳动物细胞或植物病变细胞;
优选地,所述细胞包括癌细胞;
优选地,所述细胞包括感染性细胞或被感染原感染的细胞;
优选地,所述细胞包括被病毒感染的细胞、被朊病毒感染的细胞;
优选地,所述细胞包括真菌细胞、原生动物或寄生虫细胞。
43.权利要求11至24中任一项所述的基因编辑系统在制备治疗受试者病症或疾病的药物中的应用。
44.根据权利要求43所述的应用,其特征在于,所述应用包括向所述受试者或所述受试者的离体细胞施用所述基因编辑系统;
优选地,所述间隔子序列与跟所述病症或疾病相关的所述靶核酸的至少15个核苷酸互补,所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白切割所述靶核酸;
优选地,所述病症或疾病包括癌症或感染性疾病;
优选地,所述癌症包括维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤或尿膀胱癌中的一种或多种;
优选地,所述病症或疾病包括囊性纤维化、进行性假肥大性肌营养不良、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、额颞叶痴呆、遗传性慢性肾脏病、高脂血症、高胆固醇血症、莱伯氏先天性黑蒙、镰状细胞病或β地中海贫血中的一种或多种;
优选地,所述感染性疾病的感染原包括人类免疫缺陷病毒、单纯疱疹病毒-1或单纯疱疹病毒-2中的一种或多种。
45.一种真核细胞系,其特征在于,所述真核细胞系包含权利要求29或30所述的含有基因编辑系统的细胞,或为所述含有基因编辑系统的细胞的后代。
46.一种多细胞生物体,其特征在于,所述多细胞生物体包含权利要求29或30所述的含有基因编辑系统的细胞。
47.根据权利要求46所述的多细胞生物体,其特征在于,所述多细胞生物体包括模型动物或模型植物。
48.一种获得目的性状的植物的方法,其特征在于,利用权利要求11至24中任一项所述的基因编辑系统与植物细胞接触,对所述植物细胞的基因进行修饰或引入目的基因,所述修饰或目的基因能够表达所述目的性状,获得修饰后的植物细胞,
利用所述修饰后的植物细胞进行再生,获得所述目的性状的植物。
49.一种鉴定植物中目的性状的方法,其特征在于,植物细胞中的目的基因能够表达所述目的性状,利用权利要求11至24中任一项所述的基因编辑系统与所述植物细胞接触,从而鉴定所述目的基因。
50.一种试剂盒,其特征在于,所述试剂盒包括一种或多种选自下列的组分:权利要求1至3中任一项所述的CRISPR-Cas效应子蛋白、权利要求4或5所述的CRISPR-Cas效应子融合蛋白、权利要求6或7所述的DNA分子、权利要求8或9所述的重组载体、权利要求10所述的宿主细胞、权利要求11至24所述的基因编辑系统、权利要求25或26所述的基因编辑载体、权利要求29或30所述的含有基因编辑系统的细胞、权利要求45所述的真核细胞系、权利要求46或47所述的多细胞生物体;
所述试剂盒的组分在相同或不同的容器中。
51.一种容器,其特征在于,所述容器包含权利要求50所述的试剂盒。
52.根据权利要求51所述的容器,其特征在于,所述容器包括无菌容器;
优选地,所述容器包括注射器。
53.一种可植入装置,其特征在于,所述可植入装置包括权利要求11至24中任一项所述的基因编辑系统。
54.根据权利要求53所述的可植入装置,其特征在于,所述基因编辑系统在基质内;
优选地,所述基因编辑系统在储库内。
CN202210681597.5A 2022-06-16 2022-06-16 CRISPR-Cas效应子蛋白、其基因编辑系统及应用 Active CN114921439B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210681597.5A CN114921439B (zh) 2022-06-16 2022-06-16 CRISPR-Cas效应子蛋白、其基因编辑系统及应用
PCT/CN2023/100529 WO2023241669A1 (zh) 2022-06-16 2023-06-15 CRISPR-Cas效应子蛋白、其基因编辑系统及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210681597.5A CN114921439B (zh) 2022-06-16 2022-06-16 CRISPR-Cas效应子蛋白、其基因编辑系统及应用

Publications (2)

Publication Number Publication Date
CN114921439A true CN114921439A (zh) 2022-08-19
CN114921439B CN114921439B (zh) 2024-04-26

Family

ID=82814195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210681597.5A Active CN114921439B (zh) 2022-06-16 2022-06-16 CRISPR-Cas效应子蛋白、其基因编辑系统及应用

Country Status (2)

Country Link
CN (1) CN114921439B (zh)
WO (1) WO2023241669A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023241669A1 (zh) * 2022-06-16 2023-12-21 尧唐(上海)生物科技有限公司 CRISPR-Cas效应子蛋白、其基因编辑系统及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112301018A (zh) * 2019-05-14 2021-02-02 深圳华大生命科学研究院 新型的Cas蛋白、Crispr-Cas系统及其在基因编辑领域中的用途
CN113308451A (zh) * 2020-12-07 2021-08-27 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
CN114015674A (zh) * 2021-11-02 2022-02-08 辉二(上海)生物科技有限公司 新型CRISPR-Cas12i系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230169449A (ko) * 2016-09-30 2023-12-15 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Rna-가이드된 핵산 변형 효소 및 이의 사용 방법
PT3765615T (pt) * 2018-03-14 2023-08-28 Arbor Biotechnologies Inc Novas enzimas e sistemas de direcionamento de dna crispr
CN113136375B (zh) * 2018-10-29 2023-01-06 中国农业大学 新型CRISPR/Cas12f酶和系统
CN114921439B (zh) * 2022-06-16 2024-04-26 尧唐(上海)生物科技有限公司 CRISPR-Cas效应子蛋白、其基因编辑系统及应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112301018A (zh) * 2019-05-14 2021-02-02 深圳华大生命科学研究院 新型的Cas蛋白、Crispr-Cas系统及其在基因编辑领域中的用途
CN113308451A (zh) * 2020-12-07 2021-08-27 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
CN114015674A (zh) * 2021-11-02 2022-02-08 辉二(上海)生物科技有限公司 新型CRISPR-Cas12i系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023241669A1 (zh) * 2022-06-16 2023-12-21 尧唐(上海)生物科技有限公司 CRISPR-Cas效应子蛋白、其基因编辑系统及应用

Also Published As

Publication number Publication date
WO2023241669A1 (zh) 2023-12-21
CN114921439B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN107058358B (zh) 一种双spacer序列识别切割CRISPR-Cas9载体构建及其在疣孢菌中的应用
JP2023082141A (ja) CasZ組成物及び使用方法
KR101897213B1 (ko) Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도
KR102530118B1 (ko) 유도 dna 결합 단백질 및 게놈 교란 도구 및 이의 적용
CN101939433B (zh) 酵母中生产乙酰-CoA的酶
CN102695796B (zh) 细胞、核酸、酶和它们用于生产槐糖脂的用途以及方法
KR102647766B1 (ko) 클래스 ii, 타입 v crispr 시스템
CN107189954A (zh) 由乙酸和甘油生产乙醇的工程化酵母菌株
CN108138155A (zh) 经由指导cas系统恢复非功能性基因产物的功能及使用方法
CN106755092A (zh) GLCCI1基因基于Cre‑LoxP条件性基因敲除小鼠模型构建试剂盒及构建方法
WO2014127287A1 (en) Method for in vivo tergated mutagenesis
CN110467679B (zh) 一种融合蛋白、碱基编辑工具和方法及其应用
CN106661573B (zh) 多核苷酸文库的重组酶介导的整合
KR20130138760A (ko) 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포
CN106687578B (zh) 螺旋藻中的靶向诱变
CN114934031B (zh) 新型Cas效应蛋白、基因编辑系统及用途
CN109825522A (zh) 一种无痕化双靶点基因组编辑系统
CN116083398B (zh) 分离的Cas13蛋白及其应用
CN114921439A (zh) CRISPR-Cas效应子蛋白、其基因编辑系统及应用
CN112301018B (zh) 新型的Cas蛋白、Crispr-Cas系统及其在基因编辑领域中的用途
KR20240017367A (ko) 클래스 ii, v형 crispr 시스템
WO2004033633A2 (en) Compatible host/vector systems for expression of dna
CN1875102B (zh) 新型质粒及其利用
CN114207125A (zh) 通过抑制条件性必需基因进行反向选择
CN112626116B (zh) 定点整合大片段外源dna的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant