CN116083400B - Cas蛋白截短体、构建其的方法及其应用 - Google Patents

Cas蛋白截短体、构建其的方法及其应用 Download PDF

Info

Publication number
CN116083400B
CN116083400B CN202211575384.0A CN202211575384A CN116083400B CN 116083400 B CN116083400 B CN 116083400B CN 202211575384 A CN202211575384 A CN 202211575384A CN 116083400 B CN116083400 B CN 116083400B
Authority
CN
China
Prior art keywords
protein
cas13
sequence
domain
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211575384.0A
Other languages
English (en)
Other versions
CN116083400A (zh
Inventor
梁峻彬
梁兴祥
孙阳
徐辉
李秋婷
杨正霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Xunzhi Biotechnology Co ltd
Guangzhou Ruifeng Biotechnology Co ltd
Original Assignee
Zhejiang Xunzhi Biotechnology Co ltd
Guangzhou Ruifeng Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Xunzhi Biotechnology Co ltd, Guangzhou Ruifeng Biotechnology Co ltd filed Critical Zhejiang Xunzhi Biotechnology Co ltd
Priority to CN202311442477.0A priority Critical patent/CN117701530A/zh
Priority to CN202211575384.0A priority patent/CN116083400B/zh
Publication of CN116083400A publication Critical patent/CN116083400A/zh
Application granted granted Critical
Publication of CN116083400B publication Critical patent/CN116083400B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15023Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15041Use of virus, viral particle or viral elements as a vector
    • C12N2740/15043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14123Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Virology (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种Cas蛋白截短体、构建其的方法及其应用。所述Cas13蛋白截短体由以下(1)‑(3)中任一种组成:(1)相对如SEQ ID NO:2所示的氨基酸序列存在缺失的截短体序列;(2)同源或异源蛋白结构域,以及(1)中所述截短体序列;(3)同源或异源蛋白结构域,(1)中所述截短体序列,以及用于连接所述蛋白结构域与所述截短体序列的连接序列。本发明的Cas蛋白截短体在保持编辑活性的同时大大减小了蛋白尺寸,便于AAV递送,具有广泛的应用前景。

Description

Cas蛋白截短体、构建其的方法及其应用
技术领域
本发明属于基因工程技术领域,具体涉及一种Cas蛋白截短体、构建其的方法及其应用。
背景技术
CRISPR-Cas13是一种基于细菌免疫系统的RNA靶向和编辑系统,可保护细菌免受病毒侵害。CRISPR-Cas13系统类似于CRISPR-Cas9系统,但与靶向DNA的Cas9蛋白不同,Cas13蛋白通常靶向RNA。
CRISPR-Cas13属于Type VI CRISPR系统,它包含一个单一的Cas13效应蛋白。目前,CRISPR-Cas13根据系统发育可分为多个亚型(如Cas13a、Cas13b、Cas13c和Cas13d)。然而,目前对于发现尺寸紧凑(例如,适用于AAV递送)和/或在哺乳动物细胞中编辑效率高(例如,RNA靶向/切割活性)的新Cas13系统仍存在迫切的需求。
发明内容
本发明所要解决的技术问题是现有技术中缺少小尺寸、高编辑效率的Cas蛋白,为此本发明提供了Cas蛋白截短体、构建其的方法及其应用。本发明的Cas蛋白截短体在具备编辑活性的同时大大减小了蛋白尺寸,便于AAV(腺相关病毒)递送,具有广泛的应用前景。
本发明具体通过以下技术方案解决上述技术问题。
本发明的第一方面提供一种构建Cas蛋白截短体的方法,所述方法包括将参比Cas蛋白的三维结构与晶体结构已知且为相同型(或亚型)的活性Cas蛋白的三维结构叠合,识别所述参比Cas蛋白与所述活性Cas蛋白的三维结构不一致的一个或更多个连续氨基酸序列,并人工缺失所述连续氨基酸序列中的一个或更多个氨基酸,得到所述Cas蛋白截短体;
所述三维结构不一致是指所述参比Cas蛋白与所述活性Cas蛋白在所述连续氨基酸序列上的α螺旋数量相差≥1个和/或β折叠数量相差≥1个。
本发明一些实施方案中,所述Cas蛋白截短体可与指导多核苷酸形成CRISPR复合物。进一步地,在一些实施方案中,所述指导多核苷酸可指导所述CRISPR复合物与靶核酸的序列特异性结合。
本发明一些实施方案中,所述连续氨基酸序列的长度为1-300aa。
本发明一些较佳实施方案中,所述连续氨基酸序列的长度为5-300aa、10-300aa、20-300aa、30-300aa、40-300aa、50-300aa、40-250aa、40-200aa、40-190aa、40-180aa、40-170aa、40-160aa、40-150aa、50-250aa、50-200aa、50-190aa、50-180aa、50-170aa、50-160aa或50-150aa。
本发明一些实施方案中,所述参比Cas蛋白为Cas9、Cas12或Cas13型。
本发明中,所述参比Cas蛋白的三维结构优选通过实验测定得到或程序预测得到。
本发明一些具体实施方案中,所述参比Cas蛋白为Cas9a、Cas9b、Cas9c、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12f、Cas12g、Cas12g、Cas12h、Cas12i、Cas12j、Cas12k、Cas13a、Cas13b、Cas13c或Cas13d亚型。
本发明一些具体实施方案中,所述参比Cas蛋白为Cas13b。
我们新近发现了2个高编辑活性的Cas13蛋白,即Cas13m.3、Cas13m.6。但Cas13m.3和Cas13m.6蛋白的尺寸不够小,不便于AAV递送。因此我们分别以Cas13m.3和Cas13m.6作为参比蛋白,设计多个截短体用于测试,筛选出了尺寸小且仍具有RNA编辑活性的截短体。
Cas13m.3序列为:
MYHLSDANHGKHIAGTYYEMAMGNFIHTLSHMLVRAGIKVNKLEDNYSIEREIMNLTAPGAYDAQRAALSRLLYRHFPFFGPIMADHTDHILSSKRKKVQSASDDGNLDLGQELKDEVAGASACQMIRYLATIAGALVYYRNMYSHKNHYDNAQDIAAQQEREQKLALWLDVVFRGARDILLTRKSHPQPDTDFLTQNGTINYYIEKNGKSAYNPNFYFKPGLKTDNGWVMTDFGKFFFCSLFLRRADAERFAAETDLYVGSPFKITAQERARLQEAENKRAADEQARASSAGFPHIVNPRTIGPSESPQNNIIREMLNMHRARIPRERRIDADMSEGILAMDIMNELRRCPLSLYNTLSPEAKASFEKTGVTPEGGIVSNLLVRHSDRYPELALRAIDQMELLPTIRFHVRLGSLRFRFYEKKLIDGSHTLRTVQKAVNGFGRWQEVEPRRVEKYTAIQARCQNDKGIDQFLPDSPTTTPYITDWRTTYNIHANRIGLAWNLPQMSDGIYLPNLDTDKGDNLHRKALIDMPAPMCYLSIFDLPALLFYCHIYTHYHGTKYHLPSAESIIQAKYDALHKFFSFAAAQNHSAEQLREKQLELNLADNEIPDKLRCMMQTKPFFKNGRQQLSPLGYPIMKNWIGVAEQRKHAAQVLRDVANEAADRLASFEKKHQRVVVGGRDNRYGRRGHADIRHGSLARYLATSMVRWQPALDQPGGDKLTSANHRALAGFLSEYGLHGSNINKLRNVLKEAGLIEGSHPHPFLAHVLESAPANIEALYVAYLKHEQSHATALKNKFTDRNGIVQPSEVPAFVRFNSSRWRNDSATTARRYLQTPPAPGSSDSAEHNAPIMLPDGLFTTHIMTLLNKVLGQNDRVPEEDYLRHDLPRIASIINPNGKTYGAAYIIRAWFDQVENQDVQPFYDLPRFYREISLLAPRRKPNQELIRDYFSEEQIAQKIQTVPKKQRSEKVGHTIDTEKDIRRYRLQDITLYLTLLDMLTLMLSRNEAERTDRQMKSSTAERVSNMRLVDFDHSFDFDLLGSTSGEAAYSYLHQRSGITISMPALSLRSYGSIFRVLADSRFETLMDALNRQGVTHVNFGDITSELALYDTLRSHFLLQAHNVEQDAFSAKRGVLENHTSPFFYRSGNLQLDDQGNITNPSTDAIRNHYGELIKILDRYSLKIDKKTKDGKSQDILLRDLMAELRNAAAHNRYPKADFFFRQFDHFLNTCKPTDSNLTAPNYIRTVLEFLKSIVDNNFTPLLHEESPENESKSE(SEQ ID NO:2)。
Cas13m.6序列为:
MKEQKKFSLQGVRHVCGSYFNMALNNYCRTLNGVFIKCKIKFALKEDDFPRSLSSLRKIFSSGPIMPQTEKKVAKMIASVDTAMKLKQQLFKHFPMLGPIMDKTISCMNHHKGSSVADAPLDLCMNAILNFGECLYHCRNFYTHFKPYNSPEDLKLQYDIQHIIALNLGTLFDVSRRIGKKREGLTPEELEFLTGKNRFNQVGKKFLERNDWYLKIEKPSDMKDYDKTILSDFGMVYLCSIFLAKNYALRLFDESKLFNKETIRNLFSEEQVRFLKEMLVIYRIRTPRGKQLDSHDSKQALAMDMLNELRKCPRPLYDVLSEEYKKRTFYVPVEHENEKTEEYVKMLRSDDRFPYFTLRYIDDMEKFSRIRFQIRLGSYRFKFYDKMNIDGTPRIRSLQKEINGFGRLSDMENKRKREWKDMFQATEEIDYEDQFGDYQTGVTQFVEDTADTKPYVTNHRAAYNVHSNHIGLIWNDADSIILQDDNKLFFPDLKIDENGKADIYQPSPKASLSVFDFPAMVFYMYLREKTEATKEFPSAEQLIINKYDHLVRFFKDISDGRFGPSENKNAFSKKLKEEYDLKTGEIPEKLLHWLSSESEEDPSEKYAKKLEEEIKLRRERVQRRLEKFNQDLREIRKKDSVPYGKKGHVNIRHSQLAKYLMRSIMEWQPTRNDGKNKLTGQNFNVMTAFLATLGYTSQVKDLRDLFSRANMLEGPNAHPFLKKVLNNNSIKDIQGFYRTYLVEELNQIEDKQRRIAKAKNVKDTVRQFPFAHFNRMRYQKRDEDYYRNLAKRYLNIGDNEKDKAVILLPDGMFTSYIYDLIMKLPENNEKMRINLASDVAHCNSSFLISRFFENIRNDYAQPFYREERTYELFSILNNKKVRNTLQPLFISPHDINIQLTEKEKDGKGRLILQKIDHFCKSITQKGNFNNVEEAKEATSRKLKHLITDCKNNERDIRRYKTQDMVIYLMARDILKDIIPDSEKDKYAKDRKLLLKDVCEEGFLRQAVKMEYEYSIEEKGKRTRTVKITHPNMSLKNYGEFHRLLNDERLKSLLQQLANMDEIDYTDLMGEFADYDQKRSEIFRLAQSIEKHLYEQNEQGLNDEKSDLFYHTRYNGKKIPRRNSFSSLLELIGEEESQMTETDKKQTISIRNAFGHNTYKVSLAEMNATELPNVAKTILKKMEELRNKL(SEQ ID NO:4)。
因此,在本发明一些具体实施方案中,所述参比Cas蛋白包含SEQ ID NO:2所示的序列。本发明一些具体实施方案中,所述参比Cas蛋白包含SEQ ID NO:4所示的序列。
本发明一些具体实施方案中,所述参比Cas蛋白由SEQ ID NO:2所示的序列组成。本发明一些具体实施方案中,所述参比Cas蛋白由SEQ ID NO:4所示的序列组成。
令人惊讶的是,本发明的部分截短体虽然相比全长Cas13蛋白缺失了Rx4H(RxxxxH)基序(x代表任意氨基酸残基),但仍有可检测的敲降活性。不受理论约束地,发明人推测,有可能是因为所缺失的Rx4H基序并不是所述Cas13蛋白催化中心的Rx4H基序;或者,所缺失的虽然是催化中心的Rx4H基序,但蛋白中其他Rx4-6H(4-6个x)基序产生了某种未知的替代机制。
本发明的第二方面提供一种Cas13蛋白,所述Cas13蛋白包含相对如SEQ ID NO:2所示的氨基酸序列存在一个或更多个氨基酸序列的缺失的序列(即截短体序列),或者,所述Cas13蛋白由相对如SEQ ID NO:2所示的氨基酸序列存在一个或更多个氨基酸序列的缺失的序列(即截短体序列)组成。
本发明一些实施方案中,所述Cas13蛋白由以下(1)-(3)中的任一种组成:
(1)相对如SEQ ID NO:2所示的氨基酸序列存在选自第623-772位、第773-922位、第923-1072位、第623-1072位、第923-972位、第973-1022位、第1023-1072位、第973-1072位、第623-672位、第673-722位、第723-772位、第773-822位、第823-872位、第873-922位、第1127-1272位、第994-1107位、第726-827位、第263-315位、第82-132位、第187-243位、第610-661位、第593-658位和第810-905位的任一种缺失的截短体序列;
(2)同源或异源蛋白结构域,以及(1)中所述截短体序列;
(3)同源或异源蛋白结构域,(1)中所述截短体序列,以及用于连接所述蛋白结构域与所述截短体序列的连接序列。
本发明一些实施方案中,所述Cas13蛋白可与指导多核苷酸形成CRISPR复合物;可选地,所述指导多核苷酸可指导所述CRISPR复合物与靶核酸的序列特异性结合。
本发明一些实施方案中,所述Cas13蛋白进一步包含融合的同源或异源蛋白结构域,且融合后不改变Cas13蛋白的原有功能。本发明一些实施方案中,所述同源或异源蛋白结构域为核定位信号(NLS)。本发明一些实施方案中,所述同源或异源蛋白结构域为核输出信号(NES)。本发明一些实施方案中,所述同源或异源蛋白结构域还可任选自:脱氨酶结构域、翻译激活结构域、翻译抑制结构域、RNA甲基化结构域、RNA去甲基化结构域、核酸酶结构域、剪接因子结构域、报告标签以及亲和标签中的一种或更多种。本发明一些实施方案中,所述同源或异源蛋白结构域为胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。本发明一些实施方案中,所述Cas13蛋白中同源或异源蛋白结构域为共价连接;可选地,所述Cas13蛋白中同源或异源蛋白结构域为通过连接序列共价连接,或不通过连接序列共价连接;进一步可选地,所述连接序列为氨基酸序列;再进一步可选地,所述连接序列的长度为1-100个氨基酸、1-50个氨基酸、1-40个氨基酸、1-30个氨基酸、1-20个氨基酸、2-15个氨基酸、1-10个氨基酸、1-9个氨基酸、1-8个氨基酸、1-7个氨基酸、1-6个氨基酸、1-5个氨基酸或1-4个氨基酸。
本发明的一些实施方案中,所述Cas蛋白包含≥1个、≥2个、≥3个、≥4个、≥5个、≥6个或≥7个相同或不同的同源或异源蛋白结构域。
本发明的一些实施方案中,所述Cas蛋白包含1个、2个、3个、4个、5个、6个、7个或更多个相同或不同的同源或异源蛋白结构域。在一些实施方案中,所述同源或异源蛋白结构域位于所述Cas13蛋白的N端和/或C端。
本发明一些实施方案中,所述CRISPR复合物在细胞中对AQp1 RNA的敲降效率为≥5%、≥10%、≥20%、≥30%、≥40%、≥50%、≥60%、≥70%、≥80%或≥90%;可选地,所述细胞为过表达AQp1基因的细胞。
本发明一些实施方案中,所述缺失的氨基酸序列的长度为1-300aa。
本发明一些具体实施方案中,所述缺失的氨基酸序列的长度为5-300aa、10-300aa、20-300aa、30-300aa、40-300aa、50-300aa、40-250aa、40-200aa、40-190aa、40-180aa、40-170aa、40-160aa、40-150aa、50-250aa、50-200aa、50-190aa、50-180aa、50-170aa、50-160aa或50-150aa。
本发明一些实施方案中,所述缺失的区域位于SEQ ID NO:2所示序列的第82位至第1272位氨基酸之间。
本发明一些较佳实施方案中,所述缺失的区域位于SEQ ID NO:2所示序列的第593位至第1107位氨基酸之间。
本发明一些具体实施方案中,所述缺失的区域位于SEQ ID NO:2所示序列的第823位至第1072位氨基酸之间。
本发明一些具体实施方案中,所述缺失的区域位于SEQ ID NO:2所示序列的第922位至第1072位氨基酸之间。
本发明一些实施方案中,所述缺失的区域可以为SEQ ID NO:2中一段连续的序列(即存在一个氨基酸序列的缺失),或者两段或以上不连续的序列(即存在两个或更多个氨基酸序列的缺失)。
本发明的第三方面提供一种Cas13蛋白,所述Cas13蛋白包含相对如SEQ ID NO:4所示的氨基酸序列存在一个或更多个氨基酸序列的缺失的序列(即截短体序列),或者,所述Cas13蛋白由相对如SEQ ID NO:4所示的氨基酸序列存在一个或更多个氨基酸序列的缺失的序列(即截短体序列)组成。
本发明一些实施方案中,所述Cas13蛋白由以下(1)-(3)中的任一种组成:
(1)相对如SEQ ID NO:4所示的氨基酸序列存在选自第602-701位、第702-801位、第802-901位、第602-901位、第602-651位、第652-701位、第802-851位、第852-901位、第1087-1188位、第651-766位、第879-950位、第528-606位、第172-279位、第812-867位和第106-170位的任一种缺失的截短体序列;
(2)同源或异源蛋白结构域,以及(1)中所述截短体序列;
(3)同源或异源蛋白结构域,(1)中所述截短体序列,以及用于连接所述蛋白结构域与所述截短体序列的连接序列。
本发明一些实施方案中,所述Cas13蛋白由以下(1)-(3)中的任一种组成:
(1)相对如SEQ ID NO:4所示的氨基酸序列存在选自第1087-1188位、第651-766位、第879-950位、第528-606位、第172-279位、第812-867位和第106-170位的任一种缺失的截短体序列;
(2)同源或异源蛋白结构域,以及(1)中所述截短体序列;
(3)同源或异源蛋白结构域,(1)中所述截短体序列,以及用于连接所述蛋白结构域与所述截短体序列的连接序列。
本发明一些实施方案中,所述Cas13蛋白可与指导多核苷酸形成CRISPR复合物;可选地,所述指导多核苷酸可指导所述CRISPR复合物与靶核酸的序列特异性结合。
本发明一些实施方案中,所述Cas13蛋白进一步包含融合的同源或异源蛋白结构域,且融合后不改变Cas13蛋白的原有功能。本发明一些实施方案中,所述同源或异源蛋白结构域为核定位信号(NLS)。本发明一些实施方案中,所述同源或异源蛋白结构域为核输出信号(NES)。本发明一些实施方案中,所述同源或异源蛋白结构域还可任选自:脱氨酶结构域、翻译激活结构域、翻译抑制结构域、RNA甲基化结构域、RNA去甲基化结构域、核酸酶结构域、剪接因子结构域,以及报告标签或亲和标签或报告域或亲和域中的一种或更多种。本发明一些实施方案中,所述同源或异源蛋白结构域为胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。本发明一些实施方案中,所述Cas13蛋白中同源或异源蛋白结构域为共价连接;可选地,所述Cas13蛋白中同源或异源蛋白结构域为通过连接序列共价连接,或不通过连接序列共价连接;进一步可选地,所述连接序列为氨基酸序列;再进一步可选地,所述连接序列的长度为1-100个氨基酸、1-50个氨基酸、1-40个氨基酸、1-30个氨基酸、1-20个氨基酸、2-15个氨基酸、1-10个氨基酸、1-9个氨基酸、1-8个氨基酸、1-7个氨基酸、1-6个氨基酸、1-5个氨基酸或1-4个氨基酸。
本发明的一些实施方案中,所述Cas蛋白包含≥1个、≥2个、≥3个、≥4个、≥5个、≥6个或≥7个相同或不同的同源或异源蛋白结构域。
本发明的一些实施方案中,所述Cas蛋白包含1个、2个、3个、4个、5个、6个、7个或更多个相同或不同的同源或异源蛋白结构域。在一些实施方案中,所述同源或异源蛋白结构域位于所述Cas13蛋白的N端和/或C端。
本发明一些实施方案中,所述CRISPR复合物在细胞中对AQp1 RNA的敲降效率为≥5%、≥10%、≥20%、≥30%、≥40%、≥50%、≥60%、≥70%、≥80%或≥90%;可选地,所述细胞为过表达AQp1基因的细胞。
本发明一些实施方案中,所述缺失的氨基酸序列的长度为1-300aa。
本发明一些具体实施方案中,所述缺失的氨基酸序列的长度为5-300aa、10-300aa、20-300aa、30-300aa、40-300aa、50-300aa、40-250aa、40-200aa、40-190aa、40-180aa、40-170aa、40-160aa、40-150aa、50-250aa、50-200aa、50-190aa、50-180aa、50-170aa、50-160aa、50-150aa、50-140aa、50-130aa、50-120aa、50-110aa、50-100aa、50-90aa、50-80aa、50-70aa或50-60aa。
本发明一些实施方案中,所述缺失的区域位于SEQ ID NO:4所示序列的第106位至第1188位氨基酸之间。
本发明一些具体实施方案中,所述缺失的区域位于SEQ ID NO:4所示序列的第528位至第950位氨基酸之间。
本发明一些具体实施方案中,所述缺失的区域位于SEQ ID NO:4所示序列的第528位至第867位氨基酸之间。
本发明一些具体实施方案中,所述缺失的区域位于SEQ ID NO:4所示序列的第766位至第901位氨基酸之间。
本发明一些具体实施方案中,所述缺失的区域位于SEQ ID NO:4所示序列的第802位至第901位氨基酸之间。
本发明一些实施方案中,所述缺失的区域可以为SEQ ID NO:4中一段连续的序列(即存在一个氨基酸序列的缺失),或者两段或以上不连续的序列(即存在两个或更多个氨基酸序列的缺失)。
本发明的第四方面提供一种Cas13蛋白,所述Cas13蛋白包含相对如SEQ ID NO:2所示的氨基酸序列存在选自第623-772位、第773-922位、第923-1072位、第623-1072位、第923-972位、第973-1022位、第1023-1072位、第973-1072位、第623-672位、第673-722位、第723-772位、第773-822位、第823-872位、第873-922位、第1127-1272位、第994-1107位、第726-827位、第263-315位、第82-132位、第187-243位、第610-661位、第593-658位和第810-905位的任一种或更多种缺失的截短体序列,或者,所述Cas13蛋白包含与所述截短体序列的序列同一性≥50%、≥60%、≥70%、≥80%、≥85%、≥90%、≥91%、≥92%、≥93%、≥94%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%,且<100%的序列(即截短体的相似序列)。可选地,所述Cas13蛋白进一步包含同源或异源蛋白结构域。
在一些实施方案中,所述Cas13蛋白由以下(1)-(4)中的任一种组成:
(1)相对如SEQ ID NO:2所示的氨基酸序列存在选自第623-772位、第773-922位、第923-1072位、第623-1072位、第923-972位、第973-1022位、第1023-1072位、第973-1072位、第623-672位、第673-722位、第723-772位、第773-822位、第823-872位、第873-922位、第1127-1272位、第994-1107位、第726-827位、第263-315位、第82-132位、第187-243位、第610-661位、第593-658位和第810-905位的任一种或更多种缺失的截短体序列;
(2)与(1)中所述截短体序列的序列同一性≥50%、≥60%、≥70%、≥80%、≥85%、≥90%、≥91%、≥92%、≥93%、≥94%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%,且<100%的序列(即截短体的相似序列);
(3)同源或异源蛋白结构域,以及(1)或(2)中所述序列;
或者,
(4)同源或异源蛋白结构域,(1)或(2)中所述序列,以及用于连接所述蛋白结构域与(1)或(2)中所述序列的连接序列。
在一些实施方案中,所述Cas13蛋白可与指导多核苷酸形成CRISPR复合物;可选地,所述指导多核苷酸可指导所述CRISPR复合物与靶核酸的序列特异性结合。在一些实施方案中,所述CRISPR复合物在细胞中对AQp1 RNA的敲降效率为≥5%、≥10%、≥20%、≥30%、≥40%、≥50%、≥60%、≥70%、≥80%或≥90%;可选地,所述细胞为过表达AQp1基因的细胞。
在一些实施方案中,所述同源或异源蛋白结构域不改变所述截短体序列或截短体相似序列的原有功能;非限制性示例例如同源或异源蛋白结构域的存在不会使所述截短体序列或截短体相似序列的RNA编辑活性丧失,例如不会使RNA切割活性丧失。
本发明的一些实施方案中,所述截短体序列或截短体相似序列与同源或异源蛋白结构域共价连接;可选地,所述Cas13蛋白中同源或异源蛋白结构域为通过连接序列共价连接,或不通过连接序列共价连接;进一步可选地,所述连接序列为氨基酸序列;再进一步可选地,所述连接序列的长度为1-100个氨基酸、1-50个氨基酸、1-40个氨基酸、1-30个氨基酸、1-20个氨基酸、2-15个氨基酸、1-10个氨基酸、1-9个氨基酸、1-8个氨基酸、1-7个氨基酸、1-6个氨基酸、1-5个氨基酸或1-4个氨基酸。在一些实施方案中,所述同源或异源蛋白结构域为同源或异源核定位信号(NLS)。在一些实施方案中,所述同源或异源蛋白结构域为同源或异源核输出信号(NES)。在一些实施方案中,所述同源或异源蛋白结构域选自:脱氨酶结构域、翻译激活结构域、翻译抑制结构域、RNA甲基化结构域、RNA去甲基化结构域、核酸酶结构域、剪接因子结构域,以及报告标签或亲和标签或报告域或亲和域。在一些实施方案中,所述同源或异源蛋白结构域为胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。
本发明的一些实施方案中,所述Cas蛋白包含≥1个、≥2个、≥3个、≥4个、≥5个、≥6个或≥7个相同或不同的同源或异源蛋白结构域。
本发明的一些实施方案中,所述Cas蛋白包含1个、2个、3个、4个、5个、6个、7个或更多个相同或不同的同源或异源蛋白结构域。在一些实施方案中,所述同源或异源蛋白结构域位于所述Cas13蛋白的N端和/或C端。
本发明的第五方面提供一种Cas13蛋白,所述Cas13蛋白包含相对如SEQ ID NO:4所示的氨基酸序列存在选自第602-701位、第702-801位、第802-901位、第602-901位、第602-651位、第652-701位、第802-851位、第852-901位、第1087-1188位、第651-766位、第879-950位、第528-606位、第172-279位、第812-867位和第106-170位的任一种或更多种缺失的截短体序列,或者,所述Cas13蛋白包含与所述截短体序列的序列同一性≥50%、≥60%、≥70%、≥80%、≥85%、≥90%、≥91%、≥92%、≥93%、≥94%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%,且<100%的序列(即截短体的相似序列)。可选地,所述Cas13蛋白进一步包含同源或异源蛋白结构域。
在一些实施方案中,所述Cas13蛋白由以下(1)-(4)中的任一种组成:
(1)相对如SEQ ID NO:4所示的氨基酸序列存在选自第602-701位、第702-801位、第802-901位、第602-901位、第602-651位、第652-701位、第802-851位、第852-901位、第1087-1188位、第651-766位、第879-950位、第528-606位、第172-279位、第812-867位和第106-170位的任一种或更多种缺失的截短体序列;
(2)与(1)中所述截短体序列的序列同一性≥50%、≥60%、≥70%、≥80%、≥85%、≥90%、≥91%、≥92%、≥93%、≥94%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%,且<100%的序列(即截短体的相似序列);
(3)同源或异源蛋白结构域,以及(1)或(2)中所述序列;
或者,
(4)同源或异源蛋白结构域,(1)或(2)中所述序列,以及用于连接所述蛋白结构域与(1)或(2)中所述序列的连接序列。
在一些实施方案中,所述Cas13蛋白包含相对如SEQ ID NO:4所示的氨基酸序列存在选自第1087-1188位、第651-766位、第879-950位、第528-606位、第172-279位、第812-867位和第106-170位的任一种或更多种缺失的截短体序列,或者,所述Cas13蛋白包含与所述截短体序列的序列同一性≥50%、≥60%、≥70%、≥80%、≥85%、≥90%、≥91%、≥92%、≥93%、≥94%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%的序列(即截短体的相似序列)。可选地,所述Cas13蛋白进一步包含同源或异源蛋白结构域。
在一些实施方案中,所述Cas13蛋白由以下(1)-(4)中的任一种组成:
(1)相对如SEQ ID NO:4所示的氨基酸序列存在选自第1087-1188位、第651-766位、第879-950位、第528-606位、第172-279位、第812-867位和第106-170位的任一种或更多种缺失的截短体序列;
(2)与(1)中所述截短体序列的序列同一性≥50%、≥60%、≥70%、≥80%、≥85%、≥90%、≥91%、≥92%、≥93%、≥94%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%,且<100%的序列(即截短体的相似序列);
(3)同源或异源蛋白结构域,以及(1)或(2)中所述序列;
或者,
(4)同源或异源蛋白结构域,(1)或(2)中所述序列,以及用于连接所述蛋白结构域与(1)或(2)中所述序列的连接序列。
在一些实施方案中,所述Cas13蛋白可与指导多核苷酸形成CRISPR复合物;可选地,所述指导多核苷酸可指导所述CRISPR复合物与靶核酸的序列特异性结合。在一些实施方案中,所述CRISPR复合物在细胞中对AQp1 RNA的敲降效率为≥5%、≥10%、≥20%、≥30%、≥40%、≥50%、≥60%、≥70%、≥80%或≥90%;可选地,所述细胞为过表达AQp1基因的细胞。
在一些实施方案中,所述同源或异源蛋白结构域不改变所述截短体序列或截短体相似序列的原有功能;非限制性示例例如同源或异源蛋白结构域的存在不会使所述截短体序列或截短体相似序列的RNA编辑活性丧失,例如不会使RNA切割活性丧失。
在一些实施方案中,所述截短体序列或截短体相似序列与同源或异源蛋白结构域共价连接;可选地,所述Cas13蛋白中同源或异源蛋白结构域为通过连接序列共价连接,或不通过连接序列共价连接;进一步可选地,所述连接序列为氨基酸序列;再进一步可选地,所述连接序列的长度为1-100个氨基酸、1-50个氨基酸、1-40个氨基酸、1-30个氨基酸、1-20个氨基酸、2-15个氨基酸、1-10个氨基酸、1-9个氨基酸、1-8个氨基酸、1-7个氨基酸、1-6个氨基酸、1-5个氨基酸或1-4个氨基酸。在一些实施方案中,所述同源或异源蛋白结构域为同源或异源核定位信号(NLS)。在一些实施方案中,所述同源或异源蛋白结构域为同源或异源核输出信号(NES)。在一些实施方案中,所述同源或异源蛋白结构域选自:脱氨酶结构域、翻译激活结构域、翻译抑制结构域、RNA甲基化结构域、RNA去甲基化结构域、核酸酶结构域、剪接因子结构域,以及报告标签或亲和标签或报告域或亲和域中的一种或更多种。在一些实施方案中,所述同源或异源蛋白结构域为胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。
本发明的一些实施方案中,所述Cas蛋白包含1个、2个、3个、4个、5个、6个、7个或更多个相同或不同的同源或异源蛋白结构域。在一些实施方案中,所述同源或异源蛋白结构域位于所述Cas13蛋白的N端和/或C端。
本发明的第六方面提供一种多核苷酸,所述多核苷酸编码如第二方面、第三方面、第四方面或第五方面所述的Cas13蛋白。
本发明的第七方面提供一种CRISPR-Cas13系统,所述CRISPR-Cas13系统包含:
如第二方面、第三方面、第四方面或第五方面所述的Cas13蛋白或如第六方面所述的多核苷酸;以及
指导多核苷酸或编码所述指导多核苷酸的核酸,所述指导多核苷酸包含连接至指导序列的同向重复序列,所述指导序列被工程化以与靶核苷酸杂交;
所述指导多核苷酸能够与所述Cas13蛋白形成CRISPR复合物,可选地,所述指导多核苷酸可指导所述CRISPR复合物与靶核苷酸的序列特异性结合。
本发明的第八方面提供一种包含如第七方面所述的CRISPR-Cas13系统的载体系统,其中,所述载体系统包含一个或更多个载体,所述载体包含编码所述Cas13蛋白的多核苷酸序列和/或编码所述指导多核苷酸的多核苷酸序列。本发明的实施方案中,所述载体系统包含编码所述Cas13蛋白的多核苷酸序列和编码所述指导多核苷酸的多核苷酸序列。本发明的一些实施方案中,所述编码Cas13蛋白的多核苷酸序列和编码指导多核苷酸的多核苷酸序列位于同一个载体上,或并不位于同一个载体上。
本发明的第九方面提供一种包含如第七方面所述的CRISPR-Cas13系统的腺相关病毒载体,其中,所述腺相关病毒载体包含编码所述Cas13蛋白和指导多核苷酸的DNA。
本发明的第十方面提供一种包含如第七方面所述的CRISPR-Cas13系统的脂质纳米粒,其中,所述脂质纳米粒包含所述的指导多核苷酸和编码所述Cas13蛋白的mRNA。
本发明的第十一方面提供一种包含如第七方面所述的CRISPR-Cas13系统的慢病毒载体,其中,所述慢病毒载体包含所述指导多核苷酸和编码所述Cas13蛋白的mRNA。
本发明一些实施方案中,所述慢病毒载体是用包膜蛋白假型化的;可选地,所述编码Cas13蛋白的mRNA与适体序列连接。
本发明的第十二方面提供一种包含如第七方面所述的CRISPR-Cas13系统的核糖核蛋白复合物,其中,所述核糖核蛋白复合物由所述指导多核苷酸和Cas13蛋白形成。
本发明的第十三方面提供一种包含如第七方面所述的CRISPR-Cas13系统的病毒样颗粒,其中,所述病毒样颗粒包含由所述指导多核苷酸和Cas13蛋白形成的核糖核蛋白复合物;可选地,所述Cas13蛋白与gag蛋白融合。
本发明的第十四方面提供一种真核细胞,所述真核细胞包含如第七方面所述的CRISPR-Cas13系统;可选地,所述真核细胞是哺乳动物细胞。
本发明的第十五方面提供一种药物组合物,所述药物组合物包含如第七方面所述的CRISPR-Cas13系统。
本发明的第十六方面提供一种体外组合物,所述体外组合物包含如第七方面所述的CRISPR-Cas13系统,以及不能与指导多核苷酸杂交的标记的detector RNA(RNA探针)。
本发明的第十七方面提供一种如第二方面、第三方面、第四方面或第五方面所述的Cas13蛋白、如第六方面所述的多核苷酸或如第七方面所述的CRISPR-Cas13系统在检测疑似包含靶核酸的核酸样品中的靶核酸或制备检测疑似包含靶核酸的核酸样品中的靶核酸的试剂中的用途。
本发明的第十八方面提供一种如第二方面、第三方面、第四方面或第五方面所述的Cas13蛋白、如第六方面所述的多核苷酸或如第七方面所述的CRISPR-Cas13系统在以下任一项或制备实现以下任一项方案的试剂中的用途:切割一种或多种靶核酸分子或使一种或多种靶核酸分子产生切口(nicking),激活或上调一种或多种靶核酸分子,激活或抑制一种或多种靶核酸分子的翻译,使一种或多种靶核酸分子失活,可视化、标记或检测一种或多种靶核酸分子,结合一种或多种靶核酸分子,运输一种或多种靶核酸分子,以及掩蔽一种或多种靶核酸分子。
在一些实施方案中,所述用途为切割一种或多种靶核酸分子的用途。在一些实施方案中,所述用途为制备实现切割一种或多种靶核酸分子的试剂中的用途。
本发明的第十九方面提供一种诊断、治疗或预防与靶核酸相关的疾病或病症的方法,包括向有需要的受试者的样品或向有需要的受试者施用如第二方面、第三方面、第四方面或第五方面所述的Cas13蛋白、如第六方面所述的多核苷酸或如第七方面所述的CRISPR-Cas13系统。
在一些实施方案中,所述与靶核酸相关的疾病或病症是指因靶核酸的异常表达(表达过高或过低)所导致的疾病或病症。
本发明的第二十方面提供一种如第二方面、第三方面、第四方面或第五方面所述的Cas13蛋白、如第六方面所述的多核苷酸或如第七方面所述的CRISPR-Cas13系统在制备用于诊断、治疗或预防与靶核酸相关的疾病或病症的药物中的用途。
在一些实施方案中,所述与靶核酸相关的疾病或病症是指因靶核酸的异常表达(表达过高或过低)所导致的疾病或病症。
本申请提及术语“Cas蛋白”时,目的在于指代CRISPR-Cas基因编辑系统中的Cas蛋白。提及Cas蛋白的“型”(TYPE)时,目的在于指代不同的Cas蛋白类别,例如Cas9、Cas12、Cas13、Cas1、Cas2和Cas4型等等。提及Cas蛋白的“亚型”(SUBTYPE)时,目的在于指代更细分的Cas蛋白类别,例如Cas9a、Cas9b、Cas9c、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12f、Cas12g、Cas12g、Cas12h、Cas12i、Cas12j、Cas12k、Cas13a、Cas13b、Cas13c或Cas13d亚型等等。
本发明中,指导多核苷酸指导CRISPR复合物与靶核酸(例如靶RNA)的序列特异性结合的能力可以通过任何合适的测定来评估。例如,可以将足以形成CRISPR复合物的CRISPR系统的组分,包括待测试的Cas蛋白截短体和指导多核苷酸,提供给具有相应靶核酸分子(例如靶RNA)的宿主细胞,例如通过编码CRISPR复合物的组分的载体的转染,然后评估靶序列内的优先切割。类似地,可以在试管中评估靶核酸序列的切割,方法是提供靶核酸、含待测试Cas蛋白截短体的CRISPR复合物的组分,并比较其和阴性对照组之间结合或切割靶核酸的能力、或结合或切割靶核酸的速率。
本发明中,术语截短体与截短蛋白可互换使用。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
本发明的Cas13蛋白在保持良好的编辑活性的同时大大减小了尺寸,便于AAV递送,具有广泛的应用前景。
附图说明
图1为实施例1设计的Cas13m.3截短体的示意图,示出了各截短体在Cas13m.3全长蛋白上对应的缺失区域。
图2为实施例1设计的Cas13m.6截短体的示意图,示出了各截短体在Cas13m.6全长蛋白上对应的缺失区域。
图3为实施例2的Cas13m.3-AQp1质粒结构示意图,可用于表达完整的Cas13m.3蛋白,以及靶向AQp1的gRNA。
图4为实施例2的Cas13m.6-AQp1质粒结构示意图,可用于表达完整的Cas13m.6蛋白,以及靶向AQp1的gRNA。
图5为实施例2中,在高表达AQp1的293T细胞系中,Cas13m.3S截短体蛋白对AQp1RNA的敲降测试结果。
图6为实施例2中,在高表达AQp1的293T细胞系中,Cas13m.3C截短体蛋白对AQp1RNA的敲降测试结果。
图7为实施例2中,在高表达AQp1的293T细胞系中,Cas13m.6S截短体蛋白对AQp1RNA的敲降测试结果。
图8为实施例2中,在高表达AQp1的293T细胞系中,Cas13m.6C截短体蛋白对AQp1RNA的敲降测试结果。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例1:Cas13m.3和Cas13m.6截短体的设计
我们新近发现了2个高编辑活性的Cas13蛋白,命名为Cas13m.3(SEQ ID NO:2)和Cas13m.6(SEQ ID NO:4)。Cas13m.3筛选自NCBI Genbank数据库中编号GCA_902762805.1的基因组,对应编码序列在基因组中的位置为CACWPQ010000015.1:53195:57013:+。Cas13m.6筛选自NCBI Genbank数据库中编号GCA_902779095.1的基因组,对应编码序列在基因组中的位置为CACZAB010000017.1:58800:62366:+。这两个Cas13蛋白在293T细胞中显示出靶向PTBP1 RNA的高编辑活性,在高表达AQp1的293T细胞中显示出靶向AQp1 RNA的高编辑活性。但Cas13m.3和Cas13m.6蛋白的尺寸不够小,不便于AAV递送。因此发明人分别以Cas13m.3和Cas13m.6作为参比蛋白,设计多个截短体用于测试,以筛选出尺寸更小且具有RNA编辑活性的截短体。
如图1和图2所示,使用以下两种策略设计截短体:
(1)S截短:在蛋白序列上按顺序截短特定长度(如50aa)的序列;
(2)C截短:使用AlphaFold v2.1.1预测参比蛋白Cas13m.3和Cas13m.6的三维结构。然后使用PyMOL v2.5.1fit命令与BzCas13b-crRNA晶体结构(https://www.rcsb.org/structure/6AAY)叠合(Cas13m.3和Cas13m.6与6AAY的结构最相似)。以50个氨基酸为滑动窗口标记Cas13m.3或Cas13m.6的结构,当标记结构和6AAY明显不一致(参比Cas蛋白标记区域与BzCas13b相应区域的α螺旋数量相差≥1个和/或β折叠数量相差≥1个)时,作为截短的目标。
设计的Cas13m.3截短体如下表1所示:
表1.Cas13m.3截短体
Cas13m.6截短体如下表2所示:
表2.Cas13m.6截短体
实施例2:内源基因编辑效率验证
1、构建靶向AQp1的载体
实验选择的靶核酸是AQp1(Aquaporin 1),验证AQp1使用高表达AQp1的293T细胞系。
高表达AQp1的293T细胞系(293T-AQp1细胞)的构建方法:构建过表达AQp1基因以及EGFP基因的载体Lv-AQp1-T2a-GFP(SEQ ID NO:13)。其中,AQp1与EGFP使用2A肽进行间隔。将Lv-AQp1-T2a-GFP质粒包装慢病毒后转导293T细胞,形成稳定过表达AQp1基因的细胞系。
使用常规方法制备得到如图3和图4所示的Cas13m.3-AQp1质粒(SEQ ID NO:1)、Cas13m.6-AQp1质粒(SEQ ID NO:3)。载体结构为CMV-Cas13m.3-U6-gRNA、CMV-Cas13m.6-U6-gRNA,可用于表达Cas13m.3或Cas13m.6蛋白,以及靶向AQp1的gRNA,所述gRNA指导序列为agggcagaaccgaugcugaugaagac(SEQ ID NO:8)。Cas13m.3-AQp1质粒载体的5150-5185位编码gRNA的骨架序列(同向重复序列)。Cas13m.6-AQp1质粒载体的4898-4933位编码gRNA的骨架序列(同向重复序列)。
CasRx是本领域目前最常用的Cas13蛋白,且活性通常高于市售的其他Cas13,所以使用常规方法制备得到以下对照载体:
CasRx-AQp1质粒(CasRx靶向AQp1的阳性对照载体),序列如SEQ ID NO:5所示,质粒结构为CMV-CasRx-U6-gRNA。可表达CasRx以及靶向AQp1的gRNA(指导序列为SEQ ID NO:8);
CasRx-blank质粒(空白对照载体,可表达CasRx和gRNA,但gRNA不靶向AQp1),序列如SEQ ID NO:7所示,质粒结构为CMV-CasRx-U6-gRNA。
2、构建Cas13m.3截短体靶向AQp1的载体
在外包服务公司,通过AgeI、EcoRI双酶切位点对Cas13m.3-AQp1载体进行改造,得到一系列截短蛋白载体,所述截短蛋白载体的结构为CMV-截短蛋白-U6-gRNA,可用于表达实施例1的截短蛋白以及靶向AQp1的gRNA;所述截短蛋白载体与Cas13m.3-AQp1载体的区别仅在于用截短蛋白编码序列替换了Cas13m.3编码序列,且所述截短蛋白编码序列使用与Cas13m.3编码序列相同的密码子。
例如S5载体即是在Cas13m.3-AQp1载体基础上缺失Cas13m.3的623-772aa对应的编码序列而得到。
3、构建Cas13m.6截短体靶向AQp1的载体
在外包服务公司,通过AgeI、EcoRI双酶切位点对Cas13m.6-AQp1载体进行改造,得到一系列截短蛋白载体,所述截短蛋白载体的结构为CMV-截短蛋白-U6-gRNA,可用于表达实施例1的截短蛋白以及靶向AQp1的gRNA;所述截短蛋白载体与Cas13m.6-AQp1载体的区别仅在于用截短蛋白编码序列替换了Cas13m.6编码序列,且所述截短蛋白编码序列使用与Cas13m.6编码序列相同的密码子。
例如S1载体即是在Cas13m.6-AQp1载体基础上缺失Cas13m.6的602-701aa对应的编码序列而得到。
4、待验证载体转染293T-AQp1细胞及编辑效率验证
将对照质粒或靶向AQP1的载体质粒按照500ng在24孔板中转染293T-AQp1细胞。
转染方法如下所示:
(1)胰酶(Trypsin 0.25%,EDTA,Thermo,11058021)消化细胞,对细胞计数,按照一个孔500μL将2×105细胞铺24孔板。
(2)对于每个转染样品,请按照以下步骤准备复合物:
a在加入细胞的24孔板每个孔中,加入50μL无血清的Opti-MEM I(Thermo,25200056)还原血清培养基中稀释前述的质粒DNA,并轻轻混合;
b在使用前轻轻混合Lipofectamine 2000(Thermo,11668019),然后在每个孔中,即50μL的Opti-MEM I培养基中稀释1.8μL的Lipofectamine 2000。在室温下孵育5分钟。注意:在25分钟内继续执行步骤c;
c孵育5分钟后,将稀释的DNA与稀释的Lipofectamine 2000合并。轻轻混合并在室温下孵育20分钟(溶液可能看起来混浊)。注意:复合物在室温下稳定6小时。
将复合物加入细胞中并混合。
未转染任何质粒的293T-AQp1细胞作为阴性对照。
(3)qPCR检测靶基因的RNA
转染后48h的细胞使用SteadyPure Universal RNA Extraction Kit AG21017试剂盒进行RNA提取操作,并使用超微量分光光度计检测RNA浓度。RNA产物使用Evo M-MLVMix Kit with gDNA Clean for qPCR AG11728反转录试剂盒进行反转录,反转录产物使用SYBR Green Premix Pro Taq HS qPCR Kit(Low Rox Plus)AG11720 qPCR试剂盒进行检测。
其中qPCR所使用引物如下所示:
检测AQp1:
上游引物:5’-gctcttctggagggcagtgg-3’(SEQ ID NO:9)
下游引物:5’-cagtgtgacagccgggttgag-3’(SEQ ID NO:10)
检测内参GAPDH:
上游引物:5’-CCATGGGGAAGGTGAAGGTC-3’(SEQ ID NO:11)
下游引物:5’-GAAGGGGTCATTGATGGCAAC-3’(SEQ ID NO:12)
按照SYBR Green Premix Pro Taq HS qPCR Kit(Low Rox Plus)AG11720使用说明配置反应体系,使用QuantStudioTM5 Real-Time PCR System,96-well进行检测。
本实验使用相对定量方法即2-△△Ct法计算目标RNA。其计算方式如下所示:
△Ct=Ct(AQp1)-Ct(GAPDH)
△△Ct=△Ct(待验证样品如Cas13m.3)-△Ct(CasRx-blank)
2-△△Ct=2^(-△△Ct)
按照上述计算方式计算AQp1的RNA量。
Cas13m.3S截短体对AQp1 RNA的敲降测试结果如表3和图5所示。生物学独立重复2次,结果数据取2次测试的平均值。
表3.Cas13m.3S截短体对AQp1 RNA的敲降测试结果
Cas13m.3的S5-S18截短体都有明显的RNA敲降活性,且与CasRx相比活性相当甚至更强。其中S11、S18截短体的敲降活性最接近全长的Cas13m.3。
Cas13m.3的C截短体对AQp1 RNA的敲降测试结果如表4和图6所示。生物学独立重复4次,结果数据取4次测试的平均值。
表4.Cas13m.3C截短体对AQp1 RNA的敲降测试结果
Cas13m.3的C1-C9截短体都有明显的RNA敲降活性,且与CasRx相比活性相当。其中C1、C2截短体的敲降活性最接近全长的Cas13m.3。
Cas13m.6的S截短体对AQp1 RNA的敲降测试结果如表5和图7所示。生物学独立重复2次,结果数据取2次测试的平均值。
表5.Cas13m.6S截短体对AQp1 RNA的敲降测试结果
Cas13m.6的S1-S8截短体都有RNA敲降活性。其中S1-S3、S7、S8截短体的敲降活性相对更高。
Cas13m.6C截短体对AQp1 RNA的敲降测试结果如表6和图8所示。生物学独立重复4次,结果数据取4次测试的平均值。
表6.Cas13m.6C截短体对AQp1 RNA的敲降测试结果
Cas13m.6的C1-C7截短体都有明显的RNA敲降活性,且与CasRx相比活性相当。

Claims (16)

1.一种Cas13蛋白,其特征在于,所述Cas13蛋白由以下(1)-(3)中的任一种组成:
(1)相对如SEQ ID NO: 2所示的氨基酸序列存在选自第623-772位、第773-922位、第923-1072位、第623-1072位、第923-972位、第973-1022位、第1023-1072位、第973-1072位、第623-672位、第673-722位、第723-772位、第773-822位、第823-872位、第873-922位、第1127-1272位、第994-1107位、第726-827位、第263-315位、第82-132位、第187-243位、第610-661位、第593-658位和第810-905位的任一种缺失的截短体序列;
(2)同源或异源蛋白结构域,以及(1)中所述截短体序列;
(3)同源或异源蛋白结构域,(1)中所述截短体序列,以及用于连接所述蛋白结构域与所述截短体序列的连接序列。
2.如权利要求1所述的Cas13蛋白,其特征在于,所述同源或异源蛋白结构域任选自核定位信号、核输出信号、脱氨酶结构域、翻译激活结构域、翻译抑制结构域、RNA甲基化结构域、RNA去甲基化结构域、核酸酶结构域、剪接因子结构域、报告标签以及亲和标签中的一种或更多种。
3.如权利要求1所述的Cas13蛋白,其特征在于,所述蛋白结构域与所述截短体序列通过连接序列共价连接。
4.一种多核苷酸,其特征在于,所述多核苷酸编码如权利要求1所述的Cas13蛋白。
5.一种CRISPR-Cas13系统,其特征在于,所述CRISPR-Cas13系统包含:
如权利要求1~3任一项所述的Cas13蛋白或编码如权利要求1~3任一项所述的Cas13蛋白的多核苷酸;以及靶向目的基因的指导多核苷酸或编码靶向目的基因的指导多核苷酸的核酸,所述指导多核苷酸包含连接至指导序列的骨架序列,所述指导序列被工程化以与靶核苷酸杂交;
所述指导多核苷酸能够与所述Cas13蛋白形成CRISPR复合物。
6.一种包含权利要求5所述的CRISPR-Cas13系统的载体系统,其中,所述载体系统包含一个或更多个载体,所述载体系统包含编码所述Cas13蛋白的多核苷酸序列和编码所述指导多核苷酸的多核苷酸序列。
7.一种包含权利要求5所述的CRISPR-Cas13系统的腺相关病毒载体,其中,所述腺相关病毒载体包含编码所述Cas13蛋白和指导多核苷酸的DNA。
8.一种包含权利要求5所述的CRISPR-Cas13系统的脂质纳米粒,其中,所述脂质纳米粒包含所述的指导多核苷酸和编码所述Cas13蛋白的mRNA。
9.一种包含权利要求5所述的CRISPR-Cas13系统的慢病毒载体,其中,所述慢病毒载体包含所述指导多核苷酸和编码所述Cas13蛋白的mRNA。
10.如权利要求9所述的慢病毒载体,其中,所述慢病毒载体是用包膜蛋白假型化的。
11.一种包含权利要求5所述的CRISPR-Cas13系统的核糖核蛋白复合物,其中,所述核糖核蛋白复合物由所述指导多核苷酸和Cas13蛋白形成。
12.一种包含权利要求5所述的CRISPR-Cas13系统的病毒样颗粒,其中,所述病毒样颗粒包含由所述指导多核苷酸和Cas13蛋白形成的核糖核蛋白复合物。
13.一种真核细胞,其特征在于,所述真核细胞包含如权利要求5所述的CRISPR-Cas13系统。
14.一种药物组合物,其特征在于,所述药物组合物包含如权利要求5所述的CRISPR-Cas13系统。
15.一种如权利要求1-3任一项所述的Cas13蛋白、如权利要求4所述的多核苷酸或如权利要求5所述的CRISPR-Cas13系统在制备检测核酸样品中的靶核酸的试剂中的用途。
16.一种如权利要求1-3任一项所述的Cas13蛋白、如权利要求4所述的多核苷酸或如权利要求5所述的CRISPR-Cas13系统在制备实现以下任一项方案的非诊断或非治疗目的的试剂中的用途:切割一种或多种靶核酸分子;激活或上调一种或多种靶核酸分子;使一种或多种靶核酸分子失活;可视化、标记或检测一种或多种靶核酸分子;运输一种或多种靶核酸分子;以及掩蔽一种或多种靶核酸分子。
CN202211575384.0A 2022-12-08 2022-12-08 Cas蛋白截短体、构建其的方法及其应用 Active CN116083400B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202311442477.0A CN117701530A (zh) 2022-12-08 2022-12-08 Cas蛋白截短体、构建其的方法及其应用
CN202211575384.0A CN116083400B (zh) 2022-12-08 2022-12-08 Cas蛋白截短体、构建其的方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211575384.0A CN116083400B (zh) 2022-12-08 2022-12-08 Cas蛋白截短体、构建其的方法及其应用

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311442477.0A Division CN117701530A (zh) 2022-12-08 2022-12-08 Cas蛋白截短体、构建其的方法及其应用

Publications (2)

Publication Number Publication Date
CN116083400A CN116083400A (zh) 2023-05-09
CN116083400B true CN116083400B (zh) 2023-12-12

Family

ID=86207249

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202311442477.0A Pending CN117701530A (zh) 2022-12-08 2022-12-08 Cas蛋白截短体、构建其的方法及其应用
CN202211575384.0A Active CN116083400B (zh) 2022-12-08 2022-12-08 Cas蛋白截短体、构建其的方法及其应用

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202311442477.0A Pending CN117701530A (zh) 2022-12-08 2022-12-08 Cas蛋白截短体、构建其的方法及其应用

Country Status (1)

Country Link
CN (2) CN117701530A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111549054A (zh) * 2020-05-22 2020-08-18 中国农业科学院植物保护研究所 CRISPR/RfxCas13d抗植物RNA病毒载体及其构建方法和应用
CN113348245A (zh) * 2018-07-31 2021-09-03 博德研究所 新型crispr酶和系统
CN113544267A (zh) * 2019-01-14 2021-10-22 罗切斯特大学 使用CRISPR-Cas进行靶向核RNA裂解和聚腺苷酸化
WO2022068912A1 (en) * 2020-09-30 2022-04-07 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
CN114934031A (zh) * 2022-05-25 2022-08-23 广州瑞风生物科技有限公司 新型Cas效应蛋白、基因编辑系统及用途
CN114990093A (zh) * 2022-06-24 2022-09-02 吉林大学 氨基酸序列小的蛋白序列mini rfx-cas13d
WO2022249152A2 (en) * 2021-05-27 2022-12-01 King Abdullah University Of Science And Technology Cas13-based compositions and methods of use thereof

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113348245A (zh) * 2018-07-31 2021-09-03 博德研究所 新型crispr酶和系统
CN113544267A (zh) * 2019-01-14 2021-10-22 罗切斯特大学 使用CRISPR-Cas进行靶向核RNA裂解和聚腺苷酸化
CN111549054A (zh) * 2020-05-22 2020-08-18 中国农业科学院植物保护研究所 CRISPR/RfxCas13d抗植物RNA病毒载体及其构建方法和应用
WO2022068912A1 (en) * 2020-09-30 2022-04-07 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
WO2022249152A2 (en) * 2021-05-27 2022-12-01 King Abdullah University Of Science And Technology Cas13-based compositions and methods of use thereof
CN114934031A (zh) * 2022-05-25 2022-08-23 广州瑞风生物科技有限公司 新型Cas效应蛋白、基因编辑系统及用途
CN114990093A (zh) * 2022-06-24 2022-09-02 吉林大学 氨基酸序列小的蛋白序列mini rfx-cas13d

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NCBI Reference Sequence: WP_028912271.1.NCBI.2020,ORIGIN. *
RNA靶向系统Crispr/Cas13在分子诊断及临床治疗中的研究进展;王泽华等;《临床检验杂志》;38(05);第367-370页 *

Also Published As

Publication number Publication date
CN116083400A (zh) 2023-05-09
CN117701530A (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN111328343B (zh) Rna靶向方法和组合物
US20230103909A1 (en) Compositions and methods for gene editing
JP2021500863A (ja) ゲノム編集用のポリヌクレオチド、組成物および方法
Mandal et al. Enrichment of processed pseudogene transcripts in L1-ribonucleoprotein particles
CN112513250A (zh) 用于跟踪和操纵细胞rna的融合蛋白和融合核糖核酸
KR20230002401A (ko) C9orf72의 표적화를 위한 조성물 및 방법
US11970720B2 (en) RNA targeting methods and compositions
US10982209B2 (en) Read through of truncated proteins in premature termination codon diseases by suppressor tRNAs
CA3145309A1 (en) Rna-targeting knockdown and replacement compositions and methods for use
EP1974042B1 (en) Hybrid 3 untranslated regions suitable for efficient protein expression in mammalian cells
TW202237845A (zh) 用於涉及去胺作用之基因體編輯之多核苷酸、組合物及方法
CN114369584A (zh) 重组人源岩藻糖基转移酶变异体及应用
WO2020069029A1 (en) Novel crispr nucleases
JP6960409B2 (ja) プロモーター
CN116083400B (zh) Cas蛋白截短体、构建其的方法及其应用
JP2019514972A (ja) 組換え核酸のミトコンドリア送達
WO2005090562A1 (ja) 軽度の低温により遺伝子の発現を促進させる配列
WO2024041653A1 (zh) 一种CRISPR-Cas13系统及其应用
AU2020353149A1 (en) Minimal arrestin domain containing protein 1 (ARRDC1) constructs
CN117230043B (zh) Cas13蛋白及其应用
WO2024109957A1 (zh) Cas13蛋白、CRISPR-Cas系统及其应用
US20240026345A1 (en) Parallel single-cell reporter assays and compositions
US20240067968A1 (en) Compositions, systems, and methods for regulation of hepatitis b virus through targeted gene repression
WO2023207607A1 (zh) 用于修饰线粒体dna的脱氨酶突变体、组合物和方法
RU2804665C2 (ru) Композиции и способы редактирования генов

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant