CN116024324B - 基因编辑细胞脱靶检测的方法 - Google Patents
基因编辑细胞脱靶检测的方法 Download PDFInfo
- Publication number
- CN116024324B CN116024324B CN202310020693.XA CN202310020693A CN116024324B CN 116024324 B CN116024324 B CN 116024324B CN 202310020693 A CN202310020693 A CN 202310020693A CN 116024324 B CN116024324 B CN 116024324B
- Authority
- CN
- China
- Prior art keywords
- gene editing
- cells
- cell
- target
- stranded dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010362 genome editing Methods 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 47
- 108020004414 DNA Proteins 0.000 claims abstract description 58
- 102000053602 DNA Human genes 0.000 claims abstract description 42
- 238000012163 sequencing technique Methods 0.000 claims abstract description 40
- 108020004682 Single-Stranded DNA Proteins 0.000 claims abstract description 39
- 210000004027 cell Anatomy 0.000 claims description 125
- 239000011324 bead Substances 0.000 claims description 37
- 238000001514 detection method Methods 0.000 claims description 32
- 108090000623 proteins and genes Proteins 0.000 claims description 27
- 108091033409 CRISPR Proteins 0.000 claims description 22
- 102000004169 proteins and genes Human genes 0.000 claims description 18
- 108010027643 Replication Protein A Proteins 0.000 claims description 15
- 102000018780 Replication Protein A Human genes 0.000 claims description 15
- 238000010354 CRISPR gene editing Methods 0.000 claims description 13
- 239000006228 supernatant Substances 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000027455 binding Effects 0.000 claims description 10
- 239000000243 solution Substances 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 10
- 239000000047 product Substances 0.000 claims description 8
- 238000005406 washing Methods 0.000 claims description 7
- 108010077544 Chromatin Proteins 0.000 claims description 6
- 239000007853 buffer solution Substances 0.000 claims description 6
- 210000003483 chromatin Anatomy 0.000 claims description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 5
- 108010067770 Endopeptidase K Proteins 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 5
- 230000001404 mediated effect Effects 0.000 claims description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 239000011534 wash buffer Substances 0.000 claims description 4
- 108010014064 CCCTC-Binding Factor Proteins 0.000 claims description 3
- 108010033040 Histones Proteins 0.000 claims description 3
- 238000010459 TALEN Methods 0.000 claims description 3
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 3
- -1 ZFN Proteins 0.000 claims description 3
- 230000001973 epigenetic effect Effects 0.000 claims description 3
- 239000012530 fluid Substances 0.000 claims description 3
- 210000004602 germ cell Anatomy 0.000 claims description 3
- 210000002865 immune cell Anatomy 0.000 claims description 3
- 230000011987 methylation Effects 0.000 claims description 3
- 238000007069 methylation reaction Methods 0.000 claims description 3
- 210000001082 somatic cell Anatomy 0.000 claims description 3
- 210000000130 stem cell Anatomy 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 240000003049 Canavalia gladiata Species 0.000 claims description 2
- 235000010518 Canavalia gladiata Nutrition 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 102000016897 CCCTC-Binding Factor Human genes 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 10
- 230000035945 sensitivity Effects 0.000 abstract description 6
- 238000001727 in vivo Methods 0.000 description 8
- 238000002156 mixing Methods 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 7
- 230000009437 off-target effect Effects 0.000 description 7
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 230000003007 single stranded DNA break Effects 0.000 description 5
- 230000005778 DNA damage Effects 0.000 description 4
- 231100000277 DNA damage Toxicity 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 102100027938 ATR-interacting protein Human genes 0.000 description 2
- 230000005971 DNA damage repair Effects 0.000 description 2
- 238000007399 DNA isolation Methods 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102100033962 GTP-binding protein RAD Human genes 0.000 description 2
- 108050007570 GTP-binding protein Rad Proteins 0.000 description 2
- 101000697966 Homo sapiens ATR-interacting protein Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000007664 blowing Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 241000220451 Canavalia Species 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710116602 DNA-Binding protein G5P Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 101710162453 Replication factor A Proteins 0.000 description 1
- 101710176758 Replication protein A 70 kDa DNA-binding subunit Proteins 0.000 description 1
- 101710176276 SSB protein Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 239000012295 chemical reaction liquid Substances 0.000 description 1
- 238000000749 co-immunoprecipitation Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000020520 nucleotide-excision repair Effects 0.000 description 1
- 230000009438 off-target cleavage Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提出了基因编辑细胞脱靶检测的方法,所述方法包括:(1)对细胞进行基因编辑,获得的基因编辑细胞中含有蛋白‑单链DNA复合物;(2)从所述基因编辑细胞中分离出单链DNA;(3)将所述单链DNA构建测序文库,对所述测序文库进行测序,获得测序结果;(4)将所述测序结果与参考序列进行比对分析,确定脱靶信息。利用本发明的方法可以确定脱靶信息,具有高准确性、高灵敏度和高普适性等特点,适于广泛应用。
Description
技术领域
本发明涉及生物领域。具体地,本发明涉及基因编辑细胞脱靶检测的方法。
背景技术
基因编辑(gene editing),又称基因组编辑或基因组工程,是能对生物体基因组特定目标基因进行修饰的一种基因工程技术,基因编辑以其能够高效率地进行定点基因组编辑,在基因研究、基因治疗和遗传改良等方面展示出了巨大的潜力。但是,基因编辑的一大挑战在于如何确保不会在DNA上的其他地方进行切割,即所谓的“脱靶效应”,其可能会产生不可预见的后果,这也严重制约了其推广应用。为了解决该难题,已有研究人员开发出了体外全基因组脱靶效应检测技术,例如Digenome-seq、CIRCLE-Seq、SITE-Seq。但是这些检测技术仅能检测无细胞的基因组DNA,无法检测细胞内的脱靶效应。
为了检测细胞内脱靶效应,研究人员开发出了基于细胞的全基因组脱靶效应检测技术。例如,研究人员开发出的BLESS技术可以利用生物素标记细胞内的DSB,再结合二代测序进行脱靶效应检测;研究人员开发了GUIDE-seq技术,可以在Cas9裂解区域引入短双链寡核苷酸标记脱靶断裂,再结合高通量测序找到脱靶位置;研究人员还开发出一种称为DISCOVER-Seq的技术,该技术利用DNA修复因子染色质免疫共沉淀和高通量测序的方法检测脱靶效应。但是,上述脱靶检测技术依然存在局限性,例如假阳性率高、灵敏度低(需要使用大量的细胞进行检测)、普适性低(每种方法都是为有限的编辑系统设计的,无法同时检测不同编辑工具的脱靶位点),并且例如ABE、PE等基因编辑工具目前仍未开发出对应的体内细胞脱靶检测工具。
因此,目前针对基因编辑细胞脱靶检测方法仍有待研究。
发明内容
本发明旨在至少在一定程度上解决现有技术中存在的技术问题。
需要说明的是,本发明是基于发明人的下列发现而完成的:
大多数的基因编辑会造成DNA损伤,例如CRISPR/Cas9会导致双链DNA断裂(DSB)的产生,而单碱基编辑器(BE)及主编辑器(PE)会导致单链DNA断裂(SSB)的产生。若找到一种DSB和SSB共享的DNA结合因子,通过识别该因子与DNA的结合位点,进而确定基因编辑工具在基因组中切割的确切位置,便可以开发出一套适用于实现体内细胞编辑脱靶检测的技术。
有鉴于此,本发明的发明人进行深入研究分析,当细胞内存在DSB或SSB时,细胞内的核酸内切酶会切割DNA损伤处产生单链DNA区域,而细胞内存在能够与单链DNA相结合的蛋白,将与产生的单链DNA形成蛋白-单链DNA复合物。由此,这类蛋白可以作为基因编辑的潜在检测靶点,提取出与该蛋白相结合的单链DNA,并进一步对单链DNA测序分析,从而可以确定脱靶信息,具有高准确性、高灵敏度和高普适性等特点,体内和体外细胞脱靶检测均实现,适于广泛应用。
为此,在本发明的一个方面,本发明提出了一种基因编辑细胞脱靶检测的方法。根据本发明的实施例,所述方法包括:(1)对细胞进行基因编辑,获得的基因编辑细胞中含有蛋白-单链DNA复合物;(2)从所述基因编辑细胞中分离出单链DNA;(3)将所述单链DNA构建测序文库,对所述测序文库进行测序,获得测序结果;(4)将所述测序结果与参考序列进行比对分析,确定脱靶信息。
根据本发明实施例的方法中,利用细胞内存在能够与单链DNA相结合的蛋白这一特性,将其作为基因编辑的潜在检测靶点,提取出与该蛋白相结合的单链DNA,并进一步对单链DNA测序分析,从而可以确定脱靶信息,具有高灵敏度和高普适性等特点,体内和体外细胞脱靶检测均可实现,适于广泛应用。
根据本发明的实施例,上述基因编辑细胞脱靶检测的方法还可以具有下列附加技术特征:
根据本发明的实施例,所述蛋白选自复制蛋白A、RAD51蛋白或ATRIP蛋白。
根据本发明的实施例,所述基因编辑细胞选自细胞系、原代细胞、免疫细胞、干细胞、体细胞或生殖细胞。
根据本发明的实施例,所述基因编辑采用的基因编辑工具包括:TALEN、ZFN或者CRISPR系统介导的基因编辑器。
根据本发明的实施例,所述基因编辑器选自CRISPR/Cas9基因编辑器、单碱基编辑器或者先导编辑器。
根据本发明的实施例,步骤(1)包括:将预先构建的用于基因编辑的载体转染至细胞中,培养细胞至预定时间后进行步骤(2);其中,当采用CRISPR/Cas9基因编辑器进行基因编辑时,所述预定时间为48~96小时;当采用单碱基编辑器或者先导编辑器进行基因编辑时,所述预定时间为12~48小时。
根据本发明的实施例,步骤(2)包括:将含有所述基因编辑细胞的细胞液与刀豆蛋白A磁珠共孵育,去除上清,用含有所述蛋白的抗体的缓冲液重悬磁珠,孵育,洗涤磁珠;用含有pA-MNase的洗涤缓冲液重悬磁珠,孵育,洗涤磁珠;用含有EDTA的缓冲液重悬磁珠,孵育,向试管中加入CaCl2溶液重悬磁珠,冰上消化,终止反应,离心,置于磁力架上,收集上清液;将所述上清液、蛋白酶K和载体RNA进行反应,得到反应液;从所述反应液中分离出单链DNA。
根据本发明的实施例,所述重悬磁珠时,通过敲击试管以混匀。
根据本发明的实施例,将步骤(2)分离出的单链DNA进行步骤(3)的构建测序文库之前,采用HL-dsDNase处理所述单链DNA,将所得处理物进行步骤(3)。
根据本发明的实施例,基于500个至100万个所述细胞获取的单链DNA,所述HL-dsDNase的用量为1~5μL,所述处理包括:35~39℃孵育50分钟~70分钟,70~80℃孵育15~25分钟。
在本发明的另一方面,本发明提出了一种构建脱靶预测模型的方法。根据本发明的实施例,所述方法包括:针对细胞进行基因编辑,得到基因编辑细胞;利用前面所述基因编辑细胞脱靶检测的方法对所述基因编辑细胞进行不同基因编辑工具的脱靶检测,得到脱靶信息;将所述脱靶信息以及所述细胞的信息进行训练和测试,得到不同基因编辑工具针对所述细胞的脱靶预测模型。由此,利用根据本发明实施例的方法可以准确地构建脱靶预测模型,可以针对不同基因编辑工具以及不同细胞类型,提供更为精准的sgRNA靶点设计参照。
根据本发明的实施例,所述细胞的信息包括下列至少之一:细胞的类型、基因组信息、表观组学信息和转录组学信息。
根据本发明的实施例,所述表观组学信息包括下列至少之一:染色质开放性信息、不同组蛋白修饰信息、甲基化信息和CTCF结合位点。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明一个实施例的基因编辑细胞脱靶检测的方法流程示意图;
图2显示了根据本发明另一个实施例的基因编辑细胞脱靶检测的方法流程示意图;
图3显示了根据本发明一个实施例的针对不同基因编辑工具的目标靶点和脱靶位点的IGV软件分析图;
图4显示了根据本发明一个实施例的针对不同细胞的目标靶点和脱靶位点的IGV软件分析图;
图5显示了根据本发明一个实施例的针对不同培养时间的目标靶点和脱靶位点的IGV软件分析图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本发明提出了基因编辑细胞脱靶检测的方法和构建脱靶预测模型的方法,下面将分别对其进行详细描述。
基因编辑细胞脱靶检测的方法
在本发明的一个方面,本发明提出了基因编辑细胞脱靶检测的方法。根据本发明的实施例,参见图1,该方法包括:S100基因编辑、S200分离出单链DNA、S300构建测序文库和测序和S400比对分析。下面将分别对各个步骤进行详细描述。
S100基因编辑
在该步骤中,对细胞进行基因编辑,获得的基因编辑细胞中含有蛋白-单链DNA复合物。
需要说明的是,本发明对于蛋白的类型不作严格限定,凡是存在于细胞内且可以与单链DNA相结合的蛋白均适用于本发明,例如,可以为复制蛋白A、RAD51蛋白或ATRIP蛋白等,其中,优选复制蛋白A。
复制蛋白A(RPA)是真核生物的单链DNA结合蛋白,细胞经基因编辑后,会存在DSB或SSB时,细胞内的核酸内切酶会切割DNA损伤处产生单链DNA区域,RPA结合于此产生的RPA-ssDNA结构可以促进DSB或SSB的修复。因此,RPA是DSB及SSB修复途径的共享修复因子,可以作为CRISPR系统介导的基因组各编辑器的潜在检测靶点,并且具有链特异性结合的特点,这将有利于提高测序对切割位点的辨识度。
因此,相比于其他蛋白,复制蛋白A对于单链DNA的特异性强,并且其参与了如核苷酸切除修复、DNA错配修复、同源重组和非同源末端连接等多种DNA损伤修复过程,可以涵盖不同基因编辑工具产生的不同DNA损伤修复;此外,复制蛋白A单链结合区域极其广泛,可以覆盖DNA损伤区域20kbp至100kbp的范围,显著提高脱靶检测效率。并且,复制蛋白A具有商业化的抗体,可以降低实验难度及成本。
需要说明的是,凡是依赖于DNA损伤及修复的基因编辑均适用于本发明,具体采用的基因编辑工具可以包括:TALEN、ZFN或者CRISPR系统介导的基因编辑器。在一些实施例中,基因编辑器选自CRISPR/Cas9基因编辑器、单碱基编辑器或者先导编辑器。本发明的检测方法具有广泛地适用性,可适用于不同类型的基因编辑工具,极大地提高其应用场景和价值。
本发明中,术语“基因编辑细胞”是指预先经过基因编辑的细胞,对于细胞的种类不作严格限定,invitro、ex vivo或者in vivo实验中经过基因编辑的细胞均可适用于本发明的脱靶检测方法,具体地,可以为细胞系、原代细胞、免疫细胞、干细胞、体细胞或生殖细胞等。实验结果表明,针对HEK293T、NIH3T3、U2OS、mESC等不同细胞类型,均可获取高准确度的脱靶检测结果。本发明的脱靶检测方法对于体内细胞或者体外细胞均适用,对小鼠HSC、肝脏等各器官的脱靶进行检测,可以更好地预测基因组编辑在临床环境中的作用。
本发明中,术语“in vitro”主要是指体外实验;“in vivo”主要是指活体直接转移,将带有遗传物质的病毒、脂质体或DNA等直接注射到机体内;“ex vivo”主要是指将实验对象的细胞取出,体外培养并导入重组基因,而后将这些经遗传修饰的细胞重新输回机体内,例如CAR-T细胞。
根据本发明的实施例,步骤S100包括:将预先构建的用于基因编辑的载体转染至细胞中,培养细胞至预定时间后进行步骤(2);其中,当采用CRISPR/Cas9方式进行基因编辑时,预定时间为48~96小时;当采用单碱基编辑器或者先导编辑器进行基因编辑时,预定时间为12~48小时。发明人发现,培养细胞的时间会影响脱靶检测的准确性,例如,若时间过短或者过长,容易出现某些脱靶位点未出现可检测的信号,导致脱靶位点遗漏。进而,发明人经过大量实验得到上述较佳培养细胞的时间,由此,脱靶检测的准确性强。
S200分离出单链DNA
在该步骤中,从基因编辑细胞中分离出单链DNA。
根据本发明的实施例,步骤S200包括:将含有基因编辑细胞的细胞液与刀豆蛋白A磁珠共孵育,去除上清,用含有蛋白的抗体的缓冲液重悬磁珠,孵育,洗涤磁珠;用含有pA-MNase的洗涤缓冲液重悬磁珠,孵育,洗涤磁珠;用含有EDTA的缓冲液重悬磁珠,孵育,向试管中加入CaCl2溶液重悬磁珠,冰上消化,终止反应,离心,置于磁力架上,收集上清液;将上清液、蛋白酶K和载体RNA进行反应,得到反应液;从反应液中分离出单链DNA。
刀豆蛋白A磁珠可以结合细胞膜/细胞核上的糖复合物。膜是通透的,针对蛋白-单链DNA复合物中蛋白的特性而使用了可特异性结合该蛋白的抗体,该蛋白抗体可以与染色质上的蛋白-单链DNA复合物结合。pAG-MNase结合到抗体连接的染色质上,然后通过Ca2+来激活pAG-MNase,从而切割单链DNA。被切下来的蛋白-单链DNA复合物游离到上清液中,在蛋白酶K作用下可降解蛋白,分离出单链DNA,同时添加载体RNA可帮助核酸去除提取过程中产生的静电效应,提高单链DNA收率和纯度。
根据本发明的实施例,重悬磁珠时,通过敲击试管以混匀。发明人发现,重悬磁珠的混匀方式会影响后续建库及测序结果,发明人测试了涡旋混匀、移液器混匀及敲击混匀,发现采用敲击混匀方式可以稳定地获取高质量数据,尤其适用于微量细胞。
根据本发明的实施例,将步骤S200分离出的单链DNA进行步骤S300的构建测序文库之前,采用HL-dsDNase处理单链DNA,将所得处理物进行步骤S300。发明人发现,由细胞中提取出蛋白-单链DNA复合物并进一步分离出单链DNA时,容易携带有双链DNA,进而影响后续测序分析。为此,发明人经过大量实验发现,分离出的单链DNA构建测序文库之前,预先采用HL-dsDNase对其进行处理,既可以有效地去除双链DNA,也不会破坏单链DNA结构,从而保证测序分析的准确性。
根据本发明的实施例,基于500个至100万个细胞获取的单链DNA,HL-dsDNase的用量为1~5μL;处理包括:35~39℃孵育50分钟~70分钟,70~80℃孵育15~25分钟。发明人经过大量实验得到上述较佳处理条件,由此,既可以有效地去除双链DNA,也不会破坏单链DNA结构,从而保证测序分析的准确性。
需要说明的是,本发明对于进行步骤S200的基因编辑细胞的个数不做严格限定,由于本发明的脱靶检测方法具有较高的灵敏度,可以检测低至500个细胞,可应用于临床珍贵且难以获取的细胞进行基因治疗,例如CAR-T、HSC等细胞。
S300构建测序文库和测序
在该步骤中,将单链DNA构建测序文库,对测序文库进行测序,获得测序结果。本发明对于构建测序文库方法和测序方法不作严格限定,可以为本领域常规技术手段。
S400比对分析
在该步骤中,将测序结果与参考序列进行比对分析,确定脱靶信息。具体地,脱靶信息可以为脱靶位点、脱靶序列等。
本发明中,术语“参考序列”是指生物体的部分或全部基因组的连续核苷酸的已知序列。待使用的参考序列取决于读取序列的来源,参考序列可为来自与获得读取序列的物种相同的物种的核酸序列。如果来自相同物种的核酸序列不可用,那么与其基因组正在被测序的生物体最紧密相关的生物体的核酸序列可用作参考序列。参考序列可通过测序技术确定或可从序列数据库获得。术语“比对”是指将读取序列映射到在参考序列中的区域。
构建脱靶预测模型的方法
在本发明的又一方面,本发明提出了一种构建脱靶预测模型的方法。根据本发明的实施例,所述方法包括:针对细胞进行基因编辑,得到基因编辑细胞;利用前面所述基因编辑细胞脱靶检测的方法对所述基因编辑细胞进行不同基因编辑工具的脱靶检测,得到脱靶信息;将所述脱靶信息以及所述细胞的信息进行训练和测试,得到不同基因编辑工具针对所述细胞的脱靶预测模型。由此,利用根据本发明实施例的方法可以准确地构建脱靶预测模型,可以针对不同基因编辑工具以及不同细胞类型,提供更为精准的sgRNA靶点设计参照。
根据本发明的实施例,所述细胞的信息包括下列至少之一:细胞的类型、基因组信息、表观组学信息和转录组学信息。发明人发现,对于不同类型的细胞,例如hek293细胞与k562细胞,针对相同的sgRNA,脱靶位点及频率可能存在差异。
根据本发明的实施例,所述表观组学信息包括下列至少之一:染色质开放性信息、不同组蛋白修饰信息、甲基化信息和CTCF结合位点。
有益效果
1、本发明的基因编辑细胞脱靶检测方法的准确性强、灵敏度高,可实现少量细胞脱靶检测,细胞检测量可低至500个,有助于珍贵或者难以获取的细胞进行基因治疗,例如CAR-T细胞、HSC细胞等。
2、本发明的基因编辑细胞脱靶检测方法具有普适性的特点,适用于多种细胞类型、体内细胞、体外细胞以及多种CRISPR系统介导的基因编辑器,从而可以更好地预测基因编辑在临床环境中的作用。
3、本发明的构建脱靶预测模型的方法获得的脱靶预测模型可以为基因编辑提供sgRNA靶点设计参照。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1
在该实施例中,参考图2,按照下列方法对基因编辑细胞脱靶检测:
1.采用基因编辑工具对细胞进行基因编辑,然后培养细胞,获得的基因编辑细胞中含有RPA-单链DNA复合物。
2.采用如下步骤分离出单链DNA:
2.1.收集细胞于接收管中。
2.2清洗并重悬细胞。
2.3.向细胞中加入10μl预洗的刀豆蛋白A磁珠,轻敲管子使磁珠与细胞充分混合,室温孵育10min。
2.4.去除上清液,用含有1μg RPA抗体的抗体缓冲液重悬磁珠。
2.5.4℃轻轻摇动孵育样品2小时。
2.6.洗涤磁珠两次。
2.7.用含有pA-MNase的洗涤缓冲液重悬磁珠,期间轻敲管子以充分混合。
2.8.4℃轻轻摇动孵育样品1小时左右。
2.9.洗涤磁珠两次。
2.10.去除上清液,然后用EDTA缓冲液重悬磁珠。
2.11.冰上平衡样品2分钟左右。
2.12.向每个试管中加入2μl 100mM CaCl2,轻敲试管并立即放回冰上。
2.13.冰上消化30分钟左右。
2.14.向每管中加入100μlEDTA-EGTA缓冲液,同时轻轻涡旋以终止反应。
2.15.37℃轻轻摇动孵育30分钟。
2.16.16000g离心5分钟。
2.17.将试管置于磁力架上,收集上清液。
2.18.加入1μL 20% SDS、2μL蛋白酶K和20ng载体RNA。
2.19.PCR仪56℃反应45分钟,72℃反应20分钟。
2.20.2.2×磁珠纯化核酸。
2.21.加入2μl HL-dsDNase和2μl缓冲液,37℃1小时,75℃20分钟。
3建库和测序
3.1 95℃加热上述样品2min,迅速置于冰上静置2min。
3.2加入5μl 3'Ligation Buffer,2.5μl 3'Ligation Enzyme Mix,2.5μl 3'Adaptor。
3.3轻轻吹打混匀后短暂离心,将反应液收集至管底。
3.4 37℃15min,95℃2min。
3.5加入2.5μl Extension Primer,17.5μlExtension Enzyme Mix。
3.6移液枪轻轻吹打混匀后短暂离心,将反应液收集至管底。
3.7 98℃30sec,63℃15sec,68℃5min。
3.8 1.8×DNA纯化磁珠纯化反应产物。
3.9加入5μl 5'Ligation Mix。
3.10加入5μl Adaptor。
3.11 25℃15min。
3.12使用1.6×DNA纯化磁珠纯化反应产物。
3.13将反应产物进行扩增,然后使用1.6×DNA纯化磁珠纯化扩增产物。
3.14二代测序。
如图3所示,针对不同基因编辑工具编辑的目标靶点及脱靶位点处均可以获取明显的RPA结合位点信号,表明该检测方法具有较高的普适性。
如图4所示,进行步骤2处理的不同数量细胞均可用于本发明的检测方法,尤其是当低至1000个细胞,同样可以在目标靶点和脱靶位点处获得明显的RPA结合位点信号,从而实现准确检测脱靶位点。
如图5所示,经基因编辑后的细胞培养不同时间,对应的RPA结合位点信号强度有所差异,当采用CRISPR/Cas9方式进行基因编辑时,培养时间为48~96小时;当采用单碱基编辑器或者先导编辑器进行基因编辑时,培养时间为12~48小时。由此,在目标靶点和脱靶位点处获得的RPA结合位点信号强度适宜,可以实现准确检测脱靶位点。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (7)
1.一种基因编辑细胞脱靶检测的方法,其特征在于,包括:
(1)对细胞进行基因编辑,获得的基因编辑细胞中含有蛋白-单链DNA复合物;
(2)从所述基因编辑细胞中分离出单链DNA;
(3)将所述单链DNA构建测序文库,对所述测序文库进行测序,获得测序结果;
(4)将所述测序结果与参考序列进行比对分析,确定脱靶信息;
所述蛋白选自复制蛋白A;
所述基因编辑采用的基因编辑工具包括:TALEN、ZFN或者CRISPR系统介导的CRISPR/Cas9基因编辑器、单碱基编辑器或者先导编辑器;
步骤(2)包括:
将含有所述基因编辑细胞的细胞液与刀豆蛋白A磁珠共孵育,去除上清,用含有所述蛋白的抗体的缓冲液重悬磁珠,孵育,洗涤磁珠;
用含有pA-MNase的洗涤缓冲液重悬磁珠,孵育,洗涤磁珠;
用含有EDTA的缓冲液重悬磁珠,孵育,向试管中加入CaCl2溶液重悬磁珠,冰上消化,终止反应,离心,置于磁力架上,收集上清液;所述重悬磁珠时,通过敲击试管以混匀;
将所述上清液、蛋白酶K和载体RNA进行反应,得到反应液;
从所述反应液中分离出单链DNA;
步骤(1)包括:将预先构建的用于基因编辑的载体转染至细胞中,培养细胞至预定时间后进行步骤(2);
其中,当采用CRISPR/Cas9基因编辑器进行基因编辑时,所述预定时间为48~96小时;
当采用单碱基编辑器或者先导编辑器进行基因编辑时,所述预定时间为12~48小时。
2.根据权利要求1所述的方法,其特征在于,所述基因编辑细胞选自细胞系、原代细胞、免疫细胞、干细胞、体细胞或生殖细胞。
3.根据权利要求1所述的方法,其特征在于,将步骤(2)分离出的单链DNA进行步骤(3)的构建测序文库之前,采用HL-dsDNase处理所述单链DNA,将所得处理物进行步骤(3)。
4.根据权利要求3所述的方法,其特征在于,基于500个至100万个所述细胞获取的单链DNA,所述HL-dsDNase的用量为1~5μL;
所述处理包括:35~39℃孵育50分钟~70分钟,70~80℃孵育15~25分钟。
5.一种构建脱靶预测模型的方法,其特征在于,包括:
针对细胞进行基因编辑,得到基因编辑细胞;
利用权利要求1~4任一项所述基因编辑细胞脱靶检测的方法对所述基因编辑细胞进行不同基因编辑工具的脱靶检测,得到脱靶信息;
将所述脱靶信息以及所述细胞的信息进行训练和测试,得到不同基因编辑工具针对所述细胞的脱靶预测模型。
6.根据权利要求5所述的方法,其特征在于,所述细胞的信息包括下列至少之一:细胞的类型、基因组信息、表观组学信息和转录组学信息。
7.根据权利要求5所述的方法,其特征在于,所述表观组学信息包括下列至少之一:染色质开放性信息、不同组蛋白修饰信息、甲基化信息和CTCF结合位点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310020693.XA CN116024324B (zh) | 2023-01-06 | 2023-01-06 | 基因编辑细胞脱靶检测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310020693.XA CN116024324B (zh) | 2023-01-06 | 2023-01-06 | 基因编辑细胞脱靶检测的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116024324A CN116024324A (zh) | 2023-04-28 |
CN116024324B true CN116024324B (zh) | 2024-05-14 |
Family
ID=86079012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310020693.XA Active CN116024324B (zh) | 2023-01-06 | 2023-01-06 | 基因编辑细胞脱靶检测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116024324B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024145924A1 (zh) * | 2023-01-06 | 2024-07-11 | 清华大学 | 基因编辑细胞脱靶检测的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109971842A (zh) * | 2019-02-15 | 2019-07-05 | 成都美杰赛尔生物科技有限公司 | 一种检测CRISPR-Cas9脱靶效应的方法 |
CN114574551A (zh) * | 2022-01-27 | 2022-06-03 | 上海达澈生物科技有限公司 | 一种检测crispr基因编辑脱靶的方法 |
-
2023
- 2023-01-06 CN CN202310020693.XA patent/CN116024324B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109971842A (zh) * | 2019-02-15 | 2019-07-05 | 成都美杰赛尔生物科技有限公司 | 一种检测CRISPR-Cas9脱靶效应的方法 |
CN114574551A (zh) * | 2022-01-27 | 2022-06-03 | 上海达澈生物科技有限公司 | 一种检测crispr基因编辑脱靶的方法 |
Non-Patent Citations (1)
Title |
---|
单链DNA结合蛋白RPA沉积的分子机理以及仔基因组稳定性维持中的意义;张琦;《中国博士学位论文全文数据库——医药卫生科技辑》;20210630;第27页第1段,第74页第3段 * |
Also Published As
Publication number | Publication date |
---|---|
CN116024324A (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Grandi et al. | Chromatin accessibility profiling by ATAC-seq | |
EP4284942B1 (en) | Method for transposase mediated spatial tagging and analyzing genomic dna in a biological sample | |
US20230287481A1 (en) | Method for transposase mediated spatial tagging and analyzing genomic dna in a biological sample | |
CN112195521A (zh) | 一种基于转座酶的dna/rna共建库方法、试剂盒及应用 | |
CN105624272A (zh) | 基因组预定区域核酸测序文库的构建方法及装置 | |
CN111440896A (zh) | 一种新型β冠状病毒变异检测方法、探针和试剂盒 | |
CN112522382B (zh) | 一种基于液相探针捕获的y染色体测序方法 | |
CN116024324B (zh) | 基因编辑细胞脱靶检测的方法 | |
CN110853708B (zh) | 用于hla分型的核酸捕获探针的设计方法 | |
CN109641933A (zh) | 染色质相互作用的全基因组鉴定 | |
US20240043919A1 (en) | Method for traceable medium-throughput single-cell copy number sequencing | |
CN111705135A (zh) | 一种检测mgmt启动子区甲基化的方法 | |
CN115109842A (zh) | 用于准确的平行定量核酸的高灵敏度方法 | |
WO2019212138A1 (ko) | 차세대 염기서열 분석을 위한 시료 간 교차 오염 탐색용 내부 검정 물질 | |
CN113667714A (zh) | 一种目标区域捕获方法、试剂盒及测序方法 | |
WO2024145924A1 (zh) | 基因编辑细胞脱靶检测的方法 | |
CN111440843A (zh) | 一种利用微量临床穿刺样本进行染色质免疫共沉淀文库制备的方法及其应用 | |
CN112538657B (zh) | 一种脑脊液基因测序建库、检测方法及其应用 | |
CN112858693A (zh) | 一种生物分子检测方法 | |
WO2020259303A1 (zh) | 一种快速构建rna 3'端基因表达文库的方法 | |
CN115279917A (zh) | 多维度解析细胞表观基因组学的方法 | |
CN111088303A (zh) | 模拟血浆cfDNA及制备方法和测序文库的构建方法 | |
CN114317741B (zh) | 一种软组织肉瘤基因检测试剂盒和系统 | |
CN110600082A (zh) | 用于hla分型的核酸捕获探针及其设计方法 | |
CN116377096B (zh) | 幽门螺旋杆菌克拉霉素耐药性分析试剂盒及检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |