CN111349690B - 检测蛋白质dna结合位点的方法 - Google Patents
检测蛋白质dna结合位点的方法 Download PDFInfo
- Publication number
- CN111349690B CN111349690B CN201811584980.9A CN201811584980A CN111349690B CN 111349690 B CN111349690 B CN 111349690B CN 201811584980 A CN201811584980 A CN 201811584980A CN 111349690 B CN111349690 B CN 111349690B
- Authority
- CN
- China
- Prior art keywords
- fluorescent
- dna
- dna fragment
- fragment library
- fluorescence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 120
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 120
- 230000004568 DNA-binding Effects 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 35
- 108020004414 DNA Proteins 0.000 claims abstract description 163
- 239000012634 fragment Substances 0.000 claims abstract description 132
- 238000006116 polymerization reaction Methods 0.000 claims abstract description 58
- 238000012163 sequencing technique Methods 0.000 claims abstract description 48
- 238000012986 modification Methods 0.000 claims abstract description 28
- 230000004048 modification Effects 0.000 claims abstract description 28
- 230000000379 polymerizing effect Effects 0.000 claims abstract description 11
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 claims description 14
- 230000000295 complement effect Effects 0.000 claims description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 10
- 239000007850 fluorescent dye Substances 0.000 claims description 10
- 238000000338 in vitro Methods 0.000 claims description 4
- 238000011068 loading method Methods 0.000 claims description 4
- 238000001215 fluorescent labelling Methods 0.000 claims description 3
- 102000034287 fluorescent proteins Human genes 0.000 claims description 3
- 108091006047 fluorescent proteins Proteins 0.000 claims description 3
- 239000002077 nanosphere Substances 0.000 claims description 3
- 230000012743 protein tagging Effects 0.000 claims description 3
- 238000009396 hybridization Methods 0.000 abstract description 7
- 230000027455 binding Effects 0.000 description 19
- 239000000872 buffer Substances 0.000 description 17
- 238000001514 detection method Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 6
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 101100153581 Bacillus anthracis topX gene Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 101150041570 TOP1 gene Proteins 0.000 description 4
- 101150038500 cas9 gene Proteins 0.000 description 4
- 238000005086 pumping Methods 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 238000003766 bioinformatics method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000011807 nanoball Substances 0.000 description 3
- 229920000136 polysorbate Polymers 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- ZAINTDRBUHCDPZ-UHFFFAOYSA-M Alexa Fluor 546 Chemical compound [H+].[Na+].CC1CC(C)(C)NC(C(=C2OC3=C(C4=NC(C)(C)CC(C)C4=CC3=3)S([O-])(=O)=O)S([O-])(=O)=O)=C1C=C2C=3C(C(=C(Cl)C=1Cl)C(O)=O)=C(Cl)C=1SCC(=O)NCCCCCC(=O)ON1C(=O)CCC1=O ZAINTDRBUHCDPZ-UHFFFAOYSA-M 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000007622 bioinformatic analysis Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- OOTFVKOQINZBBF-UHFFFAOYSA-N cystamine Chemical compound CCSSCCN OOTFVKOQINZBBF-UHFFFAOYSA-N 0.000 description 1
- 229940099500 cystamine Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002337 electrophoretic mobility shift assay Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- -1 polypropylene Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000003335 steric effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提出了检测蛋白质DNA结合位点的方法。包括:将DNA片段库进行测序;去除测序后的DNA片段库中的新生链;以DNA片段库的DNA片段为模板,将不带有荧光标记的dNTP依次聚合在测序接头的3’端,将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位;记录聚合反应后的DNA片段库中的荧光点位置和所述荧光点的荧光强度;将目标蛋白与所述聚合反应后的DNA片段库进行杂交,所述目标蛋白具有荧光修饰;记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度;基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光强度或荧光种类的差异,确定目标蛋白质DNA结合位点。
Description
技术领域
本发明涉及生物技术领域,具体地,本发明涉及检测蛋白质DNA结合位点的方法。
背景技术
生物体内众多生物学过程诸如染色体组装,DNA复制,转录,重组,修复,RNA翻译等都会涉及到DNA与蛋白质的相互作用。而这些蛋白质往往都是通过特异的序列与DNA相互作用的。因此研究清楚蛋白质的与DNA的结合位点对于理解生物的生长、发育和调控具有重要意义,能为基础科学研究提供便利,为医疗服务提供参考。
现有的研究蛋白质与DNA相互作用较为经典的方法有EMSA(凝胶阻滞迁移实验),即在体外用放射性同位素标记DNA,该DNA与蛋白质结合后进行非变性聚丙烯凝胶电泳,结合有蛋白质的DNA迁移速度会比没有结合蛋白质的DNA慢,从而鉴定与蛋白质结合的DNA(Hellman L M,Fried M G.Electrophoretic mobility shift assay(EMSA)fordetecting protein–nucleic acid interactions[J].Nature protocols,2007,2(8):1849.)。
另外一个较为经典的方法是DNase I footprinting(DNase I足迹法),即利用DNase I分别对结合和未结合蛋白质的DNA进行酶切,结合有蛋白质的DNA会由于位阻效应而在结合位点附近不被DNaseI酶切,没有结合蛋白质的DNA则会被DNaseI完全降解,DNaseI处理后经电泳检测获得较为精确的与蛋白质结合的DNA信息(Brenowitz,M.,Senear,D.F.,Shea,M.A.,and Ackers,G.K.1986b.Quantitative DNase I footprint titration:Amethod for studying protein-DNA interactions.Meth.Enzymol.130:132-181.)。
然而,蛋白质DNA结合位点的检测方法仍需要进一步开发和改进。
发明内容
本申请是基于发明人对以下事实和问题的发现和认识作出的:
现有技术中,EMSA法可以鉴定蛋白质结合的DNA片段但是不能确定具体的结合位点,DNase I foorprinting是在已知能结合的片段中确定大致的DNA结合位点,其检测的位点由于空间位阻效应会比实际的结合位点大8-10个碱基(Carey M F,Peterson C L,SmaleS T.DNase I footprinting[J].Cold Spring Harbor Protocols,2013,2013(5):pdb.prot074328.)。且目前这两种方法都不是高通量的。
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明提出了一种能够高通量检测蛋白质的DNA结合位点的方法。
在本发明的第一方面,本发明提出了一种检测蛋白质DNA结合位点的方法。根据本发明的实施例,所述方法包括:将DNA片段库进行测序,以便获得DNA片段库的DNA序列,所述DNA片段库的DNA片段在测序接头互补位后的序列是随机的,所述DNA片段库中的DNA片段预先与所述测序接头互补配对结合;去除测序后的DNA片段库中的新生链;以DNA片段库的DNA片段为模板,将所述测序接头与所述模板进行第二互补配对结合,将不带有荧光标记的dNTP依次聚合在所述测序接头的3’端,将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位;记录聚合反应后的DNA片段库中的荧光点位置和所述荧光点的荧光强度;将目标蛋白与所述聚合反应后的DNA片段库进行杂交,所述目标蛋白具有荧光修饰;记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度;基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光强度或荧光种类的差异,确定目标蛋白质DNA结合位点。根据本发明实施例的检测方法中,以DNA片段为模板,将不带有荧光标记的dNTP依次聚合在测序接头的3’端,将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位,既保证了新生成的DNA产物与自然界的DNA结构基本一致,而不会影响蛋白质的识别、结合和切割,又起到荧光标记DNA的作用。根据本发明实施例的检测方法能够安全高效且高通量地筛选蛋白质的DNA结合位点,精确确定蛋白质具体的DNA结合片段,相对于现有技术,精准度得到大大提升,时间和成本大大节省。
根据本发明的实施例,上述方法还可以进一步包括如下附加技术特征至少之一:
根据本发明的实施例,所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同,所述杂交后的DNA片段库中的荧光点的荧光强度强于聚合反应后的DNA片段库中荧光点的荧光强度,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示。能够理解的是,当目标蛋白结合于DNA片段库某一DNA片段后,如果目标蛋白荧光与碱基荧光在同一通道,目标蛋白所携带的荧光与聚合反应后的DNA片段库中的荧光点重合,目标蛋白的荧光信号与DNA片段库某一DNA片段的荧光信号叠加,使得结合位点处的荧光信号的强度显著高于杂交前DNA片段库中此位点处的荧光信号的强度,如果目标蛋白荧光与碱基荧光在不同的通道,则蛋白通道的荧光强度,结合目标蛋白后比结合目标蛋白前也显著增强,进而可基于杂交后DNA片段库中的荧光点的荧光强度是否强于聚合反应后的DNA片段库中荧光点的荧光强度,来精确判定杂交后的DNA片段库中的荧光点是否为目标蛋白质DNA结合位点。
根据本发明的实施例,所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同,所述杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示。能够理解的是,当带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同,如果杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光,则说明有蛋白质结合到DNA片段库某一DNA片段,则可定性判断杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点。需要说明的是,此处的“荧光不同”是指荧光种类不同,可以理解成荧光物质被激发后所发出的荧光颜色不同。
根据本发明的实施例,进一步基于所确定的目标蛋白质DNA结合位点,确定所述目标蛋白质DNA结合位点的DNA序列。根据本发明实施例的检测方法,可进一步通过生物信息学分析统计得到目标蛋白质DNA结合位点的DNA序列信息。
根据本发明的实施例,所述DNA片段库是以装载在芯片上的DNB(DNA NanoBall)形式存在的。进而利用DNB芯片上DNA片段库进行蛋白质的DNA结合位点的高通量筛选。
根据本发明的具体实施例,所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同,所述杂交后的DNA片段库中的荧光点的荧光强度是所述聚合反应后的DNA片段库中荧光点的荧光强度的至少1.5倍或2倍,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示。发明人发现,若目标蛋白荧光与碱基荧光在同一通道,则通道荧光强度,结合目标蛋白后比结合目标蛋白之前的比值大于1.5,若目标蛋白荧光与碱基荧光在不同的通道,则蛋白通道的荧光强度,结合目标蛋白后比结合目标蛋白之前的比值大于2,则认为该DNB有可能结合蛋白质。
根据本发明的实施例,所述DNA片段库具有18亿个DNA片段。根据发明的具体实施例,所述DNB芯片上最大可以装载18亿个DNA片段,进而可利用DNB(DNA NanoBall)芯片上18亿个DNA片段进行蛋白质的DNA结合位点的高通量筛选。
根据本发明的实施例,所述第一测序和/或聚合反应是在BGISEQ-500测序平台上进行的。
根据本发明的实施例,通过甲酰胺去除第一测序后的DNA片段库中的新生链。发明发现,甲酰胺能有效降低DNA的Tm值,从而达到变性的目的以去除新生链。
根据本发明的实施例,将不带有荧光标记的dNTP依次聚合在所述测序接头3’端是通过35~45个循环的DNA聚合反应实现的,优选地,通过40个循环的DNA聚合反应实现。发明人发现,DNA聚合反应的循环次数不可以少于蛋白质识别DNA序列的长度,否则蛋白质结合不紧密,不利于准确检测DNA结合位点,如本实施例中的cas9,其在测序接头后只要有9bp的DNA长度即可识别,但是cas9蛋白结合实则需要更长的跨度,这样才能使得cas9与目标序列结合更紧密;同时发明人发现,DNA聚合反应的循环次数也不可以长于测序的长度,因为如果超出测序长度,而蛋白质正好结合到了超出的部分则无法进行序列分析。通过35~45个循环的DNA聚合反应将不带有荧光标记的dNTP依次聚合在所述测序接头3’端既可保证目标蛋白与目标序列的紧密结合,又可保证聚合产物不长于测序长度,使得检测结果更加精确和真实可靠。
根据本发明的实施例,将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位是通过一个循环的DNA聚合反应实现的,进而通过单循环将带有荧光标记的碱基聚合在聚合产物的3’端的最后一位,实现DNB的荧光标记,由于每个DNB的位置是固定的,进而可根据这个荧光信号反知该DNB处所对应的DNA片段的序列。
所述目标蛋白的荧光修饰的方式不受特别限制,只要能够实现目标蛋白的荧光修饰即可。根据本发明的具体实施例,所述目标蛋白的荧光修饰是通过荧光二抗修饰、荧光蛋白融合表达或体外荧光标记实现的。
在本发明的第二方面,本发明提出了一种检测蛋白质DNA结合位点的方法。根据本发明的实施例,所述方法包括:将DNA片段以DNA纳米球的形式装载在芯片上,以便获得DNA片段库,所述DNA片段库的DNA片段在测序接头互补位后的序列是随机的,所述DNA片段库中的DNA片段预先与所述测序接头互补配对结合;在BGISEQ-500测序平台上,将所述DNA片段库进行测序,以便获得DNA片段库的DNA序列;利用甲酰胺去除第一测序后的DNA片段库中的新生链;以DNA片段库的DNA片段为模板,将所述测序接头与所述模板进行第二互补配对结合,将不带有荧光标记的dNTP依次聚合在所述测序接头的3’端,聚合反应的循环次数为35~45,优选40;将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位,聚合反应的循环次数为1;记录聚合反应后的DNA片段库中的荧光点的位置和所述荧光点的荧光强度;将目标蛋白与所述聚合反应后的DNA片段库进行杂交,所述目标蛋白具有荧光修饰;记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度;基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光种类或荧光强度的差异,确定目标蛋白质DNA结合位点;其中,当所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同,所述杂交后的DNA片段库中的荧光点的荧光强度强于聚合反应后的DNA片段库中荧光点的荧光强度,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示;当所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同,所述杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示;进一步基于所确定的目标蛋白质DNA结合位点,确定所述目标蛋白质DNA结合位点的DNA序列。根据本发明实施例的检测方法,利用DNB(DNA NanoBall)芯片上成千上万个DNA进行蛋白质的DNA结合位点的高通量筛选,既能精确确定蛋白质的具体结合片段,又能通过生物信息分析得出具体的蛋白质特异性结合位点序列信息,大大节省时间和成本,为DNA结合蛋白研究提供了良好的平台。
附图说明
图1是根据本发明实施例的检测蛋白质DNA结合位点的方法的原理图;以及
图2是根据本发明实施例2的生物信息学分析结果。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
实施例1
为了便于理解,申请人将根据本发明实施例的检测蛋白质DNA结合位点的方法的原理展现在图1中,即DNB片段库经过正常的DNA测序、经处理重新变成单链状态后,用不带荧光标记的dNTP聚合生成DNA双链,再用一个循环的荧光dNTP进行荧光标记,加入荧光修饰的蛋白质,进而根据荧光信号的增强判断哪个DNB被结合,从而分析出蛋白质特征序列。
下面将根据本发明实施例的检测蛋白质DNA结合位点的方法具体描述如下:
一.制备DNB并装载到芯片上
使用大肠杆菌基因组文库或其他随机DNA库,根据BGISEQ-500的制备和装载方法制备DNB并装载到芯片上。
二.SE50测序
按照操作手册使用BGISEQ-500的SE50试剂盒进行单端50bp的测序。
三.用甲酰胺去除新生链并杂交测序接头
1、往芯片中泵入300μL PPS缓冲液;
2、泵入300μL 100%的甲酰胺溶液,并于37℃孵育10分钟;
3、泵入300μL PPS缓冲液;
4、泵入300μL WB2缓冲液进行清洗;
5、泵入300μL Block缓冲液并在55℃孵育5分钟;
6、依次泵入300μL WB1,300μL WB2缓冲液进行清洗;
7、泵入300μL PAW缓冲液,再泵入200μL测序接头,室温孵育20min。
四.用不带荧光的dNTP做40个循环的聚合反应
将BGISEQ-500的SE50试剂盒的5号孔位试剂换成6号孔位试剂,6号孔位保持不变,进行40个循环的无拍照聚合,即完成40个循环的聚合反应。
五.做一个循环的带荧光dNTP测序反应
按照操作手册使用BGISEQ-500的SE50试剂盒进行单端1bp的聚合,并拍照记录下每个DNB的位置。
六.杂交荧光修饰的目标蛋白
依次泵入300μL WB1、WB2缓冲液清洗后,泵入200μL溶于其活性缓冲液的标记荧光的待测蛋白,37℃孵育过夜后用WB2缓冲液清洗三遍。若使用荧光二抗则在清洗后泵入荧光二抗,37℃孵育2小时后用WB2缓冲液清洗三遍。
其中,PPS缓冲液包括0.1%Tween 80,0.1mM Na2EDTA;
WB1缓冲液包括5xSSC,0.05%Tween 20,0.002M胱胺;
WB2缓冲液包括0.05M Tris,0.05M NaCl,0.001M EDTA,0.05%Tween 20;
PAW缓冲液包括10mM柠檬酸;
ICB缓冲液包括0.05M Tris,0.05M NaCl,0.01M EDTA,3mM MgSO4,0.05%Tween20,0.1M(NH4)2SO4;
Block缓冲液是由ICB缓冲液中加入了ddNTP和BG9DNA聚合酶获得的,其中Block缓冲液中包括0.05mM ddNTP和4%BG9DNA。
七.拍照,并根据前后两次拍照结果进行生物信息学分析。
对上述杂交待测蛋白的芯片进行拍照,记录杂交有蛋白质的位点。
数据分析过程:
1.数据过滤,删选出潜在含有蛋白结合位点序列的高丰度测序数据集。
1.1粗过滤,将加入蛋白质前对同于cycle测序反应的3次拍照图片,利用basecall软件判定芯片上每个位置DNB的碱基信息,将3次call base一致的那部分DNB数据保留下来,进入下一轮过滤
1.2细过滤,根据加入蛋白质后所做2次拍照反应获取的DNB荧光亮度信息,计算加入蛋白前后同一DNB同一位点在ACGT 4个通道的荧光强度变化比值,若call base为A,T且A通道光强加蛋白后比加之前的比值大于1.5,或者call base为G,C且光强比值大于2,认为该DNB有较大可能结合蛋白质
将通过上述2步过滤保留下来的DNB ID记录下来,并根据ID获取最初做SE50测序所得50bp的测序序列的前40bp组成长度为40bp的序列数据集,该集合中有相当比例的序列含有蛋白结合位点序列
2.蛋白结合位点探寻
2.1从数据集中寻找高富集的4~8bp长的短序列片段。根据数据集中有大量reads含有蛋白结合序列这一特征,可以推断在4~8bp的短序列里面,一定有一部分因为包含或者包含于结合序列而在数据集里面丰度明显偏高,于是统计所有类型4~8bp序列在数据集中所出现的频率,再统计这些序列在对应参考基因组上出现的频率作为背景,然后计算每种序列频率与背景频率的比值,从每种长度挑选出top25且比值大于1.5的序列作为种子。
2.2种子拼接.对每种长度的短序列分别用挑选出来的top25条做拼接操作,取top1为固定种子,其反向互补序列作为另一个种子,然后从剩余的短序列里面按照频率高低依次尝试与2个种子序列做一个base长度的延伸,若没有延伸成功则退回作为下一轮候选,延伸成功则不退回,直至所有候选序列用光或者剩余序列都无法构成延伸,如此可获得由初始的2条反向互补种子延伸所得的较长序列,然后将其作为正负义链做碱基互补配对,截取其中配对上的最长双链区域,一般认为这段双链序列很有可能就是酶切识别序列。
2.3锁定识别序列:由于蛋白结合序列长短是未知的,上述4~8组合各自所拼接出的双链序列不一定都包含真正的结合位点序列,因此将各mer所预测的序列集合在一起,求最高频的最大共有序列。认为该序列就是蛋白结合序列。
2.4对中间含有非固定序列的结合位点的探究:对于中间含有若干非固定碱基的识别位点,上述2.3过程往往得不到最大共有序列,当出现该种结果时,启动另一条预测通路,用上述2.2,2.3的方法来分别对识别位点2端的固定序列各自做拼接预测获得2个短固定序列,再针对过滤数据做统计,记录那些40bp长reads中以上述2个固定序列作为2端的片段,统计出符合该特征的所有序列的频率,取排在top1的序列长度作为识别位点长度,上述2固定序列分别作为识别序列2端的特有固定序列,中间则是非固定序列,用N表示
2.4粗验证:根据上一步骤所预测出的结合位点序列,统计过滤数据集里与预测序列等长的所有类型序列的频率,从高到低排序,验证预测序列是否排top1。
其中使系统带上荧光标记可以是直接的也可以是间接的,例如使用荧光二抗,荧光蛋白融合表达,体外荧光标记等。
实施例2
在本实施例中,发明人以dcas9(dead-cas9,去除切割活性的cas9)及相应的sgRNA(single guide RNA)在BGISEQ-500平台验证为例,检测能否分析得出该sgRNA的序列信息。Cas9是一种RNA引导的DNA靶向核酸酶,它的特异性识别位点PAM(Protospacer AdjacentMotif)序列为NGG位于sgRNA的下游。
本实施例中所用到的dcas9以及荧光标记试剂盒如下表1所示:
表1:
该实施例所用的sgRNA的序列为CTACGATCCGACTTACAGAT,其中前14个碱基与接头末尾的14个碱基一致。用表1所提到的SNAP-Surface试剂盒预先对dcas9蛋白进行AlexaFluor546的荧光标记。分为Lane1实验组(加荧光标记的dcas9)和Lane2对照组(加不带荧光标记的dcas9)进行平行实验,其他实验条件及步骤均一致。具体实验过程如实施例1所述。
结果:生物信息分析的荧光信号增强的DNB插入序列前9位的碱基分布如图2所示,其中,横坐标是插入序列的碱基位置,接头下面第一位记为1,纵坐标为荧光信号增强的DNB中各位置各碱基所占的比例,碱基高度越高,表明所占比例越大。结果显示,共有序列为ACAGATNGG,与原本的sgRNA序列的后六位一致,其中NGG也符合cas9识别的PAM序列原则。
结论:根据本发明实施例的检测系统能准确地筛选出蛋白质的DNA结合位点,并能通过该生物信息分析方法得出精确的DNA结合位点序列。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (11)
1.一种检测蛋白质DNA结合位点的方法,其特征在于,包括:
将DNA片段库进行测序,以便获得DNA片段库的DNA序列,所述DNA片段库的DNA片段在测序接头互补位后的序列是随机的,所述DNA片段库中的DNA片段预先与所述测序接头互补配对结合;
去除测序后的DNA片段库中的新生链;
以DNA片段库的DNA片段为模板,再将测序接头与所述模板进行第二互补配对结合,将不带有荧光标记的dNTP依次聚合在测序接头的3’端,将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位;
记录聚合反应后的DNA片段库中的荧光点位置和所述荧光点的荧光强度;
将目标蛋白与所述聚合反应后的DNA片段库进行杂交,所述目标蛋白具有荧光修饰;
记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度;
基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光强度或荧光种类的差异,确定目标蛋白质DNA结合位点;
其中,当所述带有荧光标记的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同,所述杂交后的DNA片段库中的荧光点的荧光强度强于聚合反应后的DNA片段库中荧光点的荧光强度,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示;
当所述带有荧光标记的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同,所述杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示;
将不带有荧光标记的dNTP依次聚合在测序接头的3’端是通过35~45个循环的DNA聚合反应实现的;
将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位是通过一个循环的DNA聚合反应实现的。
2.根据权利要求1所述的方法,其特征在于,所述杂交后的DNA片段库中的荧光点的荧光强度是所述聚合反应后的DNA片段库中荧光点的荧光强度的2倍或1.5倍,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示。
3.根据权利要求1所述的方法,其特征在于,进一步基于所确定的目标蛋白质DNA结合位点,确定所述目标蛋白质DNA结合位点的DNA序列。
4.根据权利要求1所述的方法,其特征在于,所述DNA片段库是以装载在芯片上的DNA纳米球形式存在的。
5.根据权利要求1所述的方法,其特征在于,所述DNA片段库具有18亿个DNA片段。
6.根据权利要求1所述的方法,其特征在于,所述测序和/或聚合反应是在BGISEQ-500测序平台上进行的。
7.根据权利要求1所述的方法,其特征在于,通过甲酰胺去除测序后的DNA片段库中的新生链。
8.根据权利要求1所述的方法,其特征在于,将不带有荧光标记的dNTP依次聚合在测序接头的3’端是通过40个循环的DNA聚合反应实现的。
9.根据权利要求1所述的方法,其特征在于,所述目标蛋白的荧光修饰是通过荧光二抗修饰、荧光蛋白融合表达或体外荧光标记实现的。
10.一种检测蛋白质DNA结合位点的方法,其特征在于,包括:
将DNA片段以DNA纳米球的形式装载在芯片上,以便获得DNA片段库,所述DNA片段库的DNA片段在测序接头互补位后的序列是随机的,所述DNA片段库中的DNA片段预先与所述测序接头互补配对结合;
在BGISEQ-500测序平台上,将所述DNA片段库进行测序,以便获得DNA片段库的DNA序列;
利用甲酰胺去除测序后的DNA片段库中的新生链;
以DNA片段库的DNA片段为模板,再将测序接头与所述模板进行第二互补配对结合,将不带有荧光标记的dNTP依次聚合在测序接头的3’端,聚合反应的循环次数为35~45;
将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位,聚合反应的循环次数为1;
记录聚合反应后的DNA片段库中的荧光点的位置和所述荧光点的荧光强度;
将目标蛋白与所述聚合反应后的DNA片段库进行杂交,所述目标蛋白具有荧光修饰;
记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度;
基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光种类或荧光强度的差异,确定目标蛋白质DNA结合位点;
其中,当所述带有荧光标记的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同,所述杂交后的DNA片段库中的荧光点的荧光强度强于聚合反应后的DNA片段库中荧光点的荧光强度,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示;
当所述带有荧光标记的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同,所述杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光,是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示;
进一步基于所确定的目标蛋白质DNA结合位点,确定所述目标蛋白质DNA结合位点的DNA序列。
11.根据权利要求10所述的方法,其特征在于,将不带有荧光标记的dNTP依次聚合在测序接头的3’端是通过40个循环的DNA聚合反应实现的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811584980.9A CN111349690B (zh) | 2018-12-24 | 2018-12-24 | 检测蛋白质dna结合位点的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811584980.9A CN111349690B (zh) | 2018-12-24 | 2018-12-24 | 检测蛋白质dna结合位点的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111349690A CN111349690A (zh) | 2020-06-30 |
CN111349690B true CN111349690B (zh) | 2024-05-10 |
Family
ID=71190410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811584980.9A Active CN111349690B (zh) | 2018-12-24 | 2018-12-24 | 检测蛋白质dna结合位点的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111349690B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1287177A (zh) * | 2000-06-15 | 2001-03-14 | 上海交通大学 | 筛选基因变异和蛋白质结合的dna片段的方法 |
CN1746318A (zh) * | 2004-09-10 | 2006-03-15 | 王进科 | 核酸外切酶保护dna探针杂交dna微阵列芯片检测dna结合蛋白 |
JP2009278866A (ja) * | 2006-09-04 | 2009-12-03 | Olympus Corp | Dnaに於けるdna結合性タンパク質の結合部位の検出方法 |
WO2018232086A1 (en) * | 2017-06-14 | 2018-12-20 | Board Of Regents, The University Of Texas System | Chip hybridized association-mapping platform and methods of use |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006078313A (ja) * | 2004-09-09 | 2006-03-23 | Hitachi Software Eng Co Ltd | タンパク質の結合位置同定方法 |
US10435738B2 (en) * | 2014-01-10 | 2019-10-08 | Kyoto University | RNA microarray for detecting interaction between protein and RNA containing a higher-order structure |
-
2018
- 2018-12-24 CN CN201811584980.9A patent/CN111349690B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1287177A (zh) * | 2000-06-15 | 2001-03-14 | 上海交通大学 | 筛选基因变异和蛋白质结合的dna片段的方法 |
CN1746318A (zh) * | 2004-09-10 | 2006-03-15 | 王进科 | 核酸外切酶保护dna探针杂交dna微阵列芯片检测dna结合蛋白 |
JP2009278866A (ja) * | 2006-09-04 | 2009-12-03 | Olympus Corp | Dnaに於けるdna結合性タンパク質の結合部位の検出方法 |
WO2018232086A1 (en) * | 2017-06-14 | 2018-12-20 | Board Of Regents, The University Of Texas System | Chip hybridized association-mapping platform and methods of use |
Non-Patent Citations (4)
Title |
---|
Bipasha Dey et al..DNA–protein interactions: methods for detection and analysis.《Mol Cell Biochem》.2012,第365卷(第1-2期),第279-299页. * |
Jason D Buenrostro et al..Quantitative analysis of RNA-protein interactions on a massively parallel array reveals biophysical and evolutionary landscapes.《Nat Biotechnol》.2014,第32卷(第6期),第562-568页. * |
Michael F Berge et al..Universal protein-binding microarrays for the comprehensive characterization of the DNA-binding specificities of transcription factors.《Nature Protocols》.2009,第4卷(第3期),摘要、第396页左栏第3段-第399页右栏第1段、图1、图3、图5. * |
廉德源.基于DNase信号的蛋白质结合位点识别方法研究.《中国优秀硕士学位论文全文数据库 基础科学辑》.2018,(第06期),A006-24. * |
Also Published As
Publication number | Publication date |
---|---|
CN111349690A (zh) | 2020-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230049314A1 (en) | Methods for Identifying Multiple Epitopes in Selected Sub-Populations of Cells | |
JP6761467B2 (ja) | シークエンシング技術におけるオフターゲット補足の低減 | |
EP3642358A1 (en) | Systems and methods for identification of nucleic acids in a sample | |
US20080261204A1 (en) | Polynucleotide Ligation Reactions | |
Matochko et al. | Next-generation sequencing of phage-displayed peptide libraries | |
CA2920250A1 (en) | Dna sequencing and epigenome analysis | |
Quinodoz et al. | SPRITE: a genome-wide method for mapping higher-order 3D interactions in the nucleus using combinatorial split-and-pool barcoding | |
US20130059736A1 (en) | Methods and compositions for profiling rna molecules | |
US20190360037A1 (en) | Methods and systems for nucleic acid sequencing validation, calibration and normalization | |
CN115433768B (zh) | 一种基于ngs扩增子测序技术的igh超突变检测方法及系统 | |
Yoshinaga et al. | Genome sequencing | |
KR20170133270A (ko) | 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도 | |
CN111349690B (zh) | 检测蛋白质dna结合位点的方法 | |
Faccioli et al. | From single genes to co-expression networks: extracting knowledge from barley functional genomics | |
Binan et al. | Exploiting molecular barcodes in high-throughput cellular assays | |
WO2021076423A1 (en) | Detection of sequences uniquely associated with a dna target region | |
C. Christodoulou et al. | Quantification of gene transcripts with deep sequencing analysis of gene expression (DSAGE) using 1 to 2 µg total RNA | |
Szelinger et al. | Bar-coded, multiplexed sequencing of targeted DNA regions using the Illumina Genome Analyzer | |
CN117672343B (zh) | 测序饱和度评估方法及装置、设备及存储介质 | |
WO2023175018A1 (en) | Concurrent sequencing of forward and reverse complement strands on separate polynucleotides | |
Saha et al. | Proteomics Informed by Transcriptomics | |
Jordi | Development of Proximity Ligation Assay variants for single cell proteomics | |
Rapley | Molecular cloning and DNA sequencing | |
KR20230154658A (ko) | Ngs 분석에서의 itd 분석을 위한 씨드 서열의 생성 방법 및 장치 | |
WO2023130049A1 (en) | Next-generation sequencing for protein measurement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |