CN111647052B - 用于识别g-四链体的多肽探针及其在检测细胞中g-四链体的应用 - Google Patents

用于识别g-四链体的多肽探针及其在检测细胞中g-四链体的应用 Download PDF

Info

Publication number
CN111647052B
CN111647052B CN202010413944.7A CN202010413944A CN111647052B CN 111647052 B CN111647052 B CN 111647052B CN 202010413944 A CN202010413944 A CN 202010413944A CN 111647052 B CN111647052 B CN 111647052B
Authority
CN
China
Prior art keywords
quadruplex
dna
cells
artificial sequence
polypeptide probe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010413944.7A
Other languages
English (en)
Other versions
CN111647052A (zh
Inventor
谭铮
郑克威
郑金平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHANGZHI MEDICAL COLLEGE
Original Assignee
CHANGZHI MEDICAL COLLEGE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHANGZHI MEDICAL COLLEGE filed Critical CHANGZHI MEDICAL COLLEGE
Priority to CN202010413944.7A priority Critical patent/CN111647052B/zh
Priority to US16/896,196 priority patent/US11767343B2/en
Publication of CN111647052A publication Critical patent/CN111647052A/zh
Application granted granted Critical
Publication of CN111647052B publication Critical patent/CN111647052B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/06Linear peptides containing only normal peptide links having 5 to 11 amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/133Detection mode being characterised by the assay principle conformational analysis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Toxicology (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种用于识别G‑四链体的多肽探针及其在检测细胞中G‑四链体的应用。其中,用于识别G‑四链体的多肽探针包括2~4个G‑四链体结合结构域和用于连接相邻所述G‑四链体结合结构域的连接肽,所述G‑四链体结合结构域包括一个特异性结构区,所述特异性结构区的氨基酸序列为PGHLKGREIGMWY(SEQ ID NO.1)。本发明提供的多肽探针特异性强,同时与细胞内的还原环境不存在不相容的问题,可以应用于检测细胞中G‑四链体。

Description

用于识别G-四链体的多肽探针及其在检测细胞中G-四链体的 应用
技术领域
本发明属于生物探针技术领域,尤其涉及一种用于识别G-四链体的多肽探 针及其在检测细胞中G-四链体的应用。
背景技术
G-四链体是由富含鸟嘌呤的核酸形成的四链高级结构。潜在的G-四链体形 成序列(PQS)在高等动物细胞的基因组中的含量极其丰富,基因组中G-四链 体的检测和定量对研究G-四链体的生物学功能非常重要。尽管体外实验发现G- 四链体易于在单链核酸中形成,但细胞中的环境却更复杂。比如:染色体中的 富含鸟嘌呤的序列受限于长双链DNA,而且两条互补DNA链彼此配对结合。 此外,细胞核中DNA被大量的蛋白质结合并压缩。这些情况都不利于G-四链 体的形成。最近研究发现,使用G-四链体抗体的免疫荧光或免疫共沉淀实验可 以在化学固定的人细胞中检测到G-四链体。然而,由于常规的固定剂例如甲醛, 乙醇和乙酸等可能会让核酸变性,细胞的固定,透化或染色过程有可能导致G- 四链体生成。因此,G-四链体是否能在细胞中形成依然存在争议,许多生物学 家仍然不完全相信它们的存在。
G-四链体的抗体是一种有效识别靶标的探针,却不适合在细胞中检测G-四 链体,因为细胞内的还原环境与维持抗体空间结构所需的二硫键不相容。在细 胞中抗体极易受损,导致其仅在由长簇鸟嘌呤序列组成的端粒DNA中检测到 G-四链体。天然的G-四链体结合蛋白也不适合检测G-四链体,因为它们通常具 有多个功能结构域,可以与靶标之外的其他蛋白质发生相互作用。它们有可能 因为与其他蛋白的相互作用被定位到DNA或RNA上,导致非特异性识别。因 此,我们需要更合适的蛋白探针来检测和定量G-四链体,并探索它们在细胞中 的功能。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种用于识别G-四 链体的多肽探针,其解决现有探针无法应用于检测细胞中G-四链体的技术问题。
本发明的目的之二在于提供上述多肽探针在检测细胞中G-四链体的应用, 解决现有技术无法检测细胞中G-四链体的问题。
本发明的目的之一采用如下技术方案实现:一种用于识别G-四链体的多肽 探针,包括2~4个G-四链体结合结构域和用于连接相邻所述G-四链体结合结 构域的连接肽,所述G-四链体结合结构域包括一个特异性结构区,所述特异性 结构区的氨基酸序列为PGHLKGREIGMWY(SEQ ID NO.1)。
优选地,所述G-四链体结合结构域的氨基酸数目为23个。
优选地,所述G-四链体结合结构域的氨基酸序列为 HPGHLKGREIGMWYAKKQGQKNK(SEQ ID NO.2)。
优选地,所述G-四链体结合结构域的数量为2个。
优选地,所述连接肽包括2~4个六肽,所述六肽的序列为GTGSGA。
优选地,所述六肽的数量为3个。
优选地,所述多肽探针还包括位于所述多肽探针C端的蛋白标签。
本发明的目的之二采用如下技术方案实现:一种多肽探针在检测细胞中G- 四链体的应用。
优选地,采用染色质免疫沉淀-二代测序方法检测细胞中的G-四链体。
优选地,细胞来自于人类、小鼠或鸡。
相比现有技术,本发明的有益效果在于:结构简单,与其他蛋白质的非特 异性相互作用小,并且G-四链体结合结构域之间的协同作用使其对G-四链体的 识别具有极高的亲和力和选择性,因此,本发明提供的多肽探针特异性强,同 时与细胞内的还原环境不存在不相容的问题,可以应用于检测细胞中G-四链体。
附图说明
图1为G4P与不同构型G-四链体的亲和力图;
图2为G4P与G-四链体结合的核磁共振结构图;
图3为比较G4P和单体RHAU23对G-四链体的亲和力图;
图4为人类A549,NCI-H1975,HeLa-S3,293T,小鼠3T3和鸡DF-1细胞 的基因中G4P结合DNA信号分布曲线图;
图5为G4P-ChIP检测到的人不同细胞系中G-四链体形成位点的实例图;
图6为G4P-ChIP检测到的小鼠3T3细胞中G-四链体形成位点的实例图;
图7为G4P-ChIP检测到的鸡DF-1细胞中G-四链体形成位点的实例图;
图8为G4P在4G PQS处结合的DNA占总测序DNA的百分比;
图9A为通过ChIP-qPCR验证G4P结合DNA的富集图,其中定量PCR模 板区域用箭头指示;
图9B为通过ChIP-qPCR验证G4P结合DNA的富集图,其中G4P在qPCR 区域的富集倍数为两次重复的平均值加减变化范围;
图10为蛋白momomer、G4P、triplex和tetrad分别与G-四链体DNA结合 的电泳图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的 是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任 意组合形成新的实施例。
本发明提供一种用于识别G-四链体的多肽探针,包括2~4个G-四链体结 合结构域和用于连接相邻G-四链体结合结构域的连接肽,G-四链体结合结构域 包括一个特异性结构区,特异性结构区的氨基酸序列为PGHLKGREIGMWY (SEQ ID NO.1)。本发明提供的多肽探针包含的特异性结构区是G-四链体解旋酶 (RHAU)特异性结合G-四链体的决定性元件,并且本发明提供的多肽探针结 构简单,与其他蛋白质的非特异性相互作用小,而2~4个G-四链体结合结构域 的协同作用使其对G-四链体的识别具有极高的亲和力和选择性,所以该多肽探 针特异性强,并且与细胞内的还原环境不存在不相容的问题,因此,本发明提 供的多肽探针可以应用于检测细胞中G-四链体。
优选地,G-四链体结合结构域的氨基酸数目为23个。
优选地,G-四链体结合结构域的氨基酸序列为 HPGHLKGREIGMWYAKKQGQKNK(SEQ.ID.No.2)。
优选地,G-四链体结合结构域的数量为2个。通过该种方式,本发明提供 的多肽探针可以像夹子一样结合在G-四链体的两个末端G平面上,这种双位点 结合的协同作用确保了探针与G-四链体紧密的结合。
优选地,连接肽包括2~4个六肽,六肽的序列为GTGSGA。连接肽由一段 柔性氨基酸形成的短肽。
优选地,六肽的数量为3个。
优选地,多肽探针还包括位于多肽探针C端的蛋白标签。蛋白标签为 3*FLAG标签,用于与相应的抗体结合。
本发明还提供一种上述多肽探针在检测细胞中G-四链体的应用。
优选地,采用染色质免疫沉淀-二代测序方法检测细胞中的G-四链体。
优选地,检测来自于人类、小鼠或鸡的细胞中的G-四链体。
通过对细胞中的G-四链体进行检测,使得我们能够在全基因组范围和目标 基因上检测G-四链体的形成,对研究G-四链体的生物学功能起着非常积极的作 用。
以下以包括两个G-四链体结合结构域、连接肽设有3个六肽(GTGSGA)、 C端标签蛋白为FLAG的多肽探针为例对本发明提供的用于识别G-四链体的多 肽探针作详细说明,为了便于该探针的提取纯化,在探针的N端插入了标签蛋 白HIS,定义本发明提供的包括两个G-四链体结合结构域的多肽探针为G4P, 定义G-四链体结合结构域为RHAU23。G4P的基因序列如SEQ ID NO.3所示, 氨基酸序列如SEQ ID NO.4所示。
实施例1
G4P的制备。
将G4P的基因序列插入到pet28b载体的Nde I和EcoR I酶切位点之间,通 过质粒转化到BL21-DE3表达菌中,细菌培养到OD 0.5时加入0.8mM终浓度 IPTG,37℃诱导4小时,然后进行蛋白提取、纯化,蛋白提取使用CapturemTM His-Tagged Purification MiniprepKit(TAKARA)。纯化后的蛋白在溶液:20mM Tris-HCl(pH 7.4),150mM NaCl,0.1mM EDTA,50%甘油中储存,保存在-20℃。
实施例2
G4P识别G-四链体的特异性验证。
在本实施例中,采用酶联免疫吸附法测定G4P与21个不同序列的G-四链 体以及几个非G-四链体的对照核酸之间的结合能力。具体方法为:将生物素化 的21种寡核苷酸(序列见表1)在含有10mM Tris-HCl(pH 7.4)、150mM KCl的缓冲液中加热至95℃,然后缓慢退火冷却至20℃。将退火的寡核苷酸固 定在链霉亲和素包被的多孔板(Sigma-Aldrich)上,然后与相应浓度的G4P或 RHAU23一起孵育。使用抗FLAG小鼠单克隆抗体(TransgenBiotech,中 国),HRP偶联山羊抗小鼠IgG(H+L)二抗(Transgen Biotech,中国)和 TMBELISA底物(Transgen Biotech,中国),按照制造商的说明书进行操作。 在Multi-PlateReader(Biotek,美国)上测量450nm处的吸光度。从结合曲线 获得解离常数,数据的标准差来自三个重复实验的平均值。
表1为与G4P结合的不同G-四链体的结构以及结合Kd值
Figure BDA0002494250310000061
Figure BDA0002494250310000071
Figure BDA0002494250310000081
图1为G4P与不同构型G-四链体的亲和力图,其中横坐标表示探针的浓度, 纵坐标表示吸光度。
从表1和图1中可以看出,在经典DNA和RNAG-四链体,分子间DNA G-四链体,DNA:RNA杂合体G-四链体,G-空缺的G-四链体(GVBQs)和 侧链凸起的G-四链体等21个G-四链体中,G4P对其中的16个G-四链体结合 的解离常数(Kd)值在nM以下,对其中5个G-四链体结合的Kd值在1-3 nM。G4P对全部G-四链体结合的Kd值范围为0.31至3.11nM,均在一个数量 级内。说明本发明提供的多肽探针G4P对G-四链体亲和力很高,不仅识别传 统的平行G-四链体,而且也识别非传统的G-四链体,比如:有一个8-15个核 苷酸的环的G-四链体、含G缺口的G-四链体(GVBQ)、具有凸起侧链的G- 四链体。另外,G4P与非G-四链体的DNA或RNA比如:单链DNA,双链 DNA(dsDNA),单链RNA(ssRNA),RNA发夹,DNA:RNA杂交双链,i- motif等没有结合。说明本发明提供的多肽探针特异性强。
图2示出G4P与G-四链体结合的核磁共振(NMR)结构图,显示G-四链 体的两个末端鸟嘌呤平面都可以被RHAU23结合,G4P中的两个RHAU23单元 像夹子一样结合在G-四链体的两个末端G平面上,这种双位点结合的协同作用 确保了G4P与G-四链体紧密的结合。
另外,还进行了本发明提供的G4P与具有单个G-四链体结合结构域的多肽 探针对不同G-四链体的亲和力的对比试验,定义包含单个G-四链体结合结构域 的G-四链体探针为单体RHAU23。图3为比较G4P和单体RHAU23对G-四链 体的亲和力图,其中横坐标表示探针的浓度,纵坐标表示吸光度。从图中可以 看出,单体RHAU23偏好结合平行G-四链体,G4P对平行和非平行G-四链体 的结合几乎没有区别,并且G4P对平行G-四链体的结合能力是单体RHAU23 的10倍以上。
实施例3
G4P识别细胞中的G-四链体。
为了识别细胞中的G-四链体,本发明将G4P在人A549细胞中表达并且利 用它进行G-四链体的免疫共沉淀。G4P结合的DNA建库后进行二代测序,然 后将测序结果中的DNA序列匹配到基因组相应的位点。
主要步骤如下:
G4P-ChIP质粒的构建:
编码G4P的DNA在Generay Biotechnology(中国上海)合成,DNA序列 插入pIRES2-EGFP载体的Nhe I和EcoRI位点之间获得pG4P-IRES2-EGFP。在Sangon(中国上海)合成SV40大抗原的核定位信号肽(NLS:PKKKRKV)的 编码序列,插入pG4P-IRES2-EGFP的Nhe I位点的,获得质粒 pNLS-G4P-IRES2-EGFP。
从pNLS-G4P-IRES2-EGFP扩增表达NLS-G4P和eGFP的DNA片段,插入 AAVS1供体质粒的Spe I和Sal I位点之间。AAVS1位点的gRNA序列 (5'-GTCACCAATCCTGTCCCTAG-3')是通过在线CRISPR工具(crispr.mit.edu) 设计的,并插入到PX330质粒的两个Bbs I位点之间。
细胞系:A549,NCI-H1975、293T,HeLa-S3、3T3和DF-1细胞由中国科 学院干细胞库提供。
细胞培养条件:细胞在含10%胎牛血清,100U/ml青霉素,和0.1mg/ml链 霉素的DMEM培养基中培养。
瞬时转染、基因敲入:
瞬时转染:将细胞在15cm皿中培养至70-80%的密度,根据说明书使用lipofectamine 3000(Thermo Scientific)将30μg pNLS-G4P-IRES2-EGFP质粒转 染进细胞。转染后的细胞再培养24小时。
基因敲入:使用lipofectamine 2000(Thermo Scientific)将含有G4P和AAVS1gRNA的AAVS1供体和PX330质粒共转染到293T细胞中。24小时后,通过 流式细胞仪(MoFloXDP,Beckman)将GFP阳性单细胞分选到96孔板中。细 胞培养两周,然后通过PCR验证稳定表达G4P的细胞系。
G4P-ChIP和DNA文库构建:
在室温下,将约0.5-1×107个瞬时或稳定转染表达G4P的细胞用1%甲醛交 联20分钟。用终浓度0.125M甘氨酸中和甲醛15分钟。固定的细胞用PBS洗 涤两次,离心后重悬在NP-40缓冲液(10mM Tris-HCl pH 7.4、150mM NaCl,0.5%NP-40和2mM AEBSF)中,在冰上孵育10分钟。800g离心5分钟后, 将细胞沉淀重悬于CHAPS缓冲液(20mM Tris-HCl pH 7.4、0.5mM EGTA,50 mM NaCl,0.5%CHAPS,10%甘油和2mM AEBSF)中。将重悬的细胞在冰上 孵育30分钟,然后800g下离心5分钟。将沉淀重悬于1ml的1×dsDNase缓冲 液中,加入50μldsDNase(Invitrogen,EN0771),在37℃孵育20分钟并持续 混匀。加入终浓度20mM的EDTA以终止酶切反应。4℃下15,000g离心沉淀细 胞碎片,收集上清液放冰上。将细胞碎片沉淀重悬于500μl洗涤缓冲液(150mM NaCl,10mM Tris-HCl,pH 7.4、0.1mM EDTA,0.5%Triton X-100)中并在冰 冷的水浴中超声处理30-60秒。15000g下离心5分钟后,收集上清液并与上一步骤的上清液合并。
制备DNA文库,用洗涤缓冲液(10mM Tris-HCl,pH 8.0、150mM NaCl 和0.5%Triton X-100)洗涤50μl抗FLAG M2磁珠(Sigma-Aldrich),并将其在 含75μg/ml单链鱼精DNA和1mg/ml BSA的洗涤缓冲液中封闭。留下1%的 染色质片段保存为对照,剩余的片段与封闭后的抗FLAG磁珠在4℃下旋转孵育 3小时。磁珠用洗涤缓冲液洗涤十次,期间更换新的EP管三次。用300μg/ml的 3×FLAG肽(Sigma-Aldrich)洗脱结合的染色质片段,4℃下孵育1小时。将洗 脱的染色质片段和input样品与蛋白酶K在65℃下孵育过夜。DNA依次用RNase A和蛋白酶K消化后,苯酚:氯仿:异戊醇抽提,然后乙醇沉淀纯化DNA片段。 使用NEBNextUltra II DNA LibraryPrep试剂盒和回收的DNA片段构建文库。二 代测序是由金唯智(中国苏州)完成,使用Illumina HiSeq X 10平台。
ChIP-qPCR:
表2为ChIP-qPCR的引物序列,用于扩增PQS近端和远端区域的引物
Figure BDA0002494250310000111
Figure BDA0002494250310000121
Figure BDA0002494250310000131
使用GoTaq qPCR预混液(Promega)和qTOWER 2.2进行qPCR反应。循 环条件是在95℃下20s,然后分别在95℃下30s和60℃下30s进行45个循环。 ChIP样品中基因位点的信号富集倍数是相对于input样品,以无PQS区域作为 参照来计算。
ChIP-Seq数据分析:
二代测序的数据使用Bowtie2匹配到基因组上。通过samtools过滤以消除 参数匹配质量低于20的结果,通过samtools过滤去除重复项后,然后写入bam 文件。bam文件由deeptools bamCompare处理,以比率或减法模式生成bigwig 文件。分别使用deeptools,computeMatrix,plotProfile和plotHeatmap从bigwig 文件生成测序信号的分布曲线和热图。从UCSC网站(http://genome.ucsc.edu/ 下载的NCBI RefSeq的坐标文件然后去除坐标重复项。使用--qvalue 0.001, -keep-dup 1和其他默认参数值,以及macs2软件计算DNA信号发生富集的峰 位点。公共数据库的ChIP-Seq数据是从GEO(https://www.ncbi.nlm.nih.gov/geo/) 或Encode(https://www.encodeproject.org/)数据库下载,同上所述流程进行了数 据处理。
本发明通过上述方法分别对人类A549,NCI-H1975,HeLa-S3,293T,小 鼠3T3和鸡DF-1细胞中G-四链体进行检测,结果请参阅图4至图7。
G4P识别细胞中G-四链体的能力首先通过DNA片段的富集来证明,这些 富集的片段中包含了经典的G-四链体形成序列,定义这种G-四链体形成的序列 为4G PQS。G4P识别细胞中G-四链体的能力还可以通过4G PQS坐标附近DNA 片段的富集来证明。当4G PQS的坐标被随机打乱后,这些坐标上DNA片段的 富集现象消失。另外,本发明通过ChIP-qPCR技术进一步验证G4P体对G-四链 体的识别。图8为G4P在4G PQS处结合的DNA占总测序DNA的百分比,图 9A和图9B为通过ChIP-qPCR进一步验证G4P结合DNA的富集。从上述结果 可以看出,G4P能够在4G PQS处特异性识别G-四链体。因此,本发明提供的 G4P可以识别细胞中的G-四链体。
本发明提供的G4P具有更小的尺寸,更高的亲和力,对传统类型的G-四链 体和非传统类型的G-四链体均可以结合,由于去除了天然RHAU蛋白中90%以 上的氨基酸,G4P不会与其他蛋白发生复杂的相互作用,因此,识别G-四链体 的特异性高。另外,本发明提供的G4P克服了抗体的二硫键问题,可以在细胞 中检测G-四链体。
实施例4
分别包括1-4个G-四链体结合结构域RHAU23的蛋白结合G四链体能力的 检测。
定义包括一个G-四链体结合结构域RHAU23的蛋白为monomer,其氨基酸 序列如SEQ ID NO.5所示;定义包括三个G-四链体结合结构域RHAU23的蛋 白为triplex,其氨基酸序列如SEQ ID NO.6所示;定义包括四个G-四链体结合 结构域RHAU23的蛋白为tetrad,其氨基酸序列如SEQ ID NO.7所示。
分别将monomer、G4P、triplex和tetrad的基因序列插入到pet28b载体的 Nde I和EcoR I酶切位点之间,通过质粒转化到BL21-DE3表达菌中,细菌培养 到OD 0.5时加入0.8mM终浓度IPTG,37℃诱导4小时,然后进行蛋白提取、 纯化,分别得到蛋白monomer、G4P、triplex和tetrad。蛋白提取使用CapturemTM His-Tagged Purification Miniprep Kit(TAKARA)。
将获得的蛋白和G-四链体DNA以摩尔浓度比2:1和6:1进行结合,其中 G-四链体DNA序列为(GGGT)4,浓度为100nM。G-四链体DNA和蛋白结合后 在含75mM KCl的非变性聚丙烯酰胺凝胶里电泳。见图10,为蛋白monomer、 G4P、triplex和tetrad分别结合G-四链体的电泳图。其中,G-四链体DNA被蛋 白结合后电泳速度变慢,生成一条新的条带。从图中可以看出,蛋白G4P、triplex 和tetrad均与G-四链体DNA进行结合,其中G4P结合G-四链体的能力最强。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护 的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替 换均属于本发明所要求保护的范围。
Figure BDA0002494250310000161
/>
Figure BDA0002494250310000171
/>
Figure BDA0002494250310000181
/>
Figure BDA0002494250310000191
/>
Figure BDA0002494250310000201
/>
Figure BDA0002494250310000211
/>
Figure BDA0002494250310000221
/>
Figure BDA0002494250310000231
/>
Figure BDA0002494250310000241
/>
Figure BDA0002494250310000251
/>
Figure BDA0002494250310000261
/>
Figure BDA0002494250310000271
/>
Figure BDA0002494250310000281
/>
Figure BDA0002494250310000291
/>
Figure BDA0002494250310000301
/>
Figure BDA0002494250310000311
/>
Figure BDA0002494250310000321
/>
Figure BDA0002494250310000331
/>
Figure BDA0002494250310000341
/>
Figure BDA0002494250310000351
/>
Figure BDA0002494250310000361
/>
Figure BDA0002494250310000371
/>
Figure BDA0002494250310000381
/>
Figure BDA0002494250310000391
/>
Figure BDA0002494250310000401
/>
Figure BDA0002494250310000411
/>
Figure BDA0002494250310000421
/>
Figure BDA0002494250310000431
/>
Figure BDA0002494250310000441
/>
Figure BDA0002494250310000451
/>
Figure BDA0002494250310000461
/>
序列表
<110> 长治医学院
<120> 用于识别G-四链体的多肽探针及其在检测细胞中G-四链体的应用
<130> SXCZ-00101-UCN
<160> 70
<170> SIPOSequenceListing 1.0
<210> 1
<211> 13
<212> PRT
<213> Artificial Sequence
<400> 1
Pro Gly His Leu Lys Gly Arg Glu Ile Gly Met Trp Tyr
1 5 10
<210> 2
<211> 23
<212> PRT
<213> Artificial Sequence
<400> 2
His Pro Gly His Leu Lys Gly Arg Glu Ile Gly Met Trp Tyr Ala Lys
1 5 10 15
Lys Gln Gly Gln Lys Asn Lys
20
<210> 3
<211> 348
<212> DNA
<213> Artificial Sequence
<400> 3
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgcatcctg gccatctcaa aggccgtgaa atcggcatgt ggtacgctaa gaaacagggt 120
cagaaaaaca aaggcacggg aagcggcgca ggcaccggca gcggtgcggg taccggctcc 180
ggcgcacatc caggccacct gaaaggacgc gagatcggta tgtggtacgc aaagaaacag 240
ggtcagaaga ataaaggcac cggttccggt gcagactaca aagaccatga cggtgattat 300
aaagatcatg acatcgatta caaggatgac gatgacaagt aagaattc 348
<210> 4
<211> 113
<212> PRT
<213> Artificial Sequence
<400> 4
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met His Pro Gly His Leu Lys Gly Arg Glu Ile Gly
20 25 30
Met Trp Tyr Ala Lys Lys Gln Gly Gln Lys Asn Lys Gly Thr Gly Ser
35 40 45
Gly Ala Gly Thr Gly Ser Gly Ala Gly Thr Gly Ser Gly Ala His Pro
50 55 60
Gly His Leu Lys Gly Arg Glu Ile Gly Met Trp Tyr Ala Lys Lys Gln
65 70 75 80
Gly Gln Lys Asn Lys Gly Thr Gly Ser Gly Ala Asp Tyr Lys Asp His
85 90 95
Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp
100 105 110
Lys
<210> 5
<211> 72
<212> PRT
<213> Artificial Sequence
<400> 5
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met His Pro Gly His Leu Lys Gly Arg Glu Ile Gly
20 25 30
Met Trp Tyr Ala Lys Lys Gln Gly Gln Lys Asn Lys Gly Thr Gly Ser
35 40 45
Gly Ala Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile
50 55 60
Asp Tyr Lys Asp Asp Asp Asp Lys
65 70
<210> 6
<211> 154
<212> PRT
<213> Artificial Sequence
<400> 6
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met His Pro Gly His Leu Lys Gly Arg Glu Ile Gly
20 25 30
Met Trp Tyr Ala Lys Lys Gln Gly Gln Lys Asn Lys Gly Thr Gly Ser
35 40 45
Gly Ala Gly Thr Gly Ser Gly Ala Gly Thr Gly Ser Gly Ala His Pro
50 55 60
Gly His Leu Lys Gly Arg Glu Ile Gly Met Trp Tyr Ala Lys Lys Gln
65 70 75 80
Gly Gln Lys Asn Lys Gly Thr Gly Ser Gly Ala Gly Thr Gly Ser Gly
85 90 95
Ala Gly Thr Gly Ser Gly Ala His Pro Gly His Leu Lys Gly Arg Glu
100 105 110
Ile Gly Met Trp Tyr Ala Lys Lys Gln Gly Gln Lys Asn Lys Gly Thr
115 120 125
Gly Ser Gly Ala Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His
130 135 140
Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys
145 150
<210> 7
<211> 195
<212> PRT
<213> Artificial Sequence
<400> 7
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met His Pro Gly His Leu Lys Gly Arg Glu Ile Gly
20 25 30
Met Trp Tyr Ala Lys Lys Gln Gly Gln Lys Asn Lys Gly Thr Gly Ser
35 40 45
Gly Ala Gly Thr Gly Ser Gly Ala Gly Thr Gly Ser Gly Ala His Pro
50 55 60
Gly His Leu Lys Gly Arg Glu Ile Gly Met Trp Tyr Ala Lys Lys Gln
65 70 75 80
Gly Gln Lys Asn Lys Gly Thr Gly Ser Gly Ala Gly Thr Gly Ser Gly
85 90 95
Ala Gly Thr Gly Ser Gly Ala His Pro Gly His Leu Lys Gly Arg Glu
100 105 110
Ile Gly Met Trp Tyr Ala Lys Lys Gln Gly Gln Lys Asn Lys Gly Thr
115 120 125
Gly Ser Gly Ala Gly Thr Gly Ser Gly Ala Gly Thr Gly Ser Gly Ala
130 135 140
His Pro Gly His Leu Lys Gly Arg Glu Ile Gly Met Trp Tyr Ala Lys
145 150 155 160
Lys Gln Gly Gln Lys Asn Lys Gly Thr Gly Ser Gly Ala Asp Tyr Lys
165 170 175
Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp
180 185 190
Asp Asp Lys
195
<210> 8
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 8
gggctgggct gggcttggcc ggg 23
<210> 9
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 9
tattgttggt gggtgggtgg gttat 25
<210> 10
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 10
gggccgggcc tggggcgcgc ggg 23
<210> 11
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 11
ggggcggggc gcggggcggg g 21
<210> 12
<211> 30
<212> DNA
<213> Artificial Sequence
<400> 12
ggttagggtt agggttaggg ttagggttag 30
<210> 13
<211> 19
<212> RNA
<213> Artificial Sequence
<400> 13
agggaggggc gggucuggg 19
<210> 14
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 14
tgggcggagg gaagtggga 19
<210> 15
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 15
ttagggttag ggttaggg 18
<210> 16
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 16
tattgtggtg ggtgggtggg ttat 24
<210> 17
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 17
ttgggttagg gttagggtta ggga 24
<210> 18
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 18
agggtgggct gggaggt 17
<210> 19
<211> 21
<212> RNA
<213> Artificial Sequence
<400> 19
uuaggguuag gguuaggguu a 21
<210> 20
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 20
gggcgcggga ggaagggggc ggg 23
<210> 21
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 21
agggtgggga gggtgggga 19
<210> 22
<211> 23
<212> RNA
<213> Artificial Sequence
<400> 22
uuaggguuag gguuaggguu agg 23
<210> 23
<211> 15
<212> DNA
<213> Artificial Sequence
<400> 23
ggttggtgtg gttgg 15
<210> 24
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 24
ggggccgggg ccggggccgg ggcc 24
<210> 25
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 25
ggcgaggagg ggcgtggccg gc 22
<210> 26
<211> 27
<212> DNA
<213> Artificial Sequence
<400> 26
tcgggttgcg ggcgcagggc acgggcg 27
<210> 27
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 27
tcgcggcggc gcgcggcgat tgcgtttcgc cgcgcgccgc gccga 45
<210> 28
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 28
cccgccccct tcctcccgcg ccc 23
<210> 29
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 29
agcgtgggga gcgtgggga 19
<210> 30
<211> 54
<212> DNA
<213> Artificial Sequence
<400> 30
accctaaccc taaccctaac cctaattttt ttagggttag ggttagggtt aggg 54
<210> 31
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 31
ttcacgcggg ctcggagtgg tt 22
<210> 32
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 32
ccctaaccct aaccctaacc ct 22
<210> 33
<211> 18
<212> RNA
<213> Artificial Sequence
<400> 33
caguacagau cuguacug 18
<210> 34
<211> 24
<212> RNA
<213> Artificial Sequence
<400> 34
uuaccguuac cguuaccguu accg 24
<210> 35
<211> 55
<212> DNA
<213> Artificial Sequence
<400> 35
aagcagacag ctagtgaatt cagatagatg ggttgctcta caagcgtata actgt 55
<210> 36
<211> 55
<212> DNA
<213> Artificial Sequence
<400> 36
aagcagacag ctagtgaatt cagatagatg ggttgctcta caagcgtata actgt 55
<210> 37
<211> 21
<212> RNA
<213> Artificial Sequence
<400> 37
uacgcuugua gagcuugggu u 21
<210> 38
<211> 55
<212> DNA
<213> Artificial Sequence
<400> 38
aagcagacag ctagtgaatt cagatgggtg ggttgctcta caagcgtata actgt 55
<210> 39
<211> 25
<212> RNA
<213> Artificial Sequence
<400> 39
uacgcuugua gagcuugggu ggguu 25
<210> 40
<211> 55
<212> DNA
<213> Artificial Sequence
<400> 40
aagcagacag ctagtgaatt cgggtgggtg ggttgctcta caagcgtata actgt 55
<210> 41
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 41
tgtccttctc ggctacacct g 21
<210> 42
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 42
cacgcttcct ctaacatcaa cg 22
<210> 43
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 43
gctcggcgat ggtaggcgt 19
<210> 44
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 44
cccgcattca cgccccac 18
<210> 45
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 45
tcaccgcagc acgccgag 18
<210> 46
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 46
cggagatgtg gcccctggta 20
<210> 47
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 47
gaggtgggga cccgaataaa 20
<210> 48
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 48
tggccgagcc ttagagcc 18
<210> 49
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 49
cgccaacgcc acaacca 17
<210> 50
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 50
cggagggtcg catcgct 17
<210> 51
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 51
cccgccattt cggactg 17
<210> 52
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 52
ggagccgctg agcctctg 18
<210> 53
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 53
gatgcggggc gacagct 17
<210> 54
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 54
agcggcgcaa ggaccac 17
<210> 55
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 55
tccgccttcg ggatggtat 19
<210> 56
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 56
gcgttgctgt gcgttcttc 19
<210> 57
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 57
cttcctttgc ttctactccc agtt 24
<210> 58
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 58
gcgcacttcc tcaacctcc 19
<210> 59
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 59
cggtctcggg acacggacac 20
<210> 60
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 60
ggacgtacgg ggcctggtg 19
<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 61
ccccaggatg tggagatgaa 20
<210> 62
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 62
ccgtcttgcc gtctgcc 17
<210> 63
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 63
ctcaaccttt ggcctaaact cc 22
<210> 64
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 64
ttggaggaac aagaggacta cagac 25
<210> 65
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 65
ctctttgccg agctttccg 19
<210> 66
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 66
caccctctgc gctgttgc 18
<210> 67
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 67
tcgtcccgcg cacggatg 18
<210> 68
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 68
cccgacagca gctggaggag c 21
<210> 69
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 69
gtatgggaga cggccaacaa 20
<210> 70
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 70
aggccagaca ggtgcaggta 20

Claims (6)

1.用于识别G-四链体的多肽探针,其特征在于,由2个G-四链体结合结构域和用于连接2个所述G-四链体结合结构域的连接肽组成,所述G-四链体结合结构域的氨基酸序列为HPGHLKGREIGMWYAKKQGQKNK (SEQ ID NO. 2),所述连接肽包括2~4个六肽,所述六肽的序列为GTGSGA。
2.根据权利要求1所述的用于识别G-四链体的多肽探针,其特征在于,所述六肽的数量为3个。
3.用于识别G-四链体的多肽探针,其特征在于,其为C端连接蛋白标签的权利要求1所述的多肽探针。
4.权利要求1至3任一项所述的多肽探针在检测细胞中G-四链体的应用。
5.根据权利要求4所述的多肽探针在检测细胞中G-四链体的应用,其特征在于,采用染色质免疫沉淀-二代测序方法检测细胞中的G-四链体。
6.根据权利要求5所述的多肽探针在检测细胞中G-四链体的应用,其特征在于,细胞来自于人类、小鼠或鸡。
CN202010413944.7A 2020-05-15 2020-05-15 用于识别g-四链体的多肽探针及其在检测细胞中g-四链体的应用 Active CN111647052B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010413944.7A CN111647052B (zh) 2020-05-15 2020-05-15 用于识别g-四链体的多肽探针及其在检测细胞中g-四链体的应用
US16/896,196 US11767343B2 (en) 2020-05-15 2020-06-08 Peptide probe for recognition of G-quadruplex and use thereof in detection of G-quadruplex in cell

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010413944.7A CN111647052B (zh) 2020-05-15 2020-05-15 用于识别g-四链体的多肽探针及其在检测细胞中g-四链体的应用

Publications (2)

Publication Number Publication Date
CN111647052A CN111647052A (zh) 2020-09-11
CN111647052B true CN111647052B (zh) 2023-07-07

Family

ID=72344397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010413944.7A Active CN111647052B (zh) 2020-05-15 2020-05-15 用于识别g-四链体的多肽探针及其在检测细胞中g-四链体的应用

Country Status (2)

Country Link
US (1) US11767343B2 (zh)
CN (1) CN111647052B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112941159A (zh) * 2020-12-25 2021-06-11 南京农业大学 一种在全基因组水平鉴定植物基因组dna鸟嘌呤四联体位点的方法
CN113480612B (zh) * 2021-06-28 2022-12-02 武汉大学 Rig-i的c末端结构域抗病毒多肽、载体及其在制备抗病毒药物中的应用
CN114146187B (zh) * 2021-11-12 2022-11-22 中山大学 一种PDGFR-β基因表达抑制剂及其用途
CN114276417B (zh) * 2021-12-03 2024-05-03 南京农业大学 一种在植物正常生理条件下鉴定全基因组dna鸟嘌呤四联体位点的方法
CN114540324B (zh) * 2022-03-10 2023-02-17 中山大学 Dna聚合酶、核酸适配体、热启动dna聚合酶及方法和应用
CN115521361A (zh) * 2022-11-22 2022-12-27 广东工业大学 一种靶向g-四链体的pet多肽探针及其制备方法和应用
CN116092575A (zh) * 2023-02-03 2023-05-09 中国科学院地理科学与资源研究所 基于gmns法则的g-dna结构判别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018068244A1 (zh) * 2016-10-12 2018-04-19 中山大学 一种单链抗体及其在特异性检测正平行型g-四链体中的应用
CN110747191A (zh) * 2019-10-17 2020-02-04 深圳清华大学研究院 多肽、嵌合聚合酶及其应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014189468A1 (en) * 2013-05-20 2014-11-27 Nanyang Technological University Peptides binding to parallel-stranded g-quadruplexes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018068244A1 (zh) * 2016-10-12 2018-04-19 中山大学 一种单链抗体及其在特异性检测正平行型g-四链体中的应用
CN110747191A (zh) * 2019-10-17 2020-02-04 深圳清华大学研究院 多肽、嵌合聚合酶及其应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Brahim Heddi等.Insights into G-quadruplex specific recognition by the DEAH-box helicase RHAU: Solution structure of a peptide–quadruplex complex.《PNAS》.2015,第112卷(第31期), *
Detection of genomic G-quadruplexes in living cells using a small artificial protein;Ke-wei Zheng等;《Nucleic Acids Research》;20201012;第48卷(第20期);第11706-11720页 *
Insights into G-quadruplex specific recognition by the DEAH-box helicase RHAU: Solution structure of a peptide–quadruplex complex;Brahim Heddi等;《PNAS》;20150804;第112卷(第31期);表1 *
双链DNA中G四聚体的形成以及利用DNA足迹实验鉴定G四聚体结构;郑克威;《中国博士学位论文全文数据库》;20120715;A006-17 *

Also Published As

Publication number Publication date
US11767343B2 (en) 2023-09-26
CN111647052A (zh) 2020-09-11
US20210403507A1 (en) 2021-12-30

Similar Documents

Publication Publication Date Title
CN111647052B (zh) 用于识别g-四链体的多肽探针及其在检测细胞中g-四链体的应用
JP6280222B2 (ja) サルモネラ菌の非コードrnaおよびその同定と使用
US20230265442A1 (en) Incorporation of internal polya-encoded poly-lysine sequence tags and their variations for the tunable control of protein synthesis in bacterial and eukaryotic cells
WO2019206233A1 (zh) 一种RNA编辑的CRISPR/Cas效应蛋白及系统
Lisitsky et al. RNA-binding characteristics of a ribonucleoprotein from spinach chloroplast
CN110577934B (zh) 敲低tlr4基因猪肺泡巨噬细胞系的构建方法及其应用
CN111410695B (zh) 基于自噬机制介导Tau蛋白降解的嵌合分子及其应用
CN102965375B (zh) 增强外源蛋白表达的增强子样基因及其应用
CN112501174A (zh) 与cd44-透明质酸结合域蛋白特异结合的rna适配体及其筛选方法和应用
US20140329700A1 (en) Methods of isolating rna and mapping of polyadenylation isoforms
WO2022120936A1 (zh) 一种修饰的核酸及其应用
JPH11507814A (ja) アンカーライブラリー及びペプチド結合配列の同定
Newton-Northup et al. Contending with target unrelated peptides from phage display
EP3978511A1 (en) Norovirus-binding peptide
EP3978510A1 (en) Norovirus-binding peptide
Yu et al. The rat mitochondrial Ori L encodes a novel small RNA resembling an ancestral tRNA
Xiao et al. DamIP: a novel method to identify DNA binding sites in vivo
Tremblay et al. mRNAs associated with the Sam68 RNA binding protein
Lin et al. Role of antisense RNAs in evolution of yeast regulatory complexity
CN114807150B (zh) 靶向和拮抗hmgb1分子的核酸适体
CN110885826A (zh) 一种原核表达的cd20核酸适配体、筛选方法及其应用
JP2021533826A (ja) 正確に改変した秘匿メッセンジャーrna、及び、その他のポリヌクレオチド
AU2020103472A4 (en) A PCR Method for Obtaining the Product with High Fidelity and 3&#39;-end Addition of &#34;A&#34;
Zhai et al. Identification and antiviral effect of Cherry Valley duck IRF4
Horcajadas et al. The switch from early to late transcription in phage GA-1: characterization of the regulatory protein p4G

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant