CN110423736A - 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法 - Google Patents

碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法 Download PDF

Info

Publication number
CN110423736A
CN110423736A CN201910760844.9A CN201910760844A CN110423736A CN 110423736 A CN110423736 A CN 110423736A CN 201910760844 A CN201910760844 A CN 201910760844A CN 110423736 A CN110423736 A CN 110423736A
Authority
CN
China
Prior art keywords
leu
sequence
lys
base
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910760844.9A
Other languages
English (en)
Other versions
CN110423736B (zh
Inventor
江雯
冯松杰
陈洁平
黄行许
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanfang Hospital
First Affiliated Hospital of PLA Military Medical University
Original Assignee
First Affiliated Hospital of PLA Military Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of PLA Military Medical University filed Critical First Affiliated Hospital of PLA Military Medical University
Priority to CN201910760844.9A priority Critical patent/CN110423736B/zh
Publication of CN110423736A publication Critical patent/CN110423736A/zh
Application granted granted Critical
Publication of CN110423736B publication Critical patent/CN110423736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及碱基编辑领域,公开了一种碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法。该碱基编辑工具包括:(1)多拷贝的GCN4与D10A‑Cas9连接形成的GCN4‑D10A蛋白;(2)胞嘧啶脱氨酶AID与尿嘧啶糖基化酶抑制物UGI连于单链抗体scFv形成的scFv‑AID‑UGI蛋白,或者胞嘧啶脱氨酶AID、尿嘧啶糖基化酶抑制物UGI和防止多聚化的热稳定性结构域GB1连于单链抗体scFv形成的scFv‑AID‑UGI‑GB1蛋白。本发明提供的碱基编辑工具具有序列兼容性好、编辑窗口宽,高效率和高保真等优势,更适合针对非编码区调控元件的编辑及功能研究。

Description

碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序 列偏好性碱基编辑的方法
技术领域
本发明涉及碱基编辑领域,具体地,涉及一种碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法。
背景技术
人类基因组中98%的DNA序列属于非编码序列,其中80%具有调控功能。非编码区DNA序列的变化与复杂疾病(如关节炎、共济失调症等)、个体对药物的反应和对疾病易感性的差异等息息相关。目前认为,有大量的调控元件存在于非编码DNA中,调节着基因的活动,这些元件在癌症、心脏病和自闭症等疾病中发挥着极其重要的作用,可能成为疾病治疗的潜在靶点。针对非编码区调控序列的研究被认为是基因组研究的下一个前沿领域之一。
基于CRISPR发展而来的碱基编辑技术(base editing)实现了在不产生DNA双链断裂(DSB)的情况引入碱基替换,具有效率高,安全性高,可在原位、碱基水平编辑DNA序列等优势。碱基编辑工具(base editor,BE)已经被广泛的用于编码区域的研究中。但目前用BE针对非编码区域调控元件进行编辑,进而探讨调控元件功能的研究还鲜见报道。与编码区不同的是,在非编码区单碱基突变常不足以影响调控元件的功能。因此,能够同时产生多碱基饱和突变的宽编辑窗口BEs,是在碱基水平对非编码区调控元件的编辑以及功能研究的理想工具。
Jiang,W.,et al.(Jiang,W.,et al.,BE-PLUS:a new base editing tool withbroadened editing window and enhanced fidelity.Cell Res,2018.)创建了一种BE-PLUS碱基编辑工具,不仅具有宽窗口,同时编辑效率和精准性更高,有望成为研究非编码区调控元件的合适工具。但对人类基因组进行分析,发现在非编码区的调控区域,尤其在转录起始位点(TSS)附近(启动子和5’-UTR),“GC”序列含量显著高于平均水平。用BE-PLUS对一些基因的调控区域进行碱基编辑和研究时,同其他基于rAPOBEC1的BEs一样,BE-PLUS存在序列“偏好性”,即BE-PLUS在“GC”序列中编辑效率偏低。这将会极大地限制其在调控区域中的应用。
发明内容
本发明的目的是克服现有技术的不足,提供一种新型碱基编辑工具,该碱基编辑工具无序列偏好性且编辑窗口宽。
本发明的发明人在研究的过程中发现,采用胞嘧啶脱氨酶hAID,用以替代BE-PLUS中的rAPOBEC1,建立了一种新型碱基编辑工具BE-PLUS-AID,其具有序列兼容性好、编辑窗口宽,高效率和高保真等优势,更适合针对非编码区调控元件的编辑及功能研究。
基于此,第一方面,本发明提供了一种碱基编辑工具,该碱基编辑工具包括:
(1)多拷贝的GCN4与D10A-Cas9连接形成的GCN4-D10A蛋白;
(2)胞嘧啶脱氨酶AID与尿嘧啶糖基化酶抑制物UGI连于单链抗体scFv形成的scFv-AID-UGI蛋白,或者
胞嘧啶脱氨酶AID、尿嘧啶糖基化酶抑制物UGI和防止多聚化的热稳定性结构域GB1连于单链抗体scFv形成的scFv-AID-UGI-GB1蛋白。
第二方面,本发明提供了编码如上所述的碱基编辑工具的核酸,该核酸包括:
(1)编码所述GCN4-D10A蛋白的第一核酸;
(2)编码所述scFv-AID-UGI蛋白或scFv-AID-UGI-GB1蛋白的第二核酸。
第三方面,本发明提供了如上所述的碱基编辑工具或如上所述的核酸在碱基编辑中的应用。
第四方面,本发明提供了一种在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法,该方法包括:将如上所述的碱基编辑工具引入真核细胞内,对靶位点进行碱基编辑。
与现有技术相比,本发明能够获得如下的有益效果:
1、本发明的碱基编辑工具BE-PLUS-AID,具有编辑窗口宽和无序列偏好性的特点。
2、本发明的碱基编辑工具BE-PLUS-AID相较于发明人之前创建的BE-PLUS碱基编辑工具(Jiang,W.,et al.,BE-PLUS:a new base editing tool with broadened editingwindow and enhanced fidelity.Cell Res,2018.)具有更宽的碱基编辑窗口,在基因组里拥有更大的碱基编辑范围。
3、本发明的碱基编辑工具BE-PLUS-AID具有序列的无偏好性,更适用于富含GC的调控区域的功能研究或者筛选。当将其用于G四联体中时,可高效改变G四联体的序列从而调节基因的表达。
4、本发明针对基因组中非编码区域调控元件的功能研究具有重要的科学意义,通过编辑非编码区实现对基因的表达及遗传信息的调控具有重要应用价值,它将为未来的疾病治疗和研究提供新思路。
本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1为全基因组里的GC序列的分布情况。
图2为本发明提供的一种优选实施方式的BE-PLUS-AID示意图。
图3为本发明提供的BE-PLUS-AID在内源基因GC位点编辑的Sanger-seq测序结果(A)和分析结果(B/C)。
图4为本发明提供的BE-PLUS-AID在内源基因里的碱基编辑窗口。
图5为本发明提供的BE-PLUS-AID产生的插入/缺失(indel)频率(A)和副产物C突变为A/G的突变频率(B)。
图6为本发明提供的BE-PLUS-AID对序列偏好性的分析。
图7为本发明提供的BE-PLUS-AID在VEGFA(血管内皮生长因子)的G四联体位点序列的编辑效率(A)和分析结果(B/C)。
图8为本发明提供的BE-PLUS-AID编辑后VEGFA基因在mRNA和蛋白水平的变化。
具体实施方式
以下对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
在本文中所披露的范围的端点和任何值都不限于该精确的范围或值,这些范围或值应当理解为包含接近这些范围或值的值。对于数值范围来说,各个范围的端点值之间、各个范围的端点值和单独的点值之间,以及单独的点值之间可以彼此组合而得到一个或多个新的数值范围,这些数值范围应被视为在本文中具体公开。
第一方面,本发明提供了一种碱基编辑工具,该碱基编辑工具包括:
(1)多拷贝的GCN4与D10A-Cas9连接形成的GCN4-D10A蛋白;
(2)胞嘧啶脱氨酶AID与尿嘧啶糖基化酶抑制物UGI连于单链抗体scFv形成的scFv-AID-UGI蛋白,或者
胞嘧啶脱氨酶AID、尿嘧啶糖基化酶抑制物UGI和防止多聚化的热稳定性结构域GB1连于单链抗体scFv形成的scFv-AID-UGI-GB1蛋白。
根据本发明,在所述GCN4-D10A蛋白中,GCN4的拷贝数不受特别的限制,优选的,GCN4(酵母转录激活因子)的拷贝数为8-12个,例如,可以为8个、9个、10个、11个或12个。根据本发明一种优选的实施方式,GCN4的拷贝数为10个。
其中,GCN4可以为本领域公知的任意的具有酵母转录激活因子活性的GCN4蛋白。根据本发明一种优选的实施方式,所述GCN4的氨基酸序列如SEQ ID NO:2所示。
根据本发明,D10A-Cas9为Cas9中第10位的天冬氨酸(D)突变为了丙氨酸(A),其中,D10A-Cas9可以通过在本领域公知的任意的Cas9蛋白中通过点突变获得,根据本发明一种优选的实施方式,所述D10A-Cas9的氨基酸序列如SEQ ID NO:3所示。
根据本发明,所述连接子的序列可以为任意的能够将两端氨基酸序列进行连接的氨基酸序列,本发明对此并没有特别的限制,根据本发明一种优选的实施方式,所述连接子的氨基酸序列如SEQ ID NO:1所示。
根据本发明,所述胞嘧啶脱氨酶AID可以为本领域公知的任意的具有胞嘧啶脱氨酶AID活性的氨基酸序列,根据本发明一种优选的实施方式,所述胞嘧啶脱氨酶为全长AIDfl,其氨基酸序列如SEQ ID NO:4所示。
然而本发明的发明人在研究中发现,通过对如SEQ ID NO:4所示的氨基酸序列进行点突变和C端截短,能够有效地提高最终制备的碱基编辑工具的碱基编辑效率,其中,所述点突变选自由K10E、E156G和T82I所组成的组中,所述截短为去除SEQ ID NO:4所示氨基酸序列的182-198位氨基酸。根据本发明更为优选的一种实施方式,所述点突变为K10E、E156G和T82I,由此所获得的氨基酸序列如SEQ ID NO:5所示,以hAID*Δ表示。
根据本发明,所述尿嘧啶糖基化酶抑制物UGI可以为本领域公知的任意的具有尿嘧啶糖基化酶抑制物活性的蛋白,根据本发明一种优选的实施方式,所述尿嘧啶糖基化酶抑制物UGI的氨基酸序列如SEQ ID NO:6所示。
根据本发明,所述单链抗体scFv可以为本领域公知的任意单链抗体scFv,根据本发明一种优选的实施方式,所述单链抗体scFv的氨基酸序列如SEQ ID NO:7所示。
根据本发明,所述防止多聚化的热稳定性结构域GB1可以为本领域公知的任意的具有防止多聚化的热稳定性结构域活性的蛋白,根据本发明一种优选的实施方式,所述防止多聚化的热稳定性结构域GB1的氨基酸序列如SEQ ID NO:8所示。
根据本发明,所述胞嘧啶脱氨酶AID可以通过任意的方式连接于单链抗体scFv上,然后再通过任意的方式将与所述尿嘧啶糖基化酶抑制物UGI的连接于所述胞嘧啶脱氨酶AID上,例如,可以通过直接连接,也可以通过连接子连接,根据本发明一种优选的实施方式,通过如SEQ ID NO:140所示的连接子将所述胞嘧啶脱氨酶AID连接于单链抗体scFv上,再通过如SEQ ID NO:141所示的连接子将所述尿嘧啶糖基化酶抑制物UGI的连接于所述胞嘧啶脱氨酶AID上。
根据本发明,当优选还在单链抗体scFv上连接防止多聚化的热稳定性结构域GB1时,可以通过任意的方式将防止多聚化的热稳定性结构域GB1连接于scFv-AID-UGI蛋白的尿嘧啶糖基化酶抑制物UGI上,例如,可以通过直接连接,也可以通过连接子连接,根据本发明一种优选的实施方式,通过如SEQ ID NO:142所示的连接子将防止多聚化的热稳定性结构域GB1连接于scFv-AID-UGI蛋白的尿嘧啶糖基化酶抑制物UGI上。
根据本发明,在细胞内,所述GCN4-D10A蛋白可以对scFv-AID-UGI蛋白或scFv-AID-UGI-GB1蛋白进行招募,以在靶位点进行碱基编辑。
根据本发明,优选的,所述碱基编辑工具还包括sgRNA载体,用于引导GCN4-D10A蛋白招募的scFv-AID-UGI蛋白或scFv-AID-UGI-GB1蛋白在靶位点进行碱基编辑。其中,所述sgRNA载体可以为任意的能够引导GCN4-D10A蛋白招募的scFv-AID-UGI蛋白或scFv-AID-UGI-GB1蛋白到靶位点的载体,具体根据靶位点的序列不同而不同。根据本发明一种优选的实施方式,靶位点为内源GCGC位点,所述sgRNA载体为靶向富含GC的基因调控区或调控元件的sgRNA载体,更优选的,所述sgRNA载体的核苷酸序列如SEQ ID NO:9所示。
第二方面,本发明提供了编码如上所述的碱基编辑工具的核酸,该核酸包括:
(1)编码所述GCN4-D10A蛋白的第一核酸;
(2)编码所述scFv-AID-UGI蛋白或scFv-AID-UGI-GB1蛋白的第二核酸。
本领域公知,组成蛋白质的20种不同的氨基酸中,除Met(ATG)或Trp(TGG)分别为单一密码子编码外,其他18种氨基酸分别由2-6个密码子编码(Sambrook等,分子克隆,冷泉港实验室出版社,纽约,美国,第二版,1989,见950页附录D)。即由于遗传密码子的简并性,决定一个氨基酸的密码子大多不止一个,三联体密码子中第三个核苷酸的置换,往往不会改变氨基酸的组成,因此编码相同蛋白的基因的核苷酸序列可以不同。本领域人员根据公知的密码子表,从本发明公开的氨基酸序列,完全可以推导出能够编码它们的基因的核苷酸序列,通过生物学方法(如PCR方法、突变方法)或化学合成方法得到所述核苷酸序列,因此该部分核苷酸序列都应该包括在本发明范围内。
根据本发明,优选的,编码SEQ ID NO:4所示全长胞嘧啶脱氨酶AIDfl的核苷酸序列如SEQ ID NO:138所示,编码SEQ ID NO:5所示胞嘧啶脱氨酶AID优化版本hAID*Δ的核苷酸序列如SEQ ID NO:139所示。
第三方面,本发明提供了如上所述的碱基编辑工具或如上所述的核酸在碱基编辑中的应用。
优选的,所述碱基编辑在真核生物细胞中进行。其中,所述真核细胞可以为任意的需要进行碱基编辑的真核细胞,特别是富含GC的非编码区域。
优选的,所述的应用包括:用于引入提前的终止密码子进行基因敲除、用于产生随机突变实现蛋白进化、药物靶点筛选、基因调控元件筛选和富含GC的非编码区域功能研究中的至少一种。
第四方面,本发明提供了一种在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法,该方法包括:将如上所述的碱基编辑工具引入真核细胞内,对靶位点进行碱基编辑。
根据本发明,可以通过本领域常规的技术手段将所述碱基编辑工具引入真核细胞内,例如,使用如上所述的核酸转化真核细胞,获得转基因细胞,然后对所述转基因细胞进行培养,以使所述核酸表达得到所述的碱基编辑工具,然后所述碱基编辑工具在真核细胞中行驶碱基编辑功能。
其中,可以采用本领域常规的技术手段将所述核酸转化真核细胞,如氯化钙法化学转化、高压电击转化,优选电击转化。
以下将通过实施例对本发明进行详细描述。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
pst1374-scFv-APOBEC-UGI-GB1质粒:Addgene#113029。
BE3质粒:Addgene#73021。
实施例1
本实施例用于说明编码scFv-AID-UGI-GB1蛋白的质粒的构建
1、编码AID的核酸序列片段(AID)的扩增
由金唯智生物科技有限公司合成胞嘧啶脱氨酶AID优化版本hAID*Δ的编码序列hAID*Δ(编码的氨基酸序列如SEQ ID NO:5所示,DNA序列如SEQ ID NO:139所示),克隆于pUC57载体中得到pUC57-hAID*Δ载体,稀释至10μM作为PCR模板。设计正向引物(如SEQ IDNO:10所示),反向引物(如SEQ ID NO:11所示),加水溶解至10μM。使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增hAID序列片段。扩增体系如表1所示,PCR反应条件如表2所示。
表1
表2
2、编码UGI-GB1的核酸序列片段(UGI-GB1)的扩增
同样地,以pst1374-scFv-APOBEC-UGI-GB1质粒为模板,设计正向引物(如SEQ IDNO:12所示),反向引物(如SEQ ID NO:13所示),加水溶解至10μM。使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增UGI-GB1序列片段。扩增体系如表1所示,PCR反应条件如表2所示,仅将退火58℃修改为60℃。
3、pst1374-scFv载体片段的获得
取pst1374-scFv-APOBEC-UGI-GB1质粒1μg。用BamHI-HF(NEB,R3136S)和XhoI(NEB,R0146S)酶切,将rAPOBEC-UGI-GB1序列片段从载体中去除,获得pst1374-scFv载体片段。酶切条件为:37℃孵育2h。酶切体系如表3所示。
表3
4、片段的连接
将hAID*Δ序列片段和UGI-GB1序列片段的PCR扩增产物分别通过AxyPrep PCRClean-up试剂盒(Axygen,AP-PCR-500G)纯化回收。酶切产物割胶用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)回收pst1374-scFv载体片段。
通过Vazyme重组试剂盒(Vazyme,C112-01)重组连接PCR扩增并纯化的hAID序列片段和UGI-GB1序列片段以及纯化回收的pst1374-scFv载体片段。连接体系如表4所示。
表4
连接产物在37℃孵育0.5h,转化宿主细胞并涂板,经Sanger测序,确认得到正确的pst1374-scFv-hAID*Δ-UGI-GB1质粒,核酸序列信息如SEQ ID NO:14所示。
pst1374-scFv-hAID*Δ-UGI-GB1质粒、GCN4-D10A质粒以及sgRNA载体导入真核细胞中,pst1374-scFv-hAID*Δ-UGI-GB1质粒、GCN4-D10A质粒表达得到本发明的碱基编辑工具称BE-PLUS-AID,示意图如图2所示,以下称为BE-PA1。
实施例2
本实施例用于说明编码scFv-AIDfl-UGI-GB1蛋白的质粒的构建
按照实施例1进行编码scFv-AIDfl-UGI-GB1蛋白的质粒的构建,不同的是,将人源密码子优化的hAID*Δ替换为未优化的全长AIDfl的核苷酸序列,也即编码如SEQ ID NO:4所示蛋白的核苷酸序列(SEQ ID NO:138),扩增正向引物和反向引物分别如SEQ ID NO:143所示和SEQ ID NO:144所示,得到BE-PA2。
实施例3
本实施例用于说明编码scFv-hAID*Δ-UGI蛋白的质粒的构建
按照实施例1进行编码scFv-hAID*Δ-UGI蛋白的质粒的构建,不同的是,步骤(2)中,仅扩增UGI序列,扩增正向引物和反向引物分别如SEQ ID NO:15所示和SEQ ID NO:16所示,得到BE-PA3。
对比例1
本对比例用于说明参比的碱基编辑工具BE-AID的核酸的构建
1、hAID*Δ序列片段的扩增
按照实施例1构建pUC57-hAID*Δ载体。以pUC57-hAID*Δ稀释至10μM作为PCR模板。设计带有NotI(NEB,R0189S)酶切位点的正向引物(SEQ ID NO:17),带有XmaI(NEB,R0180S)酶切位点的反向引物(SEQ ID NO:18),加水溶解至10μM。使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增hAID*Δ序列片段。扩增体系如表1所示,PCR反应条件如表2所示,不同的是,将退火的58℃修改为62℃。
2、BE3中载体片段的获得
取BE3质粒载体1μg,用XmaI(NEB,R0180S)和NotI-HF(NEB,R3189S)酶切。酶切条件为:37℃孵育2h。酶切体系如表5所示,不同的是,将pst1374-scFv-APOBEC-UGI-GB1质粒替换为BE3质粒,BamHI酶和XhoI酶替换为XmaI酶和NotI-HF酶。
3、片段的连接
将hAID*Δ序列片段的PCR扩增产物通过AxyPrep PCR Clean-up试剂盒(Axygen,AP-PCR-500G)纯化回收。酶切产物割胶用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)回收载体片段。
通过T4连接酶(NEB,M0202S)重组连接PCR扩增并纯化的hAID*Δ序列片段和纯化回收的载体片段。连接体系如表5所示。
表5
连接产物在16℃孵育2h,转化宿主细胞并涂板,经Sanger测序,确认得到正确的BE-AID质粒,以下称为BE-A,序列信息见SEQ ID NO:82。
对比例2
按照Jiang,W.,et al.(Jiang,W.,et al.,BE-PLUS:a new base editing toolwith broadened editing window and enhanced fidelity.Cell Res,2018中的方法构建BE-PLUS,以下称为BE-P。
测试例1
本测试例用于说明本发明碱基编辑工具和对比的碱基编辑工具的碱基编辑效率
1、靶向特异性sgRNA的制备
针对人293FT细胞的18个内源基因位点和3个GCGC位点做碱基编辑,靶向位点序列见如表6所示。根据靶向位点序列设计20nt互补配对的上下游引物,加灭菌水溶解至100μM。将引物按照退火体系和退火程序(退火体系:上下游引物各4.5μl,10x buffer 2μl,水补足至10μl;退火程序:95℃5min,95-85℃-2℃/s;85-25℃-0.1℃/s;4℃∞)退火,得到退火产物。其中,引物序列见表6所示。
表6
BsaI(NEB,R0535S)对pGL3-U6-sgRNA(Addgene#51133)质粒酶切,37℃2小时,以得到线性化sgRNA载体。酶切体系:U6-sgRNA载体1.5μg、10xCutsmart buffer 5μl、BsaI酶1μl、水补至50μl。
酶切产物用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-500G)做割胶回收得到线性化sgRNA载体。取50ng线性化载体与3μl退火产物通过T4连接酶(NEB,M0202S)连接,16℃孵育1小时后并转化宿主细胞涂板,经Sanger测序得到了正确的靶向特异性sgRNA。连接体系:10xbuffer2 1μl、PCR片段3μl、线性化载体150ng、T4连接酶1μl、水补至10μl。
2、在内源基因GC位点的碱基编辑效率
为了验证在GC位点的编辑效率,本发明设计了针对3个内源GCGC位点(GCGC位点1,2,3;靶位点序列SEQ ID NO:19-21)的靶向sgRNA,分别与上述的BE-P、BE-PA1、BE-PA2、BE-PA3、BE-A系统转染293FT细胞,过程如下:
1)HEK293FT细胞(来自ATCC)分盘至10cm培养皿(Corning,430167)中培养,培养基为混有10%的FBS(HyClone,SV30087)的DMEM(HyClone,SH30243.01)。当细胞密度为80%时,将细胞分盘至12孔板。
2)在孔板中细胞浓度为80%时,换新鲜培养基液,2小时后每孔转染GCN4-D10A质粒1μg,实施例1-3构建的质粒各1μg,靶向GCGC位点1、GCGC位点2、GCGC位点3位点的sgRNA质粒每孔0.5μg。将质粒混在100μl的Opti-(Gibco,11058021)培养基。以BE-P和BE-A编辑工具做对照组,每孔加BE-P质粒或BE-A质粒1μg,sgRNA0.5μg。
3)将转染试剂Lipofectamine 2000(Thermo,11668019)6μl混入100μl的Opti-MEM培养基,吹打混匀。
4)将混有质粒的Opti-MEM 100μl加入混有Lipofectamine 2000的Opti-MEM,吹打混匀,室温静置25分钟后加入种有HEK293FT细胞的12孔板。
5)8小时后用新鲜培养基换液。
6)转染24小时后,加入终浓度为2ng/ml的Puromycin(InvivoGen,nt-pr-1)药杀48小时。
7)新鲜培养基换液洗去死细胞,收取活细胞,酚氯仿法抽取基因组DNA。
以靶向位点上下游各100bp分别设计并合成PCR引物,加水稀释至10μM。PCR引物序列如SEQ ID NO:83-88所示。用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)PCR扩增各基因组靶向位点片段。PCR反应体系如表1所示,PCR程序如表2所示,不同的是,将退火温度58℃修改为62℃。
三个GCGC靶向位点PCR产物割胶回收去除非特异性条带,用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)。PCR纯化样品各取100ng送Sanger-seq测序以验证各碱基编辑工具的突变效率。测序结果统计如图3所示。BE-PLUS-AID在GC位点具有更高的编辑效率BE-PA1,49.72%;BE-PA2,25.77%(图未示出);BE-PA3,31.24%(图未示出);BE-A,24.82%;BE-P,4.09%;在非GC位点,五种工具编辑效率一致。
3、BE-PA扩大了碱基编辑的窗口
为了确认BE-PA1、BE-PA2、BE-PA3在内源基因上的碱基编辑窗口,本发明对18个内源基因做碱基编辑,并分析所有胞嘧啶位点的碱基编辑频率。转染过程如下:
1)HEK293FT细胞将细胞分盘至12孔板。
2)当孔板中细胞浓度为80%时,换新鲜培养基液,2小时后每孔转染GCN4-D10A质粒1μg,实施例1-3构建的质粒各1μg,靶向18个内源基因位点的sgRNA质粒每孔0.5μg。将质粒混在100μl的Opti-MEM(Gibco,11058021)培养基。以BE-P和BE-A编辑工具做对照组,每孔加BE-P质粒或BE-A质粒2μg,sgRNA0.5μg。
3)将转染试剂Lipofectamine 2000(Thermo,11668019)6μl混入100μl的Opti-MEM培养基,吹打混匀。
4)将混有质粒的Opti-MEM 100μl加入混有Lipofectamine 2000的Opti-MEM,吹打混匀,室温静置25分钟后加入种有HEK293FT细胞的12孔板。
5)8小时后用新鲜培养基换液。
6)转染24小时后,加入终浓度为2ng/ml的Puromycin(InvivoGen,nt-pr-1)药杀48小时。
7)新鲜培养基换液,洗去死细胞,收取活细胞酚氯仿法抽取基因组DNA。
以靶向位点上下游各100bp分别设计并合成PCR引物,加水稀释至10μM。PCR引物序列见序列表SEQ IDNO:89-124所示。用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)PCR扩增各基因组靶向位点片段。PCR反应体系如表1所示,PCR程序如表2所示,不同的是,将退火温度58℃修改为62℃。
靶向位点PCR产物割胶回收,使用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)去除非特异性条带。PCR纯化样品各取100ng送Deep-seq测序,碱基编辑效率结果统计如图4所示:BE-PA1的碱基编辑窗口为C1-C14,而BE-A为C1-C8,BE-P的碱基编辑窗口为C4-C14,如图4所示。因此BE-PA具有较大的碱基编辑窗口。
4、在碱基编辑过程中的保真度
本发明进一步分析了在18个内源基因位点的indel水平,和C-to-A,C-to-T等副产物的比例,分析结果如图5所示,相较于BE-P,在碱基编辑时BE-PA1具有相同的高保真度。
5、在碱基编辑过程中无明显的序列偏好性
为了进一步确认BE-PA1是否有序列偏好性,本发明系统分析了18个内源位点被编辑的C前后的各一个位置碱基的分布和C的编辑效率。分析结果如图6A,B所示。对于BE-P,碱基编辑的效率趋势为“TC”≧“CC”≧“AC”>“GC”和“CT”≧“CC”≈“CG”≈“CA”。对于BE-PA1和BE-A,碱基编辑的趋势为“GC”≧“CC”≈“AC”≈“TC”和“CG”≧“CA”≈“CT”≈“CC”。因此,相较于基于rAPOBEC1的碱基编辑工具,基于AID的碱基编辑工具在GC位点具有更高的编辑效率,且无明显的序列偏好性。
6、在GC-rich的基因调控区域具有优势
鉴于BE-PA1的宽编辑窗口和无明显的序列偏好性等优势,BE-PA1具有在高GC含量的基因调控区进行编辑的应用价值。为了验证BE-PA1在GC-rich的调控区域编辑效率,本发明选择在GC-rich的VEGFA启动子区对G4调控元件进行编辑,并研究G4元件对VEGFA表达的调控。
在GC-rich的VEGFA启动子区有5份拷贝的G4序列,本发明针对前4个G4设计靶向sgRNA,示意图如图7A所示。靶向序列如SEQ ID NO:125。sgRNA的引物序列见附录序列表SEQID NO:126,127。VEGFA高鸟嘌呤含量sg1与BE-P,BE-PA1系统转染293FT细胞,过程如下:
1)HEK293FT细胞(来自ATCC)分盘至12孔板。在孔板中细胞浓度为80%时,换新鲜培养基液,2小时后每孔转染GCN4-D10A质粒1μg,pst1374-scFv-hAID*Δ-UGI-GB1质粒1μg,靶向VEGFA高鸟嘌呤含量sg1靶位点的sgRNA质粒每孔0.5μg。将质粒混在100μl的Opti-(Gibco,11058021)培养基。以BE-P编辑工具做对照组,每孔加BE-P或BE-A2μg,sgRNA0.5μg。
2)将转染试剂Lipofectamine 2000(Thermo,11668019)6μl混入100μl的Opti-MEM培养基,吹打混匀。
3)将混有质粒的Opti-MEM 100μl加入混有Lipofectamine 2000的Opti-MEM,吹打混匀,室温静置25分钟后加入种有HEK293FT细胞的12孔板。
4)8小时后用新鲜培养基换液。转染24小时后,加入终浓度为2ng/ml的Puromycin(InvivoGen,nt-pr-1)药杀48小时。新鲜培养基换液洗去死细胞,收取活细胞,酚氯仿法抽取基因组DNA。
以靶向位点上下游各100bp分别设计并合成PCR引物,加水稀释至10μM。PCR引物序列见附录序列表SEQ IDNO:128,129所示。用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)PCR扩增各基因组靶向位点片段。PCR反应体系如表1所示,PCR程序如表2所示,不同的是,将退火58℃修改为62℃。
G4位点PCR产物割胶回收去除非特异性条带,用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)。PCR纯化样品各取100ng送Sanger-seq测序和deep-seq测序以检测BE-PA1的编辑效率。Sanger测序和deep-seq测序统计结果如图7B,C所示。BE-PA1在更宽的范围内对G4元件进行编辑。且BE-PA1编辑效率高于BE-P,达到88.25%。
为了确认G4四联体结构是否被破坏,本发明进一步利用圆二色谱仪(AppliedPhotophysics,Chirascan-Plus)检测碱基编辑后的DNA结构变化。同时合成G4四联体的WT型序列引物和碱基编辑后的突变类型引物,引物序列见SEQ IDNO:130-133。检测结果如图8(A)所示,与WT相比,被BE-PA碱基编辑过的饱和突变型MUT15的G4结构在260nm处峰值降低,在240nm处峰发生偏离,因此G4结构在体内能被BE-PA1成功编辑并发生构象改变。为了进一步研究G4结构变化对VEGFA的调控,我们分析VEGFA的表达水平。q-PCR和WesternBlot结果如图8B、C、D所示。VEGFA和GAPDH基因的Q-PCR引物序列见SEQ ID NO:134-137。Antibody为anti-VEGFA(Abcam,ab214424)。当G4被BE-PA1编辑后,VEGFA的表达显著降低。BE-P由于无法有效的编辑G4元件,VEGFA表达与对照组无明显变化。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 中国人民解放军陆军军医大学第一附属医院
<120> 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法
<160> 144
<170> SIPOSequenceListing 1.0
<210> 1
<211> 13
<212> PRT
<213> 多拷贝的GCN4与D10A-Cas9之间的连接子(Multicopy connection betweenGCN4 and D10A-Cas9)
<400> 1
Gly Ser Gly Ser Gly Gln Arg Pro Gln Gly Gly Gly Gly
1 5 10
<210> 2
<211> 19
<212> PRT
<213> GCN4的氨基酸序列(The amino acid sequence of GCN4)
<400> 2
Glu Glu Leu Leu Ser Lys Asn Tyr His Leu Glu Asn Glu Val Ala Arg
1 5 10 15
Leu Lys Lys
<210> 3
<211> 1368
<212> PRT
<213> D10A-Cas9的氨基酸序列(The amino acid sequence of D10A-Cas9)
<400> 3
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 4
<211> 198
<212> PRT
<213> 全长胞嘧啶脱氨酶AIDfl的氨基酸序列(Amino acid sequence of full-length cytosine deaminase AIDfl)
<400> 4
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 5
<211> 181
<212> PRT
<213> 优化版本胞嘧啶脱氨酶hAID*Δ的氨基酸序列(Optimize the amino acidsequence of the version of cytosine deaminase hAID*Δ)
<400> 5
Met Asp Ser Leu Leu Met Asn Arg Arg Glu Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Ile Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Gly Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu
180
<210> 6
<211> 84
<212> PRT
<213> 尿嘧啶糖基化酶抑制物UGI的氨基酸序列(Amino acid sequence of uracilglycosylase inhibitor UGI)
<400> 6
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu
<210> 7
<211> 277
<212> PRT
<213> 所述单链抗体scFv的氨基酸序列(The amino acid sequence of the single-chain antibody scFv)
<400> 7
Met Gly Pro Asp Ile Val Met Thr Gln Ser Pro Ser Ser Leu Ser Ala
1 5 10 15
Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ser Ser Thr Gly Ala
20 25 30
Val Thr Thr Ser Asn Tyr Ala Ser Trp Val Gln Glu Lys Pro Gly Lys
35 40 45
Leu Phe Lys Gly Leu Ile Gly Gly Thr Asn Asn Arg Ala Pro Gly Val
50 55 60
Pro Ser Arg Phe Ser Gly Ser Leu Ile Gly Asp Lys Ala Thr Leu Thr
65 70 75 80
Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Phe Cys Ala Leu
85 90 95
Trp Tyr Ser Asn His Trp Val Phe Gly Gln Gly Thr Lys Val Glu Leu
100 105 110
Lys Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
115 120 125
Ser Ser Gly Gly Gly Ser Glu Val Lys Leu Leu Glu Ser Gly Gly Gly
130 135 140
Leu Val Gln Pro Gly Gly Ser Leu Lys Leu Ser Cys Ala Val Ser Gly
145 150 155 160
Phe Ser Leu Thr Asp Tyr Gly Val Asn Trp Val Arg Gln Ala Pro Gly
165 170 175
Arg Gly Leu Glu Trp Ile Gly Val Ile Trp Gly Asp Gly Ile Thr Asp
180 185 190
Tyr Asn Ser Ala Leu Lys Asp Arg Phe Ile Ile Ser Lys Asp Asn Gly
195 200 205
Lys Asn Thr Val Tyr Leu Gln Met Ser Lys Val Arg Ser Asp Asp Thr
210 215 220
Ala Leu Tyr Tyr Cys Val Thr Gly Leu Phe Asp Tyr Trp Gly Gln Gly
225 230 235 240
Thr Leu Val Thr Val Ser Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
245 250 255
Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
260 265 270
Gly Gly Gly Gly Ser
275
<210> 8
<211> 56
<212> PRT
<213> 所述防止多聚化的热稳定性结构域GB1的氨基酸序列(The amino acidsequence of the thermal stability domain GB1 that preventspolypolymerization)
<400> 8
Met Glu Tyr Lys Leu Ile Leu Asn Gly Lys Thr Leu Lys Gly Glu Thr
1 5 10 15
Thr Thr Glu Ala Val Asp Ala Ala Thr Ala Glu Lys Val Phe Lys Gln
20 25 30
Tyr Ala Asn Asp Asn Gly Val Asp Gly Glu Trp Thr Tyr Asp Asp Ala
35 40 45
Thr Lys Thr Phe Thr Val Thr Glu
50 55
<210> 9
<211> 4951
<212> DNA
<213> sgRNA载体的核苷酸序列(The nucleotide sequence of the sgRNA carrier)
<400> 9
ggtaccgatt agtgaacgga tctcgacggt atcgatcacg agactagcct cgagcggccg 60
cccccttcac cgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 120
ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata 180
cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 240
tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 300
tgtggaaagg acgaaacacc gtgagaccga gagagggtct cagttttaga gctagaaata 360
gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt 420
tttttaaaga attctcgacc tcgagacaaa tggcagtatt catccacaat tttaaaagaa 480
aaggggggat tggggggtac agtgcagggg aaagaatagt agacataata gcaacagaca 540
tacaaactaa agaattacaa aaacaaatta caaaaattca aaattttcgg gtttattaca 600
gggacagcag agatccactt tggccgcggc tcgagggggt tggggttgcg ccttttccaa 660
ggcagccctg ggtttgcgca gggacgcggc tgctctgggc gtggttccgg gaaacgcagc 720
ggcgccgacc ctgggactcg cacattcttc acgtccgttc gcagcgtcac ccggatcttc 780
gccgctaccc ttgtgggccc cccggcgacg cttcctgctc cgcccctaag tcgggaaggt 840
tccttgcggt tcgcggcgtg ccggacgtga caaacggaag ccgcacgtct cactagtacc 900
ctcgcagacg gacagcgcca gggagcaatg gcagcgcgcc gaccgcgatg ggctgtggcc 960
aatagcggct gctcagcagg gcgcgccgag agcagcggcc gggaaggggc ggtgcgggag 1020
gcggggtgtg gggcggtagt gtgggccctg ttcctgcccg cgcggtgttc cgcattctgc 1080
aagcctccgg agcgcacgtc ggcagtcggc tccctcgttg accgaatcac cgacctctct 1140
ccccaggggg atccaccgga gcttaccatg accgagtaca agcccacggt gcgcctcgcc 1200
acccgcgacg acgtccccag ggccgtacgc accctcgccg ccgcgttcgc cgactacccc 1260
gccacgcgcc acaccgtcga tccggaccgc cacatcgagc gggtcaccga gctgcaagaa 1320
ctcttcctca cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc 1380
gcggtggcgg tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc 1440
ggcccgcgca tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc 1500
ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg 1560
cccgaccacc agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc 1620
gagcgcgccg gggtgcccgc cttcctggaa acctccgcgc cccgcaacct ccccttctac 1680
gagcggctcg gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg 1740
tgcatgaccc gcaagcccgg tgcctgacgc ccgccccacg acccgcagcg cccgaccgaa 1800
aggagcgcac gaccccatgc atcggtacct ttaagaccaa tgacttacaa ggcagctgta 1860
gatcttagcc actttctaga gtcggggcgg ccggccgctt cgagcagaca tgataagata 1920
cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga 1980
aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa 2040
caacaattgc attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaaag 2100
caagtaaaac ctctacaaat gtggtaaaat cgataaggat ccgtcgaccg atgcccttga 2160
gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc gtcgccgcac 2220
ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg ctcttccgct 2280
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 2340
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2400
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2460
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2520
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2580
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2640
ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2700
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2760
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2820
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2880
ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2940
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 3000
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 3060
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 3120
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 3180
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 3240
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 3300
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgggaccca 3360
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3420
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3480
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3540
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3600
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3660
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3720
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3780
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3840
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3900
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3960
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 4020
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 4080
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 4140
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 4200
cctgacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 4260
accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 4320
gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 4380
tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 4440
gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 4500
agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 4560
ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 4620
tttaacgcga attttaacaa aatattaacg tttacaattt cccattcgcc attcaggctg 4680
cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gcccaagcta 4740
ccatgataag taagtaatat taaggtacgg gaggtacttg gagcggccgc aataaaatat 4800
ctttattttc attacatctg tgtgttggtt ttttgtgtga atcgatagta ctaacatacg 4860
ctctccatca aaacaaaacg aaacaaaaca aactagcaaa ataggctgtc cccagtgcaa 4920
gtgcaggtgc cagaacattt ctctatcgat a 4951
<210> 10
<211> 79
<212> DNA
<213> hAID*Δ正向引物(hAID*Δ Positive primer)
<400> 10
ggcggatcca gcggcagcga gactcccggg acctcagagt ccgccacacc cgaaagtatg 60
gacagcctgc tgatgaaca 79
<210> 11
<211> 21
<212> DNA
<213> hAID*Δ反向引物(hAID*Δ Reverse primer)
<400> 11
cagctgaggc gtattttact g 21
<210> 12
<211> 58
<212> DNA
<213> UGI-GB1序列片段的扩增正向引物(Amplifying forward primers of UGI-GB1sequence fragments)
<400> 12
cagctgaggc gtattttact gggcggaggt ggaagcacta atctgtcaga tattattg 58
<210> 13
<211> 49
<212> DNA
<213> UGI-GB1序列片段的扩增反向引物(Amplification reverse primer of UGI-GB1 sequence fragments)
<400> 13
aagggccctc ctgcagctcc accgctcgag actttcctct tcttcttgg 49
<210> 14
<211> 7092
<212> DNA
<213> pst1374-scFv-hAID*Δ-UGI-GB1质粒(pst1374-scFv-hAID*Δ-UGI-GB1plasmid)
<400> 14
gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
accatgggac ctaagaaaaa gaggaaggtg gcggccgctg actacaagga tgacgacgat 960
aaatctagaa tgggtcccga catcgtgatg acccagagcc ccagcagcct gagcgccagc 1020
gtgggcgacc gcgtgaccat cacctgccgc agcagcaccg gcgccgtgac caccagcaac 1080
tacgccagct gggtgcagga gaagcccggc aagctgttca agggcctgat cggcggcacc 1140
aacaaccgcg cccccggcgt gcccagccgc ttcagcggca gcctgatcgg cgacaaggcc 1200
accctgacca tcagcagcct gcagcccgag gacttcgcca cctacttctg cgccctgtgg 1260
tacagcaacc actgggtgtt cggccagggc accaaggtgg agctgaagcg cggcggcggc 1320
ggcagcggcg gcggcggcag cggcggcggc ggcagcagcg gcggcggcag cgaggtgaag 1380
ctgctggaga gcggcggcgg cctggtgcag cccggcggca gcctgaagct gagctgcgcc 1440
gtgagcggct tcagcctgac cgactacggc gtgaactggg tgcgccaggc ccccggccgc 1500
ggcctggagt ggatcggcgt gatctggggc gacggcatca ccgactacaa cagcgccctg 1560
aaggaccgct tcatcatcag caaggacaac ggcaagaaca ccgtgtacct gcagatgagc 1620
aaggtgcgca gcgacgacac cgccctgtac tactgcgtga ccggcctgtt cgactactgg 1680
ggccagggca ccctggtgac cgtgagcagc tacccatacg atgttccaga ttacgctggt 1740
ggaggcggag gttctggggg aggaggtagt ggcggtggtg gttcaggagg cggcggatcc 1800
agcggcagcg agactcccgg gacctcagag tccgccacac ccgaaagtat ggacagcctg 1860
ctgatgaaca ggagggagtt cctgtaccag ttcaagaacg tcagatgggc caagggcagg 1920
agggagacct acctctgcta cgtggtgaag agaagggaca gcgccacctc cttctccctg 1980
gacttcggat acctgaggaa caagaacggc tgccacgtgg agctgctgtt cctgaggtat 2040
atcagcgact gggacctgga ccccggcaga tgttacaggg tgacctggtt catctcctgg 2100
agcccctgct acgactgcgc taggcacgtg gccgacttcc tgaggggcaa ccctaacctg 2160
agcctgagga tcttcaccgc caggctgtac ttctgcgagg acaggaaggc cgaacccgag 2220
ggcctgagga gactgcacag agccggagtg cagatcgcca tcatgacctt caaggactat 2280
ttttactgct ggaacacctt cgtggagaac cacggcagga ccttcaaagc ctgggagggc 2340
ctgcacgaga acagcgtgag gctgtccaga cagctgaggc gtattttact gggcggaggt 2400
ggaagcacta atctgtcaga tattattgaa aaggagaccg gaaagcaact ggttatccag 2460
gaatccatcc tcatgctccc agaggaggtg gaagaagtca ttgggaacaa gccggaaagc 2520
gatatactcg tgcacaccgc ctacgacgag agcaccgacg agaatgtcat gcttctgact 2580
agcgacgccc ctgaatacaa gccttgggct ctggtcatac aggatagcaa cggtgagaac 2640
aagattaaga tgctcggagg aggaggaagc ggaggaggag gtagcggagg aggtggaagc 2700
cggaccgaag agtacaagct tatcctgaac ggtaaaaccc tgaaaggtga aaccaccacc 2760
gaagctgttg acgctgctac cgcggaaaaa gttttcaaac agtacgctaa cgacaacggt 2820
gttgacggtg aatggaccta cgacgacgct accaaaacct tcacggtaac cgaaggtggt 2880
ggtagcggtg gtggtggtag tcccaagaag aagaggaaag tctcgagcgg tggagctgca 2940
ggagggccct tcgaaggtaa gcctatccct aaccctctcc tcggtctcga ttctacgcgt 3000
accggtcatc atcaccatca ccattgagtt taaacccgct gatcagcctc gactgtgcct 3060
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 3120
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 3180
tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 3240
aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc 3300
tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 3360
gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 3420
ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggc 3480
atccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 3540
ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 3600
gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 3660
tcggtctatt cttttgattt ataagggatt ttggggattt cggcctattg gttaaaaaat 3720
gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt 3780
gtggaaagtc cccaggctcc ccaggcaggc agaagtatgc aaagcatgca tctcaattag 3840
tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg 3900
catctcaatt agtcagcaac catagtcccg cccctaactc cgcccatccc gcccctaact 3960
ccgcccagtt ccgcccattc tccgccccat ggctgactaa ttttttttat ttatgcagag 4020
gccgaggccg cctctgcctc tgagctattc cagaagtagt gaggaggctt ttttggaggc 4080
ctaggctttt gcaaaaagct cccgggagct tgtatatcca ttttcggatc tgatcagcac 4140
gtgttgacaa ttaatcatcg gcatagtata tcggcatagt ataatacgac aaggtgagga 4200
actaaaccat ggccaagcct ttgtctcaag aagaatccac cctcattgaa agagcaacgg 4260
ctacaatcaa cagcatcccc atctctgaag actacagcgt cgccagcgca gctctctcta 4320
gcgacggccg catcttcact ggtgtcaatg tatatcattt tactggggga ccttgtgcag 4380
aactcgtggt gctgggcact gctgctgctg cggcagctgg caacctgact tgtatcgtcg 4440
cgatcggaaa tgagaacagg ggcatcttga gcccctgcgg acggtgtcga caggtgcttc 4500
tcgatctgca tcctgggatc aaagcgatag tgaaggacag tgatggacag ccgacggcag 4560
ttgggattcg tgaattgctg ccctctggtt atgtgtggga gggctaagca cttcgtggcc 4620
gaggagcagg actgacacgt gctacgagat ttcgattcca ccgccgcctt ctatgaaagg 4680
ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc 4740
atgctggagt tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa 4800
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 4860
ttgtccaaac tcatcaatgt atcttatcat gtctgtatac cgtcgacctc tagctagagc 4920
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 4980
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 5040
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 5100
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 5160
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 5220
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 5280
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 5340
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 5400
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 5460
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 5520
gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 5580
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 5640
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 5700
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 5760
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 5820
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 5880
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 5940
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 6000
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 6060
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 6120
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 6180
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 6240
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 6300
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 6360
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 6420
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 6480
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 6540
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 6600
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 6660
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 6720
aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 6780
cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 6840
cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 6900
aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 6960
ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 7020
tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 7080
ccacctgacg tc 7092
<210> 15
<211> 58
<212> DNA
<213> 仅扩增UGI序列的正向引物(Only the positive primer of the UGIsequence is amplified)
<400> 15
cagctgaggc gtattttact gggcggaggt ggaagcacta atctgtcaga tattattg 58
<210> 16
<211> 75
<212> DNA
<213> 仅扩增UGI序列的反向引物(Amplify only the reverse primer of the UGIsequence)
<400> 16
aagggccctc ctgcagctcc accgctcgag actttcctct tcttcttggg gagcatctta 60
atcttgttct caccg 75
<210> 17
<211> 65
<212> DNA
<213> hAID*Δ序列片段扩增正向引物(带有NotI酶切位点hAID*Δ sequencefragment amplification forward primerwith Notease tangent point)
<400> 17
tccgcggccg ctaatacgac tcactatagg gagagccgcc accatgagct cagagactgg 60
cccag 65
<210> 18
<211> 50
<212> DNA
<213> hAID*Δ序列片段扩增反向引物(带有XmaI酶切位点hAID*Δ sequencefragment amplification reverse primerwith XmaI enzyme site)
<400> 18
gaggtcccgg gagtctcgct gccgctcagt aaaatacgcc tcagctgtct 50
<210> 19
<211> 20
<212> DNA
<213> GCGC位点1靶位点序列(GCGC bit 1 target sequence)
<400> 19
actgcgctgc ccttgggccc 20
<210> 20
<211> 20
<212> DNA
<213> GCGC位点2靶位点序列(GCGC bit 2 target sequence)
<400> 20
tcctgcggcg ccggaaggac 20
<210> 21
<211> 20
<212> DNA
<213> GCGC位点3靶位点序列(GCGC bit 3 target sequence)
<400> 21
gcgctgctgg cagtgatgat 20
<210> 22
<211> 20
<212> DNA
<213> C9ORF72高G鸟嘌呤含量sg1靶位点序列(C9ORF 72 High G guanine contentSG1 target sequence)
<400> 22
ccccgaccac gccccggccc 20
<210> 23
<211> 20
<212> DNA
<213> 293 site3靶位点序列(293 Site3 target sequence)
<400> 23
ggcccagact gagcacgtga 20
<210> 24
<211> 20
<212> DNA
<213> 294 site3 LoseG靶位点序列(294 Site3 LoseG target sequence)
<400> 24
cacccagact gagcacgtgc 20
<210> 25
<211> 20
<212> DNA
<213> 293 site4靶位点序列(293 site4 target sequence)
<400> 25
ggcactgcgg ctggaggtgg 20
<210> 26
<211> 20
<212> DNA
<213> FANCF靶位点序列(FANCF target sequence)
<400> 26
ggaatccctt ctgcagcacc 20
<210> 27
<211> 20
<212> DNA
<213> DNMT3B靶位点序列(DNMT3B target sequence)
<400> 27
agagcccccc ctcaaagaga 20
<210> 28
<211> 20
<212> DNA
<213> DNMT3B LossG靶位点序列(DNMT3B LossG target sequence)
<400> 28
aaatcccccc cttaaagaga 20
<210> 29
<211> 20
<212> DNA
<213> EBX1靶位点序列(EB X1 target sequence)
<400> 29
tgcccctccc tccctggccc 20
<210> 30
<211> 20
<212> DNA
<213> MYOD1靶位点序列(MYOD1 Target bit sequence)
<400> 30
ccagcagctg gtcacaaagc 20
<210> 31
<211> 20
<212> DNA
<213> FAP sg1靶位点序列(FAP SG1 target sequence)
<400> 31
gacaatgcac atcaccaata 20
<210> 32
<211> 20
<212> DNA
<213> FRZB靶位点序列(FRZB target sequence)
<400> 32
gggcgtgtgc atctctcccg 20
<210> 33
<211> 20
<212> DNA
<213> c-kit-1 sg靶位点序列(C-kit-1 SG target sequence)
<400> 33
agcgccctcc ctctgcgcgc 20
<210> 34
<211> 20
<212> DNA
<213> HOXC8 sg2靶位点序列(HOXC8sg2 target sequence)
<400> 34
gctaggcagt ctcagttgtt 20
<210> 35
<211> 20
<212> DNA
<213> miR21靶位点序列(MiR21 target sequence)
<400> 35
tgataagcta cccgacaagg 20
<210> 36
<211> 20
<212> DNA
<213> miR34靶位点序列(MiR34 target sequence)
<400> 36
ttctttggca gtgtcttagc 20
<210> 37
<211> 20
<212> DNA
<213> miR155靶位点序列(miR155 target sequence)
<400> 37
ctgttaatgc taatcgtgat 20
<210> 38
<211> 20
<212> DNA
<213> VEGF靶位点序列(VEGF target sequence)
<400> 38
gaccccctcc accccgcctc 20
<210> 39
<211> 20
<212> DNA
<213> VEGFA GainG靶位点序列(VEGFA Gainger Target Sequence)
<400> 39
ctcccccgcc accccgcccc 20
<210> 40
<211> 24
<212> DNA
<213> GCGC位点1靶位点序列正向引物(GCGC bitpoint 1 target sequence forwardprimer)
<400> 40
accgactgcg ctgcccttgg gccc 24
<210> 41
<211> 24
<212> DNA
<213> GCGC位点1靶位点序列反向引物(GCGC bitpoint 1 target sequence reverseprimer)
<400> 41
aaacgggccc aagggcagcg cagt 24
<210> 42
<211> 24
<212> DNA
<213> GCGC位点2靶位点序列正向引物(GCGC bit 2 target sequence forwardprimer)
<400> 42
accgtcctgc ggcgccggaa ggac 24
<210> 43
<211> 24
<212> DNA
<213> GCGC位点2靶位点序列反向引物(GCGC bitpoint 2 target sequence reverseprimer)
<400> 43
aaacgtcctt ccggcgccgc agga 24
<210> 44
<211> 24
<212> DNA
<213> GCGC位点3靶位点序列正向引物(GCGC bitpoint 3 target sequence forwardprimer)
<400> 44
accggcgctg ctggcagtga tgat 24
<210> 45
<211> 24
<212> DNA
<213> GCGC位点3靶位点序列反向引物(GCGC bitpoint 3 target sequence reverseprimer)
<400> 45
aaacatcatc actgccagca gcgc 24
<210> 46
<211> 24
<212> DNA
<213> C9ORF72高鸟嘌呤含量sg1靶位点序列正向引物(C9ORF 72 High guaninecontent SG1 target sequence forward primer)
<400> 46
accgccccga ccacgccccg gccc 24
<210> 47
<211> 24
<212> DNA
<213> C9ORF72高鸟嘌呤含量sg1靶位点序列反向引物(C9ORF 72 High guaninecontent SG1 target sequence reverse primer)
<400> 47
aaacgggccg gggcgtggtc gggg 24
<210> 48
<211> 24
<212> DNA
<213> 293 site3靶位点序列正向引物(293 Site3 target sequence forwardprimer)
<400> 48
accgggccca gactgagcac gtga 24
<210> 49
<211> 24
<212> DNA
<213> 293 site3靶位点序列反向引物(293 Site3 target sequence reverseprimer)
<400> 49
aaactcacgt gctcagtctg ggcc 24
<210> 50
<211> 24
<212> DNA
<213> 294 site3 LoseG靶位点序列正向引物(294 Site3 LoseG target sequenceforward primer)
<400> 50
accgcaccca gactgagcac gtgc 24
<210> 51
<211> 24
<212> DNA
<213> 294 site3 LoseG靶位点序列反向引物(294 Site3 LoseG target sequencereverse primer)
<400> 51
aaacgcacgt gctcagtctg ggtg 24
<210> 52
<211> 24
<212> DNA
<213> 293 site4靶位点序列正向引物(293 site4 target sequence forwardprimer)
<400> 52
accgggcact gcggctggag gtgg 24
<210> 53
<211> 24
<212> DNA
<213> 293 site4靶位点序列反向引物(293 site4 target sequence reverseprimer)
<400> 53
aaacccacct ccagccgcag tgcc 24
<210> 54
<211> 24
<212> DNA
<213> FANCF靶位点序列正向引物(FANCF target sequence forward primer)
<400> 54
accggacccc ctccaccccg cctc 24
<210> 55
<211> 24
<212> DNA
<213> FANCF靶位点序列反向引物(FANCF target sequence reverse primer)
<400> 55
aaacgaggcg gggtggaggg ggtc 24
<210> 56
<211> 24
<212> DNA
<213> DNMT3B靶位点序列正向引物(DNMT3B target sequence forward primer)
<400> 56
accgctcccc cgccaccccg cccc 24
<210> 57
<211> 24
<212> DNA
<213> DNMT3B靶位点序列反向引物(DNMT3B target sequence reverse primer)
<400> 57
aaacggggcg gggtggcggg ggag 24
<210> 58
<211> 24
<212> DNA
<213> DNMT3B LossG靶位点序列正向引物(DNMT3B LossG target sequence forwardprimer)
<400> 58
accgggaatc ccttctgcag cacc 24
<210> 59
<211> 24
<212> DNA
<213> DNMT3B LossG靶位点序列反向引物(DNMT3B LossG target sequence reverseprimer)
<400> 59
aaacggtgct gcagaaggga ttcc 24
<210> 60
<211> 24
<212> DNA
<213> EBX1靶位点序列正向引物(EBX1 target sequence forward primer)
<400> 60
accgagagcc ccccctcaaa gaga 24
<210> 61
<211> 24
<212> DNA
<213> EBX1靶位点序列反向引物(EBX1 target sequence reverse primer)
<400> 61
aaactctctt tgaggggggg ctct 24
<210> 62
<211> 24
<212> DNA
<213> MYOD1靶位点序列正向引物(MYOD1 target sequence forward primer)
<400> 62
accgaaatcc cccccttaaa gaga 24
<210> 63
<211> 24
<212> DNA
<213> MYOD1靶位点序列反向引物(MYOD1 Target Sequence Reverse Primer)
<400> 63
aaactctctt taaggggggg attt 24
<210> 64
<211> 24
<212> DNA
<213> FAP sg1靶位点序列正向引物(FAP SG1 target sequence forward primer)
<400> 64
accgtgcccc tccctccctg gccc 24
<210> 65
<211> 24
<212> DNA
<213> FAP sg1靶位点序列反向引物(FAP SG1 target sequence reverse primer)
<400> 65
aaacgggcca gggagggagg ggca 24
<210> 66
<211> 24
<212> DNA
<213> FRZB靶位点序列正向引物(FRZB target sequence forward primer)
<400> 66
accgccagca gctggtcaca aagc 24
<210> 67
<211> 24
<212> DNA
<213> FRZB靶位点序列反向引物(FRZB target sequence reverse primer)
<400> 67
aaacgctttg tgaccagctg ctgg 24
<210> 68
<211> 24
<212> DNA
<213> c-kit-1 sg靶位点序列正向引物(c-kit -1 SG target sequence forwardprimer)
<400> 68
accggacaat gcacatcacc aata 24
<210> 69
<211> 24
<212> DNA
<213> c-kit-1 sg靶位点序列反向引物(c-kit -1 SG target sequence reverseprimer)
<400> 69
aaactattgg tgatgtgcat tgtc 24
<210> 70
<211> 24
<212> DNA
<213> HOXC8 sg2靶位点序列正向引物(HOXC8sg2 target sequence forwardprimer)
<400> 70
accggggcgt gtgcatctct cccg 24
<210> 71
<211> 24
<212> DNA
<213> HOXC8 sg2靶位点序列反向引物(HOXC8sg2 target sequence reverseprimer)
<400> 71
aaaccgggag agatgcacac gccc 24
<210> 72
<211> 24
<212> DNA
<213> miR21靶位点序列正向引物(miR21 target sequence forward primer)
<400> 72
accgagcgcc ctccctctgc gcgc 24
<210> 73
<211> 24
<212> DNA
<213> miR21靶位点序列反向引物(miR21 target sequence reverse primer)
<400> 73
aaacgcgcgc agagggaggg cgct 24
<210> 74
<211> 24
<212> DNA
<213> miR34靶位点序列正向引物(miR34 target sequence forward primer)
<400> 74
accggctagg cagtctcagt tgtt 24
<210> 75
<211> 24
<212> DNA
<213> miR34靶位点序列反向引物(miR34 target sequence reverse primer)
<400> 75
aaacaacaac tgagactgcc tagc 24
<210> 76
<211> 24
<212> DNA
<213> miR155靶位点序列正向引物(Mi R155 target sequence forward primer)
<400> 76
accgtgataa gctacccgac aagg 24
<210> 77
<211> 24
<212> DNA
<213> miR155靶位点序列反向引物(Mi R155 target sequence reverse primer)
<400> 77
aaacccttgt cgggtagctt atca 24
<210> 78
<211> 24
<212> DNA
<213> VEGF靶位点序列正向引物(VEGF target sequence forward primer)
<400> 78
accgttcttt ggcagtgtct tagc 24
<210> 79
<211> 24
<212> DNA
<213> VEGF靶位点序列反向引物(VEGF target sequence reverse primer)
<400> 79
aaacgctaag acactgccaa agaa 24
<210> 80
<211> 24
<212> DNA
<213> VEGFA GainG靶位点序列正向引物(VEGFA GainG target sequence forwardprimer)
<400> 80
accgctgtta atgctaatcg tgat 24
<210> 81
<211> 24
<212> DNA
<213> VEGFA GainG靶位点序列反向引物(VEGFA GainG target sequence reverseprimer)
<400> 81
aaacatcacg attagcatta acag 24
<210> 82
<211> 8388
<212> DNA
<213> BE-A核酸序列(BE-A nucleic acid sequence)
<400> 82
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 60
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 120
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 180
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 240
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 300
ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt cagatccgct 360
agagatccgc ggccgctaat acgactcact atagggagag ccgccaccat ggacagcctg 420
ctgatgaaca ggagggagtt cctgtaccag ttcaagaacg tcagatgggc caagggcagg 480
agggagacct acctctgcta cgtggtgaag agaagggaca gcgccacctc cttctccctg 540
gacttcggat acctgaggaa caagaacggc tgccacgtgg agctgctgtt cctgaggtat 600
atcagcgact gggacctgga ccccggcaga tgttacaggg tgacctggtt catctcctgg 660
agcccctgct acgactgcgc taggcacgtg gccgacttcc tgaggggcaa ccctaacctg 720
agcctgagga tcttcaccgc caggctgtac ttctgcgagg acaggaaggc cgaacccgag 780
ggcctgagga gactgcacag agccggagtg cagatcgcca tcatgacctt caaggactat 840
ttttactgct ggaacacctt cgtggagaac cacggcagga ccttcaaagc ctgggagggc 900
ctgcacgaga acagcgtgag gctgtccaga cagctgaggc gtattttact gagcggcagc 960
gagactcccg ggacctcaga gtccgccaca cccgaaagtg ataaaaagta ttctattggt 1020
ttagccatcg gcactaattc cgttggatgg gctgtcataa ccgatgaata caaagtacct 1080
tcaaagaaat ttaaggtgtt ggggaacaca gaccgtcatt cgattaaaaa gaatcttatc 1140
ggtgccctcc tattcgatag tggcgaaacg gcagaggcga ctcgcctgaa acgaaccgct 1200
cggagaaggt atacacgtcg caagaaccga atatgttact tacaagaaat ttttagcaat 1260
gagatggcca aagttgacga ttctttcttt caccgtttgg aagagtcctt ccttgtcgaa 1320
gaggacaaga aacatgaacg gcaccccatc tttggaaaca tagtagatga ggtggcatat 1380
catgaaaagt acccaacgat ttatcacctc agaaaaaagc tagttgactc aactgataaa 1440
gcggacctga ggttaatcta cttggctctt gcccatatga taaagttccg tgggcacttt 1500
ctcattgagg gtgatctaaa tccggacaac tcggatgtcg acaaactgtt catccagtta 1560
gtacaaacct ataatcagtt gtttgaagag aaccctataa atgcaagtgg cgtggatgcg 1620
aaggctattc ttagcgcccg cctctctaaa tcccgacggc tagaaaacct gatcgcacaa 1680
ttacccggag agaagaaaaa tgggttgttc ggtaacctta tagcgctctc actaggcctg 1740
acaccaaatt ttaagtcgaa cttcgactta gctgaagatg ccaaattgca gcttagtaag 1800
gacacgtacg atgacgatct cgacaatcta ctggcacaaa ttggagatca gtatgcggac 1860
ttatttttgg ctgccaaaaa ccttagcgat gcaatcctcc tatctgacat actgagagtt 1920
aatactgaga ttaccaaggc gccgttatcc gcttcaatga tcaaaaggta cgatgaacat 1980
caccaagact tgacacttct caaggcccta gtccgtcagc aactgcctga gaaatataag 2040
gaaatattct ttgatcagtc gaaaaacggg tacgcaggtt atattgacgg cggagcgagt 2100
caagaggaat tctacaagtt tatcaaaccc atattagaga agatggatgg gacggaagag 2160
ttgcttgtaa aactcaatcg cgaagatcta ctgcgaaagc agcggacttt cgacaacggt 2220
agcattccac atcaaatcca cttaggcgaa ttgcatgcta tacttagaag gcaggaggat 2280
ttttatccgt tcctcaaaga caatcgtgaa aagattgaga aaatcctaac ctttcgcata 2340
ccttactatg tgggacccct ggcccgaggg aactctcggt tcgcatggat gacaagaaag 2400
tccgaagaaa cgattactcc atggaatttt gaggaagttg tcgataaagg tgcgtcagct 2460
caatcgttca tcgagaggat gaccaacttt gacaagaatt taccgaacga aaaagtattg 2520
cctaagcaca gtttacttta cgagtatttc acagtgtaca atgaactcac gaaagttaag 2580
tatgtcactg agggcatgcg taaacccgcc tttctaagcg gagaacagaa gaaagcaata 2640
gtagatctgt tattcaagac caaccgcaaa gtgacagtta agcaattgaa agaggactac 2700
tttaagaaaa ttgaatgctt cgattctgtc gagatctccg gggtagaaga tcgatttaat 2760
gcgtcacttg gtacgtatca tgacctccta aagataatta aagataagga cttcctggat 2820
aacgaagaga atgaagatat cttagaagat atagtgttga ctcttaccct ctttgaagat 2880
cgggaaatga ttgaggaaag actaaaaaca tacgctcacc tgttcgacga taaggttatg 2940
aaacagttaa agaggcgtcg ctatacgggc tggggacgat tgtcgcggaa acttatcaac 3000
gggataagag acaagcaaag tggtaaaact attctcgatt ttctaaagag cgacggcttc 3060
gccaatagga actttatgca gctgatccat gatgactctt taaccttcaa agaggatata 3120
caaaaggcac aggtttccgg acaaggggac tcattgcacg aacatattgc gaatcttgct 3180
ggttcgccag ccatcaaaaa gggcatactc cagacagtca aagtagtgga tgagctagtt 3240
aaggtcatgg gacgtcacaa accggaaaac attgtaatcg agatggcacg cgaaaatcaa 3300
acgactcaga aggggcaaaa aaacagtcga gagcggatga agagaataga agagggtatt 3360
aaagaactgg gcagccagat cttaaaggag catcctgtgg aaaataccca attgcagaac 3420
gagaaacttt acctctatta cctacaaaat ggaagggaca tgtatgttga tcaggaactg 3480
gacataaacc gtttatctga ttacgacgtc gatcacattg taccccaatc ctttttgaag 3540
gacgattcaa tcgacaataa agtgcttaca cgctcggata agaaccgagg gaaaagtgac 3600
aatgttccaa gcgaggaagt cgtaaagaaa atgaagaact attggcggca gctcctaaat 3660
gcgaaactga taacgcaaag aaagttcgat aacttaacta aagctgagag gggtggcttg 3720
tctgaacttg acaaggccgg atttattaaa cgtcagctcg tggaaacccg ccaaatcaca 3780
aagcatgttg cacagatact agattcccga atgaatacga aatacgacga gaacgataag 3840
ctgattcggg aagtcaaagt aatcacttta aagtcaaaat tggtgtcgga cttcagaaag 3900
gattttcaat tctataaagt tagggagata aataactacc accatgcgca cgacgcttat 3960
cttaatgccg tcgtagggac cgcactcatt aagaaatacc cgaagctaga aagtgagttt 4020
gtgtatggtg attacaaagt ttatgacgtc cgtaagatga tcgcgaaaag cgaacaggag 4080
ataggcaagg ctacagccaa atacttcttt tattctaaca ttatgaattt ctttaagacg 4140
gaaatcactc tggcaaacgg agagatacgc aaacgacctt taattgaaac caatggggag 4200
acaggtgaaa tcgtatggga taagggccgg gacttcgcga cggtgagaaa agttttgtcc 4260
atgccccaag tcaacatagt aaagaaaact gaggtgcaga ccggagggtt ttcaaaggaa 4320
tcgattcttc caaaaaggaa tagtgataag ctcatcgctc gtaaaaagga ctgggacccg 4380
aaaaagtacg gtggcttcga tagccctaca gttgcctatt ctgtcctagt agtggcaaaa 4440
gttgagaagg gaaaatccaa gaaactgaag tcagtcaaag aattattggg gataacgatt 4500
atggagcgct cgtcttttga aaagaacccc atcgacttcc ttgaggcgaa aggttacaag 4560
gaagtaaaaa aggatctcat aattaaacta ccaaagtata gtctgtttga gttagaaaat 4620
ggccgaaaac ggatgttggc tagcgccgga gagcttcaaa aggggaacga actcgcacta 4680
ccgtctaaat acgtgaattt cctgtattta gcgtcccatt acgagaagtt gaaaggttca 4740
cctgaagata acgaacagaa gcaacttttt gttgagcagc acaaacatta tctcgacgaa 4800
atcatagagc aaatttcgga attcagtaag agagtcatcc tagctgatgc caatctggac 4860
aaagtattaa gcgcatacaa caagcacagg gataaaccca tacgtgagca ggcggaaaat 4920
attatccatt tgtttactct taccaacctc ggcgctccag ccgcattcaa gtattttgac 4980
acaacgatag atcgcaaacg atacacttct accaaggagg tgctagacgc gacactgatt 5040
caccaatcca tcacgggatt atatgaaact cggatagatt tgtcacagct tgggggtgac 5100
tctggtggtt ctactaatct gtcagatatt attgaaaagg agaccggtaa gcaactggtt 5160
atccaggaat ccatcctcat gctcccagag gaggtggaag aagtcattgg gaacaagccg 5220
gaaagcgata tactcgtgca caccgcctac gacgagagca ccgacgagaa tgtcatgctt 5280
ctgactagcg acgcccctga atacaagcct tgggctctgg tcatacagga tagcaacggt 5340
gagaacaaga ttaagatgct ctctggtggt tctcccaaga agaagaggaa agtctaaccg 5400
gtcatcatca ccatcaccat tgagtttaaa cccgctgatc agcctcgact gtgccttcta 5460
gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 5520
ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 5580
attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata 5640
gcaggcatgc tggggatgcg gtgggctcta tggcttctga ggcggaaaga accagctggg 5700
gctcgatacc gtcgacctct agctagagct tggcgtaatc atggtcatag ctgtttcctg 5760
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 5820
aagcctaggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 5880
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 5940
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6000
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6060
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6120
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6180
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6240
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6300
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6360
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6420
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6480
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6540
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6600
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 6660
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 6720
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6780
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6840
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 6900
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 6960
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7020
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7080
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7140
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7200
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7260
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7320
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7380
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7440
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7500
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7560
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7620
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 7680
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 7740
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7800
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7860
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cgacggatcg ggagatcgat 7920
ctcccgatcc cctagggtcg actctcagta caatctgctc tgatgccgca tagttaagcc 7980
agtatctgct ccctgcttgt gtgttggagg tcgctgagta gtgcgcgagc aaaatttaag 8040
ctacaacaag gcaaggcttg accgacaatt gcatgaagaa tctgcttagg gttaggcgtt 8100
ttgcgctgct tcgcgatgta cgggccagat atacgcgttg acattgatta ttgactagtt 8160
attaatagta atcaattacg gggtcattag ttcatagccc atatatggag ttccgcgtta 8220
cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt 8280
caataatgac gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg 8340
tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatc 8388
<210> 83
<211> 22
<212> DNA
<213> GCGC位点1靶位点上游扩增引物(GCGC bit 1 target point upstreamamplification primer)
<400> 83
gagctcgtga gtgtgggctt ag 22
<210> 84
<211> 25
<212> DNA
<213> GCGC位点1靶位点下游扩增引物(GCGC bit 1 target point downstreamamplification primer)
<400> 84
ggcctggtag aggagataac agctg 25
<210> 85
<211> 23
<212> DNA
<213> GCGC位点2靶位点上游扩增引物(GCGC bitpoint 2 target upstreamamplification primer)
<400> 85
gctgttaagc agccgatcct agg 23
<210> 86
<211> 21
<212> DNA
<213> GCGC位点2靶位点下游扩增引物(GCGC bitpoint 2 target downstreamamplification primer)
<400> 86
gagtgaatga accctggcac g 21
<210> 87
<211> 21
<212> DNA
<213> GCGC位点3靶位点上游扩增引物(GCGC bitpoint 3 target upstreamamplification primer)
<400> 87
gagcacagag ggtacaggcc g 21
<210> 88
<211> 24
<212> DNA
<213> GCGC位点3靶位点下游扩增引物(GCGC bitpoint 3 target downstreamamplification primer)
<400> 88
ggtaggagga ttgcctgagc ccag 24
<210> 89
<211> 20
<212> DNA
<213> C9ORF72高G含量sg1靶位点上游扩增引物(C9ORF 72 High G content SG1target point upstream amplification primer)
<400> 89
gtactcgctg agggtgaaca 20
<210> 90
<211> 20
<212> DNA
<213> C9ORF72高G含量sg1靶位点下游扩增引物(C9ORF 72 high G content SG1target point downstream amplification primer)
<400> 90
caggatgccg cctcctcact 20
<210> 91
<211> 20
<212> DNA
<213> 293 site3靶位点上游扩增引物(293 Site3 target upstream amplificationprimer)
<400> 91
gggaaacgcc catgcaatta 20
<210> 92
<211> 20
<212> DNA
<213> 293 site3靶位点下游扩增引物(293 Site3 target downstreamamplification primer)
<400> 92
gtcaaccagt atcccggtgc 20
<210> 93
<211> 20
<212> DNA
<213> 294 site3 LoseG靶位点上游扩增引物(294 Site3 LoseG target upstreamamplification primer)
<400> 93
gacctggaga agcatgaacc 20
<210> 94
<211> 20
<212> DNA
<213> 294 site3 LoseG靶位点下游扩增引物(294 Site3 LoseG target downstreamamplification primer)
<400> 94
atcgtctgag tgcttcatgg 20
<210> 95
<211> 20
<212> DNA
<213> 293 site4靶位点上游扩增引物(293 site4 target upstream amplificationprimer)
<400> 95
ctcccttcaa gatggctgac 20
<210> 96
<211> 20
<212> DNA
<213> 293 site4靶位点下游扩增引物(293 site4 target downstreamamplification primer)
<400> 96
cgaacggaga cacacacaca 20
<210> 97
<211> 20
<212> DNA
<213> FANCF靶位点上游扩增引物(FANCF target upstream amplification primer)
<400> 97
gcgctgacgg acagacagac 20
<210> 98
<211> 20
<212> DNA
<213> FANCF靶位点下游扩增引物(FANCF target point downstream amplificationprimer)
<400> 98
tagcacttct cgcggctccg 20
<210> 99
<211> 20
<212> DNA
<213> DNMT3B靶位点上游扩增引物(Augmented primer upstream of DNMT3B targetpoint)
<400> 99
tgacaccgtt ggaccaggtg 20
<210> 100
<211> 20
<212> DNA
<213> DNMT3B靶位点下游扩增引物(Downstream amplification primer for DNMT3Btarget point)
<400> 100
gctgtaagac tgcctcaatt 20
<210> 101
<211> 20
<212> DNA
<213> DNMT3B LossG靶位点上游扩增引物(DNA MT3B LossG target upstreamamplification primer)
<400> 101
agaggcgtat catttcgcgg 20
<210> 102
<211> 20
<212> DNA
<213> DNMT3B LossG靶位点下游扩增引物(Downstream amplification primer forDNMT3B LossG target point)
<400> 102
cgatggatgt ggcgcaggta 20
<210> 103
<211> 20
<212> DNA
<213> EBX1靶位点上游扩增引物(EBX1 target amplification primer upstream)
<400> 103
ctggtgtcag ggcctcaact 20
<210> 104
<211> 20
<212> DNA
<213> EBX1靶位点下游扩增引物(EBX1 target amplification primer downstream)
<400> 104
ctgagtctcc acacaggtgc 20
<210> 105
<211> 20
<212> DNA
<213> MYOD1靶位点上游扩增引物(MYOD1 target point upstream amplifiedprimer)
<400> 105
ggctaccact tctacacttt 20
<210> 106
<211> 20
<212> DNA
<213> MYOD1靶位点下游扩增引物(MYOD1 target point downstream amplificationprimer)
<400> 106
gggcttggat agttgaaatc 20
<210> 107
<211> 20
<212> DNA
<213> FAP sg1靶位点上游扩增引物(FAP SG1 target upstream amplificationprimer)
<400> 107
ggggccccta accctatgta 20
<210> 108
<211> 20
<212> DNA
<213> FAP sg1靶位点下游扩增引物(FAP SG1 target downstream amplificationprimer)
<400> 108
caccggttga tgtgatggga 20
<210> 109
<211> 20
<212> DNA
<213> FRZB靶位点上游扩增引物(FRZB target upstream amplified primer)
<400> 109
cagggggaac accaaggaac 20
<210> 110
<211> 20
<212> DNA
<213> FRZB靶位点下游扩增引物(FRZB target amplified primer downstream)
<400> 110
actctgggcg ccacgtattg 20
<210> 111
<211> 20
<212> DNA
<213> c-kit-1 sg靶位点上游扩增引物(c-kit-1 SG target upstreamamplification primer)
<400> 111
aggtgtaaac aaaatcttgc 20
<210> 112
<211> 20
<212> DNA
<213> c-kit-1 sg靶位点下游扩增引物(c-kit-1 SG target downstreamamplification primer)
<400> 112
tgttcaacca cttgtgatct 20
<210> 113
<211> 20
<212> DNA
<213> HOXC8 sg2靶位点上游扩增引物(HOXC8sg2 target upstream amplificationprimer)
<400> 113
gctgtgagcc catactcatc 20
<210> 114
<211> 20
<212> DNA
<213> HOXC8 sg2靶位点下游扩增引物(HOXC8sg2 target point downstreamamplification primer)
<400> 114
gactccaaga attgaggagg 20
<210> 115
<211> 20
<212> DNA
<213> miR21靶位点上游扩增引物(MiR21 target upstream amplification primer)
<400> 115
ggcattaaca cgtcgaaaga 20
<210> 116
<211> 20
<212> DNA
<213> miR21靶位点下游扩增引物(MiR21 target point downstream amplificationprimer)
<400> 116
gtagctgcga tgggatccga 20
<210> 117
<211> 20
<212> DNA
<213> miR34靶位点上游扩增引物(MiR34 target upstream amplification primer)
<400> 117
gaaacctcca gcgtatttta 20
<210> 118
<211> 20
<212> DNA
<213> miR34靶位点下游扩增引物(MiR34 target downstream amplificationprimer)
<400> 118
cgagcacatt gcataaacag 20
<210> 119
<211> 20
<212> DNA
<213> miR155靶位点上游扩增引物(miR155 target upstream amplificationprimer)
<400> 119
gatcttaaca ggccagaaat 20
<210> 120
<211> 20
<212> DNA
<213> miR155靶位点下游扩增引物(miR155 target amplification primerdownstream)
<400> 120
gagaacattg gatatggatg 20
<210> 121
<211> 20
<212> DNA
<213> VEGF靶位点上游扩增引物(VEGF target upstream amplification primer)
<400> 121
gaagcgatcc tcccacctcg 20
<210> 122
<211> 20
<212> DNA
<213> VEGF靶位点下游扩增引物(VEGF target amplification primer downstream)
<400> 122
gggcatctct cgcttcatct 20
<210> 123
<211> 20
<212> DNA
<213> VEGFA GainG靶位点上游扩增引物(VEGFA GainG target upstreamamplification primer)
<400> 123
gcaggtggca caaaccagga 20
<210> 124
<211> 20
<212> DNA
<213> VEGFA GainG靶位点下游扩增引物(VEGFA GainG target downstreamamplification primer)
<400> 124
gcagggtgac tcatgcttct 20
<210> 125
<211> 20
<212> DNA
<213> 针对前4个G4设计靶向序列(Design target sequences for the first 4 G4)
<400> 125
accccgcccc cggcccgccc 20
<210> 126
<211> 24
<212> DNA
<213> 针对前4个G4设计靶向sgRNA的正向引物(Positive primers targeting sgRNAfor the first 4 G4 designs)
<400> 126
accgaccccg cccccggccc gccc 24
<210> 127
<211> 24
<212> DNA
<213> 针对前4个G4设计靶向sgRNA的反向引物(Reverse primers targeting sgRNAfor the first 4 G4 designs)
<400> 127
aaacgggcgg gccgggggcg gggt 24
<210> 128
<211> 20
<212> DNA
<213> 针对前4个G4设计靶向序列的上游扩增引物(Upstream amplification primerfor the first 4 G4 design target sequences)
<400> 128
gcgggccagg cttcactgag 20
<210> 129
<211> 20
<212> DNA
<213> 针对前4个G4设计靶向序列的下游扩增引物(Downstream amplificationprimers for the first 4 G4 design target sequences)
<400> 129
gaccggtcca cctaaccgct 20
<210> 130
<211> 22
<212> DNA
<213> G4四联体的WT型序列正向引物(WT-type sequence forward primer of G4quadrangle)
<400> 130
cggggcgggc cgggggcggg gt 22
<210> 131
<211> 22
<212> DNA
<213> G4四联体的WT型序列反向引物(WT-type sequence reverse primer of G4quadrangle)
<400> 131
accccgcccc cggcccgccc cg 22
<210> 132
<211> 22
<212> DNA
<213> G4四联体碱基编辑后的突变类型正向引物(G4 quadruple base edited typeof mutation forward primer)
<400> 132
cggggcggac caaaaacaaa at 22
<210> 133
<211> 22
<212> DNA
<213> G4四联体碱基编辑后的突变类型反向引物(G4 quadruple base editedmutation type reverse primer)
<400> 133
attttgtttt tggtccgccc cg 22
<210> 134
<211> 22
<212> DNA
<213> VEGFA基因Q-PCR上游引物(VEGFA gene Q-PCR upstream primer)
<400> 134
ttgccttgct gctctacctc ca 22
<210> 135
<211> 22
<212> DNA
<213> VEGFA基因Q-PCR下游引物(VEGFA gene Q-PCR downstream primer)
<400> 135
gatggcagta gctgcgctga ta 22
<210> 136
<211> 20
<212> DNA
<213> GAPDH基因Q-PCR上游引物(GAPDH gene Q-PCR upstream primer)
<400> 136
catcaatgga aatcccatca 20
<210> 137
<211> 20
<212> DNA
<213> GAPDH基因Q-PCR下游引物(GAPDH gene Q-PCR downstream primer)
<400> 137
ttctccatgg tggtgaagac 20
<210> 138
<211> 597
<212> DNA
<213> 编码SEQ ID NO:4所示全长胞嘧啶脱氨酶AIDfl的核苷酸序列(Code SEQID NO:4 The full length cytosine deaminase AIDfl nucleotide sequence)
<400> 138
atggacagcc tcttgatgaa ccggaggaag tttctttacc aattcaaaaa tgtccgctgg 60
gctaagggtc ggcgtgagac ctacctgtgc tacgtagtga agaggcgtga cagtgctaca 120
tccttttcac tggactttgg ttatcttcgc aataagaacg gctgccacgt ggaattgctc 180
ttcctccgct acatctcgga ctgggaccta gaccctggcc gctgctaccg cgtcacctgg 240
ttcacctcct ggagcccctg ctacgactgt gcccgacatg tggccgactt tctgcgaggg 300
aaccccaacc tcagtctgag gatcttcacc gcgcgcctct acttctgtga ggaccgcaag 360
gctgagcccg aggggctgcg gcggctgcac cgcgccgggg tgcaaatagc catcatgacc 420
ttcaaagatt atttttactg ctggaatact tttgtagaaa accacgaaag aactttcaaa 480
gcctgggaag ggctgcatga aaattcagtt cgtctctcca gacagcttcg gcgcatcctt 540
ttgcccctgt atgaggttga tgacttacga gacgcatttc gtactttggg actttga 597
<210> 139
<211> 543
<212> DNA
<213> 人胞嘧啶脱氨酶AID优化版本hAID*Δ 的编码序列(Human cytosinedeaminase AID optimizes the encoding sequence of hAID*Δ of the version)
<400> 139
atggacagcc tgctgatgaa caggagggag ttcctgtacc agttcaagaa cgtcagatgg 60
gccaagggca ggagggagac ctacctctgc tacgtggtga agagaaggga cagcgccacc 120
tccttctccc tggacttcgg atacctgagg aacaagaacg gctgccacgt ggagctgctg 180
ttcctgaggt atatcagcga ctgggacctg gaccccggca gatgttacag ggtgacctgg 240
ttcatctcct ggagcccctg ctacgactgc gctaggcacg tggccgactt cctgaggggc 300
aaccctaacc tgagcctgag gatcttcacc gccaggctgt acttctgcga ggacaggaag 360
gccgaacccg agggcctgag gagactgcac agagccggag tgcagatcgc catcatgacc 420
ttcaaggact atttttactg ctggaacacc ttcgtggaga accacggcag gaccttcaaa 480
gcctgggagg gcctgcacga gaacagcgtg aggctgtcca gacagctgag gcgtatttta 540
ctg 543
<210> 140
<211> 16
<212> PRT
<213> 将胞嘧啶脱氨酶AID连接于单链抗体scFv上的连接子(connectors attachingcytosine deaminase ID to single-chain antibody scFv)
<400> 140
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 141
<211> 5
<212> PRT
<213> 将尿嘧啶糖基化酶抑制物UGI的连接于胞嘧啶脱氨酶AID上的连接子(aconnector that connects the uracil glycosylase inhibitor UGI to the cytosinedeaminase ID)
<400> 141
Gly Gly Gly Gly Ser
1 5
<210> 142
<211> 18
<212> PRT
<213> 将防止多聚化的热稳定性结构域GB1连接于scFv-AID-UGI蛋白的尿嘧啶糖基化酶抑制物UGI上的连接子(Connectors of the thermal stability domain GB1 to theuracil glycosylase inhibitor UGI of the scFv-AID-UGI protein to preventpolymerization)
<400> 142
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg
1 5 10 15
Thr Glu
<210> 143
<211> 42
<212> DNA
<213> 全长AIDfl的正向扩增引物(full-length AIDfl positive amplificationprimer)
<400> 143
gagtccgcca cacccgaaag tatggacagc ctcttgatga ac 42
<210> 144
<211> 44
<212> DNA
<213> 全长AIDfl的反向扩增引物(Full length AIDfl reverse amplificationprimer)
<400> 144
gattagtgct tccacctccg ccaagtccca aagtacgaaa tgcg 44

Claims (10)

1.一种碱基编辑工具,其特征在于,该碱基编辑工具包括:
(1)多拷贝的GCN4与D10A-Cas9连接形成的GCN4-D10A蛋白;
(2)胞嘧啶脱氨酶AID与尿嘧啶糖基化酶抑制物UGI连于单链抗体scFv形成的scFv-AID-UGI蛋白,或者
胞嘧啶脱氨酶AID、尿嘧啶糖基化酶抑制物UGI和防止多聚化的热稳定性结构域GB1连于单链抗体scFv形成的scFv-AID-UGI-GB1蛋白。
2.根据权利要求1所述的碱基编辑工具,其中,所述GCN4-D10A蛋白中,GCN4的拷贝数为8-12个;
优选的,多拷贝的GCN4与D10A-Cas9通过连接子连接形成GCN4-D10A蛋白;
优选的,所述连接子的氨基酸序列如SEQ ID NO:1所示;
优选的,所述GCN4的氨基酸序列如SEQ ID NO:2所示;
优选的,D10A-Cas9的氨基酸序列如SEQ ID NO:3所示。
3.根据权利要求1所述的碱基编辑工具,其中,所述胞嘧啶脱氨酶AID为全长胞嘧啶脱氨酶AIDfl,其氨基酸序列如SEQ ID NO:4所示;或者
所述胞嘧啶脱氨酶AID为SEQ ID NO:4的优化版本hAID*Δ,所述优化版本hAID*Δ为在SEQ ID NO:4所示的氨基酸序列进行K10E、E156G和T82I中的至少一种突变且缺失182-198位氨基酸衍生的氨基酸序列;优选的,所述优化版本hAID*Δ的氨基酸序列如SEQ ID NO:5所示。
4.根据权利要求1所述的碱基编辑工具,其中,尿嘧啶糖基化酶抑制物UGI的氨基酸序列如SEQ ID NO:6所示;和/或
所述单链抗体scFv的氨基酸序列如SEQ ID NO:7所示;和/或
所述防止多聚化的热稳定性结构域GB1的氨基酸序列如SEQ ID NO:8所示。
5.根据权利要求1-4中任意一项所述的碱基编辑工具,其中,所述碱基编辑工具还包括sgRNA载体,用于引导GCN4-D10A蛋白招募的scFv-AID-UGI蛋白或scFv-AID-UGI-GB1蛋白在靶位点进行碱基编辑;
优选的,所述sgRNA载体为靶向富含GC的基因调控区或调控元件的sgRNA载体;
优选的,所述sgRNA载体的核苷酸序列如SEQ ID NO:9所示。
6.编码权利要求1-5中任意一项所述的碱基编辑工具的核酸,其特征在于,该核酸包括:
(1)编码所述GCN4-D10A蛋白的第一核酸;
(2)编码所述scFv-AID-UGI蛋白或scFv-AID-UGI-GB1蛋白的第二核酸。
7.权利要求1-5中任意一项所述的碱基编辑工具或权利要求6所述的核酸在碱基编辑中的应用。
8.根据权利要求7所述的应用,其中,所述碱基编辑在真核生物细胞中进行;
优选的,所述的应用包括:用于引入提前的终止密码子进行基因敲除、用于产生随机突变实现蛋白进化、药物靶点筛选、基因调控元件筛选和富含GC的非编码区域功能研究中的至少一种。
9.一种在真核细胞内进行碱基编辑的方法,其特征在于,该方法包括:将权利要求1-5中任意一项所述的碱基编辑工具引入真核细胞内,对靶位点进行碱基编辑。
10.根据权利要求9所述的方法,其中,所述引入的方式包括:
(1)使用权利要求6所述的核酸转化真核细胞,获得转基因细胞;
(2)培养所述转基因细胞,使所述核酸表达以产生权利要求1-5中任意一项所述的碱基编辑工具。
CN201910760844.9A 2019-08-16 2019-08-16 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法 Active CN110423736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910760844.9A CN110423736B (zh) 2019-08-16 2019-08-16 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910760844.9A CN110423736B (zh) 2019-08-16 2019-08-16 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法

Publications (2)

Publication Number Publication Date
CN110423736A true CN110423736A (zh) 2019-11-08
CN110423736B CN110423736B (zh) 2021-09-17

Family

ID=68415145

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910760844.9A Active CN110423736B (zh) 2019-08-16 2019-08-16 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法

Country Status (1)

Country Link
CN (1) CN110423736B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113564145A (zh) * 2021-06-04 2021-10-29 上海市第一人民医院 用于胞嘧啶碱基编辑的融合蛋白及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108715861A (zh) * 2018-04-26 2018-10-30 上海科技大学 一种碱基编辑工具及其应用
WO2018209712A1 (en) * 2017-05-19 2018-11-22 Tsinghua University Engineering of a minimal sacas9 crispr/cas system for gene editing and transcriptional regulation optimized by enhanced guide rna
CN109136272A (zh) * 2017-06-15 2019-01-04 中山大学 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其在人生殖系中的应用
CN109679989A (zh) * 2018-12-29 2019-04-26 北京市农林科学院 一种提高碱基编辑系统编辑效率的方法
CN110300802A (zh) * 2016-12-23 2019-10-01 基础科学研究院 用于动物胚胎碱基编辑的组合物和碱基编辑方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110300802A (zh) * 2016-12-23 2019-10-01 基础科学研究院 用于动物胚胎碱基编辑的组合物和碱基编辑方法
WO2018209712A1 (en) * 2017-05-19 2018-11-22 Tsinghua University Engineering of a minimal sacas9 crispr/cas system for gene editing and transcriptional regulation optimized by enhanced guide rna
CN109136272A (zh) * 2017-06-15 2019-01-04 中山大学 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其在人生殖系中的应用
CN108715861A (zh) * 2018-04-26 2018-10-30 上海科技大学 一种碱基编辑工具及其应用
CN109679989A (zh) * 2018-12-29 2019-04-26 北京市农林科学院 一种提高碱基编辑系统编辑效率的方法

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
BIN REN ET AL.,: "Improved Base Editor for Efficiently Inducing Genetic Variations in Rice with CRISPR/Cas9-Guided Hyperactive hAID Mutant", 《MOLECULAR PLANT》 *
HOLLY A. REES ET AL.,: "Base editing: precision chemistry on the genome and transcriptome of living cells", 《NATURE REVIEWS》 *
LAVYSH,D. ET AL.,: "uracil-DNA-glycosylase inhibitor [Bacillus phage AR9]", 《GENBANK》 *
LE Q ET AL.,: "single-stranded DNA cytosine deaminase isoform 1 [Homo sapiens]", 《GENBANK》 *
MORITA,S.ET AL.,: "dCas9-5xPlat2AflD-P2A-scFvGCN4sfGFPTET1CD [Cloning vector pPlatTET-gRNA2]", 《GENBANK》 *
MORITA,S.ET AL.,: "scFvGCN4sfGFPTET1CD [Cloning vector pCAG-scFvGCN4sfGFPTET1CD]", 《GENBANK》 *
WEN JIANG ET AL.,: "BE-PLUS: a new base editing tool with broadened editing window and enhanced fidelity", 《CELL RESEARCH》 *
ZHANG,W. ET AL.,: "Cloning vector pGL3-U6-sgRNA-PG, complete sequence", 《GENBANK》 *
李广磊等: "基因编辑技术在人类生殖细胞中的应用研究", 《生命科学》 *
王丽洁等: "碱基编辑技术的发展与应用", 《生命的化学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113564145A (zh) * 2021-06-04 2021-10-29 上海市第一人民医院 用于胞嘧啶碱基编辑的融合蛋白及其应用

Also Published As

Publication number Publication date
CN110423736B (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
CN1304575C (zh) 预防黄病毒感染的核酸疫苗
US20040013648A1 (en) Vector system
TW380162B (en) Process to screen substances with modulating effect on a receptor dependent cellular signal transduction pathway
CN112430582B (zh) 一种慢病毒稳定包装细胞系及其制备方法
KR101201020B1 (ko) 감마-카르복실화된 단백질의 제조 방법
KR20190055086A (ko) 재조합 자기-상보적인 아데노-부속 바이러스를 이용한 병태의 치료 방법 및 조성물
CN113444830A (zh) 用于检测SARS-CoV-2冠状病毒的试剂盒及其专用引物和探针
CN110423736B (zh) 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法
CN114616000A (zh) 载体组合物及其用于治疗溶酶体贮积症的方法
US20040132133A1 (en) Methods and compositions for the production, identification and purification of fusion proteins
CN103773803A (zh) 表达猪o型口蹄疫病毒vp1蛋白的重组牛副流感病毒载体
US6468754B1 (en) Vector and method for targeted replacement and disruption of an integrated DNA sequence
CA2743775A1 (en) .beta.gi-igg intron for enhanced anti-igf1r expression
CN112513072A (zh) 慢病毒载体转化的t-rapa细胞在改善溶酶体贮积症中的应用
CN111518838A (zh) 一种真核细胞单碱基基因编辑的引物、试剂盒及使用方法、用途
CN112105389A (zh) 用于转染抵抗细胞类型的组合物
CN111690687B (zh) 促进骨骼肌发育的方法和应用
EP4323521A1 (en) Casrx/cas13d systems targeting c9orf72
US20040077573A1 (en) Method for regulating the activity of an expression product of a gene transferred into living body
TW202228728A (zh) 用於同時調節基因表現之組合物及方法
CN108753727A (zh) 一种gpcr靶向药物筛选系统及其构建和应用
CN103864902B (zh) 一种双价dna疫苗连接肽及其应用
KR20220139344A (ko) 신경변성 질환을 치료하기 위한 조성물 및 방법
CN114231568B (zh) 一种提高dna修复效率的辅助蛋白及其基因编辑载体和应用
RU2749459C1 (ru) Универсальный интеграционный вектор pVEAL и рекомбинантная плазмида pVEAL-15742, обеспечивающая синтез и секрецию scFv-Fc антител ADI-15742 против вируса Эбола в клетках млекопитающих и полученная с использованием вектора pVEAL

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant