CN110499333A - 用于修复dmd基因突变的核酸序列及系统 - Google Patents

用于修复dmd基因突变的核酸序列及系统 Download PDF

Info

Publication number
CN110499333A
CN110499333A CN201910707013.5A CN201910707013A CN110499333A CN 110499333 A CN110499333 A CN 110499333A CN 201910707013 A CN201910707013 A CN 201910707013A CN 110499333 A CN110499333 A CN 110499333A
Authority
CN
China
Prior art keywords
seq
dna
artificial sequence
grna
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910707013.5A
Other languages
English (en)
Inventor
孔祥东
杨宇霞
陶米林
祝海宝
刘洁
喻小鲁
陈梦麟
达琦
罗思施
陈雪峰
张楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Dehe Biotechnology Co Ltd
Original Assignee
Guangzhou Dehe Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Dehe Biotechnology Co Ltd filed Critical Guangzhou Dehe Biotechnology Co Ltd
Priority to CN201910707013.5A priority Critical patent/CN110499333A/zh
Publication of CN110499333A publication Critical patent/CN110499333A/zh
Priority to CN202010731942.2A priority patent/CN111718964A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/864Parvoviral vectors, e.g. parvovirus, densovirus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明公开了用于修复DMD基因突变的核酸序列及系统,基因编辑系统可敲除X染色体第31792310位至第31854834位,或第31747866位至第31838091位,或第31747866位至第31854834位之间的Dystrophin基因组区域;优选的,所述基因编辑系统可敲除X染色体第31815201位至第31846518位、第31769972位至第31815200位,或第31769972位至第31846518位之间的Dystrophin基因组区域。本发明的基因编辑系统可针对>17%的DMD患者,包括EX51(缺失)4%、EX50(缺失)13%、EX45‑50(缺失)、EX48‑50(缺失)、EX50(缺失)、EX51(缺失)、EX52(缺失)以及EX50或EX51外显子区点突变及其他各种形式的突变,适应性更广。

Description

用于修复DMD基因突变的核酸序列及系统
技术领域
本发明涉及基因治疗领域,特别涉及用于修复DMD基因突变的核酸序列及系统。
背景技术
杜氏肌营养不良综合征(Duchenne muscular dystrophy,DMD),也称假肥大性肌营养不良,是一种X染色体隐性遗传的单基因遗传疾病,由抗肌萎缩蛋白基因(Dystrophin,Dys)突变所致。DMD发病率为1/3500,具有发病年龄小,起病隐袭,病程长,且病死率高的特点。患者因骨骼肌不断退化出现肌肉无力或萎缩,在7岁到12岁时便彻底丧失行走能力,至20岁左右死于呼吸衰竭或心力衰竭。目前该病没有切实有效的治愈方法,临床上以对症治疗及康复治疗为主。因此针对DMD突变基因做基因治疗是目前亟待进一步研究探索的方向。
2014经欧洲药品管理局(EMA)批准PTC Therepeutics公司研发的(Ataluren)上市。DMD患者mRNA发生无意突变产生提前终止密码子,使mRNA翻译提前终止,不能产生完整的蛋白。能使核糖体翻译含有提前终止密码子的mRNA,使含有提前终止密码子的mRNA能表达完整蛋白质。该技术仅适用于存在终止密码子突变且未发生移码的DMD患者,适用性窄;对于移码突变的患者,跳过终止密码子后,氨基酸表达序列并未被修正;且为口服颗粒剂,推荐给药剂量每天3次,需终身服药。
2015年12月,RMGO Pharma公司开发的杜氏肌营养不良治疗药物ARM210/S48168获得美国食品与药品管理局孤儿药地位和罕见儿童疾病资格认定。ARM210靶向兰尼碱受体防止细胞内的钙渗漏,目前ARM210的Ⅰ期临床试验正在欧洲进行。其他一些研究比如成肌细胞移植、促进utrophin表达的SMT C1100、抗myostatin药物BMS-986089、PF-06252616、促结缔组织生长因子FG-3019、抗炎药物Givinostat以及CAT-1004等均处于临床Ⅰ/Ⅱ期研究阶段,这些研究和应用主要着眼点在于减轻其临床症状,缺乏实质性重大突破。
2016年美国FDA批准的Sarepta Therapeutics公司的DMD反义寡核苷酸药物Eteplirsen,通过改变mRNA剪接方式,跳过外显子51表达,从而修复特定的基因突变。产生一种较短、但仍具有功能的抗肌萎缩蛋白,从而稳定或显著减缓疾病的进程,延长并改善DMD患者的生活质量。该技术中,反义寡核苷酸需要反复定期注射以维持Dys基因外显子在翻译过程中产生跳读以修正读码框。且注射反义寡核苷酸后的Dys基因为瞬时表达,目前的临床研究数据表明,该方法治疗效果并不显著。另外,Dys基因是目前已知最大的人类基因,其突变种类和位点非常多,需要针对Dys基因上不同的突变位点来设计反义寡核苷酸,开发一系列的产品,研发成本和难度都较高,不利于罕见病药物的研发和推广。
基因编辑技术是目前全球研究DMD治疗方法的热点,其原理是通过精确识别目的细胞基因组中特定的核苷酸序列,利用核酸内切酶对靶序列进行切割,实现对目的细胞DNA的精准编辑,因此需要针对每位患者不同的突变对其进行个性化治疗,但这让在基因水平精确高效切除肌萎缩蛋白基因突变外显子成为可能。国内外已有多例基因编辑治疗基因病、癌症的例子。其中CRISPR-Cas9技术,被誉为“基因剪刀手”正带来全球科研和医疗领域的重大变革。CRISPR-Cas9的技术发明人张锋,正在密切关注CRISPR在单基因遗传病的临床应用,而DMD的基因疗法正是其中之一。
虽然人们对CRISPR/Cas9技术的研究已经比较深入,但是现有技术中,基于CRISPR/Cas9靶序列设计规则设计出来的gRNA,不能直接应用,并不是所有gRNA都能切割目的DNA序列,更不是所有gRNA都具有高效的切割效率。需要根据实际情况进行相应的设计。同时,CRISPR/Cas9技术的脱靶效应也需要特别关注。
AAV病毒具有不整合入宿主细胞,安全性好等优点;其次它在许多组织(肌肉、肝脏、视网膜、中枢神经等)中能介导外源基因长期表达;AAV具有多种血清型,能提供不同的组织特异性;这些特性使其成为基因治疗中最具吸引力的运载体。目前AAV已被用来参与Cas9介导的mdx小鼠dmd基因的有效编辑。AAV的基因组约4700bp,可装载外源核酸序列最大片段约4500bp。而SpCas9核酸序列全长(含核定位信号)4200bp,加上启动子和polyA后全长超过4500bp,不能进行AAV的有效包装。
在当前形势下,开发出一种覆盖率高(可针对不同DMD突变)的DMD基因修复系统,具有非常重要的意义,也是一项具有挑战性的工作。
发明内容
本发明的目的在于克服现有技术的不足,提供一种覆盖率高(针对不同DMD突变)的DMD基因修复系统。
本发明所采取的技术方案是:
本发明的第一个方面,提供:
一种修复人Dystrophin蛋白表达的基因编辑系统,所述基因编辑系统可敲除X染色体第31792310位至第31854834位,或第31747866位至第31838091位,或第31747866位至第31854834位之间的Dystrophin基因组区域;优选的,所述基因编辑系统可敲除X染色体第31815201位至第31846518位、第31769972位至第31815200位,或第31769972位至第31846518位之间的Dystrophin基因组区域。
在一些基因编辑系统的实例中,所述基因编辑系统为CRISPR/Cas基因编辑系统,所述CRISPR/Cas基因编辑系统为酿脓链球菌(Streptococcus pyogenes)的CRISPR/Sp.Cas9基因编辑系统、金黄色酿脓葡萄球菌(Staphylococcus aureus)的CRISPR/Sa.Cas9基因编辑系统、嗜热链球菌(Streptococcus thermophilus)的CRISPR/St.Cas9基因编辑系统,或脑膜炎双球菌(Neisseria meningitidis)的CRISPR/Nm.Cas9基因编辑系统;进一步的,所述CRISPR/Cas基因编辑系统为金黄色酿脓葡萄球菌(Staphylococcus aureus)的CRISPR/Sa.Cas9基因编辑系统。
在一些基因编辑系统的实例中,所述CRISPR/Cas基因编辑系统的gRNA的核酸序列选自如下序列中的至少一条:
SEQ ID NO:1~SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ IDNO:17、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ IDNO:57、SEQ ID NO:64~SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:74~SEQID NO:77、SEQ ID NO:82~SEQ ID NO:89、SEQ ID NO:91~SEQ ID NO:94、SEQ ID NO:97~SEQ ID NO:100、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:114、SEQ ID NO:115、SEQ IDNO:119、SEQ ID NO:121~SEQ ID NO:123、SEQ ID NO:125~SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:140~SEQ ID NO:142、SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152~SEQ ID NO:160、SEQ ID NO:165~SEQ ID NO:168、SEQ ID NO:172、SEQ ID NO:178、SEQ IDNO:179、SEQ ID NO:184~SEQ ID NO:188、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:199、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:206~SEQ ID NO:209、SEQ ID NO:214、SEQ ID NO:219~SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:229~SEQID NO:232、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:241、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249~SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:254;
优选地,所述基因编辑系统中gRNA的核酸序列选自如下序列中的至少一条:SEQID NO:14、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:43、SEQ ID NO:48、SEQID NO:49、SEQ ID NO:57、SEQ ID NO:64~SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:74~SEQ ID NO:77、SEQ ID NO:82~SEQ ID NO:89、SEQ ID NO:91~SEQ IDNO:94、SEQ ID NO:97~SEQ ID NO:100、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:119、SEQ ID NO:121~SEQ ID NO:123、SEQ ID NO:125~SEQID NO:128、SEQ ID NO:130、SEQ ID NO:140~SEQ ID NO:142、SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152~SEQ ID NO:160、SEQ ID NO:165~SEQ ID NO:168、SEQ ID NO:172、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:184~SEQ ID NO:188、SEQ ID NO:195、SEQ IDNO:196、SEQ ID NO:199。
在一些基因编辑系统的实例中,所述CRISPR/Cas基因编辑系统包含第一gRNA和第二gRNA的组合:其中
(1)用于修复Dystrophin基因51号外显子突变或缺失的第一gRNA的核酸序列选自SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:23或SEQ ID NO:24,第二gRNA的核酸序列选自SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:57、SEQ ID NO:64~SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:74~SEQ ID NO:77、SEQ ID NO:82~SEQ IDNO:89、SEQ ID NO:91~SEQ ID NO:94、SEQ ID NO:97~SEQ ID NO:100、SEQ ID NO:105、SEQ ID NO:107;
(2)用于修复Dystrophin基因50号外显子突变或缺失的第一gRNA的核酸序列选自SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:119、SEQ ID NO:121~SEQ ID NO:123、SEQ IDNO:125~SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:140、SEQ ID NO:141或SEQ ID NO:142,第二gRNA的核酸序列选自SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152~SEQ IDNO:160、SEQ ID NO:165~SEQ ID NO:168、SEQ ID NO:172、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:184~SEQ ID NO:188、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:199;
(3)用于修复Dystrophin基因50号外显子或51号外显子突变或缺失的第一gRNA的核酸序列选自SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:23或SEQ ID NO:24,第二gRNA的核酸序列选自SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152~SEQ ID NO:160、SEQ ID NO:165~SEQ ID NO:168、SEQ ID NO:172、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:184~SEQ ID NO:188、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:199;
优选的,所述CRISPR/Cas基因编辑系统包含第一gRNA和第二gRNA的组合:其中
(1)用于修复Dystrophin基因51号外显子突变或缺失的第一gRNA的核酸序列选自SEQ ID NO:23,第二gRNA的核酸序列选自SEQ ID NO:43、SEQ ID NO:105或SEQ ID NO:107;
(2)用于修复Dystrophin基因50号外显子突变或缺失的第一gRNA的核酸序列选自SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:119、SEQ ID NO:121~SEQ ID NO:123、SEQ IDNO:125~SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:140、SEQ ID NO:141或SEQ ID NO:142,第二gRNA的核酸序列选自SEQ ID NO:152、SEQ ID NO:153或SEQ ID NO:167;
(3)用于修复Dystrophin基因50号外显子或51号外显子突变或缺失的第一gRNA的核酸序列选自SEQ ID NO:23,第二gRNA的核酸序列选自SEQ ID NO:152、SEQ ID NO:153或SEQ ID NO:167。
本发明的第二个方面,提供:
一种表达体系,所述表达体系可表达本发明第一个方面所述的基因编辑系统。
在一些表达体系的实例中,所述表达体系的载体为病毒载体;优选的,所述病毒为腺相关病毒AAV或腺病毒Adv或杆状病毒(Baculovirus);进一步的,所述AAV选自AAV2.5、AAV6、AAV8或AAV9。
在一些表达体系的实例中,所述表达体系包括gRNA序列表达系统和Cas9表达系统。
在一些表达体系的实例中,所述表达体系的载体为腺相关病毒AAV,所述Cas9为Sa.Cas9,表达Sa.Cas9的AAV和表达gRNA的AAV两种AAV的两者用量比为3:2~4:1。
在一些表达体系的实例中,所述表达体系还插入有肌肉组织特异性启动子。
在一些表达体系的实例中,所述肌肉组织特异性启动子的核酸序列如SEQ ID NO:433所示。
本发明的有益效果是:
本发明所筛选的gRNA靶序列,其打靶效率更高,脱靶效率低,从而对Dys基因读码框的纠正效率更高。
本发明选取的靶点在基因组中的特定位置,可有效避免切割时大片段缺失导致的二次移码发生,降低了基因编辑导致的风险,提高有效编辑效率。
本发明所采用的肌肉组织特异性启动子可在肌肉细胞中有效启动目的基因的表达,避免了目的基因在其它组织器官中的表达,从而降低了基因编辑过程中非靶组织的编辑风险,以及机体内的细胞和体液免疫反应。
本发明利用优化的AAV/Cas9:AAV/sgRNA比例3:2~4:1,可实现体内最高基因编辑效率。
本发明所采用的Sa.Cas9核酸序列全长(含核定位信号)3258bp,可进行AAV(腺相关病毒)的有效包装,在治疗过程中采用肌肉局部注射更有优势。此外,Dys基因经基因编辑后的细胞在体内可稳定分化和扩增,一次注射,终身有效。且本发明的基因治疗技术可针对>17%的DMD患者,包括EX51(缺失)4%、EX50(缺失)13%、EX45-50(缺失)、EX48-50(缺失)、EX50(缺失)、EX51(缺失)、EX52(缺失)以及EX50或EX51外显子区点突变及其他各种形式的突变,适应性更广。
附图说明
图1是CRISPR/Cas9基因编辑系统通过非同源性末端连接修复断裂DNA的原理示意图;
图2是纠正Dys基因的读码框,使DMD患者向症状较轻的BMD转变的原理示意图;
图3是CRISPR/Sa.Cas9AAV表达体系的结构示意图;
图4是商品化质粒pX601质粒的结构示意图;
图5~33是使用T7E1酶切分析不同gRNA突变效率的凝胶电泳结果;图中泳道编号与SEQ ID NO编号对应,其中,图5~图7为SEQ ID NO:1-SEQ ID NO:24检测结果,图8~图20为SEQ ID NO:25-SEQ ID NO:144检测结果,图21~图33为SEQ ID NO:145-SEQ ID NO:256检测结果;
图34~图42是不同菌落的突变类型分析,图中,第一栏数字代表随机挑选的菌落编号,wild type或w为未经基因编辑处理的原始BCL11A基因序列,*表示gRNA识别靶定基因所必需的PAM区,灰色区域为gRNA识别的靶序列,-表示碱基缺失,□表示插入序列;Δ表示碱基替换突变;
图43是gRNA靶序列组合的设计结果;
图44是Group NO:1PCR检测结果;
图45是Group NO:2~Group NO:7PCR检测结果;
图46是Group NO:8PCR检测结果。
具体实施方式
本发明采用来源于金黄色酿脓葡萄球菌(Staphylococcus aureus)的CRISPR-Sa.Cas9基因编辑系统,设计多对gRNA组合以引导Sa.Cas9在Dys基因突变热点区域50号外显子、51号外显子或50-51号双外显子区的上游和下游分别进行双链切割,引起DNA双链断裂后,在不存在同源模板的情况下通过非同源性末端连接(Non-homologous end joining,NHEJ)修复断裂DNA(如图1)。通常在Cas9剪切位点附近造成小片段碱基的插入或缺失。最终使得50或51号外显子区的上下游之间产生缺失,从而纠正Dys基因的读码框,使DMD患者向症状较轻的BMD转变(如图2)。
本发明针对DMD各种突变,分别设计了三套方案:1)敲除51号外显子的方案,选取50号内含子和51号内含子的gRNA靶序列进行组合,可以治疗包括EX50缺失突变;2)敲除50号外显子的方案,选取49号内含子和50号内含子的gRNA靶序列进行组合,可以治疗包括EX51缺失突变;3)同时敲除50和51号外显子的方案,选取49号内含子和51号内含子的gRNA靶序列进行组合,可以治疗包括EX50、EX51缺失以及EX50或者EX51点突变、重复突变等突变类型。
本发明靶点主要选取在各内含子DNA序列特定区域,例如在EX50外显子上游内含子区的靶点,主要集中在靠近EX50的靶点。本研究发现,这样的靶点位置选择,在基因编辑时,可以有效避免切割时,导致的大片段缺失,(这种大片段缺失容易导致EX49发生突变),避免了基因编辑导致的二次移码,大大提高了有效切割效率,同时降低了二次移码的可能。
研究者发现使用通用型启动子(例如CMV)不能在机体内有效的表达目的基因,原因是CMV表达效率过高,缺乏组织特异性,容易引起机体产生细胞和体液免疫反应,从而沉默掉目的基因的表达。而降低载体的使用量,最直接的后果就是导致目的基因的表达量下降,甚至达不到治疗疾病的效果。本研究使用序列优化过的肌肉组织特异性启动子MCKpromoter表达Sa.Cas9蛋白,可以在肌肉细胞内有效表达目的基因,无需降低载体使用量。避免了Sa.Cas9在其它组织器官中的表达,可降低机体内的细胞和体液免疫反应。AAV血清型靶向感染能力与组织特异性启动子特异表达能力相结合,可以对目的基因进行更精准、更高效的基因编辑改造(如图3)。
CRISPR/Cas9包含cas9蛋白以及sgRNA两个部分,在体外细胞水平,两者的比例一般为1:1,可达到最佳切割效率。但是在动物体内条件下,由于涉及到免疫中和等复杂环境影响,该比率无法套用体外条件,通过本研究发现,当利用AAV为载体,注射病毒比例处于3:2~4:1之间,可以达到较高的切割效率。
本发明的技术方案是一种高覆盖率(>17%DMD突变)、低毒副作用的治疗技术,适用于Dys基因多种突变(适用不少于17%的DMD患者),使严重的DMD转变为非致死性的BMD。
为更好的说明本发明的目的、技术方案和优点,下面将结合具体实施例对本发明作进一步说明。
实施例1 Dys基因49、50、51号内含子gRNA靶序列筛选
1.1gRNA准备
(1)参照Sa.CRISPR/Cas9靶位点设计规则,分别针对Dys基因49、50、51号内含子的序列设计21nt的gRNA靶序列,所述gRNA的靶序列如表1、表2、表3所示;
(2)按照表1分别合成gRNA靶序列的DNA序列正义链和反义链(正义链的5’-端加cacc,若正义链5’-端第一个核苷酸不是鸟嘌呤G,则在正义链的5’-端加caccG;在反义链的5’-端加aaac,若正义链5’-端第一个核苷酸不是鸟嘌呤G,则在反义链的3’-端加C);
(3)将上述gRNA正义链和反义链混合,90℃处理后自然冷却至室温进行退火处理,合成带粘性末端的双链gRNA。
表1针对Dys基因49号内含子所设计的gRNA靶序列的正义链及其检测引物
表2针对Dys基因50号内含子所设计的gRNA靶序列的正义链及其检测引物
表3针对Dys基因51号内含子所设计的Sa-gRNA的DNA序列正义链及其检测引物
1.2载体准备
(1)pX601质粒(商品化载体,如图4)扩增和提取,并测定质粒浓度;
(2)采用限制性内切酶Bsa I对pX601进行酶切,37℃酶切1h后加loading buffer终止反应;
(3)琼脂糖凝胶电泳后切胶回收线性化质粒pX601,并测定回收产物浓度,-20℃保存备用。
1.3连接转化
(1)将切胶回收的线性化pX601载体与退火后的gRNA双链进行连接反应;
(2)连接产物热击法转化大肠杆菌感受态细胞TOP10,转化后向每个离心管加入无菌的LB液体培养基(不含抗生素),混匀后置于恒温摇床37℃,200rpm振荡培养45min使菌体复苏。
(3)将复苏后的TOP10细胞涂布LB固体平板(Amp+),倒置于恒温培养箱37℃静置培养12-16h。
(4)从上述平板上分别挑取单菌落接种到LB液体培养基(Amp+)中扩大培养。
(5)使用引物601SaF-F(5’-TTCCTTgACCCTggAAggTg-3’)(SEQ ID NO:299),对上述菌液分别测序;
(6)将测序正确的菌液提取质粒并测定质粒浓度后至-20℃保存备用。
1.4细胞转染
(1)HEK293T细胞铺板;
(2)采用Lipofectamine 3000试剂盒将1.3(6)中提取的质粒分别转染HEK293T细胞;
(3)转染后的细胞培养48小时,离心收集细胞。
1.5T7E1酶切分析突变效率
(1)将上述1.4(3)收集的细胞提取细胞基因组,并检测基因组浓度;
(2)分别在gRNA结合位点上下游设计PCR引物,如表1所示;
(3)分别使用PCR法扩增带有靶位点的目的片段;
(4)纯化回收PCR产物,并测定产物浓度;
(5)将上述纯化的PCR产物退火处理,即先加热至95℃,保温10min,然后以每30s下降2~3℃的速度降温至室温;
(6)上述每管退火产物分别加入T7核酸内切酶1(T7E1),设置mock组(未转化的细胞)和空白对照组(不加T7E1,用ddH2O代替),37℃酶切1h。
(7)2%琼脂糖凝胶电泳检测酶切效果,以Takara公司的DL 2,000DNAMarker作为参照(电泳条带从上至下依次为2000bp、1000bp、750bp、500bp、250bp、100bp(以下所有电泳图如无特别说明,均为使用TAKARADL2000Marker)。
(8)结果如图5~33所示(图中泳道编号与SEQ ID NO编号对应),图5~图7为SEQID NO:1-SEQ ID NO:24检测结果,图8~图20为SEQ ID NO:25-SEQ ID NO:144检测结果,图21~图33为SEQ ID NO:145-SEQ ID NO:256检测结果。根据T7E1检测的原理,酶切条带越亮、酶切效率越高,表示该gRNA的突变效率越高。
在针对49号内含子的gRNA靶序列中,SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:24切割效率较高。
在针对50号内含子的gRNA靶序列中,SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:57、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:75、SEQ IDNO:76、SEQ ID NO:77、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ IDNO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:92、SEQ IDNO:93、SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQID NO:105、SEQ ID NO:107、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQID NO:128、SEQ ID NO:130、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142切割效率较高。
在针对51号内含子的gRNA靶序列中,SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQID NO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQ ID NO:168、SEQ ID NO:172、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:184、SEQID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:199、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:206、SEQ ID NO:207、SEQID NO:208、SEQ ID NO:209、SEQ ID NO:214、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:229、SEQ ID NO:230、SEQID NO:231、SEQ ID NO:232、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:241、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:250、SEQ ID NO:251、SEQ ID NO:253、SEQID NO:254切割效率较高。
由上述结果可见,根据Sa.CRISPR/Cas9靶序列设计规则设计出来的gRNA,不能直接应用,并不是所有gRNA都能切割目的DNA序列,更不是所有gRNA都具有高效的切割效率。通过本实施例的方法,可以有效筛选出效率较高的gRNA靶序列,以便进行进一步的筛选。
实施例2测序分析Dystrophin基因突变效率和突变类型
选取实施例1中突变效率较高的gRNA,进一步分析突变效率和突变类型。以SEQ IDNO:10、SEQ ID NO:23和SEQ ID NO:43;SEQ ID NO:105和SEQ ID NO:107;SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:167和SEQ ID NO:179为例进行以下实验操作。
2.1T载体连接
(1)将实施例1中1.5(4)所得的纯化后的PCR产物,测定浓度备用;
(2)选用康为世纪Master PCR Mix给PCR产物3’-末端加一个腺嘌呤(A):取3.1中的PCR产物2μg按照1:1(V:V)比例与Master PCR Mix混合,72℃反应30min;
(3)用1%琼脂糖凝胶电泳4.2中的反应产物,切胶回收目的片段并测定回收产物浓度;
(4)用TaKaRa pMDTM18-T Vector Cloning Kit进行连接反应:按下表4配制反应体系,16℃反应30min;
表4连接pMDTM18-T载体的反应体系
ddH<sub>2</sub>O 补齐至10μL
pMD18-T Vector(5×) 1μL(10ng)
目的片段 0.1pmol~0.3pmol
Solution I 5μL
(5)上述连接产物热击法转化大肠杆菌感受态细胞TOP10,转化后向每个离心管加入无菌的LB液体培养基(不含抗生素),混匀后置于恒温摇床37℃200rpm振荡培养45min使菌体复苏;
(6)将复苏后的TOP10细胞涂布LB固体平板(Amp+),倒置于恒温培养箱37℃静置培养12-16h。
2.2Sanger测序
(1)随机挑取4.1(6)中平板上长出来的单菌落,进行Sanger测序,确定载体自连的假阳性单菌落个数、阳性单菌落个数、发生突变的菌落个数及突变型,并计算突变效率。
突变效率=发生突变菌落数/阳性单菌落数×100%
结果如下表所示:
图34~图42中,第一栏数字代表随机挑选的菌落编号,wild type或w为未经基因编辑处理的原始BCL11A基因序列,*表示gRNA识别靶定基因所必需的PAM区,灰色区域为gRNA识别的靶序列,-表示碱基缺失,□表示插入序列;Δ表示碱基替换突变。
由图34可见,共有4个单菌落(3、11、12、15号菌)为缺失突变;1个单菌落(7号菌)为7个位点碱基替换突变。整体突变效率为31.25%,突变均发生在靶序列SEQ ID NO:10附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
由图35可见,共有3个单菌落(6、7、13号菌)为缺失突变;1个单菌落(1号菌)为4个位点碱基替换突变。整体突变效率为22.2%,突变均发生在靶序列SEQ ID NO:23附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
由图36可见,共有3个单菌落(6、8、26号菌)为缺失突变;2个单菌落(7、13号菌)同时存在缺失突变和碱基替换突变。整体突变效率为25%,突变均发生在靶序列SEQ ID NO:43附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
由图37可见,共有16个单菌落(2、5、10、12、16、22、23、31、34、36、38、39、43、50、51、53号菌)为缺失突变,其中22、50号菌为大片段缺失;2个单菌落(17、20号菌)同时存在缺失突变和碱基替换突变。整体突变效率为36%,突变均发生在靶序列SEQ ID NO:105附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
由图38可见,共有18个单菌落(1、4、5、11、16、20、21、25、26、28、30、32、35、39、45、49、54、55号菌)为缺失突变,其中26号菌为大片段缺失;2个单菌落(2、24号菌)同时存在缺失突变和碱基替换突变;1个单菌落(43号菌)为8个位点碱基替换突变;1个单菌落(53号菌)同时存在缺失突变和插入突变;2个单菌落(19、31号菌)为插入突变,其中31号菌为长片段插入。整体突变效率为46.2%,突变均发生在靶序列SEQ ID NO:107附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
由图39可见,共有24个单菌落(3、4、5、6、7、8、9、10、14、17、19、20、21、23、25、28、31、38、41、45、46、49、50、52号菌)为缺失突变,其中5、10、28、38号菌为大片段缺失;3个单菌落(32、34、37号菌)同时存在缺失突变和碱基替换突变;2个单菌落(15、44号菌)为插入突变,其中15号菌为长片段插入。整体突变效率为58%,突变均发生在靶序列SEQ ID NO:152附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
由图40可见,共有18个单菌落(5、6、9、11、12、18、19、26、28、29、30、32、37、41、45、49、50、54号菌)为缺失突变,其中32号菌为大片段缺失;2个单菌落(22、53号菌)同时存在缺失突变和碱基替换突变;1个单菌落(24号菌)为2个位点碱基替换突变;1个单菌落(27号菌)同时存在缺失突变和插入突变;5个单菌落(8、38、39、48、52号菌)为插入突变;2个单菌落(2、10号菌)同时存在缺失突变、插入突变和碱基替换突变。整体突变效率为56.86%,突变均发生在靶序列SEQ ID NO:153附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
由图41可见,共有26个单菌落(1、4、7、8、9、12、18、19、20、21、22、23、25、26、30、33、35、40、43、44、45、47、49、50、52、55号菌)为缺失突变,其中22号菌为大片段缺失;1个单菌落(36号菌)同时存在缺失突变和碱基替换突变;1个单菌落(29号菌)为插入突变;1个单菌落(6号菌)同时存在缺失突变、插入突变和碱基替换突变。整体突变效率为56.86%,突变均发生在靶序列SEQ ID NO:167附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
由图42可见,共有11个单菌落(4、6、7、18、24、26、38、40、42、44、47号菌)为缺失突变;1个单菌落(13号菌)为单位点碱基替换突变;1个单菌落(35号菌)同时存在缺失突变和插入突变;2个单菌落(3、48号菌)为插入突变。整体突变效率为30%,突变均发生在靶序列SEQ ID NO:179附近,判断为CRISPR-Cas9系统对Dystrophin基因内含子靶向切割引起。
实施例3 Dys基因49、50、51号内含子gRNA靶序列组合的筛选
3.1 gRNA靶序列组合的设计(图43)
针对50号外显子缺失的DMD突变型,可以采取敲除51号外显子的方案,选取50号内含子和51号内含子的gRNA靶序列进行组合;
针对51号外显子缺失的DMD突变型,可以采取敲除50号外显子的方案,选取49号内含子和50号内含子的gRNA靶序列进行组合;
针对50-51号外显子突变或缺失的DMD突变型,可以采取同时敲除50和51号外显子的方案,选取49号内含子和51号内含子的gRNA靶序列进行组合;
表5 Dys基因外显子50-51上下游Sa-gRNA组合
49号内含子区的gRNA 51号内含子区的gRNA
Group NO:1 SEQ ID NO:23 SEQ ID NO:153
表6 Dys基因51号外显子上下游Sa-gRNA组合
50号内含子区的gRNA 51号内含子区的gRNA
Group NO:2 SEQ ID NO:105 SEQ ID NO:152
Group NO:3 SEQ ID NO:105 SEQ ID NO:153
Group NO:4 SEQ ID NO:107 SEQ ID NO:152
Group NO:5 SEQ ID NO:107 SEQ ID NO:153
Group NO:6 SEQ ID NO:105 SEQ ID NO:167
Group NO:7 SEQ ID NO:107 SEQ ID NO:167
表7 Dys基因50号外显子上下游Sa-gRNA组合
49号内含子区的gRNA 50号内含子区的gRNA
Group NO:8 SEQ ID NO:23 SEQ ID NO:43
3.2细胞转染
(1)HEK293T细胞铺板;
(2)采用Lipofectamine 3000试剂盒将1.3(6)中提取的质粒按照3.1中的组合分别转染HEK293T细胞;
(3)转染后的细胞培养48小时,离心收集细胞。
3.3 PCR检测突变效果及测序分析
(1)将上述3.2(3)收集的细胞提取细胞基因组,并检测基因组浓度;
(2)分别在gRNA结合位点上下游设计PCR引物,如表8所示。
表8 PCR检测分析引物列表
(3)分别使用PCR法扩增带有靶位点的目的片段;
(4)1%琼脂糖凝胶电泳检测打靶敲除效果,以Takara公司的DL 2,000DNAMarker作为参照。
结果如图所示(图中泳道编号与SEQ ID NO编号对应),图44为Group NO:1PCR检测结果;图45为Group NO:2~Group NO:7PCR检测结果;图46为Group NO:8PCR检测结果。
根据非同源末端连接修复原理,基因组断裂后,细胞会倾向于将两个DNA断端彼此连接在一起。按照3.1的组合设计在细胞中共转入1.3(6)中的载体后,两个Sa-gRNA之间的DNA片段被切除,DNA断端彼此连接修复。
通过在Dys基因49号内含子Sa-gRNA 5’端和Dys基因51号内含子Sa-gRNA 3’端设计引物进行PCR,根据PCR产物大小可以判断其发生非同源末端连接。图44中,泳道下方数字表示两个Sa-gRNA之间发生非同源末端连接修复后所得PCR产物大小,箭头指示前述PCR产物的位置,可见PCR产物大小符合预期,两个Sa-gRNA之间发生非同源末端连接。
通过在Dys基因50号内含子Sa-gRNA5’端和Dys基因51号内含子Sa-gRNA 3’端设计引物进行PCR,根据PCR产物大小可以判断是否发生非同源末端连接。图45中,泳道下方数字表示两个Sa-gRNA之间发生非同源末端连接修复后所得PCR产物大小,箭头指示前述PCR产物的位置,可见PCR产物大小符合预期,两个Sa-gRNA之间发生非同源末端连接。
通过在Dys基因49号内含子Sa-gRNA 5’端和Dys 50号内含子Sa-gRNA 3’端设计引物进行PCR,根据PCR产物大小可以判断是否发生非同源末端连接。图46中,泳道下方数字表示两个Sa-gRNA之间发生非同源末端连接修复后所得PCR产物大小,箭头指示前述PCR产物的位置,可见PCR产物大小符合预期,两个Sa-gRNA之间发生非同源末端连接。
(5)切胶回收PCR产物箭头所指条带,委外进行Sanger一代测序,并与Dys基因组比对分析。所有PCR产物测序均使用PCR上游引物。结果如下:
Group NO:1(SEQ ID NO:434)496bp处为非同源末端连接位点。
Dys基因外显子50-51上下游Sa-gRNA组合Sanger一代测序结果
Group NO:1(SEQ ID NO:434):TTTTTTTGCCCCAGTGAAGTGGAACCAGCTCAGGACGGCCTACTGTTATATTGCCAGGCATTTTTTGAGCCACTTGATGTTATCTTCTTGGTAATTTAAATTTAACCGTGGTAGGAATATTTACACCACAGAAATTGGCAAACACTAAAAACAAGGTGTTTTTAAACACCCTGAGATCAGAGATCCAGTTGATATACATCTACCAGCACACCACTGGCCATATACAGGCTTGCCTTATGCCACGGGGAGCTCTGCAGCTGAAGTAGCCCTTCAAACTTGTCCTGCTTTGAGCCAAATTAGGCCTCTATACTTTCACCTTCATCAGTCACTGAATGAGGGCTGCCTGGGGAAAGGCATGAACTTGGACAAGGCAGCTCTCTGCAGCTCAGGCAGTCCCTGAAGGGACTGACAGTTGAAGAATGTCTACTGACATCATTTCCATCATCTAGAACAAGAGTCTTTCTTTGAAGGGGGCTCTGAGTAGCATATTCCCGTGTGAAAGGATTGTAAACAGGAAAATAAAATCATCACATATAGTTTAGTTGCCTATCAATTAGAGCTCTCTGGATGCAAGCAACAGAAATCATTCTCTGATTAAATCAGGCAGAAAGTAAATGTGCTGTAATTAGCACAAAGGCATTGGAACAAAACTTACAAAAGGAAAAAGAATCTGAGCATGCCTTTCTGGGCATGTGGCTAGCAAGAAGTATTCCAGTCTGTTTGGGAACCC
MCK promoter肌肉组织特异性启动子SEQ ID NO:433
TGCCCATGTAAGGAGGCAAGGCCTGGGGACACCCGAGATGCCTGGTTATAATTAACCCAGACATGTGGCTGCCCCCCCCCCCCCAACACCTGCTGCCTGCTAAAAATAACCCTATGTTCCCGGCGAAGGGCCAGCTGTCCCCCGCCAGCTAGACTCAGCACTTAGTTTAGGAACCAGTGAGCAAGTCAGCCCTTGGGGCAGCCCATACAAGGCCATGGGGCTGGGCAAGCTGCACGCCTGGGTCCGGGGTGGGCACGGTGCCCGGGCAACGAGCTGAAAGCTCATCTGCTCTCAGGGGCCCCTCCCTGGGGACAGCCCCTCCTGGCTAGTCACACCCTGTAGGCTCCTCTATATAACCCAGGGGCACAGGGGCTGCCCCCTCATTCTGGTCACcaccacctccacagcacagacagacactcaggagccagccagc
SEQUENCE LISTING
<110> 广州德赫生物科技有限公司
<120> 用于修复DMD基因突变的核酸序列及系统
<130>
<160> 434
<170> PatentIn version 3.5
<210> 1
<211> 21
<212> DNA
<213> 人工序列
<400> 1
tggcagcaca ccaggacaga a 21
<210> 2
<211> 21
<212> DNA
<213> 人工序列
<400> 2
gatctccaag tggcccagta g 21
<210> 3
<211> 21
<212> DNA
<213> 人工序列
<400> 3
gggccacttg gagatcagaa c 21
<210> 4
<211> 21
<212> DNA
<213> 人工序列
<400> 4
tgcctcggcc tcgcaaagtg c 21
<210> 5
<211> 21
<212> DNA
<213> 人工序列
<400> 5
cactttgcga ggccgaggca g 21
<210> 6
<211> 21
<212> DNA
<213> 人工序列
<400> 6
ggtccacagc aaaagttgtg c 21
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<400> 7
ggacagacag gctgtctgat g 21
<210> 8
<211> 21
<212> DNA
<213> 人工序列
<400> 8
ctcctacgct cacctcccaa g 21
<210> 9
<211> 21
<212> DNA
<213> 人工序列
<400> 9
agggagagag ggagagaggg a 21
<210> 10
<211> 21
<212> DNA
<213> 人工序列
<400> 10
gctaggccat gatggtccca g 21
<210> 11
<211> 21
<212> DNA
<213> 人工序列
<400> 11
ggggagcttg ggagtgaggt a 21
<210> 12
<211> 21
<212> DNA
<213> 人工序列
<400> 12
ctcactccca agctccccac t 21
<210> 13
<211> 21
<212> DNA
<213> 人工序列
<400> 13
gggactctaa gtggggagct t 21
<210> 14
<211> 21
<212> DNA
<213> 人工序列
<400> 14
accgcgccca gccaaagcgt t 21
<210> 15
<211> 21
<212> DNA
<213> 人工序列
<400> 15
agccactgcg cccggccatg g 21
<210> 16
<211> 21
<212> DNA
<213> 人工序列
<400> 16
catgagccac tgcgcccggc c 21
<210> 17
<211> 21
<212> DNA
<213> 人工序列
<400> 17
tacaggctcg caccaccaca c 21
<210> 18
<211> 21
<212> DNA
<213> 人工序列
<400> 18
gctaccggga ggctgaggca g 21
<210> 19
<211> 21
<212> DNA
<213> 人工序列
<400> 19
catcccagcc tcccaaagcg c 21
<210> 20
<211> 21
<212> DNA
<213> 人工序列
<400> 20
aggctgggat gggcagatca c 21
<210> 21
<211> 21
<212> DNA
<213> 人工序列
<400> 21
actgctctcc cgcctgggtg a 21
<210> 22
<211> 21
<212> DNA
<213> 人工序列
<400> 22
ctgcatggta gccccggagt t 21
<210> 23
<211> 21
<212> DNA
<213> 人工序列
<400> 23
gggaggggct gcagtggaca c 21
<210> 24
<211> 21
<212> DNA
<213> 人工序列
<400> 24
actgggggtg agccagtaca t 21
<210> 25
<211> 21
<212> DNA
<213> 人工序列
<400> 25
agagcacaag ggagattgtg g 21
<210> 26
<211> 21
<212> DNA
<213> 人工序列
<400> 26
ggctggctgt gcagagctgt c 21
<210> 27
<211> 21
<212> DNA
<213> 人工序列
<400> 27
tggccaatgg ctggctggat c 21
<210> 28
<211> 21
<212> DNA
<213> 人工序列
<400> 28
cagcccctgg ccaatggctg g 21
<210> 29
<211> 21
<212> DNA
<213> 人工序列
<400> 29
gccaggggct ggctgctgcc t 21
<210> 30
<211> 21
<212> DNA
<213> 人工序列
<400> 30
gaccacaagc tgacttgggg g 21
<210> 31
<211> 21
<212> DNA
<213> 人工序列
<400> 31
cagtgcatct catgtgccct c 21
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<400> 32
ctgggattac tcggcagtca t 21
<210> 33
<211> 21
<212> DNA
<213> 人工序列
<400> 33
actggtgctg cgagtacagc a 21
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<400> 34
gaggccccta tcctagaccc a 21
<210> 35
<211> 21
<212> DNA
<213> 人工序列
<400> 35
cagtgtgcac aggattcacc t 21
<210> 36
<211> 21
<212> DNA
<213> 人工序列
<400> 36
gtggaggaca taggagaaga c 21
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<400> 37
ctccacattg ctgccagtat g 21
<210> 38
<211> 21
<212> DNA
<213> 人工序列
<400> 38
tgctgccagt atggagagtc t 21
<210> 39
<211> 21
<212> DNA
<213> 人工序列
<400> 39
cttcctgcaa gtcaggaagt c 21
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<400> 40
atcttgctct gttgcccagg c 21
<210> 41
<211> 21
<212> DNA
<213> 人工序列
<400> 41
cactttgaga ggctgaggca g 21
<210> 42
<211> 21
<212> DNA
<213> 人工序列
<400> 42
tgcctcagcc tctcaaagtg c 21
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<400> 43
cctctcttgg aaaactgccc t 21
<210> 44
<211> 21
<212> DNA
<213> 人工序列
<400> 44
gctcacagca acctctgcct c 21
<210> 45
<211> 21
<212> DNA
<213> 人工序列
<400> 45
cggttctcct gcctcagcct c 21
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<400> 46
cactatggga ggctgaggca g 21
<210> 47
<211> 21
<212> DNA
<213> 人工序列
<400> 47
tgcctcagcc tcccatagtg c 21
<210> 48
<211> 21
<212> DNA
<213> 人工序列
<400> 48
tactccccat ctccccaccc c 21
<210> 49
<211> 21
<212> DNA
<213> 人工序列
<400> 49
catcctcggg gtggggagat g 21
<210> 50
<211> 21
<212> DNA
<213> 人工序列
<400> 50
ctgcagagct gttcagtgtt c 21
<210> 51
<211> 21
<212> DNA
<213> 人工序列
<400> 51
cccagcagct tgtggataag a 21
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<400> 52
tgttctcagg cccagcagct t 21
<210> 53
<211> 21
<212> DNA
<213> 人工序列
<400> 53
ctacggggga ggctgaggca g 21
<210> 54
<211> 21
<212> DNA
<213> 人工序列
<400> 54
cactttggaa ggccgaggcg g 21
<210> 55
<211> 21
<212> DNA
<213> 人工序列
<400> 55
cgcctcggcc ttccaaagtg c 21
<210> 56
<211> 21
<212> DNA
<213> 人工序列
<400> 56
cgtgagccac cgcgcccggc c 21
<210> 57
<211> 21
<212> DNA
<213> 人工序列
<400> 57
agtgggctac ccatttcccc t 21
<210> 58
<211> 21
<212> DNA
<213> 人工序列
<400> 58
aaggctgagt gctaagggga a 21
<210> 59
<211> 21
<212> DNA
<213> 人工序列
<400> 59
agctggggag gagattatct c 21
<210> 60
<211> 21
<212> DNA
<213> 人工序列
<400> 60
cctctccagc catgtggaac t 21
<210> 61
<211> 21
<212> DNA
<213> 人工序列
<400> 61
gagggaccat gtgggaggta a 21
<210> 62
<211> 21
<212> DNA
<213> 人工序列
<400> 62
atggtccctc ccacaacacg t 21
<210> 63
<211> 21
<212> DNA
<213> 人工序列
<400> 63
cccacaacac gtggggatta t 21
<210> 64
<211> 21
<212> DNA
<213> 人工序列
<400> 64
atatcccacc ttcttctccc c 21
<210> 65
<211> 21
<212> DNA
<213> 人工序列
<400> 65
ctacccaagg ggagaagaag g 21
<210> 66
<211> 21
<212> DNA
<213> 人工序列
<400> 66
tcaaactcag gagatgtggg g 21
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<400> 67
ctcagaagta gaccctgaga c 21
<210> 68
<211> 21
<212> DNA
<213> 人工序列
<400> 68
atcacacact ggggcctgct g 21
<210> 69
<211> 21
<212> DNA
<213> 人工序列
<400> 69
aggccttgca gtatcttggg a 21
<210> 70
<211> 21
<212> DNA
<213> 人工序列
<400> 70
ctccaaggcc ttgcagtatc t 21
<210> 71
<211> 21
<212> DNA
<213> 人工序列
<400> 71
caaagtgctt gccagcccat g 21
<210> 72
<211> 21
<212> DNA
<213> 人工序列
<400> 72
gagaccttag agaccctcca g 21
<210> 73
<211> 21
<212> DNA
<213> 人工序列
<400> 73
gggcacagca tggccttgaa c 21
<210> 74
<211> 21
<212> DNA
<213> 人工序列
<400> 74
agcgtcccct tcggccgtca a 21
<210> 75
<211> 21
<212> DNA
<213> 人工序列
<400> 75
ccccttcggc cgtcaaaagg g 21
<210> 76
<211> 21
<212> DNA
<213> 人工序列
<400> 76
aaacccagtg tgagcaaggc c 21
<210> 77
<211> 21
<212> DNA
<213> 人工序列
<400> 77
gcatccatgg ccttgctcac a 21
<210> 78
<211> 21
<212> DNA
<213> 人工序列
<400> 78
cacctcggcc ccccaaagtg t 21
<210> 79
<211> 21
<212> DNA
<213> 人工序列
<400> 79
ccaacacttt ggggggccga g 21
<210> 80
<211> 21
<212> DNA
<213> 人工序列
<400> 80
gtgggtggat cacctgaggt c 21
<210> 81
<211> 21
<212> DNA
<213> 人工序列
<400> 81
gctcaccgca acctccacct c 21
<210> 82
<211> 21
<212> DNA
<213> 人工序列
<400> 82
cgattgtgct gtggggaaca c 21
<210> 83
<211> 21
<212> DNA
<213> 人工序列
<400> 83
gtgctgtggg gaacacaagg g 21
<210> 84
<211> 21
<212> DNA
<213> 人工序列
<400> 84
gtaacagatt cccctggtgc c 21
<210> 85
<211> 21
<212> DNA
<213> 人工序列
<400> 85
gcgtgtgact ccaggcacca g 21
<210> 86
<211> 21
<212> DNA
<213> 人工序列
<400> 86
agctgcagtg gacagccctg t 21
<210> 87
<211> 21
<212> DNA
<213> 人工序列
<400> 87
aaccaatgga gatgggagcc c 21
<210> 88
<211> 21
<212> DNA
<213> 人工序列
<400> 88
actattcctt ccgggggcaa g 21
<210> 89
<211> 21
<212> DNA
<213> 人工序列
<400> 89
agaattcccc ttgcccccgg a 21
<210> 90
<211> 21
<212> DNA
<213> 人工序列
<400> 90
ggaagctgat ccctaggaag c 21
<210> 91
<211> 21
<212> DNA
<213> 人工序列
<400> 91
aaacagggcc tggatgagga c 21
<210> 92
<211> 21
<212> DNA
<213> 人工序列
<400> 92
tgggtcccct gaaaacaggg c 21
<210> 93
<211> 21
<212> DNA
<213> 人工序列
<400> 93
tgggtcccct gaaaacaggg c 21
<210> 94
<211> 21
<212> DNA
<213> 人工序列
<400> 94
gggaggtaag gagcgtcttt c 21
<210> 95
<211> 21
<212> DNA
<213> 人工序列
<400> 95
tgggtccctc ccacaacaca t 21
<210> 96
<211> 21
<212> DNA
<213> 人工序列
<400> 96
gagggaccca gggggaagta a 21
<210> 97
<211> 21
<212> DNA
<213> 人工序列
<400> 97
cctctgaagc catgcggaac t 21
<210> 98
<211> 21
<212> DNA
<213> 人工序列
<400> 98
agatttggga ggggccagga g 21
<210> 99
<211> 21
<212> DNA
<213> 人工序列
<400> 99
tgggtccctc ccatgacacc t 21
<210> 100
<211> 21
<212> DNA
<213> 人工序列
<400> 100
gagggaccca gtgagaggta a 21
<210> 101
<211> 21
<212> DNA
<213> 人工序列
<400> 101
cacagggtgg caggagggag a 21
<210> 102
<211> 21
<212> DNA
<213> 人工序列
<400> 102
tcttcacagg gtggcaggag g 21
<210> 103
<211> 21
<212> DNA
<213> 人工序列
<400> 103
cctgaggcct ccccagccat g 21
<210> 104
<211> 21
<212> DNA
<213> 人工序列
<400> 104
cctccccagc catgcagaat g 21
<210> 105
<211> 21
<212> DNA
<213> 人工序列
<400> 105
aggaaccctt gagctgggga t 21
<210> 106
<211> 21
<212> DNA
<213> 人工序列
<400> 106
gaagactctg atccccagct c 21
<210> 107
<211> 21
<212> DNA
<213> 人工序列
<400> 107
tgagagggtt gcaagttggg c 21
<210> 108
<211> 21
<212> DNA
<213> 人工序列
<400> 108
agctcccctt tgcccttcac c 21
<210> 109
<211> 21
<212> DNA
<213> 人工序列
<400> 109
aatgcccttc ctgggggcag g 21
<210> 110
<211> 21
<212> DNA
<213> 人工序列
<400> 110
ggtcatgggg gtggatcctt c 21
<210> 111
<211> 21
<212> DNA
<213> 人工序列
<400> 111
gggaagtgtg gggtcatggg g 21
<210> 112
<211> 21
<212> DNA
<213> 人工序列
<400> 112
ggtggggctt aacgggaagt g 21
<210> 113
<211> 21
<212> DNA
<213> 人工序列
<400> 113
gcttggtaca caaggccgtt c 21
<210> 114
<211> 21
<212> DNA
<213> 人工序列
<400> 114
gcccagtgtc accccaatgg a 21
<210> 115
<211> 21
<212> DNA
<213> 人工序列
<400> 115
ttgggcccag tgtcacccca a 21
<210> 116
<211> 21
<212> DNA
<213> 人工序列
<400> 116
aatcatcccg atcacagccc c 21
<210> 117
<211> 21
<212> DNA
<213> 人工序列
<400> 117
gcctcctgcc gctatcagta c 21
<210> 118
<211> 21
<212> DNA
<213> 人工序列
<400> 118
aggatggggt ggggtggggc c 21
<210> 119
<211> 21
<212> DNA
<213> 人工序列
<400> 119
gtcctgtcta ccagctgagt c 21
<210> 120
<211> 21
<212> DNA
<213> 人工序列
<400> 120
taacacaccc tctggggctt c 21
<210> 121
<211> 21
<212> DNA
<213> 人工序列
<400> 121
tctgcgaccc ctgaagcccc a 21
<210> 122
<211> 21
<212> DNA
<213> 人工序列
<400> 122
gcaagcaaac gaggtgggaa c 21
<210> 123
<211> 21
<212> DNA
<213> 人工序列
<400> 123
gcttgcacac tccctccagt g 21
<210> 124
<211> 21
<212> DNA
<213> 人工序列
<400> 124
cccctttgtg gaactcgcaa c 21
<210> 125
<211> 21
<212> DNA
<213> 人工序列
<400> 125
cccctgttgc gagttccaca a 21
<210> 126
<211> 21
<212> DNA
<213> 人工序列
<400> 126
ctgggaaact actgggcagg g 21
<210> 127
<211> 21
<212> DNA
<213> 人工序列
<400> 127
gcacagtcag aactagtgtg c 21
<210> 128
<211> 21
<212> DNA
<213> 人工序列
<400> 128
ctccagcctg ggagacaaag c 21
<210> 129
<211> 21
<212> DNA
<213> 人工序列
<400> 129
ggtggtagaa cacctgaggt c 21
<210> 130
<211> 21
<212> DNA
<213> 人工序列
<400> 130
gtgggtgcat cgactccaga a 21
<210> 131
<211> 21
<212> DNA
<213> 人工序列
<400> 131
aagaccgtgt ggcgattcct c 21
<210> 132
<211> 21
<212> DNA
<213> 人工序列
<400> 132
gggggattgg ggggcagagg g 21
<210> 133
<211> 21
<212> DNA
<213> 人工序列
<400> 133
gggagcaatg ggagctcttc a 21
<210> 134
<211> 21
<212> DNA
<213> 人工序列
<400> 134
gtgagggcct gacacatggt a 21
<210> 135
<211> 21
<212> DNA
<213> 人工序列
<400> 135
ctcgatgaac caagccccaa g 21
<210> 136
<211> 21
<212> DNA
<213> 人工序列
<400> 136
ctaccagctg accacgagtg c 21
<210> 137
<211> 21
<212> DNA
<213> 人工序列
<400> 137
gagtggctgt cctgtgcatt g 21
<210> 138
<211> 21
<212> DNA
<213> 人工序列
<400> 138
atactcagga ggctgaggca g 21
<210> 139
<211> 21
<212> DNA
<213> 人工序列
<400> 139
cgattcccct gcctcagcct c 21
<210> 140
<211> 21
<212> DNA
<213> 人工序列
<400> 140
gctcactgca atctctgcct c 21
<210> 141
<211> 21
<212> DNA
<213> 人工序列
<400> 141
agtgttgctc tgttgccagg c 21
<210> 142
<211> 21
<212> DNA
<213> 人工序列
<400> 142
atgggtgtgg aggagcctgg a 21
<210> 143
<211> 21
<212> DNA
<213> 人工序列
<400> 143
ttatctgccc atgactggcg c 21
<210> 144
<211> 21
<212> DNA
<213> 人工序列
<400> 144
aaggagggag ggagggaggg a 21
<210> 145
<211> 21
<212> DNA
<213> 人工序列
<400> 145
tggctcccaa gctgtgtgac c 21
<210> 146
<211> 21
<212> DNA
<213> 人工序列
<400> 146
gcctcagcct cccaaagcgc t 21
<210> 147
<211> 21
<212> DNA
<213> 人工序列
<400> 147
cgctttggga ggctgaggca g 21
<210> 148
<211> 21
<212> DNA
<213> 人工序列
<400> 148
gcaggtggat cacttgaggt c 21
<210> 149
<211> 21
<212> DNA
<213> 人工序列
<400> 149
aggctgaggc aggagaatca c 21
<210> 150
<211> 21
<212> DNA
<213> 人工序列
<400> 150
agctcaatgg aacctctggt c 21
<210> 151
<211> 21
<212> DNA
<213> 人工序列
<400> 151
gtctcactct gtcactcagt c 21
<210> 152
<211> 21
<212> DNA
<213> 人工序列
<400> 152
agcacagtct gttccctctg c 21
<210> 153
<211> 21
<212> DNA
<213> 人工序列
<400> 153
tacaggcagt ggcaactctg a 21
<210> 154
<211> 21
<212> DNA
<213> 人工序列
<400> 154
gacgcatgtg gctcacaggc c 21
<210> 155
<211> 21
<212> DNA
<213> 人工序列
<400> 155
gcctgtgagc cacatgcgtc c 21
<210> 156
<211> 21
<212> DNA
<213> 人工序列
<400> 156
cacatgcgtc ccaggatggc t 21
<210> 157
<211> 21
<212> DNA
<213> 人工序列
<400> 157
ttccctgggc cacactggaa g 21
<210> 158
<211> 21
<212> DNA
<213> 人工序列
<400> 158
tggcccaggg aagccaaaag a 21
<210> 159
<211> 21
<212> DNA
<213> 人工序列
<400> 159
acccagaccc ccagacctct t 21
<210> 160
<211> 21
<212> DNA
<213> 人工序列
<400> 160
attcccaaga ggtctggggg t 21
<210> 161
<211> 21
<212> DNA
<213> 人工序列
<400> 161
cgtgagctac catgcccggc c 21
<210> 162
<211> 21
<212> DNA
<213> 人工序列
<400> 162
gcgggtgtat cacctgaggt c 21
<210> 163
<211> 21
<212> DNA
<213> 人工序列
<400> 163
ctactcctga ggctgaggca g 21
<210> 164
<211> 21
<212> DNA
<213> 人工序列
<400> 164
gctcactgca acatctgcct c 21
<210> 165
<211> 21
<212> DNA
<213> 人工序列
<400> 165
gctcttgaac ttctggcctc a 21
<210> 166
<211> 21
<212> DNA
<213> 人工序列
<400> 166
agatcatgtc acctcagcct c 21
<210> 167
<211> 21
<212> DNA
<213> 人工序列
<400> 167
gtgacatgat ctcttgggcc c 21
<210> 168
<211> 21
<212> DNA
<213> 人工序列
<400> 168
cagtgagcta tgatagcgcc a 21
<210> 169
<211> 21
<212> DNA
<213> 人工序列
<400> 169
gtctcgcact gttgcccggg c 21
<210> 170
<211> 21
<212> DNA
<213> 人工序列
<400> 170
cgattctcct gcttcagcct c 21
<210> 171
<211> 21
<212> DNA
<213> 人工序列
<400> 171
ctactcagga ggctgaagca g 21
<210> 172
<211> 21
<212> DNA
<213> 人工序列
<400> 172
atggagtctc tgtcgccagg c 21
<210> 173
<211> 21
<212> DNA
<213> 人工序列
<400> 173
accagggagt cagaggttgc a 21
<210> 174
<211> 21
<212> DNA
<213> 人工序列
<400> 174
aacctctgac tccctggttc a 21
<210> 175
<211> 21
<212> DNA
<213> 人工序列
<400> 175
gcaggagaat cccttgaacc a 21
<210> 176
<211> 21
<212> DNA
<213> 人工序列
<400> 176
ggattctcct gcctcagcct c 21
<210> 177
<211> 21
<212> DNA
<213> 人工序列
<400> 177
tgcctcagcc tcccaaagtg g 21
<210> 178
<211> 21
<212> DNA
<213> 人工序列
<400> 178
tacagacata gtgcctggag g 21
<210> 179
<211> 21
<212> DNA
<213> 人工序列
<400> 179
acaaacagga gctgacacag c 21
<210> 180
<211> 21
<212> DNA
<213> 人工序列
<400> 180
gggccatggg gtggtgctgc t 21
<210> 181
<211> 21
<212> DNA
<213> 人工序列
<400> 181
cgcctcatcc tcccaaagtg c 21
<210> 182
<211> 21
<212> DNA
<213> 人工序列
<400> 182
cactttggga ggatgaggcg g 21
<210> 183
<211> 21
<212> DNA
<213> 人工序列
<400> 183
acgtggtttc accgtgttag c 21
<210> 184
<211> 21
<212> DNA
<213> 人工序列
<400> 184
agggcctcag ctgaccgttc a 21
<210> 185
<211> 21
<212> DNA
<213> 人工序列
<400> 185
ccgttcaggg agttcttaag c 21
<210> 186
<211> 21
<212> DNA
<213> 人工序列
<400> 186
aaccccgtgt caagtcatgc a 21
<210> 187
<211> 21
<212> DNA
<213> 人工序列
<400> 187
ccataagggg gctgctatgg t 21
<210> 188
<211> 21
<212> DNA
<213> 人工序列
<400> 188
tgcgggctct gccttcagaa a 21
<210> 189
<211> 21
<212> DNA
<213> 人工序列
<400> 189
ggagtgggcc ctcaccagac a 21
<210> 190
<211> 21
<212> DNA
<213> 人工序列
<400> 190
ggacttagtt ccccagctgc t 21
<210> 191
<211> 21
<212> DNA
<213> 人工序列
<400> 191
cagaaaggcc agtctcctgg g 21
<210> 192
<211> 21
<212> DNA
<213> 人工序列
<400> 192
agtcaggaat tcacgtgggg a 21
<210> 193
<211> 21
<212> DNA
<213> 人工序列
<400> 193
acaaccaggc agcacaaact c 21
<210> 194
<211> 21
<212> DNA
<213> 人工序列
<400> 194
cactgccgag cgtacgtgtg t 21
<210> 195
<211> 21
<212> DNA
<213> 人工序列
<400> 195
tggcaaattc agcccaggga t 21
<210> 196
<211> 21
<212> DNA
<213> 人工序列
<400> 196
agtgggtggc aaattcagcc c 21
<210> 197
<211> 21
<212> DNA
<213> 人工序列
<400> 197
tatggacatc tttggcgggg g 21
<210> 198
<211> 21
<212> DNA
<213> 人工序列
<400> 198
cagtgcgccc aatgtaatca c 21
<210> 199
<211> 21
<212> DNA
<213> 人工序列
<400> 199
ttccctctaa gggatgtagg g 21
<210> 200
<211> 21
<212> DNA
<213> 人工序列
<400> 200
tcctccccta catcccttag a 21
<210> 201
<211> 21
<212> DNA
<213> 人工序列
<400> 201
gcagagcttg cattccctct a 21
<210> 202
<211> 21
<212> DNA
<213> 人工序列
<400> 202
caggactgca aggaagtgtt g 21
<210> 203
<211> 21
<212> DNA
<213> 人工序列
<400> 203
catgtggaca gggctagact t 21
<210> 204
<211> 21
<212> DNA
<213> 人工序列
<400> 204
cattccgtgc tcatgggtag g 21
<210> 205
<211> 21
<212> DNA
<213> 人工序列
<400> 205
ccccaaagac agccagccag t 21
<210> 206
<211> 21
<212> DNA
<213> 人工序列
<400> 206
atggtactgc agcctttctg c 21
<210> 207
<211> 21
<212> DNA
<213> 人工序列
<400> 207
agcagaagag ggttaggggg c 21
<210> 208
<211> 21
<212> DNA
<213> 人工序列
<400> 208
gttgagaagg gaagctgggg c 21
<210> 209
<211> 21
<212> DNA
<213> 人工序列
<400> 209
tgccttggcc tcccaaagtg t 21
<210> 210
<211> 21
<212> DNA
<213> 人工序列
<400> 210
ctgcatggga ggctgacaca g 21
<210> 211
<211> 21
<212> DNA
<213> 人工序列
<400> 211
ttcactccag tgccctccag c 21
<210> 212
<211> 21
<212> DNA
<213> 人工序列
<400> 212
gtcattctgg ctggagggca c 21
<210> 213
<211> 21
<212> DNA
<213> 人工序列
<400> 213
agagtgggga gggagggaaa c 21
<210> 214
<211> 21
<212> DNA
<213> 人工序列
<400> 214
ctctggacat cagacttggg a 21
<210> 215
<211> 21
<212> DNA
<213> 人工序列
<400> 215
tggctggtta gccatatgca g 21
<210> 216
<211> 21
<212> DNA
<213> 人工序列
<400> 216
gatgagggaa tggctgatca g 21
<210> 217
<211> 21
<212> DNA
<213> 人工序列
<400> 217
cctcacctct ctcggcattc a 21
<210> 218
<211> 21
<212> DNA
<213> 人工序列
<400> 218
ctagcataac ctgaagggcc c 21
<210> 219
<211> 21
<212> DNA
<213> 人工序列
<400> 219
cctggtcacc caagagccct g 21
<210> 220
<211> 21
<212> DNA
<213> 人工序列
<400> 220
tggacatatt cctcagggct c 21
<210> 221
<211> 21
<212> DNA
<213> 人工序列
<400> 221
gtggtgagtc cactgatgga t 21
<210> 222
<211> 21
<212> DNA
<213> 人工序列
<400> 222
tttgacctcc tcccctcaat c 21
<210> 223
<211> 21
<212> DNA
<213> 人工序列
<400> 223
agggtggcgg ttgctgaagg t 21
<210> 224
<211> 21
<212> DNA
<213> 人工序列
<400> 224
ggtacaggct cttgcctcag t 21
<210> 225
<211> 21
<212> DNA
<213> 人工序列
<400> 225
tgggggctta aaacctggat g 21
<210> 226
<211> 21
<212> DNA
<213> 人工序列
<400> 226
atcacacacc ggggcctgtc a 21
<210> 227
<211> 21
<212> DNA
<213> 人工序列
<400> 227
tgggaagggt cgtggggagg t 21
<210> 228
<211> 21
<212> DNA
<213> 人工序列
<400> 228
ggatggttac ctgaggatgg g 21
<210> 229
<211> 21
<212> DNA
<213> 人工序列
<400> 229
tcaaatgggc tggttagagc c 21
<210> 230
<211> 21
<212> DNA
<213> 人工序列
<400> 230
ctgccatatt ggtcaacctc c 21
<210> 231
<211> 21
<212> DNA
<213> 人工序列
<400> 231
ttgggaggca tcagcagatc a 21
<210> 232
<211> 21
<212> DNA
<213> 人工序列
<400> 232
ggatgagagg agagtgagtc g 21
<210> 233
<211> 21
<212> DNA
<213> 人工序列
<400> 233
ctcttgacag gagctggggc t 21
<210> 234
<211> 21
<212> DNA
<213> 人工序列
<400> 234
caaggcctga aaggctaagg g 21
<210> 235
<211> 21
<212> DNA
<213> 人工序列
<400> 235
ggaaagcctc ctcatcccac t 21
<210> 236
<211> 21
<212> DNA
<213> 人工序列
<400> 236
ggcacttctc actcagagag g 21
<210> 237
<211> 21
<212> DNA
<213> 人工序列
<400> 237
cctctctctt ccttgcagag t 21
<210> 238
<211> 21
<212> DNA
<213> 人工序列
<400> 238
tctctccctc tctcttcctt g 21
<210> 239
<211> 21
<212> DNA
<213> 人工序列
<400> 239
tccttccact agaccgcaca c 21
<210> 240
<211> 21
<212> DNA
<213> 人工序列
<400> 240
cacccaatga ttgggtgtgg t 21
<210> 241
<211> 21
<212> DNA
<213> 人工序列
<400> 241
tggctttggt gcagtgcaat c 21
<210> 242
<211> 21
<212> DNA
<213> 人工序列
<400> 242
acagcccctg cacctagctc a 21
<210> 243
<211> 21
<212> DNA
<213> 人工序列
<400> 243
gaatccgggc aagggttacc t 21
<210> 244
<211> 21
<212> DNA
<213> 人工序列
<400> 244
gaactcccag gtaacccttg c 21
<210> 245
<211> 21
<212> DNA
<213> 人工序列
<400> 245
ccactctatt tggagaggca g 21
<210> 246
<211> 21
<212> DNA
<213> 人工序列
<400> 246
gcattcggct gcctctccaa a 21
<210> 247
<211> 21
<212> DNA
<213> 人工序列
<400> 247
tttggagagg cagccgaatg c 21
<210> 248
<211> 21
<212> DNA
<213> 人工序列
<400> 248
tctcactaag tccccccaga g 21
<210> 249
<211> 21
<212> DNA
<213> 人工序列
<400> 249
cctccatctt tgctcagcta g 21
<210> 250
<211> 21
<212> DNA
<213> 人工序列
<400> 250
gctcagctag tggaatccat g 21
<210> 251
<211> 21
<212> DNA
<213> 人工序列
<400> 251
tagcagattg ggggcagaga a 21
<210> 252
<211> 21
<212> DNA
<213> 人工序列
<400> 252
tctcatctgt gggtggctcg a 21
<210> 253
<211> 21
<212> DNA
<213> 人工序列
<400> 253
cactgccaca tgcatagtcc c 21
<210> 254
<211> 21
<212> DNA
<213> 人工序列
<400> 254
gcttcccatg tcacagatga c 21
<210> 255
<211> 21
<212> DNA
<213> 人工序列
<400> 255
tctcctaagc tgcctgtccg t 21
<210> 256
<211> 21
<212> DNA
<213> 人工序列
<400> 256
atggagacat tccggagtac c 21
<210> 257
<211> 19
<212> DNA
<213> 人工序列
<400> 257
tgtgccctta tgtaccagg 19
<210> 258
<211> 19
<212> DNA
<213> 人工序列
<400> 258
aaggtttatc ccaggccag 19
<210> 259
<211> 20
<212> DNA
<213> 人工序列
<400> 259
cattgtagca agccatgcag 20
<210> 260
<211> 20
<212> DNA
<213> 人工序列
<400> 260
aaagttgtgc gtgagtcaac 20
<210> 261
<211> 20
<212> DNA
<213> 人工序列
<400> 261
cacccacaca ctcaactact 20
<210> 262
<211> 20
<212> DNA
<213> 人工序列
<400> 262
agagcaatgg agtgtccttc 20
<210> 263
<211> 20
<212> DNA
<213> 人工序列
<400> 263
tgtgtccacc gcttacaaac 20
<210> 264
<211> 20
<212> DNA
<213> 人工序列
<400> 264
ggtgctattg aggacctagt 20
<210> 265
<211> 21
<212> DNA
<213> 人工序列
<400> 265
agagctcatc accttgctaa g 21
<210> 266
<211> 20
<212> DNA
<213> 人工序列
<400> 266
gagttcgaga ccagcttgac 20
<210> 267
<211> 20
<212> DNA
<213> 人工序列
<400> 267
gcagccacaa ttgtagctac 20
<210> 268
<211> 21
<212> DNA
<213> 人工序列
<400> 268
cacagctgaa ttctaccaga c 21
<210> 269
<211> 20
<212> DNA
<213> 人工序列
<400> 269
tcaaccttgc tgctcgttac 20
<210> 270
<211> 22
<212> DNA
<213> 人工序列
<400> 270
gctaagagga aagttcatag tg 22
<210> 271
<211> 19
<212> DNA
<213> 人工序列
<400> 271
cttccaaggg tggttttcc 19
<210> 272
<211> 19
<212> DNA
<213> 人工序列
<400> 272
tgcattgtgg ggaattgag 19
<210> 273
<211> 19
<212> DNA
<213> 人工序列
<400> 273
cagtcagcag ccacatctg 19
<210> 274
<211> 18
<212> DNA
<213> 人工序列
<400> 274
gactatgtgc ccttcgca 18
<210> 275
<211> 20
<212> DNA
<213> 人工序列
<400> 275
cacagagtag cacctgaaca 20
<210> 276
<211> 20
<212> DNA
<213> 人工序列
<400> 276
gtttgtcagt ttggggctga 20
<210> 277
<211> 18
<212> DNA
<213> 人工序列
<400> 277
tgcccagtga agtggaac 18
<210> 278
<211> 19
<212> DNA
<213> 人工序列
<400> 278
gtttaccgcc ttccactca 19
<210> 279
<211> 19
<212> DNA
<213> 人工序列
<400> 279
ctgaccacta ttggagcct 19
<210> 280
<211> 21
<212> DNA
<213> 人工序列
<400> 280
tctttcccct gagagtcaaa g 21
<210> 281
<211> 20
<212> DNA
<213> 人工序列
<400> 281
ctactagcac ctctccctgt 20
<210> 282
<211> 19
<212> DNA
<213> 人工序列
<400> 282
agtctgaggc tgaacctac 19
<210> 283
<211> 20
<212> DNA
<213> 人工序列
<400> 283
agccacgtta cacatggtag 20
<210> 284
<211> 19
<212> DNA
<213> 人工序列
<400> 284
ccagctatca ccaaacagc 19
<210> 285
<211> 20
<212> DNA
<213> 人工序列
<400> 285
tgtttggtga tagctggcag 20
<210> 286
<211> 20
<212> DNA
<213> 人工序列
<400> 286
gatagtgtaa agcacagcca 20
<210> 287
<211> 21
<212> DNA
<213> 人工序列
<400> 287
gtggctgtgc tttacactat c 21
<210> 288
<211> 20
<212> DNA
<213> 人工序列
<400> 288
cagccacaag gtagtttggt 20
<210> 289
<211> 19
<212> DNA
<213> 人工序列
<400> 289
tgactggcct gtttctgtg 19
<210> 290
<211> 20
<212> DNA
<213> 人工序列
<400> 290
tgatctccag tttccctcct 20
<210> 291
<211> 20
<212> DNA
<213> 人工序列
<400> 291
aggagggaaa ctggagatca 20
<210> 292
<211> 21
<212> DNA
<213> 人工序列
<400> 292
accagatttg ctggctcttt g 21
<210> 293
<211> 21
<212> DNA
<213> 人工序列
<400> 293
aggtagacag gactttgcat g 21
<210> 294
<211> 19
<212> DNA
<213> 人工序列
<400> 294
aggaaggctg agtgctaag 19
<210> 295
<211> 21
<212> DNA
<213> 人工序列
<400> 295
agtttggaga gagcaagtct c 21
<210> 296
<211> 19
<212> DNA
<213> 人工序列
<400> 296
actgcccaat tcactggag 19
<210> 297
<211> 20
<212> DNA
<213> 人工序列
<400> 297
tgggggataa aggtgttggt 20
<210> 298
<211> 21
<212> DNA
<213> 人工序列
<400> 298
tgaataccca ctctgtcact g 21
<210> 299
<211> 20
<212> DNA
<213> 人工序列
<400> 299
gtgcaccatg tatcaagcag 20
<210> 300
<211> 19
<212> DNA
<213> 人工序列
<400> 300
ccacaacagg aaagggtgt 19
<210> 301
<211> 20
<212> DNA
<213> 人工序列
<400> 301
tcttgggtcc tgatccttct 20
<210> 302
<211> 19
<212> DNA
<213> 人工序列
<400> 302
gttcagaccc caaagcaca 19
<210> 303
<211> 20
<212> DNA
<213> 人工序列
<400> 303
ccatgactct gtcacatcat 20
<210> 304
<211> 23
<212> DNA
<213> 人工序列
<400> 304
ccagaagtag gaattgaaag tag 23
<210> 305
<211> 22
<212> DNA
<213> 人工序列
<400> 305
catacagctt gaggaatctc tg 22
<210> 306
<211> 22
<212> DNA
<213> 人工序列
<400> 306
cttcattcat agactgcatg ac 22
<210> 307
<211> 23
<212> DNA
<213> 人工序列
<400> 307
gttcagacct gattctctga aag 23
<210> 308
<211> 23
<212> DNA
<213> 人工序列
<400> 308
tcactctagg gttcactaac tac 23
<210> 309
<211> 21
<212> DNA
<213> 人工序列
<400> 309
actgaggtaa ctgagcatat g 21
<210> 310
<211> 23
<212> DNA
<213> 人工序列
<400> 310
agatgattac atagaacgta cac 23
<210> 311
<211> 20
<212> DNA
<213> 人工序列
<400> 311
tggttacttc cagggagatg 20
<210> 312
<211> 21
<212> DNA
<213> 人工序列
<400> 312
aggtcatgca tttcatagca g 21
<210> 313
<211> 20
<212> DNA
<213> 人工序列
<400> 313
tgatgacaga cagaactctg 20
<210> 314
<211> 21
<212> DNA
<213> 人工序列
<400> 314
cattcactat cacgacaaca g 21
<210> 315
<211> 23
<212> DNA
<213> 人工序列
<400> 315
gtgagcttct tgaggacata ctc 23
<210> 316
<211> 23
<212> DNA
<213> 人工序列
<400> 316
acttcatcgt ccacatcacc atc 23
<210> 317
<211> 20
<212> DNA
<213> 人工序列
<400> 317
tggatgtgag acatgtagtc 20
<210> 318
<211> 21
<212> DNA
<213> 人工序列
<400> 318
tctctgtact gagtcttgct c 21
<210> 319
<211> 22
<212> DNA
<213> 人工序列
<400> 319
gtgggtgatt tcacatgaga tc 22
<210> 320
<211> 21
<212> DNA
<213> 人工序列
<400> 320
tctgggagtc tacttgatct g 21
<210> 321
<211> 21
<212> DNA
<213> 人工序列
<400> 321
cctagtctgc attgctctat g 21
<210> 322
<211> 22
<212> DNA
<213> 人工序列
<400> 322
cattggcata gtttcagtag tc 22
<210> 323
<211> 21
<212> DNA
<213> 人工序列
<400> 323
ctcagctcat cttgtacact g 21
<210> 324
<211> 23
<212> DNA
<213> 人工序列
<400> 324
ctctgaactt ccagttatgt gag 23
<210> 325
<211> 21
<212> DNA
<213> 人工序列
<400> 325
tccagaactg aggatggatt c 21
<210> 326
<211> 20
<212> DNA
<213> 人工序列
<400> 326
tgctgaaaag tggatgtgac 20
<210> 327
<211> 20
<212> DNA
<213> 人工序列
<400> 327
acttccatgc agctattcag 20
<210> 328
<211> 21
<212> DNA
<213> 人工序列
<400> 328
tctgagacta cagcacagtt g 21
<210> 329
<211> 23
<212> DNA
<213> 人工序列
<400> 329
gtccaactgt gctgtagtct cag 23
<210> 330
<211> 23
<212> DNA
<213> 人工序列
<400> 330
gttgtccctc tgaagtcaag ctg 23
<210> 331
<211> 21
<212> DNA
<213> 人工序列
<400> 331
acacaactct cgtactgata g 21
<210> 332
<211> 21
<212> DNA
<213> 人工序列
<400> 332
acctacttag taacgaagca g 21
<210> 333
<211> 20
<212> DNA
<213> 人工序列
<400> 333
tagatgctgg acaagagctc 20
<210> 334
<211> 22
<212> DNA
<213> 人工序列
<400> 334
cttccttaca tgttagaacc ac 22
<210> 335
<211> 21
<212> DNA
<213> 人工序列
<400> 335
tcctgcttcg ttactaagta g 21
<210> 336
<211> 22
<212> DNA
<213> 人工序列
<400> 336
acgatcacaa tcttctgtga ag 22
<210> 337
<211> 21
<212> DNA
<213> 人工序列
<400> 337
tggctagttt gacacaatgt g 21
<210> 338
<211> 20
<212> DNA
<213> 人工序列
<400> 338
tgcagtagca tctacatcac 20
<210> 339
<211> 22
<212> DNA
<213> 人工序列
<400> 339
cagcaactct gatgatacat tg 22
<210> 340
<211> 21
<212> DNA
<213> 人工序列
<400> 340
tctcatctct gacaccgtat c 21
<210> 341
<211> 25
<212> DNA
<213> 人工序列
<400> 341
acgtaaatag accagagata cggtg 25
<210> 342
<211> 24
<212> DNA
<213> 人工序列
<400> 342
tcatagacca ggtgaattgt ggac 24
<210> 343
<211> 21
<212> DNA
<213> 人工序列
<400> 343
tgagatacca tctcacatca g 21
<210> 344
<211> 20
<212> DNA
<213> 人工序列
<400> 344
tgtacaggtt tgctacgtag 20
<210> 345
<211> 20
<212> DNA
<213> 人工序列
<400> 345
cacgtgtata cctacgtagc 20
<210> 346
<211> 20
<212> DNA
<213> 人工序列
<400> 346
tgctagacta agcaatgatg 20
<210> 347
<211> 21
<212> DNA
<213> 人工序列
<400> 347
acattgcact aatggttcct c 21
<210> 348
<211> 21
<212> DNA
<213> 人工序列
<400> 348
gttagagaca agactctgca g 21
<210> 349
<211> 21
<212> DNA
<213> 人工序列
<400> 349
tgtcagctat ctattgctgt g 21
<210> 350
<211> 20
<212> DNA
<213> 人工序列
<400> 350
acaggaactg tcttagtgac 20
<210> 351
<211> 20
<212> DNA
<213> 人工序列
<400> 351
gtcatgtttg ctgatacctc 20
<210> 352
<211> 20
<212> DNA
<213> 人工序列
<400> 352
gtaacaatca agcgcatctg 20
<210> 353
<211> 22
<212> DNA
<213> 人工序列
<400> 353
ccttagaact gtgaacaggt tg 22
<210> 354
<211> 21
<212> DNA
<213> 人工序列
<400> 354
catcgacctc tcacattaga g 21
<210> 355
<211> 22
<212> DNA
<213> 人工序列
<400> 355
tccaactctc aactactatc ag 22
<210> 356
<211> 22
<212> DNA
<213> 人工序列
<400> 356
ctgactgtaa gtacactatg tg 22
<210> 357
<211> 19
<212> DNA
<213> 人工序列
<400> 357
agcagtgggt cttcctcca 19
<210> 358
<211> 22
<212> DNA
<213> 人工序列
<400> 358
cagacttcaa caagcagacc ac 22
<210> 359
<211> 19
<212> DNA
<213> 人工序列
<400> 359
tgtcagacac tatgctgag 19
<210> 360
<211> 19
<212> DNA
<213> 人工序列
<400> 360
gcaggaagct atgtcaatg 19
<210> 361
<211> 20
<212> DNA
<213> 人工序列
<400> 361
cattgatgtg ctcagtagtc 20
<210> 362
<211> 20
<212> DNA
<213> 人工序列
<400> 362
agccaagaac tgacaatgtc 20
<210> 363
<211> 22
<212> DNA
<213> 人工序列
<400> 363
caatgatgag atgtgaactc ag 22
<210> 364
<211> 20
<212> DNA
<213> 人工序列
<400> 364
acagagttac acacaggatg 20
<210> 365
<211> 21
<212> DNA
<213> 人工序列
<400> 365
cagtctgttt gtgatactct c 21
<210> 366
<211> 21
<212> DNA
<213> 人工序列
<400> 366
ctaaggtttg gtctgaatct c 21
<210> 367
<211> 19
<212> DNA
<213> 人工序列
<400> 367
cacattgcac tgttacctg 19
<210> 368
<211> 19
<212> DNA
<213> 人工序列
<400> 368
tcaccctaag atgactgtc 19
<210> 369
<211> 20
<212> DNA
<213> 人工序列
<400> 369
gtcagtgtca gtaatgtgac 20
<210> 370
<211> 20
<212> DNA
<213> 人工序列
<400> 370
agagaagacc cagattctac 20
<210> 371
<211> 22
<212> DNA
<213> 人工序列
<400> 371
cactttacca cacttactca ag 22
<210> 372
<211> 19
<212> DNA
<213> 人工序列
<400> 372
ctgtgacata ccagtcaac 19
<210> 373
<211> 20
<212> DNA
<213> 人工序列
<400> 373
cattcaaggt gtgagttctg 20
<210> 374
<211> 21
<212> DNA
<213> 人工序列
<400> 374
ctcaggagac tttcattcat c 21
<210> 375
<211> 19
<212> DNA
<213> 人工序列
<400> 375
cagcattctc actacagtg 19
<210> 376
<211> 21
<212> DNA
<213> 人工序列
<400> 376
agagtatctt ggctagcata g 21
<210> 377
<211> 20
<212> DNA
<213> 人工序列
<400> 377
acgtggtatt aggtcatcag 20
<210> 378
<211> 19
<212> DNA
<213> 人工序列
<400> 378
gttgagcaat gcatgactg 19
<210> 379
<211> 19
<212> DNA
<213> 人工序列
<400> 379
tgacctacac tttggagag 19
<210> 380
<211> 20
<212> DNA
<213> 人工序列
<400> 380
gtgctctcct cactatactc 20
<210> 381
<211> 19
<212> DNA
<213> 人工序列
<400> 381
gaaggcatca gacaactag 19
<210> 382
<211> 21
<212> DNA
<213> 人工序列
<400> 382
cttgccactt cacatagtat c 21
<210> 383
<211> 21
<212> DNA
<213> 人工序列
<400> 383
gatactatgt gaagtggcaa g 21
<210> 384
<211> 19
<212> DNA
<213> 人工序列
<400> 384
tgctgatgat gacatcgag 19
<210> 385
<211> 20
<212> DNA
<213> 人工序列
<400> 385
catctactgc cattctgaag 20
<210> 386
<211> 20
<212> DNA
<213> 人工序列
<400> 386
ctatgtgtca tcgacaagag 20
<210> 387
<211> 21
<212> DNA
<213> 人工序列
<400> 387
cttgtcgatg acacatagta c 21
<210> 388
<211> 18
<212> DNA
<213> 人工序列
<400> 388
ctgtattagc tgcctgtg 18
<210> 389
<211> 20
<212> DNA
<213> 人工序列
<400> 389
cagctaatac agccatgaac 20
<210> 390
<211> 22
<212> DNA
<213> 人工序列
<400> 390
agcattctta tacaccaacg ac 22
<210> 391
<211> 20
<212> DNA
<213> 人工序列
<400> 391
tgctagatga cgggttagtg 20
<210> 392
<211> 20
<212> DNA
<213> 人工序列
<400> 392
acagacacca tttgaggtag 20
<210> 393
<211> 22
<212> DNA
<213> 人工序列
<400> 393
cttcagtagc acatgtactg tg 22
<210> 394
<211> 20
<212> DNA
<213> 人工序列
<400> 394
gtctacatta gcacatggtg 20
<210> 395
<211> 20
<212> DNA
<213> 人工序列
<400> 395
acacatggtt gttcaccatc 20
<210> 396
<211> 19
<212> DNA
<213> 人工序列
<400> 396
acgtattgct gcactagac 19
<210> 397
<211> 20
<212> DNA
<213> 人工序列
<400> 397
tctcacactc tgaaagtctc 20
<210> 398
<211> 22
<212> DNA
<213> 人工序列
<400> 398
gtctacagac cacatatcct ac 22
<210> 399
<211> 20
<212> DNA
<213> 人工序列
<400> 399
agatgtcatg aactgcactc 20
<210> 400
<211> 21
<212> DNA
<213> 人工序列
<400> 400
ctatcgttca acctagtgat c 21
<210> 401
<211> 21
<212> DNA
<213> 人工序列
<400> 401
agacctttgt cagatgcata g 21
<210> 402
<211> 20
<212> DNA
<213> 人工序列
<400> 402
tcctgtgttc aacagagtag 20
<210> 403
<211> 20
<212> DNA
<213> 人工序列
<400> 403
tgtcttagtg gtctggatag 20
<210> 404
<211> 19
<212> DNA
<213> 人工序列
<400> 404
cttgatccaa ggactgcag 19
<210> 405
<211> 20
<212> DNA
<213> 人工序列
<400> 405
actagatgac tgcacatctc 20
<210> 406
<211> 20
<212> DNA
<213> 人工序列
<400> 406
agagtagagt gcatctcatg 20
<210> 407
<211> 20
<212> DNA
<213> 人工序列
<400> 407
ctctactctt ggtgatgatg 20
<210> 408
<211> 19
<212> DNA
<213> 人工序列
<400> 408
gtttggttcc agactgctg 19
<210> 409
<211> 20
<212> DNA
<213> 人工序列
<400> 409
cttactggct tgtgaaagtg 20
<210> 410
<211> 19
<212> DNA
<213> 人工序列
<400> 410
acacctgcta ggtactcac 19
<210> 411
<211> 20
<212> DNA
<213> 人工序列
<400> 411
tgtgtagtaa gcacatcatg 20
<210> 412
<211> 19
<212> DNA
<213> 人工序列
<400> 412
cacaaccact atggagaac 19
<210> 413
<211> 20
<212> DNA
<213> 人工序列
<400> 413
ctttgctcct atagcctcag 20
<210> 414
<211> 19
<212> DNA
<213> 人工序列
<400> 414
caagacctct tgacaggag 19
<210> 415
<211> 19
<212> DNA
<213> 人工序列
<400> 415
agctgtagtg ccatacttg 19
<210> 416
<211> 21
<212> DNA
<213> 人工序列
<400> 416
gagatactga gtctctacct c 21
<210> 417
<211> 21
<212> DNA
<213> 人工序列
<400> 417
gttgaggtca caatcaggta c 21
<210> 418
<211> 21
<212> DNA
<213> 人工序列
<400> 418
tcagttccat gtaacgtgat g 21
<210> 419
<211> 21
<212> DNA
<213> 人工序列
<400> 419
cattcaggta gtagtgtcat g 21
<210> 420
<211> 20
<212> DNA
<213> 人工序列
<400> 420
gtcactcatt gagctaggtg 20
<210> 421
<211> 20
<212> DNA
<213> 人工序列
<400> 421
agtaacagga gtcctcagtc 20
<210> 422
<211> 21
<212> DNA
<213> 人工序列
<400> 422
agttgtcgta tctccttagt c 21
<210> 423
<211> 21
<212> DNA
<213> 人工序列
<400> 423
agactaagga gatacgacaa c 21
<210> 424
<211> 20
<212> DNA
<213> 人工序列
<400> 424
ctttcaacca tctcactgag 20
<210> 425
<211> 20
<212> DNA
<213> 人工序列
<400> 425
gatggaggtg ctagtagaac 20
<210> 426
<211> 20
<212> DNA
<213> 人工序列
<400> 426
catggattcc actagctgag 20
<210> 427
<211> 19
<212> DNA
<213> 人工序列
<400> 427
accacttcac tcaactctg 19
<210> 428
<211> 20
<212> DNA
<213> 人工序列
<400> 428
acacaagcat atggtgagag 20
<210> 429
<211> 21
<212> DNA
<213> 人工序列
<400> 429
gagtctaagt tgacatgctt g 21
<210> 430
<211> 21
<212> DNA
<213> 人工序列
<400> 430
cataagtcag ctggagagta c 21
<210> 431
<211> 20
<212> DNA
<213> 人工序列
<400> 431
acctgtaatc tgatgctctc 20
<210> 432
<211> 21
<212> DNA
<213> 人工序列
<400> 432
cttagtatca gggttcttca g 21
<210> 433
<211> 436
<212> DNA
<213> 人工序列
<400> 433
tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata attaacccag 60
acatgtggct gccccccccc ccccaacacc tgctgcctgc taaaaataac cctatgttcc 120
cggcgaaggg ccagctgtcc cccgccagct agactcagca cttagtttag gaaccagtga 180
gcaagtcagc ccttggggca gcccatacaa ggccatgggg ctgggcaagc tgcacgcctg 240
ggtccggggt gggcacggtg cccgggcaac gagctgaaag ctcatctgct ctcaggggcc 300
cctccctggg gacagcccct cctggctagt cacaccctgt aggctcctct atataaccca 360
ggggcacagg ggctgccccc tcattctggt caccaccacc tccacagcac agacagacac 420
tcaggagcca gccagc 436
<210> 434
<211> 730
<212> DNA
<213> 人工序列
<400> 434
tttttttgcc ccagtgaagt ggaaccagct caggacggcc tactgttata ttgccaggca 60
ttttttgagc cacttgatgt tatcttcttg gtaatttaaa tttaaccgtg gtaggaatat 120
ttacaccaca gaaattggca aacactaaaa acaaggtgtt tttaaacacc ctgagatcag 180
agatccagtt gatatacatc taccagcaca ccactggcca tatacaggct tgccttatgc 240
cacggggagc tctgcagctg aagtagccct tcaaacttgt cctgctttga gccaaattag 300
gcctctatac tttcaccttc atcagtcact gaatgagggc tgcctgggga aaggcatgaa 360
cttggacaag gcagctctct gcagctcagg cagtccctga agggactgac agttgaagaa 420
tgtctactga catcatttcc atcatctaga acaagagtct ttctttgaag ggggctctga 480
gtagcatatt cccgtgtgaa aggattgtaa acaggaaaat aaaatcatca catatagttt 540
agttgcctat caattagagc tctctggatg caagcaacag aaatcattct ctgattaaat 600
caggcagaaa gtaaatgtgc tgtaattagc acaaaggcat tggaacaaaa cttacaaaag 660
gaaaaagaat ctgagcatgc ctttctgggc atgtggctag caagaagtat tccagtctgt 720
ttgggaaccc 730

Claims (10)

1.一种修复人Dystrophin蛋白表达的基因编辑系统,其特征在于:所述基因编辑系统可敲除X染色体第31792310位至第31854834位,或第31747866位至第31838091位,或第31747866位至第31854834位之间的Dystrophin基因组区域;优选的,所述基因编辑系统可敲除X染色体第31815201位至第31846518位、第31769972位至第31815200位,或第31769972位至第31846518位之间的Dystrophin基因组区域。
2.根据权利要求1所述的基因编辑系统,其特征在于:所述基因编辑系统为CRISPR/Cas基因编辑系统,所述CRISPR/Cas基因编辑系统为酿脓链球菌(Streptococcus pyogenes)的CRISPR/Sp.Cas9基因编辑系统、金黄色酿脓葡萄球菌(Staphylococcus aureus)的CRISPR/Sa.Cas9基因编辑系统、嗜热链球菌(Streptococcus thermophilus)的CRISPR/St.Cas9基因编辑系统,或脑膜炎双球菌(Neisseria meningitidis)的CRISPR/Nm.Cas9基因编辑系统;进一步的,所述CRISPR/Cas基因编辑系统为金黄色酿脓葡萄球菌(Staphylococcusaureus)的CRISPR/Sa.Cas9基因编辑系统。
3.根据权利要求2所述的基因编辑系统,其特征在于:所述CRISPR/Cas基因编辑系统的gRNA的核酸序列选自如下序列中的至少一条:
SEQ ID NO:1~SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ IDNO:57、SEQ ID NO:64~SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:74~SEQID NO:77、SEQ ID NO:82~SEQ ID NO:89、SEQ ID NO:91~SEQ ID NO:94、SEQ ID NO:97~SEQ ID NO:100、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:114、SEQ ID NO:115、SEQ IDNO:119、SEQ ID NO:121~SEQ ID NO:123、SEQ ID NO:125~SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:140~SEQ ID NO:142、SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152~SEQ ID NO:160、SEQ ID NO:165~SEQ ID NO:168、SEQ ID NO:172、SEQ ID NO:178、SEQ IDNO:179、SEQ ID NO:184~SEQ ID NO:188、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:199、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:206~SEQ ID NO:209、SEQ ID NO:214、SEQ ID NO:219~SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:229~SEQID NO:232、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:241、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249~SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:254;
优选地,所述基因编辑系统中gRNA的核酸序列选自如下序列中的至少一条:SEQ IDNO:14、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:43、SEQ ID NO:48、SEQ IDNO:49、SEQ ID NO:57、SEQ ID NO:64~SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:72、SEQID NO:74~SEQ ID NO:77、SEQ ID NO:82~SEQ ID NO:89、SEQ ID NO:91~SEQ ID NO:94、SEQ ID NO:97~SEQ ID NO:100、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:114、SEQ IDNO:115、SEQ ID NO:119、SEQ ID NO:121~SEQ ID NO:123、SEQ ID NO:125~SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:140~SEQ ID NO:142、SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152~SEQ ID NO:160、SEQ ID NO:165~SEQ ID NO:168、SEQ ID NO:172、SEQID NO:178、SEQ ID NO:179、SEQ ID NO:184~SEQ ID NO:188、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:199。
4.根据权利要求2或3所述的基因编辑系统,其特征在于:所述CRISPR/Cas基因编辑系统包含第一gRNA和第二gRNA的组合:其中
(1)用于修复Dystrophin基因51号外显子突变或缺失的第一gRNA的核酸序列选自SEQID NO:14、SEQ ID NO:17、SEQ ID NO:23或SEQ ID NO:24,第二gRNA的核酸序列选自SEQ IDNO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:57、SEQ ID NO:64~SEQ ID NO:69、SEQID NO:71、SEQ ID NO:72、SEQ ID NO:74~SEQ ID NO:77、SEQ ID NO:82~SEQ ID NO:89、SEQ ID NO:91~SEQ ID NO:94、SEQ ID NO:97~SEQ ID NO:100、SEQ ID NO:105、SEQ IDNO:107;
(2)用于修复Dystrophin基因50号外显子突变或缺失的第一gRNA的核酸序列选自SEQID NO:114、SEQ ID NO:115、SEQ ID NO:119、SEQ ID NO:121~SEQ ID NO:123、SEQ ID NO:125~SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:140、SEQ ID NO:141或SEQ ID NO:142,第二gRNA的核酸序列选自SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152~SEQ ID NO:160、SEQ ID NO:165~SEQ ID NO:168、SEQ ID NO:172、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:184~SEQ ID NO:188、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:199;
(3)用于修复Dystrophin基因50号外显子或51号外显子突变或缺失的第一gRNA的核酸序列选自SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:23或SEQ ID NO:24,第二gRNA的核酸序列选自SEQ ID NO:145、SEQ ID NO:150、SEQ ID NO:152~SEQ ID NO:160、SEQ ID NO:165~SEQ ID NO:168、SEQ ID NO:172、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:184~SEQID NO:188、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:199;
优选的,所述CRISPR/Cas基因编辑系统包含第一gRNA和第二gRNA的组合:其中
(1)用于修复Dystrophin基因51号外显子突变或缺失的第一gRNA的核酸序列选自SEQID NO:23,第二gRNA的核酸序列选自SEQ ID NO:43、SEQ ID NO:105或SEQ ID NO:107;
(2)用于修复Dystrophin基因50号外显子突变或缺失的第一gRNA的核酸序列选自SEQID NO:114、SEQ ID NO:115、SEQ ID NO:119、SEQ ID NO:121~SEQ ID NO:123、SEQ ID NO:125~SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:140、SEQ ID NO:141或SEQ ID NO:142,第二gRNA的核酸序列选自SEQ ID NO:152、SEQ ID NO:153或SEQ ID NO:167;
(3)用于修复Dystrophin基因50号外显子或51号外显子突变或缺失的第一gRNA的核酸序列选自SEQ ID NO:23,第二gRNA的核酸序列选自SEQ ID NO:152、SEQ ID NO:153或SEQID NO:167。
5.一种表达体系,其特征在于:所述表达体系可表达权利要求1~4任一项所述的基因编辑系统。
6.根据权利要求5所述的表达体系,其特征在于:所述表达体系的载体为病毒载体;优选的,所述病毒为腺相关病毒AAV或腺病毒Adv或杆状病毒(Baculovirus);进一步的,所述AAV选自AAV2.5、AAV6、AAV8或AAV9。
7.根据权利要求5或6所述的表达体系,其特征在于:所述表达体系包括gRNA序列表达系统和Cas9表达系统。
8.根据权利要求7表达体系,其特征在于:所述表达体系的载体为腺相关病毒AAV,所述Cas9为Sa.Cas9,表达Sa.Cas9的AAV和表达gRNA的AAV两种AAV的两者用量比为3:2~4:1。
9.根据权利要求5~8所述的表达系统,其特征在于:所述表达体系还插入有肌肉组织特异性启动子。
10.根据权利要求9所述的表达系统,其特征在于:所述肌肉组织特异性启动子的核酸序列如SEQ ID NO:433所示。
CN201910707013.5A 2019-08-01 2019-08-01 用于修复dmd基因突变的核酸序列及系统 Pending CN110499333A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910707013.5A CN110499333A (zh) 2019-08-01 2019-08-01 用于修复dmd基因突变的核酸序列及系统
CN202010731942.2A CN111718964A (zh) 2019-08-01 2020-07-27 用于修复dmd基因突变的核酸序列及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910707013.5A CN110499333A (zh) 2019-08-01 2019-08-01 用于修复dmd基因突变的核酸序列及系统

Publications (1)

Publication Number Publication Date
CN110499333A true CN110499333A (zh) 2019-11-26

Family

ID=68586999

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910707013.5A Pending CN110499333A (zh) 2019-08-01 2019-08-01 用于修复dmd基因突变的核酸序列及系统
CN202010731942.2A Pending CN111718964A (zh) 2019-08-01 2020-07-27 用于修复dmd基因突变的核酸序列及系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202010731942.2A Pending CN111718964A (zh) 2019-08-01 2020-07-27 用于修复dmd基因突变的核酸序列及系统

Country Status (1)

Country Link
CN (2) CN110499333A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111718964A (zh) * 2019-08-01 2020-09-29 广东赤萌医疗科技有限公司 用于修复dmd基因突变的核酸序列及系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117959464A (zh) * 2022-10-27 2024-05-03 苏州新芽基因生物技术有限公司 用于疾病治疗的基因编辑器和抗纤维化抑制剂的核酸药物组合物

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160058889A1 (en) * 2014-08-11 2016-03-03 The Board Of Regents Of The University Of Texas System Prevention of muscular dystrophy by crispr/cas9-mediated gene editing
CA3000931A1 (en) * 2015-10-28 2017-05-04 Crispr Therapeutics Ag Materials and methods for treatment of duchenne muscular dystrophy
US20180353615A1 (en) * 2015-11-30 2018-12-13 Charles A. Gersbach Therapeutic targets for the correction of the human dystrophin gene by gene editing and methods of use
ES2957660T3 (es) * 2016-05-05 2024-01-23 Univ Duke Composiciones relacionadas con crispr/cas para tratar la distrofia muscular de duchenne
WO2018098480A1 (en) * 2016-11-28 2018-05-31 The Board Of Regents Of The University Of Texas System Prevention of muscular dystrophy by crispr/cpf1-mediated gene editing
JOP20190166A1 (ar) * 2017-01-05 2019-07-02 Univ Texas استراتيجية مثلى من أجل تعديلات تخطي إكسون باستخدام crispr/cas9 مع متواليات توجيه ثلاثي
WO2019092505A1 (en) * 2017-11-09 2019-05-16 Casebia Therapeutics Llp Self-inactivating (sin) crispr/cas or crispr/cpf1 systems and uses thereof
CN110760511B (zh) * 2018-07-27 2021-09-07 广东赤萌医疗科技有限公司 一种用于治疗杜氏肌营养不良症的gRNA、表达载体、CRISPR-Cas9系统
CN110499333A (zh) * 2019-08-01 2019-11-26 广州德赫生物科技有限公司 用于修复dmd基因突变的核酸序列及系统
CN112063621B (zh) * 2020-09-02 2022-06-28 西湖大学 杜氏肌营养不良症相关的外显子剪接增强子、sgRNA、基因编辑工具及应用

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111718964A (zh) * 2019-08-01 2020-09-29 广东赤萌医疗科技有限公司 用于修复dmd基因突变的核酸序列及系统

Also Published As

Publication number Publication date
CN111718964A (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
US11667917B2 (en) Composition for genome editing using CRISPR/CPF1 system and use thereof
KR101969971B1 (ko) 양기능성 pna 프로브를 이용한 융해곡선 분석방법, 및 이를 이용한 현미부수체 불안정성의 진단방법 및 현미부수체 불안정성 진단용 키트
CN110760511B (zh) 一种用于治疗杜氏肌营养不良症的gRNA、表达载体、CRISPR-Cas9系统
WO2020160517A1 (en) Nucleobase editors having reduced off-target deamination and methods of using same to modify a nucleobase target sequence
CN110337493A (zh) 用于治疗肌强直性营养不良的组合物和方法
CN111088365B (zh) 一种用于检测甲状腺癌ret基因突变及融合的引物及试剂盒
EP4159853A1 (en) Genome editing system and method
CN107267516B (zh) 双sgRNA介导的基因精确修饰方法及应用
CN112159801B (zh) SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用
CN106636344A (zh) 一种基于二代高通量测序技术的地中海贫血症的基因检测试剂盒
CN110499333A (zh) 用于修复dmd基因突变的核酸序列及系统
CN113774085B (zh) 一种单碱基编辑工具TaC9-ABE及其应用
Wang et al. CRISPR-Cas9 HDR system enhances AQP1 gene expression
CN113966401A (zh) 用于治疗amd的htra1调节
CN107338292A (zh) 基于高通量测序检测人类基因组突变负荷的方法及试剂盒
CN111718420A (zh) 一种用于基因治疗的融合蛋白及其应用
WO2022062440A1 (zh) 靶向CTGF基因的gRNA及其应用
CN110387400B (zh) 一种同时捕获基因组目标区域正反义双链的平行液相杂交捕获方法
CN110791552B (zh) 一种基于ngs方法检测ntrk-1-2-3融合基因变异的探针池及试剂盒
CN113038971A (zh) RHO-adRP基于基因编辑的方法和组合物
CN116732097A (zh) 于pd-1位点定点敲入robo1 car的细胞及其制备方法和应用
CN114990093A (zh) 氨基酸序列小的蛋白序列mini rfx-cas13d
CN114807230A (zh) 一种利用CRISPR-Cas9系统敲除人骨髓间充质干细胞TET2基因的方法
CN115851706A (zh) 一种碱基编辑系统及其应用
CN114134174A (zh) 一种LncRNA TUG1靶向调控hsa-miR-4638-3p的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191126

WD01 Invention patent application deemed withdrawn after publication