CN110944656B

CN110944656B - 编码人类fkrp蛋白的新型多核苷酸

Info

Publication number: CN110944656B
Application number: CN201880045606.3A
Authority: CN
Inventors: I·理查德; E·吉凯尔-祖伊达; W·娄思透
Original assignee: Evry Wald Esson University; Institut National de la Sante et de la Recherche Medicale INSERM; Genethon
Current assignee: Evry Wald Esson University; Institut National de la Sante et de la Recherche Medicale INSERM; Genethon
Priority date: 2017-07-07
Filing date: 2018-07-06
Publication date: 2024-05-03
Anticipated expiration: 2038-07-06
Also published as: JP2020530275A; EP3648783A1; US20210338837A1; US11596698B2; CA3069045A1; CN110944656A; WO2019008157A1; US20230321277A1; JP7141417B2

Abstract

本发明涉及编码人福库汀相关蛋白(FKRP)的合成的多核苷酸，其中所述多核苷酸包含避免从移码起始密码子产生的补充转录物的至少一个突变。所述的多核苷酸可用于，尤其是治疗与FKRP缺陷相关或由“α‑抗肌萎缩相关糖蛋白(“α‑DG)糖基化缺陷引起的病症，如LGMD2I。

Description

编码人类FKRP蛋白的新型多核苷酸

本发明提供了一种有效的基因治疗产品，用于治疗由α-抗肌萎缩相关糖蛋白(dystroglycan)(α-DG)糖基化缺陷引起的病症。本发明涉及编码人福库汀(fukutin)相关蛋白(FKRP)并含有避免从移码起始密码子产生的补充转录物的突变的多核苷酸。用所述多核苷酸观察到较高水平的FKRP表达，这为治疗与FKRP缺陷相关的各种疾病，例如2I型肢带型肌营养不良症(LGMD2I)提供了有价值的治疗工具。

发明背景

“抗肌萎缩相关糖蛋白病(Dystroglycanopathies)”重新组合了导致α-抗肌萎缩相关糖蛋白(dystroglycan)(αDG)继发性异常糖基化的不同遗传病症。这种蛋白主要存在于骨骼肌、心脏、眼和大脑组织中，是一种高糖基化膜蛋白，其糖基化过程将其重量从70kDa增加到156kDa。它是肌营养不良蛋白-糖蛋白复合物的一部分，该复合物将细胞骨架连接到细胞外基质(ECM)。它的高糖基化水平使αDG直接与某些ECM蛋白的层粘连蛋白球状结构域结合，例如来自心肌和骨骼肌中的层粘连蛋白、神经肌肉接头处的凝集素和基底膜蛋白多糖(perlecan)、脑中的神经毒素和视网膜中的皮卡丘林(pikachurin)。αDG的糖基化是一个复杂的过程，目前对其尚未完全了解。实际上，已经鉴定出许多基因与αDG糖基化有关。由于对显示出αDG糖基化缺陷的患者进行突变检测中高通量测序方法的使用，这些研究最近正在加速发展。这些蛋白之一是福库汀(Fukutin)相关蛋白(FKRP)。由于其序列中存在许多糖基转移酶所共有的DxD基序，并且在FKRP基因突变的患者中存在αDG低糖基化的证据，因此最初将其归类为认定的αDG糖基转移酶。(Breton等，1999；Brockington等，2001)。最近，FKRP及其同源的福库汀(Fukutin)被鉴定为5-磷酸核糖醇(Rbo5P)转移酶，形成了添加配体结合部分所必需的di-Rbo5P接头(Kanagawa等，2016)。

FKRP基因的突变可产生由αDG糖基化缺陷引起的所有病症范围，从2I型肢带型肌营养不良症(LGMD2I；Muller等，2005)、1C型先天性肌营养不良症(MDC1C；Brockington等，2001)，到沃克-沃伯格(Walker-Warburg)综合征(WWS)和肌肉性眼脑(Muscle-Eye-Brain)病(MEB；Beltran-Valero de Bernabe等，2004)。疾病的严重程度与患者人数之间呈负相关关系，患者越严重，病患越稀少(患病率参见www.orphanet.fr：WWS(所有基因)：1-9/1,000,000和LGMD2I：1-9/100,000)。病理类型似乎至少部分与FKRP突变的性质有关。特别地，纯合的L276I突变，在蛋白质的276位上的亮氨酸被替代为异亮氨酸，其总是与LGMD2I有关(Mercuri等，2003)。LGMD2I是一种隐性常染色体肌肉营养不良，尽管异质性地影响了肩部和骨盆带的肌肉，但它受到的影响较大。它是欧洲最常见的LGMD2之一，特别是由于北欧L276I突变的高流行性(Sveen等，2006)。病理的严重性差异巨大。肌肉症状可能出现在最初的十年到第三十年之间，并且从杜氏病(Duchenne-like disease)到相对良性的程度不等。心脏也可能受到导致严重心力衰竭和死亡等后果的影响(Muller等，2005)。使用心脏磁共振成像的研究表明，很大比例的LGMD2I患者(60-80％)会出现心肌功能障碍，例如射血分数降低(Wahbi等，2008年)。有趣的是，心脏异常的严重程度与骨骼肌受累无关。

吉奎尔等(Hum Mol Genet，2017年3月3日，doi:10.1093/hmg/ddx066)报道了FKRP^L276I小鼠模型的产生，其中重组腺相关病毒(rAAV2/9)转移了鼠Fkrp基因的表达，该基因被置于结蛋白启动子和β-血红蛋白(HBB2)基因的聚腺苷酸化(polyA)信号的控制下，并对此进行评价。肌内或静脉内递送后，观察到肌肉病理学改善。他们在mRNA和蛋白质水平上都获得了FKRP的强表达，并显示出αDG适当糖基化的拯救和层粘连蛋白结合的增加，从而导致了营养不良的组织学和功能上的拯救。

WO2016/138387提出将编码FKRP的野生型核苷酸序列的GC含量降低约5％至约10％，以增加FKRP的表达。它提供了一种合成的多核苷酸，即SEQ ID NO：1，与野生型序列相比其GC含量降低了9.99％。

因此，基于FKRP的基因替代疗法似乎是由FKRP缺乏引起的病理学的有前途的治疗方法。但是，仍然需要改进的治疗方法。

发明概述

本发明旨在通过提供由能够具有更高的KFRP表达水平的经修饰转基因编码的天然人FKRP蛋白来减轻或治愈与福库汀相关蛋白(FKRP)缺乏有关的破坏性病理学状况，如肢体型肌营养不良症2I型(LGMD2I)。

本发明提供了基于FKRP优化序列的有前途的基因治疗产品。本申请报道了当将AAV9载体中衣壳化的要求保护的多核苷酸肌肉内注射到小鼠中时，能够获得与用天然编码序列获得的FKRP相比更高水平的FKRP。

定义

除非另有定义，否则其中使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。本说明书中使用的术语仅是出于描述特定实施例的目的，并非旨在进行限制。

本文使用的冠词“一”和“一个”是指该冠词的语法对象中的一个或多个(即，至少一个)。举例来说，“一个元件”是指一个元件或一个以上元件。

如本文所用，“约”或“大约”是指当涉及诸如量、时间持续时间等的可测量值时，包括相对于指定值±20％或±10％，更优选地±5％，甚至更优选地±1％，还更优选地±0.1％，因为这样的变化适合于执行所公开的方法。

范围：在本发明全部内容中，可以以范围格式来呈现本发明的各个方面。应当理解，范围格式的描述仅是为了方便和简洁，而不应被解释为对本发明范围的不灵活的限制。因此，应该认为范围的描述已经具体公开了所有可能的子范围以及该范围内的各个数值。例如，描述某范围，如1到6应视为已明确公开了子范围，例如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等，以及该范围内的单个数字，例如1、2、2.7、3、4、5、5.3和6。这种适用性与范围的广度无关。

“分离的”是指从自然状态改变的或去除的。例如，天然存在于活体动物中的核酸或肽不是“分离的”，但是与天然状态的共存材料部分或完全分离的相同核酸或肽是“分离的”。分离的核酸或蛋白质可以基本上以纯化的形式存在，或可以存在于非天然环境中，例如宿主细胞中。

在本发明的上下文中，对于常见的核酸碱基使用以下缩写。“A”是指腺苷，“C”是指胞嘧啶，“G”是指鸟苷，“T”是指胸腺嘧啶，“U”是尿苷。

“编码氨基酸序列的核苷酸序列”包括彼此为简并形式并且编码相同氨基酸序列的所有核苷酸序列。短语编码蛋白质或RNA或cDNA的核苷酸序列还可以包括内含子，其程度为编码蛋白质的核苷酸序列在某些形式中可以包含一个或多个内含子。

“编码”是指多核苷酸(例如基因、cDNA或mRNA)中特定核苷酸序列的固有属性，以用作在具有确定的核苷酸序列(即rRNA、tRNA和mRNA)或确定的氨基酸序列的生物过程，以及由此产生的生物学特性中，合成其他聚合物和大分子的模板。因此，如果对应于一基因的mRNA的转录和翻译在细胞或其他生物系统中产生一蛋白质，则该基因编码该蛋白质。编码链和非编码链都可以称为编码该基因或cDNA的蛋白质或其他产物，其中，编码链的核苷酸序列与mRNA序列相同且通常是在序列表中提供的编码链，而非编码链被用作基因或cDNA转录的模板。

术语“起始密码子”表示由核糖体翻译的信使RNA(mRNA)转录物的第一个密码子。在真核生物中，起始密码子始终编码甲硫氨酸。最常见的起始密码子是AUG。结果，在DNA的编码链(或正义链或非模板链)上，起始密码子的序列为ATG。非编码链(或反义链或反编码链或模板链或转录菌株)上的相应反密码子是CAT。在说明书的其余部分中，术语“起始密码子”也用于DNA。

如本文所用，术语“多核苷酸”被定义为可以是单链(ss)或双链(ds)的核苷酸链。此外，核酸是核苷酸的聚合物。因此，如本文所用的核酸和多核苷酸是可互换的。本领域技术人员具有核酸是多核苷酸的一般知识，其可以被水解成单体“核苷酸”。单体核苷酸可以被水解成核苷。如本文所用，多核苷酸包括但不限于通过本领域可用的任何手段获得的所有核酸序列，包括但不限于重组手段(即使用常规克隆技术和PCR等从重组文库或细胞基因组中克隆核酸序列)，以及通过合成的方式。

如本文所用，术语“肽”、“多肽”和“蛋白质”可互换使用，并且是指由通过肽键共价连接的氨基酸残基组成的复合物。蛋白质或肽必须包含至少两个氨基酸，并且对构成蛋白质或肽的序列的最大氨基酸数没有限制。多肽包括包含通过肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白质。如本文所用，该术语是指短链或长链，其中，短链在本领域中通常也被称为例如肽、寡肽和寡聚物，而长链在本领域中通常被称为蛋白质，其中有很多类型。“多肽”包括例如生物活性片段、基本上同源的多肽、寡肽、同二聚体、异二聚体、多肽的变体、修饰的多肽、衍生物、类似物、融合蛋白等等。所述多肽包括天然肽、重组肽、合成肽，或其组合。

蛋白质可以被“改变”并包含氨基酸残基的缺失、插入或取代，这些氨基酸残基具有沉默的改变并产生功能上等同的结果。可以基于残基的极性、电荷、溶解性、疏水性、亲水性和/或两亲性质的相似性来进行故意的氨基酸取代。例如，带负电荷的氨基酸可包括天冬氨酸和谷氨酸；带正电荷的氨基酸可以包括赖氨酸和精氨酸；具有相似的亲水性数值的不带电荷的极性头基的氨基酸可以包括亮氨酸、异亮氨酸和缬氨酸、甘氨酸和丙氨酸、天冬酰胺和谷氨酰胺、丝氨酸和苏氨酸以及苯丙氨酸和酪氨酸。

如本文所用，“变体”是指一个或多个氨基酸被改变的氨基酸序列。所述变体可以具有“保守的”变化，其中取代的氨基酸具有相似的结构或化学性质，例如用异亮氨酸替代亮氨酸。变体也可能具有“非保守的”变化，例如用色氨酸替代甘氨酸。类似的微小变化也可以包括氨基酸的缺失或插入，或两者。使用本领域众所周知的计算机程序可以找到确定哪些氨基酸残基可以被取代、插入或缺失而不丧失生物学或免疫学活性的指南。

“相同的”或“同源的”是指两个多肽之间或两个核酸分子之间的序列同一性或序列相似性。当两个比较序列的某一位置均被相同的碱基或氨基酸单体亚基占据时(例如，如果两个DNA分子中的某一位置均被腺嘌呤占据)，则这两个分子在该位置是同源的或相同的。两个序列之间的同源性/同一性百分比是两个序列共享的匹配位置数除以所比较的位置数×100的函数。例如，如果两个序列中10个位置中的6个匹配，则两个序列60％相同。通常，当两个序列比对以给出最大的同源性/同一性时进行比较。

“载体”是包含分离的核酸并且可以用于将分离的核酸递送至细胞内部的物质组合物。许多载体是本领域已知的，包括但不限于线性多核苷酸、与离子或两亲性化合物相关的多核苷酸、质粒和病毒。因此，术语“载体”包括自主复制质粒或病毒。该术语也应解释为包括有助于核酸转移到细胞中的非质粒和非病毒复合物，例如聚赖氨酸复合物、脂质体等。病毒载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体等。

“表达载体”是指包含重组多核苷酸的载体，所述重组多核苷酸包含与待表达的核苷酸序列可操作地连接的表达调控序列。表达载体包含足够的顺式作用元件用于表达；其他表达元件可以由宿主细胞提供或在体外表达系统中提供。表达载体包括本领域已知的所有载体，例如掺入重组多核苷酸的粘粒、质粒(例如，裸露的或包含在脂质体中的)和病毒(例如，慢病毒、逆转录病毒、腺病毒和腺相关病毒)。

如本文所用，术语“启动子”定义为启动多核苷酸序列的特异性转录所需的DNA序列，其被细胞的合成机制或引入的合成机制识别。

如本文所用，术语“启动子/调节序列”是指表达可操作地连接至所述启动子/调节序列的基因产物所需的核酸序列。在某些情况下，该序列可以是核心启动子序列，在其他情况下，该序列也可以包括表达基因产物所需的增强子序列和其他调控元件。所述启动子/调节序列可以例如是一种以组织特异性方式表达基因产物的启动子/调节序列。

“组成型”启动子是一种核苷酸序列，当其与编码或指定基因产物的多核苷酸可操作地连接时，其导致在细胞的大多数或全部生理条件下在细胞中产生该基因产物。

“诱导型”启动子是一种核苷酸序列，当其与编码或指定基因产物的多核苷酸可操作地连接时，仅当对应于该启动子的诱导物存在于细胞中时，其才能导致在细胞中产生该基因产物。

“组织特异性”启动子是一种核苷酸序列，当与编码或指定基因的多核苷酸可操作连接时，如果该细胞是与该启动子相对应的组织类型的细胞，则优先使该基因产物在该细胞中产生。

当在生物体、组织、细胞或其组成部分的上下文中使用时，术语“异常”是指在至少一种可观察或可检测的特征(例如年龄、治疗、天数等)方面，与显示“正常”(预期)的生物体、组织、细胞或其组成部分各自不同的生物体、组织、细胞或其组成部分。对于一种细胞或组织类型正常或预期的特征，对于另一种细胞或组织类型可能是异常的。

术语“患者”、“受试者”、“个体”等在本文中可互换使用，并且是指无论是体外还是原位，适合于本文所述方法的任何动物或其细胞。受试者可以是哺乳动物，例如人、狗、小鼠、大鼠或非人灵长类动物。在某些非限制性实施方式中，所述的患者、受试者或个体是人。

“疾病”或“病症”是受试者的一种健康状态，其中受试者不能维持体内稳态，并且如果疾病没有得到改善，则受试者的健康状态继续恶化。相反，受试者的“紊乱(disorder)”是一种健康状态，其中受试者能够维持体内稳态，但是与不存在该紊乱的情况相比，受试者的健康状态不佳。如果不及时治疗，紊乱不一定会导致受试者的健康状况进一步下降。

如果所述疾病或紊乱的症状的严重性、患者经历这些症状的频率，或两者都降低，则所述疾病或紊乱被“减轻”或“缓解”。这也包括阻止所述疾病或紊乱的进展。如果所述疾病或紊乱的症状的严重性、患者经历这种症状的频率，或两者都消除，则所述疾病或病症被“治愈”。

“治疗性”疗法是施用于表现出病理学迹象的受试者，以减少或消除那些迹象的治疗。“预防性”治疗是为了预防或推迟这些迹象的发生，而施用于没有表现出病症迹象或尚未被诊断为该疾病的受试者的治疗。

如本文所用，“治疗疾病或紊乱”是指降低受试者经历的疾病或紊乱的至少一种迹象或症状的频率或严重性。在治疗的背景下，疾病和紊乱在本文中可互换使用。

化合物的“有效量”是足以向施用该化合物的受试者提供有益作用的化合物的量。如本文所用，短语“治疗有效量”是指足以或有效地预防或治疗(延缓或预防其发作、防止其发展、抑制、减少或逆转)疾病或病症的量，包括减轻此类疾病的症状。递送载体的“有效量”是足以有效结合或递送化合物的量。

发明详述

本发明基于以下的发现：抑制福库汀蛋白相关蛋白(FKRP)的编码区中包含的补充移码起始密码子，可增加FKRP的表达。

因此，在一方面，本发明提供了编码人FKRP的合成的多核苷酸，其中所述多核苷酸包含避免从移码起始密码子产生的补充转录物的至少一个突变。

根据本发明，所述合成的多核苷酸包含编码功能性人FKRP的核酸序列，或由其组成。

在一个实施方式中，编码人FKRP的多核苷酸，也称为“开放阅读框”ORF，是cDNA。但是，例如可以使用单链或双链DNA或RNA。

在本发明的框架中，人FKRP蛋白是由如SEQ ID NO：1(对应于495aa的蛋白质)所示的氨基酸序列组成，或包含其的蛋白。

根据特定的实施方式，功能性人FKRP是具有与由SEQ ID NO：1编码的天然人FKRP相同功能的蛋白质，尤其是糖基化α-抗肌萎缩相关糖蛋白(αDG)和/或至少部分缓解与FKRP缺陷有关的一种或多种症状，特别是如上所述的LGMD2I表型的能力。它可以是其片段和/或其衍生物。根据一个实施方式，所述FKRP序列与序列SEQ ID NO：1的同一性大于或等于60％、70％、80％、90％、95％或甚至99％。

如本领域已知的，编码序列为SEQ ID NO：1的人FKRP蛋白的天然人序列中具有序列SEQ ID NO：2。

本发明不包括天然序列SEQ ID NO：2，并且关注于编码SEQ ID NO：1但与SEQ IDNO：2不同的序列。更确切地说，天然多核苷酸(SEQ ID NO：2)已被修饰或优化：基于遗传密码子的简并性，天然序列(SEQ ID NO：2)的一个或多个碱基已被其他碱基取代，同时不改变所得氨基酸序列(SEQ ID NO：1)。换句话说，本发明提供了一种合成的多核苷酸，即非天然存在的，优选经优化的多核苷酸。

根据另一个具体的实施方式，本发明所述的合成的多核苷酸不包含序列SEQ IDNO：20，或与其具有至少90％同一性的任何序列，也不由其组成。

优选地，编码人FKRP的合成的多核苷酸为与编码功能性人FKRP(优选为序列SEQID NO：1)的分离的核酸的核苷酸序列，尤其是序列SEQ ID NO：2约60％同源/相同，更优选为约65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、88％、89％或约90％、91％、92％、93％、94％同源/相同，甚至更优选约95％同源/相同，甚至更优选约96％、97％、98％或甚至99％同源/相同。如前所述，所述多核苷酸不包含序列SEQ ID NO：2，或不由其组成。

如本领域中已知的，编码序列可以在正义或反义方向上包含一个或多个移码起始密码子，其可以产生替代或补充的转录产物。作为示例，所述编码序列在正义起始密码子的情况下可以另外包含ATG，或者在反义起始密码子的情况下可以另外包含CAT。根据一个具体的实施方式，这些起始密码子是移码的，即它们产生替代的开放阅读框(ORF)与人FKRP的编码序列不同相/框，而是移位了一个核苷酸(“相/框+1”)或2个核苷酸(“相/框+2”)。换句话说，所谓的“移码”起始密码子在FKRP编码序列的替代框之一中。

在SEQ ID NO：2的特定情况下，主ORF在第1位以编码甲硫氨酸(M或Met)的ATG(SEQID NO：2的1至3位核苷酸)开始；相应的ORF由1488个碱基或核苷酸组成，编码495aa的蛋白，由以终止密码子TGA结束。同相内(即同框内)的其他ORF起始于第430位(SEQ ID No：2的430至432位核苷酸)和第1279位(SEQ ID NO：2的1279至1281位核苷酸)，具有编码甲硫氨酸(M或Met)的ATG。但是，它们不可能被更改，因为除了经典的ATG外，没有其他编码甲硫氨酸的密码子。

在相+1的情况下，有4个起始密码子能够生成补充转录物：

-在反义方向上对应于ATG的第429位(SEQ ID NO：2的429至431位核苷酸)、第819位(SEQ ID NO：2的819至821位核苷酸)和第1431位(SEQ ID NO：2的1431至1433位核苷酸)的CAT；

-在正义方向上的第545位的ATG(SEQ ID NO：5的545至547位核苷酸)。

在相/框+2的情况下，没有潜在的起始密码子(正义或反义)。

根据本发明，引入至少一个碱基改变，以突变起始密码子，而不改变编码的氨基酸。

根据一个实施方式，所述多核苷酸的一个起始密码子被突变，所述起始密码子位于序列SEQ ID NO：2的第429位(“429-431”)，或第545位(“545-547”)，或第819位(“819-821”)，或第1431位(“1431-1433”)。

在一个优选的实施方式中，所述多核苷酸的至少一个起始密码子被突变，所述起始密码子位于序列SEQ ID NO：2的第819位(“819-821”)。

根据一个实施方式，所述多核苷酸的至少两个(2)起始密码子被突变，所述起始密码子位于序列SEQ ID NO：2的第429和545位，第429和819位，或第429和1431位，或第545和819位，或第545和1431位，或第819和1431位。优选地，突变的起始密码子位于序列SEQ IDNO：2的第429和819位、第545和819位或第819和1431位。

根据另一个实施方式，所述多核苷酸的至少三个(3)起始密码子被突变，所述起始密码子位于序列SEQ ID NO：2的第429和545和819位、第429和545和1431位、或第429和819和1431位、或第545和819和1431位，优选地是SEQ ID NO：2的第429和819和1431位。更优选地，所述多核苷酸包括序列SEQ ID NO：4，或SEQ ID NO：7，或SEQ ID No：8，或由其组成。

在另一个实施方式中，所述多核苷酸的至少四个(4)起始密码子被突变，所述起始密码子位于序列SEQ ID NO：2的第429和545和819和1431位。优选地，所述多核苷酸包括序列SEQ ID NO：3，或SEQ ID NO：5，或SEQ ID No：6，或由其组成。

所述起始密码子的修饰可以由所述密码子中的1、2或3个突变引起。如已经提到的，所述突变不应改变编码的序列。

第429位(“429-431”)的反义起始密码子的抑制可以是由于，例如将第429位的C碱基更改为G或A所引起。结果，“CAT”(反义方向的ATG)被转换为“GAT”(反义方向的ATC)或“AAT”(反义方向的ATT)，其不再与反义方向上的起始密码子相对应，但不改变相应的氨基酸序列。

第545位(“545-547”)的正义起始密码子的抑制可以是由，于例如将第546位的T碱基更改为C所引起。结果，“ATG”被转换为“ACG”，其不再对应于正义方向的起始密码子，但不改变相应的氨基酸序列。

第819位(“819-821”)的反义起始密码子的抑制可以是由于，例如将第819位的C碱基更改为G或A所引起。结果，“CAT”(反义方向的ATG)被转换为“GAT”(反义方向的ATC)或“AAT”(反义方向的ATT)，其不再与反义方向上的起始密码子相对应，但不改变相应的氨基酸序列。

第1431位(“1431-1433”)的反义起始密码子的抑制可以是由于，例如将第1431位的C碱基更改为G所引起。结果，“CAT”(反义方向的ATG)被转换为“GAT”(反义方向的ATC)，其不再与反义方向上的起始密码子相对应，但不改变相应的氨基酸序列。

可以如下进一步优化本发明的多核苷酸：

根据一个实施方式，GC含量被修改，优选被降低。优选地，本发明的多核苷酸的GC含量，相对于SEQ ID NO：2的GC含量降低小于5％，或相对于SEQ ID NO：2的GC含量降低大于10％。当用A或T取代G和C碱基时，氨基酸序列应保守，并且优选不引入额外的起始密码子。

根据另一个实施方式，优选以与上述相同的预防措施替换CG基序以避免CpG结构的形成(氨基酸序列是保守的，并且不引入额外的起始密码子)。

根据另一个实施方式，基于人的转运RNA频率(例如遵循Sharp等(1988)中公开的密码子频率表)优化序列，优选采用与上述相同的预防措施。

根据另一个实施方式，本发明的多核苷酸还可在SEQ ID NO：2的区域553-559中(GCCCCCG)的具有至少一个突变，其对应于茎环。优选地，由于一个或多个突变，所述茎环结构被修饰甚至被破坏。例如，SEQ ID NO：2的第558位的核苷酸C被转换为T。

根据一个具体的实施方式，本发明的多核苷酸包含选自SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7或SEQ ID NO：8的序列，或与其具有约60％同源/相同，更优选约65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、88％、89％或约90％、91％、92％、93％、94％同源/相同，甚至更优选约95％同源/相同，甚至更优选约96％、97％、98％或甚至99％同源/相同的序列，或由其组成。

根据一个优选的实施方式，所述同源序列具有相同的起始密码子突变。

因此，作为实例，本发明还涉及与SEQ ID NO：4具有60％的同一性，更优选约65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、88％、89％或大约90％、91％、92％、93％、94％的同一性，甚至更优选地，大约95％同一性，甚至更优选地，大约96％、97％、98％或甚至99％的同一性的序列；并且在序列SEQ ID NO：2的第429、819和1431位的3个起始密码子突被变。根据一个具体的实施方式，所述序列是SEQ ID NO：7或SEQ IDNO：8。

根据另一个实例，本发明还涉及与SEQ ID NO：6具有60％的同一性，更优选约65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、88％、89％或大约90％、91％、92％、93％、94％的同一性，甚至更优选地，大约95％同一性，甚至更优选地，大约96％、97％、98％或甚至99％的同一性的序列；并且在序列SEQ ID NO：2的第429、545、819和1431位的4个起始密码子突被变。根据一个具体的实施方式，所述序列是SEQ ID NO：5或SEQ ID NO：3。

根据一个具体的实施方式，将分离的多核苷酸插入载体。简而言之，天然或合成核酸的表达通常是通过将核酸或其部分可操作地连接至启动子，并将构建物掺入表达载体而实现的。所使用的载体适合在真核细胞中复制和任选地整合。典型的载体包含用于调节所需核酸序列表达的转录和翻译终止子、起始序列和启动子。

在一个实施方式中，所述载体是表达载体，优选地是病毒载体。

在一个实施方式中，所述病毒载体选自下组：杆状病毒载体、疱疹病毒载体、慢病毒载体、逆转录病毒载体、腺病毒载体和腺相关病毒(AAV)载体。

根据本发明的特定实施方式，包含所述多核苷酸的病毒载体是腺相关病毒(AAV)载体。

腺相关病毒(AAV)载体已成为治疗各种疾病的强大的基因传递工具。AAV载体具有许多功能，这使其非常适合基因治疗，所述的功能包括缺乏致病性、中等免疫原性以及以稳定和有效的方式转导有丝分裂后细胞和组织的能力。通过选择AAV血清型、启动子和递送方法的合适组合，可以将AAV载体中包含的特定基因的表达特异性地靶向一种或多种细胞。

在一实施方式中，所述编码序列包含在AAV载体内。已知有超过100种自然存在的AAV血清型。AAV衣壳中存在许多天然变体，从而可以鉴定和使用具有特别适合于营养不良性疾病的特性的AAV。可以使用常规的分子生物学技术对AAV病毒进行工程改造，从而可以优化这些颗粒，以实现核酸序列的细胞特异性递送、最小化免疫原性、调节稳定性和颗粒寿命、有效降解、准确递送至细胞核。

如上所述，使用AAV载体是DNA外源递送的一种常见方式，因为它相对无毒、可以提供有效的基因转移，并且可以很容易地针对特定目的进行优化。在从人或非人灵长类动物(NHP)分离并具有良好特征的AAV血清型中，人血清型2是第一个被开发为基因转移载体的AAV。当前使用的其他AAV血清型包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAV11和AAV12。另外，非天然工程化变体和嵌合AAV也可以被使用。

用于组装到载体中的理想AAV片段包括：cap蛋白，其包括vp1、vp2、vp3和高变区；rep蛋白，其包括rep78、rep68、rep52和rep40；以及编码这些蛋白的序列。这些片段可以容易地用于多种载体系统和宿主细胞中。

此类片段可单独使用、与其他AAV血清型序列或片段结合使用，或与其他AAV或非AAV病毒序列的元件结合使用。如本文所用，人工AAV血清型包括但不限于具有非天然存在的衣壳蛋白的AAV。这样的人工衣壳可以通过任何合适的技术，使用选择的AAV序列(例如，vp1衣壳蛋白的片段)结合异源序列来产生，所述异源序列可以获自不同的选择的AAV血清型、同样的AAV血清型的非连续部分、非AAV病毒来源的或非病毒来源的。人工AAV血清型可以是但不限于嵌合AAV衣壳、重组AAV衣壳或“人源化”AAV衣壳。因此，示例性AAV或人工AAV包括AAV2/8(US7,282,199)、AAV2/5(可从美国国立卫生研究院(National Institutes ofHealth)获得)、AAV2/9(WO2005/033321)、AAV2/6(US6,156,303)和AAVrh10(WO2003/042397)。在一个实施方式中，可用于本文所述的组合物和方法中的载体至少包含编码选择的AAV血清型衣壳(例如AAV8衣壳或其片段)的序列。在另一个实施方式中，有用的载体至少包含编码选择的AAV血清型rep蛋白(例如AAV8 rep蛋白或其片段)的序列。任选地，这样的载体可以同时包含AAV帽蛋白和rep蛋白。在同时提供了AAV rep和cap的载体中，AAV rep和AAV cap序列都可以是一个血清型起源，例如所有AAV8起源。或者，可以使用其中rep序列来自一个不同于提供cap序列的AAV血清型的载体。在一个实施方式中，所述rep和cap序列从不同的来源(例如不同的载体，或宿主细胞和载体)表达。在另一个实施方式中，这些rep序列在框内与不同AAV血清型的cap序列融合，以形成嵌合AAV载体，例如AAV2/8(US7,282,199)。

根据一个实施方式，所述组合物包含血清型2、5、8或9的AAV。优选地，要求保护的载体是AAV8或AAV9载体，尤其是AAV2/8或AAV2/9载体。更优选地，要求保护的载体是AAV9载体或AAV2/9载体。

在用于本发明的AAV载体中，AAV基因组可以是单链(ss)核酸或双链(ds)/自互补(sc)核酸分子。

优选地，将编码人FKRP的多核苷酸插入AAV载体的ITR(“反向末端重复”)序列之间。典型的ITR序列对应于SEQ ID NO：12(5’ITR序列)和SEQ ID NO：16(3’ITR序列)。

重组病毒颗粒可通过本领域技术人员已知的任何方法获得，例如通过单纯疱疹病毒系统和杆状病毒系统共转染293HEK细胞。所述载体滴度通常表示为每毫升病毒基因组(vg/mL)。

在一个实施方式中，所述载体包含调节序列，尤其是启动子序列。这样的启动子可以是可诱导的或组成型的天然或合成(人工)启动子。

在一个实施方式中，所述启动子是普遍存在的启动子或具有低的组织特异性的启动子。例如，所述表达载体可以带有磷酸甘油酸激酶1(PGK)、EF1、β-肌动蛋白、CMV启动子。

在一个优选的实施方式中，启动子序列的选择是为了在表达水平以及组织特异性方面充分调控被其调控的核酸序列的表达。在一实施方式中，所述表达载体包含肌肉特异性启动子。这样的启动子允许在骨骼肌中并且可能在心肌(心脏)中强烈表达。本领域技术人员已知的合适启动子的实例是例如结蛋白(desmin)启动子、肌肉肌酸激酶(MCK)启动子、CK6启动子、Syn启动子、ACTA1启动子或合成启动子C5-12(spC5-12)。特别感兴趣的是人结蛋白启动子，如序列SEQ ID NO：13所示。

也可以使用FKRP启动子。

其他可能的调节序列的非详尽列表是：

-转录稳定序列，例如血红蛋白(HBB2)的内含子1。如序列SEQ ID NO：14所示，所述HBB2内含子之后优选地包含共有的Kozak序列，位于mRNA内的AUG起始密码子之前，以改善翻译的起始；

-聚腺苷酸化信号，例如目的基因的polyA、SV40或β血红蛋白(HBB2)的polyA，优选地位于编码人FKRP的序列的3’端。作为优选的实例，HBB2的polyA在序列SEQ ID NO：15中公开；

-增强子序列；

-miRNA靶序列，其可以抑制在非靶组织中编码人FKRP的序列的表达，在所述非靶组织中所述的表达是不希望的，例如在其可能是有毒的情况下。优选地，相应的miRNA不存在于骨骼肌中，并且可能不存在于心脏中。

通常，本发明所述的载体包括：

-对应于SEQ ID NO：10或11的494至638位核苷酸的5’ITR序列(SEQ ID NO：12)；然后是

-对应于SEQ ID NO：10或11的639至1699位核苷酸的人结蛋白启动子(SEQ ID NO：13)；然后是

-HBB2内含子，然后是对应于SEQ ID NO：10或11的1700至2151位核苷酸的共有Kozak序列(SEQ ID NO：14)；然后是

-编码人FKRP的多核苷酸，例如SEQ ID NO：3或4或5或6或7或8，在SEQ ID NO：3和4的情况下，对应于SEQ ID NO：10或11的2152至3639位核苷酸；然后是

-对应于SEQ ID NO：10或11的3640至4405位核苷酸的HBB2 polyA序列(SEQ IDNO：15)；然后是

-对应于SEQ ID NO：10或11的4406至4550位核苷酸的3’ITR序列(SEQ ID NO：16)。

关于含有序列SEQ ID NO：3、SEQ ID NO：4和SEQ ID NO：6的多核苷酸，本发明的载体分别包含SEQ ID NO：10、SEQ ID NO：11和SEQ ID NO：21所示的序列。

根据一个实施方式，本发明涉及一种载体，优选地是表达载体，更优选地是具有序列SEQ ID NO：10、SEQ ID NO：11或SEQ ID NO：21的AAV载体。如上所述，本发明还包括同源序列，即显示与序列SEQ ID NO：10、SEQ ID NO：11或SEQ ID NO：21具有约60％的同源性，更优选约70％的同源性，甚至更优选约80％的同源性，更优选约90％的同源性，甚至更优选约95％的同源性，并且甚至更优选约97％、98％或甚至99％的同源性。

本发明的其他方面涉及：

-如上所述的包含本发明的多核苷酸的细胞或包含含有所述多核苷酸的载体的细胞。

所述细胞可以是任何类型的细胞，即原核或真核细胞。所述细胞可以用于载体的增殖，或者可以被进一步引入(例如移植)到宿主或受试者中。可以通过本领域已知的任何方法将多核苷酸或载体引入细胞，例如通过转化、电穿孔或转染。也可以使用源自细胞的囊泡。

-一种转基因动物(优选地为非人)，其包含本发明的多核苷酸、包含所述多核苷酸的载体，或包含所述多核苷酸或载体的细胞，如上所述。

本发明的另一方面涉及一种包含如上所述的多核苷酸、载体或细胞的组合物，其被用作药物。

根据一个实施方式，所述组合物至少包含所述基因治疗产物(所述多核苷酸、载体或细胞)，以及可能的其他活性分子(其他基因治疗产物、化学分子、肽、蛋白质…)，其专门用于相同的疾病或其他疾病的治疗。

然后，本发明提供了包含本发明所述的多核苷酸、载体或细胞的药物组合物。这样的组合物包含治疗有效量的治疗剂(本发明的多核苷酸或载体或细胞)，和药学上可接受的载体。在一个具体的实施方式中，术语“药学上可接受的”是指由联邦或州政府的监管机构批准或在美国或欧洲药典或其他公认的药典中列出的用于动物和人类的药物。术语“载体”是指与治疗剂一起施用的稀释剂、佐剂、赋形剂或媒介物。这样的药物载体可以是无菌液体，例如水和油，包括石油、动物、植物或合成来源的油，例如花生油、大豆油、矿物油、芝麻油等。当药物组合物静脉内施用时，水是优选的载体。盐溶液以及葡萄糖水溶液和甘油溶液也可以用作液体载体，特别是用于注射溶液。合适的药物赋形剂包括淀粉、葡萄糖、乳糖、蔗糖、硬脂酸钠、单硬脂酸甘油酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙二醇、水、乙醇等。

如果需要，所述组合物还可包含少量的润湿剂或乳化剂或pH缓冲剂。这些组合物可以采取溶液、混悬剂、乳剂、缓释制剂等形式。合适的药物载体的实例在E.W.Martin的“《雷明顿药学》(Remington's Pharmaceutical Sciences)”中有所描述。这样的组合物将包含治疗有效量的治疗剂，优选以纯化形式，以及适当量的载体，以提供用于向受试者适当施用的形式。

在一个优选的实施方式中，所述组合物被根据常规程序配制成适于静脉内施用于人的药物组合物。通常，用于静脉内施用的组合物是在无菌等渗水性缓冲液中的溶液。必要时，所述组合物还可包含增溶剂和局部麻醉剂(例如利多卡因)，以在注射部位缓解疼痛。

在一个实施方式中，本发明所述的组合物适合于在人中施用。所述组合物优选为液体形式，优选地为盐水组合物，更优选地为磷酸盐缓冲盐水(PBS)组合物或林格(Ringer)-乳酸盐溶液。

可以通过标准的临床技术确定对目标疾病有效的本发明的治疗剂(即核酸、载体或细胞)的量。另外，可以任选地使用体内和/或体外测定来帮助预测最佳剂量范围。制剂中使用的精确剂量还取决于给药途径、体重、疾病的严重性，并且应根据从业者的判断和每个患者的情况来决定。

适当的施用应允许将治疗有效量的基因治疗产品递送至靶组织，尤其是骨骼肌，可能还有心脏。在本发明的上下文中，当基因治疗产品是包含编码人FKRP的多核苷酸的病毒载体时，治疗剂量定义为包含FKRP序列的病毒颗粒的量(病毒基因组的vg)，施用于受试者的每千克(kg)的量。

可用的给药途径是局部(局部)的、肠内的(全身作用，但通过胃肠道胃肠道传递)，或肠胃外的(全身作用，但通过胃肠道以外的途径传递)。本文公开的组合物的优选给药途径是肠胃外给药，包括肌肉内给药(即进入肌肉)和全身给药(即进入循环系统)。在本文中，术语“注射”(或“灌注”或“输注”)涵盖血管内，尤其是静脉内(IV)、肌内(IM)、眼内或脑内给药。注射通常使用注射器或导管进行。

在一个实施方式中，组合物的全身递送包括在局部治疗部位附近(即在衰弱的肌肉附近的静脉或动脉中)施用组合物。在某些实施方式中，本发明包括所述组合物的局部递送，其产生全身效应这种给药途径，通常称为“区域(局部)输注”、“通过单独的肢体灌注”或“高压静脉肢体灌注”进行的给药，已成功地用作肌肉营养不良的基因传递方法(Fan等，2012)。

根据一方面，通过输注或灌注将所述组合物施用于离体的肢体(局部)。换句话说，本发明包括在压力下通过血管内给药途径(即静脉(静脉)或动脉)，在腿和/或手臂中局部递送所述组合物。这通常是通过使用止血带暂时停止血液循环，同时允许所注入产品的区域性扩散来实现的，例如由Toromanoff等(2008)公开的。

在一个实施方式中，将所述组合物注射到受试者的四肢中。当受试者是人时，肢体可以是手臂或腿。根据一个实施方式，所述组合物在受试者身体的下部(例如在膝盖以下)施用，或在受试者身体的上部(例如在肘部以下)施用。

在一个实施方式中，将所述组合物施用于外周静脉，例如头静脉。待输注的所述组合物的体积可以在肢体体积的约5％至40％之间的范围内变化。典型的剂量可在5至30ml/kg体重之间变化。在一个实施方式中，要施加的压力(止血带压力或最大管路压力)低于100000Pa，优选地低于50000Pa。在一个优选的实施方式中，所述施加的压力为约300托(40000Pa)。

在一个实施方式中，使用止血带将肢体的血液循环停止，该止血带被拉紧几分钟至超过一个小时，通常在大约1至80分钟之间，例如大约30分钟。在一个优选的实施方式中，在给药之前、期间和之后使用止血带，例如在输注之前约10分钟、在输注期间约20分钟和在输注之后约15分钟。更通常地，施加压力几分钟，通常在大约1至80分钟之间，例如大约30分钟。在一个优选的实施方式中，在给药之前、期间和之后施加压力，例如在输注之前约10分钟、在输注期间约20分钟和在输注之后约15分钟。

在一个实施方式中，平均流速在5至150ml/分钟之间，优选地在5至80ml/分钟之间，例如10ml/分钟。当然，所述流速还决定了血液循环停止和施加压力的时间段。

在局部给药的情况下，注射剂量可以在10¹²至10¹⁴vg/kg患者体重之间变化，优选在10¹²和10¹³vg/kg之间。

本发明的优选的给药方法是全身给药。全身注射为全身的注射开辟了道路，以便到达受试者的身体的所有肌肉，包括心脏和隔膜肌，然后真正治疗这些全身性的且仍无法治愈的疾病。在某些实施方式中，全身递送包括将组合物递送至受试者，使得所述组合物抵达受试者的所有身体部位。

根据一个优选的实施方式，全身性给药是通过将组合物注射到血管中进行的，即血管内(静脉内或动脉内)给药。根据一个实施方式，所述组合物通过外周静脉，静脉内注射给药。

全身性给药通常在以下条件下进行：

-流速为1至10mL/分钟，优选地为1至5mL/分钟，例如3mL/分钟；

-每kg受试者的总注射体积可以在1至20mL的载体制剂之间变化，优选5mL。注射体积不应超过总血体积的10％，最好为约6％。

当全身性递送时，优选以小于或等于10¹⁵vg/kg或甚至10¹⁴vg/kg，优选地在10¹²vg/kg和10¹⁴vg/kg之间，更优选地在5.10¹²vg/kg和10¹⁴vg/kg之间(例如1、2、3、4、5、6、7、8或9.10¹³vg/kg)的剂量施用所述组合物。也可以考虑较低的剂量，例如1、2、3、4、5、6、7、8或9.10¹²vg/kg，以避免潜在的毒性和/或免疫反应。如本领域技术人员所知，就效率而言，优选以尽可能低的剂量给出令人满意的结果。

在一个具体的实施方式中，所述治疗包括组合物的单次施用。

“抗肌萎缩相关糖蛋白病”是指与α-抗肌萎缩相关糖蛋白(αDG)有关的疾病或病理。此缺陷可能是由于FKRP缺陷引起的。根据一个具体的实施方式，所述病症选自下组：2I型肢带型肌营养不良症(LGMD2I)、1C型先天性肌营养不良症(MDC1C)、沃克-沃堡(Walker-Warburg)综合征(WWS)和肌肉性眼脑(Muscle-Eye-Brain)疾病(MEB)，优选是LGMD2I。

可以从本发明的组合物中受益的受试者包括所有被诊断出患有这种疾病或具有患这种疾病的风险的患者。然后可以通过本领域技术人员已知的任何方法，基于FKRP基因中突变或缺失的鉴定，选择待治疗的受试者，包括例如对FKRP基因进行测序，和/或通过本领域技术人员已知的任何方法对FKRP的表达或活性水平进行评估。因此，所述受试者包括已经表现出这种疾病症状的受试者和处于发展所述疾病的风险中的受试者。在一个实施方式中，所述受试者包括已经表现出这种疾病症状的受试者。在另一个实施方式中，所述受试者是非卧床患者和早期卧床患者。

这些组合物主要用于基因治疗，特别是用于治疗：2I型肢带型肌营养不良症(LGMD2I)、1C型先天性肌营养不良症(MDC1C)、沃克-沃堡(Walker-Warburg)综合征(WWS)和肌肉性眼脑(Muscle-Eye-Brain)疾病(MEB)，优选是LGMD2I。

根据一个实施方式，本发明涉及一种治疗抗肌萎缩相关糖蛋白病的方法，其包括向受试者施用如上所述的基因治疗产品(多核苷酸、载体或细胞)。

优选地，所述抗肌萎缩相关糖蛋白病是与α-抗肌萎缩相关糖蛋白(αDG)的异常糖基化和/或FKRP缺乏相关的病症。更加优选地，所述病症是2I型肢带型肌营养不良症(LGMD2I)、1C型先天性肌营养不良症(MDC1C)、沃克-沃堡(Walker-Warburg)综合征(WWS)和肌肉性眼脑(Muscle-Eye-Brain)疾病(MEB)。

在另一方面，本发明提供了增加细胞中α-抗肌萎缩相关糖蛋白(αDG)的糖基化的方法，其包括将本发明的多核苷酸或载体递送至所述细胞，其中合成的多核苷酸在所述细胞中表达，从而产生FKRP，并且增加αDG的糖基化。

除非另有说明，本发明的实践将采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术，这些技术在本领域的技术范围内。此类技术文献中有充分的解释，例如《分子克隆：实验室手册》，第四版(Sambrook,2012)；《寡核苷酸合成》(Gait,1984)；《动物细胞的培养》(Freshney,2010)；《酶学方法》《实验免疫学手册》(Weir,1997)；《哺乳动物细胞的基因转移载体》(Miller and Calos,1987)；《分子生物学的简短实验步骤》(Ausubel,2002)；《聚合酶链反应：原理、应用和故障排除》，(Babar,2011)；《当前的免疫学方案》(Coligan,2002)。这些技术适用于本发明的多核苷酸和多肽的产生，并且因此可以在进行和实施本发明时考虑。在以下部分中将讨论用于特定实施方式的特定有用的技术。

本文引用的每个专利、专利申请和出版物的公开内容通过引用整体并入本文。

无需进一步的描述，相信本领域的普通技术人员可以使用以上的描述和以下的示例性实施例来制备和使用本发明的化合物并实践所要求保护的方法。

实验实施例

参考以下实验实施例和附图进一步详细描述本发明。这些实施例的提供仅出于说明的目的，并不旨在进行限制。

图1：本研究中所用质粒的方案：

A/pAAV-hDesmin(结蛋白)-hFKRPwt(野生型)

B/pAAV-hDesmin-hFKRP-OPTmin

C/pAAV-hDesmin-hFKRP-OPTcomp

图2：以2种不同的剂量(3E9 vg/TA和1.5E10 vg/TA)向C57BI6小鼠注射或不注射(PBS)AAV9，所述AAV9中包含包含不同形式的人FKRP(hFKRP)转基因：hFKRP-wt(编码序列SEQ ID NO：2)、hFKRP-OPTmin(编码序列SEQ ID NO：3)和hFKRP-OPTcomp(编码序列SEQ IDNO：4)：

A/通过蛋白质印迹对FKRP的表达的评估

B/用GADPH归一化后FKRP蛋白的定量

C/用GADPH归一化后FKRP蛋白的定量：剂量为3E9 vg/TA的FKRP wt(SEQ ID NO：2)、FKRP-OPTcomp(SEQ ID NO：4)、FKRP-06(SEQ ID NO：20)、FKRP-OPT-07(SEQ ID NO：5)、FKRP-OPT-08(SEQ ID NO：6)、FKRP-OPT-10(SEQ ID NO：7)和FKRP-OPT-11(SEQ ID NO：8)。

图3：以2种不同剂量(3E9 vg/TA和1.5E10 vg/TA)施用于HSA-FKRPdel小鼠(FKRP缺陷型小鼠模型)后，FKRP-OPTcomp(SEQ ID NO：4)的体内评估：

A/TA肌肉中的离心指数

B/原位TA的力

C/逃生测试的结果。

材料和方法：

新型人FKRP序列的设计：

人FKRP编码序列SEQ ID NO：2已根据以下规则进行了修饰：

-引入抑制存在于编码区的正义和反义移码ATG的突变，所述突变位于第429位(反义；相+1)、第546位(正义；相+1)、第819位(反义；相+1)和/或第1431位(反义；相+1)；

-可能遵循密码子频率表，例如Sharp等(1988)中公开的内容；

-没有生成新的开放阅读框(ORF)；

-可能取代CG基序，以避免CpG结构的形成；

-可能降低GC％；

-可能修饰存在于SEQ ID NO：2的第553-559位的茎环。

所有产生的设计序列(下表1中所示的SEQ ID NO：3至8)编码具有序列SEQ ID NO：1的FKRP蛋白，其对应于人天然FKRP序列。

质粒和AAV载体：

人Fkrp基因的编码序列(SEQ ID NO：2)使用经典的基因合成方法合成，并插入包含AAV2 ITR、人结蛋白启动子、HBB2内含子、之后为Kozak序列和HBB2 polyA(血红蛋白亚基β2多腺苷酸化信号)的质粒(pUC57)中。

所得到的质粒如图1A所示，称为pAAV-hDesmin-hFKRPwt。包含ITR序列的插入序列示于SEQ ID NO：9。

质粒pAAV-hDesmin-hFKRP-OPTmin(图1B)和pAAV-hDesmin-hFKRP-OPTcomp(图1C)的插入序列分别示于SEQ ID NO：10和11，通过分别将修饰的序列SEQ ID NO：3和4替换天然人FKRP蛋白的编码序列(SEQ ID NO：2)而获得。通过分别将SEQ ID NO：2替换为SEQ ID NO：20、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7和SEQ ID NO：8，以类似的方式获得了其他质粒FKRP-06、FKRP-OPT-07、FKRP-OPT-08、FKRP-OPT-10和FKRP-OPT-11。

通过使用如前所述的三种质粒转染方案(Bartoli等，2006)，通过将AAV2-ITR重组基因组包装在AAV9衣壳中来产生无腺病毒的rAAV2/9病毒制剂。简而言之，将HEK293细胞与pAAV-hDesmin-hFKRPwt(或pAAV-hDesmin-hFKRP-OPTmin或pAAV-hDesmin-hFKRP-OPTcomp)、RepCap质粒(pAAV2.9，J.Wilson博士，UPenn)和腺病毒辅助质粒(pXX6；Apparailly等，2005)以1：1：2的比例共转染。转染后60小时收获粗病毒裂解液，并通过冻融循环裂解。通过两轮CsCl超速离心然后透析来纯化病毒裂解物。使用与AAV载体基因组的HBB2 polyA相对应的引物和探针，通过TaqMan实时PCR分析定量病毒基因组。用于扩增的引物对和TaqMan探针为：

正向：CCAGGCGAGGAGAAACCA(SEQ ID NO：17)

反向：CTTGACTCCACTCAGTTCTCTTGCT(SEQ ID NO：18)；和

探针：CTCGCCGTAAAACATGGAAGGAACACTTC(SEQ ID NO：19)。

蛋白质印迹

细胞沉淀和肌肉组织在RIPA裂解缓冲液(赛默飞世尔科技，沃尔瑟姆，马萨诸塞州，美国)中进行机械均质处理，并补充以完全不含EDTA的蛋白酶抑制剂混合物(罗氏，巴塞尔，瑞士)。样品中所含的核酸通过在37℃下与苯甲酰酶(西格玛，圣路易斯,密苏里州,美国)一起温育15分钟来降解。

使用预制聚丙烯酰胺凝胶(4-15％，BioRad，赫拉克勒斯，加利福尼亚州，美国)分离蛋白质，然后将其转移至硝酸纤维素膜上。

先前已经描述了针对FKRP的兔多克隆抗体(Gicquel等，2017)。在室温下，用抗FKRP(1：100)和GAPDH抗体(圣克鲁斯生物技术，达拉斯，德克萨斯州，美国，1：200)孵育硝酸纤维素膜2小时，以便归一化。

最后，将膜与孵育，以通过Odyssey红外扫描仪(LI-COR生物科学，林肯，内布拉斯加州，美国)进行检测。

动物和注射剂

使用一个月大的小鼠。这项研究中的所有动物均按照欧洲有关人类护理和实验动物使用的准则进行处理，并且所有有关动物的程序均已获得热那波尔伦理委员会(Genopole’s ethics committee)的批准。

为了评估基因转移效率，将雄性C57B16小鼠的TA(胫骨前肌)中肌肉内注射25μL的两种剂量：3E9 vg/TA和1.5E10 vg/TA。作为阴性对照，给小鼠注射用于AAV制剂的缓冲液，即PBS。1个月后对小鼠实施安乐死，解剖注射的肌肉，并在液氮中冷却的异戊烷中冷冻。

对于体内功能测试，将包含FKRP-OPTcomp序列(SEQ ID NO：4)的AAV9-FKRP通过静脉注射给予HSA-FKRPdel小鼠(FKRP缺陷型小鼠模型)，两种剂量：2.5E12 vg/kg和1E13 vg/kg。3个月后，将动物进行不同的功能测试。

体内评估

逃生测试：

通过逃避测试评估小鼠的整体力量(Carlson和Makiejus，1990)。简而言之，将小鼠放在面对30厘米长管入口的平台上。将缠绕在尾巴上的袖带连接到固定的力传感器，通过轻轻地捏住尾巴，诱使小鼠沿着与力传感器相反的方向从管内逃出。向前飞行会产生一个短的力峰，并分析通过体重归一化的五个最高力峰的平均值。

所用材料：

力传感器ADInstrument MLT1030系列810。

软件ADinstrument Labchart7。

原位TA的力：

如前所述(Vignaud等，2005)，通过原位测量肌肉收缩来评估骨骼肌功能。通过腹膜内注射氯胺酮(100mg/kg)和甲苯噻嗪(10mg/kg)麻醉动物，并根据需要给予补充剂量以维持深度麻醉。膝盖和脚用夹子和不锈钢销钉固定。暴露出TA肌肉，切断远端肌腱并连接至力传感器(欧若拉科学，都柏林，爱尔兰)。使用0.1ms持续时间的超最大方波脉冲，用双极银电极将坐骨神经压向近端并向远端刺激。绝对最大力是在最佳长度(观察到最大强直张力的长度)下测定的。通过用肌肉质量归一化总肌肉力来计算比最大力。

所用材料：

欧若拉科学的仪器。

传感器305C 5N剑桥技术模型6650n°X11271243Y。

软件ASI 610A动态肌肉控制。

离心参数：

功能测试后不久将注射的小鼠处死。取样骨骼肌并在冷却的异戊烷中冷冻。横向冰冻切片用苏木精-福乐辛-藏红花(HPS)染色，并用于核化纤维计数。将角核化纤维的数量与切片面积相结合，以获得角核化指数。

结果：

I/新型人FKRP序列的设计：

为了评估修饰对FKRP编码序列的影响，设计合成了源自序列SEQ ID NO：2的编码人FKRP蛋白序列SEQ ID NO：1的一系列序列。所述序列的主要特征总结于表1中：

/>

表1：编码人FKRP蛋白的修饰序列的特征

II/对体内构建物的评估：

图2A显示了通过蛋白质印迹获得的基因转移后FKRP表达的结果。由不同构建物(野生型wt和优化的)表达的FKRP蛋白具有预期的大小(58kDa)。而且，与野生型序列相比，修饰的FKRP转基因使得FKRP蛋白的表达更高。所获得的条带的强度通过GAPDH归一进行量化和归一化。定量结果表明与FKRP wt相比，hFKRP-OPTcomp增加了5倍(图2B)。

使用表1所示的不同FKRP序列重复相同的实验，包括WO2016/138387中公开的序列(在所述文件中是SEQ ID NO：1；在本申请中是SEQ ID NO：20)。如图2C所示，WO2016/138387(标记为FKRP-06)中公开的序列不能达到用本发明所述的构建物所观察到的转基因表达水平。在新测试的序列中，FKRP-08是最佳的候选序列，但它们通常导致转基因表达水平高于天然序列。

III/构建物的功能评价：

已在FKRP缺陷型小鼠模型中测试了最佳候选序列，即FKRP-OPTcomp(SEQ ID NO：4)的体内效果。

图3A的数据揭示了在治疗的动物的中心成核减少。此外，胫前肌(TA)的力量(图3B)和通过逃避测试评估的整体力量(图3C)的原位测量值显示，治疗后的动物中肌肉功能有所改善。

结论：

本研究表明，在小鼠中肌肉内注射含有所述转基因的AAV载体后，人FKRP转基因的序列优化使得FKRP表达水平提高。这种增加具有治疗和临床意义，因为它改善了治疗的功效和/或能够减少治疗产品的注射剂量。

参考文献

Apparailly,F.,Khoury,M.,Vervoordeldonk,M.J.,Adriaansen,J.,Gicquel,E.,Perez,N.,Riviere,C.,Louis-Plence,P.,Noel,D.,Danos,O.等(2005)腺相关病毒假5型载体促进关节炎基因转移.Hum.Gene Ther.,16,426-434.

Bartoli,M.,Poupiot,J.,Goyenvalle,A.,Perez,N.,Garcia,L.,Danos,O.和Richard,I.(2006)肌营养不良动物模型治疗性基因转移的无创监测.Gene Ther.,13,20-28.

Beedle,A.M.,Turner,A.J.,Saito,Y.,Lueck,J.D.,Foltz,S.J.,Fortunato,M.J.,Nienaber,P.M.和Campbell,K.P.(2012)小鼠福库汀(fukutin)缺失对肌营养不良的影响.J.Clin.Invest.,122,3330-3342.

Beltran-Valero de Bernabe,D.,Voit,T.,Longman,C.,Steinbrecher,A.,Straub,V.,Yuva,Y.,Herrmann,R.,Sperner,J.,Korenke,C.,Diesen,C.等(2004)FKRP基因突变可引起肌肉性眼脑疾病和沃克-沃堡(Walker-Warburg)综合征.J.Med.Genet.,41,e61.

Breton,C.和Imberty,A.(1999)糖基转移酶的结构与功能研究.Curr.Opin.Struct.Biol.,9,563-571.

Brockington,M.,Blake,D.J.,Prandini,P.,Brown,S.C.,Torelli,S.,Benson,M.A.,Ponting,C.P.,Estournet,B.,Romero,N.B.,Mercuri,E.等(2001)福库汀相关蛋白基因(FKRP)突变导致一种先天性肌营养不良，其继发层粘连蛋白α2缺乏并且α-抗肌萎缩相关糖蛋白的糖基化异常.Am.J.Hum.Genet.,69,1198-1209.

Gicquel等(2017)Hum Mol Genet,doi:10.1093/hmg/ddx066.

Kanagawa,M.,Kobayashi,K.,Tajiri,M.,Manya,H.,Kuga,A.,Yamaguchi,Y.,Akasaka-Manya,K.,Furukawa,J.I.,Mizuno,M.,Kawakami,H.等(2016)磷酸核糖醇翻译后修饰在肌营养不良中的鉴定及其缺陷.Cell reports,印刷中.

Mercuri,E.,Brockington,M.,Straub,V.,Quijano-Roy,S.,Yuva,Y.,Herrmann,R.,Brown,S.C.,Torelli,S.,Dubowitz,V.,Blake,D.J.等(2003)与福库汀相关蛋白基因突变相关的表型谱.Ann.Neurol.,53,537-542.

Muller,T.,Krasnianski,M.,Witthaut,R.,Deschauer,M.和Zierz,S.(2005)扩张型心肌病可能是C826A福库汀相关蛋白突变的早期迹象.Neuromuscul.Disord.,15,372-376.

Rohr,U.P.,Wulf,M.A.,Stahn,S.,Steidl,U.,Haas,R.和Kronenwett,R.(2002)使用定量实时PCR快速可靠地滴定重组2型腺相关病毒.J.Virol.Methods,106,81-88.

Sharp,P.M.,Cowe E.,Higgins D.G.,Shields D.C,Wolfe K.H,Wright F(1988)大肠杆菌、枯草芽孢杆菌、酿酒酵母、粟酒裂殖酵母、黑腹果蝇和智人的密码子使用方式；大量物种内多样性的综述.Nucleic Acids Res.,16(17):8207-11.

Sveen,M.L.,Schwartz,M.和Vissing,J.(2006)丹麦2I型肢带型肌营养不良症的高患病率和表型基因型相关性.Ann.Neurol.,59,808-815.

Toromanoff等(2008),Molecular Therapy 16(7):1291-99.

Wahbi,K.,Meune,C.,Hamouda el,H.,Stojkovic,T.,Laforet,P.,Becane,H.M.,Eymard,B.和Duboc,D.(2008)2I型肢带型肌营养不良症患者的心脏评估：超声检查、动态心电图和磁共振成像研究.Neuromuscul.Disord.,18,650-655.

Zheng Fan等(2012),Molecular Therapy 20(2),456-461.

序列表

<110> 吉尼松公司

埃夫里-瓦尔德艾松大学

国家健康和医学研究院(INSERM)

<120> 编码人类FKRP蛋白的新型多核苷酸

<130> G143-B-49229 PCT

<150> EP17305894.2

<151> 2017-07-07

<160> 21

<170> SIPOSequenceListing 1.0

<210> 1

<211> 495

<212> PRT

<213> 智人(Homo sapiens)

<400> 1

Met Arg Leu Thr Arg Cys Gln Ala Ala Leu Ala Ala Ala Ile Thr Leu

1 5 10 15

Asn Leu Leu Val Leu Phe Tyr Val Ser Trp Leu Gln His Gln Pro Arg

20 25 30

Asn Ser Arg Ala Arg Gly Pro Arg Arg Ala Ser Ala Ala Gly Pro Arg

35 40 45

Val Thr Val Leu Val Arg Glu Phe Glu Ala Phe Asp Asn Ala Val Pro

50 55 60

Glu Leu Val Asp Ser Phe Leu Gln Gln Asp Pro Ala Gln Pro Val Val

65 70 75 80

Val Ala Ala Asp Thr Leu Pro Tyr Pro Pro Leu Ala Leu Pro Arg Ile

85 90 95

Pro Asn Val Arg Leu Ala Leu Leu Gln Pro Ala Leu Asp Arg Pro Ala

100 105 110

Ala Ala Ser Arg Pro Glu Thr Tyr Val Ala Thr Glu Phe Val Ala Leu

115 120 125

Val Pro Asp Gly Ala Arg Ala Glu Ala Pro Gly Leu Leu Glu Arg Met

130 135 140

Val Glu Ala Leu Arg Ala Gly Ser Ala Arg Leu Val Ala Ala Pro Val

145 150 155 160

Ala Thr Ala Asn Pro Ala Arg Cys Leu Ala Leu Asn Val Ser Leu Arg

165 170 175

Glu Trp Thr Ala Arg Tyr Gly Ala Ala Pro Ala Ala Pro Arg Cys Asp

180 185 190

Ala Leu Asp Gly Asp Ala Val Val Leu Leu Arg Ala Arg Asp Leu Phe

195 200 205

Asn Leu Ser Ala Pro Leu Ala Arg Pro Val Gly Thr Ser Leu Phe Leu

210 215 220

Gln Thr Ala Leu Arg Gly Trp Ala Val Gln Leu Leu Asp Leu Thr Phe

225 230 235 240

Ala Ala Ala Arg Gln Pro Pro Leu Ala Thr Ala His Ala Arg Trp Lys

245 250 255

Ala Glu Arg Glu Gly Arg Ala Arg Arg Ala Ala Leu Leu Arg Ala Leu

260 265 270

Gly Ile Arg Leu Val Ser Trp Glu Gly Gly Arg Leu Glu Trp Phe Gly

275 280 285

Cys Asn Lys Glu Thr Thr Arg Cys Phe Gly Thr Val Val Gly Asp Thr

290 295 300

Pro Ala Tyr Leu Tyr Glu Glu Arg Trp Thr Pro Pro Cys Cys Leu Arg

305 310 315 320

Ala Leu Arg Glu Thr Ala Arg Tyr Val Val Gly Val Leu Glu Ala Ala

325 330 335

Gly Val Arg Tyr Trp Leu Glu Gly Gly Ser Leu Leu Gly Ala Ala Arg

340 345 350

His Gly Asp Ile Ile Pro Trp Asp Tyr Asp Val Asp Leu Gly Ile Tyr

355 360 365

Leu Glu Asp Val Gly Asn Cys Glu Gln Leu Arg Gly Ala Glu Ala Gly

370 375 380

Ser Val Val Asp Glu Arg Gly Phe Val Trp Glu Lys Ala Val Glu Gly

385 390 395 400

Asp Phe Phe Arg Val Gln Tyr Ser Glu Ser Asn His Leu His Val Asp

405 410 415

Leu Trp Pro Phe Tyr Pro Arg Asn Gly Val Met Thr Lys Asp Thr Trp

420 425 430

Leu Asp His Arg Gln Asp Val Glu Phe Pro Glu His Phe Leu Gln Pro

435 440 445

Leu Val Pro Leu Pro Phe Ala Gly Phe Val Ala Gln Ala Pro Asn Asn

450 455 460

Tyr Arg Arg Phe Leu Glu Leu Lys Phe Gly Pro Gly Val Ile Glu Asn

465 470 475 480

Pro Gln Tyr Pro Asn Pro Ala Leu Leu Ser Leu Thr Gly Ser Gly

485 490 495

<210> 2

<211> 1488

<212> DNA

<213> 智人(Homo sapiens)

<400> 2

atgcggctca cccgctgcca ggctgccctg gcggccgcca tcaccctcaa ccttctggtc 60

ctcttctatg tctcgtggct gcagcaccag cctaggaatt cccgggcccg ggggccccgt 120

cgtgcctctg ctgccggccc ccgtgtcacc gtcctggtgc gggagttcga ggcatttgac 180

aacgcggtgc ccgagctggt agactccttc ctgcagcaag acccagccca gcccgtggtg 240

gtggcagccg acacgctccc ctacccgccc ctggccctgc cccgcatccc caacgtgcgt 300

ctggcgctgc tccagcccgc cctggaccgg ccagccgcag cctcgcgccc ggagacctac 360

gtggccaccg agtttgtggc cctagtacct gatggggcgc gggctgaggc acctggcctg 420

ctggagcgca tggtggaggc gctccgcgca ggaagcgcac gtctggtggc cgccccggtt 480

gccacggcca accctgccag gtgcctggcc ctgaacgtca gcctgcgaga gtggaccgcc 540

cgctatggcg cagcccccgc cgcgccccgc tgcgacgccc tggacggaga tgctgtggtg 600

ctcctgcgcg cccgcgacct cttcaacctc tcggcgcccc tggcccggcc ggtgggcacc 660

agcctctttc tgcagaccgc ccttcgcggc tgggcggtgc agctgctgga cttgaccttc 720

gccgcggcgc gccagccccc gctggccacg gcccacgcgc gctggaaggc tgagcgcgag 780

ggacgcgctc ggcgggcggc gctgctccgc gcgctgggca tccgcctagt gagctgggaa 840

ggcgggcggc tggagtggtt cggctgcaac aaggagacca cgcgctgctt cggaaccgtg 900

gtgggcgaca cgcccgccta cctctacgag gagcgctgga cgcccccctg ctgcctgcgc 960

gcgctgcgcg agaccgcccg ctatgtggtg ggcgtgctgg aggctgcggg cgtgcgctac 1020

tggctcgagg gcggctcact gctgggggcc gcccgccacg gggacatcat cccatgggac 1080

tacgacgtgg acctgggcat ctacttggag gacgtgggca actgcgagca gctgcggggg 1140

gcagaggccg gctcggtggt ggatgagcgc ggcttcgtat gggagaaggc ggtcgagggc 1200

gactttttcc gcgtgcagta cagcgaaagc aaccacttgc acgtggacct gtggcccttc 1260

tacccccgca atggcgtcat gaccaaggac acgtggctgg accaccggca ggatgtggag 1320

tttcccgagc acttcctgca gccgctggtg cccctgccct ttgccggctt cgtggcgcag 1380

gcgcctaaca actaccgccg cttcctggag ctcaagttcg ggcccggggt catcgagaac 1440

ccccagtacc ccaacccggc actgctgagt ctgacgggaa gcggctga 1488

<210> 3

<211> 1488

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

atgcggctca cccgctgcca ggctgccctg gcggccgcca tcaccctcaa ccttctggtc 60

ctcttctatg tctcgtggct gcagcaccag cctaggaatt cccgggcccg ggggccccgt 120

cgtgcctctg ctgccggccc ccgtgtcacc gtcctggtgc gggagttcga ggcatttgac 180

aacgcggtgc ccgagctggt agactccttc ctgcagcaag acccagccca gcccgtggtg 240

gtggcagccg acacgctccc ctacccgccc ctggccctgc cccgcatccc caacgtgcgt 300

ctggcgctgc tccagcccgc cctggaccgg ccagccgcag cctcgcgccc ggagacctac 360

gtggccaccg agtttgtggc cctagtacct gatggggcgc gggctgaggc acctggcctg 420

ctggagcgga tggtggaggc gctccgcgca ggaagcgcac gtctggtggc cgccccggtt 480

gccacggcca accctgccag gtgcctggcc ctgaacgtca gcctgcgaga gtggaccgcc 540

cgctacggcg cagcccccgc cgcgccccgc tgcgacgccc tggacggaga tgctgtggtg 600

ctcctgcgcg cccgcgacct cttcaacctc tcggcgcccc tggcccggcc ggtgggcacc 660

agcctctttc tgcagaccgc ccttcgcggc tgggcggtgc agctgctgga cttgaccttc 720

gccgcggcgc gccagccccc gctggccacg gcccacgcgc gctggaaggc tgagcgcgag 780

ggacgcgctc ggcgggcggc gctgctccgc gcgctgggaa tccgcctagt gagctgggaa 840

ggcgggcggc tggagtggtt cggctgcaac aaggagacca cgcgctgctt cggaaccgtg 900

gtgggcgaca cgcccgccta cctctacgag gagcgctgga cgcccccctg ctgcctgcgc 960

gcgctgcgcg agaccgcccg ctatgtggtg ggcgtgctgg aggctgcggg cgtgcgctac 1020

tggctcgagg gcggctcact gctgggggcc gcccgccacg gggacatcat cccatgggac 1080

tacgacgtgg acctgggcat ctacttggag gacgtgggca actgcgagca gctgcggggg 1140

gcagaggccg gctcggtggt ggatgagcgc ggcttcgtat gggagaaggc ggtcgagggc 1200

gactttttcc gcgtgcagta cagcgaaagc aaccacttgc acgtggacct gtggcccttc 1260

tacccccgca atggcgtcat gaccaaggac acgtggctgg accaccggca ggatgtggag 1320

tttcccgagc acttcctgca gccgctggtg cccctgccct ttgccggctt cgtggcgcag 1380

gcgcctaaca actaccgccg cttcctggag ctcaagttcg ggcccggggt gatcgagaac 1440

ccccagtacc ccaacccggc actgctgagt ctgacgggaa gcggctga 1488

<210> 4

<211> 1488

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atgagactga ccaggtgcca ggctgccctg gctgctgcca tcaccctgaa cctgctggtg 60

ctgttctatg tgagctggct gcagcaccag cccaggaaca gcagggccag gggccccagg 120

agggcctctg ctgctggccc cagggtgaca gtgctggtga gggagtttga ggcctttgac 180

aatgctgtgc ctgagctggt ggacagcttc ctgcagcagg accctgccca gcctgtggtg 240

gtggctgctg ataccctgcc ctaccccccc ctggccctgc ccaggatccc caatgtgagg 300

ctggccctgc tgcagcctgc cctggacagg cctgctgctg ccagcaggcc tgagacctat 360

gtggccacag agtttgtggc cctggtgcct gatggggcca gggctgaggc ccctggcctg 420

ctggagagga tggtggaggc cctgagggct ggctctgcca ggctggtggc tgcccctgtg 480

gccacagcca accctgccag gtgcctggcc ctgaatgtga gcctgagaga gtggacagcc 540

aggtatgggg ctgcccctgc tgcccccagg tgtgatgccc tggatggaga tgctgtggtg 600

ctgctgaggg ccagggacct gttcaacctg tctgcccccc tggccaggcc tgtggggacc 660

agcctgtttc tgcagacagc cctgaggggc tgggctgtgc agctgctgga cctgaccttt 720

gctgctgcca ggcagccccc cctggctaca gcccacgcca ggtggaaggc tgagagggag 780

ggcagggcca ggagggctgc cctgctgagg gccctgggga tcaggctggt gagctgggag 840

gggggcaggc tggagtggtt tggctgcaac aaggagacaa ccaggtgctt tgggacagtg 900

gtgggggata cccctgccta cctgtatgag gagaggtgga cccccccctg ctgcctgagg 960

gccctgaggg agacagccag gtatgtggtg ggggtgctgg aggctgctgg ggtgaggtac 1020

tggctggagg ggggcagcct gctgggggct gccaggcacg gggacattat cccctgggac 1080

tatgatgtgg acctgggcat ctacctggag gatgtgggca actgtgagca gctgaggggg 1140

gctgaggctg gctctgtggt ggatgagagg ggctttgtgt gggagaaggc tgtggagggg 1200

gactttttca gggtgcagta ctctgagagc aaccacctgc acgtggacct gtggcccttc 1260

taccccagga atggggtgat gaccaaggac acctggctgg accacaggca ggatgtggag 1320

ttccctgagc acttcctgca gcccctggtg cccctgccct ttgctggctt tgtggcccag 1380

gcccccaaca actacaggag gttcctggag ctgaagtttg gccctggggt gattgagaac 1440

ccccagtacc ccaaccctgc cctgctgagc ctgacaggct ctggctga 1488

<210> 5

<211> 1488

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atgcggctca cccgctgcca ggctgccctg gctgccgcca tcaccctcaa ccttctggtc 60

ctcttctatg tcagctggct gcagcaccag cctaggaatt cccgggcccg ggggcccagg 120

agggcctctg ctgccggccc cagggtcacc gtcctggtgc gggagttcga ggcatttgac 180

aacgctgtgc ccgagctggt agactccttc ctgcagcaag acccagccca gcccgtggtg 240

gtggcagccg acaccctccc ctaccccccc ctggccctgc cccgcatccc caacgtgagg 300

ctggccctgc tccagcccgc cctggaccgg ccagccgcag ccagccgccc tgagacctac 360

gtggccaccg agtttgtggc cctggtacct gatggggccc gggctgaggc acctggcctg 420

ctggagcgga tggtggaggc cctccgcgca ggaagcgcaa ggctggtggc cgcccctgtt 480

gccacagcca accctgccag gtgcctggcc ctgaacgtca gcctgcgaga gtggaccgcc 540

cgctacggcg cagcccccgc cgccccccgc tgcgacgccc tggacggaga tgctgtggtg 600

ctcctgcgcg cccgcgacct cttcaacctc tctgcccccc tggcccggcc tgtgggcacc 660

agcctctttc tgcagaccgc ccttcgcggc tgggctgtgc agctgctgga cttgaccttc 720

gccgctgccc gccagccccc cctggccaca gcccacgccc gctggaaggc tgagcgcgag 780

ggacgcgctc ggcgggctgc cctgctccgc gccctgggaa tccgcctggt gagctgggaa 840

ggcgggcggc tggagtggtt cggctgcaac aaggagacca cccgctgctt cggaaccgtg 900

gtgggcgaca cccccgccta cctctacgag gagcgctgga cccccccctg ctgcctgcgc 960

gccctgcgcg agaccgcccg ctatgtggtg ggcgtgctgg aggctgctgg cgtgcgctac 1020

tggctcgagg gcggctcact gctgggggcc gcccgccacg gggacatcat cccatgggac 1080

tacgacgtgg acctgggcat ctacttggag gacgtgggca actgcgagca gctgcggggg 1140

gcagaggccg gctctgtggt ggatgagcgc ggcttcgtat gggagaaggc tgtcgagggc 1200

gactttttcc gcgtgcagta cagcgaaagc aaccacttgc acgtggacct gtggcccttc 1260

tacccccgca atggcgtcat gaccaaggac acctggctgg accaccggca ggatgtggag 1320

tttcccgagc acttcctgca gcccctggtg cccctgccct ttgccggctt cgtggcccag 1380

gcccctaaca actaccgccg cttcctggag ctcaagttcg ggcccggggt gatcgagaac 1440

ccccagtacc ccaaccctgc actgctgagt ctgaccggaa gcggctga 1488

<210> 6

<211> 1488

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

atgcggctca cccgctgcca ggctgccctg gctgctgcca tcaccctcaa ccttctggtc 60

ctcttctatg tcagctggct gcagcaccag cctaggaatt cccgggcccg ggggcccagg 120

agggcctctg ctgctggccc cagggtcacc gtcctggtgc gggagttcga ggcatttgac 180

aacgctgtgc ccgagctggt agactccttc ctgcagcaag acccagccca gcccgtggtg 240

gtggcagctg acaccctccc ctaccccccc ctggccctgc cccgcatccc caacgtgagg 300

ctggccctgc tccagcccgc cctggaccgg ccagctgcag ccagccgccc tgagacctac 360

gtggccaccg agtttgtggc cctggtacct gatggggccc gggctgaggc acctggcctg 420

ctggagcgga tggtggaggc cctcagggca ggaagcgcaa ggctggtggc tgcccctgtt 480

gccacagcca accctgccag gtgcctggcc ctgaacgtca gcctgcgaga gtggaccgcc 540

cgctacgggg cagcccccgc tgccccccgc tgcgacgccc tggacggaga tgctgtggtg 600

ctcctgaggg ccagggacct cttcaacctc tctgcccccc tggcccggcc tgtgggcacc 660

agcctctttc tgcagaccgc ccttaggggc tgggctgtgc agctgctgga cttgaccttc 720

gctgctgccc gccagccccc cctggccaca gcccacgccc gctggaaggc tgagagggag 780

ggaagggctc ggcgggctgc cctgctcagg gccctgggaa tccgcctggt gagctgggaa 840

ggggggcggc tggagtggtt cggctgcaac aaggagacca cccgctgctt cggaaccgtg 900

gtgggggaca cccccgccta cctctacgag gagcgctgga cccccccctg ctgcctgagg 960

gccctgaggg agaccgcccg ctatgtggtg ggggtgctgg aggctgctgg ggtgcgctac 1020

tggctcgagg ggggctcact gctgggggct gcccgccacg gggacatcat cccatgggac 1080

tacgacgtgg acctgggcat ctacttggag gacgtgggca actgcgagca gctgcggggg 1140

gcagaggctg gctctgtggt ggatgagagg ggcttcgtat gggagaaggc tgtggagggg 1200

gactttttca gggtgcagta cagcgaaagc aaccacttgc acgtggacct gtggcccttc 1260

tacccccgca atggggtcat gaccaaggac acctggctgg accaccggca ggatgtggag 1320

tttcccgagc acttcctgca gcccctggtg cccctgccct ttgctggctt cgtggcccag 1380

gcccctaaca actaccgccg cttcctggag ctcaagttcg ggcccggggt gatcgagaac 1440

ccccagtacc ccaaccctgc actgctgagt ctgaccggaa gcggctga 1488

<210> 7

<211> 1488

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

atgagactga caaggtgcca ggctgccctg gctgctgcca tcacactgaa cctgctggtg 60

ctgttttatg tgagctggct gcagcaccag cctaggaaca gcagggccag gggccctagg 120

agggcctctg ctgctggccc tagggtgaca gtgctggtga gggagtttga ggcctttgac 180

aatgctgtgc ctgagctggt ggacagcttt ctgcagcagg accctgccca gcctgtggtg 240

gtggctgctg atacactgcc ttaccctcct ctggccctgc ctaggatccc taatgtgagg 300

ctggccctgc tgcagcctgc cctggacagg cctgctgctg ccagcaggcc tgagacttat 360

gtggccacag agtttgtggc cctggtgcct gatggggcca gggctgaggc ccctggcctg 420

ctggagagga tggtggaggc cctgagggct ggctctgcca ggctggtggc tgcccctgtg 480

gccacagcca accctgccag gtgcctggcc ctgaatgtga gcctgagaga gtggacagcc 540

aggtatgggg ctgcccctgc tgcccctagg tgtgatgccc tggatggaga tgctgtggtg 600

ctgctgaggg ccagggacct gtttaacctg tctgcccctc tggccaggcc tgtggggaca 660

agcctgtttc tgcagacagc cctgaggggc tgggctgtgc agctgctgga cctgacattt 720

gctgctgcca ggcagcctcc tctggctaca gcccacgcca ggtggaaggc tgagagggag 780

ggcagggcca ggagggctgc cctgctgagg gccctgggga tcaggctggt gagctgggag 840

gggggcaggc tggagtggtt tggctgcaac aaggagacaa caaggtgctt tgggacagtg 900

gtgggggata cacctgccta cctgtatgag gagaggtgga cacctccttg ctgcctgagg 960

gccctgaggg agacagccag gtatgtggtg ggggtgctgg aggctgctgg ggtgaggtac 1020

tggctggagg ggggcagcct gctgggggct gccaggcacg gggacattat cccttgggac 1080

tatgatgtgg acctgggcat ctacctggag gatgtgggca actgtgagca gctgaggggg 1140

gctgaggctg gctctgtggt ggatgagagg ggctttgtgt gggagaaggc tgtggagggg 1200

gactttttta gggtgcagta ctctgagagc aaccacctgc acgtggacct gtggcctttt 1260

taccctagga atggggtgat gacaaaggac acatggctgg accacaggca ggatgtggag 1320

tttcctgagc actttctgca gcctctggtg cctctgcctt ttgctggctt tgtggcccag 1380

gcccctaaca actacaggag gtttctggag ctgaagtttg gccctggggt gattgagaac 1440

cctcagtacc ctaaccctgc cctgctgagc ctgacaggct ctggctga 1488

<210> 8

<211> 1488

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

atgagactga caaggtgcca ggctgccctg gctgctgcca tcacactgaa cctgctggtg 60

ctgttttatg tgagctggct gcagcaccag cctagaaaca gcagagccag aggccctaga 120

agagcctctg ctgctggccc tagagtgaca gtgctggtga gagagtttga ggcctttgac 180

aatgctgtgc ctgagctggt ggacagcttt ctgcagcagg accctgccca gcctgtggtg 240

gtggctgctg atacactgcc ttaccctcct ctggccctgc ctagaatccc taatgtgaga 300

ctggccctgc tgcagcctgc cctggacaga cctgctgctg ccagcagacc tgagacttat 360

gtggccacag agtttgtggc cctggtgcct gatggggcca gagctgaggc ccctggcctg 420

ctggagagaa tggtggaggc cctgagagct ggctctgcca gactggtggc tgcccctgtg 480

gccacagcca accctgccag atgcctggcc ctgaatgtga gcctgagaga gtggacagcc 540

agatatgggg ctgcccctgc tgcccctaga tgtgatgccc tggatggaga tgctgtggtg 600

ctgctgagag ccagagacct gtttaacctg tctgcccctc tggccagacc tgtggggaca 660

agcctgtttc tgcagacagc cctgagaggc tgggctgtgc agctgctgga cctgacattt 720

gctgctgcca gacagcctcc tctggctaca gcccacgcca gatggaaggc tgagagagag 780

ggcagagcca gaagagctgc cctgctgaga gccctgggga tcaggctggt gagctgggag 840

gggggcagac tggagtggtt tggctgcaac aaggagacaa caagatgctt tgggacagtg 900

gtgggggata cacctgccta cctgtatgag gagaggtgga cacctccttg ctgcctgaga 960

gccctgagag agacagccag atatgtggtg ggggtgctgg aggctgctgg ggtgagatac 1020

tggctggagg ggggcagcct gctgggggct gccagacacg gggacattat cccttgggac 1080

tatgatgtgg acctgggcat ctacctggag gatgtgggca actgtgagca gctgagaggg 1140

gctgaggctg gctctgtggt ggatgagaga ggctttgtgt gggagaaggc tgtggagggg 1200

gactttttta gagtgcagta ctctgagagc aaccacctgc acgtggacct gtggcctttt 1260

taccctagaa atggggtgat gacaaaggac acatggctgg accacagaca ggatgtggag 1320

tttcctgagc actttctgca gcctctggtg cctctgcctt ttgctggctt tgtggcccag 1380

gcccctaaca actacagaag atttctggag ctgaagtttg gccctggggt gattgagaac 1440

cctcagtacc ctaaccctgc cctgctgagc ctgacaggct ctggctga 1488

<210> 9

<211> 6903

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt accttaaacc 420

ggttcctaca tatgggttgc gcaatgcggc cgcagtactg cagaaatagg ccgaaatcgg 480

caaaatccct ttattggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 540

accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 600

cagagaggga gtggccaact ccatcactag gggttcctta ccccctgccc cccacagctc 660

ctctcctgtg ccttgtttcc cagccatgcg ttctcctcta taaatacccg ctctggtatt 720

tggggttggc agctgttgct gccagggaga tggttgggtt gacatgcggc tcctgacaaa 780

acacaaaccc ctggtgtgtg tgggcgtggg tggtgtgagt agggggatga atcagggagg 840

gggcggggga cccagggggc aggagccaca caaagtctgt gcgggggtgg gagcgcacat 900

agcaattgga aactgaaagc ttatcagacc ctttctggaa atcagcccac tgtttataaa 960

cttgaggccc caccctcgac agtaccgggg aggaagaggg cctgcactag tccagaggga 1020

aactgaggct cagggctagc tcgcccatag acatacatgg caggcaggct ttggccagga 1080

tccctccgcc tgccaggcgt ctccctgccc tcccttcctg cctagagacc cccaccctca 1140

agcctggctg gtctttgcct gagacccaaa cctcttcgac ttcaagagaa tatttaggaa 1200

caaggtggtt tagggccttt cctgggaaca ggccttgacc ctttaagaaa tgacccaaag 1260

tctctccttg accaaaaagg ggaccctcaa actaaaggga agcctctctt ctgctgtctc 1320

ccctgacccc actccccccc accccaggac gaggagataa ccagggctga aagaggcccg 1380

cctgggggct gcagacatgc ttgctgcctg ccctggcgaa ggattggcag gcttgcccgt 1440

cacaggaccc ccgctggctg actcaggggc gcaggcctct tgcgggggag ctggcctccc 1500

cgcccccacg gccacgggcc gccctttcct ggcaggacag cgggatcttg cagctgtcag 1560

gggaggggag gcgggggctg atgtcaggag ggatacaaat agtgccgacg gctgggggcc 1620

ctgtctcccc tcgccgcatc cactctccgg ccggccgcct gcccgccgcc tcctccgtgc 1680

gcccgccagc ctcgcccgcg tacacatatt gaccaaatca gggtaatttt gcatttgtaa 1740

ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt 1800

ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt 1860

ctaaagaata acagtgataa tttctgggtt aaggcaatag caatatttct gcatataaat 1920

atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa 1980

tccagctacc attctgcttt tattttttgg ttgggataag gctggattat tctgagtcca 2040

agctaggccc ttttgctaat cttgttcata cctcttatct tcctcccaca gctcctgggc 2100

aacgtgctgg tctctgtgct ggcccatcac tttggcaaag aattcgccac catgcggctc 2160

acccgctgcc aggctgccct ggcggccgcc atcaccctca accttctggt cctcttctat 2220

gtctcgtggc tgcagcacca gcctaggaat tcccgggccc gggggccccg tcgtgcctct 2280

gctgccggcc cccgtgtcac cgtcctggtg cgggagttcg aggcatttga caacgcggtg 2340

cccgagctgg tagactcctt cctgcagcaa gacccagccc agcccgtggt ggtggcagcc 2400

gacacgctcc cctacccgcc cctggccctg ccccgcatcc ccaacgtgcg tctggcgctg 2460

ctccagcccg ccctggaccg gccagccgca gcctcgcgcc cggagaccta cgtggccacc 2520

gagtttgtgg ccctagtacc tgatggggcg cgggctgagg cacctggcct gctggagcgc 2580

atggtggagg cgctccgcgc aggaagcgca cgtctggtgg ccgccccggt tgccacggcc 2640

aaccctgcca ggtgcctggc cctgaacgtc agcctgcgag agtggaccgc ccgctatggc 2700

gcagcccccg ccgcgccccg ctgcgacgcc ctggacggag atgctgtggt gctcctgcgc 2760

gcccgcgacc tcttcaacct ctcggcgccc ctggcccggc cggtgggcac cagcctcttt 2820

ctgcagaccg cccttcgcgg ctgggcggtg cagctgctgg acttgacctt cgccgcggcg 2880

cgccagcccc cgctggccac ggcccacgcg cgctggaagg ctgagcgcga gggacgcgct 2940

cggcgggcgg cgctgctccg cgcgctgggc atccgcctag tgagctggga aggcgggcgg 3000

ctggagtggt tcggctgcaa caaggagacc acgcgctgct tcggaaccgt ggtgggcgac 3060

acgcccgcct acctctacga ggagcgctgg acgcccccct gctgcctgcg cgcgctgcgc 3120

gagaccgccc gctatgtggt gggcgtgctg gaggctgcgg gcgtgcgcta ctggctcgag 3180

ggcggctcac tgctgggggc cgcccgccac ggggacatca tcccatggga ctacgacgtg 3240

gacctgggca tctacttgga ggacgtgggc aactgcgagc agctgcgggg ggcagaggcc 3300

ggctcggtgg tggatgagcg cggcttcgta tgggagaagg cggtcgaggg cgactttttc 3360

cgcgtgcagt acagcgaaag caaccacttg cacgtggacc tgtggccctt ctacccccgc 3420

aatggcgtca tgaccaagga cacgtggctg gaccaccggc aggatgtgga gtttcccgag 3480

cacttcctgc agccgctggt gcccctgccc tttgccggct tcgtggcgca ggcgcctaac 3540

aactaccgcc gcttcctgga gctcaagttc gggcccgggg tcatcgagaa cccccagtac 3600

cccaacccgg cactgctgag tctgacggga agcggctgaa ttcaccccac cagtgcaggc 3660

tgcctatcag aaagtggtgg ctggtgtggc taatgccctg gcccacaagt atcactaagc 3720

tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 3780

aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 3840

ttttcattgc aatgatgtat ttaaattatt tctgaatatt ttactaaaaa gggaatgtgg 3900

gaggtcagtg catttaaaac ataaagaaat gaagagctag ttcaaacctt gggaaaatac 3960

actatatctt aaactccatg aaagaaggtg aggctgcaaa cagctaatgc acattggcaa 4020

cagccctgat gcctatgcct tattcatccc tcagaaaagg attcaagtag aggcttgatt 4080

tggaggttaa agttttgcta tgctgtattt tacattactt attgttttag ctgtcctcat 4140

gaatgtcttt tcactaccca tttgcttatc ctgcatctct cagccttgac tccactcagt 4200

tctcttgctt agagatacca cctttcccct gaagtgttcc ttccatgttt tacggcgaga 4260

tggtttctcc tcgcctggcc actcagcctt agttgtctct gttgtcttat agaggtctac 4320

ttgaagaagg aaaaacaggg ggcatggttt gactgtcctg tgagcccttc ttccctgcct 4380

cccccactca cagtgacccg gaatcaggaa cccctagtga tggagttggc cactccctct 4440

ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 4500

gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa tttgagttct 4560

tctactcagg ttaaacttaa gcgcggccgc agtcctaggt tgcgcaatgg gcatgctaca 4620

gatcttccgc ggtgcagcaa gtcgactgca gaggcctgca tgcaagcttg gcgtaatcat 4680

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 4740

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 4800

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 4860

tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 4920

ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 4980

taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5040

agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5100

cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5160

tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5220

tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5280

gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5340

acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5400

acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5460

cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5520

gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5580

gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 5640

agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 5700

ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 5760

ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 5820

atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 5880

tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 5940

gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 6000

ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6060

caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6120

cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6180

cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6240

cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6300

agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6360

tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6420

agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 6480

atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 6540

ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 6600

cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 6660

caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 6720

attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 6780

agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 6840

aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 6900

gtc 6903

<210> 10

<211> 6903

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt accttaaacc 420

ggttcctaca tatgggttgc gcaatgcggc cgcagtactg cagaaatagg ccgaaatcgg 480

caaaatccct ttattggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 540

accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 600

cagagaggga gtggccaact ccatcactag gggttcctta ccccctgccc cccacagctc 660

ctctcctgtg ccttgtttcc cagccatgcg ttctcctcta taaatacccg ctctggtatt 720

tggggttggc agctgttgct gccagggaga tggttgggtt gacatgcggc tcctgacaaa 780

acacaaaccc ctggtgtgtg tgggcgtggg tggtgtgagt agggggatga atcagggagg 840

gggcggggga cccagggggc aggagccaca caaagtctgt gcgggggtgg gagcgcacat 900

agcaattgga aactgaaagc ttatcagacc ctttctggaa atcagcccac tgtttataaa 960

cttgaggccc caccctcgac agtaccgggg aggaagaggg cctgcactag tccagaggga 1020

aactgaggct cagggctagc tcgcccatag acatacatgg caggcaggct ttggccagga 1080

tccctccgcc tgccaggcgt ctccctgccc tcccttcctg cctagagacc cccaccctca 1140

agcctggctg gtctttgcct gagacccaaa cctcttcgac ttcaagagaa tatttaggaa 1200

caaggtggtt tagggccttt cctgggaaca ggccttgacc ctttaagaaa tgacccaaag 1260

tctctccttg accaaaaagg ggaccctcaa actaaaggga agcctctctt ctgctgtctc 1320

ccctgacccc actccccccc accccaggac gaggagataa ccagggctga aagaggcccg 1380

cctgggggct gcagacatgc ttgctgcctg ccctggcgaa ggattggcag gcttgcccgt 1440

cacaggaccc ccgctggctg actcaggggc gcaggcctct tgcgggggag ctggcctccc 1500

cgcccccacg gccacgggcc gccctttcct ggcaggacag cgggatcttg cagctgtcag 1560

gggaggggag gcgggggctg atgtcaggag ggatacaaat agtgccgacg gctgggggcc 1620

ctgtctcccc tcgccgcatc cactctccgg ccggccgcct gcccgccgcc tcctccgtgc 1680

gcccgccagc ctcgcccgcg tacacatatt gaccaaatca gggtaatttt gcatttgtaa 1740

ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt 1800

ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt 1860

ctaaagaata acagtgataa tttctgggtt aaggcaatag caatatttct gcatataaat 1920

atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa 1980

tccagctacc attctgcttt tattttttgg ttgggataag gctggattat tctgagtcca 2040

agctaggccc ttttgctaat cttgttcata cctcttatct tcctcccaca gctcctgggc 2100

aacgtgctgg tctctgtgct ggcccatcac tttggcaaag aattcgccac catgcggctc 2160

acccgctgcc aggctgccct ggcggccgcc atcaccctca accttctggt cctcttctat 2220

gtctcgtggc tgcagcacca gcctaggaat tcccgggccc gggggccccg tcgtgcctct 2280

gctgccggcc cccgtgtcac cgtcctggtg cgggagttcg aggcatttga caacgcggtg 2340

cccgagctgg tagactcctt cctgcagcaa gacccagccc agcccgtggt ggtggcagcc 2400

gacacgctcc cctacccgcc cctggccctg ccccgcatcc ccaacgtgcg tctggcgctg 2460

ctccagcccg ccctggaccg gccagccgca gcctcgcgcc cggagaccta cgtggccacc 2520

gagtttgtgg ccctagtacc tgatggggcg cgggctgagg cacctggcct gctggagcgg 2580

atggtggagg cgctccgcgc aggaagcgca cgtctggtgg ccgccccggt tgccacggcc 2640

aaccctgcca ggtgcctggc cctgaacgtc agcctgcgag agtggaccgc ccgctacggc 2700

gcagcccccg ccgcgccccg ctgcgacgcc ctggacggag atgctgtggt gctcctgcgc 2760

gcccgcgacc tcttcaacct ctcggcgccc ctggcccggc cggtgggcac cagcctcttt 2820

ctgcagaccg cccttcgcgg ctgggcggtg cagctgctgg acttgacctt cgccgcggcg 2880

cgccagcccc cgctggccac ggcccacgcg cgctggaagg ctgagcgcga gggacgcgct 2940

cggcgggcgg cgctgctccg cgcgctggga atccgcctag tgagctggga aggcgggcgg 3000

ctggagtggt tcggctgcaa caaggagacc acgcgctgct tcggaaccgt ggtgggcgac 3060

acgcccgcct acctctacga ggagcgctgg acgcccccct gctgcctgcg cgcgctgcgc 3120

gagaccgccc gctatgtggt gggcgtgctg gaggctgcgg gcgtgcgcta ctggctcgag 3180

ggcggctcac tgctgggggc cgcccgccac ggggacatca tcccatggga ctacgacgtg 3240

gacctgggca tctacttgga ggacgtgggc aactgcgagc agctgcgggg ggcagaggcc 3300

ggctcggtgg tggatgagcg cggcttcgta tgggagaagg cggtcgaggg cgactttttc 3360

cgcgtgcagt acagcgaaag caaccacttg cacgtggacc tgtggccctt ctacccccgc 3420

aatggcgtca tgaccaagga cacgtggctg gaccaccggc aggatgtgga gtttcccgag 3480

cacttcctgc agccgctggt gcccctgccc tttgccggct tcgtggcgca ggcgcctaac 3540

aactaccgcc gcttcctgga gctcaagttc gggcccgggg tgatcgagaa cccccagtac 3600

cccaacccgg cactgctgag tctgacggga agcggctgaa ttcaccccac cagtgcaggc 3660

tgcctatcag aaagtggtgg ctggtgtggc taatgccctg gcccacaagt atcactaagc 3720

tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 3780

aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 3840

ttttcattgc aatgatgtat ttaaattatt tctgaatatt ttactaaaaa gggaatgtgg 3900

gaggtcagtg catttaaaac ataaagaaat gaagagctag ttcaaacctt gggaaaatac 3960

actatatctt aaactccatg aaagaaggtg aggctgcaaa cagctaatgc acattggcaa 4020

cagccctgat gcctatgcct tattcatccc tcagaaaagg attcaagtag aggcttgatt 4080

tggaggttaa agttttgcta tgctgtattt tacattactt attgttttag ctgtcctcat 4140

gaatgtcttt tcactaccca tttgcttatc ctgcatctct cagccttgac tccactcagt 4200

tctcttgctt agagatacca cctttcccct gaagtgttcc ttccatgttt tacggcgaga 4260

tggtttctcc tcgcctggcc actcagcctt agttgtctct gttgtcttat agaggtctac 4320

ttgaagaagg aaaaacaggg ggcatggttt gactgtcctg tgagcccttc ttccctgcct 4380

cccccactca cagtgacccg gaatcaggaa cccctagtga tggagttggc cactccctct 4440

ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 4500

gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa tttgagttct 4560

tctactcagg ttaaacttaa gcgcggccgc agtcctaggt tgcgcaatgg gcatgctaca 4620

gatcttccgc ggtgcagcaa gtcgactgca gaggcctgca tgcaagcttg gcgtaatcat 4680

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 4740

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 4800

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 4860

tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 4920

ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 4980

taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5040

agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5100

cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5160

tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5220

tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5280

gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5340

acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5400

acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5460

cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5520

gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5580

gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 5640

agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 5700

ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 5760

ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 5820

atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 5880

tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 5940

gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 6000

ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6060

caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6120

cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6180

cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6240

cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6300

agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6360

tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6420

agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 6480

atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 6540

ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 6600

cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 6660

caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 6720

attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 6780

agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 6840

aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 6900

gtc 6903

<210> 11

<211> 6903

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt accttaaacc 420

ggttcctaca tatgggttgc gcaatgcggc cgcagtactg cagaaatagg ccgaaatcgg 480

caaaatccct ttattggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 540

accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 600

cagagaggga gtggccaact ccatcactag gggttcctta ccccctgccc cccacagctc 660

ctctcctgtg ccttgtttcc cagccatgcg ttctcctcta taaatacccg ctctggtatt 720

tggggttggc agctgttgct gccagggaga tggttgggtt gacatgcggc tcctgacaaa 780

acacaaaccc ctggtgtgtg tgggcgtggg tggtgtgagt agggggatga atcagggagg 840

gggcggggga cccagggggc aggagccaca caaagtctgt gcgggggtgg gagcgcacat 900

agcaattgga aactgaaagc ttatcagacc ctttctggaa atcagcccac tgtttataaa 960

cttgaggccc caccctcgac agtaccgggg aggaagaggg cctgcactag tccagaggga 1020

aactgaggct cagggctagc tcgcccatag acatacatgg caggcaggct ttggccagga 1080

tccctccgcc tgccaggcgt ctccctgccc tcccttcctg cctagagacc cccaccctca 1140

agcctggctg gtctttgcct gagacccaaa cctcttcgac ttcaagagaa tatttaggaa 1200

caaggtggtt tagggccttt cctgggaaca ggccttgacc ctttaagaaa tgacccaaag 1260

tctctccttg accaaaaagg ggaccctcaa actaaaggga agcctctctt ctgctgtctc 1320

ccctgacccc actccccccc accccaggac gaggagataa ccagggctga aagaggcccg 1380

cctgggggct gcagacatgc ttgctgcctg ccctggcgaa ggattggcag gcttgcccgt 1440

cacaggaccc ccgctggctg actcaggggc gcaggcctct tgcgggggag ctggcctccc 1500

cgcccccacg gccacgggcc gccctttcct ggcaggacag cgggatcttg cagctgtcag 1560

gggaggggag gcgggggctg atgtcaggag ggatacaaat agtgccgacg gctgggggcc 1620

ctgtctcccc tcgccgcatc cactctccgg ccggccgcct gcccgccgcc tcctccgtgc 1680

gcccgccagc ctcgcccgcg tacacatatt gaccaaatca gggtaatttt gcatttgtaa 1740

ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt 1800

ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt 1860

ctaaagaata acagtgataa tttctgggtt aaggcaatag caatatttct gcatataaat 1920

atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa 1980

tccagctacc attctgcttt tattttttgg ttgggataag gctggattat tctgagtcca 2040

agctaggccc ttttgctaat cttgttcata cctcttatct tcctcccaca gctcctgggc 2100

aacgtgctgg tctctgtgct ggcccatcac tttggcaaag aattcgccac catgagactg 2160

accaggtgcc aggctgccct ggctgctgcc atcaccctga acctgctggt gctgttctat 2220

gtgagctggc tgcagcacca gcccaggaac agcagggcca ggggccccag gagggcctct 2280

gctgctggcc ccagggtgac agtgctggtg agggagtttg aggcctttga caatgctgtg 2340

cctgagctgg tggacagctt cctgcagcag gaccctgccc agcctgtggt ggtggctgct 2400

gataccctgc cctacccccc cctggccctg cccaggatcc ccaatgtgag gctggccctg 2460

ctgcagcctg ccctggacag gcctgctgct gccagcaggc ctgagaccta tgtggccaca 2520

gagtttgtgg ccctggtgcc tgatggggcc agggctgagg cccctggcct gctggagagg 2580

atggtggagg ccctgagggc tggctctgcc aggctggtgg ctgcccctgt ggccacagcc 2640

aaccctgcca ggtgcctggc cctgaatgtg agcctgagag agtggacagc caggtatggg 2700

gctgcccctg ctgcccccag gtgtgatgcc ctggatggag atgctgtggt gctgctgagg 2760

gccagggacc tgttcaacct gtctgccccc ctggccaggc ctgtggggac cagcctgttt 2820

ctgcagacag ccctgagggg ctgggctgtg cagctgctgg acctgacctt tgctgctgcc 2880

aggcagcccc ccctggctac agcccacgcc aggtggaagg ctgagaggga gggcagggcc 2940

aggagggctg ccctgctgag ggccctgggg atcaggctgg tgagctggga ggggggcagg 3000

ctggagtggt ttggctgcaa caaggagaca accaggtgct ttgggacagt ggtgggggat 3060

acccctgcct acctgtatga ggagaggtgg acccccccct gctgcctgag ggccctgagg 3120

gagacagcca ggtatgtggt gggggtgctg gaggctgctg gggtgaggta ctggctggag 3180

gggggcagcc tgctgggggc tgccaggcac ggggacatta tcccctggga ctatgatgtg 3240

gacctgggca tctacctgga ggatgtgggc aactgtgagc agctgagggg ggctgaggct 3300

ggctctgtgg tggatgagag gggctttgtg tgggagaagg ctgtggaggg ggactttttc 3360

agggtgcagt actctgagag caaccacctg cacgtggacc tgtggccctt ctaccccagg 3420

aatggggtga tgaccaagga cacctggctg gaccacaggc aggatgtgga gttccctgag 3480

cacttcctgc agcccctggt gcccctgccc tttgctggct ttgtggccca ggcccccaac 3540

aactacagga ggttcctgga gctgaagttt ggccctgggg tgattgagaa cccccagtac 3600

cccaaccctg ccctgctgag cctgacaggc tctggctgaa ttcaccccac cagtgcaggc 3660

tgcctatcag aaagtggtgg ctggtgtggc taatgccctg gcccacaagt atcactaagc 3720

tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 3780

aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 3840

ttttcattgc aatgatgtat ttaaattatt tctgaatatt ttactaaaaa gggaatgtgg 3900

gaggtcagtg catttaaaac ataaagaaat gaagagctag ttcaaacctt gggaaaatac 3960

actatatctt aaactccatg aaagaaggtg aggctgcaaa cagctaatgc acattggcaa 4020

cagccctgat gcctatgcct tattcatccc tcagaaaagg attcaagtag aggcttgatt 4080

tggaggttaa agttttgcta tgctgtattt tacattactt attgttttag ctgtcctcat 4140

gaatgtcttt tcactaccca tttgcttatc ctgcatctct cagccttgac tccactcagt 4200

tctcttgctt agagatacca cctttcccct gaagtgttcc ttccatgttt tacggcgaga 4260

tggtttctcc tcgcctggcc actcagcctt agttgtctct gttgtcttat agaggtctac 4320

ttgaagaagg aaaaacaggg ggcatggttt gactgtcctg tgagcccttc ttccctgcct 4380

cccccactca cagtgacccg gaatcaggaa cccctagtga tggagttggc cactccctct 4440

ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 4500

gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa tttgagttct 4560

tctactcagg ttaaacttaa gcgcggccgc agtcctaggt tgcgcaatgg gcatgctaca 4620

gatcttccgc ggtgcagcaa gtcgactgca gaggcctgca tgcaagcttg gcgtaatcat 4680

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 4740

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 4800

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 4860

tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 4920

ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 4980

taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5040

agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5100

cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5160

tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5220

tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5280

gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5340

acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5400

acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5460

cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5520

gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5580

gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 5640

agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 5700

ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 5760

ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 5820

atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 5880

tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 5940

gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 6000

ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6060

caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6120

cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6180

cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6240

cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6300

agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6360

tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6420

agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 6480

atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 6540

ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 6600

cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 6660

caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 6720

attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 6780

agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 6840

aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 6900

gtc 6903

<210> 12

<211> 145

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcct 145

<210> 13

<211> 1061

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

taccccctgc cccccacagc tcctctcctg tgccttgttt cccagccatg cgttctcctc 60

tataaatacc cgctctggta tttggggttg gcagctgttg ctgccaggga gatggttggg 120

ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg tgtgggcgtg ggtggtgtga 180

gtagggggat gaatcaggga gggggcgggg gacccagggg gcaggagcca cacaaagtct 240

gtgcgggggt gggagcgcac atagcaattg gaaactgaaa gcttatcaga ccctttctgg 300

aaatcagccc actgtttata aacttgaggc cccaccctcg acagtaccgg ggaggaagag 360

ggcctgcact agtccagagg gaaactgagg ctcagggcta gctcgcccat agacatacat 420

ggcaggcagg ctttggccag gatccctccg cctgccaggc gtctccctgc cctcccttcc 480

tgcctagaga cccccaccct caagcctggc tggtctttgc ctgagaccca aacctcttcg 540

acttcaagag aatatttagg aacaaggtgg tttagggcct ttcctgggaa caggccttga 600

ccctttaaga aatgacccaa agtctctcct tgaccaaaaa ggggaccctc aaactaaagg 660

gaagcctctc ttctgctgtc tcccctgacc ccactccccc ccaccccagg acgaggagat 720

aaccagggct gaaagaggcc cgcctggggg ctgcagacat gcttgctgcc tgccctggcg 780

aaggattggc aggcttgccc gtcacaggac ccccgctggc tgactcaggg gcgcaggcct 840

cttgcggggg agctggcctc cccgccccca cggccacggg ccgccctttc ctggcaggac 900

agcgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg agggatacaa 960

atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc ggccggccgc 1020

ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg c 1061

<210> 14

<211> 452

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60

cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120

gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180

atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240

aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300

ttattttttg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360

tcttgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctctgtgc 420

tggcccatca ctttggcaaa gaattcgcca cc 452

<210> 15

<211> 766

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

attcacccca ccagtgcagg ctgcctatca gaaagtggtg gctggtgtgg ctaatgccct 60

ggcccacaag tatcactaag ctcgctttct tgctgtccaa tttctattaa aggttccttt 120

gttccctaag tccaactact aaactggggg atattatgaa gggccttgag catctggatt 180

ctgcctaata aaaaacattt attttcattg caatgatgta tttaaattat ttctgaatat 240

tttactaaaa agggaatgtg ggaggtcagt gcatttaaaa cataaagaaa tgaagagcta 300

gttcaaacct tgggaaaata cactatatct taaactccat gaaagaaggt gaggctgcaa 360

acagctaatg cacattggca acagccctga tgcctatgcc ttattcatcc ctcagaaaag 420

gattcaagta gaggcttgat ttggaggtta aagttttgct atgctgtatt ttacattact 480

tattgtttta gctgtcctca tgaatgtctt ttcactaccc atttgcttat cctgcatctc 540

tcagccttga ctccactcag ttctcttgct tagagatacc acctttcccc tgaagtgttc 600

cttccatgtt ttacggcgag atggtttctc ctcgcctggc cactcagcct tagttgtctc 660

tgttgtctta tagaggtcta cttgaagaag gaaaaacagg gggcatggtt tgactgtcct 720

gtgagccctt cttccctgcc tcccccactc acagtgaccc ggaatc 766

<210> 16

<211> 145

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag agagggagtg gccaa 145

<210> 17

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

ccaggcgagg agaaacca 18

<210> 18

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

cttgactcca ctcagttctc ttgct 25

<210> 19

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

ctcgccgtaa aacatggaag gaacacttc 29

<210> 20

<211> 1488

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

atgagactga caagatgcca ggccgccctg gccgctgcca tcacactgaa tctgctggtg 60

ctgttctatg tgtcctggct gcagcaccag ccccggaact ctagagccag aggcccaaga 120

agggcctctg ccgccggacc tagagtgaca gtgctcgtgc gcgagttcga ggccttcgac 180

aatgccgtgc ccgagctggt ggacagcttc ctgcagcaag accctgctca gcctgtggtg 240

gtggccgccg atacactgcc ttatcctcca ctggccctgc ccagaatccc caatgtgcga 300

ctggctctgc tgcagcccgc cctggataga cctgccgccg ctagcagacc tgagacatac 360

gtggccaccg agttcgtggc cctggtgcct gatggcgcca gagctgaagc tcccggcctg 420

ctggaaagaa tggtggaagc cctgagagcc ggcagcgcca gactggtggc tgctcctgtg 480

gctaccgcca accctgccag atgtctggcc ctgaatgtgt ccctgagaga gtggaccgcc 540

agatacggcg ctgcccctgc cgctcctaga tgtgatgctc tggatggcga cgccgtggtg 600

ctgctgagag ccagggacct gttcaacctg agcgcccctc tggccagacc tgtgggcaca 660

agcctgtttc tgcagacagc cctgaggggc tgggccgtgc agctgctgga tctgacattt 720

gccgctgcca gacagcctcc tctggccaca gcccatgcca gatggaaggc cgagagagag 780

ggcagagcca gaagggctgc tctgctgagg gccctgggca tcagactggt gtcttgggaa 840

ggcggcagac tcgagtggtt cggctgcaac aaagaaacca cccggtgctt cggcaccgtc 900

gtgggcgata caccagccta cctgtacgag gaaagatgga cccccccttg ctgcctgcgg 960

gccctgagag aaacagccag atatgtcgtg ggcgtgctgg aagccgctgg cgtgcgatat 1020

tggctggaag gcggatctct gctgggagcc gccaggcacg gcgacatcat cccttgggac 1080

tacgacgtgg acctgggcat ctacctggaa gatgtgggca actgcgagca gctgagaggc 1140

gccgaagccg gctctgtggt ggatgagagg ggcttcgtgt gggagaaggc cgtggaaggc 1200

gacttcttcc gggtgcagta cagcgagagc aaccatctgc atgtggacct gtggcccttc 1260

tacccccgga acggcgtgat gaccaaggac acctggctgg accaccggca ggacgtggaa 1320

ttccccgagc actttctgca gcccctggtg ccactgcctt tcgccggatt tgtggcccag 1380

gcccccaaca actaccggcg gttcctggaa ctgaagttcg gccctggcgt gatcgagaac 1440

ccccagtacc ctaaccctgc cctgctgagc ctgaccggca gcggctaa 1488

<210> 21

<211> 6903

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt accttaaacc 420

ggttcctaca tatgggttgc gcaatgcggc cgcagtactg cagaaatagg ccgaaatcgg 480

caaaatccct ttattggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 540

accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 600

cagagaggga gtggccaact ccatcactag gggttcctta ccccctgccc cccacagctc 660

ctctcctgtg ccttgtttcc cagccatgcg ttctcctcta taaatacccg ctctggtatt 720

tggggttggc agctgttgct gccagggaga tggttgggtt gacatgcggc tcctgacaaa 780

acacaaaccc ctggtgtgtg tgggcgtggg tggtgtgagt agggggatga atcagggagg 840

gggcggggga cccagggggc aggagccaca caaagtctgt gcgggggtgg gagcgcacat 900

agcaattgga aactgaaagc ttatcagacc ctttctggaa atcagcccac tgtttataaa 960

cttgaggccc caccctcgac agtaccgggg aggaagaggg cctgcactag tccagaggga 1020

aactgaggct cagggctagc tcgcccatag acatacatgg caggcaggct ttggccagga 1080

tccctccgcc tgccaggcgt ctccctgccc tcccttcctg cctagagacc cccaccctca 1140

agcctggctg gtctttgcct gagacccaaa cctcttcgac ttcaagagaa tatttaggaa 1200

caaggtggtt tagggccttt cctgggaaca ggccttgacc ctttaagaaa tgacccaaag 1260

tctctccttg accaaaaagg ggaccctcaa actaaaggga agcctctctt ctgctgtctc 1320

ccctgacccc actccccccc accccaggac gaggagataa ccagggctga aagaggcccg 1380

cctgggggct gcagacatgc ttgctgcctg ccctggcgaa ggattggcag gcttgcccgt 1440

cacaggaccc ccgctggctg actcaggggc gcaggcctct tgcgggggag ctggcctccc 1500

cgcccccacg gccacgggcc gccctttcct ggcaggacag cgggatcttg cagctgtcag 1560

gggaggggag gcgggggctg atgtcaggag ggatacaaat agtgccgacg gctgggggcc 1620

ctgtctcccc tcgccgcatc cactctccgg ccggccgcct gcccgccgcc tcctccgtgc 1680

gcccgccagc ctcgcccgcg tacacatatt gaccaaatca gggtaatttt gcatttgtaa 1740

ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt 1800

ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt 1860

ctaaagaata acagtgataa tttctgggtt aaggcaatag caatatttct gcatataaat 1920

atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa 1980

tccagctacc attctgcttt tattttttgg ttgggataag gctggattat tctgagtcca 2040

agctaggccc ttttgctaat cttgttcata cctcttatct tcctcccaca gctcctgggc 2100

aacgtgctgg tctctgtgct ggcccatcac tttggcaaag aattcgccac catgcggctc 2160

acccgctgcc aggctgccct ggctgctgcc atcaccctca accttctggt cctcttctat 2220

gtcagctggc tgcagcacca gcctaggaat tcccgggccc gggggcccag gagggcctct 2280

gctgctggcc ccagggtcac cgtcctggtg cgggagttcg aggcatttga caacgctgtg 2340

cccgagctgg tagactcctt cctgcagcaa gacccagccc agcccgtggt ggtggcagct 2400

gacaccctcc cctacccccc cctggccctg ccccgcatcc ccaacgtgag gctggccctg 2460

ctccagcccg ccctggaccg gccagctgca gccagccgcc ctgagaccta cgtggccacc 2520

gagtttgtgg ccctggtacc tgatggggcc cgggctgagg cacctggcct gctggagcgg 2580

atggtggagg ccctcagggc aggaagcgca aggctggtgg ctgcccctgt tgccacagcc 2640

aaccctgcca ggtgcctggc cctgaacgtc agcctgcgag agtggaccgc ccgctacggg 2700

gcagcccccg ctgccccccg ctgcgacgcc ctggacggag atgctgtggt gctcctgagg 2760

gccagggacc tcttcaacct ctctgccccc ctggcccggc ctgtgggcac cagcctcttt 2820

ctgcagaccg cccttagggg ctgggctgtg cagctgctgg acttgacctt cgctgctgcc 2880

cgccagcccc ccctggccac agcccacgcc cgctggaagg ctgagaggga gggaagggct 2940

cggcgggctg ccctgctcag ggccctggga atccgcctgg tgagctggga aggggggcgg 3000

ctggagtggt tcggctgcaa caaggagacc acccgctgct tcggaaccgt ggtgggggac 3060

acccccgcct acctctacga ggagcgctgg acccccccct gctgcctgag ggccctgagg 3120

gagaccgccc gctatgtggt gggggtgctg gaggctgctg gggtgcgcta ctggctcgag 3180

gggggctcac tgctgggggc tgcccgccac ggggacatca tcccatggga ctacgacgtg 3240

gacctgggca tctacttgga ggacgtgggc aactgcgagc agctgcgggg ggcagaggct 3300

ggctctgtgg tggatgagag gggcttcgta tgggagaagg ctgtggaggg ggactttttc 3360

agggtgcagt acagcgaaag caaccacttg cacgtggacc tgtggccctt ctacccccgc 3420

aatggggtca tgaccaagga cacctggctg gaccaccggc aggatgtgga gtttcccgag 3480

cacttcctgc agcccctggt gcccctgccc tttgctggct tcgtggccca ggcccctaac 3540

aactaccgcc gcttcctgga gctcaagttc gggcccgggg tgatcgagaa cccccagtac 3600

cccaaccctg cactgctgag tctgaccgga agcggctgaa ttcaccccac cagtgcaggc 3660

tgcctatcag aaagtggtgg ctggtgtggc taatgccctg gcccacaagt atcactaagc 3720

tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 3780

aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 3840

ttttcattgc aatgatgtat ttaaattatt tctgaatatt ttactaaaaa gggaatgtgg 3900

gaggtcagtg catttaaaac ataaagaaat gaagagctag ttcaaacctt gggaaaatac 3960

actatatctt aaactccatg aaagaaggtg aggctgcaaa cagctaatgc acattggcaa 4020

cagccctgat gcctatgcct tattcatccc tcagaaaagg attcaagtag aggcttgatt 4080

tggaggttaa agttttgcta tgctgtattt tacattactt attgttttag ctgtcctcat 4140

gaatgtcttt tcactaccca tttgcttatc ctgcatctct cagccttgac tccactcagt 4200

tctcttgctt agagatacca cctttcccct gaagtgttcc ttccatgttt tacggcgaga 4260

tggtttctcc tcgcctggcc actcagcctt agttgtctct gttgtcttat agaggtctac 4320

ttgaagaagg aaaaacaggg ggcatggttt gactgtcctg tgagcccttc ttccctgcct 4380

cccccactca cagtgacccg gaatcaggaa cccctagtga tggagttggc cactccctct 4440

ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 4500

gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa tttgagttct 4560

tctactcagg ttaaacttaa gcgcggccgc agtcctaggt tgcgcaatgg gcatgctaca 4620

gatcttccgc ggtgcagcaa gtcgactgca gaggcctgca tgcaagcttg gcgtaatcat 4680

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 4740

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 4800

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 4860

tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 4920

ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 4980

taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5040

agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5100

cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5160

tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5220

tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5280

gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5340

acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5400

acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5460

cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5520

gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5580

gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 5640

agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 5700

ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 5760

ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 5820

atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 5880

tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 5940

gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 6000

ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6060

caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6120

cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6180

cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6240

cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6300

agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6360

tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6420

agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 6480

atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 6540

ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 6600

cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 6660

caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 6720

attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 6780

agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 6840

aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 6900

gtc 6903

Claims

1.一种编码人福库汀相关蛋白（FKRP）的合成的多核苷酸，其特征在于，所述多核苷酸的序列如SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：6所示。

2.一种载体，其特征在于，包含如权利要求1所述的多核苷酸。

3.如权利要求2所述的载体，其特征在于，所述载体是腺相关病毒（AAV）载体。

4.如权利要求3所述的载体，其特征在于，所述AAV载体是血清型2、8或9。

5.如权利要求4所述的载体，其特征在于，所述AAV载体是血清型2/9。

6.如权利要求2至5中任一项所述的载体，其特征在于，包含序列SEQ ID NO：10、SEQ IDNO：11、SEQ ID NO：21。

7.一种细胞，其特征在于，包含如权利要求1所述的多核苷酸或如权利要求2至6中任一项所述的载体。

8.一种包含如权利要求1所述的多核苷酸或如权利要求2至6中任一项所述的载体或如权利要求7所述的细胞的组合物在制备药物中的用途，其特征在于，所述药物用于治疗与FKRP缺陷相关的病症。

9.一种药物组合物，其特征在于，包含如权利要求1所述的多核苷酸或如权利要求2至6中任一项所述的载体或如权利要求7所述的细胞，和药学上可接受的载体。

10.一种权利要求9所述的药物组合物在制备药物中的用途，其特征在于，所述药物用于治疗与FKRP缺陷相关的病症。

11.如权利要求10所述的用途，其特征在于，所述与FKRP缺陷相关的病症由α-抗肌萎缩相关糖蛋白（α-DG）糖基化缺陷引起。

12.如权利要求10所述的用途，其特征在于，所述病症选自：2I型肢带型肌营养不良症（LGMD2I）、1C型先天性肌营养不良症（MDC1C）、沃克-沃堡（Walker-Warburg）综合征（WWS）和肌肉性眼脑（Muscle-Eye-Brain）疾病（MEB）。

13.如权利要求12所述的用途，其特征在于，所述病症是LGMD2I。