CN116234904A

CN116234904A - 用于治疗糖尿病的经修饰的胰岛素和葡萄糖激酶核酸

Info

Publication number: CN116234904A
Application number: CN202180052115.3A
Authority: CN
Inventors: N·古普塔; W·申; M·加西亚马丁内斯; V·吉梅内兹森扎诺; M·F·波什图伯特
Original assignee: Universitat Autonoma de Barcelona UAB; Kriya Therapy Co ltd
Current assignee: Universitat Autonoma de Barcelona UAB; Kriya Therapy Co ltd
Priority date: 2020-07-03
Filing date: 2021-07-02
Publication date: 2023-06-06
Also published as: KR20230087436A; WO2022006551A3; CA3174156A1; US20240279300A1; AU2021300450A1; EP4176060A2; MX2023000099A; IL299545A; EP4176060A4; JP2023542241A; WO2022006551A2

Abstract

本公开涉及编码胰岛素和葡萄糖激酶的经修饰核酸序列、包含其的表达盒和递送载体，以及用于递送其以治疗糖尿病的方法。

Description

用于治疗糖尿病的经修饰的胰岛素和葡萄糖激酶核酸

相关申请的交叉引用

本申请要求2020年7月3日提交的第63/047,965号美国临时申请；2020年7月20日提交的第63/054,162号美国临时申请；2020年8月18日提交的第63/067,264号美国临时申请；2021年1月26日提交的第63/141,918号美国临时申请；和2021年5月14日提交的第63/188,788号美国临时申请的优先权权益，其各自在此都通过引用方式全文并入。

对以电子方式递交的序列表的引用

以电子方式递交的ASCII文本文件(4525_016PC05_Seqlisting_ST25；大小：240,360字节；和创建日期：2021年6月30日)格式的序列表与本申请一起提交，该序列表的内容通过引用方式整体并入本文。

背景技术

糖尿病的两种主要形式是1型(T1DM)和2型(T2DM)(Diabetes care,1997,20-1183-1197)。

T1DM的特征是由于胰腺β-细胞的特异性破坏而导致胰岛素产生严重缺乏。T1DM中的β-细胞丧失是自身免疫介导的过程的结果，其中称为胰岛炎的慢性炎症导致β-细胞破坏(Eizirik D.L.等人,2001,Diabetologia,44:2115-2133和Mathis D等人,2001,Nature,414:792-798)。T1DM是儿童期最常见的内分泌和代谢病况之一；发病率正在迅速增加，尤其是在幼儿中。当自身免疫介导的β-细胞破坏几乎完全导致患者需要胰岛素替代疗法才能生存时，就可以诊断为T1DM。成人中的T1DM可能表现出与T2DM相似，代谢控制缓慢恶化，随后进展为胰岛素依赖。这种形式称为成人潜伏性自身免疫糖尿病(LADA)(Diabetes Atlas第4版,2009,国际糖尿病联盟(International Diabetes Federation))。

T2DM是糖尿病的最常见形式，并且已将其归因于遗传、环境和行为风险因素之间的相互作用。T2DM的特征是胰岛素不敏感、胰岛素产生减少和最终的胰腺β-细胞衰竭(Olokoba,A.等人,2012,Oman Med.J.27(4):269-273)。

终身胰岛素治疗通常是T1DM和T2DM两者的首选疗法。虽然使用外源性胰岛素进行终身治疗在控制糖尿病方面取得了很大成功，但由于难以维持严格血糖控制，糖尿病并发症仍可能发生。长期的高血糖状态可能导致严重的微血管或大血管并发症，最常见的表现为视网膜病变、神经病变、肾病、脑血管意外或心肌梗塞。通过改善血糖控制可以预防这些毁灭性并发症。值得注意的是，脆性糖尿病是一种特别不稳定的形式，即使终身使用外源性胰岛素也很难控制。

此外，在许多不发达国家，获得自我保健工具和胰岛素的机会可能受到限制，这可能导致糖尿病儿童出现严重残疾和早逝(Diabetes Atlas第4版,2009,国际糖尿病联盟,Beran D.等人2006,Lancet,368:1689-1695和Gale E.A.等人,2006,Lancet,368:1626-1628)。从全球角度来看，患糖尿病儿童最常见的死亡原因是缺乏获得胰岛素的机会。因此，在胰岛素获取机会受限的情况下，一次性基因治疗方法的可用性可以产生深远的影响(Greenwood H.L.等人,2006,PLoS Med 3.e381)。

降低高血糖和维持正常血糖是T1DM和T2DM的任何治疗方法的目标。目前对大多数糖尿病患者的疗法是基于定期皮下注射短效作用和长效作用胰岛素制剂。

技术领域

本公开涉及医学领域，包括基因治疗组合物，该组合物包含编码胰岛素和/或葡萄糖激酶的经修饰核酸，用于治疗糖尿病。

发明内容

本公开的某些方面涉及编码人胰岛素(Ins)蛋白(例如，前胰岛素原或其变体)的多核苷酸，其包括(i)编码信号肽的核苷酸序列，任选地，其中信号肽不是野生型前胰岛素原信号序列，和(ii)编码胰岛素原多肽的核苷酸序列，相对于野生型胰岛素原中相应的氨基酸位置，该胰岛素原多肽包含在选自人胰岛素B链的氨基酸B10、B28和/或B29、人胰岛素C链的C1和/或C32或者其任意组合的位置处的氨基酸修饰，并且任选地，该多核苷酸进一步包括切割位点。在一些方面，信号肽是野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列。在一些方面，切割位点是弗林蛋白酶切割位点。

本公开的某些方面涉及包含编码人胰岛素(Ins)蛋白的核酸的多核苷酸，其中该核酸包含开放阅读框(ORF)，该ORF包含：(i)编码信号肽的核苷酸序列和(ii)与SEQ ID NO:43-57、110-116、150-151、154-155和157-159中任一项的核酸73-330，SEQ ID NO:117-122、152和156中任一项的核酸88-345，或者SEQ ID NO:153的核酸79-336存在至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

在一些方面，所编码的人Ins蛋白包含(i)信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)和(ii)SEQ ID NO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110。在一些方面，所编码的人胰岛素蛋白进一步包含切割位点(例如，弗林蛋白酶切割位点)。

本公开的某些方面涉及包含编码人胰岛素(Ins)蛋白的核酸的多核苷酸，其中该核酸包含开放阅读框(ORF)，该ORF包含：与SEQ ID NO:43-57、110-122或150-159中任一项存在至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。在一些方面，该多核苷酸包含至少两个编码人Ins蛋白的核酸序列。在一些方面，该多核苷酸包含至少两个与SEQ ID NO:43-57、110-122或150-159中任一项存在至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的ORF核苷酸序列，其中两个ORF核苷酸序列可以相同或不同。在一些方面，该多核苷酸进一步包含IRES序列。在一些方面，至少两个ORF核苷酸序列由IRES序列分隔开。

在一些方面，所编码的人Ins蛋白包含信号序列和胰岛素原多肽。在一些方面，所编码的人Ins蛋白包含SEQ ID NO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110中任一项的氨基酸序列。在一些方面，所编码的人Ins蛋白是前胰岛素原。在一些方面，所编码的人Ins蛋白包含SEQ ID NO:41、SEQ ID NO:144或SEQID NO:145的氨基酸序列。

在一些方面，该多核苷酸或核酸序列进一步包含5’UTR和/或3’UTR。在一些方面，该多核苷酸或核酸包含：与SEQ ID NO:1-16、84-88、123-141或160-161中任一项存在至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

本公开的某些方面涉及包含编码人胰岛素(Ins)蛋白(例如，前胰岛素原或其变体)的核酸的多核苷酸，其中该核酸包括：(i)编码信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)的核苷酸序列和(ii)编码胰岛素原多肽的核苷酸序列，相对于野生型胰岛素原中相应的氨基酸，该胰岛素原多肽包含在选自人胰岛素B链的氨基酸B10、B28和/或B29、人胰岛素C链的C1和/或C32或者其任意组合的位置处的氨基酸修饰(或者相对于野生型前胰岛素原中相应的氨基酸，在选自氨基酸H34、P52、K53、R55、L86或其任意组合的位置处的氨基酸修饰)。

在一些方面，信号肽不是野生型前胰岛素原信号序列(例如，将野生型前胰岛素原序列替换为IL-6信号序列或纤连蛋白信号序列)。在一些方面，胰岛素原多肽包含SEQ IDNO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110中任一项的氨基酸序列。

在一些方面，该多核苷酸进一步包含切割位点(例如，弗林蛋白酶切割位点)。

在一些方面，相对于野生型前胰岛素原序列，所编码的人Ins蛋白(例如，前胰岛素原或其变体)包含选自以下的氨基酸修饰：(i)H34D、H34I或H34V中的氨基酸修饰(或者在胰岛素原B链的B10位处，将组氨酸(H)置换为天冬氨酸(D)、异亮氨酸(I)或缬氨酸(V))，和/或(ii)在P52、K53、R55和/或L86处的一个或多个氨基酸修饰(或者胰岛素原B链的B28和/或B29位或胰岛素原C链的C1和/或C32位)。在一些方面，在P52、K53、R55和/或L86处的一个或多个氨基酸修饰包括P52D、K53R、R55K、L86R或其任意组合(或者胰岛素原B链或C链中的一个或多个修饰包括在胰岛素原B链的B28位处将脯氨酸(P)置换为天冬氨酸(D)、在胰岛素原B链的B29位处将赖氨酸(K)置换为精氨酸(R)、在胰岛素原C链的C1位处将精氨酸(R)置换为赖氨酸(K)、在胰岛素原C链的C32位处将亮氨酸(L)置换为精氨酸(R)，或其任意组合)。

本公开的某些方面涉及包含编码人葡萄糖激酶(Gck)蛋白的核酸的多核苷酸，其中该核酸包含ORF，该ORF包含：与SEQ ID NO:61-80或162中任一项的核酸1-1398；或者SEQID NO:61-80和162中任一项存在至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。在一些方面，所编码的人Gck蛋白包含SEQ ID NO:82的氨基酸序列。

在一些方面，编码Gck蛋白的多核苷酸或核酸序列进一步包含5’UTR和/或3’UTR。在一些方面，该核酸进一步包含5’UTR，该5’UTR包含与SEQ ID NO:42、SEQ ID NO:42的5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148存在至少85％、90％、95％、99％或100％同一性的核苷酸序列。在一些方面，该核酸进一步包含3’UTR，该3’UTR包含与SEQ IDNO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101或SEQID NO:149存在至少85％、90％、95％、99％或100％同一性的核苷酸序列。在一些方面，该多核苷酸或核酸包含：与SEQ ID NO:20-39和89-96以及163-164中任一项存在至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

在一些方面，将该核酸可操作地连接到启动子(例如，真核生物启动子)。本公开的某些方面涉及表达盒，该表达盒包含本公开的多核苷酸和与该核酸序列可操作地连接的异源表达调控序列。在一些方面，将该核酸可操作地连接到多腺苷酸化(多聚A)元件。

本公开的某些方面涉及包含本公开的多核苷酸或表达盒的载体(例如，病毒载体、非病毒载体、质粒、脂质或溶酶体)。在一些方面，载体是腺相关病毒(AAV)载体或慢病毒载体。本公开的某些方面涉及重组AAV(rAAV)颗粒，其包含AAV衣壳和载体基因组，该载体基因组包含本公开的多核苷酸或表达盒。在一些方面，AAV血清型选自于由下列组成的组，即AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVRH8、AAVrh9、AAV9、AAVrh10、AAV10、AAVRH10、AAV11和AAV12。本公开的某些方面涉及宿主细胞(例如，哺乳动物细胞)，该宿主细胞包含本公开的多核苷酸、表达盒、载体或rAAV颗粒。

本公开的某些方面涉及一种在受试者中产生人Ins蛋白和/或人Gck蛋白的方法，包括向受试者施用本公开的多核苷酸、表达盒、载体或rAAV颗粒，从而在受试者中产生人Ins蛋白和/或人Gck。本公开的某些方面涉及一种在有此需要的受试者中治疗或改善与糖尿病相关的症状的方法，包括向受试者递送治疗有效量的本公开的多核苷酸、表达盒、载体或rAAV颗粒，从而治疗受试者中的糖尿病。在一些方面，糖尿病是1型糖尿病(T1DM)或2型糖尿病(T2DM)。

在一些方面，本文公开的方法包括向受试者施用多种多核苷酸，包括编码人胰岛素的第一多核苷酸和编码人Gck的第二多核苷酸；多种表达盒，包括含有编码人胰岛素的多核苷酸的第一表达盒和含有编码人Gck的多核苷酸的第二表达盒；多种载体，包括第一载体和第二载体，该第一载体包括含有编码人胰岛素的多核苷酸的表达盒，该第二载体包括含有编码人Gck的多核苷酸的表达盒；或者多种rAAV颗粒，包括第一rAAV颗粒和第二rAAV颗粒，该第一rAAV颗粒包括含有编码人胰岛素的多核苷酸的表达盒，该第二rAAV颗粒包括含有编码人Gck的多核苷酸的表达盒。在一些方面，同时或序贯地施用多种多核苷酸、表达盒、载体或rAAV颗粒。在一些方面，以肌内方式递送和/或施用本公开的多核苷酸、表达盒、载体或rAAV颗粒。在一些方面，本公开的方法提供了(i)受试者中糖化的血液血红蛋白(HbA1c)水平的降低和/或调节；(ii)受试者中循环酮类的降低，(iii)受试者中甘油三酯的降低，或者(iv)其任意组合。

附图说明

图1A示出了核酸序列构建体的列表，包括人胰岛素(hIns)未修饰核酸序列(SEQID NO:1、SEQ ID NO:127和SEQ ID NO:160)和经修饰的hIns核酸序列(SEQ ID NO:2-16、84-88、123-126和128-141)。序列包括3’UTR、ORF和5’UTR核酸序列。某些序列还包括IRES序列。转染到HEK细胞中的示例性pAAV-Ins质粒显示在右侧一列中。

图1B和1C是显示转染了0.5ug/孔(图1B)或0.1ug/孔(图1C)pAAV-胰岛素质粒的HEK细胞的胰岛素分泌情况的图。将每种质粒的胰岛素表达水平与对照质粒(AAV1-CMV-hInsB10D_2)进行比较。

图2A示出了核酸序列构建体的列表，包括人葡萄糖激酶(hGcK)野生型核酸序列(SEQ ID NO:19和SEQ ID NO:163)和经修饰hGcK核酸序列(SEQ ID NO:20-39和89-96)。序列包括3’UTR、ORF和5’UTR核酸序列。转染到HEK细胞中的示例性pAAV-Gck质粒显示在右侧一列中。

图2B是显示转染了2.5ug/孔pAAV-Gck质粒的HEK细胞中葡萄糖激酶表达情况的图。将每种质粒的GcK表达水平与对照质粒(AAV1-CMV-hGcKWT_2)进行比较。

图3A-3C是显示2v6.11细胞的细胞提取物中细胞内AAV1-hInsulin载体基因组(vg)量的图，2v6.11细胞在三种不同MOI(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))下和三次独立研究中感染了载体AAV1-CMV-hInsB10D-9(SEQ ID NO:110)、AAV1-CMV-Ins5(SEQ ID NO:87)和AAV1-CMV-Ins7(SEQ ID NO:88)。图3A是测定1，图3B是测定2，并且图3C是测定3。

图4A-4C是显示2v6.11细胞中人胰岛素mRNA表达水平的图，2v6.11细胞在三种不同MOI(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))下和三次独立研究中感染了载体AAV1-CMV-hInsB10D(SEQ ID NO:110)、AAV1-CMV-Ins5(SEQ ID NO:87)和AAV1-CMV-Ins7(SEQ ID NO:88)。图4A是测定1，图4B是测定2，并且图4C是测定3。

图5A-5C是显示对2v6.11细胞进行三次独立感染研究后测量的所分泌人胰岛素(mU/L)水平的图，2v6.11细胞在三种不同MOI(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))下感染了载体AAV1-CMV-hInsB10D(SEQ ID NO:110)、AAV1-CMV-Ins5(SEQ ID NO:87)和AAV1-CMV-Ins7(SEQ ID NO:88)。图5A是测定1，图5B是测定2，并且图5C是测定3。

图6A-6C是显示对2v6.11细胞进行三次独立感染研究后测量的所分泌人胰岛素的功能性的图，2v6.11细胞在三种不同MOI(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))下感染了载体AAV1-CMV-hInsB10D(SEQ ID NO:110)、AAV1-CMV-Ins5(SEQ ID NO:87)和AAV1-CMV-Ins7(SEQ ID NO:88)。使用重组人胰岛素(Life Technologies)作为标准参照物，将活性表示为ng/ml。图6A是测定1，图6B是测定2，并且图6C是测定3。

图7A-7C是显示2v6.11细胞的细胞提取物中细胞内AAV1-hGlucokinase载体基因组(vg)量的图，2v6.11细胞在三种不同MOI(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))下和三次独立测定中感染了载体AAV1-CMV-hGckWT(野生型)(SEQ ID NO:19)、AAV1-CMV-Gck8(SEQ ID NO:93)和AAV1-CMV-Gck12(SEQ ID NO:95)。图7A是测定1，图7B是测定2，并且图7C是测定3。

图8A-8C是显示2v6.11细胞中人葡萄糖激酶mRNA表达水平的图，2v6.11细胞在三种不同MOI(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))下和三次独立测定中感染了载体AAV1-CMV-hGckWT(野生型)(SEQ ID NO:19)、AAV1-CMV-Gck8(SEQ ID NO:93)和AAV1-CMV-Gck12(SEQ ID NO:95)。图8A是测定1，图8B是测定2，并且图8C是测定3。

图9A-9C是显示对2v6.11细胞进行三次独立感染研究后测量的细胞内葡萄糖激酶水平(ng/mg)的图，2v6.11细胞在三种不同MOI(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))下和三次独立测定中感染了载体AAV1-CMV-hGckWT(野生型)(SEQ IDNO:19)、AAV1-CMV-Gck8(SEQ ID NO:93)和AAV1-CMV-Gck12(SEQ ID NO:95)。图9A是测定1，图9B是测定2，并且图9C是测定3。

图10A-10C是显示对2v6.11细胞进行三次独立感染研究后在细胞提取物中测量的葡萄糖激酶酶活性(mU/mg)的图，2v6.11细胞在三种不同MOI(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))下和三次独立测定中感染了载体AAV1-CMV-hGckWT(野生型)(SEQ ID NO:19)、AAV1-CMV-Gck8(SEQ ID NO:93)和AAV1-CMV-Gck12(SEQ ID NO:95)。图10A是测定1，图10B是测定2，并且图10C是测定3。

图11A-11C是显示在注射后三周(图11A)、四周(图11B)和五周(图11C)时个体C57Blk6小鼠在进食或空腹条件下的葡萄糖水平的图，这些小鼠注射了含有人胰岛素基因(SEQ ID NO:1)的AAV1和含有大鼠葡萄糖激酶基因的AAV1。图11B中四(4)周时间点是在禁食条件下采集的。

图12是显示在注射后五周内测试的C57Blk6小鼠在进食或禁食条件下的平均葡萄糖水平的图，这些小鼠注射了含有人胰岛素基因(SEQ ID NO:1)的AAV1和含有大鼠葡萄糖激酶基因的AAV1。除了在禁食条件下采集的四(4)周时间点之外，其余时间点均在进食条件下采集。

图13A-13B是显示HEK293细胞的细胞内胰岛素含量和所分泌胰岛素水平的图，这些细胞转染了包含经修饰的胰岛素的核酸序列的AAV质粒(pAAV)。

图14A-14D是显示HEK293细胞中胰岛素表达水平的图，这些细胞转染了包含经修饰的胰岛素的核酸序列的pAAV。

图15是显示HEK293细胞所分泌胰岛素水平的图，这些细胞转染了包含经修饰的胰岛素的核酸序列的pAAV。

图16A-16F是显示对CD1小鼠进行口服葡萄糖耐量试验后血糖水平的图，这些小鼠经过包含经修饰的胰岛素的核酸序列的AAV载体处理。

图17是显示健康小鼠的空腹葡萄糖水平的图，这些小鼠经过包含经修饰的胰岛素的核酸序列的AAV载体处理。在AAV施用后三(3)周时进行测量。

图18A-18C是显示HEK细胞中TLR9刺激情况的图，这些细胞经过修饰以过表达人TLR9，随后用AAV-ratGck或AAV-hInsB10_2(图18A)；AAV1-hGckWT、AAV1-hGck8或AAV1-hGck12(图18B)；以及AAV1-CMV-hInsB10D、AAV1-hIns5或AAV1-hIns7(图18C)转导。

图19是显示在STZ诱发的1型糖尿病小鼠模型中平均血糖水平随时间变化的图。实心圆圈代表非STZ+PBS媒介物对照；空心圆圈代表STZ+PBS对照；空心三角代表AAV1_926+AAV1_927(高剂量)；以虚线填充的实心三角代表B10H AAV1-Gck(高剂量)；实心菱形代表Ins-B10H+IL6AAV1-Gck(低剂量)；以实线填充的实心三角代表B10H AAV1-Gck(中剂量)；空心菱形代表B10H+IL6AAV1-Gck(高剂量)。

图20A和20B是显示在肌内施用AAV1_926+AAV1_927(高剂量)、B10D AAV1-Gck2(低剂量)、B10H-IL6 AAV1-Gck(低剂量)、B10H-IL6AAV1-Gck(高剂量)或PBS对照后4周时，禁食对照或STZ处理的小鼠中循环人胰岛素水平(ng/mL)的图。对于因健康状况不佳/低血糖而死亡或接受安乐死的动物，未测定其循环胰岛素水平。图20B中的虚线表示禁食条件下非糖尿病C57BL/6小鼠中的循环胰岛素水平。

图21是显示在施用B10H AAV1-Gck(高剂量)、Ins-B10H-IL6AAV1-Gck(低剂量)或媒介物对照后8周时，在对照或STZ处理小鼠中进行的口服葡萄糖耐量试验的结果的图。

图22是显示在施用B10H AAV1-Gck(高剂量)、B10H+IL6AAV1-Gck(低剂量)或媒介物对照后8周时，在对照或STZ处理小鼠中进行葡萄糖负荷后0至120分钟计算的血糖水平曲线下面积(AUC)的图。

图23A和23B是显示在施用B10H AAV1-Gck(高剂量)、Ins-B10D AAV-Gck(低剂量)、Ins-B10D AAV-Gck(中剂量)、Ins-B10H+IL6 AAV1-Gck(低剂量)、Ins-B10H+IL6 AAV1-Gck(高剂量)或媒介物对照(图23A)或者B10H-AAV1-Gck(高剂量)、Ins-B10H+IL6 AAV1-Gck(低剂量)或媒介物对照(图23B)后8周时，在对照和STZ处理小鼠中HbA1c水平的图。对于因健康状况不佳/低血糖而死亡或接受安乐死的动物，未测定其HbA1C水平。

图24A-24B是显示在施用B10H AAV1-Gck(低剂量)、B10H AAV1-Gck(高剂量)、Ins-B10D AAV1-Gck(低剂量)、Ins-B10D AAV1-Gck(中剂量)、Ins-B10H+IL6 AAV1-Gck(低剂量)、Ins-B10H+IL6 AAV1-Gck(高剂量)或媒介物对照后，对照或STZ处理小鼠中血清甘油三酯(图24A)或酮类(图24B)水平的图。

图25是显示在施用AAV1mTWhIns+AAV1rGck(KT1+AAV926；高剂量)、AAV1mWTINS+AAV1rGck(INS-17+AAV926；低剂量)或AAV1mWThINS+AAV1rGck(INS-17+AAV926；高剂量)后，STZ处理的小鼠肝脏中hINS表达情况的图。

本公开的发明详述

除非另有定义，本文所用的所有技术和科学术语具有与本公开所属领域普通技术人员通常理解的相同含义。如果发生抵触，则以包括定义在内的本申请为准。除非上下文另有要求，单数术语应包括复数，而复数术语应包括单数。

在本公开的全文中，术语“一种/一个(a)”或“一种/一个(an)”实体指的是该实体中的一个或多个；例如，“一种多核苷酸”应理解为代表一个/种或多个/种多核苷酸。因此，术语“一种/一个(a)”(或“an”)、“一个或多个”和“至少一个”在本文中可以互换使用。

而且，“和/或”在本文中使用时，应该视为具体公开了两个指定特征或组分中的每一个，无论是否具有另一个。因此，在本文中如在短语诸如“A和/或B”中使用的术语“和/或”，意在包括“A和B”、“A或B”、(仅)“A”和(仅)“B”。同样，如在短语诸如“A、B和/或C”中使用的术语“和/或”，意在涵盖以下每个方面：A、B和C；A、B或C；A或C；A或B；B或C；A和C；A和B；B和C；(仅)A；(仅)B；和(仅)C。

术语“约”在本文中用于表示近似地、粗略地、大约地或在某个区间。当术语“约”与数值范围结合使用时，它通过将边界扩展到所列数值之上和之下来调整该范围。一般来说，除非另有说明，术语“约”在本文中用于将数值调整为高于和低于所规定值，有向上或向下(更高或更低)10％的变化幅度。

在一个数字或一系列数字之前的术语“至少”应该理解为包括与术语“至少”相邻的数字，以及逻辑上可以包括的所有后续数字或整数，如从上下文中可以清楚地看出那样。例如，核酸分子中的核苷酸数目必须是整数。例如，“21个核苷酸的核酸分子中至少18个核苷酸”意指18、19、20或21个核苷酸具有指定的特性。当至少出现在一系列数字或一个范围之前时，应该理解“至少”可以修饰该系列或范围中的每个数字。“至少”也不限于整数(例如，“至少5％”包括5.0％、5.1％、5.18％，而不考虑有效树的数字)。

除非另有具体说明，核苷酸序列在本文中仅以单链表示，从左到右沿5′至3′方向。核苷酸和氨基酸在本文中以IUPAC-IUB生化命名委员会推荐的方式表示，或者(对于氨基酸)以单字母代码或三字母代码表示，两者均符合37CFR§1.822的规定和既定用法。

如本文所用的“多核苷酸”或“核酸”意指由磷酸二酯键连接的核苷酸序列。多核苷酸在本文中以从5'到3'方向的方向表示。本公开的多核苷酸可以是脱氧核糖核酸(DNA)分子或核糖核酸(RNA)分子。核苷酸碱基在本文中由单字母代码表示：腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)、肌苷(I)和尿嘧啶(U)。

如本文所用的，术语“多肽”包括肽和蛋白质，除非另有说明。

术语“编码序列”或“编码…的序列”在本文中用于表示“编码”特定蛋白质，例如胰岛素或葡萄糖激酶的DNA或RNA区域(转录区域)。当置于合适的调节区域如启动子的控制下时，编码序列在体外或体内转录(DNA)并翻译(RNA)成多肽。编码序列的边界由5′(氨基)末端的起始密码子和3′(羧基)末端的翻译终止密码子决定。编码序列可以包括但不限于来自原核生物或真核生物的cDNA、来自原核生物或真核生物的基因组DNA以及合成DNA序列。转录终止序列可以位于编码序列的3′侧。

基因可以包含若干个可操作地连接的片段，诸如启动子、5′前导序列、内含子、编码序列和3′-非翻译序列，例如包含多腺苷酸化位点或信号序列。如本文所用的，“基因的表达”指的是基因转录成RNA和/或翻译成活性蛋白质的过程。

如本文所用的开放阅读框(ORF)是阅读框中具有被翻译的能力的部分。ORF是一段连续的密码子，其以起始密码子开始，并以终止密码子结束。在一些方面，ORF序列可以在含有或不含起始密码子序列和/或终止密码子序列的情况下显示或提及。

Kozak共有序列、Kozak共有或Kozak序列，已知是出现在真核生物mRNA上并具有共有(gcc)gccRccAUGG的序列，其中R是起始密码子(AUG)上游三个碱基处的嘌呤(腺嘌呤或鸟嘌呤)，其后跟着另一个“G”。在一些方面，多核苷酸包含与Kozak共有序列具有至少95％、至少99％或更多序列同一性的核酸序列。在一些方面，多核苷酸包含Kozak共有序列。

术语“序列同一性”在本文中用于表示两个或更多个氨基酸(多肽或蛋白质)序列或者两个或更多个核酸(多核苷酸)序列之间的关系，如通过对序列进行比较而确定的。在某些方面，基于两个给定SEQ ID NO的全长或其部分来计算序列同一性。其部分可以指两个SEQ ID NO的至少10％、20％、30％、40％、50％、60％、70％、80％、90％或100％，或者任何其他指定百分比。术语“同一性”还可以指氨基酸或核酸序列之间的序列相关性程度，视情况而定，如通过此类序列串之间的匹配而确定。

在某些方面，确定同一性的方法设计为提供测试序列之间的最大匹配。确定同一性和相似性的方法已编入可公开获取的计算机程序中。

“实质同源性”或“实质相似性”意指，当提及一种核酸或其片段时，表示当与另一种核酸(或其互补链)进行适当的核苷酸插入或缺失的最佳比对时，在至少约95％至99％的序列中存在核苷酸序列同一性。

如本文所用的，并且除非另有说明，当用于描述与第二核酸序列相关的第一核酸序列时，术语“互补的”指的是在一定条件下，包含第一核酸序列的寡核苷酸或多核苷酸与包含第二核酸序列的寡核苷酸或多核苷酸杂交并形成双链体结构的能力，如本领域技术人员会理解的那样。例如，这样的条件可以是严格条件，其中严格条件可以包括：400mM NaCl、40mM PIPES pH 6.4、1mM EDTA、50℃或70℃，持续12-16小时，随后洗涤(参见，例如“Molecular Cloning:A Laboratory Manual”,Sambrook等人(1989)Cold Spring HarborLaboratory Press)。还可以使用其他条件，例如在生物体内部可能遇到的生理学上相关条件。根据杂交核苷酸的最终应用，技术人员将能够确定一组最适用于测试两个序列互补性的条件。

术语“启动子”在本文中用于表示一种核酸序列或片段，其功能是调控一个或多个基因(或编码序列)的转录，相对于基因转录起始位点的转录方向位于上游，并且通过存在DNA依赖性RNA聚合酶的结合位点、转录起始位点和任何其他DNA序列在结构上进行鉴定，其他DNA序列包括但不限于转录因子结合位点、阻遏子和激活蛋白结合位点，以及本领域技术人员已知的直接或间接发挥作用以调节来自启动子的转录量的任何其他核苷酸序列。“组成型启动子”是在大多数生理和发育条件下都具有活性的启动子。“诱导型”启动子是依赖于生理或发育条件而受到调节的启动子。“组织特异性”启动子优先在特定类型的分化细胞/组织中具有活性。

如本文所用的，术语“增强子”是一种刺激或抑制邻近基因转录的顺式作用元件。抑制转录的增强子也称为“沉默子”。增强子可以在任一方向上发挥作用(例如，可以与编码序列相关联)，距离编码序列和转录区域下游位置的距离可多达几千碱基对(kb)。

术语“可操作地连接”、“可操作地插入”、“可操作地定位”、“处于控制之下”或“在转录调控下”意指启动子相对于核酸处于正确的位置和方向，以控制RNA聚合酶的启动和基因的表达。术语“可操作地连接”意指DNA序列和一个或多个调节序列以这样的方式连接，即当合适的分子(例如，转录激活蛋白)与一个或多个调节序列结合时，允许基因表达。术语“可操作地插入”意指导入细胞中的感兴趣的DNA位于一种DNA序列邻近处，该DNA序列指导所导入DNA的转录和翻译(即，促进例如由感兴趣的DNA编码的多肽的产生)。

术语“转基因”在本文中用于表示导入细胞中的基因或核酸分子。转基因的一个实例是编码治疗性多肽的核酸(例如，编码胰岛素的基因和/或编码葡萄糖激酶的基因)。在一些实施方案中，该基因可以存在于细胞中，但在某些情况下通常在细胞中不表达或表达水平不足。在此上下文中，“不足”意指尽管所述基因例如胰岛素和/或葡萄糖激酶在细胞中正常表达，但仍可能出现如本文公开的病况和/或疾病(例如，糖尿病)。在某些方面，转基因允许该基因，例如胰岛素和/或葡萄糖激酶的表达增加或过表达。转基因可以包括细胞天然有的序列，包括并非天然存在于细胞中的序列，或者它可以包括两者的组合。在某些方面，转基因可以包括编码下列的经修饰的序列，即胰岛素、葡萄糖激酶、胰岛素和葡萄糖激酶两者，和/或一种或多种另外蛋白质，其可以可操作地连接到合适的调节序列以用于在细胞中表达编码胰岛素、葡萄糖激酶或胰岛素和葡萄糖激酶两者的序列。在一些方面，转基因没有整合到宿主细胞的基因组中。

术语“经修饰的基因”、“经修饰的核酸”以及诸如此类在本文中可互换使用，意指相对于基因或核酸序列的天然序列引入一个或多个修饰或变化。此类修饰可能会或可能不会导致编码的蛋白序列发生突变。在一些实施方案中，经修饰的核酸编码野生型或突变型蛋白序列或者其片段。

如本文所用的术语“源自/来源于/衍生自”指的是从指定的分子或生物体中分离出来的组分或者使用指定的分子或生物体制备的组分，或者来自指定的分子或生物体的信息(例如，氨基酸或核酸序列)。例如，源自第二核酸序列(例如，野生型人胰岛素基因)的核酸序列(例如，经修饰的人胰岛素基因)可以包括与该第二核酸序列的核苷酸序列相同或实质性相似的核苷酸序列或其部分。在一些方面，突变体、类似物或衍生物可以源自野生型序列。

在多核苷酸的情况下，可以通过例如天然发生的诱变、人工定向诱变或人工随机诱变获得衍生的种类。用于衍生多核苷酸的诱变可以是有意定向的或有意随机的，或两者的混合。

如本文所用的，术语“递送载体”或“载体”包括任何基因元件，诸如质粒、噬菌体、转座子、粘粒、染色体、人工染色体、病毒、病毒体等，当与适当的调控元件相关联时，其能够复制，并且其可以在细胞之间转移基因或核酸序列。因此，该术语包括克隆和表达媒介物，以及病毒载体。在一些方面，设想有用的载体是其中待转录的核酸区段位于启动子的转录调控下的载体。在一些方面，递送载体选自于由下列组成的组，即病毒载体、质粒、脂质和溶酶体。

在一些方面，生物载体包括病毒，特别是减毒和/或复制缺陷型病毒。在一些实施方案中，化学载体包括脂质复合物和裸DNA构建体。

如本文所用的，术语“裸DNA”或“裸核酸”以及诸如此类指的是一种核酸分子，其不包含在病毒颗粒、细菌细胞或其他有助于将核酸递送到靶细胞的细胞质中的封装方式中。裸核酸可以与有助于将核酸递送至靶细胞部位(例如，以促进核酸穿过消化道进入靶细胞，保护核酸免受胃酸的影响，和/或用于穿透肠粘液)和/或靶上皮细胞表面的方式相关联。

“病毒基因组”或“载体基因组”或“病毒载体”指的是包含一个或多个多核苷酸区域的序列，这些多核苷酸区域编码或包含感兴趣的分子，例如，蛋白质、肽和多核苷酸或它们的多个。病毒载体用于将遗传物质递送到细胞中。可以针对特定应用对病毒载体进行修饰。在一些方面，递送载体包括选自于由下列组成的组中的病毒载体，即腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。

如本文所用的术语“腺相关病毒载体”或“AAV载体”指的是包含或来源自腺相关载体的组分并且适合感染哺乳动物细胞、优选人类细胞的任何载体。术语AAV载体通常指包含有效载荷的AAV型病毒颗粒或病毒体。AAV载体可来源于各种血清型，包括血清型的组合(即，“假型”AAV)或来源于各种基因组(例如，单链或自互补基因组)。另外，AAV载体可以具有复制缺陷和/或可靶向。如本文所用的，术语“腺相关病毒”(AAV)包括但不限于1型AAV、2型AAV、3型AAV(包括3A型和3B型)、4型AAV、5型AAV、6型AAV、7型AAV、8型AAV、9型AAV、10型AAV、11型AAV、12型AAV、13型AAV、AAVrh8、AAVrh10、AAVrh.74、蛇AAV、禽AAV、牛AAV、犬AAV、马AAV、绵羊AAV、山羊AAV、虾AAV、Gao等人(J.Virol.78:6381(2004))和Moris等人(Virol.33:375(2004))公开的那些AAV血清型和分支，以及任何其他AAV。参见，例如FIELDS等人VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。在一些方面，“AAV载体”包括已知的AAV载体的衍生物。在一些方面，“AAV载体”包括经修饰的或人工AAV载体。术语“AAV基因组”和“AAV载体”可以互换使用。

如本文所用的，“AAV颗粒”是包含AAV载体的AAV病毒，该AAV载体具有至少一个有效载荷区域(例如，编码胰岛素和/或Gck的多核苷酸)和至少一个反向末端重复(ITR)区域。在一些方面，术语“本公开的AAV载体”或“本文公开的AAV载体”指的是包含本文公开的编码胰岛素、GcK或其组合的多核苷酸或核酸的AAV载体，例如，封装在AAV颗粒中。

病毒对细胞的“转导”意指存在核酸从病毒颗粒到细胞的转移。在一些方面，转导指的是通过病毒载体将编码胰岛素和/或葡萄糖激酶的一种或多种核酸递送到接受体宿主细胞中。例如，本公开的rAAV载体对靶细胞的转导引起包含在该载体中的rAAV基因组(例如，包含本公开的多核苷酸)转移到转导的细胞中。

对细胞的“转染”意指将遗传物质导入细胞中，以达到对该细胞进行遗传修饰的目的。转染可以通过本领域已知的多种方式完成，例如转导或电穿孔。

如本文所用的“载体”意指一种重组质粒或病毒，其包含要在体外或体内递送到宿主细胞中的多核苷酸。

术语“宿主细胞”或“靶细胞”在本文中用于表示在体外或体内发生多核苷酸递送进入的细胞。AAV载体能够转导分裂和非分裂细胞两者。

“重组的”意指不同于通常在自然界中存在的形式。

与载体或病毒衣壳相关的“血清型”由基于衣壳蛋白序列和衣壳结构的独特免疫学特征来定义。

“AAV Cap”意指AAV Cap蛋白，VP1、VP2和VP3及其类似物。

“AAV Rep”意指AAV Rep蛋白及其类似物。

对于侧接有其他元件的序列，“侧翼”表示相对于该序列，在上游和/或下游，即5'和/或3'侧存在一个或多个侧翼元件。术语“侧翼”并非意在表示序列必须是连续的。例如，在编码转基因的核酸和侧翼元件之间可能存在间插序列。“侧翼”存在两个其他元件(例如，ITR)的序列(例如，转基因)表示一个元件位于该序列的5'侧，另一个元件位于该序列的3′侧；然而，在它们之间可能存在间插序列。

如本文所用的，术语“有效量”、“治疗有效量”和“足够量”的例如包含本文公开的多核苷酸的基因治疗组合物指的是当施用于受试者(包括人类)时，足以实现有益或期望结果(包括临床效果)的量，并且因此，“有效量”或其同义词取决于其应用的上下文。

给定的治疗剂或组合物的量将对应于这样的量，其将根据各种因素而变化，诸如给定的药剂、药物制剂、施用途径、疾病或病症的类型、正在接受治疗的受试者(例如，年龄、性别和/或体重)或宿主的特征以及诸如此类。

如本文所用的，术语“基因疗法”是指将核酸序列(例如，包含与一种多核苷酸可操作地连接的启动子的核酸，该多核苷酸编码如本文所定义的治疗分子)插入个体的细胞和/或组织中以治疗疾病或病况。基因疗法还包括插入本质上具有抑制性的转基因，即其抑制、减少或降低内源性基因或蛋白质，诸如不良或异常(例如，致病性)基因或蛋白质的表达、活性或功能。这种转基因可以是外源性的。可以将外源性分子或序列理解为通常不存在于待治疗的细胞、组织和/或个体中的分子或序列。后天性疾病和先天性疾病都适于接受基因疗法。

在一些方面，本公开提供了编码野生型或突变型胰岛素和/或野生型葡萄糖激酶或其功能性片段的经修饰的核酸。本公开还提供了核酸构建体，其包括编码野生型或突变型胰岛素和/或野生型葡萄糖激酶或其功能性片段的一种或多种经修饰核酸作为构建体序列的一部分。例如，本公开包括表达盒、质粒和/或其他载体，它们包括一种或多种经修饰的核酸序列以及其他元件，例如调节元件。在一些方面，本公开提供了一种包装型基因递送媒介物，例如病毒衣壳，其包括编码野生型或突变型胰岛素和/或野生型葡萄糖激酶或其功能性片段的一种或多种经修饰的核酸序列。本公开还包括通过将一种或多种经修饰核酸序列与促进在细胞中表达所需的元件一起递送到细胞中来表达野生型或突变型胰岛素和/或野生型葡萄糖激酶或其功能性片段的方法。本公开还提供了基因治疗方法，其中将编码野生型或突变型胰岛素和/或野生型葡萄糖激酶或其功能性片段的一种或多种经修饰核酸序列施用于受试者，例如作为一种或多种载体的组分和/或包装为一种或多种病毒基因递送媒介物的组分。例如，可以进行治疗以在有此需要的受试者中治疗或减轻糖尿病症状。本文将进一步详细论述本公开的这些方面中的每一个。

经修饰的核酸

在一些方面，本公开提供了包含编码胰岛素、葡萄糖激酶或其组合的经修饰(例如，经密码子优化和/或减少CpG含量)的核酸的多核苷酸。在一些方面，经修饰的核酸编码人胰岛素(例如，前胰岛素原或胰岛素原、其突变体、类似物或变体)。在一些方面，经修饰的核酸编码人葡萄糖激酶(例如，Gck、其突变体、类似物或变体)。在一些方面，对编码序列的修饰保留了胰岛素和/或葡萄糖激酶的野生型或突变型氨基酸序列。在一些方面，所编码的人Ins蛋白包含信号序列和胰岛素原多肽。在一些方面，所编码的人Ins蛋白包含SEQ IDNO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110中任一项的氨基酸序列。在一些方面，经修饰的核酸序列编码人前胰岛素原(例如，SEQ IDNO:41、SEQ ID NO:144或SEQ ID NO:145)。在一些方面，经修饰的核酸序列编码人Gck(例如，SEQ ID NO:82)。

在一些方面，经修饰的核酸是经过密码子优化的。在一些方面，密码子优化包括对编码胰岛素或葡萄糖激酶的核酸的开放阅读框中的密码子进行修饰。在一些方面，相对于相应的野生型序列和/或未修饰序列，经修饰的核酸包含降低的CpG含量。

在一些方面，相对于相应的野生型序列和/或未修饰序列，经修饰的核酸具有降低的先天免疫原性。在一些方面，相对于相应的野生型序列和/或未修饰序列，经修饰的核酸的表达增加。在一些方面，相对于相应的野生型序列和/或未修饰序列，经修饰的核酸的表达降低。在一些方面，经修饰的序列是通过计算机模拟方法然后进行人工序列检查开发的。可以使用分子生物学技术产生本公开的核酸，例如，可以通过PCR扩增或cDNA克隆技术获得编码胰岛素或葡萄糖激酶的经修饰的cDNA。

在一些方面，对核酸序列进行修饰以降低CpG含量，例如，通过TLR9二聚化和相关通路最大限度地减少炎症应答。在一些方面，某些CpG基序对其炎症效应具有抑制或中和作用。在一些实施方案中，可以保留这些基序中的一个或多个。在一些方面，可以将这种CpG基序导入核酸序列中，以抑制TLR9二聚化的下游效应。

在一些方面，相对于相应的野生型多核苷酸和/或未修饰多核苷酸，密码子修饰可以降低编码胰岛素和/或葡萄糖激酶的多核苷酸的免疫原性。在一些方面，相对于相应的野生型和/或未修饰多核苷酸，密码子修饰提高了编码胰岛素或葡萄糖激酶的多核苷酸的表达。在一些方面，相对于相应的野生型Gck多核苷酸和/或未修饰Gck多核苷酸，密码子修饰可以降低编码葡萄糖激酶的多核苷酸的免疫原性。

本公开的经修饰核酸可以存在于全细胞中、细胞裂解物中，或者以部分纯化或基本上纯的形式存在。可以分离出经修饰核酸。当通过标准技术，包括碱性/SDS处理、CsCl分带、柱层析、琼脂糖凝胶电泳和本领域熟知的其他技术，将核酸从其他细胞组分或其他污染物(例如其他细胞核酸或蛋白质)中纯化出来时，该核酸是“分离的”或“呈基本上纯的”，参见，例如F.Ausubel等人编著(1987)Current Protocols in Molecular Biology,GreenePublishing and Wiley Interscience,New York。在一些方面，本公开的经修饰核酸可以是例如DNA或RNA，并且可以含有或不含内含子序列。在一些方面，该核酸可以是cDNA分子。

经修饰的胰岛素核酸

在一些方面，相对于野生型(SEQ ID NO:147)和/或未修饰的人胰岛素(Ins)或者人Ins突变体或类似物(例如，SEQ ID NO:110或SEQ ID NO:111)，对本文公开的多核苷酸或核酸序列进行修饰。在一些方面，相对于包括5'UTR、ORF和/或3'UTR的序列，例如对应于SEQID NO:1或SEQ ID NO:127，对多核苷酸或核酸进行修饰。在一些方面，经修饰的核酸编码野生型人胰岛素(SEQ ID NO:41)、其变体或突变体(例如，SEQ ID NO:144或SEQ ID NO:145)或者其功能性片段。

胰岛素包括两条多肽链A链和B链，它们通过二硫键连接在一起。它首先合成为一种称为前胰岛素原的单一多肽。“前胰岛素原”是胰岛素基因的初级翻译产物。它是一种长度为110个氨基酸的肽。前胰岛素原包括其N-末端连接有信号肽的胰岛素原分子。包括前胰岛素原信号肽的部分N-末端被切割掉，剩下的氨基酸作为“胰岛素原”。由此产生的切割序列的氨基酸1-30是“B链”，并且此处的“B10”对应于前胰岛素原的34位。因此，例如，“B10”胰岛素原突变对应于前胰岛素原中的H34突变。在某些方面，如本文所提及的，“B10H”是指B10位的野生型组氨酸氨基酸(在野生型前胰岛素原序列中也称为H34)。前胰岛素原和胰岛素原还包括A链和B链之间的C-肽。在成熟的胰岛素蛋白中，C-肽被蛋白水解切割，并且A链和B链通过二硫键连接。

在一些方面，本文公开的经修饰的编码序列编码前胰岛素原突变体，其相对于野生型前胰岛素原(SEQ ID NO:41)中的相应位置，包含H34、P52、K53、R55和/或L86位的一个或多个突变。在一些方面，经修饰的编码序列编码前胰岛素原突变体，其相对于SEQ ID NO:41中的相应位置，包含以下突变H34D、H34I、H34V、P52D、K53R、R55K和/或L86R中的一个或多个。在一些方面，经修饰的编码序列编码前胰岛素原突变体，其相对于SEQ ID NO:41中的相应位置，包含突变H34D、H34I、H34V、P52D、K53R、R55K和/或L86R。在一些方面，经修饰的编码序列编码前胰岛素原突变体，其相对于SEQ ID NO:41中的相应位置，包含突变P52D、K53R、R55K和/或L86R。在一些方面，经修饰的编码序列编码与选自SEQ ID NO:41、SEQ ID NO:144或SEQ ID NO:145中的氨基酸序列至少90％、95％、99％或100％相似的氨基酸序列。在一些方面，经修饰的编码序列编码与选自SEQ ID NO:41、SEQ ID NO:144或SEQ ID NO:145中的氨基酸序列至少90％、95％、99％或100％相似的氨基酸序列，其中该氨基酸序列相对于SEQID NO:41中的相应位置，包含以下突变H34D、H34I、H34V、P52D、K53R、R55K和/或L86R中的一个或多个。在一些方面，经修饰的编码序列编码的氨基酸序列不包括相对于SEQ ID NO:41中相应位置的H34突变。

在一些方面，经修饰的核酸序列包含切割位点，例如弗林蛋白酶内切蛋白酶切割位点。

在一些方面，经修饰的核酸序列包含编码信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)的核酸。在一些方面，前胰岛素原包含野生型胰岛素信号序列(例如，MALWMRLLPLLALLALWGPDPAAA(SEQ ID NO:165)或SEQ ID NO:41的氨基酸1-24)。在一些方面，将野生型前胰岛素原的信号序列替换为非胰岛素分泌肽，例如IL-6信号序列(例如，MNSFSTSAFGPVAFSLGLLLVLPAAFPAP(SEQ ID NO:166))或纤连蛋白信号序列(例如，MLRGPGPGLLLLAVQCLGTAVPSTGA(SEQ ID NO:167))。

在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含选自H34D、H34I或H34V的氨基酸修饰，这些氨基酸修饰对应于野生型前胰岛素原的氨基酸位置(或者在胰岛素原B链的B10位处，将组氨酸(H)置换为天冬氨酸(D)、异亮氨酸(I)或缬氨酸(V))。在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰H34D(或者在胰岛素原B链的B10位处，将组氨酸(H)置换为天冬氨酸(D))。在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含选自H34D、H34I或H34V中的氨基酸修饰，这些氨基酸修饰对应于野生型前胰岛素原的氨基酸位置(或者在胰岛素原B链的B10位处，将组氨酸(H)置换为天冬氨酸(D)、异亮氨酸(I)或缬氨酸(V))，其中该人胰岛素任选地包含切割位点例如弗林蛋白酶切割位点和信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)。

在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰K53R、R55K和L86R(或者修饰对应于在B29位处将胰岛素原赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))。在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰K53R、R55K和L86R(或者修饰对应于在B29位处将胰岛素原赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))，其中该人胰岛素任选地包含切割位点例如弗林蛋白酶切割位点和信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)。

在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰H34D、K53R、R55K和L86R(或者修饰对应于在B10位处将胰岛素原组氨酸(H)置换为天冬氨酸(D)、在B29位处将赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))。在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰H34D、K53R、R55K和L86R(或者修饰对应于在B10位处将胰岛素原组氨酸(H)置换为天冬氨酸(D)、在B29位处将赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))，其中该人胰岛素任选地包含切割位点例如弗林蛋白酶切割位点和信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)。

在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰H34I、K53R、R55K和L86R(或者修饰对应于在B10位处将胰岛素原组氨酸(H)置换为异亮氨酸(I)、在B29位处将赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))。在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰H34I、K53R、R55K和L86R(或者修饰对应于在B10位处将胰岛素原组氨酸(H)置换为异亮氨酸(I)、在B29位处将赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))，其中该人胰岛素任选地包含切割位点例如弗林蛋白酶切割位点和信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)。

在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰H34V、K53R、R55K和L86R(或者修饰对应于在B10位处将胰岛素原组氨酸(H)置换为缬氨酸(V)、在B29位处将赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))。在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰H34V、K53R、R55K和L86R(或者修饰对应于在B10位处将胰岛素原组氨酸(H)置换为缬氨酸(V)、在B29位处将赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))，其中该人胰岛素任选地包含切割位点例如弗林蛋白酶切割位点和信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)。

在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含对应于野生型前胰岛素原氨基酸位置的氨基酸修饰P49D、K53R、R55K和L86R(或者修饰对应于在B28位处将胰岛素原脯氨酸(P)置换为天冬氨酸(D)、在B29位处将赖氨酸(K)置换为精氨酸(R)、在C1位处将精氨酸(R)置换为赖氨酸(K)和在C32位处将亮氨酸(L)置换为精氨酸(R))。在一些方面，经修饰的核酸编码一种人胰岛素，该胰岛素包含氨基酸修饰P49D、K53R、R55K和L86R(对应于野生型前胰岛素原的氨基酸位置)，其中该人胰岛素任选地包含切割位点例如弗林蛋白酶切割位点和信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)。

在一些方面，经修饰的核酸编码人胰岛素(Ins)蛋白(例如，前胰岛素原或其变体)，其中该核酸包括：(i)编码信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)的核苷酸序列和(ii)编码胰岛素原多肽的核苷酸序列，相对于野生型胰岛素原中相应的氨基酸，该胰岛素原多肽包含在选自人胰岛素B链的氨基酸B10、B28和/或B29、人胰岛素C链的C1和/或C32或者其任意组合的位置处的氨基酸修饰(或者相对于野生型前胰岛素原中相应的氨基酸，在选自氨基酸H34、P52、K53、R55、L86或其任意组合的位置处的氨基酸修饰)。在一些方面，信号肽不是野生型前胰岛素原信号序列(例如，将野生型前胰岛素原序列替换为IL-6信号序列或纤连蛋白信号序列)。在一些方面，该多核苷酸进一步包含切割位点(例如，弗林蛋白酶切割位点)。在一些方面，所编码的人Ins蛋白(例如，前胰岛素原或其变体)相对于野生型前胰岛素原序列包含选自(i)H34D、H34I或H34V的氨基酸修饰(或者在胰岛素原B链的B10位处，将组氨酸(H)置换为天冬氨酸(D)、异亮氨酸(I)或缬氨酸(V))，和/或(ii)在P52、K53、R55和/或L86处的一个或多个氨基酸修饰(或者胰岛素原B链的B28和/或B29位或胰岛素原C链的C1和/或C32位)。在一些方面，在P52、K53、R55和/或L86处的一个或多个氨基酸修饰包括P52D、K53R、R55K、L86R或其任意组合(或者胰岛素原B链或C链中的一个或多个修饰包括在胰岛素原B链的B28位处将脯氨酸(P)置换为天冬氨酸(D)、在胰岛素原B链的B29位处将赖氨酸(K)置换为精氨酸(R)、在胰岛素原C链的C1位处将精氨酸(R)置换为赖氨酸(K)、在胰岛素原C链的C32位处将亮氨酸(L)置换为精氨酸(R)，或其任意组合)。

在一些方面，经修饰的核酸编码变体或突变型人胰岛素蛋白或者其功能性片段。在一些方面，人胰岛素蛋白包含与SEQ ID NO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％同一性的氨基酸序列。在一些方面，人胰岛素蛋白包含与SEQ IDNO:41、SEQ ID NO:144或SEQ ID NO:145具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％同一性的氨基酸序列。在一些方面，相对于野生型人胰岛素，人胰岛素蛋白包含插入、缺失、置换或其组合。在一些方面，人胰岛素蛋白包含至少一个置换。在一些方面，该至少一个置换是保守性置换。在一些方面，该至少一个置换是非保守性置换。

在一些方面，本公开的多核苷酸包括开放阅读框(ORF)，该ORF包含核酸序列，该核酸序列具有与SEQ ID NO:43-57、110-116、150-151、154-155和157-159中任一项的核酸73-330，SEQ ID NO:117-122、152和156中任一项的核酸88-345，或者SEQ ID NO:153的核酸79-336至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的核苷酸序列。在一些方面，ORF进一步包含编码信号肽的核酸序列。

在一些方面，本公开的多核苷酸包括开放阅读框(ORF)，该ORF包含与选自于下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列：SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ IDNO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ IDNO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158或SEQ ID NO:159，其中该经修饰的核酸序列编码人胰岛素蛋白(例如，SEQ ID NO:41、SEQ ID NO:144或SEQ ID NO:145)或其功能性片段。在一些方面，本公开的多核苷酸包含开放阅读框(ORF)，该ORF包含与SEQ ID NO:122具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，本公开的多核苷酸包含开放阅读框，该开放阅读框包含具有以下序列的核酸：SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ IDNO:120、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ IDNO:158或SEQ ID NO:159。在一些方面，本公开的多核苷酸包含开放阅读框，该开放阅读框包含具有SEQ ID NO:122序列的核酸。在一些方面，该多核苷酸包含表1、表13和/或图1A中存在或提及的ORF序列。

在一些方面，本公开的多核苷酸包含两个或更多个ORF，这些ORF选自由与以下序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列组成的组：SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ IDNO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ IDNO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ IDNO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ IDNO:159，及其任何组合。在一些方面，两个或更多个ORF中之一与SEQ ID NO:122具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些方面，两个或更多个ORF选自于由以下序列组成的组，即SEQ ID NO:43、SEQ ID NO:44、SEQID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQID NO:57、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQID NO:120、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQID NO:158、SEQ ID NO:159，及其任何组合。在一些方面，两个或更多个ORF中之一具有SEQID NO:122的核酸序列。

在一些方面，两个或更多个ORF可操作地连接。在一些方面，ORF由IRES可操作地连接。在一些方面，IRES包含与SEQ ID NO:142或SEQ ID NO:143具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，IRES包含SEQ ID NO:142或SEQ ID NO:143的核酸序列。

在一些方面，由IRES连接的两个或更多个ORF包括与包含下列的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列：SEQ ID NO:110和SEQ ID NO:53、SEQ ID NO:47和SEQ ID NO:54、SEQ ID NO:49和SEQID NO:56、SEQ ID NO:111和SEQ ID NO:114、SEQ ID NO:112和SEQ ID NO:115、SEQ ID NO:113和SEQ ID NO:116、SEQ ID NO:120和SEQ ID NO:114、SEQ ID NO:121和SEQ ID NO:115、或SEQ ID NO:122和SEQ ID NO:116。在一些方面，通过IRES连接的两个或更多个ORF包括含有下列的核酸序列：SEQ ID NO:110和SEQ ID NO:53、SEQ ID NO:47和SEQ ID NO:54、SEQID NO:49和SEQ ID NO:56、SEQ ID NO:111和SEQ ID NO:114、SEQ ID NO:112和SEQ ID NO:115、SEQ ID NO:113和SEQ ID NO:116、SEQ ID NO:120和SEQ ID NO:114、SEQ ID NO:121和SEQ ID NO:115、或SEQ ID NO:122和SEQ ID NO:116。

在一些方面，本公开的多核苷酸进一步包含经修饰的5'UTR核酸序列。在一些方面，本公开的多核苷酸进一步包含5'UTR，该5'UTR包含与SEQ ID NO:42、SEQ ID NO:42的核酸5-329、或SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该多核苷酸进一步包含Kozak共有序列(Kozak共有或Kozak序列)。在一些方面，该5'UTR包含具有SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ IDNO:148序列的核酸。在一些方面，该多核苷酸包含表1和/或图1A中存在或提及的5'UTR核酸序列。

在一些方面，本公开的多核苷酸进一步包含经修饰的3'UTR核酸序列。在一些方面，本公开的多核苷酸进一步包含3'UTR，该3'UTR包含与SEQ ID NO:60、SEQ ID NO:97、SEQID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101或SEQ ID NO:149具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性核酸序列。在一些方面，该3'UTR包含具有SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101或SEQ ID NO:149序列的核酸。在一些方面，该3'UTR包含选自下组的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI及其任意组合。在一些方面，该多核苷酸包含表1和/或图1A中存在或提及的3'UTR核酸序列。

在一些方面，本公开的多核苷酸包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列：SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:84、SEQ ID NO:85、SEQ IDNO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161，其中该核酸序列编码人胰岛素蛋白(例如，SEQ ID NO:41、SEQ IDNO:144或SEQ ID NO:145)或其功能性片段。在一些方面，本公开的多核苷酸包含与SEQ IDNO:138具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，本公开的多核苷酸包含与选自下列中的序列的核酸5-957具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16。在一些方面，本公开的多核苷酸包含具有以下序列的核酸，即SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161。在一些方面，本公开的多核苷酸包含具有SEQ ID NO:138序列的核酸。在一些方面，本公开的多核苷酸包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的核酸5-957。在一些方面，该多核苷酸包含经修饰的核酸，该经修饰的核酸包含表1和/或图1A中所示的5'UTR、ORF和3'UTR。

在一些方面，本公开的多核苷酸编码包含野生型前胰岛素原分泌信号肽的人胰岛素。在一些方面，本公开的多核苷酸不编码野生型前胰岛素原分泌信号肽。在一些方面，野生型前胰岛素原由非胰岛素分泌信号替换。在一些方面，本公开的多核苷酸编码包含白细胞介素6(IL-6)分泌信号肽的人前胰岛素原。在一些方面，本公开的多核苷酸编码包含纤连蛋白分泌信号肽的人前胰岛素原。

经修饰的葡萄糖激酶核酸

在一些方面，相对于野生型和/或未修饰人葡萄糖激酶(Gck)，例如包括5'UTR、ORF和/或3'UTR的核酸序列，例如，对应于SEQ ID NO:19，对本文公开的多核苷酸或核酸序列进行修饰。在一些方面，经修饰的核酸编码野生型人葡萄糖激酶(SEQ ID NO:82)或其功能性片段。

在一些方面，本公开的多核苷酸包括ORF，该ORF包含与选自于下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列：SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQID NO:78、SEQ ID NO:79、SEQ ID NO:80或SEQ ID NO:162，其中该核酸序列编码人葡萄糖激酶蛋白(SEQ ID NO:82)或其功能性片段。在一些方面，本公开的多核苷酸包括开放阅读框，该开放阅读框包含具有以下序列的核酸，即SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80或SEQID NO:162。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的ORF序列。

在一些方面，本公开的多核苷酸进一步包含经修饰5'UTR核酸序列。在一些方面，本公开的多核苷酸进一步包含5'UTR，该5'UTR包含与SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该多核苷酸进一步包含Kozak共有序列(Kozak共有或Kozak序列)。在一些方面，该5'UTR包含具有SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ IDNO:148序列的核酸。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的5'UTR序列。

在一些方面，本公开的多核苷酸进一步包含经修饰3'UTR核酸序列。在一些方面，本公开的多核苷酸进一步包含3'UTR，该3'UTR包含与SEQ ID NO:60、SEQ ID NO:102、SEQID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109或SEQ ID NO:149存在至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该3'UTR包含具有SEQ IDNO:60、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109或SEQ ID NO:149序列的核酸。在一些方面，该3'UTR包含选自下组的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI及其任意组合。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的3'UTR序列。

在一些方面，本公开的多核苷酸包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列：SEQID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQID NO:39、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:163或SEQ ID NO:164，其中该核酸序列编码人葡萄糖激酶蛋白(例如，SEQ ID NO:82)或其功能性片段。在一些方面，本公开的多核苷酸包含与选自以下的序列的核酸5-2025具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:39。在一些方面，本公开的多核苷酸包含具有以下序列的核酸：SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:89、SEQID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQID NO:96、SEQ ID NO:163或SEQ ID NO:164。在一些方面，本公开的多核苷酸包含以下序列的核酸5-2025：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38或SEQ ID NO:39。在一些方面，该多核苷酸是表2和/或图2A中存在或提及的经修饰核酸。

表达构建体

在一些方面，本公开还提供了一种表达盒，其包含本文公开的核酸序列，例如编码胰岛素、葡萄糖激酶、其组合或其功能性片段的经修饰核酸序列，以及与该核酸序列可操作地连接的异源调控序列。在一些方面，异源调控序列是启动子。

具有与感兴趣的DNA可操作地连接的真核生物启动子的核酸构建体可用于本公开。可根据本公开使用的包含DNA序列(或相应的RNA序列)的构建体可以是包含感兴趣的DNA或RNA序列的任何真核表达构建体。例如，可以切割质粒或病毒构建体(例如，AAV载体)以提供具有可连接末端的线性DNA。这些末端与具有互补性末端(类似可连接末端)的外源性DNA结合，以提供具有完整复制子和所需表型特性的生物学功能性重组DNA分子。在一些方面，该构建体能够在真核和原核宿主中复制。

在一些方面，本公开中使用的外源DNA获自合适的细胞，并且使用本领域已知的技术制备构建体。同样，在遗传改变的宿主细胞中获得外源DNA或RNA序列表达的技术是本领域已知的(参见，例如Kormal等人,Proc.Natl.Acad.Sci.USA,84:2150-2154(1987)；Sambrook等人,Molecular Cloning:a Laboratory Manual,第2版,1989,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.；其中每一个关于用于感兴趣的DNA真核表达的方法和组合物都在此通过引用方式并入)。

在一些方面，DNA构建体含有启动子以促进感兴趣的DNA(例如，编码胰岛素、葡萄糖激酶、其组合或其片段的经修饰核酸)在分泌细胞内的表达。在一些方面，启动子是强真核生物启动子，例如来自巨细胞病毒(CMV)、小鼠乳腺肿瘤病毒(MMTV)、劳斯肉瘤病毒(RSV)或腺病毒的启动子。示例性启动子包括但不限于来自人CMV的立即早期基因的启动子(Boshart等人,Cell 41:521-530(1985))和来自RSV的长末端重复序列(LTR)的启动子(Gorman等人,Proc.Natl.Acad.Sci.USA 79:6777-6781(1982))。备选地，所用的启动子可以是组织特异性启动子。

本公开的构建体还可以包括其他组分，诸如有助于选择含有和/或表达该构建体的细胞的标志物(例如，抗生素抗性基因(如氨苄青霉素抗性基因)或β-半乳糖苷酶)、用于该构建体在细菌细胞中稳定复制的复制起点(优选地，高拷贝数复制起点)、核定位信号，或促进产生DNA构建体、由其编码的蛋白质或两者的其他元件。

对于真核表达，该构建体可以至少包含真核生物启动子，其可操作地连接至感兴趣的DNA(例如，编码胰岛素、葡萄糖激酶、其组合或其片段的经修饰核酸)，该感兴趣的DNA又可操作地连接至多腺苷酸化序列。多腺苷酸化信号序列可选自本领域已知的多种多腺苷酸化信号序列中的任何一种。在一些方面，多腺苷酸化信号序列是SV40早期多腺苷酸化信号序列。该构建体还可以包括一个或多个内含子，其可以增加感兴趣的DNA的表达水平，特别是在该感兴趣的DNA是cDNA的情况下(例如，不含天然存在序列的内含子)。可以使用本领域已知的多种内含子中的任何一种(例如，人β-珠蛋白内含子，将其插入构建体中，位于感兴趣的DNA的5'位置)。

可以将感兴趣的DNA(例如，编码胰岛素、葡萄糖激酶、其组合或其片段的经修饰核酸)插入到构建体中，使得治疗分子(例如，蛋白质)以融合蛋白(例如，在N-末端部分具有β-半乳糖苷酶或其部分并在C-末端部分具有治疗性蛋白的融合蛋白)的形式表达。融合蛋白的产生可以促进表达该蛋白的转化细胞的鉴定(例如，通过使用与融合蛋白结合的抗体的酶联免疫吸附测定(ELISA))。

用于递送感兴趣的DNA(例如，编码胰岛素、葡萄糖激酶、其组合或其片段的经修饰核酸)的载体可以是病毒型或非病毒型，或者可以由裸DNA与佐剂如病毒颗粒(例如，AAV颗粒)或阳离子脂质或脂质体混合组成。“佐剂”是一种本身并不产生期望效果的物质，但其作用是增强或以其他方式改善活性化合物的作用。所用的精确载体和载体配方将取决于几种因素，例如基因转移的靶向细胞和/或器官。

合适启动子的实例包括巨细胞病毒(CMV)中间早期启动子、病毒长末端重复序列启动子(LTR)，诸如来自莫罗尼氏鼠白血病病毒(MMLV)、劳斯肉瘤病毒或HTLV-1的启动子、猿猴病毒40(SV 40)早期启动子、RSV启动子和单纯疱疹病毒胸苷激酶启动子。在一些方面，启动子是细胞特异性和/或组织特异性启动子。在一些方面，将启动子与内含子序列一起使用。在一些方面，启动子具有组织特异性。在一些方面，启动子是CMV启动子。在一些方面，CMV启动子是迷你CMV启动子。

在一些方面，表达盒包含可操作地连接至经修饰核酸序列的启动子，该经修饰核酸序列包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的ORF：SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ IDNO:120、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ IDNO:158或SEQ ID NO:159，其中该经修饰核酸序列编码人胰岛素蛋白(例如，SEQ ID NO:41、SEQ ID NO:144或SEQ ID NO:145)或其功能性片段。在一些方面，表达盒包含可操作地连接至经修饰核酸序列的启动子，该经修饰核酸序列包含与SEQ ID NO:122具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的ORF。在一些方面，本公开的多核苷酸包含开放阅读框，该开放阅读框包含具有以下序列的核酸：SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158或SEQ ID NO:159。在一些方面，本公开的多核苷酸包含开放阅读框，该开放阅读框包含具有SEQ ID NO:122序列的核酸。在一些方面，该多核苷酸包含表1、表13和/或图1A中存在或提及的ORF序列。

在一些方面，表达盒包含编码人胰岛素的多核苷酸，该人胰岛素包含野生型前胰岛素原分泌信号肽。在一些方面，本公开的多核苷酸不编码野生型前胰岛素原分泌信号肽。在一些方面，野生型前胰岛素原由非胰岛素分泌信号替换。在一些方面，表达盒包含编码人前胰岛素原的多核苷酸，该人前胰岛素原包含白细胞介素6(IL-6)分泌信号肽。在一些方面，表达盒包含编码人前胰岛素原的多核苷酸，该人前胰岛素原包含纤连蛋白分泌信号肽。

在一些方面，表达盒包含经修饰核酸，该经修饰核酸进一步包含5'UTR，该5'UTR包含与SEQ ID NO:42、SEQ ID NO:42的核酸5-329、或SEQ ID NO:83、SEQ ID NO:146或SEQ IDNO:148具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该5'UTR包含具有SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148序列的核酸。在一些方面，该多核苷酸包含表1和/或图1A中存在或提及的5'UTR序列。

在一些方面，表达盒包含经修饰核酸，该经修饰核酸进一步包含3'UTR，该3'UTR包含与SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ IDNO:101或SEQ ID NO:149具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该3'UTR包含具有SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101或SEQ IDNO:149序列的核酸。在一些方面，该3'UTR包含选自下组中的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI及其任意组合。在一些方面，该多核苷酸包含表1和/或图1A中存在或提及的3'UTR序列。

在一些方面，表达盒包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQID NO:87、SEQ ID NO:88、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQID NO:132、SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161，其中该经修饰核酸序列编码人胰岛素蛋白(例如，SEQ ID NO:41、SEQ IDNO:144或SEQ ID NO:145)或其功能性片段。在一些方面，表达盒包含与SEQ ID NO:138具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸。在一些方面，表达盒包含与选自下列中的序列的核酸5-957具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16。在一些方面，表达盒包含具有以下序列的经修饰核酸：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:123、SEQID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134、SEQID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161。在一些方面，表达盒包含具有SEQID NO:138序列的经修饰核酸。在一些方面，表达盒包含与选自下列中的序列的核酸5-957具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16。在一些方面，表达盒包含经修饰核酸，该经修饰核酸包含表1和/或图1A中存在或提及的5'UTR、ORF和3'UTR。

在一些方面，表达盒包含可操作地连接至经修饰核酸序列的启动子，该经修饰核酸序列包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的ORF：SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80或SEQID NO:162。在一些方面，表达盒包含可操作地连接至经修饰核酸的启动子，该经修饰核酸具有以下序列：SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ IDNO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ IDNO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80或SEQ ID NO:162。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的ORF序列。

在一些方面，表达盒包含经修饰核酸，该经修饰核酸进一步包含5'UTR，该5'UTR包含与SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ IDNO:148具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该5'UTR包含具有SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148序列的核酸。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的5'UTR序列。

在一些方面，表达盒包含经修饰核酸，该经修饰核酸进一步包含3'UTR，该3'UTR包含与SEQ ID NO:60、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109或SEQ ID NO:149具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该3'UTR包含具有SEQ ID NO:60、SEQ ID NO:102、SEQ ID NO:103、SEQID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109或SEQ ID NO:149序列的核酸。在一些方面，该3'UTR包含选自下组的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI及其任意组合。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的3'UTR序列。

在一些方面，表达盒包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:39、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ IDNO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:163或SEQ ID NO:164，其中该核酸序列编码人葡萄糖激酶蛋白(例如，SEQ ID NO:82)或其功能性片段。在一些方面，表达盒包含与选自下列中的序列的核酸5-2025具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸：SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:39。在一些方面，表达盒包含具有以下序列的经修饰核酸：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:89、SEQ ID NO:90、SEQ IDNO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ IDNO:163或SEQ ID NO:164。在一些方面，表达盒包含经修饰核酸，该经修饰核酸包含以下序列的核酸5-2025：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38或SEQ ID NO:39。在一些方面，表达盒包含经修饰核酸，该经修饰核酸包含表2和/或图2A中存在或提及的5'UTR、ORF和3'UTR。

在一些方面，表达盒包括第一经修饰核酸和第二经修饰核酸序列，该第一经修饰核酸序列包含与SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ IDNO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:110、SEQID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121、SEQID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158或SEQ ID NO:159具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的第一ORF，该第二经修饰核酸序列包含与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80或SEQID NO:162具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的第二ORF。

在一些方面，表达盒包含可操作地连接至经修饰核酸的启动子，其中第一和第二经修饰核酸的每一个分别连接至第一和第二启动子。在一些方面，包含第一ORF的第一经修饰核酸序列选自于由SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ IDNO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:110、SEQID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121、SEQID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158和SEQ ID NO:159组成的组，并且包含第二ORF的第二经修饰核酸序列选自于由SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ IDNO:80和SEQ ID NO:162组成的组。

在一些方面，第一经修饰核酸序列编码包含野生型前胰岛素原分泌信号肽的人胰岛素。在一些方面，第一经修饰核酸序列不编码野生型前胰岛素原分泌信号肽。在一些方面，野生型前胰岛素原由非胰岛素分泌信号替换。在一些方面，第一经修饰核酸序列编码包含白细胞介素6(IL-6)分泌信号肽的人前胰岛素原。在一些方面，第一经修饰核酸序列编码包含纤连蛋白分泌信号肽的人前胰岛素原。

在一些方面，第一和第二经修饰核酸序列进一步包含5'UTR，该5'UTR包含与SEQID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该5'UTR包含具有SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQID NO:83、SEQ ID NO:146或SEQ ID NO:148序列的核酸。

在一些方面，第一和第二经修饰核酸序列进一步包含3'UTR，该3'UTR包含与SEQID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ IDNO:107、SEQ ID NO:108、SEQ ID NO:109或SEQ ID NO:149具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该3'UTR包含选自下组的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI及其任意组合。在一些方面，该3'UTR包含具有SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQID NO:108、SEQ ID NO:109或SEQ ID NO:149序列的核酸。

在一些方面，表达盒包括第一经修饰核酸和第二经修饰核酸序列，该第一经修饰核酸序列与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:84、SEQ IDNO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:123、SEQ ID NO:124、SEQID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQID NO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性，该第二经修饰核酸序列与SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQID NO:95、SEQ ID NO:96、SEQ ID NO:163或SEQ ID NO:164具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性，其中第一和第二经修饰核酸的每个分别连接至第一和第二启动子。在一些方面，第一经修饰核酸序列与选自SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16中的序列的核酸5-957具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性，并且第二经修饰核酸与选自SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38或SEQ ID NO:39中的序列的核酸5-2025具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些方面，第一经修饰核酸序列选自于由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:123、SEQ IDNO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134、SEQ IDNO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161组成的组，并且第二核酸序列选自于由SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ IDNO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:163或SEQ ID NO:164组成的组。在一些方面，第一经修饰核酸包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ IDNO:16的核酸5-957，并且第二经修饰核酸包含SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:39的核酸5-2025。在一些方面，第一经修饰核酸序列包含表1和/或图1A中存在或提及的5'UTR、ORF和3'UTR，并且第二经修饰核酸序列包含表2和/或图2A中存在或提及的5'UTR、ORF和3'UTR。

本公开的某些方面涉及表达构建体，例如载体。在一些方面，表达构建体包括表达盒。在一些方面，表达构建体进一步包含能够在细胞中稳定并保持游离型的基因组。在本公开的上下文中，在一些方面，细胞或宿主细胞可包括用于制备该构建体的细胞或向其施用该构建体的细胞。在一些方面，构建体能够整合到细胞基因组中，例如通过同源重组或其他方式。在一些方面，表达构建体是其中编码如本文公开的胰岛素和/或葡萄糖激酶的核苷酸序列可操作地连接至如本文提供的启动子的表达构建体，其中启动子能够指导一个或多个核苷酸序列(即，一个或多个编码序列)在细胞中的表达。在一些方面，如本文所用的表达盒包含编码胰岛素的核苷酸序列和/或编码葡萄糖激酶的核苷酸序列或由其组成，在每种情况下核苷酸序列均可操作地连接至启动子，其中该启动子能够指导所述核苷酸序列的表达。在一些方面，病毒表达构建体是旨在用于基因疗法的表达构建体。可以将它设计成包含如本文所公开的病毒基因组的一部分。

在一些方面，表达构建体进一步包含以下一种或多种：ITR序列(例如，AAV2 ITR)、多聚A序列(例如，SV40多腺苷酸化信号、bGH多腺苷酸化信号)和增强子序列(例如，SV40增强子序列)。

在一些方面，本文公开的表达构建体使用重组技术制备，其中编码胰岛素和/或葡萄糖激酶的经修饰核酸序列在合适的细胞，例如培养的细胞或多细胞生物体的细胞中表达，诸如描述于Ausubel等人,“Current Protocols in Molecular Biology”,GreenePublishing and Wiley-Interscience,New York(1987)以及Sambrook和Russell(2001,见上文)；这两者均通过引用方式整体并入本文。另请参见Kunkel(1985)Proc.Natl.Acad.Sci.82:488(描述了定点诱变)和Roberts等人(1987)Nature 328:731-734或Wells,J.A.等人(1985)Gene 34:315(描述了盒式诱变)。

递送载体

本公开还提供了包含本文所述的经修饰核酸、多核苷酸或表达盒中任一种的载体。在一些方面，递送载体是病毒载体、非病毒载体、质粒、脂质或溶酶体。在一些方面，递送载体是病毒载体。在一些方面，病毒载体是腺相关病毒(AAV)表达载体。

在一些方面，在表达构建体或表达载体中使用编码胰岛素和/或葡萄糖激酶的经修饰核酸或核苷酸序列。短语“表达载体”通常指的是能够在宿主中实现基因表达的核苷酸序列，该宿主与此类序列相容。这些表达载体可以至少包括合适的启动子序列和任选的转录终止信号。还可以使用如本文所公开的实现表达所必需的或有助于实现表达的另外因子。可以将编码胰岛素和/或葡萄糖激酶的经修饰核酸或DNA或者经密码子优化的核苷酸序列并入能够导入体外细胞培养物中并在其中表达的表达载体中。在一些方面，该表达载体适于在原核宿主，诸如细菌，如大肠杆菌中复制，或者可以导入培养的哺乳动物、植物、昆虫(例如，Sf9)、酵母、真菌或其他真核细胞系中。在一些方面，该表达构建体适于在体内表达。

在一些方面，该递送载体包含表达盒，该表达盒包含可操作地连接至经修饰核酸序列的启动子，该经修饰核酸序列包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的ORF：SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ IDNO:119、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ IDNO:157、SEQ ID NO:158或SEQ ID NO:159，其中该经修饰核酸序列编码人胰岛素蛋白(例如，SEQ ID NO:41、SEQ ID NO:144或SEQ ID NO:145)或其功能性片段。在一些方面，该递送载体包含表达盒，该表达盒包含可操作地连接至经修饰核酸序列的启动子，该经修饰核酸序列包含与SEQ ID NO:122具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的ORF。在一些方面，经修饰核酸包含具有以下序列的ORF：SEQID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ IDNO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ IDNO:156、SEQ ID NO:157、SEQ ID NO:158或SEQ ID NO:159。在一些方面，经修饰核酸包含具有SEQ ID NO:122序列的ORF。在一些方面，该多核苷酸包含表1、表13和/或图1A中存在或提及的ORF序列。

在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸序列，该经修饰核酸序列编码包含野生型前胰岛素原分泌信号肽的人胰岛素。在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸序列，该经修饰核酸序列不编码野生型前胰岛素原分泌信号肽。在一些方面，野生型前胰岛素原由非胰岛素分泌信号替换。在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸序列，该经修饰核酸序列编码包含白细胞介素6(IL-6)分泌信号肽的人前胰岛素原。在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸序列，该经修饰核酸序列编码包含纤连蛋白分泌信号肽的人前胰岛素原。

在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸，该经修饰核酸进一步包含5'UTR，该5'UTR包含与SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该5'UTR包含具有SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148序列的核酸。在一些方面，该多核苷酸包含表1和/或图1A中存在或提及的5'UTR序列。

在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸，该经修饰核酸进一步包含3'UTR，该3'UTR包含与SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101或SEQ ID NO:149具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该3'UTR包含选自下组的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI及其任意组合。在一些方面，该3'UTR包含具有SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101或SEQ ID NO:149序列的核酸。在一些方面，该多核苷酸包含表1和/或图1A中存在或提及的3'UTR序列。

在一些方面，递送载体包含表达盒，该表达盒包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:123、SEQ ID NO:124、SEQ IDNO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ IDNO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161，其中该经修饰核酸序列编码人胰岛素蛋白(例如，SEQ IDNO:41、SEQ ID NO:144或SEQ ID NO:145)或其功能性片段。在一些方面，递送载体包含表达盒，该表达盒包含与SEQ ID NO:138具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸。在一些方面，递送载体包含表达盒，该表达盒包含与选自下列中的序列的核酸5-957具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸序列：SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15或SEQ ID NO:16。在一些方面，递送载体包含表达盒，该表达盒包含具有以下序列的经修饰核酸：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:123、SEQID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134、SEQID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161。在一些方面，递送载体包含表达盒，该表达盒包含具有SEQ ID NO:138序列的经修饰核酸。在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸，该经修饰核酸包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的核酸5-957。在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸，该经修饰核酸包含表1和/或图1A中存在或提及的5'UTR、ORF和3'UTR。

在一些方面，递送载体包含表达盒，该表达盒包含可操作地连接至经修饰核酸的启动子，该经修饰核酸包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的ORF序列：SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ IDNO:80或SEQ ID NO:162。在一些方面，递送载体包含表达盒，该表达盒包含可操作地连接至经修饰核酸的启动子，该经修饰核酸具有以下序列：SEQ ID NO:61、SEQ ID NO:62、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80或SEQID NO:162。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的ORF序列。

在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸，该经修饰核酸进一步包含5'UTR，该5'UTR包含与SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该5'UTR包含具有SEQ ID NO:42、SEQ ID NO:42的核酸5-329、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148序列的核酸。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的5'UTR序列。

在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸，该经修饰核酸进一步包含3'UTR，该3'UTR包含与SEQ ID NO:60、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109或SEQ ID NO:149具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核酸序列。在一些方面，该3'UTR包含选自下组的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI及其任意组合。在一些方面，该3'UTR包含具有SEQ ID NO:60、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109或SEQ ID NO:149序列的核酸。在一些方面，该多核苷酸包含表2和/或图2A中存在或提及的3'UTR序列。

在一些方面，递送载体包含表达盒，该表达盒包含与选自下列中的序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQID NO:38、SEQ ID NO:39、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:163或SEQ ID NO:164，其中该核酸序列编码人葡萄糖激酶蛋白(例如，SEQ ID NO:82)或其功能性片段。在一些方面，递送载体包含表达盒，该表达盒包含与选自下列中的序列的核酸5-2025具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的经修饰核酸：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38或SEQ ID NO:39。在一些方面，递送载体包含表达盒，该表达盒包含具有以下序列的经修饰核酸：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ IDNO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:163或SEQID NO:164。在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸，该经修饰核酸包含以下序列的核酸5-2025：SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:39。在一些方面，递送载体包含表达盒，该表达盒包含经修饰核酸，该经修饰核酸包含表2和/或图2A中存在或提及的5'UTR、ORF和3'UTR。

在一些方面，递送载体包含表达盒，该表达盒包括第一经修饰核酸和第二经修饰核酸序列，该第一经修饰核酸序列包含与SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158或SEQ ID NO:159具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的第一ORF，该第二经修饰核酸序列包含与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ IDNO:80或SEQ ID NO:162具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的第二ORF。在一些方面，递送载体包含表达盒，该表达盒包含可操作地连接至经修饰核酸的启动子，该经修饰核酸具有以下序列：SEQ ID NO:61、SEQ IDNO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ IDNO:80或SEQ ID NO:162，其中第一和第二经修饰核酸各自分别连接至第一和第二启动子。在一些方面，包含第一ORF的第一经修饰核酸序列选自于由SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ IDNO:119、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ IDNO:157、SEQ ID NO:158和SEQ ID NO:159组成的组，并且包含第二ORF的第二经修饰核酸序列选自于由SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ IDNO:77、SEQ ID NO:78、SEQ ID NO:79和SEQ ID NO:80组成的组。

在一些方面，递送载体包含表达盒，该表达盒包括第一经修饰核酸和第二经修饰核酸序列，该第一经修饰核酸序列与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ IDNO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ IDNO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性，该第二经修饰核酸序列与SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQID NO:38、SEQ ID NO:39、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:163或SEQ ID NO:164具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性，其中第一和第二经修饰核酸各自分别连接至第一和第二启动子。在一些方面，第一经修饰核酸与选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的序列的核酸5-957具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性，并且第二经修饰核酸序列与选自SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:39的序列的核酸5-2025具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些方面，第一经修饰核酸序列选自于由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ IDNO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139、SEQ IDNO:140、SEQ ID NO:141、SEQ ID NO:160或SEQ ID NO:161组成的组，并且第二核酸序列选自由SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ IDNO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:163或SEQ ID NO:164组成的组。在一些方面，第一经修饰核酸序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQID NO:16的核酸5-957，并且第二经修饰核酸序列包含SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:39的核酸5-2025。在一些方面，第一经修饰核酸序列包含表1和/或图1A中存在或提及的5'UTR、ORF和3'UTR，并且第二经修饰核酸序列包含表2和/或图2A中存在或提及的5'UTR、ORF和3'UTR。

在一些方面，递送载体可包含与调控或调节序列、可筛选标志物、任何融合伴侣和/或另外的元件可操作地连接的编码蛋白质(例如，胰岛素和/或Gck)的序列。在某些方面，将经修饰核酸与另一个核酸序列建立功能关系。术语“调节序列”包括启动子、增强子和其他调控蛋白质转录或翻译的表达调控元件(例如，多腺苷酸化信号)。例如，在以下文献中描述了此类调节序列：Goeddel(Gene Expression Technology,Methods inEnzymology185,Academic Press,San Diego,CA(1990))。在一些方面，表达载体包括与编码蛋白质的核酸可操作地连接的转录和翻译调节核酸，并且通常适合用于表达蛋白质的宿主细胞。一般来说，转录和翻译调节序列可以包括启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列以及增强子或激活子序列。如本领域还已知的那样，表达载体可以含有选择基因或标志物，以允许选择含有表达载体的转化宿主细胞。选择基因是本领域已知的，并且会随着所用的宿主细胞而变化。例如，通常可选择标志物基因赋予已在其中导入载体的宿主细胞对药物，诸如G418、潮霉素或甲氨蝶呤的抗性。在一些方面，可筛选标志物基因包括二氢叶酸还原酶(DHFR)基因(用于dhfr-宿主细胞，进行甲氨蝶呤选择/扩增)和neo基因(用于G418选择)。

在一些方面，递送载体是病毒载体或包含病毒表达构建体的基因治疗载体。在某些方面，病毒载体或基因治疗载体是适用于基因治疗的载体。

在一些方面，基因治疗载体包括腺病毒和腺相关病毒(AAV)载体。这些载体感染广泛的分裂和非分裂细胞类型，包括滑膜细胞和肝细胞。进入细胞后腺病毒和AAV载体的游离性质使这些载体适合于治疗应用。如上所示，(Russell,2000,J.Gen.Virol.81:2573-2604；Goncalves,2005,Virol J.2(1):43)。AAV载体可以引起转基因表达的非常稳定的长期表达(在犬中长达9年(Niemeyer等人,Blood.2009年1月22日；113(4):797-806)并且在人类中长达2年(Nathwani等人,N Engl J Med.2011年12月22日；365(25):2357-65,Simonelli等人,Mol Ther.2010年3月；18(3):643-50.电子出版于2009年12月1日))。在一些方面，对腺病毒载体进行修饰以降低宿主应答，如Russell所综述的那样(2000,见上文)。以下文献描述了使用AAV载体进行基因治疗的方法：Wang等人,2005,J Gene Med.3月9日(刊载之前的电子版),Mandel等人,2004,Curr Opin Mol Ther.6(5):482-90,和Martin等人,2004,Eye 18(11):1049-55,Nathwani等人,N Engl J Med.2011年12月22日；365(25):2357-65,Apparailly等人,Hum Gene Ther.2005年4月；16(4):426-34。

在一些方面，基因治疗载体包括逆转录病毒载体。在一些方面，逆转录病毒载体是基于慢病毒的表达构建体。慢病毒载体具有感染分裂和非分裂细胞并稳定整合入它们基因组中的能力(Amado和Chen,1999Science 285:674-6)。在以下文献中描述了基于慢病毒的表达构建体的构建和使用方法：第6,165,782、6,207,455、6,218,181、6,277,633和6,323,031号美国专利以及Federico(1999,Curr Opin Biotechnol 10:448-53)和Vigna等人(2000,J Gene Med 2000；2:308-16)。

在一些方面，基因治疗载体是疱疹病毒载体、多瘤病毒载体或痘苗病毒载体。

在一些方面，基因治疗载体包含编码胰岛素和/或葡萄糖激酶的经修饰核苷酸序列，由此每个所述经修饰核苷酸序列可操作地连接至适当的调节序列。这种调节序列可以至少包含启动子序列。用于从基因治疗载体表达编码胰岛素和/或葡萄糖激酶的核苷酸序列的合适启动子可以包括，例如巨细胞病毒(CMV)中间早期启动子、病毒长末端重复序列启动子(LTR)，诸如来自莫罗尼氏鼠白血病病毒(MMLV)、劳斯肉瘤病毒或HTLV-1的启动子、猿猴病毒40(SV 40)早期启动子和单纯疱疹病毒胸苷激酶启动子。

在一些方面，基因治疗载体包括编码另一种多肽的另一种核苷酸序列。另一种多肽可以是允许鉴定、选择和/或筛选含有表达构建体的细胞的(可选择)标志物多肽。在一些方面，用于此目的的合适标志物蛋白是例如荧光蛋白GFP和可选择标志物基因HSV胸苷激酶(用于HAT培养基上选择)、细菌潮霉素B磷酸转移酶(用于潮霉素B选择)、Tn5氨基糖苷磷酸转移酶(基于G418进行筛选)，以及二氢叶酸还原酶(DHFR)(基于甲氨蝶呤进行筛选)、CD20、低亲和力神经生长因子基因。在以下文献中提供了获取这些标志物基因的来源及其使用方法：Sambrook和Russel(2001)“Molecular Cloning:A Laboratory Manual(第3版),ColdSpring Harbor Laboratory,Cold Spring Harbor Laboratory Press,New York。

非病毒载体

在一些方面，可以使用非病毒载体来施用本公开的经修饰核酸、多核苷酸或表达构建体。如本文所用的“非病毒载体”意在包括裸DNA、含有裸DNA的化学配制品(例如，DNA和阳离子化合物(如硫酸葡聚糖)的配制品)以及裸DNA与佐剂诸如病毒颗粒的混合(即，感兴趣的DNA不包含在病毒颗粒中，但是转化配制品由裸DNA和病毒颗粒(例如，AAV颗粒)组成)(参见，例如Curiel等人,Am.J.Respir.Cell Mol.Biol.6:247-52(1992))。因此，“非病毒载体”可以包括由DNA和病毒颗粒组成的载体，其中病毒颗粒在病毒基因组内不包含感兴趣的DNA。

在一些方面，本公开的经修饰核酸、多核苷酸或表达构建体可以与聚阳离子物质如多聚-L-赖氨酸或DEAC-葡聚糖、靶向配体和/或DNA结合蛋白(例如，组蛋白)复合。DNA-或RNA-脂质体复合物配制品包含脂质混合物，其与遗传物质(DNA或RNA)结合并促进将核酸递送至细胞中。根据本公开可以使用的脂质体包括DOPE(二油酰磷脂酰乙醇胺)、CUDMEDA(N-(5-胆甾烯-3-β-醇3-尿烷基(urethanyl))-N′,N′-二甲基乙二胺)。

在一些方面，还可以将本公开的经修饰核酸、多核苷酸或表达构建体作为与载剂分子(例如，抗体或受体配体)偶联的DNA或RNA的化学配制品施用，该载剂分子有助于递送至宿主细胞以改变宿主细胞的生物学特性。术语“化学配制品”指的是对核酸进行修饰，以允许核酸化合物与载剂分子如蛋白质或脂质或者其衍生物偶联。示例性蛋白载剂分子包括对靶细胞而言具有特异性的抗体，即能够与受体相互作用的分子，这些受体与递送所靶向的细胞相关联。

腺相关病毒载体(AAV载体)

在一些方面，可以将本文公开的经修饰核酸、多核苷酸或表达构建体作为包装型病毒载体的组分施用。一般来说，包装型病毒载体包括包装在衣壳中的病毒载体。

在一些方面，病毒载体是AAV载体。在一些方面，如本文所用的AAV载体可以包括重组AAV载体(rAAV)。如本文所用的“rAAV载体”指的是包含AAV基因组一部分的重组载体，这部分AAV基因组包裹在源自如本文公开的AAV血清型的衣壳蛋白的蛋白壳中。AAV基因组的一部分可以包含源自腺相关病毒血清型的反向末端重复序列(ITR)，这些血清型诸如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAV9、AAV10、AAVRH10、AAV11、AAV12等。在一些方面，ITR源自AAV2。

通常，载体基因组需要使用侧翼5′和3′ITR序列，以允许将载体基因组高效包装到rAAV衣壳中。在一些方面，存在于rAAV载体中的rAAV基因组至少包含AAV血清型之一(例如，如本文前面公开的血清型AAV2)的反向末端重复区域(ITR)的核苷酸序列，或与其基本上相同的核苷酸序列，以及在合适的调节元件(例如，启动子)的控制下编码胰岛素和/或葡萄糖激酶的经修饰核酸序列，其中在两个ITR之间插入调节元件和一个或多个经修饰核酸序列。

已对几种AAV血清型的全基因组和相应的ITR进行了测序(Chiorini等人1999,J.of Virology第73卷,第2期,1309-1319页)。可以对它们进行克隆或通过如本领域已知的化学合成来制备，例如使用由例如Applied Biosystems Inc.(Fosters,Calif.,USA)提供的寡核苷酸合成仪或通过标准分子生物学技术。ITR可以从AAV病毒基因组中克隆或从包含AAV ITR的载体中切离下来。可以使用标准分子生物学技术将ITR核苷酸序列在任一端连接到编码一种或多种治疗性蛋白的核苷酸序列，或者可以将ITR之间的野生型AAV序列替换为所需的核苷酸序列。

包装型病毒载体的病毒衣壳组分可以是细小病毒衣壳，例如AAV Cap和/或嵌合衣壳。合适的细小病毒病毒衣壳组分的实例是来自细小病毒科(Parvoviridae)的衣壳组分，例如来自自主性细小病毒或依赖性细小病毒(Dependovirus)。例如，病毒衣壳可以是AAV衣壳(例如，AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVRH8、AAV9、AAV10、AAVRH10、AAV11或AAV12衣壳；本领域技术人员会了解，可能存在尚未鉴定的执行相同或相似功能的其他变体)，或者可以包括来自两种或更多种AAV衣壳的组分。AAV Cap蛋白的完整组成(full complement)包括VP1、VP2和VP3。包含编码AAV VP衣壳蛋白的核苷酸序列的ORF可包含少于完整组成的AAV Cap蛋白，或者可以提供AAV Cap蛋白的完整组分。

一种或多种AAV Cap蛋白可以是嵌合蛋白，包括来自两种或更多种病毒，优选两种或更多种AAV的AAV Cap的氨基酸序列。例如，嵌合性病毒衣壳可包括AAV1 Cap蛋白或亚基和至少一个AAV2 Cap蛋白或亚基。在一些方面，如rAAV载体中存在的rAAV基因组不包含任何编码病毒蛋白的核苷酸序列，例如AAV的rep(复制)或cap(衣壳)基因。这种rAAV基因组可进一步包含标志物或报告基因，诸如编码例如抗生素抗性基因、荧光蛋白(例如，gfp)的基因或者编码本领域已知的以化学方式、酶学方式或其他方式可检测和/或可选择的产物(例如，lacZ、aph等)的基因。

在一些方面，如存在于所述rAAV载体中的rAAV基因组进一步包含与编码胰岛素和/或葡萄糖激酶的核苷酸序列可操作地连接的启动子序列。在一些方面，启动子序列是赋予在肌肉细胞和/或肌肉组织中表达的启动子。此类启动子的实例包括如本文公开的CMV和RSV启动子。

在一些方面，合适的3′非翻译序列也可以与编码胰岛素和/或葡萄糖激酶的经修饰核酸序列可操作地连接。合适的3'非翻译区可以是与该核苷酸序列天然相关联的区域，或者可以源自不同的基因，如例如牛生长激素3'非翻译区(例如，bGH多腺苷酸化信号、SV40多腺苷酸化信号、SV40多腺苷酸化信号和增强子序列)。

在一些方面，另外的核苷酸序列可以可操作地连接至编码胰岛素和/或葡萄糖激酶的一个或多个经修饰核酸序列，例如编码信号序列、核定位信号、表达增强子等的核苷酸序列。

除非另有说明，否则本领域技术人员已知的方法可用于构建重组细小病毒和AAV(rAAV)构建体、表达细小病毒Rep和/或Cap序列的包装载体以及瞬时和稳定处理的包装细胞。这些技术对本领域技术人员而言是已知的。参见，例如SAMBROOK等人,MOLECULARCLONING:A LABORATORY MANUAL第2版(Cold Spring Harbor,N.Y.,1989)；AUSUBEL等人,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(Green Publishing Associates,Inc.和JohnWiley Sons,Inc.,New York)。

慢病毒表达构建体

慢病毒是复杂的逆转录病毒，其除了常见的逆转录病毒基因gag、pol和env之外，还含有其他具有调节或结构功能的基因。较高的复杂度使慢病毒能够调节其生命周期，如在潜伏感染过程中那样。

典型的慢病毒是人类免疫缺陷病毒(HIV)，它是AIDS的病原体。在体内，HIV可以感染很少分裂的终末分化细胞，如淋巴细胞和巨噬细胞。在体外，HIV可以感染单核细胞源性巨噬细胞(MDM)以及HeLa-Cd4或T淋巴细胞的原代培养物，这些细胞通过用阿非迪霉素或γ辐射处理而使细胞周期停滞。

细胞感染依赖于HIV整合前复合物通过靶细胞核孔的主动核输入。这是通过复合物中多个部分冗余的分子决定簇与靶细胞的核输入机构的相互作用而发生的。已鉴定的决定簇包括gag基质(MA)蛋白中的功能性核定位信号(NLS)、嗜核病毒体相关蛋白、vpr、gagMA蛋白中的C-末端磷酸化酪氨酸残基。

慢病毒基因组和前病毒DNA具有在逆转录病毒中发现的三种基因：gag、pol和env，其侧翼是两个长末端重复(LTR)序列。gag基因编码内部结构(基质、衣壳和核衣壳)蛋白；pol基因编码RNA指导的DNA聚合酶(逆转录酶)、蛋白酶和整合酶；并且env基因编码病毒包膜糖蛋白。5'和3'LTR用于促进病毒体RNA的转录和多腺苷酸化。LTR包含病毒复制所需的所有其他顺式作用序列。慢病毒具有另外的基因，包括vif、vpr、tat、rev、vpu、nef和vpx(在HIV-1、HIV-2和/或SIV中)。

与5'LTR相邻的是基因组逆转录(tRNA引物结合位点)和病毒RNA高效衣壳化到颗粒中(Psi位点)所必需的序列。如果病毒基因组中缺少衣壳化(或将逆转录病毒RNA包装到感染性病毒体中)所必需的序列，顺式缺陷会阻止基因组RNA的衣壳化。然而，由此产生的突变体仍然能够指导所有病毒体蛋白的合成。

在一些方面，通过用两种或更多种携带包装功能，即gag、pol和env，以及rev和tat的载体转染合适的宿主细胞，重组慢病毒能够感染非分裂细胞。在一些示例中，缺少功能性tat基因的载体是期望的。因此，例如，第一载体可以提供编码病毒gag和病毒pol的核酸，而另一载体可以提供编码病毒env的核酸以产生包装细胞。将提供异源基因的载体(称为转移载体)导入该包装细胞中，产生释放携带感兴趣的外来基因的感染性病毒颗粒的生产细胞。

感兴趣载体的gag、pol和env基因也是本领域已知的。因此，将相关基因克隆到选定的载体中，然后用于转化感兴趣的靶细胞。

根据以上所示载体和外来基因的配置，第二载体可以提供编码病毒包膜(env)基因的核酸。env基因可以源自任何病毒，包括逆转录病毒。优选地，env是一种兼嗜性包膜蛋白，其允许转导人类和其他物种的细胞。

可能需要通过包膜蛋白与抗体或靶向特定细胞类型的受体的特定配体的连接来使重组病毒具有靶向功能。例如，通过将感兴趣的序列(包括调节区域)与编码特定靶细胞上受体的配体的另一基因一起插入病毒载体，该载体现在具有靶标特异性。通过插入例如糖脂或蛋白质，可以使逆转录病毒载体具有靶标特异性。通常通过使用抗体的抗原结合部分或重组抗体型分子如单链抗体来实现靶向，从而使逆转录病毒载体具有靶向功能。本领域技术人员会了解或无需过度实验即可轻易确定实现将逆转录病毒载体递送至特定靶标的具体方法。

逆转录病毒来源的env基因的实例包括但不限于：莫罗尼氏鼠白血病病毒(MoMuLV或MMLV)、哈维鼠肉瘤病毒(HaMuSV或HSV)、鼠乳腺肿瘤病毒(MuMTV或MMTV)、长臂猿白血病病毒(GaLV或GALV)、人类免疫缺陷病毒(HIV)和劳斯肉瘤病毒(RSV)。也可以使用其他env基因，诸如水泡性口炎病毒(VSV)蛋白G(VSV G)、肝炎病毒和流感病毒的env基因。

提供病毒env核酸序列的载体与调节序列，例如启动子或增强子可操作地相关联。调节序列可以是任何真核生物启动子或增强子，包括例如莫罗尼氏鼠白血病病毒启动子-增强子元件、人巨细胞病毒增强子或痘苗病毒P7.5启动子。在诸如莫罗尼氏鼠白血病病毒启动子-增强子元件的某些情况下，这些启动子-增强子元件位于LTR序列内或其邻近处。

在一些方面，如存在于所述慢病毒载体中的慢病毒基因组进一步包含与编码胰岛素和/或葡萄糖激酶的核苷酸序列可操作地连接的启动子序列。在一些方面，启动子序列是赋予在肌肉细胞和/或肌肉组织中表达的启动子。此类启动子的实例包括如本文公开的CMV和RSV启动子。

除非另有说明，否则本领域技术人员已知的方法可用于构建慢病毒构建体、载体以及瞬时和稳定处理的包装细胞。这类技术对本领域技术人员而言是已知的。参见，例如SAMBROOK等人,MOLECULAR CLONING:A LABORATORY MANUAL第2版(Cold Spring Harbor,N.Y.,1989)；AUSUBEL等人,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(GreenPublishing Associates,Inc.和John Wiley Sons,Inc.,New York)。

宿主细胞

在一些方面，本公开还提供了包含本文公开的经修饰核酸序列、多核苷酸、表达盒、载体或表达构建体的宿主细胞。在一些方面，宿主细胞是哺乳动物细胞。

为导入特定宿主而制备的构建体可以包括由宿主识别的复制系统、编码所需多肽的预定DNA区段，以及与该多肽编码区段可操作地连接的转录和翻译起始和终止调节序列。术语“可操作地连接”已经在本文中定义。例如，如果启动子或增强子刺激编码序列的转录，则该启动子或增强子与该编码序列可操作地连接。如果信号序列的DNA表达为参与多肽分泌的前蛋白，则该DNA与编码多肽的DNA可操作地连接。总体来说，可操作地连接的DNA序列是相邻的，并且在信号序列的情况下，既相邻又在阅读框内。然而，增强子不需要与它们控制其转录的编码序列相邻。连接是通过在实用的限制性位点或在代替其插入的衔接子或接头处接合，或者通过基因合成来完成的。

适当启动子序列的选择通常取决于为表达DNA区段而选定的宿主细胞。合适的启动子序列的实例包括本领域熟知的原核生物和真核生物启动子(参见，例如Sambrook和Russell,2001,见上文)。转录调节序列通常包括由宿主识别的异源增强子或启动子。适当启动子的选择取决于宿主，但启动子如trp、lac和噬菌体启动子、tRNA启动子和糖酵解酶启动子是已知且可用的(参见，例如Sambrook和Russell,2001,见上文)。可以采用包括复制系统、转录和翻译调节序列以及多肽编码区段插入位点的表达载体。在大多数情况下，复制系统仅在用于制备载体的细胞(细菌细胞，如大肠杆菌)中发挥作用。大多数质粒和载体都不会在感染了该载体的细胞中复制。在以下文献中描述了细胞系和表达载体的可行组合的实例：Sambrook和Russell(2001,见上文)和Metzger等人(1988)Nature 334:31-36。例如，合适的表达载体可以在酵母例如酿酒酵母(S.cerevisiae)、昆虫细胞例如Sf9细胞、哺乳动物细胞例如CHO细胞和细菌细胞例如大肠杆菌中表达。因此，细胞可以是原核或真核宿主细胞。细胞可以是适于在液体培养基中或固体培养基上培养的细胞。

将外源性核酸导入宿主细胞的方法是本领域众所周知的，并且会随着所用的宿主细胞而变化。技术包括但不限于葡聚糖介导的转染、磷酸钙沉淀、氯化钙处理、聚乙烯亚胺介导的转染、聚凝胺介导的转染、原生质体融合、电穿孔、病毒或噬菌体感染、将一种或多种多核苷酸封装在脂质体中以及将DNA直接显微注射到细胞核中。在哺乳动物细胞的情况下，转染可以是瞬时的或稳定的。

宿主细胞可以是酵母例如酿酒酵母、昆虫细胞例如Sf9细胞、哺乳动物细胞例如CHO细胞和细菌细胞例如大肠杆菌。因此，细胞可以是原核或真核宿主细胞。细胞可以是适于在液体培养基中或固体培养基上培养的细胞。备选地，宿主细胞是作为多细胞生物体例如转基因植物或动物的一部分的细胞。在一些方面，宿主细胞是哺乳动物细胞。

在一些方面，可以采用将包含本文公开的经修饰核酸的病毒载体导入细胞宿主中以进行复制和包装的方法，包括但不限于电穿孔、磷酸钙沉淀、显微注射、阳离子或阴离子脂质体以及与核定位信号组合的脂质体。在通过使用病毒载体转染来提供病毒载体功能的实施方案中，可以使用产生病毒感染的标准方法。

在一些方面，包装功能可以包括用于病毒载体复制和包装的基因。因此，例如，根据需要，包装功能可以包括病毒基因表达、病毒载体复制、从整合状态拯救病毒载体、病毒基因表达和将病毒载体包装到病毒颗粒中所必需的功能。可以使用基因构建体如质粒或扩增子将包装功能一起或分别提供给包装细胞。包装功能可以存在于包装细胞内的染色体外，或者可以整合到细胞的染色体DNA中。实例包括编码AAV Rep和Cap蛋白的基因。

在一些方面，辅助功能可以包括建立包装细胞的活性感染所需的辅助病毒元件，这是启动病毒载体包装所必需的。实例包括源自腺病毒、杆状病毒和/或疱疹病毒的功能，它们足以引起病毒载体的包装。例如，腺病毒辅助功能通常会包括腺病毒组分E1a、E1b、E2a、E4和VA RNA。包装功能可以通过用所需病毒感染包装细胞来提供。可以使用基因构建体如质粒或扩增子将包装功能一起或分别提供给包装细胞。包装功能可以存在于包装细胞内的染色体外，或者可以整合到细胞的染色体DNA中。

可以使用任何合适的辅助病毒功能。例如，在包装细胞是昆虫细胞的情况下，杆状病毒可以作为辅助病毒。疱疹病毒也可以在AAV包装方法中用作辅助病毒。

可以采用任何将携带辅助功能的核苷酸序列导入细胞宿主以用于复制和包装的方法，包括但不限于电穿孔、磷酸钙沉淀、显微注射、阳离子或阴离子脂质体以及与核定位信号组合的脂质体。在通过使用病毒载体转染或使用辅助病毒感染来提供辅助功能的实施方案中，可以使用产生病毒感染的标准方法。

本领域已知的任何合适的容许性或包装细胞都可以用于生产包装型病毒载体。优选哺乳动物细胞或昆虫细胞。在本发明的实践中可用于产生包装细胞的细胞的实例包括，例如，人类细胞系或灵长类动物细胞，诸如VERO、WI38、MRC5、A549、293细胞、B-50或任何其它HeLa细胞、HepG2、Saos-2、HuH7和HT1080细胞系。

在一些方面，用作包装细胞的细胞系是昆虫细胞系。根据本发明可以使用允许AAV复制并且可以在培养中维持的任何昆虫细胞。实例包括草地贪夜蛾(Spodopterafrugiperda)，诸如Sf9或Sf21细胞系、果蝇属物种细胞系或蚊子细胞系，例如亚洲虎蚊(Aedes albopictus)衍生的细胞系。优选的细胞系是草地贪夜蛾Sf9细胞系。将以下参考文献并入本文，用于其对关于昆虫细胞进行异源多肽表达的用途、将核酸导入此类细胞的方法以及在培养中维持此类细胞的方法的教导：Methods in Molecular Biology,Richard编著,Humana Press,NJ(1995)；O'Reilly等人,Baculovirus Expression Vectors:ALaboratory Manual,Oxford Univ.Press(1994)；Samulski等人,J.Vir.63:3822-8(1989)；Kajigaya等人,Proc.Nat'l.Acad.Sci.USA 88:4646-50(1991)；Ruffing等人,J.Vir.66:6922-30(1992)；Kimbauer等人,Vir.219:37-44(1996)；Zhao等人,Vir.272:382-93(2000)；以及Samulski等人,第6,204,059号美国专利。

在产生过程中，包装细胞可以包括一种或多种病毒载体功能以及足以引起病毒载体复制和包装的辅助功能和包装功能。可以使用基因构建体如质粒或扩增子将这些不同的功能一起或分别提供给包装细胞，并且它们可以存在于细胞系内的染色体外或整合到细胞的染色体中。

可以向细胞提供任何一种或多种已经引入的功能，例如，具有并入染色体外或整合到细胞的染色体DNA中的一种或多种载体功能的细胞系，具有并入染色体外或整合到细胞的染色体DNA中的一种或多种包装功能的细胞系，或具有并入染色体外或整合到细胞的染色体DNA中的辅助功能的细胞系。

药物组合物

在一些方面，本公开还提供了包含本文公开的经修饰核酸序列、多核苷酸、表达盒、载体或表达构建体的药物组合物。在一些方面，提供了包括表达构建体或递送载体(例如，包装在AAV衣壳中的病毒载体)的组合物，该表达构建体或递送载体包含编码本文公开的胰岛素和/或葡萄糖激酶的经修饰核酸序列。在一些方面，组合物是基因治疗组合物。在一些方面，该组合物是药物组合物，所述药物组合物包含药学上可接受的载剂、佐剂、稀释剂、增溶剂、填充剂、防腐剂和/或赋形剂。

例如，可以在以下文献中找到这种药学上可接受的载剂、填充剂、防腐剂、增溶剂、稀释剂和/或赋形剂，即Remington:The Science and Practice of Pharmacy,第20版Baltimore,Md.:Lippincott Williams&Wilkins,2000。

在一些方面，该组合物用作药剂。在一些方面，该药剂用于预防、减少或改善糖尿病的症状，延缓、治愈、逆转和/或治疗糖尿病。在一些方面，糖尿病可以是1型糖尿病、2型糖尿病或单基因糖尿病。在一些方面，接受治疗的受试者是哺乳动物，例如猫、啮齿类动物(小鼠、大鼠、沙鼠、豚鼠、小鼠或大鼠)、狗或人类。

在一些方面，当经修饰核酸、表达构建体、递送载体和/或组合物能够表现出抗糖尿病作用时，所述经修饰核酸、表达构建体、递送载体和/或组合物用于预防、减少或改善糖尿病的症状，延缓、逆转、治愈和/或治疗糖尿病。当血液中的葡萄糖处置增加和/或葡萄糖耐量得到改善时，就可以达到抗糖尿病作用。这可以使用本领域技术人员已知的技术来评估。在此上下文中，“增加/提高”(相应地“改善/改进”)意指使用技术人员已知的测定法或使用在实验部分中进行的测定法，至少可检测到的增加/提高(相应地可检测到的改善/改进)。

经内科医师评估，当典型症状(即胰岛炎、β细胞丧失)的进展已经减缓时，也可以观察到抗糖尿病作用。与糖尿病相关的典型症状的减少可能意味着症状发展的进度减缓或症状的完全消失。可以使用多种方法评估症状以及症状的减少，这些方法在很大程度上与用于诊断糖尿病的方法相同，包括临床检查和常规实验室测试。这类方法包括宏观和微观方法，以及分子方法、生物化学、免疫组织化学等。

如果使用本文公开的经修饰核酸、病毒表达构建体、病毒载体或组合物治疗至少一周、一个月、六个月、一年或更长时间后，如本文所定义的药剂(经修饰核酸、表达构建体、递送载体、组合物等)优选能够缓解患者或者所述糖尿病患者的细胞、组织或器官的一种症状或一种特征，则所述症状或特征减少或者不再可检测到。

如本文公开的用于预防、减少或改善糖尿病的症状，延缓、逆转、治愈和/或治疗糖尿病的经修饰核酸、表达构建体、递送载体或组合物可以适用于施用给受糖尿病影响或者存在患糖尿病风险的个体的体内细胞、组织和/或器官，并且可以在体内、离体或体外施用。可以将所述组合和/或组合物直接或间接施用给受糖尿病影响或者存在患糖尿病风险的个体的体内细胞、组织和/或器官，并且可以直接或间接在体内、离体或体外施用。在一些方面，施用方式为肌内。

在一些方面，可以使用本领域已知的合适方式直接或间接施用如本文公开的经修饰核酸、表达构建体、递送载体或组合物。在一些方面，可以将如本文公开的经修饰核酸、表达构建体、递送载体或组合物按原样递送至个体、所述个体的细胞、组织或器官。根据疾病或病况，所述个体的细胞、组织或器官可以如本文前面所定义。在一些方面，将如本文公开的经修饰核酸、表达构建体、递送载体或组合物溶解在与递送方法相容的溶液中。对于静脉内、皮下、肌内、鞘内、关节内和/或室内施用，该溶液可以是生理盐溶液。在一些方面，施用是肌内施用。在一些方面，使用多针头进行肌内施用。在一些方面，治疗有效剂量的如本文所述的经修饰核酸、表达构建体、载体或组合物以单一且独特的剂量施用，因此避免反复的定期施用。在一些方面，将单一剂量施用于肌肉组织。在一些方面，将单一剂量施用于骨骼肌组织。在一些方面，单一剂量包括对一块或多块肌肉(例如，多个肌群)的多次注射(例如，两次、三次、四次或五次)。

在一些方面，在本发明的组合物中可以存在化合物。所述化合物可以协助递送经修饰核酸或包含其的组合物。在一些方面，该化合物是能够形成穿过细胞膜递送如本文所定义的每种成分(复合或捕获在囊泡或脂质体中)的复合物、纳米颗粒、胶束体、脂质体的化合物。许多这些化合物是本领域已知的。在一些方面，另外的化合物是聚乙烯亚胺(PEI)或类似的阳离子聚合物，包括聚丙烯亚胺或聚乙烯亚胺共聚物(PEC)和衍生物、合成的两亲物(SAINT-18)、Lipofectin^TM、DOTAP或其组合。

使用方法

本公开还提供了一种用于预防、减少或改善糖尿病的症状，延缓、逆转、治愈和/或治疗糖尿病的方法，包括向有此需要的受试者施用本文公开的任何经修饰核酸、多核苷酸、表达盒、递送载体或表达构建体。在一些方面，糖尿病可以是T1DM。在一些方面，糖尿病可以是T2DM。在一些方面，该方法是基因疗法。在某些方面，本公开的方法包括将本文公开的任何经修饰核酸、多核苷酸、表达盒、递送载体或表达构建体施用(例如，肌内施用)至有此需要的细胞、组织或受试者。在某些方面，方法包括施用(i)编码人胰岛素(Ins)蛋白(例如，前胰岛素原或其变体)的经修饰(或野生型或未修饰)核酸、多核苷酸、表达盒、递送载体或表达构建体，和/或(ii)包含编码人葡萄糖激酶(Gck)蛋白的核酸的经修饰(或野生型或未修饰)核酸、多核苷酸、表达盒、递送载体或表达构建体。在一些方面，hIns核酸序列是本文公开的经修饰hIns序列，并且hGck核酸序列是本文公开的经修饰hGck序列。在一些方面，hIns核酸序列是本文公开的野生型或未修饰hIns序列，并且hGck序列是本文公开的经修饰hGck序列。在某些方面，同时或序贯施用(i)和(ii)。

本公开的某些方面涉及使用方法，包括施用编码人胰岛素(Ins)蛋白(例如，前胰岛素原或其变体)的多核苷酸，该多核苷酸包含(i)编码信号肽的核苷酸序列，任选地，其中该信号肽不是野生型前胰岛素原信号序列，和(ii)编码胰岛素原多肽的核苷酸序列，相对于野生型胰岛素原中相应的氨基酸位置，该胰岛素原多肽包含在选自人胰岛素B链的氨基酸B10、B28和/或B29、人胰岛素C链的C1和/或C32或者其任意组合的位置处的氨基酸修饰，并且任选地，该多核苷酸进一步包括切割位点。在一些方面，信号肽是野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列。在一些方面，切割位点是弗林蛋白酶切割位点。

本公开的某些方面涉及使用方法，包括施用包含编码人胰岛素(Ins)蛋白的核酸的多核苷酸，其中该核酸包含开放阅读框(ORF)，该ORF包含：(i)编码信号肽的核苷酸序列和(ii)与SEQ ID NO:43-57、110-116、150-151、154-155和157-159中任一项的核酸73-330，SEQ ID NO:117-122、152和156中任一项的核酸88-345，或者SEQ ID NO:153的核酸79-336至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的核苷酸序列。在一些方面，所编码的人Ins蛋白包含(i)信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)和(ii)SEQ ID NO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110。在一些方面，所编码的人胰岛素蛋白进一步包含切割位点(例如，弗林蛋白酶切割位点)。

本公开的某些方面涉及一种使用方法，包括施用包含编码人胰岛素(Ins)蛋白的核酸的多核苷酸，其中该核酸包含开放阅读框(ORF)，该ORF包含：与SEQ ID NO:43-57、110-122或150-159中任一项至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的核苷酸序列。在一些方面，该多核苷酸包含至少两个编码人Ins蛋白的核酸序列。在一些方面，该多核苷酸包含至少两个与SEQ ID NO:43-57、110-122或150-159中任一项至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的ORF核苷酸序列，其中两个ORF核苷酸序列可以相同或不同。在一些方面，该多核苷酸进一步包含IRES序列。在一些方面，至少两个ORF核苷酸序列由IRES序列隔开。在一些方面，所编码的人Ins蛋白包含信号序列和胰岛素原多肽。在一些方面，所编码的人Ins蛋白包含SEQ ID NO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110中任一项的氨基酸序列。在一些方面，所编码的人Ins蛋白是前胰岛素原。在一些方面，所编码的人Ins蛋白包含SEQ ID NO:41、SEQ IDNO:144或SEQ ID NO:145的氨基酸序列。在一些方面，该多核苷酸或核酸序列进一步包含5’UTR和/或3’UTR。在一些方面，该多核苷酸或核酸包含：与SEQ ID NO:1-16、84-88、123-141或160-161中任一项至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的核苷酸序列。

本公开的某些方面涉及一种使用方法，包括施用包含编码人胰岛素(Ins)蛋白(例如，前胰岛素原或其变体)的核酸的多核苷酸，其中该核酸包括：(i)编码信号肽(例如，野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列)的核苷酸序列和(ii)编码胰岛素原多肽的核苷酸序列，相对于野生型胰岛素原中相应的氨基酸，该胰岛素原多肽包含在选自人胰岛素B链的氨基酸B10、B28和/或B29、人胰岛素C链的C1和/或C32或者其任意组合的位置处的氨基酸修饰(或者相对于野生型前胰岛素原中相应的氨基酸，在选自氨基酸H34、P52、K53、R55、L86或其任意组合的位置处的氨基酸修饰)。在一些方面，信号肽不是野生型前胰岛素原信号序列(例如，将野生型前胰岛素原序列替换为IL-6信号序列或纤连蛋白信号序列)。在一些方面，胰岛素原多肽包含SEQ ID NO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110中任一项的氨基酸序列。在一些方面，该多核苷酸进一步包含切割位点(例如，弗林蛋白酶切割位点)。

本公开的某些方面涉及一种使用方法，包括施用包含编码人葡萄糖激酶(Gck)蛋白的核酸的多核苷酸，其中该核酸包含ORF，该ORF包含：与SEQ ID NO:61-80或162中任一项的核酸1-1398；或者SEQ ID NO:61-80和162中任一项至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的核苷酸序列。在一些方面，所编码的人Gck蛋白包含SEQ ID NO:82的氨基酸序列。在一些方面，编码Gck蛋白的多核苷酸或核酸序列进一步包含5’UTR和/或3’UTR。在一些方面，该核酸进一步包含5’UTR，该5’UTR包含与SEQ ID NO:42、SEQ ID NO:42的5-329、SEQ ID NO:83、SEQ ID NO:146或SEQID NO:148存在至少85％、90％、95％、99％或100％同一性的核苷酸序列。在一些方面，该核酸进一步包含3’UTR，该3’UTR包含与SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ IDNO:99、SEQ ID NO:100、SEQ ID NO:101或SEQ ID NO:149存在至少85％、90％、95％、99％或100％同一性的核苷酸序列。在一些方面，该多核苷酸或核酸包含：与SEQ ID NO:20-39和89-96以及163-164中任一项存在至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。在一些方面，将该核酸可操作地连接到启动子(例如，真核生物启动子)。本公开的某些方面涉及表达盒，该表达盒包含本公开的多核苷酸和与该核酸序列可操作地连接的异源表达调控序列。在一些方面，将该核酸可操作地连接到多腺苷酸化(多聚A)元件。

本公开的某些方面涉及使用方法，包括施用包含本公开的多核苷酸或表达盒的载体(例如，病毒载体、非病毒载体、质粒、脂质或溶酶体)。在一些方面，载体是腺相关病毒(AAV)载体或慢病毒载体。本公开的某些方面涉及一种施用重组AAV(rAAV)颗粒的方法，该颗粒包含AAV衣壳和包含本公开的多核苷酸或表达盒的载体基因组。在一些方面，AAV血清型选自于由下列组成的组，即AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVRH8、AAVrh9、AAV9、AAVrh10、AAV10、AAVRH10、AAV11和AAV12。

本文公开的基因治疗方法的某些优点包括施用本文公开的经修饰核酸、多核苷酸、表达盒、递送载体或表达构建体的潜力，其在糖尿病受试者的一生中提供治疗性基因表达。WO 2012/007458公开了两种病毒载体的产生，一种表达胰岛素基因且一种表达葡萄糖激酶基因以治疗糖尿病。此外，WO 2016/110518公开了包含胰岛素和葡萄糖激酶基因的单载体基因构建体。在某些方面，本公开提供了用于糖尿病治疗或预防的改进型核酸序列、表达构建体和/或递送载体，它们增加了胰岛素和/或葡萄糖激酶的表达、降低了不良免疫反应和/或允许施用较低剂量的病毒载体。

在一些方面，本公开的方法缓解或减少个体中、所述个体的细胞、组织或器官中的一种或多种糖尿病症状，或者缓解或减少所述个体的细胞、组织或器官的一种或多种特征或症状，该方法包括向所述个体施用本文公开的经修饰核酸、多核苷酸、表达盒、载体或表达构建体中的一种或多种。

成人糖尿病患者的治疗建议通常以HbA1c<7.0％为目标，且无明显低血糖。在一些方面，HbA1c的“正常范围”是<7.0％，例如，<6.5％、<6.0％、<5.7％，例如，约5.0％至约6.5％。大多数市售产品可将HbA1c降低0.5％至1.50％。在一些方面，本公开的方法使接受治疗的糖尿病受试者中HbA1c水平正常化至非糖尿病受试者中的HbA1c水平，例如在8周内。在一些方面，本公开的方法允许降低和/或调节受试者中的糖化血液血红蛋白(HbA1c)水平。在一些方面，治疗后受试者中的HbA1c水平<7.0％(例如，<6.5％、<6.0％、<5.7％，例如，5.0％至6.5％)，例如，在治疗后8周内。

胰岛素在调节肝脏、脂肪和肠道的脂质代谢中起着核心作用(Vergès B.Insulinsensitivity and lipids.Diabetes Metab.2001年4月；27(2Pt2):223-7.PMID:11452214)。在失控的1型糖尿病中，患者无法利用葡萄糖，需要替代能量来源。在脂肪组织中，胰岛素抑制激素敏感性脂肪酶，通常会促进甘油三酯在脂肪细胞中的储存，并减少游离脂肪酸从脂肪组织释放到循环中。当循环胰岛素水平较低时，脂蛋白分解代谢会显著降低(Taskinen MR.Lipoprotein lipase in diabetes.Diabetes Metab Rev.3:551-570.1987doi:10.1002/dmr.5610030208.1987)。发生脂肪分解，结果是循环中富含甘油三酯的脂蛋白(乳糜微粒，VLDL)水平升高，从而导致高甘油三酯血症。在一些方面，本公开的方法降低了受试者(例如，患有糖尿病的受试者)中、所述受试者的细胞、组织或器官中富含甘油三酯的脂蛋白(乳糜微粒，VLDL)的水平，该方法包括向受试者施用本文公开的经修饰核酸、多核苷酸、表达盒、载体或表达构建体中的一种或多种。

在肝脏中，酮体(β-羟基丁酸酯(β-HB)和乙酰乙酸(AcAc))是由脂肪酸的β-氧化作用产生的。在禁食或限制膳食中碳水化合物期间，酮类作为葡萄糖限制条件下的替代能量来源，并可以提供高达80％的脑能量需求。虽然在短期内有用，但循环中酮类的慢性升高会对大脑、肾脏、肝脏和微血管系统产生不利影响(Kanikarla-Marie P,JainSK.Hyperketonemia and ketosis increase the risk of complications in type1diabetes.Free Radic Biol Med.95:268-277,2016.doi:10.1016/j.freeradbiomed.2016.03.020)，并导致可能致命的酮症酸中毒。在一些方面，本公开的方法降低了受试者(例如，患有糖尿病的受试者)中、所述受试者的细胞、组织或器官中的酮类水平，该方法包括向受试者施用本文公开的经修饰核酸、多核苷酸、表达盒、载体或表达构建体中的一种或多种。

在一些方面，本公开的方法提供了(i)受试者中糖化血液血红蛋白(HbA1c)水平的降低和/或调节；(ii)受试者中循环酮类的降低，(iii)受试者中甘油三酯的降低，或者(iv)其任意组合。

在一些方面，该方法或用途在体外进行，例如使用细胞培养物。在一些方面，该方法或用途在体内进行。在一些方面，将本文公开的经修饰核酸、多核苷酸、表达盒、递送载体或表达构建体与已知用于治疗个体糖尿病的另外的化合物组合。在一些方面，该方法进一步包括施用重组胰岛素，例如，通过常规注射。

在一些方面，不再重复本文公开的方法。在一些方面，每年或者每2、3、4、5、6、7、8、9或10年重复一次本文公开的方法。

在一些方面，该方法包括施用治疗有效剂量的如本文所述的经修饰核酸、表达构建体、载体或组合物，其中该施用是单次进行，例如，避免反复的定期施用。在一些方面，将单一剂量施用于肌肉组织。在一些方面，将单一剂量施用于骨骼肌组织。在一些方面，单一剂量包括对一块或多块肌肉(例如，多个肌群)的多次注射(例如，两次、三次、四次或五次)。

应当理解的是，发明详述部分而非发明内容和摘要部分旨在用于解释权利要求。发明内容和摘要部分可以阐述本发明人所设想的本发明的一个或多个但非全部示例性实施方案，因此，并非意在以任何方式限制本发明和所附权利要求。

本发明的广度和范围不应受到任何上述示例性实施方案的限制，而应根据以下权利要求及其等同形式来限定。

在描述了本发明之后，将在以下实施例中更详细地解释本发明，这些实施例包括在本文中仅用于说明目的，它们并非意在限制本发明。

实施例

实施例1：经修饰的胰岛素的核酸

通过计算机模拟设计了以下对应于SEQ ID No:1-16、84-88、123-141和160-161的经修饰人胰岛素核酸序列(如表1所示)。5'UTR序列(SEQ ID NO:42、SEQ ID NO:83、SEQ IDNO:146或SEQ ID NO:148)用粗体表示，ORF序列(SEQ ID NO:43-57、110-122)用下划线表示，并且3'UTR序列用斜体表示(SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101或SEQ ID NO:149)。对具有SEQ ID NO:42序列的5'UTR进行进一步修饰，以去除1-4位的CTAG。相应地，在某些构建体中，5'UTR包括SEQ ID NO:42的核酸5-329。在一些构建体中，在两个胰岛素ORF序列之间添加了IRES序列，IRES序列以粗体和斜体显示(SEQ ID NO:143)。

表1：编码人胰岛素的经修饰的核酸序列

在一些方面，相对于野生型和/或未修饰的人胰岛素核酸序列(例如，SEQ ID NO:1)，该核酸包括经密码子优化和CpG减少的序列。通过化学方式合成经修饰核酸，制备成包括CMV启动子的表达盒，并克隆到表达质粒中。通过Sanger测序证实经修饰的序列。

测试了转染了pAAV-胰岛素质粒的HEK细胞分泌胰岛素的情况。将pAAV-胰岛素质粒AAV1-CMV-hInsB10D_2(SEQ ID NO:160)、AAV1-CMV-未修饰hIns(SEQ ID NO:1)、AAV1-CMV-经修饰hIns22(SEQ ID NO:123)、AAV1-CMV-经修饰hIns6(SEQ ID NO:6)、AAV1-CMV-经修饰hIns8(SEQ ID NO:8)、AAV1-CMV-经修饰hIns23(SEQ ID NO:124)、AAV1-CMV-经修饰hIns24(SEQ ID NO:125)、AAV1-CMV-经修饰hIns25(SEQ ID NO:126)、AAV1-CMV-经修饰hIns_2(SEQ ID NO:127)、AAV1-CMV-经修饰hIns27(SEQ ID NO:128)、AAV1-CMV-经修饰hIns28(SEQ ID NO:129)、AAV1-CMV-经修饰hIns29(SEQ ID NO:130)、AAV1-CMV-经修饰hIns30(SEQ ID NO:131)、AAV1-CMV-经修饰hIns31(SEQ ID NO:132)、AAV1-CMV-经修饰hIns32(SEQ ID NO:133)、AAV1-CMV-经修饰hIns33(SEQ ID NO:134)、AAV1-CMV-经修饰hIns34(SEQ ID NO:135)、AAV1-CMV-经修饰hIns35(SEQ ID NO:136)、AAV1-CMV-经修饰hIns36(SEQ ID NO:137)、AAV1-CMV-经修饰hIns37(SEQ ID NO:138)、AAV1-CMV-经修饰hIns38(SEQ ID NO:139)、AAV1-CMV-经修饰hIns39(SEQ ID NO:140)或AAV1-CMV-经修饰Ins40(SEQ ID NO:141)以0.5ug(图1B)或0.1ug(图1C)转染入24孔板中的HEK293细胞中。通过ELISA测定法来确定细胞外胰岛素水平。pAAV-胰岛素质粒在转染后显示出胰岛素表达。

实施例2：经修饰的Gck的核酸

通过计算机模拟设计了以下对应于SEQ ID No:20-39、89-96和163-164的经修饰人葡萄糖激酶(Gck)核酸序列(如表2所示)。5'UTR序列(SEQ ID NO:42或SEQ ID NO:83)用粗体表示，ORF序列(SEQ ID NO:61-80和162)用下划线表示，并且3'UTR序列用斜体表示(SEQ ID NO:60、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ IDNO:106、SEQ ID NO:107、SEQ ID NO:108或SEQ ID NO:109)。对具有SEQ ID NO:42序列的5'UTR进行进一步修饰，以去除1-4位的CTAG。相应地，在某些构建体中，5'UTR包括SEQ ID NO:42的核酸5-329。

表2：编码葡萄糖激酶的经修饰核酸序列

在一些方面，相对于野生型和/或未修饰的人Gck核酸序列(例如，SEQ ID NO:19)，该核酸包括经密码子优化和CpG减少的序列。通过化学方式合成经修饰的核酸，制备成包括CMV启动子的表达盒，并克隆到表达质粒中。通过Sanger测序证实经修饰的序列。

测试了转染了pAAV-Gck质粒的HEK细胞中GcK表达情况。将pAAV-GcK质粒AAV1-CMV-hGckWT(SEQ ID NO:19)、AAV1-CMV-hGckWT_2(SEQ ID NO:163)、AAV1-CMV-经修饰hGck9(SEQ ID NO:68)、AAV1-CMV-经修饰hGck10(SEQ ID NO:69)、AAV1-CMV-经修饰hGck11(SEQ ID NO:70)、AAV1-CMV-经修饰hGck12(SEQ ID NO:71)、AAV1-CMV-经修饰hGck13(SEQID NO:72)、AAV1-CMV-经修饰hGck14(SEQ ID NO:73)、AAV1-CMV-经修饰hGck15(SEQ IDNO:74)和AAV1-CMV-经修饰hGck16(SEQ ID NO:75)以每孔2.5ug转染入6孔板中的HEK293细胞中。转染后48小时收集细胞沉淀，并通过ELISA测定法确定细胞内胰岛素水平。pAAV-GcK质粒在转染后显示出GcK表达。

实施例3：hInsulin载体的体外比较分析

研究了带有胰岛素变体(SEQ ID NO:1、SEQ ID NO:87和SEQ ID NO:88)的AAV1-CMV-hInsulin载体的感染性和效力(胰岛素mRNA表达、分泌到细胞培养基中的胰岛素和分泌的胰岛素的生物学活性)。在不同的MOI下，用AAV1-CMV-hInsWT(SEQ ID NO:110)、AAV1-CMV-Ins5(SEQ ID NO:87)和AAV1-CMV-Ins7(SEQ ID NO:88)载体感染2v6.11细胞。对于感染性测定，对载体基因组的细胞内含量进行定量。对于效力测定，对人胰岛素mRNA表达和分泌到细胞培养基中的胰岛素进行测量。还评估了分泌的胰岛素的性能。

方法

3.1用AAV1-CMV-hInsulin载体感染2v6.11细胞

感染前一天，将2v6.11细胞以2E+05个细胞/孔的密度接种在24孔板中。在37℃和8.5％ CO2的条件下，将细胞在补充有抗生素(青霉素＝10,000U/ml、链霉素＝10,000μg/ml)和1μg/ml尖叶土杉甾酮(Ponasterone)A的生长培养基(DMEM+10％ FBS)中生长。

感染之前，在明视野显微镜下评估细胞的正确细胞汇合度(70-80％)。为了评估细胞计数，对4个孔的细胞进行胰蛋白酶消化并使用Scepter 2.0手持式自动细胞计数仪(Merck-Millipore)进行定量。在MOI＝1000、2000和4000vg/细胞下，用AAV1-CMV-hInsulin载体AAV1-CMV-hInsB10D(野生型)(SEQ ID NO:110)、AAV1-CMV-Ins5(SEQ ID NO:87)和AAV1-CMV-Ins7(SEQ ID NO:88)(表3)对细胞进行感染。对于感染性测试和效力测试，均以一式四份对细胞进行感染。未感染的2v6.11细胞(NI)用作阴性对照。在不同的日期，使用处于不同细胞传代的细胞重复感染三次。

表3：AAV1-CMV-hInsulin载体

AAV载体	SEQ ID NO
		AAV1-CMV-hInsB10D	SEQ ID NO:1
AAV1-CMV-Ins5	SEQ ID NO:87
		AAV1-CMV-Ins7	SEQ ID NO:88

3.2感染性测试

感染后24小时，在明视野显微镜下观察细胞的活力。接下来，吸出细胞培养基，用500μl 1x PBS洗涤细胞两次，并用细胞刮刀将细胞收集在200μl 1x PBS中。使用DNeasy血液和组织试剂盒(Qiagen)提取细胞内载体基因组，并使用针对ITR2序列的寡核苷酸组通过Taqman qPCR进行扩增。通过从标准DNA的连续稀释生成的标准曲线进行插值来定量载体基因组。

3.3用于效力测试的样品收集

感染后48小时并评估细胞活力之后，吸出细胞培养基，更换为加热至37℃的400μlDMEM+1％ BSA，并将培养板放回培养箱。孵育5小时后，为了进行蛋白质读取，将350μl细胞培养基收集到1.5ml微型管中，在4℃以600x g离心10分钟，并将300μl上清液转移到新管中。对于mRNA表达，从孔中吸出剩余的培养基，用500μl 1x PBS轻轻洗涤细胞并收集在350μl RLT+β-巯基乙醇(10μl/ml)中(RNeasy小提试剂盒,Qiagen)。将样品在处理前储存在-80℃。

3.4hInsulin mRNA表达

按照生产商提供的方案，用RNeasy小提试剂盒(Qiagen)和不含RNase的DNase I(Qiagen)提取RNA，除了将柱上DNAse I消化从标准的15分钟延长到30分钟，以确保感染的AAV载体基因组的适当降解。使用转录子第一链cDNA合成试剂盒(Roche)对每个RNA样品各1μg进行逆转录。使用Taqman Probes Master(Roche)和2μl样品(1/10稀释)进行qPCR，一式三份。为了对表达进行定量，使用了针对SV40多聚A信号(所有hInsulin质粒共有的序列)的引物-探针混合物(正向引物：AGC AAT AGC ATC ACA AAT TTC ACA A；反向引物：CAG ACATGA TAA GAT ACA TTG ATG AGT T；探针：/56-FAM/AGC ATT TTT TT/ZEN/CAC TGC ATT CTAGTT GTG GTT TGT C/3IABkFQ/)。管家基因hRplp0的引物-探针混合物用于标准化(正向引物：CAG ACA GAC ACT GGC AAC AT；反向引物：GCA GCA TCT ACA ACC CTG AA；探针：/5HEX/AA CTC TGC A/ZEN/TT CTC GCT TCC TGG A/3IABkFQ)。

3.5对分泌的hInsulin的定量分析

使用胰岛素ELISA试剂盒(Crystal Chem)，将培养基样品在milliQ水中以1/10稀释，测量其中分泌的胰岛素，一式两份。

3.6对分泌的hInsulin的功能分析

使用iLite胰岛素测定可用细胞(Svar Life Science)测量由感染细胞产生并分泌到细胞培养基中的胰岛素的生物学活性。简言之，将40μl标准或来自感染细胞的细胞培养基以及预先解冻并重新悬浮于补充有9％FBS(热灭活)和抗生素(青霉素＝10,000U/ml、链霉素＝10,000μg/ml)的RPMI中的40μl iLite胰岛素测定可用细胞加入到96孔白板中。在37℃和5％ CO₂的条件下孵育5小时后，将该板平衡至室温，并将80μl ONE-Glo荧光素酶测定试剂加入孔中。使细胞裂解10分钟，并在读板器中测量发光。重组人胰岛素(LifeTechnologies)用于制作标准曲线。

3.7统计学分析

使用Anova和Tukey的多重比较检验对于3次研究的每种MOI进行独立分析。

结果

在三次独立的研究中，用携带hInsulin变体Ins5和Ins7以及WT hInsulin的AAV1-hInsulin载体感染2v6.11细胞，以评估载体感染性和效力。

3.8感染性测定

使用AAV1-hInsulin载体AAV1-CMV-hInsB10D(SEQ ID NO:1)、AAV1-CMV-Ins5(SEQID NO:87)和AAV1-CMV-Ins7(SEQ ID NO:88)在2v6.11细胞中进行的三次独立感染研究表明，在测试的3种MOI下(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))，不同载体感染细胞的能力没有显著性差异，如细胞内载体基因组含量(vg/ng DNA)所示(图3A-3C和表4)。

表4：不同AAV1-hInsulin载体感染性测定的统计学意义(经调整的P值)。

使用Anova和Tukey的多重比较检验分析对应于每种MOI和每次测定的感染性数据。

3.9效力测定

3.9.1人胰岛素mRNA表达

在进行的三次研究中，对hInsulin表达水平的定量显示载体AAV1-CMV-hInsB10D(SEQ ID NO:1)和AAV1-CMV-Ins5(SEQ ID NO:87)之间没有显著性差异(图4A-4C和表5)。另一方面，由用载体AAV1-CMV-Ins7(SEQ ID NO:88)感染介导的mRNA表达水平显著低于由AAV1-CMV-hInsB10D(SEQ ID NO:110)和AAV1-CMV-Ins5(SEQ ID NO:87)介导的表达水平(图4A-4C和表5)。

表5：不同AAV1-hInsulin载体的hInsulin mRNA表达的统计学意义(经调整的P值)。

使用Anova和Tukey的多重比较检验分析对应于每种MOI和每次测定的hInsulinmRNA表达数据。粗体和斜体表示具有统计学意义。

3.9.2对分泌的hInsulin的定量分析

当使用胰岛素ELISA试剂盒(Crystal Chem)对感染了不同AAV1-hInsulin载体的2v6.11细胞分泌到细胞培养基中的胰岛素进行定量时，在载体AAV1-CMV-hInsB10D(SEQ IDNO:110)和AAV1-CMV-Ins5(SEQ ID NO:87)之间未观察到显著性差异(图5A-5C和表6)。正如对mRNA表达读取所观察到的(图4A-4C和表5)，由载体AAV1-CMV-Ins7(SEQ ID NO:88)介导的分泌胰岛素水平显著低于由AAV1-CMV-hInsB10D(SEQ ID NO:1)和AAV1-CMV-Ins5(SEQID NO:87)载体提供的水平(图5A-5C和表6)。由于1K的数据低于最低标准且无法量化，因此对2K和4K下感染的数据进行统计学分析。

表6：不同AAV1-hInsulin载体的分泌hInsulin的统计学意义(经调整的P值)。

使用Anova和Tukey的多重比较检验分析对应于每种MOI和每次测定的分泌hInsulin数据。粗体和斜体表示具有统计学意义。

3.9.3分泌的hInsulin的功能分析

使用iLite胰岛素测定可用细胞(Svar Life Science)测量由感染细胞产生并分泌到细胞培养基中的胰岛素的活性。与mRNA表达和hInsulin蛋白质读取获得的结果(图4A-4C和5A-5C以及表5和6)一致，观察到载体AAV1-CMV-hIns_B10D(SEQ ID NO:1)和AAV1-CMV-Ins5(SEQ ID NO:87)的胰岛素活性没有显著性差异，而AAV1-CMV-Ins7(SEQ ID NO:88)再次显示出明显更低的胰岛素活性(图6A-6C和表7)。

表7：不同AAV1-hInsulin载体的hInsulin活性的统计学意义(经调整的P值)。

使用Anova和Tukey的多重比较检验分析对应于每种MOI和每次测定的hInsulin活性数据。粗体和斜体表示具有统计学意义。

实施例4：hGlucokinase载体的体外比较分析

研究了携带野生型(SEQ ID NO:19)以及Gck8(SEQ ID NO:93)和Gck12(SEQ IDNO:95)hGlucokinase变体的AAV1-CMV-hGlucokinase载体的感染性和效力(mRNA表达、蛋白含量和生物学活性)。为此，在不同的MOI下，用AAV1-CMV-hGckWT(SEQ ID NO:19)、AAV1-CMV-Gck8(SEQ ID NO:93)和AAV1-CMV-Gck12(SEQ ID NO:95)感染2v6.11细胞。对于感染性测定，对载体基因组的细胞内含量进行定量。对于效力测定，测量人葡萄糖激酶mRNA表达、葡萄糖激酶细胞内含量和葡萄糖激酶活性。

方法

4.1用AAV1-CMV-hGlucokinase载体感染2v6.11细胞

感染前一天，将2v6.11细胞以2E+05个细胞/孔的密度接种在24孔板中。在37℃和8.5％ CO₂的条件下，将细胞在补充有抗生素(青霉素＝10,000U/ml、链霉素＝10,000μg/ml)和1μg/ml尖叶土杉甾酮(Ponasterone)A的生长培养基(DMEM+10％ FBS)中生长。

感染之前，在明视野显微镜下评估细胞的正确细胞汇合度(70-80％)。为了评估细胞计数，对4个孔的细胞进行胰蛋白酶消化并使用Scepter 2.0手持式自动细胞计数仪(Merck-Millipore)进行定量。在MOI＝1000、2000和4000vg/细胞下，用AAV1-CMV-hGlucokinase载体AAV1-CMV-hGckWT、AAV1-CMV-Gck8和AAV1-CMV-Gck12(表8)对细胞进行感染。以一式四份对细胞进行感染用于每种特定分析：感染性、hGlucokinase mRNA表达、细胞内hGlucokinase和葡萄糖激酶活性。未感染的2v6.11细胞(NI)用作阴性对照。在不同的日期，使用处于不同细胞传代的细胞重复感染三次。

表8：AAV1-CMV-hGck载体

AAV载体	SEQ ID NO
		AAV1-CMV-hGckWT	SEQ ID NO:19
AAV1-CMV-Gck8	SEQ ID NO:93
		AAV1-CMV-Gck12	SEQ ID NO:95

4.2感染性测定

4.3人葡萄糖激酶mRNA表达

感染后48小时并评估细胞活力之后，用500μl 1x PBS轻轻洗涤细胞并收集在350μl RLT+β-巯基乙醇(10μl/ml)中(RNeasy小提试剂盒,Qiagen)。按照生产商提供的方案，用RNeasy小提试剂盒(Qiagen)和不含RNase的DNase I(Qiagen)提取RNA，除了将柱上DNAse I消化从标准的15分钟延长到30分钟，以确保感染的AAV载体基因组的适当降解。使用转录子第一链cDNA合成试剂盒(Roche)对每个RNA样品各1μg进行逆转录。使用Taqman ProbesMaster(Roche)和2μl样品(1/10稀释)进行qPCR，一式三份。为了对表达进行定量，使用了针对SV40多聚A信号(所有hGlucokinase变体共有的序列)的引物-探针混合物(正向引物：AGCAAT AGC ATC ACA AAT TTC ACA A；反向引物：CAG ACA TGA TAA GAT ACA TTG ATG AGT T；探针：/56-FAM/AGC ATT TTT TT/ZEN/CAC TGC ATT CTA GTT GTG GTT TGT C/3IABkFQ/)。管家基因hRplp0的引物-探针混合物用于标准化(正向引物：CAG ACA GAC ACT GGC AACAT；反向引物：GCA GCA TCT ACA ACC CTG AA；探针：/5HEX/AA CTC TGC A/ZEN/TT CTC GCTTCC TGG A/3IABkFQ)。

4.4对细胞内葡萄糖激酶含量的定量分析

感染后48小时，用500μl 1x PBS/孔轻轻洗涤细胞。然后，将细胞刮取在200μl冰冷的1x PBS中，并收集在微型管中。为了获得细胞提取物，将细胞冷冻(液氮)和解冻(37℃水浴)3次，在4℃以5000xg离心10分钟，保存上清液并在-80℃储存。使用人葡萄糖激酶ELISA试剂盒(Abcam)以一式两份(标准品和样品)测量hGlucokinase。使用ELISA试剂盒提供的1x稀释剂N将样品以1/20稀释。通过总蛋白含量对葡萄糖激酶的含量进行标准化，使用在milliQ水中以1/10稀释的样品通过BCA方法以一式两份对细胞提取物中的总蛋白含量进行定量。

4.5葡萄糖激酶活性测定

感染后48小时，用500μl 1x PBS/孔轻轻洗涤细胞。然后，将250μl胰蛋白酶轻轻加入孔中，旋动并通过抽吸去除多余的胰蛋白酶。在室温孵育2分钟后，通过上下吸液吹打将细胞收集在750μl DMEM+10％ FBS中，并转移到1.5ml微型管中。将细胞在4℃以600x g沉淀10分钟，吸出上清液，并将细胞沉淀在处理之前储存在-80℃。

使用葡萄糖激酶活性测定试剂盒(AssayGenie)测量葡萄糖激酶的活性。按照生产商提供的方案，不同之处在于将细胞沉淀在250μl含有2.5mM DTT的Gck测定缓冲液中进行超声处理。在该测定中使用10μl 10倍稀释的样品。

4.6统计学分析

使用Anova和Tukey的多重比较检验对3次研究中的每种MOI都进行独立分析。

结果

在三次独立的研究中，用携带hGlucokinase变体Gck8和Gck12以及WT hGck的AAV1-hGlucokinase载体感染2v6.11细胞，以评估载体感染性和效力。

4.7感染性测定

在测试的3种MOI下(1000vg/细胞(1K)、2000vg/细胞(2K)和4000vg/细胞(4K))，三种AAV1-hGlucokinase载体AAV1-CMV-hGckWT(SEQ ID NO:19)、AAV1-CMV-Gck8(SEQ ID NO:93)和AAV1-CMV-Gck12(SEQ ID NO:95)感染2v6.11细胞的能力未显示出一致的显著性差异，如三次不同测定中的细胞内载体基因组含量(vg/ng DNA)所示(图7A-7C和表9)。

表9：不同AAV1-hGlucokinase载体感染性测定的统计学意义(经调整的P值)。

使用Anova和Tukey的多重比较检验分析对应于每种MOI和每次测定的感染性数据。粗体和斜体表示具有统计学意义。

4.8效力测定

4.8.1人葡萄糖激酶mRNA表达

hGlucokinase表达水平的定量分析显示，分别携带hGckWT和葡萄糖激酶变体Gck8的载体AAV1-CMV-hGckWT(SEQ ID NO:19)和AAV1-CMV-Gck8(SEQ ID NO:93)之间没有一致的显著性差异(图8A-8C和表10)。与AAV1-CMV-hGckWT(SEQ ID NO:19)和具体地AAV1-CMV-Gck8(SEQ ID NO:93)相比，含有葡萄糖激酶变体Gck12的AAV1-CMV-Gck12(SEQ ID NO:95)显示出介导较低mRNA表达的趋势，尽管在不同测定和MOI之间并不一致(图8A-8C和表10)。

表10：不同AAV1-hGlucokinase载体的hGlucokinase mRNA表达的统计学意义(经调整的P值)。

使用Anova和Tukey的多重比较检验分析对应于每种MOI和每次测定的hGlucokinase mRNA表达数据。粗体和斜体表示具有统计学意义。4.8.2对细胞内葡萄糖激酶含量的定量分析

当使用葡萄糖激酶ELISA试剂盒(Abcam)对感染了不同AAV1-hGlucokinase载体的2v6.11细胞的细胞内葡萄糖激酶含量进行定量时，在不同载体之间未观察到在整个MOI和测定中一致的显著性差异(图9A-9C和表11)。

表11：不同AAV1-hGlucokinase载体的细胞内葡萄糖激酶含量的统计学意义(经调整的P值)。

使用Anova和Tukey的多重比较检验分析对应于每种MOI和每次测定的细胞内葡萄糖激酶含量数据。粗体和斜体表示具有统计学意义。

4.8.3葡萄糖激酶活性测定

使用葡萄糖激酶活性测定试剂盒(AssayGenie)测量感染细胞的细胞提取物中的葡萄糖激酶活性。与mRNA表达和蛋白质读取观察到的结果(图8A-8C和9A-9C以及表10和11)一致，在整个MOI和测定中，观察到载体AAV1-CMV-hGckWT(SEQ ID NO:19)、AAV1-CMV-Gck8(SEQ ID NO:93)和AAV1-CMV-Gck12(SEQ ID NO:95)的葡萄糖激酶活性在载体之间没有显著性差异(图10A-10C和表12)。

表12：不同AAV1-hGlucokinase载体的葡萄糖激酶活性的统计学意义(经调整的P值)。

使用Anova和Tukey的多重比较检验分析对应于每种MOI和每次测定的葡萄糖激酶活性数据。粗体和斜体表示具有统计学意义。

实施例5：通过在骨骼肌中表达胰岛素和葡萄糖激酶来逆转1型糖尿病小鼠

为了评估一次性施用AAV载体胰岛素和葡萄糖激酶构建体以从血液中移除葡萄糖的有效性，向C57Blk6小鼠的两个后肢的骨骼肌(股四头肌、腓肠肌和胫骨前肌)注射了含有人胰岛素基因(SEQ ID NO:1)的AAV1和含有大鼠葡萄糖激酶基因的AAV1。

首先用40mg链脲霉素(STZ)连续五天对小鼠进行处理，以耗尽胰腺中的β细胞，从而消除天然小鼠胰岛素的产生，并导致血糖水平达到约600mg/dL。然后在两个后肢的三块确定的肌肉中给予动物等量的AAV1-胰岛素(SEQ ID NO:1)和AAV1-大鼠葡萄糖激酶的混合物。在一个单独的组中，在两块后肢肌肉(股四头肌和腓肠肌)中以较低的总体积向动物施用相同总剂量的AAV1-胰岛素(SEQ ID NO:1)和AAV1-大鼠葡萄糖激酶。将这些动物与用STZ媒介物处理的和非糖尿病的媒介物处理的动物进行比较(n＝10-11/组)。正如早期研究中观察到的那样，接受AAV1-胰岛素(SEQ ID NO:1)和AAV1-大鼠葡萄糖激酶的经STZ处理的糖尿病小鼠在进食和禁食条件下恢复并维持了正常血糖和HbA1C水平。

对两块肌肉施用基因疗法与对三块肌肉施用基因疗法等同有效。接受AAV1-胰岛素(SEQ ID NO:1)和AAV1-大鼠葡萄糖激酶的经链脲霉素处理糖尿病小鼠在注射后长达五周的进食(图11A-11C和图12)和禁食条件下(显示第4周的数据)恢复并维持了正常血糖。另外，仅在两个较大肌群(股四头肌和腓肠肌)中接受较高浓度载体治疗的小鼠似乎与在三个肌群中接受治疗的小鼠表现相当或更好(图11A-11C和图12)。这些结果表明，肌肉解剖结构和血流量可能是异速生长转化(allometric translation)中的一个考虑因素。早在给药后一周就观察到了治疗效果，到两周时观察到高血糖显著降低，处于未经处理的对照动物范围内。AAV介导的基础胰岛素产生和葡萄糖激酶活性的联合作用可能会在骨骼肌中产生“葡萄糖传感器”，使糖尿病动物中的葡萄糖得到适当调节，从而驱动经治疗动物中的糖尿病完全逆转。

实施例6：另外的胰岛素原变体的开发

设计了另外十个编码前胰岛素原变体的经修饰核酸人胰岛素ORF序列(如表13所示)，对应于SEQ ID NO:150-159。ORF编码前胰岛素原变体，这些变体包含B链和/或C链中的氨基酸突变、信号序列中的取代、弗林蛋白酶内切蛋白酶切割位点的添加或其组合。

表13：经修饰的胰岛素的ORF序列

实施例7：对前胰岛素原变体的体外评估

为了在体外评估由SEQ ID NO:150-159介导的胰岛素产生和分泌水平，首先将每种胰岛素变体克隆到由miniCMV启动子控制下的AAV质粒(pAAV)中(pAAV-miniCMV-InsX，其中X表示特定的ORF，即SEQ ID NO:150-159)。质粒名称和相应的ORF序列列于表14中。

表14：胰岛素质粒名称

质粒名称	ORF SEQ ID NO
		pAAV-miniCMV-Ins1	150
pAAV-miniCMV-Ins2	151
		pAAV-miniCMV-Ins3	152
pAAV-miniCMV-Ins4	153
		pAAV-miniCMV-Ins5	154
pAAV-miniCMV-Ins6	155
		pAAV-miniCMV-Ins7	156
pAAV-miniCMV-Ins8	157
		pAAV-miniCMV-Ins9	158
pAAV-miniCMV-Ins10	159

通过克隆在AAV2的ITR之间由miniCMV启动子控制下的人前胰岛素原变体，获得AAV表达盒(pAAV-miniCMV-InsX，其中X表示特定的胰岛素变体)。

根据标准方法，通过三重转染HEK293细胞产生了血清型1的单链AAV载体(AAV1-InsX，其中X表示特定的胰岛素原变体)，其编码由miniCMV启动子控制下的前胰岛素原变体和由RSV启动子控制下的人葡萄糖激酶(Ayuso,E.等人,2010.Curr Gene Ther.10(6):423-36)。将细胞在10个滚瓶(850cm²,平底；Corning^TM,Sigma-Aldrich Co.,Saint Louis,MO,US)中于DMEM 10％ FBS中培养至80％汇合度，并通过磷酸钙法共转染携带两侧为AAV2 ITR的表达盒的质粒、携带AAV2 rep基因和血清型1的AAV cap基因的辅助质粒以及携带腺病毒辅助功能的质粒。非编码质粒用于产生空载体(pAAV-Null)。使用基于聚乙二醇沉淀步骤和两个连续氯化铯(CsCl)梯度的优化方法来纯化AAV。这种基于CsCl的第二代方案显著减少了空的AAV衣壳以及DNA和蛋白质杂质(Ayuso,E.等人,2010.Curr Gene Ther.10(6):423-36)。纯化的AAV载体用PBS透析，过滤并储存在-80℃。使用线性化质粒DNA作为标准曲线，按照针对AAV2参考标准物质描述的方案，通过定量PCR来确定病毒基因组的滴度(Lock M等人,Hum.Gene Ther.2010；21:1273-1285)。根据本领域熟知的分子生物学技术来构建载体。

首先，用等摩尔量的质粒pAAV-miniCMV-Ins1至8转染HEK293细胞。在24孔板中培养HEK293细胞，并按照生产商的说明书(Thermo Fisher Scientific)使用Lipofectamine2000以每孔0.8μg的DNA进行转染。未转染的HEK293细胞和转染了不含转基因的AAV质粒(pAAV-Null)的HEK293细胞用作对照。pAAV-miniCMV-Ins3质粒同时介导了最高的细胞内胰岛素含量和胰岛素到培养基中的分泌(图13A-13B)。这些结果并不是由于与其余变体相比，转染了pAAV-miniCMV-Ins3质粒的HEK293细胞中胰岛素表达水平有所提高(图14A-14D)。

接下来，用pAAV-miniCMV-Ins3、pAAV-miniCMV-Ins9或pAAV-miniCMV-Ins10转染HEK293细胞。将转染了pAAV-Null质粒的HEK293细胞用作对照。与之前的观察结果类似，转染了pAAV-miniCMV-Ins3的细胞优于转导了pAAV-miniCMV-Ins9或pAAV-miniCMV-Ins9的细胞(图15)。

实施例8：前胰岛素原变体生物学活性的体内评价

为了评价生物学活性，生成了编码前胰岛素原变体AAV1-Ins1、AAV1-Ins3、AAV1-Ins4、AAV1-Ins5或AAV1-Ins6的AAV1载体(参见表13)，并在健康小鼠中评估了它们增强体内葡萄糖处置的功效。为此，用3×10¹¹个病毒基因组(vg)的AAV-Ins或AAV1-Null载体处理CD1小鼠。通过腹膜内注射氯胺酮(100mg/kg)和甲苯噻嗪(10mg/kg)来麻醉小鼠。剃去后肢的皮毛，并通过肌内注射施用载体，总体积为180μl，分为六个注射部位，分布在每个后肢的股四头肌、腓肠肌和胫骨前肌中。

AAV施用后三周时，进行葡萄糖耐量试验。为了进行葡萄糖耐量试验，将清醒小鼠禁食过夜(16小时)，并通过腹膜内注射施用葡萄糖(2g/kg体重)。在指定的时间点测量尾静脉血样中的血糖。

在用编码WT前胰岛素原、前胰岛素原变体1或4的AAV1载体处理的对照小鼠的组之间，腹膜内葡萄糖耐量试验后，没有观察到血糖水平的差异(图16A-16C和图17)。相比之下，与健康小鼠相比，接受AAV1-Ins3载体的小鼠表现出更高的葡萄糖耐量(图16D和图17)。用AAV1-Ins6处理部分地增强了葡萄糖处置(图16E和图17)。用6x10¹¹个vg的AAV-Ins6载体处理的小鼠和用3x10¹¹个vg的AAV1-Ins3载体处理的对照小鼠的结果如图16F和图17所示。

实施例9：AAV-Ins或AAV-Gck刺激TLR9的体外评价

在用AAV1-ratGck或AAV1-hInsB10D_2转导的HEK-Dual^TMhTLR9细胞中检测到TLR9刺激的差异(图18A)。与包括CMV启动子和hGckWT编码序列的野生型AAV1-GCK对照构建体(AAV1-hGckWT)相比，用经修饰AAV1-GCK构建体转导的细胞中TLR9刺激减少，这些经修饰AAV1-GCK构建体包括(1)CMV启动子和经修饰的hGck8编码序列(AAV1-hGck8)以及(2)CMV启动子和经修饰的hGck12编码序列(AAV1-hGck12)(图18B)。在用对照AAV1-CMV-hInsB10D和经修饰AAV1-Ins构建体转导的细胞之间，TLR9刺激是相似的，这些经修饰AAV1-Ins构建体包括(1)CMV启动子和经修饰的hIns5编码序列(AAV1-hIns5)以及(2)CMV启动子和经修饰的hIns7编码序列(AAV1-hIns7)(图18C)。表15中提供了TLR9刺激的斜率。结果显示使用包括经修饰GcK编码序列的构建体减少了对TLR9的刺激，并表明使用经修饰的构建体的免疫激活降低。

表15.施用AAV-Ins和AAV-Gck载体后TLR9刺激的斜率。

载体1	载体2	斜率1	斜率2	p
					AAV1-ratGck	AAV1-hInsB10D_2	1.3	0.8	0.02
AAV1-hGckWT	AAV1-hGck8	1.5	0.9	0.004
					AAV1-hGckWT	AAV1-hGck12	1.5	0.7	0.001
AAV1-hGck8	AAV1-hGck12	0.9	0.7	0.21
					AAV1-CMV-hInsB10D	AAV1-hIns5	0.7	0.8	0.54
AAV1-CMV-hInsB10D	AAV1-hIns7	0.7	0.7	0.55
					AAV1-hIns5	AAV1-hIns7	0.8	0.7	0.98
AAV1-ratGck	AAV1-hGckWT	1.3	1.5	0.59
					AAV1-hGckWT	AAV1-hInsB10D_2	1.5	0.8	0.001
AAV1-hGckWT	AAV1-CMV-hInsB10D	1.5	0.7	0.001
					AAV1-hInsB10D_2	AAV1-CMV-hInsB10D	0.8	0.7	0.58

实施例10：在糖尿病小鼠中对AAV-Ins和AAV-Gck载体的体内评价

在施用六次肌内注射后，在链脲霉素诱导的糖尿病C57BL/6J小鼠模型中评估了表达大鼠葡萄糖激酶和人胰岛素的AAV1载体构建体的功效。获得两组小鼠(开始用药时为8-9周龄)。对第一组施用5次每日i.p.剂量的链脲霉素(50mg/kg；STZ)以诱导糖尿病。对第二组施用5次每日i.p.剂量的柠檬酸钠缓冲液，以用作非糖尿病对照。

诱导后，允许动物自由获取食物和市政自来水，这些自来水经过反渗透处理，并通过自动供水系统进行氯化处理以保持1-6ppm的氯。让动物适应饲养设施4天，之后再确定基线体重、非空腹血糖和循环小鼠胰岛素水平。然后将动物分组并分配到各治疗组，使得组内或组间在任何这些参数方面都没有显著性差异。

治疗之前，用氧气中的异氟醚对动物进行麻醉，并通过用胰岛素注射器直接注射到每个后肢的股四头肌、腓肠肌和胫骨前肌中来施用30微升(μL)的剂量。将构建体AAV1-926+AAV1-927(即分别为大鼠GcK和人胰岛素的1:1混合物，之前已在Bosch实验室发表的研究(Mas等人,2006)和第9,309,534号美国专利中有所描述，其在此通过引用方式并入)作为对照施用以进行比较。以高、中(mid)或低剂量施用载体。高剂量是低剂量的3倍(3timesgreater than)，是中剂量的1.5倍(1.5times greater than)。在所有实验中给药都是一致的。每次注射(每只老鼠总共六次)都将每次注射的全部载体悬浮液(30uL)沉积到选定的两侧肌束(胫骨前肌、股四头肌和腓肠肌)中。各治疗组如表16所示。

表16.糖尿病小鼠模型治疗组

每周测定体重和非禁食血糖。为了保持一致性，每次测量都在一天中的同一时间进行(下午1-3点)。在第4周测定禁食血糖，并在第8周进行口服葡萄糖耐量试验(OGTT)。在研究终止时，从所有动物中采集血液样品，以测量血糖、小鼠和人循环胰岛素、HbA1c和其他代谢参数。采集肌肉、肝脏和胰腺的组织样品，称重并保存，用于评估mRNA、蛋白质水平和蛋白质活性。用STZ或柠檬酸钠缓冲液处理的所有小鼠的基线值如表17所示。

表17.用STZ或柠檬酸钠缓冲液处理的小鼠的基线值

到第33天时，供试品有效地将血糖显著降低至非糖尿病对照的水平(图19)。一旦达到正常血糖，在整个研究过程中都会保持该效果。治疗似乎可以防止通常与未经治疗的1型糖尿病相关的体重减轻，并将许多代谢参数恢复到与正常血糖相关的水平。使用包含天然胰岛素信号肽的B10H构建体(高剂量)和包含IL-6信号肽的B10H构建体(低剂量)证明了动力学和降糖作用的最佳状态。

这些数据进一步表明，使用AAV1载体可以在骨骼肌中表达胰岛素和葡萄糖激酶。在1型糖尿病小鼠模型中用这些载体进行治疗迅速地恢复并维持进食和禁食条件下的正常血糖达8周。

10.1施用AAV-Ins和AAV-Gck载体后糖尿病小鼠中的循环胰岛素

水平

施用STZ消除了所有可检测到的循环小鼠胰岛素。为了评估包括带有天然或IL-6信号序列的hInsB10D或hInsB10H的编码序列的AAV1载体构建体的功效，在i.m.注射AAV1载体构建体后4周时，禁食6小时后，测量STZ小鼠循环中的人胰岛素。通过经验证的基于板的ELISA方法分析所有样品。

文献中报道的C57Bl/6小鼠中空腹循环胰岛素水平范围通常为0.75至1.0ng/mL。到第4周时，注射了AAV1-926+AAV1-927(高剂量)和hINSB10D(包括SEQ ID NO:110的编码序列)+AAV1-GCK(AAV926)(中剂量)的小鼠由于持续低血糖而实施安乐死。在结束终点时，那些组的平均循环人胰岛素水平分别为10.1ng/mL和4.5ng/mL。在第4周时，注射了hInsB10D(包括SEQ ID NO:110的编码序列)+AAV1-GCK(AAV926)(低剂量)和hInsB10H+IL6(包括SEQID NO:120的编码序列)+AAV1-GCK(AAV926)(高剂量)的小鼠的循环人胰岛素分别已达到5.27±0.34和3.39±0.25ng/ml的水平(图20A)。最终，这两组也因低血糖而实施安乐死。

如图19所示，在研究期间，施用了hInsB10H(包括SEQ ID NO:111的编码序列)+AAV1-GCK(AAV926)(高剂量)和hInsB10H+IL6(包括SEQ ID NO:120的编码序列)+AAV1-GCK(AAV926)(低剂量)的动物均降低了血糖并将血糖维持在非糖尿病对照小鼠的水平或接近该水平。这些小鼠的循环人胰岛素值分别为1.33±0.14和0.6±0.1ng/mL(图20A和20B)。这些数据表明，将hINS和hGCK共施用于经STZ处理的小鼠的骨骼肌，当循环胰岛素水平处于正常空腹(即，基础)水平范围内时，可以有效控制血糖。

10.2施用AAV-Ins和AAV-Gck载体后糖尿病小鼠的口服葡萄糖耐

量

在第54天时进行最后一次进食葡萄糖测量后，将动物放在干净的笼子里，之后进入12小时暗周期。移除饲料，但在整个过程中提供了获取水的机会。禁食4-6小时后，对动物进行称重，并通过经口管饲法以2g/kg葡萄糖的剂量将葡萄糖溶液(以10mL/kg的0.2mg/mL葡萄糖)施用于动物。然后使用手持式血糖仪通过剪尾法取尾部的第2滴血(5-10μL)来测定血糖。相对于葡萄糖给予，在以下时间进行测量：T＝0(就在葡萄糖给予之前)、15、30、60、90和120分钟。在最后一次血糖测量后，将饲料放回笼子中。

非糖尿病对照小鼠的空腹血糖(T＝0)显著低于经STZ处理动物的空腹血糖(图21)。与STZ对照小鼠相比，使用AAV1载体构建体治疗显著降低了空腹血糖，并达到了非糖尿病对照的水平。在经口管饲葡萄糖(2g/kg)之后，非STZ对照的血糖升高了189±17mg/dL，在15分钟时达到峰值，并在90分钟内恢复到接近对照的水平。相比之下，经STZ处理的小鼠升高了264±37mg/dL，峰值出现在更接近30分钟时，并且即使在120分钟时也未能恢复到对照水平。该数据表明，经STZ处理的小鼠无法在餐后波动后正常调节葡萄糖处置。与非糖尿病对照相似，IM注射载体构建体hInsB10H(包括SEQ ID NO:111的编码序列)+AAV1-GCK(AAV926)(高剂量)和hInsB10H+IL6(包括SEQ ID NO:120的编码序列)+AAV1-GCK(AAV926)(低剂量)在冲击后15分钟时分别产生154±16和218±22mg/dL的峰值葡萄糖波动。两种治疗都在60分钟内使血糖恢复到T＝0水平。利用AUC进行ANCOVA分析的结果支持这些解释(图22)。总体而言，这些数据表明，IM注射这些构建体不仅可以控制空腹血糖水平，还可以减弱通常在糖尿病患者中观察到的大幅度餐后血糖波动。

针对1型糖尿病的目标是在不改变体重的情况下使血糖控制正常化，同时预防糖尿病酮症酸中毒和医学上继发的低血糖。由于1型糖尿病患者的循环胰岛素非常少或没有，因此他们必须每天利用胰岛素来维持生命。此外，据报道，链脲霉素(STZ)诱发的糖尿病产生的高血糖会导致外周组织的进行性胰岛素抵抗性(

P,Moreno M,Alonso A,Fernández R,Diaz F and González C.Insulin sensitivity in streptozotocin-induced diabetic rats treated with different doses of 17beta-oestradiol orprogesterone.Exp Physiol 92:241-9,2007.doi:10.1113/expphysiol.2006.035006.电子出版于2006年10月26日)。此处显示的结果支持，除了改善外周组织的胰岛素敏感性之外，还能够为肌肉提供替代的胰岛素供应，这提供了恢复血糖控制的多种手段。

10.3施用AAV-Ins和AAV-Gck载体后糖尿病小鼠中的HbA1c水平

在注射后8周时的最后一次非禁食采血过程中获得血样。使用手持式HbA1c检测仪从剪尾获取的第2滴血(5-10μL)中测定糖化血液血红蛋白(HbA1c)。该方法已通过与作为金标准参照物的美国国家糖化血红蛋白标准化计划(NGSP)认证方法的对比测试进行了验证。在因健康状况不佳/低血糖而死亡或接受安乐死的动物中(AAV1-Ins+AAV1 GCK高剂量)，未测定HbA1c。

非糖尿病小鼠的HbA1c正常范围为4％-5.6％，而将糖尿病定义为HbA1c>6.5％。来自这项研究的数据如图23所示。非STZ对照小鼠的HbA1c值为4.3±0.05％。与非糖尿病对照相比，施用STZ使HbA1c显著升高(9.48±0.64％；p<0.001)。使用载体构建体hInsB10H+AAV1-GCK(包括SEQ ID NO:111的编码序列)(AAV926)高剂量(4.89±0.15)和hInsB10H+IL6(包括SEQ ID NO:120的编码序列)+AAV1-GCK(AAV926)低剂量(5.03±0.27％)治疗显著降低血糖和HbA1c至非糖尿病对照的水平。

HbA1c是反映一段时间内平均血糖的综合信号；在小鼠的情况下，红细胞t_1/2为约14天。在临床上，该测试是评估血糖控制的主要工具，并对糖尿病和合并症具有很强的预测价值。糖尿病治疗的目标是将HbA1c维持在正常范围内(<6.5％)，大多数市售产品可将HbA1c降低0.5％至1.25％。在这里，使用STZ在小鼠中化学诱导1型糖尿病将HbA1c从4.3％升高到9.48％。IM注射含有hINS和rGCK的AAV1载体，在8周内基本上将HbA1c正常化至非糖尿病对照的HbA1c。此外，与STZ对照相比，这些载体使HbA1c降低了>4％。所有组均降低了HbA1c，但只有hInsB10H(包括SEQ ID NO:111的编码序列)+AAV1-Gck(高剂量)和hIns-B10H-IL6(包括SEQ ID NO:120的编码序列)+AAV1-Gck(低剂量)存活到8周采血，这意味着该HbA1c水平8周内是平均值。

HbA1c与每周血糖的定期测量同时提供了对一段时间内餐后葡萄糖暴露的改善和血糖可变性程度降低的定量量度，表明这两个要素可以通过这种治疗实现正常化。结果支持hIns和GcK AAV构建体以IM方式共施用于1型糖尿病患者可能代表对这种慢性和衰竭性疾病的单剂量逆转。

10.4施用AAV-Ins和AAV-Gck载体后糖尿病小鼠中的血清甘油三

酯和酮体水平

与非糖尿病对照相比，STZ诱发的糖尿病小鼠模型的血液甘油三酯和酮类水平都有所升高，并且已转向以脂质基础为主要能量来源。IM注射载体构建体hInsB10H(包括SEQID NO:111的编码序列)+AAV1-GCK(AAV926)高剂量和hInsB10H+IL6(包括SEQ ID NO:120的编码序列)+AAV1-GCK(AAV926)低剂量将循环甘油三酯(图24A)和酮类(图24B)水平降低至非糖尿病对照的水平或更低。该数据表明，在施用AAV-hInsB10H(带有天然或IL-6信号序列)和AAV-Gck载体之后，多个代谢终点实现正常化。

10.5施用AAV-Ins和AAV-Gck载体后糖尿病小鼠中的肝脏hINS

mRNA水平

qPCR分析用于评估STZ诱发的糖尿病小鼠在施用AAV-Ins和AAV-Gck构建体后的mRNA表达。评估肝脏中的hINS mRNA水平，以确定AAV-1载体是否脱离肌肉，进入循环中并转导肝脏，随后以可检测的水平开始转录。未在非糖尿病对照或STZ对照小鼠中测量样品，因为未在这些组中注射载体。未对遭遇意外死亡或表现出不适的动物进行分析。结果如表18和图25所示。

表18.hINS的肝脏表达

该测定的结果显示ΔCt>5个循环，表明在施用了所测试的三种构建体(AAV1-mWTIns+AAV1-rGck(AAV926)高剂量；AAV1-mWTIns(Ins17)+AAV1-rGck(AAV926)低剂量；和AAV1-mWTIns(Ins17)+AAV1-rGck(AAV926)高剂量)的小鼠肝脏中hINS mRNA的存在非常低或不存在，因此IM注射的AAV主要保留在靶肌肉中。这些结果表明，由于AAV-Ins和AAV-Gck载体在肌肉中的转导以及蛋白质表达，IM递送的AAV1-Ins构建体的结果是观察到血糖、HbA1c、酮类和甘油三酯正常化。

序列表

<110> KRIYA THERAPEUTICS, INC.

UNIVERSITAT AUTONOMA DE BARCELONA

GUPTA, NACHI

SHEN, WEIRAN

GARCIA MARTINEZ, MIQUEL

JIMENEZ CENZANO, VERONICA

BOSCH TUBERT, MARIA FATIMA

<120> 用于治疗糖尿病的经修饰的胰岛素和葡萄糖激酶核酸

<130> 4525.016PC05

<150> US 63/188,778

<151> 2021-05-14

<150> US 63/141,918

<151> 2021-01-26

<150> US 63/067,264

<151> 2020-08-18

<150> US 63/054,162

<151> 2020-07-20

<150> US 63/047,965

<151> 2020-07-03

<160> 167

<170> PatentIn version 3.5

<210> 1

<211> 1046

<212> DNA

<213> 人

<400> 1

aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60

aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtac ttaatacgac tcactatagg ctagcctcga gaattctgcc atggccctgt 360

ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac ccagccgcag 420

cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac ctagtgtgcg 480

gggaacgagg cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg 540

ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg 600

ggtcgcgaca gaagcgtggc attgtggaac aatgctgtac cagcatctgc tccctctacc 660

agctggagaa ctactgcaac tagacgcagc tgctagctaa tcgataccgt cgacctcgag 720

gaattcacgc gtggtacctc tagagtcgac ccgggcggcc gcttcccttt agtgagggtt 780

aatgcttcga gcagacatga taagatacat tgatgagttt ggacaaacca caactagaat 840

gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 900

tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 960

gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatccg 1020

ataagggact agagcagaag cttttg 1046

<210> 2

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 2

<400> 2

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ctgcccctgc 360

tggcactgct ggccctctgg ggacctgacc cagcagcagc ctttgtgaac caacacctgt 420

gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaagaggc ttcttctaca 480

cacccaggac caagagggag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540

gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtccagacag aagagaggca 600

ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660

agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 3

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 3

<400> 3

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgaggctc ctgcccctgc 360

tggccctgct ggccctctgg ggacctgacc cagctgcagc ctttgtgaac caacacctgt 420

gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaaggggc ttcttctaca 480

cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540

gccctggtgc aggcagcctg cagcccttgg ccctggaggg gagcaggcag aagaggggca 600

ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660

agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 4

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 4

<400> 4

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgaggctc ctgcccctgc 360

tggctctgct ggccctctgg ggacctgacc cagcagcagc ctttgtgaac caacacctgt 420

gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaaggggc ttcttctaca 480

cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540

gccctggtgc aggcagcctg cagcccttgg ccctggaggg gagcaggcag aagagaggca 600

ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660

agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 5

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 5

<400> 5

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactg ctccccctcc 360

tggctttgct ggccctgtgg ggaccagatc ctgcagctgc ctttgtgaat cagcacctgt 420

gtggctcaga tctggttgag gcactctacc tggtgtgtgg ggagagaggc ttcttttaca 480

caccaaggac caagagggag gcagaggatc tgcaggtagg tcaggtggag ctgggaggtg 540

gccctggagc aggatccctg cagcccttgg cactggaggg ctccagacag aagaggggca 600

ttgtggaaca gtgttgcact agcatctgca gcctgtacca gctggagaac tactgcaact 660

aaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 6

<211> 953

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 6

<400> 6

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360

gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420

ctcagatctg gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc 480

caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953

<210> 7

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 7

<400> 7

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcgcctc ctgcccctgc 360

tggcgctgct ggccctctgg ggacctgacc cagccgcagc ctttgtgaac caacacctgt 420

gcggctcaga tctggtggaa gctctctacc tagtgtgcgg ggaaagaggc ttcttctaca 480

cacccaggac caagcgggag gcagaggacc tgcaggtggg gcaggtggag ctgggcgggg 540

gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtcgcgacag aagagaggca 600

ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660

agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 8

<211> 953

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns -8

<400> 8

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360

tctgctggcc ctctggggac ctgacccagc tgcagccttt gtgaaccaac acctgtgtgg 420

ctcagatctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480

caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtct agacagaaga ggggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953

<210> 9

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 9

<400> 9

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ctgcccctgc 360

tggccctgct ggccctctgg ggacctgacc cagctgcagc ctttgtgaac caacacctgt 420

gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaagaggc ttcttctaca 480

cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540

gccctggtgc aggcagcctg cagcccttgg ccctggaggg gagcagacag aagagaggca 600

ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660

agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 10

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 10

<400> 10

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ctgcccctgc 360

tggctctgct ggccctctgg ggacctgacc cagctgcagc ctttgtgaac caacacctgt 420

gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaagaggc ttcttctaca 480

cacccaggac caagagggag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540

gccctggtgc aggcagcctg cagcccttgg ccctggaggg gagtagacag aagaggggca 600

ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660

agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 11

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 11

<400> 11

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ctgcccctgc 360

tggctctgct ggccctctgg ggacctgacc cagctgcagc ctttgtgaac caacacctgt 420

gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaagaggc ttcttctaca 480

cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag ctgggtgggg 540

gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtctagacag aagagaggca 600

ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660

agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 12

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns -12

<400> 12

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcggctc ttgccccttc 360

tggctttact ggcactatgg ggccctgacc cagcggccgc tttcgtgaac cagcacctct 420

gcggaagcga tctggtcgag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480

ccccgaggac aaagcgcgag gcagaagacc ttcaagtggg ccaggtagag ctcggagggg 540

gccccggtgc cggatccctg cagcctctgg ctctcgaagg gtctcgacaa aaacgtggca 600

tcgtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660

gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 13

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 13

<400> 13

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcggctc ttgccccttc 360

tggctttact ggcactatgg ggccctgacc cagcggccgc ttttgtgaac cagcacctct 420

gcggatctga tctggttgag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480

ccccaaggac aaagcgcgag gcagaagacc ttcaagtggg ccaggtagag ctgggagggg 540

gcccgggtgc aggatccctg cagcctctgg ctctagaagg gtctagacaa aaaaggggca 600

tagtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660

gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 14

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 14

<400> 14

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcggctc ttgccccttc 360

tggctttact ggcactatgg ggccctgacc cagcggccgc ttttgtgaac cagcacctct 420

gcggatctga tctggtggag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480

cccccaggac aaagcgcgag gcagaagacc ttcaagtggg ccaggtagag ctgggagggg 540

gcccgggtgc aggatccctg cagcctctgg ctctggaagg gtctagacaa aaaaggggca 600

tagtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660

gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 15

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 15

<400> 15

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ttgccccttc 360

tggctttact ggcactatgg ggccctgacc cagcagctgc ttttgtgaac cagcacctct 420

gtggatctga tctggttgag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480

ccccaaggac aaagagggag gcagaagacc ttcaagtggg ccaggtagag ctgggagggg 540

gccctggtgc aggatccctg cagcctctgg ctctagaagg gtctagacaa aaaaggggca 600

tagtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660

gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 16

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 16

<400> 16

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ttgccccttc 360

tggctttact ggcactatgg ggccctgacc cagcagctgc ttttgtgaac cagcacctct 420

gtggatctga tctggtggag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480

cccccaggac aaagagagag gcagaagacc ttcaagtggg ccaggtagag ctgggagggg 540

gcccaggtgc aggatccctg cagcctctgg ctctggaagg gtctagacaa aaaagaggca 600

tagtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660

gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 17

<400> 17

000

<210> 18

<400> 18

000

<210> 19

<211> 2118

<212> DNA

<213> 人

<400> 19

ctagaagctt tattgcggta gtttatcaca gttaaattgc taacgcagtc agtgcttctg 60

acacaacagt ctcgaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcgtgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtacttaata cgactcacta taggctagcc tcgagaattc tgccatggcg 360

atggatgtca caaggagcca ggcccagaca gccttgactc tggtagagca gatcctggca 420

gagttccagc tgcaggagga ggacctgaag aaggtgatga gacggatgca gaaggagatg 480

gaccgcggcc tgaggctgga gacccatgaa gaggccagtg tgaagatgct gcccacctac 540

gtgcgctcca ccccagaagg ctcagaagtc ggggacttcc tctccctgga cctgggtggc 600

actaacttca gggtgatgct ggtgaaggtg ggagaaggtg aggaggggca gtggagcgtg 660

aagaccaaac accagatgta ctccatcccc gaggacgcca tgaccggcac tgctgagatg 720

ctcttcgact acatctctga gtgcatctcc gacttcctgg acaagcatca gatgaaacac 780

aagaagctgc ccctgggctt caccttctcc tttcctgtga ggcacgaaga catcgataag 840

ggcatccttc tcaactggac caagggcttc aaggcctcag gagcagaagg gaacaatgtc 900

gtggggcttc tgcgagacgc tatcaaacgg agaggggact ttgaaatgga tgtggtggca 960

atggtgaatg acacggtggc cacgatgatc tcctgctact acgaagacca tcagtgcgag 1020

gtcggcatga tcgtgggcac gggctgcaat gcctgctaca tggaggagat gcagaatgtg 1080

gagctggtgg agggggacga gggccgcatg tgcgtcaata ccgagtgggg cgccttcggg 1140

gactccggcg agctggacga gttcctgctg gagtatgacc gcctggtgga cgagagctct 1200

gcaaaccccg gtcagcagct gtatgagaag ctcataggtg gcaagtacat gggcgagctg 1260

gtgcggcttg tgctgctcag gctcgtggac gaaaacctgc tcttccacgg ggaggcctcc 1320

gagcagctgc gcacacgcgg agccttcgag acgcgcttcg tgtcgcaggt ggagagcgac 1380

acgggcgacc gcaagcagat ctacaacatc ctgagcacgc tggggctgcg accctcgacc 1440

accgactgcg acatcgtgcg ccgcgcctgc gagagcgtgt ctacgcgcgc tgcgcacatg 1500

tgctcggcgg ggctggcggg cgtcatcaac cgcatgcgcg agagccgcag cgaggacgta 1560

atgcgcatca ctgtgggcgt ggatggctcc gtgtacaagc tgcaccccag cttcaaggag 1620

cggttccatg ccagcgtgcg caggctgacg cccagctgcg agatcacctt catcgagtcg 1680

gaggagggca gtggccgggg cgcggccctg gtctcggcgg tggcctgtaa gaaggcctgt 1740

atgctgggcc agtgaacgca gctgctagct aatcgatacc gtcgacctcg aggaattcac 1800

gcgtggtacc tctagagtcg acccgggcgg ccgcttccct ttagtgaggg ttaatgcttc 1860

gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 1920

aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 1980

gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga 2040

tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga 2100

ctagagcaga agcttttg 2118

<210> 20

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 2

<400> 20

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaagg atgcagaagg agatggacag gggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900

aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacca 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcacaggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

ggatgtgtgt caatacagag tggggagcct ttggggactc tggggagctg gatgagttcc 1140

tgctggagta tgacaggctg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgag gcttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg cctctgagca gctgaggaca aggggagcct 1320

ttgagaccag gtttgtgtcc caggtggaga gtgacacagg agacaggaag cagatctaca 1380

acatcctgag caccctgggg ctgagaccct ccaccacaga ctgtgacatt gtgaggaggg 1440

cttgtgagag tgtgtctacc agggctgccc acatgtgctc tgctgggctg gctggggtca 1500

tcaacaggat gagggagagc aggagtgagg atgtaatgag gatcactgtg ggagtggatg 1560

gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgccagt gtgaggaggc 1620

tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc aggggagcag 1680

ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 21

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-3

<400> 21

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggacag gggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtggt ctgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgagg gatgctatca 900

aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacaa 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcacaggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

gaatgtgtgt caatacagag tggggagcct ttggggactc tggggagctg gatgagttcc 1140

tgctggagta tgacagactg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgag acttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg cctctgagca gctgagaaca agaggagcct 1320

ttgagaccag atttgtgtcc caggtggagt ctgacacagg agacaggaag cagatctaca 1380

acatcctgag caccctgggg ctgaggccct ccaccacaga ctgtgacatt gtgagaagag 1440

cctgtgagtc tgtgtctacc agggctgccc acatgtgctc tgctgggctg gctggggtca 1500

tcaacagaat gagggagagc aggtctgagg atgtaatgag aatcactgtg ggagtggatg 1560

gctctgtgta caagctgcac ccctcattca aggagagatt ccatgcctct gtgagaaggc 1620

tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc agaggagctg 1680

ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 22

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-4

<400> 22

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggacag gggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgact ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgagg gatgctatca 900

aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtagg catgattgtg ggcactggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

gaatgtgtgt caatactgag tggggtgcct ttggggactc aggggagctg gatgagttcc 1140

tgctggagta tgacagactg gtggatgaga gctctgcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgag acttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg cctctgagca gctgagaaca agaggagcct 1320

ttgagaccag atttgtgtcc caggtggagt ctgacactgg tgacaggaag cagatctaca 1380

acatcctgag cacactgggg ctgaggccct ccaccacaga ctgtgacatt gtgagaagag 1440

cttgtgagag tgtgtctacc agggctgctc acatgtgcag tgctgggctg gctggggtca 1500

tcaacagaat gagggagagc aggtctgagg atgtaatgag aatcactgtg ggtgtggatg 1560

gcagtgtgta caagctgcac ccctcattca aggagagatt ccatgccagt gtgagaaggc 1620

tgacccccag ctgtgagatc accttcattg agtctgagga gggcagtggc aggggtgcag 1680

ccctggtcag tgcagtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 23

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-5

<400> 23

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggacag gggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtggt ctgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgact ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcat gaagacatag ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900

aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgatagtg ggcactggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

ggatgtgtgt caatactgag tggggagcct ttggggactc tggggagctg gatgagttcc 1140

tgctggagta tgacaggctg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatggggg agctggtgag gcttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg cctctgagca gctgagaaca aggggagcct 1320

ttgagaccag gtttgtgtcc caggtggagt ctgacactgg ggacaggaag cagatctaca 1380

acatcctgag caccctgggg ctgaggccct ccaccactga ctgtgacata gtgaggagag 1440

cctgtgagtc tgtgtctacc agggctgccc acatgtgctc tgctgggctg gcaggggtca 1500

tcaacaggat gagggagagc agatctgagg atgtaatgag gatcactgtg ggtgtggatg 1560

gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgcctct gtgaggaggc 1620

tgacccccag ctgtgagatc acctttatag agtctgagga gggcagtggc agaggggcag 1680

ccctggtctc tgcagtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 24

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-6

<400> 24

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaagg atgcagaagg agatggacag gggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900

aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacca 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgatagtg ggcacaggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

ggatgtgtgt caatactgag tggggagcct ttggggactc tggggagctg gatgagttcc 1140

tgctggagta tgacaggctg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatggggg agctggtgag gcttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg cctcagagca gctgagaaca aggggagcct 1320

ttgagaccag gtttgtgtcc caggtggaga gtgacacagg tgacaggaag cagatctaca 1380

acatcctgag caccctgggg ctgagaccct ccaccacaga ctgtgacatt gtgaggaggg 1440

cctgtgagag tgtgtctacc agggctgccc acatgtgctc tgctgggctg gcaggagtca 1500

tcaacaggat gagggagagc aggagtgagg atgtaatgag gatcactgtg ggagtggatg 1560

gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgccagt gtgagaaggc 1620

tgacccccag ctgtgagatc acctttatag agtctgagga gggcagtggc aggggagcag 1680

ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 25

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-7

<400> 25

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaagg atgcagaagg agatggacag gggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900

aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacaa 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgatagtg ggcacaggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

gaatgtgtgt caatacagag tggggagcct ttggggactc tggggagctg gatgagttcc 1140

tgctggagta tgacagactg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgag gcttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg cctctgagca gctgaggaca agaggagcct 1320

ttgagaccag atttgtgtca caggtggagt ctgacactgg agacagaaag cagatctaca 1380

acatcctgag cacactgggg ctgaggccct ccaccactga ctgtgacata gtgaggagag 1440

cttgtgagag tgtgtctacc agagctgccc acatgtgctc tgctgggctg gctggggtca 1500

tcaacaggat gagagagagc aggagtgagg atgtaatgag aatcactgtg ggggtggatg 1560

gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgcctct gtgaggaggc 1620

tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtgga aggggagcag 1680

ccctggtctc tgcagtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 26

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-8

<400> 26

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaagg atgcagaagg agatggacag gggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900

aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcactggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

ggatgtgtgt caatactgag tggggagcct ttggggactc tggggagctg gatgagttcc 1140

tgctggagta tgacaggctg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgag acttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg cctcagagca gctgaggaca aggggagcct 1320

ttgagaccag gtttgtgtcc caggtggaga gtgacactgg agacaggaag cagatctaca 1380

acatcctgag caccctgggg ctgaggccct ctaccacaga ctgtgacata gtgagaaggg 1440

cctgtgagtc tgtgtctacc agggctgccc acatgtgctc tgctgggctg gctggagtca 1500

tcaacagaat gagggagagc agaagtgagg atgtaatgag gatcactgtg ggagtggatg 1560

gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgccagt gtgaggaggc 1620

tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc aggggagctg 1680

ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 27

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-9

<400> 27

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggaccg cggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgcg ctccacccca gaaggctcag 540

aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900

aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggttgg catgattgtg ggcacaggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggcc 1080

gcatgtgtgt caatactgag tggggcgcct ttggggactc tggagagctg gatgagttcc 1140

tgctggagta tgaccgcctg gtggatgaga gctcagcaaa cccaggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgcg gcttgtgctg ctcaggttgg 1260

tggatgaaaa cctgctcttc catggggagg ccagtgagca gctgcgcaca cgcggagcct 1320

ttgagacgcg ctttgtgtca caagtggagt ctgacacagg agaccgcaag cagatctaca 1380

acatcctgag cacactgggg ctgcggccct ccaccactga ctgtgacatt gtgcgccgcg 1440

cctgtgagag tgtgtctacg cgcgctgcgc acatgtgctc agcggggctg gcgggagtca 1500

tcaaccgcat gcgcgagagc cgctctgagg atgtaatgcg catcactgtg ggagtggatg 1560

gcagtgtgta caagctgcac cccagcttca aggagcggtt ccatgcctca gtgcgcaggc 1620

tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc agaggcgcgg 1680

ccctggtcag cgcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 28

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-10

<400> 28

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggaccg cggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgcg ctccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgcgg gatgctatca 900

aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacca 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcactggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggcc 1080

gcatgtgtgt caatacagag tggggcgcct ttggggacag cggagagctg gatgagttcc 1140

tgctggagta tgaccgcctg gtggatgaga gctcagcaaa cccaggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgcg gcttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg cctctgagca gctgcgcaca cgcggagcct 1320

ttgagacgcg ctttgtgagc caggtggaga gtgacacagg agaccgcaag cagatctaca 1380

acatcctgag caccctgggg ctgcggccca gcaccactga ctgtgacatt gtgcgccgcg 1440

cctgtgagtc agtgtctacg cgcgctgcgc acatgtgcag cgcggggctg gcgggagtca 1500

tcaaccgcat gcgcgagagc cgctctgagg atgtaatgcg catcactgtg ggagtggatg 1560

gcagtgtgta caagctgcac cccagcttca aggagcggtt ccatgcctca gtgcgcaggc 1620

tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc agaggcgcgg 1680

ccctggtcag cgcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 29

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-11

<400> 29

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggaccg cggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgcg ctccacccca gaaggctcag 540

aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tcccggagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900

aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtagg catgatagtg ggcacaggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggcc 1080

gcatgtgtgt caatactgag tggggcgcct ttggggacag tggagagctg gatgagttcc 1140

tgctggagta tgaccgcctg gtggatgaga gctctgcaaa cccaggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgcg gcttgtgctg ctcaggctag 1260

tggatgaaaa cctgctcttc catggggagg cctcagagca gctgcgcaca cgcggagcct 1320

ttgagacgcg ctttgtgtct caagtggaga gtgacacagg tgaccgcaag cagatctaca 1380

acatcctgag cactctgggg ctgcggccct caaccacaga ctgtgacatt gtgcgccgcg 1440

cctgtgagtc tgtgtctacg cgcgctgcgc acatgtgcag tgcggggctg gcgggagtca 1500

tcaaccgcat gcgcgagagc cgctcagagg atgtaatgcg catcactgtg ggtgtggatg 1560

gctctgtgta caagctgcac cccagcttca aggagcggtt ccatgccagt gtgcgcaggc 1620

tgactcccag ctgtgagatc acctttatag agtcagagga gggcagtggc agaggcgcgg 1680

ccctggtctc cgcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 30

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-12

<400> 30

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggaccg cggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgcg ctccacccca gaaggctcag 540

aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtggt ctgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgact ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900

aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggttgg catgattgtg ggcactggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggcc 1080

gcatgtgtgt caatactgag tggggcgcct ttggggactc tggtgagctg gatgagttcc 1140

tgctggagta tgaccgcctg gtggatgaga gctctgcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggtg agctggtgcg gcttgtgctg ctcaggttag 1260

tggatgaaaa cctgctcttc catggggagg cctctgagca gctgcgcaca cgcggagcct 1320

ttgagacgcg ctttgtgtct caagtggagt ctgacactgg tgaccgcaag cagatctaca 1380

acatcctgag cactctgggg ctgagaccct ctaccactga ctgtgacatt gtgcgccgcg 1440

cctgtgagtc tgtgtctacg cgcgctgcgc acatgtgctc tgcggggctg gcgggtgtca 1500

tcaaccgcat gcgcgagagc cgctctgagg atgtaatgcg catcactgtg ggtgtggatg 1560

gctctgtgta caagctgcac ccctcattca aggagcggtt ccatgcctct gtgcgcaggc 1620

tgactcccag ctgtgagatc acctttattg agtctgagga gggcagtggc agaggcgcgg 1680

ccctggtctc tgcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 31

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-13

<400> 31

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggacag aggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag atccacccca gaaggctcag 540

aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900

aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggttgg catgattgtg ggcacaggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

ggatgtgtgt caatactgag tggggagcct ttggggactc tggagagctg gatgagttcc 1140

tgctggagta tgacagactg gtggatgaga gctcagcaaa cccaggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgag gcttgtgctg ctcaggttgg 1260

tggatgaaaa cctgctcttc catggggagg ccagtgagca gctgagaaca aggggagcct 1320

ttgagacaag atttgtgtca caggtggagt ctgacacagg agacaggaag cagatctaca 1380

acatcctgag caccctgggg ctgagaccct ccaccactga ctgtgacatt gtgaggagag 1440

cctgtgagag tgtgtctacc agggctgctc acatgtgctc agcagggctg gctggagtca 1500

tcaacagaat gagggagagc agatctgagg atgtaatgag gatcactgtg ggtgtggatg 1560

gcagtgtgta caagctgcac cccagcttca aggagagatt ccatgcctca gtgaggaggc 1620

tgacccccag ctgtgagatc accttcattg agtctgagga gggcagtggc agaggagcag 1680

ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 32

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-14

<400> 32

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggacag aggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag atccacccca gaaggctcag 540

aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900

aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacca 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcactggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

gaatgtgtgt caatacagag tggggagcct ttggggactc tggagagctg gatgagttcc 1140

tgctggagta tgacagactg gtggatgaga gctcagcaaa cccaggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggag agctggtgag acttgtgctg ctcaggctgg 1260

tggatgaaaa cctgctcttc catggggagg ccagtgagca gctgagaaca agaggagcct 1320

ttgagaccag atttgtgagc caggtggagt cagacacagg agacagaaag cagatctaca 1380

acatcctgag caccctgggg ctgagaccca gcaccactga ctgtgacatt gtgagaagag 1440

cctgtgagtc tgtgtctacc agagctgccc acatgtgcag tgctgggctg gctggagtca 1500

tcaacagaat gagagagagc agatcagagg atgtaatgag aatcactgtg ggtgtggatg 1560

gctctgtgta caagctgcac cccagcttca aggagagatt ccatgccagt gtgagaaggc 1620

tgacccccag ctgtgagatc acctttattg agtcagagga gggcagtggc agaggagcag 1680

ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 33

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-15

<400> 33

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggacag aggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag atccacccca gaaggctcag 540

aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660

tcccagagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900

aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggtagg catgatagtg ggcacaggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

ggatgtgtgt caatactgag tggggagcct ttggggacag tggagagctg gatgagttcc 1140

tgctggagta tgacagactg gtggatgaga gctctgcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggtg agctggtgag gcttgtgctg ctcaggctag 1260

tggatgaaaa cctgctcttc catggggagg cctcagagca gctgagaaca aggggagcct 1320

ttgagacaag atttgtgtct caggtggaga gtgacactgg agacaggaag cagatctaca 1380

acatcctgag cacactgggg ctgagaccct caaccactga ctgtgacatt gtgaggagag 1440

cctgtgagtc tgtgtctaca agggctgcac acatgtgcag tgctgggctg gcaggtgtca 1500

tcaacagaat gagggagagc agatcagagg atgtaatgag gatcactgtg ggagtggatg 1560

gctctgtgta caagctgcac cccagcttca aggagagatt ccatgccagt gtgaggaggc 1620

tgacccccag ctgtgagatc acctttatag agtcagagga gggcagtggc agaggtgctg 1680

ccctggtctc tgcagtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 34

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-16

<400> 34

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagaaga atgcagaagg agatggacag aggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctatgtgag atccacccca gaaggctcag 540

aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtggt ctgtgaagac caaacaccag atgtactcca 660

tccctgagga tgccatgact ggcactgctg agatgctctt tgactacatc tctgagtgca 720

tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900

aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacta 960

tgatctcctg ctactatgaa gaccatcagt gtgaggttgg catgattgtg ggcactggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080

gaatgtgtgt caatactgag tggggtgcct ttggggactc tggtgagctg gatgagttcc 1140

tgctggagta tgacagactg gtggatgaga gctctgcaaa ccctggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggtg agctggtgag acttgtgctg ctcaggttag 1260

tggatgaaaa cctgctcttc catggggagg cctctgagca gctgagaaca agaggagcct 1320

ttgagactag atttgtgtct caggtggagt ctgacactgg tgacagaaag cagatctaca 1380

acatcctgag cactctgggg ctgagaccct ctaccactga ctgtgacatt gtgagaagag 1440

cctgtgagtc tgtgtctact agagctgctc acatgtgctc tgctgggctg gctggtgtca 1500

tcaacagaat gagagagagc agatctgagg atgtaatgag aatcactgtg ggtgtggatg 1560

gctctgtgta caagctgcac ccctcattca aggagagatt ccatgcctct gtgagaaggc 1620

tgactcccag ctgtgagatc accttcattg agtctgagga gggcagtggc agaggtgctg 1680

ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 35

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-17

<400> 35

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga cgtgacccgg agccaggctc 360

aaacagcact gactctcgtc gagcagatct tggcggaatt ccagcttcaa gaggaagatc 420

tgaagaaagt tatgagaagg atgcagaagg agatggaccg cggcttacga ctggaaacgc 480

acgaggaggc ctccgtgaaa atgctaccca cctacgtgcg ttctacacct gaaggatcag 540

aggtggggga ttttctcagt ctggacttgg gtggcactaa cttccgggtc atgctggtga 600

aggttggaga aggggaggaa ggccagtggt cggtgaaaac caagcatcag atgtatagca 660

ttccagagga tgctatgaca ggcaccgccg agatgctttt tgactacata tccgaatgca 720

tctctgattt cctcgacaag caccaaatga aacataagaa actgccgctg ggatttactt 780

tctcatttcc cgtgagacac gaggatattg acaaggggat cctcttgaat tggacgaaag 840

gcttcaaggc aagtggcgcc gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900

agcgccgggg tgactttgag atggacgttg tggcaatggt caacgataca gtggccacaa 960

tgatcagctg ttattacgag gaccatcagt gcgaagtcgg catgatagtg ggaactgggt 1020

gtaatgcgtg ctatatggag gaaatgcaga acgttgagtt agtggaaggc gatgagggta 1080

gaatgtgtgt aaataccgag tggggagctt tcggggactc cggcgaactg gatgagttcc 1140

tactcgaata cgacaggctg gtggatgagt ctagcgccaa ccctggccag caattgtatg 1200

aaaaactgat cggagggaag tacatgggtg agcttgtccg cctcgttctg ctgcgattag 1260

tggacgagaa tctcctgttt cacggcgaag catccgagca gttgcgtaca cggggagcct 1320

tcgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380

acatccttag cacactgggc ctacgcccat ctacgaccga ttgcgacatt gtgcggcgag 1440

cttgtgagtc cgtttcgact agagccgcac acatgtgctc agctggtctc gccggagtaa 1500

tcaataggat gcgcgaaagc cggagtgagg acgtgatgag aataacagtc ggcgtggatg 1560

ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcacgcgagc gtgcgccgtc 1620

tgaccccttc atgtgagatt actttcatcg aatccgagga gggcagtgga cggggggcag 1680

ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 36

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-18

<400> 36

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtgaccaga agccaggctc 360

aaacagcact gactctggta gagcagatct tggcggaatt ccagcttcaa gaggaagatc 420

tgaagaaagt tatgagaagg atgcagaagg agatggaccg cggcttaagg ctggaaaccc 480

atgaggaggc cagtgtgaaa atgctaccca cctatgtaag atctacacct gaaggatcag 540

aggtggggga ttttctcagt ctggacttgg gtggcactaa cttcagggtc atgctggtga 600

aggttggaga aggggaggaa ggccagtggt cagtgaaaac caagcatcag atgtatagca 660

ttccagagga tgctatgaca ggtaccgctg agatgctttt tgactacata tctgaatgca 720

tctctgattt cctagacaag caccaaatga aacataagaa actgccgctg ggatttactt 780

tctcatttcc tgtgagacat gaggatattg acaaggggat cctcttgaat tggacaaaag 840

gcttcaaggc aagtggcgca gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900

agcgcagagg tgactttgag atggatgttg tggcaatggt caatgataca gtggccacaa 960

tgatcagctg ttattatgag gaccatcagt gtgaagtggg catgatagtg ggaactgggt 1020

gtaatgcctg ctatatggag gaaatgcaga atgttgagtt agtggaaggt gatgagggta 1080

gaatgtgtgt aaatacagag tggggagctt ttggggacag cggagaactg gatgagttcc 1140

tattagaata tgacaggctg gtggatgagt ctagcgccaa ccctggccag caattgtatg 1200

aaaaactgat tggagggaag tacatgggtg agcttgtccg ccttgttctg ctgcggttag 1260

tggatgagaa tctcctgttt catggggaag caagtgagca gttgcggaca aggggagcct 1320

ttgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380

acatccttag cacactgggc ctaagaccat ctaccactga ttgtgacatt gtgcggcggg 1440

cttgtgagtc agtttccact agagccgcac acatgtgctc agctggtttg gctggagtaa 1500

tcaataggat gcgcgaaagc aggagtgagg atgtgatgag aataacagtt ggtgtggatg 1560

ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcacgcgtct gtgcgcagac 1620

tgaccccttc atgtgagatt actttcatag aatctgagga gggcagtgga aggggggcag 1680

ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 37

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-19

<400> 37

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtgaccaga agccaggctc 360

aaacagcact gactctggtg gagcagatct tggcggaatt ccagcttcaa gaggaagatc 420

tgaagaaagt tatgagaagg atgcagaagg agatggaccg cggcttaagg ctggaaaccc 480

atgaggaggc cagtgtgaaa atgctaccca cctatgtaag atctacacct gaaggatcag 540

aggtggggga ttttctcagt ctggacttgg gtggcactaa cttcagggtc atgctggtga 600

aggttggaga aggggaggaa ggccagtggt cagtgaaaac caagcatcag atgtatagca 660

ttccagagga tgctatgaca ggtaccgctg agatgctttt tgactacata tctgaatgca 720

tctctgattt cctggacaag caccaaatga aacataagaa actgccgctg ggatttactt 780

tctcatttcc tgtgagacat gaggatattg acaaggggat cctcttgaat tggaccaaag 840

gcttcaaggc aagtggcgca gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900

agcgcagagg tgactttgag atggatgttg tggcaatggt caatgataca gtggccacaa 960

tgatcagctg ttattatgag gaccatcagt gtgaagtggg catgatagtg ggaactgggt 1020

gtaatgcctg ctatatggag gaaatgcaga atgttgagtt agtggaaggt gatgagggta 1080

gaatgtgtgt aaatacagag tggggagctt ttggggacag cggagaactg gatgagttcc 1140

tactggaata tgacaggctg gtggatgagt ctagcgccaa ccctggccag caattgtatg 1200

aaaaactgat tggagggaag tacatgggtg agcttgtccg cctggttctg ctgcggttag 1260

tggatgagaa tctcctgttt catggggaag caagtgagca gttgcggaca aggggagcct 1320

ttgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380

acatccttag cacactgggc ctaagaccat ctaccacaga ttgtgacatt gtgcggcggg 1440

cttgtgagtc agttagcact agagccgcac acatgtgctc agctggtctg gctggagtaa 1500

tcaataggat gcgcgaaagc aggagtgagg atgtgatgag aataacagtg ggtgtggatg 1560

ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcacgcgtct gtgcgcagac 1620

tgaccccttc atgtgagatt actttcatag aatctgagga gggcagtgga aggggggcag 1680

ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 38

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-20

<400> 38

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtgaccaga agccaggctc 360

aaacagcact gactctggta gagcagatct tggctgaatt ccagcttcaa gaggaagatc 420

tgaagaaagt tatgagaagg atgcagaagg agatggacag gggcttaaga ctggaaaccc 480

atgaggaggc cagtgtgaaa atgctaccca cctatgtaag gtctacacct gaaggatcag 540

aggtggggga ttttctcagt ctggacttgg gtggcactaa cttcagagtc atgctggtga 600

aggttggaga aggggaggaa ggccagtggt cagtgaaaac caagcatcag atgtatagca 660

ttccagagga tgctatgaca ggcacagcag agatgctttt tgactacata tctgaatgca 720

tctctgattt cctagacaag caccaaatga aacataagaa actgccactg ggatttactt 780

tctcatttcc tgtgagacat gaggatattg acaaggggat cctcttgaat tggaccaaag 840

gcttcaaggc aagtggtgct gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900

agaggagagg tgactttgag atggatgttg tggcaatggt caatgataca gtggccacaa 960

tgatcagctg ttattatgag gaccatcagt gtgaagtggg catgatagtg ggaactgggt 1020

gtaatgcctg ctatatggag gaaatgcaga atgttgagtt agtggaagga gatgagggta 1080

gaatgtgtgt aaatacagag tggggagctt ttggggacag tggggaactg gatgagttcc 1140

tattagaata tgacaggctg gtggatgagt cttcagccaa ccctggccag caattgtatg 1200

aaaaactgat tggagggaag tacatgggtg agcttgtcag gcttgttctg ctgagattag 1260

tggatgagaa tctcctgttt catggtgaag catctgagca gttgaggaca agaggagcct 1320

ttgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380

acatccttag cacactgggc ctaaggccat ctaccactga ttgtgacatt gtgagaaggg 1440

cttgtgagag tgtttccact agagcagcac acatgtgctc agctggtttg gctggagtaa 1500

tcaataggat gagagaaagc aggagtgagg atgtgatgag aataacagtt ggagtggatg 1560

ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcatgcctct gtgagaaggc 1620

tgaccccttc atgtgagatt actttcatag aatcagagga gggcagtgga agaggggcag 1680

ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 39

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck-21

<400> 39

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccatgga tgtgaccaga agccaggctc 360

aaacagcact gactctggtg gagcagatct tggctgaatt ccagcttcaa gaggaagatc 420

tgaagaaagt tatgagaagg atgcagaagg agatggacag aggcttaaga ctggaaaccc 480

atgaggaggc cagtgtgaaa atgctaccca cctatgtaag atctacacct gaaggatcag 540

aggtggggga ttttctcagt ctggacttgg gtggcactaa cttcagagtc atgctggtga 600

aggttggaga aggggaggaa ggccagtggt cagtgaaaac caagcatcag atgtatagca 660

ttccagagga tgctatgaca ggcacagcag agatgctttt tgactacata tctgaatgca 720

tctctgattt cctggacaag caccaaatga aacataagaa actgcccctg ggatttactt 780

tctcatttcc tgtgagacat gaggatattg acaaggggat cctcttgaat tggaccaaag 840

gcttcaaggc aagtggtgct gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900

agagaagagg tgactttgag atggatgttg tggcaatggt caatgataca gtggccacaa 960

tgatcagctg ttattatgag gaccatcagt gtgaagtggg catgatagtg ggaactgggt 1020

gtaatgcctg ctatatggag gaaatgcaga atgttgagtt agtggaagga gatgagggta 1080

gaatgtgtgt aaatacagag tggggagctt ttggggacag tggggaactg gatgagttcc 1140

tactggaata tgacaggctg gtggatgagt cttcagccaa ccctggccag caattgtatg 1200

aaaaactgat tggagggaag tacatgggtg agcttgtcag actggttctg ctgagattag 1260

tggatgagaa tctcctgttt catggtgaag catctgagca gttgagaaca agaggagcct 1320

ttgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380

acatccttag cacactgggc ctaagaccat ctaccactga ttgtgacatt gtgagaagag 1440

cttgtgagag tgttagcact agagcagcac acatgtgctc agctggtctg gctggagtaa 1500

tcaataggat gagagaaagc agaagtgagg atgtgatgag aataacagtg ggagtggatg 1560

ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcatgcctct gtgagaagac 1620

tgaccccttc atgtgagatt actttcatag aatcagagga gggcagtgga agaggggcag 1680

ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 40

<400> 40

000

<210> 41

<211> 110

<212> PRT

<213> 人工序列

<220>

<223> 野生型胰岛素aa

<400> 41

Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu

1 5 10 15

Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly

20 25 30

Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe

35 40 45

Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly

50 55 60

Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu

65 70 75 80

Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys

85 90 95

Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

100 105 110

<210> 42

<211> 329

<212> DNA

<213> 人工序列

<220>

<223> 5' UTR

<400> 42

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacc 329

<210> 43

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 43

atggccctgt ggatgagact cctgcccctg ctggcactgc tggccctctg gggacctgac 60

ccagcagcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120

ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagaggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtccagaca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 44

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 44

atggccctgt ggatgaggct cctgcccctg ctggccctgc tggccctctg gggacctgac 60

ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120

ctagtgtgtg gggaaagggg cttcttctac acacccagga ccaagagaga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggagcaggca gaagaggggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 45

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 45

atggccctgt ggatgaggct cctgcccctg ctggctctgc tggccctctg gggacctgac 60

ccagcagcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120

ctagtgtgtg gggaaagggg cttcttctac acacccagga ccaagagaga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggagcaggca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 46

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 46

atggccctgt ggatgagact gctccccctc ctggctttgc tggccctgtg gggaccagat 60

cctgcagctg cctttgtgaa tcagcacctg tgtggctcag atctggttga ggcactctac 120

ctggtgtgtg gggagagagg cttcttttac acaccaagga ccaagaggga ggcagaggat 180

ctgcaggtag gtcaggtgga gctgggaggt ggccctggag caggatccct gcagcccttg 240

gcactggagg gctccagaca gaagaggggc attgtggaac agtgttgcac tagcatctgc 300

agcctgtacc agctggagaa ctactgcaac taa 333

<210> 47

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 47

atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60

ccagccgcag cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac 120

ctagtgtgcg gggaaagagg cttcttctac acacccagga ccaagcggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtcgcgaca gaagcggggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 48

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 48

atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60

ccagccgcag cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac 120

ctagtgtgcg gggaaagagg cttcttctac acacccagga ccaagcggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtcgcgaca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 49

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 49

atggccctgt ggatgagact cctgcccctg ctggctctgc tggccctctg gggacctgac 60

ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120

ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagaggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtctagaca gaagaggggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 50

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 50

atggccctgt ggatgagact cctgcccctg ctggccctgc tggccctctg gggacctgac 60

ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120

ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagagaga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggagcagaca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 51

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 51

atggccctgt ggatgagact cctgcccctg ctggctctgc tggccctctg gggacctgac 60

ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120

ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagaggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggagtagaca gaagaggggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 52

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 52

atggccctgt ggatgagact cctgcccctg ctggctctgc tggccctctg gggacctgac 60

ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120

ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagagaga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggtggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtctagaca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 53

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 53

atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60

ccagcggccg ctttcgtgaa ccagcacctc tgcggaagcg atctggtcga ggccttgtac 120

ctggtttgtg gggaaagagg ttttttctat accccgagga caaagcgcga ggcagaagac 180

cttcaagtgg gccaggtaga gctcggaggg ggccccggtg ccggatccct gcagcctctg 240

gctctcgaag ggtctcgaca aaaacgtggc atcgtggagc agtgctgtac ttcaatttgc 300

agtttgtacc agcttgagaa ttattgtaac tga 333

<210> 54

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 54

atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60

ccagcggccg cttttgtgaa ccagcacctc tgcggatctg atctggttga ggccttgtac 120

ctggtttgtg gggaaagagg ttttttctat accccaagga caaagcgcga ggcagaagac 180

cttcaagtgg gccaggtaga gctgggaggg ggcccgggtg caggatccct gcagcctctg 240

gctctagaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300

agtttgtacc agcttgagaa ttattgtaac tga 333

<210> 55

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 55

atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60

ccagcggccg cttttgtgaa ccagcacctc tgcggatctg atctggtgga ggccttgtac 120

ctggtttgtg gggaaagagg ttttttctat acccccagga caaagcgcga ggcagaagac 180

cttcaagtgg gccaggtaga gctgggaggg ggcccgggtg caggatccct gcagcctctg 240

gctctggaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300

agtttgtacc agcttgagaa ttattgtaac tga 333

<210> 56

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 56

atggccctgt ggatgagact cttgcccctt ctggctttac tggcactatg gggccctgac 60

ccagcagctg cttttgtgaa ccagcacctc tgtggatctg atctggttga ggccttgtac 120

ctggtttgtg gggaaagagg ttttttctat accccaagga caaagaggga ggcagaagac 180

cttcaagtgg gccaggtaga gctgggaggg ggccctggtg caggatccct gcagcctctg 240

gctctagaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300

agtttgtacc agcttgagaa ttattgtaac tga 333

<210> 57

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> ORF胰岛素

<400> 57

atggccctgt ggatgagact cttgcccctt ctggctttac tggcactatg gggccctgac 60

ccagcagctg cttttgtgaa ccagcacctc tgtggatctg atctggtgga ggccttgtac 120

ctggtttgtg gggaaagagg ttttttctat acccccagga caaagagaga ggcagaagac 180

cttcaagtgg gccaggtaga gctgggaggg ggcccaggtg caggatccct gcagcctctg 240

gctctggaag ggtctagaca aaaaagaggc atagtggagc agtgctgtac ttcaatttgc 300

agtttgtacc agcttgagaa ttattgtaac tga 333

<210> 58

<400> 58

000

<210> 59

<400> 59

000

<210> 60

<211> 295

<212> DNA

<213> 人工序列

<220>

<223> 3' UTR

<400> 60

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 295

<210> 61

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 61

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag gatgcagaag 120

gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac tgtggccacc atgatctcct gctactatga agaccatcag 660

tgtgaggtgg gcatgattgt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatacaga gtggggagcc 780

tttggggact ctggggagct ggatgagttc ctgctggagt atgacaggct ggtggatgag 840

agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtga ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gcctctgagc agctgaggac aaggggagcc tttgagacca ggtttgtgtc ccaggtggag 1020

agtgacacag gagacaggaa gcagatctac aacatcctga gcaccctggg gctgagaccc 1080

tccaccacag actgtgacat tgtgaggagg gcttgtgaga gtgtgtctac cagggctgcc 1140

cacatgtgct ctgctgggct ggctggggtc atcaacagga tgagggagag caggagtgag 1200

gatgtaatga ggatcactgt gggagtggat ggctctgtgt acaagctgca cccctcattc 1260

aaggagaggt tccatgccag tgtgaggagg ctgaccccca gctgtgagat cacctttatt 1320

gagtctgagg agggcagtgg caggggagca gccctggtct ctgctgtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 62

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 62

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

tctgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtggtgg ggcttctgag ggatgctatc aaaaggagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccaca atgatctcct gctactatga agaccatcag 660

tgtgaggtgg gcatgattgt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatacaga gtggggagcc 780

tttggggact ctggggagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840

agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtga gacttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gcctctgagc agctgagaac aagaggagcc tttgagacca gatttgtgtc ccaggtggag 1020

tctgacacag gagacaggaa gcagatctac aacatcctga gcaccctggg gctgaggccc 1080

tccaccacag actgtgacat tgtgagaaga gcctgtgagt ctgtgtctac cagggctgcc 1140

cacatgtgct ctgctgggct ggctggggtc atcaacagaa tgagggagag caggtctgag 1200

gatgtaatga gaatcactgt gggagtggat ggctctgtgt acaagctgca cccctcattc 1260

aaggagagat tccatgcctc tgtgagaagg ctgaccccca gctgtgagat cacctttatt 1320

gagtctgagg agggcagtgg cagaggagct gccctggtct ctgctgtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 63

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 63

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac tggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgttgtgg ggcttctgag ggatgctatc aaaaggagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac tgtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggtag gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatactga gtggggtgcc 780

tttggggact caggggagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840

agctctgcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtga gacttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gcctctgagc agctgagaac aagaggagcc tttgagacca gatttgtgtc ccaggtggag 1020

tctgacactg gtgacaggaa gcagatctac aacatcctga gcacactggg gctgaggccc 1080

tccaccacag actgtgacat tgtgagaaga gcttgtgaga gtgtgtctac cagggctgct 1140

cacatgtgca gtgctgggct ggctggggtc atcaacagaa tgagggagag caggtctgag 1200

gatgtaatga gaatcactgt gggtgtggat ggcagtgtgt acaagctgca cccctcattc 1260

aaggagagat tccatgccag tgtgagaagg ctgaccccca gctgtgagat caccttcatt 1320

gagtctgagg agggcagtgg caggggtgca gccctggtca gtgcagtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 64

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 64

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

tctgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac tggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacata 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac tgtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggtgg gcatgatagt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780

tttggggact ctggggagct ggatgagttc ctgctggagt atgacaggct ggtggatgag 840

agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggg 900

gagctggtga ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gcctctgagc agctgagaac aaggggagcc tttgagacca ggtttgtgtc ccaggtggag 1020

tctgacactg gggacaggaa gcagatctac aacatcctga gcaccctggg gctgaggccc 1080

tccaccactg actgtgacat agtgaggaga gcctgtgagt ctgtgtctac cagggctgcc 1140

cacatgtgct ctgctgggct ggcaggggtc atcaacagga tgagggagag cagatctgag 1200

gatgtaatga ggatcactgt gggtgtggat ggctctgtgt acaagctgca cccctcattc 1260

aaggagaggt tccatgcctc tgtgaggagg ctgaccccca gctgtgagat cacctttata 1320

gagtctgagg agggcagtgg cagaggggca gccctggtct ctgcagtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 65

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 65

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag gatgcagaag 120

gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccacc atgatctcct gctactatga agaccatcag 660

tgtgaggtgg gcatgatagt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780

tttggggact ctggggagct ggatgagttc ctgctggagt atgacaggct ggtggatgag 840

agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggg 900

gagctggtga ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gcctcagagc agctgagaac aaggggagcc tttgagacca ggtttgtgtc ccaggtggag 1020

agtgacacag gtgacaggaa gcagatctac aacatcctga gcaccctggg gctgagaccc 1080

tccaccacag actgtgacat tgtgaggagg gcctgtgaga gtgtgtctac cagggctgcc 1140

cacatgtgct ctgctgggct ggcaggagtc atcaacagga tgagggagag caggagtgag 1200

gatgtaatga ggatcactgt gggagtggat ggctctgtgt acaagctgca cccctcattc 1260

aaggagaggt tccatgccag tgtgagaagg ctgaccccca gctgtgagat cacctttata 1320

gagtctgagg agggcagtgg caggggagca gccctggtct ctgctgtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 66

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 66

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag gatgcagaag 120

gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac tgtggccaca atgatctcct gctactatga agaccatcag 660

tgtgaggtgg gcatgatagt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatacaga gtggggagcc 780

tttggggact ctggggagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840

agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtga ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gcctctgagc agctgaggac aagaggagcc tttgagacca gatttgtgtc acaggtggag 1020

tctgacactg gagacagaaa gcagatctac aacatcctga gcacactggg gctgaggccc 1080

tccaccactg actgtgacat agtgaggaga gcttgtgaga gtgtgtctac cagagctgcc 1140

cacatgtgct ctgctgggct ggctggggtc atcaacagga tgagagagag caggagtgag 1200

gatgtaatga gaatcactgt gggggtggat ggctctgtgt acaagctgca cccctcattc 1260

aaggagaggt tccatgcctc tgtgaggagg ctgaccccca gctgtgagat cacctttatt 1320

gagtctgagg agggcagtgg aaggggagca gccctggtct ctgcagtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 67

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 67

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag gatgcagaag 120

gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggtgg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780

tttggggact ctggggagct ggatgagttc ctgctggagt atgacaggct ggtggatgag 840

agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtga gacttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gcctcagagc agctgaggac aaggggagcc tttgagacca ggtttgtgtc ccaggtggag 1020

agtgacactg gagacaggaa gcagatctac aacatcctga gcaccctggg gctgaggccc 1080

tctaccacag actgtgacat agtgagaagg gcctgtgagt ctgtgtctac cagggctgcc 1140

cacatgtgct ctgctgggct ggctggagtc atcaacagaa tgagggagag cagaagtgag 1200

gatgtaatga ggatcactgt gggagtggat ggctctgtgt acaagctgca cccctcattc 1260

aaggagaggt tccatgccag tgtgaggagg ctgaccccca gctgtgagat cacctttatt 1320

gagtctgagg agggcagtgg caggggagct gccctggtct ctgctgtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 68

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 68

atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtgc gctccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggttg gcatgattgt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc cgcatgtgtg tcaatactga gtggggcgcc 780

tttggggact ctggagagct ggatgagttc ctgctggagt atgaccgcct ggtggatgag 840

agctcagcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtgc ggcttgtgct gctcaggttg gtggatgaaa acctgctctt ccatggggag 960

gccagtgagc agctgcgcac acgcggagcc tttgagacgc gctttgtgtc acaagtggag 1020

tctgacacag gagaccgcaa gcagatctac aacatcctga gcacactggg gctgcggccc 1080

tccaccactg actgtgacat tgtgcgccgc gcctgtgaga gtgtgtctac gcgcgctgcg 1140

cacatgtgct cagcggggct ggcgggagtc atcaaccgca tgcgcgagag ccgctctgag 1200

gatgtaatgc gcatcactgt gggagtggat ggcagtgtgt acaagctgca ccccagcttc 1260

aaggagcggt tccatgcctc agtgcgcagg ctgaccccca gctgtgagat cacctttatt 1320

gagtctgagg agggcagtgg cagaggcgcg gccctggtca gcgcggtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 69

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 69

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtgc gctccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtggtgg ggcttctgcg ggatgctatc aaaagaagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccacc atgatctcct gctactatga agaccatcag 660

tgtgaggtgg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc cgcatgtgtg tcaatacaga gtggggcgcc 780

tttggggaca gcggagagct ggatgagttc ctgctggagt atgaccgcct ggtggatgag 840

agctcagcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtgc ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gcctctgagc agctgcgcac acgcggagcc tttgagacgc gctttgtgag ccaggtggag 1020

agtgacacag gagaccgcaa gcagatctac aacatcctga gcaccctggg gctgcggccc 1080

agcaccactg actgtgacat tgtgcgccgc gcctgtgagt cagtgtctac gcgcgctgcg 1140

cacatgtgca gcgcggggct ggcgggagtc atcaaccgca tgcgcgagag ccgctctgag 1200

gatgtaatgc gcatcactgt gggagtggat ggcagtgtgt acaagctgca ccccagcttc 1260

aaggagcggt tccatgcctc agtgcgcagg ctgaccccca gctgtgagat cacctttatt 1320

gagtctgagg agggcagtgg cagaggcgcg gccctggtca gcgcggtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 70

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 70

atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtgc gctccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atcccggagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggtag gcatgatagt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc cgcatgtgtg tcaatactga gtggggcgcc 780

tttggggaca gtggagagct ggatgagttc ctgctggagt atgaccgcct ggtggatgag 840

agctctgcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtgc ggcttgtgct gctcaggcta gtggatgaaa acctgctctt ccatggggag 960

gcctcagagc agctgcgcac acgcggagcc tttgagacgc gctttgtgtc tcaagtggag 1020

agtgacacag gtgaccgcaa gcagatctac aacatcctga gcactctggg gctgcggccc 1080

tcaaccacag actgtgacat tgtgcgccgc gcctgtgagt ctgtgtctac gcgcgctgcg 1140

cacatgtgca gtgcggggct ggcgggagtc atcaaccgca tgcgcgagag ccgctcagag 1200

gatgtaatgc gcatcactgt gggtgtggat ggctctgtgt acaagctgca ccccagcttc 1260

aaggagcggt tccatgccag tgtgcgcagg ctgactccca gctgtgagat cacctttata 1320

gagtcagagg agggcagtgg cagaggcgcg gccctggtct ccgcggtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 71

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 71

atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtgc gctccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

tctgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac tggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac tgtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggttg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc cgcatgtgtg tcaatactga gtggggcgcc 780

tttggggact ctggtgagct ggatgagttc ctgctggagt atgaccgcct ggtggatgag 840

agctctgcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggt 900

gagctggtgc ggcttgtgct gctcaggtta gtggatgaaa acctgctctt ccatggggag 960

gcctctgagc agctgcgcac acgcggagcc tttgagacgc gctttgtgtc tcaagtggag 1020

tctgacactg gtgaccgcaa gcagatctac aacatcctga gcactctggg gctgagaccc 1080

tctaccactg actgtgacat tgtgcgccgc gcctgtgagt ctgtgtctac gcgcgctgcg 1140

cacatgtgct ctgcggggct ggcgggtgtc atcaaccgca tgcgcgagag ccgctctgag 1200

gatgtaatgc gcatcactgt gggtgtggat ggctctgtgt acaagctgca cccctcattc 1260

aaggagcggt tccatgcctc tgtgcgcagg ctgactccca gctgtgagat cacctttatt 1320

gagtctgagg agggcagtgg cagaggcgcg gccctggtct ctgcggtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 72

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 72

atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggaca gaggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga gatccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggttg gcatgattgt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780

tttggggact ctggagagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840

agctcagcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtga ggcttgtgct gctcaggttg gtggatgaaa acctgctctt ccatggggag 960

gccagtgagc agctgagaac aaggggagcc tttgagacaa gatttgtgtc acaggtggag 1020

tctgacacag gagacaggaa gcagatctac aacatcctga gcaccctggg gctgagaccc 1080

tccaccactg actgtgacat tgtgaggaga gcctgtgaga gtgtgtctac cagggctgct 1140

cacatgtgct cagcagggct ggctggagtc atcaacagaa tgagggagag cagatctgag 1200

gatgtaatga ggatcactgt gggtgtggat ggcagtgtgt acaagctgca ccccagcttc 1260

aaggagagat tccatgcctc agtgaggagg ctgaccccca gctgtgagat caccttcatt 1320

gagtctgagg agggcagtgg cagaggagca gccctggtct ctgctgtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 73

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 73

atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggaca gaggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga gatccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtggtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccacc atgatctcct gctactatga agaccatcag 660

tgtgaggtgg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatacaga gtggggagcc 780

tttggggact ctggagagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840

agctcagcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900

gagctggtga gacttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960

gccagtgagc agctgagaac aagaggagcc tttgagacca gatttgtgag ccaggtggag 1020

tcagacacag gagacagaaa gcagatctac aacatcctga gcaccctggg gctgagaccc 1080

agcaccactg actgtgacat tgtgagaaga gcctgtgagt ctgtgtctac cagagctgcc 1140

cacatgtgca gtgctgggct ggctggagtc atcaacagaa tgagagagag cagatcagag 1200

gatgtaatga gaatcactgt gggtgtggat ggctctgtgt acaagctgca ccccagcttc 1260

aaggagagat tccatgccag tgtgagaagg ctgaccccca gctgtgagat cacctttatt 1320

gagtcagagg agggcagtgg cagaggagca gccctggtct ctgctgtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 74

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 74

atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggaca gaggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga gatccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agtgtgaaga ccaaacacca gatgtactcc atcccagagg atgccatgac aggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggtag gcatgatagt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780

tttggggaca gtggagagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840

agctctgcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggt 900

gagctggtga ggcttgtgct gctcaggcta gtggatgaaa acctgctctt ccatggggag 960

gcctcagagc agctgagaac aaggggagcc tttgagacaa gatttgtgtc tcaggtggag 1020

agtgacactg gagacaggaa gcagatctac aacatcctga gcacactggg gctgagaccc 1080

tcaaccactg actgtgacat tgtgaggaga gcctgtgagt ctgtgtctac aagggctgca 1140

cacatgtgca gtgctgggct ggcaggtgtc atcaacagaa tgagggagag cagatcagag 1200

gatgtaatga ggatcactgt gggagtggat ggctctgtgt acaagctgca ccccagcttc 1260

aaggagagat tccatgccag tgtgaggagg ctgaccccca gctgtgagat cacctttata 1320

gagtcagagg agggcagtgg cagaggtgct gccctggtct ctgcagtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 75

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 75

atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120

gagatggaca gaggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctatgtga gatccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

tctgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac tggcactgct 360

gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac tgtggccact atgatctcct gctactatga agaccatcag 660

tgtgaggttg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatactga gtggggtgcc 780

tttggggact ctggtgagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840

agctctgcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggt 900

gagctggtga gacttgtgct gctcaggtta gtggatgaaa acctgctctt ccatggggag 960

gcctctgagc agctgagaac aagaggagcc tttgagacta gatttgtgtc tcaggtggag 1020

tctgacactg gtgacagaaa gcagatctac aacatcctga gcactctggg gctgagaccc 1080

tctaccactg actgtgacat tgtgagaaga gcctgtgagt ctgtgtctac tagagctgct 1140

cacatgtgct ctgctgggct ggctggtgtc atcaacagaa tgagagagag cagatctgag 1200

gatgtaatga gaatcactgt gggtgtggat ggctctgtgt acaagctgca cccctcattc 1260

aaggagagat tccatgcctc tgtgagaagg ctgactccca gctgtgagat caccttcatt 1320

gagtctgagg agggcagtgg cagaggtgct gccctggtct ctgctgtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 76

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 76

atggccatgg acgtgacccg gagccaggct caaacagcac tgactctcgt cgagcagatc 60

ttggcggaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120

gagatggacc gcggcttacg actggaaacg cacgaggagg cctccgtgaa aatgctaccc 180

acctacgtgc gttctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240

ggtggcacta acttccgggt catgctggtg aaggttggag aaggggagga aggccagtgg 300

tcggtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggcaccgcc 360

gagatgcttt ttgactacat atccgaatgc atctctgatt tcctcgacaa gcaccaaatg 420

aaacataaga aactgccgct gggatttact ttctcatttc ccgtgagaca cgaggatatt 480

gacaagggga tcctcttgaa ttggacgaaa ggcttcaagg caagtggcgc cgaaggaaac 540

aatgtagtgg ggcttctgag ggatgctatt aagcgccggg gtgactttga gatggacgtt 600

gtggcaatgg tcaacgatac agtggccaca atgatcagct gttattacga ggaccatcag 660

tgcgaagtcg gcatgatagt gggaactggg tgtaatgcgt gctatatgga ggaaatgcag 720

aacgttgagt tagtggaagg cgatgagggt agaatgtgtg taaataccga gtggggagct 780

ttcggggact ccggcgaact ggatgagttc ctactcgaat acgacaggct ggtggatgag 840

tctagcgcca accctggcca gcaattgtat gaaaaactga tcggagggaa gtacatgggt 900

gagcttgtcc gcctcgttct gctgcgatta gtggacgaga atctcctgtt tcacggcgaa 960

gcatccgagc agttgcgtac acggggagcc ttcgaaacca gatttgtctc acaagtggag 1020

agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctacgccca 1080

tctacgaccg attgcgacat tgtgcggcga gcttgtgagt ccgtttcgac tagagccgca 1140

cacatgtgct cagctggtct cgccggagta atcaatagga tgcgcgaaag ccggagtgag 1200

gacgtgatga gaataacagt cggcgtggat gggtctgtct ataagctgca tccctccttc 1260

aaggaaaggt ttcacgcgag cgtgcgccgt ctgacccctt catgtgagat tactttcatc 1320

gaatccgagg agggcagtgg acggggggca gccttggttt ctgctgtggc ctgcaaaaag 1380

gcatgcatgc ttggccaatg a 1401

<210> 77

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 77

atggccatgg atgtgaccag aagccaggct caaacagcac tgactctggt agagcagatc 60

ttggcggaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120

gagatggacc gcggcttaag gctggaaacc catgaggagg ccagtgtgaa aatgctaccc 180

acctatgtaa gatctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240

ggtggcacta acttcagggt catgctggtg aaggttggag aaggggagga aggccagtgg 300

tcagtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggtaccgct 360

gagatgcttt ttgactacat atctgaatgc atctctgatt tcctagacaa gcaccaaatg 420

aaacataaga aactgccgct gggatttact ttctcatttc ctgtgagaca tgaggatatt 480

gacaagggga tcctcttgaa ttggacaaaa ggcttcaagg caagtggcgc agaaggaaac 540

aatgtagtgg ggcttctgag ggatgctatt aagcgcagag gtgactttga gatggatgtt 600

gtggcaatgg tcaatgatac agtggccaca atgatcagct gttattatga ggaccatcag 660

tgtgaagtgg gcatgatagt gggaactggg tgtaatgcct gctatatgga ggaaatgcag 720

aatgttgagt tagtggaagg tgatgagggt agaatgtgtg taaatacaga gtggggagct 780

tttggggaca gcggagaact ggatgagttc ctattagaat atgacaggct ggtggatgag 840

tctagcgcca accctggcca gcaattgtat gaaaaactga ttggagggaa gtacatgggt 900

gagcttgtcc gccttgttct gctgcggtta gtggatgaga atctcctgtt tcatggggaa 960

gcaagtgagc agttgcggac aaggggagcc tttgaaacca gatttgtctc acaagtggag 1020

agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctaagacca 1080

tctaccactg attgtgacat tgtgcggcgg gcttgtgagt cagtttccac tagagccgca 1140

cacatgtgct cagctggttt ggctggagta atcaatagga tgcgcgaaag caggagtgag 1200

gatgtgatga gaataacagt tggtgtggat gggtctgtct ataagctgca tccctccttc 1260

aaggaaaggt ttcacgcgtc tgtgcgcaga ctgacccctt catgtgagat tactttcata 1320

gaatctgagg agggcagtgg aaggggggca gccttggttt ctgctgtggc ctgcaaaaag 1380

gcatgcatgc ttggccaatg a 1401

<210> 78

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 78

atggccatgg atgtgaccag aagccaggct caaacagcac tgactctggt ggagcagatc 60

ttggcggaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120

gagatggacc gcggcttaag gctggaaacc catgaggagg ccagtgtgaa aatgctaccc 180

acctatgtaa gatctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240

ggtggcacta acttcagggt catgctggtg aaggttggag aaggggagga aggccagtgg 300

tcagtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggtaccgct 360

gagatgcttt ttgactacat atctgaatgc atctctgatt tcctggacaa gcaccaaatg 420

aaacataaga aactgccgct gggatttact ttctcatttc ctgtgagaca tgaggatatt 480

gacaagggga tcctcttgaa ttggaccaaa ggcttcaagg caagtggcgc agaaggaaac 540

aatgtagtgg ggcttctgag ggatgctatt aagcgcagag gtgactttga gatggatgtt 600

gtggcaatgg tcaatgatac agtggccaca atgatcagct gttattatga ggaccatcag 660

tgtgaagtgg gcatgatagt gggaactggg tgtaatgcct gctatatgga ggaaatgcag 720

aatgttgagt tagtggaagg tgatgagggt agaatgtgtg taaatacaga gtggggagct 780

tttggggaca gcggagaact ggatgagttc ctactggaat atgacaggct ggtggatgag 840

tctagcgcca accctggcca gcaattgtat gaaaaactga ttggagggaa gtacatgggt 900

gagcttgtcc gcctggttct gctgcggtta gtggatgaga atctcctgtt tcatggggaa 960

gcaagtgagc agttgcggac aaggggagcc tttgaaacca gatttgtctc acaagtggag 1020

agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctaagacca 1080

tctaccacag attgtgacat tgtgcggcgg gcttgtgagt cagttagcac tagagccgca 1140

cacatgtgct cagctggtct ggctggagta atcaatagga tgcgcgaaag caggagtgag 1200

gatgtgatga gaataacagt gggtgtggat gggtctgtct ataagctgca tccctccttc 1260

aaggaaaggt ttcacgcgtc tgtgcgcaga ctgacccctt catgtgagat tactttcata 1320

gaatctgagg agggcagtgg aaggggggca gccttggttt ctgctgtggc ctgcaaaaag 1380

gcatgcatgc ttggccaatg a 1401

<210> 79

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 79

atggccatgg atgtgaccag aagccaggct caaacagcac tgactctggt agagcagatc 60

ttggctgaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120

gagatggaca ggggcttaag actggaaacc catgaggagg ccagtgtgaa aatgctaccc 180

acctatgtaa ggtctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240

ggtggcacta acttcagagt catgctggtg aaggttggag aaggggagga aggccagtgg 300

tcagtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggcacagca 360

gagatgcttt ttgactacat atctgaatgc atctctgatt tcctagacaa gcaccaaatg 420

aaacataaga aactgccact gggatttact ttctcatttc ctgtgagaca tgaggatatt 480

gacaagggga tcctcttgaa ttggaccaaa ggcttcaagg caagtggtgc tgaaggaaac 540

aatgtagtgg ggcttctgag ggatgctatt aagaggagag gtgactttga gatggatgtt 600

gtggcaatgg tcaatgatac agtggccaca atgatcagct gttattatga ggaccatcag 660

tgtgaagtgg gcatgatagt gggaactggg tgtaatgcct gctatatgga ggaaatgcag 720

aatgttgagt tagtggaagg agatgagggt agaatgtgtg taaatacaga gtggggagct 780

tttggggaca gtggggaact ggatgagttc ctattagaat atgacaggct ggtggatgag 840

tcttcagcca accctggcca gcaattgtat gaaaaactga ttggagggaa gtacatgggt 900

gagcttgtca ggcttgttct gctgagatta gtggatgaga atctcctgtt tcatggtgaa 960

gcatctgagc agttgaggac aagaggagcc tttgaaacca gatttgtctc acaagtggag 1020

agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctaaggcca 1080

tctaccactg attgtgacat tgtgagaagg gcttgtgaga gtgtttccac tagagcagca 1140

cacatgtgct cagctggttt ggctggagta atcaatagga tgagagaaag caggagtgag 1200

gatgtgatga gaataacagt tggagtggat gggtctgtct ataagctgca tccctccttc 1260

aaggaaaggt ttcatgcctc tgtgagaagg ctgacccctt catgtgagat tactttcata 1320

gaatcagagg agggcagtgg aagaggggca gccttggttt ctgctgtggc ctgcaaaaag 1380

gcatgcatgc ttggccaatg a 1401

<210> 80

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> ORF Gck

<400> 80

atggccatgg atgtgaccag aagccaggct caaacagcac tgactctggt ggagcagatc 60

ttggctgaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120

gagatggaca gaggcttaag actggaaacc catgaggagg ccagtgtgaa aatgctaccc 180

acctatgtaa gatctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240

ggtggcacta acttcagagt catgctggtg aaggttggag aaggggagga aggccagtgg 300

tcagtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggcacagca 360

gagatgcttt ttgactacat atctgaatgc atctctgatt tcctggacaa gcaccaaatg 420

aaacataaga aactgcccct gggatttact ttctcatttc ctgtgagaca tgaggatatt 480

gacaagggga tcctcttgaa ttggaccaaa ggcttcaagg caagtggtgc tgaaggaaac 540

aatgtagtgg ggcttctgag ggatgctatt aagagaagag gtgactttga gatggatgtt 600

gtggcaatgg tcaatgatac agtggccaca atgatcagct gttattatga ggaccatcag 660

tgtgaagtgg gcatgatagt gggaactggg tgtaatgcct gctatatgga ggaaatgcag 720

aatgttgagt tagtggaagg agatgagggt agaatgtgtg taaatacaga gtggggagct 780

tttggggaca gtggggaact ggatgagttc ctactggaat atgacaggct ggtggatgag 840

tcttcagcca accctggcca gcaattgtat gaaaaactga ttggagggaa gtacatgggt 900

gagcttgtca gactggttct gctgagatta gtggatgaga atctcctgtt tcatggtgaa 960

gcatctgagc agttgagaac aagaggagcc tttgaaacca gatttgtctc acaagtggag 1020

agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctaagacca 1080

tctaccactg attgtgacat tgtgagaaga gcttgtgaga gtgttagcac tagagcagca 1140

cacatgtgct cagctggtct ggctggagta atcaatagga tgagagaaag cagaagtgag 1200

gatgtgatga gaataacagt gggagtggat gggtctgtct ataagctgca tccctccttc 1260

aaggaaaggt ttcatgcctc tgtgagaaga ctgacccctt catgtgagat tactttcata 1320

gaatcagagg agggcagtgg aagaggggca gccttggttt ctgctgtggc ctgcaaaaag 1380

gcatgcatgc ttggccaatg a 1401

<210> 81

<400> 81

000

<210> 82

<211> 465

<212> PRT

<213> 人工序列

<220>

<223> 野生型gck

<400> 82

Met Leu Asp Asp Arg Ala Arg Met Glu Ala Ala Lys Lys Glu Lys Val

1 5 10 15

Glu Gln Ile Leu Ala Glu Phe Gln Leu Gln Glu Glu Asp Leu Lys Lys

20 25 30

Val Met Arg Arg Met Gln Lys Glu Met Asp Arg Gly Leu Arg Leu Glu

35 40 45

Thr His Glu Glu Ala Ser Val Lys Met Leu Pro Thr Tyr Val Arg Ser

50 55 60

Thr Pro Glu Gly Ser Glu Val Gly Asp Phe Leu Ser Leu Asp Leu Gly

65 70 75 80

Gly Thr Asn Phe Arg Val Met Leu Val Lys Val Gly Glu Gly Glu Glu

85 90 95

Gly Gln Trp Ser Val Lys Thr Lys His Gln Met Tyr Ser Ile Pro Glu

100 105 110

Asp Ala Met Thr Gly Thr Ala Glu Met Leu Phe Asp Tyr Ile Ser Glu

115 120 125

Cys Ile Ser Asp Phe Leu Asp Lys His Gln Met Lys His Lys Lys Leu

130 135 140

Pro Leu Gly Phe Thr Phe Ser Phe Pro Val Arg His Glu Asp Ile Asp

145 150 155 160

Lys Gly Ile Leu Leu Asn Trp Thr Lys Gly Phe Lys Ala Ser Gly Ala

165 170 175

Glu Gly Asn Asn Val Val Gly Leu Leu Arg Asp Ala Ile Lys Arg Arg

180 185 190

Gly Asp Phe Glu Met Asp Val Val Ala Met Val Asn Asp Thr Val Ala

195 200 205

Thr Met Ile Ser Cys Tyr Tyr Glu Asp His Gln Cys Glu Val Gly Met

210 215 220

Ile Val Gly Thr Gly Cys Asn Ala Cys Tyr Met Glu Glu Met Gln Asn

225 230 235 240

Val Glu Leu Val Glu Gly Asp Glu Gly Arg Met Cys Val Asn Thr Glu

245 250 255

Trp Gly Ala Phe Gly Asp Ser Gly Glu Leu Asp Glu Phe Leu Leu Glu

260 265 270

Tyr Asp Arg Leu Val Asp Glu Ser Ser Ala Asn Pro Gly Gln Gln Leu

275 280 285

Tyr Glu Lys Leu Ile Gly Gly Lys Tyr Met Gly Glu Leu Val Arg Leu

290 295 300

Val Leu Leu Arg Leu Val Asp Glu Asn Leu Leu Phe His Gly Glu Ala

305 310 315 320

Ser Glu Gln Leu Arg Thr Arg Gly Ala Phe Glu Thr Arg Phe Val Ser

325 330 335

Gln Val Glu Ser Asp Thr Gly Asp Arg Lys Gln Ile Tyr Asn Ile Leu

340 345 350

Ser Thr Leu Gly Leu Arg Pro Ser Thr Thr Asp Cys Asp Ile Val Arg

355 360 365

Arg Ala Cys Glu Ser Val Ser Thr Arg Ala Ala His Met Cys Ser Ala

370 375 380

Gly Leu Ala Gly Val Ile Asn Arg Met Arg Glu Ser Arg Ser Glu Asp

385 390 395 400

Val Met Arg Ile Thr Val Gly Val Asp Gly Ser Val Tyr Lys Leu His

405 410 415

Pro Ser Phe Lys Glu Arg Phe His Ala Ser Val Arg Arg Leu Thr Pro

420 425 430

Ser Cys Glu Ile Thr Phe Ile Glu Ser Glu Glu Gly Ser Gly Arg Gly

435 440 445

Ala Ala Leu Val Ser Ala Val Ala Cys Lys Lys Ala Cys Met Leu Gly

450 455 460

Gln

465

<210> 83

<211> 325

<212> DNA

<213> 人工序列

<220>

<223> 5' UTR

<400> 83

aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60

aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccacc 325

<210> 84

<211> 951

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 17

<400> 84

aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60

aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360

actgctggcc ctctggggac ctgacccagc agcagccttt gtgaaccaac acctgtgtgg 420

ctcagatctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480

caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtcc agacagaaga gaggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaataaggga ctagagcagg gatccaagct t 951

<210> 85

<211> 951

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns18

<400> 85

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360

actgctggcc ctctggggac ctgacccagc agcagccttt gtgaaccaac acctgtgtgg 420

ctcagatctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480

caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtcc agacagaaga gaggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaataaggga ctagagcagg aattcaagct t 951

<210> 86

<211> 951

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 19

<400> 86

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactgctcc ccctcctggc 360

tttgctggcc ctgtggggac cagatcctgc agctgccttt gtgaatcagc acctgtgtgg 420

ctcagatctg gttgaggcac tctacctggt gtgtggggag agaggcttct tttacacacc 480

aaggaccaag agggaggcag aggatctgca ggtaggtcag gtggagctgg gaggtggccc 540

tggagcagga tccctgcagc ccttggcact ggagggctcc agacagaaga ggggcattgt 600

ggaacagtgt tgcactagca tctgcagcct gtaccagctg gagaactact gcaactaaag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaataaggga ctagagcagc atatgaagct t 951

<210> 87

<211> 951

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 20

<400> 87

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360

gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420

ctcagatctg gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc 480

caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaataaggga ctagagcagg atatcaagct t 951

<210> 88

<211> 951

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hIns - 21

<400> 88

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360

tctgctggcc ctctggggac ctgacccagc tgcagccttt gtgaaccaac acctgtgtgg 420

ctcagatctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480

caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtct agacagaaga ggggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaataaggga ctagagcaga ctagtaagct t 951

<210> 89

<211> 2019

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 22

<400> 89

aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60

aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360

agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420

gaaggtgatg agaaggatgc agaaggagat ggacaggggc ctgaggctgg agacccatga 480

agaggccagt gtgaagatgc tgcccaccta tgtgaggtcc accccagaag gctcagaagt 540

gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600

gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660

tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720

tgacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780

atttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840

caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900

gagaggggac tttgaaatgg atgtggtggc aatggtgaat gacactgtgg ccaccatgat 960

ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca caggctgcaa 1020

tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080

gtgtgtcaat acagagtggg gagcctttgg ggactctggg gagctggatg agttcctgct 1140

ggagtatgac aggctggtgg atgagagctc agcaaaccct ggtcagcagc tgtatgagaa 1200

gctcataggt ggcaagtaca tgggagagct ggtgaggctt gtgctgctca ggctggtgga 1260

tgaaaacctg ctcttccatg gggaggcctc tgagcagctg aggacaaggg gagcctttga 1320

gaccaggttt gtgtcccagg tggagagtga cacaggagac aggaagcaga tctacaacat 1380

cctgagcacc ctggggctga gaccctccac cacagactgt gacattgtga ggagggcttg 1440

tgagagtgtg tctaccaggg ctgcccacat gtgctctgct gggctggctg gggtcatcaa 1500

caggatgagg gagagcagga gtgaggatgt aatgaggatc actgtgggag tggatggctc 1560

tgtgtacaag ctgcacccct cattcaagga gaggttccat gccagtgtga ggaggctgac 1620

ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcaggg gagcagccct 1680

ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740

cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980

atgtggtaaa ataagggact agagcagtct agaaagctt 2019

<210> 90

<211> 2019

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 23

<400> 90

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360

agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420

gaaggtgatg agaaggatgc agaaggagat ggacaggggc ctgaggctgg agacccatga 480

agaggccagt gtgaagatgc tgcccaccta tgtgaggtcc accccagaag gctcagaagt 540

gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600

gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660

tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720

tgacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780

atttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840

caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900

gagaggggac tttgaaatgg atgtggtggc aatggtgaat gacactgtgg ccaccatgat 960

ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca caggctgcaa 1020

tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080

gtgtgtcaat acagagtggg gagcctttgg ggactctggg gagctggatg agttcctgct 1140

ggagtatgac aggctggtgg atgagagctc agcaaaccct ggtcagcagc tgtatgagaa 1200

gctcataggt ggcaagtaca tgggagagct ggtgaggctt gtgctgctca ggctggtgga 1260

tgaaaacctg ctcttccatg gggaggcctc tgagcagctg aggacaaggg gagcctttga 1320

gaccaggttt gtgtcccagg tggagagtga cacaggagac aggaagcaga tctacaacat 1380

cctgagcacc ctggggctga gaccctccac cacagactgt gacattgtga ggagggcttg 1440

tgagagtgtg tctaccaggg ctgcccacat gtgctctgct gggctggctg gggtcatcaa 1500

caggatgagg gagagcagga gtgaggatgt aatgaggatc actgtgggag tggatggctc 1560

tgtgtacaag ctgcacccct cattcaagga gaggttccat gccagtgtga ggaggctgac 1620

ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcaggg gagcagccct 1680

ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740

cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980

atgtggtaaa ataagggact agagcaggct agcaagctt 2019

<210> 91

<211> 2019

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 24

<400> 91

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360

agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420

gaaggtgatg agaaggatgc agaaggagat ggacaggggc ctgaggctgg agacccatga 480

agaggccagt gtgaagatgc tgcccaccta tgtgaggtcc accccagaag gctcagaagt 540

gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600

gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660

tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720

tgacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780

atttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840

caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900

gagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccaccatgat 960

ctcctgctac tatgaagacc atcagtgtga ggtgggcatg atagtgggca caggctgcaa 1020

tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080

gtgtgtcaat actgagtggg gagcctttgg ggactctggg gagctggatg agttcctgct 1140

ggagtatgac aggctggtgg atgagagctc agcaaaccct ggtcagcagc tgtatgagaa 1200

gctcataggt ggcaagtaca tgggggagct ggtgaggctt gtgctgctca ggctggtgga 1260

tgaaaacctg ctcttccatg gggaggcctc agagcagctg agaacaaggg gagcctttga 1320

gaccaggttt gtgtcccagg tggagagtga cacaggtgac aggaagcaga tctacaacat 1380

cctgagcacc ctggggctga gaccctccac cacagactgt gacattgtga ggagggcctg 1440

tgagagtgtg tctaccaggg ctgcccacat gtgctctgct gggctggcag gagtcatcaa 1500

caggatgagg gagagcagga gtgaggatgt aatgaggatc actgtgggag tggatggctc 1560

tgtgtacaag ctgcacccct cattcaagga gaggttccat gccagtgtga gaaggctgac 1620

ccccagctgt gagatcacct ttatagagtc tgaggagggc agtggcaggg gagcagccct 1680

ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740

cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980

atgtggtaaa ataagggact agagcagatt aataagctt 2019

<210> 92

<211> 2019

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 25

<400> 92

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360

agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420

gaaggtgatg agaaggatgc agaaggagat ggacaggggc ctgaggctgg agacccatga 480

agaggccagt gtgaagatgc tgcccaccta tgtgaggtcc accccagaag gctcagaagt 540

gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600

gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660

tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720

tgacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780

atttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840

caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900

gagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccactatgat 960

ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca ctggctgcaa 1020

tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080

gtgtgtcaat actgagtggg gagcctttgg ggactctggg gagctggatg agttcctgct 1140

ggagtatgac aggctggtgg atgagagctc agcaaaccct ggtcagcagc tgtatgagaa 1200

gctcataggt ggcaagtaca tgggagagct ggtgagactt gtgctgctca ggctggtgga 1260

tgaaaacctg ctcttccatg gggaggcctc agagcagctg aggacaaggg gagcctttga 1320

gaccaggttt gtgtcccagg tggagagtga cactggagac aggaagcaga tctacaacat 1380

cctgagcacc ctggggctga ggccctctac cacagactgt gacatagtga gaagggcctg 1440

tgagtctgtg tctaccaggg ctgcccacat gtgctctgct gggctggctg gagtcatcaa 1500

cagaatgagg gagagcagaa gtgaggatgt aatgaggatc actgtgggag tggatggctc 1560

tgtgtacaag ctgcacccct cattcaagga gaggttccat gccagtgtga ggaggctgac 1620

ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcaggg gagctgccct 1680

ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740

cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980

atgtggtaaa ataagggact agagcagatg cataagctt 2019

<210> 93

<211> 2019

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 26

<400> 93

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc tatggatgtc acaaggagcc aggcccagac 360

agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420

gaaggtgatg agaagaatgc agaaggagat ggaccgcggc ctgaggctgg agacccatga 480

agaggccagt gtgaagatgc tgcccaccta tgtgcgctcc accccagaag gctcagaagt 540

tggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600

gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660

tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720

agacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780

ctttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840

caaggcctca ggagcagaag ggaacaatgt tgtggggctt ctgagagatg ctatcaaaag 900

aagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccactatgat 960

ctcctgctac tatgaagacc atcagtgtga ggttggcatg attgtgggca caggctgcaa 1020

tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggccgcat 1080

gtgtgtcaat actgagtggg gcgcctttgg ggactctgga gagctggatg agttcctgct 1140

ggagtatgac cgcctggtgg atgagagctc agcaaaccca ggtcagcagc tgtatgagaa 1200

gctcataggt ggcaagtaca tgggagagct ggtgcggctt gtgctgctca ggttggtgga 1260

tgaaaacctg ctcttccatg gggaggccag tgagcagctg cgcacacgcg gagcctttga 1320

gacgcgcttt gtgtcacaag tggagtctga cacaggagac cgcaagcaga tctacaacat 1380

cctgagcaca ctggggctgc ggccctccac cactgactgt gacattgtgc gccgcgcctg 1440

tgagagtgtg tctacgcgcg ctgcgcacat gtgctcagcg gggctggcgg gagtcatcaa 1500

ccgcatgcgc gagagccgct ctgaggatgt aatgcgcatc actgtgggag tggatggcag 1560

tgtgtacaag ctgcacccca gcttcaagga gcggttccat gcctcagtgc gcaggctgac 1620

ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcagag gcgcggccct 1680

ggtcagcgcg gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740

cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980

atgtggtaaa ataagggact agagcagagt actaagctt 2019

<210> 94

<211> 2019

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 27

<400> 94

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360

agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420

gaaggtgatg agaagaatgc agaaggagat ggaccgcggc ctgaggctgg agacccatga 480

agaggccagt gtgaagatgc tgcccaccta tgtgcgctcc accccagaag gctcagaagt 540

gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600

gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660

tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720

agacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780

ctttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840

caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgcgggatg ctatcaaaag 900

aagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccaccatgat 960

ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca ctggctgcaa 1020

tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggccgcat 1080

gtgtgtcaat acagagtggg gcgcctttgg ggacagcgga gagctggatg agttcctgct 1140

ggagtatgac cgcctggtgg atgagagctc agcaaaccca ggtcagcagc tgtatgagaa 1200

gctcataggt ggcaagtaca tgggagagct ggtgcggctt gtgctgctca ggctggtgga 1260

tgaaaacctg ctcttccatg gggaggcctc tgagcagctg cgcacacgcg gagcctttga 1320

gacgcgcttt gtgagccagg tggagagtga cacaggagac cgcaagcaga tctacaacat 1380

cctgagcacc ctggggctgc ggcccagcac cactgactgt gacattgtgc gccgcgcctg 1440

tgagtcagtg tctacgcgcg ctgcgcacat gtgcagcgcg gggctggcgg gagtcatcaa 1500

ccgcatgcgc gagagccgct ctgaggatgt aatgcgcatc actgtgggag tggatggcag 1560

tgtgtacaag ctgcacccca gcttcaagga gcggttccat gcctcagtgc gcaggctgac 1620

ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcagag gcgcggccct 1680

ggtcagcgcg gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740

cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980

atgtggtaaa ataagggact agagcagggt accaagctt 2019

<210> 95

<211> 2019

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 28

<400> 95

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc tatggatgtc acaaggagcc aggcccagac 360

agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420

gaaggtgatg agaagaatgc agaaggagat ggacagaggc ctgaggctgg agacccatga 480

agaggccagt gtgaagatgc tgcccaccta tgtgagatcc accccagaag gctcagaagt 540

tggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600

gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660

tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720

agacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780

ctttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840

caaggcctca ggagcagaag ggaacaatgt tgtggggctt ctgagagatg ctatcaaaag 900

aagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccactatgat 960

ctcctgctac tatgaagacc atcagtgtga ggttggcatg attgtgggca caggctgcaa 1020

tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080

gtgtgtcaat actgagtggg gagcctttgg ggactctgga gagctggatg agttcctgct 1140

ggagtatgac agactggtgg atgagagctc agcaaaccca ggtcagcagc tgtatgagaa 1200

gctcataggt ggcaagtaca tgggagagct ggtgaggctt gtgctgctca ggttggtgga 1260

tgaaaacctg ctcttccatg gggaggccag tgagcagctg agaacaaggg gagcctttga 1320

gacaagattt gtgtcacagg tggagtctga cacaggagac aggaagcaga tctacaacat 1380

cctgagcacc ctggggctga gaccctccac cactgactgt gacattgtga ggagagcctg 1440

tgagagtgtg tctaccaggg ctgctcacat gtgctcagca gggctggctg gagtcatcaa 1500

cagaatgagg gagagcagat ctgaggatgt aatgaggatc actgtgggtg tggatggcag 1560

tgtgtacaag ctgcacccca gcttcaagga gagattccat gcctcagtga ggaggctgac 1620

ccccagctgt gagatcacct tcattgagtc tgaggagggc agtggcagag gagcagccct 1680

ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740

cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980

atgtggtaaa ataagggact agagcagaat attaagctt 2019

<210> 96

<211> 2019

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的hGck - 29

<400> 96

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360

agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420

gaaggtgatg agaagaatgc agaaggagat ggacagaggc ctgaggctgg agacccatga 480

agaggccagt gtgaagatgc tgcccaccta tgtgagatcc accccagaag gctcagaagt 540

gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600

gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660

tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720

agacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780

ctttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840

caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900

aagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccaccatgat 960

ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca ctggctgcaa 1020

tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcagaat 1080

gtgtgtcaat acagagtggg gagcctttgg ggactctgga gagctggatg agttcctgct 1140

ggagtatgac agactggtgg atgagagctc agcaaaccca ggtcagcagc tgtatgagaa 1200

gctcataggt ggcaagtaca tgggagagct ggtgagactt gtgctgctca ggctggtgga 1260

tgaaaacctg ctcttccatg gggaggccag tgagcagctg agaacaagag gagcctttga 1320

gaccagattt gtgagccagg tggagtcaga cacaggagac agaaagcaga tctacaacat 1380

cctgagcacc ctggggctga gacccagcac cactgactgt gacattgtga gaagagcctg 1440

tgagtctgtg tctaccagag ctgcccacat gtgcagtgct gggctggctg gagtcatcaa 1500

cagaatgaga gagagcagat cagaggatgt aatgagaatc actgtgggtg tggatggctc 1560

tgtgtacaag ctgcacccca gcttcaagga gagattccat gccagtgtga gaaggctgac 1620

ccccagctgt gagatcacct ttattgagtc agaggagggc agtggcagag gagcagccct 1680

ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740

cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980

atgtggtaaa ataagggact agagcagtta attaagctt 2019

<210> 97

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hIns 3' UTR

<400> 97

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gggatccaag ctt 293

<210> 98

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hIns 3' UTR

<400> 98

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca ggaattcaag ctt 293

<210> 99

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hIns 3' UTR

<400> 99

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gcatatgaag ctt 293

<210> 100

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hIns 3' UTR

<400> 100

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca ggatatcaag ctt 293

<210> 101

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hIns 3' UTR

<400> 101

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gactagtaag ctt 293

<210> 102

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hGck 3' UTR

<400> 102

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gtctagaaag ctt 293

<210> 103

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hGck 3' UTR

<400> 103

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca ggctagcaag ctt 293

<210> 104

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hGck 3' UTR

<400> 104

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gattaataag ctt 293

<210> 105

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hGck 3' UTR

<400> 105

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gatgcataag ctt 293

<210> 106

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hGck 3' UTR

<400> 106

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gagtactaag ctt 293

<210> 107

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hGck 3' UTR

<400> 107

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gggtaccaag ctt 293

<210> 108

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hGck 3' UTR

<400> 108

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gaatattaag ctt 293

<210> 109

<211> 293

<212> DNA

<213> 人工序列

<220>

<223> hGck 3' UTR

<400> 109

agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180

aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240

taaaacctct acaaatgtgg taaaataagg gactagagca gttaattaag ctt 293

<210> 110

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10D) ORF - 22

<400> 110

atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60

ccagccgcag cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac 120

ctagtgtgcg gggaacgagg cttcttctac acacccagga ccaagcggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtcgcgaca gaagcgtggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 111

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H) ORF - 2

<400> 111

atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60

ccagccgcag cctttgtgaa ccaacacctg tgcggctcac acctggtgga agctctctac 120

ctagtgtgcg gggaacgagg cttcttctac acacccagga ccaagcggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtcgcgaca gaagcgtggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 112

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H) ORF - 27

<400> 112

atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60

ccagccgcag cctttgtgaa ccaacacctg tgcggctcac acctggtgga agctctctac 120

ctagtgtgcg gggaaagagg cttcttctac acacccagga ccaagcggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtcgcgaca gaagcggggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 113

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H) ORF -28

<400> 113

atggccctgt ggatgagact cctgcccctg ctggctctgc tggccctctg gggacctgac 60

ccagctgcag cctttgtgaa ccaacacctg tgtggctcac acctggtgga agctctctac 120

ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagaggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtctagaca gaagaggggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 114

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H) ORF

<400> 114

atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60

ccagcggccg ctttcgtgaa ccagcacctc tgcggaagcc acctggtcga ggccttgtac 120

ctggtttgtg gggaaagagg ttttttctat accccgagga caaagcgcga ggcagaagac 180

cttcaagtgg gccaggtaga gctcggaggg ggccccggtg ccggatccct gcagcctctg 240

gctctcgaag ggtctcgaca aaaacgtggc atcgtggagc agtgctgtac ttcaatttgc 300

agtttgtacc agcttgagaa ttattgtaac tga 333

<210> 115

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H) ORF

<400> 115

atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60

ccagcggccg cttttgtgaa ccagcacctc tgcggatctc acctggttga ggccttgtac 120

ctggtttgtg gggaaagagg ttttttctat accccaagga caaagcgcga ggcagaagac 180

cttcaagtgg gccaggtaga gctgggaggg ggcccgggtg caggatccct gcagcctctg 240

gctctagaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300

agtttgtacc agcttgagaa ttattgtaac tga 333

<210> 116

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H) ORF

<400> 116

atggccctgt ggatgagact cttgcccctt ctggctttac tggcactatg gggccctgac 60

ccagcagctg cttttgtgaa ccagcacctc tgtggatctc acctggttga ggccttgtac 120

ctggtttgtg gggaaagagg ttttttctat accccaagga caaagaggga ggcagaagac 180

cttcaagtgg gccaggtaga gctgggaggg ggccctggtg caggatccct gcagcctctg 240

gctctagaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300

agtttgtacc agcttgagaa ttattgtaac tga 333

<210> 117

<211> 348

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10D[IL-6]) ORF - 32

<400> 117

atgaacagct tcagcacaag cgccttcggc cccgtggctt tctctctggg actgctgctg 60

gtgctgcctg ccgctttccc tgcccctttt gtgaaccaac acctgtgcgg ctcagatctg 120

gtggaagctc tctacctagt gtgcggggaa cgaggcttct tctacacacc caggaccaag 180

cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc tggtgcaggc 240

agcctgcagc ccttggccct ggaggggtcg cgacagaagc gtggcattgt ggaacaatgc 300

tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348

<210> 118

<211> 348

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10D[IL-6]) ORF - 33

<400> 118

atgaacagct tcagcacaag cgcctttggc ccagtggctt tctctctggg actgctgctg 60

gtgctgcctg ccgctttccc tgcccctttt gtgaaccaac acctgtgcgg ctcagatctg 120

gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc caggaccaag 180

cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc tggtgcaggc 240

agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt ggaacaatgc 300

tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348

<210> 119

<211> 348

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10D[IL-6]) ORF - 34

<400> 119

atgaacagct tcagcacaag tgcctttggc ccagtggctt tctctctggg actgctgctg 60

gtgctgcctg cagctttccc tgcccctttt gtgaaccaac acctgtgtgg ctcagatctg 120

gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc caggaccaag 180

agagaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc tggtgcaggc 240

agcctgcagc ccttggccct ggaggggtcc aggcagaaga gaggcattgt ggaacaatgc 300

tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348

<210> 120

<211> 348

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H[IL-6]) ORF -35

<400> 120

atgaacagct tcagcacaag cgccttcggc cccgtggctt tctctctggg actgctgctg 60

gtgctgcctg ccgctttccc tgcccctttt gtgaaccaac acctgtgcgg ctcacacctg 120

gtggaagctc tctacctagt gtgcggggaa cgaggcttct tctacacacc caggaccaag 180

cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc tggtgcaggc 240

agcctgcagc ccttggccct ggaggggtcg cgacagaagc gtggcattgt ggaacaatgc 300

tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348

<210> 121

<211> 348

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H[IL-6]) ORF - 36

<400> 121

atgaacagct tcagcacaag cgcctttggc ccagtggctt tctctctggg actgctgctg 60

gtgctgcctg ccgctttccc tgcccctttt gtgaaccaac acctgtgcgg ctcacacctg 120

gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc caggaccaag 180

cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc tggtgcaggc 240

agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt ggaacaatgc 300

tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348

<210> 122

<211> 348

<212> DNA

<213> 人工序列

<220>

<223> hIns (B10H[IL-6]) ORF - 37

<400> 122

atgaacagct tcagcacaag tgcctttggc ccagtggctt tctctctggg actgctgctg 60

gtgctgcctg cagctttccc tgcccctttt gtgaaccaac acctgtgtgg ctcacacctg 120

gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc caggaccaag 180

agagaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc tggtgcaggc 240

agcctgcagc ccttggccct ggaggggtcc aggcagaaga gaggcattgt ggaacaatgc 300

tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348

<210> 123

<211> 953

<212> DNA

<213> 人工序列

<220>

<223> Ins B10D: 4 mutations - 22

<400> 123

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360

gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420

ctcagatctg gtggaagctc tctacctagt gtgcggggaa cgaggcttct tctacacacc 480

caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc gtggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953

<210> 124

<211> 1870

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Dx2: B10D->IRES->RE - 23

<400> 124

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatggcc ctgtggatgc gcctcctgcc cctgctggcg 360

ctgctggccc tctggggacc tgacccagcc gcagcctttg tgaaccaaca cctgtgcggc 420

tcagatctgg tggaagctct ctacctagtg tgcggggaac gaggcttctt ctacacaccc 480

aggaccaagc gggaggcaga ggacctgcag gtggggcagg tggagctggg cgggggccct 540

ggtgcaggca gcctgcagcc cttggccctg gaggggtcgc gacagaagcg tggcattgtg 600

gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660

cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720

cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780

aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840

tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900

caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960

gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020

ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080

ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140

catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200

acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgcgg 1260

ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcggc cgctttcgtg 1320

aaccagcacc tctgcggaag cgatctggtc gaggccttgt acctggtttg tggggaaaga 1380

ggttttttct ataccccgag gacaaagcgc gaggcagaag accttcaagt gggccaggta 1440

gagctcggag ggggccccgg tgccggatcc ctgcagcctc tggctctcga agggtctcga 1500

caaaaacgtg gcatcgtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560

aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620

atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680

tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740

caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800

gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860

gaagcttttg 1870

<210> 125

<211> 1870

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Dx2: 111->IRES->RE-111 - 24

<400> 125

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatggcc ctgtggatgc gcctcctgcc cctgctggcg 360

ctgctggccc tctggggacc tgacccagcc gcagcctttg tgaaccaaca cctgtgcggc 420

tcagatctgg tggaagctct ctacctagtg tgcggggaaa gaggcttctt ctacacaccc 480

aggaccaagc gggaggcaga ggacctgcag gtggggcagg tggagctggg cgggggccct 540

ggtgcaggca gcctgcagcc cttggccctg gaggggtcgc gacagaagcg gggcattgtg 600

gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660

cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720

cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780

aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840

tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900

caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960

gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020

ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080

ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140

catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200

acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgcgg 1260

ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcggc cgcttttgtg 1320

aaccagcacc tctgcggatc tgatctggtt gaggccttgt acctggtttg tggggaaaga 1380

ggttttttct ataccccaag gacaaagcgc gaggcagaag accttcaagt gggccaggta 1440

gagctgggag ggggcccggg tgcaggatcc ctgcagcctc tggctctaga agggtctaga 1500

caaaaaaggg gcatagtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560

aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620

atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680

tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740

caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800

gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860

gaagcttttg 1870

<210> 126

<211> 1870

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Dx2: 211->IRES->RE-211 - 25

<400> 126

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatggcc ctgtggatga gactcctgcc cctgctggct 360

ctgctggccc tctggggacc tgacccagct gcagcctttg tgaaccaaca cctgtgtggc 420

tcagatctgg tggaagctct ctacctagtg tgtggggaaa gaggcttctt ctacacaccc 480

aggaccaaga gggaggcaga ggacctgcag gtggggcagg tggagctggg agggggccct 540

ggtgcaggca gcctgcagcc cttggccctg gaggggtcta gacagaagag gggcattgtg 600

gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660

cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720

cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780

aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840

tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900

caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960

gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020

ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080

ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140

catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200

acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgaga 1260

ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcagc tgcttttgtg 1320

aaccagcacc tctgtggatc tgatctggtt gaggccttgt acctggtttg tggggaaaga 1380

ggttttttct ataccccaag gacaaagagg gaggcagaag accttcaagt gggccaggta 1440

gagctgggag ggggccctgg tgcaggatcc ctgcagcctc tggctctaga agggtctaga 1500

caaaaaaggg gcatagtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560

aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620

atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680

tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740

caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800

gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860

gaagcttttg 1870

<210> 127

<211> 953

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10H)_2

<400> 127

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360

gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420

ctcacacctg gtggaagctc tctacctagt gtgcggggaa cgaggcttct tctacacacc 480

caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc gtggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953

<210> 128

<211> 953

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10H) - 27

<400> 128

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360

gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420

ctcacacctg gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc 480

caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953

<210> 129

<211> 953

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10H) - 28

<400> 129

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360

tctgctggcc ctctggggac ctgacccagc tgcagccttt gtgaaccaac acctgtgtgg 420

ctcacacctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480

caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540

tggtgcaggc agcctgcagc ccttggccct ggaggggtct agacagaaga ggggcattgt 600

ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660

ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720

tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780

tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840

ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900

aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953

<210> 130

<211> 1870

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Hx2: B10H->IRES->RE - 29

<400> 130

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatggcc ctgtggatgc gcctcctgcc cctgctggcg 360

ctgctggccc tctggggacc tgacccagcc gcagcctttg tgaaccaaca cctgtgcggc 420

tcacacctgg tggaagctct ctacctagtg tgcggggaac gaggcttctt ctacacaccc 480

aggaccaagc gggaggcaga ggacctgcag gtggggcagg tggagctggg cgggggccct 540

ggtgcaggca gcctgcagcc cttggccctg gaggggtcgc gacagaagcg tggcattgtg 600

gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660

cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720

cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780

aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840

tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900

caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960

gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020

ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080

ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140

catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200

acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgcgg 1260

ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcggc cgctttcgtg 1320

aaccagcacc tctgcggaag ccacctggtc gaggccttgt acctggtttg tggggaaaga 1380

ggttttttct ataccccgag gacaaagcgc gaggcagaag accttcaagt gggccaggta 1440

gagctcggag ggggccccgg tgccggatcc ctgcagcctc tggctctcga agggtctcga 1500

caaaaacgtg gcatcgtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560

aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620

atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680

tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740

caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800

gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860

gaagcttttg 1870

<210> 131

<211> 1870

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Hx2: 111->IRES->RE-111 - 30

<400> 131

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatggcc ctgtggatgc gcctcctgcc cctgctggcg 360

ctgctggccc tctggggacc tgacccagcc gcagcctttg tgaaccaaca cctgtgcggc 420

tcacacctgg tggaagctct ctacctagtg tgcggggaaa gaggcttctt ctacacaccc 480

aggaccaagc gggaggcaga ggacctgcag gtggggcagg tggagctggg cgggggccct 540

ggtgcaggca gcctgcagcc cttggccctg gaggggtcgc gacagaagcg gggcattgtg 600

gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660

cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720

cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780

aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840

tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900

caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960

gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020

ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080

ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140

catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200

acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgcgg 1260

ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcggc cgcttttgtg 1320

aaccagcacc tctgcggatc tcacctggtt gaggccttgt acctggtttg tggggaaaga 1380

ggttttttct ataccccaag gacaaagcgc gaggcagaag accttcaagt gggccaggta 1440

gagctgggag ggggcccggg tgcaggatcc ctgcagcctc tggctctaga agggtctaga 1500

caaaaaaggg gcatagtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560

aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620

atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680

tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740

caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800

gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860

gaagcttttg 1870

<210> 132

<211> 1870

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Hx2: 211->IRES->RE-211 -31

<400> 132

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatggcc ctgtggatga gactcctgcc cctgctggct 360

ctgctggccc tctggggacc tgacccagct gcagcctttg tgaaccaaca cctgtgtggc 420

tcacacctgg tggaagctct ctacctagtg tgtggggaaa gaggcttctt ctacacaccc 480

aggaccaaga gggaggcaga ggacctgcag gtggggcagg tggagctggg agggggccct 540

ggtgcaggca gcctgcagcc cttggccctg gaggggtcta gacagaagag gggcattgtg 600

gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660

cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720

cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780

aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840

tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900

caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960

gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020

ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080

ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140

catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200

acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgaga 1260

ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcagc tgcttttgtg 1320

aaccagcacc tctgtggatc tcacctggtt gaggccttgt acctggtttg tggggaaaga 1380

ggttttttct ataccccaag gacaaagagg gaggcagaag accttcaagt gggccaggta 1440

gagctgggag ggggccctgg tgcaggatcc ctgcagcctc tggctctaga agggtctaga 1500

caaaaaaggg gcatagtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560

aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620

atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680

tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740

caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800

gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860

gaagcttttg 1870

<210> 133

<211> 968

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10D[IL-6]) - 32

<400> 133

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagcgcct tcggccccgt 360

ggctttctct ctgggactgc tgctggtgct gcctgccgct ttccctgccc cttttgtgaa 420

ccaacacctg tgcggctcag atctggtgga agctctctac ctagtgtgcg gggaacgagg 480

cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg ggcaggtgga 540

gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtcgcgaca 600

gaagcgtggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660

ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960

agcttttg 968

<210> 134

<211> 968

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10D[IL-6]) - 33

<400> 134

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagcgcct ttggcccagt 360

ggctttctct ctgggactgc tgctggtgct gcctgccgct ttccctgccc cttttgtgaa 420

ccaacacctg tgcggctcag atctggtgga agctctctac ctagtgtgcg gggaaagagg 480

cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg ggcaggtgga 540

gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtcgcgaca 600

gaagcggggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660

ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960

agcttttg 968

<210> 135

<211> 968

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10D[IL-6]) - 34

<400> 135

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagtgcct ttggcccagt 360

ggctttctct ctgggactgc tgctggtgct gcctgcagct ttccctgccc cttttgtgaa 420

ccaacacctg tgtggctcag atctggtgga agctctctac ctagtgtgtg gggaaagagg 480

cttcttctac acacccagga ccaagagaga ggcagaggac ctgcaggtgg ggcaggtgga 540

gctgggaggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtccaggca 600

gaagagaggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660

ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960

agcttttg 968

<210> 136

<211> 968

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10H[IL-6]) - 35

<400> 136

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagcgcct tcggccccgt 360

ggctttctct ctgggactgc tgctggtgct gcctgccgct ttccctgccc cttttgtgaa 420

ccaacacctg tgcggctcac acctggtgga agctctctac ctagtgtgcg gggaacgagg 480

cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg ggcaggtgga 540

gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtcgcgaca 600

gaagcgtggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660

ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960

agcttttg 968

<210> 137

<211> 968

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10H[IL-6]) - 36

<400> 137

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagcgcct ttggcccagt 360

ggctttctct ctgggactgc tgctggtgct gcctgccgct ttccctgccc cttttgtgaa 420

ccaacacctg tgcggctcac acctggtgga agctctctac ctagtgtgcg gggaaagagg 480

cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg ggcaggtgga 540

gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtcgcgaca 600

gaagcggggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660

ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960

agcttttg 968

<210> 138

<211> 968

<212> DNA

<213> 人工序列

<220>

<223> Ins (B10H[IL-6]) - 37

<400> 138

aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60

aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagtgcct ttggcccagt 360

ggctttctct ctgggactgc tgctggtgct gcctgcagct ttccctgccc cttttgtgaa 420

ccaacacctg tgtggctcac acctggtgga agctctctac ctagtgtgtg gggaaagagg 480

cttcttctac acacccagga ccaagagaga ggcagaggac ctgcaggtgg ggcaggtgga 540

gctgggaggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtccaggca 600

gaagagaggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660

ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960

agcttttg 968

<210> 139

<211> 1885

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Hx2[IL-6/ISP]: IL-6->B10H->IRES->ISP->RE - 38

<400> 139

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatgaac agcttcagca caagcgcctt cggccccgtg 360

gctttctctc tgggactgct gctggtgctg cctgccgctt tccctgcccc ttttgtgaac 420

caacacctgt gcggctcaca cctggtggaa gctctctacc tagtgtgcgg ggaacgaggc 480

ttcttctaca cacccaggac caagcgggag gcagaggacc tgcaggtggg gcaggtggag 540

ctgggcgggg gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtcgcgacag 600

aagcgtggca ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac 660

tactgcaact aggcccctct ccctcccccc cccctaacgt tactggccga agccgcttgg 720

aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg tcttttggca 780

atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg ggtctttccc 840

ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag 900

cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac cccccacctg 960

gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca aaggcggcac 1020

aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg ctctcctcaa 1080

gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg ggatctgatc 1140

tggggcctcg gtacacatgc tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc 1200

ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccacaatg 1260

gccctgtgga tgcggctctt gccccttctg gctttactgg cactatgggg ccctgaccca 1320

gcggccgctt tcgtgaacca gcacctctgc ggaagccacc tggtcgaggc cttgtacctg 1380

gtttgtgggg aaagaggttt tttctatacc ccgaggacaa agcgcgaggc agaagacctt 1440

caagtgggcc aggtagagct cggagggggc cccggtgccg gatccctgca gcctctggct 1500

ctcgaagggt ctcgacaaaa acgtggcatc gtggagcagt gctgtacttc aatttgcagt 1560

ttgtaccagc ttgagaatta ttgtaactga agccagctgc cttcccttta ctgtgggtta 1620

atgcttgcag cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg 1680

cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt 1740

ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag 1800

ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatccga 1860

taagggacta gagcagaagc ttttg 1885

<210> 140

<211> 1885

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Hx2[IL-6/ISP]: IL-6->111->IRES->ISP->RE-111 - 39

<400> 140

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatgaac agcttcagca caagcgcctt tggcccagtg 360

gctttctctc tgggactgct gctggtgctg cctgccgctt tccctgcccc ttttgtgaac 420

caacacctgt gcggctcaca cctggtggaa gctctctacc tagtgtgcgg ggaaagaggc 480

ttcttctaca cacccaggac caagcgggag gcagaggacc tgcaggtggg gcaggtggag 540

ctgggcgggg gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtcgcgacag 600

aagcggggca ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac 660

tactgcaact aggcccctct ccctcccccc cccctaacgt tactggccga agccgcttgg 720

aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg tcttttggca 780

atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg ggtctttccc 840

ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag 900

cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac cccccacctg 960

gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca aaggcggcac 1020

aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg ctctcctcaa 1080

gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg ggatctgatc 1140

tggggcctcg gtacacatgc tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc 1200

ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccacaatg 1260

gccctgtgga tgcggctctt gccccttctg gctttactgg cactatgggg ccctgaccca 1320

gcggccgctt ttgtgaacca gcacctctgc ggatctcacc tggttgaggc cttgtacctg 1380

gtttgtgggg aaagaggttt tttctatacc ccaaggacaa agcgcgaggc agaagacctt 1440

caagtgggcc aggtagagct gggagggggc ccgggtgcag gatccctgca gcctctggct 1500

ctagaagggt ctagacaaaa aaggggcata gtggagcagt gctgtacttc aatttgcagt 1560

ttgtaccagc ttgagaatta ttgtaactga agccagctgc cttcccttta ctgtgggtta 1620

atgcttgcag cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg 1680

cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt 1740

ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag 1800

ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatccga 1860

taagggacta gagcagaagc ttttg 1885

<210> 141

<211> 1885

<212> DNA

<213> 人工序列

<220>

<223> Ins B10Hx2[IL-6/ISP]: IL-6->211->IRES->ISP->RE-211 - 40

<400> 141

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc caccatgaac agcttcagca caagtgcctt tggcccagtg 360

gctttctctc tgggactgct gctggtgctg cctgcagctt tccctgcccc ttttgtgaac 420

caacacctgt gtggctcaca cctggtggaa gctctctacc tagtgtgtgg ggaaagaggc 480

ttcttctaca cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag 540

ctgggagggg gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtccaggcag 600

aagagaggca ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac 660

tactgcaact aggcccctct ccctcccccc cccctaacgt tactggccga agccgcttgg 720

aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg tcttttggca 780

atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg ggtctttccc 840

ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag 900

cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac cccccacctg 960

gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca aaggcggcac 1020

aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg ctctcctcaa 1080

gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg ggatctgatc 1140

tggggcctcg gtacacatgc tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc 1200

ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccacaatg 1260

gccctgtgga tgagactctt gccccttctg gctttactgg cactatgggg ccctgaccca 1320

gcagctgctt ttgtgaacca gcacctctgt ggatctcacc tggttgaggc cttgtacctg 1380

gtttgtgggg aaagaggttt tttctatacc ccaaggacaa agagggaggc agaagacctt 1440

caagtgggcc aggtagagct gggagggggc cctggtgcag gatccctgca gcctctggct 1500

ctagaagggt ctagacaaaa aaggggcata gtggagcagt gctgtacttc aatttgcagt 1560

ttgtaccagc ttgagaatta ttgtaactga agccagctgc cttcccttta ctgtgggtta 1620

atgcttgcag cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg 1680

cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt 1740

ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag 1800

ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatccga 1860

taagggacta gagcagaagc ttttg 1885

<210> 142

<211> 567

<212> DNA

<213> 人工序列

<220>

<223> IRES

<400> 142

tccctccccc ccccctaacg ttactggccg aagccgcttg gaataaggcc ggtgtgcgtt 60

tgtctatatg ttattttcca ccatattgcc gtcttttggc aatgtgaggg cccggaaacc 120

tggccctgtc ttcttgacga gcattcctag gggtctttcc cctctcgcca aaggaatgca 180

aggtctgttg aatgtcgtga aggaagcagt tcctctggaa gcttcttgaa gacaaacaac 240

gtctgtagcg accctttgca ggcagcggaa ccccccacct ggcgacaggt gcctctgcgg 300

ccaaaagcca cgtgtataag atacacctgc aaaggcggca caaccccagt gccacgttgt 360

gagttggata gttgtggaaa gagtcaaatg gctctcctca agcgtattca acaaggggct 420

gaaggatgcc cagaaggtac cccattgtat gggatctgat ctggggcctc ggtgcacatg 480

ctttacatgt gtttagtcga ggttaaaaaa acgtctaggc cccccgaacc acggggacgt 540

ggttttcctt tgaaaacacg atgataa 567

<210> 143

<211> 585

<212> DNA

<213> 人工序列

<220>

<223> IRES v2

<400> 143

gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60

gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120

ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180

gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240

aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300

tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360

acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 420

aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480

acacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg 540

gggacgtggt tttcctttga aaaacacgat gataatatgg ccaca 585

<210> 144

<211> 110

<212> PRT

<213> 人工序列

<220>

<223> 突变体ins B10D

<400> 144

Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu

1 5 10 15

Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly

20 25 30

Ser Asp Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe

35 40 45

Phe Tyr Thr Pro Arg Thr Lys Arg Glu Ala Glu Asp Leu Gln Val Gly

50 55 60

Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu

65 70 75 80

Ala Leu Glu Gly Ser Arg Gln Lys Arg Gly Ile Val Glu Gln Cys Cys

85 90 95

Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

100 105 110

<210> 145

<211> 110

<212> PRT

<213> 人工序列

<220>

<223> 突变体ins B10H

<400> 145

Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu

1 5 10 15

Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly

20 25 30

Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe

35 40 45

Phe Tyr Thr Pro Arg Thr Lys Arg Glu Ala Glu Asp Leu Gln Val Gly

50 55 60

Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu

65 70 75 80

Ala Leu Glu Gly Ser Arg Gln Lys Arg Gly Ile Val Glu Gln Cys Cys

85 90 95

Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

100 105 110

<210> 146

<211> 324

<212> DNA

<213> 人工序列

<220>

<223> 5' UTR

<400> 146

agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60

acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120

aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180

gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240

catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300

ctagagtcct gcagaattgc cacc 324

<210> 147

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> 野生型序列

<400> 147

atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60

ccagccgcag cctttgtgaa ccaacacctg tgcggctcac acctggtgga agctctctac 120

ctagtgtgcg gggaacgagg cttcttctac acacccaaga cccgccggga ggcagaggac 180

ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240

gccctggagg ggtccctgca gaagcgtggc attgtggaac aatgctgtac cagcatctgc 300

tccctctacc agctggagaa ctactgcaac tag 333

<210> 148

<211> 350

<212> DNA

<213> 人工序列

<220>

<223> 5 UTR (B10D-Ins未修饰)

<400> 148

aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60

aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtac ttaatacgac tcactatagg ctagcctcga gaattctgcc 350

<210> 149

<211> 363

<212> DNA

<213> 人工序列

<220>

<223> 3' UTR (B10D-Ins未修饰)

<400> 149

acgcagctgc tagctaatcg ataccgtcga cctcgaggaa ttcacgcgtg gtacctctag 60

agtcgacccg ggcggccgct tccctttagt gagggttaat gcttcgagca gacatgataa 120

gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt 180

gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta 240

acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt 300

aaagcaagta aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt 360

ttg 363

<210> 150

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> Ins1 - 弗林蛋白酶切割位点和在B10位置组氨酸被异亮氨酸替代

<400> 150

atggctctgt ggatgagact gctgcccctg ctggctctgc tggcactgtg gggacctgat 60

cctgccgccg ctttcgtgaa ccagcacctg tgtggcagca tcctggtgga agccctgtac 120

ctcgtgtgcg gcgagagagg cttcttctac acccctagga ccaagagaga ggccgaggat 180

ctgcaagtgg gccaggtgga actgggcgga ggacctggcg ctggatctct gcagcctctg 240

gctctggaag gcagcagaca gaaaaggggc atcgtggaac agtgctgcac cagcatctgc 300

tccctgtacc agctggaaaa ctactgcaac tga 333

<210> 151

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> Ins2 - 弗林蛋白酶切割位点和在B10位置组氨酸被缬氨酸替代

<400> 151

atggctctgt ggatgagact gctgcccctg ctggctctgc tggcactgtg gggacctgat 60

cctgccgccg ctttcgtgaa ccagcacctg tgtggaagcg tgctggtgga agccctgtac 120

ctcgtgtgtg gcgagagagg cttcttctac acccctagga ccaagagaga ggccgaggat 180

ctgcaagtgg gccaggtgga actgggcgga ggacctggcg ctggatctct gcagcctctg 240

gctctggaag gcagcagaca gaaaaggggc atcgtggaac agtgctgcac cagcatctgc 300

tccctgtacc agctggaaaa ctactgcaac tga 333

<210> 152

<211> 348

<212> DNA

<213> 人工序列

<220>

<223> Ins3 - 弗林蛋白酶切割位点和替代WT信号肽的白介素6(IL6)的信号肽

<400> 152

atgaacagct tcagcacaag cgccttcggc cccgtggctt tctctctggg actgctgctg 60

gtgctgcctg ccgctttccc tgcccctttc gtgaaccagc acctgtgcgg cagccacctg 120

gtggaagctc tgtacctcgt gtgcggcgag agaggcttct tctacacccc taggaccaag 180

agagaggccg aggatctgca agtgggccag gtggaactgg gcggaggacc tggcgctgga 240

tctctgcagc ctctggctct ggaaggcagc agacagaaaa ggggcatcgt ggaacagtgc 300

tgcaccagca tctgctccct gtaccagctg gaaaactact gcaactga 348

<210> 153

<211> 339

<212> DNA

<213> 人工序列

<220>

<223> Ins4 - 弗林蛋白酶切割位点和替代WT信号肽的纤连蛋白的信号肽

<400> 153

atgctgagag gacctggacc aggactgctg ctgctggccg tgcagtgtct gggaacagcc 60

gtgcctagca caggcgcctt cgtgaaccag cacctgtgtg gcagccacct ggtggaagcc 120

ctgtacctcg tgtgtggcga gagaggcttc ttctacaccc ctaggaccaa gagagaggcc 180

gaggatctgc aagtgggcca ggtggaactg ggcggaggac caggcgctgg atctctgcag 240

cctctggctc tggaaggcag cagacagaaa aggggcatcg tggaacagtg ctgcaccagc 300

atctgctccc tgtaccagct ggaaaactac tgcaactga 339

<210> 154

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> Ins5 - 弗林蛋白酶切割位点

<400> 154

atggctctgt ggatgagact gctgcccctg ctggctctgc tggcactgtg gggacctgat 60

cctgccgccg ctttcgtgaa ccagcacctg tgtggcagcc acctggtgga agccctgtac 120

ctcgtgtgtg gcgagagagg cttcttctac acccctagga ccaagagaga ggccgaggat 180

ctgcaagtgg gccaggtgga actgggcgga ggacctggcg ctggatctct gcagcctctg 240

gctctggaag gcagcagaca gaaaaggggc atcgtggaac agtgctgcac cagcatctgc 300

tccctgtacc agctggaaaa ctactgcaac tga 333

<210> 155

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> Ins6 - 弗林蛋白酶切割位点

<400> 155

atggctctgt ggatgagact gctgcccctg ctggctctgc tggcactgtg gggacctgat 60

cctgccgccg ctttcgtgaa ccagcacctg tgtggcagcc acctggtgga agccctgtac 120

ctcgtgtgtg gcgagagagg cttcttctac acccctagga ccaagagaga ggccgaggat 180

ctgcaagtgg gccaggtgga actgggcgga ggacctggcg ctggatctct gcagcctctg 240

gctctggaag gcagcagaca gaaaaggggc atcgtggaac agtgctgcac cagcatctgc 300

tccctgtacc agctggaaaa ctactgcaac tga 333

<210> 156

<211> 348

<212> DNA

<213> 人工序列

<220>

<223> Ins7 - 弗林蛋白酶切割位点、替代WT信号肽的IL6的信号肽和在B10位置组氨酸被缬氨酸替代

<400> 156

atgaacagct tcagcacaag cgctttcggc cccgtggctt tttctctggg actgctgctg 60

gttctgcctg ccgcttttcc tgctcctttc gtgaaccagc acctgtgcgg aagcgtgctg 120

gtggaagctc tgtatctcgt gtgtggcgag agaggcttct tctacacccc taggaccaag 180

agagaggccg aggatctgca agtcggccag gttgaacttg gcggaggacc tggtgctgga 240

tctctgcagc ctcttgctct ggaaggcagc agacagaaga ggggcatcgt cgagcagtgc 300

tgcaccagca tctgtagcct gtaccagctg gaaaactact gcaactga 348

<210> 157

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> Ins8 - 弗林蛋白酶切割位点和在B28位置脯氨酸被天冬氨酸替代

<400> 157

atggcacttt ggatgagact gctgccactg ctggccctgc ttgctctttg gggacctgat 60

cctgctgccg cctttgtgaa ccagcacctg tgtggaagcc atctggtgga agccctgtac 120

ctcgtgtgtg gcgagagagg cttcttctac accgacagga ccaagagaga ggccgaggat 180

ctgcaagtcg gccaggttga acttggcgga ggacctggtg ctggatctct gcagcctctt 240

gctctggaag gcagcagaca gaagaggggc atcgtcgagc agtgctgcac cagcatctgt 300

agcctgtacc agctggaaaa ctactgcaac tga 333

<210> 158

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> Ins9 - 弗林蛋白酶切割位点

<400> 158

atggccttgt ggatgcggct tttgccgctg ctcgcgctct tggccctctg ggggcccgac 60

ccggctgccg ctttcgtcaa tcagcacctc tgcggcagcc acctcgtgga agcgctttac 120

ttggtctgcg gcgagagggg cttcttttat actccacgga ctaagcggga ggccgaagac 180

ttgcaagtcg ggcaagtgga actgggaggc gggccgggtg cggggtctct gcaacctctt 240

gcccttgagg ggtcacgaca aaagagaggg atagttgagc agtgttgtac gtcaatttgt 300

tccctgtatc aacttgaaaa ttattgcaat tag 333

<210> 159

<211> 333

<212> DNA

<213> 人工序列

<220>

<223> Ins10 - 弗林蛋白酶切割位点

<400> 159

atggctctgt ggatgagact tcttcctctt ttggccctgc tggccctttg gggccctgat 60

cctgccgccg ccttcgttaa ccaacatctg tgcggttcac acctggttga agctctttac 120

ctcgtttgtg gagaaagagg ctttttttac acaccacgga ccaaaaggga ggcagaggac 180

ctgcaggtgg gacaggttga gctgggcggg ggccctgggg caggctcact tcagccactc 240

gccctggagg gctctcgcca gaagagaggt atagtggagc aatgctgtac cagcatttgt 300

tctctctatc agctggagaa ttactgtaac taa 333

<210> 160

<211> 683

<212> DNA

<213> 人工序列

<220>

<223> 未修饰的hIns_2 (B10D)

<400> 160

aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60

aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120

gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180

tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240

acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300

gctagagtac ttaatacgac tcactatagg ctagcctcga gaattctgcc atggccctgt 360

ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac ccagccgcag 420

cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac ctagtgtgcg 480

gggaacgagg cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg 540

ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg 600

ggtcgcgaca gaagcgtggc attgtggaac aatgctgtac cagcatctgc tccctctacc 660

agctggagaa ctactgcaac tag 683

<210> 161

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 未修饰的hIns_3 (B10D)

<400> 161

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcgcctc ctgcccctgc 360

tggcgctgct ggccctctgg ggacctgacc cagccgcagc ctttgtgaac caacacctgt 420

gcggctcaga tctggtggaa gctctctacc tagtgtgcgg ggaacgaggc ttcttctaca 480

cacccaggac caagcgggag gcagaggacc tgcaggtggg gcaggtggag ctgggcgggg 540

gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtcgcgacag aagcgtggca 600

ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660

agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840

acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900

agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957

<210> 162

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> 未修饰的hGck_2 ORF

<400> 162

atggcgatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60

ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagacg gatgcagaag 120

gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180

acctacgtgc gctccacccc agaaggctca gaagtcgggg acttcctctc cctggacctg 240

ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300

agcgtgaaga ccaaacacca gatgtactcc atccccgagg acgccatgac cggcactgct 360

gagatgctct tcgactacat ctctgagtgc atctccgact tcctggacaa gcatcagatg 420

aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca cgaagacatc 480

gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540

aatgtcgtgg ggcttctgcg agacgctatc aaacggagag gggactttga aatggatgtg 600

gtggcaatgg tgaatgacac ggtggccacg atgatctcct gctactacga agaccatcag 660

tgcgaggtcg gcatgatcgt gggcacgggc tgcaatgcct gctacatgga ggagatgcag 720

aatgtggagc tggtggaggg ggacgagggc cgcatgtgcg tcaataccga gtggggcgcc 780

ttcggggact ccggcgagct ggacgagttc ctgctggagt atgaccgcct ggtggacgag 840

agctctgcaa accccggtca gcagctgtat gagaagctca taggtggcaa gtacatgggc 900

gagctggtgc ggcttgtgct gctcaggctc gtggacgaaa acctgctctt ccacggggag 960

gcctccgagc agctgcgcac acgcggagcc ttcgagacgc gcttcgtgtc gcaggtggag 1020

agcgacacgg gcgaccgcaa gcagatctac aacatcctga gcacgctggg gctgcgaccc 1080

tcgaccaccg actgcgacat cgtgcgccgc gcctgcgaga gcgtgtctac gcgcgctgcg 1140

cacatgtgct cggcggggct ggcgggcgtc atcaaccgca tgcgcgagag ccgcagcgag 1200

gacgtaatgc gcatcactgt gggcgtggat ggctccgtgt acaagctgca ccccagcttc 1260

aaggagcggt tccatgccag cgtgcgcagg ctgacgccca gctgcgagat caccttcatc 1320

gagtcggagg agggcagtgg ccggggcgcg gccctggtct cggcggtggc ctgtaagaag 1380

gcctgtatgc tgggccagtg a 1401

<210> 163

<211> 2016

<212> DNA

<213> 人工序列

<220>

<223> 未修饰的hGck_2

<400> 163

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggcgatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagacgg atgcagaagg agatggaccg cggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctacgtgcg ctccacccca gaaggctcag 540

aagtcgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gcgtgaagac caaacaccag atgtactcca 660

tccccgagga cgccatgacc ggcactgctg agatgctctt cgactacatc tctgagtgca 720

tctccgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcac gaagacatcg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtcgtggg gcttctgcga gacgctatca 900

aacggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacacg gtggccacga 960

tgatctcctg ctactacgaa gaccatcagt gcgaggtcgg catgatcgtg ggcacgggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gacgagggcc 1080

gcatgtgcgt caataccgag tggggcgcct tcggggactc cggcgagctg gacgagttcc 1140

tgctggagta tgaccgcctg gtggacgaga gctctgcaaa ccccggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggcg agctggtgcg gcttgtgctg ctcaggctcg 1260

tggacgaaaa cctgctcttc cacggggagg cctccgagca gctgcgcaca cgcggagcct 1320

tcgagacgcg cttcgtgtcg caggtggaga gcgacacggg cgaccgcaag cagatctaca 1380

acatcctgag cacgctgggg ctgcgaccct cgaccaccga ctgcgacatc gtgcgccgcg 1440

cctgcgagag cgtgtctacg cgcgctgcgc acatgtgctc ggcggggctg gcgggcgtca 1500

tcaaccgcat gcgcgagagc cgcagcgagg acgtaatgcg catcactgtg ggcgtggatg 1560

gctccgtgta caagctgcac cccagcttca aggagcggtt ccatgccagc gtgcgcaggc 1620

tgacgcccag ctgcgagatc accttcatcg agtcggagga gggcagtggc cggggcgcgg 1680

ccctggtctc ggcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcat 2016

<210> 164

<211> 2025

<212> DNA

<213> 人工序列

<220>

<223> 未修饰的hGck_3

<400> 164

ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60

acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120

tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180

aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240

actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300

taaggctaga gtcctgcaga attgccacca tggcgatgga tgtcacaagg agccaggccc 360

agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420

tgaagaaggt gatgagacgg atgcagaagg agatggaccg cggcctgagg ctggagaccc 480

atgaagaggc cagtgtgaag atgctgccca cctacgtgcg ctccacccca gaaggctcag 540

aagtcgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600

aggtgggaga aggtgaggag gggcagtgga gcgtgaagac caaacaccag atgtactcca 660

tccccgagga cgccatgacc ggcactgctg agatgctctt cgactacatc tctgagtgca 720

tctccgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780

tctcctttcc tgtgaggcac gaagacatcg ataagggcat ccttctcaac tggaccaagg 840

gcttcaaggc ctcaggagca gaagggaaca atgtcgtggg gcttctgcga gacgctatca 900

aacggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacacg gtggccacga 960

tgatctcctg ctactacgaa gaccatcagt gcgaggtcgg catgatcgtg ggcacgggct 1020

gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gacgagggcc 1080

gcatgtgcgt caataccgag tggggcgcct tcggggactc cggcgagctg gacgagttcc 1140

tgctggagta tgaccgcctg gtggacgaga gctctgcaaa ccccggtcag cagctgtatg 1200

agaagctcat aggtggcaag tacatgggcg agctggtgcg gcttgtgctg ctcaggctcg 1260

tggacgaaaa cctgctcttc cacggggagg cctccgagca gctgcgcaca cgcggagcct 1320

tcgagacgcg cttcgtgtcg caggtggaga gcgacacggg cgaccgcaag cagatctaca 1380

acatcctgag cacgctgggg ctgcgaccct cgaccaccga ctgcgacatc gtgcgccgcg 1440

cctgcgagag cgtgtctacg cgcgctgcgc acatgtgctc ggcggggctg gcgggcgtca 1500

tcaaccgcat gcgcgagagc cgcagcgagg acgtaatgcg catcactgtg ggcgtggatg 1560

gctccgtgta caagctgcac cccagcttca aggagcggtt ccatgccagc gtgcgcaggc 1620

tgacgcccag ctgcgagatc accttcatcg agtcggagga gggcagtggc cggggcgcgg 1680

ccctggtctc ggcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740

cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800

gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860

ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920

attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980

acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025

<210> 165

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 野生型胰岛素信号序列

<400> 165

Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu

1 5 10 15

Trp Gly Pro Asp Pro Ala Ala Ala

20

<210> 166

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> IL-6信号序列

<400> 166

Met Asn Ser Phe Ser Thr Ser Ala Phe Gly Pro Val Ala Phe Ser Leu

1 5 10 15

Gly Leu Leu Leu Val Leu Pro Ala Ala Phe Pro Ala Pro

20 25

<210> 167

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 纤连蛋白信号序列

<400> 167

Met Leu Arg Gly Pro Gly Pro Gly Leu Leu Leu Leu Ala Val Gln Cys

1 5 10 15

Leu Gly Thr Ala Val Pro Ser Thr Gly Ala

20 25

Claims

1.一种编码人胰岛素(Ins)蛋白的多核苷酸，其包含：(i)编码信号肽的核苷酸序列，任选地，其中所述信号肽不是野生型前胰岛素原信号序列，和(ii)编码胰岛素原多肽的核苷酸序列，所述胰岛素原多肽相对于野生型胰岛素原中相应的氨基酸位置包含在选自人胰岛素B链的氨基酸B10、B28和/或B29，人胰岛素C链的C1和/或C32，或者其任意组合的位置处的氨基酸修饰，并且任选地，所述多核苷酸进一步包括弗林蛋白酶切割位点。

2.一种包含编码人胰岛素(Ins)蛋白的核酸的多核苷酸，其中所述核酸包含开放阅读框(ORF)，所述ORF包含：与以下任一项至少85％、90％、95％、99％或100％相同的核苷酸序列：(a)SEQ ID NO:43-57、110-116、150-151、154-155或157-159中任一项的核酸73-330，SEQ ID NO:117-122、152或156中任一项的核酸88-345，或者SEQ ID NO:153的核酸79-336；或者(b)SEQ ID NO:43-57、SEQ ID NO:110-122或SEQ ID NO:150-159。

3.权利要求2所述的多核苷酸，其中编码的人Ins蛋白包含SEQ ID NO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110、SEQ ID NO:145的氨基酸25-110、SEQ ID NO:41、SEQID NO:144或SEQ ID NO:145中任一项的氨基酸序列。

4.权利要求2或3所述的多核苷酸，其中所述人Ins蛋白包含信号肽。

5.权利要求1或4中任一项所述的多核苷酸，其中所述信号肽是野生型前胰岛素原信号序列、IL-6信号序列或纤连蛋白信号序列。

6.权利要求5所述的多核苷酸，其中所述信号肽包含SEQ ID NO:41的氨基酸25-110、SEQ ID NO:144的氨基酸25-110或SEQ ID NO:145的氨基酸25-110。

7.权利要求1-6中任一项所述的多核苷酸，其中所述人Ins蛋白进一步包含切割位点。

8.权利要求1-7中任一项所述的多核苷酸，其中所述核酸进一步包含5'UTR，所述5'UTR包含与SEQ ID NO:42的核酸5-329至少85％、90％、95％、99％或100％相同的核苷酸序列。

9.权利要求1-8中任一项所述的多核苷酸，其中所述核酸进一步包含5'UTR，所述5'UTR包含与SEQ ID NO:42、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148至少85％、90％、95％、99％或100％相同的核苷酸序列。

10.权利要求1-9中任一项所述的多核苷酸，其中所述核酸进一步包含3'UTR，所述3'UTR包含与SEQ ID NO:60、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、或SEQ ID NO:101或SEQ ID NO:149至少85％、90％、95％、99％或100％相同的核苷酸序列。

11.权利要求1-10中任一项所述的多核苷酸，其中所述3'UTR进一步包含选自下组中的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI。

12.权利要求1-11中任一项所述的多核苷酸，其包含至少两个编码人Ins蛋白的开放阅读框(ORF)。

13.权利要求12所述的多核苷酸，其中所述至少两个ORF通过IRES序列可操作地连接。

14.权利要求13所述的多核苷酸，其中所述IRES序列包含与SEQ ID NO:142或SEQ IDNO:143至少85％、90％、95％、99％或100％相同的核苷酸序列。

15.权利要求1-10中任一项所述的多核苷酸，其中所述核酸包括：

(a)与选自SEQ ID NO:1-16中任一项的序列至少85％、90％、95％、99％或100％相同的核苷酸序列或其任意组合。

16.权利要求1-11中任一项所述的多核苷酸，其中所述核酸包括：

(a)与选自SEQ ID NO:84-88中任一项的序列至少85％、90％、95％、99％或100％相同的核苷酸序列或其任意组合。

17.权利要求12-14中任一项所述的多核苷酸，其中所述核酸包括：

(a)与选自SEQ ID NO:124-126、130-132和139-141中任一项的序列至少85％、90％、95％、99％或100％相同的核苷酸序列或其任意组合。

18.权利要求1-17中任一项所述的多核苷酸，其中所述核酸与启动子可操作地连接。

19.一种表达盒，其包含权利要求1-18中任一项所述的多核苷酸和与所述核酸序列可操作地连接的异源表达调控序列。

20.权利要求19所述的表达盒，其中所述异源表达调控序列是启动子。

21.权利要求20所述的多核苷酸或表达盒，其中所述启动子是真核生物启动子。

22.权利要求21所述的多核苷酸或表达盒，其中所述启动子是CMV启动子。

23.前述权利要求中任一项所述的多核苷酸或表达盒，其中将所述核酸可操作地连接到多腺苷酸化(多聚A)元件。

24.一种载体，其包含前述权利要求中任一项所述的多核苷酸或表达盒。

25.权利要求24所述的载体，其中所述载体是病毒载体、非病毒载体、质粒、脂质或溶酶体。

26.权利要求24所述的载体，其中所述载体是腺相关病毒(AAV)载体或慢病毒载体。

27.一种重组AAV(rAAV)颗粒，其包含：AAV衣壳和包含权利要求1-23中任一项所述的多核苷酸或表达盒的载体基因组。

28.权利要求26或27所述的载体或rAAV颗粒，其中所述AAV血清型选自下组：AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVRH8、AAVrh9、AAV9、AAVrh10、AAV10、AAVRH10、AAV11、AAV12。

29.前述权利要求中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒，其中所述信号肽是IL-6信号肽或纤连蛋白信号肽。

30.一种宿主细胞，其包含前述权利要求中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒。

31.权利要求30所述的宿主细胞，其中所述宿主细胞是哺乳动物细胞。

32.一种在细胞中产生人Ins蛋白的方法，其包括用权利要求1-29中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒接触和/或转化所述细胞，从而在所述细胞中产生所述人Ins蛋白。

33.一种在受试者中产生人Ins蛋白的方法，其包括向所述受试者施用权利要求1-29中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒，从而在所述受试者中产生所述人Ins蛋白。

34.一种在有此需要的受试者中治疗或改善与糖尿病相关的症状的方法，其包括向所述受试者递送对于所述受试者治疗有效量的权利要求1-29中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒，从而治疗所述受试者中的糖尿病。

35.权利要求34所述的方法，其中所述糖尿病是1型糖尿病(T1DM)或2型糖尿病(T2DM)。

36.一种多核苷酸，其包含编码人葡萄糖激酶(Gck)蛋白的核酸，其中所述核酸包含ORF，所述ORF包含：

(a)与选自(a)SEQ ID NO:61-80或162中任一项的核酸1-1398；或者(b)SEQ ID NO:61-80和162中任一项的序列至少85％、90％、95％、99％或100％相同的核苷酸序列或者其任意组合。

37.权利要求36所述的多核苷酸，其中编码的人Gck蛋白包含SEQ ID NO:82的氨基酸序列。

38.权利要求36或权利要求37所述的多核苷酸，其中所述核酸进一步包含5'UTR，所述5'UTR包含与SEQ ID NO:42的核酸5-329至少85％、90％、95％、99％或100％相同的核苷酸序列。

39.权利要求36-38中任一项所述的多核苷酸，其中所述核酸进一步包含5'UTR，所述5'UTR包含与SEQ ID NO:42、SEQ ID NO:83、SEQ ID NO:146或SEQ ID NO:148至少85％、90％、95％、99％或100％相同的核苷酸序列。

40.权利要求36-39中任一项所述的多核苷酸，其中所述核酸进一步包含3'UTR，所述3'UTR包含与SEQ ID NO:60、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109或SEQ ID NO:149至少85％、90％、95％、99％或100％相同的核苷酸序列。

41.权利要求36-40中任一项所述的多核苷酸，其中所述3'UTR进一步包含选自下组的限制性位点：BamHI、EcoRI、NdeI、EcoRV、SpeI、XbaI、NheI、VspI、NsiI、ScaI、KpnI、SspI和PacI。

42.权利要求36-40中任一项所述的多核苷酸，其中所述核酸包括：

(a)与选自SEQ ID NO:20-39中任一项的序列至少85％、90％、95％、99％或100％相同的核苷酸序列或其任意组合。

43.权利要求36-40中任一项所述的多核苷酸，其中所述核酸包括：

(a)与选自SEQ ID NO:89-96和163-164中任一项的序列至少85％、90％、95％、99％或100％相同的核苷酸序列或其任意组合。

44.权利要求36-43中任一项所述的多核苷酸，其中将所述核酸可操作地连接到启动子。

45.一种表达盒，其包含权利要求36-44中任一项所述的多核苷酸和与所述核酸序列可操作地连接的异源表达调控序列。

46.权利要求45所述的表达盒，其中所述异源表达调控序列是启动子。

47.权利要求46所述的多核苷酸或表达盒，其中所述启动子是真核生物启动子。

48.权利要求46所述的多核苷酸或表达盒，其中所述启动子是CMV启动子。

49.权利要求36-48中任一项所述的多核苷酸或表达盒，其中将所述核酸可操作地连接到多腺苷酸化(多聚A)元件。

50.一种载体，其包含权利要求36-49中任一项所述的多核苷酸或表达盒。

51.权利要求50所述的载体，其中所述载体是病毒载体、非病毒载体、质粒、脂质或溶酶体。

52.权利要求51所述的载体，其中所述载体是腺相关病毒(AAV)载体或慢病毒载体。

53.一种重组AAV(rAAV)颗粒，其包含：AAV衣壳和包含权利要求36-49中任一项所述的多核苷酸或表达盒的载体基因组。

54.权利要求52或53所述的载体或rAAV颗粒，其中所述AAV血清型选自下组：AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVRH8、AAVrh9、AAV9、AAVrh10和AAV10、AAV11、AAV12。

55.一种宿主细胞，其包含权利要求36-54中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒。

56.权利要求55所述的宿主细胞，其中所述宿主细胞是哺乳动物细胞。

57.一种在细胞中产生人Gck蛋白的方法，其包括用权利要求36-54中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒接触和/或转化所述细胞，从而在所述细胞中产生所述人Gck蛋白。

58.一种在受试者中产生人Gck蛋白的方法，其包括向所述受试者施用权利要求36-54中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒，从而在所述受试者中产生所述人Gck蛋白。

59.一种在有此需要的受试者中治疗或改善与糖尿病相关的症状的方法，其包括向所述受试者递送对于所述受试者治疗有效量的权利要求36-54中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒，从而治疗所述受试者中的糖尿病。

60.权利要求59所述的方法，其中所述糖尿病是1型糖尿病(T1DM)或2型糖尿病(T2DM)。

61.一种在有此需要的受试者中治疗或改善与糖尿病相关的症状的方法，其包括向所述受试者递送治疗有效量的(i)权利要求1-29中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒和(ii)权利要求36-54中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒，从而治疗所述受试者中的糖尿病。

62.一种在有此需要的受试者中产生人Ins蛋白和人Gck蛋白和/或在有此需要的受试者中治疗或改善与糖尿病相关的症状的方法，其包括向所述受试者施用包含(i)权利要求1-29中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒和(ii)权利要求36-54中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒的多种多核苷酸、多种表达盒、多种载体或多种rAAV颗粒，从而在所述受试者中产生人Ins蛋白和人Gck蛋白和/或治疗所述受试者中的糖尿病。

63.权利要求61或62所述的方法，其中所述糖尿病是1型糖尿病(T1DM)或2型糖尿病(T2DM)。

64.权利要求61-63中任一项所述的方法，其中同时或序贯地施用(i)权利要求1-29中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒和(ii)权利要求36-54中任一项所述的多核苷酸、表达盒、载体或rAAV颗粒。

65.权利要求32-35、57-60和61-64中任一项所述的方法，其中以肌内方式递送和/或施用。

66.权利要求32-35、57-60和61-65中任一项所述的方法，其中(i)降低和/或调节受试者中的糖化血液血红蛋白(HbA1c)水平，(ii)降低受试者中的循环酮类，(iii)降低受试者中的甘油三酯，或者(iv)其任意组合。