CN117043319A - 通用供体细胞 - Google Patents

通用供体细胞 Download PDF

Info

Publication number
CN117043319A
CN117043319A CN202180094946.7A CN202180094946A CN117043319A CN 117043319 A CN117043319 A CN 117043319A CN 202180094946 A CN202180094946 A CN 202180094946A CN 117043319 A CN117043319 A CN 117043319A
Authority
CN
China
Prior art keywords
cells
gene
polynucleotide encoding
cell
genetically modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180094946.7A
Other languages
English (en)
Inventor
A·雷扎尼亚
瓦伦汀·斯卢奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CRISPR Therapeutics AG
Original Assignee
CRISPR Therapeutics AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CRISPR Therapeutics AG filed Critical CRISPR Therapeutics AG
Priority claimed from PCT/IB2021/062525 external-priority patent/WO2022144855A1/en
Publication of CN117043319A publication Critical patent/CN117043319A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文提供了与多于一名受试者相容的遗传修饰的细胞,例如通用供体细胞,以及产生所述遗传修饰的细胞的方法。通用供体细胞在编码一种或更多种MHC‑I或MHC‑II人类白细胞抗原或MHC‑I或MHC‑II复合物的组分或转录调节因子的基因内或附近处包含至少一种遗传修饰,其中遗传修饰包括编码致耐受性因子和/或存活因子的多核苷酸的插入。通用供体细胞还可以在编码存活因子的基因内或附近处包含至少一种遗传修饰,其中所述遗传修饰包括编码第二致耐受性因子和/或不同存活因子的多核苷酸的插入。

Description

通用供体细胞
相关申请的交叉引用
本申请要求2020年12月31日提交的美国临时申请第63/132,890号、2021年8月19日提交的美国临时申请第63/234,997号和2021年12月10日提交的美国临时申请第63/288,356号的权益,每个申请的公开内容通过引用以其全文并入本文。
通过引用并入序列表
本申请包含经由EFS-Web以ASCII格式提交的序列表,并通过引用将其全文特此并入。于2021年12月22日生成的ASCII副本被命名为CT154_Sequence_Listing_ST25.txt并且大小为约131,000字节。
发明领域
本发明涉及基因编辑领域,并且在一些实施方案中,涉及出于产生与多于一个受试者相容的细胞(例如,通用供体细胞)的目的的遗传修饰。
背景
已经提出了多种方法来克服移植或植入细胞的同种异体排斥,包括HLA匹配、用抗体阻断触发T细胞活化的途径、使用免疫抑制药物混合物(cocktail)和自体细胞治疗。另一种抑制移植排斥的策略包括使移植或植入细胞和受体之间的同种异体差异最小化。细胞表面表达的人类白细胞抗原(HLA)是由位于6号染色体上的人类主要组织相容性复合体中的基因编码的分子,是免疫排斥的主要介体。供体和受试者之间单个HLA基因的错配会引起稳健的免疫应答(Fleischhauer K.等人.“Bone marrow-allograft rejection by Tlymphocytes recognizing a single amino acid difference in HLA-B44,”N Engl JMed.,1990,323:1818-1822)。HLA基因分为MHC I类(MHC-I)和MHC II类(MHC-II)。MHC-I基因(HLA-A、HLA-B和HLA-C)在几乎所有组织细胞类型中表达,向CD8+T细胞呈递“非自身”抗原加工肽,从而促进其活化为溶细胞性CD8+T细胞。表达“非自身”MHC-I分子的移植或植入细胞将引起针对这些细胞的稳健的细胞免疫应答,并最终通过活化的溶细胞性CD8+T细胞导致这些细胞的死亡。MHC-I蛋白与内质网中的β-2-微球蛋白(B2M)密切相关,β-2-微球蛋白是在细胞表面形成功能性MHC-I分子所必需的。
与MHC-I基因的广泛细胞表达不同,MHC-II基因的表达仅限于抗原呈递细胞,诸如树突状细胞、巨噬细胞和B细胞。HLA抗原基因是在人类基因组中观察到的多态性最丰富的基因(the most polymorphic genes)(Rubinstein P.,“HLA matching for bone marrowtransplantation--how much is enough?”N Engl J Med.,2001,345:1842-1844)。与任何HLA基因型相容的“通用供体”细胞的产生提供了一种替代策略,可以解决免疫排斥和当前免疫逃避方法的相关经济成本。
为了产生这样的通用供体细胞系,以前的一种方法是功能性地破坏MHC-I和MHC-II类基因的表达。这可以通过遗传破坏例如编码MHC-I轻链B2M的两个遗传等位基因来实现。由此产生的B2M无效细胞系(B2M-null cell line)及其派生物(derivatives)有望展示极大降低的表面MHC-I,从而降低对同种异体CD8+T细胞的免疫原性。靶向转录激活因子样效应物核酸酶(TALEN)的方法已被用于通过缺失B2M基因外显子2中的若干核苷酸来产生B2M缺陷型hESC系(Lu,P.等人,“Generating hypoimmunogenic human embryonic stemcells by the disruption of beta 2-microglobulin,”Stem Cell Rev.2013,9:806-813)。尽管靶向B2M的hESC系表现为表面HLA-I缺陷型的,但发现它们仍然含有B2M和MHC-I的特定mRNA。B2M和MHC-I mRNA以相当于非靶向hESC的水平(组成型和IFN-g诱导的)表达。因此,担心这些靶向TALEN B2M的hESC系可能表达足以引起免疫排斥的残留的细胞表面MHC-I,如用仍表达B2M mRNA的B2M2/2小鼠细胞观察到的那样(Gross,R.和Rappuoli,R.“Pertussis toxin promoter sequences involved in modulation,”Proc Natl AcadSci,1993,90:3913-3917)。尽管没有检查靶向TALEN B2M的hESC系的脱靶裂解事件,但是当使用TALEN时,非特异性裂解的发生仍然是一个重要的问题,这将产生关于其临床使用的主要的安全性问题(Grau,J.等人.“TALENoffer:genome-wide TALEN off-targetprediction,”Bioinformatics,2013,29:2931-2932;Guilinger J.P.等人.“Broadspecificity profiling of TALENs results in engineered nucleases with improvedDNA-cleavage specificity,”Nat Methods 2014,11:429-435)。此外,另一份报告通过敲除第一个B2M等位基因并在第二个B2M等位基因处敲入HLA-E基因,这导致HLA-E二聚体或三聚体的表面表达,而不存在HLA-A、HLA-B或HLA-C的表面表达,产生了逃脱同种异体识别的IPS细胞(Gornalusse,G.G.等人,“HLA-E-expressing pluripotent stem cells escapeallogeneic responses and lysis by NK cells,”Nature Biotechnology,2017,35,765-773)。
上述一些策略的潜在限制是,MHC I类阴性细胞易被自然杀伤(NK)细胞溶解,因为HLA分子是自然杀伤(NK)细胞的主要配体抑制剂。已经显示宿主NK细胞消除移植或植入的B2M-/-供体细胞,并且在MHC I类阴性人类白血病系的情况下在体外发生类似的现象(Bix,M.等人,“Rejection of class I MHC-deficient haemopoietic cells by irradiatedMHC-matched mice,”Nature,1991,349,329-331;Zarcone,D.等人,“Human leukemia-derived cell lines and clones as models for mechanistic analysis of naturalkiller cell-mediated cytotoxicity,”Cancer Res.1987,47,2674-2682)。因此,需要改进以前的方法来产生能够逃避免疫应答的通用供体细胞,以及需要产生能够在植入后存活的细胞。如本文所述,植入后或移植后的细胞存活可以由许多独立于同种异体排斥的其他途径介导,例如缺氧、活性氧、营养剥夺和氧化应激。同样如本文所述,存活因子(基因和/或蛋白质)的遗传引入可以帮助细胞在植入后存活。如本文所述,通用供体细胞系可以组合解决同种异体排斥和植入后存活二者的特性。
概述
在一些方面,本公开内容涵盖遗传修饰的细胞,包含(a)编码中脑星形胶质细胞来源的神经营养因子(MANF)的第一外源多核苷酸插入、编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的第二外源多核苷酸插入、编码分化簇39(CD39)的第三外源多核苷酸插入和/或编码分化簇73(CD73)的第四外源多核苷酸插入,其中遗传修饰的细胞表达CD39、MANF、TNFAIP3和/或CD73;和/或(b)被破坏的编码转化生长因子β(TGFβ)蛋白、β-2-微球蛋白(B2M)蛋白、硫氧还蛋白相互作用蛋白(TXNIP)蛋白和/或II类反式激活因子(CIITA)蛋白的基因,其中遗传修饰的细胞具有TGFβ蛋白、B2M蛋白、TXNIP蛋白和/或CIITA蛋白的被破坏的表达。
在一些方面,本公开内容的遗传修饰的细胞是干细胞、造血干细胞、谱系限制性祖细胞和/或完全分化的体细胞。
在一些方面,本公开内容涵盖多于一种遗传修饰的细胞,包含一种或更多种含有MANF、TNFAIP3、CD39、CD73的外源多核苷酸插入物,和/或一种或更多种被破坏的编码转化生长因子β(TGFβ)蛋白、β-2-微球蛋白(B2M)蛋白、硫氧还蛋白相互作用蛋白(TXNIP)蛋白和/或II类反式激活因子(CIITA)蛋白的基因,其中遗传修饰的细胞具有TGFβ蛋白、B2M蛋白、TXNIP蛋白和/或CIITA蛋白的被破坏的表达。在一些方面,本公开内容涵盖多于一种遗传修饰的细胞,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L-1、CD39和/或CD73。
在一些另外的方面,本公开内容涵盖来源于多于一种遗传修饰的细胞的谱系限制性祖细胞群体(包括但不限于内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞、胰腺内分泌细胞或未成熟β细胞,并且完全分化的体细胞是胰腺β细胞)或完全分化的体细胞群体。在一些方面,本公开内容还涵盖来源于多于一种遗传修饰的细胞的谱系限制性祖细胞群体(包括但不限于内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞、胰腺内分泌细胞或未成熟β细胞,并且完全分化的体细胞是胰腺β细胞)或完全分化的体细胞群体,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L-1、CD39和/或CD73。
在一些方面,本公开内容涵盖包含多于一种遗传修饰的细胞或遗传修饰的细胞的细胞群体的组合物,该组合物包含(a)编码中脑星形胶质细胞来源的神经营养因子(MANF)的第一外源多核苷酸插入、编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的第二外源多核苷酸插入、编码分化簇39(CD39)的第三外源多核苷酸插入和/或编码分化簇73(CD73)的第四外源多核苷酸插入,其中遗传修饰的细胞表达CD39、MANF、TNFAIP3和/或CD73;和/或(b)被破坏的编码转化生长因子β(TGFβ)蛋白、β-2-微球蛋白(B2M)蛋白、硫氧还蛋白相互作用蛋白(TXNIP)蛋白和/或II类反式激活因子(CIITA)蛋白的基因,其中遗传修饰的细胞具有TGFβ蛋白、B2M蛋白、TXNIP蛋白和/或CIITA蛋白的被破坏的表达。
在一些方面,本公开内容还涵盖用于治疗有相应需要的受试者的方法,所述方法包括:(a)获得或已经获得本文公开的多于一种遗传修饰的细胞,其中所述多于一种遗传修饰的细胞包括干细胞;(b)将所述遗传修饰的细胞分化为胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(c)向受试者施用胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
在另外的方面中,本公开内容涵盖用于治疗有相应需要的受试者的方法,所述方法包括:(a)获得或已经获得来源于本文公开的多于一种遗传修饰的细胞的谱系限制性祖细胞或完全分化的体细胞的群体,其中所述谱系限制性祖细胞或完全分化的体细胞包括胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(b)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或β细胞。
在一些方面,本公开内容涵盖用于治疗有相应需要的受试者的方法,所述方法包括:(a)获得或已经获得多于一种遗传修饰的细胞,其中本文公开的多于一种遗传修饰的细胞包括干细胞;(b)将所述遗传修饰的细胞分化为胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(c)向受试者施用胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
尽管本公开内容容易有各种修改和替代形式,但是在附图中通过示例的方式示出了其具体实施方案,并且将在本文详细描述。然而,应该理解,本文给出的附图和详细描述并不旨在将本公开内容限制于所公开的具体实施方案,而是相反,目的是覆盖落入由所附权利要求限定的本公开内容的精神和范围内的所有修改、等同物和替代方案。
参照附图,在本发明实施方案的以下详细描述中,本公开内容的其他特征和优点将变得明显。
附图简述
图1展示了B2M-CAGGS-MANF-P2A-TNFAIP3-P2A-PD-L-1供体载体的质粒图谱。
图2展示了CIITA-CAGGS-CD39供体载体的质粒图谱。
图3展示了B2M-CAGGS-CD39-P2A-PD-L-1供体载体的质粒图谱。
图4展示了B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体载体的质粒图谱。
图5展示了TXNIP-CAGGS-MANF-P2A-HLA-E供体载体的质粒图谱。
图6显示了L3V003B和L3V004B细胞系关于CD39表达的流式细胞术。
图7显示了从野生型(WT)细胞(上图)或X1细胞(即,TXNIP KO/MANF-P2A-HLA-EKI&B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI)分化的PEC和第6阶段(S6)细胞的形态。
图8显示了从野生型(WT)细胞(上图)或X1(“X1”)细胞(即,TXNIP KO/MANF-P2A-HLA-EKI&B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI)分化的PEC和第6阶段(S6)细胞中的选定基因表达。
图9显示了从野生型(WT)细胞或TXNIP KO/MANF-P2A-HLA-E KI&B2MKO/TNFAIP3(A20)-P2A-PD-L-1 KI细胞(L1V028-C3,L1V028-24)分化的PEC细胞中CHGA、PDX1和NKX6.1的流式细胞术。
图10A显示了从野生型(WT)细胞分化的第6阶段(S6)细胞中CHGA、PDX1和NKX6.1的流式细胞术。
图10B显示了从X1细胞(即,TXNIP KO/MANF-P2A-HLA-E KI&B2MKO/TNFAIP3(A20)-P2A-PD-L-1 KI)分化的第6阶段(S6)细胞中CHGA、PDX1和NKX6.1的流式细胞术。
图11显示了在12、16、20、24周,从移植了L1V009B大块细胞(GRP 1)或L1V008克隆分离物(B2M KO/MANF-P2A-TNFAIP3-P2A-PD-L-1 KI;GRP 2和GRP 3)的细胞聚集体或对照细胞(GRP 4)的无胸腺裸大鼠获得的血液样品中的C-肽水平,对于GRP 1-3为腹膜内施用3g/kg葡萄糖后90分钟,并且对于GRP 4为施用后60分钟。
图12显示了在12、16、20、24周,在腹膜内施用3g/kg葡萄糖后90分钟(对于24周读取为60分钟),从移植了来自B2M KO/CD39-P2A-PD-L-1 KI的细胞聚集体或对照细胞的无胸腺裸大鼠获得的血液样品中的C-肽水平。
图13显示了在12周和16周,在葡萄糖刺激后,从移植了含有PEC阶段或第6阶段(S6)的未修饰(NCG)或B2M KO/TNFAIP3-P2A-PD-L-1 KI&TXNIP KO/MANF-P2A-HLA-E KI(X1)的分化的细胞聚集体的囊(capsule)的NSG小鼠获得的血液样品中的C-肽水平。
图14展示了在12、16、20、24周,PEC对照(NCG)和PEC-X1(B2M KO/TNFAIP3-P2A-PD-L-1 KI和TXNIP KO/MANF-P2A-HLA-E KI)组小鼠在葡萄糖刺激后的平均C-肽水平。
图15展示了在12、16和20周时,在移植了包含自未修饰(CON)细胞或B2MKO/TNFAIP3-P2A-PD-L-1 KI&TXNIP KO/MANF-P2A-HLA-E KI(X1)细胞的克隆(即,6D09、6H07和5C10)分化的细胞的囊的NSG小鼠中的C-肽水平。
图16展示了B2M-CAGGS-CD39-P2A-CD73-P2A-PD-L-1供体载体的质粒图谱。
图17显示了L1V017B细胞(即,CD39-P2A-PD-L-1 KI和B2M KO)、L1V018B细胞(即,CD39-P2A-CD73-P2A-PD-L-1 KI和B2M KO)和L1V019B细胞(即,TNFAIP3(A20)-P2A-PD-L-1KI和B2M KO)中SOX17和FOXA2表达的流式细胞术。
图18显示了L1V017B细胞(即,CD39-P2A-PD-L-1 KI和B2M KO)、L1V018B细胞(即,CD39-P2A-CD73-P2A-PD-L-1 KI和B2M KO)和L1V019B细胞(即,TNFAIP3(A20)-P2A-PD-L-1KI和B2M KO)中CHGA、NKX6.1和PDX1表达的流式细胞术。
图19展示了L1V017B细胞(即,CD39-P2A-PD-L-1 KI和B2M KO)、L1V018B细胞(即,CD39-P2A-CD73-P2A-PD-L-1 KI和B2M KO)和L1V019B细胞(即,TNFAIP3(A20)-P2A-PD-L-1KI和B2M KO)中多种标志物的基因表达的时间进程。
图20A显示了TIDE分析,显示X1(B2M KO/TNFAIP3-P2A-PD-L-1 KI&TXNIP KO/MANF-P2A-HLA-E KI)+TGF-β2KO细胞(“L3V002B”)中TGF-β2基因的90% KO,显著的+1和-7编辑导致编码区的移码。
图20B显示了TIDE分析,显示X4(B2M KO/TNFAIP3-P2A-PD-L-1 KI&TXNIP KO/MANF-P2A-HLA-E KI&CIITA KO/CD39 KI)+TGF-β2细胞(“L3V004B”)中TGF-β2基因的90%KO,显著的+1和-7编辑导致编码区的移码。
图21展示了在培养基中存在X1和B2M KO编辑的细胞且存在或不存在TGF-β阻断剂的情况下,使用外周血单个核细胞增殖测定的免疫逃避测定数据。
图22A显示了在含有分化的野生型、V1B(HLA-E KI,TXNIP KO,PD-L-1 KI,B2M KO)和TGF-β2KO PEC细胞的条件培养基中72小时,来自针对分泌的TGF-β2的ELISA测定的数据。
图22B显示了在含有分化的野生型、V1B(HLA-E KI,TXNIP KO,PD-L-1 KI,B2M KO)和TGF-β2KO PEC细胞的条件培养基中72小时,来自针对分泌的TGF-β1的ELISA测定的数据。
图23A提供了V1B和TGF-β2KO PEC细胞分泌TGF-β的数据。
图23B提供了V1B和TGF-β2KO PEC细胞分泌GDF-9的数据。
图23C提供了V1B和TGF-β2KO PEC细胞分泌PDGF-AA的数据。
图24A-图24B显示了使用人类肺成纤维细胞(MRC-5)细胞和来自WT、V1B和X1 PEC细胞(图24A)和WT以及TGF-β2KO PEC细胞(图24B)的条件培养基的成纤维细胞迁移测定。
图25A-图25C显示了使用人类纤维肉瘤(HT1080)细胞和来自WT、V1B和X1 PEC细胞(图25A)、WT和TGF-β2KO PEC细胞(图25B)、以及WT、X4(L3V003B)和X4+TGF-β2KO(L3V004B)PEC细胞(图25C)的条件培养基的成纤维细胞迁移测定。
详述
I.定义
缺失:如本文所用,术语“缺失”可与术语“遗传缺失”或“敲除”互换使用,通常是指通过任何分子生物学方法,例如本文所述的方法,例如通过向基因组DNA的位点递送核酸内切酶和至少一种gRNA来去除基因组DNA的位点或区域的遗传修饰。可以缺失任意数量的核苷酸。在一些实施方案中,缺失包括去除至少一个、至少两个、至少三个、至少四个、至少五个、至少十个、至少十五个、至少二十个或至少25个核苷酸。在一些实施方案中,缺失包括去除10-50、25-75、50-100、50-200或超过100个核苷酸。在一些实施方案中,缺失包括部分或整个去除一个靶基因,例如B2M基因、TXNIP基因、CIITA基因或TGF-β2基因。在一些实施方案中,缺失包括部分或整个去除两个靶基因、三个靶基因或四个靶基因。在一些实施方案中,去除部分靶基因是指去除基因的全部或部分启动子和/或编码序列。在一些实施方案中,缺失包括移除靶基因的转录调节因子,例如启动子区域。在一些实施方案中,缺失包括去除全部或部分编码区,使得通常由编码区表达的产物不再表达、以截短形式表达或以降低的水平表达。在一些实施方案中,缺失导致基因相对于未修饰细胞的表达降低。在一些实施方案中,缺失导致基因相对于未修饰细胞的表达缺失。
破坏:如本文所用,术语“破坏(disruption)”、“破坏(disrupting)”或“破坏的”是指改变靶基因表达水平的遗传修饰。在一些方面,破坏可以是由于靶基因内或附近的至少一个核苷酸的缺失,或者靶基因的部分或全部缺失,如上所述。在其他方面,破坏也可以是由于在靶基因内或附近至少一个核苷酸的取代和/或至少一个核苷酸的插入。在另外的方面中,破坏可以是由于在靶基因内或附近插入一个或更多个外源多核苷酸。通常,如本文所用,被破坏的表达是指靶基因表达的减少或消除。在一些实施方案中,破坏可以是表达水平的降低(例如,表达低于未修饰的细胞的水平的30%、低于25%、低于20%、低于10%或低于5%)。在一些实施方案中,破坏可以是消除表达(例如,没有表达或检测不到RNA和/或蛋白质表达的水平)。可以使用任何标准的基于RNA、基于蛋白质和/或基于抗体的检测方法(例如,RT-PCR、ELISA、流式细胞术、免疫细胞化学等)来测量表达。可检测水平被定义为高于检测限(LOD),检测限是通过给定的检测方法可以测量(检测)到的具有统计显著性的最低浓度。
核酸内切酶:如本文所用,术语“核酸内切酶”通常是指裂解多核苷酸内的磷酸二酯键的酶。在一些实施方案中,核酸内切酶特异性裂解DNA多核苷酸内的磷酸二酯键。在一些实施方案中,核酸内切酶是锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、归巢核酸内切酶(HE)、兆核酸酶(meganuclease)、MegaTAL或CRISPR相关的核酸内切酶。在一些实施方案中,核酸内切酶是RNA引导的核酸内切酶。在某些方面,RNA引导的核酸内切酶是CRISPR核酸酶,例如II型CRISPR Cas9核酸内切酶或V型CRISPR Cpf1核酸内切酶。在一些实施方案中,核酸内切酶是Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4或Cpf1核酸内切酶,或其同源物,其天然存在的分子的重组,其密码子优化形式,或其修饰形式,或其组合。在一些实施方案中,核酸内切酶可以引入一个或更多个单链断裂(SSB)和/或一个或更多个双链断裂(DSB)。
外源的:本文中使用的术语“外源的”是指来源于受体细胞或生物体外部的多核苷酸序列,在受体细胞或生物体外部组装的多核苷酸序列,或来源于受体细胞或生物体但在天然存在的位置以外的位置整合到受体基因组中的多核苷酸序列。外源多核苷酸序列可以包含基因序列,可以包含基因的编码序列(CDS),可以包含来自一个以上基因的编码序列,可以包含启动子序列、增强子序列和/或其他调节元件,可以包含核糖体跳跃序列,和/或可以包含人工序列。外源多核苷酸可以进行密码子优化,以确保在受体细胞或生物体中的有效翻译。
遗传修饰:如本文所用,术语“遗传修饰”通常是指已经使用任何分子生物学方法,例如本文所述的方法,例如通过将核酸内切酶和至少一种gRNA递送到基因组DNA的位点进行遗传编辑或操纵的基因组DNA位点。示例性遗传修饰包括插入、缺失、重复、倒位和易位,以及它们的组合。在一些实施方案中,遗传修饰是缺失。在一些实施方案中,遗传修饰是插入。在其他实施方案中,遗传修饰是插入-缺失突变(或插入缺失(indel)),使得靶基因的阅读框被移位,导致改变的基因产物或没有基因产物。
引导RNA(gRNA):如本文所用,术语“引导RNA”或“gRNA”通常是指能够与核酸内切酶相互作用(例如结合)并与靶基因组位点或区域结合或杂交的短核糖核酸。在一些实施方案中,gRNA是单分子引导RNA(sgRNA)。在一些实施方案中,gRNA可以包含间隔子延伸区。在一些实施方案中,gRNA可以包含tracrRNA延伸区。在一些实施方案中,gRNA是单链的。在一些实施方案中,gRNA包含天然存在的核苷酸。在一些实施方案中,gRNA是化学修饰的gRNA。在一些实施方案中,化学修饰的gRNA是包含至少一个具有化学修饰(例如,2’-O-甲基糖修饰)的核苷酸的gRNA。在一些实施方案中,化学修饰的gRNA包含修饰的核酸主链。在一些实施方案中,化学修饰的gRNA包含2’-O-甲基-硫代磷酸酯残基。在一些实施方案中,gRNA可以与DNA核酸内切酶预复合。
插入:如本文所用,术语“插入”可与术语“遗传插入”或“敲入”互换使用,通常指的是其中通过任何分子生物学方法,例如本文所述的方法,例如通过将核酸内切酶和至少一种gRNA递送到基因组DNA的位点来将多核苷酸引入或添加到基因组DNA的位点或区域的遗传修饰。在一些实施方案中,外源多核苷酸的插入发生在靶基因内或附近。在一些实施方案中,外源多核苷酸的插入可以发生在基因组DNA的位点内或附近,该位点已经是先前遗传修饰例如缺失或插入-缺失突变的位点。在一些实施方案中,插入发生在部分重叠、完全重叠或被包含在先前遗传修饰(例如缺失或插入-缺失突变)的位点内的基因组DNA位点处。在一些实施方案中,插入同时导致在插入的靶位点处的基因破坏。在一些实施方案中,插入发生在安全港基因座处。在一些实施方案中,插入包括引入编码感兴趣的蛋白质的多核苷酸。在一些实施方案中,插入包括引入编码致耐受性因子的多核苷酸。在一些实施方案中,插入包括引入编码存活因子的多核苷酸。在一些实施方案中,插入包括引入编码MANF、TNFAIP3、CD39、CD73、PD-L-1和/或HLA-E的多核苷酸。在一些实施方案中,插入包括引入外源启动子,例如组成型启动子,例如CAG或CAGGS启动子。在一些实施方案中,插入包括引入编码非编码基因的多核苷酸。通常,待插入的多核苷酸的侧翼是在插入位点处或附近与基因组DNA具有实质性序列同源性的序列(例如,同源臂)。
主要组织相容性复合体I类(MHC-I):如本文所用,术语“主要组织相容性复合体I类”或“MHC-I”通常是指在脊椎动物(包括哺乳动物,例如人类)的所有有核细胞的细胞表面上发现;并且具有从细胞内(即胞质)向细胞毒性T细胞(例如CD8+T细胞)展示非自身或外来抗原(例如蛋白质)的肽的功能,以便刺激免疫应答的一类生物分子。在一些实施方案中,MHC-I生物分子是MHC-I基因或MHC-I蛋白。MHC-I蛋白与β-2微球蛋白(B2M)蛋白的复合是所有MHC-I蛋白的细胞表面表达所必需的。在一些实施方案中,相对于未修饰的细胞降低MHC-I人类白细胞抗原(HLA)的表达包括MHC-I基因表达降低(或减少)。在一些实施方案中,相对于未修饰的细胞降低MHC-I人类白细胞抗原(HLA)的表达包括MHC-I蛋白的细胞表面表达的降低(或减少)。在一些实施方案中,MHC-I生物分子是HLA-A(NCBI基因ID号:3105)、HLA-B(NCBI基因ID号:3106)、HLA-C(NCBI基因ID号:3107)或B2M(NCBI基因ID号:567)。
主要组织相容性复合体II类(MHC-II):如本文所用,术语“主要组织相容性复合体II类”或“MHC-II”通常是指通常在脊椎动物(包括哺乳动物,例如人类)的抗原呈递细胞的细胞表面上发现;并且具有从细胞的外部(细胞外)向细胞毒性T细胞(例如CD8+T细胞)展示非自身或外来抗原(例如蛋白质)的肽的功能,以便刺激免疫应答的一类生物分子。在一些实施方案中,抗原呈递细胞是树突状细胞、巨噬细胞或B细胞。在一些实施方案中,MHC-II生物分子是MHC-II基因或MHC-II蛋白。在一些实施方案中,相对于未修饰的细胞降低MHC-II人类白细胞抗原(HLA)的表达包括MHC-II基因的表达降低(或减少)。在一些实施方案中,相对于未修饰的细胞降低MHC-II人类白细胞抗原(HLA)的表达包括MHC-II蛋白的细胞表面表达的降低(或减少)。在一些实施方案中,MHC-II生物分子是HLA-DPA(NCBI基因ID号:3113)、HLA-DPB(NCBI基因ID号:3115)、HLA-DMA(NCBI基因ID号:3108)、HLA-DMB(NCBI基因ID号:3109)、HLA-DOA(NCBI基因ID号:3111)、HLA-DOB(NCBI基因ID号:3112)、HLA-DQA(NCBI基因ID号:3117)、HLA-DQB(NCBI基因ID号:3119)、HLA-DRA(NCBI基因ID号:3122)或HLA-DRB(NCBI基因ID号:3123)。
多核苷酸:如本文所用,术语“多核苷酸”可与术语“核酸”互换使用,通常是指包含两个或更多个核苷酸的生物分子。在一些实施方案中,多核苷酸包含至少两个、至少五个、至少十个、至少二十个、至少30个、至少40个、至少50个、至少100个、至少200个、至少250个、至少500个或任何数量的核苷酸。例如,多核苷酸可以包含至少500个核苷酸、至少约600个核苷酸、至少约700个核苷酸、至少约800个核苷酸、至少约900个核苷酸、至少约1000个核苷酸、至少约2000个核苷酸、至少约3000个核苷酸、至少约4000个核苷酸、至少约4500个核苷酸或至少约5000个核苷酸。多核苷酸可以是DNA或RNA分子或杂合DNA/RNA分子。多核苷酸可以是单链或双链的。在一些实施方案中,多核苷酸是基因组DNA的位点或区域。在一些实施方案中,多核苷酸是包含在未修饰的细胞或通用供体细胞基因组中的内源性基因。在一些实施方案中,多核苷酸是未整合到基因组DNA中的外源多核苷酸。在一些实施方案中,多核苷酸是整合到基因组DNA中的外源多核苷酸。在一些实施方案中,多核苷酸是质粒或腺相关病毒载体。在一些实施方案中,多核苷酸是环状或线性分子。
安全港基因座:如本文所用,术语“安全港基因座”通常是指能够容纳遗传插入到其中,而不会对细胞产生不利影响的基因组DNA的任何位置、位点或区域。在一些实施方案中,安全港基因座是基因内或基因外区域。在一些实施方案中,安全港基因座是通常转录沉默的基因组DNA区域。在一些实施方案中,安全港基因座是AAVS1(PPP1 R12C)、ALB、Angptl3、ApoC3、ASGR2、CCR5、FIX(F9)、G6PC、Gys2、HGD、Lp(a)、Pcsk9、Serpina1、TF或TTR基因座。在一些实施方案中,安全港基因座描述于Sadelain,M.等人,“Safe harbours forthe integration of new DNA in the human genome,”Nature Reviews Cancer,2012,Vol 12,第51-58页。
安全开关:如本文所用,术语“安全开关”通常是指导致细胞经历凋亡的生物分子。在一些实施方案中,安全开关是蛋白质或基因。在一些实施方案中,安全开关是自杀基因。在一些实施方案中,安全开关,例如单纯疱疹病毒胸苷激酶(HSV-tk),通过代谢前药,例如更昔洛韦,导致细胞经历凋亡。在一些实施方案中,安全开关的过表达存在(overexpressedpresence of a safety switch)本身导致细胞经历凋亡。在一些实施方案中,安全开关是基于p53的分子、HSV-tk或诱导型胱天蛋白酶-9。
受试者:如本文使用的,术语“受试者”指哺乳动物。在一些实施方案中,受试者是非人类灵长类动物或啮齿动物。在一些实施方案中,受试者是人类。在一些实施方案中,受试者患有疾病或紊乱、被怀疑患有疾病或紊乱或处于疾病或紊乱的风险中。在一些实施方案中,受试者具有疾病或紊乱的一种或更多种症状。
存活因子:如本文所用,术语“存活因子”通常是指当在细胞中增加或减少时,使细胞,例如,通用供体细胞能够在移植或植入到宿主受试者中后以相对于未修饰的细胞更高的存活率存活的蛋白质(例如,由本文所述的多核苷酸表达)。在一些实施方案中,存活因子是人类存活因子。在一些实施方案中,存活因子是参与细胞存活的关键途径的成员。在一些实施方案中,参与细胞存活的关键途径涉及缺氧、活性氧、营养剥夺和/或氧化应激。在一些实施方案中,至少一种存活因子的遗传修饰,例如缺失或插入,使得通用供体细胞能够在植入后比未修饰的细胞存活更长的时间,例如至少1.05倍、至少1.1倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、至少20倍或至少50倍更长的时间。在一些实施方案中,存活因子是MANF(NCBI基因ID号:7873)、ZNF143(NCBI基因ID号:7702)、TXNIP(NCBI基因ID号:10628)、FOXO1(NCBI基因ID号:2308)或JNK(NCBI基因ID号:5599)。在一些实施方案中,存活因子被插入细胞,例如通用供体细胞。在一些实施方案中,从细胞,例如通用供体细胞缺失存活因子。在一些实施方案中,编码MANF的多核苷酸的插入使得细胞,例如通用供体细胞能够在移植或植入到宿主受试者中后以相对于未修饰的细胞更高的存活率存活。在一些实施方案中,TXNIP基因内或附近的缺失或插入-缺失突变使得细胞,例如,通用供体细胞能够在移植或植入到宿主受试者中后以相对于未修饰的细胞更高的存活率存活。
致耐受性因子:如本文所用,术语“致耐受性因子”通常是指当在细胞中增加或减少时,使细胞,例如,通用供体细胞在移植或植入到宿主受试者中后能够以相对于未修饰的细胞更高的比率(rate)抑制或逃避免疫排斥的蛋白质(例如,由本文所述的多核苷酸表达)。在一些实施方案中,致耐受性因子是人类致耐受性因子。在一些实施方案中,至少一种致耐受性因子的遗传修饰(例如,至少一种致耐受性因子的插入或缺失)使得细胞,例如通用供体细胞在植入后以比未修饰细胞高至少1.05倍、至少1.1倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、至少20倍或至少50倍的比率抑制或逃避免疫排斥。在一些实施方案中,致耐受性因子是TNFAIP3(NCBI基因ID号:7128)、CD39(NCBI基因ID号:953)、CD73(NCBI基因ID号4907)、PD-L-1(NCBI基因ID号:29126)、HLA-E(NCBI基因ID号:3133)、HLA-G(NCBI基因ID号:3135)、CTLA-4(NCBI基因ID号:1493)或CD47(NCBI基因ID号:961)。在一些实施方案中,将致耐受性因子插入细胞,例如通用供体细胞。在一些实施方案中,从细胞,例如,通用供体细胞缺失致耐受性因子。在一些实施方案中,编码TNFAIP3、CD39、CD73、HLA-E、PD-L-1、HLA-G、CTLA-4和/或CD47的多核苷酸的插入使得细胞,例如,通用供体细胞在移植或植入到宿主受试者中后能够抑制或逃避免疫排斥。
MHC-I或MHC-II的转录调节因子:如本文所用,术语“MHC-I或MHC-II的转录调节因子”通常指调节,例如增加或减少MHC-I和/或MHC-II人类白细胞抗原表达的生物分子。在一些实施方案中,生物分子是多核苷酸,例如基因或蛋白质。在一些实施方案中,MHC-I或MHC-II的转录调节因子将增加或减少至少一种MHC-I或MHC-II蛋白的细胞表面表达。在一些实施方案中,MHC-I或MHC-II的转录调节因子将增加或减少至少一种MHC-I或MHC-II基因的表达。在一些实施方案中,转录调节因子是CIITA(NCBI基因ID号:4261)或NLRC5(NCBI基因ID号:84166)。在一些实施方案中,CIITA或NLRC5表达的缺失或减少降低了至少一种MHC-I或MHC-II基因的表达。
通用供体细胞:如本文所用,术语“通用供体细胞”通常是指相对于未修饰的细胞,在细胞移植期间较不易发生同种异体排斥和/或在移植后表现出增加的存活的遗传修饰的细胞。在一些实施方案中,本文所述的遗传修饰的细胞是通用供体细胞。在一些实施方案中,与未修饰的细胞相比,通用供体细胞具有增加的免疫逃避和/或移植后存活。在一些实施方案中,与未修饰的细胞相比,通用供体细胞具有增加的细胞存活。在一些实施方案中,通用供体细胞可以是干细胞。在一些实施方案中,通用供体细胞可以是胚胎干细胞(ESC)、成体干细胞(ASC)、诱导多能干细胞(iPSC)或造血干细胞或祖细胞(HSPC)(也称为造血干细胞(HSC))。在一些实施方案中,通用供体细胞可以是分化的细胞。在一些实施方案中,通用供体细胞可以是体细胞(例如,免疫系统细胞)。在一些实施方案中,向受试者施用通用供体细胞。在一些实施方案中,通用供体细胞被施用至患有疾病、被怀疑患有疾病或处于疾病风险中的受试者。在一些实施方案中,通用供体细胞能够分化成谱系限制性祖细胞或完全分化的体细胞。在一些实施方案中,谱系限制性祖细胞是胰腺内胚层祖细胞、胰腺内分泌祖细胞、间充质祖细胞、肌肉祖细胞、母细胞、造血祖细胞或神经祖细胞。在一些实施方案中,完全分化的体细胞是内分泌细胞(endocrine secretory cell)诸如胰腺β细胞、上皮细胞、内胚层细胞、巨噬细胞、肝细胞、脂肪细胞、肾细胞、血细胞或免疫系统细胞。在一些实施方案中,完全分化的体细胞是心肌细胞。
未修饰的细胞:如本文所用,术语“未修饰的细胞”是指未进行涉及编码MHC-I、MHC-I、MHC-I或MHC-II的转录调节因子、存活因子和/或致耐受性因子的多核苷酸或基因的遗传修饰的细胞。在一些实施方案中,未修饰的细胞可以是干细胞。在一些实施方案中,未修饰的细胞可以是胚胎干细胞(ESC)、成体干细胞(ASC)、诱导多能干细胞(iPSC)或造血干细胞或祖细胞(HSPC)(也称为造血干细胞(HSC))。在一些实施方案中,未修饰的细胞可以是分化的细胞。在一些实施方案中,未修饰的细胞可以选自体细胞(例如,免疫系统细胞,例如T细胞,例如CD8+T细胞)。如果将通用供体细胞“相对于未修饰的细胞”进行比较,则通用供体细胞和未修饰的细胞是相同的细胞类型或共有共同的亲本细胞系,例如,将通用供体iPSC相对于未修饰的iPSC进行比较。
基因内或附近:如本文所用,术语“基因内或附近”是指为所述基因的内含子或外显子组分或位于所述基因的近端的基因组DNA的位点或区域。在一些实施方案中,如果基因组DNA的位点包含所述基因的内含子或外显子的至少一部分,则该位点在基因内。在一些实施方案中,位于基因附近的基因组DNA的位点可以在所述基因的5’或3’末端(例如,所述基因编码区的5’或3’末端)。在一些实施方案中,位于基因附近的基因组DNA的位点可以是调节所述基因表达的启动子区域或阻遏物区域。在一些实施方案中,位于基因附近的基因组DNA的位点可以与所述基因在同一染色体上。在一些实施方案中,如果基因组DNA的位点或区域在所述基因的5’或3’末端(例如,所述基因编码区的5’或3’末端)的50Kb、40Kb、30Kb、20Kb、10Kb、5Kb、1 Kb内,或者更靠近所述基因的5’或3’末端(例如,所述基因编码区的5’或3’末端),则该位点或区域在所述基因附近。
如本文所使用的,术语“包含(comprising)”或“包含(comprises)”是包容性的或开放式的,并且不排除另外的、未列举的要素、成分或方法步骤;短语“由…组成(consisting of)”或“由…组成(consists of)”是封闭式的,并且不包括任何未指定的要素、步骤或成分;并且短语“基本上由...组成(consisting essentially of)”或“基本上由…组成(consists essentially)”意味着可以存在特定的其他组分,即那些不会实质性影响化合物、组合物或方法的基本特性的组分。当在序列的上下文中使用时,短语“基本上由…组成(consisting essentially of)”或“基本上由…组成(consists essentially)”意味着序列可以包含不改变序列的基本功能或性质的取代和/或另外的序列。
II.逃避免疫应答和提高存活的策略
本文描述了使遗传修饰的细胞,即通用供体细胞,在植入到受试者中后增加其存活或生存力和/或逃避免疫应答的策略。在一些实施方案中,这些策略使得通用供体细胞能够以比未修饰的细胞更高的成功率存活和/或逃避免疫应答。在一些实施方案中,遗传修饰的细胞包括在编码存活因子的至少一个基因内或附近处引入至少一种遗传修饰,其中所述遗传修饰包括插入编码致耐受性因子的多核苷酸。通用供体细胞还可以在编码一种或更多种MHC-I或MHC-II人类白细胞抗原或MHC-I或MHC-II复合体的组分或转录调节因子的基因内或附近处包含至少一种遗传修饰,其中所述遗传修饰包括插入编码第二致耐受性因子的多核苷酸。
在一些实施方案中,遗传修饰的细胞包括在至少一个基因内或附近处引入相对于未修饰的细胞降低一种或更多种MHC-I和MHC-II人类白细胞抗原的表达的至少一种遗传修饰;相对于未修饰的细胞增加编码致耐受性因子的至少一种多核苷酸的表达的至少一种遗传修饰;和相对于未修饰的细胞改变编码存活因子的至少一种基因的表达的至少一种遗传修饰。在其他实施方案中,遗传修饰的细胞包含在至少一个基因内或附近处的相对于未修饰细胞改变一种或更多种MHC-I和MHC-II人类白细胞抗原的表达的至少一个缺失或插入-缺失突变;和在与改变一种或更多种MHC-I和MHC-II HLA的表达的基因缺失的位点部分重叠、完全重叠或包含在该位点内的位点处的编码至少一种致耐受性因子的多核苷酸的至少一个插入。在又其他实施方案中,遗传修饰的细胞包含相对于未修饰的细胞改变编码存活因子的至少一种基因的表达的至少一种遗传修饰。
编码主要组织相容性复合体(MHC)的基因位于人类染色体6p21上。由MHC基因编码的所得蛋白是细胞移植期间供体相容性必需的一系列表面蛋白。MHC基因分为MHC I类(MHC-I)和MHC II类(MHC-II)。MHC-I基因(HLA-A、HLA-B和HLA-C)在几乎所有组织细胞类型中表达,向CD8+T细胞呈递“非自身”抗原加工肽,从而促进其活化为溶细胞性CD8+T细胞。表达“非自身”MHC-I分子的移植或植入细胞将引起针对这些细胞的稳健的细胞免疫应答,并最终通过活化的溶细胞性CD8+T细胞导致这些细胞的死亡。MHC-I蛋白与内质网中的B2M密切相关,B2M是在细胞表面形成功能性MHC-I分子所必需的。此外,有三种非典型的MHC-Ib分子(HLA-E、HLA-F、HLA-G),它们具有免疫调节功能。MHC-II生物分子包括HLA-DP、HLA-DM、HLA-DOA、HLA-DOB、HLA-DQ和HLA-DR。由于它们在免疫应答中的主要功能,MHC-I和MHC-II生物分子有助于在非宿主细胞的细胞植入,例如用于再生医学目的的细胞植入后的免疫排斥。
MHC-I细胞表面分子由MHC编码的重链(HLA-A、HLA-B或HLA-C)和不变的亚基B2M组成。因此,细胞内B2M浓度的降低允许降低MHC-I细胞表面分子的细胞表面表达的有效方法。
在一些实施方案中,细胞包含一个或更多个MHC-I或MHC-II基因的基因组修饰。在一些实施方案中,细胞包含调节MHC-I和/或MHC-II表达的一个或更多个多核苷酸序列的基因组修饰。在一些实施方案中,使用任何基因编辑方法进行本公开内容的遗传修饰,包括但不限于本文描述的那些方法。
在一些实施方案中,相对于未修饰的细胞降低一种或更多种MHC-I和MHC-II人类白细胞抗原的表达通过直接靶向MHC-I和/或MHC-II基因,例如其中的至少一个碱基对的遗传缺失和/或插入来实现。在一些实施方案中,相对于未修饰的细胞降低一种或更多种MHC-I和MHC-II人类白细胞抗原的表达通过靶向CIITA基因例如遗传缺失来实现。在一些实施方案中,相对于未修饰的细胞降低一种或更多种MHC-I和MHC-II人类白细胞抗原的表达通过靶向MHC-I或MHC-II的至少一种转录调节因子例如遗传缺失来实现。在一些实施方案中,MHC-I或MHC-II的转录调节因子是NLRC5或CIITA基因。在一些实施方案中,MHC-I或MHC-II的转录调节因子是RFX5、RFXAP、RFXANK、NFY-A、NFY-B、NFY-C、IRF-1和/或TAP1基因。
在一些实施方案中,细胞的基因组已经被修饰以缺失全部或部分HLA-A、HLA-B和/或HLA-C基因。在一些实施方案中,细胞的基因组已经被修饰以缺失HLA-A、HLA-B和/或HLA-C基因的全部或部分启动子区域。在一些实施方案中,细胞的基因组已经被修饰以缺失全部或部分编码MHC-I或MHC-II的转录调节因子的基因。在一些实施方案中,细胞的基因组已经被修饰以缺失编码MHC-I或MHC-II的转录调节因子的基因的全部或部分启动子区域。
在一些实施方案中,细胞的基因组已被修饰以破坏或降低β-2-微球蛋白(B2M)(也称为β2微球蛋白、B2微球蛋白或IMD43)的表达。B2M是一种非多态性基因,编码所有多态性MHC I类重链表面表达所需的共同蛋白亚基。HLA-I蛋白与内质网中的B2M密切相关,B2M是形成功能性细胞表面表达的HLA-I分子所必需的。在一些实施方案中,gRNA靶向B2M基因内包含5’-GCTACTCTCTCTTTCTGGCC-3’序列(SEQ ID NO:1)的位点。在一些实施方案中,gRNA靶向B2M基因内包含5’-GGCCGAGATGTCTCGCTCCG-3’序列(SEQ ID NO:2)的位点。在一些实施方案中,gRNA靶向B2M基因内包含5’-CGCGAGCACAGCTAAGGCCA-3’序列(SEQ ID NO:3)的位点。在替代实施方案中,gRNA靶向B2M基因内包含以下序列中的任一个的位点:5’-TATAAGTGGAGGCGTCGCGC-3’(SEQ ID NO:4)、5’-GAGTAGCGCGAGCACAGCTA-3’(SEQ ID NO:5)、5’-ACTGGACGCGTCGCGCTGGC-3’(SEQ ID NO:6)、5’-AAGTGGAGGCGTCGCGCTGG-3’(SEQ ID NO:7)、5-GGCCACGGAGCGAGACATCT-3’(SEQ ID NO:8)、5’-GCCCGAATGCTGTCAGCTTC-3’(SEQ IDNO:9)、5’-CTCGCGCTACTCTCTCTTTC-3’(SEQ ID NO:10)、5’-TCCTGAAGCTGACAGCATTC-3’(SEQID NO:11)、5’-TTCCTGAAGCTGACAGCATT-3’(SEQ ID NO:12)或5’-ACTCTCTCTTTCTGGCCTGG-3’(SEQ ID NO:13)。在一些实施方案中,gRNA包含SEQ ID NO:2的多核苷酸序列的RNA形式。在其他实施方案中,gRNA包含SEQ ID NO:1或3-13的任一种的RNA形式。gRNA/CRISPR核酸酶复合体靶向并裂解B2M基因座中的靶位点。NHEJ对双链断裂的修复可能导致至少一个核苷酸的缺失和/或至少一个核苷酸的插入,从而破坏或消除B2M的表达。可选地,B2M基因座可以被至少两个CRISPR系统靶向,每个CRISPR系统包含不同的gRNA,使得B2M基因座中两个位点处的裂解导致两个切口之间的序列缺失,从而消除B2M的表达。
在一些实施方案中,遗传修饰的细胞包含至少一种遗传修饰,其相对于未修饰的细胞破坏编码存活因子诸如TXNIP的至少一种基因的表达。在一些实施方案中,细胞的基因组已经被修饰以降低硫氧还蛋白相互作用蛋白(TXNIP)的表达,该蛋白也被称为EST01027、HHCPA78、THIF、VDUP1或ARRDC6。TXNIP是参与氧化还原调节的代谢基因,也可以作为肿瘤抑制因子。TXNIP的下调或敲除可以保护细胞免受代谢应激。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-GAAGCGTGTCTTCATAGCGC-3’序列(SEQ ID NO:32)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-TTACTCGTGTCAAAGCCGTT-3’序列(SEQ ID NO:33)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-TGTCAAAGCCGTTAGGATCC-3’序列(SEQ ID NO:34)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-GCCGTTAGGATCCTGGCTTG-3’序列(SEQ ID NO:35)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-GCGGAGTGGCTAAAGTGCTT-3’序列(SEQ ID NO:36)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-TCCGCAAGCCAGGATCCTAA-3’序列(SEQ ID NO:37)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-GTTCGGCTTTGAGCTTCCTC-3’序列(SEQ ID NO:38)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-GAGATGGTGATCATGAGACC-3’序列(SEQ ID NO:39)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-TTGTACTCATATTTGTTTCC-3’序列(SEQ ID NO:40)的位点。在一些实施方案中,gRNA靶向TXNIP基因内包含5’-AACAAATATGAGTACAAGTT-3’序列(SEQ ID NO:41)的位点。在一些实施方案中,gRNA包含SEQ IN NO:37的多核苷酸序列的RNA形式。在其他实施方案中,gRNA包含SEQ ID NO:32-36或38-41的任一种的RNA形式。gRNA/CRISPR核酸酶复合体靶向并裂解TXNIP基因座中的靶位点。NHEJ对双链断裂的修复可能导致至少一个核苷酸的缺失和/或至少一个核苷酸的插入,从而破坏或消除TXNIP的表达。可选地,将编码外源基因的多核苷酸插入到TXNIP基因座中可以破坏或消除TXNIP的表达。
在一些实施方案中,细胞的基因组已经被修饰以破坏II类反式激活因子(CIITA)的表达,CIITA也被称为C2TA、CIITAIV、MHC2TA、NLRA或II类主要组织相容性复合体反式激活因子。CIITA是主要组织相容性复合体(MHC)基因表达的主要调节因子。CIITA是核苷酸结合结构域(NBD)富含亮氨酸重复序列(LRR)蛋白质家族的成员,并且通过与MHC增强体(enhanceosome)缔合来调节MHC-II的转录。CIITA的表达在B细胞和树突状细胞中根据发育阶段被诱导,并且在大多数细胞类型中可被IFN-γ诱导。在一些实施方案中,gRNA靶向CIITA基因内包含5’-GGTCCATCTGGTCATAGAAG-3’(SEQ ID NO:25)的位点。在一些实施方案中,gRNA靶向CIITA基因内包含5’-GCTCCAGGTAGCCACCTTCT-3’(SEQ ID NO:48)的位点。在一些实施方案中,gRNA靶向CIITA基因内包含5’-TAGGGGCCCCAACTCCATGG-3’(SEQ ID NO:49)的位点。在一些实施方案中,gRNA靶向CIITA基因内包含5’-GGCTTATGCCAATATCGGTG-3’(SEQID NO:50)的位点。在一些实施方案中,gRNA靶向CIITA基因内包含5’-AGGTGATGAAGAGACCAGGG-3’(SEQ ID NO:51)的位点。在一些实施方案中,gRNA包含SEQ IDNO:25的序列的RNA形式。gRNA/CRISPR核酸酶复合体靶向并裂解CIITA基因座中的靶位点。NHEJ对双链断裂的修复可能导致至少一个核苷酸的缺失和/或至少一个核苷酸的插入,从而破坏或消除CIITA的表达。可选地,将编码外源基因的多核苷酸插入到CIITA基因座中可以破坏或消除CIITA的表达。
在一些实施方案中,细胞的基因组已被修饰以破坏TGF-β2的表达,TGF-β2也称为TGFB2、转化生长因子β2、胶质母细胞瘤来源的T细胞抑制因子、转化生长因子β-2前蛋白前转化生长因子β-2、Cetermin、G-TSF、转化生长因子β-2、BSC-1细胞生长抑制剂3、TGF-β2、Polyergin、LDS4。该基因编码TGF-β2蛋白超家族的分泌配体。TGF-β2是成纤维细胞的关键活化剂,成纤维细胞是纤维化反应的中心效应物,并且也促进免疫和血管细胞的成纤维表型。破坏TGF-β2表达可改进植入的通用供体细胞的长期存活。在一些实施方案中,细胞的基因组已被修饰以破坏TGF-β2基因。gRNA靶向TGF-β2基因中包含5’-GTTCATGCGCAAGAGGATCG-3’(SEQ ID NO:57)的位点。gRNA/CRISPR核酸酶复合体靶向并裂解TGF-β2基因座中的靶位点。NHEJ对双链断裂的修复可能导致至少一个核苷酸的缺失和/或至少一个核苷酸的插入,从而破坏或消除TGF-β2的表达。可选地,将编码外源基因的多核苷酸插入到TGF-β2基因座中可以破坏或消除TGF-β2的表达。
在一些实施方案中,细胞的基因组已经被修饰以降低NLR家族含CARD结构域5(NLRC5)的表达。NLRC5是MHC-I介导的免疫应答的关键调节因子,并且与CIITA相似,NLRC5可被IFN-γ高度诱导并能易位到细胞核中。NLRC5活化MHC-I基因的启动子,并诱导MHC-I以及参与MHC-I抗原呈递的相关基因的转录。
在一些实施方案中,编码一种或更多种致耐受性因子的多核苷酸可以插入细胞,例如遗传修饰或未遗传修饰的细胞,以产生免疫赦免的通用供体细胞。示例性致耐受性因子包括但不限于TNFAIP3、CD39、PD-L-1、HLA-E、CD73、HLA-C、HLA-F、HLA-G、CTLA-4-Ig、CD47、CI-抑制剂和IL-35中的一种或更多种。在一些实施方案中,致耐受性因子是TNFAIP3或A20,也称为OTUD7C、TNFAIP2、AISBL或TNFα诱导蛋白3。TNFAIP3或A20是炎症和免疫的关键调节因子,并且已知抑制NF-κB活化以及TNF介导的凋亡。在一些实施方案中,致耐受性因子是CD39,其也被称为ENTPD1(外核苷三磷酸二磷酸氢化酶-1)、NTPD酶1、ATPD酶或SPG64。虽然CD39是一种致耐受性因子,但它也可以通过增加血管生成、抗炎活性和/或其他方式提供益处。在一些实施方案中,致耐受性因子是PD-L-1(程序性死亡配体1),也称为分化簇274(CD274)、B7同源物(B7-H、B7H1)、PDCD1L1、PDCD1LG1或PDL1。PD-L-1表现为在抑制免疫系统的适应性臂中起主要作用,并被认为是免疫应答的共抑制因子。在一些实施方案中,致耐受性因子是HLA-E,也称为EA1.2、EA2.1、HLA-6.2、MHC、QA1或I类主要组织相容性复合体E。HLA-E是自然杀伤(NK)和细胞毒性T淋巴细胞(CTL)活化和抑制功能的重要调节剂。在一些实施方案中,致耐受性因子是CD73,也称为5’-核苷酸酶胞外(NT5E)、5’-核苷酸酶(5’-NT)、胞外-5’-核苷酸酶、ENT、EN、NT5、NTE或E5NT。CD73是一种质膜蛋白,催化AMP转化为腺苷。CD73衍生的腺苷通过活化树突状细胞(DC)上的A2b受体促进DC的异常分化,从而促进致耐受性表型,其特征是增加IL-6、IL-10、VEGF和IL-8的产生以及免疫抑制蛋白如IDO、TGF-β、精氨酸酶2和COX2的表达。在一些实施方案中,遗传修饰,例如插入编码至少一种致耐受性因子的至少一种多核苷酸,使得通用供体细胞在植入后能够以比未修饰的细胞高至少1.05、至少1.1、至少1.25、至少1.5、至少2、至少3、至少4、至少5、至少10、至少20或至少50倍的比率抑制或逃避免疫排斥。在一些实施方案中,编码TNFAIP3、CD39、PD-L-1、HLA-E、CD73、HLA-G、CTLA-4和/或CD47的多核苷酸的插入使得通用供体细胞在移植或植入到宿主受试者中后能够抑制或逃避免疫排斥。
在一些实施方案中,编码一种或更多种存活因子诸如MANF的多核苷酸可以插入到遗传修饰或未遗传修饰的细胞中,以产生具有增加的存活的通用供体细胞。在一些实施方案中,存活因子是MANF,其也被称为富含精氨酸的在早期肿瘤中突变的(arginine-rich,mutated in early-stage tumors,ARMET)、富含精氨酸的蛋白(ARP)或中脑星形胶质细胞来源的神经营养因子。MANF是一种内质网(ER)应激诱导的神经营养因子,促进胰腺β细胞的增殖和存活,以及多巴胺能神经元的存活。在一些实施方案中,插入编码一种或更多种存活因子诸如MANF的多核苷酸,使得通用供体细胞在移植或植入到宿主受试者中后能够以比移植或植入后的未修饰细胞高至少1.05倍、至少1.1倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、至少20倍或至少50倍的比率存活。
编码致耐受性因子和/或存活因子的多核苷酸通常包含编码致耐受性因子的核苷酸序列侧翼的左同源臂和右同源臂。同源臂与靶向的插入位点处或附近的基因组DNA具有实质的序列同源性。例如,左同源臂可以是与位于靶位点或切割位点左侧或上游的区域同源的核苷酸序列,并且右同源臂可以是与位于靶位点或切割位点右侧或下游的区域同源的核苷酸序列。每个同源臂的近端可以与邻接切割位点的基因组DNA序列同源。可选地,每个同源臂的近端可以与距离切割位点最多约10、20、30、40、50、60或70个核碱基的基因组DNA序列同源。因此,编码致耐受性因子的多核苷酸可以插入或替换切割位点的约10、20、30、40、50、60或70个碱基对内的靶向基因座,并且可以缺失与切割位点相邻(并且与同源臂没有同源性)的另外的基因组DNA。同源臂的长度范围可以从约50个核苷酸到几千个核苷酸。在一些实施方案中,同源臂的长度范围可以是约500个核碱基至约1000个核碱基。在一些实施方案中,同源臂的长度为约700、约800或约900个核碱基。在一些实施方案中,同源臂的长度为约800个核碱基。同源臂和基因组DNA之间的实质的序列同源性可以是至少约80%、至少约85%、至少约90%、至少约95%或至少约99%。在一些实施方案中,同源臂与基因组DNA相同。
在一些实施方案中,同源臂与B2M引导物(例如,包含SEQ ID NO:1-13的RNA形式的gRNA)一起使用。在一些实施方案中,同源臂被设计成与将消除B2M基因起始位点的任何B2M引导物一起使用。在一些实施方案中,B2M同源臂可以包含以下或基本上由以下组成:SEQID NO:15或22的核苷酸序列,或与SEQ ID NO:15或22的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,左B2M同源臂可以包含以下或基本上由以下组成:SEQ ID NO:15的核苷酸序列,或与SEQ ID NO:15的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,右B2M同源臂可以包含以下或基本上由以下组成:SEQ ID NO:22的核苷酸序列,或与SEQ ID NO:22的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,同源臂与TXNIP引导物(例如,包含SEQ ID NO:32-41的RNA形式的gRNA)一起使用。在一些实施方案中,同源臂被设计成与靶向TXNIP外显子1的任何TXNIP引导物(例如,包含SEQ ID NO:32-41的RNA形式的gRNA)一起使用。在一些实施方案中,TXNIP同源臂可以包含以下或基本上由以下组成:SEQ ID NO:26或28的核苷酸序列,或与SEQ ID NO:26或28的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,左TXNIP同源臂可以包含以下或基本上由以下组成:SEQ ID NO:26的核苷酸序列,或与SEQ ID NO:26的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,右TXNIP同源臂可以包含以下或基本上由以下组成:SEQ ID NO:28的核苷酸序列,或与SEQ ID NO:28的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,同源臂与CIITA引导物(例如,包含SEQ ID NO:25或48-51的RNA形式的gRNA)一起使用。在一些实施方案中,CIITA同源臂可以包含以下或基本上由以下组成:SEQ ID NO:42或44的核苷酸序列,或与SEQ ID NO:42或44的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,左CIITA同源臂可以包含以下或基本上由以下组成:SEQ ID NO:42的核苷酸序列,或与SEQ ID NO:42的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,右CIITA同源臂可以包含以下或基本上由以下组成:SEQ ID NO:44的核苷酸序列,或与SEQ IDNO:44的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,同源臂与TGF-β2引导物(例如,靶向包含SEQ ID NO:57的靶序列的gRNA)一起使用。
编码至少一种致耐受性因子和/或存活因子的至少一种多核苷酸可以包含编码一个或更多个核糖体跳跃的序列,使得在表达时产生单个转录物,但是翻译期间由于核糖体跳跃产生两个或更多个单独的蛋白。在一些实施方案中,核糖体跳跃可以是短肽(~20aa),其阻止核糖体在生长的多肽链的C末端在甘氨酸和脯氨酸之间产生肽键。核糖体在甘氨酸之后暂停,导致释放新生多肽链。翻译恢复,脯氨酸成为第二个多肽链的第一个氨基酸。这种机制导致多肽的明显共翻译切割(co-translational cleavage)。核糖体跳跃肽C末端的高度保守序列有助于空间位阻和核糖体跳跃。在一些实施方案中,核糖体跳跃肽是2A序列家族成员。合适的2A序列家族成员包括F2A、T2A、E2A和P2A,其中F2A来源于口蹄疫病毒2A,T2A来源于明脉扁刺蛾(thosea asigna)病毒2A,E2A来源于马鼻炎A病毒,并且P2A来源于猪肠病毒-1 2A。在一些实施方案中,核糖体跳跃肽是P2A。在一些实施方案中,编码核糖体跳跃P2A的序列包含SEQ ID NO:18的核苷酸序列或由SEQ ID NO:18的核苷酸序列组成。在其他实施方案中,核糖体跳跃可以是内部核糖体进入序列(IRES),其是允许以帽非依赖性方式进行翻译起始的RNA元件。因此,IRES允许从单个转录单位产生两种独立的蛋白。IRES元件是本领域熟知的,例如,可以来源于病毒基因组(例如,小RNA病毒(picornavirus)、鹅口疮病毒(aphthovirus)、瘟病毒属(pestivirus)IRES)或细胞mRNA(例如,各种生长因子、转录因子、癌基因等)。
编码至少一种致耐受性因子和/或存活因子的至少一种多核苷酸可以与外源启动子可操作地连接。外源启动子可以是组成型、诱导型、时间特异性、组织特异性或细胞类型特异性启动子。在一些实施方案中,外源启动子是CMV、EFla、PGK、CAG/CAGGS或UBC启动子。通常,CAG或CAGGS启动子包括CMV增强子、鸡β-肌动蛋白启动子和嵌合内含子。在一些实施方案中,CAG或CAGGS启动子包含以下或基本上由以下组成:SEQ ID NO:16的核苷酸序列或与SEQ ID NO:16的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,编码至少一种致耐受性因子和/或存活因子的至少一种多核苷酸可以插入安全港基因座,例如AAVS1基因座。在一些实施方案中,编码至少一种致耐受性因子和/或存活因子的至少一种多核苷酸被插入与MHC-I基因、MHC-II基因、MHC-I或MHC-II的转录调节因子或存活因子基因部分重叠、完全重叠或被包含在MHC-I基因、MHC-II基因、MHC-I或MHC-II的转录调节因子或存活因子基因内(即,在其内或附近)的基因组DNA的位点或区域。
在某些实施方案中,本公开内容设想了具有对应于表1中列为敲入的任何基因的外源多核苷酸的一个或更多个插入和/或表1中列为敲除的一个或更多个基因的被破坏的表达的通用供体细胞。工程化的通用供体细胞可以包括在任何靶基因组位置(例如,安全港位置)的对应于表1所列基因的一个多核苷酸插入、任何两个多核苷酸插入、任何三个多核苷酸插入、任何四个多核苷酸插入、任何五个多核苷酸插入或所有六个多核苷酸插入,和/或工程化的通用供体细胞可以包括表1所列靶基因中的一个、两个、三个或四个的被破坏的表达(例如,减少或消除表达)。细胞可以包含列出的基因敲入和基因敲除的任何可能组合。在一些实施方案中,待插入的两个或更多个多核苷酸可以通过一个或更多个编码核糖体跳跃诸如2A肽的序列连接,使得两个或更多个单独的蛋白可以从单个RNA转录物表达。在一些实施方案中,待插入细胞基因组的一个或更多个多核苷酸可操作地连接到外源启动子。
表1:可能的基因敲入和基因敲除的列表
基因敲入 基因敲除
PD-L-1 B2M
TNFAIP3(A20) TXNIP
MANF CIITA
CD39 TGF-β2
HLA-E
CD73
在一些实施方案中,将编码PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码PD-L-1的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码PD-L-1的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码PD-L-1的多核苷酸插入TGF-β2基因座内或附近的位点。编码PD-L-1的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码PD-L-1的多核苷酸包含SEQ ID NO:20的核苷酸序列或与SEQ ID NO:20的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,将编码TNFAIP3的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码TNFAIP3的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码TNFAIP3的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码TNFAIP3的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码TNFAIP3的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码TNFAIP3的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码TNFAIP3的多核苷酸插入TGF-β2基因座内或附近的位点。编码TNFAIP3的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码TNFAIP3的多核苷酸包含SEQ ID NO:19的核苷酸序列或与SEQ ID NO:19的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,将编码MANF的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码MANF的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码MANF的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码MANF的多核苷酸插入B2M基因座内或附近的位点。在其他实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码MANF的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码MANF的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码MANF的多核苷酸插入TGF-β2基因座内或附近的位点。编码MANF的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码MANF的多核苷酸包含SEQ ID NO:17的核苷酸序列或与SEQ ID NO:17的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,将编码CD39的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码CD39的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码CD39的多核苷酸插入CIITA基因座内或附近或B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码CD39的多核苷酸插入B2M基因座内或附近的位点。在其他实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码CD39的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子缺失的同时或之后将编码CD39的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码CD39的多核苷酸插入TGF-β2基因座内或附近的位点。编码CD39的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码CD39的多核苷酸包含SEQ ID NO:27的核苷酸序列或与SEQID NO:27的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,将编码HLA-E的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码HLA-E的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码HLA-E的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码HLA-E的多核苷酸插入B2M基因座内或附近的位点。在其他实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码HLA-E的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子缺失的同时或之后将编码HLA-E的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码HLA-E的多核苷酸插入TGF-β2基因座内或附近的位点。编码HLA-E的多核苷酸包含编码HLA-E三聚体的序列,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。编码HLA-E的多核苷酸可操作地连接到外源启动子。外源启动子可以是CMV启动子。在一些实施方案中,编码HLA-E的多核苷酸包含SEQ ID NO:43的核苷酸序列或与SEQ IDNO:43的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,将编码CD73的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码CD73的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码CD73的多核苷酸插入B2M基因座内或附近或CIITA基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子缺失的同时或之后将编码CD73的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子缺失的同时或之后将编码CD73的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子缺失的同时或之后将编码CD73的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码CD73的多核苷酸插入TGF-β2基因座内或附近的位点。编码CD73的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码CD73的多核苷酸包含SEQ ID NO:46的核苷酸序列或与SEQ ID NO:46的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。
在一些实施方案中,将编码MANF、TNFAIP3和PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码MANF、TNFAIP3和PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码MANF、TNFAIP3和PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码MANF、TNFAIP3和PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码MANF、TNFAIP3和PD-L-1的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码MANF、TNFAIP3和PD-L-1的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码MANF、TNFAIP3和PD-L-1的多核苷酸插入TGF-β2基因座内或附近的位点。编码MANF、TNFAIP3和PD-L-1的多核苷酸包含编码MANF的序列,编码MANF的序列连接到编码第一核糖体跳跃的序列,编码第一核糖体跳跃的序列连接到编码TNFAIP3的序列,编码TNFAIP3的序列连接到编码第二核糖体跳跃的序列,编码第二核糖体跳跃的序列连接到编码PD-L-1的序列。第一和第二核糖体跳跃可以是2A序列家族成员,例如,两者都可以是P2A。在一些实施方案中,多核苷酸包含MANF-P2A-TNFAIP3-P2A-PD-L-1编码序列。在一些实施方案中,编码MANF-P2A-TNFAIP3-P2A-PD-L-1的多核苷酸包含以下或由以下组成:SEQ ID NO:52的核苷酸序列或与SEQ ID NO:52的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,编码MANF-P2A-TNFAIP3-P2A-PD-L-1的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码MANF-P2A-TNFAIP3-P2A-PD-L-1并包含B2M同源臂的供体载体具有SEQ ID NO:24的核苷酸序列。在一些实施方案中,供体载体编码MANF-P2A-TNFAIP3-P2A-PD-L-1并包含TXNIP同源臂。在一些实施方案中,供体载体编码MANF-P2A-TNFAIP3-P2A-PD-L-1并包含CTIIA同源臂。在一些实施方案中,供体载体编码MANF-P2A-TNFAIP3-P2A-PD-L-1并包含TGF-β2同源臂。
在一些实施方案中,将编码TNFAIP3和PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码TNFAIP3和PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码TNFAIP3和PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码TNFAIP3和PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码TNFAIP3和PD-L-1的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码TNFAIP3和PD-L-1的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码TNFAIP3和PD-L-1的多核苷酸插入TGF-β2基因座内或附近的位点。编码TNFAIP3和PD-L-1的多核苷酸包含编码TNFAIP3的序列,编码TNFAIP3的序列连接到编码核糖体跳跃的序列,编码核糖体跳跃的序列连接到编码PD-L-1的序列。核糖体跳跃可以是2A序列家族成员,诸如P2A。在一些实施方案中,多核苷酸包含TNFAIP3-P2A-PD-L-1编码序列。在一些实施方案中,编码TNFAIP3-P2A-PD-L-1的多核苷酸包含以下或由以下组成:SEQ ID NO:54的核苷酸序列或与SEQ ID NO:54的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,编码TNFAIP3-P2A-PD-L-1的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码TNFAIP3-P2A-PD-L-1并包含B2M同源臂的供体质粒具有SEQ ID NO:31的核苷酸序列。在一些实施方案中,供体质粒编码TNFAIP3-P2A-PD-L-1并包含TXNIP同源臂。在一些实施方案中,供体质粒编码TNFAIP3-P2A-PD-L-1并包含CIITA同源臂。在一些实施方案中,供体载体编码TNFAIP3-P2A-PD-L-1并包含TGF-β2同源臂。
在一些实施方案中,将编码MANF和HLA-E的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码MANF和HLA-E的多核苷酸插入B2M基因座内或附近或TXNIP基因座内或附近的位点。在一些实施方案中,将编码MANF和HLA-E的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码MANF和HLA-E的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码MANF和HLA-E的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码MANF和HLA-E的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码HLA-E的多核苷酸插入TGF-β2基因座内或附近的位点。编码MANF和HLA-E的多核苷酸包含编码MANF的序列,编码MANF的序列连接到编码核糖体跳跃的序列,编码核糖体跳跃的序列连接到编码HLA-E的序列。核糖体跳跃可以是2A序列家族成员,诸如P2A。编码HLA-E的序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。在一些实施方案中,多核苷酸包含MANF-P2A-HLA-E编码序列。在一些实施方案中,编码MANF-P2A-HLA-E的多核苷酸包含以下或由以下组成:SEQ ID NO:55的核苷酸序列或与SEQ ID NO:55的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,编码MANF-P2A-HLA-E的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码MANF-P2A-HLA-E并包含TXNIP同源臂的供体质粒具有SEQ ID NO:45的核苷酸序列。在一些实施方案中,供体质粒编码MANF-P2A-HLA-E并包含B2M同源臂。在一些实施方案中,供体质粒编码MANF-P2A-HLA-E并包含CIITA同源臂。在一些实施方案中,供体质粒编码MANF-P2A-HLA-E并包含TGF-β2同源臂。
在一些实施方案中,将编码CD39和PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码CD39和PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码CD39和PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码CD39和PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码CD39和PD-L-1的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码CD39和PD-L-1的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码CD39和PD-L-1的多核苷酸插入TGF-β2基因座内或附近的位点。编码CD39和PD-L-1的多核苷酸包含编码CD39的序列,编码CD39的序列连接到编码核糖体跳跃的序列,编码核糖体跳跃的序列连接到编码PD-L-1的序列。核糖体跳跃可以是2A序列家族成员,诸如P2A。在一些实施方案中,多核苷酸包含CD39-P2A-PD-L-1编码序列。在一些实施方案中,编码CD39-P2A-PD-L-1的多核苷酸包含以下或由以下组成:SEQ ID NO:53的核苷酸序列或与SEQ IDNO:53的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,编码CD39-P2A-PD-L-1的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码CD39-P2A-PD-L-1并包含B2M同源臂的供体质粒具有SEQ ID NO:30的核苷酸序列。在一些实施方案中,供体质粒编码CD39-P2A-PD-L-1并包含TXNIP同源臂。在一些实施方案中,供体质粒编码CD39-P2A-PD-L-1并包含CIITA同源臂。在一些实施方案中,供体质粒编码CD39-P2A-PD-L-1并包含TGF-β2同源臂。
在一些实施方案中,将编码CD39、CD73和PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码CD39、CD73和PD-L-1的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码CD39、CD73和PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码CD39、CD73和PD-L-1的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码CD39、CD73和PD-L-1的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码CD39、CD73和PD-L-1的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码CD39、CD73和PD-L-1的多核苷酸插入TGF-β2基因座内或附近的位点。编码CD39、CD73和PD-L-1的多核苷酸包含编码CD39的序列,编码CD39的序列连接到编码核糖体跳跃的序列,编码核糖体跳跃的序列连接到编码CD73的序列,编码CD73的序列连接到编码核糖体跳跃的序列,编码核糖体跳跃的序列连接到编码PD-L-1的序列。核糖体跳跃可以是2A序列家族成员,诸如P2A。在一些实施方案中,多核苷酸包含CD39-P2A-CD73-P2A-PD-L-1编码序列。在一些实施方案中,编码CD39-P2A-CD73-P2A-PD-L-1的多核苷酸包含以下或由以下组成:SEQ ID NO:56的核苷酸序列或与SEQ ID NO:56的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,编码CD39-P2A-CD73-P2A-PD-L-1的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,编码CD39-P2A-CD73-P2A-PD-L-1并包含B2M同源臂的供体质粒具有SEQ ID NO:47的核苷酸序列。在一些实施方案中,供体质粒编码CD39-P2A-CD73-P2A-PD-L-1并包含TXNIP同源臂。在一些实施方案中,供体质粒编码CD39-P2A-CD73-P2A-PD-L-1并包含CIITA同源臂。在一些实施方案中,供体质粒编码CD39-P2A-CD73-P2A-PD-L-1并包含TGF-β2同源臂。
在一些实施方案中,将编码CD39和CD73的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、CIITA基因座内或附近、或TGF-β2基因座内或附近的位点。在一些实施方案中,将编码CD39和CD73的多核苷酸插入B2M基因座内或附近、TXNIP基因座内或附近、或CIITA基因座内或附近的位点。在一些实施方案中,将编码CD39和CD73的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在B2M基因或启动子的全部或部分缺失的同时或之后将编码CD39和CD73的多核苷酸插入B2M基因座内或附近的位点。在一些实施方案中,在TXNIP基因或启动子的全部或部分缺失的同时或之后将编码CD39和CD73的多核苷酸插入TXNIP基因座内或附近的位点。在一些实施方案中,在CIITA基因或启动子的全部或部分缺失的同时或之后将编码CD39和CD73的多核苷酸插入CIITA基因座内或附近的位点。在其他实施方案中,在TGF-β2基因或启动子的全部或部分缺失的同时或之后将编码CD39和CD73的多核苷酸插入TGF-β2基因座内或附近的位点。编码CD39和CD73的多核苷酸包含编码CD39的序列,编码CD39的序列连接到编码核糖体跳跃的序列,编码核糖体跳跃的序列连接到编码CD73的序列。核糖体跳跃可以是2A序列家族成员,诸如P2A。在一些实施方案中,多核苷酸包含CD39-P2A-CD73编码序列。在一些实施方案中,编码CD39-P2A-CD73的多核苷酸包含以下或由以下组成:SEQ ID NO:58的核苷酸序列或与SEQ ID NO:58的核苷酸序列具有至少85%、90%、95%或99%序列同一性的核苷酸序列。在一些实施方案中,编码CD39-P2A-CD73的多核苷酸可操作地连接到外源启动子。外源启动子可以是CAG或CAGGS启动子。在一些实施方案中,供体质粒编码CD39-P2A-CD73并包含B2M同源臂。在一些实施方案中,供体质粒编码CD39-P2A-CD73-P2A-PD-L-1并包含TXNIP同源臂。在一些实施方案中,供体质粒编码CD39-P2A-CD73-P2A-PD-L-1并包含CIITA同源臂。在一些实施方案中,供体质粒编码CD39-P2A-CD73-P2A-PD-L-1并包含TGF-β2同源臂。
在一些实施方案中,编码至少一种致耐受性因子和/或存活因子的至少一种多核苷酸可以作为载体的一部分递送至细胞。例如,载体可以是质粒载体。在各种实施方案中,递送至细胞的质粒载体的量的范围可为约0.5μg至约10μg(每约106个细胞)。在一些实施方案中,质粒的量的范围可为约1μg至约8μg、约2μg至约6μg、或约3μg至约5μg。在特定实施方案中,递送至细胞的质粒的量可为约4μg。
在某些实施方案中,不表达MHC-II和中等表达MHC-I的细胞被遗传修饰为不表面表达MHC-I或MHC-II。在另一种实施方案中,没有MHC-I/II表面表达的细胞被进一步编辑以具有PD-L-1表达,例如插入编码PD-L-1的多核苷酸;具有MANF表达,例如插入编码MANF的多核苷酸;具有CD39表达,例如插入编码CD39的多核苷酸;具有CD73表达,例如插入编码CD73的多核苷酸;具有HLA-E表达,例如插入编码HLA-E的多核苷酸;具有TNFAIP3表达,例如插入编码TNFAIP3的多核苷酸,和/或其任何组合。在另一种实施方案中,没有MHC-I/II表面表达的细胞被进一步编辑以具有PD-L-1表达,例如,插入编码PD-L-1的多核苷酸。在又一种实施方案中,没有MHC-I/II表面表达的细胞被进一步编辑以具有PD-L-1表达,例如插入编码PD-L-1的多核苷酸,并且还被遗传修饰以相对于未修饰的细胞增加或减少编码存活因子的至少一种基因的表达。
在一些实施方案中,细胞还包括例如通过遗传修饰增加或减少一种或更多种另外的基因的表达,这些基因不一定涉及植入后或移植后的免疫逃避或细胞存活。在一些实施方案中,相对于未修饰的细胞,细胞还包含一种或更多种安全开关蛋白的增加表达。在一些实施方案中,细胞包含编码安全开关蛋白的一个或更多个另外的基因的增加表达。在一些实施方案中,安全开关也是自杀基因。在一些实施方案中,安全开关是单纯疱疹病毒-1胸苷激酶(HSV-tk)或诱导型胱天蛋白酶-9。在一些实施方案中,编码至少一种安全开关的多核苷酸被插入基因组,例如,插入安全港基因座。在一些其他实施方案中,遗传修饰的一种或更多种另外的基因编码以下一种或更多种:安全开关蛋白;靶向模式(targetingmodalities);受体;信号传导分子;转录因子;药学活性蛋白或肽;药物靶候选物;以及与构建体整合的促进其植入、运输、归巢、生存力、自我更新、持久性和/或存活的蛋白。
本发明的一个方面提供了一种产生基因组工程化的通用供体细胞的方法,其中通用供体细胞在基因组中的一个或更多个选定位点包含至少一种靶向基因组修饰,该方法包括通过将一种或更多种构建体引入本文所述的细胞类型以允许在选定位点进行靶向修饰,对所述细胞进行遗传工程化;使用一种或更多种能够识别所选位点的核酸内切酶在所选位点处将一种或更多种双链断裂引入所述细胞;以及培养编辑的细胞以允许内源性DNA修复以在所选位点处产生靶向插入或缺失;从而获得基因组修饰的通用供体细胞。靶向基因敲低或敲除可以在靶向多核苷酸插入之前、同时或之后进行。基因组修饰的通用供体细胞可以经历连续几轮的基因组修饰,使得多于一个位点被靶向和修饰。使用本领域熟知的技术培养、表征、选择和扩增基因组修饰的细胞。通过该方法产生的通用供体细胞将包含至少一种功能性靶向基因组修饰,并且其中基因组修饰的细胞,如果它们是干细胞,则能够分化成祖细胞或完全分化的细胞。
在一些其他实施方案中,基因组工程化的通用供体细胞包括在HLA-E、HLA-G、CD47、PD-L-1、TNFAIP3、MANF、CD73和/或CD39中的至少一种中引入或增加表达。在一些实施方案中,基因组工程化的通用供体细胞包含HLA-E、PD-L-1、TNFAIP3和/或MANF的引入或增加表达。在一些实施方案中,基因组工程化的通用供体细胞包含HLA-E、PD-L-1、TNFAIP3、MANF和/或CD39的引入或增加表达。在一些实施方案中,基因组工程化的通用供体细胞包含PD-L-1和CD39的引入或增加表达和/或PD-L-1、CD73和CD39的引入或增加表达。在一些实施方案中,基因组工程化的通用供体细胞是HLA I类和/或II类缺陷的。在一些实施方案中,基因组工程化的通用供体细胞包含无效或低B2M(B2M null or low)。在一些实施方案中,基因组工程化的通用供体细胞包括无效或低B2M和无效或低TXNIP。在一些实施方案中,基因组工程化的通用供体细胞包括无效或低B2M、无效或低TXNIP和无效或低CIITA。在一些实施方案中,基因组工程化的通用供体细胞包括无效或低B2M、无效或低TXNIP、无效或低CIITA和无效或低TGF-β2。
在一些实施方案中,基因组工程化的通用供体细胞包含编码HLA-E、HLA-G、CD47、PD-L-1、TNFAIP3、MANF、CD73和/或CD39中的一种或更多种的整合或非整合外源多核苷酸。在一些实施方案中,基因组工程化的通用供体细胞包含编码HLA-E、PD-L-1、TNFAIP3、MANF、CD73和/或CD39中的一种或更多种的整合或非整合外源多核苷酸。在一些实施方案中,所述引入的表达是来自所述细胞中包含的非表达或低表达基因的增加表达。在一些实施方案中,使用仙台病毒、AAV、附加体或质粒引入非整合的外源多核苷酸。在一些实施方案中,通用供体细胞是B2M无效的和TXNIP无效的,并具有TNFAIP3、PD-L-1、MANF和HLA-E的引入表达。在一些实施方案中,通用供体细胞为CIITA无效的。在一些实施方案中,通用供体细胞是TGF-β2无效的。在一些实施方案中,通用供体细胞是(i)B2M无效的,其中编码TNFAIP3和PD-L-1的多核苷酸被插入B2M基因座内或附近,和(ii)TXNIP无效的,其中编码MANF和HLA-E的多核苷酸被插入TXNIP基因座内或附近。在一些实施方案中,通用供体细胞是(i)B2M无效的,其中编码TNFAIP3和PD-L-1的多核苷酸被插入B2M基因座内或附近,(ii)TXNIP无效的,其中编码MANF和HLA-E的多核苷酸被插入TXNIP基因座内或附近,和(iii)CIITA无效的,其中编码CD39的多核苷酸被插入CIITA基因座内或附近。在一些实施方案中,通用供体细胞是(i)B2M无效的,其中编码TNFAIP3和PD-L-1的多核苷酸被插入B2M基因座内或附近,(ii)TXNIP无效的,其中编码MANF和HLA-E的多核苷酸被插入TXNIP基因座内或附近,和(iii)CIITA无效的,其中编码CD39的多核苷酸被插入CIITA基因座内或附近,和(iv)TGF-β2无效的。在一些实施方案中,通用供体细胞是(i)B2M无效的,其中编码TNFAIP3和PD-L-1的第一多核苷酸被插入B2M基因座的第一位点内或附近,并且编码CD39和PD-L-1的第二多核苷酸被插入B2M基因座的第二位点内或附近,和(ii)TXNIP无效的,其中编码MANF和HLA-E的多核苷酸被插入TXNIP基因座内或附近。在一些实施方案中,通用供体细胞是(i)B2M无效的,其中编码TNFAIP3和PD-L-1的第一多核苷酸被插入B2M基因座的第一位点内或附近,并且编码CD39和PD-L-1的第二多核苷酸被插入B2M基因座的第二位点内或附近,(ii)TXNIP无效的,其中编码MANF和HLA-E的多核苷酸被插入TXNIP基因座内或附近,和(iii)TGF-β2无效的。在另一个实施方案中,通用供体细胞是B2M无效的,其中编码MANF、TNFAIP3和PD-L-1的多核苷酸被插入B2M基因座内或附近。在一些实施方案中,通用供体细胞是(i)B2M无效的,其中编码PD-L-1的多核苷酸被插入B2M基因座内或附近,(ii)TXNIP无效的,其中编码HLA-E的多核苷酸被插入TXNIP基因座内或附近,和(iii)CIITA无效的,其中编码CD39的多核苷酸被插入CIITA基因座内或附近,和(iv)TGF-β2无效的。在又其他实施方案中,通用供体细胞是B2M无效的,其中编码MANF、TNFAIP3和PD-L-1的多核苷酸被插入B2M基因座内或附近,并且任选地是CIITA无效的,其中编码CD39的多核苷酸被插入CIITA基因座内或附近。在又其他实施方案中,通用供体细胞是B2M无效的,其中编码MANF、TNFAIP3和PD-L-1的第一多核苷酸被插入B2M基因座的第一位点内或附近,并且编码CD39和PD-L-1的第二多核苷酸被插入B2M基因座的第二位点内或附近,并且任选地是TGF-β2无效的。在其他实施方案中,通用供体细胞是(i)B2M无效的,其中编码MANF、TNFAIP3和PD-L-1的多核苷酸被插入B2M基因座内或附近,(ii)CIITA无效的,其中编码CD39的多核苷酸被插入CIITA基因座内或附近,和(iii)TGF-β2无效的。在另外的实施方案中,通用供体细胞是(i)B2M无效的,其中编码PD-L-1的多核苷酸被插入B2M基因座内或附近,(ii)TXNIP无效的,其中编码HLA-E的多核苷酸被插入TXNIP基因座内或附近,(iii)CIITA无效的,其中编码CD39的多核苷酸被插入CIITA基因座内或附近,和(iv)TGF-β2无效的。在又其他实施方案中,通用供体细胞是(i)B2M无效的,其中编码PD-L-1的第一多核苷酸被插入B2M基因座的第一位点内或附近,并且编码CD39的第二多核苷酸被插入B2M基因座的第二位点内或附近,和(ii)TXNIP无效的,其中编码HLA-E的多核苷酸被插入TXNIP基因座内或附近。在一些实施方案中,通用供体细胞是B2M无效的,其中编码CD39和PD-L-1的多核苷酸被插入B2M基因座内或附近。在一些实施方案中,通用供体细胞是B2M无效的,其中编码CD39、CD73和PD-L-1的多核苷酸被插入B2M基因座内或附近,并且进一步任选地是TGF-β2无效的。
在某些实施方案中,所述通用供体细胞还包含至少一种安全开关蛋白的表达增加或减少。预期产生本文所述的任何遗传修饰的细胞的方法使用本文所述的至少任何基因编辑方法来进行。
III.基因组编辑方法
基因组编辑通常是指修饰基因组核苷酸序列的过程,优选以精确或预先确定的方式。在一些实施方案中,本文所述的基因组编辑方法,例如CRISPR-核酸内切酶系统,可用于遗传修饰本文所述的细胞,例如以产生通用供体细胞。在一些实施方案中,本文所述的基因组编辑方法,例如CRISPR-核酸内切酶系统,可用于遗传修饰本文所述的细胞,例如以在至少一个基因内或附近引入相对于未修饰的细胞降低一种或更多种MHC-I和/或MHC-II人类白细胞抗原或MHC-I或MHC-II复合体的其他组分的表达的至少一种遗传修饰;引入相对于未修饰的细胞增加编码致耐受性因子的至少一种多核苷酸的表达的至少一种遗传修饰;和/或引入相对于未修饰的细胞增加或减少编码存活因子的至少一种基因的表达的至少一种遗传修饰。
本文描述的基因组编辑方法的实例包括使用定点核酸酶在基因组中精确的靶位置切割脱氧核糖核酸(DNA),从而在基因组内的特定位置产生单链或双链DNA断裂的方法。这样的断裂可以并且有规律地通过自然的内源性细胞过程修复,例如同源定向修复(HDR)和非同源末端连接(NHEJ),如Cox等人,“Therapeutic genome editing:prospects andchallenges,”,Nature Medicine,2015,21(2),121-31中所述。这两个主要的DNA修复过程由一系列可选择的途径组成。NHEJ直接连接双链断裂导致的DNA末端,有时会丢失或添加核苷酸序列,这可能会破坏或增强基因表达。HDR利用同源序列或供体序列作为模板,在断裂点插入确定的DNA序列。同源序列可以在内源性基因组中,诸如姐妹染色单体。可选地,供体序列可以是外源多核苷酸,诸如质粒、单链寡核苷酸、双链寡核苷酸(double-strandedoligonucleotide)、双链体寡核苷酸(duplex oligonucleotide)或病毒,其具有与核酸酶裂解的基因座高度同源的区域(例如,左同源臂和右同源臂),但也可以包含另外的序列或序列变化,包括可以掺入被裂解的靶基因座的缺失。第三种修复机制可以是微同源介导的末端连接(MMEJ),也称为“选择性NHEJ”,其中遗传结果与NHEJ的相似之处在于小的缺失和插入可以发生在裂解位点。MMEJ可以利用DNA断裂位点侧翼的几个碱基对的同源序列来驱动更有利的DNA末端连接修复结果,并且最近的报道进一步阐明了这一过程的分子机制;参见例如,Cho和Greenberg,Nature,2015,518,174-76;Kent等人,Nature Structural andMolecular Biology,2015,22(3):230-7;Mateos-Gomez等人,Nature,2015,518,254-57;Ceccaldi等人,Nature,2015,528,258-62。在一些情况下,基于对DNA断裂位点潜在微同源性的分析,有可能预测可能的修复结果。
这些基因组编辑机制中的每一个都可以用于创建所需的遗传修饰。基因组编辑过程中的一个步骤可以是在靶基因座靠近预期突变位点的地方创建一个或两个DNA断裂,后者是双链断裂或两个单链断裂。这可以通过使用核酸内切酶来实现,如本文所描述和说明的。
通常,本文描述的基因组编辑方法可以是体外或离体方法。在一些实施方案中,本文公开的基因组编辑方法不是通过疗法治疗人类或动物身体的方法和/或不是修改人类种系遗传身份的过程。
CRISPR核酸内切酶系统
CRISPR-核酸内切酶系统是原核生物中天然存在的防御机制,已被重新用作用于基因编辑的RNA引导的DNA靶向平台。CRISPR系统包括I型、II型、III型、IV型、V型和VI型系统。在一些方面,CRISPR系统是II型CRISPR/Cas9系统。在其他方面,CRISPR系统是V型CRISPR/Cpf系统。CRISPR系统依赖于DNA核酸内切酶,例如Cas9,和两个非编码RNA—crisprRNA(crRNA)和反式活化RNA(tracrRNA)—来靶向DNA的裂解。
crRNA通过通常与靶DNA中的约20个核苷酸(nt)序列的Watson-Crick碱基配对来驱动CRISPR-核酸内切酶复合体的序列识别和特异性。改变crRNA中5’的20nt的序列允许将CRISPR-核酸内切酶复合体靶向特定基因座。如果靶序列之后是被称为原间隔区相邻基序(PAM)的特定短DNA基序(具有序列NGG),则CRISPR-核酸内切酶复合体仅结合包含与单引导RNA(sgRNA)的前20nt匹配的序列的DNA序列。
tracrRNA与crRNA的3’末端杂交形成RNA-双链体结构,该结构被核酸内切酶结合形成催化活性CRISPR-核酸内切酶复合体,该复合体然后可以裂解靶DNA。
在CRISPR-核酸内切酶复合体在靶位点与DNA结合后,核酸内切酶内的两个独立核酸酶结构域各自在PAM位点上游三个碱基处裂解DNA链中的一条,留下双链断裂(DSB),在这里DNA的两条链终止于碱基对(平端)。
在一些实施方案中,核酸内切酶是Cas9(CRISPR相关蛋白9)。在一些实施方案中,Cas9核酸内切酶来自酿脓链球菌(Streptococcus pyogenes),尽管可以使用其他Cas9同源物,例如金黄色葡萄球菌(S.Aureus)Cas9、脑膜炎奈瑟氏球菌(N.Meningitidis)Cas9、嗜热链球菌(S.Thermophilus)CRISPR l Cas9、嗜热链球菌CRISPR 3Cas9或齿垢密螺旋体(T.Denticola)Cas9。在其他情况下,CRISPR核酸内切酶是Cpf1,例如毛螺旋菌科细菌(L.bacterium)ND2006 Cpfl或氨基酸球菌属种(Acidaminococcus sp.)BV3L6 Cpfl。在一些实施方案中,核酸内切酶是Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4或Cpf1核酸内切酶。在一些实施方案中,可以使用野生型变体。在一些实施方案中,可以使用前述核酸内切酶的修饰形式(例如,其同源物、其天然存在的分子的重组、其密码子优化或其修饰形式)。
CRISPR核酸酶可以连接到至少一个核定位信号(NLS)。至少一个NLS可以位于CRISPR核酸酶的氨基末端的50个氨基酸处或50个氨基酸内,和/或至少一个NLS可以位于CRISPR核酸酶的羧基末端的50个氨基酸处或50个氨基酸内。
示例性CRISPR/Cas多肽包括发表在Fonfara等人,“Phylogeny of Cas9determines functional exchangeability of dual-RNA and Cas9 among orthologoustype IICRISPR-Cas systems,”Nucleic Acids Research,2014,42:2577-2590中的Cas9多肽。自从Cas基因被发现以来,CRISPR/Cas基因命名系统经历了广泛的重写。Fonfara等人还提供了来自各种物种的Cas9多肽的PAM序列。
锌指核酸酶
锌指核酸酶(ZFN)是由与II型核酸内切酶FokI的催化结构域连接的工程化锌指DNA结合结构域组成的模块化蛋白。因为FokI仅作为二聚体发挥作用,一对ZFN必须被工程化成与相对DNA链上的同源靶“半位点”序列结合,并且它们之间具有精确的间距,以使催化活性FokI二聚体能够形成。当FokI结构域二聚化时,其本身没有序列特异性,ZFN半位点之间产生DNA双链断裂,作为基因组编辑的起始步骤。
每个ZFN的DNA结合结构域通常由丰富的Cys2-His2结构的3-6个锌指组成,每个指主要识别靶DNA序列一条链上的核苷酸三联体,尽管与第四个核苷酸的跨链相互作用也可能很重要。改变与DNA关键接触的位置上的指的氨基酸会改变给定指的序列特异性。因此,四指锌指蛋白将选择性地识别12bp靶序列,其中靶序列是由每个指贡献的三联体偏好的复合物,尽管三联体偏好可以不同程度地受到相邻指的影响。ZFN的一个重要方面是,它们可以简单地通过修改单个指来容易地重新靶向几乎任何基因组地址。在ZFN的大多数应用中,使用4-6指的蛋白,分别识别12-18bp。因此,一对ZFN将通常识别24-36bp的组合靶序列,不包括半位点之间典型的5-7bp间隔区。结合位点可以用更大的间隔区(包括15-17bp)进一步隔开。假设在设计过程中排除了重复序列或基因同源物,那么这个长度的靶序列在人类基因组中可能是独一无二的。然而,ZFN蛋白-DNA相互作用在其特异性上不是绝对的,因此脱靶结合和切割事件确实会发生,作为两个ZFN之间的异二聚体,或者作为一个或另一个ZFN的同源二聚体。后一种的可能性已经通过对FokI结构域的二聚化界面工程化以产生“正”和“负”变体(也称为专性异二聚体变体,它们只能彼此二聚化,而不能与自身二聚化)被有效地消除。迫使专性异二聚体阻止同源二聚体的形成。这极大地增强了ZFN的特异性,以及采用这些FokI变体的任何其他核酸酶的特异性。
本领域中已经描述了各种基于ZFN的系统,定期报道了对其的修改,并且许多参考文献描述了用于指导ZFN的设计的规则和参数;参见例如,Segal等人,Proc Natl AcadSci,199996(6):2758-63;Dreier B等人,J Mol Biol.,2000,303(4):489-502;Liu Q等人,J Biol Chem.,2002,277(6):3850-6;Dreier等人,J Biol Chem.,2005,280(42):35588-97;和Dreier等人,J Biol Chem.2001,276(31):29466-78。
转录激活因子样效应物核酸酶(TALEN)
TALEN代表与ZFN一样,工程化的DNA结合结构域藉以连接到FokI核酸酶结构域,并且一对TALEN串联操作以实现靶向DNA裂解的模块化核酸酶的另一种形式。与ZFN的主要区别是DNA结合结构域的性质和相关的靶DNA序列识别特性。TALEN DNA结合结构域来源于TALE蛋白,其最初在植物细菌病原体黄单胞菌属种(Xanthomonas sp.)中描述。TALE由33-35个氨基酸重复序列的串联阵列组成,每个重复序列识别靶DNA序列中的单个碱基对,靶DNA序列的长度通常高达20bp,给出总的靶序列长度高达40bp。每个重复序列的核苷酸特异性由重复可变双残基(RVD)决定,其仅包括位置12和13的两个氨基酸。碱基鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶主要被四种RVD识别:分别为Asn-Asn、Asn-Ile、His-Asp和Asn-Gly。这构成了比锌指简单得多的识别码,因此代表了核酸酶设计优于锌指的优势。然而,与ZFN一样,TALEN的蛋白-DNA相互作用在其特异性上不是绝对的,并且TALEN也受益于使用FokI结构域的专性异二聚体变体来降低脱靶活性。
已经产生了FokI结构域的催化功能被失活的其他变体。如果TALEN或ZFN对的一半包含无活性的FokI结构域,那么只有单链DNA裂解(产生切口)将发生在靶位点,而不是DSB。结果与使用CRISPR/Cas9或CRISPR/Cpf1“切口酶”突变体(其中Cas9裂解结构域之一已经失活)相当。DNA切口可以用来驱动HDR的基因组编辑,但效率低于DSB。主要的益处是脱靶切口被快速且准确地修复,不像DSB那样容易出现NHEJ介导的错误修复。
本领域中已经描述了各种基于TALEN的系统,并且定期报道了对其的修改;参见例如,Boch,Science,2009 326(5959):1509-12;Mak等人,Science,2012,335(6069):716-9;和Moscou等人,Science,2009,326(5959):1501。基于“金门(Golden Gate)”平台或克隆方案的TALEN的使用已被多个团体描述;参见例如,Cermak等人,Nucleic Acids Res.,2011,39(12):e82;Li等人,Nucleic Acids Res.,2011,39(14):6315-25;Weber等人,PLoS One.,2011,6(2):e16765;Wang等人,J Genet Genomics,2014,41(6):339-47.;和Cermak T等人,Methods Mol Biol.,20151239:133-59。
归巢核酸内切酶
归巢核酸内切酶(HE)是序列特异性核酸内切酶,具有长识别序列(14-44个碱基对),并以高特异性裂解DNA——通常在基因组中独特的位点。根据它们的结构分类,至少有六个已知的HE家族,包括GIY-YIG、His-Cis框、H-N-H、PD-(D/E)xK和类Vsr,它们来源于广泛的宿主,包括真核生物、原生生物、细菌、古细菌、蓝细菌和噬菌体。与ZFN和TALEN一样,HE可以用于在靶基因座处创建DSB作为基因组编辑的初始步骤。此外,一些天然的和工程化的HE只切割一条DNA链,从而作为位点特异性的切口酶发挥作用。HE的大的靶序列和它们提供的特异性使它们成为创建位点特异性DSB的有吸引力的候选物。
本领域已经描述了各种基于HE的系统,并且定期报道了对其的修改;参见例如,Steentoft等人,Glycobiology,2014,24(8):663-80;Belfort和Bonocora,Methods MolBiol.,2014,1123:1-26;以及Hafez和Hausner,Genome,2012,55(8):553-69的综述。
MegaTAL/Tev-mTALEN/MegaTev
作为杂合体核酸酶的另外的实例,MegaTAL平台和Tev-mTALEN平台使用TALE DNA结合结构域和催化活性HE的融合物,利用TALE的可调DNA结合和特异性,以及HE的裂解序列特异性二者;参见例如,Boissel等人,Nucleic Acids Res.,2014,42:2591-2601;Kleinstiver等人,G3,2014,4:1155-65;以及Boissel和Scharenberg,Methods Mol.Biol.,2015,1239:171-96。
在另一个变型中,MegaTev结构是兆核酸酶(Mega)与来源于GIY-YIG归巢核酸内切酶I-TevI的核酸酶结构域(Tev)的融合。这两个活性位点在DNA底物上相距~30bp定位,并产生两个具有不相容粘性末端的DSB;参见例如,Wolfs等人,Nucleic Acids Res.,2014,42,8816-29。预计现有的基于核酸酶的方法的其他组合将会发展,并可用于实现本文所述的靶向基因组修饰。
dCas9-FokI或dCpf1-Fok1和其他核酸酶
组合上述核酸酶平台的结构和功能特性提供了基因组编辑的另外的方法,该方法可以潜在地克服一些固有的缺陷。例如,CRISPR基因组编辑系统通常使用单个Cas9核酸内切酶来创建DSB。靶向的特异性由引导RNA中的20或24个核苷酸的序列驱动,该序列与靶DNA进行Watson-Crick碱基配对(在来自酿脓链球菌的Cas9的情况下,加上相邻NAG或NGG PAM序列中的另外2个碱基)。这样的序列足够长,使得该序列在人类基因组中是独特的,然而,RNA/DNA相互作用的特异性不是绝对的,有时可以容忍显著的混杂,特别是在靶序列的5’半部分(5’half),这有效地减少了驱动特异性的碱基的数量。对此,一种解决方案是完全失活Cas9或Cpf1催化功能—仅保留RNA引导的DNA结合功能—取而代之的是将FokI结构域融合到失活的Cas9;参见例如,Tsai等人,Nature Biotech,2014,32:569-76;和Guilinger等人,Nature Biotech.,2014,32:577-82。因为FokI必须二聚化才能具有催化活性,所以需要两个引导RNA将两个FokI融合物紧密相连,以形成二聚体并裂解DNA。这实质上使组合靶位点中的碱基数量加倍,从而增加了基于CRISPR的系统靶向的严格性。
作为另外的实例,TALE DNA结合结构域与催化活性HE(诸如I-TevI)的融合利用了TALE的可调DNA结合和特异性,以及I-TevI的裂解序列特异性二者,期望脱靶裂解可以进一步降低。
碱基编辑
在一些实施方案中,使用碱基编辑在细胞中编辑基因。碱基编辑是一种能够在DNA中没有双链断裂的情况下将一个核苷酸转化为另一个核苷酸的技术。碱基编辑允许将C转化为T,G转化为A,或者反之。胞嘧啶的示例编辑器包括与无催化活性形式的Cas9融合的rAPOBEC1。Cas9有助于结合感兴趣的位点,并且rAPOBEC1胞苷脱氨酶诱导点突变。腺嘌呤的转化需要突变的转移RNA腺苷脱氨酶(transfer RNA adenosine deaminase,TadA)、Cas9切口酶和sgRNA,如本文所述。该构建体能够引入位点特异性突变而不引入链断裂。在一些实施方案中,碱基编辑用于在本文描述的细胞中引入一种或更多种突变。
RNA引导的核酸内切酶
本文所用的RNA引导的核酸内切酶系统可包含与野生型示例性核酸内切酶(例如,来自酿脓链球菌的Cas9,US2014/0068797的SEQ ID No.8或Sapranauskas等人,NucleicAcids Res,39(21):9275-9282(2011))具有至少10%、至少15%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%氨基酸序列同一性的氨基酸序列。核酸内切酶可以在10个连续氨基酸上与野生型核酸内切酶(例如,来自酿脓链球菌的Cas9,见上文)包含至少70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。核酸内切酶可以在10个连续氨基酸上与野生型核酸内切酶(例如,来自酿脓链球菌的Cas9,见上文)包含至多70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。核酸内切酶可以在核酸内切酶的HNH核酸酶结构域中的10个连续氨基酸上与野生型核酸内切酶(例如,来自酿脓链球菌的Cas9,见上文)包含至少70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。核酸内切酶可以在核酸内切酶的HNH核酸酶结构域中的10个连续氨基酸上与野生型核酸内切酶(例如,来自酿脓链球菌的Cas9,见上文)包含至多70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。核酸内切酶可以在核酸内切酶的RuvC核酸酶结构域中的10个连续氨基酸上与野生型核酸内切酶(例如,来自酿脓链球菌的Cas9,见上文)包含至少70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。核酸内切酶可以在核酸内切酶的RuvC核酸酶结构域中的10个连续氨基酸上与野生型核酸内切酶(例如,来自酿脓链球菌的Cas9,见上文)包含至多70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。
核酸内切酶可以包含野生型示例性核酸内切酶的修饰形式。野生型示例性核酸内切酶的修饰形式可以包含降低核酸内切酶的核酸裂解活性的突变。野生型示例性核酸内切酶的修饰形式可以具有野生型示例性核酸内切酶(例如来自酿脓链球菌的Cas9,见上文)的核酸裂解活性的小于90%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%。修饰形式的核酸内切酶可以不具有实质的核酸裂解活性。当核酸内切酶是不具有实质的核酸裂解活性的修饰形式时,它在本文中被称为“无酶促活性”。
设想的突变可以包括取代、添加和缺失,或其任何组合。突变将突变的氨基酸转化为丙氨酸。突变将突变的氨基酸转化为另一种氨基酸(例如甘氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、脯氨酸、苯丙氨酸、酪氨酸、色氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺、组氨酸、赖氨酸或精氨酸)。突变将突变的氨基酸转化为非天然氨基酸(例如硒代甲硫氨酸)。突变将突变的氨基酸转化为氨基酸模拟物(例如,磷酸模拟物)。突变可以是保守突变。例如,突变将突变的氨基酸转化为类似于突变的氨基酸的大小、形状、电荷、极性、构象和/或旋转异构体的氨基酸(例如,半胱氨酸/丝氨酸突变、赖氨酸/天冬酰胺突变、组氨酸/苯丙氨酸突变)。突变可导致阅读框的移位和/或产生过早终止密码子(premature stop codon)。突变可导致影响一个或更多个基因表达的基因或基因座的调控区的变化。
引导RNA
本公开内容提供了引导RNA(gRNA),其可以将相关核酸内切酶的活性导向多核苷酸内的特定靶位点。引导RNA可以至少包含与感兴趣的靶核酸序列杂交的间隔区序列和CRISPR重复序列。在II型CRISPR系统中,gRNA还包含第二个RNA,称为tracrRNA序列。在II型CRISPR引导RNA(gRNA)中,CRISPR重复序列和tracrRNA序列彼此杂交形成双链体。在V型CRISPR系统中,gRNA包含形成双链体的crRNA。在一些实施方案中,gRNA可以结合核酸内切酶,使得gRNA和核酸内切酶形成复合体。gRNA可以凭借其与核酸内切酶的缔合为复合体提供靶特异性。因此,靶向基因组的核酸可以指导核酸内切酶的活性。
示例性引导RNA包括包含15-200个核苷酸的间隔区序列,其中gRNA靶向基于GRCh38人类基因组组装的基因组位置。如本领域普通技术人员所理解的,每个gRNA可以被设计成包括与其基因组靶位点或区域互补的间隔区序列。参见Jinek等人,Science,2012,337,816-821和Deltcheva等人,Nature,2011,471,602-607。
gRNA可以是双分子引导RNA。gRNA可以是单分子引导RNA。
双分子引导RNA可以包含两条RNA链。第一条链在5’至3’方向包含任选的间隔区延伸序列、间隔区序列和最小CRISPR重复序列。第二条链可以包含最小tracrRNA序列(与最小CRISPR重复序列互补)、3’tracrRNA序列和任选的tracrRNA延伸序列。
单分子引导RNA(sgRNA)可以在5’至3’方向上包含任选的间隔区延伸序列、间隔区序列、最小CRISPR重复序列、单分子引导接头、最小tracrRNA序列、3’tracrRNA序列和任选的tracrRNA延伸序列。任选的tracrRNA延伸序列可以包含对引导RNA贡献另外功能(例如稳定性)的元件。单分子引导接头可以连接最小CRISPR重复序列和最小tracrRNA序列,形成发夹结构。任选的tracrRNA延伸序列可以包含一个或更多个发夹。
在一些实施方案中,sgRNA在sgRNA序列的5’末端包含20个核苷酸的间隔区序列。在一些实施方案中,sgRNA在sgRNA序列的5’末端包含小于20个核苷酸的间隔区序列。在一些实施方案中,sgRNA在sgRNA序列的5’末端包含超过20个核苷酸的间隔区序列。在一些实施方案中,sgRNA在sgRNA序列的5’末端包含具有17-30个核苷酸的可变长度间隔区序列。在一些实施方案中,sgRNA包含长度大于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180或200个核苷酸的间隔区延伸序列。在一些实施方案中,sgRNA包含长度小于3、5、10、15、20、25、30、35、40、45、50、60、70、80、90或100个核苷酸的间隔区延伸序列。
在一些实施方案中,sgRNA包含间隔区延伸序列,该序列包含另一部分(例如,稳定性控制序列、内切核糖核酸酶结合序列或核酶)。该部分可以降低或增加核酸靶向核酸(nucleic acid targeting nucleic acid)的稳定性。该部分可以是转录终止子区段(即转录终止序列)。该部分可以在真核细胞中发挥作用。该部分可以在原核细胞中发挥作用。该部分可在真核细胞和原核细胞二者中发挥作用。合适部分的非限制性实例包括:5’帽(例如,7-甲基鸟苷酸帽(m7 G))、核糖开关序列(例如,允许蛋白和蛋白复合体调节稳定性和/或调节可及性)、形成dsRNA双链体(即,发夹)的序列、将RNA靶向亚细胞位置(例如,细胞核、线粒体、叶绿体等)的序列、提供用于追踪的修饰或序列(例如,与荧光分子直接缀合、与促进荧光检测的部分缀合、允许荧光检测的序列等),和/或为蛋白(例如,作用于DNA的蛋白,包括转录活化因子、转录阻遏因子、DNA甲基转移酶、DNA去甲基化酶、组蛋白乙酰转移酶、组蛋白脱乙酰化酶等)提供结合位点的修饰或序列。
在一些实施方案中,sgRNA包含与靶多核苷酸中的序列杂交的间隔区序列。gRNA的间隔区可以经由杂交(即,碱基配对)以序列特异性方式与靶多核苷酸相互作用。间隔区的核苷酸序列可以根据感兴趣的靶核酸的序列而变化。
在CRISPR-核酸内切酶系统中,间隔区序列可以被设计成与位于系统中使用的核酸内切酶的PAM的5’处的靶多核苷酸杂交。间隔区可以完全匹配靶序列,或者也可以有错配。每种核酸内切酶,例如Cas9核酸酶,具有它在靶DNA中识别的特定PAM序列。例如,酿脓链球菌Cas9识别包含序列5’-NRG-3’的PAM,其中R包含A或G,其中N是任何核苷酸,并且N紧邻间隔区序列靶向的靶核酸序列的3’。
靶多核苷酸序列可包含20个核苷酸。靶多核苷酸可以包含少于20个核苷酸。靶多核苷酸可以包含多于20个核苷酸。靶多核苷酸可包含至少:5、10、15、16、17、18、19、20、21、22、23、24、25、30或更多个核苷酸。所述靶多核苷酸可以包含至多:5、10、15、16、17、18、19、20、21、22、23、24、25、30或更多个核苷酸。靶多核苷酸序列可包含紧邻PAM第一个核苷酸5’的20个碱基。
与靶多核苷酸杂交的间隔区序列可以具有至少约6个核苷酸(nt)的长度。间隔区序列可以是至少约6nt、至少约10nt、至少约15nt、至少约18nt、至少约19nt、至少约20nt、至少约25nt、至少约30nt、至少约35nt或至少约40nt、约6nt至约80nt、约6nt至约50nt、约6nt至约45nt、约6nt至约40nt、约6nt至约35nt、约6nt至约30nt、约6nt至约25nt、约6nt至约20nt、约6nt至约19nt、约10nt至约50nt、约10nt至约45nt、约10nt至约40nt、约10nt至约35nt、约10nt至约30nt、约10nt至约25nt、约10nt至约20nt、约10nt至约19nt、约19nt至约25nt、约19nt至约30nt、约19nt至约35nt、约19nt至约40nt、约19nt至约45nt、约19nt至约50nt、约19nt至约60nt、约20nt至约25nt、约20nt至约30nt、约20nt至约35nt、约20nt至约40nt、约20nt至约45nt、约20nt至约50nt或约20nt至约60nt。在一些实例中,间隔区序列可以包含20个核苷酸。在一些实例中,间隔区可以包含19个核苷酸。在一些实例中,间隔区可以包含18个核苷酸。在一些实例中,间隔区可以包含22个核苷酸。
在一些实例中,间隔区序列和靶核酸之间的互补性百分比为至少约30%、至少约40%、至少约50%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%、至少约99%或100%。在一些实例中,间隔区序列和靶核酸之间的互补性百分比为最多约30%、最多约40%、最多约50%、最多约60%、最多约65%、最多约70%、最多约75%、最多约80%、最多约85%、最多约90%、最多约95%、最多约97%、最多约98%、最多约99%或100%。在一些实例中,在靶核酸互补链的靶序列的六个连续的最5’核苷酸上,间隔区序列和靶核酸之间的互补性百分比是100%。在约20个连续核苷酸上,间隔区序列和靶核酸之间的互补性百分比可以是至少60%。间隔区序列和靶核酸的长度可以相差1至6个核苷酸,这可以被认为是一个或更多个凸起。
tracrRNA序列可以包含与细胞中最小CRISPR重复序列杂交的核苷酸。最小tracrRNA序列和最小CRISPR重复序列可以形成双链体,即碱基配对的双链结构。最小tracrRNA序列和最小CRISPR重复序列一起可以结合RNA引导的核酸内切酶。最小tracrRNA序列的至少一部分可以与最小CRISPR重复序列杂交。最小tracrRNA序列可以与最小CRISPR重复序列至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%互补。
最小tracrRNA序列可以具有约7个核苷酸至约100个核苷酸的长度。例如,最小tracrRNA序列可以长约7个核苷酸(nt)至约50个nt、约7个nt至约40个nt、约7个nt至约30个nt、约7个nt至约25个nt、约7个nt至约20个nt、约7个nt至约15个nt、约8个nt至约40个nt、约8个nt至约30个nt、约8个nt至约25个nt、约8个nt至约20个nt、约8个nt至约15个nt、约15个nt至约100个nt、约15个nt至约80个nt、约15个nt至约50个nt、约15个nt至约40个nt、约15个nt至约30个nt或约15个nt至约25个nt。最小tracrRNA序列的长度可为大约9个核苷酸。最小tracrRNA序列可以是大约12个核苷酸。最小tracrRNA可以由Jinek等人(同上)中描述的tracrRNA nt 23-48组成。
在一段至少6、7或8个连续核苷酸上,最小tracrRNA序列可以与参考最小tracrRNA(例如,来自酿脓链球菌的野生型tracrRNA)序列至少约60%相同。例如,在一段至少6、7或8个连续核苷酸上,最小tracrRNA序列可以与参考最小tracrRNA序列至少约65%相同、约70%相同、约75%相同、约80%相同、约85%相同、约90%相同、约95%相同、约98%相同、约99%相同或100%相同。
最小CRISPR RNA和最小tracrRNA之间的双链体可以包含双螺旋。最小CRISPR RNA和最小tracrRNA之间的双链体可以包含至少约1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。最小CRISPR RNA和最小tracrRNA之间的双链体可包含至多约1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。
双链体可以包含错配(即,双链体的两条链不是100%互补的)。双链体可以包含至少约1、2、3、4或5个或更多个错配。双链体可包含至多约1、2、3、4或5个或更多个错配。双链体可以包含不超过2个错配。
在一些实施方案中,tracrRNA可以是3’tracrRNA。在一些实施方案中,3’tracrRNA序列可以包含与参考tracrRNA序列(例如,来自酿脓链球菌的tracrRNA)具有至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%序列同一性的序列。
在一些实施方案中,gRNA可以包含tracrRNA延伸序列。tracrRNA延伸序列可以具有约1个核苷酸至约400个核苷酸的长度。tracrRNA延伸序列可以具有多于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180或200个核苷酸的长度。tracrRNA延伸序列可以具有约20至约5000或更多个核苷酸的长度。tracrRNA延伸序列可以具有少于5、10、15、20、25、30、35、40、45、50、60、70、80、90或100个核苷酸的长度。tracrRNA延伸序列的长度可以包含少于10个核苷酸。tracrRNA延伸序列的长度可以是10-30个核苷酸。tracrRNA延伸序列的长度可以是30-70个核苷酸。
tracrRNA延伸序列可包含功能部分(例如,稳定性控制序列、核酶、内切核糖核酸酶结合序列)。功能部分可以包含转录终止子区段(即,转录终止序列)。功能部分可以具有约10个核苷酸(nt)至约100个核苷酸、约10个nt至约20个nt、约20个nt至约30个nt、约30个nt至约40个nt、约40个nt至约50个nt、约50个nt至约60个nt、约60个nt至约70个nt、约70个nt至约80个nt、约80个nt至约90个nt、约90个nt至约100个nt、约15个nt至约80个nt、约15个nt至约50个nt、约15个nt至约40个nt、约15个nt至约30个nt或约15个nt至约25个nt的总长度。
在一些实施方案中,sgRNA可以包含长度为约3个核苷酸至约100个核苷酸的接头序列。例如,在Jinek等人(同上)中,使用了简单的4核苷酸“四环”(-GAAA-)(Jinek等人,Science,2012,337(6096):816-821)。说明性接头具有约3个核苷酸(nt)至约90个nt、约3个nt至约80个nt、约3个nt至约70个nt、约3个nt至约60个nt、约3个nt至约50个nt、约3个nt至约40个nt、约3个nt至约30个nt、约3个nt至约20个nt、约3个nt至约10个nt的长度。例如,接头可以具有约3nt至约5nt、约5nt至约10nt、约10nt至约15nt、约15nt至约20nt、约20nt至约25nt、约25nt至约30nt、约30nt至约35nt、约35nt至约40nt、约40nt至约50nt、约50nt至约60nt、约60nt至约70nt、约70nt至约80nt、约80nt至约90nt或约90nt至约100nt的长度。单分子引导核酸的接头可以在4和40个核苷酸之间。接头可以是至少约100、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500或7000或更多个核苷酸。接头可以是至多约100、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500或7000或更多个核苷酸。
接头可以包含多种序列中的任一种,尽管在一些实例中,接头将不包含与引导RNA的其他部分具有同源性的广泛区域的序列,这可能导致分子内结合,从而干扰引导物的其他功能区域。在Jinek等人(同上)中,使用了简单的4核苷酸序列-GAAA-(Jinek等人,Science,2012,337(6096):816-821),但是同样可以使用许多其他序列,包括更长的序列。
接头序列可以包含功能部分。例如,接头序列可以包含一个或更多个特征,包括适体、核酶、蛋白相互作用发夹、蛋白结合位点、CRISPR阵列、内含子或外显子。接头序列可以包含至少约1、2、3、4或5个或更多个功能部分。在一些实例中,接头序列可包含至多约1、2、3、4或5个或更多个功能部分。
在一些实施方案中,sgRNA不包含尿嘧啶,例如在sgRNA序列的3’末端。在一些实施方案中,sgRNA确实包含一个或更多个尿嘧啶,例如在sgRNA序列的3’末端。在一些实施方案中,sgRNA在sgRNA序列的3’末端包含1、2、3、4、5、6、7、8、9或10个尿嘧啶(U)。
sgRNA可以被化学修饰。在一些实施方案中,化学修饰的gRNA是包含至少一个具有化学修饰(例如,2’-O-甲基糖修饰)的核苷酸的gRNA。在一些实施方案中,化学修饰的gRNA包含修饰的核酸主链。在一些实施方案中,化学修饰的gRNA包含2’-O-甲基-硫代磷酸酯残基。在一些实施方案中,化学修饰增强稳定性,降低先天免疫应答的可能性或程度,和/或增强其他属性,如本领域所述的。
在一些实施方案中,修饰的gRNA可以包含修饰的主链,例如硫代磷酸酯、磷酸三酯、吗啉代、甲基膦酸酯、短链烷基(alkyl)或环烷基糖间键或短链杂原子或杂环糖间键。
基于吗啉代的化合物描述于Braasch和David Corey,Biochemistry,2002,41(14):4503-4510;Genesis,2001,Volume 30,Issue 3;Heasman,Dev.Biol.,2002,243:209-214;Nasevicius等人,Nat.Genet.,2000,26:216-220;Lacerra等人,Proc.Natl.Acad.Sci.,2000,97:9591-9596.;和1991年7月23日发布的美国专利第5,034,506号。
环己烯基核酸寡核苷酸模拟物描述于Wang等人,J.Am.Chem.Soc.,2000,122:8595-8602。
在一些实施方案中,修饰的gRNA可以在2’位置包含一个或更多个取代的糖部分,例如下列之一:OH、SH、SCH3、F、OCN、OCH3、OCH3 O(CH2)n CH3、O(CH2)n NH2或O(CH2)nCH3,其中n为1至约10;C1-C10低级烷基、烷氧基烷氧基、取代的低级烷基、烷芳基或芳烷基;Cl;Br;CN;CF3;OCF3;O-、S-或N-烷基;O-、S-或N-烯基;SOCH3;SO2 CH3;ONO2;NO2;N3;NH2;杂环烷基;杂环烷芳基;氨基烷基氨基;聚烷基氨基;取代的甲硅烷基;RNA裂解基团;报告基团;嵌入剂;2'-O-(2-甲氧基乙基);2'-甲氧基(2'-O-CH3);2'-丙氧基(2'-OCH2 CH2CH3);和2'-氟(2'-F)。也可以在gRNA上的其他位置进行类似的修饰,特别是在3’末端核苷酸上的糖的3’位置和5’末端核苷酸的5’位置。在一些实例中,核苷酸单元的糖和核苷间键,即主链,都可以被新的基团代替。
另外地或可选地,引导RNA还可以包括核碱基(本领域中通常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然的”核碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括在天然核酸中很少或短暂发现的核碱基,例如次黄嘌呤、6-甲基腺嘌呤、5-Me嘧啶,特别是5-甲基胞嘧啶(也称为5-甲基-2’脱氧胞嘧啶,在本领域中通常称为5-Me-C)、5-羟甲基胞嘧啶(HMC)、糖基HMC和龙胆二糖基HMC,以及合成的核碱基,例如2-氨基腺嘌呤、2-(甲基氨基)腺嘌呤、2-(咪唑基烷基)腺嘌呤、2-(氨基烷基氨基)腺嘌呤或其他杂取代的烷基腺嘌呤、2-硫尿嘧啶、2-硫胸腺嘧啶、5-溴尿嘧啶、5-羟甲基尿嘧啶、8-氮杂鸟嘌呤、7-脱氮鸟嘌呤、N6(6-氨基己基)腺嘌呤和2,6-二氨基嘌呤。Kornberg,A.,DNA Replication,W.H.Freeman&Co.,San Francisco,pp.75-77,1980;Gebeyehu等人,Nucl.Acids Res.1997,15:4513。也可以包括本领域已知的“通用”碱基,例如肌苷。5-Me-C取代已被显示可将核酸双链体的稳定性提高0.6-1.2℃,(Sanghvi,Y.S.,inCrooke,S.T.and Lebleu,B.,eds.,Antisense Research and Applications,CRC Press,Boca Raton,1993,pp.276-278)并且是碱基取代的方面。
经修饰的核碱基可以包括其他合成以及天然的核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物,2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-卤代尿嘧啶(5-halouracil)和胞嘧啶、5-丙炔基尿嘧啶和胞嘧啶,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶,8-卤代、8-氨基、8-巯基、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤代特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。
靶向基因组的核酸与核酸内切酶的复合体
gRNA与核酸内切酶(例如,RNA引导的核酸酶诸如Cas9)相互作用,从而形成复合体。gRNA将核酸内切酶引导到靶多核苷酸。
核酸内切酶和gRNA可以各自分别施用至细胞或受试者。在一些实施方案中,核酸内切酶可以与一种或更多种引导RNA,或一种或更多种crRNA以及tracrRNA预复合。然后可以将预复合的材料施用至细胞或受试者。这样的预复合材料被称为核糖核蛋白颗粒(RNP)。RNP中的核酸内切酶可以是例如Cas9核酸内切酶或Cpf1核酸内切酶。核酸内切酶可以在N-末端、C-末端或N-末端和C-末端二者侧接一个或更多个核定位信号(NLS)。例如,Cas9核酸内切酶的侧翼可以有两个NLS,一个NLS位于N-末端,并且第二个NLS位于C-末端。NLS可以是本领域已知的任何NLS,诸如SV40 NLS。RNP中靶向基因组的核酸与核酸内切酶的摩尔比的范围可为约1:1至约10:1。例如,RNP中sgRNA与Cas9核酸内切酶的摩尔比可以是3:1。
编码系统组分的核酸
本公开内容提供了一种核酸,其包含编码本公开内容的基因组靶向核酸的核苷酸序列、本公开内容的核酸内切酶和/或实施本公开内容的方法的方面所需的任何核酸或蛋白分子。编码核酸可以是RNA、DNA或其组合。
编码本公开内容的基因组靶向核酸的核酸、本公开内容的核酸内切酶和/或实施本公开内容的方法的方面所需的任何核酸或蛋白分子可以构成载体(例如,重组表达载体)。
术语“载体”是指能够转运与其连接的另一核酸的核酸分子。一种类型的载体是质粒,其是指可以将另外的核酸区段连接到其中的环状双链DNA环。另一种类型的载体为病毒载体,其中另外的核酸区段可以被连接到病毒基因组中。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被引入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入到宿主细胞后被整合进宿主细胞的基因组中,并且从而与宿主基因组一起复制。
在一些实例中,载体可以能够指导与它们可操作地连接的核酸的表达。这样的载体在本文中被称为“重组表达载体”,或更简单地称为“表达载体”,它们具有等效的功能。
术语“可操作地连接”是指,感兴趣的核苷酸序列以允许核苷酸序列表达的方式连接到调节序列。术语“调节序列”意在包括例如启动子、增强子和其他表达控制元件(例如,多腺苷酸化信号)。这样的调节序列是本领域熟知的,并且例如在Goeddel;GeneExpression Technology:Methods in Enzymology,1990,185,Academic Press,SanDiego,CA中描述。调节序列包括那些在许多类型的宿主细胞中指导核苷酸序列组成型表达的序列,以及那些仅在某些宿主细胞中指导核苷酸序列表达的序列(例如,组织特异性调节序列)。本领域技术人员将理解,表达载体的设计可以取决于诸如靶细胞的选择、所需的表达水平等因素。
设想的表达载体包括但不限于基于痘苗病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、SV40、单纯疱疹病毒、人类免疫缺陷病毒、逆转录病毒(例如,鼠白血病病毒、脾坏死病毒和来源于逆转录病毒的载体,诸如劳氏肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人类免疫缺陷病毒、骨髓增生性肉瘤病毒和乳腺肿瘤病毒)的病毒载体和其他重组载体。设想用于真核靶细胞的其他载体包括但不限于载体pXT1、pSG5、pSVK3、pBPV、pMSG和pSVLSV40(Pharmacia)。可以使用其他载体,只要它们与宿主细胞相容。
在一些实例中,载体可以包含一个或更多个转录和/或翻译控制元件。根据所使用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任何一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等。载体可以是自失活载体,其可以使病毒序列或CRISPR机制的组分或其他元件失活。
合适的真核启动子(即,在真核细胞中有功能的启动子)的非限制性实例包括来自以下的启动子:巨细胞病毒(CMV)即刻早期、单纯疱疹病毒(HSV)胸苷激酶、早期和晚期SV40、来自逆转录病毒的长末端重复序列(LTR)、人类延伸因子-1α启动子(EF1α)、鸡β-肌动蛋白启动子(CBA)、泛素C启动子(UBC)、包含与鸡β-肌动蛋白启动子融合的巨细胞病毒增强子的杂交构建体、包含与鸡β-肌动蛋白基因的启动子(CAG或CAGGS)、第一外显子和第一内含子融合的巨细胞病毒增强子的杂交构建体、鼠干细胞病毒启动子(MSCV)、磷酸甘油酸激酶-1基因座启动子(PGK)和小鼠金属硫蛋白-I启动子。
启动子可以是诱导型启动子(例如,热休克启动子、四环素调节启动子、类固醇调节启动子、金属调节启动子、雌激素受体调节启动子等)。启动子可以是组成型启动子(例如,CMV启动子、UBC启动子、CAG或CAGGS启动子)。在一些情况下,启动子可以是空间受限和/或时间受限的启动子(例如,组织特异性启动子、细胞类型特异性启动子等)。
可以通过病毒或噬菌体感染、转染、缀合、原生质体融合、脂质感染、电穿孔、核转染、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微量注射、纳米粒子介导的核酸递送等将本公开内容的复合体、多肽和核酸引入细胞。
IV.细胞类型
本文所述的细胞,例如通用供体细胞(和相应的未修饰的细胞)可以属于任何可能类别的细胞类型。在一些实施方案中,细胞,例如通用供体细胞(和相应的未修饰的细胞)可以是哺乳动物细胞。在一些实施方案中,细胞,例如通用供体细胞(和相应的未修饰的细胞)可以是人类细胞。在一些实施方案中,细胞,例如通用供体细胞(和相应的未修饰的细胞)可以是干细胞。在一些实施方案中,细胞,例如通用供体细胞(和相应的未修饰的细胞)可以是多能干细胞(PSC)。在一些实施方案中,细胞,例如通用供体细胞(和相应的未修饰的细胞)可以是胚胎干细胞(ESC)、成体干细胞(ASC)、诱导多能干细胞(iPSC)或造血干细胞或祖细胞(HSPC)(也称为造血干细胞(HSC))。在一些实施方案中,细胞,例如通用供体细胞(和相应的未修饰的细胞)可以是分化细胞。在一些实施方案中,细胞,例如通用供体细胞(和相应的未修饰的细胞)可以是体细胞,例如免疫系统细胞、胰腺细胞或收缩细胞,例如骨骼肌细胞。
本文所述的细胞,例如通用供体干细胞,可以分化成相关的细胞类型,以评估HLA表达,以及评价通用干细胞系的免疫原性。一般而言,分化包括将感兴趣的细胞在足以使细胞分化成感兴趣的分化细胞的条件下维持一段时间。例如,本文公开的通用干细胞可以分化成间充质祖细胞(MPC)、低免疫原性心肌细胞、肌肉祖细胞、母细胞、内皮细胞(EC)、巨噬细胞、肝细胞、β细胞(例如,胰腺β细胞)、胰腺内胚层祖细胞、胰腺内分泌祖细胞、胰腺内分泌细胞、造血祖细胞或神经祖细胞(NPC)。在一些实施方案中,通用供体细胞可以分化成定形内胚层细胞、原肠管细胞、后前肠细胞、胰腺内胚层细胞(PEC)、胰腺内分泌细胞、未成熟β细胞或成熟β细胞。
干细胞既能增殖又能产生更多的祖细胞,这些祖细胞继而具有产生大量母细胞的能力,这些母细胞继而能产生分化或可分化的子细胞。子细胞本身可以被诱导增殖并产生子代,该子代随后分化为一种或更多种成熟细胞类型,同时还保留一种或更多种具有亲本发育潜力的细胞。因此,术语“干细胞”是指在特定情况下具有分化为更专门化或更分化的表型的能力或潜力,并且在特定情况下保持增殖而不实质分化的能力的细胞。在一个方面,术语祖细胞或干细胞是指广义的母细胞,其后代(子代)通常通过分化在不同方向上专门化,例如通过获得完全独立的特征,如在胚胎细胞和组织的渐进多样化中发生的那样。细胞分化是通常通过许多细胞分裂而发生的复杂过程。分化的细胞可以衍生自专能细胞,该专能细胞本身也衍生自专能细胞,等等。虽然这些多能细胞中的每一种都可以被认为是干细胞,但是每种细胞所能产生的细胞类型的范围可能相差很大。一些分化的细胞也具有产生更大发展潜力的细胞的能力。这样的能力可以是天然的,也可以在用各种因子处理时由人工诱导。
例如,人类胚胎干细胞(hESC)可以通过需要添加特定生长因子和小分子的七阶段过程人工分化为产生胰岛素的细胞。这七个阶段包括1)定型内胚层,2)原始肠管,3)后前肠,4)胰腺内胚层,5)胰腺内胚层前体,6)未成熟β细胞,和7)成熟β细胞。例如,如Schulz等人.(2012)PLoS ONE 7(5):e37004,Rezania等人.(2014)Nat.Biotechnol.32(11):1121-1133和/或US20200208116所述,人类多能干细胞可以分化成胰腺谱系。在许多生物学情况下,干细胞也是“专能的”,因为它们可以产生不止一种不同细胞类型的子代,但这不是“干性(stemness)”所必需的。
“分化细胞”是在发育途径中比与之比较的细胞进展得更远的细胞。因此,干细胞可以分化成谱系限制性前体细胞(诸如,肌细胞祖细胞),其继而可以沿途径进一步分化成其他类型的前体细胞(诸如,肌细胞前体细胞),然后分化成终末期分化细胞,诸如肌细胞,其在某种组织类型中起特征作用,并且可以或可以不保留进一步增殖的能力。在一些实施方案中,分化细胞可以是胰腺β细胞。
胚胎干细胞
本文描述的细胞可以是胚胎干细胞(ESC)。ESC来源于哺乳动物胚胎的胚细胞,并且能够分化成任何细胞类型并快速增殖。ESC还被认为具有正常的核型,保持高端粒酶活性,并表现出显著的长期增殖潜力,使这些细胞成为用作通用供体细胞的优秀候选物。
成体干细胞
本文描述的细胞可以是成体干细胞(ASC)。ASC是可以在哺乳动物(例如,人类)中发现的未分化细胞。ASC由它们自我更新,例如,在保持其未分化状态的同时通过若干轮细胞复制的能力,以及分化成若干种不同细胞类型例如神经胶质细胞的能力来定义。成体干细胞是一大类干细胞,可包括造血干细胞、乳腺干细胞、肠干细胞、间充质干细胞、内皮干细胞、神经干细胞、嗅觉成体干细胞、神经嵴干细胞和睾丸细胞。
诱导多能干细胞
本文描述的细胞可以是诱导多能干细胞(iPSC)。iPSC可以通过引入编码参与多能性的关键转录因子的基因,例如OCT4、SOX2、cMYC和KLF4,直接从成体人类细胞产生。iPSC可以来源于将施用后续祖细胞的同一受试者。也就是说,可以从受试者获得体细胞,重新编程为诱导多能干细胞,然后重新分化为将施用至受试者的祖细胞(例如,自体细胞)。然而,在自体细胞的情况下,仍然存在植入后免疫应答和低生存力的风险。在一些实施方案中,iPSC源自商业来源。在一些实施方案中,iPSC在分化成谱系限制性祖细胞或完全分化的体细胞之前被基因编辑。
人类造血干细胞和祖细胞
本文描述的细胞可以是人类造血干细胞和祖细胞(hHSPC)。这种干细胞谱系产生所有血细胞类型,包括红系(红细胞(erythrocyte)或红细胞(RBC))、髓系(单核细胞和巨噬细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、巨核细胞/血小板和树突状细胞)和淋巴系(T细胞、B细胞、NK细胞)。血细胞由非常小的多能造血干细胞(HSC)群体的增殖和分化产生,这些多能造血干细胞也具有通过自我更新来补充自身的能力。在分化过程中,HSC的后代在达到成熟之前经历各种中间成熟阶段,产生多潜能和谱系定向的祖细胞。骨髓(BM)是人类造血的主要场所,并且在正常情况下,外周血(PB)中只能发现少量造血干细胞和祖细胞(HSPC)。使用细胞因子、一些用于癌症治疗的骨髓抑制药物以及破坏造血和BM基质细胞之间相互作用的化合物进行处理,可以快速动员大量干细胞和祖细胞进入循环。
细胞向其他细胞类型的分化
本公开内容的方法的另一个步骤可以包括将细胞分化成分化的细胞。分化步骤可以根据本领域已知的任何方法来执行。例如,使用各种处理,包括活化素和B27补充剂(LifeTechnologies),将人类iPSC分化为定形内胚层。定形内胚层进一步分化为肝细胞,处理包括:FGF4、HGF、BMP2、BMP4、抑瘤素M、地塞米松等(Duan等人,Stem Cells,2010;28:674-686;Ma等人,Stem Cells Translational Medicine,2013;2:409-419)。在另一种实施方案中,可根据Sawitza等人,Sci Rep.2015;5:13320进行分化步骤。分化细胞可以是哺乳动物例如人类的任何体细胞。在一些实施方案中,体细胞可以是外分泌上皮细胞(例如,唾液腺粘液细胞、前列腺细胞)、激素分泌细胞(例如,垂体前叶细胞、肠道细胞、胰岛细胞)、角化上皮细胞(例如,表皮角质形成细胞)、湿分层屏障上皮细胞、感觉转导细胞(例如,光感受器)、自主神经元细胞、感觉器官和外周神经元支持细胞(例如,许旺细胞)、中枢神经系统神经元、神经胶质细胞(例如,星形胶质细胞、少突胶质细胞)、晶状体细胞、脂肪细胞、肾细胞、屏障功能细胞(例如,导管细胞)、细胞外基质细胞、收缩细胞(例如,骨骼肌细胞、心肌细胞、平滑肌细胞)、血细胞(例如,红细胞)、免疫系统细胞(例如,巨核细胞、小神经胶质细胞、中性粒细胞、肥大细胞、T细胞、B细胞、自然杀伤细胞)、生殖细胞(例如,精子细胞)、营养细胞或间质细胞。
通常,本文公开的通用供体细胞群体随着时间保持插入的一个或更多个核苷酸序列的表达。例如,至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或至少约99%的通用供体细胞表达插入的一种或更多种致耐受性因子和/或存活因子。此外,来源于本文公开的通用供体细胞的谱系限制性或完全分化的细胞群体随着时间保持插入的一个或更多个核苷酸序列的表达。例如,至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或至少约99%的谱系限制性或完全分化的细胞表达一种或更多种致耐受性因子和/或存活因子。
V.制剂和施用
用于基因编辑的制剂和递送
本文所述的引导RNA、多核苷酸,例如编码致耐受性因子和/或存活因子的多核苷酸,或编码核酸内切酶的多核苷酸,以及核酸内切酶可以本领域已知的任何方式配制并递送至细胞。
取决于特定的施用模式和剂型,引导RNA和/或多核苷酸可以用药学上可接受的赋形剂诸如载体、溶剂、稳定剂、佐剂、稀释剂等配制。引导RNA和/或多核苷酸组合物可以被配制以获得生理相容的pH,并且取决于制剂和施用途径,范围从pH约3到pH约11,约pH 3到约pH 7。在一些情况下,pH可以调节到从约pH 5.0到约pH 8的范围。在一些情况下,组合物可以包含治疗有效量的至少一种如本文所述的化合物以及一种或更多种药学上可接受的赋形剂。任选地,组合物可以包含本文所述化合物的组合,或者可以包含可用于治疗或预防细菌生长的第二活性成分(例如但不限于抗菌剂或抗微生物剂),或者可以包含本公开内容的试剂的组合。
合适的赋形剂包括例如载体分子,其包括大的、缓慢代谢的大分子,诸如蛋白质、多糖、聚乳酸、聚乙醇酸、聚氨基酸、氨基酸共聚物和无活性病毒颗粒。其他示例性赋形剂可以包括抗氧化剂(例如但不限于抗坏血酸)、螯合剂(例如但不限于EDTA)、碳水化合物(例如但不限于糊精、羟烷基纤维素和羟烷基甲基纤维素)、硬脂酸、液体(例如但不限于油、水、盐水、甘油和乙醇)、润湿剂或乳化剂、pH缓冲物质等。
引导RNA多核苷酸(RNA或DNA)和/或核酸内切酶多核苷酸(RNA或DNA)可以通过本领域已知的病毒或非病毒递送媒介物递送。可选地,核酸内切酶多肽可以通过本领域已知的病毒或非病毒递送媒介物递送,诸如电穿孔或脂质纳米颗粒。在另外的替代方面,DNA核酸内切酶可以作为一种或更多种多肽单独递送,或者与一种或更多种引导RNA、或者一种或更多种crRNA与tracrRNA一起预复合地递送。
多核苷酸可以通过非病毒递送媒介物递送,包括但不限于纳米颗粒、脂质体、核糖核蛋白、带正电荷的肽、小分子RNA-缀合物、适体-RNA嵌合体和RNA-融合蛋白复合体。一些示例性非病毒递送媒介物在Peer和Lieberman,Gene Therapy,2011,18:1127-1133(其集中于也可用于递送其他多核苷酸的siRNA的非病毒递送媒介物)中描述。
对于本公开内容的多核苷酸,制剂可以选自例如国际申请PCT/US2012/069610中教导的任何制剂。
多核苷酸,诸如引导RNA、sgRNA和编码核酸内切酶的mRNA,可以通过脂质纳米颗粒(LNP)递送到细胞或受试者。
LNP是指具有直径小于1000nm、500nm、250nm、200nm、150nm、100nm、75nm、50nm或25nm的任何颗粒。可选地,纳米颗粒的尺寸范围可为1-1000nm、1-500nm、1-250nm、25-200nm、25-100nm、35-75nm或25-60nm。
LNP可以由阳离子、阴离子或中性脂质制成。中性脂质,诸如融合磷脂DOPE或膜组分胆固醇,可以作为“辅助脂质”包含在LNP中,以增强转染活性和纳米颗粒稳定性。阳离子脂质的局限性包括由于稳定性差和清除快而导致的低功效,以及炎症反应或抗炎症反应的产生。
LNP也可以由疏水性脂质、亲水性脂质或疏水性和亲水性脂质二者组成。
本领域已知的任何脂质或脂质组合都可以用于产生LNP。用于产生LNP的脂质的实例是:DOTMA、DOSPA、DOTAP、DMRIE、DC-胆固醇、DOTAP-胆固醇、GAP-DMORIE-DPyPE和GL67A-DOPE-DMPE-聚乙二醇(PEG)。阳离子脂质的实例是:98N12-5、C12-200、DLin-KC2-DMA(KC2)、DLin-MC3-DMA(MC3)、XTC、MD1和7C1。中性脂质的实例是:DPSC、DPPC、POPC、DOPE和SM。PEG修饰的脂质的实例是:PEG-DMG、PEG-CerC14和PEG-CerC20。
脂质可以以任意数量的摩尔比组合以产生LNP。此外,多核苷酸可与脂质以宽范围的摩尔比组合以产生LNP。
重组腺相关病毒(AAV)载体可用于递送。产生rAAV颗粒的技术是本领域的标准技术,其中将被包装的AAV基因组(包括要递送的多核苷酸、rep和cap基因以及辅助病毒功能)提供给细胞。rAAV的产生通常需要以下组分存在于单个细胞(本文表示为包装细胞)中:rAAV基因组、与rAAV基因组分离(即不在rAAV基因组中)的AAV rep和cap基因以及辅助病毒功能。AAV rep和cap基因可以来自可以衍生重组病毒的任何AAV血清型,并且可以来自不同于rAAV基因组ITR的AAV血清型,包括但不限于本文所述的AAV血清型。在例如国际专利申请公布第WO 01/83692号中公开了假型rAAV的产生。
细胞例如通用供体细胞的制剂和施用
本文所述的遗传修饰的细胞,例如通用供体细胞,可以通过本领域已知的任何方式配制并施用至受试者。
术语“施用”、“引入”、“植入(implanting)”、“植入(engrafting)”和“移植”在通过导致引入的细胞至少部分定位在所需位点的方法或途径将细胞(例如,祖细胞)放置到受试者中的上下文中可互换使用。细胞,例如祖细胞,或它们的分化的后代可以通过任何合适的途径施用,该途径导致递送到受试者的期望位置,在那里至少一部分植入的细胞或细胞的组分保持存活。向受试者施用后细胞的存活期可以短至几小时,例如24小时,至几天、至几年或者甚至是受试者的一生,即长期植入。
本文所述的遗传修饰的细胞,例如通用供体细胞,可以在施用至受试者后比未修饰的细胞存活更长的时间段。
在一些实施方案中,包含本文所述细胞的组合物可以通过合适的途径施用,该途径可以包括静脉施用,例如,作为推注或通过在一段时间内连续输注。在一些实施方案中,静脉施用可以通过肌内、腹膜内、脑脊液内、皮下、关节内、滑膜内或鞘内途径进行。在一些实施方案中,组合物可以呈固体形式、水性形式或液体形式。在一些实施方案中,水性或液体形式可以是雾化或冻干的。在一些实施方案中,雾化或冻干形式可以用水性或液体溶液重构。
细胞组合物也可以乳化或作为脂质体组合物呈现,前提是乳化过程不会对细胞生存力产生不利影响。细胞和任何其他活性成分可以与赋形剂混合,所述赋形剂是药学上可接受的并且与活性成分相容,其量适合用于本文所述的治疗方法。
细胞组合物中包含的另外的剂可包括其中的组分的药学上可接受的盐。药学上可接受的盐包括用无机酸诸如例如盐酸或磷酸,或用有机酸诸如乙酸、酒石酸、扁桃酸等形成的酸加成盐(与多肽的游离氨基基团形成的酸加成盐)。与游离羧基基团形成的盐还可以来源于无机碱,诸如例如钠、钾、铵、钙或铁的氢氧化物;和有机碱,诸如异丙胺、三甲胺、2-乙基氨基乙醇、组氨酸、普鲁卡因等。
生理上可耐受的载体是本领域熟知的。示例性液体载体是除活性成分和水之外不含任何物质的无菌水性溶液,或者含有缓冲液诸如生理pH值的磷酸钠、生理盐水或二者,诸如磷酸盐缓冲盐水。此外,水性载体可以包含多于一种缓冲盐,以及盐,诸如氯化钠和氯化钾、右旋糖、聚乙二醇和其他溶质。液体组合物还可以除水之外包含液相以及不包含水而包含液相。这样的另外液相的实例是甘油、植物油诸如棉籽油和水-油乳液。在有效治疗特定紊乱或状况的细胞组合物中使用的活性化合物的量可以取决于紊乱或状况的性质,并且可以通过标准临床技术来确定。
在一些实施方案中,可以将包含细胞的组合物施用至患有疾病或紊乱、怀疑患有疾病或紊乱或处于疾病或紊乱风险中的受试者,例如人类受试者。在一些实施方案中,组合物可以向没有疾病或紊乱、没有被怀疑有疾病或紊乱或没有疾病或障碍风险的受试者施用。在一些实施方案中,受试者是健康的人类。在一些实施方案中,受试者例如人类受试者患有可遗传疾病或紊乱、被怀疑患有可遗传疾病或紊乱或处于可遗传疾病或紊乱风险。在一些实施方案中,受试者正在遭受指示疾病或紊乱的症状或处于发展指示疾病或紊乱的症状的风险中。在一些实施方案中,疾病是糖尿病,例如I型糖尿病或II型糖尿病。在一些实施方案中,紊乱是胰腺切除术。
VI.本公开内容的具体组合物和方法
因此,本公开内容特别涉及以下非限制性组合物和方法。
在第一组合物即组合物1中,本公开内容提供了包含遗传修饰的细胞的组合物,遗传修饰的细胞包含:(a)被破坏的B2M基因和编码中脑星形胶质细胞来源的神经营养因子(MANF)的第一多核苷酸在被破坏的B2M基因中的第一插入;(b)被破坏的TXNIP基因和编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的第二多核苷酸在被破坏的TXNIP基因中的第二插入;其中所述细胞表达MANF和TNFAIP3,并且具有B2M和TXNIP的被破坏的表达。
在另一组合物即组合物2中,本公开内容提供了根据组合物1的组合物,其中第一插入还包含编码HLA I类组织相容性抗原α链E(HLA-E)的第三多核苷酸。
在另一组合物即组合物3中,本公开内容提供了根据组合物1或2的组合物,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一组合物即组合物4中,本公开内容提供了根据组合物1至3中任一项的组合物,其中编码MANF的第一多核苷酸通过编码P2A肽的多核苷酸连接到编码HLA-E的第三多核苷酸,使得第一插入包含MANF-P2A-HLA-E构建体。
在另一组合物即组合物5中,本公开内容提供了根据组合物4的组合物,其中所述MANF-P2A-HLA-E构建体包含基本上由SEQ ID NO:55组成的多核苷酸序列。
在另一组合物即组合物6中,本公开内容提供了根据组合物4或5的组合物,其中所述MANF-P2A-HLA-E构建体可操作地连接到外源启动子。
在另一组合物即组合物7中,本公开内容提供了根据组合物1至6中任一项的组合物,其中第二插入还包含编码程序性死亡配体1(PD-L-1)的第四多核苷酸。
在另一组合物即组合物8中,本公开内容提供了根据组合物1至7中任一项的组合物,其中编码TNFAIP3的第二核苷酸序列通过编码P2A肽的核苷酸序列连接到编码PD-L-1的第四核苷酸序列,使得第二插入包含TNFAIP3-P2A-PD-L-1构建体。
在另一组合物即组合物9中,本公开内容提供了根据组合物8的组合物,其中所述TNFAIP3-P2A-PD-L-1构建体包含基本上由SEQ ID NO:54组成的核苷酸序列。
在另一组合物即组合物10中,本公开内容提供了根据组合物8或9的组合物,其中TNFAIP3-P2A-PD-L-1构建体可操作地连接到外源启动子。
在另一组合物即组合物11中,本公开内容提供了根据组合物1至10中任一项的组合物,其中B2M和TXNIP的被破坏的表达包括B2M和/或TXNIP的表达减少或消除。
在另一组合物即组合物12中,本公开内容提供了根据组合物1至11中任一项的组合物,其中与没有多核苷酸插入和基因破坏的可比细胞(comparable cell)相比,通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一组合物即组合物13中,本公开内容提供了根据组合物1至12中任一项的组合物,其中所述细胞是干细胞。
在另一组合物即组合物14中,本公开内容提供了根据组合物13的组合物,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一组合物即组合物15中,本公开内容提供了根据组合物1至12中任一项的组合物,其中所述细胞是分化细胞或体细胞。
在另一组合物即组合物16中,本公开内容提供了根据组合物15的组合物,其中所述细胞分化为谱系限制性祖细胞或完全分化的体细胞。
在另一组合物即组合物17中,本公开内容提供了根据组合物16的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞或未成熟β细胞,并且完全分化的体细胞是β细胞。
在另一组合物即组合物18中,本公开内容提供了一种组合物,该组合物包含多于一种根据组合物1至17中任一项的遗传修饰的细胞。
在另一组合物即组合物19中,本公开内容提供了一种组合物,该组合物包含来源于组合物18的多于一种遗传修饰的细胞的谱系限制性祖细胞或完全分化的体细胞的群体。
在另一组合物即组合物20中,本公开内容提供了根据组合物19的组合物,其中所述群体包括定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
在另一组合物即组合物21中,本公开内容提供了一种组合物,该组合物包含组合物18的多于一种细胞或组合物19的细胞群体和至少一种药学上可接受的赋形剂。
在第一方法即方法22中,本公开内容提供了一种用于治疗有相应需要的受试者的胰腺疾病或紊乱的方法,即方法22,该方法包括:(a)获得或已经获得权利要求19的谱系限制性祖细胞或完全分化的体细胞的群体,其中所述谱系限制性祖细胞或完全分化的体细胞包括胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(b)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或β细胞。
在另一方法即方法23中,本公开内容提供了一种用于治疗有相应需要的受试者的胰腺疾病或紊乱的方法,即方法23,所述方法包括(a)获得或已经获得权利要求18的多于一种遗传修饰的细胞,其中所述多于一种遗传修饰的细胞包括干细胞;(b)将所述遗传修饰的细胞分化为胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(c)向受试者施用胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
在另一方法即方法24中,本公开内容提供了方法22或23中提供的方法,其中胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
在另一组合物即组合物25中,本公开内容提供了包含遗传修饰的细胞的组合物,所述遗传修饰的细胞包含(a)编码中脑星形胶质细胞来源的神经营养因子(MANF)的第一外源多核苷酸插入、编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的第二外源多核苷酸插入、编码分化簇39(CD39)的第三外源多核苷酸插入和/或编码分化簇73(CD73)的第四外源多核苷酸插入,其中所述遗传修饰的细胞表达CD39、MANF、TNFAIP3和/或CD73;和/或(b)被破坏的编码转化生长因子β(TGFβ)蛋白、β-2-微球蛋白(B2M)蛋白、硫氧还蛋白相互作用蛋白(TXNIP)蛋白和/或II类反式激活因子(CIITA)蛋白的基因,其中所述遗传修饰的细胞具有TGFβ蛋白、B2M蛋白、TXNIP蛋白和/或CIITA蛋白的被破坏的表达。
在另一组合物即组合物26中,本公开内容提供了根据组合物25的组合物,其中遗传修饰的细胞包含编码MANF的第一外源多核苷酸并表达MANF。
在另一组合物即组合物27中,本公开内容提供了根据组合物25或26的组合物,其中第一外源多核苷酸可操作地连接到外源启动子。
在另一组合物即组合物28中,本公开内容提供了根据组合物25至27中任一项的组合物,其中第一外源多核苷酸包含基本上由SEQ ID NO:17组成的核苷酸序列。
在另一组合物即组合物29中,本公开内容提供了根据组合物25至28中任一项的组合物,其中所述遗传修饰的细胞包含编码TNFAIP3的第二外源多核苷酸并表达TNFAIP3。
在另一组合物即组合物30中,本公开内容提供了根据组合物25至29中任一项的组合物,其中第二外源多核苷酸可操作地连接到外源启动子。
在另一组合物即组合物31中,本公开内容提供了根据组合物25至30中任一项的组合物,其中第二外源多核苷酸包含基本上由SEQ ID NO:19组成的核苷酸序列。
在另一组合物即组合物32中,本公开内容提供了根据组合物25至31中任一项的组合物,其中所述遗传修饰的细胞包含编码CD39的第三外源多核苷酸并表达CD39。
在另一组合物即组合物33中,本公开内容提供了根据组合物25至32中任一项的组合物,其中第三外源多核苷酸可操作地连接到外源启动子。
在另一组合物即组合物34中,本公开内容提供了根据组合物25至33中任一项的组合物,其中第三外源多核苷酸包含基本上由SEQ ID NO:27组成的核苷酸序列。
在另一组合物即组合物35中,本公开内容提供了根据组合物25至34中任一项的组合物,其中所述遗传修饰的细胞包含编码CD73的第四外源多核苷酸并表达CD73。
在另一组合物即组合物36中,本公开内容提供了根据组合物25至35中任一项的组合物,其中编码CD73的第四外源多核苷酸可操作地连接到外源启动子。
在另一组合物即组合物37中,本公开内容提供了根据组合物25至36中任一项的组合物,其中编码CD73的第四外源多核苷酸包含基本上由SEQ ID NO:46组成的核苷酸序列。
在另一组合物即组合物38中,本公开内容提供了根据组合物25至37中任一项的组合物,其中遗传修饰的细胞包含编码CD39的第三外源多核苷酸和编码CD73的第四外源多核苷酸并表达CD39和CD73,其中编码CD39的第三外源多核苷酸通过编码P2A肽的多核苷酸连接到编码CD73的第四外源多核苷酸,使得编码CD39的第三外源多核苷酸、编码P2A肽的多核苷酸和编码CD73的第四外源多核苷酸形成CD39-P2A-CD73构建体。
在另一组合物即组合物39中,本公开内容提供了根据组合物38的组合物,其中CD39-P2A-CD73构建体可操作地连接到外源启动子。
在另一组合物即组合物40中,本公开内容提供了根据组合物38或39的组合物,其中CD39-P2A-CD73构建体包含基本上由SEQ ID NO:58组成的核苷酸序列。
在另一组合物即组合物41中,本公开内容提供了根据组合物25至40中任一项的组合物,该组合物还包含编码HLA I类组织相容性抗原α链E(HLA-E)的第五外源多核苷酸,其中所述遗传修饰的细胞表达HLA-E。
在另一组合物即组合物42中,本公开内容提供了根据组合物41的组合物,其中编码HLA-E的第五外源多核苷酸包含编码HLA-E三聚体的多核苷酸,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一组合物即组合物43中,本公开内容提供了根据组合物41或42的组合物,其中编码HLA-E的第五外源多核苷酸可操作地连接到外源启动子。
在另一组合物即组合物44中,本公开内容提供了根据组合物41至43中任一项的组合物,其中编码HLA-E的第五外源多核苷酸包含基本上由SEQ ID NO:43组成的核苷酸序列。
在另一组合物即组合物45中,本公开内容提供了根据组合物41至44中任一项的组合物,该组合物包含编码MANF的第一外源多核苷酸和编码HLA-E的第五外源多核苷酸,其中编码MANF的第一外源多核苷酸通过编码P2A肽的多核苷酸连接到编码HLA-E的第五外源多核苷酸,使得第一外源多核苷酸、编码P2A肽的多核苷酸和第五外源多核苷酸形成MANF-P2A-HLA-E构建体。
在另一组合物即组合物46中,本公开内容提供了根据组合物45的组合物,其中MANF-P2A-HLA-E构建体可操作地连接到外源启动子。
在另一组合物即组合物47中,本公开内容提供了根据组合物45或46的组合物,其中MANF-P2A-HLA-E构建体包含基本上由SEQ ID NO:55组成的多核苷酸序列。
在另一组合物即组合物48中,本公开内容提供了根据组合物25至47中任一项的组合物,该组合物还包含编码程序性死亡配体1(PD-L-1)的第六外源多核苷酸,其中所述遗传修饰的细胞表达PD-L-1。
在另一组合物即组合物49中,本公开内容提供了根据组合物48的组合物,其中编码PD-L-1的第六外源多核苷酸可操作地连接到外源启动子。
在另一组合物即组合物50中,本公开内容提供了根据组合物48或49的组合物,其中第六外源多核苷酸包含基本上由SEQ ID NO:20组成的核苷酸序列。
在另一组合物即组合物51中,本公开内容提供了根据组合物48至50中任一项的组合物,该组合物包含编码TNFAIP3的第二外源多核苷酸和编码PD-L-1的第六外源多核苷酸,其中编码TNFAIP3的第二外源多核苷酸通过编码P2A肽的多核苷酸连接到编码PD-L-1的第六外源多核苷酸序列,使得第二外源多核苷酸、编码P2A肽的多核苷酸和第六外源多核苷酸形成TNFAIP3-P2A-PD-L-1构建体。
在另一组合物即组合物52中,本公开内容提供了根据组合物51的组合物,其中TNFAIP3-P2A-PD-L-1构建体可操作地连接到外源启动子。
在另一组合物即组合物53中,本公开内容提供了根据组合物51或52的组合物,其中TNFAIP3-P2A-PD-L-1构建体包含基本上由SEQ ID NO:54组成的核苷酸序列。
在另一组合物即组合物54中,本公开内容提供了根据组合物48至53中任一项的组合物,该组合物包含编码CD39的第三外源多核苷酸和编码PD-L-1的第六外源多核苷酸,其中编码CD39的第三外源多核苷酸通过编码P2A肽的多核苷酸连接到编码PD-L-1的第六外源多核苷酸,使得第三外源多核苷酸、编码P2A肽的多核苷酸和第六外源多核苷酸形成CD39-P2A-PD-L-1构建体。
在另一组合物即组合物55中,本公开内容提供了根据组合物54的组合物,其中CD39-P2A-PD-L-1构建体可操作地连接到外源启动子。
在另一组合物即组合物56中,本公开内容提供了根据组合物54或55的组合物,其中CD39-P2A-PD-L-1构建体包含基本上由SEQ ID NO:53组成的核苷酸序列。
在另一组合物即组合物57中,本公开内容提供了根据组合物48至56中任一项的组合物,该组合物包含编码MANF的第一外源多核苷酸、编码TNFAIP3的第二外源多核苷酸和编码PD-L-1的第六外源多核苷酸,其中第一外源多核苷酸通过编码P2A肽的第一多核苷酸连接到第二外源多核苷酸,并且第二外源多核苷酸通过编码P2A肽的第二多核苷酸连接到第六外源多核苷酸,使得编码MANF的第一外源多核苷酸、编码P2A肽的第一多核苷酸、编码TNFAIP3的第二外源多核苷酸、编码P2A肽的第二多核苷酸和编码PD-L-1的第六外源多核苷酸形成MANF-P2A-TNFAIP3-P2A-PD-L-1构建体。
在另一组合物即组合物58中,本公开内容提供了根据组合物57的组合物,其中MANF-P2A-TNFAIP3-P2A-PD-L-1可操作地连接到外源启动子。
在另一组合物即组合物59中,本公开内容提供了根据组合物57或58的组合物,其中MANF-P2A-TNFAIP3-P2A-PD-L-1构建体包含基本上由SEQ ID NO:52组成的核苷酸序列。
在另一组合物即组合物60中,本公开内容提供了根据组合物48至59中任一项的组合物,该组合物包含编码CD39的第三外源多核苷酸、编码CD73的第四外源多核苷酸和编码PD-L-1的第六外源多核苷酸,其中编码CD39的第三外源多核苷酸通过编码P2A肽的第一多核苷酸连接到编码CD73的第四外源多核苷酸,并且第四外源多核苷酸通过编码P2A肽的第二多核苷酸连接到第六外源多核苷酸,使得编码CD39的第三外源多核苷酸、编码P2A肽的第一多核苷酸、编码CD73的第四外源多核苷酸、编码P2A肽的第二多核苷酸和编码PD-L-1的第六外源多核苷酸形成CD39-P2A-CD73-P2A-PD-L-1构建体。
在另一组合物即组合物61中,本公开内容提供了根据组合物60的组合物,其中CD39-P2A-CD73-P2A-PD-L-1构建体可操作地连接到外源启动子。
在另一组合物即组合物62中,本公开内容提供了根据组合物60或61的组合物,其中CD39-P2A-CD73-P2A-PD-L-1构建体包含基本上由SEQ ID NO:56组成的核苷酸序列。
在另一组合物即组合物63中,本公开内容提供了根据组合物25至62中任一项的组合物,其中所述遗传修饰的细胞包含被破坏的B2M基因、被破坏的TXNIP基因、被破坏的CIITA基因和/或被破坏的TGFβ基因,并且所述细胞具有B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的被破坏的表达。
在另一组合物即组合物64中,本公开内容提供了根据组合物25至63中任一项的组合物,其中编码MANF的第一外源多核苷酸、编码TNFAIP3的第二外源多核苷酸、编码CD39的第三外源多核苷酸和/或编码CD73的第四外源多核苷酸各自独立地被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达。
在另一组合物即组合物65中,本公开内容提供了根据组合物25至64中任一项的组合物,该组合物还包含编码HLA I类组织相容性抗原α链E(HLA-E)的第五外源多核苷酸,其中编码HLA-E的第五外源多核苷酸被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达,并且其中通用供体细胞还表达HLA-E。
在另一组合物即组合物66中,本公开内容提供了根据组合物25至65中任一项的组合物,该组合物还包含编码程序性死亡配体1(PD-L-1)的第六外源多核苷酸,其中编码PD-L-1的第六外源多核苷酸被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达,并且其中通用供体细胞表达PD-L-1。
在另一组合物即组合物67中,本公开内容提供了根据组合物64至66中任一项的组合物,其中编码MANF的第一外源多核苷酸被插入B2M基因、TXNIP基因或CIITA基因和/或TGFβ基因内或附近。
在另一组合物即组合物68中,本公开内容提供了根据组合物64至67中任一项的组合物,其中编码MANF的第一外源多核苷酸被插入B2M基因和/或TXNIP基因内或附近,从而破坏B2M蛋白和/或TXNIP蛋白的表达。
在另一组合物即组合物69中,本公开内容提供了根据组合物64至68的组合物,其中编码TNFAIP3的第二外源多核苷酸被插入B2M基因、TXNIP基因或CIITA基因和/或TGFβ基因内或附近。
在另一组合物即组合物70中,本公开内容提供了根据组合物64至69的组合物,其中编码TNFAIP3的第二外源多核苷酸被插入B2M基因内或附近,从而破坏B2M蛋白的表达。
在另一组合物即组合物71中,本公开内容提供了根据组合物64至70中任一项的组合物,其中编码CD39的第三外源多核苷酸被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近。
在另一组合物即组合物72中,本公开内容提供了根据组合物64至71中任一项的组合物,其中编码CD39的第三外源多核苷酸被插入CIITA基因和/或B2M基因内或附近,从而破坏CIITA蛋白和/或B2M蛋白的表达。
在另一组合物即组合物73中,本公开内容提供了根据组合物64至72中任一项的组合物,其中编码CD73的第四外源多核苷酸被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近。
在另一组合物即组合物74中,本公开内容提供了根据组合物64至73中任一项的组合物,其中编码CD73的第四外源多核苷酸被插入B2M基因内或附近,从而破坏B2M蛋白的表达。
在另一组合物即组合物75中,本公开内容提供了根据组合物64至74中任一项的组合物,该组合物包含MANF-P2A-HLA-E构建体,其中所述MANF-P2A-HLA-E构建体被插入B2M基因、TXNIP基因、CIITA基因或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达。
在另一组合物即组合物76中,本公开内容提供了根据组合物64至75中任一项的组合物,其中MANF-P2A-HLA-E构建体被插入TXNIP基因内或附近,从而破坏TXNIP蛋白的表达。
在另一组合物即组合物77中,本公开内容提供了根据组合物64至76中任一项的组合物,该组合物包含TNFAIP3-P2A-PD-L-1构建体,其中所述TNFAIP3-P2A-PD-L-1构建体被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达。
在另一组合物即组合物78中,本公开内容提供了根据组合物64至77中任一项的组合物,其中TNFAIP3-P2A-PD-L-1构建体被插入B2M基因内或附近,从而破坏B2M蛋白的表达。
在另一组合物即组合物79中,本公开内容提供了根据组合物64至78中任一项的组合物,该组合物包含CD39-P2A-PD-L-1构建体,其中所述CD39-P2A-PD-L-1构建体被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达。
在另一组合物即组合物80中,本公开内容提供了根据组合物64至79中任一项的组合物,其中CD39-P2A-PD-L-1构建体被插入B2M基因内或附近,从而破坏B2M蛋白的表达。
在另一组合物即组合物81中,本公开内容提供了根据组合物64至80中任一项的组合物,该组合物包含MANF-P2A-TNFAIP3-P2A-PD-L-1构建体,其中所述MANF-P2A-TNFAIP3-P2A-PD-L-1构建体被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达。
在另一组合物即组合物82中,本公开内容提供了根据组合物64至81中任一项的组合物,其中MANF-P2A-TNFAIP3-P2A-PD-L-1构建体被插入B2M基因内或附近,从而破坏B2M蛋白的表达。
在另一组合物即组合物83中,本公开内容提供了根据组合物64至82中任一项的组合物,该组合物包含CD39-P2A-CD73构建体,其中所述CD39-P2A-CD73构建体被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达。
在另一组合物即组合物84中,本公开内容提供了根据组合物64至83中任一项的组合物,其中CD39-P2A-CD73构建体被插入B2M基因内或附近,从而破坏B2M蛋白的表达。
在另一组合物即组合物85中,本公开内容提供了根据组合物64至84中任一项的组合物,该组合物包含CD39-P2A-CD73-P2A-PD-L-1构建体,其中所述CD39-P2A-CD73-P2A-PD-L-1构建体被插入B2M基因、TXNIP基因、CIITA基因和/或TGFβ基因内或附近,从而破坏B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达。
在另一组合物即组合物86中,本公开内容提供了根据组合物64至85中任一项的组合物,其中CD39-P2A-CD73-P2A-PD-L-1构建体被插入B2M基因内或附近,从而破坏B2M蛋白的表达。
在另一组合物即组合物87中,本公开内容提供了根据组合物25至86中任一项的组合物,其中B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的被破坏的表达包括B2M蛋白、TXNIP蛋白、CIITA蛋白和/或TGFβ蛋白的表达减少或消除。
在另一组合物即组合物88中,本公开内容提供了根据组合物25至87中任一项的组合物,其中TGFβ蛋白是TGFβ-2。
在另一组合物即组合物89中,本公开内容提供了根据组合物25至88中任一项的组合物,其中所述细胞是干细胞。
在另一组合物即组合物90中,本公开内容提供了根据组合物89的组合物,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一组合物即组合物91中,本公开内容提供了根据组合物25至88中任一项的组合物,其中所述细胞是分化细胞或体细胞。
在另一组合物即组合物92中,本公开内容提供了根据组合物91的组合物,其中所述细胞是谱系限制性祖细胞或完全分化的体细胞。
在另一组合物即组合物93中,本公开内容提供了根据组合物92的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞、胰腺内分泌细胞或未成熟β细胞,并且完全分化的体细胞是胰腺β细胞。
在另一组合物即组合物94中,本公开内容提供了一种组合物,该组合物包含多于一种根据权利要求1至93中任一项的遗传修饰的细胞。
在另一组合物即组合物95中,本公开内容提供了根据组合物94的组合物,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L-1、CD39和/或CD73。
在另一组合物即组合物96中,本公开内容提供了一种组合物,该组合物包含来源于组合物94或95的多于一种遗传修饰的细胞的谱系限制性祖细胞或完全分化的体细胞的群体。
在另一组合物即组合物97中,本公开内容提供了根据组合物96的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞或未成熟β细胞,并且完全分化的体细胞是胰腺β细胞。
在另一组合物即组合物98中,本公开内容提供了根据组合物96或97的组合物,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L-1、CD39和/或CD73。
在另一组合物即组合物99中,本公开内容提供了包含组合物94或95的多于一种细胞或组合物96至98中任一项的细胞群体的组合物。
在另一组合物即组合物100中,本公开内容提供了根据组合物99的组合物,该组合物还包含至少一种药学上可接受的赋形剂。
在另一组合物即组合物101中,本公开内容提供了根据组合物99或100的组合物,用于治疗胰腺疾病或紊乱。
在另一组合物即组合物102中,本公开内容提供了根据组合物101的组合物,其中胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
在另一组合物即组合物103中,本公开内容提供了根据组合物101或102的组合物,其中人类包括胰腺疾病或紊乱。
在另一方法即方法104中,本公开内容提供了一种用于治疗有相应需要的受试者的方法,该方法包括:(a)获得或已经获得分化为胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或胰腺β细胞后的权利要求94或95的多于一种遗传修饰的细胞;和(b)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或胰腺β细胞。
在另一方法即方法105中,本公开内容提供了一种用于治疗有相应需要的受试者的方法,该方法包括:(a)获得或已经获得权利要求96至98中任一项的谱系限制性祖细胞或完全分化的体细胞的群体,其中所述谱系限制性祖细胞或完全分化的体细胞包括胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(b)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或β细胞。
在另一方法即方法106中,本公开内容提供了一种用于治疗有相应需要的受试者的方法,该方法包括:(a)获得或已经获得权利要求94或95的多于一种遗传修饰的细胞,其中所述多于一种遗传修饰的细胞包括干细胞;(b)将所述遗传修饰的细胞分化为胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(c)向受试者施用胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
在另一方法即方法107中,本公开内容提供了方法104至106中任一项所提供的方法,其中施用包括将包含胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞的装置植入受试者中。
在另一方法即方法108中,本公开内容提供了方法104至107中任一项所提供的方法,其中受试者患有胰腺疾病或紊乱、被怀疑患有胰腺疾病或紊乱或处于胰腺疾病或紊乱的风险中。
在另一方法即方法109中,本公开内容提供了方法108中提供的方法,其中胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
在另一方法即方法110中,本公开内容提供了方法104至109中任一项所提供的方法,其中所述受试者是人类。
在另一组合物即组合物111中,本公开内容提供了包含遗传修饰的细胞的组合物,所述遗传修饰的细胞包含:(a)插入在编码硫氧还蛋白相互作用蛋白(TXNIP)的基因内或附近的编码中脑星形胶质细胞来源的神经营养因子(MANF)的第一多核苷酸和(b)插入在编码β-2-微球蛋白(B2M)的基因内或附近的编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的第二多核苷酸,其中所述遗传修饰的细胞表达MANF和TNFAIP3,并且具有TXNIP和B2M的被破坏的表达。
在另一组合物即组合物112中,本公开内容提供了根据组合物111的组合物,其中B2M和TXNIP的被破坏的表达包括B2M和/或TXNIP的表达减少或消除。
在另一组合物即组合物113中,本公开内容提供了根据组合物111或112的组合物,该组合物还包含插入在TXNIP基因内或附近的编码HLA I类组织相容性抗原α链E(HLA-E)的第三多核苷酸。
在另一组合物即组合物114中,本公开内容提供了根据组合物113的组合物,其中编码HLA-E的第三多核苷酸包含编码HLA-E三聚体的多核苷酸,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一组合物即组合物115中,本公开内容提供了根据组合物113或114的组合物,其中编码MANF的第一多核苷酸和编码HLA-E的第三多核苷酸可操作地连接到外源启动子。
在另一组合物即组合物116中,本公开内容提供了根据组合物113至115中任一项的组合物,其中编码MANF的第一多核苷酸通过编码P2A肽的多核苷酸连接到编码HLA-E的第三多核苷酸,使得第一多核苷酸、编码P2A肽的多核苷酸和第三多核苷酸形成MANF-P2A-HLA-E构建体。
在另一组合物即组合物117中,本公开内容提供了根据组合物116的组合物,其中MANF-P2A-HLA-E构建体包含基本上由SEQ ID NO:55组成的多核苷酸序列。
在另一组合物即组合物118中,本公开内容提供了根据组合物111至117中任一项的组合物,该组合物还包含插入在B2M基因内或附近的编码程序性死亡配体1(PD-L-1)的第四多核苷酸。
在另一组合物即组合物119中,本公开内容提供了根据组合物118的组合物,其中编码TNFAIP3的第二多核苷酸和编码PD-L-1的第四多核苷酸可操作地连接到外源启动子。
在另一组合物即组合物120中,本公开内容提供了根据组合物118或119的组合物,其中编码TNFAIP3的第二多核苷酸通过编码P2A肽的多核苷酸连接到编码PD-L-1的第四多核苷酸序列,使得第二多核苷酸、编码P2A肽的多核苷酸和第四多核苷酸形成TNFAIP3-P2A-PD-L-1构建体。
在另一组合物即组合物121中,本公开内容提供了根据组合物120的组合物,其中TNFAIP3-P2A-PD-L-1构建体包含基本上由SEQ ID NO:54组成的核苷酸序列。
在另一组合物即组合物122中,本公开内容提供了根据组合物111至121中任一项的组合物,其中所述细胞是干细胞。
在另一组合物即组合物123中,本公开内容提供了根据组合物112的组合物,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一组合物即组合物124中,本公开内容提供了根据组合物111至121中任一项的组合物,其中所述细胞是分化细胞或体细胞。
在另一组合物即组合物125中,本公开内容提供了根据组合物124的组合物,其中所述细胞是谱系限制性祖细胞或完全分化的体细胞。
在另一组合物即组合物126中,本公开内容提供了根据组合物125的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞、胰腺内分泌细胞或未成熟β细胞,并且完全分化的体细胞是胰腺β细胞。
在另一组合物即组合物127中,本公开内容提供了一种组合物,该组合物包含多于一种根据权利要求111至126中任一项的遗传修饰的细胞。
在另一组合物即组合物128中,本公开内容提供了根据组合物127的组合物,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3和/或PD-L-1。
在另一组合物即组合物129中,本公开内容提供了一种组合物,该组合物包含来源于组合物127或128的多于一种遗传修饰的细胞的谱系限制性祖细胞或完全分化的体细胞的群体。
在另一组合物即组合物130中,本公开内容提供了根据组合物129的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞或未成熟β细胞,并且完全分化的体细胞是胰腺β细胞。
在另一组合物即组合物131中,本公开内容提供了根据组合物129或130的组合物,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3和/或PD-L-1。
在另一组合物即组合物132中,本公开内容提供了包含组合物17或18的多于一种细胞或组合物130或131中任一种的细胞群体的组合物。
在另一组合物即组合物133中,本公开内容提供了根据组合物132的组合物,该组合物还包含至少一种药学上可接受的赋形剂。
在另一组合物即组合物134中,本公开内容提供了根据组合物132或133的组合物,用于治疗胰腺疾病或紊乱。
在另一组合物即组合物135中,本公开内容提供了根据组合物134的组合物,其中人类包括胰腺疾病或紊乱。
在另一组合物即组合物136中,本公开内容提供了根据组合物134或135的组合物,其中胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
在另一方法即方法137中,本公开内容提供了一种用于治疗有相应需要的受试者的方法,该方法包括:(a)获得或已经获得分化为胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或胰腺β细胞后的权利要求111至139中任一项的多于一种遗传修饰的细胞;和(b)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或胰腺β细胞。
在另一方法即方法138中,本公开内容提供了一种用于治疗有相应需要的受试者的方法,该方法包括:(a)获得或已经获得权利要求129的谱系限制性祖细胞或完全分化的体细胞的群体,其中所述谱系限制性祖细胞或完全分化的体细胞包括胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(b)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或β细胞。
在另一方法即方法139中,本公开内容提供了一种用于治疗有相应需要的受试者的方法,该方法包括:(a)获得或已经获得权利要求127或权利要求128的多于一种遗传修饰的细胞,其中所述多于一种遗传修饰的细胞包括干细胞;(b)将所述遗传修饰的细胞分化为胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(c)向受试者施用胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
在另一方法即方法140中,本公开内容提供了方法137至139中任一项所提供的方法,其中施用包括将包含胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞的装置植入受试者中。
在另一方法即方法141中,本公开内容提供了方法137至140中任一项所提供的方法,其中受试者患有胰腺疾病或紊乱、被怀疑患有胰腺疾病或紊乱或处于胰腺疾病或紊乱的风险中。
在另一方法即方法142中,本公开内容提供了方法141中提供的方法,其中胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
在另一方法即方法143中,本公开内容提供了方法137至142中任一项所提供的方法,其中所述受试者是人类。
在另一方法即方法144中,本公开内容提供了一种用于产生通用供体细胞的体外方法,该方法包括向干细胞递送:(a)第一RNA引导的核酸酶和靶向β-2微球蛋白(B2M)基因座中的靶位点的第一引导RNA(gRNA);(b)包含核酸的第一载体,所述核酸包含:(i)编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的核苷酸序列和编码程序性死亡配体1(PD-L-1)的核苷酸序列;(ii)与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述B2M基因座在所述靶位点被裂解,并且包含编码TNFAIP3和PD-L-1的核苷酸序列的核酸被插入到所述B2M基因座中,从而破坏所述B2M基因;和(c)第二RNA引导的核酸酶和靶向硫氧还蛋白相互作用蛋白(TXNIP)基因座中的靶位点的第二gRNA;和(d)包含核酸的第二载体,所述核酸包含:(i)编码中脑星形胶质细胞来源的神经营养因子(MANF)的核苷酸序列和编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列;(ii)与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述TXNIP基因座在所述靶位点被裂解,并且包含编码MANF和HLA-E的核苷酸序列的核酸被插入到所述TXNIP基因座中,从而破坏所述TXNIP基因;其中所述通用供体细胞表达TNFAIP3、PD-L-1、MANF和HLA-E,并且具有B2M和TXNIP的被破坏的表达。
在另一方法即方法145中,本公开内容提供了方法144中提供的体外方法,其中B2M和TXNIP的被破坏的表达包括B2M和/或TXNIP的表达减少或消除。
在另一方法即方法146中,本公开内容提供了方法144或145中提供的体外方法,其中(b)(i)的核苷酸序列包含编码TNFAIP3的核苷酸序列,编码TNFAIP3的核苷酸序列连接到编码P2A的核苷酸序列,编码P2A的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法147中,本公开内容提供了方法144至146中任一项所提供的体外方法,其中(b)(i)的核苷酸序列包含SEQ ID NO:54。
在另一方法即方法148中,本公开内容提供了方法144至147中任一项所提供的体外方法,其中(b)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法149中,本公开内容提供了方法148中提供的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法150中,本公开内容提供了方法144至149中任一项所提供的体外方法,其中(b)(ii)的核苷酸序列包含SEQ ID NO:15或基本上由SEQ ID NO:15组成。
在另一方法即方法151中,本公开内容提供了方法144至150中任一项所提供的体外方法,其中(b)(iii)的核苷酸序列包含SEQ ID NO:22或基本上由SEQ ID NO:22组成。
在另一方法即方法152中,本公开内容提供了方法144至151中任一项所提供的体外方法,其中所述第一RNA引导的核酸酶和第一gRNA以约1:1至约1:10的比存在。
在另一方法即方法153中,本公开内容提供了方法144至152中任一项所提供的体外方法,其中所述第一RNA引导的核酸酶是第一Cas9核酸酶。
在另一方法即方法154中,本公开内容提供了方法153中提供的体外方法,其中所述第一Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法155中,本公开内容提供了方法144至154中任一项所提供的体外方法,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包括融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一方法即方法156中,本公开内容提供了方法144至155中任一项所提供的体外方法,其中(d)(i)的核苷酸序列包含编码MANF的核苷酸序列,编码MANF的核苷酸序列连接到编码P2A的核苷酸序列,编码P2A的核苷酸序列连接到编码HLA-E的核苷酸序列。
在另一方法即方法157中,本公开内容提供了方法144至156中任一项所提供的体外方法,其中(d)(i)的核苷酸序列包含SEQ ID NO:55。
在另一方法即方法158中,本公开内容提供了方法144至157中任一项所提供的体外方法,其中(d)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法159中,本公开内容提供了方法158中提供的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法160中,本公开内容提供了方法144至159中任一项所提供的体外方法,其中(d)(ii)的核苷酸序列基本上由SEQ ID NO:42组成。
在另一方法即方法161中,本公开内容提供了方法144至160中任一项所提供的体外方法,其中(d)(iii)的核苷酸序列基本上由SEQ ID NO:44组成。
在另一方法即方法162中,本公开内容提供了方法144至161中任一项所提供的体外方法,其中所述第二RNA引导的核酸酶和第二gRNA以约1:1至约1:10的比存在。
在另一方法即方法163中,本公开内容提供了方法144至162中任一项所提供的体外方法,其中所述第二RNA引导的核酸酶是第二Cas9核酸酶。
在另一方法即方法164中,本公开内容提供了方法163中提供的体外方法,其中所述第二Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法165中,本公开内容提供了方法144至164中任一项所提供的体外方法,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一方法即方法166中,本公开内容提供了方法144至165中任一项所提供的体外方法,其中所述干细胞是人类干细胞。
在另一方法即方法167中,本公开内容提供了方法144至166中任一项所提供的体外方法,其中与没有核酸插入和基因破坏的可比细胞相比,通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一方法即方法168中,本公开内容提供了一种用于产生通用供体细胞的体外方法,该方法包括向干细胞递送:(a)RNA引导的核酸酶和靶向第一靶基因座中的靶位点的引导RNA(gRNA)以及包含编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)、中脑星形胶质细胞来源的神经营养因子(MANF)、分化簇39(CD39)和/或分化簇73(CD73)的核苷酸序列的第一核酸,其中所述第一靶基因座在所述靶位点被裂解,并且包含编码TNFAIP3、MANF、CD39和/或CD73的核苷酸序列的所述第一核酸被插入所述靶基因座,从而破坏所述靶基因;和/或(b)RNA引导的核酸酶和靶向β-2微球蛋白(B2M)基因座中的靶位点的引导RNA(gRNA),其中所述B2M基因座在所述靶位点被裂解,从而破坏所述B2M基因;和/或(c)RNA引导的核酸酶和靶向硫氧还蛋白相互作用蛋白(TXNIP)基因座中的靶位点的引导RNA(gRNA),其中所述TXNIP基因座在所述靶位点被裂解,从而破坏所述TXNIP基因;和/或(d)RNA引导的核酸酶和靶向II类反式激活因子(CIITA)基因座中的靶位点的引导RNA(gRNA),其中所述CIITA基因座在所述靶位点被裂解,从而破坏所述CIITA基因;和/或(e)RNA引导的核酸酶和靶向转化生长因子β(TGFβ)基因座中的靶位点的引导RNA(gRNA),其中所述TGFβ基因座在所述靶位点被裂解,从而破坏所述TGFβ基因。
在另一方法即方法169中,本公开内容提供了方法168中提供的体外方法,其中(a)的靶基因座选自β-2微球蛋白(B2M)基因座、硫氧还蛋白相互作用蛋白(TXNIP)基因座、II类反式激活因子(CIITA)基因座和/或转化生长因子β(TGFβ)基因座,并且通用供体细胞具有B2M、TXNIP、CIITA和/或TGFβ的被破坏的表达。
在另一方法即方法170中,本公开内容提供了方法168或169中提供的体外方法,其中B2M、TXNIP、CIITA和/或TGFβ的被破坏的表达包括B2M、TXNIP、CIITA和/或TGFβ的表达减少或消除。
在另一方法即方法171中,本公开内容提供了方法169或170中提供的体外方法,其中(a)的靶基因座是B2M基因座,并且核酸还包含(i)与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39和/或CD73的核苷酸序列侧翼为(i)和(ii),并且通用供体细胞具有B2M的被破坏的表达。
在另一方法即方法172中,本公开内容提供了方法171中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:15或基本上由SEQ ID NO:15组成。
在另一方法即方法173中,本公开内容提供了方法171或172中任一项所提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:22或基本上由SEQ ID NO:22组成。
在另一方法即方法174中,本公开内容提供了方法169中提供的体外方法,其中(a)的靶基因座是TXNIP基因座,并且核酸还包含(i)与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39和/或CD73的核苷酸序列侧翼为(i)和(ii),并且通用供体细胞具有TXNIP的被破坏的表达。
在另一方法即方法175中,本公开内容提供了方法174中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:42或基本上由SEQ ID NO:42组成。
在另一方法即方法176中,本公开内容提供了方法174或175中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:44或基本上由SEQ ID NO:44组成。
在另一方法即方法177中,本公开内容提供了方法169中提供的体外方法,其中(a)的靶基因座是CIITA基因座,并且核酸还包含(i)与位于CIITA基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于CIITA基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39和/或CD73的核苷酸序列侧翼为(i)和(ii),并且通用供体细胞具有CIITA的被破坏的表达。
在另一方法即方法178中,本公开内容提供了方法177中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:26或基本上由SEQ ID NO:26组成。
在另一方法即方法179中,本公开内容提供了方法177或178中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:28或基本上由SEQ ID NO:28组成。
在另一方法即方法180中,本公开内容提供了方法169中提供的体外方法,其中(a)的靶基因座是TGFβ基因座,并且核酸还包含(i)与位于TGFβ基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于TGFβ基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39和/或CD73的核苷酸序列侧翼为(i)和(ii),并且通用供体细胞具有TGFβ的被破坏的表达。
在另一方法即方法181中,本公开内容提供了方法168至180中任一项所提供的体外方法,其中(b)的靶位点包含基本上由SEQ ID NO:1至13中的任一种组成的核苷酸序列。
在另一方法即方法182中,本公开内容提供了方法168至181中任一项所提供的体外方法,其中(c)的靶位点包含基本上由SEQ ID NO:32-41中的任一种组成的核苷酸序列。
在另一方法即方法183中,本公开内容提供了方法168至182中任一项所提供的体外方法,其中(d)的靶位点包含基本上由SEQ ID NO:25和48-51中的任一种组成的核苷酸序列。
在另一方法即方法184中,本公开内容提供了方法168至183中任一项所提供的体外方法,其中(e)的靶位点包含基本上由SEQ ID NO:57组成的核苷酸序列。
在另一方法即方法185中,本公开内容提供了方法168至184中任一项所提供的体外方法,该体外方法还包括向干细胞递送:(f)RNA引导的核酸酶和靶向靶基因座中的靶位点的引导RNA(gRNA),以及包含编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)、中脑星形胶质细胞来源的神经营养因子(MANF)、分化簇39(CD39)、分化簇73(CD73)、HLA I类组织相容性抗原α链E(HLA-E)和/或程序性死亡配体1(PD-L-1)的核苷酸序列的核酸,其中所述靶基因座在靶位点被裂解,并且包含编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的核酸被插入所述靶基因座,从而破坏靶基因。
在另一方法即方法186中,本公开内容提供了方法185中提供的体外方法,其中(f)的靶基因座选自β-2微球蛋白(B2M)基因座、硫氧还蛋白相互作用蛋白(TXNIP)基因座、II类反式激活因子(CIITA)基因座和/或转化生长因子β(TGFβ)基因座。
在另一方法即方法187中,本公开内容提供了方法186中提供的体外方法,其中(f)的靶基因座是B2M基因座,并且(f)的核酸还包含(i)与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法188中,本公开内容提供了方法187中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:15或基本上由SEQ ID NO:15组成。
在另一方法即方法189中,本公开内容提供了方法187或188中任一项所提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:22或基本上由SEQ ID NO:22组成。
在另一方法即方法190中,本公开内容提供了方法186中提供的体外方法,其中(f)的靶基因座是TXNIP基因座,并且(f)的核酸还包含(i)与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法191中,本公开内容提供了方法190中任一项所提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:42或基本上由SEQ ID NO:42组成。
在另一方法即方法192中,本公开内容提供了方法190或191中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:44或基本上由SEQ ID NO:44组成。
在另一方法即方法193中,本公开内容提供了方法186中提供的体外方法,其中(f)的靶基因座是CIITA基因座,并且(f)的核酸还包含(i)与位于CIITA基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于CIITA基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法194中,本公开内容提供了方法193中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:26或基本上由SEQ ID NO:26组成。
在另一方法即方法195中,本公开内容提供了方法193或195中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:28或基本上由SEQ ID NO:28组成。
在另一方法即方法196中,本公开内容提供了方法186中提供的体外方法,其中(f)的靶基因座是TGFβ基因座,并且(f)的核酸还包含(i)与位于TGFβ基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于TGFβ基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法197中,本公开内容提供了方法185至196中任一项所提供的体外方法,其中(f)的靶基因座与(a)的靶基因座相同。
在另一方法即方法198中,本公开内容提供了方法185至197中任一项所提供的体外方法,其中(f)的靶基因座不同于(a)的靶基因座。
在另一方法即方法199中,本公开内容提供了方法168至198中任一种所提供的体外方法,该体外方法还包括向干细胞递送:(f)RNA引导的核酸酶和靶向靶基因座中的靶位点的引导RNA(gRNA),以及包含编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)、中脑星形胶质细胞来源的神经营养因子(MANF)、分化簇39(CD39)、分化簇73(CD73)、HLA-E和/或PD-L-1的核苷酸序列的核酸,其中所述靶基因座在靶位点被裂解,并且包含编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的核酸被插入所述靶基因座,从而破坏靶基因。
在另一方法即方法200中,本公开内容提供了方法199中提供的体外方法,其中(g)的靶基因座选自β-2微球蛋白(B2M)基因座、硫氧还蛋白相互作用蛋白(TXNIP)基因座、II类反式激活因子(CIITA)基因座和/或转化生长因子β(TGFβ)基因座。
在另一方法即方法201中,本公开内容提供了方法200中提供的体外方法,其中(g)的靶基因座是B2M基因座,并且(g)的核酸还包含(i)与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法202中,本公开内容提供了方法201中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:15或基本上由SEQ ID NO:15组成。
在另一方法即方法203中,本公开内容提供了方法201或202中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:22或基本上由SEQ ID NO:22组成。
在另一方法即方法204中,本公开内容提供了方法200中提供的体外方法,其中(g)的靶基因座是TXNIP基因座,并且(g)的核酸还包含(i)与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法205中,本公开内容提供了方法204中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:42或基本上由SEQ ID NO:42组成。
在另一方法即方法206中,本公开内容提供了方法204或205中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:44或基本上由SEQ ID NO:44组成。
在另一方法即方法207中,本公开内容提供了方法200中提供的体外方法,其中(g)的靶基因座是CIITA基因座,并且(g)的核酸还包含(i)与位于CIITA基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于CIITA基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法208中,本公开内容提供了方法207中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:26或基本上由SEQ ID NO:26组成。
在另一方法即方法209中,本公开内容提供了方法207或208中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:28或基本上由SEQ ID NO:28组成。
在另一方法即方法210中,本公开内容提供了方法200中提供的体外方法,其中(g)的靶基因座是TGFβ基因座,并且(g)的核酸还包含(i)与位于TGFβ基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于TGFβ基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法211中,本公开内容提供了方法199至210中任一项所提供的体外方法,其中(g)的靶基因座与(a)和/或(f)的靶基因座相同。
在另一方法即方法212中,本公开内容提供了方法199至211中任一项所提供的体外方法,其中(g)的靶基因座不同于(a)和/或(f)的靶基因座。
在另一方法即方法213中,本公开内容提供了方法168至212中任一项所提供的体外方法,该体外方法还包括向干细胞递送:(h)RNA引导的核酸酶和靶向靶基因座中的靶位点的引导RNA(gRNA),以及包含编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)、中脑星形胶质细胞来源的神经营养因子(MANF)、分化簇39(CD39)、分化簇73(CD73)、HLA-E和/或PD-L-1的核苷酸序列的核酸,其中所述靶基因座在靶位点被裂解,并且包含编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的核酸被插入所述靶基因座,从而破坏靶基因。
在另一方法即方法214中,本公开内容提供了方法213中提供的体外方法,其中(h)的靶基因座选自β-2微球蛋白(B2M)基因座、硫氧还蛋白相互作用蛋白(TXNIP)基因座、II类反式激活因子(CIITA)基因座和/或转化生长因子β(TGFβ)基因座。
在另一方法即方法215中,本公开内容提供了方法214中提供的体外方法,其中(h)的靶基因座是B2M基因座,并且(h)的核酸还包含(i)与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法216中,本公开内容提供了方法215中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:15或基本上由SEQ ID NO:15组成。
在另一方法即方法217中,本公开内容提供了方法215或216中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:22或基本上由SEQ ID NO:22组成。
在另一方法即方法218中,本公开内容提供了方法214中提供的体外方法,其中(h)的靶基因座是TXNIP基因座,并且(h)的核酸还包含(i)与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法219中,本公开内容提供了方法218中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:42或基本上由SEQ ID NO:42组成。
在另一方法即方法220中,本公开内容提供了方法218或219中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:44或基本上由SEQ ID NO:44组成。
在另一方法即方法221中,本公开内容提供了方法214中提供的体外方法,其中(h)的靶基因座是CIITA基因座,并且(h)的核酸还包含(i)与位于CIITA基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于CIITA基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法222中,本公开内容提供了方法221中提供的体外方法,其中(i)的核苷酸序列包含SEQ ID NO:26或基本上由SEQ ID NO:26组成。
在另一方法即方法223中,本公开内容提供了方法221或222中提供的体外方法,其中(ii)的核苷酸序列包含SEQ ID NO:28或基本上由SEQ ID NO:28组成。
在另一方法即方法224中,本公开内容提供了方法214中提供的体外方法,其中(h)的靶基因座是TGFβ基因座,并且(h)的核酸还包含(i)与位于TGFβ基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(ii)与位于TGFβ基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中编码TNFAIP3、MANF、CD39、CD73、HLA-E和/或PD-L-1的核苷酸序列的侧翼是(i)和(ii)。
在另一方法即方法225中,本公开内容提供了方法213至224中任一项所提供的体外方法,其中(h)的靶基因座与(a)、(f)和/或(g)的靶基因座相同。
在另一方法即方法226中,本公开内容提供了方法213至225中任一项所提供的体外方法,其中(h)的靶基因座不同于(a)、(f)和/或(g)的靶基因座。
在另一方法即方法227中,本公开内容提供了方法168至226中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码MANF的核苷酸序列,并且通用供体细胞表达MANF。
在另一方法即方法228中,本公开内容提供了方法227中提供的体外方法,其中编码MANF的核苷酸序列基本上由SEQ ID NO:17组成。
在另一方法即方法229中,本公开内容提供了方法168至228中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码TNFAIP3的核苷酸序列,并且通用供体细胞表达TNFAIP3。
在另一方法即方法230中,本公开内容提供了方法229中提供的体外方法,其中编码TNFAIP3的核苷酸序列基本上由SEQ ID NO:19组成。
在另一方法即方法231中,本公开内容提供了方法168至230中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码CD39的核苷酸序列,并且通用供体细胞表达CD39。
在另一方法即方法232中,本公开内容提供了方法231中提供的体外方法,其中编码CD39的核苷酸序列基本上由SEQ ID NO:27组成。
在另一方法即方法233中,本公开内容提供了方法168至232中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码CD73的核苷酸序列,并且通用供体细胞表达CD73。
在另一方法即方法234中,本公开内容提供了方法233中提供的体外方法,其中编码CD73的核苷酸序列基本上由SEQ ID NO:46组成。
在另一方法即方法235中,本公开内容提供了方法168至234中任一项所提供的体外方法,其中(a)的核酸还包含编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列,并且通用供体细胞还表达HLA-E。
在另一方法即方法236中,本公开内容提供了方法168至235中任一项所提供的体外方法,其中(f)的核酸、(g)的核酸和/或(h)的核酸包含编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列,并且通用供体细胞表达HLA-E。
在另一方法即方法237中,本公开内容提供了方法168至236中所提供的体外方法,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包括融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一方法即方法238中,本公开内容提供了方法235至237中任一项所提供的体外方法,其中编码HLA-E的核苷酸序列基本上由SEQ ID NO:43组成。
在另一方法即方法239中,本公开内容提供了方法235至238中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码MANF的核苷酸序列和编码HLA-E的核苷酸序列,并且通用供体细胞表达MANF和HLA-E。
在另一方法即方法240中,本公开内容提供了方法239中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码MANF的核苷酸序列,编码MANF的核苷酸序列连接到编码P2A肽的核苷酸序列,编码P2A肽的核苷酸序列连接到编码HLA-E的核苷酸序列。
在另一方法即方法241中,本公开内容提供了方法240中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含由SEQ ID NO:55组成的核苷酸序列。
在另一方法即方法242中,本公开内容提供了方法168至241中任一项所提供的体外方法,其中(a)的核酸还包含编码程序性死亡配体1(PD-L-1)的核苷酸序列,并且通用供体细胞还表达PD-L-1。
在另一方法即方法243中,本公开内容提供了方法168至242中任一项所提供的体外方法,其中(f)的核酸、(g)的核酸和/或(h)的核酸包含编码PD-L-1的核苷酸序列,并且通用供体细胞表达PD-L-1。
在另一方法即方法244中,本公开内容提供了方法242或243中提供的体外方法,其中编码PD-L-1的核苷酸序列基本上由SEQ ID NO:20组成。
在另一方法即方法245中,本公开内容提供了方法242至244中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码TNFAIP3的核苷酸序列和编码PD-L-1的核苷酸序列,并且通用供体细胞表达TNFAIP3和PD-L-1。
在另一方法即方法246中,本公开内容提供了方法242至245中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码TNFAIP3的核苷酸序列,编码TNFAIP3的核苷酸序列连接到编码P2A肽的核苷酸序列,编码P2A肽的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法247中,本公开内容提供了方法246中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含基本上由SEQ ID NO:54组成的核苷酸序列。
在另一方法即方法248中,本公开内容提供了方法242至247中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含CD39的核苷酸序列和编码PD-L-1的核苷酸序列,并且通用供体细胞表达CD39和PD-L-1。
在另一方法即方法249中,本公开内容提供了方法248中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含CD39的核苷酸序列,CD39的核苷酸序列连接到编码P2A肽的核苷酸序列,编码P2A肽的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法250中,本公开内容提供了方法249中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含基本上由SEQ ID NO:53组成的核苷酸序列。
在另一方法即方法251中,本公开内容提供了方法185至250中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码MANF的核苷酸序列、编码TNFAIP3的核苷酸序列和编码PD-L-1的核苷酸序列,并且通用供体细胞表达MANF、TNFAIP3和PD-L-1。
在另一方法即方法252中,本公开内容提供了方法251中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码MANF的核苷酸序列和编码TNFAIP3的核苷酸序列,编码MANF的核苷酸序列通过编码P2A肽的第一核苷酸序列连接到编码TNFAIP3的核苷酸序列,编码TNFAIP3的核苷酸序列通过编码P2A肽的第二核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法253中,本公开内容提供了方法252中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含基本上由SEQ ID NO:52组成的核苷酸序列。
在另一方法即方法254中,本公开内容提供了方法185至253中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码CD39的核苷酸序列、编码CD73的核苷酸序列和编码PD-L-1的核苷酸序列,并且通用供体细胞表达CD39、CD73和PD-L-1。
在另一方法即方法255中,本公开内容提供了方法254中提供的体外方法,其中编码CD39的核苷酸序列通过编码P2A肽的第一核苷酸序列连接到编码CD73的核苷酸序列,并且编码CD73的核苷酸序列通过编码P2A肽的第二核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法256中,本公开内容提供了方法255中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含基本上由SEQ ID NO:56组成的核苷酸序列。
在另一方法即方法257中,本公开内容提供了方法168至256中任一项所提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含编码CD39的核苷酸序列和编码CD73的核苷酸序列,并且通用供体细胞表达CD39和CD73。
在另一方法即方法258中,本公开内容提供了方法257中提供的体外方法,其中编码CD39的核苷酸序列通过编码P2A肽的核苷酸序列连接到编码CD73的核苷酸序列。
在另一方法即方法259中,本公开内容提供了方法258中提供的体外方法,其中(a)的核酸、(f)的核酸、(g)的核酸和/或(h)的核酸包含基本上由SEQ ID NO:58组成的核苷酸序列。
在另一方法即方法260中,本公开内容提供了方法168至259中任一项所提供的体外方法,其中(a)、(f)、(g)和/或(h)的核酸中的任一个的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法261中,本公开内容提供了方法260中提供的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法262中,本公开内容提供了方法168至261中任一项所提供的体外方法,其中(a)、(b)、(c)、(d)、(e)、(f)、(g)和/或(h)的RNA引导的核酸酶和gRNA以约1:1至约1:10的比存在。
在另一方法即方法263中,本公开内容提供了方法168至262中任一项所提供的体外方法,其中(a)、(b)、(c)、(d)、(e)、(f)、(g)和/或(h)中每一个的RNA引导的核酸酶和gRNA以约1:1至约1:10的比存在。
在另一方法即方法264中,本公开内容提供了方法168至263中任一项所提供的体外方法,其中(a)、(b)、(c)、(d)、(e)、(f)、(g)和/或(h)中的每一个的RNA引导的核酸酶是Cas9核酸酶。
在另一方法即方法265中,本公开内容提供了方法264中提供的体外方法,其中Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法266中,本公开内容提供了方法168至264中任一项所提供的体外方法,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一方法即方法267中,本公开内容提供了方法168至266中任一项所提供的体外方法,其中所述干细胞是人类干细胞。
在另一方法即方法268中,本公开内容提供了方法1至267中任一项所提供的体外方法,其中与没有核酸插入和/或基因破坏的可比细胞相比,通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一方法即方法269中,本公开内容提供了一种用于产生通用供体细胞的体外方法,该方法包括向干细胞递送:(a)第一RNA引导的核酸酶和靶向β-2微球蛋白(B2M)基因座中的靶位点的第一引导RNA(gRNA);(b)包含核酸的第一载体,所述核酸包含:(i)编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的核苷酸序列和编码程序性死亡配体1(PD-L-1)的核苷酸序列;(ii)与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述B2M基因座在所述靶位点被裂解,并且包含编码TNFAIP3和PD-L-1的核苷酸序列的核酸被插入所述B2M基因座,从而破坏B2M基因;其中所述通用供体细胞表达TNFAIP3和PD-L-1并且与没有核酸插入和基因破坏的可比细胞相比具有增加的免疫逃避和/或移植后存活。
在另一方法即方法270中,本公开内容提供了方法269中提供的体外方法,其中破坏B2M基因包括减少或消除B2M的表达。
在另一方法即方法271中,本公开内容提供了方法269或270中提供的体外方法,其中(b)(i)的核苷酸序列包含编码TNFAIP3的核苷酸序列,编码TNFAIP3的核苷酸序列连接到编码P2A肽的核苷酸序列,编码P2A肽的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法272中,本公开内容提供了方法269至271中任一项所提供的体外方法,其中(b)(i)的核苷酸序列包含SEQ ID NO:54。
在另一方法即方法273中,本公开内容提供了方法269至272中任一项所提供的体外方法,其中(b)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法274中,本公开内容提供了方法273中提供的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法275中,本公开内容提供了方法269至274中任一项所提供的体外方法,其中(b)(ii)的核苷酸序列包含SEQ ID NO:15或基本上由SEQ ID NO:15组成。
在另一方法即方法276中,本公开内容提供了方法269至275中任一项提供的体外方法,其中(b)(iii)的核苷酸序列包含SEQ ID NO:22或基本上由SEQ ID NO:22组成。
在另一方法即方法277中,本公开内容提供了方法269至276中任一项所提供的体外方法,其中第一RNA引导的核酸酶和第一gRNA以约1:1至约1:10的比存在。
在另一方法即方法278中,本公开内容提供了方法269至277中任一项所提供的体外方法,其中第一RNA引导的核酸酶是第一Cas9核酸酶。
在另一方法即方法279中,本公开内容提供了方法278中提供的体外方法,其中第一Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法280中,本公开内容提供了方法269至279中任一项所提供的体外方法,该体外方法还包括:(c)第二RNA引导的核酸酶和靶向硫氧还蛋白相互作用蛋白(TXNIP)基因座中靶位点的第二gRNA;和(d)包含核酸的第二载体,所述核酸包含:(i)编码中脑星形胶质细胞来源的神经营养因子(MANF)的核苷酸序列和编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列;(ii)与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述TXNIP基因座在所述靶位点被裂解,并且包含编码MANF和HLA-E的核苷酸序列的核酸被插入所述TXNIP基因座中,从而破坏TXNIP基因;其中所述通用供体细胞还表达MANF和HLA-E。
在另一方法即方法281中,本公开内容提供了方法280中提供的体外方法,其中破坏TXNIP基因包括减少或消除TXNIP的表达。
在另一方法即方法282中,本公开内容提供了方法280或281中所提供的体外方法,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一方法即方法283中,本公开内容提供了方法280至282中任一项所提供的体外方法,其中(d)(i)的核苷酸序列包含编码MANF的核苷酸序列,编码MANF的核苷酸序列连接到编码P2A肽的核苷酸序列,编码P2A肽的核苷酸序列连接到编码HLA-E的核苷酸序列。
在另一方法即方法284中,本公开内容提供了方法280至283中任一项所提供的体外方法,其中(d)(i)的核苷酸序列包含SEQ ID NO:55。
在另一方法即方法285中,本公开内容提供了方法280至284中任一项所提供的体外方法,其中(d)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法286中,本公开内容提供了方法285中提供的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法287中,本公开内容提供了方法280至286中任一项所提供的体外方法,其中(d)(ii)的核苷酸序列基本上由SEQ ID NO:42组成。
在另一方法即方法288中,本公开内容提供了方法280至287中任一项所提供的体外方法,其中(d)(iii)的核苷酸序列基本上由SEQ ID NO:44组成。
在另一方法即方法289中,本公开内容提供了方法280至288中任一项所提供的体外方法,其中所述第二RNA引导的核酸酶和第二gRNA以约1:1至约1:10的比存在。
在另一方法即方法290中,本公开内容提供了方法280至289中任一项所提供的体外方法,其中第二RNA引导的核酸酶是第二Cas9核酸酶。
在另一方法即方法291中,本公开内容提供了方法290中提供的体外方法,其中第二Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法292中,本公开内容提供了方法269至291中任一项所提供的体外方法,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一方法即方法293中,本公开内容提供了方法269至292中任一项所提供的体外方法,其中所述干细胞是人类干细胞。
在另一组合物即组合物294中,本公开内容提供了包含遗传修饰的细胞的组合物,所述遗传修饰的细胞包含插入在编码β-2-微球蛋白(B2M)、硫氧还蛋白相互作用蛋白(TXNIP)或II类反式激活因子(CIITA)的基因内或附近的编码中脑星形胶质细胞来源的神经营养因子(MANF)的核苷酸序列、编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的核苷酸序列、编码分化簇73(Cd73)的核苷酸序列和/或编码分化簇39(CD39)的核苷酸序列,其中所述遗传修饰的细胞表达MANF、TNFAIP3、CD73和/或CD39并且具有B2M、TXNIP和/或CIITA的被破坏的表达。
在另一组合物即组合物295中,本公开内容提供了根据组合物294的组合物,其中B2M、TXNIP和/或CIITA的被破坏的表达包括B2M、TXNIP和/或CIITA的表达减少或消除。
在另一组合物即组合物296中,本公开内容提供了根据组合物294或295的组合物,该组合物还包含插入在B2M、TXNIP或CIITA基因内或附近的编码程序性死亡配体1(PD-L-1)的核苷酸序列和/或编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列。
在另一组合物即组合物297中,本公开内容提供了根据组合物296的组合物,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一组合物即组合物298中,本公开内容提供了根据组合物296或297的组合物,其中遗传修饰的细胞包含插入在TXNIP基因内或附近的编码MANF的核苷酸序列和编码HLA-E的核苷酸序列。
在另一组合物即组合物299中,本公开内容提供了根据组合物298的组合物,其中编码MANF的核苷酸序列和编码HLA-E的核苷酸序列可操作地连接到外源启动子。
在另一组合物即组合物300中,本公开内容提供了根据组合物298或299的组合物,其中编码MANF的核苷酸序列通过编码核糖体跳跃的核苷酸序列连接到编码HLA-E的核苷酸序列。
在另一组合物即组合物301中,本公开内容提供了根据组合物300的组合物,其中核糖体跳跃是2A序列家族成员。
在另一组合物即组合物302中,本公开内容提供了根据组合物294至301中任一项的组合物,其中遗传修饰的细胞包含插入在B2M基因内或附近的编码TNFAIP3的核苷酸序列和编码PD-L-1的核苷酸序列。
在另一组合物即组合物303中,本公开内容提供了根据组合物302的组合物,其中编码TNFAIP3的核苷酸序列和编码PD-L-1的核苷酸序列可操作地连接到外源启动子。
在另一组合物即组合物304中,本公开内容提供了根据组合物302或303的组合物,其中编码TNFAIP3的核苷酸序列通过编码核糖体跳跃的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一组合物即组合物305中,本公开内容提供了根据组合物304的组合物,其中核糖体跳跃是2A序列家族成员。
在另一组合物即组合物306中,本公开内容提供了根据组合物296或297的组合物,其中遗传修饰的细胞包含插入在B2M基因内或附近的编码TNFAIP3的核苷酸序列、编码MANF的核苷酸序列和编码PD-L-1的核苷酸序列。
在另一组合物即组合物307中,本公开内容提供了根据组合物306的组合物,其中编码TNFAIP3的核苷酸序列、编码MANF的核苷酸序列和编码PD-L-1的核苷酸序列可操作地连接到外源启动子。
在另一组合物即组合物308中,本公开内容提供了根据组合物306或307的组合物,其中编码TNFAIP3的核苷酸序列通过编码核糖体跳跃的核苷酸序列连接到编码MANF的核苷酸序列,并且编码MANF的核苷酸序列通过编码核糖体跳跃的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一组合物即组合物309中,本公开内容提供了根据组合物308的组合物,其中核糖体跳跃是2A序列家族成员。
在另一组合物即组合物310中,本公开内容提供了根据组合物294至309中任一项的组合物,其中遗传修饰的细胞包含插入在CIITA基因内或附近的编码CD39的核苷酸序列。
在另一组合物即组合物311中,本公开内容提供了根据组合物310的组合物,其中编码CD39的核苷酸序列可操作地连接到外源启动子。
在另一组合物即组合物312中,本公开内容提供了根据组合物296或297的组合物,其中遗传修饰的细胞包含插入在B2M基因内或附近的编码CD39的核苷酸序列和编码PD-L-1的核苷酸序列。
在另一组合物即组合物313中,本公开内容提供了根据组合物312的组合物,其中编码CD39的核苷酸序列和编码PD-L-1的核苷酸序列可操作地连接到外源启动子。
在另一组合物即组合物314中,本公开内容提供了根据组合物312或313的组合物,其中编码CD39的核苷酸序列通过编码核糖体跳跃的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一组合物即组合物315中,本公开内容提供了根据组合物314的组合物,其中核糖体跳跃是2A序列家族成员。
在另一组合物即组合物316中,本公开内容提供了一种组合物,该组合物包含插入在B2M基因内或附近的编码PD-L-1的核苷酸序列、插入在TXNIP基因内或附近的编码HLA-E的核苷酸序列和/或插入在CIITA基因或B2M基因内或附近的编码CD39的核苷酸序列,其中遗传修饰的细胞表达PD-L-1、HLA-E和/或CD39并且具有B2M、TXNIP和/或CIITA的被破坏的表达。
在另一组合物即组合物317中,本公开内容提供了根据组合物316的组合物,其中B2M、TXNIP和/或CIITA的被破坏的表达包括B2M、TXNIP和/或CIITA的表达减少或消除。
在另一组合物即组合物318中,本公开内容提供了根据组合物294至317中任一项的组合物,其中所述细胞是干细胞。
在另一组合物即组合物319中,本公开内容提供了根据组合物318的组合物,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一组合物即组合物320中,本公开内容提供了根据组合物294至319中任一项的组合物,其中所述细胞是分化细胞或体细胞。
在另一组合物即组合物321中,本公开内容提供了根据组合物320的组合物,其中所述细胞分化为谱系限制性祖细胞或完全分化的体细胞。
在另一组合物即组合物322中,本公开内容提供了根据组合物321的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞或胰腺内分泌细胞,并且完全分化的体细胞是未成熟β细胞或成熟β细胞。
在另一组合物即组合物323中,本公开内容提供了一种组合物,该组合物包含多于一种根据权利要求294至322中任一项的遗传修饰的细胞。
在另一组合物即组合物324中,本公开内容提供了根据组合物323的组合物,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L-1和/或CD39。
在另一组合物即组合物325中,本公开内容提供了一种组合物,该组合物包含来源于组合物323或324的多于一种遗传修饰的细胞的谱系限制性祖细胞或完全分化的体细胞的群体。
在另一组合物即组合物326中,本公开内容提供了根据组合物325的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞或胰腺内分泌细胞,并且完全分化的体细胞是未成熟β细胞或成熟β细胞。
在另一组合物即组合物327中,本公开内容提供了根据组合物325或326的组合物,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L-1和/或CD39。
在另一组合物即组合物328中,本公开内容提供了包含组合物323或324的多于一种细胞或组合物325至327中任一项的细胞群体的组合物。
在另一组合物即组合物329中,本公开内容提供了根据组合物328的组合物,该组合物还包含至少一种药学上可接受的赋形剂。
在另一组合物即组合物330中,本公开内容提供了根据组合物328或329的组合物,用于治疗有相应需要的受试者。
在另一组合物即组合物331中,本公开内容提供了根据组合物330的组合物,其中受试者患有疾病或紊乱、被怀疑患有疾病或紊乱或处于疾病或紊乱的风险中。
在另一组合物即组合物332中,本公开内容提供了根据组合物330或331的组合物,其中所述疾病或紊乱是遗传上可遗传的疾病,诸如I型糖尿病。
在另一组合物即组合物333中,本公开内容提供了根据组合物332的组合物,其中所述疾病或紊乱是II型糖尿病或胰腺切除术。
在另一组合物即组合物334中,本公开内容提供了根据组合物328至333中任一项的组合物,其中受试者是人类。
在另一方法即方法335中,本公开内容提供了一种用于治疗有相应需要的受试者的胰腺疾病或紊乱的方法,该方法包括:(a)获得或已经获得分化为胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞后的权利要求294至322中任一项的多于一个遗传修饰的细胞;和(b)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞。
在另一方法即方法336中,本公开内容提供了方法335中提供的方法,其中施用包括将包含胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞的装置植入受试者。
在另一方法即方法337中,本公开内容提供了方法335或336中提供的方法,其中胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
在另一方法即方法338中,本公开内容提供了方法335至337中任一项所提供的方法,其中所述受试者是人类。
在另一方法即方法339中,本公开内容提供了一种用于产生通用供体细胞的体外方法,该方法包括向干细胞递送:(a)包含RNA引导的核酸酶和靶向β-2微球蛋白(B2M)基因座中的靶位点的引导RNA(gRNA)的核糖核蛋白(RNP)复合体;(b)包含核酸的载体,所述核酸包含:(i)编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的核苷酸序列和编码程序性死亡配体1(PD-L-1)的核苷酸序列;(ii)基本上由SEQ ID NO:15组成并且与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)基本上由SEQ ID NO:22组成并且与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中B2M基因座在所述靶位点被裂解,并且包含编码TNFAIP3和PD-L-1的核苷酸序列的核酸被插入所述B2M基因座,从而破坏B2M基因;其中与没有核酸插入和基因破坏的可比细胞相比,所述通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一方法即方法340中,本公开内容提供了方法339中提供的体外方法,其中(b)(i)的核苷酸序列包含编码TNFAIP3的核苷酸序列,编码TNFAIP3的核苷酸序列连接到编码核糖体跳跃的核苷酸序列,编码核糖体跳跃的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法341中,本公开内容提供了一种用于产生通用供体细胞的体外方法,该方法包括向干细胞递送:(a)包含RNA引导的核酸酶和靶向硫氧还蛋白相互作用蛋白(TXNIP)基因座中的靶位点的gRNA的RNP复合体;和(b)包含核酸的载体,所述核酸包含:(i)编码中脑星形胶质细胞来源的神经营养因子(MANF)的核苷酸序列和编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列;(ii)基本上由SEQ ID NO:42组成并且与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)基本上由SEQID NO:44组成并且与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述TXNIP基因座在所述靶位点被裂解,并且包含编码MANF和HLA-E的核苷酸序列的核酸被插入到所述TXNIP基因座中,由此破坏TXNIP基因并产生通用供体细胞,其中与没有核酸插入和基因破坏的可比细胞相比,所述通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一方法即方法342中,本公开内容提供了方法341中所提供的体外方法,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一方法即方法343中,本公开内容提供了方法341或342中提供的体外方法,其中(b)(i)的核苷酸序列包含编码MANF的核苷酸序列,编码MANF的核苷酸序列连接到编码核糖体跳跃的核苷酸序列,编码核糖体跳跃的核苷酸序列连接到编码HLA-E的核苷酸序列。
在另一方法即方法344中,本公开内容提供了方法340或343中提供的体外方法,其中(b)(i)的核糖体跳跃是2A序列家族成员。
在另一方法即方法345中,本公开内容提供了一种用于产生通用供体细胞的体外方法,该方法包括向干细胞递送:(a)包含RNA引导的核酸酶和靶向II类反式激活因子(CIITA)基因座中的靶位点的gRNA的RNP复合体;和(b)包含核酸的载体,所述核酸包含:(i)编码分化簇39(CD39)的核苷酸序列;(ii)基本上由SEQ ID NO:26组成并且与位于CIITA基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)基本上由SEQ IDNO:28组成并且与位于CIITA基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述CIITA基因座在所述靶位点被裂解,并且包含编码CD39的核苷酸序列的核酸被插入到所述CIITA基因座中,从而破坏CIITA基因并产生通用供体细胞,其中与没有所述核酸插入和基因破坏的可比细胞相比,所述通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一方法即方法346中,本公开内容提供了方法339至345中任一项所提供的体外方法,其中(b)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法347中,本公开内容提供了方法346中提供的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法348中,本公开内容提供了一种用于产生通用供体细胞的体外方法,该方法包括向干细胞递送:(a)包含RNA引导的核酸酶和靶向β-2微球蛋白(B2M)基因座中的靶位点的引导RNA(gRNA)的第一核糖核蛋白(RNP)复合体;(b)包含核酸的第一载体,所述核酸包含:(i)编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的核苷酸序列和编码程序性死亡配体1(PD-L-1)的核苷酸序列;(ii)基本上由SEQ ID NO:15组成并且与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)基本上由SEQ ID NO:22组成并且与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述B2M基因座在所述靶位点被裂解,并且包含编码TNFAIP3和PD-L-1的核苷酸序列的核酸被插入所述B2M基因座,从而破坏B2M基因;(c)包含RNA引导的核酸酶和靶向硫氧还蛋白相互作用蛋白(TXNIP)基因座中的靶位点的gRNA的第二RNP复合体;和(d)包含核酸的第二载体,所述核酸包含:(i)编码中脑星形胶质细胞来源的神经营养因子(MANF)的核苷酸序列和编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列;(ii)基本上由SEQ ID NO:42组成并且与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)基本上由SEQ ID NO:44组成并且与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述TXNIP基因座在所述靶位点被裂解,并且包含编码MANF和HLA-E的核苷酸序列的核酸被插入到所述TXNIP基因座中,由此破坏TXNIP基因并产生通用供体细胞,其中与没有所述核酸插入和基因破坏的可比细胞相比,所述通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一方法即方法349中,本公开内容提供了方法348中所提供的体外方法,该体外方法还包括向干细胞递送:(e)包含RNA引导的核酸酶和靶向II类反式激活因子(CIITA)基因座中的靶位点的gRNA的第三RNP复合体;和(f)包含核酸的第三载体,所述核酸包含:(i)编码分化簇39(CD39)的核苷酸序列;(ii)基本上由SEQ ID NO:26组成并且与位于CIITA基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)基本上由SEQID NO:28组成并且与位于CIITA基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述CIITA基因座在所述靶位点被裂解,并且包含编码CD39的核苷酸序列的核酸被插入所述CIITA基因座,从而破坏CIITA基因。
在另一方法即方法350中,本公开内容提供了方法294至349中提供的体外方法,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包括融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一方法即方法351中,本公开内容提供了方法294至350中任一项所提供的体外方法,其中(b)(i)的核苷酸序列包含编码TNFAIP3的序列,编码TNFAIP3的序列连接到编码核糖体跳跃的序列,编码核糖体跳跃的序列连接到编码PD-L-1的序列;并且(d)(i)的核苷酸序列包含编码MANF的序列,编码MANF的序列连接到编码核糖体跳跃的序列,编码核糖体跳跃的序列连接到编码HLA-E的序列。
在另一方法即方法352中,本公开内容提供了方法351中提供的体外方法,其中(b)(i)和(d)(i)中每一个的核糖体跳跃是2A序列家族成员。
在另一方法即方法353中,本公开内容提供了方法294至352中任一项所提供的体外方法,其中(b)(i)、(d)(i)和(f)(i)中每一个的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法354中,本公开内容提供了方法353中提供的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法355中,本公开内容提供了一种用于产生通用供体细胞的体外方法,该方法包括向干细胞递送:(a)包含RNA引导的核酸酶和靶向β-2微球蛋白(B2M)基因座中的靶位点的引导RNA(gRNA)的第一核糖核蛋白(RNP)复合体;(b)包含核酸的第一载体,所述核酸包含:(i)编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的核苷酸序列、编码MANF的核苷酸序列和编码程序性死亡配体1(PD-L-1)的核苷酸序列;(ii)基本上由SEQ ID NO:15组成并且与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)基本上由SEQ ID NO:22组成并且与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述B2M基因座在所述靶位点被裂解,并且包含编码TNFAIP3、MANF和PD-L-1的核苷酸序列的核酸被插入到所述B2M基因座中,从而破坏B2M基因;并且产生通用供体细胞,其中与没有所述核酸插入和基因破坏的可比细胞相比,所述通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一方法即方法356中,本公开内容提供了方法355中所提供的体外方法,该体外方法还包括向干细胞递送:(c)包含RNA引导的核酸酶和靶向II类反式激活因子(CIITA)基因座中的靶位点的gRNA的第二RNP复合体;和(d)包含核酸的第二载体,所述核酸包含:(i)编码分化簇39(CD39)的核苷酸序列;(ii)基本上由SEQ ID NO:26组成并且与位于CIITA基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)基本上由SEQID NO:28组成并且与位于CIITA基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述CIITA基因座在所述靶位点被裂解,并且包含编码CD39的核苷酸序列的核酸被插入所述CIITA基因座,从而破坏CIITA基因。
在另一方法即方法357中,本公开内容提供了方法355或356中提供的体外方法,其中(b)(i)的核苷酸序列包含编码TNFAIP3的核苷酸序列和编码MANF的核苷酸序列,编码TNFAIP3的核苷酸序列通过编码核糖体跳跃的核苷酸序列连接到编码MANF的核苷酸序列,编码MANF的核苷酸序列通过编码核糖体跳跃的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法358中,本公开内容提供了方法357中提供的体外方法,其中核糖体跳跃是2A序列家族成员。
在另一方法即方法359中,本公开内容提供了方法357至358中任一项所提供的体外方法,其中(b)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法360中,本公开内容提供了方法356至359中任一项所提供的体外方法,其中(d)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法361中,本公开内容提供了方法359或360中提供的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法362中,本公开内容提供了方法339至361中任一项所提供的体外方法,其中每个RNP复合体包含约1:1至约1:10的RNA引导的核酸酶与gRNA的摩尔比。
在另一方法即方法363中,本公开内容提供了方法339至362中任一项所提供的体外方法,其中每个RNP复合体的RNA引导的核酸酶是Cas9核酸酶。
在另一方法即方法364中,本公开内容提供了方法363中提供的体外方法,其中Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法365中,本公开内容提供了方法339至362中任一项所提供的体外方法,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一方法即方法366中,本公开内容提供了方法339至365中任一项所提供的体外方法,其中所述干细胞是人类干细胞。
在另一组合物即组合物367中,本公开内容提供了包含通过方法339至366中任一项产生的多于一种通用供体细胞的组合物。
在另一组合物即组合物368中,本公开内容提供了根据组合物367的组合物,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L-1和/或CD39。
在另一组合物即组合物369中,本公开内容提供了包含来源于组合物367或368的多于一种通用供体细胞的谱系限制性祖细胞或完全分化的体细胞的群体的组合物。
在另一组合物即组合物370中,本公开内容提供了根据组合物369的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞,并且完全分化的体细胞是胰腺β细胞。
在另一组合物即组合物371中,本公开内容提供了根据组合物369至370的组合物,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L-1和/或CD39。
在另一组合物即组合物372中,本公开内容提供了包含组合物367或368中任一项的多于一种细胞或组合物369至371中任一项的细胞群体的组合物。
在另一组合物即组合物373中,本公开内容提供了根据组合物372的组合物,该组合物还包含至少一种药学上可接受的赋形剂。
在另一组合物即组合物374中,本公开内容提供了根据组合物372至373的组合物,用于治疗有相应需要的受试者。
在另一组合物即组合物375中,本公开内容提供了根据组合物权利要求374的组合物,其中受试者患有疾病或紊乱、被怀疑患有疾病或紊乱或处于疾病或紊乱的风险中。
在另一组合物即组合物376中,本公开内容提供了根据组合物375的组合物,其中所述疾病或紊乱是遗传上可遗传的疾病,诸如I型糖尿病。
在另一组合物即组合物377中,本公开内容提供了根据组合物375的组合物,其中所述疾病或紊乱是II型糖尿病或胰腺切除术。
在另一组合物即组合物378中,本公开内容提供了根据组合物374至377的组合物,其中受试者是人类。
在另一方法即方法379中,本公开内容提供了一种用于治疗有相应需要的受试者的胰腺疾病或紊乱的方法,该方法包括:(c)获得或已经获得分化为胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞后的权利要求367或368的多于一种通用供体细胞;和(d)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞。
在另一方法即方法380中,本公开内容提供了方法379中提供的方法,其中施用包括将包含胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞的装置植入受试者。
在另一方法即方法381中,本公开内容提供了方法379至380中提供的方法,其中胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
在另一方法即方法382中,本公开内容提供了方法379至381中任一项所提供的方法,其中所述受试者是人类。
在另一组合物即组合物383中,本公开内容提供了组合物294至296中任一项所提供的组合物,其中遗传修饰的细胞包含插入在B2M基因内或附近的编码CD39的核苷酸序列和编码PD-L-1的核苷酸序列。
在另一组合物即组合物384中,本公开内容提供了根据组合物383的组合物,其中编码CD39的核苷酸序列通过编码2A序列家族成员的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一组合物即组合物385中,本公开内容提供了根据组合物383或384的组合物,其中编码CD39的核苷酸序列和编码PD-L-1的核苷酸序列可操作地连接到外源启动子。
在另一组合物即组合物386中,本公开内容提供了组合物294至296中任一项所提供的组合物,其中遗传修饰的细胞包含插入在B2M基因内或附近的编码CD39的核苷酸序列、编码CD73的核苷酸序列和编码PD-L-1的核苷酸序列。
在另一组合物即组合物387中,本公开内容提供了根据组合物386的组合物,其中编码CD39的核苷酸序列通过编码2A序列家族成员的核苷酸序列连接到编码CD73的核苷酸序列,并且编码CD73的核苷酸序列通过编码2A序列家族成员的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一组合物即组合物388中,本公开内容提供了根据组合物386或387的组合物,其中编码CD39的核苷酸序列、编码CD73的核苷酸序列和编码PD-L-1的核苷酸序列可操作地连接到外源启动子。
在另一组合物即组合物389中,本公开内容提供了包含遗传修饰的细胞的组合物,所述遗传修饰的细胞包含(a)插入在编码硫氧还蛋白相互作用蛋白(TXNIP)的基因内或附近的编码中脑星形胶质细胞来源的神经营养因子(MANF)的第一多核苷酸序列和编码HLA I类组织相容性抗原α链E(HLA-E)的第二多核苷酸,以及(b)插入在编码β-2-微球蛋白(B2M)的基因内或附近的编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的第三多核苷酸序列和编码程序性死亡配体1(PD-L-1)的第四多核苷酸,其中所述遗传修饰的细胞表达MANF、HLA-E、TNFAIP3和PD-LL并具有TXNIP和B2M的被破坏的表达。
在另一方法即方法390中,本公开内容提供了一种用于制备通用供体细胞的体外方法,该方法包括向干细胞递送:(a)第一RNA引导的核酸酶和靶向β-2微球蛋白(B2M)基因座中的靶位点的第一引导RNA(gRNA);(b)包含核酸的第一载体,所述核酸包含:(i)编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的核苷酸序列和编码程序性死亡配体1(PD-L-1)的核苷酸序列;(ii)与位于B2M基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)与位于B2M基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述B2M基因座在所述靶位点被裂解,并且包含编码TNFAIP3和PD-L-1的核苷酸序列的核酸被插入所述B2M基因座,从而破坏B2M基因;其中所述通用供体细胞表达TNFAIP3和PD-L-1并且与没有核酸插入和基因破坏的可比细胞相比具有增加的免疫逃避和/或移植后存活。
在另一方法即方法391中,本公开内容提供了根据方法390的体外方法,其中破坏B2M基因包括减少或消除B2M的表达。
在另一方法即方法392中,本公开内容提供了根据方法390或391的体外方法,其中(b)(i)的核苷酸序列包含编码TNFAIP3的核苷酸序列,编码TNFAIP3的核苷酸序列连接到编码P2A的核苷酸序列,编码P2A的核苷酸序列连接到编码PD-L-1的核苷酸序列。
在另一方法即方法393中,本公开内容提供了根据方法390至392中任一项的体外方法,其中(b)(i)的核苷酸序列包含SEQ ID NO:54。
在另一方法即方法394中,本公开内容提供了根据方法390至393中任一项的体外方法,其中(b)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法395中,本公开内容提供了根据方法390至394中任一项的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法396中,本公开内容提供了根据方法390至395中任一项的体外方法,其中(b)(ii)的核苷酸序列包含SEQ ID NO:15或基本上由SEQ ID NO:15组成。
在另一方法即方法397中,本公开内容提供了根据方法390至396中任一项的体外方法,其中(b)(iii)的核苷酸序列包含SEQ ID NO:22或基本上由SEQ ID NO:22组成。
在另一方法即方法398中,本公开内容提供了根据方法390至397中任一项的体外方法,其中所述第一RNA引导的核酸酶和第一gRNA以约1:1至约1:10的比存在。
在另一方法即方法399中,本公开内容提供了根据方法390至398中任一项的体外方法,其中第一RNA引导的核酸酶是第一Cas9核酸酶。
在另一方法即方法400中,本公开内容提供了根据方法399的体外方法,其中第一Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法401中,本公开内容提供了根据方法390至400中任一项的体外方法,该体外方法还包括向干细胞递送:(c)第二RNA引导的核酸酶和靶向硫氧还蛋白相互作用蛋白(TXNIP)基因座中靶位点的第二gRNA;和(d)包含核酸的第二载体,所述核酸包含:(i)编码中脑星形胶质细胞来源的神经营养因子(MANF)的核苷酸序列和编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列;(ii)与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述TXNIP基因座在所述靶位点被裂解,并且包含编码MANF和HLA-E的核苷酸序列的核酸被插入到所述TXNIP基因座中,从而破坏TXNIP基因;其中所述通用供体细胞还表达MANF和HLA-E。
在另一方法即方法402中,本公开内容提供了根据方法401的体外方法,其中破坏TXNIP基因包括减少或消除TXNIP的表达。
在另一方法即方法403中,本公开内容提供了根据方法401或402的体外方法,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一方法即方法404中,本公开内容提供了根据方法401至403中任一项的体外方法,其中(d)(i)的核苷酸序列包含编码MANF的核苷酸序列,编码MANF的核苷酸序列连接到编码P2A的核苷酸序列,编码P2A的核苷酸序列连接到编码HLA-E的核苷酸序列。
在另一方法即方法405中,本公开内容提供了根据方法401至404中任一项的体外方法,其中(d)(i)的核苷酸序列包含SEQ ID NO:55。
在另一方法即方法406中,本公开内容提供了根据方法401至405中任一项的体外方法,其中(d)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法407中,本公开内容提供了根据方法406的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法408中,本公开内容提供了根据方法401至407中任一项的体外方法,其中(d)(ii)的核苷酸序列基本上由SEQ ID NO:42组成。
在另一方法即方法409中,本公开内容提供了根据方法401至408中任一项的体外方法,其中(d)(iii)的核苷酸序列基本上由SEQ ID NO:44组成。
在另一方法即方法410中,本公开内容提供了根据方法401至409中任一项的体外方法,其中所述第二RNA引导的核酸酶和第二gRNA以约1:1至约1:10的比存在。
在另一方法即方法411中,本公开内容提供了根据方法401至410中任一项的体外方法,其中所述第二RNA引导的核酸酶是第二Cas9核酸酶。
在另一方法即方法412中,本公开内容提供了根据方法411的体外方法,其中所述第二Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法413中,本公开内容提供了根据方法401至412中任一项的体外方法,该体外方法还包括向干细胞递送:(e)第三RNA引导的核酸酶和靶向II类反式活化子(CIITA)基因座中靶位点的第三gRNA;和(f)包含核酸的第二载体,所述核酸包含:(i)编码CD39的核苷酸序列;(ii)与位于CIITA基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)与位于CIITA基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述TXNIP基因座在所述靶位点被裂解,并且包含编码CD39的核苷酸序列的核酸被插入到所述CIITA基因座中,从而破坏CIITA基因;其中所述通用供体细胞还表达CD39。
在另一方法即方法414中,本公开内容提供了根据方法413的体外方法,其中(e)(i)的核苷酸序列包含SEQ ID NO:27。
在另一方法即方法415中,本公开内容提供了根据方法413或414的体外方法,其中(f)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法416中,本公开内容提供了根据方法415的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法417中,本公开内容提供了根据方法413至416中任一项的体外方法,其中(f)(ii)的核苷酸序列基本上由SEQ ID NO:26组成。
在另一方法即方法418中,本公开内容提供了根据方法413至417中任一项的体外方法,其中(f)(iii)的核苷酸序列基本上由SEQ ID NO:28组成。
在另一方法即方法419中,本公开内容提供了根据方法413至418中任一项的体外方法,其中所述第三RNA引导的核酸酶和第三gRNA以约1:1至约1:10的比存在。
在另一方法即方法420中,本公开内容提供了根据方法413至419中任一项的体外方法,其中第三RNA引导的核酸酶是第三Cas9核酸酶。
在另一方法即方法421中,本公开内容提供了根据方法420的体外方法,其中第三Cas9核酸酶连接到至少一种核定位信号。
在另一方法即方法422中,本公开内容提供了根据方法390至421中任一项的体外方法,该体外方法还包括向干细胞递送:(g)第四RNA引导的核酸酶和靶向TGFβ基因座中的靶位点的第四gRNA,从而破坏TGFβ基因。
在另一方法即方法423中,本公开内容提供了根据方法422的体外方法,其中所述第四gRNA靶向基本上由SEQ ID NO:57组成的核苷酸序列。
在另一方法即方法424中,本公开内容提供了根据方法390至423中任一项的体外方法,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一方法即方法425中,本公开内容提供了根据方法390至424中任一项的体外方法,其中所述干细胞是人类干细胞。
在另一组合物即组合物426中,本公开内容提供了包含遗传修饰的细胞的组合物,所述遗传修饰的细胞包含:(a)被破坏的B2M基因和编码中脑星形胶质细胞来源的神经营养因子(MANF)的第一多核苷酸在被破坏的B2M基因中的第一插入;(b)被破坏的TXNIP基因和编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的第二多核苷酸在被破坏的TXNIP基因中的第二插入;(c)被破坏的CIITA基因和编码CD39的第三多核苷酸的第三插入,其中所述细胞表达MANF、TNFAIP3和CD39,并且具有B2M、TXNIP和CIITA的被破坏的表达。
在另一组合物即组合物427中,本公开内容还提供了根据组合物426的组合物,其中第三多核苷酸包含基本上由SEQ ID NO:27组成的核苷酸序列。
在另一组合物即组合物428中,本公开内容提供了根据组合物426至427中任一项的组合物,其中B2M、TXNIP和/或CIITA的被破坏的表达包括B2M蛋白、TXNIP蛋白和/或CIITA蛋白的表达减少或消除。
在另一组合物即组合物429中,本公开内容还提供了根据组合物426至428中任一项的组合物,其中遗传修饰的细胞还包含(d)被破坏的TGFβ基因,并且其中所述细胞具有TGFβ蛋白的被破坏的表达。
在另一组合物即组合物430中,本公开内容提供了根据组合物429的组合物,其中TGFβ蛋白的被破坏的表达包括TGFβ蛋白的表达减少或消除。
在另一组合物即组合物431中,本公开内容提供了根据组合物426至430中任一项的组合物,其中与没有多核苷酸插入和基因破坏的可比细胞相比,通用供体细胞具有增加的免疫逃避和/或移植后存活。
在另一组合物即组合物432中,本公开内容提供了根据组合物426至431中任一项的组合物,其中所述细胞是干细胞。
在另一组合物即组合物433中,本公开内容提供了根据组合物432的组合物,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
在另一组合物即组合物434中,本公开内容提供了根据组合物426至431中任一项的组合物,其中所述细胞是分化细胞或体细胞。
在另一组合物即组合物435中,本公开内容提供了根据组合物434的组合物,其中所述细胞分化为谱系限制性祖细胞或完全分化的体细胞。
在另一组合物即组合物436中,本公开内容提供了根据组合物435的组合物,其中谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞或未成熟β细胞,并且完全分化的体细胞是胰腺β细胞。
在另一组合物即组合物437中,本公开内容提供了一种组合物,该组合物包含多于一种根据组合物1至436中任一项的遗传修饰的细胞。
在另一组合物即组合物438中,本公开内容提供了一种组合物,该组合物包含来源于组合物437的多于一种遗传修饰的细胞的谱系限制性祖细胞或完全分化的体细胞的群体。
在另一组合物即组合物439中,本公开内容提供了根据组合物438的组合物,其中所述群体包括定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
在另一组合物即组合物440中,本公开内容提供了一种组合物,该组合物包含组合物437的多于一种细胞或组合物438或439的细胞群体和至少一种药学上可接受的赋形剂。
在另一方法即方法441中,本公开内容提供了一种用于治疗有相应需要的受试者的胰腺疾病或紊乱的方法,该方法包括:(a)获得或已经获得权利要求438的谱系限制性祖细胞或完全分化的体细胞的群体,其中所述谱系限制性祖细胞或完全分化的体细胞包括胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(b)向受试者施用胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或β细胞。
在另一方法即方法442中,本公开内容提供了一种用于治疗有相应需要的受试者的胰腺疾病或紊乱的方法,所述方法包括(a)获得或已经获得权利要求437的多于一种遗传修饰的细胞,其中所述多于一种遗传修饰的细胞包括干细胞;(b)将所述遗传修饰的细胞分化为胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;和(c)向受试者施用胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
在另一方法即方法443中,本公开内容提供了方法441或442中提供的方法,其中胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
在另一方法即方法444中,本公开内容提供了一种用于制备通用供体细胞的体外方法,该方法包括向干细胞递送:(a)RNA引导的核酸酶和靶向硫氧还蛋白相互作用蛋白(TXNIP)基因座中的靶位点的gRNA;和(b)包含核酸的载体,所述核酸包含:(i)编码中脑星形胶质细胞来源的神经营养因子(MANF)的核苷酸序列和编码HLA I类组织相容性抗原α链E(HLA-E)的核苷酸序列;(ii)与位于TXNIP基因座中靶位点左侧的基因组区域具有序列同源性的核苷酸序列;和(iii)与位于TXNIP基因座中靶位点右侧的基因组区域具有序列同源性的核苷酸序列,其中(i)的侧翼是(ii)和(iii);其中所述TXNIP基因座在所述靶位点被裂解,并且包含编码MANF和HLA-E的核苷酸序列的核酸被插入到所述TXNIP基因座中,从而破坏TXNIP基因;其中所述通用供体细胞表达MANF和HLA-E。
在另一方法即方法445中,本公开内容提供了根据方法444的体外方法,其中破坏TXNIP基因包括减少或消除TXNIP的表达。
在另一方法即方法446中,本公开内容提供了根据方法444或445的体外方法,其中编码HLA-E的核苷酸序列包含编码HLA-E三聚体的序列,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
在另一方法即方法447中,本公开内容提供了根据方法444至446中任一项的体外方法,其中(b)(i)的核苷酸序列包含编码MANF的核苷酸序列,编码MANF的核苷酸序列连接到编码P2A的核苷酸序列,编码P2A的核苷酸序列连接到编码HLA-E的核苷酸序列。
在另一方法即方法448中,本公开内容提供了根据方法444至447中任一项的体外方法,其中(b)(i)的核苷酸序列包含SEQ ID NO:55。
在另一方法即方法449中,本公开内容提供了根据方法444至448中任一项的体外方法,其中(b)(i)的核苷酸序列可操作地连接到外源启动子。
在另一方法即方法450中,本公开内容提供了根据方法449的体外方法,其中外源启动子是CMV、EF1α、PGK、CAG或UBC启动子。
在另一方法即方法451中,本公开内容提供了根据方法444至450中任一项的体外方法,其中(b)(ii)的核苷酸序列基本上由SEQ ID NO:42组成。
在另一方法即方法452中,本公开内容提供了根据方法444至451中任一项的体外方法,其中(b)(iii)的核苷酸序列基本上由SEQ ID NO:44组成。
在另一方法即方法453中,本公开内容提供了根据方法444至452中任一项的体外方法,其中所述RNA引导的核酸酶和gRNA以约1:1至约1:10的比存在。
在另一方法即方法454中,本公开内容提供了根据方法444至453中任一项的体外方法,其中所述RNA引导的核酸酶是Cas9核酸酶。
在另一方法即方法455中,本公开内容提供了根据方法454的体外方法,其中所述Cas9核酸酶连接到至少一种核定位信号。
实施例
下面的实施例描述了根据本公开内容的特定通用供体细胞的产生和表征。
实施例1:细胞维持和扩增
hESC/hiPSC的维持。将人类胚胎干细胞(hESC)和人类诱导多能干细胞(hiPSC)维持在BIOLAMININ 521 CTG(BioLamina Cat#CT521)上的StemFlex Complete(LifeTechnologies,A3349401)或层粘连蛋白511包被的组织培养板上。每天用StemFlex培养基饲喂细胞。为了将细胞作为单细胞进行铺板,将细胞用在StemFlex中的1% RevitaCellTM补充剂(100X)(ThermoFisher Cat#A2644501)铺板在BIOLAMININ或层粘连蛋白511包被的板上。对于传代,添加1%的REVITACELLTM补充剂(100X)。
hPSC的单细胞克隆。对于单细胞克隆,用StemFlex Complete(LifeTechnologies,A3349401)和1% RevitaCellTM补充剂(100X)(ThermoFisher Cat#A2644501)饲喂hPSC(hESC或hiPSC)。在用解离后,将细胞分选为预包被板的每个孔中的单细胞。将96孔板用在DPBS、钙、镁(Life Technologies,14040133)中的1:10或1:20稀释的BIOLAMININ 521CTG(BioLamina Cat#CT521)在37℃预包被2小时。WOLF FACS-sorter(Nanocellect)用于将单细胞分选到孔中。平板预填充100-200μL含RevitaCellTM和4μL/mL重组层粘连蛋白iMatrix-511 E8(AMSBIO,AMS.892 011)的StemFlex Complete。细胞接种后3天,用新鲜StemFlex饲喂细胞,并继续每隔一天用100-200μL培养基饲喂。培养10天后,每天用StemFlex饲喂细胞,直到第12-14天。此时,用解离板,并将收集的细胞悬浮液1:2分开,一半进入新的96孔板进行维持,并且另一半进入DNA提取溶液QuickExtractTM DNA提取溶液(Lucigen)。DNA提取后,进行PCR以评估靶向DNA基因座处存在或不存在所需的基因编辑。使用Sanger测序验证所需的编辑。
单细胞来源的hPSC克隆的扩增。对于hESC,使用StemFlex和BIOLAMININ 521或重组层粘连蛋白iMatrix-511 E8将成功靶向的克隆从96孔板传代至24孔板。在24孔板中扩增后,将细胞传代到6孔板上,并在StemFlex中铺板后的第二天开始向KSR A10H10培养基过渡。铺板后的第一天,用50:50的KSR A10H10和StemFlex混合物饲喂细胞。第二天,用100%KSR A10H10饲喂细胞。在100% KSR A10H10中2天后,细胞可以使用KSR A10H10中的10%XF传代。如果细胞没有经历2天的100% KSR A10H10,则细胞接受BIOLAMININ 521或重组层粘连蛋白iMatrix-511 E8以实现附着和存活,随后在KSR A10H10中另外培养并完全过渡到用层粘连蛋白培养。在完全过渡为KSR A10H10后,如Schulz等人.(2012)PLoS ONE 7(5):e37004所述地传代hESC克隆。
对于hiPSC,在整个克隆和常规维持过程中,细胞被维持在BIOLAMININ包被板上的StemFlex Complete中,在传代阶段,细胞被维持在RevitaCellTM中。
实施例2:产生B2M敲除(KO)和MANF-P2A-TNFAIP3-P2A-PD-L-1敲入(KI)的人类多能干细胞
本实施例描述了根据本公开内容的具有改进存活(MANF)和免疫逃避(TNFAIP3,也称为A20)的另外编辑的特定通用供体细胞的产生和表征。产生了编码MANF-P2A-TNFAIP3-P2A-PD-L-1的转基因被插入B2M基因座,从而敲除B2M基因的细胞。
B2M靶向gRNA被设计为靶向B2M编码序列的外显子1。基于使用gRNA设计软件的序列同源性预测,这些gRNA具有预测的低脱靶分数。gRNA的靶序列如表2所示。gRNA包含对应于靶DNA序列的RNA序列。
表2.B2M gRNA靶序列
名称 靶序列(5'-3') SEQ ID NO: PAM
B2M-1 gRNA(外显子1_T12) GCTACTCTCTCTTTCTGGCC 1 TGG
B2M-2 gRNA(外显子1_T2) GGCCGAGATGTCTCGCTCCG 2 TGG
B2M-3 gRNA(外显子1_T8) CGCGAGCACAGCTAAGGCCA 3 CGG
外显子1_T1 TATAAGTGGAGGCGTCGCGC 4 TGG
外显子1_T3 GAGTAGCGCGAGCACAGCTA 5 AGG
外显子1_T4 ACTGGACGCGTCGCGCTGGC 6 GGG
外显子1_T5 AAGTGGAGGCGTCGCGCTGG 7 CGG
外显子1_T6 GGCCACGGAGCGAGACATCT 8 CGG
外显子1_T7 GCCCGAATGCTGTCAGCTTC 9 AGG
外显子1_T9 CTCGCGCTACTCTCTCTTTC 10 TGG
外显子1_T10 TCCTGAAGCTGACAGCATTC 11 GGG
外显子1_T11 TTCCTGAAGCTGACAGCATT 12 CGG
外显子1_T13 ACTCTCTCTTTCTGGCCTGG 13 AGG
进行质粒设计以将编码MANF-P2A-TNFAIP3-P2A-PD-L-1的转基因插入B2M基因座,使得在经历同源定向修复(HDR)以插入转基因后移除B2M的起始密码子,消除了部分B2M表达的任何机会。成功的HDR导致MANF、TNFAIP3和PD-L-1(CD274)三个基因插入基因组。这三个编码序列通过P2A肽编码序列连接,以允许从单个转录物表达三种独立的蛋白。MANF-P2A-TNFAIP3-P2A-PD-L-1的编码序列包含SEQ ID NO:52的核苷酸序列。图1展示了B2M-CAGGS-MANF-P2A-TNFAIP3-P2A-PD-L-1供体质粒的示意图,并且表3标识了其中的元件和位置。供体质粒包含CAGGS启动子(即,包括CMV增强子、鸡β-肌动蛋白启动子和嵌合内含子)驱动的MANF-P2A-TNFAIP3-P2A-PD-L-1的cDNA,侧翼是800个碱基对的同源臂,其具有与外显子1周围的B2M基因座相同的序列。质粒的完整序列包含SEQ ID NO:24的核苷酸序列。
表3.B2M-CAGGS-MANF-P2A-TNFAIP3-P2A-PD-L-1供体质粒的元件
使用Neon电穿孔仪(Neon转染系统ThermoFisher Cat#MPK5000)用每百万hESC 4μg质粒DNA以及Cas9蛋白和B2M-2 gRNA(SEQ ID NO:2)的核糖核蛋白(RNP)混合物对人类ESC进行电穿孔。为了形成RNP复合体,将gRNA和Cas9与R-缓冲液(Neon转染系统100μL试剂盒ThermoFisher Cat#MPK10096)在一个容器中合并至总体积为25-50μL,并在RT孵育15分钟。使用解离细胞,然后重悬于DMEM/F12培养基(Gibco,cat#11320033)中,使用NC-200(Chemometec)计数并离心。用质粒、RNP复合体和R-缓冲液重悬总共1x106个细胞。然后将该混合物电穿孔。电穿孔后,将细胞移液到填充有具有RevitaCellTM的StemFlex培养基的Eppendorf管或6孔板的孔中。然后将该细胞悬浮液铺在预先包被的组织培养皿中。细胞在常氧培养箱(37℃,8%CO2)中培养。
电穿孔后7至10天,使用抗小鼠IgG Dynabeads(ThermoFisher,CELLectionTM Pan小鼠IgG试剂盒,11531D)通过磁辅助细胞分选(MACS)富集细胞中表达PD-L-1的细胞。这些富集的细胞(L1V008细胞系)代表了PD-L-1高度阳性的大量KI群体。然后使用WOLF FACS-分选仪(Nanocellect)将富集的细胞FACS分选PD-L-1表面表达到带有StemFlex和RevitaCellTM的BIOLAMININ 521 CTG包被的96孔板中。为了检测PD-L-1表面表达,使用抗PD-L-1荧光抗体(参见表4)。对于FACS分选,未编辑的细胞用作阴性对照。选择PD-L-1阳性细胞进行分选和单细胞克隆。
表4.用于流式细胞术的抗体
抗原 克隆 荧光团 制造商 目录#
B2M 2M2 PE Biolegend 316305
HLA-ABC W6/32 Alexa 488 Biolegend 311415
mIgG1κ N/A PE BD Bioscience 555749
PD-L-1 B7-H1 Alexa-488 ThermoFisher 53-5983-42
HLA-E 3D12 PE ThermoFisher 12-9953-42
在常氧培养箱(37℃,8%CO2)中培养铺板的单细胞,每隔一天更换培养基,直到集落大到足以作为单细胞重新接种。当汇合时,样品被分开用于维持和基因组DNA提取。使用从插入B2M基因座的位点的质粒同源臂外侧扩增的引物,使得能够仅扩增KI整合的DNA,通过对MANF-TNFAIP3-PD-L-1 KI插入进行PCR鉴定了正确靶向的克隆。克隆的B2M KO状态通过PCR和Sanger测序证实。正确的KI和KO克隆以递增的组织培养形式扩增,直到达到3000万个细胞的群体大小。
实施例3:产生B2M KO和MANF-P2A-TNFAIP3-P2A-PD-L-1 KI以及CIITA KO和CD39KI的人类多能干细胞
将产生其中编码MANF-P2A-TNFAIP3-P2A-PD-L-1的转基因插入B2M基因座并且编码CD39的转基因插入CIITA基因座,从而敲除B2M和CIITA基因的细胞。
基本上如以上实施例2描述的用B2M-CAGGS-MANF-P2A-TNFAIP3-P2A-PD-L-1供体质粒(SEQ ID NO:24,表3)和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP将人类多能干细胞电穿孔。电穿孔后7至10天,将使用Miltenyi试剂或ThermoFisher试剂通过MACS富集表达PD-L-1(阳性)的细胞。在扩增富集的PD-L-1阳性群体后,基本上如以上实施例2中所述,用如下表5所详述的CIITA-CAGGS-CD39供体质粒以及包含Cas9和针对CIITA的外显子3的gRNA,例如CIITA Ex3_T6 gRNA(靶序列是5’-GGTCCATCTGGTCATAGAAG-3’SEQ ID NO:25;PAM是TGG)的RNP将细胞电穿孔。
图2展示了CIITA-CAGGS-CD39供体质粒的示意图,并且表5标识了其中的元件和位置。CIITA-CAGGS-CD39供体质粒包含CAGGS启动子(包括CMV增强子、鸡β-肌动蛋白启动子和嵌合内含子),以驱动CD39的cDNA的表达,侧翼是800个碱基对的同源臂,其具有与外显子3周围的CIITA基因座相同的序列。质粒的完整序列包含SEQ ID NO:29的核苷酸序列。
表5.CIITA-CAGGS-CD39供体质粒的元件
元件 位置(以bp计的大小) SEQ ID NO:
左ITR 1-130(130) 14
LHA-CIITA 145-944(800) 26
CAGGS启动子 973-2639(1667) 16
CD39 2684-4213(1530) 27
bGH多(A)信号 4240-4464(225) 21
RHA-CIITA 4471-5270(800) 28
右ITR 5312-5452(141) 23
完整质粒 7799 29
电穿孔后7至10天,使用Miltenyi试剂(抗小鼠IgG微珠Cat#130-048-401、LS柱Cat#130-042-401和MidiMACS分离器Cat#130-042-302)或ThermoFisher试剂(DynaMagTM-15磁体Cat#12301D、CELLectionTM Pan小鼠IgG试剂盒Cat#11531D、DynabeadsTM Pan小鼠IgGCat#11042)通过MACS富集细胞中表达PD-L-1和/或CD39的细胞。在PD-L-1和/或CD39富集后,使用WOLF FACS-分选仪(Nanocellect)针对PD-L-1和/或CD39表达将富集的细胞FACS分选到带有StemFlex和RevitaCellTM的BIOLAMININ 521 CTG包被的96孔板中,门控设置为PD-L-1和CD39双阳性细胞。对于FACS分选,未编辑的细胞用作阴性对照。将选择阳性细胞进行分选和单细胞克隆。
在常氧培养箱(37℃,8% CO2)中培养铺板的单细胞,每隔一天更换培养基,直到集落大到足以作为单细胞重新接种。当汇合时,样品将被分开以进行维持和基因组DNA提取。将使用扩增每个插入位点的质粒同源臂外侧的区域的引物,使得能够仅扩增KI整合的DNA,通过对PD-L-1 KI插入和CD39 KI插入进行PCR来鉴定正确靶向的克隆。克隆的B2M和CIITA KO状态将通过PCR和Sanger测序来确认。
实施例4:产生B2M KO和CD39-P2A-PD-L-1 KI的人类多能干细胞
产生了其中编码CD39-P2A-PD-L-1的转基因被插入B2M基因座,从而敲除B2M基因的细胞。
基本上如以上实施例2描述的用如下表6中详述的B2M-CAGGS-CD39-P2A-PD-L-1供体质粒和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP将人类多能干细胞电穿孔。
图3展示了B2M-CAGGS-CD39-P2A-PD-L-1供体质粒的示意图,并且表6标识了其中的元件和位置。B2M-CAGGS-CD39-P2A-PD-L-1供体质粒包含CAGGS启动子(包括CMV增强子、鸡β-肌动蛋白启动子和嵌合内含子)以驱动CD39-P2A-PD-L-1的cDNA(SEQ ID NO:53)的表达,侧翼为800个碱基对的同源臂,其具有与外显子1周围的B2M基因座相同的序列。B2M-CAGGS-CD39-P2A-PD-L-1供体质粒的完整序列包含SEQ ID NO:30的核苷酸序列。
表6.B2M-CAGGS-CD39-P2A-PD-L-1供体质粒的元件
元件 位置(以bp计的大小) SEQ ID NO:
左ITR 1-130(130) 14
LHA-B2M 145-944(800) 15
CAGGS启动子 973-2639(1667) 16
CD39 2684-4213(1530) 27
P2A 4223-4279(57) 18
PD-L-1 4280-5152(873) 20
bGH多(A)信号 5170-5394(225) 21
RHA-B2M 5401-6200(800) 22
右ITR 6242-6382(141) 23
完整质粒 8729bp 30
电穿孔后7至10天,使用抗小鼠IgG Dynabeads(ThermoFisher,CELLectionTM Pan小鼠IgG试剂盒,11531D)通过磁辅助细胞分选(MACS)富集细胞中表达PD-L-1的细胞。这些富集的细胞代表了PD-L-1高度阳性的大量KI群体。然后使用WOLF FACS-分选仪(Nanocellect)针对PD-L-1表面表达将富集的细胞FACS分选到带有StemFlex和RevitaCellTM的BIOLAMININ 521 CTG包被的96孔板中。为了检测PD-L-1表面表达,使用抗PD-L-1荧光抗体(参见表4)。对于FACS分选,未编辑的细胞用作阴性对照。选择PD-L-1阳性细胞进行分选和单细胞克隆。
在常氧培养箱(37℃,8%CO2)中培养铺板的单细胞,每隔一天更换培养基,直到集落大到足以作为单细胞重新接种。当汇合时,样品被分开用于维持和基因组DNA提取。使用从插入B2M基因座的位点的质粒同源臂外侧扩增的引物,使得能够仅扩增KI整合的DNA,通过对CD39-PD-L-1 KI插入进行PCR来鉴定正确靶向的克隆。克隆的B2M KO状态通过PCR和Sanger测序来确认。正确的KI和KO克隆(L1V017细胞系)以递增的组织培养形式扩增,直到达到3000万个细胞的群体大小。
实施例5:产生B2M KO和MANF-P2A-TNFAIP3-P2A-PD-L-1 KI以及B2M KO和CD39-P2A-PD-L-1 KI的人类多能干细胞
将产生其中编码MANF-P2A-TNFAIP3-P2A-PD-L-1的转基因被插入到B2M基因座的第一靶位点,并且编码CD39-P2A-PD-L-1的转基因被插入到B2M基因座的另一个位置的第二靶位点,从而敲除B2M基因的细胞。
基本上如以上实施例2描述的,用B2M-CAGGS-MANF-P2A-TNFAIP3-P2A-PD-L-1供体质粒(SEQ ID NO:24,表3)和包含Cas9和B2M-2 gRNA(SEQ ID NO:3)的RNP将人类多能干细胞电穿孔。在PD-L-1富集和扩增后,用B2M-CAGGS-CD39-P2A-PD-L-1供体质粒(SEQ ID NO:30,表6)和包含Cas9和选自SEQ ID NO:1或3-13(参见上表2)的第二B2M gRNA的RNP将细胞电穿孔。细胞将如上所述地被富集、扩增、选择和表征。
实施例6:产生B2M KO和TNFAIP3-P2A-PD-L-1 KI以及TXNIP KO和MANF-P2A-HLA-EKI的人类多能干细胞(“X1”细胞)
产生了其中编码TNFAIP3-P2A-PD-L-1的转基因插入B2M基因座并且编码MANF-P2A-HLA-E的转基因插入TXNIP,从而敲除B2M和TXNIP基因的细胞。
基本上如以上实施例2中所述的,用B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒(参见以下)和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP将人类多能干细胞电穿孔。图4展示了B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒(也称为X1-1盒)的示意图,并且表7标识了其中的元件和位置。B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒包含CAGGS启动子(包括CMV增强子、鸡β-肌动蛋白启动子和嵌合内含子)以驱动TNFAIP3-P2A-PD-L-1的cDNA(SEQ ID NO:54)的表达,侧翼为800个碱基对的同源臂,其具有与外显子1周围的B2M基因座相同的序列。B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒的完整序列包含SEQ ID NO:31的核苷酸序列。
表7.B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒的元件
元件 位置(以bp计的大小) SEQ ID NO:
左ITR 1-130(130) 14
LHA-B2M 145-944(800) 15
CAGGS启动子 973-2639(1667) 16
TNFAIP3 2684-5053(2370) 19
P2A 5063-5119(57) 18
PD-L-1 5120-5992(873) 20
bGH多(A)信号 6010-6234(225) 21
RHA-B2M 6241-7040(800) 22
右ITR 7082-7222(141) 23
完整质粒 9569bp 31
电穿孔后7至10天,基本上如实施例2所述的通过MACS富集细胞中表达PD-L-1的细胞。PD-L-1富集后,用如下详述的TXNIP-CAGGS-MANF-P2A-HLA-E供体质粒和包含Cas9和靶向TXNIP基因的外显子1的gRNA(即,TXNIP_外显子1_T5 gRNA,SEQ ID NO:37)的RNP将富集的细胞电穿孔。表8展示了靶向TXNIP基因的外显子1或外显子2的另外gRNA的靶序列。基于使用gRNA设计软件的序列同源性预测,这些gRNA具有预测的低脱靶分数。
表8.TXNIP gRNA靶序列
名称 靶序列(5'-3') SEQ ID NO: PAM
TXNIP_外显子1_T1 GAAGCGTGTCTTCATAGCGC 32 AGG
TXNIP_外显子1_T21 TTACTCGTGTCAAAGCCGTT 33 AGG
TXNIP_外显子1_T22 TGTCAAAGCCGTTAGGATCC 34 TGG
TXNIP_外显子1_T23 GCCGTTAGGATCCTGGCTTG 35 CGG
TXNIP_外显子1_T25 GCGGAGTGGCTAAAGTGCTT 36 TGG
TXNIP_外显子1_T5 TCCGCAAGCCAGGATCCTAA 37 CGG
TXNIP_外显子2_T4 GTTCGGCTTTGAGCTTCCTC 38 AGG
TXNIP_外显子2_T2 GAGATGGTGATCATGAGACC 39 TGG
TXNIP_外显子2_T1 TTGTACTCATATTTGTTTCC 40 AGG
TXNIP_外显子2_T3 AACAAATATGAGTACAAGTT 41 CGG
图5展示了TXNIP-CAGGS-MANF-P2A-HLA-E供体质粒(也称为X1-2盒)的示意图,并且表9标识了其中的元件和位置。TXNIP-CAGGS-MANF-P2A-HLA-E供体质粒包含CAGGS启动子(包括CMV增强子、鸡β-肌动蛋白启动子和嵌合内含子)以驱动MANF-P2A-HLA-E的cDNA(SEQID NO:55)的表达,侧翼为800个碱基对的同源臂,其具有与外显子1周围的TXNIP基因座相同的序列。HLA-E序列(SEQ ID NO:43)编码HLA-E三聚体,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,HLA-G呈递肽融合到GS接头,GS接头融合到B2M膜蛋白,B2M膜蛋白融合到GS接头,GS接头融合到无其信号肽的HLA-E蛋白。这种三聚体设计以前已经发表(Gornalusse等人.(2017)Nat.Biotechnol.35(8):765-772)。TXNIP-CAGGS-MANF-P2A-HLA-E供体质粒的完整序列包含SEQ ID NO:45的核苷酸序列。
表9.TXNIP-CAGGS-MANF-P2A-HLA-E供体质粒的元件
元件 位置(以bp计的大小) SEQ ID NO:
左ITR 1-130(130) 14
LHA-TXNIP 145-944(800) 42
CAGGS启动子 973-2639(1667) 16
MANF 2684-3229(546) 17
P2A 3239-3295(57) 18
HLA-E 3296-4795(1500) 43
bGH多(A)信号 4822-5046(225) 21
RHA-TXNIP 5053-5852(800) 44
右ITR 5894-6034(141) 23
完整质粒 8381bp 45
电穿孔后7至10天,使用Miltenyi试剂或ThermoFisher试剂通过MACS富集细胞中表达HLA-E的细胞。然后使用WOLF FACS-分选仪(Nanocellect)将这些富集的细胞FACS分选到带有StemFlex和RevitaCellTM的BIOLAMININ 521 CTG包被的96孔板中,门控设置为PD-L-1和HLA-E双阳性细胞。为了检测PD-L-1表面表达和HLA-E表面表达,使用抗PD-L-1和抗HLA-E荧光抗体(参见表4)。对于FACS分选,未编辑的细胞用作阴性对照。选择PD-L-1和HLA-E双阳性细胞(L1V028细胞系)进行分选和单细胞克隆。
在常氧培养箱(37℃,8%CO2)中培养铺板的单细胞,每隔一天更换培养基,直到集落大到足以作为单细胞重新接种。当汇合时,样品被分开用于维持和基因组DNA提取。使用从每个插入位点的质粒同源臂外侧扩增的引物,从而能够仅扩增KI整合的DNA,通过对PD-L-1KI插入和HLA-E KI插入进行PCR来鉴定正确靶向的克隆。克隆的B2M和TXNIP KO状态通过PCR和Sanger测序来确认。正确的KI和KO克隆以递增的组织培养形式扩增,直到达到3000万个细胞的群体大小。这些细胞在下文中被称为X1细胞。
实施例7:产生B2M KO和TNFAIP3-P2A-PD-L-1 KI、TXNIP KO和MANF-P2A-HLA-EKI以及CIITA KO和CD39 KI的人类多能干细胞
产生其中编码TNFAIP3-P2A-PD-L-1的转基因被插入B2M基因座,编码MANF-P2A-HLA-E的转基因被插入TXNIP基因座,并且编码CD39的转基因被插入CIITA基因座,从而敲除B2M、TXNIP和CIITA基因的细胞。
基本上如以上实施例2描述的用B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒(SEQID NO:31,表7)和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP将人类多能干细胞电穿孔。电穿孔后7至10天,基本上如实施例2所述的通过MACS富集细胞中表达PD-L-1(阳性)的细胞。扩增富集的PD-L-1阳性群体后,基本上如以上实施例2描述的用TXNIP-CAGGS-MANF-P2A-HLA-E供体质粒(SEQ ID NO:45,表9)和包含Cas9和TXNIP_外显子1_T5 gRNA(SEQ IDNO:37)的RNP将细胞电穿孔。在富集HLA-E阳性细胞并扩增PD-L-1和HLA-E细胞后,双阳性细胞用于CD39向CIITA基因座的进一步插入。
CIITA-CAGGS-CD39供体质粒(SEQ ID NO:29,表5)与由靶向CIITA的gRNA(CIITAEx3_T6 gRNA(SEQ ID NO:25))和Cas9蛋白组成的核糖核蛋白(RNP)复合体一起引入。具体地,实施例7中描述的X1的克隆用CIITA-CAGGS-CD39供体质粒与由靶向CIITA的gRNA(CIITAEx3_T6 gRNA(SEQ ID NO:25))和Cas9蛋白组成的RNP一起转染。每200万hESC细胞中,通过电穿孔将4μg质粒DNA与RNP一起递送。使用氖电穿孔仪在hESC细胞中用摩尔比为5:1(gRNA:Cas9)的Cas9蛋白(Biomay)和引导RNA(Biospring)的RNP混合物进行电穿孔,绝对值为每200万细胞125pmol Cas9和625pmol gRNA。为了形成RNP复合体,将gRNA和Cas9与R-缓冲液(Neon转染试剂盒)在一个容器中合并至总体积为25-50μL,并在室温(RT)孵育15min。使用解离细胞,然后重悬于StemFlex培养基中,使用NC-200(Chemometec)计数并离心。将总共2x106个细胞重悬在RNP复合体中,并添加R-缓冲液至总体积~115μL。然后在1000V用3个脉冲将该混合物电穿孔30ms。进行两次电穿孔。电穿孔后,将细胞移液到填充有含有RevitaCell和层粘连蛋白511的StemFlex培养基的6孔板的孔中。用1:10稀释的BIOLAMININ 521 CTG预包被板。细胞在常氧培养箱(37℃,8% CO2)中培养。
电穿孔后两天,通过荧光辅助细胞分选(FACS)使用抗CD39抗体富集细胞中转染的表达CD39的细胞。然后将这些富集的细胞扩增,并在电穿孔后7-10天再次分选,以富集CD39敲入。这些由X1克隆产生的富集细胞代表CD39阳性细胞的大量转染群体(“L3V003B”,也称为“X4”)。靶向TGF-β2基因的引导RNA也用于编辑具有CD39 KI的X1克隆,以产生CD39阳性细胞和TGF-β2阴性细胞的大量转染群体(“L3V004B”,也称为“X4+TGF-β2KO”)。通过流式细胞术评估这些群体的CD39表达,然而总百分比低于预期,因此第三次富集大量细胞中表达CD39的细胞,并且通过流式细胞术显示>90%的CD39表达(图6)。
实施例8:产生B2M KO和TNFAIP3-P2A-PD-L-1 KI、TXNIP KO和MANF-P2A-HLA-EKI以及B2M KO和CD39-P2A-PD-L-1 KI的人类多能干细胞
将产生其中编码TNFAIP3-P2A-PD-L-1的转基因被插入到B2M基因座中的第一靶位点,编码MANF-P2A-HLA-E的转基因被插入到TXNIP基因座中,并且编码CD39-P2A-PD-L-1的转基因被插入到B2M基因座中的第二靶位点的另一个位置中,从而敲除B2M和TXNIP基因的细胞。
基本上如以上实施例2描述的用B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒(SEQID NO:31,表7)和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP将人类多能干细胞电穿孔。电穿孔后7至10天,将使用Miltenyi试剂或ThermoFisher试剂通过MACS富集细胞中表达PD-L-1(阳性)细胞。扩增富集的PD-L-1阳性群体后,基本上如以上实施例2描述的用TXNIP-CAGGS-MANF-P2A-HLA-E供体质粒(SEQ ID NO:45,表9)和包含Cas9和TXNIP_外显子1_T5gRNA(SEQ ID NO:37)的RNP将细胞电穿孔。在富集HLA-E阳性细胞并扩增PD-L-1和HLA-E细胞后,用B2M-CAGGS-CD39-P2A-PD-L-1供体质粒(SEQ ID NO:30,表6)和包含Cas9和选自SEQID NO:1或3-13的B2M gRNA的RNP将双阳性细胞电穿孔。将富集细胞中的CD39阳性细胞,扩增,并选择PD-L-1、HLA-E和CD39三阳性细胞,其如上所述表征。
在一些实施方案中,在B2M-CAGGS-CD39-P2A-PD-L-1供体质粒中,CD39-P2A-PD-L-1的cDNA侧翼是800个碱基对的同源臂,其与第二B2M靶位点两侧的基因组序列具有序列同一性。
实施例9:编辑的克隆的G带核型分析
将100万个编辑的ES细胞(参见实施例2和6)传代到含有培养基(DMEM/F12+10%无Xeno的KSR,含10ng/mL活化素和10ng/mL调蛋白)的T-25培养瓶中。培养过夜后,将三个T25培养瓶运送到细胞遗传学实验室(Cell Line Genetics,Inc.)进行核型分析;1号、12号、17号、20号染色体的FISH分析;以及用标准8x60K阵列进行阵列比较基因组杂交(aCGH)分析。选择的B2M KO和MANF-TNFAIP3(A20)-PD-L-1 KI克隆(L1V008细胞系;实施例2)以及TXNIPKO和MANF-P2A-HLA-E KI/B2M KO和TNFAIP3(A20)-P2A-PD-L-1 KI克隆(L1V028细胞系;实施例6)的G-显带结果显示在表10中。
表10.G带核型分析结果
实施例10:编辑的人类胚胎干细胞向胰腺内胚层细胞(PEC)的分化
编辑的人类胚胎干细胞(ES)的维持。在不同的传代(P38-42)的编辑的人类多能干细胞通过以下来维持:对于4天传代,以33,000个细胞/cm2接种,或对于3天传代以50,000个细胞/cm2接种,该传代用hESM培养基(DMEM/F12+10% KSR+10ng/mL活化素A和10ng/mL调蛋白)和最终10%人类AB血清进行。
聚集编辑的人类胚胎干细胞用于PEC分化。用将编辑的细胞解离成单细胞,然后离心并以每毫升100万个细胞重悬于DMEM/F12培养基中的2% StemPro(Cat#A1000701,Invitrogen,CA)中,并且将总共3.5亿-4亿个细胞接种在一个850cm2滚瓶(Cat#431198,Corning,NY)中,转速为8RPM±0.5RPM持续18-20小时,之后进行分化。如Schulz等人(2012)PLoS ONE 7(5):e37004所述,使用滚瓶将来自编辑的人类多能干细胞的聚集体分化成胰腺谱系。如Rezania等人(2014)Nat.Biotechnol.32(11):1121-1133和US20200208116所述,将来自编辑的人类多能干细胞的聚集体分化成胰腺谱系。
图7显示了在PEC阶段和第6阶段(S6)的TXNIP KO/MANF-P2A-HLA-E KI和B2MKO/TNFAIP3(A20)-P2A-PD-L-1 KI克隆(“X1”或L1V028细胞系)以及从野生型细胞分化的克隆的相似的形态学。
实施例11:PEC阶段和第6阶段的基因表达
使用Illumina TruSeq和靶向111个基因的定制寡核苷酸组进行用于基因表达分析的靶向RNAseq。该组主要包含为胰腺分化期间发育阶段的标志物的基因。在PEC阶段和第6阶段结束时,收集10μL APV(聚集沉淀体积)并使用Qiagen RNeasy或RNeasy 96旋转柱方案(包括柱上DNA酶处理)提取。使用TapeStation组合Qubit或通过使用Qiagen QIAxcel进行定量和质量控制。根据Illumina TruSeq文库制备方案处理50-200ng的RNA,该方案由以下组成:cDNA合成、定制寡核苷酸池的杂交、洗涤、延伸、连接结合的寡核苷酸、文库的PCR扩增和文库的净化,然后使用TapeStation组合Qubit或通过使用Qiagen QIAxcel对所得dsDNA文库进行定量和质量控制。随后将文库稀释至4nM的浓度并汇集,随后变性,掺入PhiX对照,并进一步稀释至10-12pM,然后加载到Illumina MiSeq测序仪。测序运行后,通过BaseSpace自动执行初始数据分析,为每个定制探针生成原始读段计数。对于每个基因,然后对对应于该基因的所有探针的这些读段计数求和,并加上1个读段计数(以防止下游除以0)。针对基因SF3B2进行归一化,并且读段通常显示为相对于阶段0的倍数变化。当处理数据用于主成分分析时,使用DEseq方法进行归一化。
选择的基因表达显示在图8中。在PEC阶段和第6阶段(S6),来自“X1”克隆,即TXNIPKO/MANF-P2A-HLA-E KI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI(X1)的CHGA、FOXA2、NKX6.1、PDX1和INS的表达模式与从野生型细胞分化的细胞的表达模式相似。
实施例12:PEC阶段和第6阶段针对CHGA、PDX1和NKX6.1的流式细胞术
用PBS洗涤PEC阶段和第6阶段聚集体,并且然后使用ACCUMAXTM(目录#A7089,Sigma,MO)在37℃酶促解离成单细胞悬浮液。加入MACS分离缓冲液(Cat#130-091-221,Miltenyi Biotec,North Rhine-Westphalia,Germany),并且将悬浮液通过40μm过滤器并沉淀。对于细胞内标志物染色,将细胞在4%(wt/v)多聚甲醛中固定30分钟,在FACS缓冲液(PBS,0.1%(wt/v)BSA,0.1%(wt/v)NaN3)中洗涤,并且然后用Perm缓冲液(PBS,0.2%(v/v)Triton X-100(Cat#A16046,Alfa Aesar,MA),5%(v/v)正常驴血清,0.1%(wt/v)NaN3)在冰上透化细胞30分钟,并且然后用洗涤缓冲液(PBS,1%(wt/v)BSA,0.1%(wt/v)NaN3)洗涤。将细胞与用封闭缓冲液(PBS,0.1%(v/v)Triton X-100,5%(v/v)正常驴血清,0.1%(wt/v)NaN3)稀释的一抗(表11)在4℃孵育过夜。细胞在IC缓冲液中洗涤,并且然后与适当的二抗在4℃孵育60分钟。细胞在IC缓冲液中洗涤,并且然后在FACS缓冲液中洗涤。流式细胞术数据用NovoCyte流式细胞仪(ACEA Biosciences,Brussels)采集。使用FlowJo软件(Tree Star,Inc.)分析数据。基于前向(低角度)和侧向(正交,90°)光散射来识别完整细胞。使用抗体对照和未分化细胞估算背景。在图中,显示了一个亚群体的代表性流式细胞术图。图中报告的数字代表来自完整细胞门的总细胞的百分比。
表11.用于流式细胞术的抗体
抗原 荧光团 来源 稀释
PDX1 PE BD Bioscience(Cat#562161) 1:2.5
NKX6.1 AF647 BD Bioscience(Cat#563338) 1:2.5
CHGA AF405 Novus(Cat#NBP2-33198AF405) 1:1000
图9展示了从野生型细胞或实施例6中产生的两个L1V028克隆(即,TXNIP KO/MANF-P2A-HLA-E KI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI)分化的PEC细胞中CHGA、PDX1和NKX6.1的流式细胞术。图10A和图10B展示了从野生型细胞(图10A)或X1细胞(即,TXNIPKO/MANF-P2A-HLA-E KI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI)(图10B)分化的第6阶段(S6)细胞中CHGA、PDX1和NKX6.1的流式细胞术。
实施例13:B2M KO/MANF-P2A-TNFAIP3-P2A-PD-L-1 KI细胞的体内功效研究
从上述实施例2描述的B2M KO/MANF-P2A-TNFAIP3(A20)-P2A-PD-L-1 KI(L1V008)细胞系和通过用非切割引导RNA(non-cutting guide-RNA,NCG)转染获得的克隆未修饰细胞系(clonal unmodified cell line)产生胰腺内胚层细胞。
将来源于所示克隆系的胰腺内胚层聚集体装载到穿孔装置(PD)中,以产生试验物品或对照物品。PD允许皮下移植后直接血管化,并且包封的胰腺祖细胞在体内成熟为功能性胰腺内分泌细胞,包括葡萄糖响应性胰岛素产生细胞。
如表12所总结的,在四组无胸腺裸大鼠中测试L1V008和对照细胞,其中每组皮下植入两个物品,每个物品含有大约7×106个细胞。
表12.研究设计
从12周开始,通过葡萄糖刺激胰岛素分泌(GSIS)试验对所有存活的动物进行功效评价。在腹膜内施用3g/kg葡萄糖之前和之后从非禁食动物获得血液样品。通过标准酶联免疫吸附测定确定人类C-肽的血清浓度。对照组(GRP 4)的C-肽读数在腹膜内施用葡萄糖后60分钟采集,而实验组的读数在施用后90分钟采集。
图11展示了四组在12、16、20和24周时的C-肽水平。结果表明,实验组之间没有实质性差异。这些结果表明,引入的遗传修饰和产生克隆系所需的操作都不影响所讨论的细胞系在体外分化成胰腺内胚层细胞并随后在体内产生功能性β细胞的能力。
实施例14:B2M KO/CD39-P2A-PD-L-1 KI细胞的体内功效研究
将来源于实施例4中制备的B2M KO/CD39-P2A-PD-L-1 KI(L1V017)细胞系或来自对照细胞的胰腺内胚层聚集体装载到穿孔装置中,并植入动物中用于GSIS测试,如以上实施例13中所述。表13展示了研究设计。
表13.研究设计
如图12所示,产生该细胞系所需的遗传修饰和操作不影响细胞在体外分化为胰腺内胚层细胞并随后在体内产生功能性β细胞的能力。
实施例15:TXNIP KO/MANF-P2A-HLA-E KI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1KI细胞的体内功效研究
从对照细胞(NCG)或实施例6中产生的L1V028克隆(即TXNIP KO/MANF-P2A-HLA-EKI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI;“X1”)分化的PEC阶段和第6阶段细胞的体内功效进行了测试。将试验囊或对照囊移植到NSG小鼠(Jackson Laboratory Stock No:005557)的左肾中。表14展示了研究设计。
表14.研究设计
在第12、16、20和24周进行GSIS试验。图13展示了PEC对照组、PEC-X1组、S6对照组和S6-X1组中个体动物在第12周和第16周的C-肽水平。图14展示了PEC对照组和PEC-X1组从第12周到第24周的平均C-肽水平的时间进程。这些结果表明,X1细胞能够在体外分化为胰腺内胚层细胞,并且随后在体内产生功能性β细胞。
在第26周,GSIS测试后,对动物实施安乐死,并将取出的试验物品(explantedtest article)固定在中性缓冲的福尔马林中,加工成载玻片,并用H&E染色,并通过免疫组织化学确定胰岛素和胰高血糖素。
还在体内测试了来自“X1”细胞系(即,L1V028)的若干个种子运行克隆。基于全基因组测序选择克隆。它们具有Het/Hom原位基因型(on-site genotype),没有表现出意外的质粒插入,也没有表现出任何可能具有功能改变的癌基因的变体。克隆6D09没有推定的脱靶插入,而克隆6H07和5C10有至少一个推定的脱靶插入。在第12周和第16周进行GSIS测试。图15展示了每只动物在第12周、16周和20周的C-肽水平和组平均水平。克隆6D09、6H07和5C10表现出良好的体内功效。
实施例16:产生B2M敲除(KO)和CD39-P2A-CD73-P2A-PD-L-1 KI的人类多能干细胞
产生了其中编码CD39-P2A-CD73-P2A-PD-L-1的转基因被插入B2M基因座,从而敲除B2M基因的细胞。
基本上如以上实施例2中所述的用如下表15中详述的B2M-CAGGS-CD39-P2A-CD73-P2A-PD-L-1供体质粒和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP将人类多能干细胞电穿孔。
图16展示了B2M-CAGGS-CD39-P2A-CD73-P2A-PD-L-1质粒的示意图,并且表15标识了其中的元件和位置。B2M-CAGGS-CD39-P2A-CD73-P2A-PD-L-1供体质粒包含驱动CD39-P2A-CD73-P2A-PD-L-1的cDNA(SEQ ID NO:56)表达的CAGGS启动子,侧翼为800个碱基对的同源臂,其具有与外显子1周围的B2M基因座相同的序列。B2M-CAGGS-CD39-P2A-CD73-P2A-PD-L-1供体质粒的完整序列包含SEQ ID NO:47的核苷酸序列。
表15:B2M-CAGGS-CD39-P2A-CD73-P2A-PD-L-1供体质粒的元件
元件 位置(以bp计的大小) SEQ ID NO:
左ITR 1-130(130) 14
LHA-B2M 145-944(800) 15
CAGGS启动子 973-2639(1667) 16
CD39 2684-4213(1530) 27
P2A 4223-4279(57) 18
CD73 4280-6001(1722) 46
P2A 6011-6067(57) 18
PD-L-1 6068-6940(873) 20
bGH多(A)信号 6958-7182(225) 21
RHA-B2M 7189-7988(800) 22
右ITR 8030-8170(141) 23
完整质粒 10,517bp 47
电穿孔后7至10天,使用抗小鼠IgG Dynabeads(ThermoFisher,CELLectionTM Pan小鼠IgG试剂盒,11531D)通过磁辅助细胞分选(MACS)富集细胞中表达PD-L-1的细胞。这些富集的细胞代表了PD-L-1高度阳性的大量KI群体。然后使用WOLF FACS-分选仪(Nanocellect)针对PD-L-1表面表达将富集的细胞FACS分选到带有StemFlex和RevitaCellTM的BIOLAMININ 521 CTG包被的96孔板中。为了检测PD-L-1表面表达,使用抗PD-L-1荧光抗体(参见表4)。对于FACS分选,未编辑的细胞用作阴性对照。选择PD-L-1阳性细胞进行分选和单细胞克隆。
在常氧培养箱(37℃,8% CO2)中培养铺板的单细胞,每隔一天更换培养基,直到集落大到足以作为单细胞重新接种。当汇合时,样品被分开用于维持和基因组DNA提取。使用从插入B2M基因座的位点的质粒同源臂外部扩增的引物,使得能够仅扩增KI整合的DNA,通过PCR鉴定了CD39-P2A-CD73-P2A-PD-L-1 KI插入的正确靶向克隆。克隆的B2M KO状态通过PCR和Sanger测序证实。正确的KI和KO克隆(L1V018B细胞系)以递增的组织培养形式扩增,直到达到3000万个细胞的群体大小。
实施例17:产生B2M KO和TNFAIP3(A20)-P2A-PD-L-1 KI人类多能干细胞
基本上如以上实施例2描述的用B2M-CAGGS-TNFAIP3(A20)-P2A-PD-L-1供体质粒(SEQ ID NO:31,表7)和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP将人类多能干细胞电穿孔以产生L1V019B细胞系。图4展示了B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒(也称为X1-1盒)的示意图。
电穿孔后7至10天,使用抗小鼠IgG Dynabeads(ThermoFisher,CELLectionTM Pan小鼠IgG试剂盒,11531D)通过磁辅助细胞分选(MACS)富集细胞中表达PD-L-1的细胞。这些富集的细胞代表了PD-L-1高度阳性的大量KI群体。然后使用WOLF FACS-分选仪(Nanocellect)针对PD-L-1表面表达将富集的细胞FACS分选到带有StemFlex和RevitaCellTM的BIOLAMININ 521 CTG包被的96孔板中。为了检测PD-L-1表面表达,使用抗PD-L-1荧光抗体(参见表4)。对于FACS分选,未编辑的细胞用作阴性对照。选择PD-L-1阳性细胞进行分选和单细胞克隆。
在常氧培养箱(37℃,8% CO2)中培养铺板的单细胞,每隔一天更换培养基,直到集落大到足以作为单细胞重新接种。当汇合时,样品被分开用于维持和基因组DNA提取。使用从插入B2M基因座的位点的质粒同源臂外部扩增的引物,使得能够仅扩增KI整合的DNA,通过PCR鉴定了A20-P2A-PD-L-1 KI插入的正确靶向克隆。克隆的B2M KO状态通过PCR和Sanger测序证实。正确的KI和KO克隆(L1V019B细胞系)以递增的组织培养形式扩增,直到达到3000万个细胞的群体大小。
实施例18:另外的编辑的细胞系的分化和表征
来自上述实施例4中制备的L1V017B细胞系(即,CD39-P2A-PD-L-1 KI和B2M KO)、上述实施例16中制备的L1V018B细胞系(即,CD39-P2A-CD73-P2A-PD-L-1 KI和B2M KO)和上述实施例17中制备的L1V019B细胞系(即,TNFAIP3(A20)-P2A-PD-L-1 KI和B2M KO)的细胞基本上如上述实施例10中所述进行分化。
基本如上述实施例11和12中描述的在分化过程期间不同时间点检查基因表达。图17展示了在第18天用流式细胞术检测SOX17和FOXA2的表达,以证实DE(定型内胚层)细胞的存在。分化的胰腺内胚层细胞(PEC)的存在通过流式细胞术检测存在CHGA阴性和PDX1和NKX6.1阳性优势群体进一步证实(参见图18)。从第16天到胰岛细胞表达各种标志物(例如,CHGA、FOXA2、NKX6.1、PDX1、SOX17、AFP、ALB、CDX2、HAND1、HAND2、NANOG)的时间进程显示在图19。
实施例19:产生B2M KO和PD-L-1 KI、TXNIP KO和HLA-E KI以及CIITA KO和CD39KI人类多能干细胞
将产生其中编码PD-L-1的多核苷酸插入B2M基因座,编码HLA-E的多核苷酸插入TXNIP基因座,并且编码CD39的多核苷酸插入CIITA基因座,从而敲除B2M、TXNIP和CIITA基因的细胞。
人类多能干细胞将基本上如以上实施例2中所述用B2M-CAGGS-PD-L-1供体质粒和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP电穿孔,所述B2M-CAGGS-PD-L-1供体质粒中,PD-L-1序列(SEQ ID NO:20)侧翼是与分别位于B2M基因座的靶位点的左侧和右侧的基因组序列具有序列同源性的800bp同源臂(SEQ ID NO:15和22)。电穿孔后7至10天,基本上如实施例2所述的通过MACS富集细胞中表达PD-L-1(阳性)的细胞。在扩增富集的PD-L-1阳性群体后,细胞将基本上如以上实施例2中所述的用TXNIP-CAGGS-HLA-E供体质粒和包含Cas9和TXNIP_外显子1_T5 gRNA(SEQ ID NO:37)的RNP电穿孔,所述TXNIP-CAGGS-HLA-E供体质粒中HLA-E序列(SEQ ID NO:43)的侧翼是与分别位于TXNIP基因座的靶位点的左侧和右侧的基因组序列具有序列同源性的800bp臂(SEQ ID NO:42和44)。在富集HLA-E阳性细胞并扩增PD-L-1和HLA-E细胞后,双阳性细胞将用CIITA-CAGGS-CD39供体质粒(表5)和包含Cas9和CIITA Ex3_T6 gRNA(SEQ ID NO:25)的RNP电穿孔。将富集细胞中表达CD39的细胞,扩增,并选择PD-L-1、HLA-E和CD39三阳性细胞,其将如上所述地表征。
实施例20:产生B2M KO和TNFAIP3-P2A-PD-L-1 KI、TXNIP KO和MANF-P2A-HLA-EKI以及B2M KO和CD39-P2A-PD-L-1 KI的人类多能干细胞
将产生其中编码PD-L-1的多核苷酸被插入到B2M基因座的第一靶位点,编码HLA-E的多核苷酸被插入到TXNIP基因座,并且编码CD39的多核苷酸被插入到B2M基因座的第二靶位点的另一个位置,从而敲除B2M和TXNIP基因的细胞。
表达PD-L-1和HLA-E的双阳性细胞将基本上如上述实施例16中所述地产生。双阳性细胞将用B2M-CAGGS-CD39供体质粒以及包含Cas9和选自SEQ ID NO:1或3-13的B2MgRNA的RNP电穿孔,所述B2M-CAGGS-CD39供体质粒中CD39序列(SEQ ID NO:27)侧翼是与第二B2M靶位点周围的基因组序列具有序列同一性的800bp同源臂。将富集细胞中的CD39阳性细胞,扩增,并选择PD-L-1、HLA-E和CD39三阳性细胞,其如上所述表征。
实施例21:编辑的人类胚胎干细胞向胰腺内胚层细胞(PEC)的分化
编辑的人类胚胎干细胞(ES)的维持。不同传代(P38-42)的包含B2M KO和TNFAIP3-P2A-PD-L-1 KI、TXNIP KO和MANF-P2A-HLA-E KI、CIITA KO和CD39 KI的编辑的人类多能干细胞(“X4”;参见实施例7)通过以下维持:对于4天传代以约33,000个细胞/cm2接种,或对于3天传代以约50,000个细胞/cm2接种,传代用hESM培养基(DMEM/F12+10%KSR+10ng/mL活化素A和10ng/mL调蛋白)和最终10%人类AB血清进行。
用于PEC分化的编辑的人类胚胎干细胞的聚集。用将编辑的细胞解离成单细胞,然后离心并以每毫升100万个细胞重悬于DMEM/F12培养基中的2% StemPro(Cat#A1000701,Invitrogen,CA)中,并且将总共3.5亿-4亿个细胞接种在一个850cm2滚瓶(Cat#431198,Corning,NY)中,转速为8RPM±0.5RPM持续18-20小时,之后进行分化。如Schulz等人(2012)PLoS ONE 7(5):e37004所述,使用滚瓶将来自编辑的人类多能干细胞的聚集体分化成胰腺谱系,并显示X1细胞。如Rezania等人(2014)Nat.Biotechnol.32(11):1121-1133和US20200208116所述,将来自编辑的人类多能干细胞的聚集体分化成胰腺谱系。
确定来自“X4”克隆,即TXNIP KO/MANF-P2A-HLA-E KI、B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI和CIITA KO/CD39 KI,在PEC阶段和第6阶段(S6)的CHGA、FOXA2、NKX6.1、PDX1和INS的表达模式以证实分化。
实施例22:TXNIP KO/MANF-P2A-HLA-E KI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1KI、CIITA KO/CD39 KI细胞的体内功效研究
还将测试从对照细胞(NCG)或X4(即,TXNIP KO/MANF-P2A-HLA-E KI和B2MKO/TNFAIP3(A20)-P2A-PD-L-1 KI、CIITA KO/CD39 KI)分化的PEC阶段和第6阶段细胞的体内功效。将试验囊或对照囊移植到NSG小鼠(Jackson Laboratory Stock No:005557)的左肾中。
GSIS测试将在第12、16、20和24周进行,如实施例15中对X1细胞所述的。在第26周,GSIS测试后,对动物实施安乐死,并将取出的试验物品固定在中性缓冲的福尔马林中,加工成载玻片,并用H&E染色,并通过免疫组织化学确定胰岛素和胰高血糖素。
实施例23:产生具有TGF-β2KO的X1人类多能干细胞。
产生其中编码TNFAIP3-P2A-PD-L-1的转基因被插入B2M基因座,编码MANF-P2A-HLA-E的转基因被插入TXNIP基因座,编码CD39的转基因被插入CIITA基因座,并且TGF-β2基因被敲除,从而使细胞具有B2M、TXNIP、CIITA和TGF-β2基因敲除的细胞。
基本上如以上实施例2描述的用B2M-CAGGS-TNFAIP3-P2A-PD-L-1供体质粒(SEQID NO:31,表7)和包含Cas9和B2M-2 gRNA(SEQ ID NO:2)的RNP电穿孔人类多能干细胞。电穿孔后7至10天,基本上如实施例2所述的通过MACS富集细胞中表达PD-L-1(阳性)的细胞。扩增富集的PD-L-1阳性群体后,基本上如以上实施例2描述的用TXNIP-CAGGS-MANF-P2A-HLA-E供体质粒(SEQ ID NO:45,表9)和包含Cas9和TXNIP_外显子1_T5 gRNA(SEQ ID NO:37)的RNP电穿孔细胞。在富集HLA-E阳性细胞并扩增PD-L-1和HLA-E细胞后,用CIITA-CAGGS-CD39供体质粒(SEQ ID NO:29,表5)和包含Cas9和CIITA Ex3_T6 gRNA(SEQ ID NO:25)的RNP电穿孔双阳性细胞。富集细胞中表达CD39的细胞,扩增,并选择PD-L-1、HLA-E和CD39三阳性细胞,其如上所述表征。
用包含Cas9和TGF-β2 gRNA的RNP电穿孔确认的三阳性细胞(还具有B2M、TXNIP和CIITA基因敲除),以产生TGF-β2敲除。TGF-β2 gRNA1(5’-GTTCATGCGCAAGAGGATCG-3’(SEQID NO:57),PAM是AGG)用于通过引起TGF-β2基因外显子1中的移码突变来敲除X1克隆和X4批量细胞系中的TGF-β2蛋白。使用氖电穿孔仪在这些富集的hESC细胞中用摩尔比为5:1(gRNA:Cas9)的Cas9蛋白(Biomay)和引导RNA(IDT)的RNP混合物进行电穿孔,绝对值为每100万细胞125pmol Cas9和625pmol gRNA。为了形成RNP复合体,将gRNA和Cas9与R-缓冲液(Neon转染试剂盒)在一个容器中合并至总体积为25-50μL,并在室温(RT)孵育15min。然后使用R-缓冲液将该混合物与细胞合并至~115μL的总体积。然后将该混合物在1500V用1个脉冲电穿孔20ms。电穿孔后,将细胞移出到填充有具有REVITACELLTM补充剂(100X)和层粘连蛋白511的STEMFLEXTM培养基的6孔板中。细胞在常氧培养箱(37℃,8%CO2)中培养。用TGF-β2 gRNA靶向的L3V003B(“X4”)群体命名为L3V004B(“X4+TGF-β2KO”),而用TGF-β2 gRNA靶向的X1克隆群体命名为L3V002B(“X1+TGF-β2KO”)。对L3V004B群体重复该过程一次,并且对L3V002B群体重复两次,以确保高效率的TGF-β2KO。
在常氧培养箱(37℃,8% CO2)中培养铺板的单细胞,每隔一天更换培养基,直到集落大到足以作为单细胞重新接种。当汇合时,样品被分开用于维持和基因组DNA提取。通过PCR和Sanger测序证实了正确靶向的克隆。
对靶TGF-β2序列进行PCR,并通过TIDE分析评估所得到的扩增的DNA的切割效率。使用Platinum Taq Supermix(Invitrogen,cat#125320176和Cat#11495017)对相关区域进行PCR。PCR引物的序列展示在表16中。图20A和图20B显示两个批量编辑的系L3V002(“TGFB2-KO-F1”)和L3V004(“TGFB2-KO-CD39-F1”)的TGF-β2KO编辑效率。两个群体都有超过80%的KO,高于期望的阈值,+1和-7插入缺失是最突出的编辑。
表16.TGF-β2KO引物
名称 类型 序列(5'-3') SEQ ID NO:
TGF-β2F1 正向 AGGATACGTTTTTCTGTTGGGC 59
TGF-β2R1 反向 GGAGAACGGGAAAAGAGCGA 60
实施例24:编辑的人类胚胎干细胞向胰腺内胚层细胞(PEC)的分化
编辑的人类胚胎干细胞(ES)的维持。不同传代(P38-42)的包含B2M KO和TNFAIP3-P2A-PD-L-1 KI、TXNIP KO和MANF-P2A-HLA-E KI、CIITA KO和CD39 KI以及TGF-β2KO(“X4+TGF-β2KO”)的编辑的人类多能干细胞通过以下来维持:对于4天传代以约33,000个细胞/cm2接种,或对于3天传代以约50,000个细胞/cm2接种,接种用hESM培养基(DMEM/F12+10%KSR+10ng/mL活化素A和10ng/mL调蛋白)和最终10%人类AB血清进行。
用于PEC分化的编辑的人类胚胎干细胞的聚集。用将编辑的细胞解离成单细胞,然后离心并以每毫升100万个细胞重悬于DMEM/F12培养基中的2% StemPro(Cat#A1000701,Invitrogen,CA)中,并且将总共3.5亿-4亿个细胞接种在一个850cm2滚瓶(Cat#431198,Corning,NY)中,转速为8RPM±0.5RPM持续18-20小时,之后进行分化。如Schulz等人(2012)PLoS ONE 7(5):e37004所述,使用滚瓶将来自编辑的人类多能干细胞的聚集体分化成胰腺谱系,并显示X1细胞。如Rezania等人(2014)Nat.Biotechnol.32(11):1121-1133和US20200208116所述,将来自编辑的人类多能干细胞的聚集体分化成胰腺谱系。
在PEC阶段和第6阶段(S6),确定来自“X4+TGF-β2KO”克隆,即TXNIP KO/MANF-P2A-HLA-E KI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI(X1)CIITA KO/CD39KI和TGF-β2KO的CHGA、FOXA2、NKX6.1、PDX1和INS的表达模式以确认分化。
实施例25:B2M KO和X1 PEC细胞的免疫逃避测定
采用使用外周血单个核细胞(PBMC)增殖测定的免疫逃避测定,测试B2M KO和TXNIP KO/MANF-P2A-HLA-E KI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI(“X1”)细胞在培养基中有或没有TGF-β信号传导的情况下逃避免疫应答的能力。按照制造商为CellTraceTMCFSE细胞增殖试剂盒提供的说明进行测定。简而言之,将荧光标记的PBMC加入到X-VIVO-15培养基中,该培养基包含编辑的或非切割的对照PEC细胞、IL-2和含有或不含TGF-β阻断抗体的人类血清。使用抗TGF-β1、TGF-β2和TGF-β3的抗体阻断培养基中的蛋白信号传导并抑制TGFβ介导的免疫逃避。使用染料稀释CFSE细胞增殖试剂盒监测PBMC细胞在5天的时间段的增殖。在有或没有TGF-β阻断剂的情况下的PBMC活化数据在图21中提供。结果表明,在没有TGF-β阻断的情况下,所有的PEC都是“免疫逃避的”,因为任何样品都没有诱导T细胞活化。在TGF-β阻断的情况下,T细胞活化增加。NCG(具有正常B2M的非切割对照)驱动高于单独PBMC对照的T细胞活化响应,但是B2M KO和X1(也具有B2M KO)PEC都低于基线,这表明X1和B2M KO PEC是免疫逃避的,而NCG PEC对同种异体PBMC是轻度免疫原性的。
实施例26:编辑和分化的PEC细胞分泌TGF-β2的表征。
在72小时条件培养基中,采用使用抗TGF-β1和抗TGF-β2抗体的基于ELISA的测定检测编辑和分化的细胞中的TGF-β1和TGF-β2分泌水平。下表提供了所用的抗体。
ELISA靶 供应商 Cat#
TGF-b1 ThermoFisher BMS249
TGF-b2 R&D DB250
S100A8/A9-钙防卫蛋白9 FisherScientific 501656476
GDF9 LifeSpan LS-526-1
PDGF-AA ThermoFisher EHPDGFA
PDGF-BB ThermoFisher EHPDGFB
在TGF-β2KO细胞和具有HLA-E KI、TXNIP KO、PD-L-1 KI和B2M KO的编辑的细胞(“V1B”)中确定TGF-β2和TGF-β1分泌谱。结果表明,V1B和TGF-β2KO细胞在条件培养基中均表现出检测不到的TGF-β2水平(参见图22A)。然而,有趣的是,来自TGF-β2KO细胞的条件培养基表现出更高水平的TGF-β1分泌(参见图22B)。
实施例27:TGF-β2KO细胞分泌的化学引诱剂的表征
成纤维细胞的迁移和导致的纤维化是由植入的细胞分泌的化学引诱剂指导的。使用基于ELISA的方法来检查与V1B细胞(HLA-E KI、TXNIP KO、PD-L-1 KI、B2M KO)和X1(实施例26中表格中提供的抗体)相比,TGF-β2KO细胞是否具有减少的化学引诱剂分泌。测试的化学引诱剂包括TGF-β2(参见图23A)、生长分化因子(GDF-9,参见图23B)和血小板来源的生长因子-AA(PDGF-AA,参见图23C)。
结果表明,V1B和TGF-β2KO细胞的TGF-β2和GDF-9分泌均显著减少。然而,只有TGF-β2KO细胞显示PDGF-AA分泌减少。
实施例28:体外成纤维细胞迁移测定。
按照制造商的说明,使用来自Millipore/Sigma的QCM趋化性细胞迁移检测试剂盒(目录号ECM509)进行体外成纤维细胞迁移测定。简言之,将包含MRC-5(人类肺成纤维细胞)或HT1080(人类纤维肉瘤)细胞的细胞悬浮液置于测定单元的上室中,该上室通过8μm孔径的聚碳酸酯膜与包含来自野生型、V1B、TGF-β2KO、X1、X4和/或X4+TGF-β2KO PEC细胞的72小时条件培养基的外室分开。允许细胞迁移通过聚碳酸酯膜2-24小时。迁移的细胞附着在膜的底部。将迁移的细胞从膜上解离并裂解。使用CyQuant GR染料对细胞进行定量。图24A-图24B显示使用人类肺成纤维细胞(MRC-5)细胞和来自WT、V1B和X1细胞(图24A)以及WT和TGF-β2KO细胞(图24B)的条件培养基进行的成纤维细胞迁移测定结果。图25A-图25C显示使用人类纤维肉瘤(HT1080)细胞和来自WT、V1B和X1细胞(图25A)、WT和TGF-β2KO细胞(图25B),以及WT、X4和X4+TGF-β2KO细胞(图25C)的条件培养基进行的成纤维细胞迁移测定结果。从展示的数据可以看出,与野生型相比,两种TGF-β2KO编辑的PEC条件培养基都支持成纤维细胞的迁移减少。
实施例29:TXNIP KO/MANF-P2A-HLA-E KI和B2M KO/TNFAIP3(A20)-P2A-PD-L-1KI、CIITA KO/CD39 KI和TGF-β2KO细胞的体内功效研究
将测试从对照细胞(NCG)或实施例24中产生的X4+TGF-β2KO细胞系(即TXNIP KO/MANF-P2A-HLA-E KI、B2M KO/TNFAIP3(A20)-P2A-PD-L-1 KI、CIITA KO/CD39 KI和TGF-β2KO)分化的PEC阶段和第6阶段细胞的体内功效。将试验囊或对照囊移植到NSG小鼠(Jackson Laboratory Stock No:005557)的左肾中。
GSIS测试将在第12、16、20和24周进行,如实施例14中对X1细胞所述。在第26周,GSIS测试后,对动物实施安乐死,并将取出的试验物品固定在中性缓冲的福尔马林中,加工成载玻片,并用H&E染色,并通过免疫组织化学确定胰岛素和胰高血糖素。
序列表
<110> 克里斯珀医疗股份公司
A·雷扎尼亚
瓦伦汀·斯卢奇
<120> 通用供体细胞
<130> CT154-PCT1
<150> US 63/132,890
<151> 2020-12-31
<150> US 63/234,997
<151> 2021-08-19
<150> US 63/288,356
<151> 2021-12-10
<160> 60
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
gctactctct ctttctggcc 20
<210> 2
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 2
ggccgagatg tctcgctccg 20
<210> 3
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 3
cgcgagcaca gctaaggcca 20
<210> 4
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 4
tataagtgga ggcgtcgcgc 20
<210> 5
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 5
gagtagcgcg agcacagcta 20
<210> 6
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 6
actggacgcg tcgcgctggc 20
<210> 7
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 7
aagtggaggc gtcgcgctgg 20
<210> 8
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 8
ggccacggag cgagacatct 20
<210> 9
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 9
gcccgaatgc tgtcagcttc 20
<210> 10
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 10
ctcgcgctac tctctctttc 20
<210> 11
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 11
tcctgaagct gacagcattc 20
<210> 12
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 12
ttcctgaagc tgacagcatt 20
<210> 13
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 13
actctctctt tctggcctgg 20
<210> 14
<211> 130
<212> DNA
<213> 智人(Homo sapiens)
<400> 14
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 15
<211> 800
<212> DNA
<213> 智人(Homo sapiens)
<400> 15
gttctagggt ggaaactaag agaatgatgt acctagaggg cgctggaagc tctaaagccc 60
tagcagttac tgcttttact attagtggtc gtttttttct cccccccgcc ccccgacaaa 120
tcaacagaac aaagaaaatt acctaaacag caaggacata gggaggaact tcttggcaca 180
gaactttcca aacacttttt cctgaaggga tacaagaagc aagaaaggta ctctttcact 240
aggaccttct ctgagctgtc ctcaggatgc ttttgggact atttttctta cccagagaat 300
ggagaaaccc tgcagggaat tcccaagctg tagttataaa cagaagttct ccttctgcta 360
ggtagcattc aaagatctta atcttctggg tttccgtttt ctcgaatgaa aaatgcaggt 420
ccgagcagtt aactggctgg ggcaccatta gcaagtcact tagcatctct ggggccagtc 480
tgcaaagcga gggggcagcc ttaatgtgcc tccagcctga agtcctagaa tgagcgcccg 540
gtgtcccaag ctggggcgcg caccccagat cggagggcgc cgatgtacag acagcaaact 600
cacccagtct agtgcatgcc ttcttaaaca tcacgagact ctaagaaaag gaaactgaaa 660
acgggaaagt ccctctctct aacctggcac tgcgtcgctg gcttggagac aggtgacggt 720
ccctgcgggc cttgtcctga ttggctgggc acgcgtttaa tataagtgga ggcgtcgcgc 780
tggcgggcat tcctgaagct 800
<210> 16
<211> 1667
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 16
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg ggtcgaggtg agccccacgt tctgcttcac tctccccatc 420
tcccccccct ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg 480
atgggggcgg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg 540
cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc 600
ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg 660
agtcgctgcg ttgccttcgc cccgtgcccc gctccgcgcc gcctcgcgcc gcccgccccg 720
gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg 780
ctgtaattag cgcttggttt aatgacggct cgtttctttt ctgtggctgc gtgaaagcct 840
taaagggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt gcgtgcgtgt 900
gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg agcgctgcgg 960
gcgcggcgcg gggctttgtg cgctccgcgt gtgcgcgagg ggagcgcggc cgggggcggt 1020
gccccgcggt gcgggggggc tgcgagggga acaaaggctg cgtgcggggt gtgtgcgtgg 1080
gggggtgagc agggggtgtg ggcgcggcgg tcgggctgta acccccccct gcacccccct 1140
ccccgagttg ctgagcacgg cccggcttcg ggtgcggggc tccgtgcggg gcgtggcgcg 1200
gggctcgccg tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg 1260
cctcgggccg gggagggctc gggggagggg cgcggcggcc ccggagcgcc ggcggctgtc 1320
gaggcgcggc gagccgcagc cattgccttt tatggtaatc gtgcgagagg gcgcagggac 1380
ttcctttgtc ccaaatctgg cggagccgaa atctgggagg cgccgccgca ccccctctag 1440
cgggcgcggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga gggccttcgt 1500
gcgtcgccgc gccgccgtcc ccttctccat ctccagcctc ggggctgccg cagggggacg 1560
gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg accggcggct 1620
ctagagcctc tgctaaccat gttcatgcct tcttcttttt cctacag 1667
<210> 17
<211> 546
<212> DNA
<213> 智人(Homo sapiens)
<400> 17
atgaggagga tgtgggccac gcaggggctg gcggtggcgc tggctctgag cgtgctgccg 60
ggcagccggg cgctgcggcc gggcgactgc gaagtttgta tttcttatct gggaagattt 120
taccaggacc tcaaagacag agatgtcaca ttctcaccag ccactattga aaacgaactt 180
ataaagttct gccgggaagc aagaggcaaa gagaatcggt tgtgctacta tatcggggcc 240
acagatgatg cagccaccaa aatcatcaat gaggtatcaa agcctctggc ccaccacatc 300
cctgtggaga agatctgtga gaagcttaag aagaaggaca gccagatatg tgagcttaag 360
tatgacaagc agatcgacct gagcacagtg gacctgaaga agctccgagt taaagagctg 420
aagaagattc tggatgactg gggggagaca tgcaaaggct gtgcagaaaa gtctgactac 480
atccggaaga taaatgaact gatgcctaaa tatgccccca aggcagccag tgcacggacc 540
gatttg 546
<210> 18
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 18
gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57
<210> 19
<211> 2370
<212> DNA
<213> 智人(Homo sapiens)
<400> 19
atggctgaac aagtccttcc tcaggctttg tatttgagca atatgcggaa agctgtgaag 60
atacgggaga gaactccaga agacattttt aaacctacta atgggatcat tcatcatttt 120
aaaaccatgc accgatacac actggaaatg ttcagaactt gccagttttg tcctcagttt 180
cgggagatca tccacaaagc cctcatcgac agaaacatcc aggccaccct ggaaagccag 240
aagaaactca actggtgtcg agaagtccgg aagcttgtgg cgctgaaaac gaacggtgac 300
ggcaattgcc tcatgcatgc cacttctcag tacatgtggg gcgttcagga cacagacttg 360
gtactgagga aggcgctgtt cagcacgctc aaggaaacag acacacgcaa ctttaaattc 420
cgctggcaac tggagtctct caaatctcag gaatttgttg aaacggggct ttgctatgat 480
actcggaact ggaatgatga atgggacaat cttatcaaaa tggcttccac agacacaccc 540
atggcccgaa gtggacttca gtacaactca ctggaagaaa tacacatatt tgtcctttgc 600
aacatcctca gaaggccaat cattgtcatt tcagacaaaa tgctaagaag tttggaatca 660
ggttccaatt tcgccccttt gaaagtgggt ggaatttact tgcctctcca ctggcctgcc 720
caggaatgct acagataccc cattgttctc ggctatgaca gccatcattt tgtacccttg 780
gtgaccctga aggacagtgg gcctgaaatc cgagctgttc cacttgttaa cagagaccgg 840
ggaagatttg aagacttaaa agttcacttt ttgacagatc ctgaaaatga gatgaaggag 900
aagctcttaa aagagtactt aatggtgata gaaatccccg tccaaggctg ggaccatggc 960
acaactcatc tcatcaatgc cgcaaagttg gatgaagcta acttaccaaa agaaatcaat 1020
ctggtagatg attactttga acttgttcag catgagtaca agaaatggca ggaaaacagc 1080
gagcagggga ggagagaggg gcacgcccag aatcccatgg aaccttccgt gccccagctt 1140
tctctcatgg atgtaaaatg tgaaacgccc aactgcccct tcttcatgtc tgtgaacacc 1200
cagcctttat gccatgagtg ctcagagagg cggcaaaaga atcaaaacaa actcccaaag 1260
ctgaactcca agccgggccc tgaggggctc cctggcatgg cgctcggggc ctctcgggga 1320
gaagcctatg agcccttggc gtggaaccct gaggagtcca ctggggggcc tcattcggcc 1380
ccaccgacag cacccagccc ttttctgttc agtgagacca ctgccatgaa gtgcaggagc 1440
cccggctgcc ccttcacact gaatgtgcag cacaacggat tttgtgaacg ttgccacaac 1500
gcccggcaac ttcacgccag ccacgcccca gaccacacaa ggcacttgga tcccgggaag 1560
tgccaagcct gcctccagga tgttaccagg acatttaatg ggatctgcag tacttgcttc 1620
aaaaggacta cagcagaggc ctcctccagc ctcagcacca gcctccctcc ttcctgtcac 1680
cagcgttcca agtcagatcc ctcgcggctc gtccggagcc cctccccgca ttcttgccac 1740
agagctggaa acgacgcccc tgctggctgc ctgtctcaag ctgcacggac tcctggggac 1800
aggacgggga cgagcaagtg cagaaaagcc ggctgcgtgt attttgggac tccagaaaac 1860
aagggctttt gcacactgtg tttcatcgag tacagagaaa acaaacattt tgctgctgcc 1920
tcagggaaag tcagtcccac agcgtccagg ttccagaaca ccattccgtg cctggggagg 1980
gaatgcggca cccttggaag caccatgttt gaaggatact gccagaagtg tttcattgaa 2040
gctcagaatc agagatttca tgaggccaaa aggacagaag agcaactgag atcgagccag 2100
cgcagagatg tgcctcgaac cacacaaagc acctcaaggc ccaagtgcgc ccgggcctcc 2160
tgcaagaaca tcctggcctg ccgcagcgag gagctctgca tggagtgtca gcatcccaac 2220
cagaggatgg gccctggggc ccaccggggt gagcctgccc ccgaagaccc ccccaagcag 2280
cgttgccggg cccccgcctg tgatcatttt ggcaatgcca agtgcaacgg ctactgcaac 2340
gaatgctttc agttcaagca gatgtatggc 2370
<210> 20
<211> 873
<212> DNA
<213> 智人(Homo sapiens)
<400> 20
atgaggatat ttgctgtctt tatattcatg acctactggc atttgctgaa cgcatttact 60
gtcacggttc ccaaggacct atatgtggta gagtatggta gcaatatgac aattgaatgc 120
aaattcccag tagaaaaaca attagacctg gctgcactaa ttgtctattg ggaaatggag 180
gataagaaca ttattcaatt tgtgcatgga gaggaagacc tgaaggttca gcatagtagc 240
tacagacaga gggcccggct gttgaaggac cagctctccc tgggaaatgc tgcacttcag 300
atcacagatg tgaaattgca ggatgcaggg gtgtaccgct gcatgatcag ctatggtggt 360
gccgactaca agcgaattac tgtgaaagtc aatgccccat acaacaaaat caaccaaaga 420
attttggttg tggatccagt cacctctgaa catgaactga catgtcaggc tgagggctac 480
cccaaggccg aagtcatctg gacaagcagt gaccatcaag tcctgagtgg taagaccacc 540
accaccaatt ccaagagaga ggagaaactt ttcaatgtga ccagcacact gagaatcaac 600
acaacaacta atgagatttt ctactgcact tttaggagat tagatcctga ggaaaaccat 660
acagctgaat tggtcatccc agaactacct ctggcacatc ctccaaatga aaggactcac 720
ttggtaattc tgggagccat cttattatgc cttggtgtag cactgacatt catcttccgt 780
ttaagaaaag ggagaatgat ggatgtgaaa aaatgtggca tccaagatac aaactcaaag 840
aagcaaagtg atacacattt ggaggagacg taa 873
<210> 21
<211> 225
<212> DNA
<213> 家牛(Bos taurus)
<400> 21
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 60
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 120
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 180
gaagacaata gcaggcatgc tggggatgcg gtgggctcta tgggt 225
<210> 22
<211> 800
<212> DNA
<213> 智人(Homo sapiens)
<400> 22
ccagcgtgag tctctcctac cctcccgctc tggtccttcc tctcccgctc tgcaccctct 60
gtggccctcg ctgtgctctc tcgctccgtg acttcccttc tccaagttct ccttggtggc 120
ccgccgtggg gctagtccag ggctggatct cggggaagcg gcggggtggc ctgggagtgg 180
ggaagggggt gcgcacccgg gacgcgcgct acttgcccct ttcggcgggg agcaggggag 240
acctttggcc tacggcgacg ggagggtcgg gacaaagttt agggcgtcga taagcgtcag 300
agcgccgagg ttgggggagg gtttctcttc cgctctttcg cggggcctct ggctccccca 360
gcgcagctgg agtgggggac gggtaggctc gtcccaaagg cgcggcgctg aggtttgtga 420
acgcgtggag gggcgcttgg ggtctggggg aggcgtcgcc cgggtaagcc tgtctgctgc 480
ggctctgctt cccttagact ggagagctgt ggacttcgtc taggcgcccg ctaagttcgc 540
atgtcctagc acctctgggt ctatgtgggg ccacaccgtg gggaggaaac agcacgcgac 600
gtttgtagaa tgcttggctg tgatacaaag cggtttcgaa taattaactt atttgttccc 660
atcacatgtc acttttaaaa aattataaga actacccgtt attgacatct ttctgtgtgc 720
caaggacttt atgtgctttg cgtcatttaa ttttgaaaac agttatcttc cgccatagat 780
aactactatg gttatcttct 800
<210> 23
<211> 141
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 23
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag ctgcctgcag g 141
<210> 24
<211> 10181
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 24
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtgttcta gggtggaaac taagagaatg atgtacctag 180
agggcgctgg aagctctaaa gccctagcag ttactgcttt tactattagt ggtcgttttt 240
ttctcccccc cgccccccga caaatcaaca gaacaaagaa aattacctaa acagcaagga 300
catagggagg aacttcttgg cacagaactt tccaaacact ttttcctgaa gggatacaag 360
aagcaagaaa ggtactcttt cactaggacc ttctctgagc tgtcctcagg atgcttttgg 420
gactattttt cttacccaga gaatggagaa accctgcagg gaattcccaa gctgtagtta 480
taaacagaag ttctccttct gctaggtagc attcaaagat cttaatcttc tgggtttccg 540
ttttctcgaa tgaaaaatgc aggtccgagc agttaactgg ctggggcacc attagcaagt 600
cacttagcat ctctggggcc agtctgcaaa gcgagggggc agccttaatg tgcctccagc 660
ctgaagtcct agaatgagcg cccggtgtcc caagctgggg cgcgcacccc agatcggagg 720
gcgccgatgt acagacagca aactcaccca gtctagtgca tgccttctta aacatcacga 780
gactctaaga aaaggaaact gaaaacggga aagtccctct ctctaacctg gcactgcgtc 840
gctggcttgg agacaggtga cggtccctgc gggccttgtc ctgattggct gggcacgcgt 900
ttaatataag tggaggcgtc gcgctggcgg gcattcctga agctaagctt gtggacgata 960
tcgaattcgc acgacattga ttattgacta gttattaata gtaatcaatt acggggtcat 1020
tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg 1080
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 1140
cgccaatagg gactttccat tgacgtcaat gggtggacta tttacggtaa actgcccact 1200
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 1260
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 1320
acatctacgt attagtcatc gctattacca tgggtcgagg tgagccccac gttctgcttc 1380
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1440
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 1500
cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct 1560
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 1620
gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 1680
ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 1740
ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 1800
gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 1860
gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg 1920
tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg 1980
gccgggggcg gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg 2040
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc 2100
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg 2160
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 2220
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg ccccggagcg 2280
ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 2340
gggcgcaggg acttcctttg tcccaaatct ggcggagccg aaatctggga ggcgccgccg 2400
caccccctct agcgggcgcg ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg 2460
gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc atctccagcc tcggggctgc 2520
cgcaggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 2580
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagg 2640
ggggatccgt ttatctgcag aattcgccct tgacgtcgcc accatgagga ggatgtgggc 2700
cacgcagggg ctggcggtgg cgctggctct gagcgtgctg ccgggcagcc gggcgctgcg 2760
gccgggcgac tgcgaagttt gtatttctta tctgggaaga ttttaccagg acctcaaaga 2820
cagagatgtc acattctcac cagccactat tgaaaacgaa cttataaagt tctgccggga 2880
agcaagaggc aaagagaatc ggttgtgcta ctatatcggg gccacagatg atgcagccac 2940
caaaatcatc aatgaggtat caaagcctct ggcccaccac atccctgtgg agaagatctg 3000
tgagaagctt aagaagaagg acagccagat atgtgagctt aagtatgaca agcagatcga 3060
cctgagcaca gtggacctga agaagctccg agttaaagag ctgaagaaga ttctggatga 3120
ctggggggag acatgcaaag gctgtgcaga aaagtctgac tacatccgga agataaatga 3180
actgatgcct aaatatgccc ccaaggcagc cagtgcacgg accgatttgg gaagcggagc 3240
tactaacttc agcctgctga agcaggctgg agacgtggag gagaaccctg gacctatggc 3300
tgaacaagtc cttcctcagg ctttgtattt gagcaatatg cggaaagctg tgaagatacg 3360
ggagagaact ccagaagaca tttttaaacc tactaatggg atcattcatc attttaaaac 3420
catgcaccga tacacactgg aaatgttcag aacttgccag ttttgtcctc agtttcggga 3480
gatcatccac aaagccctca tcgacagaaa catccaggcc accctggaaa gccagaagaa 3540
actcaactgg tgtcgagaag tccggaagct tgtggcgctg aaaacgaacg gtgacggcaa 3600
ttgcctcatg catgccactt ctcagtacat gtggggcgtt caggacacag acttggtact 3660
gaggaaggcg ctgttcagca cgctcaagga aacagacaca cgcaacttta aattccgctg 3720
gcaactggag tctctcaaat ctcaggaatt tgttgaaacg gggctttgct atgatactcg 3780
gaactggaat gatgaatggg acaatcttat caaaatggct tccacagaca cacccatggc 3840
ccgaagtgga cttcagtaca actcactgga agaaatacac atatttgtcc tttgcaacat 3900
cctcagaagg ccaatcattg tcatttcaga caaaatgcta agaagtttgg aatcaggttc 3960
caatttcgcc cctttgaaag tgggtggaat ttacttgcct ctccactggc ctgcccagga 4020
atgctacaga taccccattg ttctcggcta tgacagccat cattttgtac ccttggtgac 4080
cctgaaggac agtgggcctg aaatccgagc tgttccactt gttaacagag accggggaag 4140
atttgaagac ttaaaagttc actttttgac agatcctgaa aatgagatga aggagaagct 4200
cttaaaagag tacttaatgg tgatagaaat ccccgtccaa ggctgggacc atggcacaac 4260
tcatctcatc aatgccgcaa agttggatga agctaactta ccaaaagaaa tcaatctggt 4320
agatgattac tttgaacttg ttcagcatga gtacaagaaa tggcaggaaa acagcgagca 4380
ggggaggaga gaggggcacg cccagaatcc catggaacct tccgtgcccc agctttctct 4440
catggatgta aaatgtgaaa cgcccaactg ccccttcttc atgtctgtga acacccagcc 4500
tttatgccat gagtgctcag agaggcggca aaagaatcaa aacaaactcc caaagctgaa 4560
ctccaagccg ggccctgagg ggctccctgg catggcgctc ggggcctctc ggggagaagc 4620
ctatgagccc ttggcgtgga accctgagga gtccactggg gggcctcatt cggccccacc 4680
gacagcaccc agcccttttc tgttcagtga gaccactgcc atgaagtgca ggagccccgg 4740
ctgccccttc acactgaatg tgcagcacaa cggattttgt gaacgttgcc acaacgcccg 4800
gcaacttcac gccagccacg ccccagacca cacaaggcac ttggatcccg ggaagtgcca 4860
agcctgcctc caggatgtta ccaggacatt taatgggatc tgcagtactt gcttcaaaag 4920
gactacagca gaggcctcct ccagcctcag caccagcctc cctccttcct gtcaccagcg 4980
ttccaagtca gatccctcgc ggctcgtccg gagcccctcc ccgcattctt gccacagagc 5040
tggaaacgac gcccctgctg gctgcctgtc tcaagctgca cggactcctg gggacaggac 5100
ggggacgagc aagtgcagaa aagccggctg cgtgtatttt gggactccag aaaacaaggg 5160
cttttgcaca ctgtgtttca tcgagtacag agaaaacaaa cattttgctg ctgcctcagg 5220
gaaagtcagt cccacagcgt ccaggttcca gaacaccatt ccgtgcctgg ggagggaatg 5280
cggcaccctt ggaagcacca tgtttgaagg atactgccag aagtgtttca ttgaagctca 5340
gaatcagaga tttcatgagg ccaaaaggac agaagagcaa ctgagatcga gccagcgcag 5400
agatgtgcct cgaaccacac aaagcacctc aaggcccaag tgcgcccggg cctcctgcaa 5460
gaacatcctg gcctgccgca gcgaggagct ctgcatggag tgtcagcatc ccaaccagag 5520
gatgggccct ggggcccacc ggggtgagcc tgcccccgaa gaccccccca agcagcgttg 5580
ccgggccccc gcctgtgatc attttggcaa tgccaagtgc aacggctact gcaacgaatg 5640
ctttcagttc aagcagatgt atggcggaag cggagctact aacttcagcc tgctgaagca 5700
ggctggagac gtggaggaga accctggacc tatgaggata tttgctgtct ttatattcat 5760
gacctactgg catttgctga acgcatttac tgtcacggtt cccaaggacc tatatgtggt 5820
agagtatggt agcaatatga caattgaatg caaattccca gtagaaaaac aattagacct 5880
ggctgcacta attgtctatt gggaaatgga ggataagaac attattcaat ttgtgcatgg 5940
agaggaagac ctgaaggttc agcatagtag ctacagacag agggcccggc tgttgaagga 6000
ccagctctcc ctgggaaatg ctgcacttca gatcacagat gtgaaattgc aggatgcagg 6060
ggtgtaccgc tgcatgatca gctatggtgg tgccgactac aagcgaatta ctgtgaaagt 6120
caatgcccca tacaacaaaa tcaaccaaag aattttggtt gtggatccag tcacctctga 6180
acatgaactg acatgtcagg ctgagggcta ccccaaggcc gaagtcatct ggacaagcag 6240
tgaccatcaa gtcctgagtg gtaagaccac caccaccaat tccaagagag aggagaaact 6300
tttcaatgtg accagcacac tgagaatcaa cacaacaact aatgagattt tctactgcac 6360
ttttaggaga ttagatcctg aggaaaacca tacagctgaa ttggtcatcc cagaactacc 6420
tctggcacat cctccaaatg aaaggactca cttggtaatt ctgggagcca tcttattatg 6480
ccttggtgta gcactgacat tcatcttccg tttaagaaaa gggagaatga tggatgtgaa 6540
aaaatgtggc atccaagata caaactcaaa gaagcaaagt gatacacatt tggaggagac 6600
gtaaccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 6660
cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 6720
aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 6780
aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct 6840
ctatgggtcg acccagcgtg agtctctcct accctcccgc tctggtcctt cctctcccgc 6900
tctgcaccct ctgtggccct cgctgtgctc tctcgctccg tgacttccct tctccaagtt 6960
ctccttggtg gcccgccgtg gggctagtcc agggctggat ctcggggaag cggcggggtg 7020
gcctgggagt ggggaagggg gtgcgcaccc gggacgcgcg ctacttgccc ctttcggcgg 7080
ggagcagggg agacctttgg cctacggcga cgggagggtc gggacaaagt ttagggcgtc 7140
gataagcgtc agagcgccga ggttggggga gggtttctct tccgctcttt cgcggggcct 7200
ctggctcccc cagcgcagct ggagtggggg acgggtaggc tcgtcccaaa ggcgcggcgc 7260
tgaggtttgt gaacgcgtgg aggggcgctt ggggtctggg ggaggcgtcg cccgggtaag 7320
cctgtctgct gcggctctgc ttcccttaga ctggagagct gtggacttcg tctaggcgcc 7380
cgctaagttc gcatgtccta gcacctctgg gtctatgtgg ggccacaccg tggggaggaa 7440
acagcacgcg acgtttgtag aatgcttggc tgtgatacaa agcggtttcg aataattaac 7500
ttatttgttc ccatcacatg tcacttttaa aaaattataa gaactacccg ttattgacat 7560
ctttctgtgt gccaaggact ttatgtgctt tgcgtcattt aattttgaaa acagttatct 7620
tccgccatag ataactacta tggttatctt ctggtaacca cgtgcggacc gaggctgcag 7680
cgtcgtcctc cctaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 7740
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 7800
tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc tgatgcggta ttttctcctt 7860
acgcatctgt gcggtatttc acaccgcata cgtcaaagca accatagtac gcgccctgta 7920
gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 7980
gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 8040
ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 8100
acctcgaccc caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat 8160
agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 8220
aaactggaac aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc 8280
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 8340
acaaaatatt aacgtttaca attttatggt gcactctcag tacaatctgc tctgatgccg 8400
catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 8460
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 8520
ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt 8580
tataggttaa tgtcatgaac aataaaactg tctgcttaca taaacagtaa tacaaggggt 8640
gttatgagcc atattcaacg ggaaacgtcg aggccgcgat taaattccaa catggatgct 8700
gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat 8760
cgcttgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt 8820
gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt 8880
ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc 8940
cccggaaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt 9000
gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt 9060
aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt 9120
gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa 9180
atgcataaac ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt 9240
gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga 9300
atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct 9360
tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg 9420
cagtttcatt tgatgctcga tgagtttttc taatctcatg accaaaatcc cttaacgtga 9480
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 9540
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 9600
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 9660
gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 9720
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 9780
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 9840
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 9900
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 9960
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 10020
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 10080
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 10140
tttacggttc ctggcctttt gctggccttt tgctcacatg t 10181
<210> 25
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 25
ggtccatctg gtcatagaag 20
<210> 26
<211> 800
<212> DNA
<213> 智人(Homo sapiens)
<400> 26
catatttatg gggtatatgt gaatatttat tacatgcata gaaggtataa tgatcatgtc 60
aggatatttg aggtatccac atttgggatt gtttaaagat taaatgaaat agtgttaaaa 120
gtatttaata tgcccttcaa caaatgatga ggaaatctta gaatctgctc agactccttc 180
agtttacata ttaggaaact gaggcacaga aaggagcaga gacttgctca agtccaccca 240
aagcagtaga gcattgtggt taaatgcagg acttcagtca gactgtctgg gttcaaatcc 300
tggttccact tggacatggg tttccttaca taaatcactt cacctctctg agcctcagtt 360
ttctcatatg caaagtgagg ataataataa taccttcctt acatggttac tgatatgagt 420
attaaatgtg ccagctcatg tgcctggcgt ataggaggtg ctttataaac cttagctgtt 480
accactcatg gcattgccaa atgtgggacg ggtctcctga ctctctggtg tgagattgat 540
ggaatccaca ctttccagtt cccttttcta cctcctgggt atcttctcat atggttgtaa 600
gttccttgga ggaagggaat gtggcttgct ctctccacca cgctgagcat ataagaggtg 660
ctgaatgagc gcttttattc actcctctca tccccagccc tcaccagctg ggagttgttg 720
taggtgtcaa ttttctgcct ctttccaaca ccctgtgagg tgactgagca ttgtcttccc 780
tcccaggcag ctcacagtgt 800
<210> 27
<211> 1530
<212> DNA
<213> 智人(Homo sapiens)
<400> 27
atggaagata caaaggagtc taacgtgaag acattttgct ccaagaatat cctagccatc 60
cttggcttct cctctatcat agctgtgata gctttgcttg ctgtggggtt gacccagaac 120
aaagcattgc cagaaaacgt taagtatggg attgtgctgg atgcgggttc ttctcacaca 180
agtttataca tctataagtg gccagcagaa aaggagaatg acacaggcgt ggtgcatcaa 240
gtagaagaat gcagggttaa aggtcctgga atctcaaaat ttgttcagaa agtaaatgaa 300
ataggcattt acctgactga ttgcatggaa agagctaggg aagtgattcc aaggtcccag 360
caccaagaga cacccgttta cctgggagcc acggcaggca tgcggttgct caggatggaa 420
agtgaagagt tggcagacag ggttctggat gtggtggaga ggagcctcag caactacccc 480
tttgacttcc agggtgccag gatcattact ggccaagagg aaggtgccta tggctggatt 540
actatcaact atctgctggg caaattcagt cagaaaacaa ggtggttcag catagtccca 600
tatgaaacca ataatcagga aacctttgga gctttggacc ttgggggagc ctctacacaa 660
gtcacttttg taccccaaaa ccagactatc gagtccccag ataatgctct gcaatttcgc 720
ctctatggca aggactacaa tgtctacaca catagcttct tgtgctatgg gaaggatcag 780
gcactctggc agaaactggc caaggacatt caggttgcaa gtaatgaaat tctcagggac 840
ccatgctttc atcctggata taagaaggta gtgaacgtaa gtgaccttta caagaccccc 900
tgcaccaaga gatttgagat gactcttcca ttccagcagt ttgaaatcca gggtattgga 960
aactatcaac aatgccatca aagcatcctg gagctcttca acaccagtta ctgcccttac 1020
tcccagtgtg ccttcaatgg gattttcttg ccaccactcc agggggattt tggggcattt 1080
tcagcttttt actttgtgat gaagttttta aacttgacat cagagaaagt ctctcaggaa 1140
aaggtgactg agatgatgaa aaagttctgt gctcagcctt gggaggagat aaaaacatct 1200
tacgctggag taaaggagaa gtacctgagt gaatactgct tttctggtac ctacattctc 1260
tccctccttc tgcaaggcta tcatttcaca gctgattcct gggagcacat ccatttcatt 1320
ggcaagatcc agggcagcga cgccggctgg actttgggct acatgctgaa cctgaccaac 1380
atgatcccag ctgagcaacc attgtccaca cctctctccc actccaccta tgtcttcctc 1440
atggttctat tctccctggt ccttttcaca gtggccatca taggcttgct tatctttcac 1500
aagccttcat atttctggaa agatatggta 1530
<210> 28
<211> 800
<212> DNA
<213> 智人(Homo sapiens)
<400> 28
tgaccagatg gacctggctg gagaagaaga gattgagctc tactcaggtg ggccctcctc 60
cctctggtct cttccggtat cccccacccc tcagcttgct gtagagacgg caatcagggg 120
aaattctggt ccctgccctc ccgtcagcac cacggacagc tcccacgtct gtgggacgct 180
ctctgcagat ggggatgatc tcccagccct gccccgcctc tccctcgttc cccaccagcc 240
ctctttccag aaatttcctt cttcatccaa gggacttttc ctcccagaac ccgacacaga 300
caccatcaac tgcgaccagt tcagcaggct gttgtgtgac atggaaggtg atgaagagac 360
cagggaggct tatgccaata tcggtgagga agcacctgag cccagaaaag gacaatcaag 420
ggcaagagtt ctttgctgcc acttgtcaat atcacccatt catcatgagc cacgtcagtc 480
ccctcccaca gaaatcattg caagggggat gcggagcaat ggctggagga acggagactc 540
cagggaagag aggggagatg gaggccagtg ggggaaatag gccccttcac taatgaccac 600
caagaaaaca aaatctcatg tttacatcct ccacctccat ttctatacgc atttctgctt 660
cttgctcttc tgtccatcct ttctacaaag cccataccat acaccccttt cccttttcct 720
cccagctcct tagccaagct actctagtat ttgtaataac tagcatttac tggatactca 780
tagtatgctc attgctgtcc 800
<210> 29
<211> 7799
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 29
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtcatatt tatggggtat atgtgaatat ttattacatg 180
catagaaggt ataatgatca tgtcaggata tttgaggtat ccacatttgg gattgtttaa 240
agattaaatg aaatagtgtt aaaagtattt aatatgccct tcaacaaatg atgaggaaat 300
cttagaatct gctcagactc cttcagttta catattagga aactgaggca cagaaaggag 360
cagagacttg ctcaagtcca cccaaagcag tagagcattg tggttaaatg caggacttca 420
gtcagactgt ctgggttcaa atcctggttc cacttggaca tgggtttcct tacataaatc 480
acttcacctc tctgagcctc agttttctca tatgcaaagt gaggataata ataatacctt 540
ccttacatgg ttactgatat gagtattaaa tgtgccagct catgtgcctg gcgtatagga 600
ggtgctttat aaaccttagc tgttaccact catggcattg ccaaatgtgg gacgggtctc 660
ctgactctct ggtgtgagat tgatggaatc cacactttcc agttcccttt tctacctcct 720
gggtatcttc tcatatggtt gtaagttcct tggaggaagg gaatgtggct tgctctctcc 780
accacgctga gcatataaga ggtgctgaat gagcgctttt attcactcct ctcatcccca 840
gccctcacca gctgggagtt gttgtaggtg tcaattttct gcctctttcc aacaccctgt 900
gaggtgactg agcattgtct tccctcccag gcagctcaca gtgtaagctt gtggacgata 960
tcgaattcgc acgacattga ttattgacta gttattaata gtaatcaatt acggggtcat 1020
tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg 1080
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 1140
cgccaatagg gactttccat tgacgtcaat gggtggacta tttacggtaa actgcccact 1200
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 1260
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 1320
acatctacgt attagtcatc gctattacca tgggtcgagg tgagccccac gttctgcttc 1380
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1440
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 1500
cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct 1560
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 1620
gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 1680
ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 1740
ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 1800
gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 1860
gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg 1920
tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg 1980
gccgggggcg gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg 2040
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc 2100
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg 2160
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 2220
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg ccccggagcg 2280
ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 2340
gggcgcaggg acttcctttg tcccaaatct ggcggagccg aaatctggga ggcgccgccg 2400
caccccctct agcgggcgcg ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg 2460
gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc atctccagcc tcggggctgc 2520
cgcaggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 2580
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagg 2640
ggggatccgt ttatctgcag aattcgccct tgacgtcgcc accatggaag atacaaagga 2700
gtctaacgtg aagacatttt gctccaagaa tatcctagcc atccttggct tctcctctat 2760
catagctgtg atagctttgc ttgctgtggg gttgacccag aacaaagcat tgccagaaaa 2820
cgttaagtat gggattgtgc tggatgcggg ttcttctcac acaagtttat acatctataa 2880
gtggccagca gaaaaggaga atgacacagg cgtggtgcat caagtagaag aatgcagggt 2940
taaaggtcct ggaatctcaa aatttgttca gaaagtaaat gaaataggca tttacctgac 3000
tgattgcatg gaaagagcta gggaagtgat tccaaggtcc cagcaccaag agacacccgt 3060
ttacctggga gccacggcag gcatgcggtt gctcaggatg gaaagtgaag agttggcaga 3120
cagggttctg gatgtggtgg agaggagcct cagcaactac ccctttgact tccagggtgc 3180
caggatcatt actggccaag aggaaggtgc ctatggctgg attactatca actatctgct 3240
gggcaaattc agtcagaaaa caaggtggtt cagcatagtc ccatatgaaa ccaataatca 3300
ggaaaccttt ggagctttgg accttggggg agcctctaca caagtcactt ttgtacccca 3360
aaaccagact atcgagtccc cagataatgc tctgcaattt cgcctctatg gcaaggacta 3420
caatgtctac acacatagct tcttgtgcta tgggaaggat caggcactct ggcagaaact 3480
ggccaaggac attcaggttg caagtaatga aattctcagg gacccatgct ttcatcctgg 3540
atataagaag gtagtgaacg taagtgacct ttacaagacc ccctgcacca agagatttga 3600
gatgactctt ccattccagc agtttgaaat ccagggtatt ggaaactatc aacaatgcca 3660
tcaaagcatc ctggagctct tcaacaccag ttactgccct tactcccagt gtgccttcaa 3720
tgggattttc ttgccaccac tccaggggga ttttggggca ttttcagctt tttactttgt 3780
gatgaagttt ttaaacttga catcagagaa agtctctcag gaaaaggtga ctgagatgat 3840
gaaaaagttc tgtgctcagc cttgggagga gataaaaaca tcttacgctg gagtaaagga 3900
gaagtacctg agtgaatact gcttttctgg tacctacatt ctctccctcc ttctgcaagg 3960
ctatcatttc acagctgatt cctgggagca catccatttc attggcaaga tccagggcag 4020
cgacgccggc tggactttgg gctacatgct gaacctgacc aacatgatcc cagctgagca 4080
accattgtcc acacctctct cccactccac ctatgtcttc ctcatggttc tattctccct 4140
ggtccttttc acagtggcca tcataggctt gcttatcttt cacaagcctt catatttctg 4200
gaaagatatg gtataatgat agccgctgat cagcctcgac tgtgccttct agttgccagc 4260
catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg 4320
tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc 4380
tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg 4440
ctggggatgc ggtgggctct atgggtcgac tgaccagatg gacctggctg gagaagaaga 4500
gattgagctc tactcaggtg ggccctcctc cctctggtct cttccggtat cccccacccc 4560
tcagcttgct gtagagacgg caatcagggg aaattctggt ccctgccctc ccgtcagcac 4620
cacggacagc tcccacgtct gtgggacgct ctctgcagat ggggatgatc tcccagccct 4680
gccccgcctc tccctcgttc cccaccagcc ctctttccag aaatttcctt cttcatccaa 4740
gggacttttc ctcccagaac ccgacacaga caccatcaac tgcgaccagt tcagcaggct 4800
gttgtgtgac atggaaggtg atgaagagac cagggaggct tatgccaata tcggtgagga 4860
agcacctgag cccagaaaag gacaatcaag ggcaagagtt ctttgctgcc acttgtcaat 4920
atcacccatt catcatgagc cacgtcagtc ccctcccaca gaaatcattg caagggggat 4980
gcggagcaat ggctggagga acggagactc cagggaagag aggggagatg gaggccagtg 5040
ggggaaatag gccccttcac taatgaccac caagaaaaca aaatctcatg tttacatcct 5100
ccacctccat ttctatacgc atttctgctt cttgctcttc tgtccatcct ttctacaaag 5160
cccataccat acaccccttt cccttttcct cccagctcct tagccaagct actctagtat 5220
ttgtaataac tagcatttac tggatactca tagtatgctc attgctgtcc ggtaaccacg 5280
tgcggaccga ggctgcagcg tcgtcctccc taggaacccc tagtgatgga gttggccact 5340
ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 5400
ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcctg 5460
atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg tcaaagcaac 5520
catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 5580
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 5640
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 5700
gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat ggttcacgta 5760
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 5820
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc tattcttttg 5880
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 5940
aatttaacgc gaattttaac aaaatattaa cgtttacaat tttatggtgc actctcagta 6000
caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg 6060
cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg 6120
ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc 6180
tcgtgatacg cctattttta taggttaatg tcatgaacaa taaaactgtc tgcttacata 6240
aacagtaata caaggggtgt tatgagccat attcaacggg aaacgtcgag gccgcgatta 6300
aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa tgtcgggcaa 6360
tcaggtgcga caatctatcg cttgtatggg aagcccgatg cgccagagtt gtttctgaaa 6420
catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact aaactggctg 6480
acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga tgatgcatgg 6540
ttactcacca ctgcgatccc cggaaaaaca gcattccagg tattagaaga atatcctgat 6600
tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca ttcgattcct 6660
gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc gcaatcacga 6720
atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg ctggcctgtt 6780
gaacaagtct ggaaagaaat gcataaactt ttgccattct caccggattc agtcgtcact 6840
catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat aggttgtatt 6900
gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct atggaactgc 6960
ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg tattgataat 7020
cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta atctcatgac 7080
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 7140
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 7200
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 7260
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 7320
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 7380
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 7440
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 7500
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 7560
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 7620
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 7680
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 7740
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgt 7799
<210> 30
<211> 8729
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 30
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtgttcta gggtggaaac taagagaatg atgtacctag 180
agggcgctgg aagctctaaa gccctagcag ttactgcttt tactattagt ggtcgttttt 240
ttctcccccc cgccccccga caaatcaaca gaacaaagaa aattacctaa acagcaagga 300
catagggagg aacttcttgg cacagaactt tccaaacact ttttcctgaa gggatacaag 360
aagcaagaaa ggtactcttt cactaggacc ttctctgagc tgtcctcagg atgcttttgg 420
gactattttt cttacccaga gaatggagaa accctgcagg gaattcccaa gctgtagtta 480
taaacagaag ttctccttct gctaggtagc attcaaagat cttaatcttc tgggtttccg 540
ttttctcgaa tgaaaaatgc aggtccgagc agttaactgg ctggggcacc attagcaagt 600
cacttagcat ctctggggcc agtctgcaaa gcgagggggc agccttaatg tgcctccagc 660
ctgaagtcct agaatgagcg cccggtgtcc caagctgggg cgcgcacccc agatcggagg 720
gcgccgatgt acagacagca aactcaccca gtctagtgca tgccttctta aacatcacga 780
gactctaaga aaaggaaact gaaaacggga aagtccctct ctctaacctg gcactgcgtc 840
gctggcttgg agacaggtga cggtccctgc gggccttgtc ctgattggct gggcacgcgt 900
ttaatataag tggaggcgtc gcgctggcgg gcattcctga agctaagctt gtggacgata 960
tcgaattcgc acgacattga ttattgacta gttattaata gtaatcaatt acggggtcat 1020
tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg 1080
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 1140
cgccaatagg gactttccat tgacgtcaat gggtggacta tttacggtaa actgcccact 1200
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 1260
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 1320
acatctacgt attagtcatc gctattacca tgggtcgagg tgagccccac gttctgcttc 1380
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1440
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 1500
cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct 1560
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 1620
gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 1680
ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 1740
ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 1800
gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 1860
gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg 1920
tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg 1980
gccgggggcg gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg 2040
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc 2100
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg 2160
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 2220
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg ccccggagcg 2280
ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 2340
gggcgcaggg acttcctttg tcccaaatct ggcggagccg aaatctggga ggcgccgccg 2400
caccccctct agcgggcgcg ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg 2460
gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc atctccagcc tcggggctgc 2520
cgcaggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 2580
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagg 2640
ggggatccgt ttatctgcag aattcgccct tgacgtcgcc accatggaag atacaaagga 2700
gtctaacgtg aagacatttt gctccaagaa tatcctagcc atccttggct tctcctctat 2760
catagctgtg atagctttgc ttgctgtggg gttgacccag aacaaagcat tgccagaaaa 2820
cgttaagtat gggattgtgc tggatgcggg ttcttctcac acaagtttat acatctataa 2880
gtggccagca gaaaaggaga atgacacagg cgtggtgcat caagtagaag aatgcagggt 2940
taaaggtcct ggaatctcaa aatttgttca gaaagtaaat gaaataggca tttacctgac 3000
tgattgcatg gaaagagcta gggaagtgat tccaaggtcc cagcaccaag agacacccgt 3060
ttacctggga gccacggcag gcatgcggtt gctcaggatg gaaagtgaag agttggcaga 3120
cagggttctg gatgtggtgg agaggagcct cagcaactac ccctttgact tccagggtgc 3180
caggatcatt actggccaag aggaaggtgc ctatggctgg attactatca actatctgct 3240
gggcaaattc agtcagaaaa caaggtggtt cagcatagtc ccatatgaaa ccaataatca 3300
ggaaaccttt ggagctttgg accttggggg agcctctaca caagtcactt ttgtacccca 3360
aaaccagact atcgagtccc cagataatgc tctgcaattt cgcctctatg gcaaggacta 3420
caatgtctac acacatagct tcttgtgcta tgggaaggat caggcactct ggcagaaact 3480
ggccaaggac attcaggttg caagtaatga aattctcagg gacccatgct ttcatcctgg 3540
atataagaag gtagtgaacg taagtgacct ttacaagacc ccctgcacca agagatttga 3600
gatgactctt ccattccagc agtttgaaat ccagggtatt ggaaactatc aacaatgcca 3660
tcaaagcatc ctggagctct tcaacaccag ttactgccct tactcccagt gtgccttcaa 3720
tgggattttc ttgccaccac tccaggggga ttttggggca ttttcagctt tttactttgt 3780
gatgaagttt ttaaacttga catcagagaa agtctctcag gaaaaggtga ctgagatgat 3840
gaaaaagttc tgtgctcagc cttgggagga gataaaaaca tcttacgctg gagtaaagga 3900
gaagtacctg agtgaatact gcttttctgg tacctacatt ctctccctcc ttctgcaagg 3960
ctatcatttc acagctgatt cctgggagca catccatttc attggcaaga tccagggcag 4020
cgacgccggc tggactttgg gctacatgct gaacctgacc aacatgatcc cagctgagca 4080
accattgtcc acacctctct cccactccac ctatgtcttc ctcatggttc tattctccct 4140
ggtccttttc acagtggcca tcataggctt gcttatcttt cacaagcctt catatttctg 4200
gaaagatatg gtaggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt 4260
ggaggagaac cctggaccta tgaggatatt tgctgtcttt atattcatga cctactggca 4320
tttgctgaac gcatttactg tcacggttcc caaggaccta tatgtggtag agtatggtag 4380
caatatgaca attgaatgca aattcccagt agaaaaacaa ttagacctgg ctgcactaat 4440
tgtctattgg gaaatggagg ataagaacat tattcaattt gtgcatggag aggaagacct 4500
gaaggttcag catagtagct acagacagag ggcccggctg ttgaaggacc agctctccct 4560
gggaaatgct gcacttcaga tcacagatgt gaaattgcag gatgcagggg tgtaccgctg 4620
catgatcagc tatggtggtg ccgactacaa gcgaattact gtgaaagtca atgccccata 4680
caacaaaatc aaccaaagaa ttttggttgt ggatccagtc acctctgaac atgaactgac 4740
atgtcaggct gagggctacc ccaaggccga agtcatctgg acaagcagtg accatcaagt 4800
cctgagtggt aagaccacca ccaccaattc caagagagag gagaaacttt tcaatgtgac 4860
cagcacactg agaatcaaca caacaactaa tgagattttc tactgcactt ttaggagatt 4920
agatcctgag gaaaaccata cagctgaatt ggtcatccca gaactacctc tggcacatcc 4980
tccaaatgaa aggactcact tggtaattct gggagccatc ttattatgcc ttggtgtagc 5040
actgacattc atcttccgtt taagaaaagg gagaatgatg gatgtgaaaa aatgtggcat 5100
ccaagataca aactcaaaga agcaaagtga tacacatttg gaggagacgt aaccgctgat 5160
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 5220
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 5280
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 5340
gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atgggtcgac 5400
ccagcgtgag tctctcctac cctcccgctc tggtccttcc tctcccgctc tgcaccctct 5460
gtggccctcg ctgtgctctc tcgctccgtg acttcccttc tccaagttct ccttggtggc 5520
ccgccgtggg gctagtccag ggctggatct cggggaagcg gcggggtggc ctgggagtgg 5580
ggaagggggt gcgcacccgg gacgcgcgct acttgcccct ttcggcgggg agcaggggag 5640
acctttggcc tacggcgacg ggagggtcgg gacaaagttt agggcgtcga taagcgtcag 5700
agcgccgagg ttgggggagg gtttctcttc cgctctttcg cggggcctct ggctccccca 5760
gcgcagctgg agtgggggac gggtaggctc gtcccaaagg cgcggcgctg aggtttgtga 5820
acgcgtggag gggcgcttgg ggtctggggg aggcgtcgcc cgggtaagcc tgtctgctgc 5880
ggctctgctt cccttagact ggagagctgt ggacttcgtc taggcgcccg ctaagttcgc 5940
atgtcctagc acctctgggt ctatgtgggg ccacaccgtg gggaggaaac agcacgcgac 6000
gtttgtagaa tgcttggctg tgatacaaag cggtttcgaa taattaactt atttgttccc 6060
atcacatgtc acttttaaaa aattataaga actacccgtt attgacatct ttctgtgtgc 6120
caaggacttt atgtgctttg cgtcatttaa ttttgaaaac agttatcttc cgccatagat 6180
aactactatg gttatcttct ggtaaccacg tgcggaccga ggctgcagcg tcgtcctccc 6240
taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 6300
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 6360
cgagcgcgca gctgcctgca ggggcgcctg atgcggtatt ttctccttac gcatctgtgc 6420
ggtatttcac accgcatacg tcaaagcaac catagtacgc gccctgtagc ggcgcattaa 6480
gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 6540
ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 6600
ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 6660
aaaaacttga tttgggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 6720
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 6780
cactcaaccc tatctcgggc tattcttttg atttataagg gattttgccg atttcggcct 6840
attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 6900
cgtttacaat tttatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 6960
agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat 7020
ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt 7080
catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta taggttaatg 7140
tcatgaacaa taaaactgtc tgcttacata aacagtaata caaggggtgt tatgagccat 7200
attcaacggg aaacgtcgag gccgcgatta aattccaaca tggatgctga tttatatggg 7260
tataaatggg ctcgcgataa tgtcgggcaa tcaggtgcga caatctatcg cttgtatggg 7320
aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt 7380
acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag 7440
cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggaaaaaca 7500
gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca 7560
gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc 7620
gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat 7680
tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataaactt 7740
ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt 7800
tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga 7860
taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa 7920
cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg 7980
atgctcgatg agtttttcta atctcatgac caaaatccct taacgtgagt tttcgttcca 8040
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 8100
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 8160
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 8220
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 8280
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 8340
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 8400
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 8460
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 8520
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 8580
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 8640
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 8700
ggccttttgc tggccttttg ctcacatgt 8729
<210> 31
<211> 9569
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 31
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtgttcta gggtggaaac taagagaatg atgtacctag 180
agggcgctgg aagctctaaa gccctagcag ttactgcttt tactattagt ggtcgttttt 240
ttctcccccc cgccccccga caaatcaaca gaacaaagaa aattacctaa acagcaagga 300
catagggagg aacttcttgg cacagaactt tccaaacact ttttcctgaa gggatacaag 360
aagcaagaaa ggtactcttt cactaggacc ttctctgagc tgtcctcagg atgcttttgg 420
gactattttt cttacccaga gaatggagaa accctgcagg gaattcccaa gctgtagtta 480
taaacagaag ttctccttct gctaggtagc attcaaagat cttaatcttc tgggtttccg 540
ttttctcgaa tgaaaaatgc aggtccgagc agttaactgg ctggggcacc attagcaagt 600
cacttagcat ctctggggcc agtctgcaaa gcgagggggc agccttaatg tgcctccagc 660
ctgaagtcct agaatgagcg cccggtgtcc caagctgggg cgcgcacccc agatcggagg 720
gcgccgatgt acagacagca aactcaccca gtctagtgca tgccttctta aacatcacga 780
gactctaaga aaaggaaact gaaaacggga aagtccctct ctctaacctg gcactgcgtc 840
gctggcttgg agacaggtga cggtccctgc gggccttgtc ctgattggct gggcacgcgt 900
ttaatataag tggaggcgtc gcgctggcgg gcattcctga agctaagctt gtggacgata 960
tcgaattcgc acgacattga ttattgacta gttattaata gtaatcaatt acggggtcat 1020
tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg 1080
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 1140
cgccaatagg gactttccat tgacgtcaat gggtggacta tttacggtaa actgcccact 1200
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 1260
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 1320
acatctacgt attagtcatc gctattacca tgggtcgagg tgagccccac gttctgcttc 1380
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1440
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 1500
cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct 1560
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 1620
gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 1680
ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 1740
ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 1800
gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 1860
gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg 1920
tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg 1980
gccgggggcg gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg 2040
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc 2100
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg 2160
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 2220
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg ccccggagcg 2280
ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 2340
gggcgcaggg acttcctttg tcccaaatct ggcggagccg aaatctggga ggcgccgccg 2400
caccccctct agcgggcgcg ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg 2460
gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc atctccagcc tcggggctgc 2520
cgcaggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 2580
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagg 2640
ggggatccgt ttatctgcag aattcgccct tgacgtcgcc accatggctg aacaagtcct 2700
tcctcaggct ttgtatttga gcaatatgcg gaaagctgtg aagatacggg agagaactcc 2760
agaagacatt tttaaaccta ctaatgggat cattcatcat tttaaaacca tgcaccgata 2820
cacactggaa atgttcagaa cttgccagtt ttgtcctcag tttcgggaga tcatccacaa 2880
agccctcatc gacagaaaca tccaggccac cctggaaagc cagaagaaac tcaactggtg 2940
tcgagaagtc cggaagcttg tggcgctgaa aacgaacggt gacggcaatt gcctcatgca 3000
tgccacttct cagtacatgt ggggcgttca ggacacagac ttggtactga ggaaggcgct 3060
gttcagcacg ctcaaggaaa cagacacacg caactttaaa ttccgctggc aactggagtc 3120
tctcaaatct caggaatttg ttgaaacggg gctttgctat gatactcgga actggaatga 3180
tgaatgggac aatcttatca aaatggcttc cacagacaca cccatggccc gaagtggact 3240
tcagtacaac tcactggaag aaatacacat atttgtcctt tgcaacatcc tcagaaggcc 3300
aatcattgtc atttcagaca aaatgctaag aagtttggaa tcaggttcca atttcgcccc 3360
tttgaaagtg ggtggaattt acttgcctct ccactggcct gcccaggaat gctacagata 3420
ccccattgtt ctcggctatg acagccatca ttttgtaccc ttggtgaccc tgaaggacag 3480
tgggcctgaa atccgagctg ttccacttgt taacagagac cggggaagat ttgaagactt 3540
aaaagttcac tttttgacag atcctgaaaa tgagatgaag gagaagctct taaaagagta 3600
cttaatggtg atagaaatcc ccgtccaagg ctgggaccat ggcacaactc atctcatcaa 3660
tgccgcaaag ttggatgaag ctaacttacc aaaagaaatc aatctggtag atgattactt 3720
tgaacttgtt cagcatgagt acaagaaatg gcaggaaaac agcgagcagg ggaggagaga 3780
ggggcacgcc cagaatccca tggaaccttc cgtgccccag ctttctctca tggatgtaaa 3840
atgtgaaacg cccaactgcc ccttcttcat gtctgtgaac acccagcctt tatgccatga 3900
gtgctcagag aggcggcaaa agaatcaaaa caaactccca aagctgaact ccaagccggg 3960
ccctgagggg ctccctggca tggcgctcgg ggcctctcgg ggagaagcct atgagccctt 4020
ggcgtggaac cctgaggagt ccactggggg gcctcattcg gccccaccga cagcacccag 4080
cccttttctg ttcagtgaga ccactgccat gaagtgcagg agccccggct gccccttcac 4140
actgaatgtg cagcacaacg gattttgtga acgttgccac aacgcccggc aacttcacgc 4200
cagccacgcc ccagaccaca caaggcactt ggatcccggg aagtgccaag cctgcctcca 4260
ggatgttacc aggacattta atgggatctg cagtacttgc ttcaaaagga ctacagcaga 4320
ggcctcctcc agcctcagca ccagcctccc tccttcctgt caccagcgtt ccaagtcaga 4380
tccctcgcgg ctcgtccgga gcccctcccc gcattcttgc cacagagctg gaaacgacgc 4440
ccctgctggc tgcctgtctc aagctgcacg gactcctggg gacaggacgg ggacgagcaa 4500
gtgcagaaaa gccggctgcg tgtattttgg gactccagaa aacaagggct tttgcacact 4560
gtgtttcatc gagtacagag aaaacaaaca ttttgctgct gcctcaggga aagtcagtcc 4620
cacagcgtcc aggttccaga acaccattcc gtgcctgggg agggaatgcg gcacccttgg 4680
aagcaccatg tttgaaggat actgccagaa gtgtttcatt gaagctcaga atcagagatt 4740
tcatgaggcc aaaaggacag aagagcaact gagatcgagc cagcgcagag atgtgcctcg 4800
aaccacacaa agcacctcaa ggcccaagtg cgcccgggcc tcctgcaaga acatcctggc 4860
ctgccgcagc gaggagctct gcatggagtg tcagcatccc aaccagagga tgggccctgg 4920
ggcccaccgg ggtgagcctg cccccgaaga cccccccaag cagcgttgcc gggcccccgc 4980
ctgtgatcat tttggcaatg ccaagtgcaa cggctactgc aacgaatgct ttcagttcaa 5040
gcagatgtat ggcggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt 5100
ggaggagaac cctggaccta tgaggatatt tgctgtcttt atattcatga cctactggca 5160
tttgctgaac gcatttactg tcacggttcc caaggaccta tatgtggtag agtatggtag 5220
caatatgaca attgaatgca aattcccagt agaaaaacaa ttagacctgg ctgcactaat 5280
tgtctattgg gaaatggagg ataagaacat tattcaattt gtgcatggag aggaagacct 5340
gaaggttcag catagtagct acagacagag ggcccggctg ttgaaggacc agctctccct 5400
gggaaatgct gcacttcaga tcacagatgt gaaattgcag gatgcagggg tgtaccgctg 5460
catgatcagc tatggtggtg ccgactacaa gcgaattact gtgaaagtca atgccccata 5520
caacaaaatc aaccaaagaa ttttggttgt ggatccagtc acctctgaac atgaacttac 5580
atgtcaggct gagggctacc ccaaggccga agtcatctgg acaagcagtg accatcaagt 5640
cctgagtggt aagaccacca ccaccaattc caagagagag gagaaacttt tcaatgtgac 5700
cagcacactg agaatcaaca caacaactaa tgagattttc tactgcactt ttaggagatt 5760
agatcctgag gaaaaccata cagctgaatt ggtcatccca gaactacctc tggcacatcc 5820
tccaaatgaa aggactcact tggtaattct gggagccatc ttattatgcc ttggtgtagc 5880
actgacattc atcttccgtt taagaaaagg gagaatgatg gatgtgaaaa aatgtggcat 5940
ccaagataca aactcaaaga agcaaagtga tacacatttg gaggagacgt aaccgctgat 6000
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 6060
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 6120
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 6180
gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atgggtcgac 6240
ccagcgtgag tctctcctac cctcccgctc tggtccttcc tctcccgctc tgcaccctct 6300
gtggccctcg ctgtgctctc tcgctccgtg acttcccttc tccaagttct ccttggtggc 6360
ccgccgtggg gctagtccag ggctggatct cggggaagcg gcggggtggc ctgggagtgg 6420
ggaagggggt gcgcacccgg gacgcgcgct acttgcccct ttcggcgggg agcaggggag 6480
acctttggcc tacggcgacg ggagggtcgg gacaaagttt agggcgtcga taagcgtcag 6540
agcgccgagg ttgggggagg gtttctcttc cgctctttcg cggggcctct ggctccccca 6600
gcgcagctgg agtgggggac gggtaggctc gtcccaaagg cgcggcgctg aggtttgtga 6660
acgcgtggag gggcgcttgg ggtctggggg aggcgtcgcc cgggtaagcc tgtctgctgc 6720
ggctctgctt cccttagact ggagagctgt ggacttcgtc taggcgcccg ctaagttcgc 6780
atgtcctagc acctctgggt ctatgtgggg ccacaccgtg gggaggaaac agcacgcgac 6840
gtttgtagaa tgcttggctg tgatacaaag cggtttcgaa taattaactt atttgttccc 6900
atcacatgtc acttttaaaa aattataaga actacccgtt attgacatct ttctgtgtgc 6960
caaggacttt atgtgctttg cgtcatttaa ttttgaaaac agttatcttc cgccatagat 7020
aactactatg gttatcttct ggtaaccacg tgcggaccga ggctgcagcg tcgtcctccc 7080
taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 7140
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 7200
cgagcgcgca gctgcctgca ggggcgcctg atgcggtatt ttctccttac gcatctgtgc 7260
ggtatttcac accgcatacg tcaaagcaac catagtacgc gccctgtagc ggcgcattaa 7320
gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 7380
ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 7440
ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 7500
aaaaacttga tttgggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 7560
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 7620
cactcaaccc tatctcgggc tattcttttg atttataagg gattttgccg atttcggcct 7680
attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 7740
cgtttacaat tttatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 7800
agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat 7860
ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt 7920
catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta taggttaatg 7980
tcatgaacaa taaaactgtc tgcttacata aacagtaata caaggggtgt tatgagccat 8040
attcaacggg aaacgtcgag gccgcgatta aattccaaca tggatgctga tttatatggg 8100
tataaatggg ctcgcgataa tgtcgggcaa tcaggtgcga caatctatcg cttgtatggg 8160
aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt 8220
acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag 8280
cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggaaaaaca 8340
gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca 8400
gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc 8460
gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat 8520
tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataaactt 8580
ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt 8640
tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga 8700
taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa 8760
cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg 8820
atgctcgatg agtttttcta atctcatgac caaaatccct taacgtgagt tttcgttcca 8880
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 8940
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 9000
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 9060
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 9120
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 9180
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 9240
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 9300
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 9360
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 9420
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 9480
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 9540
ggccttttgc tggccttttg ctcacatgt 9569
<210> 32
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 32
gaagcgtgtc ttcatagcgc 20
<210> 33
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 33
ttactcgtgt caaagccgtt 20
<210> 34
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 34
tgtcaaagcc gttaggatcc 20
<210> 35
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 35
gccgttagga tcctggcttg 20
<210> 36
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 36
gcggagtggc taaagtgctt 20
<210> 37
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 37
tccgcaagcc aggatcctaa 20
<210> 38
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 38
gttcggcttt gagcttcctc 20
<210> 39
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 39
gagatggtga tcatgagacc 20
<210> 40
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 40
ttgtactcat atttgtttcc 20
<210> 41
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 41
aacaaatatg agtacaagtt 20
<210> 42
<211> 800
<212> DNA
<213> 智人(Homo sapiens)
<400> 42
accgctctca gaccagaaac gtccacaccc gccctccgat ggcctgtcgc cctggctagg 60
ttttagggtc agtgggatcc tccttccact ggacccggga gaagacgctc aacagccccc 120
tccttcccct ccttcctctc cttcctctcc ttcccccctc cctgcgccgc tccagagcgc 180
aacaaccatt ttcccagcca ggagcacacc gtgtccacgc gccacagcga tctcactgat 240
tggtcgggct cctggtaaac aaggaccggg cagccaatgg gagggatgtg cacgagggca 300
gcacgagcct ccgggccagc gctcgcgtgg ctcttctggc ccgggctact atatagagac 360
gtttccgcct cctgcttgaa actaacccct ctttttctcc aaaggagtgc ttgtggagat 420
cggatctttt ctccagcaat tgggggaaag aaggcttttt ctctgaatta gcttagtgta 480
accagcggcg tatatttttt aggcgccttt tcgaaaacct agtagttaat attcatttgt 540
ttaaatctta ttttattttt aagctcaaac tgcttaagaa taccttaatt ccttaaagtg 600
aaataatttt ttgcaaaggg gtttcctcga tttggagctt tttttttctt ccaccgtcat 660
ttctaactct taaaaccaac tcagttccat catggtgatg ttcaagaaga tcaagtcttt 720
tgaggtggtc tttaacgacc ctgaaaaggt gtacggcagt ggcgagaagg tggctggccg 780
ggtgatagtg gaggtgtgtg 800
<210> 43
<211> 1500
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 43
atgtctcgct ccgttgcctt agctgtgctc gcgctactct ctctttctgg attagaggct 60
gtcatggcgc cccgaaccct cttcctgggt ggaggcggtt caggcggagg tggctctggc 120
ggtggcggat cgatccagcg tactccaaag attcaggttt actcacgtca tccagcagag 180
aatggaaagt caaatttcct gaattgctat gtgtctgggt ttcatccatc cgacattgaa 240
gttgacttac tgaagaatgg agagagaatt gaaaaagtgg agcattcaga cttgtctttc 300
agcaaggact ggtctttcta tctcttgtac tacactgaat tcacccccac tgaaaaagat 360
gagtatgcct gccgtgtgaa ccatgtgact ttgtcacagc ccaagatagt taagtgggat 420
cgagacatgg gtggtggtgg ttctggtggt ggtggttctg gcggcggcgg ctccggtggt 480
ggtggatccg gctcccactc cttgaagtat ttccacactt ccgtgtcccg gcccggccgc 540
ggggagcccc gcttcatctc tgtgggctac gtggacgaca cccagttcgt gcgcttcgac 600
aacgacgccg cgagtccgag gatggtgccg cgggcgccgt ggatggagca ggaggggtca 660
gagtattggg accgggagac acggagcgcc agggacaccg cacagatttt ccgagtgaat 720
ctgcggacgc tgcgcggcta ctacaatcag agcgaggccg ggtctcacac cctgcagtgg 780
atgcatggct gcgagctggg gcccgacggg cgcttcctcc gcgggtatga acagttcgcc 840
tacgacggca aggattatct caccctgaat gaggacctgc gctcctggac cgcggtggac 900
acggcggctc agatctccga gcaaaagtca aatgatgcct ctgaggcgga gcaccagaga 960
gcctacctgg aagacacatg cgtggagtgg ctccacaaat acctggagaa ggggaaggag 1020
acgctgcttc acctggagcc cccaaagaca cacgtgactc accaccccat ctctgaccat 1080
gaggccaccc tgaggtgctg ggccctgggc ttctaccctg cggagatcac actgacctgg 1140
cagcaggatg gggagggcca tacccaggac acggagctcg tggagaccag gcctgcaggg 1200
gatggaacct tccagaagtg ggcagctgtg gtggtgcctt ctggagagga gcagagatac 1260
acgtgccatg tgcagcatga ggggctaccc gagcccgtca ccctgagatg gaagccggct 1320
tcccagccca ccatccccat cgtgggcatc attgctggcc tggttctcct tggatctgtg 1380
gtctctggag ctgtggttgc tgctgtgata tggaggaaga agagctcagg tggaaaagga 1440
gggagctact ctaaggctga gtggagcgac agtgcccagg ggtctgagtc tcacagcttg 1500
<210> 44
<211> 800
<212> DNA
<213> 智人(Homo sapiens)
<400> 44
cagggatccc agcagtgcaa acagacttcg gagtacctgc gctatgaaga cacgcttctt 60
ctggaagacc agccaacagg taagcggccc aattcattgt tggagggtga aagctgatta 120
gagaagagaa ttgaatacac aaaacctgta cgaaatgttt taagttgctc agtttgagtg 180
gtttgaatta cgtgttgttg cttccttttt tctgttttaa tttgcagaca ttctcctccc 240
cccccaaaaa aaagggtgat ttgtacaatt ttttatggtg ctgtgtccta aaggggatcc 300
tgaggggcgt tgcctcgggt agttaaagtc ttatgtgtgc ataagttgct tattctttgt 360
ctacttccta tttgagatgt tagtagagaa ctgtcctggg tgaatctttc agtattgcag 420
ggcttggcaa cttgctgccc gacaaaatac atcagaattt ctctttaaga acaatatggg 480
atggattaaa aaatatatat atgggatgaa attgggggta cttcaatacc ttgcatgcca 540
cccaagcatt ccttatcaca cagatgcatt ttaagtgtaa cagcaagcct aatggctact 600
cgattttctt tcccttcagg tgagaatgag atggtgatca tgagacctgg aaacaaatat 660
gagtacaagt tcggctttga gcttcctcag gggtaaatat cagctaaatg catctttgaa 720
cttttctgtc taaaatatct tgccctcctt tgatcactta ctgttcttgg agagcgtttt 780
aaaattttca ttttcttgac 800
<210> 45
<211> 8381
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 45
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtaccgct ctcagaccag aaacgtccac acccgccctc 180
cgatggcctg tcgccctggc taggttttag ggtcagtggg atcctccttc cactggaccc 240
gggagaagac gctcaacagc cccctccttc ccctccttcc tctccttcct ctccttcccc 300
cctccctgcg ccgctccaga gcgcaacaac cattttccca gccaggagca caccgtgtcc 360
acgcgccaca gcgatctcac tgattggtcg ggctcctggt aaacaaggac cgggcagcca 420
atgggaggga tgtgcacgag ggcagcacga gcctccgggc cagcgctcgc gtggctcttc 480
tggcccgggc tactatatag agacgtttcc gcctcctgct tgaaactaac ccctcttttt 540
ctccaaagga gtgcttgtgg agatcggatc ttttctccag caattggggg aaagaaggct 600
ttttctctga attagcttag tgtaaccagc ggcgtatatt ttttaggcgc cttttcgaaa 660
acctagtagt taatattcat ttgtttaaat cttattttat ttttaagctc aaactgctta 720
agaatacctt aattccttaa agtgaaataa ttttttgcaa aggggtttcc tcgatttgga 780
gctttttttt tcttccaccg tcatttctaa ctcttaaaac caactcagtt ccatcatggt 840
gatgttcaag aagatcaagt cttttgaggt ggtctttaac gaccctgaaa aggtgtacgg 900
cagtggcgag aaggtggctg gccgggtgat agtggaggtg tgtgaagctt gtggacgata 960
tcgaattcgc acgacattga ttattgacta gttattaata gtaatcaatt acggggtcat 1020
tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg 1080
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 1140
cgccaatagg gactttccat tgacgtcaat gggtggacta tttacggtaa actgcccact 1200
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 1260
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 1320
acatctacgt attagtcatc gctattacca tgggtcgagg tgagccccac gttctgcttc 1380
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1440
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 1500
cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct 1560
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 1620
gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 1680
ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 1740
ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 1800
gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 1860
gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg 1920
tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg 1980
gccgggggcg gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg 2040
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc 2100
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg 2160
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 2220
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg ccccggagcg 2280
ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 2340
gggcgcaggg acttcctttg tcccaaatct ggcggagccg aaatctggga ggcgccgccg 2400
caccccctct agcgggcgcg ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg 2460
gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc atctccagcc tcggggctgc 2520
cgcaggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 2580
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagg 2640
ggggatccgt ttatctgcag aattcgccct tgacgtcgcc accatgagga ggatgtgggc 2700
cacgcagggg ctggcggtgg cgctggctct gagcgtgctg ccgggcagcc gggcgctgcg 2760
gccgggcgac tgcgaagttt gtatttctta tctgggaaga ttttaccagg acctcaaaga 2820
cagagatgtc acattctcac cagccactat tgaaaacgaa cttataaagt tctgccggga 2880
agcaagaggc aaagagaatc ggttgtgcta ctatatcggg gccacagatg atgcagccac 2940
caaaatcatc aatgaggtat caaagcctct ggcccaccac atccctgtgg agaagatctg 3000
tgagaagctt aagaagaagg acagccagat atgtgagctt aagtatgaca agcagatcga 3060
cctgagcaca gtggacctga agaagctccg agttaaagag ctgaagaaga ttctggatga 3120
ctggggggag acatgcaaag gctgtgcaga aaagtctgac tacatccgga agataaatga 3180
actgatgcct aaatatgccc ccaaggcagc cagtgcacgg accgatttgg gaagcggagc 3240
tactaacttc agcctgctga agcaggctgg agacgtggag gagaaccctg gacctatgtc 3300
tcgctccgtt gccttagctg tgctcgcgct actctctctt tctggattag aggctgtcat 3360
ggcgccccga accctcttcc tgggtggagg cggttcaggc ggaggtggct ctggcggtgg 3420
cggatcgatc cagcgtactc caaagattca ggtttactca cgtcatccag cagagaatgg 3480
aaagtcaaat ttcctgaatt gctatgtgtc tgggtttcat ccatccgaca ttgaagttga 3540
cttactgaag aatggagaga gaattgaaaa agtggagcat tcagacttgt ctttcagcaa 3600
ggactggtct ttctatctct tgtactacac tgaattcacc cccactgaaa aagatgagta 3660
tgcctgccgt gtgaaccatg tgactttgtc acagcccaag atagttaagt gggatcgaga 3720
catgggtggt ggtggttctg gtggtggtgg ttctggcggc ggcggctccg gtggtggtgg 3780
atccggctcc cactccttga agtatttcca cacttccgtg tcccggcccg gccgcgggga 3840
gccccgcttc atctctgtgg gctacgtgga cgacacccag ttcgtgcgct tcgacaacga 3900
cgccgcgagt ccgaggatgg tgccgcgggc gccgtggatg gagcaggagg ggtcagagta 3960
ttgggaccgg gagacacgga gcgccaggga caccgcacag attttccgag tgaatctgcg 4020
gacgctgcgc ggctactaca atcagagcga ggccgggtct cacaccctgc agtggatgca 4080
tggctgcgag ctggggcccg acgggcgctt cctccgcggg tatgaacagt tcgcctacga 4140
cggcaaggat tatctcaccc tgaatgagga cctgcgctcc tggaccgcgg tggacacggc 4200
ggctcagatc tccgagcaaa agtcaaatga tgcctctgag gcggagcacc agagagccta 4260
cctggaagac acatgcgtgg agtggctcca caaatacctg gagaagggga aggagacgct 4320
gcttcacctg gagcccccaa agacacacgt gactcaccac cccatctctg accatgaggc 4380
caccctgagg tgctgggccc tgggcttcta ccctgcggag atcacactga cctggcagca 4440
ggatggggag ggccataccc aggacacgga gctcgtggag accaggcctg caggggatgg 4500
aaccttccag aagtgggcag ctgtggtggt gccttctgga gaggagcaga gatacacgtg 4560
ccatgtgcag catgaggggc tacccgagcc cgtcaccctg agatggaagc cggcttccca 4620
gcccaccatc cccatcgtgg gcatcattgc tggcctggtt ctccttggat ctgtggtctc 4680
tggagctgtg gttgctgctg tgatatggag gaagaagagc tcaggtggaa aaggagggag 4740
ctactctaag gctgagtgga gcgacagtgc ccaggggtct gagtctcaca gcttgtaatg 4800
atagccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 4860
cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 4920
aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 4980
aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct 5040
ctatgggtcg accagggatc ccagcagtgc aaacagactt cggagtacct gcgctatgaa 5100
gacacgcttc ttctggaaga ccagccaaca ggtaagcggc ccaattcatt gttggagggt 5160
gaaagctgat tagagaagag aattgaatac acaaaacctg tacgaaatgt tttaagttgc 5220
tcagtttgag tggtttgaat tacgtgttgt tgcttccttt tttctgtttt aatttgcaga 5280
cattctcctc cccccccaaa aaaaagggtg atttgtacaa ttttttatgg tgctgtgtcc 5340
taaaggggat cctgaggggc gttgcctcgg gtagttaaag tcttatgtgt gcataagttg 5400
cttattcttt gtctacttcc tatttgagat gttagtagag aactgtcctg ggtgaatctt 5460
tcagtattgc agggcttggc aacttgctgc ccgacaaaat acatcagaat ttctctttaa 5520
gaacaatatg ggatggatta aaaaatatat atatgggatg aaattggggg tacttcaata 5580
ccttgcatgc cacccaagca ttccttatca cacagatgca ttttaagtgt aacagcaagc 5640
ctaatggcta ctcgattttc tttcccttca ggtgagaatg agatggtgat catgagacct 5700
ggaaacaaat atgagtacaa gttcggcttt gagcttcctc aggggtaaat atcagctaaa 5760
tgcatctttg aacttttctg tctaaaatat cttgccctcc tttgatcact tactgttctt 5820
ggagagcgtt ttaaaatttt cattttcttg acggtaacca cgtgcggacc gaggctgcag 5880
cgtcgtcctc cctaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 5940
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 6000
tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc tgatgcggta ttttctcctt 6060
acgcatctgt gcggtatttc acaccgcata cgtcaaagca accatagtac gcgccctgta 6120
gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 6180
gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 6240
ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 6300
acctcgaccc caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat 6360
agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 6420
aaactggaac aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc 6480
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 6540
acaaaatatt aacgtttaca attttatggt gcactctcag tacaatctgc tctgatgccg 6600
catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 6660
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 6720
ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt 6780
tataggttaa tgtcatgaac aataaaactg tctgcttaca taaacagtaa tacaaggggt 6840
gttatgagcc atattcaacg ggaaacgtcg aggccgcgat taaattccaa catggatgct 6900
gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat 6960
cgcttgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt 7020
gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt 7080
ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc 7140
cccggaaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt 7200
gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt 7260
aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt 7320
gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa 7380
atgcataaac ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt 7440
gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga 7500
atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct 7560
tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg 7620
cagtttcatt tgatgctcga tgagtttttc taatctcatg accaaaatcc cttaacgtga 7680
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 7740
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 7800
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 7860
gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 7920
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 7980
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 8040
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 8100
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 8160
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 8220
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 8280
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 8340
tttacggttc ctggcctttt gctggccttt tgctcacatg t 8381
<210> 46
<211> 1722
<212> DNA
<213> 智人(Homo sapiens)
<400> 46
atgtgtcccc gagccgcgcg ggcgcccgcg acgctactcc tcgccctggg cgcggtgctg 60
tggcctgcgg ctggcgcctg ggagcttacg attttgcaca ccaacgacgt gcacagccgg 120
ctggagcaga ccagcgagga ctccagcaag tgcgtcaacg ccagccgctg catgggtggc 180
gtggctcggc tcttcaccaa ggttcagcag atccgccgcg ccgaacccaa cgtgctgctg 240
ctggacgccg gcgaccagta ccagggcact atctggttca ccgtgtacaa gggcgccgag 300
gtggcgcact tcatgaacgc cctgcgctac gatgccatgg cactgggaaa tcatgaattt 360
gataatggtg tggaaggact gatcgagcca ctcctcaaag aggccaaatt tccaattctg 420
agtgcaaaca ttaaagcaaa ggggccacta gcatctcaaa tatcaggact ttatttgcca 480
tataaagttc ttcctgttgg tgatgaagtt gtgggaatcg ttggatacac ttccaaagaa 540
accccttttc tctcaaatcc agggacaaat ttagtgtttg aagatgaaat cactgcatta 600
caacctgaag tagataagtt aaaaactcta aatgtgaaca aaattattgc actgggacat 660
tcgggttttg aaatggataa actcatcgct cagaaagtga ggggtgtgga cgtcgtggtg 720
ggaggacact ccaacacatt tctttacaca ggcaatccac cttccaaaga ggtgcctgct 780
gggaagtacc cattcatagt cacttctgat gatgggcgga aggttcctgt agtccaggcc 840
tatgcttttg gcaaatacct aggctatctg aagatcgagt ttgatgaaag aggaaacgtc 900
atctcttccc atggaaatcc cattcttcta aacagcagca ttcctgaaga tccaagcata 960
aaagcagaca ttaacaaatg gaggataaaa ttggataatt attctaccca ggaattaggg 1020
aaaacaattg tctatctgga tggctcctct caatcatgcc gctttagaga atgcaacatg 1080
ggcaacctga tttgtgatgc aatgattaac aacaacctga gacacacgga tgaaatgttc 1140
tggaaccacg tatccatgtg cattttaaat ggaggtggta tccggtcgcc cattgatgaa 1200
cgcaacaatg gcacaattac ctgggagaac ctggctgctg tattgccctt tggaggcaca 1260
tttgacctag tccagttaaa aggttccacc ctgaagaagg cctttgagca tagcgtgcac 1320
cgctacggcc agtccactgg agagttcctg caggtgggcg gaatccatgt ggtgtatgat 1380
ctttcccgaa aacctggaga cagagtagtc aaattagatg ttctttgcac caagtgtcga 1440
gtgcccagtt atgaccctct caaaatggac gaggtatata aggtgatcct cccaaacttc 1500
ctggccaatg gtggagatgg gttccagatg ataaaagatg aattattaag acatgactct 1560
ggtgaccaag atatcaacgt ggtttctaca tatatctcca aaatgaaagt aatttatcca 1620
gcagttgaag gtcggatcaa gttttccaca ggaagtcact gccatggaag cttttcttta 1680
atatttcttt cactttgggc agtgatcttt gttttatacc aa 1722
<210> 47
<211> 10517
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 47
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtgttcta gggtggaaac taagagaatg atgtacctag 180
agggcgctgg aagctctaaa gccctagcag ttactgcttt tactattagt ggtcgttttt 240
ttctcccccc cgccccccga caaatcaaca gaacaaagaa aattacctaa acagcaagga 300
catagggagg aacttcttgg cacagaactt tccaaacact ttttcctgaa gggatacaag 360
aagcaagaaa ggtactcttt cactaggacc ttctctgagc tgtcctcagg atgcttttgg 420
gactattttt cttacccaga gaatggagaa accctgcagg gaattcccaa gctgtagtta 480
taaacagaag ttctccttct gctaggtagc attcaaagat cttaatcttc tgggtttccg 540
ttttctcgaa tgaaaaatgc aggtccgagc agttaactgg ctggggcacc attagcaagt 600
cacttagcat ctctggggcc agtctgcaaa gcgagggggc agccttaatg tgcctccagc 660
ctgaagtcct agaatgagcg cccggtgtcc caagctgggg cgcgcacccc agatcggagg 720
gcgccgatgt acagacagca aactcaccca gtctagtgca tgccttctta aacatcacga 780
gactctaaga aaaggaaact gaaaacggga aagtccctct ctctaacctg gcactgcgtc 840
gctggcttgg agacaggtga cggtccctgc gggccttgtc ctgattggct gggcacgcgt 900
ttaatataag tggaggcgtc gcgctggcgg gcattcctga agctaagctt gtggacgata 960
tcgaattcgc acgacattga ttattgacta gttattaata gtaatcaatt acggggtcat 1020
tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg 1080
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 1140
cgccaatagg gactttccat tgacgtcaat gggtggacta tttacggtaa actgcccact 1200
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 1260
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 1320
acatctacgt attagtcatc gctattacca tgggtcgagg tgagccccac gttctgcttc 1380
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1440
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 1500
cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct 1560
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 1620
gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 1680
ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 1740
ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 1800
gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 1860
gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg 1920
tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg 1980
gccgggggcg gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg 2040
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc 2100
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg 2160
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 2220
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg ccccggagcg 2280
ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 2340
gggcgcaggg acttcctttg tcccaaatct ggcggagccg aaatctggga ggcgccgccg 2400
caccccctct agcgggcgcg ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg 2460
gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc atctccagcc tcggggctgc 2520
cgcaggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 2580
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagg 2640
ggggatccgt ttatctgcag aattcgccct tgacgtcgcc accatggaag atacaaagga 2700
gtctaacgtg aagacatttt gctccaagaa tatcctagcc atccttggct tctcctctat 2760
catagctgtg atagctttgc ttgctgtggg gttgacccag aacaaagcat tgccagaaaa 2820
cgttaagtat gggattgtgc tggatgcggg ttcttctcac acaagtttat acatctataa 2880
gtggccagca gaaaaggaga atgacacagg cgtggtgcat caagtagaag aatgcagggt 2940
taaaggtcct ggaatctcaa aatttgttca gaaagtaaat gaaataggca tttacctgac 3000
tgattgcatg gaaagagcta gggaagtgat tccaaggtcc cagcaccaag agacacccgt 3060
ttacctggga gccacggcag gcatgcggtt gctcaggatg gaaagtgaag agttggcaga 3120
cagggttctg gatgtggtgg agaggagcct cagcaactac ccctttgact tccagggtgc 3180
caggatcatt actggccaag aggaaggtgc ctatggctgg attactatca actatctgct 3240
gggcaaattc agtcagaaaa caaggtggtt cagcatagtc ccatatgaaa ccaataatca 3300
ggaaaccttt ggagctttgg accttggggg agcctctaca caagtcactt ttgtacccca 3360
aaaccagact atcgagtccc cagataatgc tctgcaattt cgcctctatg gcaaggacta 3420
caatgtctac acacatagct tcttgtgcta tgggaaggat caggcactct ggcagaaact 3480
ggccaaggac attcaggttg caagtaatga aattctcagg gacccatgct ttcatcctgg 3540
atataagaag gtagtgaacg taagtgacct ttacaagacc ccctgcacca agagatttga 3600
gatgactctt ccattccagc agtttgaaat ccagggtatt ggaaactatc aacaatgcca 3660
tcaaagcatc ctggagctct tcaacaccag ttactgccct tactcccagt gtgccttcaa 3720
tgggattttc ttgccaccac tccaggggga ttttggggca ttttcagctt tttactttgt 3780
gatgaagttt ttaaacttga catcagagaa agtctctcag gaaaaggtga ctgagatgat 3840
gaaaaagttc tgtgctcagc cttgggagga gataaaaaca tcttacgctg gagtaaagga 3900
gaagtacctg agtgaatact gcttttctgg tacctacatt ctctccctcc ttctgcaagg 3960
ctatcatttc acagctgatt cctgggagca catccatttc attggcaaga tccagggcag 4020
cgacgccggc tggactttgg gctacatgct gaacctgacc aacatgatcc cagctgagca 4080
accattgtcc acacctctct cccactccac ctatgtcttc ctcatggttc tattctccct 4140
ggtccttttc acagtggcca tcataggctt gcttatcttt cacaagcctt catatttctg 4200
gaaagatatg gtaggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt 4260
ggaggagaac cctggaccta tgtgtccccg agccgcgcgg gcgcccgcga cgctactcct 4320
cgccctgggc gcggtgctgt ggcctgcggc tggcgcctgg gagcttacga ttttgcacac 4380
caacgacgtg cacagccggc tggagcagac cagcgaggac tccagcaagt gcgtcaacgc 4440
cagccgctgc atgggtggcg tggctcggct cttcaccaag gttcagcaga tccgccgcgc 4500
cgaacccaac gtgctgctgc tggacgccgg cgaccagtac cagggcacta tctggttcac 4560
cgtgtacaag ggcgccgagg tggcgcactt catgaacgcc ctgcgctacg atgccatggc 4620
actgggaaat catgaatttg ataatggtgt ggaaggactg atcgagccac tcctcaaaga 4680
ggccaaattt ccaattctga gtgcaaacat taaagcaaag gggccactag catctcaaat 4740
atcaggactt tatttgccat ataaagttct tcctgttggt gatgaagttg tgggaatcgt 4800
tggatacact tccaaagaaa ccccttttct ctcaaatcca gggacaaatt tagtgtttga 4860
agatgaaatc actgcattac aacctgaagt agataagtta aaaactctaa atgtgaacaa 4920
aattattgca ctgggacatt cgggttttga aatggataaa ctcatcgctc agaaagtgag 4980
gggtgtggac gtcgtggtgg gaggacactc caacacattt ctttacacag gcaatccacc 5040
ttccaaagag gtgcctgctg ggaagtaccc attcatagtc acttctgatg atgggcggaa 5100
ggttcctgta gtccaggcct atgcttttgg caaataccta ggctatctga agatcgagtt 5160
tgatgaaaga ggaaacgtca tctcttccca tggaaatccc attcttctaa acagcagcat 5220
tcctgaagat ccaagcataa aagcagacat taacaaatgg aggataaaat tggataatta 5280
ttctacccag gaattaggga aaacaattgt ctatctggat ggctcctctc aatcatgccg 5340
ctttagagaa tgcaacatgg gcaacctgat ttgtgatgca atgattaaca acaacctgag 5400
acacacggat gaaatgttct ggaaccacgt atccatgtgc attttaaatg gaggtggtat 5460
ccggtcgccc attgatgaac gcaacaatgg cacaattacc tgggagaacc tggctgctgt 5520
attgcccttt ggaggcacat ttgacctagt ccagttaaaa ggttccaccc tgaagaaggc 5580
ctttgagcat agcgtgcacc gctacggcca gtccactgga gagttcctgc aggtgggcgg 5640
aatccatgtg gtgtatgatc tttcccgaaa acctggagac agagtagtca aattagatgt 5700
tctttgcacc aagtgtcgag tgcccagtta tgaccctctc aaaatggacg aggtatataa 5760
ggtgatcctc ccaaacttcc tggccaatgg tggagatggg ttccagatga taaaagatga 5820
attattaaga catgactctg gtgaccaaga tatcaacgtg gtttctacat atatctccaa 5880
aatgaaagta atttatccag cagttgaagg tcggatcaag ttttccacag gaagtcactg 5940
ccatggaagc ttttctttaa tatttctttc actttgggca gtgatctttg ttttatacca 6000
aggaagcgga gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc 6060
tggacctatg aggatatttg ctgtctttat attcatgacc tactggcatt tgctgaacgc 6120
atttactgtc acggttccca aggacctata tgtggtagag tatggtagca atatgacaat 6180
tgaatgcaaa ttcccagtag aaaaacaatt agacctggct gcactaattg tctattggga 6240
aatggaggat aagaacatta ttcaatttgt gcatggagag gaagacctga aggttcagca 6300
tagtagctac agacagaggg cccggctgtt gaaggaccag ctctccctgg gaaatgctgc 6360
acttcagatc acagatgtga aattgcagga tgcaggggtg taccgctgca tgatcagcta 6420
tggtggtgcc gactacaagc gaattactgt gaaagtcaat gccccataca acaaaatcaa 6480
ccaaagaatt ttggttgtgg atccagtcac ctctgaacat gaactgacat gtcaggctga 6540
gggctacccc aaggccgaag tcatctggac aagcagtgac catcaagtcc tgagtggtaa 6600
gaccaccacc accaattcca agagagagga gaaacttttc aatgtgacca gcacactgag 6660
aatcaacaca acaactaatg agattttcta ctgcactttt aggagattag atcctgagga 6720
aaaccataca gctgaattgg tcatcccaga actacctctg gcacatcctc caaatgaaag 6780
gactcacttg gtaattctgg gagccatctt attatgcctt ggtgtagcac tgacattcat 6840
cttccgttta agaaaaggga gaatgatgga tgtgaaaaaa tgtggcatcc aagatacaaa 6900
ctcaaagaag caaagtgata cacatttgga ggagacgtaa ccgctgatca gcctcgactg 6960
tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg 7020
aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga 7080
gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg 7140
aagacaatag caggcatgct ggggatgcgg tgggctctat gggtcgaccc agcgtgagtc 7200
tctcctaccc tcccgctctg gtccttcctc tcccgctctg caccctctgt ggccctcgct 7260
gtgctctctc gctccgtgac ttcccttctc caagttctcc ttggtggccc gccgtggggc 7320
tagtccaggg ctggatctcg gggaagcggc ggggtggcct gggagtgggg aagggggtgc 7380
gcacccggga cgcgcgctac ttgccccttt cggcggggag caggggagac ctttggccta 7440
cggcgacggg agggtcggga caaagtttag ggcgtcgata agcgtcagag cgccgaggtt 7500
gggggagggt ttctcttccg ctctttcgcg gggcctctgg ctcccccagc gcagctggag 7560
tgggggacgg gtaggctcgt cccaaaggcg cggcgctgag gtttgtgaac gcgtggaggg 7620
gcgcttgggg tctgggggag gcgtcgcccg ggtaagcctg tctgctgcgg ctctgcttcc 7680
cttagactgg agagctgtgg acttcgtcta ggcgcccgct aagttcgcat gtcctagcac 7740
ctctgggtct atgtggggcc acaccgtggg gaggaaacag cacgcgacgt ttgtagaatg 7800
cttggctgtg atacaaagcg gtttcgaata attaacttat ttgttcccat cacatgtcac 7860
ttttaaaaaa ttataagaac tacccgttat tgacatcttt ctgtgtgcca aggactttat 7920
gtgctttgcg tcatttaatt ttgaaaacag ttatcttccg ccatagataa ctactatggt 7980
tatcttctgg taaccacgtg cggaccgagg ctgcagcgtc gtcctcccta ggaaccccta 8040
gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca 8100
aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc 8160
tgcctgcagg ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac 8220
cgcatacgtc aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg 8280
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 8340
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 8400
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 8460
tgggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 8520
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 8580
tctcgggcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 8640
atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt 8700
tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc 8760
cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac 8820
aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac 8880
gcgcgagacg aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgaacaata 8940
aaactgtctg cttacataaa cagtaataca aggggtgtta tgagccatat tcaacgggaa 9000
acgtcgaggc cgcgattaaa ttccaacatg gatgctgatt tatatgggta taaatgggct 9060
cgcgataatg tcgggcaatc aggtgcgaca atctatcgct tgtatgggaa gcccgatgcg 9120
ccagagttgt ttctgaaaca tggcaaaggt agcgttgcca atgatgttac agatgagatg 9180
gtcagactaa actggctgac ggaatttatg cctcttccga ccatcaagca ttttatccgt 9240
actcctgatg atgcatggtt actcaccact gcgatccccg gaaaaacagc attccaggta 9300
ttagaagaat atcctgattc aggtgaaaat attgttgatg cgctggcagt gttcctgcgc 9360
cggttgcatt cgattcctgt ttgtaattgt ccttttaaca gcgatcgcgt atttcgtctc 9420
gctcaggcgc aatcacgaat gaataacggt ttggttgatg cgagtgattt tgatgacgag 9480
cgtaatggct ggcctgttga acaagtctgg aaagaaatgc ataaactttt gccattctca 9540
ccggattcag tcgtcactca tggtgatttc tcacttgata accttatttt tgacgagggg 9600
aaattaatag gttgtattga tgttggacga gtcggaatcg cagaccgata ccaggatctt 9660
gccatcctat ggaactgcct cggtgagttt tctccttcat tacagaaacg gctttttcaa 9720
aaatatggta ttgataatcc tgatatgaat aaattgcagt ttcatttgat gctcgatgag 9780
tttttctaat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 9840
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 9900
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 9960
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 10020
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 10080
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 10140
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 10200
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 10260
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 10320
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 10380
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 10440
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 10500
gccttttgct cacatgt 10517
<210> 48
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 48
gctccaggta gccaccttct 20
<210> 49
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 49
taggggcccc aactccatgg 20
<210> 50
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 50
ggcttatgcc aatatcggtg 20
<210> 51
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 51
aggtgatgaa gagaccaggg 20
<210> 52
<211> 3921
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 52
atgaggagga tgtgggccac gcaggggctg gcggtggcgc tggctctgag cgtgctgccg 60
ggcagccggg cgctgcggcc gggcgactgc gaagtttgta tttcttatct gggaagattt 120
taccaggacc tcaaagacag agatgtcaca ttctcaccag ccactattga aaacgaactt 180
ataaagttct gccgggaagc aagaggcaaa gagaatcggt tgtgctacta tatcggggcc 240
acagatgatg cagccaccaa aatcatcaat gaggtatcaa agcctctggc ccaccacatc 300
cctgtggaga agatctgtga gaagcttaag aagaaggaca gccagatatg tgagcttaag 360
tatgacaagc agatcgacct gagcacagtg gacctgaaga agctccgagt taaagagctg 420
aagaagattc tggatgactg gggggagaca tgcaaaggct gtgcagaaaa gtctgactac 480
atccggaaga taaatgaact gatgcctaaa tatgccccca aggcagccag tgcacggacc 540
gatttgggaa gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag 600
aaccctggac ctatggctga acaagtcctt cctcaggctt tgtatttgag caatatgcgg 660
aaagctgtga agatacggga gagaactcca gaagacattt ttaaacctac taatgggatc 720
attcatcatt ttaaaaccat gcaccgatac acactggaaa tgttcagaac ttgccagttt 780
tgtcctcagt ttcgggagat catccacaaa gccctcatcg acagaaacat ccaggccacc 840
ctggaaagcc agaagaaact caactggtgt cgagaagtcc ggaagcttgt ggcgctgaaa 900
acgaacggtg acggcaattg cctcatgcat gccacttctc agtacatgtg gggcgttcag 960
gacacagact tggtactgag gaaggcgctg ttcagcacgc tcaaggaaac agacacacgc 1020
aactttaaat tccgctggca actggagtct ctcaaatctc aggaatttgt tgaaacgggg 1080
ctttgctatg atactcggaa ctggaatgat gaatgggaca atcttatcaa aatggcttcc 1140
acagacacac ccatggcccg aagtggactt cagtacaact cactggaaga aatacacata 1200
tttgtccttt gcaacatcct cagaaggcca atcattgtca tttcagacaa aatgctaaga 1260
agtttggaat caggttccaa tttcgcccct ttgaaagtgg gtggaattta cttgcctctc 1320
cactggcctg cccaggaatg ctacagatac cccattgttc tcggctatga cagccatcat 1380
tttgtaccct tggtgaccct gaaggacagt gggcctgaaa tccgagctgt tccacttgtt 1440
aacagagacc ggggaagatt tgaagactta aaagttcact ttttgacaga tcctgaaaat 1500
gagatgaagg agaagctctt aaaagagtac ttaatggtga tagaaatccc cgtccaaggc 1560
tgggaccatg gcacaactca tctcatcaat gccgcaaagt tggatgaagc taacttacca 1620
aaagaaatca atctggtaga tgattacttt gaacttgttc agcatgagta caagaaatgg 1680
caggaaaaca gcgagcaggg gaggagagag gggcacgccc agaatcccat ggaaccttcc 1740
gtgccccagc tttctctcat ggatgtaaaa tgtgaaacgc ccaactgccc cttcttcatg 1800
tctgtgaaca cccagccttt atgccatgag tgctcagaga ggcggcaaaa gaatcaaaac 1860
aaactcccaa agctgaactc caagccgggc cctgaggggc tccctggcat ggcgctcggg 1920
gcctctcggg gagaagccta tgagcccttg gcgtggaacc ctgaggagtc cactgggggg 1980
cctcattcgg ccccaccgac agcacccagc ccttttctgt tcagtgagac cactgccatg 2040
aagtgcagga gccccggctg ccccttcaca ctgaatgtgc agcacaacgg attttgtgaa 2100
cgttgccaca acgcccggca acttcacgcc agccacgccc cagaccacac aaggcacttg 2160
gatcccggga agtgccaagc ctgcctccag gatgttacca ggacatttaa tgggatctgc 2220
agtacttgct tcaaaaggac tacagcagag gcctcctcca gcctcagcac cagcctccct 2280
ccttcctgtc accagcgttc caagtcagat ccctcgcggc tcgtccggag cccctccccg 2340
cattcttgcc acagagctgg aaacgacgcc cctgctggct gcctgtctca agctgcacgg 2400
actcctgggg acaggacggg gacgagcaag tgcagaaaag ccggctgcgt gtattttggg 2460
actccagaaa acaagggctt ttgcacactg tgtttcatcg agtacagaga aaacaaacat 2520
tttgctgctg cctcagggaa agtcagtccc acagcgtcca ggttccagaa caccattccg 2580
tgcctgggga gggaatgcgg cacccttgga agcaccatgt ttgaaggata ctgccagaag 2640
tgtttcattg aagctcagaa tcagagattt catgaggcca aaaggacaga agagcaactg 2700
agatcgagcc agcgcagaga tgtgcctcga accacacaaa gcacctcaag gcccaagtgc 2760
gcccgggcct cctgcaagaa catcctggcc tgccgcagcg aggagctctg catggagtgt 2820
cagcatccca accagaggat gggccctggg gcccaccggg gtgagcctgc ccccgaagac 2880
ccccccaagc agcgttgccg ggcccccgcc tgtgatcatt ttggcaatgc caagtgcaac 2940
ggctactgca acgaatgctt tcagttcaag cagatgtatg gcggaagcgg agctactaac 3000
ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc ctggacctat gaggatattt 3060
gctgtcttta tattcatgac ctactggcat ttgctgaacg catttactgt cacggttccc 3120
aaggacctat atgtggtaga gtatggtagc aatatgacaa ttgaatgcaa attcccagta 3180
gaaaaacaat tagacctggc tgcactaatt gtctattggg aaatggagga taagaacatt 3240
attcaatttg tgcatggaga ggaagacctg aaggttcagc atagtagcta cagacagagg 3300
gcccggctgt tgaaggacca gctctccctg ggaaatgctg cacttcagat cacagatgtg 3360
aaattgcagg atgcaggggt gtaccgctgc atgatcagct atggtggtgc cgactacaag 3420
cgaattactg tgaaagtcaa tgccccatac aacaaaatca accaaagaat tttggttgtg 3480
gatccagtca cctctgaaca tgaactgaca tgtcaggctg agggctaccc caaggccgaa 3540
gtcatctgga caagcagtga ccatcaagtc ctgagtggta agaccaccac caccaattcc 3600
aagagagagg agaaactttt caatgtgacc agcacactga gaatcaacac aacaactaat 3660
gagattttct actgcacttt taggagatta gatcctgagg aaaaccatac agctgaattg 3720
gtcatcccag aactacctct ggcacatcct ccaaatgaaa ggactcactt ggtaattctg 3780
ggagccatct tattatgcct tggtgtagca ctgacattca tcttccgttt aagaaaaggg 3840
agaatgatgg atgtgaaaaa atgtggcatc caagatacaa actcaaagaa gcaaagtgat 3900
acacatttgg aggagacgta a 3921
<210> 53
<211> 2469
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 53
atggaagata caaaggagtc taacgtgaag acattttgct ccaagaatat cctagccatc 60
cttggcttct cctctatcat agctgtgata gctttgcttg ctgtggggtt gacccagaac 120
aaagcattgc cagaaaacgt taagtatggg attgtgctgg atgcgggttc ttctcacaca 180
agtttataca tctataagtg gccagcagaa aaggagaatg acacaggcgt ggtgcatcaa 240
gtagaagaat gcagggttaa aggtcctgga atctcaaaat ttgttcagaa agtaaatgaa 300
ataggcattt acctgactga ttgcatggaa agagctaggg aagtgattcc aaggtcccag 360
caccaagaga cacccgttta cctgggagcc acggcaggca tgcggttgct caggatggaa 420
agtgaagagt tggcagacag ggttctggat gtggtggaga ggagcctcag caactacccc 480
tttgacttcc agggtgccag gatcattact ggccaagagg aaggtgccta tggctggatt 540
actatcaact atctgctggg caaattcagt cagaaaacaa ggtggttcag catagtccca 600
tatgaaacca ataatcagga aacctttgga gctttggacc ttgggggagc ctctacacaa 660
gtcacttttg taccccaaaa ccagactatc gagtccccag ataatgctct gcaatttcgc 720
ctctatggca aggactacaa tgtctacaca catagcttct tgtgctatgg gaaggatcag 780
gcactctggc agaaactggc caaggacatt caggttgcaa gtaatgaaat tctcagggac 840
ccatgctttc atcctggata taagaaggta gtgaacgtaa gtgaccttta caagaccccc 900
tgcaccaaga gatttgagat gactcttcca ttccagcagt ttgaaatcca gggtattgga 960
aactatcaac aatgccatca aagcatcctg gagctcttca acaccagtta ctgcccttac 1020
tcccagtgtg ccttcaatgg gattttcttg ccaccactcc agggggattt tggggcattt 1080
tcagcttttt actttgtgat gaagttttta aacttgacat cagagaaagt ctctcaggaa 1140
aaggtgactg agatgatgaa aaagttctgt gctcagcctt gggaggagat aaaaacatct 1200
tacgctggag taaaggagaa gtacctgagt gaatactgct tttctggtac ctacattctc 1260
tccctccttc tgcaaggcta tcatttcaca gctgattcct gggagcacat ccatttcatt 1320
ggcaagatcc agggcagcga cgccggctgg actttgggct acatgctgaa cctgaccaac 1380
atgatcccag ctgagcaacc attgtccaca cctctctccc actccaccta tgtcttcctc 1440
atggttctat tctccctggt ccttttcaca gtggccatca taggcttgct tatctttcac 1500
aagccttcat atttctggaa agatatggta ggaagcggag ctactaactt cagcctgctg 1560
aagcaggctg gagacgtgga ggagaaccct ggacctatga ggatatttgc tgtctttata 1620
ttcatgacct actggcattt gctgaacgca tttactgtca cggttcccaa ggacctatat 1680
gtggtagagt atggtagcaa tatgacaatt gaatgcaaat tcccagtaga aaaacaatta 1740
gacctggctg cactaattgt ctattgggaa atggaggata agaacattat tcaatttgtg 1800
catggagagg aagacctgaa ggttcagcat agtagctaca gacagagggc ccggctgttg 1860
aaggaccagc tctccctggg aaatgctgca cttcagatca cagatgtgaa attgcaggat 1920
gcaggggtgt accgctgcat gatcagctat ggtggtgccg actacaagcg aattactgtg 1980
aaagtcaatg ccccatacaa caaaatcaac caaagaattt tggttgtgga tccagtcacc 2040
tctgaacatg aactgacatg tcaggctgag ggctacccca aggccgaagt catctggaca 2100
agcagtgacc atcaagtcct gagtggtaag accaccacca ccaattccaa gagagaggag 2160
aaacttttca atgtgaccag cacactgaga atcaacacaa caactaatga gattttctac 2220
tgcactttta ggagattaga tcctgaggaa aaccatacag ctgaattggt catcccagaa 2280
ctacctctgg cacatcctcc aaatgaaagg actcacttgg taattctggg agccatctta 2340
ttatgccttg gtgtagcact gacattcatc ttccgtttaa gaaaagggag aatgatggat 2400
gtgaaaaaat gtggcatcca agatacaaac tcaaagaagc aaagtgatac acatttggag 2460
gagacgtaa 2469
<210> 54
<211> 3309
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 54
atggctgaac aagtccttcc tcaggctttg tatttgagca atatgcggaa agctgtgaag 60
atacgggaga gaactccaga agacattttt aaacctacta atgggatcat tcatcatttt 120
aaaaccatgc accgatacac actggaaatg ttcagaactt gccagttttg tcctcagttt 180
cgggagatca tccacaaagc cctcatcgac agaaacatcc aggccaccct ggaaagccag 240
aagaaactca actggtgtcg agaagtccgg aagcttgtgg cgctgaaaac gaacggtgac 300
ggcaattgcc tcatgcatgc cacttctcag tacatgtggg gcgttcagga cacagacttg 360
gtactgagga aggcgctgtt cagcacgctc aaggaaacag acacacgcaa ctttaaattc 420
cgctggcaac tggagtctct caaatctcag gaatttgttg aaacggggct ttgctatgat 480
actcggaact ggaatgatga atgggacaat cttatcaaaa tggcttccac agacacaccc 540
atggcccgaa gtggacttca gtacaactca ctggaagaaa tacacatatt tgtcctttgc 600
aacatcctca gaaggccaat cattgtcatt tcagacaaaa tgctaagaag tttggaatca 660
ggttccaatt tcgccccttt gaaagtgggt ggaatttact tgcctctcca ctggcctgcc 720
caggaatgct acagataccc cattgttctc ggctatgaca gccatcattt tgtacccttg 780
gtgaccctga aggacagtgg gcctgaaatc cgagctgttc cacttgttaa cagagaccgg 840
ggaagatttg aagacttaaa agttcacttt ttgacagatc ctgaaaatga gatgaaggag 900
aagctcttaa aagagtactt aatggtgata gaaatccccg tccaaggctg ggaccatggc 960
acaactcatc tcatcaatgc cgcaaagttg gatgaagcta acttaccaaa agaaatcaat 1020
ctggtagatg attactttga acttgttcag catgagtaca agaaatggca ggaaaacagc 1080
gagcagggga ggagagaggg gcacgcccag aatcccatgg aaccttccgt gccccagctt 1140
tctctcatgg atgtaaaatg tgaaacgccc aactgcccct tcttcatgtc tgtgaacacc 1200
cagcctttat gccatgagtg ctcagagagg cggcaaaaga atcaaaacaa actcccaaag 1260
ctgaactcca agccgggccc tgaggggctc cctggcatgg cgctcggggc ctctcgggga 1320
gaagcctatg agcccttggc gtggaaccct gaggagtcca ctggggggcc tcattcggcc 1380
ccaccgacag cacccagccc ttttctgttc agtgagacca ctgccatgaa gtgcaggagc 1440
cccggctgcc ccttcacact gaatgtgcag cacaacggat tttgtgaacg ttgccacaac 1500
gcccggcaac ttcacgccag ccacgcccca gaccacacaa ggcacttgga tcccgggaag 1560
tgccaagcct gcctccagga tgttaccagg acatttaatg ggatctgcag tacttgcttc 1620
aaaaggacta cagcagaggc ctcctccagc ctcagcacca gcctccctcc ttcctgtcac 1680
cagcgttcca agtcagatcc ctcgcggctc gtccggagcc cctccccgca ttcttgccac 1740
agagctggaa acgacgcccc tgctggctgc ctgtctcaag ctgcacggac tcctggggac 1800
aggacgggga cgagcaagtg cagaaaagcc ggctgcgtgt attttgggac tccagaaaac 1860
aagggctttt gcacactgtg tttcatcgag tacagagaaa acaaacattt tgctgctgcc 1920
tcagggaaag tcagtcccac agcgtccagg ttccagaaca ccattccgtg cctggggagg 1980
gaatgcggca cccttggaag caccatgttt gaaggatact gccagaagtg tttcattgaa 2040
gctcagaatc agagatttca tgaggccaaa aggacagaag agcaactgag atcgagccag 2100
cgcagagatg tgcctcgaac cacacaaagc acctcaaggc ccaagtgcgc ccgggcctcc 2160
tgcaagaaca tcctggcctg ccgcagcgag gagctctgca tggagtgtca gcatcccaac 2220
cagaggatgg gccctggggc ccaccggggt gagcctgccc ccgaagaccc ccccaagcag 2280
cgttgccggg cccccgcctg tgatcatttt ggcaatgcca agtgcaacgg ctactgcaac 2340
gaatgctttc agttcaagca gatgtatggc ggaagcggag ctactaactt cagcctgctg 2400
aagcaggctg gagacgtgga ggagaaccct ggacctatga ggatatttgc tgtctttata 2460
ttcatgacct actggcattt gctgaacgca tttactgtca cggttcccaa ggacctatat 2520
gtggtagagt atggtagcaa tatgacaatt gaatgcaaat tcccagtaga aaaacaatta 2580
gacctggctg cactaattgt ctattgggaa atggaggata agaacattat tcaatttgtg 2640
catggagagg aagacctgaa ggttcagcat agtagctaca gacagagggc ccggctgttg 2700
aaggaccagc tctccctggg aaatgctgca cttcagatca cagatgtgaa attgcaggat 2760
gcaggggtgt accgctgcat gatcagctat ggtggtgccg actacaagcg aattactgtg 2820
aaagtcaatg ccccatacaa caaaatcaac caaagaattt tggttgtgga tccagtcacc 2880
tctgaacatg aacttacatg tcaggctgag ggctacccca aggccgaagt catctggaca 2940
agcagtgacc atcaagtcct gagtggtaag accaccacca ccaattccaa gagagaggag 3000
aaacttttca atgtgaccag cacactgaga atcaacacaa caactaatga gattttctac 3060
tgcactttta ggagattaga tcctgaggaa aaccatacag ctgaattggt catcccagaa 3120
ctacctctgg cacatcctcc aaatgaaagg actcacttgg taattctggg agccatctta 3180
ttatgccttg gtgtagcact gacattcatc ttccgtttaa gaaaagggag aatgatggat 3240
gtgaaaaaat gtggcatcca agatacaaac tcaaagaagc aaagtgatac acatttggag 3300
gagacgtaa 3309
<210> 55
<211> 2112
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 55
atgaggagga tgtgggccac gcaggggctg gcggtggcgc tggctctgag cgtgctgccg 60
ggcagccggg cgctgcggcc gggcgactgc gaagtttgta tttcttatct gggaagattt 120
taccaggacc tcaaagacag agatgtcaca ttctcaccag ccactattga aaacgaactt 180
ataaagttct gccgggaagc aagaggcaaa gagaatcggt tgtgctacta tatcggggcc 240
acagatgatg cagccaccaa aatcatcaat gaggtatcaa agcctctggc ccaccacatc 300
cctgtggaga agatctgtga gaagcttaag aagaaggaca gccagatatg tgagcttaag 360
tatgacaagc agatcgacct gagcacagtg gacctgaaga agctccgagt taaagagctg 420
aagaagattc tggatgactg gggggagaca tgcaaaggct gtgcagaaaa gtctgactac 480
atccggaaga taaatgaact gatgcctaaa tatgccccca aggcagccag tgcacggacc 540
gatttgggaa gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag 600
aaccctggac ctatgtctcg ctccgttgcc ttagctgtgc tcgcgctact ctctctttct 660
ggattagagg ctgtcatggc gccccgaacc ctcttcctgg gtggaggcgg ttcaggcgga 720
ggtggctctg gcggtggcgg atcgatccag cgtactccaa agattcaggt ttactcacgt 780
catccagcag agaatggaaa gtcaaatttc ctgaattgct atgtgtctgg gtttcatcca 840
tccgacattg aagttgactt actgaagaat ggagagagaa ttgaaaaagt ggagcattca 900
gacttgtctt tcagcaagga ctggtctttc tatctcttgt actacactga attcaccccc 960
actgaaaaag atgagtatgc ctgccgtgtg aaccatgtga ctttgtcaca gcccaagata 1020
gttaagtggg atcgagacat gggtggtggt ggttctggtg gtggtggttc tggcggcggc 1080
ggctccggtg gtggtggatc cggctcccac tccttgaagt atttccacac ttccgtgtcc 1140
cggcccggcc gcggggagcc ccgcttcatc tctgtgggct acgtggacga cacccagttc 1200
gtgcgcttcg acaacgacgc cgcgagtccg aggatggtgc cgcgggcgcc gtggatggag 1260
caggaggggt cagagtattg ggaccgggag acacggagcg ccagggacac cgcacagatt 1320
ttccgagtga atctgcggac gctgcgcggc tactacaatc agagcgaggc cgggtctcac 1380
accctgcagt ggatgcatgg ctgcgagctg gggcccgacg ggcgcttcct ccgcgggtat 1440
gaacagttcg cctacgacgg caaggattat ctcaccctga atgaggacct gcgctcctgg 1500
accgcggtgg acacggcggc tcagatctcc gagcaaaagt caaatgatgc ctctgaggcg 1560
gagcaccaga gagcctacct ggaagacaca tgcgtggagt ggctccacaa atacctggag 1620
aaggggaagg agacgctgct tcacctggag cccccaaaga cacacgtgac tcaccacccc 1680
atctctgacc atgaggccac cctgaggtgc tgggccctgg gcttctaccc tgcggagatc 1740
acactgacct ggcagcagga tggggagggc catacccagg acacggagct cgtggagacc 1800
aggcctgcag gggatggaac cttccagaag tgggcagctg tggtggtgcc ttctggagag 1860
gagcagagat acacgtgcca tgtgcagcat gaggggctac ccgagcccgt caccctgaga 1920
tggaagccgg cttcccagcc caccatcccc atcgtgggca tcattgctgg cctggttctc 1980
cttggatctg tggtctctgg agctgtggtt gctgctgtga tatggaggaa gaagagctca 2040
ggtggaaaag gagggagcta ctctaaggct gagtggagcg acagtgccca ggggtctgag 2100
tctcacagct tg 2112
<210> 56
<211> 4257
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 56
atggaagata caaaggagtc taacgtgaag acattttgct ccaagaatat cctagccatc 60
cttggcttct cctctatcat agctgtgata gctttgcttg ctgtggggtt gacccagaac 120
aaagcattgc cagaaaacgt taagtatggg attgtgctgg atgcgggttc ttctcacaca 180
agtttataca tctataagtg gccagcagaa aaggagaatg acacaggcgt ggtgcatcaa 240
gtagaagaat gcagggttaa aggtcctgga atctcaaaat ttgttcagaa agtaaatgaa 300
ataggcattt acctgactga ttgcatggaa agagctaggg aagtgattcc aaggtcccag 360
caccaagaga cacccgttta cctgggagcc acggcaggca tgcggttgct caggatggaa 420
agtgaagagt tggcagacag ggttctggat gtggtggaga ggagcctcag caactacccc 480
tttgacttcc agggtgccag gatcattact ggccaagagg aaggtgccta tggctggatt 540
actatcaact atctgctggg caaattcagt cagaaaacaa ggtggttcag catagtccca 600
tatgaaacca ataatcagga aacctttgga gctttggacc ttgggggagc ctctacacaa 660
gtcacttttg taccccaaaa ccagactatc gagtccccag ataatgctct gcaatttcgc 720
ctctatggca aggactacaa tgtctacaca catagcttct tgtgctatgg gaaggatcag 780
gcactctggc agaaactggc caaggacatt caggttgcaa gtaatgaaat tctcagggac 840
ccatgctttc atcctggata taagaaggta gtgaacgtaa gtgaccttta caagaccccc 900
tgcaccaaga gatttgagat gactcttcca ttccagcagt ttgaaatcca gggtattgga 960
aactatcaac aatgccatca aagcatcctg gagctcttca acaccagtta ctgcccttac 1020
tcccagtgtg ccttcaatgg gattttcttg ccaccactcc agggggattt tggggcattt 1080
tcagcttttt actttgtgat gaagttttta aacttgacat cagagaaagt ctctcaggaa 1140
aaggtgactg agatgatgaa aaagttctgt gctcagcctt gggaggagat aaaaacatct 1200
tacgctggag taaaggagaa gtacctgagt gaatactgct tttctggtac ctacattctc 1260
tccctccttc tgcaaggcta tcatttcaca gctgattcct gggagcacat ccatttcatt 1320
ggcaagatcc agggcagcga cgccggctgg actttgggct acatgctgaa cctgaccaac 1380
atgatcccag ctgagcaacc attgtccaca cctctctccc actccaccta tgtcttcctc 1440
atggttctat tctccctggt ccttttcaca gtggccatca taggcttgct tatctttcac 1500
aagccttcat atttctggaa agatatggta ggaagcggag ctactaactt cagcctgctg 1560
aagcaggctg gagacgtgga ggagaaccct ggacctatgt gtccccgagc cgcgcgggcg 1620
cccgcgacgc tactcctcgc cctgggcgcg gtgctgtggc ctgcggctgg cgcctgggag 1680
cttacgattt tgcacaccaa cgacgtgcac agccggctgg agcagaccag cgaggactcc 1740
agcaagtgcg tcaacgccag ccgctgcatg ggtggcgtgg ctcggctctt caccaaggtt 1800
cagcagatcc gccgcgccga acccaacgtg ctgctgctgg acgccggcga ccagtaccag 1860
ggcactatct ggttcaccgt gtacaagggc gccgaggtgg cgcacttcat gaacgccctg 1920
cgctacgatg ccatggcact gggaaatcat gaatttgata atggtgtgga aggactgatc 1980
gagccactcc tcaaagaggc caaatttcca attctgagtg caaacattaa agcaaagggg 2040
ccactagcat ctcaaatatc aggactttat ttgccatata aagttcttcc tgttggtgat 2100
gaagttgtgg gaatcgttgg atacacttcc aaagaaaccc cttttctctc aaatccaggg 2160
acaaatttag tgtttgaaga tgaaatcact gcattacaac ctgaagtaga taagttaaaa 2220
actctaaatg tgaacaaaat tattgcactg ggacattcgg gttttgaaat ggataaactc 2280
atcgctcaga aagtgagggg tgtggacgtc gtggtgggag gacactccaa cacatttctt 2340
tacacaggca atccaccttc caaagaggtg cctgctggga agtacccatt catagtcact 2400
tctgatgatg ggcggaaggt tcctgtagtc caggcctatg cttttggcaa atacctaggc 2460
tatctgaaga tcgagtttga tgaaagagga aacgtcatct cttcccatgg aaatcccatt 2520
cttctaaaca gcagcattcc tgaagatcca agcataaaag cagacattaa caaatggagg 2580
ataaaattgg ataattattc tacccaggaa ttagggaaaa caattgtcta tctggatggc 2640
tcctctcaat catgccgctt tagagaatgc aacatgggca acctgatttg tgatgcaatg 2700
attaacaaca acctgagaca cacggatgaa atgttctgga accacgtatc catgtgcatt 2760
ttaaatggag gtggtatccg gtcgcccatt gatgaacgca acaatggcac aattacctgg 2820
gagaacctgg ctgctgtatt gccctttgga ggcacatttg acctagtcca gttaaaaggt 2880
tccaccctga agaaggcctt tgagcatagc gtgcaccgct acggccagtc cactggagag 2940
ttcctgcagg tgggcggaat ccatgtggtg tatgatcttt cccgaaaacc tggagacaga 3000
gtagtcaaat tagatgttct ttgcaccaag tgtcgagtgc ccagttatga ccctctcaaa 3060
atggacgagg tatataaggt gatcctccca aacttcctgg ccaatggtgg agatgggttc 3120
cagatgataa aagatgaatt attaagacat gactctggtg accaagatat caacgtggtt 3180
tctacatata tctccaaaat gaaagtaatt tatccagcag ttgaaggtcg gatcaagttt 3240
tccacaggaa gtcactgcca tggaagcttt tctttaatat ttctttcact ttgggcagtg 3300
atctttgttt tataccaagg aagcggagct actaacttca gcctgctgaa gcaggctgga 3360
gacgtggagg agaaccctgg acctatgagg atatttgctg tctttatatt catgacctac 3420
tggcatttgc tgaacgcatt tactgtcacg gttcccaagg acctatatgt ggtagagtat 3480
ggtagcaata tgacaattga atgcaaattc ccagtagaaa aacaattaga cctggctgca 3540
ctaattgtct attgggaaat ggaggataag aacattattc aatttgtgca tggagaggaa 3600
gacctgaagg ttcagcatag tagctacaga cagagggccc ggctgttgaa ggaccagctc 3660
tccctgggaa atgctgcact tcagatcaca gatgtgaaat tgcaggatgc aggggtgtac 3720
cgctgcatga tcagctatgg tggtgccgac tacaagcgaa ttactgtgaa agtcaatgcc 3780
ccatacaaca aaatcaacca aagaattttg gttgtggatc cagtcacctc tgaacatgaa 3840
ctgacatgtc aggctgaggg ctaccccaag gccgaagtca tctggacaag cagtgaccat 3900
caagtcctga gtggtaagac caccaccacc aattccaaga gagaggagaa acttttcaat 3960
gtgaccagca cactgagaat caacacaaca actaatgaga ttttctactg cacttttagg 4020
agattagatc ctgaggaaaa ccatacagct gaattggtca tcccagaact acctctggca 4080
catcctccaa atgaaaggac tcacttggta attctgggag ccatcttatt atgccttggt 4140
gtagcactga cattcatctt ccgtttaaga aaagggagaa tgatggatgt gaaaaaatgt 4200
ggcatccaag atacaaactc aaagaagcaa agtgatacac atttggagga gacgtaa 4257
<210> 57
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 57
gttcatgcgc aagaggatcg 20
<210> 58
<211> 3318
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<400> 58
atggaagata caaaggagtc taacgtgaag acattttgct ccaagaatat cctagccatc 60
cttggcttct cctctatcat agctgtgata gctttgcttg ctgtggggtt gacccagaac 120
aaagcattgc cagaaaacgt taagtatggg attgtgctgg atgcgggttc ttctcacaca 180
agtttataca tctataagtg gccagcagaa aaggagaatg acacaggcgt ggtgcatcaa 240
gtagaagaat gcagggttaa aggtcctgga atctcaaaat ttgttcagaa agtaaatgaa 300
ataggcattt acctgactga ttgcatggaa agagctaggg aagtgattcc aaggtcccag 360
caccaagaga cacccgttta cctgggagcc acggcaggca tgcggttgct caggatggaa 420
agtgaagagt tggcagacag ggttctggat gtggtggaga ggagcctcag caactacccc 480
tttgacttcc agggtgccag gatcattact ggccaagagg aaggtgccta tggctggatt 540
actatcaact atctgctggg caaattcagt cagaaaacaa ggtggttcag catagtccca 600
tatgaaacca ataatcagga aacctttgga gctttggacc ttgggggagc ctctacacaa 660
gtcacttttg taccccaaaa ccagactatc gagtccccag ataatgctct gcaatttcgc 720
ctctatggca aggactacaa tgtctacaca catagcttct tgtgctatgg gaaggatcag 780
gcactctggc agaaactggc caaggacatt caggttgcaa gtaatgaaat tctcagggac 840
ccatgctttc atcctggata taagaaggta gtgaacgtaa gtgaccttta caagaccccc 900
tgcaccaaga gatttgagat gactcttcca ttccagcagt ttgaaatcca gggtattgga 960
aactatcaac aatgccatca aagcatcctg gagctcttca acaccagtta ctgcccttac 1020
tcccagtgtg ccttcaatgg gattttcttg ccaccactcc agggggattt tggggcattt 1080
tcagcttttt actttgtgat gaagttttta aacttgacat cagagaaagt ctctcaggaa 1140
aaggtgactg agatgatgaa aaagttctgt gctcagcctt gggaggagat aaaaacatct 1200
tacgctggag taaaggagaa gtacctgagt gaatactgct tttctggtac ctacattctc 1260
tccctccttc tgcaaggcta tcatttcaca gctgattcct gggagcacat ccatttcatt 1320
ggcaagatcc agggcagcga cgccggctgg actttgggct acatgctgaa cctgaccaac 1380
atgatcccag ctgagcaacc attgtccaca cctctctccc actccaccta tgtcttcctc 1440
atggttctat tctccctggt ccttttcaca gtggccatca taggcttgct tatctttcac 1500
aagccttcat atttctggaa agatatggta ggaagcggag ctactaactt cagcctgctg 1560
aagcaggctg gagacgtgga ggagaaccct ggacctatgt gtccccgagc cgcgcgggcg 1620
cccgcgacgc tactcctcgc cctgggcgcg gtgctgtggc ctgcggctgg cgcctgggag 1680
cttacgattt tgcacaccaa cgacgtgcac agccggctgg agcagaccag cgaggactcc 1740
agcaagtgcg tcaacgccag ccgctgcatg ggtggcgtgg ctcggctctt caccaaggtt 1800
cagcagatcc gccgcgccga acccaacgtg ctgctgctgg acgccggcga ccagtaccag 1860
ggcactatct ggttcaccgt gtacaagggc gccgaggtgg cgcacttcat gaacgccctg 1920
cgctacgatg ccatggcact gggaaatcat gaatttgata atggtgtgga aggactgatc 1980
gagccactcc tcaaagaggc caaatttcca attctgagtg caaacattaa agcaaagggg 2040
ccactagcat ctcaaatatc aggactttat ttgccatata aagttcttcc tgttggtgat 2100
gaagttgtgg gaatcgttgg atacacttcc aaagaaaccc cttttctctc aaatccaggg 2160
acaaatttag tgtttgaaga tgaaatcact gcattacaac ctgaagtaga taagttaaaa 2220
actctaaatg tgaacaaaat tattgcactg ggacattcgg gttttgaaat ggataaactc 2280
atcgctcaga aagtgagggg tgtggacgtc gtggtgggag gacactccaa cacatttctt 2340
tacacaggca atccaccttc caaagaggtg cctgctggga agtacccatt catagtcact 2400
tctgatgatg ggcggaaggt tcctgtagtc caggcctatg cttttggcaa atacctaggc 2460
tatctgaaga tcgagtttga tgaaagagga aacgtcatct cttcccatgg aaatcccatt 2520
cttctaaaca gcagcattcc tgaagatcca agcataaaag cagacattaa caaatggagg 2580
ataaaattgg ataattattc tacccaggaa ttagggaaaa caattgtcta tctggatggc 2640
tcctctcaat catgccgctt tagagaatgc aacatgggca acctgatttg tgatgcaatg 2700
attaacaaca acctgagaca cacggatgaa atgttctgga accacgtatc catgtgcatt 2760
ttaaatggag gtggtatccg gtcgcccatt gatgaacgca acaatggcac aattacctgg 2820
gagaacctgg ctgctgtatt gccctttgga ggcacatttg acctagtcca gttaaaaggt 2880
tccaccctga agaaggcctt tgagcatagc gtgcaccgct acggccagtc cactggagag 2940
ttcctgcagg tgggcggaat ccatgtggtg tatgatcttt cccgaaaacc tggagacaga 3000
gtagtcaaat tagatgttct ttgcaccaag tgtcgagtgc ccagttatga ccctctcaaa 3060
atggacgagg tatataaggt gatcctccca aacttcctgg ccaatggtgg agatgggttc 3120
cagatgataa aagatgaatt attaagacat gactctggtg accaagatat caacgtggtt 3180
tctacatata tctccaaaat gaaagtaatt tatccagcag ttgaaggtcg gatcaagttt 3240
tccacaggaa gtcactgcca tggaagcttt tctttaatat ttctttcact ttgggcagtg 3300
atctttgttt tataccaa 3318
<210> 59
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 59
aggatacgtt tttctgttgg gc 22
<210> 60
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 60
ggagaacggg aaaagagcga 20

Claims (76)

1.一种遗传修饰的细胞,包含(a)编码中脑星形胶质细胞来源的神经营养因子(MANF)的第一外源多核苷酸插入、编码肿瘤坏死因子α诱导蛋白3(TNFAIP3)的第二外源多核苷酸插入、编码分化簇39(CD39)的第三外源多核苷酸插入和/或编码分化簇73(CD73)的第四外源多核苷酸插入,其中所述遗传修饰的细胞表达CD39、MANF、TNFAIP3和/或CD73;和/或(b)被破坏的编码转化生长因子β(TGFβ)蛋白、β-2-微球蛋白(B2M)蛋白、硫氧还蛋白相互作用蛋白(TXNIP)蛋白和/或II类反式激活因子(CIITA)蛋白的基因,其中所述遗传修饰的细胞具有所述TGFβ蛋白、所述B2M蛋白、所述TXNIP蛋白和/或所述CIITA蛋白的被破坏的表达。
2.根据权利要求1所述的遗传修饰的细胞,其中所述遗传修饰的细胞包含编码MANF的所述第一外源多核苷酸并表达MANF。
3.根据权利要求1或2所述的遗传修饰的细胞,其中所述第一外源多核苷酸可操作地连接到外源启动子。
4.根据权利要求1至3中任一项所述的遗传修饰的细胞,其中所述第一外源多核苷酸包含基本上由SEQ ID NO:17组成的核苷酸序列。
5.根据权利要求1至4中任一项所述的遗传修饰的细胞,其中所述遗传修饰的细胞包含编码TNFAIP3的所述第二外源多核苷酸并表达TNFAIP3。
6.根据权利要求1至5中任一项所述的遗传修饰的细胞,其中所述第二外源多核苷酸可操作地连接到外源启动子。
7.根据权利要求1至6中任一项所述的遗传修饰的细胞,其中所述第二外源多核苷酸包含基本上由SEQ ID NO:19组成的核苷酸序列。
8.根据权利要求1至7中任一项所述的遗传修饰的细胞,其中所述遗传修饰的细胞包含编码CD39的所述第三外源多核苷酸并表达CD39。
9.根据权利要求1至8中任一项所述的遗传修饰的细胞,其中所述第三外源多核苷酸可操作地连接到外源启动子。
10.根据权利要求1至9中任一项所述的遗传修饰的细胞,其中所述第三外源多核苷酸包含基本上由SEQ ID NO:27组成的核苷酸序列。
11.根据权利要求1至10中任一项所述的遗传修饰的细胞,其中所述遗传修饰的细胞包含编码CD73的所述第四外源多核苷酸并表达CD73。
12.根据权利要求1至11中任一项所述的遗传修饰的细胞,其中编码CD73的所述第四外源多核苷酸可操作地连接到外源启动子。
13.根据权利要求1至12中任一项所述的遗传修饰的细胞,其中编码CD73的所述第四外源多核苷酸包含基本上由SEQ ID NO:46组成的核苷酸序列。
14.根据权利要求1至13中任一项所述的遗传修饰的细胞,其中所述遗传修饰的细胞包含编码CD39的所述第三外源多核苷酸和编码CD73的所述第四外源多核苷酸并表达CD39和CD73,其中编码CD39的所述第三外源多核苷酸通过编码P2A肽的多核苷酸连接到编码CD73的所述第四外源多核苷酸,使得编码CD39的所述第三外源多核苷酸、编码P2A肽的所述多核苷酸和编码CD73的所述第四外源多核苷酸形成CD39-P2A-CD73构建体。
15.根据权利要求14所述的遗传修饰的细胞,其中所述CD39-P2A-CD73构建体可操作地连接到外源启动子。
16.根据权利要求14或15所述的遗传修饰的细胞,其中所述CD39-P2A-CD73构建体包含基本上由SEQ ID NO:58组成的核苷酸序列。
17.根据权利要求1至16中任一项所述的遗传修饰的细胞,还包含编码HLA I类组织相容性抗原α链E(HLA-E)的第五外源多核苷酸,其中所述遗传修饰的细胞表达HLA-E。
18.根据权利要求17所述的遗传修饰的细胞,其中编码HLA-E的所述第五外源多核苷酸包含编码HLA-E三聚体的多核苷酸,所述HLA-E三聚体包含融合到HLA-G呈递肽的B2M信号肽,所述HLA-G呈递肽融合到B2M膜蛋白,所述B2M膜蛋白融合到无其信号肽的HLA-E。
19.根据权利要求17或18所述的遗传修饰的细胞,其中编码HLA-E的所述第五外源多核苷酸可操作地连接到外源启动子。
20.根据权利要求17至19中任一项所述的遗传修饰的细胞,其中编码HLA-E的所述第五外源多核苷酸包含基本上由SEQ ID NO:43组成的核苷酸序列。
21.根据权利要求17至20中任一项所述的遗传修饰的细胞,包含编码MANF的所述第一外源多核苷酸和编码HLA-E的所述第五外源多核苷酸,任选地,其中编码MANF的所述第一外源多核苷酸通过编码P2A肽的多核苷酸连接到编码HLA-E的所述第五外源多核苷酸,使得所述第一外源多核苷酸、编码P2A肽的所述多核苷酸和所述第五外源多核苷酸形成MANF-P2A-HLA-E构建体。
22.根据权利要求21所述的遗传修饰的细胞,其中所述MANF-P2A-HLA-E构建体可操作地连接到外源启动子。
23.根据权利要求21或22所述的遗传修饰的细胞,其中所述MANF-P2A-HLA-E构建体包含基本上由SEQ ID NO:55组成的多核苷酸序列。
24.根据权利要求1至23中任一项所述的遗传修饰的细胞,还包含编码程序性死亡配体1(PD-L1)的第六外源多核苷酸,其中所述遗传修饰的细胞表达PD-L1。
25.根据权利要求24所述的遗传修饰的细胞,其中编码PD-L1的所述第六外源多核苷酸可操作地连接到外源启动子。
26.根据权利要求24或25所述的遗传修饰的细胞,其中所述第六外源多核苷酸包含基本上由SEQ ID NO:20组成的核苷酸序列。
27.根据权利要求24至26中任一项所述的遗传修饰的细胞,包含编码TNFAIP3的所述第二外源多核苷酸和编码PD-L1的所述第六外源多核苷酸,任选地,其中编码TNFAIP3的所述第二外源多核苷酸通过编码P2A肽的多核苷酸连接到编码PD-L1的所述第六外源多核苷酸序列,使得所述第二外源多核苷酸、编码P2A肽的所述多核苷酸和所述第六外源多核苷酸形成TNFAIP3-P2A-PD-L1构建体。
28.根据权利要求27所述的遗传修饰的细胞,其中所述TNFAIP3-P2A-PD-L1构建体可操作地连接到外源启动子。
29.根据权利要求27或28所述的遗传修饰的细胞,其中所述TNFAIP3-P2A-PD-L1构建体包含基本上由SEQ ID NO:54组成的核苷酸序列。
30.根据权利要求24至29中任一项所述的遗传修饰的细胞,包含编码CD39的所述第三外源多核苷酸和编码PD-L1的所述第六外源多核苷酸,任选地,其中编码CD39的所述第三外源多核苷酸通过编码P2A肽的多核苷酸连接到编码PD-L1的所述第六外源多核苷酸,使得所述第三外源多核苷酸、编码P2A肽的所述多核苷酸和所述第六外源多核苷酸形成CD39-P2A-PD-L1构建体。
31.根据权利要求30所述的遗传修饰的细胞,其中所述CD39-P2A-PD-L1构建体可操作地连接到外源启动子。
32.根据权利要求30或31所述的遗传修饰的细胞,其中所述CD39-P2A-PD-L1构建体包含基本上由SEQ ID NO:53组成的核苷酸序列。
33.根据权利要求24至32中任一项所述的遗传修饰的细胞,包含编码MANF的所述第一外源多核苷酸、编码TNFAIP3的所述第二外源多核苷酸和编码PD-L1的所述第六外源多核苷酸,任选地其中所述第一外源多核苷酸通过编码P2A肽的第一多核苷酸连接到所述第二外源多核苷酸,并且所述第二外源多核苷酸通过编码P2A肽的第二多核苷酸连接到所述第六外源多核苷酸,使得编码MANF的所述第一外源多核苷酸、编码P2A肽的所述第一多核苷酸、编码TNFAIP3的所述第二外源多核苷酸、编码P2A肽的所述第二多核苷酸和编码PD-L1的所述第六外源多核苷酸形成MANF-P2A-TNFAIP3-P2A-PD-L1构建体。
34.根据权利要求33所述的遗传修饰的细胞,其中所述MANF-P2A-TNFAIP3-P2A-PD-L1可操作地连接到外源启动子。
35.根据权利要求33或34所述的遗传修饰的细胞,其中所述MANF-P2A-TNFAIP3-P2A-PD-L1构建体包含基本上由SEQ ID NO:52组成的核苷酸序列。
36.根据权利要求24至35中任一项所述的遗传修饰的细胞,包含编码CD39的所述第三外源多核苷酸、编码CD73的所述第四外源多核苷酸和编码PD-L1的所述第六外源多核苷酸,任选地其中编码CD39的所述第三外源多核苷酸通过编码P2A肽的第一多核苷酸连接到编码CD73的所述第四外源多核苷酸,并且所述第四外源多核苷酸通过编码P2A肽的第二多核苷酸连接到所述第六外源多核苷酸,使得编码CD39的所述第三外源多核苷酸、编码P2A肽的所述第一多核苷酸、编码CD73的所述第四外源多核苷酸、编码P2A肽的所述第二多核苷酸和编码PD-L1的所述第六外源多核苷酸形成CD39-P2A-CD73-P2A-PD-L1构建体。
37.根据权利要求36所述的遗传修饰的细胞,其中所述CD39-P2A-CD73-P2A-PD-L1构建体可操作地连接到外源启动子。
38.根据权利要求36或37所述的遗传修饰的细胞,其中所述CD39-P2A-CD73-P2A-PD-L1构建体包含基本上由SEQ ID NO:56组成的核苷酸序列。
39.根据权利要求1至38中任一项所述的遗传修饰的细胞,其中所述遗传修饰的细胞包含被破坏的B2M基因、被破坏的TXNIP基因、被破坏的CIITA基因和/或被破坏的TGFβ基因,并且所述细胞具有所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的被破坏的表达。
40.根据权利要求1至39中任一项所述的遗传修饰的细胞,其中编码MANF的所述第一外源多核苷酸、编码TNFAIP3的所述第二外源多核苷酸、编码CD39的所述第三外源多核苷酸和/或编码CD73的所述第四外源多核苷酸各自独立地被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达。
41.根据权利要求1至40中任一项所述的遗传修饰的细胞,还包含编码HLA I类组织相容性抗原α链E(HLA-E)的第五外源多核苷酸,其中编码HLA-E的所述第五外源多核苷酸被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达,并且其中所述通用供体细胞还表达HLA-E。
42.根据权利要求1至41中任一项所述的遗传修饰的细胞,还包含编码程序性死亡配体1(PD-L1)的第六外源多核苷酸,其中编码PD-L1的所述第六外源多核苷酸被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达,并且其中所述通用供体细胞表达PD-L1。
43.根据权利要求1至42中任一项所述的遗传修饰的细胞,其中编码MANF的所述第一外源多核苷酸被插入所述B2M基因、所述TXNIP基因或所述CIITA基因和/或所述TGFβ基因内或附近。
44.根据权利要求1至43所述的遗传修饰的细胞,其中编码TNFAIP3的所述第二外源多核苷酸被插入所述B2M基因、所述TXNIP基因或所述CIITA基因和/或所述TGFβ基因内或附近。
45.根据权利要求1至44中任一项所述的遗传修饰的细胞,其中编码CD39的所述第三外源多核苷酸被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近。
46.根据权利要求1至45中任一项所述的遗传修饰的细胞,其中编码CD73的所述第四外源多核苷酸被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近。
47.根据权利要求21至46中任一项所述的遗传修饰的细胞,包含所述MANF-P2A-HLA-E构建体,其中所述MANF-P2A-HLA-E构建体被插入所述B2M基因、所述TXNIP基因、所述CIITA基因或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达。
48.根据权利要求27至47中任一项所述的遗传修饰的细胞,包含所述TNFAIP3-P2A-PD-L1构建体,其中所述TNFAIP3-P2A-PD-L1构建体被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达。
49.根据权利要求30至48中任一项所述的遗传修饰的细胞,包含所述CD39-P2A-PD-L1构建体,其中所述CD39-P2A-PD-L1构建体被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达。
50.根据权利要求33至49中任一项所述的遗传修饰的细胞,包含所述MANF-P2A-TNFAIP3-P2A-PD-L1构建体,其中所述MANF-P2A-TNFAIP3-P2A-PD-L1构建体被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达。
51.根据权利要求40至50中任一项所述的遗传修饰的细胞,包含所述CD39-P2A-CD73构建体,其中所述CD39-P2A-CD73构建体被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达。
52.根据权利要求36至50中任一项所述的遗传修饰的细胞,包含所述CD39-P2A-CD73-P2A-PD-L1构建体,其中所述CD39-P2A-CD73-P2A-PD-L1构建体被插入所述B2M基因、所述TXNIP基因、所述CIITA基因和/或所述TGFβ基因内或附近,从而破坏所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达。
53.根据权利要求1至52中任一项所述的遗传修饰的细胞,其中所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的被破坏的表达包括所述B2M蛋白、所述TXNIP蛋白、所述CIITA蛋白和/或所述TGFβ蛋白的表达减少或消除。
54.根据权利要求1至53中任一项所述的遗传修饰的细胞,其中所述TGFβ蛋白是TGFβ-2。
55.根据权利要求1至54中任一项所述的遗传修饰的细胞,其中所述细胞是干细胞。
56.根据权利要求55所述的遗传修饰的细胞,其中所述干细胞是胚胎干细胞、成体干细胞、诱导多能干细胞或造血干细胞。
57.根据权利要求1至54中任一项所述的遗传修饰的细胞,其中所述细胞是分化细胞或体细胞。
58.根据权利要求57所述的遗传修饰的细胞,其中所述细胞是谱系限制性祖细胞或完全分化的体细胞。
59.根据权利要求58所述的遗传修饰的细胞,其中所述谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞、胰腺内分泌细胞或未成熟β细胞,并且所述完全分化的体细胞是胰腺β细胞。
60.多于一种根据权利要求1至59中任一项所述的遗传修饰的细胞。
61.根据权利要求60所述的多于一种细胞,其中至少约50%的所述细胞表达MANF、HLA-E、TNFAIP3、PD-L1、CD39和/或CD73。
62.谱系限制性祖细胞或完全分化的体细胞的群体,所述谱系限制性祖细胞或完全分化的体细胞的群体来源于权利要求60或61的多于一种遗传修饰的细胞。
63.根据权利要求62所述的细胞群体,其中所述谱系限制性祖细胞是定型内胚层细胞、原始肠管细胞、后前肠细胞、胰腺内胚层祖细胞、胰腺内分泌祖细胞或未成熟β细胞,并且所述完全分化的体细胞是胰腺β细胞。
64.根据权利要求62或63所述的细胞群体,其中至少约50%的细胞表达MANF、HLA-E、TNFAIP3、PD-L1、CD39和/或CD73。
65.一种组合物,包含权利要求60或61的多于一种细胞或权利要求62至64中任一项的细胞群体。
66.根据权利要求65所述的组合物,还包含至少一种药学上可接受的赋形剂。
67.根据权利要求65或66所述的组合物,用于治疗胰腺疾病或紊乱。
68.根据权利要求67所述的组合物,其中所述胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
69.根据权利要求67或68所述的组合物,其中人类包括所述胰腺疾病或紊乱。
70.一种用于治疗有相应需要的受试者的方法,所述方法包括:
(a)获得或已经获得分化为胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或胰腺β细胞后的权利要求60或61的多于一种遗传修饰的细胞;以及
(b)向所述受试者施用所述胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或胰腺β细胞。
71.一种用于治疗有相应需要的受试者的方法,所述方法包括:
(a)获得或已经获得权利要求62至64中任一项的谱系限制性祖细胞或完全分化的体细胞的群体,其中所述谱系限制性祖细胞或完全分化的体细胞包括胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;以及
(b)向所述受试者施用所述胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞和/或β细胞。
72.一种用于治疗有相应需要的受试者的方法,所述方法包括:
(a)获得或已经获得权利要求60或61的多于一种遗传修饰的细胞,其中所述多于一种遗传修饰的细胞包括干细胞;
(b)将所述遗传修饰的细胞分化为胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞;以及
(c)向所述受试者施用所述胰腺内胚层细胞、胰腺内分泌前体细胞、未成熟β细胞和/或胰腺β细胞。
73.根据权利要求70至72中任一项所述的方法,其中施用包括将包含所述胰腺内胚层细胞、胰腺内分泌细胞、未成熟β细胞或成熟β细胞的装置植入所述受试者。
74.根据权利要求70至73中任一项所述的方法,其中所述受试者患有胰腺疾病或紊乱、被怀疑患有胰腺疾病或紊乱或处于胰腺疾病或紊乱的风险中。
75.根据权利要求74所述的方法,其中所述胰腺疾病或紊乱是I型糖尿病、II型糖尿病或胰腺切除术。
76.根据权利要求70至75中任一项所述的方法,其中所述受试者是人类。
CN202180094946.7A 2020-12-31 2021-12-31 通用供体细胞 Pending CN117043319A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/132,890 2020-12-31
US63/234,997 2021-08-19
US202163288356P 2021-12-10 2021-12-10
US63/288,356 2021-12-10
PCT/IB2021/062525 WO2022144855A1 (en) 2020-12-31 2021-12-31 Universal donor cells

Publications (1)

Publication Number Publication Date
CN117043319A true CN117043319A (zh) 2023-11-10

Family

ID=88384771

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180094941.4A Pending CN116940666A (zh) 2020-12-31 2021-12-31 通用供体细胞
CN202180094946.7A Pending CN117043319A (zh) 2020-12-31 2021-12-31 通用供体细胞

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202180094941.4A Pending CN116940666A (zh) 2020-12-31 2021-12-31 通用供体细胞

Country Status (1)

Country Link
CN (2) CN116940666A (zh)

Also Published As

Publication number Publication date
CN116940666A (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
US11180776B1 (en) Universal donor cells
US11434505B2 (en) Universal donor cells
US11433103B2 (en) Universal donor cells
TW202242094A (zh) 通用供體細胞
CN117043319A (zh) 通用供体细胞

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination