CN116670275A

CN116670275A - 包含靶向pdcd1的rna指导物的组合物及其用途

Info

Publication number: CN116670275A
Application number: CN202180080045.2A
Authority: CN
Inventors: Q·N·韦斯塞尔; J·R·哈斯韦尔; T·M·迪托马索; N·M·贾基莫
Original assignee: Abbott Biotechnology
Current assignee: Abbott Biotechnology
Priority date: 2020-10-30
Filing date: 2021-10-29
Publication date: 2023-08-29

Abstract

本发明涉及包含靶向PDCD1的RNA指导物的组合物、表征这些组合物的方法、包含这些组合物的细胞以及使用这些组合物的方法。

Description

包含靶向PDCD1的RNA指导物的组合物及其用途

序列表

本申请含有已以ASCII格式以电子方式提交且特此通过援引以其全文并入的序列表。所述ASCII副本创建于2021年10月29日，名为51451-016WO3_Sequence_Listing_10_29_21_ST25，并且大小为189,383字节。

背景技术

成簇规律间隔短回文重复序列(CRISPR)和CRISPR相关(Cas)基因(统称为CRISPR-Cas或CRISPR/Cas系统)是古细菌和细菌中针对外来遗传元件而防御特定物种的适应性免疫系统。

发明内容

正是在上述背景下，本发明提供了优于现有技术的某些优点和进步。尽管本文披露的本发明不限于特定优点或功能，但本发明提供了包含RNA指导物的组合物，其中该RNA指导物包含(i)与PDCD1基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列；其中该靶序列与包含序列5′-NTTN-3′的原型间隔子相邻基序(PAM)相邻。

在组合物的一方面，靶序列在PDCD1基因的外显子1、外显子2、外显子3或外显子4内。

在组合物的另一方面，PDCD1基因包含SEQ ID NO:277的序列、SEQ ID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。

在组合物的另一方面，间隔子序列包含：a.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸16；b.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸17；c.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸18；d.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸19；e.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸20；f.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸21；g.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸22；h.与SEQ IDNO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸23；i.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸24；j.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸25；k.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸26；l.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸27；m.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸28；n.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸29；或o.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸30。

在组合物的另一方面，间隔子序列包含：a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16；b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17；c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18；d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19；e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20；f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21；g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22；h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23；i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24；j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25；k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26；l.SEQID NO:143-255和257-274中任一个的核苷酸1至核苷酸27；m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28；n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29；或o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。

在该组合物的另一方面，同向重复序列包含：a.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；o.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸1至核苷酸34；p.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸2至核苷酸34；q.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸3至核苷酸34；r.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸4至核苷酸34；s.与SEQID NO:9的序列具有至少90％同一性的序列的核苷酸5至核苷酸34；t.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸6至核苷酸34；u.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸7至核苷酸34；v.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸8至核苷酸34；w.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸9至核苷酸34；x.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸10至核苷酸34；y.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸11至核苷酸34；z.与SEQID NO:9的序列具有至少90％同一性的序列的核苷酸12至核苷酸34；或aa.与SEQ ID NO:10的序列或其一部分具有至少90％同一性的序列。

在该组合物的另一方面，同向重复序列包含：a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36；b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36；c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36；d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36；e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36；f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36；g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36；h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36；i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36；j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36；k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36；l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36；m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36；n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36；o.SEQ ID NO:9的核苷酸1至核苷酸34；p.SEQ ID NO:9的核苷酸2至核苷酸34；q.SEQ ID NO:9的核苷酸3至核苷酸34；r.SEQ IDNO:9的核苷酸4至核苷酸34；s.SEQ ID NO:9的核苷酸5至核苷酸34；t.SEQ ID NO:9的核苷酸6至核苷酸34；u.SEQ ID NO:9的核苷酸7至核苷酸34；v.SEQ ID NO:9的核苷酸8至核苷酸34；w.SEQ ID NO:9的核苷酸9至核苷酸34；x.SEQ ID NO:9的核苷酸10至核苷酸34；y.SEQID NO:9的核苷酸11至核苷酸34；z.SEQ ID NO:9的核苷酸12至核苷酸34；或aa.SEQ ID NO:10或其一部分。

在该组合物的另一方面，同向重复序列包含：a.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQ IDNO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；或o.与SEQ ID NO:317的序列或其一部分具有至少90％同一性的序列。

在该组合物的另一方面，同向重复序列包含：a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36；b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36；c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36；d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36；e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36；f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36；g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36；h.SEQ IDNO:299-316中任一个的核苷酸8至核苷酸36；i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36；j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36；k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36；l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36；m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36；n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36；或o.SEQ ID NO:317或其一部分。

在该组合物的另一方面，同向重复序列包含：a.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸14至核苷酸36；或o.与SEQ IDNO:319或SEQ ID NO:320的序列或其一部分具有至少90％同一性的序列。

在该组合物的另一方面，同向重复序列包含：a.SEQ ID NO:318的核苷酸1至核苷酸36；b.SEQ ID NO:318的核苷酸2至核苷酸36；c.SEQ ID NO:318的核苷酸3至核苷酸36；d.SEQ ID NO:318的核苷酸4至核苷酸36；e.SEQ ID NO:318的核苷酸5至核苷酸36；f.SEQID NO:318的核苷酸6至核苷酸36；g.SEQ ID NO:318的核苷酸7至核苷酸36；h.SEQ ID NO:318的核苷酸8至核苷酸36；i.SEQ ID NO:318的核苷酸9至核苷酸36；j.SEQ ID NO:318的核苷酸10至核苷酸36；k.SEQ ID NO:318的核苷酸11至核苷酸36；l.SEQ ID NO:318的核苷酸12至核苷酸36；m.SEQ ID NO:318的核苷酸13至核苷酸36；n.SEQ ID NO:318的核苷酸14至核苷酸36；或o.SEQ ID NO:319或SEQ ID NO:320或其一部分。

在该组合物的另一方面，同向重复序列包含：a.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:321或SEQID NO:322的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ IDNO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:321或SEQ IDNO:322的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；o.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸15至核苷酸36；或p.与SEQ IDNO:323的序列或其一部分具有至少90％同一性的序列。

在该组合物的另一方面，同向重复序列包含：a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36；b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36；c.SEQID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36；d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36；e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36；f.SEQ IDNO:321或SEQ ID NO:322的核苷酸6至核苷酸36；g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36；h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36；i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36；j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36；k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36；l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36；m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36；n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36；o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36；或p.SEQ ID NO:323或其一部分。

在组合物的另一方面，间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。

在组合物的另一方面，PAM包含序列：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。

在组合物的另一方面，靶序列紧邻PAM序列。

在组合物的另一方面，组合物还包含Cas12i多肽。

在组合物的另一方面，Cas12i多肽是：a.Cas12i2多肽，其包含与SEQ ID NO:276、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的序列具有至少90％同一性的序列；b.Cas12i4多肽，其包含与SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列具有至少90％同一性的序列；c.Cas12i1多肽，其包含与SEQ ID NO:297的序列具有至少90％同一性的序列；或d.Cas12i3多肽，其包含与SEQ ID NO:298的序列具有至少90％同一性的序列。

在组合物的另一方面，Cas12i多肽是：a.Cas12i2多肽，其包含SEQ ID NO:276、SEQID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的序列；b.Cas12i4多肽，其包含SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列；c.Cas12i1多肽，其包含SEQ ID NO:297的序列；或d.Cas12i3多肽，其包含SEQ ID NO:298的序列。

在组合物的另一方面，RNA指导物和Cas12i多肽形成核糖核蛋白复合物。

在组合物的另一方面，核糖核蛋白复合物结合靶核酸。

在组合物的另一方面，组合物存在于细胞内。

在组合物的另一方面，RNA指导物和Cas12i多肽被编码在载体(例如，表达载体)中。在组合物的另一方面，RNA指导物和Cas12i多肽被编码在单一载体中，或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。

本发明还提供了一种载体系统，该载体系统包含一个或多个编码本文披露的RNA指导物和Cas12i多肽的载体。在实施例中，载体系统包含编码本文披露的RNA指导物的第一载体以及编码Cas12i多肽的第二载体。载体可以是表达载体。

本发明进一步提供包含RNA指导物和Cas12i多肽的组合物，其中所述RNA指导物包含(i)与PDCD1基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列。

在该组合物的另一方面，同向重复序列包含：a.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQ IDNO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；o.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸1至核苷酸34；p.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸2至核苷酸34；q.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸3至核苷酸34；r.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸4至核苷酸34；s.与SEQID NO:9的序列具有至少90％同一性的序列的核苷酸5至核苷酸34；t.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸6至核苷酸34；u.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸7至核苷酸34；v.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸8至核苷酸34；w.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸9至核苷酸34；x.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸10至核苷酸34；y.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸11至核苷酸34；z.与SEQID NO:9的序列具有至少90％同一性的序列的核苷酸12至核苷酸34；或aa.与SEQ ID NO:10的序列或其一部分具有至少90％同一性的序列。

在组合物的另一方面，该靶序列与包含序列5′-NTTN-3′的原型间隔子相邻基序(PAM)相邻。

在组合物的另一方面，靶序列紧邻PAM序列。

在组合物的另一方面，靶序列在PAM序列的1、2、3、4或5个核苷酸内。

在组合物的另一方面，核糖核蛋白复合物结合靶核酸。

在组合物的另一方面，组合物存在于细胞内。

在组合物的另一方面，RNA指导物不由以下序列组成：AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGGUCGGCG(SEQ ID NO:283)；AGAAAUCCGUCUUUCAUUGACGGCCCGAGGACCGCAGCCAGCC(SEQ ID NO:284)；AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285)；或AGAAAUCCGUCUUUCAUUGAC GGCACAUGAGCGUGGUCAGGGC(SEQ ID NO:286)。

本发明还进一步提供了一种RNA指导物，其包含(i)基本上与PDCD1基因内的靶序列互补的间隔子序列和(ii)同向重复序列。

在RNA指导物的一方面，靶序列在PDCD1基因的外显子1、外显子2、外显子3或外显子4内。

在RNA指导物的另一方面，PDCD1基因包含SEQ ID NO:277的序列、SEQ ID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。

在RNA指导物的另一方面，间隔子序列包含：a.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸16；b.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸17；c.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸18；d.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸19；e.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸20；f.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸21；g.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸22；h.与SEQID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸23；i.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸24；j.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸25；k.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸26；l.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸27；m.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸28；n.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸29；或o.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸30。

在RNA指导物的另一方面，间隔子序列包含：a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16；b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17；c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18；d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19；e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20；f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21；g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22；h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23；i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24；j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25；k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26；l.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27；m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28；n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29；或o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。

在RNA指导物的另一方面，同向重复序列包含：a.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；o.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸1至核苷酸34；p.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸2至核苷酸34；q.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸3至核苷酸34；r.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸4至核苷酸34；s.与SEQID NO:9的序列具有至少90％同一性的序列的核苷酸5至核苷酸34；t.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸6至核苷酸34；u.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸7至核苷酸34；v.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸8至核苷酸34；w.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸9至核苷酸34；x.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸10至核苷酸34；y.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸11至核苷酸34；z.与SEQID NO:9的序列具有至少90％同一性的序列的核苷酸12至核苷酸34；或aa.与SEQ ID NO:10的序列或其一部分具有至少90％同一性的序列。

在RNA指导物的另一方面，同向重复序列包含：a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36；b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36；c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36；d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36；e.SEQ IDNO:1-8中任一个的核苷酸5至核苷酸36；f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36；g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36；h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36；i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36；j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36；k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36；l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36；m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36；n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36；o.SEQ ID NO:9的核苷酸1至核苷酸34；p.SEQ ID NO:9的核苷酸2至核苷酸34；q.SEQ ID NO:9的核苷酸3至核苷酸34；r.SEQ IDNO:9的核苷酸4至核苷酸34；s.SEQ ID NO:9的核苷酸5至核苷酸34；t.SEQ ID NO:9的核苷酸6至核苷酸34；u.SEQ ID NO:9的核苷酸7至核苷酸34；v.SEQ ID NO:9的核苷酸8至核苷酸34；w.SEQ ID NO:9的核苷酸9至核苷酸34；x.SEQ ID NO:9的核苷酸10至核苷酸34；y.SEQID NO:9的核苷酸11至核苷酸34；z.SEQ ID NO:9的核苷酸12至核苷酸34；或aa.SEQ ID NO:10或其一部分。

在RNA指导物的另一方面，同向重复序列包含：a.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ IDNO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；或o.与SEQ ID NO:317的序列或其一部分具有至少90％同一性的序列。

在RNA指导物的另一方面，同向重复序列包含：a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36；b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36；c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36；d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36；e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36；f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36；g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36；h.SEQ IDNO:299-316中任一个的核苷酸8至核苷酸36；i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36；j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36；k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36；l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36；m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36；n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36；或o.SEQ ID NO:317或其一部分。

在RNA指导物的另一方面，同向重复序列包含：a.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸14至核苷酸36；或o.与SEQID NO:319或SEQ ID NO:320的序列或其一部分具有至少90％同一性的序列。

在RNA指导物的另一方面，同向重复序列包含：a.SEQ ID NO:318的核苷酸1至核苷酸36；b.SEQ ID NO:318的核苷酸2至核苷酸36；c.SEQ ID NO:318的核苷酸3至核苷酸36；d.SEQ ID NO:318的核苷酸4至核苷酸36；e.SEQ ID NO:318的核苷酸5至核苷酸36；f.SEQID NO:318的核苷酸6至核苷酸36；g.SEQ ID NO:318的核苷酸7至核苷酸36；h.SEQ ID NO:318的核苷酸8至核苷酸36；i.SEQ ID NO:318的核苷酸9至核苷酸36；j.SEQ ID NO:318的核苷酸10至核苷酸36；k.SEQ ID NO:318的核苷酸11至核苷酸36；l.SEQ ID NO:318的核苷酸12至核苷酸36；m.SEQ ID NO:318的核苷酸13至核苷酸36；n.SEQ ID NO:318的核苷酸14至核苷酸36；或o.SEQ ID NO:319或SEQ ID NO:320或其一部分。

在RNA指导物的另一方面，同向重复序列包含：a.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；b.与SEQ ID NO:321或SEQID NO:322的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；c.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；d.与SEQ IDNO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；e.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；f.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；g.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；h.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；i.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；j.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；k.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；l.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；m.与SEQ IDNO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；n.与SEQ ID NO:321或SEQ IDNO:322的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；o.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸15至核苷酸36；或p.与SEQ IDNO:323的序列或其一部分具有至少90％同一性的序列。

在RNA指导物的另一方面，同向重复序列包含：a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36；b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36；c.SEQID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36；d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36；e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36；f.SEQ IDNO:321或SEQ ID NO:322的核苷酸6至核苷酸36；g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36；h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36；i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36；j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36；k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36；l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36；m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36；n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36；o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36；或p.SEQ ID NO:323或其一部分。

在RNA指导物的另一方面，间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。

在RNA指导物的另一方面，靶序列与包含序列5'-NTTN-3′的原型间隔子相邻基序(PAM)相邻，其中N是任何核苷酸。

在RNA指导物的另一方面，RNA指导物不由以下序列组成：AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGGUCGGCG(SEQ ID NO:283)；AGAAAUCCGUCUUUCAUUGACGGCCCGAGGACCGCAGCCAGCC(SEQ ID NO:284)；AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285)；或AGAAAUCCGUCUUUCAUUGAC GGCACAUGAGCGUGGUCAGGGC(SEQ IDNO:286)。

在RNA指导物的另一方面，PAM包含序列：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。

在RNA指导物的另一方面，靶序列紧邻PAM序列。

在RNA指导物的另一方面，靶序列在PAM序列的1、2、3、4或5个核苷酸内。

本发明还进一步提供了编码如本文所述的RNA指导物的核酸。

本发明还进一步提供了包含本文所述的此类RNA指导物的载体。

本发明还进一步提供了包含如本文所述的组合物、RNA指导物、核酸或载体的细胞。

在细胞的一个方面，细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞或T细胞。

本发明还进一步提供了包含如本文所述的组合物、RNA指导物、核酸或载体的试剂盒。

本发明还进一步提供了一种编辑PDCD1序列的方法，该方法包括使PDCD1序列与本文所述的组合物或RNA指导物接触。在实施例中，该方法在体外进行。在实施例中，该方法离体进行。

在该方法的一方面，PDCD1序列在细胞中。

在该方法的一方面，组合物或RNA指导物诱导PDCD1序列的缺失。

在该方法的一方面，缺失与5′-NTTN-3'序列相邻，其中N是任何核苷酸。

在该方法的一方面，缺失是在5′-NTTN-3'序列的下游。

在该方法的一方面，缺失长度多达约40个核苷酸。

在该方法的一方面，缺失长度为约4个核苷酸至40个核苷酸。

在该方法的一方面，缺失长度为约4个核苷酸至25个核苷酸。

在该方法的一方面，缺失长度为约10个核苷酸至25个核苷酸。

在该方法的一方面，缺失长度为约10个核苷酸至15个核苷酸。

在该方法的一方面，缺失在5′-NTTN-3′序列的约5个核苷酸至约15个核苷酸内开始。

在该方法的一方面，缺失在5′-NTTN-3'序列的约5个核苷酸至约10个核苷酸内开始。

在该方法的一方面，缺失在5'-NTTN-3'序列的约10个核苷酸至约15个核苷酸内开始。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约5个核苷酸至约15个核苷酸内开始。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约5个核苷酸至约10个核苷酸内开始。

在该方法的一方面，缺失在5'-NTTN-3′序列的下游约10个核苷酸至约15个核苷酸内开始。

在该方法的一方面，缺失在5′-NTTN-3'序列的约20个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5'-NTTN-3′序列的约20个核苷酸至约25个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的约25个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约20个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约20个核苷酸至约25个核苷酸内结束。

在该方法的一方面，缺失在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5'-NTTN-3′序列的下游约5个核苷酸至约15个核苷酸内开始，并且在5′-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5'-NTTN-3′序列的下游约5个核苷酸至约15个核苷酸内开始，并且在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约5个核苷酸至约15个核苷酸内开始，并且在5′-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约5个核苷酸至约10个核苷酸内开始，并且在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约5个核苷酸至约10个核苷酸内开始，并且在5′-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约5个核苷酸至约10个核苷酸内开始，并且在5′-NTTN-3′序列的下游约25个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约10个核苷酸至约15个核苷酸内开始，并且在5′-NTTN-3′序列的下游约20个核苷酸至约30个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约10个核苷酸至约15个核苷酸内开始，并且在5′-NTTN-3′序列的下游约20个核苷酸至约25个核苷酸内结束。

在该方法的一方面，缺失在5′-NTTN-3′序列的下游约10个核苷酸至约15个核苷酸内开始，并且在5′-NTTN-3′序列的下游约25个核苷酸至约30个核苷酸内结束。

在该方法的一方面，5′-NTTN-3'序列是5′-CTTT-3′、5'-CTTC-3'、5'-GTTT-3′、5′-GTTC-3′、5′-TTTC-3′、5′-GTTA-3′或5′-GTTG-3′。

在该方法的一方面，缺失与基因中的突变重叠。

在该方法的一方面，缺失与基因中的插入重叠。

在该方法的一方面，缺失去除了基因或其一部分的重复扩展。

在该方法的一方面，缺失破坏了基因的一个或两个等位基因。

在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面，RNA指导物不由以下序列组成：AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGGUCGGCG(SEQ ID NO:283)；AGAAAUCCGUCUUUCAUUGACGG CCCGAGGACCGCAGCCAGCC(SEQ ID NO:284)；AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285)；或AGAAAUCCGUCUUUCAUUGACGGCACAUGAGCGUGGUCAGGGC(SEQ ID NO:286)。

在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面，RNA指导物包含SEQ ID NO:324-330中任一个的序列。

定义

本发明将相对于具体实施例来说明，但本发明并不受限于此而只受权利要求限制。除非另有说明，否则下文阐述的术语通常应以其常见意义来理解。

如本文所用，术语“活性”是指生物活性。在一些实施例中，活性包括酶活性，例如效应子的催化能力。例如，活性可以包括核酸酶活性。

如本文所用，术语“Cas12i多肽”(本文也称为Cas12i)是指与RNA指导物指定的靶核酸上的靶序列结合的多肽，其中该多肽与野生型Cas12i多肽具有至少一些氨基酸序列同源性。在一些实施例中，Cas12i多肽与美国专利号10,808,245的SEQ ID NO:1-5和11-18中任一个包含至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性，其通过引用整体并入本文。在一些实施例中，Cas12i多肽与美国专利号10,808,245的SEQ ID NO:3(Cas12i1)、SEQ ID NO:5(Cas12i2)、SEQ ID NO:14(Cas12i3)或SEQ ID NO:16(Cas12i4)(对应于本申请的SEQ ID NO:297、276、298和294)中任一个包含至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些实施例中，本披露的Cas12i多肽是如PCT/US 2021/025257中所述的Cas12i1多肽或Cas12i2多肽。在一些实施例中，Cas12i多肽切割靶核酸(例如，作为切口或双链断裂)。

如本文所用，术语“复合物”是指两个或更多个分子的群化。在一些实施例中，复合物包含彼此相互作用(例如，结合、接触、粘附)的多肽和核酸分子。如本文所用，术语“复合物”可以指RNA指导物和多肽(例如，Cas12i多肽)的组化。如本文所用，术语“复合物”可指RNA指导物、多肽和靶序列的组化。如本文所用，术语“复合物”可以指靶向PDCD1的RNA指导物和Cas12i多肽的组化。

如本文所用，术语“原型间隔子相邻基序”或“PAM”是指与靶序列(例如，PDCD1靶序列)相邻的DNA序列，包含RNA指导物(例如，靶向PDCD1的RNA指导物)和Cas12i多肽的复合物与该靶序列结合。在双链靶标的情况下，RNA指导物结合靶标的第一链(例如，靶链或间隔子互补链)，并且如本文所述的PAM序列存在于第二互补链中(例如，非靶链或非间隔子互补链)。如本文所用，术语“相邻”包括其中包含RNA指导物和Cas12i多肽的复合物的RNA指导物与紧邻PAM的靶序列特异性结合、相互作用或缔合的情况。在此类情况下，在靶序列与PAM之间没有核苷酸。术语“相邻”还包括在与RNA指导物结合的靶序列与PAM之间存在少数(例如，1、2、3、4或5个)核苷酸的情况。在一些实施例中，如本文所述的PAM序列存在于非靶链(例如，非间隔子互补链)中。术语“相邻”包括本文所述的PAM序列，其与非靶链中的序列直接相邻(或在非靶链中的序列的少量，例如1、2、3、4或5个核苷酸内)。

如本文所用，术语“PDCD1”是指“程序性细胞死亡蛋白1”。PDCD1，也称为PD-1和CD279，是细胞表面蛋白，其下调免疫系统对身体细胞的反应，并通过抑制T细胞炎症活性来促进自我耐受。如本文所阐述的SEQ ID NO:277提供了PDCD1基因序列的实例。应当理解，本文所述的间隔子序列可以靶向SEQ ID NO:277或其反向互补序列，这取决于它们是如表5中所列的“+”还是“-”所示。表5和表6中列出的靶序列位于PDCD1基因的非靶链上。

如本文所用，术语“RNA指导物”是指促进本文所述的多肽(例如，Cas12i多肽)靶向靶序列(例如，PDCD1基因的序列)的任何RNA分子。RNA指导物可以被设计成包括与特定的核酸序列(例如，PDCD1核酸序列)互补的序列的分子。RNA指导物可以包含靶向DNA的序列(即，间隔子序列)和同向重复(DR)序列。术语“crRNA”在本文中也用于指RNA指导物。

在一些实施例中，间隔子序列与靶序列互补。如本文所用，术语“互补”是指第一核酸分子(例如RNA指导物)的核碱基与第二核酸分子(例如靶序列)的核碱基碱基配对的能力。两个互补的核酸分子能够在适当的温度和溶液离子强度条件下非共价结合。在一些实施例中，第一核酸分子(例如，RNA指导物的间隔子序列)包含与第二核酸(例如，靶序列)的100％互补性。在一些实施例中，如果第一核酸分子包含与第二核酸至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的互补性，则第一核酸分子(例如RNA指导物的间隔子序列)与第二核酸分子(例如靶序列)互补。如本文所用，术语“基本上互补”是指与靶序列具有一定水平互补性的多核苷酸(例如，RNA指导物的间隔子序列)。在一些实施例中，互补性水平使得多核苷酸可以以足够的亲和力与靶序列杂交，以允许与多核苷酸复合的效应多肽(例如，Cas12i)作用于(例如，切割)靶序列。在一些实施例中，与靶序列基本上互补的间隔子序列与靶序列具有小于100％的互补性。在一些实施例中，与靶序列基本上互补的间隔子序列与靶序列具有至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％互补性。在一些实施例中，具有与靶序列基本互补的间隔子序列的RNA指导物与靶序列具有100％互补性。

如本文所用，术语“靶标”和“靶序列”是指RNA指导物特异性结合的核酸序列。在一些实施例中，RNA指导物的DNA靶向序列(例如，间隔子)结合靶序列。在双链靶标的情况下，RNA指导物结合靶标的第一链(即，靶链或间隔子互补链)，并且如本文所述的PAM序列存在于第二互补链中(即，非靶链或非间隔子互补链)。在一些实施例中，靶链(即，间隔子互补链)包含5'-NAAN-3′序列。在一些实施例中，靶序列是PDCD1基因序列内的序列，包括但不限于SEQ ID NO:277或其反向互补序列。

如本文所用，术语“上游”和“下游”是指核酸分子中单个核酸(例如，DNA)序列内的相对位置。“上游”和“下游”分别涉及发生RNA转录的5′至3'方向。当第一序列的3′端出现在第二序列的5'端之前时，第一序列在第二序列的上游。当第一序列的5'端出现在第二序列的3'端之后时，第一序列在第二序列的下游。在一些实施例中，5′-NTTN-3′序列在本文所述的插入缺失的上游，并且Cas12i诱导的插入缺失在5′-NTTN-3′序列的下游。

附图说明

图1显示了SEQ ID NO:287的变体Cas12i2和几个靶向PDCD1的单独RNA指导物在不同浓度在HEK293T细胞中的插入缺失活性。

图2显示了SEQ ID NO:288的变体Cas12i2和几个靶向PDCD1的单独RNA指导物在不同浓度在原代T细胞中的插入缺失活性。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。

图3显示了在原代T细胞中引入不同浓度的靶向PDCD1的变体Cas12i2 RNP后七天的细胞活力(经由DAPI染色)。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。

具体实施方式

本披露涉及能够结合PDCD1的RNA指导物及其使用方法。在一些方面，本文描述了一种包含具有一个或多个特性的RNA指导物的组合物。在一些方面，描述了产生RNA指导物的方法。在一些方面，描述了一种递送包含RNA指导物的组合物的方法。

组合物

在一些方面，本文所述的发明包括包含靶向PDCD1的RNA指导物的组合物。在一些实施例中，RNA指导物由同向重复组分和间隔子组分组成。在一些实施例中，RNA指导物与Cas12i多肽结合。在一些实施例中，间隔子组分与PDCD1靶序列基本上互补，其中PDCD1靶序列与本文所述的5′-NTTN-3′PAM序列相邻。在双链靶标的情况下，RNA指导物结合靶标的第一链(即，靶链或间隔子互补链)，并且如本文所述的PAM序列存在于第二互补链中(即，非靶链或非间隔子互补链)。

在一些实施例中，本文所述的发明包含含有复合物的组合物，其中该复合物包含靶向PDCD1的RNA指导物。在一些实施例中，本发明包含一种复合物，该复合物包含RNA指导物和Cas12i多肽。在一些实施例中，RNA指导物和Cas12i多肽以约1:1的摩尔比彼此结合。在一些实施例中，包含RNA指导物和Cas12i多肽的复合物与PDCD1靶序列结合。在一些实施例中，包含靶向PDCD1的RNA指导物和Cas12i多肽的复合物与PDCD1靶序列以约1:1的摩尔比结合。在一些实施例中，复合物包含可以切割PDCD1靶序列的酶活性，如核酸酶活性。RNA指导物、Cas12i多肽、和PDCD1靶序列(无论是单独还是一起)不是天然存在的。

本文披露的组合物的使用具有优于其他已知的核酸酶系统的那些的优点。Cas12i多肽比其他核酸酶小。例如，Cas12i2的长度为1,054个氨基酸，而化脓性链球菌(S.pyogenes)Cas9(SpCas9)的长度为1,368个氨基酸，嗜热链球菌(S.thermophilus)Cas9(StCas9)的长度为1,128个氨基酸，FnCpf1的长度为1,300个氨基酸，AsCpf1的长度为1,307个氨基酸，并且LbCpf1的长度为1,246个氨基酸。不需要反式激活的CRISPR RNA(tracrRNA)的Cas12i RNA指导物也比Cas9 RNA指导物小。较小的Cas12i多肽和RNA指导物大小有利于递送。与包含SpCas9多肽的组合物相比，包含Cas12i多肽的组合物还表现出降低的脱靶活性。参见PCT/US 2021/025257，将该文献通过援引以其全文并入。此外，由包含Cas12i多肽的组合物诱导的插入缺失不同于由包含SpCas9多肽的组合物诱导的插入缺失。例如，SpCas9多肽主要诱导长度为1个核苷酸的插入和缺失。然而，Cas12i多肽诱导较大的缺失，这可有利于破坏基因(如PDCD1)的较大部分。

RNA指导物

在一些实施例中，本文所述的组合物包含靶向PDCD1基因或PDCD1基因的一部分的RNA指导物。在一些实施例中，本文所述的组合物包含两个或更多个(例如，2、3、4、5、6、7、8、9、或更多个)靶向PDCD1的RNA指导物。

RNA指导物可将本文所述的Cas12i多肽引导至PDCD1靶序列。两个或更多个RNA指导物可以将两个或更多个如本文所述的单独的Cas12i多肽(例如，具有相同或不同序列的Cas12i多肽)靶向至两个或更多个(例如，2、3、4、5、6、7、8、9、或更多个)PDCD1靶序列。

阅读以下特定种类的RNA指导物的实例的本领域技术人员将理解，在一些实施例中，RNA指导物具有PDCD1靶特异性。也就是说，在一些实施例中，RNA指导物与一个或多个PDCD1靶序列(例如，在细胞内)特异性结合，并且不与非靶向的序列(例如，相同细胞内的非特异性DNA或随机序列)结合。

在一些实施例中，RNA指导物包含间隔子序列、随后是同向重复序列，指的是从5'至3'方向的序列。在一些实施例中，RNA指导物包含第一同向重复序列、随后是间隔子序列、和第二同向重复序列，指的是从5′至3'方向的序列。在一些实施例中，这种RNA指导物的第一同向重复序列和第二同向重复序列相同。在一些实施例中，这种RNA指导物的第一同向重复序列和第二同向重复序列不同。

在一些实施例中，RNA指导物的间隔子序列和一个或多个同向重复序列存在于相同的RNA分子内。在一些实施例中，间隔子序列和同向重复序列彼此直接连接。在一些实施例中，在间隔子序列和同向重复序列之间存在短接头，例如长度为1、2、或3个核苷酸的RNA接头。在一些实施例中，RNA指导物的间隔子序列和一个或多个同向重复序列存在于单独的分子中，它们通过碱基配对相互作用彼此连接。

关于RNA指导物的示例性同向重复组分和间隔子组分的额外信息提供如下。

同向重复序列

在一些实施例中，RNA指导物包含同向重复序列。在一些实施例中，RNA指导物的同向重复序列的长度介于12-100、13-75、14-50、或15-40个核苷酸之间(例如，15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40个核苷酸)。

在一些实施例中，同向重复序列是或包含表1的序列或表1的序列的一部分。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸1至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸2至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸3至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸4至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸5至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸6至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸7至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸8至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸9至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸10至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸11至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸12至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸13至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸14至核苷酸36。同向重复序列可以包含SEQ ID NO:9的核苷酸1至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸2至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸3至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸4至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸5至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸6至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸7至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸8至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸9至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸10至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸11至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸12至核苷酸34。在一些实施例中，同向重复序列在SEQ ID NO:10中阐述。在一些实施例中，同向重复序列包含在SEQ ID NO:10中阐述的序列的一部分。

在一些实施例中，同向重复序列具有或包含序列，该序列与表1的序列或表1的序列的一部分包含至少90％的同一性(例如，至少90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％的同一性)。同向重复序列可以具有或包含序列，该序列与包含SEQ IDNO:1、2、3、4、5、6、7、或8中任一个的核苷酸1至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸2至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸3至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸4至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸5至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸6至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸7至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸8至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ IDNO:1、2、3、4、5、6、7、或8中任一个的核苷酸9至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸10至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸11至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸12至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸13至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸14至核苷酸36的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸1至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸2至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸3至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸4至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQID NO:9的核苷酸5至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸6至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸7至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸8至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸9至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸10至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸11至核苷酸34的序列具有至少90％的同一性。同向重复序列可以具有或包含序列，该序列与包含SEQ ID NO:9的核苷酸12至核苷酸34的序列具有至少90％的同一性。在一些实施例中，同向重复序列与SEQ ID NO:10具有至少90％的同一性(例如，至少90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％的同一性)。在一些实施例中，同向重复序列与在SEQ ID NO:10中阐述的序列的一部分具有至少90％的同一性。

在一些实施例中，包含Cas12i2多肽和RNA指导物的组合物能够将插入缺失引入PDCD1靶序列中，该RNA指导物包含SEQ ID NO:10的同向重复序列和20个核苷酸长度的间隔子。见，例如，实例1，其中插入缺失在瞬时转染RNA指导物和SEQ ID NO:287的Cas12i2多肽后在十一个PDCD1靶序列处测量，以及实例2，其中插入缺失在RNP递送RNA指导物和SEQ IDNO:288的Cas12i2多肽后在四个PDCD1靶序列处进行测量。

在一些实施例中，同向重复序列是或包含序列，该序列与SEQ ID NO:1-10中任一个的反向互补序列具有至少90％的同一性。在一些实施例中，同向重复序列是或包含SEQID NO:1-10中任一个的反向互补序列。

表1.同向重复序列

序列标识符	同向重复序列
		SEQ ID NO:1	GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:2	AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG
		SEQ ID NO:3	AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:4	CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
		SEQ ID NO:5	CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:6	GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
		SEQ ID NO:7	GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:8	GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG
		SEQ ID NO:9	GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG
SEQ ID NO:10	AGAAAUCCGUCUUUCAUUGACGG

在一些实施例中，同向重复序列是表2的序列或表2的序列的一部分。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸1至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸2至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸3至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸4至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸5至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸6至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸7至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸8至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸9至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸10至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸11至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸12至核苷酸36。同向重复序列可以包含SEQID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸13至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸14至核苷酸36。

在一些实施例中，同向重复序列与表2的序列或表2的序列的一部分具有至少95％的同一性(例如，至少95％、96％、97％、98％、或99％的同一性)。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸1至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸2至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸3至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸4至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸5至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸6至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸7至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸8至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸9至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸10至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸11至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸12至核苷酸36的序列具有至少95％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸13至核苷酸36的序列具有至少95％的同一性。

在一些实施例中，同向重复序列与表2的序列或表2的序列的一部分具有至少90％的同一性(例如，至少90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％的同一性)。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸1至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸2至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸3至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸4至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸5至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸6至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸7至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸8至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸9至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸10至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸11至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸12至核苷酸36的序列具有至少90％的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸13至核苷酸36的序列具有至少90％的同一性。

在一些实施例中，同向重复序列与SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的反向互补序列具有至少90％的同一性。在一些实施例中，同向重复序列与SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的反向互补序列具有至少95％的同一性。在一些实施例中，同向重复序列是SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的反向互补序列。

在一些实施例中，同向重复序列与SEQ ID NO:317或SEQ ID NO:317的一部分具有至少90％的同一性。在一些实施例中，同向重复序列与SEQ ID NO:317或SEQ ID NO:317的一部分具有至少95％的同一性。在一些实施例中，同向重复序列与SEQ ID NO:317或SEQ IDNO:317的一部分具有100％的同一性。

表2.Cas12i4同向重复序列。

在一些实施例中，同向重复序列是表3的序列或表3的序列的一部分。在一些实施例中，同向重复序列与表3的序列或表3的序列的一部分具有至少95％的同一性(例如，至少95％、96％、97％、98％、或99％的同一性)。在一些实施例中，同向重复序列与表3的序列或表3的序列的一部分具有至少90％的同一性(例如，至少90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％的同一性)。在一些实施例中，同向重复序列与SEQ ID NO:318-320中任一个的反向互补序列具有至少90％的同一性。在一些实施例中，同向重复序列与SEQID NO:318-320中任一个的反向互补序列具有至少95％的同一性。在一些实施例中，同向重复序列是SEQ ID NO:318-320中任一个的反向互补序列。

表3.Cas12i1同向重复序列。

序列标识符	同向重复序列
		SEQ ID NO:318	GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC
SEQ ID NO:319	AAUUUUUGUGCCCAUCGUUGGCAC
		SEQ ID NO:320	AUUUUUGUGCCCAUCGUUGGCAC

在一些实施例中，同向重复序列是表4的序列或表4的序列的一部分。在一些实施例中，同向重复序列与表4的序列或表4的序列的一部分具有至少95％的同一性(例如，至少95％、96％、97％、98％、或99％的同一性)。在一些实施例中，同向重复序列与表4的序列或表4的序列的一部分具有至少90％的同一性(例如，至少90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％的同一性)。在一些实施例中，同向重复序列与SEQ ID NO:321-323中任一个的反向互补序列具有至少90％的同一性。在一些实施例中，同向重复序列与SEQID NO:321-323中任一个的反向互补序列具有至少95％的同一性。在一些实施例中，同向重复序列是SEQ ID NO:321-323中任一个的反向互补序列。

表4.Cas12i3同向重复序列。

序列标识符	同向重复序列
		SEQ ID NO:321	CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU
SEQ ID NO:322	CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG
		SEQ ID NO:323	AUAGUGUGUCCUUAGUUGACAU

在一些实施例中，本文所述的同向重复序列包含尿嘧啶(U)。在一些实施例中，本文所述的同向重复序列包含胸腺嘧啶(T)。在一些实施例中，根据表1-4的同向重复序列包含这样的序列，该序列在表1-4中指示为尿嘧啶的一个或多个位置中包含胸腺嘧啶。

间隔子

在一些实施例中，RNA指导物包含靶向DNA的间隔子序列。在一些实施例中，RNA指导物的间隔子序列的长度介于12-100、13-75、14-50、或15-30个核苷酸之间(例如，15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸)并且与特定靶序列互补。在一些实施例中，间隔子序列被设计为与例如基因组基因座的特定DNA链互补。

在一些实施例中，RNA指导物间隔子序列与靶序列的互补链基本上相同。在一些实施例中，RNA指导物包含与参考核酸序列(例如靶序列)的互补链具有至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、或至少约99.5％序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如，BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。

在一些实施例中，RNA指导物包含间隔子序列，该间隔子序列的长度介于12-100、13-75、14-50、或15-30个核苷酸之间(例如，15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸)，并且该间隔子序列与靶序列具有至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％的互补性。在一些实施例中，RNA指导物包含与靶DNA序列至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％互补的序列。在一些实施例中，RNA指导物包含与靶基因组序列至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％互补的序列。在一些实施例中，RNA指导物包含长度为至多50并且与靶序列至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％互补的序列(例如，RNA序列)。在一些实施例中，RNA指导物包含与靶DNA序列至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％互补的序列。在一些实施例中，RNA指导物包含与靶基因组序列至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％互补的序列。

在一些实施例中，间隔子序列是或包含表5的序列或表5的序列的一部分。表5和表6中列出的靶序列位于PDCD1序列的非靶链上。应当理解，SEQ ID NO:143-274的指示应被认为等同于以下的列表：SEQ ID NO:143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273和274。

间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27。间隔子序列可以包含SEQID NO:143-255和258-274中任一个的核苷酸1至核苷酸28。间隔子序列可以包含SEQ IDNO:143-255和258-274中任一个的核苷酸1至核苷酸29。间隔子序列可以包含SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。

在一些实施例中，间隔子序列具有或包含序列，该序列与表5的序列或表5的序列的一部分具有至少90％的同一性(例如，至少90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％的同一性)。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29的序列具有至少90％的同一性。间隔子序列可以具有或包含序列，该序列与包含SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30的序列具有至少90％的同一性。

表5.PDCD1靶序列和间隔子序列

本发明包括与本文披露内容一致的、以上列出的同向重复序列和间隔子的所有组合。在一些实施例中，RNA指导物不由以下序列组成：AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGGUCGGCG(SEQ ID NO:283)；AGAAAUCCGUCUUUCAUUGACGG CCCGAGGACCGCAGCCAGCC(SEQID NO:284)；AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285)；或AGAAAUCCGUCUUUCAUUGACGG CACAUGAGCGUGGUCAGGGC(SEQ ID NO:286)。

在一些实施例中，本文所述的间隔子序列包含尿嘧啶(U)。在一些实施例中，本文所述的间隔子序列包含胸腺嘧啶(T)。在一些实施例中，根据表5的间隔子序列包含这样的序列，该序列在表5中指示为尿嘧啶的一个或多个位置中包含胸腺嘧啶。

修饰

RNA指导物可以包括相对于参考序列、特别是亲本多核糖核苷酸的一个或多个共价修饰，该一个或多个共价修饰包括在本发明的范围内。

示例性修饰可以包括对糖、核碱基、核苷间键(例如，对连接性磷酸盐/磷酸二酯键/磷酸二酯主链)以及任何组合的任何修饰。下面详细描述了本文提供的一些示例性修饰。

RNA指导物可以包括如对糖、核碱基、或核苷间键(例如，对连接性磷酸酯/对磷酸二酯键/对磷酸二酯主链)的任何有用的修饰。嘧啶核碱基的一个或多个原子可被任选取代的氨基、任选取代的硫醇、任选取代的烷基(例如，甲基或乙基)或卤基(例如，氯或氟)替代或取代。在某些实施例中，修饰(例如，一个或多个修饰)存在于糖和核苷间键的每一者中。修饰可以是对核糖核酸(RNA)到脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA)或它们的杂交体的修饰。本文描述了另外的修饰。

在一些实施例中，修饰可包括化学或细胞诱导的修饰。例如，细胞内RNA修饰的一些非限制性实例由Lewis和Pan在“RNA modifications and structures cooperate toguide RNA-protein interactions[RNA修饰和结构协作指导RNA-蛋白质相互作用]”,NatReviews Mol Cell Biol[自然评论：分子细胞生物学],2017,18:202-210中所描述。

不同的糖修饰、核苷酸修饰和/或核苷间键(例如，主链结构)可存在于序列中的不同位置处。本领域普通技术人员将理解，核苷酸类似物或其他修饰可位于序列的任何位置处，使得序列的功能基本上不降低。序列可包括约1％至约100％的经修饰的核苷酸(相对于总核苷酸含量，或相对于一种或多种类型的核苷酸，即A、G、U或C中的任一种或多种)或任何插入百分比(例如，1％至20％、1％至25％、1％至50％、1％至60％、1％至70％、1％至80％、1％至90％、1％至95％、10％至20％、10％至25％、10％至50％、10％至60％、10％至70％、10％至80％、10％至90％、10％至95％、10％至100％、20％至25％、20％至50％、20％至60％、20％至70％、20％至80％、20％至90％、20％至95％、20％至100％、50％至60％、50％至70％、50％至80％、50％至90％、50％至95％、50％至100％、70％至80％、70％至90％、70％至95％、70％至100％、80％至90％、80％至95％、80％至100％、90％至95％、90％至100％和95％至100％)。

在一些实施例中，糖修饰(例如，2′位置或4'位置处)或序列的一个或多个核糖核苷酸处的糖替代以及主链修饰可包括磷酸二酯键的修饰或替代。序列的特定实例包括但不限于包括经修饰的主链或非天然核苷间键(例如核苷间修饰，包括磷酸二酯键的修饰或替代)的序列。具有经修饰的主链的序列尤其包括在主链中不具有磷原子的那些。出于本申请的目的，并且如本领域中有时提及的，在其核苷间主链中不具有磷原子的经修饰的RNA也可以被认为是寡核苷。在特定的实施例中，序列将包括在其核苷间主链中具有磷原子的核糖核苷酸。

经修饰的序列主链可包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(诸如3'-亚烷基膦酸酯和手性膦酸酯)、亚膦酸酯、氨基磷酸酯(诸如3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫羰氨基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和具有正常3′-5′连接的硼烷磷酸酯、这些酯的2′-5′连接的类似物，以及具有相反极性的那些，其中相邻的核苷单元对3′-5′连接至5'-3′或2'-5′连接至5′-2'。也包括各种盐、混合盐和游离酸形式。在一些实施例中，序列可带负电荷或带正电荷。

可掺入序列中的经修饰的核苷酸可以在核苷间键(例如，主链)上被修饰。在本文中，在多核苷酸主链的上下文中，短语“磷酸酯”和“磷酸二酯”可互换地使用。可以通过用不同的取代基替代一个或多个氧原子来修饰主链磷酸酯基团。此外，经修饰的核苷和核苷酸可以包括用如本文所述的另一核苷间键对未经修饰的磷酸酯部分进行整体替代。经修饰的磷酸酯基团的实例包括但不限于硫代磷酸酯、亚磷酸硒酸酯、硼酸磷酸酯(boranophosphate)、硼酸磷酸酯(boranophosphate ester)、氢膦酸酯、氨基磷酸酯、二氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫替代。也可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)替代连接氧来修饰磷酸酯接头。

提供α-硫代取代的磷酸酯部分以通过非天然硫代磷酸酯主链连接赋予RNA和DNA聚合物稳定性。硫代磷酸酯DNA和RNA具有增强的核酸酶抗性，并因此在细胞环境中具有更长的半衰期。

在特定的实施例中，经修饰的核苷包括α-硫代-核苷(例如5′-O-(1-硫代磷酸)-腺苷、5'-O-(1-硫代磷酸)-胞苷(a-硫代胞苷)、5'-O-(1-硫代磷酸)-鸟苷、5′-O-(1-硫代磷酸)-尿苷或5'-O-(1-硫代磷酸)-假尿苷)。

本文描述了可根据本发明使用的其他核苷间键，包括不含磷原子的核苷间键。

在一些实施例中，序列可包括一个或多个细胞毒性核苷。例如，可将细胞毒性核苷掺入序列中，诸如双功能修饰。细胞毒性核苷可包括但不限于阿糖腺苷、5-氮杂胞苷、4'-硫代阿糖胞苷、环戊烯基胞嘧啶、克拉屈滨、氯法拉滨、阿糖胞苷、胞嘧啶阿拉伯糖苷、1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)-胞嘧啶、地西他滨、5-氟尿嘧啶、氟达拉滨、氟尿苷、吉西他滨、替加氟和尿嘧啶的组合、替加氟((RS)-5-氟-1-(四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他滨、替扎西他滨、2′-脱氧-2′-亚甲基胞苷(DMDC)和6-巯基嘌呤。其他实例包括氟达拉滨磷酸酯、N4-山嵛酰基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-棕榈酰基-1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5′-反油酸酯)。

在一些实施例中，序列包括一个或多个转录后修饰(例如，加帽、切割、聚腺苷酸化、剪接、聚A序列、甲基化、酰化、磷酸化、赖氨酸和精氨酸残基的甲基化、乙酰化、以及硫醇基团和酪氨酸残基的亚硝基化等)。该一个或多个转录后修饰可以是任何转录后修饰，如已经在RNA中鉴定出的多于一百种不同的核苷修饰中的任一种(Rozenski,J,Crain,P,和McCloskey,J.(1999).The RNA Modification Database:1999update[RNA修饰数据库：1999年更新].Nucl Acids Res[核酸研究]27:196-197)。在一些实施例中，第一分离的核酸包含信使RNA(mRNA)。在一些实施例中，mRNA包含至少一种选自下组的核苷，该组由以下组成：吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些实施例中，mRNA包含至少一种选自下组的核苷，该组由以下组成：5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟基甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮-假异胞苷、1-甲基-1-去氮-假异胞苷、折布拉林(zebularine)、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。在一些实施例中，mRNA包含至少一种选自下组的核苷，该组由以下组成：2-氨基嘌呤、2,6-二氨基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮杂-腺嘌呤、7-去氮-2-氨基嘌呤、7-去氮-8-氮杂-2-氨基嘌呤、7-去氮-2,6-二氨基嘌呤、7-去氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲基硫代-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨甲酰基腺苷、N6-苏氨酰氨甲酰基腺苷、2-甲基硫代-N6-苏氨酰氨甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些实施例中，mRNA包含至少一种选自下组的核苷，该组由以下组成：肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-去氮-鸟苷、7-去氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮-鸟苷、6-硫代-7-去氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、和N2,N2-二甲基-6-硫代-鸟苷。

序列沿着分子的整个长度可以被或者可以不被均一地修饰。例如，一种或多种或所有类型的核苷酸(例如，天然存在的核苷酸嘌呤或嘧啶，或者A、G、U、C、I、pU中的任一种或多种或所有)可或可不在序列中或其给定的预定序列区域中被均匀修饰。在一些实施例中，序列包括假尿苷。在一些实施例中，序列包括肌苷，该肌苷可以帮助免疫系统将序列相对于病毒RNA表征为内源性。肌苷的掺入还可以介导改善的RNA稳定性/减少降解。参见例如，Yu,Z.等人(2015)RNA editing by ADAR1 marks dsRNA as“self”[ADAR1进行的RNA编辑将dsRNA标记为“自我”].Cell Res[细胞研究].25,1283-1284，将该文献通过援引以其全文并入。

Cas12i多肽

在一些实施例中，本发明的组合物包含如PCT/US 2019/022375中所述的Cas12i多肽。

在一些实施例中，本发明的组合物包括本文所述的Cas12i2多肽(例如，包含SEQID NO:276和/或由SEQ ID NO:275编码的多肽)。在一些实施例中，Cas12i2多肽包含至少一个RuvC结构域。

编码本文所述的Cas12i2多肽的核酸序列可以与参考核酸序列(例如SEQ ID NO:275)基本上相同。在一些实施例中，Cas12i2多肽由核酸编码，该核酸包含与参考核酸序列(例如，SEQ ID NO:275)具有至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、或至少约99.5％序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如，BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在温度和离子强度的严格条件下(例如，在中至高严格度的范围内)与另一核酸分子的互补序列杂交。参见例如，Tijssen,“Hybridization withNucleic Acid Probes.Part I.Theory and Nucleic Acid Preparation[与核酸探针杂交.第I部分.理论和核酸制备]”(Laboratory Techniques in Biochemistry andMolecular Biology[生物化学和分子生物学实验室技术]，第24卷)。

在一些实施例中，Cas12i2多肽由核酸序列编码，该核酸序列与参考核酸序列(例如，SEQ ID NO:275)具有至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、或更高的序列同一性，但不具有100％的序列同一性。

在一些实施例中，本发明的Cas12i2多肽包含与SEQ ID NO:276具有至少50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％同一性的多肽序列。

在一些实施例中，本发明描述了Cas12i2多肽，其与一个或多个参考多肽具有指定程度的氨基酸序列同一性，例如，与SEQ ID NO:276的氨基酸序列具有至少60％、至少65％、至少70％、至少75％、至少80％，至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或甚至至少99％但不是100％的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。

还提供了本发明的Cas12i2多肽，其具有酶活性(例如，核酸酶或内切核酸酶活性)，并且当使用任何先前描述的比对方法比对时，包含与SEQ ID NO:276的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。

在一些实施例中，Cas12i2多肽包含具有SEQ ID NO:287、SEQ ID NO:288、SEQ IDNO:289、SEQ ID NO:290、或SEQ ID NO:291的序列的多肽。

在一些实施例中，本发明的Cas12i2多肽包含与SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291具有至少50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％同一性的多肽序列。在一些实施例中，与SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291具有至少50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％同一性的Cas12i2多肽保持将该多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1、2、3个等)。

在一些实施例中，本发明描述了Cas12i2多肽，其与一个或多个参考多肽具有指定程度的氨基酸序列同一性，例如，与SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQID NO:290、或SEQ ID NO:291的氨基酸序列具有至少60％、至少65％、至少70％、至少75％、至少80％，至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或甚至至少99％但不是100％的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。

还提供了本发明的Cas12i2多肽，该Cas12i2多肽具有酶活性(例如，核酸酶或内切核酸酶活性)，并且当使用任何先前描述的比对方法比对时，包含与SEQ ID NO:287、SEQ IDNO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。

在一些实施例中，本发明的组合物包括本文所述的Cas12i4多肽(例如，包含SEQID NO:294和/或由SEQ ID NO:293编码的多肽)。在一些实施例中，Cas12i4多肽包含至少一个RuvC结构域。

编码本文所述的Cas12i4多肽的核酸序列可以与参考核酸序列(例如SEQ ID NO:293)基本上相同。在一些实施例中，Cas12i4多肽由核酸编码，该核酸包含与参考核酸序列(例如，SEQ ID NO:293)具有至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、或至少约99.5％序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如，BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在温度和离子强度的严格条件下(例如，在中至高严格度的范围内)与另一核酸分子的互补序列杂交。

在一些实施例中，Cas12i4多肽由核酸序列编码，该核酸序列与参考核酸序列(例如，SEQ ID NO:293)具有至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、或更高的序列同一性，但不具有100％的序列同一性。

在一些实施例中，本发明的Cas12i4多肽包含与SEQ ID NO:294具有至少50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％同一性的多肽序列。

在一些实施例中，本发明描述了Cas12i4多肽，其与一个或多个参考多肽具有指定程度的氨基酸序列同一性，例如，与SEQ ID NO:294的氨基酸序列具有至少60％、至少65％、至少70％、至少75％、至少80％，至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或甚至至少99％但不是100％的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。

还提供了本发明的Cas12i4多肽，其具有酶活性(例如，核酸酶或内切核酸酶活性)，并且当使用任何先前描述的比对方法比对时，包含与SEQ ID NO:294的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。

在一些实施例中，Cas12i4多肽包含具有SEQ ID NO:295或SEQ ID NO:296的序列的多肽。

在一些实施例中，本发明的Cas12i4多肽包含与SEQ ID NO:295或SEQ ID NO:296具有至少50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％同一性的多肽序列。在一些实施例中，与SEQ ID NO:295或SEQ ID NO:296具有至少50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％同一性的Cas12i4多肽保持将该多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1、2、3个等)。

在一些实施例中，本发明描述了Cas12i4多肽，该Cas12i4多肽与一个或多个参考多肽具有指定程度的氨基酸序列同一性，例如，与SEQ ID NO:295或SEQ ID NO:296的氨基酸序列具有至少60％、至少65％、至少70％、至少75％、至少80％，至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或甚至至少99％但不是100％的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。

还提供了本发明的Cas12i4多肽，其具有酶活性(例如，核酸酶或内切核酸酶活性)，并且当使用任何先前描述的比对方法比对时，包含与SEQ ID NO:295或SEQ ID NO:296的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。

在一些实施例中，本发明的组合物包括本文所述的Cas12i1多肽(例如，包含SEQID NO:297的多肽)。在一些实施例中，Cas12i4多肽包含至少一个RuvC结构域。

在一些实施例中，本发明的Cas12i1多肽包含与SEQ ID NO:297具有至少50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％同一性的多肽序列。

在一些实施例中，本发明描述了Cas12i1多肽，其与一个或多个参考多肽具有指定程度的氨基酸序列同一性，例如，与SEQ ID NO:297的氨基酸序列具有至少60％、至少65％、至少70％、至少75％、至少80％，至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或甚至至少99％但不是100％的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。

还提供了本发明的Cas12i1多肽，该Cas12i1多肽具有酶活性(例如，核酸酶或内切核酸酶活性)，并且当使用任何先前描述的比对方法比对时，包含与SEQ ID NO:297的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。

在一些实施例中，本发明的组合物包括本文所述的Cas12i3多肽(例如，包含SEQID NO:298的多肽)。在一些实施例中，Cas12i4多肽包含至少一个RuvC结构域。

在一些实施例中，本发明的Cas12i3多肽包含与SEQ ID NO:298具有至少50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％同一性的多肽序列。

在一些实施例中，本发明描述了Cas12i3多肽，其与一个或多个参考多肽具有指定程度的氨基酸序列同一性，例如，与SEQ ID NO:298的氨基酸序列具有至少60％、至少65％、至少70％、至少75％、至少80％，至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或甚至至少99％但不是100％的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。

还提供了本发明的Cas12i3多肽，其具有酶活性(例如，核酸酶或内切核酸酶活性)，并且当使用任何先前描述的比对方法比对时，包含与SEQ ID NO:298的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。

尽管本文所述的变化可以是一个或多个氨基酸的变化，但Cas12i多肽的变化也可以是实质性的，例如作为氨基和/或羧基末端延伸的多肽融合。例如，Cas12i多肽可以含有额外的肽，例如，一个或多个肽。另外的肽的实例可包括用于标记的表位肽，诸如多组氨酸标签(His标签)、Myc和FLAG。在一些实施例中，本文所述的Cas12i多肽可以融合到可检测部分，诸如荧光蛋白(例如，绿色荧光蛋白(GFP)或黄色荧光蛋白(YFP))。

在一些实施例中，Cas12i多肽包含至少一个(例如，两个、三个、四个、五个、六个或更多个)核定位信号(NLS)。在一些实施例中，Cas12i多肽包含至少一个(例如，两个、三个、四个、五个、六个或更多个)核输出信号(NES)。在一些实施例中，Cas12i多肽包含至少一个(例如，两个、三个、四个、五个、六个或更多)NLS和至少一个(例如，两个、三个、四个、五个、六个或更多个)NES。

在一些实施例中，本文所述的Cas12i多肽可以是自我灭活的。参见Epstein等人,“Engineering a Self-Inactivating CRISPR System for AAV Vectors[工程化用于AAV载体的自我灭活的CRISPR系统],”Mol.Ther.[分子疗法],24(2016):S50，将该文献通过援引以其全文并入。

在一些实施例中，编码本文所述的Cas12i多肽的核苷酸序列可以经密码子优化以用于特定的宿主细胞或生物。例如，核酸可以经密码子优化以用于任何非人真核生物，包括小鼠、大鼠、兔、狗、家畜或非人灵长类动物。密码子使用表是易于获得的，例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon Usage Database)”中，并且这些表可以按多种方式进行改编。参见Nakamura等人Nucl.Acids Res.[核酸研究]28:292(2000)，将其通过援引以其全文并入本文。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的，诸如基因制造(Gene Forge)(Aptagen公司；宾夕法尼亚州雅各布斯(Jacobus,PA))。

靶序列

在一些实施例中，靶序列在PDCD1基因或PDCD1基因的基因座内。在一些实施例中，PDCD1基因是哺乳动物基因。在一些实施例中，PDCD1基因是人类基因。例如，在一些实施例中，靶序列在SEQ ID NO:277或其反向互补序列内。在一些实施例中，靶序列在SEQ ID NO:277(或其反向互补序列)阐述的PDCD1基因的外显子内，例如，在SEQ ID NO:278、279、280、281、或282的序列(或其反向互补序列)内。表5列出了SEQ ID NO:277的PDCD1基因外显子内的靶序列(及其反向互补序列)。在一些实施例中，靶序列在SEQ ID NO:277(或其反向互补序列)阐述的PDCD1基因的内含子内。在一些实施例中，靶序列在SEQ ID NO:277阐述的PDCD1基因序列或其反向互补序列的变体(例如，多态性变体)内。在一些实施例中，PDCD1基因序列是在SEQ ID NO:277阐述的序列或其反向互补序列的同源物。例如，在一些实施例中，PDCD1基因序列是非人PDCD1序列。

在一些实施例中，靶序列与5′-NTTN-3'PAM序列相邻，其中N是任何核苷酸。5′-NTTN-3′序列可以紧邻靶序列，或者例如在靶序列的少量(例如，1、2、3、4、或5个)核苷酸内。在一些实施例中，5'-NTTN-3′序列是5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’，其中Y是C或T，B是除A之外的任何核苷酸，D是除C之外的任何核苷酸，并且R是A或G。在一些实施例中，5'-NTTN-3'序列是5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。

在一些实施例中，靶序列是单链的(例如，单链DNA)。在一些实施例中，靶序列是双链的(例如，双链DNA)。在一些实施例中，靶序列包含单链区和双链区两者。在一些实施例中，靶序列是线性的。在一些实施例中，靶序列是环状的。在一些实施例中，靶序列包含一个或多个经修饰的核苷酸，如甲基化的核苷酸、受损的核苷酸、或核苷酸类似物。在一些实施例中，靶序列未经修饰。在一些实施例中，RNA指导物与双链靶序列的第一链(例如，靶链或间隔子互补链)结合，并且5′-NTTN-3′PAM序列存在于第二互补链(例如，非靶链或非间隔子互补链)。在一些实施例中，RNA指导物在靶链(例如，间隔子互补链)上的5′-NAAN-3′序列附近结合。

在一些实施例中，靶序列存在于细胞中。在一些实施例中，靶序列存在于细胞核中。在一些实施例中，靶序列对细胞是内源的。在一些实施例中，靶序列是基因组DNA。在一些实施例中，靶序列是染色体DNA。在一些实施例中，靶序列是编码蛋白质的基因或其功能区如编码区、或调节元件，如启动子、增强子、5′或3′非翻译区等。在一些实施例中，靶序列是质粒。

在一些实施例中，靶序列存在于靶序列的易于接近的区域中。在一些实施例中，靶序列是靶基因的外显子。在一些实施例中，靶序列跨靶基因的外显子-内含子接点。在一些实施例中，靶序列存在于非编码区(如基因的调节区)中。在一些实施例中，其中靶序列对细胞是外源的，靶序列包含在细胞的基因组中未发现的序列。

在一些实施例中，靶序列对于细胞是外源的。在一些实施例中，靶序列是水平转移的质粒。在一些实施例中，靶序列整合在细胞的基因组中。在一些实施例中，靶序列不整合在细胞的基因组中。在一些实施例中，靶序列是细胞中的质粒。在一些实施例中，靶序列存在于染色体外阵列中。

在一些实施例中，靶序列是分离的核酸，诸如分离的DNA或分离的RNA。在一些实施例中，靶序列存在于无细胞环境中。在一些实施例中，靶序列是分离的载体，诸如质粒。在一些实施例中，靶序列是超纯质粒。

靶序列是与RNA指导物杂交的PDCD1基因的基因座。在一些实施例中，细胞仅具有靶序列的一个拷贝。在一些实施例中，细胞具有靶序列的多于一个拷贝，如至少约2、3、4、5、10、100或更多个拷贝中的任一个。

在一些实施例中，选择PDCD1靶序列以由Cas12i多肽和RNA指导物使用以下标准中的一项或多项进行编辑。首先，在一些实施例中，选择靠近PDCD1编码序列的5′端的靶序列。例如，在一些实施例中，RNA指导物被设计成靶向外显子1(SEQ ID NO:278)或外显子2(SEQID NO:279)中的序列。其次，在一些实施例中，选择与5′-CTTY-3′PAM序列相邻的靶序列。例如，在一些实施例中，RNA指导物被设计成靶向与5′-CTTT-3′或5′-CTTC-3′序列相邻的序列。第三，在一些实施例中，选择与其他基因组序列具有低序列相似性的靶序列。例如，对于每个靶序列，通过搜索与PAM序列相邻的其他基因组序列并计算靶序列与PAM相邻序列之间的莱文斯坦距离来鉴定潜在非靶位点。莱文斯坦距离(例如，编辑距离)对应于将一个序列改变为另一个序列(例如，将潜在非靶基因座的序列改变为在靶基因座的序列)所需的编辑(例如，插入、缺失或取代)的最小次数。按照此分析，RNA指导物是为靶序列设计的，这些靶序列不具有Levenshtein距离为0或1的潜在脱靶序列。

生产

本发明包括用于产生RNA指导物的方法、用于产生Cas12i多肽的方法以及用于复合RNA指导物和Cas12i多肽的方法。

RNA指导物

在一些实施例中，RNA指导物是通过DNA模板的体外转录制成的。因此，例如，在一些实施例中，通过使用上游启动子序列(例如，T7聚合酶启动子序列)在体外转录编码RNA指导物的DNA模板来产生RNA指导物。在一些实施例中，DNA模板编码多个RNA指导物，或者体外转录反应包括多个不同的DNA模板，每个DNA模板编码不同的RNA指导物。在一些实施例中，使用化学合成方法制备RNA指导物。在一些实施例中，通过在用包括编码RNA指导物的序列的质粒转染的细胞中表达RNA指导物序列来制备RNA指导物。在一些实施例中，质粒编码多个不同的RNA指导物。在一些实施例中，将各自编码不同的RNA指导物的多个不同的质粒转染到细胞中。在一些实施例中，从编码RNA指导物并且还编码Cas12i多肽的质粒表达该RNA指导物。在一些实施例中，从表达RNA指导物但不表达Cas12i多肽的质粒表达该RNA指导物。在一些实施例中，RNA指导物从商业供应商购买。在一些实施例中，使用一个或多个经修饰的核苷酸(例如，如上所述)合成RNA指导物。

Cas12i多肽

在一些实施例中，本发明的Cas12i多肽可以通过以下制备：(a)培养产生本发明的Cas12i多肽的细菌，分离该Cas12i多肽，任选地纯化该Cas12i多肽，并将该Cas12i多肽与RNA指导物复合。Cas12i多肽还可以通过(b)已知的基因工程技术来制备，具体地，通过以下过程制备：从细菌中分离编码本发明的Cas12i多肽的基因，构建重组表达载体，然后将该载体转移到表达RNA指导物的合适宿主细胞中以在宿主细胞中表达与RNA指导物复合的重组蛋白。替代性地，Cas12i多肽可以通过(c)体外偶联的转录-翻译系统然后与RNA指导物复合来制备。

在一些实施例中，宿主细胞用于表达Cas12i多肽。宿主细胞没有特别限制，并且可以优选地使用各种已知的细胞。宿主细胞的具体实例包括细菌，诸如大肠杆菌、酵母(芽殖酵母酿酒酵母(Saccharomyces cerevisiae)和裂殖酵母粟酒裂殖酵母(Schizosaccharomyces pombe))、线虫(秀丽隐杆线虫(Caenorhabditis elegans))、爪蟾(Xenopus laevis)卵母细胞和动物细胞(例如，CHO细胞、COS细胞和HEK293细胞)。用于将上述表达载体转移到宿主细胞中的方法(即转化法)没有特别限制，并且可以使用已知的方法，诸如电穿孔、磷酸钙法、脂质体法和DEAE葡聚糖法。

在用表达载体转化宿主后，可以培养、培育或繁殖宿主细胞以产生Cas12i多肽。在Cas12i多肽表达后，可以根据常规方法(例如，过滤、离心、细胞破坏、凝胶过滤色谱、离子交换色谱等)收集宿主细胞并从培养物中纯化Cas12i多肽等。

在一些实施例中，用于Cas12i多肽表达的方法包括翻译该Cas12i多肽的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸、或至少1000个氨基酸。在一些实施例中，用于蛋白质表达的方法包括翻译Cas12i多肽的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多。

多种方法可以用于确定宿主细胞中成熟Cas12i多肽的产生水平。此类方法包括但不限于例如利用对Cas12i多肽具有特异性的多克隆或单克隆抗体或如本文别处所述的标记标签的方法。示例性方法包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(MA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。这些和其他测定是本领域熟知的(参见例如Maddox等人,J.Exp.Med.[实验医学杂志]158:1211[1983])。

本披露内容提供了在细胞中体内表达Cas12i多肽的方法，这些方法包括向宿主细胞提供编码该Cas12i多肽的多核糖核苷酸(其中该多核糖核苷酸编码该Cas12i多肽)；在该细胞中表达该Cas12i多肽；以及从该细胞中获得该Cas12i多肽。

复合

在一些实施例中，靶向PDCD1的RNA指导物与Cas12i多肽复合以形成核糖核蛋白。在一些实施例中，RNA指导物和Cas12i多肽的复合发生在低于约以下中任一个的温度下：20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、或55℃。在一些实施例中，在约37C下在至少约以下中的任一个的孵育时间段内，RNA指导物不会从Cas12i多肽解离：10min、15min、20min、25min、30min、35min、40min、45min、50min、55min、1hr、2hr、3hr、4hr、或更多个小时。

在一些实施例中，RNA指导物和Cas12i多肽在复合缓冲液中复合。在一些实施例中，将Cas12i多肽储存在被复合缓冲液替代的缓冲液中以与RNA指导物形成复合物。在一些实施例中，将Cas12i多肽储存在复合缓冲液中。

在一些实施例中，复合缓冲液的pH范围为约7.3至8.6。在一个实施例中，复合缓冲液的pH为约7.3。在一个实施例中，复合缓冲液的pH为约7.4。在一个实施例中，复合缓冲液的pH为约7.5。在一个实施例中，复合缓冲液的pH为约7.6。在一个实施例中，复合缓冲液的pH为约7.7。在一个实施例中，复合缓冲液的pH为约7.8。在一个实施例中，复合缓冲液的pH为约7.9。在一个实施例中，复合缓冲液的pH为约8.0。在一个实施例中，复合缓冲液的pH为约8.1。在一个实施例中，复合缓冲液的pH为约8.2。在一个实施例中，复合缓冲液的pH为约8.3。在一个实施例中，复合缓冲液的pH为约8.4。在一个实施例中，复合缓冲液的pH为约8.5。在一个实施例中，复合缓冲液的pH为约8.6。

在一些实施例中，在如本文所述纯化之前，可以使Cas12i多肽在宿主细胞中过表达并与RNA指导物复合。在一些实施例中，编码Cas12i多肽的mRNA或DNA被引入细胞中，使得Cas12i多肽在细胞中表达。在一些实施例中，RNA指导物也从单个mRNA或DNA构建体同时、分别或依次引入细胞，使得核糖核蛋白复合物在细胞中形成。

递送

可将本文所述的组合物或复合物配制成例如包括载剂(诸如载剂和/或聚合物载剂，例如脂质体)，并且通过已知方法递送到细胞(例如，原核细胞、真核细胞、植物细胞、哺乳动物细胞等)。此类方法包括但不限于转染(例如，脂质介导、阳离子聚合物、磷酸钙、树枝状大分子)；电穿孔或其他破坏膜的方法(例如，核转染)、病毒递送(例如，慢病毒、逆转录病毒、腺病毒、AAV)、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光转染、原生质体融合、刺穿感染、磁转染、外来体介导的转移、脂质纳米颗粒介导的转移以及它们的任何组合。

在一些实施例中，该方法包括将一种或多种核酸(例如，编码Cas12i多肽、RNA指导物、供体DNA等的核酸)、其一种或多种转录物、和/或预形成的RNA指导物/Cas12i多肽复合物递送至细胞，在该细胞中形成三元复合物。示例性细胞内递送方法包括但不限于：病毒或病毒样药剂；基于化学的转染方法，诸如使用磷酸钙、树枝状大分子、脂质体或阳离子聚合物(例如，DEAE-葡聚糖或聚乙烯亚胺)的转染方法；非化学方法，诸如显微注射、电穿孔、细胞挤压、声孔效应、光转染、刺穿感染、原生质体融合、细菌缀合、质粒或转座子的递送；基于粒子的方法，诸如使用基因枪、磁转染或磁辅助转染、粒子轰击；以及混合方法，诸如核转染。在一些实施例中，本申请进一步提供了通过此类方法产生的细胞，以及包含此类细胞的或由此类细胞产生的生物体(例如，动物、植物或真菌)。

在一些实施例中，将Cas12i组分和RNA指导物组分一起递送。例如，在一些实施例中，将Cas12i组分和RNA指导物组分一起包装在单个AAV颗粒中。在另一个实例中，在一些实施例中，将Cas12i组分和RNA指导物组分经由脂质纳米颗粒(LNP)一起递送。在一些实施例中，将Cas12i组分和RNA指导物组分分开递送。例如，在一些实施例中，将Cas12i组分和RNA指导物组分包装在分开的AAV颗粒中。在另一个例子中，在一些实施例中，将Cas12i组分通过第一递送机制递送，并将RNA指导物组分通过第二递送机制递送。

细胞

可将本文所述的组合物或复合物递送到多种细胞。在一些实施例中，细胞是分离的细胞。在一些实施例中，细胞在细胞培养物中或在两种或更多种细胞类型的共培养物中。在一些实施例中，细胞是离体的。在一些实施例中，细胞获自活的生物并维持在细胞培养物中。在一些实施例中，细胞是单细胞生物体。

在一些实施例中，细胞是原核细胞。在一些实施例中，细胞是细菌细胞或来源于细菌细胞。在一些实施例中，细胞是古细菌细胞或来源于古细菌细胞。

在一些实施例中，细胞是真核细胞。在一些实施例中，细胞是植物细胞或来源于植物细胞。在一些实施例中，细胞是真菌细胞或来源于真菌细胞。在一些实施例中，细胞是动物细胞或来源于动物细胞。在一些实施例中，细胞是无脊椎动物细胞或来源于无脊椎动物细胞。在一些实施例中，细胞是脊椎动物细胞或来源于脊椎动物细胞。在一些实施例中，细胞是哺乳动物细胞或来源于哺乳动物细胞。在一些实施例中，细胞是人细胞。在一些实施例中，细胞是斑马鱼细胞。在一些实施例中，细胞是啮齿动物细胞。在一些实施例中，细胞是合成制成的，有时称为人工细胞。

在一些实施例中，细胞来源于细胞系。用于组织培养的多种多样的细胞系是本领域已知的。细胞系的实例包括但不限于293T、MF7、K562、HeLa、CHO、及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(例如，参见美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassas,Va.)))。在一些实施例中，细胞是永生或永生化细胞。

在一些实施例中，细胞是原代细胞。在一些实施例中，细胞是干细胞，例如全能干细胞(例如，全能的)、多能干细胞、专能干细胞、寡能干细胞或单能干细胞。在一些实施例中，细胞是诱导性多能干细胞(iPSC)或来源于iPSC。在一些实施例中，细胞是分化细胞。例如，在一些实施例中，分化细胞是肌肉细胞(例如，肌细胞)、脂肪细胞(例如，脂细胞)、骨的细胞(例如，成骨细胞、骨细胞、破骨细胞)、血细胞(例如，单核细胞、淋巴细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、巨噬细胞、红细胞或血小板)、神经细胞(例如，神经元)、上皮细胞、免疫细胞(例如，淋巴细胞、嗜中性粒细胞、单核细胞或巨噬细胞)、肝脏细胞(例如肝细胞)、成纤维细胞或性细胞。在一些实施例中，细胞是终末分化细胞。例如，在一些实施例中，终末分化细胞是神经元细胞、脂肪细胞、心肌细胞、骨骼肌细胞、表皮细胞或肠细胞。在一些实施例中，细胞是免疫细胞。在一些实施例中，免疫细胞是T细胞。在一些实施例中，免疫细胞是B细胞。在一些实施例中，免疫细胞是自然杀伤(NK)细胞。在一些实施例中，免疫细胞是肿瘤浸润淋巴细胞(TIL)。在一些实施例中，细胞是哺乳动物细胞，例如人细胞或鼠细胞。在一些实施例中，鼠细胞来源于野生型小鼠、免疫抑制小鼠或疾病特异性小鼠模型。在一些实施例中，细胞是活组织、器官、或生物内的细胞。

方法

本披露还提供了修饰PDCD1基因内的靶序列的方法。在一些实施例中，该方法包括将PDCD1靶向性RNA指导物和Cas12i多肽引入细胞中。PDCD1靶向性RNA指导物和Cas12i多肽可以作为核糖核蛋白复合物引入细胞。可以将PDCD1靶向性RNA指导物和Cas12i多肽在核酸载体上引入。可以将Cas12i多肽作为mRNA引入。可以将RNA指导物直接引入细胞中。

在一些实施例中，PDCD1基因的序列在SEQ ID NO:277或其反向互补序列中列出。在一些实施例中，靶序列在PDCD1基因的外显子中，例如具有SEQ ID NO:278、SEQ ID NO:279、SEQ ID NO:280、SEQ ID NO:281或SEQ ID NO:282中任一个所示序列的外显子或其反向互补序列。在一些实施例中，靶序列位于PDCD1基因的内含子中(例如，SEQ ID NO:277或其反向互补序列中所示序列的内含子)。在其他实施例中，PDCD1基因的序列是SEQ ID NO:277中所示序列的变体(或其反向互补序列)或SEQ ID NO:277中所示序列的同源序列(或其反向互补序列)。例如，在一些实施例中，靶序列是SEQ ID NO:277(或其反向互补序列)中所示的PDCD1序列的多态变体或PDCD1基因的非人形式。

在一些实施例中，如本文披露的RNA指导物被设计成与靶序列互补，该靶序列与5′-NTTN-3′PAM序列相邻。5′-NTTN-3′序列可以紧邻靶序列，或者例如在靶序列的少量(例如，1、2、3、4、或5个)核苷酸内。在一些实施例中，5′-NTTN-3′序列是5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’，其中Y是C或T，B是除A之外的任何核苷酸，D是除C之外的任何核苷酸，并且R是A或G。在一些实施例中，5′-NTTN-3′序列是5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，RNA指导物被设计成与双链靶序列的第一链(例如，靶链或间隔子互补链)结合，并且5′-NTTN-3′PAM序列存在于第二互补链(例如，非靶链或非间隔子互补链)。在一些实施例中，RNA指导物在靶链(例如，间隔子互补链)上的5′-NAAN-3′序列附近结合。

在一些实施例中，Cas12i多肽具有酶活性(例如，核酸酶活性)。在一些实施例中，Cas12i多肽在细胞中诱导一个或多个DNA双链断裂。在一些实施例中，Cas12i多肽在细胞中诱导一个或多个DNA单链断裂。在一些实施例中，Cas12i多肽在细胞中诱导一个或多个DNA切口。在一些实施例中，DNA断裂和/或切口导致形成一个或多个插入缺失(例如，一个或多个缺失)。

在一些实施例中，本文披露的RNA指导物与Cas12i多肽形成复合物并将该Cas12i多肽引导至与5′-NTTN-3′序列相邻的靶序列。在一些实施例中，该复合物诱导与5'-NTTN-3'序列相邻的缺失(例如，核苷酸缺失或DNA缺失)。在一些实施例中，该复合物诱导与以下序列相邻的缺失：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，该复合物诱导与富含T/C的序列相邻的缺失。

在一些实施例中，缺失在5′-NTTN-3′序列的下游。在一些实施例中，缺失在以下序列的下游：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游。

在一些实施例中，缺失改变PDCD1基因的表达。在一些实施例中，缺失改变PDCD1基因的功能。在一些实施例中，缺失使PDCD1基因失活。在一些实施例中，缺失是移码缺失。在一些实施例中，缺失是非移码缺失。在一些实施例中，缺失导致细胞毒性或细胞死亡(例如，凋亡)。

在一些实施例中，缺失在5'-NTTN-3′序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中，缺失始于以下序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。

在一些实施例中，缺失在5′-NTTN-3′序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中，缺失始于以下序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。

在一些实施例中，缺失在5′-NTTN-3′序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中，缺失始于以下序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11、或12个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。

在一些实施例中，缺失在5′-NTTN-3′序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中，缺失始于以下序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11、或12个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。

在一些实施例中，缺失在5′-NTTN-3′序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中，缺失始于以下序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。

在一些实施例中，缺失在5′-NTTN-3'序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中，缺失始于以下序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。

在一些实施例中，缺失在5′-NTTN-3′序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失终于以下序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失终于以下序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3'序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中，缺失终于以下序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中，缺失终于以下序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失终于以下序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失终于以下序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内，并且终于以下序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3'序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在5′-NTTN-3′序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3'序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中，缺失始于以下序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内，并且终于以下序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在5′-NTTN-3′序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始，并且在该序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内，并且终于以下序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在5′-NTTN-3'序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约5至约15个核苷酸(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始，并且在该序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3′序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在该序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11、或12个核苷酸)内，并且终于以下序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在该序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在5′-NTTN-3'序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11、或12个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在该序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3'序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在该序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中，缺失始于以下序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11、或12个核苷酸)内，并且终于该序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约5至约10个核苷酸内开始，并且在该序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3′序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在5′-NTTN-3'序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11、或12个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在该序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在该序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失在富含T/C的序列的约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在该序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3′序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在5′-NTTN-3′序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11、或12个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约5至约10个核苷酸(例如，约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始，并且在该序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16、或17个核苷酸)内，并且终于以下序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在5′-NTTN-3′序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的下游约20至约30个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中，缺失始于以下序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16、或17个核苷酸)内，并且终于以下序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在5′-NTTN-3'序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的下游约20至约25个核苷酸(例如，约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。

在一些实施例中，缺失在5′-NTTN-3′序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16、或17个核苷酸)内，并且终于以下序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中，缺失始于以下序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16、或17个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’，并且终于以下序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内：5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中，缺失在富含T/C的序列的下游约10至约15个核苷酸(例如，约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始，并且在该序列的下游约25至约30个核苷酸(例如，约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。

在一些实施例中，缺失的长度多达约50个核苷酸(例如，约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸)。在一些实施例中，缺失的长度多达约40个核苷酸(例如，约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中，缺失的长度介于约4个核苷酸与约40个核苷酸之间(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中，缺失的长度介于约4个核苷酸与约25个核苷酸之间(例如，约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中，缺失的长度介于约10个核苷酸与约25个核苷酸之间(例如，约7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中，缺失的长度介于约10个核苷酸与约15个核苷酸之间(例如，约7、8、9、10、11、12、13、14、15、16或17个核苷酸)。

在一些实施例中，本文所述的方法用于工程化在PDCD1基因中包含如本文所述的缺失的细胞。

本文披露的组合物、载体、核酸、RNA指导物和细胞可用于疗法中。本文披露的组合物、载体、核酸、RNA指导物和细胞可用于治疗受试者的疾病或病症的方法中。本领域已知的任何合适的递送或施用方法可用于递送本文披露的组合物、载体、核酸、RNA指导物和细胞。这样的方法可以涉及使靶序列与本文披露的组合物、载体、核酸或RNA指导物接触。这样的方法可以涉及编辑如本文披露的PDCD1序列的方法。在一些实施例中，使用本文披露的RNA指导物工程化的细胞用于离体基因疗法。在一些实施例中，使用本文披露的RNA指导物工程化的细胞用于CAR T细胞疗法。

试剂盒

本发明还提供了可以用于例如实施本文所述的方法的试剂盒或系统。在一些实施例中，试剂盒或系统包括RNA指导物和Cas12i多肽。在一些实施例中，试剂盒或系统包括编码这种Cas12i多肽的多核苷酸，并且任选地，该多核苷酸被包含在例如如本文所述的载体内。在一些实施例中，试剂盒或系统包括编码本文披露的RNA指导物的多核苷酸。可以将Cas12i多肽和RNA指导物(例如，作为核糖核蛋白)包装在试剂盒或系统内的相同容器或其他容器内，或者可以包装在内容物可以在使用前混合的分开的小瓶或其他容器中。任选地，试剂盒或系统还可以额外地包括缓冲液和/或RNA指导物和Cas12i多肽的使用说明。

本文引用的所有参考文献和出版物特此通过援引并入。

实例

提供以下实例以进一步说明本发明的一些实施例但并非旨在限制本发明的范围；通过它们的示例性性质将理解，可替代性地使用本领域技术人员已知的其他程序、方法或技术。

实例1—通过转染编辑哺乳动物细胞中的PDCD1

本实例描述了使用通过瞬时转染引入哺乳动物细胞的Cas12i2和RNA指导物组合物对多个PDCD1靶标的插入缺失评估。

SEQ ID NO:287的变体Cas12i2与pcda3.1主链(英杰公司)中的CMV启动子一起被克隆。然后将质粒大量制备并且稀释至1μg/μL。对于RNA指导物制备，通过含有靶序列支架的超聚体(ultramer)和U6启动子衍生编码RNA指导物的dsDNA片段。将超聚体重悬于pH 7.5的10mM Tris·HCl中至最终原液浓度为100μM。随后再次使用10mM Tris·HCl将工作原液稀释至10μM以充当用于PCR反应的模板。将RNA指导物的扩增在具有以下组分的50μL反应物中进行：0.02μl前面提及的模板、2.5μl正向引物、2.5μl反向引物、25μL NEB HiFi聚合酶和20μl水。循环条件是：1x(98℃下30s)、30x(98℃下10s，67℃下15s)、1x(72℃下2min)。将PCR产物用1.8X SPRI处理净化并且归一化至25ng/μL。制备的RNA指导物序列及其相应的靶序列在表6中示出。

表6.用于瞬时转染的RNA指导物和靶序列。

在转染前大约16小时，将100μl在DMEM/10％FBS+青霉素/链霉素中的25,000个HEK293T细胞铺板至96孔板中的每个孔中。在转染的当天，细胞的汇合度为70％-90％。对于待转染的每个孔，制备0.5μlLipofectamine 2000和9.5μl Opti-MEM的混合物，然后在室温下孵育5-20分钟(溶液1)。在孵育之后，将lipofectamine:OptiMEM混合物添加至最多至10μL的含有182ng效应子质粒和14ng RNA指导物以及水的单独混合物(溶液2)。将溶液1和溶液2混合物通过向上和向下吸移进行混合，且然后在室温下孵育25分钟。在孵育后，将20μL溶液1和溶液2混合物逐滴添加至含有细胞的96孔板的每个孔。在转染后72小时，通过以下方式使细胞胰蛋白酶化：向每个孔的中心添加10μL TrypLE并且孵育大约5分钟。然后将100μLD10培养基添加至每个孔并且混合以重悬细胞。然后将细胞以500g旋转沉降10分钟，并且弃去上清液。将QuickExtract缓冲液添加至原始细胞悬浮液体积的量的1/5。将细胞在65℃下孵育15分钟，在68℃下孵育15分钟，并且在98℃下孵育10分钟。

通过两轮PCR制备用于下一代测序的样品。使用第一轮(PCR1)来扩增根据靶的特定基因组区域。通过柱纯化对PCR1产物进行纯化。进行第2轮PCR(PCR2)以添加Illumina衔接子和索引。然后合并反应，将其加载到2％ E-gel EX上10分钟并进行凝胶提取。用150次循环NextSeq v2.5中等或高输出试剂盒进行测序运行。

如图1所示，十一个测试的RNA指导物中的每一个都在PDCD1靶序列中诱导了插入缺失。因此，RNA指导物和SEQ ID NO:287的变体Cas12i2能够靶向哺乳动物细胞外显子1和外显子2中的PDCD1靶标。

实例2—通过RNP电穿孔编辑哺乳动物细胞中的PDCD1

本实例描述了在哺乳动物细胞中使用Cas12i多肽对多个PDCD1靶序列进行核糖核蛋白(RNP)转染，然后进行FACS染色和插入缺失评估。

将来自三个单个供体的CD3+T细胞复苏，并使用自动细胞计数器进行计数。收集来自每个供体的样品，并分别进行CD3ε和DAPI染色以用于表面表达和活力的流式细胞术分析。将细胞密度调节至1e6个细胞/mL，并将细胞用抗CD3:CD28的混合物刺激3天。

通过以1:1(效应子:crRNA)的体积比(2.5:1crRNA:效应子摩尔比)混合纯化的变体Cas12i2(400μM；SEQ ID NO:288)与RNA指导物(在250mM NaCl中为1mM；参见表7中的序列)进行变体Cas12i2 RNP复合反应。通过以6.45:1(效应子:sgRNA)的体积比(2.5:1sgRNA:效应子摩尔比)混合纯化的SpCas9(Aldevron；62μM)与sgRNA(在水中为1mM；参见表7中的序列)进行SpCas9 RNP复合反应。对于“只有效应子”的对照，分别以与crRNA或sgRNA相同的体积比将变体Cas12i2或SpCas9与蛋白质储存缓冲液(25mM Tris(pH 7.5)、250mM NaCl、1mMTCEP、50％甘油)混合。包括另外的对照：SpCas9(Aldevron)与Lethal#1(转染对照指导物)、合并的CD3或ROSA26 sgRNA以及SpCas9(Horizon)与Lethal#1、合并的CD3或ROSA26 sgRNA。将复合物在37℃下孵育30-60分钟。孵育后，将RNP稀释至20μM、50μM、100μM或160μM效应子浓度(对于变体Cas12i2)和20μM或50μM(对于SpCas9)。

表7.用于RNP转染的RNA指导物序列。

将稀释的复合反应以2μL/孔分配到384孔电穿孔板中。收集细胞悬浮液，并使用自动细胞计数器进行计数。在P3缓冲液中将细胞密度调节至1.1e7个细胞/mL，并以2e5个细胞/反应(18μL)分配。变体Cas12i2RNP的最终浓度为2μM、5μM、10μM或16μM。SpCas9 RNP的最终浓度为2或5μM。设置以下对照：只有未电穿孔细胞、只有P3原代细胞缓冲液(Lonza#VXP-3032)中的细胞、只有蛋白质储存缓冲液中的细胞。使用电穿孔装置(程序EO-115-AA，LonzaHT)对板进行电穿孔，不包括未电穿孔条件。使用机器人技术(StarLab Hamilton)将每个孔分成四个96孔编辑板(含有200μL总体积)。将编辑板在37℃下孵育7天，在第4天更换100μL培养基。

7天后，将板离心并除去上清液。将沉淀重悬于200μL PBS中。收集100μL样品，并用抗体组(抗PDCD1)或抗CD3ε抗体(lethal#1，用于Cas9对照的合并CD3ε、ROSA26、蛋白质储存缓冲液和未电穿孔)染色。将所有细胞用DAPI染色以评估活力。将剩余的细胞悬浮液转移到96孔PCR板中并以500x g离心5分钟。除去上清液并将沉淀冷冻在-80℃下。

对于gDNA提取，将沉淀解冻至室温并重悬于适当体积的DNA提取缓冲液(QuickExtract)中，得到1000个细胞/μL的最终浓度。然后将样品在PCR机器中在65℃下循环15分钟，在68℃下循环15分钟，在98℃下循环10分钟。然后将样品冷冻在-20℃下。

通过多轮PCR制备用于下一代测序(NGS)的样品。第一轮(PCR I)用于扩增靶位点侧翼的基因组区域并添加NGS衔接子。第二轮(PCR II)用于添加NGS index。然后将反应液合并，通过柱纯化进行纯化，并在荧光计(量子比特公司(Qubit))上定量。使用150循环NGS仪器(NextSeq v2.5)中或高输出试剂盒完成测序运行，并在NGS仪器(NextSeq 550)上运行。

对于NGS分析，插入缺失映射功能使用样品的fastq文件、扩增子参考序列、和正向引物序列。对于每个读段，使用kmer扫描算法来计算读段与参考序列之间的编辑操作(匹配、错配、插入、缺失)。为了去除一些样品中存在的少量引物二聚体，每个读段的前30nt需要与参考匹配，并且超过一半的映射核苷酸为错配的读段也被滤除。通过这些过滤器的多达50,000个读段用于分析，并且如果读段含有插入或缺失，则将其计为插入缺失读数。将插入缺失％计算为含有插入缺失的读段数目除以分析的读段数目(通过过滤器的读段多达50,000个)。通过过滤器的最小读段数目的QC标准是10,000。

结果显示在原代T细胞中由变体Cas12i2 RNP靶向诱导的PDCD1中的插入缺失(图2)。在靶向PDCD1的Cas12i2 RNP电穿孔后七天，细胞活力在所有条件下都保持高水平(图3)。

因此，该实例显示了如何测量用本文所述的RNA指导物/Cas12i多肽复合物电穿孔的细胞(例如T细胞)的活力、细胞中PDCD1的表达以及对细胞中PDCD1靶序列的活性(插入缺失％)。

该实例进一步表明，RNA指导物和SEQ ID NO:288的变体Cas12i2能够靶向哺乳动物细胞外显子1和外显子2中的PDCD1靶标。

序列表

<110> 阿伯生物技术公司（Arbor Biotechnologies, Inc.）

<120> 包含靶向PDCD1的RNA指导物的组合物及其用途

<130> 51451-016WO3

<150> US 63/252,835

<151> 2021-10-06

<150> US 63/108,053

<151> 2020-10-30

<160> 341

<170> PatentIn3.5版

<210> 1

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 1

guugcaaaac ccaagaaauc cgucuuucau ugacgg 36

<210> 2

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 2

aauagcggcc cuaagaaauc cgucuuucau ugacgg 36

<210> 3

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 3

auuggaacug gcgagaaauc cgucuuucau ugacgg 36

<210> 4

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 4

ccagcaacac cuaagaaauc cgucuuucau ugacgg 36

<210> 5

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 5

cggcgcucga auaggaaauc cgucuuucau ugacgg 36

<210> 6

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 6

guggcaacac cuaagaaauc cgucuuucau ugacgg 36

<210> 7

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 7

guugcaacac cuaagaaauc cgucuuucau ugacgg 36

<210> 8

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 8

guugcaaugc cuaagaaauc cgucuuucau ugacgg 36

<210> 9

<211> 34

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 9

gcaacaccua agaaauccgu cuuucauuga cggg 34

<210> 10

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 10

agaaauccgu cuuucauuga cgg 23

<210> 11

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 11

aacctgacct gggacagttt cccttccgct 30

<210> 12

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 12

aagggagggt gcccgcccct tgctcccgcc 30

<210> 13

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 13

tccactgctc aggcggaggt gagcggaagg 30

<210> 14

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 14

tagcaccgcc cagacgactg gccagggcgc 30

<210> 15

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 15

ggtaggtggg gtcggcggtc aggtgtccca 30

<210> 16

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 16

ttaggtaggt ggggtcggcg gtcaggtgtc 30

<210> 17

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 17

cgctcacctc cgcctgagca gtggagaagg 30

<210> 18

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 18

ccttccgctc acctccgcct gagcagtgga 30

<210> 19

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 19

cccttccgct cacctccgcc tgagcagtgg 30

<210> 20

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 20

atctgcgcct tgggggccag ggagatggcc 30

<210> 21

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 21

ggggccaggg agatggcccc acagaggtag 30

<210> 22

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 22

tccccttcgg tcaccacgag cagggctggg 30

<210> 23

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 23

ggcagttgtg tgacacggaa gcggcagtcc 30

<210> 24

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 24

cgccgggccc tgaccacgct catgtggaag 30

<210> 25

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 25

tccgtctggt tgctggggct catgcggtac 30

<210> 26

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 26

ctggggctca tgcggtacca gtttagcacg 30

<210> 27

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 27

agcacgaagc tctccgatgt gttggagaag 30

<210> 28

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 28

gatctgcgcc ttgggggcca gggagatggc 30

<210> 29

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 29

tgtgacacgg aagcggcagt cctggccggg 30

<210> 30

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 30

cacatgagcg tggtcagggc ccggcgcaat 30

<210> 31

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 31

acctgcagct tctccaacac atcggagagc 30

<210> 32

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 32

cccgaggacc gcagccagcc cggccaggac 30

<210> 33

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 33

gtgctaaact ggtaccgcat gagccccagc 30

<210> 34

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 34

tccaacacat cggagagctt cgtgctaaac 30

<210> 35

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 35

gcacgaagct ctccgatgtg ttggagaagc 30

<210> 36

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 36

tccccagccc tgctcgtggt gaccgaaggg 30

<210> 37

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 37

ctcacctctc tccatctctc agactcccca 30

<210> 38

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 38

tggggccacc cagccccttc ctcacctctc 30

<210> 39

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 39

gtggggccac ccagcccctt cctcacctct 30

<210> 40

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 40

ggtcaccacg agcagggctg gggagaaggt 30

<210> 41

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 41

cagggcctgt ctggggagtc tgagagatgg 30

<210> 42

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 42

cgtgtcacac aactgcccaa cgggcgtgac 30

<210> 43

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 43

gagaagctgc aggtgaaggt ggcgttgtcc 30

<210> 44

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 44

gtgcccttcc agagagaagg gcagaagtgc 30

<210> 45

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 45

ggacggggtc agggtggagg gtcagggtca 30

<210> 46

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 46

tgcccttcca gagagaaggg cagaagtgcc 30

<210> 47

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 47

cagagagaag ggcagaagtg cccacagccc 30

<210> 48

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 48

gtgtcgtggg cggcctgctg ggcagcctgg 30

<210> 49

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 49

gggcagggca ggccgagggg ctgggatgac 30

<210> 50

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 50

caaaccctgg tggttggtgt cgtgggcggc 30

<210> 51

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 51

ggaactggcc ggctggcctg ggtgaggggc 30

<210> 52

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 52

gaactggccg gctggcctgg gtgaggggct 30

<210> 53

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 53

tgcccttctc tctggaaggg cacaaaggtc 30

<210> 54

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 54

tctctggaag ggcacaaagg tcaggggtta 30

<210> 55

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 55

cctcgtgcgg cccgggagca gatgacggcc 30

<210> 56

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 56

ctctgcaggg acaataggag ccaggcgcac 30

<210> 57

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 57

ctgcatgatc cactgtgcct tccttcctgg 30

<210> 58

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 58

cctgcatgat ccactgtgcc ttccttcctg 30

<210> 59

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 59

tcctgcatga tccactgtgc cttccttcct 30

<210> 60

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 60

tctgcaggga caataggagc caggcgcacc 30

<210> 61

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 61

tccctgcaga gaaacacact tggggtcacc 30

<210> 62

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 62

gggtcaccag gccgaccctg agccgtgctc 30

<210> 63

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 63

cctagcggaa tgggcacctc atcccccgcc 30

<210> 64

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 64

cctgaaactt ctctaggcct gcagggagca 30

<210> 65

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 65

tgaccttccc tgaaacttct ctaggcctgc 30

<210> 66

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 66

ctgccctgcc caccacagcc aggagctctt 30

<210> 67

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 67

cctgccctgc ccaccacagc caggagctct 30

<210> 68

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 68

cctgccccac aaagggcctg aggtgctgcc 30

<210> 69

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 69

ctgcctcagc ttccctgccc cacaaagggc 30

<210> 70

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 70

ggaccgtagg atgtccctct cccgagtggt 30

<210> 71

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 71

tctaggcctg cagggagcag ataactcctg 30

<210> 72

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 72

tgccctccca acacccaggt ggccacagct 30

<210> 73

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 73

aggaatgggt tccaaggaga gctcccaggg 30

<210> 74

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 74

caggaatggg ttccaaggag agctcccagg 30

<210> 75

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 75

aataatttca ggaatgggtt ccaaggagag 30

<210> 76

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 76

aaataatttc aggaatgggt tccaaggaga 30

<210> 77

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 77

ccacccaggc cctggtggga gcccggccaa 30

<210> 78

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 78

tcccagccac tcaggtgcct gctggccgcc 30

<210> 79

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 79

taatataata gaaccacagg gaagggggat 30

<210> 80

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 80

caaggagagc tcccagggtg ggcacatggg 30

<210> 81

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 81

taattataat ataatagaac cacagggaag 30

<210> 82

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 82

ggccctgcgt ccagggcgtt tcgggatgcc 30

<210> 83

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 83

gggatgccac tgccaggggc accttggctg 30

<210> 84

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 84

ctgcggtggg ccgtggggct gactccctct 30

<210> 85

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 85

ctcctcaaag aaggaggacc cctcagccgt 30

<210> 86

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 86

tcctcaaaga aggaggaccc ctcagccgtg 30

<210> 87

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 87

tctgtggact atggggagct ggatttccag 30

<210> 88

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 88

ccagtggcga gagaagaccc cggagccccc 30

<210> 89

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 89

aggagaaagg gagagggagt cagccccacg 30

<210> 90

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 90

gaggagaaag ggagagggag tcagccccac 30

<210> 91

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 91

cgggatgcca ctgccagggg caccttggct 30

<210> 92

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 92

tttgaggaga aagggagagg gagtcagccc 30

<210> 93

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 93

cgctaggaaa gacaatggtg gcatactccg 30

<210> 94

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 94

tcctgaggaa atgcgctgac ccgggctcat 30

<210> 95

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 95

agacatgagt cctgtggtgg ggctgtgcct 30

<210> 96

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 96

agggagctgg acgcaggcag ctctgtgctg 30

<210> 97

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 97

agccccgggc cgcaggcagc agcagcagca 30

<210> 98

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 98

aggcaggagg ctccggggcg tcaggcaggg 30

<210> 99

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 99

gctgctccaa ggccatctcc aaccagcccc 30

<210> 100

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 100

tctcgccact ggaaatccag ctccccatag 30

<210> 101

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 101

attataatta taatataata gaaccacagg 30

<210> 102

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 102

aattataatt ataatataat agaaccacag 30

<210> 103

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 103

gcatgctctc atatttaatt ataattataa 30

<210> 104

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 104

acacatgccc aggcagcacc tcaggccctt 30

<210> 105

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 105

agggaaggtc agaagagctc ctggctgtgg 30

<210> 106

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 106

cagggaaggt cagaagagct cctggctgtg 30

<210> 107

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 107

cagtggcgag agaagacccc ggagcccccc 30

<210> 108

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 108

gagcagccaa ggtgcccctg gcagtggcat 30

<210> 109

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 109

gagatggcct tggagcagcc aaggtgcccc 30

<210> 110

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 110

ggggctggtt ggagatggcc ttggagcagc 30

<210> 111

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 111

cacatgccca ggcagcacct caggcccttt 30

<210> 112

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 112

aggtcctgcc agcacagagc tgcctgcgtc 30

<210> 113

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 113

ctcaggagaa gcaggcaggg tgcaggccat 30

<210> 114

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 114

cctcaggaga agcaggcagg gtgcaggcca 30

<210> 115

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 115

tgcagaccct ccaccatgag cccgggtcag 30

<210> 116

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 116

gccaccagtg ttctgcagac cctccaccat 30

<210> 117

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 117

cttggccacc agtgttctgc agaccctcca 30

<210> 118

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 118

gcccctctga ccggcttcct tggccaccag 30

<210> 119

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 119

ctagcggaat gggcacctca tcccccgccc 30

<210> 120

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 120

caggccgtcc aggggctgag ctgcctgggg 30

<210> 121

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 121

gtggggcagg gaagctgagg cagtaagcgg 30

<210> 122

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 122

tggggcaggg aagctgaggc agtaagcggg 30

<210> 123

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 123

caggcccagc cagcactctg gcctcctgcc 30

<210> 124

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 124

aatatgagag catgctaagg a 21

<210> 125

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 125

taattaaata tgagagcatg ctaagga 27

<210> 126

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 126

taattataat taaatatgag agcatgctaa 30

<210> 127

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 127

tattataatt ataattaaat atgagagcat 30

<210> 128

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 128

tattatatta taattataat taaatatgag 30

<210> 129

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 129

cctgtggttc tattatatta taattataat 30

<210> 130

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 130

ccccggggcc tagtaccccc gccgtggcct 30

<210> 131

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 131

gccgggctcc caccagggcc tgggtgggaa 30

<210> 132

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 132

aaggggttgg ccgggctccc accagggcct 30

<210> 133

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 133

aaaggggttg gccgggctcc caccagggcc 30

<210> 134

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 134

tttaaagggg ttggccgggc tcccaccagg 30

<210> 135

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 135

ctgaaattat ttaaaggggt tggccgggct 30

<210> 136

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 136

gaacccattc ctgaaattat ttaaaggggt 30

<210> 137

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 137

ggagggcaga agtgcaggca cctagggccc 30

<210> 138

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 138

actcaggccc ctcccagctg tggccacctg 30

<210> 139

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 139

caccccagcc cctcacacca ctcgggagag 30

<210> 140

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 140

aggcccagcc agcactctgg cctcctgccg 30

<210> 141

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 141

tctttcctag cggaatgggc acctcatccc 30

<210> 142

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 142

tctgctccct gcaggcctag agaagtttca 30

<210> 143

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 143

aaccugaccu gggacaguuu cccuuccgcu 30

<210> 144

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 144

aagggagggu gcccgccccu ugcucccgcc 30

<210> 145

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 145

uccacugcuc aggcggaggu gagcggaagg 30

<210> 146

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 146

uagcaccgcc cagacgacug gccagggcgc 30

<210> 147

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 147

gguagguggg gucggcgguc agguguccca 30

<210> 148

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 148

uuagguaggu ggggucggcg gucagguguc 30

<210> 149

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 149

cgcucaccuc cgccugagca guggagaagg 30

<210> 150

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 150

ccuuccgcuc accuccgccu gagcagugga 30

<210> 151

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 151

cccuuccgcu caccuccgcc ugagcagugg 30

<210> 152

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 152

aucugcgccu ugggggccag ggagauggcc 30

<210> 153

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 153

ggggccaggg agauggcccc acagagguag 30

<210> 154

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 154

uccccuucgg ucaccacgag cagggcuggg 30

<210> 155

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 155

ggcaguugug ugacacggaa gcggcagucc 30

<210> 156

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 156

cgccgggccc ugaccacgcu cauguggaag 30

<210> 157

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 157

uccgucuggu ugcuggggcu caugcgguac 30

<210> 158

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 158

cuggggcuca ugcgguacca guuuagcacg 30

<210> 159

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 159

agcacgaagc ucuccgaugu guuggagaag 30

<210> 160

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 160

gaucugcgcc uugggggcca gggagauggc 30

<210> 161

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 161

ugugacacgg aagcggcagu ccuggccggg 30

<210> 162

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 162

cacaugagcg uggucagggc ccggcgcaau 30

<210> 163

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 163

accugcagcu ucuccaacac aucggagagc 30

<210> 164

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 164

cccgaggacc gcagccagcc cggccaggac 30

<210> 165

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 165

gugcuaaacu gguaccgcau gagccccagc 30

<210> 166

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 166

uccaacacau cggagagcuu cgugcuaaac 30

<210> 167

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 167

gcacgaagcu cuccgaugug uuggagaagc 30

<210> 168

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 168

uccccagccc ugcucguggu gaccgaaggg 30

<210> 169

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 169

cucaccucuc uccaucucuc agacucccca 30

<210> 170

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 170

uggggccacc cagccccuuc cucaccucuc 30

<210> 171

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 171

guggggccac ccagccccuu ccucaccucu 30

<210> 172

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 172

ggucaccacg agcagggcug gggagaaggu 30

<210> 173

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 173

cagggccugu cuggggaguc ugagagaugg 30

<210> 174

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 174

cgugucacac aacugcccaa cgggcgugac 30

<210> 175

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 175

gagaagcugc aggugaaggu ggcguugucc 30

<210> 176

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 176

gugcccuucc agagagaagg gcagaagugc 30

<210> 177

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 177

ggacgggguc aggguggagg gucaggguca 30

<210> 178

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 178

ugcccuucca gagagaaggg cagaagugcc 30

<210> 179

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 179

cagagagaag ggcagaagug cccacagccc 30

<210> 180

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 180

gugucguggg cggccugcug ggcagccugg 30

<210> 181

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 181

gggcagggca ggccgagggg cugggaugac 30

<210> 182

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 182

caaacccugg ugguuggugu cgugggcggc 30

<210> 183

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 183

ggaacuggcc ggcuggccug ggugaggggc 30

<210> 184

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 184

gaacuggccg gcuggccugg gugaggggcu 30

<210> 185

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 185

ugcccuucuc ucuggaaggg cacaaagguc 30

<210> 186

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 186

ucucuggaag ggcacaaagg ucagggguua 30

<210> 187

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 187

ccucgugcgg cccgggagca gaugacggcc 30

<210> 188

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 188

cucugcaggg acaauaggag ccaggcgcac 30

<210> 189

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 189

cugcaugauc cacugugccu uccuuccugg 30

<210> 190

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 190

ccugcaugau ccacugugcc uuccuuccug 30

<210> 191

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 191

uccugcauga uccacugugc cuuccuuccu 30

<210> 192

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 192

ucugcaggga caauaggagc caggcgcacc 30

<210> 193

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 193

ucccugcaga gaaacacacu uggggucacc 30

<210> 194

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 194

gggucaccag gccgacccug agccgugcuc 30

<210> 195

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 195

ccuagcggaa ugggcaccuc aucccccgcc 30

<210> 196

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 196

ccugaaacuu cucuaggccu gcagggagca 30

<210> 197

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 197

ugaccuuccc ugaaacuucu cuaggccugc 30

<210> 198

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 198

cugcccugcc caccacagcc aggagcucuu 30

<210> 199

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 199

ccugcccugc ccaccacagc caggagcucu 30

<210> 200

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 200

ccugccccac aaagggccug aggugcugcc 30

<210> 201

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 201

cugccucagc uucccugccc cacaaagggc 30

<210> 202

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 202

ggaccguagg augucccucu cccgaguggu 30

<210> 203

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 203

ucuaggccug cagggagcag auaacuccug 30

<210> 204

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 204

ugcccuccca acacccaggu ggccacagcu 30

<210> 205

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 205

aggaaugggu uccaaggaga gcucccaggg 30

<210> 206

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 206

caggaauggg uuccaaggag agcucccagg 30

<210> 207

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 207

aauaauuuca ggaauggguu ccaaggagag 30

<210> 208

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 208

aaauaauuuc aggaaugggu uccaaggaga 30

<210> 209

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 209

ccacccaggc ccugguggga gcccggccaa 30

<210> 210

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 210

ucccagccac ucaggugccu gcuggccgcc 30

<210> 211

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 211

uaauauaaua gaaccacagg gaagggggau 30

<210> 212

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 212

caaggagagc ucccagggug ggcacauggg 30

<210> 213

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 213

uaauuauaau auaauagaac cacagggaag 30

<210> 214

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 214

ggcccugcgu ccagggcguu ucgggaugcc 30

<210> 215

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 215

gggaugccac ugccaggggc accuuggcug 30

<210> 216

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 216

cugcgguggg ccguggggcu gacucccucu 30

<210> 217

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 217

cuccucaaag aaggaggacc ccucagccgu 30

<210> 218

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 218

uccucaaaga aggaggaccc cucagccgug 30

<210> 219

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 219

ucuguggacu auggggagcu ggauuuccag 30

<210> 220

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 220

ccaguggcga gagaagaccc cggagccccc 30

<210> 221

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 221

aggagaaagg gagagggagu cagccccacg 30

<210> 222

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 222

gaggagaaag ggagagggag ucagccccac 30

<210> 223

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 223

cgggaugcca cugccagggg caccuuggcu 30

<210> 224

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 224

uuugaggaga aagggagagg gagucagccc 30

<210> 225

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 225

cgcuaggaaa gacaauggug gcauacuccg 30

<210> 226

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 226

uccugaggaa augcgcugac ccgggcucau 30

<210> 227

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 227

agacaugagu ccuguggugg ggcugugccu 30

<210> 228

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 228

agggagcugg acgcaggcag cucugugcug 30

<210> 229

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 229

agccccgggc cgcaggcagc agcagcagca 30

<210> 230

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 230

aggcaggagg cuccggggcg ucaggcaggg 30

<210> 231

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 231

gcugcuccaa ggccaucucc aaccagcccc 30

<210> 232

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 232

ucucgccacu ggaaauccag cuccccauag 30

<210> 233

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 233

auuauaauua uaauauaaua gaaccacagg 30

<210> 234

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 234

aauuauaauu auaauauaau agaaccacag 30

<210> 235

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 235

gcaugcucuc auauuuaauu auaauuauaa 30

<210> 236

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 236

acacaugccc aggcagcacc ucaggcccuu 30

<210> 237

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 237

agggaagguc agaagagcuc cuggcugugg 30

<210> 238

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 238

cagggaaggu cagaagagcu ccuggcugug 30

<210> 239

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 239

caguggcgag agaagacccc ggagcccccc 30

<210> 240

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 240

gagcagccaa ggugccccug gcaguggcau 30

<210> 241

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 241

gagauggccu uggagcagcc aaggugcccc 30

<210> 242

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 242

ggggcugguu ggagauggcc uuggagcagc 30

<210> 243

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 243

cacaugccca ggcagcaccu caggcccuuu 30

<210> 244

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 244

agguccugcc agcacagagc ugccugcguc 30

<210> 245

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 245

cucaggagaa gcaggcaggg ugcaggccau 30

<210> 246

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 246

ccucaggaga agcaggcagg gugcaggcca 30

<210> 247

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 247

ugcagacccu ccaccaugag cccgggucag 30

<210> 248

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 248

gccaccagug uucugcagac ccuccaccau 30

<210> 249

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 249

cuuggccacc aguguucugc agacccucca 30

<210> 250

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 250

gccccucuga ccggcuuccu uggccaccag 30

<210> 251

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 251

cuagcggaau gggcaccuca ucccccgccc 30

<210> 252

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 252

caggccgucc aggggcugag cugccugggg 30

<210> 253

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 253

guggggcagg gaagcugagg caguaagcgg 30

<210> 254

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 254

uggggcaggg aagcugaggc aguaagcggg 30

<210> 255

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 255

caggcccagc cagcacucug gccuccugcc 30

<210> 256

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 256

aauaugagag caugcuaagg a 21

<210> 257

<211> 27

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 257

uaauuaaaua ugagagcaug cuaagga 27

<210> 258

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 258

uaauuauaau uaaauaugag agcaugcuaa 30

<210> 259

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 259

uauuauaauu auaauuaaau augagagcau 30

<210> 260

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 260

uauuauauua uaauuauaau uaaauaugag 30

<210> 261

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 261

ccugugguuc uauuauauua uaauuauaau 30

<210> 262

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 262

ccccggggcc uaguaccccc gccguggccu 30

<210> 263

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 263

gccgggcucc caccagggcc ugggugggaa 30

<210> 264

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 264

aagggguugg ccgggcuccc accagggccu 30

<210> 265

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 265

aaagggguug gccgggcucc caccagggcc 30

<210> 266

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 266

uuuaaagggg uuggccgggc ucccaccagg 30

<210> 267

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 267

cugaaauuau uuaaaggggu uggccgggcu 30

<210> 268

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 268

gaacccauuc cugaaauuau uuaaaggggu 30

<210> 269

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 269

ggagggcaga agugcaggca ccuagggccc 30

<210> 270

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 270

acucaggccc cucccagcug uggccaccug 30

<210> 271

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 271

caccccagcc ccucacacca cucgggagag 30

<210> 272

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 272

aggcccagcc agcacucugg ccuccugccg 30

<210> 273

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 273

ucuuuccuag cggaaugggc accucauccc 30

<210> 274

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 274

ucugcucccu gcaggccuag agaaguuuca 30

<210> 275

<211> 3162

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 275

atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60

ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120

caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180

cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240

agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300

ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360

tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420

gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480

agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540

agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600

ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660

accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720

gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780

attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840

gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900

accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960

ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020

gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080

aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140

attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200

ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260

aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320

aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380

cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440

cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500

gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560

ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620

accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680

atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740

gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800

aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860

aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920

aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980

gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040

aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100

ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160

aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220

tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280

aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340

agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400

ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460

acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520

aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580

aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640

tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700

tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760

ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820

agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880

agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940

gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000

accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060

gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120

gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162

<210> 276

<211> 1054

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 276

Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu

1 5 10 15

Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly

20 25 30

Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr

35 40 45

Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp

50 55 60

Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp

65 70 75 80

Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu

85 90 95

Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser

100 105 110

Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr

115 120 125

Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His

130 135 140

Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu

145 150 155 160

Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu

165 170 175

Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu

180 185 190

Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln

195 200 205

Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln

210 215 220

Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile

225 230 235 240

Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp

245 250 255

Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys

260 265 270

Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp

275 280 285

Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys

290 295 300

Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln

305 310 315 320

Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu

325 330 335

Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr

340 345 350

Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys

355 360 365

Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu

370 375 380

Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile

385 390 395 400

Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile

405 410 415

Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln

420 425 430

Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn

435 440 445

Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser

450 455 460

Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly

465 470 475 480

Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln

485 490 495

Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg

500 505 510

Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala

515 520 525

Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg

530 535 540

Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys

545 550 555 560

Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile

565 570 575

Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly

580 585 590

Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr

595 600 605

Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly

610 615 620

Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu

625 630 635 640

Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr

645 650 655

Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu

660 665 670

Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu

675 680 685

Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr

690 695 700

Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly

705 710 715 720

Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe

725 730 735

Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser

740 745 750

Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe

755 760 765

Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln

770 775 780

Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu

785 790 795 800

Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn

805 810 815

Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly

820 825 830

Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn

835 840 845

Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg

850 855 860

Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu

865 870 875 880

Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala

885 890 895

Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp

900 905 910

Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr

915 920 925

Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu

930 935 940

Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys

945 950 955 960

Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu

965 970 975

Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile

980 985 990

Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe

995 1000 1005

Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala

1010 1015 1020

Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser

1025 1030 1035

Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr

1040 1045 1050

Ser

<210> 277

<211> 9366

<212> DNA

<213> 智人

<400> 277

aggagaaggg cctgccccca cccggcagcc tcaggagggg cagctcgggc gggatatgga 60

aagaggccac agcagtgagc agagacacag aggaggaagg ggccctgagc tggggagacc 120

cccacggggt agggcgtggg ggccacgggc ccacctcctc cccatctcct ctgtctccct 180

gtctctgtct ctctctccct cccccaccct ctccccagtc ctaccccctc ctcacccctc 240

ctcccccagc actgcctctg tcactctcgc ccacgtggat gtggaggaag agggggcggg 300

agcaaggggc gggcaccctc ccttcaacct gacctgggac agtttccctt ccgctcacct 360

ccgcctgagc agtggagaag gcggcactct ggtggggctg ctccaggcat gcagatccca 420

caggcgccct ggccagtcgt ctgggcggtg ctacaactgg gctggcggcc aggatggttc 480

ttaggtaggt ggggtcggcg gtcaggtgtc ccagagccag gggtctggag ggaccttcca 540

ccctcagtcc ctggcaggtc ggggggtgct gaggcgggcc tggccctggc agcccagggg 600

tcccggagcg aggggtctgg agggaccttt cactctcagt ccctggcagg tcggggggtg 660

ctgtggcagg cccagccttg gcccccagct ctgcccctta ccctgagctg tgtggctttg 720

ggcagctcga actcctgggt tcctctctgg gccccaactc ctcccctggc ccaagtcccc 780

tctttgctcc tgggcaggca ggacctctgt cccctctcag ccggtccttg gggctgcgtg 840

tttctgtaga atgacgggtc aggctggcca gaaccccaaa ccttggccgt ggggagtctg 900

cgtggcggct ctgccttgcc caggcatcct tggtcctcac tcgagttttc ctaaggatgg 960

gatgagcccc atgtgggact aaccttggct ttacgacgtc aaagtttaga tgagctggtg 1020

atatttttct cattatatcc aaagtgtacc tgttcgagtg aggacagttc ttctgtctcc 1080

aggatccctc ctgggtgggg attgtgcccg cctgggtctc tgcccagatt ccagggctct 1140

ccccgagccc tgttcagacc atccgtgggg gaggccttgg cctcactctc ccggatcgag 1200

gagagaggga gcctcttcct gggctgcccg tgaccctggg ccctctgtgt acactgtgac 1260

cacagcccgc tcctggaccc tctgtgcccg gctggccctc tgtgcccagc cagcctgcac 1320

ctggggatgc caaggcctgg ggagggtggt ttcacccagg ccaagcctaa gacagtccct 1380

ctgggccctg ctgggtaccg gggtgtgaca ccactgggag gacaagatga ggggcacccc 1440

tggggccgcc ctgacacccc ctcgaggctc ctgccccggg ggtcctggtg ccccttcact 1500

gtggcaggcg actgggggtt ccccacctcg gcccctctcc cggggcctgc tccccggcac 1560

ctgaggcagc atccttgtca gggccgtgcc ttcctgcctc agcgccacct cttaaggttg 1620

gcccgtgggt cactcaggac tcagaactgg agattctggg caaaaggcaa agagcaaagg 1680

gccaaaaggc atcccaggga gacgactgcg ggggaaccag agggcagagg ggcgctcgtc 1740

acaggggagg gggagctgag cgaggcagga ggggagccga gcctctcccc ccgtgtcccg 1800

gctcttcagg cacgccctcg ggacgccacc ctccccgacc caggcgggaa agataagagc 1860

aaggtgtccg cagcctgaca ctcgtgcctc aggtgcccgc gcttgtgccg gacaagactc 1920

tcacaggtgg catgcctcgg tttccccact ggtaacagca cagggcactc agcaaggcgc 1980

agtgggcatg actggggtcc tgtgggtcct gacccagatg tggccacccc ggccgcagtg 2040

gtcttcattc caggatgcct cttttccctc ctgatctatt cactgcgttc gccattcggt 2100

cattcccggg gccaccactc ccacctcagg tgtgtgcttc ccttgtgttt tatgagatat 2160

ccccaacccg gctgcttatt ggccccgtcc gagggcagga gcataaataa gagcctctgc 2220

tttggcgtgg gaccactgtg agctccagtc agcgctgcca ctgctgagct ctgggccttc 2280

gacaggactt ggccccttac tgacttctcc gtgtgctttg ggtcatgggt gaggacgcct 2340

cctggcaagg ctgcgtcctg aggattaaat cgggtcatct gtgaaaacta cccagcccag 2400

cccctgacac ttttttgttt gtttctttta gtgacagggt cttgctctgt cacccaggct 2460

ggagtgcagt ggtgtgatct cggctcactc gacctccggg gctcaagcaa ttctcccacc 2520

tctgcctcca gagtagctgg gactataggc acgtgccacc ctgccaggct aatttcttcc 2580

atttttttta gagacagggt ctcgctatgt tccccaggct gggctcaaat ggtcctccca 2640

cctcagcctc cccaagtact gggattacag gcataagcca ctgcatctgg cctccatgac 2700

acatattttt aaagtctgat ttttaaagtc aaacttttga agtcagattt taaacggact 2760

attttgaaaa atatacaaaa acgtttaaaa acaatgaata tccctcacct agaatcaata 2820

actaagaata ttgacacatt tgctttgggg actgggcggc tggagctgcc atgacaaagc 2880

tccgccgacc gagtggcttt taaacagagc ctgccctctc gccgactgag ggctggacgt 2940

gcaggatgga gctccgcagg gtcggctccc ctgtgctctg aggggctctg ctcagcctct 3000

cccggctgtg gcttaaaaac agagcctgtc ctcccgccgt ggggggctgg acatgcagga 3060

ccgaggggcc acagggtcgg ctccctgtgc tccgagaggg ctctgctcag cttctcctgg 3120

ctggggggtt ttgtggccac cctctgtgtt cctgggttca gaagcatccc ccaggctctg 3180

ccttcatctc tgcacgggtg actctgtaca ggaagccagg cctgctggtc aatggccacc 3240

cagccctgtg ccctcatctt acctagtccc agctgccgtc accctattcc taataaggcc 3300

gccttctgag gtcatggggt taggacttcc acataggaat ctgtggggac acggttcggc 3360

ccacagccct tcccacctcc acacacacac acgactgtga ggagttggaa gacctcactc 3420

ctcacccctg ccaggtcctc tagggacaag ctcgctgtcc tcatcccagc acagcccgtg 3480

ggacggtttc cttgtcccta atgggaccac ggtcagagat gccgggtctg gtctgggcca 3540

gcaggttcct ccgcccgggg caggcagcct tcttctgtgc gcttctggaa agcaatgtcc 3600

tgtaatgcgg tctctctgcg ggagcacccc caccgccacc tcacaggcct gttccacagc 3660

cccgggatgg gctctgtctc cctcctgacc ctgcataggg cacagccctc tctcatcaac 3720

ccacgatcct acgtggatcc gagagggagc acctggggaa acaatggaat cccatagaaa 3780

caccccaaat ctaacttgat ccaggaccag ccagtggtca cttctgaata ttcaccttcc 3840

tagtagacac taccagccaa gggaggccag gaagccttcc tggaggaggt ggcctgagga 3900

ctggggtgag gcaggccctg cgtgggggtc gccacccagc acccccacac tgggtgggag 3960

ccagtctctg agactggctg ggggaggtgg gagagggggc tgcttgaact gcagacaccg 4020

aggtctagcc cccaccccac ccagccagtt ggtggaggca ggggaggccg aggggcccag 4080

ctggacctgc tccccggggt ggattccaaa ataggggggt tggggggggc ggaacaggag 4140

cccagggtcc tggcttgagg cccagtggct gagggctggt gcaagccaga caggaaaagg 4200

gttgagcctg tcagcgccag cacagatcaa gtcaggagca ggtccctcca ccaatgtgtg 4260

caaataaata gcagctaagt ttccagttac aagaacaatg cacagatggt cccagggaca 4320

ttgcggtgtg gacacacagc ggccattgtc ctgtcgccag cacctcgccc tacagctggg 4380

gggtccctta gcacttccta gccatgcagg gtccctgctc acagtacccg tgatgacttc 4440

tgttcctcac ctgcctgtct gtcccgacag ctgcatggca gccctggcct gggagatgga 4500

gaccccgagg ggctgcctgc ggtggtgggg cccctgggtc cccactgcat tcccagaaac 4560

ccagagggca gggcatttcc cctgctctgt gccgagtcca cccagcccca gcctaggccc 4620

agtaagggct gcagcccacc ctgtcccagg ctgcctccca ggagccctct tggccctgat 4680

gccagaagcc catcttcctc cattcaggca ggtctctgag tgccctggcc tggctgcctg 4740

ctggccctga gagtcacact accccacagc cctccttggt caaaatccac tctggagtgg 4800

ctggaagatt ccccgggccc acgccgcaca cgcctatgca gggagcttcc cctggccggc 4860

cggcagacaa gggcggtctc agagaggggg ctcacctcag cagccccttg tgtagctggc 4920

cctcgcccct gccacctctg ggaacaccac caggaagctg ggggacaggc acgcaggtga 4980

aggaggcgag cgcttgtcag ccgggaggcc atgggcacag agggaacagg gacaccctgg 5040

gtggcctcaa ggtcacttca aacccctcac tcgtcccctg ggagggtgcc cagtgaggtt 5100

ggcactagga gttggtcctg gtcacatgac agacccaccc acctctggtg tccagccagc 5160

acgccgtggg ccagcctggc tgcagggaca cgagggcagc agccccctcc tcctctgagc 5220

tggttgctcc ttgagtcatc accaccgcct gccacggagg ccgcctgtcc caggaagcag 5280

agggaccgca gctgtggcaa ccagggcctg gtctctgtgt cacctcgctg gggggccgtg 5340

cccaggcctg agacggaact gagtgacagt gcactgggtc tgacagtgtg gggctggcgc 5400

catgtttggg gaaccctgtg gcatgggacc tgtgggtgag ccgggaaaat caccccgttg 5460

catggcatct cgggcctgga tcttaagcgc ctgtgttggt gcctccgcct ggcggaagag 5520

ccgcgacccc cacgttgcca tgcgggtatc ccaagccctg accctggcag gcatatgttt 5580

caggaggtcc ttgtcttggg agcccagggt cgggggcccc gtgtctgtcc acatccgagt 5640

caatggccca tctcgtctct gaagcatctt tgctgtgagc tctagtcccc actgtcttgc 5700

tggaaaatgt ggaggcccca ctgcccactg cccagggcag caatgcccat accacgtggt 5760

cccagctccg agcttgtcct gaaaaggggg caaagactgg accctgagcc tgccaagggg 5820

ccacactcct cccagggctg gggtctccat gggcagcccc ccacccaccc agaccagtta 5880

cactcccctg tgccagagca gtgcagacag gaccaggcca ggatgcccaa gggtcagggg 5940

ctggggatgg gtagccccca aacagccctt tctgggggaa ctggcctcaa cggggaaggg 6000

ggtgaaggct cttagtagga aatcagggag acccaagtca gagccaggtg ctgtgcagaa 6060

gctgcagcct cacgtagaag gaagaggctc tgcagtggag gccagtgccc atccccgggt 6120

ggcagaggcc ccagcagaga cttctcaatg acattccagc tggggtggcc cttccagagc 6180

ccttgctgcc cgagggatgt gagcaggtgg ccggggaggc tttgtggggc cacccagccc 6240

cttcctcacc tctctccatc tctcagactc cccagacagg ccctggaacc cccccacctt 6300

ctccccagcc ctgctcgtgg tgaccgaagg ggacaacgcc accttcacct gcagcttctc 6360

caacacatcg gagagcttcg tgctaaactg gtaccgcatg agccccagca accagacgga 6420

caagctggcc gccttccccg aggaccgcag ccagcccggc caggactgcc gcttccgtgt 6480

cacacaactg cccaacgggc gtgacttcca catgagcgtg gtcagggccc ggcgcaatga 6540

cagcggcacc tacctctgtg gggccatctc cctggccccc aaggcgcaga tcaaagagag 6600

cctgcgggca gagctcaggg tgacaggtgc ggcctcggag gccccggggc aggggtgagc 6660

tgagccggtc ctggggtggg tgtcccctcc tgcacaggat caggagctcc agggtcgtag 6720

ggcagggacc ccccagctcc agtccagggc tctgtcctgc acctggggaa tggtgaccgg 6780

catctctgtc ctctagctct ggaagcaccc cagcccctct agtctgccct cacccctgac 6840

cctgaccctc caccctgacc ccgtcctaac ccctgacctt tgtgcccttc cagagagaag 6900

ggcagaagtg cccacagccc accccagccc ctcacccagg ccagccggcc agttccaaac 6960

cctggtggtt ggtgtcgtgg gcggcctgct gggcagcctg gtgctgctag tctgggtcct 7020

ggccgtcatc tgctcccggg ccgcacgagg taacgtcatc ccagcccctc ggcctgccct 7080

gccctaaccc tgctggcggc cctcactccc gcctcccctt cctccaccct tccctcaccc 7140

caccccacct ccccccatct ccccgccagg ctaagtccct gatgaaggcc cctggactaa 7200

gaccccccac ctaggagcac ggctcagggt cggcctggtg accccaagtg tgtttctctg 7260

cagggacaat aggagccagg cgcaccggcc agcccctggt gagtctcact cttttcctgc 7320

atgatccact gtgccttcct tcctgggtgg gcagaggtgg aaggacaggc tgggaccaca 7380

cggcctgcag gactcacatt ctattatagc caggacccca cctccccagc ccccaggcag 7440

caacctcaat ccctaaagcc atgatctggg gccccagccc acctgcggtc tccgggggtg 7500

cccggcccat gtgtgtgcct gcctgcggtc tccaggggtg cctggcccac gcgtgtgccc 7560

gcctgcggtc tctgggggtg cccggcccac atatgtgcct gcctgcggtc tccaggtgtg 7620

cccggcccat gcgtgtgccc acctgcgagg gcgtggggtg ggcttggtca tttcttatct 7680

tacattggag acaggagagc ttgaaaagtc acattttgga atcctaaatc tgcaagaatg 7740

ccagggacat ttcagagggg gacattgagc cagagaggag gggtggtgtc cccagatcac 7800

acagagggca gtggtgggac agctcagggt aagcagctca tagtgggggg cccaggttcg 7860

gtgccggtac tgcagccagg ctgtggagcc gcgggcctcc ttcctgcggt gggccgtggg 7920

gctgactccc tctccctttc tcctcaaaga aggaggaccc ctcagccgtg cctgtgttct 7980

ctgtggacta tggggagctg gatttccagt ggcgagagaa gaccccggag ccccccgtgc 8040

cctgtgtccc tgagcagacg gagtatgcca ccattgtctt tcctagcgga atgggcacct 8100

catcccccgc ccgcaggggc tcagctgacg gccctcggag tgcccagcca ctgaggcctg 8160

aggatggaca ctgctcttgg cccctctgac cggcttcctt ggccaccagt gttctgcaga 8220

ccctccacca tgagcccggg tcagcgcatt tcctcaggag aagcaggcag ggtgcaggcc 8280

attgcaggcc gtccaggggc tgagctgcct gggggcgacc ggggctccag cctgcacctg 8340

caccaggcac agccccacca caggactcat gtctcaatgc ccacagtgag cccaggcagc 8400

aggtgtcacc gtcccctaca gggagggcca gatgcagtca ctgcttcagg tcctgccagc 8460

acagagctgc ctgcgtccag ctccctgaat ctctgctgct gctgctgctg ctgctgctgc 8520

tgcctgcggc ccggggctga aggcgccgtg gccctgcctg acgccccgga gcctcctgcc 8580

tgaacttggg ggctggttgg agatggcctt ggagcagcca aggtgcccct ggcagtggca 8640

tcccgaaacg ccctggacgc agggcccaag actgggcaca ggagtgggag gtacatgggg 8700

ctggggactc cccaggagtt atctgctccc tgcaggccta gagaagtttc agggaaggtc 8760

agaagagctc ctggctgtgg tgggcagggc aggaaacccc tccaccttta cacatgccca 8820

ggcagcacct caggcccttt gtggggcagg gaagctgagg cagtaagcgg gcaggcagag 8880

ctggaggcct ttcaggccca gccagcactc tggcctcctg ccgccgcatt ccaccccagc 8940

ccctcacacc actcgggaga gggacatcct acggtcccaa ggtcaggagg gcagggctgg 9000

ggttgactca ggcccctccc agctgtggcc acctgggtgt tgggagggca gaagtgcagg 9060

cacctagggc cccccatgtg cccaccctgg gagctctcct tggaacccat tcctgaaatt 9120

atttaaaggg gttggccggg ctcccaccag ggcctgggtg ggaaggtaca ggcgttcccc 9180

cggggcctag tacccccgcc gtggcctatc cactcctcac atccacacac tgcaccccca 9240

ctcctggggc agggccacca gcatccaggc ggccagcagg cacctgagtg gctgggacaa 9300

gggatccccc ttccctgtgg ttctattata ttataattat aattaaatat gagagcatgc 9360

taagga 9366

<210> 278

<211> 232

<212> DNA

<213> 智人

<400> 278

caaggggcgg gcaccctccc ttcaacctga cctgggacag tttcccttcc gctcacctcc 60

gcctgagcag tggagaaggc ggcactctgg tggggctgct ccaggcatgc agatcccaca 120

ggcgccctgg ccagtcgtct gggcggtgct acaactgggc tggcggccag gatggttctt 180

aggtaggtgg ggtcggcggt caggtgtccc agagccaggg gtctggaggg ac 232

<210> 279

<211> 460

<212> DNA

<213> 智人

<400> 279

aggctttgtg gggccaccca gccccttcct cacctctctc catctctcag actccccaga 60

caggccctgg aaccccccca ccttctcccc agccctgctc gtggtgaccg aaggggacaa 120

cgccaccttc acctgcagct tctccaacac atcggagagc ttcgtgctaa actggtaccg 180

catgagcccc agcaaccaga cggacaagct ggccgccttc cccgaggacc gcagccagcc 240

cggccaggac tgccgcttcc gtgtcacaca actgcccaac gggcgtgact tccacatgag 300

cgtggtcagg gcccggcgca atgacagcgg cacctacctc tgtggggcca tctccctggc 360

ccccaaggcg cagatcaaag agagcctgcg ggcagagctc agggtgacag gtgcggcctc 420

ggaggccccg gggcaggggt gagctgagcc ggtcctgggg 460

<210> 280

<211> 256

<212> DNA

<213> 智人

<400> 280

gaccctccac cctgaccccg tcctaacccc tgacctttgt gcccttccag agagaagggc 60

agaagtgccc acagcccacc ccagcccctc acccaggcca gccggccagt tccaaaccct 120

ggtggttggt gtcgtgggcg gcctgctggg cagcctggtg ctgctagtct gggtcctggc 180

cgtcatctgc tcccgggccg cacgaggtaa cgtcatccca gcccctcggc ctgccctgcc 240

ctaaccctgc tggcgg 256

<210> 281

<211> 135

<212> DNA

<213> 智人

<400> 281

ggagcacggc tcagggtcgg cctggtgacc ccaagtgtgt ttctctgcag ggacaatagg 60

agccaggcgc accggccagc ccctggtgag tctcactctt ttcctgcatg atccactgtg 120

ccttccttcc tgggt 135

<210> 282

<211> 1467

<212> DNA

<213> 智人

<400> 282

cttcctgcgg tgggccgtgg ggctgactcc ctctcccttt ctcctcaaag aaggaggacc 60

cctcagccgt gcctgtgttc tctgtggact atggggagct ggatttccag tggcgagaga 120

agaccccgga gccccccgtg ccctgtgtcc ctgagcagac ggagtatgcc accattgtct 180

ttcctagcgg aatgggcacc tcatcccccg cccgcagggg ctcagctgac ggccctcgga 240

gtgcccagcc actgaggcct gaggatggac actgctcttg gcccctctga ccggcttcct 300

tggccaccag tgttctgcag accctccacc atgagcccgg gtcagcgcat ttcctcagga 360

gaagcaggca gggtgcaggc cattgcaggc cgtccagggg ctgagctgcc tgggggcgac 420

cggggctcca gcctgcacct gcaccaggca cagccccacc acaggactca tgtctcaatg 480

cccacagtga gcccaggcag caggtgtcac cgtcccctac agggagggcc agatgcagtc 540

actgcttcag gtcctgccag cacagagctg cctgcgtcca gctccctgaa tctctgctgc 600

tgctgctgct gctgctgctg ctgcctgcgg cccggggctg aaggcgccgt ggccctgcct 660

gacgccccgg agcctcctgc ctgaacttgg gggctggttg gagatggcct tggagcagcc 720

aaggtgcccc tggcagtggc atcccgaaac gccctggacg cagggcccaa gactgggcac 780

aggagtggga ggtacatggg gctggggact ccccaggagt tatctgctcc ctgcaggcct 840

agagaagttt cagggaaggt cagaagagct cctggctgtg gtgggcaggg caggaaaccc 900

ctccaccttt acacatgccc aggcagcacc tcaggccctt tgtggggcag ggaagctgag 960

gcagtaagcg ggcaggcaga gctggaggcc tttcaggccc agccagcact ctggcctcct 1020

gccgccgcat tccaccccag cccctcacac cactcgggag agggacatcc tacggtccca 1080

aggtcaggag ggcagggctg gggttgactc aggcccctcc cagctgtggc cacctgggtg 1140

ttgggagggc agaagtgcag gcacctaggg ccccccatgt gcccaccctg ggagctctcc 1200

ttggaaccca ttcctgaaat tatttaaagg ggttggccgg gctcccacca gggcctgggt 1260

gggaaggtac aggcgttccc ccggggccta gtacccccgc cgtggcctat ccactcctca 1320

catccacaca ctgcaccccc actcctgggg cagggccacc agcatccagg cggccagcag 1380

gcacctgagt ggctgggaca agggatcccc cttccctgtg gttctattat attataatta 1440

taattaaata tgagagcatg ctaagga 1467

<210> 283

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 283

agaaauccgu cuuucauuga cgguuaggua gguggggucg gcg 43

<210> 284

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 284

agaaauccgu cuuucauuga cggcccgagg accgcagcca gcc 43

<210> 285

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 285

agaaauccgu cuuucauuga cggcguguca cacaacugcc caa 43

<210> 286

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 286

agaaauccgu cuuucauuga cggcacauga gcguggucag ggc 43

<210> 287

<211> 1054

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 287

Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu

1 5 10 15

Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly

20 25 30

Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr

35 40 45

Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp

50 55 60

Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp

65 70 75 80

Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu

85 90 95

Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser

100 105 110

Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr

115 120 125

Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His

130 135 140

Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu

145 150 155 160

Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu

165 170 175

Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu

180 185 190

Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln

195 200 205

Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln

210 215 220

Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile

225 230 235 240

Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp

245 250 255

Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys

260 265 270

Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp

275 280 285

Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys

290 295 300

Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln

305 310 315 320

Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu

325 330 335

Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr

340 345 350

Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys

355 360 365

Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu

370 375 380

Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile

385 390 395 400

Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile

405 410 415

Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln

420 425 430

Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn

435 440 445

Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser

450 455 460

Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly

465 470 475 480

Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln

485 490 495

Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg

500 505 510

Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala

515 520 525

Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg

530 535 540

Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys

545 550 555 560

Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile

565 570 575

Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly

580 585 590

Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr

595 600 605

Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly

610 615 620

Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu

625 630 635 640

Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr

645 650 655

Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu

660 665 670

Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu

675 680 685

Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr

690 695 700

Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly

705 710 715 720

Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe

725 730 735

Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser

740 745 750

Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe

755 760 765

Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln

770 775 780

Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu

785 790 795 800

Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn

805 810 815

Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly

820 825 830

Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn

835 840 845

Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg

850 855 860

Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu

865 870 875 880

Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala

885 890 895

Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp

900 905 910

Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr

915 920 925

Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu

930 935 940

Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys

945 950 955 960

Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu

965 970 975

Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile

980 985 990

Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe

995 1000 1005

Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala

1010 1015 1020

Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser

1025 1030 1035

Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr

1040 1045 1050

Ser

<210> 288

<211> 1054

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 288

Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu

1 5 10 15

Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly

20 25 30

Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr

35 40 45

Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp

50 55 60

Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp

65 70 75 80

Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu

85 90 95

Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser

100 105 110

Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr

115 120 125

Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His

130 135 140

Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu

145 150 155 160

Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu

165 170 175

Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu

180 185 190

Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln

195 200 205

Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln

210 215 220

Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile

225 230 235 240

Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp

245 250 255

Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys

260 265 270

Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp

275 280 285

Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys

290 295 300

Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln

305 310 315 320

Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu

325 330 335

Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr

340 345 350

Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys

355 360 365

Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu

370 375 380

Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile

385 390 395 400

Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile

405 410 415

Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln

420 425 430

Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn

435 440 445

Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser

450 455 460

Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly

465 470 475 480

Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln

485 490 495

Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg

500 505 510

Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala

515 520 525

Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg

530 535 540

Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys

545 550 555 560

Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile

565 570 575

Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly

580 585 590

Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr

595 600 605

Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly

610 615 620

Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu

625 630 635 640

Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr

645 650 655

Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu

660 665 670

Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu

675 680 685

Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr

690 695 700

Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly

705 710 715 720

Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe

725 730 735

Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser

740 745 750

Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe

755 760 765

Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln

770 775 780

Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu

785 790 795 800

Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn

805 810 815

Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly

820 825 830

Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn

835 840 845

Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg

850 855 860

Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu

865 870 875 880

Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala

885 890 895

Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp

900 905 910

Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr

915 920 925

Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu

930 935 940

Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys

945 950 955 960

Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu

965 970 975

Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile

980 985 990

Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe

995 1000 1005

Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala

1010 1015 1020

Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser

1025 1030 1035

Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr

1040 1045 1050

Ser

<210> 289

<211> 1054

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 289

Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu

1 5 10 15

Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly

20 25 30

Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr

35 40 45

Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp

50 55 60

Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp

65 70 75 80

Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu

85 90 95

Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser

100 105 110

Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr

115 120 125

Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His

130 135 140

Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu

145 150 155 160

Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu

165 170 175

Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu

180 185 190

Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln

195 200 205

Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln

210 215 220

Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile

225 230 235 240

Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp

245 250 255

Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys

260 265 270

Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp

275 280 285

Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys

290 295 300

Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln

305 310 315 320

Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu

325 330 335

Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr

340 345 350

Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys

355 360 365

Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu

370 375 380

Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile

385 390 395 400

Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile

405 410 415

Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln

420 425 430

Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn

435 440 445

Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser

450 455 460

Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly

465 470 475 480

Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln

485 490 495

Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg

500 505 510

Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala

515 520 525

Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg

530 535 540

Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys

545 550 555 560

Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile

565 570 575

Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly

580 585 590

Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr

595 600 605

Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly

610 615 620

Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu

625 630 635 640

Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr

645 650 655

Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu

660 665 670

Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu

675 680 685

Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr

690 695 700

Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly

705 710 715 720

Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe

725 730 735

Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser

740 745 750

Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe

755 760 765

Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln

770 775 780

Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu

785 790 795 800

Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn

805 810 815

Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly

820 825 830

Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn

835 840 845

Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg

850 855 860

Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu

865 870 875 880

Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala

885 890 895

Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp

900 905 910

Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr

915 920 925

Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu

930 935 940

Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys

945 950 955 960

Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu

965 970 975

Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile

980 985 990

Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe

995 1000 1005

Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala

1010 1015 1020

Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser

1025 1030 1035

Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr

1040 1045 1050

Ser

<210> 290

<211> 1054

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 290

Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu

1 5 10 15

Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly

20 25 30

Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr

35 40 45

Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp

50 55 60

Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp

65 70 75 80

Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu

85 90 95

Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser

100 105 110

Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr

115 120 125

Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His

130 135 140

Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu

145 150 155 160

Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu

165 170 175

Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu

180 185 190

Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln

195 200 205

Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln

210 215 220

Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile

225 230 235 240

Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp

245 250 255

Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys

260 265 270

Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp

275 280 285

Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys

290 295 300

Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln

305 310 315 320

Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu

325 330 335

Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr

340 345 350

Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys

355 360 365

Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu

370 375 380

Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile

385 390 395 400

Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile

405 410 415

Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln

420 425 430

Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn

435 440 445

Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser

450 455 460

Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly

465 470 475 480

Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln

485 490 495

Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg

500 505 510

Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala

515 520 525

Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg

530 535 540

Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys

545 550 555 560

Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile

565 570 575

Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly

580 585 590

Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr

595 600 605

Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg

610 615 620

Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu

625 630 635 640

Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr

645 650 655

Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu

660 665 670

Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu

675 680 685

Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr

690 695 700

Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly

705 710 715 720

Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe

725 730 735

Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser

740 745 750

Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe

755 760 765

Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln

770 775 780

Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu

785 790 795 800

Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn

805 810 815

Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly

820 825 830

Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn

835 840 845

Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg

850 855 860

Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu

865 870 875 880

Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala

885 890 895

Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp

900 905 910

Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr

915 920 925

Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu

930 935 940

Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys

945 950 955 960

Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu

965 970 975

Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile

980 985 990

Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe

995 1000 1005

Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala

1010 1015 1020

Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser

1025 1030 1035

Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr

1040 1045 1050

Ser

<210> 291

<211> 1054

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 291

Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu

1 5 10 15

Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly

20 25 30

Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr

35 40 45

Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp

50 55 60

Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp

65 70 75 80

Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu

85 90 95

Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser

100 105 110

Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr

115 120 125

Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His

130 135 140

Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu

145 150 155 160

Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu

165 170 175

Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu

180 185 190

Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln

195 200 205

Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln

210 215 220

Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile

225 230 235 240

Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp

245 250 255

Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys

260 265 270

Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp

275 280 285

Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys

290 295 300

Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln

305 310 315 320

Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu

325 330 335

Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr

340 345 350

Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys

355 360 365

Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu

370 375 380

Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile

385 390 395 400

Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile

405 410 415

Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln

420 425 430

Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn

435 440 445

Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser

450 455 460

Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly

465 470 475 480

Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln

485 490 495

Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg

500 505 510

Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala

515 520 525

Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg

530 535 540

Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys

545 550 555 560

Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile

565 570 575

Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly

580 585 590

Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr

595 600 605

Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg

610 615 620

Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu

625 630 635 640

Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr

645 650 655

Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu

660 665 670

Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu

675 680 685

Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr

690 695 700

Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly

705 710 715 720

Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe

725 730 735

Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser

740 745 750

Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe

755 760 765

Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln

770 775 780

Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu

785 790 795 800

Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn

805 810 815

Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly

820 825 830

Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn

835 840 845

Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg

850 855 860

Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu

865 870 875 880

Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala

885 890 895

Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp

900 905 910

Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr

915 920 925

Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu

930 935 940

Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys

945 950 955 960

Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu

965 970 975

Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile

980 985 990

Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe

995 1000 1005

Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala

1010 1015 1020

Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser

1025 1030 1035

Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr

1040 1045 1050

Ser

<210> 292

<211> 100

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<220>

<221> 尚未归类的特征

<222> (1)..(4)

<223> 位置1、2、3和4处的核苷酸之间的键是

硫代磷酸酯键

<220>

<221> 经修饰的碱基

<222> (1)..(1)

<223> um

<220>

<221> 经修饰的碱基

<222> (2)..(3)

<223> cm

<220>

<221> 尚未归类的特征

<222> (97)..(100)

<223> 位置97、98、99和100处的核苷酸之间的键

是硫代磷酸酯键

<220>

<221> 经修饰的碱基

<222> (97)..(99)

<223> um

<400> 292

uccaggcaug cagaucccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 293

<211> 3222

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 293

atggcttcca tctctaggcc atacggcacc aagctgcgac cggacgcacg gaagaaggag 60

atgctcgata agttctttaa tacactgact aagggtcagc gcgtgttcgc agacctggcc 120

ctgtgcatct atggctccct gaccctggag atggccaagt ctctggagcc agaaagtgat 180

tcagaactgg tgtgcgctat tgggtggttt cggctggtgg acaagaccat ctggtccaag 240

gatggcatca agcaggagaa tctggtgaaa cagtacgaag cctattccgg aaaggaggct 300

tctgaagtgg tcaaaacata cctgaacagc cccagctccg acaagtacgt gtggatcgat 360

tgcaggcaga aattcctgag gtttcagcgc gagctcggca ctcgcaacct gtccgaggac 420

ttcgaatgta tgctctttga acagtacatt agactgacca agggcgagat cgaagggtat 480

gccgctattt caaatatgtt cggaaacggc gagaaggaag accggagcaa gaaaagaatg 540

tacgctacac ggatgaaaga ttggctggag gcaaacgaaa atatcacttg ggagcagtat 600

agagaggccc tgaagaacca gctgaatgct aaaaacctgg agcaggttgt ggccaattac 660

aaggggaacg ctggcggggc agaccccttc tttaagtata gcttctccaa agagggaatg 720

gtgagcaaga aagaacatgc acagcagctc gacaagttca aaaccgtcct gaagaacaaa 780

gcccgggacc tgaattttcc aaacaaggag aagctgaagc agtacctgga ggccgaaatc 840

ggcattccgg tcgacgctaa cgtgtactcc cagatgttct ctaacggggt gagtgaggtc 900

cagcctaaga ccacacggaa tatgtctttt agtaacgaga aactggatct gctcactgaa 960

ctgaaggacc tgaacaaggg cgatgggttc gagtacgcca gagaagtgct gaacgggttc 1020

tttgactccg agctccacac taccgaggat aagtttaata tcacctctag gtacctggga 1080

ggcgacaaat caaaccgcct gagcaaactc tataagatct ggaagaaaga gggtgtggac 1140

tgcgaggaag gcattcagca gttctgtgaa gccgtcaaag ataagatggg ccagatcccc 1200

attcgaaatg tgctgaagta cctgtggcag ttccgggaga cagtcagtgc cgaggatttt 1260

gaagcagccg ctaaggctaa ccatctggag gaaaagatca gccgggtgaa agcccaccca 1320

atcgtgatta gcaataggta ctgggctttt gggacttccg cactggtggg aaacattatg 1380

cccgcagaca agaggcatca gggagagtat gccggtcaga atttcaaaat gtggctggag 1440

gctgaactgc actacgatgg caagaaagca aagcaccatc tgccttttta taacgcccgc 1500

ttctttgagg aagtgtactg ctatcacccc tctgtcgccg agatcactcc tttcaaaacc 1560

aagcagtttg gctgtgaaat cgggaaggac attccagatt acgtgagcgt cgctctgaag 1620

gacaatccgt ataagaaagc aaccaaacga atcctgcgtg caatctacaa tcccgtcgcc 1680

aacacaactg gcgttgataa gaccacaaac tgcagcttca tgatcaaacg cgagaatgac 1740

gaatataagc tggtcatcaa ccgaaaaatt tccgtggatc ggcctaagag aatcgaagtg 1800

ggcaggacaa ttatggggta cgaccgcaat cagacagcta gcgatactta ttggattggc 1860

cggctggtgc cacctggaac ccggggcgca taccgcatcg gagagtggag cgtccagtat 1920

attaagtccg ggcctgtcct gtctagtact cagggagtta acaattccac taccgaccag 1980

ctggtgtaca acggcatgcc atcaagctcc gagcggttca aggcctggaa gaaagccaga 2040

atggctttta tccgaaaact cattcgtcag ctgaatgacg agggactgga atctaagggt 2100

caggattata tccccgagaa cccttctagt ttcgatgtgc ggggcgaaac cctgtacgtc 2160

tttaacagta attatctgaa ggccctggtg agcaaacaca gaaaggccaa gaaacctgtt 2220

gaggggatcc tggacgagat tgaagcctgg acatctaaag acaaggattc atgcagcctg 2280

atgcggctga gcagcctgag cgatgcttcc atgcagggaa tcgccagcct gaagagtctg 2340

attaacagct acttcaacaa gaatggctgt aaaaccatcg aggacaaaga aaagtttaat 2400

cccgtgctgt atgccaagct ggttgaggtg gaacagcgga gaacaaacaa gcggtctgag 2460

aaagtgggaa gaatcgcagg tagtctggag cagctggccc tgctgaacgg ggttgaggtg 2520

gtcatcggcg aagctgacct gggggaggtc gaaaaaggaa agagtaagaa acagaattca 2580

cggaacatgg attggtgcgc aaagcaggtg gcacagcggc tggagtacaa actggccttc 2640

catggaatcg gttactttgg agtgaacccc atgtatacca gccaccagga ccctttcgaa 2700

cataggcgcg tggctgatca catcgtcatg cgagcacgtt ttgaggaagt caacgtggag 2760

aacattgccg aatggcacgt gcgaaatttc tcaaactacc tgcgtgcaga cagcggcact 2820

gggctgtact ataagcaggc caccatggac ttcctgaaac attacggtct ggaggaacac 2880

gctgagggcc tggaaaataa gaaaatcaag ttctatgact ttagaaagat cctggaggat 2940

aaaaacctga caagcgtgat cattccaaag aggggcgggc gcatctacat ggccaccaac 3000

ccagtgacat ccgactctac cccgattaca tacgccggca agacttataa taggtgtaac 3060

gctgatgagg tggcagccgc taatatcgtt atttctgtgc tggctccccg cagtaagaaa 3120

aacgaggaac aggacgatat ccctctgatt accaagaaag ccgagagtaa gtcaccaccg 3180

aaagaccgga agagatcaaa aacaagccag ctgcctcaga aa 3222

<210> 294

<211> 1074

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 294

Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala

1 5 10 15

Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly

20 25 30

Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr

35 40 45

Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val

50 55 60

Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys

65 70 75 80

Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser

85 90 95

Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser

100 105 110

Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe

115 120 125

Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met

130 135 140

Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr

145 150 155 160

Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser

165 170 175

Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn

180 185 190

Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu

195 200 205

Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala

210 215 220

Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met

225 230 235 240

Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val

245 250 255

Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu

260 265 270

Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val

275 280 285

Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr

290 295 300

Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu

305 310 315 320

Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val

325 330 335

Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe

340 345 350

Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser

355 360 365

Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly

370 375 380

Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro

385 390 395 400

Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser

405 410 415

Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys

420 425 430

Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp

435 440 445

Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys

450 455 460

Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu

465 470 475 480

Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe

485 490 495

Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val

500 505 510

Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly

515 520 525

Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr

530 535 540

Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala

545 550 555 560

Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys

565 570 575

Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val

580 585 590

Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp

595 600 605

Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro

610 615 620

Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr

625 630 635 640

Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser

645 650 655

Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg

660 665 670

Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile

675 680 685

Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile

690 695 700

Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val

705 710 715 720

Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala

725 730 735

Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser

740 745 750

Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp

755 760 765

Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr

770 775 780

Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn

785 790 795 800

Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn

805 810 815

Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu

820 825 830

Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly

835 840 845

Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp

850 855 860

Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe

865 870 875 880

His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln

885 890 895

Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala

900 905 910

Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg

915 920 925

Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr

930 935 940

Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His

945 950 955 960

Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys

965 970 975

Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly

980 985 990

Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro

995 1000 1005

Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu

1010 1015 1020

Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser

1025 1030 1035

Lys Lys Asn Glu Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys

1040 1045 1050

Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr

1055 1060 1065

Ser Gln Leu Pro Gln Lys

1070

<210> 295

<211> 1074

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 295

Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala

1 5 10 15

Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly

20 25 30

Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr

35 40 45

Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val

50 55 60

Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys

65 70 75 80

Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser

85 90 95

Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser

100 105 110

Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe

115 120 125

Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met

130 135 140

Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr

145 150 155 160

Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser

165 170 175

Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn

180 185 190

Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu

195 200 205

Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala

210 215 220

Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met

225 230 235 240

Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val

245 250 255

Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu

260 265 270

Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val

275 280 285

Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr

290 295 300

Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu

305 310 315 320

Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val

325 330 335

Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe

340 345 350

Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser

355 360 365

Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly

370 375 380

Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro

385 390 395 400

Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser

405 410 415

Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys

420 425 430

Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp

435 440 445

Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys

450 455 460

Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu

465 470 475 480

Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe

485 490 495

Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val

500 505 510

Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly

515 520 525

Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr

530 535 540

Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala

545 550 555 560

Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys

565 570 575

Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg

580 585 590

Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp

595 600 605

Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro

610 615 620

Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr

625 630 635 640

Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser

645 650 655

Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg

660 665 670

Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile

675 680 685

Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile

690 695 700

Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val

705 710 715 720

Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala

725 730 735

Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser

740 745 750

Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp

755 760 765

Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr

770 775 780

Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn

785 790 795 800

Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn

805 810 815

Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu

820 825 830

Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly

835 840 845

Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp

850 855 860

Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe

865 870 875 880

His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln

885 890 895

Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala

900 905 910

Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg

915 920 925

Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr

930 935 940

Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His

945 950 955 960

Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys

965 970 975

Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly

980 985 990

Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro

995 1000 1005

Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu

1010 1015 1020

Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser

1025 1030 1035

Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys

1040 1045 1050

Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr

1055 1060 1065

Ser Gln Leu Pro Gln Lys

1070

<210> 296

<211> 1074

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 296

Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala

1 5 10 15

Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly

20 25 30

Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr

35 40 45

Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val

50 55 60

Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys

65 70 75 80

Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser

85 90 95

Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser

100 105 110

Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe

115 120 125

Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met

130 135 140

Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr

145 150 155 160

Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser

165 170 175

Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn

180 185 190

Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu

195 200 205

Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala

210 215 220

Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met

225 230 235 240

Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val

245 250 255

Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu

260 265 270

Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val

275 280 285

Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr

290 295 300

Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu

305 310 315 320

Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val

325 330 335

Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe

340 345 350

Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser

355 360 365

Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly

370 375 380

Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro

385 390 395 400

Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser

405 410 415

Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys

420 425 430

Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp

435 440 445

Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys

450 455 460

Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg

465 470 475 480

Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe

485 490 495

Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val

500 505 510

Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly

515 520 525

Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr

530 535 540

Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala

545 550 555 560

Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys

565 570 575

Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg

580 585 590

Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp

595 600 605

Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro

610 615 620

Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr

625 630 635 640

Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser

645 650 655

Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg

660 665 670

Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile

675 680 685

Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile

690 695 700

Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val

705 710 715 720

Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala

725 730 735

Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser

740 745 750

Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp

755 760 765

Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr

770 775 780

Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn

785 790 795 800

Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn

805 810 815

Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu

820 825 830

Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly

835 840 845

Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp

850 855 860

Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe

865 870 875 880

His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln

885 890 895

Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala

900 905 910

Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg

915 920 925

Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr

930 935 940

Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His

945 950 955 960

Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys

965 970 975

Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly

980 985 990

Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro

995 1000 1005

Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu

1010 1015 1020

Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser

1025 1030 1035

Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys

1040 1045 1050

Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr

1055 1060 1065

Ser Gln Leu Pro Gln Lys

1070

<210> 297

<211> 1093

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 297

Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr

1 5 10 15

Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn

20 25 30

Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp

35 40 45

Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala

50 55 60

Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe

65 70 75 80

Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn

85 90 95

Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln

100 105 110

Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp

115 120 125

Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu

130 135 140

Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys

145 150 155 160

Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met

165 170 175

Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr

180 185 190

Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val

195 200 205

Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr

210 215 220

Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile

225 230 235 240

Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu

245 250 255

Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg

260 265 270

Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe

275 280 285

Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met

290 295 300

Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys

305 310 315 320

Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu

325 330 335

Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr

340 345 350

Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile

355 360 365

Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His

370 375 380

Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu

385 390 395 400

Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr

405 410 415

Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu

420 425 430

Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile

435 440 445

Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln

450 455 460

Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn

465 470 475 480

Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys

485 490 495

His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile

500 505 510

Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His

515 520 525

Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala

530 535 540

Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys

545 550 555 560

Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu

565 570 575

Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln

580 585 590

Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr

595 600 605

Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe

610 615 620

Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr

625 630 635 640

Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr

645 650 655

Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn

660 665 670

Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser

675 680 685

Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys

690 695 700

Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu

705 710 715 720

Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln

725 730 735

Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser

740 745 750

Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile

755 760 765

Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu

770 775 780

Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser

785 790 795 800

Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr

805 810 815

Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val

820 825 830

Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu

835 840 845

Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val

850 855 860

Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu

865 870 875 880

Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile

885 890 895

Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu

900 905 910

Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val

915 920 925

Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr

930 935 940

Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg

945 950 955 960

Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg

965 970 975

Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr

980 985 990

Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly

995 1000 1005

Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys

1010 1015 1020

Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu

1025 1030 1035

Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys

1040 1045 1050

Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe

1055 1060 1065

Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu

1070 1075 1080

Val Asp Ile Gln Lys Asp Phe Lys Lys Lys

1085 1090

<210> 298

<211> 1098

<212> PRT

<213> 人工序列

<220>

<223> 合成的构建体

<400> 298

Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu

1 5 10 15

Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu

20 25 30

Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly

35 40 45

Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro

50 55 60

His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val

65 70 75 80

Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser

85 90 95

Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser

100 105 110

His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg

115 120 125

Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln

130 135 140

Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu

145 150 155 160

Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu

165 170 175

Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu

180 185 190

Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe

195 200 205

Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala

210 215 220

Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly

225 230 235 240

Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp

245 250 255

Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln

260 265 270

Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp

275 280 285

Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr

290 295 300

Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser

305 310 315 320

Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln

325 330 335

Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys

340 345 350

Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn

355 360 365

Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu

370 375 380

Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn

385 390 395 400

Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly

405 410 415

Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr

420 425 430

Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn

435 440 445

Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His

450 455 460

Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys

465 470 475 480

Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile

485 490 495

Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro

500 505 510

Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met

515 520 525

His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala

530 535 540

Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys

545 550 555 560

Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln

565 570 575

Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu

580 585 590

Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr

595 600 605

Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu

610 615 620

Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile

625 630 635 640

Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu

645 650 655

Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln

660 665 670

Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val

675 680 685

Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser

690 695 700

Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His

705 710 715 720

Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe

725 730 735

Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln

740 745 750

Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg

755 760 765

Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln

770 775 780

Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met

785 790 795 800

Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe

805 810 815

Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu

820 825 830

Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu

835 840 845

Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala

850 855 860

Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile

865 870 875 880

Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys

885 890 895

Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys

900 905 910

Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro

915 920 925

Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser

930 935 940

Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp

945 950 955 960

Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys

965 970 975

Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met

980 985 990

Cys Glu Glu Leu Gly Ile His Lys Thr Asp Met Ala Lys Gly Lys Val

995 1000 1005

Ser Leu Ser Asp Phe Val Asp Lys Phe Ile Gly Glu Lys Ala Ile

1010 1015 1020

Phe Pro Gln Arg Gly Gly Arg Phe Tyr Met Ser Thr Lys Arg Leu

1025 1030 1035

Thr Thr Gly Ala Lys Leu Ile Cys Tyr Ser Gly Ser Asp Val Trp

1040 1045 1050

Leu Ser Asp Ala Asp Glu Ile Ala Ala Ile Asn Ile Gly Met Phe

1055 1060 1065

Val Val Cys Asp Gln Thr Gly Ala Phe Lys Lys Lys Lys Lys Glu

1070 1075 1080

Lys Leu Asp Asp Glu Glu Cys Asp Ile Leu Pro Phe Arg Pro Met

1085 1090 1095

<210> 299

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 299

ucucaacgau agucagacau guguccucag ugacac 36

<210> 300

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 300

uuuuaacaac acucaggcau guguccacag ugacac 36

<210> 301

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 301

uugaacggau acucagacau guguuuccag ugacac 36

<210> 302

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 302

ugcccucaau agucagaugu guguccacag ugacac 36

<210> 303

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 303

ucucaaugau acuuagauac guguccucag ugacac 36

<210> 304

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 304

ucucaaugau acucagacau guguccccag ugacac 36

<210> 305

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 305

ucucaaugau acuaagacau guguccucag ugacac 36

<210> 306

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 306

ucucaacuau acucagacau guguccucag ugacac 36

<210> 307

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 307

ucucaacgau acucagacau guguccucag ugacac 36

<210> 308

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 308

ucucaacgau acuaagauau guguccucag cgacac 36

<210> 309

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 309

ucucaacgau acuaagauau guguccccag ugacac 36

<210> 310

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 310

ucucaacgau acuaagauau guguccacag ugacac 36

<210> 311

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 311

ucucaacaau acucagacau guguccccag ugacac 36

<210> 312

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 312

ucucaacaau acuaaggcau guguccccag ugaccc 36

<210> 313

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 313

ucucaaagau acucagacac guguccccag ugacac 36

<210> 314

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 314

ucucaaaaau acucagacau guguccucag ugacac 36

<210> 315

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 315

gcgaaacaac agucagacau guguccccag ugacac 36

<210> 316

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 316

ccucaacgau auuaagacau guguccgcag ugacac 36

<210> 317

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 317

agacaugugu ccucagugac ac 22

<210> 318

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 318

guuggaauga cuaauuuuug ugcccaccgu uggcac 36

<210> 319

<211> 24

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 319

aauuuuugug cccaucguug gcac 24

<210> 320

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 320

auuuuugugc ccaucguugg cac 23

<210> 321

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 321

cuagcaauga ccuaauagug uguccuuagu ugacau 36

<210> 322

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 322

ccuacaauac cuaagaaauc cguccuaagu ugacgg 36

<210> 323

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 323

auaguguguc cuuaguugac au 22

<210> 324

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 324

agaaauccgu cuuucauuga cggcagggcc ugucugggga guc 43

<210> 325

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 325

agaaauccgu cuuucauuga cgguccccag cccugcucgu ggu 43

<210> 326

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 326

agaaauccgu cuuucauuga cggggucacc acgagcaggg cug 43

<210> 327

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 327

agaaauccgu cuuucauuga cggaccugca gcuucuccaa cac 43

<210> 328

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 328

agaaauccgu cuuucauuga cgguccaaca caucggagag cuu 43

<210> 329

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 329

agaaauccgu cuuucauuga cgggugcuaa acugguaccg cau 43

<210> 330

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 330

agaaauccgu cuuucauuga cgggaucugc gccuuggggg cca 43

<210> 331

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 331

ttaggtaggt ggggtcggcg 20

<210> 332

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 332

cagggcctgt ctggggagtc 20

<210> 333

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 333

tccccagccc tgctcgtggt 20

<210> 334

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 334

ggtcaccacg agcagggctg 20

<210> 335

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 335

acctgcagct tctccaacac 20

<210> 336

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 336

tccaacacat cggagagctt 20

<210> 337

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 337

gtgctaaact ggtaccgcat 20

<210> 338

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 338

cccgaggacc gcagccagcc 20

<210> 339

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 339

cgtgtcacac aactgcccaa 20

<210> 340

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 340

cacatgagcg tggtcagggc 20

<210> 341

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体

<400> 341

gatctgcgcc ttgggggcca 20

Claims

1.一种包含RNA指导物的组合物，其中该RNA指导物包含(i)与PDCD1基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列；其中该靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻。

2.如权利要求1所述的组合物，其中该靶序列在该PDCD1基因的外显子1、外显子2、外显子3或外显子4内。

3.如权利要求1或2所述的组合物，其中该PDCD1基因包含SEQ ID NO:277的序列、SEQID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。

4.如权利要求1至3中任一项所述的组合物，其中该间隔子序列包含：

a.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸16；

b.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸17；

c.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸18；

d.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸19；

e.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸20；

f.与SEQ ID NO:143-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸21；

g.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸22；

h.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸23；

i.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸24；

j.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸25；

k.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸26；

l.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸27；

m.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸28；

n.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸29；或

o.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸30。

5.如权利要求1至4中任一项所述的组合物，其中该间隔子序列包含：

a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16；

b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17；

c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18；

d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19；

e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20；

f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21；

g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22；

h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23；

i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24；

j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25；

k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26；

l.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27；

m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28；

n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29；或

o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。

6.如权利要求1至5中任一项所述的组合物，其中该同向重复序列包含：

a.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；

b.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；

c.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；

d.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；

e.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；

f.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；

g.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；

h.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；

i.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；

j.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；

k.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；

l.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；

m.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；

n.与SEQ ID NO:1-8中任一个的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；

o.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸1至核苷酸34；

p.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸2至核苷酸34；

q.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸3至核苷酸34；

r.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸4至核苷酸34；

s.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸5至核苷酸34；

t.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸6至核苷酸34；

u.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸7至核苷酸34；

v.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸8至核苷酸34；

w.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸9至核苷酸34；

x.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸10至核苷酸34；

y.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸11至核苷酸34；

z.与SEQ ID NO:9的序列具有至少90％同一性的序列的核苷酸12至核苷酸34；或

aa.与SEQ ID NO:10的序列或其一部分具有至少90％同一性的序列。

7.如权利要求1至6中任一项所述的组合物，其中该同向重复序列包含：

a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36；

b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36；

c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36；

d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36；

e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36；

f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36；

g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36；

h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36；

i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36；

j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36；

k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36；

l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36；

m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36；

n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36；

o.SEQ ID NO:9的核苷酸1至核苷酸34；

p.SEQ ID NO:9的核苷酸2至核苷酸34；

q.SEQ ID NO:9的核苷酸3至核苷酸34；

r.SEQ ID NO:9的核苷酸4至核苷酸34；

s.SEQ ID NO:9的核苷酸5至核苷酸34；

t.SEQ ID NO:9的核苷酸6至核苷酸34；

u.SEQ ID NO:9的核苷酸7至核苷酸34；

v.SEQ ID NO:9的核苷酸8至核苷酸34；

w.SEQ ID NO:9的核苷酸9至核苷酸34；

x.SEQ ID NO:9的核苷酸10至核苷酸34；

y.SEQ ID NO:9的核苷酸11至核苷酸34；

z.SEQ ID NO:9的核苷酸12至核苷酸34；或

aa.SEQ ID NO:10或其一部分。

8.如权利要求1至5中任一项所述的组合物，其中该同向重复序列包含：

a.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；

b.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；

c.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；

d.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；

e.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；

f.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；

g.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；

h.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；

i.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；

j.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；

k.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；

l.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；

m.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；

n.与SEQ ID NO:299-316中任一个的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；或

o.与SEQ ID NO:317的序列或其一部分具有至少90％同一性的序列。

9.如权利要求1至5或8中任一项所述的组合物，其中该同向重复序列包含：

a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36；

b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36；

c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36；

d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36；

e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36；

f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36；

g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36；

h.SEQ ID NO:299-316中任一个的核苷酸8至核苷酸36；

i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36；

j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36；

k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36；

l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36；

m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36；

n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36；或

o.SEQ ID NO:317或其一部分。

10.如权利要求1至5中任一项所述的组合物，其中该同向重复序列包含：

a.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸1至核苷酸36；

b.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸2至核苷酸36；

c.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸3至核苷酸36；

d.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸4至核苷酸36；

e.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸5至核苷酸36；

f.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸6至核苷酸36；

g.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸7至核苷酸36；

h.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸8至核苷酸36；

i.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸9至核苷酸36；

j.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸10至核苷酸36；

k.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸11至核苷酸36；

l.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸12至核苷酸36；

m.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸13至核苷酸36；

n.与SEQ ID NO:318具有至少90％同一性的序列的核苷酸14至核苷酸36；或

o.与SEQ ID NO:319或SEQ ID NO:320的序列或其一部分具有至少90％同一性的序列。

11.如权利要求1至5或10中任一项所述的组合物，其中该同向重复序列包含：

a.SEQ ID NO:318的核苷酸1至核苷酸36；

b.SEQ ID NO:318的核苷酸2至核苷酸36；

c.SEQ ID NO:318的核苷酸3至核苷酸36；

d.SEQ ID NO:318的核苷酸4至核苷酸36；

e.SEQ ID NO:318的核苷酸5至核苷酸36；

f.SEQ ID NO:318的核苷酸6至核苷酸36；

g.SEQ ID NO:318的核苷酸7至核苷酸36；

h.SEQ ID NO:318的核苷酸8至核苷酸36；

i.SEQ ID NO:318的核苷酸9至核苷酸36；

j.SEQ ID NO:318的核苷酸10至核苷酸36；

k.SEQ ID NO:318的核苷酸11至核苷酸36；

l.SEQ ID NO:318的核苷酸12至核苷酸36；

m.SEQ ID NO:318的核苷酸13至核苷酸36；

n.SEQ ID NO:318的核苷酸14至核苷酸36；或

o.SEQ ID NO:319或SEQ ID NO:320或其一部分。

12.如权利要求1至5中任一项所述的组合物，其中该同向重复序列包含：

a.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸1至核苷酸36；

b.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸2至核苷酸36；

c.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸3至核苷酸36；

d.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸4至核苷酸36；

e.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸5至核苷酸36；

f.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸6至核苷酸36；

g.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸7至核苷酸36；

h.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸8至核苷酸36；

i.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸9至核苷酸36；

j.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸10至核苷酸36；

k.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸11至核苷酸36；

l.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸12至核苷酸36；

m.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸13至核苷酸36；

n.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸14至核苷酸36；

o.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90％同一性的序列的核苷酸15至核苷酸36；或

p.与SEQ ID NO:323的序列或其一部分具有至少90％同一性的序列。

13.如权利要求1至5或12中任一项所述的组合物，其中该同向重复序列包含：

a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36；

b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36；

c.SEQ ID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36；

d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36；

e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36；

f.SEQ ID NO:321或SEQ ID NO:322的核苷酸6至核苷酸36；

g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36；

h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36；

i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36；

j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36；

k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36；

l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36；

m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36；

n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36；

o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36；或

p.SEQ ID NO:323或其一部分。

14.如权利要求1至13中任一项所述的组合物，其中该间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。

15.如权利要求1所述的组合物，其中该PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’或5’-CTTC-3’。

16.如权利要求1或15所述的组合物，其中该靶序列紧邻该PAM序列。

17.如权利要求1至16中任一项所述的组合物，其中该组合物进一步包含Cas12i多肽。

18.如权利要求17所述的组合物，其中该Cas12i多肽是：

a.Cas12i2多肽，其包含与SEQ ID NO:276、SEQ ID NO:287、SEQ ID NO:288、SEQ IDNO:289、SEQ ID NO:290、或SEQ ID NO:291的序列具有至少90％同一性的序列；

b.Cas12i4多肽，其包含与SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列具有至少90％同一性的序列；

c.Cas12i1多肽，其包含与SEQ ID NO:297的序列具有至少90％同一性的序列；或

d.Cas12i3多肽，其包含与SEQ ID NO:298的序列具有至少90％同一性的序列。

19.如权利要求18所述的组合物，其中该Cas12i多肽是：

a.Cas12i2多肽，其包含SEQ ID NO:276、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的序列；

b.Cas12i4多肽，其包含SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列；

c.Cas12i1多肽，其包含SEQ ID NO:297的序列；或

d.Cas12i3多肽，其包含SEQ ID NO:298的序列。

20.如权利要求17至19中任一项所述的组合物，其中该RNA指导物和该Cas12i多肽形成核糖核蛋白复合物。

21.如权利要求20所述的组合物，其中该核糖核蛋白复合物与靶核酸结合。

22.如权利要求20或21所述的组合物，其中该组合物存在于细胞内。

23.如权利要求17至22中任一项所述的组合物，其中该RNA指导物和该Cas12i多肽被编码在载体中，例如表达载体中。

24.如权利要求23所述的组合物，其中该RNA指导物和该Cas12i多肽被编码在单一载体中，或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。

25.一种RNA指导物，其包含(i)与PDCD1基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列。

26.如权利要求25所述的RNA指导物，其中该靶序列在该PDCD1基因的外显子1、外显子2、外显子3或外显子4内。

27.如权利要求25或26所述的RNA指导物，其中该PDCD1基因包含SEQ ID NO:277的序列、SEQ ID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。

28.如权利要求25至27中任一项所述的RNA指导物，其中该间隔子序列包含：

29.如权利要求25至28中任一项所述的RNA指导物，其中该间隔子序列包含：

a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16；

b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17；

c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18；

d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19；

e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20；

f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21；

g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22；

h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23；

i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24；

j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25；

k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26；

l.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27；

m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28；

n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29；或

o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。

30.如权利要求25至29中任一项所述的RNA指导物，其中该同向重复序列包含：

31.如权利要求25至30中任一项所述的RNA指导物，其中该同向重复序列包含：

a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36；

b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36；

c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36；

d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36；

e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36；

f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36；

g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36；

h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36；

i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36；

j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36；

k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36；

l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36；

m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36；

n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36；

o.SEQ ID NO:9的核苷酸1至核苷酸34；

p.SEQ ID NO:9的核苷酸2至核苷酸34；

q.SEQ ID NO:9的核苷酸3至核苷酸34；

r.SEQ ID NO:9的核苷酸4至核苷酸34；

s.SEQ ID NO:9的核苷酸5至核苷酸34；

t.SEQ ID NO:9的核苷酸6至核苷酸34；

u.SEQ ID NO:9的核苷酸7至核苷酸34；

v.SEQ ID NO:9的核苷酸8至核苷酸34；

w.SEQ ID NO:9的核苷酸9至核苷酸34；

x.SEQ ID NO:9的核苷酸10至核苷酸34；

y.SEQ ID NO:9的核苷酸11至核苷酸34；

z.SEQ ID NO:9的核苷酸12至核苷酸34；或

aa.SEQ ID NO:10或其一部分。

32.如权利要求25至29中任一项所述的RNA指导物，其中该同向重复序列包含：

33.如权利要求25至29或32中任一项所述的RNA指导物，其中该同向重复序列包含：

a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36；

b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36；

c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36；

d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36；

e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36；

f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36；

g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36；

h.SEQ ID NO:299-316中任一个的核苷酸8至核苷酸36；

i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36；

j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36；

k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36；

l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36；

m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36；

n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36；或

o.SEQ ID NO:317或其一部分。

34.如权利要求25至29中任一项所述的RNA指导物，其中该同向重复序列包含：

35.如权利要求25至29或34中任一项所述的RNA指导物，其中该同向重复序列包含：

a.SEQ ID NO:318的核苷酸1至核苷酸36；

b.SEQ ID NO:318的核苷酸2至核苷酸36；

c.SEQ ID NO:318的核苷酸3至核苷酸36；

d.SEQ ID NO:318的核苷酸4至核苷酸36；

e.SEQ ID NO:318的核苷酸5至核苷酸36；

f.SEQ ID NO:318的核苷酸6至核苷酸36；

g.SEQ ID NO:318的核苷酸7至核苷酸36；

h.SEQ ID NO:318的核苷酸8至核苷酸36；

i.SEQ ID NO:318的核苷酸9至核苷酸36；

j.SEQ ID NO:318的核苷酸10至核苷酸36；

k.SEQ ID NO:318的核苷酸11至核苷酸36；

l.SEQ ID NO:318的核苷酸12至核苷酸36；

m.SEQ ID NO:318的核苷酸13至核苷酸36；

n.SEQ ID NO:318的核苷酸14至核苷酸36；或

o.SEQ ID NO:319或SEQ ID NO:320或其一部分。

36.如权利要求25至29中任一项所述的RNA指导物，其中该同向重复序列包含：

37.如权利要求25至29或36中任一项所述的RNA指导物，其中该同向重复序列包含：

a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36；

b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36；

c.SEQ ID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36；

d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36；

e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36；

f.SEQ ID NO:321或SEQ ID NO:322的核苷酸6至核苷酸36；

g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36；

h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36；

i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36；

j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36；

k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36；

l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36；

m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36；

n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36；

o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36；或

p.SEQ ID NO:323或其一部分。

38.如权利要求25至37中任一项所述的RNA指导物，其中该间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。

39.如权利要求25至38中任一项所述的RNA指导物，其中该靶序列与包含该序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻，其中N是任何核苷酸。

40.如权利要求39所述的RNA指导物，其中该PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’或5’-CTTC-3’。

41.如权利要求39或40所述的RNA指导物，其中该靶序列紧邻该PAM序列。

42.一种核酸，其编码如权利要求25至41中任一项所述的RNA指导物。

43.一种载体，其包含如权利要求42所述的核酸。

44.一种载体系统，其包含一个或多个编码(i)如权利要求1至41中任一项所定义的RNA指导物和(ii)Cas12i多肽的载体，任选地其中该载体系统包含编码该RNA指导物的第一载体以及编码该Cas12i多肽的第二载体。

45.一种细胞，其包含如权利要求1至24中任一项所述的组合物、如权利要求25至41中任一项所述的RNA指导物、如权利要求42所述的核酸、如权利要求43所述的载体或如权利要求44所述的载体系统。

46.如权利要求45所述的细胞，其中该细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞、或T细胞。

47.一种试剂盒，其包含如权利要求1至24中任一项所述的组合物、如权利要求25至41中任一项所述的RNA指导物、如权利要求42所述的核酸、如权利要求43所述的载体或如权利要求44所述的载体系统。

48.一种编辑PDCD1序列的方法，该方法包括使PDCD1序列与如权利要求1至24中任一项所述的组合物或如权利要求25至41中任一项所述的RNA指导物接触。

49.如权利要求48所述的方法，其中该PDCD1序列在细胞中。

50.如权利要求48或49所述的方法，其中该组合物或该RNA指导物诱导该PDCD1序列中的缺失。

51.如权利要求50所述的方法，其中该缺失与5'-NTTN-3'序列相邻，其中N是任何核苷酸。

52.如权利要求50或51所述的方法，其中该缺失在该5'-NTTN-3'序列的下游。

53.如权利要求50至52中任一项所述的方法，其中该缺失的长度多达约50个核苷酸。

54.如权利要求50至53中任一项所述的方法，其中该缺失的长度多达约40个核苷酸。

55.如权利要求50至54中任一项所述的方法，其中该缺失的长度为约4个核苷酸至40个核苷酸。

56.如权利要求50至55中任一项所述的方法，其中该缺失的长度为约4个核苷酸至25个核苷酸。

57.如权利要求50至56中任一项所述的方法，其中该缺失的长度为约10个核苷酸至25个核苷酸。

58.如权利要求50至57中任一项所述的方法，其中该缺失的长度为约10个核苷酸至15个核苷酸。

59.如权利要求50至58中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的约5个核苷酸至约15个核苷酸内开始。

60.如权利要求50至59中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的约5个核苷酸至约10个核苷酸内开始。

61.如权利要求50至60中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的约10个核苷酸至约15个核苷酸内开始。

62.如权利要求50至61中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始。

63.如权利要求50至62中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始。

64.如权利要求50至63中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始。

65.如权利要求50至64中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的约20个核苷酸至约30个核苷酸内结束。

66.如权利要求50至65中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的约20个核苷酸至约25个核苷酸内结束。

67.如权利要求50至66中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的约25个核苷酸至约30个核苷酸内结束。

68.如权利要求50至67中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。

69.如权利要求50至68中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。

70.如权利要求50至69中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。

71.如权利要求50至70中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。

72.如权利要求50至71中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。

73.如权利要求50至72中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。

74.如权利要求50至73中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。

75.如权利要求50至74中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。

76.如权利要求50至75中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。

77.如权利要求50至76中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。

78.如权利要求50至77中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。

79.如权利要求50至78中任一项所述的方法，其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始，并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。

80.如权利要求50至79中任一项所述的方法，其中该5'-NTTN-3'序列是5'-CTTT-3'、5'-CTTC-3'、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。

81.如权利要求50至80中任一项所述的方法，其中该缺失与该PDCD1序列中的突变重叠。

82.如权利要求50至81中任一项所述的方法，其中该缺失与该PDCD1序列中的插入重叠。

83.如权利要求50至82中任一项所述的方法，其中该缺失去除该PDCD1序列或其一部分的重复扩展。

84.如权利要求50至83中任一项所述的方法，其中该缺失破坏该PDCD1序列的一个或两个等位基因。

85.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法，其中该RNA指导物不由以下序列组成：

AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGG UCGGCG(SEQ ID NO:283)；AGAAAUCCGUCUUUCAUUGAC GGCCCGAGGACCGCAGCCAGCC(SEQ ID NO:284)；AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285)；或AGAAAUCCGUCUUUCAUUGACGGCACAUGAGCGUGGUCAGGGC(SEQ ID NO:286)。

86.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法，其中该RNA指导物包含SEQ ID NO:324-330中任一个的序列。