CN116670275A - 包含靶向pdcd1的rna指导物的组合物及其用途 - Google Patents

包含靶向pdcd1的rna指导物的组合物及其用途 Download PDF

Info

Publication number
CN116670275A
CN116670275A CN202180080045.2A CN202180080045A CN116670275A CN 116670275 A CN116670275 A CN 116670275A CN 202180080045 A CN202180080045 A CN 202180080045A CN 116670275 A CN116670275 A CN 116670275A
Authority
CN
China
Prior art keywords
nucleotide
sequence
seq
identity
nos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180080045.2A
Other languages
English (en)
Inventor
Q·N·韦斯塞尔
J·R·哈斯韦尔
T·M·迪托马索
N·M·贾基莫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abbott Biotechnology
Original Assignee
Abbott Biotechnology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abbott Biotechnology filed Critical Abbott Biotechnology
Priority claimed from PCT/US2021/057432 external-priority patent/WO2022094329A1/en
Publication of CN116670275A publication Critical patent/CN116670275A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及包含靶向PDCD1的RNA指导物的组合物、表征这些组合物的方法、包含这些组合物的细胞以及使用这些组合物的方法。

Description

包含靶向PDCD1的RNA指导物的组合物及其用途
序列表
本申请含有已以ASCII格式以电子方式提交且特此通过援引以其全文并入的序列表。所述ASCII副本创建于2021年10月29日,名为51451-016WO3_Sequence_Listing_10_29_21_ST25,并且大小为189,383字节。
背景技术
成簇规律间隔短回文重复序列(CRISPR)和CRISPR相关(Cas)基因(统称为CRISPR-Cas或CRISPR/Cas系统)是古细菌和细菌中针对外来遗传元件而防御特定物种的适应性免疫系统。
发明内容
正是在上述背景下,本发明提供了优于现有技术的某些优点和进步。尽管本文披露的本发明不限于特定优点或功能,但本发明提供了包含RNA指导物的组合物,其中该RNA指导物包含(i)与PDCD1基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列;其中该靶序列与包含序列5′-NTTN-3′的原型间隔子相邻基序(PAM)相邻。
在组合物的一方面,靶序列在PDCD1基因的外显子1、外显子2、外显子3或外显子4内。
在组合物的另一方面,PDCD1基因包含SEQ ID NO:277的序列、SEQ ID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。
在组合物的另一方面,间隔子序列包含:a.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQ IDNO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在组合物的另一方面,间隔子序列包含:a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25;k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26;l.SEQID NO:143-255和257-274中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28;n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29;或o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ IDNO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:317的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36;h.SEQ IDNO:299-316中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:317或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ IDNO:319或SEQ ID NO:320的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:318的核苷酸1至核苷酸36;b.SEQ ID NO:318的核苷酸2至核苷酸36;c.SEQ ID NO:318的核苷酸3至核苷酸36;d.SEQ ID NO:318的核苷酸4至核苷酸36;e.SEQ ID NO:318的核苷酸5至核苷酸36;f.SEQID NO:318的核苷酸6至核苷酸36;g.SEQ ID NO:318的核苷酸7至核苷酸36;h.SEQ ID NO:318的核苷酸8至核苷酸36;i.SEQ ID NO:318的核苷酸9至核苷酸36;j.SEQ ID NO:318的核苷酸10至核苷酸36;k.SEQ ID NO:318的核苷酸11至核苷酸36;l.SEQ ID NO:318的核苷酸12至核苷酸36;m.SEQ ID NO:318的核苷酸13至核苷酸36;n.SEQ ID NO:318的核苷酸14至核苷酸36;或o.SEQ ID NO:319或SEQ ID NO:320或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:321或SEQID NO:322的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ IDNO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:321或SEQ IDNO:322的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ IDNO:323的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36;b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36;c.SEQID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36;d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36;e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36;f.SEQ IDNO:321或SEQ ID NO:322的核苷酸6至核苷酸36;g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36;h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36;i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36;j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36;k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36;l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36;m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36;n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36;o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36;或p.SEQ ID NO:323或其一部分。
在组合物的另一方面,间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。
在组合物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在组合物的另一方面,靶序列紧邻PAM序列。
在组合物的另一方面,组合物还包含Cas12i多肽。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含与SEQ ID NO:276、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的序列具有至少90%同一性的序列;b.Cas12i4多肽,其包含与SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列具有至少90%同一性的序列;c.Cas12i1多肽,其包含与SEQ ID NO:297的序列具有至少90%同一性的序列;或d.Cas12i3多肽,其包含与SEQ ID NO:298的序列具有至少90%同一性的序列。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含SEQ ID NO:276、SEQID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的序列;b.Cas12i4多肽,其包含SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列;c.Cas12i1多肽,其包含SEQ ID NO:297的序列;或d.Cas12i3多肽,其包含SEQ ID NO:298的序列。
在组合物的另一方面,RNA指导物和Cas12i多肽形成核糖核蛋白复合物。
在组合物的另一方面,核糖核蛋白复合物结合靶核酸。
在组合物的另一方面,组合物存在于细胞内。
在组合物的另一方面,RNA指导物和Cas12i多肽被编码在载体(例如,表达载体)中。在组合物的另一方面,RNA指导物和Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
本发明还提供了一种载体系统,该载体系统包含一个或多个编码本文披露的RNA指导物和Cas12i多肽的载体。在实施例中,载体系统包含编码本文披露的RNA指导物的第一载体以及编码Cas12i多肽的第二载体。载体可以是表达载体。
本发明进一步提供包含RNA指导物和Cas12i多肽的组合物,其中所述RNA指导物包含(i)与PDCD1基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列。
在组合物的一方面,靶序列在PDCD1基因的外显子1、外显子2、外显子3或外显子4内。
在组合物的另一方面,PDCD1基因包含SEQ ID NO:277的序列、SEQ ID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。
在组合物的另一方面,间隔子序列包含:a.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQ IDNO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在组合物的另一方面,间隔子序列包含:a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25;k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26;l.SEQID NO:143-255和257-274中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28;n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29;或o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ IDNO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ IDNO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:317的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36;h.SEQ IDNO:299-316中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:317或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ IDNO:319或SEQ ID NO:320的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:318的核苷酸1至核苷酸36;b.SEQ ID NO:318的核苷酸2至核苷酸36;c.SEQ ID NO:318的核苷酸3至核苷酸36;d.SEQ ID NO:318的核苷酸4至核苷酸36;e.SEQ ID NO:318的核苷酸5至核苷酸36;f.SEQID NO:318的核苷酸6至核苷酸36;g.SEQ ID NO:318的核苷酸7至核苷酸36;h.SEQ ID NO:318的核苷酸8至核苷酸36;i.SEQ ID NO:318的核苷酸9至核苷酸36;j.SEQ ID NO:318的核苷酸10至核苷酸36;k.SEQ ID NO:318的核苷酸11至核苷酸36;l.SEQ ID NO:318的核苷酸12至核苷酸36;m.SEQ ID NO:318的核苷酸13至核苷酸36;n.SEQ ID NO:318的核苷酸14至核苷酸36;或o.SEQ ID NO:319或SEQ ID NO:320或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:321或SEQID NO:322的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ IDNO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:321或SEQ IDNO:322的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ IDNO:323的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36;b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36;c.SEQID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36;d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36;e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36;f.SEQ IDNO:321或SEQ ID NO:322的核苷酸6至核苷酸36;g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36;h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36;i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36;j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36;k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36;l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36;m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36;n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36;o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36;或p.SEQ ID NO:323或其一部分。
在组合物的另一方面,间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。
在组合物的另一方面,该靶序列与包含序列5′-NTTN-3′的原型间隔子相邻基序(PAM)相邻。
在组合物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在组合物的另一方面,靶序列紧邻PAM序列。
在组合物的另一方面,靶序列在PAM序列的1、2、3、4或5个核苷酸内。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含与SEQ ID NO:276、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的序列具有至少90%同一性的序列;b.Cas12i4多肽,其包含与SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列具有至少90%同一性的序列;c.Cas12i1多肽,其包含与SEQ ID NO:297的序列具有至少90%同一性的序列;或d.Cas12i3多肽,其包含与SEQ ID NO:298的序列具有至少90%同一性的序列。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含SEQ ID NO:276、SEQID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的序列;b.Cas12i4多肽,其包含SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列;c.Cas12i1多肽,其包含SEQ ID NO:297的序列;或d.Cas12i3多肽,其包含SEQ ID NO:298的序列。
在组合物的另一方面,RNA指导物和Cas12i多肽形成核糖核蛋白复合物。
在组合物的另一方面,核糖核蛋白复合物结合靶核酸。
在组合物的另一方面,组合物存在于细胞内。
在组合物的另一方面,RNA指导物和Cas12i多肽被编码在载体(例如,表达载体)中。在组合物的另一方面,RNA指导物和Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
本发明还提供了一种载体系统,该载体系统包含一个或多个编码本文披露的RNA指导物和Cas12i多肽的载体。在实施例中,载体系统包含编码本文披露的RNA指导物的第一载体以及编码Cas12i多肽的第二载体。载体可以是表达载体。
在组合物的另一方面,RNA指导物不由以下序列组成:AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGGUCGGCG(SEQ ID NO:283);AGAAAUCCGUCUUUCAUUGACGGCCCGAGGACCGCAGCCAGCC(SEQ ID NO:284);AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285);或AGAAAUCCGUCUUUCAUUGAC GGCACAUGAGCGUGGUCAGGGC(SEQ ID NO:286)。
本发明还进一步提供了一种RNA指导物,其包含(i)基本上与PDCD1基因内的靶序列互补的间隔子序列和(ii)同向重复序列。
在RNA指导物的一方面,靶序列在PDCD1基因的外显子1、外显子2、外显子3或外显子4内。
在RNA指导物的另一方面,PDCD1基因包含SEQ ID NO:277的序列、SEQ ID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。
在RNA指导物的另一方面,间隔子序列包含:a.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在RNA指导物的另一方面,间隔子序列包含:a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25;k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26;l.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28;n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29;或o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ IDNO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ IDNO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:317的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36;h.SEQ IDNO:299-316中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:317或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQID NO:319或SEQ ID NO:320的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:318的核苷酸1至核苷酸36;b.SEQ ID NO:318的核苷酸2至核苷酸36;c.SEQ ID NO:318的核苷酸3至核苷酸36;d.SEQ ID NO:318的核苷酸4至核苷酸36;e.SEQ ID NO:318的核苷酸5至核苷酸36;f.SEQID NO:318的核苷酸6至核苷酸36;g.SEQ ID NO:318的核苷酸7至核苷酸36;h.SEQ ID NO:318的核苷酸8至核苷酸36;i.SEQ ID NO:318的核苷酸9至核苷酸36;j.SEQ ID NO:318的核苷酸10至核苷酸36;k.SEQ ID NO:318的核苷酸11至核苷酸36;l.SEQ ID NO:318的核苷酸12至核苷酸36;m.SEQ ID NO:318的核苷酸13至核苷酸36;n.SEQ ID NO:318的核苷酸14至核苷酸36;或o.SEQ ID NO:319或SEQ ID NO:320或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:321或SEQID NO:322的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ IDNO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ IDNO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:321或SEQ IDNO:322的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ IDNO:323的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36;b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36;c.SEQID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36;d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36;e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36;f.SEQ IDNO:321或SEQ ID NO:322的核苷酸6至核苷酸36;g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36;h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36;i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36;j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36;k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36;l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36;m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36;n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36;o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36;或p.SEQ ID NO:323或其一部分。
在RNA指导物的另一方面,间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。
在RNA指导物的另一方面,靶序列与包含序列5'-NTTN-3′的原型间隔子相邻基序(PAM)相邻,其中N是任何核苷酸。
在RNA指导物的另一方面,RNA指导物不由以下序列组成:AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGGUCGGCG(SEQ ID NO:283);AGAAAUCCGUCUUUCAUUGACGGCCCGAGGACCGCAGCCAGCC(SEQ ID NO:284);AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285);或AGAAAUCCGUCUUUCAUUGAC GGCACAUGAGCGUGGUCAGGGC(SEQ IDNO:286)。
在RNA指导物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在RNA指导物的另一方面,靶序列紧邻PAM序列。
在RNA指导物的另一方面,靶序列在PAM序列的1、2、3、4或5个核苷酸内。
本发明还进一步提供了编码如本文所述的RNA指导物的核酸。
本发明还进一步提供了包含本文所述的此类RNA指导物的载体。
本发明还进一步提供了包含如本文所述的组合物、RNA指导物、核酸或载体的细胞。
在细胞的一个方面,细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞或T细胞。
本发明还进一步提供了包含如本文所述的组合物、RNA指导物、核酸或载体的试剂盒。
本发明还进一步提供了一种编辑PDCD1序列的方法,该方法包括使PDCD1序列与本文所述的组合物或RNA指导物接触。在实施例中,该方法在体外进行。在实施例中,该方法离体进行。
在该方法的一方面,PDCD1序列在细胞中。
在该方法的一方面,组合物或RNA指导物诱导PDCD1序列的缺失。
在该方法的一方面,缺失与5′-NTTN-3'序列相邻,其中N是任何核苷酸。
在该方法的一方面,缺失是在5′-NTTN-3'序列的下游。
在该方法的一方面,缺失长度多达约40个核苷酸。
在该方法的一方面,缺失长度为约4个核苷酸至40个核苷酸。
在该方法的一方面,缺失长度为约4个核苷酸至25个核苷酸。
在该方法的一方面,缺失长度为约10个核苷酸至25个核苷酸。
在该方法的一方面,缺失长度为约10个核苷酸至15个核苷酸。
在该方法的一方面,缺失在5′-NTTN-3′序列的约5个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5′-NTTN-3'序列的约5个核苷酸至约10个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的约10个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约5个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约5个核苷酸至约10个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3′序列的下游约10个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5′-NTTN-3'序列的约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3′序列的约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3′序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5′-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3′序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5′-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5′-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5′-NTTN-3′序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5′-NTTN-3′序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5′-NTTN-3′序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5′-NTTN-3′序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5′-NTTN-3′序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,5′-NTTN-3'序列是5′-CTTT-3′、5'-CTTC-3'、5'-GTTT-3′、5′-GTTC-3′、5′-TTTC-3′、5′-GTTA-3′或5′-GTTG-3′。
在该方法的一方面,缺失与基因中的突变重叠。
在该方法的一方面,缺失与基因中的插入重叠。
在该方法的一方面,缺失去除了基因或其一部分的重复扩展。
在该方法的一方面,缺失破坏了基因的一个或两个等位基因。
在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面,RNA指导物不由以下序列组成:AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGGUCGGCG(SEQ ID NO:283);AGAAAUCCGUCUUUCAUUGACGG CCCGAGGACCGCAGCCAGCC(SEQ ID NO:284);AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285);或AGAAAUCCGUCUUUCAUUGACGGCACAUGAGCGUGGUCAGGGC(SEQ ID NO:286)。
在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面,RNA指导物包含SEQ ID NO:324-330中任一个的序列。
定义
本发明将相对于具体实施例来说明,但本发明并不受限于此而只受权利要求限制。除非另有说明,否则下文阐述的术语通常应以其常见意义来理解。
如本文所用,术语“活性”是指生物活性。在一些实施例中,活性包括酶活性,例如效应子的催化能力。例如,活性可以包括核酸酶活性。
如本文所用,术语“Cas12i多肽”(本文也称为Cas12i)是指与RNA指导物指定的靶核酸上的靶序列结合的多肽,其中该多肽与野生型Cas12i多肽具有至少一些氨基酸序列同源性。在一些实施例中,Cas12i多肽与美国专利号10,808,245的SEQ ID NO:1-5和11-18中任一个包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,其通过引用整体并入本文。在一些实施例中,Cas12i多肽与美国专利号10,808,245的SEQ ID NO:3(Cas12i1)、SEQ ID NO:5(Cas12i2)、SEQ ID NO:14(Cas12i3)或SEQ ID NO:16(Cas12i4)(对应于本申请的SEQ ID NO:297、276、298和294)中任一个包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施例中,本披露的Cas12i多肽是如PCT/US 2021/025257中所述的Cas12i1多肽或Cas12i2多肽。在一些实施例中,Cas12i多肽切割靶核酸(例如,作为切口或双链断裂)。
如本文所用,术语“复合物”是指两个或更多个分子的群化。在一些实施例中,复合物包含彼此相互作用(例如,结合、接触、粘附)的多肽和核酸分子。如本文所用,术语“复合物”可以指RNA指导物和多肽(例如,Cas12i多肽)的组化。如本文所用,术语“复合物”可指RNA指导物、多肽和靶序列的组化。如本文所用,术语“复合物”可以指靶向PDCD1的RNA指导物和Cas12i多肽的组化。
如本文所用,术语“原型间隔子相邻基序”或“PAM”是指与靶序列(例如,PDCD1靶序列)相邻的DNA序列,包含RNA指导物(例如,靶向PDCD1的RNA指导物)和Cas12i多肽的复合物与该靶序列结合。在双链靶标的情况下,RNA指导物结合靶标的第一链(例如,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(例如,非靶链或非间隔子互补链)。如本文所用,术语“相邻”包括其中包含RNA指导物和Cas12i多肽的复合物的RNA指导物与紧邻PAM的靶序列特异性结合、相互作用或缔合的情况。在此类情况下,在靶序列与PAM之间没有核苷酸。术语“相邻”还包括在与RNA指导物结合的靶序列与PAM之间存在少数(例如,1、2、3、4或5个)核苷酸的情况。在一些实施例中,如本文所述的PAM序列存在于非靶链(例如,非间隔子互补链)中。术语“相邻”包括本文所述的PAM序列,其与非靶链中的序列直接相邻(或在非靶链中的序列的少量,例如1、2、3、4或5个核苷酸内)。
如本文所用,术语“PDCD1”是指“程序性细胞死亡蛋白1”。PDCD1,也称为PD-1和CD279,是细胞表面蛋白,其下调免疫系统对身体细胞的反应,并通过抑制T细胞炎症活性来促进自我耐受。如本文所阐述的SEQ ID NO:277提供了PDCD1基因序列的实例。应当理解,本文所述的间隔子序列可以靶向SEQ ID NO:277或其反向互补序列,这取决于它们是如表5中所列的“+”还是“-”所示。表5和表6中列出的靶序列位于PDCD1基因的非靶链上。
如本文所用,术语“RNA指导物”是指促进本文所述的多肽(例如,Cas12i多肽)靶向靶序列(例如,PDCD1基因的序列)的任何RNA分子。RNA指导物可以被设计成包括与特定的核酸序列(例如,PDCD1核酸序列)互补的序列的分子。RNA指导物可以包含靶向DNA的序列(即,间隔子序列)和同向重复(DR)序列。术语“crRNA”在本文中也用于指RNA指导物。
在一些实施例中,间隔子序列与靶序列互补。如本文所用,术语“互补”是指第一核酸分子(例如RNA指导物)的核碱基与第二核酸分子(例如靶序列)的核碱基碱基配对的能力。两个互补的核酸分子能够在适当的温度和溶液离子强度条件下非共价结合。在一些实施例中,第一核酸分子(例如,RNA指导物的间隔子序列)包含与第二核酸(例如,靶序列)的100%互补性。在一些实施例中,如果第一核酸分子包含与第二核酸至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的互补性,则第一核酸分子(例如RNA指导物的间隔子序列)与第二核酸分子(例如靶序列)互补。如本文所用,术语“基本上互补”是指与靶序列具有一定水平互补性的多核苷酸(例如,RNA指导物的间隔子序列)。在一些实施例中,互补性水平使得多核苷酸可以以足够的亲和力与靶序列杂交,以允许与多核苷酸复合的效应多肽(例如,Cas12i)作用于(例如,切割)靶序列。在一些实施例中,与靶序列基本上互补的间隔子序列与靶序列具有小于100%的互补性。在一些实施例中,与靶序列基本上互补的间隔子序列与靶序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互补性。在一些实施例中,具有与靶序列基本互补的间隔子序列的RNA指导物与靶序列具有100%互补性。
如本文所用,术语“靶标”和“靶序列”是指RNA指导物特异性结合的核酸序列。在一些实施例中,RNA指导物的DNA靶向序列(例如,间隔子)结合靶序列。在双链靶标的情况下,RNA指导物结合靶标的第一链(即,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(即,非靶链或非间隔子互补链)。在一些实施例中,靶链(即,间隔子互补链)包含5'-NAAN-3′序列。在一些实施例中,靶序列是PDCD1基因序列内的序列,包括但不限于SEQ ID NO:277或其反向互补序列。
如本文所用,术语“上游”和“下游”是指核酸分子中单个核酸(例如,DNA)序列内的相对位置。“上游”和“下游”分别涉及发生RNA转录的5′至3'方向。当第一序列的3′端出现在第二序列的5'端之前时,第一序列在第二序列的上游。当第一序列的5'端出现在第二序列的3'端之后时,第一序列在第二序列的下游。在一些实施例中,5′-NTTN-3′序列在本文所述的插入缺失的上游,并且Cas12i诱导的插入缺失在5′-NTTN-3′序列的下游。
附图说明
图1显示了SEQ ID NO:287的变体Cas12i2和几个靶向PDCD1的单独RNA指导物在不同浓度在HEK293T细胞中的插入缺失活性。
图2显示了SEQ ID NO:288的变体Cas12i2和几个靶向PDCD1的单独RNA指导物在不同浓度在原代T细胞中的插入缺失活性。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
图3显示了在原代T细胞中引入不同浓度的靶向PDCD1的变体Cas12i2 RNP后七天的细胞活力(经由DAPI染色)。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
具体实施方式
本披露涉及能够结合PDCD1的RNA指导物及其使用方法。在一些方面,本文描述了一种包含具有一个或多个特性的RNA指导物的组合物。在一些方面,描述了产生RNA指导物的方法。在一些方面,描述了一种递送包含RNA指导物的组合物的方法。
组合物
在一些方面,本文所述的发明包括包含靶向PDCD1的RNA指导物的组合物。在一些实施例中,RNA指导物由同向重复组分和间隔子组分组成。在一些实施例中,RNA指导物与Cas12i多肽结合。在一些实施例中,间隔子组分与PDCD1靶序列基本上互补,其中PDCD1靶序列与本文所述的5′-NTTN-3′PAM序列相邻。在双链靶标的情况下,RNA指导物结合靶标的第一链(即,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(即,非靶链或非间隔子互补链)。
在一些实施例中,本文所述的发明包含含有复合物的组合物,其中该复合物包含靶向PDCD1的RNA指导物。在一些实施例中,本发明包含一种复合物,该复合物包含RNA指导物和Cas12i多肽。在一些实施例中,RNA指导物和Cas12i多肽以约1:1的摩尔比彼此结合。在一些实施例中,包含RNA指导物和Cas12i多肽的复合物与PDCD1靶序列结合。在一些实施例中,包含靶向PDCD1的RNA指导物和Cas12i多肽的复合物与PDCD1靶序列以约1:1的摩尔比结合。在一些实施例中,复合物包含可以切割PDCD1靶序列的酶活性,如核酸酶活性。RNA指导物、Cas12i多肽、和PDCD1靶序列(无论是单独还是一起)不是天然存在的。
本文披露的组合物的使用具有优于其他已知的核酸酶系统的那些的优点。Cas12i多肽比其他核酸酶小。例如,Cas12i2的长度为1,054个氨基酸,而化脓性链球菌(S.pyogenes)Cas9(SpCas9)的长度为1,368个氨基酸,嗜热链球菌(S.thermophilus)Cas9(StCas9)的长度为1,128个氨基酸,FnCpf1的长度为1,300个氨基酸,AsCpf1的长度为1,307个氨基酸,并且LbCpf1的长度为1,246个氨基酸。不需要反式激活的CRISPR RNA(tracrRNA)的Cas12i RNA指导物也比Cas9 RNA指导物小。较小的Cas12i多肽和RNA指导物大小有利于递送。与包含SpCas9多肽的组合物相比,包含Cas12i多肽的组合物还表现出降低的脱靶活性。参见PCT/US 2021/025257,将该文献通过援引以其全文并入。此外,由包含Cas12i多肽的组合物诱导的插入缺失不同于由包含SpCas9多肽的组合物诱导的插入缺失。例如,SpCas9多肽主要诱导长度为1个核苷酸的插入和缺失。然而,Cas12i多肽诱导较大的缺失,这可有利于破坏基因(如PDCD1)的较大部分。
RNA指导物
在一些实施例中,本文所述的组合物包含靶向PDCD1基因或PDCD1基因的一部分的RNA指导物。在一些实施例中,本文所述的组合物包含两个或更多个(例如,2、3、4、5、6、7、8、9、或更多个)靶向PDCD1的RNA指导物。
RNA指导物可将本文所述的Cas12i多肽引导至PDCD1靶序列。两个或更多个RNA指导物可以将两个或更多个如本文所述的单独的Cas12i多肽(例如,具有相同或不同序列的Cas12i多肽)靶向至两个或更多个(例如,2、3、4、5、6、7、8、9、或更多个)PDCD1靶序列。
阅读以下特定种类的RNA指导物的实例的本领域技术人员将理解,在一些实施例中,RNA指导物具有PDCD1靶特异性。也就是说,在一些实施例中,RNA指导物与一个或多个PDCD1靶序列(例如,在细胞内)特异性结合,并且不与非靶向的序列(例如,相同细胞内的非特异性DNA或随机序列)结合。
在一些实施例中,RNA指导物包含间隔子序列、随后是同向重复序列,指的是从5'至3'方向的序列。在一些实施例中,RNA指导物包含第一同向重复序列、随后是间隔子序列、和第二同向重复序列,指的是从5′至3'方向的序列。在一些实施例中,这种RNA指导物的第一同向重复序列和第二同向重复序列相同。在一些实施例中,这种RNA指导物的第一同向重复序列和第二同向重复序列不同。
在一些实施例中,RNA指导物的间隔子序列和一个或多个同向重复序列存在于相同的RNA分子内。在一些实施例中,间隔子序列和同向重复序列彼此直接连接。在一些实施例中,在间隔子序列和同向重复序列之间存在短接头,例如长度为1、2、或3个核苷酸的RNA接头。在一些实施例中,RNA指导物的间隔子序列和一个或多个同向重复序列存在于单独的分子中,它们通过碱基配对相互作用彼此连接。
关于RNA指导物的示例性同向重复组分和间隔子组分的额外信息提供如下。
同向重复序列
在一些实施例中,RNA指导物包含同向重复序列。在一些实施例中,RNA指导物的同向重复序列的长度介于12-100、13-75、14-50、或15-40个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40个核苷酸)。
在一些实施例中,同向重复序列是或包含表1的序列或表1的序列的一部分。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸1至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸2至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸3至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸4至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸5至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸6至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸7至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸8至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸9至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸10至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸11至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸12至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸13至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸14至核苷酸36。同向重复序列可以包含SEQ ID NO:9的核苷酸1至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸2至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸3至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸4至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸5至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸6至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸7至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸8至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸9至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸10至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸11至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸12至核苷酸34。在一些实施例中,同向重复序列在SEQ ID NO:10中阐述。在一些实施例中,同向重复序列包含在SEQ ID NO:10中阐述的序列的一部分。
在一些实施例中,同向重复序列具有或包含序列,该序列与表1的序列或表1的序列的一部分包含至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。同向重复序列可以具有或包含序列,该序列与包含SEQ IDNO:1、2、3、4、5、6、7、或8中任一个的核苷酸1至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸2至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸3至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸4至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸5至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸6至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸7至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸8至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ IDNO:1、2、3、4、5、6、7、或8中任一个的核苷酸9至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸10至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸11至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸12至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸13至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸14至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸1至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸2至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸3至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸4至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQID NO:9的核苷酸5至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸6至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸7至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸8至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸9至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸10至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸11至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸12至核苷酸34的序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:10具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与在SEQ ID NO:10中阐述的序列的一部分具有至少90%的同一性。
在一些实施例中,包含Cas12i2多肽和RNA指导物的组合物能够将插入缺失引入PDCD1靶序列中,该RNA指导物包含SEQ ID NO:10的同向重复序列和20个核苷酸长度的间隔子。见,例如,实例1,其中插入缺失在瞬时转染RNA指导物和SEQ ID NO:287的Cas12i2多肽后在十一个PDCD1靶序列处测量,以及实例2,其中插入缺失在RNP递送RNA指导物和SEQ IDNO:288的Cas12i2多肽后在四个PDCD1靶序列处进行测量。
在一些实施例中,同向重复序列是或包含序列,该序列与SEQ ID NO:1-10中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列是或包含SEQID NO:1-10中任一个的反向互补序列。
表1.同向重复序列
序列标识符 同向重复序列
SEQ ID NO:1 GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:2 AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:3 AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:4 CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:5 CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:6 GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:7 GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:8 GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO:9 GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG
SEQ ID NO:10 AGAAAUCCGUCUUUCAUUGACGG
在一些实施例中,同向重复序列是表2的序列或表2的序列的一部分。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸1至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸2至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸3至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸4至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸5至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸6至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸7至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸8至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸9至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸10至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸11至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸12至核苷酸36。同向重复序列可以包含SEQID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸13至核苷酸36。同向重复序列可以包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸14至核苷酸36。
在一些实施例中,同向重复序列与表2的序列或表2的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸1至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸2至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸3至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸4至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸5至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸6至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸7至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸8至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸9至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸10至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸11至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸12至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸13至核苷酸36的序列具有至少95%的同一性。
在一些实施例中,同向重复序列与表2的序列或表2的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸1至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸2至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸3至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸4至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸5至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸6至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸7至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸8至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸9至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸10至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸11至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸12至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的核苷酸13至核苷酸36的序列具有至少90%的同一性。
在一些实施例中,同向重复序列与SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、或316中任一个的反向互补序列。
在一些实施例中,同向重复序列与SEQ ID NO:317或SEQ ID NO:317的一部分具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:317或SEQ ID NO:317的一部分具有至少95%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:317或SEQ IDNO:317的一部分具有100%的同一性。
表2.Cas12i4同向重复序列。
在一些实施例中,同向重复序列是表3的序列或表3的序列的一部分。在一些实施例中,同向重复序列与表3的序列或表3的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与表3的序列或表3的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与SEQ ID NO:318-320中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQID NO:318-320中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:318-320中任一个的反向互补序列。
表3.Cas12i1同向重复序列。
序列标识符 同向重复序列
SEQ ID NO:318 GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC
SEQ ID NO:319 AAUUUUUGUGCCCAUCGUUGGCAC
SEQ ID NO:320 AUUUUUGUGCCCAUCGUUGGCAC
在一些实施例中,同向重复序列是表4的序列或表4的序列的一部分。在一些实施例中,同向重复序列与表4的序列或表4的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与表4的序列或表4的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与SEQ ID NO:321-323中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQID NO:321-323中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:321-323中任一个的反向互补序列。
表4.Cas12i3同向重复序列。
序列标识符 同向重复序列
SEQ ID NO:321 CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU
SEQ ID NO:322 CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG
SEQ ID NO:323 AUAGUGUGUCCUUAGUUGACAU
在一些实施例中,本文所述的同向重复序列包含尿嘧啶(U)。在一些实施例中,本文所述的同向重复序列包含胸腺嘧啶(T)。在一些实施例中,根据表1-4的同向重复序列包含这样的序列,该序列在表1-4中指示为尿嘧啶的一个或多个位置中包含胸腺嘧啶。
间隔子
在一些实施例中,RNA指导物包含靶向DNA的间隔子序列。在一些实施例中,RNA指导物的间隔子序列的长度介于12-100、13-75、14-50、或15-30个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸)并且与特定靶序列互补。在一些实施例中,间隔子序列被设计为与例如基因组基因座的特定DNA链互补。
在一些实施例中,RNA指导物间隔子序列与靶序列的互补链基本上相同。在一些实施例中,RNA指导物包含与参考核酸序列(例如靶序列)的互补链具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。
在一些实施例中,RNA指导物包含间隔子序列,该间隔子序列的长度介于12-100、13-75、14-50、或15-30个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸),并且该间隔子序列与靶序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的互补性。在一些实施例中,RNA指导物包含与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含长度为至多50并且与靶序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列(例如,RNA序列)。在一些实施例中,RNA指导物包含与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。
在一些实施例中,间隔子序列是或包含表5的序列或表5的序列的一部分。表5和表6中列出的靶序列位于PDCD1序列的非靶链上。应当理解,SEQ ID NO:143-274的指示应被认为等同于以下的列表:SEQ ID NO:143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273和274。
间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20。间隔子序列可以包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26。间隔子序列可以包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27。间隔子序列可以包含SEQID NO:143-255和258-274中任一个的核苷酸1至核苷酸28。间隔子序列可以包含SEQ IDNO:143-255和258-274中任一个的核苷酸1至核苷酸29。间隔子序列可以包含SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。
在一些实施例中,间隔子序列具有或包含序列,该序列与表5的序列或表5的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30的序列具有至少90%的同一性。
表5.PDCD1靶序列和间隔子序列
本发明包括与本文披露内容一致的、以上列出的同向重复序列和间隔子的所有组合。在一些实施例中,RNA指导物不由以下序列组成:AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGGUCGGCG(SEQ ID NO:283);AGAAAUCCGUCUUUCAUUGACGG CCCGAGGACCGCAGCCAGCC(SEQID NO:284);AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285);或AGAAAUCCGUCUUUCAUUGACGG CACAUGAGCGUGGUCAGGGC(SEQ ID NO:286)。
在一些实施例中,本文所述的间隔子序列包含尿嘧啶(U)。在一些实施例中,本文所述的间隔子序列包含胸腺嘧啶(T)。在一些实施例中,根据表5的间隔子序列包含这样的序列,该序列在表5中指示为尿嘧啶的一个或多个位置中包含胸腺嘧啶。
修饰
RNA指导物可以包括相对于参考序列、特别是亲本多核糖核苷酸的一个或多个共价修饰,该一个或多个共价修饰包括在本发明的范围内。
示例性修饰可以包括对糖、核碱基、核苷间键(例如,对连接性磷酸盐/磷酸二酯键/磷酸二酯主链)以及任何组合的任何修饰。下面详细描述了本文提供的一些示例性修饰。
RNA指导物可以包括如对糖、核碱基、或核苷间键(例如,对连接性磷酸酯/对磷酸二酯键/对磷酸二酯主链)的任何有用的修饰。嘧啶核碱基的一个或多个原子可被任选取代的氨基、任选取代的硫醇、任选取代的烷基(例如,甲基或乙基)或卤基(例如,氯或氟)替代或取代。在某些实施例中,修饰(例如,一个或多个修饰)存在于糖和核苷间键的每一者中。修饰可以是对核糖核酸(RNA)到脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA)或它们的杂交体的修饰。本文描述了另外的修饰。
在一些实施例中,修饰可包括化学或细胞诱导的修饰。例如,细胞内RNA修饰的一些非限制性实例由Lewis和Pan在“RNA modifications and structures cooperate toguide RNA-protein interactions[RNA修饰和结构协作指导RNA-蛋白质相互作用]”,NatReviews Mol Cell Biol[自然评论:分子细胞生物学],2017,18:202-210中所描述。
不同的糖修饰、核苷酸修饰和/或核苷间键(例如,主链结构)可存在于序列中的不同位置处。本领域普通技术人员将理解,核苷酸类似物或其他修饰可位于序列的任何位置处,使得序列的功能基本上不降低。序列可包括约1%至约100%的经修饰的核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即A、G、U或C中的任一种或多种)或任何插入百分比(例如,1%至20%、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%和95%至100%)。
在一些实施例中,糖修饰(例如,2′位置或4'位置处)或序列的一个或多个核糖核苷酸处的糖替代以及主链修饰可包括磷酸二酯键的修饰或替代。序列的特定实例包括但不限于包括经修饰的主链或非天然核苷间键(例如核苷间修饰,包括磷酸二酯键的修饰或替代)的序列。具有经修饰的主链的序列尤其包括在主链中不具有磷原子的那些。出于本申请的目的,并且如本领域中有时提及的,在其核苷间主链中不具有磷原子的经修饰的RNA也可以被认为是寡核苷。在特定的实施例中,序列将包括在其核苷间主链中具有磷原子的核糖核苷酸。
经修饰的序列主链可包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(诸如3'-亚烷基膦酸酯和手性膦酸酯)、亚膦酸酯、氨基磷酸酯(诸如3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫羰氨基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和具有正常3′-5′连接的硼烷磷酸酯、这些酯的2′-5′连接的类似物,以及具有相反极性的那些,其中相邻的核苷单元对3′-5′连接至5'-3′或2'-5′连接至5′-2'。也包括各种盐、混合盐和游离酸形式。在一些实施例中,序列可带负电荷或带正电荷。
可掺入序列中的经修饰的核苷酸可以在核苷间键(例如,主链)上被修饰。在本文中,在多核苷酸主链的上下文中,短语“磷酸酯”和“磷酸二酯”可互换地使用。可以通过用不同的取代基替代一个或多个氧原子来修饰主链磷酸酯基团。此外,经修饰的核苷和核苷酸可以包括用如本文所述的另一核苷间键对未经修饰的磷酸酯部分进行整体替代。经修饰的磷酸酯基团的实例包括但不限于硫代磷酸酯、亚磷酸硒酸酯、硼酸磷酸酯(boranophosphate)、硼酸磷酸酯(boranophosphate ester)、氢膦酸酯、氨基磷酸酯、二氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫替代。也可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)替代连接氧来修饰磷酸酯接头。
提供α-硫代取代的磷酸酯部分以通过非天然硫代磷酸酯主链连接赋予RNA和DNA聚合物稳定性。硫代磷酸酯DNA和RNA具有增强的核酸酶抗性,并因此在细胞环境中具有更长的半衰期。
在特定的实施例中,经修饰的核苷包括α-硫代-核苷(例如5′-O-(1-硫代磷酸)-腺苷、5'-O-(1-硫代磷酸)-胞苷(a-硫代胞苷)、5'-O-(1-硫代磷酸)-鸟苷、5′-O-(1-硫代磷酸)-尿苷或5'-O-(1-硫代磷酸)-假尿苷)。
本文描述了可根据本发明使用的其他核苷间键,包括不含磷原子的核苷间键。
在一些实施例中,序列可包括一个或多个细胞毒性核苷。例如,可将细胞毒性核苷掺入序列中,诸如双功能修饰。细胞毒性核苷可包括但不限于阿糖腺苷、5-氮杂胞苷、4'-硫代阿糖胞苷、环戊烯基胞嘧啶、克拉屈滨、氯法拉滨、阿糖胞苷、胞嘧啶阿拉伯糖苷、1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)-胞嘧啶、地西他滨、5-氟尿嘧啶、氟达拉滨、氟尿苷、吉西他滨、替加氟和尿嘧啶的组合、替加氟((RS)-5-氟-1-(四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他滨、替扎西他滨、2′-脱氧-2′-亚甲基胞苷(DMDC)和6-巯基嘌呤。其他实例包括氟达拉滨磷酸酯、N4-山嵛酰基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-棕榈酰基-1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5′-反油酸酯)。
在一些实施例中,序列包括一个或多个转录后修饰(例如,加帽、切割、聚腺苷酸化、剪接、聚A序列、甲基化、酰化、磷酸化、赖氨酸和精氨酸残基的甲基化、乙酰化、以及硫醇基团和酪氨酸残基的亚硝基化等)。该一个或多个转录后修饰可以是任何转录后修饰,如已经在RNA中鉴定出的多于一百种不同的核苷修饰中的任一种(Rozenski,J,Crain,P,和McCloskey,J.(1999).The RNA Modification Database:1999update[RNA修饰数据库:1999年更新].Nucl Acids Res[核酸研究]27:196-197)。在一些实施例中,第一分离的核酸包含信使RNA(mRNA)。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟基甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮-假异胞苷、1-甲基-1-去氮-假异胞苷、折布拉林(zebularine)、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:2-氨基嘌呤、2,6-二氨基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮杂-腺嘌呤、7-去氮-2-氨基嘌呤、7-去氮-8-氮杂-2-氨基嘌呤、7-去氮-2,6-二氨基嘌呤、7-去氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲基硫代-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨甲酰基腺苷、N6-苏氨酰氨甲酰基腺苷、2-甲基硫代-N6-苏氨酰氨甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-去氮-鸟苷、7-去氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮-鸟苷、6-硫代-7-去氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、和N2,N2-二甲基-6-硫代-鸟苷。
序列沿着分子的整个长度可以被或者可以不被均一地修饰。例如,一种或多种或所有类型的核苷酸(例如,天然存在的核苷酸嘌呤或嘧啶,或者A、G、U、C、I、pU中的任一种或多种或所有)可或可不在序列中或其给定的预定序列区域中被均匀修饰。在一些实施例中,序列包括假尿苷。在一些实施例中,序列包括肌苷,该肌苷可以帮助免疫系统将序列相对于病毒RNA表征为内源性。肌苷的掺入还可以介导改善的RNA稳定性/减少降解。参见例如,Yu,Z.等人(2015)RNA editing by ADAR1 marks dsRNA as“self”[ADAR1进行的RNA编辑将dsRNA标记为“自我”].Cell Res[细胞研究].25,1283-1284,将该文献通过援引以其全文并入。
Cas12i多肽
在一些实施例中,本发明的组合物包含如PCT/US 2019/022375中所述的Cas12i多肽。
在一些实施例中,本发明的组合物包括本文所述的Cas12i2多肽(例如,包含SEQID NO:276和/或由SEQ ID NO:275编码的多肽)。在一些实施例中,Cas12i2多肽包含至少一个RuvC结构域。
编码本文所述的Cas12i2多肽的核酸序列可以与参考核酸序列(例如SEQ ID NO:275)基本上相同。在一些实施例中,Cas12i2多肽由核酸编码,该核酸包含与参考核酸序列(例如,SEQ ID NO:275)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在温度和离子强度的严格条件下(例如,在中至高严格度的范围内)与另一核酸分子的互补序列杂交。参见例如,Tijssen,“Hybridization withNucleic Acid Probes.Part I.Theory and Nucleic Acid Preparation[与核酸探针杂交.第I部分.理论和核酸制备]”(Laboratory Techniques in Biochemistry andMolecular Biology[生物化学和分子生物学实验室技术],第24卷)。
在一些实施例中,Cas12i2多肽由核酸序列编码,该核酸序列与参考核酸序列(例如,SEQ ID NO:275)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的序列同一性,但不具有100%的序列同一性。
在一些实施例中,本发明的Cas12i2多肽包含与SEQ ID NO:276具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i2多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:276的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i2多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:276的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i2多肽包含具有SEQ ID NO:287、SEQ ID NO:288、SEQ IDNO:289、SEQ ID NO:290、或SEQ ID NO:291的序列的多肽。
在一些实施例中,本发明的Cas12i2多肽包含与SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些实施例中,与SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i2多肽保持将该多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1、2、3个等)。
在一些实施例中,本发明描述了Cas12i2多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQID NO:290、或SEQ ID NO:291的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i2多肽,该Cas12i2多肽具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:287、SEQ IDNO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i4多肽(例如,包含SEQID NO:294和/或由SEQ ID NO:293编码的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
编码本文所述的Cas12i4多肽的核酸序列可以与参考核酸序列(例如SEQ ID NO:293)基本上相同。在一些实施例中,Cas12i4多肽由核酸编码,该核酸包含与参考核酸序列(例如,SEQ ID NO:293)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在温度和离子强度的严格条件下(例如,在中至高严格度的范围内)与另一核酸分子的互补序列杂交。
在一些实施例中,Cas12i4多肽由核酸序列编码,该核酸序列与参考核酸序列(例如,SEQ ID NO:293)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的序列同一性,但不具有100%的序列同一性。
在一些实施例中,本发明的Cas12i4多肽包含与SEQ ID NO:294具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i4多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:294的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i4多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:294的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i4多肽包含具有SEQ ID NO:295或SEQ ID NO:296的序列的多肽。
在一些实施例中,本发明的Cas12i4多肽包含与SEQ ID NO:295或SEQ ID NO:296具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些实施例中,与SEQ ID NO:295或SEQ ID NO:296具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i4多肽保持将该多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1、2、3个等)。
在一些实施例中,本发明描述了Cas12i4多肽,该Cas12i4多肽与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:295或SEQ ID NO:296的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i4多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:295或SEQ ID NO:296的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i1多肽(例如,包含SEQID NO:297的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
在一些实施例中,本发明的Cas12i1多肽包含与SEQ ID NO:297具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i1多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:297的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i1多肽,该Cas12i1多肽具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:297的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i3多肽(例如,包含SEQID NO:298的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
在一些实施例中,本发明的Cas12i3多肽包含与SEQ ID NO:298具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i3多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:298的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i3多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:298的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
尽管本文所述的变化可以是一个或多个氨基酸的变化,但Cas12i多肽的变化也可以是实质性的,例如作为氨基和/或羧基末端延伸的多肽融合。例如,Cas12i多肽可以含有额外的肽,例如,一个或多个肽。另外的肽的实例可包括用于标记的表位肽,诸如多组氨酸标签(His标签)、Myc和FLAG。在一些实施例中,本文所述的Cas12i多肽可以融合到可检测部分,诸如荧光蛋白(例如,绿色荧光蛋白(GFP)或黄色荧光蛋白(YFP))。
在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核定位信号(NLS)。在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核输出信号(NES)。在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多)NLS和至少一个(例如,两个、三个、四个、五个、六个或更多个)NES。
在一些实施例中,本文所述的Cas12i多肽可以是自我灭活的。参见Epstein等人,“Engineering a Self-Inactivating CRISPR System for AAV Vectors[工程化用于AAV载体的自我灭活的CRISPR系统],”Mol.Ther.[分子疗法],24(2016):S50,将该文献通过援引以其全文并入。
在一些实施例中,编码本文所述的Cas12i多肽的核苷酸序列可以经密码子优化以用于特定的宿主细胞或生物。例如,核酸可以经密码子优化以用于任何非人真核生物,包括小鼠、大鼠、兔、狗、家畜或非人灵长类动物。密码子使用表是易于获得的,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon Usage Database)”中,并且这些表可以按多种方式进行改编。参见Nakamura等人Nucl.Acids Res.[核酸研究]28:292(2000),将其通过援引以其全文并入本文。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,诸如基因制造(Gene Forge)(Aptagen公司;宾夕法尼亚州雅各布斯(Jacobus,PA))。
靶序列
在一些实施例中,靶序列在PDCD1基因或PDCD1基因的基因座内。在一些实施例中,PDCD1基因是哺乳动物基因。在一些实施例中,PDCD1基因是人类基因。例如,在一些实施例中,靶序列在SEQ ID NO:277或其反向互补序列内。在一些实施例中,靶序列在SEQ ID NO:277(或其反向互补序列)阐述的PDCD1基因的外显子内,例如,在SEQ ID NO:278、279、280、281、或282的序列(或其反向互补序列)内。表5列出了SEQ ID NO:277的PDCD1基因外显子内的靶序列(及其反向互补序列)。在一些实施例中,靶序列在SEQ ID NO:277(或其反向互补序列)阐述的PDCD1基因的内含子内。在一些实施例中,靶序列在SEQ ID NO:277阐述的PDCD1基因序列或其反向互补序列的变体(例如,多态性变体)内。在一些实施例中,PDCD1基因序列是在SEQ ID NO:277阐述的序列或其反向互补序列的同源物。例如,在一些实施例中,PDCD1基因序列是非人PDCD1序列。
在一些实施例中,靶序列与5′-NTTN-3'PAM序列相邻,其中N是任何核苷酸。5′-NTTN-3′序列可以紧邻靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5个)核苷酸内。在一些实施例中,5'-NTTN-3′序列是5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y是C或T,B是除A之外的任何核苷酸,D是除C之外的任何核苷酸,并且R是A或G。在一些实施例中,5'-NTTN-3'序列是5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在一些实施例中,靶序列是单链的(例如,单链DNA)。在一些实施例中,靶序列是双链的(例如,双链DNA)。在一些实施例中,靶序列包含单链区和双链区两者。在一些实施例中,靶序列是线性的。在一些实施例中,靶序列是环状的。在一些实施例中,靶序列包含一个或多个经修饰的核苷酸,如甲基化的核苷酸、受损的核苷酸、或核苷酸类似物。在一些实施例中,靶序列未经修饰。在一些实施例中,RNA指导物与双链靶序列的第一链(例如,靶链或间隔子互补链)结合,并且5′-NTTN-3′PAM序列存在于第二互补链(例如,非靶链或非间隔子互补链)。在一些实施例中,RNA指导物在靶链(例如,间隔子互补链)上的5′-NAAN-3′序列附近结合。
在一些实施例中,靶序列存在于细胞中。在一些实施例中,靶序列存在于细胞核中。在一些实施例中,靶序列对细胞是内源的。在一些实施例中,靶序列是基因组DNA。在一些实施例中,靶序列是染色体DNA。在一些实施例中,靶序列是编码蛋白质的基因或其功能区如编码区、或调节元件,如启动子、增强子、5′或3′非翻译区等。在一些实施例中,靶序列是质粒。
在一些实施例中,靶序列存在于靶序列的易于接近的区域中。在一些实施例中,靶序列是靶基因的外显子。在一些实施例中,靶序列跨靶基因的外显子-内含子接点。在一些实施例中,靶序列存在于非编码区(如基因的调节区)中。在一些实施例中,其中靶序列对细胞是外源的,靶序列包含在细胞的基因组中未发现的序列。
在一些实施例中,靶序列对于细胞是外源的。在一些实施例中,靶序列是水平转移的质粒。在一些实施例中,靶序列整合在细胞的基因组中。在一些实施例中,靶序列不整合在细胞的基因组中。在一些实施例中,靶序列是细胞中的质粒。在一些实施例中,靶序列存在于染色体外阵列中。
在一些实施例中,靶序列是分离的核酸,诸如分离的DNA或分离的RNA。在一些实施例中,靶序列存在于无细胞环境中。在一些实施例中,靶序列是分离的载体,诸如质粒。在一些实施例中,靶序列是超纯质粒。
靶序列是与RNA指导物杂交的PDCD1基因的基因座。在一些实施例中,细胞仅具有靶序列的一个拷贝。在一些实施例中,细胞具有靶序列的多于一个拷贝,如至少约2、3、4、5、10、100或更多个拷贝中的任一个。
在一些实施例中,选择PDCD1靶序列以由Cas12i多肽和RNA指导物使用以下标准中的一项或多项进行编辑。首先,在一些实施例中,选择靠近PDCD1编码序列的5′端的靶序列。例如,在一些实施例中,RNA指导物被设计成靶向外显子1(SEQ ID NO:278)或外显子2(SEQID NO:279)中的序列。其次,在一些实施例中,选择与5′-CTTY-3′PAM序列相邻的靶序列。例如,在一些实施例中,RNA指导物被设计成靶向与5′-CTTT-3′或5′-CTTC-3′序列相邻的序列。第三,在一些实施例中,选择与其他基因组序列具有低序列相似性的靶序列。例如,对于每个靶序列,通过搜索与PAM序列相邻的其他基因组序列并计算靶序列与PAM相邻序列之间的莱文斯坦距离来鉴定潜在非靶位点。莱文斯坦距离(例如,编辑距离)对应于将一个序列改变为另一个序列(例如,将潜在非靶基因座的序列改变为在靶基因座的序列)所需的编辑(例如,插入、缺失或取代)的最小次数。按照此分析,RNA指导物是为靶序列设计的,这些靶序列不具有Levenshtein距离为0或1的潜在脱靶序列。
生产
本发明包括用于产生RNA指导物的方法、用于产生Cas12i多肽的方法以及用于复合RNA指导物和Cas12i多肽的方法。
RNA指导物
在一些实施例中,RNA指导物是通过DNA模板的体外转录制成的。因此,例如,在一些实施例中,通过使用上游启动子序列(例如,T7聚合酶启动子序列)在体外转录编码RNA指导物的DNA模板来产生RNA指导物。在一些实施例中,DNA模板编码多个RNA指导物,或者体外转录反应包括多个不同的DNA模板,每个DNA模板编码不同的RNA指导物。在一些实施例中,使用化学合成方法制备RNA指导物。在一些实施例中,通过在用包括编码RNA指导物的序列的质粒转染的细胞中表达RNA指导物序列来制备RNA指导物。在一些实施例中,质粒编码多个不同的RNA指导物。在一些实施例中,将各自编码不同的RNA指导物的多个不同的质粒转染到细胞中。在一些实施例中,从编码RNA指导物并且还编码Cas12i多肽的质粒表达该RNA指导物。在一些实施例中,从表达RNA指导物但不表达Cas12i多肽的质粒表达该RNA指导物。在一些实施例中,RNA指导物从商业供应商购买。在一些实施例中,使用一个或多个经修饰的核苷酸(例如,如上所述)合成RNA指导物。
Cas12i多肽
在一些实施例中,本发明的Cas12i多肽可以通过以下制备:(a)培养产生本发明的Cas12i多肽的细菌,分离该Cas12i多肽,任选地纯化该Cas12i多肽,并将该Cas12i多肽与RNA指导物复合。Cas12i多肽还可以通过(b)已知的基因工程技术来制备,具体地,通过以下过程制备:从细菌中分离编码本发明的Cas12i多肽的基因,构建重组表达载体,然后将该载体转移到表达RNA指导物的合适宿主细胞中以在宿主细胞中表达与RNA指导物复合的重组蛋白。替代性地,Cas12i多肽可以通过(c)体外偶联的转录-翻译系统然后与RNA指导物复合来制备。
在一些实施例中,宿主细胞用于表达Cas12i多肽。宿主细胞没有特别限制,并且可以优选地使用各种已知的细胞。宿主细胞的具体实例包括细菌,诸如大肠杆菌、酵母(芽殖酵母酿酒酵母(Saccharomyces cerevisiae)和裂殖酵母粟酒裂殖酵母(Schizosaccharomyces pombe))、线虫(秀丽隐杆线虫(Caenorhabditis elegans))、爪蟾(Xenopus laevis)卵母细胞和动物细胞(例如,CHO细胞、COS细胞和HEK293细胞)。用于将上述表达载体转移到宿主细胞中的方法(即转化法)没有特别限制,并且可以使用已知的方法,诸如电穿孔、磷酸钙法、脂质体法和DEAE葡聚糖法。
在用表达载体转化宿主后,可以培养、培育或繁殖宿主细胞以产生Cas12i多肽。在Cas12i多肽表达后,可以根据常规方法(例如,过滤、离心、细胞破坏、凝胶过滤色谱、离子交换色谱等)收集宿主细胞并从培养物中纯化Cas12i多肽等。
在一些实施例中,用于Cas12i多肽表达的方法包括翻译该Cas12i多肽的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸、或至少1000个氨基酸。在一些实施例中,用于蛋白质表达的方法包括翻译Cas12i多肽的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多。
多种方法可以用于确定宿主细胞中成熟Cas12i多肽的产生水平。此类方法包括但不限于例如利用对Cas12i多肽具有特异性的多克隆或单克隆抗体或如本文别处所述的标记标签的方法。示例性方法包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(MA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。这些和其他测定是本领域熟知的(参见例如Maddox等人,J.Exp.Med.[实验医学杂志]158:1211[1983])。
本披露内容提供了在细胞中体内表达Cas12i多肽的方法,这些方法包括向宿主细胞提供编码该Cas12i多肽的多核糖核苷酸(其中该多核糖核苷酸编码该Cas12i多肽);在该细胞中表达该Cas12i多肽;以及从该细胞中获得该Cas12i多肽。
复合
在一些实施例中,靶向PDCD1的RNA指导物与Cas12i多肽复合以形成核糖核蛋白。在一些实施例中,RNA指导物和Cas12i多肽的复合发生在低于约以下中任一个的温度下:20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、或55℃。在一些实施例中,在约37C下在至少约以下中的任一个的孵育时间段内,RNA指导物不会从Cas12i多肽解离:10min、15min、20min、25min、30min、35min、40min、45min、50min、55min、1hr、2hr、3hr、4hr、或更多个小时。
在一些实施例中,RNA指导物和Cas12i多肽在复合缓冲液中复合。在一些实施例中,将Cas12i多肽储存在被复合缓冲液替代的缓冲液中以与RNA指导物形成复合物。在一些实施例中,将Cas12i多肽储存在复合缓冲液中。
在一些实施例中,复合缓冲液的pH范围为约7.3至8.6。在一个实施例中,复合缓冲液的pH为约7.3。在一个实施例中,复合缓冲液的pH为约7.4。在一个实施例中,复合缓冲液的pH为约7.5。在一个实施例中,复合缓冲液的pH为约7.6。在一个实施例中,复合缓冲液的pH为约7.7。在一个实施例中,复合缓冲液的pH为约7.8。在一个实施例中,复合缓冲液的pH为约7.9。在一个实施例中,复合缓冲液的pH为约8.0。在一个实施例中,复合缓冲液的pH为约8.1。在一个实施例中,复合缓冲液的pH为约8.2。在一个实施例中,复合缓冲液的pH为约8.3。在一个实施例中,复合缓冲液的pH为约8.4。在一个实施例中,复合缓冲液的pH为约8.5。在一个实施例中,复合缓冲液的pH为约8.6。
在一些实施例中,在如本文所述纯化之前,可以使Cas12i多肽在宿主细胞中过表达并与RNA指导物复合。在一些实施例中,编码Cas12i多肽的mRNA或DNA被引入细胞中,使得Cas12i多肽在细胞中表达。在一些实施例中,RNA指导物也从单个mRNA或DNA构建体同时、分别或依次引入细胞,使得核糖核蛋白复合物在细胞中形成。
递送
可将本文所述的组合物或复合物配制成例如包括载剂(诸如载剂和/或聚合物载剂,例如脂质体),并且通过已知方法递送到细胞(例如,原核细胞、真核细胞、植物细胞、哺乳动物细胞等)。此类方法包括但不限于转染(例如,脂质介导、阳离子聚合物、磷酸钙、树枝状大分子);电穿孔或其他破坏膜的方法(例如,核转染)、病毒递送(例如,慢病毒、逆转录病毒、腺病毒、AAV)、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光转染、原生质体融合、刺穿感染、磁转染、外来体介导的转移、脂质纳米颗粒介导的转移以及它们的任何组合。
在一些实施例中,该方法包括将一种或多种核酸(例如,编码Cas12i多肽、RNA指导物、供体DNA等的核酸)、其一种或多种转录物、和/或预形成的RNA指导物/Cas12i多肽复合物递送至细胞,在该细胞中形成三元复合物。示例性细胞内递送方法包括但不限于:病毒或病毒样药剂;基于化学的转染方法,诸如使用磷酸钙、树枝状大分子、脂质体或阳离子聚合物(例如,DEAE-葡聚糖或聚乙烯亚胺)的转染方法;非化学方法,诸如显微注射、电穿孔、细胞挤压、声孔效应、光转染、刺穿感染、原生质体融合、细菌缀合、质粒或转座子的递送;基于粒子的方法,诸如使用基因枪、磁转染或磁辅助转染、粒子轰击;以及混合方法,诸如核转染。在一些实施例中,本申请进一步提供了通过此类方法产生的细胞,以及包含此类细胞的或由此类细胞产生的生物体(例如,动物、植物或真菌)。
在一些实施例中,将Cas12i组分和RNA指导物组分一起递送。例如,在一些实施例中,将Cas12i组分和RNA指导物组分一起包装在单个AAV颗粒中。在另一个实例中,在一些实施例中,将Cas12i组分和RNA指导物组分经由脂质纳米颗粒(LNP)一起递送。在一些实施例中,将Cas12i组分和RNA指导物组分分开递送。例如,在一些实施例中,将Cas12i组分和RNA指导物组分包装在分开的AAV颗粒中。在另一个例子中,在一些实施例中,将Cas12i组分通过第一递送机制递送,并将RNA指导物组分通过第二递送机制递送。
细胞
可将本文所述的组合物或复合物递送到多种细胞。在一些实施例中,细胞是分离的细胞。在一些实施例中,细胞在细胞培养物中或在两种或更多种细胞类型的共培养物中。在一些实施例中,细胞是离体的。在一些实施例中,细胞获自活的生物并维持在细胞培养物中。在一些实施例中,细胞是单细胞生物体。
在一些实施例中,细胞是原核细胞。在一些实施例中,细胞是细菌细胞或来源于细菌细胞。在一些实施例中,细胞是古细菌细胞或来源于古细菌细胞。
在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是植物细胞或来源于植物细胞。在一些实施例中,细胞是真菌细胞或来源于真菌细胞。在一些实施例中,细胞是动物细胞或来源于动物细胞。在一些实施例中,细胞是无脊椎动物细胞或来源于无脊椎动物细胞。在一些实施例中,细胞是脊椎动物细胞或来源于脊椎动物细胞。在一些实施例中,细胞是哺乳动物细胞或来源于哺乳动物细胞。在一些实施例中,细胞是人细胞。在一些实施例中,细胞是斑马鱼细胞。在一些实施例中,细胞是啮齿动物细胞。在一些实施例中,细胞是合成制成的,有时称为人工细胞。
在一些实施例中,细胞来源于细胞系。用于组织培养的多种多样的细胞系是本领域已知的。细胞系的实例包括但不限于293T、MF7、K562、HeLa、CHO、及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(例如,参见美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassas,Va.)))。在一些实施例中,细胞是永生或永生化细胞。
在一些实施例中,细胞是原代细胞。在一些实施例中,细胞是干细胞,例如全能干细胞(例如,全能的)、多能干细胞、专能干细胞、寡能干细胞或单能干细胞。在一些实施例中,细胞是诱导性多能干细胞(iPSC)或来源于iPSC。在一些实施例中,细胞是分化细胞。例如,在一些实施例中,分化细胞是肌肉细胞(例如,肌细胞)、脂肪细胞(例如,脂细胞)、骨的细胞(例如,成骨细胞、骨细胞、破骨细胞)、血细胞(例如,单核细胞、淋巴细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、巨噬细胞、红细胞或血小板)、神经细胞(例如,神经元)、上皮细胞、免疫细胞(例如,淋巴细胞、嗜中性粒细胞、单核细胞或巨噬细胞)、肝脏细胞(例如肝细胞)、成纤维细胞或性细胞。在一些实施例中,细胞是终末分化细胞。例如,在一些实施例中,终末分化细胞是神经元细胞、脂肪细胞、心肌细胞、骨骼肌细胞、表皮细胞或肠细胞。在一些实施例中,细胞是免疫细胞。在一些实施例中,免疫细胞是T细胞。在一些实施例中,免疫细胞是B细胞。在一些实施例中,免疫细胞是自然杀伤(NK)细胞。在一些实施例中,免疫细胞是肿瘤浸润淋巴细胞(TIL)。在一些实施例中,细胞是哺乳动物细胞,例如人细胞或鼠细胞。在一些实施例中,鼠细胞来源于野生型小鼠、免疫抑制小鼠或疾病特异性小鼠模型。在一些实施例中,细胞是活组织、器官、或生物内的细胞。
方法
本披露还提供了修饰PDCD1基因内的靶序列的方法。在一些实施例中,该方法包括将PDCD1靶向性RNA指导物和Cas12i多肽引入细胞中。PDCD1靶向性RNA指导物和Cas12i多肽可以作为核糖核蛋白复合物引入细胞。可以将PDCD1靶向性RNA指导物和Cas12i多肽在核酸载体上引入。可以将Cas12i多肽作为mRNA引入。可以将RNA指导物直接引入细胞中。
在一些实施例中,PDCD1基因的序列在SEQ ID NO:277或其反向互补序列中列出。在一些实施例中,靶序列在PDCD1基因的外显子中,例如具有SEQ ID NO:278、SEQ ID NO:279、SEQ ID NO:280、SEQ ID NO:281或SEQ ID NO:282中任一个所示序列的外显子或其反向互补序列。在一些实施例中,靶序列位于PDCD1基因的内含子中(例如,SEQ ID NO:277或其反向互补序列中所示序列的内含子)。在其他实施例中,PDCD1基因的序列是SEQ ID NO:277中所示序列的变体(或其反向互补序列)或SEQ ID NO:277中所示序列的同源序列(或其反向互补序列)。例如,在一些实施例中,靶序列是SEQ ID NO:277(或其反向互补序列)中所示的PDCD1序列的多态变体或PDCD1基因的非人形式。
在一些实施例中,如本文披露的RNA指导物被设计成与靶序列互补,该靶序列与5′-NTTN-3′PAM序列相邻。5′-NTTN-3′序列可以紧邻靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5个)核苷酸内。在一些实施例中,5′-NTTN-3′序列是5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y是C或T,B是除A之外的任何核苷酸,D是除C之外的任何核苷酸,并且R是A或G。在一些实施例中,5′-NTTN-3′序列是5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,RNA指导物被设计成与双链靶序列的第一链(例如,靶链或间隔子互补链)结合,并且5′-NTTN-3′PAM序列存在于第二互补链(例如,非靶链或非间隔子互补链)。在一些实施例中,RNA指导物在靶链(例如,间隔子互补链)上的5′-NAAN-3′序列附近结合。
在一些实施例中,Cas12i多肽具有酶活性(例如,核酸酶活性)。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA双链断裂。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA单链断裂。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA切口。在一些实施例中,DNA断裂和/或切口导致形成一个或多个插入缺失(例如,一个或多个缺失)。
在一些实施例中,本文披露的RNA指导物与Cas12i多肽形成复合物并将该Cas12i多肽引导至与5′-NTTN-3′序列相邻的靶序列。在一些实施例中,该复合物诱导与5'-NTTN-3'序列相邻的缺失(例如,核苷酸缺失或DNA缺失)。在一些实施例中,该复合物诱导与以下序列相邻的缺失:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,该复合物诱导与富含T/C的序列相邻的缺失。
在一些实施例中,缺失在5′-NTTN-3′序列的下游。在一些实施例中,缺失在以下序列的下游:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游。
在一些实施例中,缺失改变PDCD1基因的表达。在一些实施例中,缺失改变PDCD1基因的功能。在一些实施例中,缺失使PDCD1基因失活。在一些实施例中,缺失是移码缺失。在一些实施例中,缺失是非移码缺失。在一些实施例中,缺失导致细胞毒性或细胞死亡(例如,凋亡)。
在一些实施例中,缺失在5'-NTTN-3′序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。
在一些实施例中,缺失在5′-NTTN-3′序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。
在一些实施例中,缺失在5′-NTTN-3′序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。
在一些实施例中,缺失在5′-NTTN-3′序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。
在一些实施例中,缺失在5′-NTTN-3′序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。
在一些实施例中,缺失在5′-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。
在一些实施例中,缺失在5′-NTTN-3′序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5′-NTTN-3′序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5′-NTTN-3′序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5′-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3′序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5′-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内,并且终于该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3′序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5′-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3′序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5′-NTTN-3′序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5′-NTTN-3′序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5′-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5′-NTTN-3′序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失的长度多达约50个核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸)。在一些实施例中,缺失的长度多达约40个核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约40个核苷酸之间(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约25个核苷酸之间(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约25个核苷酸之间(例如,约7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约15个核苷酸之间(例如,约7、8、9、10、11、12、13、14、15、16或17个核苷酸)。
在一些实施例中,本文所述的方法用于工程化在PDCD1基因中包含如本文所述的缺失的细胞。
本文披露的组合物、载体、核酸、RNA指导物和细胞可用于疗法中。本文披露的组合物、载体、核酸、RNA指导物和细胞可用于治疗受试者的疾病或病症的方法中。本领域已知的任何合适的递送或施用方法可用于递送本文披露的组合物、载体、核酸、RNA指导物和细胞。这样的方法可以涉及使靶序列与本文披露的组合物、载体、核酸或RNA指导物接触。这样的方法可以涉及编辑如本文披露的PDCD1序列的方法。在一些实施例中,使用本文披露的RNA指导物工程化的细胞用于离体基因疗法。在一些实施例中,使用本文披露的RNA指导物工程化的细胞用于CAR T细胞疗法。
试剂盒
本发明还提供了可以用于例如实施本文所述的方法的试剂盒或系统。在一些实施例中,试剂盒或系统包括RNA指导物和Cas12i多肽。在一些实施例中,试剂盒或系统包括编码这种Cas12i多肽的多核苷酸,并且任选地,该多核苷酸被包含在例如如本文所述的载体内。在一些实施例中,试剂盒或系统包括编码本文披露的RNA指导物的多核苷酸。可以将Cas12i多肽和RNA指导物(例如,作为核糖核蛋白)包装在试剂盒或系统内的相同容器或其他容器内,或者可以包装在内容物可以在使用前混合的分开的小瓶或其他容器中。任选地,试剂盒或系统还可以额外地包括缓冲液和/或RNA指导物和Cas12i多肽的使用说明。
本文引用的所有参考文献和出版物特此通过援引并入。
实例
提供以下实例以进一步说明本发明的一些实施例但并非旨在限制本发明的范围;通过它们的示例性性质将理解,可替代性地使用本领域技术人员已知的其他程序、方法或技术。
实例1—通过转染编辑哺乳动物细胞中的PDCD1
本实例描述了使用通过瞬时转染引入哺乳动物细胞的Cas12i2和RNA指导物组合物对多个PDCD1靶标的插入缺失评估。
SEQ ID NO:287的变体Cas12i2与pcda3.1主链(英杰公司)中的CMV启动子一起被克隆。然后将质粒大量制备并且稀释至1μg/μL。对于RNA指导物制备,通过含有靶序列支架的超聚体(ultramer)和U6启动子衍生编码RNA指导物的dsDNA片段。将超聚体重悬于pH 7.5的10mM Tris·HCl中至最终原液浓度为100μM。随后再次使用10mM Tris·HCl将工作原液稀释至10μM以充当用于PCR反应的模板。将RNA指导物的扩增在具有以下组分的50μL反应物中进行:0.02μl前面提及的模板、2.5μl正向引物、2.5μl反向引物、25μL NEB HiFi聚合酶和20μl水。循环条件是:1x(98℃下30s)、30x(98℃下10s,67℃下15s)、1x(72℃下2min)。将PCR产物用1.8X SPRI处理净化并且归一化至25ng/μL。制备的RNA指导物序列及其相应的靶序列在表6中示出。
表6.用于瞬时转染的RNA指导物和靶序列。
在转染前大约16小时,将100μl在DMEM/10%FBS+青霉素/链霉素中的25,000个HEK293T细胞铺板至96孔板中的每个孔中。在转染的当天,细胞的汇合度为70%-90%。对于待转染的每个孔,制备0.5μlLipofectamine 2000和9.5μl Opti-MEM的混合物,然后在室温下孵育5-20分钟(溶液1)。在孵育之后,将lipofectamine:OptiMEM混合物添加至最多至10μL的含有182ng效应子质粒和14ng RNA指导物以及水的单独混合物(溶液2)。将溶液1和溶液2混合物通过向上和向下吸移进行混合,且然后在室温下孵育25分钟。在孵育后,将20μL溶液1和溶液2混合物逐滴添加至含有细胞的96孔板的每个孔。在转染后72小时,通过以下方式使细胞胰蛋白酶化:向每个孔的中心添加10μL TrypLE并且孵育大约5分钟。然后将100μLD10培养基添加至每个孔并且混合以重悬细胞。然后将细胞以500g旋转沉降10分钟,并且弃去上清液。将QuickExtract缓冲液添加至原始细胞悬浮液体积的量的1/5。将细胞在65℃下孵育15分钟,在68℃下孵育15分钟,并且在98℃下孵育10分钟。
通过两轮PCR制备用于下一代测序的样品。使用第一轮(PCR1)来扩增根据靶的特定基因组区域。通过柱纯化对PCR1产物进行纯化。进行第2轮PCR(PCR2)以添加Illumina衔接子和索引。然后合并反应,将其加载到2% E-gel EX上10分钟并进行凝胶提取。用150次循环NextSeq v2.5中等或高输出试剂盒进行测序运行。
如图1所示,十一个测试的RNA指导物中的每一个都在PDCD1靶序列中诱导了插入缺失。因此,RNA指导物和SEQ ID NO:287的变体Cas12i2能够靶向哺乳动物细胞外显子1和外显子2中的PDCD1靶标。
实例2—通过RNP电穿孔编辑哺乳动物细胞中的PDCD1
本实例描述了在哺乳动物细胞中使用Cas12i多肽对多个PDCD1靶序列进行核糖核蛋白(RNP)转染,然后进行FACS染色和插入缺失评估。
将来自三个单个供体的CD3+T细胞复苏,并使用自动细胞计数器进行计数。收集来自每个供体的样品,并分别进行CD3ε和DAPI染色以用于表面表达和活力的流式细胞术分析。将细胞密度调节至1e6个细胞/mL,并将细胞用抗CD3:CD28的混合物刺激3天。
通过以1:1(效应子:crRNA)的体积比(2.5:1crRNA:效应子摩尔比)混合纯化的变体Cas12i2(400μM;SEQ ID NO:288)与RNA指导物(在250mM NaCl中为1mM;参见表7中的序列)进行变体Cas12i2 RNP复合反应。通过以6.45:1(效应子:sgRNA)的体积比(2.5:1sgRNA:效应子摩尔比)混合纯化的SpCas9(Aldevron;62μM)与sgRNA(在水中为1mM;参见表7中的序列)进行SpCas9 RNP复合反应。对于“只有效应子”的对照,分别以与crRNA或sgRNA相同的体积比将变体Cas12i2或SpCas9与蛋白质储存缓冲液(25mM Tris(pH 7.5)、250mM NaCl、1mMTCEP、50%甘油)混合。包括另外的对照:SpCas9(Aldevron)与Lethal#1(转染对照指导物)、合并的CD3或ROSA26 sgRNA以及SpCas9(Horizon)与Lethal#1、合并的CD3或ROSA26 sgRNA。将复合物在37℃下孵育30-60分钟。孵育后,将RNP稀释至20μM、50μM、100μM或160μM效应子浓度(对于变体Cas12i2)和20μM或50μM(对于SpCas9)。
表7.用于RNP转染的RNA指导物序列。
将稀释的复合反应以2μL/孔分配到384孔电穿孔板中。收集细胞悬浮液,并使用自动细胞计数器进行计数。在P3缓冲液中将细胞密度调节至1.1e7个细胞/mL,并以2e5个细胞/反应(18μL)分配。变体Cas12i2RNP的最终浓度为2μM、5μM、10μM或16μM。SpCas9 RNP的最终浓度为2或5μM。设置以下对照:只有未电穿孔细胞、只有P3原代细胞缓冲液(Lonza#VXP-3032)中的细胞、只有蛋白质储存缓冲液中的细胞。使用电穿孔装置(程序EO-115-AA,LonzaHT)对板进行电穿孔,不包括未电穿孔条件。使用机器人技术(StarLab Hamilton)将每个孔分成四个96孔编辑板(含有200μL总体积)。将编辑板在37℃下孵育7天,在第4天更换100μL培养基。
7天后,将板离心并除去上清液。将沉淀重悬于200μL PBS中。收集100μL样品,并用抗体组(抗PDCD1)或抗CD3ε抗体(lethal#1,用于Cas9对照的合并CD3ε、ROSA26、蛋白质储存缓冲液和未电穿孔)染色。将所有细胞用DAPI染色以评估活力。将剩余的细胞悬浮液转移到96孔PCR板中并以500x g离心5分钟。除去上清液并将沉淀冷冻在-80℃下。
对于gDNA提取,将沉淀解冻至室温并重悬于适当体积的DNA提取缓冲液(QuickExtract)中,得到1000个细胞/μL的最终浓度。然后将样品在PCR机器中在65℃下循环15分钟,在68℃下循环15分钟,在98℃下循环10分钟。然后将样品冷冻在-20℃下。
通过多轮PCR制备用于下一代测序(NGS)的样品。第一轮(PCR I)用于扩增靶位点侧翼的基因组区域并添加NGS衔接子。第二轮(PCR II)用于添加NGS index。然后将反应液合并,通过柱纯化进行纯化,并在荧光计(量子比特公司(Qubit))上定量。使用150循环NGS仪器(NextSeq v2.5)中或高输出试剂盒完成测序运行,并在NGS仪器(NextSeq 550)上运行。
对于NGS分析,插入缺失映射功能使用样品的fastq文件、扩增子参考序列、和正向引物序列。对于每个读段,使用kmer扫描算法来计算读段与参考序列之间的编辑操作(匹配、错配、插入、缺失)。为了去除一些样品中存在的少量引物二聚体,每个读段的前30nt需要与参考匹配,并且超过一半的映射核苷酸为错配的读段也被滤除。通过这些过滤器的多达50,000个读段用于分析,并且如果读段含有插入或缺失,则将其计为插入缺失读数。将插入缺失%计算为含有插入缺失的读段数目除以分析的读段数目(通过过滤器的读段多达50,000个)。通过过滤器的最小读段数目的QC标准是10,000。
结果显示在原代T细胞中由变体Cas12i2 RNP靶向诱导的PDCD1中的插入缺失(图2)。在靶向PDCD1的Cas12i2 RNP电穿孔后七天,细胞活力在所有条件下都保持高水平(图3)。
因此,该实例显示了如何测量用本文所述的RNA指导物/Cas12i多肽复合物电穿孔的细胞(例如T细胞)的活力、细胞中PDCD1的表达以及对细胞中PDCD1靶序列的活性(插入缺失%)。
该实例进一步表明,RNA指导物和SEQ ID NO:288的变体Cas12i2能够靶向哺乳动物细胞外显子1和外显子2中的PDCD1靶标。
序列表
<110> 阿伯生物技术公司(Arbor Biotechnologies, Inc.)
<120> 包含靶向PDCD1的RNA指导物的组合物及其用途
<130> 51451-016WO3
<150> US 63/252,835
<151> 2021-10-06
<150> US 63/108,053
<151> 2020-10-30
<160> 341
<170> PatentIn3.5版
<210> 1
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1
guugcaaaac ccaagaaauc cgucuuucau ugacgg 36
<210> 2
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 2
aauagcggcc cuaagaaauc cgucuuucau ugacgg 36
<210> 3
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 3
auuggaacug gcgagaaauc cgucuuucau ugacgg 36
<210> 4
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 4
ccagcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 5
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 5
cggcgcucga auaggaaauc cgucuuucau ugacgg 36
<210> 6
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 6
guggcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 7
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 7
guugcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 8
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 8
guugcaaugc cuaagaaauc cgucuuucau ugacgg 36
<210> 9
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 9
gcaacaccua agaaauccgu cuuucauuga cggg 34
<210> 10
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 10
agaaauccgu cuuucauuga cgg 23
<210> 11
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 11
aacctgacct gggacagttt cccttccgct 30
<210> 12
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 12
aagggagggt gcccgcccct tgctcccgcc 30
<210> 13
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 13
tccactgctc aggcggaggt gagcggaagg 30
<210> 14
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 14
tagcaccgcc cagacgactg gccagggcgc 30
<210> 15
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 15
ggtaggtggg gtcggcggtc aggtgtccca 30
<210> 16
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 16
ttaggtaggt ggggtcggcg gtcaggtgtc 30
<210> 17
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 17
cgctcacctc cgcctgagca gtggagaagg 30
<210> 18
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 18
ccttccgctc acctccgcct gagcagtgga 30
<210> 19
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 19
cccttccgct cacctccgcc tgagcagtgg 30
<210> 20
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 20
atctgcgcct tgggggccag ggagatggcc 30
<210> 21
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 21
ggggccaggg agatggcccc acagaggtag 30
<210> 22
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 22
tccccttcgg tcaccacgag cagggctggg 30
<210> 23
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 23
ggcagttgtg tgacacggaa gcggcagtcc 30
<210> 24
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 24
cgccgggccc tgaccacgct catgtggaag 30
<210> 25
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 25
tccgtctggt tgctggggct catgcggtac 30
<210> 26
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 26
ctggggctca tgcggtacca gtttagcacg 30
<210> 27
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 27
agcacgaagc tctccgatgt gttggagaag 30
<210> 28
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 28
gatctgcgcc ttgggggcca gggagatggc 30
<210> 29
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 29
tgtgacacgg aagcggcagt cctggccggg 30
<210> 30
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 30
cacatgagcg tggtcagggc ccggcgcaat 30
<210> 31
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 31
acctgcagct tctccaacac atcggagagc 30
<210> 32
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 32
cccgaggacc gcagccagcc cggccaggac 30
<210> 33
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 33
gtgctaaact ggtaccgcat gagccccagc 30
<210> 34
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 34
tccaacacat cggagagctt cgtgctaaac 30
<210> 35
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 35
gcacgaagct ctccgatgtg ttggagaagc 30
<210> 36
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 36
tccccagccc tgctcgtggt gaccgaaggg 30
<210> 37
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 37
ctcacctctc tccatctctc agactcccca 30
<210> 38
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 38
tggggccacc cagccccttc ctcacctctc 30
<210> 39
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 39
gtggggccac ccagcccctt cctcacctct 30
<210> 40
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 40
ggtcaccacg agcagggctg gggagaaggt 30
<210> 41
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 41
cagggcctgt ctggggagtc tgagagatgg 30
<210> 42
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 42
cgtgtcacac aactgcccaa cgggcgtgac 30
<210> 43
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 43
gagaagctgc aggtgaaggt ggcgttgtcc 30
<210> 44
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 44
gtgcccttcc agagagaagg gcagaagtgc 30
<210> 45
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 45
ggacggggtc agggtggagg gtcagggtca 30
<210> 46
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 46
tgcccttcca gagagaaggg cagaagtgcc 30
<210> 47
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 47
cagagagaag ggcagaagtg cccacagccc 30
<210> 48
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 48
gtgtcgtggg cggcctgctg ggcagcctgg 30
<210> 49
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 49
gggcagggca ggccgagggg ctgggatgac 30
<210> 50
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 50
caaaccctgg tggttggtgt cgtgggcggc 30
<210> 51
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 51
ggaactggcc ggctggcctg ggtgaggggc 30
<210> 52
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 52
gaactggccg gctggcctgg gtgaggggct 30
<210> 53
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 53
tgcccttctc tctggaaggg cacaaaggtc 30
<210> 54
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 54
tctctggaag ggcacaaagg tcaggggtta 30
<210> 55
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 55
cctcgtgcgg cccgggagca gatgacggcc 30
<210> 56
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 56
ctctgcaggg acaataggag ccaggcgcac 30
<210> 57
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 57
ctgcatgatc cactgtgcct tccttcctgg 30
<210> 58
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 58
cctgcatgat ccactgtgcc ttccttcctg 30
<210> 59
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 59
tcctgcatga tccactgtgc cttccttcct 30
<210> 60
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 60
tctgcaggga caataggagc caggcgcacc 30
<210> 61
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 61
tccctgcaga gaaacacact tggggtcacc 30
<210> 62
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 62
gggtcaccag gccgaccctg agccgtgctc 30
<210> 63
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 63
cctagcggaa tgggcacctc atcccccgcc 30
<210> 64
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 64
cctgaaactt ctctaggcct gcagggagca 30
<210> 65
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 65
tgaccttccc tgaaacttct ctaggcctgc 30
<210> 66
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 66
ctgccctgcc caccacagcc aggagctctt 30
<210> 67
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 67
cctgccctgc ccaccacagc caggagctct 30
<210> 68
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 68
cctgccccac aaagggcctg aggtgctgcc 30
<210> 69
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 69
ctgcctcagc ttccctgccc cacaaagggc 30
<210> 70
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 70
ggaccgtagg atgtccctct cccgagtggt 30
<210> 71
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 71
tctaggcctg cagggagcag ataactcctg 30
<210> 72
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 72
tgccctccca acacccaggt ggccacagct 30
<210> 73
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 73
aggaatgggt tccaaggaga gctcccaggg 30
<210> 74
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 74
caggaatggg ttccaaggag agctcccagg 30
<210> 75
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 75
aataatttca ggaatgggtt ccaaggagag 30
<210> 76
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 76
aaataatttc aggaatgggt tccaaggaga 30
<210> 77
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 77
ccacccaggc cctggtggga gcccggccaa 30
<210> 78
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 78
tcccagccac tcaggtgcct gctggccgcc 30
<210> 79
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 79
taatataata gaaccacagg gaagggggat 30
<210> 80
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 80
caaggagagc tcccagggtg ggcacatggg 30
<210> 81
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 81
taattataat ataatagaac cacagggaag 30
<210> 82
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 82
ggccctgcgt ccagggcgtt tcgggatgcc 30
<210> 83
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 83
gggatgccac tgccaggggc accttggctg 30
<210> 84
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 84
ctgcggtggg ccgtggggct gactccctct 30
<210> 85
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 85
ctcctcaaag aaggaggacc cctcagccgt 30
<210> 86
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 86
tcctcaaaga aggaggaccc ctcagccgtg 30
<210> 87
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 87
tctgtggact atggggagct ggatttccag 30
<210> 88
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 88
ccagtggcga gagaagaccc cggagccccc 30
<210> 89
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 89
aggagaaagg gagagggagt cagccccacg 30
<210> 90
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 90
gaggagaaag ggagagggag tcagccccac 30
<210> 91
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 91
cgggatgcca ctgccagggg caccttggct 30
<210> 92
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 92
tttgaggaga aagggagagg gagtcagccc 30
<210> 93
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 93
cgctaggaaa gacaatggtg gcatactccg 30
<210> 94
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 94
tcctgaggaa atgcgctgac ccgggctcat 30
<210> 95
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 95
agacatgagt cctgtggtgg ggctgtgcct 30
<210> 96
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 96
agggagctgg acgcaggcag ctctgtgctg 30
<210> 97
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 97
agccccgggc cgcaggcagc agcagcagca 30
<210> 98
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 98
aggcaggagg ctccggggcg tcaggcaggg 30
<210> 99
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 99
gctgctccaa ggccatctcc aaccagcccc 30
<210> 100
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 100
tctcgccact ggaaatccag ctccccatag 30
<210> 101
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 101
attataatta taatataata gaaccacagg 30
<210> 102
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 102
aattataatt ataatataat agaaccacag 30
<210> 103
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 103
gcatgctctc atatttaatt ataattataa 30
<210> 104
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 104
acacatgccc aggcagcacc tcaggccctt 30
<210> 105
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 105
agggaaggtc agaagagctc ctggctgtgg 30
<210> 106
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 106
cagggaaggt cagaagagct cctggctgtg 30
<210> 107
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 107
cagtggcgag agaagacccc ggagcccccc 30
<210> 108
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 108
gagcagccaa ggtgcccctg gcagtggcat 30
<210> 109
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 109
gagatggcct tggagcagcc aaggtgcccc 30
<210> 110
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 110
ggggctggtt ggagatggcc ttggagcagc 30
<210> 111
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 111
cacatgccca ggcagcacct caggcccttt 30
<210> 112
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 112
aggtcctgcc agcacagagc tgcctgcgtc 30
<210> 113
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 113
ctcaggagaa gcaggcaggg tgcaggccat 30
<210> 114
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 114
cctcaggaga agcaggcagg gtgcaggcca 30
<210> 115
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 115
tgcagaccct ccaccatgag cccgggtcag 30
<210> 116
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 116
gccaccagtg ttctgcagac cctccaccat 30
<210> 117
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 117
cttggccacc agtgttctgc agaccctcca 30
<210> 118
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 118
gcccctctga ccggcttcct tggccaccag 30
<210> 119
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 119
ctagcggaat gggcacctca tcccccgccc 30
<210> 120
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 120
caggccgtcc aggggctgag ctgcctgggg 30
<210> 121
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 121
gtggggcagg gaagctgagg cagtaagcgg 30
<210> 122
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 122
tggggcaggg aagctgaggc agtaagcggg 30
<210> 123
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 123
caggcccagc cagcactctg gcctcctgcc 30
<210> 124
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 124
aatatgagag catgctaagg a 21
<210> 125
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 125
taattaaata tgagagcatg ctaagga 27
<210> 126
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 126
taattataat taaatatgag agcatgctaa 30
<210> 127
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 127
tattataatt ataattaaat atgagagcat 30
<210> 128
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 128
tattatatta taattataat taaatatgag 30
<210> 129
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 129
cctgtggttc tattatatta taattataat 30
<210> 130
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 130
ccccggggcc tagtaccccc gccgtggcct 30
<210> 131
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 131
gccgggctcc caccagggcc tgggtgggaa 30
<210> 132
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 132
aaggggttgg ccgggctccc accagggcct 30
<210> 133
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 133
aaaggggttg gccgggctcc caccagggcc 30
<210> 134
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 134
tttaaagggg ttggccgggc tcccaccagg 30
<210> 135
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 135
ctgaaattat ttaaaggggt tggccgggct 30
<210> 136
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 136
gaacccattc ctgaaattat ttaaaggggt 30
<210> 137
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 137
ggagggcaga agtgcaggca cctagggccc 30
<210> 138
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 138
actcaggccc ctcccagctg tggccacctg 30
<210> 139
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 139
caccccagcc cctcacacca ctcgggagag 30
<210> 140
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 140
aggcccagcc agcactctgg cctcctgccg 30
<210> 141
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 141
tctttcctag cggaatgggc acctcatccc 30
<210> 142
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 142
tctgctccct gcaggcctag agaagtttca 30
<210> 143
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 143
aaccugaccu gggacaguuu cccuuccgcu 30
<210> 144
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 144
aagggagggu gcccgccccu ugcucccgcc 30
<210> 145
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 145
uccacugcuc aggcggaggu gagcggaagg 30
<210> 146
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 146
uagcaccgcc cagacgacug gccagggcgc 30
<210> 147
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 147
gguagguggg gucggcgguc agguguccca 30
<210> 148
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 148
uuagguaggu ggggucggcg gucagguguc 30
<210> 149
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 149
cgcucaccuc cgccugagca guggagaagg 30
<210> 150
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 150
ccuuccgcuc accuccgccu gagcagugga 30
<210> 151
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 151
cccuuccgcu caccuccgcc ugagcagugg 30
<210> 152
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 152
aucugcgccu ugggggccag ggagauggcc 30
<210> 153
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 153
ggggccaggg agauggcccc acagagguag 30
<210> 154
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 154
uccccuucgg ucaccacgag cagggcuggg 30
<210> 155
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 155
ggcaguugug ugacacggaa gcggcagucc 30
<210> 156
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 156
cgccgggccc ugaccacgcu cauguggaag 30
<210> 157
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 157
uccgucuggu ugcuggggcu caugcgguac 30
<210> 158
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 158
cuggggcuca ugcgguacca guuuagcacg 30
<210> 159
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 159
agcacgaagc ucuccgaugu guuggagaag 30
<210> 160
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 160
gaucugcgcc uugggggcca gggagauggc 30
<210> 161
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 161
ugugacacgg aagcggcagu ccuggccggg 30
<210> 162
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 162
cacaugagcg uggucagggc ccggcgcaau 30
<210> 163
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 163
accugcagcu ucuccaacac aucggagagc 30
<210> 164
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 164
cccgaggacc gcagccagcc cggccaggac 30
<210> 165
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 165
gugcuaaacu gguaccgcau gagccccagc 30
<210> 166
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 166
uccaacacau cggagagcuu cgugcuaaac 30
<210> 167
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 167
gcacgaagcu cuccgaugug uuggagaagc 30
<210> 168
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 168
uccccagccc ugcucguggu gaccgaaggg 30
<210> 169
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 169
cucaccucuc uccaucucuc agacucccca 30
<210> 170
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 170
uggggccacc cagccccuuc cucaccucuc 30
<210> 171
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 171
guggggccac ccagccccuu ccucaccucu 30
<210> 172
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 172
ggucaccacg agcagggcug gggagaaggu 30
<210> 173
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 173
cagggccugu cuggggaguc ugagagaugg 30
<210> 174
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 174
cgugucacac aacugcccaa cgggcgugac 30
<210> 175
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 175
gagaagcugc aggugaaggu ggcguugucc 30
<210> 176
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 176
gugcccuucc agagagaagg gcagaagugc 30
<210> 177
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 177
ggacgggguc aggguggagg gucaggguca 30
<210> 178
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 178
ugcccuucca gagagaaggg cagaagugcc 30
<210> 179
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 179
cagagagaag ggcagaagug cccacagccc 30
<210> 180
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 180
gugucguggg cggccugcug ggcagccugg 30
<210> 181
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 181
gggcagggca ggccgagggg cugggaugac 30
<210> 182
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 182
caaacccugg ugguuggugu cgugggcggc 30
<210> 183
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 183
ggaacuggcc ggcuggccug ggugaggggc 30
<210> 184
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 184
gaacuggccg gcuggccugg gugaggggcu 30
<210> 185
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 185
ugcccuucuc ucuggaaggg cacaaagguc 30
<210> 186
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 186
ucucuggaag ggcacaaagg ucagggguua 30
<210> 187
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 187
ccucgugcgg cccgggagca gaugacggcc 30
<210> 188
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 188
cucugcaggg acaauaggag ccaggcgcac 30
<210> 189
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 189
cugcaugauc cacugugccu uccuuccugg 30
<210> 190
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 190
ccugcaugau ccacugugcc uuccuuccug 30
<210> 191
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 191
uccugcauga uccacugugc cuuccuuccu 30
<210> 192
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 192
ucugcaggga caauaggagc caggcgcacc 30
<210> 193
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 193
ucccugcaga gaaacacacu uggggucacc 30
<210> 194
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 194
gggucaccag gccgacccug agccgugcuc 30
<210> 195
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 195
ccuagcggaa ugggcaccuc aucccccgcc 30
<210> 196
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 196
ccugaaacuu cucuaggccu gcagggagca 30
<210> 197
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 197
ugaccuuccc ugaaacuucu cuaggccugc 30
<210> 198
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 198
cugcccugcc caccacagcc aggagcucuu 30
<210> 199
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 199
ccugcccugc ccaccacagc caggagcucu 30
<210> 200
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 200
ccugccccac aaagggccug aggugcugcc 30
<210> 201
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 201
cugccucagc uucccugccc cacaaagggc 30
<210> 202
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 202
ggaccguagg augucccucu cccgaguggu 30
<210> 203
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 203
ucuaggccug cagggagcag auaacuccug 30
<210> 204
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 204
ugcccuccca acacccaggu ggccacagcu 30
<210> 205
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 205
aggaaugggu uccaaggaga gcucccaggg 30
<210> 206
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 206
caggaauggg uuccaaggag agcucccagg 30
<210> 207
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 207
aauaauuuca ggaauggguu ccaaggagag 30
<210> 208
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 208
aaauaauuuc aggaaugggu uccaaggaga 30
<210> 209
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 209
ccacccaggc ccugguggga gcccggccaa 30
<210> 210
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 210
ucccagccac ucaggugccu gcuggccgcc 30
<210> 211
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 211
uaauauaaua gaaccacagg gaagggggau 30
<210> 212
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 212
caaggagagc ucccagggug ggcacauggg 30
<210> 213
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 213
uaauuauaau auaauagaac cacagggaag 30
<210> 214
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 214
ggcccugcgu ccagggcguu ucgggaugcc 30
<210> 215
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 215
gggaugccac ugccaggggc accuuggcug 30
<210> 216
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 216
cugcgguggg ccguggggcu gacucccucu 30
<210> 217
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 217
cuccucaaag aaggaggacc ccucagccgu 30
<210> 218
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 218
uccucaaaga aggaggaccc cucagccgug 30
<210> 219
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 219
ucuguggacu auggggagcu ggauuuccag 30
<210> 220
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 220
ccaguggcga gagaagaccc cggagccccc 30
<210> 221
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 221
aggagaaagg gagagggagu cagccccacg 30
<210> 222
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 222
gaggagaaag ggagagggag ucagccccac 30
<210> 223
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 223
cgggaugcca cugccagggg caccuuggcu 30
<210> 224
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 224
uuugaggaga aagggagagg gagucagccc 30
<210> 225
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 225
cgcuaggaaa gacaauggug gcauacuccg 30
<210> 226
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 226
uccugaggaa augcgcugac ccgggcucau 30
<210> 227
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 227
agacaugagu ccuguggugg ggcugugccu 30
<210> 228
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 228
agggagcugg acgcaggcag cucugugcug 30
<210> 229
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 229
agccccgggc cgcaggcagc agcagcagca 30
<210> 230
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 230
aggcaggagg cuccggggcg ucaggcaggg 30
<210> 231
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 231
gcugcuccaa ggccaucucc aaccagcccc 30
<210> 232
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 232
ucucgccacu ggaaauccag cuccccauag 30
<210> 233
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 233
auuauaauua uaauauaaua gaaccacagg 30
<210> 234
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 234
aauuauaauu auaauauaau agaaccacag 30
<210> 235
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 235
gcaugcucuc auauuuaauu auaauuauaa 30
<210> 236
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 236
acacaugccc aggcagcacc ucaggcccuu 30
<210> 237
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 237
agggaagguc agaagagcuc cuggcugugg 30
<210> 238
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 238
cagggaaggu cagaagagcu ccuggcugug 30
<210> 239
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 239
caguggcgag agaagacccc ggagcccccc 30
<210> 240
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 240
gagcagccaa ggugccccug gcaguggcau 30
<210> 241
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 241
gagauggccu uggagcagcc aaggugcccc 30
<210> 242
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 242
ggggcugguu ggagauggcc uuggagcagc 30
<210> 243
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 243
cacaugccca ggcagcaccu caggcccuuu 30
<210> 244
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 244
agguccugcc agcacagagc ugccugcguc 30
<210> 245
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 245
cucaggagaa gcaggcaggg ugcaggccau 30
<210> 246
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 246
ccucaggaga agcaggcagg gugcaggcca 30
<210> 247
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 247
ugcagacccu ccaccaugag cccgggucag 30
<210> 248
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 248
gccaccagug uucugcagac ccuccaccau 30
<210> 249
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 249
cuuggccacc aguguucugc agacccucca 30
<210> 250
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 250
gccccucuga ccggcuuccu uggccaccag 30
<210> 251
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 251
cuagcggaau gggcaccuca ucccccgccc 30
<210> 252
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 252
caggccgucc aggggcugag cugccugggg 30
<210> 253
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 253
guggggcagg gaagcugagg caguaagcgg 30
<210> 254
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 254
uggggcaggg aagcugaggc aguaagcggg 30
<210> 255
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 255
caggcccagc cagcacucug gccuccugcc 30
<210> 256
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 256
aauaugagag caugcuaagg a 21
<210> 257
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 257
uaauuaaaua ugagagcaug cuaagga 27
<210> 258
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 258
uaauuauaau uaaauaugag agcaugcuaa 30
<210> 259
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 259
uauuauaauu auaauuaaau augagagcau 30
<210> 260
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 260
uauuauauua uaauuauaau uaaauaugag 30
<210> 261
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 261
ccugugguuc uauuauauua uaauuauaau 30
<210> 262
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 262
ccccggggcc uaguaccccc gccguggccu 30
<210> 263
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 263
gccgggcucc caccagggcc ugggugggaa 30
<210> 264
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 264
aagggguugg ccgggcuccc accagggccu 30
<210> 265
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 265
aaagggguug gccgggcucc caccagggcc 30
<210> 266
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 266
uuuaaagggg uuggccgggc ucccaccagg 30
<210> 267
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 267
cugaaauuau uuaaaggggu uggccgggcu 30
<210> 268
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 268
gaacccauuc cugaaauuau uuaaaggggu 30
<210> 269
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 269
ggagggcaga agugcaggca ccuagggccc 30
<210> 270
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 270
acucaggccc cucccagcug uggccaccug 30
<210> 271
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 271
caccccagcc ccucacacca cucgggagag 30
<210> 272
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 272
aggcccagcc agcacucugg ccuccugccg 30
<210> 273
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 273
ucuuuccuag cggaaugggc accucauccc 30
<210> 274
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 274
ucugcucccu gcaggccuag agaaguuuca 30
<210> 275
<211> 3162
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 275
atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60
ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120
caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180
cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240
agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300
ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360
tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420
gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480
agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540
agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600
ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660
accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720
gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780
attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840
gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900
accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960
ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020
gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080
aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140
attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200
ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260
aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320
aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380
cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440
cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500
gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560
ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620
accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680
atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740
gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800
aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860
aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920
aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980
gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040
aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100
ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160
aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220
tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280
aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340
agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400
ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460
acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520
aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580
aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640
tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700
tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760
ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820
agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880
agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940
gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000
accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060
gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120
gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162
<210> 276
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 276
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 277
<211> 9366
<212> DNA
<213> 智人
<400> 277
aggagaaggg cctgccccca cccggcagcc tcaggagggg cagctcgggc gggatatgga 60
aagaggccac agcagtgagc agagacacag aggaggaagg ggccctgagc tggggagacc 120
cccacggggt agggcgtggg ggccacgggc ccacctcctc cccatctcct ctgtctccct 180
gtctctgtct ctctctccct cccccaccct ctccccagtc ctaccccctc ctcacccctc 240
ctcccccagc actgcctctg tcactctcgc ccacgtggat gtggaggaag agggggcggg 300
agcaaggggc gggcaccctc ccttcaacct gacctgggac agtttccctt ccgctcacct 360
ccgcctgagc agtggagaag gcggcactct ggtggggctg ctccaggcat gcagatccca 420
caggcgccct ggccagtcgt ctgggcggtg ctacaactgg gctggcggcc aggatggttc 480
ttaggtaggt ggggtcggcg gtcaggtgtc ccagagccag gggtctggag ggaccttcca 540
ccctcagtcc ctggcaggtc ggggggtgct gaggcgggcc tggccctggc agcccagggg 600
tcccggagcg aggggtctgg agggaccttt cactctcagt ccctggcagg tcggggggtg 660
ctgtggcagg cccagccttg gcccccagct ctgcccctta ccctgagctg tgtggctttg 720
ggcagctcga actcctgggt tcctctctgg gccccaactc ctcccctggc ccaagtcccc 780
tctttgctcc tgggcaggca ggacctctgt cccctctcag ccggtccttg gggctgcgtg 840
tttctgtaga atgacgggtc aggctggcca gaaccccaaa ccttggccgt ggggagtctg 900
cgtggcggct ctgccttgcc caggcatcct tggtcctcac tcgagttttc ctaaggatgg 960
gatgagcccc atgtgggact aaccttggct ttacgacgtc aaagtttaga tgagctggtg 1020
atatttttct cattatatcc aaagtgtacc tgttcgagtg aggacagttc ttctgtctcc 1080
aggatccctc ctgggtgggg attgtgcccg cctgggtctc tgcccagatt ccagggctct 1140
ccccgagccc tgttcagacc atccgtgggg gaggccttgg cctcactctc ccggatcgag 1200
gagagaggga gcctcttcct gggctgcccg tgaccctggg ccctctgtgt acactgtgac 1260
cacagcccgc tcctggaccc tctgtgcccg gctggccctc tgtgcccagc cagcctgcac 1320
ctggggatgc caaggcctgg ggagggtggt ttcacccagg ccaagcctaa gacagtccct 1380
ctgggccctg ctgggtaccg gggtgtgaca ccactgggag gacaagatga ggggcacccc 1440
tggggccgcc ctgacacccc ctcgaggctc ctgccccggg ggtcctggtg ccccttcact 1500
gtggcaggcg actgggggtt ccccacctcg gcccctctcc cggggcctgc tccccggcac 1560
ctgaggcagc atccttgtca gggccgtgcc ttcctgcctc agcgccacct cttaaggttg 1620
gcccgtgggt cactcaggac tcagaactgg agattctggg caaaaggcaa agagcaaagg 1680
gccaaaaggc atcccaggga gacgactgcg ggggaaccag agggcagagg ggcgctcgtc 1740
acaggggagg gggagctgag cgaggcagga ggggagccga gcctctcccc ccgtgtcccg 1800
gctcttcagg cacgccctcg ggacgccacc ctccccgacc caggcgggaa agataagagc 1860
aaggtgtccg cagcctgaca ctcgtgcctc aggtgcccgc gcttgtgccg gacaagactc 1920
tcacaggtgg catgcctcgg tttccccact ggtaacagca cagggcactc agcaaggcgc 1980
agtgggcatg actggggtcc tgtgggtcct gacccagatg tggccacccc ggccgcagtg 2040
gtcttcattc caggatgcct cttttccctc ctgatctatt cactgcgttc gccattcggt 2100
cattcccggg gccaccactc ccacctcagg tgtgtgcttc ccttgtgttt tatgagatat 2160
ccccaacccg gctgcttatt ggccccgtcc gagggcagga gcataaataa gagcctctgc 2220
tttggcgtgg gaccactgtg agctccagtc agcgctgcca ctgctgagct ctgggccttc 2280
gacaggactt ggccccttac tgacttctcc gtgtgctttg ggtcatgggt gaggacgcct 2340
cctggcaagg ctgcgtcctg aggattaaat cgggtcatct gtgaaaacta cccagcccag 2400
cccctgacac ttttttgttt gtttctttta gtgacagggt cttgctctgt cacccaggct 2460
ggagtgcagt ggtgtgatct cggctcactc gacctccggg gctcaagcaa ttctcccacc 2520
tctgcctcca gagtagctgg gactataggc acgtgccacc ctgccaggct aatttcttcc 2580
atttttttta gagacagggt ctcgctatgt tccccaggct gggctcaaat ggtcctccca 2640
cctcagcctc cccaagtact gggattacag gcataagcca ctgcatctgg cctccatgac 2700
acatattttt aaagtctgat ttttaaagtc aaacttttga agtcagattt taaacggact 2760
attttgaaaa atatacaaaa acgtttaaaa acaatgaata tccctcacct agaatcaata 2820
actaagaata ttgacacatt tgctttgggg actgggcggc tggagctgcc atgacaaagc 2880
tccgccgacc gagtggcttt taaacagagc ctgccctctc gccgactgag ggctggacgt 2940
gcaggatgga gctccgcagg gtcggctccc ctgtgctctg aggggctctg ctcagcctct 3000
cccggctgtg gcttaaaaac agagcctgtc ctcccgccgt ggggggctgg acatgcagga 3060
ccgaggggcc acagggtcgg ctccctgtgc tccgagaggg ctctgctcag cttctcctgg 3120
ctggggggtt ttgtggccac cctctgtgtt cctgggttca gaagcatccc ccaggctctg 3180
ccttcatctc tgcacgggtg actctgtaca ggaagccagg cctgctggtc aatggccacc 3240
cagccctgtg ccctcatctt acctagtccc agctgccgtc accctattcc taataaggcc 3300
gccttctgag gtcatggggt taggacttcc acataggaat ctgtggggac acggttcggc 3360
ccacagccct tcccacctcc acacacacac acgactgtga ggagttggaa gacctcactc 3420
ctcacccctg ccaggtcctc tagggacaag ctcgctgtcc tcatcccagc acagcccgtg 3480
ggacggtttc cttgtcccta atgggaccac ggtcagagat gccgggtctg gtctgggcca 3540
gcaggttcct ccgcccgggg caggcagcct tcttctgtgc gcttctggaa agcaatgtcc 3600
tgtaatgcgg tctctctgcg ggagcacccc caccgccacc tcacaggcct gttccacagc 3660
cccgggatgg gctctgtctc cctcctgacc ctgcataggg cacagccctc tctcatcaac 3720
ccacgatcct acgtggatcc gagagggagc acctggggaa acaatggaat cccatagaaa 3780
caccccaaat ctaacttgat ccaggaccag ccagtggtca cttctgaata ttcaccttcc 3840
tagtagacac taccagccaa gggaggccag gaagccttcc tggaggaggt ggcctgagga 3900
ctggggtgag gcaggccctg cgtgggggtc gccacccagc acccccacac tgggtgggag 3960
ccagtctctg agactggctg ggggaggtgg gagagggggc tgcttgaact gcagacaccg 4020
aggtctagcc cccaccccac ccagccagtt ggtggaggca ggggaggccg aggggcccag 4080
ctggacctgc tccccggggt ggattccaaa ataggggggt tggggggggc ggaacaggag 4140
cccagggtcc tggcttgagg cccagtggct gagggctggt gcaagccaga caggaaaagg 4200
gttgagcctg tcagcgccag cacagatcaa gtcaggagca ggtccctcca ccaatgtgtg 4260
caaataaata gcagctaagt ttccagttac aagaacaatg cacagatggt cccagggaca 4320
ttgcggtgtg gacacacagc ggccattgtc ctgtcgccag cacctcgccc tacagctggg 4380
gggtccctta gcacttccta gccatgcagg gtccctgctc acagtacccg tgatgacttc 4440
tgttcctcac ctgcctgtct gtcccgacag ctgcatggca gccctggcct gggagatgga 4500
gaccccgagg ggctgcctgc ggtggtgggg cccctgggtc cccactgcat tcccagaaac 4560
ccagagggca gggcatttcc cctgctctgt gccgagtcca cccagcccca gcctaggccc 4620
agtaagggct gcagcccacc ctgtcccagg ctgcctccca ggagccctct tggccctgat 4680
gccagaagcc catcttcctc cattcaggca ggtctctgag tgccctggcc tggctgcctg 4740
ctggccctga gagtcacact accccacagc cctccttggt caaaatccac tctggagtgg 4800
ctggaagatt ccccgggccc acgccgcaca cgcctatgca gggagcttcc cctggccggc 4860
cggcagacaa gggcggtctc agagaggggg ctcacctcag cagccccttg tgtagctggc 4920
cctcgcccct gccacctctg ggaacaccac caggaagctg ggggacaggc acgcaggtga 4980
aggaggcgag cgcttgtcag ccgggaggcc atgggcacag agggaacagg gacaccctgg 5040
gtggcctcaa ggtcacttca aacccctcac tcgtcccctg ggagggtgcc cagtgaggtt 5100
ggcactagga gttggtcctg gtcacatgac agacccaccc acctctggtg tccagccagc 5160
acgccgtggg ccagcctggc tgcagggaca cgagggcagc agccccctcc tcctctgagc 5220
tggttgctcc ttgagtcatc accaccgcct gccacggagg ccgcctgtcc caggaagcag 5280
agggaccgca gctgtggcaa ccagggcctg gtctctgtgt cacctcgctg gggggccgtg 5340
cccaggcctg agacggaact gagtgacagt gcactgggtc tgacagtgtg gggctggcgc 5400
catgtttggg gaaccctgtg gcatgggacc tgtgggtgag ccgggaaaat caccccgttg 5460
catggcatct cgggcctgga tcttaagcgc ctgtgttggt gcctccgcct ggcggaagag 5520
ccgcgacccc cacgttgcca tgcgggtatc ccaagccctg accctggcag gcatatgttt 5580
caggaggtcc ttgtcttggg agcccagggt cgggggcccc gtgtctgtcc acatccgagt 5640
caatggccca tctcgtctct gaagcatctt tgctgtgagc tctagtcccc actgtcttgc 5700
tggaaaatgt ggaggcccca ctgcccactg cccagggcag caatgcccat accacgtggt 5760
cccagctccg agcttgtcct gaaaaggggg caaagactgg accctgagcc tgccaagggg 5820
ccacactcct cccagggctg gggtctccat gggcagcccc ccacccaccc agaccagtta 5880
cactcccctg tgccagagca gtgcagacag gaccaggcca ggatgcccaa gggtcagggg 5940
ctggggatgg gtagccccca aacagccctt tctgggggaa ctggcctcaa cggggaaggg 6000
ggtgaaggct cttagtagga aatcagggag acccaagtca gagccaggtg ctgtgcagaa 6060
gctgcagcct cacgtagaag gaagaggctc tgcagtggag gccagtgccc atccccgggt 6120
ggcagaggcc ccagcagaga cttctcaatg acattccagc tggggtggcc cttccagagc 6180
ccttgctgcc cgagggatgt gagcaggtgg ccggggaggc tttgtggggc cacccagccc 6240
cttcctcacc tctctccatc tctcagactc cccagacagg ccctggaacc cccccacctt 6300
ctccccagcc ctgctcgtgg tgaccgaagg ggacaacgcc accttcacct gcagcttctc 6360
caacacatcg gagagcttcg tgctaaactg gtaccgcatg agccccagca accagacgga 6420
caagctggcc gccttccccg aggaccgcag ccagcccggc caggactgcc gcttccgtgt 6480
cacacaactg cccaacgggc gtgacttcca catgagcgtg gtcagggccc ggcgcaatga 6540
cagcggcacc tacctctgtg gggccatctc cctggccccc aaggcgcaga tcaaagagag 6600
cctgcgggca gagctcaggg tgacaggtgc ggcctcggag gccccggggc aggggtgagc 6660
tgagccggtc ctggggtggg tgtcccctcc tgcacaggat caggagctcc agggtcgtag 6720
ggcagggacc ccccagctcc agtccagggc tctgtcctgc acctggggaa tggtgaccgg 6780
catctctgtc ctctagctct ggaagcaccc cagcccctct agtctgccct cacccctgac 6840
cctgaccctc caccctgacc ccgtcctaac ccctgacctt tgtgcccttc cagagagaag 6900
ggcagaagtg cccacagccc accccagccc ctcacccagg ccagccggcc agttccaaac 6960
cctggtggtt ggtgtcgtgg gcggcctgct gggcagcctg gtgctgctag tctgggtcct 7020
ggccgtcatc tgctcccggg ccgcacgagg taacgtcatc ccagcccctc ggcctgccct 7080
gccctaaccc tgctggcggc cctcactccc gcctcccctt cctccaccct tccctcaccc 7140
caccccacct ccccccatct ccccgccagg ctaagtccct gatgaaggcc cctggactaa 7200
gaccccccac ctaggagcac ggctcagggt cggcctggtg accccaagtg tgtttctctg 7260
cagggacaat aggagccagg cgcaccggcc agcccctggt gagtctcact cttttcctgc 7320
atgatccact gtgccttcct tcctgggtgg gcagaggtgg aaggacaggc tgggaccaca 7380
cggcctgcag gactcacatt ctattatagc caggacccca cctccccagc ccccaggcag 7440
caacctcaat ccctaaagcc atgatctggg gccccagccc acctgcggtc tccgggggtg 7500
cccggcccat gtgtgtgcct gcctgcggtc tccaggggtg cctggcccac gcgtgtgccc 7560
gcctgcggtc tctgggggtg cccggcccac atatgtgcct gcctgcggtc tccaggtgtg 7620
cccggcccat gcgtgtgccc acctgcgagg gcgtggggtg ggcttggtca tttcttatct 7680
tacattggag acaggagagc ttgaaaagtc acattttgga atcctaaatc tgcaagaatg 7740
ccagggacat ttcagagggg gacattgagc cagagaggag gggtggtgtc cccagatcac 7800
acagagggca gtggtgggac agctcagggt aagcagctca tagtgggggg cccaggttcg 7860
gtgccggtac tgcagccagg ctgtggagcc gcgggcctcc ttcctgcggt gggccgtggg 7920
gctgactccc tctccctttc tcctcaaaga aggaggaccc ctcagccgtg cctgtgttct 7980
ctgtggacta tggggagctg gatttccagt ggcgagagaa gaccccggag ccccccgtgc 8040
cctgtgtccc tgagcagacg gagtatgcca ccattgtctt tcctagcgga atgggcacct 8100
catcccccgc ccgcaggggc tcagctgacg gccctcggag tgcccagcca ctgaggcctg 8160
aggatggaca ctgctcttgg cccctctgac cggcttcctt ggccaccagt gttctgcaga 8220
ccctccacca tgagcccggg tcagcgcatt tcctcaggag aagcaggcag ggtgcaggcc 8280
attgcaggcc gtccaggggc tgagctgcct gggggcgacc ggggctccag cctgcacctg 8340
caccaggcac agccccacca caggactcat gtctcaatgc ccacagtgag cccaggcagc 8400
aggtgtcacc gtcccctaca gggagggcca gatgcagtca ctgcttcagg tcctgccagc 8460
acagagctgc ctgcgtccag ctccctgaat ctctgctgct gctgctgctg ctgctgctgc 8520
tgcctgcggc ccggggctga aggcgccgtg gccctgcctg acgccccgga gcctcctgcc 8580
tgaacttggg ggctggttgg agatggcctt ggagcagcca aggtgcccct ggcagtggca 8640
tcccgaaacg ccctggacgc agggcccaag actgggcaca ggagtgggag gtacatgggg 8700
ctggggactc cccaggagtt atctgctccc tgcaggccta gagaagtttc agggaaggtc 8760
agaagagctc ctggctgtgg tgggcagggc aggaaacccc tccaccttta cacatgccca 8820
ggcagcacct caggcccttt gtggggcagg gaagctgagg cagtaagcgg gcaggcagag 8880
ctggaggcct ttcaggccca gccagcactc tggcctcctg ccgccgcatt ccaccccagc 8940
ccctcacacc actcgggaga gggacatcct acggtcccaa ggtcaggagg gcagggctgg 9000
ggttgactca ggcccctccc agctgtggcc acctgggtgt tgggagggca gaagtgcagg 9060
cacctagggc cccccatgtg cccaccctgg gagctctcct tggaacccat tcctgaaatt 9120
atttaaaggg gttggccggg ctcccaccag ggcctgggtg ggaaggtaca ggcgttcccc 9180
cggggcctag tacccccgcc gtggcctatc cactcctcac atccacacac tgcaccccca 9240
ctcctggggc agggccacca gcatccaggc ggccagcagg cacctgagtg gctgggacaa 9300
gggatccccc ttccctgtgg ttctattata ttataattat aattaaatat gagagcatgc 9360
taagga 9366
<210> 278
<211> 232
<212> DNA
<213> 智人
<400> 278
caaggggcgg gcaccctccc ttcaacctga cctgggacag tttcccttcc gctcacctcc 60
gcctgagcag tggagaaggc ggcactctgg tggggctgct ccaggcatgc agatcccaca 120
ggcgccctgg ccagtcgtct gggcggtgct acaactgggc tggcggccag gatggttctt 180
aggtaggtgg ggtcggcggt caggtgtccc agagccaggg gtctggaggg ac 232
<210> 279
<211> 460
<212> DNA
<213> 智人
<400> 279
aggctttgtg gggccaccca gccccttcct cacctctctc catctctcag actccccaga 60
caggccctgg aaccccccca ccttctcccc agccctgctc gtggtgaccg aaggggacaa 120
cgccaccttc acctgcagct tctccaacac atcggagagc ttcgtgctaa actggtaccg 180
catgagcccc agcaaccaga cggacaagct ggccgccttc cccgaggacc gcagccagcc 240
cggccaggac tgccgcttcc gtgtcacaca actgcccaac gggcgtgact tccacatgag 300
cgtggtcagg gcccggcgca atgacagcgg cacctacctc tgtggggcca tctccctggc 360
ccccaaggcg cagatcaaag agagcctgcg ggcagagctc agggtgacag gtgcggcctc 420
ggaggccccg gggcaggggt gagctgagcc ggtcctgggg 460
<210> 280
<211> 256
<212> DNA
<213> 智人
<400> 280
gaccctccac cctgaccccg tcctaacccc tgacctttgt gcccttccag agagaagggc 60
agaagtgccc acagcccacc ccagcccctc acccaggcca gccggccagt tccaaaccct 120
ggtggttggt gtcgtgggcg gcctgctggg cagcctggtg ctgctagtct gggtcctggc 180
cgtcatctgc tcccgggccg cacgaggtaa cgtcatccca gcccctcggc ctgccctgcc 240
ctaaccctgc tggcgg 256
<210> 281
<211> 135
<212> DNA
<213> 智人
<400> 281
ggagcacggc tcagggtcgg cctggtgacc ccaagtgtgt ttctctgcag ggacaatagg 60
agccaggcgc accggccagc ccctggtgag tctcactctt ttcctgcatg atccactgtg 120
ccttccttcc tgggt 135
<210> 282
<211> 1467
<212> DNA
<213> 智人
<400> 282
cttcctgcgg tgggccgtgg ggctgactcc ctctcccttt ctcctcaaag aaggaggacc 60
cctcagccgt gcctgtgttc tctgtggact atggggagct ggatttccag tggcgagaga 120
agaccccgga gccccccgtg ccctgtgtcc ctgagcagac ggagtatgcc accattgtct 180
ttcctagcgg aatgggcacc tcatcccccg cccgcagggg ctcagctgac ggccctcgga 240
gtgcccagcc actgaggcct gaggatggac actgctcttg gcccctctga ccggcttcct 300
tggccaccag tgttctgcag accctccacc atgagcccgg gtcagcgcat ttcctcagga 360
gaagcaggca gggtgcaggc cattgcaggc cgtccagggg ctgagctgcc tgggggcgac 420
cggggctcca gcctgcacct gcaccaggca cagccccacc acaggactca tgtctcaatg 480
cccacagtga gcccaggcag caggtgtcac cgtcccctac agggagggcc agatgcagtc 540
actgcttcag gtcctgccag cacagagctg cctgcgtcca gctccctgaa tctctgctgc 600
tgctgctgct gctgctgctg ctgcctgcgg cccggggctg aaggcgccgt ggccctgcct 660
gacgccccgg agcctcctgc ctgaacttgg gggctggttg gagatggcct tggagcagcc 720
aaggtgcccc tggcagtggc atcccgaaac gccctggacg cagggcccaa gactgggcac 780
aggagtggga ggtacatggg gctggggact ccccaggagt tatctgctcc ctgcaggcct 840
agagaagttt cagggaaggt cagaagagct cctggctgtg gtgggcaggg caggaaaccc 900
ctccaccttt acacatgccc aggcagcacc tcaggccctt tgtggggcag ggaagctgag 960
gcagtaagcg ggcaggcaga gctggaggcc tttcaggccc agccagcact ctggcctcct 1020
gccgccgcat tccaccccag cccctcacac cactcgggag agggacatcc tacggtccca 1080
aggtcaggag ggcagggctg gggttgactc aggcccctcc cagctgtggc cacctgggtg 1140
ttgggagggc agaagtgcag gcacctaggg ccccccatgt gcccaccctg ggagctctcc 1200
ttggaaccca ttcctgaaat tatttaaagg ggttggccgg gctcccacca gggcctgggt 1260
gggaaggtac aggcgttccc ccggggccta gtacccccgc cgtggcctat ccactcctca 1320
catccacaca ctgcaccccc actcctgggg cagggccacc agcatccagg cggccagcag 1380
gcacctgagt ggctgggaca agggatcccc cttccctgtg gttctattat attataatta 1440
taattaaata tgagagcatg ctaagga 1467
<210> 283
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 283
agaaauccgu cuuucauuga cgguuaggua gguggggucg gcg 43
<210> 284
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 284
agaaauccgu cuuucauuga cggcccgagg accgcagcca gcc 43
<210> 285
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 285
agaaauccgu cuuucauuga cggcguguca cacaacugcc caa 43
<210> 286
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 286
agaaauccgu cuuucauuga cggcacauga gcguggucag ggc 43
<210> 287
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 287
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 288
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 288
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 289
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 289
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 290
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 290
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg
610 615 620
Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 291
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 291
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg
610 615 620
Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 292
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<220>
<221> 尚未归类的特征
<222> (1)..(4)
<223> 位置1、2、3和4处的核苷酸之间的键是
硫代磷酸酯键
<220>
<221> 经修饰的碱基
<222> (1)..(1)
<223> um
<220>
<221> 经修饰的碱基
<222> (2)..(3)
<223> cm
<220>
<221> 尚未归类的特征
<222> (97)..(100)
<223> 位置97、98、99和100处的核苷酸之间的键
是硫代磷酸酯键
<220>
<221> 经修饰的碱基
<222> (97)..(99)
<223> um
<400> 292
uccaggcaug cagaucccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 293
<211> 3222
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 293
atggcttcca tctctaggcc atacggcacc aagctgcgac cggacgcacg gaagaaggag 60
atgctcgata agttctttaa tacactgact aagggtcagc gcgtgttcgc agacctggcc 120
ctgtgcatct atggctccct gaccctggag atggccaagt ctctggagcc agaaagtgat 180
tcagaactgg tgtgcgctat tgggtggttt cggctggtgg acaagaccat ctggtccaag 240
gatggcatca agcaggagaa tctggtgaaa cagtacgaag cctattccgg aaaggaggct 300
tctgaagtgg tcaaaacata cctgaacagc cccagctccg acaagtacgt gtggatcgat 360
tgcaggcaga aattcctgag gtttcagcgc gagctcggca ctcgcaacct gtccgaggac 420
ttcgaatgta tgctctttga acagtacatt agactgacca agggcgagat cgaagggtat 480
gccgctattt caaatatgtt cggaaacggc gagaaggaag accggagcaa gaaaagaatg 540
tacgctacac ggatgaaaga ttggctggag gcaaacgaaa atatcacttg ggagcagtat 600
agagaggccc tgaagaacca gctgaatgct aaaaacctgg agcaggttgt ggccaattac 660
aaggggaacg ctggcggggc agaccccttc tttaagtata gcttctccaa agagggaatg 720
gtgagcaaga aagaacatgc acagcagctc gacaagttca aaaccgtcct gaagaacaaa 780
gcccgggacc tgaattttcc aaacaaggag aagctgaagc agtacctgga ggccgaaatc 840
ggcattccgg tcgacgctaa cgtgtactcc cagatgttct ctaacggggt gagtgaggtc 900
cagcctaaga ccacacggaa tatgtctttt agtaacgaga aactggatct gctcactgaa 960
ctgaaggacc tgaacaaggg cgatgggttc gagtacgcca gagaagtgct gaacgggttc 1020
tttgactccg agctccacac taccgaggat aagtttaata tcacctctag gtacctggga 1080
ggcgacaaat caaaccgcct gagcaaactc tataagatct ggaagaaaga gggtgtggac 1140
tgcgaggaag gcattcagca gttctgtgaa gccgtcaaag ataagatggg ccagatcccc 1200
attcgaaatg tgctgaagta cctgtggcag ttccgggaga cagtcagtgc cgaggatttt 1260
gaagcagccg ctaaggctaa ccatctggag gaaaagatca gccgggtgaa agcccaccca 1320
atcgtgatta gcaataggta ctgggctttt gggacttccg cactggtggg aaacattatg 1380
cccgcagaca agaggcatca gggagagtat gccggtcaga atttcaaaat gtggctggag 1440
gctgaactgc actacgatgg caagaaagca aagcaccatc tgccttttta taacgcccgc 1500
ttctttgagg aagtgtactg ctatcacccc tctgtcgccg agatcactcc tttcaaaacc 1560
aagcagtttg gctgtgaaat cgggaaggac attccagatt acgtgagcgt cgctctgaag 1620
gacaatccgt ataagaaagc aaccaaacga atcctgcgtg caatctacaa tcccgtcgcc 1680
aacacaactg gcgttgataa gaccacaaac tgcagcttca tgatcaaacg cgagaatgac 1740
gaatataagc tggtcatcaa ccgaaaaatt tccgtggatc ggcctaagag aatcgaagtg 1800
ggcaggacaa ttatggggta cgaccgcaat cagacagcta gcgatactta ttggattggc 1860
cggctggtgc cacctggaac ccggggcgca taccgcatcg gagagtggag cgtccagtat 1920
attaagtccg ggcctgtcct gtctagtact cagggagtta acaattccac taccgaccag 1980
ctggtgtaca acggcatgcc atcaagctcc gagcggttca aggcctggaa gaaagccaga 2040
atggctttta tccgaaaact cattcgtcag ctgaatgacg agggactgga atctaagggt 2100
caggattata tccccgagaa cccttctagt ttcgatgtgc ggggcgaaac cctgtacgtc 2160
tttaacagta attatctgaa ggccctggtg agcaaacaca gaaaggccaa gaaacctgtt 2220
gaggggatcc tggacgagat tgaagcctgg acatctaaag acaaggattc atgcagcctg 2280
atgcggctga gcagcctgag cgatgcttcc atgcagggaa tcgccagcct gaagagtctg 2340
attaacagct acttcaacaa gaatggctgt aaaaccatcg aggacaaaga aaagtttaat 2400
cccgtgctgt atgccaagct ggttgaggtg gaacagcgga gaacaaacaa gcggtctgag 2460
aaagtgggaa gaatcgcagg tagtctggag cagctggccc tgctgaacgg ggttgaggtg 2520
gtcatcggcg aagctgacct gggggaggtc gaaaaaggaa agagtaagaa acagaattca 2580
cggaacatgg attggtgcgc aaagcaggtg gcacagcggc tggagtacaa actggccttc 2640
catggaatcg gttactttgg agtgaacccc atgtatacca gccaccagga ccctttcgaa 2700
cataggcgcg tggctgatca catcgtcatg cgagcacgtt ttgaggaagt caacgtggag 2760
aacattgccg aatggcacgt gcgaaatttc tcaaactacc tgcgtgcaga cagcggcact 2820
gggctgtact ataagcaggc caccatggac ttcctgaaac attacggtct ggaggaacac 2880
gctgagggcc tggaaaataa gaaaatcaag ttctatgact ttagaaagat cctggaggat 2940
aaaaacctga caagcgtgat cattccaaag aggggcgggc gcatctacat ggccaccaac 3000
ccagtgacat ccgactctac cccgattaca tacgccggca agacttataa taggtgtaac 3060
gctgatgagg tggcagccgc taatatcgtt atttctgtgc tggctccccg cagtaagaaa 3120
aacgaggaac aggacgatat ccctctgatt accaagaaag ccgagagtaa gtcaccaccg 3180
aaagaccgga agagatcaaa aacaagccag ctgcctcaga aa 3222
<210> 294
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 294
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Glu Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 295
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 295
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 296
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 296
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 297
<211> 1093
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 297
Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr
1 5 10 15
Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn
20 25 30
Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp
35 40 45
Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala
50 55 60
Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe
65 70 75 80
Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn
85 90 95
Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln
100 105 110
Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp
115 120 125
Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu
130 135 140
Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys
145 150 155 160
Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met
165 170 175
Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr
180 185 190
Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val
195 200 205
Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr
210 215 220
Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile
225 230 235 240
Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu
245 250 255
Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg
260 265 270
Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe
275 280 285
Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met
290 295 300
Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys
305 310 315 320
Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu
325 330 335
Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr
340 345 350
Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile
355 360 365
Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His
370 375 380
Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu
385 390 395 400
Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr
405 410 415
Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu
420 425 430
Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile
435 440 445
Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln
450 455 460
Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn
465 470 475 480
Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys
485 490 495
His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile
500 505 510
Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His
515 520 525
Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala
530 535 540
Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys
545 550 555 560
Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu
565 570 575
Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln
580 585 590
Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr
595 600 605
Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe
610 615 620
Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr
625 630 635 640
Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr
645 650 655
Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn
660 665 670
Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser
675 680 685
Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys
690 695 700
Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu
705 710 715 720
Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln
725 730 735
Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser
740 745 750
Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile
755 760 765
Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu
770 775 780
Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser
785 790 795 800
Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr
805 810 815
Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val
820 825 830
Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu
835 840 845
Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val
850 855 860
Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu
865 870 875 880
Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile
885 890 895
Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu
900 905 910
Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val
915 920 925
Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr
930 935 940
Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg
945 950 955 960
Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg
965 970 975
Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr
980 985 990
Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly
995 1000 1005
Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys
1010 1015 1020
Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu
1025 1030 1035
Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys
1040 1045 1050
Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe
1055 1060 1065
Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu
1070 1075 1080
Val Asp Ile Gln Lys Asp Phe Lys Lys Lys
1085 1090
<210> 298
<211> 1098
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 298
Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu
1 5 10 15
Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu
20 25 30
Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly
35 40 45
Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro
50 55 60
His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val
65 70 75 80
Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser
85 90 95
Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser
100 105 110
His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg
115 120 125
Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln
130 135 140
Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu
145 150 155 160
Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu
165 170 175
Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu
180 185 190
Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe
195 200 205
Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala
210 215 220
Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly
225 230 235 240
Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp
245 250 255
Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln
260 265 270
Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp
275 280 285
Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr
290 295 300
Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser
305 310 315 320
Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln
325 330 335
Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys
340 345 350
Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn
355 360 365
Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu
370 375 380
Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn
385 390 395 400
Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly
405 410 415
Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr
420 425 430
Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn
435 440 445
Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His
450 455 460
Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys
465 470 475 480
Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile
485 490 495
Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro
500 505 510
Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met
515 520 525
His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala
530 535 540
Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys
545 550 555 560
Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln
565 570 575
Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu
580 585 590
Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr
595 600 605
Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu
610 615 620
Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile
625 630 635 640
Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu
645 650 655
Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln
660 665 670
Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val
675 680 685
Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser
690 695 700
Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His
705 710 715 720
Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe
725 730 735
Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln
740 745 750
Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg
755 760 765
Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln
770 775 780
Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met
785 790 795 800
Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe
805 810 815
Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu
820 825 830
Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu
835 840 845
Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala
850 855 860
Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile
865 870 875 880
Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys
885 890 895
Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys
900 905 910
Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro
915 920 925
Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser
930 935 940
Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp
945 950 955 960
Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys
965 970 975
Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met
980 985 990
Cys Glu Glu Leu Gly Ile His Lys Thr Asp Met Ala Lys Gly Lys Val
995 1000 1005
Ser Leu Ser Asp Phe Val Asp Lys Phe Ile Gly Glu Lys Ala Ile
1010 1015 1020
Phe Pro Gln Arg Gly Gly Arg Phe Tyr Met Ser Thr Lys Arg Leu
1025 1030 1035
Thr Thr Gly Ala Lys Leu Ile Cys Tyr Ser Gly Ser Asp Val Trp
1040 1045 1050
Leu Ser Asp Ala Asp Glu Ile Ala Ala Ile Asn Ile Gly Met Phe
1055 1060 1065
Val Val Cys Asp Gln Thr Gly Ala Phe Lys Lys Lys Lys Lys Glu
1070 1075 1080
Lys Leu Asp Asp Glu Glu Cys Asp Ile Leu Pro Phe Arg Pro Met
1085 1090 1095
<210> 299
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 299
ucucaacgau agucagacau guguccucag ugacac 36
<210> 300
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 300
uuuuaacaac acucaggcau guguccacag ugacac 36
<210> 301
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 301
uugaacggau acucagacau guguuuccag ugacac 36
<210> 302
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 302
ugcccucaau agucagaugu guguccacag ugacac 36
<210> 303
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 303
ucucaaugau acuuagauac guguccucag ugacac 36
<210> 304
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 304
ucucaaugau acucagacau guguccccag ugacac 36
<210> 305
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 305
ucucaaugau acuaagacau guguccucag ugacac 36
<210> 306
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 306
ucucaacuau acucagacau guguccucag ugacac 36
<210> 307
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 307
ucucaacgau acucagacau guguccucag ugacac 36
<210> 308
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 308
ucucaacgau acuaagauau guguccucag cgacac 36
<210> 309
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 309
ucucaacgau acuaagauau guguccccag ugacac 36
<210> 310
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 310
ucucaacgau acuaagauau guguccacag ugacac 36
<210> 311
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 311
ucucaacaau acucagacau guguccccag ugacac 36
<210> 312
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 312
ucucaacaau acuaaggcau guguccccag ugaccc 36
<210> 313
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 313
ucucaaagau acucagacac guguccccag ugacac 36
<210> 314
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 314
ucucaaaaau acucagacau guguccucag ugacac 36
<210> 315
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 315
gcgaaacaac agucagacau guguccccag ugacac 36
<210> 316
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 316
ccucaacgau auuaagacau guguccgcag ugacac 36
<210> 317
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 317
agacaugugu ccucagugac ac 22
<210> 318
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 318
guuggaauga cuaauuuuug ugcccaccgu uggcac 36
<210> 319
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 319
aauuuuugug cccaucguug gcac 24
<210> 320
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 320
auuuuugugc ccaucguugg cac 23
<210> 321
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 321
cuagcaauga ccuaauagug uguccuuagu ugacau 36
<210> 322
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 322
ccuacaauac cuaagaaauc cguccuaagu ugacgg 36
<210> 323
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 323
auaguguguc cuuaguugac au 22
<210> 324
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 324
agaaauccgu cuuucauuga cggcagggcc ugucugggga guc 43
<210> 325
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 325
agaaauccgu cuuucauuga cgguccccag cccugcucgu ggu 43
<210> 326
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 326
agaaauccgu cuuucauuga cggggucacc acgagcaggg cug 43
<210> 327
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 327
agaaauccgu cuuucauuga cggaccugca gcuucuccaa cac 43
<210> 328
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 328
agaaauccgu cuuucauuga cgguccaaca caucggagag cuu 43
<210> 329
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 329
agaaauccgu cuuucauuga cgggugcuaa acugguaccg cau 43
<210> 330
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 330
agaaauccgu cuuucauuga cgggaucugc gccuuggggg cca 43
<210> 331
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 331
ttaggtaggt ggggtcggcg 20
<210> 332
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 332
cagggcctgt ctggggagtc 20
<210> 333
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 333
tccccagccc tgctcgtggt 20
<210> 334
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 334
ggtcaccacg agcagggctg 20
<210> 335
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 335
acctgcagct tctccaacac 20
<210> 336
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 336
tccaacacat cggagagctt 20
<210> 337
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 337
gtgctaaact ggtaccgcat 20
<210> 338
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 338
cccgaggacc gcagccagcc 20
<210> 339
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 339
cgtgtcacac aactgcccaa 20
<210> 340
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 340
cacatgagcg tggtcagggc 20
<210> 341
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 341
gatctgcgcc ttgggggcca 20

Claims (86)

1.一种包含RNA指导物的组合物,其中该RNA指导物包含(i)与PDCD1基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列;其中该靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻。
2.如权利要求1所述的组合物,其中该靶序列在该PDCD1基因的外显子1、外显子2、外显子3或外显子4内。
3.如权利要求1或2所述的组合物,其中该PDCD1基因包含SEQ ID NO:277的序列、SEQID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。
4.如权利要求1至3中任一项所述的组合物,其中该间隔子序列包含:
a.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;
b.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;
c.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;
d.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;
e.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;
f.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;
g.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;
h.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;
i.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;
j.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;
k.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;
l.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;
m.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;
n.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或
o.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
5.如权利要求1至4中任一项所述的组合物,其中该间隔子序列包含:
a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16;
b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17;
c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18;
d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19;
e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20;
f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21;
g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22;
h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23;
i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24;
j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25;
k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26;
l.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27;
m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28;
n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29;或
o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。
6.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;
p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;
q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;
r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;
s.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;
t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;
u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;
v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;
w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;
x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;
y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;
z.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或
aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
7.如权利要求1至6中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;
o.SEQ ID NO:9的核苷酸1至核苷酸34;
p.SEQ ID NO:9的核苷酸2至核苷酸34;
q.SEQ ID NO:9的核苷酸3至核苷酸34;
r.SEQ ID NO:9的核苷酸4至核苷酸34;
s.SEQ ID NO:9的核苷酸5至核苷酸34;
t.SEQ ID NO:9的核苷酸6至核苷酸34;
u.SEQ ID NO:9的核苷酸7至核苷酸34;
v.SEQ ID NO:9的核苷酸8至核苷酸34;
w.SEQ ID NO:9的核苷酸9至核苷酸34;
x.SEQ ID NO:9的核苷酸10至核苷酸34;
y.SEQ ID NO:9的核苷酸11至核苷酸34;
z.SEQ ID NO:9的核苷酸12至核苷酸34;或
aa.SEQ ID NO:10或其一部分。
8.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:317的序列或其一部分具有至少90%同一性的序列。
9.如权利要求1至5或8中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:299-316中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36;或
o.SEQ ID NO:317或其一部分。
10.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:319或SEQ ID NO:320的序列或其一部分具有至少90%同一性的序列。
11.如权利要求1至5或10中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:318的核苷酸1至核苷酸36;
b.SEQ ID NO:318的核苷酸2至核苷酸36;
c.SEQ ID NO:318的核苷酸3至核苷酸36;
d.SEQ ID NO:318的核苷酸4至核苷酸36;
e.SEQ ID NO:318的核苷酸5至核苷酸36;
f.SEQ ID NO:318的核苷酸6至核苷酸36;
g.SEQ ID NO:318的核苷酸7至核苷酸36;
h.SEQ ID NO:318的核苷酸8至核苷酸36;
i.SEQ ID NO:318的核苷酸9至核苷酸36;
j.SEQ ID NO:318的核苷酸10至核苷酸36;
k.SEQ ID NO:318的核苷酸11至核苷酸36;
l.SEQ ID NO:318的核苷酸12至核苷酸36;
m.SEQ ID NO:318的核苷酸13至核苷酸36;
n.SEQ ID NO:318的核苷酸14至核苷酸36;或
o.SEQ ID NO:319或SEQ ID NO:320或其一部分。
12.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或
p.与SEQ ID NO:323的序列或其一部分具有至少90%同一性的序列。
13.如权利要求1至5或12中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36;
b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36;
c.SEQ ID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36;
d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36;
e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36;
f.SEQ ID NO:321或SEQ ID NO:322的核苷酸6至核苷酸36;
g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36;
h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36;
i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36;
j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36;
k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36;
l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36;
m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36;
n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36;
o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36;或
p.SEQ ID NO:323或其一部分。
14.如权利要求1至13中任一项所述的组合物,其中该间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。
15.如权利要求1所述的组合物,其中该PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’或5’-CTTC-3’。
16.如权利要求1或15所述的组合物,其中该靶序列紧邻该PAM序列。
17.如权利要求1至16中任一项所述的组合物,其中该组合物进一步包含Cas12i多肽。
18.如权利要求17所述的组合物,其中该Cas12i多肽是:
a.Cas12i2多肽,其包含与SEQ ID NO:276、SEQ ID NO:287、SEQ ID NO:288、SEQ IDNO:289、SEQ ID NO:290、或SEQ ID NO:291的序列具有至少90%同一性的序列;
b.Cas12i4多肽,其包含与SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列具有至少90%同一性的序列;
c.Cas12i1多肽,其包含与SEQ ID NO:297的序列具有至少90%同一性的序列;或
d.Cas12i3多肽,其包含与SEQ ID NO:298的序列具有至少90%同一性的序列。
19.如权利要求18所述的组合物,其中该Cas12i多肽是:
a.Cas12i2多肽,其包含SEQ ID NO:276、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、或SEQ ID NO:291的序列;
b.Cas12i4多肽,其包含SEQ ID NO:294、SEQ ID NO:295、或SEQ ID NO:296的序列;
c.Cas12i1多肽,其包含SEQ ID NO:297的序列;或
d.Cas12i3多肽,其包含SEQ ID NO:298的序列。
20.如权利要求17至19中任一项所述的组合物,其中该RNA指导物和该Cas12i多肽形成核糖核蛋白复合物。
21.如权利要求20所述的组合物,其中该核糖核蛋白复合物与靶核酸结合。
22.如权利要求20或21所述的组合物,其中该组合物存在于细胞内。
23.如权利要求17至22中任一项所述的组合物,其中该RNA指导物和该Cas12i多肽被编码在载体中,例如表达载体中。
24.如权利要求23所述的组合物,其中该RNA指导物和该Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
25.一种RNA指导物,其包含(i)与PDCD1基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列。
26.如权利要求25所述的RNA指导物,其中该靶序列在该PDCD1基因的外显子1、外显子2、外显子3或外显子4内。
27.如权利要求25或26所述的RNA指导物,其中该PDCD1基因包含SEQ ID NO:277的序列、SEQ ID NO:277的反向互补序列、SEQ ID NO:277的变体、或SEQ ID NO:277的变体的反向互补序列。
28.如权利要求25至27中任一项所述的RNA指导物,其中该间隔子序列包含:
a.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;
b.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;
c.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;
d.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;
e.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;
f.与SEQ ID NO:143-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;
g.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;
h.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;
i.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;
j.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;
k.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;
l.与SEQ ID NO:143-255和257-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;
m.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;
n.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或
o.与SEQ ID NO:143-255和258-274中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
29.如权利要求25至28中任一项所述的RNA指导物,其中该间隔子序列包含:
a.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸16;
b.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸17;
c.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸18;
d.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸19;
e.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸20;
f.SEQ ID NO:143-274中任一个的核苷酸1至核苷酸21;
g.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸22;
h.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸23;
i.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸24;
j.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸25;
k.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸26;
l.SEQ ID NO:143-255和257-274中任一个的核苷酸1至核苷酸27;
m.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸28;
n.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸29;或
o.SEQ ID NO:143-255和258-274中任一个的核苷酸1至核苷酸30。
30.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;
p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;
q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;
r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;
s.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;
t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;
u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;
v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;
w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;
x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;
y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;
z.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或
aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
31.如权利要求25至30中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;
o.SEQ ID NO:9的核苷酸1至核苷酸34;
p.SEQ ID NO:9的核苷酸2至核苷酸34;
q.SEQ ID NO:9的核苷酸3至核苷酸34;
r.SEQ ID NO:9的核苷酸4至核苷酸34;
s.SEQ ID NO:9的核苷酸5至核苷酸34;
t.SEQ ID NO:9的核苷酸6至核苷酸34;
u.SEQ ID NO:9的核苷酸7至核苷酸34;
v.SEQ ID NO:9的核苷酸8至核苷酸34;
w.SEQ ID NO:9的核苷酸9至核苷酸34;
x.SEQ ID NO:9的核苷酸10至核苷酸34;
y.SEQ ID NO:9的核苷酸11至核苷酸34;
z.SEQ ID NO:9的核苷酸12至核苷酸34;或
aa.SEQ ID NO:10或其一部分。
32.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:299-316中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:317的序列或其一部分具有至少90%同一性的序列。
33.如权利要求25至29或32中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:299-316中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:299-316中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:299-316中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:299-316中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:299-316中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:299-316中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:299-316中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:299-316中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:299-316中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:299-316中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:299-316中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:299-316中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:299-316中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:299-316中任一个的核苷酸14至核苷酸36;或
o.SEQ ID NO:317或其一部分。
34.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:318具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:319或SEQ ID NO:320的序列或其一部分具有至少90%同一性的序列。
35.如权利要求25至29或34中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:318的核苷酸1至核苷酸36;
b.SEQ ID NO:318的核苷酸2至核苷酸36;
c.SEQ ID NO:318的核苷酸3至核苷酸36;
d.SEQ ID NO:318的核苷酸4至核苷酸36;
e.SEQ ID NO:318的核苷酸5至核苷酸36;
f.SEQ ID NO:318的核苷酸6至核苷酸36;
g.SEQ ID NO:318的核苷酸7至核苷酸36;
h.SEQ ID NO:318的核苷酸8至核苷酸36;
i.SEQ ID NO:318的核苷酸9至核苷酸36;
j.SEQ ID NO:318的核苷酸10至核苷酸36;
k.SEQ ID NO:318的核苷酸11至核苷酸36;
l.SEQ ID NO:318的核苷酸12至核苷酸36;
m.SEQ ID NO:318的核苷酸13至核苷酸36;
n.SEQ ID NO:318的核苷酸14至核苷酸36;或
o.SEQ ID NO:319或SEQ ID NO:320或其一部分。
36.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:321或SEQ ID NO:322的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或
p.与SEQ ID NO:323的序列或其一部分具有至少90%同一性的序列。
37.如权利要求25至29或36中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:321或SEQ ID NO:322的核苷酸1至核苷酸36;
b.SEQ ID NO:321或SEQ ID NO:322的核苷酸2至核苷酸36;
c.SEQ ID NO:321或SEQ ID NO:322的核苷酸3至核苷酸36;
d.SEQ ID NO:321或SEQ ID NO:322的核苷酸4至核苷酸36;
e.SEQ ID NO:321或SEQ ID NO:322的核苷酸5至核苷酸36;
f.SEQ ID NO:321或SEQ ID NO:322的核苷酸6至核苷酸36;
g.SEQ ID NO:321或SEQ ID NO:322的核苷酸7至核苷酸36;
h.SEQ ID NO:321或SEQ ID NO:322的核苷酸8至核苷酸36;
i.SEQ ID NO:321或SEQ ID NO:322的核苷酸9至核苷酸36;
j.SEQ ID NO:321或SEQ ID NO:322的核苷酸10至核苷酸36;
k.SEQ ID NO:321或SEQ ID NO:322的核苷酸11至核苷酸36;
l.SEQ ID NO:321或SEQ ID NO:322的核苷酸12至核苷酸36;
m.SEQ ID NO:321或SEQ ID NO:322的核苷酸13至核苷酸36;
n.SEQ ID NO:321或SEQ ID NO:322的核苷酸14至核苷酸36;
o.SEQ ID NO:321或SEQ ID NO:322的核苷酸15至核苷酸36;或
p.SEQ ID NO:323或其一部分。
38.如权利要求25至37中任一项所述的RNA指导物,其中该间隔子序列与SEQ ID NO:11-142中任一个的序列的互补序列基本上互补。
39.如权利要求25至38中任一项所述的RNA指导物,其中该靶序列与包含该序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻,其中N是任何核苷酸。
40.如权利要求39所述的RNA指导物,其中该PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’或5’-CTTC-3’。
41.如权利要求39或40所述的RNA指导物,其中该靶序列紧邻该PAM序列。
42.一种核酸,其编码如权利要求25至41中任一项所述的RNA指导物。
43.一种载体,其包含如权利要求42所述的核酸。
44.一种载体系统,其包含一个或多个编码(i)如权利要求1至41中任一项所定义的RNA指导物和(ii)Cas12i多肽的载体,任选地其中该载体系统包含编码该RNA指导物的第一载体以及编码该Cas12i多肽的第二载体。
45.一种细胞,其包含如权利要求1至24中任一项所述的组合物、如权利要求25至41中任一项所述的RNA指导物、如权利要求42所述的核酸、如权利要求43所述的载体或如权利要求44所述的载体系统。
46.如权利要求45所述的细胞,其中该细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞、或T细胞。
47.一种试剂盒,其包含如权利要求1至24中任一项所述的组合物、如权利要求25至41中任一项所述的RNA指导物、如权利要求42所述的核酸、如权利要求43所述的载体或如权利要求44所述的载体系统。
48.一种编辑PDCD1序列的方法,该方法包括使PDCD1序列与如权利要求1至24中任一项所述的组合物或如权利要求25至41中任一项所述的RNA指导物接触。
49.如权利要求48所述的方法,其中该PDCD1序列在细胞中。
50.如权利要求48或49所述的方法,其中该组合物或该RNA指导物诱导该PDCD1序列中的缺失。
51.如权利要求50所述的方法,其中该缺失与5'-NTTN-3'序列相邻,其中N是任何核苷酸。
52.如权利要求50或51所述的方法,其中该缺失在该5'-NTTN-3'序列的下游。
53.如权利要求50至52中任一项所述的方法,其中该缺失的长度多达约50个核苷酸。
54.如权利要求50至53中任一项所述的方法,其中该缺失的长度多达约40个核苷酸。
55.如权利要求50至54中任一项所述的方法,其中该缺失的长度为约4个核苷酸至40个核苷酸。
56.如权利要求50至55中任一项所述的方法,其中该缺失的长度为约4个核苷酸至25个核苷酸。
57.如权利要求50至56中任一项所述的方法,其中该缺失的长度为约10个核苷酸至25个核苷酸。
58.如权利要求50至57中任一项所述的方法,其中该缺失的长度为约10个核苷酸至15个核苷酸。
59.如权利要求50至58中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约5个核苷酸至约15个核苷酸内开始。
60.如权利要求50至59中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约5个核苷酸至约10个核苷酸内开始。
61.如权利要求50至60中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约10个核苷酸至约15个核苷酸内开始。
62.如权利要求50至61中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始。
63.如权利要求50至62中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始。
64.如权利要求50至63中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始。
65.如权利要求50至64中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约20个核苷酸至约30个核苷酸内结束。
66.如权利要求50至65中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约20个核苷酸至约25个核苷酸内结束。
67.如权利要求50至66中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约25个核苷酸至约30个核苷酸内结束。
68.如权利要求50至67中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
69.如权利要求50至68中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
70.如权利要求50至69中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
71.如权利要求50至70中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
72.如权利要求50至71中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
73.如权利要求50至72中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
74.如权利要求50至73中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
75.如权利要求50至74中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
76.如权利要求50至75中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
77.如权利要求50至76中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
78.如权利要求50至77中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
79.如权利要求50至78中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
80.如权利要求50至79中任一项所述的方法,其中该5'-NTTN-3'序列是5'-CTTT-3'、5'-CTTC-3'、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。
81.如权利要求50至80中任一项所述的方法,其中该缺失与该PDCD1序列中的突变重叠。
82.如权利要求50至81中任一项所述的方法,其中该缺失与该PDCD1序列中的插入重叠。
83.如权利要求50至82中任一项所述的方法,其中该缺失去除该PDCD1序列或其一部分的重复扩展。
84.如权利要求50至83中任一项所述的方法,其中该缺失破坏该PDCD1序列的一个或两个等位基因。
85.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法,其中该RNA指导物不由以下序列组成:
AGAAAUCCGUCUUUCAUUGACGGUUAGGUAGGUGGGG UCGGCG(SEQ ID NO:283);AGAAAUCCGUCUUUCAUUGAC GGCCCGAGGACCGCAGCCAGCC(SEQ ID NO:284);AGAAAUCCGUCUUUCAUUGACGGCGUGUCACACAACUGCCCAA(SEQ ID NO:285);或AGAAAUCCGUCUUUCAUUGACGGCACAUGAGCGUGGUCAGGGC(SEQ ID NO:286)。
86.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法,其中该RNA指导物包含SEQ ID NO:324-330中任一个的序列。
CN202180080045.2A 2020-10-30 2021-10-29 包含靶向pdcd1的rna指导物的组合物及其用途 Pending CN116670275A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/108,053 2020-10-30
US202163252835P 2021-10-06 2021-10-06
US63/252,835 2021-10-06
PCT/US2021/057432 WO2022094329A1 (en) 2020-10-30 2021-10-29 Compositions comprising an rna guide targeting pdcd1 and uses thereof

Publications (1)

Publication Number Publication Date
CN116670275A true CN116670275A (zh) 2023-08-29

Family

ID=87717569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180080045.2A Pending CN116670275A (zh) 2020-10-30 2021-10-29 包含靶向pdcd1的rna指导物的组合物及其用途

Country Status (1)

Country Link
CN (1) CN116670275A (zh)

Similar Documents

Publication Publication Date Title
US20230203539A1 (en) Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof
TW202317761A (zh) 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途
KR20230107265A (ko) Pdcd1을 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도
CN116670275A (zh) 包含靶向pdcd1的rna指导物的组合物及其用途
CN116867898A (zh) 包含靶向trac的rna指导物的组合物及其用途
KR20230117116A (ko) Trac를 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도
US20230399639A1 (en) Compositions comprising an rna guide targeting b2m and uses thereof
CN116648505A (zh) 包含靶向b2m的rna指导物的组合物及其用途
US20230416732A1 (en) Compositions comprising an rna guide targeting bcl11a and uses thereof
CN116601292A (zh) 包含靶向bcl11a的rna指导物的组合物及其用途
US11821012B2 (en) Gene editing systems comprising an RNA guide targeting hydroxyacid oxidase 1 (HAO1) and uses thereof
TW202334421A (zh) 包含靶向ciita之rna引導之組合物及其用途
CN117813382A (zh) 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途
WO2022140340A1 (en) Compositions comprising an rna guide targeting dmd and uses thereof
WO2023137451A1 (en) Compositions comprising an rna guide targeting cd38 and uses thereof
WO2022140343A1 (en) Compositions comprising an rna guide targeting dmpk and uses thereof
CN117897485A (zh) 包括靶向羟基酸氧化酶1(hao1)的rna向导的基因编辑系统和其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination