CN117295818A - 原核系统中环状多核糖核苷酸的产生 - Google Patents

原核系统中环状多核糖核苷酸的产生 Download PDF

Info

Publication number
CN117295818A
CN117295818A CN202280022556.3A CN202280022556A CN117295818A CN 117295818 A CN117295818 A CN 117295818A CN 202280022556 A CN202280022556 A CN 202280022556A CN 117295818 A CN117295818 A CN 117295818A
Authority
CN
China
Prior art keywords
rna
ligase
sequence
polyribonucleotide
complementary region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280022556.3A
Other languages
English (en)
Inventor
巴里·安德鲁·马丁
斯维塔·斯里尼瓦萨·穆拉利
牛雅杰
德里克·托马斯·罗森赫伯
米奇卡·加布里埃尔·夏普
安德鲁·麦金利·舒梅克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Flagship Entrepreneurship And Innovation Co 7
Original Assignee
Flagship Entrepreneurship And Innovation Co 7
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Flagship Entrepreneurship And Innovation Co 7 filed Critical Flagship Entrepreneurship And Innovation Co 7
Priority claimed from PCT/US2022/021865 external-priority patent/WO2022204466A1/en
Publication of CN117295818A publication Critical patent/CN117295818A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本披露总体上涉及用于产生、纯化、和使用来自原核系统的环状RNA的方法。

Description

原核系统中环状多核糖核苷酸的产生
优先权申请的引用
根据专利合作条约提交的本国际专利申请要求2021年5月17日提交的美国临时专利申请序列号63/189,610和2021年3月26日提交的美国临时专利申请序列号63/166,467的权益。
序列表
本申请包含序列表,该序列表已以ASCII格式电子提交,并通过引用以其全文特此并入。所述ASCII副本创建于2022年3月22日,名为VL70003WO00_ST25,并且大小为317,708字节。通过引用以其全文并入本文的还有在美国临时专利申请序列号63/189,610中提交的序列表,该序列表创建于2021年5月17日,名为51484-004001_Sequence_Listing_5.17.21_ST25,并且大小为295,542字节。通过引用以其全文并入本文的还有在美国临时专利申请序列号63/166,467中提交的序列表,该序列表创建于2021年3月25日,名为51484-003001_Sequence_Listing_3.25.21_ST25,并且大小为166,651字节。
背景技术
环状多核糖核苷酸是多核糖核苷酸的一个亚类,以连续环的形式存在。内源性环状多核糖核苷酸在人体组织和细胞中普遍表达。大多数内源性环状多核糖核苷酸是通过反向剪接(backsplicing)产生的,并且主要发挥非编码作用。已提出将合成的环状多核糖核苷酸(包括编码蛋白质的环状多核糖核苷酸)用于各种治疗性应用和工程应用。需要产生、纯化、和使用环状多核糖核苷酸的方法。
发明内容
本披露提供了用于产生、纯化、和使用环状RNA的组合物和方法。
在第一方面,本披露的特点在于用于使多核糖核苷酸环化的原核系统,该原核系统包含:(a)多核糖核苷酸(例如,线性多核糖核苷酸),该多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中:(A)包含5'自切割核酶;(B)包含5'退火区;(C)包含多核糖核苷酸负载物(cargo);(D)包含3'退火区;并且(E)包含3'自切割核酶;以及(b)包含RNA连接酶的原核细胞。该线性多核糖核苷酸可以包括例如在元件(A)、(B)、(C)、(D)和(E)中的任一者之外或之间的另外的元件。例如,如本文所述,元件(A)、(B)、(C)、(D)和/或(E)中的任一者可以由间隔子序列隔开。
在另一方面,本披露提供了一种用于使多核糖核苷酸环化的原核系统,该原核系统包含:(a)多核糖核苷酸(例如,线性多核糖核苷酸),该多核糖核苷酸包括以5'至3'方向可操作地连接的(A)、(B)、(C)、(D)和(E):(A)5'自切割核酶;(B)5'退火区;(C)多核糖核苷酸负载物;(D)3'退火区;和(E)3'自切割核酶;以及(b)包含RNA连接酶的原核细胞。该线性多核糖核苷酸可以包括例如在元件(A)、(B)、(C)、(D)和(E)中的任一者之外或之间的另外的元件。例如,如本文所述,元件(A)、(B)、(C)、(D)和/或(E)中的任一者可以由间隔子序列隔开。
在另一方面,本披露提供了一种产生环状RNA的方法,该方法包括在原核细胞中使(a)与(b)接触:(a)多核糖核苷酸(例如,线性多核糖核苷酸),该多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中:(A)包含5'自切割核酶;(B)包含5'退火区;(C)包含多核糖核苷酸负载物;(D)包含3'退火区;并且(E)包含3'自切割核酶;以及(b)RNA连接酶。在一些实施例中,该5'自切割核酶的切割和该3'自切割核酶的切割产生连接酶相容的线性多核糖核苷酸。在一些实施例中,该RNA连接酶连接该连接酶相容的线性多核糖核苷酸的5'端和3'端,从而产生环状RNA。在一些实施例中,将该环状RNA从原核细胞分离。在一些实施例中,该RNA连接酶对该原核细胞是内源的。在一些实施例中,该RNA连接酶对该原核细胞是异源的。
在另一方面,本披露提供了一种产生环状RNA的方法,该方法包括在原核细胞中使(a)与(b)接触:(a)多核糖核苷酸(例如,线性多核糖核苷酸),该多核糖核苷酸包括以5'至3'方向可操作地连接的(A)、(B)、(C)、(D)和(E):(A)5'自切割核酶;(B)5'退火区;(C)多核糖核苷酸负载物;(D)3'退火区;和(E)3'自切割核酶;以及(b)RNA连接酶。在一些实施例中,该5'自切割核酶的切割和该3'自切割核酶的切割产生连接酶相容的线性多核糖核苷酸。在一些实施例中,该RNA连接酶连接该连接酶相容的线性多核糖核苷酸的5'端和3'端,从而产生环状RNA。在一些实施例中,将该环状RNA从原核细胞分离。在一些实施例中,该RNA连接酶对该原核细胞是内源的。在一些实施例中,该RNA连接酶对该原核细胞是异源的。
在另一方面,本披露提供了一种原核细胞,该原核细胞包含:(a)多核糖核苷酸(例如,线性多核糖核苷酸),该多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中:(A)包含5'自切割核酶;(B)包含5'退火区;(C)包含多核糖核苷酸负载物;(D)包含3'退火区;并且(E)包含3'自切割核酶;以及(b)RNA连接酶。在一些实施例中,该5'自切割核酶的切割和该3'自切割核酶的切割产生连接酶相容的线性多核糖核苷酸。在一些实施例中,该RNA连接酶能够连接该连接酶相容的线性多核糖核苷酸的5'端和3'端以产生环状RNA。在一些实施例中,该RNA连接酶对该原核细胞是内源的。在一些实施例中,该RNA连接酶对该原核细胞是异源的。在一些实施例中,该原核细胞进一步包含该环状RNA。
在另一方面,本披露提供了一种原核细胞,该原核细胞包含:(a)多核糖核苷酸(例如,线性多核糖核苷酸),该多核糖核苷酸包括以5'至3'方向可操作地连接的(A)、(B)、(C)、(D)和(E):(A)5'自切割核酶;(B)5'退火区;(C)多核糖核苷酸负载物;(D)3'退火区;和(E)3'自切割核酶;以及(b)RNA连接酶。在一些实施例中,该5'自切割核酶的切割和该3'自切割核酶的切割产生连接酶相容的线性多核糖核苷酸。在一些实施例中,该RNA连接酶能够连接该连接酶相容的线性多核糖核苷酸的5'端和3'端以产生环状RNA。在一些实施例中,该RNA连接酶对该原核细胞是内源的。在一些实施例中,该RNA连接酶对该原核细胞是异源的。在一些实施例中,该原核细胞进一步包含该环状RNA。
在一些实施例中,该5'自切割核酶能够在位于该5'自切割核酶的3'端的10个核糖核苷酸内的位点处或在位于该5'自切割核酶的3'端的位点处进行自切割。
在一些实施例中,该5'自切割核酶是选自以下的核酶:锤头状(Hammerhead)核酶、发夹状(Hairpin)核酶、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)核酶、glmS核酶、扭转(Twister)核酶、扭转姐妹(Twister sister)核酶、斧头(Hatchet)核酶和手枪(Pistol)核酶。在一些实施例中,该5'自切割核酶是锤头状核酶。在一些实施例中,该5'自切割核酶包括与SEQ ID NO:16的核酸序列具有至少85%、90%、95%、96%、97%、98%、或99%序列同一性的区域。在一些实施例中,该5'自切割核酶包括SEQ ID NO:16的核酸序列。在一些实施例中,该5'自切割核酶包括与SEQ ID NO:24-571中的任一者具有至少85%、90%、95%、96%、97%、98%、或99%序列同一性的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。在一些实施例中,该5'自切割核酶包括SEQ ID NO:24-571中的任一者的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。
在一些实施例中,该3'自切割核酶能够在位于该3'自切割核酶的5'端的10个核糖核苷酸内的位点处或在位于该3'自切割核酶的5'端的位点处进行自切割。
在一些实施例中,该3'自切割核酶是选自以下的核酶:锤头状核酶、发夹状核酶、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)核酶、glmS核酶、扭转核酶、扭转姐妹核酶、斧头核酶和手枪核酶。在一些实施例中,该3'自切割核酶是丁型肝炎病毒(HDV)核酶。在一些实施例中,该3'自切割核酶包括与SEQ ID NO:21的核酸序列具有至少85%、90%、95%、96%、97%、98%、或99%序列同一性的区域。在一些实施例中,该3'自切割核酶包括SEQ ID NO:21的核酸序列。在一些实施例中,该3'自切割核酶包括与SEQ ID NO:24-571中的任一者具有至少85%、90%、95%、96%、97%、98%、或99%序列同一性的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。在一些实施例中,该3'自切割核酶包括与SEQ ID NO:24-571中的任一者具有至少95%、96%、97%、98%、或99%序列同一性的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。在一些实施例中,该3'自切割核酶包括SEQ ID NO:24-571中的任一者的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。
在一些实施例中,该5'自切割核酶和该3'自切割核酶产生连接酶相容的线性多核糖核苷酸。在一些实施例中,该5'自切割核酶的切割产生游离的5'-羟基基团,并且3'自切割核酶的切割产生游离的2',3'-环磷酸基团。
在一些实施例中,该5'和3'自切割核酶共享至少80%、85%、90%、95%、98%、或99%的序列同一性。在一些实施例中,该5'和3'自切割核酶来自相同的自切割核酶家族。在一些实施例中,该5'和3'自切割核酶共享100%的序列同一性。
在一些实施例中,该5'和3'自切割核酶共享低于100%、99%、95%、90%、85%、或80%的序列同一性。在一些实施例中,该5'和3'自切割核酶并非来自相同的自切割核酶家族。
在一些实施例中,该5'退火区具有2至100个核糖核苷酸(例如,2至80、2至50、2至30、2至20、10至100、10至80、10至50、或10至30个核糖核苷酸)。在一些实施例中,该3'退火区具有2至100个核糖核苷酸(例如,2至80、2至50、2至30、2至20、10至100、10至80、10至50、或10至30个核糖核苷酸)。
在一些实施例中,该5'退火区和该3'退火区各自包括互补区(例如,形成一对互补区)。在一些实施例中,该5'退火区包括具有在5与50个之间的核糖核苷酸(例如,5-40、5-30、5-20、5-10、10-50、10-40、10-30、10-20、或20-50个核糖核苷酸)的5'互补区;并且该3'退火区包括具有在5与50个之间的核糖核苷酸(例如,5-40、5-30、5-20、5-10、10-50、10-40、10-30、10-20、或20-50个核糖核苷酸)的3'互补区。在一些实施例中,该5'互补区和该3'互补区具有在50%与100%之间的序列互补性(例如,在60%-100%、70%-100%、80%-100%、90%-100%之间、或100%的序列互补性)。
在一些实施例中,该5'互补区和该3'互补区具有低于-5kcal/mol(例如,低于-10kcal/mol、低于-20kcal/mol、或低于-30kcal/mol)的结合自由能。在一些实施例中,该5'互补区和该3'互补区具有至少10℃、至少15℃、至少20℃、至少30℃、至少40℃、至少50℃、至少60℃、至少70℃、至少80℃、或至少90℃的结合Tm。在一些实施例中,该5'互补区和该3'互补区包括至少一个但不多于10个错配,例如10、9、8、7、6、5、4、3、或2个错配,或1个错配,即,该5'互补区和该3'互补区具有低于100%的序列互补性。在实例中,在约50个核糖核苷酸的5'互补区与约50个核糖核苷酸的3'互补区之间有10个错配的情况下,在5'与3'互补区之间将有约80%的序列互补性。在一些实施例中,该5'互补区和该3'互补区不包括任何错配,即,该5'互补区和该3'互补区具有100%序列互补性。
在一些实施例中,该5'退火区和该3'退火区各自包括非互补区。在一些实施例中,该5'退火区进一步包括具有在5与50个之间的核糖核苷酸(例如,5-40、5-30、5-20、5-10、10-50、10-40、10-30、10-20、或20-50个核糖核苷酸)的5'非互补区。在一些实施例中,该3'退火区进一步包括具有在5与50个之间的核糖核苷酸(例如,5-40、5-30、5-20、5-10、10-50、10-40、10-30、10-20、或20-50个核糖核苷酸)的3'非互补区。在一些实施例中,该5'非互补区位于该5'互补区的5'(例如,在该5'自切割核酶与该5'互补区之间)。在一些实施例中,该3'非互补区位于该3'互补区的3'(例如,在该3'互补区与该3'自切割核酶之间)。在一些实施例中,该5'非互补区和该3'非互补区具有在0%与50%之间的序列互补性(例如,在0%-40%、0%-30%、0%-20%、0%-10%之间、或0%的序列互补性)。在一些实施例中,该5'非互补区和该3'非互补区具有大于-5kcal/mol的结合自由能。在一些实施例中,该5'互补区和该3'互补区具有低于10℃的结合Tm。在一些实施例中,该5'非互补区和该3'非互补区包括至少1、2、3、4、5、6、7、8、9、或10个错配。在一些实施例中,该5'退火区和该3'退火区不包括任何非互补区。
在实施例中,该5'退火区和该3'退火区具有高GC百分比(计算为GC核苷酸的数目除以总核苷酸、乘以100),即其中相对大量的GC对参与在该5'退火区与该3'退火区之间的退火,例如,其中该GC百分比为至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或甚至约100%。例如,在其中5'和3'退火区短(例如,其中每个退火区的长度为2、3、4、5、6、7、8、9、10个核苷酸)的实施例中,退火区中增加的GC百分比将增加两个区域之间的退火强度。
在一些实施例中,该5'退火区包括与SEQ ID NO:17的核酸序列具有至少85%、90%、95%、96%、97%、98%、或99%序列同一性的区域。在一些实施例中,该5'退火区包括SEQ ID NO:17的核酸序列。在一些实施例中,该3'退火区包括与SEQ ID NO:20的核酸序列具有至少85%、90%、95%、96%、97%、98%、或99%序列同一性的区域。在一些实施例中,该3'退火区包括SEQ ID NO:20的核酸序列。
在一些实施例中,该多核糖核苷酸负载物包括编码序列、或包含非编码序列、或包含编码序列和非编码序列的组合。在一些实施例中,该多核糖核苷酸负载物包括两个或更多个编码序列(例如,2、3、4、5、6、7、8、9、或10个或更多个编码序列)、两个或更多个非编码序列(例如,2、3、4、5、6、7、8、9、或10个或更多个非编码序列)、或其组合。在该多核糖核苷酸负载物包括两个或更多个编码序列的情况下,该编码序列可以是单个编码序列的两个或更多个拷贝、或者两个或更多个不同的编码序列中的每个编码序列的至少一个拷贝。在该多核糖核苷酸负载物包括两个或更多个非编码序列的情况下,该非编码序列可以是单个非编码序列的两个或更多个拷贝、或者两个或更多个不同的非编码序列中的每个非编码序列的至少一个拷贝。在一些实施例中,该多核糖核苷酸负载物包括至少一个编码序列和至少一个非编码序列。在实施例中,该多核糖核苷酸负载物包括至少一个编码多肽的编码序列,并且进一步包含选自由以下组成的组的额外的元件:(a)内部核糖体进入位点(IRES)或5’UTR序列,其位于该编码序列的5'并与之可操作地连接,任选地在该IRES或5'UTR序列与该编码序列之间具有插入核糖核苷酸;(b)3’UTR序列,其位于该编码序列的3'并与之可操作地连接,任选地在该3'UTR与该编码序列之间具有插入核糖核苷酸;以及(c)(a)和(b)两者。
在一些实施例中,该多核糖核苷酸负载物包含至少一个非编码RNA序列。在一些实施例中,该至少一个非编码RNA序列包含至少一个选自由以下组成的组的RNA:RNA适配体、长非编码RNA(lncRNA)、转移RNA衍生的片段(tRF)、转移RNA(tRNA)、核糖体RNA(rRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、和Piwi相互作用RNA(piRNA);或这些RNA中的任一者的片段。在一些实施例中,该至少一个非编码RNA序列包含调节RNA。在一些实施例中,该至少一个非编码RNA序列反式调节靶序列。
在一些实施例中,该至少一个非编码RNA序列对靶序列的反式调节是靶序列表达的上调。在一些实施例中,该至少一个非编码RNA序列对靶序列的反式调节是靶序列表达的下调。在一些实施例中,该至少一个非编码RNA序列对靶序列的反式调节是靶序列的可诱导表达。例如,该至少一个非编码RNA序列可以通过环境条件(例如,光、温度、水或营养可用性)、通过昼夜节律、通过内源性或外源性提供的诱导剂(例如,小RNA、配体)进行诱导。在一些实施例中,至少一个非编码RNA序列可被原核系统的生理状态(例如,生长期、转录调节状态、和细胞内代谢物浓度)诱导。例如,可以提供外源性提供的配体(例如,阿拉伯糖、鼠李糖、或IPTG)以使用诱导型启动子(例如,PBAD、Prha、和lacUV5)诱导表达。
在一些实施例中,该至少一个非编码RNA序列包含选自由以下组成的组的RNA:小干扰RNA(siRNA)或其前体、双链RNA(dsRNA)或至少部分双链RNA[例如,包含一个或多个茎环的RNA];发夹RNA(hpRNA)、微小RNA(miRNA)或其前体[例如,pre-miRNA或pri-miRNA];相位小干扰RNA(phasiRNA)或其前体;异染色质小干扰RNA(hcsiRNA)或其前体;以及天然反义短干扰RNA(natsiRNA)或其前体。
在一些实施例中,该至少一个非编码RNA序列包含指导RNA(gRNA)或其前体。
在一些实施例中,靶序列包含受试基因组的基因的核苷酸序列。在一些实施例中,受试基因组是脊椎动物、无脊椎动物、真菌、植物、或微生物的基因组。在一些实施例中,受试基因组是人、非人哺乳动物、爬行动物、鸟、两栖动物、或鱼的基因组。在一些实施例中,受试基因组是昆虫、蛛形纲、线虫、或软体动物的基因组。在一些实施例中,受试基因组是单子叶植物、双子叶植物、裸子植物、或真核藻类的基因组。在一些实施例中,受试基因组是细菌、真菌、或古细菌的基因组。在一些实施例中,靶序列包含在多个受试基因组中(例如,在给定属内的多个物种的基因组中)发现的基因的核苷酸序列。
在一些实施例中,该多核糖核苷酸负载物包含编码多肽的编码序列。在一些实施例中,该多核糖核苷酸负载物包括与编码多肽的编码序列可操作地连接的IRES。在一些实施例中,该多核糖核苷酸负载物包含编码对受试者具有生物学作用的多肽的RNA序列。在一些实施例中,该多肽是例如用于人或非人动物的治疗性多肽。在一些实施例中,该多肽是具有在脊椎动物(例如,非人哺乳动物、爬行动物、鸟、两栖动物、或鱼)、无脊椎动物(例如,昆虫、蛛形纲(arachnid)、线虫(nematode)、或软体动物)、植物(例如,单子叶植物、双子叶植物、裸子植物、真核藻类)、或微生物(例如,细菌、真菌、古细菌、卵菌)的基因组中编码的序列的多肽。在一些实施例中,当与脊椎动物、无脊椎动物、或植物接触时,或当与脊椎动物细胞、无脊椎动物细胞、微生物细胞、或植物细胞接触时,该多肽具有生物学作用。在一些实施例中,该多肽是植物修饰多肽。在一些实施例中,当与以下各者接触时,该多肽提高脊椎动物、无脊椎动物、或植物的适应度,或提高脊椎动物细胞、无脊椎动物细胞、微生物细胞、或植物细胞的适应度。在一些实施例中,当与以下各者接触时,该多肽降低脊椎动物、无脊椎动物、或植物的适应度,或降低脊椎动物细胞、无脊椎动物细胞、微生物细胞、或植物细胞的适应度。
在一些实施例中,该多核糖核苷酸负载物包含编码多肽并且具有经密码子优化用于在受试者或生物体中表达的核苷酸序列的RNA序列。用于在特定类型的生物体中表达的密码子优化的方法是本领域已知的并且作为商业载体或多肽设计服务的一部分提供。参见例如,美国专利号6,180,774(用于在单子叶植物中表达)、7,741,118(用于在双子叶植物中表达)、以及5,786,464和6,114,148(两者均用于在哺乳动物中表达)中描述的密码子优化的方法,将所有这些专利都通过引用以其全文并入本文。密码子优化可以使用几种公开获得的工具中的任一种来执行,例如,在例如以下中提供的各种密码子优化工具:www[dot]idtdna[dot]com/pages/tools/codon-optimization-tool;www[dot]novoprolabs[dot]com/tools/codon-optimization、en[dot]vectorbuilder[dot]com/tool/codon-optimization[dot]html,其中用于受试者的适当的属的密码子使用表可从门户网站下拉菜单中选择。
在一些实施例中,受试者包含(a)真核细胞;或(b)原核细胞。此类细胞的实施例包括永生化细胞系和原代细胞系。实施例包括位于组织、器官、或完整多细胞生物体内的细胞。例如,在实施例中,将如在本披露中所述的环状多核糖核苷酸(或含有该环状多核糖核苷酸的原核细胞)以靶向方式递送至多细胞生物体中的一个或多个特定细胞、组织、或器官。
在一些实施例中,受试者包含脊椎动物、无脊椎动物、真菌、植物、或微生物。在一些实施例中,该脊椎动物选自人、非人哺乳动物(例如,小家鼠(Mus musculus))、爬行动物(例如,安乐蜥(Anolis carolinensis))、鸟(例如,家鸡(Gallus gallus domesticus))、两栖动物(例如,热带爪蟾(Xenopus tropicalis))、或鱼(例如,Danio rerio(斑马鱼))。在一些实施例中,该无脊椎动物选自昆虫(例如,科罗拉多马铃薯甲虫(Leptinotarsadecemlineata))、蛛形纲(例如,中东金蝎(Scorpio maurus))、线虫(例如,南方根结线虫(Meloidogyne incognita))、或软体动物(例如,散斑角蜗牛(Cornu aspersum))。在一些实施例中,该植物选自单子叶植物(例如,玉蜀黍(Zea mays))、双子叶植物(例如,橹豆(Glycine max))、裸子植物(例如,北美乔松(Pinus strobus))、或真核藻类(例如,棒叶蕨藻(Caulerpa sertularioides))。在一些实施例中,该微生物选自细菌(例如,大肠杆菌(Escherichia coli))、真菌(例如,酿酒酵母(Saccharomyces cerevisiae))、或古细菌(例如,激烈火球菌(Pyrococcus furiosus))。
在一些实施例中,该线性多核糖核苷酸进一步包括在该5'退火区与该多核糖核苷酸负载物之间的、长度为至少5个多核糖核苷酸的间隔子区。在一些实施例中,该线性多核糖核苷酸进一步包括在该5'退火区与该多核糖核苷酸负载物之间的、长度为在5与1000个之间的多核糖核苷酸的间隔子区。在一些实施例中,间隔子区包括聚A序列。在一些实施例中,间隔子区包括聚A-C序列。
在一些实施例中,该线性多核糖核苷酸是至少1kb。在一些实施例中,该线性多核糖核苷酸是1kb至20kb。在一些实施例中,该线性多核糖核苷酸是100至约20,000个核苷酸。在一些实施例中,该线性RNA的大小是至少100、500、550、600、650、700、750、800、850、900、950、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、1,900、2,000、2,500、3,000、3,500、4,000、4,500、5,000、6,000、7,000、8,000、9,000、或10,000个核苷酸。
在一些实施例中,该RNA连接酶对该原核细胞是内源的(例如,该RNA连接酶在该细胞中天然存在)。在一些实施例中,该RNA连接酶对该原核细胞是异源的(例如,该RNA连接酶在该细胞中不是天然存在的,例如,该细胞已被基因工程化以表达或过表达该RNA连接酶)。在一些实施例中,通过在原核细胞中将外源多核苷酸转录成编码该RNA连接酶的mRNA、并翻译编码该RNA连接酶的mRNA,向该原核细胞提供该RNA连接酶。在一些实施例中,向该原核细胞提供作为外源性蛋白的RNA连接酶(例如,使该RNA连接酶在该细胞外表达并向该细胞提供)。
在一些实施例中,该RNA连接酶是tRNA连接酶。在一些实施例中,该tRNA连接酶是T4连接酶、RtcB连接酶、TRL-1连接酶、Rnl1连接酶、Rnl2连接酶、LIG1连接酶、LIG2连接酶、PNK/PNL连接酶、PF0027连接酶、thpR ligT连接酶、ytlPor连接酶、或其变体。
在一些实施例中,该RNA连接酶包含选自由SEQ ID NO:572-588组成的组的氨基酸序列。
在一些实施例中,该RNA连接酶选自由以下组成的组:植物RNA连接酶、质体(例如,叶绿体)RNA连接酶、来自古细菌的RNA连接酶、细菌RNA连接酶、真核RNA连接酶、病毒RNA连接酶、或线粒体RNA连接酶、或其变体。
在一些实施例中,该线性多核糖核苷酸是从脱氧核糖核酸转录的,该脱氧核糖核酸包括与编码本文所述的线性多核糖核苷酸的序列可操作地连接的RNA聚合酶启动子。在一些实施例中,该RNA聚合酶启动子与编码该线性多核糖核苷酸的序列是异源的。在一些实施例中,该RNA聚合酶启动子是T7启动子、T6启动子、T4启动子、T3启动子、SP3启动子、或SP6启动子。在本文所述的任何方面的一些实施例中,本披露提供了一种用于使多核糖核苷酸环化的原核系统,该原核系统包含:(a)编码本文所述的线性多核糖核苷酸的脱氧核糖核苷酸(例如,cDNA、环状DNA载体、或线性DNA载体),以及(b)包含RNA连接酶的原核细胞。
在一些实施例中,向该原核细胞提供包含该线性多核苷酸的外源性多核糖核苷酸。在一些实施例中,在该原核细胞中将该线性多核糖核苷酸从向该原核细胞提供的外源性重组DNA分子瞬时转录。在一些实施例中,在该原核细胞中将该线性多核糖核苷酸从向该原核细胞提供的外源性DNA分子转录。在一些实施例中,该外源性DNA分子不整合到该原核细胞的基因组中。在一些实施例中,该外源性DNA分子包含与编码该线性多核糖核苷酸的DNA可操作地连接的异源性启动子。在一些实施例中,该异源性启动子选自由以下组成的组:T7启动子、T6启动子、T4启动子、T3启动子、SP3启动子、或SP6启动子。在一些实施例中,在该原核细胞中将线性多核糖核苷酸从并入该原核细胞的基因组中的重组DNA分子转录。
在一些实施例中,该原核细胞在培养基中生长。在一些实施例中,生物反应器中含有原核细胞。
在一些实施例中,该原核细胞是细菌细胞或古细菌细胞。在一些实施例中,该原核细胞是天然细菌群体的成员。
在一些实施例中,该原核细胞是与真核生物体相关的微生物组的成员。在一些实施例中,该真核生物体是人、非人脊椎动物、无脊椎动物、真菌、或植物。在一些实施例中,该真核生物体是人、非人脊椎动物、无脊椎动物、真菌、或植物的寄生虫或病原体。在一些实施例中,该真核生物体是植物的无脊椎有害生物、或植物病原体的无脊椎动物载体。在一些实施例中,该真核生物体是被子植物或裸子植物,并且该原核细胞包含与植物的根(根圈)或与植物生长的土壤或生长培养基的微生物群落相关的微生物组的成员。在一些实施例中,该真核生物体是被子植物或裸子植物,并且该原核细胞包含与植物地上组织相关的微生物组的成员。在一些实施例中,该真核生物体是人、非人脊椎动物、或无脊椎动物,并且该原核细胞包含与人、非人脊椎动物、或无脊椎动物的细胞、组织、或器官相关的微生物组的成员。在一些实施例中,该真核生物体是人、非人脊椎动物、或无脊椎动物,并且该原核细胞包含与人、非人脊椎动物、或无脊椎动物的消化系统的细胞或组织相关的微生物组的成员。在一些实施例中,该真核生物体是昆虫,并且该原核细胞包含与昆虫的细菌细胞相关的微生物组的成员。
在另一方面,本披露提供了一种环状多核糖核苷酸,该环状多核糖核苷酸通过本文所述的原核系统或包括原核系统的任何方法产生。
在另一方面,本披露提供了一种通过向受试者提供本文所述的组合物或配制品来改良该受试者的方法。在一些实施例中,该组合物或配制品是核酸分子或包括核酸分子(例如,本文所述的DNA分子或RNA分子),并且向原核系统提供该核酸分子。在一些实施例中,该组合物或配制品是本文所述的原核细胞或包括本文所述的原核细胞。
在另一方面,本披露提供了一种通过向有需要的受试者提供本文所述的组合物或配制品治疗该受试者的病症的方法。在一些实施例中,该组合物或配制品是核酸分子或包括核酸分子(例如,本文所述的DNA分子或RNA分子),并且向原核受试者提供该核酸分子。在一些实施例中,该组合物或配制品是本文所述的原核细胞或包括本文所述的原核细胞。
在另一方面,本披露提供了一种通过向受试者提供本文所述的原核细胞而向该受试者提供环状多核糖核苷酸的方法。
在另一方面,本披露提供了一种配制品,该配制品包含本文所述的原核系统、原核细胞、或多核糖核苷酸。在一些实施例中,该配制品是药物配制品、兽用配制品、或农业配制品。
在另一方面,本披露提供了一种配制品,该配制品包含本文所述的原核细胞。在一些实施例中,该原核细胞是裂解的、干燥的或冷冻的。在一些实施例中,该配制品是药物配制品、兽用配制品、或农业配制品。
定义
为了有助于对本披露的理解,下面定义了多个术语。本文定义的术语具有如与本披露相关的领域中的普通技术人员通常理解的含义。术语如“一个/中(a、an)”和“该”并不旨在仅指单个实体,而是包括可以使用特定实例来说明的一般类别。术语“或”用于意指“和/或”,除非明确指出仅指替代物或者替代物相互排斥,尽管本披露支持仅指替代物和“和/或”的定义。
本文的术语用于描述特定的实施例,但它们的使用不应被视为限制,除非在权利要求中列出。
如本文使用的,在值的范围内提供的任何值都包括上限和下限、以及该上限和下限内含有的任何值。
如本文使用的,术语“circRNA”或“环状多核糖核苷酸”或“环状RNA”或“环状多核糖核苷酸分子”可互换使用,并且意指具有没有游离端(即,没有游离3'和/或5'端)的结构的多核糖核苷酸分子,例如通过共价或非共价键形成环状或环形结构的多核糖核苷酸分子。
如本文使用的,术语“环化效率”是所得环状多核糖核苷酸相对于其非环状起始材料的测量。
词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指示的治疗、调节等目的的化合物、组合物、产物等。词语“用于治疗、调节等的化合物、组合物、产物等”作为优选的实施例额外地披露了这种化合物、组合物、产物等用于治疗、调节等。
词语“用于…的化合物、组合物、产物等”或“化合物、组合物、产品等用于制造用于…的药物、药物组合物、兽用组合物、诊断组合物等中的用途”指示此类化合物、组合物、产品等将用于可在人体或动物体身上实施的治疗性方法中。它们被认为是涉及治疗方法等的实施例和权利要求的等同披露。如果实施例或权利要求因此是指“用于治疗疑似患有疾病的人或动物的化合物”,则这也被认为是披露“化合物在制造用于治疗疑似患有疾病的人或动物的药物中的用途”或“通过向疑似患有疾病的人或动物施用化合物的治疗方法”。
如本文使用的,术语“疾病”、“障碍”和“病症”各自指亚健康状态,例如,典型地被或将会被医疗专业人员诊断或治疗的状态。
“异源”意指发生在与天然存在的(天然的)背景不同的背景中。“异源”多核苷酸序列指示多核苷酸序列以在该序列的天然基因组中发现的方式不同的方式使用。例如,“异源启动子”用于驱动序列的转录,该序列不是由该启动子天然转录的序列;因此,“异源启动子”序列通常通过重组核酸技术包括在表达构建体中。术语“异源”也用于指被置于与另一序列的非天然存在的关系中的给定序列;例如,异源编码或非编码核苷酸序列通常通过基因组转化技术被插入基因组中,产生经基因修饰的基因组或重组基因组。
如本文使用的,“提高受试者的适应度”或“促进受试者的适应度”是指由于施用本文所述的肽或多肽而产生的生理学的或受试生物体进行的任何活动的任何有利的改变,包括但不限于以下所希望效果中的任何一种或多种:(1)使对生物或非生物应激的耐受性提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(2)使产率或生物量提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(3)使开花时间调整约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(4)使对有害生物或病原体的抗性提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多,(4)使对除草剂的抗性提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(5)使受试生物体(例如,农业上重要的昆虫)的群体增加约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(6)使受试生物体(例如,昆虫,例如,蜂或蚕)的繁殖速率提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(7)使受试生物体(例如,昆虫,例如,蜂或蚕)的迁移提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(8)使受试生物体(例如,昆虫,例如,蜂或蚕)的体重增加约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(9)使受试生物体(例如,昆虫,例如,蜂或蚕)的代谢速率或活性提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(10)使通过受试生物体(例如,昆虫,例如,蜂或蚕)进行的授粉(例如,在给定时间内被授粉的植物数量)提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(11)使受试生物体(例如,昆虫,例如,蜂或蚕)副产物(例如,来自蜜蜂的蜂蜜或来自蚕的蚕丝)的产量提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(12)使受试生物体(例如,昆虫)的营养物(例如,蛋白质、脂肪酸、或氨基酸)含量提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;或(13)使受试生物体对杀有害生物剂(例如,新烟碱(例如,吡虫啉)或有机磷杀昆虫剂(例如,硫代磷酸酯,例如,杀螟硫磷))的抗性提高约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多,(14)使受试生物体(如人或非人动物)的健康提高或使受试生物体(如人或非人动物)的疾病减少。相比于未施用调节剂的受试生物体,可以确定宿主适应度的提高。相反地,“降低受试者的适应度”是指由于施用本文所述的肽或多肽而产生的生理学的或受试生物体进行的任何活动的任何不利的改变,包括但不限于以下预期效果中的任何一种或多种:(1)使对生物或非生物应激的耐受性降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(2)使产率或生物量降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(3)使开花时间调整约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(4)使对有害生物或病原体的抗性降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多,(4)使对除草剂的抗性降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(5)使受试生物体(例如,农业上重要的昆虫)的群体减少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(6)使受试生物体(例如,昆虫,例如,蜂或蚕)的繁殖速率降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(7)使受试生物体(例如,昆虫,例如,蜂或蚕)的迁移降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(8)使受试生物体(例如,昆虫,例如,蜂或蚕)的体重减少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(9)使受试生物体(例如,昆虫,例如,蜂或蚕)的代谢速率或活性降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(10)使通过受试生物体(例如,昆虫,例如,蜂或蚕)进行的授粉(例如,在给定时间内被授粉的植物数量)降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(11)使受试生物体(例如,昆虫,例如,蜂或蚕)副产物(例如,来自蜜蜂的蜂蜜或来自蚕的蚕丝)的产量降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;(12)使受试生物体(例如,昆虫)的营养物(例如,蛋白、脂肪酸、或氨基酸)含量降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多;或(13)使受试生物体对杀有害生物剂(例如,新烟碱(例如,吡虫啉)或有机磷杀昆虫剂(例如,硫代磷酸酯,例如,杀螟硫磷))的抗性降低约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多,(14)使受试生物体(如人或非人动物)的健康降低或使受试生物体(如人或非人动物)的疾病减少。相比于未施用调节剂的受试生物体,可以确定宿主适应度的降低。对本领域技术人员而言将显而易见的是,受试者的生理学、表型、或活性的某些变化(例如,植物开花时间的调整)可以被认为提高该受试者的适应度或降低该受试者的适应度,这取决于背景(例如,以适应气候或其他环境条件的变化)。例如,开花时间的延迟(例如,在给定日历日期开花的群体中的植物减少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%)可以是对较晚或较凉的春季的有益适应,并因此被认为提高植物的适应度;相反,在春季较早或较暖的背景下,相同的开花时间的延迟可以被认为会降低植物的适应度。
如本文使用的,术语“线性RNA”或“线性多核糖核苷酸”或“线性多核糖核苷酸分子”可互换使用,并且意指具有5'和3'端的多核糖核苷酸分子。5'和3'端中的一者或两者可以是游离端或与另一部分连接。线性RNA包括未经历环化(例如,经预环化)并可用作环化的起始材料的RNA。
如本文使用的,术语“经修饰的核糖核苷酸”意指具有至少一个针对糖、核碱基、或核苷间键的修饰的核苷酸。
术语“药物组合物”旨在同样披露包括在药物组合物中的环状或线性多核糖核苷酸可用于通过疗法治疗人体或动物体。
如本文使用的,术语“多核苷酸”意指包括一个或多个核酸亚基或核苷酸的分子,并且可以与“核酸”或“寡核苷酸”互换使用。多核苷酸可以包括一个或多个选自腺苷(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)或其变体的核苷酸。核苷酸可以包括核苷和至少1、2、3、4、5、6、7、8、9、10个或更多个磷酸(PO3)基团。核苷酸可以包括核碱基、五碳糖(核糖或脱氧核糖)以及一个或多个磷酸基团。核糖核苷酸是其中糖为核糖的核苷酸。多核糖核苷酸或核糖核酸或RNA可以指包括经由磷酸二酯键聚合的多个核糖核苷酸的大分子。脱氧核糖核苷酸是其中糖是脱氧核糖的核苷酸。
如本文使用的,本文的术语“多核糖核苷酸负载物”包括含有至少一个多核糖核苷酸的任何序列。在实施例中,该多核糖核苷酸负载物包括一个或多个编码序列,其中每个编码序列编码多肽。在实施例中,多核糖核苷酸负载物包括一个或多个非编码序列,如具有调节或催化功能的多核糖核苷酸。在实施例中,该多核糖核苷酸负载物包括编码序列和非编码序列的组合。在实施例中,多核糖核苷酸负载物包括一个或多个本文所述的多核糖核苷酸序列,如一个或多个调节元件、内部核糖体进入位点(IRES)元件、和/或间隔子序列。
如本文使用的,如果核酸构建体或载体的元件位于该构建体或载体上使得它们能够执行其功能(例如,促进转录或终止转录),则它们是“可操作地连接的(operablyconnected或operably linked)”。例如,包括与编码线性前体RNA的DNA序列可操作地连接的启动子的DNA构建体指示该编码线性前体RNA的DNA序列可以被转录以形成线性前体RNA,例如,然后可以使用本文提供的方法环化成环状RNA的线性前体RNA。
多脱氧核糖核苷酸或脱氧核糖核酸或DNA意指包括经由磷酸二酯键聚合的多个脱氧核糖核苷酸的大分子。核苷酸可以是核苷一磷酸或核苷多磷酸。核苷酸意指包括可检测标签(如发光标签)或标志物(例如,荧光团)的脱氧核糖核苷多磷酸,如例如脱氧核糖核苷三磷酸(dNTP),其可以选自脱氧腺苷三磷酸(dATP)、脱氧胞苷三磷酸(dCTP)、脱氧鸟苷三磷酸(dGTP)、尿苷三磷酸(dUTP)和脱氧胸苷三磷酸(dTTP)dNTP。核苷酸可以包括可以掺入正在生长的核酸链中的任何亚基。这种亚基可以是A、C、G、T或U,或对一个或多个互补A、C、G、T或U有特异性或与嘌呤(即,A或G或其变体)或嘧啶(即,C、T或U或其变体)互补的任何其他亚基。在一些实例中,多核苷酸是脱氧核糖核酸(DNA)、核糖核酸(RNA)或其衍生物或变体。在一些情况下,仅举数例,多核苷酸是短干扰RNA(siRNA)、微小RNA(miRNA)、质粒DNA(pDNA)、短发夹RNA(shRNA)、小核RNA(snRNA)、信使RNA(mRNA)、前体mRNA(pre-mRNA)、反义RNA(asRNA),并且涵盖核苷酸序列及其任何结构实施例,如单链、双链、三链、螺旋、发夹等。在一些情况下,多核苷酸分子是环状的。多核苷酸可以具有各种长度。核酸分子可以具有至少约10个碱基、20个碱基、30个碱基、40个碱基、50个碱基、100个碱基、200个碱基、300个碱基、400个碱基、500个碱基、1千碱基(kb)、2kb、3kb、4kb、5kb、10kb、50kb或更大的长度。可以从细胞或组织中分离多核苷酸。多核苷酸序列的实施例包括分离和纯化的DNA/RNA分子、合成的DNA/RNA分子和合成的DNA/RNA类似物。
多核苷酸(例如多核糖核苷酸或多脱氧核糖核苷酸)的实施例包括含有一种或多种核苷酸变体的多核苷酸,这些核苷酸变体包括一个或多个非标准核苷酸、一个或多个非天然核苷酸、一个或多个核苷酸类似物和/或经修饰的核苷酸。经修饰的核苷酸的实例包括但不限于二氨基嘌呤、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫代尿苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基辨苷(galactosylqueosine)、肌苷、N6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基辫苷(mannosylqueosine)、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-D46-异戊烯腺嘌呤、尿嘧啶-5-氧乙酸(v)、怀丁苷(wybutoxosine)、假尿嘧啶、辫苷(queosine)、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤等。在一些情况下,核苷酸在其磷酸部分中包括修饰,包括对三磷酸部分的修饰。此类修饰的非限制性实例包括较大长度的磷酸链(例如,具有4、5、6、7、8、9、10个或更多个磷酸部分的磷酸链)和具有硫醇部分的修饰(例如,α-硫代三磷酸和β-硫代三磷酸)。在实施例中,核酸分子在碱基部分(例如,在典型地可用于与互补核苷酸形成氢键的一个或多个原子处和/或在典型地不能与互补核苷酸形成氢键的一个或多个原子处)、糖部分或磷酸骨架处被修饰。在实施例中,核酸分子含有胺修饰的基团,如氨基烯丙基1-dUTP(aa-dUTP)和氨基己基丙烯酰胺-dCTP(aha-dCTP),以允许共价附接胺反应性部分,如N-羟基琥珀酰亚胺酯(NHS)。本披露的寡核苷酸中的标准DNA碱基对或RNA碱基对的替代物可以提供更高的位/立方mm密度,更高的安全性(抵抗天然毒素的意外或有目的的合成),光编程聚合酶的更容易区分,或更低的二级结构。在Betz K,Malyshev DA,Lavergne T,Welte W,Diederichs K,Dwyer TJ,Ordoukhanian P,RomesbergFE,Marx A.Nat.Chem.Biol.[自然-化学生物学]2012年7月;8(7):612-4中描述了与用于从头和/或扩增合成的天然和突变体聚合酶相容的此类替代性碱基对,该文献出于所有目的通过引用并入本文中。
如本文使用的,“多肽”意指最常通过肽键连接在一起的氨基酸残基(天然或非天然)的聚合物。如本文使用的,该术语是指任何大小、结构或功能的蛋白质、多肽和肽。多肽可以包括基因产物、天然存在的多肽、合成的多肽、同源物、直系同源物、旁系同源物、片段以及前述物质的其他等同物、变体和类似物。多肽可以是单分子或多分子复合物,如二聚体、三聚体或四聚体。它们还可以包括单链或多链多肽(如抗体或胰岛素),并且可以是缔合的或连接的。最常见的二硫键存在于多链多肽中。术语多肽也可以应用于其中一个或多个氨基酸残基是对应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物。
如本文使用的,“前体线性多核糖核苷酸”或“前体线性RNA”是指通过在原核系统中转录(例如,体内转录)(例如,从本文提供的脱氧核糖核苷酸模板)创建的线性RNA分子。前体线性RNA是一种或多种自切割核酶切割之前的线性RNA。在一种或多种自切割核酶切割后,线性RNA被称为“连接酶相容的线性多核糖核苷酸”或“连接酶相容的RNA”。
如本文使用的,术语“植物修饰多肽”是指能以导致植物适应度提高或降低的方式改变植物的遗传特性(例如,增加基因表达、减少基因表达或以其他方式改变DNA或RNA的核苷酸序列)、表观遗传特性、或生物化学或生理特性的多肽。
如本文使用的,术语“调节元件”是修饰与其可操作地连接的核酸序列的表达或转录的部分,如核酸序列。调节元件包括启动子、转录因子识别位点、终止子元件、小RNA识别位点(小RNA(例如微小RNA)与其结合并进行切割)、和转录稳定元件(参见例如,美国专利申请公开2007/0011761中描述的稳定元件)。例如,在实施例中,调节元件(如启动子)修饰环状或线性多核糖核苷酸内编码或非编码序列的表达。在另一实施例中,调节元件(如小RNA识别和切割位点)修饰RNA转录物的表达,例如通过限制其在特定细胞、组织、或器官中的表达(参见例如,美国专利号8,334,430和9,139,838)。
如本文使用的,术语“RNA等同物”是指RNA序列,该RNA序列是DNA序列的RNA等同物。因此,DNA序列的RNA等同物是指其中每个胸苷(T)残基被尿苷(U)残基替代的DNA序列。例如,本披露提供了通过生物信息学方法鉴定的核酶的DNA序列。本披露特别考虑了这些DNA序列中的任一DNA序列都可以转化为对应的RNA序列并包括在本文所述的RNA分子中。
如本文使用的,“间隔子”是指提供两个相邻多核苷酸区之间的距离和/或灵活性的任何邻接的(例如,一个或多个核苷酸的)核苷酸序列。
如本文使用的,术语“序列同一性”是通过使用全局或局部比对算法对两个肽或两个核苷酸序列进行比对来确定的。当序列在最佳比对时(例如,当通过程序(如GAP或BESTFIT)使用默认参数进行比对时)共享至少某个最小百分比的序列同一性时,这些序列被称为“基本上相同的”或“基本上相似的”。GAP使用Needleman和Wunsch全局比对算法在两个序列的整个长度上对其进行比对,从而最大程度地增加了匹配数目并最大程度地减少了空位数目。通常,使用GAP默认参数,空位产生罚分=50(核苷酸)/8(蛋白质),空位延伸罚分=3(核苷酸)/2(蛋白质)。对于核苷酸,使用的默认评分矩阵是nwsgapdna,而对于蛋白质,默认评分矩阵是Blosum62(Henikoff和Henikoff,1992,PNAS[美国科学院院报]89,915-919)。序列比对和百分比序列同一性的评分例如使用计算机程序来确定,这些计算机程序如从美国92121-3752加州圣地亚哥斯克兰顿路9685号的阿赛乐德公司(Accelrys Inc.,9685Scranton Road,San Diego,CA)获得的GCG Wisconsin软件包10.3版或EmbossWin2.10.0版(使用程序“needle”)。可替代地或额外地,通过例如使用如FASTA、BLAST等算法对数据库进行搜索来确定同一性百分比。序列同一性是指在序列的整个长度上的序列同一性。
如本文使用的,关于RNA,“结构化”是指由RNAFold软件或类似预测工具预测与其自身或相同RNA分子中的其他序列形成有序的或可预测的二级或三级结构(例如,发夹环)的RNA序列。
如本文使用的,“核酶”是指催化RNA或RNA的催化区。“自切割核酶”是能够催化在核酶序列自身内的核苷酸位点处或在核酶序列自身的末端处发生的切割反应的核酶。
如本文使用的,术语“受试者”是指生物体,如动物、植物、或微生物。在实施例中,该受试者是脊椎动物(例如,哺乳动物、鸟、鱼、爬行动物、或两栖动物)。在实施例中,该受试者是人,包括成人和非成人(婴儿和儿童)。在实施例中,该受试者是非人哺乳动物。在实施例中,该受试者是非人哺乳动物,如非人灵长类动物(例如,猴、猿)、有蹄类动物(例如,牛科动物,包括牛、水牛、野牛、绵羊、山羊、和麝牛;猪;骆驼科动物,包括骆驼、美洲驼、和羊驼;鹿,羚羊;和马科动物,包括马和驴)、肉食动物(例如,狗、猫)、啮齿动物(例如,大鼠、小鼠、豚鼠、仓鼠、松鼠)、或兔类动物(例如,兔子、野兔)。在实施例中,该受试者是鸟,如以下鸟类分类群的成员:鸡形目(例如鸡、火鸡、野鸡、鹌鹑)、雁形目(例如鸭、鹅)、古颚下纲(例如鸵鸟、鸸鹋)、鸽形目(例如鸽子、野鸽)、或鹦形目(例如鹦鹉)。在实施例中,该受试者是无脊椎动物,如节肢动物(例如,昆虫、蛛形纲、甲壳动物)、线虫、环节动物、蠕虫、或软体动物。在实施例中,该受试者是无脊椎动物农业有害生物或寄生在无脊椎动物或脊椎动物宿主上的无脊椎动物。在实施例中,该受试者是植物,如被子植物(其可以是双子叶植物或单子叶植物)或裸子植物(例如,针叶树、苏铁、买麻藤类植物、银杏)、蕨类、马尾植物、石松类、或苔藓植物。在实施例中,该受试者是真核藻类(单细胞或多细胞)。在实施例中,该受试者是具有农业或园艺重要性的植物,如行间作物、生产水果的植物和树木、蔬菜、树木、以及观赏植物(包括观赏花、灌木、树木、地被植物、和草坪草)。
植物和植物细胞是任何目的物种(包括双子叶植物和单子叶植物)的植物和植物细胞。目的植物包括行间作物、生产水果的植物和树木、蔬菜、树木、以及观赏植物(包括观赏花、灌木、树木、地被植物、和草坪草)。商业上重要的栽培作物、树木、和植物的实例包括:苜蓿(紫苜蓿(Medicago sativa)),杏仁(扁桃(Prunus dulcis)),苹果(栽培苹果(Malus xdomestica)),杏子(杏(Prunus armeniaca),布里扬松杏(P.brigantine),东北杏(P.mandshurica),梅(P.mume),西伯利亚杏(P.sibirica)),芦笋(asparagus)(芦笋(Asparagus officinalis)),香蕉(芭蕉属物种(Musa spp.)),大麦(barley)(大麦(Hordeum vulgare)),豆类(菜豆属物种(Phaseolus spp.)),蓝莓和蔓越莓(越橘属物种(Vaccinium spp.)),可可(cocao)(可可(Theobroma cacao)),卡诺拉和油菜籽或油菜(欧洲油菜(Brassica napus)),波兰卡诺拉(芜青(Brassica rapa))以及相关的十字花科蔬菜,包括西兰花,羽衣甘蓝,卷心菜,和萝卜(埃塞俄比亚芥(Brassica carinata)、芥菜(B.juncea)、甘蓝(B.oleracea)、甘蓝型油莱(B.napus)、黑芥(B.nigra)、和芜青(B.rapa)、以及这些的杂交体),康乃馨(香石竹(Dianthus caryophyllus)),胡萝卜(胡萝卜(Daucuscarota sativus)),木薯(cassava)(木薯(Manihot esculentum)),樱桃(欧洲甜樱桃(Prunus avium)),鹰嘴豆(chickpea)(鹰嘴豆(Cicer arietinum)),菊苣(chicory)(菊苣(Cichoriumintybus)),红辣椒和其他辣椒属(capsicum)辣椒(辣椒(Capsicum annuum),尖椒(C.frutescens),中华辣椒(C.chinense),绒毛辣椒(C.pubescens),灯笼辣椒(C.baccatum)),菊花(菊属物种(Chrysanthemum spp.)),椰子(coconut)(椰子(Cocosnucifera)),咖啡(咖啡属物种(Coffea spp.),包括小粒咖啡(Coffea arabica)和中粒咖啡(Coffea canephora)),棉花(陆地棉(Gossypium hirsutum L.)),豇豆(cowpea)(豇豆(Vigna unguiculata)和其他豇豆属物种(Vigna spp.)),蚕豆(fava bean)(蚕豆(Viciafaba)),黄瓜(cucumber)(黄瓜(Cucumis sativus)),红醋栗和醋栗(茶藨子属物种(Ribesspp.)),枣(海枣(Phoenix dactylifera)),浮萍(浮萍科(Lemnoideae)),茄子或矮瓜(茄(Solanummelongena)),桉树(桉属物种(Eucalyptus spp.)),亚麻(flax)(亚麻(Linumusitatissumum L.)),天竺葵(天竺葵属物种(Pelargonium spp.)),葡萄柚(grapefruit)(葡萄柚(Citrus x paradisi)),葡萄(grape)(葡萄属物种(Vitus spp.)),包括酿酒葡萄(酿酒用葡萄(Vitus vinifera)及其杂交体),番石榴(guava)(番石榴(Psidiumguajava)),啤酒花(hops)(啤酒花(Humulus lupulus)),苎麻和大麻(cannabis)(大麻(Cannabis sativa)和大麻属物种(Cannabis spp.)),鸢尾花(鸢尾属物种(Iris spp.)),柠檬(lemon)(柠檬(Citrus limon)),生菜(莴苣(Lactuca sativa)),酸橙(柑橘属物种(Citrus spp.)),玉米(玉蜀黍(Zea mays L.)),芒果(芒果(Mangifera indica)),山竹(莽吉柿(Garcinia mangostana)),瓜(甜瓜(Cucumis melo)),小米(狗尾草属物种(Setariaspp.)、稗属物种(Echinochloa spp.)、穇属物种(Eleusine spp.)、黍属物种(Panicumspp.)、狼尾草属物种(Pennisetum spp.)),燕麦(oat)(燕麦(Avena sativa)),油棕(oilpalm)(油棕(Ellis quineensis)),橄榄(木犀榄(Olea europaea)),洋葱(onion)(洋葱(Allium cepa))和其他葱蒜类植物(葱属物种(Allium spp.)),橙(甜橙(Citrussinensis)),木瓜(番木瓜(Carica papaya)),桃子和油桃(碧桃(Prunus persica)),梨(梨属物种(Pyrus spp.)),豌豆(pea)(豌豆(Pisa sativum)),花生(落花生(Arachishypogaea)),牡丹(芍药属物种(Paeonia spp.)),矮牵牛(碧冬茄属物种(Petunia spp.)),菠萝(凤梨(Ananas comosus)),大蕉(芭蕉属物种),李子(欧洲李(Prunus domestica)),圣诞红(一品红(Euphorbia pulcherrima)),白杨(杨属物种(Populus spp.)),马铃薯(马铃薯(Solanum tuberosum)),南瓜(pumpkin)和倭瓜(西葫芦(Cucurbita pepo)、笋瓜(C.maximus)、南瓜(C.moschata)),水稻(稻(Oryza sativa L.)),玫瑰(蔷薇属物种(Rosaspp.)),橡胶(橡胶树(Hevea brasiliensis)),黑麦(rye)(黑麦(Secale cereale)),红花(safflower)(红花(Carthamus tinctorius L)),芝麻籽(芝麻(Sesame indium)),高粱(sorghum)(高粱(Sorghum bicolor)),大豆(橹豆(Glycine max L.)),草莓(strawberry)(草莓属物种(Fragaria spp.),草莓(Fragaria x ananassa)),甜菜(sugar beet)(甜菜(Beta vulgaris)),甘蔗(甘蔗属物种(Saccharum spp.)),向日葵(sunflower)(向日葵(Helianthus annuus)),甘薯(sweet potato)(甘薯(Ipomoea batatas)),橘子(福橘(Citrus tangerina)),茶(茶树(Camellia sinensis)),烟草(tobacco)(烟草(Nicotianatabacum L.)),番茄(tomato)(番茄(Solanum lycopersicum或Lycopersiconesculentum)),郁金香(郁金香属物种(Tulipa spp.)),核桃(胡桃属物种(Juglansspp.L.)),西瓜(watermelon)(西瓜(Citrullus lanatus)),小麦(普通小麦(Triticumaestivum)),和山药(薯蓣属物种(Discorea spp.))。目的无脊椎动物包括被认为有益的无脊椎动物(例如,授粉昆虫、有助于控制无脊椎有害生物的捕食性昆虫)或被驯化以供人使用的无脊椎动物(例如,欧洲蜜蜂(西方蜜蜂(Apis mellifera))、蚕(家蚕(Bombyx mori))、食用蜗牛(如Helix属物种))和被认为是有害生物或其他有害的无脊椎动物。
许多无脊椎动物被认为是有害生物,因为它们会破坏对人重要的资源,或在人、非人动物(特别是家畜)、或植物中引起或传播疾病。控制有害生物无脊椎动物的努力通常采用合成的化学物质,这些化学物质本身可能会因其毒性(包括对人和其他非靶标生物体,如有益的无脊椎动物)、缺乏特异性、在环境中的持久性、以及通过食物链转运而具有不希望的影响。
损害植物(特别是作为作物种植的驯化植物)的无脊椎农业有害生物包括但不限于节肢动物(例如,昆虫、蛛形纲、多足类)、线虫、扁形动物、和软体动物。重要的农业无脊椎有害生物包括以下昆虫的代表性有害生物:鞘翅目(甲虫)、双翅目(苍蝇)、鳞翅目(蝴蝶、飞蛾)、直翅目(蚱蜢、蝗虫)、缨翅目(蓟马)、和半翅目(椿象)、蛛形纲(如螨虫和蜱),各种蠕虫(如线虫(蛔虫)和扁形动物(扁虫)),以及软体动物(如蛞蝓和蜗牛)。
农业昆虫有害生物的实例包括蚜虫、球蚜(adalgids)、根瘤蚜、潜叶虫、粉虱、毛虫(蝴蝶或蛾幼虫)、水蜡虫、介壳虫、蚱蜢、蝗虫、苍蝇、蓟马、蠼螋、臭虫、跳甲、象鼻虫、螟蛉虫、神枪手(sharpshooter)、根或茎蛀虫、叶蝉、潜叶虫、和蠓。重要的鳞翅目农业有害生物的非限制性特定实例包括,例如,小菜蛾(diamondback moth)(小菜蛾(Plutellaxylostella)),各种“螟蛉虫”(例如,棉铃虫属物种(Diparopsis spp.)、钻夜蛾属物种(Earias spp.)、铃虫属物种(Pectinophora spp.)、和铃夜蛾属物种(Helicoverpa spp.),包括玉米穗虫(corn earworm)、谷实夜蛾(Helicoverpa zea)、和棉铃虫(棉铃虫(Helicoverpa armigera))),欧洲玉米蛀虫(玉米螟(Ostrinia nubilalis)),黑色切根虫(小地老虎(Agrotis ipsilon)),“粘虫”(例如,草地贪夜蛾(Spodoptera frugiperda)、甜菜夜蛾(Spodoptera exigua)、海灰翅夜蛾(Spodoptera littoralis)、一星黏虫(Pseudaletia unipuncta)),玉米秆蛀虫(普通蛀茎夜蛾(Papaipema nebris)),豆白缘切根虫(菜豆白缘切根虫(Striacosta albicosta)),舞毒蛾(gypsy moth)(毒蛾属物种(Lymatria spp.)),菜青虫(Pieris rapae),红铃麦蛾(Pectinophora gossypiella),小桃翅蛾(Synanthedon exitiosa),南瓜藤透翅蛾(Melittia cucurbitae),苹果小卷蛾(Cydiapomonella),梨小食心虫(Grapholita molesta),印度谷斑螟(Plodia interpunctella),大蜡螟(Galleria mellonella),烟草天蛾(Manduca sexta),番茄天蛾(Manducaquinquemaculata),舞毒蛾(Lymantria dispar),黄毒蛾(Euproctis chrysorrhoea),粉纹夜蛾(Trichoplusia ni),甘蓝夜蛾(Mamestra brassicae),梨豆夜蛾(Anticarsiagemmatalis),大豆尺金夜蛾(Pseudoplusia includens),菜豆小卷蛾(Epinotiaaporema),烟芽夜蛾(Heliothis virescens),三化螟(Scripophaga incertulus),蛀茎夜蛾属物种(Sesamia spp.),Buseola fusca,稻纵卷叶螟(Cnaphalocrocis medinalis)和二化螟(Chilo suppressalis)。重要的鞘翅目(甲虫)农业有害生物的非限制性特定实例包括,例如,马铃薯甲虫(Colorado potato beetle)(科罗拉多马铃薯甲虫(Leptinotarsadecemlineata))和其他金花虫属物种(Leptinotarsa spp.),例如,伪马铃薯叶甲(L.juncta)(假马铃薯甲虫)、L.haldemani(霍尔德曼(Haldeman)绿色马铃薯甲虫)、膜苞菊叶甲(L.lineolata)(菊科灌木叶甲虫)、L.behrensi、L.collinsi、L.defecta、L.heydeni、蒺藜叶甲(L.peninsularis)、柔毛茄叶甲(L.rubiginosa)、胡颓子叶茄叶甲(L.texana)、蒺藜四条叶甲(L.tlascalana)、L.tumamoca、和L.typographica;“玉米根虫”和“黄瓜甲虫”,包括西方玉米根虫(玉米根萤叶甲(Diabrotica virgifera virgifera))、北方玉米根虫(Northern corn rootworm)(北方玉米根虫(D.barberi))、南方玉米根虫(十一星叶甲食根亚种(D.undecimpunctata howardi))、葫芦甲虫(南美叶甲(D.speciosa))、带状黄瓜甲虫(带纹黄瓜萤叶甲(D.balteata))、条纹黄瓜甲虫(带纹条叶甲(Acalymma vittatum))、和西部条纹黄瓜甲虫(西部黄瓜条叶甲(A.trivittatum));“跳甲”,例如,蚤凹胫跳甲(Chaetocnema pulicaria)、条跳甲属物种(Phyllotreta spp.)、和蚤跳甲属物种(Psylliodes spp.);“玉米种甲虫”,例如,玉米小蝼甲(Stenolophus lecontei)和玉米籽步甲(Clivinia impressifrons);谷类叶甲虫(橙足负泥虫(Oulema melanopus));日本甲虫(日本弧丽金龟(Popillia japonica))和其他“白蛴螬(white grubs)”,例如,鳃角金龟属物种(Phyllophaga spp.)、方头甲属物种(Cyclocephala spp.);谷斑皮蠹(khaprabeetle)(谷斑皮蠹(Trogoderma granarium));棕榈核小蠹(date stone beetle)(棕榈核小蠹(Coccotrypes dactyliperda));棉铃象鼻虫(boll weevil)(棉铃象鼻虫(Anthonomusgrandis grandis));蛀茎虫(Dectes stem borer)(蛀茎虫(Dectes texanus));“线虫”“磕头虫”,例如,梳爪叩头虫属物种(Melanotus spp.)、小麦叩甲(Agriotes mancus)、和甜菜叩甲(Limonius dubitans)。重要的半翅目(椿象)农业有害生物的非限制性特定实例包括,例如,褐纹蝽(茶翅蝽(Halyomorpha halys))、绿蝽象(green stinkbug)(绿蝽(Chinaviahilaris));象甲,例如,玉米长喙象(Sphenophorus maidis);吹沫虫,例如,牧场沫蝉(meadow spittlebug)(长沫蝉(Philaenus spumarius));叶蝉,例如,马铃薯叶蝉(苹果小绿叶蝉(Empoasca fabae))、甜菜叶蝉(beet leafhopper)(甜菜叶蝉(Circulifertenellus)、蓝绿神枪手(blue-green sharpshooter)(蓝绿叶蝉(Graphocephalaatropunctata))、玻璃翅神枪手(翅尖头叶蝉(Homalodisca vitripennis))、玉米叶蝉(maize leafhopper)(玉米叶蝉(Cicadulina mbila)、两斑叶蝉(two-spottedleafhopper)(双斑夜蛘(Sophonia rufofascia))、普通褐叶蝉(南斑叶蝉(Orosiusorientalis))、水稻绿叶蝉(黑尾叶蝉属物种(Nephotettix spp.))、和白苹果叶蝉(苹白小叶蝉(Typhlocyba pomaria));蚜虫(例如,缢管蚜属物种(Rhopalosiphum spp.)、蚜虫属物种(Aphis spp.)、瘤蚜属物种(Myzus spp.)),葡萄根瘤蚜(grape phylloxera)(葡萄根瘤蚜(Daktulosphaira vitifoliae))和木虱,例如,亚洲柑橘木虱(柑桔木虱(Diaphorinacitri))、非洲柑橘木虱(African citrus psyllid)(柑桔木虱(Trioza erytreae))、马铃薯/番茄木虱(番茄木虱(Bactericera cockerelli))。重要农业有害生物的其他实例包括蓟马(例如,西方花蓟马(Frankliniella occidentalis)、麦花蓟马(F.tritici)、唐菖蒲简蓟马(Thrips simplex)、棕榈蓟马(T.palmi));双翅目的成员,包括地种蝇属物种(Deliaspp.)、果蝇(例如,铃木氏果蝇(Drosophila suzukii)和其他果蝇属物种(Drosophilaspp.)、地中海实蝇(Ceratitis capitata)、果实蝇属物种(Bactrocera spp.))、潜叶虫(斑潜蝇属物种(Liriomyza spp.))和蠓(例如,黑森瘿蚊(Mayetiola destructor))。
造成农业损害的其他无脊椎动物包括以植物为食的螨虫,例如,两斑螨虫或红蜘蛛螨虫(二斑叶螨(Tetranychus urticae))和云杉蜘蛛螨虫(针叶小爪螨(Oligonychusunungui));各种线虫或蛔虫,例如,根结线虫属物种(Meloidogyne spp.),包括南方根结线虫(M.incognita)(南方根结)、象耳豆根结线虫(M.enterlobii)(番石榴根结)、爪哇根结线虫(M.javanica)(爪哇根结)、北方根结线虫(M.hapla)(北方根结)、和花生根结线虫(M.arenaria)(花生根结),长针线虫属物种(Longidorus spp.),滑刃线虫属物种(Aphelenchoides spp.),茎线虫属物种(Ditylenchus spp.),马铃薯金线虫(Globoderarostochiensis)和其他球孢囊线虫属物种(Globodera spp.),真珠线虫属物种(Nacobbusspp.),异皮线虫属物种(Heterodera spp.),松材线虫(Bursaphelenchus xylophilus)和其他伞滑刃线虫属物种(Bursaphelenchus spp.),短体线虫属物种(Pratylenchus spp.),毛刺线虫属物种(Trichodorus spp.),标记剑线虫(Xiphinema index),异尾剑线虫(Xiphinema diversicaudatum)和其他剑线虫属物种(Xiphinema spp.);以及蜗牛和蛞蝓(例如,颈蛞蝓属物种(Deroceras spp.)、褐色蛞蝓(Vaginulus plebius)、和Veronicaleydigi)。
有害生物无脊椎动物还包括破坏人造结构或食品储藏、或以其他方式造成滋扰的那些,例如,干木和地下白蚁、木蚁、象鼻虫(例如,三齿豆象属物种(Acanthoscelidesspp.)、瘤背豆象属物种(Callosobruchus spp.)、象鼻属物种(Sitophilus spp.))、面粉甲虫(赤拟谷盗(Tribolium castaneum)、杂拟谷盗(Tribolium confusum))和其他甲虫(例如,药材甲(Stegobium paniceum)、谷斑皮蠹、锯谷盗属物种(Oryzaephilus spp.))、飞蛾(例如大蜡螟,其破坏蜂箱;印度谷斑螟(Plodia interpunctella),地中海粉螟(Ephestiakuehniella),谷蛾属物种(Tinea spp.),幕谷蛾属物种(Tineola spp.))、蠹虫、和螨虫(例如,粗脚粉螨(Acarus siro)、粉尘螨(Glycophagus destructor)。
许多无脊椎动物被认为是人或兽的有害生物(如叮咬或寄生于人或其他动物的无脊椎动物),并且许多是致病微生物(例如,细菌、病毒)的载体。这些的实例包括双翅目,如叮咬苍蝇和蠓(例如,白蛉属物种(Phlebotomus spp.)、罗蛉属物种(Lutzomyia spp.)、虻属物种(Tabanus spp.)、斑虻属物种(Chrysops spp.)、麻虻属物种(Haematopota spp.)、蚋属物种(Simulium spp.))和绿头苍蝇(螺旋锥蝇(screwworm flies))(例如,次生锥蝇(Cochliomyia macellaria)、美洲锥蝇(C.hominivorax)、C.aldrichi和C.minima(极小锥蝇);还有红颜金蝇(Chrysomya rufifacies)和大头金蝇(Chrysomya megacephala)、采采蝇(舌蝇属物种(Glossina spp.))、肤蝇(人肤蝇(Dermatobia hominis)、皮蝇属物种(Dermatobia spp.));蚊子(例如,伊蚊属物种(Aedes spp.)、按蚊属物种(Anophelesspp.)、库蚊属物种(Culex spp.)、脉毛蚊属物种(Culiseta spp.));臭虫(例如,温带臭虫(Cimex lectularius)、热带臭虫(Cimex hemipterus))和“接吻虫”(锥猎蝽属物种(Triatoma spp.));昆虫虱目(Phthiraptera)(吸虱和嚼虱,例如,人虱(Pediculushumanus)、耻阴虱(Pthirus pubis))和蚤目(Siphonaptera)(跳蚤,例如穿皮潜蚤(Tungapenetrans))的成员。寄生蛛形纲也包括重要的疾病载体;实例包括蜱(例如,肩突硬蜱(Ixodes scapularis)、太平洋硬蜱(Ixodes pacificus)、蓖子硬蜱(Ixodes ricinus)、Ixodes cookie、美洲花蜱(Amblyomma americanum)、海湾花蜱(Amblyomma maculatum)、变异革蜱(Dermacentor variabilis)、安氏革蜱(Dermacentor andersoni)、白纹革蜱(Dermacentor albipictus)、血红扇头蜱(Rhipicephalus sanguineus)、微小扇头蜱(Rhipicephalus microplus)、具环牛蜱(Rhipicephalus annulatus)、长角血蜱(Haemaphysalis longicornis)、和璃眼蜱属物种(Hyalomma spp.))和螨虫,这些螨虫包括疥螨(人疥螨(Sarcoptes scabiei)和其他疥螨属物种(Sarcoptes spp.))、马痒螨(痒螨属物种(Psoroptes spp.))、恙螨(阿氏真恙螨(Trombicula alfreddugesi)、秋恙螨(Trombicula autumnalis))、蠕形螨(毛囊蠕形螨(Demodex folliculorum)、皮脂蠕形螨(Demodex brevis)、犬蠕形螨(Demodex canis))、蜂螨(例如,狄斯瓦蜂螨(Varroadestructor)、大蜂螨(Varroa jacobosoni)和其他蜂螨属物种(Varroa spp.))、气管螨(武氏蜂盾螨(Acarapis woodi))和厉螨属物种(Tropilaelaps spp.)。可以感染人和/或非人动物的寄生虫包括外寄生虫(如水蛭(环节动物的一种类型))和内寄生虫,统称为“蠕虫”,其感染消化道、皮肤、肌肉、或其他组织或器官。蠕虫包括环节动物门(环形虫或节肢虫)、扁形动物门(扁虫,例如绦虫、吸虫)、线虫动物门(蛔虫)、和棘头动物门(Acanthocephala)(棘头虫)的成员。寄生线虫的实例包括人蛔虫(Ascaris lumbricoides)、蛔虫属物种(Ascarisspp.)、副蛔属物种(Parascaris spp.)、贝蛔属物种(Baylisascaris spp.)、马来丝虫(Brugia malayi)、帝纹丝虫(Brugia timori)、班氏丝虫(Wuchereria bancrofti)、罗阿丝虫(Loa loa)、卷尾丝虫(Mansonella streptocerca)、奥氏曼森线虫(Mansonellaozzardi)、常现丝虫(Mansonella perstans)、盘尾丝虫(Onchocerca volvulus)、犬恶丝虫(Dirofilaria immitis)和其他恶丝虫属物种(Dirofilaria spp.)、麦地那龙线虫(Dracunculus medinensis)、十二指肠钩虫(Ancylostoma duodenale)、锡兰钩口线虫(Ancyclostoma celanicum)、和其他钩虫属物种(Ancylostoma spp.)、美洲板口线虫(Necator americanus)和其他板口线虫属物种(Necator spp.)、管圆属物种(Angriostrongylus spp.)、狭头刺口钩虫(Uncinaria stenocephala)、牛仰口线虫(Bunostomum phlebotomum)、蠕形住肠蛲虫(Enterobius vermicularis)、格氏蛲虫(Enterobius gregorii)和其他蛲虫属物种(Enterobius spp.)、粪类圆线虫(Strongyloides stercoralis)、福氏类圆线虫(Strongyloides fuelleborni)、乳突类圆线虫(Strongyloides papillosus)、兰氏类圆线虫(Strongyloides ransomi)和其他类圆线虫属物种(Strongyloides spp.)、加利福尼亚吸吮线虫(Thelazia californiensis)、结膜吸吮线虫(Thelazia callipaeda)、毛首鞭虫(Trichuris trichiura)、犬鞭虫(Trichuris vulpis)、旋毛虫(Trichinella spiralis)、布氏旋毛虫(Trichinellabritovi)、纳氏旋毛虫(Trichinella nelson)、本地毛形线虫(Trichinella nativa)、犬弓蛔虫(Toxocara canis)、猫蛔虫(Toxocara cati)、狮弓蛔虫(Toxascaris leonina)、班氏丝虫(Wuchereria bancrofti)、和捻转血矛线虫(Haemonchus contortus)。寄生扁形动物的实例包括牛肉绦虫(Taenia saginata)、猪肉绦虫(Taenia solium)、多头绦虫(Taeniamulticeps)、阔节裂头绦虫(Diphyllobothrium latum)、细粒棘球绦虫(Echinococcusgranulosus)、多房棘球绦虫(Echinococcus multilocularis)、伏氏棘球绦虫(Echinococcus vogeli)、少节棘球绦虫(Echinococcus oligarthrus)、短膜壳绦虫(Hymenolepis nana)、缩小膜壳绦虫(Hymenolepis diminuta)、欧猥迭宫绦虫(Spirometraerinaceieuropaei)、埃及血吸虫(Schistosoma haematobium)、曼氏血吸虫(Schistosomamansoni)、日本血吸虫(Schistosoma japonicum)、间插血吸虫(Schistosomaintercalatum)、湄公血吸虫(Schistosoma mekongi)、布氏姜片虫(Fasciolopis buski)、异形异形吸虫(Heterophyes heterophyes)、肝片吸虫(Fasciola hepatica)、大片吸虫(Fasciola gigantica)、华支睾吸虫(Clonorchis sinensis)、Clonorchis vivirrini、支双腔吸虫(Dicrocoelium dendriticum)、拟人腹盘吸虫(Gastrodiscoides hominis)、横川后殖吸虫(Metagonimus yokogawai)、结合次睾吸虫(Metorchis conjunctus)、麝猫后睾吸虫(Opisthorchis viverrine)、猫后睾吸虫(Opisthorchis felineus)、卫氏并殖吸虫(Paragonimus westermani)、非洲并殖吸虫(Paragonimus africanus)、并殖吸虫属物种(Paragonimus spp.)、多刺棘口吸虫(Echinostoma echinatum)、和regenti毛毕吸虫(Trichobilharzia regenti)。
内寄生的原生动物无脊椎动物包括棘阿米巴属物种(Axanthamoeba spp.)、巴氏阿米巴(Balamuthia mandrillaris)、分歧巴贝斯虫(Babesia divergens)、双芽巴贝斯虫(Babesia bigemina)、马巴贝斯虫(Babesia equi)、微小巴贝斯虫(Babesia microfti)、邓肯巴贝斯虫(Babesia duncani)、结肠小袋纤毛虫(Balantidium coli)、芽囊原虫属物种(Blastocystis spp.)、隐孢子虫属物种(Cryptosporidium spp.)、卡耶塔环孢子虫(Cyclospora cayetanensis)、脆双核阿米巴(Dientamoeba fragili)、溶组织内阿米巴(Entamoeba histolytica)、蓝氏贾第鞭毛虫(Giardia lamblia)、贝氏等孢球虫(Isosporabelli)、利什曼虫属物种(Leishmania spp.)、福氏耐格里阿米巴(Naegleria fowleri)、恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、三日疟原虫(Plasmodium malariae)、卵形疟原虫柯氏亚种(Plasmodium ovale curtisi)、卵形疟原虫沃氏亚种(Plasmodium ovale wallikeri)、诺氏疟原虫(Plasmodium knowlesi)、西伯氏鼻孢子虫(Rhinosporidium seeberi)、肉孢子虫属物种(Sarcosystis spp.)、刚地弓形虫(Toxoplasma gondii)、阴道毛滴虫(Trichomonas vaginalis)、布氏锥虫(Trypanosomabrucei)、克氏锥虫(Trypanosoma cruzi)。
如本文使用的,术语“治疗(treat或treating)”是指对受试者的疾病或障碍(例如,感染性疾病、癌症、中毒、或过敏反应)的预防性或治疗性治疗。治疗的效果可以包括如与没有治疗性治疗的情况下该疾病或障碍的状态和/或病症相比,逆转、减轻、降低疾病的严重程度,治愈疾病,抑制疾病的进展,降低该疾病、或该疾病或障碍的一种或多种症状或表现的复发的可能性,稳定(即,不恶化)该疾病或障碍的状态,和/或预防该疾病或障碍的传播。实施例包括治疗植物以控制由无脊椎有害生物或微生物(例如,细菌、真菌、卵菌、或病毒)病原体引起或与之相关的疾病或不利病症。实施例包括治疗植物以增加植物的先天防御或免疫能力以耐受有害生物或病原体压力。
如本文使用的,术语“终止元件”是终止环状或线性多核糖核苷酸中编码序列的翻译的部分,如核酸序列。
如本文使用的,术语“翻译效率”是从核糖核苷酸转录物产生蛋白质或肽的速率或量。在一些实施例中,翻译效率可以表示为给定量的编码蛋白或肽的转录物产生的蛋白或肽的量,例如在给定的时间段内,例如在给定的翻译系统(例如像原核细胞的原核系统)中。
如本文使用的,术语“翻译起始序列”是在环状或线性多核糖核苷酸中起始编码序列的翻译的核酸序列。
如本文使用的,术语“治疗性多肽”是指当向受试者施用或在受试者中表达时提供一些治疗性益处的多肽。在实施例中,通过向受试者施用治疗性肽或通过在受试者中表达治疗性多肽,将治疗性多肽用于治疗或预防受试者的疾病、障碍、或病症。在替代性的实施例中,使治疗性多肽在细胞中表达,并且向受试者施用该细胞以提供治疗性益处。
如本文使用的,“载体”意指一段DNA,它是合成的(例如,使用PCR),或取自外来DNA片段可以或已经插入其中用于克隆和/或表达目的的病毒、质粒、或高等生物体的细胞。在一些实施例中,载体可以稳定地维持在生物体中。载体可以包括例如复制的起点、可选择标志物或报告基因,如抗生素抗性或GFP、和/或多克隆位点(MCS)。该术语包括线性DNA片段(例如,PCR产物、线性化质粒片段)、质粒载体、病毒载体、粘粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)等。在一个实施例中,本文提供的载体包括多克隆位点(MCS)。在另一实施例中,本文提供的载体不包括MCS。
从以下详细说明以及权利要求中,本发明的其他特征和优点将会是显而易见的。
附图说明
附图旨在说明本披露的一个或多个特征、方面或实施例,而非旨在进行限制。
图1是描绘设计示例性DNA构建体以产生连接酶相容的线性RNA以及后续通过在原核宿主细胞中使该连接酶相容的线性RNA与RNA连接酶接触而环化的示意图。
图2是描绘转录DNA构建体以产生连接酶相容的线性RNA和转录DNA构建体以产生RNA连接酶、以及后续通过在原核宿主细胞中使该连接酶相容的线性RNA与异源性RNA连接酶接触而环化的示意图。
图3示出了RNA样品的PCR扩增,其表明在大肠杆菌中成功产生环化RNA。单个条带指示线性前体的表达和对预测的“单位长度”扩增子的正确核酶加工。阶梯样的图案指示环化,观察到较高分子量的条带,这表明由于在环化RNA分子周围扩增两次,导致两倍单位长度的扩增子。测试了两种构建体:min1(“单位长度”或核酶加工后的长度为275nt;两倍单位长度是550nt)和min2(“单位长度”是128nt;两倍单位长度是256nt)。泳道1:min1,体外转录,无连接酶。泳道2:min2,体外转录,无连接酶。泳道3:min1,体外转录,具有RtcB连接酶。泳道4:min2,体外转录,具有RtcB连接酶。泳道5:min1,在大肠杆菌中体内转录。泳道6:min2,在大肠杆菌中体内转录。
具体实施方式
总体来说,本披露提供了用于产生、纯化、和使用来自原核系统的环状RNA的组合物和方法。
多核苷酸
本披露的特点在于环状多核糖核苷酸组合物和制备环状多核糖核苷酸的方法。
在实施例中,环状多核糖核苷酸从线性多核糖核苷酸(例如,通过连接线性多核糖核苷酸的连接酶相容的末端)产生。在实施例中,线性多核糖核苷酸从脱氧核糖核苷酸模板(例如,载体、线性化载体、或cDNA)转录。因此,本披露的特点在于可用于产生环状多核糖核苷酸的脱氧核糖核苷酸、线性多核糖核苷酸、和环状多核糖核苷酸组合物。
模板脱氧核糖核苷酸
本披露的特点在于用于制备环状RNA的脱氧核糖核苷酸。该脱氧核糖核苷酸包括以5'至3'方向可操作地连接的以下项:(A)5'自切割核酶;(B)5'退火区;(C)多核糖核苷酸负载物;(D)3'退火区;和(E)3'自切割核酶。在实施例中,该脱氧核糖核苷酸包括例如在元件(A)、(B)、(C)、(D)和(E)中的任一者之外或之间的另外的元件。在实施例中,如本文所述,元件(A)、(B)、(C)、(D)和/或(E)中的任一者通过间隔子序列隔开。图1提供了示例性模板脱氧核糖核苷酸的设计。
在实施例中,该脱氧核糖核苷酸是例如环状DNA载体、线性化DNA载体、或线性DNA(例如,(例如从DNA载体产生的)cDNA)。
在一些实施例中,该脱氧核糖核酸进一步包括与编码本文所述的线性RNA的序列可操作地连接的RNA聚合酶启动子。在实施例中,该RNA聚合酶启动子与编码该线性RNA的序列是异源的。在一些实施例中,该RNA聚合酶启动子是T7启动子、T6启动子、T4启动子、T3启动子、SP6病毒启动子、或SP3启动子。
在一些实施例中,该脱氧核糖核苷酸包括多克隆位点(MCS)。
在一些实施例中,使用该脱氧核糖核苷酸产生大小范围为约100至约20,000个核苷酸的环状RNA。在一些实施例中,该环状RNA的大小是至少100、500、550、600、650、700、750、800、850、900、950、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、1,900、2,000、2,500、3,000、3,500、4,000、4,500、或5,000个核苷酸。在一些实施例中,该环状RNA的大小不多于20,000、15,000、10,000、9,000、8,000、7,000、6,000、5,000或4,000个核苷酸。
前体线性多核糖核苷酸
本披露的特点还在于以5'至3'方向可操作地连接的包括以下的线性多核糖核苷酸(例如,前体线性多核糖核苷酸):(A)5'自切割核酶;(B)5'退火区;(C)多核糖核苷酸负载物;(D)3'退火区;和(E)3'自切割核酶。该线性多核糖核苷酸可以包括例如在元件(A)、(B)、(C)、(D)和(E)中的任一者之外或之间的另外的元件。例如,如本文所述,元件(A)、(B)、(C)、(D)和/或(E)中的任一者可以由间隔子序列隔开。
在某些实施例中,本文提供了使用本文提供的脱氧核糖核苷酸(例如,载体、线性化载体、或cDNA)作为模板(例如,本文提供的RNA聚合酶启动子置于编码线性RNA的区的上游的载体、线性化载体、或cDNA)通过在原核系统中进行转录(例如,体内转录)来生成前体线性RNA的方法。
图2是描绘用于从前体线性RNA产生环状RNA的示例性过程的示意图。例如,可以转录脱氧核糖核苷酸模板以产生前体线性RNA。在表达时,在合适的条件下,并且不按特定的顺序,5'和3'自切割核酶各自经历切割反应,从而产生连接酶相容的末端(例如,5'-羟基和2',3'-环磷酸)并且5'和3'退火区使游离端靠近。因此,前体线性多核糖核苷酸产生连接酶相容的多核糖核苷酸,其可以被连接(例如,在连接酶存在下)以产生环状多核糖核苷酸。
连接酶相容的线性多核糖核苷酸
本披露的特点还在于以5'至3'方向可操作地连接的包括以下的线性多核糖核苷酸(例如,连接酶相容的线性多核糖核苷酸):(B)5'退火区;(C)多核糖核苷酸负载物;以及(D)3'退火区。该线性多核糖核苷酸可以包括例如在元件(B)、(C)、和(D)中的任一者之外或之间的另外的元件。例如,如本文所述,任何元件(B)、(C)、和/或(D)可以通过间隔子序列隔开。
在一些实施例中,该连接酶相容的线性多核糖核苷酸包括游离的5’-羟基基团。在一些实施例中,该连接酶相容的线性多核糖核苷酸包括游离的2’,3’-环磷酸。
在一些实施例中,并且在合适的条件下,3'退火区和5'退火区促进游离的3'和5'端的缔合(例如,通过导致热力学有利的缔合的部分或完全互补,例如杂交)。
在一些实施例中,在5'端处的游离的羟基与在3'端处的游离的2',3'-环磷酸的靠近有利于通过连接酶识别进行识别,从而改善环化的效率。
环状多核糖核苷酸
在一些实施例中,本披露提供了环状RNA。
在一些实施例中,该环状RNA包括第一退火区、多核苷酸负载物、和第二退火区。在一些实施例中,该第一退火区与该第二退火区连接,从而形成环状多核糖核苷酸。
在一些实施例中,该环状RNA由本文所述的脱氧核糖核苷酸模板、前体线性RNA、和/或连接酶相容的线性RNA产生(参见例如,图2)。在一些实施例中,该环状RNA通过本文所述的任一方法产生。
在一些实施例中,该环状多核糖核苷酸是至少约20个核苷酸、至少约30个核苷酸、至少约40个核苷酸、至少约50个核苷酸、至少约75个核苷酸、至少约100个核苷酸、至少约200个核苷酸、至少约300个核苷酸、至少约400个核苷酸、至少约500个核苷酸、至少约1,000个核苷酸、至少约2,000个核苷酸、至少约5,000个核苷酸、至少约6,000个核苷酸、至少约7,000个核苷酸、至少约8,000个核苷酸、至少约9,000个核苷酸、至少约10,000个核苷酸、至少约12,000个核苷酸、至少约14,000个核苷酸、至少约15,000个核苷酸、至少约16,000个核苷酸、至少约17,000个核苷酸、至少约18,000个核苷酸、至少约19,000个核苷酸或至少约20,000个核苷酸。
在一些实施例中,该环状多核糖核苷酸具有足够的大小以容纳核糖体的结合位点。在一些实施例中,环状多核糖核苷酸的大小是足以编码有用的多肽的长度,例如,至少20,000个核苷酸、至少15,000个核苷酸、至少10,000个核苷酸、至少7,500个核苷酸、至少5,000个核苷酸、至少4,000个核苷酸、至少3,000个核苷酸、至少2,000个核苷酸、至少1,000个核苷酸、至少500个核苷酸、至少1400个核苷酸、至少300个核苷酸、至少200个核苷酸、或至少100个核苷酸。
在一些实施例中,该环状多核糖核苷酸包括一个或多个本文其他处所述的元件。在一些实施例中,这些元件可以通过间隔子序列彼此隔开。在一些实施例中,这些元件可以被1个核糖核苷酸、2个核苷酸、约5个核苷酸、约10个核苷酸、约15个核苷酸、约20个核苷酸、约30个核苷酸、约40个核苷酸、约50个核苷酸、约60个核苷酸、约80个核苷酸、约100个核苷酸、约150个核苷酸、约200个核苷酸、约250个核苷酸、约300个核苷酸、约400个核苷酸、约500个核苷酸、约600个核苷酸、约700个核苷酸、约800个核苷酸、约900个核苷酸、约1000个核苷酸、最多约1kb、至少约1000个核苷酸、或其间任意量的核苷酸彼此隔开。在一些实施例中,一个或多个元件彼此邻接,例如,缺少间隔子元件。
在一些实施例中,环状多核糖核苷酸可以包括一个或多个本文其他处所述的重复元件。在一些实施例中,环状多核糖核苷酸包括一个或多个本文其他处所述的修饰。在一个实施例中,环状RNA含有至少一个核苷修饰。在一个实施例中,高达100%的环状RNA的核苷被修饰。在一个实施例中,至少一个核苷修饰是尿苷修饰或腺苷修饰。
作为其环化的结果,环状多核糖核苷酸可以包括某些使其区别于线性RNA的特征。例如,如与线性RNA相比,环状多核糖核苷酸较不易被核酸外切酶降解。这样,环状多核糖核苷酸比线性RNA更稳定,尤其是在核酸外切酶存在下孵育时。环状多核糖核苷酸与线性RNA相比的增加的稳定性使得环状多核糖核苷酸作为产生多肽的细胞转化试剂更加有用,并且与线性RNA相比,存储更容易且时间更长。可以使用本领域标准的方法测试用核酸外切酶处理的环状多核糖核苷酸的稳定性,这些方法确定是否已经发生RNA降解(例如,通过凝胶电泳)。此外,与线性RNA不同,当环状多核糖核苷酸与磷酸酶(如小牛肠磷酸酶)一起孵育时,环状多核糖核苷酸较不易去磷酸化。
核酶
本文所述的多核苷酸组合物可包括一种或多种自切割核酶,例如本文所述的一种或多种自切割核酶。核酶是催化RNA或RNA的催化区。自切割核酶是能够催化在核酶序列自身内的核苷酸位点处或在核酶序列自身的末端处发生的切割反应的核酶。
示例性自切割核酶是本领域已知的和/或在本文中提供。示例性自切割核酶包括锤头状、发夹状、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)、glmS核酶、扭转核酶、扭转姐妹核酶、斧头核酶和手枪核酶。另外的示例性自切割核酶在下文描述。在一些实施例中,该5'自切割核酶是锤头状核酶。
在一些实施例中,本披露的多核糖核苷酸包括第一(例如,5')自切割核酶。在一些实施例中,该核酶选自本文所述的任一核酶。在一些实施例中,本披露的多核糖核苷酸包括第二(例如,3')自切割核酶。在一些实施例中,该核酶选自本文所述的任一核酶。
在一些实施例中,该5'和3'自切割核酶共享至少80%、85%、90%、95%、98%、或99%的序列同一性。在一些实施例中,该5'和3'自切割核酶来自相同的自切割核酶家族。在一些实施例中,该5'和3'自切割核酶共享100%的序列同一性。
在一些实施例中,该5'和3'自切割核酶共享低于100%、99%、95%、90%、85%、或80%的序列同一性。在一些实施例中,该5'和3'自切割核酶并非来自相同的自切割核酶家族。
在一些实施例中,该5'自切割核酶的切割产生在对应的线性多核糖核苷酸上的游离的5'-羟基残基。在一些实施例中,该5'自切割核酶能够在位于该5'自切割核酶的3'端的10个核糖核苷酸内的位点处或在位于该5'自切割核酶的3'端的位点处进行自切割。
在一些实施例中,该3'自切割核酶的切割产生在对应的线性多核糖核苷酸上的游离的3'-羟基残基。在一些实施例中,该3'自切割核酶能够在位于该3'自切割核酶的5'端的10个核糖核苷酸内的位点处或在位于该3'自切割核酶的5'端的位点处进行自切割。
以下是本披露考虑的示例性自切割核酶。该列表不应被视为限制本披露的范围。
使用RFam鉴定以下自切割核酶家族。RFam是公共数据库,其含有对非编码RNA元件和序列的广泛注释,并且原则上是管理蛋白家族成员的PFam数据库的RNA类似物。RFam数据库的区别性特征在于结合一级序列信息,RNA二级结构是家庭成员的主要预测因子。非编码RNA基于从共同的祖先的进化分为多个家族。这些进化关系通过以下来确定:为推定的RNA家族建立共有的二级结构,然后执行专门版本的多序列比对。
扭转:扭转核酶(例如,扭转P1、P5、P3)被认为是小型自切割核酶家族的成员,该家族包括锤头状核酶、发夹状核酶、丁型肝炎病毒(HDV)核酶、Varkud卫星(VS)核酶、和glmS核酶。扭转核酶产生2',3'-环磷酸和5'羟基产物。对于扭转P1核酶的实例,参见http://rfam.xfam.org/family/RF03160;对于扭转P3核酶的实例,参见http://rfam.xfam.org/family/RF03154;并且对于扭转P5核酶的实例,参见http://rfam.xfam.org/family/RF02684。
扭转姐妹:扭转姐妹核酶(TS)是与扭转核酶家族具有结构相似性的自切割核酶。催化产物是环2',3'磷酸和5'-羟基基团。对于扭转姐妹核酶的实例,参见http://rfam.xfam.org/family/RF02681。
斧头:斧头核酶是通过生物信息学分析发现的自切割核酶。对于斧头核酶的实例,参见http://rfam.xfam.org/family/RF02678。
HDV:丁型肝炎病毒(HDV)核酶是丁型肝炎病毒中的自切割核酶。对于HDV核酶的实例,参见http://rfam.xfam.org/family/RF00094。
手枪核酶:手枪核酶是自切割核酶。手枪核酶是通过比较基因组分析发现的。通过质谱法发现产物含有5'-羟基和2',3'-环磷酸官能团。对于手枪核酶的实例,参见http://rfam.xfam.org/family/RF02679。
HHR 1型:锤头状核酶是在RNA分子内的特定位点处催化可逆的切割和连接反应的自切割核酶。对于HHR 1型核酶的实例,参见http://rfam.xfam.org/family/RF00163。
HHR 2型:锤头状核酶是在RNA分子内的特定位点处催化可逆的切割和连接反应的自切割核酶。对于HHR 2型核酶的实例,参见http://rfam.xfam.org/family/RF02276。
HHR 3型:锤头状核酶是在RNA分子内的特定位点处催化可逆的切割和连接反应的自切割核酶。这些RNA结构基序遍布自然界。对于HHR 3型核酶的实例,参见http://rfam.xfam.org/family/RF00008。
HH9:锤头状核酶是在RNA分子内的特定位点处催化可逆的切割和连接反应的自切割核酶。对于HH9核酶的实例,参见http://rfam.xfam.org/family/RF02275。
HH10:锤头状核酶是在RNA分子内的特定位点处催化可逆的切割和连接反应的自切割核酶。对于HH10核酶的实例,参见http://rfam.xfam.org/family/RF02277。
glmS:氨基葡萄糖-6-磷酸核糖开关核酶(glmS核酶)是驻留在glmS基因的mRNA转录物的5'非翻译区(UTR)中的RNA结构。对于glmS核酶的实例,参见http://rfam.xfam.org/family/RF00234。
GIR1:套索加帽(Lariat capping)核酶(以前称为GIR1分支核酶)是与组I核酶具有明显的相似之处的约180nt的核酶。对于GIR1核酶的实例,参见http://rfam.xfam.org/family/RF01807。
CPEB3:哺乳动物CPEB3核酶是位于CPEB3基因的第二内含子中的自切割非编码RNA。对于CPEB核酶的实例,参见http://rfam.xfam.org/family/RF00622。
drz-Agam 1和drz-Agam 2:drz-Agam-1和drz-Agam 2核酶是通过使用限制性结构描述符发现的,并且与HDV和CPEB3核酶非常相似。对于drz-Agam 1核酶的实例,参见http://rfam.xfam.org/family/RF01787,并且对于drz-Agam 2核酶的实例,参见http://rfam.xfam.org/family/RF01788。
发夹:发夹状核酶是可以充当核酶的一小部分RNA。与锤头状核酶相似,它见于植物病毒的RNA卫星中。对于发夹状核酶的实例,参见http://rfam.xfam.org/family/RF00173。
RAGATH-1:使用生物信息学算法发现的RNA结构基序。这些RNA与已知的核酶(如但不限于锤头状和HDV核酶)含有很强的相似性。对于RAGATH-1核酶的实例,参见http://rfam.xfam.org/family/RF03152。
RAGATH-5:使用生物信息学算法发现的RNA结构基序。这些RNA与已知的核酶(如但不限于锤头状和HDV核酶)含有很强的相似性。对于RAGATH-5核酶的实例,参见http://rfam.xfam.org/family/RF02685。
RAGATH-6:使用生物信息学算法发现的RNA结构基序。这些RNA与已知的核酶(如但不限于锤头状和HDV核酶)含有很强的相似性。对于RAGATH-6核酶的实例,参见http://rfam.xfam.org/family/RF02686。
RAGATH-13:使用生物信息学算法发现的RNA结构基序。这些RNA与已知的核酶(如但不限于锤头状和HDV核酶)含有很强的相似性。对于RAGATH-13核酶的实例,参见http://rfam.xfam.org/family/RF02688。
在一些实施例中,自切割核酶是本文所述的核酶(例如来自本文所述的类别)、或其催化活性片段或部分。在一些实施例中,核酶包括与SEQ ID NO:24-571中的任一者至少85%、90%、95%、96%、97%、98%、或99%相同的序列、或其对应的RNA等同物。在一些实施例中,自切割核酶是本文所述的核酶(例如来自本文所述的类别)、或其催化活性片段或部分。在一些实施例中,核酶包括与SEQ ID NO:24-571中的任一者至少95%、96%、97%、98%、或99%相同的序列、或其对应的RNA等同物。在一些实施例中,核酶包括SEQ ID NO:24-571中的任一者的序列、或其对应的RNA等同物。在实施例中,自切割核酶是SEQ ID NO:24-571中的任一者的核酶的片段、或其对应的RNA等同物,例如,含有完整核酶序列的至少20个邻接核苷酸(例如,至少20、25、30、35、40、45、50、55、或60个邻接核苷酸)并且具有完整核酶的至少30%(例如,至少约30%、40%、50%、60%、70%、75%、80%、85%、90%、或95%)的催化活性的片段。在一些实施例中,核酶包括SEQ ID NO:24-571中的任一者的催化区(例如,能够自切割的区域)、或其对应的RNA等同物,其中该区域的长度是至少10个核苷酸、20个核苷酸、30个核苷酸、40个核苷酸、或50个核苷酸,或该区域在10-200个核苷酸、10-100个核苷酸、10-50个核苷酸、10-30个核苷酸、10-200个核苷酸、20-100个核苷酸、20-50个核苷酸、20-30个核苷酸之间。
退火区
本文所述的多核苷酸组合物可包括两个或更多个退火区,例如两个或更多个本文所述的退火区。退火区或退火区对是含有具有在合适的条件下促进杂交的高度互补性的部分的那些。
退火区包括至少下文所述的互补区。该互补区的高度互补性促进退火区对的缔合。在第一退火区(例如,5'退火区)位于或接近线性RNA的5'端并且第二退火区(例如,3'退火区)位于或接近线性RNA的3'端的情况下,这些退火区的缔合使5'和3'末端靠近。在一些实施例中,这种缔合有利于通过5'和3'端的连接使线性RNA环化。
在实施例中,退火区进一步包括如下文所述的非互补区。可以将非互补区添加至互补区以允许RNA的末端保持灵活性、非结构化、或与互补区相比更少结构化。灵活和/或单链的游离的5'和3'端的可用性支持连接,并因此支持环化效率。
在一些实施例中,每个退火区包括2至100个核糖核苷酸(例如,2至80、2至50、2至30、2至20、10至100、10至80、10至50、或10至30个核糖核苷酸)。在一些实施例中,5'退火区包括2至100个核糖核苷酸(例如,2至80、2至50、2至30、2至20、10至100、10至80、10至50、或10至30个核糖核苷酸)。在一些实施例中,3'退火区包括2至100个核糖核苷酸(例如,2至80、2至50、2至30、2至20、10至100、10至80、10至50、或10至30个核糖核苷酸)。
互补区
互补区是在合适的条件下有利于与对应的互补区缔合的区。例如,一对互补区可以共享高度的序列互补性(例如,第一互补区至少部分是第二互补区的反向互补物)。当两个互补区缔合(例如,杂交)时,它们可以形成高度结构化的二级结构,如茎或茎环。
在一些实施例中,该多核糖核苷酸包括5'互补区和3'互补区。在一些实施例中,该5'互补区具有在2与50个之间的核糖核苷酸(例如,2-40、2-30、2-20、5-10、10-50、10-40、10-30、10-20、或20-50个核糖核苷酸)。在一些实施例中,该3'互补区具有在2与50个之间的核糖核苷酸(例如,2-40、2-30、2-20、2-10、10-50、10-40、10-30、10-20、或20-50个核糖核苷酸)。
在一些实施例中,该5'互补区和该3'互补区具有在50%与100%之间的序列互补性(例如,在60%-100%、70%-100%、80%-100%、90%-100%之间、或100%的序列互补性)。
在一些实施例中,该5'互补区和该3'互补区具有低于-5kcal/mol(例如,低于-10kcal/mol、低于-20kcal/mol、或低于-30kcal/mol)的结合自由能。
在一些实施例中,该5'互补区和该3'互补区具有至少10℃、至少15℃、至少20℃、至少30℃、至少40℃、至少50℃、至少60℃、至少70℃、至少80℃、或至少90℃的结合Tm。
在一些实施例中,该5'互补区和该3'互补区包括至少一个但不多于10个错配,例如10、9、8、7、6、5、4、3、或2个错配,或1个错配(即,当该5'互补区和该3'互补区相互杂交时)。例如,错配可以是5'互补区中的核苷酸和3'互补区中的核苷酸彼此相对(即,当该5'互补区和该3'互补区杂交时)但不形成沃森-克里克(Watson-Crick)碱基对。例如,错配可以是在5'互补区或3'互补区形成扭结或凸起的未配对的核苷酸。在一些实施例中,该5'互补区和该3'互补区不包括任何错配。
非互补区
非互补区是在合适的条件下不利于与对应的非互补区缔合的区。例如,一对非互补区可以共享低度的序列互补性(例如,第一非互补区不是第二非互补区的反向互补物)。当两个非互补区靠近时,它们不形成高度结构化的二级结构,如茎或茎环。
在一些实施例中,该多核糖核苷酸包括5'非互补区和3'非互补区。在一些实施例中,该5'非互补区具有在5与50个之间的核糖核苷酸(例如,5-40、5-30、5-20、5-10、10-50、10-40、10-30、10-20、或20-50个核糖核苷酸)。在一些实施例中,该3'非互补区具有在5与50个之间的核糖核苷酸(例如,5-40、5-30、5-20、5-10、10-50、10-40、10-30、10-20、或20-50个核糖核苷酸)。
在一些实施例中,该5'非互补区位于该5'互补区的5'(例如,在该5'自切割核酶与该5'互补区之间)。在一些实施例中,该3'非互补区位于该3'互补区的3'(例如,在该3'互补区与该3'自切割核酶之间)。
在一些实施例中,该5'非互补区和该3'非互补区具有在0%与50%之间的序列互补性(例如,在0%-40%、0%-30%、0%-20%、0%-10%之间、或0%的序列互补性)。
在一些实施例中,该5'非互补区和该3'非互补区具有大于-5kcal/mol的结合自由能。
在一些实施例中,该5'互补区和该3'互补区具有低于10℃的结合Tm。
在一些实施例中,该5'非互补区和该3'非互补区包括至少1、2、3、4、5、6、7、8、9、或10个错配。
多核糖核苷酸负载物
本文所述的多核糖核苷酸负载物包括含有至少一个多核糖核苷酸的任何序列。
例如,多核糖核苷酸负载物可以包括至少约40个核苷酸、至少约50个核苷酸、至少约75个核苷酸、至少约100个核苷酸、至少约200个核苷酸、至少约300个核苷酸、至少约400个核苷酸、至少约500个核苷酸、至少约1,000个核苷酸、至少约2,000个核苷酸、至少约5,000个核苷酸、至少约6,000个核苷酸、至少约7,000个核苷酸、至少约8,000个核苷酸、至少约9,000个核苷酸、至少约10,000个核苷酸、至少约12,000个核苷酸、至少约14,000个核苷酸、至少约15,000个核苷酸、至少约16,000个核苷酸、至少约17,000个核苷酸、至少约18,000个核苷酸、至少约19,000个核苷酸、或至少约20,000个核苷酸。在一些实施例中,该多核糖核苷酸负载物包括1-20,000个核苷酸、1-10,000个核苷酸、1-5,000个核苷酸、100-20,000个核苷酸、100-10,000个核苷酸、100-5,000个核苷酸、500-20,000个核苷酸、500-10,000个核苷酸、500-5,000个核苷酸、1,000-20,000个核苷酸、1,000-10,000个核苷酸、或1,000-5,000个核苷酸。
在实施例中,该多核糖核苷酸负载物包括一个或多个编码(或表达)序列,其中每个编码序列编码多肽。在实施例中,该多核糖核苷酸负载物包括一个或多个非编码序列。在实施例中,该多核糖核苷酸负载物完全由一个或多个非编码序列组成。在实施例中,该多核糖核苷酸负载物包括编码(或表达)序列和非编码序列的组合。
在实施例中,该多核糖核苷酸负载物包括单个编码序列的多个拷贝(例如,2、3、4、5、6、7、8、9、10、或甚至多于10个)。例如,该多核糖核苷酸可包括编码单个蛋白质的序列的多个拷贝。在其他实施例中,该多核糖核苷酸负载物包括两个或更多个(例如,2、3、4、5、6、7、8、9、10、或多于10个)不同的编码序列中每个编码序列的至少一个拷贝(例如,1、2、3、4、5、6、7、8、9、10、或甚至多于10个拷贝)。例如,该多核苷酸负载物可以包括第一编码序列的两个拷贝和第二编码序列的三个拷贝。
在实施例中,该多核糖核苷酸负载物包括至少一个非编码序列的一个或多个拷贝。在实施例中,至少一个非编码RNA序列包括至少一个选自由以下组成的组的RNA:RNA适配体、长非编码RNA(lncRNA)、转移RNA衍生的片段(tRF)、转移RNA(tRNA)、核糖体RNA(rRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、和Piwi相互作用RNA(piRNA);或这些RNA中的任一者的片段。在实施例中,至少一个非编码RNA序列包括至少一个调节RNA,例如至少一个选自由以下组成的组的RNA:微小RNA(miRNA)或miRNA前体(参见例如,美国专利号8,395,023、8,946,511、8,410,334或10,570,414)、微小RNA识别位点(参见例如,美国专利号8,334,430或10,876,126)、小干扰RNA(siRNA)或siRNA前体(如但不限于形成RNA发夹或RNA茎环或RNA茎的RNA序列)(参见例如,美国专利号8,404,927或10,378,012)、小RNA识别位点(参见例如,美国专利号9,139,838)、反式作用siRNA(ta-siRNA)或ta-siRNA前体(参见例如,美国专利号8,030,473)、相位sRNA或相位RNA前体(参见例如,美国专利号8,404,928)、相位sRNA识别位点(参见例如,美国专利号9,309,512)、miRNA诱饵(参见例如,美国专利号8,946,511或10,435,686)、miRNA切割阻断剂(参见例如,美国专利号9,040,774)、顺式作用核糖开关、反式作用核糖开关、和核酶;所有这些引用的美国专利都以其全文并入本文。在实施例中,至少一个非编码RNA序列包括与靶序列(例如,由信使RNA编码或由受试者基因组的DNA编码的靶序列)互补或反义的RNA序列;这种RNA序列可用于例如通过沃森-克里克碱基配对识别靶序列并与靶序列结合。在实施例中,该多核糖核苷酸负载物包括单个非编码序列的多个拷贝(例如,2、3、4、5、6、7、8、9、10、或甚至多于10个)。例如,该多核糖核苷酸可以包括编码单个微小RNA前体的序列的多个拷贝或指导RNA序列的多个拷贝。在其他实施例中,该多核糖核苷酸负载物包括两个或更多个(例如,2、3、4、5、6、7、8、9、10、或多于10个)不同的非编码序列中每个非编码序列的至少一个拷贝(例如,1、2、3、4、5、6、7、8、9、10、或甚至多于10个拷贝)。在一个实例中,该多核苷酸负载物包括第一非编码序列的两个拷贝和第二非编码序列的三个拷贝。在另一实例中,该多核糖核苷酸负载物包括两个或更多个不同miRNA前体中的每个miRNA前体的至少一个拷贝。在另一实例中,该多核糖核苷酸负载物包括(a)与靶序列互补或反义的RNA序列,和(b)核酶或适配体。
在一些实施例中,如本文所述制备的环状多核糖核苷酸在疗法和/或农业中用作效应子。在实施例中,该环状多核糖核苷酸包括多核苷酸负载物,该多核苷酸负载物包括对受试者具有生物学作用的非编码RNA序列。在实施例中,该环状多核糖核苷酸包括多核苷酸负载物,该多核苷酸负载物包括编码对受试者具有生物学作用的多肽的RNA序列。在一些实施例中,该多核糖核苷酸负载物包含编码多肽并且具有经密码子优化用于在受试者中表达的核苷酸序列的RNA序列。例如,可以向受试者施用通过本文所述的方法(例如,本文所述的原核方法)制备的环状多核糖核苷酸(例如,在药物、兽用、或农业组合物中)。在另一实例中,可以将通过本文所述的方法(例如,本文所述的原核方法)制备的环状多核糖核苷酸递送至细胞。
在一些实施例中,环状多核糖核苷酸包括如国际专利公开号WO 2019/118919(通过引用以其全文特此并入本文)中披露的任何特征或特征的任何组合。
多肽编码序列
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括一个或多个编码序列,其中每个编码序列编码多肽。在一些实施例中,该环状多核糖核苷酸包括两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个编码序列。
每个被编码的多肽可以是直链或支链的。在各种实施例中,多肽具有以下长度:从约5个至约40,000个氨基酸、约15个至约35,000个氨基酸、约20个至约30,000个氨基酸、约25个至约25,000个氨基酸、约50个至约20,000个氨基酸、约100个至约15,000个氨基酸、约200个至约10,000个氨基酸、约500个至约5,000个氨基酸、约1,000至约2,500个氨基酸、或其间的任何范围。在一些实施例中,多肽具有以下长度可能是有用的:少于约40,000个氨基酸、少于约35,000个氨基酸、少于约30,000个氨基酸、少于约25,000个氨基酸、少于约20,000个氨基酸、少于约15,000个氨基酸、少于约10,000个氨基酸、少于约9,000个氨基酸、少于约8,000个氨基酸、少于约7,000个氨基酸、少于约6,000个氨基酸、少于约5,000个氨基酸、少于约4,000个氨基酸、少于约3,000个氨基酸、少于约2,500个氨基酸、少于约2,000个氨基酸、少于约1,500个氨基酸、少于约1,000个氨基酸、少于约900个氨基酸、少于约800个氨基酸、少于约700个氨基酸、少于约600个氨基酸、少于约500个氨基酸、少于约400个氨基酸、少于约300个氨基酸、或更少。
本文包括的多肽可以包括天然存在的多肽或非天然存在的多肽。在实施例中,该多肽是参考多肽的功能性片段或变体(例如,酶的酶解活性片段或变体)或包括参考多肽的功能性片段或变体(例如,酶的酶解活性片段或变体)。例如,该多肽可以是本文所述的任一多肽的功能活性变体,例如在指定区或整个序列上与本文所述的多肽或天然存在的多肽的序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性。在一些情况下,该多肽可以与目的蛋白具有至少50%(例如,至少50%、60%、70%、80%、90%、95%、97%、99%、或更大)同一性。
多肽的一些实例包括但不限于荧光标签或标志物、抗原、治疗性多肽、或用于农业应用的多肽。
治疗性多肽可以是激素、神经递质、生长因子、酶(例如,氧化还原酶、代谢酶、线粒体酶、加氧酶、脱氢酶、不依赖ATP的酶、溶酶体酶、去饱和酶)、细胞因子、抗原结合多肽(例如,抗原结合抗体或抗体样片段,如单链抗体、纳米抗体或其他含有Ig重链和/或轻链的多肽)、Fc融合蛋白、抗凝剂、血液因子、骨形态发生蛋白、干扰素、白细胞介素、和溶栓剂。
在一些情况下,环状多核糖核苷酸表达非人蛋白。
用于农业应用的多肽可以是细菌素、溶素、抗微生物多肽、抗真菌多肽、富含结节C的肽、细菌性细胞调节肽、肽毒素、杀有害生物多肽(例如,杀昆虫多肽和/或杀线虫多肽)、抗原结合多肽(例如,抗原结合抗体或抗体样片段,如单链抗体、纳米抗体或其他含有Ig重链和/或轻链的多肽)、酶(例如,核酸酶、淀粉酶、纤维素酶、肽酶、脂肪酶、几丁质酶)、肽信息素、和转录因子。
在一些实施例中,环状多核糖核苷酸表达抗体,例如抗体片段或其一部分。在一些实施例中,由环状多核糖核苷酸表达的抗体可以是任何同种型的,如IgA、IgD、IgE、IgG、IgM。在一些实施例中,环状多核糖核苷酸表达抗体的一部分,如轻链、重链、Fc片段、CDR(互补决定区)、Fv片段、或Fab片段、其另外的部分。在一些实施例中,环状多核糖核苷酸表达抗体的一个或多个部分。例如,环状多核糖核苷酸可以包括多于一个编码序列,其中每一个表达抗体的一部分,并且其总和可以构成抗体。在一些情况下,环状多核糖核苷酸包括一个编码抗体重链的编码序列和另一个编码抗体轻链的编码序列。在一些情况下,当环状多核糖核苷酸在细胞(例如,原核细胞)环境中表达时,轻链和重链可以经受适当的修饰、折叠或其他翻译后修饰以形成功能性抗体。
在实施例中,多肽包括多个多肽,例如,一个多肽序列的多个拷贝、或多个不同的多肽序列。在实施例中,多个多肽通过接头氨基酸或间隔氨基酸连接。
在实施例中,多核苷酸负载物包括编码信号肽的序列。已经描述了许多信号肽序列,例如,Tat(双精氨酸易位)信号序列典型地是含有共有SRRxFLK“双精氨酸”基序的N末端肽序列,其用于将含有这种Tat信号肽的折叠蛋白易位跨过脂质双层。还参见例如,可在www[dot]signalpeptide[dot]de上公开获得的信号肽数据库(Signal Peptide Database)。信号肽也可用于将蛋白质导向特定的细胞器;参见例如,在Spdb信号肽数据库中披露的实验确定的和计算预测的信号肽,其可在proline[dot]bic[dot]nus[dot]edu[dot]sg/spdb公开获得。
在实施例中,多核苷酸负载物包括编码细胞穿透肽(CPP)的序列。已经描述了数百个CPP序列;参见例如,细胞穿透肽的数据库CPPsite,其可在crdd[dot]osdd[dot]net/raghava/cppsite/上公开获得。常用的CPP序列的实例是可以融合到CGI肽的C末端的聚精氨酸序列,例如八精氨酸或九精氨酸。
在实施例中,多核苷酸负载物包括编码自组装肽的序列;参见例如,Miki等人(2021)Nature Communications[自然通讯],21:3412,DOI:10.1038/s41467-021-23794-6。
治疗性多肽
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括至少一个编码治疗性多肽的编码序列。治疗性多肽是当向受试者施用或在受试者中表达时提供一些治疗性益处的多肽。向受试者施用或在受试者中表达治疗性多肽可用于治疗或预防疾病、障碍、或病症或其症状。在一些实施例中,环状多核糖核苷酸编码两种、三种、四种、五种、六种、七种、八种、九种、十种或更多种治疗性多肽。
在一些实施例中,环状多核糖核苷酸包括编码治疗性蛋白的编码序列。该蛋白可以治疗有需要的受试者的疾病。在一些实施例中,治疗性蛋白可补偿有需要的受试者中突变的、表达不足的、或缺少的蛋白。在一些实施例中,治疗性蛋白可靶向有需要的受试者中的细胞、组织或病毒,与有需要的受试者中的细胞、组织或病毒相互作用或结合。
治疗性多肽可以是可从细胞分泌或定位于细胞的细胞质、细胞核或膜区室的多肽。
治疗性多肽可以是激素、神经递质、生长因子、酶(例如,氧化还原酶、代谢酶、线粒体酶、加氧酶、脱氢酶、不依赖ATP的酶、溶酶体酶、去饱和酶)、细胞因子、转录因子、抗原结合多肽(例如,抗原结合抗体或抗体样片段,如单链抗体、纳米抗体或其他含有Ig重链和/或轻链的多肽)、Fc融合蛋白、抗凝剂、血液因子、骨形态发生蛋白、干扰素、白细胞介素、溶栓剂、抗原(例如,肿瘤、病毒、或细菌抗原)、核酸酶(例如核酸内切酶,如Cas蛋白,例如Cas9)、膜蛋白(例如,嵌合抗原受体(CAR)、跨膜受体、G蛋白偶联受体(GPCR)、受体酪氨酸激酶(RTK)、抗原受体、离子通道、或膜转运蛋白)、分泌蛋白、基因编辑蛋白(例如,CRISPR-Cas、TALEN、或锌指)、或基因书写蛋白(参见例如,国际专利申请公开WO/2020/047124,将其通过引用以其全文并入本文)。
在一些实施例中,治疗性多肽是抗体,例如,全长抗体、抗体片段、或其一部分。在一些实施例中,由环状多核糖核苷酸表达的抗体可以是任何同种型的,如IgA、IgD、IgE、IgG、IgM。在一些实施例中,环状多核糖核苷酸表达抗体的一部分,如轻链、重链、Fc片段、CDR(互补决定区)、Fv片段、或Fab片段、其另外的部分。在一些实施例中,环状多核糖核苷酸表达抗体的一个或多个部分。例如,环状多核糖核苷酸可以包括多于一个编码序列,其中每一个表达抗体的一部分,并且其总和可以构成抗体。在一些情况下,环状多核糖核苷酸包括一个编码抗体重链的编码序列和另一个编码抗体轻链的编码序列。当环状多核糖核苷酸在细胞中表达时,轻链和重链可以经受适当的修饰、折叠或其他翻译后修饰以形成功能性抗体。
在一些实施例中,如本文所述制备的环状多核糖核苷酸在疗法和/或农业中用作效应子。例如,可以向受试者施用通过本文所述的方法制备的环状多核糖核苷酸(例如,在药物、兽用、或农业组合物中)。在实施例中,该受试者是脊椎动物(例如,哺乳动物、鸟、鱼、爬行动物、或两栖动物)。在实施例中,该受试者是人。在实施例中,该受试者是非人哺乳动物。在实施例中,该受试者是非人哺乳动物,如非人灵长类动物(例如,猴、猿)、有蹄类动物(例如,牛、水牛、绵羊、山羊、猪、骆驼、美洲驼、羊驼、鹿、马、驴)、肉食动物(例如,狗、猫)、啮齿动物(例如,大鼠、小鼠)、或兔类动物(例如,兔)。在实施例中,该受试者是鸟,如以下鸟类分类群的成员:鸡形目(例如鸡、火鸡、野鸡、鹌鹑)、雁形目(例如鸭、鹅)、古颚下纲(例如鸵鸟、鸸鹋)、鸽形目(例如鸽子、野鸽)、或鹦形目(例如鹦鹉)。在实施例中,该受试者是无脊椎动物,如节肢动物(例如,昆虫、蛛形纲、甲壳动物)、线虫、环节动物、蠕虫、或软体动物。在实施例中,该受试者是无脊椎动物农业有害生物或寄生在无脊椎动物或脊椎动物宿主上的无脊椎动物。在实施例中,该受试者是植物,如被子植物(其可以是双子叶植物或单子叶植物)或裸子植物(例如,针叶树、苏铁、买麻藤类植物、银杏)、蕨类、马尾植物、石松类、或苔藓植物。在实施例中,该受试者是真核藻类(单细胞或多细胞)。在实施例中,该受试者是具有农业或园艺重要性的植物,如行间作物、生产水果的植物和树木、蔬菜、树木、以及观赏植物(包括观赏花、灌木、树木、地被植物、和草坪草)。
植物修饰多肽
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括至少一个编码植物修饰多肽的编码序列。植物修饰多肽是指能以导致植物适应度提高或降低的方式改变植物的遗传特性(例如,增加基因表达、减少基因表达或以其他方式改变DNA或RNA的核苷酸序列)、表观遗传特性、或生理或生物化学特性的多肽。在一些实施例中,环状多核糖核苷酸编码两种、三种、四种、五种、六种、七种、八种、九种、十种或更多种不同的植物修饰多肽,或一种或多种植物修饰多肽的多个拷贝。在实施例中,植物修饰多肽改变多种植物(例如,分类为多个属的植物)的遗传特性,或以更具体的方式起作用,例如,改变一种或多种具体植物(例如,植物的具体物种或具体属)的遗传特性。
本文可用的多肽的实例可以包括酶(例如,代谢重组酶、解旋酶、整合酶、RNA酶、DNA酶、或泛素化蛋白)、成孔蛋白、信号传导配体、细胞穿透肽、转录因子、受体、抗体、纳米抗体、基因编辑蛋白(例如,CRISPR-Cas核酸内切酶、TALEN、或锌指)、基因书写蛋白(参见例如,国际专利申请公开WO/2020/047124,将其通过引用以其全文并入本文)、核糖蛋白、蛋白适配体、或伴侣蛋白。
农业多肽
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括至少一个编码农业多肽的编码序列。农业多肽是适合于农业用途的多肽。在实施例中,将农业多肽应用于植物或种子(例如,通过叶面喷雾、喷粉、注射、或种子包衣)或应用于植物的环境(例如,通过土壤浸透或颗粒土壤应用),导致植物的适应度改变。农业多肽的实施例包括改变寄宿于植物或非人动物宿主中或寄宿于其上的一种或多种微生物的水平、活性或代谢的多肽,该改变导致该宿主的适应度提高。在一些实施例中,该农业多肽是植物多肽。在一些实施例中,该农业多肽是昆虫多肽。在一些实施例中,当与非人类脊椎动物、无脊椎动物、微生物、或植物细胞接触时,该农业多肽具有生物学作用。
在一些实施例中,环状多核糖核苷酸编码两种、三种、四种、五种、六种、七种、八种、九种、十种或更多种农业多肽,或一种或多种农业多肽的多个拷贝。
可用于农业应用的多肽的实施例包括例如细菌素、溶素、抗微生物肽、富含结节C的肽、和细菌性细胞调节肽。此类多肽可用于改变靶微生物的水平、活性或代谢以提高昆虫(如,蜜蜂和蚕)的适应度。农业上有用的多肽的实施例包括肽毒素,如由昆虫病原细菌(例如,苏云金芽孢杆菌(Bacillus thuringiensis)、发光杆菌(Photorhabdus luminescens)、嗜虫沙雷氏菌(Serratia entomophila)或嗜线虫致病杆菌(Xenorhabdus nematophila))天然产生的那些,如本领域中已知的。农业上有用的多肽的实施例包括用于控制农业上重要的有害生物或病原体的多肽(包括小肽,如环二肽或二酮哌嗪),例如用于控制植物疾病的抗微生物多肽或抗真菌多肽,或用于控制无脊椎有害生物(如昆虫或线虫)的杀有害生物多肽(例如,杀昆虫多肽和/或杀线虫多肽)。农业上有用的多肽的实施例包括抗体、纳米抗体、及其片段,例如,保留完整抗体或纳米抗体的至少一些(例如,至少10%)特异性结合活性的抗体或纳米抗体片段。农业上有用的多肽的实施例包括转录因子,例如,植物转录因子;参见例如,列出了在模式植物拟南芥(Arabidopsis thaliana)中鉴定的转录因子家族的“AtTFDB”数据库,其可在agris-knowledgebase[dot]org/AtTFDB/上公开获得。农业上有用的多肽的实施例包括核酸酶,例如,外切核酸酶或内切核酸酶(例如,Cas核酸酶,如Cas9或Cas12a)。农业上有用的多肽的实施例进一步包括细胞穿透肽、酶(例如,淀粉酶、纤维素酶、肽酶、脂肪酶、几丁质酶)、肽信息素(例如,酵母交配信息素、无脊椎动物繁殖和幼虫信号传导信息素,参见例如Altstein(2004)Peptides[肽],25:1373-1376)。
农业上有用的多肽的实施例包括以下多肽:当在特定的植物组织、细胞、或细胞类型中表达时,这些多肽赋予所希望的特征,如所希望的与植物形态学、生理学、生长、发育、产量、产品、营养概况、疾病或有害生物抗性、和/或环境或化学耐受性相关的特征。农业上有用的多肽包括但不限于编码以下的多肽:产率蛋白(yield protein)、应激抗性蛋白、发育控制蛋白、组织分化蛋白、分生组织蛋白、环境响应性蛋白、衰老蛋白、激素响应性蛋白、脱落蛋白、源蛋白、储器蛋白(sink protein)、开花时间或开花结构控制蛋白、种子蛋白、除草剂抗性蛋白、疾病抗性蛋白、脂肪酸生物合成酶、生育酚生物合成酶、氨基酸生物合成酶、一种或多种参与次级代谢的酶(例如,参与生物碱、萜类、聚酮类和/或苯丙素类的生物合成或分解代谢的酶)、或毒素或杀有害生物蛋白(如杀昆虫或杀线虫或抗微生物蛋白)。在实施例中,农业上有用的多肽在植物内发挥作用以对植物的生理或新陈代谢产生影响,或在以植物为食的有害生物的饮食中充当杀有害生物剂发挥作用,或发挥作用以减少或预防由植物的病毒、细菌、真菌、或卵菌病原体引起的感染或疾病。
农业上有用的多肽的实施例赋予有益的农艺性状,例如除草剂耐受性,昆虫控制,改良的产率,增加的真菌或卵菌病抗性,增加的病毒抗性,增加的线虫抗性,增加的细菌疾病抗性、植物生长和发育,改良的淀粉产量,改良的油产量,高油产量,改良的脂肪酸含量,高蛋白产量,果实成熟,增加的动物和人营养、生物聚合物的产量、环境应激抗性、药用肽和可分泌肽,改善的加工性状,改善的消化率(例如,降的低毒素的水平或降低的具有“抗营养”特性的化合物(如木质素、凝集素、和植酸盐)的水平)、酶产量、风味、氮固定、杂交种子产量、纤维产量、和生物燃料产量。农业上有用的多肽的非限制性实例包括赋予以下的多肽:除草剂抗性(美国专利号6,803,501;6,448,476;6,248,876;6,225,114;6,107,549;5,866,775;5,804,425;5,633,435;和5,463,175),增加的产率(美国专利号RE38,446;6,716,474;6,663,906;6,476,295;6,441,277;6,423,828;6,399,330;6,372,211;6,235,971;6,222,098;和5,716,837),昆虫控制(美国专利号6,809,078;6,713,063;6,686,452;6,657,046;6,645,497;6,642,030;6,639,054;6,620,988;6,593,293;6,555,655;6,538,109;6,537,756;6,521,442;6,501,009;6,468,523;6,326,351;6,313,378;6,284,949;6,281,016;6,248,536;6,242,241;6,221,649;6,177,615;6,156,573;6,153,814;6,110,464;6,093,695;6,063,756;6,063,597;6,023,013;5,959,091;5,942,664;5,942,658,5,880,275;5,763,245;5,763,241;10,017,549;10,233,217;10,487,123;10,494,408;10,494,409;10,611,806;10,612,037;10,669,317;10,827,755;11,254,950;11,267,849;11,130,965;11,136,593;和11,180,774),真菌疾病抗性(美国专利号6,653,280;6,573,361;6,506,962;6,316,407;6,215,048;5,516,671;5,773,696;6,121,436;6,316,407;和6,506,962),病毒抗性(美国专利号6,617,496;6,608,241;6,015,940;6,013,864;5,850,023;和5,304,730),线虫抗性(美国专利号6,228,992),细菌疾病抗性(美国专利号5,516,671)、植物生长和发育(美国专利号6,723,897和6,518,488)、淀粉产量(美国专利号6,538,181;6,538,179;6,538,178;5,750,876;6,476,295),改良的油产量(美国专利号6,444,876;6,426,447;和6,380,462),高油产量(美国专利号6,495,739;5,608,149;6,483,008;和6,476,295),改良的脂肪酸含量(美国专利号6,828,475;6,822,141;6,770,465;6,706,950;6,660,849;6,596,538;6,589,767;6,537,750;6,489,461;和6,459,018),高蛋白产量(美国专利号6,380,466),果实成熟(美国专利号5,512,466)、增加的动物和人营养(美国专利号6,723,837;6,653,530;6,5412,59;5,985,605;和6,171,640)、生物聚合物(美国专利号RE37,543;6,228,623;以及美国专利号5,958,745和6,946,588)、环境应激抗性(美国专利号6,072,103)、药物肽和可分泌肽(美国专利号6,812,379;6,774,283;6,140,075;和6,080,560),改善的加工性状(美国专利号6,476,295),改善的消化率(美国专利号6,531,648),低棉子糖(美国专利号6,166,292),工业酶产量(美国专利号5,543,576),改善的风味(美国专利号6,011,199)、氮固定(美国专利号5,229,114)、杂交种子产量(美国专利号5,689,041)、纤维产量(美国专利号6,576,818;6,271,443;5,981,834;和5,869,720)和生物燃料产量(美国专利号5,998,700)。
分泌的多肽效应子
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括至少一个编码分泌的多肽效应子的编码序列。可被表达的示例性分泌的多肽效应子或蛋白包括例如细胞因子和细胞因子受体,多肽激素和受体,生长因子,凝血因子,治疗性替代酶和治疗性非酶效应子,再生、修复、和纤维化因子,转化因子,和刺激细胞再生的蛋白质,其非限制性实例在本文中(例如在下表中)描述。
细胞因子和细胞因子受体:
在一些实施例中,本文所述的效应子包含表1的细胞因子或其功能变体或片段,例如,与表1中通过参考其UniProt ID披露的蛋白质序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。在一些实施例中,功能变体与对应的细胞因子受体结合,其Kd比对应的野生型细胞因子在相同条件下对于相同受体的Kd高或低不超过10%、20%、30%、40%或50%。在一些实施例中,效应子包含融合蛋白,该融合蛋白包含第一区(例如,表1的细胞因子多肽或其功能变体或片段)和第二异源区。在一些实施例中,第一区是表1的第一细胞因子多肽。在一些实施例中,第二区是表1的第二细胞因子多肽,其中该第一和第二细胞因子多肽在野生型细胞中彼此形成细胞因子异二聚体。在一些实施例中,表1的多肽或其功能变体包含信号序列,例如效应子内源性的信号序列,或异源信号序列。
在一些实施例中,本文所述的效应子包含结合表1的细胞因子的抗体或其变体。在一些实施例中,抗体分子包含信号序列。
表1.示例性细胞因子和细胞因子受体
/>
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上的NCBI数据库上获得,Maglott D等人Gene:a gene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.pii:gku1055。
2序列可在万维网网站“uniprot.org/uniprot/”上的Uniprot数据库上获得;UniProt:the universal protein knowledgebase in 2021.[UniProt:2021年的通用蛋白知识库]Nucleic Acids Res.[核酸研究]49:D1(2021)。
多肽激素和受体
在一些实施例中,本文所述的效应子包含表2的激素或其功能变体,例如,与表2中通过参考其UniProt ID披露的蛋白质序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。在一些实施例中,功能变体与对应的受体结合,其Kd比对应的野生型激素在相同条件下对于相同受体的Kd高不超过10%、20%、30%、40%或50%。在一些实施例中,表2的多肽或其功能变体包含信号序列,例如效应子内源性的信号序列,或异源信号序列。
在一些实施例中,本文所述的效应子包含与表2的激素结合的抗体分子(例如,scFv)。在一些实施例中,本文所述的效应子包含与表2的激素受体结合的抗体分子(例如,scFv)。在一些实施例中,抗体分子包含信号序列。
表2.示例性多肽激素和受体
/>
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上的NCBI数据库上获得,Maglott D等人Gene:a gene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.pii:gku1055。
2序列可在万维网网站“uniprot.org/uniprot/”上的Uniprot数据库上获得;UniProt:the universal protein knowledgebase in 2021.[UniProt:2021年的通用蛋白知识库]Nucleic Acids Res.[核酸研究]49:D1(2021)。
生长因子:
在一些实施例中,本文所述的效应子包含表3的生长因子或其功能变体,例如,与表3中通过参考其UniProt ID披露的蛋白质序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。在一些实施例中,功能变体与对应的受体结合,其Kd比对应的野生型生长因子在相同条件下对于相同受体的Kd高不超过10%、20%、30%、40%或50%。在一些实施例中,表3的多肽或其功能变体包含信号序列,例如效应子内源性的信号序列,或异源信号序列。
在一些实施例中,本文所述的效应子包含与表3的生长因子结合的抗体或其变体。在一些实施例中,本文所述的效应子包含与表3的生长因子受体结合的抗体分子(例如,scFv)。在一些实施例中,抗体分子包含信号序列。
表3.示例性生长因子
/>
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上的NCBI数据库上获得,Maglott D等人Gene:a gene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.pii:gku1055。
2序列可在万维网网站“uniprot.org/uniprot/”上的Uniprot数据库上获得;UniProt:the universal protein knowledgebase in 2021.[UniProt:2021年的通用蛋白知识库]Nucleic Acids Res.[核酸研究]49:D1(2021)。
凝血因子:
在一些实施例中,本文所述的效应子包含表4的多肽或其功能变体,例如,与表4中通过参考其UniProt ID披露的蛋白质序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。在一些实施例中,功能变体催化与对应的野生型蛋白相同的反应,例如,催化速率比野生型蛋白低或高不少于10%、20%、30%、40%或50%。在一些实施例中,表4的多肽或其功能变体包含信号序列,例如效应子内源性的信号序列,或异源信号序列。
表4.凝血相关的因子
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上的NCBI数据库上获得,Maglott D等人Gene:a gene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.pii:gku1055。
2序列可在万维网网站“uniprot.org/uniprot/”上的Uniprot数据库上获得;UniProt:the universal protein knowledgebase in 2021.[UniProt:2021年的通用蛋白知识库]Nucleic Acids Res.[核酸研究]49:D1(2021)。
治疗性替代酶:
在一些实施例中,本文所述的效应子包含表5的酶或其功能变体,例如,与表5中通过参考其UniProt ID披露的蛋白质序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。在一些实施例中,功能变体催化与对应的野生型蛋白相同的反应,例如,催化速率比野生型蛋白低不少于或不多于10%、20%、30%、40%或50%。
表5.用于酶缺乏症的示例性酶效应子
/>
/>
/>
/>
/>
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上的NCBI数据库上获得,Maglott D等人Gene:a gene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.pii:gku1055。
2序列可在万维网网站“uniprot.org/uniprot/”上的Uniprot数据库上获得;UniProt:the universal protein knowledgebase in 2021.[UniProt:2021年的通用蛋白知识库]Nucleic Acids Res.[核酸研究]49:D1(2021)。
其他非酶效应子:
在一些实施例中,本文所述的治疗性多肽包含表6的多肽或其功能变体,例如,与表6中通过参考其UniProt ID披露的蛋白质序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。
表6.示例性非酶效应子和对应的适应症
/>
/>
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上的NCBI数据库上获得,Maglott D等人Gene:a gene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.pii:gku1055。
2序列可在万维网网站“uniprot.org/uniprot/”上的Uniprot数据库上获得;UniProt:the universal protein knowledgebase in 2021.[UniProt:2021年的通用蛋白知识库]Nucleic Acids Res.[核酸研究]49:D1(2021)。
再生、修复和纤维化因子
本文所述的治疗性多肽还包括例如如在表7中披露的生长因子或其功能变体,与表7中通过参考其NCBI蛋白登录号披露的蛋白序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。还包括针对此类生长因子的抗体或其片段、或促进再生和修复的miRNA。
表7
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上获得(Maglott D等人Gene:agene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.Pii:gku1055。)
2序列可在万维网网站“ncbi.nlm.nih.gov/protein/”上获得
转化因子:
本文所述的治疗性多肽还包括转化因子,例如将成纤维细胞转化为分化细胞的蛋白因子,例如在表8中披露的因子或其功能变体,例如,与表8中通过参考其NCBI蛋白登录号披露的蛋白序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。
表8:指示用于通过转化成纤维细胞进行器官修复的多肽
靶标 基因登录号1 蛋白登录号2
MESP1 基因ID:55897 EAX02066
ETS2 基因ID:2114 NP_005230
HAND2 基因ID:9464 NP_068808
心肌素 基因ID:93649 NP_001139784
ESRRA 基因ID:2101 AAH92470
miR1 MI0000651 n/a
miR133 MI000450 n/a
TGFb 基因ID:7040 NP_000651.3
WNT 基因ID:7471 NP_005421
JAK 基因ID:3716 NP_001308784
NOTCH 基因ID:4851 XP_011517019
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上获得(Maglott D等人Gene:agene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.Pii:gku1055。)
2序列可在万维网网站“ncbi.nlm.nih.gov/protein/”上获得
刺激细胞再生的蛋白质:
本文所述的治疗性多肽还包括刺激细胞再生的蛋白质,例如在表9中披露的蛋白质或其功能变体,例如,与表9中通过参考其NCBI蛋白登录号披露的蛋白质序列具有至少80%、85%、90%、95%、96%、97%、98%、或99%同一性的蛋白质。
表9
靶标 基因登录号1 蛋白登录号2
MST1 NG_016454 NP_066278
STK30 基因ID:26448 NP_036103
MST2 基因ID:6788 NP_006272
SAV1 基因ID:60485 NP_068590
LATS1 基因ID:9113 NP_004681
LATS2 基因ID:26524 NP_055387
YAP1 NG_029530 NP_001123617
CDKN2b NG_023297 NP_004927
CDKN2a NG_007485 NP_478102
1序列可在万维网网站“ncbi.nlm.nih.gov/gene”上获得(Maglott D等人Gene:agene-centered information resource at NCBI[基因:在NCBI处以基因为中心的信息资源].Nucleic Acids Res.[核酸研究]2014.Pii:gku1055。)
2序列可在万维网网站“ncbi.nlm.nih.gov/protein/”上获得
在一些实施例中,环状多核糖核苷酸包含一个或多个表达序列(编码序列),并且被配置用于在受试者体内细胞中持续表达。在一些实施例中,环状多核糖核苷酸被配置为使得一个或多个表达序列在细胞中在较晚的时间点的表达等于或高于较早的时间点的表达。在此类实施例中,一个或多个表达序列的表达可以维持在相对稳定的水平或可以随时间增加。表达序列的表达可以在延长的时间段内相对稳定。例如,在一些情况下,一个或多个表达序列在细胞中在至少7、8、9、10、12、14、16、18、20、22、23或更多天的时间段内的表达不会减少50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。在一些情况下,在一些情况下,一个或多个表达序列在细胞中在至少7、8、9、10、12、14、16、18、20、22、23或更多天的表达维持在变化不超过50%、45%、40%、35%、30%、25%、20%、15%、10%或5%的水平。
内部核糖体进入位点(IRES)
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括一个或多个内部核糖体进入位点(IRES)元件。在一些实施例中,IRES与一个或多个编码序列可操作地连接(例如,每个IRES与一个或多个编码序列可操作地连接)。在实施例中,IRES位于异源启动子与编码序列的5'端之间。
包括在环状多核糖核苷酸中的合适的IRES元件包括能够接合真核核糖体的RNA序列。在一些实施例中,IRES元件是至少约5nt、至少约8nt、至少约9nt、至少约10nt、至少约15nt、至少约20nt、至少约25nt、至少约30nt、至少约40nt、至少约50nt、至少约100nt、至少约200nt、至少约250nt、至少约350nt、或至少约500nt。
在一些实施例中,IRES元件衍生自生物体的DNA,该生物体包括但不限于病毒、哺乳动物和果蝇。此类病毒DNA可以衍生自但不限于小核糖核酸病毒互补DNA(cDNA)、脑心肌炎病毒(EMCV)cDNA和脊髓灰质炎病毒cDNA。在一个实施例中,衍生IRES元件的果蝇DNA包括但不限于来自黑腹果蝇(Drosophila melanogaster)的触角足基因。
在一些实施例中,如果存在,IRES序列是以下病毒的IRES序列:桃拉综合征(Taurasyndrome)病毒、锥猎蝽(Triatoma)病毒、泰勒氏脑脊髓炎病毒(Theiler'sencephalomyelitis virus)、猿猴病毒40、红火蚁(Solenopsis invicta)病毒1、禾谷缢管蚜(Rhopalosiphum padi)病毒、网状内皮组织增生病毒、福尔曼脊髓灰质炎病毒(fumanpoliovirus)1、普劳提娅失速肠病毒(Plautia stall intestine virus)、克什米尔蜜蜂病毒、人鼻病毒2、假桃病毒叶蝉病毒-1(Homalodisca coagulata virus-1)、人类免疫缺陷病毒1型、假桃病毒叶蝉病毒-1、Himetobi P病毒、丙型肝炎病毒、甲型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人类肠道病毒71、马鼻炎病毒、茶尺蠖(Ectropis obliqua)小核糖核酸样病毒、脑心肌炎病毒(EMCV)、果蝇C病毒、十字花科烟草病毒、蟋蟀麻痹病毒、牛病毒性腹泻病毒1、黑皇后细胞病毒、蚜虫致死性麻痹病毒、禽脑脊髓炎病毒、急性蜜蜂麻痹病毒、木槿褪绿环斑病毒(Hibiscus chlorotic ringspot virus)、经典猪瘟病毒、人FGF2、人SFTPA1、人AML1/RUNX1、果蝇触角足、人AQP4、人AT1R、人BAG-l、人BCL2、人BiP、人c-IAPl、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1α、人n.myc、小鼠Gtx、人p27kipl、人PDGF2/c-sis、人p53、人Pim-l、小鼠Rbm3、果蝇reaper、犬Scamper、果蝇Ubx、人UNR、小鼠UtrA、人VEGF-A、人XIAP、萨里病毒(Salivirus)、科萨病毒(Cosavirus)、副肠孤病毒(Parechovirus)、果蝇无毛、酿酒酵母(S.cerevisiae)TFIID、酿酒酵母YAP1、人c-src、人FGF-l、猿猴小核糖核酸病毒、芜菁皱缩病毒(Turnip crinkle virus)、eIF4G的适配体、柯萨奇病毒(Coxsackievirus)B3(CVB3)或柯萨奇病毒A(CVB1/2)。在又另一实施例中,IRES是柯萨奇病毒B3(CVB3)的IRES序列。在另外的实施例中,IRES是脑心肌炎病毒的IRES序列。
在一些实施例中,环状多核糖核苷酸包括侧接至少一个(例如,2、3、4、5或更多个)编码序列的至少一个IRES。在一些实施例中,IRES侧接至少一个(例如,2、3、4、5或更多个)编码序列的两侧。在一些实施例中,环状多核糖核苷酸在每个编码序列的一侧或两侧上包括一个或多个IRES序列,导致所得的一个或多个肽和/或一个或多个多肽的隔开。
调节元件
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括一个或多个调节元件。在一些实施例中,环状多核糖核苷酸包括调节元件,例如修饰环状多核糖核苷酸内编码序列的表达的序列。
调节元件可以包括与编码表达产物的编码序列相邻定位的序列。调节元件可以可操作地连接至相邻的序列。与不存在调节元件时表达的产物的量相比,调节元件可以增加表达的产物的量。另外,一个调节元件可以增加串联连接的多个编码序列表达的产物的量。因此,一个调节元件可以增强一个或多个编码序列的表达。多个调控元件是本领域普通技术人员熟知的。
在一些实施例中,调节元件是翻译调节子。翻译调节子可以调节环状多核糖核苷酸中编码序列的翻译。翻译调节子可以是翻译增强子或翻译抑制子。在一些实施例中,环状多核糖核苷酸包括与至少一种编码序列相邻的至少一种翻译调节子。在一些实施例中,环状多核糖核苷酸包括与每个编码序列相邻的翻译调节子。在一些实施例中,翻译调节子存在于每个编码序列的一侧或两侧,导致例如一个或多个肽和/或一个或多个多肽的编码产物的隔开。
在一些实施例中,多核糖核苷酸负载物包括至少一种包括调节RNA的非编码RNA序列。在一些实施例中,非编码RNA序列反式调节靶序列。在一些实施例中,靶序列包括受试者基因组的基因的核苷酸序列,其中该受试者基因组是脊椎动物、无脊椎动物、真菌、植物、或微生物的基因组。在实施例中,受试者基因组是人、非人哺乳动物、爬行动物、鸟、两栖动物、或鱼的基因组。在实施例中,受试者基因组是昆虫、蛛形纲、线虫、或软体动物的基因组。在实施例中,受试者基因组是单子叶植物、双子叶植物、裸子植物、或真核藻类的基因组。在实施例中,受试者基因组是细菌、真菌、或古细菌的基因组。在实施例中,靶序列包含在多个受试者基因组中(例如,在给定属内的多个物种的基因组中)发现的基因的核苷酸序列。
在一些实施例中,该至少一个非编码RNA序列对靶序列的反式调节是靶序列表达的上调。在一些实施例中,至少一个非编码RNA序列对靶序列的反式调节是靶序列表达的下调。在一些实施例中,至少一个非编码RNA序列对靶序列的反式调节是靶序列表达的可诱导表达。例如,可诱导表达可以通过环境条件(例如,光、温度、水、或营养可用性)、通过昼夜节律、通过内源性或外源性提供的诱导剂(例如,小RNA、配体)进行诱导。在一些实施例中,至少一个非编码RNA序列可被原核系统的生理状态(例如,生长期、转录调节状态、和细胞内代谢物浓度)诱导。例如,可以提供外源性提供的配体(例如,阿拉伯糖、鼠李糖、或IPTG)以使用诱导型启动子(例如,PBAD、Prha、和lacUV5)诱导表达。
在一些实施例中,至少一个非编码RNA序列包括选自由以下组成的组的调节RNA:小干扰RNA(siRNA)或其前体、双链RNA(dsRNA)或至少部分双链RNA(例如,包含一个或多个茎环的RNA);发夹RNA(hpRNA)、微小RNA(miRNA)或其前体(例如pre-miRNA或pri-miRNA);相位小干扰RNA(phasiRNA)或其前体;异染色质小干扰RNA(hcsiRNA)或其前体;以及天然反义短干扰RNA(natsiRNA)或其前体。在一些实施例中,至少一个非编码RNA序列包括指导RNA(gRNA)或其前体、或可识别且可被指导RNA结合的异源性RNA序列。在一些实施例中,调节元件是微小RNA(miRNA)或miRNA结合位点、或siRNA或siRNA结合位点。
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括至少一种农业上有用的非编码RNA序列,当提供给特定的植物组织、细胞、或细胞类型时,该非编码RNA序列赋予所希望的特征,如所希望的与植物形态学、生理学、生长、发育、产量、产品、营养特性、疾病或有害生物抗性、和/或环境或化学耐受性相关的特征。在实施例中,农业上有用的非编码RNA序列引起内源性基因的基因表达的靶向调节,例如经由反义(参见例如美国专利号5,107,065);抑制性RNA(“RNAi”,包括经由miRNA、siRNA、反式作用siRNA、和相位sRNA介导的机制调节基因表达,例如,如在公开的申请US2006/0200878和US2008/0066206中以及在美国专利申请序列号11/974,469中所述);或共抑制介导的机制。在实施例中,农业上有用的非编码RNA序列是催化RNA分子(例如,核酶或核糖开关;参见例如,US2006/0200878),其经工程化以切割所希望的内源性mRNA产物。农业上有用的非编码RNA序列是本领域已知的,例如,调节植物细胞中的基因表达的反义定向RNA披露于美国专利号5,107,065和5,759,829中,以及调节植物中的基因表达的正义定向RNA披露于美国专利号5,283,184和5,231,020中。向植物细胞提供农业上有用的非编码RNA也可用于调节与植物相关的生物体中的基因表达,该生物体例如植物的无脊椎有害生物或感染植物的微生物病原体(例如,细菌、真菌、卵菌、或病毒)、或与植物的无脊椎有害生物相关(例如,共生)的微生物。
翻译起始序列
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括至少一个翻译起始序列。在一些实施例中,环状多核糖核苷酸包括与编码序列可操作地连接的翻译起始序列。
在一些实施例中,环状多核糖核苷酸编码多肽并且可以包括翻译起始序列,例如起始密码子。在一些实施例中,翻译起始序列包括科扎克(Kozak)或夏因-达尔加诺(Shine-Dalgarno)序列。在一些实施例中,环状多核糖核苷酸包括与编码序列相邻的翻译起始序列,例如科扎克序列。在一些实施例中,翻译起始序列是非编码起始密码子。在一些实施例中,翻译起始序列(例如,科扎克序列)存在于每个编码序列的一侧或两侧,导致编码产物的隔开。在一些实施例中,环状多核糖核苷酸包括与编码序列相邻的至少一个翻译起始序列。在一些实施例中,翻译起始序列为环状多核糖核苷酸提供构象柔性。在一些实施例中,翻译起始序列基本上在环状多核糖核苷酸的单链区域内。
环状多核糖核苷酸可以包括多于1个起始密码子,如但不限于至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个或多于60个起始密码子。翻译可以在第一起始密码子上起始或可以在第一起始密码子的下游起始。
在一些实施例中,环状多核糖核苷酸可以起始于不是第一起始密码子的密码子,例如AUG。环状多核糖核苷酸的翻译可以起始于替代的翻译起始序列,如但不限于ACG、AGG、AAG、CTG/CUG、GTG/GUG、ATA/AUA、ATT/AUU、TTG/UUG。在一些实施例中,翻译在例如应激诱导条件的选择性条件下在替代的翻译起始序列处开始。作为非限制性实例,环状多核糖核苷酸的翻译可以在替代的翻译起始序列(如ACG)处开始。作为另一非限制性实例,环状多核糖核苷酸翻译可以在替代的翻译起始序列CTG/CUG处开始。作为又另一非限制性实例,环状多核糖核苷酸翻译可以在替代的翻译起始序列GTG/GUG处开始。作为又另一非限制性实例,环状多核糖核苷酸可以在重复相关的非AUG(RAN)序列(如包括短段的重复RNA(例如,CGG、GGGGCC、CAG、CTG)的替代的翻译起始序列)处开始翻译。
终止元件
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括至少一个终止元件。在一些实施例中,环状多核糖核苷酸包括与编码序列可操作地连接的终止元件。
在一些实施例中,环状多核糖核苷酸包括一个或多个编码序列,并且每个编码序列可以具有或可以不具有终止元件。在一些实施例中,环状多核糖核苷酸包括一个或多个编码序列,并且编码序列缺少终止元件,使得环状多核糖核苷酸被连续翻译。终止元件的排除可导致滚环翻译或编码产物的连续表达。
非编码序列
在一些实施例中,本文所述的环状多核糖核苷酸(例如,环状多核糖核苷酸的多核糖核苷酸负载物)包括一个或多个非编码序列,例如,不编码多肽的表达的序列。在一些实施例中,该环状多核糖核苷酸包括两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个非编码序列。在一些实施例中,环状多核糖核苷酸不编码多肽编码序列。
非编码序列可以是天然的或合成的序列。在一些实施例中,非编码序列可以改变细胞行为,如例如淋巴细胞行为。在一些实施例中,该非编码序列对于细胞RNA序列是反义的。
在一些实施例中,环状多核糖核苷酸包含调节核酸,该调节核酸是RNA或RNA样结构,典型地在约5-500个碱基对(bp)之间(取决于特定的RNA结构(例如,miRNA5-30bp,lncRNA200-500bp)),并且可以具有与细胞内表达的靶基因中的编码序列相同(互补)或几乎相同(基本上互补)的核碱基序列。在实施例中,环状多核糖核苷酸包括编码RNA前体的调节核酸,该RNA前体可以被加工成较小的RNA,例如miRNA前体(其可以是从约50至约1000bp)可以被加工成较小的miRNA中间体或成熟的miRNA。
长非编码RNA(lncRNA)定义为长于100个核苷酸的非蛋白编码转录物。许多lncRNA被表征为组织特异性。以与附近的蛋白编码基因相反的方向转录的反向型lncRNA占大比例(例如,占哺乳动物基因组中总lncRNA的约20%)并可能会调节附近基因的转录。在一个实施例中,本文提供的环状多核糖核苷酸包括lncRNA的正义链。在一个实施例中,本文提供的环状多核糖核苷酸包括lncRNA的反义链。
在实施例中,环状多核糖核苷酸编码与内源性基因或基因产物(例如,mRNA)的全部或与其至少一个片段基本上互补或完全互补的调节核酸。在实施例中,调节核酸与内含子和外显子之间的边界处、在外显子之间的内部、或与外显子相邻的序列互补,从而防止特定基因的新生成的核RNA转录物成熟化为用于转录的mRNA。与特定基因互补的调节核酸可与该基因的mRNA杂交并防止其翻译。反义调节核酸可以是DNA、RNA或其衍生物或杂交体。在一些实施例中,调节核酸包括可以与参与内源性基因或外源性基因的表达调节的蛋白结合的蛋白结合位点。
在实施例中,环状多核糖核苷酸编码至少一个与目的转录物杂交的调节RNA,其中该调节RNA的长度是约5与30个之间的核苷酸,约10与30个之间的核苷酸,或约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、或多于30个核苷酸。在实施例中,调节核酸与靶向转录物的序列同一性程度是至少75%、至少80%、至少85%、至少90%、或至少95%。
在实施例中,环状多核糖核苷酸编码与靶基因的约5至约25个连续的核苷酸相同的微小RNA(miRNA)分子,或编码该miRNA的前体。在一些实施例中,该miRNA具有允许miRNA识别特定靶mRNA并与其结合的序列。在实施例中,miRNA序列以二核苷酸AA开始,包括含量为约30%-70%(约30%-60%、约40%-60%、或约45%-55%)的GC,并且与除了待引入其中的受试者(例如,哺乳动物)的基因组中的靶标之外的任何核苷酸序列不具有高同一性百分比,例如,如通过标准BLAST检索确定的。
在一些实施例中,环状多核糖核苷酸包括至少一种miRNA(或miRNA前体),例如2种、3种、4种、5种、6种或更多种miRNA或miRNA前体。在一些实施例中,环状多核糖核苷酸包括编码miRNA(或其前体)的序列,该miRNA(或其前体)与靶序列具有至少约75%、80%、85%、90%、95%、96%、97%、98%、或99%或100%核苷酸互补性。
siRNA和shRNA类似于内源性微小RNA(miRNA)基因的加工途径中的中间体。在一些实施例中,siRNA可以充当miRNA,并且反之亦然。像siRNA一样,微小RNA使用RISC来下调靶基因,但与siRNA不同,大多数动物miRNA都不切割mRNA。相反,miRNA通过翻译抑制或聚A去除和mRNA降解来降低蛋白输出。已知的miRNA结合位点位于mRNA3'UTR内;miRNA似乎靶向与从miRNA 5'端的第2-8个核苷酸几乎完全互补的位点。该区域称为种子区域。因为成熟siRNA和miRNA是可互换的,所以外源性siRNA下调具有与siRNA的种子互补性的mRNA。
已知miRNA序列的列表可在研究组织维护的数据库中找到,这些组织如维康信托基金会桑格研究院(Wellcome Trust Sanger Institute)、宾夕法尼亚生物信息学中心(Penn Center for Bioinformatics)、斯隆凯特灵癌症中心(Memorial Sloan KetteringCancer Center)和欧洲分子生物学实验室(European Molecule Biology Laboratory)等。已知的有效的siRNA序列和同源结合位点也很好地呈现在相关文献中。通过本领域已知的技术,RNAi分子易于设计和产生。此外,存在增加发现有效且特异性的序列基序的机会的计算工具。
植物miRNA、它们的前体、和它们的靶基因是本领域已知的;参见例如,美国专利号8,697,949、8,946,511、和9,040,774,并且还参见可在miRbase[dot]org获得的可公开获得的微小RNA数据库“miRbase”。天然存在的miRNA或miRNA前体序列可以被工程化或对其序列进行修饰,以使所得的成熟miRNA识别所选的靶序列并与其结合;工程化植物和动物miRNA和miRNA前体两者的实例已经得到充分表明;参见例如,美国专利号8,410,334、8,536,405和9,708,620。所有引用的专利以及其中披露的miRNA和miRNA前体序列均通过引用并入本文。
间隔子序列
在一些实施例中,本文所述的环状多核糖核苷酸包括一个或多个间隔子序列。间隔子是指提供两个相邻多核苷酸区之间的距离和/或灵活性的任何邻接的(例如,一个或多个核苷酸的)核苷酸序列。间隔子可以存在于本文所述的任一核酸元件之间。间隔子也可存在于本文所述的核酸元件内。
例如,其中核酸包括以下元件中的任何两种或更多种:(A)5'自切割核酶;(B)5'退火区;(C)多核糖核苷酸负载物;(D)3'退火区;和/或(E)3'自切割核酶;间隔子区可以存在于任何一种或多种元件之间。如本文所述,元件(A)、(B)、(C)、(D)和/或(E)中的任一者可以通过间隔子序列隔开。例如,间隔子可以在(A)与(B)之间、(B)与(C)之间、(C)与(D)之间、和/或(D)与(E)之间。
间隔子也可存在于本文所述的核酸区内。例如,多核苷酸负载物区可以包括一个或多个间隔子。间隔子可以隔开多核苷酸负载物内的区域。
在一些实施例中,间隔子序列的长度可以是例如,至少5个核苷酸、至少10个核苷酸、至少15个核苷酸、或至少30个核苷酸。在一些实施例中,间隔子序列的长度是至少7、8、9、10、11、12、13、14、15、16、17、18、19、20、25或30个核苷酸。在一些实施例中,间隔子序列的长度是不多于100、90、80、70、60、50、45、40、35或30个核苷酸。在一些实施例中,间隔子序列的长度是在20与50个核苷酸之间。在某些实施例中,间隔子序列的长度是10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。
在一些实施例中,在5'退火区与多核糖核苷酸负载物之间,间隔子区的长度可以是在5与1000、5与900、5与800、5与700、5与600、5与500、5与400、5与300、5与200、5与100、100与200、100与300、100与400、100与500、100与600、100与700、100与800、100与900、或100与1000个多核糖核苷酸之间。间隔子序列可以是聚A序列、聚A-C序列、聚C序列、或聚U序列。
间隔子序列可用于将IRES与相邻的结构元件隔开,以维持IRES或相邻的元件的结构和功能。可以根据IRES将间隔子特异性工程化。在一些实施例中,可以利用RNA折叠计算机软件(如RNAFold)指导载体的各种元件(包括间隔子)的设计。
在一些实施例中,多核糖核苷酸包括5'间隔子序列(例如,在5'退火区与多核糖核苷酸负载物之间)。在一些实施例中,5'间隔子序列的长度是至少10个核苷酸。在另一实施例中,5'间隔子序列的长度是至少15个核苷酸。在另外的实施例中,5'间隔子序列的长度是至少30个核苷酸。在一些实施例中,5'间隔子序列的长度是至少7、8、9、10、11、12、13、14、15、16、17、18、19、20、25或30个核苷酸。在一些实施例中,5'间隔子序列的长度是不多于100、90、80、70、60、50、45、40、35或30个核苷酸。在一些实施例中,5'间隔子序列的长度是在20与50个核苷酸之间。在某些实施例中,5'间隔子序列的长度是10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一个实施例中,5'间隔子序列是聚A序列。在另一实施例中,5'间隔子序列是聚A-C序列。
在一些实施例中,多核糖核苷酸包括3'间隔子序列(例如,在3'退火区与多核糖核苷酸负载物之间)。在一些实施例中,3'间隔子序列的长度是至少10个核苷酸。在另一实施例中,3'间隔子序列的长度是至少15个核苷酸。在另外的实施例中,3'间隔子序列的长度是至少30个核苷酸。在一些实施例中,3'间隔子序列的长度是至少7、8、9、10、11、12、13、14、15、16、17、18、19、20、25或30个核苷酸。在一些实施例中,3'间隔子序列的长度是不多于100、90、80、70、60、50、45、40、35或30个核苷酸。在一些实施例中,3'间隔子序列的长度是在20与50个核苷酸之间。在某些实施例中,3'间隔子序列的长度是10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一个实施例中,3'间隔子序列是聚A序列。在另一实施例中,5'间隔子序列是聚A-C序列。
在一个实施例中,多核糖核苷酸包括5'间隔子序列,但不包括3'间隔子序列。在另一实施例中,多核糖核苷酸包括3'间隔子序列,但不包括5'间隔子序列。在另一实施例中,多核糖核苷酸既不包括5'间隔子序列,又不包括3'间隔子序列。在另一实施例中,多核糖核苷酸不包括IRES序列。在另外的实施例中,多核糖核苷酸不包括IRES序列、5'间隔子序列或3'间隔子序列。
在一些实施例中,间隔子序列包括至少3个核糖核苷酸、至少4个核糖核苷酸、至少5个核糖核苷酸、至少约8个核糖核苷酸、至少约10个核糖核苷酸、至少约12个核糖核苷酸、至少约15个核糖核苷酸、至少约20个核糖核苷酸、至少约25个核糖核苷酸、至少约30个核糖核苷酸、至少约40个核糖核苷酸、至少约50个核糖核苷酸、至少约60个核糖核苷酸、至少约70个核糖核苷酸、至少约80个核糖核苷酸、至少约90个核糖核苷酸、至少约100个核糖核苷酸、至少约120个核糖核苷酸、至少约150个核糖核苷酸、至少约200个核糖核苷酸、至少约250个核糖核苷酸、至少约300个核糖核苷酸、至少约400个核糖核苷酸、至少约500个核糖核苷酸、至少约600个核糖核苷酸、至少约700个核糖核苷酸、至少约800个核糖核苷酸、至少约900个核糖核苷酸、或至少约100个核糖核苷酸。
连接酶
RNA连接酶是一类利用ATP催化在RNA分子的末端之间形成磷酸二酯键的酶。内源性RNA连接酶修复植物、动物、人、细菌、古细菌、和真菌细胞以及病毒中单链、双链体化RNA中的核苷酸断裂。
本披露提供了一种在原核系统中通过使线性RNA(例如,如本文所述的连接酶相容的线性RNA)与RNA连接酶接触来产生环状RNA的方法。
在一些实施例中,该RNA连接酶对该原核细胞是内源的。在一些实施例中,该RNA连接酶对该原核细胞是异源的。在一些实施例中,通过在原核细胞中将外源多核苷酸转录成编码该RNA连接酶的mRNA、并翻译编码该RNA连接酶的mRNA,向该原核细胞提供该RNA连接酶。在一些实施例中,通过在原核细胞中将内源多核苷酸转录成编码该RNA连接酶的mRNA、并翻译编码该RNA连接酶的mRNA,向该原核细胞提供该RNA连接酶;例如,可以向该原核细胞提供编码对该原核细胞内源的RNA连接酶的载体,用于在该原核细胞中过表达。在一些实施例中,向该原核细胞提供作为外源蛋白的RNA连接酶。
在一些实施例中,该RNA连接酶是tRNA连接酶或其变体。在一些实施例中,该tRNA连接酶是T4连接酶、RtcB连接酶、TRL-1连接酶、和Rnl1连接酶、Rnl2连接酶、LIG1连接酶、LIG2连接酶、PNK/PNL连接酶、PF0027连接酶、thpR ligT连接酶、ytlPor连接酶、或其变体(例如,保留连接酶功能的突变性变体)。
在一些实施例中,该RNA连接酶是植物RNA连接酶或其变体。在一些实施例中,该RNA连接酶是叶绿体RNA连接酶或其变体。在实施例中,该RNA连接酶是真核藻类RNA连接酶或其变体。在一些实施例中,该RNA连接酶是来自古细菌的RNA连接酶或其变体。在一些实施例中,该RNA连接酶是细菌RNA连接酶或其变体。在一些实施例中,该RNA连接酶是真核RNA连接酶或其变体。在一些实施例中,该RNA连接酶是病毒RNA连接酶或其变体。在一些实施例中,该RNA连接酶是线粒体RNA连接酶或其变体。
在一些实施例中,该RNA连接酶是在表10中描述的连接酶或其变体。在一些实施例中,该RNA连接酶包括选自由SEQ ID NO:572-588组成的组的氨基酸序列。
表10:示例性tRNA连接酶
/>
产生方法
本披露还提供了在原核系统中产生环状RNA的方法。图2是描绘用于从前体线性RNA产生环状RNA的示例性过程的示意图。在一些实施例中,向原核细胞提供外源性多核糖核苷酸(例如,本文所述的线性多核糖核苷酸或编码用于转录本文所述的线性多核糖核苷酸的DNA分子)。可在该原核细胞中将该线性多核糖核苷酸从向该原核细胞提供的外源性DNA分子转录。可在该原核细胞中将该线性多核糖核苷酸从向该原核细胞提供的外源性重组DNA分子瞬时转录。在一些实施例中,该外源性DNA分子不整合到该原核细胞的基因组中。在一些实施例中,在该原核细胞中将该线性多核糖核苷酸从并入该原核细胞的基因组中的重组DNA分子转录。
在一些实施例中,该DNA分子包括与编码该线性多核糖核苷酸的DNA可操作地连接的异源性启动子。该异源性启动子可以是T7启动子、T6启动子、T4启动子、T3启动子、SP3启动子、或SP6启动子。
在细胞中表达时,5'和3'自切割核酶各自经历切割反应,从而产生连接酶相容的末端(例如,5'-羟基和2',3'-环磷酸)并且5'和3'退火区使游离端靠近。因此,前体线性多核糖核苷酸产生连接酶相容的多核糖核苷酸,其可以被连接(例如,在连接酶存在下)以产生环状多核糖核苷酸。
线性RNA在原核系统中从DNA模板转录(例如,体内转录)、前体线性RNA自切割以形成连接酶相容的线性RNA、以及连接酶相容的线性RNA连接以产生环状RNA在原核细胞中进行。在一些实施例中,该线性多核糖核苷酸在原核系统中的转录(例如,体内转录)在具有内源性连接酶的原核细胞中进行。在一些实施例中,该内源性连接酶过表达。在一些实施例中,该线性多核糖核苷酸在原核系统中的转录(例如,体内转录)在具有异源性连接酶的原核细胞中进行。
在一些实施例中,该原核细胞包括RNA连接酶,例如本文所述的RNA连接酶。在一些实施例中,该RNA连接酶对该原核细胞是内源的。在一些实施例中,该RNA连接酶对该原核细胞是异源的。在该RNA连接酶对该细胞是异源的情况下,该RNA连接酶可以作为外源性RNA连接酶向该细胞提供,或者可以由向该细胞提供的多核苷酸编码。在该RNA连接酶对该细胞是内源的情况下,通过向该细胞提供编码该RNA连接酶的表达的多核糖核苷酸,可以使该RNA连接酶在该细胞中过表达。
包括本文所述的多核糖核苷酸的原核细胞可以是细菌细胞或古细菌细胞。例如,该原核细胞可以是天然细菌群体的成员。在一些实施例中,该原核细胞是与真核生物体相关的微生物组的成员。在一些实施例中,真核生物体是人。在一些实施例中,真核生物体是非人脊椎动物。在一些实施例中,真核生物体是无脊椎动物。在一些实施例中,真核生物体是真菌。在一些实施例中,真核生物体是植物。在一些实施例中,真核生物体是植物的无脊椎有害生物。在一些实施例中,真核生物体是植物病原体的无脊椎动物载体。该真核生物体可以是被子植物,并且该原核细胞可以包括与植物的根或与植物生长的土壤或生长培养基的微生物群落相关的微生物组的成员。该真核生物体可以是被子裸子植物,并且该原核细胞可以包括与植物的根(根圈)或与植物生长的土壤或生长培养基的微生物群落相关的微生物组的成员。该真核生物体可以是被子植物,并且该原核细胞可以包括与植物地上组织相关的微生物组的成员。该真核生物体可以是裸子植物,并且该原核细胞可以包括与植物地上组织相关的微生物组的成员。在一些实施例中,该真核生物体是人,并且该原核细胞包括与人的细胞、组织、或器官相关的微生物组的成员。在一些实施例中,该真核生物体是非人脊椎动物,并且该原核细胞包括与非人脊椎动物的细胞、组织、或器官相关的微生物组的成员。在一些实施例中,该真核生物体是无脊椎动物,并且该原核细胞包括与无脊椎动物的细胞、组织、或器官相关的微生物组的成员。在一些实施例中,该真核生物体是人,并且该原核细胞包含与人的消化系统的细胞或组织相关的微生物组的成员。在一些实施例中,该真核生物体是非人脊椎动物,并且该原核细胞包括与非人脊椎动物的消化系统的细胞或组织相关的微生物组的成员。在一些实施例中,该真核生物体是无脊椎动物,并且该原核细胞包含与无脊椎动物的消化系统的细胞或组织相关的微生物组的成员。在一些实施例中,该真核生物体是昆虫,并且该原核细胞包括与昆虫的细菌细胞相关的微生物组的成员。
例如,包括本文所述的多核糖核苷酸的原核细胞可以是大肠杆菌、嗜盐古细菌(例如,沃氏嗜盐富饶菌(Haloferax volcaniii))、鞘氨醇单胞菌属(Sphingomonas)、蓝细菌(例如,细长聚球藻(Synechococcus elongatus)、螺旋藻属(Spirulina)(节旋藻属(Arthrospira))物种和集胞藻属物种(Synechocystis spp.))、链霉菌属(Streptomyces)、放线菌(例如,野村菌属(Nonomuraea)、北里孢菌属(Kitasatospora)或高温双岐菌属(Thermobifida))、芽孢杆菌属物种(Bacillus spp.)(例如,枯草芽孢杆菌(Bacillussubtilis)、炭疽芽孢杆菌(Bacillus anthracis)、蜡样芽孢杆菌(Bacillus cereus))、β变形杆菌(例如,伯克霍尔德氏菌属(Burkholderia))、α变形杆菌(例如,农杆菌属(Agrobacterium))、假单胞菌属(例如,恶臭假单胞菌(Pseudomonas putida))、和肠杆菌。
这些原核细胞可以在培养基中生长。这些原核细胞可以包含在生物反应器中。
纯化的方法
本披露提供了从原核细胞纯化环状多核糖核苷酸的方法。例如,实验室规模研究的纯化可以通过以下进行:添加苯酚、氯仿和异戊醇(西格玛公司(Sigma):P3803),以及涡旋以破坏原核细胞并将RNA(例如,从线性前体RNA形成的环化RNA分子)提取到水相中。将水相用氯仿洗涤以去除残余的苯酚,并通过添加乙醇从水相沉淀RNA。可以将含有RNA的沉淀物风干并重悬于例如无核酸酶的水或水性缓冲液中。
生物反应器
本文所述的原核细胞可以包含在生物反应器中。在一些实施例中,本文所述的任何产生环状多核糖核苷酸的方法都可以在生物反应器中进行。生物反应器是指在其中进行涉及生物体或衍生自此类生物体的生物化学活性物质的化学过程的任何容器。特别地,生物反应器可以与本文所述的使用原核系统用于产生环状RNA的方法相容。用于生物反应器的容器可以包括培养瓶、皿、或袋,其可以是单次使用的(一次性的)、可高压灭菌的、或可消毒的。生物反应器可以由玻璃制成,或者其也可以是基于聚合物的,或者其也可以由其他材料制成。
生物反应器的实例包括但不限于搅拌罐(例如,充分混合的)生物反应器和管式(例如,活塞流)生物反应器、气升式生物反应器、膜搅拌罐、旋转过滤搅拌罐、振动混合器、流化床反应器、和膜生物反应器。操作生物反应器的模式可以是间歇的或连续的过程。当试剂和产物流连续地进出系统时,生物反应器是连续的。间歇式生物反应器可以有连续的再循环流,但没有连续的试剂进料或产物收获。间歇式生物反应器可以具有连续的再循环流,但没有连续的营养物进料或产物收获。对于间歇性收获和分批进料(fed-batch或batchfed)培养,将细胞以较低的活细胞密度接种在与分批培养基的组成相似的培养基中。允许细胞在基本上没有外部操作的情况下呈指数生长,直到营养物有些耗尽并且细胞接近稳定生长期。此时,对于间歇性收获分批进料过程,可以收获部分的细胞和产物,并用新鲜培养基补充去除的培养基。该过程可以重复几次。对于重组蛋白的生产,可以使用分批进料过程。当细胞呈指数增长,但营养物逐渐耗尽时,连续地或间歇地添加浓缩的进料培养基(例如,10-15倍浓缩的基础培养基)以供应额外的营养物,从而允许细胞浓度和转化期时长的进一步增加。可以在不去除培养基(肉汤)的情况下按照与细胞浓度成比例的方式添加新鲜培养基。为了容纳添加的培养基,分批进料培养以远低于生物反应器的全部容量的体积(例如,最大体积的大约40%至50%)开始。
本披露的一些方法针对环状多核糖核苷酸的大规模生产。对于大规模生产方法,该方法可以在1升(L)至50L或更大(例如,5L、10L、15L、20L、25L、30L、35L、40L、45L、50L、或更大)的体积中进行。在一些实施例中,该方法可以在5L至10L、5L至15L、5L至20L、5L至25L、5L至30L、5L至35L、5L至40L、5L至45L、10L至15L、10L至20L、10L至25L、20L至30L、10L至35L、10L至40L、10L至45L、10L至50L、15L至20L、15L至25L、15L至30L、15L至35L、15L至40L、15L至45L、或15至50L的体积中进行。
在一些实施例中,生物反应器可以产生至少1g的环状RNA。在一些实施例中,生物反应器可产生1-200g的环状RNA(例如,1-10g、1-20g、1-50g、10-50g、10-100g、50-100g、或50-200g的环状RNA)。在一些实施例中,产生的量是测量值/升(例如,1-200g/升)、/批或反应(例如,1-200g/批或反应)、或/单位时间(例如,1-200g/小时或/天)。
在一些实施例中,可以串联使用多于一个生物反应器以增加生产能力(例如,可以串联使用一个、两个、三个、四个、五个、六个、七个、八个、或九个生物反应器)。
使用方法
在一些实施例中,本文所述的组合物或配制品在疗法和/或农业中用作效应子。
在一些实施例中,本披露提供了一种通过向受试者提供本文所述的组合物或配制品来改良该受试者的方法。在一些实施例中,该组合物或配制品是核酸分子或包括核酸分子(例如,本文所述的DNA分子或RNA分子),并且向原核系统提供该多核苷酸。在一些实施例中,该组合物或配制品是本文所述的原核细胞或包括本文所述的原核细胞。
在一些实施例中,本披露提供了一种通过向有需要的受试者提供本文所述的组合物或配制品治疗该受试者的病症的方法。在一些实施例中,该组合物或配制品是核酸分子或包括核酸分子(例如,本文所述的DNA分子或RNA分子),并且向原核受试者提供该多核苷酸。在一些实施例中,该组合物或配制品是本文所述的原核细胞或包括本文所述的原核细胞。
在一些实施例中,本披露提供了一种通过向受试者提供本文所述的原核细胞而向该受试者提供环状多核糖核苷酸的方法。
在一些实施例中,受试者包括真核细胞。在一些实施例中,受试者包括原核细胞。在一些实施例中,受试者包括脊椎动物、无脊椎动物、真菌、植物、或微生物。在一些实施例中,该受试者是脊椎动物(例如,哺乳动物、鸟、鱼、爬行动物、或两栖动物)。在一些实施例中,该受试者是人。在一些实施例中,该受试者是非人哺乳动物。在一些实施例中,该受试者是非人哺乳动物,如非人灵长类动物、有蹄类动物、肉食动物、啮齿动物、或兔类动物。在一些实施例中,该受试者是鸟、爬行动物、或两栖动物。在一些实施例中,受试者是无脊椎动物(例如,昆虫、蛛形纲、线虫、或软体动物)。在一些实施例中,该受试者是植物或真核藻类。在一些实施例中,该受试者是植物,如被子植物(其可以是双子叶植物或单子叶植物)或裸子植物(例如,针叶树、苏铁、买麻藤类植物(gnetophyte)、银杏)、蕨类、马尾植物、石松类、或苔藓植物。在实施例中,该受试者是具有农业或园艺重要性的植物,如行间作物、水果、蔬菜、树木、或观赏植物。在一些实施例中,微生物选自细菌、真菌、或古细菌。
配制品或组合物
在本披露的一些实施例中,可将本文所述的环状多核糖核苷酸(例如,通过本文所述的方法使用原核系统制备的环状多核糖核苷酸)提供为配制品或组合物,例如,用于递送至细胞、植物、无脊椎动物、非人脊椎动物、或人受试者的组合物,例如农业、兽用、或药物组合物。在一些实施例中,本披露提供了一种原核细胞(例如,通过本文所述的方法使用原核系统制备的原核细胞),该原核细胞可配制为例如用于递送至细胞、植物、无脊椎动物、非人脊椎动物、或人受试者的组合物,例如农业、兽用、或药物组合物。在一些实施例中,向受试者提供在适当的组合物中(例如,在农业、兽用、或药物配制品中)的本文所述的原核系统。
因此,在一些实施例中,本披露还涉及组合物,这些组合物包括环状多核糖核苷酸(例如,通过本文所述的原核方法制备的环状多核糖核苷酸)或包含该环状多核糖核苷酸的原核细胞和药学上可接受的载剂。在一个方面,本披露提供了药物组合物或兽用组合物,这些药物组合物或兽用组合物包括有效量的本文所述的多核糖核苷酸(或包含该多核糖核苷酸的原核细胞)和药学上可接受的赋形剂。本披露的药物组合物或兽用组合物可以包括如本文所述的多核糖核苷酸(或包含该多核糖核苷酸的原核细胞)与一种或多种药学上或生理学上可接受的载剂、赋形剂或稀释剂的组合。
在一些实施例中,药学上可接受的载剂可以是药物组合物或兽用组合物中除活性成分外的对受试者无毒的成分。药学上可接受的载剂可以包括但不限于缓冲液、赋形剂、稳定剂、或防腐剂。药学上可接受的载剂的实例是生理学上相容的溶剂、分散介质、包衣、抗细菌和抗真菌剂、等渗剂和吸收延迟剂等,如盐、缓冲液、糖、抗氧化剂、水性或非水性载剂、防腐剂、润湿剂、表面活性剂或乳化剂、或其组合。药物组合物或兽用组合物中的一种或多种药学上可接受的载剂的量可以基于一种或多种载剂的活性和所希望的配制品的特征(如稳定性和/或最小氧化)通过实验确定。
在一些实施例中,此类组合物可包括缓冲液,如乙酸、柠檬酸、组氨酸、硼酸、甲酸、琥珀酸、磷酸、碳酸、苹果酸、天冬氨酸、Tris缓冲液、HEPPSO、HEPES、中性缓冲盐水、磷酸盐缓冲盐水等;碳水化合物,如葡萄糖、蔗糖、甘露糖、或葡聚糖、甘露醇;蛋白质;多肽或氨基酸,如甘氨酸;抗氧化剂;螯合剂,如EDTA或谷胱甘肽;佐剂(例如,氢氧化铝);抗细菌剂和抗真菌剂;以及防腐剂。
在某些实施例中,本披露的组合物可配制用于多种肠胃外或非肠胃外施用方式。在一个实施例中,这些组合物可配制用于输注或静脉内施用。本文披露的组合物可以提供为例如可以缓冲至所希望的pH的无菌液体制剂,例如等渗水性溶液、乳液、悬浮液、分散体、或粘性组合物。适合于口服使用的配制品可以包括液体溶液、胶囊、药袋、片剂、锭剂、和糖锭剂、在适当的液体中的粉末液体悬浮液和乳液。
本披露的药物组合物或兽用组合物可以以适合待治疗或预防的疾病或病症的方式施用。施用的数量和频率将由如受试者的状况、以及受试者疾病或病症的类型和严重程度等因素确定,尽管适当的剂量可通过临床试验确定。
在实施例中,如本披露中描述的环状多核糖核苷酸以适合农业应用的配制品提供,例如作为液体溶液或乳液或悬浮液、浓缩物(液体、乳液、悬浮液、凝胶、或固体)、粉末、颗粒、糊剂、凝胶、饵剂、或种子包衣或种子处理剂。将此类农业配制品的实施例应用于植物或植物的环境,例如作为叶面喷雾、喷粉应用、颗粒应用、根或土壤浸透、沟内处理、颗粒土壤处理、饵剂、水培溶液、或可植入或可注射的配制品。此类农业配制品的一些实施例包括额外的组分,如赋形剂、稀释剂、表面活性剂、铺展剂、粘合剂、安全剂、稳定剂、缓冲液、漂移控制剂、保留剂、油浓缩物、消泡剂、泡沫标志物、香味剂、载剂、或封装剂。用于农业配制品的有用佐剂包括在Compendium of Herbicide Adjuvants[除草剂佐剂概要],第13版(2016)中披露的那些,可在www[dot]herbicide-adjuvants[dot]com上在线公开获得。在实施例中,含有如本披露中所述的环状多核糖核苷酸的农业配制品(或含有该环状多核糖核苷酸的原核细胞)进一步含有一种或多种选自由以下组成的组的组分:载剂、表面活性剂、润湿剂、铺展剂、阳离子脂质、有机硅、有机硅表面活性剂、抗氧化剂、多核苷酸除草分子、非多核苷酸除草分子、非多核苷酸有害生物分子、安全剂、昆虫信息素、昆虫引诱剂、和昆虫生长调节剂。
实施例
本文所述的原核系统、原核细胞、配制品、方法、和其他组合物的各种实施例在以下编号的实施例集合中阐述。
1.一种用于使多核糖核苷酸环化的原核系统,该原核系统包含:
(a)线性多核糖核苷酸,该线性多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中:
(A)包含5'自切割核酶;
(B)包含5'退火区;
(C)包含多核糖核苷酸负载物;
(D)包含3'退火区;并且
(E)包含3'自切割核酶;以及
(b)包含RNA连接酶的原核细胞。
2.如实施例1所述的原核系统,其中该5'自切割核酶能够在位于该5'自切割核酶的3'端的10个核糖核苷酸内的位点处或在位于该5'自切割核酶的3'端的位点处进行自切割。
3.如实施例1或2所述的原核系统,其中该5'自切割核酶是选自以下的核酶:锤头状核酶、发夹状核酶、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)核酶、glmS核酶、扭转核酶、扭转姐妹核酶、斧头核酶和手枪核酶。
4.如实施例3所述的原核系统,其中该5'自切割核酶是锤头状核酶。
5.如实施例1-4中任一项所述的原核系统,其中该5'自切割核酶包含与SEQ IDNO:16的核酸序列具有至少85%序列同一性的区域。
6.如实施例5所述的原核系统,其中该5'自切割核酶包含SEQ ID NO:16的核酸序列。
7.如实施例1或2所述的原核系统,其中该5'自切割核酶包含与SEQ ID NO:24-571中的任一者具有至少95%序列同一性的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。
8.如实施例7所述的原核系统,其中该5'自切割核酶包含SEQ ID NO:24-571中的任一者的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。
9.如实施例1-8中任一项所述的原核系统,其中该3'自切割核酶能够在位于该3'自切割核酶的5'端的10个核糖核苷酸内的位点处或在位于该3'自切割核酶的5'端的位点处进行自切割。
10.如实施例1-9中任一项所述的原核系统,其中该3'自切割核酶是选自以下的核酶:锤头状核酶、发夹状核酶、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)核酶、glmS核酶、扭转核酶、扭转姐妹核酶、斧头核酶和手枪核酶。
11.如实施例10所述的原核系统,其中该3'自切割核酶是丁型肝炎病毒(HDV)核酶。
12.如实施例1-10中任一项所述的原核系统,其中该3'自切割核酶包含与SEQ IDNO:21的核酸序列具有至少85%序列同一性的区域。
13.如实施例12所述的原核系统,其中该3'自切割核酶包含SEQ ID NO:21的核酸序列。
14.如实施例1-9中任一项所述的原核系统,其中该3'自切割核酶包含与SEQ IDNO:24-571中的任一者具有至少95%序列同一性的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。
15.如实施例14所述的原核系统,其中该3'自切割核酶包含SEQ ID NO:24-571中的任一者的核酸序列、或其对应的RNA等同物、或其有催化能力的片段。
16.如实施例1-15中任一项所述的原核系统,其中该5'自切割核酶的切割和该3'自切割核酶的切割产生连接酶相容的线性多核糖核苷酸。
17.如实施例1-16中任一项所述的原核系统,其中该5'自切割核酶的切割产生游离的5'-羟基基团,并且3'自切割核酶的切割产生游离的2',3'-环磷酸基团。
18.如实施例1-17中任一项所述的原核系统,其中该5'退火区具有2至100个核糖核苷酸。
19.如实施例1-18中任一项所述的原核系统,其中该3'退火区具有2至100个核糖核苷酸。
20.如实施例1-19中的一项所述的原核系统,其中该5'退火区包含具有在5与50个之间的核糖核苷酸的5’互补区;并且该3'退火区包含具有在5与50个之间的核糖核苷酸的3'互补区;并且
其中该5’互补区和该3’互补区具有在50%与100%之间的序列互补性;或
其中该5'互补区和该3'互补区具有低于-5kcal/mol的结合自由能;或
其中该5'互补区和该3'互补区具有至少10℃的结合Tm。
21.如实施例20所述的原核系统,其中该5'退火区进一步包含具有在5与50个之间的核糖核苷酸并且位于该5'互补区的5'的5'非互补区;并且3'退火区进一步包含具有在5与50个之间的核糖核苷酸并且位于该3'互补区的3'的3'非互补区;并且其中该5’非互补区和该3’非互补区具有在0%与50%之间的序列互补性;或其中该5'非互补区和该3'非互补区具有大于-5kcal/mol的结合自由能;或其中该5'非互补区和该3'非互补区具有低于10℃的结合Tm。
22.如实施例1-21中任一项所述的原核系统,其中该5'退火区包含与SEQ ID NO:17的核酸序列具有至少85%序列同一性的区域。
23.如实施例22所述的原核系统,其中该5'退火区包含SEQ ID NO:17的核酸序列。
24.如实施例1-23中任一项所述的原核系统,其中该3'退火区包含与SEQ ID NO:20的核酸序列具有至少85%序列同一性的区域。
25.如实施例24所述的原核系统,其中该3'退火区包含SEQ ID NO:20的核酸序列。
26.如实施例1-25中任一项所述的原核系统,其中该多核糖核苷酸负载物包含编码序列、或包含非编码序列、或包含编码序列和非编码序列的组合。
27.如实施例26所述的原核系统,其中该多核糖核苷酸负载物包含至少一个非编码RNA序列。
28.如实施例26或27所述的原核系统,其中该至少一个非编码RNA序列包含至少一个选自由以下组成的组的RNA:RNA适配体、长非编码RNA(lncRNA)、转移RNA衍生的片段(tRF)、转移RNA(tRNA)、核糖体RNA(rRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、和Piwi相互作用RNA(piRNA);或这些RNA中的任一者的片段。
29.如实施例26或27所述的原核系统,其中该至少一个非编码RNA序列包含调节RNA。
30.如实施例29所述的原核系统,其中该至少一个非编码RNA序列反式调节靶序列。
31.如实施例30所述的原核系统,其中该靶序列包含受试基因组的基因的核苷酸序列。
32.如实施例30或31所述的原核系统,其中该至少一个非编码RNA序列对该靶序列的反式调节是该靶序列的表达的上调。
33.如实施例30或31所述的原核系统,其中该至少一个非编码RNA序列对该靶序列的反式调节是该靶序列的表达的下调。
34.如实施例30或31所述的原核系统,其中该至少一个非编码RNA序列对该靶序列的反式调节是该靶序列的可诱导表达。
35.如实施例27所述的原核系统,其中该至少一个非编码RNA序列包含选自由以下组成的组的RNA:小干扰RNA(siRNA)或其前体、双链RNA(dsRNA)或至少部分双链RNA;发夹RNA(hpRNA)、微小RNA(miRNA)、或其前体;相位小干扰RNA(phasiRNA)或其前体;异染色质小干扰RNA(hcsiRNA)或其前体;以及天然反义短干扰RNA(natsiRNA)或其前体。
36.如实施例27所述的原核系统,其中该至少一个非编码RNA序列包含指导RNA(gRNA)或其前体。
37.如实施例26-36中任一项所述的原核系统,其中该多核糖核苷酸负载物包含编码多肽的编码序列。
38.如实施例26-37中任一项所述的原核系统,其中该多核糖核苷酸负载物包含与编码多肽的编码序列可操作地连接的IRES。
39.如实施例26-38中任一项所述的原核系统,其中该多核糖核苷酸负载物包含编码对受试者具有生物学作用的多肽的RNA序列。
40.如实施例39所述的原核系统,其中该多核糖核苷酸负载物包含编码多肽并且具有经密码子优化用于在该受试者中表达的核苷酸序列的RNA序列。
41.如实施例39或40所述的原核系统,其中该受试者包含(a)真核细胞;或(b)原核细胞。
42.如实施例39-41中任一项所述的原核系统,其中该受试者包含脊椎动物、无脊椎动物、真菌、植物、或微生物。
43.如实施例42所述的原核系统,其中该脊椎动物选自人、非人哺乳动物、爬行动物、鸟、两栖动物、或鱼。
44.如实施例42所述的原核系统,其中该无脊椎动物选自昆虫、蛛形纲、线虫、或软体动物。
45.如实施例42所述的原核系统,其中该植物选自单子叶植物、双子叶植物、裸子植物、或真核藻类。
46.如实施例42所述的原核系统,其中该微生物选自细菌、真菌、或古细菌。
47.如实施例1-46中任一项所述的原核系统,其中该线性多核糖核苷酸进一步包含在该5'退火区与该多核糖核苷酸负载物之间的、长度为至少5个多核糖核苷酸的间隔子区。
48.如实施例1-47中任一项所述的原核系统,其中该线性多核糖核苷酸进一步包含在该5'退火区与该多核糖核苷酸负载物之间的、长度为在5与1000个之间的多核糖核苷酸的间隔子区。
49.如实施例47或48所述的原核系统,其中该间隔子区包含聚A序列。
50.如实施例47或48所述的原核系统,其中该间隔子区包含聚A-C序列。
51.如实施例1-50中任一项所述的原核系统,其中该线性多核糖核苷酸是至少1kb。
52.如实施例1-51中任一项所述的原核系统,其中该线性多核糖核苷酸是1kb至20kb。
53.如实施例1-52中任一项所述的原核系统,其中该RNA连接酶对该原核细胞是内源的。
54.如实施例1-52中任一项所述的原核系统,其中该RNA连接酶对该原核细胞是异源的。
55.如实施例1-54中任一项所述的原核系统,其中通过在该原核细胞中将外源多核苷酸转录成编码该RNA连接酶的mRNA、并翻译编码该RNA连接酶的mRNA,向该原核细胞提供该RNA连接酶。
56.如实施例54所述的原核系统,其中向该原核细胞提供作为外源蛋白的RNA连接酶。
57.如实施例1-56中任一项所述的原核系统,其中该RNA连接酶是tRNA连接酶。
58.如实施例57所述的原核系统,其中该tRNA连接酶是T4连接酶、RtcB连接酶、TRL-1连接酶、Rnl1连接酶、Rnl2连接酶、LIG1连接酶、LIG2连接酶、PNK/PNL连接酶、PF0027连接酶、thpR ligT连接酶、ytlPor连接酶、或其变体。
59.如实施例58所述的原核系统,其中该RNA连接酶包含选自由SEQ ID NO:572-588组成的组的氨基酸序列。
60.如实施例1-56中任一项所述的原核系统,其中该RNA连接酶选自由以下组成的组:植物RNA连接酶、质体RNA连接酶、来自古细菌的RNA连接酶、细菌RNA连接酶、真核RNA连接酶、病毒RNA连接酶、或线粒体RNA连接酶、或其变体。
61.如实施例1-60中任一项所述的原核系统,其中向该原核细胞提供包含该线性多核苷酸的外源性多核糖核苷酸。
62.如实施例1-61中任一项所述的原核系统,其中在该原核细胞中将该线性多核糖核苷酸从向该原核细胞提供的外源性重组DNA分子瞬时转录。
63.如实施例1-61中任一项所述的原核系统,其中在该原核细胞中将该线性多核糖核苷酸从向该原核细胞提供的外源性DNA分子转录。
64.如实施例62或63所述的原核系统,其中该外源性DNA分子不整合到该原核细胞的基因组中。
65.如实施例62-64中任一项所述的原核系统,其中该外源性DNA分子包含与编码该线性多核糖核苷酸的DNA可操作地连接的异源性启动子。
66.如实施例65所述的原核系统,其中该异源性启动子是选自由以下组成的组的启动子:T7启动子、T6启动子、T4启动子、T3启动子、SP3启动子、或SP6启动子。
67.如实施例62或63所述的原核系统,其中在该原核细胞中将该线性多核糖核苷酸从并入该原核细胞的基因组中的重组DNA分子转录。
68.如实施例1-67中任一项所述的原核系统,其中该原核细胞在培养基中生长。
69.如实施例68所述的原核系统,其中该原核细胞包含在生物反应器中。
70.如实施例1-69中任一项所述的原核系统,其中该原核细胞是细菌细胞或古细菌细胞。
71.如实施例70所述的原核系统,其中该原核细胞是天然细菌群体的成员。
72.如实施例1-69中任一项所述的原核系统,其中该原核细胞是与真核生物体相关的微生物组的成员。
73.如实施例72所述的原核系统,其中该真核生物体是人、非人脊椎动物、无脊椎动物、真菌、或植物。
74.如实施例72所述的原核系统,其中该真核生物体是人、非人脊椎动物、无脊椎动物、真菌、或植物的寄生虫或病原体。
75.如实施例72所述的原核系统,其中该真核生物体是植物的无脊椎有害生物、或植物病原体的无脊椎动物载体。
76.如实施例72所述的原核系统,其中该真核生物体是被子植物或裸子植物,并且其中该原核细胞包含与该植物的根(根圈)或与该植物生长的土壤或生长培养基的微生物群落相关的微生物组的成员。
77.如实施例72所述的原核系统,其中该真核生物体是被子植物或裸子植物,并且其中该原核细胞包含与该植物的地上组织相关的微生物组的成员。
78.如实施例72或73所述的原核系统,其中该真核生物体是人、非人脊椎动物、或无脊椎动物,并且其中该原核细胞包含与该人、非人脊椎动物、或无脊椎动物的细胞、组织、或器官相关的微生物组的成员。
79.如实施例78所述的原核系统,其中该真核生物体是人、非人脊椎动物、或无脊椎动物,并且其中该原核细胞包含与该人、非人脊椎动物、或无脊椎动物的消化系统的细胞或组织相关的微生物组的成员。
80.如实施例72所述的原核系统,其中该真核生物体是昆虫,并且其中该原核细胞包含与该昆虫的细菌细胞相关的微生物组的成员。
81.一种配制品,该配制品包含如实施例1-80中任一项所述的原核系统。
82.如实施例81所述的配制品,其中该配制品是药物配制品、兽用配制品、或农业配制品。
83.一种产生环状RNA的方法,该方法包括在原核细胞中使(a)与(b)接触:
(a)线性多核糖核苷酸,该线性多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中:
(A)包含5'自切割核酶;
(B)包含5'退火区;
(C)包含多核糖核苷酸负载物;
(D)包含3'退火区;并且
(E)包含3'自切割核酶;以及
(b)RNA连接酶;其中该5'自切割核酶的切割和该3'自切割核酶的切割产生连接酶相容的线性多核糖核苷酸,并且其中该RNA连接酶连接该连接酶相容的线性多核糖核苷酸的5'端和3'端,从而产生环状RNA。
84.如实施例83所述的方法,其中将该环状RNA从该原核细胞分离。
85.如实施例83或84所述的方法,其中该RNA连接酶对该原核细胞是内源的。
86.如实施例83或84所述的方法,其中该RNA连接酶对该原核细胞是异源的。
87.一种环状RNA,该环状RNA通过如实施例83-86中任一项所述的方法产生。
88.一种配制品,该配制品包含如实施例87所述的环状RNA。
89.如实施例88所述的配制品,其中该配制品是药物配制品、兽用配制品、或农业配制品。
90.一种治疗有需要的受试者的病症的方法,该方法包括向该受试者提供如实施例88或89所述的配制品。
91.一种原核细胞,该原核细胞包含:
(a)线性多核糖核苷酸,该线性多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中:
(A)包含5'自切割核酶;
(B)包含5'退火区;
(C)包含多核糖核苷酸负载物;
(D)包含3'退火区;并且
(E)包含3'自切割核酶;以及
(b)RNA连接酶;其中该5'自切割核酶的切割和该3'自切割核酶的切割产生连接酶相容的线性多核糖核苷酸,并且其中该RNA连接酶能够连接该连接酶相容的线性多核糖核苷酸的5'端和3'端以产生环状RNA。
92.如实施例91所述的原核细胞,其中该RNA连接酶对该原核细胞是内源的。
93.如实施例91所述的原核细胞,其中该RNA连接酶对该原核细胞是异源的。
94.如实施例91所述的原核细胞,该原核细胞进一步包含该环状RNA。
95.一种向受试者提供环状RNA的方法,该方法包括向该受试者提供如实施例94所述的原核细胞。
96.一种治疗有需要的受试者的障碍的方法,该方法包括向该受试者提供如实施例94所述的原核细胞。
97.一种配制品,该配制品包含如实施例94所述的原核细胞。
98.如实施例97所述的配制品,其中该原核细胞是干燥的或冷冻的。
99.如实施例97或98所述的配制品,其中该配制品是药物配制品、兽用配制品、或农业配制品。
100.一种治疗有需要的受试者的障碍的方法,该方法包括向该受试者提供如实施例97-99中任一项所述的配制品。
实例
提出以下实例是为了向本领域普通技术人员提供可以如何使用、制备和评价本文所述的组合物和方法的描述,并且旨在纯粹作为本披露的示例,而不旨在限制诸位发明人认为是其发明的范围。表11汇总了提供的实例。
表11:关于在原核细胞中产生功能性环状RNA的实例的汇总
实例 标题
1 用于产生环状RNA的构建体设计
2 用于RNA连接酶表达的构建体设计
3 环状RNA构建体向原核细胞中的转化
4 原核系统中环状RNA的产生
5 从原核细胞进行的RNA的提取
6 环状RNA的确认和表征
7 RNA的产生效率的测量
8 RNA是功能性的
9 用于在原核系统中生成RNA的方法
10 环状RNA的多核苷酸负载物的改善的翻译效率
11 使用可诱导的异源性RNA聚合酶产生环状RNA
12 编码调节性非编码多核糖核苷酸的环状RNA的产生
13 在真核生物体中修饰靶基因的表达并引起表型的变化
14 用RT-PCR确认原核生物体中环状多核糖核苷酸的产生
实例1:用于产生环状RNA的构建体设计
本实例描述了DNA构建体(SEQ ID NO:12)的设计,该DNA构建体编码经设计已被加工成与连接酶相容的RNA的线性多核糖核苷酸。图1中提供了描绘DNA构建体的设计的示意图。该DNA构建体包括:用于组成型RNA表达的启动子(SEQ ID NO:2),该启动子位于编码线性多核糖核苷酸的DNA的5'并与之可操作地连接,其中该线性多核糖核苷酸包括(按5'至3'顺序):(A)在其3'端切割的5'自切割核酶(SEQ ID NO:3);(B)5'退火区(SEQ ID NO:4);(C)多核糖核苷酸负载物,该多核糖核苷酸负载物在这种情况下包括三个离散的元件,即荧光适配体(SEQ ID NO:5)、内部核糖体进入位点(IRES)(SEQ ID NO:6)、和报告基因(nanoluc,SEQ ID NO:7);(D)3'退火区(SEQ ID NO:9);以及(E)在其5'端切割的3'自切割核酶(SEQID NO:10);位于编码该线性多核苷酸的DNA的3'的是转录终止子序列(SEQ ID NO:11)。
将该DNA构建体(SEQ ID NO:12)转录以产生线性RNA(SEQ ID NO:13),该线性RNA从5'至3'包括:在其3'端切割的5'自切割核酶(SEQ ID NO:16);5'退火区(SEQ ID NO:17);编码包括pepper适配体、EMCV IRES、和Nanoluc报告基因的负载物的RNA(SEQ ID NO:19);3'退火区(SEQ ID NO:20);以及在其5'端切割的3'自切割核酶(SEQ ID NO:21)。表达后,该线性RNA自切割以产生具有游离的5'羟基和游离的3'单磷酸的连接酶相容的线性RNA(SEQID NO:14)。该连接酶相容的线性RNA被宿主细胞中的RNA连接酶环化。图1和图2中提供了描绘在原核系统中的环化的过程的示意图。
实例2:用于RNA连接酶表达的构建体设计
本实例描述了在原核系统中持续表达RNA连接酶的DNA构建体的设计。该构建体具有p15载体骨架,该p15载体骨架在多克隆位点处经修饰以从5'至3'包括:用于可诱导表达连接酶的启动子(SEQ ID NO:1)、编码RtcB RNA连接酶的编码序列(SEQ ID NO:15)、以及转录终止子序列(SEQ ID NO:11)。
向宿主细胞提供该DNA构建体。将宿主细胞的液体培养物培养至OD600=0.1,并添加IPTG至0.1mM的最终浓度,从而诱导RtcB RNA连接酶的表达。
实例3:环状RNA构建体向原核细胞中的转化
本实例描述了将DNA构建体转染到原核细胞中。如实例1和2中所述设计载体构建体并转化到大肠杆菌的BL21(DE3)细胞中。使细胞在50mL培养体积的250mL带挡板的锥形瓶中于37℃下在补充有抗生素的极品肉汤(Terrific Broth)中伴随250rpm振荡生长24小时。通过添加IPTG至0.1mM的最终浓度、或通过添加阿拉伯糖至1mM的最终浓度、或两者,在OD600为0.5处诱导培养物。
实例4:原核系统中环状RNA的产生
本实例描述了在原核系统中产生环状RNA。通过从1mL培养物的样品中收获细胞并测量适配体荧光和/或报告基因的表达来监测RNA的产生。为了使用适配体荧光测量RNA的产生,培养基中补充了500nM HBC525,该HBC525在与RNA负载物中的Pepper适配体结合时发出荧光;参见Chen等人(2019)Nature Biotechnol.[自然生物技术],37:1287-1293,doi:10.1038/s41587-019-0249-1。通过使用分光光度计测量525nm处的荧光来量化从DNA构建体产生的RNA的量。为了使用报告基因测量RNA的产生,将10μL的培养基添加到10μL的Nano-Glo测定缓冲液中,然后使用分光光度计测量所得的发光以定量Nanoluc报告基因的表达。该测定确认了在原核细胞中产生了环状RNA。
实例5:从原核细胞进行的RNA的提取
本实例描述了在从DNA构建体转录后从原核细胞中提取RNA。通过如实例4中所述的原核细胞产生RNA,然后将其从细胞中提取。RNA提取通过以下进行:离心1mL的培养物,将所得的细胞沉淀物重悬于100μL补充有300mM乙酸钠的Tris-EDTA缓冲液中,进行苯酚氯仿提取,随后进行两次氯仿和异戊醇洗涤。将水层用乙醇沉淀处理,并将沉淀重悬于无核酸酶的水中。
实例6:环状RNA的确认和表征
本实例描述了原核系统中RNA的环化的确认。使用凝胶移位法和/或聚A聚合酶法确认了线性RNA被环化,该线性RNA在如实例1中所述的原核系统中环化并如实例5中所述被提取。与线性RNA相比,观察到的凝胶移位确认了环状RNA的存在。
为了表征环状RNA,将1μg提取的RNA在50%甲酰胺中煮沸并加载到6%PAGE尿素凝胶上用于变性电泳。在分离核苷酸后,将凝胶用溴化乙锭染色并成像。通过观察与线性RNA种类相比的环状RNA的凝胶移位来确认RNA的环状性。额外地或可替代地,为了表征环状RNA,根据制造商的说明,用聚A聚合酶(新英格兰生物实验室公司(New England Biolabs))处理1μg提取的RNA。
在37℃下的1小时反应中,向线性多核糖核苷酸酶促添加长度为约100、200、或300个核苷酸的聚A尾。不将聚A尾添加到环状多核糖核苷酸中,因为它们不具有游离的3'端。用聚A尾处理后,通过在6%PAGE尿素凝胶上的凝胶电泳分析产物。所得的凝胶将未处理的样品与经聚A聚合酶处理的RNA提取物进行比较,以鉴定与观察到的环状RNA的分子量没有变化相比的线性RNA的分子量的变化。
实例7:RNA的产生效率的测量
本实例描述了用于测量原核系统中RNA的产生效率的方法。RNA产生效率表示为产生的所希望的RNA的质量/大肠杆菌细胞。首先,通过在600nm处的光密度(OD600)并通过在选择性培养基上铺板稀释系列来测量大肠杆菌培养密度,以确定OD600与菌落形成单位/毫升培养物(cfu/ml)之间的关系。如实例4中所述,通过从1mL培养物样品收获细胞并测量适配体荧光来监测RNA的产生。适配体荧光通过用500nM的HBC525补充培养来测量,该HBC525在与RNA负载物中的Pepper适配体结合时发出荧光。将大肠杆菌细胞中产生的RNA的荧光与通过体外转录(IVT)产生的同源RNA的标准曲线产生的荧光进行比较。使用分光光度计在体外测量适配体荧光。可替代地,适配体荧光可以通过以下来测量:染色含有分离的目的RNA的6%PAGE尿素凝胶,并与通过IVT产生并用500nM的HBC525处理的同源RNA的标准曲线进行比较,并使用ImageJ软件分析在大肠杆菌细胞中产生的RNA相较于通过IVT产生的RNA的相对亮度。该分析允许对大肠杆菌RNA产生进行定量。
实例8:RNA是功能性的
本实例确认了功能性蛋白从通过本文所述的方法生成的环状RNA表达。为了确认通过本文所述的方法生成的环状RNA保持功能性,使用测量本氏烟(Nicotianabenthamiana)相对根长的小麦胚芽提取物(普洛麦格公司(Promega Corporation))、TNTT7昆虫细胞提取蛋白表达系统(普洛麦格公司)对荧光素酶的表达进行定量。
根据制造商的说明,使用小麦胚芽提取物(WGE)体外翻译系统(普洛麦格公司)测量Nanoluc RNA报告子的表达。简言之,将如实例5中所述的1μg提取的RNA加热至75℃持续5分钟,然后在工作台上在室温下冷却20分钟。将RNA转移到1x小麦胚芽提取物并在30℃下孵育1小时。将混合物置于冰上并用水稀释4倍。然后在Nano-Glo荧光素酶测定(普洛麦格公司)中分析体外翻译反应的产物。将10μl的小麦胚芽提取产物与10μl的Nano-Glo测定缓冲液(普洛麦格公司)混合,并在分光光度计中测量发光。发光指示提取的RNA能够产生Nanoluc报告酶。
可替代地,根据制造商的说明,可以使用昆虫细胞提取物(ICE)体外翻译系统(普洛麦格公司)测量Nanoluc RNA报告子的表达。简言之,将如实例中所述的1μg提取的RNA加热至75℃持续5分钟,然后在工作台上在室温下冷却20分钟。将RNA转移到1x昆虫细胞提取物并在30℃下孵育1小时。将混合物置于冰上并用水稀释4倍。然后在Nano-Glo荧光素酶测定(普洛麦格公司)中分析体外翻译反应的产物。将10μl的昆虫细胞提取产物与10μl的Nano-Glo测定缓冲液(普洛麦格公司)混合,并在分光光度计中测量发光。
最后,使用体内靶基因的qRT-PCR测量RNA负载物的干扰潜力。通过用金刚砂摩擦接种物将如实例5中所述的RNA提取物施加至本氏烟的叶子。5天后,收获叶子并提取RNA。使用SuperScript IV VILO试剂盒(赛默飞世尔公司(ThermoFisher))根据制造商的说明使用针对目的靶基因和管家基因(如GAPDH)的引物进行qRT-PCR。比较RNA负载物处理和未处理样品中目的靶基因相比于管家基因的Δ-ΔCt值,计算RNA负载物的干扰活性。
实例9:用于在原核系统中生成RNA的方法
本实例描述了用于在包括原核细胞的原核系统中生成RNA构建体的方法。该方法可用于产生包括环状RNA的产物细胞。在本实例中,环状RNA在与植物(作为共生物或共生体)相关的细菌中产生。将以在实例1中所述的方式设计的DNA构建体转化到已从普通小麦(Triticum aestivum)的组织中分离的采后生防菌肠杆菌(Enterobacter cowanii)的感受态细胞中。使细胞在具有50mL培养体积的250mL带挡板的锥形瓶中于37℃下在补充有抗生素的极品肉汤中伴随250rpm振荡生长24小时。通过添加IPTG至0.1mM的最终浓度、或通过添加阿拉伯糖至1mM的最终浓度、或两者,在OD600为0.5处任选地诱导培养物。
在24小时后,使用离心收集培养物,之后用水洗涤细胞沉淀物2次。将洗涤过的细胞稀释至5x 1011个细胞/mL,并施加至表面灭菌的小麦种子。将以相同方式制备的未转化的细胞施加至表面灭菌的小麦种子作为对照。种子在非无菌土壤中发芽,并且使植物生长10天。
通过在选择性培养基中培养来从均质化的植物组织中分离细胞。如实例4中所述,通过测定适配体荧光或报告子表达来监测RNA的产生。
实例10:环状RNA的多核苷酸负载物的改善的翻译效率
本实例描述了包括多核苷酸负载物的环状RNA的实施例,该多核苷酸负载物包括一个或多个编码序列或表达序列。更具体地,本实例描述了对环状RNA序列的修饰,该修饰可改善功能性,例如,提高环状RNA的稳定性和/或提高由多核糖核苷酸负载物编码的多肽的翻译效率。
在实施例中,包括含有至少一个编码序列的多核糖核苷酸负载物的环状RNA经如下修饰:
(a)用5'UTR序列(例如SEQ ID NO:607、608、609、610、611、或619中的任一者)替代内部核糖体进入位点(IRES),该5'UTR序列在编码序列的5’并且(直接地或以插入序列)与之可操作地连接;
(b)包括3'UTR序列(例如,SEQ ID NO:612、613、614、615、616、617、618或620中的任一者),该3'UTR序列在编码序列的3'并且(直接地或以插入序列)与之可操作地连接;
(c)在DNA构建体中包括编码IRES或5'UTR的DNA序列以及编码3'UTR的DNA序列,该编码IRES或5'UTR的DNA序列(例如,SEQ ID NO:589、590、591、598、608、609、610、611或619中的任一者)在编码序列的5'并且与其可操作地连接,并且该编码3'UTR的DNA序列(选自SEQ ID NO:612、613、614、615、616、617、618或620)在多核苷酸负载物的3'并且与其可操作地连接。
多核糖核苷酸负载物的编码序列侧翼的这些修饰提高了编码序列的翻译效率。例如,与缺少5’UTR和3’UTR序列添加的对照RNA构建体(数据未示出)相比,包括(a)在负载物序列的5'并与其可操作地连接的sTNV 5'UTR(SEQ ID NO:607)、和(b)在负载物序列的3'并与其可操作地连接的sTNV 3'UTR(SEQ ID NO:612)二者的环状RNA在小麦胚芽提取物测定中具有提高了约5倍的翻译效率。在另一实例中,与缺少5’UTR和3’UTR序列添加的对照RNA构建体(数据未示出)相比,包括(a)在负载物序列的5'并与其可操作地连接的TCV 5'UTR(SEQ ID NO:619)、和(b)在负载物序列的3'并与其可操作地连接的TCV 3'UTR(SEQ ID NO:620)二者的环状RNA在昆虫细胞提取物测定中具有提高了约1.5倍的翻译效率。
实例11:使用可诱导的异源性RNA聚合酶产生环状RNA
本实例描述了产生环状RNA的方法的实施例。在本实施例中,将异源性RNA聚合酶与编码线性多核糖核苷酸前体的重组DNA构建体一起提供至细胞。
在一个实施例中,构建DNA载体以在可诱导表达控制下表达RNA聚合酶。在非限制性实例中,该DNA载体包括可操作地连接并驱动编码T7 RNA聚合酶的DNA的表达的乳糖诱导型(“lac”)启动子;在lac启动子和T7 RNA聚合酶基因之间任选地包括lac操纵子。该载体任选地包括编码T7 RNA聚合酶基因上游的核糖体结合位点(RBS)的DNA。该载体任选地包括编码T7 RNA聚合酶基因下游的终止子序列的DNA。该DNA载体任选地包括允许对表达该DNA载体的克隆进行选择的序列,例如,该DNA载体编码抗生素抗性基因,如卡那霉素抗性基因。
将乳糖诱导型T7RNA聚合酶载体与编码线性多核苷酸的DNA载体(例如,如实例1中所述的载体)共转染到原核细胞中,该线性多核苷酸是环状RNA的前体,该原核细胞例如自由生活的细菌或与真核生物体(作为共生物或共生体)相关的细菌,该真核生物体例如肠杆菌属(Enterobacter)、克雷伯氏菌属(Klebsiella)、或泛菌属(Pantoea)的细胞。原核细胞可以任选地与编码RNA连接酶(例如,在原核细胞的基因组中非天然编码的异源性RNA连接酶)的载体进一步共转化。
在实例中,将乳糖诱导型T7RNA聚合酶载体与DNA载体共转染到采后生防菌肠杆菌、产气克雷伯氏菌(Klebsiella aerogenes)和成团泛菌(Pantoea agglomerans)的细胞中,该DNA载体编码线性多核糖核苷酸(环状RNA的前体)并携带包括Pepper适配体的多核苷酸负载物(参见例如,实例1)。分别用100μg/ml、50μg/mL、25μg/ml的羧苄青霉素、卡那霉素和氯霉素抗生素在LB板上选择共转化体。将细胞转移到胰蛋白酶大豆肉汤中的液体培养物中,并在37℃下以250rpm振荡,直到获得光密度OD600=0.1。将培养物用0.1mM IPTG诱导,并在诱导后6小时收获。使用苯酚氯仿乙酸异戊酯提取、随后乙醇沉淀来纯化总RNA。通过用6%尿素PAGE分离总RNA来完成RNA制剂的质量控制。将凝胶用HBC525染色以观察含有Pepper适配体的RNA,并用溴化乙锭染色所有RNA。含有Pepper适配体的RNA被HBC525强烈染色;较高分子量条带的出现确认成功产生了含有Pepper适配体的环状RNA。
实例12:编码调节性非编码多核糖核苷酸的环状RNA的产生
本实例描述了产生具有包括非编码多核糖核苷酸的负载物的环状RNA的方法的实施例。更具体地,本实例描述了环状RNA的产生,该环状RNA包括调节RNA,即被加工成与靶基因结合并切割靶基因(在这种情况下,八氢番茄红素脱氢酶,PDS)的成熟miRNA的微小RNA前体(pri-miRNA或pre-miRNA)。
合成针对八氢番茄红素脱氢酶(PDS)基因的编码pri-miRNA(初级miRNA)(SEQ IDNO:622)的DNA载体(SEQ ID NO:621)和编码pre-miRNA(SEQ ID NO:624)的DNA载体(SEQ IDNO:623),并单独转染到大肠杆菌的细胞中。将转染的细胞在抗生素上进行选择并在37℃下以250rpm振荡在极品肉汤中生长。在OD600=0.1处用0.1mM IPTG诱导培养物。在诱导后6小时收获培养物,并使用苯酚氯仿乙酸异戊酯提取、随后乙醇沉淀来纯化RNA。通过用6%尿素PAGE分离总RNA来进行RNA制剂的质量控制。将凝胶用HBC525染色以观察含有Pepper适配体的RNA,并用溴化乙锭染色所有RNA。来自具有pre-miRNA构建体和pri-miRNA构建体的菌株的RNA在PAGE凝胶上得到了大小正确并且被HBC525强烈染色的条带,这指示成功产生了pre-miRNA和pri-miRNA分子。
实例13:在真核生物体中修饰靶基因的表达并引起表型的变化
本实例展示了向受试真核生物体提供环状RNA以修饰靶基因的表达并引起表型的变化。更具体地,本实例描述了使植物与环状miRNA接触,该环状miRNA包括下调该植物中靶基因的表达的调节性非编码RNA。
将实例12中产生的环状RNA作为总RNA提取物从细胞中分离。还从含有空载体的细胞分离出总RNA作为阴性对照。通过用金刚砂摩擦轻轻研磨烟草(本氏烟)和番茄(tomato)(番茄(Solanum lycopersicum))的叶子,然后施加10微克的总RNA。在施加RNA后3天和5天,从经处理的叶子(已施加环状RNA)和系统性叶子(经处理的叶子的远端)提取总RNA。使用与PDS基因和与管家基因杂交的寡核苷酸进行RT-qPCR用于归一化计算。观察到用从含有包含miRNA前体的载体的细胞分离的RNA处理的植物具有比用从含有空载体的细胞分离的RNA处理的植物更低的PDS(相对于管家基因)表达,这确认了环状RNA能够修饰(在这种情况下,下调)靶基因的表达。
在第二实验中,将靶向本氏烟的PDS基因的pri-miRNA负载物和pre-miRNA负载物在大肠杆菌细胞中进行序列确认,并如实例12中所述进行质量控制。通过用金刚砂摩擦将总RNA施加至烟草的叶子。将大约2-3μg之间的总RNA施加至每片叶子,或基于RNA定量的大约200ng-500ng的pri-miRNA或pre-miRNA。在施加后3天和5天收集经处理的叶子的样品。根据制造商的说明,使用Kingfisher液体处理器和Zymo植物RNA提取试剂盒提取总RNA。使用英杰公司(Invitrogen)SSIV Vilo试剂盒进行逆转录以生成cDNA。使用靶向PDS基因和pp2a管家基因的寡核苷酸进行定量PCR。通过比较PDS的Ct相对于pp2a的Ct计算所有样品的Δ-ΔCt值。将结果针对用来自缺少pri-miRNA或pre-miRNA的大肠杆菌的总RNA处理的阴性对照进行归一化。观察到用pri-miRNA或pre-miRNA处理的植物具有比用从含有空载体的细胞分离的RNA处理的植物更低的PDS(相对于管家基因)表达,这确认了从环状RNA产生的调节性非编码RNA能够修饰(在这种情况下,下调)靶基因的表达。
实例14:用RT-PCR确认原核生物体中环状多核糖核苷酸的产生
本实例描述了使用RT-PCR确认多核糖核苷酸的环状构象的一般方法。
将来自大肠杆菌细菌细胞的总RNA制剂用作逆转录酶(RT)反应的模板。使用随机六聚体起始反应。线性多核糖核苷酸产生了互补DNA(cDNA),该互补DNA(cDNA)具有比“单位长度”(即在5'与3'核酶切割位点之间的距离)短的长度。由于滚环扩增,环状多核糖核苷酸产生了较短(短于单位长度)和较长(长于单位长度)长度的cDNA。使用多核糖核苷酸序列内的寡核苷酸引物,将来自RT反应的cDNA产物用作PCR反应中的模板。单位长度cDNA的PCR扩增产生了单位长度的扩增子。长于单位长度的cDNA的PCR扩增产生了单位长度的扩增子和长于单位长度(典型地是整数倍单位长度,最常见的是两倍单位长度)的扩增子两者,这在凝胶上生成了特征性阶梯图案。在RNA连接酶不存在的情况下将体外生成的线性多核糖核苷酸用作环状多核糖核苷酸RT-PCR信号的阴性对照;这些PCR生成了缺少阶梯图案的单位长度的扩增子。将通过使体外生成的线性多核糖核苷酸与RNA连接酶接触而生成的环状多核糖核苷酸用作环状多核糖核苷酸RT-PCR信号的阳性对照;这些PCR生成了呈阶梯图案的长于单位长度的扩增子。以这种方式对来自细菌细胞(这些细菌细胞含有预定用于通过RNA连接酶进行环化的线性多核糖核苷酸前体)的总RNA进行的RT-PCR示出了长于单位长度的扩增子具有特征性阶梯图案,这确认了线性前体的环化,同时从缺少多核糖核苷酸的细菌细胞分离的总RNA没有示出这种图案。图3展示了细菌细胞中线性多核糖核苷酸的环化和环化RNA产物的RT-PCR检测的实例。测试了两种构建体,其编码各自的线性多核糖核苷酸前体“min1”(SEQ ID NO:625)(其具有392nt的未加工长度和在核酶切割后275nt的加工长度)、以及“min2”(SEQ ID NO:626)(其具有245nt的未加工长度和在核酶切割后128nt的加工长度)。min1的环化由阶梯图案指示,该阶梯图案由来自单位长度扩增子(275nt)和两倍单位长度扩增子(550nt)的条带形成。min 2的环化由阶梯图案指示,该阶梯图案由来自单位长度扩增子(128nt)和两倍单位长度扩增子(256nt)的条带形成。
验证线性RNA前体的环化的替代性方法使用地高辛标记和RNA印迹分析。简言之,使用DIG标记的UTP代替UTP,并使用编码线性多核糖核苷酸前体的DNA构建体的PCR扩增子作为模板,使用SP6 Mega IVT试剂盒根据制造商的说明在体外转录地高辛标记的RNA分子。将待分析的样品提取为来自转染的细菌细胞的总RNA,通过凝胶电泳分离,然后转移到硝酸纤维素膜上。按照制造商的方案(DIG Northern Starter试剂盒,罗氏公司(Roche),12039672910)制备被设计为具有与线性多核糖核苷酸前体互补的序列的地高辛标记的探针,将其纯化(例如,使用Monarch50ug RNA纯化柱),并用于在硝酸纤维素膜上使RNA可视化。
本申请提到的所有引用的专利和专利公开均通过引用以其全文并入本文。本文披露和要求保护的所有材料和方法都可以如通过上述披露指示的和通过实例说明的进行制备和使用,而无需进行过多实验。尽管与本发明相关的材料和方法已在实施例和说明性实例方面进行了描述,但对于本领域技术人员而言将显而易见的是,在不背离本发明的概念、精神和范围的情况下,可以对本文所述的材料和方法做出替代和变化。因此,本发明的广度和范围不应受上述任一实例的限制,而应仅根据前述实施例、以下权利要求、以及它们的等同物来定义。
序列表
<110> 旗舰创业创新七公司(FLAGSHIP PIONEERING INNOVATIONS VII, LLC)
<120> 原核系统中环状多核糖核苷酸的产生
<130> P13756WO00
<150> 63/189610
<151> 2021-05-17
<150> 63/166467
<151> 2021-03-26
<160> 626
<170> PatentIn 3.5版
<210> 1
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1
taatacgact cactataggg aat 23
<210> 2
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 2
cgatgcttct ttgagcgaac gatcaaaaat aagtgccttc ccatcaaaaa aatattctca 60
acataaaaaa ctttgtgtaa tacttgtaac gctg 94
<210> 3
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 3
tttcccctga tgagtccgtg aggacgaaac gagtaagctc gtcgggaaa 49
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 4
gggaaaaaaa tgccgtcggt 20
<210> 5
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 5
ttggaccaat cgtggcgtgt cggcctgctt cggcaggcac tggcgccgtc cag 53
<210> 6
<211> 464
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 6
gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct 60
cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc 120
ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga 180
caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc 240
ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt 300
attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg 360
gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc taggcccccc 420
gaaccacggg gacgtggttt tcctttgaaa aacacgatga taat 464
<210> 7
<211> 516
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 7
atggtcttca cactcgaaga tttcgttggg gactggcgac agacagccgg ctacaacctg 60
gaccaagtcc ttgaacaggg aggtgtgtcc agtttgtttc agaatctcgg ggtgtccgta 120
actccgatcc aaaggattgt cctgagcggt gaaaatgggc tgaagatcga catccatgtc 180
atcatcccgt atgaaggtct gagcggcgac caaatgggcc agatcgaaaa aatttttaag 240
gtggtgtacc ctgtggatga tcatcacttt aaggtgatcc tgcactatgg cacactggta 300
atcgacgggg ttacgccgaa catgatcgac tatttcggac ggccgtatga aggcatcgcc 360
gtgttcgacg gcaaaaagat cactgtaaca gggaccctgt ggaacggcaa caaaattatc 420
gacgagcgcc tgatcaaccc cgacggctcc ctgctgttcc gagtaaccat caacggagtg 480
accggctggc ggctgtgcga acgcattctg gcgtaa 516
<210> 8
<211> 1036
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 8
ttggaccaat cgtggcgtgt cggcctgctt cggcaggcac tggcgccgtc caggagggcc 60
cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 120
ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 180
caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 240
ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 300
cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 360
aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 420
tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaaac gtctaggccc cccgaaccac 480
ggggacgtgg ttttcctttg aaaaacacga tgataatgcc accatggtct tcacactcga 540
agatttcgtt ggggactggc gacagacagc cggctacaac ctggaccaag tccttgaaca 600
gggaggtgtg tccagtttgt ttcagaatct cggggtgtcc gtaactccga tccaaaggat 660
tgtcctgagc ggtgaaaatg ggctgaagat cgacatccat gtcatcatcc cgtatgaagg 720
tctgagcggc gaccaaatgg gccagatcga aaaaattttt aaggtggtgt accctgtgga 780
tgatcatcac tttaaggtga tcctgcacta tggcacactg gtaatcgacg gggttacgcc 840
gaacatgatc gactatttcg gacggccgta tgaaggcatc gccgtgttcg acggcaaaaa 900
gatcactgta acagggaccc tgtggaacgg caacaaaatt atcgacgagc gcctgatcaa 960
ccccgacggc tccctgctgt tccgagtaac catcaacgga gtgaccggct ggcggctgtg 1020
cgaacgcatt ctggcg 1036
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 9
accgacggca aaaaaaaaaa 20
<210> 10
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 10
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60
aatgggac 68
<210> 11
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 11
gaaatcatcc ttagcgaaag ctaaggattt tttttatctg aaat 44
<210> 12
<211> 1268
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 12
cttatcgaaa ttaatacgac tcactatagg gaattttccc ctgatgagtc cgtgaggacg 60
aaacgagtaa gctcgtcggg aaaaaaatgc cgtcggtttg gaccaatcgt ggcgtgtcgg 120
cctgcttcgg caggcactgg cgccgtccag gagggcccgg aaacctggcc ctgtcttctt 180
gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc tgttgaatgt 240
cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg tagcgaccct 300
ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa agccacgtgt 360
ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt ggatagttgt 420
ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg atgcccagaa 480
ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta catgtgttta 540
gtcgaggtta aaaaaacgtc taggcccccc gaaccacggg gacgtggttt tcctttgaaa 600
aacacgatga taatgccacc atggtcttca cactcgaaga tttcgttggg gactggcgac 660
agacagccgg ctacaacctg gaccaagtcc ttgaacaggg aggtgtgtcc agtttgtttc 720
agaatctcgg ggtgtccgta actccgatcc aaaggattgt cctgagcggt gaaaatgggc 780
tgaagatcga catccatgtc atcatcccgt atgaaggtct gagcggcgac caaatgggcc 840
agatcgaaaa aatttttaag gtggtgtacc ctgtggatga tcatcacttt aaggtgatcc 900
tgcactatgg cacactggta atcgacgggg ttacgccgaa catgatcgac tatttcggac 960
ggccgtatga aggcatcgcc gtgttcgacg gcaaaaagat cactgtaaca gggaccctgt 1020
ggaacggcaa caaaattatc gacgagcgcc tgatcaaccc cgacggctcc ctgctgttcc 1080
gagtaaccat caacggagtg accggctggc ggctgtgcga acgcattctg gcgtaaaccg 1140
acggcaaaaa aaaaaaggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac 1200
atgcttcggc atggcgaatg ggacgaaatc atccttagcg aaagctaagg atttttttta 1260
tctgaaat 1268
<210> 13
<211> 1195
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 13
ggaauuuucc ccugaugagu ccgugaggac gaaacgagua agcucgucgg gaaaaaaaug 60
ccgucgguuu ggaccaaucg uggcgugucg gccugcuucg gcaggcacug gcgccgucca 120
ggagggcccg gaaaccuggc ccugucuucu ugacgagcau uccuaggggu cuuuccccuc 180
ucgccaaagg aaugcaaggu cuguugaaug ucgugaagga agcaguuccu cuggaagcuu 240
cuugaagaca aacaacgucu guagcgaccc uuugcaggca gcggaacccc ccaccuggcg 300
acaggugccu cugcggccaa aagccacgug uauaagauac accugcaaag gcggcacaac 360
cccagugcca cguugugagu uggauaguug uggaaagagu caaauggcuc uccucaagcg 420
uauucaacaa ggggcugaag gaugcccaga agguacccca uuguauggga ucugaucugg 480
ggccucggug cacaugcuuu acauguguuu agucgagguu aaaaaaacgu cuaggccccc 540
cgaaccacgg ggacgugguu uuccuuugaa aaacacgaug auaaugccac cauggucuuc 600
acacucgaag auuucguugg ggacuggcga cagacagccg gcuacaaccu ggaccaaguc 660
cuugaacagg gagguguguc caguuuguuu cagaaucucg ggguguccgu aacuccgauc 720
caaaggauug uccugagcgg ugaaaauggg cugaagaucg acauccaugu caucaucccg 780
uaugaagguc ugagcggcga ccaaaugggc cagaucgaaa aaauuuuuaa ggugguguac 840
ccuguggaug aucaucacuu uaaggugauc cugcacuaug gcacacuggu aaucgacggg 900
guuacgccga acaugaucga cuauuucgga cggccguaug aaggcaucgc cguguucgac 960
ggcaaaaaga ucacuguaac agggacccug uggaacggca acaaaauuau cgacgagcgc 1020
cugaucaacc ccgacggcuc ccugcuguuc cgaguaacca ucaacggagu gaccggcugg 1080
cggcugugcg aacgcauucu ggcguaaacc gacggcaaaa aaaaaaaggc cggcaugguc 1140
ccagccuccu cgcuggcgcc ggcugggcaa caugcuucgg cauggcgaau gggac 1195
<210> 14
<211> 1079
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 14
gggaaaaaaa ugccgucggu uuggaccaau cguggcgugu cggccugcuu cggcaggcac 60
uggcgccguc caggagggcc cggaaaccug gcccugucuu cuugacgagc auuccuaggg 120
gucuuucccc ucucgccaaa ggaaugcaag gucuguugaa ugucgugaag gaagcaguuc 180
cucuggaagc uucuugaaga caaacaacgu cuguagcgac ccuuugcagg cagcggaacc 240
ccccaccugg cgacaggugc cucugcggcc aaaagccacg uguauaagau acaccugcaa 300
aggcggcaca accccagugc cacguuguga guuggauagu uguggaaaga gucaaauggc 360
ucuccucaag cguauucaac aaggggcuga aggaugccca gaagguaccc cauuguaugg 420
gaucugaucu ggggccucgg ugcacaugcu uuacaugugu uuagucgagg uuaaaaaaac 480
gucuaggccc cccgaaccac ggggacgugg uuuuccuuug aaaaacacga ugauaaugcc 540
accauggucu ucacacucga agauuucguu ggggacuggc gacagacagc cggcuacaac 600
cuggaccaag uccuugaaca gggaggugug uccaguuugu uucagaaucu cggggugucc 660
guaacuccga uccaaaggau uguccugagc ggugaaaaug ggcugaagau cgacauccau 720
gucaucaucc cguaugaagg ucugagcggc gaccaaaugg gccagaucga aaaaauuuuu 780
aagguggugu acccugugga ugaucaucac uuuaagguga uccugcacua uggcacacug 840
guaaucgacg ggguuacgcc gaacaugauc gacuauuucg gacggccgua ugaaggcauc 900
gccguguucg acggcaaaaa gaucacugua acagggaccc uguggaacgg caacaaaauu 960
aucgacgagc gccugaucaa ccccgacggc ucccugcugu uccgaguaac caucaacgga 1020
gugaccggcu ggcggcugug cgaacgcauu cuggcguaaa ccgacggcaa aaaaaaaaa 1079
<210> 15
<211> 1227
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 15
atgaattacg aattactgac cactgaaaat gccccggtaa aaatgtggac caaaggcgtg 60
ccggtagagg ccgatgcgcg tcagcaactt attaatacgg cgaagatgcc gtttattttc 120
aaacatattg cggtaatgcc tgatgtacac ctgggtaaag gttccaccat tggtagcgtg 180
atcccgacca aaggggcgat tattccggcg gcggtgggcg tggatattgg ctgtggaatg 240
aacgcgctgc gtaccgcgtt aacggcggaa gacctgcctg aaaacctggc agagctgcgt 300
caggcgattg aaacggccgt gccgcacggg cgtaccactg gccgttgtaa acgtgataaa 360
ggtgcctggg aaaatccacc tgttaacgtc gatgctaaat gggctgagct tgaagccggt 420
tatcagtggt taacgcaaaa atatccccgt ttcctgaata ccaataacta taaacacctg 480
ggaacgctgg gaaccggtaa ccactttatt gaaatctgcc ttgatgagtc ggaccaggtg 540
tggattatgc tgcactccgg ttcacgcgga attggtaacg ccatcgggac ttactttatc 600
gatctggcac aaaaagagat gcaggaaacg cttgagacgt tgccgtcgcg tgatctggcg 660
tactttatgg aaggtacgga atactttgat gattacctga aagccgtggc ctgggcgcag 720
ctttttgcca gccttaaccg cgatgcgatg atggaaaacg tggtaacggc attgcagagc 780
attacgcaga aaacggtcag acagccacaa acgctggcga tggaagagat caactgtcac 840
cacaactatg tgcaaaaaga acagcacttt ggtgaagaga tctacgtgac gcgtaaaggc 900
gcggtgtctg cgcgtgctgg tcaatatgga attattcccg gttcgatggg agcaaaaagc 960
tttatcgtcc gtgggctggg aaatgaagag tcgttctgtt cgtgcagcca cggtgccggg 1020
cgggtaatga gccgaactaa agcgaaaaaa ctgttcagcg tggaagatca aattcgtgcc 1080
accgcgcatg tggaatgccg taaagatgcc gaagtgatcg acgaaatccc gatggcgtat 1140
aaagatattg atgcggtgat ggcggcacaa agcgatctgg tggaagttat ctataccctg 1200
cgtcaggtgg tgtgcgtaaa aggataa 1227
<210> 16
<211> 49
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 16
uuuccccuga ugaguccgug aggacgaaac gaguaagcuc gucgggaaa 49
<210> 17
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 17
gggaaaaaaa ugccgucggu 20
<210> 18
<211> 464
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 18
gagggcccgg aaaccuggcc cugucuucuu gacgagcauu ccuagggguc uuuccccucu 60
cgccaaagga augcaagguc uguugaaugu cgugaaggaa gcaguuccuc uggaagcuuc 120
uugaagacaa acaacgucug uagcgacccu uugcaggcag cggaaccccc caccuggcga 180
caggugccuc ugcggccaaa agccacgugu auaagauaca ccugcaaagg cggcacaacc 240
ccagugccac guugugaguu ggauaguugu ggaaagaguc aaauggcucu ccucaagcgu 300
auucaacaag gggcugaagg augcccagaa gguaccccau uguaugggau cugaucuggg 360
gccucggugc acaugcuuua cauguguuua gucgagguua aaaaaacguc uaggcccccc 420
gaaccacggg gacgugguuu uccuuugaaa aacacgauga uaau 464
<210> 19
<211> 1036
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 19
uuggaccaau cguggcgugu cggccugcuu cggcaggcac uggcgccguc caggagggcc 60
cggaaaccug gcccugucuu cuugacgagc auuccuaggg gucuuucccc ucucgccaaa 120
ggaaugcaag gucuguugaa ugucgugaag gaagcaguuc cucuggaagc uucuugaaga 180
caaacaacgu cuguagcgac ccuuugcagg cagcggaacc ccccaccugg cgacaggugc 240
cucugcggcc aaaagccacg uguauaagau acaccugcaa aggcggcaca accccagugc 300
cacguuguga guuggauagu uguggaaaga gucaaauggc ucuccucaag cguauucaac 360
aaggggcuga aggaugccca gaagguaccc cauuguaugg gaucugaucu ggggccucgg 420
ugcacaugcu uuacaugugu uuagucgagg uuaaaaaaac gucuaggccc cccgaaccac 480
ggggacgugg uuuuccuuug aaaaacacga ugauaaugcc accauggucu ucacacucga 540
agauuucguu ggggacuggc gacagacagc cggcuacaac cuggaccaag uccuugaaca 600
gggaggugug uccaguuugu uucagaaucu cggggugucc guaacuccga uccaaaggau 660
uguccugagc ggugaaaaug ggcugaagau cgacauccau gucaucaucc cguaugaagg 720
ucugagcggc gaccaaaugg gccagaucga aaaaauuuuu aagguggugu acccugugga 780
ugaucaucac uuuaagguga uccugcacua uggcacacug guaaucgacg ggguuacgcc 840
gaacaugauc gacuauuucg gacggccgua ugaaggcauc gccguguucg acggcaaaaa 900
gaucacugua acagggaccc uguggaacgg caacaaaauu aucgacgagc gccugaucaa 960
ccccgacggc ucccugcugu uccgaguaac caucaacgga gugaccggcu ggcggcugug 1020
cgaacgcauu cuggcg 1036
<210> 20
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 20
accgacggca aaaaaaaaaa 20
<210> 21
<211> 68
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 21
ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggcg 60
aaugggac 68
<210> 22
<211> 44
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 22
gaaaucaucc uuagcgaaag cuaaggauuu uuuuuaucug aaau 44
<210> 23
<211> 1227
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 23
augaauuacg aauuacugac cacugaaaau gccccgguaa aaauguggac caaaggcgug 60
ccgguagagg ccgaugcgcg ucagcaacuu auuaauacgg cgaagaugcc guuuauuuuc 120
aaacauauug cgguaaugcc ugauguacac cuggguaaag guuccaccau ugguagcgug 180
aucccgacca aaggggcgau uauuccggcg gcggugggcg uggauauugg cuguggaaug 240
aacgcgcugc guaccgcguu aacggcggaa gaccugccug aaaaccuggc agagcugcgu 300
caggcgauug aaacggccgu gccgcacggg cguaccacug gccguuguaa acgugauaaa 360
ggugccuggg aaaauccacc uguuaacguc gaugcuaaau gggcugagcu ugaagccggu 420
uaucaguggu uaacgcaaaa auauccccgu uuccugaaua ccaauaacua uaaacaccug 480
ggaacgcugg gaaccgguaa ccacuuuauu gaaaucugcc uugaugaguc ggaccaggug 540
uggauuaugc ugcacuccgg uucacgcgga auugguaacg ccaucgggac uuacuuuauc 600
gaucuggcac aaaaagagau gcaggaaacg cuugagacgu ugccgucgcg ugaucuggcg 660
uacuuuaugg aagguacgga auacuuugau gauuaccuga aagccguggc cugggcgcag 720
cuuuuugcca gccuuaaccg cgaugcgaug auggaaaacg ugguaacggc auugcagagc 780
auuacgcaga aaacggucag acagccacaa acgcuggcga uggaagagau caacugucac 840
cacaacuaug ugcaaaaaga acagcacuuu ggugaagaga ucuacgugac gcguaaaggc 900
gcggugucug cgcgugcugg ucaauaugga auuauucccg guucgauggg agcaaaaagc 960
uuuaucgucc gugggcuggg aaaugaagag ucguucuguu cgugcagcca cggugccggg 1020
cggguaauga gccgaacuaa agcgaaaaaa cuguucagcg uggaagauca aauucgugcc 1080
accgcgcaug uggaaugccg uaaagaugcc gaagugaucg acgaaauccc gauggcguau 1140
aaagauauug augcggugau ggcggcacaa agcgaucugg uggaaguuau cuauacccug 1200
cgucaggugg ugugcguaaa aggauaa 1227
<210> 24
<211> 61
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P3型扭转核酶,URS0000D66A6B_12908
<400> 24
caugcucagc ggucccaagu ccgcaucaaa gccugagggc ugcaguaaag guacugagcu 60
g 61
<210> 25
<211> 76
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P3型扭转核酶,URS0000D6AAF0_12908
<400> 25
uuauuuagcc gucuaaaguc ggcaaugaau ugagauagca cccuguaaau uuucagggug 60
uaaacaaacu aaauga 76
<210> 26
<211> 72
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P3型扭转核酶,URS0000D6663E_12908
<400> 26
uuaauugccg guugccaguc cguuaaauug ugagcagucc ggccauugug ccggauuaaa 60
caaaccaauu aa 72
<210> 27
<211> 72
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P3型扭转核酶,URS0000D6C266_12908
<400> 27
uuaguuaacg guugcacguc cgauaaauug ugagcagucc cggagcaauc cgggauuaaa 60
caaacuaacu aa 72
<210> 28
<211> 74
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P3型扭转核酶,URS0000D6AF2A_12908
<400> 28
ugauuuaggc guuccaaacc gccgcaaauu gugaggacug cucgccaaaa gcgggcagua 60
aacaaguuaa auca 74
<210> 29
<211> 80
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P3型扭转核酶,URS0000D6A2C3_12908
<400> 29
aauucuugcg guucaaaguc cgcguaaaau ccagaugaca cauucccgua auaaacggga 60
guguguaaug aacaagaauu 80
<210> 30
<211> 73
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P3型扭转核酶,URS0000D6726E_12908
<400> 30
acacccaccu guuacaaguc aggacagaag cagaguaacg guugcuuacg caaccgguaa 60
ugcuacuggg ugu 73
<210> 31
<211> 74
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P3型扭转核酶,URS0000D66C2E_12908
<400> 31
caauaaagcg guuacaagcc cgcaaaaaua gcagaguaau gucgcgauag cgcggcauua 60
augcagcuuu auug 74
<210> 32
<211> 72
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D659B0_12908
<400> 32
uguuuaaugc agccaugagu auuuaauacu augaagguga uaagcuccuu guaaaguaau 60
gcagaaucga ca 72
<210> 33
<211> 57
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6D1CA_12908
<400> 33
gccguaaagc cacuaugacc ggguugcaag ucccggcugc gauaggcuga gcacggu 57
<210> 34
<211> 119
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D67E2B_12908
<400> 34
guucuaaugc agccagcacg acuuugucau agauaaaaua ucauuaauac acuauuuaca 60
cagauguaug cgauuacuag ugcugggagu ccuaagccuc cauaaaugca gaagggaac 119
<210> 35
<211> 93
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D68054_12908
<400> 35
ucuguaaccc caccaccgug gacauccugg cagggauaau ggccaggaug aucauggugg 60
agguccaaag uccucaaaag aggggauggc aga 93
<210> 36
<211> 84
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6D330_12908
<400> 36
acaauaaugc ggccucgcua ccaauacgca uuuauuagua uugguaacgu gacaguccca 60
agccuguaaa acgcagaggg uugu 84
<210> 37
<211> 57
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6A800_12908
<400> 37
gucguaaugc agccguugcc acgugccaag ucguggauua gaaaugcaga ggcggaa 57
<210> 38
<211> 61
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D68297_12908
<400> 38
gguguaaugc gacucgcuca cagagcgaca gguucacagu ccuacaaacg cagaugacac 60
c 61
<210> 39
<211> 97
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D68DD8_12908
<400> 39
agcuuaauac agguagauaa gcaagcaagg ugcggcuauc uacacggucc caacuccgua 60
aagguuagag ugacaacuaa ucgaaguaga gggagcu 97
<210> 40
<211> 52
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D66D37_12908
<400> 40
uaaauaaugu cgccaaugga gguaucaagc ccucauaaag acagagauaa aa 52
<210> 41
<211> 73
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D68577_12908
<400> 41
acguuaaugu ggcuguaugu gugggugcac acacauacac uagucccaag ccuagguaaa 60
cacagaggga uug 73
<210> 42
<211> 62
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D68F79_12908
<400> 42
aaaguaaugc aacuacaaga aauuguaucg gugacaaguc cgagauaaau gcagagucau 60
uu 62
<210> 43
<211> 56
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D68EE0_12908
<400> 43
ucuguaauga ugccgauggc gguugcaagc ccgcaggaag aaacucagag cacaga 56
<210> 44
<211> 55
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D67CC2_12908
<400> 44
acuauaaucu ugccaucguc aguuccaagc cugagugaga aaaagagagg auagu 55
<210> 45
<211> 58
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D65864_12908
<400> 45
acucuaaccc agcggcaauc uuuugcccgu guccgaagcc acuaaugggg acgggagu 58
<210> 46
<211> 55
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D68DB5_12908
<400> 46
ccgcuaacca ugccguggcc agucccaagc cuggauguga aaaugggagg ggcgg 55
<210> 47
<211> 60
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6B540_12908
<400> 47
uuuuuaauga agccacagug aucacuguga ggguccuaag ccccuaauuc agaagggaaa 60
<210> 48
<211> 68
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6A03C_12908
<400> 48
uguguaaugc uacuaugaua gcacauugcg aaucauacgg guugcaaguc ccucaagcag 60
agcacacg 68
<210> 49
<211> 51
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6C02F_12908
<400> 49
uuuuuaaccc agccagagac ggucacaagc ccgugaaaug gggaguggaa a 51
<210> 50
<211> 58
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6AF09_12908
<400> 50
gcucuaaugu ggccacccga cagggugugu guuucaagcc accaacacag agaagagc 58
<210> 51
<211> 83
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D67A5B_12908
<400> 51
gguguaacac ggcuauaguc aggcauuaca agauuaaguc cugcuauaaa ggucuaaagc 60
ccuuguaaac aguggauagc acu 83
<210> 52
<211> 57
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D66DD2_12908
<400> 52
uguguaaugc gagcauugua uggucacaac uccauaauua aaaacgcaga gugcaca 57
<210> 53
<211> 56
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D667E4_12908
<400> 53
gcuuuaacac agccaaagaa gguuccaagc ccuuuaguga aauuguggag gaaagc 56
<210> 54
<211> 67
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6A251_12908
<400> 54
aaaguaaugc agccgcccgc cgcgcgcggg gacgucggua gcaagcccgu guaaugcaga 60
guuuucu 67
<210> 55
<211> 61
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6A995_12908
<400> 55
gcuuuaaugc ggcccguuuu gauacggcag guuacaagcc cugguaaacg cagaguagag 60
c 61
<210> 56
<211> 69
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6A5FC_12908
<400> 56
uucguaaugc ggccgugcug guaacguucc agcgcgacgg ucccaagccc gaaaaacgca 60
gagggagaa 69
<210> 57
<211> 80
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D67156_12908
<400> 57
ccgguaaugc ggcacgcgug gucacaagcc caccgcccuu cguugagcgg aaacguucac 60
guugggacgc agagugacgg 80
<210> 58
<211> 53
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6CC8F_12908
<400> 58
ggcuuaacuc agccaacggc gguccaaagc ccgcguguaa ugaggaugga gcc 53
<210> 59
<211> 66
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D65A05_12908
<400> 59
agcguaaugu agccuagucc gacuuuggac uagaggguuc acagccccuu uaauacagau 60
gacgca 66
<210> 60
<211> 81
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6967F_12908
<400> 60
gguguaaagc uacuaaacag gcaauacaaa aauaaguccu guuuaaaggu ucaaaguccu 60
uguaaaaaag cugaugacac g 81
<210> 61
<211> 62
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6755D_12908
<400> 61
ccucuaaugc ggcccggcau ggugccggac ggugguaagc ccgugcaaac gcagaaccua 60
gg 62
<210> 62
<211> 52
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D68D61_12908
<400> 62
cucguaaugc ggcgaaccgg uggcaagccc ggugguggac gcagagccag ag 52
<210> 63
<211> 53
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D67BA2_12908
<400> 63
uccucaaugc ggcaagccgg ugacaagccc ggcgguagac gcagagucaa gga 53
<210> 64
<211> 62
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6B09E_12908
<400> 64
uuuguaaugu ggccuaaauu uuuauuuaga acguuccaag ccguuaaaac acagaggaca 60
aa 62
<210> 65
<211> 55
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D65D7A_12908
<400> 65
cucuuaaagu ugccuaagaa cguugcaagc cguuuuacga aaaacugagc aagaa 55
<210> 66
<211> 71
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D694CE_12908
<400> 66
auuguaaugc agcauauaga uguauuaaca ccuauauaga guucaaagcc ucuacaaaug 60
cagaugacaa u 71
<210> 67
<211> 72
<212> RNA
<213> 豌豆蚜(Acyrthosiphon pisum)
<220>
<223> 豌豆蚜(Acyrthosiphon pisum)(豌豆蚜虫)P1型扭转核酶,URS0000D68632_7029
<400> 67
uuuuuaauca uaccaguagu cuaauuuuua gauuacugac aguccuaagu cuguaaaaaa 60
ugagaaggga aa 72
<210> 68
<211> 106
<212> RNA
<213> 未知
<220>
<223> 未分类的序列RAGATH-1锤头状核酶,URS0000D67356_12908
<400> 68
aacucagcua gggagaguau aacauucaug uugacgagac cuagacgaaa cacagaggaa 60
aauuauuaau cacuggauag uauuaguaau gacucugugu ccauga 106
<210> 69
<211> 77
<212> RNA
<213> 未知
<220>
<223> 未分类的序列RAGATH-1锤头状核酶,URS0000D6976A_12908
<400> 69
uugucagcua aggagacaga aaaauuaucu acugaugaga cuuagccgaa accaccucuu 60
uuaggggugg ucuagau 77
<210> 70
<211> 85
<212> RNA
<213> 未知
<220>
<223> 未分类的序列RAGATH-1锤头状核酶,URS0000D6B94F_12908
<400> 70
aagucagcca ggagacuaua aaauucauac ugaugagacu ggacgaaaua ccuaguaaca 60
guuguacguu auuagguauc uauga 85
<210> 71
<211> 119
<212> RNA
<213> 未知
<220>
<223> 未分类的序列RAGATH-1锤头状核酶,URS0000D698D3_12908
<400> 71
aacucagcua gggagaguag cgagcauuac guaauacuac guauuacucc aauaacauug 60
ucacugauga gaccuagacg aaacuacggu aaacauuugc aucauacugu agucugaua 119
<210> 72
<211> 76
<212> RNA
<213> 未知
<220>
<223> 未分类的序列RAGATH-1锤头状核酶,URS0000D68882_12908
<400> 72
aagacagccu aggagucuau aaaauaugug cugacgagac uaggacgaaa cuauccucag 60
uugaggauag uccacu 76
<210> 73
<211> 73
<212> RNA
<213> 未知
<220>
<223> 未分类的序列RAGATH-1锤头状核酶,URS0000D6A535_12908
<400> 73
aagacagucu aggagucuau aaaauuguua cugaagagac uagaacgaaa cuucuuuaau 60
uagaagucua aca 73
<210> 74
<211> 63
<212> RNA
<213> 未知
<220>
<223> 未分类的序列RAGATH-1锤头状核酶,URS0000D6B98C_12908
<400> 74
aacucaacca ggagaguaua aaauguuuac ugaugagacu ggacgaaacc aauagguuua 60
aac 63
<210> 75
<211> 74
<212> RNA
<213> 未知
<220>
<223> 未分类的序列RAGATH-1锤头状核酶,URS0000D68B88_12908
<400> 75
aagacaucca ggagucuaua aaauagucac ugaugagacu ggacgaaacc ucugcuauau 60
guagaggucu gauu 74
<210> 76
<211> 163
<212> DNA
<213> 未知
<220>
<223> 韦荣氏球菌属物种(Veillonella sp.)CAG:933基因组支架,scf58,HF986131.1
<400> 76
attgcctgtg aaggtagtgc atatttttat tattagatca tcagaagatg acaagcatgt 60
ggggcgtaag tagtattttt atgcgggaga agaagaatgg caattgttct aattagtact 120
gataattgca aatactatga tcgtgcggac gttaaaatca tgc 163
<210> 77
<211> 176
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F2-X_000328,BAAZ01000328.1
<400> 77
ttataatgtt agcataaata caataaagtt aatgcagtag aaatactgcg ctctttaagg 60
tgagaatcct tgacaagcat gtggggctta tatctattca tacagagcaa gtacgtacgg 120
gaaagcttaa aatactcatc tgtaaaatag tattagtgca gactttaaaa tcatgc 176
<210> 78
<211> 128
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F1-T_010313,BAAV01010313.1
<400> 78
acagaaaaag aagctaaaga agcaagaaag tattactgtg agaatcagta ataagcatgt 60
ggggcttatg tcttatcaaa agggtggcca acttttagat agcattagtg cggacgttaa 120
aatcatgc 128
<210> 79
<211> 157
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组1091142135580,全基因组鸟枪序列,AACY021400709.1
<400> 79
acattttgtg gttttaaggg ttaatcctta aggttgataa accttgacaa gcctatgggg 60
ctactatagt attctcttat tacgggtaag agtatcaagc ataagcgaaa ttccgtgctt 120
atgtaatgct aagttagtgc agacttaaaa attaggc 157
<210> 80
<211> 170
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:In-A_012728,BABB01012728.1
<400> 80
cttgttcgtg agaataggtg caattgccta aatgaatgtc ttcagaagat gacaaacctg 60
tggggcgtaa gtaataaaga gtctgaaaga ttgcagataa gagtatgcac ttattggcaa 120
tatgcatacc agaataattt attatgatcg tgcggacgtt aaaatcaggt 170
<210> 81
<211> 159
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F2-X_000328,BAAZ01000328.1
<400> 81
tcagtctgtg aagatagagt atacgtcctc agaagatgac aaacctgtgg ggcgtaagta 60
aatgcatatc gtatattatt cccttgaata cggcaatagc gggtaatatc cgagatactc 120
gtatttgtgt ttataatcgt gcagacgtta aaatcaggt 159
<210> 82
<211> 78
<212> DNA
<213> 达马拉鼹鼠(Fukomys damarensis)
<220>
<223> 达马拉鼹鼠(Fukomys damarensis)重叠群106618,全基因组鸟枪序列,AYUG01106618.1
<400> 82
ggaggataac agggggccac agcacaagcg ttcacgtcgc agcccctgtc ggattctgag 60
gaatctgcga attctgca 78
<210> 83
<211> 78
<212> DNA
<213> 欧亚野猪(Sus scrofa)
<220>
<223> 欧亚野猪(Sus scrofa)TJ分离株塔巴斯克(Tabasco)品种杜洛克(Duroc)染色体14,全基因组鸟枪序列,CM000825.5
<400> 83
agaggataac tggcagccac agtagaagca ttcacattgt ggtccatgtc agattctggt 60
gaatttgcaa attctgct 78
<210> 84
<211> 78
<212> DNA
<213> 美国短吻鳄(Alligator mississippiensis)
<220>
<223> 美国短吻鳄(Alligator mississippiensis)ScZkoYb_60,全基因组鸟枪序列,AKHW03000178.1
<400> 84
tttatgtcac tgggggccat agcggaagtg ttcatatcat ggccccaatc ggattccaac 60
aaatctgaga attctgct 78
<210> 85
<211> 77
<212> DNA
<213> 矛尾鱼(Latimeria chalumnae)
<220>
<223> 矛尾鱼(Latimeria chalumnae)重叠群145668,全基因组鸟枪序列,AFYH01145668.1
<400> 85
gggtactatt gggggaccgt agcaggagcg ttcacatcgc ggtccctgtc agactattac 60
agtctgcgaa tcctgct 77
<210> 86
<211> 83
<212> DNA
<213> 美国短吻鳄(Alligator mississippiensis)
<220>
<223> 美国短吻鳄(Alligator mississippiensis)ScZkoYb_55,全基因组鸟枪序列,AKHW03006769.1
<400> 86
attgcagctt agggggccat agcagaagca ttcatgttgc agcccctgtc aggtaatagc 60
tggtaatacc tgctaattct gat 83
<210> 87
<211> 79
<212> DNA
<213> 矛尾鱼(Latimeria chalumnae)
<220>
<223> 矛尾鱼(Latimeria chalumnae)重叠群100904,全基因组鸟枪序列,AFYH01100904.1
<400> 87
attgtttatt ttgggggcca tagcagaagt gttcatgtcg cggcccctgt cagattctta 60
tgaatctgca aattctgct 79
<210> 88
<211> 78
<212> DNA
<213> 矛尾鱼(Latimeria chalumnae)
<220>
<223> 矛尾鱼(Latimeria chalumnae)重叠群227694,全基因组鸟枪序列,AFYH01227694.1
<400> 88
ttacccacaa ctggggccat agcagaagcg ttcatgtcgc ggcccctgtc atattcttac 60
aaacctgtga attctgct 78
<210> 89
<211> 75
<212> DNA
<213> 佛罗里达文昌鱼(Branchiostoma floridae)
<220>
<223> 佛罗里达文昌鱼(Branchiostoma floridae)基因组支架BRAFLscaffold_190,全基因组鸟枪序列,GG666606.1
<400> 89
cgccactaca tgggggccac agaaggagcg ttcacgtcgc ggtccctgtc aggtgttcta 60
cctgcggatc cttct 75
<210> 90
<211> 83
<212> DNA
<213> 扬子鳄(Alligator sinensis)
<220>
<223> 扬子鳄(Alligator sinensis)未放置的基因组支架scaffold150_1,全基因组鸟枪序列,KE695878.1
<400> 90
agcagttggc taggggtcat agtagaagtg ttcatgccac aacccctgtc aggtaatacc 60
tagtaatacc tgcaaattct gct 83
<210> 91
<211> 81
<212> DNA
<213> 美国短吻鳄(Alligator mississippiensis)
<220>
<223> 美国短吻鳄(Alligator mississippiensis)ScZkoYb_1.1,全基因组鸟枪序列,AKHW03001485.1
<400> 91
agaggtcaca agtccgaggc cgcggcagaa gtgctcacgg cacgggccct gtcagattcc 60
agcgaatctg caaattctgc t 81
<210> 92
<211> 77
<212> DNA
<213> 美国短吻鳄(Alligator mississippiensis)
<220>
<223> 美国短吻鳄(Alligator mississippiensis)ScZkoYb_58,全基因组鸟枪序列,AKHW03000416.1
<400> 92
caggggttgc atgaggccat agcaaaagca ctcacagtgc tgccctgtca gattccaaca 60
aatctgcaaa ttctgct 77
<210> 93
<211> 83
<212> DNA
<213> 美国短吻鳄(Alligator mississippiensis)
<220>
<223> 美国短吻鳄(Alligator mississippiensis)ScZkoYb_121,全基因组鸟枪序列,AKHW03004037.1
<400> 93
aatgctttga tgggggtcat agcagaagca ttaatgttgt gacccctgtc aggtaatacc 60
tgataatacc tgtgaattct gct 83
<210> 94
<211> 78
<212> DNA
<213> 矛尾鱼(Latimeria chalumnae)
<220>
<223> 矛尾鱼(Latimeria chalumnae)重叠群110885,全基因组鸟枪序列,AFYH01110885.1
<400> 94
tgcacatcta tgggggcctt agcagaagca ttcacgtcgc agcccctgtc ggattcttaa 60
gaatttgcga attctgct 78
<210> 95
<211> 78
<212> DNA
<213> 扬子鳄(Alligator sinensis)
<220>
<223> 扬子鳄(Alligator sinensis)未放置的基因组支架scaffold277_1,全基因组鸟枪序列,KE695937.1
<400> 95
caattaagat gcagggccac agcagacatg tttatgttgt ggtccctgtc ggattctaat 60
gaatctgaga attctgct 78
<210> 96
<211> 75
<212> DNA
<213> 紫海胆(Strongylocentrotus purpuratus)
<220>
<223> 紫海胆(Strongylocentrotus purpuratus)重叠群100549_fixed,全基因组鸟枪序列,AAGJ05100549.1
<400> 96
acagtaaaaa agtggggcca ttgaaggagc gttcacgtcg tggtccctgt cagatgaaaa 60
tctgcgaatc cttca 75
<210> 97
<211> 76
<212> DNA
<213> 美国短吻鳄(Alligator mississippiensis)
<220>
<223> 美国短吻鳄(Alligator mississippiensis)ScZkoYb_244,全基因组鸟枪序列,AKHW03003332.1
<400> 97
agttgctata acggccacaa cagaaatgtt cacatcgtgg ccccggtcag attccagcaa 60
atctgcaaat tctgct 76
<210> 98
<211> 81
<212> DNA
<213> 美国短吻鳄(Alligator mississippiensis)
<220>
<223> 美国短吻鳄(Alligator mississippiensis)ScZkoYb_72,全基因组鸟枪序列,AKHW03000533.1
<400> 98
agaggttaca agtgcaaggc cagagcagaa gtgttcacag catagccctt gtcagatacc 60
aatgaatctg tgaattctgc t 81
<210> 99
<211> 78
<212> DNA
<213> 矛尾鱼(Latimeria chalumnae)
<220>
<223> 矛尾鱼(Latimeria chalumnae)重叠群070068,全基因组鸟枪序列,AFYH01070068.1
<400> 99
agcttgcgaa tgggggccat agcagaagag ttcacgtcgc ggcccctgtc agagttctac 60
gaatttgcga attctgct 78
<210> 100
<211> 78
<212> DNA
<213> 九带犰狳(Dasypus novemcinctus)
<220>
<223> 九带犰狳(Dasypus novemcinctus)cont2.425401,全基因组鸟枪序列,AAGV020425402.1
<400> 100
atagaagata atggggccac agcagaagca ttcatgttgc agcccttgtg agattcaagt 60
gaatctgtga attctgct 78
<210> 101
<211> 104
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.106基因组支架,全基因组鸟枪序列,CH477291.1
<400> 101
tacccagcaa atcctatccc tacctcctta aggtactggc tgaagtacga gtaactttag 60
gaaagatcgg gtaaccaacc ccggtccaat tctgactgag aagg 104
<210> 102
<211> 96
<212> DNA
<213> 微小按蚊(Anopheles minimus)
<220>
<223> 微小按蚊(Anopheles minimus)MINIMUS1株系未放置的基因组支架supercont1.16,全基因组鸟枪序列,KB663677.1
<400> 102
cactggcaaa atccgatccc tgcctccacg tggcgctgct ggatgtcggt tttggtgagg 60
cttatcacct cagccaagac ctaaccaaag ggacgg 96
<210> 103
<211> 116
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群96443,全基因组鸟枪序列,JXUM01096443.1
<400> 103
ttcccaacaa ctcctatccc tacctcctcg tgacactcac tggaccgcca gctactttag 60
acaagatcgg ataacccacc ctgacggata atttggccgt tggctgacag ggcagg 116
<210> 104
<211> 133
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.33基因组支架,全基因组鸟枪序列,CH477218.1
<400> 104
tgctcagcaa ctcctatccc tacctcctcg tggtactggt acgagtatgg gtggtaccgg 60
tacgagtaac cttggggaag atcgggtaac caatcccggg gggggaactt tggtcgtatg 120
cagacaggga agg 133
<210> 105
<211> 123
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.2284基因组支架,全基因组鸟枪序列,CH479147.1
<400> 105
tgtccagtaa ctcctatccc tacctccccg tggtgccgcc tggggtacga gtaatcgtag 60
gcaacattgg gtaaccaacc ctgacaggga aggctcctct cttctgtatg ctgacaggga 120
agg 123
<210> 106
<211> 109
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群57437,全基因组鸟枪序列,JXUM01057437.1
<400> 106
tgcccagcaa ctcttatccc tacttcctcg tggtaccagc cggaaactac gagaaaccta 60
agggaagatc gggtaaccac aagtgtggcg ggggcgcaga gggggggag 109
<210> 107
<211> 92
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群160006,全基因组鸟枪序列,JXUM01160006.1
<400> 107
tgcccagcac ctcctatccc tgcctccacg cggtagggaa gatcgggtaa ccaaccccgg 60
tgagaagttt ggtcgtaggc tgacagggaa gg 92
<210> 108
<211> 106
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.267基因组支架,全基因组鸟枪序列,CH477452.1
<400> 108
tgcacagcaa ctcctatccc tatctcctcg cggtactgac cgaggtacga gcaaccttag 60
ggaagatcgg gttctgcaaa cctagagcgt ctgtacatgg agtagg 106
<210> 109
<211> 110
<212> DNA
<213> 中华按蚊(Anopheles sinensis)
<220>
<223> 中华按蚊(Anopheles sinensis)未放置的基因组支架AS2_scf7180000690996,全基因组鸟枪序列。
<400> 109
tattcttgaa ctccgatccc aacctcctcg tggtgctagc tgaagtatga tcttggaact 60
tattaagttc ttcagcacat tgtgcaacga tcgtatacca atagggacgg 110
<210> 110
<211> 135
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.263基因组支架,全基因组鸟枪序列,KE524294.1
<400> 110
tgcctagcaa ctcctatccc tacctcttca tggtactgcc cggggtactg gccggagtat 60
tagcaactca agcaattaga gaagatcggg taactaaccc cggtctcaac tttgatcgta 120
tgctgatatg gaagg 135
<210> 111
<211> 99
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群149242,全基因组鸟枪序列,JXUM01149242.1
<400> 111
tgcccagcaa ctccaatccc tacatccgcg aggtaccggt tgtagactac gagcaccgag 60
caaccggtgg taactttggt cgtattctga cagggaagg 99
<210> 112
<211> 76
<212> DNA
<213> 长须白蛉(Lutzomyia longipalpis)
<220>
<223> 长须白蛉(Lutzomyia longipalpis)重叠群2844,全基因组鸟枪序列,AJWK01002842.1
<400> 112
ggtaatccaa ctcctacttc aacctccacg tggtgacacc tgggcaccca atttattggg 60
tggctaactg aagagg 76
<210> 113
<211> 113
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.353基因组支架,全基因组鸟枪序列,CH477538.1
<400> 113
tgctcagcag ctcctatctc tacctcgtcg cattactggc cggggtccga gcaaccttat 60
ggaaaatcgc cccaaccccg agggaaactt tggtcgtatg ctgacaggga agg 113
<210> 114
<211> 64
<212> DNA
<213> 麻蝇金小蜂(Trichomalopsis sarcophagae)
<220>
<223> 麻蝇金小蜂(Trichomalopsis sarcophagae)Alberta株系scaffold25490,全基因组鸟枪序列,NNAY01025263.1
<400> 114
ggcgtacaaa atcctatcgt gcaacctccc cgtggtgtat gccgggttat gctaatgcgg 60
aagg 64
<210> 115
<211> 76
<212> DNA
<213> 豌豆蚜(Acyrthosiphon pisum)
<220>
<223> 豌豆蚜(Acyrthosiphon pisum)LSR1株系重叠群29506,全基因组鸟枪序列,ABLF02028779.1
<400> 115
ggtcggtgaa gtcctacccc caccaccacg tggtgccgac tggaaacgga actccggttc 60
cagccaacgg gggagg 76
<210> 116
<211> 99
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群110469,全基因组鸟枪序列,JXUM01110469.1
<400> 116
tgcccagcaa ctcctatccc tacctcctcg cggtaccggc cggaaactat aaggcaatct 60
agcgctcatc acccttctct ctcaagcaaa cacagaaga 99
<210> 117
<211> 95
<212> DNA
<213> 微小按蚊(Anopheles minimus)
<220>
<223> 微小按蚊(Anopheles minimus)MINIMUS1株系未放置的基因组支架supercont1.12,全基因组鸟枪序列,KB663633.1
<400> 117
cattggcaaa atcctattcc tacctcctcg tggtgctggt ggatgagggc atgctgagtc 60
tcactagctc agtatgtctt aactaaaagg gaagg 95
<210> 118
<211> 95
<212> DNA
<213> 眼斑雀鳝(Lepisosteus oculatus)
<220>
<223> 眼斑雀鳝(Lepisosteus oculatus)连锁群LG14,全基因组鸟枪序列,CM001417.1
<400> 118
ggctggcaaa atcctatcac cacctcctcg cggtgccagg tggatacggc tggatacaac 60
tggatacaac gactcgttgg aactaacggt gaagg 95
<210> 119
<211> 96
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.686基因组支架,全基因组鸟枪序列,CH477871.1
<400> 119
tggccagcac ctcccatccc cacctccttg tggtactggc cagggtacga gcaaccaatc 60
ccggtggaca ctcttgtcgt atgctgacag ggaaag 96
<210> 120
<211> 126
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.594基因组支架,全基因组鸟枪序列,CH477779.1
<400> 120
tgcccagcaa ctcttatccc tacctcctct tacttcctcg tggtaatggc cagggtacga 60
gcaaccttag ggaagatcgg ataaccaacc ctggtgagag ctctcgtcgt atgctggcag 120
ggaagg 126
<210> 121
<211> 98
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群77081,全基因组鸟枪序列,JXUM01077081.1
<400> 121
taaccaggaa ctcctatccc tacctccccg cggtactgac cgggatacga tcagtcccaa 60
tcaccgtggg aactttggtc gtatgctgac agggaagg 98
<210> 122
<211> 88
<212> DNA
<213> 法老按蚊(Anopheles farauti)
<220>
<223> 法老按蚊(Anopheles farauti)FAR1株系未放置的基因组支架supercont2.12,全基因组鸟枪序列,KI915051.1
<400> 122
ggccggcaaa gcccgacccc cacctcctcg tggtgccggc tggatgcata agaccctacc 60
cgtcgtgggt tgcagccaac gggggcgg 88
<210> 123
<211> 89
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.1120基因组支架,全基因组鸟枪序列,CH478303.1
<400> 123
tgccaagaaa ctcctcccca acctcctcgt ggtactggcc gggctacgag taaccttgga 60
gaactttagt cgtatgatga caagaaagg 89
<210> 124
<211> 97
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群8119,全基因组鸟枪序列,JXUM01008119.1
<400> 124
tgcccagcaa ctcttatccc tacctccacg tggtaccgca cagaaaaaaa aatattcatg 60
taaaattcag cgacaaatca tgcacataaa gggaatg 97
<210> 125
<211> 130
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.1096基因组支架,全基因组鸟枪序列,CH478279.1
<400> 125
tgctcagtaa ctcctatccc tgacctcccc gaggtgccgg ctggggtgcg aacaacccaa 60
aggttgaaag gcgaattcac gtagcctaat gagctcaaag cgaactcagg tcgcatgctg 120
acagggaagg 130
<210> 126
<211> 80
<212> DNA
<213> 长红锥蝽(Rhodnius prolixus)
<220>
<223> 长红锥蝽(Rhodnius prolixus)Rhodnius_prolixus-3.0.3-200.47,全基因组鸟枪序列,ACPB03013890.1
<400> 126
tgctcggtaa aatctgatct ctacctcctt gtggtcctac caggaccttt tacctactaa 60
gaataggcca acagagacgg 80
<210> 127
<211> 102
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群176146,全基因组鸟枪序列,JXUM01176146.1
<400> 127
tgcccagcaa caccaacccc tacctccgcg gggcaccagc cggactgcat gcggctgtat 60
gcggactaca tgggaccttt ggtcgtaggc tgacagggaa gg 102
<210> 128
<211> 109
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群103962,全基因组鸟枪序列,JXUM01103962.1
<400> 128
tgcccagcaa ctcctatccc tacctcctcg tggtaccggc cggaaactat gattagcatc 60
acggggatca tcaagaataa tttcggaccg cacaagctaa atgggtgag 109
<210> 129
<211> 97
<212> DNA
<213> 淡色按蚊(Anopheles albimanus)
<220>
<223> 淡色按蚊(Anopheles albimanus)ALBI9_A株系cont1.2834,全基因组鸟枪序列,APCK01002835.1
<400> 129
cgtctcggaa cacctatctc tacctccacg tggtgcctgc tggattatgg tgcatgcgac 60
ggtacagctc acatgaacca tataccgaca gagaagg 97
<210> 130
<211> 81
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群45626,全基因组鸟枪序列,JXUM01045626.1
<400> 130
tgcccagcaa ctcctatccc tacctcctcg tggtactggt tggaaactac gctggaatca 60
acgtccgagt tccagggaag g 81
<210> 131
<211> 82
<212> DNA
<213> 淡色按蚊(Anopheles albimanus)
<220>
<223> 淡色按蚊(Anopheles albimanus)ALBI9_A株系染色体3L,全基因组鸟枪序列,CM008154.1
<400> 131
aactcggaac tcctatcctc acctccacgt ggtgccggct ggaatatgat tgtattagtc 60
tatcatatac agacgaggaa gg 82
<210> 132
<211> 108
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.1004基因组支架,全基因组鸟枪序列,CH478188.1
<400> 132
tgcccagcaa ctcctatccc tacctcctcg tggtactggc cggggtacga gttgttgatc 60
taagcaaccg gaagtccatg tccatgatca aagcacccat agaggaag 108
<210> 133
<211> 94
<212> DNA
<213> 斯氏按蚊(Anopheles stephensi)
<220>
<223> 斯氏按蚊(Anopheles stephensi)SDA-500株系未放置的基因组支架supercont1.615,全基因组鸟枪序列,KB664972.1
<400> 133
tgctttagaa ctccgatctc aaacctcctc gtggtgctgg ctggaggata attgttgcac 60
attttacaca acaattattc actgattgag acgg 94
<210> 134
<211> 94
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.438基因组支架,全基因组鸟枪序列,CH477623.1
<400> 134
agcccagcaa ctcctatccc tacctcctcg tggtactggc cggctgcgaa aggcctggaa 60
aagtttcaga aaatggagtc gctaaaaccg aagg 94
<210> 135
<211> 120
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.461基因组支架,全基因组鸟枪序列,CH477646.1
<400> 135
tgcccaataa ttcctatccc tatctcccca cgatgccgcc cagagtacga gtaatcatct 60
ttccgatctt ttccagtaat caaccccggt gagaccttgg tcgtatgctg acaagaaagg 120
<210> 136
<211> 134
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.161基因组支架,全基因组鸟枪序列,CH477346.1
<400> 136
tgcccagcaa ctcctatccc tacctcctcg tggtactggc cggggtacga gtaaccttgg 60
ggaagtagta ggaagtagta ggaaggagta accaaccccc ggtgggaact ttggtcgtat 120
gctgacagga aagg 134
<210> 137
<211> 80
<212> DNA
<213> 赤拟谷盗(Tribolium castaneum)
<220>
<223> 赤拟谷盗(Tribolium castaneum)格鲁吉亚(Georgia ) GA2株系连锁群LGX,全基因组鸟枪序列,CM000276.3
<400> 137
tcctggcaaa aatgctctaa acctccacgt ggttcttgct ggacaaatta gttattagct 60
aatttgacca attagagcaa 80
<210> 138
<211> 89
<212> DNA
<213> 法老按蚊(Anopheles farauti)
<220>
<223> 法老按蚊(Anopheles farauti)FAR1株系未放置的基因组支架supercont2.15,全基因组鸟枪序列,KI915054.1
<400> 138
gcctttggaa ctccgttttc taacctccac gtggtgctgg ctggaatatg gtctttcctt 60
tatggtcgat catatacaaa tagaaacgg 89
<210> 139
<211> 105
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.281基因组支架,全基因组鸟枪序列,CH477466.1
<400> 139
tgttcatcaa ctcctatccc tacctcctcg cggtactgtc cggggtacga gcaaccttag 60
agaagatccc gcaacggctt cgtggcgcga gccgagatgt gcagg 105
<210> 140
<211> 104
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群134552,全基因组鸟枪序列,JXUM01134552.1
<400> 140
aacccagtaa ctccgatccc ttccttcacg cggcgccggc cggggtgcga ccatccgaaa 60
ggtagattaa gcttgaagct taggtcgtat gttgacaggg aagg 104
<210> 141
<211> 119
<212> DNA
<213> 未知
<220>
<223> 致倦库蚊(Culex pipiens quinquefasciatus)supercont3.1335基因组支架,全基因组鸟枪序列,DS233147.1
<400> 141
tgttcagtaa ctccgatacc ctggcctccc cgcggcgctg gccgggatac tagtaaccat 60
tggagagatc gggtaaccaa ccccggtggg aactatggta gtatgctgac agggtaagg 119
<210> 142
<211> 83
<212> DNA
<213> 表皮按蚊(Anopheles epiroticus)
<220>
<223> 表皮按蚊(Anopheles epiroticus)epiroticus2株系未放置的基因组支架supercont1.133,全基因组鸟枪序列,KB669981.1
<400> 142
ggccgacaaa accctctccc aacctccacg tggtgtcggc tggaaagtgc ctcatgtaat 60
gttgcattta ccaactggga agg 83
<210> 143
<211> 104
<212> DNA
<213> 淡色按蚊(Anopheles albimanus)
<220>
<223> 淡色按蚊(Anopheles albimanus)ALBI9_A株系染色体3R,全基因组鸟枪序列,CM008155.1
<400> 143
aatctcggaa ctcctatccc cacctcctcg tggtgccggc tggaatatgg tagatgtgca 60
tggtatccga ccaatatcat cttaccatat acagacgggg aagg 104
<210> 144
<211> 92
<212> DNA
<213> 埃及伊蚊(Aedes aegypti)
<220>
<223> 埃及伊蚊(Aedes aegypti)利物浦株系supercont1.294基因组支架,全基因组鸟枪序列,CH477479.1
<400> 144
tgccaagcat ctcctatccc taccatctcg tggtactggc cgtggtacga gcctcccaga 60
tgggaacgat ggtcgtatgg tgacagcgaa gg 92
<210> 145
<211> 55
<212> DNA
<213> 白符跳(Folsomia candida)
<220>
<223> 白符跳(Folsomia candida)VU株系Fcan01_Sc032群体,全基因组鸟枪序列,LNIX01000032.1
<400> 145
aacaaatata cgggtgcccc cgtactgatg aggccatggc aggccgaaat ttgtg 55
<210> 146
<211> 55
<212> DNA
<213> 温氏类芽孢杆菌(Paenibacillus wynnii)
<220>
<223> 温氏类芽孢杆菌(Paenibacillus wynnii)株系DSM 18334 unitig_3_1r,全基因组鸟枪序列,JQCR01000003.1
<400> 146
cttgcttatg gactcagttc actgacgagc tcgtgagatt cgagcgaaaa gtatc 55
<210> 147
<211> 60
<212> DNA
<213> 双孢蘑菇(Agaricus bisporus)
<220>
<223> 双孢蘑菇四孢变种(Agaricus bisporus var. burnettii)JB137-S8未放置的基因组支架AGABI1scaffold_33,全基因组鸟枪序列,JH971417.1
<400> 147
gtcggattag ggcagcggtt aagccctctg atgagcccct tcgcaagggc gaaatccgca 60
<210> 148
<211> 58
<212> DNA
<213> 巨桉(Eucalyptus grandis)
<220>
<223> 巨桉(Eucalyptus grandis)BRASUZ1栽培种未放置的基因组支架scaffold_11,全基因组鸟枪序列,KK198763.1
<400> 148
aattagttgg gagttgatgc tgctctcctg atgaggccat agcaggccga aaccagtt 58
<210> 149
<211> 58
<212> DNA
<213> 巨桉(Eucalyptus grandis)
<220>
<223> 巨桉(Eucalyptus grandis)BRASUZ1栽培种未放置的基因组支架scaffold_2,全基因组鸟枪序列,KK198754.1
<400> 149
aattggttgg gagctaatgc tattctcctg acgaggccat ggcaggctga aactattt 58
<210> 150
<211> 75
<212> DNA
<213> laboriosa回条蜂(Habropoda laboriosa)
<220>
<223> laboriosa回条蜂(Habropoda laboriosa)重叠群20310,全基因组鸟枪序列,LHQN01020310.1
<400> 150
gtggcgtctg gggcatggac cggctacatc agcctcactg atgagtctgt ggtcggtctc 60
gagacgaaac gcttc 75
<210> 151
<211> 57
<212> DNA
<213> 未知
<220>
<223> 脱硫球茎菌属物种(Desulfobulbus sp.)Tol-SR contig_572,全基因组鸟枪序列,JROS01000118.1
<400> 151
gtgatgtctg cggctgaatc tgccgcactg acgagcccat ccagggcgaa acatcca 57
<210> 152
<211> 58
<212> DNA
<213> 长角长虫兆(Orchesella cincta)
<220>
<223> 长角长虫兆(Orchesella cincta)Ocin01_Sc3888,全基因组鸟枪序列,LJIJ01003888.1
<400> 152
gacgcgtcta gaagtgaagc ccttctactg atgaggttat ggcagaccga aacgcaaa 58
<210> 153
<211> 58
<212> DNA
<213> 向日葵(Helianthus annuus)
<220>
<223> 向日葵(Helianthus annuus)连锁群3,全基因组鸟枪序列,CM007892.1
<400> 153
cactagttga gagttgtcgc tggtttcctg atgagtccaa ggcaagacaa aaccagta 58
<210> 154
<211> 56
<212> DNA
<213> 未知
<220>
<223> 柠檬胞菌属物种(Citreicella sp.)357 C357_106,全基因组鸟枪序列,AJKJ01000094.1
<400> 154
cccaggtacc cggatgtgtt ttccgggctg atgagtccgt gaggacgaaa cctggg 56
<210> 155
<211> 67
<212> DNA
<213> 绿猴(Chlorocebus sabaeus)
<220>
<223> 绿猴(Chlorocebus sabaeus)1994-021分离株染色体4,全基因组鸟枪序列,CM001944.2
<400> 155
attcagtcag gagttttttc tgctgatgag ttcctggtct tgctaacttc aaagaacgaa 60
gctgcag 67
<210> 156
<211> 60
<212> DNA
<213> 松生拟层孔菌(Fomitopsis pinicola)
<220>
<223> 松生拟层孔菌(Fomitopsis pinicola)FP-58527 SS1未放置的基因组支架FOMPIscaffold_81,全基因组鸟枪序列,KE504202.1
<400> 156
ggacggtcgg ggcagcgggt aagccccctg acgaggactt tcgcaggtcc gaaaccgctg 60
<210> 157
<211> 75
<212> DNA
<213> 麻蝇金小蜂(Trichomalopsis sarcophagae)
<220>
<223> 麻蝇金小蜂(Trichomalopsis sarcophagae)亚伯达(Alberta)株系scaffold10693,全基因组鸟枪序列,NNAY01010628.1
<400> 157
tgcgcgtctg aggcagggtt accatcggat gccttactga cgagtccacg atggtaacct 60
gggacgaaac gcaac 75
<210> 158
<211> 60
<212> DNA
<213> 未知
<220>
<223> 葡萄(Vitis vinifera),PN40024系的全基因组鸟枪序列,未定向的染色体13,chr13,FN597036.1
<400> 158
aactggtcaa gagctggagt cattcccctg atgaatccat gaatcaggat gaaaccagtt 60
<210> 159
<211> 57
<212> DNA
<213> 未知
<220>
<223> 乌尔菌门细菌暂定种(Candidatus Uhrbacteria bacterium)RIFOXYB2_FULL_45_11 rifoxyb2_full_scaffold_3973,全基因组鸟枪序列,MGFD01000034.1
<400> 159
tttttgtctt tagatacagt atctaaactg atgagtcctg taaggacgaa acaaaag 57
<210> 160
<211> 61
<212> DNA
<213> 未知
<220>
<223> 亚洲柑橘木虱(Asian citrus Psyllid),柑桔木虱(Diaphorina citri) - 佛罗里达株系,全基因组鸟枪序列,AWGM01152003.1
<400> 160
aacgcgtctt aggctgctct caggtgctag ctgatgagtt ccaacaagaa cgaaacgcgt 60
c 61
<210> 161
<211> 79
<212> DNA
<213> 杜隧蜂(Dufourea novaeangliae)
<220>
<223> 杜隧蜂(Dufourea novaeangliae)contig3158,全基因组鸟枪序列,LGHO01003158.1
<400> 161
caggcgtctg gggttggggt cgtctaccgt cagtcccact gacgaatctt ggttgacgat 60
tctcgagacg aaacgccat 79
<210> 162
<211> 58
<212> DNA
<213> 巨桉(Eucalyptus grandis)
<220>
<223> 巨桉(Eucalyptus grandis)BRASUZ1栽培种未放置的基因组支架scaffold_1,全基因组鸟枪序列,KK198753.1
<400> 162
aactggtcag gagcttatgc taccatccta atgaggccat ggtaggccga aaccagtt 58
<210> 163
<211> 58
<212> DNA
<213> 克莱门柚(Citrus clementina)
<220>
<223> 克莱门柚(Citrus clementina)栽培种Clemenules未放置的基因组支架scaffold_5,全基因组鸟枪序列,KI536799.1
<400> 163
cactggttgg gaactgaagc cgttctcctg acgagcccac ggtagggcga aaccagtc 58
<210> 164
<211> 56
<212> DNA
<213> 卡氏棘口吸虫(Echinostoma caproni)
<220>
<223> 卡氏棘口吸虫(Echinostoma caproni)埃及株系基因组组装,支架:ECPE_scaffold0022838,LL256423.1
<400> 164
ctggagtgat atttgctgat atttactgat gagctccaat aagagcgaaa ctcgag 56
<210> 165
<211> 58
<212> DNA
<213> 未知
<220>
<223> 葡萄(Vitis vinifera),PN40024系的全基因组鸟枪序列,染色体6,chr6,FN597024.1
<400> 165
aactagttgg gagctagagc cattcccctt atgagtccat ggcaagacga aaccagtc 58
<210> 166
<211> 68
<212> DNA
<213> 未知
<220>
<223> 乌尔菌门细菌暂定种(Candidatus Uhrbacteria bacterium)RIFOXYC2_FULL_47_19 rifoxyc2_full_scaffold_469,全基因组鸟枪序列,MGFG01000021.1
<400> 166
accacttctg ccgttgagta cggcactgat gagtccattc gattgtaaac agcaggacga 60
aaagtaaa 68
<210> 167
<211> 55
<212> DNA
<213> 未知
<220>
<223> Taylorbacteria细菌暂定种(Candidatus Taylorbacteria bacterium)RIFCSPLOWO2_02_FULL_46_40 rifcsplowo2_02_scaffold_68864,全基因组鸟枪序列,MHSH01000051.1
<400> 167
cgttgctctc ggaatgtgta ttccgactga tgagtccaaa aggacgaaag cagaa 55
<210> 168
<211> 56
<212> DNA
<213> 未知
<220>
<223> 杂食菌门(Omnitrophica)细菌暂定种CG1_02_46_14 cg1_0.2_scaffold_5404_c,全基因组鸟枪序列,MNVS01000076.1
<400> 168
cggctgtttc ccgatgtgtt atcgggactg atgagtccga aaggacgaaa cagcgt 56
<210> 169
<211> 58
<212> DNA
<213> 根瘤菌(Rhizobium)噬菌体
<220>
<223> 根瘤菌(Rhizobium)噬菌体RHEph01,完整基因组,JX483873.1
<400> 169
aataggtacg gggctgatgc tgccccgctg atgaggccaa gctatggccg aaaccatc 58
<210> 170
<211> 58
<212> DNA
<213> 巨桉(Eucalyptus grandis)
<220>
<223> 巨桉(Eucalyptus grandis)BRASUZ1栽培种未放置的基因组支架scaffold_11,全基因组鸟枪序列,KK198763.1
<400> 170
aactggtcga gagttgatgt cgctctcttg acgaggccat ggcaggtcga aaccaatt 58
<210> 171
<211> 58
<212> DNA
<213> 双班蛸(Octopus bimaculoides)
<220>
<223> 双班蛸(Octopus bimaculoides)Scaffold62703_contig_4,全基因组鸟枪序列,LGKD01404090.1
<400> 171
aatgagtcaa gtgacgcgaa catctctgat gagaccctca aaaaggtcga aattcgat 58
<210> 172
<211> 57
<212> DNA
<213> 海水派金虫(Perkinsus marinus)
<220>
<223> 海水派金虫(Perkinsus marinus)ATCC 50983 gcontig_1104296167808,全基因组鸟枪序列,AAXJ01016906.1
<400> 172
ggtgtgtctg gcgccgttag ccactgatga gtccctgtgg tgaggacgaa acactac 57
<210> 173
<211> 56
<212> DNA
<213> cornetzi皱切叶蚁(Trachymyrmex cornetzi)
<220>
<223> cornetzi皱切叶蚁(Trachymyrmex cornetzi)重叠群48241,全基因组鸟枪序列,LKEY01048241.1
<400> 173
tatatgtcag tttgcgtttg ctctgaggag ggctcaggaa tgagccgaaa catgta 56
<210> 174
<211> 55
<212> DNA
<213> 未知
<220>
<223> 俭菌总门(Parcubacteria)(乔凡诺尼菌门(Giovannonibacteria))细菌GW2011_GWF2_42_19 UV11_C0020,全基因组鸟枪序列,LCDF01000020.1
<400> 174
ccactgtcct agagtgtgta ctctagctga tgagtcggaa acgacgaaac agaaa 55
<210> 175
<211> 53
<212> DNA
<213> 双班蛸(Octopus bimaculoides)
<220>
<223> 双班蛸(Octopus bimaculoides)Scaffold54493_contig_334,全基因组鸟枪序列,LGKD01378372.1
<400> 175
ccgaagtcga gctgtcttaa ttgatgaggc gaaggaaaat gccgaaacta cgc 53
<210> 176
<211> 74
<212> DNA
<213> 杜隧蜂(Dufourea novaeangliae)
<220>
<223> 杜隧蜂(Dufourea novaeangliae)contig944,全基因组鸟枪序列,LGHO01000944.1
<400> 176
cccgcgtcta aggcagggtc tgctagaaaa gccttactga cgagtccact agcatgccca 60
ggacgaaacg ctcc 74
<210> 177
<211> 60
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0008277,LL965256.1
<400> 177
tggatgtata ttcatgatat aggattgctg atgagtccca aagataggac gaaacaaccg 60
<210> 178
<211> 55
<212> DNA
<213> 糙皮侧耳(Pleurotus ostreatus)
<220>
<223> 糙皮侧耳(Pleurotus ostreatus)PC15未放置的基因组支架scaffold_10,全基因组鸟枪序列,KL198013.1
<400> 178
tttgtgttgg gaggtgtgtg cctctcctga tgaatccaaa aggacgaaac acatt 55
<210> 179
<211> 99
<212> DNA
<213> 四条无刺蜂(Melipona quadrifasciata)
<220>
<223> 四条无刺蜂(Melipona quadrifasciata)111107301分离株未放置的基因组支架scaffold95,全基因组鸟枪序列,KQ435798.1
<400> 179
agggcgtctg gggtaggagt cactgccatc aaaacacccc cctccccccc ccccccccca 60
ctgatgagtc taggcagcga ctccgagacg aaacgcatc 99
<210> 180
<211> 58
<212> DNA
<213> 牵牛花(Ipomoea nil)
<220>
<223> 牵牛花(Ipomoea nil)DNA,支架:scaffold1407,栽培种:东京-kokei标准品,BDFN01001407.1
<400> 180
aactagtcgg gagctattga cgttcccctg atgagcccat gacgggacaa aaccagtt 58
<210> 181
<211> 52
<212> DNA
<213> 粗环点革菌(Punctularia strigosozonata)
<220>
<223> 粗环点革菌(Punctularia strigosozonata)HHB-11173 SS5未放置的基因组支架PUNSTscaffold_19,全基因组鸟枪序列,JH687556.1
<400> 181
gctcggtcat ctcgggcaga accctgatga gcctataaag gcgaaacagg gc 52
<210> 182
<211> 62
<212> DNA
<213> 四条无刺蜂(Melipona quadrifasciata)
<220>
<223> 四条无刺蜂(Melipona quadrifasciata)111107301分离株未放置的基因组支架scaffold98,全基因组鸟枪序列,KQ435803.1
<400> 182
caagcgtttt ggggccagcc ccactgatga gtctaggcag cgactccaag acgaaacgca 60
tc 62
<210> 183
<211> 55
<212> DNA
<213> 奧布分支杆菌(Mycobacterium obuense)
<220>
<223> 奧布分支杆菌(Mycobacterium obuense)UC1株系Mobu_contig000008,全基因组鸟枪序列,LAUZ02000008.1
<400> 183
ctgctctcca gggtcaccct gctgacgagc ccgtgaaagt cgggcgaaag agccc 55
<210> 184
<211> 74
<212> DNA
<213> 未知
<220>
<223> 乔凡诺尼菌门(Giovannonibacteria)细菌暂定种RIFCSPLOWO2_01_FULL_46_13 rifcsplowo2_01_scaffold_439,全基因组鸟枪序列,MFIE01000019.1
<400> 184
gaacgctcgc gagatgtgtg tctcgcctga tgagcccgcc aaaggcgggc aagtccaaaa 60
ggacgaaagc gtgt 74
<210> 185
<211> 54
<212> DNA
<213> 毛毕属血吸虫(Trichobilharzia regenti)
<220>
<223> 毛毕属血吸虫(Trichobilharzia regenti)基因组组装,支架:TRE_scaffold0102769,LL113166.1
<400> 185
aatgcatcca gtacatccac tggctgacga gtccgagata agacgaaatg catg 54
<210> 186
<211> 59
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0002697,LL959675.1
<400> 186
gacatgtctg ggatgcaggt acatccaact gacgagtccc aaatacgacg aaacatgca 59
<210> 187
<211> 69
<212> DNA
<213> 白纹伊蚊(Aedes albopictus)
<220>
<223> 白纹伊蚊(Aedes albopictus)佛山分离株重叠群106395,全基因组鸟枪序列,JXUM01106395.1
<400> 187
tcaaagtctt gacgaaaggc caacgggcca aaacgtcaac tgatgagtcc ttgatggacg 60
aaactttgt 69
<210> 188
<211> 55
<212> DNA
<213> 未知
<220>
<223> Lloydbacteria细菌暂定种RIFCSPHIGHO2_02_FULL_54_17 rifcsphigho2_02_scaffold_4023,全基因组鸟枪序列,MHLO01000032.1
<400> 188
ttgctgtaga gaagtgcatg cttctcctga cgagtcggaa acgacgaaac agcac 55
<210> 189
<211> 110
<212> DNA
<213> 未知
<220>
<223> 细菌SM23_31 WORSMTZ_22961,全基因组鸟枪序列,LJUD01000105.1
<400> 189
agcagagacc gggaagggat tctcttatta tgaaaatatt gaaaatagca tgaaacacta 60
aaccccgggg atcctcccgg taatgcagcc gtagccggtc acaagcccgg 110
<210> 190
<211> 58
<212> DNA
<213> 热纤梭菌(Clostridium thermocellum)
<220>
<223> 热纤梭菌(Clostridium thermocellum)ATCC 27405,完整基因组,CP000568.1
<400> 190
tccagagtga cggaacgact cttcctccgg taatgcggtg gcccggtcac aagtccgg 58
<210> 191
<211> 60
<212> DNA
<213> 未知
<220>
<223> 候选分类NC10细菌CSP1-5 XU15_C0011,全基因组鸟枪序列,LDXR01000011.1
<400> 191
cgcagagagg ggctaggcca taggcttagc tctaatgcgg cataccggtc tcaagcccgg 60
<210> 192
<211> 51
<212> DNA
<213> 未知
<220>
<223> 黑冠鹤东非亚种(Balearica pavonina gibbericeps)重叠群83242,全基因组鸟枪序列,JJRR01083242.1
<400> 192
tgcagatgga ataatttaat gcaactgtag ttactcaggt tccaagtcct g 51
<210> 193
<211> 63
<212> DNA
<213> 螺旋体(Spirochaetes)细菌
<220>
<223> 螺旋体(Spirochaetes)细菌GWB1_66_5 gwb1_scaffold_16834,全基因组鸟枪序列,MIAS01000104.1
<400> 193
tgcagagggg gccgggacgc gcgaagcgac tcggcctaat gcacaggccg gtcccaagtc 60
cgg 63
<210> 194
<211> 57
<212> DNA
<213> 天门冬型梭菌(Clostridium asparagiforme)
<220>
<223> 天门冬型梭菌(Clostridium asparagiforme)DSM 15981基因组支架Scfld9,全基因组鸟枪序列,GG657595.1
<400> 194
cgcagagcaa cggggcagca atgccccggt aatgcggggg aacggttgca accccgt 57
<210> 195
<211> 65
<212> DNA
<213> 未知
<220>
<223> 亨氏梭菌(Clostridium hungatei)DSM 14427株系CLHUN_contig000001,全基因组鸟枪序列,MZGX01000001.1
<400> 195
tgcagatggg cggccttatg gccgttaatg cgctcccgga taccgggaac ccgtccaaag 60
ccggg 65
<210> 196
<211> 60
<212> DNA
<213> 紫海胆(Strongylocentrotus purpuratus)
<220>
<223> 紫海胆(Strongylocentrotus purpuratus)重叠群102072_fixed,全基因组鸟枪序列,AAGJ05102072.1
<400> 196
agggagggag gggtattgga accaaacctc ttaaccaacc gtcgcccgtc ccaagtcggg 60
<210> 197
<211> 56
<212> DNA
<213> 未知
<220>
<223> 脱硫芽孢弯曲菌属物种(Desulfosporosinus sp.)I2重叠群00035,全基因组鸟枪序列,JYNH01000035.1
<400> 197
cgcagagtga ccgcccatcg cgggcgggta atgcggctag ccggtcacaa gcccgg 56
<210> 198
<211> 70
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)W14A NODE_41,全基因组鸟枪序列,MBSV01000063.1
<400> 198
cgcagagcag cggagaaact gacttcgtta atgcggcctg acgtttttcg tctgacggtt 60
gcaagcccgc 70
<210> 199
<211> 65
<212> DNA
<213> 未知
<220>
<223> 生物反应器宏基因组PBDCA2_GBB5CE401D1Q9V_left,全基因组鸟枪序列,AGTN01047810.1
<400> 199
tgcagatggg cgccttcggg cgttaatgcg ctgaaaccaa aggttccacc aggtccaaag 60
tcctg 65
<210> 200
<211> 59
<212> DNA
<213> 未知
<220>
<223> 叠层石宏基因组35133330,全基因组鸟枪序列,ABMG01007509.1
<400> 200
ggtgagcggc cccgcccgta aggacgggga ctaaaccaca agtccggtcg caagtccgg 59
<210> 201
<211> 71
<212> DNA
<213> 未知
<220>
<223> 未培养的瘤胃球菌科(Ruminococcaceae)细菌TS29_contig142355,全基因组鸟枪序列,ADJT01008886.1
<400> 201
tgcagagtga gaaagctcat taccgtttgg tgatgggctt ttgtaatgca gagcgccggt 60
cacaatcccg g 71
<210> 202
<211> 56
<212> DNA
<213> 未知
<220>
<223> 淡水沉积物宏基因组lwFormaldehyde_BCIB5337_x1,全基因组鸟枪序列,ABSN01019877.1
<400> 202
cgcagatgac ggtgccacca cggcaccgta atgcgacaag caggttccaa tccctg 56
<210> 203
<211> 72
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组ctg_1101668267133,全基因组鸟枪序列,ABSN01019877.1
<400> 203
tgatgagggg cggggggcca gagacccccc gttaaatcgc catgtcaacc gacatgctgg 60
tcccaagccc ag 72
<210> 204
<211> 61
<212> DNA
<213> 未知
<220>
<223> 堆肥宏基因组重叠群24470,全基因组鸟枪序列,ADGO01024387.1
<400> 204
agtgagggga tcgatctaaa ctactggctt gtttcgtgca agtcaccggt cccaagtccg 60
g 61
<210> 205
<211> 65
<212> DNA
<213> 未知
<220>
<223> 堆肥宏基因组FHNL2OP04YM6SP,全基因组鸟枪序列,ADGO01161384.1
<400> 205
cgcagagcac gccctacggg gcgtaatgcg gcctcaccac tggggtgagc cagttgcaag 60
cctgg 65
<210> 206
<211> 63
<212> DNA
<213> 未知
<220>
<223> 堆肥宏基因组FHNL2OP04YQ5F0,全基因组鸟枪序列,ADGO01160766.1
<400> 206
cgcagagggc agcccttcgg ggctgtaatg cactccccac ctggggagcg gtcccaagtc 60
cgc 63
<210> 207
<211> 64
<212> DNA
<213> 未知
<220>
<223> 生物反应器宏基因组PBDCA2_FISUTAU01BA9VK,全基因组鸟枪序列,AGTN01403367.1
<400> 207
cgcagagtga cgggagggtt tatcggccct cccggtaatg cggcagcccg gttcgcaagc 60
ccgg 64
<210> 208
<211> 55
<212> DNA
<213> 未知
<220>
<223> 生物反应器宏基因组PBDCA2_contig37489,全基因组鸟枪序列,AGTN01271243.1
<400> 208
cgcagagtga gccgggaaac cggcttaatg cgggcagagg cggtcacaac cccgc 55
<210> 209
<211> 219
<212> DNA
<213> 未知
<220>
<223> 纳氏虫属物种(Naegleria sp.)NG872 SSU rRNA基因I组内含子,NG872株系,AJ001399.1
<400> 209
ctgttattgg aatttgatag ttgtgcgatg gggttcatac cttaactgcc aaaacgggac 60
cccttttggg gtataaatct tgtaaaagga ttatattccg tactaaggat atttgataat 120
atccggaatg tctagagact acacggcaag ccaattggtg gtatgaatgg atagtcccta 180
gtttttttta ccatctaggt atcccataca aaatggtaa 219
<210> 210
<211> 196
<212> DNA
<213> 钙皮黏菌(Didymium iridis)
<220>
<223> 钙皮黏菌(Didymium iridis)部分IGS、18S rRNA基因、I-DirI基因和部分ITS1,Pan2-16分离株,AJ938153.1
<400> 210
ttttggttgg gttgggaagt atcatggcta atcaccatga tgcaatcggg ttgaacactt 60
aattgggtta aaacggtggg ggacgatccc gtaacatccg tcctaacggc gacagactgc 120
acggccctgc ctcttaggtg tgttcaatga acagtcgttc cgaaaggaag catccggtat 180
cccaagacaa tcaaat 196
<210> 211
<211> 200
<212> DNA
<213> 未知
<220>
<223> 纳氏虫属物种(Naegleria sp.)NG458组I样核酶GIR1,NG458株系,AM497931.1
<400> 211
ctgttattga aggacgttct agagtgcgat ggggttcata cctttatctg ccaaaacggg 60
acctctgttg aggtatatat tgaatattcc gtactaagga tttaatccgg aacgtctaga 120
gactacacgg cagaccattg ttggtggtat gaatggatag tccctagtga accatctagg 180
catcccatac aaaatggtta 200
<210> 212
<211> 209
<212> DNA
<213> 未知
<220>
<223> 异叶足纲物种(Heterolobosea sp.)BA 16S小亚基核糖体RNA基因,部分序列;以及His-Cys盒归巢核酸内切酶基因,完整cds,DQ388519.1
<400> 212
cagctgtttt gatacatgct cgactttctt tttctcttgt gcaatggggt ttatgagtta 60
attagccaaa acgggacctt aaaaaggtgt aagtaaccgt actaagttcg taagaacgga 120
atgtctagag actacacggc tgagcgattt agctctcata aatggatagt cctcagtata 180
ccatctgagc atcccataca aaatggtta 209
<210> 213
<211> 76
<212> DNA
<213> 反刍真杆菌(Eubacterium ruminantium)
<220>
<223> 反刍真杆菌(Eubacterium ruminantium)ATCC 17233株系基因组组装,重叠群:EI46DRAFT_scaffold00014.14,FUXA01000016.1
<400> 213
agtcgtcaga gcgactataa ataggcttta ggctctgagc gtgccgaccg tcaataaaag 60
gcggtcagcg gtagca 76
<210> 214
<211> 71
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<220>
<223> 冈比亚按蚊(Anopheles gambiae)株系PEST全基因组鸟枪测序项目,全基因组鸟枪序列,AAAB01006002.1
<400> 214
actcgactaa gcgagtataa aaaggtttca agcttagagc gttgataggg ataaaaacct 60
atcaggtaac a 71
<210> 215
<211> 71
<212> DNA
<213> 未知
<220>
<223> 冢村氏菌属(Tsukamurella)噬菌体TIN3,完整基因组,KR011063.1
<400> 215
cctcgtcagg gcgaggttaa atagccgcat aggccctgag cgtccccgcc ccacaagggc 60
ggggggacgg g 71
<210> 216
<211> 65
<212> DNA
<213> 未知
<220>
<223> 类芽孢杆菌属物种(Paenibacillus sp.)TCA20 DNA,重叠群:PspTCA2nb10,BBIW01000010.1
<400> 216
agtcggcttg gcgactataa ataggctttt ggccaagcgc gggctcccaa ctcgggagta 60
tagca 65
<210> 217
<211> 69
<212> DNA
<213> 噬萘类芽孢杆菌(Paenibacillus naphthalenovorans)
<220>
<223> 噬萘类芽孢杆菌(Paenibacillus naphthalenovorans)32O-Y株系,完整基因组,CP013652.1
<400> 217
actcgtgcca gcgagtttaa atagaccaat aggctggcag cgttccactc ataaagagtg 60
gaggaggta 69
<210> 218
<211> 71
<212> DNA
<213> 未知
<220>
<223> 瘤胃球菌属物种(Ruminococcus sp.)SR1 5基因组草图,FP929053.1
<400> 218
agtggtcaca gccactataa acagggcttt aagctgtgag cgttgaccgt cacaacggcg 60
gtcaggtagt c 71
<210> 219
<211> 69
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)ASF502基因组支架acMal-supercont1.1,全基因组鸟枪序列,KB822441.1
<400> 219
agtagtcatg gctactataa atagagactt aagccatgag cgttcccatc tttgtgatgg 60
gaggtgtct 69
<210> 220
<211> 69
<212> DNA
<213> 未知
<220>
<223> 大头茶属(Gordonia)噬菌体GTE7,完整基因组,JN035618.1
<400> 220
cgtcgtctga gcgacgttaa atagccgtta ggctcagagc ggtacacctc ccctattctc 60
ggggttggg 69
<210> 221
<211> 66
<212> DNA
<213> 未知
<220>
<223> 噬纤维素菌属(Cellulophaga)噬菌体phi19:3,完整基因组,KC821608.1
<400> 221
agccgttgca gcggcataaa ataggttatt aggctgcaag cgttcgccct taattgggcg 60
gtgtta 66
<210> 222
<211> 65
<212> DNA
<213> 未知
<220>
<223> 鞘氨醇杆菌属物种(Sphingobacterium sp.)ML3W,完整基因组,CP009278.1
<400> 222
agtcgtttga gcgacttaaa ataggtttta agctcaaagc gccccgataa taatcgggag 60
taaca 65
<210> 223
<211> 70
<212> DNA
<213> 未知
<220>
<223> 布劳特氏菌属物种(Blautia sp.)YL58,完整基因组,CP015405.2
<400> 223
agaggttgca acctctataa atagggcttt aagttgcaag cgttcccgct ggaaacagtg 60
ggagatagcc 70
<210> 224
<211> 66
<212> DNA
<213> 毛螺旋菌科(Lachnospiraceae)细菌
<220>
<223> 毛螺旋菌科(Lachnospiraceae)细菌A2基因组支架acPFL-supercont1.1,全基因组鸟枪序列,KE159636.1
<400> 224
agccgtccca acggctctaa aaagtccatt aagttgggag cgtccggcag aaatgccggg 60
gttgga 66
<210> 225
<211> 75
<212> DNA
<213> 梭菌目(Clostridiales)细菌
<220>
<223> 梭菌目(Clostridiales)细菌42_27 Ley3_66761_scaffold_13135,全基因组鸟枪序列,MNRF01000152.1
<400> 225
gctcgtctgg gcgagggtaa atagtaatta ggcccagagc gtcttggctg gcagatctgc 60
cggtcggggg tttag 75
<210> 226
<211> 64
<212> DNA
<213> 未知
<220>
<223> 短芽孢杆菌属(Brevibacillus)噬菌体Jenst,完整基因组,KT151955.1
<400> 226
tagtgttgcg gcacttacaa gcccattaag ccgcaagcgt tagcccttcc ggggctaggt 60
tggg 64
<210> 227
<211> 74
<212> DNA
<213> 未知
<220>
<223> 大头茶属(Gordonia)噬菌体Orchid,完整基因组,KU998253.1
<400> 227
acacgactgg acgtgtataa ataggcgtta ggtccagtgc gggtgatggt attgagtatt 60
ttggaatcgg tgcc 74
<210> 228
<211> 64
<212> DNA
<213> 大豆发酵芽孢杆菌
<220>
<223> 大豆发酵芽孢杆菌(Bacillus glycinifermentans)株系GO-13 contig_36,全基因组鸟枪序列,LECW02000030.1
<400> 228
agtcgtggcg gcaacattaa acaggcatta agccgccagc attcccctta ttggggaggt 60
tgca 64
<210> 229
<211> 69
<212> DNA
<213> 大豆发酵芽孢杆菌(Bacillus glycinifermentans)
<220>
<223> 大豆发酵芽孢杆菌(Bacillus glycinifermentans)株系GO-13 contig_9,全基因组鸟枪序列,LECW02000082.1
<400> 229
ggacgtgacg gcggctcaaa aaagtgcatt aagccgcaag agtttccccg tttttggggg 60
aaggtttca 69
<210> 230
<211> 80
<212> DNA
<213> 哈尔滨产乙醇杆菌(Ethanoligenens harbinense)
<220>
<223> 哈尔滨产乙醇杆菌(Ethanoligenens harbinense)YUAN-3,完整基因组,CP002400.1
<400> 230
caccgtggcg gcggtgtaaa acaaacatta agccgccagc gtcccggaac aaggcatttt 60
ccgattctcc gggggttgca 80
<210> 231
<211> 70
<212> DNA
<213> 梭菌目(Clostridiales)细菌
<220>
<223> 梭菌目(Clostridiales)细菌44_9 Ley3_66761_scaffold_7759,全基因组鸟枪序列,MNRG01000094.1
<400> 231
gctcgtctgg gcgaggataa acagctatta agcccagagc gttctgagtc tttaagattc 60
ggaggtttag 70
<210> 232
<211> 69
<212> DNA
<213> 未知
<220>
<223> 芽孢杆菌属(Bacillus)噬菌体B4,完整基因组,JN790865.1
<400> 232
agtcgtgtga gcgactataa acaggcttta ggctcacagc gtcgcggggt ttatcccccg 60
tgggtagca 69
<210> 233
<211> 70
<212> DNA
<213> 未知
<220>
<223> 鞘氨醇杆菌属物种(Sphingobacterium sp.)ML3W,完整基因组,CP009278.1
<400> 233
agtggattgc gccactttaa aaaggtttta agcgtaaagc gttgcaaggt tttgagcctt 60
gcaggtaaca 70
<210> 234
<211> 64
<212> DNA
<213> 大豆发酵芽孢杆菌(Bacillus glycinifermentans)
<220>
<223> 大豆发酵芽孢杆菌(Bacillus glycinifermentans)株系GO-13 contig_3,全基因组鸟枪序列,LECW02000023.1
<400> 234
actcgtcaca gcgagtataa agaggcatta ggctgtgagc gttccccgtc atggggaggt 60
tgca 64
<210> 235
<211> 67
<212> DNA
<213> 未知
<220>
<223> 梭菌目物种(Clostridiales sp.)SS3 4基因组草图,FP929062.1
<400> 235
acacgttgcg ccgtgtataa atagccagtt agggcgcaag cgtcccggca ttttgccggg 60
ggtctgg 67
<210> 236
<211> 65
<212> DNA
<213> 未知
<220>
<223> 另枝菌属物种(Alistipes sp.)CHKCI003分离株CHKC3基因组组装,FCNT01000042.1
<400> 236
agccgttcgg gtggctataa atagacctta ggcccgaagc gtggcggcac ctgccgccgg 60
tggta 65
<210> 237
<211> 78
<212> DNA
<213> 表兄链球菌(Streptococcus sobrinus)
<220>
<223> 表兄链球菌(Streptococcus sobrinus)TCI-98重叠群00583,全基因组鸟枪序列,AGGO01000583.1
<400> 237
agtcgttgtg gcgactataa ccaagctctt taagccacaa gcgttgctga tgaggtttca 60
taacatcagc aggtagag 78
<210> 238
<211> 67
<212> DNA
<213> 埃吉类芽孢杆菌(Paenibacillus elgii)
<220>
<223> 埃吉类芽孢杆菌(Paenibacillus elgii)B69重叠群93,全基因组鸟枪序列,AFHW01000093.1
<400> 238
actggttcga gccagtaaaa aaaggccgat aagctcgaag cgttccactc ttagagtgga 60
ggaggca 67
<210> 239
<211> 66
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组35801239,全基因组鸟枪序列,ABLZ01250225.1
<400> 239
agtcgttagg gcgactataa acagacatta agccctaagc gtcccctact agctaggggg 60
gttgta 66
<210> 240
<211> 69
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组ctg_1101668203871,全基因组鸟枪序列,AACY023396520.1
<400> 240
agtcggtaga gcgactttaa aaaggcatta ggctctacgc gttccaggag gaaactcctg 60
gaggttgtt 69
<210> 241
<211> 64
<212> DNA
<213> 韦荣球菌科(Erysipelotrichaceae)细菌
<220>
<223> 韦荣球菌科(Erysipelotrichaceae)细菌2_2_44A cont1.7,全基因组鸟枪序列,ADCZ01000007.1
<400> 241
attcgactag acgagtataa ataggtgtca ggtctagtgc ggcagggttc ttccctgcat 60
cata 64
<210> 242
<211> 69
<212> DNA
<213> 韦荣球菌科(Erysipelotrichaceae)细菌
<220>
<223> 韦荣球菌科(Erysipelotrichaceae)细菌2_2_44A cont1.7,全基因组鸟枪序列,ADCZ01000007.1
<400> 242
aatcgactag gcgattttaa ataggtgtta agcctagtgc ggtaagaggt ataaccctct 60
tgcgtcacg 69
<210> 243
<211> 70
<212> DNA
<213> 未知
<220>
<223> 微生物垫宏基因组hsmat10_BHWZ5893_b1,全基因组鸟枪序列,ABPY01006745.1
<400> 243
gctggtcacg gccagtataa acagacatta agccgtgagc gtctcctgtt ctgtgaacgg 60
gagggttgta 70
<210> 244
<211> 66
<212> DNA
<213> 未知
<220>
<223> 活性污泥宏基因组contig01440,全基因组鸟枪序列,AERA01001428.1
<400> 244
actcgttagg gcgagtataa atagccatta ggccctaagc gtcaatgata agctcattgg 60
gttgga 66
<210> 245
<211> 66
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组1096626606346,全基因组鸟枪序列,AACY020454254.1
<400> 245
agtcgtttgg gcgactataa acagacgaat aagcccaaag cgtttcctcg taagaggaag 60
gacgga 66
<210> 246
<211> 66
<212> DNA
<213> 未知
<220>
<223> 珊瑚宏基因组39763165,全基因组鸟枪序列,ABNK01016853.1
<400> 246
agtcgtctga gcgactataa acagagtttt aggctcagag cgcctcccct tcgggggagg 60
gtacta 66
<210> 247
<211> 79
<212> DNA
<213> 哥伦比亚芭切叶蚁(Atta colombica)
<220>
<223> 哥伦比亚芭切叶蚁(Atta colombica)真菌圃Top 2030450980,全基因组鸟枪序列,AGFS01138167.1
<400> 247
actcgactag acgagtataa actacattaa gcctagtgcg ttatagccgt aaataagaag 60
taaacggcta taggttgta 79
<210> 248
<211> 70
<212> DNA
<213> 多粘类芽孢杆菌(Paenibacillus polymyxa)
<220>
<223> 多粘类芽孢杆菌(Paenibacillus polymyxa)E681,完整基因组,CP000154.1
<400> 248
gttcgtctga gcgaacgcaa acaggccatt aagctcagag cgttcactgg attcgtccag 60
tgagattggc 70
<210> 249
<211> 71
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组ctg_1101667068628,全基因组鸟枪序列,AACY022661277.1
<400> 249
actggactac gccagtataa ataggcatta agcgtagtgc gttccaatgt tgtgaaacat 60
cggaggttgt t 71
<210> 250
<211> 66
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组1096626660187,全基因组鸟枪序列,AACY020496190.1
<400> 250
agtcgtctaa gcgactctaa aaaggcttta agcttagagc gttcgcccat attgggcgag 60
gttgta 66
<210> 251
<211> 73
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组1096626606768,全基因组鸟枪序列,AACY020454584.1
<400> 251
actggttgcg gccagtataa atagtcttta agccgcaagc gtgtcctgga gttaatcttc 60
cagggcggta gca 73
<210> 252
<211> 69
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组ctg_1101667160699,全基因组鸟枪序列,AACY022753348.1
<400> 252
agtcgactaa gcgactctaa acagcattta ggcttagtgc gttcccctgc tcacgcgggg 60
gaggtatgg 69
<210> 253
<211> 78
<212> DNA
<213> 球形赖氨酸芽孢杆菌(Lysinibacillus sphaericus)
<220>
<223> 球形赖氨酸芽孢杆菌(Lysinibacillus sphaericus)C3-41,完整基因组,CP000817.1
<400> 253
actcgactaa gcgagtataa acaggcatta ggcttagagc gttctcacgt tatctgaatg 60
atgatgtgag aggttgca 78
<210> 254
<211> 55
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组32650920,全基因组鸟枪序列,ABLX01143204.1
<400> 254
actcgacagg gcgaggctaa atagcattta ggccctgagc ggctcccttc gggag 55
<210> 255
<211> 58
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组2065701,全基因组鸟枪序列,AACY021048934.1
<400> 255
gctcggtgcg gcgagcctaa atagtgcctt aggccgcacg cgttatgcat aggtggca 58
<210> 256
<211> 66
<212> DNA
<213> 未知
<220>
<223> 微生物垫宏基因组hsmat10_BHWZ5893_b1,全基因组鸟枪序列,ABPY01006745.1
<400> 256
acaggtttgc gcctgtataa atagacatta agcgcaaagc gtcccgcaat tgttgcgggg 60
gttgta 66
<210> 257
<211> 67
<212> DNA
<213> 奥湖甲苯单胞菌(Tolumonas auensis)
<220>
<223> 奥湖甲苯单胞菌(Tolumonas auensis)DSM 9187,完整基因组,CP001616.1
<400> 257
aagcgaaaca ggccccggag ggcctgtctg ccggaggtgg tgctccggta ctgatgagca 60
gcctagc 67
<210> 258
<211> 69
<212> DNA
<213> 万巴氏分枝杆菌(Mycobacterium vanbaalenii)
<220>
<223> 万巴氏分枝杆菌(Mycobacterium vanbaalenii)PYR-1,完整基因组,CP000511.1
<400> 258
tgccgaaacg ccgactcggg tcggcgtccc tgggaggtgg cattctcagg ctgatgatgg 60
ctgccgcag 69
<210> 259
<211> 77
<212> DNA
<213> 未知
<220>
<223> 奥奈达湖希瓦氏菌(Shewanella oneidensis)MR-1,完整基因组,AE014299.2
<400> 259
aagcgaaaca agcaaggcgc ttaggtgcct tgcctgtctg ctcggcgtgg ttgccgagca 60
ctgatgagca gccaaag 77
<210> 260
<211> 87
<212> DNA
<213> 脱硫杆菌科(Desulfobacteraceae)细菌
<220>
<223> 脱硫杆菌科(Desulfobacteraceae)细菌4572_35.1 ex4572_35.1_scaffold_634,全基因组鸟枪序列,NBLX01000010.1
<400> 260
atgcgaaacc gcgatcattt tgccgccatt ggcaaggtga tcgcggtcat cagggtgcgg 60
cgatcctgat ctgatgagca gccaaga 87
<210> 261
<211> 70
<212> DNA
<213> 耐碱脱硫弧菌(Desulfovibrio alkalitolerans)
<220>
<223> 耐碱脱硫弧菌(Desulfovibrio alkalitolerans)DSM 16529 ctg12,全基因组鸟枪序列,ATHI01000003.1
<400> 261
aagcgaaacc gccctgagtg ggcggtcgtt ccggagagac ggcgaccggg gcctgatgag 60
ccagccgaat 70
<210> 262
<211> 77
<212> DNA
<213> 未知
<220>
<223> 链霉菌属(Streptomyces)噬菌体R4,完整基因组,JX182370.1
<400> 262
atgcgaaaca tctcgccggc tggaccggtg aggtgtcggc ccagggcggt tcctgggtcc 60
tgacgatgca accggga 77
<210> 263
<211> 71
<212> DNA
<213> 未知
<220>
<223> 热原体古细菌(Thermoplasmatales archaeon)SG8-52-4 WOR_8-12_1532,全基因组鸟枪序列,LSSF01000016.1
<400> 263
agccgaaaca ggggtctgtg cgcccctgtc caccatgggt ggtgccatgg tgccgatgat 60
ggtagccaca a 71
<210> 264
<211> 70
<212> DNA
<213> 未知
<220>
<223> 类芽孢杆菌属物种(Paenibacillus sp.)MSt1 Contig_22,全基因组鸟枪序列,JNVM01000022.1
<400> 264
agccgaaacg cctcgcgata ggaggcgtcg cggggatatg gcctaccccg cctgatgatg 60
gcaggccgga 70
<210> 265
<211> 74
<212> DNA
<213> 南极海神单胞菌(Neptunomonas antarctica)
<220>
<223> 南极海神单胞菌(Neptunomonas antarctica)DSM 22306株系基因组组装,重叠群:Ga0111702_106,FTOE01000006.1
<400> 265
ccgcgaaacg cccacacctt aacgggacgg gcgtctatcc agcgtggcaa ctgggtactg 60
atgagcagcc acta 74
<210> 266
<211> 67
<212> DNA
<213> 哈尔滨产乙醇杆菌(Ethanoligenens harbinense)
<220>
<223> 哈尔滨产乙醇杆菌(Ethanoligenens harbinense)YUAN-3,完整基因组,CP002400.1
<400> 266
agccgaaacg gggtgaaagc cctgtccgct ggggatggcc tcctcgcgct gatgatggca 60
ggccaac 67
<210> 267
<211> 84
<212> DNA
<213> 未知
<220>
<223> 红杆菌目(Rhodobacterales)细菌65-51 scnpilot_p_inoc_scaffold_125,全基因组鸟枪序列,MKWD01000005.1
<400> 267
atgcgaaacc gcatccgggg cggcgtgtgc cccgggtgcc ggtcggccgg gcgtggtggc 60
ccggtcctga tgatgcagcc ggag 84
<210> 268
<211> 68
<212> DNA
<213> 未知
<220>
<223> 小梨形菌属物种(Pirellula sp.)SH-Sr6A,完整基因组,CP011272.1
<400> 268
agccgaaacg cggtagcgat ccgcgtcgcc gatcggtggt tcgatcggcc tgacgatggc 60
agccaacc 68
<210> 269
<211> 74
<212> DNA
<213> 未知
<220>
<223> 德沃斯氏菌属(Devosia)物种66-22 SCNpilot_expt_1000_bf_scaffold_212,全基因组鸟枪序列,MKUZ01000009.1
<400> 269
ttgcgaaacg cctcccggct ccggctgggg gcgtcgtcca cgggtcgcgc cgtgggcctg 60
atgagcagcg acac 74
<210> 270
<211> 77
<212> DNA
<213> 未知
<220>
<223> 疣微菌科(Verrucomicrobiaceae)细菌GAS474基因组组装,LT629781.1
<400> 270
tgccgaaacg gcttcctcgt gccccgaggt gccgtcctgc cgggctgagc tcccagcagc 60
tgatgaggca gctccct 77
<210> 271
<211> 68
<212> DNA
<213> 未知
<220>
<223> 糖丝菌属物种(Saccharothrix sp.)ALI-22-I Contig71,全基因组鸟枪序列,MTQP01000067.1
<400> 271
cggcgaaacc gcctccccgg aggcggtcca cgggattggc attcccgtgc tgaggatgcc 60
tgccgagc 68
<210> 272
<211> 69
<212> DNA
<213> 未知
<220>
<223> 海单胞菌属物种(Marinomonas sp.)S3726 contig0030,全基因组鸟枪序列,JXYC01000030.1
<400> 272
tagcgaagcg cggctaggta tagccgcgtc aatctcgtgt agtggctaga tactgatgag 60
cagctaaaa 69
<210> 273
<211> 75
<212> DNA
<213> 未知
<220>
<223> 鲁杰氏菌属物种(Ruegeria sp.)ANG-R contig_12,全基因组鸟枪序列,JWLJ01000012.1
<400> 273
atgcgaaacc gtcccggtgt tcacgccggg atggtcatcg gggcgtggtg accccggtct 60
gatgagcagc cagaa 75
<210> 274
<211> 67
<212> DNA
<213> 未知
<220>
<223> 贝格阿托氏菌属物种(Beggiatoa sp.)IS2 Ga0073106_1108,全基因组鸟枪序列,MTEL01000108.1
<400> 274
aaccgaaact cccctcacgg ggagtccgac cgggattaat cacccggcgc tgatgaggca 60
gattcct 67
<210> 275
<211> 65
<212> DNA
<213> 未知
<220>
<223> 链霉菌属(Streptomyces)噬菌体R4,完整基因组,JX182370.1
<400> 275
tgccgaaaca cccttcgggg tgtcggggtg gggtggcgct cacctcctga cgatggcagc 60
cacga 65
<210> 276
<211> 69
<212> DNA
<213> 未知
<220>
<223> 蓝绿藻菌属物种(Lachnoclostridium sp.)An76 An76_contig_9,全基因组鸟枪序列,NFHL01000009.1
<400> 276
agccgaaacg gtcagtaatg accgtcagcc gggaagtgac tgccccggct ctgatgatgg 60
caggtcatg 69
<210> 277
<211> 66
<212> DNA
<213> 织片草螺菌(Herbaspirillum seropedicae)
<220>
<223> 织片草螺菌(Herbaspirillum seropedicae)SmR1,完整基因组,CP002039.1
<400> 277
agccgaaaca tcctcaaagg gtgtctctca gaggtggcct cctgagactg atgatggctg 60
gctgtg 66
<210> 278
<211> 71
<212> DNA
<213> 粘放线菌(Moritella viscosa)
<220>
<223> 粘放线菌(Moritella viscosa)基因组组装,LN554852.1
<400> 278
aagcgaaaca cgtcttagtg ataagtcgtg tctactcagc gttgtggttg agtactgatg 60
agcagcaact t 71
<210> 279
<211> 67
<212> DNA
<213> 金属还原菲维菌(Fervidicella metallireducens)
<220>
<223> 金属还原菲维菌(Fervidicella metallireducens)AeB重叠群00024,全基因组鸟枪序列,LN554852.1
<400> 279
aaccgaaaca agggtatgtc ccttgtctgc tgaggataac ctctcagcac tgatgaggta 60
ggttaaa 67
<210> 280
<211> 67
<212> DNA
<213> 未知
<220>
<223> 糖丝菌属物种(Saccharothrix sp.)ALI-22-I Contig71,全基因组鸟枪序列,MTQP01000067.1
<400> 280
cggcgaaacc gtccggtgtg gacggtcccg agggctggca tccctcggct gatgatgcct 60
gccaaga 67
<210> 281
<211> 61
<212> DNA
<213> 未知
<220>
<223> 链霉菌属(Streptomyces)噬菌体R4,完整基因组,JX182370.1
<400> 281
aggcgaaacg ccgtgaggcg tccggccggg tggtacccgg tcgctgatga gccagcctgc 60
t 61
<210> 282
<211> 67
<212> DNA
<213> 哈尔滨产乙醇杆菌(Ethanoligenens harbinense)
<220>
<223> 哈尔滨产乙醇杆菌(Ethanoligenens harbinense)YUAN-3,完整基因组,CP002400.1
<400> 282
agccgaaacg ggactttggt cctgtctgcc gggaatggcc gcccggcact gaggatggca 60
ggctgct 67
<210> 283
<211> 66
<212> DNA
<213> 未知
<220>
<223> 颤杆菌克属物种(Oscillibacter sp.)KLE 1745基因组支架Scaffold306,全基因组鸟枪序列,KI271721.1
<400> 283
agccgaaacg ccctccgggg cgtcatcggg gggagccctc ccccggtctg aagatggcag 60
ggcacg 66
<210> 284
<211> 69
<212> DNA
<213> 未知
<220>
<223> 罕见小球菌属物种(Subdoligranulum sp.)4_3_54A2FAA基因组支架supercont1.5,全基因组鸟枪序列,JH414702.1
<400> 284
agccgaaaca gccctgcggg gctgtcgtgc gggggctgac cgccccgtgc ctgatgatgg 60
caggtcaag 69
<210> 285
<211> 69
<212> DNA
<213> 鲍曼不动杆菌(Acinetobacter baumannii)
<220>
<223> 鲍曼不动杆菌(Acinetobacter baumannii)株系SDF,完整基因组,CU468230.2
<400> 285
aagcgaaaca caggcattcg tgcctgtgtc tactggatgt cgtgatccag tactgatgag 60
cagcgatag 69
<210> 286
<211> 66
<212> DNA
<213> 吸水链霉菌(Streptomyces hygroscopicus)
<220>
<223> 吸水链霉菌井冈山亚种(Streptomyces hygroscopicus subsp.jinggangensis)5008,完整基因组,CP003275.1
<400> 286
tgccgaaacc ccttggtgag gggtcgttcc ggggtggtgc ccggagcctg acgacggcag 60
ccgccc 66
<210> 287
<211> 70
<212> DNA
<213> 伶俐瘤胃球菌(Ruminococcus callidus)
<220>
<223> 伶俐瘤胃球菌(Ruminococcus callidus)ATCC 27760基因组支架Scaffold724,全基因组鸟枪序列,KI260480.1
<400> 287
agccgaaaca gcggcagaga gccgctgtct gccggaactg gtctaccggc actgatgatg 60
gcagaccgga 70
<210> 288
<211> 65
<212> DNA
<213> 未知
<220>
<223> 糖丝菌属物种(Saccharothrix sp.)ALI-22-I Contig71,全基因组鸟枪序列,MTQP01000067.1
<400> 288
aggcgaaacc cggctggcac cgggtccgta gggctggcat ccctgcgctg atgagcctgc 60
caacg 65
<210> 289
<211> 67
<212> DNA
<213> 未知
<220>
<223> 布劳特氏菌属物种(Blautia sp.)An249 An249_contig_12,全基因组鸟枪序列,NFJL01000012.1
<400> 289
agccgaaacg gggaacttac cccgtccgct gcgggatcgc ctcccggcgc tgatgaggca 60
ggcgaga 67
<210> 290
<211> 78
<212> DNA
<213> 未知
<220>
<223> 小红卵菌属物种(Rhodovulum sp.)P5,完整基因组,CP015039.1
<400> 290
ccgcgaaacc ccgccaggcc catcggtctg gcggcggtcg gccgggcgtg gtggcccgac 60
cctgatgagc agccggag 78
<210> 291
<211> 81
<212> DNA
<213> 未知
<220>
<223> 地杆菌科(Geobacteraceae)细菌GWC2_58_44 gwc2_scaffold_235,全基因组鸟枪序列,MGZL01000059.1
<400> 291
atgcgaaacg atcattttgc cggcgtcgac aaaatgatcg tcatcccggc gtggcggccg 60
gggtctgatg agcagccgcg g 81
<210> 292
<211> 68
<212> DNA
<213> 横须链霉菌(Streptomyces yokosukanensis)
<220>
<223> 横须链霉菌(Streptomyces yokosukanensis)DSM 40224株系基因组支架PRJNA299221_s003,全基因组鸟枪序列,KQ948208.1
<400> 292
cggcgaaacc cgctggtgag gcgggtcgcg aagcggtggt gcgcttcgcc tgatgatgcc 60
agccagca 68
<210> 293
<211> 84
<212> DNA
<213> 内生小单胞菌属物种(Endozoicomonas sp.)
<220>
<223> 内生小单胞菌属物种(Endozoicomonas sp.)(之前的内氏布古菌(Bugulaneritina)AB1)AB1-5分离株ACH42_contig000207,全基因组鸟枪序列,MDLD01000207.1
<400> 293
ttgcgaaaca ctcccgccgt acctgtcccc acaggtggga gtgtcagtcc agtgtggtga 60
ctgggctctg atgagcagcc aaag 84
<210> 294
<211> 68
<212> DNA
<213> 绿弯菌门(Chloroflexi)细菌
<220>
<223> 绿弯菌门(Chloroflexi)细菌RBG_13_60_13 RBG_13_scaffold_3543,全基因组鸟枪序列,MGNC01000101.1
<400> 294
agccgaaacg ggggcatcgg cccccgtcgt cccgggcagt ccactgggac ctgacgaggc 60
aaagcgcg 68
<210> 295
<211> 72
<212> DNA
<213> 未知
<220>
<223> 奥奈达湖希瓦氏菌(Shewanella oneidensis)MR-1,完整基因组,AE014299.2
<400> 295
aagcgaaacc cgccccattc atggggcgcg gtctgtctaa tgtagtgatt aggcactgat 60
gagcagctaa cc 72
<210> 296
<211> 66
<212> DNA
<213> 未知
<220>
<223> 链霉菌属(Streptomyces)噬菌体R4,完整基因组,JX182370.1
<400> 296
aggcgaaacc acccgagagg gtggtcggac cgggcggttc ccggttcctg acgatgccaa 60
ccactg 66
<210> 297
<211> 69
<212> DNA
<213> 未知
<220>
<223> 乙醇酸脱硫棒菌(Desulfofustis glycolicus)DSM 9705基因组组装,重叠群:EJ46DRAFT_scaffold00001.1,FQXS01000001.1
<400> 297
aggcgaaacg ccggggtgac ccggcgtcgt cggagggtga tgcctccggc ctgacgatgc 60
cagttacag 69
<210> 298
<211> 68
<212> DNA
<213> 未知
<220>
<223> 脱硫弧菌属物种(Desulfovibrio sp.)TomC contig00038,全基因组鸟枪序列,JSEH01000038.1
<400> 298
aggcgaaacc gttctcctcg gagcggtcgg ccgggtgtgg tggcccggcc ctgatgagcc 60
agccgctc 68
<210> 299
<211> 76
<212> DNA
<213> 南方脱硫单胞菌(Desulfuromonas soudanensis)
<220>
<223> 南方脱硫单胞菌(Desulfuromonas soudanensis)WTL株系染色体,完整基因组,CP010802.1
<400> 299
aagcgaaacg accacccccc caggggggta gtcgtcgctc gggggtggtg ccccgggcct 60
gatgatgcag ccaagt 76
<210> 300
<211> 69
<212> DNA
<213> 未知
<220>
<223> 海单胞菌属物种(Marinomonas sp.)S3726 contig0020,全基因组鸟枪序列,JXYC01000020.1
<400> 300
aagcgaaaca tggctcgttg tagccgtgtc tattcagcgt agtggctggg tactgatgag 60
cagctaaaa 69
<210> 301
<211> 57
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<220>
<223> 普拉梭菌(Faecalibacterium prausnitzii)L2 6基因组草图,FP929045.1
<400> 301
gcggacactt tcaagggctg caccgctgcc gcaaaagcaa ccctatgcca ccgcccc 57
<210> 302
<211> 54
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<220>
<223> 普拉梭菌(Faecalibacterium prausnitzii)L2 6基因组草图,FP929045.1
<400> 302
acggatgcct tgacgggccg caccgaacga aaagcgaccc gatcccacac cccg 54
<210> 303
<211> 53
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<220>
<223> 普拉梭菌(Faecalibacterium prausnitzii)L2 6基因组草图,FP929045.1
<400> 303
acggatactc tagccgggtt gcaccgttca aagcagccca gccccagccg caa 53
<210> 304
<211> 54
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<220>
<223> 普拉梭菌(Faecalibacterium prausnitzii)SL3 3基因组草图,FP929046.1
<400> 304
tgggataccc tagcagggcc gcaccccaga aaagcggccc cgccccacac ccgg 54
<210> 305
<211> 53
<212> DNA
<213> 未知
<220>
<223> 未培养的粪杆菌属物种(Faecalibacterium sp.)TS29_contig14193,全基因组鸟枪序列,ADJT01006171.1
<400> 305
ccggatattt tggcagggct gcaccgggca aagcaacccc gccccactac ccc 53
<210> 306
<211> 53
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:In-D_005494.,BABD01005494.1
<400> 306
gcggacacct cagcagggcc gcaccggaca aagcggcccc gccccaccgc cca 53
<210> 307
<211> 57
<212> DNA
<213> 未知
<220>
<223> 未培养的粪杆菌属物种(Faecalibacterium sp.)TS29_contig122416,全基因组鸟枪序列,ADJT01006524.1
<400> 307
gcggatgccc tggcagggtc gcaccgctca aacaaagcgg ccccgcccca taacccc 57
<210> 308
<211> 52
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F1-S_028045,BAAU01028045.1
<400> 308
tcggacactc tggcagggca agcaccgtat agcagccccg accaactacc cc 52
<210> 309
<211> 54
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:In-R_005008,BABG01005008.1
<400> 309
ccggaagccc tggcagggtg cgcaccggat aaagcggccc tacctcaccg gcac 54
<210> 310
<211> 247
<212> DNA
<213> 未知
<220>
<223> Parasitella parasitica CBS 412.66株系基因组组装,重叠群:contig_63,CCXP01000063.1
<400> 310
aaaagcacct cttaaatagt gatccgtaaa atgaggttca tataaaattt ttcactatat 60
gctggaaaat cttaaagctt taagtacctc aatggtaaca atcttaaaga tattacaata 120
gacaatcagc aggaaaccaa cataattcta ttatttttag taggatcctc agagactaca 180
cgtgaaacac cgtattttta ttaagaatac gctgaagata tagtccgccc cacttcgaaa 240
gatgtgg 247
<210> 311
<211> 262
<212> DNA
<213> 未知
<220>
<223> Taylorbacteria细菌暂定种(Candidatus Taylorbacteria bacterium)RIFCSPLOWO2_12_FULL_43_20 rifcsplowo2_12_scaffold_4872,全基因组鸟枪序列,MHSK01000028.1
<400> 311
ctgttatagt tctgttaatg caataaaatg taaaaacatt ttgataaact aaataaacaa 60
taatcagtac actattcaaa gctgcctcgc tctgtagtaa tacaaagcag gtccgcacca 120
tggctatatg cggggaagtc tgtaatttgc agatcatccg cagggaagtt ctaaaatttt 180
ttttagaacc cctcagagac cacacgccat gctccagctg gtttgtacca gctggatgaa 240
gatatggtcc ttcgttaaag ag 262
<210> 312
<211> 428
<212> DNA
<213> 未知
<220>
<223> 雅诺夫斯基菌门(Yanofskybacteria)细菌暂定种RIFCSPHIGHO2_02_FULL_43_15c rifcsphigho2_02_scaffold_6549,全基因组鸟枪序列,MGJT01000029.1
<400> 312
caaggcggct tgttacttgc cgcaggggcc attgagaagc aattctcaat agcaaattcg 60
actatatgct ggaaactccg ccagtatctc taggtactat gatattatga tatatcatag 120
tgaaaatcct aagagtgatg cggacaatca gcaggcaacc ccgctcaaat ttttggaaat 180
aaaaaagtgg atttctggga ttcaggatcc ggcctcgatt agaggttgcc atcctttcgg 240
aaggatgccc tgaaatgctt cccacgcaaa atccactttc atgctagtat atcaaataaa 300
taatgcactt gtcaagtgtt tgtttctaaa aatttgagcg ggagagtcct caacgactga 360
aagtcgaacc agttatattt caaaaaaatg actggatgat acagtctgaa cttataggcg 420
actataag 428
<210> 313
<211> 501
<212> DNA
<213> 丝盘虫(Trichoplax adhaerens)
<220>
<223> 丝盘虫(Trichoplax adhaerens)Grell红海分离株线粒体,完整基因组,DQ112541.1
<400> 313
aagattaaat aatataagtt tttgactttt acctccggca ctttttttac tattaggttc 60
ctctttagta gaacaaggag cgggtacagg gtggacggtt gaaaggccgc ccgagttagt 120
gatgacttgg tgaaaatttt gctcaatgcg agaacatcct caaaaaaaag gtgctttggc 180
tcattgatta accctaaaaa ggtacctttt gatggcccca tgcaaaaatc cttttttacg 240
ccgaaggcgc cgtggacaac tcgccggggg cccaagccta tgggcccctc agagactaaa 300
tgcagaatat cttctatttt ttgataggcg ccgggcccct taacgggcgc cgaaggcgcc 360
caatgggagc caacgaccga tggcgccata ggcgccgaag gcgccgatag aaataaaggg 420
cccgaagcga ccgattcacc aatcggtcgc ttcggccgat ggaagataaa ggaatagtcc 480
gatccgactc taaagggtcg g 501
<210> 314
<211> 307
<212> DNA
<213> 纹缘盔孢伞(Galerina marginata)
<220>
<223> 纹缘盔孢伞(Galerina marginata)CBS 339.88 GALMAscaffold_102_Cont1090,全基因组鸟枪序列,AYUM01001090.1
<400> 314
ttgcctgggt tttcttaatt gaattcccga atttaaatgc tagtccaagt taaaacttgg 60
gcaagacctt caaactgacg gggaactcct aaagcttcag acaccaagcc ttattccgaa 120
agggtagggt ggccaggtta atagcctcgg gtatggtaaa agatctgaag atattacaat 180
ggacaatccg cagccaaggc cctaacgaag tgtttcactt ctatgggaca ggttcagaga 240
ctagatggag gtcggtctca tgtaaatgag gcttaaggta tagtccggct tcaagtgaaa 300
acttgtt 307
<210> 315
<211> 215
<212> DNA
<213> 核盘菌(Sclerotinia sclerotiorum)
<220>
<223> 核盘菌(Sclerotinia sclerotiorum)1980 UF-70线粒体,完整基因组,KT283062.1
<400> 315
ttatattttt attactaaaa aaaaaaggga aaaaacagca aataaaaaaa cttcttctta 60
ctaattgctg gaaactcctg tttaatagga caatcagcag gagcctgctg tatatgttta 120
tacagtaggg ttcttcagag actacacgta agatatccta gaatcattaa ataaatagga 180
taaagatata gtccgctctt aatagaaata ttaag 215
<210> 316
<211> 564
<212> DNA
<213> 木本鸡脚棉(Gossypium arboreum)
<220>
<223> 木本鸡脚棉(Gossypium arboreum)AKA8401栽培种重叠群_3227_1,全基因组鸟枪序列,JRRC01306379.1
<400> 316
ctacggactt aattggattg agccttggta tggaaaccta ctaagtgata actttcaaat 60
tcagagaaac cctggaatga aaaatgggca atcctgagcc aaatcctatt attttattat 120
tttacgaaaa taaacatgaa caaaggttca gcaagcgaga ataagaaaaa aaggaaagga 180
taggtgcaga gactcaatgg aagctattct aacaaatggg gttgactgtt ggtaaaggaa 240
tccttatatc gaatatcgaa actctagaaa ggatgcaaga tatacctatt ttttttatag 300
gtatactaat gaaaaactat ctcaaaaaag acgtaccgaa cccgtatttt tttttttatt 360
tctattatat gcaatatcaa tttatattta tatgaaaata tgaaaaataa aaagaattgt 420
tgtgaatcga ttccaagttg aagaaagaat cgaatagaat agtcattaat caaatcattc 480
actccatagt ctgataaatc ttttgaaaaa ctgattaatc ggacgagaat aaagatagag 540
tcccgttcta catgtcaata tcaa 564
<210> 317
<211> 227
<212> DNA
<213> 未知
<220>
<223> 多噬棘阿米巴(Acanthamoeba polyphaga)姆姆病毒,完整基因组,JX962719.1
<400> 317
attccttatt ggttcctaag tatatatcga aaggtatata tggtaatagt taatcactat 60
tagaggaaaa atatcaataa ggtcatagtc aatccgcagc aaagctccta aacccgttat 120
gctagggcat ggagaatgtt caacgactaa acggatgtgg gcatgaagga attagcactt 180
cctaatgatt gcttaagata tagtctaaac ccaccagtga tggtgtt 227
<210> 318
<211> 370
<212> DNA
<213> 未知
<220>
<223> 韩国芽孢杆菌(Bacillus koreensis)DSM 16467株系scaffold4,全基因组鸟枪序列,LILC01000037.1
<400> 318
ttcgtgacgt agattatgct ttagctgcgt aagcagtaac aagcacagtc gtcctagctg 60
gtaacggcta gagatcataa ttgggtgaat tgctggaaac cccttagagc tttcttcccc 120
acagcggagt tggaaacgac agacgcgatg ggtttaagaa gaagagagat tgggcaatca 180
gcagccgagc tcctgttccg aaaggatgga gaaggttcaa cgactaggat agaccatcta 240
aaagctaaag ctcaagatga tgaaatccat aggtgaagca gtagatcatc actactgtga 300
atccgaagtg cccaacccct accgaatacg gagggtgaag atatagtcta gtcatttatg 360
aaagtaaatg 370
<210> 319
<211> 282
<212> DNA
<213> 长蒴黄麻(Corchorus olitorius)
<220>
<223> 长蒴黄麻(Corchorus olitorius)O-4栽培种重叠群18264,全基因组鸟枪序列,AWUE01018231.1
<400> 319
ccacggactt aattaaattg gattgagctt tggcatggta acctactaag tgataacttt 60
caaattcaga gaaatcctgg aatgaaaaat gggcaatcct gagtcaaatc ctattatttc 120
acgaaaataa acaaaggttc agcaggggag acatctttaa cagctgccaa tgaatctcca 180
atatatttgg taatttccta cttatagtag ttaaagaagc tgaataacaa gcattttaag 240
gtagaagagt gctgacctgt gaggttagtg gaggtcgtgt gg 282
<210> 320
<211> 214
<212> DNA
<213> 未知
<220>
<223> 杂食菌门(Omnitrophica)WOR_2细菌SM23_29 WORSMTZ_35813,全基因组鸟枪序列,LJUB01000113.1
<400> 320
agcgggctgt gctcaagcgc agcttccaca ggaaactgtg gttgacaaag caggagaatt 60
gctggaagcc cctctggggt aatcagcagc cgagcccgtc attattttgg cgggaaggtt 120
cagagactat gtacctgcct cccgaaacgc aatgtccgcc tatggcggaa agtcgtggga 180
gaagatatag tccaagtccg atagtaatat cggg 214
<210> 321
<211> 243
<212> DNA
<213> 米根霉(Rhizopus oryzae)
<220>
<223> 米根霉(Rhizopus oryzae)RA 99-880 supercont3.83线粒体支架,全基因组鸟枪序列,GG669565.1
<400> 321
gttcggagat ttgtggagtt caccacgggt aggtaataag ccccctcatt attagatggg 60
gataatctca ctatatgccc gaaactccta aagcccaatt tacggaaacc gtgataataa 120
ttgggataat acaatggaca atgggcagga aacagaaaat ttattctggc tcctcagaga 180
ctacatgtga aacattcatt ttaatgaatg aagatatagt cccatccatg acgagattca 240
tgg 243
<210> 322
<211> 251
<212> DNA
<213> 乌拉尔图小麦(Triticum urartu)
<220>
<223> 乌拉尔图小麦(Triticum urartu)G1812栽培种重叠群97470,全基因组鸟枪序列,AOTI010097470.1
<400> 322
atttgaatac aatagtattg agcccaagta aaactggatg aattgcaggg aaaactaaaa 60
atgaatttag ttaatctgca gcgaagctat tatcggcacc ttattaactt atcagttaat 120
ttgtagataa tagaacgttc aacgactaat cggtgagctg tgctagcaat aatccggaca 180
cgagcgtcca gcagaaaata attaatattt attttctgat gaaatagtct gaacaatggt 240
gtgaatcatt g 251
<210> 323
<211> 825
<212> DNA
<213> 未知
<220>
<223> 莱氏微球黑粉菌-异株p1A1拉莫勒(Microbotryum lychnidis-dioicae p1A1Lamole)未放置的基因组支架supercont1.89,全基因组鸟枪序列,GL541731.1
<400> 323
attttaggat tcattgtttg gtcttggttg ggactccctc acagtgatgt gggggtaaga 60
aatttcgcta tttgctgaaa cagttttacg ttgttaggta tcaagatata gtaaaatcct 120
agcagcaata ctcaatcagc agggagccgt cactttatta atgcgggttc ttcagagact 180
atacgcgaga catcttggca taactttaca gccttctata cccttttaat ggttatatca 240
acactatgag tcagcttttt tctagttagc cttttttttt ggcctgtcgt ttttgctctc 300
ttttttagaa aaacagcccg ctcattattt ttgcttttat ttttcttttt ctttttactc 360
tctttttcta ccggaggagt aaaaacagca gcgcttattt tcactcggta gaaaataaag 420
gccaaataag cgcccttttt ctgtttttat aaagcgcctc gcccagccga gctgggcgct 480
tcattcgccc agccgagctg cttttcatca aagatgaagc gcccagctcg gctgggcgag 540
gcgcttagtt tttatttttg ctttttttgt cctgcttttt gattaatcaa aaaagacaaa 600
aacagcaaaa agcacaaaaa aggaaaaggc agctcggctg ggcgaggaaa aagacaaaaa 660
aataaaaaaa aagggaaaga gcatttaaca ccagacggat tacagcagat tcgatccctt 720
tacaggcaaa ttaatgtctg taactaagaa tcagctaaga cagatcatct cggccataaa 780
gcgacaagat gaagatatag tccgaacttt actcgcgaga gtaag 825
<210> 324
<211> 269
<212> DNA
<213> 未知
<220>
<223> 青枯韧皮杆菌暂定种(Candidatus Liberibacter solanacearum)CLso-ZC1,完整基因组,CP002371.1
<400> 324
atatgtggtt tatgtttgta aacttcataa taggtaatga aaaaaaattg tggatgtggc 60
ggaataggta gacgcagcag acttaatgtt attgggtgcc catagagaaa tcgatggagt 120
agaactgctc aaattcgggg aaagcttttg caaagctaat cccgagccaa atcttgttat 180
tcaagagagg tgtagagact ggacgggcag cacctaaggc atttaaaacg ttatggtgaa 240
gggacagtcc agaccacaaa cactgcaaa 269
<210> 325
<211> 324
<212> DNA
<213> 酪蛋白溶酶体龟孢菌(Tortispora caseinolytica)
<220>
<223> 酪蛋白溶酶体龟孢菌(Tortispora caseinolytica)NRRL Y-17796未放置的基因组支架CANCAscaffold_5,全基因组鸟枪序列,KV453845.1
<400> 325
agcgggtcgt tttctgaaag gaaagcggcg ttgctgaaag ctaggttcta aaacgttggg 60
ccagtcgcgc tgaaaggcgc ggctagtcgt gcatatgcac ggcgacactg tcaaattgcg 120
gcgacaccct gagagcttca agtaccaagc tagcgtcgaa agacagctag tggccgagtt 180
agtaaccctg ggtacggtaa aaaccttgaa gattgggcga gcacgcagcc aagtcctacg 240
gcgcaagcta cggatgcagt tcacagacta aatggcagtg ggcgaaagct taagatatag 300
tcgggcctct ggcgaaagcc aggt 324
<210> 326
<211> 847
<212> DNA
<213> 长孢轮枝菌(Verticillium longisporum)
<220>
<223> 长孢轮枝菌(Verticillium longisporum)VL1分离株基因组组装,重叠群:scaffold_246,CVQH01016224.1
<220>
<221> 尚未归类的特征
<222> (333)..(345)
<223> n是a、c、g、或t
<220>
<221> 尚未归类的特征
<222> (510)..(517)
<223> n是a、c、g、或t
<220>
<221> 尚未归类的特征
<222> (625)..(633)
<223> n是a、c、g、或t
<400> 326
aaatcggcgt catttgagac gaggactttc gggcccgaaa gggtgtccac caacgaggac 60
cgtagcacgg cttgtgtacc gtagtctcct cggaggcgac accctcaaat tgcgggaaac 120
tcctaaagct cacgctccaa agccgtctgt gaaagcagtt cggtggccag gttaattgcc 180
tcgggtattg gaacaacgcg tgagatgcaa caatggacaa tccgcagcca agcctctaag 240
tctcttgtga ctctgggtga acgtgcttca cccagtttgc tcaaggcggg aggactcaca 300
gatcgaaacc ggagtcacga cctctggtca tgnnnnnnnn nnnnnctccg gtggttcggc 360
gtctcgattc tgctgagtcc tggttcgcgt cccagagcca aactgcctct ggcagcacct 420
agacggagac ttaagtgccg tagacggagg cttaagtccc caactgccta acaggcggtt 480
ggttctgatt caggaccagc ctgagtcacn nnnnnnncca gcctgagtca cgagagatat 540
ggggaaggtt cagagacttg acgggggtgg gtgaattcac tgctgctgca acaatataaa 600
tggggagaga tcctcttctt cttcnnnnnn nnntcttctt cttccaacaa ccaaaccaaa 660
ccacaactga acctcaaaca agacccacaa gctcttcaaa atgtcccatt cttctccctc 720
tcctgttctc gctaacggga gcgagtatgt cgtgagggat ggaggttcgt ctggtcaggc 780
ataaggaacg agaatgcagt ggcgtggttt gcttaagata aagtccgggc ttatgggaaa 840
ccatagg 847
<210> 327
<211> 365
<212> DNA
<213> 不规则丛枝菌根真菌(Rhizophagus irregularis)
<220>
<223> 不规则丛枝菌根真菌(Rhizophagus irregularis) DAOM 181602 DAOM197198株系GLOINscaffold_4832_Cont4827线粒体,全基因组鸟枪序列,AUPC01004827.1
<400> 327
ctatagtttt ataagccctg aagctataga tgtctatctg gctatatgct gggaaaccca 60
ctaactttct atttaagtta agaatatggt gaagtggaca atcagcaggt aaccctcctt 120
agcaaagtag ggaggctacc tcagagacta aacgccagag cctgcagtat gaattgcatt 180
ccctctgggc taaattggaa gggagtctgg gacactatct tgccgggtta atagaaggag 240
acggagctat tattgtttct tctaaaataa ccttgttctt tttgataaaa tcccggtaag 300
gtgagtcaaa gcatgctgtt caatctgcag gtaagatata gtccgatcca aatagtgatg 360
tttgg 365
<210> 328
<211> 311
<212> DNA
<213> Paludisphaera borealis
<220>
<223> Paludisphaera borealis PX4株系,完整基因组,CP019082.1
<400> 328
gcaggggact catcaaccaa aatggtggcg ccggagggcg accttcggat gcgaaccggg 60
tgaattgcgg gaaacctaaa cctctgtttt gaggcacggc gatccgcagc caagcctggc 120
cgggctttgg tggccaggaa ggttcagaga ctagcggggt gagtcccaac gataatcccc 180
gcctcgagcg cccggcctcc ctcgaatgct tcgaggcggt cacgtcaagc ggtccgtcaa 240
cgaccgccac gcaaccgttt cgatcgtcgc aggcgaggat gagatagtcc aagccccgtg 300
gaaacgcggg g 311
<210> 329
<211> 346
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<223> 普通小麦(Triticum aestivum)基因组组装,重叠群:Triticum_aestivum_CS42_TGACv1_scaffold_435076_5DL,FAOM01435076.1
<400> 329
attcatcgat tagctgctag ataatagcat gtgacatttt tagtcgctaa gtggtaactt 60
ccaaattcag agaaaccctg gaattaaaaa agggcaatcc tgagccaaat ccgtgttttg 120
agaaaacaag gggttctcga actagaatac aaaggagaag gataggtgta gagactcaat 180
ggaagctgtt ctaacgaatc gagttaatta cgttgtgttg ttagtggaat tccgaagtga 240
gtggcatcgt gccttctttt agagcgggtc acatccaatt tcgatatggc tcacctttga 300
atcacttgtt ggtaattatt ccatagaaat gacttattag gatacg 346
<210> 330
<211> 322
<212> DNA
<213> 西伯利亚微小杆菌(Exiguobacterium sibiricum)
<220>
<223> 西伯利亚微小杆菌(Exiguobacterium sibiricum)255-15,完整基因组,CP001022.1
<400> 330
gtaatttgat ttcaccgggc gtctgatcga gtaactgatc agagcatgac tgggtgaatt 60
gctggaactc cttagagcct tgatgtacga caacgtggct ggaaacggtg agcgtgaccg 120
ttctgaaaaa cgtcaaggat tggacaatca gcagccaagc acctgtaggg aaaccttggt 180
gaaggttcaa cgactaggat agacgaccta atggagactt ctgatggtta tgaaatccgt 240
actccgtaaa cggcggggga agcgcccagc tcctagtata cctaggatga agatatagtc 300
ttatcattag cgaaagttaa tg 322
<210> 331
<211> 349
<212> DNA
<213> Parasitella parasitica
<220>
<223> Parasitella parasitica CBS 412.66株系基因组组装,重叠群:contig_1784,CCXP01001784.1
<400> 331
atatttgggt aaactataca cttgccccat attagttaat aactaatatg caaatctcac 60
tatatgctgg aaactcctta gagcttgcaa tacctagatc cctttgggta tcttacccca 120
ggcgctacgc gcccggggct agatggtgac aatttacaag attggacaat cagcaggaaa 180
ccaaaggaat attaatattc caagtttcgg cgggccctgc gggcccgccg tcaccgaacc 240
cgcgcgcttt gcgcgcggga aaagtaggat cttcagagac tacacgtgag acatcctata 300
gtatatttga cggatgatga tatagtccaa cctttattga aagatgaaa 349
<210> 332
<211> 306
<212> DNA
<213> 斑点小壶菌(Spizellomyces punctatus)
<220>
<223> 斑点小壶菌(Spizellomyces punctatus)DAOM BR117染色体未知supercont1.30,全基因组鸟枪序列,KQ257479.1
<400> 332
aagaccatgt tatgcagtga tcagcacgtg cacttgcaaa gaaagtaaca tggataggat 60
cttctggctc aactgcgtgt ggcagagatc gtcaaattgt tcggggaagc ccttagagct 120
caagctacca accattggtt gaaagaccag tggggccctt cctagggatg gtaataatgc 180
tttgagattg ggtaatccgc agccaagctc ctaaaacttg cttagcaagt catggagaag 240
gttcaacgac tgtaaggcgt accgcgcaag cggaatatac agtctagccc cacgggaaac 300
tgtgcc 306
<210> 333
<211> 302
<212> DNA
<213> 未知
<220>
<223> 鞘丝藻属物种(Lyngbya sp.)PCC 8106 1099428180522,全基因组鸟枪序列,AAVU01000005.1
<400> 333
ggaaaatggt taatattagc cctttatatc agtaatgata taaatgcacc tcctgaattg 60
ctgggaaacc ctaaagctgt tttaacgaca acataactag aaatagtcag tgtgaacgtt 120
taaaaataaa acagatgaaa caatgggtga tcagcagccg agattctgtt aaatgaatca 180
ggttcaacga ctattccaaa cggaagtaca ctcaagcgag tggaagtagg aggtatcctg 240
tagtcaaatc tctaaattat tacaggataa agatatagtc tggtcttaca tgaaagtgta 300
ag 302
<210> 334
<211> 288
<212> DNA
<213> 核盘菌(Sclerotinia sclerotiorum)
<220>
<223> 核盘菌(Sclerotinia sclerotiorum)1980 scaffold_35基因组支架,全基因组鸟枪序列,DS267914.1
<400> 334
gtaagagggg atgcgaatag cattccttta gtgatgagat cgcaacactg tcaaattgcg 60
gggagttcct aaagctcagg ctaccgcctc aggtgctgaa aagccctgaa ggcaccaagg 120
ttagcaacct tgggtatggt aataacgcct gtagatacta caatggatga tccgcagcca 180
agctctaaca atcttttcac gattcacgag cggggttcaa cgactagacg gcagtgggcc 240
tgcaaaacag gtttaagata tagtctgcgc ctagggaaaa atcccaag 288
<210> 335
<211> 305
<212> DNA
<213> 未知
<220>
<223> 杨盘二孢菌(Marssonina brunnea f.)物种'多菌种'线粒体,完整基因组,JN204424.1
<400> 335
gtttgtgttt ttaaatggtg aatattgaat attacaatca actcctcgtg atataaataa 60
aaggtaatga cattagcccc ttcaaatctt tctatatgct ggaaactctt aaaggcttaa 120
gtactatata aaattcatat ttaattttat aagtaaaaat cttaagtata tctagacaat 180
cagcaggaaa ccaacggata atatagattt attctagtag gatcctcaga gactacacga 240
aagagatggt atagcgtaaa gtctgtacca ttaagacata gtccaatttg tttgtaatgt 300
aacat 305
<210> 336
<211> 213
<212> DNA
<213> 未知
<220>
<223> 俭菌总门(Parcubacteria)(雅诺夫斯基菌门(Yanofskybacteria))细菌GW2011_GWA2_44_9 UW79_C0037,全基因组鸟枪序列,LCJR01000037.1
<400> 336
tcgggctcat aaataattgt gacctaccat agtaatgtgg catggaaaaa ctctctaaat 60
tgtctggaaa ccccactcgc ctatcagcga agggcaatca gcagcgaaac cttaagctca 120
tcgaaaggga cgttcagaga ctataatggg agcacccgta accgtaacaa aagttgggtg 180
atggtatagt ccgtcactgc aagtaattgc aga 213
<210> 337
<211> 269
<212> DNA
<213> 黑-翠绿颤藻(Oscillatoria nigro-viridis)
<220>
<223> 黑-翠绿颤藻(Oscillatoria nigro-viridis)PCC 7112,完整基因组,CP003614.1
<400> 337
caaaagccct agtgacatag cagctctatc cggtaacggg tactgaaaaa tcgggtgaat 60
tcaaggaaac cgcagcactt cgggtggcga caatcttgag ccaagtctgg cgaaaggcag 120
cggttgcgat cgcaagtagc cggaaaggtg cagagactag agatgaggag cctaaccaat 180
aaatctcaca gcgcccgaca tccgacgaca gatcgcacaa atgatttgta gggatgatga 240
aatagtccgc ccccttcgga aacgttggg 269
<210> 338
<211> 292
<212> DNA
<213> 西伯利亚阔口罐病毒(Pithovirus sibericum)
<220>
<223> 西伯利亚阔口罐病毒(Pithovirus sibericum)P1084-T分离株,完整基因组,KF740664.1
<400> 338
tgacacgcat ttgatcttga atgtgtgttg agcaagaccc tcaaattcag ggaaacccct 60
aaagcttttg aataccaagc ttccagcgaa agttggaggt ggccgcgagt aaatctcgta 120
gggtatggtg aaaacgtcaa aagatatccg ggaaaccggt aatgggcaat cctgagccaa 180
gcaaccgaaa tgccgtatgg tagaggttga aggtgcaacg acttgacggg ggtcggtcag 240
aaacgacagt ttcaggctta aggtaaagtc tactccttag cgaaagttaa gg 292
<210> 339
<211> 221
<212> DNA
<213> 色二孢属真菌(Diplodia seriata)
<220>
<223> 色二孢属真菌(Diplodia seriata)DS_831_scaffold_v01_13,全基因组鸟枪序列,LAQI01000013.1
<400> 339
agaagcattt aactcagttg agcatatatt cccacataat gtgctcatta aaccaggctg 60
tttgctggga actctgccgc attaaaccgg ttgacaatca gcaggaacca aggggttttt 120
taaaatcctg atgggttctt cagagactat acgcctggcg cttaattatt aaagaaaaaa 180
attaaatgat gatatagtcc ttctactatt gaaaaattgt a 221
<210> 340
<211> 359
<212> DNA
<213> 立枯丝核菌(Rhizoctonia solani)
<220>
<223> 立枯丝核菌(Rhizoctonia solani)株系AG-1 IB完整线粒体基因组,HF546977.1
<400> 340
gcacctcgat agtaacatgt cgagttaaat tagaaataat ttatgggaaa ttgggttaat 60
ttcaagaaaa tctttacact ccaaaatttt ttctatatgt taagcttcaa gcttaacaaa 120
cccacttacg gtgggttgcc tctacttttt cgggggtgcc cagcgaagct gggtcacccg 180
atggttaaaa atttttggag ttaaagacaa cttgaagcga agctagttct gacaataagc 240
taattatgga actagaacgt tcaacgacta gtgggtgagt tttgtcaaca ataatcccgc 300
cacgaatgcc caacaactaa agtcacagat agaatcggaa tttgtgattg aaacaatta 359
<210> 341
<211> 317
<212> DNA
<213> 嗜热毛壳菌(Chaetomium thermophilum)
<220>
<223> 嗜热毛壳菌嗜热变种(Chaetomium thermophilum var. thermophilum)DSM1495株系线粒体,完整基因组,JN007486.1
<400> 341
agaaggagtt ttctatggtc atccccatta agggactaac tgacattggc ctaaactgta 60
gtgaacctac ggttaaaaac catcaaattg cgggaaaccc ctaaaggaat cttaaccaag 120
taagtatggt aacataactt atggcacagg taatgactcg tggtatggta aaatcaagat 180
tcattattca atgggcaatc cgcagccaag tgccaaatat aaaatatttg gtatgcagtt 240
catcgactag acggtggttg gtattattag ttttaataat gcttaagata tagtcaacac 300
ccccctgaaa gggtgcg 317
<210> 342
<211> 216
<212> DNA
<213> 未知
<220>
<223> Limnohabitans属物种103DPR2,完整基因组,CP011834.1
<400> 342
gcagaggact catatttctc aaatgtgcct tacacgtgga aactgtgtaa gggatggtgt 60
caaattcgat gaaacctaag tgtggcaaca catatggcaa tgtcgagcga agcttagtgc 120
gaaagcactt tgaacgtgta gagacttgac ggcacccacc taagtacagc gatgtatatg 180
gtgaaggcaa agtccagcga gtgatgaaag tcacac 216
<210> 343
<211> 334
<212> DNA
<213> 未知
<220>
<223> 葡萄球菌属物种(Staphylococcus sp.)HGB0015基因组支架aczIz-supercont1.1,全基因组鸟枪序列,KE150417.1
<400> 343
ttcagtgtgt agagaaatct gcacatcgtg acagtacgac tgtccaacaa agaaattgaa 60
ttgcttgaaa accctaaagc ctgcttgacc acaacgtaga gataatcaaa ctcaagcgtg 120
aaggttgcga aactgcagaa aaaataagca ggatgacata aggttaaaac ctaagtgttt 180
tttgcaatgg gcaactagca gccaagccta gaaataggaa ggttcaacga ctattcctct 240
tgagggaagt acacacaagc gtgtggaagt ggtttcgccg taatggataa tgccaacgga 300
aaagatatag tctgtgcttg tatgaaaata caag 334
<210> 344
<211> 383
<212> DNA
<213> 未知
<220>
<223> 俭菌总门(Parcubacteria)(乌尔菌门(Uhrbacteria))细菌GW2011_GWC2_53_7UY82_C0027,全基因组鸟枪序列,LCRN01000027.1
<400> 344
atagcgacat tctgtataaa tcgtcttttc gtctaaaaat tgttcaatca tatgattgaa 60
ctcgaccgtg ctgtcataaa atctggctat atgctggaac atctggcatc tcccaaccat 120
caggagaatg ggagattgga gaatctcaca ctacgtagta aactacttgt aaaagatacg 180
tgaaaatgtg ttgagtgcag ataaccagca gggaagacta agatatgaca gcgtcgattc 240
atccaaatct tgtttataca atgaacaagt ctggcaagta tcgacgttgt aaacatcatc 300
tatcttagaa ccctcagaga ctatacgccg gactccgatg tccatcggag aagatatagt 360
ccgaaccgca tggcgacatg cag 383
<210> 345
<211> 262
<212> DNA
<213> 未知
<220>
<223> 瘦鞘丝藻属物种(Leptolyngbya sp.)Heron Island J,全基因组鸟枪序列,AWNH01000034.1
<400> 345
ctgcggactt agaaaactga gccttagtgg agaaatctgc taagtggaag ctctcaaact 60
cagggaaacc taagtcttgg ttggttactt gaccttctga gatatggcaa tcctgagcca 120
agcccttcaa aaggcgaaaa atagagggta aagttcatcc tttatctttt cgatttcatc 180
cttttgaagg gaaggtgcag aggcccgacg ggagctaccc taacgtcaag tcgagggtaa 240
agggagggtc caatcctcaa ag 262
<210> 346
<211> 339
<212> DNA
<213> 长枝被孢霉(Mortierella elongata)
<220>
<223> 长枝被孢霉(Mortierella elongata)AG-77未放置的基因组支架K457scaffold_276,全基因组鸟枪序列,KV442285.1
<400> 346
tcatatattc ataatattat gaatgtatat taatgattta attaggcatg gccgggtaat 60
atagtaatat attactttct tttcactatc tgctggaaca ccttaagagt atttaaaact 120
agttctgcat gctttcttta atgaaaagcg gtaggaaaca gtgacattta aataattagg 180
caatcagcag gaaaccaaag ataaaagggc ttaactttaa gcattaaaca cttttattga 240
gtaggatcct cagagactac acgtgaaata ccctattaag tgattattct taattattta 300
agggtaaaga tatagtccaa ccattaacga aagttaatg 339
<210> 347
<211> 209
<212> DNA
<213> 未知
<220>
<223> 戈茨曼菌门(Gottesmanbacteria)细菌暂定种RIFCSPLOWO2_01_FULL_49_10rifcsplowo2_01_scaffold_16705,全基因组鸟枪序列,MFJZ01000013.1
<400> 347
acagaaggct caacatatgg gctgtcctga gtttaatcga aggatagaat tcggctatat 60
cggtgaaacc ctaagaccaa cgtccgggta ataccgagga aagatcccga gcttgtcgag 120
ggaaatccgt agagactata cgccgaatcc ctccgaagct tttgagcgaa gggggaaaga 180
tatagtccga cactctcagt aatgggagg 209
<210> 348
<211> 258
<212> DNA
<213> 殊异肠球菌(Enterococcus dispar)
<220>
<223> 殊异肠球菌(Enterococcus dispar)ATCC 51266基因组支架acpMG-supercont1.1,全基因组鸟枪序列,KE136354.1
<400> 348
atattcggtt tgttgaaatc ccatattcaa tgaccgataa agaaatagaa aaagccatat 60
ttgaattaac tatgccaatc atgagccaag cctgtcggga aactgcagga aggtgcaacg 120
actagataaa ttaacctaag caaaagcagt catttatttg attgcttttt ttgtatggcg 180
aaatatccac gagcgcttga taccttaacg tttaaggcga aggtaatgat atagtctgaa 240
cttataggaa actataag 258
<210> 349
<211> 345
<212> DNA
<213> 抑食金球藻(Aureococcus anophagefferens)
<220>
<223> 抑食金球藻(Aureococcus anophagefferens)未放置的基因组支架AURANscaffold_2,全基因组鸟枪序列,GL833121.1
<400> 349
ttagttgcgt gtctattgtg cgctagtcgc accgttccgc gaactgcacg ggaacggcgg 60
cggcaacatc atcgaattgc tgggaaacct cgataggccg gagctactaa aggctcgggg 120
aaacccgggt caaatcgagc ttagacgctc gaagtgaaaa tgcttcggat agaggcaatc 180
agcagccaag cgcctaaagc cgcgtgtatt acagtgtatt acagttgggt atacatgtat 240
tgcaagcggt cacggtgaag gtccagagac taagtggtga tgggtgtcgg cgcggttgac 300
cgcgccgatg cttaagatat agtccgcccc tcttgagaga gagct 345
<210> 350
<211> 272
<212> DNA
<213> 黑孢块菌(Tuber melanosporum)
<220>
<223> 黑孢块菌(Tuber melanosporum)全基因组鸟枪序列组装,scaffold_368,株系Mel28,FN430284.1
<400> 350
caaaaagtat aggtaaaccc tctgctagtt cctaaaggga gcaaaaccat caaattgcgg 60
gaacatctta aagcaatttt taaccaagcg agaacggtaa cgtatttcgt ggcgcaggta 120
atgactcgcg gtaaggtaaa ataaaaattg atgtacgaaa ggaaatagaa aatccgcagc 180
caagttcgaa ataaaattcg aatgcagttc atcgactaaa tgttggttgg cgcaagctta 240
aaatatagtc agacctcaat cgaaagattt ag 272
<210> 351
<211> 203
<212> DNA
<213> 未知
<220>
<223> 薄壁芽孢杆菌属(Gracilibacteria)细菌暂定种CG1_02_38_174 cg_0.2_sub10_scaffold_1404_c,全基因组鸟枪序列,MNXD01000034.1
<400> 351
agatatgatt tctgtcaagg gctactagag aagtaatttt ctagtgaaaa tccgtcaaat 60
tcggggaaac cttcatttct agttatagaa atatggcaat cccgagccaa gcctatttat 120
aggaaggtgt agagactaga tggcggacat cctgatactc aggatgaagg gatagtccag 180
accacgaacc cgaaaggggc gat 203
<210> 352
<211> 207
<212> DNA
<213> 未知
<220>
<223> 集胞藻属物种(Synechocystis sp.)PCC 6803 DNA,完整基因组,BA000022.2
<400> 352
cttggcatct catcttgcaa aaaggggctg cgcaaaagga aacttctgcg tgattatctc 60
tcaaattcgg ggaagccttt caaatggtaa tcccgagcca aacctaggaa tgcttggtgt 120
ttctgggaag gtgtagagac ttaatgggag acaccctaac agaaaagctg agggtgaaga 180
gaaagtccag accacaaact gacagag 207
<210> 353
<211> 355
<212> DNA
<213> 俭菌总门(Parcubacteria)细菌
<220>
<223> 俭菌总门(Parcubacteria)细菌GW2011_GWA2_46_9 UX68_C0001,全基因组鸟枪序列,LCND01000001.1
<400> 353
ataaatgcgt tttattgtgc gcgaattgtc acagagaagt acatgctggt gtaatcgcag 60
ccccgcgtag gaatgcgcgg agaaaaactg ggtgaattcg gggaagccca gccccacttt 120
ttgataagat gccaccagta gataaataat tgtgtattta tttgctgacg ttagtactag 180
tcattatcgg ttttgtcaga aagtggggct gggtaatccc gagccaatac ctgacgggta 240
aaagtgtcag gaaaggtgta gagactagcg ggtgagtccc aacgataatc ccgccacgag 300
cgcccagcgc ctagaacagg cgatgagata gtccgtccct attggtaaca gtagg 355
<210> 354
<211> 92
<212> DNA
<213> 菲氏军团菌(Legionella feeleii)
<220>
<223> 菲氏军团菌(Legionella feeleii)株系WO-44C Lfee_ctg085,全基因组鸟枪序列,LNYB01000085.1
<400> 354
acgggtttac ccccgaatcg agccttgtgg cccttgccaa gcatcatgta tatgagctgc 60
tcgaataaca ctaaacacaa tcctgggtaa ac 92
<210> 355
<211> 96
<212> DNA
<213> 莎士比亚军团菌(Legionella shakespearei)
<220>
<223> 莎士比亚军团菌(Legionella shakespearei)DSM 23087株系ATCC 49655Lsha_ctg016,全基因组鸟枪序列,LNYW01000016.1
<400> 355
cttgatttgc ctcatcattt cgagccttgc agcgcaagct ggatatcctc tttgagtgaa 60
tcgctcgatt aacactaaac caaagacagg gcaaat 96
<210> 356
<211> 96
<212> DNA
<213> 沃尔特氏军团菌(Legionella waltersii)
<220>
<223> 沃尔特氏军团菌(Legionella waltersii)ATCC 51914株系Lwal_ctg060,全基因组鸟枪序列,LNZB01000060.1
<400> 356
attgatttgc cccccccgtt ggagccttgt ggcgtaagcc tggtatcgct tttgagtgag 60
ccgctcgatc aacactaaac caaagtcagg gcaagt 96
<210> 357
<211> 96
<212> DNA
<213> 詹姆斯敦军团菌(Legionella jamestowniensis)
<220>
<223> 詹姆斯敦军团菌(Legionella jamestowniensis)JA-26-G1-E2株系Ljam_ctg012,全基因组鸟枪序列,LNYG01000012.1
<400> 357
actgatttgc ccctgaactg agccttgagg cactacgcct ggtactgcaa ccttgcaggc 60
cgctctacca acactaaaca aaataccagg gcaaat 96
<210> 358
<211> 96
<212> DNA
<213> 法氏军团菌(Legionella fallonii)
<220>
<223> 法氏军团菌(Legionella fallonii)LLAP-10基因组组装,质粒:III,LN614829.1
<400> 358
attgatttgc cccctctttg agcatttcgg cttttgccgg gtatcaattt tttggattga 60
gccgctcgac caacactaaa cacaaacagg gcaaat 96
<210> 359
<211> 126
<212> DNA
<213> 黑狐蝠(Pteropus alecto)
<220>
<223> 黑狐蝠(Pteropus alecto)重叠群92670,全基因组鸟枪序列,ALWS01092670.1
<400> 359
caagaaatgt ttcttgacca gttgcctgca gctgatgagc tccagtaaga gcgaaaccag 60
ttctcactcc actgaaacaa ttttgaagtg tgaattggtc ctgtagtact gtgtcagaaa 120
caactc 126
<210> 360
<211> 126
<212> DNA
<213> 黄喉沙鸡(Pterocles gutturalis)
<220>
<223> 黄喉沙鸡(Pterocles gutturalis)重叠群91464,全基因组鸟枪序列,JMFR01091464.1
<400> 360
aggtttatga tgttaaacca gttgcctaca gctgatgagt gccaggaaga gcgaaaccag 60
ttctgttctg tttcaacagt tatgaaaagt aaggactggt cctgtagtac tgtccagcat 120
caaaat 126
<210> 361
<211> 206
<212> DNA
<213> 大劣按蚊(Anopheles dirus)
<220>
<223> 大劣按蚊(Anopheles dirus)WRAIR2株系未放置的基因组支架supercont1.9,全基因组鸟枪序列,KB673645.1
<400> 361
tagaaatgca gcactggtac gggtacggat ccgacgcctc tcgtaggata cttaggctct 60
ccgtacccta ctcctactca aaacgtcccc gacgtacata ttcgtgtttc ttatcccgtt 120
tctctcgatt agtgatagcg tagtgatctg ttcactggca ccgataggta aaaatccttt 180
caaaatacta tacgaaacta aaagac 206
<210> 362
<211> 150
<212> DNA
<213> 微小按蚊(Anopheles minimus)
<220>
<223> 微小按蚊(Anopheles minimus)MINIMUS1株系未放置的基因组支架supercont1.15,全基因组鸟枪序列,KB663666.1
<400> 362
ttgtacttat gctctgcaat ggggtaggac ccggaacctt ttgaaggtta cacaggttct 60
cctattcaac tccttttcta ctacgtatcc aagcttggat acatgggcca tctacatccc 120
ctggagtggg cagaaacgaa actgggctac 150
<210> 363
<211> 192
<212> DNA
<213> 库态按蚊(Anopheles culicifacies)
<220>
<223> 库态按蚊(Anopheles culicifacies)株系物种A-37_1 cont1.7520,全基因组鸟枪序列,KB663666.1
<400> 363
agtaaaattt cactggtaag ggatggatct gaaaacctat cgaaaatcaa caaaggctct 60
ccatattcta ctccgactca atagaagtcc ccgacgtata gaacggtaac ctgtctcact 120
aaatatctga gcttgggtat atggagaaac ccaacccttg ggaagatggg cggctagctt 180
cctttctatc ct 192
<210> 364
<211> 167
<212> DNA
<213> 催命按蚊(Anopheles funestus)
<220>
<223> 催命按蚊(Anopheles funestus)FUMOZ株系未放置的基因组支架supercont1.144,全基因组鸟枪序列,KB668664.1
<400> 364
agcaataccg cactgatata gatatggatt caaagtctct tgaaggataa tataggttct 60
ccgtcccgac cctactatac gtccatgtcg tatatacata tctctacaaa tatctgagct 120
tgggtatacg aggaaaccct ggagactaga tgttcctcat gccctgg 167
<210> 365
<211> 176
<212> DNA
<213> 中华按蚊(Anopheles sinensis)
<220>
<223> 中华按蚊(Anopheles sinensis)未放置的基因组支架AS2_scf7180000696013,全基因组鸟枪序列,KE525305.1
<400> 365
ttgaccattt agtctgacca tgggtctgca aaggaactat aagctatcct cccccactcc 60
tactcaatgc gtccgcgaag tacagaacgg cagcttgtcg cttaaatatc caagcttggg 120
tacatgggga aacccacccc cttgggcgaa tggccggcaa ggctgaattg agagga 176
<210> 366
<211> 162
<212> DNA
<213> 黑小按蚊(Anopheles atroparvus)
<220>
<223> 黑小按蚊(Anopheles atroparvus)EBRO株系未放置的基因组支架supercont1.22,全基因组鸟枪序列,KI421903.1
<400> 366
gtctgtgttg gtctgtgaat ggggcaggat ccgacgcctc ctgaaggcta cataggctct 60
cctatctaac tcatattctg gtatgtccaa gccatacaga ccgtgtacgg gttcaatccc 120
aaccccctgg gaggatgggg ttgcacggct aatgtagaag gg 162
<210> 367
<211> 186
<212> DNA
<213> 克里斯蒂按蚊(Anopheles christyi)
<220>
<223> 克里斯蒂按蚊(Anopheles christyi)ACHKN1017株系cont1.4036,全基因组鸟枪序列,APCM01004036.1
<400> 367
agcaatactt cgctgacacg ggaatggatc cgaagcctcc agaaggctaa cataggctct 60
ccgttgccta ctcctactaa atattcacta cattcctaca gaacggcaac ttgtttctca 120
attatccaaa cttgatgcaa catgcaaccc cttgggaaga tggaaggaat ggcaaaatta 180
ggctgg 186
<210> 368
<211> 181
<212> DNA
<213> 大劣按蚊(Anopheles dirus)
<220>
<223> 大劣按蚊(Anopheles dirus)WRAIR2株系未放置的基因组支架supercont1.24,全基因组鸟枪序列,KB672913.1
<400> 368
tttacattat gaaacacaaa tctacaatct tcacgcctgt cgaaggatgc acaggctctt 60
cttactctac tcctactcaa aacgttcccg actgtaacat gtctatccgc atatctgagc 120
ttgggtatac gaggaaacgc aaccccttgg gcgaatggat gatgtggcta atttgagtgg 180
a 181
<210> 369
<211> 164
<212> DNA
<213> 未知
<220>
<223> 冈比亚按蚊(Anopheles gambiae)M scf_1925491374基因组支架,全基因组鸟枪序列,EQ090202.1
<400> 369
aataatgttt aaattcgaaa ctgacttgga aaaccctgta atatagactc tctcatccaa 60
cttctattct tagccgtcat tggtaacatg tgtcaccaca tatgagtact tagactagat 120
ccaaaccctt gggcggatgg tggcatatgg cgaaccagga gagg 164
<210> 370
<211> 201
<212> DNA
<213> 阿拉伯按蚊(Anopheles arabiensis)
<220>
<223> 阿拉伯按蚊(Anopheles arabiensis)DONG5_A株系未放置的基因组支架supercont1.17,全基因组鸟枪序列,KB704418.1
<400> 370
ttaagtagca aatgcaatcg gataggtttc gaagcctctc tgagggataa tagaggctct 60
actattcaac ttctaatcga acacgaccct attcgtgtag agtggtaaca tgtggattcg 120
gactagttcg aagggtccca aagggaacac ggactagttc caactcctcg cacagatggt 180
ggcatatggc gaatgaggcg a 201
<210> 371
<211> 167
<212> DNA
<213> 微小按蚊(Anopheles minimus)
<220>
<223> 微小按蚊(Anopheles minimus)MINIMUS1株系未放置的基因组支架supercont1.186,全基因组鸟枪序列,KB663706.1
<400> 371
atcaaatttc tgtgagttgg tgtggtagaa ataccgcagg agaatactcc tactcaatac 60
gtccccggcg tacagagtgg taacatgtct ctccaaatat ctgagcttgg gtatacggga 120
aaatccatcc tcttgggagg atgggtgata tggctaaatt gagagga 167
<210> 372
<211> 208
<212> DNA
<213> 密拉斯按蚊(Anopheles melas)
<220>
<223> 密拉斯按蚊(Anopheles melas)CM1001059_A株系cont2.23244,全基因组鸟枪序列,AXCO02023244.1
<400> 372
agcaccaaat tatctgcaaa tgagttaata tccgacacct ccttgaaggt taatatagac 60
tctcttactc tcttactctt tctcctatcc tgcgacgtcc gtttcgtata gtggtaacat 120
gtatcatagt atattcaagc atggctgcac gggcccagtc ccaacccctt gggcggatga 180
tggtacatac atggccaacc aggagggg 208
<210> 373
<211> 180
<212> DNA
<213> 克里斯蒂按蚊(Anopheles christyi)
<220>
<223> 克里斯蒂按蚊(Anopheles christyi)ACHKN1017株系cont1.5619,全基因组鸟枪序列,APCM01005619.1
<400> 373
ctcattggct ggatcaggtg aagcgggact tgtcggagac ataggctctc ctattcaatt 60
cccatacgga cacgtcccag ttcgtgcaga gtagtaactt ggatcatcga atatccaagc 120
ttgggtacac gggcttgttc caaccccttg ggcggatggc tcatggcaaa tcaggagggc 180
<210> 374
<211> 140
<212> DNA
<213> 多斑按蚊(Anopheles maculatus)
<220>
<223> 多斑按蚊(Anopheles maculatus)maculatus3株系cont1.9278,全基因组鸟枪序列,AXCL01009283.1
<400> 374
gtcagtataa cacactagta ttgatatggg tccgaagcct gtccaaggat aatataggct 60
ctccatgtac tccatatatc ttagatagag cataagggaa aactcttgga gagatgggtg 120
ttttagctaa attgagcggt 140
<210> 375
<211> 186
<212> DNA
<213> 未知
<220>
<223> 冈比亚按蚊(Anopheles gambiae)M scf_1925491386基因组支架,全基因组鸟枪序列,EQ090214.1
<400> 375
attcttctgt gctctgcaat gggataggat ccgaagccct tctgagggat aatataggct 60
ctcttattta actcctactc ggacaagtcc ctgttcgtgc agagtggcaa catgtgtcat 120
cacatattca agcttgagtg cacggactag ttccaacccc tcgggaaaca gagtcgtaat 180
aaagga 186
<210> 376
<211> 148
<212> DNA
<213> 中华按蚊(Anopheles sinensis)
<220>
<223> 中华按蚊(Anopheles sinensis)未放置的基因组支架AS2_scf7180000695538,全基因组鸟枪序列,KE524837.1
<400> 376
tgaatgagtt gttctgcaaa tggattgaat cacttgcccc tatcccaggg cagtatgaag 60
gcgtgttcat tcctagatcc tactcaacac gtccacgtcg tgcagaatgg tagcatttca 120
ttacgatgaa atgactaagt tgagaggg 148
<210> 377
<211> 169
<212> DNA
<213> 表皮按蚊(Anopheles epiroticus)
<220>
<223> 表皮按蚊(Anopheles epiroticus)epiroticus2株系未放置的基因组支架supercont1.178,全基因组鸟枪序列,KB670480.1
<400> 377
actactacta gcttcttgaa gggttttgaa gccaggctct tctacttcta ctcttctaca 60
atttgtcctt atcgtacaga gcactaacat atattcaaat atctgagctt ggcaaaacgg 120
cgaaacccaa tcacaactcc atggatgaaa gacatggagt ttgagaggg 169
<210> 378
<211> 225
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<220>
<223> 冈比亚按蚊(Anopheles gambiae)株系PEST染色体2L,全基因组鸟枪序列,CM000356.1
<400> 378
ctctttgcct caaaagtttg ccgaccgctg ctctagaagg ttaacatagg ctctccaccc 60
cctaccctta ctcaatacgt tcccgtcgta cggatgtccc tcaattattc agatgtccag 120
atatccagat gtacagatgt ccaatgtccc tcaattatcc aagcttgggt ataaggggaa 180
acctaacccc ttgggctgat ggattgcatg gctaaattaa gagga 225
<210> 379
<211> 175
<212> DNA
<213> 克里斯蒂按蚊(Anopheles christyi)
<220>
<223> 克里斯蒂按蚊(Anopheles christyi)ACHKN1017株系cont1.3711,全基因组鸟枪序列,APCM01003711.1
<400> 379
agcaataccc cgctagtgcg ggaatggatc caaagcttcc agaagatgaa catacgctct 60
ccattccata ctcctactca atacgtcctc ggcgtacaga acaacaccat gtatctctat 120
tatccaagct tgggtaaatg gcgaaaatca tacaatttgg ggagatggga ggcag 175
<210> 380
<211> 173
<212> DNA
<213> 多斑按蚊(Anopheles maculatus)
<220>
<223> 多斑按蚊(Anopheles maculatus)maculatus3株系cont1.28980,全基因组鸟枪序列,AXCL01028988.1
<400> 380
aaaaacaacc aattgggcca cgcaaaacga cttttgcaac atgatacatt acaaattgga 60
acataatacc tgtcgtacat aatactgaaa taaacatacc aaatatctga gcttgggtat 120
acggggaaac ccaacctcta gggaaaatgg gtgatatggc taaatttacc gaa 173
<210> 381
<211> 188
<212> DNA
<213> 密拉斯按蚊(Anopheles melas)
<220>
<223> 密拉斯按蚊(Anopheles melas)CM1001059_A株系cont2.8943,全基因组鸟枪序列,AXCO02008943.1
<400> 381
ggtagttcta ctggcaatgg ttggcagatt cgaaacctct agaaggttaa caaaggctct 60
ccatcaccga cttctactca atacgtcctt gtcgtacaga atggtaacat gtttcttaat 120
tatccaagct ttggtacacg gggaaaccca accccttgga cattggttgc atggctaaat 180
tgagagga 188
<210> 382
<211> 121
<212> DNA
<213> 斯氏按蚊(Anopheles stephensi)
<220>
<223> 斯氏按蚊(Anopheles stephensi)SDA-500株系未放置的基因组支架supercont1.383,全基因组鸟枪序列,KB664714.1
<220>
<221> 尚未归类的特征
<222> (105)..(121)
<223> n是a、c、g、或t
<400> 382
attaatctgg ctctgttaat ggggtaggaa ccgaagctcc tctcggggtt acacaggctc 60
tcctacccaa ctcctattcc gtcacgtcct cgtcgtacag agtgnnnnnn nnnnnnnnnn 120
n 121
<210> 383
<211> 175
<212> DNA
<213> 克里斯蒂按蚊(Anopheles christyi)
<220>
<223> 克里斯蒂按蚊(Anopheles christyi)ACHKN1017株系cont1.2748,全基因组鸟枪序列,APCM01002748.1
<400> 383
tacttcatat gtattgcaat aagataagtt ccgtagcccc tttgagggat aatacaggct 60
ctccaattca actcctatcc gaaaacgtcc tagttcgtac aaagattcgt caccgctttt 120
cttgttgacc tgttctaacc ccttgggagg ttggcgcaag gctaatcagg agagt 175
<210> 384
<211> 167
<212> DNA
<213> 微小按蚊(Anopheles minimus)
<220>
<223> 微小按蚊(Anopheles minimus)MINIMUS1株系未放置的基因组支架supercont1.2,全基因组鸟枪序列,KB663721.1
<400> 384
tctagcaatg gtaagggaat ggatctggag cctctcgaag gataataaag gttctatata 60
tcatattact actcaacggt aacatgtatc gccaaatacc ctgagcttgg gaatatgaag 120
aaattcaacc actcggcagg atgaggaatg ttgtgaagct tggaaga 167
<210> 385
<211> 222
<212> DNA
<213> 斯氏按蚊(Anopheles stephensi)
<220>
<223> 斯氏按蚊(Anopheles stephensi)SDA-500株系未放置的基因组支架supercont1.505,全基因组鸟枪序列,KB664850.1
<400> 385
cctaaaagtt gctctgttaa tgaaatagga tccgagactc ctttcagggt tacacagggg 60
ggtaggagag agtttcaggg taggagagtc ctacccaact cctattccgt cacgtcctcg 120
tcgtacagag tggtaacttt tcccaccata tatctaagct tgggtacacg gacctgtccc 180
aaccccttgg gcggatggtg gagaaaggct aaacaggagg ag 222
<210> 386
<211> 158
<212> DNA
<213> 大劣按蚊(Anopheles dirus)
<220>
<223> 大劣按蚊(Anopheles dirus)WRAIR2株系未放置的基因组支架supercont1.30,全基因组鸟枪序列,KB672980.1
<400> 386
tagaaatgca gcactggtaa gggtacggat ccgacgcctc tcgaaggata cctaggctct 60
ccgtacccta ctcctactca aaacgtcccc gattttcctc ctgtctaacc taagacgcgt 120
tccgcgagag atcttagctt atggttagtt tggttggt 158
<210> 387
<211> 189
<212> DNA
<213> 微小按蚊(Anopheles minimus)
<220>
<223> 微小按蚊(Anopheles minimus)MINIMUS1株系未放置的基因组支架supercont1.12,全基因组鸟枪序列,KB663633.1
<400> 387
ttcacatagg ctctgcaata aggtagaact cggaacctat tgaaggtcac acaggctctc 60
ctactcaact cccattctgc aacgtcctcg tcgtgcagag tgacgagaac taccgtatat 120
ccaatattga gtacacggac tagctccaac cctttgatcg ggtagtgatg ctcggcaaaa 180
gaggagggc 189
<210> 388
<211> 193
<212> DNA
<213> 未知
<220>
<223> 冈比亚按蚊(Anopheles gambiae)M scf_1925488698基因组支架,全基因组鸟枪序列,EQ087528.1
<400> 388
cccagtgttt ttcctttttc ctgtttttcc agaaacccct cgagggatag taccggctct 60
tccatccaac tcctattccg acacgtcctc gtcgtgcaga gtggtagcat gtgccaccat 120
atatcctagg ttggatacac gggctagatc caacccttcg ggcggatggt ggcatatgac 180
gaaccaggag ggg 193
<210> 389
<211> 167
<212> DNA
<213> 中华按蚊(Anopheles sinensis)
<220>
<223> 中华按蚊(Anopheles sinensis)未放置的基因组支架AS2_scf7180000696059,全基因组鸟枪序列,KE525351.1
<400> 389
tctagtagta gtcctttaac gggttggatc cggcgcctcg tgaaggctac tataggctct 60
ccttctcaaa atctattcga tgcgtccgcg acgtacagaa cggtaccttg tcgcccaaat 120
atccatcagt tcatcctcga gcggctgtcc tccatgttag gagcggc 167
<210> 390
<211> 189
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<220>
<223> 冈比亚按蚊(Anopheles gambiae)株系PEST染色体2R,全基因组鸟枪序列,CM000357.1
<400> 390
agcaatacgt cgctgatatg gcagtggagc cgaagcctct agaaggttaa caaaggctca 60
ccatccttta ctcatattcc atacgtcctc aatgtacaga tcggtaacat gcctctcaat 120
tatctaagct tagctatacg aggttcttca tgactgttct ccatattagg agcggctccc 180
tccaagcgt 189
<210> 391
<211> 117
<212> DNA
<213> 阿拉伯按蚊(Anopheles arabiensis)
<220>
<223> 阿拉伯按蚊(Anopheles arabiensis)DONG5_A株系未放置的基因组支架supercont1.5,全基因组鸟枪序列,KB704784.1
<400> 391
ctcgacttgc cgttcgaaca ccatgatcag gccacatata ggctaatttt ctatgcttag 60
atatacgggg aaacccaagc ccttgggcgg atgggttgta tggctaaatt gagtatt 117
<210> 392
<211> 155
<212> DNA
<213> 中华按蚊(Anopheles sinensis)
<220>
<223> 中华按蚊(Anopheles sinensis)未放置的基因组支架AS2_scf7180000696013,全基因组鸟枪序列,KE525305.1
<400> 392
agtatcgtta aaaccacata ttgtcctttg caaaccttcc gtaccaaaat tacggagagt 60
acagaacggt agcctgttgc ctaaatattc aagcttgggt acacggggaa acccaccccc 120
ttgggcgaat gggcgacaag gccgaattga gacgg 155
<210> 393
<211> 136
<212> DNA
<213> 拇鲁斯按蚊(Anopheles merus)
<220>
<223> 拇鲁斯按蚊(Anopheles merus)MAF株系未放置的基因组支架supercont2.196,全基因组鸟枪序列,KI915351.1
<400> 393
ctgagacgag gatagatcca aaggtagatc cgaagaaggt taataaagga tctccaaccc 60
ctacaccaac taaatatgtc cccgtagtac ggcccggtaa catgtggtaa ccctctcagt 120
ggatgtacag acccga 136
<210> 394
<211> 119
<212> DNA
<213> 表皮按蚊(Anopheles epiroticus)
<220>
<223> 表皮按蚊(Anopheles epiroticus)epiroticus2株系未放置的基因组支架supercont1.208,全基因组鸟枪序列,KB670814.1
<400> 394
tcaatcatgt gaaactgtta tgggatggga tccgaagcct ccagaagatt ccatctaact 60
cctgttccga cacgtccacg tcgtgcaggg tggggcaaca tggacctaac cagggggtc 119
<210> 395
<211> 208
<212> DNA
<213> 达氏按蚊(Anopheles darlingi)
<220>
<223> 达氏按蚊(Anopheles darlingi)Cont6653,全基因组鸟枪序列,ADMH02001348.1
<400> 395
gcaattggtt gctctacaaa tgaggttagg atccgaagca ctaggctaat ttaggctctc 60
ctcccctaac tcctactcgt cgcgtcctcg cggggctcat gggttctgct cgtgtagagc 120
ggtaacatgc ctcccacacg tctgagcttg ggtacacggg taacaccaac cccttgggaa 180
gatggggggt atggctgaga cgagaggg 208
<210> 396
<211> 172
<212> DNA
<213> 斯氏按蚊(Anopheles stephensi)
<220>
<223> 斯氏按蚊(Anopheles stephensi)SDA-500株系未放置的基因组支架supercont1.182,全基因组鸟枪序列,KB664491.1
<400> 396
cgtagcaata atgcactagt aaggtatgga tctgaagctt cttgagggtt aacaaaacct 60
ctccatacgc tacttcgact caatacgtcg tacgggcgta cagaactctc catacatatg 120
aacttgggtc atacggggaa acccaacccc ttgggaagag agatagcgag cg 172
<210> 397
<211> 193
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<220>
<223> 冈比亚按蚊(Anopheles gambiae)株系PEST全基因组鸟枪测序项目,全基因组鸟枪序列,AAAB01008842.1
<400> 397
aacattttta gatcgtcagc atataataac aatttaacat gaggaatagc aaacacgaca 60
tcgttaataa atataataaa tagtaaaggt cctaatcacc acattgatat gtgtcaccac 120
atatccaagc ttgggtacac gggcttgacc caaccccttg ggcggatggt ggcacatggc 180
gaaccaggag ggg 193
<210> 398
<211> 153
<212> DNA
<213> 大劣按蚊(Anopheles dirus)
<220>
<223> 大劣按蚊(Anopheles dirus)WRAIR2株系未放置的基因组支架supercont1.20,全基因组鸟枪序列,KB672869.1
<400> 398
tgcaacaacc atttcgtaca tgagggaatg aaaacaagaa gaggtggggt gacaaactta 60
aagaatttta acactatagt agatatctga gcttgggtat acggggaaac ccaacccctt 120
gggaggatgg aagacatggc taatttgaga gga 153
<210> 399
<211> 110
<212> DNA
<213> 库态按蚊(Anopheles culicifacies)
<220>
<223> 库态按蚊(Anopheles culicifacies)株系物种A-37_1 cont1.7295,全基因组鸟枪序列,AXCM01007295.1
<400> 399
atcaatcgtt gctctgtaag taggtgtggt actgttaaga taagctctcc ataccgtact 60
cctactcaat acgtcctcgg cgtacagagc ggtaacatgt ctctccaaat 110
<210> 400
<211> 201
<212> DNA
<213> 大劣按蚊(Anopheles dirus)
<220>
<223> 大劣按蚊(Anopheles dirus)WRAIR2株系未放置的基因组支架supercont1.25,全基因组鸟枪序列,KB672924.1
<400> 400
cgtatctttc tactatataa tgggataaga tccaatacct tttgcaagct aacgcatgct 60
ctattattct cttctgtcgc gacacgtccc caacgtacag cttggtagca tatatgattt 120
attttccaag cttgggtagt ccggacaaat ggcaatctca acgttggaga agagctagac 180
gatatactca actacttcaa g 201
<210> 401
<211> 129
<212> DNA
<213> 库态按蚊(Anopheles culicifacies)
<220>
<223> 库态按蚊(Anopheles culicifacies)株系物种A-37_1 cont1.8016,全基因组鸟枪序列,AXCM01008016.1
<400> 401
aaatggatcc gaagcctctc gaaggataat tgagggctac tcctacttac atgtctctac 60
aaatatctga gctcgggtat tcagggaaat ccaacccttt gggagtatga tacggctgaa 120
ttgagagga 129
<210> 402
<211> 129
<212> DNA
<213> 斯氏按蚊(Anopheles stephensi)
<220>
<223> 斯氏按蚊(Anopheles stephensi)SDA-500株系未放置的基因组支架supercont1.68,全基因组鸟枪序列,KB665043.1
<400> 402
gctagttctg cagctgttgt ggtagcatta ctgaagcctc ttgcaggtta acaaaggctc 60
tccataccct acctcgactc aatacgttcc cctgtcgtac aaaacggtag catgtctcaa 120
cggaaatga 129
<210> 403
<211> 190
<212> DNA
<213> 微小按蚊(Anopheles minimus)
<220>
<223> 微小按蚊(Anopheles minimus)MINIMUS1株系未放置的基因组支架supercont1.11,全基因组鸟枪序列,KB663622.1
<400> 403
accataatat cctgctaacg gggtagaata tgaagtcgct taaaggttac acaggctctc 60
ctactcaacc cttattcccc ctagcatcct cgtcgtgcag agcggcaact tgaaccatcg 120
catatccaag cttgggtacg cgggttagtt ccccttgggc ggatggtggt gtatgattaa 180
acaggaggga 190
<210> 404
<211> 183
<212> DNA
<213> 拇鲁斯按蚊(Anopheles merus)
<220>
<223> 拇鲁斯按蚊(Anopheles merus)MAF株系未放置的基因组支架supercont2.33,全基因组鸟枪序列,KI915188.1
<400> 404
ttcagatcat ctgctcagca atggaacagg atccgaagtt tccctgaatg ataacatagg 60
ttatccgatc taactcgtat ccagacaagt gtcagttcgt tacatgtgtc atcacatatc 120
caagcttatg tacacggacc tgttgcaacc gttcgggcgg attgttgcag tcatttgatt 180
gca 183
<210> 405
<211> 127
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)CAG:221基因组支架,scf67,FR883402.1
<400> 405
aactaagttg acgaggatga gatttatcga attttttcgg cggatatctc acgtaaatag 60
cactagcgtt aataattaac aaaactacaa agtaatttgt aggacaaatt taattatgtg 120
caatcta 127
<210> 406
<211> 159
<212> DNA
<213> 未知
<220>
<223> 新丙酸[梭菌]([Clostridium] neopropionicum) DSM-3847株系CLNEO_contig000018,全基因组鸟枪序列,LRVM01000018.1
<400> 406
ttgaaaaatg aagcgccaga accgcagata gggcggttga cgaggtagaa gtgatcgaat 60
ttttcggcgg atgcttctcg cccattcgtt cagggacgca ggtctttcta caaataggag 120
aaggtaattc ttctgacaaa gggaaaggca acggacgaa 159
<210> 407
<211> 154
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)CAG:465基因组支架,scf33,FR891245.1
<400> 407
taacattaaa tagcgcatga acataccttt cgtatgtgac gaggatgata gttatcgaac 60
attcagcgga tactatcacg gtgatttagc atcgatatat atagtacaaa aagtaaaatc 120
tttaattact acaaaaacta tataatctaa atat 154
<210> 408
<211> 178
<212> DNA
<213> 暗黑菌门(Atribacteria)细菌
<220>
<223> 暗黑菌门(Atribacteria)细菌34_128 MPI_scaffold_1295,全基因组鸟枪序列,LGGA01000028.1
<400> 408
aattgaatac aagcgccaga acttactcaa tttgaagggc taagtgtttt gataaggtaa 60
gttgacgagg aaggagttta tcgaaaattc ggcggatgct cctgggttgg ccagaccctt 120
agaaaacctg taaaacttgt gagtaattgc aaggacagag aggtttttat ggcaaaat 178
<210> 409
<211> 150
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)CAG:793基因组支架,scf49,HF993644.1
<400> 409
ttatttaagt aagcgccagg acattttttt aatgttgacg aggatagaac ttatcgaaat 60
tttcggcgga tggttctagg gaatgctact tcctaaaata ttgtcaaaaa ataatagcga 120
tattataaca aatcaatatt actagctgtg 150
<210> 410
<211> 171
<212> DNA
<213> 未知
<220>
<223> 库特氏菌属物种(Kurthia sp.)11kri321,完整基因组,CP013217.1
<400> 410
aaaacagtta tagcgccagt actgaagaaa tcggacgaca agtatcttca gtagacgagg 60
tggaggagta tcgaaagttt cggcggatgc ctcccggtcg acagcccgat cgtaagttca 120
tctttaaaat agtgaagtga ttcattagac aaagagatga aatggcaaat c 171
<210> 411
<211> 148
<212> DNA
<213> 脓肿分枝杆菌(Mycobacterium abscessus)
<220>
<223> 脓肿分枝杆菌(Mycobacterium abscessus)株系PAP053基因组组装,重叠群:ERS075544SCcontig000014,CSXB01000014.1
<400> 411
caatatcgga tagcgccaga cctgaacgtt caggtgacga ggagagagct tatcgaagat 60
tcggcgggtg gctctaggga ctgcactcta cagataacaa agaaaaacta attgtgaagt 120
tagaacaaag cggttatcac gcaggtag 148
<210> 412
<211> 189
<212> DNA
<213> Shuttleworthia satelles
<220>
<223> Shuttleworthia satelles DSM 14600基因组支架Scfld0,全基因组鸟枪序列,GG665866.1
<400> 412
tcaaaaactt tagcgccatg tacccggccg cttttcatcc ctctgtattt ttggaggaac 60
gttttggccc gggttgacga ggtgtcaggt gatcgaagat tcggcggatg cctgatcgcg 120
gatgcggccg cgcatacagt tgacaaaaga tccggtaacg gagagacaaa gagactgtaa 180
ccgtatgga 189
<210> 413
<211> 324
<212> DNA
<213> 拜氏梭菌(Clostridium beijerinckii)
<220>
<223> 拜氏梭菌(Clostridium beijerinckii)NCIMB 8052,完整基因组,CP000721.1
<400> 413
aatcaataaa aagcgccagg actaagtgga atttagttga aagtgaattt ttacagggtt 60
ggtttttata aaaggaattt agttaatagt aagctttgat ataagctacg cgaatagcta 120
atgaaatctt tttaaaggaa actcgactca cgttcgttcg ctgagtaaat tcaactatcc 180
aaatcgaaga tttggagttt catttacgtc gacgaggttg gggagtatcg aaacttcggc 240
gggtgcccca cggtatcgca ctaccgtaaa cgactggtaa aactgtgaag tgattcacag 300
gacaaattca gtctggtgtt aaaa 324
<210> 414
<211> 147
<212> DNA
<213> 未知
<220>
<223> 芽孢杆菌属物种(Bacillus sp.)CAG:988基因组支架,scf27,FR897768.1
<400> 414
gaattctttc tagcgccaga actttgaata gttgacgagg atagtagtga tcgaaaattc 60
ggcggatgct actacgtagg gaagatgcgt taggtatgtc taaaaagcaa aatcgacatt 120
gtaacaacag atgtatcact tttcaga 147
<210> 415
<211> 155
<212> DNA
<213> 还原脱硫肠状菌(Desulfotomaculum reducens)
<220>
<223> 还原脱硫肠状菌(Desulfotomaculum reducens)MI-1,完整基因组,CP000612.1
<400> 415
taaataactg aagcgccaga accttttaca aagtaagggt tgacgaggag agggagtatc 60
gatgtttcgg cggatgccct ccggcccagt tgcggccgta aaagcagaac aaagctggaa 120
ggtaactttc ggtacaaaaa ctgcgggtga ctaaa 155
<210> 416
<211> 148
<212> DNA
<213> 澳大利亚马赫氏菌(Mahella australiensis)
<220>
<223> 澳大利亚马赫氏菌(Mahella australiensis)50-1 BON,完整基因组,CP002360.1
<400> 416
ttcgatataa aagcgccgga actcattttg agttgacgag gtcagggttt atcgattttt 60
cggcgggtgc cctgcggcat acggctgccg acaaaggttc cacaaaagca aaaagcgatt 120
tttgctacaa acgggactgg gccaaaat 148
<210> 417
<211> 202
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)CAG:7基因组支架,scf260,HF990741.1
<400> 417
agtaaagcta tagcgccatg cacctgggtc gggtcgtgaa cagtaacgga tgaatgaata 60
ataacttact gctgacacag gttaacgagg tggagagaga atcgaacata ttcggcgggt 120
gctctcccat gcagtccggg cgtgttttat accagaaaaa tatgcgggta actgcaaaac 180
aaagctggta taaccggaca ga 202
<210> 418
<211> 173
<212> DNA
<213> 巨大芽孢杆菌(Bacillus megaterium)
<220>
<223> 巨大芽孢杆菌(Bacillus megaterium)QM B1551,完整基因组,CP001983.1
<400> 418
agtgaataca aagcgcctga actaagtaaa gggacggaaa cgacttagtt gacgaggagg 60
aggtttatcg aagtatcggc ggatgcctcc cggttgttga ttatcacggc cgaaaacttg 120
atgtgaaaaa caatgaggtg acttattgga caaaagcatt gagatgataa tca 173
<210> 419
<211> 197
<212> DNA
<213> 解糖热解纤维菌(Caldicellulosiruptor saccharolyticus)
<220>
<223> 解糖热解纤维菌(Caldicellulosiruptor saccharolyticus)DSM 8903,完整基因组,CP000679.1
<400> 419
ggttttttca aagcgccagg acctctggaa attatagcgc tattgccttt gcgcattttt 60
tccagaggtt gacgaggact ggggagaatc gaggttttcg gcgggtgccc cagcggggtt 120
ttgccttttt ccctcgcaac tttctgctac aaaccccgga aggcaacttc tgggacaaag 180
gcagaaagaa aaaaggc 197
<210> 420
<211> 159
<212> DNA
<213> 未知
<220>
<223> 梭菌属(Clostridium cellulosi)基因组组装,染色体:I,LM995447.1
<400> 420
ttaaatatta aagcgccagg accgatataa atcggttgac gaggtgggga gttatcgaaa 60
gattcggcgg gtgctcctcc ggccgttagt gttgcggtcg ttagctcatg ctacaaaaaa 120
cgcgggtaac cgcgcaaaaa aaggctgagc attcagcgc 159
<210> 421
<211> 152
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)CAG:245基因组支架,scf154,FR880072.1
<400> 421
agttcatttt tagcgccagg acagcgtttg tgctgttgac gaggttagag tttatcgaaa 60
tattcggcgg atgctctagg gctttctacg gtccttataa attagcaaaa cctagcagtg 120
atgttagaac agatataatt ttgagtagtt ta 152
<210> 422
<211> 157
<212> DNA
<213> 蜡样芽孢杆菌(Bacillus cereus)
<220>
<223> 蜡样芽孢杆菌(Bacillus cereus)cytotoxis亚种NVH 391-98,完整基因组,CP000764.1
<400> 422
agagtgatta aagcgccaga actacaaatt gtgtagttga cgaggaggag ttttatcgag 60
atttcggcgg atgactcccg gttattcatc ataaccgcaa gcttttattt aaatcactga 120
ggcgacttgg tggacaaaga taaaagtgtg atgagag 157
<210> 423
<211> 209
<212> DNA
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<223> 金黄色葡萄球菌(Staphylococcus aureus)C0673基因组支架aedLz-supercont1.14,全基因组鸟枪序列,KK222758.1
<400> 423
aggaaactta tagcgcctga acaaagcgca tacacgattg tagaggcatg tataatcaga 60
tacatgctga atgagtgtta tgacctttgt tgacgaggag gatagttatc gaattttcgg 120
cggatgctat cccggatgtg gcccattcga agttcaatgt ttaaagcata taggtgactg 180
tatgtccaaa gacgttgaaa tagccataa 209
<210> 424
<211> 156
<212> DNA
<213> 格氏梭菌(Clostridium grantii)
<220>
<223> 格氏梭菌(Clostridium grantii)DSM 8605基因组组装,重叠群:EJ34DRAFT_scaffold00005.5,FQXM01000006.1
<400> 424
atattatagt tagcgccaga agtagtgggt aaagtgctac ttgacgagga tggggagtat 60
cgaaatttcg gcggatgccc cacggtataa cactatcgat aaacattggc aaagcaaaga 120
agtgattctt tgtacaaatt caatggagtg tgaatc 156
<210> 425
<211> 153
<212> DNA
<213> 巴氏梭菌(Clostridium bartlettii)
<220>
<223> 巴氏梭菌(Clostridium bartlettii)CAG:1329基因组支架,scf11,HF999313.1
<400> 425
agtgtttata aagcgccaga acttaatttt ttaagttgac gaggtcagag ttaatcgaaa 60
tatcggcgga tgctctgcgg tgtgccacca tcgaaggatt tctacaaagg gtgaaagcaa 120
tttcactaca caaaaagaaa cccatgtgga ttg 153
<210> 426
<211> 154
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)SCN 57-10 ABT01_C0138,全基因组鸟枪序列,MEFT01000138.1
<400> 426
acacgttcaa aagcgccggg actgcgtgtg cagttgacga ggcggaggat gatcgaacca 60
ttcggcgggt gcctcctttt cgcgtcgcgc ggaaaagagc cgatgctcaa aacccgttcg 120
caaggacggc gacaaaagca cggcacgcga caca 154
<210> 427
<211> 178
<212> DNA
<213> 耐辐射奇球菌(Deinococcus radiodurans)
<220>
<223> 耐辐射奇球菌(Deinococcus radiodurans)R1染色体1,完整序列,AE000513.1
<400> 427
cttcttcggg cagcgcaagg ccccggcgac acgtgatgtc acaagccggg gagacgaggt 60
ggaggtcagc gacttttctg cggatgcctc caggccccgg tgaacgggcc tacccggcgc 120
gtgctttgcc gctctgagtc aaagactccg gcaggcagaa ccacgcgcaa gcccggcg 178
<210> 428
<211> 167
<212> DNA
<213> 澳门假芽孢杆菌(Fictibacillus macauensis)
<220>
<223> 澳门假芽孢杆菌(Fictibacillus macauensis)ZFHKF-1重叠群05,全基因组鸟枪序列,AKKV01000005.1
<400> 428
gcaataccac aagcgcctga actattttcg accggaatga aaatagttga cgaggaagag 60
gatcatcgag atttcggcgg atgcctctcg gatgacgtca catccgtaag cttttataca 120
aaccaggtaa ggtgacttcc tgtacaaaca taaaagtagt gacgaat 167
<210> 429
<211> 153
<212> DNA
<213> 甲基戊糖梭菌(Clostridium methylpentosum)
<220>
<223> 甲基戊糖梭菌(Clostridium methylpentosum)DSM 5476 Scfld6基因组支架,全基因组鸟枪序列,EQ973344.1
<400> 429
gggtacaacc aagcgccagg cccggataca gctccgggtg acgaggtgga gagtgatcga 60
acagaatcgg cggatgctct cccggtcccg gcaggaggat cgtcagatgg ttcacaaaag 120
cgcgttgcgc acaaaagagc caccccatcc cgc 153
<210> 430
<211> 158
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)CAG:470基因组支架,scf38,FR898135.1
<400> 430
gttatttttc aagcgccagg accactattt tcaggaggtt gacgaggtct agagttatcg 60
aaatattcgg cggatgctct agtggctttt acttaaggtc atcagtatta attaaaaact 120
aatagtaata ttagaacaga agttaatatt ttaagttt 158
<210> 431
<211> 159
<212> DNA
<213> 白蚁孢杆菌(Sporobacter termitidis)
<220>
<223> 白蚁孢杆菌(Sporobacter termitidis)DSM 10068基因组组装,重叠群:EK05DRAFT_scaffold00008.8,FQXV01000008.1
<400> 431
taaaatttag aagcgccaga cttcacgcag agcgcggagt tgacgagggc ggggtttatc 60
gaagtattcg gcgggtgccc cgtgctgcgg tccatcagca ttacaggttt tacaaatcct 120
caagcaattg acgggacaaa ataaacctga ttgggcctt 159
<210> 432
<211> 165
<212> DNA
<213> 格氏李斯特菌(Listeria grayi)
<220>
<223> 格氏李斯特菌(Listeria grayi)DSM 20601基因组支架SCAFFOLD1,全基因组鸟枪序列,GL538352.1
<400> 432
aatttaatag aagcgccaga actgatcgaa cggggtatca gttgacgagg aggagattaa 60
tcgagttttt tcggcgggag tctcccggtt attcatgtag ccgttatgtc tgagttacaa 120
aacaagcagg cgactgtttg gacagaaagc ttagacgcat gagtt 165
<210> 433
<211> 157
<212> DNA
<213> 未知
<220>
<223> 颤杆菌克属物种(Oscillibacter sp.)KLE 1745基因组支架Scaffold170,全基因组鸟枪序列,KI271673.1
<400> 433
cggcccatca cagcgccagc gcccgccgcc agcggcggga cgacgagggg aagggagtat 60
cgaaggattc ggcggatgcc cttccgtgcc cacgggcgcg tacacagccg gcaaatatgc 120
gggcaaccgc aaaacaaggg ggctgtgacc gtgaaga 157
<210> 434
<211> 155
<212> DNA
<213> 解糖热厌氧杆菌(Thermoanaerobacterium saccharolyticum)
<220>
<223> 解糖热厌氧杆菌(Thermoanaerobacterium saccharolyticum)JW SL-YS485,完整基因组,CP003184.1
<400> 434
aactgaataa aagcgcctgg gcttagggga aactctaagt tgacgaggac agggttaatc 60
gagttatcgg cggatgccct gcggcttcct gcggccgata gagaaccggg aaaaccatgg 120
gtgaccattg gcatagagcg gtttgagcag ggata 155
<210> 435
<211> 171
<212> DNA
<213> 嗜盐薄壁芽孢杆菌(Gracilibacillus halophilus)
<220>
<223> 嗜盐薄壁芽孢杆菌(Gracilibacillus halophilus)YIM-C55.5重叠群_7,全基因组鸟枪序列,APML01000007.1
<400> 435
tattaatgga aagcgccagg gctatggtga acgaagaatc catagctgac gaggtggagg 60
ttttatcgag tttgatcggc ggatgcctcc cggttgttgc atctcaaccg tcacattttt 120
attcgaaaac atgaaggtaa ctttatgaac aagaataaaa ataagatgcc t 171
<210> 436
<211> 152
<212> DNA
<213> 嗜碱盐水球菌(Salinicoccus alkaliphilus)
<220>
<223> 嗜碱盐水球菌(Salinicoccus alkaliphilus)DSM 16010基因组组装,重叠群:EJ97DRAFT_scaffold00003.3,FRCF01000004.1
<400> 436
aaaatcggaa tagcgcccgg gcagctttgc tgctgacgag gaggacggtc atcgatcatc 60
ggcggatacc gtcccggaca ctgaagtgtt cgttacaccg gatgttaaaa cccgcaagcg 120
attgcgggga cagagcaccg gtcgataatt gt 152
<210> 437
<211> 168
<212> DNA
<213> 布替利西柯普利卡柯伦菌(Butyricicoccus pullicaecorum)
<220>
<223> 布替利西柯普利卡柯伦菌(Butyricicoccus pullicaecorum)1.2基因组支架acBRa-supercont1.1,全基因组鸟枪序列,KB976103.1
<400> 437
tgcatatcga tagcgccaga actgcggagc agcccgtttc gcagtggacg aggtaagggt 60
tgatcgaaaa ttcggcggat gacccttcgg ccgcgagtga gccggtcgtt agcaggacgt 120
gtaaaccccg ggagtgatcc cggaaacaga gcgtcttcgc atgaccca 168
<210> 438
<211> 198
<212> DNA
<213> 厚壁菌门(Firmicutes)细菌
<220>
<223> 厚壁菌门(Firmicutes)细菌CAG:176_63_11 Ley3_66761_scaffold_4747,全基因组鸟枪序列,MNSY01000086.1
<400> 438
tcctgcgctt ttgcgccttg tcttgacgaa aaatctctcg ccggcaggcc ggcggatatt 60
tttcttttcc gccgccgtgg gataacgagg tggggagcga tcgaaaattc ggcggatgct 120
cctccgcatc gtccggatgc gcacacagct cataaatatg cgggagaccg caaaacagag 180
gggctgtgac cggatgcg 198
<210> 439
<211> 168
<212> DNA
<213> 小基因组菌总门(Microgenomates)细菌
<220>
<223> 小基因组菌总门(Microgenomates)细菌OLB23 UZ22_OP11002CONTIG000039,全基因组鸟枪序列,LMZU01000039.1
<400> 439
cattgttata tagcgtgtgg cccccatctg cattggcagc ggggatacga ggagagggct 60
agcgaataat ctgcgggtac cctcaggccg aagccaagct gtcgacctta agtgtgctct 120
taaatccttc tggcaacaga agggacacgg gagcttgcat acagcata 168
<210> 440
<211> 174
<212> DNA
<213> 鱼腥味锥形杆菌(Pyramidobacter piscolens)
<220>
<223> 鱼腥味锥形杆菌(Pyramidobacter piscolens)W5455重叠群00008,全基因组鸟枪序列,ADFP01000071.1
<400> 440
gaacgaacgg aagcgccagg actgaaccgc ttctcactcc gcggcgacag tcgacgagga 60
cgaaagtgat cgaaccattc ggcggatgct ttcgtggcgg gcgaagggga gccatgaacc 120
tccgtcacaa aaccccgggg cgacccggga acaaacggcg gaggcccttc aatg 174
<210> 441
<211> 172
<212> DNA
<213> 芽孢杆菌属物种(Bacillus sp.)CHD6a
<220>
<223> 芽孢杆菌属物种(Bacillus sp.)CHD6a重叠群17,全基因组鸟枪序列,LBMD01000017.1
<400> 441
tagatataca aagcgcctga actaagcgac ggacgaaacc atgcttagtt gacgaggagg 60
aggtttatcg atctatcggc ggatgcctcc cggttgccaa tcacaaccga ctttagggac 120
agtttaaagc ataaaggcaa ctttatgtac aaagactgtt actatgattg ca 172
<210> 442
<211> 147
<212> DNA
<213> 未知
<220>
<223> 支原体属物种(Mycoplasma sp.)CAG:472基因组支架,scf184,FR899424.1
<400> 442
atttttgtaa tagcgcatgg cctatttagg tgacgaggac ttacattgtc gatttatcag 60
cggatgtgta agcggagaag ttttacttcg taaaatacct taaaaaaata aaatcaaaat 120
tataacaaag aggtatttaa taaaaca 147
<210> 443
<211> 297
<212> DNA
<213> 诺维氏梭菌(Clostridium novyi)
<220>
<223> 诺维氏梭菌(Clostridium novyi)NT,完整基因组,CP000382.1
<400> 443
aataatatta aagcgccaga acttaagttg agtaaatgag ggaataaagg aaactcaaac 60
tagacgtttg agtaagttcg actaactaaa tcatagattt aagaagttaa ggaaactcaa 120
actaaatgtt tgagtaagtt cgccttaacc aaatcgtaga tttggaggct cacttaagtt 180
gacgaggatg gggagtatcg agaattcggc ggatgtccca cggtatttat gtactaccga 240
taacagttag caaatctaaa aagcgatttt tagcacaaat ctaactaggt acatgat 297
<210> 444
<211> 228
<212> DNA
<213> 南极类芽孢杆菌(Paenibacillus antarcticus)
<220>
<223> 南极类芽孢杆菌(Paenibacillus antarcticus)株系CECT 5836 PBAT34,全基因组鸟枪序列,LVJI01000034.1
<400> 444
tgtatattaa aagcgccaga acttgactag cgcgggatgt aagatggacc gagggtatgg 60
atgagtacga tccgtttcgg tgcctgatta caacggcaga tcaagttgac gaggtggggg 120
tgttcgaaat gttcggcggg gacctcccgg tgatgcacca gagccgtgaa tcatatacgg 180
aaaataagcg ggcgactgct catacaacgt agtgatgggt gctaatta 228
<210> 445
<211> 224
<212> DNA
<213> 未知
<220>
<223> 戈茨曼菌门(Gottesmanbacteria)细菌暂定种RIFCSPLOWO2_01_FULL_48_11rifcsplowo2_01_scaffold_16357,全基因组鸟枪序列,MFJY01000009.1
<400> 445
cagagaacat aagcgtgtgg cccggctatc atgttcctcg ccgagctcgt cacaccagcc 60
gggcaagccc ggttgatgcg agcgaagcga gcataataac cgggatacga ggaaagggct 120
tatcggataa atctgcgggt gccctttggt agtactctct accacaacgg taatcagaaa 180
ctccaccggt aacggtggga acaaatgatt atcggcagag tcgc 224
<210> 446
<211> 144
<212> DNA
<213> 解乳厌氧球菌(Anaerococcus lactolyticus)
<220>
<223> 解乳厌氧球菌(Anaerococcus lactolyticus)ATCC 51172基因组支架SCAFFOLD12,全基因组鸟枪序列,GG666055.1
<400> 446
aaaaacaaca aagcgccaga tccctttggg atgacgaggg aggaagttat cgaaaattcg 60
gcgggagctt cctgggttca cagccttagt gttagacaaa agcagagagc aatttctgcg 120
acagagaaga cacagtggcc tcat 144
<210> 447
<211> 149
<212> DNA
<213> 肠球菌属物种(Enterococcus sp.)9D6_DIV0238
<220>
<223> 肠球菌属物种(Enterococcus sp.)9D6_DIV0238 scaffold00002,全基因组鸟枪序列,NIBQ01000002.1
<400> 447
aatataggaa tagcgccagg cctgttgttt caggtgacga ggagagagct tatcgaaaca 60
ttcggcggat agctctaggg gctgcactct acaagctgga aataaaaaat aattgcaaaa 120
ttataacaaa gattcagcta agcagaata 149
<210> 448
<211> 328
<212> DNA
<213> 解淀粉梭菌(Clostridium amylolyticum)
<220>
<223> 解淀粉梭菌(Clostridium amylolyticum)DSM 21864株系基因组组装,重叠群:Ga0131114_103,FQZO01000003.1
<400> 448
tacaatataa aagcgccagg actagagtag agccaaatta aaatttggaa catatgatta 60
acttaccatg acgtatggag aagttggagc atatgataaa aggaaacttc ttctccgatg 120
ctaaagctta aaaaataaga aatatgaagc tttagcatct acgaagaaga aagcgaccgc 180
gccaaattaa aatttagagc ctctgcttta gttgacgagg atggggagta tcgagtcttc 240
ggcgggtgcc ccacggtagc gcactaccgt taacgattga taaagccggg aagtgatttc 300
tggaaacaac atcaatcagg tgttaaaa 328
<210> 449
<211> 84
<212> DNA
<213> 长蒴黄麻(Corchorus olitorius)
<220>
<223> 长蒴黄麻(Corchorus olitorius)O-4栽培种重叠群22559,全基因组鸟枪序列,AWUE01022526.1
<400> 449
gcaataactc cgcctgtggc tgcactaaat acctacctct gcaaccacag ccggtcccaa 60
gcccggaaaa aggaggaggg ttgc 84
<210> 450
<211> 92
<212> DNA
<213> 陆地棉(Gossypium hirsutum)
<220>
<223> 陆地棉(Gossypium hirsutum)TM-1栽培种染色体15,全基因组鸟枪序列,CM003264.1
<400> 450
atgataactc cgcctgtgcc atattgaaac ctgagagtat atatcctttt cggcactgcc 60
ggtcccaagc ccggataaag gaggagggtc at 92
<210> 451
<211> 74
<212> DNA
<213> 墨西哥丽脂鲤(Astyanax mexicanus)
<220>
<223> 墨西哥丽脂鲤(Astyanax mexicanus)染色体6,全基因组鸟枪序列,CM008305.1
<400> 451
ttagtaactc tgccaaagtg tctcttttaa ggtcactttg ccggtcccaa gcccggataa 60
aagaggaggg ttaa 74
<210> 452
<211> 81
<212> DNA
<213> 土瓶草(Cephalotus follicularis)
<220>
<223> 土瓶草(Cephalotus follicularis)DNA,支架:scaffold3557,分离株:St1,BDDD01003557.1
<400> 452
gtcataactc cgcctgtgta gcaatatgta taaccatgtg tacacagccg gtcccaagcc 60
cggatgaagg aggagggtga c 81
<210> 453
<211> 80
<212> DNA
<213> 博落回(Macleaya cordata)
<220>
<223> 博落回(Macleaya cordata)BLH2017分离株scaffold525,全基因组鸟枪序列,MVGT01000217.1
<400> 453
tttttaactc cgccaatgca aatgttatgc cataacattt gcattgccgg tcccaagccc 60
gggtaaagga ggagggggaa 80
<210> 454
<211> 63
<212> DNA
<213> 博落回(Macleaya cordata)
<220>
<223> 博落回(Macleaya cordata)BLH2017分离株scaffold7799,全基因组鸟枪序列,MVGT01000535.1
<400> 454
tttttaactc cgccaatgca tatgcattgc cggtctcaag cccgggtaaa ggaggaggga 60
gaa 63
<210> 455
<211> 57
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D6C49D_12908
<400> 455
gcacuaaugu agcucagacc ugugacaagc caaggcuaga aaaauacaga gucgugc 57
<210> 456
<211> 56
<212> RNA
<213> 未知
<220>
<223> 未分类的序列P1型扭转核酶,URS0000D669BF_12908
<400> 456
ggccuaaugc agcauagucc ugucacaagc caggcugaaa aaugcagagu gaggca 56
<210> 457
<211> 85
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:In-R_005008,BABG01005008.1
<400> 457
gaaacccgct aggccgacag cctcaccgct gccgctggtg caagcccagc cgccccagac 60
cggggcgggc gctcatgggt aacag 85
<210> 458
<211> 82
<212> DNA
<213> 阿德利企鹅(Pygoscelis adeliae)
<220>
<223> 阿德利企鹅(Pygoscelis adeliae)重叠群107431,全基因组鸟枪序列,JMFP01107431.1
<400> 458
ttaggccgtt acctacagct gatgagctcc aagaagagcg aaacctttta agataggtcc 60
tgtagtattg gcctaacaat ct 82
<210> 459
<211> 77
<212> DNA
<213> 刺鹩(Acanthisitta chloris)
<220>
<223> 刺鹩(Acanthisitta chloris)重叠群104940,全基因组鸟枪序列,JJRS01104940.1
<400> 459
attggctgtt agctgctgct cttgagctcc agaaagagca acactgctta ggtcctgcag 60
tactggccta caggtgt 77
<210> 460
<211> 109
<212> DNA
<213> 海龟(Chelonia mydas)
<220>
<223> 海龟(Chelonia mydas)重叠群57739,全基因组鸟枪序列,AJIM01057739.1
<400> 460
ttaaccagtt acctacagct gatgagctcc aggaagagcg aaaccagttc cgccctgttt 60
cagtagttat gaaaagttcg gactggtcct gtagtactgt cctgcagca 109
<210> 461
<211> 82
<212> DNA
<213> 未知
<220>
<223> 非洲鸵鸟南非亚种(Struthio camelus australis)重叠群33602,全基因组鸟枪序列,JJRT01033602.1
<400> 461
ttaggctgtt acctatagct gatgagcttc aaaatgaatg aaaccactta aaataggtcc 60
tgtagaacta tccttagggc ca 82
<210> 462
<211> 77
<212> DNA
<213> 金领娇鹟(Manacus vitellinus)
<220>
<223> 金领娇鹟(Manacus vitellinus)重叠群47454,全基因组鸟枪序列,JMFM02047454.1
<400> 462
tcaggccatt gcctataggt gatgagctcc atgaagagtg aaaccagtta ggtcctgtat 60
tgctagccta atgagca 77
<210> 463
<211> 83
<212> DNA
<213> 海龟(Chelonia mydas)
<220>
<223> 海龟(Chelonia mydas)重叠群198956,全基因组鸟枪序列,AJIM01198956.1
<400> 463
ttgggctata gcctacagct aatgagcttc aaaaaggagc aaaagcattt aaaataggcc 60
ctgtagtatt agcctaatct aat 83
<210> 464
<211> 78
<212> DNA
<213> 海龟(Chelonia mydas)
<220>
<223> 海龟(Chelonia mydas)重叠群141094,全基因组鸟枪序列,AJIM01141094.1
<400> 464
ttaagacatt gcctacagct gacaagctcc acaaagagca aaaccagtga ggatcctgta 60
acactgtcct acagagct 78
<210> 465
<211> 86
<212> DNA
<213> 矛尾鱼(Latimeria chalumnae)
<220>
<223> 矛尾鱼(Latimeria chalumnae)重叠群061484,全基因组鸟枪序列,AFYH01061484.1
<400> 465
acgttccagt tatctacagc tgatgagctc aaaggagagc gaaaccggac atcctgtccg 60
gtcttgtagt actggcttag ttgtct 86
<210> 466
<211> 77
<212> DNA
<213> 绒啄木鸟(Picoides pubescens)
<220>
<223> 绒啄木鸟(Picoides pubescens)重叠群42547,全基因组鸟枪序列,JJRU01042547.1
<400> 466
ctgcaccgtt acctgcagcc gatgagctcc aaaaagagca aaaccagcca ggtcctgcag 60
tactggctgc agccttc 77
<210> 467
<211> 77
<212> DNA
<213> 绿头鸭(Anas platyrhynchos)
<220>
<223> 绿头鸭(Anas platyrhynchos)北京鸭品种重叠群108924,全基因组鸟枪序列,ADON01108924.1
<400> 467
aatgtctgtt acttgaagct gatgagctcc aaatagagca aaaccattta ggtcctatag 60
tactggcctg taagctt 77
<210> 468
<211> 111
<212> DNA
<213> 斑尾非洲咬鹃(Apaloderma vittatum)
<220>
<223> 斑尾非洲咬鹃(Apaloderma vittatum)重叠群91687,全基因组鸟枪序列,JMFV01091687.1
<400> 468
ttaaaccagt tacctacagc tgatgagctc cggaaagagc aaaaccagtt ctgttctatt 60
tcagcagtta tgaatgctaa gaactggtcc tgtagtaatg ttgaacatcg a 111
<210> 469
<211> 77
<212> DNA
<213> 黄喉沙鸡(Pterocles gutturalis)
<220>
<223> 黄喉沙鸡(Pterocles gutturalis)重叠群86319,全基因组鸟枪序列,JMFR01086319.1
<400> 469
ttaggccatt atctgcagct gatgagctcc aagaagagca aaatccgtta ggtcctacaa 60
tgctggccta atacaca 77
<210> 470
<211> 77
<212> DNA
<213> 原鸡(Gallus gallus)
<220>
<223> 原鸡(Gallus gallus)分离株RJF #256红丛林鸡品种,自交系UCD001染色体10,全基因组鸟枪序列,CM000102.4
<400> 470
cttggccatt acctgcagct ggtgagctcc aaaaagagcg gtgccattta ggtcatgtca 60
ttctggccta tatgttt 77
<210> 471
<211> 77
<212> DNA
<213> 白领姬鹟(Ficedula albicollis)
<220>
<223> 白领姬鹟(Ficedula albicollis)OC2分离株染色体10,全基因组鸟枪序列,CM001999.1
<400> 471
attgaatgtt acttgcagct gatgggctcc aaaaagagag aagcccctta ggtcctgtag 60
tactggactt gaaacat 77
<210> 472
<211> 77
<212> DNA
<213> 斑鼠鸟(Colius striatus)
<220>
<223> 斑鼠鸟(Colius striatus)重叠群35117,全基因组鸟枪序列,JJRP01035117.1
<400> 472
attggctgtt acatgcagct agtgagctcc aaaaagagtg aaaccactta gctcctgtaa 60
ttctggctta taagtgt 77
<210> 473
<211> 77
<212> DNA
<213> 朱红蜂鸟(Calypte anna)
<220>
<223> 朱红蜂鸟(Calypte anna)重叠群32988,全基因组鸟枪序列,JJRV01032988.1
<400> 473
attggccatt atctgcagct gatgagctcc aaaaagagca ggaccacttg gatcctttag 60
tactgcccta taagtgt 77
<210> 474
<211> 85
<212> DNA
<213> 矛尾鱼(Latimeria chalumnae)
<220>
<223> 矛尾鱼(Latimeria chalumnae)重叠群209269,全基因组鸟枪序列,AFYH01209269.1
<400> 474
aatttcagtt atctgcagct gatgagctta aataaaagca aaactggaat taatttccag 60
tcctgcagta ctggttaata tgcct 85
<210> 475
<211> 78
<212> DNA
<213> 洋红蜂虎(Merops nubicus)
<220>
<223> 洋红蜂虎(Merops nubicus)重叠群71858,全基因组鸟枪序列,JJRJ01071858.1
<400> 475
attgtccact acctgcagct gatgaacctc aaaaaagagc aaaactccct aggtcctgta 60
gtagtggcca gtaagtgt 78
<210> 476
<211> 80
<212> DNA
<213> 矛尾鱼(Latimeria chalumnae)
<220>
<223> 矛尾鱼(Latimeria chalumnae)重叠群106573,全基因组鸟枪序列,AFYH01106573.1
<400> 476
caatccagtt atctacagct gacgagctct aatgagagcg aaactgggga accggtcctg 60
tggtactggc atgaaagaaa 80
<210> 477
<211> 77
<212> DNA
<213> 白鹭(Egretta garzetta)
<220>
<223> 白鹭(Egretta garzetta)重叠群72922,全基因组鸟枪序列,JJRC01072922.1
<400> 477
attggccact acccgcagcc ggtgagctct aaaaagagtg aaaccacttg ggtcttgtgg 60
tattggccga taagcgt 77
<210> 478
<211> 83
<212> DNA
<213> 美国短吻鳄(Alligator mississippiensis)
<220>
<223> 美国短吻鳄(Alligator mississippiensis)ScZkoYb_152,全基因组鸟枪序列,AKHW03006215.1
<400> 478
gcaggccatt acttgcagct aatgagttcc acagagaatg aaaccatttg aaattggtcc 60
ctgaagtact ggcctagaaa act 83
<210> 479
<211> 77
<212> DNA
<213> 小马岛猬(Echinops telfairi)
<220>
<223> 小马岛猬(Echinops telfairi)cont1.498693,全基因组鸟枪序列,AAIY01498693.1
<400> 479
ccgagccgtt gcctgcagct gatgagctcc aacaagagcg aaaccgaaca ggtcctgcag 60
tacgggtggg gtcagca 77
<210> 480
<211> 52
<212> DNA
<213> 菊苣黄斑驳(Chicory yellow mottle)病毒
<220>
<223> 用于假定蛋白的菊苣黄斑驳病毒卫星RNA基因,D00721.1
<400> 480
caacagcgaa gcgcgccagg gaaacacacc atgtgtggta tattatctgg ca 52
<210> 481
<211> 52
<212> DNA
<213> 南芥菜花叶(Arabis mosaic)病毒
<220>
<223> 南芥菜花叶(Arabis mosaic)病毒小卫星RNA,完整基因组,M21212.1
<400> 481
caacagcgaa gcggaacggc gaaacacacc ttgtgtggta tattacccgt tg 52
<210> 482
<211> 50
<212> DNA
<213> 烟草环斑(Tobacco ringspot)病毒
<220>
<223> 烟草环斑(Tobacco ringspot)病毒卫星RNA,M14879.1
<400> 482
aaacagagaa gtcaaccaga gaaacacacg ttgtggtata ttacctggta 50
<210> 483
<211> 70
<212> DNA
<213> costatus驼切叶蚁(Cyphomyrmex costatus)
<220>
<223> costatus驼切叶蚁(Cyphomyrmex costatus)重叠群21873,全基因组鸟枪序列,LKEX01021873.1
<400> 483
gattctcaac aatcgtctac ctccccgtgg tgagaatcgg gaaacatttc aaataatggc 60
taaagacgat 70
<210> 484
<211> 73
<212> DNA
<213> 长牡蛎(Crassostrea gigas)
<220>
<223> 长牡蛎(Crassostrea gigas)株系05x7-T-G4-1.051#20 contig28208,全基因组鸟枪序列,AFTI01028208.1
<400> 484
cctgctcaaa atcctacttc cacctccccg cggcgagcag ggggcaacgg acatttgtcc 60
ggcgaacgga aga 73
<210> 485
<211> 74
<212> DNA
<213> 解糖梭菌(Clostridium saccharolyticum)
<220>
<223> 解糖梭菌(Clostridium saccharolyticum)样K10基因组草图,FP929037.1
<400> 485
gctgctcgaa actttgcaca cctcttcgtg gtgagcagca ggcaacgatc ttatggtcgg 60
ctaagaatgc agag 74
<210> 486
<211> 75
<212> DNA
<213> 不规则丛枝菌根真菌(Rhizophagus irregularis)
<220>
<223> 不规则丛枝菌根真菌(Rhizophagus irregularis)DAOM 197198wjcf7180003189428,全基因组鸟枪序列,JEMT01023831.1
<400> 486
cctgaacgaa gcttgccacc tctacgtggt gttcaggaga aacagttgta agttaataac 60
tggccaagag caagc 75
<210> 487
<211> 74
<212> DNA
<213> 佛罗里达弓背蚁(Camponotus floridanus)
<220>
<223> 佛罗里达弓背蚁(Camponotus floridanus)CamFlo_1.0_4.contig2489,全基因组鸟枪序列,AEAB01026452.1
<400> 487
gattttccat tatatgttta cctccacgcg gtgaaaatcg ggcaacgtca aataaattgg 60
cggcaaaaga acgt 74
<210> 488
<211> 72
<212> DNA
<213> 美孢胶膜菌(Tulasnella calospora)
<220>
<223> 美孢胶膜菌(Tulasnella calospora)MUT 4182未放置的基因组支架scaffold_124,全基因组鸟枪序列,KN823065.1
<400> 488
ggggctcgat gatgcgcaca cctccccgtg gtgagccctg tcaacgtcgg caaggacggc 60
caagatgcgc at 72
<210> 489
<211> 72
<212> DNA
<213> 麻蝇金小蜂(Trichomalopsis sarcophagae)
<220>
<223> 麻蝇金小蜂(Trichomalopsis sarcophagae)Alberta株系scaffold26742,全基因组鸟枪序列,NNAY01026514.1
<400> 489
gatgttttga ctcattcacc tccacgcggt aagtatcggg atacgttgta catcaacggc 60
taagaaatga ga 72
<210> 490
<211> 69
<212> DNA
<213> 未知
<220>
<223> 普氏粪杆菌(Faecalibacterium cf. prausnitzii)KLE1255 F_prausnitziiKLE1255.K95-1.0_Cont34.1,全基因组鸟枪序列,AECU01000025.1
<400> 490
gctgtccgaa aatgctgcct ctacgtggcg gacggcaggc aacggagcgt gtctccggct 60
aaagcatga 69
<210> 491
<211> 73
<212> DNA
<213> 短膜壳绦虫(Hymenolepis nana)
<220>
<223> 短膜壳绦虫(Hymenolepis nana)基因组组装,支架:HNAJ_contig0000132,LM398097.1
<400> 491
gggcaacgta tactcataca cctccacgtg gtgcaccctg ggcaacgtat attcatatgg 60
caaaaatgtc tat 73
<210> 492
<211> 75
<212> DNA
<213> 梭菌目(Clostridiales)细菌
<220>
<223> 梭菌目(Clostridiales)细菌41_21_two_genomes Ley3_66761_scaffold_672,全基因组鸟枪序列,MNRE01000164.1
<400> 492
gctgtttgga taatcacaca ccgatgcgag gttagcagca ggcaacacag cggaagctat 60
ggcgaagatg caatg 75
<210> 493
<211> 75
<212> DNA
<213> 美孢胶膜菌(Tulasnella calospora)
<220>
<223> 美孢胶膜菌(Tulasnella calospora)MUT 4182未放置的基因组支架scaffold_99,全基因组鸟枪序列,KN823040.1
<400> 493
ggggttcgag ctgtacgcgt acctcctcgt ggtgaaccct gggcaacgct ctgacggagc 60
ggctgaatcg cgtac 75
<210> 494
<211> 68
<212> DNA
<213> 毕氏粗角猛蚁(Cerapachys biroi)
<220>
<223> 毕氏粗角猛蚁(Cerapachys biroi)未放置的基因组支架scaffold278,全基因组鸟枪序列,KK107279.1
<400> 494
aactctaaaa cgtccacctc cacgtggtta gagttgggca acgttaaaca ttaacggcta 60
acggacga 68
<210> 495
<211> 69
<212> DNA
<213> 梭状梭菌(Clostridium clostridioforme)
<220>
<223> 梭状梭菌(Clostridium clostridioforme)CAG:132基因组支架,scf345,FR886101.1
<400> 495
gccgcccata ggtgctgcct ctgcgtggcg ggtggcaggc aacggaggag ttctccggct 60
aaagcactg 69
<210> 496
<211> 78
<212> DNA
<213> 肠道寄生线虫(Heligmosomoides polygyrus)
<220>
<223> 肠道寄生线虫(Heligmosomoides polygyrus)基因组组装,支架:HPBE_contig0009563,LL216641.1
<400> 496
gcttcccgat gacggtgcca cctccacgtg gtgggaagcg ggcaacgggt ttggattggc 60
gcccggctaa gagcaccg 78
<210> 497
<211> 77
<212> DNA
<213> 丽蝇蛹集金小蜂(Nasonia vitripennis)
<220>
<223> 丽蝇蛹集金小蜂(Nasonia vitripennis)未放置的基因组支架ChrUn_0243,全基因组鸟枪序列,GL341474.1
<400> 497
gggttttcaa tgaacgttca ccttcacgtg gtgaaacccg ggcaacgtta cattcagcag 60
cggctaagaa cgttcac 77
<210> 498
<211> 70
<212> DNA
<213> 未知
<220>
<223> 瘤胃球菌属物种(Ruminococcus sp.)CAG:724基因组支架,scf297,HF994873.1
<400> 498
gttacgcaag atcaaagcct cctcgcggcg cgtagcgggc aacgaatttt cattcggctg 60
atttgatcga 70
<210> 499
<211> 79
<212> DNA
<213> costatus驼切叶蚁
<220>
<223> costatus驼切叶蚁(Cyphomyrmex costatus)重叠群15289,全基因组鸟枪序列,LKEX01015289.1
<400> 499
agttttcgaa agtcgttcac ctcctcgtgg tgaaaactgg ataacgttta aataactgat 60
aaacggcaaa gaaacgaca 79
<210> 500
<211> 72
<212> DNA
<213> 未知
<220>
<223> 瘤胃球菌属物种(Ruminococcus sp.)18P13基因组草图,FP929052.1
<400> 500
gccgcacaaa atcaaagcct ccacgtggcg tgcggcggac aacggatgat tgatccggct 60
aagattgatt ga 72
<210> 501
<211> 77
<212> DNA
<213> 热带秀丽隐杆线虫(Caenorhabditis tropicalis)
<220>
<223> 热带秀丽隐杆线虫(Caenorhabditis tropicalis)JU1373株系未放置的基因组支架Scaffold629,全基因组鸟枪序列,GL637601.1
<400> 501
cttctacacg tacttcgcct ctccgtggcg tagaagaggc aacactcctg ggcaaccaga 60
gtggctaaga agtacac 77
<210> 502
<211> 75
<212> DNA
<213> 短膜壳绦虫(Hymenolepis nana)
<220>
<223> 短膜壳绦虫(Hymenolepis nana)基因组组装,支架:HNAJ_contig0006064,LM407409.1
<400> 502
ggggtgctag atagacttac ctccacgcgg tgtaccctgg gcaacgtata ctcatcatac 60
ggcaaataag tcaat 75
<210> 503
<211> 75
<212> DNA
<213> 未知
<220>
<223> 厌氧棍状菌属物种(Anaerotruncus sp.)CAG:390基因组支架,scf127,FR897605.1
<400> 503
accgcacagg gtcaaagcct ccacgtggcg tgcggtgggc aacggacaac tcgctcgtcc 60
ggctgatttg accat 75
<210> 504
<211> 70
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<220>
<223> 普拉梭菌(Faecalibacterium prausnitzii)L2 6基因组草图,FP929045.1
<400> 504
gccgctcaga tatgctacct ctccgtggtg agcagcaggc aacgagagtt ttctctcggc 60
taaagcatat 70
<210> 505
<211> 75
<212> DNA
<213> 麻蝇金小蜂(Trichomalopsis sarcophagae)
<220>
<223> 麻蝇金小蜂(Trichomalopsis sarcophagae)Alberta株系scaffold35,全基因组鸟枪序列,NNAY01000035.1
<400> 505
ggttctcttt catcgttcac ctccccgtgg tgagaaccgg gcaacacaac atttcagagt 60
ggcaaagaaa cgatt 75
<210> 506
<211> 84
<212> DNA
<213> 麻蝇金小蜂(Trichomalopsis sarcophagae)
<220>
<223> 麻蝇金小蜂(Trichomalopsis sarcophagae)Alberta株系scaffold18563,全基因组鸟枪序列,NNAY01018372.1
<400> 506
gattctcaaa agcgttcacc tcctcgtggt gagaatcggg caactctgat gtttacgaat 60
aaatcagagg caaagaacgc gtga 84
<210> 507
<211> 82
<212> DNA
<213> 格氏斯坦线虫(Steinernema glaseri)
<220>
<223> 格氏斯坦线虫(Steinernema glaseri)NC株系未放置的基因组支架GLAS_3282,全基因组鸟枪序列,KN169778.1
<400> 507
ggaagacgac gagctacacc tccacgtggt gtcttccggg caacgttagg gcttctgggt 60
cctaacggca aagacagctc ta 82
<210> 508
<211> 83
<212> DNA
<213> 有齿食道口线虫(Oesophagostomum dentatum)
<220>
<223> 有齿食道口线虫(Oesophagostomum dentatum)株系OD-Hann O_dentatum-1.0_Cont728411.1,全基因组鸟枪序列,JOOK01112482.1
<400> 508
ggtcctcata gctgccacct ccacgtggtg aggaccgggc aacgttggtg cttctggagc 60
caccaacggc taaggcagcg tgg 83
<210> 509
<211> 71
<212> DNA
<213> 层出节水霉(Gonapodya prolifera)
<220>
<223> 层出节水霉(Gonapodya prolifera)JEL478未放置的基因组支架M427scaffold_56,全基因组鸟枪序列,KQ965786.1
<400> 509
ggagcgcgat ggcccgccca cctctacgtg gtgcgctcta gaaacaccag tttggtggct 60
gagaggcggg c 71
<210> 510
<211> 71
<212> DNA
<213> 层出节水霉(Gonapodya prolifera)
<220>
<223> 层出节水霉(Gonapodya prolifera)JEL478未放置的基因组支架M427scaffold_140,全基因组鸟枪序列,KQ965870.1
<400> 510
ggggtacacg gtgactgcct cctcgtggcg taccccgggc aacgttcgat tttcgaacgg 60
ctgaagtcac c 71
<210> 511
<211> 74
<212> DNA
<213> 麻蝇金小蜂(Trichomalopsis sarcophagae)
<220>
<223> 麻蝇金小蜂(Trichomalopsis sarcophagae)Alberta株系scaffold15944,全基因组鸟枪序列,NNAY01015791.1
<400> 511
gattctcaat gtttgctaac ctccacgtgg tgagaatcgg gcaacgttta tttataaacg 60
gcaaagaggc aata 74
<210> 512
<211> 82
<212> DNA
<213> 未知
<220>
<223> 梭菌属物种(Clostridium sp.)C105KSO13 分离株 C105KSO131基因组组装,FBWL01000170.1
<400> 512
gctactcgga caaatcaaaa aattacacac ctcttcgtgg taagcagcag acaacgattt 60
tatgatcggc gaagatgtga ga 82
<210> 513
<211> 77
<212> DNA
<213> 梭菌目(Clostridiales)细菌
<220>
<223> 梭菌目(Clostridiales)细菌41_21_two_genomes Ley3_66761_scaffold_1913,全基因组鸟枪序列,MNRE01000064.1
<400> 513
gttgctcgaa tgcgaatgaa tcacacacct ctccgtggtg agcagcaggc aatgaagtta 60
tatcataaaa tttttaa 77
<210> 514
<211> 76
<212> DNA
<213> costatus驼切叶蚁(Cyphomyrmex costatus)
<220>
<223> costatus驼切叶蚁(Cyphomyrmex costatus)重叠群10795,全基因组鸟枪序列,LKEX01010795.1
<400> 514
ggttatcgat aagcgtccac ctcctcgcgg tgataaccgg gcaacgttga attcatcagc 60
ggcaaaggac gtctaa 76
<210> 515
<211> 74
<212> DNA
<213> 未知
<220>
<223> 瘤胃球菌属物种(Ruminococcus sp.)CAG:353基因组支架,scf176,FR901357.1
<400> 515
gctgctcgaa aaatgcacac cgctacgagg tgagcagcag acaacacagc agagactgtg 60
gctaagaggc aaga 74
<210> 516
<211> 72
<212> DNA
<213> 短膜壳绦虫(Hymenolepis nana)
<220>
<223> 短膜壳绦虫(Hymenolepis nana)基因组组装,支架:HNAJ_scaffold0000733,LM398231.1
<400> 516
ggggtgtgag acagacttac ctcaacgtgg tacaccccag gcaacgtata tttatgcggc 60
aaaaaagttt at 72
<210> 517
<211> 75
<212> DNA
<213> 布氏秀丽隐杆线虫(Caenorhabditis brenneri)
<220>
<223> 布氏秀丽隐杆线虫(Caenorhabditis brenneri)株系PB2801 C_brenneri-6.0.1_Cont82.14,全基因组鸟枪序列,ABEG02002846.1
<400> 517
cttcttcgac ggtactaacc tctacgcggt gaagaagaga caacagtttc tgatgaaact 60
ggctaataag tacca 75
<210> 518
<211> 71
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F2-X_007529,BAAZ01007529.1
<400> 518
gctactcaaa aaaagacagc ctccacgcgg cgagcagcgg gcaacgggaa agacccggca 60
gatagtcttt a 71
<210> 519
<211> 80
<212> DNA
<213> 未知
<220>
<223> 未培养的粪杆菌属物种(Faecalibacterium sp.)TS29_contig04278,全基因组鸟枪序列,ADJT01005907.1
<400> 519
tccgctcgaa actttgcaca cctctacgcg gtgggcggca ggcaacacag tgtgtagatg 60
ctgtggcaaa gaatgcaaga 80
<210> 520
<211> 76
<212> DNA
<213> 未知
<220>
<223> 瘤胃球菌属物种(Ruminococcus sp.)5_1_39B_FAA cont1.60,全基因组鸟枪序列,ACII01000060.1
<400> 520
gctgctcaga aatgcacact gcgactggtg agcagtaggt gatgtttatc aaaggataag 60
cggctaagat gtagaa 76
<210> 521
<211> 75
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组1577600,全基因组鸟枪序列,AACY021109846.1
<400> 521
gggggacgaa gtcgaactga acacctccat cgtggtgtcc cccgggcaac gcttgcaaaa 60
gcggctaacg ttcag 75
<210> 522
<211> 89
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F2-V_032439,BAAX01032439.1
<400> 522
gctgctcgta ataatcacac acctctccgt ggtgagcagc aggcaacgat ttaagaatgt 60
atggttcgat gatcggcgaa gatgtgcga 89
<210> 523
<211> 71
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F2-X_004974,BAAZ01004974.1
<400> 523
actgcacaaa accaacagcc ttcacgcggc gtgcagtgag caacgtatag ttttatacgg 60
ccaatgttga a 71
<210> 524
<211> 76
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F2-W_003903,BAAY01003903.1
<400> 524
gccgctttat attttgtaca cctctacgtg gtaagcggca ggcaacgttt attttataga 60
cggctaagat gcaaaa 76
<210> 525
<211> 89
<212> DNA
<213> 陪伴粪球菌(Coprococcus comes)
<220>
<223> 陪伴粪球菌(Coprococcus comes)ATCC 27758 C_comes-1.0.1_Cont1600,全基因组鸟枪序列,ABVR01000037.1
<400> 525
gctgctcgaa tgaatcacac acctctttgt ggtgagtagc aggcaacgat ctaagaatca 60
gggatccggt gatcggctga gatgtgaag 89
<210> 526
<211> 78
<212> DNA
<213> 未知
<220>
<223> 海洋宏基因组1095527145240,全基因组鸟枪序列,AACY021449234.1
<400> 526
atctcacaac gttaatcgcc tcctcgtggc gtgagatgga aacagcatat ttgcaaatat 60
gttggctaag attaacag 78
<210> 527
<211> 45
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold1749_15,全基因组鸟枪序列,AMPZ01025371.1
<400> 527
tcccggctga cgagtctcaa acagaacgta atgcgcgtcc tggat 45
<210> 528
<211> 49
<212> DNA
<213> 羊裂体吸虫(Schistosoma mattheei)
<220>
<223> 羊裂体吸虫(Schistosoma mattheei)赞比亚Denwood株系基因组组装,支架:SMTD_contig0008514,LM184686.1
<400> 528
atccatctga tgaatcctaa aataggacga aacatgcgtc aaactggat 49
<210> 529
<211> 45
<212> DNA
<213> 马格里包氏裂体吸虫(Schistosoma margrebowiei)
<220>
<223> 马格里包氏裂体吸虫(Schistosoma margrebowiei)赞比亚株系基因组组装,支架:SMRZ_scaffold0000569,LL877594.1
<400> 529
atccaactga tgtgtcttag gtaaaacgaa acacgcgtcc tggat 45
<210> 530
<211> 45
<212> DNA
<213> 柯拉松血吸虫(Schistosoma curassoni)
<220>
<223> 柯拉松血吸虫(Schistosoma curassoni)塞内加尔达喀尔株系基因组组装,支架:SCUD_scaffold0001340,LM066427.1
<400> 530
accctaatga aaagtgccaa atagtacgaa acttaagtct agggt 45
<210> 531
<211> 216
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold839_8,全基因组鸟枪序列,AMPZ01016641.1
<400> 531
attcagctga cgagtcccaa tgtcgtgttt gaatgaacaa atgattcctt tgtacttgtt 60
gaatgcttga tttcgaattc taaatacagt acattcgctt gtgcttatct actacttctt 120
gatccaatta cgttatttct ggaattctta gttcatacta taactcaaag actcctaatt 180
atcacacccg agtaggatga aacgcgcgtc ctgaat 216
<210> 532
<211> 68
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0004017,LL960995.1
<220>
<221> 尚未归类的特征
<222> (33)..(55)
<223> n是a、c、g、或t
<400> 532
atccagctga cgagtcccga ataggacaaa acnnnnnnnn nnnnnnnnnn nnnnngagcg 60
ttctggat 68
<210> 533
<211> 45
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0005707,LL962685.1
<400> 533
atccagacga cgagtccaag acaggaccaa acgcgctttt tgtat 45
<210> 534
<211> 45
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0002741,LL959719.1
<400> 534
acccagatga tgagtctcac ataaaacgaa acgtacgtct tagat 45
<210> 535
<211> 49
<212> DNA
<213> 毛毕属血吸虫(Trichobilharzia regenti)
<220>
<223> 毛毕属血吸虫(Trichobilharzia regenti)基因组组装,支架:TRE_scaffold0001662,LL001662.1
<400> 535
atccagatga cgagtcccag gtcgaacgaa atgcgcatcc tggctggat 49
<210> 536
<211> 46
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold572_14,全基因组鸟枪序列,AMPZ01012007.1
<400> 536
attctactga cgagtcccaa acaggacgag atggatttta tagaat 46
<210> 537
<211> 48
<212> DNA
<213> 毛毕属血吸虫(Trichobilharzia regenti)
<220>
<223> 毛毕属血吸虫(Trichobilharzia regenti)基因组组装,支架:TRE_scaffold0038465,LL038740.1
<400> 537
atccggatga cgagtccaaa atagggtgaa atacgcgtaa tcctggat 48
<210> 538
<211> 45
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold265_6,全基因组鸟枪序列,AMPZ01005699.1
<400> 538
accttgcgga cgagtaccaa atagcacgaa acccgggtcc agggt 45
<210> 539
<211> 45
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0003196,LL960174.1
<400> 539
atccatctga cgagccctaa atggggcgaa atgcacatcc tgcac 45
<210> 540
<211> 46
<212> DNA
<213> 曼氏血吸虫(Schistosoma mansoni)
<220>
<223> 曼氏血吸虫(Schistosoma mansoni)波多黎各株系染色体1,完整基因组,HE601624.1
<400> 540
atccagccga agagttcaaa atttagacga aatgtgcgtc caggat 46
<210> 541
<211> 45
<212> DNA
<213> 曼氏血吸虫(Schistosoma mansoni)
<220>
<223> 曼氏血吸虫(Schistosoma mansoni)波多黎各株系染色体4,完整基因组,HE601627.1
<400> 541
gtccagccga tgagttcgaa ataggatgaa acgcacgtcc tgaat 45
<210> 542
<211> 45
<212> DNA
<213> 马格里包氏裂体吸虫(Schistosoma margrebowiei)
<220>
<223> 马格里包氏裂体吸虫(Schistosoma margrebowiei)赞比亚株系基因组组装,支架:SMRZ_scaffold0001143,LL878569.1
<400> 542
attcaactga tgggttcaaa ataggacgga gctcgcgtcc tgaat 45
<210> 543
<211> 48
<212> DNA
<213> 马格里包氏裂体吸虫(Schistosoma margrebowiei)
<220>
<223> 马格里包氏裂体吸虫(Schistosoma margrebowiei)赞比亚株系基因组组装,支架:SMRZ_contig0000066,LL877199.1
<400> 543
atctagctga cgtgtctcaa atagggtgaa acgcgcatca aactggat 48
<210> 544
<211> 46
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0007499,LL964478.1
<400> 544
gtcttgctga ggagtcccac aattggacaa aacgatcgtc cagtac 46
<210> 545
<211> 45
<212> DNA
<213> 羊裂体吸虫(Schistosoma mattheei)
<220>
<223> 羊裂体吸虫(Schistosoma mattheei)赞比亚Denwood株系基因组组装,支架:SMTD_scaffold0000113,LM149431.1
<400> 545
atccagacga tgagtcgcaa tcaggacaaa acgcgtgtcc tgcat 45
<210> 546
<211> 314
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0002417,LL959395.1
<400> 546
tcactgctga ggagtcccac aacagggtga aacgaccatc cagtgctttc aggttctcca 60
tagtggtcca gcttcaatcg actcatgatt tcaactgtta aaatactaaa tctccacaaa 120
aacccttctg ataattcata atagatcaga ggggggtttg tggagaattt agtattttaa 180
cagttgaaat catgagtcga ttgaagctag accatcattg aaaacctgaa agcactggac 240
ggccatttcg ttctattatg ggaatcctca gcagtgcgca tccataataa taggacgaaa 300
cggccgtcca gtgc 314
<210> 547
<211> 45
<212> DNA
<213> 马格里包氏裂体吸虫(Schistosoma margrebowiei)
<220>
<223> 马格里包氏裂体吸虫(Schistosoma margrebowiei)赞比亚株系基因组组装,支架:SMRZ_scaffold0000011,LL876856.1
<400> 547
attcagctga cgagtgttga ataagacgga acgtgcatcc tgaat 45
<210> 548
<211> 51
<212> DNA
<213> 卡氏棘口吸虫(Echinostoma caproni)
<220>
<223> 卡氏棘口吸虫(Echinostoma caproni)埃及株系基因组组装,支架:ECPE_scaffold0005374,LL238470.1
<400> 548
gcactgctga cgagtcccag acaggacgaa acaacaacaa ctgtccagtg c 51
<210> 549
<211> 45
<212> DNA
<213> 柯拉松血吸虫(Schistosoma curassoni)
<220>
<223> 柯拉松血吸虫(Schistosoma curassoni)塞内加尔达喀尔株系基因组组装,支架:SCUD_contig0027497,LM120165.1
<400> 549
accttggtga cgagtgtcaa ataggacgaa acttaggtcc atgat 45
<210> 550
<211> 46
<212> DNA
<213> 毛毕属血吸虫(Trichobilharzia regenti)
<220>
<223> 毛毕属血吸虫(Trichobilharzia regenti)基因组组装,支架:TRE_scaffold0038963,LL039251.1
<400> 550
gtatcaccga agagtcccaa actaggacga aacagcagtc taatac 46
<210> 551
<211> 45
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0000311,LL957289.1
<400> 551
attcaactaa tgaatcccaa gtagaacgaa acgtacgtcc tgaat 45
<210> 552
<211> 141
<212> DNA
<213> 羊裂体吸虫(Schistosoma mattheei)
<220>
<223> 羊裂体吸虫(Schistosoma mattheei)赞比亚Denwood株系基因组组装,支架:SMTD_scaffold0017800,LM169888.1
<400> 552
attcagctga cgagtcccac ttagctattg agtcctgata attacttgct tgtgcaattt 60
ctgaagagaa catcaactct gggatgtagg cacatcctgc tgatgggtcg caaataggac 120
gaaacgcgcg tcaaaccgga t 141
<210> 553
<211> 45
<212> DNA
<213> 马格里包氏裂体吸虫(Schistosoma margrebowiei)
<220>
<223> 马格里包氏裂体吸虫(Schistosoma margrebowiei)赞比亚株系基因组组装,支架:SMRZ_contig0000349,LL878022.1
<400> 553
atctatctga caagtcctaa ataggactaa acgtgcgttc tgaat 45
<210> 554
<211> 46
<212> DNA
<213> 毛毕属血吸虫(Trichobilharzia regenti)
<220>
<223> 毛毕属血吸虫(Trichobilharzia regenti)基因组组装,支架:TRE_scaffold0003993,LL003993.1
<400> 554
gcaccgatga agagtcctaa aataggacga aacggctgtc tggcgc 46
<210> 555
<211> 45
<212> DNA
<213> 柯拉松血吸虫(Schistosoma curassoni)
<220>
<223> 柯拉松血吸虫(Schistosoma curassoni)塞内加尔达喀尔株系基因组组装,支架:SCUD_scaffold0002666,LM067904.1
<400> 555
acctagccga cgagtctgaa ataggacaaa acgtgtgtcc ttgat 45
<210> 556
<211> 46
<212> DNA
<213> 双班蛸(Octopus bimaculoides)
<220>
<223> 双班蛸(Octopus bimaculoides)Scaffold16004_contig_23,全基因组鸟枪序列,LGKD01170204.1
<400> 556
ttctggctga cgaaacacaa caggtcgaaa caccggtgtc ccagaa 46
<210> 557
<211> 45
<212> DNA
<213> 曼氏血吸虫(Schistosoma mansoni)
<220>
<223> 曼氏血吸虫(Schistosoma mansoni)波多黎各株系染色体7,完整基因组,HE601630.1
<400> 557
atttagctga tgtatcccaa acaaaacgaa acacacgtca tgaat 45
<210> 558
<211> 45
<212> DNA
<213> 麝猫后睾吸虫(Opisthorchis viverrini)
<220>
<223> 麝猫后睾吸虫(Opisthorchis viverrini)opera_v5_148.27,全基因组鸟枪序列,JACJ01014299.1
<400> 558
gcactgctga tgagctctaa ttagagcgaa actcgagtcc agtgc 45
<210> 559
<211> 45
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold104_9,全基因组鸟枪序列,AMPZ01005908.1
<400> 559
attcaactga taagtcccaa acaggatgaa ataagcatct tgaat 45
<210> 560
<211> 49
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold15_47,全基因组鸟枪序列,AMPZ01001461.1
<400> 560
gcattgctga ggagtcccac aataagacga aacgtccgtc aaacaatac 49
<210> 561
<211> 214
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold555_12,全基因组鸟枪序列,AMPZ01011692.1
<400> 561
attgctgagg agtcccatac tagtatttta gtattttaga ttgaataaaa cttcataaac 60
aaagatggat agtggctagc agtggaatcc aggacacgcg tttcgtccta tttgtgactc 120
gttagctaga tggtcctgca tttcagagtt gatgttcact ctaggactcg aacccagtac 180
cgttcgctac aaggacgaaa cgcgcgtcct gaat 214
<210> 562
<211> 46
<212> DNA
<213> 马格里包氏裂体吸虫(Schistosoma margrebowiei)
<220>
<223> 马格里包氏裂体吸虫(Schistosoma margrebowiei)赞比亚株系基因组组装,支架:SMRZ_scaffold0000277,LL877183.1
<400> 562
gcactactga ggagtcccag aacaaaagga aacggccgtc tagtgt 46
<210> 563
<211> 46
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold631_7,全基因组鸟枪序列,AMPZ01013432.1
<400> 563
acactgctga agagtcctac aatgggacga aacagccgtc tggtat 46
<210> 564
<211> 45
<212> DNA
<213> 埃及血吸虫(Schistosoma haematobium)
<220>
<223> 埃及血吸虫(Schistosoma haematobium)scaffold313_14,全基因组鸟枪序列,AMPZ01007250.1
<400> 564
atccaactga caaatcccaa acaggatgaa acgcacgtcc tctat 45
<210> 565
<211> 45
<212> DNA
<213> 罗氏裂体吸虫(Schistosoma rodhaini)
<220>
<223> 罗氏裂体吸虫(Schistosoma rodhaini)布隆迪株系基因组组装,支架:SROB_scaffold0000033,LL957011.1
<400> 565
atccaactga tgagtgtcaa ataggacaaa actctagttc tgtat 45
<210> 566
<211> 46
<212> DNA
<213> 柯拉松血吸虫(Schistosoma curassoni)
<220>
<223> 柯拉松血吸虫(Schistosoma curassoni)塞内加尔达喀尔株系基因组组装,支架:SCUD_scaffold0004111,LM069637.1
<400> 566
gtattgttga ggagtcgcat accagggcga aacggccgtc caatac 46
<210> 567
<211> 45
<212> DNA
<213> 马格里包氏裂体吸虫(Schistosoma margrebowiei)
<220>
<223> 马格里包氏裂体吸虫(Schistosoma margrebowiei)赞比亚株系基因组组装,支架:SMRZ_contig0000159,LL877504.1
<400> 567
atccgtctga caagtcctag atagaacgag acgcgcgtct tggat 45
<210> 568
<211> 55
<212> DNA
<213> 曼氏血吸虫(Schistosoma mansoni)
<220>
<223> 曼氏血吸虫(Schistosoma mansoni)波多黎各株系染色体W,完整基因组,HE601631.1
<400> 568
atccaactga tgagtcccaa atagaaccaa ataggacgaa atgcatgtcc tggat 55
<210> 569
<211> 108
<212> DNA
<213> 毛毕属血吸虫(Trichobilharzia regenti)
<220>
<223> 毛毕属血吸虫(Trichobilharzia regenti)基因组组装,支架:TRE_scaffold0029912,LL030011.1
<220>
<221> 尚未归类的特征
<222> (21)..(85)
<223> n是a、c、g、或t
<400> 569
atccagctga tgagtcccaa nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnaggac gaaatgtgca tcttggat 108
<210> 570
<211> 46
<212> DNA
<213> 毛毕属血吸虫(Trichobilharzia regenti)
<220>
<223> 毛毕属血吸虫(Trichobilharzia regenti)基因组组装,支架:TRE_scaffold0035981,LL036185.1
<400> 570
atcgaaatga cgagtcccaa atggaacgaa acccgtgtct tttgat 46
<210> 571
<211> 151
<212> DNA
<213> 未知
<220>
<223> 人肠道宏基因组DNA,重叠群序列:F2-X_000382,BAAZ01000382.1
<400> 571
aattcattcg caaagtaatt attctatgaa atgcaaatta tcttcatatg ttgtgaaaca 60
tagcttaacc acgttaaagt ataataatat aagttaggta tgcccttata aagacttagg 120
tagcgctaag gactatatta ttatacttct t 151
<210> 572
<211> 484
<212> PRT
<213> 耐超高温热棒菌(Pyrobaculum aerophilum)
<400> 572
Met Arg Asn Ile Pro Ile Asn Lys Ile Asn Asp Tyr Val Trp Glu Ile
1 5 10 15
Pro Pro Gly Val Lys Pro Cys Gln Lys Val Pro Val Arg Ile Tyr Ala
20 25 30
Asp Ser Val Leu Leu Glu Lys Met Lys Ser Asp Met Thr Leu Glu Gln
35 40 45
Gly Ile Asn Val Gly Cys Leu Pro Gly Ile Tyr Arg Trp Ser Ile Val
50 55 60
Leu Pro Asp Ala His Gln Gly Tyr Gly Phe Pro Ile Gly Gly Val Ala
65 70 75 80
Ala Ile Asp Ala Glu Glu Gly Val Ile Ser Pro Gly Gly Ile Gly Tyr
85 90 95
Asp Ile Asn Cys Gly Val Arg Val Leu Arg Thr Asn Leu Thr Glu Glu
100 105 110
Asp Val Arg Pro Lys Leu Lys Glu Leu Val Asp Thr Ile Phe Arg Leu
115 120 125
Val Pro Pro Gly Val Gly Gly Thr Gly His Leu Arg Leu Ser Pro Ser
130 135 140
Glu Phe Glu Arg Val Leu Ala Glu Gly Val Glu Trp Ala Val Gln Lys
145 150 155 160
Gly Tyr Gly Trp Ala Glu Asp Met Glu Tyr Ile Glu Glu Arg Gly Ser
165 170 175
Trp Lys Leu Ala Asp Pro Ser Lys Val Ser Glu Lys Ala Lys Ala Arg
180 185 190
Gly Arg Asp Gln Leu Gly Thr Leu Gly Ser Gly Asn His Phe Leu Glu
195 200 205
Ile Gln Val Val Asp Lys Ile Tyr Asp Glu Lys Ile Ala Lys Leu Phe
210 215 220
Gly Ile Glu Arg Glu Gly Gln Val Val Val Met Ile His Thr Gly Ser
225 230 235 240
Arg Gly Phe Gly His Gln Val Ala Thr Asp Tyr Leu Leu Ile Met Glu
245 250 255
Arg Lys Met Arg Gln Trp Gly Leu Asn Leu Pro Asp Arg Glu Leu Ala
260 265 270
Ala Ala Pro Leu Lys Asp Lys Val Ala Glu Asp Tyr Ile Lys Ala Met
275 280 285
Ala Ser Ala Ala Asn Phe Ala Trp Thr Asn Arg His Ile Ile Met His
290 295 300
Trp Val Arg Glu Ala Phe Lys Lys Val Phe Gly Ser Ile Glu Lys Val
305 310 315 320
Gly Leu Glu Val Val Tyr Asp Val Ala His Asn Ile Ala Lys Leu Glu
325 330 335
Glu His Val Val Asp Glu Lys Gly Thr Val Arg Lys Val Trp Val His
340 345 350
Arg Lys Gly Ala Thr Arg Ala Phe Pro Pro Gly Arg Ser Glu Ile Pro
355 360 365
Ala Lys Tyr Arg Glu Val Gly Gln Pro Val Leu Ile Pro Gly Ser Met
370 375 380
Gly Thr Ala Ser Trp Ile Leu Val Gly Thr His Asp Ala Met Arg Leu
385 390 395 400
Thr Phe Gly Thr Ala Pro His Gly Ala Gly Arg Val Leu Ser Arg Glu
405 410 415
Ala Ala Ile Arg Met Tyr Pro Pro His Lys Val Gln Glu Glu Met Ala
420 425 430
Lys Arg Gly Ile Ile Val Arg Ser Ala Glu Thr Glu Val Ile Ser Glu
435 440 445
Glu Ala Pro Trp Ala Tyr Lys Asp Val Asp Arg Val Val Glu Ala Ala
450 455 460
His Gln Val Gly Phe Ala Lys Lys Val Val Arg Gln Arg Pro Ile Gly
465 470 475 480
Val Val Lys Gly
<210> 573
<211> 482
<212> PRT
<213> 嗜酸热硫化叶菌(Sulfolobus acidocaldarius)
<400> 573
Met Gln Thr Gln Ile Lys Arg Ile Gly Asn Tyr Glu Trp Arg Ile Glu
1 5 10 15
Lys Gly Ala Gln Glu Cys Met Lys Val Pro Val Thr Val Phe Ala Asp
20 25 30
Asp Val Leu Ile Asp Lys Met Lys Gln Asp Leu Thr Leu Arg Gln Ala
35 40 45
Thr Asn Val Ser Cys Leu Gln Gly Val Gln Glu Ser Val Tyr Val Leu
50 55 60
Pro Asp Gly His Gln Gly Tyr Gly Phe Pro Ile Gly Gly Ile Ala Ala
65 70 75 80
Ser Ala Ile Asp Glu Glu Gly Val Val Ser Pro Gly Gly Ile Gly Tyr
85 90 95
Asp Ile Asn Cys Gly Val Arg Leu Leu Arg Thr Asn Leu Asp Tyr Lys
100 105 110
Asp Val Lys Asp Lys Leu Lys Asp Leu Val Glu Glu Ile Tyr Arg Asn
115 120 125
Val Pro Ser Gly Val Gly Ser Glu Gly Arg Val Lys Leu Ser Tyr Gln
130 135 140
Gln Leu Asp Asn Val Leu Ser Glu Gly Val Lys Trp Ala Val Asp Asn
145 150 155 160
Gly Tyr Gly Trp Asn Arg Asp Met Glu His Ile Glu Gln Ser Gly Ser
165 170 175
Trp Asn Leu Ala Asp Pro Ser Lys Val Ser Pro Ile Ala Lys Gln Arg
180 185 190
Gly His Thr Gln Leu Gly Thr Leu Gly Ala Gly Asn His Phe Leu Glu
195 200 205
Ile Gln Val Val Asp Lys Ile Tyr Asp Glu Lys Val Ala Lys Ala Ile
210 215 220
Gly Ile Thr His Glu Gly Gln Ile Thr Val Met Val His Thr Gly Ser
225 230 235 240
Arg Gly Leu Gly His Gln Val Ala Ser Asp Tyr Leu Gln Val Met Glu
245 250 255
Arg Ala Met Lys Lys Tyr Asn Ile Lys Val Pro Asp Arg Glu Leu Ala
260 265 270
Ala Ile Pro Phe Asn Thr Arg Glu Ala Gln Asp Tyr Ile His Ala Met
275 280 285
Ser Ser Ala Ala Asn Phe Ala Trp Thr Asn Arg Gln Met Ile Thr His
290 295 300
Trp Ala Arg Glu Ser Phe Gly Arg Val Tyr Arg Ile Asp Pro Glu Lys
305 310 315 320
Leu Asp Leu Asn Ile Val Tyr Asp Val Ala His Asn Ile Ala Lys Ile
325 330 335
Glu Glu Tyr Asp Ile Asp Gly Lys Arg Lys Lys Val Leu Val His Arg
340 345 350
Lys Gly Ala Thr Arg Ala Phe Pro Pro Gly Ser Thr Glu Ile Pro Ala
355 360 365
Asp His Arg Asn Val Gly Gln Ile Val Leu Ile Pro Gly Ser Met Gly
370 375 380
Thr Ala Ser Tyr Ile Met Ala Gly Ile Pro Glu Gly Arg Arg Thr Trp
385 390 395 400
Phe Thr Ala Pro His Gly Ala Gly Arg Trp Met Ser Arg Glu Ala Ala
405 410 415
Val Arg Ser Tyr Pro Val Asn Ser Val Val Gln Asn Leu Glu Glu Lys
420 425 430
Gly Ile Ile Val Arg Ala Ala Thr Lys Arg Val Val Ala Glu Glu Ala
435 440 445
Pro Gly Ala Tyr Lys Asp Val Asp Arg Val Ala Lys Val Ala His Glu
450 455 460
Val Lys Ile Ala Lys Leu Val Ala Arg Leu Lys Pro Ile Gly Val Thr
465 470 475 480
Lys Gly
<210> 574
<211> 970
<212> PRT
<213> 激烈火球菌(Pyrococcus furiosus)
<400> 574
Met Ile Ile Leu Arg Val Val Asn Val Ala Val Pro Leu Lys Arg Ile
1 5 10 15
Asp Lys Ile Arg Trp Glu Ile Pro Lys Phe Asp Lys Arg Met Lys Val
20 25 30
Pro Gly Arg Val Tyr Ala Asp Asp Val Leu Ile Glu Lys Met Arg Gln
35 40 45
Asp Arg Thr Leu Glu Gln Ala Ala Asn Val Ala Met Leu Pro Gly Ile
50 55 60
Tyr Lys Tyr Ser Ile Val Met Pro Asp Gly His Gln Gly Tyr Gly Phe
65 70 75 80
Pro Ile Gly Gly Val Ala Ala Phe Asp Ile Lys Glu Gly Val Ile Ser
85 90 95
Pro Gly Gly Ile Gly Tyr Asp Ile Asn Cys Leu Ala Pro Gly Thr Lys
100 105 110
Val Leu Thr Glu His Gly Tyr Trp Leu Lys Ile Glu Glu Met Pro Glu
115 120 125
Lys Phe Lys Leu Gln Arg Leu Arg Leu Tyr Asn Ile Glu Glu Gly His
130 135 140
Asn Asp Phe Ser Arg Val Ala Phe Val Ala Glu Arg Asn Ile Glu Lys
145 150 155 160
Asp Glu Thr Ala Ile Arg Ile Val Thr Glu Thr Gly Thr Leu Ile Glu
165 170 175
Gly Ser Glu Asp His Pro Val Leu Thr Pro Gln Gly Tyr Val Tyr Leu
180 185 190
Lys Asn Ile Lys Glu Gly Asp Tyr Val Ile Val Tyr Pro Phe Glu Gly
195 200 205
Val Pro Tyr Glu Glu Lys Lys Gly Ile Ile Ile Asp Glu Ser Ala Phe
210 215 220
Glu Gly Glu Asp Pro Gln Val Ile Lys Phe Leu Lys Glu Arg Asn Leu
225 230 235 240
Leu Pro Leu Arg Trp Glu Asp Pro Lys Ile Gly Thr Leu Ala Arg Ile
245 250 255
Leu Gly Phe Ala Leu Gly Asp Gly His Leu Gly Glu Met Gly Gly Arg
260 265 270
Leu Val Leu Ala Phe Tyr Gly Arg Glu Glu Thr Leu Arg Glu Leu Lys
275 280 285
Lys Asp Leu Glu Ser Leu Gly Ile Lys Ala Asn Leu Tyr Val Arg Glu
290 295 300
Lys Asn Tyr Arg Ile Lys Thr Glu Ser Gly Glu Tyr Ser Gly Lys Thr
305 310 315 320
Val Leu Ala Glu Leu Arg Val Ser Ser Arg Ser Phe Ala Leu Leu Leu
325 330 335
Glu Lys Leu Gly Met Pro Arg Gly Glu Lys Thr Lys Lys Ala Tyr Arg
340 345 350
Ile Pro Val Trp Ile Met Glu Ala Pro Leu Trp Val Lys Arg Asn Phe
355 360 365
Leu Ala Gly Phe Phe Gly Ala Asp Gly Ser Ile Val Glu Phe Lys Gly
370 375 380
Thr Thr Pro Leu Pro Ile His Leu Thr Gln Ala Lys Asp Val Ala Leu
385 390 395 400
Glu Glu Asn Leu Lys Glu Phe Leu Tyr Asp Ile Ser Arg Ile Leu Glu
405 410 415
Glu Phe Gly Val Lys Thr Thr Ile Tyr Lys Val Asn Ser Lys Lys Ser
420 425 430
Val Thr Tyr Arg Leu Ser Ile Val Gly Glu Glu Asn Ile Arg Asn Phe
435 440 445
Leu Gly Lys Ile Asn Tyr Glu Tyr Asp Pro Lys Lys Lys Ala Lys Gly
450 455 460
Leu Ile Ala Tyr Ala Tyr Leu Lys Phe Lys Glu Ser Val Lys Lys Glu
465 470 475 480
Arg Arg Lys Ala Met Glu Ile Ser Lys Lys Ile Tyr Glu Glu Thr Gly
485 490 495
Asn Ile Asp Arg Ala Tyr Lys Ala Val Lys Asp Ile Val Asn Arg Arg
500 505 510
Phe Val Glu Arg Thr Ile Tyr Glu Gly Glu Arg Asn Pro Arg Val Pro
515 520 525
Lys Asn Phe Leu Thr Phe Glu Glu Phe Ala Lys Glu Arg Gly Tyr Glu
530 535 540
Gly Gly Phe Val Ala Glu Lys Val Val Lys Val Glu Arg Ile Lys Pro
545 550 555 560
Glu Tyr Asp Arg Phe Tyr Asp Ile Gly Val Tyr His Glu Ala His Asn
565 570 575
Phe Ile Ala Asn Gly Ile Val Val His Asn Cys Gly Val Arg Leu Ile
580 585 590
Arg Thr Asn Leu Thr Glu Lys Asp Val Arg Pro Lys Ile Lys Gln Leu
595 600 605
Val Asp Thr Leu Phe Lys Asn Val Pro Ser Gly Val Gly Ser Gln Gly
610 615 620
Lys Val Arg Leu His Trp Thr Gln Ile Asp Asp Val Leu Val Asp Gly
625 630 635 640
Ala Lys Trp Ala Val Asp Gln Gly Tyr Gly Trp Glu Arg Asp Leu Glu
645 650 655
Arg Leu Glu Glu Gly Gly Arg Met Glu Gly Ala Asp Pro Asp Ala Val
660 665 670
Ser Gln Arg Ala Lys Gln Arg Gly Ala Pro Gln Leu Gly Ser Leu Gly
675 680 685
Ser Gly Asn His Phe Leu Glu Val Gln Val Val Asp Lys Ile Phe Asp
690 695 700
Glu Glu Ile Ala Lys Ala Tyr Gly Leu Phe Glu Gly Gln Val Val Val
705 710 715 720
Met Val His Thr Gly Ser Arg Gly Leu Gly His Gln Val Ala Ser Asp
725 730 735
Tyr Leu Arg Ile Met Glu Arg Ala Ile Arg Lys Tyr Gly Ile Pro Trp
740 745 750
Pro Asp Arg Glu Leu Val Ser Val Pro Phe Gln Ser Glu Glu Gly Gln
755 760 765
Arg Tyr Phe Ser Ala Met Lys Ala Ala Ala Asn Phe Ala Trp Ala Asn
770 775 780
Arg Gln Met Ile Thr His Trp Val Arg Glu Ser Phe Gln Glu Val Phe
785 790 795 800
Arg Gln Asp Pro Glu Gly Asp Leu Gly Met Glu Ile Val Tyr Asp Val
805 810 815
Ala His Asn Ile Gly Lys Val Glu Glu His Glu Val Asp Gly Lys Lys
820 825 830
Val Lys Val Ile Val His Arg Lys Gly Ala Thr Arg Ala Phe Pro Pro
835 840 845
Gly His Glu Ala Ile Pro Lys Ile Tyr Arg Asp Val Gly Gln Pro Val
850 855 860
Leu Ile Pro Gly Ser Met Gly Thr Ala Ser Tyr Val Leu Ala Gly Thr
865 870 875 880
Glu Gly Ala Met Ala Glu Thr Phe Gly Ser Thr Cys His Gly Ala Gly
885 890 895
Arg Val Leu Ser Arg Ala Ala Ala Thr Arg Gln Tyr Arg Gly Asp Arg
900 905 910
Ile Arg Asp Glu Leu Leu Arg Arg Gly Ile Tyr Val Arg Ala Ala Ser
915 920 925
Met Arg Val Val Ala Glu Glu Ala Pro Gly Ala Tyr Lys Asn Val Asp
930 935 940
Asn Val Val Lys Val Val Ser Glu Ala Gly Ile Ala Lys Leu Val Ala
945 950 955 960
Arg Met Arg Pro Ile Gly Val Ala Lys Gly
965 970
<210> 575
<211> 444
<212> PRT
<213> 蜡样芽孢杆菌(Bacillus cereus)
<400> 575
Met Asn Val Lys Leu Leu Met Asp Glu Ser Thr Lys Glu Leu Ser Ile
1 5 10 15
Tyr Leu Lys Gly Ile Glu Glu Phe Leu Asn Asn Phe Ser Glu Met Lys
20 25 30
His Ile Lys Lys Pro Ile Asn Ile Phe Pro Asp Ala Tyr Ile Lys Arg
35 40 45
Trp Gly Phe Pro Ser Gly Ile Thr Ile Ile Ser Glu Glu Asp Gly Leu
50 55 60
Val Phe Pro Ala Ala Ala Pro Asp Leu Gly Cys Gly Phe Arg Ile Ile
65 70 75 80
Lys Thr Asn Leu Asp Ile His Thr Phe Asn Asp Asp Leu Ala Lys Glu
85 90 95
Ile Leu Ile Gln Leu Glu Asp Met Ala Gly Val Asp Ser Lys Ile Arg
100 105 110
Met Lys Lys Val Ala Asn Leu Asp Lys Glu Arg Ile Phe Ser Gln Gly
115 120 125
Val Leu Tyr Leu Leu Glu Met Gly Ile Gly Ser Gln Glu Asp Leu Glu
130 135 140
Lys Ile Gln Gly Ile Ser Thr Asn Lys Ser Lys Lys Leu His Ile Ser
145 150 155 160
Glu Lys Asp Lys Asp Leu Leu Ile Glu Asn Phe Gly Ile Cys Ala Gly
165 170 175
His Phe Leu Glu Val Arg Tyr Val Thr Asp Ile Phe Asn Lys Thr Val
180 185 190
Gly Ser Lys Leu Asn Leu Ser Val Gly Gln Ile Ile Ile Ile Ile His
195 200 205
Ser Ser Ser Tyr Val Gly Lys Glu Ile Ile Leu Glu Asn Tyr Tyr Arg
210 215 220
Pro Ala Ile Glu Phe Met Leu Ser Lys Lys Leu Val Ser Asn Glu Gln
225 230 235 240
Leu Asn Arg Gly Ile Phe Gly Leu Pro Ile Lys Ser Glu Leu Gly Lys
245 250 255
Ala Tyr Ile Glu Ala Ser Asn Ala Leu Val Glu Tyr Ser Tyr Ala Ser
260 265 270
Arg His Phe Ala Gln Tyr Leu Val Asn Glu Val Leu Asn Asn Val Phe
275 280 285
Gly Asp Lys Val Glu Phe Glu Leu Ile Ser Asp Ile Cys His Ser Lys
290 295 300
Ile Glu Tyr Leu Asp Asn Gly Asp Val Leu His Gly Arg Gly Val Gln
305 310 315 320
Lys Ile Tyr Pro Ile Gly His Ala Asn Thr Leu Pro Tyr Tyr Ser Asp
325 330 335
Thr Gly Asp Val Ala Leu Leu Ala Gly Gln Lys Gly Thr Glu Ser His
340 345 350
Leu Ile Ile Pro Thr Ser Gln Ile Lys Glu Thr Ser Tyr Leu Cys Ser
355 360 365
His Gly Thr Gly Glu Phe Leu Val Glu Lys Asp Val His Asp Val Pro
370 375 380
Val Ser Val Arg Lys Glu Leu Glu Leu Cys Ser Phe Asp Thr Gln Tyr
385 390 395 400
Asp Glu Leu Asp Glu Phe Thr Leu Asp Tyr Phe Asn Thr Lys Met Cys
405 410 415
Leu Lys Glu Leu Glu Glu Asn Gln Lys Ile Ile Asn Lys Val Cys Arg
420 425 430
Leu Ala Pro Leu Ile Asn Tyr Trp Gly Asp Lys Glu
435 440
<210> 576
<211> 408
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 576
Met Asn Tyr Glu Leu Leu Thr Thr Glu Asn Ala Pro Val Lys Met Trp
1 5 10 15
Thr Lys Gly Val Pro Val Glu Ala Asp Ala Arg Gln Gln Leu Ile Asn
20 25 30
Thr Ala Lys Met Pro Phe Ile Phe Lys His Ile Ala Val Met Pro Asp
35 40 45
Val His Leu Gly Lys Gly Ser Thr Ile Gly Ser Val Ile Pro Thr Lys
50 55 60
Gly Ala Ile Ile Pro Ala Ala Val Gly Val Asp Ile Gly Cys Gly Met
65 70 75 80
Asn Ala Leu Arg Thr Ala Leu Thr Ala Glu Asp Leu Pro Glu Asn Leu
85 90 95
Ala Glu Leu Arg Gln Ala Ile Glu Thr Ala Val Pro His Gly Arg Thr
100 105 110
Thr Gly Arg Cys Lys Arg Asp Lys Gly Ala Trp Glu Asn Pro Pro Val
115 120 125
Asn Val Asp Ala Lys Trp Ala Glu Leu Glu Ala Gly Tyr Gln Trp Leu
130 135 140
Thr Gln Lys Tyr Pro Arg Phe Leu Asn Thr Asn Asn Tyr Lys His Leu
145 150 155 160
Gly Thr Leu Gly Thr Gly Asn His Phe Ile Glu Ile Cys Leu Asp Glu
165 170 175
Ser Asp Gln Val Trp Ile Met Leu His Ser Gly Ser Arg Gly Ile Gly
180 185 190
Asn Ala Ile Gly Thr Tyr Phe Ile Asp Leu Ala Gln Lys Glu Met Gln
195 200 205
Glu Thr Leu Glu Thr Leu Pro Ser Arg Asp Leu Ala Tyr Phe Met Glu
210 215 220
Gly Thr Glu Tyr Phe Asp Asp Tyr Leu Lys Ala Val Ala Trp Ala Gln
225 230 235 240
Leu Phe Ala Ser Leu Asn Arg Asp Ala Met Met Glu Asn Val Val Thr
245 250 255
Ala Leu Gln Ser Ile Thr Gln Lys Thr Val Arg Gln Pro Gln Thr Leu
260 265 270
Ala Met Glu Glu Ile Asn Cys His His Asn Tyr Val Gln Lys Glu Gln
275 280 285
His Phe Gly Glu Glu Ile Tyr Val Thr Arg Lys Gly Ala Val Ser Ala
290 295 300
Arg Ala Gly Gln Tyr Gly Ile Ile Pro Gly Ser Met Gly Ala Lys Ser
305 310 315 320
Phe Ile Val Arg Gly Leu Gly Asn Glu Glu Ser Phe Cys Ser Cys Ser
325 330 335
His Gly Ala Gly Arg Val Met Ser Arg Thr Lys Ala Lys Lys Leu Phe
340 345 350
Ser Val Glu Asp Gln Ile Arg Ala Thr Ala His Val Glu Cys Arg Lys
355 360 365
Asp Ala Glu Val Ile Asp Glu Ile Pro Met Ala Tyr Lys Asp Ile Asp
370 375 380
Ala Val Met Ala Ala Gln Ser Asp Leu Val Glu Val Ile Tyr Thr Leu
385 390 395 400
Arg Gln Val Val Cys Val Lys Gly
405
<210> 577
<211> 505
<212> PRT
<213> 秀丽隐杆线虫(Caenorhabditis elegans)
<400> 577
Met Pro Arg Thr Phe Glu Glu Glu Cys Asp Phe Ile Asp Arg Leu Thr
1 5 10 15
Asp Thr Lys Phe Arg Ile Lys Lys Gly Phe Val Pro Asn Met Asn Val
20 25 30
Glu Gly Arg Phe Tyr Val Asn Asn Ser Leu Glu Gln Leu Met Phe Asp
35 40 45
Glu Leu Lys Phe Ser Cys Asp Gly Gln Gly Ile Gly Gly Phe Leu Pro
50 55 60
Ala Val Arg Gln Ile Ala Asn Val Ala Ser Leu Pro Gly Ile Val Gly
65 70 75 80
His Ser Ile Gly Leu Pro Asp Ile His Ser Gly Tyr Gly Phe Ser Ile
85 90 95
Gly Asn Ile Ala Ala Phe Asp Val Gly Asn Pro Glu Ser Val Ile Ser
100 105 110
Pro Gly Gly Val Gly Phe Asp Ile Asn Cys Gly Val Arg Leu Leu Arg
115 120 125
Thr Asn Leu Phe Glu Glu Asn Val Lys Pro Leu Lys Glu Gln Leu Thr
130 135 140
Gln Ser Leu Phe Asp His Ile Pro Val Gly Val Gly Ser Arg Gly Ala
145 150 155 160
Ile Pro Met Leu Ala Ser Asp Leu Val Glu Cys Leu Glu Met Gly Met
165 170 175
Asp Trp Thr Leu Arg Glu Gly Tyr Ser Trp Ala Glu Asp Lys Glu His
180 185 190
Cys Glu Glu Tyr Gly Arg Met Leu Gln Ala Asp Ala Ser Lys Val Ser
195 200 205
Leu Arg Ala Lys Lys Arg Gly Leu Pro Gln Leu Gly Thr Leu Gly Ala
210 215 220
Gly Asn His Tyr Ala Glu Val Gln Val Val Asp Glu Ile Tyr Asp Lys
225 230 235 240
His Ala Ala Ser Thr Met Gly Ile Asp Glu Glu Gly Gln Val Val Val
245 250 255
Met Leu His Cys Gly Ser Arg Gly Leu Gly His Gln Val Ala Thr Asp
260 265 270
Ser Leu Val Glu Met Glu Lys Ala Met Ala Arg Asp Gly Ile Val Val
275 280 285
Asn Asp Lys Gln Leu Ala Cys Ala Arg Ile Asn Ser Val Glu Gly Lys
290 295 300
Asn Tyr Phe Ser Gly Met Ala Ala Ala Ala Asn Phe Ala Trp Val Asn
305 310 315 320
Arg Ser Cys Ile Thr Phe Cys Val Arg Asn Ala Phe Gln Lys Thr Phe
325 330 335
Gly Met Ser Ala Asp Asp Met Asp Met Gln Val Ile Tyr Asp Val Ser
340 345 350
His Asn Val Ala Lys Met Glu Glu His Met Val Asp Gly Arg Pro Arg
355 360 365
Gln Leu Cys Val His Arg Lys Gly Ala Thr Arg Ala Phe Pro Ala His
370 375 380
His Pro Leu Ile Pro Val Asp Tyr Gln Leu Ile Gly Gln Pro Val Leu
385 390 395 400
Ile Gly Gly Ser Met Gly Thr Cys Ser Tyr Val Leu Thr Gly Thr Glu
405 410 415
Gln Gly Leu Val Glu Thr Phe Gly Thr Thr Cys His Gly Ala Gly Arg
420 425 430
Ala Leu Ser Arg Ala Lys Ser Arg Arg Thr Ile Thr Trp Asp Ser Val
435 440 445
Ile Asp Asp Leu Lys Lys Lys Glu Ile Ser Ile Arg Ile Ala Ser Pro
450 455 460
Lys Leu Ile Met Glu Glu Ala Pro Glu Ser Tyr Lys Asn Val Thr Asp
465 470 475 480
Val Val Asp Thr Cys Asp Ala Ala Gly Ile Ser Lys Lys Ala Val Lys
485 490 495
Leu Arg Pro Ile Ala Val Ile Lys Gly
500 505
<210> 578
<211> 827
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 578
Met Pro Ser Pro Tyr Asp Gly Lys Arg Thr Val Thr Gln Leu Val Asn
1 5 10 15
Glu Leu Glu Lys Ala Glu Lys Leu Ser Gly Arg Gly Arg Ala Tyr Arg
20 25 30
Arg Val Cys Asp Leu Ser His Ser Asn Lys Lys Val Ile Ser Trp Lys
35 40 45
Phe Asn Glu Trp Asp Tyr Gly Lys Asn Thr Ile Thr Leu Pro Cys Asn
50 55 60
Ala Arg Gly Leu Phe Ile Ser Asp Asp Thr Thr Asn Pro Val Ile Val
65 70 75 80
Ala Arg Gly Tyr Asp Lys Phe Phe Asn Val Gly Glu Val Asn Phe Thr
85 90 95
Lys Trp Asn Trp Ile Glu Glu Asn Cys Thr Gly Pro Tyr Asp Val Thr
100 105 110
Ile Lys Ala Asn Gly Cys Ile Ile Phe Ile Ser Gly Leu Glu Asp Gly
115 120 125
Thr Leu Val Val Cys Ser Lys His Ser Thr Gly Pro Arg Ala Asp Val
130 135 140
Asp Arg Asn His Ala Glu Ala Gly Glu Lys Gln Leu Leu Arg Gln Leu
145 150 155 160
Ala Ala Met Asn Ile Asn Arg Ser Asp Phe Ala Arg Met Leu Tyr Thr
165 170 175
His Asn Val Thr Ala Val Ala Glu Tyr Cys Asp Asp Ser Phe Glu Glu
180 185 190
His Ile Leu Glu Tyr Pro Leu Glu Lys Ala Gly Leu Tyr Leu His Gly
195 200 205
Val Asn Val Asn Lys Ala Glu Phe Glu Thr Trp Asp Met Lys Asp Val
210 215 220
Ser Gln Met Ala Ser Lys Tyr Gly Phe Arg Cys Val Gln Cys Ile Thr
225 230 235 240
Ser Asn Thr Leu Glu Asp Leu Lys Lys Phe Leu Asp Asn Cys Ser Ala
245 250 255
Thr Gly Ser Phe Glu Gly Gln Glu Ile Glu Gly Phe Val Ile Arg Cys
260 265 270
His Leu Lys Ser Thr Glu Lys Pro Phe Phe Phe Lys Tyr Lys Phe Glu
275 280 285
Glu Pro Tyr Leu Met Tyr Arg Gln Trp Arg Glu Val Thr Lys Asp Tyr
290 295 300
Ile Ser Asn Lys Ser Arg Val Phe Lys Phe Arg Lys His Lys Phe Ile
305 310 315 320
Thr Asn Lys Tyr Leu Asp Phe Ala Ile Pro Ile Leu Glu Ser Ser Pro
325 330 335
Lys Ile Cys Glu Asn Tyr Leu Lys Gly Phe Gly Val Ile Glu Leu Arg
340 345 350
Asn Lys Phe Leu Gln Ser Tyr Gly Met Ser Gly Leu Glu Ile Leu Asn
355 360 365
His Glu Lys Val Ala Glu Leu Glu Leu Lys Asn Ala Ile Asp Tyr Asp
370 375 380
Lys Val Asp Glu Arg Thr Lys Phe Leu Ile Phe Pro Ile Ser Val Ile
385 390 395 400
Gly Cys Gly Lys Thr Thr Thr Ser Gln Thr Leu Val Asn Leu Phe Pro
405 410 415
Asp Ser Trp Gly His Ile Gln Asn Asp Asp Ile Thr Gly Lys Asp Lys
420 425 430
Ser Gln Leu Met Lys Lys Ser Leu Glu Leu Leu Ser Lys Lys Glu Ile
435 440 445
Lys Cys Val Ile Val Asp Arg Asn Asn His Gln Phe Arg Glu Arg Lys
450 455 460
Gln Leu Phe Glu Trp Leu Asn Glu Leu Lys Glu Asp Tyr Leu Val Tyr
465 470 475 480
Asp Thr Asn Ile Lys Val Ile Gly Val Ser Phe Ala Pro Tyr Asp Lys
485 490 495
Leu Ser Glu Ile Arg Asp Ile Thr Leu Gln Arg Val Ile Lys Arg Gly
500 505 510
Asn Asn His Gln Ser Ile Lys Trp Asp Glu Leu Gly Glu Lys Lys Val
515 520 525
Val Gly Ile Met Asn Gly Phe Leu Lys Arg Tyr Gln Pro Val Asn Leu
530 535 540
Asp Lys Ser Pro Asp Asn Met Phe Asp Leu Met Ile Glu Leu Asp Phe
545 550 555 560
Gly Gln Ala Asp Ser Ser Leu Thr Asn Ala Lys Gln Ile Leu Asn Glu
565 570 575
Ile His Lys Ala Tyr Pro Ile Leu Val Pro Glu Ile Pro Lys Asp Asp
580 585 590
Glu Ile Glu Thr Ala Phe Arg Arg Ser Leu Asp Tyr Lys Pro Thr Val
595 600 605
Arg Lys Ile Val Gly Lys Gly Asn Asn Asn Gln Gln Lys Thr Pro Lys
610 615 620
Leu Ile Lys Pro Thr Tyr Ile Ser Ala Lys Ile Glu Asn Tyr Asp Glu
625 630 635 640
Ile Ile Glu Leu Val Lys Arg Cys Ile Ala Ser Asp Ala Glu Leu Thr
645 650 655
Glu Lys Phe Lys His Leu Leu Ala Ser Gly Lys Val Gln Lys Glu Leu
660 665 670
His Ile Thr Leu Gly His Val Met Ser Ser Arg Glu Lys Glu Ala Lys
675 680 685
Lys Leu Trp Lys Ser Tyr Cys Asn Arg Tyr Thr Asp Gln Ile Thr Glu
690 695 700
Tyr Asn Asn Asn Arg Ile Glu Asn Ala Gln Gly Ser Gly Asn Asn Gln
705 710 715 720
Asn Thr Gln Val Lys Thr Thr Asp Lys Leu Asn Phe Arg Leu Glu Lys
725 730 735
Leu Cys Trp Asp Glu Lys Ile Ile Ala Ile Val Val Glu Leu Ser Lys
740 745 750
Asp Lys Asp Gly Cys Ile Ile Asp Glu Asn Asn Glu Lys Ile Lys Gly
755 760 765
Leu Cys Cys Gln Asn Lys Ile Pro His Ile Thr Leu Cys Lys Leu Glu
770 775 780
Ser Gly Val Lys Ala Val Tyr Ser Asn Val Leu Cys Glu Lys Val Glu
785 790 795 800
Ser Ala Glu Val Asp Glu Asn Ile Lys Val Val Lys Leu Asp Asn Ser
805 810 815
Lys Glu Phe Val Gly Ser Val Tyr Leu Asn Phe
820 825
<210> 579
<211> 1104
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 579
Met Asp Ala Pro Phe Glu Ser Gly Asp Ser Ser Ala Thr Val Val Ala
1 5 10 15
Glu Ala Val Asn Asn Gln Phe Gly Gly Leu Ser Leu Lys Glu Ser Asn
20 25 30
Thr Asn Ala Pro Val Leu Pro Ser Gln Thr Thr Ser Asn His Arg Val
35 40 45
Gln Asn Leu Val Trp Lys Pro Lys Ser Tyr Gly Thr Val Ser Gly Ser
50 55 60
Ser Ser Ala Thr Glu Val Gly Lys Thr Ser Ala Val Ser Gln Ile Gly
65 70 75 80
Ser Ser Gly Asp Thr Lys Val Gly Leu Asn Leu Ser Lys Ile Phe Gly
85 90 95
Gly Asn Leu Leu Glu Lys Phe Ser Val Asp Lys Ser Thr Tyr Cys His
100 105 110
Ala Gln Ile Arg Ala Thr Phe Tyr Pro Lys Phe Glu Asn Glu Lys Thr
115 120 125
Asp Gln Glu Ile Arg Thr Arg Met Ile Glu Met Val Ser Lys Gly Leu
130 135 140
Ala Thr Leu Glu Val Ser Leu Lys His Ser Gly Ser Leu Phe Met Tyr
145 150 155 160
Ala Gly His Lys Gly Gly Ala Tyr Ala Lys Asn Ser Phe Gly Asn Ile
165 170 175
Tyr Thr Ala Val Gly Val Phe Val Leu Ser Arg Met Phe Arg Glu Ala
180 185 190
Trp Gly Thr Lys Ala Pro Lys Lys Glu Ala Glu Phe Asn Asp Phe Leu
195 200 205
Glu Lys Asn Arg Met Cys Ile Ser Met Glu Leu Val Thr Ala Val Leu
210 215 220
Gly Asp His Gly Gln Arg Pro Leu Asp Asp Tyr Val Val Val Thr Ala
225 230 235 240
Val Thr Glu Leu Gly Asn Gly Lys Pro Gln Phe Tyr Ser Thr Ser Glu
245 250 255
Ile Ile Ser Phe Cys Arg Lys Trp Arg Leu Pro Thr Asn His Val Trp
260 265 270
Leu Phe Ser Thr Arg Lys Ser Val Thr Ser Phe Phe Ala Ala Phe Asp
275 280 285
Ala Leu Cys Glu Glu Gly Ile Ala Thr Ser Val Cys Arg Ala Leu Asp
290 295 300
Glu Val Ala Asp Ile Ser Val Pro Ala Ser Lys Asp His Val Lys Val
305 310 315 320
Gln Gly Glu Ile Leu Glu Gly Leu Val Ala Arg Ile Val Ser Ser Gln
325 330 335
Ser Ser Arg Asp Met Glu Asn Val Leu Arg Asp His Pro Pro Pro Pro
340 345 350
Cys Asp Gly Ala Asn Leu Asp Leu Gly Leu Ser Leu Arg Glu Ile Cys
355 360 365
Ala Ala His Arg Ser Asn Glu Lys Gln Gln Met Arg Ala Leu Leu Arg
370 375 380
Ser Val Gly Pro Ser Phe Cys Pro Ser Asp Val Glu Trp Phe Gly Asp
385 390 395 400
Glu Ser His Pro Lys Ser Ala Asp Lys Ser Val Ile Thr Lys Phe Leu
405 410 415
Gln Ser Gln Pro Ala Asp Tyr Ser Thr Ser Lys Leu Gln Glu Met Val
420 425 430
Arg Leu Met Lys Glu Lys Arg Leu Pro Ala Ala Phe Lys Cys Tyr His
435 440 445
Asn Phe His Arg Ala Glu Asp Ile Ser Pro Asp Asn Leu Phe Tyr Lys
450 455 460
Leu Val Val His Val His Ser Asp Ser Gly Phe Arg Arg Tyr His Lys
465 470 475 480
Glu Met Arg His Met Pro Ser Leu Trp Pro Leu Tyr Arg Gly Phe Phe
485 490 495
Val Asp Ile Asn Leu Phe Lys Ser Asn Lys Gly Arg Asp Leu Met Ala
500 505 510
Leu Lys Ser Ile Asp Asn Ala Ser Glu Asn Asp Gly Arg Gly Glu Lys
515 520 525
Asp Gly Leu Ala Asp Asp Asp Ala Asn Leu Met Ile Lys Met Lys Phe
530 535 540
Leu Thr Tyr Lys Leu Arg Thr Phe Leu Ile Arg Asn Gly Leu Ser Ile
545 550 555 560
Leu Phe Lys Asp Gly Ala Ala Ala Tyr Lys Thr Tyr Tyr Leu Arg Gln
565 570 575
Met Lys Ile Trp Gly Thr Ser Asp Gly Lys Gln Lys Glu Leu Cys Lys
580 585 590
Met Leu Asp Glu Trp Ala Ala Tyr Ile Arg Arg Lys Cys Gly Asn Asp
595 600 605
Gln Leu Ser Ser Ser Thr Tyr Leu Ser Glu Ala Glu Pro Phe Leu Glu
610 615 620
Gln Tyr Ala Lys Arg Ser Pro Lys Asn His Ile Leu Ile Gly Ser Ala
625 630 635 640
Gly Asn Leu Val Arg Thr Glu Asp Phe Leu Ala Ile Val Asp Gly Asp
645 650 655
Leu Asp Glu Glu Gly Asp Leu Val Lys Lys Gln Gly Val Thr Pro Ala
660 665 670
Thr Pro Glu Pro Ala Val Lys Glu Ala Val Gln Lys Asp Glu Gly Leu
675 680 685
Ile Val Phe Phe Pro Gly Ile Pro Gly Ser Ala Lys Ser Ala Leu Cys
690 695 700
Lys Glu Leu Leu Asn Ala Pro Gly Gly Phe Gly Asp Asp Arg Pro Val
705 710 715 720
His Thr Leu Met Gly Asp Leu Val Lys Gly Lys Tyr Trp Pro Lys Val
725 730 735
Ala Asp Glu Arg Arg Lys Lys Pro Gln Ser Ile Met Leu Ala Asp Lys
740 745 750
Asn Ala Pro Asn Glu Asp Val Trp Arg Gln Ile Glu Asp Met Cys Arg
755 760 765
Arg Thr Arg Ala Ser Ala Val Pro Ile Val Ala Asp Ser Glu Gly Thr
770 775 780
Asp Thr Asn Pro Tyr Ser Leu Asp Ala Leu Ala Val Phe Met Phe Arg
785 790 795 800
Val Leu Gln Arg Val Asn His Pro Gly Lys Leu Asp Lys Glu Ser Ser
805 810 815
Asn Ala Gly Tyr Val Leu Leu Met Phe Tyr His Leu Tyr Glu Gly Lys
820 825 830
Asn Arg Asn Glu Phe Glu Ser Glu Leu Ile Glu Arg Phe Gly Ser Leu
835 840 845
Ile Lys Met Pro Leu Leu Lys Ser Asp Arg Thr Pro Leu Pro Asp Pro
850 855 860
Val Lys Ser Val Leu Glu Glu Gly Ile Asp Leu Phe Asn Leu His Ser
865 870 875 880
Arg Arg His Gly Arg Leu Glu Ser Thr Lys Gly Thr Tyr Ala Ala Glu
885 890 895
Trp Thr Lys Trp Glu Lys Gln Leu Arg Asp Thr Leu Val Ala Asn Ser
900 905 910
Glu Tyr Leu Ser Ser Ile Gln Val Pro Phe Glu Ser Met Val His Gln
915 920 925
Val Arg Glu Glu Leu Lys Thr Ile Ala Lys Gly Asp Tyr Lys Pro Pro
930 935 940
Ser Ser Glu Lys Arg Lys His Gly Ser Ile Val Phe Ala Ala Ile Asn
945 950 955 960
Leu Pro Ala Thr Gln Val His Ser Leu Leu Glu Lys Leu Ala Ala Ala
965 970 975
Asn Pro Thr Met Arg Ser Phe Leu Glu Gly Lys Lys Lys Ser Ile Gln
980 985 990
Glu Lys Leu Glu Arg Ser His Val Thr Leu Ala His Lys Arg Ser His
995 1000 1005
Gly Val Ala Thr Val Ala Ser Tyr Ser Gln His Leu Asn Arg Glu
1010 1015 1020
Val Pro Val Glu Leu Thr Glu Leu Ile Tyr Asn Asp Lys Met Ala
1025 1030 1035
Ala Leu Thr Ala His Val Gly Ser Val Asp Gly Glu Thr Val Val
1040 1045 1050
Ser Lys Asn Glu Trp Pro His Val Thr Leu Trp Thr Ala Glu Gly
1055 1060 1065
Val Thr Ala Lys Glu Ala Asn Thr Leu Pro Gln Leu Tyr Leu Glu
1070 1075 1080
Gly Lys Ala Ser Arg Leu Val Ile Asp Pro Pro Val Ser Ile Ser
1085 1090 1095
Gly Pro Leu Glu Phe Phe
1100
<210> 580
<211> 334
<212> PRT
<213> 肠杆菌噬菌体(Enterobacteria phage)T4
<400> 580
Met Phe Lys Lys Tyr Ser Ser Leu Glu Asn His Tyr Asn Ser Lys Phe
1 5 10 15
Ile Glu Lys Leu Tyr Ser Leu Gly Leu Thr Gly Gly Glu Trp Val Ala
20 25 30
Arg Glu Lys Ile His Gly Thr Asn Phe Ser Leu Ile Ile Glu Arg Asp
35 40 45
Lys Val Thr Cys Ala Lys Arg Thr Gly Pro Ile Leu Pro Ala Glu Asp
50 55 60
Phe Phe Gly Tyr Glu Ile Ile Leu Lys Asn Tyr Ala Asp Ser Ile Lys
65 70 75 80
Ala Val Gln Asp Ile Met Glu Thr Ser Ala Val Val Ser Tyr Gln Val
85 90 95
Phe Gly Glu Phe Ala Gly Pro Gly Ile Gln Lys Asn Val Asp Tyr Cys
100 105 110
Asp Lys Asp Phe Tyr Val Phe Asp Ile Ile Val Thr Thr Glu Ser Gly
115 120 125
Asp Val Thr Tyr Val Asp Asp Tyr Met Met Glu Ser Phe Cys Asn Thr
130 135 140
Phe Lys Phe Lys Met Ala Pro Leu Leu Gly Arg Gly Lys Phe Glu Glu
145 150 155 160
Leu Ile Lys Leu Pro Asn Asp Leu Asp Ser Val Val Gln Asp Tyr Asn
165 170 175
Phe Thr Val Asp His Ala Gly Leu Val Asp Ala Asn Lys Cys Val Trp
180 185 190
Asn Ala Glu Ala Lys Gly Glu Val Phe Thr Ala Glu Gly Tyr Val Leu
195 200 205
Lys Pro Cys Tyr Pro Ser Trp Leu Arg Asn Gly Asn Arg Val Ala Ile
210 215 220
Lys Cys Lys Asn Ser Lys Phe Ser Glu Lys Lys Lys Ser Asp Lys Pro
225 230 235 240
Ile Lys Ala Lys Val Glu Leu Ser Glu Ala Asp Asn Lys Leu Val Gly
245 250 255
Ile Leu Ala Cys Tyr Val Thr Leu Asn Arg Val Asn Asn Val Ile Ser
260 265 270
Lys Ile Gly Glu Ile Gly Pro Lys Asp Phe Gly Lys Val Met Gly Leu
275 280 285
Thr Val Gln Asp Ile Leu Glu Glu Thr Ser Arg Glu Gly Ile Thr Leu
290 295 300
Thr Gln Ala Asp Asn Pro Ser Leu Ile Lys Lys Glu Leu Val Lys Met
305 310 315 320
Val Gln Asp Val Leu Arg Pro Ala Trp Ile Glu Leu Val Ser
325 330
<210> 581
<211> 832
<212> PRT
<213> 白色念珠菌(Candida albicans)
<400> 581
Met Lys Asp Ser Gln Ser Asp Ile Ile Glu Leu Cys Asn Lys Leu Asn
1 5 10 15
Glu Ala Thr Lys Leu Lys Arg Asn Gly Lys Ser Ile Lys Leu Thr Asn
20 25 30
Phe Val Ser Asn Thr Gln Ile Lys Leu Asp Ser Trp Lys Phe Leu Glu
35 40 45
Trp Asp Tyr Gly Lys Pro Ser Val Gln Leu Pro Ile Gln Ala Arg Gly
50 55 60
Leu Phe Thr Leu Asn Asn Asp Thr Ile Ala Val Arg Gly Tyr Asp Lys
65 70 75 80
Phe Phe Asn Val Glu Glu Lys Pro Phe Thr Lys Glu Thr Asn Leu Lys
85 90 95
Thr Ser Thr His Gly Pro Tyr Glu Val Thr Leu Lys Glu Asn Gly Cys
100 105 110
Ile Ile Phe Ile Ser Gly Leu Ser Thr Gly Asp Ile Val Val Cys Ser
115 120 125
Lys His Ser Thr Gly Asp Arg Ile Asp Asp Asn Glu Ser Asp Lys Thr
130 135 140
Thr Thr Ala Thr Ala Thr Ala Thr Ala Pro Thr Arg Asn His Ala Lys
145 150 155 160
Gln Gly Glu Phe Glu Leu Leu Gln Gln Phe Asp Gly Asp Gln Gln Lys
165 170 175
Val Lys Gln Leu Ala His Tyr Leu Tyr Glu Asn Asn Leu Thr Val Val
180 185 190
Ala Glu Leu Cys Asp Asp Glu Phe Glu Glu His Val Leu Pro Tyr Pro
195 200 205
Lys Asp Lys Ser Gly Leu Tyr Val His Gly Leu Asn Tyr Asn Thr Ile
210 215 220
Thr Phe Lys Thr Leu Pro Met Asp Gln Val Leu Gln Phe Ala Lys Glu
225 230 235 240
Trp Gly Phe Lys Tyr Val Ser Tyr Leu Thr Tyr Asp Asn Ala Asp Glu
245 250 255
Leu Phe Lys Phe Leu His Lys Cys Ser Glu Thr Gly Thr Tyr Asn Gly
260 265 270
Arg Glu Ile Glu Gly Phe Val Ile Arg Cys His Arg Gln Ser His Thr
275 280 285
Asn Gly Asp Thr Asp Gly Asp Cys Phe Phe Phe Lys Tyr Lys Phe Glu
290 295 300
Gln Pro Tyr Leu Leu Tyr Arg Gln Phe Arg Glu Val Thr Lys Gln Leu
305 310 315 320
Leu Asn Gly Thr Pro Ile Asn Ser Ile Lys Ile Lys Lys Asn Lys Pro
325 330 335
Ile Thr Lys Lys Tyr Leu Gln Phe Val Glu Lys Leu Phe Glu Gln Glu
340 345 350
Pro Glu Ile Ala Arg Asn Phe Glu Asn Gly Phe Asp Ile Ile Lys Val
355 360 365
Arg Gln Leu Phe Leu Gln Ser Leu Asn Glu Thr Asn Gly Met Asn Leu
370 375 380
Leu Ser Ile Asp Ser Glu Leu Ser Asp Gln Leu Lys Asn Leu Ala Leu
385 390 395 400
Ala Asn Gly Asn Glu Gly Leu Ser Thr Thr Thr Lys Tyr Ile Phe Val
405 410 415
Pro Ile Ala Thr Ile Gly Cys Gly Lys Thr Thr Val Phe Asn Thr Leu
420 425 430
Asn Asn Leu Phe Pro Gln Trp Thr His Ile Gln Asn Asp Asn Ile Ser
435 440 445
Lys Lys Ala Lys Leu Lys Ile Cys Asp Leu Thr Leu Leu Ala Leu Glu
450 455 460
Asp Asp Asp Gln Ser Val Val Leu Phe Asp Arg Asn Asn Ser Ala Ser
465 470 475 480
Arg Glu Arg Arg Gln Ile Phe Thr Thr Ile Asp Gln Lys Arg Asp Glu
485 490 495
His Leu Asp Asp Thr Val Asp Leu Lys Tyr Ile Ala Ile Asn Phe Ile
500 505 510
Pro Glu Asp Leu Ser Glu Glu Glu Leu Trp Asp Ile Thr Tyr Asn Arg
515 520 525
Val Ile Gln Arg Gly Asp Asn His Gln Ser Ile Lys Ser Gln Ser Asp
530 535 540
Glu Asn Leu Val Glu Ser Val Met Lys Gly Phe Ile Gln Arg Tyr Gln
545 550 555 560
Pro Ile Asn Thr Ser Arg Ser Pro Asp Asp Gln Phe Asp His Val Ile
565 570 575
His Leu Lys Leu Ser Lys Asp Glu Asn Ser Ser Lys Ser Ser Leu Glu
580 585 590
Asn Val Arg Ile Ile Ile Asp Asp Leu Val Gln Asn Phe Pro Asp Leu
595 600 605
Ile Lys Glu Lys Pro Ala Asp Glu Leu Ile Asn Glu Cys Phe Gln Lys
610 615 620
Ala Leu Asp Tyr Lys Pro Thr Phe Val Lys Asn Met Thr Ala Asn Thr
625 630 635 640
Ile Lys Lys Asp Pro Thr Tyr Tyr Gly Ile Ala Met His Tyr Ser Ser
645 650 655
Ile Leu Glu Asn Leu Glu Ile Val Ser His Asn Glu His Phe Gln Asn
660 665 670
Ile Lys Ser His Ile Gln Thr Glu Phe His Val Thr Leu Gly His Ile
675 680 685
Ala Ser Ser Lys Gln Asp Lys Ala Gly Arg Val Lys Trp Lys Lys Leu
690 695 700
Val Lys Thr Leu Gly Lys Gly Asp Pro Asn Lys Pro Lys Ser Ala Leu
705 710 715 720
Lys Phe Phe Ala Asp Val Lys Leu Leu Gln Ile Val Ile Asn Thr Asp
725 730 735
Lys Leu Ala Cys Ile Lys Val Glu Ile Leu Lys Ile Tyr Asp Thr Asn
740 745 750
Asp Val Leu Gln Ser Glu Ile Glu Pro Ile Asn Lys Gln Leu His Ile
755 760 765
Thr Ile Gly Cys Ile Pro Pro Ala Thr Ala Val Glu Ser Asn Ile Thr
770 775 780
Leu Glu Glu Leu Tyr Asp Asn Pro Asp Glu Gln Glu Leu Lys Pro Asp
785 790 795 800
Gly Thr Tyr Lys Cys Gly Asp Asp Thr Leu His Val Phe Asn Phe Asp
805 810 815
Asn Pro Asp Leu Lys Leu Phe Ser Gln Gln Leu Phe Val Ala Tyr Gln
820 825 830
<210> 582
<211> 469
<212> PRT
<213> 布氏锥虫指名亚种(Trypanosoma brucei brucei)
<400> 582
Met Gln Leu Gln Arg Leu Gly Ala Pro Leu Leu Lys Arg Leu Val Gly
1 5 10 15
Gly Cys Ile Arg Gln Ser Thr Ala Pro Ile Met Pro Cys Val Val Val
20 25 30
Ser Gly Ser Gly Val Phe Leu Thr Pro Val Arg Thr Tyr Met Pro Leu
35 40 45
Pro Asn Asp Gln Ser Asp Phe Ser Pro Tyr Ile Glu Ile Asp Leu Pro
50 55 60
Ser Glu Ser Arg Ile Gln Ser Leu His Lys Ser Gly Leu Ala Ala Gln
65 70 75 80
Glu Trp Val Ala Cys Glu Lys Val His Gly Thr Asn Phe Gly Ile Tyr
85 90 95
Leu Ile Asn Gln Gly Asp His Glu Val Val Arg Phe Ala Lys Arg Ser
100 105 110
Gly Ile Met Asp Pro Asn Glu Asn Phe Phe Gly Tyr His Ile Leu Ile
115 120 125
Asp Glu Phe Thr Ala Gln Ile Arg Ile Leu Asn Asp Leu Leu Lys Gln
130 135 140
Lys Tyr Gly Leu Ser Arg Val Gly Arg Leu Val Leu Asn Gly Glu Leu
145 150 155 160
Phe Gly Ala Lys Tyr Lys His Pro Leu Val Pro Lys Ser Glu Lys Trp
165 170 175
Cys Thr Leu Pro Asn Gly Lys Lys Phe Pro Ile Ala Gly Val Gln Ile
180 185 190
Gln Arg Glu Pro Phe Pro Gln Tyr Ser Pro Glu Leu His Phe Phe Ala
195 200 205
Phe Asp Ile Lys Tyr Ser Val Ser Gly Ala Glu Glu Asp Phe Val Leu
210 215 220
Leu Gly Tyr Asp Glu Phe Val Glu Phe Ser Ser Lys Val Pro Asn Leu
225 230 235 240
Leu Tyr Ala Arg Ala Leu Val Arg Gly Thr Leu Asp Glu Cys Leu Ala
245 250 255
Phe Asp Val Glu Asn Phe Met Thr Pro Leu Pro Ala Leu Leu Gly Leu
260 265 270
Gly Asn Tyr Pro Leu Glu Gly Asn Leu Ala Glu Gly Val Val Ile Arg
275 280 285
His Val Arg Arg Gly Asp Pro Ala Val Glu Lys His Asn Val Ser Thr
290 295 300
Ile Ile Lys Leu Arg Cys Ser Ser Phe Met Glu Leu Lys His Pro Gly
305 310 315 320
Lys Gln Lys Glu Leu Lys Glu Thr Phe Ile Asp Thr Val Arg Ser Gly
325 330 335
Ala Leu Arg Arg Val Arg Gly Asn Val Thr Val Ile Ser Asp Ser Met
340 345 350
Leu Pro Gln Val Glu Ala Ala Ala Asn Asp Leu Leu Leu Asn Asn Val
355 360 365
Ser Asp Gly Arg Leu Ser Asn Val Leu Ser Lys Ile Gly Arg Glu Pro
370 375 380
Leu Leu Ser Gly Glu Val Ser Gln Val Asp Val Val Leu Met Leu Ala
385 390 395 400
Lys Asp Ala Leu Lys Asp Phe Leu Lys Glu Val Asp Ser Leu Val Leu
405 410 415
Asn Thr Thr Leu Ala Phe Arg Lys Leu Leu Ile Thr Asn Val Tyr Phe
420 425 430
Glu Ser Lys Arg Leu Val Glu Gln Lys Trp Lys Glu Leu Met Gln Glu
435 440 445
Glu Ala Ala Ala Gln Ser Glu Ala Ile Pro Pro Leu Ser Pro Ala Ala
450 455 460
Pro Thr Lys Gly Glu
465
<210> 583
<211> 416
<212> PRT
<213> 布氏锥虫指名亚种(Trypanosoma brucei brucei)
<400> 583
Met Leu Arg Arg Leu Gly Val Arg His Phe Arg Arg Thr Pro Leu Leu
1 5 10 15
Phe Val Gly Gly Asp Gly Ser Ile Phe Glu Arg Tyr Thr Glu Ile Asp
20 25 30
Asn Ser Asn Glu Arg Arg Ile Asn Ala Leu Lys Gly Cys Gly Met Phe
35 40 45
Glu Asp Glu Trp Ile Ala Thr Glu Lys Val His Gly Ala Asn Phe Gly
50 55 60
Ile Tyr Ser Ile Glu Gly Glu Lys Met Ile Arg Tyr Ala Lys Arg Ser
65 70 75 80
Gly Ile Met Pro Pro Asn Glu His Phe Phe Gly Tyr His Ile Leu Ile
85 90 95
Pro Glu Leu Gln Arg Tyr Val Thr Ser Ile Arg Glu Met Leu Cys Glu
100 105 110
Lys Gln Lys Lys Lys Leu His Val Val Leu Ile Asn Gly Glu Leu Phe
115 120 125
Gly Gly Lys Tyr Asp His Pro Ser Val Pro Lys Thr Arg Lys Thr Val
130 135 140
Met Val Ala Gly Lys Pro Arg Thr Ile Ser Ala Val Gln Thr Asp Ser
145 150 155 160
Phe Pro Gln Tyr Ser Pro Asp Leu His Phe Tyr Ala Phe Asp Ile Lys
165 170 175
Tyr Lys Glu Thr Glu Gly Gly Asp Tyr Thr Thr Leu Val Tyr Asp Glu
180 185 190
Ala Ile Glu Leu Phe Gln Arg Val Pro Gly Leu Leu Tyr Ala Arg Ala
195 200 205
Val Ile Arg Gly Pro Met Ser Lys Val Ala Ala Phe Asp Val Glu Arg
210 215 220
Phe Val Thr Thr Ile Pro Pro Leu Val Gly Met Gly Asn Tyr Pro Leu
225 230 235 240
Thr Gly Asn Trp Ala Glu Gly Leu Val Val Lys His Ser Arg Leu Gly
245 250 255
Met Ala Gly Phe Asp Pro Lys Gly Pro Thr Val Leu Lys Phe Lys Cys
260 265 270
Thr Ala Phe Gln Glu Ile Ser Thr Asp Arg Ala Gln Gly Pro Arg Val
275 280 285
Asp Glu Met Arg Asn Val Arg Arg Asp Ser Ile Asn Arg Ala Gly Val
290 295 300
Gln Leu Pro Asp Leu Glu Ser Ile Val Gln Asp Pro Ile Gln Leu Glu
305 310 315 320
Ala Ser Lys Leu Leu Leu Asn His Val Cys Glu Asn Arg Leu Lys Asn
325 330 335
Val Leu Ser Lys Ile Gly Thr Glu Pro Phe Glu Lys Glu Glu Met Thr
340 345 350
Pro Asp Gln Leu Ala Thr Leu Leu Ala Lys Asp Ala Leu Lys Asp Phe
355 360 365
Leu Lys Asp Thr Glu Pro Ser Ile Val Asn Ile Pro Val Leu Ile Arg
370 375 380
Lys Asp Leu Thr Arg Tyr Val Ile Phe Glu Ser Arg Arg Leu Val Cys
385 390 395 400
Ser Gln Trp Lys Asp Ile Leu Lys Arg Gln Ser Pro Asp Phe Ser Glu
405 410 415
<210> 584
<211> 374
<212> PRT
<213> 肠杆菌噬菌体(Enterobacteria phage)T4
<400> 584
Met Gln Glu Leu Phe Asn Asn Leu Met Glu Leu Cys Lys Asp Ser Gln
1 5 10 15
Arg Lys Phe Phe Tyr Ser Asp Asp Val Ser Ala Ser Gly Arg Thr Tyr
20 25 30
Arg Ile Phe Ser Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Leu Pro
35 40 45
Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Gly Glu Lys
50 55 60
Pro Val Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Asn
65 70 75 80
Glu Asn Pro Phe Thr Met Asn Ile Asp Leu Asn Asp Val Asp Tyr Ile
85 90 95
Leu Thr Lys Glu Asp Gly Ser Leu Val Ser Thr Tyr Leu Asp Gly Asp
100 105 110
Glu Ile Leu Phe Lys Ser Lys Gly Ser Ile Lys Ser Glu Gln Ala Leu
115 120 125
Met Ala Asn Gly Ile Leu Met Asn Ile Asn His His Arg Leu Arg Asp
130 135 140
Arg Leu Lys Glu Leu Ala Glu Asp Gly Phe Thr Ala Asn Phe Glu Phe
145 150 155 160
Val Ala Pro Thr Asn Arg Ile Val Leu Ala Tyr Gln Glu Met Lys Ile
165 170 175
Ile Leu Leu Asn Val Arg Glu Asn Glu Thr Gly Glu Tyr Ile Ser Tyr
180 185 190
Asp Asp Ile Tyr Lys Asp Ala Thr Leu Arg Pro Tyr Leu Val Glu Arg
195 200 205
Tyr Glu Ile Asp Ser Pro Lys Trp Ile Glu Glu Ala Lys Asn Ala Glu
210 215 220
Asn Ile Glu Gly Tyr Val Ala Val Met Lys Asp Gly Ser His Phe Lys
225 230 235 240
Ile Lys Ser Asp Trp Tyr Val Ser Leu His Ser Thr Lys Ser Ser Leu
245 250 255
Asp Asn Pro Glu Lys Leu Phe Lys Thr Ile Ile Asp Gly Ala Ser Asp
260 265 270
Asp Leu Lys Ala Met Tyr Ala Asp Asp Glu Tyr Ser Tyr Arg Lys Ile
275 280 285
Glu Ala Phe Glu Thr Thr Tyr Leu Lys Tyr Leu Asp Arg Ala Leu Phe
290 295 300
Leu Val Leu Asp Cys His Asn Lys His Cys Gly Lys Asp Arg Lys Thr
305 310 315 320
Tyr Ala Met Glu Ala Gln Gly Val Ala Lys Gly Ala Gly Met Asp His
325 330 335
Leu Phe Gly Ile Ile Met Ser Leu Tyr Gln Gly Tyr Asp Ser Gln Glu
340 345 350
Lys Val Met Cys Glu Ile Glu Gln Asn Phe Leu Lys Asn Tyr Lys Lys
355 360 365
Phe Ile Pro Glu Gly Tyr
370
<210> 585
<211> 694
<212> PRT
<213> 苜蓿尺蠖(Autographa californica)核型多角体病毒
<400> 585
Met Leu His Val Ser Arg Leu Leu Ala Asn Gly Gly Val Lys Asn Leu
1 5 10 15
Cys Asp Lys Phe Lys Val Lys Ile Lys Asn Tyr Thr Glu His Asp Leu
20 25 30
Met Val Leu Asn Tyr Glu Ser Phe Glu Arg Asp Arg Asp His Pro Val
35 40 45
Val Val Glu Cys Arg Gly Leu Ile Leu Asn Ser Arg Thr Tyr Ala Val
50 55 60
Val Ser Arg Ser Phe Asp Arg Phe Phe Asn Phe Gln Glu Leu Leu Gln
65 70 75 80
Asn Ile Gly Gly Glu Asp Ala His His Lys Leu Phe Gln Ser Lys Glu
85 90 95
Asn Phe Lys Phe Tyr Glu Lys Ile Asp Gly Ser Leu Ile Lys Ile Tyr
100 105 110
Lys Tyr Asn Gly Glu Trp His Ala Ser Thr Arg Gly Ser Ala Phe Ala
115 120 125
Glu Asn Leu Cys Val Ser Asp Val Thr Phe Lys Arg Leu Val Leu Gln
130 135 140
Ala Leu Gln Leu Asp Glu Ala His Asn Gln Phe Gln Ala Leu Cys Asn
145 150 155 160
Glu Tyr Leu Asp Cys Ala Ser Thr His Met Phe Glu Leu Thr Ser Lys
165 170 175
His Asn Arg Ile Val Thr Val Tyr Asp Glu Gln Pro Thr Leu Trp Tyr
180 185 190
Leu Ala Ser Arg Asn Asn Glu Thr Gly Asp Tyr Phe Tyr Cys Ser Asn
195 200 205
Leu Pro Phe Cys Lys Tyr Pro Lys Cys Tyr Glu Phe Thr Ser Val Gln
210 215 220
Glu Cys Val Glu His Ala Ala Gln Leu Lys Asn Leu Glu Glu Gly Phe
225 230 235 240
Val Val Tyr Asp Lys Asn Asn Ala Pro Leu Cys Lys Ile Lys Ser Asp
245 250 255
Val Tyr Leu Asn Met His Lys Asn Gln Ser Arg Ala Glu Asn Pro Thr
260 265 270
Lys Leu Ala Gln Leu Val Ile Asn Gly Glu His Asp Asp Phe Leu Ala
275 280 285
Leu Phe Pro His Leu Lys Ser Val Ile Lys Pro Tyr Val Asp Ala Arg
290 295 300
Asn Thr Phe Thr Asn Glu Ser Thr Ile Asn Ile Met Val Ser Gly Leu
305 310 315 320
Thr Leu Asn Gln Gln Arg Phe Asn Glu Leu Val Gln Thr Leu Pro Trp
325 330 335
Lys Cys Leu Ala Tyr Arg Cys Arg Lys Ala Gln Thr Ile Asp Val Glu
340 345 350
Ser Glu Phe Leu Lys Leu Thr Glu Pro Glu Lys Ile Lys Met Ile Lys
355 360 365
Asn Ile Ile Lys Phe Val Ser Thr Lys Gln Ala Leu Asn Asn Lys Leu
370 375 380
Ala Pro Thr Ile Lys Leu Pro Ser Ser Lys Gln Leu Leu Val Leu Ile
385 390 395 400
Gly Ile Ser Gly Ser Gly Lys Ser Thr Tyr Ala Lys Ser Leu Lys Gly
405 410 415
Tyr Thr Glu Ile Asn Arg Asp Asp Val Arg Val Lys Leu Phe Leu Asn
420 425 430
Gly Asp Tyr Thr Lys Leu Asn Ala Phe Tyr Asn Gln Ser Arg Lys Cys
435 440 445
Arg Gln Thr Lys Glu Glu Gln Ile Thr Lys Met Cys Ile Glu Gln Phe
450 455 460
Leu Lys Ala Ala Lys Cys Gly Ala Asn Val Val Val Ser Asp Thr Asn
465 470 475 480
Leu Asn Thr Gln Ser Val Asp Met Trp Gln Lys Met Ala Ala Thr His
485 490 495
Asn Tyr His Phe Leu Thr Arg Leu Met Asp Val Ser Leu Glu Thr Ala
500 505 510
Leu Glu Arg Asn Tyr Lys Arg Ser Asp Lys Phe Pro Leu Asn Pro Glu
515 520 525
Thr Ile Lys Lys Gln Tyr Lys Lys Phe Leu Lys Val Asn Asn Phe Glu
530 535 540
Tyr Tyr Val Pro Val Gly Asp Lys Phe Pro Arg Ala Val Leu Cys Asp
545 550 555 560
Leu Asp Gly Thr Val Ala Leu Pro Thr Asn Arg Ser Phe Tyr Asp Phe
565 570 575
Asp Asn Arg Val Ala Gln Asp Glu Ala Arg Leu Asp Val Ile Thr Cys
580 585 590
Val Lys Tyr Leu Ala Asn Cys His Asp Ala Ile Ile Val Phe Met Ser
595 600 605
Gly Arg Ser Val Ile Cys Glu Gln Pro Thr Arg Asn Trp Ile Glu Lys
610 615 620
Tyr Phe Asp Ile Lys Ser Tyr Lys Leu Phe Met Arg Pro Ser Asp Asp
625 630 635 640
Thr Cys Lys Asp Tyr Leu Leu Lys Leu Lys Leu Phe Asn Asn Tyr Ile
645 650 655
Arg Gly Lys Tyr Asn Val Ile Ala Val Phe Asp Asp Arg Pro Cys Val
660 665 670
Val Arg Met Trp Gln Asp Leu Lys Ile Pro Thr Val Phe Asn Val Cys
675 680 685
Arg Asp Tyr Leu Glu Phe
690
<210> 586
<211> 184
<212> PRT
<213> 激烈火球菌(Pyrococcus furiosus)
<400> 586
Met Arg Ala Phe Ile Ala Ile Asp Val Ser Glu Ser Val Arg Asp Ala
1 5 10 15
Leu Val Arg Ala Gln Asp Tyr Ile Gly Ser Lys Glu Ala Lys Ile Lys
20 25 30
Phe Val Glu Arg Glu Asn Phe His Ile Thr Leu Lys Phe Leu Gly Glu
35 40 45
Ile Thr Glu Glu Gln Ala Glu Glu Ile Lys Lys Ile Leu Glu Lys Ile
50 55 60
Ala Lys Lys Tyr Lys Lys His Glu Val Asn Val Arg Gly Ile Gly Val
65 70 75 80
Phe Pro Asn Pro Asn Tyr Val Arg Val Ile Trp Ala Gly Val Glu Asn
85 90 95
Asp Glu Ile Ile Lys Lys Ile Ala Lys Glu Ile Asp Asp Glu Leu Ala
100 105 110
Lys Leu Gly Phe Lys Lys Glu Gly Asn Phe Val Ala His Ile Thr Leu
115 120 125
Gly Arg Val Lys Phe Val Lys Asp Lys Leu Gly Leu Ala Met Lys Leu
130 135 140
Lys Glu Leu Ala Asn Glu Asp Phe Gly Ser Phe Ile Val Glu Ala Ile
145 150 155 160
Glu Leu Lys Lys Ser Thr Leu Thr Pro Lys Gly Pro Ile Tyr Glu Thr
165 170 175
Leu Ala Arg Phe Glu Leu Ser Glu
180
<210> 587
<211> 176
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 587
Met Ser Glu Pro Gln Arg Leu Phe Phe Ala Ile Asp Leu Pro Ala Glu
1 5 10 15
Ile Arg Glu Gln Ile Ile His Trp Arg Ala Thr His Phe Pro Pro Glu
20 25 30
Ala Gly Arg Pro Val Ala Ala Asp Asn Leu His Leu Thr Leu Ala Phe
35 40 45
Leu Gly Glu Val Ser Ala Glu Lys Glu Lys Ala Leu Ser Leu Leu Ala
50 55 60
Gly Arg Ile Arg Gln Pro Gly Phe Thr Leu Thr Leu Asp Asp Ala Gly
65 70 75 80
Gln Trp Leu Arg Ser Arg Val Val Trp Leu Gly Met Arg Gln Pro Pro
85 90 95
Arg Gly Leu Ile Gln Leu Ala Asn Met Leu Arg Ser Gln Ala Ala Arg
100 105 110
Ser Gly Cys Phe Gln Ser Asn Arg Pro Phe His Pro His Ile Thr Leu
115 120 125
Leu Arg Asp Ala Ser Glu Ala Val Thr Ile Pro Pro Pro Gly Phe Asn
130 135 140
Trp Ser Tyr Ala Val Thr Glu Phe Thr Leu Tyr Ala Ser Ser Phe Ala
145 150 155 160
Arg Gly Arg Thr Arg Tyr Thr Pro Leu Lys Arg Trp Ala Leu Thr Gln
165 170 175
<210> 588
<211> 183
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 588
Met Pro Asp Ile Arg Pro His Tyr Phe Ile Gly Val Pro Ile Pro Glu
1 5 10 15
Gly Ile Ala Asn Pro Ile Tyr Gln Ala Ala Lys Asn Glu Pro Ile Leu
20 25 30
Thr Phe Gln Lys Trp Val His Pro Leu Asp Tyr His Ile Thr Leu Ile
35 40 45
Phe Leu Gly Ala Ala Asp Glu Thr Gln Ile Lys Lys Leu Glu Gly Ser
50 55 60
Leu Ala Glu Ile Ala Ser Glu Ile Asp Pro Phe Ser Ile Lys Phe Gly
65 70 75 80
Lys Ile Asp Val Phe Gly Asp Arg Arg Lys Pro Arg Val Leu His Leu
85 90 95
Glu Pro Lys Lys Asn Lys Thr Leu Asp Arg Leu Arg Glu His Thr Lys
100 105 110
Gln Ala Val Leu Gln Ala Gly Phe Gln Val Glu Lys Arg Pro Tyr His
115 120 125
Pro His Met Thr Leu Ala Arg Lys Trp Thr Gly Glu Asp Gly Phe Pro
130 135 140
Ala His Val Pro Phe Glu Ser Gly Glu Val Ser Met Met Ala Glu Arg
145 150 155 160
Phe Ser Leu Phe Gln Ile His Leu Asn Gln Ser Pro Lys Tyr Glu Glu
165 170 175
Ile Phe Lys Phe Gln Leu Ser
180
<210> 589
<211> 228
<212> RNA
<213> 未知
<220>
<223> 合成的
<400> 589
aucuaaguua gguuguaaac auauuagaga cguuguucau uuggaagagu uacgcgaguc 60
uuugugugau guagcuagua accuaaauaa uugugcguau uuuucacagu uagaugaggc 120
cguugccgag guucauaaga ccgcgguagg cgguucguuu gcuuuuugua guauaauuaa 180
auauuuguca gauaagagau uguuuagaga uuuguucuuu guuugaua 228
<210> 590
<211> 121
<212> RNA
<213> 木槿褪绿环斑病毒(Hibiscus chlorotic ringspot virus)
<400> 590
uagcuuauuu ggguucuuua ucacuguccu gauuaaggcu gaaucagaac accaucacuu 60
ccacucacac gacaguagua agacacagaa cauaguaguu aauacuggaa aguaacccac 120
c 121
<210> 591
<211> 147
<212> RNA
<213> 玉蜀黍(Zea mays)
<400> 591
agcacaacau uucaaccaga aacacuagcc gaagcaaauc cauuccacaa gcaccuggug 60
ggaucaucuc aucaucagaa accaagagag agauuccgug uccgcuuguu guaguagauu 120
gugaggacug aggaccgaga agcagcc 147
<210> 592
<211> 1653
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 592
auggaagacg ccaaaaacau aaagaaaggc ccggcgccau ucuauccgcu ggaagaugga 60
accgcuggag agcaacugca uaaggcuaug aagagauacg cccugguucc uggaacaauu 120
gcuuuuacag augcacauau cgagguggac aucacuuacg cugaguacuu cgaaaugucc 180
guucgguugg cagaagcuau gaaacgauau gggcugaaua caaaucacag aaucgucgua 240
ugcagugaaa acucucuuca auucuuuaug ccgguguugg gcgcguuauu uaucggaguu 300
gcaguugcgc ccgcgaacga cauuuauaau gaacgugaau ugcucaacag uaugggcauu 360
ucgcagccua ccgugguguu cguuuccaaa aagggguugc aaaaaauuuu gaacgugcaa 420
aaaaagcucc caaucaucca aaaaauuauu aucauggauu cuaaaacgga uuaccaggga 480
uuucagucga uguacacguu cgucacaucu caucuaccuc ccgguuuuaa ugaauacgau 540
uuugugccag aguccuucga uagggacaag acaauugcac ugaucaugaa cuccucugga 600
ucuacugguc ugccuaaagg ugucgcucug ccucauagaa cugccugcgu gagauucucg 660
caugccagag auccuauuuu uggcaaucaa aucauuccgg auacugcgau uuuaaguguu 720
guuccauucc aucacgguuu uggaauguuu acuacacucg gauauuugau auguggauuu 780
cgagucgucu uaauguauag auuugaagaa gagcuguuuc ugaggagccu ucaggauuac 840
aagauucaaa gugcgcugcu ggugccaacc cuauucuccu ucuucgccaa aagcacucug 900
auugacaaau acgauuuauc uaauuuacac gaaauugcuu cugguggcgc uccccucucu 960
aaggaagucg gggaagcggu ugccaagagg uuccaucugc cagguaucag gcaaggauau 1020
gggcucacug agacuacauc agcuauucug auuacacccg agggggauga uaaaccgggc 1080
gcggucggua aaguuguucc auuuuuugaa gcgaagguug uggaucugga uaccgggaaa 1140
acgcugggcg uuaaucaaag aggcgaacug ugugugagag guccuaugau uauguccggu 1200
uauguaaaca auccggaagc gaccaacgcc uugauugaca aggauggaug gcuacauucu 1260
ggagacauag cuuacuggga cgaagacgaa cacuucuuca ucguugaccg ccugaagucu 1320
cugauuaagu acaaaggcua ucagguggcu cccgcugaau uggaauccau cuugcuccaa 1380
caccccaaca ucuucgacgc uggugucgca ggucuucccg acgaugacgc cggugaacuu 1440
cccgccgccg uuguuguuuu ggagcacgga aagacgauga cggaaaaaga gaucguggau 1500
uacgucgcca gucaaguaac aaccgcgaaa aaguugcgcg gaggaguugu guuuguggac 1560
gaaguaccga aaggucuuac cggaaaacuc gacgcaagaa aaaucagaga gauccucaua 1620
aaggccaaga agggcggaaa gaucgccgug uaa 1653
<210> 593
<211> 790
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 593
gggaaaaaaa ugccgucggu aucuaaguua gguuguaaac auauuagaga cguuguucau 60
uuggaagagu uacgcgaguc uuugugugau guagcuagua accuaaauaa uugugcguau 120
uuuucacagu uagaugaggc cguugccgag guucauaaga ccgcgguagg cgguucguuu 180
gcuuuuugua guauaauuaa auauuuguca gauaagagau uguuuagaga uuuguucuuu 240
guuugauagc caccaugguc uucacacucg aagauuucgu uggggacugg cgacagacag 300
ccggcuacaa ccuggaccaa guccuugaac agggaggugu guccaguuug uuucagaauc 360
ucgggguguc cguaacuccg auccaaagga uuguccugag cggugaaaau gggcugaaga 420
ucgacaucca ugucaucauc ccguaugaag gucugagcgg cgaccaaaug ggccagaucg 480
aaaaaauuuu uaagguggug uacccugugg augaucauca cuuuaaggug auccugcacu 540
auggcacacu gguaaucgac gggguuacgc cgaacaugau cgacuauuuc ggacggccgu 600
augaaggcau cgccguguuc gacggcaaaa agaucacugu aacagggacc cuguggaacg 660
gcaacaaaau uaucgacgag cgccugauca accccgacgg cucccugcug uuccgaguaa 720
ccaucaacgg agugaccggc uggcggcugu gcgaacgcau ucuggcguaa accgacggca 780
aaaaaaaaaa 790
<210> 594
<211> 1876
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 594
gggaaaaaaa ugccgucggu agcacaacau uucaaccaga aacacuagcc gaagcaaauc 60
cauuccacaa gcaccuggug ggaucaucuc aucaucagaa accaagagag agauuccgug 120
uccgcuuguu guaguagauu gugaggacug aggaccgaga agcagccgcc accaaugaga 180
gaccuuuuaa aaggucucua augauggagg acgccaagaa caucaagaag ggccccgccc 240
ccuucuaccc ccuggaggac ggcaccgccg gcgagcagcu gcacaaggcc augaagcggu 300
acgcccuggu gcccggcacc aucgccuuca ccgacgccca caucgaggug gacaucaccu 360
acgccgagua cuucgagaug agcgugcggc uggccgaggc caugaagcgg uacggccuga 420
acaccaacca ccggaucgug gugugcagcg agaacagccu gcaguucuuc augcccgugc 480
ugggcgcccu guucaucggc guggccgugg cccccgccaa cgacaucuac aacgagcggg 540
agcugcugaa cagcaugggc aucagccagc ccaccguggu guucgugagc aagaagggcc 600
ugcagaagau ccugaacgug cagaagaagc ugcccaucau ccagaagauc aucaucaugg 660
acagcaagac cgacuaccag ggcuuccaga gcauguacac cuucgugacc agccaccugc 720
cccccggcuu caacgaguac gacuucgugc ccgagagcuu cgaccgggac aagaccaucg 780
cccugaucau gaacagcagc ggcagcaccg gccugcccaa gggcguggcc cugccccacc 840
ggaccgccug cgugcgguuc agccacgccc gggaccccau cuucggcaac cagaucaucc 900
ccgacaccgc cauccugagc guggugcccu uccaccacgg cuucggcaug uucaccaccc 960
ugggcuaccu gaucugcggc uuccgggugg ugcugaugua ccgguucgag gaggagcugu 1020
uccugcggag ccugcaggac uacaagaucc agagcgcccu gcuggugccc acccuguuca 1080
gcuucuucgc caagagcacc cugaucgaca aguacgaccu gagcaaccug cacgagaucg 1140
ccagcggcgg cgccccccug agcaaggagg ugggcgaggc cguggccaag cgguuccacc 1200
ugcccggcau ccggcagggc uacggccuga ccgagaccac cagcgccauc cugaucaccc 1260
ccgagggcga cgacaagccc ggcgccgugg gcaagguggu gcccuucuuc gaggccaagg 1320
ugguggaccu ggacaccggc aagacccugg gcgugaacca gcggggcgag cugugcgugc 1380
ggggccccau gaucaugagc ggcuacguga acaaccccga ggccaccaac gcccugaucg 1440
acaaggacgg cuggcugcac agcggcgaca ucgccuacug ggacgaggac gagcacuucu 1500
ucaucgugga ccggcugaag agccugauca aguacaaggg cuaccaggug gcccccgccg 1560
agcuggagag cauccugcug cagcacccca acaucuucga cgccggcgug gccggccugc 1620
ccgacgacga cgccggcgag cugcccgccg ccgugguggu gcuggagcac ggcaagacca 1680
ugaccgagaa ggagaucgug gacuacgugg ccagccaggu gaccaccgcc aagaagcugc 1740
ggggcggcgu gguguucgug gacgaggugc ccaagggccu gaccggcaag cuggacgccc 1800
ggaagauccg ggagauccug aucaaggcca agaagggcgg caagaucgcc gugugaaccg 1860
acggcaaaaa aaaaaa 1876
<210> 595
<211> 49
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 595
tttcccctga tgagtccgtg aggacgaaac gagtaagctc gtcgggaaa 49
<210> 596
<211> 20
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 596
gggaaaaaaa tgccgtcggt 20
<210> 597
<211> 20
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 597
accgacggca aaaaaaaaaa 20
<210> 598
<211> 464
<212> DNA
<213> 脑心肌炎病毒(encephalomyocarditis virus)
<400> 598
gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct 60
cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc 120
ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga 180
caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc 240
ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt 300
attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg 360
gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc taggcccccc 420
gaaccacggg gacgtggttt tcctttgaaa aacacgatga taat 464
<210> 599
<211> 516
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 599
atggtcttca cactcgaaga tttcgttggg gactggcgac agacagccgg ctacaacctg 60
gaccaagtcc ttgaacaggg aggtgtgtcc agtttgtttc agaatctcgg ggtgtccgta 120
actccgatcc aaaggattgt cctgagcggt gaaaatgggc tgaagatcga catccatgtc 180
atcatcccgt atgaaggtct gagcggcgac caaatgggcc agatcgaaaa aatttttaag 240
gtggtgtacc ctgtggatga tcatcacttt aaggtgatcc tgcactatgg cacactggta 300
atcgacgggg ttacgccgaa catgatcgac tatttcggac ggccgtatga aggcatcgcc 360
gtgttcgacg gcaaaaagat cactgtaaca gggaccctgt ggaacggcaa caaaattatc 420
gacgagcgcc tgatcaaccc cgacggctcc ctgctgttcc gagtaaccat caacggagtg 480
accggctggc ggctgtgcga acgcattctg gcgtaa 516
<210> 600
<211> 68
<212> DNA
<213> 未知
<220>
<223> 合成的
<400> 600
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60
aatgggac 68
<210> 601
<211> 683
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 601
gggaaaaaaa ugccgucggu uagcuuauuu ggguucuuua ucacuguccu gauuaaggcu 60
gaaucagaac accaucacuu ccacucacac gacaguagua agacacagaa cauaguaguu 120
aauacuggaa aguaacccac cgccaccaug gucuucacac ucgaagauuu cguuggggac 180
uggcgacaga cagccggcua caaccuggac caaguccuug aacagggagg uguguccagu 240
uuguuucaga aucucggggu guccguaacu ccgauccaaa ggauuguccu gagcggugaa 300
aaugggcuga agaucgacau ccaugucauc aucccguaug aaggucugag cggcgaccaa 360
augggccaga ucgaaaaaau uuuuaaggug guguacccug uggaugauca ucacuuuaag 420
gugauccugc acuauggcac acugguaauc gacgggguua cgccgaacau gaucgacuau 480
uucggacggc cguaugaagg caucgccgug uucgacggca aaaagaucac uguaacaggg 540
acccugugga acggcaacaa aauuaucgac gagcgccuga ucaaccccga cggcucccug 600
cuguuccgag uaaccaucaa cggagugacc ggcuggcggc ugugcgaacg cauucuggcg 660
uaaaccgacg gcaaaaaaaa aaa 683
<210> 602
<211> 47
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 602
ccggtcccaa gcccggataa aatccgaggg ggcgggaaac cgcctaa 47
<210> 603
<211> 55
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 603
aacactgcca atgccggtcc caagcccgga taaaagtgga gggaaagggg atagt 55
<210> 604
<211> 27
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 604
ggatgtgttc cctaggaggg tgggtgt 27
<210> 605
<211> 34
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 605
acacctctcc ccctcccagg tactatcccc tttc 34
<210> 606
<211> 53
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 606
ttggaccaat cgtggcgtgt cggcctgctt cggcaggcac tggcgccgtc cag 53
<210> 607
<211> 29
<212> DNA
<213> 卫星烟草坏死病毒(Satellite tobacco necrosis virus)
<400> 607
agtaaagaca ggaaacttta ctgactaac 29
<210> 608
<211> 122
<212> DNA
<213> 未知
<220>
<223> 合成的
<400> 608
agatatcgac ctgcctgacc aggctgagat tgcgctagcc ggcgtagttg gtatctctcg 60
cgcaagcggg tttgaaggtg cggcctatct taggggggta aattgtaact tcgcacaaag 120
gc 122
<210> 609
<211> 38
<212> DNA
<213> 烟草坏死病毒(Tobacco necrosis virus)
<400> 609
gatacctaac cagtgtctca gtgattaagt aatcagct 38
<210> 610
<211> 140
<212> DNA
<213> 大麦黄矮病毒(Barley yellow dwarf virus)
<400> 610
gtgaagattg accatctcac aaaagctgtt acgtgcttgt aacacactac gcgcccgttt 60
tgtattcggg aagtagttgc gaaaacggtc cccttattgc ctgacaagct aagggccacc 120
cttctttccc caccgccatc 140
<210> 611
<211> 42
<212> DNA
<213> 人工
<220>
<223> 合成的
<400> 611
caaccacaac gctctaacgc aatcaatcta cattatatta aa 42
<210> 612
<211> 619
<212> DNA
<213> 卫星烟草坏死病毒(Satellite tobacco necrosis virus)
<400> 612
tcccagaggt tcacaatgtt agtgatgggg cgctgaaaga tgcgtagcta cccttctgga 60
gccacttcct ggtggtaagc agaaatccaa gggtacggtg gtacggtgga aagcagtccc 120
agctctgcat tgggaaccgg cttacaccca gcttagggct aaagtgtact acttgctcat 180
ttgtagtcta aatgagacgt tggcctcgac gtgtcgaggt ggcctaaggg attggaaccc 240
ctgatggtcg tagtcgaatt tcccgtgttt cattccgagt ctcttggtca taatgccatt 300
agtaggtcta gcactcaacg taacttcaaa gatatcctcc ttgcaacaag aatatgtgcg 360
ccgtctgtgt ttaaagcggt atattaagtg cgccggcata tcgttgtttg gaccagggcc 420
ccacgccggt tggtacccgg gtggcttccc ctcgttcaca gggctttagg agatgataag 480
gtatagttat tagacaaatg cggacaaacc tgaaaagctc gctagtggtg ggctggccaa 540
gcgaagaacc tcatccaggt atagttctac atgggaaatt tggtaccatc caaacttcta 600
tgaagtcctc gactacccc 619
<210> 613
<211> 221
<212> DNA
<213> 未知
<220>
<223> 合成的
<400> 613
gacaaactct ccgcctaatg tctgatgatg tgaggaacgt ggactgtgat gtggtggtgc 60
ggtaccatgg ctggtcacca tggtaatgcg tagggcaaca cagttcatta agactcactg 120
atgatggcac taggcacggt tcacccccat ccttcgggag ggctataggg ggtgaccggg 180
ttacaccacc ggaagaccgg aacattgcct ttgggcagcc c 221
<210> 614
<211> 306
<212> DNA
<213> 烟草坏死病毒(Tobacco necrosis virus)
<400> 614
ttgctttcat agatccgtct tccgggagac gttaagaaga cacccgataa aaatagtaag 60
tagagttgtg gcgtgacaac ccacaactgc atctctttgc ttatctaatt acaatatatg 120
ttgacgtaca agccggatcc tgggaaacag gtttaacggg ctcactgtgg tggtgggccg 180
tcgatacact tgtatgtgcc ccaatattgg ttgtcgataa gcgtcctgac atggctccat 240
gcaacagcat gggggggtcc agagtcagtc ccctctttat ttacctagag atctctctag 300
gaaccc 306
<210> 615
<211> 869
<212> DNA
<213> 大麦黄矮病毒(Barley yellow dwarf virus)
<400> 615
agtgaagaca acaccactag cacaaatcgg atcctgggaa acaggcagaa cttcggttcg 60
taagctcggg taggccgtca acctaccgcc gtatcgtatt gtgtttggcc gatggaggat 120
cttcacgtta tcgccgtttg tattcttgct ttgactgtgc tctctggggt aggcgctgtt 180
ttgagttgct gccgttggtg ctgcagcaat ccttttcctc cctccctctc ttctgttcaa 240
gcaaaagact ctcgatctgt gcgagagaca atcaaaaata tcgagggagc ttcggctcag 300
tgaggggatt aacgaccccc agtaatggcc ggtcctggcg gacataaata acccgctata 360
ggacgaagtg gtagccacca ctgatcaaat ggcaaacatg cttctgtgtt gtacactgcc 420
ccggagccta ccgggtcaac aaggctatcc caccaacccg atgaaatgag ggtggagtga 480
gcggagtggg tgacttcgtg atgtacaccc gatcgtcagg attgaagacg ttaaaactcg 540
acgacctggt acaagtcgtt aaactgactc gggtggatac accacacccg gcccagcatg 600
ttggcatacc cacgatacga aacgtgggtc tcttggagcc actacctgtg atgcaaggta 660
gggtatgagt cttagcaagc tctgagccag gagatggaca taaaccatag caatccaacg 720
tgtaaccgca atggggcaaa caacaggtga accgtgtcca cgggcctggt taccgaaagg 780
aaagccagta tccaacacag caatgtgttg ggggtcacac cttcggggta ctcttaacgc 840
tgacactcga aagagcagtt cggcaaccc 869
<210> 616
<211> 183
<212> PRT
<213> 豇豆花叶病毒(Cowpea mosaic virus)
<400> 616
Thr Thr Ala Ala Cys Thr Cys Thr Gly Gly Thr Thr Thr Cys Ala Thr
1 5 10 15
Thr Ala Ala Ala Thr Thr Thr Thr Cys Thr Thr Thr Ala Gly Thr Thr
20 25 30
Thr Gly Ala Ala Thr Thr Thr Ala Cys Thr Gly Thr Thr Ala Thr Thr
35 40 45
Cys Gly Gly Thr Gly Thr Gly Cys Ala Thr Thr Thr Cys Thr Ala Thr
50 55 60
Gly Thr Thr Thr Gly Gly Thr Gly Ala Gly Cys Gly Gly Thr Thr Thr
65 70 75 80
Thr Cys Thr Gly Thr Gly Cys Thr Cys Ala Gly Ala Gly Thr Gly Thr
85 90 95
Gly Thr Thr Thr Ala Thr Thr Thr Thr Ala Thr Gly Thr Ala Ala Thr
100 105 110
Thr Thr Ala Ala Thr Thr Thr Cys Thr Thr Thr Gly Thr Gly Ala Gly
115 120 125
Cys Thr Cys Cys Thr Gly Thr Thr Thr Ala Gly Cys Ala Gly Gly Thr
130 135 140
Cys Gly Thr Cys Cys Cys Thr Thr Cys Ala Gly Cys Ala Ala Gly Gly
145 150 155 160
Ala Cys Ala Cys Ala Ala Ala Ala Gly Ala Thr Thr Thr Thr Ala Ala
165 170 175
Thr Thr Thr Thr Ala Thr Thr
180
<210> 617
<211> 41
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 617
tcgcacaaga aaataaaaga tttgtagaat caactaagaa a 41
<210> 618
<211> 22
<212> DNA
<213> 烟草花叶病毒(Tobacco mosaic virus)
<400> 618
acaattacta tttacaatta ca 22
<210> 619
<211> 137
<212> DNA
<213> 芜菁皱缩病毒(Turnip crinkle virus)
<400> 619
ggtaatatat gctttctaca actctctctc actggtcctc ctactttgtc atctgattcc 60
tgaaatcaaa ccgattcaca catcctacaa cacacacgac tcatcgaagc agcaacacat 120
aagcatcaac actggaa 137
<210> 620
<211> 255
<212> DNA
<213> 芜菁皱缩病毒(Turnip crinkle virus)
<400> 620
tacggtaata gtgtagtctt ctcatcttag tagttagctc tctcttatat taagaaaaga 60
aaacaaaaac ccccaggtcg ctttattttg acctgtgtta gggaccaaaa acggtggcag 120
cactgtctag ctgcgggcat tagactggaa aactagtgct ctttgggtaa ccactaaaat 180
cccgaaaggg tgggctgtgg tgaccttccg aactaaaaga tagcctccct cctcgcgcgg 240
gggggggtcc tgccc 255
<210> 621
<211> 651
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 621
gggaauuccu agggaacccg gucccaagcc cggauaaaau ccgagggggc gggaaaccgc 60
cuaaggaugu guucccuagg agggugggug uaccucuuuu ggaccaaucg uggcgugucg 120
gccugcuucg gcaggcacug gcgccgucca ggagagcaaa cacacgcucg gacgcauauu 180
acacauguuc auacacuuaa uacucgcugu uuugaauuga uguuuuagga auauauaugu 240
agaguagaaa gguagcagca ugguucacag gucgugauau gauucaauua gcuuccgacu 300
cauucaucca aauaccgagu cgccaaaauu caaacuagac ucguuaaaug aaugaaugau 360
gcgguagaca aauuggauca uugauucucu uugauccaug cagcuaccuu uccacucucu 420
cuuuuguauu ccaauuuucu ugauuaaucu uuccugcaca aaaacaugcu ugauccacua 480
agugacauau augcugccuu cguauauaua guucugguaa aauuaacauu uuggguuuau 540
cuuuauuuaa ggcaucgcca ugacaccucu cccccuccca gguacuaucc ccuuucaaca 600
cugccaaugc cggucccaag cccggauaaa aguggaggga aaggggauag u 651
<210> 622
<211> 417
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 622
gggaauuccu agggaacccg gucccaagcc cggauaaaau ccgagggggc gggaaaccgc 60
cuaaggaugu guucccuagg agggugggug uaccucuuuu ggaccaaucg uggcgugucg 120
gccugcuucg gcaggcacug gcgccgucca ggagagguag aaagguagca gcaugguuca 180
caggucguga uaugauucaa uuagcuuccg acucauucau ccaaauaccg agucgccaaa 240
auucaaacua gacucguuaa augaaugaau gaugcgguag acaaauugga ucauugauuc 300
ucuuugaucc augcagcuac cuuuccacac accucucccc cucccaggua cuauccccuu 360
ucaacacugc caaugccggu cccaagcccg gauaaaagug gagggaaagg ggauagu 417
<210> 623
<211> 406
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 623
caaacacacg cucggacgca uauuacacau guucauacac uuaauacucg cuguuuugaa 60
uugauguuuu aggaauauau auguagagua gaaagguagc agcaugguuc acaggucgug 120
auaugauuca auuagcuucc gacucauuca uccaaauacc gagucgccaa aauucaaacu 180
agacucguua aaugaaugaa ugaugcggua gacaaauugg aucauugauu cucuuugauc 240
caugcagcua ccuuuccacu cucucuuuug uauuccaauu uucuugauua aucuuuccug 300
cacaaaaaca ugcuugaucc acuaagugac auauaugcug ccuucguaua uauaguucug 360
guaaaauuaa cauuuugggu uuaucuuuau uuaaggcauc gccaug 406
<210> 624
<211> 172
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 624
guagaaaggu agcagcaugg uucacagguc gugauaugau ucaauuagcu uccgacucau 60
ucauccaaau accgagucgc caaaauucaa acuagacucg uuaaaugaau gaaugaugcg 120
guagacaaau uggaucauug auucucuuug auccaugcag cuaccuuucc ac 172
<210> 625
<211> 392
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 625
gggaauuccu agggaacccg gucccaagcc cggauaaaau ccgagggggc gggaaaccgc 60
cuaaggaugu guucccuagg agggugggug uaccucuuuu ggaccaaucg uggcgugucg 120
gccugcuucg gcaggcacug gcgccgucca ggagagagca caacauuuca accagaaaca 180
cuagccgaag caaauccauu ccacaagcac cuggugggau caucucauca ucagaaacca 240
agagagagau uccguguccg cuuguuguag uagauuguga ggacugagga ccgagaagca 300
gccacaccuc ucccccuccc agguacuauc cccuuucaac acugccaaug ccggucccaa 360
gcccggauaa aaguggaggg aaaggggaua gu 392
<210> 626
<211> 245
<212> RNA
<213> 人工
<220>
<223> 合成的
<400> 626
gggaauuccu agggaacccg gucccaagcc cggauaaaau ccgagggggc gggaaaccgc 60
cuaaggaugu guucccuagg agggugggug uaccucuuuu ggaccaaucg uggcgugucg 120
gccugcuucg gcaggcacug gcgccgucca ggagagacac cucucccccu cccagguacu 180
auccccuuuc aacacugcca augccggucc caagcccgga uaaaagugga gggaaagggg 240
auagu 245

Claims (53)

1.一种用于使多核糖核苷酸环化的原核系统,该原核系统包含原核细胞,该原核细胞包含:
(a)线性多核糖核苷酸,该线性多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中元件(A)、(B)、(C)、(D)、和(E)可操作地连接,并且其中:
(A)包含5'自切割核酶;
(B)包含含有5'互补区的5'退火区;
(C)包含多核糖核苷酸负载物;
(D)包含含有3'互补区的3'退火区;并且
(E)包含3'自切割核酶;
其中该5'互补区和该3'互补区具有低于-5kcal/mol的结合自由能,并且/或者其中该5'互补区和该3'互补区具有至少10℃的结合Tm;
以及
(b)RNA连接酶;
其中该5'自切割核酶的切割在该线性多核糖核苷酸的5'端上产生游离的5'-羟基基团,并且其中该3'自切割核酶的切割在该线性多核糖核苷酸的3'端上产生游离的2',3'-环磷酸基团,得到连接酶相容的线性多核糖核苷酸;
并且其中该连接酶相容的线性多核糖核苷酸的5'和3'端通过该RNA连接酶连接,从而产生环状多核糖核苷酸。
2.如权利要求1所述的原核系统,其中该5'自切割核酶是选自由以下组成的组的核酶:锤头状核酶、发夹状核酶、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)核酶、glmS核酶、扭转核酶、扭转姐妹核酶、斧头核酶、和手枪核酶。
3.如权利要求1所述的原核系统,其中该3'自切割核酶是选自由以下组成的组的核酶:锤头状核酶、发夹状核酶、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)核酶、glmS核酶、扭转核酶、扭转姐妹核酶、斧头核酶、和手枪核酶。
4.如权利要求1所述的原核系统,其中该5’互补区具有在5与50个之间的核糖核苷酸并且该3’互补区具有在5与50个之间的核糖核苷酸。
5.如权利要求1所述的原核系统,其中该5’互补区和该3’互补区具有在50%与100%之间的序列互补性,并且任选地其中该5'互补区和该3'互补区包括在它们之间的不多于10个错配。
6.如权利要求1所述的原核系统,其中该5'退火区进一步包含具有在5与50个之间的核糖核苷酸并且位于该5'互补区的5'的5'非互补区;并且其中该3'退火区进一步包含具有在5与50个之间的核糖核苷酸并且位于该3'互补区的3'的3'非互补区;并且其中:
(a)该5’非互补区和该3’非互补区具有在0%与50%之间的序列互补性;并且/或者
(b)该5'非互补区和该3'非互补区具有大于-5kcal/mol的结合自由能;并且/或者
(c)该5'非互补区和该3'非互补区具有低于10℃的结合Tm。
7.如权利要求1所述的原核系统,其中该3'退火区和该5'退火区促进该线性多核糖核苷酸的3'和5'端的缔合。
8.如权利要求1所述的原核系统,其中该RNA连接酶是tRNA连接酶,任选地其中该tRNA连接酶是(a)选自由以下组成的组的连接酶:T4连接酶、RtcB连接酶、TRL-1连接酶、和Rnl1连接酶、Rnl2连接酶、LIG1连接酶、LIG2连接酶、PNK/PNL连接酶、PF0027连接酶、thpR ligT连接酶、和ytlPor连接酶;或(b)选自由以下组成的组的连接酶:植物RNA连接酶、叶绿体RNA连接酶、来自古细菌的RNA连接酶、细菌RNA连接酶、真核RNA连接酶、病毒RNA连接酶、和线粒体RNA连接酶。
9.如权利要求1所述的原核系统,其中该多核糖核苷酸负载物包含:
(a)至少一个编码多肽的编码序列;或
(b)至少一个非编码序列;或
(c)至少一个编码多肽的编码序列和至少一个非编码序列的组合。
10.如权利要求1所述的原核系统,其中该多核糖核苷酸负载物包含至少一个编码多肽的编码序列,并且其中该多肽包含在脊椎动物、无脊椎动物、植物或微生物的基因组中编码的氨基酸序列,并且/或者其中该多肽包含治疗性多肽、植物修饰多肽、或农业多肽;并且任选地,其中该编码序列经密码子优化用于在受试者中表达。
11.如权利要求1所述的原核系统,其中该多核糖核苷酸负载物包含至少一个编码多肽的编码序列,并且进一步包含选自由以下组成的组的额外的元件:
(a)内部核糖体进入位点(IRES)或5’UTR序列,其位于该编码序列的5'并与之可操作地连接,任选地在该IRES或5'UTR序列与该编码序列之间具有插入核糖核苷酸;
(b)3’UTR序列,其位于该编码序列的3'并与之可操作地连接,任选地在该3'UTR与该编码序列之间具有插入核糖核苷酸;以及
(c)(a)和(b)两者。
12.如权利要求1所述的原核系统,其中该多核糖核苷酸负载物包含至少一个非编码序列,并且其中该至少一个非编码RNA序列包含:
(a)至少一个选自由以下组成的组的RNA:RNA适配体、长非编码RNA(lncRNA)、转移RNA衍生的片段(tRF)、转移RNA(tRNA)、核糖体RNA(rRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、和Piwi相互作用RNA(piRNA);或这些RNA中的任一者的片段;和/或
(b)至少一个选自由以下组成的组的RNA:小干扰RNA(siRNA)或其前体、双链RNA(dsRNA)或至少部分双链RNA;发夹RNA(hpRNA)、微小RNA(miRNA)、或其前体;相位小干扰RNA(phasiRNA)或其前体;异染色质小干扰RNA(hcsiRNA)或其前体;以及天然反义短干扰RNA(natsiRNA)或其前体;和/或
(c)指导RNA(gRNA)或其前体;和/或
(d)核酶或核糖开关。
13.如权利要求1所述的原核系统,其中该多核糖核苷酸负载物包含至少一个非编码序列,并且其中该至少一个非编码RNA序列包含反式调节靶序列的调节RNA,任选地其中该靶序列包含受试基因组的基因的核苷酸序列,并且其中该靶序列的调节是(a)该靶序列的表达的上调、或(b)该靶序列的表达的下调、或(c)该靶序列的可诱导表达。
14.如权利要求1所述的原核系统,其中该连接酶:
(a)对该原核细胞内源的,或
(b)对该原核细胞异源的。
15.如权利要求1所述的原核系统,其中通过以下向该原核细胞提供该线性多核苷酸:
(a)向该原核细胞提供包含该线性多核苷酸的外源性多核糖核苷酸;
(b)在该原核细胞中转录向该原核细胞瞬时提供的外源性重组DNA分子,该外源性重组DNA分子包含编码该线性多核糖核苷酸的DNA并且任选地包含与编码该线性多核糖核苷酸的DNA可操作地连接的异源性启动子;或
(c)在该原核细胞中转录并入该原核细胞的基因组中的重组DNA分子,该重组DNA分子包含编码该线性多核糖核苷酸的DNA并且任选地包含与编码该线性多核糖核苷酸的DNA可操作地连接的异源性启动子。
16.如权利要求1所述的原核系统,其中该原核细胞是细菌细胞或古细菌细胞,该细菌细胞或古细菌细胞是:
(a)在培养基中生长或包含在生物反应器中;或
(b)天然细菌群体的成员;或
(c)与真核生物体相关的微生物组的成员。
17.如权利要求1所述的原核系统,其中该原核细胞是:
(a)与被子植物或裸子植物的根圈、或与该植物生长的土壤或生长培养基的微生物群落、或与该植物的地上组织相关的细菌细胞,任选地其中该相关是共生;或
(b)与人、非人脊椎动物、或无脊椎动物的细胞、组织、或器官相关的细菌细胞,任选地其中该相关是共生。
18.一种配制品,该配制品包含如权利要求1所述的原核系统,任选地其中该配制品是药物配制品、兽用配制品、或农业配制品。
19.一种环状多核糖核苷酸,该环状多核糖核苷酸通过如权利要求1所述的原核系统产生,任选地其中该环状多核糖核苷酸经纯化。
20.一种配制品,该配制品包含如权利要求19所述的环状多核糖核苷酸,任选地其中该配制品是药物配制品、兽用配制品、或农业配制品。
21.一种产生环状RNA的方法,该方法包括:
(a)在原核细胞中使(i)与(ii)接触:
(i)线性多核糖核苷酸,该线性多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中元件(A)、(B)、(C)、(D)、和(E)可操作地连接,并且其中:
(A)包含5'自切割核酶;
(B)包含含有5'互补区的5'退火区;
(C)包含多核糖核苷酸负载物;
(D)包含含有3'互补区的3'退火区;并且
(E)包含3'自切割核酶;
其中该5'互补区和该3'互补区具有低于-5kcal/mol的结合自由能,并且/或者其中该5'互补区和该3'互补区具有至少10℃的结合Tm;
其中该5'自切割核酶的切割在该线性多核糖核苷酸的5'端上产生游离的5'-羟基基团,并且其中该3'自切割核酶的切割在该线性多核糖核苷酸的3'端上产生游离的2',3'-环磷酸基团,得到连接酶相容的线性多核糖核苷酸;
(ii)RNA连接酶;
由此该连接酶相容的线性多核糖核苷酸的5'和3'端通过该RNA连接酶连接,从而产生环状多核糖核苷酸;以及
(b)任选地,纯化该环状多核糖核苷酸。
22.如权利要求21所述的方法,其中通过以下向该原核细胞提供该线性多核苷酸:
(a)向该原核细胞提供包含该线性多核苷酸的外源性多核糖核苷酸;
(b)在该原核细胞中转录向该原核细胞瞬时提供的外源性重组DNA分子,该外源性重组DNA分子包含编码该线性多核糖核苷酸的DNA并且任选地包含与编码该线性多核糖核苷酸的DNA可操作地连接的异源性启动子;或
(c)在该原核细胞中转录并入该原核细胞的基因组中的重组DNA分子,该重组DNA分子包含编码该线性多核糖核苷酸的DNA并且任选地包含与编码该线性多核糖核苷酸的DNA可操作地连接的异源性启动子。
23.如权利要求21所述的方法,其中该5'自切割核酶是选自由以下组成的组的核酶:锤头状核酶、发夹状核酶、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)核酶、glmS核酶、扭转核酶、扭转姐妹核酶、斧头核酶、和手枪核酶。
24.如权利要求21所述的方法,其中该3'自切割核酶是选自由以下组成的组的核酶:锤头状核酶、发夹状核酶、丁型肝炎病毒核酶(HDV)、Varkud卫星(VS)核酶、glmS核酶、扭转核酶、扭转姐妹核酶、斧头核酶、和手枪核酶。
25.如权利要求21所述的方法,其中该5’互补区具有在5与50个之间的核糖核苷酸并且该3’互补区具有在5与50个之间的核糖核苷酸。
26.如权利要求21所述的方法,其中该5’互补区和该3’互补区具有在50%与100%之间的序列互补性,并且任选地其中该5'互补区和该3'互补区包括在它们之间的不多于10个错配。
27.如权利要求21所述的方法,其中该5'退火区进一步包含具有在5与50个之间的核糖核苷酸并且位于该5'互补区的5'的5'非互补区;并且其中该3'退火区进一步包含具有在5与50个之间的核糖核苷酸并且位于该3'互补区的3'的3'非互补区;并且其中:
(a)该5’非互补区和该3’非互补区具有在0%与50%之间的序列互补性;并且/或者
(b)该5'非互补区和该3'非互补区具有大于-5kcal/mol的结合自由能;并且/或者
(c)该5'非互补区和该3'非互补区具有低于10℃的结合Tm。
28.如权利要求21所述的方法,其中该3'退火区和该5'退火区促进该线性多核糖核苷酸的3'和5'端的缔合。
29.如权利要求21所述的方法,其中该RNA连接酶是tRNA连接酶,任选地其中该tRNA连接酶是(a)选自由以下组成的组的连接酶:T4连接酶、RtcB连接酶、TRL-1连接酶、和Rnl1连接酶、Rnl2连接酶、LIG1连接酶、LIG2连接酶、PNK/PNL连接酶、PF0027连接酶、thpR ligT连接酶、和ytlPor连接酶;或(b)选自由以下组成的组的连接酶:植物RNA连接酶、叶绿体RNA连接酶、来自古细菌的RNA连接酶、细菌RNA连接酶、真核RNA连接酶、病毒RNA连接酶、和线粒体RNA连接酶。
30.如权利要求21所述的方法,其中该多核糖核苷酸负载物包含:
(a)至少一个编码多肽的编码序列;或
(b)至少一个非编码序列;或
(c)至少一个编码多肽的编码序列和至少一个非编码序列的组合。
31.如权利要求21所述的方法,其中该多核糖核苷酸负载物包含至少一个编码多肽的编码序列,并且其中该多肽包含在脊椎动物、无脊椎动物、植物或微生物的基因组中编码的氨基酸序列,并且/或者其中该多肽包含治疗性多肽、植物修饰多肽、或农业多肽;并且任选地,其中该编码序列经密码子优化用于在受试者中表达。
32.如权利要求21所述的方法,其中该多核糖核苷酸负载物包含至少一个编码多肽的编码序列,并且进一步包含选自由以下组成的组的额外的元件:
(a)内部核糖体进入位点(IRES)或5’UTR序列,其位于该编码序列的5'并与之可操作地连接,任选地在该IRES或5'UTR序列与该编码序列之间具有插入核糖核苷酸;
(b)3’UTR序列,其位于该编码序列的3'并与之可操作地连接,任选地在该3'UTR与该编码序列之间具有插入核糖核苷酸;以及
(c)(a)和(b)两者。
33.如权利要求21所述的方法,其中该多核糖核苷酸负载物包含至少一个非编码序列,并且其中该至少一个非编码RNA序列包含:
(a)至少一个选自由以下组成的组的RNA:RNA适配体、长非编码RNA(lncRNA)、转移RNA衍生的片段(tRF)、转移RNA(tRNA)、核糖体RNA(rRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、和Piwi相互作用RNA(piRNA);或这些RNA中的任一者的片段;和/或
(b)至少一个选自由以下组成的组的RNA:小干扰RNA(siRNA)或其前体、双链RNA(dsRNA)或至少部分双链RNA;发夹RNA(hpRNA)、微小RNA(miRNA)、或其前体;相位小干扰RNA(phasiRNA)或其前体;异染色质小干扰RNA(hcsiRNA)或其前体;以及天然反义短干扰RNA(natsiRNA)或其前体;和/或
(c)指导RNA(gRNA)或其前体;和/或
(d)核酶或核糖开关。
34.如权利要求21所述的方法,其中该多核糖核苷酸负载物包含至少一个非编码序列,并且其中该至少一个非编码RNA序列包含反式调节靶序列的调节RNA,任选地其中该靶序列包含受试基因组的基因的核苷酸序列,并且其中该靶序列的调节是(a)该靶序列的表达的上调、或(b)该靶序列的表达的下调、或(c)该靶序列的可诱导表达。
35.如权利要求21所述的方法,其中该原核细胞是细菌细胞或古细菌细胞,该细菌细胞或古细菌细胞是:
(a)在培养基中生长或包含在生物反应器中;或
(b)天然细菌群体的成员;或
(c)与真核生物体相关的微生物组的成员。
36.如权利要求21所述的方法,其中该原核细胞是:
(a)与被子植物或裸子植物的根圈、或与该植物生长的土壤或生长培养基的微生物群落、或与该植物的地上组织相关的细菌细胞,任选地其中该相关是共生;或
(b)与人、非人脊椎动物、或无脊椎动物的细胞、组织、或器官相关的细菌细胞,任选地其中该相关是共生。
37.一种环状多核苷酸,该环状多核苷酸通过如权利要求21所述的方法产生。
38.如权利要求21所述的方法,其中纯化并配制该环状多核苷酸以递送至受试者,任选地以治疗该受试者的病症,并且进一步任选地其中该配制品是药物配制品、兽用配制品、或农业配制品。
39.如权利要求38所述的方法,其中该受试者是人、非人脊椎动物、无脊椎动物、或植物。
40.一种原核细胞,该原核细胞包含:
(a)线性多核糖核苷酸,该线性多核糖核苷酸具有式5'-(A)-(B)-(C)-(D)-(E)-3',其中元件(A)、(B)、(C)、(D)、和(E)可操作地连接,并且其中:
(A)包含5'自切割核酶;
(B)包含含有5'互补区的5'退火区;
(C)包含多核糖核苷酸负载物;
(D)包含含有3'互补区的3'退火区;并且
(E)包含3'自切割核酶;
其中该5'互补区和该3'互补区具有低于-5kcal/mol的结合自由能,并且/或者其中该5'互补区和该3'互补区具有至少10℃的结合Tm;
其中该5'自切割核酶的切割在该线性多核糖核苷酸的5'端上产生游离的5'-羟基基团,并且其中该3'自切割核酶的切割在该线性多核糖核苷酸的3'端上产生游离的2',3'-环磷酸基团,得到连接酶相容的线性多核糖核苷酸;
以及
(b)RNA连接酶,其中该RNA连接酶能够连接该连接酶相容的线性多核糖核苷酸的5'端和3'端以产生环状RNA。
41.如权利要求40所述的原核细胞,其中该5'退火区进一步包含具有在5与50个之间的核糖核苷酸并且位于该5'互补区的5'的5'非互补区;并且其中该3'退火区进一步包含具有在5与50个之间的核糖核苷酸并且位于该3'互补区的3'的3'非互补区;并且其中:
(a)该5’非互补区和该3’非互补区具有在0%与50%之间的序列互补性;并且/或者
(b)该5'非互补区和该3'非互补区具有大于-5kcal/mol的结合自由能;并且/或者
(c)该5'非互补区和该3'非互补区具有低于10℃的结合Tm。
42.如权利要求40所述的原核细胞,其中该多核糖核苷酸负载物包含:
(a)至少一个编码多肽的编码序列;或
(b)至少一个非编码序列;或
(c)至少一个编码多肽的编码序列和至少一个非编码序列的组合。
43.如权利要求40所述的原核细胞,其中该多核糖核苷酸负载物包含至少一个编码多肽的编码序列,并且其中该多肽包含在脊椎动物、无脊椎动物、植物或微生物的基因组中编码的氨基酸序列,并且/或者其中该多肽包含治疗性多肽、植物修饰多肽、或农业多肽;并且任选地,其中该编码序列经密码子优化用于在受试者中表达。
44.如权利要求40所述的原核细胞,其中该多核糖核苷酸负载物包含至少一个编码多肽的编码序列,并且进一步包含选自由以下组成的组的额外的元件:
(a)内部核糖体进入位点(IRES)或5’UTR序列,其位于该编码序列的5'并与之可操作地连接,任选地在该IRES或5'UTR序列与该编码序列之间具有插入核糖核苷酸;
(b)3’UTR序列,其位于该编码序列的3'并与之可操作地连接,任选地在该3'UTR与该编码序列之间具有插入核糖核苷酸;以及
(c)(a)和(b)两者。
45.如权利要求40所述的原核细胞,其中该多核糖核苷酸负载物包含至少一个非编码序列,并且其中该至少一个非编码RNA序列包含:
(a)至少一个选自由以下组成的组的RNA:RNA适配体、长非编码RNA(lncRNA)、转移RNA衍生的片段(tRF)、转移RNA(tRNA)、核糖体RNA(rRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、和Piwi相互作用RNA(piRNA);或这些RNA中的任一者的片段;和/或
(b)至少一个选自由以下组成的组的RNA:小干扰RNA(siRNA)或其前体、双链RNA(dsRNA)或至少部分双链RNA;发夹RNA(hpRNA)、微小RNA(miRNA)、或其前体;相位小干扰RNA(phasiRNA)或其前体;异染色质小干扰RNA(hcsiRNA)或其前体;以及天然反义短干扰RNA(natsiRNA)或其前体;和/或
(c)指导RNA(gRNA)或其前体;和/或
(d)核酶或核糖开关。
46.如权利要求40所述的原核细胞,其中该RNA连接酶(a)对该原核细胞是内源的、或(b)对该原核细胞是异源的。
47.如权利要求40所述的原核细胞,其中该RNA连接酶是tRNA连接酶,任选地其中该tRNA连接酶是(a)选自由以下组成的组的连接酶:T4连接酶、RtcB连接酶、TRL-1连接酶、和Rnl1连接酶、Rnl2连接酶、LIG1连接酶、LIG2连接酶、PNK/PNL连接酶、PF0027连接酶、thpRligT连接酶、和ytlPor连接酶;或(b)选自由以下组成的组的连接酶:植物RNA连接酶、叶绿体RNA连接酶、来自古细菌的RNA连接酶、细菌RNA连接酶、真核RNA连接酶、病毒RNA连接酶、和线粒体RNA连接酶。
48.如权利要求40所述的原核细胞,该原核细胞进一步包含该环状RNA。
49.一种向受试者提供环状RNA的方法,该方法包括向该受试者提供如权利要求40所述的原核细胞,任选地其中将该原核细胞裂解、干燥或冷冻,并且进一步任选地其中该原核细胞在药物配制品、兽用配制品、或农业配制品中提供。
50.如权利要求49所述的方法,其中该受试者是人、非人脊椎动物、无脊椎动物、或植物。
51.一种配制品,该配制品包含如权利要求40所述的原核细胞,任选地其中将该原核细胞裂解、干燥或冷冻,并且进一步任选地其中该配制品是药物配制品、兽用配制品、或农业配制品。
52.一种治疗有需要的受试者的障碍的方法,该方法包括向该受试者提供如权利要求51所述的配制品。
53.如权利要求52所述的方法,其中该受试者是人、非人脊椎动物、无脊椎动物、或植物。
CN202280022556.3A 2021-03-26 2022-03-25 原核系统中环状多核糖核苷酸的产生 Pending CN117295818A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/166,467 2021-03-26
US202163189610P 2021-05-17 2021-05-17
US63/189,610 2021-05-17
PCT/US2022/021865 WO2022204466A1 (en) 2021-03-26 2022-03-25 Production of circular polyribonucleotides in a prokaryotic system

Publications (1)

Publication Number Publication Date
CN117295818A true CN117295818A (zh) 2023-12-26

Family

ID=89241204

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280022556.3A Pending CN117295818A (zh) 2021-03-26 2022-03-25 原核系统中环状多核糖核苷酸的产生

Country Status (1)

Country Link
CN (1) CN117295818A (zh)

Similar Documents

Publication Publication Date Title
AU2016208418B2 (en) Down-regulating gene expression in insect pests
CN101213301B (zh) 用于防治昆虫和蜘蛛类动物的RNAi
CN103562395B (zh) 对昆虫害虫具有抗性的植物
CN117120605A (zh) 用于产生环状多核糖核苷酸的组合物和方法
CN106413390A (zh) 用于控制虫害的组合物和方法
WO2022204466A1 (en) Production of circular polyribonucleotides in a prokaryotic system
US10808261B2 (en) Double strand RNA-mediated RNA interference through feeding detrimental to larval Lymantria dispar (gypsy moth)
WO2022204464A1 (en) Production of circular polyribonucleotides in a eukaryotic system
WO2012082823A2 (en) Formicidae (ant) control using double-stranded rna constructs
CN114921467A (zh) 基于桃蚜效应因子MpC002基因的dsRNA及其在防治桃蚜中的应用
CN110195049B (zh) 褐飞虱眼色基因NlGCHI及其编码蛋白、应用
WO2016198852A1 (en) Pest control system
Zhang et al. MicroRNA-190-5p confers chlorantraniliprole resistance by regulating CYP6K2 in Spodoptera frugiperda (Smith)
KR102008064B1 (ko) 애멸구의 핵수용체 E75 유전자에 특이적인 dsRNA를 이용한 애멸구 매개 바이러스 방제용 조성물 및 방법
CN102851297B (zh) 一种烟蚜hunchback基因cDNA及其应用
CN109468336B (zh) 褐飞虱蛋白磷酸基因NlPP1、蛋白及其dsRNA和应用
WO2017136353A1 (en) Methods and compositions for controlling ants
US9000145B2 (en) Control of insect pests through RNAi of pheromone biosynthesis activating neuropeptide receptor
CN117295818A (zh) 原核系统中环状多核糖核苷酸的产生
CN107760682A (zh) 一种可用于分子防治害虫的核酸序列及其应用
CN117203335A (zh) 真核系统中环状多核糖核苷酸的产生
US10308954B2 (en) Method for the control of nematodes in plants
CN113881679B (zh) 一种增强金龟子绿僵菌杀灭白蚁效果的miR-71-5模拟物
CN106318956A (zh) 一种绿盲蝽V‑ATPase‑A基因cDNA及其应用
Wang et al. Fusion dsRNA designs incorporating multiple target sequences can enhance the aphid control capacity of an RNAi‐based strategy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination