CN102066562A - 结构限定的适配子的直接选择 - Google Patents

结构限定的适配子的直接选择 Download PDF

Info

Publication number
CN102066562A
CN102066562A CN2009801172500A CN200980117250A CN102066562A CN 102066562 A CN102066562 A CN 102066562A CN 2009801172500 A CN2009801172500 A CN 2009801172500A CN 200980117250 A CN200980117250 A CN 200980117250A CN 102066562 A CN102066562 A CN 102066562A
Authority
CN
China
Prior art keywords
adaptive
nucleotide
sequence
son
material standed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801172500A
Other languages
English (en)
Inventor
菲利普·N·伯勒尔
马克·P·迈克派克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syracuse University
Original Assignee
Syracuse University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syracuse University filed Critical Syracuse University
Publication of CN102066562A publication Critical patent/CN102066562A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1048SELEX
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/16Aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/13Applications; Uses in screening processes in a process of directed evolution, e.g. SELEX, acquiring a new function
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • C12N2330/31Libraries, arrays

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了具有预先限定的二级结构的适配子文库,它可用于针对亲和结合的过度采样筛选。在某一实施方案中,应用了复合方法将文库分配成简并子集并固定于固相支持物诸如微阵列芯片的多个位置上。

Description

结构限定的适配子的直接选择
发明领域
本发明涉及适配子及其应用领域。
相关申请的交叉引用
本申请要求下列申请的优先权:2008年3月12日提交的第61/035,844号美国临时专利申请、2008年12月4日提交的第61/119,777号美国临时专利申请,以上申请的全部内容在此收编作为参考。
关于联邦政府资助研究声明
本文所述的发明是在美国国立卫生研究院第一阶段SBIR计划提供ORTHOSYSTEMS公司的经费资助下完成的,联邦政府可能对本发明拥有一定权利。
发明背景
适配子是以相当于抗体-抗原相互作用的亲和力和特异性结合靶标的核酸或肽分子。由于不需要在动物或细胞系中进行选择、有数年的货架生命期、可以很容易的进行修饰以减少与非预期靶标的交叉反应性,因此DNA/RNA适配子能够提供低成本高收益的抗体替代品。这种与靶标结合并且在某些情况下改变其靶标功能的能力,使适配子具有在生物传感器开发、亲和层析以及最近的治疗和诊断中的应用潜力。
传统上,人工适配子序列是通过SELEX技术(SYSTEMATIC EVOLUTION OF LIGANDS BY EXPONENTIAL ENRICHMENT,指数富集式配体系统进化技术)以及其他密切相关的体外进化方法发现的。起始文库具有相对较长的DNA/RNA序列寡聚物(80-120NT),其中央是随机化区域(30-120NT)。这些是稀疏采样文库,其在一个典型的起始池中,随机化30MER出现任意特定序列的概率为大约10-4,对于随机化70MERS出现任意特定序列的可能性是大约10-29。这意味着此类SELEX实验是由那些随机存在的序列单拷贝开始的。通过与靶标结合后扩增存活体的选择压力使之发生进化,选择和扩增一般要重复5-20轮。通过克隆和测序的方法找到最终的存留序列,之后,通过截去亲本适配子中与靶标相互作用所不必需的片断的方法找到一个最小核心结合序列。
尽管SELEX方法被广泛用于发现DNA/RNA适配子,但迄今使用此方法只发现了几百个靶标特异性的适配子,与此相比,同期筛选出的抗体有数千个。这种有限的成功可能主要源于SELEX选择方法本身的很多缺陷。首先,在SELEX实验中出现的各种可能的序列数量如此巨大(例如,对于30个核苷酸随机延伸而言有1×1018种可能序列),以致于直接合成与筛选所有序列是不可能的,即使是利用先进的高通量DNA/RNA合成仪器进行制备也是如此。其次,即使SELEX识别出对靶标具有非常高亲和力的核酸序列,这些序列通常比较长(一般在80-150个单体长度单位),而且往往具有复杂的内部结构(二级结构)。这么长的折叠分子对于各种应用而言常常是不利的,而短的(20-40个单位)限定结合结构域则在生产和操作的成本和方便上都较有优势。第三,重复数轮进行选择和扩增的SELEX方法是不方便的、耗时的和昂贵的。
鉴于上述原因,需要有改进的高通量的适配子发现方法。
发明概述
一种所谓的高通量适配子筛选方法(HTSA)被描述为用于快速发现以高亲和力和选择性结合靶标的相对较小、结构限定的核酸序列。
在一个方面,本发明提供了一个包含多个适配子候选物的适配子文库。每个适配子候选物长度基本相同并且具有一级结构和预先选定的二级结构。一级结构包括至少一个其中在m个位置上的核苷酸有变化的可变核苷酸序列,二级结构包括至少一个单链区和一个双链区,其中的可变序列至少是单链区的一部分,并且,其中对于每100pmol的适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列。
在各种实施方案中,预先选定的二级结构是发夹环、凸环、内部环、多分支环、假节结或它们的组合。
可变序列可在某些位置具有随机化的核苷酸而在其它位置具有不变的核苷酸,或者在所有位置都具有随机化的核苷酸。可变序列可完全在单链区内,或者包含位置在双链区内且距单链区末端在三个核苷酸以下的核苷酸。
在某些实施方案中,对于每100pmol的适配子候选物而言,平均至少表现了大约六拷贝、十二拷贝或更高数目拷贝的每种可能的可变序列。m个位置的数目可至少为大约5个。每个适配子候选物可以是大约50-60个核苷酸长度,而m可以是大约25、22或更少。一个特征是每个适配子候选物具有共同的二级结构。每一适配子候选物可能包含选自DNA、RNA、PNA、修饰的核苷酸以及任何上述物质混合物的寡核苷酸。在某些实施方案中,每个适配子候选物长度在100、75或50个核苷酸以下。
在某一实施方案中,适配子文库至少包含109个截然不同的成员。有一特征是,适配子文库可能包含多个链接的适配子,它们可以包括两个或更多个相同的二级结构、两个或更多个不同的二级结构或者相同和不同二级结构的组合。
在一个方面,本发明提供了包含上述适配子文库或本发明其他文库实施方案的微阵列芯片。
在另一方面,本发明进一步提供了利用本发明文库的方法,具体而言,用于识别与靶标结合的适配子的方法。自然,文库的特征也应用于涉及该文库的方法且在此不再重复。所述方法包括以下步骤:(a)提供包含多个适配子候选物的适配子文库,各个适配子候选物具有长度基本相同的一级结构和预先选定的二级结构,一级结构包含至少一个其中在m个位置的核苷酸是变化的可变核苷酸序列,二级结构包含至少一个单链区和一个双链区,其中可变序列至少是单链区的一部分并且其中对于每100pmol的适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列;(b)在允许适配子文库成员与靶标结合的缓冲条件下使适配子文库接触靶标;(c)分离至少一个被靶标结合的适配子文库成员,并且(d)测定被结合的适配子候选物的可变序列。
在某一实施方案中,以上方法包括在步骤(c)之后的扩增步骤。
在某一实施方案中,步骤(c)包括分离适配子文库中被靶标结合的亚组分,其中的方法进一步包括步骤(e),即按照它们在亚组分中出现的频率排列被结合的候选适配子对靶标的亲和力,作为步骤(d)结果的证明。
在某一特征上,可变序列具有在某些位置随机化的核苷酸和在其它位置不变的核苷酸。在其它特征上,可变序列包含在所有位置随机化的核苷酸。
在某一实施方案中,上述识别与靶标结合的适配子的方法包含在接触步骤之后的漂洗步骤,其中不与靶标结合的适配子候选物通过缓冲液被漂洗掉。漂洗步骤的缓冲液条件可能不比接触步骤的缓冲液条件更严紧,或者漂洗可能发生在含有适配子候选物至少一部分二级结构的竞争性寡核苷酸存在的条件下。
在某些实施方案中,靶标包括多肽序列、核苷酸序列、脂类和碳水化合物。在其它实施方案中,靶标包括病毒或细胞表面的肽、核苷酸、脂类或碳水化合物部分。靶标可被固定在固相支持物上。从某一特征上而言,靶标包括小分子。所述小分子可能具有1000或更小的分子量。在某一特征上,靶标可能包含标记物。
在某一特征上,所述方法的步骤(d)是通过高通量测序技术完成的。在一个实施方案中,所述的高通量测序技术能在步骤(c)之后产生文库内的至少10,000个序列。
在另一方面,本发明提供了鉴别与靶标结合的候选适配子序列的方法,包括以下步骤:(a)提供包含多个适配子候选物的适配子文库,各个适配子候选物具有一级结构和预先选定的二级结构,所述一级结构包含至少一个可变核苷酸序列,其中在m个位置上的核苷酸是可变的,所述二级结构包含至少一个单链区和一个双链区,其中可变序列至少是单链区的一部分并且其中对于每100pmol的适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列;(b)将适配子文库分到适配子候选物的集合中,每一集合包含4m的适配子候选物,其中m代表各个适配子候选物可变序列内随机化核苷酸的数目;(c)将每个集合针对不同特征附着于支持物上;(d)使所述支持物接触靶标;(e)确定展示出以高于预定水平与靶标充分结合的特征;(f)随后从与步骤(e)中所确定特征相关的任何候选集合中整理出亚集合,各个亚集合包含候选集合中所含有的一部分不同的候选适配子;(g)重复步骤c)至步骤f)直到至少所述亚集合之一只有相同可变序列的适配子候选物,并且确定步骤(g)中所获得的至少一个亚集合中适配子候选物的可变序列。
在某一实施方案中,固相支持物是微阵列芯片或滤器基材。在某一实施方案中,亚集合是通过凝胶迁移(gel shift)鉴别的。
在某一实施方案中,各个适配子候选物可变序列内的随机化核苷酸的数目m是大约25、22或更少。
在进一步的方面,本发明提供了通过随机化适配子序列的某些区段来完善模板适配子的理想特性的方法,提供模板适配子,在模板适配子区段内引入随机化序列,应用任一上述鉴别与靶标结合的候选适配子序列的方法,并确定所述区段内哪一个随机化序列提高了模板适配子对靶标的结合亲和力。
模板适配子可以是SELEX来源的适配子。对靶标的结合亲和力可通过荧光偏振进行确定。靶标可以是被标记的。
在另一方面,本发明公开了基于适配子的生物传感器,包含:(a)能结合靶标的测试适配子,所述测试适配子选自含有多个适配子候选物的适配子文库,每个适配子候选物具有一级结构和预先选定的二级结构,该一级结构包含至少一个可变核苷酸序列,其中m个位置的核苷酸是可变的,所述二级结构包含至少一个单链区和一个双链区,其中可变序列至少是单链区的一部分,并且其中对于每100pmol的适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列,以及(b)探测部分,附着于测试适配子,其中在靶标与测试适配子没有结合的情况下允许检测来自探测部分的信号。
探测部分可以是寡核苷酸,且该寡核苷酸可以包含荧光供体和或者荧光受体或者荧光淬灭物。靶标与测试适配子的结合可诱导所述探测部分的构象改变从而引起荧光信号的变化。
在另一方面,本发明提供了用于鉴定样品中靶标存在的诊断试剂盒,包含:(a)能结合靶标的测试适配子,所述适配子选自含有多个适配子候选物的适配子文库,每个适配子候选物具有长度基本相同的一级结构和预先选定的二级结构,该一级结构包含至少一个可变核苷酸序列,其中m个位置的核苷酸是可变的,所述二级结构包含至少一个单链区和一个双链区,其中可变序列至少是单链区的一部分并且其中对于每100pmol的适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列,(b)用于在测试适配子和靶标之间进行结合反应的试剂,以及(c)利用该诊断试剂盒鉴定待测样品中所述靶标存在的说明书。
正如对本领域技术人员而言是显而易见的,所述的关于本发明某一方面的特征和实施方案经常适用于本发明的其它方面,在此不再重复。例如,所述的关于文库的特征通常适用于本发明的生物传感器以及诊断试剂盒方面。
应当理解为本申请并不局限于本概述中所公开的实施方案,而且它意图覆盖本领域中拥有足够技术范围内的修饰和变异,并如权利要求所确定的。
本文所述实施方案有许多超越SELEX和其它类似适配子发现方法的优势。本文所述的HTSA方法使用了具有预先限定的二级结构的短核酸序列的全面文库,其中每一个可能的变体序列都由文库中的至少一个拷贝来表现。只经一轮与靶标的结合就对靶标结合的候选适配子进行选择和测序。因此HTSA方法通过改善通量、成本、所筛选序列的多样性以及验证候选适配子所需时间等方面解决了目前适配子发现技术的诸多限制。
附图说明
图1描述了用HTSA方法进行凝血酶特异性适配子选择的流程。
图2显示了(a)包含G四级特征的SELEX来源凝血酶结合适配子(TBA)和(b)SELEX来源的PDGF结合适配子。
图3描述了具有8个碱基对主干和非互补尾部的发夹环HT适配子。
图4描述了用HTSA方法进行凝血酶适配子选择。
图5描述了用于(a)发夹环、(b)三向连接、(c)内部/凸出(i/b)环以及(d)假节结的适配子基元。平行线表示碱基配对区域,细线表示固定的序列,粗线表示随机化序列。
图6显示了关于制备适配子-衔接头连接用于高通量测序的实验方案。
图7示意性将HTSA方法与SELEX进行了比较。
图8是从文库中筛选6碱基发夹环的示意图。混合位点残基N粗略包括等量的A、C、G、T。从先前轮次筛选中确定的固定碱基以粗体表示。
图9描述了HT适配子或探针以及AlloSwitch技术在药物发现中的应用。
图10以图形描述了对选定序列的进一步分析:a,≥10个计数的序列的系统发生树。b,基元顶端竞争者的SPR分析。SPR信号,Δ%R=芯片表面响应被分析物的发射率的变化。具有相当于TBA的计数的基元III未对α-凝血酶展示出高亲和力。c,计数和亲和力之间相关性的证实。计数有所变化的4个TBA基元序列(表1所示)具有与其计数相一致的SPR响应。d,4个序列的标准化的计数对SPR信号的对数在三次重复实验中呈现出高度的重复性。
图11显示了基元III序列结合碳水化合物部分。基元III顶端竞争者(糖-适配子-候选物(sugar-aptamer-candidate(SAC))(上部)、TBA(下部)和多聚A(poly-A)对照序列(中间)与(a)葡萄糖和(b)α-甲基-甘露糖苷的分析显示出了SAC对于底物而言的优越性。可预计的TBA对两种糖都展示出竞争性亲和力,因为已报道在碳水化合物适配子中有富G序列,而某些报道将结合能力归因于G四联体(G-quartets)24,25。c,d GMSA显示SAC对α-凝血酶的亲和力在加入凝血酶碳水化合物元件的竞争者Con-A后减小,并在加入优选底物葡萄糖后消失。所有的DNA发夹在GMSA中始终具有两条带。
图12a和12b描述了N3-N6DNA发夹环文库(总共5440个序列,106个文库集合)。
图13显示了两个扩展的DNA发夹环文库:(a).N6-56-57芯片与Cy3-NCp7的杂交,(b).N6-56-57芯片布局图,(c)对照特征以白色显示,N6-57和N6-56文库特征分别以棕褐色和蓝色显示。以粗体显示的序列被选择供进一步分析。
图14描述了显示扩展的阵列布局的DNA微阵列芯片总体布置(a)。微阵列芯片与SYBR 555DNA染色剂的杂交。
图15显示了N3-N6芯片与Cy3-NCp7的杂交(a)。N3-N6芯片布局以白色显示对照特征,并按照表1所示的环大小和复杂性用颜色对文库特征进行分组。
图16是Cy3-NCp7/N3-N6文库芯片筛选的柱状图。每一特征的平均强度数值代表4次重复的总强度的平均数,相对于GUG进行了标准化。阳性和阴性对照特征是左侧明亮的组,而复杂性为64和256的特征分别是中间较暗的组和右边较亮的组。
图17显示了针对以下序列的NCp7Trp37荧光强度对寡/蛋白质的摩尔比例,分别为对照序列(蓝色)、来自扩展的“击中”文库集合N6_56(64)的击中(红色)和未击中(浅绿色),以及来自扩展的“未击中”文库N6_57(64)的未击中(深绿色)。黑色的1∶1线条代表无穷大的结合常数。每个序列名称后面的括号内是计算好的Kd值。
发明详述
除非另有规定,此处所用的所有技术和科学术语具有与本领域技术人员通常所理解的相同的含义。以下定义供帮助解释本申请的公开内容和权利要求。在本节定义与别处定义不一致的情况下,以本节阐明的定义为准。
用于本文时,当术语“约”或“大约”与数目联合使用时指在参照数的5、10或15%以内的任何数目。
术语“多个”用于本文时,指两个或两个以上的数量。
用于本文时,“核酸”、“寡核苷酸”和“多核苷酸”可交替用于指任何长度的核苷酸聚合物,且这样的核苷酸可能包括脱氧核糖核苷酸、核糖核苷酸、和/或类似物或化学修饰的脱氧核糖核苷酸或核糖核苷酸。术语“多核苷酸”、“寡核苷酸”和“核酸”包括双链或单链分子以及三重螺旋分子。寡核苷酸,理论上可能含有任何数目的核苷酸,但优选2-200个核苷酸,更优选10-100个核苷酸,还更优选20-40个核苷酸。
“列举”指的是寡核苷酸序列中的一系列位置。一个被列举的位置应只有数个不同碱基(通常是G、A、T、C或U)中的一个在该位置。被列举的位置通常被发现于单链环或凸环中。
用于本文时,“靶分子”和“靶标”可交替用于指适配子可与之结合的任何分子。“靶分子”或“靶标”指例如蛋白质、多肽、核酸、碳水化合物、脂质、多糖、糖蛋白、激素、受体、抗原、抗体、affybodies、模拟抗体、病毒、病原体、有毒物质、底物、代谢产物、过渡态类似物、辅助因子、抑制剂、药物、小分子、染料、营养物、污染物、生长因子、细胞、组织或微生物以及任何前述物质的任何片断或部分。在某一实施方案中,“靶标”指细胞表面分子,诸如细胞膜蛋白质。
用于本文时,“组合子(combimer)”、“适配子候选物”和“适配子”可交替使用来指通过碱基配对杂交之外还能结合目的靶标的寡核苷酸。“适配子”一般包括DNA、RNA、PNA、核苷酸类似物、修饰的核苷酸或任何上述物质的混合物。“适配子”可天然存在或通过合成或重组方式制备。“适配子”用于本文时包含单链区和二级结构区域,所述二级结构区域包括但不局限于发夹环、凸环、内部环、多分支环、假节结或它们的组合。“适配子”可包含天然存在的核苷酸、以某些方式诸如通过化学修饰等被修饰的核苷酸、以及非天然的碱基,例如2-氨基嘌呤。“适配子”可被化学修饰,例如,通过加入诸如荧光团等标记物,或者通过加入某分子使得适配子与其所结合的分子交联。“适配子”或“候选适配子”如果具有相同的序列或能特异性的结合相同分子则它们是相同“类型”的。适配子长度将有所不同,但一般小于大约100个核苷酸。HT-适配子指在HTSA文库中找到的适配子,而SE-适配子指在SELEX文库中找到的适配子。
“适配子候选物”是对靶分子具有低、中等或高结合亲和力的HTSA选定适配子(有时称为HT-适配子)。人们认识到亲和相互作用有程度的问题;不过,在此上下文中,适配子对其靶标的“特异性结合亲和力”,指该适配子结合其靶标的亲和力程度通常远远高于它与待测样品中其它组分结合的亲和力。
用于本文时,“模板适配子”是对靶标具有亲和力且可通过精心制作有所改进的适配子,即,修饰适配子的核苷酸序列以提高或降低模板适配体对靶标的亲和力。在某一实施方案中,“模板适配子”是SELEX-来源的适配子(有时被称为SE-适配子)。
用于本文时,“高亲和力”结合指候选适配子以Kd小于100nMolar的结合解离常数与靶标结合。
用于本文时,“中等亲和力”结合指候选适配子以Kd在0.1μM至100μM之间的结合解离常数与靶标结合。
用于本文时,“高亲和力”结合指候选适配子以Kd在0.1mM至1000mM之间的结合解离常数与靶标结合。
用于本文时,术语“文库”指多个化合物,例如,适配子。
用于本文时,肽核酸(Peptide Nucleic Acids(PNAs))是其中寡核苷酸的糖磷酸盐骨架被包含酰胺键的肽骨架所取代的核酸。
用于本文时,术语“标记物”或“检测部分”指可用于检测涉及靶标和适配子相互作用的一种或多种反应物。检测部分或标记物能被直接或间接检测到。通常,可检测到的任何报告分子都可以是标记物。标记物包括,例如,(i)依靠产生信号而可直接检测到的报告分子,(ii)可通过随后与包含报告分子的相关物结合而被间接检测到的特异结合配对成员,(iii)通过质谱可检测的质量标签,以及(iv)可为扩增或连接提供模板的寡核苷酸引物。报告分子可以是催化剂诸如酶等、染料、荧光分子、量子点、化学发光分子、辅酶、酶底物、放射性基团、有机小分子、可扩增的多核苷酸序列、诸如乳胶或碳颗粒等颗粒、金属溶胶、微晶,等等,它们可以用或者可以不用以下物质进行进一步的标记:染料、催化剂或其它可检测基团、改变与其相连接的分子重量供质谱检测的质量标签,等等。标记物可选自电磁或电化学材料。在某一实施方案中,可检测标记物是荧光染料诸如Cy-3或Cy-5。其它标记物及标记方案在本发明公开内容的基础上对于本领域技术人员而言是显而易见的。
检测部分可通过荧光信号、化学发光信号或任何其它可检测信号的发射被检测到,依该部分的特性而定。在可检测部分是酶(例如碱性磷酸酶)的情况下,可在存在酶底物和酶活性所必需的任何附加因素的条件下产生信号。在其中的可检测部分是酶底物的情况下,可在存在酶和酶活性所必需之任何附加因素的条件下产生信号。对于将可检测部分附着于靶分子而言合适的反应物构型包括可检测部分对靶分子的共价附着、可检测部分与共价附着于靶分子上的另一标记制剂组分的非共价缔合、以及可检测部分与非共价连接于靶分子上的标记制剂组分的共价附着。通用的蛋白质染色详述于美国专利申请US20080160535中。在某一实施方案中,检测部分是基于FRET配对的分子转换,例如,Alloswitch”(Orthosystems,Inc.),在已发表的美国专利申请US20060216692和US20060029933中有更进一步的描述。
“固相支持物”在本文中指具有分子可经由共价或非共价键直接或间接附着之表面的任何基底物。所述基底物材料可以是天然存在的、合成的或天然存在材料的修饰。固相支持物材料包括硅、石墨、镜像表面、层压板、陶瓷、塑料(包括聚合物,如聚氯乙烯)、环烯烃共聚物、聚丙烯酰胺、聚丙烯酸酯、聚乙烯,聚丙烯、聚(4-甲基丁烯)、聚苯乙烯、聚甲基丙烯酸酯、聚(对苯二甲酸乙二醇酯)、聚四氟乙烯(PTFE或TeflonfR])、尼龙、聚(乙烯丁酸盐)、锗、镓砷化物、金、银等,或单独使用或与其它材料联合使用。也可考虑另外的刚性材料,诸如玻璃,其中包括二氧化硅,还进一步包括,例如,可作为生物玻璃(Bioglass)获取的玻璃。可使用的其它材料包括多孔材料,诸如可控孔隙玻璃珠。还可考虑使用本领域已知能具有一个或多个功能基团的任何其它材料,诸如氨基、羧基、硫醇或羟基功能基团,例如,掺入其表面。固相支持物可采用从简单到复杂的各种各样的构型并且可以具有许多形状中的任一种,包括条带、薄板、圆盘、杆、颗粒,包括珠子、管子、井,等等。表面可以是相对平坦的(例如,载玻片、球形的(例如,珠子)、柱状的(例如,柱子)或有凹槽的。代表性的固相支持物包括,但不局限于,微量滴定井、显微镜载玻片、膜、顺磁珠、带电荷纸、过滤器、凝胶、Langmuir-Blodgett薄膜、硅片芯片、流过芯片、微阵列芯片、微珠和磁珠。
用于本文时术语“扩增”或“正在扩增”指增加某一分子或某类分子数量或拷贝数的任何过程或工艺步骤的联合。在某一实施方案中,“扩增”指聚合酶链式反应(PCR)。
用于本文时,寡核苷酸的一级结构指它的核苷酸序列。
用于本文时,寡核苷酸的“二级结构”指RNA或DNA二级结构,包括但不局限于发夹环、凸环、内部环、多分支环、假节结或它们的组合。
“预先选定的二级结构”指通过设计选定并改装入适配子的那些二级结构。
用于本文时,“可变序列”或“可变的核苷酸序列”指适配子内包括至少一个列举的或随机化位置的碱基序列。在某些实施方案中,“可变序列”还包括不变的核苷酸,其中该位置的核苷酸序列是与给定适配子种群中所有成员内的是一样的,只要至少一个其它的碱基不是恒定的即可。在某一实施方案中,可变序列被限制于适配子的单链区。在另一实施方案中,可变序列包含位置在双链区内且距单链区末端在三个核苷酸以下的核苷酸。“可变的核苷酸序列”可以是至少2个、至少5个、至少10个、至少15个、至少20个或至少25个或50个核苷酸长度。
“双链区”指其中两个单链区具有足够的互补性能相互配对的适配子区域。双链区可能具有不变的序列。在某些实施方案中,在最初意图作为单链的区域内包含随机化序列可能使得主干位置改变,因为随机化的位置可能能够相互碱基配对,从而使双链区延伸入先前的单链区内。换而言之,某些候选适配子的“单链”区域可能包括已变化的环位置,它可能采用超螺旋(Watson-Crick)或非规范配对、三重、四重的结构。
用于本文时,多联适配子是包含系列连接之碱基序列的一个或多个重复的连续核酸分子。所述连接可能是共价或非共价的。在某一实施方案中,链接的适配子包含两个或更多个同样的二级结构。在另一实施方案中,链接的适配子包含两个或更多个不同样的二级结构。在又一实施方案中,链接的适配子包含同样和不同样的二级结构的组合。
缓冲条件指缓冲液的化学特性、pH、加入的盐、变性剂、去垢剂、靶标与适配子候选物的摩尔比例,以及本领域众所周知调节靶标与核酸相互作用的其它参数。
用于本文时,术语“严紧”用于指温度、离子强度、以及其它化合物诸如有机溶剂的存在等条件,结合试验在所述条件下进行。
用于本文时,“过度采样”或“充足采样”指每个独特的适配子序列在文库中具有至少一个、优选多个拷贝且实质上可变核苷酸序列内的所有可能序列都表现在文库中。
用于本文时,“稀疏采样”指不是所有可能序列都出现在文库中。
用于本文时,术语“小分子”和类似的术语包括但不局限于肽、肽模拟物、氨基酸、氨基酸类似物、多核苷酸、多核苷酸类似物、核苷酸、核苷酸类似物、分子量小于大约10,000克每摩尔的其它有机和无机化合物(即包括异有机的和有机的金属化合物)。在某些实施方案中,该术语指分子量小于约5,000克每摩尔、小于1,000克每摩尔、小于500克每摩尔、小于100克每摩尔的有机或无机化合物。盐、酯和其它药用可接受形式的类似化合物也包含在内。
I.HTSA筛选
一方面,本发明可以用“溶解着”的方式进行实践,其中HT-适配子以溶液状态提供,而它与固定在固相支持物上的靶标结合。被结合的适配子然后被从靶标上洗脱下来,与适配器(adaptor)序列链接,PCR扩增后进行高通量测序。因此通过测序确定各个被结合适配子的身份和出现频率。
目前基于SELEX的适配子发现技术需要从含1014个不同的、30至120个核苷酸长度的完全随机化的SE-适配子候选物的高度复杂的集合开始连续数轮富集候选适配子。如图1所示,对结合靶标的SE-适配子的选择可以通过亲和层析完成,其中靶标被固定于固相支持物上。例如,Bock等人通过将它们与固定在伴刀豆球蛋白A-琼脂糖凝胶上的凝血酶结合来选择凝血酶特异的SE-适配子(TBA)(Bock et al.(1992)Nature 355,564)。随后未结合适配子的洗脱和漂洗使得选择到了保持结合于固定化凝血酶上的凝血酶特异性候选SE-适配子。在-甲基甘露糖苷存在的条件下洗脱并经苯酚提取后,用与各个SE-适配子退火的非生物素化和生物素化引物通过PCR扩增候选SE-适配子。生物素化的引物与各个SE-适配子的3’末端互补。然后使双链化的PCR产物结合链霉亲和素珠子并在碱存在的条件下变性,由此洗脱富集的候选SE-适配子序列。再进行5至20轮重复的分隔和PCR扩增后,潜在的胜出者被克隆并测序。利用类似的流程,Bock等人分离了32个凝血酶结合适配子(TBA),每个都具有图2的高度保守的主干和环结构,它随后显示出以高亲和力与凝血酶的活性位点结合。
尽管有了最初的成功,但SELEX方法仍然是艰巨的、耗时的并且不适于进行自动化控制。正如从该公开内容中可显而易见的,SELEX方法具有根本上的缺陷,因为起始文库的复杂性严重限制了可以存在于SELEX文库中的序列的多样性。如表1所示,在一70个核苷酸的适配子中的每个位置引入随机核苷酸会可能产生470=1.4×1042个不同的适配子候选序列。100pmol的70个核苷酸长的适配子文库只包含100×10-12X 6.022×1023=6.02×1013个序列。因此,即使在高浓度的情况下,SE-文库也很稀疏的被采样,也只能获取本文所述HTSA文库之丰富多样性中的很少一部分。当然,随机化长序列自然还包含较短的序列。例如,表1显示所有可能的20mer序列在含100pmol所有随机化NA分子的文库中平均出现55次,而所有17mer的序列则平均出现超过3000次。不过,所有实质长度的靶标结合序列不能被表现在所有可能的二级结构背景中-集合中的大部分多样性在建立H-键的联系中会被耗尽。这可能帮助解释了为何从SELEX被首次报道后的近20年内,只发现了针对约500个靶标的SE-适配子。
与SELEX不同,HTSA丰富预先限定了寡核苷酸文库成员的二级结构并通过在链内的位置系统性的限制了它们的序列多样性,从而建立了较小的、更可操控的序列集合,它们集中在一起筛选组合序列空间的巨大多样性。一般,每个文库包含109-1012个HT-适配子候选物,其中可变序列的每种可能改变平均至少出现一次。这是通过产生只30-50个核苷酸长的相对较短的HT-适配子并通常将可变核苷酸序列限制在单链区内和某些情况下限制在邻近双链区内来实现的。在某些情况下,目标单链区内的碱基随机化可以导致先前单链区内的碱基配对,造成现存双链区的延伸或形成新的双链区。
对SELEX所分离的适配子诸如图2(a)之凝血酶结合适配子的定性表明许多适配子的核心结合序列可被限制在相对简单的结构基元内,常常是环的形式或凸出结构。最简单形式的HT-适配子设计是如图3中所述的单个发夹环。在此例子中,双链主干是由8个碱基对形成的,它包括含有可变核苷酸区的单链环区。双链区可能有任何数目的碱基对,只要在适当的结合缓冲条件下碱基配对是稳定的即可。在某些实施方案中,主干可能包括可变长度和序列的一个或更多个凸出。可变核苷酸序列可以是至少1个、至少2个、至少3个、至少5个、至少10个、至少25个、至少50个、至少100个或更多个核苷酸长度。在某些实施方案中,可变核苷酸序列可能包含一个或更多个不变的核苷酸,它们可能在环内任何预先限定的位置。在其它实施方案中,可变核苷酸序列包含“m”数目的随机化核苷酸,其中每个位置可以具有四种可能核苷酸(对于DNA而言是A、T、G或C,对于RNA而言是A、U、G或C)中的任一种。在某一实施方案中,可变核苷酸序列包括修饰的核苷酸。在某些实施方案中,随机化核苷酸的数目m可以等于至少1个、至少2个、至少3个、至少5个、至少10个、至少15个、至少20个或至少22个或至少23个随机化核苷酸。在某一实施方案中,主干内的互补核苷酸序列是不变的。在另一实施方案中,双链区的一条链可能包含一个或更多个随机化序列。对于一个给定的HT-文库而言,每个HT-适配子的末端有一个或更多个短的单链区,例如4个核苷酸长,还有非互补头和尾序列,方便在进行连接、PCR扩增和高通量测序前与衔接头进行退火(更多的细节参阅下文)。
在某一实施方案中,HT-适配子包含任何已知的二级结构,包括但不局限于发夹环、凸环、内部环、多分支环、假节结或它们的组合(某些例子参阅图5,其中对于组图b、c、d而言可变位置的总数m=m1+m2+m3+...)。在其它实施方案中,HT-适配子可以是链接的,即,相同或不相同的HT-适配子序列的一个或更多个重复。
此外,HTSA文库设计允许以单次分离/PCR扩增步骤直接筛选文库。如图4这所述,在某一实施方案中,HTSA文库首先经由亲和层析分离,其中靶标诸如凝血酶等被固定于固相支持物如伴刀豆球蛋白A-琼脂糖凝胶上。在经漂洗、洗脱和苯酚提取以纯化被凝血酶所结合的HT-适配子后,将每个HT-适配子的尾部与衔接头退火、连接、任选的PCR扩增并用高通量测序仪(ABI SOLiD,Illumina Solexa,Roche 454Life Sciences,etc.)测序。利用2008年可买到的Illumina(Solexa)HT测序平台上的1/8芯片,一次可测定6×106个序列,最佳读取长度为35-40个核苷酸。因此HTSA方法较SELEX而言提供了显著增加的通量并将发现过程从通常的数周缩短至数天,且不需要自动化。
用SE-适配子文库观察到的低采样限制通过HTSA得到解决。为了对此进行解释,表1显示了当随机化核苷酸数目“m”从1增加到120时100pmol的HT-适配子文库中的序列冗余和复杂性变化。在其中各个适配子候选物长度约15nt的100pmol候选适配子集合中,有大约AM=6.02×1013个适配子候选物存在于该集合中。长度m的独特序列的数目等于4m。例如,若m=5,则存在pm=45=1,024个独特的环。因此每个独特序列的拷贝数等于6.02×1013/1024=5.9×1010。当m=15时,每个独特序列在集合中有大约56000个拷贝,且有0.006的概率任一特定HT-适配子不经PCR就被计数。
当m约为22且每个不同序列在集合中只有平均约3拷贝时,采集所有可能HT-适配子所涉及的问题只是变得明显了。这代表了在PCR扩增后可用目前的Illumina(Solexa)高通量测序仪检测并测序的HT-适配子的阈值数目。在选择步骤中使用超过100pmol并利用较新一代的测序仪,则可实现阈值m=23、24或25。单分子测序仪预计将很快进入市场,它不需要PCR步骤。这些对于HTSA的溶解状态模式尤其具有吸引力。
包括HTSA在内的所有适配子发现方法的一个根本局限性是令集合接触靶标的分离步骤从未能100%的有效去除未结合或弱结合的候选物。会有数千至数百万的随机选定分子被测序-这代表了试验背景的“噪声”。其它为结合或弱结合的候选物将被转入HTSA中的测序步骤。以m=15的100pmol发夹环为例,采集6×106个序列,并且无分离步骤,泊松分布预计将有31例其中随机发夹会被测序三次,而将近17000例其中随机发夹会被测序两次。
DNA序列分析领域内的技术人员可通过泊松分布设定保守的噪声基底。从已分离集合中确定的某个序列若其出现的频率高于针对随机序列多次出现的泊松估计值,则它就应被认为是可能的结合候选物。以m=15且6×106个序列已确定为例,在已分离集合中出现三次或更多次的发夹形候选物可被认为是“信号”。正如在下文中可见的,在这样的文库中已知对靶标具有高亲和力的适配子出现了数千次。
在某一实施方案中,提高分离步骤的严紧性可减少非序列特异性结合。例如,可提高缓冲液的离子强度,或者可在结合缓冲液中加入竞争性的寡核苷酸,例如那些包含候选HT-适配子的一部分双链区的寡核苷酸。
本领域技术人员将认识到靶标特异性适配子的选择可利用本领域已知的各种分离方法来完成,包括但不局限于免疫沉淀、凝胶迁移试验、动力学毛细管电泳、按大小分离以及需要经离心或磁领域技术分离的多种珠子试验。
HTSA方法特有的识别对靶标具有广泛亲和力的替代HT-适配子。为了比较不同候选HT-适配子序列的亲和力和特异性,可用荧光标记蛋白质筛选DNA-蛋白质微阵列,或者用表面等离子共振(Surface Plasmon Resonance(SPR))进行低通量、无标记的分析。此外,可将有效的HT-适配子与可能具有交叉反应性的其它蛋白质靶标接触进行微阵列分析以确定HT-适配子的特异性。
表面等离子共振(Surface Plasmon Resonance(SPR))是一种无标记的方法,用于测定动力学上的开启速率和关闭速率,以及由此而来的关于解离适配子-靶标复合物的平衡常数Kd。生物素化的适配子候选物可附着至SPR微阵列芯片的表面上。然后检测与结合蛋白质靶标相关的任何质量变化。因此,仪器通常可检测复合物是否为1∶1或不同的定量关系。尽管SPR的通量较HT-测序或微阵列分析要低(见下文),它仍然能有非常足够的通量来评估通过测序和微阵列试验的前100个最引人注意的候选适配子。
也可采用HTSA方法来精炼先前鉴别的适配子,诸如SELEX-来源适配子,即通过在适配子的一个或多个选定区域内引入定向突变并测定精制的适配子对其靶标的亲和力。
II.复合文库
另一方面,本发明可利用复合方法加以实践,其中HT-适配子文库被划分成数个集合,它们被固定至固相支持物例如微阵列芯片上高达106个或更多个的位置之一。每个集合被设计成包含HT-适配子可变序列内限定数目的已计数碱基,由此可以推断可预计数目的已知序列的不同适配子。然后靶分子与特异位点的结合表明集合中在该位置的至少一个HT-适配子包含针对靶标的结合位点。设计第二张微阵列芯片,其中每个位置只包含一个预计可在每个亚集合中找到的适配子候选物类型,然后重复与靶标的结合,由此可能无需直接测序而确定与靶标结合的任一HT-适配子的身份。
本发明提供了从被筛选寡聚物文库的化学特性以及产生的高亲和力靶序列两方面而言比现存体外选择方法更简单、更明确和更灵活的方法。当许多靶标类型需要研究时,本方法还使得其通量与体外选择相比较有巨大的提高。
由于SELEX实验中可能序列的范围广泛(例如对于随机30个核苷酸的伸展而言有1×1018个可能序列),直接分析和筛选所有序列是不可能的,即便对DNA/RNA合成仪设备进行高通量的改进也是不可能的。这样的“低采样”问题意味着在典型的SELEX文库中,相当数量的候选序列甚至是不存在于文库中的。与之形成对照的是,在本发明的一个应用中,程序被设计成通过位置驱动方法系统性的限制文库成员的序列多样性。具体而言,本方法的一个实施方案顺序保持预定数目的例如两个位点的变体-只在文库的亚集内-经过检查在可变序列链内,从而建立较小的、可操控的亚集(即芯片上的特征群)。合在一起,这些较小的亚集被用于筛选有巨大多样性的组合序列空间。我们有时称此复合文库筛选方法为Combigen方法。如上所述,这样的适配子文库中成员的二级结构被限定或预先选定。
本质上,本发明通过将文库的序列复杂性划分成简并集合的子集,解决了上文所提及的SELEX方法中的“低采样”问题。若总序列复杂性是4m-意味着可变序列的总长度是“m”-且“n”个核苷酸被选定在子集中保持不变,那么需要有个46子集,但每个子集只需要有4(m-n)个不同的序列来保证相同的理想序列复杂性。通过操纵这4(m-n)个数目,给定特征的物质限制现在可充裕的提供为保证各子集预期序列复杂性所必需的寡核苷酸数目-事实上,每个不同的序列可有足够的数目出现在子集中,例如,平均约3拷贝,优选4、5、6、7、8、9、10个拷贝,更优选12个或甚至更多个拷贝,导致“充足采样”或“过量采样”以保证复合文库的完全性。
图8利用6个位置(N6)的发夹环文库(即,m=6)描述了文库设计和筛选原理。对于完整的N6文库而言,存在46=4096个不同的序列(每个碱基位置有四种可能的核苷酸),如果我们每次检查两个碱基的序列亲和力(即,n=2),我们就将N6文库划分成16(即,4n=42)个子集的较小文库(N6-2文库)。第一轮,16个N6-2文库中的每一个具有一个适配子候选物子集,其中每个候选物具有能表示为“NNNNαβ”的可变序列,其中α和β在给定N6-2子集文库内是不变的。α和β的位置,在给定轮次中是相对不变的位置,图8中以箭头标出。16个子集文库中的每一个,以αβ的唯一组合为特征,将包含由四个前列位置(表示为“N”)的随机取代所产生的256个(即,4(m-n)=44)可能序列。因为256远远小于4096,而且微阵列芯片特征图可供给的寡核苷酸或适配子数目有上限,每个不同的序列有更多的机会被体现在特征图中。
仍然参照图8,针对α和β位置所关注的核苷酸在第一轮中被确定后(例如,来源于对靶标展示出相对高亲和力的文库子集),在随后的每一轮次中都有两个更多的核苷酸保持不变。在随后的每轮中,基于选自前一轮的一个或更多个子集文库产生了16个另外的文库子集。
假设GCATGA是针对环状结构的最终高亲和力适配子序列,那么第一轮将有一次命NNNNGA中,第二轮将有一次命中NNATGA,然后第三轮将展现出GCATGA。因此,对于N6文库,而言,三轮16个N6-2子集综合体(或3次芯片筛选)足以发现特别紧密结合的适配子。在第二轮中,由于“GA”已被确定为整个可变序列的一部分,该轮所需要的总序列复杂性是256。而且通过分配至子集中,第二轮内每个子集的序列复杂性下降到16。第二轮的假定命中序列“NNATGA”在第一轮中已表现出来,虽然在“NNNNGA”子集文库中的数目要小的多。因此,在随后每轮中阳性序列被进一步富集,如果所有的其它条件保持相似,则可以预期会有更强的结合信号。
以上方法的关键价值之一是立足于如何将限定的序列空间分配入序列集合或文库组中,提供了在随后筛选中展开选定文库组解析时其中理想亲和力的序列可以定位并被监测的背景。由此,本发明富集特征群内每个适配子候选物的数目,以避免文库的不充分或稀疏采样。理想亲和力可以是高于预定水平的亲和力,例如,正如通过结合解离常数所估量的。在某一实施方案中,理想的亲和力是根据所有文库子集中结合所产生的信号强度确定的在所有候选物中相对较高的亲和力。在其它实施方案中,理想的亲和力是弱亲和力、中等的或优选高的亲和力。回头参阅表1并如更早所描述的,对于每100pmol总长度大约50nt的适配子候选物而言,本发明可以提供平均约1个拷贝的23nt长的可变序列,平均约3拷贝的22nt长的可变序列,平均约14拷贝的21nt长的可变序列。
有许多方法和介质可用于检查这些文库组的亲和力:芯片、过滤器、凝胶迁移或本领域通常已知适于测试结合亲和力的任何其它方法。在某一实施方案中,微阵列芯片被用作一种快速的低成本的方法,以平行的高通量形式全面和比较性的测量数百万寡核苷酸/适配子特征群针对靶标的亲和力。
在某一实施例中,所述靶标是蛋白质。有数个研究小组已使用DNA微阵列来研究蛋白质-DNA相互作用(7,8);此工作的大部分集中于识别推定的转录因子(TF)结合位点(9-11)。Bulyk等人已将这些芯片和技术分别定义为“蛋白质结合微阵列”或PBM技术。这些文库芯片被设计成微阵列的每个特征区代表了完全限定的双链DNA文库序列,用于勾勒针对DNA结合蛋白质诸如TF的推定结合位点(11-14)。这些dsDNA特征一般经由引物延伸或自我形成发夹的序列产生(15)。相反,本方法,当其用于微阵列时,通常在最初的和随后的筛选中使用多元化特征直至达到最终芯片上每一特征代表了一个限定序列的解析度。而且,本复合文库构建体的“反应点”是在预先限定的二级结构内的,例如,发夹环、凸出或连接,而不在dsDNA螺旋内。此外,大部分PBM研究使用基于抗体的方法;虽然我们并未排除这种可能性,但在优选的实施方案中,本发明使用直接标记。微阵列芯片已被用于研究适配子(16-18);不过这些研究聚焦于将芯片作为用于辨别SELEX过程所产生之适配子碰撞的普通方法。这些适配子芯片在每一特征上使用完全限定的序列。
在某一应用实施方案中,靶标特异的适配子合并可转接的生物传感器,如已公开的美国专利申请US20060216692和US20060029933中所描述的。例如,AlloSwitch是当与其相关靶标结合时改变其形状的分子开关。将形状改变与荧光或发光报告子联合。AlloSwitch生物传感器的头部是对靶标具有高亲和力的核酸探针(HT-适配子)(图9)。例如,在HIV-1核壳体蛋白质(NC)开关的案例中,探针序列包含四个碱基的发夹环,它来自天然的RNA环,该RNA环结合塞口物(gag)-前体蛋白质内的NC结构域以便将基因组RNA包装入新的病毒颗粒内。所述技术可以应用于大批靶标,快速产生有关以下方面的响应指症:(i)针对非天然结合RNA或DNA的蛋白质的药物研发,(ii)公共供水中的污染物包括隐性芽胞虫菌、贾第鞭毛虫和大肠菌,(iii)生物恐怖制剂,和(iv)具临床或环境利益的其它靶标的宿主。
如图9中所示,AlloSwitch技术可应用于针对潜在的任何靶标的药物开发。探针或HT-适配子结合右手形式的靶标,将开关从开启(ON)跳转至关闭(OFF)。高亲和力的药物优秀者取代来自蛋白质的开关,将开关开启。通常,右手物种是O-形式的,其中探针是开放的,而探针是以左手H-形式隐藏的。图9还描述了AlloSwitch技术的数个特征。开关分子可以是DNA和/或RNA适配子,携带有附着于链上的荧光团(F)和淬灭剂(Q)。当缺乏靶标时,大部分开关处于开关的(荧光)开启状态(图9的左边),其中Q和F是远离的。在此状态下探针的重要结合元件隐蔽入携带覆盖链的碱基对中。靶标的加入使开关跳转至(淬灭)关闭状态,其中Q非常接近F。在关闭形式下探针经常采取具有未配对碱基或非标准氢键结合的不寻常折叠结构。AlloSwitch的关键要素是设置开关扳机以应对小数量靶标的能力。关闭/开启分子的比例K1可以通过优化所述开关的覆盖链的序列来加以调整。在某一实施方案中,关闭/开启分子的比例K1至少是0.01,并且当没有靶标时小于0.1。
实施例1:来自过采样结构文库之适配子的筛选
如上所述并如图2(a)所示,在对稀疏采样的60merSELEX文库进行5轮筛选并对32个克隆进行测序后,发现了15个碱基长的规范的TBA序列[Bock et al.(1992)Nature,355,564-566]。为了检验HTSA选择方法的效率,用m=15的发夹HT-适配子文库的全部序列空间探查能特异结合α-凝血酶的HT-适配子。在进行凝血酶选择实验后,另外还通过偶然发现鉴定了特异于己糖——葡萄糖和尤其是α-甲基-甘露糖苷的适配子候选物。此发现是偶然的,因为葡萄糖的作用呈现为亲和珠子的稳定器,而α-甲基-甘露糖苷是洗脱剂。除了直接分离适配子之外,HTSA还被证实可以通过提供高、中和低结合的序列变体的全面景象来有效地用于直接探查适配子序列空间,而无需利用突变研究或进行截断来发现核心结合序列。
如上所提及的,HTSA选择步骤的两个要素加速了发现过程。(1)利用具有相对较短(<22个碱基)简并区的组合文库使得可以以相对低的文库浓度完全覆盖所有的可能序列。(2)对文库过采样产生了多拷贝的各个可能序列(参阅表1)。每个序列的过表现与单一分配步骤联合可以确定由新一代测序仪器所产生的5-6百万个读取序列中频率远远高于背景的高亲和力结合者。
如上文所概述的,首先产生了具有恒定主干和非互补尾部区域的15mer短组合发夹文库(主干和尾部序列见图3)。100pmol文库包含约56000个拷贝的11亿可能的15merDNA序列中的每种序列。15mer的环结构文库被选定,因为α-凝血酶有一个特征清楚的15个碱基的规范适配子,产生的短文库序列(总共39nt)对于Illumina基因组分析仪而言大小是理想的,该仪器产生5-6百万个约36个碱基长的读取序列。
在划分步骤之前先构建文库,通过使用预定输入比例的以混合手性环合成的氨基磷酸核苷(nucleoside phosphoramidites)以便在随机化位置内产生等数目的四种碱基。在根据凝血酶对样品进行划分之前,用摩尔比例为1.00∶0.10∶0.010∶0.0010的4种不同的指定m=15的发夹进行剂量应答分析,没有针对靶标进行选择。320万已测序族群的计数直接与剂量成比例,为1.00∶0.11∶0.012∶0.0010,精确的代表了输入个数,从而消除了由于测序中合成过程造成的桥扩增引起的偏差干扰。
Bock等人先前已描述了文库分配条件。来自Bock等人之实验流程的60∶1的靶标∶DNA比例被保持以证实HTSA的效率。由于SELEX的特性-在以单拷贝的每个序列开始后需要多轮选择和扩增的“富集”循环。
因为HTSA具有单一选择步骤,在某一实施方案中,通过在数种方法中降低靶标∶DNA的比例、增加盐浓度、加入竞争物等,可实现较高的严紧性。在60∶1的比例时成功分离高亲和力适配子序列帮助证实了HTSA的效率,甚至在低严紧条件下也如此。在分离到高亲和力结合物后,准备样品供测序,即通过与Illumina系统所需的衔接头DNA分子连接并进行PCR扩增。连接产物和PCR扩增的验证通过进行琼脂糖凝胶电泳来完成。然后通过Illumina基因组分析仪对8道流过细胞中单道内的纯化PCR产物进行测序分析。
Illumina基因组分析仪每次分配实验产生约5百万个读取序列。用常规Perl转录物对输出的读取序列进行分析(表2)。为了确定已产生序列的准确性,我们评估了恒定已知指明主干和尾部区域的碱基信号后对每个碱基位置报告了准确度大于95%(表3)。转录产物还计算并通过频率大小排列每个输出序列,生成了一个FASTA文件分别通过ClustalX和Drawtree用于序列比对和产生系统发生数模式图(图10a)。Clustal广泛使用多重序列比对计算机程序来鉴别保守序列区并通过构建系统发生树确定进化关系。
基于某序列被计数的次数与其对筛选所针对靶标的亲和力之间存在关联的假设,可以用HTSA筛选与特异靶标结合的适配子序列。在所产生的约5百万读取序列中,适配子候选物是可辨别的,因为在来自理论上5百万个序列之数据组的泊松分布的3次测定中它们出现的次数比保守的背景计数要高数百至数千次(表4)。规范的TBA序列最频繁出现(总数46444),而α-甲基-甘露糖苷结合序列则具有第二高的计数,为29405个。两个构建体均引起它们的序列类似物和其它新的序列。至少出现10次的所有序列的序列比对和系统发生树揭示了3个不同的序列基元家族(图10a)。
为了验证所述发现,对这些序列与α-凝血酶的结合亲和力进行了研究。来自每个基元家族的最高频率序列被用于经由SPR分析的结合试验中(图10b)。SPR信号反映了除一个序列基元之外所有序列基元测序结果的趋势:基元III的计数与TBA基元相当但没有展示出对α-凝血酶的高亲和力。通过将基元III序列与TBA进行其最高竞争者连接效率和扩增速率的比较试验而消除了基元III序列造成的连接和/或PCR偏差的可能性。此外,所述序列不结合亲和基质的组分,即琼脂糖和蛋白质Con-A(图11c)。通过利用选择中所用的所有各个组分进行另外的SPR实验,发现基元III的最高竞争序列与碳水化合物部分结合最强(图11a-b)。与该发现相一致,用基元III最高竞争者进行的凝胶迁移实验显示了当存在Con-A时它对α-凝血酶的微弱亲和力会变小。这显示了Con-A对凝血酶糖基化侧链的竞争,在加入葡萄糖或α-甲基-甘露糖苷后该竞争消失(图11d)。此发现的主张在其它HTSA实验中得到了证明,其中选择实验中较高的糖水平导致了来自基元家族III的序列(39,940)具有较TBA(24,484)高的计数。
在一次选择实验中队针对两种不同靶标的适配子候选物的双重鉴定证实了HTSA的巨大前途。这是经由用SPR分析对计数和亲和力之间关联进行二级分析来揭示的。与SELEX形成的另一对照也是显然的,SELEX中重复的选择和PCR循环导致序列“怪物”,它在特异于靶标的理想适配子的花费方面可以在种群中占主要位置。HTSA显示出能容忍糖结合怪物,它们自身可能被证明是有用的。此外,图10c、d中所述的SPR实验肯定了集合中适配子将以与其亲和力相关的计数被测序这一基本前提。图10d中的数据显示了经由三次不同HTSA测定计算得到的总数之对数与通过SPR测定的相对亲和力之间有恒定的关系(序列见表4)。
HTSA中对新生代DNA测序技术的应用使得它可以有效探查凝血酶适配子候选物的序列空间。TBA基元的头108个序列被进行了序列比对,并且对15个可能文库位置中每个位置的每个碱基的频率进行了计数。序列比对概图展示了组成堆叠GC结构前半部分的TBA碱基GGTTGG的高度保守,而在中央环的TGT环之G位置的最大可变性是被容忍的(见图2a)。3’末端位置G14和G15也是在一定程度上可变的,无论如何,这是可能出现的,因为直接邻近主干碱基的也是(见图3),它也可能盖在其中TBA已知为折叠的G-四联体顶上。这些发现与先前有关TBA G-四联体的研究相一致。
我们还指出只有能形成G-四联体的适配子候选物才抑制α-凝血酶的活性。规范的TBA是最有效的,而TBA变体则具有按它们从HTSA实验计数得到的总数为顺序降低的性能。
关于结合人凝血因子IXa的链接RNA内部和发夹环结构文库的研究也获得了与此α-凝血酶例子相似的结果。此凝血因子的5’-和3’-末端由相同的DNA尾巴和主干底部6个DNA碱基对组成,如图3。固定序列的顶端6残基RNA发夹与RNA产生的中央内部环区域连接(m1=11和m2=5,总的m=16)。HTSA分辨出了一个针对因子IXa的已知高亲和力适配子,它具有m1=7和m2=1的内部环[Rusconi et al.(2002)Nature,419,90-94]。在与针对凝血酶的所述操作非常相似的Illumina操作中,HTSA的计数大于50000。此因子IXa适配子也显示出具有对因子IXa的高亲和力并且抑制该蛋白质的活性。
HTSA绕开了标准SELEX适配子产生中最慢的3个步骤:(1)多轮分配,(2)将序列克隆入质粒、挑选菌落并进行常规测序和(3)从长链末端截断序列以寻找适配子的核心序列。主要的花费下一代测序技术的成本,它可通过不同选择实验的复合测序而被减少。不过,生物技术实验室中的最大支出是关于训练良好的雇员的工资,因此测序的花费很快得到了补偿。此外,较新的测序技术为进行多重通道测序运转提供了机会,以便从应用于多重靶标的不同集合中分析胜出序列。
材料和方法
适配子选择在高亲和力结合者洗脱后,对被洗脱的混合物进行两次苯酚抽提,随后是最后一次氯仿抽提。经过浓缩后,令衔接头构建体与候选序列连接。连接步骤如下:将50μM衔接头序列和它们的互补序列加入已分配的DNA文库中并在90℃保温3分钟,在25℃加入连接缓冲液和T4DNA连接酶(New England BioLabs)并将混合物保温30分钟。用QIAquick PCR纯化试剂盒(QIAGEN)提取DNA并在2%琼脂糖凝胶上进行纯化,之后切下连接产物并用QIAGEN小量洗脱凝胶提取试剂盒(QIAGEN MiniElute Gel Extraction Kit)进行提取。PCR循环条件如下:最初在94℃变性2分钟,然后重复进行94℃变性1分钟、在61℃引物退火1分钟和72℃延伸1分钟共18次。在测序之前纯化PCR产物并用2%琼脂糖凝胶确认其长度。
DNA测序数据分析Illumina基因组分析仪(GA)在每个分配实验中产生了约4-6百万个读取序列。输出序列文件用常规Perl转录物(Perl Script)进行分析。针对含有其中包括15nt环区之全长文库序列的序列串,用严格的运算法则(低罚分容许极限)过滤输出的GA数据。包含≤2个碱基错配或者在“m”简并文库5’侧10个碱基内和3’侧4个碱基内包含单一缺刻的序列被归类为“候选读出序列”。不符合这些条件的序列被归类为“坏的读出序列”,并突出了实验中所遇到的衔接头连接或扩增问题。实验流程将所有解析数据输出成文本文件,进一步的描述参阅补充材料。头部序列的10个碱基和尾部序列中4个碱基的选择是优化实验流程和观察资料的结果,二者的结合足以最大程度的过滤掉坏的读出序列。在“候选读出序列”中,在可变“m”区域恰好15个碱基的序列被选作“好的读出序列”。这些序列随后被输入ClustalX以产生序列比对概图和系统发生树供进一步的分析。
凝血酶分析为了避免选择到针对污染物的适配子,用沉降速率实验检验选择实验中所用的α-凝血酶的纯度,证实其含稳定的约90%的纯度和约10%的自我裂解产物。在选择缓冲液中透析24小时后,用Beckman XL-A仪器进行α-凝血酶的沉降速率实验,其中的样品用280nm的光吸收进行监测。在整个21小时内用具有环氧树脂木炭填充的3mm中心的6通道细胞通过在20℃转速50,000rev/min来获取数据。用SEDFIT通过0.69mg/mL的v-棒分析所述数据[23]。
SPR分析用GWC
Figure BPA00001254923100301
阵列仪(GWC Technologies,Inc.)以及16和25张SpotReadyTM芯片测量结合亲和力。用V++成像软件获取SPR数据并在Microsoft Excel中进行分析。全部的SPR实验均在25℃下进行,使用选择缓冲液作为工作缓冲液。针对每个实验,通过将芯片在溶于纯乙醇的1mM的8-氨基-octanethiol(AOT)(Dojindo Molecular Technologies,Inc.)溶液中室温保温过夜、建立自我聚集的单层来使SpotReadyTM芯片(GWC Technologies,Inc.)表面功能化。芯片用纯乙醇漂洗并在氮气中干燥,然后与1mM的4-(N-马来酰亚胺甲基)环己烷-1-羧酸3-磺酸基-n-羟基马来酰亚胺酯(SSMCC)(Pierce Biotechnology)保温一小时以便产生硫醇-反应性马来酰亚胺端的表面。然后将已还原的3’硫醇化DNA寡核苷酸(2mM)以每个序列5次重复点在SSMCC处理过的芯片上并反应过夜。通过用无核酸酶的水进行漂洗去除过量的DNA,然后用氮气吹干。芯片用4mM的mPEG-硫醇(MW1000)(Nanocs)封闭过夜以便覆盖所有未被反应的SSMCC。一旦放入仪器中,所述芯片就用500nM牛血清白蛋白(Fischer Scientific)封闭、用配于选择缓冲液中的0.02%Tween-20以及随后用选择缓冲液(无Tween-20)进行漂洗。用50nM α-凝血酶进行结合实验,凝血酶被泵入以恒定流速流过的细胞流中10分钟,之后用选择缓冲液漂洗芯片。
凝胶迁移率转换实验(GMSA)将各个DNA适配子候选物在选择缓冲液中与α凝血酶、Con-A、α凝血酶+Con-A、Con-A珠子和用α凝血酶饱和的Con-A珠子预保温30分钟,所有都分开在存在和缺乏20mM葡萄糖和20mMα甲基甘露糖苷的两种情况下以60DNA∶1蛋白质的比例作为每次选择的条件。样品用天然聚丙烯酰胺凝胶(14%(w/v))在1X Tris/甘氨酸电泳缓冲液中于4℃以100V电泳30分钟进行分析。电泳结束后立即用SYBR金对凝胶染色1小时、照相,随后再用考马斯亮蓝进行蛋白质染色。
半定量实时PCR(sqRT-PCR)为了确认高通量测序中产生的计数代表了对靶标的亲和力而非“超”扩增偏差的结果,进行了sqRT-PCR。用等量起始模板DNA和PCR混合试剂准备了每个适配子候选物的12个PCR反应。PCR循环条件如针对选择过程所述的条件,只是重复了30个循环而非18个循环。每个序列有2个管子在第10、14、18、22、26和30个循环被拿出并通过凝胶电泳和Nanodrop DNA浓度读数比较它们的扩增速率。
凝血酶活性测定用纤维测量仪(fibrometer)Oatoclot 2(Helena Laboratories)测量双份试样的凝结时间。将正常的人血浆和不同浓度的DNA适配子候选物(0.1nM-700nM)在37℃保温4分钟,然后加入稀释于选择缓冲液中并且在37℃预平衡至最终α-凝血酶浓度为7.5nM的α-凝血酶。然后用通过在缺乏高亲和力结合DNA序列并且在不同的凝血酶浓度下测量血浆凝结时间对应凝血酶浓度所产生的标准曲线计算凝血酶的抑制程度。
在HTSA的“溶解状态”实例中所用的DNA序列如下文所列。所有的序列均以5’至3’的方向列出并且m=15。要注意的是衔接头互补序列拥有从每一方向进入文库恒定主干和尾部区域的悬垂,因此它们的长度更长。正向PCR引物还引入了5’悬垂序列因而使长度更长。悬垂序列与安置于Illumina流过细胞上的序列互补并因此方便了为测序而进行的已扩增文库与流过细胞的退火。所述测序引物实质上是衔接头1。
DNA序列:
结构化的DNA文库
ACACGCGCATGCmGCATGCGCCACA(SEQ ID NO.1)
衔接头1
ACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO.2)
衔接头1互补序列
GCATGCGCGTGTAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT(SEQ ID NO.3)
衔接头2
GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG(SEQ ID NO.4)
衔接头2互补序列
CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGTGGCGCATGC(SEQ ID NO.5)
PCR正向引物
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO.6)
PCR反向引物
CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT(SEQ ID NO.7)
测序引物
ACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO.8)
实施例2:利用复合微阵列芯片发现针对HIV-1核壳体蛋白(NCp7) 的高亲和力适配子
在本实施例中通过系统化搜寻整个装配于微阵列格式中的结构限定序列文库大大加速了发现紧密结合序列的过程。关于此研究,我们成功筛选了HIV-1核壳体蛋白p7(NC)所针对的以不同水平特征复杂性包含所有可能的3至6个核苷酸环序列的DNA发夹文库。在两次连续的芯片筛选中,我们发现了根据NC-色氨酸滴定检验确定以低nM亲和力结合NC的数个高亲和力DNA环序列。
材料和方法
DNA文库:N3-N6DNA发夹文库覆盖了所有可能的3到6个碱基的环结构序列(分别是21mer至24mer),总数达5440个独特序列。通过分别包括一束3(NNN)或4(NNNN)个简并DNA碱基位置,所述文库以64(图12a)和256(图12b)的集合复杂性(每个集合的#序列)被合成。用于随后芯片筛选的“被列举”的DNA发夹文库如图13a中所示。DNA发夹文库订购自IDT(Integrated DNA Technologies,Inc.),它包含3’末端生物素并经过标准的脱盐。DNA文库以标准化的100uM贮液放置成96孔板形式。
微阵列翻印:将DNA文库转移至384孔平板并用2x点样缓冲液(Arrayit,Inc.)1∶1稀释制备50uM的翻印贮液。用Omnigrid 100阵列仪翻印DNA文库,配备了本领域四种状态的100微米硅片插针。将文库翻印在特级链霉亲和素载玻片上,翻印数批,每批25块载玻片,湿度70%。将载玻片放置过夜晾干,随后保存于4℃的干燥器中。文库被翻印成4个相同的阵列(A、B、C、D),每个具有4个相同的文库“块”(1、2、3、4)。对照序列G(阳性):5’GGACUAGCGGUGGCUAGUCC和A(阴性):5’GGACUAGCGAUAGCUAGUCC具有针对NCp7的已知亲和力。
蛋白质标记:HIV-1NCp7蛋白质由Borer博士的实验室(Syracuse大学,化学系)提供。NCp7蛋白质的新鲜贮液以每周一次的基准制备于实验室中,根据SDS-PAGE所测定的,达到了一致性大于95%,并且是高产量的。在筛选之前,用氨基反应性Dylight 549或649试剂(Pierce Biotechnology)对每个蛋白质进行荧光标记。采用制造商的流程优化标记反应以便每个蛋白质获得1个标记。用Pierce Technology提供的亲和纯化树将未反应的标记物完全去除。
蛋白质筛选:将载玻片装上4孔垫圈并放到快速框架(Fast frame)上(图12)。为了减少背景结合,用特级链霉亲和素封闭缓冲液(Arrayit)在25℃封闭微阵列1小时。封闭缓冲液包含私有的标准去垢剂和牛奶蛋白质混合物。在封闭后,用筛选缓冲液(50mM PBS,Tween(0.1%),5mM MgCl2)漂洗载玻片两次。据Ellington及合作者报道此缓冲液组成是适于适配子微阵列筛选的合理的“通用”缓冲液。然后将蛋白质样品(100-500nM,150ul)转移至每个孔中、密封并温和摇动30分钟。载玻片用筛选缓冲液漂洗两次,在载玻片离心机中干燥并用配备了Cy3和Cy5过滤装置的Axon 4100A载玻片扫描仪进行扫描。获取载玻片的图像并用Genepix 5(Molecular Dynamics)分析。数据被输出至Excel中供进一步的分析。
NC-Trp滴定检验:在微阵列筛选缓冲液(PBS,pH 7.4,0.1%Tween-20,5mM MgCl2)中于25℃针对NCp7蛋白单独滴定寡核苷酸。随着在0.35uM NCp7样品中加入浓缩的等分试样寡核苷酸,在350nm监测Trp荧光。用PTI分光计(QM-4/2005SE,Photon Technology International,Birmingham,NJ)进行滴定并在每个寡核苷酸等分试样加入5分钟后用Felix 5.1软件获取数据。将数据输出至Excel并通过假定1∶1的结合模式用非线性回归分析拟合滴定曲线来确定针对每个寡核苷酸的Kd值。
结果:
用生物素化的DNA文库在链酶亲和素芯片上进行微阵列研究。微阵列的布局如图14a所示。为了最大化我们载玻片的“真实情况”,翻印了4个同样的阵列(A、B、C、D),每个具有4个相同的文库“块”(1、2、3、4)。利用改良过的框架装配(Whatman)可将4个分开的样品安排到单个载玻片上。单个“块”的翻译阵列布局如图14a所述。对照序列或已知对NCp7具有亲和力的适配子被翻译在每个“块”中以保证蛋白质在杂交期间的活力。为了保证统一的翻印和点浓度,用SYBR 555DNA染料(Invitrogen)对一批25张载玻片中的每张载玻片进行染色,如图14b中所示。SYBR 555计数与文库特征是一致的;不过对于NCp7对照特征G和A则由于其序列较短因而SYBR 555计数减少,而对于对照特征15和33而言则由于它们较复杂的二级结构被推测方便了较高的SYBR 555染色容量因而点较亮。
最初的研究是在包含具有多达256个序列的特征群的N3-N6多样性芯片组上进行的,它们与Cy3标记的NC(Cy3-NC)进行杂交。这些筛选产生了如图15a中所示的许多命中点。此芯片亮度概图在重复筛选中可高度重现,并且“命中”的特征的在一定的NCp7浓度范围内(10nm-1uM)始终存在。NCp7(NC)也适当的结合其RNA对照特征,强烈结合特征G(Kd=10nM),对特征A结合有弱结合(Kd=200nM)。此外,NC还适当结合对照特征15、33和sc,其中的每个包含丰富的GTG序列束并且具有结合若干NC蛋白质的能力,产生信号显现出非常高的亲和相互作用。此多重结合从下一节所论述的NC色氨酸滴定实验的结果中可明显的看到。这一特别的结果突出了辨别高亮度特征的重要性,假设具有单一高亲和力位点或多个低亲和力位点的序列可以具有相似的亮度。这是我们的复合特征芯片的一个重要方面并将对此进行详述。
Cy3-NC芯片概图的柱状图如图16中所示。我们观察到平均亮度等于或高于NC阳性对照G(在柱状图中表示为GUG)的数个特征。由于N3-N6DNA文库完全跨越了数个发夹环的大小,我们既可以评估每个环内每个序列集合的也可以评估不同大小环之间的相对亲和力。对于这些研究,我们只追踪最高亮度的特征,目标是将其进一步扩展以发现至少一个高亲和力序列。N6_56(64),TGTNNN始终被发现是芯片上最高亮度的文库命中序列并且在64个复杂性文库特征内,具有大约是对照GUG的1.5倍和背景(AUA)的3.5倍的亮度,紧随其后的是特征N6_54(64),TGGNNN。
总的说来,对于同一文库而言,所有64个复杂性文库特征(中间较暗的棒组)的平均亮度高于256个复杂性特征(右边较亮的棒组)的平均亮度。这是由于在256个复杂性特征中的每个序列具有较低的浓度,它是出现于64个复杂性特征中的相同序列的四分之一。尽管256个复杂性特征低于背景(AUA)的两倍,它们的相对亮度清楚展现了先前提及的特征N6-6(256)和N6-14(256)。
“扩展”芯片
N3-N6多样性芯片使得我们可以在单一微阵列中快速评估针对NC的3到6个碱基长的所有可能的DNA发夹环。在第二轮筛选中,N6_56(64)和N6_57(64)文库组被完全列举并以相同的FAST框架格式翻印至链酶亲和素芯片上(图14a)。N6_56(64)扩展组代表了来自“命中”特征的64个序列,而N6_57(64)代表了“非”命中特征的64个序列扩展组,如图13a中所示。将“非命中”文库组包括在内会提供关于“非命中”特征的真实性的有价值的认知。在进行筛选之前,用Syber555对N3-N6多样性芯片进行染色以保证特征和翻印浓度的一致(数据未显示)。
用同样的流程对载玻片进行封闭、与Cy3-NC杂交和漂洗。此筛选的结果和芯片的布局分别如图13b和13c所示。阳性对照特征(33、G、sc)全部是阳性,而阴性对照特征(A)则适当的显示出没有结合。将非命中序列翻印在阵列的上半部分,如图13c。如所预期的,在扩展的“非命中”文库组中没有命中特征(图13b),确认了N6_57(64)特征的“非命中”状态存在于N3-N6多样性芯片上(图15)。
将扩展的N6_56(64)命中组翻印在阵列的下半部分,如图13c所示。在此特征组中我们可以清楚的看到数个不同的命中(图13b)。强亮度特征N6_56_56具有环序列TGTTGT,而特征N6_56_24则具有环序列TGTGGG。这些特征代表了N6-56/57芯片上最高的两个命中。总的说来,来自扩展N6_56文库的所有的数个环是造成有关N6_56(64)和N6_14(256)特征的高信号出现于多样性芯片上的原因。此外,N6_56文库命中呈现出对于特征22-24、30-32和54-56是三个一套成束。这些束分别代表了序列家族TGTGGX、TGTGTX和TGTTGX,其中X代表了C、T和G碱基。它看起来似乎在环基元的3’末端中具有腺嘌呤(A)破坏了NCp7对6碱基发夹环的结合。
C-探针/NCp7间接筛选
在初始的工作中,通过监测蛋白质的色氨酸荧光测定在环区有点突变的SL3 RNA发夹构建体对NCp7蛋白质的亲和力。NCp7的色氨酸-37残基是发荧光的,并且在与核酸形成复合物时它的发射被淬灭。此行为允许进行定量荧光滴定,其中RNA(或DNA)被加入NCp7溶液中。然后对产生的数据进行分析以确定复合物的化学计量关系、在饱和状态残留的荧光水平和1∶1复合物的平衡解离常数Kd(19-21)。为了确认扩展NC芯片筛选的亮度概图,用NC-Trp滴定试验独立研究命中和非命中文库序列的总和。
这些NC-Trp滴定的结果如图17所示。在此,来自N6_56(64)扩展文库的3个命中(红色)和3个非命中(绿色)序列以及来自N6_57(64)扩展文库的3个非命中(深绿)被连同全部以蓝色显示的NCp7对照G、A和33(TBA)一起进行筛选。G(SL3-GUG)和A(SL3-AUA)的滴定本质上设置了全部1∶1(c-probe∶NCp7)复合物都可以被比较的限制。低于1∶1线条诸如TBA(蓝色Δ)的曲线表明了多个NCp7结合位点。与TBA中15mer G和A相关的发夹样结构会支持多重NCp7结合位点的存在。N6_56命中序列22、24和56全部追随高亲和力GUG曲线。它们的计算Kd值实质上完全相同(在20-14nM范围内)并且以1∶1的化学计量关系结合。这些特性几乎与RNA GUG对照序列(G)完全相同,证实了我们已从两次连续的微阵列筛选中成功发现了至少3个高亲和力NCp7DNA序列。同样重要的是N6_56(64)和N6-57(64)非命中序列34、57、3、12、25都追随低亲和力AUA曲线,具有从低uM至高nM之间的Kd值(图17)。这些序列的低亲和力是与它们非常低亮度的芯片特征相关联的。即使将序列46包括在N6_56非命中集合中,它在芯片上的弱亮度和115nm的Kd表现了它更多的作为“弱”命中的特征。
在这些研究中利用本发明的两个复合文库芯片我们发现了对NCp7蛋白具有低nM亲和力的一组新的DNA发夹构建体。每次蛋白质筛选耗时小于24小时以完成从标记蛋白质到分析蛋白质芯片概图的过程。FAST框架载玻片支架使得我们可以在24小时期间平行的并且在不同缓冲液条件下迅速处理多个载玻片。整个过程中唯一的“瓶颈”是等待IDT(整合DNA技术Integrated DNA Technologies,Inc.)递送生物素化的复合文库。这些筛选的结果在灵敏度、重复性和速度方面超越了我们自己的预期。此外,这些芯片研究和产生的概图适合用作有价值的对照文库用于进一步优化本发明的复合微阵列格式。
用于第一轮筛选的N3-N6多样性芯片覆盖了全部可能的3到6碱基环DNA序列(分别为21mer至24mer),总共5440个独特序列。利用环结构内的3或4个邻近简并位置将这5440个序列系统性的包含在110个特征阵列内。此简并性水平使得我们可以在单一芯片上研究关于3-6个碱基的发夹环大小的64和256个特征复杂性。NCp7由于其结合已知发夹环结构的能力被选定作为蛋白质靶标,此结合能力被用作对照特征。
N3-N6/NCp7筛选产生了如图15所示的数个命中。在这些命中中,特征N6_56(64),TGTNNN和N6_54(64),TGGNNN始终被发现是芯片上64个复杂性文库内最高亮度的文库命中。这两个特征序列均代表了有关6碱基发夹环组的最高亲和力序列集合。有趣的是特征N5_14(64),TGNNN和N5_6(64),GGNNN是5碱基发夹环组内的两个最高亮度命中。此趋势在较高复杂性的特征序列N6_6(256),TGNNNN和N6_14(256),GGNNNN中得到了延续,强烈表明了亲和的趋势。
在此我们成功的证明了64和256个序列的复合特征识别相同的6碱基环序列组TGXXXX或GGXXXX(其中X=A、G、T或C)。这是开发复合筛选方法中非常重要的第一步。在进一步的实施方案中,具有1024个(NNNNN或45)特征复杂性的适配子文库被构建。在实验较高特征复杂性的文库时,应通过例如用商品化的杂交仪使杂交和漂洗步骤自动化而使得人工漂洗造成的背景噪声最小化。命中信号的放大应该也有助于较高复杂性文库的分析。
若实验的目的是只发现最高亲和力的序列,那么重要的是保证没有高亲和力的命中被“隐藏”在非命中特征中。以较低的特征复杂性进行筛选(即较高分辨率的微阵列)将减轻这一问题,但会损失文库的覆盖度。本发明设想到了芯片分辨率与期望具有高分辨率序列空间的宽广覆盖度之间需要有微妙的平衡。在多个实施方案中,高密度微阵列平台诸如Nimblegen(Roche)、Geniom(Febit)和Agilent阵列被用于解决此问题。
在扩展的N6_56(64)文库组中,出现了数个不同的命中,它们对多样性芯片上亲本N6_56和N6_14(256)特征的总亮度有所贡献。环序列TGTTGT和TGTGGG代表了扩展N6-56/57芯片上的头两个命中。大体上,序列家族TGTGGX、TGTGTX和TGTTGX,其中X代表了C、T和G碱基,已被发现共同提高了亲本特征的总亮度。此结果证明了复合特征内的序列是共同作为一个序列“家族”结合的,这显示了其中只有单个高亲和力序列存在于复合特征中的情况是不太可能的。换而言之,拥有最高亲和力之“星”序列的复合特征将具有接近的序列同源物,它们将非常有可能以中等亲和力结合蛋白质靶标并提升蛋白质对该混合物的总亲和力。这些序列同源物对于鉴定最佳序列用作特异于给定靶标的适配子非常有用。它们还可用于辨别最少可能与靶标的已知干扰物交叉反应的适配子,仅通过在中等至高复杂性水平上筛选针对这些相同阵列的干扰即可。当然,随着特征复杂性的增加,特征内序列的同源性将变得更远。
用NC-Trp滴定检测对用复合微阵列方法发现的命中和非命中序列进行了进一步研究。此检测的一个重要方面是这些实验是在平衡条件下生理离子强度的均质缓冲溶液中进行的。可逆性和重复性被证实并且数据符合有关平衡常数和化学计量关系二者的预期。
在初始的用HIV-1基因组RNA SL3基元的RNA发夹构建体进行NC-Trp滴定研究中,具有GNNN环差异(43)的64个可能的SL3构建体中有24个显示出Kd值在20,000至10nM之间,对于这三个位置的亲和力有2000倍的变化(22)。有趣的是,主干序列和长度对复合物的稳定性影响很小,即使是DNA主干也只轻微的降低了亲和力(23),而用DNA取代RNA环结构残基则将复合物的稳定性降低了约10倍(24)。这些滴定研究中若干实验的结果表明关于SL3 RNA的最高亲和力序列环序列是GGUG,随后是GGGG(24)。在0.20M NaCl缓冲液,pH 7.4中,GGUG案例的解离常数值Kd是10nM(19-21)。所有的其它环序列均发现对NCp7具有较低的亲和力(24)。这些结果是与用复合芯片筛选方法发现的GTG和GGG DNA碱基模式(针对环结构位置4、5、6)的出现密切相关的。此外,我们的高亲和力命中序列也与Fisher等人的发现密切相关,他们使用表面等离子共振(SPR)来研究NC与一系列短的DNA寡核苷酸的结合。他们发现NC与d(G)同聚物紧密结合,而对d(TG)n则展示出高的多的结合,其中n≥5(25)。
通过此实施例中进行的工作,用两个Combigen文库芯片发现了对NCp7蛋白质具有低nM亲和力的一组新的DNA发夹构建体。每次蛋白质筛选耗时小于24小时以完成从标记蛋白质到分析蛋白质芯片概图的过程。使用分成许多间隔的载玻片支架使得我们可以在24小时期间平行的并且在不同缓冲液条件下迅速处理多个载玻片。整个过程中唯一的“瓶颈”是为了IDT(整合DNA技术Integrated DNA Technologies,Inc.)耽搁了一周以便合成和递送生物素化的复合文库。这些筛选的结果在灵敏度、重复性和速度方面超越了我们自己的预期。
说明书中确定的任何专利、专利申请、出版物或其他披露材料在此均全部收编作为参考。任何上述材料,或其中一部分,即收编于此作为参考,但与现有的定义、声明或本文所提出的其他公开材料相冲突的内容只在收编材料和本公开材料之间不出现冲突的范围内进行收编。
表1:含100pmol混合寡核苷酸的起始集合的DNA发夹环数目
Figure BPA00001254923100421
对100pmol文库的计算
AM=6.02E+13是文库中所有NA分子的总数。
m=有变化的环序列的长度.
pm=4m,是长度m的独特序列的数目.
Np=AM/pm,是只包括长度m的集合中各个不同分子的平均数目
H=6.0E06,是芯片可读取序列的数目
tm=H/pm,是长度m的集合中给定环结构平均次数,应在没有进行先前的分离步骤时测序
表2:Perl script产生的文件
表3选定文库中恒定主干区的后10个碱基至简并区左边的碱基调用统计
Figure BPA00001254923100432
表4针对α-凝血酶的适配子候选物的计数结果
Figure BPA00001254923100451
参考文献
1.Jayasena,S.D.(1999)Aptamers:an emerging class of molecules that rival antibodies in diagnostics.Clin Chem,45,1628-1650.
2.Gold,L.(1995)Oligonucleotides as research,diagnostic,and therapeutic agents.J Biol Chem,270,13581-13584.
3.Tuerk,C.and Gold,L.(1990)Systematic evolution of ligands by exponential enrichment:RNA ligands to bacteriophage T4 DNA polymerase.Science,249,505-510.
4.Ellington,A.D.and Szostak,J.W.(1990)In vitro selection of RNA molecules that bind specific ligands.Nature,346,818-822.
5.Fitzwater,T.and Polisky,B.(1996)A SELEX primer.Methods in enzymology,267,275-301.
6.Cox,J.C.,Rajendran,M.,Riedel,T.,Davidson,E.A.,Sooter,L.J.,Bayer,T.S.,Schmitz-Brown,M.and Ellington,A.D.(2002)Automated acquisition of aptamer sequences.Comb Chem High Throughput Screen,5,289-299.
7.Choi,Y.S.,Pack,S.P.and Yoo,Y.J.(2005)Development of a protein microarray using sequence-specific DNA binding domain on DNA chip surface.Biochemical and biophysical research communications,329,1315-1319.
8.Wang,J.,Bai,Y.,Li,T.and Lu,Z.(2003)DNA microarrays with unimolecular hairpin double-stranded DNA probes:fabrication and exploration of sequence-specific DNA/protein interactions.Journal of biochemical and biophysical methods,55,215-232.
9.Mukherjee,S.,Berger,M.F.,Jona,G.,Wang,X.S.,Muzzey,D.,Snyder,M.,Young,R.A.and Bulyk,M.L.(2004)Rapid analysis of the DNA-binding specificities of transcription factors with DNA microarrays.Nature genetics,36,1331-1339.
10.Berger,M.F.,Philippakis,A.A.,Qureshi,A.M.,He,F.S.,Estep,P.W.,3rd and Bulyk,M.L.(2006)Compact,universal DNA microarrays to comprehensively determine transcription-factor binding site specificities.Nature biotechnology,24,1429-1435.
11.Bulyk,M.L.(2006)Analysis of sequence specificities of DNA-binding proteins with protein binding microarrays.Methods in enzymology,410,279-299.
12.Bulyk,M.L.(2006)DNA microarray technologies for measuring protein-DNA interactions.Current opinion in biotechnology,17,422-430.
13.Bulyk,M.L.(2007)Protein binding microarrays for the characterization of DNA-protein interactions.Advances in biochemical engineering/biotechnology,104,65-85.
14.Bulyk,M.L.,Gentalen,E.,Lockhart,D.J.and Church,G.M.(1999)Quantifying DNA-protein interactions by double-stranded DNA arrays.Nature biotechnology,17,573-577.
15.Warren,C.L.,Kratochvil,N.C.,Hauschild,K.E.,Foister,S.,Brezinski,M.L.,Dervan,P.B.,Phillips,G.N.,Jr.and Ansari,A.Z.(2006)Defining the sequence-recognition profile of DNA-binding molecules.Proceedings of the National Academy of Sciences of the United States of America,103,867-872.
16.Li,Y.,Lee,H.J.and Corn,R.M.(2006)Fabrication and characterization of RNA aptamer microarrays for the study of protein-aptamer interactions with SPR imaging.Nucleic acids research,34,6416-6424.
17.Collett,J.R.,Cho,E.J.and Ellington,A.D.(2005)Production and processing of aptamer microarrays.Methods(San Diego,Calif,37,4-15.
18.Collett,J.R.,Cho,E.J.,Lee,J.F.,Levy,M.,Hood,A.J.,Wan,C.and Ellington,A.D.(2005)Functional RNA microarrays for high-throughput screening of antiprotein aptamers.Analytical biochemistry,338,113-123.
19.Paoletti,A.C.(2004)Ph.D.dissertation,Syracuse University.
20.Paoletti,A.C.,Shubsda,M.F.,Hudson,B.S.and Borer,P.N.(2002)Affinities of the Nucleocapsid Protein for Variants of SL3 RNA in HIV-1.Biochemistry,41,15423-15428.
21.Shubsda,M.F.,Paoletti,A.C.,Hudson,B.S.and Borer,P.N.(2002)Affinities of Packaging Domain Loops in HIV-1RNA for the Nucleocapsid Protein.Biochemistry,41,5276-5282.
22.Paoletti,A.C.,Shubsda,M.F.,Hudson,B.S.and Borer,P.N.(2002)Affinities of the nucleocapsid protein for variants of SL3 RNA in HIV-1.Biochemistry,41,15423-15428.
23.Paoletti,A.C.(2004)Ph.D.Dissertation,Syracuse University,Syracuse,NY 13244.
24.Shubsda,M.F.,Paoletti,A.C.,Hudson,B.S.and Borer,P.N.(2002)Affinities of packaging domain loops in HIV-1RNA for the nucleocapsid protein.Biochemistry,41,5276-5282.
25.Fisher,R.J.,Rein,A.,Fivash,M.,Urbaneja,M.A.,Casas-Finet,J.R.,Medaglia,M.and Henderson,L.E.(1998)Sequence-specific binding of human immunodeficiency virus type 1 nucleocapsid protein to short oligonucleotides.Journal of virology,72,1902-1909.
26.Bock,L.C.,Griffin,L.C.,Latham,J.A.,Vermaas,E.H.and Toole,J.J.(1992)Selection of single-stranded DNA molecules that bind and inhibit human thrombin.Nature,355,564-566.
27.Rusconi,C.P.,Scardino,E.,Layzer,J.,Pitoc,G.A.,Ortel,T.L.,Monroe,D.and Sullenger,B.A.(2002)RNA aptamers as reversible antagonists of coagulation factor IXa.Nature,419,90-94.

Claims (130)

1.包含多个适配子候选物的适配子文库,所述每个适配子候选物长度基本相同,并且具有一级结构和预先选定的二级结构,所述一级结构包含至少一个其中m个位置的核苷酸处于变化中的可变核苷酸序列,所述二级结构包含至少一个单链区和一个双链区,其中所述可变序列至少是所述单链区的一部分,并且
其中对于每100pmol所述适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列。
2.权利要求1的适配子文库,其中对于每100pmol所述适配子候选物而言,平均至少表现了大约6拷贝的每种可能的可变序列。
3.权利要求1的适配子文库,其中m至少大约是5。
4.权利要求1的适配子文库,其中每个适配子候选物长度大约是50-60个核苷酸,并且其中的m大约是25或更小。
5.权利要求1的适配子文库,其中所述每个适配子候选物具有共有的二级结构。
6.权利要求1的适配子文库,其中所述每个适配子候选物包含选自以下的寡核苷酸:DNA、RNA、PNA、修饰的核苷酸及上述任何的混合物。
7.权利要求1的适配子文库,其中所述适配子文库包含至少109个不同的成员。
8.权利要求1的适配子文库,其中所述每个适配子候选物长度在100个核苷酸以下。
9.权利要求1的适配子文库,其中所述每个适配子候选物长度在75个核苷酸以下。
10.权利要求1的适配子文库,其中所述每个适配子候选物长度在50个核苷酸以下。
11.权利要求1的适配子文库,其中所述适配子文库包含多个多联适配子。
12.权利要求11的适配子文库,其中所述多联适配子包含两个或更多个相同的二级结构。
13.权利要求11的适配子文库,其中所述多联适配子包含两个或更多个不相同的二级结构。
14.权利要求11的适配子文库,其中所述多联适配子包含相同和不相同二级结构的组合。
15.权利要求1的适配子文库,其中所述预先选定的二级结构包含发夹环、凸环、内部环、多分支环、假结节或它们的组合。
16.权利要求1的适配子文库,其中所述可变序列在某些位置具有随机化的核苷酸,而在其它位置具有不变的核苷酸。
17.权利要求1的适配子文库,其中所述可变序列包含在所有位置随机化的核苷酸。
18.权利要求1的适配子文库,其中所述可变序列完全在所述单链区内。
19.权利要求1的适配子文库,其中所述可变序列包含在所述双链区内位置的核苷酸并且距所述单链区末端在3个核苷酸以下。
20.微阵列芯片,包含权利要求1的适配子文库。
21.鉴定与靶标结合的适配子的方法,包括以下步骤:
(a)提供包含多个适配子候选物的适配子文库,所述每个适配子候选物具有长度基本相同的一级结构和预先选定的二级结构,所述一级结构包含至少一个其中核苷酸在m个位置处于变化中的可变核苷酸序列,所述的二级结构包含至少一个单链区和一个双链区,其中所述可变序列至少是所述单链区的一部分,
其中对于每100pmol的适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列;
(b)在允许所述适配子文库成员与所述靶标结合的缓冲条件下使所述适配子文库与靶标接触;
(c)分离至少一个被所述靶标结合的所述适配子文库的成员,并且
(d)测定所述被结合适配子候选物的所述可变序列。
22.权利要求21的方法,其中对于每100pmol的所述适配子候选物而言,平均至少表现了大约6拷贝的每种可能的可变序列。
23.权利要求21的方法,其中m至少是大约5。
24.权利要求21的方法,其中所述的每个适配子候选物长度大约是50-60个核苷酸,并且其中的m大约是25或更小。
25.权利要求21的方法,在步骤(c)之后还包括扩增步骤。
26.权利要求21的方法,其中步骤(c)包括分离所述适配子文库中被所述靶标结合的亚组分,并且其中所述方法还包括按照由步骤(d)的结果显示的它们在所述亚组分中出现的频率排列所述被结合候选适配子对所述靶标的亲和力的步骤(e)。
27.权利要求21的方法,其中所述每个适配子候选物包含选自以下的寡核苷酸:DNA、RNA、PNA、修饰的核苷酸及上述任何的混合物。
28.权利要求21的方法,其中所述适配子文库包含至少109个不同的成员。
29.权利要求21的方法,其中所述每个适配子候选物长度在100个核苷酸以下。
30.权利要求21的方法,其中所述每个适配子候选物长度在75个核苷酸以下。
31.权利要求21的方法,其中所述每个适配子候选物长度在50个核苷酸以下。
32.权利要求21的方法,其中所述适配子文库包含多个多联适配子。
33.权利要求32的方法,其中所述多联适配子包含两个或更多个相同的二级结构。
34.权利要求32的适配子文库,其中所述多联适配子包含两个或更多个不相同的二级结构。
35.权利要求32的适配子文库,其中所述多联适配子包含相同和不相同二级结构的组合。
36.权利要求21的方法,其中所述预先选定的二级结构包含发夹环、凸环、内部环、多分支环、假结节环或它们的组合。
37.权利要求21的方法,其中所述可变序列在某些位置具有随机化的核苷酸,而在其它位置具有不变的核苷酸。
38.权利要求21的方法,其中所述可变序列包含在所有位置随机化的核苷酸。
39.权利要求21的方法,其中所述可变序列完全在所述的单链区内。
40.权利要求21的方法,其中所述可变序列包含在所述双链区内的核苷酸并且距所述单链区末端在3个核苷酸以下。
41.权利要求21的方法,还包含在所述接触步骤之后的漂洗步骤,其中不与所述靶标结合的所述适配子候选物被缓冲液漂洗掉。
42.权利要求41的方法,其中所述漂洗步骤的缓冲液条件不比所述接触步骤中的缓冲液条件更严紧。
43.权利要求41的方法,其中所述漂洗步骤发生在竞争性寡核苷酸存在的条件下,所述寡核苷酸包含所述适配子候选物的所述二级结构的至少一部分。
44.权利要求21的方法,其中所述靶标包括多肽序列、核苷酸序列、脂类和碳水化合物。
45.权利要求21的方法,其中所述靶标包括病毒或细胞表面的肽、核苷酸、脂类或碳水化合物部分。
46.权利要求21的方法,其中所述靶标被固定在固相支持物上。
47.权利要求21的方法,其中所述靶标包括小分子。
48.权利要求47的方法,其中所述小分子的分子量为1000或更小。
49.权利要求21的方法,其中所述靶标包含标记物。
50.权利要求21的方法,其中所述步骤(d)通过高通量测序技术完成。
51.权利要求50的方法,其中所述高通量测序技术能在步骤(c)之后产生文库内的至少10,000个序列。
52.鉴别与靶标结合的候选适配子序列的方法,所述方法包括以下步骤:
(a)提供包含多个适配子候选物的适配子文库,所述每个适配子候选物具有一级结构和预先选定的二级结构,所述一级结构包含至少一个可变核苷酸序列,其中核苷酸在m个位置上是处于变化中的,所述二级结构包含至少一个单链区和一个双链区,其中所述可变序列至少是所述单链区的一部分,
其中对于每100pmol的所述适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列;
(b)将所述适配子文库分到适配子候选物的集合中,每一集合包含4m个适配子候选物,其中m代表每个适配子候选物的所述可变序列内随机化核苷酸的数目;
(c)将每个所述集合针对不同特征附着于支持物上;
(d)使所述支持物接触靶标;
(e)对展示出以高于预定水平与所述靶标充分结合的特征进行鉴定;
(f)随后从与步骤(e)中所鉴定的每个特征相关的任何候选集合中整理出亚集合,每个所述亚集合包含所述候选集合中所含有的一部分不同的候选适配子;
(g)重复步骤c)至步骤f)直到至少所述亚集合之一只有相同可变序列的适配子候选物;
(h)鉴定步骤(g)中所获得的至少一个亚集合中所述适配子候选物的所述可变序列。
53.权利要求52的方法,其中对于每100pmol的所述适配子候选物而言,平均至少表现了大约6拷贝的每种可能的可变序列。
54.权利要求52的方法,其中m至少是大约5。
55.权利要求52的方法,其中所述每个适配子候选物长度大约是50-60个核苷酸,并且其中的m大约是25或更小。
56.权利要求52的方法,其中所述支持物包含微阵列芯片。
57.权利要求52的方法,其中所述支持物包括滤器基材。
58.权利要求52的方法,其中所述亚集合是通过凝胶迁移鉴别的。
59.权利要求52的方法,其中所述每个适配子候选物包含选自以下的寡核苷酸:DNA、RNA、PNA、修饰的核苷酸及上述任何的混合物。
60.权利要求52的方法,其中所述适配子文库包含至少109个不同的成员。
61.权利要求52的方法,其中所述每个适配子候选物长度在100个核苷酸以下。
62.权利要求52的方法,其中所述每个适配子候选物长度在75个核苷酸以下。
63.权利要求52的方法,其中所述每个适配子候选物长度在50个核苷酸以下。
64.权利要求52的方法,其中在每个适配子候选物的所述可变序列内的所述随机化核苷酸数目m大约是25或更小。
65.权利要求52的方法,其中所述适配子文库包含多个多联适配子。
66.权利要求65的方法,其中所述多联适配子包含两个或更多个相同的二级结构。
67.权利要求65的适配子文库,其中所述多联适配子包含两个或更多个不相同的二级结构。
68.权利要求65的适配子文库,其中所述多联适配子包含相同和不相同二级结构的组合。
69.权利要求52的方法,其中所述预先选定的二级结构包含发夹环、凸环、内部环、多分支环、假结节或它们的组合。
70.权利要求52的方法,其中所述可变序列在某些位置具有随机化的核苷酸,而在其它位置具有不变的核苷酸。
71.权利要求52的方法,其中所述可变序列包含在所有位置随机化的核苷酸。
72.权利要求52的方法,其中所述可变序列完全在所述单链区内。
73.权利要求52的方法,其中所述可变序列包含位置在所述双链区内的核苷酸并且距所述单链区末端在3个核苷酸以下。
74.权利要求52的方法,还包含在所述接触步骤之后的漂洗步骤,其中不与所述靶标结合的所述适配子候选物被缓冲液漂洗掉。
75.权利要求74的方法,其中所述漂洗步骤的缓冲液条件不比所述接触步骤中的缓冲液条件更严紧。
76.权利要求74的方法,其中所述漂洗步骤发生在竞争性寡核苷酸存在的条件下,所述寡核苷酸包含所述适配子候选物所述二级结构的至少一部分。
77.权利要求52的方法,其中所述靶标包括多肽序列、核苷酸序列、脂类或碳水化合物。
78.权利要求52的方法,其中所述靶标包含标记物。
79.权利要求52的方法,其中所述靶标包含小分子。
80.权利要求79的方法,其中所述小分子具有1000或更小的分子量。
81.通过使适配子序列的某些区段随机化来完善模板适配子的理想特性的方法,所述方法包括:
(a)提供模板适配子;
(b)在所述模板适配子区段内引入随机化序列;
(c)实施权利要求21的方法,以及
(d)确定所述区段内所述的随机化序列中的哪一个提高了所述模板适配子对所述靶标的结合亲和力。
82.权利要求81的方法,其中所述模板适配子包含SELEX来源的适配子。
83.权利要求81的方法,其中所述区段包含发夹环、凸环、内部环、多分支环、假结节或它们的组合。
84.权利要求81的方法,其中对所述靶标的所述结合亲和力通过荧光偏振进行确定。
85.权利要求81的方法,其中所述靶标是被标记的。
86.通过对所述适配子序列的某些区段随机化来完善模板适配子的理想特性的方法,该方法包括:
(a)提供模板适配子;
(b)在所述模板适配子区段内引入随机化序列;
(c)实施权利要求52的方法,以及
确定所述区段内所述随机化序列中的哪一个提高了所述模板适配子对所述靶标的结合亲和力。
87.权利要求86的方法,其中所述模板适配子包含SELEX来源的适配子。
88.权利要求86的方法,其中所述区段包含发夹环、凸环、内部环、多分支环、假结节或它们的组合。
89.权利要求86的方法,其中对所述靶标的所述结合亲和力通过荧光偏振进行确定。
90.权利要求86的方法,其中所述靶标包含标记物。
91.基于适配子的生物传感器,包含:
(a)能结合靶标的测试适配子,所述测试适配子选自含有多个适配子候选物的适配子文库,每个所述的适配子候选物具有一级结构和预先选定的二级结构,所述的一级结构包含至少一个可变核苷酸序列,其中m个位置上的核苷酸是处于变化中的,所述二级结构包含至少一个单链区和一个双链区,其中所述的可变序列至少是所述单链区的一部分,
其中对于每100pmol的所述适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列;以及
(b)探测部分,所述探测部分附着于所述的测试适配子,
其中所述靶标与所述测试适配子没有结合允许检测来自所述探测部分的信号。
92.权利要求91的基于适配子的生物传感器,其中对于每100pmol的所述适配子候选物而言,平均至少表现了大约6拷贝的每种可能的可变序列。
93.权利要求91的基于适配子的生物传感器,其中m至少是大约5。
94.权利要求91的基于适配子的生物传感器,其中每个所述适配子候选物长度大约是50-60个核苷酸,并且其中的m大约是25或更小。
95.权利要求91的基于适配子的生物传感器,其中所述适配子文库包含至少109个不同的成员。
96.权利要求91的基于适配子的生物传感器,其中所述预先选定的二级结构包含发夹环、凸环、内部环、多分支环、假结节或它们的组合。
97.权利要求91的基于适配子的生物传感器,其中所述可变序列在某些位置具有随机化的核苷酸,而在其它位置具有不变的核苷酸。
98.权利要求91的基于适配子的生物传感器,其中所述可变序列包含在所有位置随机化的核苷酸。
99.权利要求91的基于适配子的生物传感器,其中所述可变序列完全在所述单链区内。
100.权利要求91的基于适配子的生物传感器,其中所述可变序列包含在所述双链区内位置的核苷酸并且距所述单链区末端在3个核苷酸以下。
101.权利要求91的基于适配子的生物传感器,其中所述测试适配子包含选自以下的寡核苷酸:DNA、RNA、PNA、修饰的核苷酸及上述任何的混合物。
102.权利要求91的基于适配子的生物传感器,其中所述测试适配子长度在100个核苷酸以下。
103.权利要求91的基于适配子的生物传感器,其中所述测试适配子长度在75个核苷酸以下。
104.权利要求91的基于适配子的生物传感器,其中所述测试适配子长度在50个核苷酸以下。
105.权利要求91的基于适配子的生物传感器,其中所述测试适配子包含多个多联适配子。
106.权利要求105的基于适配子的生物传感器,其中所述多联适配子包含两个或更多个相同的二级结构。
107.权利要求105的基于适配子的生物传感器,其中所述多联适配子包含两个或更多个不相同的二级结构。
108.权利要求105的基于适配子的生物传感器,其中所述多联适配子包含相同和不相同二级结构的组合。
109.权利要求91的基于适配子的生物传感器,其中所述探测部分包含寡核苷酸。
110.权利要求109的基于适配子的生物传感器,其中所述寡核苷酸包含荧光供体以及或者荧光受体或者荧光淬灭物。
111.权利要求91的基于适配子的生物传感器,其中所述靶标与所述测试适配子的结合诱导所述探测部分的构象改变从而引起荧光信号的变化。
112.用于鉴定样品中靶标存在的诊断试剂盒,所述诊断试剂盒包含:
(a)能结合靶标的测试适配子,所述适配子选自含有多个适配子候选物的适配子文库,每个所述适配子候选物长度基本相同并有一级结构和预先选定的二级结构,所述一级结构包含至少一个可变核苷酸序列,其中m个位置上的核苷酸是处于变化中的,所述二级结构包含至少一个单链区和一个双链区,其中所述可变序列至少是所述单链区的一部分,并且其中对于每100pmol的适配子候选物而言,平均至少表现了大约三拷贝的每种可能的可变序列:
(b)用于在所述测试适配子和所述靶标之间进行结合反应的试剂,以及
(c)将所述诊断试剂盒用于鉴定测试样品中所述靶标存在的说明书。
113.权利要求112的诊断试剂盒,其中对于每100pmol所述适配子候选物而言,平均至少表现了大约6拷贝的每种可能的可变序列。
114.权利要求112的诊断试剂盒,其中m至少是大约5。
115.权利要求112的诊断试剂盒,其中所述每个适配子候选物长度基本上是约50-60个核苷酸,并且其中的m大约是25或更小。
116.权利要求112的诊断试剂盒,其中所述每个适配子候选物包含选自以下的寡核苷酸:DNA、RNA、PNA、修饰的核苷酸及上述任何的混合物。
117.权利要求112的诊断试剂盒,其中所述适配子文库包含至少109个不同的成员。
118.权利要求112的诊断试剂盒,其中每个所述适配子候选物长度在100个核苷酸以下。
119.权利要求112的诊断试剂盒,其中每个所述适配子候选物长度在75个核苷酸以下。
120.权利要求112的诊断试剂盒,其中每个所述适配子候选物长度在50个核苷酸以下。
121.权利要求112的诊断试剂盒,其中所述适配子文库包含多个多联适配子。
122.权利要求121的诊断试剂盒,其中所述多联适配子包含两个或更多个相同的二级结构。
123.权利要求121的诊断试剂盒,其中所述多联适配子包含两个或更多个相同的二级结构。
124.权利要求121的诊断试剂盒,其中所述多联适配子包含两个或更多个不相同的二级结构。
125.权利要求121的诊断试剂盒,其中所述多联适配子包含相同和不相同二级结构的组合。
126.权利要求112的诊断试剂盒,其中所述预先选定的二级结构包含发夹环、凸环、内部环、多分支环、假结节或它们的组合。
127.权利要求112的诊断试剂盒,其中所述可变序列在某些位置具有随机化的核苷酸,而在其它位置具有不变的核苷酸。
128.权利要求112的诊断试剂盒,其中所述可变序列包含在所有位置随机化的核苷酸。
129.权利要求112的诊断试剂盒,其中所述可变序列完全在所述的单链区内。
130.权利要求112的诊断试剂盒,其中所述的可变序列包含在所述双链区内位置的核苷酸,并且距所述单链区末端在3个核苷酸以下。
CN2009801172500A 2008-03-12 2009-03-12 结构限定的适配子的直接选择 Pending CN102066562A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US3584408P 2008-03-12 2008-03-12
US61/035,844 2008-03-12
US11977708P 2008-12-04 2008-12-04
US61/119,777 2008-12-04
PCT/US2009/037022 WO2009151688A2 (en) 2008-03-12 2009-03-12 Direct selection of structurally defined aptamers

Publications (1)

Publication Number Publication Date
CN102066562A true CN102066562A (zh) 2011-05-18

Family

ID=41417311

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801172500A Pending CN102066562A (zh) 2008-03-12 2009-03-12 结构限定的适配子的直接选择

Country Status (6)

Country Link
US (1) US20110263459A1 (zh)
EP (1) EP2260103A4 (zh)
CN (1) CN102066562A (zh)
AU (1) AU2009258033A1 (zh)
CA (1) CA2718337A1 (zh)
WO (1) WO2009151688A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103732748A (zh) * 2011-08-12 2014-04-16 塔古西库斯生物株式会社 核酸适配体的制造方法
CN105483267A (zh) * 2016-01-15 2016-04-13 古博 血浆游离DNA双分子标记、标记和检测血浆cfNDA的方法及其用途

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9193968B2 (en) * 2008-03-12 2015-11-24 Aptamatrix, Inc. Library compositions and methods for acyclic identification of aptamers
JP2011193873A (ja) * 2010-02-26 2011-10-06 Canon Inc 核酸リガンドのスクリーニング方法
JPWO2012002541A1 (ja) * 2010-07-01 2013-08-29 独立行政法人産業技術総合研究所 標的分子の検出法
CN102234648B (zh) * 2011-06-09 2012-12-19 中国人民解放军第三军医大学第一附属医院 一种与弓形虫病毒具有特异性的弓形虫抗体适配子及构成的生物芯片
DE102011085473A1 (de) * 2011-10-28 2013-05-02 Albert-Ludwigs-Universität Freiburg Verfahren zur Identifikation von Aptameren
WO2013121201A1 (en) * 2012-02-15 2013-08-22 Oxford Nanopore Technologies Limited Aptamer method
EP2893061B1 (en) * 2012-09-05 2019-05-22 Arizona Board of Regents, a Body Corporate of the State of Arizona acting for and on behalf of Arizona State University Methods for discovering therapeutic targets
EP4170031A1 (en) 2012-10-23 2023-04-26 Caris Science, Inc. Aptamers and uses thereof
US10942184B2 (en) 2012-10-23 2021-03-09 Caris Science, Inc. Aptamers and uses thereof
CA2895847C (en) 2012-12-19 2019-01-08 Caris Science, Inc. Compositions and methods for aptamer screening
GB201318465D0 (en) 2013-10-18 2013-12-04 Oxford Nanopore Tech Ltd Method
US9765375B2 (en) 2013-06-28 2017-09-19 General Electric Company Methods for developing binding-elements and uses thereof
WO2015094958A1 (en) * 2013-12-18 2015-06-25 Albert Einstein College Of Medicine Of Yeshiva University Method of rapid isolation of aptamer beacons
EP3207155B1 (en) 2014-10-17 2019-06-05 Oxford Nanopore Technologies Limited Method for nanopore rna charicterisation
US10550393B2 (en) * 2015-03-06 2020-02-04 Tagcyx Biotechnologies Method for stabilizing DNA aptamers
US10546650B2 (en) * 2015-10-23 2020-01-28 Google Llc Neural network for processing aptamer data
KR20190134683A (ko) 2017-03-30 2019-12-04 어그매니티 나노 엘티디 기능성 올리고뉴클레오타이드의 선택을 위한 방법 및 조성물
WO2018226666A1 (en) * 2017-06-05 2018-12-13 Maumita Mandal Methods, compositions, and devices involving pseudoknot formation
WO2019055618A1 (en) 2017-09-15 2019-03-21 Arizona Board Of Regents On Behalf Of Arizona State University METHODS OF CLASSIFYING RESPONSES TO ANTICANCER IMMUNOTHERAPY
EP3733852A4 (en) * 2017-12-28 2021-09-29 Nuclixbio APTAMERIC MATRIX AND METHOD OF PREPARING APTAMER USING IT
US20210324374A1 (en) * 2018-06-04 2021-10-21 Chan Zuckerberg Biohub, Inc. Compositions and methods for screening aptamers
EP4038222A4 (en) 2019-10-02 2023-10-18 Arizona Board of Regents on behalf of Arizona State University METHODS AND COMPOSITIONS FOR IDENTIFYING NEOANTIGENS FOR USE IN THE TREATMENT AND PREVENTION OF CANCER
US20230313273A1 (en) * 2020-12-21 2023-10-05 Illumina, Inc. Selecting aptamers using sequencing

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5475096A (en) * 1990-06-11 1995-12-12 University Research Corporation Nucleic acid ligands
EP1635765B1 (en) * 2003-05-23 2013-07-17 Board Of Regents, The University Of Texas System Structure based and combinatorially selected oligonucleoside phosphorothioate and phosphorodithioate aptamer targeting ap-1 transcription factors
WO2006102540A2 (en) * 2005-03-24 2006-09-28 Syracuse University Elucidation of high affinity, high specificity oligonucleotides and derivatized oligonucleotide sequences for target recognition

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103732748A (zh) * 2011-08-12 2014-04-16 塔古西库斯生物株式会社 核酸适配体的制造方法
CN105483267A (zh) * 2016-01-15 2016-04-13 古博 血浆游离DNA双分子标记、标记和检测血浆cfNDA的方法及其用途
CN105483267B (zh) * 2016-01-15 2018-12-04 古博 血浆游离DNA双分子标记、标记和检测血浆cfDNA的方法及其用途

Also Published As

Publication number Publication date
AU2009258033A1 (en) 2009-12-17
WO2009151688A3 (en) 2010-03-04
CA2718337A1 (en) 2009-12-17
EP2260103A2 (en) 2010-12-15
WO2009151688A2 (en) 2009-12-17
EP2260103A4 (en) 2012-06-13
US20110263459A1 (en) 2011-10-27

Similar Documents

Publication Publication Date Title
CN102066562A (zh) 结构限定的适配子的直接选择
Stoltenburg et al. SELEX—A (r) evolutionary method to generate high-affinity nucleic acid ligands
EP2083269B1 (en) Method of assaying target substance in sample, aptamer molecule and method of constructing the same
WO2000004196A2 (en) Cis acting nucleic acid elements and methods of use
US20130217582A1 (en) Library Compositions and Methods for Acyclic Identification of Aptamers
CN113215167B (zh) 核酸适配体及其在检测大口黑鲈虹彩病毒感染的细胞中的应用
US20220333170A1 (en) Method and apparatus for simultaneous targeted sequencing of dna, rna and protein
WO2001044509A1 (fr) Procede de detection d'une sequence de bases cible
KR20180041331A (ko) 분자결합핵산 선정과 표적분자 동정 방법 및 키드, 그리고 그들의 용도
CN112029771B (zh) 一种特异性结合哌替啶的核酸适配体及其应用
WO2020206186A1 (en) Methods and systems to characterize tumors and identify tumor heterogeneity
WO1998016661A2 (en) Morphatides: novel shape and structure libraries
CN113462693B (zh) ssDNA核酸适配体在识别大口黑鲈虹彩病毒感染细胞中的应用
Ameta et al. Toward Evolution in Chemical Reaction Networks
US20020006620A1 (en) Morphatides: novel shape and structure libraries
Dausse et al. In vitro selection procedures for identifying DNA and RNA aptamers targeted to nucleic acids and proteins
US20020022227A1 (en) Morphatides: novel shape and structure libraries
CN113462694B (zh) 一种针对大口黑鲈虹彩病毒感染细胞的核酸适配体及其应用
JP2023524129A (ja) 反応混合物からの過剰なオリゴヌクレオチドの除去
KR20200042841A (ko) 성상교세포 특이적 핵산 압타머 및 이의 용도
EP4204566A1 (en) Novel x-aptamers for the use in detection of snap25
KR20230129675A (ko) 결합올리고뉴클레오티드의 제조 및 용도
Schürmann et al. Aptamer Adaptability: Utilizing Tumor Cell Surface Heterogeneity to Self-Select Appropriate Diagnostic and Therapeutic Agents
Chen Application of high throughput sequencing in selection of RNA aptamers
Smith et al. Photoaptamer Arrays for Proteomics Applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110518