CN101124333A - 使用固定化的捕获探针优化基因表达分析 - Google Patents

使用固定化的捕获探针优化基因表达分析 Download PDF

Info

Publication number
CN101124333A
CN101124333A CNA2004800392002A CN200480039200A CN101124333A CN 101124333 A CN101124333 A CN 101124333A CN A2004800392002 A CNA2004800392002 A CN A2004800392002A CN 200480039200 A CN200480039200 A CN 200480039200A CN 101124333 A CN101124333 A CN 101124333A
Authority
CN
China
Prior art keywords
target
oligonucleotide
probe
subsequence
transcripton
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800392002A
Other languages
English (en)
Inventor
迈克尔·休
苏堪塔·本纳吉
杨家诚
塔蒂亚娜·维纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bioarray Solutions Ltd
Original Assignee
Bioarray Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioarray Solutions Ltd filed Critical Bioarray Solutions Ltd
Publication of CN101124333A publication Critical patent/CN101124333A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

公开了样品中寡核苷酸的多重分析方法,包括:探针和靶“工程”的方法,以及由多个包括靶链和固定的(“移植”)探针层的弹性特征的因子,涉及调节探针-靶亲和常数K的测定分析方法;并且测定方法学涉及:调整测定信号强度,包括动态范围压缩和芯片上信号扩增;结合杂交介导检测和伸长介导检测,来定量确定表现高度信息相似性的信息丰度,包括,例如,同时确定未翻译的位于靠近mRNA3’末端的富含AU亚序列的相对表达水平,并识别特异类;和一种只需要单色标记的消减差异基因表达的新的分析方法。

Description

使用固定化的捕获探针优化基因表达分析
相关申请
本申请要求2003年10月28日提交的美国临时申请No.60/515,611、和2004年2月14日提交的美国临时申请No.60/544,533的优先权。
政府权益
美国政府代理处对本申请有一定权利,由于一些工作是在DAPPA合约下进行的。
发明背景
基因表达分析-基本的生物学过程诸如细胞周期进程、细胞分化和细胞死亡伴随着基因表达模式的改变,这种改变因此提供了一种在分子水平监控这些过程的方法。接触药剂可以影响基因表达模式,因此它们是对新药物效力和验证药物靶的有效的分子指示物。目前,基因表达分析与靶研究结合起着日益重要的作用。
基因表达分析也对分析多基因性状提供了一种系统的分子方法。在植物分子生物学和分子农业的主题中,选定基因的表达模式和它们的时间演变被发现应用于引导诸如提高生长率或水果、蔬菜的成熟等期望性状的“育种”。
表达水平的改变也是发病机理状态和进程的指示物。因此,已经知道功能肿瘤抑制基因的低-表达和/或致癌基因或原癌基因的超-表达与各种癌症的存在和进程相关。已经鉴别了特定基因,它们的表达模式经历特有的变异,在对炎症免疫响应的早期阶段,或暴露于致病药剂,包括普通的病毒诸如HSV或CMV以及生化战剂诸如炭疽。与蛋白标记诸如抗体相比,基因表达在免疫响应的最早阶段发生,从而提供较早和特异性治疗干涉的可能性。
因此,特定基因(“信息”)在接触传染药剂之后-或治疗之后的表达水平的快速定量分析和随着时间的演变,为疾病的预先分子诊断提供了重要的工具。然而,如本发明详述的,定量基因表达分析的标准方法产生不确定质量的数据。而且,作为分子诊断的可靠和可操作工具,基因表达分析和特异性多重表达监控(这里也指缩写“mEM”)必须步骤简单、快速完成、灵活地适应选择的基因组合、对控制交互-反应可靠、并确保特异性、能够获得必需水平的敏感度,同时在3至4个数量级的动态范围进行信息丰度的定量测定、并使用方便。
目前的方法通常不能达到这样的要求。即,尽管基因表达分析已经是靶研究的标准方法学,它作为诊断方法学的使用,尤其是在表达监控中,需要定量测定靶混合物中的cDNA水平,作为相应mRNA表达水平的一个度量,已经由于缺少灵活和可靠的测定设计而受限,这种设计确保快速、可靠和定量的多重分子诊断。
空间编码阵列-原位合成和“点”-当使用平行的测定格式时,基因表达分析的实际用途大大地增强了,这种格式使得在单个反应中同时(“多重”)分析多分析物。以通常操作的格式(见,如U.Maskos,E.M.Southern,Nucleic Acids Res.20,1679-1684(1992);S.P.A.Fodor,等人,Science 251,767-773(1991)),由提供布置于平面基质上的寡核苷酸捕获探针-或在一些情况下为cDNA分子-的一种阵列,并在使得形成探针-靶复合体的特定条件下把探针与含有感兴趣核酸样品的溶液接触,而确定基因表达水平;这些可以包括从特定组织提取的mRNA,或从mRNA反转录(RT)得到的cDNA。完成形成复合体的步骤(“杂交”)之后,除去未结合的靶分子,记录阵列内各位置的强度,这些强度反映了捕获靶的量。分析强度模式以得到关于样品中mRNA表达丰度的信息。这种“多重”测定格式在分析核酸和分子药物中的蛋白以及生物医学研究中日益被接受。
缺少灵活性、重复性和可靠性-然而,空间编码的探针阵列通常不能很好地适应于指定基因组合的定量表达分析。因此,在定制阵列中给定时间和费用,原位光化学寡核苷酸分析不能提供灵活的、开放的设计格式。结果是,在选择探针上提供灵活性的“点”或印制阵列,已经在需要使用仅仅受限的基因组合的应用中是优选的。然而,“点式”还要面对大致的技术挑战,类似于临床诊断的标准“带”测定格式遇到的,其通常不适于定量分析。重复性差,相关非-均一的覆盖、和不定的结构以及易接近单独点内的固定化探针,仍然是一个重要问题。另外,这些阵列需要使用昂贵的共焦激光扫描仪器以抑制基本“背景”强度,即使在随后的数据处理早期还需要数据分析,以解决非-均一探针覆盖和不均匀性。另一个问题是点式阵列的相当大的印迹,和大量的药剂消耗。最后,对于大比例诊断使用所需的水平的按比例增加的产量,与批处理过程比较将是复杂和经济上不适宜的,批处理过程诸如对本发明以编码的微粒的平面阵列形式的优选实施例可用的。
除了敏感度有限之外,其它伴随着基于阵列诊断的问题包括检测广泛变化的拷贝数目(从每细胞1或2拷贝至每细胞~104拷贝)的表达的基因能力有限。因此,需要的是一种测定方法,它避免了这些问题,由最大化检测敏感度、最小化交叉-反应并能够对转录物拷贝的广泛动态范围检测。
缺少特异性-现有技术的最普遍方法依赖于多重探针-靶杂交作为定量测定的单个步骤,并从多个靶序列辨别。在多重格式分析中的杂交有时缺少特异性(见提交于2002年10月15日的美国申请号No.10/271,602,标题为“由协同检测和酶-介导检测的多态位点多重分析(multiplexed analysis ofpolymorphic loci by concurrent interrogation and enzyme-mediateddetection)”)。为了增强特异性,一些多重杂交格式采用点式阵列中的长探针,如Agilent公司的EP1207209公开了优选长度10至30的探针,优选地大约25。这些可能有助于抵消点式探针中的随机障碍物和捕获序列的有限可得性。即,点式阵列中探针-靶复合体形成通常不涉及全长,而是涉及探针的随机可得亚序列。然而,如此处公开的,在固相格式中使用长探针通常将是达不到预期目标的。而且,缺少特异性仍然是问题的来源:如此处所示,交叉-杂交通常将歪曲强度模式,从而排除定量分析,除非采用谨慎的引物和探针设计,使用如同时待决申请(提交于2004年7月15日的美国申请号No.10/892,514“协同优化选择用于核酸分析的引物和捕获探针组合(concurrent optimization in selection of primer and captureprobe sets for nucleic acid analysis)”)的方法,并进行谨慎的、考虑非-同类探针与靶之间分子相互作用的分析。
差异性基因表达(“转录子分析”)-由于本领域标准方法具有这些困难、严重不确定性的可能、以及在绝对表达水平定量确定的错误,实践的格式通常优选地是差异性表达分析。这种格式鉴定正常组织或细胞与生病的或以其它方式改变的组织或细胞之间的差异,或正常(“野生型”)与转基因植物之间的差异。根据一种常用方法,一套cDNA克隆“点”在平面基质上以形成探针阵列,然后此阵列与来自正常或改变的来源的DNA接触。来自两种来源的DNA进行不同标记,以能够记录在两色渠道中由探针-靶杂交形成的模式,并因此能确定在正常和改变的样品中的表达率(见,如美国专利No.6,110,426(Stanford University))。两色荧光检测的系统是麻烦的,需要谨慎地校准激光扫描装置,通常需要此装置来读出点状或其它空间编码的探针阵列-以及对各两色通道分开扫描。这些缺点由此处公开的差异性基因表达消减方法克服,此方法只需要单个检测色。
复杂步骤-在通常操作的对多重表达的概述,目标样品中的mRNA分子首先反转录以产生相应的cDNA,然后置于与寡核苷酸捕获探针阵列接触,此探针由点或由原位合成而形成。Lockhart等人(美国专利No.6,410,229)调用一种复合步骤以产生cDNA,其中mRNA反转录为cDNA,然后在重度标记下cDNA转录为cRNA-平均每8个dNTP中有1个,并使用二级“装饰”步骤在合成的寡核苷酸探针上检测。这种费力、易于出错和昂贵的过程不仅大大增加了此方法的复杂度,还大大促进信息丰度和最终鉴定的不确定性,例如由产生非-线性扩增。
现有技术对多重表达分析的一个优选方法是使用随机放置的小反转录(RT)引物以把一套RNA转换成异源群体的cDNA,或使用针对mRNA的多聚A尾巴的通用RT引物以产生全长cDNA。尽管这些方法避免了需要设计序列特异性的RT引物,但都在定量表达监控上有显著缺点。
随机放置的RT引物将产生cDNA的代表群体,即,其中每个cDNA具有相等的频率,限制在于无限长的mRNA分子。由随机引物分析制定组合的小mRNA通常将产生对混合物中各类型mRNA具有广泛变化长度的cDNA,这反过来将在定量确定cDNA浓度时引导可能显著的偏移,假如小cDNA将比长cDNA更易于退火到固定化的捕获探针,如本发明详述的。而且,全长cDNA的产生,如果事实上全长RT成功,对探针与引物之间可能的交叉-活性提供大的序列空间,使得结果本身难以解释及因此结果是不可靠的。
靶和探针结构的作用-溶液中的DNA已经表现出显示由链熵控制的聚合物特征(见Larson等人,“流场中DNA分子的流体力学(Hydrodynamics ofa DNA molecule in a flow field)”,Physical Review E 55:1794-97(1997))。尤其单链(ss)DNA是相当灵活的,其本身的明显事实是,在实验最相关的条件下,只有几个核苷酸(nt)量级的小连续长度,比双链DNA的小很多(Marko JF.Siggia ED,“DNA的波动和超螺旋(Fluctuations andsupercoiling of DNA),”22:265,506-508(1994))。捕获ssDNA到固定化的探针,从而涉及对分子构象自由度一定程度的限制。同时,如果发生了二联体形成,在核酸分析的固相格式中使用的固定化的探针必须适应由弹性变形侵入靶链。视作聚合物的靶和探针分子构象的调整,迄今还没有用于对核酸分析的设计测定。
在前述考虑的观点中,对基因表达分析的诊断应用-这里也指多重表达监控(mEM)将期望具有灵活、快速、敏感和特异性方法、组合物和测定步骤。本发明公开了这样的方法和组合物,尤其是用于多重表达监控的快速、可定制、多重测定设计和步骤,优选地以用于多分析物分子分析的随机编码阵列检测格式。一种同样处于未授权阶段的申请公开了方法,由这些方法选择优化组合的期望转化探针(如RT引物)和检测探针(如用于杂交-介导的靶捕获的探针),以进一步增强可靠性的水平(见提交于2004年7月15目的美国申请No.10/892,514“协同优化选择用于核酸分析的引物和捕获探针组合(concurrent optimization in selection of primer andcapture probe sets for nucleic acid analysis”)。
发明概要
此处公开了样品中寡核苷酸的多重分析方法,包括:探针和靶“工程”的方法,以及由多个包括靶链和固定的(“移植”)探针层的弹性特征的因子,涉及调节探针-靶亲和常数K的测定分析方法;和测定方法学涉及:调整测定信号强度,包括动态范围压缩和芯片上信号扩增;结合杂交介导检测和伸长介导检测,来定量确定表现高度信息相似性的信息丰度,包括,例如,同时确定未翻译的位于靠近mRNA3’末端的富含AU亚序列的相对表达水平,并识别特异类;和一种只需要单色标记的消减差异基因表达分析的新的方法。
特定地,公开的方法、设计和组合物涉及:
(i)调节探针-靶亲和常数K(以及相应的对探针和靶的“变性”温度),以优化检测的敏感度,由使用涉及探针层弹性特性和靶限制的熵值,尤其是:
-控制靶(“转录”)长度和结构;
-控制选择转录子内的捕获亚序列,即,优选的放置捕获亚序列靠近转录子的5’末端;
-控制溶液中靶的浓度;
-设定移植的探针层;
-控制离子强度和pH以限制二联体形成于探针-靶区域,并最小化靶在溶液中复性;
(ii)系统地构造测定探查多重基因表达分析的优化组合物,并分析从其记录的强度模式;
(iii)进行测定方法学
-调整测定信号强度的动态范围,以适合大范围的信息丰度(从每10μl总反应体积大约1fmole至每10μl总反应体积大约10,000fmole),由:
-控制探针密度、探针长度以及靶相互作用,从而控制影响靶捕获的“包装”约束;
-调节阵列组合物,即结合位点的数目;
-调节转录长度、转录丰度和标记强度;
-由伸长-介导的序列特异性信号扩增增强敏感度;
-由结合杂交-介导的分析和伸长-介导的分析来检测高度同源序列而增强特异性;
-由只需要单色在特异基因表达水平检测“改变的”与“正常”样品之间的差异的消减方法进行差异性表达分析;
为了优化检测的特异性,多重反转录的序列特异性和检测由合适的选择引物和相应探针而优化,如在同时待决的提交于2003年7月15日的美国申请No.10/892,514,标题为“协同优化选择用于核酸分析的引物和捕获探针组合(concurrent optimization in selection of primer and capture probesets for nucleic acid analysis)”中所述的,合并以参考,为了方便也指“申请10/892,514”。
使用这些优化敏感度和特异性的方法,能够对指定组合的基因快速、定量地协同分析,通过如下方式:把指定组合的mRNA反转录为cDNA、并由捕获一套匹配的寡核苷酸探针而检测这些cDNA,优选地基于如此处公开的简单步骤,优选地避免需要单独的靶扩增步骤,从而简化步骤并减少完成测定的时间。此处描述的方法、步骤和设计对多重核酸分析的平行格式尤其有用,尤其是指定基因组合的表达模式的定量分析,此指定基因组合典型地包括2至100不同mRNA(“信息”),更典型地10至30信息,此处描述的方法是指多重表达监控(mEM)。此处描述的方法、步骤和设计可以有利地与多重表达监控的READTM格式一起使用,这种格式描述于提交于2002年8月23日的美国申请No.10/204,799,标题为“使用特异应用的随机颗粒阵列的多分析物分子分析(multianalyte molecular analysisusing application-specific random particle arrays)”,以参考的方式并入本文。
各方法、设计和组合物的用途和优点在以下详细列出。以下是附图的描述,其目的是理解此处列出的本发明。
附图说明
图1表示进行多重表达监控的方法的步骤;
图2表示涉及图1中方法的典型工作流;
图3A表示表I-1列出的探针和靶模型的滴定(“结合”)曲线;
图3B表示对图3A曲线的亲和常数(“K”)和每微粒的探针位点数目(P0),来自根据质量作用的原理对曲线进行回归分析;
图4表示微粒表面显示的荧光团的强度与浓度之间转换的校准曲线;
图5表示表I-1列出的探针和靶之间形成复合体的程度对靶长度的依赖性,以及根据幂律对数据进行回归分析的指数;
图6A表示表I-1列出的175nt靶模型与各种长度的探针之间形成复合体的吸收等温线;
图6B表示对图6A曲线的亲和常数(“K”)和每微粒的探针位点数目(P0),来自根据质量作用的原理对曲线进行回归分析;
图7A、7B、7C表示长度分别为175nt、90nt和25nt的靶与表I-1列出的各种长度的探针形成复合物的程度,对探针长度的依赖性;
图8A表示多引物-多探针(mpmp)设计,示意产生150nt cDNA的情况;
图8B表示从1,200nt卡那霉素mRNA应用这种mpmp设计产生的150nt cDNA和1,000nt cDNA的滴定曲线;
图9表示根据随机编码的阵列检测(READTM),杂交-介导的表达监控中涉及的步骤;
图10A表示图8所示滴定曲线转化得到的线性化的滴定曲线(“等温线”),是对3种不同长度cDNA的,各从卡那霉素mRNA反转录得到;等温线中的“折断”表示存在“稀释”和“浓缩”方式的吸收;
图10B表示在浓缩方式中捕获到固定化探针上的靶链的“印迹”;
图10C表示在稀释方式中捕获到固定化探针上的靶链的“印迹”;
图11表示描述在图10的等温线中从稀释到浓缩方式的拐点的值c*,对靶长度的依赖性;
图12A表示多引物-多探针(mpmp)设计,图示用于产生500nt cDNA的情况;
图12B表示比较对500nt cDNA的滴定曲线,其中一种cDNA是由捕获于匹配cDNA内部亚序列的探针而得到,另一种由捕获于匹配靠近cDNA 5’末端亚序列的探针而得到;
图13表示吸收等温线,以从图12所示500nt cDNA的滴定曲线转化得到的线性化表示;
图14表示由末端移植的聚合物链采用的不同结构作为移植密度的一个函数的示意图;
图15表示在捕获于末端移植的探针的过程中,靶链束缚的示意图;
图16A表示通过引入双功能聚合调节物,控制微粒表面上显示的探针的移植密度方法的示意图;
图16B表示探针与聚合物相互作用的较大视图;
图17表示纵座标的(标准化的)部分占用(fractional occupancy)对横坐标的量的变化,量与包括在阵列中微粒(“珠子”)的数目以及(非维度)靶浓度成正比;
图18表示由优化微粒冗余而产生的动态范围压缩效应,对50nt卡那霉素cDNA和对70nt IL8 cDNA存在的浓度范围为5,000倍,相应信号强度的差异只有大约20;
图19A表示探针和引物相对于mRNA靶的位置;
图19B表示对小cDNA稀释系列的表格,小cDNA是由反转录IL-8mRNA得到的,说明检测1fmole mRNA的较低限制;
图19C表示从图19B的表格绘制的曲线。
图20A表示探针和引物相对于mRNA靶的位置;
图20B表示对50nt cDNA的稀释系列,此cDNA是由此处特指的多步骤反转录卡那霉素mRNA得到的,包括示意cDNA“钉入”到8种细胞因子mRNA混合物中、和到人类胎盘RNA混合物中的稀释系列;
图21表示以直线表示的吸收等温线,由转化图19所示的稀释系列而得到;
图22表示由酶-催化的探针伸长和之后的装饰的信号扩增方法的示意图;
图23表示由应用图19所示信号扩增方法而得到敏感度提高的程度;较低的曲线表示记录的信号-在第一色通道中-来自标记的卡那霉素cDNA,而较高的曲线表示记录的信号-在第二色通道中-来自同样的卡那霉素,在探针伸长和之后的装饰之后。
图24A表示代表来自多重表达分析的表格,此分析在7种细胞因子和2种“看家”基因的板上进行;
图24B表示图24A中结果的柱状图;
图25A表示靶和探针在一种设计中的位置,这种设计能够辨别接近同源的序列,通过应用两步法的多态分析;
图25B表示连接有不同探针的4种编码的珠子;
图25C表示以图25A和图25B的探针测定的结果;
图26表示组合的定量确定浓度,和鉴别富含AU的mRNA序列的特异类的步骤;
图27表示来自玉米的玉米蛋白基因家族(azs22)的7种玉米基因的序列比对;
图28表示组合杂交和伸长的设计,能够检测玉米的玉米蛋白基因家族(azs22)内接近同源的序列;
图29表示组合杂交和伸长的设计,能够检测图28中鉴别的接近同源的基因16和31;
图30表示采用单检测色的消减差异基因表达分析的步骤。
发明详述
公开了方法、步骤和设计,包括用于增强方法可靠性的系统步骤,此方法确定多核酸分析物浓度水平(“丰度”),由捕获到锚定的寡核苷酸探针,尤其是包括对指定组合基因表达水平的协同(“多重”)分析。更具体地,公开了优化多重基因表达分析的敏感度、特异性和动态范围的方法,以及包括仅使用单检测色进行差异表达分析的消减格式的测定步骤。还介绍了一种对靶和锚定探针相互作用的显式现象描述,以评估控制此过程的实际亲和常数。一个优选实施例形成捕获探针的平面阵列,显示于颜色-标记的微粒上,而不需要扩增靶,如在此处描述的一种细胞因子参考板的情况,可以只在3小时或更短时间内完成从样品收集到数据分析(图1和图2)的定量多重表达监控。这些方法和设计用来解决多个问题,这些问题涉及捕获靶核酸链到固定化的寡核苷酸探针层。
I优化敏感度和动态范围:调制探针-靶亲和力
I.1控制杂交复合体(“双链体”)形成的序列特异性亲和力-杂交-介导形成两种寡核苷酸复合体(“退火的”)的标准分析,采用质量作用的原理以把复合的(“结合的”)探针和靶的浓度,c=[TP],与未复合的(“未结合”、“游离”)探针联系起来,此处优选地显示在编码的珠子上,p=[P],以及未复合的靶的浓度,t=[T],如下:
[TP]=K[T][P]
c=Kpt
类似于普通的计算“融化温度”的操作,使用现象学“最近-邻居”(NN)模型以代表相邻的碱基对之间相互作用,此碱基对对所给实验条件在探针-靶复合体内形成,条件包括盐浓度和温度,来计算(依赖于序列的)亲和常数。复合体形成的自由能,此处也指“结合能”或“浓缩能”,以以下形式计算:
ΔGC=ΔGNucleation+∑i∈NN-Pairs{ΔHi+TΔSi)
其中ΔHi和ΔSi分别代表焓和熵。反应式ΔGC=0定义“融化温度”,TM,广泛用于此领域以评价二联体的稳定性。
根据标准热力学,(序列间)亲和常数KSS,从以下表达式计算
KSS=K0exp(-ΔGC/kT)
其中K0代表一个常数,k表示玻尔兹曼(Boltzmann)常数。
给定亲和力常数和探针的初始浓度[P]0、和靶的初始浓度[T]0,靶-探针复合体的平衡浓度[TP],作为初始靶浓度[T]0的一个函数而得到。
使用此标准模型,计算复合体的融化温度和亲和常数,此复合体由175nt DNA靶与7种不同DNA寡核苷酸探针在55℃和盐浓度2M形成,此寡核苷酸探针长度从15nt至35nt。靶和探针序列示于表I-1。
表I-1
Seq ID   序列
靶175-merSEQ ID No.1   AG GGT AAA ATT AAG CAC AGT GGA AGA ATT TCA TTCTGT TCT CAG TTT TCC TGG ATT ATG CCT GGC ACCATT AAA GAA AAT ATC ATC TTT GGT GTT TCC TAT GAT GAA TAT AGA AGC GTC ATC ATC AAA GCA TGCCAA CTA GAA GAG GTA AGA AAC TAT GTG AAA ACTTTT TG
靶90-merSEQ ID No.2   T CAG TTT TCC TGG ATT ATG CCT GGC ACC ATT AAAGAA AAT ATC ATC TTT GGT GTT TCC TAT GAT GAA TATAGA AGC GTC ATC ATC AA
靶40-merSEQ ID No.3   C ACC ATT AAA GAA AAT ATC ATC TTT GGT GTT TCC TAT GAT
Seq ID   序列
靶25-mcrSEQ ID No.4   GAA AAT ATC ATC TTT GGT GTT TCCT
探针15-merSEQ ID No.5   CTT TTA TAG TAG AAA
探针17-merSEQ ID No.6   CTT TTA TAG TAG AAA CC
探针19-merSEQ ID No.7   CTT TTA TAG TAG AAA CCA C
探针21-merSEQ ID No.8   CTT TTA TAG TAG AAA CCA CAA
探针25-merSEQ ID No.9   CTT TTA TAG TAG AAA CCA CAA AGG A
探针30-merSEQ ID No.10   CTT TTA TAG TAG AAA CCA CAA AGG ATA CTA
探针35-merSEQ ID No.11   CTT TTA TAG TAG AAA CCA CAA AGG ATA CTA CTT AT
计算的融化温度和亲和常数概述于表I-2。对较长探针的较高亲和常数意味着对检测靶的有利敏感度。例如,使用直径3.2μm的颜色编码的微粒(“珠子”)的平面阵列以显示根据多分析物分子分析的随机编码阵列检测格式的探针,并设置每珠子的探针数为[P]0=105,质量作用原理提供以下对带有21-mer探针的较低限制的靶检测估计:
[T]min=[PT]min/K[P]0=[PT]min/1.7×1010/M×105
其中,[PT]min代表对每珠子确保测定所需的探针-靶复合体最小数目,[PT]min=103、[T]min≈0.6×10-12pM,对应每细胞信息单拷贝丰度的值。
表I-2
  探针长度   融化温度℃   亲和常数(/M)
    15     48.4     5.382×105
    17     56.1     3.536×107
    19     61.3     1.129×109
    21     64.9     1.712×1010
    25     71.1     1.116×1013
    30     74.0     2.717×1015
    35     76.2     7.823×1017
I.2靶和探针结构的作用:对测定设计的意义
如下所述,靶的尺寸和结构,以及基质-锚定探针的尺寸、结构和布置对探针-靶相互作用有实质的影响,导致实际探针-靶亲和力与由NN模型预测的偏移。
空间效应在捕获靶分析物到固定化探针的不利作用(“障碍”),尤其是探针可得性的重要性,已经在本领域中已知;见于如Guisan,J.M.“酶和细胞的固定化(Immobilization of Enzymes and Cells)”,Gordon F.Bickerstaff,Humana Press,Totowa,NJ.Pp.261-275(1997)。因此,描述了通过引入为了减轻关于靶“包装”的束缚的优选长度的间隔物而增强捕获效率的经验策略;见于如Southern E.等人,Nat.Genet.(suppl.)21,5-9(1999)。然而与已知方法相比,此处公开的方法在靶的一些特性与探针层之间建立了基础的相互连接,作为引导优化探针-靶相互作用的系统设计方法的基础。为了促进在形成二联体的过程中把靶或靶的部分穿入到探针层中,探针层压缩度鉴别为将要最大化的特性。更通常地,此处的设计标准反映了长度效应的本性和数量、移植密度和基质-锚定探针的静电荷、靶的长度和结构,以及选择捕获亚序列相对于靶的5’末端的位置对捕获效率和测定信号的效应。相反地,为了能够正确地确定靶丰度,公开了确定控制探针-靶相互作用的再-标准化常数的方法。
公开了设计选择锚定的捕获探针的尺寸、结构和布置,选择靶的尺寸和结构的方法、设计和设计原则,包括选择捕获亚序列、选择阵列组合物和步骤,为了调整探针-靶捕获效率和优化测定敏感度、特异性和动态范围。
为了建立设计标准,公开了基质-锚定的探针的长度、移植密度和电荷以及靶或指定的靶的亚序列的尺寸和结构,对捕获效率和测定信号的效应的本性和数量。根据多分析物分子分析的随机编码阵列检测(READTM)进行相关的实验,其中探针显示在颜色-编码的聚合物微粒(“珠子”)上,而且珠子布置在硅芯片上的平面阵列中。见提交于2002年8月23日的美国申请No.10/204,799,标题为“使用特异应用的随机颗粒阵列的多分析物分子分析(multianalyte molecular analysis using application-specific randomparticle arrays)”,以参考的方式并入本文。探针优选地由在5’末端共价键的方式“末端-移植”于珠子。对合成的DNA模型和由反转录1,200nt卡那霉素mRNA得到的cDNA模型进行实验分析,确立了靶和探针结构在靶与固定化组合的探针相互作用中的重要作用,即使当感兴趣的靶链是相对适度的尺寸时。
I.2.1合成模型靶-对大范围的标记合成DNA靶浓度,记录结合等温线,靶的长度从25nt至175nt变化,捕获探针长度从15nt至35nt(见表I-1和实例I)。
靶长度依赖性-为了研究探针-靶捕获效率对靶链长度的依赖性,将长度为25nt、40nt、90nt和175nt的,都含有一个共同亚序列的4个荧光末端标记的合成DNA靶,与显示于颜色-编码的直径3.2μm珠子上的19nt捕获探针杂交,此珠子布置于根据READ格式的平面阵列。代表性的结合曲线,揭示对靶长度L的显著依赖性。如图3A所示,靶越长,在所给低于饱和的靶浓度的信号强度越低;其中每个曲线的强度相对于在饱和的强度标准化了。
对实验亲和常数K*和可得到的捕获探针的数目密度[P]=p0的估计,由把每个谱调整到质量作用的原理而得到;结果概述于图3B。为了计算亲和力,认为信号强度I与每珠子捕获靶的数目的值c、和每靶荧光团的数目nF成比例,即I~nF c;I和c之间的互相转换由参考校准曲线而容易得出,描述于实例II及表I-3和图4。观察到的典型亲和常数级数为K*=108/M,其中靶长度大约等于探针长度,比由NN模型预测的低一个数量级(表I-2)。在饱和时占用的数目p0的典型值是每珠子105的级数。
在典型实验条件下,在基因表达分析的主题中,靶的尺寸将超过探针的尺寸,因此每个捕获的靶将结合多于1个探针;因此,饱和将反映一个珠子有限区域捕获靶的极值NT Sat。假定珠子表面以捕获的靶装饰,假定靶具有“松弛的”结构,其中靶的特征尺寸由其旋转半径设定,RG·T~aLυ,υ表示在3维良好溶剂中对理想链数字值υ=1/2,对自身-排斥的链υ=3/5(deGennes,“聚合物物理中的校准概念(Scaling Concepts in PolymerPhysics)”,Cornell University Press,1979)。因此,对于最小的靶,NT Sat~A0/RG·T 2或NT Sat~1/L。把p0与在饱和产量每珠子捕获的靶数目NT Sat视为一体,例如,对于最小的靶(L=25nt),平均分子区域为AT~4π(1.6μm)2/8*105~4*103_2,与从AT Relaxed~πRG,T 2~6.5*103_2得到的值可比较的值,当使用(实验)估计RG·T~9Lv≈45_(Tinland等人,Macromolecules30,5763(1997))。对于175nt的靶,比较相应的2个值产出AT≈1.6*104_2<AT Relaxed≈4.5*104_2。这些比较说明在饱和时,或者较大的靶分子不是松弛结构而是更致密的结构,或者它们不再是分开的但大致“重合”即互相穿入。
当把固定的靶浓度作为靶长度L的一个函数作图时,信号强度表现1/Lx依赖性(图5),其中3/2≤x≤2,靶长度从L=25nt至L=175nt,对每种长度的靶浓度从0.1nM至100nM变化超过3个数量级。尽管事实上所有靶由相同的19nt亚序列杂交于19nt探针(表I-1),说明二联体形成的同样“浓缩”能,靶长度的增加导致信号强度的基本减少。因此,对于所给长度的捕获探针,靶越长,越不利于形成二联体,有效亲和力越低。
控制探针-靶杂交的有效亲和力的能量-原理依赖性,提供了一种根据特定靶链长度调整捕获效率的方法。这是个非常有用的设计标准,在诸如由放置序列特异性的反转录(RT)引物能够控制cDNA长度表达监控的应用中。如详细讨论的,稀有的信息优选地转换为小的cDNA以最大化捕获效率。
探针长度依赖性-完整的一套结合曲线,诸如图3中对19nt探针所示的,使用一套长度从15nt至35nt的捕获探针而产生。对175nt靶的结合曲线示于图6A、6B,带有根据质量作用原理的调整,假定,如以上指出的,I~nF c,nF代表每分子荧光团标记的(平均)数目。对这一套,亲和常数的调整产出值数量级为K*=5×107/M,大约比由NN模型预测的低20倍(见表I-2)。在长度为25nt、90nt和175nt的靶的固定浓度时,信号强度的依赖性表现为随着探针长度增加的一个函数,见图7A至7C。对小探针长度的强度曲线显示了预期的增加,尽管小于由NN模型预测的;然而,对所有4种靶长度,在探针长度为大约30nt谱峰值或变平。这是从NN模型角度完全未预料到的。相反,如以下讨论的,这些结果说明,靶向固定化探针的捕获需要弹性变形,不仅是引入的靶链的变形,还有捕获探针层的变形。
I.2.2卡那霉素mRNA:选择转录长度并放设置捕获序列
还显示了在所给mRNA浓度,与合成靶,从反转录得到的cDNA(这里也指“转录子”)长度L的减少,产生对较小转录子测定信号的系统和显著增强,比从较长转录子得到的。如此处对1,22nt卡那霉素mRNA(Promega)所示的,通过选择合适的RT引物而产生长度从~1,000nt至~50nt的cDNA产物(实例III)。在靠近cDNA的5’末端处放置捕获亚序列表现出产生额外的增强。因此,捕获探针优选地设计为匹配位于靠近转录子5’末端的亚序列(见图8A)。这些增强都反映了结构对自由能的重要性,自由能控制靶与锚定的探针的相互作用。作为这些效应的结果,序列-依赖性亲和力KSS,缩减为有效亲和力K*(L)<KSS,显著地暗示对设计锚定的捕获探针和转录子,尤其是当可得到的基质表面的片断由吸收的靶覆盖时,超过特征值,γ*=c*/cmax
多引物多探针(mpmp)-RT程序-在有些情况,采用多反转录(RT)引物(图8A)从而可能从单个mRNA模板产生多个cDNA转录子,通过在靠近mRNA3’末端放置合并第一RT引物的较小cDNA、并在远离mRNA3’末端放置合并第二RT引物的较长cDNA转录子的方式。对每个cDNA,提供一个或多个捕获探针-这里是19nt(实例IV)。对多重表达监控的一个实施例采用READ格式,例如以图9所示的版本。
I.2.2A转录长度减少的效应-由如Sect.I.2.1中所述的化合物模型滴定结果引导,说明转录长度的减少缺少产生测定信号的实质增强。
对一定范围初始浓度的卡那霉素mRNA,根据mpmp-RT设计和测定步骤(实例IV)进行一系列RT反应,产生如图8A所示的滴定曲线。在从36nM至560pM的每个mRNA浓度,对150nt转录子记录的信号超过对1,000nt转录子记录的,尽管对1,000nt转录子的荧光团数目nF超过150nt转录子的。
例如,靶浓度对应于1.13nM,I150nt/I1000nt~3。实验观察的增强~3,例如在靠近拐点浓度(见图10A的“哳点”),与从转录长度L的减少预测的增强一致。即,由L从1,000nt减少至150nt而期望的增强将由~(1000/150)x(3/15),涉及长度减少的第一个因素,如在Sect.I.2.1中对靶模型(3/2≤x≤2)的讨论,第二个因素反映150-mer在所选的线性标记密度,nF(150nt)~3、nF(1000nt)~15。设定x=3/2,这预测产生增强为~3.5,与实验观察的可比较。
类似地,转录长度从1,000nt减少到50nt导致增强为~(1000/50)3/2(1/15)~6,涉及长度减少的第一个因素(x=3/2),第二个因素反映50-mer的事实,在所选的标记密度,将只含有平均一个标记。
线性化吸收等温线表示-进一步的观察通过滴定曲线以线性化吸收等温线的形式表示而得出,这种表示直接遵循质量作用的原理。对于反应P(探针)+T(靶)<->C,质量作用表示关系c=Kpt,其中c、p和t表示各自浓度,K表示亲和常数。设定p=c-p0、t=c-t0,p0和t0分别表示初始的探针浓度和靶浓度,得到c=K(c-p0)(c-t0),并假设c<<t0,如这里报道的实验,c=K(p0-c)t0或c=p0-c/Kt0。以后者的形式显示滴定结果,如上,信号I与c成比例,I~nFc,nF表示每个转录子荧光团的数目-突出c对c/Kt0的线性依赖性并能够从截距确定p0,从斜度确定K。尤其是,斜度的突然变化说明方式的拐点,如上下文中讨论的。
图10A显示了对此格式1,000nt和150nt转录子的滴定结果,以及以同样方式对50nt转录子得到的等温线。这3个曲线都表示了从由浅斜度和较高亲和常数代表的“稀释”方式,向陡峭斜度和较低亲和常数的“浓缩”方式变化的拐点。稀释方式的斜度对所有三种转录子是可比较的,说明相应的亲和常数的值相似。相反,浓缩方式的斜度和有效亲和常数是依赖转录长度的(见表1-4)。
表I-4
 cDNA长度(nt)   K[M-1](稀释方式)   K[M-1](浓缩方式)     拐点浓度[nM]   在拐点的片断平均[θ]
    1000     2×108     1×107     ~1     0.2
    150     2×108     1×108     ~1     0.2
    50     5×108     2×108     ~1     0.5
如表I-4中概述的,对所有转录子在浓度大约t0≈1nM的拐点,1,000nt转录子的亲和常数下降~20,150nt和50nt转录子的下降~2。即,有效亲和力的减少随着转录长度减少而越来越不明显。在稀释方式中,50nt转录子吸收等温线的斜度比150nt转录子的斜度小~2.5,说明前者相应的亲和常数值较高。
对此方式在较低平均值θ产生拐点,如以下讨论可见的。此线性化吸收等温线向标准朗谬尔(Langmuir)等温线的转化,1/{1+1/K t0}=c/ p0,显示占用探针的片断,c/p0=θ;如以下讨论的,更好地视作在t0占用的探针数目相对于在饱和时占用的数目的比值。尤其是,从浓缩方式推断到拐点方式表示,对于图10A的例子,K t0<<1且因此1/K t0=p0/c。使用以上这些在浓缩方式对有效亲和常数的估计,占用位点的估计片断,θ*=/c*p0,对150nt和1,000nt转录子拐点为~0.2。即,较大的转录子在片断地占用可得的珠子-显示的探针20%开始互相作用。
图11表示c*对转录长度的依赖性,c=1/Ly;有限的可得数据表示y≈3/2。此曲线描绘了稀释(低于此线)与浓缩方式(高于此线)之间的界线。通常,为了优化捕获效率和稀有信息的检测敏感度,有利的是在稀释方式操作,以受益于高效亲和常数。这个优点对长探针尤其显著。优选地,为了促进检测,靶在多个位置标记,例如在反转录过程中由合并标记的dNTPs。相反地,对实验记录数据强度的分析必须反映一个事实,即不同长度的cDNA,即使以相等的丰度存在,通常产生大致不同的信号强度。即,如果将要可靠地确定信息丰度,必须使用有效亲和常数来评估溶液浓度。
I.2.2B捕获探针放置的效应:末端捕获序列-此处还公开了控制捕获效率的有效亲和力,以及由位于靠近长转录子5’末端的捕获亚序列而增强测定信号和敏感度,如图12A所示,描述了RT引物的相对比对,以及相对于1,200nt卡那霉素mRNA内部和末端探针。图12B显示滴定结果的比较,此滴定结果是从捕获500nt转录子到两(套)不同的19-mer探针得到的,一套是位于靠近转录子5’末端的亚序列,另一套是位于转录子内部的亚序列。使用“末端”捕获探针导致在测定信号中比以“内部”探针记录的信号增强~1.5。根据等温线格式(图13)转化这些结果表明,把捕获亚序列放在靠近转录子5’末端的效果对等温线的效应,类似于由长度减少产生的效应。这与一种观点一致,即捕获末端序列是与捕获较小的靶等价的,需要较少的探针层结构调节和引入的靶,从而减少链熵-介导的排斥效应,如以下详述的。
迄今公开的结果说明,对信息丰度的定量确定需要谨慎地分析控制靶与锚定探针之间相互作用的有效亲和力。
I.3经验设计原则-将要检测的转录子的序列以“诊断”表达谱的先验知识,能够设计针对特定靶序列的捕获探针,以增强敏感度,优选地选择末端捕获探针,通过选择高于或低于c*的操作方式而调节动态范围,并优化特异性,其方法和设计详述于申请10/892,514。
以下经验设计原则对指导优化探针-靶相互作用有用。这些原则还指出在分析信号强度模式时需要相应的校正,如Sect.II进一步讨论的。
1-最小化靶长度
最小化靶长度L,为了最大化有效亲和常数K*=K*(L),此常数管理靶杂交于固定化的探针;
2-把捕获亚序列放在靠近5’末端
对所给的靶长度,把指定捕获亚序列放在尽可能靠近靶5’末端处;
3-选择操作的稀释或浓缩方式
控制有效亲和常数K*,管理特定靶与固定化探针的相互作用,由在稀释方式操作以实现K*的高值,或在浓缩方式操作以实现K*的较低值;
推论:压缩信号动态范围
对高丰度信息,产生长的转录子从而减少K*;对低丰度信息,产生小的转录子以增加K*,从而压缩信息丰度的所给范围到较小的信号强度范围;
4-调节定量分析的移植密度
为了定量确定靶浓度,为所给探针移植密度对捕获探针长度限制一个最大值,或为期望的探针长度限制移植密度从而避免“饱和”;
5-为最大敏感度调节层结构
设定移植密度σ为最大可能值,而不减少靶穿入率;在饱和时把σ限制到每靶预设小的多个探针;
6-束缚二联体形成(见以下)
选择大体积比的离子强度(以及实用的pH)从而最小化靶-靶二联体形成的比率,而不在探针层减少它;
这些经验原则将基于以下部分中研究的现象学模型而更精确。
II.靶的模型捕获到固定化探针层
II.1.概述
为了说明Sect.I显示的观察,并提供精化设计原则为系统的方法的基础,此方法引导选择优化的探针层和靶结构,本发明公开了用于捕获单链(ss)DNA或RNA靶到末端-移植探针层的现象学模型,每个这种探针设计为完全互补于同源靶内的指定“捕获”亚序列。尤其是,此模型观察在捕获探针与指定靶亚序列之间形成二联体,作为一个需要靶的一个部分穿入到探针层的吸收过程。这涉及探针层的弹性变形和束缚靶(的一部分),其伴随着失去结构熵。因此把锚定的探针-靶复合体的形成视作一个移植过程,其介导末端-移植的探针“单层”转化为探针-靶“双层”。
聚电解质刷-在一方面,此处显示的模型由聚电解质吸收到可变形基质的过程而告知,此基质表现聚电解质“刷”的特征,或在一些情况下,是聚合物“刷”,由末端-移植的探针组成(图14;Pincus,Macromolecules 24,2912-2919(1991)-由参考而合成;还见于Fleer等人,Sect.4:“界面的聚合物(Polymers at Interfaces)”,Chapman Hall,1993)。在横向密度σ的末端-移植探针层中,相邻探针之间的特征分离d,σ~d-2,每个探针在松弛或膨胀(“蘑菇”)结构的特征尺寸ξ_,相关为:只要ξ_<<d,单个“蘑菇”结构不由其邻居束缚;然而,当探针链开始重合时,“蘑菇”结构变得被束缚了,探针将渐渐采用“伸展的”结构,从而把探针层转化为“刷”,其中链末端趋向于向自由表面移位(Fleer等人,op.cit;Milner,Witten&Cates,Macromolecules 21,2610-2619(1988))。
如此处所述,锚定的寡核苷酸探针层内实现的高电荷密度,能够在多种外界条件下进行操作,具有实现多种探针层结构的可能性。这主要是由探针移植密度σ和有效线性电荷密度f确定的,0<f<1,f反映分裂的程度,探针层内响应溶液条件的探针α,溶液条件尤其是pH、温度和盐浓度CS
例如,由k表示对溶液反应AH_A-+H+的分裂常数,αBulk:=[A-]/[AH]以k给出,H+以αBulk=1/{1+[H+]/k};通常[H+]>[H+]Bulk且α<αBulk,并且f=f(α),或更准确地,f=f(k,CBulk S)。当本体溶液中盐浓度CBulk S低时,保留补偿离子以保持刷内部的电中性,代价是失去混合的熵。在相应渗透压作用下,期望链完全伸长,不考虑移植密度。相反地,在足够高的本体盐浓度,另外的协同离子和补偿离子可以穿入到刷中,并屏蔽与刷的静电相互作用;由于伴随着收集的补偿离子的渗透压减小,期望松弛的链结构的外观和层厚度的相应减少。在常常在常规杂交反应中实现的~100mM至~2M的高盐浓度下,可以导致收缩状态,其中补偿离子不再遍布层中但伴随着锚定的探针链(或探针-靶二联体)。
小的两亲化合物的界面膜-另一方面,此处的模型由吸收溶质即蛋白向单体分子(“朗谬尔(Langmuir)”)膜的过程而告知,此膜由诸如磷脂等两亲分子组成,表面活性剂或一些肽类吸收在空气-水或油-水界面。把溶质插入到诸如膜中,需要此处膜压缩,由链包装和结构的改变介导的,以类似于由横向压缩产生的方式。作为移植密度的一个函数,取向和自由程度的结构的相互影响可以产生多个相;对本目的,高度横向压缩性的相或共存区是重要的。尽管以下讨论采用聚合物理论的语言,需要理解的是,任何对小探针链层可能的伸长或束缚,由参考界面-吸收两亲(“朗谬尔(Langmuir)”)膜的已知相行为也包括在此处。
现象学模型是为了阐明对靶和探针之间形成二联体所需的靶的形变和探针层结构导致的弹性效果的重要作用,尤其是当靶或探针是固定化的时候。而且,它还提供了限制经验设计原则的基础,此原则描绘了用于靶捕获到固定化探针层和完成测定步骤的优化“操作方式”。例如,这种步骤可能需要靶-介导的、聚合酶催化的探针伸长,如以下与信号扩增的方法一起所示的,信号扩增的方法需要额外的包括酶的成分穿入到探针层中。
II.1.1探针层变形和靶限制:重标准化亲和常数
靶(的一部分)穿入进入末端-移植探针层,将增加那里的片断浓度并产生相应的渗透压;此外,引入的靶也将引起层的弹性变形,其由链伸长(“拉伸”)而介导,如图14所示。渗透压和链伸长的弹性能作用以抵制引入的靶,因此对二联体形成的自由能提供了排斥作用GP。此排斥自由能促进胶状悬浮液的熵稳定性;然而在这种情况优化的移植层结构使得链对接触的胶质颗粒的相互穿入最小化,优化捕获探针层结构的目标是促进靶链穿入进入层中。
在很低的移植密度,例如在d~σ-1/2>>RG,T的限制中,单独的探针呈现松弛的结构(“蘑菇”),尺寸为RG,T的~aPυ、υ=3/5,且靶捕获将在存在由本处链“包装”而强制的束缚时继续进行;然而,捕获靶的最大数目将小并且相应的测定信号低。相反地,在高移植密度,例如诸如d~σ-1/2≤ξT<<RG,T,尤其在产生全长链伸长的条件下,可得到的捕获探针的数目将高,但层的横向压缩性将低并且靶捕获将是低效的,测定信号低;其中ξT表示在部分伸长的靶中的特征性靶“团”尺寸。因此,为了优化靶捕获到固定化探针层,优化移植密度从而提供每单元区域最高可能数目的探针,而不大致减少可压缩性。例如,给一个实际的靶,其一个尺寸T的部分将参与二联体形成,可以通过提供尺寸T的合成靶并在固定的外界条件下确定测定信号而发现优化移植密度,此信号反应捕获靶的片断作为增加的移植密度的一个函数,直到在所得谱中得到一个平顶或峰值。“间接”的探针锚定到如柔性“骨架”,其又连接到固相,也可以减轻束缚。见于提交于2004年9月22日的美国申请No.10/947,095,标题为“带有多个能共价结合生物分子的官能团的表面固定化聚电解质(surface immobilized polyelectrolyte withmultiple functional groups capable of covalent bonding to biomolecules)”,以引用的方式并入本文。
为了与捕获序列接触,靶或靶的部分必须调整到探针层的本处结构或已经形成的合成探针-靶层(见图10B、10C、图15)。所得的靶链的限制和相应失去结构熵-即使在稀释方式-代表对二联体形成的自由能的排斥作用GT。对ssDNA或RNA强加的束缚的程度,将依赖于由这些聚电解质在预先存在于溶液中的特定未束缚(“松弛”)结构-即使不考虑序列特异性相互作用(“折叠”)的可能性,期望复合体相行为(见如,Schiessel&Pincus,Macromolecules 31,7953-7959(1998))。为了说明:穿入靶的长度为T的一部分,假设尺寸为RG,T~aTυ、υ=3/5的高斯(Gaussian)线圈结构,到本处移植密度σ的探针层,将需要靶变形的弹性能GT~(RG,T-1/2)2~a2T/σ。即,靶穿入到层中相对于相邻探针之间的特征距离d~σ-1/2的部分越大,靶的所需变形越困难。
序列依赖性的浓缩能GC,其促进形成探针-靶对,必须对这些自由能的排斥作用平衡,Gel=GP+GT;因此,管理探针-靶复合体形成的自由能具有形式G~Gel-GC。此自由能的这种形式的一个立即推论是序列依赖性亲和常数KSS“重标准化”为有效亲和常数K*<KSS。只要Gel<GC,仍将发生浓缩,但自由能具有较小净值-ΔG* C=-ΔGC+Gel、>-ΔGC,且相应较小的有效浓缩能表示较小的有效亲和常数,
K*~exp(-ΔG* C/RT)<KSS~exp(-ΔGc/RT);
和较低的“融化温度”T* M<TM,其中T* M从ΔG(T* M)=ΔGC(T* M)=0的反应式确定,TM从ΔGC(TM)=0的反应式确定。必须期望对序列特异性值的大致校正,事实上,弹性效应可以完全抑制二联体形成。
评估有效亲和常数的一个方法是此处描述的经验方法,使用定义的结构和探针层、和合成靶进行等温线测定,此靶包括一个只含有感兴趣的长度T的亚序列的靶、和另外的含有嵌入在总序列长度L>T的长度T的亚序列。忽略排除的体积效应,对所给探针长度P由移植密度σ和有效线性电荷密度f(0<f<1)确定探针层结构,有效线性电荷密度还反映实验条件,尤其是在本体溶液中实现的盐、pH和温度。从这些等温线确定,易于得到在各种靶浓度方式的有效亲和常数值。
另一种评估有效亲和常数的方法,补充于经验方法,采用探针-靶捕获的现象学模型以计算弹性和静电相互作用的效应。
II.1.2设计考虑
探针层结构:优选的光栅密度-对所给的移植密度σ,当探针链横向取代s与d可比较,即s~aPυ≈d时,在“蘑菇”结构中相邻链之间的重合开始发生,P代表探针长度,a表示单体或片断尺寸。随着υ=1/2,反应式变成a2P~d2~1/σ,并因此P~1/σa2。对感兴趣的捕获探针给出优选长度P,因此优选地调节移植密度从而σ<1/a2P。
考虑靶穿入以增加片断密度,以等价于增加探针密度的方式暗示对此规则的一种调整。对感兴趣的捕获探针给出优选长度P,期望穿入占用与探针至少相同的印记的靶的一部分,选择优选的移植密度诸如σeff=gσ<g/a2P,1/2<g<1;例如,随着g=1/2,即T=P(实现的一种较好接近末端捕获的情况,图12A、12B、13),选择σeff<1/2a2P以适应期望的插入靶。
探针层的自由能:渗透压和弹性形变-靶链或其一部分穿入到末端-移植探针刷,导致本处片断密度_的增加。对于区域A0、厚度D=D(σ)、含有np链的刷,_~S/A0D(σ)~(np/A0)P/D(σ),P表示每链中片段的数目;因此,_~σP/D(σ)。Φ的增加导致渗透压的增加,∏~_W,W表示特征指数,并在层压缩性中减小,χ:=(1/φ)_φ/_II.引入每个另外片断也导致弹性变形。例如,在由“团”串组成的刷中(图14),弹性变形减少特征“团”尺寸ξP,自由能中相应的值来自链片断的必需拉伸和刷厚度D=D(σ)伴随的增加。假设每个团都含有PB片断,ξP≈aPB v,得到PB≈ξP 1/v/a;如果每个长度为P的探针链含有超过刷厚度的P/PB团,D≈(P/PBP~aPξP 1-1/v并且由于ξP~σ-1/2,D~aPσ1/3。即,移植密度的增加导致层厚度的增加,这是链伸长的结果。这种类型的比例关系通常来自链弹性的排斥作用(如外排体积、静电相互作用)与吸引作用的平衡。
移植密度的控制-除非由固相载体表面上设置的吸收位点的横向密度限制,在由共价末端-移植形成探针层中实现的移植密度,反映了特征吸收(“结合”)能(每探针)和适应另外的探针所需的诸如成长的探针层的弹性形变排斥相互作用。即移植密度定义了每链的一种特征区域,AP~d2~1/σ。在这种情况下,移植密度反映固相载体的共价官能化相关的条件,尤其是探针浓度和培养条件。
实验观察捕获效率的最大值典型地为P≈30,暗示了每链的特征“印迹”。使用p0≈6*105(图6B)作为对每珠子(直径3.2μm)存留的靶(尺寸L=25nt)的最大数目的估计,并假设每个靶都杂交于一个尺寸上等于捕获的靶的探针,捕获靶之后估计平均分子区域为AP~π(1.6μm)2/2*6*105~0.65*103A2,或捕获靶之前值的两倍,后者对应于探针移植密度σ=1/AP≈7.5*1012/cm2。这表示“自身限制”移植过程的描绘-至少在用于此处提到的实验中的产生固相载体的条件下-产生一层,其中末端-移植探针不在松弛结构但在假设的部分伸长结构;部分伸长将与在伸长的“团”串形式的结构一致,此形式特征半径为ξP~(1.25*103A2/π)1/2~20_<RG,P≈9L1/2≈50_(Tinland等人,op.cit.),RG,F代表溶液中未束缚的探针链的旋转半径。即,在由“自身限制”移植过程产生的刷中,σ≈ξP -2
如此处讨论的,高的移植密度,尤其是在原位合成寡核苷酸探针的典型条件中实现的(Lipshutz,R.J.等人,Nat.Genet.(suppl.),21,20-24(1999);Shchepinov,M.S等人,Nucleic Acids Research 25,1155-1161(1997))通常是不利的。探针的点阵通常不产生末端-移植层,而是产生更复杂的“褶皱”层(Netz&Joanny,Macromolecules 32,9013-9025(1999)),其中分子可以在多个(随机)位点连接于固相,只除了探针序列的一小部分-先验未知和从点到点高度可变的-对靶是易接近的。在这种情况可能难以达到对移植密度的控制。
由例如引入一个中间步骤到微粒官能化的步骤中,实现了低于在“自身限制”情况中得到的值的预设值σ。尤其是,引入官能化聚合物形式的双功能的调节物,诸如分子量可调的双功能聚乙基乙二醇(“PEG”)分子、结合生物素的蛋白如中性亲和素、链霉亲和素或亲和素,或任何其它已知分子尺寸杂官能的聚合连接物,而对探针移植密度设定一个上限,其现在由调节物和其在珠子表面上横向“包装”的尺寸而确定(图16A、16B)。在使用READ格式的实施例中,在第一个步骤,调节物共价连接于颜色-编码的微粒(“珠子”),第二个步骤中,调节物由共价连接于捕获探针而官能化,优选地使用标准结合化学作用在5’端修饰引入一个官能团,诸如胺或生物素。
靶链限制:吸收的稀释和浓缩方式-探针层对靶插入的弹性响应的讨论表明,复合探针-靶层的弹性变形引起在吸收等温线中稀释方式与浓缩方式之间观察到的拐点(图10A),由位点c*(L)描绘,对其有限可得的数据表示c*~1/L3/2(图11)。
在小靶的限制中,捕获的重要效应将是在探针层内增加的片断密度,如以上讨论的,表示拐点以反映探针层的转变,或更经常地,由捕获特征尺寸ξ^P<ξP的探针形成的探针层和已经捕获的特征尺寸ξ^T<ξT的靶转变为低可压缩度的方式。即,当nT *ξ^T 2+nP *ξ^P 2~η*A0.,因此η*~(nP */A0)ξ^P 2+(nT */A0)ξ^T 2~p0ξ^P 2+c*ξ^T 2且c*~(η*-p0ξ^P 2)/ξ^T 2。对于特定情况ξ^P 2≈ξ^T 2 ≈ξ^2,c*+p0~η*/ξ^2,或假设ξ^2~Ly,0≤y≤1,c*+p0~η*/Ly;在特定情况nP *=nT *=n*,η*~(n*/A0)ξ^PT 2或c*=(n*/A0)~η*/ξ^PT 2,,其中ξ^PT 2代表探针靶二联体的印迹;其中如前0≤η*≤1。这种限制可以实现,或者由提供并非通常可得的操作设计的小靶,或者由把指定靶序列放在靠近靶的5’末端。后一种可能性结合图15表示。
相反,在大靶的限制中,准确类似于产生移植的探针层的“自身限制”移植过程,拐点反映了靶链在生长的捕获靶的层中初始的重合,此靶(总)尺寸为L,特征“印迹”为ξT 2;当nT *ξT 2~η*A0时发生靶的重合,0≤η*≤1,说明c*~nT */A0~η*T 2~1/L,其中η*A0代表由捕获的靶覆盖的可得区域的片段。
调节移植密度以使得靶穿入、束缚
对第二种情况导出的表达式代表设计原则,可以采用这种原则以优化探针层的移植密度从而确保根据图11描绘的边界实现稀释方式:
调节移植密度从而最大化c*~η*/L+p0(或对更普遍的情况的类似反应式,T≠P);例如,在优选实施例中,选择特定靶长度L,例如如对cDNA靶的情况由放置RT引物、然后调节σ。
这两种限制代表了更普遍情况的特定情况,其中拐点反映杂交探针-靶层弹性响应的转变。探针-靶杂交体的弹性变形,以及靶的弹性变形,假设了对二联体形成的束缚结构,此处也采用以计算观察到的靶捕获效率对1/Lx,3/2≤x≤2的依赖性,在对含有同样的捕获亚序列T记录的吸收等温线中,亚序列嵌入在增长的总长度L中的一个序列中。因此,“定位”一个占用有限体积的有限亚序列在体积为RG,T 3~L3v的“线圈”的可能性为~1/L3v,v=3/5。
低(大体积比)离子强度条件下的靶捕获:聚电解质刷-此处描述的关于本发明优选实施例的移植密度的典型值,即,每3.2μm直径(或~3*1012/cm2)珠子~106,符合高的层内体积电荷密度zCP。例如,对于长度P=20的寡核苷酸,假设相应的探针层厚度D~50A,CP≈106(π(3`2)2D)~10mM,对探针链的浓度,因此产生相应值fCP=200mM,f=20,对(完全离解的)骨架磷酸基团相关的本处电荷浓度。
在电化学平衡时,探针层内部和本体溶液中存在的阳离子和(聚)阴离子的浓度是由反应式C+C-=CBulk +CBulk -相互关联的。电中性条件需要在探针层内C++fCP=C+,在本体溶液中CBulk +=CBulk -=CBulk。因此,层内的阳离子浓度,对于所给的负电荷fCP,可以大致超过本体溶液中阳离子的浓度:
C+=1/2fCP(1+{1+(4CBulk 2/fCP 2)}1/2
例如,在限制CBulk/fCP<<1、C+~fCP>>CBulk。即,补偿离子留在刷中,即使离子浓度中存在大梯度;事实上,它们散布在有效体积Veff中,其小于体积V,是刷中由探针链占用的有限体积Veff~V(1-_)。
相应的Debye屏蔽长度ξE~l/κ,与每链骨架电荷fCP相关,来自表达式κ2=4πlBfCP,lB=e2/εT表示Bjerrum长度,CP=P/d2D。平衡由刷内捕获的补偿离子产生的渗透压∏=fCPT导致的排斥作用与链弹力,fCPT=kD/d2,弹力常数k=T/a2P,产生D≈f1/2aP,独立于移植密度,从而ξE≈d(a/4πlf1/2)1/2。这个尺度是由链之间的平均分离d以及移植密度设定的。在ξE<<D的限制,链伸长任何程度的装配,f>0,产生独立于移植密度的最大刷厚度。假定移植密度足够低,从而适应穿入引进的靶,捕获到结构为“钉床”的层,将继续进行而探针层没有重大弹性变形。回到符合“团”结构的部分链伸长由添加必需浓度的游离CO-和补偿离子而达到,从而确保与这些游离离子相关的Debye屏蔽长度κFree -1与ξE可比较,从而ξE可κFree≥1。对这样的屏蔽刷,内部结构,尽管质量上类似由“团”串组成的半稀释的聚合物刷,将响应本体溶液中保持的条件以保持电化学平衡。
封闭二链体形成于带电荷探针层的内部-在这种情况,尽管暴露于溶液中只有1mM的盐浓度,通常认为是排除二联体形成的(Primrose,“基因组分析的原理(Principles of Genome Analysis)”,Blackwell Science,1995),一旦靶穿入进入探针层,实际上遇到较高的本处盐浓度和静电屏蔽,其有利于二联体形成。即,探针层提供了使得探针-靶杂交的本处化学环境,名义条件为在本体溶液中极严格的,其抵消了ssDNA或RNA中二级结构的形成,并防止本体中dsDNA复性,并能够在探针层中形成(本处)二联体。此假定优选地根据以下原则实现:
调节移植密度,从而确保高刷内电荷和电中性的条件,以实现使得二联体形成的条件,同时在外部溶液中选择高严格性的条件,从而阻止形成二联体。
II.2步骤
II.2.1测定设计优化
给感兴趣的一个序列或多个序列,尤其是一套mRNA信息,如下进行,应用适合的设计原则:
S感兴趣的靶亚序列
L靶长度(核苷酸数目);
CT靶丰度;
ampC扩增后的靶丰度
SP引物序列
SC捕获序列(即,捕获到探针的将要分析的靶亚序列)
λ线性标记密度
P探针长度(核苷酸数目);
σ探针移植密度
CS盐浓度
C*拐点处的靶浓度
L*L(C*);
选择靶长度(C,C*,SP);   /*由放置引物,根据所给或期望的靶丰度选
                          择靶长度*/
{
    IF(CLOW)RETURN(L<L*);  /*确保在稀释方式操作*/
     IF(C HIGH)RETURN(L>L*);  /*确保在浓缩方式操作*/
}
选择捕获序列(ProbeSeq);    /*对引物和探针序列的优化优选地协同进行(见
                            同时待决的申请)
{
    RETURN(SC=末端捕获序列());
}
选择最终靶丰度(L,L*,C);    /*对所给的初始信息丰度,选择靶扩增条件以
                              建立操作方式*/
{
    IF(L>L*)
    {
        IF(C LOW)    RETURN(ampC≤C*);    /*稀释方式*/
         IF(C HIGH)    RETURN(ampC>C*);    /*浓编方式*/
    }
    ELSE IF(L<L*)
    {
       IF(C LOW)    RETURN(ampC>C*);    /*最好以稀释方式操作*/
        IF(C HIGH)
        {
         IF(C<C*)    RETURN(ampC≤C*);
         ELSE         RETURN(ampC=C*);
       }
    }
}
选择标记密度(L,ampC);    /*注意:如果m’plex RT或m’plex amp,λ对
                           所有靶是相同的*/
{
                           /*对于长靶:以稀释方式操作,选择高标记密
                          度*/
                          /*对于高丰度长靶:选择低标记密度*/
      RETURN(λ);
}
优化靶结构(L,λ,C,SC,SP,S)
{
  IF(C 固定)       L=选择靶长度(C,C*,SP);
  ELSE IF(L 固定)      ampC=选择靶丰度(L,L*,C);
  λ=选择标记密度();
  SC=选择捕获序列(ProbeSeq);
}
优化探针层结构()
{
  P=选择探针长度();         /*最大化KSS同时最小化交叉杂交*/
  σ=调节移植密度(P,L);    /*探针越长,σ越低,允许已知长度的靶插入*/
}
优化表示()
{
   选择类型冗余()
}
优化反应条件()
{
  选择离子强度();
}
  main()
  {
FOR(指定套的每个靶)
       {
          优化靶结构0;
          优化探针层结构();
          优化表示();
       }
       优化反应条件();
}
II.2.2评价有效亲和常数
SC捕获序列(即,捕获到探针的将要分析的靶亚序列)
P探针长度(核苷酸数目);
CS盐浓度
评价有效自由能(SC,P,CS,pH);
{
    ΔGT=评价靶弹性自由能(靶结构,探针层结构);
    ΔGP=评价探针层弹性自由能(靶结构,探针层结构);
    返回(ΔG=ΔGT+ΔGP-ΔGC);
}
评价浓缩自由能(SC,P,CS,pH,T);
{
    返回(ΔGC=计算NN碱基对相互作用(SC,P,CS,pH,T));
}
main()
{
   FOR(指定套中每个靶)
{
    ΔGC=评价浓缩自由能(SC,P, CS,pH,T);
    ΔG=评价有效自由能(ΔGC,靶结构,探针层结构);
    K=K0exp(-ΔG/kT)
  }
}
II.2.3测定信号分析
aI:测定信号强度的阵列
aK:亲和常数的阵列
aSC:指定靶亚序列的阵列
aCT:靶浓度的阵列
aP:探针的阵列
评价有效亲和常数(aK,aSC,aP)    /*见II.2.2*/
{
   FOR(j=0;j≤指定套中靶的数目;j++)
  {
    ΔGC=评价浓缩自由能(aSC(j),aP(j),CS,pH,T);
    ΔG=评价有效自由能(ΔGC,靶结构,探针层结构);
    aK(j)=K0exp(-ΔG/kT)
  }
}
/*注意:对有效亲和力的评价将必须包括共亲和力*/
    main()
    {
      记录测定信号(N,aI);
      评价有效亲和常数(aK,aSC,aP,CS,pH,T)
      校正测定信号(aI,aK);
      评价靶浓度(aI,aCT);
   }
III.测定方法学
此部分公开了涉及优化敏感度、动态范围和测定特异性的多种方法学,尤其是适合多重分析高度同源信息的丰度,还公开了只使用单个检测色对消减差异性基因表达分析的设计策略。
III.1调整信号强度
在核酸分析中,靶分析物浓度可以大范围地变化。因此,多重表达监控通常将遇到信息丰度的一个范围,从对应于每细胞1至2mRNA拷贝的低丰度,到对应于每细胞104拷贝或更多的高丰度。对同时检测来自最弱和最强转录子信号必需的4个十个一系列的动态范围,将超过许多相机和记录装置的能力。调制探针-靶亲和力以及阵列组合物的一些方法提供了根据已知或期望信息丰度调整信号强度的方法。
III.1.1阵列组合物的优化:稀释vs浓缩方式的操作
根据此处详述的考虑,选择用于从感兴趣的mRNA亚序列产生期望长度的cDNA转录子的RT引物,并选择用于捕获的5’-末端靶亚序列,能够调制探针-靶亲和力并因此控制说明靶捕获的测定信号的动态范围。
选择转录长度-在只需要反转录而不需要扩增的测定设计的最简单情况,cDNA的浓度反映原始样品中mRNA的丰度;即,给出了靶丰度。然后,明智地选择转录长度,和/或放置捕获亚序列,使得检测敏感度最大化和同时“压缩”信号动态范围,通过调整有效亲和常数的方式。
为了补偿代表稀有信息的转录子低丰度,优选地选择小的转录子长度,为了实现最高可能的有效亲和常数和最大化由这些转录子杂交锚定的探针而产生的测定信号。这将确保检测敏感度的最大化。相反地,为了补偿代表普通信息的转录子的高丰度,优选地选择长的转录子长度,为了实现最低可能的有效亲和常数和最小化由普通转录子杂交锚定的探针而产生的测定信号。这将确保稀有和冗余信息的测定信号的(合适的)“均等”。
调整转录丰度-更通常地,有一种情况,其中选择优化的转录子长度服从于另外的限制。例如,如此处讨论的,在分析接近同源的序列时,在所给样品中许多或所有靶的靠近5’末端的亚序列可能是相同的,鉴别特定靶可能需要制备比期望的cDNA长的cDNA。然后,对所给的长度L,优选地选择靶丰度t0(例如由差异性扩增的一个或多个循环,见以下),从而确保,对稀有信息在低于c*操作,对冗余信息在高于c*操作。
放置捕获亚序列-增强低拷贝数的转录子的检测敏感度的另一个方法是,提供直接针对靠近转录子5’末端的靶亚序列的捕获探针,而不是针对位于转录子中间部分的亚序列。如在部分I中讨论的,靶的中间部分趋向于较不可得,并需要探针层比靶的末端部分更大程度的变形,前者情况有对应的较低的有效亲和常数。
由任何可得的方法,优选的设计目的是实现以下结构之一。
小转录子(L<L*) 长转录子(L≥L*)
  稀有信息     高K*     高K*
  冗余信息     低或高K*     低K*
参考图11,c*代表从稀释方式到浓缩方式的拐点,L*表示相应的转录长度,L*=L(c*)。
相应的设计步骤概述于部分II.2,作为函数内测定信号优选步骤的部分:
选择靶丰度(L,L*,C)、选择靶长度(C,C*,SP)和选择捕获序列(ProbeSeq)。
III.1.2控制阵列组合物:载体冗余
可以进一步优化动态范围和检测敏感度,通过将所给类型探针的数目与特定靶的期望浓度匹配。尤其是,在本发明的优选READ格式,探针的数目易于由仅仅调节特定类型微粒(“珠子”)的数目而调节,其数量此处也是冗余的。提供了专门化检测不同类型的优化的相对冗余的设计原则。
Ekins(US5,807,755)讨论了一种相关的方法,设计受体的点阵列以进行受体-配体结合测定。本领域的此方法要求受体的浓度显著地小于配体的。如以下讨论的,这种情况对应于以下理论描述的有限情况,其中[P0]和珠子的数目NB小。然而,Ekins没有预期到此处公开的高受体浓度方式,和对动态范围压缩的相应方法。而且,Ekins没有预期使用随机编码的颗粒阵列用于受体-配体相互作用分析,也没有预期不同类型的珠子/探针的相对丰度的变化,作为确定期望的测定条件的方法。
感兴趣的反应是溶液中靶分子(包括例如配体T)与显示在诸如颜色编码珠子等固相载体上的受体分子P的配位反应,以形成可逆的复合体P·T。此反应由质量作用原理管理,亲和常数为K,因此对单受体结合单配体的情况:
P + T &LeftRightArrow; K PT
质量作用原理以其基本的形式描绘了珠子上复合的分子数目[PT]、珠子上未复合的受体位点数目[P]以及总的对反应可得的游离配体分子数目[T]之间的关系。数学上,
K = [ PT ] [ P ] [ T ]
珠子上显示的受体分子P是固定化于珠子上的,浓度为每珠子[P]0(p0)分子。在分析物中,配体分子的初始浓度是[T]0(t0)/1(或M)。
在任何时刻,表面上复合的分子浓度是[PT](c)分子/珠子。未结合的受体位点的数目[T](t),由(p0-c)给出。对反应可得的配体分子的数目在任何时候都是配体的初始数目与已经复合的配体分子数目之差。在NB珠子阵列中,都带有P型受体分子,形成的复合体的总数目等于cNB。因此,在体积为V的分析物溶液中,可得的配体分子的数目为VNAt0-NBc;其中NA代表Avogadro’s数目。质量作用原理可以重写以包括此形式中已知的变量: K = c ( p 0 - c ) ( t O - N B c V N A )
复合体的数目c直接与从每个珠子得到的荧光信号成比例。
在这种假定中,可以鉴别两种极端情况:t0>>NBp0/VNA。分析物中配体分子的总数目超过总受体位点数目。向平衡系统中加入更多珠子不会略微影响每个珠子上复合体的数目。因此复合体的数目以及显示这种复合体的珠子的强度是独立于珠子的数目的。t0<<NBp0/VNA
对反应可得的受体位点数目大大超过可得的配体分子数目。在这些条件下,如果向平衡系统加入更多珠子,一些复合的配体分子将不得不裂解并重新分布到新加入的珠子上以重新得到平衡。有效地,限制情况是c=t0VNA/NB。因此,对于所给的配体分子浓度,每个珠子显示的复合体的数目以及相应的荧光强度,是与珠子的数目成反比的,c∝=1/NB
引入无因次变量,Y=c/p0,X=Kt0,而且C=Kp0NB/NA/V,对K的平衡式可以重写为Y/(1-Y)=(X-CY)。图17表示部分占用变量Y和C,其与珠子的数目和无因次配体浓度X成正比。对于较少量的珠子,Y独立于C。这种情况等价于上述情况。无因次地,当X>>C,Y→X(1+X)并独立于C。而且,对于X>>1,Y→1,其表示高配体浓度和高的亲和常数值,确保珠子达到满的占用。对C的较高值,Y随着C单调减少。至于上述情况,限制反应式是Y=X/C。
检测敏感度-在随机编码阵列中控制所给类型的珠子的数目,提供了一种适宜的方法以在期望范围内产生信号强度。在单配体结合单受体的最简单情况中,最大占用由减少图17中曲线拐点下的珠子数目而得到,C拐点=1+X。
动态范围压缩-如以上讨论的,在多重测定中通常将要检测的单个配体的浓度有大的不等。为了把对应于分析物浓度范围的大范围信号适合所给检测器的动态范围,通常必要的是在多重反应中每种珠子的数目根据相应的期望分析物浓度而调整。尤其是,理想的是低浓度分析物产生的弱信号被增强,从而可被检测,并且同时,高浓度分析物产生的强信号被减弱,从而不超过监测系统的饱和限制。
动态范围压缩产生的特定信号强度的平衡是尤其理想的,当:
a)分析物溶液中配体的浓度是已知(或期望为)变化大。
b)一些配体的结合亲和力是已知(或期望为)很弱。
c)对一些类型珠子的受体密度是已知(或期望)低。
例如,在2配体-2受体系统中,配体浓度t0,1>>t0,2,必要的是相应的显示同源受体的珠子的相对丰度根据反应式NB,1>>NB,2而调整。这种推理是易于延伸到涉及多分析物溶液的测定,其含有大量配体,配体放置为与珠子的阵列接触,珠子含有相应的同源受体。
因此,为了成份优化的阵列设计原则经历以下步骤:
选择感兴趣的各类型珠子上的必要数目的荧光团或复合分子ci d
1.基于已知或期望的p0,i值对每对受体-配体设置Yi d
2.计算Xi作为分祈物浓度和亲和常数的结果。
3.对每对受体-配体计算 C i d = X i / Y i d - 1 / ( 1 - Y i d ) .
4.从 N B , i d = C i d = V N A / p 0 , i K , i 计算每类珠子的期望数目。
实验验证-如以上所述,有效亲和常数可以表现大致依赖于长度的变化:例如,在卡那霉素的情况,在浓缩方式Keff(L=50nt)/Keff(L=1000nt)~10。转录自长度选择和珠子冗余对测定信号强度的引人注目的效应的一个例子示于图18,根据实例V的步骤产生,但使用~3,000珠子以检测卡那霉素cDNA,在20μl反应体积中存在10,000毫微微摩尔,并使用~100珠子检测IL-8cDNA,在20μl反应体积中存在2毫微微摩尔。
如图18所示,尽管事实上,图中所示第5和第7对比率(从左数起),50nt和1,000nt卡那霉素转录子以同样丰度10,00毫微微摩尔存在,相应记录的信号强度相差大于一个数量级。而且,如图18所示,卡那霉素cDNA存在的量超过IL-8cDNA大约5,000倍,只产生大约20倍高的信号强度,直接证明动态范围压缩。
如果不校正此两种转录子大致不同的有效亲和常数,实验数据的分析将导致信号丰度的明显错误。
缠结-这个特定例子表示了捕获的靶对信号强度的进一步作用,捕获的靶来自溶液中靶链的缠结。即,溶液中的靶链在靶浓度的某一临界t*开始重合。对含有L核苷酸的一个靶,并假定高斯(Gaussian)线圈结构,对应的靶浓度为t*≈L/R3~a-3L1-3υ,或,由υ=3/5,t*~L-4/5,说明对靶体积片断,Ф*~L-4/5。对显著长度的靶,Ф*可以相当小:Ф*(L=1,000)≈0.004。在例子中,由a≈5A,L=1,000,产生旋转半径RG,T≈9L1/2≈9*33A≈300A,且分子体积V=(4/3)πRG,T 3≈300*106A3;由于103fmole=1012摩尔,靶占用的体积为VT≈0.3μl并因此Ф=0.3/20≈0.015>Ф*。即,在例子中,1,000nt卡那霉素转录子的捕获效率将期望为由靶缠结而进一步减少。
如果必要,将由另一评价来进行多协同多探针、多引物-RT反应以允许不同程度的初始mRNA稀释物。汇集产物以进行在单个多重反应中检测。
III.1.3差异性扩增
由于接近依赖于序列的亲和常数KSS由亲和常数管理,稀释方式的操作将是检测低-丰度信息的优选操作方式。尤其是当设计小cDNA是困难或不可能的时候,如此处讨论的,并结合分析接近同源序列的套。可以设计出限制PCR循环到较小数目如3-4的RT-PCR步骤,为了把最低丰度转录子的浓度带到对应于稀释方式可检测的范围。
由于浓缩方式中亲和常数的减少,转录子扩增到超过拐点浓度的浓度将产生减少的结果。即,对任何所给长度的靶,靶扩增将产生相对较小的信号增加,根据管理转录子捕获的长度依赖性有效亲和力,尤其是在浓缩方式。尤其是,如果高丰度转录子扩增到饱和方式,额外的扩增将不导致任何捕获以及检测到的信号的增加。除非考虑到测定信号以及分析测定信号,此“饱和”效应可以严重地扭曲靶浓度的定量确定。
然而,如果适合地基于本发明的方法考虑,这种假定把自身引向动态范围压缩,由差异性扩增,其中低丰度信息的信号相对于高丰度信息的增强,经过同样循环数的扩增后,并在同样的多重靶扩增反应中。
池-更通常地,必要的是使来自高和低丰度信息的转录子浓度相等-不考虑靶长度-在浓度的狭窄范围内。在这种情况,有用的是把靶分成2或更多套,经历不同的多重靶扩增反应,为了能够把高丰度信息置于小循环数扩增,而把低丰度信息置于较高循环数扩增。
III.1.4标记密度-稀释方式的操作要求检测小数目的捕获转录子,并由高比例合并标记的dNTPs而促进。在此处描述的实例中,由摩尔比为1个标记的dCTP每8个未标记的dCTPs而达到典型标记密度为1∶64。对于150nt转录子,这个比率表示nF(150nt)~3,混合物中对较小转录子存在相应的较低数目。此外,每单位长度可以添加更多标记,通过在反转录中添加多于一种标记的dNTP。例如,人们可以在特定反应混合物中使用生物素-dATP和生物素-dCTP,这比只使用1种产生每单位长度的更多标记。在一个实验中(未示出),标记的生物素-dATP与未标记的dATP以1∶6.25的比例加入到反转录反应中作为反应物。与末端-标记的cDNA对照比较,在1,000核苷酸(“nt”)卡那霉素cDNA中存在大约20标记的核苷酸。
更通常地,差异性标记还提供了使由捕获浓度不同的转录子产生的信号强度相等的进一步方法。优选地,这通过根据相应的已知或期望丰度水平和长度调节合成到转录子套中的标记的数目而达到。优选地,在超过拐点到浓度方式相关的长度限制的转录子中将确保高密度的标记的dNTPs。在这种情况,较高的标记密度将增加检测敏感度,通过补偿这种较长转录子的较低有效亲和力,较少转录子将捕获到锚定的探针,如前所述。此计算当然要考虑到一个事实,即每靶的平均总标记数与靶长度成比例。
为了实现转录子的差异性标记,通过把mRNA样品分成不同管(反应室)中的2或多个等份进行RT反应,从而例如,在一个反应中,只产生小转录子,而在另一个反应中,只产生长转录子,并调节每个RT反应中标记的dNTPs与未标记的dNTPs的比例,即比例越高,转录子中包括的标记越多。
III.2伸长介导的序列特异信号扩增-敏感度和特异性-目前使用这些测定设计进行产生小的、标记的cDNA的结果证明,足以检测到的敏感度-不追索至mRNA或cDNA扩增但利用新的信号扩增方法-标记的卡那霉素cDNA片断,长50nt-70nt,水平在总反应体积10μl 1毫微微摩尔材料(图19)。
如实例VI和图20、21中列出的,可以进行“钉入”实验以进一步评价在生病的人类样品典型复杂环境中,检测特定mRNA中可得到的特异性的水平。
新信号扩增方法-为了得到较高敏感度,公开了(测定后)信号扩增的方法,其采用序列特异性的探针伸长和随后以荧光探针装饰以在cDNA捕获之后产生信号一个数量级的增强。这种伸长-介导的方法(图22)只需要几分钟,并可以选择性地采用,例如对低丰度信息结合cDNA的RT标记,或对所有信息排外地。
伸长时,伸长杂交到探针的转录子的5’末端,仅仅当此区域中对探针有完美匹配时。见提交于2002年10月15日的美国申请No.10/271,602,标题为“由协同询问和酶-介导检测的多态位点多重分析(multiplexedanalysis of polymorphic loci by concurrent interrogation and enzyme-mediateddetection)”,合并以引用。
首先,标记卡那霉素mRNA(浓度范围每20μl从1至32fmoles),例如通过在RT反应中合并Cy3-标记的dCTPs到cDNA中。标记的cDNA捕获到固定化的捕获探针,如结合实例III、IV和V以及图9描述的。为了增强由捕获的靶产生的信号,使用生物素化的dCTPs(“Bio-14-dCTP”)在原位(“芯片上”)进行探针伸长反应。然后所得到的生物素化伸长产物由暴露于链霉亲和素-藻红蛋白复合体而“装饰”,从藻红蛋白标签产生大致增强的荧光(见实例II)。
事实上,如图23所示,反应是定量的,比大范围浓度产生10倍增强,并能够在增强的敏感度定量确定信息丰度,易于使得分辨强度比~3十进制的信号的整个动态范围的两倍改变。
在各个实例中描述的测定步骤下,并使用符合READ格式的实施例,易于检测由捕获50nt-70nt转录子产生的信号而不需要靶扩增(但需要如此出所述的信号扩增)-信号对(未校正)背景的水平为2∶1-在cDNA浓度为每10μl样品大约0.1fmole。这对检测存在频率为每细胞10-30拷贝的mRNA是足够的,假设从每毫升107外周血单核细胞收集mRNA,如标准步骤假定的(Lockhart,D.J.Dong,H.,Byrne,M.C.,Follettie,M.T.,Gallo,M.V.,Chee,M.S.,等人,Nature Biotechnology 14:1675-1680(1996))。
III.3优化检测特异性
多个转录子与一套固定化的序列特异性检测探针的相互作用是由竞争反应均衡的多样性和对应套的共-亲和力管理的。这些评价在此套中所给探针与所有可得靶亚序列之间的相互作用力,和任何靶亚序列与此套检测探针之间的相互作用力。所给靶与除了其“同源”以外的任何捕获探针之间的相互作用,可能在多要素探针-靶反应动力学和均衡中产生不期望的干扰。
III.3.1优化引物和选择探针
交叉反应的可能性,随着转录长度和反应中转录子的数目而增加,因为遇到近似所给第一个(“同源”)亚序列的第二个亚序列的条件概率,随着可得的靶序列的总长度而增加。为了增强捕获的特异性,现有技术的许多参考描述了“多-齿状”捕获策略,使用2个或多个针对每个期望靶的探针。然而,在定量分析的多重格式中,这种策略通常是不可取的,因为它不仅增加探针阵列设计的复杂性,还增加与每个加入的探针交叉反应的可能性。
为了最小化交叉反应,优选的是产生小的转录子,通过明智地把序列特异性RT引物放在靠近mRNA的3’末端。测定设计的其它方面涉及此处描述的某些熵效应,其类似地导致这种优先。因此,此处描述的测定设计技术通过优化选择序列特异性的RT引物以及序列特异性的检测探针来实践,优选地符合在先的同时待决申请No.60/487,451的方法。
本发明的方法利用序列的先验知识和感兴趣的指定mRNA的期望丰度水平来选择和放置RT引物到每个mRNA的特定区域,为了控制RT反应中产生的cDNA的长度和标记程度。在某些情况中,有利的是把多个RT引物放在指定组合中的一个或多个mRNA上,并使用针对这些cDNA不同亚序列的多个探针分析对应的cDNA。此处是指“多引物多探针”(mpmp)设计,如在先的同时待决申请No.60/487,451中所描述的。在一些情况中,有利的是在检测前进行扩增反转录子的进一步步骤。
本发明的这些方法涉及优化特异性,对多个应用有用,如由实例VII中所示的。它们也适用于一套细胞因子的多重分析,详述于实例VIII并涉及图24A、24B。
III.3.2由多探针检测增强特异性
结合hMAP和eMAP-本发明的另一测定格式对检测基因家族的成员有用,其中家族的构成具有亚序列,相对靠近地对于:(i)序列的显著差异,诸如插入3-或更多核苷酸在一些成员中,(ii)大致的序列同源,但具有较小差异诸如单核苷酸多态性(SNPs)。由于大致上序列相似,用常规杂交测定难以辨别这种序列,由于交叉-杂交。
为了解决交叉-杂交引起的问题,并降低费用,可以辨别家族的成分并确定各自丰度,通过在双测定格式进行伸长和杂交的组合,其中一些探针杂交代表具有大差异的区域的转录子,另一些探针杂交代表具有小差异的区域的转录子,其中使用伸长反应只检测后者转录子。通过对结果的特定分析,可以检测家族各成分。即,优选地检测同源序列之间的小差异,通过进行序列特异性的伸长反应,从而确保鉴别一个基因家族的各成分,同时对信息丰度的定量测定使用伸长反应本身(见III.2),或把伸长与杂交结合以确保辨别和定量。
在最简单的例子中,一个成分的家族具有一个显著序列差异(一段3个加上的碱基)的区域,和一个带有一个SNP的区域。使用以上描述的格式,人们将使用4种珠子和2种差异性转录标记。如图25B所示,一种珠子连接探针hP1(杂交于含有加上的3个碱基的P1区域),另一种编码的珠子连接探针hP2(杂交于不合有加上的3个碱基的P2区域)。第三种珠子连接探针eP1(杂交于具有正常等位基因的eP1区域),第四种珠子连接探针eP2(杂交于具有变异等位基因的对应的eP2区域)。每个转录子的5’末端用第一种颜色(“红色”)标记,通过在反转录中使用适当标记的引物。如果由eP1或eP2探针杂交的转录子在杂交后伸长,伸长的产物使用以第二种颜色(“绿色”)标记的伸出的核苷酸(dNTP或ddNTP)标记伸长产物。
对样品杂交后,可以分析阵列。当珠子hP1或hP2上表现红色时,这分别表示存在区域P1或P2。当eP1珠子上的转录子伸长了时,如从绿色标记检测的,这表示捕获了eP1正常(“野生型”)等位基因,并且当eP2珠子表现绿色时,这表示捕获了eP2变异等位基因。因此,人们可以易于检测带有两个区域的转录子的存在,只使用一次伸长反应,通过分析杂交和伸长的模式。可以用同样方式分析具有更多复杂差异模式的mRNA家族,使用适当数目的编码珠子和杂交、伸长反应。
III.3.2A同时确定富含AU的mRNA的表达水平和类
信使RNA(mRNA)转换涉及在对感染和胁迫的瞬时响应中。在哺乳动物细胞中,大多数mRNA经历多(A)缩短作为衰变的初始步骤。mRNA的3’-不翻译区域(UTR)的富含腺苷酸-鸟苷酸(AU)元件,涉及在有效动摇mRNA分子中。许多含有富含AU元件(ARE)的mRNA在疾病状态高度表达,并可以作用于在疾病响应中选择性地增强或抑制基因表达。ARE基序的核心五聚(pentameric)序列是AUUUA。AREs可以包含分散的AUUUA基序的多个拷贝,通常与附近的富含U序列或U伸展结合。目前已知多类AREs。
此处的方法能够辨别与特定独特mRNA亚序列关联的AREs的类,使用能够检测不同独特亚序列、并能用一种颜色(相对于需要多种颜色)的染料标记的探针,还确定与AREs关联的独特mRNA亚序列的相对表达水平。此方法中,首先把多种探针连接于编码的珠子,其中每种珠子的编码与所连接的探针类型相关。选择探针以与cDNA区域杂交,此区域完全互补与AREs和多聚A尾巴上游的独特mRNA亚序列。mRNA样品使用所选的引物反转录为cDNA,从而反转录ARE以及上游的独特mRNA亚序列,转录子是标记的并在杂交条件下与珠子上的探针接触。
杂交后,作为对相对基因表达的定量步骤,取一个测定图来表示与每种编码的珠子关联的标记的转录子,并提供阵列中标记的转录子的整体图片。作为辨别ARE类型的一个步骤,珠子上已经与cDNA杂交的探针在条件下伸长,从而新伸长的产物(连接在一种编码的珠子)将包括对应于ARE的一个部分。这通过大量加入所有4种dNTPs而进行,从而可以发生相对长的探针伸长。然后记录用于识别不同珠子上探针/转录子类型的测定图片。
然后把转录子从伸长的探针变性,例如由加热,然后把珠子/探针顺次接触一段序列的标记探针,此序列来自完全互补于各类AREs的库。这些“ARE探针”可以用同样的染料标记,因为它们接连地使用,而不是加到同一测定混合物中。在杂交ARE探针之后,一旦解码,可以确定ARE类,其与每种珠子以及每种独特基因序列关联。此方法示意于图26。
体内独特基因序列的相对表达水平可以在多个时间点确定,基于在时间点中确定的标记的转录子的相对信号。这种确定对于监控某些基因序列是否与AREs关联有用,并通常在疾病状态中,随着时间而上调或下调。
III.3.2B辨别接近同源的序列:玉米近交系
某些应用,诸如此处更详细讨论的,要求检测全体数百或数千个表现与感兴趣的靶序列同源的靶中的特定靶。这些环境通常将要求一定程度的序列特异性,超过由杂交提供的。涉及选择合适引物和探针组合的某些方面详细讨论于在先的同时待决临时申请No.60/487,451。这里我们公开了多种特定阵列设计和测定步骤,其采用结合由反转录的序列特异性序列变换和/或扩增以及由杂交(hMAP)多重检测和/或伸长(eMAP)。描述了多种特定实例以表示本发明的这些测定设计和方法学。
使用杂交探针询问伸长产物-本发明的另一种测定格式对检测基因家族中接近同源的成员有用,通过伸长-介导的检测的序列来辨别基因的第一亚类和第二亚类,只有第一亚类能够形成伸长产物,其可以通过合并第一种颜色的检测标记而检测。然后第一亚类中的成员可以进一步区分,通过识别伸长产物中的特定亚序列,这种鉴别涉及以第二种颜色的检测标记修饰的杂交探针。这种方法的细节,预先结合多态性的“定相”公开,描述于提交于2002年10月15日的同时待决美国申请No.10/271,602,标题为“由协同询问和酶-介导检测的多态位点多重分析(multiplexed analysis ofpolymorphic loci by concurrent interrogation and enzyme-mediateddetection)”,并进一步描述于实例IX,参照图27-29(图27中的DNA序列是SEQ ID NO.12;图28中的DNA序列是SEQ ID NO.13)。
III.4使用单色检测的消减差异分析
在本发明的一种特定测定格式,使用消减杂交来确定不同mRNA的差异性表达(图30)。这是有用的,例如对于诊断某些疾病和状况,其中对应的mRNA水平不同于生病和健康的受试者。在这种测定格式,指定mRNA从健康(“正常”N)和生病的(“变异”V)受试者提取,并使均等以确保两种样品中mRNA浓度相等。这由例如在两种样品中包含普通参照mRNA实现。
在两种样品中,首先把mRNA反转录以产生cDNA,分别标为cDNAN和cDNAv。用于一种反转录样品而不用于另一种的RT引物用一个标签修饰,此标签使得随后选择链。在反转录之后,含有标记引物的样品,即正常样品,转录以产生ccDNAN,即与cDNAN互补的DNA;cDNAN是可以酶消化的。
然后,ccDNAN和cDNAN在使得这些互补单链退火以形成二联体的条件下结合。这个步骤除去(“消减”)两个样品中相等的DNA量。V-样品中1个或多个指定基因的低表达使得N-样品中对应的过量,相反地,V-样品中1个或多个指定基因的过表达使得V-样品中对应的过量。使用编码的“有义”和“反义”探针对检测单链DNA的过量,其一匹配cDNAv,另一匹配cDNAN。优选地,有义和反义探针组合显示在编码的微粒(“珠子”)上,形成随机编码阵列。
结合的样品与有义和反义探针组合接触,检测杂交的转录子,例如,由记录来自珠子组合的荧光信号,其由捕获的转录子产生,这些转录子可以通过合并荧光RT引物或合并标记的dNTPs而荧光标记。对每一对有义和反义探针,强度的差异说明对应转录子过量的标记和量。值得注目地,相对于比率分析的标准方法,此处只需要单色。
IV.通用公开
随机编码的阵列检测(READ)-多重定量检测的方法优选地采用显示在编码的微粒(“珠子”)上的寡核苷酸探针阵列,其一旦解码,就能鉴别显示在每种编码珠子上的特定探针。优选地,编码的珠子组合以编码的微粒在平面基质上的随机阵列形式布置,能够用显微镜检查和分析。监控强度以表示每珠子结合靶的量。与编码珠子关联的标记,和与转录子关联的标记结合于阵列中的探针,优选地是荧光的,并可以使用区别不同颜色的过滤器辨别。这种测定格式详细解释于提交于2002年8月23日的美国申请No.10/204,799,标题为“使用特异应用的随机颗粒阵列的多分析物分子分析(multianalyte molecular analysis using application-specific random particlearrays)”,这里参考而合并。
探针库-官能化的编码的微粒(“珠子”)-连接探针的颗粒可以包括例如塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸聚合物、顺磁性材料、二氧化钍溶胶(thoria sol)、碳石墨、二氧化钛、橡胶或交联葡聚糖诸如琼脂糖、纤维素、尼龙、交联胶粒和特氟纶。(见,如Bangs Laboratories,Fishers,IN的“微球检测指南(Microsphere Detection Guide)”)。颗粒不必是球形,可以是多孔的。颗粒尺寸可以从纳米(如100nm)到毫米(如1mm),从大约0.2微米到大约200微米的颗粒是优选的,从大约0.5微米到大约5微米的颗粒是更优选的。
编码颗粒从而使其与序列特异性珠子显示的探针相关,探针以化学或物理可辨别的特征放在颗粒的表面,例如荧光,独特地鉴别此颗粒。可以提供化学、光学或物理特征,例如通过光学可辨别的标签使珠子着色,标签诸如含有一种或多种荧光团的或光谱可由激发波长、发射波长、激发状态寿命或发射密度区别的发色团染料。光学可辨别的标签可以用于以特定比率使珠子着色,如Fulwyler的美国专利No.4,717,655公开的。也可以根据本领域技术人员已知的方法(见,如Molday,Dreyer,Rembaum&Yen,J.Mol Biol 64,75-88(1975);L.Bangs,“通用橡胶颗粒(Uniform latex Particles),Seragen Diagnostics,1984”)膨胀颗粒而达到着色。使用这些技术,直到12种珠子通过膨胀和以两种颜色着色而编码,各以4种强度水平,并以4种名义摩尔比混合。可替换地,可以使用国际申请No.PCT/US 98/10719(合并以参考)中描述的组合颜色编码方法来赋予珠子阵列光学可辨别的标签。
探针-一套序列特异性的探针,称为“捕获探针套”,用在测定中。捕获探针的每个元件设计为-优选地使用2004年5月17日提交的同时待决临时申请“杂交-介导的多态性(hMAP)分析(hybridization-mediated analysis ofpolymorphisms(hMAP))”、No.10/847,046-具有与一个“同源”cDNA靶分子独特互补的区域。如以上所述,捕获探针的各元件的互补区域的长度可以是不同的,为了定制结合亲和力。
可以合成这些寡核苷酸探针,以在5’末端包括生物素化的TEG间隔物,用于连接到由中性亲和素官能化的微粒,或包括胺化TEG间隔物(Synthegen TX)用于共价连接到官能化的颗粒表面,使用羧化珠子和EDAC反应。
反转录-分离用于这些测定的总RNA,并反转录到cDNA,cDNA添加到含有dNTPs、或ddNTPs和DNA聚合酶的溶液中,以伸长这些探针上的cDNA,靶的5’末端与探针上的互补序列完全互补。dNTPs/ddNTPs混合物束缚了至少一种标记的dNTP或ddNTP,为了合并荧光标记到伸长的靶中。测定的cDNA靶分子如所述的荧光标记,cDNA靶分子荧光标记的密度(如,合并荧光标记的dNTPs的程度)可以变化,依赖于是否期望对应mRNA的表达水平高或低。此外,探针结合于转录子的区域影响杂交模式;即,探针结合于末端是比较容易的。细节详述于以下多个实例。
阵列装配的方法-为了产生一种含有特定探针组合的定制阵列,汇集编码的探针装饰的珠子并装配到阵列中。许多不同的装配阵列是可能的,包括称为LEAPSTM(轻-控制的靠近表面动电装配颗粒,描述于美国专利No.6,251,691,此处以引用的方式合并)。在LEAPSTM中,制备珠子阵列,首先提供与第二个平面电极大致平行的平面电极(“三明治”结构),两个电极以一个间隔分开,间隔中有可极化的液体介质,诸如电解质溶液。第二个电极的表面或内部被图案化以产生较低阻抗的区域。然后把珠子引入间隔中。向间隔施加AC电压时,珠子形成第二电极上的随机编码阵列,其符合模式,或替换地,符合第二电极上的图案模式。所得阵列可以表现很高的特征密度。装配颗粒阵列的替换方法描述于提交于02年7月9日的美国申请No.10/192,352“微粒阵列和其制备方法(arrays of microparticlesand methods of preparation thereof)”。
解码图像-在本发明测定中,颗粒群体以独特的化学或物理特征编码,其能够在测定前和测定后确定颗粒类型。为了解码,在测定前或测定后取装配阵列的解码图像,以记录编码颗粒在阵列中的空间分布,以及捕获探针套的元件的空间分布。
优化的签名和测定图像-为了方便检测捕获的靶,cDNA分子通过在反转录过程中以当前摩尔比合并标记的dNTPs而荧光标记,合并的dNTP总量随着反转录子的长度变化。代替杂交-介导的捕获,或除了杂交-介导的捕获之外,本发明的测定还包括伸长-介导的检测;cDNA分子加到含有dNTPs或ddNTPs、DNA聚合酶的溶液中,以伸长这些探针上的cDNA,其3’末端互补于捕获的靶。dNTP/ddNTP混合物含有至少一种标记的dNTP或ddNTP,为了合并荧光标记到伸长的探针中。
与编码珠子关联的标记,和与结合阵列中探针的转录子关联的标记,优选是荧光的,可以使用过滤结合区分,其能够区别不同激发和发射波长,以及结合以多种结合的基础色。根据READ的优选实施例,珠子装配在平面阵列中,其易于使用如显微镜检查和分析。监控捕获和分析靶过程中产生的光学信号的强度,以表示捕获靶的量。
记录解码和测定图像-使用荧光显微镜来解码阵列中的颗粒,并检测来自探针-捕获的cDNA分子的阵列的测定信号。解码器中的荧光过滤设置设计为区分用于着色颗粒的编码染料产生的荧光,而其它过滤装置设计为区分由转录子/扩增子关联的染料产生的测定信号。CCD相机可以合并到系统中以纪录解码和测定图像。分析测定图像以确定每个捕获靶的一致性,通过把测定图像中信号的空间分布与阵列中对应编码颗粒的空间分布联系起来。
测定-解码前或解码后,编码颗粒的阵列暴露于cDNA靶分子,在能够捕获到显示颗粒的探针的条件下。反应时间后,编码颗粒的阵列用1×TMAC洗涤以除去余下的游离和微弱退火的cDNA靶分子。代替杂交测定或除了杂交测定以外,本发明的测定包括基于伸长的检测。
然后取阵列的测定图像以记录阵列的探针-cDNA复合体的光学信号。由于每种颗粒是独特地与序列特异性探针关联的,把测定图像与记录的解码图像结合,例如在进行测定前记录的,能够鉴别退火的cDNA分子,其对应的丰度-直接涉及对应原始mRNA信息的丰度-从每种颗粒的荧光强度确定。
以下实例提供关于制造和使用本发明的进一步细节。
实例I:探针和转录长度对捕获效率的效应
合成长度从25-mers至175-mers的合成DNA多核苷酸靶(IDT,Madison,WI),每种较大的靶含有较小的靶作为内部亚序列。所有的靶都在5’末端以Cy5标记。还合成了胺-修饰的(5’末端)寡核苷酸探针,长度从15nt至35nt(IDT,Madison,WI)。详细序列信息示于表I-1。
用本领域中熟知的EDAC反应把探针共价连接到编码的甲苯磺酰基化微粒。从去离子水中10μM靶的母液取预先计算量的每种合成靶,并以1×TMAC(4.5M四甲基氯化铵、75mM Tris pH8.0、3mM EDTA、0.15%SDS)稀释到期望的终浓度。表I-1中列的一种或多种探针用荧光微粒官能化,然后装配到硅基质上的平面阵列中。向基质表面加入20微升合成靶,然后把基质置于55℃烘箱20分钟。然后从烘箱移去载玻片,对溶液送气。基质用1×TMAC在室温洗涤3次。然后,把10μl 1×TMAC置于基质表面,用玻璃载玻片覆盖,记录阵列的荧光强度。
图3、5、6和7表示从这些杂交实验得到的结果。
实例II:确定每颗粒存在荧光团的绝对数目
用来自Becton-Dickinson,Franklin Lakes,NJ的QuantiBRITETM PE藻红蛋白荧光定量试剂盒进行实验。试剂盒由6.6μm聚合珠子组成,其表面上结合了已知数目的藻红蛋白(PE)分子。为了定量分析珠子相关的荧光强度,把珠子的平面阵列装配在硅片表面上。然后监控来自颗粒表面上PE荧光团的荧光强度,作为表面结合的PE荧光团的变化数目的一个函数,使用装有合适的荧光过滤器和CCD相机的荧光显微镜。在本研究中,使用装有150W氙弧灯的Nikon Eclipse E-600FN epifluorescence显微镜来测量。使用Nikon 20×0.75NA air objective和R&B PE过滤立方(ChromaTechnology Corp.,Battleboro,VT)来测量。用冷却的16位CCD相机(Apogee Instruments Inc.)记录图像。实验的曝光/集成时间是500ms。用于收集和分析图像的用户界面程序使用一台PC上运转的MATLABTM开发。结果表示于图4,从其可以看出,使用此系统可以检测~100PE分子/颗粒(即1PE分子/μm2)。
R-藻红蛋白和两种普通CY染料的荧光特性比较于以下表I-3。
表I-3
名称   吸收最大值(nm)   发射最大值(nm) Ext.Coeff.(M-1cm-1) 对蛋白结合物的QY 分子量(染料)
R-藻红蛋白     480546565 578 1,960,000 0.82 240,000
    Cy3     550     570     150,000     0.16   766
    Cy5     649     670     250,000     0.28   792
因此一PE分子等价于~60Cy3分子或~20Cy5分子。所以,对Cy3期望的检测临界是~60分子/μm2,对Cy5是~20分子/μm2。2μm颗粒的表面积为~12.5μm2,所以需要750分子Cy3/颗粒和250分子Cy5/颗粒用于检测。对应的3微米颗粒的数目对Cy3是1700,对Cy5是600。因此,使用Cy染料检测敏感度的保守估计是~1000荧光团/颗粒。
以上述讨论的同样方式,曲线的斜度也可以用作合适的变换因素(当使用染料而不是PE时),以把记录的粗密度转换回到分子/μm2,伴随着珠子尺寸的知识,然后转换到荧光团/珠子的数目。
实例III:快速表达监控的通用步骤
对多重表达监控的典型试验步骤如下。根据本发明方法建立优化条件的步骤如下。包括根据本发明方法的信号扩增的完整步骤在少于3个小时内完成(见图1和2)。
步骤1-使用Qiagen硅-胶-膜技术从血液或组织样品提取总RNA。带有与感兴趣的mRNA互补的序列的DNA寡核苷酸加入制品中,以使靶mRNA反转录为cDNA。
步骤2-含有mRNA的溶液加热到65℃,通常加热5分钟,以促进引物退火为变性的mRNA,然后溶液通常以2℃/min的速度逐渐冷却到室温。反转录酶(例如Superscript,Contech)与荧光标记的dNTPs(通常标记的与未标记的dCTP摩尔比为1∶8)加入到初始的RT反应中。合成标记的cDNA后,使用RNase消化RNA模板。
步骤3-荧光标记的cDNA在1×TMAC缓冲液中在50℃退火30分钟,退火到颜色编码微粒,此微粒根据READ格式显示硅芯片(图9)上的DNA寡核苷酸捕获探针。然后由连续3步地在1×TMAC缓冲液中洗涤进行杂交,每个步骤只需要调换缓冲液。
如有必要,根据本发明方法的信号扩增可以如此处描述地进行。
捕获探针序列可以设计为互补于混合物中单独cDNA的3’区域。用于多重分析cDNA的捕获探针序列的优化,详述于2003年7月15日提交的同时待决申请No.10/892,514“协同优化选择用于核酸分析的引物和捕获探针组合(concurrent optimization in selection of primer and capture probe setsfor nucleic acid analysis)”如此处所述地制备阵列。
步骤4-以荧光图像的形式记录所得荧光的模式,由在自动阵列图像系统上即时成像(通常间隔时间少于1秒),如在2003年11月14日提交的美国临时申请No.10/714,203“阵列图像的分析、安全得到和传输(analysis,secure access to,and transmission of array images)”中详述的。
也可以使用人工操作的荧光显微镜。从测定图像,由分析测定图像确定定量强度,如在No.10/714,203中详述的。
实例IV:分析卡那霉素mRNA(使用实例III的步骤)
实例IVA:mpmp-RT设计和转录标记-mpmp-RT设计包括6个Cy3-修饰的RT引物,使用多个微粒显示的捕获探针,在单个对一系列连续的较低卡那霉素浓度的反应中,根据1∶2系列稀释。从79nt到150nt的片段的混合物,合并到各片断Cy-3修饰的dCTP,以平均摩尔比1∶16的标记的与未标记的dCTP,并因此产生的平均标记密度为1∶64。
实例IVB:转录长度和改进的RT设计-使用包括1或2个CY3-修饰的RT引物和微粒显示的捕获探针的mpmp-RT设计,对每种卡那霉素mRNA连续较低浓度的溶液进行RT反应,浓度跨越25nM至~50pM。特异地,测试了3种RT引物与捕获探针的组合以产生和分析70nt和/或50nt的cDNA片断。转录子的Cy3标记密度也加倍-从1∶64至1∶32-通过合并到每个片断Cy-3修饰的dCTP,标记的与未标记的dCTP平均摩尔比为1∶8。使用Cy3-标记的RT引物,每种50nt转录子将平均包含2-3 Cy3标记。
实例IVC-优化滴定模型mRNA的测定
已经建立了靶结构熵作为影响cDNA检测敏感度的重要因素,然后在多个测定设计中确定转录子长度从150nt进一步减少到~50nt,同时从1,200nt卡那霉素模型mRNA得到的转录子的Cy3标记密度加倍,在测定信号中产生进一步增强,期望倍数为~5,对应于检测限制~50pM。
值得注目地,接近可比的结果-包括靶熵的重要作用-从8种未知的mRNA混合物中得到,其中mRNA是把卡那霉素mRNA分别以摩尔比从~~1∶12至~1∶6,200“钉入的”,对应于卡那霉素浓度25pM和50pM,mRNA“背景”为300nM。这些模型测定的结果表示,存在其它mRNA分子时,检测特定信息的足够敏感度和特异性低至每细胞~3-5拷贝。
为了测试实例III中的预测,即,转录子长度从~150nt进一步减少到~50nt将产生测定信号的进一步增强,设计了mpmp-RT反应来产生50nt和/或70nt转录子。已经证明了测定信号的增强来自使用“5’-末端-针对”捕获探针(见实例III),设计了捕获探针从而在靠近转录子的5’末端靶定一个亚序列。
优化测定步骤-为了进一步提高测定敏感度和动态范围,优化了测定条件。特异地,卡那霉素mRNA滴定液中RT引物浓度减少25倍(从50μM到2μM),杂交时间减半(在50℃从30分钟到15分钟)。
这种步骤改进不仅避免检测器在最高靶浓度~500pM的饱和(图10),还减少由非特异性吸收溶液中残留的荧光标记RT引物和dCTPs产生的背景信号,从而促进测定动态范围的扩大。在测定敏感度中观察到2倍的增加。
实例V-优化模型mRNA的反转录
为了进一步提高实例III中报道的mpmp-RT的测定表现,对50nt卡那霉素转录子-最佳表现的-优化反转录(RT)步骤,通过在严格温度控制下进行RT反应。使用热循环器中可编程的温度条件(profile),改良的RT反应步骤结合严格的RT引物退火和转录条件,得到荧光信号强度的2-3倍增强(图19)。
特异地,RT反应,结构为如实例III中所述,在热循环器(Perkin-Elmer)ti中进行,执行如下温度条件:
RNA变性:65℃5分钟;
退火:45℃30分钟;
退火:38℃20分钟;
SuperScript III加热失活:85℃5分钟;并
在4℃保存。
杂交条件为:在50℃在1×TMAC中培养15分钟,然后连续以同样缓冲液洗涤3次,每次仅仅把20μl与珠子芯片接触的用新鲜缓冲液替换。
2-步的步骤强制严格条件产生特定荧光信号的增强,同时非特异性背景信号与此前得到的(“步骤2”)可比,从而提高了信噪比大约2倍。
实例VI-在人类总RNA背景中的尖峰实验:特异性
为了进一步评价在复杂环境中检测特定mRNA的可得特异性水平,此环境典型地为生病的人类样品,其富含多种RNA信息,进行一个另外系列的“钉入”实验,通过用来自人类胎盘(Ambion)的总RNA代替细菌来源的未知总RNA背景。人类胎盘总RNA更实际地模仿在确定特定类RNA表达模式时通常遇到的情况,特定RNA诸如生病样品中的人类白细胞介素或其它细胞因子。
等量的卡那霉素,浓度从~12.5nM到~50pM,钉入到稀释为100ng/μl的人类胎盘总RNA溶液中,对应浓度为~300nM。即,特异性与非特异性mRNA的摩尔比从1∶24到1∶6,200。在8种比率中-包括一个无靶对照-分别在优化的测定条件下进行RT反应。
结果(图20B)符合预先在存在总RNA时观察到的趋势。因此,对于长度为50nt的转录子,钉入到人类来源的总RNA,从捕获荧光标记的随机引物反转录产生的cDNA得到的非特异性信号,可忽略地比较于由捕获熵较好的50nt卡那霉素cDNA产生的特异信号。在摩尔比为~1∶6,200的最低检测靶水平,对应于浓度为~50pM的特异性mRNA,等价于每细胞大约数百拷贝。因此,这种测定设计得到的敏感度和特异性与市售的表达谱步骤(Lockhart等人1996)相当,不仅在8种未知RNA体外转录子混合物中,还在使用真实产生的人类样品复杂环境中。
由于特异性在多重基因表达谱系中的重要作用,预先报道的对人类胎盘RNA汇聚的卡那霉素“钉入”实验,伸长此实验以促进相对于生病样品的条件。结果对预先报道的对细菌来源的体外转录的RNA的钉入的特异性和敏感度是类似的,说明产生小RT转录子、把捕获探针针对靠近转录子5’末端的区域、并在严格条件下进行RT和杂交的结合,能增加特异性。随机引物的RT转录子通常将超过特异性RT转录子的长度,为后者提供了对捕获固定化的探针显著的熵优势。
靶熵的重要作用在优化的RT条件下再次明显。因此,图21中两阶段的绘图表示了从高亲和常数的稀释方式到低亲和常数的“浓缩”方式。如预先讨论的,浓缩方式的有效亲和常数反映靶的“拥挤”,是强依赖于转录子长度的。事实上,浓缩方式的吸收等温线斜度对于50nt转录子,在两种不同RT反应步骤下是大致一样的(图19C)。相反,在稀释方式,严格步骤3制备的50nt未钉入的转录子的等温线斜度比较不严格步骤2制备的50nt未钉入的转录子的等温线斜度小~2.5,说明在改进的RT条件下亲和常数值对应地提高。
实例VII-示例应用
此处描述的测定格式可以用于诊断和在一些情况下,结合提供治疗使用。
白血球过多症-例如,国际申请No.WO03/008552描述了根据基因表达谱系(profile)诊断混合谱系白血球过多症(MLL)、急性淋巴细胞白血球过多症(ALL)、和急性成髓细胞白血球过多症(AML)。这些测定格式还可以用于分析其它基因的表达谱,诸如Her-2,其在施用HerceptinTM之前分析。基因表达谱还可以用于决定器官移植,或诊断有毒药剂。还可以基于表达谱分析药物对靶的效应。细胞因子存在的某些多态性,其可以表示对疾病或类似移植排斥的易感性,也可以用此处描述的格式来分析。本发明方法的其它应用例子包括,分析宿主对暴露于感染性和/或致病药剂的响应,表明其自身在指定基因组合的表达模式的改变。
ADME板-已经指出,不利的药物反应对美国一年中超过100,000死亡和2百万住院治疗负责。个体遗传变异对此的显著部分负责。然而,检测遗传变异的间接方法作为药物治疗的结果,以监控特定生物标记的基因表达水平。
实例1中描述的方法学可以伸长为药物代谢关联的基因标记,带有调节药物代谢的大约200基因。这些重要的标记在柔性、定制的ADME(吸收-分配-代谢-排泄/排除)板中可得。第一个ADME板基于细胞色素P450,管理许多药物-代谢酶的60基因的超-家族。
使用珠子芯片的多重基因表达监控新标准提供了无先例的准确度、敏感度和特异性。例如,eMAP(伸长反应)之后的hMAP方法施用于辨别细胞色素P450基因家族中接近相关的序列,称为CYP 450 2B1和2B2。对珠子芯片建立的方法学能在高度多重测定格式中特异性地测量96%同源序列基因表达水平的2倍改变。
实例VIII-多重表达监控:制备九(9)种细胞因子体外转录子的细胞因子mRNA板-为了对疾病相关标记板多重基因表达谱开始建立定制的珠子芯片,设计了九(9)人类细胞因子mRNA靶的对照系统,列在表III-1中。
7种细胞因子(IL-2、-4、-8、-10、TNF-α和IFN-γ)和2种内源对照(GAPDH,泛素)的全长cDNA克隆,由测序和以质粒DNA的形式表现,质粒DNA含有插入在pCMV6载体(OriGene Technologies,MD)中的特定细胞因子cDNA。对克隆的载体序列的PCR引物设计为扩增所有带有标准引物对的cDNA,从而排除了靶特异性PCR扩增的大致消耗。把前面的PCR引物置于T7启动子序列上游-位于每个细胞因子插入物(cDNA)克隆位点之后-使得只有位于感兴趣靶的5’末端的特定cDNA序列的T7体外转录。体外转录(MegaScript,Ambion)后,使用SybrGreen染色在琼脂糖胶中纯化模板;在200倍稀释后由光学吸收确定DNA浓度。
然后,根据对卡那霉素建立的优化步骤,使用一套9基因特异性RT引物来产生9 Cy3-标记的cDNA的池而进行多重RT反应。特异地,应用经验的设计原则(见以下)来选择RT引物,从而产生长度50nt至70nt的cDNA同时最小化交叉-杂交。此cDNA的池不经过任何纯化,置于含有8种编码珠子的珠子芯片上,此珠子显示特异性捕获探针,此探针设计为7个细胞因子cDNA和2个内源阳性对照和2个阴性对照的组合,称为寡-C18和卡那霉素。
基于对引物/探针选择的经验设计原则的第一个结果证明了多重分析的随机编码阵列检测(READ)格式确定多个指定细胞因子基因表达水平的能力。然而,9-路测定的2种mRNA靶检测的信号强度接近非特异性背景信号的边缘阈值,作为交叉-反应地结合对应RT引物到复杂样品池中其它mRNA靶的结果。这些结果表示,迫切需要进一步优化引物/探针设计原则,这些原则涉及对用户友好的基于以上公开的数学算法的计算工具。
使用对RT引物和捕获探针选择的第二种设计原则,重新设计了11套捕获探针和对应的对每个感兴趣mRNA特异性的反转录引物(表III-1)。为了增加RT引物与靶杂交反应的特异性,还把引物序列的长度增加到~20寡核苷酸。基于对重新设计的RT引物和捕获探针的计算的融化温度,以比之前高严格性进行RT反应,使用2-步谱,RNA在70℃变性5分钟,然后引物退火并在52℃延伸60分钟。杂交在芯片上在57℃进行-此温度是9种重新设计的探针的平均Tm。
然后,对各含有32毫微微摩尔信息的9种体外转录的RNA进行多重RT反应,使用一套9个基因特异性RT引物以产生9个Cy3-标记的cDNA,根据如上优化的2-步温度培养步骤。特异地,应用计算的设计原则(见报告IV)来选择RT引物从而产生长度从60nt到200nt的cDNA,同时最小化交叉杂交(见以上)。
此直接标记的含有16毫微微摩尔mRNA的Cy3-cDNA的池,不经过任何纯化,放在含有11种编码的珠子的珠子芯片上,此珠子显示特异性捕获探针,此探针设计为7种细胞因子cDNA和2种内源阳性对照和2个阴性对照的组合,称为寡-C18和卡那霉素。结果显示于图26,证明多重可重复的检测6种细胞因子cDNA,RT反应中忽略了IL-6,以提供非特异性杂交的低水平的指示。信噪比在从3.5到6的范围内可重复(见表III-2,图24A),证明对检测的每种信息统计学上显著的信号产出。珠子芯片对每种cDNA包括~300珠子-这种丰度提供了增加水平的可信度。
表III-1-用于多重分析的9个人类细胞因子cDNA克隆:设计分析物的反转录引物和捕获探针。
号码 序列号     样品详情     RT引物     捕获探针 珠子编码
1 NM_000206 人类白细胞介素2受体,γ(IL2RG),mRNA   ATTGGGCGTCAGAATTGTCG20-mer,62.0C SEQ IDNO.54   ATGTTGAAGCCATCATTACCATTC25-mer,62.6C SEQ IDNO.55 G5B
2 NM_152899     人类白细胞介素4诱导的1(IL4I1),转录变体1,mRNA   GGACGAGGACGAGGAGGT18-mer,Tm=63.6CSEQ ID NO.56   TGTCCTGCTGTCACCAAGAG20-mer,Tm=62.7C SEQ IDNO.57 G5C
3 NM_000565 人类白细胞介素6受体(IL6R),mRNA   GCTAATGGGAACCGGGC17-mer,Tm=61.5CSEQ ID NO.58   CAGTGTGTGTAGAGAGCCGG20-mer,Tm=63.1C SEQ IDNO.59 G5D
4 NM_000584 人类白细胞介素8(IL8),mRNA   TCTTTAGCACTCCTTGGCAAA21-mer,60.8C SEQ IDNO.60   GTGTAGGCACTGAGGACGG22-mer,64.3C SEQ IDNO.61 G5E
5 NM_001558     人类白细胞介素10受体,α(IL10RA),mRNA   ATGAGCGTCTGAGCCAAGA19-mer,Tm=62.0CSEQ ID NO.62   ATGCTGCCGTGCCTCGTAG19-mer,Tm=66.1C SEQ IDNO.63 G5F
6 NM_001066     人类肿瘤坏死因子受体超家族,元件1B.TNFRSF1B.mRNA TCATAGTATTCTCTGAGCCGG19-mer,59.4C SEQ IDNO.64 CAGGTGGCATTTACACCCTACG22-mer,64.3C SEQ IDNO.65 G3B
7 NM_018955 人类泛素B(UBB),mRNA   GTCTTGCCGGTAAGGGTT18-mer,Tm=60.4CSEQ ID NO.66   GCAGGATCCTGGTATCCGCTA21-mer,Tm=64.4C SEQ IDNO.67 G3C
8 NM_002046 人类甘油醛-3-磷酸脱氢酶(GAPD),mRNA   ACGGTGCCATGGAATTTGC19-mer,Tm=62.8CSEQ ID NO.68   GGAGTCAACGGATTTGGTCGT21-mer,Tm=63.6C SEQ IDNO.69 G3D
9 NM_000416 人类干扰素γ受体1,(IFNGR1),mRNA   GTGTAGGCACTGAGGACGG19-mer,Tm=63C SEQID NO.70   GCATGGCTCTCCTCTTTCTCC21-mer,Tm=63.5C SEQ IDNO.71 G3E
10 阴性对照     非特异性结合核酸的对照 寡-C18 G2A
11 阴性对照、非人类     多重混合物中不存在的卡那霉素mRNA   TACAAGCTTGGGCGTGTCTC20-mer,Tm=63.4C SEQ IDNO.72 G2B
实例IX:分析玉米基因家族中高度同源的mRNA序列
在两个近交玉米系B73和BSSS53中,来自玉米蛋白的一些mRNA序列对序列的整个945nt有95%至99%同源性。图27和28表示对靶特定突变(红色加亮的)放置捕获探针和伸长探针,以检测近交玉米系BSSS53中7种高度表达的mRNA序列。
用现有方法检测这些序列和评估它们相应的表达水平的任务是个费力的过程,需要测序大量克隆。伸长-介导的和杂交-介导的检测方法学对区分高度同源mRNA是有用的,同时确定这些信息在高度平行格式分析中各自的丰度。检测测定如下进行。
首先,使用特异性RT引物(黄色加亮的)对总RNA样品进行RT反应,把感兴趣的mRNA转换为Cy3-标记的cDNA。7种cDNA靶杂交到珠子芯片上的完全匹配的捕获/伸长探针。设计探针,使得每种探针的3’-末端与靶中各独特多态位点匹配。使用TAMRA-标记的dCTP伸长匹配的杂交探针。因此,伸长的探针将发射荧光信号。
序列识别的更复杂情况,涉及2种具有共同突变的序列,但只有1个具有第二个特异突变,如图29所示。特异地,基因16和31具有同样突变T(代替C),在多序列比对(未示出)中从其它所有序列区分它们。使用第二种特异性捕获/伸长探针检测基因31,以区别独特突变C(代替G)。然而,基因16具有另一个特异性突变,其使得在7种接近同源的序列中由“相位调整(phasing)”设计鉴别它。如图29中详述的,为了确保鉴别,这种设计需要3个步骤;步骤1和2同时发生。
步骤1:探针16,其3’-末端为T,固定化到1类珠子上,并在退火条件下与7种扩增的基因转录子混合物接触。杂交之后的伸长,把两基因16和31与混合物中其它序列辨别开,如由来自负载探针的珠子的TMRA荧光检测到的。同时,3’-末端为C的探针31,固定化到另一类珠子上,并在杂交条件下与7种扩增的基因转录子放在一起。杂交之后的伸长反应,由来自特定编码的珠子类型的TMRA荧光检测基因31。
步骤2:测定的下一阶段是从伸长的探针16除去靶16,由在95℃变性反应。
步骤3:单链伸长的探针16与小Cy5-标记的检测探针16杂交,在二联体形成的融化温度(Tm=49℃),使用与在序列中间的C匹配的探针。如果在所示的融化温度(Tm)发生杂交,因此在1类珠子上检测Cy5荧光,这表示基因16存在于混合物中。因此,以这种设计,来自负载探针31的珠子类型记录的TMRA信号证实了基因31的存在,来自负载探针16的珠子类型记录的TMRA信号以及随后的Cy5信号证实了基因16的存在。
应该理解的是,此处使用的术语、表达和实例仅仅是示范性的,不是限制本发明的范围,本发明范围仅仅由随后的权利要求限定,并包括权利要求所属主题的所有等价物。方法权利要求中的所有步骤可以以任何顺序进行,包括权利要求中列出的,除非在权利要求中另外指出。
序列表
<110>迈克尔·休
     塔蒂亚娜·维纳
     杨家诚
     苏堪塔·本纳吉
<120>使用固定化的捕获探针优化基因表达分析
<130>MEXPR
<150>60/515,611
<151>2003-10-28
<150>60/544533
<151>2004-02-14
<160>72
<170>FastSEQ for Windows Version 4.0
<210>1
<211>172
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>1
agggtaaaat taagcacagt ggaagaattt cattctgttc tcagttttcc tggattatgc 60
ctggcaccat taaagaaaat atcatctttg gtgtttccta tgatgaatat agaagcgtca 120
tcatcaaagc atgccaacta gaagaggtaa gaaactatgt gaaaactttt tg         172
<210>2
<211>87
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>2
tcagttttcc tggattatgc ctggcaccat taaagaaaat atcatctttg gtgtttccta 60
tgatgaatat agaagcgtca tcatcaa                                     87
<210>3
<211>40
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>3
caccattaaa gaaaatatca tctttggtgt ttcctatgat    40
<210>4
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>4
gaaaatatca tctttggtgt ttcct                    25
<210>5
<211>15
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>5
cttttatagt agaaa                               15
<210>6
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>6
cttttatagt agaaacc                             17
<210>7
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>7
cttttatagt agaaaccac                           19
<210>8
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>8
cttttatagt agaaaccaca a                                         21
<210>9
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>9
cttttatagt agaaaccaca aagga                                     25
<210>10
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>10
cttttatagt agaaaccaca aaggatacta                                 30
<210>11
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>11
cttttatagt agaaaccaca aaggatacta cttat                            35
<210>12
<211>60
<212>DNA
<213>玉米
<400>12
ataatatttt gagcattcag aaacacacca agcgaagcac attagcaaca acctaacaac 60
<210>13
<211>60
<212>DNA
<213>玉米
<400>13
ataatatttt gagcattcag aaacacacca agcgaagcgc actagcaaca acctaacaac 60
<210>14
<211>60
<212>DNA
<213>玉米
<400>14
ataatacttt gagcattcag aaacacacca agcgaagcgc actagcaacg accaaacaac       60
<210>15
<211>60
<212>DNA
<213>玉米
<400>15
ataatatttt gagcattcag aaacacacca agcgaagcgc actagcaacg accaaacaac       60
<210>16
<211>60
<212>DNA
<213>玉米
<400>16
ataatatttt gagcattcag aaacacacca agcgaagctt actagcaacg acttaacaac       60
<210>17
<211>60
<212>DNA
<213>玉米
<400>17
ataatatttt gagcattcaa aaacacacca agcgaagctc actagcaacg acctaacaac       60
<210>18
<211>60
<212>DNA
<213>玉米
<400>18
ataatatttt cagcattcaa aaacacacca agcgaagcgc actagcaacg acctaacacc       60
<210>19
<211>60
<212>DNA
<213>玉米
<400>19
aatggctacc aagatattat ccctccttgc gcttcttgcg ctttttgcga gcgcaacaaa       60
<210>20
<211>60
<212>DNA
<213>玉米
<400>20
aatggctacc aagatattat ccctccttgc gcttcttgcg ctttttgcga gcgcaacaaa      60
<210>21
<211>60
<212>DNA
<213>玉米
<400>21
aatggctacc aagatattag ccctccttgc gcttcttgcc ctttttgtga gcgcaacaaa      60
<210>22
<211>60
<212>DNA
<213>玉米
<400>22
aatggctacc aagatattag ccctccttgc gcttcttgcc ctttttgtga gcgcaacaaa      60
<210>23
<211>60
<212>DNA
<213>玉米
<400>23
aatggctacc aagatattag ccctccttgc gcttcttgcc ctttttgtga gcgcaacaaa      60
<210>24
<211>60
<212>DNA
<213>玉米
<400>24
aatggctacc aagatattag ccctccttgc gcttcttgcc ctttttgtga gcgcaacaaa      60
<210>25
<211>60
<212>DNA
<213>玉米
<400>25
aatggctacc aagatattag ccctccttgc gcttcttgcc ctttagtga gcgcaacaaa       60
<210>26
<211>60
<212>DNA
<213>玉米
<400>26
tgcgttcatt attccacaat gctcacttgc tccaagttcc attattacac agttcctccc      60
<210>27
<211>60
<212>DNA
<213>玉米
<400>27
tgcgtccatt attccacaat gctcacttgc tcctagttcc attattccac agttcctccc      60
<210>28
<211>60
<212>DNA
<213>玉米
<400>28
tgcgttcatt attccacaat gctcacttgc tcctagtgcc attattccac agttcctccc      60
<210>29
<211>60
<212>DNA
<213>玉米
<400>29
tgcgttcatt attccacaat gctcacttgc tcctagtgcc attattccac agttcctccc      60
<210>30
<211>60
<212>DNA
<213>玉米
<400>30
tgcgttcatt attccacaat gctcacttgc tcctagtgcc attataccac agttcctccc      60
<210>31
<211>60
<212>DNA
<213>玉米
<400>31
tgcgttcatt attccacaat gctcacttgc tcctagtgcc attattccac agttcctccc      60
<210>32
<211>60
<212>DNA
<213>玉米
<400>32
tgcgttcatt attccacagt gctcacttgc tcctagtgcc agtattccac agttcctccc     60
<210>33
<211>60
<212>DNA
<213>玉米
<400>33
accagttact tcaatgggct tcgaacaccc agctgtgcaa gcctataagc tacaacaagc     60
<210>34
<211>60
<212>DNA
<213>玉米
<400>34
accagttact tcaatggcct tcgaacaccc agctgtgcaa gcctataagc tacaacaagc      60
<210>35
<211>60
<212>DNA
<213>玉米
<400>35
accagttact tcaatgggct tcgaacactc agctgtgcaa gcctacaagc tacaacaagc      60
<210>36
<211>60
<212>DNA
<213>玉米
<400>36
accagttact tcaatgggct tcgaacactc agctctgcaa gcctacaagc tacaacaagc      60
<210>37
<211>60
<212>DNA
<213>玉米
<400>37
accagttact tcaatgggct tcgaacacct agctgtgcaa gcctacaacc tacaacaagc      60
<210>38
<211>60
<212>DNA
<213>玉米
<400>38
accagttact tcaatgggct tcgaacacct agctgtgcaa gcctacagcc tacaacaagc      60
<210>39
<211>60
<212>DNA
<213>玉米
<400>39
accagttact tcaatgggct tcgaacatcc agccgtgcaa gcctacaggc tacaactagc      60
<210>40
<211>420
<212>DNA
<213>细胞系
<400>40
accagttact tcaatgggct tcgaacaccc agctgtgcaa gcctataggc tacaacaagc  60
accagttact tcaatggcct tcgaacaccc agctgtgcaa gcctataggc tacaacaagc 120
accagttact tcaatgggct tcgaacactc agctgtgcaa gccaacaggc tacaacaagc 180
accagttact tcaatgggct tcgaacactc agctctgcaa gccaacaggc tacaacaagc 240
accagttact tcaatgggct tcgaacacct agctgtgcaa gcctacaagc tacaacaagc 300
accagttact tcaatgggct tcgaacacct agctgtgcaa gcctacaggc tacaacaagc 360
accagttact tcaatgggct tcgaacatcc agccgtgcaa gcctacaggc tacaactagc 420
<210>41
<211>60
<212>DNA
<213>玉米
<400>41
gattgcggcg agcgtcttac aacaaccaat tgcccaattg caacaacaat ccttggcaca      60
<210>42
<211>60
<212>DNA
<213>玉米
<400>42
aattgcggcg agcgtcttac aacaaccaat ttcccagttg caacaacaat ccttggcaca      60
<210>43
<211>60
<212>DNA
<213>玉米
<400>43
gcttgcggcg agcgtcttac aacaacgaat tgcccaattg caacaacaat ccttggcaca      60
<210>44
<211>60
<212>DNA
<213>玉米
<440>44
gcttgcggcg agcgtcttac aacaaccaat taaccaattg caacaacaat ccttggcaca       60
<210>45
<211>36
<212>DNA
<213>玉米
<400>45
gcttacggcg agcgtcttac aacaaccaat tgacca                                 36
<210>46
<211>60
<212>DNA
<213>玉米
<400>46
gcttgcggcg agcgccttac aacaaccaat tgcccaattg caacaacaat ccttggcaca       60
<210>47
<211>60
<212>DNA
<213>玉米
<400>47
accagttact tcaatgggct tcgaacaccc agctgtgcaa gcctataggc tacaacaagc       60
<210>48
<211>60
<212>DNA
<213>玉米
<400>48
accagttact tcaatggcct tcgaacaccc agctgtgcaa gcctataggc tacaacaagc       60
<210>49
<211>60
<212>DNA
<213>玉米
<400>49
accagttact tcaatgggct tcgaacactc agctgtgcaa gccaacaggc tacaacaagc       60
<210>50
<211>60
<212>DNA
<213>玉米
<400>50
accagttact tcaatgggct tcgaacactc agctctgcaa gccaacaggc tacaacaagc      60
<210>51
<211>60
<212>DNA
<213>玉米
<400>51
accagttact tcaatgggct tcgaacacct agctgtgcaa gcctacaagc tacaacaagc      60
<210>52
<211>60
<212>DNA
<213>玉米
<400>52
accagttact tcaatgggct tcgaacacct agctgtgcaa gcctacaggc tacaacaagc 60
<210>53
<211>60
<212>DNA
<213>玉米
<400>53
accagttact tcaatgggct tcgaacatcc agccgtgcaa gcctacaggc tacaactagc 60
<210>54
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>54
attgggcgtc agaattgtcg    20
<210>55
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>55
atgttgaagc catcattacc attc    24
<210>56
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>56
ggacgaggac gaggaggt    18
<210>57
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>57
tgtcctgctg tcaccaagag    20
<210>58
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>58
gctaatgggaaccgggc    17
<210>59
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>59
cagtgtgtgt agagagccgg             20
<210>60
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>60
tctttagcac tccttggcaa a           21
<210>61
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>61
gtgtaggcac tgaggacgg              19
<210>62
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>62
atgagcgtct gagccaaga              19
<210>63
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>63
atgctgccgt gcctcgtag                 19
<210>64
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>64
tcatagtatt ctctgagccg g              21
<210>65
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>65
caggtggcat ttacacccta cg             22
<210>66
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>66
gtcttgccgg taagggtt                 18
<210>67
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>67
gcaggatcct ggtatccgct a            21
<210>68
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>68
acggtgccat ggaatttgc              19
<210>69
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>69
ggagtcaacg gatttggtcg t           21
<210>70
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工引物
<400>70
gtgtaggcac tgaggacgg              19
<210>71
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>71
gcatggctct cctctttct c            21
<210>72
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工探针
<400>72
tacaagcttg ggcgtgtctc              20

Claims (62)

1.一种阻止溶液中进行的测定中可检测的二联体数目显著减少的方法,所述测定在许多核酸靶和许多寡核苷酸之间进行,所述寡核苷酸完全或部分地互补于所述靶的亚序列,其中所述寡核苷酸连接于一种固相载体的表面,并在所述靶和所述寡核苷酸杂交之后产生测定信号,所述方法包括选择每单位所述固相载体表面连接的寡核苷酸密度,其低于一个极值,在此极值内预计发生所述显著减少。
2.根据权利要求1所述的方法,还包括把双功能聚合部分连接于所述固相载体,然后把所述寡核苷酸连接于所述双功能聚合部分。
3.根据权利要求2所述的方法,其中所述双功能聚合部分的表面区域,当连接于所述固相载体时是已知的。
4.根据权利要求2所述的方法,其中所述双功能聚合部分是大致分子量是已知的聚乙二醇。
5.根据权利要求2所述的方法,其中所述双功能聚合部分是一种蛋白质,诸如中性亲和素。
6.根据权利要求1所述的方法,其中所述限制随着所述寡核苷酸长度增加而减少。
7.根据权利要求1所述的方法,其中所述限制是基于连接于表面的相邻寡核苷酸不互相重合的区域的条件而确定。
8.根据权利要求1所述的方法,其中所述寡核苷酸与所述靶都是RNA或都是DNA。
9.一种阻止溶液中进行的测定中可检测的二联体数目显著减少的方法,所述测定在许多核酸靶和许多寡核苷酸之间进行,所述寡核苷酸完全或部分地互补于所述靶的亚序列,其中所述寡核苷酸连接于一种固相载体的表面,并在所述靶和所述寡核苷酸杂交之后产生测定信号,所述方法包括调节所述溶液中所述靶的浓度以控制所述寡核苷酸的有效电荷fnP,f≤1,其中每个所述寡核苷酸包括P核苷酸和nP可离子化基团组成,n≥1,并以确定探针不是完全伸长的。
10.根据权利要求9所述的方法,其中所述寡核苷酸以已知的每单位表面密度连接于所述固相载体。
11.根据权利要求9所述的方法,其中所述寡核苷酸与所述溶液化学平衡。
12.一种通过与靶核酸形成二联体而优化捕获的表面上寡核苷酸层密度的方法,所述寡核苷酸具有线性尺寸a的P单体,所述方法包括把所述寡核苷酸的一端连接到所述表面,其中所述寡核苷酸彼此间平均横向间距d,其中d>aPυ,υ=3/5。
13.一种优化寡核苷酸层密度的方法,所述寡核苷酸在用于捕获的表面上,通过与靶核酸形成二联体,所述寡核苷酸具有线性尺寸a的P单体,所述方法包括把所述寡核苷酸的一端连接到所述表面,并且其中所述二联体占用表面区域为ξPT 2,连接的所述寡核苷酸平均横向间距d,从而d>ξPT。
14.根据权利要求9或13所述的方法,其中所述连接是通过所述寡核苷酸的5’末端提供的官能团的方式。
15.根据权利要求9或13所述的方法,其中所述连接是通过所述寡核苷酸的指定部分提供的官能团的方式。
16.根据权利要求9或13所述的方法,其中所述连接是通过所选尺寸的双功能聚合间隔物的一个末端官能团的方式,所述间隔物由其第二个末端官能团共价连接于所述寡核苷酸的5’末端。
17.一种把二联体形成大致限制在靠近固相载体表面的溶液的一个区域的方法,并且其中所述二联体形成在溶液的本体中,在许多核酸和许多寡核苷酸之间形成,所述寡核苷酸完全或部分地互补于所述靶的亚序列,并且其中所述寡核苷酸连接于所述固相载体的表面,包括调节所述溶液的盐浓度至或低于在溶液的本体中形成二联体所需的最小值。
18.根据权利要求17所述的方法,其中所述区域包括带电的靶和带电或不带电的寡核苷酸。
19.根据权利要求17所述的方法,其中所述最小值是10mM浓度的单价盐。
20.在一个涉及核酸靶与寡核苷酸之间形成二联体的测定中,其中所述寡核苷酸完全或部分地互补于所述靶的亚序列,其中所述寡核苷酸连接于所述固相载体表面,调节管理所述核酸靶与所述寡核苷酸相互作用的亲和常数的方法,所述方法包括:选择特定长度的所述靶和所述靶在溶液中的浓度,从而达到期望的亲和常数,通过:(i)对特定长度的所述靶,调节所述靶的浓度从而不超过上限,或(ii)对特定浓度的所述靶,调节所述靶的长度以小于最大值。
21.在一个涉及核酸靶与寡核苷酸之间形成二联体的测定中,其中寡核苷酸完全或部分地互补于靶的亚序列,其中所述寡核苷酸连接于固相载体表面,调节管理所述核酸靶与所述寡核苷酸相互作用的亲和常数的方法,所述方法包括:选择靶长度与靶浓度的一种组合,从而或降低或增加所述亲和常数至期望值,如下:
(i)为了降低所述亲和常数:对特定长度的所述靶,调节所述靶的浓度从而超过浓度的限制值,或对特定浓度的所述靶,调节所述靶的长度从而超过最大长度;或
(ii)为了增加所述亲和常数:对特定长度的所述靶,调节所述靶的浓度从而不超过浓度的限制值,或对特定浓度的所述靶,调节所述靶的长度从而不超过最大长度。
22.根据权利要求20或21所述的方法,其中所述靶是从对应mRNA由反转录产生的cDNA,通过选择性地放置反转录引物到所述mRNA上而调节所述靶长度。
23.根据权利要求20或21所述的方法,其中所述靶是从对应mRNA由反转录产生的cDNA,通过改变所述靶扩增循环数目而调节所述靶浓度。
24.根据权利要求20或21所述的方法,其中所述调节的顺序优选地通过在第一步选择所述靶长度,使其小至通过放置RT引物靠近mRNA的3’末端可操作,以及通过在第二步选择浓度,使其高至可操作而不导致所述亲和常数的显著降低。
25.在从样品使用寡核苷酸阵列分析mRNA表达的方法中,其中所述寡核苷酸完全或部分地互补于从样品mRNA反转录的许多DNA转录子,其中许多DNA转录子与其它DNA转录子序列不同,并且其中测定信号在所述DNA转录子与所述寡核苷酸杂交之后产生,所述方法包括:
增加来自所选DNA转录子的测定信号,此转录子包括特定的亚序列,并存在低拷贝数或比其它DNA转录子存在较低拷贝数,通过:
(a)对包括特定亚序列的所选DNA转录子的特定浓度,并且其中所述亚序列互补于阵列中寡核苷酸(或其亚序列),确定所选DNA转录子的一种长度,在此长度它们对所述寡核苷酸的亲和力低于对包括特定亚序列和具有较短长度的较小的DNA转录子;且
(b)增加所选DNA转录子对所述寡核苷酸的亲和力,通过只反转录小于所述长度的所选DNA转录子,或者阻止长于所述长度的所选DNA转录子与测定中的所述寡核苷酸杂交。
26.根据权利要求25所述的方法,其中步骤(a)和(b)以至少另一套所选的DNA转录子重复,所述转录子包括不同于特定亚序列的另一亚序列。
27.根据权利要求25所述的方法,其中当所选DNA转录子与探针杂交后产生所述测定信号,所述探针由标记的核苷酸伸长。
28.根据权利要求25所述的方法,其中所述测定信号由合并到所选DNA转录子的标记在杂交所述探针之后产生。
29.根据权利要求28所述的方法,其中所述标记是Cy3。
30.根据权利要求28所述的方法,其中所述测定信号还在所选DNA转录子中增强,通过增加所选DNA转录子中每特定数目核苷酸标记的数目。
31.根据权利要求30所述的方法,其中所述转录子中每特定数目核苷酸标记的数目的增加,是通过在反转录之前增加溶液中所述转录子的标记的dNTPs与未标记的比例。
32.根据权利要求30所述的方法,其中所述转录子中每特定数目核苷酸标记的数目的增加,是通过控制反转录中溶液中带有特定碱基的标记的dNTP的量。
33.根据权利要求32所述的方法,其中溶液中生物素-dATP和生物素-dCTP与所述转录子在一起。
34.在涉及核酸靶与连接在固体支撑物表面的寡核苷酸之间的二联体形成、并形成其上的一层的测定中,其中所述寡核苷酸完全或部分地互补于所述靶的亚序列,并且其中所述测定信号在所述靶与所述寡核苷酸杂交之后产生,通过一种方法增加测定中可检测的二联体数目,此方法包括:把所述亚序列置于或靠近所述靶的5’末端。
35.根据权利要求34所述的测定,其中选择所述靶以不超过特定长度。
36.根据权利要求34或35所述的测定,其中所述靶是从mRNA反转录的cDNA,通过选择序列特异性的反转录引物调节亚序列位置和靶长度。
37.在使用寡核苷酸阵列从样品分析mRNA表达的方法中,所述寡核苷酸互补于所选的从mRNA样品反转录的DNA转录子,其中所述测定涉及检测转录子与所述寡核苷酸阵列之间的二联体形成,其中所述寡核苷酸连接于固体支撑物表面,在其上形成一层,并完全或部分地互补于所述转录子的亚序列,并且其中在所述靶与所述寡核苷酸杂交之后产生测定信号,并由一个方法增加测定中可检测的二联体数目,此方法包括:
提供所述寡核苷酸,其与所述所选的DNA转录子在位于或靠近所述所选的DNA转录子的一末端形成二联体。
38.根据权利要求37所述的方法,其中所述末端是5’末端。
39.根据权利要求37所述的方法,其中在转录子杂交于所述寡核苷酸之后,所述寡核苷酸由标记的核苷酸伸长时,所述测定信号结果。
40.一种增强多重分析多个不同序列的不同核酸靶的方法,其中所述分析基于涉及溶液中核酸靶与连接在固体支撑物表面的寡核苷酸之间的二联体形成的测定,其中所述寡核苷酸完全或部分地互补于所述靶的亚序列,并且其中所述测定信号在所述靶与所述寡核苷酸杂交之后产生;并且其中溶液中的所述核酸靶相对浓度是已知或预测的,并且对溶液中以高于或预测高于特定浓度存在的靶,选择靶长度以超过最小长度,在最小长度二联体亲和常数有显著减小,并且对溶液中以高于或预测低于特定浓度存在的靶,选择靶长度以不超过最小长度,从而避免二联体亲和常数显著减小。
41.根据权利要求1所述的方法,其中所述最小长度通过评价一个函数而确定,此函数对靶长度的值赋予靶浓度的值,然后确定轨迹。
42.在涉及核酸靶与连接在固相载体表面的寡核苷酸之间的二联体形成的测定中,其中所述寡核苷酸完全或部分地互补于所述靶的亚序列,一种调节亲和常数的方法,此常数管理所述核酸靶与所述寡核苷酸的相互作用,通过靶长度和靶浓度的组合从而增加或减小亲和常数,通过一种方法,其包括:
(i)为了降低亲所述和常数:对特定长度的所述靶,调节所述靶的浓度从而超过浓度的限制值,或对特定浓度的所述靶,调节所述靶的长度从而超过最小长度;或
(ii)为了增加所述亲和常数:对特定长度的所述靶,调节所述靶的浓度从而不超过浓度的限制值,或对特定浓度的所述靶,调节所述靶的长度从而不超过最大长度。
43.一种确定在一组核酸序列中指定等位基因浓度的方法,此方法包括:
通过序列间捕获介导的伸长检测所述等位基因;
通过装饰伸长产物确定其相对丰度,从而装饰产生的信号强度与形成的伸长产物的量成正比。
44.根据权利要求43的方法,其中所述装饰步骤是由把所述伸长产物杂交于荧光标记的寡核苷酸。
45.一种鉴别或辨别并检测一套大致同源的核酸中的指定核酸靶的方法,包括:
扩增或反转录所述靶内的序列;
把连接于固相载体并完全或部分地互补于所述序列内的亚序列的寡核苷酸,在一种条件下置于接触所述靶,其中所述寡核苷酸将被伸长,如果所述寡核苷酸的3’末端互补于亚序列中的配对的核苷酸;且
把完全或部分地互补于伸长产物中亚序列的标记探针,在杂交条件下置于接触所述伸长产物,然后检测杂交。
46.根据权利要求45所述的方法,其中所述寡核苷酸通过其5’末端连接于所述固相载体。
47.根据权利要求45所述的方法,其中所述伸长是在一种条件下进行,此条件确保把至少一种荧光标记的dNTP合并到所述伸长产物中。
48.根据权利要求45所述的方法,其中所述伸长是在一种条件下进行,此条件确保把至少一种荧光标记的dNTP合并到所述伸长产物中,所述dNTP修饰为能够随后以荧光部分装饰。
49.根据权利要求48所述的方法,其中所述伸长是在一种条件下进行,此条件确保把多种荧光标记的dNTPs合并到所述伸长产物中,所述dNTPs修饰为能够随后以荧光部分装饰。
50.根据权利要求48或49所述的方法,其中所述修饰过的dNTPs是生物素化的,荧光部分是共价连接于藻红蛋白的链霉亲和素。
51.检测相关基因组序列的家族中差异性的一种方法中,其中所述家族衍生自特定物种,并且其中所述家族的成员具有2或更多相关的序列相似的亚序列,并且至少一个所述相关的亚序列(指定的“S1”)在所述家族中一些成员中序列有3或更多连续核苷酸的差异,并且至少一个所述相关的亚序列(指定的“S2”)在所述家族中一些成员中序列有少于3个连续核苷酸的差异;其中采用双测定格式,包括:
扩增包括亚序列S1和S2的相关基因组序列的区域,或反转录包括亚序列S1和S2的mRNA区域,至少4套单独的寡核苷酸,所述套分别包括:
(i)来自亚序列S1的一种寡核苷酸(序列F1S1)和来自亚序列S2的一种寡核苷酸(序列F1S2);
(ii)来自亚序列S1的一种寡核苷酸(序列F2S1)和来自亚序列S2的一种寡核苷酸(序列F2S2);
(iii)来自亚序列S1的一种寡核苷酸(序列F1S1)和一种寡核苷酸(序列F2S2);和
(iv)来自亚序列S1的一种寡核苷酸(序列F2S1)和一种寡核苷酸(序列F2S2);
提供第一套能够杂交F1S1的寡核苷酸探针、第二套能够杂交F2S1的寡核苷酸探针、第三套能够杂交F1S2的寡核苷酸探针、第四套能够杂交F2S2的寡核苷酸探针,每套所述寡核苷酸能够被编码,从而能够在各套之间辨别;其中,把4套所述寡核苷酸与4套寡核苷酸探针杂交之后,包括F1S1或F2S1的寡核苷酸可以被检测,因为它们以第一种颜色标记,包括F1S2或F2S2的寡核苷酸在伸长反应后可以由可检测的第二种颜色检测;
将4套寡核苷酸与4套寡核苷酸探针在益于杂交和伸长的条件下接触,从而包括F1S1或F2S1的寡核苷酸可以被检测,因为它们以第一种颜色标记,包括F1S2或F2S2的寡核苷酸在伸长反应后可以由可检测的第二种颜色检测;
分析杂交和伸长的模式,通过检测和分析第一种和第二种颜色的存在;并基于分析,确定样品中存在4套寡核苷酸(F1S1、F2S1、F1S2、F2S2)中哪个。
52.根据权利要求51所述的方法,其中通过把各套连接于不同编码的珠子而达到对4套寡核苷酸探针的编码。
53.根据权利要求51所述的方法,其中所述寡核苷酸是伸长的,所述伸长产物包括合并于其中的标记的核苷酸。
54.根据权利要求51所述的方法,其中所述寡核苷酸套的元件被标记,通过使用标记的引物进行反转录。
55.一种确定受实验者之间mRNA差异性表达的方法,其中受实验者的基因组DNA包括两个不同但相似的亚序列,一个所述亚序列指定为“正常的”,另一个亚序列指定为“变异的”,包括:
(i)反转录受实验者的包括正常和变异亚序列的基因组DNA产生的mRNA,以产生两种cDNA链,第一cDNA链包括来自所述正常亚序列的亚序列,第二cDNA链包括来自所述变异亚序列的亚序列;
(ii)产生反义cDNA,其完全或部分地互补于第一cDNA链或第二cDNA链,从而反义cDNA在退火条件下,将退火以与第一或第二cDNA链形成双链cDNA;
(iii)提供退火条件,从而反义cDNA与互补cDNA链(第一或第二cDNA链)形成双链cDNA;
(iv)消化步骤(iii)中双链cDNA的一条链,以产生单链反义cDNA链;
(v)提供退火条件从而单链反义cDNA链与另一cDNA链(第一或第二cDNA链)退火;并
(vi)确定在步骤(v)之后是否有多余的第一或第二cDNA链。
56.根据权利要求55所述的方法,其中步骤(ii)中产生的反义DNA包括一个标签,其识别它用于消化。
57.根据权利要求55所述的方法,其中使用杂交到第一或第二cDNA链的探针实现步骤(vi),所述探针被编码以识别。
58.根据权利要求57所述的方法,其中所述cDNA链已经被标记了,并在杂交后产生可检测的信号。
59.根据权利要求57所述的方法,还包括在条件下伸长所述探针,从而产生可检测信号的标记合并到所述伸长产物中。
60.根据权利要求57所述的方法,其中所述探针通过连接到编码的珠子而编码。
61.根据权利要求55所述的方法,其中用于反转录的反转录引物是标记的。
62.根据权利要求61所述的方法,其中标记的信号强度的差异用于确定在步骤(v)之后是否有多余的第一或第二cDNA链。
CNA2004800392002A 2003-10-28 2004-10-26 使用固定化的捕获探针优化基因表达分析 Pending CN101124333A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US51661103P 2003-10-28 2003-10-28
US60/516,611 2003-10-28
US60/544,533 2004-02-14

Publications (1)

Publication Number Publication Date
CN101124333A true CN101124333A (zh) 2008-02-13

Family

ID=39086049

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800392002A Pending CN101124333A (zh) 2003-10-28 2004-10-26 使用固定化的捕获探针优化基因表达分析

Country Status (1)

Country Link
CN (1) CN101124333A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104837985A (zh) * 2012-05-30 2015-08-12 陶氏益农公司 用于floury(fl2)性状基因渗入的玉米中的floury 2基因特异性测定法
CN107614703A (zh) * 2015-02-27 2018-01-19 香港大学 Dna展示及其方法
CN109147869A (zh) * 2017-06-28 2019-01-04 上海思路迪生物医学科技有限公司 基因检测产品探针分管组合的优化方法、装置及系统
CN110352252A (zh) * 2016-09-22 2019-10-18 威廉马歇莱思大学 用于复杂序列捕获和分析的分子杂交探针
CN113965109A (zh) * 2021-08-12 2022-01-21 湖南工业大学 一种多电机分层式总量最优协同的抗饱和控制方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104837985A (zh) * 2012-05-30 2015-08-12 陶氏益农公司 用于floury(fl2)性状基因渗入的玉米中的floury 2基因特异性测定法
CN104837985B (zh) * 2012-05-30 2019-10-25 陶氏益农公司 用于floury(fl2)性状基因渗入的玉米中的floury 2基因特异性测定法
CN107614703A (zh) * 2015-02-27 2018-01-19 香港大学 Dna展示及其方法
CN110352252A (zh) * 2016-09-22 2019-10-18 威廉马歇莱思大学 用于复杂序列捕获和分析的分子杂交探针
CN109147869A (zh) * 2017-06-28 2019-01-04 上海思路迪生物医学科技有限公司 基因检测产品探针分管组合的优化方法、装置及系统
CN113965109A (zh) * 2021-08-12 2022-01-21 湖南工业大学 一种多电机分层式总量最优协同的抗饱和控制方法
CN113965109B (zh) * 2021-08-12 2023-10-10 湖南工业大学 一种多电机分层式总量最优协同的抗饱和控制方法

Similar Documents

Publication Publication Date Title
US10407718B2 (en) Optimization of gene expression analysis using immobilized capture probes
US7970553B2 (en) Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis
US6368799B1 (en) Method to detect gene polymorphisms and monitor allelic expression employing a probe array
JP4718181B2 (ja) マイクロアレイ上での逆転写
KR20020008195A (ko) 폴리뉴클레오티드 서열 변형의 미세배열-기초 분석
CN109477095A (zh) 用于单分子检测的阵列及其应用
CN102858995A (zh) 靶向测序方法
CN103370425A (zh) 用于核酸扩增的方法、组合物、系统、仪器和试剂盒
US20130344540A1 (en) Methods for minimizing sequence specific bias
CN103429754A (zh) 天然延伸平行测序
CN100354298C (zh) 使用单核苷酸多态性组分析受损样品的方法和组合物
CN101124333A (zh) 使用固定化的捕获探针优化基因表达分析
US20090061440A1 (en) Method for amplifying plural nucleic acid sequences for discrimination
WO2008088236A1 (ru) Способ генетической идентификации личности на основе анализа однонуклеотидного полиморфизма генома человека с использованием олигонуклеотидного биологического микрочипа (биочипа)
EP1913159B1 (en) Detection method for gene expression
JP2006320217A (ja) マルチプレックスpcr法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080213