CN1950516A - 用于使用扫描探针显微镜术和纳代码检测核酸的方法和组合物 - Google Patents

用于使用扫描探针显微镜术和纳代码检测核酸的方法和组合物 Download PDF

Info

Publication number
CN1950516A
CN1950516A CNA2004800394991A CN200480039499A CN1950516A CN 1950516 A CN1950516 A CN 1950516A CN A2004800394991 A CNA2004800394991 A CN A2004800394991A CN 200480039499 A CN200480039499 A CN 200480039499A CN 1950516 A CN1950516 A CN 1950516A
Authority
CN
China
Prior art keywords
code
probe
nucleic acid
coding
oligonucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800394991A
Other languages
English (en)
Inventor
A·伯林
M·山川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN1950516A publication Critical patent/CN1950516A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y5/00Nanobiotechnology or nanomedicine, e.g. protein engineering or drug delivery
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y10/00Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/155Particles of a defined size, e.g. nanoparticles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/601Detection means characterised by use of a special device being a microscope, e.g. atomic force microscopy [AFM]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Nanotechnology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种用于确定核酸的核苷酸序列的方法,该方法包括用一系列用于结合核酸的已标记寡核苷酸接触核酸,其中每一个已标记寡核苷酸包括一个已知的核苷酸序列和一个分子纳代码(nanocode)。然后用SPM检测与核酸结合的已分离的已标记寡核苷酸的纳代码。本发明的纳代码在某些方面包括超过标签的排列的可检测特征,所述标签编码与带条形码的目标有关的信息,这有助于检测编码与带条形码的目标有关的信息的标签。可检测的特征包括纳代码或与纳代码相关的结构,此处被称作可检测特征标签,用于差错校验、纠错、编密码和数据缩减/压缩。

Description

用于使用扫描探针显微镜术和纳代码检测核酸的方法和组合物
                      发明背景
                      发明领域
【0001】本发明总的来说涉及分子分析方法,更特别地涉及检测与纳代码有关的分子。
                      背景信息
【0002】医学领域,除了其它领域之外,对用于分子鉴别和表征的技术的需求正在日益增加。尤其是,对DNA分子进行测序的技术已经变得越来越重要,部分原因是由于应用了遗传学和基因治疗的最新医学进展。
【0003】由于多个原因,了解特定DNA分子的序列已经是有利的。当前的方法是对DNA序列作图,然而现有方法太麻烦并且太慢,以至于不能满足当前的表征和测序需求。当前这样的一种方法包括自动测序仪,使用PCR扩增来产生分子的许多拷贝,随后是化学(或放射活性)加标签,凝胶电泳,以及统计计算方法来计算原始序列。该方法非常耗时,不太适合于今天快速的测序需求。此外,PCR测定的统计测序为表征留下了误差余地,这是不可接受的。
【0004】对于短序列,通常使用基于杂交微阵列的方法,该方法使用了生物芯片,如Affymetrix,Inc.出售的那些生物芯片。在这些“DNA芯片”中,多个一模一样的拷贝由检测分子构成。检测分子包括DNA的特定的、短(<100碱基)序列,这些DNA被仔细地合成,这样它们的序列就是已知的。通过检测(通常是光学地)未知DNA与这些检测分子中的一个分子的杂交,可以推断出一小部分原始DNA分子的序列。然而,该生物芯片方法的问题是,检测分子太长,而不能提供完全的检测准确度。
【0005】存在对多核苷酸进行测序的设备和方法的需求,这些设备和方法能降低测序错误的可能性,如非决定性的读取,和以较快速率以及较低成本。进一步,存在对用于生物分子的检测、鉴别和/或测序的快速、准确和灵敏方法的需求,一般而言,所述生物分子如核酸和蛋白质。
                        附图简述
【0006】图1A和1B示意性说明了本发明的一种用于DNA的纳代码加标签的具体方法,该方法用于确定核酸分子的核苷酸序列。图1A提供了此处公开方法的具体实施例的步骤。图1B提供了此处公开方法的具体实施例的图形表示。
【0007】图2A和2C示意性说明了使用金纳米颗粒30标签(tag)和DNA骨架编码单核苷酸的条形码模式。该图示意性说明了2nm金纳米颗粒(小圆圈)和10nm金纳米颗粒(大圆圈)。
【0008】图3是肽C(60)纳代码的STM图像。多个巴基球(buckeyball)通过肽相连。STM扫描鉴别石墨上的四个巴基球(buckeyball),通过合成肽连接:
NH2-AAMAAKAMAAMAKAVAMAAKAVAAMAKAAA-CONH2(SEQ ID NO:1)。
【0009】图4A到4C示意性说明了阅读帧可检测特征的实施方案(图4A);数据压缩(图4B);以及校验和(图4C)。
【0010】图5示意性说明了一种例证性的方法,用于用分支520和标签530修饰的有机骨架510产生条形码500。条形码500可以包括与目标结合的探针组分550。标签530可以进行额外的修饰,例如通过与抗体540结合。
                        发明详述
【0011】本发明总的来说涉及其这样的发现,即与物理对象有关的信息,如核酸,可以在生物分子纳代码中被人工编码,并且通过表面分析方法如扫描探针显微镜术方法以单分子水平被解码。例如,本发明的几个实施方案就基于这样的发现,即可以用扫描探针显微镜术方法来鉴别核苷酸杂交反应中的纳代码。
【0012】因此,提供了检测目标分子的方法,如目标核酸,该方法包括提供一个或多个已编码探针,如已编码寡核苷酸探针,以及用已编码探针接触目标分子。每个探针包括一个生物分子核心,如寡核苷酸,与至少一个包括一个可检测的非编码特征的纳代码相关。然后使用扫描探针显微镜术(scanning probe microscopy(SPM))鉴别与目标分子结合的已编码探针,以检测纳代码以及已编码探针的可检测特征。
【0013】在某些方面,用目标分子接触已编码探针的文库,该文库包括针对特定长度的寡核苷酸的所有可能的序列。纳代码选自,例如碳纳米管、富勒烯(fullerene)、亚微米金属条形码、纳米颗粒或量子点。在某些方面,核酸附着在表面上。
【0014】该方法也进一步包括确定与核酸结合的寡核苷酸的序列。目标分子可以是,例如蛋白质、肽、糖蛋白、脂蛋白、核酸和多核苷酸、寡核苷酸、脂质、糖脂或多糖。
【0015】此处所使用的可检测的非编码特征是可以使用可检测的特征标签提供的特征,也称作“非编码特征标签(non-encoding feature tag)”或“特定特征标签(special feature tag)”。例如,可检测的非编码特征标记物可以是起始标签。在某些方面,可检测特征是核对和条形码片段(checksum barcode segment)。在其它方面,可检测的特征包括头部片段(header segment)和编码片段(encoding segment)。在某些方面,该方法进一步包括将分子纳代码转化为压缩纳代码。在其它方面,该方法包括将与在目标分子上相邻区域结合的两个探针连接在一起。在这些实施方案中,已连接的探针可以形成阅读帧,其可以用阅读帧标志(reading frame marker)来标志。
【0016】在另一个方面,提供了一种组合物,其包括附着在至少一个纳代码上的至少一个已编码探针分子,所述纳代码编码可检测的非编码特征。探针分子是特定结合对成员,例如,核酸,如寡核苷酸或多核苷酸;蛋白质或其肽片段,如受体或转录因子,抗体或抗体片段,例如遗传工程抗体,单链抗体,或人源化抗体;凝集素;底物;抑制剂;活化剂;配体;激素;细胞因子;趋化原子;和/或药物。在某些方面,探针分子是寡核苷酸。
【0017】在另一个实施方案中,提供了用于核酸测序的系统,包括扫描探针显微镜,表面,和附着在表面上的至少一个已编码探针,其中已编码探针包括纳代码,该纳代码包括一个可检测特征。在某些方面,已编码探针通过分子梳在表面上被排列比对。
【0018】在另一个实施方案中,提供了一种方法,该方法用于确定核酸的核苷酸序列,如多核苷酸,通过用一系列结合该核酸的已标记寡核苷酸接触该核酸,其中每个已标记寡核苷酸包括一个已知的核苷酸序列,和一个包括可检测的非编码特征的分子纳代码。然后分离与核酸结合的已标记寡核苷酸,已分离的已标记寡核苷酸在扫描探针显微镜(SPM)基片上沉积。例如,使用SPM检测已分离的已标记寡核苷酸的纳代码和它们的相关的可检测的非编码特征。然后基于一个或多个已检测到的纳代码,对已分离的已标记寡核苷酸的核苷酸序列进行解码。因此,确定了核酸的核苷酸序列。在本方面的某些方面,纳代码可以包括一系列标签。
【0019】本发明的该实施方案的一个具体实例在图1A和1B中进行了示意性说明。在图1A和1B中例证性说明的方法中,核酸如DNA 60从样品120分离。然后将样品DNA 60引入到反应容器130中,如烧杯中,该反应容器包括一系列已标记寡核苷酸80(例如寡核苷酸探针的已编码文库)。然后从反应容器140取出样品,在SPM表面50上沉积。与样品结合的条形码是供阅读物150。该方法可以重复,以便从多次条形码读数160确定DNA样品的DNA序列。
【0020】在一个相关的实施方案中,提供了一种用于在生物样品中确定目标核酸如多核苷酸的核苷酸序列的方法,该方法包括用一系列已标记寡核苷酸接触核酸。已标记核苷酸用于与核酸结合,其中每个已标记寡核苷酸包括一个已知的核苷酸序列,和一个分子纳代码,其包括一个可检测的非编码特征。分离与核酸结合的已标记寡核苷酸。分离的已标记寡核苷酸在扫描探针显微镜基片(SPM)上沉积。然后使用SPM检测沉积的已标记寡核苷酸上的纳代码,和它们的非编码的可检测特征。然后基于已检测纳代码,确定分离的已标记寡核苷酸的核苷酸序列,从而确定生物样品中目标核酸的核苷酸序列。
【0021】生物样品是,例如,尿液、血液、血浆、血清、唾液、精液、粪便、痰、脑脊髓液、眼泪、粘液及其类似物。在某些方面,生物样品来自哺乳动物对象,例如人。生物样品可以是实际上任何生物样品,尤其是含有来自对象的RNA或DNA的样品。生物样品可以是组织样品,其含有,例如,1到10,000,000;1000到10,000,000或1,000,000到10,000,000个体细胞。样品不需要含有完整细胞,只要该样品含有足够的用于本发明所述方法的RNA或DNA,在某些方面这仅仅需要1个RNA或DNA分子。根据本发明的方面,其中生物样品来自哺乳动物对象,生物或组织样品可以来自任何组织。例如,组织可以通过外科手术、活组织检查、拭子、粪便或其它收集方法获得。
【0022】在其它方面,生物样品含有病原体,例如病毒或细菌病原体。在某些方面,然而模板核酸在与探针接触之前,从生物样品纯化。分离的模板核酸可以与反应混合物接触,不需要被扩增。
【0023】在其它方面,生物样品含有病原体,例如病毒或细菌病原体。在某些方面,然而模板核酸在与探针接触之前,从生物样品纯化。分离的模板核酸可以与反应混合物接触,不需要被扩增。
【0024】在另一个实施方案中,提供了一种用于在核酸如多核苷酸的目标位置上确定核苷酸事件(nucleotide occurrence)的方法,该方法包括用一系列用于与核酸结合的已标记寡核苷酸与核酸接触,其中已标记寡核苷酸包括在目标位置与核苷酸事件(nucleotide occurrence)结合的已知的核苷酸序列,以及一个典型地包括可检测的非编码特征的分子纳代码。使用扫描探针显微镜术(SPM)检测已标记寡核苷酸与核酸的结合,以便检测分子纳代码,和已结合的已标记寡核苷酸的可检测的非编码特征。分子纳代码的鉴别可以鉴别在核酸的目标位置上结合核苷酸事件的已标记寡核苷酸。
【0025】在另一个实施方案中,提供了一种用于确定基因组的至少两个目标位置的核苷酸事件的方法,该方法包括用一系列结合核酸的已标记寡核苷酸接触基因组的核酸,其中已标记寡核苷酸每一个包括一个已知的核苷酸序列,该已知的核苷酸序列在该系列目标位置中的一个目标位置上与核苷酸事件结合,并且包括一个分子纳代码,该分子纳代码包括一个可检测的非编码特征。该系列的已标记寡核苷酸典型地包括在目标位置上与至少已知的核苷酸事件中的一个核苷酸事件结合的寡核苷酸。使用扫描探针显微镜术(SPM)检测已标记寡核苷酸与核酸的结合,以便检测已检测寡核苷酸的分子纳代码的分子纳代码,和可检测的非编码特征。分子纳代码的鉴别可以鉴别在核酸的目标位置上结合核苷酸事件的已标记寡核苷酸。从而,确定至少两个目标位置上的核苷酸事件。例如,可以确定在2,3,4,5,10,20,25,50,100,250,500,1000,2500,5000或10000个位置上的核苷酸事件。
【0026】在某些方面,核酸分子的目标位置是一个具有多态性的位点,如单核苷酸多态性位置。多态型是群体中发生的等位基因变体。多态性可以是一个位点上所存在的单核苷酸差异,或者可以是一个或几个核苷酸的插入或删除。同样地,单核苷酸多态性(SNP)通过基因组如人基因组中的一个特定位点上的一个或两个、三个或四个核苷酸事件(即腺苷、胞嘧啶、鸟苷或胸苷)的群体存在为特征。正如此处所表明的,本发明的方法在某些方面,提供了一个SNP位置上的一个核苷酸事件的检测,或者对于一个二倍体生物如一个哺乳动物,进行一个SNP位置上的双基因组核苷酸事件的检测。
【0027】在另一个实施方案中,提供了纳代码,其包括一个可检测的非编码特征,并且可通过单分子水平表面分析方法检测。本发明的纳代码在某些方面包括可检测的非编码特征,该特征超过了编码与带条形码对象有关的信息的纳代码结构的重排,这有助于检测编码与带条形码对象有关的信息的标签。可检测的非编码特征包括差错校验/纠错、编密码和数据缩减/压缩的结构。这些结构可以从纳代码形成或与纳代码相关,其中在此处它们被称作可检测的非编码特征标签,特征标签或可检测的特征标签。这些可检测特征可以使用用于非条形码应用的已知算法使用,以便有助于纳代码数据的数据分析。
【0028】在另一个实施方案中,提供了一系列寡核苷酸,它们包括一个已知的核苷酸序列部分,也被称作探针部分,用于通过杂交进行测序,和一个纳代码部分,用于随后的读取和已编码信息的解码。纳代码是根据本发明的纳代码。
【0029】使用此处描述的方法确定的核苷酸序列可以包括一个单核苷酸,如单核苷酸多态性上的核苷酸事件,或者可以包括,例如2,3,4,5,10,15,20,25,50,100,200,250,500,750,1000,2000,2500,5000,10,000等个数的核苷酸。
【0030】在某些方面,本发明的方法提供了这样的一个优点,即可以检测比用传统标记方法更少数量的已标记寡核苷酸的拷贝。例如,可以使用本发明的方法检测100个拷贝或更少,50个拷贝或更少,25个拷贝或更少,10个拷贝或更少,5个拷贝或更少,4个拷贝或更少,3个拷贝或更少,2个拷贝或更少,或者已标记寡核苷酸的单个拷贝。
【0031】当在此使用时,“大约”是指在一个数值的百分之十以内。例如,“大约100”是指在90与110之间的数值。
【0032】“核酸”包括DNA、RNA(核糖核酸),单链、双链或三链,及其任何化学修饰。实际上,核酸的任何修饰都在考虑范围之内。“核酸”可以是几乎任何长度,从2个或更多个碱基的寡核苷酸到全长染色体DNA分子。核酸包含,但不限于寡核苷酸和多核苷酸。当在此使用时,“多核苷酸“是包括至少25个核苷酸的核酸。
【0033】“已编码探针(coded probe)”是指附着于一个或多个纳代码上的探针分子。探针分子是对一个或多个目标分子显示出选择性和/或特异性结合的任何分子。在本发明的各种实施方案中,各个不同的探针分子可以附着于可区分的纳代码上,以便可以从一群不同的探针分子中检测到特定探针的结合。
【0034】在本发明的某些实施方案中,如那些针对确定核酸的核苷酸序列的实施方案,已编码探针可以包含已经共价或非共价地附着于一个或多个纳代码的寡核苷酸和/或核酸,其可鉴别寡核苷酸和/或核酸的序列。这些已编码探针在此处有时被称作“已编码寡核苷酸”,“已标记寡核苷酸”或“已编码寡核苷酸探针”。在某些实施方案中,在寡核苷酸探针内的各个核苷酸都可以附着于可分辨的纳代码上,这使得该已编码探针的序列可以从核苷酸的序列中鉴别出来。
【0035】至于可以使用的探针分子的类型,本发明的实施方案并没有限制。在这些实施方案中,任何在本技术领域已知的探针分子都可以使用,包含但不限于寡核苷酸、核酸、抗体、抗体片段、结合蛋白、受体蛋白、肽、凝集素、底物、抑制剂、活化剂、配体、激素、细胞因子,等等。
【0036】“纳代码(nanocode)”是指可以用来检测和/或鉴别已编码探针的构成物。在下文更为详细讨论的非限制性的实例中,纳代码包括一个或多个亚微米金属条形码、碳纳米管、富勒烯或任何其它可被扫描探针显微镜术检测和鉴别的纳米级的组分。纳代码并不限于单个组分,在本发明的某些实施方案中,纳代码可以包含,例如两个或更多个彼此粘附的富勒烯。当所述组分为富勒烯时,它们可以,例如由一连串大大小小的以特定顺序连接在一起的富勒烯组成。在纳代码中不同大小的富勒烯的顺序可以利用扫描探针显微镜术来检测,这个顺序可以用来,例如识别附着的寡核苷酸探针的序列。
【0037】当在此处使用时,术语“特定结合对成员(specific binding pairmember)”指与特定结合对的另一个成员特异性结合或选择性杂交的分子。特定结合对成员包括,例如,寡核苷酸,以及寡核苷酸可以选择性地与其杂交的核酸,或者包括蛋白质以及与该蛋白质结合的抗体。
【0038】“目标”或“分析物”分子是可以结合到已编码探针的任何分子,包含但不限于核酸、蛋白、脂质及多糖。在针对编码或解码物理目标有关的信息的方法的某些方面中,或者在针对用于检测目标分子的方法的某些方面中,已编码探针与目标分子的结合可以被用来检测在样品中该目标分子的存在。
【0039】在本发明的某些方面,除了编码与带条形码对象有关的信息的结构或标签,纳代码具有可检测的非编码特征,这有助于准确地检测纳代码。可检测的非编码特征包括纳代码的结构,或与纳代码相关的结构,用于错误校验/纠错、编密码和数据缩减/压缩。在某些方面的可检测的非编码特征结构包括起始标志物(marker)、末端标志物和条形码单元到阅读帧的排列,这可以通过阅读帧标签来标志。这些可检测的非编码特征可以与已知的用于非条形码应用的算法来一起使用,以便有助于纳代码数据的数据分析。这些可检测的非编码特征通过相同类型的标签提供,这些标签用于编码与带条形码对象有关的信息,或者可以在结构上与用于编码带条形码对象有关的信息的标签不同,这在下面进行了进一步的详细描述。
【0040】作为可检测的非编码特征的实例,正如图2b中所说明的,本发明的纳代码10在某些方面,包括标题段210和编码片段220。标题段220和编码片段230的引入有助于将已检测纳代码10从自装配结构中区分出来。纳米颗粒的大小和附着位置(即从相邻纳米颗粒分离)可以区分标题段与编码片段。例如,已编码寡核苷酸探针的文库每一个可以包括相同的标题段220和不同的编码片段230。在本发明的某些方面,纳代码10可使用单分子水平表面分析方法来区分。
【0041】本发明的纳代码10可以在许多不同的方法中使用,例如在生物技术和/或健康护理中使用的方法。这样的方法包括,但不限于,多核苷酸测序、免疫测定、单核苷酸多态性(SNP)检测、特定基因型检测和配体结合。纳代码也可以用于基于纳代码的个人ID(身份)和安全协议中。
【0042】在本发明的某些方面,分子纳代码10对与纳代码10有关并且通过纳代码10鉴别的分子有关的信息进行加密。加密信息可以用于安全目的。可以使用标准或特定加密方法。已加密纳代码可以包括一系列可检测的非编码特征标签,例如可以被加密为编码特征标签。
【0043】在本发明的某些方面,纳代码的独特的结构模式或标签模式被转化到压缩信息中,例如与已标记寡核苷酸的核苷酸序列有关的信息。压缩信息允许数据大小缩减(reduction)。从标准纳代码的压缩产生的纳代码典型地包括一系列可检测的非编码特征标签,其可以被转化到编码标签中。在某些方面,纳代码编码至少2比特、3比特、4比特、5比特或10比特的信息。例如,纳代码可以鉴别特定长度的寡核苷酸,正如此处进一步讨论的。如果例如一系列纳代码的每个纳代码被用于鉴别长度为5个核苷酸的一系列寡核苷酸的核苷酸序列,那么鉴别与目标核苷酸的相邻区域结合的寡核苷酸的一串纳代码提供了5:1的数据缩减。
【0044】任何数学编密码/解密和/或压缩/解压缩算法可以用于与编密码和压缩实施例相关的这些方面。纳代码包括一系列二进制数字(即“0”和“1”)或者其它数字体系,在该体系中每个元素准确地对应于特定计数体系的元素。例如,“大圆圈”,例如相对大的金颗粒,可以代表“0”,“小圆圈”可以代表“1”。所得系列的“0”和“1”被用作二进制数字,这些数在数学上可以被处理和操纵,正如在信息处理系统中那样,包括压缩算法,正如在计算机文件的标准压缩中所使用的(即二进制序列),如“ZIP”文件。
【0045】在本发明的某些方面,可检测的非编码特征标签是起始标签或末端标签。起始标签和/或末端标签可以鉴别纳代码的头部或足部区域。例如,参考图2,每个纳代码可以包括某个大小的金颗粒,如2nm金纳米颗粒(图2中的小圆圈),作为头部标签210或足部标签。如果一系列纳代码中的每个纳代码的长度相同,或者具有相同数量的标签,那么头部标签210或者足部标签可以被鉴别,以便证实纳代码具有该系列纳代码的期望的纳代码特征。这提供了已检测纳代码的性质控制检查,以便从自装配结构中区分出来。
【0046】正如图2b中所示,一系列条形码可以包括标题段220中相同的头部标签210,和编码片段230中的一系列标签。在图2a和2b中所示的实例中,纳米颗粒大小和附着位置(即从相邻纳米颗粒分离)编码信息,如核苷酸碱基序列(头部,C,T,A,G,----)。正如说明所描述的,图2b,例如示意性说明了编码单元,“C=0000”,“T=0100”,和“G=0110”,其中“0”和“1”被用于编码信息,正如上面所公开的。
【0047】在某些方面,纳代码上可鉴别结构的模式,如纳代码10上的标签的模式,被编码为“编码单元”250,这基于多个不同的分子特性。编码单元250是可鉴别结构或鉴别某个结构的一系列标签的模式,典型地是对象的聚合序列,如生物分子,其用纳代码10鉴别并且与其相关(即带条形码的对象)。在本发明的某些方面,纳代码10包括一系列编码单元250。编码单元250的次序和身份可以鉴别带条形码对象。例如参考图2C,编码单元250可以是主要纳代码(即纳代码骨架)20的一部分,附着在没有连接物(图2c(i))或具有连接物(图2c(ii))的主要纳代码上,或者其任何其它组合。进一步,分支2D和3D结构可以被用作标记单元。
【0048】本发明的某些方面的纳代码的编码单元可基于物理的、化学的、光学的、或电特性区分。一方面,AFM(原子力显微镜)被用于鉴别基于形貌特征的编码单元,如编码单元的大小,编码单元之间的距离,或者编码单元的原子力和分子力。AFM也可以被用于鉴别基于编码单元的粘电特性(viscoelectric property)的编码单元,如编码单元的同相(in-phase)或不同相(out-of-phase)硬度或者它们之间的键结。另一方面,CFM(化学力显微镜)或者摩擦力显微镜(LFM)被用于基于化学力鉴别编码单元,这依赖于探针尖端及其样品的化学处理。另一方面,扫描隧道显微镜(STM)被用于鉴别编码单元,基于隧道电流的形貌特性或者电特性,基于导电性或者穿隧电流。仍然在另一方面,FE-STM(铁-扫描隧道显微镜)被用于基于形貌特性(即电子反射或者散射)鉴别纳代码的编码单元。仍然在另一方面,透射电子显微镜(TEM)被用于基于形貌特性(即电子透射)鉴别编码单元。仍然在另一方面,俄歇电子能谱(AES)被用于基于形貌特性(即Auger电子散射)鉴别编码单元。仍然在另一方面,X-射线光电子能谱法(XPS)被用于基于化学组合物或者化学官能作用(即X射线的一级和二级光电散射)鉴别编码单元。仍然在另一方面,飞行时间二次离子质谱(TOF-SIMS)被用于基于元素组成或有机化学组成成分鉴别编码单元。仍然在另一方面,拉曼光谱学(Raman spectroscopy)被用于鉴别编码单元,基于化学特性如分子振动、晶体结构、或者分子方向。仍然另一方面,表面增强拉曼光谱学(Surface enhanced ramanspectroscopy(SERS/SERRS))被用于鉴别编码单元。仍然在另一个例证性的方面,荧光光谱学(fluorescence spectroscopy)如单分子水平荧光光谱学或者荧光共振转移(fluorescence resonance transfer)被用于基于荧光特性鉴别编码单元。
【0049】除了编码信息如已编码对象的身份的编码单元250,编码单元250或者一系列编码单元250可以被用作条形码的起始端或者末端的标志物,特定阅读帧指示器和数据标志物,用于这样的目的如错误校验、纠错、数据压缩、分段和编密码,正如此处针对纳代码标签所进行的进一步的详细讨论那样。编码单元250可以形成编码群,和/或可以编码分类定义。
【0050】在本发明的某些方面,纳代码(nanocodes)包括分子特征标签。分子特征标签是包括在分子条形码上的标签,它们提供有助于鉴别条形码和条形码的数据编码部分上的标签的信息。典型地,特征标签是独特地可鉴别的和可测量的。特征标签,例如可以与条形码上的一组标签不同,该组标签被用于鉴别与条形码相关的对象。作为另一个实例,特征标签的大小可以不同,但在化学上与数据标签(即条形码的数据段中的标签)类似或相同。分子特征标签可以用于此处描述的方法,用于信息的编密码,鉴别阅读帧,鉴别编码单元,错误校验/纠错,和数据缩减/压缩。正如针对标签和编码单元的讨论,特征标签可以被引入、包埋、附着或者与纳代码骨架相关联。特征标签可以被用于指示段落的起始,正如上面所描述的,或者作为周期的“冗余”阅读帧,这可以被用于再次同步化,或者用于鉴别阅读编码信息的任何错误或任何确认。
【0051】例如,正如图4A中所示,分子特征标签包括起始标志物特征标签410,或者末端标志物特征标签420,其分别标记纳代码10的起始端和末端。这些标志物有助于鉴别单一纳代码10,并且可用于鉴别自装配条形码,这些自装配条形码可能导致正确装配的条形码的错误阅读。起始标志物是如上所讨论的标题段的一种类型。
【0052】进一步,正如图4A中所示,通过使用分子特征标签,“阅读帧”可以被整合到纳代码中。这允许基本信息单元的数据捕获的同步,例如用于编码类似于视频帧、网络/通讯数据包、机器字(例如具有2比特循环冗余校验和的64比特数据)以及具有头部或/起始/末端标志物的数据文件。由于生物分子纳代码在不同数据单元/包之间表现出长度、分子键特性等等有所变化,所以将产生每一单元/包的阅读帧引入纳代码中可以显著增加用于扫描的数据读取和同步的速率和准确性。
【0053】阅读帧可以代表连接在一起的单一纳代码10,这些纳代码可以通过头部部分220分离,这些头部部分在这些实施方案中形成阅读帧标志物430。在一些方面,阅读帧标标志物430是非条形码、非分子特征标签,例如独立的化学标志物,分子结构成分/元素。
【0054】正如图4B中所示,分子特征标签可以用于数据压缩。在本发明的该方面,原始纳代码数据440被压缩为压缩的条形码数据450,其包括分子特征标签的模式,这些分子特征标签在数量上较少,或者在空间上比原始纳代码上的标签更紧密。
【0055】分子特征标签中的信息可以使用用于鉴别纳代码或者纳代码上的其它标签的相同方法恢复。也就是,分子特征标签可以基于用于检测其余纳代码的相同分子特性鉴别,甚至在特征标签是与生物分子纳代码上的其它标签不相同分子的实施例中。
【0056】在本发明的某些方面,纳代码包括可检测的特征,以提供差错检测、错误校验,并且加速条形码读取。例如,纳代码可以包括标志纳代码的数据段460的起始和结束的可检测的特征标签(即提供与带条形码对象特异的信息的纳代码部分)。本发明的纳代码也可以包括校验和纳代码段470。校验和纳代码段提供了质量控制校验,以确保已鉴别的条形码是一组或一系列纳代码中的一个成员。根据使用校验和段的实施方案,数据条形码使用单分子水平表面分析方法如扫描探针显微镜(SPM)来检测。此外,检测相关的校验和纳代码。然后检查数据条形码和检测到的校验和纳代码,以确保当产生一系列条形码时,数据条形码与校验和条形码的组合是相互相关的。该信息提供了条形码不是自装配的保证。
【0057】“可鉴别的结构”和“分子特性”是“编码元素”,如“大小/质量”(例如大与小),正如AFM和/或STM测量的;或者是电荷(例如强电荷与弱电荷),如STM测量的。一旦实际的SPM特性被转化为编码单元(即信息),任何标准信息处理方法可以被用于进一步加工信息,例如在用于生物技术应用中的生物信息学中已知的信息处理方法。作为一个实例,四个二进制数字可以编码七个“独立的”不同的编码单元:“0000”,“0001”(=“1000”),“0010”(=“0100”),“1001”,“1010”(=“0101”),“1011”(=“1101”),和“1110”(=“0111”)。如果每一个编码单元的精确起始位置是可以鉴别的,那么一系列编码单元可以代表一系列碱基/核酸:CTAG=“0000 0100 0010 0110”。在实际中,很难鉴别精确的位置来开始读取;在寡核苷酸的情况下,编码四个碱基的2位数字(例如C=00,T=10,A=01,G=11)可以与处于编码单元的起始和末端上的“帧”位置一起使用。例如,如果“0”被用作帧:CTAG=0000 0100 0010 0110。在该实施例中,如果在序列中有两个“0”,那么紧接的两个数字就是一个编码单元,代表C或T或A或G。如果在序列中有四个“0”,那么代表一个帧起始。
【0058】除了有助于鉴别编码单元的起始,阅读帧可以被用于差错检测。例如,作为差错检测的一个例证性实例,两个连续的“0”可以被用于确保在还没有发生的位置上的错误读取。可以基于可获得的算法设计出更精细的差错校正方案。其它组的编码单元可以被用于实施标准校验和或者差错校正代码,正如在相关的可获得的算法中所发现的。校验和可以被用于鉴别任何非编码序列,这可以从不利的化学/物理条件/介质下发生的偶然自发性自装配或者缺失来产生。一组阅读单元被描述为一个“段落”。
【0059】在与确定核苷酸序列相关的本发明的方法中,将至少是部分地欲被测序的核酸,如多核苷酸,与一系列已标记寡核苷酸接触。要被检测、鉴别和/或测序的核酸分子可以通过本技术领域已知的任何技术制备。在本发明的某些实施方案中,核酸是天然发生的DNA或RNA分子。实际上,任何天然发生的核酸可以通过已公开的方法来检测、鉴别和/或测序,包括但不限于染色体DNA、线粒体DNA、叶绿体DNA和核糖体RNA、转运RNA、不均一核RNA和信使RNA。在一些实施方案中,要被分析的核酸是存在于细胞、组织或器官的粗均质物或提取物中。在其它实施方案中,核酸在分析之前可以被部分或完全纯化。在另外的实施方案中,要被分析的核酸分子可以利用在本领域所熟知的化学合成法来制备,或利用本领域已知的多种核酸扩增、复制和/或合成方法来制备。
【0060】本发明的方法分析在某些方面从细胞分离的核酸。纯化各种形式的细胞内核酸的方法是已知的(参见例如,Guide to MolecularCloning Techniques,Berger和Kimmel编著,Academic Press,New York,NY,1987;Molecular Cloning:A Laboratory Manual,2nd Ed.Sambrock,Fritsch和Maniatis编著,Cold Spring Harbor Press,Cold Spring Harbor,NY,1989)。在引用的参考文献中所揭露的方法仅供示范,在本领域已知的任何变化都可加以使用。在单链DNA(ssDNA)要被分析的情况下,ssDNA可以通过任何已知方法由双链DNA(dsDNA)制备。这样的方法可以包括加热dsDNA使链分开,或者可以选择地,包括通过已知的扩增或复制方法从dsDNA制备ssDNA,例如利用克隆进M13中。任何这样的已知方法都可以用来制备ssDNA或ssRNA。
【0061】虽然本发明的某些实施方案涉及天然发生核酸的分析,如多核苷酸,但实际上,任何类型的核酸都可以使用。例如,由各种扩增技术例如聚合酶链式反应(PCR3)扩增制备的核酸都可以被分析。(参见美国专利4,683,195、4,683,202和4,800,159。)替换地,要被分析的核酸可以克隆到标准载体中,例如质粒、粘粒、BAC(细菌人工染色体)或YAC(酵母人工染色体)中。(参见参见Berger和Kimmel,1987;Sambrook等人,1989。)核酸插入物可以与载体DNA分离,例如通过用适当的限制性核酸内切酶进行切割,接着进行琼脂糖凝胶电泳。用来分离核酸插入物的方法在本领域中是已知的。所揭示的方法并没有限制要被分析的核酸的来源,任何类型的核酸,包括原核生物的、细菌的、病毒的、真核生物的、哺乳动物的和/或人的核酸都可以在所要求保护的主题范围之内被分析。
【0062】在本发明的各种实施方案中,单个核酸的多个拷贝可以利用已标记寡核苷酸探针的杂交来分析,如同下文所讨论的。制备单个核酸和形成多个拷贝,例如通过各种扩增和/或复制方法,在本领域是已知的。可以选择地,单个克隆,诸如含有单个核酸插入物的BAC、YAC、质粒、病毒或其它载体,可以被分离、生长,插入物可以被取出并纯化以用于分析。用以克隆和获得纯化的核酸插入物的方法在本领域是熟知的。
【0063】应该了解到,本发明的某些实施方案的范围并不限于核酸的分析,但也包括了其它类型的生物分子的分析,这些生物分子包含但不限于蛋白、脂质及多糖。用以制备和/或纯化各种类型的生物分子的方法在本领域是已知的,任何这样的方法都可以使用。
【0064】在某些方面,已标记寡核苷酸系列是可以在通过杂交反应的测序中使用的一系列寡核苷酸。在通过杂交的测序中,一个或多个包括已知序列的寡核苷酸探针的带标签条形码与目标核酸序列杂交。带标签条形码与目标的结合表明,在目标链中存在互补序列。多个已标记条形码可以与目标分子同时杂交,并且被同时检测。在可以选择的实施方案中,已结合的探针可以被鉴别出附着在单个目标分子上;或者可以选择地,特异性目标分子的多个拷贝可以允许与探针序列的重叠组同时结合。单个分子可以被扫描,例如,使用与检测模式偶合的已知的分子梳技术。(参见例如Bensimon等人,Phys.Rev.Lett.74:4754-57,1995;Michalet等人,Scienece 277:1518-23,1997;美国专利5,002,867;5,840,862;6,054,327;6,225,055;6,248,537;6,265,153;6,303,296和6,344,319)。
【0065】通过此处提供的杂交方法进行的测序包括一个或多个与目标核酸结合的捕获寡核苷酸探针。捕获寡核苷酸探针可以在生物芯片上点样。已结合探针的身份和生物芯片上捕获探针的位置都可以用于确定与目标核酸有关的核苷酸序列信息。
【0066】在某些方面,通过杂交方法进行的测序包括一个任选的连接反应。连接反应通常涉及捕获寡核苷酸探针到已编码寡核苷酸探针的连接,后者与目标核酸的相邻区域结合。在相邻寡核苷酸连接在一起后,去除没有被固定化到底物上的寡核苷酸,例如通过提高温度或者改变反应的pH,以便使核酸变性。没有被固定化到底物上的寡核苷酸可以,或者直接或者间接地,被洗涤掉,并且可以检测已经固定化的已编码寡核苷酸探针,以及任选地检测捕获探针。连接和洗涤步骤增加了反应的特异性。
【0067】相邻的已编码寡核苷酸探针可以使用已知的方法(参见例如美国专利6,013,456)连接在一起。不依赖于引物的连接可以用长度为至少6到8个碱基的寡核苷酸来完成(Kaczorowski和Szybalski,Gene179:189-193,1996;Kotler等人,Proc.Natl.Acad.Sci.USA 90:4241-45,1993)。将与核酸模板杂交的寡核苷酸已编码探针连接起来的方法在本领域中是已知的(美国专利6,013,456)。相邻的寡核苷酸探针的酶促连接可以利用DNA连接酶,例如T4、T7或Taq连接酶或大肠杆菌DNA连接酶。酶促连接的方法是已知的(例如,Sambrook等人,1989)。
【0068】在本发明的各种实施方案中,目标核酸与寡核苷酸型已编码探针文库的杂交可以在只允许完全互补的核酸序列杂交的严紧条件(stringent conditions)下发生。低严紧的杂交通常是在0.15M到0.9M的NaCl和20℃到50℃的温度范围内执行。高严紧杂交通常是在0.02M到0.15M的NaCl和50℃到70℃的温度范围内执行。应了解的是,具有适当的严紧性的温度和/或离子强度是部分地由寡核苷酸探针的长度、目标序列的碱基组成,及在杂交混合物中甲酰胺、四甲基氯化铵或其它溶剂的存在来决定的。上文所提到的范围供示范用,对于特定杂交反应的合适的严紧性通常是利用与阳性和/或阴性对照的比较依经验确定的。本领域普通技术人员能够惯常地调整杂交条件,以允许只有精确互补的核酸序列间的严紧杂交发生。
【0069】给定的目标核酸将与完全覆盖目标序列的连续的探针序列杂交是不可能的。更正确的说,目标的多个拷贝可以与已编码寡核苷酸的库杂交以及从每一个收集部分序列数据。使用公开获得的鸟枪法序列编译程序,部分序列可以编译成完整的目标核酸序列。部分序列也可以从目标分子群编译,其允许与条形码探针的文库同时结合,例如在溶液相中。
【0070】寡核苷酸本身的系列形成本发明的另一个实施方案。寡核苷酸系列在此处也被称作“已编码寡核苷酸文库”。寡核苷酸系列通常是杂交探针,它们包括一个已知的核苷酸序列部分,也被称作探针部分,用于通过杂交进行的测序,和用于随后已编码信息的读取和解码的纳代码部分。
【0071】核苷酸序列部分和相关的纳代码部分的长度可以改变,这基于用于子序列分析的特定需求。在某些方面,这些系列包括具有核苷酸序列的寡核苷酸,对应于小于或者等于寡核苷酸的长度的每一种可能的排列。寡核苷酸部分和相关的条形码部分的长度可以变化,这基于用于检测的特定需求。例如,已标记寡核苷酸的寡核苷酸部分,在某些方面,长度等于或者少于250个核苷酸,200个核苷酸,100个核苷酸,50个核苷酸,25个核苷酸,20个核苷酸,15个核苷酸,10个核苷酸,9个核苷酸,8个核苷酸,7个核苷酸,6个核苷酸,5个核苷酸,4个核苷酸或者3个核苷酸。例如,但不限于,寡核苷酸的长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、200或者250个核苷酸。
【0072】已标记寡核苷酸的系列,在某些方面,包括至少10、20、30、40、50、100、200、250、500、1000个寡核苷酸。例如,这些系列可以基本上包括全部,或者包括相同长度的寡核苷酸的的所有可能的核苷酸序列组合,正如对至少一些通过杂交反应进行的测序所已知的那样(参见美国专利5,002,867)。对于给定长度的基本上的所有可能的核苷酸序列组合,包括足够多的可能的核苷酸序列,以便允许使用通过杂交进行的测序进行的序列解码。
【0073】在某些方面,具有相同探针部分的已标记寡核苷酸系列中的所有寡核苷酸包括相同的独特纳代码。在其它方面,不止一个具有不同探针部分的寡核苷酸附着在相同的纳代码上,以便一组特定序列模式可以通过扫描和解码较快地被鉴别。
【0074】在本发明的某些实施方案中,已编码探针,如已标记寡核苷酸,可以在仍然附着在目标分子上时被检测。如果短寡核苷酸探针与目标核酸之间的结合作用的强度相对较弱,那么此类方法可能更为适当,例如在通过使用交联剂将已编码探针已经共价附着于目标分子的情形中。
【0075】在本发明的各种实施方案中,寡核苷酸类型的已编码探针可以是DNA、RNA或其任何类似物,例如肽核酸(PNA),它们可以被用来鉴别核酸中的特定互补序列。在本发明的某些实施方案中,一个或多个已编码探针文库可以被制备,用于与一种或多种核酸分子杂交。例如,可以使用这样的一套已编码探针,其含有所有4096种或大约2000种非互补六聚体,或所有16384或大约8000种非互补七聚体。如果非互补的寡核苷酸已编码探针的亚组被使用,那么可以进行多个的杂交和序列分析,这些分析的结果可以通过计算方法合并为一个单数据集。例如,如果只包含非互补六聚体的文库被用于杂交和序列分析,那么使用相同目标核酸分子杂交到由第一文库排除的那些已编码探针序列上的第二次杂交和分析可以被执行。
【0076】在本发明的某些方面,已编码探针文库可以包含这样的已编码探针,其中间是随机核酸序列,附着到位于一端或两端的固定不变的核酸序列上。例如,12聚体的已编码探针的一个亚组可以由一组完整的随机八聚体序列组成,其每一端附着到恒定的二聚体上。这些已编码探针文库可以根据它们固定不变的部份被再划分,并独立地与核酸杂交,然后使用各个不同的已编码探针文库的组合数据进行分析,以确定所述核酸的序列。熟练的技术人员会意识到,所需要的亚文库的数目是连接到随机序列上的恒定碱基的数目的函数。另一种实施方案可以应用使用单个已编码探针文库的多重杂交和分析,所述单个已编码探针文库含有连接于随机寡核苷酸序列上的特定恒定部份。对于核酸上任何给定的位点,可能的是:序列不同但是有重叠的多个已编码寡核苷酸探针能够以稍微有偏移的方式结合到该位点上。因此,应用使用单个文库的多重杂交和分析,该核酸的完整序列可以通过编辑所述的重叠、偏移的已编码探针序列而获得。
【0077】在本发明的涉及寡核苷酸文库的方面,寡核苷酸可以利用任何已知方法来制备,例如利用Applied Biosystems 381A DNA合成仪(Foster City,CA)或类似设备来合成。可以选择地,寡核苷酸可以从多个供货商(例如Proligo,Boulder,CO;Midland Certified Reagents,Midland,TX)处买到。在寡核苷酸化学合成的实施方案中,纳代码可以共价地连接于用于合成的一种或多种核苷酸前体上。可选择地,纳代码可以是在寡核苷酸探针已经合成之后才附加上。在其它的替代性选择中,纳代码可以在寡核苷酸合成的同时被附加上。
【0078】在本发明的某些方面,已编码探针可以包括肽核酸(PNA)。PNA是DNA类似物的聚酰胺型,其具有腺嘌呤、鸟嘌呤、胸腺嘧啶和胞嘧啶的单体单元。PNA已经商业化,可以从诸如PE Biosystem(Foster City,CA)的公司获得。可选择地,可以在存在叔胺,N,N-二异丙基乙胺(DIEA)的条件下,使用O-(7-偶氮苯并三唑-1-基)-1,1,3,3-四甲基脲六氟磷酸酯(HATU)来活化和偶联9-芴甲氧羰基(Fmoc)单体,从而实施PNA的合成。PNA能够利用反相高效液相色谱(RP-HPLC)来纯化,可利用基质辅助激光解吸附飞行时间(MALDI-TOF)质谱分析来证实。
【0079】在某些实施方案中,提供了探针分子文库,其中每一个不同的探针附着在可分辨的纳代码上。探针不限于寡核苷酸探针。在一个给定的文库中,对于已编码寡核苷酸文库,有可能某一特定探针分子存在多于一个的拷贝。在这种情况下,相同探针的每个拷贝将附着于相同的纳代码上。所使用的探针和纳代码的类型并没有限制,任何已知类型的探针分子都可以使用,包含但不限于寡核苷酸、核酸、抗体、抗体片段、结合蛋白、受体蛋白、肽、凝集素、底物、抑制物、激活物、配体、激素、细胞因子,等等。而且,任何类型的可分辨的纳代码都可被使用。
【0080】在本发明的某些方面,已标记寡核苷酸系列包括被排列以提供差错校验的标签模式,正如此处进一步详细讨论的。在本发明的某些方面,标记物的独特模式形成与已标记寡核苷酸的核苷酸序列有关的压缩信息。在本发明的某些方面,已标记寡核苷酸的系列包括一个普通的起始标签,以提供质量控制,正如此处进一步详细讨论的。在本发明的某些方面,寡核苷酸系列包括标签的一个模式,其对已标记寡核苷酸的核苷酸序列有关的信息进行加密。
【0081】在多核苷酸与已标记寡核苷酸系列接触之后,分离与多核苷酸结合(即杂交)的已标记寡核苷酸。这特别地涉及使用已知技术从未杂交的寡核苷酸杂交分离。分离可以使用物理的、化学的、电的、或本技术领域已知的任何其它方法进行。例如,可以使用已知方法,将未杂交的已标记寡核苷酸(即已编码的寡核苷酸探针)与同目标分子杂交的已编码探针分离,如高效液相层析(HPLC)、凝胶渗透层析、凝胶电泳法、超滤和/或羟磷灰石层析。
【0082】分离的已标记寡核苷酸,或者已经从分离的已标记寡核苷酸剥离下来的标签,然后在扫描探针显微镜术(SPM)基片的表面上沉积。也就是,完全探针分子可以沉积在表面上;或者已经杂交的探针可以被分离/分开;纳代码部分被剥离掉,以便在不存在探针分子的情况下单独读取和解码。例如,多核苷酸可以在检测与分离的已标记寡核苷酸相关的纳代码之前,从分离的已标记寡核苷酸上被分离下来。
【0083】例如,纳代码可以在微量级(或更小级)的分析系统中被捕获,以干态或者湿态用于SPM分析,或者用于涉及这样的分析的实施方案中的单分子水平表面分析。如果必要,适当的固定化和分散技术可以被用于改进SPM分析。例如,在SPM分析中,基片表面处理如硫醇-金、多聚赖氨酸(polylysine)、硅烷化/AP-云母,以及Mg2+和/或Ni2+(例如参见Proc.Natl.Acad.Sci.USA 94:496-501(1997);Biochemistry 36:461(1997);Analytical Sci.17:583(2001);BiophysicalJournal 77:568(1999);和Chem.Rev.96:1533(1996))可以被用于均匀地分散和固定化已标记多核苷酸。适当的分散允许进行单分子水平分析,用于读取和解码信息。
【0084】在本发明的各种实施方案中,纳代码编码探针和/或结合到已编码探针上的目标分子可以被附着到表面上并被排列以便分析。在一些实施方案中,已编码探针可以排列于表面上,被整合进的纳代码可以被探测,如本文所述。在替代性实施方案中,纳代码可以与排列于表面上的探针分子分离,并被检测。在某些实施方案中,结合到个别目标分子上的已编码探针的顺序可以被保留和检测,例如利用扫描探针显微镜术。在其它实施方案中,目标分子的多个拷贝可以存在于一个样品中,可以通过将结合所述多个拷贝的已编码探针的所有序列装配成重叠的目标分子序列,来确定目标分子的身份和/或序列。用来例如将重叠的部分核酸或蛋白序列装配成连续序列的方法在本领域是已知的。在各种实施方案中,纳米条形码可以是在它们附着于探针分子时被检测,或者替代性地,可以是在检测之前就已与探针分子分离。
【0085】将分子例如核酸、寡核苷酸探针和/或纳代码附着到表面、并使之进行排列比对的方法及装置,在本领域是已知的(参见例如Bensimon等人,Phys.Rev.Lett.74:4754-57,1995;Michalet等人,Science277:1518-23,1997;美国专利5,840,862;6,054,327;6,225,055;6,248,537;6,265,153;6,303,296和6,344,319);也参见美国专利申请10/251,152,是于2002年9月20日提交的、题目为“Controlled Alignment ofNanocodes Encoding;Specific Information for Scanning ProbeMicroscopy(SPM)”)。纳米条形码、已编码探针和/或目标分子可以利用使用空气-水的弯月面或其它类型的界面所固有的物理作用力而附着于表面并且被排列。这一技术通常称为分子梳。溶解在含水介质中的纳代码和/或目标分子可以是一端或者两端附着于表面,例如硅烷化玻璃片、生物素化(biotinylated)表面、镀金表面或任何其它的本领域已知的能够结合这样的分子的表面。该表面可以缓慢地从含水介质中拉出(例如图1)。极性或带电荷的目标分子、纳代码和/或已编码探针分子会优选分配到亲水性(含水)介质中。因此,当表面从该含水介质移出时,可造成结合的目标分子、纳代码和/或已编码探针的伸展,其方向平行于弯月面的移动方向。在所述的伸展分子的测量长度与其实际大小之间存在着直接的关联性,1微米的伸展长度对应于大约2,000个碱基的核酸序列(Herrick等人,Proc.Natl.Acad.Sci.U.S.A.97:222-227,2000)。
【0086】一旦所述表面已经全部从含水介质中移出,附着的纳代码和/或已编码探针就以平行方式对齐,该方式可以更容易和精确地分析。在本发明的某些具体实施方式中,已编码探针的两端都附着到表面上,被对齐的已编码探针将会被对齐呈现出U形形态,该形态也更容易分析。该技术并不受限于要被对齐的目标分子、纳代码和/或已编码探针的大小,它可以对长至整个染色体的核酸起作用(例如,Michalet等人,1997;Herrick等人,2000)。在弯月面以适当的速率移动时,所产生的剪切力是相当小的,这样,被对齐的DNA片段可以是数百的千碱基或更长(Michalet等人,1997)。
【0087】分子与处理表面的强烈的非特异性吸附作用会抑制分子梳作用(Bensimon等人,1995)。因此,在本发明的各种实施方案中,表面被处理,使得目标分子或已编码探针的仅仅一端或更多端会结合到表面上。将核酸及其它类型的已编码探针结合到表面上的方法在本领域为人所熟知,总结于下文中。在非限制性的例子中,目标分子、纳代码或已编码探针可以在所述分子的一端或两端用生物素残基共价修饰。当暴露于包被抗生物素蛋白或链霉抗生物素蛋白(streptavidin)的表面时,就只有生物素标记的末端会结合到该表面上。与表面的非特异性吸附可以通过使用本质上是疏水性的表面予以降低,例如硅烷化表面。
【0088】本发明的实施方案并不受限于可以使用的表面的类型。表面的非限制性的例子包含玻璃、功能化玻璃、陶瓷、塑料、聚苯乙烯、聚丙烯、聚乙烯、聚碳酸酯、PTFE(聚四氟乙烯)、PVP(聚乙烯吡咯烷酮)、锗、硅、石英、砷化镓、金、银、尼龙、硝酸纤维素或任何其它在本领域已知的能够让目标分子、纳代码和/或已编码探针附着到表面上的材料。附着可以是共价的或非共价的作用。尽管在本发明的某些实施方案中,表面可以是载玻片或盖玻片的形式,但表面的形状并没有限制,表面可以是任何形状。在本发明的某些实施方案中,表面是平面的。
【0089】应该预期到,在所要求保护的主题范围内,可以使用任何已知的对齐方法。在本发明的某些实施方案中,当溶解在含水介质中的目标分子、纳代码或已编码探针被通过移动的弯月面拉动时,发生对齐现象。弯月面移动的机理不重要,是可以通过如下方式实现的,例如通过将表面浸入缓冲溶液中并且慢慢地从溶液中拉出表面来实现。可以替换地,表面可以被浸入到溶液中,可以通过蒸发或者通过去除液体慢慢地降低弯月面的水平。
【0090】在本发明的另一个可选择的方面,一滴溶液被放置在盖玻片和表面例如载玻片之间。表面可以被慢慢地抽离该盖玻片。由于溶液粘附在盖玻片上,这导致在盖玻片与表面接触的边缘上形成了空气-水界面。移动该界面,从而在表面上对齐目标分子、纳代码和/或已编码探针。用于对齐纳代码和/或已编码探针的另一个替换性方法,涉及使用自由流动电泳,或者替换分子梳或者在分子梳过程中使用。
【0091】在已标记寡核苷酸或者剥离的标签沉积之后,沉积的条形码通过使用SPM检测标签的模式来鉴别。这通过使用SPM扫描表面来实现。这允许信息恢复和解码。然后,分离的已标记寡核苷酸的核苷酸序列,被基于已鉴别的沉积纳代码解码。数据,通常是以扫描图像的形式,被分析,并且通过标准或定制/专门化的图像处理或数据信号处理技术和软件进行处理,如SPM制造商提供的软件或任何可获得的其它图像/信号处理软件。所读取到(以及解码)的信息可以储存在分离的数据存储系统中,或者传送到计算机系统中,用于进一步的数据处理。
【0092】用于使用杂交寡核苷酸的鉴别对序列信息进行解码的方法,在本技术领域是已知的。例如,此处所包括的、与通过杂交进行的测序相关的参考文献,提供了详细的方法,用于对多核苷酸序列信息进行解码,是基于通过杂交结果的测序进行。从多个纳代码读数所收集的数据,被用于确定多核苷酸序列。生物信息学公司和政府机构提供了所需的工具、服务和用于数据处理以确定DNA序列的其它相关工具。例如,有大量的UNIX软件包,可以用于Sun SPARCstation和Linux簇,两者都是公开领域的和商业化的软件。实例为:ESTSC(EnergyScience & Technology Software Center)的“SCORE”,和“Software forDNA sequencing by hybridization”Bioinformatics 113:205(1997),或者computer applicantion in Biosciences 13:205(1997)。
【0093】在用于确定多核苷酸的核苷酸序列的本发明某些方面,可以用扫描探针显微镜术(SPM)来检测纳代码。SPM检测,或者在干态或者在湿态进行。例如,干燥的条形码可以通过AFM或者STM读取。湿的条形码(即未干燥的)可以通过射流AFM或者射流STM读取。也就是,检测可以通过分析和处理扫描的SPM图像来进行。所读取和解码的信息可以储存在一个分离的数据存储系统中,或者传送到计算机系统中,用于进一步的数据处理。
【0094】扫描探针显微镜术的实例包括扫描穿隧显微镜术(STM)、原子力显微镜术(AFM)、扫描电容显微镜术和扫描光学显微镜术,以及此处讨论的其它方法。
【0095】用于确定多核苷酸序列的本发明所述方法的优点之一是:使用具有分子纳米级条形码的SPM,可以使用浓度比传统测序方法低的多的将被测序的多核苷酸进行。因此,多核苷酸扩增的要求被最小化,或者在某些方面被免除。因此,要求比其它检测技术较少的已标记寡核苷酸的拷贝用于检测。在一些方面,10,000或者更少、5,000或者更少、2,500或者更少、1,000或者更少、500或者更少、250或者更少、100或者更少、50或者更少、25或者更少、10或者更少、5或者更少、4或者更少、3或者更少、2或者更少、或者1个已标记寡核苷酸被检测。典型地,对于每一个已标记寡核苷酸,有一个标签模式。
【0096】在某些实施方案中,在一个多核苷酸分子上检测多于一个的生物分子纳代码。例如,在通过杂交反应进行的测序中,一个以上的已标记寡核苷酸可以与将被测序的多核苷酸结合。具有已结合的已标记寡核苷酸的多核苷酸可以在SPM基片上沉积,已结合的已标记寡核苷酸可以被检测。在本发明的某些方面,确定多于一个的生物分子纳代码的次序,用于对与目标多核苷酸有关的核苷酸序列信息进行解码(即至少被部分地测序的多核苷酸)。多于一个纳代码的次序的检测增加了多核苷酸序列被解码的速度。
【0097】在某些方面,确定核苷酸序列的方法进一步包括任选的连接反应,其中生物分子条形码在一个多核苷酸分子上被检测。连接反应涉及与多核苷酸的相邻区域发生结合的寡核苷酸,可以通过SPM在它们的相邻排列中检测。换句话说,在本发明的该方面,线性系列的已编码寡核苷酸探针被连接在一起。连接在一起的分子中的每一个已编码寡核苷酸探针可以附着在可分辨的纳代码上,以允许对其进行鉴别。由于连接在一起的分子中的已编码寡核苷酸探针的序列也可以被确定,所以可以鉴别整个连接分子的序列。
【0098】相邻的已编码寡核苷酸探针可以使用已知的方法(参见例如美国专利6,013,456)连接在一起。短至6到8个碱基的寡核苷酸序列可以有效地与目标核酸杂交(美国专利6,013,456)。不依赖于引物的连接,可以用长度为至少6到8个碱基的寡核苷酸来完成(Kaczorowski和Szybalski,Gene 179:189-193,1996;Kotler等人,Proc.Natl.Acad.Sci.USA 90:4241-45,1993)。将与核酸模板杂交的寡核苷酸已编码探针连接起来的方法,在本领域中是已知的(美国专利6,013,456)。相邻的寡核苷酸已编码探针的酶促连接,可以利用DNA连接酶,例如T4、T7或Taq连接酶或大肠杆菌DNA连接酶。酶促连接的方法是已知的(例如,Sambrook等人,1989)。
【0099】本发明的方法使用了纳代码,这些纳代码本身形成本发明的实施方案。纳代码实际上可以是任何长度,但在所有尺寸中,典型地是0.5nm-1Tm,在某些实施例中在所有尺寸中是1nm-500nm。例如,纳代码的长度通常在1nm-500nm之间。进一步,纳代码通常可溶于含水相和有机相中(两性的)。在某些方面,自装配的条形码是粘弹性的、形成网络和/或是导电的。
【0100】本发明的分子条形码通常是分子纳代码。在某些方面,分子纳代码包括一个骨架和一系列标签,这些标签鉴别与纳代码有关的对象。每一个纳代码独特地鉴别与其相关的特定生物分子,如核苷酸。基于纳代码骨架本身或者空间关系的结构,和/或纳代码上标签的身份(即标签的模式),条形码是可分辨的。正如在下面更详细讨论的,标签包括,但不限于,导电的、发光的、荧光的、化学发光的、生物发光的、拉曼活性(例如SERS或SERRS活性)、和磷光组分、量子点、纳米颗粒、金属纳米颗粒、金纳米颗粒、银纳米颗粒、色原、抗体、抗体片段、遗传工程抗体、酶、磁性颗粒和自旋标记化合物。(美国专利3,817,837;3,850,752;3,939,350;3,996,345;4,277,437;4,275,149;和4,366,241)。一方面,标签包括寡核苷酸或者多核苷酸。
【0101】在某些方面,纳代码,正如下面更详细讨论的,是核苷酸、肽、富勒烯、金属纳米颗粒、有机金属化合物、荧光分子、高能量磷酸盐化合物和/或碳纳米管。在某些方面,纳代码不只是碳纳米管。
【0102】基于一个或多个物理的、化学的、光学的和/或电学的特性,纳代码可以分辨。在使用纳代码对物体有关的信息进行编码的实施方案中,通常使用单分子水平表面分析技术检测纳代码,正如此处更详细讨论的。在与多核苷酸测序和SNP检测相关的实施方案中,纳代码通常使用表面探针显微镜术检测,正如此处更详细讨论的。
【0103】在本发明的某些方面的纳代码是生物分子纳代码。生物分子纳代码包括生物分子,其作为纳代码的至少一部分。生物分子条形码可以包括化学化合物。例如,生物分子可以包括多肽、多核苷酸和/或多糖。
【0104】本发明的某些方面和实施方案包括或使用一系列纳代码,如生物分子纳代码。例如,在本发明的某些实施方案中,一系列物体可以使用一系列分子纳代码编码。纳代码系列包括至少两个,例如3、4、5、10、15、20、25、50、100、250、500、1000、2500、5000、10,000、25,000或100,000个纳代码,这些纳代码在结构上是相关的。在本发明的某些方面,例如,那些针对使用通过杂交进行的测序的方法,纳代码系列与一系列寡核苷酸相关,其中具有独特序列的每一个核苷酸通过独特纳代码鉴别。在本发明的某些方面,分子纳代码系列包括相同的大分子支架(macromolecular scaffold)。例如,所有纳代码可以包括用标签修饰的肽骨架,如C(60)标签,正如此处的实施例中所示意性说明的。在另一个实施方案中,正如图2中所示,纳代码10系列可以包括核酸骨架20,其中纳米标签30,或者一系列可检测出不同的纳米标记物30,它们沿着纳代码的骨架10、以已知距离彼此结合在一起。标签可以是,例如,金属球体,如金球体。例如,金纳米颗粒的长度可以在大约1nm到1000nm之间。
【0105】在本发明的某些方面,纳代码在检测之前被修饰。在一个实施方案中,被检测的纳代码是修饰的纳米管,例如,正如美国专利申请公开(2003/0148289)中所公开的。
【0106】本发明的几个实施方案都基于该发现,即单分子水平表面分析方法可以被用于鉴别生物分子纳代码,以便对有关物体的信息进行编码。因此,在另一个实施方案中,提供了用于编码和解码与物体有关的信息的方法,该方法包括提供在某些方面包括一个生物分子支架和标签模式的纳代码。生物分子纳代码与物体相关,这样与物体相关的信息在生物分子纳代码上被编码。纳代码使用单分子水平表面分析方法检测。然后,通过生物分子纳代码编码的信息被基于标签的检测进行解码,从而编码和解码与物体有关的信息。
【0107】在该实施方案的某些方面,纳代码包括可检测的特征,这些特征提供数据加密、压缩、或阅读帧,正如此处所讨论的。进一步,可检测的特征在某些方面,对纳代码提供了标题段和编码段,并且可以标志条形码的起始或末端。在某些方面,可检测特征通过与纳代码有关联的可检测特征标签提供。
【0108】在本发明的该方面的方法中使用的纳代码,通常是生物分子纳代码,正如此处详细讨论的。本发明的该方面的方法,可以在多个生物技术和保健应用中使用。本发明的条形码可以用于许多不同的方法中,例如在生物技术和/或保健中使用的方法,包括DNA测序、免疫测定、单核苷酸多态性(SNP)检测、特异基因型检测和配体结合。纳代码也用于基于纳代码的个人ID和安全协议。
【0109】根据本发明的该实施方案,使用单分子水平表面分析技术读取纳代码。单分子水平表面分析技术,检测单分子或少量分子的技术,包括,例如扫描隧道显微镜术(STM)、扫描光学显微镜术、扫描电容显微镜术、原子力显微镜术(AFM)、化学力显微镜术(CFM)、侧力显微镜术(LFM)、场致发射扫描电子显微镜术(FE-SEM)、透射电子显微镜术(TEM)、扫描TEM、俄歇电子光谱法(AES)、X射线光电子光谱法(XPS)、飞行时间次级离子质谱法(TOF-SIMS)、振动质谱法、拉曼质谱法或者荧光质谱法。
【0110】典型地,纳代码可基于物理的、化学的、光学的、或电学的特性分辨,正如此处所讨论的。一方面,单分子水平表面分析技术是AFM,条形码可基于形貌特性或者粘电特性分辨。另一方面,单分子水平表面分析技术是CFM或者LFM,条形码可基于化学力分辨。另一方面,单分子水平表面分析是STM,条形码可基于形貌特性或电学特性分辨。仍然在另一方面,单分子水平表面分析技术是FE-SEM,条形码可基于形貌特性分辨。仍然在另一方面,单分子水平表面分析技术是TEM,条形码可基于形貌特性分辨。仍然在另一方面,单分子水平表面分析技术是AES,条形码可基于形貌特性分辨。仍然在另一方面,单分子水平表面分析技术是XPS,条形码可基于化学组成或者化学官能化分辨。仍然在另一方面,单分子水平表面分析技术是TOF-SIMS,条形码可基于化学组成分辨。仍然在另一方面,单分子水平表面分析技术是拉曼光谱法,条形码可基于化学特性分辨。仍然在另一方面,单分子水平表面分析技术是荧光光谱法,条形码可基于荧光特性分辨。
【0111】在本发明的方法的某些方面,纳代码上的标签包括拉曼标签。进一步,这些标签包括复合的有机-无机纳米颗粒(参见美国序列号_,于2003年9月29提交,题目为“复合有机-无机纳米颗粒(CompositeOrganic-Inorganic Nanoparticles)”)(此处被称作COIN纳米颗粒或者“COINs”)。COINs是拉曼-活性探针构建物,其包括核心和表面,其中核心包括一种金属胶体,该金属胶体具有第一金属和拉曼-活性有机化合物。COINs可以进一步包括与第一金属不同的第二种金属,其中第二金属形成覆盖在纳米颗粒表面上的层。COINs可以进一步包括覆盖金属层的有机层,该有机层包括探针。用于附着在用于该实施方案的SERS-活性纳米颗粒上的合适的探针包括,但不限于,抗体、抗原、多核苷酸、寡核苷酸、受体、配体及类似物。然而,对于这些实施方案,COINs典型地附着在寡核苷酸探针上。
【0112】获得合适的SERS信号的金属是COIN中固有的,大量的拉曼-活性有机化合物可以被整合到颗粒中。实际上,大量独特的拉曼信号可以通过使用含有不同结构、混合物和比率的拉曼-活性有机化合物的纳米颗粒而产生。因此,此处描述的使用COINs的方法可用于从多于一个,典型地多于10个目标核酸中同时测定核苷酸序列信息。此外,由于许多COINs可以被整合到单一纳米颗粒中,来自单一COIN颗粒的SERS信号,相对于从不含有此处描述的纳米颗粒的拉曼-活性材料获得的SERS信号,是更强一些的。与不使用COINs的拉曼-技术相比,这种情况导致增加的敏感性。
【0113】COINs可以容易地制备,用于在使用标准金属胶体化学的本发明方法中使用。COINs的制备也利用了金属吸附有机化合物的能力。实际上,由于在形成金属胶体的过程中,拉曼-活性有机化合物被吸附在金属上,许多拉曼-活性有机化合物被整合进COIN中,不需要特别的附着化学。
【0114】通常,在本发明的方法中使用的COINs是如下制备的。制备含有合适的金属阳离子、还原剂和至少一种合适的拉曼-活性有机化合物的含水溶液。然后使溶液的组分经受这样的条件,即还原金属阳离子形成中性的胶体金属颗粒。由于在存在合适的拉曼-活性有机化合物的情况下形成金属胶体,所以在胶体形成的过程中拉曼-活性有机化合物容易吸附到金属上。该简单类型的COIN被称作类型I COIN。类型I COIN典型地通过膜过滤分离。此外,不同大小的COINs通过离心富集。
【0115】在替代性实施方案中,COINs包括与第一金属不同的第二金属,其中第二金属形成覆盖在纳米颗粒表面上的层。为了制备该类型的SERS-活性纳米颗粒,将类型I COINs放置在含有合适的第二金属阳离子和还原剂的水溶液中。然后使该溶液的组分经受如下情况,即还原第二金属阳离子,以便形成覆盖在纳米颗粒表面上的金属层。在某些实施方案中,第二金属层包括金属,诸如,例如银、金、铂、铝及类似物。该类型的COIN被称作类型II COINs。类型II COINs可以分离,或者用与类型I COINs相同的方式富集。典型地,类型I和类型II COINSs基本上是球体的,大小范围在大约20nm到60nm(纳米)之间。相对于在检测过程中用于照射COINs的光的波长,所选择的纳米颗粒的大小是非常小的。
【0116】典型地,有机化合物,如寡核苷酸,通过有机化合物共价附着在金属层的表面,附着在类型II COINs中的第二金属层上。有机层共价附着在金属层可以以本技术领域的技术人员熟知的多种方式实现,如例如通过硫醇-金属键合。在可以选择的实施方案中,附着在金属层上的有机分子可以交联在一起,形成分子网络。
【0117】本发明的方法中使用的COIN(s)可以包括含有磁性材料的核心,例如氧化铁及类似物。磁性COINs可以使用可一般获得的磁性颗粒处理系统处理,不需要离心。实际上,磁力可以被用作一种机理,用于分离附着在用颗粒状生物探针加上标签的磁性COIN颗粒上的生物目标。
【0118】正如此处所表明的,本发明的方法的一个优点是,它们允许检测较少的分子,诸如,例如,本发明实施方案中的物理对象。例如,本发明的该方面的方法可以检测10000或更少,1000或更少,500个或更少,250个或更少,100个或更少,50个或更少,25个或更少,20个或更少,15个或更少,10个或更少,9个或更少,8个或更少,7个或更少,6个或更少,5个或更少,4个或更少,3个或更少,2个或更少,或者1个纳代码和/或物理对象。
【0119】在该实施方案的某些方面,在通过SPM检测之前,生物分子纳代码在扫描探针显微镜术(SPM)基片上沉积,正如上面对于与多核苷酸测序相关的实施方案所描述的。在本发明的某些方面,编码和解码是使用针对系列物理对象的系列分子纳代码进行。在某些方面,在标签模式被检测之前,生物分子纳代码被从物理对象上分离。
【0120】物理对象可以是实际上任何物体。在本发明的某些方面,物理对象是多核苷酸、多肽或者多糖。在物理对象是多核苷酸的方面,生物分子,例如,提供了与多核苷酸的核苷酸序列有关的信息。在物理对象是多肽的方面,生物分子纳代码,例如,提供了与多肽的氨基酸序列有关的信息。在物理对象是多糖的方面,生物分子纳代码,例如,提供了与多糖的单糖亚单元的鉴别有关的信息。
【0121】在某些方面,与条形码相关的物理对象是适配子(aptamer)。适配子是通过称作SELEX的体外进化过程得到的寡核苷酸(例如Brody and Gold,Molecular Biotechnology 74:5-13,2000)。SELEX过程涉及将潜在的适配子(核酸配体)暴露给目标的重复循环,允许结合发生,从游离核酸配体结合状态的分离,扩增结合的配体以及重复结合过程。在大量循环后,可以制备对实际上任何类型的生物目标表现出高亲和性和特异性的适配子(aptamer)。由于它们的小尺寸,相对稳定性和易于制备,适配子非常适合用作探针。由于适配子包括寡核苷酸,所以它们可以容易地被整合到核酸型条形码中。产生适配子的方法是熟知的(例如美国专利5,270,163;5,567,588;5,670,637;5,696,637;5,696,249;5,843,653)。可以选择地,针对特定目标的多种适配子可以从商业来源获得(例如Somalogic,Boulder,CO)。适配子是相对小的分子,其量级为7到50kDa。
【0122】在某些实施方案中,与条形码相关的物理对象是抗体。抗体的制备方法在本技术领域也是熟知的(例如Harlow and Lane,Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,ColdSpring Harbor,New York,1988。)合适用作探针的单克隆抗体也可以从大量商业来源得到。针对大量目标的这样的商业化抗体可以获得。抗体探针可以使用标准化学方法结合到条形码上。
【0123】所公开的方法和组合物不限于所用探针的类型,本技术领域已知的任何类型的探针组分可以附着在条形码上,在所公开的方法中使用。这样的探针可以包括,但不限于,抗体片段、亲和体(affibodies)、嵌合抗体、单链抗体、配体、结合蛋白、受体、抑制剂、底物。
【0124】在相关的实施方案中,提供了鉴别目标分子的方法,该方法包括用一个已标记探针或已标记探针系列接触目标分子,其中目标分子和探针是特异性结合对,其中每一个已标记探针包括含有标签模式的分子纳代码。已标记探针与目标分子的结合使用扫描探针显微镜术(SPM)检测,以检测已检测探针的分子纳代码。分子纳代码的鉴别可以鉴别结合目标分子的已标记探针。在该实施方案的某些方面,分子纳代码包括可检测的特征标签或者其它结构,以提供编加密、差错校验、标题、起始标签、压缩数据,等等,正如本文所讨论的。进一步,已标记探针系列可以是已编码寡核苷酸探针的文库,正如本文所讨论的。
【0125】在某些方面,目标分子是蛋白质。在这些方面,探针可以是,例如,抗体。在另一个方面,探针是配体。在该方面,目标分子是,例如多核苷酸。在另一个方面,目标分子是多核苷酸。在该方面,探针是,例如,结合目标分子的多核苷酸。
【0126】该方法可用于检测一种或多种不同的目标分子。例如,该方法可以用于检测2个或更多(即一群目标分子),3个或更多,4个或更多,5个或更多,10个或更多,25个或更多,50个或更多,100个或更多,250个或更多,500个或更多,或者100或者更多个不同的目标分子。
【0127】单纳代码分子中的分子签名可以基于物理的、化学的、光学的、电学的和其它分子特征完成/编码,通过此处讨论的分析方法捕获并且分析,以便从纳代码恢复信息。
【0128】正如此处所讨论的,每个已编码探针可以整合有至少一个共价或非共价联结的纳代码。纳代码可以用来检测和/或鉴别个体的已编码探针。在本发明的某些实施方案中,每个已编码探针可以具有两个或更多个附着的纳代码,它们的组合对于特定的已编码探针是独特的。纳代码的组合可以用来扩展可分辨的纳代码的数目,这些纳代码在特异地鉴别文库中的已编码探针时是可利用的。在本发明的其它实施方案中,每个已编码探针可以具有所附着的单个独特的纳代码。这里唯一的要求就是由每个已编码探针检测到的信号必须能够将已编码探针从不同的已编码探针中可区分地鉴别出来。
【0129】在本发明的某些实施方案中,纳代码可以在合成已编码探针之前整合到前体中。对于基于寡核苷酸的已编码探针,为了在腺嘌呤(A)和鸟嘌呤(G)位置处进行共价连接而进行的内部氨基修饰是可以考虑的。内部连接(internal attachment)也可以使用商业上可获得的亚磷酰胺在胸腺嘧啶(T)位置处实施。在一些实施方案中,在A和G位置处具有丙胺连接子(linker)的文库片段可以用来将纳代码连接到已编码探针上。内部氨烷基尾端的导入使纳代码的合成后附着成为可能。连接子可以从供货商处购得,例如Synthetic Genetics(San Diego,CA)。在本发明的一个实施方案中,使用适当的亚磷酰胺衍生物进行纳代码的自动偶联也被考虑到。这样的纳代码可以在寡核苷酸合成期间被偶联到其5′-端。
【0130】通常,纳代码将以能够使所述纳代码的空间位阻最小化的方式共价附着于探针上,以便已编码探针结合到目标分子,例如杂交到核酸上。可以使用连接子,这样可以为已编码探针提供一定程度的柔性。同质-或异质-双功能连接子可以从各种商业来源获得。
【0131】寡核苷酸碱基上的附着点会随着碱基的变化而变化。当在任何位置上的附着都是可能的时候,在某些实施方式中,附着是发生在不涉及互补碱基的氢键键合的位置上。因此,例如,附着可以发生在嘧啶例如尿嘧啶、胞嘧啶和胸腺嘧啶的5或6位置处。对于诸如腺嘌呤和鸟嘌呤的嘌呤,连接可以是经由8位置处。所要求保护的方法及组分并不限于任何特定类型的探针分子,例如寡核苷酸。用以将纳代码附着于其它类型的探针例如肽、蛋白和/或抗体探针的方法在本领域是已知的。
【0132】本发明的实施方案并没有限制可以使用的纳代码的类型。应该预期到,在本领域已知的任何类型的纳代码都可以使用。非限制性的实例包括碳纳米管、富勒烯和亚微米金属条形码,正如本文中更详细讨论的。
【0133】在某些方面,纳代码是金属条形码。潜在的可用作纳代码的亚微米金属条形码的实例在本领域是已知的(例如,Nicewarner-Pena等人,Science 294:137-141,2001)。Nicewarner-Pena等人(2001年)公开了制备由亚微米条(submicrometer stripes)编码的多金属微棒(multimetal microrods)的方法,其由不同类型的金属组成。该系统允许产生非常大量的可区分的纳代码——使用两种类型的金属就可达到4160种,而利用三种不同类型的金属则可以达到8×105种之多。这样的纳代码可以整合到已编码探针,并利用SPM技术读取。将诸如金或银的金属颗粒粘附到寡核苷酸和其它类型的探针分子上的方法在本领域是已知的(例如美国专利5,472,881)。
【0134】在所公开方法中有用的另一种例证类型的纳代码是碳纳米管,如单壁碳纳米管(SWNT)。纳米管可以制作成各种形状和大小,并可通过SPM方法来区分(参见,例如Freitag等人,Phys.Rev.B 62:R2307-R2310,2000;Clauss等人,Europhys.Ltte.47:601-607,1999;Clauss等人,Phys.Rev.B 58:R4266-4269,1998;Odom等人,Ann.N.Y.Acad.Sci.960:203-215,2002)。Odom等人(2002年)公开了一种STM(扫描穿隧显微镜)技术,该技术能够检测到10纳米或更小尺寸的SWNT的隧穿谱中的离散峰。这样的峰可以代表碳纳米管的电子态密度(DOS)中的van Hove奇异性。
【0135】碳纳米管的电子性质通过该管的长度和直径来调节。电子波函数对长度的敏感性可以通过对长度为L的管子的能级劈裂的估计来说明。
【0136】ΔE=hvF/2L(方程式1)
【0137】其中h为普朗克常数,vF为费米速度(8.1×105米/秒)(1996年11月23日,Venema等人,“Imaging Electron Wave Functions ofCarbon Nanotubes”,Los Alamos Physics Preprints:cond-mat/9811317)。电子能级间的差异与该纳米管的长度成反比,较长的管子会观察到的较细密的劈裂。
【0138】碳纳米管的光学性质也是管直径的函数。基本能量间隙(最高占据分子轨道-最低未占据分子轨道)与管直径间的关系可以利用下列函数来建模:
【0139】Egap=2y0acc/d(式2)
【0140】其中y0为碳-碳紧密结合重叠能量(C-C tight bonding overlapenergy)(2.72 0.1电子伏特),acc为最邻近的碳-碳距离(0.142纳米),d为管直径(1998年,Jeroen等人,Nature 391:59-62)。
【0141】对于本发明的某些实施方案,用作纳代码的纳米管可以具有大约10到200纳米的管长度,及大约1.2到1.4纳米的直径。用作纳代码的纳米管的长度或直径并没有限制,而实际上可以考虑任何长度或直径的纳米管。
【0142】可以预想到,纳米管可通过已知的方法制备或从商业来源取得,例如CarboLex(Lexington,KY)、NanoLab(Watertown,MA)、材料和电化学研究中心(Materials and Electrochemical Research(Tucson,AZ))或碳纳米科技公司(Carbon Nano Technologies Inc.(Houston,TX))。在使用之前,合成的或购买到的纳米管可以进行适当的处理。所述处理可以包含通过纯化将纳米管与其它污染物分开、将混合直径和/或长度的纳米管分离为具有离散的直径和长度的纳米管、将纳米管的末端结构去除,和/或进行共价修饰以有利于纳米管附着到探针上,形成已编码探针。
【0143】在本发明的某些实施方案中,具有可变长度和/或直径的碳纳米管可以利用在本领域已知的各种技术来产生,所述技术包含但不限于碳-电弧放电、藉由碳氢化合物的催化高温分解的化学气相沉积、等离子体辅助化学气相沉积、含有催化金属的石墨目标的激光烧蚀、或凝聚相电解(参见,例如美国专利6,258,401、6,283,812和6,297,592)。在某些实施方案中,纳米管可以通过质谱方法按大小进行分选(参见,1991年,Parker等人,J.Am.Chem.Soc.113:7499-7503)。可以选择地,纳米管可以在整合入已编码探针之前,使用AFM(原子力显微镜术)或STM(扫描穿隧显微镜术)来分选,精确地量测单个纳米管的几何形状。其它的在本领域中已知的大小分级的方法是已知的,例如气相色谱、飞行时间质谱、超滤或等同的技术都可以考虑。被分选之后,碳纳米管可以被衍生化,共价地附着于具有已知序列的寡核苷酸探针或任何其它类型的探针上。
【0144】对于碳纳米管可能的是,其管长度的最小增量变化为碳-碳键的长度,或者大约0.142纳米。对于200纳米的管长度范围,可允许获得大约1400个互不关联的纳代码。然而,该方法并不限于每一已编码探针使用一个纳米管。在另外的实施方案中,不同长度及直径的多个纳米管可以附着于单个已编码探针。利用不同长度的纳米管的组合,可能的可分辨纳代码的数目将以指数方式增加。在一些实施方案中,单个纳米管可以附着于单个探针分子,以简化分析。
【0145】本发明的其它实施方案涉及制造具有确定长度和直径的碳纳米管的方法。在一个非限制性的示范实施方案中,一个芯片可以含有一层具有预先选定厚度的SiC,还覆盖着一个例如由硅或掺杂有催化剂(例如,金属原子,比如镍)的硅所组成的层。使用标准的芯片加工方法,诸如照相平板印刷和蚀刻或激光烧蚀,该SiC层可以被分割成任何长度、宽度、厚度和形状的SiC沉积物。然后,该芯片可以在真空中加热,例如在大约10-7Torr(托)和大约1400℃,或者从大约到Torr,到10-3到10-12Torr、10-4到10-10Torr,或10-5到10-9Torr,以及从1200到2200℃或1400到2000℃。在这些条件下,SiC晶体会自发地分解,失去硅原子(美国专利6,303,094)。剩余的碳原子自发地装配成碳纳米管。SiC沉积物的大小及形状可以精确地控制,以制造任何长度和直径的碳纳米管。
【0146】在上文中所讨论的本发明的示范性实施方案并不是限制性的,制造具有已选择的长度和直径的碳纳米管的任何方法都可以使用(例如美国专利6,258,401;6,283,812和6,297,592)。在某些实施方案中,纳米管长度可以通过使用激光束、电子束、离子束或气体等离子束剪截末端来调节。或者,纳米管的末端可以在含氧的气氛中与热片(hotblade)接触,通过氧化作用去除该管子的末端。含有纳米管的块状物也可以被切割成段或被抛磨以截断纳米管。
【0147】在本发明的某些实施方案中,碳纳米管可以用反应活性基团来衍生化,以促进与探针分子的粘附。在一个非限制性的例子中,纳米管可以被衍生化以含有羧酸基团(美国专利6,187,823)。羧化衍生的纳米管可以通过标准的化学方法附着到探针分子上,例如与位于探针上的伯胺或仲胺基团形成由碳二亚胺介导的酰胺连接。衍生化和交联的方法并没有限制,任何在本领域中已知的反应基团或交联方法都可以使用。
【0148】在本发明的另外的实施方案中,富勒烯可以用作纳代码。制造富勒烯的方法是为人所熟知的(例如美国专利6,358,375)。富勒烯可以利用类似于上文中针对碳纳米管所揭示的方法来衍生和附着到探针分子上。含有富勒烯的已编码探针可以利用SPM技术来鉴别,类似于上文中针对纳米管所揭示的方法。
【0149】在本发明的某些实施方案中,富勒烯可以附着于寡核苷酸已编码探针中个体核苷酸。在这样的情况下,只要求两种不同类型的可区分的富勒烯,因为在寡核苷酸中只发现四种类型的核苷酸,而两种类型的富勒烯可以组合成四种不同的组合(例如AA、BB、AB和BA)。当个体核苷酸被附着到纳代码上时,在该核苷酸和富勒烯之间使用已知的连接基团可能是恰当的,这样可以避免与目标核酸杂交时的空间位阻。
【0150】熟练的技术人员会意识到,在所揭示的方法中使用的纳代码并不限于在此揭示的实施方案,而是可以包括任何其它类型的已知的纳代码,所述纳代码可以附着于探针和被检测。其它可能使用的纳代码的非限制性的例子包括量子点(例如Schoenfeld等人,Proc.7th Int.Conf.on Modulated Semiconductor Structures,Madrid,pp.605-608,1995;Zhao等人,1st Int.Conf.on Low Dimensional Structures andDevices,Singapore,pp 467-471,1995)。量子点和其它类型的纳代码可以利用已知的方法来合成和/或从商业来源取得(例如量子点公司(Quantum Dot Corp.),Hayward,CA)。其它可能使用的纳代码包括纳米颗粒,可以从例如Nanoprobes Inc.(Yaphank,NY)和Polysciences,Inc.(Warrington,PA)获得。
【0151】在本发明的方法中有用的纳代码的另一个方面,正如在图5示意性说明的,包括条形码骨架510,其可以从包括有机结构的聚合物链形成,包括核酸、肽、多糖、和/或化学来源聚合物序列的任何组合。在某些方面,骨架510可以包括单链或双链核酸。在一些实施方案中,骨架可以附着在探针组分550上,如寡核苷酸、抗体或适配子。骨架510可以用一种或多种分支结构520修饰,以便产生额外的形态多样性和标签附着点。分支结构520可以使用本技术领域熟知的技术形成。例如,在条形码500包括双链核酸的情况下,分支结构520可以通过寡核苷酸的合成以及与单链模板核酸的杂交来形成。寡核苷酸可以如此设计,以便部分序列(例如5’端)与模板互补,部分(例如3’端)不互补。因此,条形码500将含有双链序列的片段,和单链分支结构520的短片段。正如图5中所公开的,标签530可被加入到条形码中,例如通过已标记530寡核苷酸的杂交,这些寡核苷酸在序列中与分支结构520的单链部分互补。
【0152】寡核苷酸模拟可以被用于产生有机骨架510。核苷酸单元的糖和核苷酸间键合,即骨架,可以用新基团代替。探针550可用于与适当的核酸目标化合物杂交。已经表明表现出杂交特性的寡聚化合物或寡聚核苷酸模拟物的一个实例被称作肽核酸(peptide nucleic acide(PNA))。在PNA化合物中,寡核苷酸的糖骨架用含有酰胺的骨架代替,例如氨乙基甘氨酸骨架。在该实施方案中,核碱基被保留,并且直接或者间接地结合到骨架的酰胺部分的偶氮原子上。公开了PNA化合物的制备的几个美国专利包括,例如美国专利5,539,082;5,714,331和5,719;262。此外,PNA化合物也公开在Nielsen等人(Science,1991,254,1497-15)。
【0153】除了将一个条形码500与另一个条形码区分开来,可以将标签530直接添加到骨架510上,或者加入到一个或多个分支结构520上。一些标签本身是条形码,正如本文所讨论的。例如,碳纳米管可以形成条形码,或者可以被用作另一种类型条形码的标签。
【0154】条形码500可以通过将另一个分子540(例如抗体)附着到一个或多个标签530上进一步修饰。在使用大体积基团的情况下,附着到分支点520上的标签组分530的修饰,将对探针550与目标分子的相互作用提供较小阻碍。标签530可以通过单分子水平表面分析方法如SPM读取,正如本文所讨论的。成像的不同变体已知可以检测标签530的形态的、形貌的、化学的和/或电学的特性,包括但不限于导电性、隧道电流、电容电流等等。所使用的特定的单分子水平表面分析方法将依赖于标签组分530的性质,以及所产生的有效信号。不同类型的已知标签530,包括但不限于,荧光、拉曼、纳米颗粒、纳米管、富勒烯、和量子点标签530,可以被用于鉴别条形码500,通过它们的形貌的、化学的、光学的和/或电学的特性进行。这样的特性将作为所用的标签组分530的类型,以及骨架510或分支结构520上的标签530的相对位置的函数,从而导致对每一个条形码500产生可分辨的信号。
【0155】在本发明的某些实施方案中,正如图5中示意性说明的,条形码500的骨架510,可以由磷酸二酯键、肽键、和/或糖苷键形成。例如,标准亚磷酰胺(phosphoramidite)化学方法可以被用于形成包括DNA链的骨架510。产生磷酸二酯键连接的骨架510的其它方法是已知的,如聚合酶链式反应(PCRTM)扩增。骨架510的末端可以具有不同的功能基团,例如生物素、氨基基团、醛基或者硫醇基团。这些功能基团可以被用于与探针组分550结合,或者用于附着标签530。标签530可以进一步被修饰,以便获得不同大小、电学的或化学特性,以便有助于检测。例如,抗体可以被用于结合地高辛(digoxigenin)或者荧光素标签530。链霉抗生物素蛋白(Streptavidin)可以被用于结合生物素标签530。金属原子可以在条形码500结构上沉积,例如通过使用酶标签530的金属离子溶液的催化还原反应。在条形码500包括肽组分的情况下,肽可以被磷酸化以用于标签530的修饰。正如在题为“PROGRAMMABLE MOLECULAR BARCODES”(于2003年9月24提交,申请号为10/670,701)的共同未决申请中所讨论的,本发明的含核苷酸的纳代码也可以使用杂交方法制作。
【0156】在本发明的不同实施方案中,条形码包括一个或多个标签组分,以有助于检测和/或鉴定。可以通过单分子水平表面分析方法检测的、在本技术领域已知的任何可检测的标签,可以与本发明的方法中的物理对象的条形码一起使用。可检测标签可以包括,但不限于,可通过电、光学、分光光度、光化学、生物化学、免疫化学、或者化学技术检测的任何组成成分。标签可以包括,但不限于,导电、发光、荧光、化学发光、生物发光和磷光组分、量子点、纳米颗粒、金属纳米颗粒、金纳米颗粒、银纳米颗粒、色原体、抗体、抗体片段、遗传工程抗体、酶、底物、辅因子、抑制剂、结合蛋白、磁性颗粒和自旋标记化合物。(美国专利3,817,837;3,850,752;3,939,350;3,996,345;4,277,437;4,275,149和4,366,241。)
【0157】在单分子水平表面分析方法是拉曼光谱学的情况下,尤其是SERS,可以使用的拉曼标签的非限定性实例包括TRIT(四甲基罗丹明异硫醇(tetromethyl rhodamine isothiol)、NBD(7-硝基苯-2-氧杂-1,3-二唑)、德克萨斯红染料(Texas Red dye)、邻苯二甲酸、对苯二甲酸、间苯二甲酸、甲酚固紫(cresyl fast violet)、甲酚蓝紫(cresyl blueviolet)、亮甲酚蓝、对-氨基苯甲酸、赤藓红、生物素、地高辛、5-羧基-4’,5’-二氯-2’,7’-二甲氧基荧光素、TET(6-羧基-2’,4,7,7’-四氯荧光素)、HEX(6-羧基-2’,4,4’,5’,7,7’-六氯荧光素)、Joe(6-羧基-4’,5’-二氯-2’,7’-二甲氧基荧光素)5-羧基-2’,4’,5’,7’-四氯荧光素、5-羧基荧光素、5-羧基罗丹明、Tamra(四甲基罗丹明)、6-羧基罗丹明、Rox(羧基-X-罗丹明)、R6G(罗丹明6G)、酞菁染料、偶氮甲碱、花菁(例如Cy3、Cy3.5、Cy5)、黄嘌呤、琥珀酰荧光素、N,N-二乙基-4-(5′-偶氮苯并三唑基)-苯胺和氨基吖啶。这些和其它拉曼标签可以从商业来源获得(例如Molecular Probes,Eugene,OR)。
【0158】多环芳族化合物一般可用作拉曼标签。可以使用的其它标签包括氰化物、硫醇、氯、溴、甲基、磷和硫。在某些实施方案中,碳纳米管可以用作拉曼标签。在拉曼光谱学中使用标签是已知的(例如美国专利5,306,403和6,174,677)。
【0159】拉曼标签可以直接附着在条形码上,或者可以通过多种连接物化合物附着。可以共价附着在拉曼标签上的核苷酸可以从标准商业来源得到(例如Roche Molecular Biochemicals,Indianapolis,IN;PromegaCorp.,Madison,WI;Ambion,Inc,.Austin,Tx;Amersham PharmaciaBiotech,Piscataway,NJ)。含有设计为与其它分子共价反应的活性基团的拉曼标签,例如核苷酸或氨基酸,可从商购获得(例如MolecularProbes.Eugene,OR)。
【0160】可以在与物理对象相关的条形码中使用的荧光标签包括,但不限于,荧光素、5-羧基荧光素(FAM)、2’,7’-二甲氧基-4’,5’-二氯-6-羧基荧光素(JOE)、罗丹明、6-羧基罗丹明(R6G)、N,N,N’N’-四甲基-6-羧基罗丹明(TAMRA)、6-羧基-X-罗丹明(ROX)、4-(4’-二甲基氨基苯基偶氮)苯甲酸(DABCYL)和5-(2’-氨基乙基)氨基萘-1-磺酸(EDANS)。其它潜在的荧光标签在本技术领域是已知的(例如美国专利5,866,336)。多种荧光标签可以从商业来源获得,如MolecularProbe(Eugene,OR)。已加上标签的分子的荧光检测方法在本技术领域也是已知的,可以使用任何这样的已知方法。
【0161】可以在与物理对象相关的条形码中使用的发光标签包括,但不限于,稀土金属穴状化合物、铕三联嘧啶二胺、铕穴状化合物或鳌合物、Tb三联嘧啶、二胺、二花菁苷、La Jolla蓝染料、allopycocyanin、allopycocyanin B、allopycocyanin C、allopycocyanin R、硫胺、藻红蓝蛋白(phycoerythrocyanin)、hycoerythrn R、上行转化(up-converting)或者下行转化(down-converting)磷、荧光素、或者吖啶酯。
【0162】此处关于纳代码讨论了被用作标签的纳米颗粒。尽管金或者银纳米颗粒最常用作标签,但任何类型或者组成的纳米颗粒可以附着在条形码上,并且被用作标签。
【0163】将被使用的纳米颗粒可以是纳米颗粒的随机聚集体(胶体纳米颗粒)。可以选择地,纳米颗粒可以被交联,以便产生纳米颗粒的特定聚集体,如二聚体、三聚体、四聚体或者其它聚集体。含有选定数量的纳米颗粒(二聚体、三聚体等等)的聚集体可以被通过已知技术富集或者纯化,如蔗糖溶液超离心。
【0164】适合于附着在条形码上的已修饰纳米颗粒可商购获得,如Nanogold纳米颗粒,来自Nanoprobes,Inc.(Yaphank,NY)。Nanogold纳米颗粒可以用单个或者多个马来酰亚胺、胺或者其它基团附着到每个纳米颗粒上而获得。这样的经过修饰的纳米颗粒可以使用多种已知连接化合物附着在条形码上。
【0165】标签可以包括亚微米金属标签(例如,Nicewarner-Pena等人,Science 294:137-141,2001)。Nicewarner-Pena等人(2001年)公开了制备由亚微米条(submicrometer stripes)编码的多金属微棒(multimetalmicrorods)的方法,其是由不同类型的金属组成。该系统允许产生非常大量的可区分的纳代码——使用两种类型的金属就可达到4160种,而利用三种不同类型的金属则可以达到8×105种之多。这样的标签可以附着到条形码上,并且被检测。将诸如金或银的金属颗粒粘附到寡核苷酸和其它类型的探针分子的方法,在本领域是已知的(例如美国专利5,472,881)。
【0166】富勒烯也可以用作条形码标签。制造富勒烯的方法是为人所熟知的(例如美国专利6,358,375)。富勒烯可以利用类似于上文中针对碳纳米管所揭示的方法来衍生和附着到探针分子上。含有富勒烯的已编码探针可以利用多种技术来鉴别。
【0167】应该预期到可以附着于条形码并且被检测的其它类型的已知标签。其它可能使用的标签的非限制性的例子包括量子点(例如Schoenfeld等人,Proc.7th Int.Conf.on Modulated SemiconductorStructures,Madrid,pp.605-608,1995;Zhao等人,1st Int.Conf.on LowDimensional Structures and Devices,Singapore,pp 467-471,1995)。量子点和其它类型的标签也可以从商业来源取得(例如量子点公司,Hayward,CA)。
【0168】碳纳米管,如单壁碳纳米管(SWNT),也可以被用作标签。纳米管可以在使用单分子水平表面分析方法的实施方案中被检测,例如通过拉曼光谱学(例如Freitag等人,Phys.Rev.B 62:R2307-R2310,2000)。碳纳米管的特性,如电学或光学特性,至少部分地依赖于纳米管的大小。碳纳米管可以通过本文讨论的多种技术制备。
【0169】核苷酸或者碱基,例如腺嘌呤、鸟嘌呤、胞嘧啶或者胸腺嘧啶可以被用于对分子条形码加上标签,而不是寡核苷酸和核酸。例如,基于肽的分子条形码可以用于核苷酸或者嘌呤或者嘧啶碱基加标签。其它类型的嘌呤或者嘧啶或者其类似物,如尿嘧啶、肌苷、2,6-二氨基嘌呤、5-氟-脱氧胞核嘧啶、7脱氮-脱氧腺嘌呤(7 deaza-deoxyadenine)或者7-脱氮-脱氧鸟嘌呤(7 deaza-deoxyguanine)也可以被用作标签。其它标签包括碱基类似物。碱基是含氮环结构,没有糖或者磷酸。这样的标签可以通过光学技术检测,如拉曼或者荧光光谱法。在将要被检测的目标分子是核酸或者寡核苷酸的情况下,使用核苷酸或者核苷酸类似物标签可能不是适当的,这是由于条形码的标签部分可以潜在地与不同于探针部分的目标分子杂交。
【0170】氨基酸也可以被用作标签。可以用作标签的氨基酸包括但不限于,苯丙氨酸、酪氨酸、色氨酸、组氨酸、精氨酸、半胱氨酸和甲硫氨酸。
【0171】双功能交联剂可以用于多个目的,如将标签附着于条形码。双功能交联剂能够根据它们的功能基团的特异性来划分,例如氨基、胍基、吲哚、或羧基基团。在这些之中,针对自由氨基基团的试剂是普遍应用的,因为它们可从商业途径获得、容易合成,并且它们被加以应用时的反应条件温和(美国专利5,603,872和5,401,511)。潜在使用的交联试剂包括戊二醛(GAD)、双功能环氧乙烷(bifuncationaloxirane(OXR))、乙二醇二缩水甘油醚(EGDE),以及碳二亚胺,例如1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)。
【0172】在本发明的各种实施方案中,要被分析的目标分子可以在已编码探针结合之前、之后和/或期间被固定化。例如,目标分子的固定化可用来促进已结合的已编码探针与未结合的已编码探针的分离。在某些实施方案中,目标分子的固定化也可在已编码探针被检测和/或鉴别之前,用来将已结合的已编码探针与目标分子分离。虽然下面的讨论是针对核酸的固定,但是熟练技术人员应了解到,固定化各种类型的生物分子的方法在本领域是已知的,它们可以用于所要求保护的方法中。
【0173】核酸固定化可以用来,例如,促进目标核酸与连接的已编码探针的分离、与未杂交的已编码探针的分离,或与彼此杂交的已编码探针的分离。在非限制性的实例中,目标核酸可以被固定,并允许与已编码探针杂交,之后,已杂交的相邻的已编码探针被连接在一起。含有已结合的核酸的混合物被轻轻清洗,以除去未杂交的已编码探针和杂交到其它已编码探针上的已编码探针。在洗涤之后,已杂交且已连接的已编码探针可以通过加热到大约摄氏90到95℃数分钟,使之与固定化的目标核酸分离。所述的已连接的已编码探针可以粘附至一个表面上,并利用分子梳来排列对齐,如同上文中所揭示。经排列对齐的已编码探针接着可以用SPM来分析。
【0174】核酸的固定化可以利用本领域已知的各种方法来达成。在本发明的一个示范性的实施方案中,固定化可以通过将基片以链霉抗生物素蛋白或抗生物素蛋白包覆,接着粘附生物素标记核酸来实现(Holmstrom等人,Anal.Biochem.209:278-283,1993)。固定化也可以通过在硅、玻璃或其它基材上包被聚-E-Lys(赖氨酸),接着用双功能交联试剂共价联结氨基修饰或巯基修饰的核酸来实现(Running等人,BioTechniques 8:276-277,1990;Newton等人,Nucleic Acids Res.21:1155-62,1993)。胺类残基可以通过应用氨基硅烷而被导入到基材上,以便交联。
【0175】固定可以通过5′-磷酸化核酸与经化学修饰的基质之间的直接共价连接而发生(Rasmussen等人,Anal.Biochem.198:138-142,1991)。在核酸与基质之间的共价键通过水溶性碳二亚胺或其它交联剂的缩合来形成。该方法有利于核酸主要经由其5′-磷酸的5′-连接。示范性的修饰基质包含已经在酸欲中处理过的载玻片或盖玻片,其在玻璃上暴露出SiOH基团(美国专利5,840,862)。
【0176】通常,首先硅烷化玻璃基质,然后用碳二亚胺或戊二醛活化,这样DNA被结合到玻璃上。另外的程序可以使用诸如3-环氧丙氧丙基三甲氧基硅烷(GOP)、乙烯基硅烷或氨基丙基三甲氧基硅烷(APTS)的试剂和DNA连接,经由在分子的3′或5′末端整合有氨基连接子连接。DNA可以使用紫外辐射直接结合到薄膜基质上。其它的核酸固定技术的非限制性的例子公开在美国专利5,610,287、5,776,674和6,225,068。商业上可获得的用于核酸结合的基质是可利用的,例如Covalink、Costar、Estapor、Bangs和Dynal。技术人员应了解到,在此所公开的方法并不受限于核酸的固定,它们也可能用于,例如,将寡核苷酸已编码探针的一端或两端粘附至基质。
【0177】用以固定核酸或其它目标分子的基质的类型是没有限制的。在本发明的各种实施方案中,固定基质可以是磁珠、非磁性珠、平面基质或可由几乎任何材料构成的具有任何其它形态的固体基质。可以使用的基质的非限制性的例子包含玻璃、硅石、硅酸盐、PDMS(聚二甲基硅氧烷)、用银或其它金属涂覆的基质、硝酸纤维素、尼龙、活化石英、活化玻璃、聚偏二氟乙烯(PVDF)、聚苯乙烯、聚丙烯酰胺、其它的诸如聚氯乙烯或聚甲基丙烯酸甲酯的聚合物,以及光敏聚合物,其含有光活性物质,例如能够与核酸分子形成共价连接的氮宾、卡宾、羰自由基(参见美国专利5,405,766和5,986,076)。
【0178】双功能交联剂可以在本发明的各种实施方案中应用。双功能交联剂能够根据它们的功能基团的特异性来划分,例如氨基、胍基、吲哚、或羧基特异性基团。在这些之中,针对自由氨基基团的试剂是较为普遍应用的,因为它们可从商业途径获得、容易合成,并且它们被加以应用时的反应条件温和。交联分子的示范性方法被公开在美国专利5,603,872和5,401,511。交联试剂包括戊二醛(GAD)、双功能环氧乙烷(OXR)、乙二醇二缩水甘油醚(EGDE),以及碳二亚胺,例如1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)。
【0179】正如此处所表明的,在本发明的方法中的某些方面,纳代码可以使用扫描探针显微镜术(SPM)来检测。扫描探针显微镜术(SPM)是在微米和/或纳米尺度上、用于测量物体的物理性质的一个仪器家族。SPM技术的不同形式是可利用的,这在下文会更详细讨论。任何形式的SPM分析都可以用来检测和/或鉴别已编码探针。一般来说,SPM仪器通过在非常靠近表面处使用非常小的、尖探针测量物体的性质。在一些类型的SPM仪器中,探针可以安装在悬臂上,该悬臂可以长约数百微米,厚度大约0.5到5.0微米。典型地,探针尖端是在xy模式下越过表面进行光栅扫描,以绘制表面性质的局部化变化。应用SPM来成像生物分子和/或检测用作纳代码的分子的方法,在本领域是已知的(例如1996年Wang等人,Amer.Chem.Soc.Lett.,12:1697-98;1998年Kim等人,Appl.Surface Sci.130,230,340-132:602-609;2000年Kobayashi等人,Appl.Surface Sci.157:228-32;2000年Hirahara等人,Phy.Rev.Lett.85:5384-87;2001年Klein等人,Applied Phys.Lett.78:2396-98;2001年Huang等人,Science 291:603-33;2001年Ando等人,Proc.Natl.Acad.Sci.USA 12468-72)。
【0180】扫描隧道显微镜术(scanning tunneling microscopy)在20世纪80年代初发展出来的第一种SPM技术。STM依赖于在探针尖端与样品表面之间的量子机械电子隧穿的存在。该尖端被锐化成单个原子点,在表面进行光栅扫描,扫描时维持探针-表面的间隔距离为几个埃,而又不实际接触到表面。微小的电势差(在微伏到几伏这个级别)被施加于在探针尖端与样品之间,测量在尖端与样品间的隧穿电流。当尖端扫描过表面时,样品的电学性质和形貌性质的差异会造成穿隧电流大小的变化。在本发明的某些实施方案中,尖端的相对高度可以通过具有回馈控制的、且与计算机相连接的压电元件来控制。计算机可以实时监控电流强度,向上或者向下移动尖端以维持相对恒定的电流。在不同的实施方案中,尖端的高度和/或电流强度可以利用计算机来处理,从而得到被扫描表面的图像。
【0181】因为STM测量样品的电学性质和形貌性质,所以它能够分辨不同类型的传导材料,例如在金属条形码中的不同类型金属。STM也能够测量局部电子密度。因为穿隧传导性与局部能态密度(local densityof states(DOS))成正比,所以STM也可用以区分碳纳米管,所述碳纳米管的电子性质依碳纳米管直径和长度而发生变化。STM可用以侦测及/或鉴别任何电学性质不同之纳代码。
【0182】STM探针尖端可以扫描含有已排列对准的已编码探针的表面,从而检测和鉴别在该表面上的各个已编码探针。连接的已编码探针也可以被鉴别。目标分子可以通过确定哪些已编码探针结合到目标分子上来加以鉴别。在本发明的一些实施方案中,已编码探针表示特定序列(例如寡核苷酸序列)的存在,那么生物分子的序列就可以从与目标分子结合的已编码探针的序列来确定。
【0183】另一种形式的SPM是原子力显微镜术(AFM)。利用AFM进行生物分子分析的方法在本领域中是广为人知的(例如,Uchihashi等人,“Application of Noncontact-Mode Atomic Force Microscopy toMolecular Imaging”,http://www.foresight.org/Conferences/MNT7/Abstracts/Uchihashi)。在AFM显微镜术中,探针是附着在载有弹簧的或弹性的悬臂上,该悬臂与待分析的表面相接触。接触时的距离是在分子力范围之内(即在范德华力的作用范围内)。在AFM中,不同模式的操作都是可能应用的,包含接触模式、非接触模式和TappingMode3。
【0184】在接触模式中,探针尖端与样品表面之间的原子力被测量,其中保持尖端-样品的距离不变,测量悬臂的偏移,这通常是利用将激光从悬臂反射到位置灵敏的检测器进行。悬臂的偏移造成被反射的激光束的位置变化。与在STM中的情形一样,探针尖端的高度可以由计算机控制,其中使用具有回馈控制的压电元件。在本发明的一些实施方案中,通过升起或降低探针尖端来维持相对固定角度的偏移。由于探针尖端与样品可以有实际的(范德华)接触,所以接触模式的AFM往往会使非刚硬的样品变形。在非接触模式中,尖端被维持在样品表面之上约50到150埃之间,并且该尖端会振荡。在尖端与样品表面之间的范德华相互作用就反映在该尖端振荡的相位、振幅或频率的变化上。非接触模式所达到的分辨率相对较低。
【0185】在TappingMode3中,悬臂梁应用压电组件,在其共振频率或接近其共振频率处振荡。AFM尖端周期性地接触(拍打)样品表面,其频率约为在空气中每秒50,000到500,000个循环,而在液体中频率要低些。当尖端开始接触样品表面时,振荡的振幅会降低。振幅的变化被用来确定样品的形貌性质。因为AFM分析并非取决于电导性,所以它可以用来分析非传导材料的形貌性质。形貌性质具有差异的某些类型的纳代码,包含但不限于碳纳米管、富勒烯及纳米颗粒,都可以利用AFM技术来检测和/或鉴别。
【0186】在别的AFM模式中,除了样品的形貌描述之外,还可以获得额外的信息。例如,在横向力显微镜术(LFM)中,探针是以垂直于其长度的方向扫描,悬臂的扭力的角度被确定。悬臂扭力取决于表面的摩擦特性。因为已编码探针的摩擦特性可以依其组成而发生变化,所以LFM可用以检测和鉴别不同的已编码探针。
【0187】另一种变化是化学力显微镜术(CFM),其中探针尖端用化学物质功能化,扫描样品时检测在该化学物质与该样品之间的粘附力(例如,1994年,Frisbie等人,Science,265:2071-2074)。对纳代码材料具有不同亲和性的化学物,例如金或银,可以被整入到AFM探针尖端中,它扫描表面以检测和鉴别纳代码。其它可能使用的SPM模式是力调变成像(1991年,Maivald等人,Nanotechnology,2:103)。Uchihashi等人公开了一种在非接触模式AFM中使用频率调变进行生物分子成像的方法(http://www.foresight.org/Conferences/MNT7/Abstracts/Uchihashi)。
【0188】其它可能用以检测和/或鉴别已编码探针的SPM模式包括磁力显微镜术(MFM)、高频MFM、磁阻敏感映像(magnetoresistivesensitivity mapping,MSM)、电子力显微镜术(EFM)、扫描电容显微镜术(SCM)、扫描延伸电阻显微镜术(SSRM)、穿隧AFM和传导AFM。在这些形式中的某一些,样品的磁性质可以被确定。本领域技术人员应了解,金属条形码和其它类型的纳代码可以被设计成能够利用其磁性及电学性质来鉴别。
【0189】供已编码探针检测和/或鉴别使用的SPM仪器可以在商业上获得(例如Veeco Instruments,Inc.,Plainview,NY;Digitali Instruments,Oakland,CA)。或者,可以使用客户定制的SPM仪器。
【0190】在本发明的某些实施方案中,用于生物分子分析的系统可以包含信息处理及控制系统。实施方案并不限制所使用的信息处理系统的类型。这样的系统可以用来分析由SPM仪器获得的数据,和/或用来控制SPM探针尖端的移动、所使用的SPM成像的形式以及获得SPM数据的精确技术。示范性的信息处理系统可以包含计算机,该计算机含有用于数据通讯的总线和用于处理信息的处理器。在一个实施方案中,处理器选自奔腾(Pentium)系列的处理器,包括但不限于奔腾II系列、奔腾III系列及奔腾4系列的处理器,这些可以从英特尔公司(Santa Clara,CA)获得。在本发明的另外的实施方案中,处理器可以是Celeron、Itanium、X-Scale或奔腾Xeon处理器(英特尔公司,Santa Clara,CA)。在本发明的各种其它的实施方案中,处理器可以是基于英特尔(Intel)体系结构,例如英特尔IA-32或英特尔IA-64体系结构。或者,也可以使用其它处理器。
【0191】计算机可以进一步包含随机存储器(RAM)或其它的动态存储装置、只读存储器(ROM)或其它的静态存储和数据存储装置,例如磁盘或光盘及其对应的驱动。信息处理系统还可以包含其它在本领域已知的外围设备,例如显示设备(例如阴极射线管或液晶显示器)、字母数字输入设备(例如键盘)、光标控制设备(例如鼠标、跟踪球或光标方向键)及通讯设备(例如调制解调器、网络连接卡、或用来连接到以太网、令牌网或其它类型的网络的接口设备)。
【0192】在本发明的特定实施方案中,SPM(扫描探针显微镜术)单元可以连接到该数据处理系统。来自SPM的数据可以用该处理器和储存在主存储器中的数据来处理。处理器可以分析来自SPM的数据以鉴别和/或确定附着于表面的已编码探针的序列。通过将连接的已编码探针的序列重叠在一起,计算机可以编辑出目标核酸的序列。或者,基于附着于表面的已编码探针的身份,计算机可以鉴别出存在于样品中的不同的已知生物分子物质。
【0193】应该了解到,配置不同的信息处理系统可以供某些特定执行使用。因此,系统的配置可以在本发明的不同实施方案中有所变化。在本发明的另外的实施方案中,在此描述的处理过程可以在程序控制的处理器的控制下执行,此时处理器可以完全或部分地通过任何可编程逻辑或硬编码逻辑,例如,现场可编程序门阵列(FPGA)、TTL逻辑或特定用途集成电路(ASIC),来加以执行。另外,所公开的方法可以通过程控的通用计算机组件和/或定制的硬件组件的任何组合来加以实施。
【0194】在本发明的某些实施方案中,可以应用为客户设计的软件包来分析从SPM获得的数据。在本发明另外的实施方案中,数据分析可以使用信息处理系统和可公开获得的软件包来执行。可以获得的用于DNA序列分析的软件的非限制性的例子包括PRISM3 DNA测序分析软件(Applied Biosystem,Foster City,CA)、Sequencher3软件包(GeneCodes,Ann Arbor,MI),和可以通过访问National BiotechnologyInformation Facility,网址www.nbif.org/links/1.4.1.php获得的各种软件包。
【0195】在本发明的某些实施方案中,含有一种或多种条形码的溶液可以被用于针对安全跟踪目的的对象。这样的方法在本技术领域是已知的。例如,British公司(SmartWater Ltd.)已经开发了使用含有数字DNA链的液体标志有价值物体的方法。DNA实际上是不可能从该物体上洗掉的,可以被用于独特地标识昂贵的物品或者相传动产。DNA可以由任何法医实验室检测。这样的方法也可以被用于标志具有本文公开的分子条形码的物质。在这样的应用中,条形码的检测将不要基于DNA序列的法医分析。
【0196】用于条形码制备、使用和/或检测的仪器可以被整合到一个较大的仪器和/或系统中。在某些实施方案中,该仪器可以包括一个微电机械系统(MEMS)。MEMS是包括机械元件、传感器、执行器和电子元件的集成系统。所有这样组件可以通过微加工技术在硅基或者等价基片的普通芯片上制造(例如Voldman等人,Ann.Rev.Biomed.Eng.1:401-425,1999)。MEMS的传感器组件可以用于测量机械、热、生物、化学、光学和/或磁性现象,以检测条形码。电子元件可以处理来自传感器的信息,并控制执行器组件,例如泵、阀、加热器等等,从而控制MEMS的功能。
【0197】MEMS的电子组件可以使用集成电路(IC)方法(例如CMOS或者Bipolar过程)制造。它们可以使用用于计算机芯片制造的照相平版印刷法和蚀刻方法绘制图案。微型机械组件可以使用兼容的“微制造”过程制造,选择性地蚀刻掉部分硅片,或者加入新的结构层,以便形成机械和/或电机组件。
【0198】MEMS制造中的基本技术包括将材料的薄膜沉淀于基片上,通过一些平版印刷方法将已形成图案的掩模应用于膜的顶层,并且选择性地蚀刻这些膜。薄膜可以在几个毫微米到100微米的范围之间。可以使用的沉淀技术包括化学过程,如化学气相沉淀(CVD)、电镀沉淀、外延附生和热氧化和物理过程,像物理气相沉淀(PVD)和铸造。也可以使用纳米机电系统的制造方法(例如参见Craighead,Science290:1532-36,2000。)
【0199】在一些实施方案中,仪器或者检测器可以与多种充满液体的区室相连,例如微流体通道或者纳米通道。该仪器的这些和其它组分可以形成为一个单一单元,例如以芯片(例如半导体芯片)和/或微毛细管或微流体芯片的形式。可以选择地,各组分可以分别制造,并且连接在一起。已知在这样的芯片中可以使用的任何材料都可以在所公开的仪器中使用,例如硅、二氧化硅、聚二甲基硅氧烷(PDMS)、聚甲基丙烯酸盐甲酯(PMMA)、塑料、玻璃、石英等等。
【0200】批量制造芯片的技术在计算机芯片制造和/或微毛细管芯片制造中是熟知的。这样的芯片可以通过本技术领域已知的任何方法制造,如通过照相平版法和蚀刻、激光烧蚀、注射成型、铸造、分子束外延附生、浸蘸笔(dip-pen)纳米平版印刷术、化学气相沉淀(CVD)制造、电子束或者聚焦离子束技术或者印迹技术。非限定性实例包括常规模塑、二氧化硅的干法蚀刻;和电子束平版印刷术。纳米机电系统的制造方法可以用于某些实施方案。(例如参见Craighead,Science 290:1532-36,2000。)多种形式的微制造芯片可从商业来源获得,例如从Caliper Technologies Inc.(Mountain View,CA)和ACLARA BioSciencesInc.(Mountain View,CA)。
【0201】在某些实施方案中,仪器的部分或者全部可以选择为可透过电磁辐射,该电磁辐射处于通过例如拉曼光谱学进行的条形码检测所用的激发和发射频率下。合适的组件可以由例如玻璃、硅、石英或者任何其它光学透明材料加工而得。对于可以暴露于多种分析物如核酸、蛋白质及其类似物的充满液体的区室,暴露于这样的分子的表面可以通过涂覆被修饰,例如以便将疏水性表面转化为亲水表面和/或以便减少分子吸附到表面。普通芯片材料如玻璃、硅、石英和/或PDMS的表面修饰是已知的(例如美国专利6,263,286)。这样的修饰可以包括,例如用可通过商业途经获得的毛细涂料(Supelco,Bellafonte,PA)、具有多种功能基团(例如聚环氧乙烷或者丙烯酰胺,等等)的硅烷进行涂覆。
【0202】在某些实施方案中,这样的MEMS仪器可以被用于制备分子条形码,以便将未并入的组件与已形成的分子条形码分离,从而将分子条形码暴露于目标,和/或以便检测与目标结合的分子条形码。
【0203】在另外的实施方案中,提供了试剂盒,该试剂盒包括具有至少一个已编码探针的组合物,每一个已编码探针包括附着到至少一个纳代码上的探针分子,探针分子包括可检测的非编码特征,纳代码可以使用单分子水平表面分析方法检测。探针分子,例如,是寡核苷酸、多核苷酸、核酸、抗体、抗体片段、遗传工程抗体、单链抗体、人源化抗体、蛋白质、受体、转录因子、肽、凝集素、底物、抑制剂、活化剂、配体、激素、细胞因子、趋化因子或药物。
【0204】纳代码是,例如碳纳米管、富勒烯、亚微米金属条形码、纳米颗粒和量子点。非编码特征可以是此处公开的任何非编码特征,例如起始标签、头部区域和/或尾部区域。纳代码可以是压缩的纳代码,或者包括阅读帧的纳代码。
【0205】下述实施例目的在于对本发明进行示意性说明,对本发明没有限制。
                            实施例1
            纳代码的合成以及SPM扫描
【0206】该实施例示意性说明了生物分子纳代码的制造和SPM检测,该生物分子纳代码包括肽骨架和C(60)标签。肽使用标准方法通过商业途经合成。肽通过将标签附着于赖氨酸残基而标记有C(60)标签。这通过功能化C(60)的羧基和赖氨酸的氨基反应而进行。已标记的多肽通过纳米滴下(nano-dropping),随后通过干燥被沉积在退火的金SPM基片上。SPM从数字设备上使用标准STM系统进行。
【0207】图3是肽C(60)纳代码的STM图像。多个巴基球(buckeyball)通过肽相连。STM扫描鉴别通过下述合成肽连接的石墨上的四个巴基球(buckeyball):
NH2-AAMAAKAMAAMAKAVAMAAKAVAAMAKAAA-CONH2(SEQ ID NO:1)。
【0208】尽管本发明已经参考上述实施例进行了描述,但应该理解到,修饰和变化也包括在本发明的精神和范围内。因此,本发明仅仅由所附权利要求限制。

Claims (36)

1.一种方法,所述方法包括:
a)提供一个或多个已编码寡核苷酸探针,每个已编码寡核苷酸探针包括与含有可检测的非编码特征的至少一个纳代码相关联的寡核苷酸;
b)将目标核酸与一个或多个已编码寡核苷酸探针接触;和
c)使用扫描探针显微镜术(SPM)鉴别与所述目标核酸结合的已编码寡核苷酸探针,以检测所述纳代码和所述可检测的非编码特征。
2.如权利要求1所述的方法,其中所述一个或多个已编码探针包括基本上所有可能的具有特定长度的寡核苷酸的序列。
3.如权利要求1所述的方法,其中所述纳代码选自碳纳米管、富勒烯、亚微米金属条形码、纳米颗粒和量子点。
4.如权利要求1所述的方法,其中所述核酸粘附于表面上。
5.如权利要求4所述的方法,所述方法进一步包括连接已杂交到所述核酸上相邻的已编码探针。
6.如权利要求5所述的方法,所述方法进一步包括将连接起来的已编码探针与所述核酸和非连接的已编码探针分离。
7.如权利要求6所述的方法,其中所述已连接的已编码探针形成阅读帧。
8.如权利要求1所述的方法,所述方法进一步包括通过分子梳将已编码探针排列在表面上。
9.如权利要求1所述的方法,其中所述扫描探针显微镜术是原子力显微镜术、扫描隧道显微镜术、横向力显微镜术、化学力显微镜术、力调制成像术、磁力显微镜术、高频磁力显微镜术、磁阻敏感映像、电子力显微镜术、扫描电容显微镜术、扫描扩展电阻显微镜术、穿隧原子力显微镜术或者传导原子力显微镜术。
10.如权利要求2所述的方法,所述方法进一步包括确定与核酸结合的寡核苷酸的核苷酸序列。
11.如权利要求10所述的方法,所述方法进一步包括从与核酸结合的寡核苷酸的序列确定目标核酸的核苷酸序列。
12.如权利要求1所述的方法,所述方法进一步包括从与核酸结合的已编码探针鉴别所述目标核酸。
13.如权利要求1所述的方法,其中在样品中存在两个或更多个核酸。
14.如权利要求1所述的方法,其中样品中的至少两个目标分子被同时合成。
15.如权利要求1所述的方法,其中所述可检测的非编码特征由与纳代码相关联的可检测特征标签提供。
16.如权利要求15所述的方法,其中所述可检测的非编码特征标签包括起始标签。
17.如权利要求1所述的方法,所述方法进一步包括转化所述分子纳代码以形成解压缩纳代码。
18.如权利要求1所述的方法,其中所述可检测的特征是校验和条形码段。
19.如权利要求1所述的方法,其中所述可检测特征包括标题段和编码片段。
20.一种组合物,其包括至少一个已编码探针,每个已编码探针包括附着于至少一个纳代码上的探针分子,所述至少一个纳代码包括可检测的非编码特征,该纳代码可以使用单分子水平表面分析方法检测。
21.如权利要求20所述的组合物,其中所述探针分子是寡核苷酸、多核苷酸、核酸、抗体、抗体片段、遗传工程抗体、单链抗体、人源化抗体、蛋白质、受体、转录因子、肽、凝集素、底物、抑制剂、活化剂、配体、激素、细胞因子、趋化因子或药物。
22.如权利要求20所述的组合物,其中所述探针分子是寡核苷酸。
23.如权利要求20所述的组合物,其中所述纳代码选自碳纳米管、富勒烯、亚微米金属条形码、纳米颗粒和量子点。
24.如权利要求20所述的组合物,其中所述可检测的非编码特征是起始标签。
25.如权利要求20所述的组合物,其中所述纳代码是压缩的纳代码。
26.如权利要求20所述的组合物,其中所述纳代码包括阅读帧。
27.如权利要求20所述的组合物,其中所述纳代码包括标题区域和编码区域。
28.如权利要求20所述的组合物,其中所述纳代码可使用扫描探针显微镜术(SPM)检测。
29.一种系统,所述系统包括:
a)扫描探针显微镜(SPM);
b)表面;和
c)至少一个附着于所述表面上的已编码寡核苷酸,其中所述已编码寡核苷酸探针包括纳代码,所述纳代码包括可检测的非编码特征,该纳代码可以使用SPM检测。
30.如权利要求29所述的系统,其中所述已编码寡核苷酸探针包括连接的寡核苷酸。
31.如权利要求30所述的系统,其中所述连接的寡核苷酸形成阅读帧。
32.如权利要求29所述的系统,其中所述扫描探针显微镜术是原子力显微镜术或者扫描隧道显微镜术。
33.如权利要求29所述的系统,其中所述可检测的非编码特征是起始标签。
34.如权利要求29所述的系统,其中所述纳代码是压缩的纳代码。
35.如权利要求29所述的系统,其中所述纳代码包括阅读帧。
36.如权利要求29所述的系统,其中所述纳代码包括标题区域和编码区域。
CNA2004800394991A 2003-12-31 2004-12-28 用于使用扫描探针显微镜术和纳代码检测核酸的方法和组合物 Pending CN1950516A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/750,515 2003-12-31
US10/750,515 US7381529B2 (en) 2003-12-31 2003-12-31 Methods and compositions for detecting nucleic acids using scanning probe microscopy and nanocodes

Publications (1)

Publication Number Publication Date
CN1950516A true CN1950516A (zh) 2007-04-18

Family

ID=34711289

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800394991A Pending CN1950516A (zh) 2003-12-31 2004-12-28 用于使用扫描探针显微镜术和纳代码检测核酸的方法和组合物

Country Status (6)

Country Link
US (1) US7381529B2 (zh)
EP (1) EP1711625A2 (zh)
JP (1) JP2007522799A (zh)
KR (1) KR20060135719A (zh)
CN (1) CN1950516A (zh)
WO (1) WO2005066368A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811943A (zh) * 2009-12-11 2012-12-05 韩国化学研究院 拉曼活性分子位于纳米粒子二聚体的结合部的二聚体核壳纳米粒子、其用途及制备方法
CN107209095A (zh) * 2014-11-28 2017-09-26 奇普凯尔公司 多重珠阵列测定
CN107300629A (zh) * 2017-07-31 2017-10-27 清华大学 扫描探针标定方法
CN109598322A (zh) * 2018-11-08 2019-04-09 首都师范大学 一种利用纳米技术对信息进行加密读写的方法
CN110168346A (zh) * 2016-11-08 2019-08-23 哈佛学院院长及董事 使用merfish、扩展显微术和相关技术进行多重成像
US11788123B2 (en) 2017-05-26 2023-10-17 President And Fellows Of Harvard College Systems and methods for high-throughput image-based screening
US11959075B2 (en) 2014-07-30 2024-04-16 President And Fellows Of Harvard College Systems and methods for determining nucleic acids
CN118335197A (zh) * 2024-06-17 2024-07-12 南方科技大学 一种基于纳米孔测序芯片的dna数据存储方法

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6767731B2 (en) * 2001-08-27 2004-07-27 Intel Corporation Electron induced fluorescent method for nucleic acid sequencing
US7738096B2 (en) 2004-10-21 2010-06-15 University Of Georgia Research Foundation, Inc. Surface enhanced Raman spectroscopy (SERS) systems, substrates, fabrication thereof, and methods of use thereof
US20070072205A1 (en) * 2005-06-09 2007-03-29 Yi Lu Nanomaterial error correction
GB0618514D0 (en) * 2006-09-20 2006-11-01 Univ Nottingham Trent Method of detecting interactions on a microarray using nuclear magnetic resonance
US10191082B1 (en) * 2007-01-30 2019-01-29 Victor B. Kley Carbon nanotube probes and structures and methods of measurement
GB2447679A (en) * 2007-03-21 2008-09-24 Jean Ernest Sohna Sohna Scanning probe microscopy-based polynucleotide sequencing and detection
US20100331195A1 (en) * 2007-10-04 2010-12-30 William Andregg Sequencing Nucleic Acid Polymers with Electron Microscopy
CN101918590B (zh) * 2007-12-10 2013-03-27 高晓莲 核酸测序
WO2011043502A1 (ko) * 2009-10-08 2011-04-14 국립암센터 광감각제 - 금속나노입자 복합물 및 이를 함유하는 광역학 치료 또는 진단을 위한 조성물
KR101381604B1 (ko) * 2010-08-31 2014-04-11 한국전자통신연구원 고분자 박막 및 자기비드를 이용한 바이오 물질 측정방법
US8342406B2 (en) 2010-09-20 2013-01-01 Research In Motion Limited System and method for data transfer through animated barcodes
EP2431912B1 (en) * 2010-09-20 2013-04-03 Research In Motion Limited Method and device for data transfer through animated barcodes
CA2731892A1 (fr) * 2011-02-18 2012-08-18 Universite De Montreal Sondes a diffusion raman a capsule nanometrique, methode de fabrication et utilisation
EP2766498B1 (en) 2011-10-14 2019-06-19 President and Fellows of Harvard College Sequencing by structure assembly
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
US10227639B2 (en) 2011-12-22 2019-03-12 President And Fellows Of Harvard College Compositions and methods for analyte detection
US9914967B2 (en) 2012-06-05 2018-03-13 President And Fellows Of Harvard College Spatial sequencing of nucleic acids using DNA origami probes
EP2971184B1 (en) 2013-03-12 2019-04-17 President and Fellows of Harvard College Method of generating a three-dimensional nucleic acid containing matrix
EP3603679B1 (en) 2013-06-04 2022-08-10 President and Fellows of Harvard College Rna-guided transcriptional regulation
US10179932B2 (en) 2014-07-11 2019-01-15 President And Fellows Of Harvard College Methods for high-throughput labelling and detection of biological features in situ using microscopy
WO2016051272A1 (en) 2014-09-29 2016-04-07 Chipcare Corporation A device for optical detection of cells comprising a cartridge and fluidic chip and methods thereof
EP3303635B1 (en) 2015-06-01 2021-09-01 California Institute of Technology Compositions and methods for screening t cells with antigens for specific populations
EP3371329A4 (en) 2015-11-03 2019-06-19 President and Fellows of Harvard College METHOD AND DEVICE FOR VOLUMETRIC IMAGING OF A THREE-DIMENSIONAL NUCLEIC ACID-CONTAINING MATRIX
CN109415761B (zh) 2016-04-25 2022-09-20 哈佛学院董事及会员团体 用于原位分子检测的杂交链反应方法
WO2017197346A1 (en) * 2016-05-13 2017-11-16 Gas Sensing Technology Corp. Gross mineralogy and petrology using raman spectroscopy
CN109923216B (zh) 2016-08-31 2024-08-02 哈佛学院董事及会员团体 将生物分子的检测组合到使用荧光原位测序的单个试验的方法
GB2570412A (en) 2016-08-31 2019-07-24 Harvard College Methods of generating libraries of nucleic acid sequences for detection via fluorescent in situ sequencing
WO2018081113A1 (en) 2016-10-24 2018-05-03 Sawaya Sterling Concealing information present within nucleic acids
CA3043489A1 (en) 2016-11-21 2018-05-24 Nanostring Technologies, Inc. Chemical compositions and methods of using same
JP6841495B2 (ja) * 2016-12-05 2021-03-10 国立大学法人 鹿児島大学 水生生物の標識方法
JP2020516593A (ja) 2017-04-14 2020-06-11 プレジデント アンド フェローズ オブ ハーバード カレッジ 細胞由来のマイクロフィラメントネットワークの生成方法
EP3794146A1 (en) 2018-05-14 2021-03-24 Nanostring Technologies, Inc. Chemical compositions and methods of using same
SG11202101934SA (en) 2018-07-30 2021-03-30 Readcoor Llc Methods and systems for sample processing or analysis
WO2020076976A1 (en) 2018-10-10 2020-04-16 Readcoor, Inc. Three-dimensional spatial molecular indexing
CN114174499A (zh) * 2019-02-08 2022-03-11 利兰斯坦福初级大学董事会 具有组合基因修饰的工程化细胞的生产和跟踪

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6060237A (en) * 1985-02-26 2000-05-09 Biostar, Inc. Devices and methods for optical detection of nucleic acid hybridization
US6174677B1 (en) 1995-10-13 2001-01-16 Ut-Battelle, Llc Advanced surface-enhanced Raman gene probe systems and methods thereof
US6361944B1 (en) * 1996-07-29 2002-03-26 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US5998175A (en) 1998-07-24 1999-12-07 Lumigen, Inc. Methods of synthesizing and amplifying polynucleotides by ligation of multiple oligomers
WO2000029617A2 (en) 1998-09-24 2000-05-25 Advanced Research And Technology Institute, Inc. Water-soluble luminescent quantum dots and bioconjugates thereof
WO2000056937A2 (en) 1999-03-25 2000-09-28 Hyseq, Inc. Solution-based methods and materials for sequence analysis by hybridization
US7225082B1 (en) 1999-10-01 2007-05-29 Oxonica, Inc. Colloidal rod particles as nanobar codes
DK2295954T3 (en) 1999-10-06 2016-08-15 Becton Dickinson Co Surface-enhanced spectroscopy-active composite nanoparticles
US20030148289A1 (en) 2002-02-04 2003-08-07 Intel Corporation Modified carbon nanotubes as molecular labels with application to DNA sequencing
US7361821B2 (en) * 2002-09-20 2008-04-22 Intel Corporation Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading
CN1682237B (zh) 2002-09-20 2010-05-26 英特尔公司 用于通过使用编码探针检测生物分子的方法和仪器
US20050147963A1 (en) * 2003-12-29 2005-07-07 Intel Corporation Composite organic-inorganic nanoparticles and methods for use thereof

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811943A (zh) * 2009-12-11 2012-12-05 韩国化学研究院 拉曼活性分子位于纳米粒子二聚体的结合部的二聚体核壳纳米粒子、其用途及制备方法
CN102811943B (zh) * 2009-12-11 2015-08-19 韩国化学研究院 以位于粒子间的结合部的拉曼活性分子标记的二聚体核壳纳米结构、其用途及制备方法
US11959075B2 (en) 2014-07-30 2024-04-16 President And Fellows Of Harvard College Systems and methods for determining nucleic acids
US12104151B2 (en) 2014-07-30 2024-10-01 President And Fellows Of Harvard College Systems and methods for determining nucleic acids
CN107209095A (zh) * 2014-11-28 2017-09-26 奇普凯尔公司 多重珠阵列测定
CN110168346A (zh) * 2016-11-08 2019-08-23 哈佛学院院长及董事 使用merfish、扩展显微术和相关技术进行多重成像
US11788123B2 (en) 2017-05-26 2023-10-17 President And Fellows Of Harvard College Systems and methods for high-throughput image-based screening
CN107300629A (zh) * 2017-07-31 2017-10-27 清华大学 扫描探针标定方法
CN107300629B (zh) * 2017-07-31 2019-07-09 清华大学 扫描探针标定方法
CN109598322A (zh) * 2018-11-08 2019-04-09 首都师范大学 一种利用纳米技术对信息进行加密读写的方法
CN109598322B (zh) * 2018-11-08 2021-08-27 首都师范大学 一种利用纳米技术对信息进行加密读写的方法
CN118335197A (zh) * 2024-06-17 2024-07-12 南方科技大学 一种基于纳米孔测序芯片的dna数据存储方法

Also Published As

Publication number Publication date
WO2005066368A2 (en) 2005-07-21
WO2005066368A3 (en) 2005-11-24
JP2007522799A (ja) 2007-08-16
EP1711625A2 (en) 2006-10-18
US7381529B2 (en) 2008-06-03
US20050147981A1 (en) 2005-07-07
KR20060135719A (ko) 2006-12-29

Similar Documents

Publication Publication Date Title
CN1950516A (zh) 用于使用扫描探针显微镜术和纳代码检测核酸的方法和组合物
EP1543152B1 (en) Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (spm) reading
CN1898398B (zh) 测定核苷酸序列信息的方法
CN1856580B (zh) 可设计的分子条码
CA3003082C (en) Microarray fabrication system and method
US7705222B2 (en) Controlled alignment of nano-barcodes encoding specific information for scanning probe microscopy (SPM)
CN1706002B (zh) 用于检测和鉴定分子结构的扫描探针显微图像基于模型的融合
KR20170116157A (ko) 단일분자 검출용 분석 및 그의 용도
US20050147977A1 (en) Methods and compositions for nucleic acid detection and sequence analysis
CN108473933A (zh) 使核酸移位通过纳米孔的方法
US6849397B2 (en) Label-free detection of nucleic acids via surface plasmon resonance
US20110237449A1 (en) Methods and Compositions for Nucleic Acid Purification
JP4771521B2 (ja) 標識された核酸プライマー結合物体、その製造方法、ならびにその用途
JP4651094B2 (ja) 標識されたプローブ結合物体、その製造方法、及びその利用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication