CN113994001A - 基于成像的混合crispr筛选 - Google Patents

基于成像的混合crispr筛选 Download PDF

Info

Publication number
CN113994001A
CN113994001A CN202080043174.XA CN202080043174A CN113994001A CN 113994001 A CN113994001 A CN 113994001A CN 202080043174 A CN202080043174 A CN 202080043174A CN 113994001 A CN113994001 A CN 113994001A
Authority
CN
China
Prior art keywords
determining
cells
phenotype
nucleic acid
genotype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080043174.XA
Other languages
English (en)
Inventor
庄小威
王翀
陆天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Original Assignee
Harvard College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College filed Critical Harvard College
Publication of CN113994001A publication Critical patent/CN113994001A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/52Use of compounds or compositions for colorimetric, spectrophotometric or fluorometric investigation, e.g. use of reagent paper and including single- and multilayer analytical elements
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/12Applications; Uses in screening processes in functional genomics, i.e. for the determination of gene function
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Optics & Photonics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明总体上涉及对细胞成像,例如,用于确定细胞群体中的表型和/或基因型,例如,以构建用于高通量筛选的基因型‑表型对应关系。在一些情况下,可以例如使用CRISPR或其他技术对细胞进行操作。在某些实施方案中,核酸可以例如使用慢病毒引入至所述细胞中。所述核酸可以含有:包含DNA或RNA识别序列的向导部分、报告基因部分、和包含一个或多个读取序列的标识部分。所述向导部分可以用来改变所述细胞的表型,例如,使用可以使用CRISPR或其他技术靶向的序列,例如sgRNA序列,并且在一些情况下,所述细胞的表型可以使用各种成像方式来确定。所述标识部分可以使用MERFISH或其他合适的技术确定。另外,在一些情况下,报告基因和读取序列的确定之间的关联或共定位可以大幅度提高解码精确度,例如,因降低背景信号的错误标识导致。其他方面总体上涉及用于在此类方法中使用的组合物或装置,用于在此类方法中使用的试剂盒,或类似物。

Description

基于成像的混合CRISPR筛选
相关申请
本申请要求Zhuang等人于2019年4月19日提交的题目为“Imaging-Based PooledCRISPR Screening”的美国临时专利申请系列号62/836,578以及Zhuang等人于2019年5月1日提交的题目为“Imaging-Based Pooled CRISPR Screening”的美国临时专利申请系列号62/841,715的权益。这些申请中每个的全部内容通过引用并入本文。
政府资助
本发明利用由美国国立卫生研究院批准的基金号MH113094在政府资助下完成。政府在本发明中拥有某些权利。
技术领域
本发明总体上涉及对细胞成像,例如,用于确定细胞群体的表型和/或基因型。在一些情况下,可以例如使用CRISPR或其他技术对细胞进行操作。
背景技术
基于CRISPR的基因编辑系统的开发已经极大地提高了我们操作基因和通过基因扰动探索细胞功能的基本分子机制的能力。受生成高多样性核酸文库的能力所促进,基于CRISPR的混合文库筛选可以极大地加快发现参与细胞过程的基因。然而,在混合文库筛选中可用的表型基本上限于细胞活力和标志物表达。近年来,将单细胞RNA测序和质谱流式细胞术与CRISPR筛选组合以扩充混合文库筛选可用的表型空间,允许基于单细胞RNA和蛋白质表达谱进行基因筛选。
然而,高通量混合文库筛选仍然无法利用许多重要的细胞表型。这些包括细胞结构的形态和细胞内分子组织,以及它们的动力学,这些仅可以通过诸如高分辨率成像的技术来测量。高内涵成像进一步允许以并行模式对许多分子种类同时测量这些特性——例如,单细胞转录组成像法近年来的进展已经增加了分子表型的数量,在单次实验中在单个细胞中分子表型可以成像至基因组规模。尽管成像有能力获得细胞表型,但基于成像的混合文库筛选仍然具有挑战性,主要是因为在混合文库筛选中难以确定表型已成像的单个细胞的基因型。已经开发了多种方式通过在物理分离具有特定表型的细胞后测序来确定基因型。然而,为了确定全部基因型-表型对应关系,需要基于全部成像的混合文库筛选方式,其中对单个细胞的基因型和表型进行原位成像。
发明内容
本发明总体上涉及对细胞成像,例如,用于确定细胞群体的表型和/或基因型。在一些情况下,可以例如使用CRISPR或其他技术对细胞进行操作。本公开的主题在一些情况下涉及相互关联的产品、特定技术问题的备选解决方案,和/或一个或多个系统和/或物品的多种不同用途。
在一个方面,本发明总体上涉及一种方法。根据一组实施方案,所述方法包括:(a)将DNA引入至多个细胞中,所述DNA包含:包含识别序列的向导部分、报告基因部分和包含读取序列的标识部分;(b)通过确定所述报告基因部分来确定所述多个细胞内由被引入的DNA的所述报告基因部分表达的RNA分子的位置;(c)通过将所述细胞暴露于能够与所述读取序列结合的读出探针来确定在所述多个细胞内由所述引入的包含所述报告基因部分和所述标识部分的DNA表达的所述RNA分子上的读取序列;(d)将所述读出探针的结合与由所述引入的DNA的所述报告基因部分表达的所述RNA分子的位置共定位;(e)使用不同的读取序列反复进行(b)、(c)和(d)多次;和(f)形成与所共定位的读出探针的结合对应的码字,其中所述码字的位数值基于所述读出探针与所述读取序列的结合。
根据另一组实施方案,所述方法包括:将DNA引入至多个细胞中,所述DNA包含:包含识别序列的向导部分、报告基因部分和包含读取序列的标识部分;通过确定所述报告基因部分来确定所述多个细胞内由被引入的DNA的所述报告基因部分表达的RNA分子的位置;通过将所述细胞暴露于各自能够与读取序列结合的多个读出探针来确定在所述多个细胞内的所述读取序列;将所述读出探针的结合与由所述引入的DNA的所述报告基因部分表达的所述RNA分子的位置共定位;以及形成与所共定位的读出探针的结合对应的码字,其中所述码字的位数值基于所述读出探针与所述读取序列的结合。
在又一组实施方案中,所述方法包括:将核酸引入至多个细胞中,其中所述核酸包含:包含识别序列的向导部分、报告基因部分和包含读取序列的标识部分;对所述多个细胞成像,其中所述细胞因表达所述向导部分而表现出可成像的表型差异;以及获取所述多个细胞的多个图像,其中所述细胞图像因所述细胞内所述核酸的标识部分的差异而表现出差异。
在再一组实施方案中,所述方法包括:使用慢病毒将DNA引入至多个细胞中,其中所述DNA包含:包含识别序列的向导部分、报告基因部分和包含读取序列的标识部分;确定所述多个细胞的表型,和确定所述多个细胞的基因型,以及确定所述基因型和所述表型之间的对应关系。
根据再另一组实施方案,所述方法包括:使用慢病毒将DNA引入至多个细胞中,其中所述DNA包含:包含识别序列的向导部分和包含读取序列的标识部分;确定所述多个细胞的表型,确定所述多个细胞的基因型,以及确定基因型和表型之间的对应关系。
在另一个方面,本发明涵盖制备本文所述的一个或多个实施方案的方法。在再另一个方面,本发明涵盖使用本文所述的一个或多个实施方案的方法。
从下面结合附图考虑对本发明的各种非限制性实施方案的详述,本发明的其他优势和新特征将是显而易见的。
附图说明
本发明的非限制性实施方案将借助于实施例参考附图进行描述,所述附图是示意性的,不意在按照比例绘制。在附图中,图示的每个相同或几乎相同的组件一般由单个数字表示。为了清楚起见,每个组件没有必要在每幅图中标记,所示的本发明的每个实施方案的每个组件也没有必要标记,其中举例说明对于允许本领域普通技术人员理解本发明不是必要的。在附图中:
图1A-1F图示了根据本发明的一个实施方案,用于基因型确定的基于成像的条形码检测;
图2A-2D图示了在本发明的另一个实施方案中的条形码错误标识率;
图3A-3E图示了在本发明的另一个实施方案中的慢病毒设计;
图4A-4D图示了在本发明的另一个实施方案中的基于成像的混合CRISPR筛选;
图5A-5C图示了根据本发明的一个实施方案,参与调节的遗传因子;
图6A-6B图示了根据本发明的另一个实施方案,用于抑制转录的某些基因;
图7图示了在本发明的一个实施方案中的用于文库的克隆策略;
图8图示了在本发明的另一个实施方案中的共定位比分析;
图9图示了在本发明的另一个实施方案中的用于文库的克隆策略;
图10A-10D图示了在本发明的一个实施方案中对某些基因的敲低;和
图11图示了在本发明的另一个实施方案中MALAT1核斑点富集的变化。
具体实施方式
本发明总体上涉及对细胞成像,例如,用于确定细胞群体的表型和/或基因型,例如,以构建用于高通量筛选的基因型-表型对应关系。在一些情况下,可以例如使用CRISPR或其他技术对细胞进行操作。在某些实施方案中,核酸可以被引入至所述细胞中,例如,使用慢病毒进行。所述核酸可以包含:包含DNA或RNA识别序列的向导部分、报告基因部分和包含一个或多个读取序列的标识部分。所述向导部分可以用来改变所述细胞的表型,例如,使用可以使用CRISPR或其他技术靶向的序列,例如sgRNA序列,并且在一些情况下,所述细胞的表型可以使用各种成像方式来确定。所述标识部分可以使用MERFISH或其他合适的技术确定。另外,在一些情况下,报告基因和读取序列的确定之间的关联或共定位可以大幅度提高解码精确度,例如,因降低背景信号的错误标识导致。其他方面总体上涉及用于在此类方法中使用的组合物或装置,用于在此类方法中使用的试剂盒,或类似物。
本发明的一个实例方面总体上涉及用于操作细胞的遗传物质(例如,使用CRISPR或其他技术)以及作为所述操作的结果确定所得到的所述细胞的表型的系统和方法。所述细胞的基因型还可以例如,使用编码读取序列的码字来确定,诸如在MERFISH或类似技术中使用的。通过确定所述细胞的基因型被改变和所述细胞的表型如何进行改变,如本文所讨论的某些实施方案可以用于理解复杂的问题,例如关于细胞形态学、亚细胞分子组织等,例如,细胞(诸如哺乳动物细胞)内的空间结构。
现在参照图1A描述本发明的示例性实施方案。在此图中,核酸文库成员可以被引入至细胞中,诸如哺乳动物细胞。在一组实施方案中,核酸包含向导部分(例如,包含sgRNA或可以用来识别靶位点的另一识别序列)、报告基因部分(例如,可以直接或间接产生信号诸如荧光或免疫沉淀信号)、和标识或“条形码”部分(例如,包含可以用来区分彼此包含不同的向导部分的各种核酸的读取序列)。
可以使用各种方法来将核酸引入至细胞中。这些方法包括,例如,病毒递送(例如,使用慢病毒、逆转录病毒、腺病毒、腺相关病毒等),电穿孔,轰击递送等。在一些情况下,慢病毒可以是有用的,因为其允许核酸稳定地整合到细胞的基因组中。另外,在某些实施方案中,核酸导入细胞中的速率可以被控制使得大部分细胞仅含有一种这样的核酸。例如,至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的细胞可以仅具有导入其中的一种这样的核酸。
在该实例中,对于由混合文库生成的慢病毒,每种慢病毒可以包含两个文库成员。在慢病毒感染过程期间,向导部分和标识部分可以重组。这样的重组可以基于对标识部分的测量导致对向导部分的错误标识。因此,在一组实施方案中,向导部分和标识部分可以在慢病毒的3’LTR区中被置于彼此紧邻,即,在聚嘌呤带(PPT)序列后,使得向导部分和标识部分之间的距离最小,例如,对于Cas9的sgRNA的恒定区,为100个碱基或更少。以此方式,可以减小重组率以提高向导部分和标识部分之间的准确关联。在一些情况下,向导部分在前病毒DNA(例如慢病毒的)5’区内复制。这可以使得向导部分被整合到宿主细胞基因组中以提供向导部分的表达。
在引入后,可以研究所述细胞以确定所述细胞的表型和所述细胞的基因型(例如,使用标识部分)。例如,所述表型可以使用检测细胞或细胞的亚区室等中的蛋白、RNA或DNA的成像方式来测量。在某些实施方案中,所述表型还可以与细胞生长、形态或细胞-细胞相互作用相关联。在一些情况下,所述表型可以是时间变化、细胞特性的动力学等。在一些情况下,所述表型可以包括多重特征,即,多维读出。
所述标识部分可以例如使用MERFISH(多重抗误差矫正荧光原位杂交)或其他技术来确定。本领域普通技术人员熟悉MERFISH和相关技术;参见,例如,国际专利申请公开号WO2016/018960,WO 2016/018963,WO 2018/089445,WO 2018/218150,WO 2018/089438。在一些情况下,在相继的一些实施方案中,所述标识部分可以包含可以使用相应的核酸探针(例如,“读出探针”)特异性鉴定的各种“读取序列”或核酸序列。在诸如MERFISH的技术中,读取序列的存在或不存在可以编码为位数数字(digit),读出探针的序列因此可以编码为码字(codeword)。另外,在一些情况下,各种误差检测和/或纠正技术,诸如Hamming代码或Golay代码,可以应用于码字。
在一些情况下,对报告基因部分的确定可以与对标识部分的各个部分的确定(例如,使用一个或多个读出探针)间隔进行。另外,在一些实施方案中,报告基因部分的位置和对标识部分的确定之间的关联或共定位可以用来大幅度提高解码准确度。例如,不与报告基因部分存在的位置充分对应的结合事件或码字可以作为背景噪声、非特异性标记等被忽略。报告基因部分和标识部分之间的这种关联或共定位可以大幅度提高检测准确度。
上面的讨论是可以用来对细胞成像(例如,用于确定细胞群体的表型和/或基因型)的本发明的一个实施方案的非限制性实例。然而,其他实施方案也是可能的。因此,更一般地,本发明的各个方面涉及用于确定细胞群体的表型和/或基因型(例如通过成像)和/或使用CRISPR或其他技术操作所述细胞的各种系统和方法。
根据一个方面,本发明总体上涉及使用成像确定细胞群体的表型和/或基因型的系统和方法。另外,细胞的基因组可以例如,使用CRISPR或其他技术进行操作。在一些情况下,相对大量的细胞可以例如,使用合适的成像技术(诸如本文所述的那些)进行研究以确定它们的表型和基因型,例如,在操作后确定。在一些实施方案中,由于使用此类的成像技术,可以确定相对大量的细胞,允许进行相对大规模或高通量筛选,如本文所讨论的那样。例如,可以确定多个细胞的特定表型(例如,在通过CRISPR编辑后),具有某种或期望表型的细胞也可以通过基因型来确定。
在一些情况下,可以确定相对大量的细胞。例如,取决于放大倍数,单视野可以包含相对大量的细胞(例如,至少10个、至少100个、至少1,000个、至少10,000个、至少100,000个细胞,等等)。另外,样品可以大于单个视野(例如,尤其在相对大的放大倍数下),并且可以人工地或自动地(例如,使用计算机控制)获取样品的不同部分的多个图像。这可以允许通过使用多于一个视野来研究甚至更大量的细胞。例如,至少10个、至少100个、至少1,000个、至少10,000个、至少100,000个、至少1,000,000个、至少10,000,000个细胞,等等。例如,样品的整体图像可以使用多个视野(例如,同时或几乎同时拍摄的视野)来组合以产生图像;例如,可以在不同的视野获取至少2个、至少3个、至少5个、至少7个、至少10个、至少15个、至少20个、至少30个、至少50个、至少75个或至少100个图像(例如,对应于样品的不同部分)以产生整体图像。因此,在一些情况下,所述样品可以基本上大于单个视野。例如,样品可以具有至少约0.01cm2、至少约0.03cm2、至少约0.1cm2、至少约0.3cm2、至少约1cm2、至少约3cm2、或至少约10cm2等的面积。
另外,在一些实施方案中,对于同一视野可以拍摄多个图像。例如,对于同一视野可以获取至少2个、至少3个、至少5个、至少7个、至少10个、至少15个、至少20个、至少30个、至少50个、至少75个或至少100个图像。
在一些情况下,在一组实施方案中,在样品内成像的每个视野处可以拍摄多个图像。在一些实施方案中,可以使用不同的波长。例如,在一些情况下,例如,可以利用不同的照明源采集图像,并且使用不同的滤光器俘获图像以便产生不同颜色的图像,所述不同颜色的图像探测不同荧光化合物的存在。因此,在一些实施方案中,可以在不同的波长拍摄不同的图像,例如,用于以不同的颜色观察图像(例如,红-绿-蓝,红-黄-蓝,青-品红-黄,等等)。
在一些实施方案中,这些图像可以以限定的时间间隔采集以便形成样品的延时图像。这可以是有用的,例如,用来确定随时间变化的特性,例如,细胞的生长。例如,可以在不同的时间点获取一个图像(或多个图像),例如,利用约5秒、约10秒、约15秒、约30秒、约1分钟、约2分钟、约3分钟、约5分钟、约10分钟、约15分钟、约20分钟、约30分钟、约1小时、约2小时、约3小时、约4小时、约1天等的周期。类似地,在一些实施方案中,可以在对同一样品进行不同的处理后采集图像。
此外,在一些实施方案中,可以利用不同的成像模态采集多个图像,例如,超分辨率光学显微术、常规落射荧光显微术、共聚焦显微术等,包括本文所述的那些。在一些情况下,这些图像可以合并,以形成对细胞特性的高内涵光学测量。
所述细胞可以是任意合适的细胞,例如,哺乳动物细胞(例如,人或非人细胞)、细菌细胞(例如,大肠杆菌)、真核细胞、原核细胞、酵母细胞、或其他类型的细胞。所述细胞可以来自任何合适的来源,例如,细胞培养。在一些情况下,所述细胞可以取自组织样品,例如,取自活组织检查、人工生长的或培养的,等等。在一些情况下,所述细胞经过基因改造。在一些情况下,可以分析组织样品。在某些实施方案中,多个细胞可以如本文所讨论的那样被转染,并且确定细胞所得到的表型。
在某些方面,将核酸引入至细胞中,这可以用来修饰细胞的遗传物质,例如,其基因组。诸如CRISPR的技术或其他相关的技术可以用来修饰细胞的遗传材料,例如,如由所述核酸引导。在一些实施方案中,这可以允许准确的标识细胞的基因操作,以及它们的对应表型,使用标识部分来鉴定导致形成所观察到的表型的基因型。
例如,在一组实施方案中,被递送到细胞的核酸可以包括向导部分、和/或报告基因部分、和/或标识部分。所述向导部分可以包含可以用来识别靶位点(例如,在细胞的基因组内)的sgRNA或另一识别序列。所述报告基因部分可以能够直接或间接产生信号,诸如荧光信号。例如,所述报告基因部分可以编码荧光蛋白(例如,GFP)、可以用来使另一分子变成发荧光的酶(例如,萤光素酶)、产生可检测的化学反应物的酶,等等。所述标识部分可以包括可以用来区分包含彼此不同的向导部分的各种核酸的序列。例如,所述标识部分可以包括一个或多个序列(例如,“读取序列”),所述序列可以使用对应的核酸探针(例如,“读出探针”)读取。
向导部分、和/或报告基因部分、和/或标识部分,如果存在的话,可以以任何合适的次序排列在待被引入至细胞中的核酸上。在一些情况下,这些部分可以彼此相对地接近(例如,在所述核酸内,例如,彼此间隔小于5,000个、小于3,000个、小于1,000个、小于500个、小于300个、小于100个、小于50个、小于30个或小于10个碱基的距离)。另外,在一些情况下,例如,在所述核酸内,这些部分中的一个或多个可以至少部分地重叠。此外,在一些实施方案中,其他部分或序列也可以存在于所述核酸内。例如,这些部分中的一个或多个可以包含启动子序列,诸如本文讨论的那些。
在一组实施方案中,所述核酸包括表达部分或向导部分。所述向导部分可以包括任何合适的核酸序列,所述核酸序列怀疑能够改变细胞的表型,和/或可以用来有意地改变或操作细胞的基因组,例如,可以导致可以观察到的细胞的表型改变。例如,所述向导部分可以编码基因、蛋白、调控序列(例如,操纵子、启动子诸如CMV启动子、阻遏物、转录因子结合位点等)、编码非编码RNA(例如,miRNA,siRNA,rRNA,tRNA,lncRNA,snoRNA,snRNA,exRNA,piRNA,tsRNA,rsRNA,shRNA,Cas9引导RNA,sgRNA等)的序列,等等。在一些情况下,所述向导部分可以是包含标识部分的同一核酸的一部分;然而,在其他情况下,所述表达部分可以是不同核酸的一部分。
因此,例如,所述向导部分可以包括识别目的靶区(例如,DNA上(例如,所述细胞的基因组上)的目的靶区)的序列,诸如RNA序列。在一些情况下,所述向导部分还可以包括结合序列,诸如Cas或另一核酸酶能够识别的Cas结合序列。例如,在某些情况下,所述向导部分可以适合于允许对基因组发生CRISPR编辑。例如,所述向导部分可以包括gRNA(向导RNA)或sgRNA(单一向导RNA)。在一些实施方案中,所述sgRNA可以包括crispr RNA部分(crRNA),所述crRNA部分是与靶序列互补的序列(例如,与靶DNA互补),和Cas核酸酶或另一种核酸酶可以识别的tracrRNA部分。在一些情况下,所述crRNA部分可以具有17个、18个、19个或20个核苷酸。可以使用多种多样的不同的Cas核酸酶,诸如Cas9(来自酿脓链球菌(Streptococcus pyogenes))、Cas14、CasX、CasY、Cas12a、Cas13a、Cas13b、Cas13d、Cas14a等。也考虑这些Cas核酸酶的变体形式,例如,高保真度Cas9、eSpCas9、SpCas9-HF1、HypaCas9、FokI-融合的dCas9、xCas9、dCas9等。用于Cas的合适的结合序列的非限制性实例在下文中提供。另外,本领域普通技术人员会知晓CRISPR和相关技术,并且可用于进行CRISPR实验的试剂盒很容易商购获得。
在某些实施方案中,对于向导部分可以存在超过一种的可能性。例如,可以制备核酸文库,例如,具有不同的crRNA部分,例如,用于与基因组中的不同靶序列结合。在某些情况下,对于向导部分存在至少10种、至少102种、至少103种、至少104种、至少105种等的可能性,例如,能够结合基因组内的不同靶位点,和/或能够引起基因组的不同改变或操作等。因此,在某些实施方案中可以使用一个或多个标识部分(诸如本文所述的那些)和一个或多个向导部分来制备多个可区分的核酸。然而,应当理解,可能的标识部分的数目不必等于可能的向导部分的数目,即,可以加入一些冗余度,例如,如下文所讨论的那样。
在一些实施方案中,所述核酸可以包括报告基因部分,所述报告基因部分可以例如,使用荧光或其他检测技术测定。例如,所述报告基因部分可以包含编码荧光蛋白的基因,所述荧光蛋白诸如GFP(绿色荧光蛋白)、来自dsRed的红色荧光蛋白、PAGFP、PSCFP、PSCFP2、Dendra、Dendra2、EosFP、tdEos、mEos2、mEos3、PAmCherry、PAtagRFP、mMaple、mMaple2和mMaple3。其他合适的荧光蛋白是本领域普通技术人员已知的。参见,例如,美国专利号7,838,302或美国专利申请系列号61/979,436,每篇的全部内容都通过引用并入本文。
在另一组实施方案中,所述报告基因部分可以编码可以使另一分子变成有荧光的酶(例如,萤光素酶)。当在细胞内表达时,可以加入合适的底物(例如,萤光素),所述底物当暴露于所述酶时可以转变成荧光形式。然而,在不存在所述核酸的区域中,没有该荧光出现。以此方式,所述核酸可以在细胞中(或在所述细胞的一部分中)被定位或确定位置。
应当理解所述报告基因部分不必仅可通过荧光确定。在其他实施方案中可以使用其他报告基因部分。例如,在一个实施方案中,可以在所述报告基因部分内编码产生可检测到的化学反应物或类似物的酶。可以使用的报告基因的其他实例包括,但不限于,可通过免疫沉淀、免疫荧光等检测到的蛋白。合适的蛋白的非限制性实例包括Myc标签或HA标签。
任何合适的技术可以用来确定所述报告基因部分,且确切的方法可以取决于报告基因的类型。实例包括,但不限于,原位杂交技术诸如smFISH(单分子荧光原位杂交)、多重FISH、CASFISH、或本领域普通技术人员已知的其他技术。在一个实施方案中,smFISH用来定位报告基因部分,例如,在细胞内定位。
此外,如本文所讨论的那样,也可以确定标识部分的位置,并将其与报告基因部分相关联或共定位,这可以例如用来减少背景噪声和/或提高解码精确度。例如,核酸的报告基因部分可以产生第一信号(例如,第一荧光),标识部分可以产生第二信号(例如,第二荧光,所述第二荧光可以与所述第一荧光处于相同或不同的波长),两者彼此可以关联或共定位。
在一些实施方案中,所述核酸可以包括标识部分或核苷酸的“条形码”,它们可以用于将多种核酸彼此区分开。所述标识部分可以存在于所述核酸上的任何合适的位置。例如,在一个实施方案中,所述标识部分可以存在于所述报告基因的3’UTR内。
在一些情况下,其他序列可以存在于所述标识部分中。例如,在一些情况下,所述标识部分可以包括启动子或另一调控序列(例如,操纵子、启动子诸如CMV启动子、阻遏物、转录因子结合位点等)。启动子可以驱动转录。在一些实施方案中,所述标识部分的启动子可以与所述向导部分的启动子相同或不同。
在某些实施方案中可以使用标识部分的文库,例如,含有至少10个、至少102个、至少103个、至少104个、至少105个、至少106个、至少107个、至少108个等的单一序列。所述单一序列可以全部单个地确定(例如,随机地),尽管在一些情况下,所述标识部分可以限定为多个可变部分(或“位(bit)”),例如,按次序。例如,标识部分可以包括至少2个、至少3个、至少5个、至少7个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、或至少50个可变部分。每个可变部分可以包括至少2种、至少3种、至少4种、至少5种、至少7种、至少10种、至少15种、至少20种、至少25种、至少30种、至少40种、至少50种、或更多种可能性。
因此,例如,限定具有22个可变区且每个可变区具有2种唯一可能性的标识部分将限定具有222=4,194,304个成员的标识部分文库。作为另一个非限制性实例,标识部分可以限定具有10个可变区且每个可变区具有7种唯一可能性,从而限定具有710个成员的标识部分文库。应当理解可变部分可以包括任何合适数目的核苷酸,且标识部分内的不同可变部分可以独立地具有相同或不同数目的核苷酸。不同的可变区也可以具有相同或不同的唯一可能性。
例如,可变部分可以限定具有至少2个、至少3个、至少4个、至少5个、至少7个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、或更多个核苷酸的长度,和/或不超过50个、不超过40个、不超过30个、不超过25个、不超过20个、不超过15个、不超过10个、不超过7个、不超过5个、不超过4个、不超过3个、或不超过2个核苷酸的最大长度。这些的组合也是可能的,例如,可变部分可以具有5-50nt或15-25nt等的长度。
每个读出序列位置可以被认为是一个“位”(例如,在本实例中为1或0),尽管应当理解对于每个“位”可能性的数目不一定限于仅为2个,不像在计算机中那样。在其他实施方案中,可以存在3种可能性(即,“三位(trit)”)、4种可能性(即,“四位(quad-bit)”)、5种可能性等,而不是仅有2种可能性。例如,各种三位在下文的实施例中使用。然而,在一些但非全部实施方案中,使用(任何数目的可能性的)位来形成标识部分可以允许在所述标识部分内使用码字、检错码、纠错码等,例如,如本文详细讨论的那样。
在一些情况下,标识部分的可变部分可以连锁在一起产生所述标识部分。然而,在其他情况下,一个或多个可变部分可以隔开,例如,以核苷酸的恒定部分间隔,从而产生所述标识部分。另外,在一些情况下,文库内的一些或所有可能的可变部分可以是唯一的,例如,以尽量减小混淆。任何方法可以用于连锁。例如,多个部分可以使用连接、重叠PCR、寡核苷酸池合成、或本领域普通技术人员已知用于将核酸连接或连锁在一起的其他技术连锁在一起。
在某些实施方案中,产生和/或使用文库的所有成员。然而,在其他实施方案中,不一定产生和/或使用文库的所有成员。例如,在一些实施方案中,例如,为了减少或消除不清楚或非有意性再用,可以使用较小子集的文库,例如,产生和/或使用文库的所有可能成员的小于75%、小于50%、小于40%、小于30%、小于20%、小于10%、小于5%、小于3%、小于2%、小于1%、小于0.5%、小于0.3%或小于0.1%。
在一些实施方案中,可以确定所述细胞的基因型,例如,使用所述标识部分确定。可以使用多种多样的用于确定细胞的基因型的不同技术,例如,FISH、smFISH、MERFISH、原位杂交、多重FISH、CASFISH、或本领域普通技术人员已知的其他技术。在一些实施方案中,这些方式可以涉及与所述标识部分的直接杂交,或与通过所述细胞由该部分生成的分子的直接杂交。在某些情况下,其也可以涉及分开的适配实体的结合,所述适配实体接着与所述标识部分或由该标识部分生成的分子直接结合。技术的其他非限制性实例包括在美国专利申请系列号15/329,683或国际专利申请公开号WO 2016/018960中公开的那些,每个申请的全部内容通过引用并入本文。
在一组实施方案中,对细胞的基因型的确定可以通过确定所述细胞内核酸的标识部分来促进。例如,包含标识部分和向导部分的核酸可以导入到细胞中;所述向导部分可以导致形成如上所讨论的不同表型,例如,通过允许对靶序列发生编辑,例如,在基因组上发生编辑。然而,还重要的是知道核酸被引入到那些细胞中,由此能够理解所观察到的表型(例如,改变的表型)和引起那些表型的基因型之间的关系。如本文所讨论的那样,通过在细胞内确定所述标识部分,可以确定每个细胞内包含的核酸的身份,由此也可以确定特定的向导部分,例如,如果所述核酸包含同一单个核酸上的标识部分和向导部分。
作为非限制性实例,在一组实施方案中,所述细胞可以相继地暴露于核酸探针,所述核酸探针能够与所述标识部分的不同部分结合或与所述细胞由此标识部分表达的分子(诸如RNA)结合,例如,所述核酸探针是包含靶序列(例如,特别是在一些情况下,其能够与所述标识部分的至少一部分结合)和读取序列(例如,其可以以一些方式被“读取”以确定结合)的核酸探针;并且可以确定在所述细胞内所述核酸探针的结合。例如,所述细胞可以暴露于二级核酸探针,所述二级核酸探针可以包含能够与读取序列结合或杂交的识别序列,并且可以包含发信号实体。通过确定图像内的发信号实体(并且在一些情况下,使图像之间的发信号实体失活,并暴露于不同的核酸探针),可以确定细胞的标识部分。
如本文所讨论的那样,多种多样的核酸探针可以用来确定细胞内的一个或多个核酸。所述探针可以包含核酸(或可以与核酸杂交的实体,例如,特异性杂交),诸如DNA、RNA、LNA(锁核酸)、PNA(肽核酸)、或其组合。在一些情况下,其他组分也可以存在于核酸探针内,例如,如下文所讨论的那样。在一些实施方案中,所述核酸探针可以由其他组分形成,例如,蛋白质或其他小分子,或可以代表这些组分与核酸(诸如DNA、RNA、LNA、PNA等)的组合。
核酸探针可以使用任何合适的方法引入至细胞中。在一些情况下,所述细胞可以被充分地透化使得所述核酸探针可以通过使含有所述核酸探针的流体围绕细胞流动而被引入至所述细胞中。在一些情况下,所述细胞可以如固定过程的一部分那样被充分地透化;在其他实施方案中,细胞可以通过暴露于某些化学物质诸如乙醇、甲醇、Triton等而被充分透化。另外,在一些实施方案中,诸如电穿孔或显微注射的技术可以用来将核酸探针引入至细胞中。
对细胞内的核酸的确定可以是定性的和/或定量的。另外,所述确定也可以是空间上的,例如,细胞内核酸的位置可以以二维或三维来确定。在一些实施方案中,可以确定细胞内核酸的位置、数目和/或浓度。
如所提到的那样,在某些实施方案中,报告基因位置和当读取码字时检测读取序列之间的关联或共定位可以大幅度提高解码精确度,例如,因减少对由非特异性标记引入的背景信号的错误标识导致。在一些情况下,例如,码字读出部分可以仅包含用于读出的一个序列,使得读出信号可以更难以鉴别,例如,相对于背景。例如,在某些情况下,所述报告基因部分可以如本文所讨论的那样进行确定,例如,局部地或在空间上,并且标识序列的部分可以如本文所讨论那样进行确定。在一些情况下,不与报告基因部分共定位的标识序列的表观部分可以从进一步的考虑中剔除。例如,所述表观标识序列可以是不正确的信号、背景噪声等。另外,在一些情况下,所述报告基因部分可以在对标识序列的不同次确定之间确定。这样的方式可以提高准确度,例如,减少了因样品的移动、平台偏移等引起的误差。因此,报告基因位置和检测读取序列之间的关联或共定位可以用来确定读取序列的假定信号是读取序列还是背景噪声等(因此不值得进一步考虑)。
应当理解,尽管向导部分和/或标识部分的数目可以具有相对大量的可能性(例如,百万种),这很容易由本领域普通技术人员使用诸如计算机和自动化核酸合成仪器(它们中的许多可以商购获得)的技术以及诸如固相合成和/或等温组装、和/或易错PCR和/或连接或以另外的方式通过例如对多个可变区组合地进行重叠PCR来组装的技术来实现。类似地,相应相对大量的唯一的标识部分可以与向导部分的这样大量的可能性相关联,例如,通过使用相对小量的合适的可变区和可以对每个可变区产生的唯一的“位”。因此,可以制备核酸文库(例如,各自含有标识部分和向导部分),例如,含有至少10个、至少102个、至少103个、至少104个、至少105个、至少106个、至少107个、至少108个唯一的成员。
在某些方面,来自核酸文库的核酸可以被引入至细胞中。任何合适的技术可以用来引入所述核酸。例如,在一组实施方案中,核酸可以使用病毒递送到细胞,所述病毒诸如慢病毒、逆转录病毒、腺病毒或腺相关病毒。在一些情况下,所述病毒可以能够转染或递送所述核酸至细胞的基因组中,并且在一些情况下,稳定地在基因组内。
例如,在一组实施方案中,慢病毒递送系统可以用来将核酸引入至细胞中。慢病毒系统可以允许一定数目的核酸引入到待受控的细胞中。例如,通过控制用于转导的慢病毒的效价,被递送到单个细胞中的文库成员的数目可以控制为1,或多于1。在一些实施方案中,所述向导部分和所述标识部分可以被置于在慢病毒的3’LTR区内彼此紧邻,即,在慢病毒的聚嘌呤带(PPT)序列后,使得向导部分和标识部分之间的距离最小,例如,对于Cas9的sgRNA的恒定区,为100个碱基或更小。在某些实施方案中,所述距离也可以小于500个碱基、小于300个碱基、小于200个碱基、小于100个碱基、小于50个碱基、小于30个碱基、或小于10个碱基。这样的慢病毒构建体可以减少向导部分和标识部分之间的基因组距离。这可以导致重组效应减少,可以允许通过测量所述标识部分更准确地标识所述向导部分。本领域普通技术人员熟悉用于将核酸引入至细胞中的基于慢病毒和其他病毒的递送系统。许多能够使用病毒将核酸这样递送到细胞中的试剂盒可以容易地通过商购获得。
另外,在一些实施方案中,可以使用其他技术将核酸引入至细胞中。例如,所述核酸可以掺入至质粒中,质粒可以被细胞摄取。将核酸引入至细胞中的其他方法包括,但不限于,磷酸钙(例如,磷酸三钙)、电穿孔、细胞挤压、将阳离子脂质与产生脂质体(脂质体与细胞膜融合)的材料混合等。合适的方法的其他非限制性实例包括树状聚物、阳离子聚合物、脂质转染、FuGENE、声穿孔、光学转染、原生质体融合、impalefection、基因枪、磁转染、粒子轰击、病毒感染等。
在某些实施方案中,所述核酸可以被引入或转染至细胞中使得至少50%的细胞在其中仅引入0或1个核酸。在一些情况下,至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%等的细胞可以在其中仅引入0和/或1个核酸。这可以例如,使用诸如上文所述的慢病毒、合适的稀释技术、细胞分选技术,或通过使用其他技术诸如微流体液滴来实现。在其他情况下,经转染的细胞的百分比可以较小,诸如小于50%、小于20%、小于10%、小于1%。在一些实施方案中,其中没有引入这些核酸的细胞可以被移除。细胞移除的非限制性实例包括用化学物质(诸如抗生素)处理,例如,杀死未转染的细胞或防止未转染的细胞分裂。在另一个实例中,不含有引入的核酸的细胞中的一些或全部可以从样品中被移除,例如,使用荧光激活细胞分选和/或其他合适的细胞分选或微流体技术。
在某些实施方案中,标识部分和向导部分可以在单一来源内合并,例如,包含在单一病毒内的核酸。在其他实施方案中,这些部分可以在分开的来源中提供给细胞,例如,两个不同的病毒递送运载体。将核酸引入至细胞的其他实例在本文中公开,并且引入的方法可以相同或不同。
可以确定标识部分和向导部分的合并,无论是在同一或不同的运载体(例如,病毒)上,例如,随机地或确定性地。例如,指定的CRISPR编辑可以分配给指定的条形码,并在细胞内表达。在一些实施方案中,标识部分和向导部分之间的特异性关联可以利用多种技术中的任一种进行测量。例如,PCR可以用来扩增包含所述标识部分和所述向导部分两者的核酸部分,然后可以使用测序方式,包括下一代测序法,通过对此PCR产物的直接测序来鉴定哪个标识区与哪个向导部分出现。本领域普通技术人员知晓可以用来对核酸(例如,含有所述标识部分和所述向导部分)测序的其他技术。任何技术可以用于测序,例如,Sanger测序、高通量测序、下一代测序、纳米孔测序、连接法测序、合成法测序等。本领域普通技术人员知晓用于对核酸测序的不同技术。
在某些方面可以分析细胞以确定它们的表型。在一些情况下,在一些实施方案中,表型可以被改变,例如,通过使用CRISPR或其他技术,例如,可以与细胞的基因组相互作用,如本文所讨论的那样。可以使用任何合适的技术确定表型,例如,使用光学技术,通过分析细胞行为等。具体实例包括,但不限于,显微镜或其他光学技术诸如光学显微镜、荧光显微镜、共聚焦显微镜、近场显微镜、双光子显微镜、或相差显微镜,或本文所述的其他技术。在一些情况下,可以使用超分辨率技术,包括本文所述的那些中的任一个。在一些实施方案中,可以通过其他技术探测表型,诸如原子力显微镜或膜片钳。另外,在一些实施方案中,可以使用蛋白质确定表型。例如,可以使用荧光、免疫荧光等确定蛋白质。具体的非限制性实例包括荧光标记方式诸如荧光蛋白或有机染料。在一些情况下,显微镜和另一技术可以组合使用以确定表型。
可以确定的表型的实例包括,但不限于,细胞的形态(例如,形状、尺寸、视觉外观、细胞器、亚室、状态(例如,细胞周期期间)等)、细胞运动的某些特征(例如,速度、持久性、趋化行为等)、细胞间相互作用的某些特征(例如,细胞-细胞粘附、细胞-细胞回避、细胞-细胞相互作用等)、或某些亚细胞特征(例如蛋白或核酸的位置、蛋白或核酸的扩散、两个或更多个蛋白和/或核酸的结合等)。形态可以包括全细胞形态或亚区室形态。在一个实施方案中,smFISH用来确定细胞的表型。
在一些情况下,所述表型可以动态地确定,例如,细胞中的时间变化。
在某些实施方案中,所述细胞存在于基底上,例如,适合用于培养和/或成像细胞的基底。例如,所述基底可以是玻璃、硅、塑料(例如,聚苯乙烯、聚丙烯、聚碳酸酯等)或类似物。在一些情况下,基底的至少部分可以至少是部分透光的。基底也可以是未受处理的或以某种方式进行处理以促进细胞贴附。
在一些实施方案中,可以确定的表型包括细胞的转录组的全部或至少一部分。可以使用多种多样的技术来确定转录组,包括,但不限于,smFISH、MERFISH、或其他技术诸如本文所述的那些。还参见美国专利申请系列号15/329,683或国际专利申请公开号WO 2016/018960,每篇的全部内容均通过引用并入本文。在一些情况下,转录组可以在一个或多个细胞内在空间上确定。
另外,在一些情况下,可以确定的表型包括细胞的染色体的全部或至少一部分,和/或可以与细胞的染色体结合或以另外的方式缔合的作用剂诸如蛋白或RNA。例如,染色体和/或其他缔合的作用剂的浓度、空间位置、活性、缔合作用等可以根据本发明的某些实施方案确定。在一些情况下,染色体可以在一个或多个细胞内在空间上确定。可以用来确定染色体的技术的非限制性实例包括多重DNA FISH或CASFISH。作为另一个实例,可以确定细胞的表观遗传修饰。
另外,在一些情况下,可以确定的表型包括细胞的蛋白质组的全部或至少一部分。可以使用多种多样的技术来确定蛋白质组,包括抗体标记、顺序抗体标记、多重抗体成像、或其他多重蛋白成像技术。例如,可以确定蛋白和/或其他缔合的作用剂的浓度、空间位置、活性、缔合作用等。
在某些实施方案中,可以确定细胞内的一个或多个标志物以确定表型。例如,所述标志物可以指示某种细胞蛋白、核酸、形态特征等,或所述标志物可以指示细胞行为。另外,所述标志物可以是在一些情况下可以视觉确定的标志物。例如,所述标志物可以是发荧光的,或可以改变所述细胞内另一荧光实体的荧光(例如,通过增强或淬灭)。在一些实施方案中,所述标志物还可以是染料或可以改变颜色。因此,可以确定图像中细胞间的强度、波长、频率、位置、分布等的差异以确定所述细胞的表型。在一些情况下,也可以使用确定标志物的其他方法;例如,所述标志物可以是放射性的。许多这样的标志物可以商购获得。
此外,应当理解这些测量不互斥。这些测量的任意组合可以在单一样品中进行。而且,在一些实施方案中这样的测量可以重复,例如,对于同一样品。例如,所述测量可以重复以确保正确性或减少潜在的误差(例如,测量误差),或在暴露于各种刺激或条件后重复所述测量,诸如用不同的营养源、小分子或可以与细胞相互作用的其他合适的作用剂处理。
在一些情况下,可以通过应用向导部分改变细胞的表型,例如,如上面所讨论的那样,所述向导部分可以以某种形式被所述细胞表达以改变其表型。例如,可以使用向导部分来诱导细胞的基因组的改变,例如,通过CRISPR或其他合适的技术,包括本文所述的那些。作为另一实例,可以向细胞加入编码蛋白的向导部分,所述细胞可以表达所述蛋白。如果在不同的细胞中编码不同的蛋白,则所述细胞可以表现出不同的表型,所述表型可以如上文所述确定。因此,例如,多个细胞可以被转染或以另外地方式被引入多个不同的向导部分,然后研究所述细胞以确定所述不同的向导部分对它们的表型的作用。
因此,某些方面总体上涉及被引入至细胞(或其他样品)中的核酸探针。所述探针可以包含可以与核酸(例如,靶位点)杂交的多种多样实体中的任一个,典型地通过Watson-Crick碱基配对,诸如DNA、RNA、LNA、PNA等,取决于应用。核酸探针典型地包含能够与靶标的至少一部分(例如,靶位点)结合的靶序列。在一些情况下,结合可以是特异性结合(例如,通过互补结合)。当引入至细胞或其他系统中时,所述靶序列可以能够与特异的靶标(例如,mRNA,或其他核酸,如本文所讨论的)结合。所述核酸探针还可以包含一个或多个读取序列,如下文所讨论的那样。
在一些情况下,可以将超过一种类型的核酸探针应用到样品,例如,相继地或同时地。例如,可以将至少2个、至少5个、至少10个、至少25个、至少50个、至少75个、至少100个、至少300个、至少1,000个、至少3,000个、至少10,000个或至少30,000个可区分的核酸探针应用于样品。在一些情况下,可以相继地加入所述核酸探针。然而,在一些情况下,可以同时加入超过一个核酸探针。
所述核酸探针可以包括一个或多个靶序列,所述靶序列可以定位在所述核酸探针内的任意位置。所述靶序列可以包含与靶标的一部分基本上互补的区域,所述靶标例如是靶核酸。例如,在一些情况下,所述部分可以是至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补,例如,以产生特异性结合。典型地,基于Watson-Crick核苷酸碱基配对确定互补性。
在一些情况下,所述靶序列的长度可以为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个、或至少450个核苷酸。在一些情况下,所述靶序列的长度可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个、或不超过10个核苷酸。这些的任意组合也是可能的,例如,所述靶序列可以具有10-30个核苷酸、20-40个核苷酸、5-50个核苷酸、10-200个核苷酸、或25-35个核苷酸、10-300个核苷酸等的长度。
核酸探针的靶序列可以参照怀疑存在于细胞或其他样品中的靶标来确定。例如,蛋白的靶核酸可以使用蛋白的序列来确定,例如,通过确定表达形成所述蛋白的核酸。在一些情况下,仅使用编码所述蛋白的核酸的一部分,例如,具有如上面所讨论的长度。另外,在一些情况下,可以使用超过一个可以用来鉴定特定靶标的靶序列。例如,可以使用多个探针,相继地和/或同时地,它们可以与同一靶标的相同或不同区域结合或杂交。杂交典型地是指退火过程,通过该退火过程互补的单链核酸通过Watson-Crick核苷酸碱基配对(例如,氢键键合、鸟嘌呤-胞嘧啶和腺嘌呤-胸腺嘧啶)缔合以形成双链核酸。
在一些实施方案中,核酸探针还可以包含一个或多个“读取”序列,如前所述。所述读取序列可以用来鉴定所述核酸探针,例如,通过与发信号实体缔合,如下所述。在一些实施方案中,所述核酸探针可以包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或更多个、20个或更多个、24个或更多个、32个或更多个、40个或更多个、48或更多个、50个或更多个、64个或更多个、75个或更多个、100个或更多个、128个或更多个读取序列。所述读取序列可以定位在核酸探针内的任何位置。如果存在超过一个读取序列,所述读取序列可以彼此紧邻定位,和/或间隔以其他序列。
所述读取序列可以具有任何长度。如果使用超过一个读取序列,则所述读取序列可以独立地具有相同或不同的长度。例如,所述读取序列的长度可以为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个、或至少450个核苷酸。在一些情况下,所述读取序列的长度可以是不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个、或不超过10个核苷酸。这些的任意组合也是可能的,例如,所述读取序列可以具有10-30个核苷酸、20-40个核苷酸、5-50个核苷酸、10-200个核苷酸、或25-35个核苷酸、10-300个核苷酸等的长度。
在一些实施方案中,所述读取序列可以是任意的或随机的。在某些情况下,可以选择所述读取序列以便减少或尽量减小与细胞或其他样品的其他组分的同源性,例如,使得所述读取序列本身不与怀疑在所述细胞或其他样品内的其他核酸结合或杂交。在一些情况下,同源性可以为小于10%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、或小于1%。在一些情况下,可以存在小于20个碱基对、小于18个碱基对、小于15个碱基对、小于14个碱基对、小于13个碱基对、小于12个碱基对、小于11个碱基对、或小于10个碱基对的同源性。在一些情况下,这样的碱基对是连续的。
在一组实施方案中,一组核酸探针可以包含特定数目的读取序列,在一些情况下,该数目可以小于所述核酸探针的靶标数目。本领域普通技术人员将知晓如果存在一个发信号实体和n个读取序列,则一般可以唯一地识别2n-1个不同的核酸靶标。然而,不需要使用所有可能的组合。例如,一组核酸探针可以靶向12个不同的核酸序列,然而包含不超过8个读取序列。作为另一个实例,一组核酸可以靶向140个不同的核酸种类,然而包含不超过16个读取序列。不同的核酸序列靶标可以通过使用每个探针内读取序列的不同组合来单独地鉴定。例如,每个探针可以包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个等或更多个读取序列。在一些情况下,一组核酸探针可以各自包含相同数目的读取序列,尽管在其他情况下,在各种探针上可以存在不同数目的读取序列。
作为非限制性实例,第一个核酸探针可以包含第一靶序列、第一读取序列和第二读取序列,而第二个不同的核酸探针可以包含第二靶序列、相同的第一读取序列、但第三读取序列代替所述第二读取序列。由此这样的探针可以通过确定存在的各种读取序列或与给定的探针或位置相关的各种读取序列来区分,如本文所讨论的那样。例如,所述探针可以使用“码字”连续地标识和编码,如下面所讨论的那样。任选地,码字还可以接受误差检测和/或纠正。
另外,在某些实施方案中,一组核酸探针(和它们在编码的探针上对应的互补位点)可以使用4个天然核苷酸碱基中的仅2个或仅3个制备,诸如在该组探针内不考虑所有“G”或不考虑所有“C”。在某些实施方案中缺少“G”或“C”的序列可以形成非常少的二级结构,并且可以促进更均一、更快速的杂交。因此,在一些情况下,所述核酸探针可以仅包含A、T和G;仅A、T和C;仅A、C和G;或仅T、C和G。
在一个方面,所述核酸探针上的读取序列可以能够与初级扩增核酸上的对应识别序列结合(例如,特异性结合)。因此,当核酸探针识别生物样品内的靶标(例如,DNA或RNA靶标)时,所述初级扩增核酸也能够与所述靶标经由所述核酸探针利用所述核酸探针的读取序列和所述初级扩增核酸上的对应识别序列之间的相互作用(例如,互补结合)而缔合。例如,所述识别序列可以能够识别靶读取序列,但基本上不识别或结合其他非靶读取序列。所述初级扩增核酸还可以包含能够与核酸杂交的多种实体中的任一种,例如,DNA、RNA、LNA、和/或PNA等,取决于应用。例如,这些实体可以形成所述识别序列中的一些或全部。因此,所述识别序列可以识别核酸序列,诸如DNA或RNA。
在一些情况下,所述识别序列可以与所述靶读取序列基本上互补。在一些情况下,所述序列可以至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补。典型地,基于Watson-Crick核苷酸碱基配对确定互补性。所述靶读取序列的结构可以包括前面所述的那些。
在一些情况下,所述识别序列的长度可以为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个、或至少450个核苷酸。在一些情况下,所述识别序列的长度可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个、或不超过10个核苷酸。这些中任一个的组合也是可能的,例如,所述识别序列可以具有10-30个核苷酸、20-40个核苷酸、5-50个核苷酸、10-200个核苷酸、或25-35个核苷酸、10-300个核苷酸等的长度。
在一些实施方案中,初级扩增核酸还可以包含一个或多个能够结合二级扩增核酸的读取序列,如下所述。例如,初级扩增核酸可以包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或更多个、20个或更多个、32个或更多个、40个或更多个、50个或更多个、64个或更多个、75个或更多个、100个或更多个、128个或更多个读取序列。所述读取序列可以定位在初级扩增核酸内的任何位置。如果存在多于一个读取序列,则所述读取序列可以彼此紧邻定位,和/或间隔以其他序列。在一个实施方案中,所述初级扩增核酸包含第一末端处的识别序列和第二末端处的多个读取序列。
在一些情况下,所述初级扩增核酸内的读取序列的长度可以为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个、或至少450个核苷酸。在一些情况下,所述读取序列的长度可以为不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个、或不超过10个核苷酸。这些中任一个的组合也是可能的,例如,所述读取序列可以具有10-20个核苷酸、10-30个核苷酸、20-40个核苷酸、5-50个核苷酸、10-200个核苷酸、或25-35个核苷酸、10-300个核苷酸等的长度。
在初级扩增核酸内可以存在任意数目的读取序列。例如,在初级扩增核酸内可以存在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或更多个读取序列。如果在初级扩增核酸内存在多于一个读取序列,则所述读取序列可以是相同的或不同的。在一些情况下,例如,所述读取序列可以全部相同。
在一些实施方案中,一组初级扩增核酸可以使用4个天然核苷酸碱基中的仅2个或仅3个制备,诸如在该组核酸内不考虑所有“G”或不考虑所有“C”。在某些实施方案中,缺少“G”或“C”的序列可以形成非常少的二级结构,并且可以促进更均一、更快速的杂交。因此,在一些情况下,所述初级扩增核酸可以仅包含A、T和G;仅A、T和C;仅A、C和G;或仅T、C和G。
在一些情况下,可以将超过一种类型的初级扩增核酸应用到样品,例如,相继地或同时地。例如,可以将至少2个、至少5个、至少10个、至少25个、至少50个、至少75个、至少100个、至少300个、至少1,000个、至少3,000个、至少10,000个或至少30,000个可区分的初级扩增核酸应用于样品。在一些情况下,可以相继地加入所述初级扩增核酸。然而,在一些情况下,可以同时加入超过一个初级扩增核酸。
在一组实施方案中,所述初级扩增核酸上的读取序列可以能够与二级扩增核酸上的对应识别序列结合(例如,特异性结合)。因此,当核酸探针识别生物样品内的靶标(例如,DNA或RNA靶标)时,所述二级扩增核酸也能够与所述靶标经由所述初级扩增核酸利用所述初级扩增核酸的读取序列和所述二级扩增核酸上的对应识别序列之间的相互作用(例如,互补结合)而缔合。例如,所述二级扩增核酸上的识别序列可以能够识别初级扩增核酸上的读取序列,但基本上不识别或结合其他非靶读取序列。所述二级扩增核酸还可以包含能够与核酸杂交的多种实体中的任一种,例如,DNA、RNA、LNA、和/或PNA等,取决于应用。例如,这些实体可以形成所述识别序列中的一些或全部。
在一些情况下,所述二级扩增核酸上的识别序列可以与初级扩增核酸上的读取序列基本上互补。在一些情况下,所述序列可以至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补。
在一些情况下,所述二级扩增核酸上的识别序列的长度可以为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个、或至少450个核苷酸。在一些情况下,所述识别序列的长度可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个、或不超过10个核苷酸。这些中任一个的组合也是可能的,例如,所述识别序列可以具有10-30个核苷酸、20-40个核苷酸、5-50个核苷酸、10-200个核苷酸、或25-35个核苷酸、10-300个核苷酸等的长度。
在一些实施方案中,二级扩增核酸还可以包含一个或多个能够结合发信号实体的读取序列,如本文所讨论的那样。例如,二级扩增核酸可以包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或更多个、20个或更多个、32个或更多个、40个或更多个、50个或更多个、64个或更多个、75个或更多个、100个或更多个、128个或更多个能够结合发信号实体的读取序列。所述读取序列可以定位在二级扩增核酸内的任何位置。如果存在多于一个读取序列,则所述读取序列可以彼此紧邻定位,和/或间隔以其他序列。在一个实施方案中,所述二级扩增核酸包含第一末端处的识别序列和第二末端处的多个读取序列。此结构还可以与初级扩增核酸的结构相同或不同。
在一些情况下,所述二级扩增核酸内的读取序列的长度可以为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个、或至少450个核苷酸。在一些情况下,所述读取序列的长度可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个、或不超过10个核苷酸。这些中任一个的组合也是可能的,例如,所述二级扩增核酸内的所述读取序列可以具有10-20个核苷酸、10-30个核苷酸、20-40个核苷酸、5-50个核苷酸、10-200个核苷酸、或25-35个核苷酸、10-300个核苷酸等的长度。
在二级扩增核酸内可以存在任意数目的读取序列。例如,在二级扩增核酸内可以存在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或更多个读取序列。如果在二级扩增核酸内存在多于一个读取序列,则所述读取序列可以是相同的或不同的。在一些情况下,例如,所述读取序列可以全部相同。另外,在初级扩增核酸和二级扩增核酸中可以独立地具有相同或不同的数目的读取序列。
该组二级扩增核酸可以使用4个天然核苷酸碱基中的仅2个或仅3个制备,在某些实施方案中,诸如在该组核酸内不考虑所有“G”或不考虑所有“C”。在某些实施方案中,缺少“G”或“C”的序列可以形成非常少的二级结构,并且可以促进更均一、更快速的杂交。因此,在一些情况下,所述二级扩增核酸可以仅包含A、T和G;仅A、T和C;仅A、C和G;或仅T、C和G。
在一些情况下,可以将超过一种类型的二级扩增核酸应用到样品,例如,相继地或同时地。例如,可以将至少2个、至少5个、至少10个、至少25个、至少50个、至少75个、至少100个、至少300个、至少1,000个、至少3,000个、至少10,000个或至少30,000个可区分的二级扩增核酸应用于样品。在一些情况下,可以相继地加入所述二级扩增核酸。然而,在一些情况下,可以同时加入超过一个二级扩增核酸。
另外,在某些实施方案中,此模式可以在发信号实体前重复,例如,利用三级扩增核酸、四级核酸等,类似于上面的讨论。因此所述发信号实体可以与最后的扩增核酸结合。因此,作为非限制性实例,编码核酸探针可以与靶标结合,初级扩增核酸与编码核酸探针结合,二级扩增核酸与初级扩增核酸结合,三级扩增核酸与二级扩增核酸结合,发信号实体与三级扩增核酸结合,或编码核酸探针可以与靶标结合,初级扩增核酸与编码核酸探针结合,二级扩增核酸与初级扩增核酸结合,三级扩增核酸与二级扩增核酸结合,四级扩增核酸与三级扩增核酸结合,发信号实体与四级扩增核酸结合等。因此,在所有的实施方案中,最后的扩增核酸不需要一定是二级扩增核酸。
在一些方面,细胞可以被固定化或固定到基底,例如,在确定基因型之前,如下所讨论的那样。在一些情况下,所述细胞的固定化或固定可以在确定表型之后进行。根据某些实施方案这可以是有用的,例如,用于将图像内细胞的表型与后续细胞的基因型(例如,如下文所讨论确定的)相关联。在一些实施方案中,所述细胞还可以在测量表型之前固定,而不是在测量表型之后和测量基因型之前固定。
本领域普通技术人员知晓用于在基底上固定细胞或以其他的方式固定化细胞的系统和方法。作为非限制性实例,细胞可以使用化学物质诸如甲醛、多聚甲醛、戊二醛、乙醇、甲醇、丙酮、乙酸等固定。在一个实施方案中,细胞可以使用Hepes-谷氨酸缓冲液介导的有机溶剂(HOPE)固定。还参见美国专利申请系列号62/419,033,该申请的全部内容通过引用并入本文。
本发明的某些方面涉及测定样品,所述样品可以包括细胞培养物、细胞悬液、生物组织、活组织检查、生物体等。在一些情况下所述样品还可以是无细胞的但包含核酸。如果样品包含细胞,则所述细胞可以是人细胞,或任何其他合适的细胞,例如,哺乳动物细胞、鱼细胞、昆虫细胞、植物细胞等。在一些情况下可以存在多于一种的细胞。
在样品内,待测定的靶标可以包括核酸、蛋白质等。待测定的核酸可以包括,例如,DNA(例如,基因组DNA)、RNA、或存在于细胞(或其他样品)内的其他核酸。所述核酸可以是所述细胞内源的,或可以加入到所述细胞中。例如,所述核酸可以是病毒的核酸,或是人工建立的。在一些情况下,待测定的核酸可以是由所述细胞表达的。在一些实施方案中,所述核酸是RNA。所述RNA可以是编码的和/或非编码的RNA。例如,所述RNA可以编码蛋白。可以在细胞内研究的RNA的非限制性实例包括mRNA、siRNA、rRNA、miRNA、tRNA、lncRNA、snoRNA、snRNA、exRNA、piRNA等。
在一些情况下,可以研究细胞内的大部分核酸。例如,在一些情况下,可以测定细胞内存在的足够的RNA以便产生所述细胞的部分或全部的转录组。在一些情况下,测定细胞内的至少4种类型的mRNA,在一些情况下,在细胞内可以测定至少3种、至少4种、至少7种、至少8种、至少12种、至少14种、至少15种、至少16种、至少22种、至少30种、至少31种、至少32种、至少50种、至少63种、至少64种、至少72种、至少75种、至少100种、至少127种、至少128种、至少140种、至少255种、至少256种、至少500种、至少1,000种、至少1,500种、至少2,000种、至少2,500种、至少3,000种、至少4,000种、至少5,000种、至少7,500种、至少10,000种、至少12,000种、至少15,000种、至少20,000种、至少25,000种、至少30,000种、至少40,000种、至少50,000种、至少75,000种、或至少100,000种类型的mRNA。
在一些情况下,可以测定细胞的转录组。应当理解所述转录组一般涵盖在细胞内产生的所有RNA分子,不只是mRNA。因此,例如,在某些情况下,所述转录组还可以包括rRNA、tRNA、siRNA等。在一些实施方案中,可以测定细胞转录组的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%。
在一些实施方案中,待测定的其他靶标可以包括与核酸、蛋白等连接的靶标。例如,在一组实施方案中,能够识别靶标的结合实体可以缀合到核酸探针。所述结合实体可以是可以识别靶标(例如,特异性或非特异性识别)的任意实体。非限制性实例包括酶、抗体、受体、互补核酸链、适配体等。例如,可以使用寡核苷酸连接的抗体来测定靶标。所述靶标可以结合到寡核苷酸连接的抗体,并且如本文所讨论的那样测定寡核苷酸。
细胞或其他样品内的靶标诸如核酸的测定可以是定性的和/或定量的。另外,所述测定也可以是空间上的,例如,细胞或其他样品内核酸或其他靶标的位置可以通过二维或三维测定。在一些实施方案中,可以测定细胞或其他样品内核酸或其他靶标的位置、数目和/或浓度。
在一些情况下,可以测定细胞的大部分基因组。测定的基因组区段可以是基因组上连续的或间断的。例如,在一些情况下,测定细胞内的至少4个基因组区段,在一些情况下,可以测定细胞内至少3个、至少4个、至少7个、至少8个、至少12个、至少14个、至少15个、至少16个、至少22个、至少30个、至少31个、至少32个、至少50个、至少63个、至少64个、至少72个、至少75个、至少100个、至少127个、至少128个、至少140个、至少255个、至少256个、至少500个、至少1,000个、至少1,500个、至少2,000个、至少2,500个、至少3,000个、至少4,000个、至少5,000个、至少7,500个、至少10,000个、至少12,000个、至少15,000个、至少20,000个、至少25,000个、至少30,000个、至少40,000个、至少50,000个、至少75,000个、或至少100,000个基因组区段。
在一些情况下,可以测定细胞的整个基因组,应当理解基因组一般涵盖细胞内产生的所有DNA分子,不只是染色体DNA。因此,例如,在一些情况下,例如,除了(或代替)染色体DNA以外,基因组还可以包括线粒体DNA、叶绿体DNA、质粒DNA等。在一些实施方案中,可以测定细胞的基因组的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或100%。
如本文所讨论的那样,根据某些方面,可以使用多种多样的核酸探针来测定细胞或其他样品内的一个或多个靶标。所述探针可以包含核酸(或可以与核酸杂交的实体,例如,特异性杂交的实体),诸如DNA、RNA、LNA(锁核酸)、PNA(肽核酸)、和/或它们的组合。在一些情况下,其他的组分也可以存在于核酸探针内,例如,如本文所讨论的那样。另外,可以使用任何合适的方法来将核酸探针引入至细胞中。
其他组分也可以存在于核酸探针内或也存在于扩增核酸内。例如,在一组实施方案中,可以存在一个或多个引物序列,例如,以促进酶扩增。本领域普通技术人员知晓适合于诸如扩增的应用(例如,使用PCR或其他合适的技术)的引物序列。许多此类引物序列可商购获得。可以存在于初级核酸探针内的序列的其他实例包括,但不限于启动子序列、操纵子、标识序列、无义序列等。
典型地,引物是单链或部分双链的核酸(例如,DNA),引物充当核酸合成的起始点,允许聚合酶诸如核酸聚合酶将引物延伸并复制互补链。引物(例如,被设计为)与靶核酸互补并杂交。在一些实施方案中,引物是合成引物。在一些实施方案中,引物是非天然引物。引物典型的具有10-50个核苷酸的长度。例如,引物可以具有10-40、10-30、10-20、25-50、15-40、15-30、20-50、20-40、或20-30个核苷酸的长度。在一些实施方案中,引物的长度为18-24个核苷酸。
在一些实施方案中,一个或多个发信号实体可以与二级扩增核酸(或其他最后的扩增核酸)上的识别实体结合。发信号实体的非限制实例包括发荧光实体(荧光团)或发磷光实体,例如,如下面所讨论的那样。然后可以确定所述发信号实体,例如,以确定所述核酸探针或所靶标。在一些情况下,所述确定可以是空间上的,例如,二维地或三维地。另外,在一些情况下,所述确定可以是定量的,例如,可以测定发信号实体和/或靶标的量或浓度。
在一组实施方案中,所述发信号实体可以附接到二级扩增核酸(或其他最后的扩增核酸)。所述发信号实体可以在所述二级扩增核酸与样品内的靶标缔合之前或之后附接到所述二级扩增核酸(或其他最后的扩增核酸)。例如,所述发信号实体可以初始地或在二级扩增核酸已经施加到样品后与所述二级扩增核酸附接。在一些情况下,加入发信号实体,然后所述发信号实体反应从而将其附接到扩增核酸。
在一组实施方案中,发信号实体可以通过键附接到核苷酸序列,所述键可以被裂解以释放所述发信号实体。例如,在确定样品内核酸探针的分布后,所述发信号实体可以被释放或被失活,然后是另一轮核酸探针和/或扩增核酸。因此,在一些实施方案中,所述键可以是可裂解的键,诸如二硫键或光可裂解键。光可裂解键的实例在本文中详细讨论。在一些情况下,这样的键可以被裂解,例如,在暴露于还原剂或光(例如,紫外光)后。其他的细节见下文。在本文中更详细地讨论了用于使发信号实体失活和/或移除发信号实体的系统和方法的其他实例。
在某些实施方案中,初级和二级扩增核酸的使用提示存在最大数目的可以与指定的核酸探针结合的发信号实体。例如,可以存在最大数目的能够与核酸探针结合的初级扩增核酸,例如,原因在于能够与有限数目的初级扩增核酸结合的二级扩增核酸的最大数目和/或因能够与核酸探针上有限数目的读取序列结合的初级扩增核酸的最大数目。尽管每个潜在位置不需要实际上被发信号实体填满,但这种结构提示发信号实体存在饱和限度,超出该饱和限度,可能碰巧存在的任意其他发信号实体不能与核酸探针或其靶标缔合。
因此,本发明的某些实施方案总体上涉及扩增指示核酸探针或其靶标的信号的系统和方法,所述信号是可饱和的,即,使得可以与所述核酸探针或其靶标缔合的发信号实体数量存在饱和上限。典型地,该数目大于1。例如,发信号实体的上限可以为至少2、至少3、至少5、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、至少400、至少500等。在一些情况下,该上限可以小于500、小于400、小于300、小于250、小于200、小于175、小于150、小于125、小于100、小于75、小于50、小于40、小于30、小于25、小于20、小于15、小于10、小于5等。在一些情况下,该上限可以确定为可以与二级扩增核酸结合的发信号实体的最大数目,乘以可以与初级扩增核酸结合的二级扩增核酸的最大数目,乘以可以结合与靶标结合的核酸探针的初级扩增核酸的最大数目。相反,诸如滚环扩增或发夹展开(hairpin unfolding)的技术允许以不受控制的方式扩增信号,即,当存在足够的试剂时,扩增可以继续进行,没有预定的终点或饱和限。因此,这样的技术对于可以与核酸探针或其靶标缔合的发信号实体的数目没有理论上的上限。
然而,应当理解,与核酸探针或其靶标结合的发信号实体的平均数目实际上不一定与其上限相同,即,所述发信号实体可以实际上不处于全饱和(尽管它们可以全饱和)。例如,饱和量(或结合的发信号实体的数目,相对于可以结合的最大数目)可以为小于97%、小于95%、小于90%、小于85%、小于80%、小于75%等,和/或至少50%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%等。在一些情况下,允许更多的时间来发生结合和/或增加试剂的浓度可以增加饱和量。
因为实际上结合核酸探针或其靶标的发信号实体的数目有潜在的上限,因此与不受控制的扩增相反,样品内分布的结合事件,例如,空间上分布,可以基本上呈现均一的尺寸和/或亮度,诸如上面所讨论的那些。例如,因可以结合初级扩增核酸的二级扩增核酸的特定数目,发现所述二级扩增核酸不能超过距核酸探针或其靶标的固定距离,这可以限制来自所述发信号实体的荧光(指示结合)的“束斑大小”或直径。
在某些实施方案中,至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%的结合事件可以表现出基本上相同的亮度、大小(例如,视直径)、颜色等,这可以使得更容易地将结合事件与其他事件区分开,所述其他事件诸如非特异性结合等。
另外,如前所述,本发明的某些方面使用编码各种结合事件的代码空间,并且任选地可以使用误差检测和/或误差纠正来确定核酸探针与它们的靶标的结合。在一些情况下,一组核酸探针可以包含可以结合某些扩增核酸的某些“读取序列”,如本文所讨论的那样,并且可以使用与所述扩增核酸缔合的发信号实体在样品内确定所述核酸探针或靶标的位置,例如,在某些代码空间内,例如,如本文所讨论的那样。还参见国际专利申请公开号WO2016/018960和WO 2016/018963,它们的全部内容各自通过引用合并入本文。如提到的那样,在一些情况下,所述核酸探针内的一组读取序列可以以各种组合组合在一起,例如,使得可以使用相对小数目的读取序列来确定相对大量的不同核酸探针,如本文所讨论的那样。
因此,在一些情况下,一组核酸探针可以各自包含特定数目的读取序列,所述读取序列中的一些在不同的核酸探针之间是共用的,使得全组的核酸探针可以包含特定数目的读取序列。一组核酸探针可以具有任何合适数目的读取序列。例如,一组核酸探针可以具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个等的读取序列。在一些实施方案中,超过20个也是可能的。另外,在一些情况下,一组核酸探针可以总共存在有1或更多个、2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、7或更多个、8或更多个、9或更多个、10或更多个、11或更多个、12或更多个、13或更多个、14或更多个、15或更多个、16或更多个、20或更多个、24或更多个、32或更多个、40或更多个、50或更多个、60或更多个、64或更多个、100或更多个、128或更多个等的可能的读取序列,尽管探针中的一些或全部可以各自包含超过一个读取序列,如本文所讨论的那样。另外,在一些实施方案中,一组核酸探针可以存在有不超过100个、不超过80个、不超过64个、不超过60个、不超过50个、不超过40个、不超过32个、不超过24个、不超过20个、不超过16个、不超过15个、不超过14个、不超过13个、不超过12个、不超过11个、不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个、或不超过2个读取序列存在。这些中的任一个的组合也是可能的,例如,一组核酸探针可以包含总共10-15个读取序列。
作为从包含在核酸探针内的相对小量的读取序列组合地鉴定相对大量的核酸探针的方式的非限制性实例,在一组6种不同类型的核酸探针中,每种类型核酸探针包含一个或多个读取序列,该组内读取序列的总数可以不大于4。应当理解,尽管在此实例中使用4个读取序列以便于解释,然而在其他实施方案中,可以实现较大数目的核酸探针,例如,使用5个、8个、10个、16个、32个等或更多个读取序列,或本文所述的任何其他合适数目的读取序列,取决于应用。例如,如果每个核酸探针包含两个不同的读取序列,则通过使用4个这样的读取序列(A、B、C和D),可以单独地鉴定出至多6个探针。应当注意在此实例中,核酸探针上读取序列的排序不是至关重要的,即,“AB”和“BA”可以被当做是同义的(尽管在其他实施方案中,读取序列的排序可以是至关重要的,且“AB”和“BA”可以不一定是同义的)。类似地,如果在一组核酸探针中使用5个读取序列(A、B、C、D和E),可以单独地鉴定出至多10个探针(例如,AB、AC、AD、AE、BC、BD、BE、CD、CE、DE)。例如,本领域普通技术人员将理解,对于在每个探针上有n个读取序列的一组中的k个读取序列,可以产生至多
Figure BDA0003406624250000361
个不同的探针,假设读取序列的排序不重要;因为不是全部探针序列需要具有相同数目的读取序列,并且在每个实施方案中不一定使用读取序列的全部组合,在某些实施方案中还可以使用大于或小于此数目的不同探针。另外,还应当理解,在一些实施方案中,每个探针上读取序列的数目不一定相同。例如,一些探针可以包含2个读取序列,而其他探针可以包含3个读取序列。
在一些方面,样品内的读取序列和/或核酸探针的结合模式可以用来定义检错码和/或纠错码,例如,以减少或防止核酸的错误标识或误差。因此,例如,如果指示有结合(例如,如使用发信号实体确定),则该位置可以用“1”标识;相反,如果指示没有结合,则该位置可以用“0”标识(或在一些情况下,反之亦然)。然后,多轮结合测定(例如,使用不同的核酸探针)可以用来建立“码字”,例如,对于该空间位置。在一些实施方案中,所述码字可以接受误差检测和/或纠正。例如,所述码字可以被组织配置成,使得对于指定组的读取序列或指定的核酸探针的结合模式,如果没有发现匹配,则所述匹配可以被标识为误差,以及,任选地,可以向序列施加纠错以确定用于该核酸探针的正确靶标。在一些情况下,所述码字可以具有较少的“字母”或位置,即,被所述码字编码的核酸的总数,例如其中每个码字编码不同的核酸。
这样的检错码和/或纠错码可以采取各种各样的形式。在其他领域诸如电信工业中以前已经开发了各种各样的此类代码,诸如Golay代码或Hamming代码。在一组实施方案中,所述读取序列或核酸探针的结合模式被分配,以使得并非每一个可能的组合被分配。
例如,如果可能有4个读取序列且核酸探针包含2个读取序列,则可以鉴定出至多6个核酸探针;但使用的核酸探针的数目可以小于6。类似地,对于在每个核酸探针上有n个读取序列的一组中的k个读取序列,可以产生
Figure BDA0003406624250000371
个不同的探针,但使用的核酸探针的数目可以是大于或小于
Figure BDA0003406624250000372
的任何数目。另外,这些可以被随机地分配,或以特定的方式分配以增加检测和/或纠正误差的能力。
作为另一实例,如果使用多轮核酸探针,则轮次可以任意地选择。如果在每轮中,每个靶标可以得出两个可能的结局,诸如被检测到或没有被检测到,对于n轮探针可能有2n个不同的靶标,但实际上使用的靶标的数目可以是小于2n的任何数目。例如,如果在每轮中,每个靶标可以得出超过两个可能的结局,诸如在不同的彩色信号通道中被检测到,则对于n轮探针可能有超过2n个(例如,3n,4n,…)不同的靶标。在一些情况下,实际使用的靶标的数目可以是小于此数的任意数目。另外,这些可以随机地分配,或以特定的方式分配以增加检测和/或纠正误差的能力。
所述码字可以用来定义各种代码空间。例如,在一组实施方案中,所述码字或核酸探针可以在代码空间内被分配使得所述分配间隔以Hamming距离,以指定的模式测量错误“读数”的数目,所述错误“读数”导致所述核酸探针被错误解释为不同的有效核酸探针。在某些情况下,Hamming距离可以为至少2、至少3、至少4、至少5、至少6等。另外,在一组实施方案中,所述分配可以形成为Hamming代码,例如,Hamming(7,4)代码、Hamming(15,11)代码、Hamming(31,26)代码、Hamming(63,57)代码、Hamming(127,120)代码等。在另一组实施方案中,所述分配可以形成SECDED代码,例如,SECDED(8,4)代码、SECDED(16,4)代码、SCEDED(16,11)代码、SCEDED(22,16)代码、SCEDED(39,32)代码、SCEDED(72,64)代码等。在再另一组实施方案中,所述分配可以形成扩展二进制Golay代码,最佳二进制Golay代码,或三进制Golay代码。在另一组实施方案中,所述分配可以代表由上面所述的任一代码获取的可能数值的子集。
例如,检错码可以通过将使用的码字的数目限于可能的码字的总数的小于10%、小于5%、小于2%、小于1%、小于0.1%、小于0.01%、小于0.001%来形成,使得不正确的码字不可能作为另一个使用的码字存在。因此,任何检测到的与所使用的码字不匹配的码字更可能是不正确的。
例如,纠错码可以通过仅使用二进制字来形成,所述二进制字包含固定或恒定数目的“1”位(或“0”位)来编码靶标。例如,所述代码空间可以仅包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个等的“1”位(或“0”位),例如,全部代码具有相同数目的“1”位或“0”位等。在另一组实施方案中,所述分配可以代表由上面所述的代码获取的可能数值的子集以解决不对称读出误差的问题。例如,在一些情况下,其中“1”位的数目可以对所有使用的二进制码字固定的代码可以消除当将“0”位测量为“1”或将“1”位测量为“0”的比率不同时对具有不同数目的“1”的码字的测量偏差。
因此,在一些实施方案中,一旦确定了码字(例如,如本文所讨论的那样),可以将所述码字与已知的核酸码字比较。如果发现有匹配,则可以识别或确定核酸靶标。如果没有发现匹配,则可以识别在读取码字中的误差。在一些情况下,也可以应用误差纠正以确定正确的码字,因此获得核酸靶标的正确身份。在一些情况下,可以选择码字使得假设仅存在一个误差,仅可获得一个可能的正确码字,因此核酸靶标可能仅有一个正确的身份。在一些情况下,这还可以推广到较大的码字空间或Hamming距离;例如,可以选择码字使得如果存在2个、3个或4个误差(或在一些情况下更多个误差),仅可获得一个可能的正确码字,因此,核酸靶标可能仅有一个正确身份。
纠错码可以是二进制纠错码,或其可以基于其他编号体系,例如,三进制或四进制纠错码。例如,在一组实施方案中,可以使用超过一种类型的发信号实体并将其分配为纠错码内的不同数字。因此,作为非限制性实例,第一发信号实体(或在一些情况下超过一个发信号实体)可以分配为“1”,第二发信号实体(或在一些情况下超过一个发信号实体)可以分配为“2”(“0”表示没有发信号实体存在),并且分配所述码字以定义三进制纠错码。类似地,第三发信号实体可以另外地分配为“3”以形成三进制纠错码,等等。此类代码的非限制性实例包括Reed-Solomon纠删码和其泛化形式。
另外,在一些实施方案中,所述代码还可以通过对所有可能的码字的子集的随机选择来选择。例如,可以选择长度为n个代码的二进制码字的随机子集。在一些情况下,这些码字可以间隔以Hamming距离,即,必须被翻转从而将一个转变为另一个使得所使用的一些码字保持一些误差稳健性或纠错能力的位的数目。在一些实施方案中,可以使用诸如下一代测序的方式来测量所使用的码字的随机子集并且可以对满足这些特性所要求的约束的码字选择性地应用误差稳健性和误差纠正。
如本文所讨论的那样,在某些方面,确定发信号实体,例如,通过成像,以确定核酸探针和/或形成码字。发信号实体的实例包括本文所讨论的那些。在一些情况下,样品内的发信号实体可以,例如,在空间上,使用各种各样的技术进行测定。在一些实施方案中,所述发信号实体可以是发荧光的,并且用于测定样品内的荧光的技术,诸如荧光显微术或共聚焦显微术,可以用来在空间上标识细胞内的发信号实体的位置。在一些情况下,样品内实体的位置可以以二维或甚至三维地确定。另外,在一些实施方案中,超过一个发信号实体可以一次性地(例如,具有不同颜色或发射的发信号实体)测定,和/或相继地测定。
另外,在一些实施方案中,可以确定靶标(例如,核酸靶标)的置信水平。例如,所述置信水平可以使用精确匹配的数目与具有一个或多个一位误差的匹配的数目的比率来确定。在一些情况下,可以使用仅具有大于特定值的置信比的匹配。例如,在某些实施方案中,仅仅匹配的置信比大于约0.01、大于约0.03、大于约0.05、大于约0.1、大于约0.3、大于约0.5、大于约1、大于约3、大于约5、大于约10、大于约30、大于约50、大于约100、大于约300、大于约500、大于约1000、或任何其他合适的值,所述匹配才可以接受。另外,在一些实施方案中,仅仅靶标的置信比大于内标或假阳性对照约0.01、约0.03、约0.05、约0.1、约0.3、约0.5、约1、约3、约5、约10、约30、约50、约100、约300、约500、约1000、或任何其他合适的值,匹配才可以接受。
在一些实施方案中,实体(因此,可以与所述实体缔合的核酸探针)的空间位置可以以相对高的分辨率来确定。例如,所述位置可以以高于约100微米、高于约30微米、高于约10微米、高于约3微米、高于约1微米、高于约800nm、高于约600nm、高于约500nm、高于约400nm、高于约300nm、高于约200nm、高于约100nm、高于约90nm、高于约80nm、高于约70nm、高于约60nm、高于约50nm、高于约40nm、高于约30nm、高于约20nm、或高于约10nm等的空间分辨率确定。
有各种各样的技术能够通过光学确定实体的空间位置或对实体的空间位置成像,例如,使用荧光显微术。在一些实施方案中,可以使用超过一种颜色。在一些情况下,空间位置可以以超分辨率确定,或以高于光的波长或衍射极限的分辨率确定。非限制性实例包括STORM(随机光学重建显微术)、STED(受激发射损耗显微术)、NSOM(近场扫描光学显微术),4Pi显微术、SIM(结构光照明显微术)、SMI(空间调制光照明)显微术、RESOLFT(可逆饱和光学线性荧光跃迁显微术)、GSD(基态损耗显微术)、SSIM(饱和结构光照明显微术)、SPDM(光谱精密距离显微术)、光激活定位显微术(PALM)、荧光光激活定位显微术(FPALM)、LIMON(3D光显微纳米显微术)、超分辨率光学波动成像(SOFI)等。参见,例如,Zhuang等人的美国专利号7,838,302,2010年11月23日授权,题目为“Sub-Diffraction Limit Image Resolutionand Other Imaging Techniques”;Zhuang等人的美国专利号8,564,792,2013年10月22日授权,题目为“Sub-diffraction Limit Image Resolution in Three Dimensions”;或Zhuang等人的国际专利申请公开号WO 2013/090360,2013年6月20日公开,题目为“HighResolution Dual-Objective Microscopy”,这些专利的全部内容各自通过引用并入本文。
作为说明性非限制性实例,在一组实施方案中,样品可以利用高数值孔径、具有100X放大倍数的油浸物镜和在电子倍增CCD照相机上采集的光进行成像。在另一个实施例中,所述样品可以利用高数值孔径、具有40X放大倍数的油浸透镜和采用广域科学级CMOS照相机采集的光成像。采用不同组合的物镜和照相机,在各种非限制性实施方案中,单个视野可以对应于不小于40x40微米、80x80微米、120x120微米、240x240微米、340x340微米、或500x500微米等。类似地,在一些实施方案中,单个照相机像素可以对应于样品的不小于80x80nm、120x120nm、160x160nm、240x240nm、或300x300nm等的区域。在另一个实施例中,所述样品可以利用低数值孔径、具有10X放大倍数的空气透镜和利用sCMOS照相机采集的光成像。在其他的实施方案中,所述样品可以通过单个或多个扫描衍射极限焦点对其照明进行光学切片,所述单个或多个扫描衍射极限焦点通过扫描反射镜或转盘生成并穿过单个或多个针孔收集。在另一个实施方案中,所述样品还可以通过薄片光照明,所述薄片光通过本领域专业技术人员已知的多种方法中的任一种生成。
在一个实施方案中,所述样品可以通过单高斯模式激光谱线照明。在一些实施方案中,照明光谱可以通过使这些激光谱线通过多模光纤平面化,所述多模光纤通过压电或其他机械装置振动。在一些实施方案中,照明光谱可以通过使单模式高斯光束穿过各种各样的折射光束成形器平面化,所述折射光束成形器诸如piShaper或一系列堆叠式鲍威尔棱镜。在又另一组实施方案中,所述高斯光束可以穿过各种各样的不同的扩散元件,诸如毛玻璃或工程散射片,在一些情况下,所述扩散元件可以高速旋转以去除残留的激光散斑。在又另一实施方案中,激光照明光可以穿过一系列微透镜阵列以产生近似平面照明场的照明光的重叠图像。
在一些实施方案中,可以确定所述实体的空间位置的矩心。例如,发信号实体的矩心可以在图像或一系列图像内使用本领域普通技术人员已知的图像分析算法来确定。在一些情况下,可以选择所述算法以测定样品中不重叠的单一发射体和/或部分重叠的单一发射体。合适的技术的非限制性实例包括最大似然算法、最小二乘算法、贝叶斯算法、压缩感知算法等。在一些情况下,也可以使用这些技术的组合。
另外,在一些情况下,所述发信号实体可以被失活。例如,在一些实施方案中,可以向样品施加可以与发信号实体缔合(例如,使用扩增核酸)的第一二级核酸探针,所述第一二级核酸探针可以识别第一读取序列(例如,在所述核酸探针上),然后可以在向所述样品施加第二二级核酸探针前将所述发信号实体失活,例如,所述第二二级核酸探针可以与发信号实体缔合(例如,使用扩增核酸)。如果使用多个发信号实体,则可以使用相同或不同的技术来使所述发信号实体失活,并且多个发信号实体中的一些或全部可以被失活,例如,相继地或同时地。
可以通过移除发信号实体(例如,从样品或从核酸探针等中移除),和/或通过以某种方式化学地改变所述发信号实体(例如,通过光漂白所述发信号实体,漂白或化学地改变所述发信号实体的结构,例如,通过还原等)导致失活。例如,在一组实施方案中,荧光发信号实体可以通过化学或光学技术失活,所述技术诸如氧化、光漂白、化学漂白、严格洗涤或酶消化或通过暴露于酶发生反应、从其他组分(例如,探针)解离所述发信号实体、发信号实体的化学反应(例如,与能够改变所述发信号实体的结构的反应物的化学反应)等。例如,漂白可以通过暴露于氧、还原剂发生,或所述发信号实体可以从所述核酸探针化学裂解(例如,使用三(2-羧乙基)膦)并通过流体流洗掉。
在一些实施方案中,各种核酸探针(包括初级和/或二级核酸探针)可以与一个或多个发信号实体缔合,例如,使用扩增核酸,如本文所讨论的那样。如果使用超过一种核酸探针,则所述发信号实体各自可以相同或不同。在某些实施方案中,发信号实体是能够发射光的任何实体。例如,在一个实施方案中,所述发信号实体是发荧光的。在其他实施方案中,所述发信号实体可以是发磷光的、放射性的、吸收性的等。在一些情况下,所述发信号实体是可以在样品内以相对高的分辨率确定的任意实体,例如,以高于可见光的波长或衍射极限的分辨率。所述发信号实体可以是,例如,染料、小分子、肽或蛋白质等。在一些情况下,所述发信号实体可以是单个分子。如果使用多个二级核酸探针,则所述核酸探针可以与相同或不同的发信号实体缔合或包含相同或不同的发信号实体。
发信号实体的非限制性实例包括发荧光实体(荧光团)或发磷光实体,例如,菁类染料(例如,Cy2,Cy3,Cy3B,Cy5,Cy5.5,Cy7等),Alexa Fluor染料,Atto染料,光可转换染料,光活化染料,荧光染料,金属纳米粒子,半导体纳米粒子或“量子点”,荧光蛋白诸如GFP(绿色荧光蛋白),或光活化荧光蛋白,诸如PAGFP,PSCFP,PSCFP2,Dendra,Dendra2,EosFP,tdEos,mEos2,mEos3,PAmCherry,PAtagRFP,mMaple,mMaple2,和mMaple3。其他合适的发信号实体是本领域普通技术人员已知的。参见,例如,美国专利号7,838,302或国际专利申请公开号WO 2015/160690,每篇的全部内容通过引用并入本文。
在一组实施方案中,所述发信号实体可以通过键连接到寡核苷酸序列,所述键可以被裂解以释放所述发信号实体。在一组实施方案中,荧光团可以通过可裂解键缀合到寡核苷酸,所述可裂解键诸如光可裂解键。光可裂解键的非限制性实例包括,但不限于,1-(2-硝基苯基)乙基,2-硝基苄基,生物素亚磷酰胺,丙烯酸亚磷酰胺,二乙氨基香豆素,1-(4,5-二甲氧基-2-硝基苯基)乙基,环十二烷基(二甲氧基-2-硝基苯基)乙基,4-氨基甲基-3-硝基苄基,(4-硝基-3-(1-氯羰基氧基乙基)苯基)甲基-S-乙酰基硫代酸酯,(4-硝基-3-(1-氯羰基氧基乙基)苯基)甲基-3-(2-吡啶基二硫代丙酸)酯,3-(4,4’-二甲氧基三甲基)-1-(2-硝基苯基)-丙烷-1,3-二醇-[2-氰乙基-(N,N-二异丙基)]-亚磷酰胺,1-[2-硝基-5-(6-三氟乙酰基己酰胺基甲基)苯基]-乙基-[2-氰基-乙基-(N,N-二异丙基)]-亚磷酰胺,1-[2-硝基-5-(6-(4,4'-二甲氧基三甲基氧基)丁酰胺基甲基)苯基]-乙基-[2-氰乙基-(N,N-二异丙基)]-亚磷酰胺,1-[2-硝基-5-(6-(N-(4,4'-二甲氧基三甲基))-生物素酰胺基己酰基-甲基)苯基]-乙基-[2-氰乙基-(N,N-二异丙基)]-亚磷酰胺,或类似的接头。寡核苷酸序列可以是,例如,初级或二级(或其他)扩增核酸,诸如本文所讨论的那些。
在另一组实施方案中,荧光团可以通过二硫键缀合到寡核苷酸。二硫键可以被多种还原剂裂解,所述还原剂诸如,但不限于,二硫苏糖醇,二硫赤藓糖醇,β-巯基乙醇,硼氢化钠,硫氧还蛋白,谷氧还蛋白,胰蛋白酶原,肼,二异丁基氢化铝,草酸,甲酸,抗坏血酸,亚磷酸,氯化锡,谷胱甘肽,巯基乙酸盐,2,3-二巯基丙醇,2-巯基乙胺,2-氨基乙醇,三(2-羧乙基)膦,二(2-巯基乙基)砜,N,N’-二甲基-N,N’-二(巯基乙酰基)肼,3-巯基丙酸盐,二甲基甲酰胺,硫代丙基-琼脂糖,三-正丁基膦,半胱氨酸,硫酸铁,亚硫酸钠,亚磷酸盐,次磷酸盐,硫代磷酸酯,等等,和/或这些中任一个的组合。所述寡核苷酸序列可以是,例如,初级或二级(或其他)扩增核酸,诸如本文所讨论的那些。
在另一个实施方案中,荧光团可以通过一个或多个硫代磷酸酯修饰的核苷酸(其中硫修饰代替桥氧和/或非桥氧)缀合到寡核苷酸。在某些实施方案中,荧光团可以通过添加化合物从所述寡核苷酸裂解,所述化合物诸如但不限于碘乙醇、混合于乙醇中的碘、硝酸银、或氯化汞。在又另一组实施方案中,所述发信号实体可以通过还原或氧化被化学灭活。例如,在一个实施方案中,发色团诸如Cy5或Cy7可以使用硼氢化钠还原到稳定的不发荧光的状态。还在另一组实施方案中,荧光团可以通过偶氮键缀合到寡核苷酸,偶氮键可以利用2-[(2-N-芳基氨基)苯基偶氮]吡啶裂解。在又另一组实施方案中,荧光团可以通过合适的核酸区段缀合到寡核苷酸,所述核酸区段可以在适当地暴露于DNA酶时被裂解,所述DNA酶例如脱氧核糖核酸外切酶或脱氧核糖核酸内切酶。实例包括,但不限于,脱氧核糖核酸酶I或脱氧核糖核酸酶II。在一组实施方案中,所述裂解可以通过限制性核酸内切酶发生。潜在合适的限制性核酸内切酶的非限制性实例包括BamHI、BsrI、NotI、XmaI、PspAI、DpnI、MboI、MnlI、Eco57I、Ksp632I、DraIII、AhaII、SmaI、MluI、HpaI、ApaI、BclI、BstEII、TaqI,EcoRI,SacI、HindII、HaeII、DraII、Tsp509I、Sau3AI、PacI等。超过3000种限制性酶已经进行了详细研究,且这些中的超过600种可商购获得。在又另一组实施方案中,荧光团可以缀合到生物素,且寡核苷酸缀合到抗生物素蛋白或链霉亲和素。生物素和抗生物素蛋白或链霉亲和素之间的相互作用允许荧光团缀合到寡核苷酸,在充分暴露于过量的添加物时,游离的生物素可以“竞争胜过”所述连接,由此导致裂解发生。另外,在另一组实施方案中,所述探针可以使用对应的“toe-hold-探针”被移除,所述“toe-hold-探针”包含与探针相同的序列,以及额外数目的与所编码的探针同源的碱基(例如,1-20个额外碱基,例如,5个额外碱基)。这些探针可以通过链置换相互作用移除标记的读出探针。寡核苷酸序列可以是,例如,初级或二级(或其他)扩增核酸,诸如本文所讨论的那些。
如本文所用,术语“光”一般是指具有任意合适的波长(或等效地,频率)的电磁辐射。例如,在一些实施方案中,光可以包括处于光学或可见范围的波长(例如,具有约400nm-约700nm的波长,即,“可见光”)、红外波长(例如,具有约300微米-700nm的波长)、紫外波长(例如,具有约400nm-约10nm的波长)等。在某些情况下,如下面详细讨论的那样,可以使用超过一种实体,即,在化学上不同或独特的实体,例如,结构上不同或独特的实体。然而,在其他情况下,所述实体可以是化学上相同的或至少基本上化学上相同的。
在一组实施方案中,所述发信号实体是“可转换的”,即,所述实体可以在两个或更多个状态之间转换,所述状态中的至少一个发射具有期望波长的光。在其他的一个或多个状态下,所述实体可以不发射光,或发射不同波长的光。例如,实体可以被“活化”至能够产生具有期望波长的光的第一状态,并“失活”为不能够发射相同波长的光的第二状态。如果实体可以被合适波长的入射光活化,则该实体是“光可活化的”。作为非限制性实例,Cy5可以以受控和可逆的方式通过不同波长的光在发荧光和暗态之间转换,即,633nm(或642nm、647nm、656nm)红光可以将Cy5转换或失活至稳定的暗态,而405nm绿光可以将Cy5转换或激活回到发荧光状态。在一些情况下,所述实体可以可逆地在两个或多个状态之间转换,例如,在暴露于适宜的刺激物时。例如,第一刺激物(例如,第一波长的光)可以用来激活可转换实体,而第二刺激物(例如,第二波长的光)可以用来将所述可转换实体失活,例如,失活至非发射状态。可以使用任何合适的方法来激活所述实体。例如,在一个实施方案中,可以使用合适波长的入射光来激活所述实体以发射光,即,所述实体是“光可转换的”。因此,所述光可转换实体可以通过例如,不同波长的入射光在不同的光发射或非发射状态之间转换。所述光可以是单色的(例如,使用激光产生)或多色的。在另一个实施方案中,所述实体可以在被电场和/或磁场刺激后活化。在其他实施方案中,所述实体可以在暴露于合适的化学环境后被激活,例如,通过调节pH,或诱导涉及该实体的可逆化学反应等。类似地,可以使用任何合适的方法来失活实体,活化和失活实体的方法不必相同。例如,实体可以在暴露于合适波长的入射光后被失活,或所述实体可以通过放置充分的时间而被失活。
典型地,“可转换的”实体可以由本领域普通技术人员如下鉴定:通过确定处于第一状态的实体当暴露于激发波长时可以发射光的条件,将所述实体从第一状态转换到第二状态,例如,在暴露于转换波长的光后,然后显示该实体在处于所述第二状态的情况下当暴露于激发波长时可以不再发射光(或发射强度减小很多的光)。
在一组实施方案中,如讨论的那样,可转换实体可以在暴露于光后进行转换。在一些情况下,用来激活可转换实体的光可以来自外部来源,例如,光源诸如激光光源、最接近所述可转换实体的另一光发射实体等。在一些情况下,第二光发射实体可以是发荧光实体,且在某些实施方案中,所述第二光发射实体本身也可以是可转换实体。
在一些实施方案中,所述可转换实体包括第一光发射部分(例如,荧光团)、和活化或“转换”第一部分的第二部分。例如,在暴露于光后,所述可转换实体的第二部分可以活化第一部分,导致所述第一部分发射光。活化剂部分的实例包括,但不限于,Alexa Fluor 405(Invitrogen),Alexa Fluor 488(Invitrogen),Cy2(GE Healthcare),Cy3(GEHealthcare),Cy3B(GE Healthcare),Cy3.5(GE Healthcare),或其他合适的染料。光发射部分的实例包括,但不限于,Cy5,Cy5.5(GE Healthcare),Cy7(GE Healthcare),AlexaFluor 647(Invitrogen),Alexa Fluor 680(Invitrogen),Alexa Fluor 700(Invitrogen),Alexa Fluor 750(Invitrogen),Alexa Fluor 790(Invitrogen),DiD,DiR,YOYO-3(Invitrogen),YO-PRO-3(Invitrogen),TOT-3(Invitrogen),TO-PRO-3(Invitrogen)或其他合适的染料。这些可以连接在一起,例如,共价连接,例如,直接连接,或通过接头,例如,形成化合物,所述化合物诸如,但不限于,Cy5-Alexa Fluor 405,Cy5-Alexa Fluor 488,Cy5-Cy2,Cy5-Cy3,Cy5-Cy3.5,Cy5.5-Alexa Fluor 405,Cy5.5-AlexaFluor 488,Cy5.5-Cy2,Cy5.5-Cy3,Cy5.5-Cy3.5,Cy7-Alexa Fluor 405,Cy7-Alexa Fluor488,Cy7-Cy2,Cy7-Cy3,Cy7-Cy3.5,Alexa Fluor 647-Alexa Fluor 405,Alexa Fluor647-Alexa Fluor 488,Alexa Fluor 647-Cy2,Alexa Fluor 647-Cy3,Alexa Fluor 647-Cy3.5,Alexa Fluor 750-Alexa Fluor 405,Alexa Fluor 750-Alexa Fluor 488,AlexaFluor 750-Cy2,Alexa Fluor 750-Cy3,或Alexa Fluor 750-Cy3.5。本领域普通技术人员知晓这些和其他化合物的结构,它们中的许多可商购获得。所述部分可以通过共价键连接,或通过接头连接,所述接头诸如下文中详细描述的那些。其他光发射或活化剂部分可以包括具有两个通过聚次甲基链连接的季铵氮原子的部分,其中每个氮独立地是杂芳族部分的一部分,所述杂芳族部分诸如吡咯、咪唑、噻唑、吡啶、喹啉、吲哚、苯并噻唑等,或非芳族胺的一部分。在一些情况下,在两个氮原子之间可以存在5个、6个、7个、8个、9个、或更多个碳原子。
在某些情况下,所述光发射部分和活化剂部分,当彼此分离时,可以各自是荧光团,即,当暴露于刺激(例如,激发波长)时可以发射特定的发射波长的光的实体。然而,当形成包含第一荧光团和第二荧光团的可转换实体时,所述第一荧光团形成第一光发射部分,第二荧光团形成活化剂部分,所述活化剂部分响应于刺激活化或“转换”所述第一部分。例如,所述可转换实体可以包含与第二荧光团直接键接的第一荧光团,或第一或第二实体可以通过接头或共用实体连接。一对光发射部分和活化剂部分是否产生合适的可转换实体可以通过本领域普通技术人员已知的方法测试。例如,各种波长的光可以用来刺激所述对,且可以测量来自所述光发射部分的发射光以确定该对是否形成合适的转换。
作为非限制性实例,Cy3和Cy5可以连接在一起形成这样的实体。在此实例中,Cy3是能够活化Cy5(光发射部分)的活化剂部分。因此,处于或接近所述实体的活化或第二部分的最大吸收的光(例如,对于Cy3,接近532nm光)可以使该部分能够活化第一光发射部分,由此使所述第一部分发射光(例如,对于Cy5,接近647nm)。参见,例如,美国专利号7,838,302,该专利的全部内容通过引用并入本文。在一些情况下,所述第一光发射部分可以后续通过任何合适的技术失活(例如,通过将647nm红光引向该分子的Cy5部分)。
潜在合适的活化剂部分的其他非限制性实例包括1,5IAEDANS,1,8-ANS,4-甲基伞形酮,5-羧基-2,7-二氯荧光素,5-羧基荧光素(5-FAM),5-羧基萘荧光素,5-羧基四甲基罗丹明(5-TAMRA),5-FAM(5-羧基荧光素),5-HAT(羟色胺),5-羟色胺(HAT),5-ROX(羧基-X-罗丹明),5-TAMRA(5-羧基四甲基罗丹明),6-羧基罗丹明6G,6-CR 6G,6-JOE,7-氨基-4-甲基香豆素,7-氨基放线菌素D(7-AAD),7-羟基-4-甲基香豆素,9-氨基-6-氯-2-甲氧基吖啶,ABQ,酸性品红,ACMA(9-氨基-6-氯-2-甲氧基吖啶),吖啶橙,吖啶红,吖啶黄,吖啶黄素,吖啶黄素Feulgen SITSA,Alexa Fluor 350,Alexa Fluor 405,Alexa Fluor 430,AlexaFluor 488,Alexa Fluor 500,Alexa Fluor 514,Alexa Fluor 532,Alexa Fluor 546,Alexa Fluor 555,Alexa Fluor 568,Alexa Fluor 594,Alexa Fluor 610,Alexa Fluor633,Alexa Fluor 635,茜素氨羧络合剂,茜红素,AMC,AMCA-S,AMCA(氨基甲基香豆素),AMCA-X,氨基放线菌素D,氨基香豆素,氨基甲基香豆素(AMCA),苯胺蓝,Anthrocylstearate,APTRA-BTC,APTS,碱性红(Astrazon Brilliant Red)4G,碱性橙R,碱性红6B,碱性黄7GLL,阿的平(Atabrine),ATTO 390,ATTO 425,ATTO 465,ATTO 488,ATTO 495,ATTO520,ATTO 532,ATTO 550,ATTO 565,ATTO 590,ATTO 594,ATTO 610,ATTO 611X,ATTO 620,ATTO 633,ATTO 635,ATTO 647,ATTO 647N,ATTO 655,ATTO 680,ATTO 700,ATTO 725,ATTO740,ATTO-TAG CBQCA,ATTO-TAG FQ,金胺,Aurophosphine G,Aurophosphine,BAO 9(二氨基苯基噁二唑),BCECF(高pH),BCECF(低pH),硫酸黄连素,Bimane,二苯甲酰胺,二苯甲亚胺(Hoechst),二-BTC,Blancophor FFG,Blancophor SV,BOBO-1,BOBO-3,Bodipy 492/515,Bodipy 493/503,Bodipy 500/510,Bodipy 505/515,Bodipy 530/550,Bodipy 542/563,Bodipy 558/568,Bodipy 564/570,Bodipy 576/589,Bodipy 581/591,Bodipy 630/650-X,Bodipy 650/665-X,Bodipy 665/676,Bodipy Fl,Bodipy FL ATP,Bodipy Fl-神经酰胺,Bodipy R6G,Bodipy TMR,Bodipy TMR-X缀合物,Bodipy TMR-X,SE,Bodipy TR,Bodipy TRATP,Bodipy TR-X SE,BO-PRO-1,BO-PRO-3,Brilliant Sulphoflavin FF,BTC,BTC-5N,钙黄绿素,钙黄绿素蓝,钙深红(Calcium Crimson),钙绿(Calcium Green),钙绿-1Ca2+染料,钙绿-2Ca2+,钙绿-5N Ca2+,钙绿-C18 Ca2+,钙橙(Calcium Orange),荧光增白剂(Calcofluor White),羧基-X-罗丹明(5-ROX),Cascade Blue,Cascade Yellow,儿茶酚胺,CCF2(GeneBlazer),CFDA,色霉素A,色霉素A,CL-NERF,CMFDA,香豆素鬼笔环肽,CPM甲基香豆素,CTC,CTC甲
Figure BDA0003406624250000491
Cy2,Cy3.1 8,Cy3.5,Cy3,Cy5.1 8,环AMP氟传感器(FiCRhR),Dabcyl,丹磺酰,丹磺酰胺(Dansyl Amine),丹磺酰尸胺,丹磺酰氯,丹磺酰DHPE,丹磺酰氟,DAPI,Dapoxyl,Dapoxyl 2,Dapoxyl 3'DCFDA,DCFH(二氯二氢荧光素二乙酸酯),DDAO,DHR(二氢罗丹明123),二-4-ANEPPS,二-8-ANEPPS(non-ratio),DiA(4-Di-16-ASP),二氯二氢荧光素二乙酸酯(DCFH),DiD–亲脂性示踪剂,DiD(DiIC18(5)),DIDS,二氢罗丹明123(DHR),DiI(DiIC18(3)),二硝基苯酚,DiO(DiOC18(3)),DiR,DiR(DiIC18(7)),DM-NERF(高pH),DNP,多巴胺,DTAF,DY-630-NHS,DY-635-NHS,DyLight 405,DyLight 488,DyLight 549,DyLight633,DyLight 649,DyLight 680,DyLight 800,ELF 97,伊红,赤藓红,赤藓红ITC,溴化乙锭,溴乙啡锭均二聚物-1(EthD-1),吖啶橙,EukoLight,氯化铕(III),Fast Blue,FDA,Feulgen(副蔷薇苯胺),FIF(甲醛诱发荧光),FITC,Flazo Orange,Fluo-3,Fluo-4,荧光素(FITC),荧光素二乙酸盐,Fluoro-Emerald,Fluoro-Gold(羟基
Figure BDA0003406624250000501
脒(Hydroxystilbamidine)),Fluor-Ruby,FluorX,FM 1-43,FM 4-46,Fura Red(高pH),FuraRed/Fluo-3,Fura-2,Fura-2/BCECF,Genacryl Brilliant Red B,Genacryl BrilliantYellow 10GF,Genacryl Pink 3G,Genacryl Yellow 5GF,GeneBlazer(CCF2),GloxalicAcid,粒状蓝,血卟啉,Hoechst33258,Hoechst 33342,Hoechst 34580,HPTS,羟基香豆素,羟基
Figure BDA0003406624250000502
脒(FluoroGold),羟色胺,Indo-1,高钙,Indo-1,低钙,吲哚二碳菁(DiD),吲哚三碳菁(DiR),Intrawhite Cf,JC-1,JO-JO-1,JO-PRO-1,LaserPro,Laurodan,LDS 751(DNA),LDS 751(RNA),Leucophor PAF,Leucophor SF,Leucophor WS,丽丝胺罗丹明,丽丝胺罗丹明B,钙黄绿素/溴乙啡锭均二聚物,LOLO-1,LO-PRO-1,荧光黄,Lyso Tracker Blue,LysoTracker Blue-White,Lyso Tracker Green,Lyso Tracker Red,Lyso Tracker Yellow,LysoSensor Blue,LysoSensor Green,LysoSensor Yellow/Blue,Mag Green,Magdala Red(根皮红B),Mag-Fura Red,Mag-Fura-2,Mag-Fura-5,Mag-Indo-1,Magnesium Green,Magnesium Orange,Malachite Green,Marina Blue,Maxilon Brilliant Flavin 10GFF,Maxilon Brilliant Flavin 8GFF,部花青,甲氧基香豆素,Mitotracker Green FM,Mitotracker Orange,Mitotracker Red,光神霉素,单溴二胺,单溴二胺(mBBr-GSH),单氯二胺,MPS(甲基绿派若宁茋),NBD,NBD胺,尼罗红,Nitrobenzoxadidole,去甲肾上腺素,核固红,核黄,Nylosan Brilliant Iavin E8G,Oregon Green,Oregon Green 488-X,OregonGreen,Oregon Green 488,Oregon Green 500,Oregon Green 514,太平洋蓝,副蔷薇苯胺(Feulgen),PBFI,根皮红B(苏丹红),Phorwite AR,Phorwite BKL,Phorwite Rev,PhorwiteRPA,膦3R,PKH26(Sigma),PKH67,PMIA,Pontochrome Blue Black,POPO-1,POPO-3,PO-PRO-1,PO-PRO-3,樱草灵,活性黄,碘化丙啶(PI),PyMPO,芘,派若宁,派若宁B,PyrozalBrilliant Flavin 7GF,QSY 7,喹吖因氮芥,试卤灵,RH 414,Rhod-2,罗丹明,罗丹明110,罗丹明123,罗丹明5GLD,罗丹明6G,罗丹明B,罗丹明B 200,罗丹明B extra,罗丹明BB,罗丹明BG,罗丹明绿,Rhodamine Phallicidine,罗丹明鬼笔环肽,罗丹明红,罗丹明WT,玫瑰红,S65A,S65C,S65L,S65T,SBFI,5-羟色胺,Sevron Brilliant Red2B,Sevron Brilliant Red4G,Sevron Brilliant Red B,Sevron Orange,Sevron Yellow L,SITS,SITS(樱草灵),SITS(茋异硫代磺酸),SNAFL钙黄绿素,SNAFL-1,SNAFL-2,SNARF钙黄绿素,SNARF1,SodiumGreen,SpectrumAqua,SpectrumGreen,SpectrumOrange,Spectrum Red,SPQ(6-甲氧基-N-(3-磺丙基)喹啉鎓),茋,磺基罗丹明B can C,磺基罗丹明Extra,SYTO 11,SYTO 12,SYTO13,SYTO 14,SYTO 15,SYTO 16,SYTO 17,SYTO 18,SYTO 20,SYTO 21,SYTO 22,SYTO 23,SYTO 24,SYTO 25,SYTO 40,SYTO 41,SYTO 42,SYTO 43,SYTO 44,SYTO 45,SYTO 59,SYTO60,SYTO 61,SYTO 62,SYTO 63,SYTO 64,SYTO 80,SYTO 81,SYTO 82,SYTO 83,SYTO 84,SYTO 85,SYTOX Blue,SYTOX Green,SYTOX Orange,四环素,四甲基罗丹明(TAMRA),德克萨斯红,德克萨斯红-X缀合物,噻二碳菁(DiSC3),噻嗪红R,噻嗪橙,硫黄素5,硫黄素S,硫黄素TCN,Thiolyte,噻唑橙,Tinopol CBS(荧光增白剂),TMR,TO-PRO-1,TO-PRO-3,TO-PRO-5,TOTO-1,TOTO-3,TRITC(四甲基罗丹明异硫氰酸酯),True Blue,TruRed,Ultralite,Uranine B,Uvitex SFC,WW 781,X-罗丹明,XRITC,二甲苯橙,Y66F,Y66H,Y66W,YO-PRO-1,YO-PRO-3,YOYO-1,YOYO-3,SYBR Green,噻唑橙(相互螯合染料),或它们的组合。
本发明的另一方面涉及计算机实施的方法。例如,可以提供能够自动地和/或反复地执行本文所述的任一种方法的计算机和/或自动化系统。如本文所用,“自动化”装置是指能够不需要人为指引而进行操作的装置,即,自动化装置可以在任何人已经完成了采取任何动作来促进一种功能(例如通过向计算机输入指令以启动该过程)后的一段时间期间执行该功能。典型地,自动化设备可以在此点后按时执行重复的功能。在一些情况下,处理步骤还可以被记录到机器只读介质上。
例如,在一些情况下,可以使用计算机来控制对样品的成像,例如,使用荧光显微术、STORM或其他超分辨率技术诸如本文所述的那些。在一些情况下,计算机还可以控制如下的操作,诸如漂移校正、物理注册(physical registration)、图像分析中的杂交和团簇比对、聚类解码(例如,荧光聚类解码)、误差检测或纠正(例如,如本文所述)、降噪、从背景特征(诸如图像中的噪点或碎片)中标识前景特征等。作为实例,可以使用计算机来控制样品内发信号实体的活化和/或激发,和/或对发信号实体的图像的获取。在一组实施方案中,可以使用具有各种波长和/或强度的光激发样品,用来激发样品的光的波长的顺序可以使用计算机与对含有所述发信号实体的样品获取的图像相关联。例如,计算机可以向样品施加具有各种波长和/或强度的光从而在每个目标区域中产生不同的平均数目的发信号实体(例如,每个位置一个活化实体,每个位置两个活化实体等)。在一些情况下,可以使用此信息来构建发信号实体的图像和/或确定发信号实体的位置,在一些情况以高分辨率构建和/或确定,如上所述。
在一些方面,所述样品放置在显微镜上。在一些情况下,显微镜可以包含一个或多个通道,诸如微流体通道,以引导或控制流体至样品或从样品流出。例如,在一个实施方案中,核酸探针诸如本文所讨论的那些可以通过使流体通过一个或多个通道流到样品或从样品流出而引入样品和/或从样品移除。在一些情况下,还可以存在一个或多个室或储库用于留存流体,例如,与通道和/或与样品流体连通。本领域普通技术人员熟悉通道,包括微流体通道,用于将流体移动到样品或从样品移出流体。
下面的文件各自以全部内容通过引用并入本文:美国专利号10,240,146,题目为“Probe Library Construction”;美国专利申请公开号2017/0220733,题目为“Systemsand Methods for Determining Nucleic Acids”;美国专利申请系列号62/779,333,题目为“Amplification Methods and Systems for MERFISH and Other Applications”;国际专利申请公开号WO 2016/018960,题目为“Systems and Methods for DeterminingNucleic Acids”;国际专利申请公开号WO 2016/018963,题目为“Probe LibraryConstruction”;国际专利申请公开号WO 2018/089445,题目为“Matrix imprinting andClearing”;国际专利申请公开号WO 2018/218150,题目为“Systems and Methods forHigh-Throughput Image-Based Screening”;和国际专利申请公开号WO 2018/089438,题目为“Multiplexed Imaging Using MERFISH and Expansion Microscopy”。另外,下面每一篇的全部内容也通过引用并入本文:Zhuang等人于2019年4月19日提交的题目为“Imaging-Based Pooled CRISPR Screening”的美国临时专利申请系列号62/836,578和Zhuang等人于2019年5月1日提交的题目为“Imaging-Based Pooled CRISPR Screening”的美国临时专利申请系列号62/841,715。
下面的实施例意在举例说明本发明的某些实施方案,但不代表本发明的全部范围。
实施例1
混合文库CRISPR筛选提供了一种强有力的手段以高通量的方式发现参与细胞过程的遗传因素。然而,混合文库筛选可获得的表型有限。复杂的表型,诸如细胞形态和亚细胞分子组织、以及它们的动力学,需要基于成像的读出,目前还不能采用混合文库CRISPR筛选得出。这些实施例显示了全部基于成像的混合文库CRISPR筛选方式,其组合了在单个细胞中的高内涵表型成像与高通量向导RNA(sgRNA)鉴定。在一种这样的方式中,sgRNA被共同递送到细胞,其中对应的条形码使用慢病毒递送系统置于报告基因的3’非翻译区(3’UTR),所述慢病毒递送系统具有减少的重组诱导的sgRNA-条形码错配。可以使用多重误差稳健荧光原位杂交(MERFISH)来读出条形码,因此可以以高精确度识别sgRNA。参见,例如,国际专利申请公开号WO 2016/018960、WO 2016/018963、WO 2018/089445、WO 2018/218150、WO2018/089438和WO 2018/089438,每篇的全部内容通过引用并入本文。这些实施例使用此方式来筛选靶向54个RNA-结合蛋白的162个sgRNA的对RNA定位到核区室的作用,以及发现以前未知的用于核RNA定位的调控因子。值得注意的是,这些筛选揭示了用于长非编码RNA(lncRNA),MALAT1的核斑点定位的正调节物和负调节物两者,提示lncRNA定位在亚细胞区室中的动态调节作用。
这些实施例开发了一种基于成像的混合文库CRISPR筛选方式,允许通过高分辨率、高内涵成像读出单个细胞的表型和基因型。这种方式通过允许探测复杂的细胞表型,有希望大幅度扩大混合基因筛选可达到的表型空间,所述表型诸如细胞形态、不同分子种类的亚细胞组织、以及它们的动力学。应用此方式来筛选参与核RNA定位的遗传因素,鉴定出控制lncRNA定位到核斑点的正调节物和负调节物两者。
这些实施例举例说明了在哺乳动物细胞中全部基于成像的混合文库CRISPR筛选方式。这种方式允许对单个细胞中的多个分子靶标进行高内涵表型成像和对每个细胞的基因型更准确的鉴定,后者通过将每个sgRNA与独特的条形码相关联,并使用多重误差稳健荧光原位杂交(MERFISH)读出所述条形码来实现。为了说明此种方法的能力,进行了对调控核区室中的RNA定位的因子的基因筛选。各种核RNA诸如小核RNA(snRNA)、小核仁RNA(snoRNA)、和长非编码RNA(lncRNA),与通过液-液相分离形成的核区室诸如核仁和核斑点相关联。了解这些RNA的空间调节对于理解它们如何组织多样的核活动和功能是很重要的,这些核活动和功能包括转录调节、转录加工和基因组稳定性。对6个RNA靶标的定位筛选了162个sgRNA(靶向54个基因)的作用,所述RNA靶标包括:lncRNA MALAT1,U2 snRNA和非编码RNA 7SK,它们全部已知定位到核斑点;新生前核糖体RNA和非编码RNA MRP,两者已知定位到核仁;以及含有多聚腺苷酸的RNA。这些结果揭示了用于核RNA定位的一些调控物。具体来说,鉴定出对MALAT1的核斑点定位至关重要的两个正调节物,和减少MALAT1的核斑点定位的负调控物,提示lncRNA定位存在动态调节。
实施例2
本实施例举例说明了在哺乳动物细胞中的高通量高精确度条形码成像。基于原位成像的混合文库筛选近年来已经在细菌中进行,其中单个细胞的基因型通过对与基因变体相关的条形码进行多重FISH成像来鉴定。因为细菌细胞的体积小,在单个细胞中来自条形码RNA的扩散信号足够强,可以很容易地测量。然而,哺乳动物细胞体积比细菌大约上千倍,使得难以达到足够高浓度的条形码RNA以允许可靠的测量。因此对于哺乳细胞来说需要新的条形码表达和检测方案以增加条形码信号并减少背景。
为了实现此目标,在同一载体中使用两个独立的启动子表达sgRNA和报告基因并在报告基因的3’非翻译区(3’UTR)中掺入12-位三进制条形码(图1A)。三进制条形码的每个位(digit)(下文称为三位(trit))由对该位特异的三个不同的读出序列(30个核苷酸(nt)长)中的一个制成,对应于三个可能的三位数值0、1和2。例如,12个三位具有编码总计312=531,441个条形码的能力。因为总计有36个不同的三位序列(12个三位中每一个有3个不同的序列),使用连续轮次的杂交形成具有36个伪彩色通道的图像来读取条形码(18轮次的杂交,每轮进行2-色成像,每个三位序列一个伪彩色通道),提供了高度多重的检测。为了增加来自条形码的信号,使用分支链DNA扩增方案来扩增每个三位序列的信号(图1A)。为了减少来自背景的干扰,报告基因的mRNA序列进行共染色,报告基因序列和条形码序列两者均使用单分子FISH(smFISH)进行检测,使得仅考虑与报告基因信号共定位的条形码信号(图1A)。对于每个特异性的三位,基于表现出与所述三位信号共定位的最高比例的报告基因mRNA smFISH信号的伪彩色通道对三位的数值(0、1或2)进行分配。这种检测方案减少了由条形码FISH探针的非特异性结合产生的背景信号,这对于下面章节中所示的解码准确度是很重要的。
为了测试此条形码标识方案,克隆了载体的文库,每个文库以混合的方式包含共用的报告基因(萤光素酶-mCherry)和在同一启动子控制下的独特条形码(图1B;见下文和图7)。尽管可能的条形码的总数超过500,000,但文库限于仅~2000个载体(用于误差检测目的,如下所述),且文库中的条形码通过测序确定。使用慢病毒以低感染复数(MOI)将所述文库递送到U-2OS细胞的基因组中,使得大多数感染的细胞仅接收一个条形码。使用如上所述的多重检测方案测量单个细胞的条形码信号。
在每轮杂交后,观察到与报告基因(萤光素酶-mCherry)mRNA的smFISH信号共定位的明亮的条形码信号(图1C)。对于每个三位检测,分开探测三个三位数值(如较早所述,在不同的伪彩色通道中),观察到三个截然不同的细胞群体,代表表达三个不同三位数值的条形码的细胞(图1D;见下文和图8)。使用k-均值聚类算法来分开三个细胞群体,基于分配给此三位的三个伪彩色通道中的哪一个表现出与所述三位信号共定位的最高比例的报告基因mRNA斑点,对每个群体分配三位数值。使用36个伪彩色通道检测12个三位允许对每个细胞分配条形码。对大多数细胞(~57%)解码的条形码匹配通过测序测定的文库中的~2000个条形码(图1E),丢弃具有不匹配的条形码的细胞。为了评估使用此报告基因共定位方式在条形码检测准确度方面的改良,每个细胞的条形码还基于对单独条形码信号检测的FISH斑点的数目进行分配(不考虑与报告基因信号的共定位)。发现在此情况下没有已解码的条形码与文库中的实际条形码匹配(图1F),推测由于非特异性FISH标记引入的背景信号引起,说明了利用报告基因共定位方式极大地改善了解码精确度。
使用瓶颈策略(即,将文库中载体的总数限为~2000,仅为12-位三进制条形码的可能总数的<0.4%)允许误差检测,因为任何位的读出误差最大可能生成文库中不存在的无效条形码。在数量上,因为仅有0.4%的全部可能的条形码存在于文库中,任何错误检测到的条形码与文库中的条形码匹配的概率仅为0.4%。因此,在57%精确匹配的条形码中,仅0.3%可能来自条形码错误标识(参见下面的详细计算)。
图1显示了在哺乳动物细胞中用于基因型测定的基于成像的条形码检测。图1A显示了目的是基因型测定的用于高精确度的基于成像的条形码检测的策略。sgRNA和具有基于成像的条形码的报告基因共同递送到宿主细胞的基因组中。mRNA的报告基因部分通过单分子FISH(smFISH)检测,条形码通过MERFISH检测,采用相继轮次的杂交来检测三进制条形码的每个位(三位)。使用4X4分支链DNA扩增方案扩增条形码信号。图1B显示了用于探测条形码标识准确度的报告基因-条形码文库的构建体设计。图1C,上图显示了示例图像,该图像显示了报告基因mRNA smFISH信号以及对于条形码中的单个三位,三个三位数值(0、1和2)中的每一个的信号。下图显示了上图的白框区域的放大视图,其中报告基因信号显示在左侧,报告基因信号和条形码三位信号之间的重叠显示在右侧。对于此细胞三位数值1具有高共定位比,而三位数值0和2不具有高共定位比。比例尺为10微米。图1D显示了对所有细胞对示例三位测量的三个三位数值的共定位比。作图中的每个斑点对应于单个细胞。共定位比定义为与三位信号斑点共定位的报告基因smFISH斑点的数目除以细胞内报告基因smFISH斑点的总数。基于其共定位比使用k-均值聚类算法将细胞分成三个聚类(以不同的阴影显示)。每个聚类对应于具有特定的三位数值的细胞。图1E显示了与文库中有效条形码相比,在解码的条形码中具有不同数目的错配三位的细胞的数目的直方图。如上所述使用报告基因信号和三位信号共定位对条形码进行解码。图1F与图1E相同,但是采用通过仅使用测量到的三位信号斑点的数目解码的条形码,不考虑报告基因信号和三位信号共定位。
图7显示了用于评价基于成像的条形码检测准确度的文库克隆策略。简言之,条形码和UMI(唯一分子标识符)首先从单件DNA寡核苷酸通过两步重叠PCR组装而成(见下)。不同寡核苷酸的阴影代表不同的三位序列。此条形码-UMI文库然后插入到消化的慢病毒质粒主链上形成条形码-UMI慢病毒载体文库。报告基因盒进一步插入到所述条形码-UMI慢病毒载体文库中以形成最终的报告基因-条形码文库。
图8显示了所有12个三位的共定位比分析。对所有12个三位展示对所有细胞测量的单个三位的三个数值的共定位比。基于其共定位比使用k-均值聚类算法将细胞分成三个聚类(以不同的阴影显示)。每个聚类对应于具有一个三位数值的细胞。
实施例3
为了进一步验证低错误标识率,在此实施例中,设计了两个报告基因-条形码文库,每个表达具有融合到如上所述的条形码文库的不同表位标签(HA标签或Myc标签)的报告基因萤光素酶-mCherry(图2A),并将两个文库分别地克隆。每个文库缩减到包含全部可能的条形码的<0.2%,使得相同的条形码非常不可能均出现在两个文库中,并且通过测序确定与每个表位标记的报告基因相关的条形码身份。两个文库分别引入至U-2OS细胞中,然后以大致相等的数目将两个文库的细胞混合在一起。每个细胞的表型,即HA或Myc标签的表达,使用免疫荧光成像(图2B),如上所述使用连续轮次的杂交对与每个细胞相关的条形码成像。基本原理在于确定每个细胞的表型将允许从测序结果推导出该细胞的条形码身份,然后与通过成像确定的条形码比较将允许确定一小部分被错误标识的条形码。
通过条形码-表型错配判断,仅~1%的细胞具有错误标识的条形码(图2C和2D)。甚至该小误差很可能是由于在细胞分割中的误差所致,这种误差接下来导致表型确定误差,进一步支持了在这些实验中非常低的条形码错误标识率。
图2图示了使用具有已知表型-条形码对应关系的条形码错误标识率的评价。图2A图示了用来评价条形码检测准确度的构建体。报告基因萤光素酶-mCherry标记以HA或Myc标签以定义两种表型,以及核定位信号以浓缩核中的HA和Myc信号从而有利于检测。条形码置于报告基因的3’UTR处,通过测序确定条形码和HA或Myc标签之间的对应关系。报告基因由CMV启动子驱动。图2B图示的图像显示了在两个不同的通道中的HA和Myc免疫染色信号。具有强HA信号的细胞核具有弱Myc信号,反之亦然。细胞边界被增亮。HA表达细胞和Myc表达细胞的核边界也分别进行标记。比例尺为50微米。图2C是单个细胞的HA和Myc免疫染色强度的散点图。显示了根据基于成像的条形码确定分配为HA或Myc文库的细胞。分别通过三角形或圆圈显示被归类为HA或Myc免疫染色阳性的细胞(见下)。在1105个具有对应HA的条形码的细胞中仅有10个被观察到为Myc免疫染色阳性,在1034个具有对应Myc的条形码的细胞中仅有9个被观察到为HA免疫染色阳性,表明条形码错误标识率低。小部分细胞(2336个细胞中有197个)的HA和Myc免疫染色信号均低于阈值或它们的HA和Myc免疫染色信号均高于阈值,因此没有被明确地鉴定为HA阳性或Myc阳性(见下)。这些细胞被从分析中剔除。图2D显示了对于通过条形码成像被解码包含HA标签报告基因或Myc标签报告基因的单个细胞,HA强度与Myc强度的比例的直方图。
实施例4
本实施例图示了对于准确的sgRNA标识具有减少的重组效应的慢病毒递送系统。通过混合条形码成像进行sgRNA标识的另一挑战来自用于将sgRNA-报告基因-条形码载体递送到哺乳动物细胞中的病毒系统。慢病毒是哺乳动物细胞的优选递送系统,因为它允许载体的稳定基因组整合和通过以低MOI转染使每个细胞导入一个sgRNA(尽管在其他情况下也可以使用其他递送系统),然而,慢病毒具有两个单链RNA基因组并且易于重组,这可以导致在病毒转导期间sgRNA和条形码的错误配对。慢病毒的重组率为每千碱基(kb)~1个事件。因为在这些实验中,sgRNA和报告基因-条形码组合分别在两个独立启动子的控制下表达,因此条形码和sgRNA序列在这些实例中间隔以很大的基因组距离(>1kb),因此重组诱导的条形码-sgRNA错误配对的概率可以是巨大的。
本实施例说明了一种由CROP-seq方式改良的策略,以克服此重组问题。具体来说,将报告基因(puro-T2A-mCherry)置于强Pol II启动子(EF1α,EF1-α)的控制下,sgRNA置于独立的启动子(hU6)的控制下,以及条形码置于慢病毒基因组中聚嘌呤带(PPT)的下游处(图3A)。这样,sgRNA的原型间隔序列(用于特异性基因靶向的~20nt序列)和条形码序列可以间隔以最小的基因组距离(~100个碱基)。尽管报告基因下游的sgRNA的表达可以因强EF1α(EF1-alpha)启动子表达报告基因的干扰而受损,但sgRNA表达盒在基因组整合期间复制到原病毒基因组的5’LTR,形成了一个额外的功能单位来表达sgRNA,不会受来自EF1α(EF1-alpha)启动子的干扰(图3A)。报告基因的转录仅在3’LTR的3’端终止,这样条形码应该在报告基因mRNA 3’UTR中表达以进行基于成像的条形码标识(图3A)。
为了评价这种构建体设计是否可以支持功能性慢病毒感染和sgRNA表达,构建包含靶向对细胞存活必需的基因的sgRNA和非靶向对照sgRNA两者的文库。有效的sgRNA表达可以导致表达靶向必需基因的sgRNA的细胞消耗。选择159个靶向53个必需核糖体蛋白的sgRNA(每个基因3个sgRNA)以及作为对照的51个非靶向sgRNA(数据集S1),通过混合克隆生成含有这210个sgRNA、以及报告基因(puro-T2A-mCherry)和条形码的慢病毒文库(图3A;见下文和图S3)。然后用此慢病毒文库感染稳定表达Cas9-BFP的U-2OS细胞。在慢病毒感染后的第2天,分别基于mCherry和BFP荧光,挑选出被该文库感染并且表达高水平Cas9的细胞,保持这些细胞用于在感染后不同的时间点进行实验。表达各种sgRNA的细胞的丰度通过对基因组DNA测序确定。
如期望的那样,与包含非靶向sgRNA的细胞相比,包含靶向必需基因的sgRNA的细胞被大量消耗,并且消耗的程度取决于慢病毒感染后的时间长度(图3B),表明此病毒系统可以支持功能性sgRNA的表达。另外,包含不同sgRNA的细胞的丰度通过基于成像的条形码标识进行测量,如上所述。通过基于成像的条形码标识测量到的包含单个sgRNA的细胞的丰度与通过直接sgRNA原型间隔序列测序测量到的细胞丰度相关性很好(图3C),进一步支持了精确条形码检测。
下一步,本实验用来评价构建体的重组率。如果发生重组,被分配为必需基因的sgRNA的条形码可以与非靶向sgRNA重组,这应该导致通过条形码成像测量到的细胞丰度高于通过原型间隔序列测序测量到的细胞丰度。类似地,被分配为非靶向sgRNA的条形码可以与靶向必需基因的sgRNA重组,导致通过条形码成像测量到的细胞丰度变小。因此,对于包含靶向必需基因的sgRNA的细胞和包含非靶向sgRNA的细胞两者,测量慢病毒转导后第2天和第21天之间相对细胞丰度的倍数变化。
如期望的那样,与第2天相比,包含靶向必需基因的sgRNA的细胞的相对丰度在第21天大大减小,而包含非靶向sgRNA的细胞的相对丰度在第21天则大幅度增加(图3D)。与通过sgRNA测序获得的结果相比,通过条形码成像确定的倍数变化因重组而稍小(图3D)。这种差异允许对重组诱导的错误配对率进行定量(见下),sgRNA原型间隔序列和条形码之间重组诱导的错误配对率被测定为~8%(图3E)。
另外,测量sgRNA原型间隔序列和唯一分子标识符(UMI,置于该原型间隔序列下游处~500个碱基的20-nt序列)之间的重组诱导的错误配对(图3A)。如期望的那样,由于UMI和原型间隔序列之间的较大的基因组距离(~500nt),与条形码和原型间隔序列之间的基因组距离(~100nt)相比,原型间隔序列和UMI之间的区域的重组诱导的错误配对率较大,为~16%(图3D和3E)。值得注意的是,对于条形码的随机配对,在任意给定的三位位置处这些条形码共用相同序列的概率为约1/3,因为对于任意给定的三位存在三个可能的序列,且因为在缩小的文库中的条形码是所有可能的条形码的随机选择子集。因此,估计条形码区域中的重组应当大致为相同长度的全同源序列的重组率的1/3。基于对条形码和原型间隔序列(sgRNA的共用序列)之间的~100-nt基因组区域所测量的~8%重组率,估计在~400-nt条形码区域中的重组率大致为(400/100)x 8%/3=10.7%,得到原型间隔序列和UMI之间的基因组区域的重组率为~8%+10.7%=18.7%,与~16%的测量值一致。此外,由于条形码文库被缩小,在条形码区域内发生的重组可能生成与文库中的有效条形码匹配的新的条形码,因此不可能产生条形码错误标识。
总之,在条形码成像中的低误差率(<1%)以及由重组诱导的sgRNA和条形码之间的低错配率(~8%)允许在通过条形码成像进行的sgRNA标识中获得高准确度,这进一步允许进行基于全成像的混合文库CRISPR筛选。值得注意的是尽管在sgRNA和条形码之间剩余的8%错配率可以在筛选中潜在地生成假阳性和假阴性,但因为一般探测携带相同sgRNA的几百个细胞以确定哪一个sgRNA具有统计学显著的效应,因此误差率将是微不足道的;而且,探测靶向每个基因的三个sgRNA,并且仅当三个sgRNA中的两个表现出统计学显著的效应才会认为该基因是命中。任意其余的假阳性可以容易地通过验证实验来鉴定。
图3A图示了慢病毒递送方式的设计,该方式具有低重组诱导的sgRNA-条形码错配率。图3A显示了用来递送sgRNA和条形码用于sgRNA标识的慢病毒构建体。sgRNA盒(hU6启动子与sgRNA)和条形码阵列置于聚嘌呤带(PPT)的下游。强Pol II启动子(EF1α,EF1-alpha)驱动报告基因puro-T2A-mCherry的表达。在基因组整合后,sgRNA盒被复制到5’LTR用于sgRNA表达,而条形码与报告基因在3’UTR处表达用于条形码成像。UMI:唯一分子标识符。图3B显示了在慢病毒转导后第8天、第21天和第28天时每个sgRNA的原型间隔序列计数针对在转导后第2天测量的原型间隔序列计数作图。在第8天、第21天和第28天时的原型间隔序列计数通过因子归一化使得对于这些条件非靶向sgRNA的平均计数与在第2天时非靶向sgRNA的平均计数相同。通过测序确定原型间隔序列计数。如期望的那样,表达靶向必需核糖体基因的sgRNA的细胞随着时间推移被强烈消耗,因此靶向必需基因的sgRNA的计数与非靶向对照sgRNA相比大大减少。图3C显示了在慢病毒转导后第21天,通过基于成像的条形码检测测量的表达某些sgRNA的细胞的数目与通过原型间隔序列测序测量的sgRNA计数之间的相关性。靶向必需基因的sgRNA通常被标记为红色,非靶向对照sgRNA通常被标记为蓝色。图3D是小提琴图,通过原型间隔序列测序、基于成像的条形码检测和UMI测序测量,显示了在慢病毒转导后第2天和第21天之间相对sgRNA丰度的中位倍数变化。特定sgRNA的相对丰度定义为对应于此特异性sgRNA的总sgRNA读数的分数(即,通过对此特定sgRNA测序测定的原型间隔序列(或UMI)读数对所有sgRNA的总原型间隔序列(或UMI)读数归一化,或通过成像测定的表达与此sgRNA对应的条形码的细胞的数目对总细胞数归一化)。如期望的那样,靶向必需基因的sgRNA的相对丰度随时间减小,非靶向sgRNA的相对丰度增加。因重组的原因,通过条形码成像测定的倍数变化稍小于通过原型间隔序列测序测定的倍数变化,通过UMI测序测定的倍数变化稍小于通过条形码成像测定的倍数变化。图3E显示了在慢病毒转导后第21天和第28天时测定的因重组引起的原型间隔序列和条形码之间的中位错误配对率以及原型间隔序列和UMI之间的中位错误配对率。误差棒显示95%置信区间。
实施例5
本实施例说明了对调控核RNA定位的因子的混合CRISPR筛选。为了说明此筛选方法的效力,在核中筛选RNA定位的潜在调节物(图4A)。选择了参与核RNA调节的54个候选基因,包括hnRNP家族蛋白,DExD/H盒RNA解旋酶,和参与RNA修饰的基因(数据集S2)。设计了167个sgRNA的文库,包含54个基因中每一个的三个sgRNA以及作为对照的5个非靶向sgRNA,通过混合克隆生成包含这些sgRNA以及报告基因(puro-T2A-mCherry)和条形码的慢病毒文库(见下文和图9)。为了证明此方法评价复杂表型的能力,使用FISH对5个特异性RNA种类(lncRNA MALAT1,U2 snRNA,7SK,MRP,和新生前核糖体,以及包含多聚腺苷酸的RNA)的空间分布进行了成像。另外,在表型成像中还包括核斑点蛋白SON,使用利用寡核苷酸缀合抗体的免疫标记。使用连续轮次的杂交对这些RNA和蛋白质靶标成像,以及条形码成像,每轮利用3-4个不同的彩色通道(图4A)(成像步骤的详情参见下文)。
如期望的那样,蛋白SON表现出标明核斑点的簇状分布,MRP和前核糖体信号标明亚核仁区室(图4B)。基于这些图像,标识了这些结构的边界,并在单个细胞中测定了它们的数目、它们覆盖的面积以及它们的平均信号强度(即,定位在标识的簇边界内的总信号除以被这些簇覆盖的总面积)。下一步,对通过SON染色标识的核斑点中MALAT1、U2、7SK和包含多聚腺苷酸的RNA的富集程度进行定量(见下)。
对于这些特征定量中的每一个,对携带靶向sgRNA的细胞测定的数值与从携带非靶向对照sgRNA的细胞测量的数值比较以确定倍数变化。进行实验的4次生物学重复,并解码总计~30,000个细胞,基于下列标准确定命中:靶向基因的三个sgRNA中的至少两个表现出统计学显著的倍数变化(数据集S3)。
作为阳性对照,检测表达靶向SON的sgRNA的细胞中与SON染色相关的簇信号强度、簇面积和簇数目的统计学显著的减少(图4C)。另外,在新生前核糖体染色的各种特征中几种DExD/H盒RNA解旋酶(DDX10,DDX18,DDX21,DDX24,DDX52和DDX56)的sgRNA导致统计学显著的变化(图4D),与这些基因在核糖体生物发生中的已知功能一致。值得注意的是,这些表型特征中改变的幅度是中等的(图4C和4D),潜在地是因为不是表达sgRNA的全部细胞的基因组都被编辑。因此,这些定量允许标识具有统计学显著的效应的基因扰动,但表型改变的幅度提供的信息不多。还注意到,hnRNP家族中的几个基因的扰动导致核仁中的前核糖体以及MRP信号的显著改变(数据集S3),潜在地是因间接效应引起。
图4显示了对核RNA定位的调控物的基于成像的混合CRISPR筛选。图4A显示了基于成像的筛选的方案。将用表达sgRNA、条形码和报告基因的慢病毒感染的细胞固定和成像。在18轮杂交(1-18轮)中通过MERFISH使用647-nm和750-nm彩色通道对条形码成像。为了增加条形码成像的准确度,在每轮中(1-18轮)使用561-nm彩色通道对报告基因mRNA成像,以允许确定条形码和报告基因mRNA信号之间的共定位。在前7轮(1-7轮)中在488-nm彩色通道中对用于表型测量的7个蛋白和RNA靶标成像。左侧上的马赛克包含来自单次筛选的900个视野。图4B显示了SON、MRP、前核糖体、MALAT1、U2 snRNA、7SK和包含多聚腺苷酸的RNA的表型图像。SON标记核斑点,前核糖体和MRP标记亚核仁结构。对于SON、核糖体和MRP,定量簇数目、簇面积和簇强度。对于MALAT1、U2 snRNA、7SK和包含多聚腺苷酸的RNA,定量它们在核斑点中的富集程度。比例尺为20微米。图4C显示了每个sgRNA对SON簇强度、簇面积和簇数目的效应的火山图。图4D显示了每个sgRNA对前核糖体簇强度、簇面积和簇数目的效应的火山图。在图4C和4D中,每个sgRNA诱导的倍数变化计算为包含此sgRNA的全部细胞的平均值除以包含非靶向sgRNA的所有细胞的平均值。水平虚线表示用来确定筛选命中的p值(0.05)。在与图例中所示的基因名字的阴影匹配的阴影中显示所指示的命中的数据点(即,靶向该基因的三个sgRNA中的两个显示统计学显著的倍数变化(p<0.05)),靶向其他基因的sgRNA的数据点以灰色显示。非靶向sgRNA的数据点以黑色显示。
图9显示了慢病毒sgRNA-条形码递送文库的克隆策略。简言之,条形码和UMI首先从单件DNA寡核苷酸通过两步重叠PCR组装而成,然后与原型间隔序列和sgRNA恒定区序列使用重叠PCR组装以形成sgRNA-条形码-UMI盒文库。不同寡核苷酸的阴影代表不同的三位序列。此文库然后插入到消化的含报告基因的慢病毒主链中,其中hU6启动子在聚嘌呤带(PTT)下游的位点处。
实施例6
本实施例说明了参与调节MALAT1核斑点定位的新因子。此筛选揭示了参与调节不同RNA种类的核斑点定位的基因(数据集S3)。与7SK、U2 snRNA和包含多聚腺苷酸的RNA相比,鉴定了更多的调节MALAT1定位的基因。此讨论集中于MALAT1。值得注意地,鉴定了以相反的方向调节MALAT1的核斑点定位的两组基因(图5A;数据集S3),通过siRNA-介导的敲低验证了除一个基因(hnRNPH3)之外的全部基因(图5B和5C)。因为缺少此蛋白的有效抗体,还没确认hnRNPH3的siRNA是否有效。消耗第一组基因(DHX15,DDX42,hnRNPK和hnRNPH1)导致MALAT1在核斑点中的富集统计学显著地减少(图5A-5C),表明这些基因上调MALAT1的核斑点定位。DHX15和DDX42分别参与剪接体再循环和组装,这与mRNA剪接因子参与使MALAT1被招募至核斑点一致。以前没有报道hnRNP家族蛋白hnRNPH1和hnRNPK参与上调MALAT1的核斑点定位。还发现这两个基因影响其他RNA种类(包括U2 snRNA,包含多腺苷酸的RNA,前核糖体RNA和MRP)(数据集S3)的定位,这可以提示这两个基因的扰动的全局效应。
出人意料地,还鉴定到三个因子,hnRNPA1、hnRNPL和PCBP1,它们负调节MALAT1的核斑点定位。通过sgRNA或siRNA消耗它们诱导了在核斑点中MALAT1富集的统计学显著的增加(图5A-5C)。由siRNA诱导的MALAT1富集的倍数增加可能是因不完全敲低所引起的低估。全部这三个因子的组合敲低进一步增加了核斑点中的MALAT1富集(见下,图10A),有趣的是,这也导致一部分核斑点的扩大(见下,图10B和10C)。每个核斑点的组成(通过核斑点中MALAT1和SON水平的比率测量)在三重敲低样品中也变得更为多样化:一些斑点具有减小的MALAT1/SON比,而一些具有增加的比率(见下,图10D)。这些结果表明在敲低三个负调节物后MALAT1的核斑点定位增强与核斑点形态和组成的改变有关。这提示MALAT1在调节核斑点结构中的作用,这与MALAT1敲低可以导致核斑点尺寸减小的观察结果一致。
图5显示了参与调节MALAT1核斑点定位的遗传因子。图5A显示了每个sgRNA对MALAT1核斑点富集的效应的火山图。如图4中所述计算倍数变化。水平虚线表示用来确定筛选命中的p值(0.05)。在与图例中所示的基因名字的阴影匹配的阴影中突出显示通过siRNA敲低确认的命中,靶向其他基因的sgRNA的数据点以灰色显示。非靶向sgRNA的数据点以黑色显示。图5B显示了箱形图,显示了7个命中基因的siRNA敲低对MALAT1定位的作用,旁边是对照非靶向siRNA的数据。中间的线显示了中位数,盒子显示了25-75%四分位数,须样线显示最大值和最小值。对每个条件定量100-300个细胞。对每个条件与对照比较进行学生t检验。****,p<0.0001。图5C显示了在siRNA敲低7个命中基因后MALAT1定位的图像。还显示了来自对照非靶向siRNA的数据。MALAT1染色显示在上面的图像中,SON染色显示在下面的图像中。比例尺为10微米。
图10显示了对hnRNPA1、hnRNPL和PCBP1的三重敲低影响核斑点的形态和组成。图10A显示了箱形图,显示了对照siRNA以及HNRNPA1、HNRNPL和PCBP1单敲低和三重敲低(knockdown,KD)对MALAT1定位的作用。箱形图要素如图5中所述。对每个条件定量100-300个细胞。在每个单KD和非靶向对照之间以及三重KD和hnRNPA1、hnRNPL或PCBP1单KD之间进行学生t检验。****,p<0.0001。图10B显示了细胞的示例图像,显示了与用对照非靶向siRNA转染的细胞相比,在hnRNPA1、hnRNPL和PCBP1三重KD后一些MALAT1-阳性核斑点扩大(由箭头突出显示)。比例尺为10微米。图10C显示了核斑点尺寸的分布,显示hnRNPA1、hnRNPL和PCBP1的三重KD增加了核斑点尺寸。使用双样本Kolmogorov-Smirnov检验来检验两个分布之间的差异。图10D显示了对于对照siRNA以及hnRNPA1、hnRNPL和PCBP1三重KD样品在每个核斑点中log2(MALAT1/SON强度比)的分布。对于对照和三重KD条件分别测量~300个细胞和~7000个斑点。
实施例7
以前表明MALAT1的核斑点定位在转录抑制后可能受损。然而,参与此过程的遗传因子在很大程度上是不清楚的。因此,测试这些负调节物是否在此过程中具有作用。为此,在此实施例中,加入药物5,6-二氯-1-β(beta)-D-核糖呋喃基苯并咪唑(DRB)以抑制转录,观察到核斑点的MALAT1富集有大幅度的减少。单敲低hnRNPA1、hnRNPL和PCBP1基本上不能挽救DRB诱导的MALAT1从核斑点的解离(图6A和11,也见下)。另一方面,双重敲低这三个因子中的两个或三重敲低所有三个因子很大程度地挽救了此DRB诱导的解离效应(图6A、6B和11,也见下),提示这些hnRNP家族蛋白是转录抑制诱导的MALAT1从核斑点解离所需要的,并且这些因子可能在此过程中扮演多重的作用。这些结果提供了MALAT1通过转录抑制从核斑点解离的潜在机制。在转录抑制期间,RNA-结合蛋白诸如hnRNPA1和hnRNPL从新生mRNA转录物游离出来从而允许它们与其他RNA种类结合。因此有可能游离的hnRNPA1和hnRNPL可以结合MALAT1,可以竞争使MALAT1被招募至核斑点的因子,由此防止在转录抑制时MALAT1的核斑点定位。
图6显示了hnRNPA1、hnRNPL和PCBP1是转录抑制诱导的MALAT1从核斑点解离所必需的。图6A显示了在存在或不存在转录抑制剂DRB处理(50微摩尔,1h)的情况下对被不同的siRNA组合转染的细胞的MALAT1核斑点富集的定量。对每个条件定量100-300个细胞。转录抑制诱导的MALAT1从核斑点的解离不能通过单敲低hnRNPA1、hnRNPL和PCBP1而被挽救,但能被这些因子的双重敲低和三重敲低挽救。图6B显示了图像,显示在被对照siRNA转染的细胞中,在转录抑制时MALAT1从核斑点解离;而在被靶向hnRNPA1、hnRNPL和PCBP1的siRNA共转染的细胞中,转录抑制不能使MALAT1从核斑点解离。比例尺为10微米。
图11显示了在不同的敲低条件下在转录抑制后MALAT1核斑点富集的倍数变化。条形图显示了在各种敲低条件下在转录抑制后MALAT1核斑点富集的倍数变化。此倍数变化定义为在相同siRNA处理后转录抑制后的MALAT1核斑点富集除以转录抑制前的富集。显示了对照siRNA、hnRNPA1、hnRNPL和PCBP1单敲低以及hnRNPA1、hnRNPL和PCBP1双重敲低和三重敲低条件。误差棒:SD。对每个条件相对于对照进行学生t检验。**,p<0.01,****,p<0.0001,n.s.,不显著。n=3,每个实验包含30-100个细胞。
实施例8
这些实施例开发了一种基于成像的混合文库CRISPR筛选法,允许对单个细胞建立基因型-表型对应关系并允许基于以前混合文库筛选无法采用的复杂表型对哺乳动物细胞进行高通量筛选。通过基于MERFISH的条形码检测的sgRNA标识允许进行此基于成像的筛选,并且证明条形码错误标识率低至~1%。设计了慢病毒递送方案,其中重组诱导的sgRNA和条形码的错误配对率减小(错误配对率<10%)。总之,这些提供了通过条形码成像的高度准确的sgRNA标识。这些方式大幅度地扩充了混合文库筛选可用的表型空间。与使用阵列形式(其中单个基因扰动单独地在单个孔中测定)的基于成像的筛选相比,进行混合筛选的主要优势在于用于基因扰动的试剂,即,DNA质粒和慢病毒,可以以混合的方式利用标准的分子生物学操作程序制备,需要的劳动和成本较少,这对于大规模定制设计的文库来说特别有益。用于阵列筛选的试剂制备一般需要昂贵的多孔机器人处理系统和更复杂的操作程序。混合方式的另一优势在于对于不同扰动的实验条件变化可以最小化,因为在同一实验中对所有基因扰动进行测量。当细胞应当用浓度或时间敏感条件处理时这是特别期望的。而且,混合形式还可以简化多重表型测量,多重表型测量要求连续轮次的染色和通过缓冲液交换去除信号。另一方面,当不特别需要产生单个基因扰动的试剂和当表型测量对样品处理条件的变化不非常敏感时,阵列筛选可以是优选的,因为MERFISH条形码读出过程大幅度增加了成像操作程序的复杂性。
目前的12-位三进制条形码文库包含超过50万个条形码。即使采用严格的1%瓶颈策略实现误差稳健性条形码检测,在每个文库中可以包括超过5000个不同的sgRNA,此容量可以很容易地通过向条形码增加更多的位数而增加。目前对可以筛选的sgRNA的数目的限制是对大量细胞成像所需的时间。此成像系统利用了高放大倍数(60X)物镜来读出各个单mRNA分子上的FISH信号以进行条形码检测,限制了可以在每个视野中成像的细胞的数目。然而,通过下列的方式成像速度可以大幅度提高:1)对于条形码信号使用更大的放大,允许以更快的帧率俘获每个视野和/或通过使用较低放大倍数的物镜允许在每个视野中成像更多的细胞;2)使用多个照相机用于检测,允许同时检测不同彩色通道中的荧光信号。利用这些改进,可以实现每个实验可以筛选的细胞和基因型的数目有超过10倍的提高。
为了证明此种方式对筛选哺乳动物细胞的复杂表型的效力,对7个不同的分子种类的亚细胞定位进行成像,包括6个RNA和一个蛋白。这些筛选实验解释了以前未知的核RNA定位的调控物。有趣的是,鉴定出了lncRNA MALAT1的核斑点定位的正调节物和负调节物。正调节物包括DExD/H盒RNA解旋酶,DHX15和DDX42,和hnRNP家族基因,hnRNPH1和hnRNPK;而负调控物包括hnRNPA1、hnRNPL和PCBP1。RNA可以通过至少两个机制定位至通过相分离形成的细胞区室:1)RNA可以充当支架,其可以使相分离成核,诸如P体(P body)和应激颗粒中的mRNA和核仁中的前核糖体RNA;2)RNA可以作为客户(client)被招募至相分离体,已经显示其负责MALAT1在核斑点中的定位。有可能在此筛选中发现的负调控物可以与使MALAT1被招募至核斑点的因子竞争,由此防止MALAT1的核斑点定位。还鉴定了这些负调控物在由转录抑制诱导的MALAT1从核斑点解离中的作用。这些结果提示lncRNA定位可以被蛋白因子动态地调控。
这些结果证明了此基于成像的筛选方法揭示参与仅可以通过高分辨率成像来评估的细胞过程中的分子因子的能力。此筛选方法可广泛地应用于调查控制或调节大量表型的遗传因子,所述表型包括形态学特征、分子组织和细胞结构的动力学,以及细胞-细胞相互作用。此筛选方式还可以与高度多重DNA、RNA和蛋白成像方式组合,包括基因组规模的成像方式,从而以高通量的方式剖析参与基因调节和其他基因组功能的因子。
实施例9
本实施例举例说明了用于这些实施例中的各种材料和方法。
报告基因-条形码文库和sgRNA-报告基因-条形码文库的克隆以混合方式使用从IDT订购的寡核苷酸(数据集S1、S2和S4)进行。这些文库克隆到慢病毒载体pFUGW中,如下所述。使用高通量测序建立文库中存在的条形码的身份和条形码-sgRNA对应关系。在LentiX细胞(Takara,632180)中使用Lenti-XTM Packaging Single Shots(VSV-G)(Takara,631276)制备慢病毒。使用该慢病毒文库以低感染复数(MOI)感染U-2OS细胞,使得仅10-20%的细胞被感染。基于mCherry表达和Cas9-BFP表达分选感染的细胞。根据下面讨论的详细方法将分选的细胞固定、透化并染色用于成像。
围绕Nikon Ti-U显微镜主体构建的定制显微镜用于成像,Nikon Ti-U显微镜主体带有具有1.4NA的Nikon CFI Plan Apo Lambda 60x油浸物镜。对于连续轮次的杂交和成像,蠕动泵(Gilson,MINIPULS 3)将液体(用于染色裂解的TCEP缓冲液,含有读出探针的杂交缓冲液或用于样品洗涤的杂交缓冲液)泵入带有样品盖玻片的Bioptech’s FCS2流动室中,使用三个阀(Hamilton、MVP和HVXM 8-5)来选择输入流体(详情见下)。基于采集的图像进行的条形码解码和表型定量也在下文详述。
细胞培养。U-2OS细胞在补充了10%FBS(Sigma,F4135-1L)和1%Pen/Strep(Invitrogen,15140122)抗生素的EMEM培养基(ATCC,HTB-96)中在37℃培养。通过慢病毒转导生成稳定表达Cas9-BFP的U-2OS细胞,接着使用BFP信号进行FACS分选。为了生成用于Cas9-BFP的慢病毒载体,从pLentiCas9-BFP(Addgene#78545)PCR扩增Cas9-BFP序列,并将其克隆进带有SVVF启动子的pFUGW主链中。加入两个核定位信号序列以增强Cas9的核定位。
载体文库克隆。12-位条形码各自由12个30-nt序列组成,每个30-nt序列代表一个三位,核苷酸‘A’分隔相邻的三位。编码每对以正向和反向交替的方式邻接的30-nt序列的寡核苷酸订购自IDT(即trit1+trit2,trit2+trit3反向互补,trit3+trit4,trit4+trit5反向互补,…,trit9+trit10,trit10+trit11反向互补,trit11+trit12,参见数据集S4)。每个三位具有三个不同的数值,由三个截然不同的30-nt序列标识,因此每对邻接的30-nt序列具有9种可能的不同序列,总计需要11x9=99个寡核苷酸来覆盖所有可能的邻接的30-nt序列对。在条形码的两端(由寡核苷酸1-9和91-99表示),加入两个恒定的引物结合序列用于PCR扩增目的。这99个寡核苷酸的序列记载在数据集S4中。整个条形码文库通过两步重叠PCR组装。首先,12个三位分成3个区段,每个区段通过下列的反应生成:区段1.寡核苷酸1-36作为模板,寡核苷酸1-9作为正向引物,寡核苷酸28-36作为反向引物;区段2.寡核苷酸37-72作为模板,寡核苷酸37-45作为正向引物,寡核苷酸64-72作为反向引物;区段3.寡核苷酸73-99作为模板,寡核苷酸73-81作为正向引物,寡核苷酸100作为反向引物。将三个PCR产物进行凝胶纯化。然后,将三个区段混合,使用正向引物寡核苷酸101和反向引物寡核苷酸102进行重叠PCR。此步骤的反向引物包含20个碱基的随机序列区,该区充当唯一分子标识符(UMI)用于测序步骤。寡核苷酸100-102的序列也记载在数据集S4中。全部PCR反应使用实时qPCR设备进行以监测反应,使得反应在对数生长期停止以减少由PCR偏倚导致的文库偏移。PCR产物通过等温组装组装成修饰的pFUGW主链。组装的文库电穿孔至Endura感受态细胞(Lucigen,60242-2)中,该感受态细胞然后在氨苄青霉素选择下生长过夜以扩增文库。扩增的文库通过mini prep纯化。此文库命名为pFUGW_条形码_UMI_主链文库。
pFUGW_条形码_UMI_主链文库然后用来生成另外包含报告基因(萤光素酶-mCherry)的文库用于条形码成像。首先在中间载体中生成包含CMV启动子和报告基因开放阅读框的报告基因盒。开放阅读框包含萤光素酶-mCherry、在N-末端处的2X HA或2X Myc标签和在C-末端处的核定位信号。使用寡核苷酸103和104(序列在数据集S4中提供)从中间载体PCR扩增报告基因盒。pFUGW_条形码_UMI_主链文库然后用BstXI消化,并用碱性磷酸酶处理,使用等温组装与报告基因盒PCR产物组装。将组装的文库电穿孔至Endura感受态细胞中,该感受态细胞然后在氨苄青霉素选择下生长过夜用于扩增。然后将细胞稀释以包括每个文库中所需数目的构建体。然后这些缩小的文库通过mini prep纯化。这些文库命名为报告基因_条形码文库。
sgRNA-条形码文库的克隆。使用下列策略来克隆sgRNA-条形码文库:首先,通过多步重叠PCR生成原型间隔序列-sgRNA恒定区-条形码盒文库;然后通过等温组装将此文库插入到慢病毒载体中,其中U6启动子置于PPT序列的下游。为了生成原型间隔序列-sgRNA恒定区-条形码盒文库,首先使用如“用于定量条形码解码准确度的条形码文库的克隆”章节中所述的类似方式生成条形码区段。仅有的不同之处在于5’端的恒定(引物)区通过用寡核苷酸105-113替换寡核苷酸1-9而改变,因为条形码被置于紧邻sgRNA。使用寡核苷酸114和115对sgRNA恒定区进行PCR扩增。原型间隔序列文库订购自IDT,其中恒定区在原型间隔序列的两侧用于PCR扩增。在此工作中,生成了两个原型间隔序列文库,一个用于必需核糖体基因和非靶向sgRNA对照用来测量sgRNA和条形码(数据集S1)之间的重组率,另一个用于靶向潜在地调节核中的RNA定位的基因(数据集S2)。使用寡核苷酸116和117将原型间隔序列文库进行PCR扩增,将PCR产物凝胶纯化。然后,将原型间隔序列、sgRNA恒定区和条形码PCR产物混合,并使用寡核苷酸116和118作为引物进行重叠PCR。反向引物寡核苷酸118包含一个20个碱基的随机序列区,其充当用于测序步骤的唯一分子标识符(UMI)。寡核苷酸105-118的序列也记载于数据集S4中。全部PCR反应使用实时qPCR设备进行以监测反应,使得反应在对数生长期停止。PCR产物通过等温组装组装成修饰的pFUGW主链,其中U6启动子置于PPT序列的下游。组装的文库电穿孔至Endura感受态细胞中,该感受态细胞然后在氨苄青霉素选择平板上生长过夜用于扩增。用LB缓冲液从所述平板刮下特定数目的菌落(~3800个用于必需核糖体基因文库,~2500个用于RNA定位筛选文库)并在200mL LB缓冲液中培养过夜。文库通过mini prep纯化。这些文库命名为sgRNA_条形码文库。
测序文库制备和分析。为了确定文库中呈现的条形码的身份并建立sgRNA和条形码之间的对应关系,使用高通量测序分析所述文库。发现对条形码区的PCR扩增可以因条形码间的同源区而导致条形码的重组。因此,使用基于连接的方式来向条形码文库安装测序适配体。在此方式中,将进行测序的区域从文库中消化,然后使用T4连接酶连接到适配体。
为了测定报告基因-条形码文库中的条形码,使用BstXI和BamHI将文库在37℃消化2-3小时,得到的片段使用Zymo DNA纯化试剂盒(ZD4002)纯化。为了生成具有用于连接的粘端的适配体,寡核苷酸119-124(序列在数据集S4中提供)以各自0.5微摩尔混合,接受5个循环的PCR反应,产物使用Zymo DNA纯化试剂盒纯化以产生带有被BstXI和BamHI消化位点隔开的5’和3’适配体的双链序列。经纯化的产物用BstXI和BamHI在37℃消化2-3小时,然后纯化。得到的混合物包含具有用于连接的粘端的适配体,与上述经纯化的文库片段混合物混合。加入T4连接酶,反应在室温保持2-4小时。将反应混合物直接进行2%琼脂糖凝胶电泳,切下对应于~400bp大小的条带并纯化。经纯化的DNA样品用于浓度测量和使用V2-MISeq试剂盒(Illumina,MS-103-1003)的高通量测序。
为了确定所述sgRNA_条形码文库的sgRNA-条形码对应关系,生成两个测序文库,因为从原型间隔序列至条形码的末端的长度大于500bp,超过了V2-MISeq试剂盒高质量测序的最适长度范围。在一个文库中,使用BstXI和BamHI生成连接位点,该连接位点分别位于原型间隔序列的5’和UMI的3’。此文库的测序覆盖了原型间隔序列区、一部分条形码区和UMI区,因为从此文库的任一端测序可能不能达到条形码的中间部分。在第二个文库中,使用KpnI和BamHI生成连接位点(KpnI位点紧接在sgRNA后和条形码前)。此文库的测序覆盖全部条形码区以及UMI区。UMI序列用来从这两个文库鉴定同一构建体中的原型间隔序列和条形码。寡核苷酸125-130和寡核苷酸131-136(序列在数据集S4中提供)分别用来生成用于第一个和第二个文库的适配体。操作程序与对生成用于报告基因-条形码文库的测序文库所述的操作程序相同。
UMI、原型间隔序列和条形码序列从测序读数中抽取。然后通过共用UMI和条形码将所述读数分组以生成用于sgRNA核条形码对应关系的代码本。具有不正确的原型间隔序列或分配给多个sgRNA的条形码的读数从进一步分析中剔除。
为了使用测序来确定在实验中在慢病毒转导后的不同时间点来自细胞群体的原型间隔序列和UMI的分布以确定重组率,使用寡核苷酸137-140和寡核苷酸141-144(序列在数据集S4中提供)分别作为正向和反向引物从经纯化的基因组DNA通过PCR扩增制备测序文库。
慢病毒制备和转导。在LentiX细胞(Takara,632180)中使用Lenti-XTM PackagingSingle Shots(VSV-G)(Takara,631276)制备慢病毒。制备的病毒使用Lenti-XTM浓缩剂(Takara,631231)浓缩并在-80℃保存。为了转染,控制病毒的量使得10-30%的细胞被转导以确保大多数被感染的细胞仅感染1个病毒粒子。使用10微克/毫升聚凝胺(Sigma,TR-1003-G)进行病毒转导。与在PPT后没有插入的构建体相比,U6-sgRNA-条形码阵列置于PPT后的构建体的病毒效价没有显示显著的减少,表明该插入不损害慢病毒转导。
siRNA敲低。全部siRNA购自Dharmacon,siRNA敲低根据Dharmacon的实验流程进行。简言之,U-2OS细胞以30,000个细胞/孔接种在处于12孔板中的成像盖玻片上。对于siRNA转染,在一个试管中将1.5微升20微摩尔siRNA加入至100微升的无血清、无抗生素的培养基中,在另一个试管中将1微升Dharmacon转染试剂(Dharmacon,T-2001-01)加入至100微升的无血清培养基中。将两个试管孵育5分钟,然后轻轻混合在室温另外孵育20分钟。将800微升无抗生素含血清培养基混合到200微升上述的siRNA和转染试剂混合物中以生成1mL转染培养基。用1mL转染培养基更换细胞培养基。细胞在表型测量前在37℃孵育72小时。
成像盖玻片硅烷化。成像盖玻片首先用1M KOH和纯甲醇清洗,用70%乙醇洗涤,在烤箱中干燥。对于硅烷化,将盖玻片用硅烷化缓冲液(500mL蒸馏水,1500微升亲和硅烷(Bind-silane,Sigma,GE17-1330-01),用冰醋酸将pH调节至3.5)在室温浸泡1小时。然后用水洗涤盖玻片,干燥保存。在接种细胞前,在60mm直径的细胞培养皿中用1%多聚-D-赖氨酸(Sigma,P0899)涂布经硅烷化的盖玻片30min,接着用水进行一次1小时的洗涤。
成像样品制备。在固定前两天将U-2OS细胞接种在盖玻片上。对于在筛选参与调节核RNA定位的因子的实验中的表型成像,在慢病毒转导后6天将U-2OS细胞固定。样品用PBS中的4%多聚甲醛(EMS,15714)固定15min并在0.5%Triton-X(Sigma,X100)中透化30分钟。下一步,样品在封闭缓冲液(500微升封闭缓冲液:50微升10x PBS,200微升不含RNA酶的BSA(ThermoFisher,AM2618),50微升25mg/ml酵母tRNA(ThermoFisher,15401029),5微升鼠RNA酶抑制剂(NEB,M0314L),1微升25%Triton-X和不含RNA酶的水补足至500微升)中孵育1小时并用1:100一抗,抗-SON(Abcam,ab121759)在封闭缓冲液中在室温染色1小时。样品用1xPBS洗涤三次,与1:300寡核苷酸标记的二抗孵育1小时。寡核苷酸标记的二抗可以以后被读出探针利用与抗体上的寡核苷酸序列的序列互补性探测到。样品用1xPBS洗涤三次,用4%PFA后固定30分钟。然后在FISH染色前,样品在2x SSC中的30%甲酰胺中平衡5分钟。FISH杂交缓冲液含有30%甲酰胺(ThermoFisher,AM9342)、60%stellaris RNA FISH杂交缓冲液(Biosearch,SMF-HB1-10)、10%25mg/mL酵母tRNA和1:100鼠RNA酶抑制剂。样品用300nM用于报告基因的FISH探针、用于RNA表型(即,6个RNA种类)成像的300nM FISH探针、和100nM用于条形码成像的初级扩增探针在37℃染色过夜。用于报告基因的FISH探针各自包含一个可以结合报告基因mRNA的30-nt靶向序列和3个允许结合互补的荧光标记的读出探针的20-nt读出序列。用于表型成像中的每个RNA靶标的FISH探针各自包含一个可以结合RNA靶标的30-nt靶向序列和一个或两个允许结合互补的荧光标记的读出探针的20-nt读出序列。每个用于条形码成像的初级扩增探针包含一个可以与条形码上的30-nt三位序列中的一个结合的30-nt靶向序列,以及4个额外的允许结合二级扩增探针的30-nt相同序列(图1A)。然后样品在2x SSC中的30%甲酰胺中洗涤两次,用100nM用于条形码成像的二级扩增探针在10%杂交缓冲液(10%甲酰胺,80%stellaris RNA FISH杂交缓冲液,10%25mg/mL酵母tRNA和1:100鼠RNA酶抑制剂)中在37℃染色1小时。每个二级扩增探针包含一个可以与初级扩增探针结合的30-nt靶向序列,和4个额外的允许结合互补的荧光标记的读出探针的20-nt相同的读出序列。因此,此扩增方案允许最大16倍的信号放大。利用用于表型成像和报告基因mRNA成像的FISH探针以及用于条形码成像的初级和二级扩增探针标记的样品在2xSSC中的30%甲酰胺中洗涤两次,然后在4%聚丙烯酰胺凝胶中包埋,接着与蛋白消化缓冲液(对于50mL消化缓冲液:5mL 8M胍-HCL(ThermoFisher,24115),2.5mL 1M Tris pH 8.0(ThermoFisher,15569025),100微升0.5M EDTA(ThermoFisher,15575020),0.25mLTriton-X和1:100蛋白酶K(ThermoFisher,AM2548))在37℃孵育过夜以从样品中去除蛋白和脂质。此步骤在下文称为样品清洗步骤。蛋白酶K裂解导致蛋白消化(包括消化mCherry蛋白),因此mCherry荧光信号在消化后消失,不干扰使用561nm通道的FISH信号检测。用于包含多聚腺苷酸的RNA、7SK、MRP、U2 snRNA的FISH探针和与用于SON染色的二抗连接的寡核苷酸与acrydite缀合,在样品清洗步骤期间其可以与聚丙烯酰胺凝胶交联并将这些探针以及它们结合的RNA保留在凝胶内。用于MALAT1和前核糖体的FISH探针不被acrydite标记,因为MALAT1和前核糖体两者的尺寸大,因此在样品清洗期间保留在凝胶内。报告基因mRNA通过acrydite标记的多聚T探针(该探针可以结合到报告基因mRNA的多聚腺苷酸尾)连接到凝胶,由此允许用于报告基因的FISH探针和用于条形码成像的FISH探针在清洗期间保留在凝胶内。样品清洗步骤大幅度地减少了因细胞自发荧光和FISH探针与蛋白和脂质的非特异性结合引起的背景信号。然后样品用2x SSC洗涤,置于2x SSC中用于成像。使用的FISH探针的序列在数据集S5中列出。
对于用来使用两种已知表型(HA或Myc标记的报告基因的表达)测量条形码标识误差的实验,在转导后6天固定U-2OS细胞。所述标签用一抗(抗-Myc(Abcam,ab9132)、抗-HA(Abcam,ab9110))染色,然后用Alexa 405标记的抗小鼠二抗(Abcam,ab175658)和Alexa488标记的抗兔二抗(Invitrogen,A21206)染色。在凝胶包埋前,样品在2x SSC中的25mMMA-NHS(Sigma,730300)中孵育1小时,因此,在凝胶聚合期间MA-NHS标记的抗体与凝胶连接。在样品清洗后,抗体被消化成片段,染料通过交联的抗体片段与凝胶连接。在凝胶包埋期间染料Alexa 405和Alexa 488可以承受聚合反应。其余的样品制备,包括免疫染色和条形码染色,如上文所述。
通过寡核苷酸进行抗体标记。使用下列的策略用寡核苷酸标记抗体。抗体首先与DBCO-NHS混合,DBCO-NHS将DBCO缀合至抗体,然后DBCO-标记的抗体与叠氮化物标记的寡核苷酸混合从而将寡核苷酸缀合到抗体上。具体来说,首先使用50KD蛋白浓缩器(Millipore,UFC510024)将100微克抗兔抗体(ThermoFisher,31210)通过缓冲液交换到100微升PBS中。将NaHCO3和DBCO-NHS酯(Kerafast,FCC310)加入到抗体溶液中使得它们的终浓度分别为50mM和100mM。使反应在室温持续1小时以制备DBCO-标记的抗体,通过使用50KD蛋白浓缩器与PBS进行缓冲液交换去除过量的DBCO。然后将PBS缓冲液加入到DBCO-标记的抗体中以使溶液体积达到100微升,并加入25微升叠氮化物标记的寡核苷酸(100微摩尔,数据集S3)。使反应在4℃继续进行过夜。在反应结束后,使用PBS通过缓冲液交换去除过量的寡核苷酸,将最终的寡核苷酸标记的抗体等分并保存在-80℃。
成像设置和连续成像。成像设置如前所述。参见,例如,美国专利申请公开号2017-0220733或国际专利申请公开号WO 2018/089438,每篇的全部内容通过引用并入本文。简言之,蠕动泵(Gilson,MINIPULS 3)将液体泵入带有样品盖玻片的Bioptech’s FCS2流动室中,使用三个阀(Hamilton、MVP和HVXM 8-5)来选择输入流体。围绕Nikon Ti-U显微镜主体构建的定制显微镜用于成像,Nikon Ti-U显微镜主体带有具有1.4NA的Nikon CFI PlanApo Lambda 60x油浸物镜。固态单模激光(405nm激光,Obis 405nm LX 200mW,Coherent;488nm激光,Genesis MX488-1000,Coherent;560nm激光,2RU-VFL-P-2000-560-B1R,MPBCommunications;647nm激光,2RU-VFL-P-1500-647-B1R,MPB Communication;和750nm激光,2RU-VFL-P-500-750-B1R,MPB Communications)用于照明。声光可调滤光器(AOTF)用来控制488nm、560nm和647nm激光的强度;405nm激光通过直接数字信号调制;750nm激光通过机械快门开关。定制二向色(Chroma,zy405/488/561/647/752RP-UF1)和发射滤光器(Chroma,ZET405/488/461/647-656/752m)用来将激发照明与荧光发射分开。将发射光成像到Hamamatsu数字CMOS照相机上。在采集期间,使用自动XY平台(Ludl,BioPrecision2)转移样品并使用自制自动聚焦系统保持聚焦。
对于需要较高的成像通量的实验,使用40x物镜(CFI60 Plan Fluor 40x油浸物镜)来获取每视野(FOV)更多的细胞。使用四照相机系统来分开地且同时地采集来自750nm、647nm、561nm和488nm荧光团的信号。详细地来说,四照相机座架(QuadCam LS 1.0x,89North)安装在Nikon Ti-U显微镜主体上,将4个Hamamatsu数字CMOS照相机安装在该座架上。将4个分离来自不同荧光团的信号的二向色滤光器(T495lpxr,T562lpxr,T647lpxr,T760lpxr,Chroma Tech)和4个单波段发射滤光器(ET 450/50m,ET 525/50m,ET 605/75m和ET 705/70m,Chroma Tech)安装在照相机座架上。为了使来自4个照相机的信号对齐,将多色珠(FP-0257-2,Spherotech)成像并通过MatLab中的cp2tform函数将来自647nm、561nm和488nm彩色通道的信号与来自750nm彩色通道的信号对齐。Cp2tform对x、y和z坐标推导多项式空间变换,并将该变换应用于条形码和表型信号。为了在四照相机设置上对细胞核成像,使用1:1000 647nm Nucred染料(R37106,ThermoFisher)代替DAPI。
在上样到流动室之前,将样品用Atto565-标记的20-nt读出探针(数据集S5)染色,该探针具有与用于报告基因mRNA成像的FISH探针上的读出序列互补的序列。所述染色在杂交缓冲液(2x SSC中的10%碳酸亚乙酯(Sigma,E26258))中进行,读出探针浓度为3nM。用于报告基因的读出探针仅引入一次,但在所有杂交轮次期间反复进行成像。在连续轮次的杂交中引入用于表型成像的7个分子靶标(SON蛋白和6个RNA靶标)的读出探针和用于条形码成像的读出探针。对于表型和条形码成像,使在杂交缓冲液(2x SSC中的10%碳酸亚乙酯)中的3nM与SON抗体(Abcam,ab121759)上的寡核苷酸序列互补、或与6个RNA靶标的FISH探针上的读出探针互补、或与用于条形码成像的二级扩增探针上的读出序列互补的20-nt读出探针(Bio-Synthesis Inc.,数据集S5)流入到流动室中,静置15分钟,接着用杂交缓冲液洗涤。将用于这些探针的染料,Alexa 488、Cy5或Alexa 750,通过可裂解的二硫键连接到寡核苷酸(Biosynthesis,数据集S5)。在抗漂白缓冲液(对于50mL抗漂白缓冲液:50mg葡萄糖氧化酶(gluco-oxidase,Sigma,G2133),50mg(+/-)-6-羟基-2,5,7,8-四甲基色满-2-羧酸(Trolox)(Sigma,238813),300微升过氧化氢酶(Sigma,C100-500MG),10%w/v葡萄糖(Sigma,G8270),5mL 500微摩尔Trolox醌和50微升鼠RNA酶抑制剂)中对样品成像。对于每轮杂交,对来自4个彩色通道(488nm、561nm、647nm和750nm,如果在该轮中包括表型成像)或三个彩色通道(561nm、647nm和750nm,如果在该轮中不包括表型成像)的荧光信号成像。在每轮后,读出探针上的染料被10%三(2-羧乙基)膦(TCEP;Sigma,646547-10X1ML)裂解,接着是下一轮读出探针的杂交。
出于对报告基因信号和条形码信号之间的共定位比的定量以及出于图像配准的原因,在每轮中使用561nm通道检测报告基因mRNA信号。通过连续轮次的杂交,以及在1-18轮中利用可裂解的Cy5和Alexa750染料使用647nm和750nm通道成像,测量条形码信号,这允许对12个-三位条形码的所有36个数值成像。通过连续轮次的杂交,以及在1-7轮中利用可裂解的Alexa 488染料使用488nm通道成像,测量表型成像中的SON和6个RNA靶标的信号。对于表型成像,以稍高的焦平面(2-3微米)采集图像,该焦平面对来自核内部的信号是最合适的。
对于使用两个已知表型(HA或Myc标记的报告基因的表达)测量条形码标识误差的实验中,Myc和HA标签用Alexa 405-染料和Alexa 488-染料标记的二抗染色,并分别在405nm和488nm通道成像。
对DAPI染色成像并用于细胞分割和核标识。对于测量两个已知表型(HA或Myc标记的报告基因)的实验,在最后一轮成像时对DAPI染色进行成像。对于筛选调节核RNA定位的因子的实验,在第一轮成像时对DAPI染色进行成像。染料标记的读出探针的序列在数据集S5中列出。
转录抑制。对于转录抑制,50微摩尔DRB(Sigma,D1916-10MG)在EMEM中混合并在固定前与细胞孵育1小时。
条形码解码分析。为了校正照明中的不一致性,指定的彩色通道的每个图像除以该照明色的全部图像的平均强度图像。多轮的图像使用报告基因mRNA的未裂解信号进行配准。使用DAPI染色作为种子和细胞自发荧光(用于评价条形码解码准确度和慢病毒重组的实验)或用于细胞边界标识的包含多聚腺苷酸的RNA染色(用于筛选调节核RNA定位的因子的实验)通过分水岭算法对细胞进行分割。使用斑点发现算法(spot finding algorithm)标识所有杂交中报告基因mRNA和条形码的单分子信号。对于使用4-照相机成像的实验,使用分割算法鉴定斑点。详细来说,选择强度大于亮度阈值的像素。所选择的像素的簇通过MatLab中的bwareaopen函数标识。保留有边界面积范围(2-30个像素)内的簇。通过对原始图像的视觉检查确定该面积范围。为了俘获具有强度变化的斑点,使用多个亮度阈值反复进行此过程,例如,从0.6x max(FOV中的像素强度)至0.3x max(FOV中的像素强度),递减0.05x max(FOV中的像素强度)。手动地确定每个三位信号的亮度阈值。对于每次重复,较低的亮度阈值将标识两种类型的簇:(i)在前一轮较高的亮度阈值下不能检测到的模糊的簇和(ii)完全包括前一轮标识的一个或多个簇的较大的簇。对于类型(i)的任何簇,仅在其面积在上述的容许面积范围内时才保留。对于类型(ii)的任何簇,如果其面积在该容许面积范围内,则保留;否则,将其去除,并且代而保留与此新簇重叠的前一轮标识的较小的簇。这些簇的中心通过MatLab中的regionprops函数标识。
单分子FISH斑点被分配给细胞,条形码中三位的三个数值中的每一个的共定位比计算为与条形码smFISH信号共定位的报告基因smFISH斑点的数目除以细胞内报告基因smFISH斑点的总数。为了确定每个细胞的每个三位的数值,基于该三位的三个共定位比通过k-均值聚类对细胞进行聚类,并且基于三个平均共定位比中哪一个是该聚类中最高的将所述三位数值分配给每个聚类。对全部12个三位重复所述相同的过程,使得每个细胞都被分配以一个12-三位条形码。对于三位的每个数值,被分配以该值的该细胞群体的平均共定位比测量为0.4;而从没有被分配该三位数值的两个细胞群体评估的因与非特异性结合的探针的随机共定位产生的平均共定位比测量为0.1。
为了基于单独条形码信号解码细胞(即,不考虑条形码信号和报告基因信号之间的共定位),基于对每个细胞内的三个三位数值检测的条形码信号斑点的数目对细胞进行聚类。使用k-均值聚类算法将细胞分成三个群体,基于所述三个三位数值中的哪一个具有最高的平均斑点数目将该三位数值分配给每个群体。对所有12个三位重复此相同过程。
为了评估条形码错误标识率,由于因瓶颈策略在文库中仅存在所有可能的条形码的0.4%,任何错误解码的条形码匹配文库中的条形码的概率仅为0.4%。因此,在57%的精确匹配的条形码中,仅大致p=0.3%可以来自条形码错误标识(从(p*57%)/(1-57%)=0.4%/(1-0.4%)求解)。
Myc和HA信号定量。为了定量核中的HA和Myc表达,每个细胞的核边界用作测量相应Myc或HA通道的强度的掩膜。为了允许将HA和Myc表达清楚地分配给单个细胞,首先确定HA和Myc表达的阈值,在该阈值之上可以确定地检测到HA或Myc标签表达。为了确定这些阈值,使用k-均值聚类算法基于其非阈值化的HA和Myc标签染色强度来将细胞聚类成两组。这种分组允许近似地将细胞分成表达HA的细胞和表达Myc的细胞。为了评估HA标签的背景染色水平,计算在表达Myc的簇中细胞的HA强度的均值和标准差,HA信号的阈值计算为均值加三个标准差。Myc表达的阈值与表达HA的簇类似地确定。HA和Myc强度均低于它们各自的阈值或均高于它们各自的阈值的细胞被剔除(2336个细胞中的197个)。在去除这些不明确的细胞后,剩余的细胞再次使用k-均值聚类算法进行聚类以获得最终的分组,如图2C中所示。
重组率计算。对于第i个sgRNA(具有条形码或UMI)的重组率ai基于下列的公式:
Bi,day n=Pi,day 2*((1-ai)*Si+ai*C)
Figure BDA0003406624250000821
Figure BDA0003406624250000822
其中n是转导后的天数,在这些实验中n等于21或28。Piday 2是在转导后第2天通过对第i个sgRNA测序确定的归一化的原型间隔序列读数(通过在转导后第2天测量的总原型间隔序列读数归一化)。Pi,day n是在转导后第n天对第i个sgRNA测序确定的归一化的原型间隔序列读数(通过在转导后第n天测量的总原型间隔序列读数归一化)。Bi,day n是通过条形码成像确定的归一化的细胞数目或通过测序确定的归一化的UMI读数(通过在转导后第n天时的总细胞数或UMI读数归一化)。Si是第i个sgRNA的生存率。C是文库内所有sgRNA的平均生存率,通过考虑文库内不同sgRNA的冗余权重来计算,如果发生重组,则其是平均生存率。
表型测量定量。通过DAPI信号确定核边界。将核与成像视野的边缘接触的细胞从进一步分析中剔除。为了标识MRP、前核糖体和SON的簇,减去通道的背景强度,使用函数regionprops(MatLab)和bwareaopen(MatLab)来标识簇,类似于用于利用4-照相机成像的实验的斑点发现算法。详细来说,选择强度大于亮度阈值的像素。所选择的像素的簇通过bwareaopen函数标识。保留有边界面积范围(对于SON为20-3000个像素,对于前核糖体为100-5000个像素,对于MRP为100-6000个像素)内的簇。通过对原始图像的视觉检查确定该面积范围。为了俘获染色水平的变化相对宽的簇,使用多个亮度阈值反复进行此过程(从0.9 x max(核中的像素强度)至0.1 x max(核中的像素强度),递减0.05x max(核中的像素强度))。最终标识的簇的数目和每个簇的面积使用regionprops函数测量。对于MRP、前核糖体和SON,对每个细胞计算簇的数目、簇的平均面积、和簇强度(定义为簇边界内的总信号除以总簇面积)。为了定量核斑点富集MALAT1、7SK、U2和包含多聚腺苷酸的RNA,使用来自SON染色的簇边界作为掩膜以测量所述SON簇边界内的MALAT1、7SK、U2和包含多聚腺苷酸的RNA信号。这些RNA中每一个的核斑点强度测量为所述SON簇边界内所述RNA的总信号除以SON簇所覆盖的总面积。斑点外的信号强度测量为在核中但在核斑点外的RNA的总信号除以不在核斑点中的核的总面积。核斑点富集确定为核斑点强度和斑点外信号强度的比率。
为了鉴定来自此筛选的命中,将实验的四次重复合并。每个重复的上述定量值(即,簇数目、簇面积、簇强度、和核斑点富集)通过合并前每个重复内所有细胞的平均值归一化。使用学生t检验通过对携带一个靶向sgRNA的细胞的测量值相对于携带所有对照非靶向sgRNA的细胞的测量值进行检验,来计算p值。当靶向特定基因的至少两个sgRNA显示p值<0.05,则该基因列为命中。将具有小于40个细胞的sgRNA从分析中剔除。
数据集S1
用于关于重组效应减少来评价慢病毒设计的sgRNA文库。此数据集列举了159个靶向必需核糖体基因的sgRNA和51个非靶向sgRNA的原型间隔序列的寡核苷酸序列。
Figure BDA0003406624250000841
Figure BDA0003406624250000851
Figure BDA0003406624250000861
Figure BDA0003406624250000871
Figure BDA0003406624250000881
Figure BDA0003406624250000891
Figure BDA0003406624250000901
Figure BDA0003406624250000911
Figure BDA0003406624250000921
数据集S2
用于调节核中的RNA定位的因子的基因筛选的sgRNA文库。此数据集列举了162个靶向所选择的用于调节核中的RNA定位的候选基因的sgRNA和5个非靶向sgRNA的原型间隔序列的寡核苷酸序列。
Figure BDA0003406624250000922
Figure BDA0003406624250000931
Figure BDA0003406624250000941
Figure BDA0003406624250000951
Figure BDA0003406624250000961
Figure BDA0003406624250000971
Figure BDA0003406624250000981
数据集S3
在调节核RNA定位的因子的筛选中定量的特征和鉴定到的基因命中。此数据集列出了在筛选中定量的单个表型特征的基因命中。
Figure BDA0003406624250000991
数据集S4
用于文库克隆和测序的DNA寡核苷酸序列。此数据集列出了用于文库构建和下一代测序的DNA寡核苷酸序列(用于确定文库内条形码身份和条形码-sgRNA对应关系,和用于定量重组定量中的原型间隔序列和UMI丰度)。
Figure BDA0003406624250000992
Figure BDA0003406624250001001
Figure BDA0003406624250001011
Figure BDA0003406624250001021
Figure BDA0003406624250001031
Figure BDA0003406624250001041
Figure BDA0003406624250001051
Figure BDA0003406624250001061
数据集S5
用于条形码、报告基因和表型成像的FISH探针序列。此数据集包括下列寡核苷酸探针的单独列表:
用于条形码成像的初级扩增探针
用于条形码图像的二级扩增探针
用于包含多聚腺苷酸的RNA的FISH探针
用于MALAT1的FISH探针
用于7SK的FISH探针
用于MRP的FISH探针
用于前核糖体的FISH探针
用于U2 snRNA的FISH探针
用于报告基因Puro-T2A-mCherry或mCherry-萤光素酶的FISH探针与SON抗体连接的寡核苷酸探针
所有上述靶标的读出探针
一些探针被修饰,并在探针序列中显示了修饰。
Figure BDA0003406624250001062
Figure BDA0003406624250001071
Figure BDA0003406624250001081
虽然本文已经描述和示出了本发明的若干实施方案,但是本领域普通技术人员将容易想到用于执行本文描述的功能和/或获得本文描述的结果和/或一个或多个优势的各种其它手段和/或结构,并且这些变化和/或修改中的每一个被认为在本发明的范围内。更一般地,本领域技术人员将容易地理解,本文描述的所有参数、尺寸、材料和构造意在是示例性的,并且实际参数、尺寸、材料和/或构造将取决于使用本发明的教导的一个或多个具体应用。本领域技术人员将通过使用不超过常规实验而认识到或者能够确定本文所述的本发明的具体实施方案的许多等同物。因此,应当理解,前述实施方案仅以举例的方式给出,并且在所附权利要求及其等同物的范围内,本发明可以以不同于具体描述和请求保护的方式实施。本发明涉及本文所述的每个单独的特征、系统、制品、材料、试剂盒和/或方法。此外,如果这些特征、系统、制品、材料、试剂盒和/或方法不相互矛盾,则两个或更多个此类特征、系统、制品、材料、试剂盒和/或方法的任何组合也包括在本发明的范围内。
在本说明书和通过引用并入的文献包括冲突和/或不一致的公开内容的情况下,以本说明书为准。如果通过引用并入的两个或更多个文献包括彼此冲突和/或不一致的公开内容,则以具有较晚的有效日的文献为准。
本文定义和使用的所有定义应理解为优先于字典定义、通过引用并入的文献中的定义和/或所定义术语的普通含义。
除非清楚地相反指示,否则本文在说明书和权利要求书中使用的不定冠词“一个”和“一种”应当被理解为是指“至少一个/一种”。
如在本文中在说明书和权利要求中所用,短语“和/或”应当被理解为意指所连接的元素的“任一个或两者”,即元素在一些情况下结合地存在以及在其它情况下分离地存在。利用“和/或”列出的多个元素应当以相同的方式来解释,即所连接的元素的“一个或多个”。除通过“和/或”从句明确确定的元素外,还可任选地存在其它元素,无论与明确确定的那些元素相关还是无关。因此,作为非限定性实例,对“A和/或B”的提及,当与开放性措辞诸如“包含/包括”结合使用时,在一个实施方案中可仅指A(任选地包括除B外的元素);在另一个实施方案中可仅指B(任选地包括除A外的元素);在另一个实施方案中,可指A和B(任选地包括其它元素);等等。
如本文中在说明书和权利要求中所用,“或”应当被理解为具有与如上定义的“和/或”相同的含义。例如,当在列表中分开各项时,“或”或“和/或”应当被理解为是包括性的,即包括至少一个,但也包括许多个元素或一列元素中的多于一个,以及任选地,包括另外未列出的项。只有明确地指明相反的术语,例如“……中的仅一个”或“……中的恰好一个”或当用于权利要求中时的“由……组成”将指包含多个元素或一列元素中的正好一个元素。一般地,如本文中所用的术语“或”应当仅在冠有排他性的术语诸如“任一”、“……之一”、“……中的仅一个”或“……中的恰好一个”时被解释为表示排他性选择(即“一个或另一个但非两个”)。
如本文中在说明书和权利要求中所用,关于一个或多个元素的列表的短语“至少一个”应当被理解为意指选自元素列表中的任何一个或多个元素的至少一个元素,但不一定包括元素列表内明确列出的每一个元素的至少一个并且不排除元素列表中的元素的任何组合。该定义还允许可任选地存在除短语“至少一个”所指的元素列表内明确确定的元素外的元素,无论与那些明确确定的元素相关还是不相关。因此,作为非限定性实例,“A和B的至少一个”(或,等同地,“A或B的至少一个”或,等同地“A和/或B的至少一个”)可在一个实施方案中指至少一个(任选地包括不止一个)A而无B存在(且任选地包括除B外的元素);在另一个实施方案中指至少一个(任选地包括不止一个)B而无A存在(且任选地包括除A外的元素);在另一个实施方案中指至少一个(任选地包括不止一个)A和至少一个(任选地包括不止一个)B(且任选地包括其它元素);等等。
当在本文中使用词语“约”来指代数字时,应当理解,本发明的另一个实施方案包括未被词语“约”修饰的数字。
还应当理解,除非明确地指明与之相反,否则在包括不止一个步骤或行为的本文请求保护的任何方法中,所述方法的步骤或行为的顺序不必须地限定于其中叙述所述方法的步骤或行为的顺序。
在权利要求中,以及在上述说明书中,所有过渡短语诸如“包含”、“包括”、“携带”、“具有”、“含有”、“牵涉”、“持有”、“由……组成”等被理解为开放性的,即意指包括但不限于。只有过渡短语“由……组成”和“基本上由……组成”应当分别是封闭性的或半封闭性的过渡短语,如美国专利局专利审查程序手册第2111.03节中所示的。
序列表
<110> 哈佛学院院长及董事(President and Fellows of Harvard College)
<120> 基于成像的混合CRISPR筛选
<130> H0498.70693WO00
<140> 尚未分配
<141> 即为本申请的提交日期
<150> US 62/841,715
<151> 2019-05-01
<150> US 62/836,578
<151> 2019-04-19
<160> 566
<170> PatentIn version 3.5
<210> 1
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 1
tcttgtggaa agccagaaac atggactact taccagggac acctgtttca gagctaagca 60
caagagtgc 69
<210> 2
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 2
tcttgtggaa agccagaaac atggcacaca cagagaactt aggggtttca gagctaagca 60
caagagtgc 69
<210> 3
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 3
tcttgtggaa agccagaaac atggctcacc tttggaaaac acaggtttca gagctaagca 60
caagagtgc 69
<210> 4
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 4
tcttgtggaa agccagaaac atggactgac cattcagaac agacgtttca gagctaagca 60
caagagtgc 69
<210> 5
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 5
tcttgtggaa agccagaaac atggcacctg cggatcttac gggcgtttca gagctaagca 60
caagagtgc 69
<210> 6
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 6
tcttgtggaa agccagaaac atggcctccc tctaggccgg aagggtttca gagctaagca 60
caagagtgc 69
<210> 7
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 7
tcttgtggaa agccagaaac atgggaagat tgaagccaga gaaagtttca gagctaagca 60
caagagtgc 69
<210> 8
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 8
tcttgtggaa agccagaaac atggacaacc tcttcaacac aaccgtttca gagctaagca 60
caagagtgc 69
<210> 9
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 9
tcttgtggaa agccagaaac atggctacga gagtacaagg tagtgtttca gagctaagca 60
caagagtgc 69
<210> 10
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 10
tcttgtggaa agccagaaac atggagacct tcttcttgcc acaggtttca gagctaagca 60
caagagtgc 69
<210> 11
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 11
tcttgtggaa agccagaaac atggatagca tagtggtcaa gcctgtttca gagctaagca 60
caagagtgc 69
<210> 12
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 12
tcttgtggaa agccagaaac atggagtcgg ctttcctttc caaggtttca gagctaagca 60
caagagtgc 69
<210> 13
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 13
tcttgtggaa agccagaaac atggatcttc cttcgaatgt gggagtttca gagctaagca 60
caagagtgc 69
<210> 14
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 14
tcttgtggaa agccagaaac atggacgcaa agctgtcatc gtgagtttca gagctaagca 60
caagagtgc 69
<210> 15
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 15
tcttgtggaa agccagaaac atggccaccg aggcctgcgc aagggtttca gagctaagca 60
caagagtgc 69
<210> 16
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 16
tcttgtggaa agccagaaac atggaaagtg ggaagtacgt cctggtttca gagctaagca 60
caagagtgc 69
<210> 17
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 17
tcttgtggaa agccagaaac atggagaggg atactcacac tccagtttca gagctaagca 60
caagagtgc 69
<210> 18
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 18
tcttgtggaa agccagaaac atggagggtt cgtagaagat tcaagtttca gagctaagca 60
caagagtgc 69
<210> 19
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 19
tcttgtggaa agccagaaac atggaacaaa gaaacatgtc agcagtttca gagctaagca 60
caagagtgc 69
<210> 20
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 20
tcttgtggaa agccagaaac atggcaatgg atttccggac gactgtttca gagctaagca 60
caagagtgc 69
<210> 21
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 21
tcttgtggaa agccagaaac atggaacaaa accagagtca tctggtttca gagctaagca 60
caagagtgc 69
<210> 22
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 22
tcttgtggaa agccagaaac atggcatggc cctacgctac cctagtttca gagctaagca 60
caagagtgc 69
<210> 23
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 23
tcttgtggaa agccagaaac atggaggcct tagagccaca gcgggtttca gagctaagca 60
caagagtgc 69
<210> 24
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 24
tcttgtggaa agccagaaac atggagcaag tgtacttggc gtgcgtttca gagctaagca 60
caagagtgc 69
<210> 25
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 25
tcttgtggaa agccagaaac atggcagcag atacctttac acccgtttca gagctaagca 60
caagagtgc 69
<210> 26
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 26
tcttgtggaa agccagaaac atggattacc agggatgttt ctgagtttca gagctaagca 60
caagagtgc 69
<210> 27
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 27
tcttgtggaa agccagaaac atgggactgg tgatgaatac aatggtttca gagctaagca 60
caagagtgc 69
<210> 28
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 28
tcttgtggaa agccagaaac atggacaggg ttgcggctgc aatggtttca gagctaagca 60
caagagtgc 69
<210> 29
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 29
tcttgtggaa agccagaaac atggcgtttg tcatcagaat cagagtttca gagctaagca 60
caagagtgc 69
<210> 30
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 30
tcttgtggaa agccagaaac atggcaccct ttacttctca ggacgtttca gagctaagca 60
caagagtgc 69
<210> 31
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 31
tcttgtggaa agccagaaac atggagactg ctgcctcata tccggtttca gagctaagca 60
caagagtgc 69
<210> 32
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 32
tcttgtggaa agccagaaac atggagcccc accagcaggt acacgtttca gagctaagca 60
caagagtgc 69
<210> 33
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 33
tcttgtggaa agccagaaac atggccgatg ttcttgtagt accggtttca gagctaagca 60
caagagtgc 69
<210> 34
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 34
tcttgtggaa agccagaaac atggaaacac tcaccgatct gtgagtttca gagctaagca 60
caagagtgc 69
<210> 35
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 35
tcttgtggaa agccagaaac atggcaacat agcagcatat ggtggtttca gagctaagca 60
caagagtgc 69
<210> 36
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 36
tcttgtggaa agccagaaac atggatcatc ctacccgaga tggtgtttca gagctaagca 60
caagagtgc 69
<210> 37
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 37
tcttgtggaa agccagaaac atggatcaac aatgccgaaa agaggtttca gagctaagca 60
caagagtgc 69
<210> 38
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 38
tcttgtggaa agccagaaac atggagctcc gcaacaagat agcagtttca gagctaagca 60
caagagtgc 69
<210> 39
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 39
tcttgtggaa agccagaaac atggaaagga tggaaaatac agccgtttca gagctaagca 60
caagagtgc 69
<210> 40
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 40
tcttgtggaa agccagaaac atggaactgg ttctacacgc gagcgtttca gagctaagca 60
caagagtgc 69
<210> 41
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 41
tcttgtggaa agccagaaac atggaaaaac acccgtggag ccgggtttca gagctaagca 60
caagagtgc 69
<210> 42
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 42
tcttgtggaa agccagaaac atggtacaaa gatgacatcc ggtggtttca gagctaagca 60
caagagtgc 69
<210> 43
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 43
tcttgtggaa agccagaaac atggcgtcat tcgaaacata gtgggtttca gagctaagca 60
caagagtgc 69
<210> 44
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 44
tcttgtggaa agccagaaac atggatcagt ctctgctgat cagggtttca gagctaagca 60
caagagtgc 69
<210> 45
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 45
tcttgtggaa agccagaaac atggaaatca ttatcttagc caccgtttca gagctaagca 60
caagagtgc 69
<210> 46
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 46
tcttgtggaa agccagaaac atggaaaaac gcaacaatca gatagtttca gagctaagca 60
caagagtgc 69
<210> 47
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 47
tcttgtggaa agccagaaac atgggttcat taaaatcgat ggcagtttca gagctaagca 60
caagagtgc 69
<210> 48
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 48
tcttgtggaa agccagaaac atggacctgc ctcacagtgc aggggtttca gagctaagca 60
caagagtgc 69
<210> 49
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 49
tcttgtggaa agccagaaac atggactgta gtatcagtca gtccgtttca gagctaagca 60
caagagtgc 69
<210> 50
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 50
tcttgtggaa agccagaaac atggaaattg aagttggtgg tggtgtttca gagctaagca 60
caagagtgc 69
<210> 51
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 51
tcttgtggaa agccagaaac atggacaaga aataccgtgc cctggtttca gagctaagca 60
caagagtgc 69
<210> 52
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 52
tcttgtggaa agccagaaac atgggcaaaa cttatgtgac cccggtttca gagctaagca 60
caagagtgc 69
<210> 53
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 53
tcttgtggaa agccagaaac atggcataaa tctcaagagg acctgtttca gagctaagca 60
caagagtgc 69
<210> 54
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 54
tcttgtggaa agccagaaac atgggacacc atgtggccac aaaggtttca gagctaagca 60
caagagtgc 69
<210> 55
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 55
tcttgtggaa agccagaaac atgggaagaa ctatgatccc cagagtttca gagctaagca 60
caagagtgc 69
<210> 56
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 56
tcttgtggaa agccagaaac atggggatgc gaagttcccg catggtttca gagctaagca 60
caagagtgc 69
<210> 57
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 57
tcttgtggaa agccagaaac atgggacccc aacgagatca aagtgtttca gagctaagca 60
caagagtgc 69
<210> 58
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 58
tcttgtggaa agccagaaac atgggccgga tgggacccga cgcggtttca gagctaagca 60
caagagtgc 69
<210> 59
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 59
tcttgtggaa agccagaaac atggctgccc cacaaaacca agcggtttca gagctaagca 60
caagagtgc 69
<210> 60
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 60
tcttgtggaa agccagaaac atgggtctcc tttggacctc atgcgtttca gagctaagca 60
caagagtgc 69
<210> 61
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 61
tcttgtggaa agccagaaac atggccgcca taacaaggac cgaagtttca gagctaagca 60
caagagtgc 69
<210> 62
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 62
tcttgtggaa agccagaaac atggctgcgc tatgactccc ggaggtttca gagctaagca 60
caagagtgc 69
<210> 63
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 63
tcttgtggaa agccagaaac atgggaatgc cagagaaggt cacagtttca gagctaagca 60
caagagtgc 69
<210> 64
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 64
tcttgtggaa agccagaaac atgggcacgt cacccacctt ccgggtttca gagctaagca 60
caagagtgc 69
<210> 65
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 65
tcttgtggaa agccagaaac atggcgtagc gcctcccgtg tccggtttca gagctaagca 60
caagagtgc 69
<210> 66
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 66
tcttgtggaa agccagaaac atggatttgc tcttaggttg tacggtttca gagctaagca 60
caagagtgc 69
<210> 67
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 67
tcttgtggaa agccagaaac atgggggata tccacagagt acctgtttca gagctaagca 60
caagagtgc 69
<210> 68
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 68
tcttgtggaa agccagaaac atggccgtgt cattgcccac acccgtttca gagctaagca 60
caagagtgc 69
<210> 69
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 69
tcttgtggaa agccagaaac atggaataga gtactatgct atgtgtttca gagctaagca 60
caagagtgc 69
<210> 70
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 70
tcttgtggaa agccagaaac atggcagatg tgcgcattga caccgtttca gagctaagca 60
caagagtgc 69
<210> 71
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 71
tcttgtggaa agccagaaac atggatttcc ttcagcgtaa ctgggtttca gagctaagca 60
caagagtgc 69
<210> 72
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 72
tcttgtggaa agccagaaac atgggtaaac aattctatta ccaggtttca gagctaagca 60
caagagtgc 69
<210> 73
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 73
tcttgtggaa agccagaaac atgggttaat aactgtgaga acacgtttca gagctaagca 60
caagagtgc 69
<210> 74
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 74
tcttgtggaa agccagaaac atggagcaac acagtcactc ctgggtttca gagctaagca 60
caagagtgc 69
<210> 75
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 75
tcttgtggaa agccagaaac atggcccagg cacagccgac gccggtttca gagctaagca 60
caagagtgc 69
<210> 76
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 76
tcttgtggaa agccagaaac atggcctcat tcgaccagtt ccgggtttca gagctaagca 60
caagagtgc 69
<210> 77
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 77
tcttgtggaa agccagaaac atgggccaaa cgtaccaaga aagtgtttca gagctaagca 60
caagagtgc 69
<210> 78
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 78
tcttgtggaa agccagaaac atggcctgct cacagcccga cgaagtttca gagctaagca 60
caagagtgc 69
<210> 79
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 79
tcttgtggaa agccagaaac atggcagact agtgctgagt cttggtttca gagctaagca 60
caagagtgc 69
<210> 80
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 80
tcttgtggaa agccagaaac atgggaggct tgtctatccc tcacgtttca gagctaagca 60
caagagtgc 69
<210> 81
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 81
tcttgtggaa agccagaaac atgggccaag aaggttgatg ctgggtttca gagctaagca 60
caagagtgc 69
<210> 82
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 82
tcttgtggaa agccagaaac atgggaactg aaattcgaat ggcggtttca gagctaagca 60
caagagtgc 69
<210> 83
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 83
tcttgtggaa agccagaaac atggagagag ccatcctcta taaggtttca gagctaagca 60
caagagtgc 69
<210> 84
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 84
tcttgtggaa agccagaaac atggcaccac agccttcccg cgaagtttca gagctaagca 60
caagagtgc 69
<210> 85
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 85
tcttgtggaa agccagaaac atggattgaa gacgtcattg cccagtttca gagctaagca 60
caagagtgc 69
<210> 86
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 86
tcttgtggaa agccagaaac atggggatgt agtgcagata gtctgtttca gagctaagca 60
caagagtgc 69
<210> 87
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 87
tcttgtggaa agccagaaac atggccagcg cgctacttac agtggtttca gagctaagca 60
caagagtgc 69
<210> 88
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 88
tcttgtggaa agccagaaac atggccggag tttgatgtgt aggggtttca gagctaagca 60
caagagtgc 69
<210> 89
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 89
tcttgtggaa agccagaaac atggcttgcg caggcgcttc agcagtttca gagctaagca 60
caagagtgc 69
<210> 90
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 90
tcttgtggaa agccagaaac atggcctcac aggcaggcta aacagtttca gagctaagca 60
caagagtgc 69
<210> 91
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 91
tcttgtggaa agccagaaac atggatatcc agaaagttta cctcgtttca gagctaagca 60
caagagtgc 69
<210> 92
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 92
tcttgtggaa agccagaaac atggagacat tgacctcacc aagagtttca gagctaagca 60
caagagtgc 69
<210> 93
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 93
tcttgtggaa agccagaaac atgggcgcgg cacctgtacc tccggtttca gagctaagca 60
caagagtgc 69
<210> 94
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 94
tcttgtggaa agccagaaac atggaccagt tcgaatgcct accagtttca gagctaagca 60
caagagtgc 69
<210> 95
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 95
tcttgtggaa agccagaaac atggtaggca ctgtcgcctt cccggtttca gagctaagca 60
caagagtgc 69
<210> 96
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 96
tcttgtggaa agccagaaac atggctgtgc ccgatgcgtg cccagtttca gagctaagca 60
caagagtgc 69
<210> 97
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 97
tcttgtggaa agccagaaac atggccaccc ggcccgtacc tcgagtttca gagctaagca 60
caagagtgc 69
<210> 98
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 98
tcttgtggaa agccagaaac atggagatgg ctactctgga gttggtttca gagctaagca 60
caagagtgc 69
<210> 99
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 99
tcttgtggaa agccagaaac atggcagacg aagcaagtaa ccatgtttca gagctaagca 60
caagagtgc 69
<210> 100
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 100
tcttgtggaa agccagaaac atggtaagat acttacaaac acacgtttca gagctaagca 60
caagagtgc 69
<210> 101
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 101
tcttgtggaa agccagaaac atggcataca cctgctcaca ggcggtttca gagctaagca 60
caagagtgc 69
<210> 102
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 102
tcttgtggaa agccagaaac atggagtggt gggaacgaca aacagtttca gagctaagca 60
caagagtgc 69
<210> 103
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 103
tcttgtggaa agccagaaac atggataagc aaaagcgtcc cagggtttca gagctaagca 60
caagagtgc 69
<210> 104
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 104
tcttgtggaa agccagaaac atggacagca caccgtaccg acaggtttca gagctaagca 60
caagagtgc 69
<210> 105
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 105
tcttgtggaa agccagaaac atgggcggac cagccgccgc agcagtttca gagctaagca 60
caagagtgc 69
<210> 106
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 106
tcttgtggaa agccagaaac atggtacaca gcgcaatggt aggtgtttca gagctaagca 60
caagagtgc 69
<210> 107
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 107
tcttgtggaa agccagaaac atggtcttgt tgatgcggat gacggtttca gagctaagca 60
caagagtgc 69
<210> 108
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 108
tcttgtggaa agccagaaac atggtcgcga caccctgtac gagggtttca gagctaagca 60
caagagtgc 69
<210> 109
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 109
tcttgtggaa agccagaaac atggttcatt tctccggatg ccaagtttca gagctaagca 60
caagagtgc 69
<210> 110
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 110
tcttgtggaa agccagaaac atggtcttct gcagttaaac acaggtttca gagctaagca 60
caagagtgc 69
<210> 111
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 111
tcttgtggaa agccagaaac atggtaccac acgaaggtgc gcgcgtttca gagctaagca 60
caagagtgc 69
<210> 112
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 112
tcttgtggaa agccagaaac atggtctttc tctaacagaa aaaggtttca gagctaagca 60
caagagtgc 69
<210> 113
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 113
tcttgtggaa agccagaaac atggttgtcg gacatacttc tggtgtttca gagctaagca 60
caagagtgc 69
<210> 114
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 114
tcttgtggaa agccagaaac atggtcctgg ccgggaaaac aagagtttca gagctaagca 60
caagagtgc 69
<210> 115
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 115
tcttgtggaa agccagaaac atgggaagtt cttcacccgc aggggtttca gagctaagca 60
caagagtgc 69
<210> 116
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 116
tcttgtggaa agccagaaac atggtgtacc cttccgctta cctggtttca gagctaagca 60
caagagtgc 69
<210> 117
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 117
tcttgtggaa agccagaaac atggtaaagc tgaagccaaa gcgagtttca gagctaagca 60
caagagtgc 69
<210> 118
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 118
tcttgtggaa agccagaaac atgggccgag cagtcaaatt ccaggtttca gagctaagca 60
caagagtgc 69
<210> 119
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 119
tcttgtggaa agccagaaac atggtttgcg attcttgctt cggtgtttca gagctaagca 60
caagagtgc 69
<210> 120
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 120
tcttgtggaa agccagaaac atggtggcag ctgtcacttt gcgggtttca gagctaagca 60
caagagtgc 69
<210> 121
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 121
tcttgtggaa agccagaaac atggtgagat gatcgacgtc atcggtttca gagctaagca 60
caagagtgc 69
<210> 122
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 122
tcttgtggaa agccagaaac atggtgcttt gtagaaaaag tcgcgtttca gagctaagca 60
caagagtgc 69
<210> 123
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 123
tcttgtggaa agccagaaac atgggcttca agaagcgtgc acctgtttca gagctaagca 60
caagagtgc 69
<210> 124
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 124
tcttgtggaa agccagaaac atggcttcca gctccttgac gttggtttca gagctaagca 60
caagagtgc 69
<210> 125
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 125
tcttgtggaa agccagaaac atggtattgt aggaaagcct acgtgtttca gagctaagca 60
caagagtgc 69
<210> 126
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 126
tcttgtggaa agccagaaac atggttacat cttagagagc ttgggtttca gagctaagca 60
caagagtgc 69
<210> 127
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 127
tcttgtggaa agccagaaac atgggtgtct taggctgtgg tccagtttca gagctaagca 60
caagagtgc 69
<210> 128
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 128
tcttgtggaa agccagaaac atgggtggct ttgccccgta cgaggtttca gagctaagca 60
caagagtgc 69
<210> 129
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 129
tcttgtggaa agccagaaac atggtttaga taactggagt gccagtttca gagctaagca 60
caagagtgc 69
<210> 130
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 130
tcttgtggaa agccagaaac atggtcggga tcgtcggtaa atacgtttca gagctaagca 60
caagagtgc 69
<210> 131
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 131
tcttgtggaa agccagaaac atgggttgca gcctcggaaa attggtttca gagctaagca 60
caagagtgc 69
<210> 132
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 132
tcttgtggaa agccagaaac atggtttgtt aggtcatcgt attggtttca gagctaagca 60
caagagtgc 69
<210> 133
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 133
tcttgtggaa agccagaaac atggtcatct tgtacatacc ctgcgtttca gagctaagca 60
caagagtgc 69
<210> 134
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 134
tcttgtggaa agccagaaac atgggttggt ggtgacaaga acgggtttca gagctaagca 60
caagagtgc 69
<210> 135
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 135
tcttgtggaa agccagaaac atggttcagc ttcgaaaggc aagggtttca gagctaagca 60
caagagtgc 69
<210> 136
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 136
tcttgtggaa agccagaaac atgggggcct actcacctgc tcgagtttca gagctaagca 60
caagagtgc 69
<210> 137
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 137
tcttgtggaa agccagaaac atggttatcc gaaatgtttc attggtttca gagctaagca 60
caagagtgc 69
<210> 138
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 138
tcttgtggaa agccagaaac atggggacga cgaccggctc aacagtttca gagctaagca 60
caagagtgc 69
<210> 139
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 139
tcttgtggaa agccagaaac atgggtaatg tgtccattcg aggggtttca gagctaagca 60
caagagtgc 69
<210> 140
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 140
tcttgtggaa agccagaaac atgggttgac atctgacgac gtgagtttca gagctaagca 60
caagagtgc 69
<210> 141
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 141
tcttgtggaa agccagaaac atgggactgg tgggatgaag gtaagtttca gagctaagca 60
caagagtgc 69
<210> 142
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 142
tcttgtggaa agccagaaac atgggctggt cgaggtccac gccggtttca gagctaagca 60
caagagtgc 69
<210> 143
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 143
tcttgtggaa agccagaaac atggtgacgt gcaactcaaa gaccgtttca gagctaagca 60
caagagtgc 69
<210> 144
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 144
tcttgtggaa agccagaaac atgggaaaag tactacacgc gcctgtttca gagctaagca 60
caagagtgc 69
<210> 145
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 145
tcttgtggaa agccagaaac atggtcaaca ccaacatcga tggggtttca gagctaagca 60
caagagtgc 69
<210> 146
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 146
tcttgtggaa agccagaaac atggtgacgg tatccaccca ttcggtttca gagctaagca 60
caagagtgc 69
<210> 147
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 147
tcttgtggaa agccagaaac atgggtgtgt gctgacttga taaggtttca gagctaagca 60
caagagtgc 69
<210> 148
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 148
tcttgtggaa agccagaaac atggtggtca tgaactttct agtggtttca gagctaagca 60
caagagtgc 69
<210> 149
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 149
tcttgtggaa agccagaaac atggtgcagc gaataggctg cacggtttca gagctaagca 60
caagagtgc 69
<210> 150
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 150
tcttgtggaa agccagaaac atggggatac gatagaaaat gtaagtttca gagctaagca 60
caagagtgc 69
<210> 151
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 151
tcttgtggaa agccagaaac atgggctgaa aaggtggcca ctaggtttca gagctaagca 60
caagagtgc 69
<210> 152
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 152
tcttgtggaa agccagaaac atggttccat ggtcaaaaaa tggcgtttca gagctaagca 60
caagagtgc 69
<210> 153
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 153
tcttgtggaa agccagaaac atggtgttcc tcaggaaaat gatggtttca gagctaagca 60
caagagtgc 69
<210> 154
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 154
tcttgtggaa agccagaaac atggttcact gcaatgtaat cctggtttca gagctaagca 60
caagagtgc 69
<210> 155
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 155
tcttgtggaa agccagaaac atggtacttt ctatgagaag cgtagtttca gagctaagca 60
caagagtgc 69
<210> 156
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 156
tcttgtggaa agccagaaac atgggccaag atcgtgaagc ccaagtttca gagctaagca 60
caagagtgc 69
<210> 157
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 157
tcttgtggaa agccagaaac atgggctggt tcgtaccaag acccgtttca gagctaagca 60
caagagtgc 69
<210> 158
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 158
tcttgtggaa agccagaaac atggtgggct ccggaacaaa cgtggtttca gagctaagca 60
caagagtgc 69
<210> 159
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 159
tcttgtggaa agccagaaac atggttggca gggagctcac tcaggtttca gagctaagca 60
caagagtgc 69
<210> 160
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 160
tcttgtggaa agccagaaac atggtccgtc tgcttcatga gcgggtttca gagctaagca 60
caagagtgc 69
<210> 161
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 161
tcttgtggaa agccagaaac atggtcctca cctaaagtgc aatagtttca gagctaagca 60
caagagtgc 69
<210> 162
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 162
tcttgtggaa agccagaaac atggtcctcg atagctggaa tccagtttca gagctaagca 60
caagagtgc 69
<210> 163
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 163
tcttgtggaa agccagaaac atggtcctgc caagaaacac ccttgtttca gagctaagca 60
caagagtgc 69
<210> 164
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 164
tcttgtggaa agccagaaac atggtcctgg ataccgcgtg gttagtttca gagctaagca 60
caagagtgc 69
<210> 165
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 165
tcttgtggaa agccagaaac atggtcgaga ggaaaaacac actggtttca gagctaagca 60
caagagtgc 69
<210> 166
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 166
tcttgtggaa agccagaaac atggtcgaga tgcgcagcag atgagtttca gagctaagca 60
caagagtgc 69
<210> 167
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 167
tcttgtggaa agccagaaac atggtcgatc gaggttgcat tcgggtttca gagctaagca 60
caagagtgc 69
<210> 168
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 168
tcttgtggaa agccagaaac atggtcgatg tagccccgcc caaggtttca gagctaagca 60
caagagtgc 69
<210> 169
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 169
tcttgtggaa agccagaaac atggtcgcaa ggaagccagc taaggtttca gagctaagca 60
caagagtgc 69
<210> 170
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 170
tcttgtggaa agccagaaac atggtcgcag cggcgtggga tcgggtttca gagctaagca 60
caagagtgc 69
<210> 171
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 171
tcttgtggaa agccagaaac atggtcgcgc ttgggttata cgctgtttca gagctaagca 60
caagagtgc 69
<210> 172
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 172
tcttgtggaa agccagaaac atggtcgcgg acatagggct ctaagtttca gagctaagca 60
caagagtgc 69
<210> 173
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 173
tcttgtggaa agccagaaac atggtcggaa gcaaacttct ggaggtttca gagctaagca 60
caagagtgc 69
<210> 174
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 174
tcttgtggaa agccagaaac atggtcggca tacgggacac acgcgtttca gagctaagca 60
caagagtgc 69
<210> 175
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 175
tcttgtggaa agccagaaac atggtcggct acaatctttg gcatgtttca gagctaagca 60
caagagtgc 69
<210> 176
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 176
tcttgtggaa agccagaaac atggtcggct acggcgtgga gaaggtttca gagctaagca 60
caagagtgc 69
<210> 177
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 177
tcttgtggaa agccagaaac atggtcggct cctgaagcca gtatgtttca gagctaagca 60
caagagtgc 69
<210> 178
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 178
tcttgtggaa agccagaaac atggtcgggc agtgagtaca atacgtttca gagctaagca 60
caagagtgc 69
<210> 179
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 179
tcttgtggaa agccagaaac atggtcgggg accacccacg atccgtttca gagctaagca 60
caagagtgc 69
<210> 180
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 180
tcttgtggaa agccagaaac atggtcgtaa acacacgacc aagtgtttca gagctaagca 60
caagagtgc 69
<210> 181
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 181
tcttgtggaa agccagaaac atggtctaaa gccgtcctga tgttgtttca gagctaagca 60
caagagtgc 69
<210> 182
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 182
tcttgtggaa agccagaaac atggtctacc tattgtggaa tttggtttca gagctaagca 60
caagagtgc 69
<210> 183
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 183
tcttgtggaa agccagaaac atggtctacg tgtagttgta catagtttca gagctaagca 60
caagagtgc 69
<210> 184
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 184
tcttgtggaa agccagaaac atggtctatt ttgtctgcgc agaagtttca gagctaagca 60
caagagtgc 69
<210> 185
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 185
tcttgtggaa agccagaaac atggtctcgt agcctaatgc gccagtttca gagctaagca 60
caagagtgc 69
<210> 186
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 186
tcttgtggaa agccagaaac atggtctctc ggagtggagc aacagtttca gagctaagca 60
caagagtgc 69
<210> 187
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 187
tcttgtggaa agccagaaac atggtctgaa aaataggccc aaccgtttca gagctaagca 60
caagagtgc 69
<210> 188
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 188
tcttgtggaa agccagaaac atggtctgac gattaatgct tctagtttca gagctaagca 60
caagagtgc 69
<210> 189
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 189
tcttgtggaa agccagaaac atggtctggc ttgacacgac cgttgtttca gagctaagca 60
caagagtgc 69
<210> 190
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 190
tcttgtggaa agccagaaac atggtctggc ttgcaccgtg tcatgtttca gagctaagca 60
caagagtgc 69
<210> 191
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 191
tcttgtggaa agccagaaac atggtgaacg cgtgtttcct tgcagtttca gagctaagca 60
caagagtgc 69
<210> 192
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 192
tcttgtggaa agccagaaac atggtgaacg gtgaagagat aggggtttca gagctaagca 60
caagagtgc 69
<210> 193
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 193
tcttgtggaa agccagaaac atggtgaagt ggggcgtcgg acacgtttca gagctaagca 60
caagagtgc 69
<210> 194
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 194
tcttgtggaa agccagaaac atggtgaatc gaatacaaac gatggtttca gagctaagca 60
caagagtgc 69
<210> 195
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 195
tcttgtggaa agccagaaac atggtgaatc gtaacctcgc cattgtttca gagctaagca 60
caagagtgc 69
<210> 196
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 196
tcttgtggaa agccagaaac atggtgacac attggctggg tgttgtttca gagctaagca 60
caagagtgc 69
<210> 197
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 197
tcttgtggaa agccagaaac atggtgacct ctgaggaatt cacagtttca gagctaagca 60
caagagtgc 69
<210> 198
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 198
tcttgtggaa agccagaaac atggtgacgc gatagagttg gcttgtttca gagctaagca 60
caagagtgc 69
<210> 199
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 199
tcttgtggaa agccagaaac atggtgacgc tccacgtccg gaccgtttca gagctaagca 60
caagagtgc 69
<210> 200
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 200
tcttgtggaa agccagaaac atggtgacta gctcttacat attcgtttca gagctaagca 60
caagagtgc 69
<210> 201
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 201
tcttgtggaa agccagaaac atggtgactc gggcaatatc ggttgtttca gagctaagca 60
caagagtgc 69
<210> 202
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 202
tcttgtggaa agccagaaac atggtgagca tgtcgggagt aactgtttca gagctaagca 60
caagagtgc 69
<210> 203
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 203
tcttgtggaa agccagaaac atggtgagca ttcgtagccc agcagtttca gagctaagca 60
caagagtgc 69
<210> 204
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 204
tcttgtggaa agccagaaac atggtgagcg gcctctaatt aatcgtttca gagctaagca 60
caagagtgc 69
<210> 205
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 205
tcttgtggaa agccagaaac atggtgagga tcatgtcgag cgccgtttca gagctaagca 60
caagagtgc 69
<210> 206
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 206
tcttgtggaa agccagaaac atggtgagtc ttactaggtc ctgtgtttca gagctaagca 60
caagagtgc 69
<210> 207
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 207
tcttgtggaa agccagaaac atggtgcaac cttccttttc aggagtttca gagctaagca 60
caagagtgc 69
<210> 208
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 208
tcttgtggaa agccagaaac atggtgcaag gacctggtat gaacgtttca gagctaagca 60
caagagtgc 69
<210> 209
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 209
tcttgtggaa agccagaaac atggtgcagg tctaggtccc aaaggtttca gagctaagca 60
caagagtgc 69
<210> 210
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 210
tcttgtggaa agccagaaac atggtgcagt cgcgctgagc gtcagtttca gagctaagca 60
caagagtgc 69
<210> 211
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 211
tcttgtggaa agccagaaac atggatcaac gactaccagc ccgggtttca gagctaagca 60
caagagtgc 69
<210> 212
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 212
tcttgtggaa agccagaaac atggagacgt gcactttgag cggagtttca gagctaagca 60
caagagtgc 69
<210> 213
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 213
tcttgtggaa agccagaaac atggagtgca aggatagaaa caccgtttca gagctaagca 60
caagagtgc 69
<210> 214
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 214
tcttgtggaa agccagaaac atggaaacaa aagcccatga atgtgtttca gagctaagca 60
caagagtgc 69
<210> 215
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 215
tcttgtggaa agccagaaac atggcaacat taaataccca atgagtttca gagctaagca 60
caagagtgc 69
<210> 216
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 216
tcttgtggaa agccagaaac atggcaacca caatctcagg acgagtttca gagctaagca 60
caagagtgc 69
<210> 217
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 217
tcttgtggaa agccagaaac atgggcaact tgtcacagac gcaggtttca gagctaagca 60
caagagtgc 69
<210> 218
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 218
tcttgtggaa agccagaaac atggcctgcc aagaaggatg tcaagtttca gagctaagca 60
caagagtgc 69
<210> 219
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 219
tcttgtggaa agccagaaac atggcgtgga cggagtgatt acgagtttca gagctaagca 60
caagagtgc 69
<210> 220
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 220
tcttgtggaa agccagaaac atggagtgat tgtgtgtcct accagtttca gagctaagca 60
caagagtgc 69
<210> 221
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 221
tcttgtggaa agccagaaac atggaagtct acttgtatct acgggtttca gagctaagca 60
caagagtgc 69
<210> 222
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 222
tcttgtggaa agccagaaac atggaagatt taatagctca agcagtttca gagctaagca 60
caagagtgc 69
<210> 223
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 223
tcttgtggaa agccagaaac atggacgtca gggatgtcct cgatgtttca gagctaagca 60
caagagtgc 69
<210> 224
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 224
tcttgtggaa agccagaaac atggaaacac aaaattcacg tccagtttca gagctaagca 60
caagagtgc 69
<210> 225
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 225
tcttgtggaa agccagaaac atggaggtgc caacacccat ccaggtttca gagctaagca 60
caagagtgc 69
<210> 226
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 226
tcttgtggaa agccagaaac atggatcatc tcacagttca accagtttca gagctaagca 60
caagagtgc 69
<210> 227
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 227
tcttgtggaa agccagaaac atggcgccca ggaatagtta ggaggtttca gagctaagca 60
caagagtgc 69
<210> 228
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 228
tcttgtggaa agccagaaac atggcccagg tcgaacatat ccaggtttca gagctaagca 60
caagagtgc 69
<210> 229
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 229
tcttgtggaa agccagaaac atggcaaaac attatactgg catggtttca gagctaagca 60
caagagtgc 69
<210> 230
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 230
tcttgtggaa agccagaaac atggaacacc accgtacctt cccggtttca gagctaagca 60
caagagtgc 69
<210> 231
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 231
tcttgtggaa agccagaaac atggcttcgt gacctactcc aatggtttca gagctaagca 60
caagagtgc 69
<210> 232
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 232
tcttgtggaa agccagaaac atggcttact gacaatctta tccagtttca gagctaagca 60
caagagtgc 69
<210> 233
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 233
tcttgtggaa agccagaaac atggactctc ccatcaattg aatggtttca gagctaagca 60
caagagtgc 69
<210> 234
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 234
tcttgtggaa agccagaaac atggaatgtg tgctcgacca cacagtttca gagctaagca 60
caagagtgc 69
<210> 235
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 235
tcttgtggaa agccagaaac atggccaaca ctggacggtc aagagtttca gagctaagca 60
caagagtgc 69
<210> 236
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 236
tcttgtggaa agccagaaac atggaaattc acttacctaa aaccgtttca gagctaagca 60
caagagtgc 69
<210> 237
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 237
tcttgtggaa agccagaaac atggaattct aagagtggaa agcggtttca gagctaagca 60
caagagtgc 69
<210> 238
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 238
tcttgtggaa agccagaaac atggacaaga ccaataagag gcgtgtttca gagctaagca 60
caagagtgc 69
<210> 239
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 239
tcttgtggaa agccagaaac atggagagta cttgtctcga tttggtttca gagctaagca 60
caagagtgc 69
<210> 240
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 240
tcttgtggaa agccagaaac atggactccc atttggatgc acaagtttca gagctaagca 60
caagagtgc 69
<210> 241
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 241
tcttgtggaa agccagaaac atggaaatgg gataacattg ccgggtttca gagctaagca 60
caagagtgc 69
<210> 242
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 242
tcttgtggaa agccagaaac atggaggtcc ctatgatagg ccgggtttca gagctaagca 60
caagagtgc 69
<210> 243
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 243
tcttgtggaa agccagaaac atggacattg acgatggact accagtttca gagctaagca 60
caagagtgc 69
<210> 244
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 244
tcttgtggaa agccagaaac atggatgatg tttgatgacc gtcggtttca gagctaagca 60
caagagtgc 69
<210> 245
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 245
tcttgtggaa agccagaaac atggactcag ttcaaagtgc ccaggtttca gagctaagca 60
caagagtgc 69
<210> 246
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 246
tcttgtggaa agccagaaac atggaatact gatgatccat cagggtttca gagctaagca 60
caagagtgc 69
<210> 247
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 247
tcttgtggaa agccagaaac atggacccca tgccaatacc accagtttca gagctaagca 60
caagagtgc 69
<210> 248
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 248
tcttgtggaa agccagaaac atggacactc caaggtgttt accagtttca gagctaagca 60
caagagtgc 69
<210> 249
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 249
tcttgtggaa agccagaaac atggatcgag ttagaggacc aaaggtttca gagctaagca 60
caagagtgc 69
<210> 250
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 250
tcttgtggaa agccagaaac atggccagcc gatacggacc acgtgtttca gagctaagca 60
caagagtgc 69
<210> 251
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 251
tcttgtggaa agccagaaac atggcaagtg agcaaagacc gctagtttca gagctaagca 60
caagagtgc 69
<210> 252
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 252
tcttgtggaa agccagaaac atggagatgg tatagctgca tgctgtttca gagctaagca 60
caagagtgc 69
<210> 253
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 253
tcttgtggaa agccagaaac atggagtgga ccgcaacatc aagggtttca gagctaagca 60
caagagtgc 69
<210> 254
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 254
tcttgtggaa agccagaaac atggacacac tcggtgacag actggtttca gagctaagca 60
caagagtgc 69
<210> 255
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 255
tcttgtggaa agccagaaac atggagttgg cagtatcatc ggaagtttca gagctaagca 60
caagagtgc 69
<210> 256
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 256
tcttgtggaa agccagaaac atggcatggt gaactactac acctgtttca gagctaagca 60
caagagtgc 69
<210> 257
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 257
tcttgtggaa agccagaaac atggaaatat ggacgaatag tggagtttca gagctaagca 60
caagagtgc 69
<210> 258
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 258
tcttgtggaa agccagaaac atggatgatc gtggaagatc tacagtttca gagctaagca 60
caagagtgc 69
<210> 259
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 259
tcttgtggaa agccagaaac atgggatgac aagaaaaaaa acaggtttca gagctaagca 60
caagagtgc 69
<210> 260
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 260
tcttgtggaa agccagaaac atggatgagt gctaaaatgc tggggtttca gagctaagca 60
caagagtgc 69
<210> 261
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 261
tcttgtggaa agccagaaac atggatggag ggactgtagt aactgtttca gagctaagca 60
caagagtgc 69
<210> 262
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 262
tcttgtggaa agccagaaac atggattctg tgactatgga accagtttca gagctaagca 60
caagagtgc 69
<210> 263
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 263
tcttgtggaa agccagaaac atggaccatc ttaccactct tccagtttca gagctaagca 60
caagagtgc 69
<210> 264
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 264
tcttgtggaa agccagaaac atgggccagt tgtaacaatg tcaggtttca gagctaagca 60
caagagtgc 69
<210> 265
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 265
tcttgtggaa agccagaaac atggcctgta caacgagcac acgggtttca gagctaagca 60
caagagtgc 69
<210> 266
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 266
tcttgtggaa agccagaaac atgggcctcg attcactcgc gcgggtttca gagctaagca 60
caagagtgc 69
<210> 267
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 267
tcttgtggaa agccagaaac atggcatgaa cccagacata ctcagtttca gagctaagca 60
caagagtgc 69
<210> 268
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 268
tcttgtggaa agccagaaac atggctgatc gtatcttgga tgtggtttca gagctaagca 60
caagagtgc 69
<210> 269
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 269
tcttgtggaa agccagaaac atggcatcac aaaaaagctg tcaggtttca gagctaagca 60
caagagtgc 69
<210> 270
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 270
tcttgtggaa agccagaaac atggcatggt ttgtgatgat ccgggtttca gagctaagca 60
caagagtgc 69
<210> 271
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 271
tcttgtggaa agccagaaac atggcttaat cggaaccata ggcggtttca gagctaagca 60
caagagtgc 69
<210> 272
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 272
tcttgtggaa agccagaaac atggctcaaa gccacagtcg acaagtttca gagctaagca 60
caagagtgc 69
<210> 273
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 273
tcttgtggaa agccagaaac atgggcacca ccataaacca cgcagtttca gagctaagca 60
caagagtgc 69
<210> 274
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 274
tcttgtggaa agccagaaac atggcctgat cgaccctatt cgaggtttca gagctaagca 60
caagagtgc 69
<210> 275
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 275
tcttgtggaa agccagaaac atggcattcc tagagagagg cgatgtttca gagctaagca 60
caagagtgc 69
<210> 276
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 276
tcttgtggaa agccagaaac atggaagtga taataaacta gagggtttca gagctaagca 60
caagagtgc 69
<210> 277
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 277
tcttgtggaa agccagaaac atggctgcct cgcagaaagc aacggtttca gagctaagca 60
caagagtgc 69
<210> 278
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 278
tcttgtggaa agccagaaac atggtcagtg tgtccattgg agcagtttca gagctaagca 60
caagagtgc 69
<210> 279
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 279
tcttgtggaa agccagaaac atggcaggta ggggatttca tcaggtttca gagctaagca 60
caagagtgc 69
<210> 280
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 280
tcttgtggaa agccagaaac atggccagtt acagcagttt cagggtttca gagctaagca 60
caagagtgc 69
<210> 281
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 281
tcttgtggaa agccagaaac atggtcatag tatcgaggag tatggtttca gagctaagca 60
caagagtgc 69
<210> 282
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 282
tcttgtggaa agccagaaac atggtagacg gcgaaatctt gtcggtttca gagctaagca 60
caagagtgc 69
<210> 283
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 283
tcttgtggaa agccagaaac atggggagat ttaccaacaa ccatgtttca gagctaagca 60
caagagtgc 69
<210> 284
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 284
tcttgtggaa agccagaaac atggcaaagc tataatcccc ctcagtttca gagctaagca 60
caagagtgc 69
<210> 285
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 285
tcttgtggaa agccagaaac atggggagga tatctactcc ggtggtttca gagctaagca 60
caagagtgc 69
<210> 286
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 286
tcttgtggaa agccagaaac atgggggaac gctcacggac tgtggtttca gagctaagca 60
caagagtgc 69
<210> 287
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 287
tcttgtggaa agccagaaac atggaggaac tactacgaac aatggtttca gagctaagca 60
caagagtgc 69
<210> 288
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 288
tcttgtggaa agccagaaac atggctaata cctcctcccc ccgggtttca gagctaagca 60
caagagtgc 69
<210> 289
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 289
tcttgtggaa agccagaaac atggcgccac cgagaacgga catggtttca gagctaagca 60
caagagtgc 69
<210> 290
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 290
tcttgtggaa agccagaaac atggaggtgt gaaacgatct gcaggtttca gagctaagca 60
caagagtgc 69
<210> 291
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 291
tcttgtggaa agccagaaac atggaggtgt gaaacgatca gcaggtttca gagctaagca 60
caagagtgc 69
<210> 292
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 292
tcttgtggaa agccagaaac atggccatgg tggcggcgac acaggtttca gagctaagca 60
caagagtgc 69
<210> 293
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 293
tcttgtggaa agccagaaac atggcaacgc gagcaagaat cagcgtttca gagctaagca 60
caagagtgc 69
<210> 294
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 294
tcttgtggaa agccagaaac atggccattt catctacact agaggtttca gagctaagca 60
caagagtgc 69
<210> 295
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 295
tcttgtggaa agccagaaac atggaatgtc tgatcacaga tacggtttca gagctaagca 60
caagagtgc 69
<210> 296
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 296
tcttgtggaa agccagaaac atggctgtga agcaaactgc acaagtttca gagctaagca 60
caagagtgc 69
<210> 297
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 297
tcttgtggaa agccagaaac atggagatag cagaaaatgc tctggtttca gagctaagca 60
caagagtgc 69
<210> 298
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 298
tcttgtggaa agccagaaac atggctgttg ggacataccg ctcggtttca gagctaagca 60
caagagtgc 69
<210> 299
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 299
tcttgtggaa agccagaaac atggaggatg ggtccaccag tggggtttca gagctaagca 60
caagagtgc 69
<210> 300
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 300
tcttgtggaa agccagaaac atggaggact ctgtgaatct gtgggtttca gagctaagca 60
caagagtgc 69
<210> 301
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 301
tcttgtggaa agccagaaac atggaggtga tggctacgac tggtgtttca gagctaagca 60
caagagtgc 69
<210> 302
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 302
tcttgtggaa agccagaaac atggagaacc agatccagaa gtcagtttca gagctaagca 60
caagagtgc 69
<210> 303
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 303
tcttgtggaa agccagaaac atggcaccgt caccgcgaac agcggtttca gagctaagca 60
caagagtgc 69
<210> 304
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 304
tcttgtggaa agccagaaac atggccccgg atacgctcac taaggtttca gagctaagca 60
caagagtgc 69
<210> 305
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 305
tcttgtggaa agccagaaac atggtcttac ggtttcgatg gacggtttca gagctaagca 60
caagagtgc 69
<210> 306
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 306
tcttgtggaa agccagaaac atggcagcat aaacgagttc cctggtttca gagctaagca 60
caagagtgc 69
<210> 307
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 307
tcttgtggaa agccagaaac atggctggac aatatgccac tccggtttca gagctaagca 60
caagagtgc 69
<210> 308
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 308
tcttgtggaa agccagaaac atggagagat ccgcgagagt acgggtttca gagctaagca 60
caagagtgc 69
<210> 309
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 309
tcttgtggaa agccagaaac atggcaagat caaggaaata cgaggtttca gagctaagca 60
caagagtgc 69
<210> 310
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 310
tcttgtggaa agccagaaac atggccacga tgatcctgag cacggtttca gagctaagca 60
caagagtgc 69
<210> 311
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 311
tcttgtggaa agccagaaac atggacatct ctacgagagg gcaggtttca gagctaagca 60
caagagtgc 69
<210> 312
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 312
tcttgtggaa agccagaaac atggatgggc ctcaatcaga atcggtttca gagctaagca 60
caagagtgc 69
<210> 313
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 313
tcttgtggaa agccagaaac atggtattcc taagagtaaa accagtttca gagctaagca 60
caagagtgc 69
<210> 314
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 314
tcttgtggaa agccagaaac atggattctt ataaggttct ctgggtttca gagctaagca 60
caagagtgc 69
<210> 315
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 315
tcttgtggaa agccagaaac atgggaatac tatagaccaa gggagtttca gagctaagca 60
caagagtgc 69
<210> 316
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 316
tcttgtggaa agccagaaac atggcttgct cttacacaga gtgtgtttca gagctaagca 60
caagagtgc 69
<210> 317
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 317
tcttgtggaa agccagaaac atggtaacac ggcaccaatg ctgtgtttca gagctaagca 60
caagagtgc 69
<210> 318
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 318
tcttgtggaa agccagaaac atggggacat catagagcgc tcgtgtttca gagctaagca 60
caagagtgc 69
<210> 319
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 319
tcttgtggaa agccagaaac atgggaggcg cgcaaggtga agaggtttca gagctaagca 60
caagagtgc 69
<210> 320
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 320
tcttgtggaa agccagaaac atggtttccc acctgtctcc acgcgtttca gagctaagca 60
caagagtgc 69
<210> 321
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 321
tcttgtggaa agccagaaac atggtgatag gccagttctc tcgtgtttca gagctaagca 60
caagagtgc 69
<210> 322
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 322
tcttgtggaa agccagaaac atggtgataa agcgaatgca acaggtttca gagctaagca 60
caagagtgc 69
<210> 323
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 323
tcttgtggaa agccagaaac atgggatgtc atccgagtat ataggtttca gagctaagca 60
caagagtgc 69
<210> 324
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 324
tcttgtggaa agccagaaac atggtgagac tagatcacca ggcagtttca gagctaagca 60
caagagtgc 69
<210> 325
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 325
tcttgtggaa agccagaaac atggtgatga gtagtcagtc tccggtttca gagctaagca 60
caagagtgc 69
<210> 326
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 326
tcttgtggaa agccagaaac atgggataag atgcttgaac agctgtttca gagctaagca 60
caagagtgc 69
<210> 327
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 327
tcttgtggaa agccagaaac atggtctcgg ttccttaaat gagggtttca gagctaagca 60
caagagtgc 69
<210> 328
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 328
tcttgtggaa agccagaaac atggtctaca aaattggatc taaggtttca gagctaagca 60
caagagtgc 69
<210> 329
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 329
tcttgtggaa agccagaaac atggctgata ggcaaactct aatggtttca gagctaagca 60
caagagtgc 69
<210> 330
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 330
tcttgtggaa agccagaaac atggtataac taggaaactc agcggtttca gagctaagca 60
caagagtgc 69
<210> 331
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 331
tcttgtggaa agccagaaac atggttgaca gcatgcatca gtccgtttca gagctaagca 60
caagagtgc 69
<210> 332
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 332
tcttgtggaa agccagaaac atggttatta aagcaagatc ccccgtttca gagctaagca 60
caagagtgc 69
<210> 333
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 333
tcttgtggaa agccagaaac atgggaggca tcgctggagc tacggtttca gagctaagca 60
caagagtgc 69
<210> 334
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 334
tcttgtggaa agccagaaac atggttgctc cataggaagg cggtgtttca gagctaagca 60
caagagtgc 69
<210> 335
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 335
tcttgtggaa agccagaaac atggttacac cataacgctc cagggtttca gagctaagca 60
caagagtgc 69
<210> 336
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 336
tcttgtggaa agccagaaac atggtgatga tcgcgtactg agtggtttca gagctaagca 60
caagagtgc 69
<210> 337
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 337
tcttgtggaa agccagaaac atggtggatg tgggaaaacc acacgtttca gagctaagca 60
caagagtgc 69
<210> 338
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 338
tcttgtggaa agccagaaac atgggccacc accactactc atgggtttca gagctaagca 60
caagagtgc 69
<210> 339
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 339
tcttgtggaa agccagaaac atggtgggac tctgacggac tgcggtttca gagctaagca 60
caagagtgc 69
<210> 340
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 340
tcttgtggaa agccagaaac atggttcatg tcttaaggtc gaaggtttca gagctaagca 60
caagagtgc 69
<210> 341
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 341
tcttgtggaa agccagaaac atggtttagg aatctggaaa accagtttca gagctaagca 60
caagagtgc 69
<210> 342
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 342
tcttgtggaa agccagaaac atggttccac caaagtttcc accagtttca gagctaagca 60
caagagtgc 69
<210> 343
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 343
tcttgtggaa agccagaaac atgggtgaag aaaatcttcg ttgggtttca gagctaagca 60
caagagtgc 69
<210> 344
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 344
tcttgtggaa agccagaaac atggtatcag gaaacacttc acgagtttca gagctaagca 60
caagagtgc 69
<210> 345
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 345
tcttgtggaa agccagaaac atggtgtaga tattaacctg gctggtttca gagctaagca 60
caagagtgc 69
<210> 346
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 346
tcttgtggaa agccagaaac atgggtttat aggaggcctt agctgtttca gagctaagca 60
caagagtgc 69
<210> 347
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 347
tcttgtggaa agccagaaac atggtggagc tggatttaaa atgggtttca gagctaagca 60
caagagtgc 69
<210> 348
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 348
tcttgtggaa agccagaaac atggtgaagc cgtagccatc actggtttca gagctaagca 60
caagagtgc 69
<210> 349
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 349
tcttgtggaa agccagaaac atggtggtcc aaatagtcct gacagtttca gagctaagca 60
caagagtgc 69
<210> 350
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 350
tcttgtggaa agccagaaac atggtctgat catagatacg gagagtttca gagctaagca 60
caagagtgc 69
<210> 351
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 351
tcttgtggaa agccagaaac atggtatgac agaatgcgac gagggtttca gagctaagca 60
caagagtgc 69
<210> 352
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 352
tcttgtggaa agccagaaac atggtaaaat caaagaactt cgaggtttca gagctaagca 60
caagagtgc 69
<210> 353
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 353
tcttgtggaa agccagaaac atggtgccct caccatattc tgcggtttca gagctaagca 60
caagagtgc 69
<210> 354
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 354
tcttgtggaa agccagaaac atggttagga atgacaatga cagtgtttca gagctaagca 60
caagagtgc 69
<210> 355
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 355
tcttgtggaa agccagaaac atggggtggt ggtatggaaa acatgtttca gagctaagca 60
caagagtgc 69
<210> 356
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 356
tcttgtggaa agccagaaac atggggtccg gccttctcaa aaaggtttca gagctaagca 60
caagagtgc 69
<210> 357
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 357
tcttgtggaa agccagaaac atggggctgg tcactaacta caaggtttca gagctaagca 60
caagagtgc 69
<210> 358
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 358
tcttgtggaa agccagaaac atggggggta ctttgagcac cgaggtttca gagctaagca 60
caagagtgc 69
<210> 359
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 359
tcttgtggaa agccagaaac atggttacta tgaattccga gagggtttca gagctaagca 60
caagagtgc 69
<210> 360
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 360
tcttgtggaa agccagaaac atggtctgac gtgtactctc ctaagtttca gagctaagca 60
caagagtgc 69
<210> 361
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 361
tcttgtggaa agccagaaac atgggctctg gacagatgca gtgagtttca gagctaagca 60
caagagtgc 69
<210> 362
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 362
tcttgtggaa agccagaaac atggatggtc atgactctcc cttggtttca gagctaagca 60
caagagtgc 69
<210> 363
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 363
tcttgtggaa agccagaaac atgggtgtgt caaacagatc tgcggtttca gagctaagca 60
caagagtgc 69
<210> 364
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 364
tcttgtggaa agccagaaac atggcgtgga cgttcggaac ggaagtttca gagctaagca 60
caagagtgc 69
<210> 365
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 365
tcttgtggaa agccagaaac atggctctag tatcacgaga acttgtttca gagctaagca 60
caagagtgc 69
<210> 366
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 366
tcttgtggaa agccagaaac atggtctacc tgctgatatc acgggtttca gagctaagca 60
caagagtgc 69
<210> 367
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 367
tcttgtggaa agccagaaac atggtgagcg agatggtgct gtcagtttca gagctaagca 60
caagagtgc 69
<210> 368
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 368
tcttgtggaa agccagaaac atggtgatta tgacactcga agtggtttca gagctaagca 60
caagagtgc 69
<210> 369
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 369
tcttgtggaa agccagaaac atggtgggtt cggtcataat gggggtttca gagctaagca 60
caagagtgc 69
<210> 370
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 370
tcttgtggaa agccagaaac atggtatctc cagatcaaca tctggtttca gagctaagca 60
caagagtgc 69
<210> 371
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 371
tcttgtggaa agccagaaac atggttgaag aatatcctaa actggtttca gagctaagca 60
caagagtgc 69
<210> 372
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 372
tcttgtggaa agccagaaac atggggttga aggactgaca ccgcgtttca gagctaagca 60
caagagtgc 69
<210> 373
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 373
tcttgtggaa agccagaaac atggatcttc agggtaacta cgaagtttca gagctaagca 60
caagagtgc 69
<210> 374
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 374
tcttgtggaa agccagaaac atggatcttc tcgacgaaaa tgcggtttca gagctaagca 60
caagagtgc 69
<210> 375
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 375
tcttgtggaa agccagaaac atggatgaca ttgcgcgtct acgggtttca gagctaagca 60
caagagtgc 69
<210> 376
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 376
tcttgtggaa agccagaaac atggatgata tctgacatgc agcggtttca gagctaagca 60
caagagtgc 69
<210> 377
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 377
tcttgtggaa agccagaaac atggatgcaa gacagcctcc cagcgtttca gagctaagca 60
caagagtgc 69
<210> 378
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 378
cagaaacatg gaagacgtga cccggagatc cgattggaac cgtcccaagc gttgcgaaac 60
gagacggtca atcgcgctgc atacttg 87
<210> 379
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 379
cagaaacatg gaagacgtga cccggagatc cgattggaac cgtcccaagc gttgcgaagt 60
gaattgctgc gcatcggcgt acgactt 87
<210> 380
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 380
cagaaacatg gaagacgtga cccggagatc cgattggaac cgtcccaagc gttgcgaaag 60
ttcaacggga ccgtggccga tgtttcg 87
<210> 381
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 381
cagaaacatg gaagacgtga cccggagcta tcgttcgttc gaggccagag cattcgaaac 60
gagacggtca atcgcgctgc atacttg 87
<210> 382
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 382
cagaaacatg gaagacgtga cccggagcta tcgttcgttc gaggccagag cattcgaagt 60
gaattgctgc gcatcggcgt acgactt 87
<210> 383
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 383
cagaaacatg gaagacgtga cccggagcta tcgttcgttc gaggccagag cattcgaaag 60
ttcaacggga ccgtggccga tgtttcg 87
<210> 384
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 384
cagaaacatg gaagacgtga cccggaccca tgatcgtccg atctggtcgg atttgtaaac 60
gagacggtca atcgcgctgc atacttg 87
<210> 385
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 385
cagaaacatg gaagacgtga cccggaccca tgatcgtccg atctggtcgg atttgtaagt 60
gaattgctgc gcatcggcgt acgactt 87
<210> 386
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 386
cagaaacatg gaagacgtga cccggaccca tgatcgtccg atctggtcgg atttgtaaag 60
ttcaacggga ccgtggccga tgtttcg 87
<210> 387
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 387
ccggttcgac tgaaggttta ctaggcgagg tcaagtatgc agcgcgattg accgtctcgt 60
tt 62
<210> 388
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 388
gctcgtcggg caacaatagc tctacgcacc tcaagtatgc agcgcgattg accgtctcgt 60
tt 62
<210> 389
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 389
gcatgagttg cctggcgttg cgacgactaa tcaagtatgc agcgcgattg accgtctcgt 60
tt 62
<210> 390
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 390
ccggttcgac tgaaggttta ctaggcgagg taagtcgtac gccgatgcgc agcaattcac 60
tt 62
<210> 391
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 391
gctcgtcggg caacaatagc tctacgcacc taagtcgtac gccgatgcgc agcaattcac 60
tt 62
<210> 392
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 392
gcatgagttg cctggcgttg cgacgactaa taagtcgtac gccgatgcgc agcaattcac 60
tt 62
<210> 393
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 393
ccggttcgac tgaaggttta ctaggcgagg tcgaaacatc ggccacggtc ccgttgaact 60
tt 62
<210> 394
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 394
gctcgtcggg caacaatagc tctacgcacc tcgaaacatc ggccacggtc ccgttgaact 60
tt 62
<210> 395
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 395
gcatgagttg cctggcgttg cgacgactaa tcgaaacatc ggccacggtc ccgttgaact 60
tt 62
<210> 396
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 396
acctcgccta gtaaaccttc agtcgaaccg gagtaagcgc aacggtggac cggagacgac 60
gg 62
<210> 397
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 397
acctcgccta gtaaaccttc agtcgaaccg gaaaattgcg tgacggacct gggccattgg 60
cc 62
<210> 398
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 398
acctcgccta gtaaaccttc agtcgaaccg gagcagattc cgctacgctc cgattcgatc 60
aa 62
<210> 399
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 399
aggtgcgtag agctattgtt gcccgacgag cagtaagcgc aacggtggac cggagacgac 60
gg 62
<210> 400
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 400
aggtgcgtag agctattgtt gcccgacgag caaaattgcg tgacggacct gggccattgg 60
cc 62
<210> 401
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 401
aggtgcgtag agctattgtt gcccgacgag cagcagattc cgctacgctc cgattcgatc 60
aa 62
<210> 402
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 402
attagtcgtc gcaacgccag gcaactcatg cagtaagcgc aacggtggac cggagacgac 60
gg 62
<210> 403
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 403
attagtcgtc gcaacgccag gcaactcatg caaaattgcg tgacggacct gggccattgg 60
cc 62
<210> 404
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 404
attagtcgtc gcaacgccag gcaactcatg cagcagattc cgctacgctc cgattcgatc 60
aa 62
<210> 405
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 405
ttaggtccgg cgattagcgc tcgtgcgcga tccgtcgtct ccggtccacc gttgcgctta 60
ct 62
<210> 406
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 406
gcctcgatta cgacggatgt aattcggccg tccgtcgtct ccggtccacc gttgcgctta 60
ct 62
<210> 407
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 407
gcccgtattc ccgcttgcga gtagggcaat tccgtcgtct ccggtccacc gttgcgctta 60
ct 62
<210> 408
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 408
ttaggtccgg cgattagcgc tcgtgcgcga tggccaatgg cccaggtccg tcacgcaatt 60
tt 62
<210> 409
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 409
gcctcgatta cgacggatgt aattcggccg tggccaatgg cccaggtccg tcacgcaatt 60
tt 62
<210> 410
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 410
gcccgtattc ccgcttgcga gtagggcaat tggccaatgg cccaggtccg tcacgcaatt 60
tt 62
<210> 411
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 411
ttaggtccgg cgattagcgc tcgtgcgcga tttgatcgaa tcggagcgta gcggaatctg 60
ct 62
<210> 412
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 412
gcctcgatta cgacggatgt aattcggccg tttgatcgaa tcggagcgta gcggaatctg 60
ct 62
<210> 413
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 413
gcccgtattc ccgcttgcga gtagggcaat tttgatcgaa tcggagcgta gcggaatctg 60
ct 62
<210> 414
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 414
atcgcgcacg agcgctaatc gccggaccta aaggtcgatg ccctaatcca cgtgcttccc 60
gc 62
<210> 415
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 415
atcgcgcacg agcgctaatc gccggaccta aaccataaca acggctagca cggcacgcaa 60
at 62
<210> 416
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 416
atcgcgcacg agcgctaatc gccggaccta aaccctcggt cccaccttac ggcgatgacc 60
ct 62
<210> 417
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 417
acggccgaat tacatccgtc gtaatcgagg caggtcgatg ccctaatcca cgtgcttccc 60
gc 62
<210> 418
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 418
acggccgaat tacatccgtc gtaatcgagg caccataaca acggctagca cggcacgcaa 60
at 62
<210> 419
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 419
acggccgaat tacatccgtc gtaatcgagg caccctcggt cccaccttac ggcgatgacc 60
ct 62
<210> 420
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 420
aattgcccta ctcgcaagcg ggaatacggg caggtcgatg ccctaatcca cgtgcttccc 60
gc 62
<210> 421
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 421
aattgcccta ctcgcaagcg ggaatacggg caccataaca acggctagca cggcacgcaa 60
at 62
<210> 422
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 422
aattgcccta ctcgcaagcg ggaatacggg caccctcggt cccaccttac ggcgatgacc 60
ct 62
<210> 423
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 423
caacgactgg cgaccttagg gttggctcgc tgcgggaagc acgtggatta gggcatcgac 60
ct 62
<210> 424
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 424
cgagtaggcc gcctgaacaa ctagccggag tgcgggaagc acgtggatta gggcatcgac 60
ct 62
<210> 425
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 425
ggacacggga tcgacggtag tggatcgatt tgcgggaagc acgtggatta gggcatcgac 60
ct 62
<210> 426
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 426
caacgactgg cgaccttagg gttggctcgc tatttgcgtg ccgtgctagc cgttgttatg 60
gt 62
<210> 427
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 427
cgagtaggcc gcctgaacaa ctagccggag tatttgcgtg ccgtgctagc cgttgttatg 60
gt 62
<210> 428
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 428
ggacacggga tcgacggtag tggatcgatt tatttgcgtg ccgtgctagc cgttgttatg 60
gt 62
<210> 429
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 429
caacgactgg cgaccttagg gttggctcgc tagggtcatc gccgtaaggt gggaccgagg 60
gt 62
<210> 430
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 430
cgagtaggcc gcctgaacaa ctagccggag tagggtcatc gccgtaaggt gggaccgagg 60
gt 62
<210> 431
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 431
ggacacggga tcgacggtag tggatcgatt tagggtcatc gccgtaaggt gggaccgagg 60
gt 62
<210> 432
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 432
agcgagccaa ccctaaggtc gccagtcgtt gaaaccggta catgacgcgg aacctaaggt 60
cg 62
<210> 433
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 433
agcgagccaa ccctaaggtc gccagtcgtt gagtgaaatc gcagcagccc acgtcgtaaa 60
ca 62
<210> 434
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 434
agcgagccaa ccctaaggtc gccagtcgtt gatagcaaag ccggtagcga caaccgtttc 60
cc 62
<210> 435
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 435
actccggcta gttgttcagg cggcctactc gaaaccggta catgacgcgg aacctaaggt 60
cg 62
<210> 436
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 436
actccggcta gttgttcagg cggcctactc gagtgaaatc gcagcagccc acgtcgtaaa 60
ca 62
<210> 437
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 437
actccggcta gttgttcagg cggcctactc gatagcaaag ccggtagcga caaccgtttc 60
cc 62
<210> 438
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 438
aaatcgatcc actaccgtcg atcccgtgtc caaaccggta catgacgcgg aacctaaggt 60
cg 62
<210> 439
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 439
aaatcgatcc actaccgtcg atcccgtgtc cagtgaaatc gcagcagccc acgtcgtaaa 60
ca 62
<210> 440
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 440
aaatcgatcc actaccgtcg atcccgtgtc catagcaaag ccggtagcga caaccgtttc 60
cc 62
<210> 441
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 441
gatggtcgac tggcggtctt aatatgccca tcgaccttag gttccgcgtc atgtaccggt 60
tt 62
<210> 442
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 442
atccatatga ccggcggcct tttctcggac tcgaccttag gttccgcgtc atgtaccggt 60
tt 62
<210> 443
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 443
atgatccacg accgagcagg ttagttgacg tcgaccttag gttccgcgtc atgtaccggt 60
tt 62
<210> 444
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 444
gatggtcgac tggcggtctt aatatgccca ttgtttacga cgtgggctgc tgcgatttca 60
ct 62
<210> 445
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 445
atccatatga ccggcggcct tttctcggac ttgtttacga cgtgggctgc tgcgatttca 60
ct 62
<210> 446
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 446
atgatccacg accgagcagg ttagttgacg ttgtttacga cgtgggctgc tgcgatttca 60
ct 62
<210> 447
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 447
gatggtcgac tggcggtctt aatatgccca tgggaaacgg ttgtcgctac cggctttgct 60
at 62
<210> 448
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 448
atccatatga ccggcggcct tttctcggac tgggaaacgg ttgtcgctac cggctttgct 60
at 62
<210> 449
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 449
atgatccacg accgagcagg ttagttgacg tgggaaacgg ttgtcgctac cggctttgct 60
at 62
<210> 450
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 450
atgggcatat taagaccgcc agtcgaccat cagtcctgtt cttgtcgagc gtggtgcgtc 60
ta 62
<210> 451
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 451
atgggcatat taagaccgcc agtcgaccat caatccgtag accaaccggc cgttaaacga 60
gt 62
<210> 452
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 452
atgggcatat taagaccgcc agtcgaccat cactgaatcc gtcgttccag acgcgagtac 60
cc 62
<210> 453
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 453
agtccgagaa aaggccgccg gtcatatgga tagtcctgtt cttgtcgagc gtggtgcgtc 60
ta 62
<210> 454
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 454
agtccgagaa aaggccgccg gtcatatgga taatccgtag accaaccggc cgttaaacga 60
gt 62
<210> 455
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 455
agtccgagaa aaggccgccg gtcatatgga tactgaatcc gtcgttccag acgcgagtac 60
cc 62
<210> 456
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 456
acgtcaacta acctgctcgg tcgtggatca tagtcctgtt cttgtcgagc gtggtgcgtc 60
ta 62
<210> 457
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 457
acgtcaacta acctgctcgg tcgtggatca taatccgtag accaaccggc cgttaaacga 60
gt 62
<210> 458
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 458
acgtcaacta acctgctcgg tcgtggatca tactgaatcc gtcgttccag acgcgagtac 60
cc 62
<210> 459
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 459
aacatcggat cggtgcggtg ggatggataa ttagacgcac cacgctcgac aagaacagga 60
ct 62
<210> 460
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 460
agacgacgca cgttcgtacc gcgtacttcg ttagacgcac cacgctcgac aagaacagga 60
ct 62
<210> 461
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 461
tttgctcgca agtgcgcacg agttgaactg ttagacgcac cacgctcgac aagaacagga 60
ct 62
<210> 462
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 462
aacatcggat cggtgcggtg ggatggataa tactcgttta acggccggtt ggtctacgga 60
tt 62
<210> 463
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 463
agacgacgca cgttcgtacc gcgtacttcg tactcgttta acggccggtt ggtctacgga 60
tt 62
<210> 464
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 464
tttgctcgca agtgcgcacg agttgaactg tactcgttta acggccggtt ggtctacgga 60
tt 62
<210> 465
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 465
aacatcggat cggtgcggtg ggatggataa tgggtactcg cgtctggaac gacggattca 60
gt 62
<210> 466
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 466
agacgacgca cgttcgtacc gcgtacttcg tgggtactcg cgtctggaac gacggattca 60
gt 62
<210> 467
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 467
tttgctcgca agtgcgcacg agttgaactg tgggtactcg cgtctggaac gacggattca 60
gt 62
<210> 468
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 468
attatccatc ccaccgcacc gatccgatgt taagcccgtc taaacgcggc gaggtacatt 60
gggccgtccg tcatctcgtt ttcgatg 87
<210> 469
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 469
attatccatc ccaccgcacc gatccgatgt tagccgcgat attcacgccg cgtatggaaa 60
ctgccgtccg tcatctcgtt ttcgatg 87
<210> 470
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 470
attatccatc ccaccgcacc gatccgatgt taatgaaacg tctgggcccg taacgctgta 60
gcgccgtccg tcatctcgtt ttcgatg 87
<210> 471
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 471
acgaagtacg cggtacgaac gtgcgtcgtc taagcccgtc taaacgcggc gaggtacatt 60
gggccgtccg tcatctcgtt ttcgatg 87
<210> 472
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 472
acgaagtacg cggtacgaac gtgcgtcgtc tagccgcgat attcacgccg cgtatggaaa 60
ctgccgtccg tcatctcgtt ttcgatg 87
<210> 473
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 473
acgaagtacg cggtacgaac gtgcgtcgtc taatgaaacg tctgggcccg taacgctgta 60
gcgccgtccg tcatctcgtt ttcgatg 87
<210> 474
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 474
acagttcaac tcgtgcgcac ttgcgagcaa aaagcccgtc taaacgcggc gaggtacatt 60
gggccgtccg tcatctcgtt ttcgatg 87
<210> 475
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 475
acagttcaac tcgtgcgcac ttgcgagcaa aagccgcgat attcacgccg cgtatggaaa 60
ctgccgtccg tcatctcgtt ttcgatg 87
<210> 476
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 476
acagttcaac tcgtgcgcac ttgcgagcaa aaatgaaacg tctgggcccg taacgctgta 60
gcgccgtccg tcatctcgtt ttcgatg 87
<210> 477
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 477
catcgaaaac gagatgacgg acggc 25
<210> 478
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 478
ggctttatat atcttgtgga aagccagaaa catggaagac gtgacccgg 49
<210> 479
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (29)..(48)
<223> n是a, c, g, 或t
<400> 479
ccagaggttg attatcgtaa tggatcctnn nnnnnnnnnn nnnnnnnntc tagacatcga 60
aaacgagatg acggacggc 79
<210> 480
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 480
ggctttatat atcttgtgga aagccagaaa caaggaccag gatgggcacc acccgtttca 60
gagctaagca caagagtgc 79
<210> 481
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 481
ccgggtcacg tcttccatgt ttctggctat cattacacct tgcgcttctt cttggg 56
<210> 482
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 482
gtggcacccg agtcgggtgc ttttttttcg ggtaccagat ccgattggaa ccgtcccaag 60
cgttgcgaaa cgagacggtc aatcgcgctg catacttg 98
<210> 483
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 483
gtggcacccg agtcgggtgc ttttttttcg ggtaccagat ccgattggaa ccgtcccaag 60
cgttgcgaag tgaattgctg cgcatcggcg tacgactt 98
<210> 484
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 484
gtggcacccg agtcgggtgc ttttttttcg ggtaccagat ccgattggaa ccgtcccaag 60
cgttgcgaaa gttcaacggg accgtggccg atgtttcg 98
<210> 485
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 485
gtggcacccg agtcgggtgc ttttttttcg ggtaccagct atcgttcgtt cgaggccaga 60
gcattcgaaa cgagacggtc aatcgcgctg catacttg 98
<210> 486
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 486
gtggcacccg agtcgggtgc ttttttttcg ggtaccagct atcgttcgtt cgaggccaga 60
gcattcgaag tgaattgctg cgcatcggcg tacgactt 98
<210> 487
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 487
gtggcacccg agtcgggtgc ttttttttcg ggtaccagct atcgttcgtt cgaggccaga 60
gcattcgaaa gttcaacggg accgtggccg atgtttcg 98
<210> 488
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 488
gtggcacccg agtcgggtgc ttttttttcg ggtaccaccc atgatcgtcc gatctggtcg 60
gatttgtaaa cgagacggtc aatcgcgctg catacttg 98
<210> 489
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 489
gtggcacccg agtcgggtgc ttttttttcg ggtaccaccc atgatcgtcc gatctggtcg 60
gatttgtaag tgaattgctg cgcatcggcg tacgactt 98
<210> 490
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 490
gtggcacccg agtcgggtgc ttttttttcg ggtaccaccc atgatcgtcc gatctggtcg 60
gatttgtaaa gttcaacggg accgtggccg atgtttcg 98
<210> 491
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 491
gtttcagagc taagcacaag agtgc 25
<210> 492
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 492
gcacccgact cgggtgccac 20
<210> 493
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 493
gctttatata tcttgtggaa agccagaaac atgg 34
<210> 494
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 494
gcactcttgt gcttagctct gaaac 25
<210> 495
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (29)..(48)
<223> n是a, c, g, 或t
<400> 495
gtcgacggta tttatcgtaa tggatcctnn nnnnnnnnnn nnnnnnnntc tagacatcga 60
aaacgagatg acggacggc 79
<210> 496
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(82)
<223> n是a, c, g, 或t
<400> 496
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn nnccagaaac atgggcatgt ggatcc 106
<210> 497
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(81)
<223> n是a, c, g, 或t
<400> 497
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn nccagaaaca tgggcatgtg gatcc 105
<210> 498
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(80)
<223> n是a, c, g, 或t
<400> 498
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn ccagaaacat gggcatgtgg atcc 104
<210> 499
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(78)
<223> n是a, c, g, 或t
<400> 499
caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnnngg atccacatgc ccatgtttct gg 102
<210> 500
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(77)
<223> n是a, c, g, 或t
<400> 500
caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnngga tccacatgcc catgtttctg g 101
<210> 501
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(76)
<223> n是a, c, g, 或t
<400> 501
caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnggat ccacatgccc atgtttctgg 100
<210> 502
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(82)
<223> n是a, c, g, 或t
<400> 502
aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn nnccagaaac atgggcatgt ggatcc 106
<210> 503
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(81)
<223> n是a, c, g, 或t
<400> 503
aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn nccagaaaca tgggcatgtg gatcc 105
<210> 504
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(80)
<223> n是a, c, g, 或t
<400> 504
aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn ccagaaacat gggcatgtgg atcc 104
<210> 505
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(78)
<223> n是a, c, g, 或t
<400> 505
caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnnngg atccacatgc ccatgtttct gg 102
<210> 506
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(77)
<223> n是a, c, g, 或t
<400> 506
caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnngga tccacatgcc catgtttctg g 101
<210> 507
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(76)
<223> n是a, c, g, 或t
<400> 507
caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnggat ccacatgccc atgtttctgg 100
<210> 508
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(82)
<223> n是a, c, g, 或t
<400> 508
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn nncacggtac cgtactgcag gatcctgc 108
<210> 509
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(81)
<223> n是a, c, g, 或t
<400> 509
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn ncacggtacc gtactgcagg atcctgc 107
<210> 510
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(80)
<223> n是a, c, g, 或t
<400> 510
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn cacggtaccg tactgcagga tcctgc 106
<210> 511
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(78)
<223> n是a, c, g, 或t
<400> 511
caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnnngc aggatcctgc agtacggtac cgtg 104
<210> 512
<211> 103
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(77)
<223> n是a, c, g, 或t
<400> 512
caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnngca ggatcctgca gtacggtacc gtg 103
<210> 513
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(76)
<223> n是a, c, g, 或t
<400> 513
caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnngcag gatcctgcag tacggtaccg tg 102
<210> 514
<211> 116
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(82)
<223> n是a, c, g, 或t
<400> 514
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn nngctttata tatcttgtgg aaagccagaa acatgg 116
<210> 515
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(81)
<223> n是a, c, g, 或t
<400> 515
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn ngctttatat atcttgtgga aagccagaaa catgg 115
<210> 516
<211> 114
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(80)
<223> n是a, c, g, 或t
<400> 516
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn gctttatata tcttgtggaa agccagaaac atgg 114
<210> 517
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(78)
<223> n是a, c, g, 或t
<400> 517
caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnnngc acccgactcg ggtgccac 98
<210> 518
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(82)
<223> n是a, c, g, 或t
<400> 518
aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn nngccgtccg tcatctcgtt ttcg 104
<210> 519
<211> 103
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(81)
<223> n是a, c, g, 或t
<400> 519
aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn ngccgtccgt catctcgttt tcg 103
<210> 520
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (71)..(80)
<223> n是a, c, g, 或t
<400> 520
aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnnn gccgtccgtc atctcgtttt cg 102
<210> 521
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (67)..(78)
<223> n是a, c, g, 或t
<400> 521
caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60
cgatctnnnn nnnnnnnntc cctagttagc cagagagctc c 101
<210> 522
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 522
atcctccttc aatacatccc 20
<210> 523
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 523
acactaccac catttcctat 20
<210> 524
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 524
actccactac tactcactct 20
<210> 525
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 525
accctctaac ttccatcaca 20
<210> 526
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 526
accacaaccc attcctttca 20
<210> 527
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 527
tttctaccac taatcaaccc 20
<210> 528
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 528
accctttaca aacacaccct 20
<210> 529
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 529
tcctattctc aacctaacct 20
<210> 530
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 530
tatccttcaa tccctccaca 20
<210> 531
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 531
acattacacc tcattctccc 20
<210> 532
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 532
tttactccct acacctccaa 20
<210> 533
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 533
ttctccctct atcaactcta 20
<210> 534
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 534
acccttacta ctacatcatc 20
<210> 535
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 535
tcctaacaac caactactcc 20
<210> 536
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 536
tctatcatta ccctcctcct 20
<210> 537
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 537
tattcacctt acaaaccctc 20
<210> 538
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 538
aaacacacac taaaccaccc 20
<210> 539
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 539
aactcatctc aatcctccca 20
<210> 540
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 540
tatctcatca atcccacact 20
<210> 541
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 541
tctatcatct ccaaaccaca 20
<210> 542
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 542
tccaactcat ctctaatctc 20
<210> 543
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 543
aatactctcc cacctcaact 20
<210> 544
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 544
ataaatcatt cccactaccc 20
<210> 545
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 545
acccaacact cataacatcc 20
<210> 546
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 546
ttcctaacaa atcacatccc 20
<210> 547
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 547
ttcttccctc aatcttcatc 20
<210> 548
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 548
tactacaaac ccataatccc 20
<210> 549
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 549
tcctcatctt actccctcta 20
<210> 550
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 550
aatctcacct tccacttcac 20
<210> 551
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 551
ttacctctaa ccctccattc 20
<210> 552
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 552
actttccaca tactatccca 20
<210> 553
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 553
acctttctcc atacccaact 20
<210> 554
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 554
tcaaactttc caaccacctc 20
<210> 555
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 555
acaccattta tccactcctc 20
<210> 556
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 556
tcccaactaa cctaacattc 20
<210> 557
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 557
acatcctaac tacaaccttc 20
<210> 558
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 558
ttccacaatc acttccacaa 20
<210> 559
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 559
tcccatacaa atccaaacct 20
<210> 560
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 560
ttctctactc attccctcaa 20
<210> 561
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 561
aaactccaca tccatctcat 20
<210> 562
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 562
aatctcctcc aacacttcta 20
<210> 563
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 563
taaacataac accctttccc 20
<210> 564
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 564
ttatccatcc ctcttcctac 20
<210> 565
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 565
aactacatac tccctacctc 20
<210> 566
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 566
attacactcc atccactcaa 20

Claims (179)

1.一种方法,包括:
(a)将DNA引入至多个细胞中,所述DNA包含:包含识别序列的向导部分、报告基因部分和包含读取序列的标识部分;
(b)通过确定所述报告基因部分来确定所述多个细胞内由被引入的DNA的所述报告基因部分表达的RNA分子的位置;
(c)通过将所述细胞暴露于能够与所述读取序列结合的读出探针来确定在所述多个细胞内由所述引入的包含所述报告基因部分和所述标识部分的DNA表达的所述RNA分子上的读取序列;
(d)将所述读出探针的结合与由所述引入的DNA的所述报告基因部分表达的所述RNA分子的位置共定位;
(e)使用不同的读取序列反复进行(b)、(c)和(d)多次;和
(f)形成与所共定位的读出探针的结合对应的码字,其中所述码字的位数值基于所述读出探针与所述读取序列的结合。
2.权利要求1所述的方法,进一步包括基于测量的码字标识单个细胞的向导部分。
3.权利要求1或2中任一项所述的方法,其中所述识别序列识别DNA序列。
4.权利要求1-3中任一项所述的方法,其中所述识别序列识别RNA序列。
5.权利要求1-4中任一项所述的方法,其中所述引入的DNA来源于核酸文库。
6.权利要求5所述的方法,其中所述文库通过混合克隆生成。
7.权利要求1-6中任一项所述的方法,其中所述DNA上的向导部分和标识部分的缔合对的身份通过测序确定。
8.权利要求1-7中任一项所述的方法,其中所述引入的DNA允许所述向导部分和标识部分的缔合发生。
9.权利要求1-8中任一项所述的方法,其中每个读取序列代表码字内的位置的值。
10.权利要求1-9中任一项所述的方法,其中所述读取序列序贯地进行测定。
11.权利要求1-10中任一项所述的方法,其中所述向导部分进一步包含Cas蛋白结合序列。
12.权利要求1-11中任一项所述的方法,其中所述向导部分允许所述Cas蛋白靶向到DNA或RNA以干扰基因的序列或表达。
13.权利要求1-12中任一项所述的方法,其中所述报告基因部分编码能够通过荧光检测到的蛋白。
14.权利要求1-13中任一项所述的方法,其中所述报告基因部分编码荧光蛋白。
15.权利要求1-14中任一项所述的方法,其中所述报告基因部分编码萤光素酶。
16.权利要求1-15中任一项所述的方法,其中所述报告基因部分编码能够通过免疫沉淀检测到的蛋白。
17.权利要求1-16中任一项所述的方法,其中所述报告基因部分编码能够通过免疫荧光检测到的蛋白。
18.权利要求1-17中任一项所述的方法,其中所述报告基因部分编码Myc标签。
19.权利要求1-18中任一项所述的方法,其中所述报告基因部分编码HA标签。
20.权利要求1-19中任一项所述的方法,其中所述报告基因部分包含报告基因。
21.权利要求1-20中任一项所述的方法,其中所述标识部分存在于所述报告基因的3’UTR内。
22.权利要求1-21中任一项所述的方法,其中所述报告基因部分包含第一启动子。
23.权利要求22所述的方法,其中所述启动子是驱动转录的启动子。
24.权利要求22或23中任一项所述的方法,其中所述启动子包含CMV启动子。
25.权利要求22-24中任一项所述的方法,其中所述识别序列包含与所述第一启动子分开的第二启动子。
26.权利要求1-25中任一项所述的方法,其中所述识别序列和所述报告基因部分间隔至少1000个碱基。
27.权利要求1-26中任一项所述的方法,其中在所述DNA内所述识别序列和所述报告基因部分间隔至少100个碱基。
28.权利要求1-27中任一项所述的方法,包括使用荧光确定所述一个或多个读取序列。
29.权利要求1-28中任一项所述的方法,包括使用靶向所述报告基因部分的smFISH确定包含所述报告基因部分和所述标识部分的RNA的位置。
30.权利要求1-29中任一项所述的方法,包括使用病毒将所述DNA引入至所述多个细胞中。
31.权利要求30所述的方法,其中所述病毒是慢病毒。
32.权利要求31所述的方法,其中所述向导部分和所述标识部分被定位于紧邻所述慢病毒内聚嘌呤带序列的3’。
33.权利要求32所述的方法,其中所述向导部分在所述慢病毒的5’区内复制。
34.权利要求1-33中任一项所述的方法,其中将所述DNA引入至所述多个细胞中包括将所述DNA电穿孔至所述多个细胞中。
35.权利要求1-34中任一项所述的方法,其中所述细胞包括组织中的细胞。
36.权利要求1-35中任一项所述的方法,包括将所述DNA引入到所述多个细胞中使得至少50%的所述细胞包含不超过一种类型的引入的DNA。
37.权利要求1-36中任一项所述的方法,包括将所述DNA引入到所述多个细胞中使得至少90%的所述细胞包含不超过一种类型的引入的DNA。
38.权利要求1-37中任一项所述的方法,包括将所述DNA引入至所述细胞的基因组中。
39.权利要求1-38中任一项所述的方法,其中所述DNA进一步包含启动子。
40.权利要求1-39中任一项所述的方法,其中所述读取序列限定所述码字的位数的二元空间。
41.权利要求1-40中任一项所述的方法,其中所述读取序列限定所述码字的位数的三元空间。
42.权利要求1-41中任一项所述的方法,其中确定所述一个或多个读取序列包括:
对所述码字的每个位数,将与所述码字的位数对应的读出探针施加于所述多个细胞。
43.权利要求42所述的方法,包括序贯地向所述多个细胞施加和移除每个所述读出探针。
44.权利要求1-43中任一项所述的方法,其中对于所形成的码字的至少一些,将所述码字与有效码字匹配,其中,如果没发现有匹配,则丢弃所述码字或对所述码字施加误差修正以形成有效码字。
45.权利要求44所述的方法,其中所述码字的位数的值限定一组潜在码字。
46.权利要求45所述的方法,其中所述组的潜在码字包括至少102个单一序列。
47.权利要求46所述的方法,其中所述组的潜在码字包括至少103个单一序列。
48.权利要求46或47中任一项所述的方法,其中所述组的潜在码字包括至少104个单一序列。
49.权利要求46-48中任一项所述的方法,其中所述组的潜在码字包括至少105个单一序列。
50.权利要求46-49中任一项所述的方法,其中所述组的潜在码字包括至少106个单一序列。
51.权利要求44-50中任一项所述的方法,其中所述潜在码字的一部分是有效码字。
52.权利要求51所述的方法,包括将所测量的码字与所述有效码字比较以确定码字测量中的误差。
53.权利要求44-52中任一项所述的方法,其中所述有效码字是从可能码字随机选择的子集。
54.权利要求53所述的方法,其中小于10%的可能码字是有效码字。
55.权利要求53或54中任一项所述的方法,其中小于5%的可能码字是有效码字。
56.权利要求53-55中任一项所述的方法,其中小于1%的可能码字是有效码字。
57.权利要求53-56中任一项所述的方法,其中小于0.5%的可能码字是有效码字。
58.权利要求1-57中任一项所述的方法,其中所述标识部分包含N个可变部分,N是至少3,每个可变部分具有至少两种可能性。
59.权利要求58所述的方法,其中N是至少5。
60.权利要求58或59中任一项所述的方法,其中N是至少10。
61.权利要求58-60中任一项所述的方法,其中N是至少15。
62.权利要求58-61中任一项所述的方法,其中N是至少20。
63.权利要求1-62中任一项所述的方法,其中所述标识部分内的可变部分各自具有相同的长度。
64.权利要求1-63中任一项所述的方法,其中所述标识部分内的可变部分各自具有5-50nt的长度。
65.权利要求1-64中任一项所述的方法,其中所述标识部分内的可变部分各自具有15-25nt的长度。
66.权利要求1-65中任一项所述的方法,其中所述标识部分包含检错码。
67.权利要求1-66中任一项所述的方法,其中所述标识部分包含纠错码。
68.权利要求66或67中任一项所述的方法,其中所述检错码或纠错码包含Hamming代码。
69.权利要求66-68中任一项所述的方法,其中所述检错码或纠错码包含扩展的Hamming代码。
70.权利要求66-69中任一项所述的方法,其中所述检错码或纠错码包含Reed-Solomon代码。
71.权利要求66-70中任一项所述的方法,其中所述检错码或纠错码对所述代码的所有成员不是一样的。
72.权利要求1-71中任一项所述的方法,其中所述核酸探针包含至少8个可能的读取序列。
73.权利要求1-72中任一项所述的方法,其中所述核酸探针包含至少16个可能的读取序列。
74.权利要求1-73中任一项所述的方法,其中所述核酸探针包含不超过32个可能的读取序列。
75.权利要求1-74中任一项所述的方法,其中所述核酸探针包含至少32个可能的读取序列。
76.一种方法,包括:
将DNA引入至多个细胞中,所述DNA包含:包含识别序列的向导部分、报告基因部分和包含读取序列的标识部分;
通过确定所述报告基因部分来确定所述多个细胞内由被引入的DNA的所述报告基因部分表达的RNA分子的位置;
通过将所述细胞暴露于各自能够与读取序列结合的多个读出探针来确定在所述多个细胞内的所述读取序列,
将所述读出探针的结合与由所述引入的DNA的所述报告基因部分表达的所述RNA分子的位置共定位;以及
形成与所共定位的读出探针的结合对应的码字,其中所述码字的位数值基于所述读出探针与所述读取序列的结合。
77.一种方法,包括:
使用慢病毒将DNA引入至多个细胞中,其中所述DNA包含:包含识别序列的向导部分、报告基因部分和包含读取序列的标识部分;
确定所述多个细胞的表型;和
确定所述多个细胞的基因型;以及
确定所述基因型和所述表型之间的对应关系。
78.权利要求77所述的方法,其中确定表型包括确定细胞性质。
79.权利要求77或78中任一项所述的方法,其中确定表型包括确定细胞结构的形态。
80.权利要求79所述的方法,其中所述形态是全细胞形态。
81.权利要求79或80中任一项所述的方法,其中所述形态是亚区室形态。
82.权利要求77-81中任一项所述的方法,其中确定表型包括确定超过一个细胞结构的形态。
83.权利要求77-82中任一项所述的方法,其中确定表型包括使用免疫荧光确定蛋白。
84.权利要求77-83中任一项所述的方法,其中确定表型包括使用荧光确定蛋白。
85.权利要求77-84中任一项所述的方法,其中确定表型包括使用荧光蛋白确定蛋白。
86.权利要求77-85中任一项所述的方法,其中确定表型包括使用有机染料确定蛋白。
87.权利要求77-86中任一项所述的方法,其中确定表型包括确定细胞动力学行为。
88.权利要求77-87中任一项所述的方法,其中确定表型包括确定细胞-细胞相互作用。
89.权利要求77-88中任一项所述的方法,其中确定表型包括确定细胞状态。
90.权利要求77-89中任一项所述的方法,其中确定表型包括使用smFISH确定一个细胞RNA或多个细胞RNA。
91.权利要求77-90中任一项所述的方法,其中确定表型包括使用多重FISH确定基因表达谱。
92.权利要求77-91中任一项所述的方法,其中确定表型包括使用MERFISH确定基因表达谱。
93.权利要求77-92中任一项所述的方法,其中确定表型包括从空间上确定一个RNA或多个RNA。
94.权利要求77-93中任一项所述的方法,其中确定表型包括确定至少一部分蛋白质组。
95.权利要求77-94中任一项所述的方法,其中确定表型包括使用DNA FISH确定至少一部分染色体。
96.权利要求77-95中任一项所述的方法,其中确定表型包括使用多重DNA FISH确定至少一部分染色体。
97.权利要求77-96中任一项所述的方法,其中确定表型包括使用CASFISH确定至少一部分染色体。
98.权利要求77-97中任一项所述的方法,其中确定表型包括使用免疫荧光确定蛋白修饰细胞。
99.权利要求77-98中任一项所述的方法,其中确定表型包括确定蛋白与RNA或DNA的相互作用。
100.权利要求77-99中任一项所述的方法,其中确定表型包括确定表观遗传修饰。
101.权利要求77-100中任一项所述的方法,其中确定表型包括确定细胞生长。
102.权利要求77-101中任一项所述的方法,其中确定表型包括确定细胞生长的变化。
103.权利要求77-102中任一项所述的方法,其中确定表型和确定基因型使用普通成像技术。
104.权利要求77-103中任一项所述的方法,其中确定表型和确定基因型使用不同的成像技术。
105.权利要求103或104中任一项所述的方法,其中所述成像技术具有超过300nm的分辨率。
106.权利要求103-105中任一项所述的方法,其中确定表型使用多色荧光成像。
107.权利要求103-106中任一项所述的方法,其中确定表型使用共聚焦成像。
108.权利要求103-107中任一项所述的方法,其中确定表型使用TIRF成像。
109.权利要求103-108中任一项所述的方法,其中确定表型使用双光子成像。
110.权利要求103-109中任一项所述的方法,其中确定表型使用STORM。
111.权利要求103-110中任一项所述的方法,其中确定表型使用超分辨率技术。
112.权利要求111所述的方法,其中所述超分辨率技术是PALM、FPALM、STED、SIM和/或RESOLFT。
113.权利要求77-112中任一项所述的方法,其中确定基因型包括确定所述引入的DNA的标识部分的序列。
114.权利要求77-113中任一项所述的方法,其中确定基因型包括使用smFISH确定所述基因型。
115.权利要求77-114中任一项所述的方法,其中确定基因型包括使用多重FISH确定所述基因型。
116.权利要求77-115中任一项所述的方法,其中确定基因型包括使用MERFISH确定所述基因型。
117.权利要求77-116中任一项所述的方法,其中确定基因型包括使用原位杂交确定所述基因型。
118.权利要求77-117中任一项所述的方法,其中确定基因型包括使用连续FISH确定所述基因型。
119.权利要求77-118中任一项所述的方法,其中确定基因型包括使用CASFISH确定所述基因型。
120.权利要求77-119中任一项所述的方法,其中确定基因型包括使用原位测序确定所述基因型。
121.一种方法,包括:
将核酸引入至多个细胞中,其中所述核酸包含:包含识别序列的向导部分、报告基因部分和包含读取序列的标识部分;
对所述多个细胞成像,其中所述细胞因表达所述向导部分而表现出可成像的表型差异;以及
获取所述多个细胞的多个图像,其中所述细胞图像因所述细胞内所述核酸的标识部分的差异而表现出差异。
122.权利要求121所述的方法,其中基于所述向导部分和所述标识部分之间的对应关系,鉴定被引入至所述多个细胞的所述向导部分。
123.权利要求121或122中任一项所述的方法,其中当成像时具有不同表型的细胞具有不同的外观。
124.权利要求121-123中任一项所述的方法,其中当成像时具有不同表型的细胞具有不同的荧光。
125.权利要求121-124中任一项所述的方法,其中对所述多个细胞成像包括使用单一成像模态获取所述多个细胞的图像。
126.权利要求121-125中任一项所述的方法,其中对所述多个细胞成像包括使用多个成像模态获取所述多个细胞的图像。
127.权利要求121-126中任一项所述的方法,其中对所述多个细胞成像包括获取单一图像。
128.权利要求121-127中任一项所述的方法,其中对所述多个细胞成像包括获取多个图像。
129.权利要求121-128中任一项所述的方法,其中对所述多个细胞成像包括使用smFISH对所述多个细胞成像。
130.权利要求121-129中任一项所述的方法,其中对所述多个细胞成像包括使用MERFISH对所述多个细胞成像。
131.权利要求121-130中任一项所述的方法,进一步包括确定所述细胞的形态。
132.权利要求131所述的方法,包括确定随时间推移所述细胞的形态变化。
133.权利要求131或132中任一项所述的方法,包括确定所述细胞的细胞器的形态改变。
134.权利要求131-133中任一项所述的方法,包括确定细胞生长期间的形态变化。
135.一种方法,包括:
使用慢病毒将DNA引入至多个细胞中,其中所述DNA包含:包含识别序列的向导部分和包含读取序列的标识部分;
确定所述多个细胞的表型;
确定所述多个细胞的基因型;以及
确定基因型和表型之间的对应关系。
136.权利要求135所述的方法,其中确定表型包括确定细胞性质。
137.权利要求135或136中任一项所述的方法,其中确定表型包括确定细胞结构的形态。
138.权利要求137所述的方法,其中所述形态是全细胞形态。
139.权利要求137或138中任一项所述的方法,其中所述形态是亚区室形态。
140.权利要求137-139中任一项所述的方法,其中确定表型包括确定超过一个细胞结构的形态。
141.权利要求135-140中任一项所述的方法,其中确定表型包括使用免疫荧光确定蛋白。
142.权利要求135-141中任一项所述的方法,其中确定表型包括使用荧光确定蛋白。
143.权利要求135-142中任一项所述的方法,其中确定表型包括使用荧光蛋白确定蛋白。
144.权利要求135-143中任一项所述的方法,其中确定表型包括使用有机染料确定蛋白。
145.权利要求135-144中任一项所述的方法,其中确定表型包括确定细胞动力学行为。
146.权利要求135-145中任一项所述的方法,其中确定表型包括确定细胞-细胞相互作用。
147.权利要求135-146中任一项所述的方法,其中确定表型包括确定细胞状态。
148.权利要求135-147中任一项所述的方法,其中确定表型包括使用smFISH确定一个RNA或多个RNA。
149.权利要求135-148中任一项所述的方法,其中确定表型包括使用多重FISH确定基因表达谱。
150.权利要求135-149中任一项所述的方法,其中确定表型包括使用MERFISH确定基因表达谱。
151.权利要求135-150中任一项所述的方法,其中确定表型包括从空间上确定一个RNA或多个RNA。
152.权利要求135-151中任一项所述的方法,其中确定表型包括确定至少一部分蛋白质组。
153.权利要求135-152中任一项所述的方法,其中确定表型包括使用DNA FISH确定至少一部分染色体。
154.权利要求135-153中任一项所述的方法,其中确定表型包括使用多重DNA FISH确定至少一部分染色体。
155.权利要求135-154中任一项所述的方法,其中确定表型包括使用CASFISH确定至少一部分染色体。
156.权利要求135-155中任一项所述的方法,其中确定表型包括使用免疫荧光确定蛋白修饰细胞。
157.权利要求135-156中任一项所述的方法,其中确定表型包括确定蛋白与RNA或DNA的相互作用。
158.权利要求135-157中任一项所述的方法,其中确定表型包括确定表观遗传修饰。
159.权利要求135-158中任一项所述的方法,其中确定表型包括确定细胞生长。
160.权利要求135-159中任一项所述的方法,其中确定表型包括确定细胞生长的变化。
161.权利要求135-160中任一项所述的方法,其中确定表型和确定基因型使用普通成像技术。
162.权利要求161所述的方法,其中所述成像技术具有超过300nm的分辨率。
163.权利要求135-160中任一项所述的方法,其中确定表型和确定基因型使用不同的成像技术。
164.权利要求163所述的方法,其中至少一种所述成像技术具有超过300nm的分辨率。
165.权利要求135-164中任一项所述的方法,其中确定表型使用多色荧光成像。
166.权利要求135-165中任一项所述的方法,其中确定表型使用共聚焦成像。
167.权利要求135-166中任一项所述的方法,其中确定表型使用TIRF成像。
168.权利要求135-167中任一项所述的方法,其中确定表型使用双光子成像。
169.权利要求135-168中任一项所述的方法,其中确定表型使用STORM。
170.权利要求135-169中任一项所述的方法,其中确定表型使用超分辨率技术。
171.权利要求135-170中任一项所述的方法,其中所述超分辨率技术是PALM、FPALM、STED、SIM和/或RESOLFT。
172.权利要求135-171中任一项所述的方法,其中确定基因型包括确定所述引入的DNA的标识部分的序列。
173.权利要求135-172中任一项所述的方法,其中确定基因型包括使用smFISH确定所述基因型。
174.权利要求135-173中任一项所述的方法,其中确定基因型包括使用多重FISH确定所述基因型。
175.权利要求135-174中任一项所述的方法,其中确定基因型包括使用MERFISH确定所述基因型。
176.权利要求135-175中任一项所述的方法,其中确定基因型包括使用原位杂交确定所述基因型。
177.权利要求135-176中任一项所述的方法,其中确定基因型包括使用连续FISH确定所述基因型。
178.权利要求135-177中任一项所述的方法,其中确定基因型包括使用CASFISH确定所述基因型。
179.权利要求135-178中任一项所述的方法,其中确定基因型包括使用原位测序确定所述基因型。
CN202080043174.XA 2019-04-19 2020-04-17 基于成像的混合crispr筛选 Pending CN113994001A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962836578P 2019-04-19 2019-04-19
US62/836,578 2019-04-19
US201962841715P 2019-05-01 2019-05-01
US62/841,715 2019-05-01
PCT/US2020/028632 WO2020214885A1 (en) 2019-04-19 2020-04-17 Imaging-based pooled crispr screening

Publications (1)

Publication Number Publication Date
CN113994001A true CN113994001A (zh) 2022-01-28

Family

ID=72837903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080043174.XA Pending CN113994001A (zh) 2019-04-19 2020-04-17 基于成像的混合crispr筛选

Country Status (7)

Country Link
US (1) US20220205983A1 (zh)
EP (1) EP3956468A4 (zh)
JP (1) JP2022529788A (zh)
CN (1) CN113994001A (zh)
AU (1) AU2020258458A1 (zh)
CA (1) CA3137344A1 (zh)
WO (1) WO2020214885A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016018963A1 (en) 2014-07-30 2016-02-04 President And Fellows Of Harvard College Probe library construction
US11788123B2 (en) 2017-05-26 2023-10-17 President And Fellows Of Harvard College Systems and methods for high-throughput image-based screening
EP4352260A1 (en) * 2021-05-21 2024-04-17 The Board Of Trustees Of The Leland Stanford Junior University Multiple feature integration with next-generation three-dimensional in situ sequencing
EP4408992A1 (en) * 2021-09-27 2024-08-07 Proxygen GmbH Method for improved intron tagging and automated clone recognition

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030064395A1 (en) * 1997-11-19 2003-04-03 The Government Of The U.S.A. As Represented By The Secretery Of The Dept. Of Health & Human Services Methods for detecting intermolecular interactions in vivo and in vitro
CN107075546A (zh) * 2014-08-19 2017-08-18 哈佛学院董事及会员团体 用于对核酸探测并作图的rna‑引导的系统
WO2018218150A1 (en) * 2017-05-26 2018-11-29 President And Fellows Of Harvard College Systems and methods for high-throughput image-based screening

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2716420C2 (ru) * 2013-06-17 2020-03-11 Те Брод Инститьют Инк. Доставка и применение систем crispr-cas, векторов и композиций для целенаправленного воздействия и терапии в печени

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030064395A1 (en) * 1997-11-19 2003-04-03 The Government Of The U.S.A. As Represented By The Secretery Of The Dept. Of Health & Human Services Methods for detecting intermolecular interactions in vivo and in vitro
CN107075546A (zh) * 2014-08-19 2017-08-18 哈佛学院董事及会员团体 用于对核酸探测并作图的rna‑引导的系统
WO2018218150A1 (en) * 2017-05-26 2018-11-29 President And Fellows Of Harvard College Systems and methods for high-throughput image-based screening

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈一欧;宝颖;马华峥;伊宗裔;周卓;魏文胜;: "基因编辑技术及其在中国的研究发展", 遗传, no. 10, pages 114 - 129 *

Also Published As

Publication number Publication date
JP2022529788A (ja) 2022-06-24
CA3137344A1 (en) 2020-10-22
AU2020258458A1 (en) 2021-11-18
EP3956468A4 (en) 2023-01-11
WO2020214885A1 (en) 2020-10-22
US20220205983A1 (en) 2022-06-30
EP3956468A1 (en) 2022-02-23

Similar Documents

Publication Publication Date Title
CN113366116A (zh) 用于merfish和其他应用的扩增方法和系统
CN113994001A (zh) 基于成像的混合crispr筛选
US20230257800A1 (en) Chemical compositions and methods of using same
AU2017268257B2 (en) Methods for detecting target nucleic acids in a sample
US20240175081A1 (en) Systems and methods for high-throughput image-based screening
JP2021503969A (ja) 出現(emergence)による核酸のシーケンシング
EP4073265A1 (en) Spatial barcoding
CN116732143A (zh) 基质印迹和清除
JP2002516667A (ja) 修飾バックボーンを有するアンチセンスプローブと核酸の液中ハイブリッド形成
JP2023530889A (ja) 試料中の異なる分析物及び分析物の異なるサブグループ/変形物を検出するための多重的方法
US20230029257A1 (en) Compositions and methods for light-directed biomolecular barcoding
US20230348958A1 (en) Genome-scale imaging of the 3d organization and transcriptional activity of chromatin
US20240263169A1 (en) Tissue spatial omics
JPWO2021119402A5 (zh)
EP3914734B1 (en) Compositions and method for synthesizing nucleic acids
WO2024020124A1 (en) Engineering dynamic dna nano-devices to amplify signal
CN118265800A (zh) 用于多路fish的比率计量符号与顺序编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40062188

Country of ref document: HK