CN109715823A - 通过测序进行的神经元投射的多重分析 - Google Patents

通过测序进行的神经元投射的多重分析 Download PDF

Info

Publication number
CN109715823A
CN109715823A CN201780036111.XA CN201780036111A CN109715823A CN 109715823 A CN109715823 A CN 109715823A CN 201780036111 A CN201780036111 A CN 201780036111A CN 109715823 A CN109715823 A CN 109715823A
Authority
CN
China
Prior art keywords
bar code
neuron
nucleic acid
mapseq
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780036111.XA
Other languages
English (en)
Inventor
安东尼·扎多尔
斯特斯·凯布舒尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cold Spring Harbor Laboratory
Original Assignee
Cold Spring Harbor Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cold Spring Harbor Laboratory filed Critical Cold Spring Harbor Laboratory
Publication of CN109715823A publication Critical patent/CN109715823A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/18Togaviridae; Flaviviridae
    • C07K14/1808Alphaviruses or Group A arboviruses, e.g. sindbis, VEE, EEE, WEE, semliki forest virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0618Cells of the nervous system
    • C12N5/0619Neurons
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/36011Togaviridae
    • C12N2770/36111Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
    • C12N2770/36141Use of virus, viral particle or viral elements as a vector
    • C12N2770/36143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Neurology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Neurosurgery (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供了包含多个标记的神经元的组合物,每个标记的神经元是由编码独特条形码核酸的表达构建体标记的。

Description

通过测序进行的神经元投射的多重分析
本申请要求于2016年4月8日提交的第62/320,386号美国临时专利申请的优先权,其全部内容通过引用并入本文。
在整个申请中,引用了各种出版物,包括在括号中引用的那些。对括号中引用的出版物的完整引用在紧接在权利要求之前的说明书末尾列出。所有引用的出版物的公开内容通过引用整体并入本申请中,以便更全面地描述本发明所属领域的现状。
本发明是在政府支持下在美国国立卫生研究院(National Institutes ofHealth)授予的授权号NS073129、DA036913和CA045508下完成的。政府拥有本发明的某些权利。
背景技术
已经在小鼠大脑中系统地定位出了区域到区域的连接,但是仅使用了整体标记(bulk labeling)技术,该技术掩盖了由混合的异源群体引起的单个神经元投射的多样性。本文描述了一种新方法,其中将随机核苷酸序列(“条形码”)引入神经元中以将投射定位(projection-mapping)转换成利用高通量测序(HTS)技术的形式。在基于测序的投射多重分析(MAPseq)中,通过RNA条形码的病毒表达标记单个神经元轴突投射,从而获得用于确定一大群单个神经元的投射靶标的有效且大规模的平行方法。将MAPseq应用于蓝斑(LC)并且证明了大多数单个LC神经元具有偏爱的皮层靶标。通过将传统上被视为显微镜学难题的神经解剖学重建为测序难题,MAPseq利用HTS的发展来允许对脑回路的高通量询问。
发明内容
神经元通过远程轴突投射将信息传递到远处的大脑区域。在一些情况下,功能上不同的神经元群体在小区域内混合。例如,下丘脑核附近介导包括食欲、攻击性和性吸引力在内的基本欲望(Kennedy et al.,2014;Sternson,2013),并且来自这些核的神经元投射到不同的靶标。在视觉皮层区域V1中,对视觉刺激的响应与神经元所投射到的高级视觉区域的特性相匹配(Glickfeld et al.,2013;Movshon and Newsome,1996)。诸如此类的发现表明,单个神经元传输的信息可以根据其靶标进行调整。然而,目前还没有用于确定单个神经元的不同投射模式的高通量方法。
目前,在定位远程连接的解剖学方法中,通量和分辨率之间存在着显著的折衷关系。在传统的脑成像(brain mapping)研究中,荧光或酶标记用于通过光学显微镜使细胞体和远端投射可视化。使用整体标记技术实现最大通量,该技术对神经元群体的总体结构进行采样(Oh et al.,2014)。这样的方法很快速,并且已经进行了几次大规模的努力来系统地绘制介观连接性(Oh et al.,2014;Zingg et al.,2014)。然而,这种整体方法掩盖了由异源神经元群体引起的单个神经元投射的多样性。例如,考虑到投射到三个下游区域的单个源区域(图1a)。该投射模式意味着该源区域中的神经元可以向三个下游区域发送信息。然而,相同的整体投射模式可以以多种方式出现:一对一体系,其中每个神经元仅靶向一个下游区域(左);一对多体系,其中每个神经元靶向每一个下游区域(中间);或者更复杂的体系(右)。尽管可以通过利用被工程化以在遗传限定的神经元亚群中表达标记物(例如重组酶)的转基因动物来改进整体标记方法(Tasic et al.,2016),但是这些策略预先假定标记物靶向多个功能类别的神经元。
区分图1a中所示的体系需要单神经元分辨率。目前实现单神经元分辨率的方法需要单独标记每个大脑的一个或最多几个细胞(Economo et al.,2016),这是一种劳动密集型方法,以低通量为代价提供高分辨率。虽然可以通过用不同颜色的荧光团标记单个神经元来多重复用单神经元追踪(Ghosh et al.,2011;Livet et al.,2007),但实际上多重复用化的程度受到颜色数量的限制-通过显微镜法可以解析最多5-10种颜色。
MAPseq是一种新方法,其中脑定位被重新构建为高通量DNA测序的难题,通过使用短的随机RNA条形码以区分单个神经元从而实现多重复用(Mayer et al.,2015;Walsh andCepko,1992;Zador et al.,2012)(图1b)。使用条形码的关键优势在于它们的多样性随着序列的长度呈指数增长。独特条形码标识符的池(pool)实际上是无限的;甚至30个核苷酸(nt)的序列也具有430≈1018个条形码的潜在多样性,远远超过小鼠脑中的~108个神经元(Herculano-Houzel et al.,2006)。由于高通量测序可以快速且廉价地区分这些条形码,因此MAPseq有可能在单个脑中平行地读出数千甚至数百万个单个神经元的投射(图1c)。
在MAPseq中,通过注射编码条形码序列的多样化集合的病毒文库,在源区域中独特地标记神经元。条形码mRNA以高水平表达并被转运到远端靶投射区域处的轴突末端(图1d)。从注射位点和每个目标靶区域提取条形码mRNA,然后对提取的条形码mRNA进行测序以读出单个神经元投射模式。空间分辨率主要受靶标切割的精度的限制。使用此方法,可以在不到一周的时间内确定来自给定区域的全脑投射图谱。
附图说明
图1:条形码允许高通量单神经元追踪。(a)相同的整体成像结果可源于不同的基础投射模式。(b)单神经元分辨率可以通过用条形码随机标记神经元并读出靶区域中的条形码来实现。(c)被独特标记的细胞的预期分数由F=(1-1/N)(k-1)给出,其中假设条形码均匀分布,N为条形码的数量,k为感染细胞的数量。根据参考文献Herculano-Houzel et al.(2006)和Schüz and Palm(1989),示出了各小鼠脑区域的神经元数量(A1=初级听觉皮层;Ctx=新皮层)。(d)在MAPseq中,用条形码病毒文库以低MOI感染神经元。条形码mRNA被表达、运输并且可以从远端位点提取。
图2:用条形码病毒文库随机标记神经元可以实现对许多神经元的独特标记。(a)非独特标记的神经元(其中神经元被几个条形码标记)及其对MAPseq读出数据的影响的图示。(b)对条形码神经元进行单细胞分离,然后进行条形码互补物(complement)的测序,显示双重感染的机会很低。N=3只动物。绘制平均值和个体数据点。(c)非独特标记(其中几个神经元共享相同的条形码)及其对MAPseq读出数据的影响的图示。(d)高度多样性Sindbis病毒文库是通过将随机寡核苷酸鸟枪克隆到质粒中然后产生病毒而产生的。(e)这项研究中使用的病毒文库具有含有~106种不同条形码(BC)的多样性。基于该经验性条形码分布,(f)确定了所使用的病毒文库足够多样化从而以低错误率独特地标记所有LC。
图3:条形码Sindbis病毒可用于投射定位。(a)编码GFP、条形码和MAPP-nλ的双启动子Sindbis病毒用于将条形码传递至神经元。(b)LC神经元的条形码mRNA标记与这些神经元的GFP标记(在注射位点(上图)和轴突部(下图)的相邻6μm切片中)相当。比例尺=100μm。3只动物的代表性数据。(c)在改变方向和使皮层受神经支配之前,LC的轴突从细胞体沿吻侧(rostrally)投射。因此,投射到额叶皮层的LC轴突仅行进支配视觉皮层的轴突约一半长度的路程。(d)向右侧LC注射MAPseq病毒,如图所示沿着前后轴切割皮层。(e)通过条形码mRNA测量到的LC到同侧皮层的整体投射强度与皮层切片的前-后位置无关,表明LC轴突的均匀的RNA填充。N=4。(f)条形码mRNA的qPCR显示对同侧皮层(ipsi-)的LC投射是对侧皮层LC投射的约30倍。N=2只动物且每只动物21个皮层切片。
图4:MAPseq揭示了来自LC的投射的高多样性。(a)按照所描述的对来自靶区域的条形码mRNA进行测序(SSI=切片特异性标识符,UMI=独特分子标识符)。(b,c)来自同侧嗅球和皮层的条形码显示投射模式(d)在皮层和/或嗅球中具有单个或多个峰。阴影区域表示由每个切片的BC计数的平方根给出的泊松误差条。
图5:(a)来自4只动物的所有995个投射模式的热图显示了在按最大投射部位分类后的强对角线组成部分(component)。将条形码丰度归一化使靶区域上的总和为1并且如图所示进行颜色编码。(b)所有条形码从最大值开始的平均皮层下降率显示快速下降,其结构与所有神经元的随机混排(shuffling)切片后的下降不同。N=4。(c)皮层投射宽度的累积分布表明单个LC神经元对皮层的广泛低强度的神经支配。(BC=条形码)。
图6:MAPseq可以多重复用到几个注射位点。(a)将条形码Sindbis病毒双侧注射至LC后,如前所述切割左右嗅球和皮层。(b)双侧注射产生对单侧注射所预期的投射模式。从左侧和右侧LC追踪的神经元数量的差异由注射差异性引起。
图7:MAPseq为单个神经元投射模式的可靠读出数据。(a)两个代表性条形码对,它们的投射模式比对随机的两个不同的神经元所预期的投射模式更相似。它们显著的相似性表明MAPseq可靠地读出单个神经元投射模式。为了进行比较,动物之间最接近的匹配用灰色表示。(b)一只动物中以及动物之间beset条形码对之间的距离的累积分布。来自一只动物的代表性数据。
图8:病毒文库的多样性足以独特地标记许多细胞。(a)当来自文库的过多条形码用生物信息学方法移除时,可以使用我们的病毒文库独特地标记的细胞的数量不会发生显著变化。图例表示哪些条形码仍在被考虑用于进行标记。(b)在四个动物中的一个以上中追踪的三个条形码的位置。其中三个条形码中的两个在病毒文库中非常丰富。
图9:用我们开发的改良包装系统DH-BB(5'SIN;TE12ORF)替代传统的包装系统DH(26S)5'SIN,在很大程度上消除了注射位点远端细胞的感染。在注射常规包装的病毒后,(a,b)条形码mRNA的原位杂交标记了远离注射位点的细胞。粉红色箭头=主要注射位点;黑色箭头=继发感染。(c,d)类似地,在注射常规产生的病毒后,可以检测远离注射位点的GFP阳性细胞或细胞簇。比例尺=50μm。(e)使用DH(26S)5'SIN包装病毒产生的MAPseq数据显示仅在单个靶位点具有极高丰度的假条形码(“尖峰”),这是由在皮层体细胞中表达的条形码产生的,该皮层体细胞通过来自感染的LC神经元的轴突的病毒颗粒的繁殖而二次感染。(f)这些高丰度条形码的表达水平与注射位点的条形码相当。(g)将包装系统改为新的DH-BB(5'SIN;TE12ORF)会产生无繁殖能力的Sindbis病毒并消除这些高丰度的条形码。本文中描述的所有MAPseq结果都使用了这种新病毒。
图10:条形码结构。(a)病毒条形码和加标(spike-in)RNA的序列的差异使得可以很容易地区分这两者。(b)最终测序扩增子的结构。
图11:Sindbis病毒的立体定位注射可靠地感染LC并用条形码mRNA填充细胞体和轴突。(a)代表性Sindbis注射的最大z-投射显示与TH染色的LC极好的重叠,证实了成功地立体定向靶向细胞核。比例尺=100μm。(b)对还为TH+的感染细胞的分数的定量证实了通过立体定位注射可靠地靶向LC。N=6。(c)条形码mRNA的原位RNA显示出在注射位点良好的细胞体填充。比例尺=50μm。
图12:MAPseq工作流程。(a)对一个快速冷冻的大脑进行冷冻切片,并将感兴趣的区域切下来。然后分别提取来自每个区域的总RNA。(b)将已知量的加标RNA和含有独特SSI和UMI的RT引物加入到每个区域的总RNA中。产生双链cDNA,并使用外切核酸酶I消化剩余的RT引物,以避免含有UMI的引物参与随后的PCR反应。进行两轮巢式PCR,引入PE2测序引物结合位点,并将P7序列作为反向引物的5'突出端。凝胶提取后,扩增子可用于Illumina测序。
图13:MAPseq跟踪的神经元的整体投射再现了均质的整体投射,但单个投射模式是非同质的。(a)注射位点处条形码的表达水平与其对靶区域的最大投射强度之间没有相关性。(b)所有MAPseq追踪的神经元的检测峰数量的直方图。对于峰定义,参见实施例4。
图14:来自MAPseq数据的CAV-cre注射和轴突追踪的模拟再现了Schwarz等人报道的LC神经元的非特异性输出模式。(a)再现了Schwarz等人的图4d。简而言之,Schwarz等人将逆行CAV-cre病毒注入许多区域,包括嗅球和听觉皮层(AC),并将cre依赖的TVA-mCherry-AAV注入LC。然后,他们计算了许多输出区域中mCherry标记的LC轴突的数量,并将所有输出区域的轴突数量归一化。因此,他们可以量化由投射到注射位点定义的LC神经元群的投射强度,并且发现大多数LC神经元群同等地投射到所有输出区域。(b)基于我们的MAPseq结果模拟由Schwarz等人进行的实验所获得的结果,其以相同的方式绘制。简而言之,我们通过标记条形码来模拟对嗅球或听觉皮层(AC)进行的CAV-cre注射,其中在嗅球或听觉皮层(AC)中条形码以超过50个的计数存在。将包含输出区域的切片中的标记的条形码的归一化计数求和,并将所有输出区域上的所得的投射强度归一化,从而模拟输出区域中标记轴突的计数。与由MAPseq报告的特异性单细胞投射模式相反,该模拟概括了Schwarz等人的研究结果,突出了单神经元分辨率在连接定位(connectivity mapping)中的重要性。CC=扣带皮层;SC=躯体感觉皮层。
图15:MAPseq可多重复用到多个注射位点。(a)条形码中右侧与左侧注射位点的条形码计数分数的直方图。条形码在左侧和右侧注射位点显示出强烈的丰度差异,允许它们被分配到两个位点中的一个。
图16:MAPseq提供单神经元投射模式的可靠读出。(a)相同示例性条形码图谱对,其比对如图7a所示的随机图谱对所预期的更相似。我们以灰色示出了从比较动物的五(5)个独立采样中获得的动物之间条形码图谱的五(5)个最佳匹配。(b)动物1、3和4的动物内和动物间最佳条形码对的距离的累积分布函数。
图17:单个LC细胞的测序显示低MOI和高MAPseq效率。(a)实验设计概述。红色Lumafluor retrobeads标记LC中的嗅球(bulb)投射细胞。存在于这些细胞中的条形码也应存在于嗅球中。(b)LC的图像总览,显示细胞的珠和GFP标记。比例尺=100μm。(c)retrobeads和GFP标记细胞的详细图像。比例尺=10μm。(d)散点图,其显示嗅球中条形码丰度与单个细胞中条形码丰度的关系。虚线表示选择作为检测阈值的嗅球中的最小条形码丰度。(e)对于珠和Sindbis标记的细胞(n=45,来自3只动物,绿色)和阴性对照细胞(仅珠标记;n=9来自3只动物;红色),在经测序的单细胞中发现的所有条形码的丰度的散点图。虚线表示仅显示红色的细胞中最丰富的条形码的高度,选择该阈值用于区分真实条形码和假条形码。(f)MAPseq效率是越来越严格的噪声阈值的函数。MAPseq效率评估对阈值的变化不是非常敏感。阴影区域表示动物之间的标准方差(s.d.)。
图18:MAPseq可以在小的靶区域上执行。(a)切割区域的示意图。FC=额叶皮层;M1=初级运动皮层;PC=梨状皮层;V1=初级视觉皮层。(b)使用DH(26S)5'SIN包装的MAPseq病毒时在3只独立动物中追踪的所有~140个神经元的热图。所有可能混淆追踪结果的异位感的细胞(参见图9f)可以通过1000的丰度截止值去除。不同同侧区域的优先靶向性是明显的。
图19:从总RNA样品中回收条形码的效率。各区域(a;n=4只动物)和动物(b)间的恢复效率较低且相对恒定。
图20:修饰的pSinEGdsp Sindbus病毒构建体的载体图,其表达MAPP-nλ并用独特的条形码核酸标记神经元。
图21:图18中所示的经修饰的pSinEGdsp Sindbus病毒构建体的载体图的注释序列。
具体实施方式
本发明提供了包含多个标记的神经元的组合物,每个标记的神经元由编码条形码核酸的表达构建体独特地标记。
在一些实施方案中,其中条形码核酸含有被核酸结合结构域特异性识别的结合区。
在一些实施方案中,其中结合区为boxB基序。
在一些实施方案中,其中结合区为MS-2茎-环基序。
在一些实施方案中,其中表达构建体还表达包括以下的嵌合蛋白:
i)特异性结合神经元中条形码核酸的核酸结合结构域;和
ii)突触转运信号,
由此促进条形码核酸转运至神经元的轴突末端。
在一些实施方案中,其中嵌合蛋白为修饰的突触前蛋白。
在一些实施方案中,其中突触前蛋白为pre-mGRASP。
在一些实施方案中,其中核酸结合结构域为nλ。
在一些实施方案中,其中核酸结合结构域为MS-2外壳蛋白的一部分。
在一些实施方案中,其中嵌合蛋白还包含Myc表位标签。
在一些实施方案中,其中嵌合蛋白还包含CLIP-tag结构域。
在一些实施方案中,其中嵌合蛋白为MAPP-nλ。
在一些实施方案中,其中嵌合蛋白为CLAP-1x-nλ。
例如,MAPP-nλ和CLAP-1x-nλ均含有小鼠NRXN1b的突触转运信号序列,其中nλRNA结合结构域在特定位置添加,之前已报道其不破坏NRXN1b转运(Fairless,2008)。尽管如此,并非在该位置插入的每个序列都允许所得融合蛋白的适当转运,这是在CLAP-1x-nλ中仅使用一个nλ拷贝的原因(与此相反,在MAPP-nλ中使用四个nλ拷贝)。理想地,简单地将nλ序列切换成另一个RNA结合结构域的序列将足以切换系统,尽管可能需要对将载体蛋白连接到RNA结合结构域的接头序列进行一些试错试验。相反,在不破坏内源性转运的位置将RNA结合结构域添加到任何其他突触前蛋白质将足以将该蛋白质转变为MAPseq载体蛋白质。任何高度特异性的RNA结合域-识别位点对都可用于此目的。因此,实施例6提供了两种MAPseq载体蛋白质序列,然而,分子生物学领域的任何技术人员都容易理解其他此类载体蛋白质。
在一些实施方案中,其中表达构建体为修饰的Sindbus病毒。例如,图18和19中描绘的表达构建体为可以使用的一种这样的构建体,然而本领域普通技术人员将理解该构建体的变体。值得注意的是,任何向突触传递条形码的方法都可以用于MAPseq。例如,除了Sindbus病毒之外,还有许多将转基因传递至神经元的方法,例如病毒,包括但不限于腺相关病毒(AAV)、慢病毒、单纯疱疹病毒(HSV)、伪狂犬病病毒(PRV)、鸡贫血病毒(CAV)或狂犬病毒可用于MAPseq。其他递送方法包括电穿孔和转基因,以及本领域普通技术人员已知的几种其他方法。
在一些实施方案中,其中使用缺陷辅助病毒(defective helper)RNA产生修饰的Sindbus病毒,缺陷辅助病毒RNA产生具有嗜神经性且无繁殖能力的病毒粒子。
在一些实施方案中,其中使用缺陷辅助病毒RNA DH-BB(5’SIN;TE12ORF)产生修饰的Sindbus病毒。
在一些实施方案中,其中至少50%、更优选至少75%、更优选至少80%、更优选至少90%、更优选至少95%、96%、97%、98%或99%的标记神经元是用条形码核酸独特标记的。
在一些实施方案中,其中每个条形码核酸中的条形码具有(k)个核苷酸的长度,其中4k大于待标记的神经元的数目。
在一些实施方案中,其中条形码核酸含有长度为约30个核苷酸的条形码区域。
在一些实施方案中,其中条形码核酸编码荧光标记。
在一些实施方案中,其中条形码核酸为RNA。
本发明还提供了获得多个标记的神经元的方法,其包括用修饰的条形码Sindbus病毒文库感染神经元。在一些实施方案中,通过将条形码病毒文库仅注射到脑或脑干的特定部分或结构中来标记脑中的神经元。例如,LC是一个这样的特定部位的实例,然而,可以注射脑的任何其他特定部位或位置。在其他实施方案中,将条形码病毒文库注射到脑的一个以上部分或结构中。
在一些实施方案中,其中所述文库足够多样化以独特地标记被感染的神经元的总数的至少50%、更优选至少75%、更优选至少80%、更优选至少90%、更优选至少99%。
在一些实施方案中,其中用条形码Sindbus病毒文库以约1的感染复数(MOI)感染神经元。
在一些实施方案中,进一步包括用能够改变基因表达的文库感染神经元。
在一些实施方案中,其中功能文库为CRISPR文库。
在一些实施方案中,其中功能文库为shRNA文库。
在一些实施方案中,其中将药物施用于多个标记的神经元以确定药物是否能够对抗由来自功能文库的改变的基因表达所引起的神经元中的连接(wiring)缺陷。
本发明还提供了一种用于获得包含多个标记的神经元的投射的区域中单个神经元投射的图谱的方法,其包括:
i)将包含多个条形码神经元的投射的区域切割成多个部分;
ii)从每个切割的部分中分离条形码核酸;
iii)扩增分离的条形码核酸;
iv)对扩增的条形码核酸进行测序;和
v)确定相同条形码序列之间的关联;
从而获得该区域中单个神经元投射的图谱。被定位(mapped)的区域可以具有来自属于中枢神经系统或外周神经系统的神经元的投射。因此,使用MAPseq可以获得神经元投射穿过的任何区域的(例如,任何器官或组织,例如肌肉或肠组织)的神经元图谱。
在一些实施方案中,其中在步骤(i)中,通过粗切割法切割该区域。
在一些实施方案中,其中在步骤(i)中,通过激光捕获显微切割法切割该区域。
在一些实施方案中,其中在步骤(ii)中,通过TIVA标记法分离条形码核酸。
在一些实施方案中,其中在步骤(ii)中,将已知量的加标核酸分子添加到分离的条形码核酸的每个样品中,以确定条形码序列回收的效率。
在一些实施方案中,其中步骤(ii)还包括分离的条形码核酸的逆转录。
在一些实施方案中,其中步骤(ii)还包括将切片特异性标识符(SSI)添加到来自切割区域的条形码核酸。
在一些实施方案中,其中步骤(ii)还包括将独特分子标识符(UMI)添加到来自每个切割区域的每个条形码核酸。
在一些实施方案中,其中条形码核酸的序列通过FISSEQ法获得。
在一些实施方案中,其中在步骤(v)中,真实的、非污染性的条形码表达的阈值通过从缺乏条形码构建体的细胞中回收的条形码序列的数量来确定。
在一些实施方案中,其中在步骤(v)中,注射位点(参考条形码)中的条形码序列与靶位点中的条形码序列匹配,以产生大小为[参考条形码数]×[靶标位点的数量+注射位点的数量]的条形码矩阵。
在一些实施方案中,其中条形码矩阵的每个靶区域通过在每个靶区域中检测到的独特的加标分子的数量进行归一化。
在一些实施方案中,其中条形码矩阵的每个靶区域通过每μl总RNA中β-肌动蛋白的量进行归一化。
在一些实施方案中,其中所有条形码被归一化为在所有靶区域上总和为1。
在一些实施方案中,其中在步骤(v)中条形码分子计数的峰如下所定义:
i)至少是所有靶标位点的最大条形码计数的一半;
ii)被至少3个切片隔开;和
iii)比其周围环境高出至少其半个最大高度(“突出”);
由此定义了用于确定相同条形码序列之间的关联的峰。
在一些实施方案中,其中标记的神经元属于中枢神经系统。
在一些实施方案中,其中标记的神经元属于外周神经系统。
在一些实施方案中,单个神经元投射的图谱。
在一些实施方案中,一种用于确定药物对神经元的作用的方法,其包括在将神经元暴露于药物之前和之后获得单个神经元投射的图谱。
预期本文公开的每个实施方案适用于每个其他公开实施方案。因此,本文描述的各种元素的所有组合都在本发明的范围内。
术语
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。
如本文所用,并且除非另有说明或上下文另有要求,否则以下术语中的每一个应具有下文所述的定义。
如本文所用,除非上下文要求更有限的范围,在数值或范围的上下文中,“约”表示所述或所要求保护的数值或范围的±10%。
术语“模板”、“核酸”和“核酸分子”在本文中可互换使用,并且各自指脱氧核糖核苷酸和/或核糖核苷酸的聚合物。“核酸”应指任何核酸,包括但不限于DNA、RNA及其杂合体。形成核酸分子的核酸碱基可以为碱基A、C、G、T和U,以及它们的衍生物。“基因组核酸”是指衍生自基因组的DNA,其可以从例如细胞、组织、肿瘤或血液中提取。
如本文所用,“重叠群”和“重叠的”是指一组重叠序列或序列读段。
如本文所用,术语“扩增”是指合成与模板核酸的一条链或两条链互补的核酸分子的过程。扩增核酸分子通常包括使模板核酸变性,在低于引物的解链温度的温度下使引物与模板核酸退火,以及从引物酶促延伸以产生扩增产物。变性、退火和延伸步骤各自可以进行一次。然而,通常,变性、退火和延伸步骤进行多次(例如,聚合酶链式反应(PCR)),使得扩增产物的量经常以指数方式增加,尽管本方法不需要指数式扩增。扩增通常需要存在脱氧核糖核苷三磷酸、DNA聚合酶和适当的缓冲液和/或用于优化聚合酶的活性的辅助因子。术语“扩增的核酸分子”是指由扩增过程产生的核酸分子。
如本文所用,术语“读段”或“序列读段”是指通过任何测序方法产生的核酸的核苷酸或碱基序列信息。因此,读段对应于从核酸片段的一条链获得的序列信息。例如,DNA片段(其中在单个反应中从一条链产生序列)将产生单一读段。然而,可以产生针对相同DNA链的多个读段,其中该DNA片段的多个拷贝存在于测序项目中或者链已经被多次测序。因此,读段对应于特定测序反应的嘌呤或嘧啶识别或序列测定。
如本文所用,术语“测序”\“获得一个序列”或“获得多个序列”是指足以鉴定或表征核酸分子并且可以为核酸分子的全长序列信息或仅部分序列信息的核苷酸序列信息。
如本文所用,术语“测序文库”是指用于测序的、包含来自单个生物体的总基因组DNA的DNA片段的混合物。通常对下一代测序文库按尺寸进行选择,并在测序之前将其连接到测序接头。
如本文所用,术语“测序接头”是指与测序文库中每个DNA片段的5'和3'末端结合的寡核苷酸。接头可以包含平台依赖性序列,其允许扩增片段,以及用于引发测序反应的序列。
如本文所用,术语“条形码”通常可指用于鉴定目的的任何核酸序列。条形码可以为用于鉴定原始来源的序列,例如细胞、基因组、样品或与其连接的另一种核酸。在MAPseq的上下文中,条形码可以指一段表达的随机化核酸,其用于独特地标记单个神经元。因此,条形码核酸含有条形码部分以及其他部分,例如,蛋白质编码部分。此外,测序条形码,也称为测序指数,是指独特的DNA序列,例如在测序接头中,其用于鉴定测序文库中每个扩增子的基因组来源。类似地,本申请中使用的其他类型的条形码包括切片特异性标识符(SSI)和独特分子标识符(UMI)。
如本文所用,术语“多重复用的”是指汇集或以其他方式混合从多个来源产生的扩增子,在单个测序运行中对整个扩增子集合进行测序,并随后通过条形码序列分选并鉴定每个片段的来源。
如本文所用,术语“独特标记的神经元”在MAPseq的上下文中是指包含条形码核酸的神经元,在多个标记的神经元中,在任何其他标记的神经元中均未发现该条形码核酸。在MAPseq的实际应用中,至少50%、更优选至少75%、更优选至少80%、更优选至少90%、更优选至少95%、96%、97%、98%或99%的用条形码核酸标记的神经元为独特标记的神经元。
如本文所用,术语“表达构建体”或“表达载体”是指任何被引入细胞并能够表达RNA或蛋白质的工程化核酸。表达构建体的非限制性实例包括重组质粒和重组病毒核酸。将工程化核酸引入细胞中可以通过多种方法实现,包括但不限于转化和转染技术、病毒转导、电穿孔、化学诱导的外源核酸摄取、流体动力学递送、脂质转染、声孔作用和分子生物学领域普通技术人员已知的其他方法。在MAPseq的一个实施方案中,Sindbus病毒用于用独特的条形码标记神经元,然而,用于转基因递送和表达的多种方法(例如上文列出的那些)也可用于此目的。
如本文所用,术语“嵌合蛋白”,也称为“融合蛋白”,是指含有来自不同来源的序列的任何蛋白质序列。在MAPseq中,嵌合蛋白用于结合神经元中的条形码核酸并将条形码核酸转运至神经元的突触或轴突。嵌合蛋白可以为修饰的突触蛋白或非突触蛋白。值得注意的是,当条形码核酸的表达足够高以到达轴突末端时,嵌合蛋白的转运不是必需的。
如本文所用,术语“核酸结合结构域”是指能够识别和结合核酸的特定区域的蛋白质结构域或基序。核酸结合结构域的实例包括结合boxBRNA基序的nλ和结合MS-2RNA茎环基序的MS-2噬菌体外壳蛋白。可用于MAPseq的嵌合载体蛋白中的其他RNA结合蛋白结构域对于本领域普通技术人员而言是已知的,包括但不限于:可定制的PUF类RNA结合结构域和PP7噬菌体外壳蛋白结合位点盒(Chen and Varani,2013;Larson et al.,2011)。
在提供一系列值的情况下,应理解的是,除非上下文另有明确规定,否则该范围的上限和下限之间的每个中间值至下限单位的十分位数,以及任何其他所述值或在所述范围内的中间值均包含在本发明内。这些较小范围的上限和下限可以独立地包括在较小范围内,并且也包括在本发明内,受所述范围内任何特别排除的限制的约束。在所述范围包括一个或两个限制的情况下,排除那些包括的限制的任一个或两个的范围也包括在本发明中。
本文提及的所有出版物和其他参考文献均以引用的方式整体并入本文,如同每个单独的出版物或参考文献被具体和单独地指出通过引用并入。本文引用的出版物和参考文献不被承认为现有技术。
通过参考下面的实验细节将更好地理解本发明,但是本领域技术人员将容易理解,详述的具体实验仅仅是对随后的权利要求中限定的本发明的说明。
实验细节
下面提供实施例以便于更完整地理解本发明。以下实施例说明了制备和实施本发明的示例性模式。然而,本发明的范围不限于这些实施例中公开的具体实施方案,这些实施例仅用于说明的目的。
方法-MAPP-nλ
MAPP-nλ为修改版的pre-mGRASP(Kim,2011)。从2A-cerulean融合物中剥离pre-mGRASP蛋白,并且在原始pre-mGRASP序列的氨基酸287之后的胞质尾区添加4个重复的nλRNA结合结构域(Daigle and Ellenberg,2007)。在原始pre-mGRASP蛋白的氨基酸59之后还添加了Myc表位标签,接着是CLIP-tag结构域(New England Biolabs)。
方法-Sindbis病毒条形码文库
本研究中使用的病毒基于双启动子pSinEGdsp构建体(Kawamura,2003)。在第一个亚基因组启动子后插入MAPP-nλ。在第二亚基因组启动子的下游,插入GFP编码区,然后是紧密间隔的NotI和MluI限制性位点和boxB基序的四个重复序列(Daigle and Ellenberg,2007)。使用该构建体,通过在NotI和MluI位点之间插入具有序列5’-AAG TAA ACG CGT AATGAT ACG GCG ACC ACC GAG ATC TAC ACT CTT TCC CTA CAC GAC GCT CTT CCG ATC TNNNNN NNN NNN NNN NNN NNN NNN NNN NNN NYY GTA CTG CGG CCG CTA CCT A-3’的双链ultramer的多样化池(Integrated DNA Technologies)来产生高度多样化的质粒文库。Sindbis病毒按照如前所述(Kebschull,2015)使用常规DH(26S)5'SIN辅助病毒(Bredenbeek,1993)或新DH-BB(5'SIN;TE12)(Kebschull,2015)辅助病毒来产生。按照如前所述通过qPCR测定所得病毒的滴度(Kebschull,2015),并通过对RNaseI保护的基因组病毒RNA进行Illumina测序来确定病毒文库多样性。
方法-注射
动物程序由冷泉港实验室动物护理和使用委员会(Cold Spring HarborLaboratory Animal Care and Use Committee)批准,并按照美国国立卫生研究院(National Institutes of Health)标准进行。
如所描述的(Cetin,2007),将180nl 2×1010GC/ml条形码Sindbis病毒单侧或双侧压力注射到6只雄性的8-10周龄的C57BL(Jackson Labs)的LC中。在两个轴上整平动物头骨,对于AP轴,使用人字缝点和前囟点,对于横轴,横向地距离在人字缝点和前囟点之间的中间点两个毫米。坐标AP=-5.4mm,ML=0.8mm,DV=2.9mm和3.1mm用于LC,并且测量从脑表面开始的深度。每个DV坐标注射90nl病毒,在每个深度之间等待10分钟。注射后44小时处死动物。对于免疫荧光、原位RNA和组织学研究,用冰冷的盐水(9g/l)经心脏灌注动物,然后用4%PFA的0.1M磷酸盐缓冲液(电子显微镜科学)灌注。对于RNA研究,提取新鲜脑并在干冰上瞬间冻结。
为了测量MAPseq效率,将红色retrobeads(Lumafluor)注射到6只雄性的8-12周龄C57BL(Jackson Labs)的右OB中。简而言之,粗略确定右OB的中心,并且从AP轴的中心测量+/-1mm,进行两次相距2mm的开颅术。在注射之前将珠超声处理20分钟以使溶液均质化。如所描述的(Cetin,2007),在三个不同深度(距离OB表面0.3mm、0.6mm和0.9mm DV)注射210nl储备浓度的珠。二十四小时后,如上所述,将条形码Sindbis病毒注射到右侧LC中。在Sindbis病毒注射后44-48小时处死动物。
方法-免疫荧光和ISH
在6μm厚的石蜡切片上进行抗GFP染色和RNA原位杂交。对于免疫荧光,在热诱导的抗原修复后使用兔抗GFP抗体ab290(Abcam)。使用Panomics ViewRNA ISH Tissue试剂盒(Affymetrix)根据制造商的方案(沸腾10分钟和蛋白酶处理10分钟)使用抗GFP探针VF1-10141进行原位杂交。使用兔抗TH抗体SAB4300675(Sigma-Aldrich)对漂浮的70μm振动切片进行抗TH染色。
方法-加标RNA
为了产生加标RNA,创建具有序列5’-GTC ATG ATC ATA ATA CGA CTC ACT ATAGGG GAC GAG CTG TAC AAG TAA ACG CGT AAT GAT ACG GCG ACC ACC GAG ATC TAC ACTCTT TCC CTA CAC GAC GCT CTT CCG ATC TNN NNN NNN NNN NNN NNN NNN NNN NAT CAGTCA TCG GAG CGG CCG CTA CCT AAT TGC CGT CGT GAG GTA CGA CCA CCG CTA GCT GTACA-3’的双链ultramer(Integrated DNATechnologies)。然后根据制造商的说明书使用mMessage mMachine T7体外转录试剂盒(Thermo Fisher)体外转录所得dsDNA。
方法-qPCR
根据制造商的说明书,使用oligodT引物和Superscript III逆转录酶(ThermoFisher)逆转录总RNA。根据制造商的说明书,使用引物5’-GAC GAC GGC AAC TAC AAG AC-3’和5’-TAG TTG TAC TCC AGC TTG TGC-3’(用于条形码cDNA)以及5’-CGG TTC CGA TGCCCT GAG GCT CTT-3’和5’-CGT CAC ACT TCA TGA TGG AAT TGA-3’(用于β-肌动蛋白cDNA),通过qPCR在SYBR green power master mix(Thermo Fisher)中定量条形码和β-肌动蛋白cDNA的量。
方法-MAPseq
使用Leica CM 3050S低温恒温器在-12℃室温度和-10℃物体温度下切割300μm厚的新鲜冷冻脑的冠状切片。为了避免样品之间的交叉污染,每个切片均用刀片的新鲜未使用部分切割。在使用冷手术刀刀片在干冰上切割皮层之前,将每个切片融化到干净的显微镜载玻片上并在干冰上快速冻结。在切割期间,避开已知的纤维束以最小化通道纤维对数据集的污染。采集样品后,所有样品都不按顺序处理,以避免样品交叉污染影响MAPseq结果的解释。
根据制造商的说明书,使用Trizol试剂(Thermo Fisher)提取来自组织样品的总RNA。将来自组织样品的总RNA与加标RNA混合。如前所述(Morris,2011),使用形式为5’-CTTGGC ACC CGA GAA TTC CAN NNN NNN NNN NNX XXX XXT GTA CAG CTA GCG GTG GTC G-3’的基因特异性引物产生ds-cDNA,其中XXXXXX为65种真序列样(trueseq like)SSI中的一种,且N12为UMI。根据制造商的说明书,使用Qiagen MinElute PCR纯化试剂盒清洁反应,并用ExonucleaseI(New England Biolabs)处理洗脱的ds cDNA以除去剩余的引物。使用用于第一PCR的引物5’-CTC GGC ATG GAC GAG CTG TA-3’和5’-CAA GCA GAA GAC GGC ATA CGAGAT CGT GAT GTG ACT GGA GTT CCT TGG CAC CC GAG AAT TCC A-3’以及用于第二PCR的引物5’-AAT GAT ACG GCG ACC ACC GA-3’和5’-CAA GCA GAA GAC GGC ATA CGA-3’在Accuprime Pfx Supermix(Thermo Fisher)中通过巢式PCR扩增条形码扩增子。根据制造商的说明书,使用Qiagen MinElute凝胶提取试剂盒凝胶提取扩增子,并基于使用引物5’-AATGAT ACG GCG ACC ACC GA-3’和5’-CAA GCA GAA GAC GGC ATA CGA-3’的qPCR定量合并各个测序文库。然后使用用于配对末端1的SBS3T测序引物和用于配对末端2的Illumina小RNA测序引物2,在配对末端36,使用Illumina NextSeq500高输出运行对合并的文库进行测序。
方法-效率测量和单细胞分离
在用冰冷的aCSF(127mM NaCl、25mM NaHCO3、1.25mM NaPO4、2.5mM KCl、2mMCaCl2、1mM MgCl2和25mM D-葡萄糖)经心脏灌注后,提取未固定的脑,并且在进行处理以用于如上所述的测序之前在干冰上将注射珠的OB瞬间冻结。使用Microm HM650V振动切片机在切割溶液(110mM氯化胆碱、11.6mM抗坏血酸、3.1mM丙酮酸钠、25mM NaHCO3、1.25mMNaPO4、2.5mM KCl、0.5mM CaCl2、7mM MgCl2和25mM D-葡萄糖)中切割剩余的右半球的400μm厚的锐角(acute)矢状切片。在室温下将含有LC的切片在含有突触阻断剂(0.05mM APV、0.02mM DNQX和0.1Μm TTX)的aCSF(126mM NaCl、20mM NaHCO3、3mM KCl、1.25mM NaH2PO4、2mM CaCl2、2mM MgSO4和20mM D-葡萄糖)中孵育20分钟。然后在室温下将切片在具有1mg/ml的灰色链霉菌(Streptomyces griseus)蛋白酶(Sigma P5147)的aCSF中消化30分钟。在具有突触阻断剂的aCSF中洗涤后,从经消化的切片中切割LC,并将组织研磨以产生单细胞悬浮液。使用倒置荧光显微镜(Zeiss Observer)手动挑取单个细胞,并直接放置到裂解缓冲液(每个细胞2.4μl 0.2%triton,1μl 10mM dNTP,1μl 10mM RT引物)中。对于组织样品,按照如上所述由细胞制备测序文库。
方法-使用的动物
实施例1将MAPseq应用于蓝斑
作为原理论证,将MAPseq应用于蓝斑(LC),蓝斑是脑干中的一个小核,其为新皮层去甲肾上腺素的唯一来源(Foote and Morrison,1987)。早期的整体追踪实验表明,LC广泛地在整个同侧半球上投射,产生了LC传播调整整体行为状态的广义信号的观点(Foote andMorrison,1987;Foote et al.,1983;Loughlin et al.,1982;Waterhouse et al.,1983)。这种观点最近得到了更复杂的逆行整体追踪实验的支持,这些实验强化了单个LC神经元在整个同侧半球中投射的观点(Schwarz et al.,2015)。但是,最近的其他报告对这一观点提出质疑。使用双逆行标记法时,这些实验揭示了单独的LC神经元群投射到皮层的不同区域(Chandler et al.,2014;Chandler and Waterhouse,2012),从而提出了LC对不同皮层区域进行差异化控制的可能性。为了解决这一争议,将MAPseq应用于LC以获得单神经元分辨率下的大量投射模式。
在下文中,首先确立MAPseq的可行性。研究了用条形码病毒文库随机标记大量神经元的理论和实际限制,并且证明了可以使用条形码RNA确定神经元的远程投射。将MAPseq应用于LC,发现单个神经元对皮层和嗅球(OB)中的偏好的靶标具有强投射,对大面积的皮层具有宽但弱的投射。将MAPseq多重复用至在同一动物中的两次注射,最后研究了我们方法的假阳性率和阴性率。
用条形码独特标记神经元
在传统的单神经元追踪中,多重化(多重复用)的主要挑战是可用于区分单个神经元的标记(例如荧光团或酶)的低多样性。为克服这一挑战,用短的、随机RNA条形码MAPseq标记神经元。理想情况下,每个标记的神经元应该只有一个独特的条形码。这里考虑了可能导致偏离这种理想情景的因素:(i)每个神经元不止一个条形码(多重标记);和(ii)每个条形码不止一个神经元(非唯一的或简并标记)。如下所述,对由多重标记引起的偏差的关注要比对由简并标记产生的偏差的关注小得多。
如果神经元被多于一个病毒颗粒感染,则它可以表达多于一种条形码。这种多重标记将导致高估所鉴定的神经元数量,但不会扭曲所记录的单个神经元的投射模式(图2a)。此外,甚至对不同神经元类别的相对丰度的估计通常也是准确的。例如,假设两个神经元A和B各自用10个不同的条形码标记。在这种情况下,MAPseq将发现神经元A的10个实例和B的10个实例;但即使神经元的绝对数量不正确,但仍能精确地推断出如下事实:神经元A和B具有不同的投射模式,并且这些模式以1:1的比例出现(实施例2)。因此,多重标记通常不会导致神经元类别或其相对频率的错误表征。
然而,为了简化MAPseq的解释,通过用滴定法测量注射的病毒的浓度和体积来最小化感染复数(MOI)。为了估计MOI,分离单个神经元并对每个神经元内的条形码进行测序。平均而言,感染的LC神经元各自含有1.2+/-0.1个条形码,暗示MOI为0.43(图2b)。只有21+/-11%包含多个条形码。
与理想情形的第二个偏差是非独特标记。如果两个神经元共享相同的条形码,则MAPseq将其解释为单个神经元,其投射模式由两个感染神经元的投射模式的并集给出(图2c)。两个神经元被相同条形码感染的概率取决于相对于可用条形码数量的感染细胞数量。通常,如果感染细胞的数量大于可用条形码的数量,则不能实现独特地标记所有神经元。相反,如果可用条形码的数量远多于被感染细胞的数量,则每个神经元将被纯粹偶然地用不同的条形码标记。
为了确定相对于这两种极端情况我们所处的位置,我们量化了LC中的细胞数量,并计数了表达酪氨酸羟化酶(一种去甲肾上腺素能标记物)的1985+/-132(N=6只动物)个神经元。这个数字远低于30-核苷酸条形码文库(~1018)的理论多样性,这表明在理想情况下,独特地标记是确定的。然而,在实践中,文库的实际多样性受限于质粒和病毒产生中的瓶颈(图2d)。假设所有条形码在文库中同样丰富,独特标记的神经元的预期分数F为:
F=(1-(1/N))k-1
其中k为感染的神经元的数量,N为条形码多样性(参见实施例3)。因此,如果k=1000,LC神经元将被多样性为N=106的文库感染,则平均而言全部神经元的99.9%将被独特地标记。尽管原则上文库中一部分条形码的过度表达降低了有效多样性,但病毒文库的测序(图2e)显示,实际上这些偏差只有很小的影响。因此,在该实施例中使用的条件下,绝大多数(>99%)神经元将被独特地标记(图2f;实施例2;图8a)。
第二种更经验性的方法用于估计简并标记的程度。由于相同的病毒文库用于感染不同动物中的神经元,因此在多于一个动物中发现的条形码序列代表简并性。因此,我们从同一病毒文库的四次独立注射中寻找回收的条形码的重叠。在用于投射定位的992个独特的条形码中,仅三个条形码存在于一个以上的动物中,并且没有条形码存在于两个以上的动物中。此外,三个重复条形码中的两个是病毒文库中最丰富的条形码(图8b),因此根据推理预期双重标记的概率最高。该分析独立地确认了,由条形码库的非独特标记引起的错误率非常低。
使用RNA追踪神经元
传统的神经解剖学追踪方法依赖于用染料或蛋白质填充神经元,因此可以通过显微镜解析神经过程。这些技术所隐含的假设是:尽管很少经过严格测试,但追踪剂充分并均匀地填充神经元,因此信号的强度对应于标记的神经过程的数量,与体细胞的距离无关。在此,使用两种策略来最大化远端过程中条形码mRNA的丰度和均匀性。
首先,我们设计了一种表示为MAPP-nλ的蛋白质,以促进条形码mRNA转运到轴突末端。为了产生MAPP-nλ,我们开始使用pre-mGRASP,这是一种工程化蛋白,其由于与来自内源性突触前蛋白的转运信号融合而在突触前末端定位(Kim,2011)。然后将4个nλ结构域(Daigle and Ellenberg,2007)插入mGRASP的细胞质结构域。nλ结构域是衍生自噬菌体λN22的22个氨基酸的肽配体,其以非常高的亲和力(Kd=22nM)结合称为boxB的15-nt RNA发夹。将boxB序列的四个拷贝添加至mRNA条形码。
其次,使用重组Sindbis病毒,其可快速实现非常高的表达,以递送条形码mRNA(图3a;实施例3)。我们使用了一种新的Sindbis包装系统,与以前的系统不同,它具有嗜神经性且无繁殖能力(Kebschull et al.,2015)(图9)。双启动子病毒用于产生两种亚基因组RNA。第一种编码随机30-nt条形码,以及GFP标记下游的boxB序列(图3a;图10;图20;和图21)。另一种RNA编码MAPP-nλ蛋白。有理由认为,通过结合这两种策略,最大化在远端过程中可靠地检测条形码mRNA的能力,即使它们中的每一种都应该有效地将条形码mRNA独立地定位到轴突。
将条形码病毒注射到右侧LC中(图11),并在注射后44小时通过原位RNA杂交检查条形码定位。观察在体细胞和神经元过程中大量条形码mRNA的定位(图3b),其模式类似于共表达的GFP的模式。这表明条形码mRNA可以有效地填充局部神经元过程。
利用LC投射神经元的特定解剖结构来确定条形码mRNA是否均匀地填充远端神经元过程。在改变方向并向尾部移动以使皮层区域受神经支配之前,投射到皮层的LC神经元将其过程一直发送到大脑的吻侧(rostral)末端(图3c)。因此投射到视觉皮层的轴突大约是投射到额叶皮层的轴突的两倍那么长。从大量追踪研究中已知,LC神经支配沿着rostro-caudal轴是均匀的(Schwarz et al.,2015;Waterhouse et al.,1983)。因此,如果条形码mRNA没有被有效地转运到远端过程,则可以预期在皮层的吻侧区域中发现更多的条形码mRNA。为了评估这一点,将条形码病毒注入LC。然后切割整个皮层的300μm冠状切片(图3d),并定量来自每个同侧和对侧切片的条形码mRNA的量。与使用GFP和其他追踪方法的先前结果一致(Schwarz et al.,2015;Waterhouse等人,1983),发现在整个同侧皮层中大致均匀的投射(p=0.972对恒定模型;图3e);特别是,没有发现远端过程比近端过程被更弱地标记的证据。与先前的结果一致,观察到对侧皮层(图3f)的更弱(低于30.6倍;p=4×10-31配对学生t检验)的投射。与传统的GFP追踪一样,MAPseq不区分突触连接和通道纤维。这些结果表明条形码mRNA以相同的功效填充远端和近端过程,因此条形码mRNA的量可以以与常规追踪研究中的荧光团或染料相同的方式解释。
条形码RNA测序揭示了不同的单神经元投射模式
MAPseq的目标是平行地量化大的神经元群的投射模式。因此,开发了一种确定每个靶标中每个条形码的量的方法(图4a)。将条形码病毒注射到右LC后44小时,对从切割的皮层靶区域提取的条形码mRNA进行逆转录(RT)。为了克服在扩增过程中引入的扭曲(Kebschull and Zador,2015),并且为了允许精确计数条形码cDNA分子,设计RT引物以用随机的12-nt独特分子标识符(UMI)标记每个单独的条形码mRNA分子。还添加了6-nt切片特异性标识符(SSI)以允许在单个高测序流动室内对样品进行多重复用。然后扩增、合并和测序这些SSI-UMI条形码cDNA(图12)。开发了一种保守的计算流程,以最小化由RNA污染引起的噪声并校正测序和其他错误(实施例4)。最后,将靶区域中的条形码丰度转换为单个神经元投射模式的矩阵。
总共获得了来自四只动物的995个LC神经元的投射模式。对于每只动物,分析从300μm同侧冠状皮层切片和从嗅球中提取和扩增的条形码mRNA(图4b,c)。因为在扩增之前用UMI标记单个条形码mRNA分子,所以获得了对每个靶标的投射强度的精确定量(经泊松计数统计;参见实施例5)。因此,对于每个神经元,MAPseq提供对投射模式的可靠估计,即对每个靶标的相对投射强度的可靠估计。例如,在切片5中回收了223个拷贝的BC28,但切片20中没有,这表明对切片5的投射强度是我们的检测基底的至少200倍(图4d)。如果神经元之间的差异由表达水平决定(R=-0.06;p=0.09;图13a),则如我们所预期的,在LC中的表达水平和对皮层的投射强度之间没有相关性。
对投射模式的检查即刻地揭示了:与来自传统整体跟踪的最简单的预测相反,单个神经元不能在整个同侧半球中均匀投射。相反,神经元以各种各样的特异性方式投射以选择靶区域,支配比其他神经元多数百倍的区域。一些神经元(例如BC28;图4d)仅显示对皮层的一小部分的特异性投射,而其他神经元(例如BC79;图4d)更广泛地投射或投射到多个区域(例如BC51;图4d)。对嗅球的投射似乎与对皮层的投射无关,其中一些神经元专门投射到嗅球(例如BC302;图4d)而其他神经元投射到两者(例如BC108;图4d)。
所有追踪的神经元都按其最大投射进行分类(图5a)。单个LC神经元的最大投射平铺整个皮层。只是这些投射总体上再现了先前通过整体方法描述的LC对皮层的明显均质的神经支配(图2e)。与之前的结果一致(Shipley et al.,1985),所有定位的神经元中的相当一部分(23+/-4.7%)投射到嗅球。
每个神经元的投射峰平均数为1.6+/-0.8(图13b),并且平均而言,单个神经元的最大投射强度下降至一半发生在<300μm(图5b)。除了这些严格定义的偏爱的投射靶标之外,许多神经元对相当一部分皮层也具有较弱但可检测的投射,因此平均而言,神经元投射到皮层的65+/-23%(图5c)。
事实上,许多神经元具有非常偏爱的皮层靶标,但也微弱地投射到更广泛的区域,这提供了一种方法来调和与LC投射的特异性明显矛盾的结果。使用其中逆行病毒标记与顺行追踪相结合的TRIO的试验得出结论:LC神经元在整个皮层中非特异性地投射(Schwarzet al.,2015)。然而,无法区分弱投射的逆行标记的神经元与强投射的标记的神经元,因此在群体水平上可能看起来投射是非特异性的。因此,尽管TRIO的结果可能自然而然地看起来与MAPseq在单神经元分辨率下获得的结果相矛盾,但模拟证明并不存在矛盾(图14)。
MAPseq扩展到几个注射位点
可以容易地扩展MAPseq以确定单个动物中的两个或更多个区域的投射。作为原理验证,将病毒双侧注射到LC中(图6a)。每个条形码主要在左侧或右侧LC中表达(图15);由于对侧投射的纤维和/或污染,在注射对侧部位的条形码表达要低得多。因此,每个条形码可以可靠地分配到适当的注射位点。正如预期的那样,平行注射重现了单次注射观察到的投射模式(图6b)。将MAPseq多重复用至每只动物数十次注射可能是可行的,这减少了全脑投射定位工作的劳动力和成本,并且无需将多个动物的数据映射到平均参考脑(Oh et al.,2014;Zingg et al.,2014)。
MAPseq是精确的
在目前的工作中,出于可解释性的原因,我们试图限制用多于一个条形码标记的神经元的数量。然而,双重感染的神经元提供了通过有效地允许多次独立测量单个神经元的投射模式来测试MAPseq投射定位的可靠性的机会。根据单细胞测序,估计感染的神经元平均携带1.2个不同的条形码。因此,全部定位的神经元的大约20%为双重标记的,这应该体现为具有非常相似的投射模式的不同条形码。发现了动物内具有显著相似的投射模式的许多条形码对,并且与对两个独立的神经元所预期的投射模式相比,这些条形码对的确在统计学上明显更相似(图7a,图16a)。预期来自双标记的神经元的条形码对的总数能够通过比较动物内和动物之间、投射模式之间的最小成对距离的分布来估计。这些数字确实与我们根据单细胞测序所预期的数字非常接近(图7b,图16b)。
MAPseq假阴性率和阳性率
与每种实验方法一样,MAPseq易受假阴性和假阳性的影响。首先,我们试图将MAPseq的效率以及其假阴性率与已建立的神经解剖学方法联系起来。MAPseq在概念上最接近基于GFP的方法(Oh et al.,2014;Zingg et al.,2014),在基于GFP的方法中,遗传编码的荧光团在神经元群体中表达,并且在靶标中检测荧光。这种基于荧光团的方法的灵敏度和选择性取决于许多因素,包括表达水平、成像条件、背景荧光等。据我们所知,尚未对这些方法的灵敏度和选择性进行严格而精确的量化,上述严格而精确的量化允许我们计算例如在例如给定的荧光团表达水平下检测小轴突的概率等;也不清楚人们如何将这样的量化真实地表达出来。此外,MAPseq和基于荧光团的方法的逐部分地直接比较将是具有挑战性的,因为成像和RNA提取的最佳条件不同。因此,没有尝试对MAPseq的效率与基于荧光团的方法的效率进行定量比较。
相反,将MAPseq的效率与另一种得到确认的方法Lumaflour retrobeads进行了比较。简而言之,将红色retrobeads注入嗅球并将MAPseqSindbis病毒注入LC(图17)。由嗅球中的轴突吸收的Retrobeads被主动运输回细胞体并标记嗅球投射细胞。因此,用retrobeads标记的受感染LC细胞的条形码应该存在于嗅球中。通过MAPseq在嗅球中检测到的、从retrobead标记的LC神经元中回收的条形码部分因此可逐个神经元地评估MAPseq假阴性率。
为了计算这种效率的程度,我们对嗅球进行MAPseq并通过解离LC对单个珠和Sindbis标记的LC细胞进行条形码互补物测序,并使用玻璃移液管挑选单个红色和绿色细胞(Sugino et al.,2006)。从组织切片产生单细胞悬浮液涉及细胞外基质的消化和组织的研磨,这不可避免地导致对过程的破坏并将条形码mRNA释放到浴中。鉴于Sindbis病毒的表达水平非常高,因此获得自由漂浮在浴或细胞碎片中的条形码的噪声分布至关重要,因为这些条形码将与标记的细胞一起收集并测序,并且稍后除了它们的丰度外,将不能与细胞驻留条形码区别开来。通过收集GFP阴性但珠标记的细胞来测量该噪声分布。由于GFP阴性神经元不表达条形码,因此从这些细胞中回收的任何条形码都代表污染。这种污染的水平用于确定完整分离的神经元中真实条形码表达的阈值。
从嗅球中收集45个用GFP/条形码和红色retrobeads标记的神经元,以及仅用红色retrobeads标记的9个神经元,以确定条形码表达的背景噪声水平。发现MAPseq效率很高:通过测序,来自投射到嗅球的细胞的所有条形码中91.4+/-6%(平均值+/-标准误差),如通过珠标记法所确定的,也似乎投射到嗅球(在3个动物中;图17d)。相对于大范围合理估计背景条形码污染的水平,这种估计是可靠的(图17f)。因此得出结论,MAPseq的假阴性率为8.6+/-6%。
MAPseq中的假阳性事件是在表达条形码的神经元所不投射到的靶区域中检测到该条形码。有两种潜在的假阳性来源。首先,可以正确地检测确实靶向该特定区域的条形码,但可能错误地将其识别为不同的条形码(例如,由于测序错误)。或者,由其他样品(切片)或外部来源产生的条形码可能污染靶标样品。(第三种错误,由条形码多样性不足引起的错误,也可能被认为是假阳性的特殊情况,但在上文“用条形码独特地标记神经元”中单独考虑)。
由于条形码的组合空间很大,极不可能由于PCR或测序错误将一个条形码误认为是另一个条形码(参见实施例4)。然而,污染是一个问题,并且需要量化。
LC神经元主要投射到同侧半球(Waterhouse et al.,1983),并且只有一小部分LC神经元投射到同侧和对侧皮层(Room et al.,1981)。因此,量化神经元相对于对同侧半球的投射对对侧半球的投射强度提供了污染率的上限,并因此提供了MAPseq的假阳性率的上限。请注意,来自同侧和对侧半球的样本将混合并不按顺序地处理。因此,来自同侧和对侧的样品之间的交叉污染应该与仅来自同侧的样品之间的污染相当,并且应该是整体污染水平的良好量度。
双侧注射动物的MAPseq数据集(图6)用于计算假阳性率的上限。简而言之,对于对同侧比对对侧具有更强烈的投射的所有条形码(n=115),计算对侧半球中检测到的条形码分子总数与同侧半球中检测到的条形码分子总数之比。因此MAPseq假阳性率的上限的平均比率为1.4+/-0.8%(平均值+/-标准误差)。请注意,LC神经元仅在同侧投射的假设是保守的;违反此假设会增加估计的假阳性率。因此可以得出结论,MAPseq具有低的假阳性率。
这些结果表明MAPseq提供了对大量神经元敏感且可靠的定位。
实施例2.用条形码标记神经元。
在MAPseq中,用来自病毒文库的条形码随机标记神经元,以为它们提供独一无二的身份。理想情况下,每个受感染的神经元都会有一个独特的条形码。这种理想情况有两种偏差:(i)每个条形码有多个神经元;(ii)每个神经元有多个条形码。下面考虑每种情况的影响。
每个条形码有多个神经元
每个条形码有多个神经元,即非独特标记,是有问题的,因为它导致不正确的结果。例如,考虑两个神经元A和B,它们投射到不同的皮层靶区域。如果偶然地A和B用相同的条形码标记(例如条形码11),则MAPseq将返回A和B的合并投射模式作为条形码11的投射模式。虽然这确实是条形码11的投射模式,但它不能被解释为单个神经元的投射。通过使用足够多样的病毒文库可以避免这种类型的错误,从而最小化相同条形码标记两个不同神经元的概率。这意味着病毒文库所必需的多样性取决于感染的神经元的数量。
在此提出了这样的数学问题:给定具有k个神经元的群,用具有N个条形码的池中随机标记,给定神经元被唯一标记的概率是多少?这与以下问题密切相关:给定条形码出现在多个神经元中的概率是多少?这些问题与从瓮中更换球的经典问题有关,其中每个球对应于条形码序列,并且取出每个球的概率由文库中该条形码的丰度决定。
首先,考虑一种简化的情况,其中假设每个条形码在病毒文库中同样丰富,即条形码概率分布是均匀的。然后,与至少一个其他标记细胞共享条形码的预期神经元数量是多少?如果只有两个神经元A和B,那么神经元B与神经元A具有相同条形码的概率是P(A)=1/N,因此A的条形码是独特的情况的概率是1-P(A)。推广到k个感染神经元,A的条形码是独特的情况的概率是(1-P(A))(k-1),它是不独特的情况的概率是1-(1-P(A))(k-1)。由于总的预期值是其预期值的总和,所以非独特标记的神经元的预期数量是
E(X)=k(1-(1-P(A))(k-1))。
然后是独特标记的神经元的分数F为
F=1-E(X)/k=(1-P(A))(k-1)=(1-1/N)(k-1)
类似地,预期的使用超过一次的条形码数量D:
D=(k2)/(2N),
其中N为条形码的数量,k为被感染细胞的数量,并且假设N>>k。
现在,让我们考虑更现实的情况,其中条形码丰度的分布不均匀,因此神经元更可能被一些条形码标记而不是其他条形码标记。为了计算在这种情况下非独特标记的神经元的预期值,通过包括所有条形码的总和(由它们的概率加权)来扩展上述推理。然后通过下式给出E(X):
其中pi为条形码i=1..N的概率,k为感染神经元的数量,N为病毒文库中条形码的总数。
为了确定病毒文库中条形码的经验分布,直接对先前描述的Sindbis病毒的等分试样的基因组RNA进行测序。以足够的深度进行测序以克服Illumina测序引入的泊松采样。错误修正后,不同条形码序列的绝对丰度是条形码概率分布的直接量度(图2e)。尽管错误修正,但在计算分子计数非常低的条形码时,仍有可能包含错误的条形码序列。因此,对于所有计算,选择保守阈值,并且为了包括在病毒文库中,需要至少3个条形码。基于该经验确定的条形码丰度分布,计算独特标记的细胞的分数作为感染细胞数量的函数(图2f)。模拟表明,去除最丰富的条形码对文库独特标记神经元的能力几乎没有影响(图8a)。这些结果表明,观察到的文库中条形码丰度的不均匀性基本上不会干扰文库对大量细胞进行独特标记的能力。
实施例3.Sindbis病毒。
MAPseq要求使用无繁殖能力的病毒进行条形码传递,即在神经元被特定条形码感染后,携带该条形码的病毒不应传播并扩散到其他细胞。如果病毒确实繁殖,条形码将从一个细胞传播到另一个细胞,并且条形码对神经元的独特标记将会破坏,因为许多神经元现在将共享相同的条形码。
用常规辅助病毒构建体DH(26S)5'SIN制备的初始Sindbis病毒文库不仅在注射位点诱导GFP标记,而且偶尔在远离初始注射位点的位点诱导GFP标记(图9)。这种远端标记先前已被解释为逆行感染(Furuta,2001),然而,最近已表明它不是由逆行扩散引起的,而是由于继发感染引起的(Kebschull,2015)。与二次扩散一致,当使用常规辅助病毒构建体包装的条形码病毒进行MAPseq时,条形码的子集在单个靶区域中显示出意外的高表达水平(“峰”;图9e)。实际上,这些峰中的条形码表达水平与初始注射位点相同条形码的表达水平相当(图9f)。这些观察结果强有力地表明观察到的峰来自异位感染的细胞体,其被与注射位点的神经元相同的条形码标记。鉴于病毒文库的高度多样性,如果标记是由于逆行感染,这种双标记极不可能意外发生,但如果所使用的病毒在大脑内繁殖则会预期逆行感染。
因此,设计了一种新的辅助病毒构建体DH-BB(5’SIN;TE12ORF)(Kebschull,2015),以消除二次传播。当使用这种使共包装(co-packaging)最小化的、修饰的辅助病毒构建体,二次感染几乎完全消除,并且我们无法通过测序检测到任何更多的峰(图9g)。因此,由DH-BB(5'SIN;TE12ORF)包装的Sindbis病毒满足MAPseq中使用的要求。用修饰的辅助病毒制备的病毒文库用于所有后续的MAPseq试验。
实施例4.生物信息学
原始MAPseq数据由两个包含Illumina测序结果的.fastq文件组成,其中配对末端1覆盖条形码序列,配对末端2覆盖12nt UMI和6nt SSI(图10和12)。为了将这些测序数据转换成投射图谱,在Matlab(Mathworks)中进行分析之前,首先在bash中对数据进行预处理。
测序数据的预处理
简而言之,fastq文件被剥离了它们的质量信息,并且读段被修剪到相关长度。然后将配对末端1和2合并为单个文件。该文件的每一行对应于包含30nt条形码、2nt嘧啶锚(YY)、12nt UMI和6nt SSI的单个读段。使用fastx_barcode_splitter工具基于SSI对读段进行解复用,并过滤以去除任何不明确的碱基。然后将读段折叠(collapsed)成唯一序列并进行分类。
接下来,设置序列必须具有多少读段以便考虑用于分析的阈值。早期关于PCR扩增在Illumina文库生成期间对下一代测序数据的影响的研究指导了阈值的选择(Kebschulland Zador,2015),其中发现当通过PCR扩增一系列独特条形码序列时,Illumina结果的序列等级图谱(rank profile)由一系列序列组成,这些序列具有大致相等的读段计数,以及肩和长尾。这种分布的尾部几乎完全由PCR误差形成。因此,在MAPseq数据集中,选择一个手动选择的最小读段阈值以从分析中移除序列等级图谱的尾部。这避免了大量PCR和测序错误对数据集的污染,并简化了随后的错误校正和分析步骤。
在去除12nt UMI后将剩余的读段(30nt条形码+YY+12nt UMI)折叠以将读段转换成分子计数。请注意,12nt UMI中任何潜在的PCR或测序错误都会被忽略,这将导对分子计数的轻微但均匀的过高估计,因为只在UMI中有错误的相同cDNA的两个拷贝被算作两个不同的分子而不是一个。
从加标分子中分离条形码
加标分子为长度为24的条形码,其后是恒定序列ATCAGTCA,因此很容易区别于病毒表达的条形码(图10)。由于它们携带不同的信息,未校正的条形码数据被分成加标分子(与N24ATCAGTCA完美匹配)和病毒表达的条形码(无N24ATCAGTCA序列,但是有N30YY)并单独处理。
错误修正
30nt长度的随机条形码具有430≈1018个不同序列的潜在多样性。如果从这种巨大的多样性中抽取相对少量的条形码,则所选择的条形码可能彼此非常不同。因此,对任何给定条形码的许多突变都是将其转换成所选组的任何其他条形码所必需的。
利用这一事实来纠正测序条形码中的错误。使用bowtie进行计数>1的所有条形码序列的整体(all-against-all)映射,允许多达3个错配。在此,bowtie被迫输出所有可能的比对。随后构建所有条形码序列的连接矩阵,其中bowtie比对是序列之间的连接。Matlab用于查找所有连接的图形组件,即所有相互映射的条形码。将这种连接的组件的每个成员的分子计数折叠成最丰富成员的序列。通过过滤具有超过6个相同核苷酸的区段的条形码来去除低复杂性序列(Illumina测序的常见产物)。最后,将所有错误修正的条形码序列与原始病毒文库中发现的错误修正条形码序列进行比较。只保留那些在病毒文库中具有完美匹配的条形码用于分析。
可以在preprocessing.sh和matlab_preprocessing.m中找到所有MAPseq文库的预处理代码。使用viruslibrary_preprocessing.sh和viruslibrary_matlabcode.m处理病毒文库。
分析投射模式
所描述的工作流程产生了每个靶区域和注射位点中的条形码序列及其分子计数的列表。使用Matlab,将注射位点中的条形码序列(参考条形码)与靶位点中的条形码序列进行匹配,构建大小为[参考条形码的数量#]×[靶标位点的数量#+注射位点的数量#]的条形码矩阵,然后将其作为所有进一步分析的基础。请注意,出现在靶区域而不出现在注射位点的条形码非常罕见(“孤儿”)且丰度较低,这与将孤儿条形码作为污染物的解释一致。
为了从分析中排除低置信度投射模式,每个条形码需要在注射位点具有超过100个计数,并且至少一个靶区域具有超过30个计数。
代码可以在producebarcodematrix_unilateral.m和producebarcodematrix_bilateral.m中找到。
条形码矩阵归一化
原始条形码计数对于调查可用数据和形成对定位投射模式的直观感觉非常有用。然而,为了计算简要的统计信息,原始条形码矩阵被归一化。首先,通过在每个靶区域中检测到的独特加标分子的数量来归一化每个靶区域,以针对不同的RT、PCR或文库制备效率进行归一化。然后通过每μl总RNA的β-肌动蛋白的量(通过qPCR测得)将每个区域归一化,以校正不同的组织输入和RNA提取效率。最后,将所有条形码归一化为在所有靶区域上总和为1,以校正不同条形码的不同表达水平。
条形码矩阵的所有分析代码可以在analyse_unilateralinjections.m和analyse_bilateralinjections.m中找到。
发现峰
为了总结LC投射模式,设置了许多为每个条形码定义峰的标准。首先,峰需要至少是所有靶标位点中最大条形码计数的一半高。其次,峰需要被至少3个切片隔开,第三,峰需要从其周围环境升高至少半个最大高度(“突出”)。用于查找峰的代码可以在detectpeaks.m中找到。
鉴定双重感染细胞
为了鉴定源自双重感染细胞的条形码对,我们寻找来自个体小鼠的投射图谱,该投射图谱与对来自不同细胞的条形码所预期的更相似。简而言之,计算每个条形码图谱与特定小鼠(“小鼠内”)的任何其他条形码图谱的最小成对欧几里德(Euclidean)距离。然后通过计算来自该小鼠的条形码图谱与从该MAPseq数据集中的其他三只小鼠(“小鼠之间”)获得的条形码图谱的自举(bootstrapped)样本的最小成对距离来构建零分布。出现在“小鼠之间”零分布中的距离是由不同细胞的投射图谱的相似性产生的。因此,“小鼠内”中的距离低于该零分布所解释的距离表明两个条形码图谱比对两个单独的细胞所预期的更相似。对应于这种低距离的两个条形码可能来自单个双重感染细胞。因此,这些条形码对被定义为源自双重感染细胞,其在经受多重假设检验的Bonferroni校正的零分布的左尾部具有一定距离。
为了估计每只动物中来自双重感染细胞的条形码的总数,计算“小鼠内”和“小鼠之间”距离的累积分布的交叉点。到目前为止,该点上条形码对的数量被认为是双重感染细胞中条形码数量的估计值,其大约相当于双重感染细胞数量的2倍。
单细胞分析。用于分析单细胞测序数据的代码可以在preprocessing_singlecells.sh、matlab_preprocessing_singlecells.m和analyse_singlecells.m中找到。
假阳性率。计算假阳性率的代码可以在analyse_bilateralinjections.m中找到。
实施例5.加标分子回收。
为了评估MAPseq中条形码回收的效率,将已知量的加标RNA(图10)添加至每个样品中(图4a、图12),并在测序结果中定量不同加标分子的数量。然后,回收的加标分子数与输入分子数之比为检测任何给定条形码分子的概率。
区域和动物间的检测效率相对恒定(图19),靶区域的检测效率平均为P(检测)=0.024。这意味着当未检测到区域中的条形码时,该样品中存在少于123个条形码mRNA分子,置信度>95%,如负二项分布所示。
注意,这种条形码检测概率的测量基于从总RNA到测序结果的效率。不考虑从组织中提取总RNA期间发生的损失,这使得整体MAPseq检测效率可能略低于估计值。
实施例6.编码能够将条形码核酸转运至轴突末端的载体蛋白的氨基酸序列。
MAPP-Nλ:
MPPSTSLLLLAALLPFALPASDWKTGEVTASRDHMVLHEYVNAAGITGGGGSGGGGSVDEQKLISEEDLQFMDKDCEMKRTTLDSPLGKLELSGCEQGLHRIIFLGKGTSAADAVEVPAPAAVLGGPEPLIQATAWLNAYFHQPEAIEEFPVPALHHPVFQQESFTRQVLWKLLKVVKFGEVISESHLAALVGNPAATAAVNTALDGNPVPILIPCHRVVQGDSDVGPYLGGLAVKEWLLAHEGHRLGKPGLGGGGGSVDFQKASSIVYKKEGEQVEFSFPLAFTVEKLTGSGELWWQAERASSSKSWITFDLKNKEVSVKRVTQDPKLQMGKKLPLHLTLPQALPQYAGSGNLTLALEAKTGKLHQEVNLVVMRATQLQKNLTCEVWGPTSPKLMLSLKLENKEAKVSKREKAVWVLNPEAGMWQCLLSDSGQVLLESNIKVLPTWSTPVQPMALIVLGGVAGLLLFIGLGIFFCVRYKYRNRDEGSSAPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLEPPLDGAGAGAGAGAGAGGLATPPSAYHVDESRNYISNSAQSNGAVVKEKQPSSAKSANKNKKNKDKEYYV*
CLAP-1x-nλ:
MYQRMLRCGADLGSPGGGSGGGAGGRLALIWIVPLTLGGLLGVAWGEFEQKLISEEDLQFMDKDCEMKRTTLDSPLGKLELSGCEQGLHRIIFLGKGTSAADAVEVPAPAAVLGGPEPLIQATAWLNAYFHQPEAIEEFPVPALHHPVFQQESFTRQVLWKLLKVVKFGEVISESHLAALVGNPAATAAVNTALDGNPVPILIPCHRVVQGDSDVGPYLGGLAVKEWLLAHEGHRLGKPGLGVDGTASSLGAHHIHHFHGSSKHHSVPIAIYRSPASLRGGHAGTTYIFSKGGGQITYKWPPNDRPSTRADRLAIGFSTVQKEAVLVRVDSSSGLGDYLELHIHQGKIGVKFNVGTDDIAIEESNAIINDGKYHVVRFTRSGGNATLQVDSWPVIERYPAGRQLTIFNSQATIIIGGKEQGQPFQGQLSGLYYNGLKVLNMAAENDANIAIVGNVRLVGEVPSSMTTESTATAMQSEMSTSIMETTTTLATSTARRGKPPTKEPISQTTDDILVASAECPSDDEDIDPCEPSSGGLANPTRVGGREPYPGSAEVIRESSSTTGMVVGIVAAAALCILILLYAMYKYRNRDEGSSAPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANLEPPLDGAGAGAGAGAGAGGLATPPSAYHVDESRNYISNSAQSNGAVVKEMQPSSAKSANKNKKNKDKEYYV*
实施例7.缺陷辅助病毒RNA DH-BB(5'SIN;TE12ORF)的RNA序列
tatagATTGACGGCGTAGTACACACTATTGAATCAAACAGCCGACCAATTGCACTACCATCACAATGGAGAAGCCAGTAGTAAACGTAGACGTAGACCCCCAGAGTCCGTTTGTCGTGCAACTGCAAAAAAGCTTCCCGCAATTTGAGGTAGTAGCACAGCAGGTCACTCCAAATGACCATGCTAATGCCAGAGCATTTTCGCATCTGGCCAGTAAACTAATCGAGCTGGAGGTTCCTACCACAGCGACGATCTTGGACATAGGCAGCGCACCGGCTCGTAGAATGTTTTCCGAGCACCAGTATCATTGTGTCTGCCCCATGCGTAGTCCAGAAGACCCGGACCGCATGATGAAATACGCCAGTAAACTGGCGGAAAAAGCGTGCAAGATTACAAACAAGAACTTGCATGAGAAGATTAAGGATCTCCGGGATCCCCTGAAAAGGCTGTTTAAGTTGGGTAAACCGCTCCCAGCCGACGACGAGCAAGACGAAGACAGAAGACGCGCTCTGCTAGATGAAACAAAGGCGTGGTTTAGAGTAGGTATAACAGGCACTTTAGCAGTGGCCGTGACGACCCGGTATGAGGTAGACAATATTACACCTGTCCTACTGGCATTGAGAACTTTTGCCCAGAGCAAAAGAGCATTCCAAGCCATCAGAGGGGAAATAAAGCATCTCTACGGTGGTCCTAAATAGTCAGCATAGTACATTTCATCTGACTAATACTACAACACCACCACCATGAATAGAGGATTCTTTAACATGCTCGGCCGCCGCCCCTTCCCGGCCCCCACTGCCATGTGGAGGCCGCGGAGAAGGAGGCAGGCGGCCCCGATGCCTGCCCGCAACGGGCTGGCTTCTCAAATCCAGCAACTGACCACAGCCGTCAGTGCCCTAGTCATTGGACAGGCAACTAGACCTCAACCCCCACGTCCACGCCCGCCACCGCGCCAGAAGAAGCAGGCGCCCAAGCAACCACCGAAGCCGAAGAAACCAAAAACGCAGGAGAAGAAGAAGAAGCAACCTGCAAAACCCAAACCCGGAAAGAGACAGCGCATGGCACTTAAGTTGGAGGCCGACAGATTGTTCGACGTCAAGAACGAAGACGGAGATGTCATCGGGCACGCACTGGCCATGGAAGGAAAGGTAATGAAACCTCTGCACGTGAAAGGAACCATCGACCACCCTGTGCTATCAAAGCTCAAATTTACCAAGTCGTCAGCATACGACATGGAGTTCGCACAGTTGCCAGTCAACATGAGAAGTGAGGCATTCACCTACACCAGTGAACACCCCGAAGGATTCTATAACTGGCACCACGGAGCGGTGCAGTATAGTGGAGGTAGATTTACCATCCCTCGCGGAGTAGGAGGCAGAGGAGACAGCGGTCGTCCGATCATGGATAACTCCGGTCGGGTTGTCGCGATAGTCCTCGGTGGCGCTGATGAAGGAACACGAACTGCCCTTTCGGTCGTCACCTGGAATAGTAAAGGGAAGACAATTAAGACGACCCCGGAAGGGACAGAAGAGTGGTCCGCAGCACCACTGGTCACGGCAATGTGTTTGCTCGGAAATGTGAGCTTCCCATGCGACCGCCCGCCCACATGCTATACCCGCGAACCTTCCAGAGCCCTCGACATCCTTGAAGAGAACGTGAACCATGAGGCCTACGATACCCTGCTCAATGCCATATTGCGGTGCGGATCGTCTGGCAGAAGCAAAAGAAGCGTCACTGACGACTTTACCCTGACCAGCCCCTACTTGGGCACATGCTCGTACTGCCACCATACTGAACCGTGCTTCAGCCCTGTTAAGATCGAGCAGGTCTGGGACGAAGCGGACGATAACACCATACGCATACAGACTTCCGCCCAGTTTGGATACGACCATAGCGGAGCAGCAAGCGCAAACAAGTACCGCTACATGTCGCTTAAGCAGGATCACACCGTTAAAGAAGGCACCATGGATGACATCAAGATTAGCACCTCAGGACCGTGTAGAAGGCTTAGCTACAAAGGATACTTTCTCCTCGCAAAATGCCCTCCAGGGGACAGCGTAACGGTTAGCATAGTGAGTAGCAACTCAGCAACGTCATGTACACTGGCCCGCAAGATAAAACCAAAATTCGTGGGACGGGAAAAATATGATCTACCTCCCGTTCACGGTAAAAAAATTCCTTGCACAGTGTACGACCGTCTGAAAGAAACAACTGCAGGCTACATCACTATGCACAGGCCGGGACCGCACGCTTATACATCCTACCTGGAAGAATCATCAGGGAAAGTTTACGCAAAGCCGCCATCTGGGAAGAACATTACGTATGAGTGCAAGTGCGGCGACTACAAGACCGGAACCGTTTCGACCCGCACCGAAATCACTGGTTGCACCGCCATCAAGCAGTGCGTCGCCTATAAGAGCGACCAAACGAAGTGGGTCTTCAACTCACCGGACTTGATCAGACATGACGACCACACGGCCCAAGGGAAATTGCATTTGCCTTTCAAGTTGATCCCGAGTACCTGCATGGTCCCTGTTGCCCACGCGCCGAATGTAATACATGGCTTTAAACACATCAGCCTCCAATTAGATACAGACCACTTGACATTGCTCACCACCAGGAGACTAGGGGCAAACCCGGAACCAACCACTGAATGGATCGTCGGAAAGACGGTCAGAAACTTCACCGTCGACCGAGATGGCCTGGAATACATATGGGGAAATCATGAGCCAGTGAGGGTCTATGCCCAAGAGTCAGCACCAGGAGACCCTCACGGATGGCCACACGAAATAGTACAGCATTACTACCATCGCCATCCTGTGTACACCATCTTAGCCGTCGCATCAGCTACCGTGGCGATGATGATTGGCGTAACTGTTGCAGTGTTATGTGCCTGTAAAGCGCGCCGTGAGTGCCTGACGCCATACGCCCTGGCCCCAAACGCCGTAATCCCAACTTCGCTGGCACTCTTGTGCTGCGTTAGGTCGGCCAATGCTGAAACGTTCACCGAGACCATGAGTTACTTGTGGTCGAACAGTCAGCCGTTCTTCTGGGTCCAGTTGTGCATACCTTTGGCCGCTTTCATCGTTCTAATGCGCTGCTGCTCCTGCTGCCTGCCTTTTTTAGTGGTTGCCGGCGCCTACCTGGCGAAGGTAGACGCCTACGAACATGCGACCACTGTTCCAAATGTGCCACAGATACCGTATAAGGCACTTGTTGAAAGGGCAGGGTATGCCCCGCTCAATTTGGAGATCACTGTCATGTCCTCGGAGGTTTTGCCTTCCACCAACCAAGAGTACATTACCTGCAAATTCACCACTGTGGTCCCCTCCCCAAAAATCAAATGCTGCGGCTCCTTGGAATGTCAGCCGGCCGCTCATGCAGACTATACCTGCAAGGTCTTCGGAGGGGTCTACCCCTTTATGTGGGGAGGAGCGCAATGTTTTTGCGACAGTGAGAACAGCCAGATGAGTGAGGCGTACGTCGAATTGTCAGCAGATTGCGCGTCTGACCACGCGCAGGCGATTAAGGTGCACACTGCCGCGATGAAAGTAGGACTGCGTATAGTGTACGGGAACACTACCAGTTTCCTAGATGTGTACGTGAACGGAGTCACACCAGGAACGTCTAAAGACTTGAAAGTCATAGCTGGACCAATTTCAGCATCATTTACGCCATTCGATCATAAGGTCGTTATCCATCGCGGCCTGGTGTACAACTATGACTTCCCGGAATATGGAGCGATGAAACCAGGAGCGTTTGGAGACATTCAAGCTACCTCCTTGACTAGCAAGGATCTCATCGCCAGCACAGACATTAGCTACTCAAGCCTTCCGCCAAGAATGTGCATGTCCCGTACACGCAGGCCGCATCAGGATTTGAGATGTGGAAAAACAACTCAGGCCGCCCATTGCAGGAAACCGCACCTTTCGGGTGTAAGATTGCAGTAAATCCGCTCCGAGCGGTGGACTGTTCATACGGGAACATTCCCATTTCTATTGACATCCCGAACGCTGCCTTTATCAGGACATCAGATGCACCACTGGTCTCAACAGTCAAATGTGAAGTCAGTGAGTGCACTTATTCAGCAGACTTCGACGGGATGGCCACCCTGCAGTATGTATCCGACCGCGAAGGTCAATGCCCCGTACATTCGCATTCGAGCACAGCAACTCTCCAAGAGTCGACAGTACATGTCCTGGAGAAAGGAGCGGTGACAGTACACTTTAGCACCGCGAGTCCACAGGCGAACTTTATCGTATCGCTGTGTGGGAAGAAGACAACATGCAATGCAGAATGTAAACCACCAGCTGACCATATCGTGAGCACCCCGCACAAAAATGACCAAGAATTTCAAGCCGCCATCTCAAAAACATCATGGAGTTGGCTGTTTGCCCTTTTCGGCGGCGCCTCGTCGCTATTAATTATAGGACTTATGATTTTTGCTTGCAGCATGATGCTGACTAGCACACGAAGATGACCGCTACGCCCCAATGATCCGACCAGCAAAACTCGATGTACTTCCGAGGAACTGATGTGCATAATGCATCAGGCTGGTACATTAGATCCCCGCTTACCGCGGGCAATATAGCAACACTAAAAACTCGATGTACTTCCGAGGAAGCGCAGTgCATAATGCTGCGCaGTGTTGCCACATAACCACTATATTAACCATTTATCTAGCGGACGCCAAAAACTCAATGTATTTCTGAGGAAGCGTGGTGCATAATGCCACGCAGCGTCTGCATAACTTTTATTATTTCTTTTATTAATCAACAAAATTTTGTTTTTAACATTTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGGGAATTCc
讨论
MAPseq是HTS在神经解剖学中的首次应用,其是一种简单、快速、廉价的确定单个动物的一个或多个注射位点中无数单个神经元的投射模式的方法。作为原理验证,将MAPseq应用于LC。与先前报道的来自LC的扩散式和非特异性投射的大量标记研究相反,这种单神经元分辨率分析显示大多数单个LC神经元具有偏爱的皮层靶标,并且调和了关于LC投射模式的特异性的争议。
高通量测序和神经解剖学
在2003年,人类基因组测序的成本是几十亿美元,但今天不到一千美元,其在十几年内减少了超过六个数量级。测序成本的急剧下降持续不衰,甚至比摩尔定律(计算机改进的速度)更快。高通量测序的进展彻底改变了生物学的不同领域(Reuter et al.,2015)。DNA测序已经从用于确定基因组序列的专用工具发展成为用于确定基因表达水平、发现新物种、追踪细胞命运和理解癌症生长等许多其他应用的技术。
通过将传统上被视为显微镜学难题的神经解剖学重新定义为测序难题,MAPseq利用高通量测序技术的进步,从而允许有效地调查脑回路的结构。MAPseq不会取代传统方法,而是对它们进行补充。例如,MAPseq非常适合发现由远程投射定义的神经元类别。此外,因为MAPseq是一种基于测序的方法,它可以很容易地与其他分子方法结合,以检查操纵单个基因对远程连接的影响。
MAPseq分辨率
通过MAPseq确定投射模式需要切割靶区域。执行切割的空间分辨率限制了可以解析的投射图谱的精度。在本发明的一个实施方案中,使用粗切割,其仅提供相对粗糙的空间分辨率,可能达到皮层区域的水平(成功切割单个皮层区域,包括初级听觉皮层;参见图18)。然而,包括激光捕获显微切割(Espina et al.,2006)、转录组体内分析(TIVA)标记(Lovatt et al.,2014),或荧光原位测序(Lee et al.,2014)的其他方法可用于确定组织中条形码的位置。
LC投射的争议
LC向大多数同侧大脑区域发送投射,其中纹状体是明显的例外。然而,单个神经元支配这些靶区域的广泛程度受到争议。经典的逆行追踪研究表明LC中的新皮层(Waterhouse et al.,1983)投射和全脑(Loughlin et al.,1986)投射神经元的地形组织。与此相一致,双逆行标记研究报告,LC对额叶皮层和运动皮层的投射(Chandler et al.,2014;Chandler and Waterhouse,2012)最低限度地重叠。与此相反,其他双逆行研究发现相同处理流程下投射到各结构的神经元之间存在重叠(Simpson et al.,1997),或投射到如前脑和小脑一般不同的结构(Steindler,1981)。最近基于逆行病毒追踪的工作甚至得出结论,LC神经元非特异性地投射到整个皮层和大脑其他部分(Schwarz et al.,2015)。
MAPseq单细胞分辨率数据可以调和这些数据。使用MAPseq,发现单个LC神经元在皮层和嗅球中具有非常特定的投射靶标,但不限于单个靶标。还观察到,除了具有偏爱的投射靶标之外,许多投射到皮层的LC神经元在某种程度上支配大部分皮层。正是该单神经元投射特征(Schwarz et al.,2015)使Schwarz等人得出如下结论:LC神经元非特异性地投射到整个皮层和嗅球,实际上MAPseq可以通过用我们的单细胞数据集模拟逆行追踪来重建他们的数据。
结论
MAPseq是HTS在神经解剖学中的首次应用,是一种简单、快速且廉价确定单个动物的一个或多个注射位点中无数单个神经元的投射模式的方法。MAPseq在LC中的应用揭示了以前用缺乏单神经元分辨率的方法所无法解析的意外结构。原则上,MAPseq可以通过感染大脑中的大部分神经元并切割整个大脑来扩展到整个大脑,以确定每个神经元的位置。
值得注意的是,MAPseq可以很容易地应用于定位任何神经元,包括与中枢神经系统或外周神经系统相关的神经元。例如,为了深入了解投射到脊髓的运动皮层中的神经元,可以简单地通过注射运动皮层并切割运动皮层和脊髓来执行MAPseq以确定投射。因此,除了定位大脑中的连接之外,MAPseq还可以用于识别和定位脑-外周神经连接,例如在肠道内,简单地通过单独切割标记的脑和感兴趣的外周靶标。
此外,MAPseq还可以与shRNA或CRISPR文库组合以在单个神经元的水平上确定功能。这种应用可用于筛选人类疾病模型中的全脑连接缺陷和筛选旨在抵消这些疾病中的所述连接缺陷的药物。这些疾病可能包括,例如,帕金森氏症、阿尔茨海默氏症等神经退行性疾病。
MAPseq还为使用测序以解释局部神经元到神经元的连接奠定了基础(Zador etal.,2012)。利用DNA测序技术,实验者对单细胞水平的细胞群的异质性有了前所未有的了解(Navin et al.,2012)。通过利用这种测序技术,MAPseq使神经科学研究人员能够有效地对在单个神经元水平上检测的神经元投射的群进行相同的操作。
参考文献
Bredenbeek,P.J.,Frolov,I.,Rice,C.M.&Schlesinger,S.Sindbis virusexpression vectors:packaging of RNA replicons by using defective helperRNAs.Journal of Virology 67,6439–6446(1993).
Cetin,A.,Komai,S.,Eliava,M.,Seeburg,P.H.&Osten,P.Stereotaxic genedelivery in the rodent brain.Nat Protoc 1,3166–3173(2007).
Chandler,D.&Waterhouse,B.D.Evidence for Broad Versus SegregatedProjections from Cholinergic and Noradrenergic Nuclei to Functionally andAnatomically Discrete Subregions of Prefrontal Cortex.Front.Behav.Neurosci.6,(2012).
Chandler,D.J.,Gao,W.J.&Waterhouse,B.D.Heterogeneous organization ofthe locus coeruleus projections to prefrontal and motor cortices.Proceedingsof the National Academy of Sciences 111,6816–6821(2014).
Chen,Y.&Varani,G.Engineering RNA-binding proteins for biology.FEBSJ.280(16),3734-3754(2013).
Daigle,N.&Ellenberg,J.λN-GFP:an RNA reporter system for live-cellimaging.Nat Meth 4,633–636(2007).
Economo,M.N.et al.A platform for brain-wide imagining andreconstruction of individual neurons.Elife 5,13(2016).
Espina,V.,Wulfkuhle,J.D.,Calvert,V.S.,VanMeter,A.,Zhou,W.,Coukos,G.,Geho,D.H.,Petricoin,E.F.,and Liotta,L.A..Laser-capture microdissection.NatureProtocols 1,586–603(2006).
Fairless,R.et al.Polarized targeting of neurexins to synapses isregulated by their C-terminal sequences.The Journal of Neuroscience 28(48),12969–12981(2008).
Foote,S.L.,Bloom,F.E.&Aston-Jones,G.Nucleus locus ceruleus:newevidence of anatomical and physiological specificity.Physiol.Rev.63,844–914(1983).
Foote,S.L.&Morrison,J.H.Extrathalamic modulation of corticalfunction.Annu.Rev.Neurosci.(1987).
Furuta,T.et al.In vivo transduction of central neurons usingrecombinant Sindbis virus:Golgi-like labeling of dendrites and axons withmembrane-targeted fluorescent proteins.J.Histochem.Cytochem.49,1497–1508(2001).
Ghosh,S.et al.Sensory maps in the olfactory cortex defined by long-range viral tracing of single neurons.Nature 472,217–220(2011).
Glickfeld,L.L.,Andermann,M.L.,Bonin,V.,and Reid,R.C..Cortico-corticalprojections in mouse visual cortex are functionally target specific.NatNeurosci 16,219–226(2013).
Herculano-Houzel,S.,Mota,B.&Lent,R.Cellular scaling rules for rodentbrains.Proceedings of the National Academy of Sciences 103,12138–12143(2006).
Kawamura,M.et al.Characterization of novel bicistronic sindbis virusvectors,SinEGdsp and SinIRES-EG,in cultured neurons.105–120(RecentRes.Dev.Neurochem.,2003).doi:10.1046/j.1471-4159.2003.01875.x/full
Kebschull,J.M.,da Silva,P.G.&Zador,A.M.A new Defective Helper RNA toproduce Sindbis virus that infects neurons but does not propagate. Biorxiv033738–16(2015).
Kebschull,J.M.&Zador,A.M.Sources of PCR-induced distortions in high-throughput sequencing data sets.Nucleic Acids Research gkv717(2015).
Kennedy,A.,Asahina,K.,Hoopfer,E.,Inagaki,H.,Jung,Y.,Lee,H.,Remedios,R.,and Anderson,D.J..Internal States and BehavioralDecision-Making:Toward anIntegration of Emotion and Cognition.Cold Spring Harbor Symposia onQuantitative Biology 79,199–210(2014).
Kim,J.et al.mGRASP enables mapping mammalian synaptic connectivitywith light microscopy.Nat Meth 9,96–102(2011).
Larson,D.R.et al.Real-Time Observation of Transcription Initiationand Elongation on an Endogenous Yeast Gene.Science 332,475-478(2011).
Lee,J.H.et al.Highly multiplexed subcellular RNA sequencing insitu.Science 343,1360–1363(2014).
Livet,J.et al.Transgenic strategies for combinatorial expression offluorescent proteins in the nervous system.Nature 450,56–62(2007).
Loughlin,S.E.,Foote,S.L.&Bloom,F.E.Efferent projections of nucleuslocus coeruleus:Topographic organization of cells of origin demonstrated bythree-dimensional reconstruction.Neuroscience 18,291–306(1986).
Loughlin,S.E.,Foote,S.L.&Fallon,J.H.Locus coeruleus projections tocortex:Topography,morphology and collateralization.Brain Research Bulletin 9,287–294(1982).
Lovatt,D.et al.Transcriptome in vivo analysis(TIVA)of spatiallydefined single cells in live tissue.Nat Meth 11,190–196(2014).
Mayer,C.et al.Clonally Related Forebrain Interneurons DisperseBroadly across Both Functional Areas and Structural Boundaries.Neuron 87,989–998(2015).
Morris,J.,Singh,J.M.&Eberwine,J.H.Transcriptome Analysis of SingleCells.JoVE(Journal of Visualized Experiments)e2634–e2634(2011).doi:10.3791/2634
Movshon,J.A.,and Newsome,W.T.Visual response properties of striatecortical neurons projecting to area MT in macaque monkeys.Journal ofNeuroscience 16,7733–7741.(1996).
Navin,N.et al.Tumour evolution inferred by single-cellsequencing.Nature 472,90–94(2012).
Oh,S.W.et al.A mesoscale connectome of the mouse brain.Nature 508,207–214(2014).
Reuter,J.A.,Spacek,D.V.,and Snyder,M.P.High-throughput sequencingtechnologies.Molecular Cell 58,586–597(2015).
Room,P.,Postema,F.&Korf,J.Divergent axon collaterals of rat locuscoeruleus neurons:Demonstration by a fluorescent double labelingtechnique.Brain Research 221,219–230(1981).
Schüz,A.&Palm,G.Density of neurons and synapses in the cerebralcortex of the mouse.J.Comp.Neurol.286,442–455(1989).
Schwarz,L.A.et al.Viral-genetic tracing of the input-outputorganization of a central noradrenaline circuit.Nature 524,88–92(2015).
Shipley,M.T.,Halloran,F.J.,and la Torre,de,J.Surprisingly richprojection from locus coeruleus to the olfactory bulb in the rat.BrainResearch 329,294–299(1985).
Simpson,K.L.,Altman,D.W.,Wang,L.,Kirifides,M.L.,Lin,R.C.,andWaterhouse,B.D.Lateralization and functional organization of the locuscoeruleus projection to the trigeminal somatosensory pathway inrat.J.Comp.Neurol.385,135–147(1997).
Steindler,D.A.Locus coeruleus neurons have axons that branch to theforebrain and cerebellum.Brain Research 223,367–373(1981).
Sternson,S.M.Hypothalamic survival circuits:blueprints for purposivebehaviors.Neuron 77,810–824(2013).
Sugino,K.et al.Molecular taxonomy of major neuronal classes in theadult mouse forebrain.Nat Neurosci 9,99–107(2006).
Tasic,B.,Menon,V.,Nguyen,T.N.,Kim,T.K.,Jarsky,T.,Yao,Z.,Levi,B.,Gray,L.T.,Sorensen,S.A.,Dolbeare,T.,et al.Adult mouse cortical cell taxonomyrevealed by single cell transcriptomics.Nat Neurosci 19,335–346(2016).
Walsh,C.&Cepko,C.L.Widespread dispersion of neuronal clones acrossfunctional regions of the cerebral cortex.Science 255,434–440(1992).
Waterhouse,B.D.,Lin,C.S.,Burne,R.A.&Woodward,D.J.The distribution ofneocortical projection neurons in the locus coeruleus.Journal of ComparativeNeurology 217,418–431(1983).
Zador,A.M.et al.Sequencing the connectome.PLoS Biol 10,e1001411(2012).
Zingg,B.et al.Neural networks of the mouse neocortex.Cell 156,1096–1111(2014).

Claims (46)

1.一种组合物,其包含多个独特标记的神经元,每个独特标记的神经元编码
a)条形码核酸;和
b)嵌合蛋白,所述嵌合蛋白包含
i)特异性结合神经元中的所述条形码核酸的核酸结合结构域;和
ii)突触转运信号,
由此促进将所述条形码核酸转运至所述标记的神经元的轴突末端。
2.根据权利要求1所述的组合物,其中所述条形码核酸含有被核酸结合结构域特异性识别的结合区。
3.根据权利要求2所述的组合物,其中所述结合区为boxB基序。
4.根据权利要求2所述的组合物,其中所述结合区为MS-2茎-环基序。
5.根据权利要求1-4中任一项所述的组合物,其中所述嵌合蛋白为修饰的突触前蛋白。
6.根据权利要求1-5中任一项所述的组合物,其中所述突触前蛋白为pre-mGRASP。
7.根据权利要求1-6中任一项所述的组合物,其中所述核酸结合结构域为nλ。
8.根据权利要求1-6中任一项所述的组合物,其中所述核酸结合结构域为MS-2外壳蛋白的一部分。
9.根据权利要求1-8中任一项所述的组合物,其中所述嵌合蛋白还包含Myc表位标签。
10.根据权利要求1-9中任一项所述的组合物,其中所述嵌合蛋白还包含CLIP-tag结构域。
11.根据权利要求1所述的组合物,其中所述嵌合蛋白为MAPP-nλ。
12.根据权利要求1所述的组合物,其中所述嵌合蛋白为CLAP-1x-nλ。
13.根据权利要求1-12中任一项所述的组合物,其中所述条形码核酸和所述嵌合蛋白由修饰的Sindbus病毒表达构建体编码。
14.根据权利要求13所述的组合物,其中使用缺陷辅助病毒RNA产生所述修饰的Sindbus病毒,所述缺陷辅助病毒RNA产生具有嗜神经性且无繁殖能力的病毒粒子。
15.根据权利要求14所述的组合物,其中使用缺陷辅助病毒RNA DH-BB(5’SIN;TE12ORF)产生修饰的Sindbus病毒。
16.根据权利要求1-15中任一项所述的组合物,其中至少50%、更优选至少75%、更优选至少80%、更优选至少90%、更优选至少95%、96%、97%、98%或99%的所述标记的神经元是用独特的条形码核酸标记的。
17.根据权利要求1-16中任一项所述的组合物,其中每个所述条形码核酸中的条形码具有(k)个核苷酸的长度,其中4k大于待标记的神经元的数量。
18.根据权利要求1-17中任一项所述的组合物,其中所述条形码核酸含有长度为约30个核苷酸的条形码区域。
19.根据权利要求1-18中任一项所述的组合物,其中所述条形码核酸编码荧光标记。
20.根据权利要求1-19中任一项所述的组合物,其中所述条形码核酸为RNA。
21.获得多个权利要求1-20中任一项所述的标记的神经元的方法,其包括用修饰的、条形码Sindbus病毒文库感染神经元。
22.根据权利要求21所述的方法,其中所述文库足够多样化以使用条形码核酸独特地标记被感染的神经元的总数的至少50%、更优选至少75%、更优选至少80%、更优选至少90%、更优选至少99%。
23.根据权利要求21或22所述的方法,其中所述神经元用条形码Sindbus病毒文库以约1的感染复数(MOI)感染。
24.根据权利要求21所述的方法,其还包括用能够改变基因表达的文库感染神经元。
25.根据权利要求24所述的方法,其中所述功能文库为CRISPR文库。
26.根据权利要求24所述的方法,其中所述功能文库为shRNA文库。
27.根据权利要求24-26中任一项所述的方法,其中将药物施用于所述多个标记的神经元以确定所述药物是否能够抵抗由来自所述功能文库的改变的基因表达所引起的神经元中的连接缺陷。
28.一种用于获得包含多个权利要求1-20中任一项所述的标记的神经元的投射的区域中的单个神经元投射的图谱的方法,其包括:
i)将所述包含多个标记的神经元的投射的区域切割成多个部分;
ii)从每个切割部分中分离条形码核酸;
iii)扩增所分离的条形码核酸;
iv)对所扩增的条形码核酸进行测序;和
v)确定相同条形码序列之间的关联;
由此获得所述区域中单个神经元投射的图谱。
29.根据权利要求28所述的方法,其中在步骤(i)中,通过粗切割法切割所述区域。
30.根据权利要求28或29所述的方法,其中在步骤(i)中,通过激光捕获显微切割法切割所述区域。
31.根据权利要求28-30中任一项所述的方法,其中在步骤(ii)中,通过TIVA标记法分离所述条形码核酸。
32.根据权利要求28-31中任一项所述的方法,其中在步骤(ii)中,将已知量的加标核酸分子添加到分离的条形码核酸的每个样品中,以确定条形码序列回收的效率。
33.根据权利要求28-32中任一项所述的方法,其中步骤(ii)还包括分离的条形码核酸的逆转录。
34.根据权利要求28-33中任一项所述的方法,其中步骤(ii)还包括将切片特异性标识符(SSI)添加到来自切割区域的条形码核酸。
35.根据权利要求28-34中任一项所述的方法,其中步骤(ii)还包括将独特分子标识符(UMI)添加到来自每个切割区域的每个条形码核酸。
36.根据权利要求28-35中任一项所述的方法,其中所述条形码核酸的序列通过FISSEQ法获得。
37.根据权利要求28-36中任一项所述的方法,其中在步骤(v)中,真实的、非污染的条形码表达的阈值通过从缺乏条形码构建体的细胞回收的条形码序列的数量来确定。
38.根据权利要求28-37中任一项所述的方法,其中在步骤(v)中,注射位点中的条形码序列(参考条形码)与靶位点中的条形码序列匹配,以产生大小为[参考条形码的数量]×[靶位点的数量+注射位点的数量]的条形码矩阵。
39.根据权利要求38所述的方法,其中所述条形码矩阵的每个靶区域通过在每个靶区域中检测到的独特加标分子的数量进行归一化。
40.根据权利要求39所述的方法,其中所述条形码矩阵的每个靶区域通过每μl总RNA中β-肌动蛋白的量进行归一化。
41.根据权利要求40所述的方法,其特征在于,所有条形码被归一化为在所有靶区域上的总和为1。
42.根据权利要求28-41中任一项所述的方法,其中在步骤(v)中条形码分子计数的峰由以下定义
i)至少是所有靶位点的最大条形码计数的一半高;
ii)被至少3个切片隔开;和
iii)比其周围环境高出至少其半个最大高度(“突出”);
由此定义用于确定相同条形码序列之间的关联的峰。
43.根据权利要求28-42中任一项所述的方法,其中所述标记的神经元属于中枢神经系统。
44.根据权利要求28-42中任一项所述的方法,其中所述标记的神经元属于外周神经系统。
45.通过权利要求28所述的方法获得的单个神经元投射的图谱。
46.用于确定药物对神经元的作用的方法,其包括在将神经元暴露于药物之前和之后通过权利要求28所述的方法获得单个神经元投射的图谱。
CN201780036111.XA 2016-04-08 2017-04-05 通过测序进行的神经元投射的多重分析 Pending CN109715823A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662320386P 2016-04-08 2016-04-08
US62/320,386 2016-04-08
PCT/US2017/026055 WO2017176829A1 (en) 2016-04-08 2017-04-05 Multiplexed analysis of neuron projections by sequencing

Publications (1)

Publication Number Publication Date
CN109715823A true CN109715823A (zh) 2019-05-03

Family

ID=60000668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780036111.XA Pending CN109715823A (zh) 2016-04-08 2017-04-05 通过测序进行的神经元投射的多重分析

Country Status (5)

Country Link
EP (1) EP3440224A4 (zh)
CN (1) CN109715823A (zh)
AU (1) AU2017246638B2 (zh)
CA (1) CA3020317A1 (zh)
WO (1) WO2017176829A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020092797A1 (en) * 2018-11-02 2020-05-07 President And Fellows Of Harvard College Methods and uses of high-throughput inference of synaptic connectivity relationships among cell types
US20230241001A1 (en) * 2019-09-20 2023-08-03 The Trustees Of The University Of Pennsylvania Compositions and methods comprising ionizable lipid nanoparticles encapsulating barcoded mrna
WO2024129672A1 (en) * 2022-12-12 2024-06-20 The Broad Institute, Inc. Trafficked rnas for assessment of cell-cell connectivity and neuroanatomy
CN117408342B (zh) * 2023-12-11 2024-03-15 华中师范大学 基于神经元尖峰序列数据的神经元网络推断方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1281718A2 (en) * 1995-11-10 2003-02-05 ELAN CORPORATION, Plc Peptides which enhance transport across tissues
US20130058871A1 (en) * 2011-07-28 2013-03-07 Howard Hughes Medical Institute Method and system for mapping synaptic connectivity using light microscopy
US20140315985A1 (en) * 2013-03-14 2014-10-23 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7785874B2 (en) * 2007-01-11 2010-08-31 The Salk Institute For Biological Studies Compositions and methods for monosynaptic transport
WO2016040594A1 (en) * 2014-09-10 2016-03-17 The Regents Of The University Of California Reconstruction of ancestral cells by enzymatic recording

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1281718A2 (en) * 1995-11-10 2003-02-05 ELAN CORPORATION, Plc Peptides which enhance transport across tissues
US20130058871A1 (en) * 2011-07-28 2013-03-07 Howard Hughes Medical Institute Method and system for mapping synaptic connectivity using light microscopy
US20140315985A1 (en) * 2013-03-14 2014-10-23 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANTHONY M ZADOR等: "Sequencing the connectome", 《PLOS BIOLOGY》 *
H.C. MOON等: "Imaging Single mRNA Dynamics in Live Neurons and Brains", 《NATURE METHODS》 *

Also Published As

Publication number Publication date
CA3020317A1 (en) 2017-10-12
AU2017246638B2 (en) 2023-07-13
US20190071666A1 (en) 2019-03-07
EP3440224A4 (en) 2019-08-28
EP3440224A1 (en) 2019-02-13
AU2017246638A1 (en) 2018-11-01
WO2017176829A1 (en) 2017-10-12

Similar Documents

Publication Publication Date Title
Boldog et al. Transcriptomic and morphophysiological evidence for a specialized human cortical GABAergic cell type
Kim et al. Extraction of distinct neuronal cell types from within a genetically continuous population
Tasic et al. Adult mouse cortical cell taxonomy revealed by single cell transcriptomics
Ng et al. Transmission of olfactory information between three populations of neurons in the antennal lobe of the fly
CN109715823A (zh) 通过测序进行的神经元投射的多重分析
US20190218276A1 (en) Methods for determining spatial and temporal gene expression dynamics in single cells
CN109804084A (zh) 基于具有嵌入纠错机制的伪彩色条形码的分子靶的顺序探测
CN107709574A (zh) 生物组织样品的分子概况的空间作图
US20020072059A1 (en) Method of identifying cells using DNA methylation patterns
Zhou et al. Encoding method of single-cell spatial transcriptomics sequencing
Kim et al. Target cell-specific synaptic dynamics of excitatory to inhibitory neuron connections in supragranular layers of human neocortex
Liu et al. Mapping visual functions onto molecular cell types in the mouse superior colliculus
Atamian et al. Taming human brain organoids one cell at a time
Morrison et al. Quantitative single cell gene expression profiling in the avian embryo
CN102321752B (zh) 一种同时分析犬基因组dna 17个基因座的荧光标记检测试剂盒及其检测方法和应用
Tasic et al. Single-cell transcriptomic characterization of vertebrate brain composition, development, and function
CN117552114A (zh) 基于核酸适体测序的单细胞图谱分析
Sherman et al. Retina-derived signals control pace of neurogenesis in visual brain areas but not circuit assembly
US12031127B2 (en) Multiplexed analysis of neuron projections by sequencing
Tao et al. A simple, affordable, and rapid visual CRISPR-based field test for sex determination of earlier porcine embryos and pork products
Granger et al. Target-specific co-transmission of acetylcholine and GABA from a subset of cortical VIP+ interneurons
Androvic et al. Spatial transcriptomics-correlated electron microscopy
Chen et al. Spatial organization of projection neurons in the mouse auditory cortex identified by in situ barcode sequencing
Mizrahi et al. An imaging-based approach to identify ligands for olfactory receptors
Liau et al. Single-cell transcriptomic analysis unveils spinal motor neuron subtype diversity underpinning the water-to-land transition in vertebrates

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination