CN107478622A - 一种荧光编码微球的解码方法和系统 - Google Patents
一种荧光编码微球的解码方法和系统 Download PDFInfo
- Publication number
- CN107478622A CN107478622A CN201710515877.8A CN201710515877A CN107478622A CN 107478622 A CN107478622 A CN 107478622A CN 201710515877 A CN201710515877 A CN 201710515877A CN 107478622 A CN107478622 A CN 107478622A
- Authority
- CN
- China
- Prior art keywords
- fluorescence
- beads
- encoded micro
- coding
- decoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6428—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6428—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
- G01N2021/6439—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
Landscapes
- Health & Medical Sciences (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Optics & Photonics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明公开了一种荧光编码微球的解码方法和系统,其中,所述方法通过预先获取荧光编码微球编码为已知的多组荧光光强数据,采用聚类的方式分别将多组荧光光强数据归属为对应的类,其中每一类对应一种荧光编码微球的编码;采用聚类算法分别计算待解码荧光编码微球的荧光光强数据和每个类的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类对应的编码作为该待解码荧光编码微球的编码,实现了对荧光编码微球的解码。由于采用聚类算法进行相似度运算实现分类,避免了因使用简单的荧光强度等分进行分类造成的检测准确度限制,提高了荧光编码微球解码的精度。
Description
技术领域
本发明涉及生物芯片检测领域,具体涉及荧光编码微球的解码方法和系统。
背景技术
生物芯片(biochip)技术是融微电子学、生命科学、计算机科学和光电化学为一体的高通量生物分子检测技术,是生命科学领域的一场重大革命。传统形式的生物芯片技术又称为微阵列(microarray)技术,其原理是将已知序列的生物分子(DNA、RNA、多肽、蛋白质等)集成于固体表面形成探针阵列,用被标记的待检测生物分子与上述探针阵列进行杂交反应,通过检测相应位置的杂交探针,实现生物分子检测的目的。传统生物芯片杂交属于固-液相杂交,其分立的固-液反应环境及洗涤因素使其在检测灵敏度及稀有样品的检测中显现出不足之处。
随着人类基因组计划的进行及人类对自身健康发展的需要,更快速、更高效、更高通量的生物分子检测技术显得尤为重要。因此在传统生物芯片技术的基础上发展出了液相生物芯片(Liquid biochip)技术。
液相生物芯片技术是集流式技术、荧光微球化学合成技术、生物分子杂交技术、高效数字信号处理技术为一体的尖端生物分子检测技术。液相生物芯片技术的核心是荧光编码标记的功能性高分子微球(荧光微球)如图1中a所示。该技术的基本思想是在每种编码好的荧光编码微球a上固定特定的探针分子b 得到捕获微球c并悬浮于一个液相体系中,用不同于编码的荧光物质(如报告分子e)对待测样本d进行标记后放入上述液相体系中进行充分的杂交反应,将所得的液相生物微球f通过流式细胞仪术或光学成像技术逐个检测分析每个微球上的编码荧光和报告荧光,编码荧光确定了待测分子的类型,报告荧光强度则确定了待测分子的含量,从而实现了单样本多成分检测的目的。
编码的基本思想是:Luminex 100为例,系统采用红色和橙色两种荧光染料对直径为5.5~5.6um大小的聚苯乙烯微球进行编码,将每种染料以荧光强度分成 10等分,形成10*10的100种具有不同荧光编码,分别偶联上100种不同的探针分子用于生物检测。流式细胞术使微球快速单列的通过检测通道,使用激光照射对单个微球上的编码荧光和报告荧光进行激发(原理如图2所示),将激发出的微球荧光信号通过一系列二向色镜和滤光片,再用光电倍增管(PMT)进行收集(原理如图3所示)。以电信号的形式导入计算机进行分析处理,从而鉴定各个不同的反应类型(即定性)及确定待测分子的含量(即定量),实现待检测物的定性和定量分析。
液相生物芯片技术的优点:(1)通量高:可同时对100或更多种目的分子进行定性、定量分析,实现多成分的检测分析;(2)样本用量少:实现单样本的多成分检测,大量节省了样本用量,能够实现对稀有样品的检测分析,弥补了传统生物芯片技术的不足;(3)灵敏度高:杂交反应在接近生物体系统内部环境的液相环境下进行,能够保持蛋白质和DNA的天然构象和活性,而具有较大表面积的微球上可偶联成千上万的探针分子,如此高密度的探针分子能够最大程度的捕获被检测分子,保证杂交反应的充分进行,从而提高了检测的灵敏度;(4)速度快:基于液相反应动力学使杂交反应快速高效,大大缩短了孵育时间,而且流式细胞术使检测分析时间大大缩短;(5)成本低:单样本的多成分检测可有效节约样本、时间和劳动,芯片技术核心的微球制备工艺简单成熟,可实现大规模生产,使检测成本降低;(6)另外,还有检测范围广、准确性高、操作简单灵活、可重复性强等优点。
尽管有如此多的优点,但随着新技术的不断出现以及社会发展对检测技术的进一步要求,液相生物芯片技术仍面临一些困难。目前,在临床和研究中,这种方法具有其局限性:现有技术仅简单的使用荧光物质发光强度分成的不同等分进行荧光编码微球的分类识别,即,两荧光微球的荧光光强成2:1的关系,则认为这两种荧光微球的编码为2:1,同时这种简单的等分关系没有考虑同批次荧光微球发光强度不一致的问题,因此限制了系统的检测精度(荧光编码微球的解码精度)。
因此,现有技术有待改进和提高。
发明内容
本申请提供一种荧光编码微球的解码方法和系统,以提高对荧光编码微球的解码精度。
根据本发明的第一方面,本发明提供一种荧光编码微球的解码方法,包括如下步骤:
分类步骤,预先获取荧光编码微球编码为已知的多组荧光光强数据,采用聚类的方式分别将多组荧光光强数据归属为对应的类,其中每一类对应一种荧光编码微球的编码;
解码步骤,采用聚类算法分别计算待解码荧光编码微球的荧光光强数据和每个类的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类对应的编码作为该待解码荧光编码微球的编码。
所述的荧光编码微球的解码方法,其中,所述聚类算法包括:基于划分聚类算法、基于层次聚类算法、基于密度聚类算法、基于网格聚类算法、基于神经网络聚类算法和基于统计学聚类算法中的一种或多种。
所述的荧光编码微球的解码方法,其中,所述解码步骤,具体包括:
将待解码荧光编码微球的荧光光强数据分别和每个类做距离运算,将与待解码荧光编码微球的荧光光强数据距离最小的类对应的编码作为该待解码荧光编码微球的编码;
或者,分别计算待解码荧光编码微球的荧光光强数据和每个类的夹角余弦,将计算得到的夹角余弦值最大的类对应的编码作为该待解码荧光编码微球的编码;
或者,分别计算待解码荧光编码微球的光强数据和每个类的相关系数,将计算得到的相关系数最大的类对应的编码作为该待解码荧光编码微球的编码。
所述的荧光编码微球的解码方法,其中,所述距离运算包括欧式距离运算和/或曼哈顿距离运算,所述相似性度量由夹角余弦法计算得到。
所述的荧光编码微球的解码方法,其中,荧光光强数据包括:
荧光编码微球包含的多种荧光物质对应的荧光光强值,或所述多种荧光物质对应的荧光光强值的比例,或所述多种荧光物质对应的荧光光强值经过归一化后的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值的比例,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘并经过归一化后的数值。
根据本发明的第二方面,本发明提供一种荧光编码微球的解码系统,包括:
光强数据获取模块,用于获取荧光编码微球编码为已知的多组荧光光强数据;
聚类模块,用于采用聚类的方式分别将多组荧光光强数据归属为对应的类,其中每一类对应一种荧光编码微球的编码;
运算处理模块,用于采用聚类算法分别计算待解码荧光编码微球的荧光光强数据和每个类的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类对应的编码作为该待解码荧光编码微球的编码。
所述的荧光编码微球的解码系统,其中,所述聚类算法包括:基于划分聚类算法、基于层次聚类算法、基于密度聚类算法、基于网格聚类算法、基于神经网络聚类算法和基于统计学聚类算法中的一种或多种。
所述的荧光编码微球的解码系统,其中,所述运算处理模块具体用于:
将待解码荧光编码微球的荧光光强数据分别和每个类做距离运算,将与待解码荧光编码微球的荧光光强数据距离最小的类对应的编码作为该待解码荧光编码微球的编码;
或者,分别计算待解码荧光编码微球的荧光光强数据和每个类的夹角余弦,将计算得到的夹角余弦值最大的类对应的编码作为该待解码荧光编码微球的编码;
或者,分别计算待解码荧光编码微球的光强数据和每个类的相关系数,将计算得到的相关系数最大的类对应的编码作为该待解码荧光编码微球的编码。
所述的荧光编码微球的解码系统,其中,所述距离运算包括欧式距离运算和/或曼哈顿距离运算,所述相似性度量由夹角余弦法计算得到。
所述的荧光编码微球的解码系统,其中,荧光光强数据包括:
荧光编码微球包含的多种荧光物质对应的荧光光强值,或所述多种荧光物质对应的荧光光强值的比例,或所述多种荧光物质对应的荧光光强值经过归一化后的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值的比例,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘并经过归一化后的数值。
本发明的有益效果:本发明提供一种荧光编码微球的解码方法和系统,通过预先获取荧光编码微球编码为已知的多组荧光光强数据,采用聚类的方式分别将多组荧光光强数据归属为对应的类,其中每一类对应一种荧光编码微球的编码;采用聚类算法分别计算待解码荧光编码微球的荧光光强数据和每个类的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类对应的编码作为该待解码荧光编码微球的编码,实现了对荧光编码微球的解码。由于采用聚类算法进行相似度运算,实现荧光编码微球的分类,避免了因使用简单的荧光强度等分进行分类造成的检测准确度限制,并且即使同种荧光编码微球中的不同荧光编码微球所发荧光强度不一致,本发明也能够准确对荧光编码微球进行解码,从而提高了荧光编码微球解码的精度。
附图说明
图1为现有的液相生物芯片技术中,荧光编码微球捕获可溶性大分子的示意图;
图2为现有的流式细胞仪液流系统原理示意图;
图3为现有的流式细胞仪获取荧光编码微球的荧光光强数据的示意图;
图4为本发明提供的荧光编码微球的解码系统的一实施例的结构框图;
图5为本发明提供的荧光编码微球的解码方法的一实施例的流程图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
本发明中用到的术语定义:
荧光编码微球是指粒径在纳米至微米范围内,负载有荧光物质和磁性粒子,受激发光照射后能够发射出荧光的固体微球。荧光物质为荧光染料、量子点、上转换发光材料等。
聚类是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程,换而言之,是给一大堆原始数据,然后通过算法将其中具有相似特征的数据聚为一类。
本发明通过聚类的思想将给定种类(已知编码)荧光编码微球归为一类,待测数据只需要和这些类进行距离相似度运算,相似度最大时对应的荧光编码微球的编码即为待测数据所属的荧光编码微球的编码。该模型能把数据库中的数据项映射到给定类别中的某一个,从而通过相似度运算可以对荧光编码微球进行解码。
具体的,在实施例中,本发明给出一种荧光编码微球的解码系统,请参考图4,所述解码系统包括:光强数据获取模块10、聚类模块20和运算处理模块 30。
光强数据获取模块10,用于获取荧光编码微球编码为已知的多组荧光光强数据,其中每一组荧光光强数据对应一种荧光编码微球的编码。每组荧光光强数据均包括多个荧光光强数据。编码的位数表示包含的荧光物质的种类数,也就是荧光编码微球的维数。每一编码位对应表示一种荧光物质。本实施例中,编码位数以5为例,其最多由五种荧光物质混合编码而成。其中第一种荧光物质记作x1,第二种荧光物质记作x2,第三种荧光物质记作x3,第四种荧光物质记作x4,第五种荧光物质记作x5。该荧光编码微球的编码即为x1x2x3x4x5。其中,x1-x5的取值在0-5,0表示该微球不包含此荧光物质,1表示该微球包含一份的此荧光物质,2表示该微球包含两份的此荧光物质,……,5表示该微球包含五份的此荧光物质。光强数据获取模块10可以是平面荧光成像系统或流式细胞术系统,也可以是从平面荧光成像系统或流式细胞术系统中获取数据的数据传输模块。
聚类模块20,用于采用聚类的方式分别将多组荧光光强数据归属为对应的类,其中每一类对应一种荧光编码微球的编码。
运算处理模块30,用于采用聚类算法分别计算待解码荧光编码微球的荧光光强数据和每个类的相似度,找出与待解码荧光编码微球的荧光光强数据相似度最大的类,将该类对应的编码作为该待解码荧光编码微球的编码。
其中,所述聚类算法包括:基于划分聚类算法(包括K-MEANS算法、K-MEDOIDS算法、CLARANS算法等)、基于层次聚类算法(包括BIRCH算法、CURE算法、CHAMELEON算法等)、基于密度聚类算法、基于网格聚类算法、基于神经网络聚类算法和基于统计学聚类算法中的一种或多种。
所述解码系统采用如下解码方法对荧光编码微球进行解码,具体参阅图5,所述解码方法包括如下步骤:
S10、分类步骤:预先通过光强数据获取模块10获取荧光编码微球编码为已知的多组荧光光强数据,其中每一组荧光光强数据对应一种荧光编码微球的编码。具体的,制备N种已知编码的荧光编码微球,通过平面荧光成像系统或流式细胞术系统使荧光编码微球进入检测区域,使用激发光(如激光)照射对单个荧光编码微球上的荧光物质进行激发,受激光(荧光)通过一系列二向色镜和滤光片后,用光电转换装置进行收集,得到每个编码位对应的荧光物质的荧光光强。即,一个荧光光强数据为一数据矩阵,如[m111,m212,...,m515],包括每个编码位对应的荧光物质的荧光光强,即m111-m515对应x1-x5的荧光光强。本实施例中,光强数据获取模块10采用上述方法分别提取多组(N组)已知编码的M个荧光编码微球的荧光光强数据,共计得到N*M条荧光光强数据,并给这N组荧光光强数据依次标记标签为1~N。N种荧光编码微球的编码需包含后续待解码荧光编码微球,N为大于1的正整数,其取值越大越好,优选为Ak, A为每种荧光物质可以分成的荧光强度等级,即每个编码位可能取值的个数,本实施例为3(可包含0-2份荧光物质);k为荧光编码微球的维数,本实施例为5。
进一步的,荧光光强数据包括荧光编码微球包含的多种(k种)荧光物质对应的荧光光强值,或所述多种荧光物质对应的荧光光强值的比例,或所述多种荧光物质对应的荧光光强值经过归一化后的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值的比例,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘并经过归一化后的数值(当然,归一化也可以在荧光光强值与权重相乘之前进行)。在现有技术中,同一批次制备的每个荧光编码微球的荧光强度必须十分均一;然而由于在储存过程中荧光编码微球的荧光物质的漂白、猝灭等问题,导致同一批次规格的荧光编码微球的荧光强度不一致,在进行荧光编码微球解码时,可能会出现解码错误。本发明可采用归一化对荧光光强值或与权重相乘得到的值进行处理,得到荧光光强数据,通过后续对荧光光强数据的进一步处理,可解决同批次荧光编码微球发光均一性不足带来的问题,提高了解码精度。本实施例中,荧光光强数据为:所述多种荧光物质对应的实测荧光光强值的比例。
聚类模块20采用聚类的方式分别将多组荧光光强数据归属为对应的类,其中每一类对应一种荧光编码微球的编码。本实施例中,聚类模块20采用凝聚层次聚类算法,将每一组荧光光强数据归为一类。
S20、解码步骤:光强数据获取模块10还获取待解码荧光编码微球的荧光光强数据;运算处理模块30根据待解码荧光编码微球的荧光光强数据和所述类的相似度进行解码。即,运算处理模块30采用聚类算法分别计算待解码荧光编码微球的荧光光强数据和每个类的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类对应的编码作为待解码荧光编码微球的编码。
具体的,运算处理模块30将待解码荧光编码微球的荧光光强数据分别和每个类做距离运算,将与待解码荧光编码微球的荧光光强数据距离最小的类对应的编码作为该待解码荧光编码微球的编码;或者,分别计算待解码荧光编码微球的荧光光强数据和每个类的夹角余弦,将计算得到的夹角余弦值最大的类对应的编码作为该待解码荧光编码微球的编码,换而言之,余弦值越接近1,就表明夹角越接近0度,也就是荧光光强数据和类越相似,将与待解码荧光编码微球的荧光光强数据计算得到的余弦值最大的类对应的编码作为该待解码荧光编码微球的编码;或者,分别计算待解码荧光编码微球的光强数据和每个类的相关系数,将计算得到的最大的相关系数对应的类对应的编码作为该待解码荧光编码微球的编码,换而言之,将与待解码荧光编码微球的荧光光强数据计算得到的相关系数最大的类对应的编码作为该待解码荧光编码微球的编码。当然,运算处理模块30也可以计算距离、夹角余弦和相关系数中的多种,通过多种不同方式的计算来找出相应的类,提高了可靠性。其中,所述距离运算包括欧式距离运算和/或曼哈顿距离运算。
采用夹角余弦或相关系数进行解码,同样可解决同批次荧光编码微球发光均一性不足带来的问题,提高了解码精度。
在本实施例具体实施时,采用凝聚层次聚类方法进行聚类。凝聚层次聚类是将每个点作为一个簇,每一步合并两个最接近的簇。由于每一组数据通过S10 步骤后已经是聚类好的,这里我们只需要在S20步骤中按照凝聚层次聚类算法来判断待解码荧光编码微球的荧光光强数据归属于哪一类即可,本实施例在具体运算时采用AL算法(即average-linkage法,组间距离等于两组对象之间的平均距离),待解码荧光编码微球的荧光光强数据与每个类间的距离计算公式为:
本实施例具体实施时,给出10种已知编码的荧光编码微球,其编码分别为: 0 0 10 0、0 1 0 1 0、1 0 1 0 1、1 1 0 1 1、1 1 1 1 1、0 0 1 2 0、0 1 2 1 0、2 0 2 0 1、 10 2 1 2、2 1 0 2 2。获取10种荧光编码微球对应的荧光光强数据,每种提取1000 条数据记录来处理。则每个类包含1000条荧光光强数据,其与编码的对应关系如下表1:
荧光微球种类 | 编码 | 该类包含的荧光光强数据 |
第一种 | 0 0 1 0 0 | 对应组包含的1000条数据 |
第二种 | 0 1 0 1 0 | 对应组包含的1000条数据 |
第三种 | 1 0 1 0 1 | 对应组包含的1000条数据 |
第四种 | 1 1 0 1 1 | 对应组包含的1000条数据 |
第五种 | 1 1 1 1 1 | 对应组包含的1000条数据 |
第六种 | 0 0 1 2 0 | 对应组包含的1000条数据 |
第七种 | 0 1 2 1 0 | 对应组包含的1000条数据 |
第八种 | 2 0 2 0 1 | 对应组包含的1000条数据 |
第九种 | 1 0 2 1 2 | 对应组包含的1000条数据 |
第十种 | 2 1 0 2 2 | 对应组包含的1000条数据 |
表1为十种已知编码的荧光编码微球及其对应的类。每类都有1000条数据,我们记作:[t1,t2,....,t1000]。
待测荧光微球的一组荧光光强数据test_data为:[4.7176,0.0540,5.1078,0.0337,1.9783]。
test_data依次和各类做运算得到该待测数据到各类的距离:
d=5.9289,7.6702,4.1484,6.3903,5.0007,7.7398,5.8015,0.8438,4.6076,8.0428],由此可知距离最小值为第八种。则该待测荧光微球即是第八种荧光微球,其编码为2 0 2 0 1。
在另一实施例中,运算处理模块30先采用聚类算法计算出各个类的类中心,再分别计算待解码荧光编码微球的荧光光强数据和每个类中心的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类中心对应的编码作为待解码荧光编码微球的编码。即,分类步骤S10与上一实施例相同,解码步骤S20 不同。
S20、对于每个类,聚类模块20采用聚类算法找出每个类的类中心。本实施例中,聚类模块20采用基于划分聚类算法(具体为K-means聚类算法)求取每个类的类中心。具体的,求取每个类中荧光光强数据的平均值,并将所述平均值作为下次迭代的类中心。
光强数据获取模块10还获取待解码荧光编码微球的荧光光强数据;运算处理模块30根据待解码荧光编码微球的荧光光强数据和所述类中心的相似度进行解码。即,运算处理模块30分别计算待解码荧光编码微球的荧光光强数据和每个类中心的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类中心对应的编码作为待解码荧光编码微球的编码。
具体的,运算处理模块30将待解码荧光编码微球的荧光光强数据分别和每个类中心做距离运算,将与待解码荧光编码微球的荧光光强数据距离最小的类中心对应的编码作为该待解码荧光编码微球的编码;或者,分别计算待解码荧光编码微球的荧光光强数据和每个类中心的夹角余弦,将计算得到的夹角余弦值最大的类中心对应的编码作为该待解码荧光编码微球的编码,换而言之,余弦值越接近1,就表明夹角越接近0度,也就是荧光光强数据和类中心越相似,将与待解码荧光编码微球的荧光光强数据计算得到的余弦值最大的类中心对应的编码作为该待解码荧光编码微球的编码;或者,分别计算待解码荧光编码微球的光强数据和每个类中心的相关系数,将计算得到的最大的相关系数对应的类中心对应的编码作为该待解码荧光编码微球的编码,换而言之,将与待解码荧光编码微球的荧光光强数据计算得到的相关系数最大的类中心对应的编码作为该待解码荧光编码微球的编码。当然,运算处理模块30也可以计算距离、夹角余弦和相关系数中的多种,通过多种不同方式的计算来找出相应的类中心,提高了可靠性。其中,所述距离运算包括欧式距离运算和/或曼哈顿距离运算。
采用夹角余弦或相关系数进行解码,同样可解决同批次荧光编码微球发光均一性不足带来的问题,提高了解码精度。
进一步的,待解码荧光编码微球的荧光光强数据为 DM=[dm1,dm2,...,dmk],N组荧光光强数据的类中心分别为 m1,m2,...,mN,N个类中心具体包含的荧光光强数据为: m1=[m11,m12,...,m1k],m2=[m21,m22,...,m2k],...,mN=[mN1,mN2,...,mNk]。 k为荧光编码微球的维数,即荧光物质的种类。运算处理模块30将待解码荧光编码微球的荧光光强数据分别和每个类中心做欧式距离运算时,采用的计算公式为:公式1。mn表示第n个类中心,n的取值范围为1-N,i为荧光光强数据包含的一位光强值,即dmi表示待解码荧光编码微球的荧光光强数据的第i位光强值,i的取值范围为1-k,mni表示第n个类的第i位光强值。运算处理模块30将待解码荧光编码微球的荧光光强数据分别和每个类中心做曼哈顿距离运算时,采用的计算公式为:公式2。其中,dmi、mni、mn、n、i的含义同上。运算处理模块30采用夹角余弦方法计算待解码荧光编码微球的荧光光强数据和每个类中心的夹角余弦时,采用的计算公式为:公式3。其中,dmi、 mni、mn、n、i的含义同上。该余弦值即为夹角余弦。
由此可知,在各个类中心对应的编码已知的情况下,只需计算距离的最小值或者最大的相关系数或最大的夹角余弦即可对荧光编码微球进行解码得到其编码,非常方便快捷,无需进行光谱信号的经验补偿,提高了荧光编码微球解码的精度,并且即使同种荧光编码微球中的不同荧光编码微球所发荧光强度不一致,本发明也能够准确对荧光编码微球进行解码。
本发明的荧光光强数据反映了荧光编码微球中用于编码的荧光物质对应的含量,荧光编码微球中用于反应待测分子含量的荧光物质对应的荧光光强不用做相似度运算,但仍需获取以便后续测定其含量。解码后只需根据其编码,即可得到该荧光编码微球标记的待测分子,根据待测分子对应的荧光光强即可得知其含量。
本实施例具体实施时,给出10种已知编码的荧光编码微球,其编码分别为: 0 0 10 0、0 1 0 1 0、1 0 1 0 1、1 1 0 1 1、1 1 1 1 1、0 0 1 2 0、0 1 2 1 0、2 0 2 0 1、 10 2 1 2、2 1 0 2 2。获取10种荧光编码微球对应的荧光光强数据,每种提取1000 条数据记录来处理。找出这10组荧光光强数据的类中心,其与编码的对应关系如下表2:
表2为十种已知编码的荧光编码微球及其对应的类中心。
待测荧光编码微球的一组荧光光强数据test_data为: [4.7176,0.0540,5.1078,0.0337,1.9783]。
采用欧式距离方法依次计算test_data和上述10个类中心的欧式距离: d=[5.9249,7.6621,4.1403,6.3698,4.9700,7.7152,5.7571,0.3109,4.5189,7.9953]。由此可知距离最小值为第八种。则该待测荧光编码微球即是第八种荧光编码微球,其编码为2 02 0 1。
采用曼哈顿距离方法依次计算test_data和上述10个类中心的曼哈顿距离: d=[9.7160,15.5589,5.8787,11.6815,9.7603,14.6486,10.6114,0.4364,7.8040,15.4006]。由此可知距离最小值仍为第八种。则该待测荧光编码微球即是第八种荧光编码微球,其编码为2 0 2 0 1。
夹角余弦方法依次计算test_data和上述10个类中心的夹角余弦: d=[0.7293,0.0377,0.9425,0.4783,0.7356,0.2756,0.6274,0.9993,0.8165,0.5292]。由此可知夹角余弦最大值为第八组,即待测数据和第八种荧光编码微球聚类中心的夹角最小。则该待测荧光编码微球即是第八种微球,其编码为2 0 2 0 1。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
Claims (10)
1.一种荧光编码微球的解码方法,其特征在于,包括如下步骤:
分类步骤,预先获取荧光编码微球编码为已知的多组荧光光强数据,采用聚类的方式分别将多组荧光光强数据归属为对应的类,其中每一类对应一种荧光编码微球的编码;
解码步骤,采用聚类算法分别计算待解码荧光编码微球的荧光光强数据和每个类的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类对应的编码作为该待解码荧光编码微球的编码。
2.根据权利要求1所述的荧光编码微球的解码方法,其特征在于,所述聚类算法包括:基于划分聚类算法、基于层次聚类算法、基于密度聚类算法、基于网格聚类算法、基于神经网络聚类算法和基于统计学聚类算法中的一种或多种。
3.根据权利要求1所述的荧光编码微球的解码方法,其特征在于,所述解码步骤,具体包括:
将待解码荧光编码微球的荧光光强数据分别和每个类做距离运算,将与待解码荧光编码微球的荧光光强数据距离最小的类对应的编码作为该待解码荧光编码微球的编码;
或者,分别计算待解码荧光编码微球的荧光光强数据和每个类的夹角余弦,将计算得到的夹角余弦值最大的类对应的编码作为该待解码荧光编码微球的编码;
或者,分别计算待解码荧光编码微球的光强数据和每个类的相关系数,将计算得到的相关系数最大的类对应的编码作为该待解码荧光编码微球的编码。
4.根据权利要求3所述的荧光编码微球的解码方法,其特征在于,所述距离运算包括欧式距离运算和/或曼哈顿距离运算。
5.根据权利要求1所述的荧光编码微球的解码方法,其特征在于,荧光光强数据包括:
荧光编码微球包含的多种荧光物质对应的荧光光强值,或所述多种荧光物质对应的荧光光强值的比例,或所述多种荧光物质对应的荧光光强值经过归一化后的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值的比例,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘并经过归一化后的数值。
6.一种荧光编码微球的解码系统,其特征在于,包括:
光强数据获取模块,用于获取荧光编码微球编码为已知的多组荧光光强数据;
聚类模块,用于采用聚类的方式分别将多组荧光光强数据归属为对应的类,其中每一类对应一种荧光编码微球的编码;
运算处理模块,用于采用聚类算法分别计算待解码荧光编码微球的荧光光强数据和每个类的相似度,将与待解码荧光编码微球的荧光光强数据相似度最大的类对应的编码作为该待解码荧光编码微球的编码。
7.根据权利要求6所述的荧光编码微球的解码系统,其特征在于,所述聚类算法包括:基于划分聚类算法、基于层次聚类算法、基于密度聚类算法、基于网格聚类算法、基于神经网络聚类算法和基于统计学聚类算法中的一种或多种。
8.根据权利要求6所述的荧光编码微球的解码系统,其特征在于,所述运算处理模块具体用于:
将待解码荧光编码微球的荧光光强数据分别和每个类做距离运算,将与待解码荧光编码微球的荧光光强数据距离最小的类对应的编码作为该待解码荧光编码微球的编码;
或者,分别计算待解码荧光编码微球的荧光光强数据和每个类的夹角余弦,将计算得到的夹角余弦值最大的类对应的编码作为该待解码荧光编码微球的编码;
或者,分别计算待解码荧光编码微球的光强数据和每个类的相关系数,将计算得到的相关系数最大的类对应的编码作为该待解码荧光编码微球的编码。
9.根据权利要求8所述的荧光编码微球的解码系统,其特征在于,所述距离运算包括欧式距离运算和/或曼哈顿距离运算。
10.根据权利要求6所述的荧光编码微球的解码系统,其特征在于,荧光光强数据包括荧光编码微球包含的多种荧光物质对应的荧光光强值,或所述多种荧光物质对应的荧光光强值的比例,或所述多种荧光物质对应的荧光光强值经过归一化后的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值,或所述多种荧光物质对应的荧光光强值与各自对应的权重相乘得到的数值的比例。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710515877.8A CN107478622B (zh) | 2017-06-29 | 2017-06-29 | 一种荧光编码微球的解码方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710515877.8A CN107478622B (zh) | 2017-06-29 | 2017-06-29 | 一种荧光编码微球的解码方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107478622A true CN107478622A (zh) | 2017-12-15 |
CN107478622B CN107478622B (zh) | 2020-06-02 |
Family
ID=60596137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710515877.8A Active CN107478622B (zh) | 2017-06-29 | 2017-06-29 | 一种荧光编码微球的解码方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107478622B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117491669A (zh) * | 2023-12-29 | 2024-02-02 | 北京胡曼智造科技有限责任公司 | 一种多指标智能标识和检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1710104A (zh) * | 2005-06-24 | 2005-12-21 | 东南大学 | 基于微球载体的阵列式生物芯片及其编码解码方法 |
CN101226190A (zh) * | 2007-01-17 | 2008-07-23 | 深圳迈瑞生物医疗电子股份有限公司 | 流式细胞术的自动分类方法和装置 |
CN103983625A (zh) * | 2014-05-15 | 2014-08-13 | 清华大学深圳研究生院 | 荧光编码微球的解码方法及系统 |
CN105219373A (zh) * | 2014-06-05 | 2016-01-06 | 上海交通大学 | 一种载体颗粒及其制备方法 |
CN106398683A (zh) * | 2016-08-29 | 2017-02-15 | 上海交通大学 | 一种制备三色编码微球组合物的方法 |
-
2017
- 2017-06-29 CN CN201710515877.8A patent/CN107478622B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1710104A (zh) * | 2005-06-24 | 2005-12-21 | 东南大学 | 基于微球载体的阵列式生物芯片及其编码解码方法 |
CN101226190A (zh) * | 2007-01-17 | 2008-07-23 | 深圳迈瑞生物医疗电子股份有限公司 | 流式细胞术的自动分类方法和装置 |
CN103983625A (zh) * | 2014-05-15 | 2014-08-13 | 清华大学深圳研究生院 | 荧光编码微球的解码方法及系统 |
CN105219373A (zh) * | 2014-06-05 | 2016-01-06 | 上海交通大学 | 一种载体颗粒及其制备方法 |
CN106398683A (zh) * | 2016-08-29 | 2017-02-15 | 上海交通大学 | 一种制备三色编码微球组合物的方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117491669A (zh) * | 2023-12-29 | 2024-02-02 | 北京胡曼智造科技有限责任公司 | 一种多指标智能标识和检测方法 |
CN117491669B (zh) * | 2023-12-29 | 2024-03-29 | 北京胡曼智造科技有限责任公司 | 一种多指标智能标识和检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107478622B (zh) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jayan et al. | Recent developments in Raman spectral analysis of microbial single cells: Techniques and applications | |
Wang et al. | Past, present and future applications of flow cytometry in aquatic microbiology | |
Nguyen et al. | Programmable microfluidic synthesis of over one thousand uniquely identifiable spectral codes | |
CN104178556B (zh) | 神经胶质瘤分子分型基因群及其应用 | |
US10684212B2 (en) | Method and system for reference-assisted droplet detection, indexing and sorting for assays and diagnostics | |
CN103983625B (zh) | 荧光编码微球的解码方法及系统 | |
CN109001180B (zh) | 一种拉曼光谱结合人工智能高通量单细胞分析鉴定方法 | |
Xu et al. | Emerging trends for microbiome analysis: from single-cell functional imaging to microbiome big data | |
US20130244909A1 (en) | Methods and apparatus for classification and quantification of multifunctional objects | |
US20090137053A1 (en) | Bead set, production process of the bead set, and method of using the bead set | |
CN107478622A (zh) | 一种荧光编码微球的解码方法和系统 | |
CN113658640B (zh) | 一种淡水生态系统健康评价方法 | |
CN107942049A (zh) | 一种多维度的微球编解码方法和系统 | |
CN110554178A (zh) | 一种悬浮式液态生物芯片检测方法 | |
CN110577982A (zh) | 高通量单细胞转录组与基因突变整合分析编码芯片 | |
CN103173566B (zh) | 一种针对鼠传病原的悬浮芯片多重非诊断性检测方法 | |
Xie et al. | Key steps for improving bacterial SERS signals in complex samples: Separation, recognition, detection, and analysis | |
CN103093122A (zh) | 高通量生物芯片检测结果的一种判读工具 | |
CN103267749B (zh) | 一种基于光子编码微球的多元生物标志物检测盒式芯片 | |
CN208443738U (zh) | 一种新型结构的sers基底 | |
Xiong et al. | Photonic Crystal Enhanced Quantum Dot Biosensor for Cancer-Associated MiRNA Detection | |
CN102925347B (zh) | 半导体芯片、半导体酶芯片及筛选目标酶的方法 | |
CN2751028Y (zh) | 一种悬浮式生物芯片 | |
CN101440403B (zh) | 一种应用悬浮芯片技术检测霍乱弧菌o139方法 | |
CN108291223A (zh) | 液滴测序中的稀疏标识空间 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20181107 Address after: 518052 Shenzhen, Guangdong, Nanshan District Taoyuan street, Xili University Town, Tsinghua campus, room 206, room L. Applicant after: Shenzhen liquid core technology Co., Ltd. Address before: Room 201, Building A, No. 1 Qianwan Road, Qianhai Shenzhen Cooperation Zone, Shenzhen, Guangdong 518000 Applicant before: Shenzhen liquid core Biological Technology Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |