CN107045637B - 一种基于光谱的血液物种识别仪及识别方法 - Google Patents

一种基于光谱的血液物种识别仪及识别方法 Download PDF

Info

Publication number
CN107045637B
CN107045637B CN201611168355.7A CN201611168355A CN107045637B CN 107045637 B CN107045637 B CN 107045637B CN 201611168355 A CN201611168355 A CN 201611168355A CN 107045637 B CN107045637 B CN 107045637B
Authority
CN
China
Prior art keywords
data
blood
spectrum
blood sample
species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611168355.7A
Other languages
English (en)
Other versions
CN107045637A (zh
Inventor
李宏霄
李迎新
秦川
孙美秀
向志光
王振南
赵晓萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Biomedical Engineering of CAMS and PUMC
Original Assignee
Institute of Biomedical Engineering of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Biomedical Engineering of CAMS and PUMC filed Critical Institute of Biomedical Engineering of CAMS and PUMC
Priority to CN201611168355.7A priority Critical patent/CN107045637B/zh
Publication of CN107045637A publication Critical patent/CN107045637A/zh
Application granted granted Critical
Publication of CN107045637B publication Critical patent/CN107045637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • G01N2021/551Retroreflectance
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • G01N2021/558Measuring reflectivity and transmission
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明涉及一种基于血液光谱数据对血液来源物种进行识别的方法,可用于血液样品来源物种的快速识别。其实现步骤为:将样本数据集分割为多个具有相对独立性的数据集,为每个数据集训练一个识别模型,通过比较各个数据集识别模型对其他数据集的预测能力,动态调整各个数据集内所包含的样本,通过循环迭代过程,将血样光谱数据中的特征分布去集中化,保证光谱特征信息的广域分布,最后综合多个预测识别模型的预测能力,提升总体模型对血样光谱特征信息的表达能力,进而提升其预测准确率。

Description

一种基于光谱的血液物种识别仪及识别方法
技术领域
本发明属于模式识别技术领域,涉及一种基于血液光谱数据对血液来源物种进行识别的方法,可用于血液样品来源物种的快速识别。
背景技术
随着中国医药行业国际化的飞速发展,血液生物材料的出入国境需求日益增加。目前海关对血液来源物种的判断主要依据两方面的信息来源,其一是申报人提供的血样信息,其二是检验机构提供的检验结果,前者的信息真实性难以保证,后者的检验过程则耗时繁多,而且血液样品可能被检测操作污染,或者血液样品自身可能携带致病因子,对检测人员造成职业暴露。因此,尽管生化方法具有很高的检测准确性,但却不便应用于海关等场合,所以,有必要提出一种更便捷的检测方法,相关研究结果表明,光谱检测法具有解决这一问题的潜力。
上世纪70年代,美国杜克大学的Frans F. Jöbsis首次提出了将血液的近红外光谱用于血液成分含量检测的设想,此后,世界各国的研究人员纷纷展开了对血液光谱的分析研究。匈牙利Imre Haynal健康科学大学的István Vályi-Nagy和Éva Gönczöl等人的研究表明红外光谱可用于测定全血和血清中血红蛋白、脂蛋白和血氧等成分的含量,而基于近红外光谱的血糖无创测量则为糖尿病患者带了福音,美国圣地亚国家实验室的M.Kathleen Alam等人发现可以采用近红外光谱测量血液的pH值,日本欧姆龙生命科学研究所有限公司的Toshikazu Shiga等人设计制作了基于红外光谱分析的便携式组织血氧计,中国科学院长春光机所的陈华才等人利用傅里叶变换近红外透射光谱技术,建立了人血清中胆固醇和甘油三酯的定标模型,此外,美国爱荷华大学的Kevin H. Hazen和Mark A.Arnold等用红外光谱对人血清中的总蛋白、球蛋白、白蛋白、甘油三酯、胆固醇、尿素、血糖和乳酸盐等进行了定量分析,并构造了相应的光谱预测模型。随着光谱分析技术的进一步发展,临床化学领域发现,通过分析血液的光谱数据,可以快速辨别类风湿性关节炎和糖尿病的发病情况。
上述各类利用红外光谱检测血液成分含量的研究,均采用了基于生化标定法的研究路线:首先,采集血液的红外光谱;其次,利用生化方法测量血液中目标成分的含量,作为标准含量数据,这就是生化标定步骤;之后,利用数学方法构建血液光谱数据与标准含量数据之间的关联模型;最后,利用该模型和血液光谱数据预测血液中目标成分的含量,实现非接触式的血液成分含量检测。其中所用的数学方法主要是统计分析方法,例如偏最小二乘算法和多元线性回归算法等,随着机器学习理论的发展,越来越多机器学习领域的算法被引入光谱预测模型的构建中,例如人工神经网络和支持向量机等。
上述内容表明,光谱法可以定量地分析血液中的生化成分,这是使用光谱法检测血液来源物种的技术理论基础,而使用光谱法检测血样来源的生物学基础则是物种之间的血液差异。物种是生物界发展的连续性与间断性统一的基本间断形式,在有性生物中,物种呈现为统一的繁殖群体,由占有一定空间,具有实际或潜在繁殖能力的种群所组成,而且与其他这样的群体在生殖上是隔离的。
有研究表明,不同物种的血液成分含量有显著差异。中科院动物研究所的董全等,测定了12只大熊猫的血液成分含量,与小熊猫和美洲黑熊的相同血液数据进行对比,结果发现三个物种的血液成分含量存在显著差异。军事医学科学院实验动物中心的王冬平等,比较了食蟹猴与猕猴的多项血液生理指标和生化指标,发现二者血液成分的多项指标均存在显著差异。综上所述,从理论角度分析,利用光谱技术检测血液来源物种是可行的。
发明内容
本发明的目的在于为了解决上述问题而提供一种既能够对血样来源进行快速检测,又能够对大量不同物种来源的血样进行模式识别的识别仪,检测箱可以检测盛放于抗凝管内血样光谱的数据,该识别仪可以采集200-1750nm波长范围的可见光和近红外光谱,上位机可以采集大量常见物种的2000个血样的光谱数据,并提供了一套完整详实的光谱数据库,使光谱数据与血样物种之间建立一个关联模型,当检测箱检测数据给出,上位机能够立即给出该血样的物种来源,实现快速检测的目的,该模型对随机抽取盲样的识别率可以达到95%,针对后续物种的血样来源检测可定制和改性,改装版本的设备同样适用于物种识别,应用范围广泛。
本发明通过以下技术方案来实现上述目的, 本发明的基于光谱的血液物种识别仪,其特征在于,
包括检测箱和上位机,所述检测箱包括第一发光系统,第一光检测系统,存储器,信号输入/输出系统,
上位机包括血液采集系统,第二发光系统,第二光检测系统,信号预处理系统,阵列信号预处理系统以及模式识别系统。
所述第一、第二发光系统由激光光源模块、第一反射镜、第一透镜构成,所述第一光检测系统由第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件构成,所述第二光检测系统由光学谐振腔、薄膜压力传感器和光电倍增管构成。
本发明的基于光谱的血液物种识别仪的识别方法,其特征在于,包括如下步骤:
(1)获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱。获取数据的同时采用正则化方法对数据进行预处理;
(2)将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就可以组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号;
(3)将血样光谱数据分成
Figure 529990DEST_PATH_IMAGE001
组,每组都包含大约
Figure 521080DEST_PATH_IMAGE002
个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量。分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据。此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据;
(4)对于
Figure 360860DEST_PATH_IMAGE001
组数据中的每一组数据进行操作:将第
Figure 779203DEST_PATH_IMAGE003
组数据集中的
Figure 277836DEST_PATH_IMAGE004
个样本按照基准样本分割比例随机分层分割,将其中包含样本数量较多的部分作为训练集,较少的部分作为测试集;
(5)对步骤(4)中得到的
Figure 869354DEST_PATH_IMAGE001
个预测模型按照从1到
Figure 501324DEST_PATH_IMAGE001
依次递增的顺序进行操作;
(6)重复循环执行步骤(5)。当重复次数达到
Figure 356147DEST_PATH_IMAGE005
次时,或者每个预测模型的所有的
Figure 135885DEST_PATH_IMAGE006
都大于
Figure 468777DEST_PATH_IMAGE007
时,就终止步骤(5)的循环迭代过程;
(7)经过步骤(6)之后,可以得到了
Figure 220832DEST_PATH_IMAGE001
个预测模型,在识别判断一个未知物种来源的血样类别时,可以让每一个预测模型都对该血样的物种作出一个判断,然后将这
Figure 43295DEST_PATH_IMAGE001
个判断结果进行综合,得出最终的判断;
其中步骤(4)中的基准样本分割比例可以选择的比例包括但不限于,9:1,3:2和1:1,其关键在于,用包含样本数量较多的部分作为训练集,用数量较少的部分作为测试集;
其中步骤(4)流式训练法的流程为:降维滤波方法à模式识别方法,其中的降维滤波方法可以是但不限于:小波分析,主成分分析,随机投影。其中的模式识别方法可以是但不限于:人工神经网络,决策树,支持向量机,贝叶斯分类器,聚类法;
步骤(5)包括:
第5.1步用流式训练法在第
Figure 185694DEST_PATH_IMAGE003
组训练集上训练出一个识别预测模型
Figure 322278DEST_PATH_IMAGE008
第5.2步用
Figure 925910DEST_PATH_IMAGE008
对其余的
Figure 919273DEST_PATH_IMAGE009
组数据中的测试集进行预测,得到
Figure 611286DEST_PATH_IMAGE009
个识别率,用
Figure 285981DEST_PATH_IMAGE006
表示
Figure 809366DEST_PATH_IMAGE008
对第
Figure 176894DEST_PATH_IMAGE010
组数据的测试集进行预测的识别率;
第5.3步找到
Figure 356202DEST_PATH_IMAGE006
中的最小值
Figure 569009DEST_PATH_IMAGE011
,从第
Figure 150163DEST_PATH_IMAGE003
组训练集和第
Figure 485329DEST_PATH_IMAGE012
组训练集中随机各自选取
Figure 151934DEST_PATH_IMAGE013
个血样光谱数据进行交换。
其中第5.2步的
Figure 159642DEST_PATH_IMAGE013
取值可以设置为每组训练集数量的5%-15%。
其中步骤(6)中
Figure 657620DEST_PATH_IMAGE005
的取值可以设置为10到100范围内的数值,
Figure 366950DEST_PATH_IMAGE007
的取值可以设为0.8,或者根据需要设为更高。
其中步骤(7)中的综合判断方法可以是但不限于:投票法;加权投票法(权值根据各个模型的
Figure 255271DEST_PATH_IMAGE006
确定);如果每个模型的输出结果是概率值,则求概率的平均值。
附图说明
图1是血液光谱的物种识别方法示意图。
图2是血液光谱的物种识别仪结构示意图。
图3是本发明中构建逻辑驱动模型的流程图。
图4是本发明将逻辑驱动模型转化为数据驱动模型的演化过程图。
图5是本发明中迭代循环步骤的流程图。
1.电源接口;2.电源开关;3.USB接口;4.WIFI模块接口;5.血样输送口;6. 数据传输装置;7.检测箱;8.上位机;9.显示器;10.血样送检盒;11. 激光光源模块。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示,上位机8的血样送检盒10一次接收12盒送检样品,样本可同时进行血液的光谱采集,其中发光系统由光学谐振腔、薄膜压力传感器和光电倍增管构成,光学谐振腔具有两个输入端和两个输出端,第一输入端和激光光源模块连接,用于接收发射光,第二输入端和样本采集装置连接,用于采集血样信息,两个输出端分别和薄膜压力传感器的输入端和光电倍增管的输入端连接,光电倍增管的输入端和模数转换器的输入端连接,模数转换器的输出端和处理器的输入端连接,处理器将信号经过预处理并输入到阵列信号预处理模块中,经过预处理后的数据是矩阵化的阵列,将阵列输入到模式识别引擎,根据建立的知识库模块进行训练,给出血样光谱的表达,在模式识别过程中不断的对阵列的某一组测试值进行测试。
从逻辑推理的角度分析,如果能得到每个物种血液中每种成分的光谱预测模型,则可以由血液光谱快速得知其血液成分含量,从而推测出血液来源物种的类别。为了设计这个逻辑驱动模型,需要为每个物种血液中的每种成分都建立一个基于生化标定法的光谱预测模型,然后将每个物种的所有光谱预测模型与物种类别相关联,从而建立一个从血液光谱到血液成分含量再到血液来源物种类别的预测模型,如图3所示。
从图3中可以看出,该逻辑驱动模型的输入端是血液光谱数据,输出端是血液来源物种,中间部分则是,基于生化标定法的数学建模过程,和血液成分含量与血液来源物种类别的关联过程。由于需要构建光谱预测模型的血液成分类别非常多,这种逻辑驱动模型的构建难度非常大。受到近年来机器学习和大数据分析领域的发展启示,本实施例用一个黑箱过程来替代逻辑驱动模型中生化标定法建模过程,如图3所示,然后,通过数学建模的方法对黑箱过程进行合理化描述,使其能够根据血液光谱数据预测血液来源物种的类别。
如图2所示,物种识别仪的检测箱7包括激光光源模块,第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件、存储器,信号输入/输出系统,血样通过血样输送口5送入到检测箱7中,打开电源开关2,检测箱开始工作,将所检测数据存储到存储器当中,通过数据传输装置6传输到上位机8当中进行模式识别检测。可以通过有线/无线方式进行数据的传输,为了方便在现场工作,检测箱7配备有USB接口3和WIFI模块接口4。
用数据驱动模型替换逻辑驱动模型的合理性在于,这两种模型的实质都是数学建模过程,从结构形式的角度来看,这两种类同的过程可以彼此趋近。其中逻辑驱动模型实质为数学建模过程的原因为:逻辑驱动模型包含两个过程,第一个过程是根据生化标定法建立血液成分含量的光谱预测模型,这个过程通过统计分析和机器学习领域的数学建模方法实现;第二个过程是建立多个血液成分含量与物种类别的关联模型,该过程需要利用模式识别领域的数学建模方法。因此逻辑驱动模型实质上是多个数学建模过程的组合。
这种数据驱动的血液物种光谱预测模型,将逻辑驱动模型中的繁复的逻辑推理过程简化为一个黑箱,由于这个黑箱中的过程是不可知的,因此需要利用数据处理和数理统计的方法寻找输入与输出之间的关系,也就是寻找血液光谱数据和血液来源物种之间的关系,然后,利用这种关系,来预测任意输入所对应的输出。
在上述数据驱动模型的设计思想指导之下,本方法的实现过程为:
(1)获取数据:获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱。获取数据的同时采用正则化方法对数据进行预处理。
(2)组织数据:将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就可以组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号。
(3)分组数据:将血样光谱数据分成
Figure 137777DEST_PATH_IMAGE001
组,每组都包含大约
Figure 427944DEST_PATH_IMAGE002
个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量,分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据。此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据。
(4)迭代循环:
4.1对于
Figure 308175DEST_PATH_IMAGE001
组数据集中的每一组数据集进行操作:将第
Figure 683793DEST_PATH_IMAGE003
组数据集中的
Figure 42093DEST_PATH_IMAGE004
个样本随机分层分割为9:1,这个比例称为基准样本分割比例,其中包含样本数量较多的部分作为训练集,较少的部分作为测试集;
4.2对于
Figure 514663DEST_PATH_IMAGE001
组数据集,从第1组数据集到第
Figure 565795DEST_PATH_IMAGE001
组数据集进行如下操作:
1)用流式训练法在第
Figure 491026DEST_PATH_IMAGE003
组训练集上训练出一个识别预测模型
Figure 650087DEST_PATH_IMAGE008
。其中的流式训练法为:降维滤波方法à模式识别方法。其中降维滤波方法可以包括但不限于:小波分析,主成分分析,随机投影。其中模式识别方法可以包括但不限于:人工神经网络,决策树,支持向量机,贝叶斯分类器,聚类法;
2)用
Figure 649267DEST_PATH_IMAGE008
对其余的
Figure 933618DEST_PATH_IMAGE009
组数据中的测试集进行预测,得到
Figure 283828DEST_PATH_IMAGE009
个识别率,用
Figure 311827DEST_PATH_IMAGE006
表示
Figure 431093DEST_PATH_IMAGE008
对第
Figure 558449DEST_PATH_IMAGE010
组数据的测试集进行预测的识别率;
3)找到
Figure 458272DEST_PATH_IMAGE006
中的最小值
Figure 962065DEST_PATH_IMAGE011
,随机交换第
Figure 201417DEST_PATH_IMAGE003
组训练集和第
Figure 561991DEST_PATH_IMAGE012
组训练集中
Figure 886793DEST_PATH_IMAGE013
个血样光谱数据,
Figure 197207DEST_PATH_IMAGE013
的取值可以设置为每组训练集数量的5%-15%;
4.3重复步骤4.2进行迭代循环,直到满足条件:(1)步骤2重复了
Figure 87803DEST_PATH_IMAGE005
次,或者(2)所有的
Figure 822541DEST_PATH_IMAGE006
都大于
Figure 431377DEST_PATH_IMAGE007
Figure 542552DEST_PATH_IMAGE007
的取值可以根据需要确定,例如0.8或者更高。
(5)识别判断:经过步骤四的迭代处理,得到了
Figure 490916DEST_PATH_IMAGE001
个预测模型,在识别判断一个未知来源的血样物种类别时,可以让每一个预测模型都对该血样的物种给出一个判断,然后将这
Figure 458872DEST_PATH_IMAGE001
个判断进行综合,得出最终的判断。其中综合的方法包括但不限于:投票法;加权投票法(权值根据各个模型的
Figure 492688DEST_PATH_IMAGE006
确定);如果每个模型的输出结果是概率值,可以求概率的平均值。
本发明方法的变种之一可以是,对光谱中的不同波段分别采用上述实现流程进行处理,最后将多个波段的判断结果进行综合。
本发明方法的变种之二可以是,在迭代循环步骤中不对数据集进行分割,直接在原数据集上进行模型训练,在后续的互相预测阶段,直接用
Figure 141975DEST_PATH_IMAGE008
对第
Figure 7163DEST_PATH_IMAGE010
组数据整体进行预测识别,也可以得到一个识别率
Figure 83703DEST_PATH_IMAGE006
。相当于第
Figure 667131DEST_PATH_IMAGE003
组数据集中的训练集和测试集都是其本身。
本发明方法的变种之三可以是,用不同类型的流式训练法得到多个不同的整体预测模型,然后对这些多个整体预测模型的判断结果进行综合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于光谱的血液物种识别仪的识别方法,
所述识别仪包括检测箱和上位机,其特征在于,
所述检测箱包括第一发光系统,第一光检测系统,存储器,信号输入/输出系统,
上位机包括血液采集系统,第二发光系统,第二光检测系统,信号预处理系统,阵列信号预处理系统以及模式识别系统,
所述第一、第二发光系统由激光光源模块、第一反射镜、第一透镜构成,所述第一光检测系统由第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件构成,血样通过血样输送口送入到检测箱中,打开电源开关,检测箱开始工作,将所检测数据存储到存储器当中,通过数据传输装置传输到上位机当中进行模式识别检测,检测箱配备有USB接口和WIFI模块接口,
所述第二光检测系统由光学谐振腔、薄膜压力传感器和光电倍增管构成,光学谐振腔具有两个输入端和两个输出端,第一输入端和激光光源模块连接,用于接收发射光,第二输入端和样本采集装置连接,用于采集血样信息,两个输出端分别和薄膜压力传感器的输入端和光电倍增管的输入端连接,光电倍增管的输入端和模数转换器的输入端连接,模数转换器的输出端和处理器的输入端连接,处理器将信号经过预处理并输入到阵列信号预处理模块中,经过预处理后的数据是矩阵化的阵列,将阵列输入到模式识别引擎,根据建立的知识库模块进行训练,给出血样光谱的表达,在模式识别过程中不断的对阵列的某一组测试值进行测试;检测箱检测盛放于抗凝管内血样光谱的数据,该识别仪采集200-1750nm波长范围的可见光和近红外光谱,上位机采集大量常见物种的2000个血样的光谱数据,并提供了一套完整详实的光谱数据库,使光谱数据与血样物种之间建立一个关联模型,当检测箱检测数据给出,上位机能够立即给出该血样的物种来源,
该识别仪的识别方法包括基于血液光谱数据对血液来源物种进行识别的方法,
包括如下步骤,
(1)获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱,获取数据的同时采用正则化方法对数据进行预处理;
(2)将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号;
(3)将血样光谱数据分成N组,每组都包含M个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量,分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据,此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据;
(4)对于N组数据中的每一组数据进行操作:将第i组数集中的Mi个样本按照基准样本分割比例随机分层分割,将其中包含样本数量较多的部分作为训练集,较少的部分作为测试集;
(5)对步骤(4)中得到的N个预测模型按照从1到N依次递增的顺序进行操作;
(6)重复循环执行步骤(5),当重复次数达到K次时,或者每个预测模型的所有的Ri,j都大于δ时,就终止步骤(5)的循环迭代过程;
(7)经过步骤(6)之后,得到了N个预测模型,在识别判断一个未知物种来源的血样类别时,让每一个预测模型都对该血样的物种作出一个判断,然后将这N个判断结果进行综合,得出最终的判断;
其中步骤(4)中的基准样本分割比例为,9:1,3:2或1:1,其关键在于,用包含样本数量较多的部分作为训练集,用数量较少的部分作为测试集;
其中步骤(4)流式训练法的流程为:降维滤波方法→模式识别方法,其中的降维滤波方法是:小波分析,主成分分析或随机投影,其中的模式识别方法是:人工神经网络,决策树,支持向量机或贝叶斯分类器;
步骤(5)包括:
第5.1步用流式训练法在第i组训练集上训练出一个识别预测模型Pi
第5.2步用Pi对其余的N-1组数据中的测试集进行预测,得到N-1个识别率,用Ri,j表示Pi对第j组数据的测试集进行预测的识别率;
第5.3步找到Ri,j中的最小值Ri,q=min{Ri,j,j∈(1,N)},从第i组训练集和第q组训练集中随机各自选取m个血样光谱数据进行交换;
其中第5.3步的m取值设置为每组训练集数量的5%-15%;
其中步骤(6)中K的取值设置为10到100范围内的数值,δ的取值设为0.8;
其中步骤(7)中的综合判断方法是:加权投票法,权值根据各个模型的Ri,j确定。
CN201611168355.7A 2016-12-16 2016-12-16 一种基于光谱的血液物种识别仪及识别方法 Active CN107045637B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611168355.7A CN107045637B (zh) 2016-12-16 2016-12-16 一种基于光谱的血液物种识别仪及识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611168355.7A CN107045637B (zh) 2016-12-16 2016-12-16 一种基于光谱的血液物种识别仪及识别方法

Publications (2)

Publication Number Publication Date
CN107045637A CN107045637A (zh) 2017-08-15
CN107045637B true CN107045637B (zh) 2020-07-24

Family

ID=59543860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611168355.7A Active CN107045637B (zh) 2016-12-16 2016-12-16 一种基于光谱的血液物种识别仪及识别方法

Country Status (1)

Country Link
CN (1) CN107045637B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022084993A1 (en) * 2020-10-19 2022-04-28 B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University Rapid and direct identification and determination of urine bacterial susceptibility to antibiotics

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108267571A (zh) * 2017-01-03 2018-07-10 中国医学科学院医学实验动物研究所 一种血液种属判别的方法
CN110057757B (zh) * 2018-01-18 2022-04-26 深圳市理邦精密仪器股份有限公司 血红蛋白及其衍生物的识别、识别网络构建方法及装置
CN109142252A (zh) * 2018-09-29 2019-01-04 重庆迈联医疗科技有限公司 一种模块化的血脂检测仪
CN109738393B (zh) * 2019-01-10 2021-03-05 上海奥普生物医药股份有限公司 光学检测装置及特定蛋白分析仪
CN110554006B (zh) * 2019-09-04 2021-10-19 中国科学技术大学 基于自干涉型微环谐振腔光传感器的多模态测量方法
CN111504207A (zh) * 2020-06-09 2020-08-07 四川九八村信息科技有限公司 一种血细胞离心分层检测系统及方法
CN111603151B (zh) * 2020-06-17 2023-05-16 深圳智领人工智能健康科技有限公司 一种基于时频联合分析的无创血液成分检测方法及系统
CN112364896B (zh) * 2020-10-26 2023-10-24 平安科技(深圳)有限公司 基于机器学习的健康信息分布的确定方法及装置
CN113390814A (zh) * 2021-06-10 2021-09-14 中国工程物理研究院激光聚变研究中心 一种基于超材料光谱仪芯片的智能成分分析系统及方法
CN113604544B (zh) * 2021-08-03 2023-03-10 北京大学口腔医学院 一种生物材料功能预测评价方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103487410B (zh) * 2013-09-01 2015-11-18 西北大学 基于模型集群分析的激光诱导击穿光谱变量选择方法
CN103852446B (zh) * 2014-03-31 2016-05-11 中国医学科学院生物医学工程研究所 一种基于光腔衰荡光谱技术的血液成分识别与分析仪器
CN105095689B (zh) * 2015-07-20 2017-11-17 浙江大学 一种基于韦恩预测的电子鼻数据挖掘方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022084993A1 (en) * 2020-10-19 2022-04-28 B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University Rapid and direct identification and determination of urine bacterial susceptibility to antibiotics

Also Published As

Publication number Publication date
CN107045637A (zh) 2017-08-15

Similar Documents

Publication Publication Date Title
CN107045637B (zh) 一种基于光谱的血液物种识别仪及识别方法
Ortega et al. Detecting brain tumor in pathological slides using hyperspectral imaging
US10043054B2 (en) Methods and systems for classifying biological samples, including optimization of analyses and use of correlation
US11145411B2 (en) System and method for serum based cancer detection
CN111443165B (zh) 一种基于气体传感器与深度学习的气味识别方法
Deshpande et al. A review of microscopic analysis of blood cells for disease detection with AI perspective
Sankaran et al. Detection of huanglongbing disease in citrus using fluorescence spectroscopy
Melo et al. A machine learning application based in random forest for integrating mass spectrometry-based metabolomic data: a simple screening method for patients with zika virus
CN110139702B (zh) 利用基质辅助激光解吸/离子化飞行时间质谱仪进行分类数据操控
WO2011106402A1 (en) Method and system for detecting fluorochromes in a flow cytometer
US11410440B2 (en) Systems and methods for classifying activated T cells
Mu et al. Statistical analysis of a lung cancer spectral histopathology (SHP) data set
Szénási et al. Evaluation and comparison of cell nuclei detection algorithms
Mondol et al. Application of high-throughput screening Raman spectroscopy (HTS-RS) for label-free identification and molecular characterization of Pollen
Britz et al. Spectral-Based Classification of Plant Species Groups and Functional Plant Parts in Managed Permanent Grassland
CN112798678A (zh) 基于血清的新型冠状病毒感染快速检测方法
Barroso et al. Point-of-care using Vis-NIR spectroscopy for white blood cell count analysis
Boldeanu et al. Multi-input convolutional neural networks for automatic pollen classification
CN116130105A (zh) 一种基于神经网络的健康风险预测方法
US20230015076A1 (en) Self-administered, non-invasive, transcutaneous viral detector
Srivastava et al. Diagnosis of sickle cell anemia using AutoML on UV-Vis absorbance spectroscopy data
Boldeanu et al. Automatic pollen classification using convolutional neural networks
Maity et al. Visible spectrum-based classification of malaria blood samples on handheld spectrometer
US10815518B2 (en) Sampler and method of parameterizing of digital circuits and of non-invasive determination of the concentration of several biomarkers simultaneously and in real time
Alexander et al. Machine learning approach for label-free rapid detection and identification of virus using Raman spectra

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant