CN107045637A - 一种基于光谱的血液物种识别仪及识别方法 - Google Patents

一种基于光谱的血液物种识别仪及识别方法 Download PDF

Info

Publication number
CN107045637A
CN107045637A CN201611168355.7A CN201611168355A CN107045637A CN 107045637 A CN107045637 A CN 107045637A CN 201611168355 A CN201611168355 A CN 201611168355A CN 107045637 A CN107045637 A CN 107045637A
Authority
CN
China
Prior art keywords
blood
spectrum
data
group
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611168355.7A
Other languages
English (en)
Other versions
CN107045637B (zh
Inventor
李宏霄
李迎新
秦川
孙美秀
向志光
王振南
赵晓萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Biomedical Engineering of CAMS and PUMC
Original Assignee
Institute of Biomedical Engineering of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Biomedical Engineering of CAMS and PUMC filed Critical Institute of Biomedical Engineering of CAMS and PUMC
Priority to CN201611168355.7A priority Critical patent/CN107045637B/zh
Publication of CN107045637A publication Critical patent/CN107045637A/zh
Application granted granted Critical
Publication of CN107045637B publication Critical patent/CN107045637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • G01N2021/551Retroreflectance
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • G01N2021/558Measuring reflectivity and transmission
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明涉及一种基于血液光谱数据对血液来源物种进行识别的方法,可用于血液样品来源物种的快速识别。其实现步骤为:将样本数据集分割为多个具有相对独立性的数据集,为每个数据集训练一个识别模型,通过比较各个数据集识别模型对其他数据集的预测能力,动态调整各个数据集内所包含的样本,通过循环迭代过程,将血样光谱数据中的特征分布去集中化,保证光谱特征信息的广域分布,最后综合多个预测识别模型的预测能力,提升总体模型对血样光谱特征信息的表达能力,进而提升其预测准确率。

Description

一种基于光谱的血液物种识别仪及识别方法
技术领域
本发明属于模式识别技术领域,涉及一种基于血液光谱数据对血液来源物种进行识别的方法,可用于血液样品来源物种的快速识别。
背景技术
随着中国医药行业国际化的飞速发展,血液生物材料的出入国境需求日益增加。目前海关对血液来源物种的判断主要依据两方面的信息来源,其一是申报人提供的血样信息,其二是检验机构提供的检验结果,前者的信息真实性难以保证,后者的检验过程则耗时繁多,而且血液样品可能被检测操作污染,或者血液样品自身可能携带致病因子,对检测人员造成职业暴露。因此,尽管生化方法具有很高的检测准确性,但却不便应用于海关等场合,所以,有必要提出一种更便捷的检测方法,相关研究结果表明,光谱检测法具有解决这一问题的潜力。
上世纪70年代,美国杜克大学的Frans F. Jöbsis首次提出了将血液的近红外光谱用于血液成分含量检测的设想,此后,世界各国的研究人员纷纷展开了对血液光谱的分析研究。匈牙利Imre Haynal健康科学大学的István Vályi-Nagy和Éva Gönczöl等人的研究表明红外光谱可用于测定全血和血清中血红蛋白、脂蛋白和血氧等成分的含量,而基于近红外光谱的血糖无创测量则为糖尿病患者带了福音,美国圣地亚国家实验室的M.Kathleen Alam等人发现可以采用近红外光谱测量血液的pH值,日本欧姆龙生命科学研究所有限公司的Toshikazu Shiga等人设计制作了基于红外光谱分析的便携式组织血氧计,中国科学院长春光机所的陈华才等人利用傅里叶变换近红外透射光谱技术,建立了人血清中胆固醇和甘油三酯的定标模型,此外,美国爱荷华大学的Kevin H. Hazen和Mark A.Arnold等用红外光谱对人血清中的总蛋白、球蛋白、白蛋白、甘油三酯、胆固醇、尿素、血糖和乳酸盐等进行了定量分析,并构造了相应的光谱预测模型。随着光谱分析技术的进一步发展,临床化学领域发现,通过分析血液的光谱数据,可以快速辨别类风湿性关节炎和糖尿病的发病情况。
上述各类利用红外光谱检测血液成分含量的研究,均采用了基于生化标定法的研究路线:首先,采集血液的红外光谱;其次,利用生化方法测量血液中目标成分的含量,作为标准含量数据,这就是生化标定步骤;之后,利用数学方法构建血液光谱数据与标准含量数据之间的关联模型;最后,利用该模型和血液光谱数据预测血液中目标成分的含量,实现非接触式的血液成分含量检测。其中所用的数学方法主要是统计分析方法,例如偏最小二乘算法和多元线性回归算法等,随着机器学习理论的发展,越来越多机器学习领域的算法被引入光谱预测模型的构建中,例如人工神经网络和支持向量机等。
上述内容表明,光谱法可以定量地分析血液中的生化成分,这是使用光谱法检测血液来源物种的技术理论基础,而使用光谱法检测血样来源的生物学基础则是物种之间的血液差异。物种是生物界发展的连续性与间断性统一的基本间断形式,在有性生物中,物种呈现为统一的繁殖群体,由占有一定空间,具有实际或潜在繁殖能力的种群所组成,而且与其他这样的群体在生殖上是隔离的。
有研究表明,不同物种的血液成分含量有显著差异。中科院动物研究所的董全等,测定了12只大熊猫的血液成分含量,与小熊猫和美洲黑熊的相同血液数据进行对比,结果发现三个物种的血液成分含量存在显著差异。军事医学科学院实验动物中心的王冬平等,比较了食蟹猴与猕猴的多项血液生理指标和生化指标,发现二者血液成分的多项指标均存在显著差异。综上所述,从理论角度分析,利用光谱技术检测血液来源物种是可行的。
发明内容
本发明的目的在于为了解决上述问题而提供一种既能够对血样来源进行快速检测,又能够对大量不同物种来源的血样进行模式识别的识别仪,检测箱可以检测盛放于抗凝管内血样光谱的数据,该识别仪可以采集200-1750nm波长范围的可见光和近红外光谱,上位机可以采集大量常见物种的2000个血样的光谱数据,并提供了一套完整详实的光谱数据库,使光谱数据与血样物种之间建立一个关联模型,当检测箱检测数据给出,上位机能够立即给出该血样的物种来源,实现快速检测的目的,该模型对随机抽取盲样的识别率可以达到95%,针对后续物种的血样来源检测可定制和改性,改装版本的设备同样适用于物种识别,应用范围广泛。
本发明通过以下技术方案来实现上述目的, 本发明的基于光谱的血液物种识别仪,其特征在于,
包括检测箱和上位机,所述检测箱包括第一发光系统,第一光检测系统,存储器,信号输入/输出系统,
上位机包括血液采集系统,第二发光系统,第二光检测系统,信号预处理系统,阵列信号预处理系统以及模式识别系统。
所述第一、第二发光系统由激光光源模块、第一反射镜、第一透镜构成,所述第一光检测系统由第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件构成,所述第二光检测系统由光学谐振腔、薄膜压力传感器和光电倍增管构成。
本发明的基于光谱的血液物种识别仪的识别方法,其特征在于,包括如下步骤:
(1)获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱。获取数据的同时采用正则化方法对数据进行预处理;
(2)将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就可以组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号;
(3)将血样光谱数据分成组,每组都包含大约个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量。分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据。此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据;
(4)对于组数据中的每一组数据进行操作:将第组数据集中的个样本按照基准样本分割比例随机分层分割,将其中包含样本数量较多的部分作为训练集,较少的部分作为测试集;
(5)对步骤(4)中得到的个预测模型按照从1到依次递增的顺序进行操作;
(6)重复循环执行步骤(5)。当重复次数达到次时,或者每个预测模型的所有的都大于时,就终止步骤(5)的循环迭代过程;
(7)经过步骤(6)之后,可以得到了个预测模型,在识别判断一个未知物种来源的血样类别时,可以让每一个预测模型都对该血样的物种作出一个判断,然后将这个判断结果进行综合,得出最终的判断;
其中步骤(4)中的基准样本分割比例可以选择的比例包括但不限于,9:1,3:2和1:1,其关键在于,用包含样本数量较多的部分作为训练集,用数量较少的部分作为测试集;
其中步骤(4)流式训练法的流程为:降维滤波方法à模式识别方法,其中的降维滤波方法可以是但不限于:小波分析,主成分分析,随机投影。其中的模式识别方法可以是但不限于:人工神经网络,决策树,支持向量机,贝叶斯分类器,聚类法;
步骤(5)包括:
第5.1步用流式训练法在第组训练集上训练出一个识别预测模型
第5.2步用对其余的组数据中的测试集进行预测,得到个识别率,用表示对第组数据的测试集进行预测的识别率;
第5.3步找到中的最小值,从第组训练集和第组训练集中随机各自选取个血样光谱数据进行交换。
其中第5.2步的取值可以设置为每组训练集数量的5%-15%。
其中步骤(6)中的取值可以设置为10到100范围内的数值,的取值可以设为0.8,或者根据需要设为更高。
其中步骤(7)中的综合判断方法可以是但不限于:投票法;加权投票法(权值根据各个模型的确定);如果每个模型的输出结果是概率值,则求概率的平均值。
附图说明
图1是血液光谱的物种识别方法示意图。
图2是血液光谱的物种识别仪结构示意图。
图3是本发明中构建逻辑驱动模型的流程图。
图4是本发明将逻辑驱动模型转化为数据驱动模型的演化过程图。
图5是本发明中迭代循环步骤的流程图。
1.电源接口;2.电源开关;3.USB接口;4.WIFI模块接口;5.血样输送口;6. 数据传输装置;7.检测箱;8.上位机;9.显示器;10.血样送检盒;11. 激光光源模块。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示,上位机8的血样送检盒10一次接收12盒送检样品,样本可同时进行血液的光谱采集,其中发光系统由光学谐振腔、薄膜压力传感器和光电倍增管构成,光学谐振腔具有两个输入端和两个输出端,第一输入端和激光光源模块连接,用于接收发射光,第二输入端和样本采集装置连接,用于采集血样信息,两个输出端分别和薄膜压力传感器的输入端和光电倍增管的输入端连接,光电倍增管的输入端和模数转换器的输入端连接,模数转换器的输出端和处理器的输入端连接,处理器将信号经过预处理并输入到阵列信号预处理模块中,经过预处理后的数据是矩阵化的阵列,将阵列输入到模式识别引擎,根据建立的知识库模块进行训练,给出血样光谱的表达,在模式识别过程中不断的对阵列的某一组测试值进行测试。
从逻辑推理的角度分析,如果能得到每个物种血液中每种成分的光谱预测模型,则可以由血液光谱快速得知其血液成分含量,从而推测出血液来源物种的类别。为了设计这个逻辑驱动模型,需要为每个物种血液中的每种成分都建立一个基于生化标定法的光谱预测模型,然后将每个物种的所有光谱预测模型与物种类别相关联,从而建立一个从血液光谱到血液成分含量再到血液来源物种类别的预测模型,如图3所示。
从图3中可以看出,该逻辑驱动模型的输入端是血液光谱数据,输出端是血液来源物种,中间部分则是,基于生化标定法的数学建模过程,和血液成分含量与血液来源物种类别的关联过程。由于需要构建光谱预测模型的血液成分类别非常多,这种逻辑驱动模型的构建难度非常大。受到近年来机器学习和大数据分析领域的发展启示,本实施例用一个黑箱过程来替代逻辑驱动模型中生化标定法建模过程,如图3所示,然后,通过数学建模的方法对黑箱过程进行合理化描述,使其能够根据血液光谱数据预测血液来源物种的类别。
如图2所示,物种识别仪的检测箱7包括激光光源模块,第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件、存储器,信号输入/输出系统,血样通过血样输送口5送入到检测箱7中,打开电源开关2,检测箱开始工作,将所检测数据存储到存储器当中,通过数据传输装置6传输到上位机8当中进行模式识别检测。可以通过有线/无线方式进行数据的传输,为了方便在现场工作,检测箱7配备有USB接口3和WIFI模块接口4。
用数据驱动模型替换逻辑驱动模型的合理性在于,这两种模型的实质都是数学建模过程,从结构形式的角度来看,这两种类同的过程可以彼此趋近。其中逻辑驱动模型实质为数学建模过程的原因为:逻辑驱动模型包含两个过程,第一个过程是根据生化标定法建立血液成分含量的光谱预测模型,这个过程通过统计分析和机器学习领域的数学建模方法实现;第二个过程是建立多个血液成分含量与物种类别的关联模型,该过程需要利用模式识别领域的数学建模方法。因此逻辑驱动模型实质上是多个数学建模过程的组合。
这种数据驱动的血液物种光谱预测模型,将逻辑驱动模型中的繁复的逻辑推理过程简化为一个黑箱,由于这个黑箱中的过程是不可知的,因此需要利用数据处理和数理统计的方法寻找输入与输出之间的关系,也就是寻找血液光谱数据和血液来源物种之间的关系,然后,利用这种关系,来预测任意输入所对应的输出。
在上述数据驱动模型的设计思想指导之下,本方法的实现过程为:
(1)获取数据:获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱。获取数据的同时采用正则化方法对数据进行预处理。
(2)组织数据:将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就可以组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号。
(3)分组数据:将血样光谱数据分成组,每组都包含大约个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量,分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据。此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据。
(4)迭代循环:
4.1对于组数据集中的每一组数据集进行操作:将第组数据集中的个样本随机分层分割为9:1,这个比例称为基准样本分割比例,其中包含样本数量较多的部分作为训练集,较少的部分作为测试集;
4.2对于组数据集,从第1组数据集到第组数据集进行如下操作:
1)用流式训练法在第组训练集上训练出一个识别预测模型。其中的流式训练法为:降维滤波方法à模式识别方法。其中降维滤波方法可以包括但不限于:小波分析,主成分分析,随机投影。其中模式识别方法可以包括但不限于:人工神经网络,决策树,支持向量机,贝叶斯分类器,聚类法;
2)用对其余的组数据中的测试集进行预测,得到个识别率,用表示对第组数据的测试集进行预测的识别率;
3)找到中的最小值,随机交换第组训练集和第组训练集中个血样光谱数据,的取值可以设置为每组训练集数量的5%-15%;
4.3重复步骤4.2进行迭代循环,直到满足条件:(1)步骤2重复了次,或者(2)所有的都大于的取值可以根据需要确定,例如0.8或者更高。
(5)识别判断:经过步骤四的迭代处理,得到了个预测模型,在识别判断一个未知来源的血样物种类别时,可以让每一个预测模型都对该血样的物种给出一个判断,然后将这个判断进行综合,得出最终的判断。其中综合的方法包括但不限于:投票法;加权投票法(权值根据各个模型的确定);如果每个模型的输出结果是概率值,可以求概率的平均值。
本发明方法的变种之一可以是,对光谱中的不同波段分别采用上述实现流程进行处理,最后将多个波段的判断结果进行综合。
本发明方法的变种之二可以是,在迭代循环步骤中不对数据集进行分割,直接在原数据集上进行模型训练,在后续的互相预测阶段,直接用对第组数据整体进行预测识别,也可以得到一个识别率。相当于第组数据集中的训练集和测试集都是其本身。
本发明方法的变种之三可以是,用不同类型的流式训练法得到多个不同的整体预测模型,然后对这些多个整体预测模型的判断结果进行综合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于光谱的血液物种识别仪,其特征在于,
包括检测箱和上位机,
所述检测箱包括第一发光系统,第一光检测系统,存储器,信号输入/输出系统,
上位机包括血液采集系统,第二发光系统,第二光检测系统,信号预处理系统,阵列信号预处理系统以及模式识别系统。
2.根据权利要求1所述的一种基于光谱的血液物种识别仪,其特征在于,
所述第一、第二发光系统由激光光源模块、第一反射镜、第一透镜构成,所述第一光检测系统由第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件构成,
所述第二发光检测系统由光学谐振腔、薄膜压力传感器和光电倍增管构成。
3.一种基于上述权利要求1或2所述的基于光谱的血液物种识别仪的识别方法,包括基于血液光谱数据对血液来源物种进行识别的方法,其特征在于,包括如下步骤,
(1)获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱;获取数据的同时采用正则化方法对数据进行预处理;
(2)将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就可以组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号;
(3)将血样光谱数据分成组,每组都包含大约个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量,分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据;此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据;
(4)对于组数据中的每一组数据进行操作:将第组数据集中的个样本按照基准样本分割比例随机分层分割,将其中包含样本数量较多的部分作为训练集,较少的部分作为测试集;
(5)对步骤(4)中得到的个预测模型按照从1到依次递增的顺序进行操作;
(6)重复循环执行步骤(5);当重复次数达到次时,或者每个预测模型的所有的都大于时,就终止步骤(5)的循环迭代过程;
(7)经过步骤(6)之后,可以得到了个预测模型,在识别判断一个未知物种来源的血样类别时,可以让每一个预测模型都对该血样的物种作出一个判断,然后将这个判断结果进行综合,得出最终的判断。
4.根据权利要求3所述的方法,其特征在于,
其中步骤(4)中的基准样本分割比例可以选择的比例包括但不限于,9:1,3:2和1:1,其关键在于,用包含样本数量较多的部分作为训练集,用数量较少的部分作为测试集。
5.根据权利要求3所述的方法,其特征在于,
其中步骤(4)流式训练法的流程为:降维滤波方法à模式识别方法,其中的降维滤波方法可以是但不限于:小波分析,主成分分析,随机投影,其中的模式识别方法可以是但不限于:人工神经网络,决策树,支持向量机,贝叶斯分类器,聚类法。
6.根据权利要求3所述的方法,其特征在于,步骤(5)包括:
第5.1步用流式训练法在第组训练集上训练出一个识别预测模型
第5.2步用对其余的组数据中的测试集进行预测,得到个识别率,用表示对第组数据的测试集进行预测的识别率;
第5.3步找到中的最小值,从第组训练集和第组训练集中随机各自选取个血样光谱数据进行交换。
7.根据权利要求6所述的方法,其特征在于,其中第5.2步的取值可以设置为每组训练集数量的5%-15%。
8.根据权利要求6所述的方法,其特征在于,其中步骤(6)中的取值可以设置为10到100范围内的数值,的取值可以设为0.8,或者根据需要设为更高。
9.根据权利要求6所述的方法,其特征在于,其中步骤(7)中的综合判断方法可以是但不限于:投票法;加权投票法(权值根据各个模型的确定);如果每个模型的输出结果是概率值,则求概率的平均值。
CN201611168355.7A 2016-12-16 2016-12-16 一种基于光谱的血液物种识别仪及识别方法 Active CN107045637B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611168355.7A CN107045637B (zh) 2016-12-16 2016-12-16 一种基于光谱的血液物种识别仪及识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611168355.7A CN107045637B (zh) 2016-12-16 2016-12-16 一种基于光谱的血液物种识别仪及识别方法

Publications (2)

Publication Number Publication Date
CN107045637A true CN107045637A (zh) 2017-08-15
CN107045637B CN107045637B (zh) 2020-07-24

Family

ID=59543860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611168355.7A Active CN107045637B (zh) 2016-12-16 2016-12-16 一种基于光谱的血液物种识别仪及识别方法

Country Status (1)

Country Link
CN (1) CN107045637B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108267571A (zh) * 2017-01-03 2018-07-10 中国医学科学院医学实验动物研究所 一种血液种属判别的方法
CN109142252A (zh) * 2018-09-29 2019-01-04 重庆迈联医疗科技有限公司 一种模块化的血脂检测仪
CN109738393A (zh) * 2019-01-10 2019-05-10 上海奥普生物医药有限公司 光学检测装置及特定蛋白分析仪
CN110057757A (zh) * 2018-01-18 2019-07-26 深圳市理邦精密仪器股份有限公司 血红蛋白及其衍生物的识别、识别网络构建方法及装置
CN110554006A (zh) * 2019-09-04 2019-12-10 中国科学技术大学 基于自干涉微环谐振腔传感器的多模态测量方法
CN111504207A (zh) * 2020-06-09 2020-08-07 四川九八村信息科技有限公司 一种血细胞离心分层检测系统及方法
CN111603151A (zh) * 2020-06-17 2020-09-01 中国医学科学院生物医学工程研究所 一种基于时频联合分析的无创血液成分检测方法及系统
CN112364896A (zh) * 2020-10-26 2021-02-12 平安科技(深圳)有限公司 基于机器学习的健康信息分布的确定方法及装置
CN113390814A (zh) * 2021-06-10 2021-09-14 中国工程物理研究院激光聚变研究中心 一种基于超材料光谱仪芯片的智能成分分析系统及方法
CN113604544A (zh) * 2021-08-03 2021-11-05 北京大学口腔医学院 一种生物材料功能预测评价方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4229651A1 (en) * 2020-10-19 2023-08-23 B.G. Negev Technologies And Applications Ltd., At Ben-Gurion University Rapid and direct identification and determination of urine bacterial susceptibility to antibiotics

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103487410A (zh) * 2013-09-01 2014-01-01 西北大学 基于模型集群分析的激光诱导击穿光谱变量选择方法
CN103852446A (zh) * 2014-03-31 2014-06-11 中国医学科学院生物医学工程研究所 一种基于光腔衰荡光谱技术的血液成分识别与分析仪器
CN105095689A (zh) * 2015-07-20 2015-11-25 浙江大学 一种基于韦恩预测的电子鼻数据挖掘方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103487410A (zh) * 2013-09-01 2014-01-01 西北大学 基于模型集群分析的激光诱导击穿光谱变量选择方法
CN103852446A (zh) * 2014-03-31 2014-06-11 中国医学科学院生物医学工程研究所 一种基于光腔衰荡光谱技术的血液成分识别与分析仪器
CN105095689A (zh) * 2015-07-20 2015-11-25 浙江大学 一种基于韦恩预测的电子鼻数据挖掘方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LINNA ZHANG ET AL.: "《Blood species identification using Near-Infrared diffuse transmitted spectra and PLS-DA method》", 《INFRARED PHYSICS & TECHNOLOGY》 *
LINNA ZHANG ET AL: "《Optimal wavelength selection for visible diffuse reflectance spectroscopy discriminating human and nonhuman blood species》", 《THE ROYAL SOCIETY OF CHEMISTRY》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108267571A (zh) * 2017-01-03 2018-07-10 中国医学科学院医学实验动物研究所 一种血液种属判别的方法
CN110057757A (zh) * 2018-01-18 2019-07-26 深圳市理邦精密仪器股份有限公司 血红蛋白及其衍生物的识别、识别网络构建方法及装置
CN109142252A (zh) * 2018-09-29 2019-01-04 重庆迈联医疗科技有限公司 一种模块化的血脂检测仪
CN109738393A (zh) * 2019-01-10 2019-05-10 上海奥普生物医药有限公司 光学检测装置及特定蛋白分析仪
CN110554006B (zh) * 2019-09-04 2021-10-19 中国科学技术大学 基于自干涉型微环谐振腔光传感器的多模态测量方法
CN110554006A (zh) * 2019-09-04 2019-12-10 中国科学技术大学 基于自干涉微环谐振腔传感器的多模态测量方法
CN111504207A (zh) * 2020-06-09 2020-08-07 四川九八村信息科技有限公司 一种血细胞离心分层检测系统及方法
CN111603151A (zh) * 2020-06-17 2020-09-01 中国医学科学院生物医学工程研究所 一种基于时频联合分析的无创血液成分检测方法及系统
CN111603151B (zh) * 2020-06-17 2023-05-16 深圳智领人工智能健康科技有限公司 一种基于时频联合分析的无创血液成分检测方法及系统
CN112364896A (zh) * 2020-10-26 2021-02-12 平安科技(深圳)有限公司 基于机器学习的健康信息分布的确定方法及装置
CN112364896B (zh) * 2020-10-26 2023-10-24 平安科技(深圳)有限公司 基于机器学习的健康信息分布的确定方法及装置
CN113390814A (zh) * 2021-06-10 2021-09-14 中国工程物理研究院激光聚变研究中心 一种基于超材料光谱仪芯片的智能成分分析系统及方法
CN113604544A (zh) * 2021-08-03 2021-11-05 北京大学口腔医学院 一种生物材料功能预测评价方法
CN113604544B (zh) * 2021-08-03 2023-03-10 北京大学口腔医学院 一种生物材料功能预测评价方法

Also Published As

Publication number Publication date
CN107045637B (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
CN107045637A (zh) 一种基于光谱的血液物种识别仪及识别方法
Ortega et al. Detecting brain tumor in pathological slides using hyperspectral imaging
CN103278464B (zh) 鱼肉检测方法和装置
US11145411B2 (en) System and method for serum based cancer detection
CN101167101A (zh) 自动图像分析
US20110028808A1 (en) Method and apparatus for examination of cancer, systemic lupus erythematosus (sle), or antiphospholipid antibody syndrome using near-infrared light
CN106706546A (zh) 一种基于红外和拉曼光谱数据的人工智能学习物质分析方法
Huang et al. Blood species identification based on deep learning analysis of Raman spectra
Gencturk et al. Detection of hazelnut varieties and development of mobile application with CNN data fusion feature reduction-based models
US20220180515A1 (en) Artificial intelligence enabled reagent-free imaging hematology analyzer
Nagadeepa et al. Artificial intelligence based cervical cancer risk prediction using m1 algorithms
US10235495B2 (en) Method for analysis and interpretation of flow cytometry data
CN114847875A (zh) 多动症的功能性近红外光谱和红外热像的识别方法
CN116130105A (zh) 一种基于神经网络的健康风险预测方法
CN109668842A (zh) 一种贝类重金属污染快速检测方法
Liang et al. Frequency comb and machine learning-based breath analysis for COVID-19 classification
US8233960B2 (en) Method and device for diagnosing chronic fatigue syndrome (CFS) by using near infrared spectrum
Srivastava et al. Diagnosis of sickle cell anemia using AutoML on UV-Vis absorbance spectroscopy data
Maity et al. Visible spectrum-based classification of malaria blood samples on handheld spectrometer
Mekonnen et al. Classification of near-infrared spectroscopic glucose concentrations using convolutional neural network
CN113033330A (zh) 一种基于轻型卷积神经网络的舌体姿态异常判别方法
US10815518B2 (en) Sampler and method of parameterizing of digital circuits and of non-invasive determination of the concentration of several biomarkers simultaneously and in real time
CN115240000B (zh) 一种用于法医鉴定的糖尿病检测装置及方法
Liu et al. FES-RF: A Feature Ensemble Selection Based Random Forest Method For Accurate Cancer Screening
CN116952807A (zh) 辅助诊断方法及其生物样本分析方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant