CN107045637B - 一种基于光谱的血液物种识别仪及识别方法 - Google Patents
一种基于光谱的血液物种识别仪及识别方法 Download PDFInfo
- Publication number
- CN107045637B CN107045637B CN201611168355.7A CN201611168355A CN107045637B CN 107045637 B CN107045637 B CN 107045637B CN 201611168355 A CN201611168355 A CN 201611168355A CN 107045637 B CN107045637 B CN 107045637B
- Authority
- CN
- China
- Prior art keywords
- data
- blood
- spectrum
- blood sample
- species
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 210000004369 blood Anatomy 0.000 title claims abstract description 109
- 239000008280 blood Substances 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000001228 spectrum Methods 0.000 title claims abstract description 46
- 230000003595 spectral effect Effects 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 24
- 239000000523 sample Substances 0.000 claims description 48
- 238000001514 detection method Methods 0.000 claims description 35
- 238000012360 testing method Methods 0.000 claims description 19
- 238000003909 pattern recognition Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000002329 infrared spectrum Methods 0.000 claims description 7
- 230000003287 optical effect Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000012567 pattern recognition method Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000012706 support-vector machine Methods 0.000 claims description 4
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 239000013074 reference sample Substances 0.000 claims description 3
- 238000000411 transmission spectrum Methods 0.000 claims description 3
- 238000001429 visible spectrum Methods 0.000 claims description 3
- 230000010100 anticoagulation Effects 0.000 claims description 2
- 238000013480 data collection Methods 0.000 claims description 2
- 125000004122 cyclic group Chemical group 0.000 abstract 1
- 241000894007 species Species 0.000 description 39
- 239000012503 blood component Substances 0.000 description 12
- 239000000306 component Substances 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000004611 spectroscopical analysis Methods 0.000 description 4
- 238000004497 NIR spectroscopy Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 238000004566 IR spectroscopy Methods 0.000 description 2
- 241000282553 Macaca Species 0.000 description 2
- 241000282567 Macaca fascicularis Species 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 2
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 2
- 240000004718 Panda Species 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 238000002306 biochemical method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000010408 film Substances 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 238000012067 mathematical method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 206010073310 Occupational exposures Diseases 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 241000282453 Ursus americanus Species 0.000 description 1
- 238000012443 analytical study Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 231100000675 occupational exposure Toxicity 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000012306 spectroscopic technique Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000002235 transmission spectroscopy Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/55—Specular reflectivity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/55—Specular reflectivity
- G01N2021/551—Retroreflectance
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/55—Specular reflectivity
- G01N2021/558—Measuring reflectivity and transmission
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明涉及一种基于血液光谱数据对血液来源物种进行识别的方法,可用于血液样品来源物种的快速识别。其实现步骤为:将样本数据集分割为多个具有相对独立性的数据集,为每个数据集训练一个识别模型,通过比较各个数据集识别模型对其他数据集的预测能力,动态调整各个数据集内所包含的样本,通过循环迭代过程,将血样光谱数据中的特征分布去集中化,保证光谱特征信息的广域分布,最后综合多个预测识别模型的预测能力,提升总体模型对血样光谱特征信息的表达能力,进而提升其预测准确率。
Description
技术领域
本发明属于模式识别技术领域,涉及一种基于血液光谱数据对血液来源物种进行识别的方法,可用于血液样品来源物种的快速识别。
背景技术
随着中国医药行业国际化的飞速发展,血液生物材料的出入国境需求日益增加。目前海关对血液来源物种的判断主要依据两方面的信息来源,其一是申报人提供的血样信息,其二是检验机构提供的检验结果,前者的信息真实性难以保证,后者的检验过程则耗时繁多,而且血液样品可能被检测操作污染,或者血液样品自身可能携带致病因子,对检测人员造成职业暴露。因此,尽管生化方法具有很高的检测准确性,但却不便应用于海关等场合,所以,有必要提出一种更便捷的检测方法,相关研究结果表明,光谱检测法具有解决这一问题的潜力。
上世纪70年代,美国杜克大学的Frans F. Jöbsis首次提出了将血液的近红外光谱用于血液成分含量检测的设想,此后,世界各国的研究人员纷纷展开了对血液光谱的分析研究。匈牙利Imre Haynal健康科学大学的István Vályi-Nagy和Éva Gönczöl等人的研究表明红外光谱可用于测定全血和血清中血红蛋白、脂蛋白和血氧等成分的含量,而基于近红外光谱的血糖无创测量则为糖尿病患者带了福音,美国圣地亚国家实验室的M.Kathleen Alam等人发现可以采用近红外光谱测量血液的pH值,日本欧姆龙生命科学研究所有限公司的Toshikazu Shiga等人设计制作了基于红外光谱分析的便携式组织血氧计,中国科学院长春光机所的陈华才等人利用傅里叶变换近红外透射光谱技术,建立了人血清中胆固醇和甘油三酯的定标模型,此外,美国爱荷华大学的Kevin H. Hazen和Mark A.Arnold等用红外光谱对人血清中的总蛋白、球蛋白、白蛋白、甘油三酯、胆固醇、尿素、血糖和乳酸盐等进行了定量分析,并构造了相应的光谱预测模型。随着光谱分析技术的进一步发展,临床化学领域发现,通过分析血液的光谱数据,可以快速辨别类风湿性关节炎和糖尿病的发病情况。
上述各类利用红外光谱检测血液成分含量的研究,均采用了基于生化标定法的研究路线:首先,采集血液的红外光谱;其次,利用生化方法测量血液中目标成分的含量,作为标准含量数据,这就是生化标定步骤;之后,利用数学方法构建血液光谱数据与标准含量数据之间的关联模型;最后,利用该模型和血液光谱数据预测血液中目标成分的含量,实现非接触式的血液成分含量检测。其中所用的数学方法主要是统计分析方法,例如偏最小二乘算法和多元线性回归算法等,随着机器学习理论的发展,越来越多机器学习领域的算法被引入光谱预测模型的构建中,例如人工神经网络和支持向量机等。
上述内容表明,光谱法可以定量地分析血液中的生化成分,这是使用光谱法检测血液来源物种的技术理论基础,而使用光谱法检测血样来源的生物学基础则是物种之间的血液差异。物种是生物界发展的连续性与间断性统一的基本间断形式,在有性生物中,物种呈现为统一的繁殖群体,由占有一定空间,具有实际或潜在繁殖能力的种群所组成,而且与其他这样的群体在生殖上是隔离的。
有研究表明,不同物种的血液成分含量有显著差异。中科院动物研究所的董全等,测定了12只大熊猫的血液成分含量,与小熊猫和美洲黑熊的相同血液数据进行对比,结果发现三个物种的血液成分含量存在显著差异。军事医学科学院实验动物中心的王冬平等,比较了食蟹猴与猕猴的多项血液生理指标和生化指标,发现二者血液成分的多项指标均存在显著差异。综上所述,从理论角度分析,利用光谱技术检测血液来源物种是可行的。
发明内容
本发明的目的在于为了解决上述问题而提供一种既能够对血样来源进行快速检测,又能够对大量不同物种来源的血样进行模式识别的识别仪,检测箱可以检测盛放于抗凝管内血样光谱的数据,该识别仪可以采集200-1750nm波长范围的可见光和近红外光谱,上位机可以采集大量常见物种的2000个血样的光谱数据,并提供了一套完整详实的光谱数据库,使光谱数据与血样物种之间建立一个关联模型,当检测箱检测数据给出,上位机能够立即给出该血样的物种来源,实现快速检测的目的,该模型对随机抽取盲样的识别率可以达到95%,针对后续物种的血样来源检测可定制和改性,改装版本的设备同样适用于物种识别,应用范围广泛。
本发明通过以下技术方案来实现上述目的, 本发明的基于光谱的血液物种识别仪,其特征在于,
包括检测箱和上位机,所述检测箱包括第一发光系统,第一光检测系统,存储器,信号输入/输出系统,
上位机包括血液采集系统,第二发光系统,第二光检测系统,信号预处理系统,阵列信号预处理系统以及模式识别系统。
所述第一、第二发光系统由激光光源模块、第一反射镜、第一透镜构成,所述第一光检测系统由第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件构成,所述第二光检测系统由光学谐振腔、薄膜压力传感器和光电倍增管构成。
本发明的基于光谱的血液物种识别仪的识别方法,其特征在于,包括如下步骤:
(1)获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱。获取数据的同时采用正则化方法对数据进行预处理;
(2)将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就可以组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号;
(3)将血样光谱数据分成组,每组都包含大约个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量。分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据。此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据;
其中步骤(4)中的基准样本分割比例可以选择的比例包括但不限于,9:1,3:2和1:1,其关键在于,用包含样本数量较多的部分作为训练集,用数量较少的部分作为测试集;
其中步骤(4)流式训练法的流程为:降维滤波方法à模式识别方法,其中的降维滤波方法可以是但不限于:小波分析,主成分分析,随机投影。其中的模式识别方法可以是但不限于:人工神经网络,决策树,支持向量机,贝叶斯分类器,聚类法;
步骤(5)包括:
附图说明
图1是血液光谱的物种识别方法示意图。
图2是血液光谱的物种识别仪结构示意图。
图3是本发明中构建逻辑驱动模型的流程图。
图4是本发明将逻辑驱动模型转化为数据驱动模型的演化过程图。
图5是本发明中迭代循环步骤的流程图。
1.电源接口;2.电源开关;3.USB接口;4.WIFI模块接口;5.血样输送口;6. 数据传输装置;7.检测箱;8.上位机;9.显示器;10.血样送检盒;11. 激光光源模块。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示,上位机8的血样送检盒10一次接收12盒送检样品,样本可同时进行血液的光谱采集,其中发光系统由光学谐振腔、薄膜压力传感器和光电倍增管构成,光学谐振腔具有两个输入端和两个输出端,第一输入端和激光光源模块连接,用于接收发射光,第二输入端和样本采集装置连接,用于采集血样信息,两个输出端分别和薄膜压力传感器的输入端和光电倍增管的输入端连接,光电倍增管的输入端和模数转换器的输入端连接,模数转换器的输出端和处理器的输入端连接,处理器将信号经过预处理并输入到阵列信号预处理模块中,经过预处理后的数据是矩阵化的阵列,将阵列输入到模式识别引擎,根据建立的知识库模块进行训练,给出血样光谱的表达,在模式识别过程中不断的对阵列的某一组测试值进行测试。
从逻辑推理的角度分析,如果能得到每个物种血液中每种成分的光谱预测模型,则可以由血液光谱快速得知其血液成分含量,从而推测出血液来源物种的类别。为了设计这个逻辑驱动模型,需要为每个物种血液中的每种成分都建立一个基于生化标定法的光谱预测模型,然后将每个物种的所有光谱预测模型与物种类别相关联,从而建立一个从血液光谱到血液成分含量再到血液来源物种类别的预测模型,如图3所示。
从图3中可以看出,该逻辑驱动模型的输入端是血液光谱数据,输出端是血液来源物种,中间部分则是,基于生化标定法的数学建模过程,和血液成分含量与血液来源物种类别的关联过程。由于需要构建光谱预测模型的血液成分类别非常多,这种逻辑驱动模型的构建难度非常大。受到近年来机器学习和大数据分析领域的发展启示,本实施例用一个黑箱过程来替代逻辑驱动模型中生化标定法建模过程,如图3所示,然后,通过数学建模的方法对黑箱过程进行合理化描述,使其能够根据血液光谱数据预测血液来源物种的类别。
如图2所示,物种识别仪的检测箱7包括激光光源模块,第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件、存储器,信号输入/输出系统,血样通过血样输送口5送入到检测箱7中,打开电源开关2,检测箱开始工作,将所检测数据存储到存储器当中,通过数据传输装置6传输到上位机8当中进行模式识别检测。可以通过有线/无线方式进行数据的传输,为了方便在现场工作,检测箱7配备有USB接口3和WIFI模块接口4。
用数据驱动模型替换逻辑驱动模型的合理性在于,这两种模型的实质都是数学建模过程,从结构形式的角度来看,这两种类同的过程可以彼此趋近。其中逻辑驱动模型实质为数学建模过程的原因为:逻辑驱动模型包含两个过程,第一个过程是根据生化标定法建立血液成分含量的光谱预测模型,这个过程通过统计分析和机器学习领域的数学建模方法实现;第二个过程是建立多个血液成分含量与物种类别的关联模型,该过程需要利用模式识别领域的数学建模方法。因此逻辑驱动模型实质上是多个数学建模过程的组合。
这种数据驱动的血液物种光谱预测模型,将逻辑驱动模型中的繁复的逻辑推理过程简化为一个黑箱,由于这个黑箱中的过程是不可知的,因此需要利用数据处理和数理统计的方法寻找输入与输出之间的关系,也就是寻找血液光谱数据和血液来源物种之间的关系,然后,利用这种关系,来预测任意输入所对应的输出。
在上述数据驱动模型的设计思想指导之下,本方法的实现过程为:
(1)获取数据:获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱。获取数据的同时采用正则化方法对数据进行预处理。
(2)组织数据:将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就可以组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号。
(3)分组数据:将血样光谱数据分成组,每组都包含大约个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量,分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据。此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据。
(4)迭代循环:
1)用流式训练法在第组训练集上训练出一个识别预测模型。其中的流式训练法为:降维滤波方法à模式识别方法。其中降维滤波方法可以包括但不限于:小波分析,主成分分析,随机投影。其中模式识别方法可以包括但不限于:人工神经网络,决策树,支持向量机,贝叶斯分类器,聚类法;
(5)识别判断:经过步骤四的迭代处理,得到了个预测模型,在识别判断一个未知来源的血样物种类别时,可以让每一个预测模型都对该血样的物种给出一个判断,然后将这个判断进行综合,得出最终的判断。其中综合的方法包括但不限于:投票法;加权投票法(权值根据各个模型的确定);如果每个模型的输出结果是概率值,可以求概率的平均值。
本发明方法的变种之一可以是,对光谱中的不同波段分别采用上述实现流程进行处理,最后将多个波段的判断结果进行综合。
本发明方法的变种之二可以是,在迭代循环步骤中不对数据集进行分割,直接在原数据集上进行模型训练,在后续的互相预测阶段,直接用对第组数据整体进行预测识别,也可以得到一个识别率。相当于第组数据集中的训练集和测试集都是其本身。
本发明方法的变种之三可以是,用不同类型的流式训练法得到多个不同的整体预测模型,然后对这些多个整体预测模型的判断结果进行综合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种基于光谱的血液物种识别仪的识别方法,
所述识别仪包括检测箱和上位机,其特征在于,
所述检测箱包括第一发光系统,第一光检测系统,存储器,信号输入/输出系统,
上位机包括血液采集系统,第二发光系统,第二光检测系统,信号预处理系统,阵列信号预处理系统以及模式识别系统,
所述第一、第二发光系统由激光光源模块、第一反射镜、第一透镜构成,所述第一光检测系统由第二透镜、衍射元件、狭缝、第二反射镜、图像拾取器件构成,血样通过血样输送口送入到检测箱中,打开电源开关,检测箱开始工作,将所检测数据存储到存储器当中,通过数据传输装置传输到上位机当中进行模式识别检测,检测箱配备有USB接口和WIFI模块接口,
所述第二光检测系统由光学谐振腔、薄膜压力传感器和光电倍增管构成,光学谐振腔具有两个输入端和两个输出端,第一输入端和激光光源模块连接,用于接收发射光,第二输入端和样本采集装置连接,用于采集血样信息,两个输出端分别和薄膜压力传感器的输入端和光电倍增管的输入端连接,光电倍增管的输入端和模数转换器的输入端连接,模数转换器的输出端和处理器的输入端连接,处理器将信号经过预处理并输入到阵列信号预处理模块中,经过预处理后的数据是矩阵化的阵列,将阵列输入到模式识别引擎,根据建立的知识库模块进行训练,给出血样光谱的表达,在模式识别过程中不断的对阵列的某一组测试值进行测试;检测箱检测盛放于抗凝管内血样光谱的数据,该识别仪采集200-1750nm波长范围的可见光和近红外光谱,上位机采集大量常见物种的2000个血样的光谱数据,并提供了一套完整详实的光谱数据库,使光谱数据与血样物种之间建立一个关联模型,当检测箱检测数据给出,上位机能够立即给出该血样的物种来源,
该识别仪的识别方法包括基于血液光谱数据对血液来源物种进行识别的方法,
包括如下步骤,
(1)获得目标血样的光谱数据,包含可见光谱,近红外光谱,其中每种光谱数据又包含前向和后向散射的光谱,前向散射光谱也称为透射光谱,后向散射光谱也称为反射光谱,获取数据的同时采用正则化方法对数据进行预处理;
(2)将每个血样的光谱串联成一条一维数组,那么多个样本的光谱数据并列在一起,就组成二维数组,该二维数组的两个维度分别是,光谱波长和样本编号;
(3)将血样光谱数据分成N组,每组都包含M个血样光谱数据,各组的血样数量不必完全相同,但是不应相差1.5倍及以上的数量,分组采用分层分组的方式,使得每一组中都包含全部物种类别的血样光谱数据,此外,分组时要考虑光谱数据采集批次,使得不同分组中尽量不包含相同采集批次的血样光谱数据;
(4)对于N组数据中的每一组数据进行操作:将第i组数集中的Mi个样本按照基准样本分割比例随机分层分割,将其中包含样本数量较多的部分作为训练集,较少的部分作为测试集;
(5)对步骤(4)中得到的N个预测模型按照从1到N依次递增的顺序进行操作;
(6)重复循环执行步骤(5),当重复次数达到K次时,或者每个预测模型的所有的Ri,j都大于δ时,就终止步骤(5)的循环迭代过程;
(7)经过步骤(6)之后,得到了N个预测模型,在识别判断一个未知物种来源的血样类别时,让每一个预测模型都对该血样的物种作出一个判断,然后将这N个判断结果进行综合,得出最终的判断;
其中步骤(4)中的基准样本分割比例为,9:1,3:2或1:1,其关键在于,用包含样本数量较多的部分作为训练集,用数量较少的部分作为测试集;
其中步骤(4)流式训练法的流程为:降维滤波方法→模式识别方法,其中的降维滤波方法是:小波分析,主成分分析或随机投影,其中的模式识别方法是:人工神经网络,决策树,支持向量机或贝叶斯分类器;
步骤(5)包括:
第5.1步用流式训练法在第i组训练集上训练出一个识别预测模型Pi;
第5.2步用Pi对其余的N-1组数据中的测试集进行预测,得到N-1个识别率,用Ri,j表示Pi对第j组数据的测试集进行预测的识别率;
第5.3步找到Ri,j中的最小值Ri,q=min{Ri,j,j∈(1,N)},从第i组训练集和第q组训练集中随机各自选取m个血样光谱数据进行交换;
其中第5.3步的m取值设置为每组训练集数量的5%-15%;
其中步骤(6)中K的取值设置为10到100范围内的数值,δ的取值设为0.8;
其中步骤(7)中的综合判断方法是:加权投票法,权值根据各个模型的Ri,j确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611168355.7A CN107045637B (zh) | 2016-12-16 | 2016-12-16 | 一种基于光谱的血液物种识别仪及识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611168355.7A CN107045637B (zh) | 2016-12-16 | 2016-12-16 | 一种基于光谱的血液物种识别仪及识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107045637A CN107045637A (zh) | 2017-08-15 |
CN107045637B true CN107045637B (zh) | 2020-07-24 |
Family
ID=59543860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611168355.7A Active CN107045637B (zh) | 2016-12-16 | 2016-12-16 | 一种基于光谱的血液物种识别仪及识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107045637B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022084993A1 (en) * | 2020-10-19 | 2022-04-28 | B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University | Rapid and direct identification and determination of urine bacterial susceptibility to antibiotics |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108267571A (zh) * | 2017-01-03 | 2018-07-10 | 中国医学科学院医学实验动物研究所 | 一种血液种属判别的方法 |
CN110057757B (zh) * | 2018-01-18 | 2022-04-26 | 深圳市理邦精密仪器股份有限公司 | 血红蛋白及其衍生物的识别、识别网络构建方法及装置 |
CN109142252A (zh) * | 2018-09-29 | 2019-01-04 | 重庆迈联医疗科技有限公司 | 一种模块化的血脂检测仪 |
CN109738393B (zh) * | 2019-01-10 | 2021-03-05 | 上海奥普生物医药股份有限公司 | 光学检测装置及特定蛋白分析仪 |
CN110554006B (zh) * | 2019-09-04 | 2021-10-19 | 中国科学技术大学 | 基于自干涉型微环谐振腔光传感器的多模态测量方法 |
CN111504207A (zh) * | 2020-06-09 | 2020-08-07 | 四川九八村信息科技有限公司 | 一种血细胞离心分层检测系统及方法 |
CN111603151B (zh) * | 2020-06-17 | 2023-05-16 | 深圳智领人工智能健康科技有限公司 | 一种基于时频联合分析的无创血液成分检测方法及系统 |
CN112364896B (zh) * | 2020-10-26 | 2023-10-24 | 平安科技(深圳)有限公司 | 基于机器学习的健康信息分布的确定方法及装置 |
CN113390814A (zh) * | 2021-06-10 | 2021-09-14 | 中国工程物理研究院激光聚变研究中心 | 一种基于超材料光谱仪芯片的智能成分分析系统及方法 |
CN113604544B (zh) * | 2021-08-03 | 2023-03-10 | 北京大学口腔医学院 | 一种生物材料功能预测评价方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103487410B (zh) * | 2013-09-01 | 2015-11-18 | 西北大学 | 基于模型集群分析的激光诱导击穿光谱变量选择方法 |
CN103852446B (zh) * | 2014-03-31 | 2016-05-11 | 中国医学科学院生物医学工程研究所 | 一种基于光腔衰荡光谱技术的血液成分识别与分析仪器 |
CN105095689B (zh) * | 2015-07-20 | 2017-11-17 | 浙江大学 | 一种基于韦恩预测的电子鼻数据挖掘方法 |
-
2016
- 2016-12-16 CN CN201611168355.7A patent/CN107045637B/zh active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022084993A1 (en) * | 2020-10-19 | 2022-04-28 | B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University | Rapid and direct identification and determination of urine bacterial susceptibility to antibiotics |
Also Published As
Publication number | Publication date |
---|---|
CN107045637A (zh) | 2017-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107045637B (zh) | 一种基于光谱的血液物种识别仪及识别方法 | |
Ortega et al. | Detecting brain tumor in pathological slides using hyperspectral imaging | |
US10043054B2 (en) | Methods and systems for classifying biological samples, including optimization of analyses and use of correlation | |
US11145411B2 (en) | System and method for serum based cancer detection | |
CN111443165B (zh) | 一种基于气体传感器与深度学习的气味识别方法 | |
Deshpande et al. | A review of microscopic analysis of blood cells for disease detection with AI perspective | |
Sankaran et al. | Detection of huanglongbing disease in citrus using fluorescence spectroscopy | |
Melo et al. | A machine learning application based in random forest for integrating mass spectrometry-based metabolomic data: a simple screening method for patients with zika virus | |
CN110139702B (zh) | 利用基质辅助激光解吸/离子化飞行时间质谱仪进行分类数据操控 | |
WO2011106402A1 (en) | Method and system for detecting fluorochromes in a flow cytometer | |
US11410440B2 (en) | Systems and methods for classifying activated T cells | |
Mu et al. | Statistical analysis of a lung cancer spectral histopathology (SHP) data set | |
Szénási et al. | Evaluation and comparison of cell nuclei detection algorithms | |
Mondol et al. | Application of high-throughput screening Raman spectroscopy (HTS-RS) for label-free identification and molecular characterization of Pollen | |
Britz et al. | Spectral-Based Classification of Plant Species Groups and Functional Plant Parts in Managed Permanent Grassland | |
CN112798678A (zh) | 基于血清的新型冠状病毒感染快速检测方法 | |
Barroso et al. | Point-of-care using Vis-NIR spectroscopy for white blood cell count analysis | |
Boldeanu et al. | Multi-input convolutional neural networks for automatic pollen classification | |
CN116130105A (zh) | 一种基于神经网络的健康风险预测方法 | |
US20230015076A1 (en) | Self-administered, non-invasive, transcutaneous viral detector | |
Srivastava et al. | Diagnosis of sickle cell anemia using AutoML on UV-Vis absorbance spectroscopy data | |
Boldeanu et al. | Automatic pollen classification using convolutional neural networks | |
Maity et al. | Visible spectrum-based classification of malaria blood samples on handheld spectrometer | |
US10815518B2 (en) | Sampler and method of parameterizing of digital circuits and of non-invasive determination of the concentration of several biomarkers simultaneously and in real time | |
Alexander et al. | Machine learning approach for label-free rapid detection and identification of virus using Raman spectra |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |