CN110057757B - 血红蛋白及其衍生物的识别、识别网络构建方法及装置 - Google Patents

血红蛋白及其衍生物的识别、识别网络构建方法及装置 Download PDF

Info

Publication number
CN110057757B
CN110057757B CN201810048392.7A CN201810048392A CN110057757B CN 110057757 B CN110057757 B CN 110057757B CN 201810048392 A CN201810048392 A CN 201810048392A CN 110057757 B CN110057757 B CN 110057757B
Authority
CN
China
Prior art keywords
hemoglobin
derivatives
training
sample
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810048392.7A
Other languages
English (en)
Other versions
CN110057757A (zh
Inventor
陈智伟
谢瑛瑛
王林泠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Edan Instruments Inc
Original Assignee
Edan Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Edan Instruments Inc filed Critical Edan Instruments Inc
Priority to CN201810048392.7A priority Critical patent/CN110057757B/zh
Publication of CN110057757A publication Critical patent/CN110057757A/zh
Application granted granted Critical
Publication of CN110057757B publication Critical patent/CN110057757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N2021/3196Correlating located peaks in spectrum with reference data, e.g. fingerprint data

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明涉及了一种血红蛋白及其衍生物的识别、识别网络构建方法及装置,所述血红蛋白及其衍生物的识别网络构建方法包括:获取具有不同血红蛋白衍生物浓度的多个训练样本;由多个训练样本对应获得多个特征序列;分别进行多个所述特征序列的降维处理;根据多个所述训练样本的血红蛋白衍生物浓度以及降维处理后的特征序列进行模型训练,通过训练得到的识别模型构建血红蛋白及其衍生物的识别网络。采用本发明解决了现有技术中血红蛋白及其衍生物的识别过于复杂的问题。

Description

血红蛋白及其衍生物的识别、识别网络构建方法及装置
技术领域
本发明涉及生化医学技术领域,尤其涉及一种血红蛋白及其衍生物的识别、识别网络构建方法及装置。
背景技术
血红蛋白是高等生物体内的一种蛋白质,血红蛋白及其衍生物在高等生物体内具备各种不同的特性。
例如,血红蛋白在氧含量高的地方,易与氧结合形成氧合血红蛋白,而在氧含量低的地方,易与氧分离形成脱氧血红蛋白,该特性使血红蛋白及其衍生物在高等生物体中具有运输氧的功能。此外,血红蛋白还易与一氧化碳结合形成碳氧血红蛋白,由此将导致煤气中毒;或者,高铁血红蛋白在人体中的生理含量占总血红蛋白的1%,能够用于诊断高铁血红蛋白症患。
目前,血红蛋白通常是由氰化高铁血红蛋白法进行测定,即,通过氰化钾试剂将血红蛋白及其衍生物全部转化为氰化高铁血红蛋白,再进一步地进行识别。由于氰化钾剧毒,使得该种方法对化学试剂的使用安全要求较高,不适用于安全条件较低的测量环境。
而血红蛋白衍生物的测定是首先制备血红蛋白衍生物样本,进行光谱吸收曲线的绘制,再将该血红蛋白衍生物样本进行纯水稀释,并以此进一步地计算血红蛋白衍生物浓度。上述方法不仅操作较为繁琐,测定过程耗时较长,导致识别效率较低,而且还会因为稀释处理造成操作误差,进而影响识别准确率。
由上可知,现有技术中血红蛋白及其衍生物的识别仍存在过于复杂的局限性。
发明内容
为了解决上述技术问题,本发明的一个目的在于提供一种血红蛋白及其衍生物的识别、识别网络构建方法及装置。
其中,本发明所采用的技术方案为:
一种血红蛋白及其衍生物的识别网络构建方法,包括:获取具有不同血红蛋白衍生物浓度的多个训练样本;由多个训练样本对应获得多个特征序列;分别进行多个所述特征序列的降维处理;根据多个所述训练样本的血红蛋白衍生物浓度以及降维处理后的特征序列进行模型训练,通过训练得到的识别模型构建血红蛋白及其衍生物的识别网络。
一种血红蛋白及其衍生物的识别方法,包括:获取待测样本的特征序列;进行所述特征序列的降维处理;将降维处理后的特征序列输入至血红蛋白及其衍生物的识别网络中进行预测,得到所述待测样本中血红蛋白衍生物浓度,通过所述血红蛋白衍生物浓度对所述待测样本中血红蛋白及其衍生物进行识别。
一种血红蛋白及其衍生物的识别网络构建装置,包括:训练样本获取模块,用于获取具有不同血红蛋白衍生物浓度的多个训练样本;特征序列获取模块,用于由多个训练样本对应获得多个特征序列;特征序列降维模块,用于分别进行多个所述特征序列的降维处理;模型训练模块,用于根据多个所述训练样本的血红蛋白衍生物浓度以及降维处理后的特征序列进行模型训练,通过训练得到的识别模型构建血红蛋白及其衍生物的识别网络。
一种血红蛋白及其衍生物的识别装置,包括:特征序列获取模块,用于获取待测样本的特征序列;特征序列降维模块,用于进行所述特征序列的降维处理;样本识别模块,用于将降维处理后的特征序列输入至血红蛋白及其衍生物的识别网络中进行预测,得到所述待测样本中血红蛋白衍生物浓度,通过所述血红蛋白衍生物浓度对所述待测样本中血红蛋白及其衍生物进行识别。
一种血红蛋白及其衍生物的识别装置,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。
在上述技术方案中,以识别网络构建的方式实现特征序列与血红蛋白衍生物浓度之间的映射,以此解决现有技术中血红蛋白及其衍生物的识别过于复杂的问题。
具体地,获取具有不同血红蛋白衍生物浓度的多个训练样本,由多个训练样本对应获得多个特征序列,进而分别进行多个特征序列的降维处理,并以此进行模型训练,最终实现血红蛋白及其衍生物的识别网络的构建,由此,只要获得待测样本的特征序列,便能够输入至该识别网络中进行预测,从而得到待测样本中血红蛋白衍生物浓度,进而根据血红蛋白衍生物浓度对待测样品中血红蛋白及其衍生物加以识别,简单快捷。
此外,通过特征序列的降维处理,有利于降低模型训练的复杂度,提高模型训练的效率,进一步保障了血红蛋白及其衍生物识别的简单快捷。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种血红蛋白及其衍生物的识别方法的流程图。
图2是根据一示例性实施例示出的血红蛋白及其衍生物的识别装置的原理框图。
图3是根据一示例性实施例示出的一种血红蛋白及其衍生物的识别网络构建方法的流程图。
图4是图3对应实施例中步骤210在一个实施例的流程图。
图5是图3对应实施例中步骤230在一个实施例的流程图。
图6是根据一示例性实施例示出的对光谱数据进行降噪处理的示意图。
图7是图3对应实施例中步骤270在一个实施例的流程图。
图8是根据一示例性实施例示出的识别网络的可视化效果示意图。
图9是图5对应实施例中步骤233在一个实施例的流程图。
图10是图3对应实施例中步骤250在一个实施例的流程图。
图11是根据一示例性实施例示出的一种血红蛋白及其衍生物的识别网络构建装置的框图。
图12是根据一示例性实施例示出的一种血红蛋白及其衍生物的识别装置的框图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
请参阅图1,在一示例性实施例中,一种血红蛋白及其衍生物的识别方法可以包括以下步骤:
步骤110,获取待测样本的特征序列。
步骤130,进行特征序列的降维处理。
步骤150,将降维处理后的特征序列输入至血红蛋白及其衍生物的识别网络中进行预测,得到待测样本中血红蛋白衍生物浓度,通过血红蛋白衍生物浓度对待测样本进行识别。
上述过程中,基于血红蛋白及其衍生物的识别网络,只要获得待测样本的特征序列,便能够输入至该识别网络中进行预测,从而得到待测样本中血红蛋白衍生物浓度。
也可以理解为,通过识别网络的构建,在特征序列与血红蛋白衍生物浓度之间建立了映射关系,由此,便能够根据建立的映射关系实现对待测样本所携带血红蛋白及其衍生物的识别。
图2是根据一示例性实施例示出的血红蛋白及其衍生物的识别装置的原理框图。可以理解,图2所示的结构仅为示意,血红蛋白及其衍生物的识别装置还可包括比图2中所示更多或更少的组件,或者具有与图2所示不同的组件。图2中所示的各组件可以采用硬件、软件或者其组合来实现。
如图2所示,血红蛋白及其衍生物的识别装置300包括但不限于:电源模块301、光源306、测试卡304、光谱仪307、MCU处理器309以及存储器312。
其中,电源模块301用于为所述装置300供电,供电方式可以是电池组(例如锂电池组)供电,也可以是交流电压(例如220V)供电,在此不进行限定。
在所述装置300上电之后,由测试卡304进行待测样品的吸入以形成待测样本,利用光源306(例如LED灯)对待测样品进行光照形成透射光信号,进一步由光谱仪307对透射光信号在指定波长范围内进行光谱数据采集,并将采集得到的多个光谱数据发送至MCU处理器309。
在MCU处理器309接收到待测样本对应的多个光谱数据之后,便读取存储在存储器312中的计算机可读指令,并执行该计算机可读指令以此实现血红蛋白及其衍生物的识别方法。
其中,存储器312可以是闪存(例如串行flash)、只读存储器、随机存储器、硬盘、光盘或者其它固态存储器,存储方式可以是短暂存储或者永久存储,在此不加以限定。
应当说明的是,在不同的应用场景中,光谱仪307还可以由分光光度计或者其它具有同等功能的测量元器件替代,在此不进行限定。
进一步地,血红蛋白及其衍生物的识别装置300还包括提供辅助功能的外围电路。
其中,该外围电路包括但不限于:
超声模块302,用于对待测样本进行充分地溶血,以使血细胞破碎,进而有利于血红蛋白及其衍生物的识别。
控温模块303,用于调节所述装置300内的温度保持在30℃~41℃之间。
检测电路305,用于对测试卡304的工作状态进行监控,例如,监控测试卡304是否接触良好、监控测试卡304是否有效、监控测试卡304是否正常工作等等。
光源驱动模块308,用于为光源306提供单独且稳定的小额电流,例如,光源306为LED灯时,该小额电流不超过0.01mA。
检测与保护电路310,用于对所述装置300的工作状态进行保护,例如,在测试卡304异常插拔,或者测试卡304异常工作、或者供电不足时,生成用户警告消息,以此提示用户所述装置300的工作状态处于异常运行状态。
指示灯314,用于提示所述装置300是否正常运行。例如,指示灯314闪烁绿光表示所述装置300正常运行,指示灯314闪烁红光则表示所述装置300异常运行。
此外,所述装置300还提供各种外设接口,包括但不限于:用于与其它设备通讯的RS232串口313、USB接口、或者用于调试和程序下载的JTAG接口315等等。
下面针对血红蛋白及其衍生物的识别网络的构建过程进行详细地说明。
请参阅图3,在一示例性实施例中,一种血红蛋白及其衍生物的识别网络构建方法可以包括以下步骤:
步骤210,获取具有不同血红蛋白衍生物浓度的多个训练样本。
为了构建血红蛋白及其衍生物的识别网络,需要得到进行血红蛋白及其衍生物识别的识别模型,训练样本则是识别模型的训练基础。通过获取大量的训练样本才能够得到较为准确的识别模型,并以此构建适用于血红蛋白及其衍生物的识别网络,进而准确地进行血红蛋白及其衍生物的识别。
本实施例中,各训练样本所具有的血红蛋白衍生物浓度各不相同,以此保证血红蛋白及其衍生物的测定能够覆盖较大的测定范围,从而充分地保证血红蛋白及其衍生物识别的准确性。例如,训练样本对应的血红蛋白衍生物浓度在0%~100%之间。
进一步地,在一实施例的具体实现中,训练样本是以全血样本为基础,并通入不同组分的混合物制备得到的。
如图4所示,训练样本的制备过程可以包括以下步骤:
步骤211,利用测试卡吸入原血形成全血样本。
此处,基于测试卡的虹吸原理,不仅方便于原血的采集,而且避免生物污染,使得血红蛋白及其衍生物的识别具有极高的实用性。
步骤213,向全血样本中分别通入不同组分的混合物,得到多个训练样本。其中,混合物包括氧、一氧化碳、二氧化碳、氮、氰化铁。
例如,在全血样本中通入组分为90%O2、0%CO、2%CO2、8%N2的混合气体,同时加入氰化铁,以此形成训练样本。
可以理解,通过调节氧、一氧化碳、二氧化碳、氮、氰化铁在混合物中的组分,将使得原血中血红蛋白及其衍生物的浓度随之发生相应地变化,进而改变了训练样本所具备的血红蛋白衍生物浓度。
其中,血红蛋白衍生物浓度包括但不限于:总血红蛋白浓度tHb、氧合血红蛋白浓度O2Hb、碳氧血红蛋白浓度COHb、还原血红蛋白浓度RHb、高铁血红蛋白MetHb等等。
步骤215,对多个训练样本中血红蛋白衍生物浓度进行检测,并记录多个训练样本分别对应的血红蛋白衍生物浓度。
在完成训练样本的制备之后,便可进行训练样本中血红蛋白衍生物浓度的检测。
具体地,利用光谱仪对训练样本中血红蛋白衍生物浓度进行重复多次的测定,并对多次测定得到的浓度值进行算术平均,进而将计算得到的浓度平均值记录为训练样本对应的血红蛋白衍生物浓度。
上述过程中,通过多次重复测定,可以剔除异常工作的测试卡,还有利于消除操作误差,从而充分地保证了训练样本对应的血红蛋白衍生物浓度的准确性,进而保障了后续待测样本中血红蛋白及其衍生物识别的准确性。
步骤230,由多个训练样本对应获得多个特征序列。
具体地,如图5所示,在一实施例的具体实现中,步骤230可以包括以下步骤:
步骤231,对训练样本进行光照形成透射光信号,并由透射光信号采集得到指定波长范围内的多个光谱数据,每个光谱数据对应一种波长。
步骤233,根据训练样本对应的多个光谱数据进行光谱吸收率计算,得到训练样本的特征序列。
应当理解,由于血红蛋白及其衍生物所具备的分子结构不同,当光线透射训练样本形成光信号时,光信号所能够吸收的光波长也各异,由此显示出特有的光谱吸收曲线,即光谱吸收曲线所具有的特征吸收峰有所区别。
举例来说,氧合血红蛋白在可见光波长500nm~650nm范围有两个特征吸收峰,峰值在541nm处和576nm处;当氧合血红蛋白转换为脱氧血红蛋白时,光谱吸收曲线改变为540nm~569nm处出现特征吸收峰,峰值在555nm处;而高铁血红蛋白的特征吸收峰出现在645nm处;碳氧血红蛋白的两个特征吸收峰则分别位于570nm处和542nm处。
由上可知,光谱吸收能够作为定量和定性分析血红蛋白衍生物浓度的基础。
为此,首先针对训练样本进行光谱数据采集,即执行步骤231。
具体地,利用光源对训练样本进行照射,由此产生由训练样本透射出的透射光信号,然后采用光谱仪对透射光信号进行光谱数据采集。
优选地,由于血红蛋白及其衍生物所对应特征吸收峰出现在480nm~680nm处,为此,光谱仪将针对指定波长范围内对光谱数据进行采集,即光谱数据的波长范围为480nm~680nm,以此提高光谱数据的采集效率,进而有利于提高血红蛋白及其衍生物的识别效率。指定波长范围为480nm~680nm,根据实际的应用场景可以灵活地设定,在此不进行限定。
优选地,为了保证血红蛋白及其衍生物的识别准确性,光谱仪在指定波长范围内采集的光谱数据的个数为设定数量n,设定数量n的可调范围为128~256,根据实际的应用场景可以灵活地调整,在此不进行限定。进一步地,n个光谱数据的波长各不相同,且波长范围在指定波长范围内。
其次,在采集得到训练样本对应的n个光谱数据之后,便能够针对该训练样本对应的n个光谱数据作进一步地光谱吸收率计算,由此产生训练样本的特征序列,即执行步骤233。
上述过程中,完成了理论与实现的相互转化,即将训练样本所对应的光谱吸收曲线表征为训练样本的特征序列,以便于后续对血红蛋白衍生物浓度的测定是以训练样本的特征序列为基础,由此,便为血红蛋白及其衍生物的识别提供了数据依据,从而保证识别网络得以构建。
可以理解,对训练样本进行光照所形成的透射光信号中,不可避免地会产生杂散光信号,以此形成噪声而对光谱数据造成干扰。优选地,对光谱数据进行降噪处理,降噪处理包括但不限于:中值滤波、均值滤波、插值等等。
具体地,如图6所示,通过中值滤波剔除孤立的噪声点、通过均值滤波进行信号平滑处理,进而消除噪声对光谱数据的干扰;通过在感兴趣的波长处(例如特征吸收峰所在波长处)插值来提高有效信号的采样率,进而保证光谱数据的正确性,有利于提高血红蛋白及其衍生物的识别准确性。
步骤250,分别进行多个特征序列的降维处理。
可以理解,特征序列是由若干特征值构成的,如果特征序列所包含特征值的数量较大,则增加了后续模型训练过程中的处理维度。
为此,降维处理,即是指减少特征序列中特征值的数量,以此降低模型训练过程中的处理维度,进而有利于加快模型训练,不仅能够有效地降低处理器的处理压力,而且有利于提高识别网络的构建效率。其中,降维处理的方式包括但不限于:线性降维方法(例如局部线性嵌入法)和非线性降维方法,而非线性降维方法又进一步包括基于核函数的非线性降维方法、以及基于特征值的非线性降维方法,在此不进行限定。
步骤270,根据多个训练样本的血红蛋白衍生物浓度以及降维处理后的特征序列进行模型训练,通过训练得到的识别模型构建血红蛋白及其衍生物的识别网络。
具体地,如图7所示,识别网络的构建过程可以包括以下步骤:
步骤271,按照指定模型对多个训练样本的特征序列及血红蛋白衍生物浓度进行建模。
本实施例中,建模是借助指定模型所描述的数学结构来反映多个训练样本的特征序列及血红蛋白衍生物浓度。
其中,指定模型包括但不限于:神经网络模型、监督学习模型、线性回归模型、非线性回归模型等等。
也可以理解为,建模基于多个训练样本建立了特征序列与血红蛋白衍生物浓度之间的映射关系,进而方便于后续通过训练使得该映射关系达到最优,由此得到识别模型。
步骤273,对所构建指定模型的训练参数进行迭代优化,通过训练参数的迭代优化由构建的指定模型收敛得到识别模型。
训练是指对指定模型的训练参数进行迭代优化,以使特征序列与血红蛋白衍生物浓度之间的映射关系最优。
当映射关系未达到最优,则以优化后的训练参数进行训练参数的更新,并基于更新的训练参数继续迭代优化的过程。
当映射关系最优时,即认为优化后的训练参数使指定模型收敛,而收敛的指定模型即被视为识别模型,以此便构建出血红蛋白及其衍生物的识别网络,进而便能够基于该识别网络进行血红蛋白及其衍生物的识别。
通过如上所述的过程,实现了曲线向量的映射,只要曲线随向量的变化是连续的,即可通过曲线与向量之间的映射关系由未知曲线中搜索出相应的向量。
如图8所示,通过识别网络的构建,在特征序列(吸收曲线)与血红蛋白衍生物浓度(concentration)之间建立了映射关系,只要获得待测样本的特征序列,便能够输入至识别网络中进行预测,从而得到待测样本中血红蛋白衍生物浓度,以此实现待测样本中血红蛋白及其衍生物的识别,简单高效。
请参阅图9,在一示例性实施例中,步骤233可以包括以下步骤:
步骤2331,获取血红蛋白衍生物浓度为零的空白样本,并针对空白样本在指定波长范围内进行光谱数据采集。
空白样本,是由测试卡吸入蒸馏水或者纯化水形成的。该空白样本所具备的血红蛋白衍生物浓度为零。
此处,对空白样本在指定波长范围内进行的光谱数据采集与针对训练样本时基本一致,二者的区别仅在于进行采集的对象不同,故而,在此不再重复描述。
步骤2333,以空白样本对应的多个光谱数据作为参考,采用吸收率计算公式由训练样本对应的多个光谱数据计算得到训练样本的多个光谱吸收率。
假设,空白样本对应的n个光谱数据为s1(i),1<i<n;训练样本对应的n个光谱数据为s2(j),1<j<n。
训练样本的n个光谱吸收率a(k),1<k<n将按照下述吸收率计算公式进行:
a(k)=log(s1(i)/s2(j))。
步骤2335,以光谱吸收率作为特征值,由多个特征值生成训练样本的特征序列。
当得到训练样本的n个光谱吸收率之后,将光谱吸收率视为特征序列的特征值,由此便得到训练样本的特征序列,即{a(1),a(2),a(3),……,a(n)},1<k<n。
进一步地,请参阅图10,在一示例性实施例中,步骤250可以包括以下步骤:
步骤251,对特征序列进行主成分分析处理得到特征权重值,特征权重值对应于特征序列中的特征值。
通过主成分分析处理,将为每一个特征值计算得到对应的特征权重值,以此来表征特征值之间的相关性,即特征权重值较大的特征值与其余特征值之间的相关性较小。
步骤253,根据降维规则对特征权重值进行筛选,得出候选特征权重值。
降维规则,是指指定权重值范围,例如,指定权重值范围为特征权重值在90%以上。
由此,根据降维规则进行的特征权重值筛选是指不在指定权重值范围的特征权重值将被剔除,而处于指定权重值范围的特征权重值即被视为候选特征权重值。相应地,被剔除的特征权重值所对应的特征值也将由特征序列中被剔除。
步骤255,将候选特征权重值所对应的特征值进行特征序列重构,得到降维处理后的特征序列。
仍以上述例子进行说明,特征值a(2)、a(3)、a(n)按照降维规则被剔除,其余特征值均保留。
相应地,由此构成的训练样本的特征序列为{a(1),a(4),……,a(n-1)}。
在上述过程中,实现了特征序列的降维,即由n个维度降低至m(m=n-3)个维度,有效地降低了模型训练过程中的处理维度,有利于加快模型训练,不仅有效的降低了处理器的处理压力,而且有利于提高识别网络的构建效率。
下述为本发明装置实施例,可以用于执行本发明所涉及的方法。对于本发明装置实施例中未披露的细节,请参照本发明所涉及的方法实施例。
请参阅图11,在一示例性实施例中,一种血红蛋白及其衍生物的识别网络构建装置900包括但不限于:训练样本获取模块910、特征序列获取模块930、特征序列降维模块950和模型训练模块970。
其中,训练样本获取模块910用于获取具有不同血红蛋白衍生物浓度的多个训练样本。
特征序列获取模块930用于由多个训练样本对应获得多个特征序列。
特征序列降维模块950用于分别进行多个特征序列的降维处理。
模型训练模块970用于根据多个训练样本的血红蛋白衍生物浓度以及降维处理后的特征序列进行模型训练,通过训练得到的识别模型构建血红蛋白及其衍生物的识别网络。
请参阅图12,在一示例性实施例中,一种血红蛋白及其衍生物的识别装置1300包括但不限于:特征序列获取模块1310、特征序列降维模块1330和样本识别模块1350。
其中,特征序列获取模块1310用于获取待测样本的特征序列。
特征序列降维模块1330用于进行特征序列的降维处理。
样本识别模块1350用于将降维处理后的特征序列输入至血红蛋白及其衍生物的识别网络中进行预测,得到待测样本中血红蛋白衍生物浓度,通过血红蛋白衍生物浓度对待测样本中的血红蛋白及其衍生物浓度进行识别。
需要说明的是,上述实施例所提供的装置仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即装置的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例所提供的装置与方法实施例所提供的方法属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
在一示例性实施例中,一种血红蛋白及其衍生物的识别装置,包括处理器及存储器。
其中,存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时实现上述各实施例中的方法。
在一示例性实施例中,一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各实施例中的方法。
上述内容,仅为本发明的较佳示例性实施例,并非用于限制本发明的实施方案,本领域普通技术人员根据本发明的主要构思和精神,可以十分方便地进行相应的变通或修改,故本发明的保护范围应以权利要求书所要求的保护范围为准。

Claims (9)

1.一种血红蛋白及其衍生物的识别网络构建方法,其特征在于,包括:
获取具有不同血红蛋白衍生物浓度的多个训练样本;
对所述训练样本进行光照形成透射光信号,并由所述透射光信号采集得到指定波长范围内的多个光谱数据;
根据所述训练样本对应的多个光谱数据进行光谱吸收率计算,得到所述训练样本的特征序列,所述特征序列是通过n个光谱数据分别对应的特征值按照设定规则生成的序列;
分别进行多个所述特征序列的降维处理;
根据多个所述训练样本的血红蛋白衍生物浓度以及降维处理后的特征序列进行模型训练,通过训练得到的识别模型构建血红蛋白及其衍生物的识别网络。
2.如权利要求1所述的方法,其特征在于,所述获取具有不同血红蛋白衍生物浓度的多个训练样本,包括:
利用测试卡吸入原血形成全血样本;
向所述全血样本中分别通入不同组分的混合物,得到多个所述训练样本,所述混合物包括氧、一氧化碳、二氧化碳、氮、氰化铁,所述不同组分使得多个所述训练样本具有不同血红蛋白衍生物浓度;
对多个所述训练样本中血红蛋白衍生物浓度进行检测,并记录多个所述训练样本分别对应的血红蛋白衍生物浓度。
3.如权利要求1所述的方法,其特征在于,所述根据所述训练样本对应的多个光谱数据进行光谱吸收率计算,得到所述训练样本的特征序列,包括:
获取血红蛋白衍生物浓度为零的空白样本,并针对所述空白样本在指定波长范围内进行光谱数据采集;
以所述空白样本对应的多个光谱数据作为参考,采用吸收率计算公式由所述训练样本对应的多个光谱数据计算得到所述训练样本的多个光谱吸收率;
以光谱吸收率作为特征值,由多个特征值生成所述训练样本的特征序列。
4.如权利要求3所述的方法,其特征在于,所述根据所述训练样本对应的多个光谱数据进行光谱吸收率计算,得到所述训练样本的特征序列,还包括:
对所述光谱数据进行降噪处理,以使所述光谱吸收率计算是根据降噪处理后的光谱数据进行的。
5.如权利要求1所述的方法,其特征在于,所述分别进行多个所述特征序列的降维处理,包括:
对所述特征序列进行主成分分析处理得到特征权重值,所述特征权重值对应于所述特征序列中的特征值;
根据降维规则对所述特征权重值进行筛选,得出候选特征权重值;
将所述候选特征权重值所对应的特征值进行特征序列重构,得到降维处理后的特征序列。
6.如权利要求1所述的方法,其特征在于,所述根据多个所述训练样本的血红蛋白衍生物浓度以及降维处理后的特征序列进行模型训练,通过训练得到的识别模型构建血红蛋白及其衍生物的识别网络,包括:
按照指定模型对多个所述训练样本的特征序列及血红蛋白衍生物浓度进行建模;
对所构建指定模型的训练参数进行迭代优化,通过所述训练参数的迭代优化由构建的指定模型收敛得到所述识别模型。
7.一种血红蛋白及其衍生物的识别方法,其特征在于,所述识别方法通过如权利要求1-6中任一项所述的血红蛋白及其衍生物的识别网络构建方法所构建的识别网络进行识别,所述识别方法包括:
获取待测样本的特征序列;
进行所述特征序列的降维处理;
将降维处理后的特征序列输入至血红蛋白及其衍生物的识别网络中进行预测,得到所述待测样本中血红蛋白衍生物浓度,通过所述血红蛋白衍生物浓度对所述待测样本中血红蛋白及其衍生物进行识别。
8.一种血红蛋白及其衍生物的识别网络构建装置,其特征在于,包括:
训练样本获取模块,用于获取具有不同血红蛋白衍生物浓度的多个训练样本;
特征序列获取模块,用于由对所述训练样本进行光照形成透射光信号,并由所述透射光信号采集得到指定波长范围内的多个光谱数据;根据所述训练样本对应的多个光谱数据进行光谱吸收率计算,得到所述训练样本的特征序列,所述特征序列是通过n个光谱数据分别对应的特征值按照设定规则生成的序列;
特征序列降维模块,用于分别进行多个所述特征序列的降维处理;
模型训练模块,用于根据多个所述训练样本的血红蛋白衍生物浓度以及降维处理后的特征序列进行模型训练,通过训练得到的识别模型构建血红蛋白及其衍生物的识别网络。
9.一种血红蛋白及其衍生物的识别装置,其特征在于,包括:
特征序列获取模块,用于获取待测样本的特征序列,所述特征序列是通过n个光谱数据分别对应的特征值按照设定规则生成的序列;
特征序列降维模块,用于进行所述特征序列的降维处理;
样本识别模块,用于将降维处理后的特征序列输入至血红蛋白及其衍生物的识别网络中进行预测,得到所述待测样本中血红蛋白衍生物浓度,通过所述血红蛋白衍生物浓度对所述待测样本中血红蛋白及其衍生物进行识别。
CN201810048392.7A 2018-01-18 2018-01-18 血红蛋白及其衍生物的识别、识别网络构建方法及装置 Active CN110057757B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810048392.7A CN110057757B (zh) 2018-01-18 2018-01-18 血红蛋白及其衍生物的识别、识别网络构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810048392.7A CN110057757B (zh) 2018-01-18 2018-01-18 血红蛋白及其衍生物的识别、识别网络构建方法及装置

Publications (2)

Publication Number Publication Date
CN110057757A CN110057757A (zh) 2019-07-26
CN110057757B true CN110057757B (zh) 2022-04-26

Family

ID=67315115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810048392.7A Active CN110057757B (zh) 2018-01-18 2018-01-18 血红蛋白及其衍生物的识别、识别网络构建方法及装置

Country Status (1)

Country Link
CN (1) CN110057757B (zh)

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7129329B1 (en) * 1999-12-06 2006-10-31 University Of Hawaii Heme proteins hemAT-Hs and hemAT-Bs and their use in medicine and microsensors
WO2004081527A2 (en) * 2003-03-10 2004-09-23 Sionex Corporation Systems for differential ion mobility analysis
BE1017986A3 (fr) * 2008-02-13 2010-03-02 Lefebvre Guy Procede de mesure de la masse grasse et de la masse maigre d'un individu.
CN101995392A (zh) * 2010-11-15 2011-03-30 中华人民共和国上海出入境检验检疫局 快速检测橄榄油掺伪的方法
CN103792344B (zh) * 2014-01-24 2016-08-17 深圳市理邦精密仪器股份有限公司 一种血气生化分析系统的识别校正方法及装置
CN104655583A (zh) * 2015-02-04 2015-05-27 中国矿业大学 一种基于傅里叶红外光谱的煤质快速识别方法
CN106353280A (zh) * 2015-07-15 2017-01-25 重庆医科大学 文拉法辛晶体的近红外光谱快速鉴别方法
CN106404710A (zh) * 2015-07-15 2017-02-15 重庆医科大学 药物散剂辅料的近红外光谱快速无损鉴别法
CN105930686B (zh) * 2016-07-05 2019-05-07 四川大学 一种基于深度神经网络的蛋白质二级结构预测方法
CN106570336A (zh) * 2016-11-10 2017-04-19 中南大学 半胱氨酸中亚磺酰化硫位点的预测方法及系统
CN106650314A (zh) * 2016-11-25 2017-05-10 中南大学 预测氨基酸突变的方法及系统
CN107045637B (zh) * 2016-12-16 2020-07-24 中国医学科学院生物医学工程研究所 一种基于光谱的血液物种识别仪及识别方法
CN107271394A (zh) * 2017-05-16 2017-10-20 江苏大学 一种模糊Kohonen鉴别聚类网络的茶叶红外光谱分类方法
CN107192690B (zh) * 2017-05-19 2019-04-23 重庆大学 近红外光谱无创血糖检测方法及其检测网络模型训练方法
CN108780037A (zh) * 2018-04-09 2018-11-09 深圳达闼科技控股有限公司 光谱分析方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN110057757A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
Chen et al. Diagnosis of colorectal cancer by near-infrared optical fiber spectroscopy and random forest
CN107045637A (zh) 一种基于光谱的血液物种识别仪及识别方法
Hasan et al. RGB pixel analysis of fingertip video image captured from sickle cell patient with low and high level of hemoglobin
Fatemi et al. Identification of informative spectral ranges for predicting major chemical constituents in corn using NIR spectroscopy
Paiva et al. Comparison between the HemoCue® and an automated counter for measuring hemoglobin
WO2023123864A1 (zh) 基于肌电信号与肌肉血氧饱和度确定肌肉状态的装置
CN104655585B (zh) 一种基于近红外光谱的pse肉筛选方法
Sun et al. Dual gas sensor with innovative signal analysis based on neural network
Parte et al. Non-invasive method for diabetes detection using CNN and SVM classifier
CN110057757B (zh) 血红蛋白及其衍生物的识别、识别网络构建方法及装置
CN110403611B (zh) 血液中糖化血红蛋白成分值预测方法、装置、计算机设备和存储介质
JP2007285922A (ja) 近赤外光を用いた臨床血液検査方法
CN205215187U (zh) 基于多光谱的皮肤检测系统
CN110426366A (zh) 基于可视化嗅觉传感器及近红外的肉类掺假比例检测方法
Guo et al. Monitor blood glucose levels via breath analysis system and sparse representation approach
CN109668842A (zh) 一种贝类重金属污染快速检测方法
Srivastava et al. Diagnosis of sickle cell anemia using AutoML on UV-Vis absorbance spectroscopy data
Cheng et al. Exploration of compressive sensing in the classification of frozen fish based on two-dimensional correlation spectrum
JPWO2007066589A1 (ja) 近赤外分光を用いた生活習慣病に関する検査・診断法および装置
WO2022144714A1 (en) Electrochemical based nutrient analysis
CN207908362U (zh) 一种基于光腔衰荡光谱技术的全自动呼吸气体分析仪
Imanaka et al. Visible and near‑infrared interactance spectroscopy is a non‑invasive technique which can be used to evaluate the hemoglobin concentration in endometriotic cyst fluid
Han et al. ATR-FTIR spectroscopy with equidistant combination PLS method applied for rapid determination of glycated hemoglobin
CN113376107B (zh) 基于云平台的水质监测系统和方法
CN107655855A (zh) 一种基于光腔衰荡光谱技术的全自动呼吸气体分析仪

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant