CN117454200A - 基于云计算的新生儿黄疸筛查方法 - Google Patents
基于云计算的新生儿黄疸筛查方法 Download PDFInfo
- Publication number
- CN117454200A CN117454200A CN202311773576.7A CN202311773576A CN117454200A CN 117454200 A CN117454200 A CN 117454200A CN 202311773576 A CN202311773576 A CN 202311773576A CN 117454200 A CN117454200 A CN 117454200A
- Authority
- CN
- China
- Prior art keywords
- characteristic wavelength
- matrix
- wavelength
- spectrum data
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 206010023138 Jaundice neonatal Diseases 0.000 title claims abstract description 25
- 201000006346 Neonatal Jaundice Diseases 0.000 title claims abstract description 25
- 238000012216 screening Methods 0.000 title claims abstract description 22
- 239000011159 matrix material Substances 0.000 claims abstract description 237
- 238000001228 spectrum Methods 0.000 claims abstract description 175
- BPYKTIZUTYGOLE-IFADSCNNSA-N Bilirubin Chemical compound N1C(=O)C(C)=C(C=C)\C1=C\C1=C(C)C(CCC(O)=O)=C(CC2=C(C(C)=C(\C=C/3C(=C(C=C)C(=O)N\3)C)N2)CCC(O)=O)N1 BPYKTIZUTYGOLE-IFADSCNNSA-N 0.000 claims abstract description 170
- 230000003595 spectral effect Effects 0.000 claims abstract description 76
- 238000010521 absorption reaction Methods 0.000 claims abstract description 55
- 238000002835 absorbance Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 4
- 238000000611 regression analysis Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 239000000126 substance Substances 0.000 description 8
- 238000012937 correction Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000002790 cross-validation Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 206010023126 Jaundice Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000013076 target substance Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0059—Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence
- A61B5/0075—Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence by spectroscopy, i.e. measuring spectra, e.g. Raman spectroscopy, infrared absorption spectroscopy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/44—Detecting, measuring or recording for evaluating the integumentary system, e.g. skin, hair or nails
- A61B5/441—Skin evaluation, e.g. for skin disorder diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Abstract
本发明涉及光谱数据处理技术领域,具体涉及基于云计算的新生儿黄疸筛查方法,包括:采集若干不同新生儿皮肤的光谱数据和实际胆红素浓度;根据光谱数据中波长对应的吸收率得到特征波长;根据不同光谱数据中特征波长对应的吸收率序列和特征波长,得到任意两个特征波长的相似性;根据任意两个特征波长的相似性,得到特征波长矩阵,得到特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数,根据影响系数和标准波长,得到列矩阵对胆红素浓度的影响因子,根据影响因子和实际胆红素浓度,得到回归模型,进而得到待测光谱数据的胆红素浓度预测值。本发明在保证岭回归法解决多重共线性的同时,使得到的回归模型更加准确,提高了回归分析的精度。
Description
技术领域
本发明涉及光谱数据处理技术领域,具体涉及基于云计算的新生儿黄疸筛查方法。
背景技术
正常新生儿黄疸和病理性新生儿黄疸在许多方面有所不同,包括发生的时间、黄疸的程度、引起的原因等,通过对新生儿体内的胆红素的变化情况进行分析,可以帮助医护人员进行准确地判断病况。传统的经皮胆红素测试仪测量结果可能会受到许多因素的影响,如婴儿皮肤的颜色、透明度,以及周围环境的光照条件等,这些因素可能导致测量结果的不确定性,故通过光谱数据分析新生儿胆红素的浓度水平。
在通过光谱数据分析新生儿胆红素的浓度水平时,由于所得光谱数据中包含多种复杂物质,其中包含部分物质的光谱与目标物质光谱波长发生重叠,进而导致测定的结果无法直接用于计算;而传统的岭回归算法,其目标函数中的修正项,对于各个维度数据的权重是一致的,在利用光谱数据对物质含量进行拟合时,会导致多个与目标物质相关性较小的维度的拟合权重过大,进而降低拟合效果,导致对新生儿的胆红素浓度预测不准确。
发明内容
为解决上述问题,本发明提供基于云计算的新生儿黄疸筛查方法。
本发明的基于云计算的新生儿黄疸筛查方法采用如下技术方案:
本发明一个实施例提供了基于云计算的新生儿黄疸筛查方法,该方法包括以下步骤:
采集若干不同新生儿皮肤的光谱数据和新生儿的实际胆红素浓度,获取若干光谱数据的排列次序,获取胆红素在光谱数据中对应的标准波长,所述光谱数据包含若干波长和波长对应的吸收率;
根据光谱数据中每个波长对应的吸收率得到每个光谱数据的若干特征波长;
根据光谱数据及特征波长,获取每个光谱数据中每个特征波长对应的吸收率序列,根据不同光谱数据中特征波长对应的吸收率序列和特征波长,得到不同光谱数据中任意两个特征波长的相似性;将包含特征波长最多的光谱数据,记为标准光谱数据;
根据不同光谱数据中任意两个特征波长的相似性和排列次序,得到标准光谱数据中每个特征波长对应的列矩阵,根据标准光谱数据中每个特征波长对应的列矩阵,得到特征波长矩阵,根据光谱数据中每个波长对应吸收率的一阶前向差分和特征波长矩阵,得到特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数,根据特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数和标准波长,得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子;
根据特征波长矩阵中每个列矩阵对胆红素浓度的影响因子和新生儿的实际胆红素浓度,得到岭回归算法的回归模型,获取一个待测光谱数据,根据回归模型和特征波长矩阵中每个列矩阵对应的特征波长的均值,得到待测光谱数据对应的胆红素浓度预测值。
进一步地,所述根据光谱数据中每个波长对应的吸收率得到每个光谱数据的若干特征波长,包括的具体步骤如下:
,其中/>表示若干不同新生儿皮肤的光谱数据中任意一个光谱数据中第/>个波长对应的吸收率,预设一个第二数值,记为/>,/>表示该光谱数据中以第/>个波长为中心,邻域半径为/>的波长范围中第/>个波长对应的吸收率,其中/>,预设一个第一阈值,记为/>,若/>且/>,将第/>个波长作为该光谱数据的一个特征波长。
进一步地,所述获取每个光谱数据中每个特征波长对应的吸收率序列的具体方法如下:
以第i个光谱数据中第p个特征波长为中心,邻域半径为的波长范围,作为第i个光谱数据中第p个特征波长的邻域范围,将第p个特征波长的邻域范围中所有波长对应的吸收率,按照邻域范围中波长在第i个光谱数据中的次序进行排列,得到第i个光谱数据中第p个特征波长对应的吸收率序列。
进一步地,所述根据不同光谱数据中特征波长对应的吸收率序列和特征波长,得到不同光谱数据中任意两个特征波长的相似性,包括的具体步骤如下:
式中,为第i个光谱数据中第p个特征波长,/>为第j个光谱数据中第q个特征波长,/>为取绝对值,/>为第i个光谱数据中第p个特征波长对应的吸收率序列,/>为第j个光谱数据中第q个特征波长对应的吸收率序列,/>为第i个光谱数据中第p个特征波长对应的吸收率序列和第j个光谱数据中第q个特征波长对应的吸收率序列的皮尔逊相关系数,其中/>,/>为第i个光谱数据中第p个特征波长和第j个光谱数据中第q个特征波长的相似性。
进一步地,所述根据不同光谱数据中任意两个特征波长的相似性和排列次序,得到标准光谱数据中每个特征波长对应的列矩阵,包括的具体步骤如下:
在除标准光谱数据外的任意一个光谱数据中,获取与标准光谱数据中第一个特征波长相似性最高的特征波长,记为标准光谱数据中第一个特征波长的一个相似特征波长,在除标准光谱数据外的每个光谱数据中,获取与标准光谱数据中第一个特征波长相似性最高的特征波长,得到标准光谱数据中第一个特征波长的若干相似特征波长,将标准光谱数据中第一个特征波长和若干相似特征波长按照所属光谱数据的排列次序进行列排列,得到标准光谱数据中第一个特征波长对应的列矩阵,以此类推,得到标准光谱数据中每个特征波长对应的列矩阵。
进一步地,所述根据标准光谱数据中每个特征波长对应的列矩阵,得到特征波长矩阵,包括的具体步骤如下:
将标准光谱数据中所有特征波长对应的列矩阵按照特征波长的次序横向拼接,形成一个具有相同行数但列数增加的大矩阵,记为特征波长矩阵。
进一步地,所述根据光谱数据中每个波长对应吸收率的一阶前向差分和特征波长矩阵,得到特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数,包括的具体步骤如下:
式中,的具体获取方法如下:将特征波长矩阵的第i行中第p1个特征波长在第i个光谱数据中对应的特征波长,记为第一特征波长,将特征波长矩阵的第i行中第q1个特征波长在第i个光谱数据中对应的特征波长,记为第二特征波长,将第一特征波长记为TS1,将第二特征波长记为TS2,若/>,将第一特征波长的左邻域范围中第v个波长对应的吸收率记为/>;若/>,将第一特征波长的右邻域范围中第v个波长对应的吸收率记为/>,若/>,将特征波长矩阵的第i行中第p1个特征波长对应的吸收率记为/>,其中第一特征波长的左邻域范围为:第一特征波长的邻域范围中第一特征波长左侧的邻域范围,第一特征波长的右邻域范围为:第一特征波长的邻域范围中第一特征波长右侧的邻域范围;/>为第一特征波长沿任意一侧的邻域范围中波长的个数,/>为特征波长矩阵的总行数,/>的具体获取方法如下:若/>,/>,若,/>,/>为特征波长矩阵的第i行中第p1个特征波长,/>为特征波长矩阵的第i行中第q1个特征波长,/>为第i个光谱数据中第v个波长对应吸收率的一阶前向差分,/>为第i个光谱数据中第v个波长,/>为特征波长矩阵中第p1个列矩阵对第q1个列矩阵的影响系数。
进一步地,所述根据特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数和标准波长,得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子,包括的具体步骤如下:
式中,为特征波长矩阵的第p1个列矩阵中所有特征波长的均值,/>为标准波长,/>为取绝对值,/>为特征波长矩阵中第p1个列矩阵对第q1个列矩阵的影响系数,为归一化函数,/>为特征波长矩阵中列矩阵的个数,/>为特征波长矩阵中第q1个列矩阵对胆红素浓度的影响因子。
进一步地,所述根据特征波长矩阵中每个列矩阵对胆红素浓度的影响因子和新生儿的实际胆红素浓度,得到岭回归算法的回归模型,包括的具体步骤如下:
式中,的具体获取方法如下:获取特征波长矩阵中每个特征波长对应的吸收率,将特征波长矩阵中每个特征波长替换为特征波长对应的吸收率,得到一个吸收率矩阵,记为/>,/>的具体获取方法如下:将多个新生儿的实际胆红素浓度按照对应的排列次序进行列排列,得到的列矩阵记为y,/>为待求解系数矩阵,/>为取二范数,/>为待求解参数,其中/>可通过交叉验证来确定,具体获取为岭回归算法中交叉验证的现有方法,本实例不再赘述,为岭回归算法的目标函数的输出值,/>为权重系数矩阵,权重系数矩阵的具体获取方法如下:
其中,为特征波长矩阵中第1个列矩阵对胆红素浓度的影响因子,/>为特征波长矩阵中第2个列矩阵对胆红素浓度的影响因子,/>为特征波长矩阵中第k个列矩阵对胆红素浓度的影响因子;
将最小值对应的/>,作为最终系数矩阵,根据最终系数矩阵得到岭回归算法的回归模型。
进一步地,所述获取一个待测光谱数据,根据回归模型和特征波长矩阵中每个列矩阵对应的特征波长的均值,得到待测光谱数据对应的胆红素浓度预测值,包括的具体步骤如下:
重新获取一个光谱数据,记为待测光谱数据,获取特征波长矩阵中每个列矩阵对应的特征波长的均值,将每个均值在待测光谱数据中对应的吸收率带入到岭回归算法的回归模型中,将岭回归算法的回归模型的输出值作为待测光谱数据对应的胆红素浓度预测值。
本发明的技术方案的有益效果是:本发明针对岭回归算法中,不同维度解释变量的修正程度一致的问题,根据光谱数据中波长对应的吸收率得到特征波长;由于不同光谱数据对应的特征波长存在差异,通过对不同光谱数据中特征波长对应的吸收率序列和特征波长进行分析,得到任意两个特征波长的相似性;进而根据任意两个特征波长的相似性,得到特征波长矩阵,根据特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数和标准波长,得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子,进而根据对胆红素浓度的影响因子,得到岭回归算法的回归模型,从而根据回归模型得到待测光谱数据的胆红素浓度预测值;通过对特征波长矩阵中每个列矩阵对胆红素浓度的影响分析,使得到的回归模型更加准确,提高了新生儿胆红素浓度预测的精度,其非侵入性检测无需抽血等操作,降低新生儿感染的风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的基于云计算的新生儿黄疸筛查方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于云计算的新生儿黄疸筛查方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于云计算的新生儿黄疸筛查方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于云计算的新生儿黄疸筛查方法的步骤流程图,该方法包括以下步骤:
步骤S001、采集若干不同新生儿皮肤的光谱数据和新生儿的实际胆红素浓度,获取若干光谱数据的排列次序,获取胆红素在光谱数据中对应的标准波长。
需要说明的是,本实施例的目的是,根据所得多个不同新生儿的皮肤光谱数据,获取不同波长下的吸收率,利用不同波长对于真实物质含量的影响大小,对传统的岭回归法的目标函数进行修正,以提高拟合的准确性,进而预测新生儿的胆红素浓度,开始分析之前,首先需要采集数据。
具体的,预设一个第一数值,记为N,本实施例以N=30进行叙述,利用光谱仪获取N个不同新生儿皮肤的光谱数据,同时记录光谱数据的排列次序,即光谱数据的获取顺序,其中光谱数据为二维数据,光谱数据的横轴为不同的波长,纵轴为不同的吸收率,其中吸收率的取值范围为;根据先验知识可知,胆红素在光谱数据中对应的标准波长为/>,通过血液样本检测的方式分别测定该N个不同新生儿的实际胆红素浓度;
需要说明的是,光谱数据中波长的最小差异为1nm。
至此,得到若干不同新生儿皮肤的光谱数据和新生儿的实际胆红素浓度,以及胆红素在光谱数据中对应的标准波长。
步骤S002、根据光谱数据中每个波长对应的吸收率得到每个光谱数据的若干特征波长。
需要说明的是,在得到各个新生儿对应的光谱数据之后,利用光谱数据的特征获取多个特征波长进行回归分析,不同光谱数据对应的特征波长可能出现一定的峰值漂移的现象,故需要对不同光谱数据对应的特征波长进行相似性分析,而后结合各个波长位置与胆红素标准波长之间的差异与各个特征波长序列之间的波长的影响系数,进而对岭回归算法中修正项进行改进。
需要说明的是,针对所获取的多个光谱数据,由于皮肤内物质成分的复杂性,光谱数据中单个波长对应的吸收率并不只单个物质影响,故需要选取多个能够体现某一物质含量的波长进行分析。
具体的,根据光谱数据中每个波长对应的吸收率得到每个光谱数据的若干特征波长,具体如下:
,其中/>表示若干不同新生儿皮肤的光谱数据中任意一个光谱数据中第/>个波长对应的吸收率,预设一个第二数值,记为/>,本实施例以/>进行叙述,/>表示该光谱数据中以第/>个波长为中心,邻域半径为/>的波长范围中第/>个波长对应的吸收率,其中/>,需要说明的是,波长范围中包括第/>个波长本身,则其中第/>个波长即是该光谱数据中第/>个波长,后续邻域范围即为此处获取的波长范围;预设一个第一阈值,记为/>,本实施例以/>进行叙述,若/>且/>,将第/>个波长作为该光谱数据的一个特征波长。
需要说明的是,若任意一个波长在光谱数据的左右两侧,即波长在光谱数据的左侧个波长范围内或者波长在光谱数据的右侧/>个波长范围内时,不参与特征波长的分析。
至此,得到每个光谱数据的若干特征波长。
步骤S003、根据不同光谱数据中特征波长对应的吸收率序列和特征波长,得到任意两个特征波长的相似性,根据不同光谱数据中任意两个特征波长的相似性,得到标准光谱数据中每个特征波长对应的列矩阵。
需要说明的是,由于光照条件,温度等条件的影响,不同光谱数据对应的多个特征波长之间的可能会出现较大的差异,故在进行回归分析之前,需要对所得的多个光谱数据对应的特征波长进行相似性分析,使得相似波长可以表示某一物质。
具体的,获取每个光谱数据中每个特征波长对应的吸收率序列,具体如下:
以第i个光谱数据中第p个特征波长为中心,邻域半径为的波长范围,作为第i个光谱数据中第p个特征波长的邻域范围,将第p个特征波长的邻域范围中所有波长对应的吸收率,按照邻域范围中波长在第i个光谱数据中的次序进行排列,得到第i个光谱数据中第p个特征波长对应的吸收率序列。
进一步地,根据不同光谱数据中特征波长对应的吸收率序列和特征波长,得到不同光谱数据中任意两个特征波长的相似性,具体如下:
式中,为第i个光谱数据中第p个特征波长,/>为第j个光谱数据中第q个特征波长,/>为取绝对值,/>为第i个光谱数据中第p个特征波长对应的吸收率序列,/>为第j个光谱数据中第q个特征波长对应的吸收率序列,/>为第i个光谱数据中第p个特征波长对应的吸收率序列和第j个光谱数据中第q个特征波长对应的吸收率序列的皮尔逊相关系数,其中/>,/>为第i个光谱数据中第p个特征波长和第j个光谱数据中第q个特征波长的相似性。
需要说明的是,获取两个序列的皮尔逊相关系数为现有方法,本实施例不再赘述,对于不同光谱数据的多个特征波长,由于特征波长选取的均为局部极大值,若两个不同光谱数据的特征波长在对应波长邻域内表征同一分子结构,则对应吸收率应当在其邻域内成比例出现,即相关系数会较高;由于温度等其他因素的影响,可能出现对应特征波长的峰值漂移的现象,故利用对应特征波长的波长差作为权重系数,进而得到不同特征波长之间相似性的度量。
进一步地,将包含特征波长最多的光谱数据,记为标准光谱数据,根据不同光谱数据中任意两个特征波长的相似性和排列次序,得到标准光谱数据中每个特征波长对应的列矩阵,具体如下:
在除标准光谱数据外的任意一个光谱数据中,获取与标准光谱数据中第一个特征波长相似性最高的特征波长,记为标准光谱数据中第一个特征波长的一个相似特征波长,在除标准光谱数据外的每个光谱数据中,获取与标准光谱数据中第一个特征波长相似性最高的特征波长,得到标准光谱数据中第一个特征波长的若干相似特征波长,将标准光谱数据中第一个特征波长和若干相似特征波长按照所属光谱数据的排列次序进行列排列,得到标准光谱数据中第一个特征波长对应的列矩阵,以此类推,得到标准光谱数据中每个特征波长对应的列矩阵。
至此,得到标准光谱数据中每个特征波长对应的列矩阵。
步骤S004、根据标准光谱数据中每个特征波长对应的列矩阵,得到特征波长矩阵,根据光谱数据中每个波长对应吸收率的一阶前向差分和特征波长矩阵,得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子。
需要说明的是,对于同一特征波长下光谱数据的吸收率而言,其对应数据大小不仅仅包含了单个物质对应的浓度,还会由于波长重叠的影响,出现多个物质光谱数据在同一波长下重叠的结果,故需要分析不同特征波长之间相互影响的大小关系,进而判断各特征波长对于真实物质含量的影响因子。
进一步地,根据标准光谱数据中每个特征波长对应的列矩阵,得到特征波长矩阵,具体如下:
将标准光谱数据中所有特征波长对应的列矩阵按照特征波长的次序横向拼接,形成一个具有相同行数但列数增加的大矩阵,记为特征波长矩阵;
具体的,根据光谱数据中波长对应的吸收率,获取每个光谱数据中每个波长对应吸收率的一阶前向差分,具体如下:
将第i个光谱数据中第b个波长对应吸收率的一阶前向差分,记为,,其中,/>为第i个光谱数据中第b个波长对应的吸收率,/>为第i个光谱数据中中第b+1个波长对应的吸收率。
进一步地,根据光谱数据中每个波长对应吸收率的一阶前向差分和特征波长矩阵,得到特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数,具体如下:
式中,的具体获取方法如下:将特征波长矩阵的第i行中第p1个特征波长在第i个光谱数据中对应的特征波长,记为第一特征波长,将特征波长矩阵的第i行中第q1个特征波长在第i个光谱数据中对应的特征波长,记为第二特征波长,将第一特征波长记为TS1,将第二特征波长记为TS2,若/>,将第一特征波长的左邻域范围中第v个波长对应的吸收率记为/>;若/>,将第一特征波长的右邻域范围中第v个波长对应的吸收率记为/>,若/>,将特征波长矩阵的第i行中第p1个特征波长对应的吸收率记为/>,其中第一特征波长的左邻域范围为:第一特征波长的邻域范围中第一特征波长左侧的邻域范围,第一特征波长的右邻域范围为:第一特征波长的邻域范围中第一特征波长右侧的邻域范围;/>为第一特征波长沿任意一侧的邻域范围中波长的个数,/>为特征波长矩阵的总行数,/>的具体获取方法如下:若/>,/>,若,/>,/>为特征波长矩阵的第i行中第p1个特征波长,/>为特征波长矩阵的第i行中第q1个特征波长,/>为第i个光谱数据中第v个波长对应吸收率的一阶前向差分,/>为第i个光谱数据中第v个波长,/>为特征波长矩阵中第p1个列矩阵对第q1个列矩阵的影响系数。
需要说明的是,首先在单个光谱数据内进行判断,若第个列矩阵对第/>1个列矩阵的影响系数较大,即对应两个波长的吸收峰会出现较大波长重叠现象,故利用第/>个特征波长的邻域内数据进行线性延伸,观察延伸后抵达第v个波长的吸收率大小,在遍历各个光谱数据后,作为特征波长矩阵中第p1个列矩阵对第q1个列矩阵的影响系数。其中延伸过程利用的是各波长下的吸收率、其对应一阶差分与波长差,利用波长差与差分信息估计吸收率之差。
需要说明的是,在得到了各个列矩阵之间的影响系数之后,由于在进行回归分析时,多个特征波长序列对于真实胆红素浓度的反映情况有所差异,传统的岭回归法没有对各个维度数据进行单独的分析,导致不同修正系数下,避免多重共线性的同时也抑制了部分解释变量对别解释变量的拟合效果,故需要判断判断各个解释变量对于胆红素浓度的影响因子大小。
具体的,根据特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数和标准波长,得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子,具体如下:
式中,为特征波长矩阵的第p1个列矩阵中所有特征波长的均值,/>为标准波长,/>为取绝对值,/>为特征波长矩阵中第p1个列矩阵对第q1个列矩阵的影响系数,为归一化函数,采用softmax归一化函数,归一化的对象为所有列矩阵的/>,为特征波长矩阵中列矩阵的个数,/>为特征波长矩阵中第q1个列矩阵对胆红素浓度的影响因子。
需要说明的是,利用其余各列矩阵对该列矩阵的影响系数进行加权平均,以得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子;单个列矩阵会受到多个列矩阵的影响,但更加关注的应当是接近于胆红素吸收峰所在的波长,若有多个接近于的波长均对该波长影响较大,即其对应吸收率变化包含了较多关于胆红素含量信息,故赋予其较高的影响因子。
至此,得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子。
步骤S005、根据特征波长矩阵中每个列矩阵对胆红素浓度的影响因子,得到岭回归算法的回归模型,根据回归模型和特征波长矩阵中每个列矩阵对应的特征波长的均值,得到待测光谱数据对应的胆红素浓度预测值。
需要说明的是,上述得到了各个列矩阵对胆红素浓度的影响因子,通过影响因子对传统岭回归算法的最小化目标函数进行修正,得到回归模型。
具体的,根据特征波长矩阵中每个列矩阵对胆红素浓度的影响因子和新生儿的实际胆红素浓度,得到岭回归算法的回归模型,具体如下:
式中,的具体获取方法如下:获取特征波长矩阵中每个特征波长对应的吸收率,将特征波长矩阵中每个特征波长替换为特征波长对应的吸收率,得到一个吸收率矩阵,记为/>,/>的具体获取方法如下:将多个新生儿的实际胆红素浓度按照对应的排列次序进行列排列,得到的列矩阵记为y,/>为待求解系数矩阵,需要说明的是,待求解系数矩阵是一个k行1列的列矩阵,列矩阵中每个元素的区域范围为/>,后续可通过岭回归算法的目标函数的最小输出值确定,为岭回归算法的现有方法,/>为取二范数,/>为待求解参数,其中/>可通过交叉验证来确定,具体获取为岭回归算法中交叉验证的现有方法,本实例不再赘述,/>为岭回归算法的目标函数的输出值,/>为权重系数矩阵,权重系数矩阵的具体获取方法如下:
其中,为特征波长矩阵中第1个列矩阵对胆红素浓度的影响因子,/>为特征波长矩阵中第2个列矩阵对胆红素浓度的影响因子,/>为特征波长矩阵中第k个列矩阵对胆红素浓度的影响因子,权重系数矩阵中主对角线是若干影响因子。
需要说明的是,在得到列矩阵对胆红素浓度的影响因子后,考虑影响因子更大的列矩阵,其对应修正项权重系数应当更大,因为岭回归法的目标函数是由两部分构成,前半部分可以看作是传统最小二乘回归的目标函数;后半部分可以看作是修正项,在每个维度上加了一个误差大小,所以在修正项中,对应维度权重系数更大,则需要更小的分量降低缩小。
进一步地,将最小值对应的/>,作为最终系数矩阵,根据最终系数矩阵得到岭回归算法的回归模型。需要说明的是,根据最终系数矩阵得到回归模型为岭回归算法的现有方法,本实施例不再赘述。
进一步地,获取一个待测光谱数据,根据回归模型和特征波长矩阵中每个列矩阵对应的特征波长的均值,得到待测光谱数据对应的胆红素浓度预测值,具体如下:
重新获取一个光谱数据,记为待测光谱数据,待测光谱数据对应的新生儿和上述N个新生儿不同;获取特征波长矩阵中每个列矩阵对应的特征波长的均值,需要说明的是,若特征波长的均值为小数,用向下取整的结果来代替均值;将每个均值在待测光谱数据中对应的吸收率带入到岭回归算法的回归模型中,将岭回归算法的回归模型的输出值作为待测光谱数据对应的胆红素浓度预测值,完成对胆红素浓度的预测。通过光谱数据进行新生儿皮肤胆红素浓度的测定,其非侵入性检测无需抽血等操作,降低感染风险的同时可以有效帮助医护人员及时了解黄疸症状,进而帮助医护人员进行新生儿黄疸的筛查。
通过以上步骤,完成基于云计算的新生儿黄疸筛查方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于云计算的新生儿黄疸筛查方法,其特征在于,该方法包括以下步骤:
采集若干不同新生儿皮肤的光谱数据和新生儿的实际胆红素浓度,获取若干光谱数据的排列次序,获取胆红素在光谱数据中对应的标准波长,所述光谱数据包含若干波长和波长对应的吸收率;
根据光谱数据中每个波长对应的吸收率得到每个光谱数据的若干特征波长;
根据光谱数据及特征波长,获取每个光谱数据中每个特征波长对应的吸收率序列,根据不同光谱数据中特征波长对应的吸收率序列和特征波长,得到不同光谱数据中任意两个特征波长的相似性;将包含特征波长最多的光谱数据,记为标准光谱数据;
根据不同光谱数据中任意两个特征波长的相似性和排列次序,得到标准光谱数据中每个特征波长对应的列矩阵,根据标准光谱数据中每个特征波长对应的列矩阵,得到特征波长矩阵,根据光谱数据中每个波长对应吸收率的一阶前向差分和特征波长矩阵,得到特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数,根据特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数和标准波长,得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子;
根据特征波长矩阵中每个列矩阵对胆红素浓度的影响因子和新生儿的实际胆红素浓度,得到岭回归算法的回归模型,获取一个待测光谱数据,根据回归模型和特征波长矩阵中每个列矩阵对应的特征波长的均值,得到待测光谱数据对应的胆红素浓度预测值。
2.根据权利要求1所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述根据光谱数据中每个波长对应的吸收率得到每个光谱数据的若干特征波长,包括的具体步骤如下:
,其中/>表示若干不同新生儿皮肤的光谱数据中任意一个光谱数据中第/>个波长对应的吸收率,预设一个第二数值,记为/>,/>表示该光谱数据中以第/>个波长为中心,邻域半径为/>的波长范围中第/>个波长对应的吸收率,其中/>,预设一个第一阈值,记为/>,若/>且/>,将第/>个波长作为该光谱数据的一个特征波长。
3.根据权利要求2所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述获取每个光谱数据中每个特征波长对应的吸收率序列的具体方法如下:
以第i个光谱数据中第p个特征波长为中心,邻域半径为的波长范围,作为第i个光谱数据中第p个特征波长的邻域范围,将第p个特征波长的邻域范围中所有波长对应的吸收率,按照邻域范围中波长在第i个光谱数据中的次序进行排列,得到第i个光谱数据中第p个特征波长对应的吸收率序列。
4.根据权利要求1所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述根据不同光谱数据中特征波长对应的吸收率序列和特征波长,得到不同光谱数据中任意两个特征波长的相似性,包括的具体步骤如下:
式中,为第i个光谱数据中第p个特征波长,/>为第j个光谱数据中第q个特征波长,为取绝对值,/>为第i个光谱数据中第p个特征波长对应的吸收率序列,/>为第j个光谱数据中第q个特征波长对应的吸收率序列,/>为第i个光谱数据中第p个特征波长对应的吸收率序列和第j个光谱数据中第q个特征波长对应的吸收率序列的皮尔逊相关系数,其中/>,/>为第i个光谱数据中第p个特征波长和第j个光谱数据中第q个特征波长的相似性。
5.根据权利要求1所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述根据不同光谱数据中任意两个特征波长的相似性和排列次序,得到标准光谱数据中每个特征波长对应的列矩阵,包括的具体步骤如下:
在除标准光谱数据外的任意一个光谱数据中,获取与标准光谱数据中第一个特征波长相似性最高的特征波长,记为标准光谱数据中第一个特征波长的一个相似特征波长,在除标准光谱数据外的每个光谱数据中,获取与标准光谱数据中第一个特征波长相似性最高的特征波长,得到标准光谱数据中第一个特征波长的若干相似特征波长,将标准光谱数据中第一个特征波长和若干相似特征波长按照所属光谱数据的排列次序进行列排列,得到标准光谱数据中第一个特征波长对应的列矩阵,以此类推,得到标准光谱数据中每个特征波长对应的列矩阵。
6.根据权利要求1所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述根据标准光谱数据中每个特征波长对应的列矩阵,得到特征波长矩阵,包括的具体步骤如下:
将标准光谱数据中所有特征波长对应的列矩阵按照特征波长的次序横向拼接,形成一个具有相同行数但列数增加的大矩阵,记为特征波长矩阵。
7.根据权利要求3所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述根据光谱数据中每个波长对应吸收率的一阶前向差分和特征波长矩阵,得到特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数,包括的具体步骤如下:
式中,的具体获取方法如下:将特征波长矩阵的第i行中第p1个特征波长在第i个光谱数据中对应的特征波长,记为第一特征波长,将特征波长矩阵的第i行中第q1个特征波长在第i个光谱数据中对应的特征波长,记为第二特征波长,将第一特征波长记为TS1,将第二特征波长记为TS2,若/>,将第一特征波长的左邻域范围中第v个波长对应的吸收率记为/>;若/>,将第一特征波长的右邻域范围中第v个波长对应的吸收率记为/>,若/>,将特征波长矩阵的第i行中第p1个特征波长对应的吸收率记为/>,其中第一特征波长的左邻域范围为:第一特征波长的邻域范围中第一特征波长左侧的邻域范围,第一特征波长的右邻域范围为:第一特征波长的邻域范围中第一特征波长右侧的邻域范围;/>为第一特征波长沿任意一侧的邻域范围中波长的个数,/>为特征波长矩阵的总行数,/>的具体获取方法如下:若/>,/>,若,/>,/>为特征波长矩阵的第i行中第p1个特征波长,/>为特征波长矩阵的第i行中第q1个特征波长,/>为第i个光谱数据中第v个波长对应吸收率的一阶前向差分,/>为第i个光谱数据中第v个波长,/>为特征波长矩阵中第p1个列矩阵对第q1个列矩阵的影响系数。
8.根据权利要求1所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述根据特征波长矩阵中每个列矩阵对另外一个列矩阵的影响系数和标准波长,得到特征波长矩阵中每个列矩阵对胆红素浓度的影响因子,包括的具体步骤如下:
式中,为特征波长矩阵的第p1个列矩阵中所有特征波长的均值,/>为标准波长,/>为取绝对值,/>为特征波长矩阵中第p1个列矩阵对第q1个列矩阵的影响系数,/>为归一化函数,/>为特征波长矩阵中列矩阵的个数,/>为特征波长矩阵中第q1个列矩阵对胆红素浓度的影响因子。
9.根据权利要求1所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述根据特征波长矩阵中每个列矩阵对胆红素浓度的影响因子和新生儿的实际胆红素浓度,得到岭回归算法的回归模型,包括的具体步骤如下:
式中,的具体获取方法如下:获取特征波长矩阵中每个特征波长对应的吸收率,将特征波长矩阵中每个特征波长替换为特征波长对应的吸收率,得到一个吸收率矩阵,记为/>,的具体获取方法如下:将多个新生儿的实际胆红素浓度按照对应的排列次序进行列排列,得到的列矩阵记为y,/>为待求解系数矩阵,/>为取二范数,/>为待求解参数,/>为岭回归算法的目标函数的输出值,/>为权重系数矩阵,权重系数矩阵的具体获取方法如下:
其中,为特征波长矩阵中第1个列矩阵对胆红素浓度的影响因子,/>为特征波长矩阵中第2个列矩阵对胆红素浓度的影响因子,/>为特征波长矩阵中第k个列矩阵对胆红素浓度的影响因子;
将最小值对应的/>,作为最终系数矩阵,根据最终系数矩阵得到岭回归算法的回归模型。
10.根据权利要求1所述基于云计算的新生儿黄疸筛查方法,其特征在于,所述获取一个待测光谱数据,根据回归模型和特征波长矩阵中每个列矩阵对应的特征波长的均值,得到待测光谱数据对应的胆红素浓度预测值,包括的具体步骤如下:
重新获取一个光谱数据,记为待测光谱数据,获取特征波长矩阵中每个列矩阵对应的特征波长的均值,将每个均值在待测光谱数据中对应的吸收率带入到岭回归算法的回归模型中,将岭回归算法的回归模型的输出值作为待测光谱数据对应的胆红素浓度预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311773576.7A CN117454200B (zh) | 2023-12-22 | 2023-12-22 | 基于云计算的新生儿胆红素浓度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311773576.7A CN117454200B (zh) | 2023-12-22 | 2023-12-22 | 基于云计算的新生儿胆红素浓度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117454200A true CN117454200A (zh) | 2024-01-26 |
CN117454200B CN117454200B (zh) | 2024-04-02 |
Family
ID=89584000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311773576.7A Active CN117454200B (zh) | 2023-12-22 | 2023-12-22 | 基于云计算的新生儿胆红素浓度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117454200B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4029085A (en) * | 1976-03-26 | 1977-06-14 | Purdue Research Foundation | Method for determining bilirubin concentration from skin reflectance |
US5435309A (en) * | 1993-08-10 | 1995-07-25 | Thomas; Edward V. | Systematic wavelength selection for improved multivariate spectral analysis |
US6587692B1 (en) * | 2000-03-30 | 2003-07-01 | Lucent Technologies Inc. | Location determination using weighted ridge regression |
US20150359459A1 (en) * | 2013-03-12 | 2015-12-17 | University Of Washington Through Its Center For Commercialization | Systems, devices, and methods for estimating bilirubin levels |
CN116994117A (zh) * | 2023-08-14 | 2023-11-03 | 深圳先闻科技有限公司 | 目标光谱分析模型的训练方法、装置、设备及存储介质 |
-
2023
- 2023-12-22 CN CN202311773576.7A patent/CN117454200B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4029085A (en) * | 1976-03-26 | 1977-06-14 | Purdue Research Foundation | Method for determining bilirubin concentration from skin reflectance |
US5435309A (en) * | 1993-08-10 | 1995-07-25 | Thomas; Edward V. | Systematic wavelength selection for improved multivariate spectral analysis |
US6587692B1 (en) * | 2000-03-30 | 2003-07-01 | Lucent Technologies Inc. | Location determination using weighted ridge regression |
US20150359459A1 (en) * | 2013-03-12 | 2015-12-17 | University Of Washington Through Its Center For Commercialization | Systems, devices, and methods for estimating bilirubin levels |
CN116994117A (zh) * | 2023-08-14 | 2023-11-03 | 深圳先闻科技有限公司 | 目标光谱分析模型的训练方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
ANIMESH HALDER ET AL.: "A Novel Whole Spectrum-Based Non-Invasive Screening Device for Neonatal Hyperbilirubinemia", IEEE JOURNAL OF BIOMEDICAL AND HEALTH INFORMATICS, vol. 23, no. 6, 30 November 2019 (2019-11-30), XP011754067, DOI: 10.1109/JBHI.2019.2892946 * |
李天渝等: "男性血清胆红素参考值与地理因素的岭回归分析", 暨南大学学报(自然科学与医学版), vol. 39, no. 4, 31 August 2018 (2018-08-31) * |
Also Published As
Publication number | Publication date |
---|---|
CN117454200B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110132862B (zh) | 小麦赤霉病检测专属病情指数构建方法及其应用 | |
Mao et al. | Nondestructive measurement of total nitrogen in lettuce by integrating spectroscopy and computer vision | |
CN107174258A (zh) | 血糖浓度预测方法 | |
Li et al. | Wavelength selection method for near-infrared spectroscopy based on standard-sample calibration transfer of mango and apple | |
Yuan et al. | Models fused with successive CARS-PLS for measurement of the soluble solids content of Chinese bayberry by vis-NIRS technology | |
Lu et al. | Fluorescence hyperspectral image technique coupled with HSI method to predict solanine content of potatoes | |
CN107928631B (zh) | 基于差分路径因子估计的近红外脑功能信号处理方法 | |
Wu et al. | Study on the optimal algorithm prediction of corn leaf component information based on hyperspectral imaging | |
CN111999258A (zh) | 一种面向光谱基线校正的加权建模局部优化方法 | |
CN110567894A (zh) | 一种含水溶液pH值快速检测方法和检测装置 | |
CN111896497B (zh) | 一种基于预测值的光谱数据修正方法 | |
CN117454200B (zh) | 基于云计算的新生儿胆红素浓度预测方法 | |
Hao et al. | Study on robust model construction method of multi-batch fruit online sorting by near-infrared spectroscopy | |
Wang et al. | SVM classification method of waxy corn seeds with different vitality levels based on hyperspectral imaging | |
CN113267458A (zh) | 甘薯可溶性蛋白质含量定量预测模型的建立方法 | |
CN105259136A (zh) | 近红外校正模型的无测点温度修正方法 | |
Wu et al. | Characterization of Pepper Ripeness in the Field Using Hyperspectral Imaging (HSI) with Back Propagation (BP) Neural Network and Kernel Based Extreme Learning Machine (KELM) Models | |
Li et al. | A two-dimensional sample screening method based on data quality and variable correlation | |
Pan et al. | Improvement of the prediction of a visual apple ripeness index under seasonal variation by NIR spectral model correction | |
CN110231300A (zh) | 一种无损快速鉴别真假阿克苏红富士苹果的方法 | |
Gao et al. | Study on deep learning model for online estimation of chlorophyll content based on near ground multispectral feature bands | |
Wójcik et al. | Deep learning assisted distinguishing of honey seasonal changes using quadruple voltammetric electrodes | |
CN107174204B (zh) | 基于总体最小二乘法的近红外脑功能信号处理方法 | |
CN117556245B (zh) | 一种四甲基氢氧化铵生产过滤杂质检测方法 | |
Yin et al. | Detection of moisture content and size of pumpkin seeds based on hyperspectral reflection and transmission imaging techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |