CN115698711A - 用于预测发展支气管肺发育不良的风险的系统和方法 - Google Patents
用于预测发展支气管肺发育不良的风险的系统和方法 Download PDFInfo
- Publication number
- CN115698711A CN115698711A CN202180038062.XA CN202180038062A CN115698711A CN 115698711 A CN115698711 A CN 115698711A CN 202180038062 A CN202180038062 A CN 202180038062A CN 115698711 A CN115698711 A CN 115698711A
- Authority
- CN
- China
- Prior art keywords
- data
- bpd
- computer
- gas
- implemented method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010006475 bronchopulmonary dysplasia Diseases 0.000 title claims abstract description 208
- 238000000034 method Methods 0.000 title claims abstract description 139
- 210000004072 lung Anatomy 0.000 claims abstract description 102
- 238000004458 analytical method Methods 0.000 claims abstract description 26
- 230000002496 gastric effect Effects 0.000 claims abstract description 24
- 238000005259 measurement Methods 0.000 claims description 90
- 230000003595 spectral effect Effects 0.000 claims description 74
- 238000010801 machine learning Methods 0.000 claims description 66
- 238000012549 training Methods 0.000 claims description 58
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 claims description 41
- 210000001124 body fluid Anatomy 0.000 claims description 41
- 238000004611 spectroscopical analysis Methods 0.000 claims description 34
- 239000010839 body fluid Substances 0.000 claims description 33
- 239000004094 surface-active agent Substances 0.000 claims description 31
- 238000011282 treatment Methods 0.000 claims description 25
- 229910052760 oxygen Inorganic materials 0.000 claims description 24
- 230000028327 secretion Effects 0.000 claims description 23
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 22
- 239000001301 oxygen Substances 0.000 claims description 22
- 239000006228 supernatant Substances 0.000 claims description 22
- 210000004381 amniotic fluid Anatomy 0.000 claims description 17
- 239000008188 pellet Substances 0.000 claims description 16
- 238000001228 spectrum Methods 0.000 claims description 14
- 238000012937 correction Methods 0.000 claims description 13
- 238000012706 support-vector machine Methods 0.000 claims description 13
- 238000005119 centrifugation Methods 0.000 claims description 11
- 230000000153 supplemental effect Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 239000013505 freshwater Substances 0.000 claims description 8
- 150000003839 salts Chemical class 0.000 claims description 8
- 238000002156 mixing Methods 0.000 claims description 7
- 238000001556 precipitation Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000002934 lysing effect Effects 0.000 claims description 3
- 238000002560 therapeutic procedure Methods 0.000 claims description 2
- 238000001035 drying Methods 0.000 claims 1
- 239000002244 precipitate Substances 0.000 claims 1
- 238000011161 development Methods 0.000 description 28
- 230000018109 developmental process Effects 0.000 description 28
- 230000001605 fetal effect Effects 0.000 description 22
- 210000004027 cell Anatomy 0.000 description 19
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 201000010099 disease Diseases 0.000 description 13
- 230000035945 sensitivity Effects 0.000 description 13
- 210000003743 erythrocyte Anatomy 0.000 description 12
- 238000001914 filtration Methods 0.000 description 10
- 238000002203 pretreatment Methods 0.000 description 10
- 238000013473 artificial intelligence Methods 0.000 description 8
- 235000010445 lecithin Nutrition 0.000 description 8
- 239000000787 lecithin Substances 0.000 description 8
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 7
- KILNVBDSWZSGLL-KXQOOQHDSA-N 1,2-dihexadecanoyl-sn-glycero-3-phosphocholine Chemical group CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCC KILNVBDSWZSGLL-KXQOOQHDSA-N 0.000 description 6
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 238000002790 cross-validation Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 229940067606 lecithin Drugs 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 230000035935 pregnancy Effects 0.000 description 6
- 238000010183 spectrum analysis Methods 0.000 description 6
- 238000000528 statistical test Methods 0.000 description 6
- 208000005107 Premature Birth Diseases 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000000090 biomarker Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 239000012530 fluid Substances 0.000 description 5
- 230000002028 premature Effects 0.000 description 5
- 238000010521 absorption reaction Methods 0.000 description 4
- 238000000862 absorption spectrum Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 4
- 238000010790 dilution Methods 0.000 description 4
- 239000012895 dilution Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 239000000815 hypotonic solution Substances 0.000 description 4
- 229940066294 lung surfactant Drugs 0.000 description 4
- 239000003580 lung surfactant Substances 0.000 description 4
- 238000004476 mid-IR spectroscopy Methods 0.000 description 4
- 150000003904 phospholipids Chemical class 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 230000000241 respiratory effect Effects 0.000 description 4
- 230000009469 supplementation Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000000411 transmission spectrum Methods 0.000 description 4
- 230000036266 weeks of gestation Effects 0.000 description 4
- 239000013543 active substance Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000005399 mechanical ventilation Methods 0.000 description 3
- 230000029058 respiratory gaseous exchange Effects 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 238000002627 tracheal intubation Methods 0.000 description 3
- 229910004261 CaF 2 Inorganic materials 0.000 description 2
- 241000288748 Chrysochloridae Species 0.000 description 2
- 206010058314 Dysplasia Diseases 0.000 description 2
- 238000001157 Fourier transform infrared spectrum Methods 0.000 description 2
- 108090001030 Lipoproteins Proteins 0.000 description 2
- 102000004895 Lipoproteins Human genes 0.000 description 2
- 206010036590 Premature baby Diseases 0.000 description 2
- 238000002669 amniocentesis Methods 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 230000009172 bursting Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 229940092456 curosurf Drugs 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000003026 hypopharynx Anatomy 0.000 description 2
- -1 lecithins Chemical class 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 208000018773 low birth weight Diseases 0.000 description 2
- 231100000533 low birth weight Toxicity 0.000 description 2
- 210000005265 lung cell Anatomy 0.000 description 2
- 230000007040 lung development Effects 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 238000002640 oxygen therapy Methods 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 238000011321 prophylaxis Methods 0.000 description 2
- 230000002685 pulmonary effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000013112 stability test Methods 0.000 description 2
- 150000003431 steroids Chemical class 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000009423 ventilation Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 206010003598 Atelectasis Diseases 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 208000007123 Pulmonary Atelectasis Diseases 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 208000030963 borderline personality disease Diseases 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229940026289 infasurf Drugs 0.000 description 1
- 238000012844 infrared spectroscopy analysis Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 238000006213 oxygenation reaction Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 208000005069 pulmonary fibrosis Diseases 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 229940063649 survanta Drugs 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N2021/3595—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/36—Gynecology or obstetrics
- G01N2800/368—Pregnancy complicated by disease or abnormalities of pregnancy, e.g. preeclampsia, preterm labour
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/50—Determining the risk of developing a disease
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Cell Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本公开涉及一种用于预测婴儿发展支气管肺发育不良(BPD)的风险的计算机实施的方法,所述方法包括以下步骤:获得婴儿的数据集,所述数据集包括a.临床数据;b.肺成熟度数据;和c.胃抽吸物(GAS)数据;分析所述数据集,从而获得分析的数据结果;和基于所述分析的数据结果预测婴儿发展BPD的风险。
Description
本公开涉及一种计算机实施的方法、一种用于预测BPD的机器学习模型的受监督的训练的方法以及用于预测婴儿发展支气管肺发育不良(BPD)的风险的系统。
发明背景
早产婴儿,尤其是在妊娠28周之前出生的婴儿,出生时肺泡很少。存在的肺泡也倾向于不够成熟,无法正常工作,并且所述婴儿可能需要氧气的呼吸支持来维持呼吸。
当通气的婴儿无法脱离长时间的高氧气输送时,通常怀疑是支气管肺发育不良(BPD)。BPD的诊断标准多种多样,但通常取决于患者在出生后长时间(最常是28天)需要补充氧气供应。如果符合该标准,则通常对患者进行胸部x光拍摄,并检查BPD的特征性体征,包括肺气肿、肺瘢痕和肺不张。
尽管BPD的临床分类依赖于评估在出生后期(通常在出生后第28天)的补充氧气供应,但已知,早期治疗,包括在出生第8天之前施用类固醇,可以防止BPD的发展。然而,与所述治疗相关的风险可能胜过益处,使得治疗仅在确认疾病后才是合适的选择。因此,迫切需要对BPD的发展进行早期预测,因为它可以帮助减少疾病相关的短期和长期影响。
发明内容
早期预测BPD的发展对于有效干预疾病至关重要。已经研究了各种临床因素和生物标志物,以评估婴儿发展BPD的风险,例如临床评分系统、血浆蛋白质组分析和血细胞计数(嗜中性粒细胞与淋巴细胞比率)。
本发明人已经认识到,通过分析胃抽吸物(GAS)数据、临床数据和肺成熟度数据,可以在出生后早期以高灵敏度和特异性预测BPD的发展。对BPD发展的早期预测能够确保对婴儿进行充分治疗成为可能,从而为降低与疾病相关的显著死亡率和发病率提供可能性。
因此,在第一个方面,本发明涉及一种用于预测婴儿发展支气管肺发育不良(BPD)的风险的计算机实施的方法,所述方法包括以下步骤:
a)获得婴儿的数据集,所述数据集包括:
·临床数据;
·肺成熟度数据;和
·胃抽吸物(GAS)数据;
b)分析所述数据集,从而获得分析的数据结果;和
c)基于所述分析的数据结果预测婴儿发展BPD的风险。
GAS数据优选以光谱数据提供,例如中红外光谱数据。GAS数据的优选光谱包括900-3400cm-1范围内的波长,例如900-1800cm-1范围内和2800-3400cm-1范围内的波长。可以选择FTIR光谱数据,例如指示BPD发展的光谱线处的测量数据,并与数据集的其他数据一起构成预测婴儿中的BPD发展的基础。
第二,数据集可以包括临床数据,所述临床数据包括与BPD发展相关的标志物,例如孕龄和/或出生体重。
第三,数据集可以进一步包括指示肺成熟度的肺成熟度数据。优选地,肺成熟度数据以婴儿是否已被给予或者待被给予表面活性物质治疗的二进制值(+/-)的形式提供。
表面活性物质治疗(表面活性物质替代疗法)可以例如被给予患有RDS的婴儿,以防止肺泡粘连在一起,并且在大多数情况下与补充氧气或机械通气结合施用,以帮助婴儿呼吸。
在另一个方面,本发明涉及一种用于机器学习模型的受监督的训练的方法,所述机器学习模型用于在出生后早期预测受试者(例如,婴儿)是否处于发展BPD的风险中。优选地,所述方法包括在出生后不久获得包括多个婴儿的信息的数据集。此后,可以基于所述数据集以及包括与所述婴儿是否患有或发展BPD相关的信息的结果数据来训练机器学习模型。数据集优选包括临床数据、肺成熟度数据和/或GAS数据。
如本发明人所示,出生后很快就发展BPD的婴儿的胃抽吸物和未发展BPD的婴儿的胃抽吸物是不同的。事实上,主要在胎儿肺部产生的胃抽吸物提供了胎儿肺生物化学的高度详细的数字指纹,其可用于预测BPD的发展。
在本公开的一个实施方案中,基于结果数据训练人工智能(AI)模型,以选择胃抽吸物测量的数据点或光谱线,其中选择数据点或光谱线以最准确地区分发展BPD的婴儿和未发展BPD的婴儿。因此,机器学习模型的训练可能不需要胃抽吸物的相关分子和生物标志物的先验知识。训练可以是AI模型的受监督的训练。
在又一个方面,本发明涉及一种系统,其用于在出生后早期预测婴儿是否处于发展BPD的风险中,所述系统包括存储器和处理单元,所述处理单元被配置为执行本文所公开的计算机实施的方法。优选地,所述系统进一步包括至少一个用于获得光谱数据的光谱单元,例如光谱仪。
附图说明
图1显示了BPD发展研究的流程图,包括患有BPD和未患有BPD的婴儿的纳入和数量。
图2显示了根据本公开的一个实施方案,使用用于基于胃抽吸物的光谱数据预测支气管肺发育不良的经训练的机器学习模型的结果。
图3显示了根据本公开的一个实施方案,使用用于基于胃抽吸物的光谱和临床数据预测支气管肺发育不良的经训练的机器学习模型的结果。
发明详述
在第一个方面,本公开涉及一种用于预测婴儿发展支气管肺发育不良(BPD)的风险的计算机实施的方法。所述方法包括以下步骤:获得婴儿的数据集,所述数据集包括临床数据;肺成熟度数据;和胃抽吸物(GAS)数据;分析所述数据集,从而获得分析的数据结果;和基于所述分析的数据结果预测婴儿发展BPD的风险。
在本公开的优选实施方案中,通过使用经训练的机器学习模型分析数据集来获得分析的数据结果。因此,可以不需要人为干预来执行分析,并且可以基于新数据(例如训练数据)来持续优化经训练的机器学习模型。
早产(preterm birth,又称premature birth),是孕龄小于37周的婴儿出生,而不是通常的约40周。因此,在本公开的又一优选实施方案中,婴儿是早产婴儿,例如在妊娠37周完成之前就出生的婴儿。然而,婴儿可能出生在妊娠早期,例如小于35周的孕龄,甚至小于30周的孕龄。孕龄越小,发展BPD的风险越高。
这种相关性的一个原因可能是早产婴儿的肺部发育较差。通常来说,在约16至26周的矫正胎龄(PMA)肺泡和肺毛细血管形成。约PMA 26周后,球囊(saccules)增大,而在约32周,肺泡发育。因此,早产可能与肺部发育不良有关,其中较低的孕龄意味着肺部发育较差。在过去几十年中,孕龄小于或等于28周的存活婴儿的BPD发病率相对稳定在约40%。
本公开方法的一个显著优势是它能够在早期预测BPD的发展。因此,在本公开的一个实施方案中,数据集包含以下或由以下组成:在出生后48小时内,更优选在出生后36小时内,最优选在出生后24小时内获得的数据,例如在出生时获得的数据。越早获得数据集的数据,就能越早预测婴儿中的BPD发展,因此,越早开始有针对性的干预,有可能显著改善结果。早期干预可以包括使用表面活性物质和新药物,和/或通气模式的预防性和针对性的预防性、治疗性干预。BPD的治疗和预防性治疗的各种策略是本领域技术人员已知的。
GAS数据
在本公开的一个实施方案中,GAS数据来自光谱数据,例如包含光谱数据如中红外光谱数据或由其组成。GAS数据可以来自或包含900-3400cm-1之间,例如900-1800cm-1之间和2800-3400cm-1之间的光谱中的光谱数据。GAS的光谱测量,例如通过FTIR光谱法,能够获得胎儿肺生物化学的高度详细的数字指纹。因此,GAS数据可以包括FTIR光谱波长和/或吸收强度,并且可以与被评估以预测BPD的其他标志物组合。胎儿肺生物化学的高度详细的数字指纹至少部分归因于包含胎儿肺部产生的流体的GAS。
在本公开的实施方案中,GAS数据来自一个或多个吸收光谱和/或一个或多个透射光谱,例如包含一个或多个吸收光谱和/或一个或多个透射光谱或由其组成。GAS数据可以由来自单个光谱测量的数据组成,或者GAS数据可以包括来自多个光谱测量的数据。此外,可以已经对不同类型的体液进行了多次测量。在本公开的优选实施方案中,GAS数据来自GAS样品,例如预处理的GAS样品的测量。
光谱测量
在本公开的优选实施方案中,GAS数据来自光谱数据。光谱数据可以已通过GAS样品的光谱分析获得。光谱数据可以反映GAS样品在中红外区域(3200–900cm-1)的吸收。
GAS数据优选来自GAS样品的测量。GAS样品优选包含胃抽吸物或由其组成。可选地或另外,GAS样品可以包含其他体液,例如咽分泌物(例如,下咽分泌物或口咽分泌物)和羊水或其组合,或由其组成。优选地,GAS样品在分析/测量期间是基本上干燥的。
预处理
在本公开的实施方案中,在光谱分析之前对GAS样品进行预处理,优选非侵入性预处理。GAS样品的预处理可以例如包括以下或由以下组成:离心以形成沉淀,并丢弃上清液。可选地或另外,预处理可以包括储存,优选冷储存,例如约4℃。
在本公开的优选实施方案中,GAS数据和/或肺成熟度数据来自已经过预处理的体液,例如胃抽吸物(GAS)、咽分泌物(例如,下咽分泌物或口咽分泌物)、羊水或GAS的测量。
体液的预处理可以例如包括以下或由以下组成:细胞裂解,例如通过与低渗溶液混合,离心以形成沉淀,优选随后丢弃上清液。可选地或另外,预处理可以包括储存,优选冷储存,例如约4℃,或甚至低于融点。
红细胞和其他细胞通常存在于GAS中。为了减少来自这些来源的GAS污染以改善磷脂测量,早先的通常做法是将羊水或GAS离心,然后在L/S测量之前丢弃沉淀。然而,这种方法减少了表面活性物质的量,导致肺成熟度的测量较不准确。
相比之下,优选的是,肺成熟度数据来自体液(例如GAS)的测量,例如测量数据,其中体液的细胞已经被裂解,例如通过与低渗溶液混合被裂解。进一步优选的是,离心裂解后的体液,离心的旋转离心力(RCF)和时间被选择为使得体液样品的LB形成沉淀,而例如裂解的细胞的细胞碎片和其他较小的组分(例如盐)保留在上清液中。足够的RCF和时间可以例如为约4000g和4分钟。优选地,离心后丢弃上清液。进一步优选的是,(优选经过稀释和离心的)体液的测量包括FTIR测量。FTIR测量因此可以是LB沉淀的测量结果,例如干燥透射FTIR,用于评估肺成熟度。
鞘磷脂通常很少存在于红细胞的外膜中。因此,与不去除红细胞相比,在测量(例如,通过光谱法,例如FTIR)之前有效去除红细胞可能导致L/S值略微增加。因此,与不去除红细胞相比,相应的L/S截止值可能更高。
在本公开的优选实施方案中,体液的预处理包括用低渗液体,例如水溶液,例如淡水(freshwater)稀释。用低渗透压液体(如淡水)稀释,使体液暴露在低渗条件下,导致任何存在的细胞如红细胞爆裂。优选地,预处理进一步包括对稀释的体液进行离心。离心优选在使得裂解物(例如,破裂的红细胞膜)和溶液中其他小的组分(例如,蛋白和/或盐)最终在上清液中而LB形成沉淀的相对离心力和时间下进行,例如约4000g,4分钟。借此丢弃上清液。进一步优选的是,(优选经稀释和离心的)体液的测量包括FTIR测量。因此,FTIR测量可以是LB沉淀的测量,用于评估肺成熟度。
获得GAS样品
在本公开的优选实施方案中,已非侵入性地获得GAS样品。在本公开的另一个实施方案中,通过饲管与通过所述饲管转移GAS的装置(例如,注射器或抽吸导管)的组合,从婴儿收集GAS样品。例如,可以使用连接到注射器的饲管或连接到气管抽吸装置的抽吸导管来收集GAS。当建立用于呼吸稳定的nCPAP或用于复苏的插管时,可以按常规放置饲管或抽吸导管。
临床数据
在本公开的实施方案中,临床数据包括选自以下的数据或由选自以下的数据组成:出生体重、孕龄、性别、婴儿是否已被诊断患有RDS的指标、(在相关情况下)RDS的严重程度或其组合。极端早产和极低出生体重已被充分确定为BPD的风险因素。孕龄和出生体重与BPD的发病率以及疾病的严重程度成反比。已知与女性相比,男性婴儿发展BPD的风险更高。已知BPD的其他临床标志物,例如Trembath等人“Predictors of BronchopulmonaryDysplasia”,Clin.Perinatol.2013中概述的那些。
肺成熟度数据
在本公开的优选实施方案中,肺成熟度数据是表示婴儿是否已被给予或待被给予表面活性物质治疗的二进制值(+/-)。
如果婴儿待被给予表面活性物质治疗,理想的治疗是通过第一剂量施用尽快开始。优选地,剂量应在出生后1小时内给予,但必须在出生后2小时之前给予。如果婴儿仍在插管且需要大于30%至40%的氧气,则应在4至12小时内给予重复剂量。如果婴儿需要小于30%的氧气,通常会停止后续剂量。典型的表面活性物质包括守肺佳(Survanta)、考法克坦(Infasurf)和固尔苏(Curosurf),与特定的给药指南相关。
在本公开的另一个实施方案中,肺成熟度数据是来自体液,例如胃抽吸物(GAS)、咽分泌物(例如下咽分泌物或口咽分泌物)和羊水或其组合的测量的数据。肺成熟度数据可来自于肺成熟度测试,例如微泡稳定性测试、板层小体(lamellar body)计数和/或光谱测量。优选地,在本公开的实施方案中,肺成熟度数据是光谱数据或来自光谱数据。因此,体液的所述测量可以是光谱测量,优选是非侵入性的。
肺表面活性物质是肺泡中II型肺细胞中产生的一种表面活性脂蛋白复合物,其作为板层小体(LB)与肺液一起分泌至羊水和GAS中。肺表面活性物质的主要脂质内容物是DPPC。因此,肺成熟度数据可反映表面活性肺磷脂的含量或比率,所述表面活性肺磷脂例如卵磷脂,如二棕榈酰磷脂酰胆碱(DPPC)和/或鞘磷脂。肺成熟度数据可以例如反映卵磷脂/鞘磷脂比率(L/S)。
在本公开的实施方案中,肺成熟度数据来自以下,例如包含以下或由以下组成:光谱数据,例如中红外光谱数据,用于评估肺成熟度。例如,光谱数据可能已被记录在中红外区域(3400-900cm-1)。例如通过FTIR光谱仪。
在本公开的实施方案中,肺成熟度数据包括相对于截止值的与婴儿的胎儿肺成熟度相关的一个或多个测量值。例如,与婴儿的胎儿肺成熟度相关的测量值,即低于(或高于)所述截止值将与与胎儿肺不成熟有关的疾病(例如RDS)的较高风险相关,而高于(低于)所述截止值的测量值将与与胎儿肺不成熟有关的疾病的较低风险相关。因此,肺成熟度数据可以包括测量值与截止值之间的差异,或者有关测量值是否高于或低于所述截止值的信息。所述截止值可以是约3,优选约3.05,例如以适当单位(例如摩尔/摩尔)显示的3.05。所述截止值可以是L/S值。
卵磷脂-鞘磷脂比率(L/S或L/S比率)是用于评估胎儿肺不成熟的胎儿羊水测试。肺需要表面活性物质来降低肺中肺泡的表面压力。这对早产婴儿在出生后试图扩张其肺部是尤其重要的。
L/S是胎儿肺成熟度的标志物。肺分泌物从胎儿肺部向外流入羊水,使卵磷脂和鞘磷脂的水平保持不变,直到孕龄32至33周左右,此时卵磷脂浓度开始显著增加,而鞘磷脂几乎保持不变。因此,如果羊水样品具有较高的比率,则表明肺中的表面活性物质较多,从而婴儿出生时呼吸困难较小。
数学运算
在本公开的实施方案中,通过将人工智能(AI)模型应用于光谱数据来获得GAS数据。AI模型可能已经通过使用训练数据/结果数据开发,其中不需要相关分子和生物标志物的先验知识。
在本公开的一个实施方案中,通过将数学运算应用于光谱数据获得GAS数据。
GAS数据由此可以利用数学方法衍生自光谱数据。数学运算可以包括去噪、平滑、背景和基线校正、归一化(转换为相对强度的标度)、比对、散射(例如NIR中的散射)校正和/或过滤或其组合。GAS数据可以因此以任何方式被预处理。
通常,信号预处理用于校正和/或去除从随机测量噪声到各种系统误差源的不期望现象的影响:非线性仪器响应、移位问题以及不期望的化学和物理变化的干扰效应。这些运算也称为去噪、平滑、背景和基线校正、归一化(转换为相对强度的标度)、比对(去除水平偏移)和近红外散射校正。此外,例如,通过导数运算来转换信号可以隐含地完成归一化、基线去除和部分条带去卷积(partial band deconvolution)。就去除水平偏移而言,已经提出了数种有助于去除失准(misalignment)的算法。
已知各种过滤方法,其作用是将测量数据利用数学方法转换为相同数据的更好版本,排除一些不期望的变化类型,以及基于模型的方法,其中基于更明确的数学模型获得更好的版本,使得过滤出的信息不会丢失,因为还获得了过滤中涉及的数学参数的统计学估计。
在用于去噪/平滑(即去除无信息的高频变化)的最常用的过滤方法中,有移动平均和多项式Savitsky Golay过滤,其工作基于假设信号与噪声相比是平滑的(单调函数之和);噪声主要是不相关的,且其将被通过温和的方法消除。或者,可以在频率(傅里叶变换)或小波(小波变换)域中去除高频的影响。
因此,在本公开的实施方案中,数学运算包括一阶导数或由其组成。可选地或另外,数学运算可以包括基线校正算法如Savitzky-Golay算法或由其组成。
在本公开的实施方案中,数学运算包括以下或由以下组成:选择测量光谱的预定波数处的测量数据。优选地,测量光谱的预定波数对于预测婴儿是否将发展BPD是重要的。借此,在预定波数处的测量数据可以指示婴儿是否将发展BPD(例如处于发展BPD的风险中)。优选地,预定波数被选择为使得与预定波数相对应的测量数据显示出发展BPD的婴儿与未发展BPD的婴儿之间的差异,优选是统计学上显著的差异。例如,统计学检验可应用于婴儿出生早期获得的数据,其中已知所述婴儿是否发展BPD,以获得与预测BPD在统计学上相关的波数、预定波数。借此,这可以被认为是结果已知的训练集,借此可以获得用于预测BPD的相关波数。优选地,这样的训练集足够大以确保差异是统计学显著的。这样的统计学检验可以是例如配对Cox-Wilcoxon检验,例如双尾p值<0.05。
在本公开的实施方案中,数学运算包括用于多变量数据分析的偏最小二乘分析或其他方法,或由其组成。PLS可以进一步与诸如线性判别分析等其他分类技术结合使用。
在本公开的实施方案中,GAS数据通过包括以下的过程获得:(非侵入性地)获得GAS样品;(可选地)储存GAS样品;(可选地)预处理GAS样品;和通过使用诸如中红外光谱法的光谱法分析/测量GAS样品来获得光谱数据;(可选地)将一种或多种数学运算应用于光谱数据。借此,从GAS样品的光谱测量中获得GAS数据。
疾病
在本公开的实施方案中,BPD被定义为出生后特定天数(例如出生后第28天)需要补充氧气支持。或者,BPD可以根据2000年6月的国家儿童健康与人类发展研究所(NationalInstitute of Child Health and Human Development,NICHD)定义来定义,包括基于严重程度的定义,其基于出生后年龄或PMA将BPD分类为轻度、中度或重度。借此,轻度BPD被定义为在最初28天内需要补充氧气(O2),但在PMA 36周或出院时不需要补充氧气(O2);中度BPD被定义为在前28天需要O2,以及在PMA 36周时需要使用<30% O2进行治疗;重度BPD被定义为在最初28天内需要O2,以及在PMA 36周时需要使用≥30% O2和/或正压进行治疗。存在其他定义,包括生理学定义。
无论使用哪种BPD定义,在进行BPD分类之前都需要一段时间。这使得确定对处于BPD风险中的早产婴儿的治疗具有挑战性。妊娠23周出生并在修正胎龄34周时需要机械通气的婴儿很可能在36周时发展BPD,即定义为氧气治疗。该婴儿可能受益于改善短期结果的策略,但其不会降低BPD发病率。
ML模型
在本公开的优选实施方案中,通过使用经训练的机器学习模型分析数据集来获得分析的数据结果。优选地,经训练的机器学习模型是受监督的经训练的模型,或者它可以是受监督的经训练的模型和未受监督的经训练的模型。
在本公开的实施方案中,经训练的模型选自支持向量机(SVM)、回归模型、人工神经网络、决策树、遗传算法、贝叶斯网络或其组合。
在本公开的实施方案中,预测包括婴儿发展BPD的风险百分比,例如根据BPD的任何定义的BPD发展,或由以上组成。或者,预测可进一步包括预测BPD的严重程度,例如轻度BPD、中度BPD或重度BPD。借此,所述模型可以预测婴儿的BPD发展,以及另外或可选地预测BPD的严重程度。预测BPD的严重程度可包括根据BPD的NICHD定义或任何其他基于严重程度的BPD分类系统来预测婴儿中BPD的严重程度。
在本公开的实施方案中,预测的灵敏度为至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%。
在本公开的实施方案中,预测的特异性为至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%。
在本公开的实施方案中,预测的特异性和灵敏度为至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%。
在另一个方面,本公开涉及如本文别处所公开的用于预测婴儿BPD发展的机器学习模型的使用。
在又一个方面,本公开涉及一种用于在出生后早期预测婴儿是否会发展BPD的系统,所述系统包括:
a)存储器,和
b)处理单元,其被配置为执行本文别处公开的预测婴儿BPD发展的方法,和/或其中处理单元被配置为执行本文别处公开的用于预测婴儿BPD发展的机器学习模型的训练。
在本公开的实施方案中,所述系统包括用于获得光谱数据的至少一个光谱单元,例如光谱仪。优选地,所述系统被配置为获得GAS数据。所述系统优选地包括FTIR光谱仪。
在本公开的实施方案中,所述系统是便携式和/或床边系统。本公开的系统的优势在于,它能够在出生后早期获得BPD的预测,因为所述系统可以存在于产房中或附近。
训练
本公开进一步涉及一种用于机器学习模型的受监督的训练的方法,所述机器学习模型用于在出生后早期预测受试者(例如,婴儿)是否患有或将发展支气管肺发育不良(BPD),所述方法包括:获得数据集,所述数据集包含出生后不久的多个婴儿的信息,所述信息包括临床数据;肺成熟度数据;和胃抽吸物(GAS)数据;获得结果数据,所述结果数据包含与婴儿是否患有或发展BPD相关的信息或由其组成;基于婴儿的数据集和结果数据,通过受监督的训练来训练机器学习模型,以在出生后早期预测受试者是否患有和/或将发展BPD。
在本公开的实施方案中,受试者和/或婴儿是早产婴儿,例如在妊娠37周完成之前出生。在本公开的优选实施方案中,婴儿是早产婴儿,例如在妊娠37周完成之前出生的婴儿。早产(preterm birth,又称premature birth),是孕龄小于37周的婴儿出生,而不是通常的约40周。然而,婴儿可能出生在妊娠早期,例如小于35周的孕龄,或甚至小于30周的孕龄。孕龄越小,发展BPD的风险越高。
优选地,数据集包括出生后24小时内获得的数据如出生时获得的数据或由其组成。越早预测婴儿中的BPD发展,就能越早开始有针对性的干预,有可能显著改善结果。早期干预可以包括使用表面活性物质和新药物,和/或通气模式的预防性和针对性的预防性、治疗性干预。BPD的治疗和预防性治疗的各种策略是本领域技术人员已知的。
GAS数据
在本公开的实施方案中,GAS数据来自光谱数据如中红外光谱数据,例如包括光谱数据如中红外光谱数据或由其组成。GAS数据可以例如来自或包含900-3400cm-1之间,例如900-1800cm-1之间和2800-3400cm-1之间的光谱中的光谱数据。GAS的光谱测量,例如通过FTIR光谱法,通常能够获得胎儿肺生物化学的高度详细的数字指纹。因此,GAS数据可以包括FTIR光谱波长和/或吸收强度,并且可以与其他标志物组合进行评估以预测BPD。
在本公开的实施方案中,基于结果数据训练AI模型以选择胃抽吸物测量的数据点或光谱线,其中选择数据点或光谱线以最准确地区分发展BPD的婴儿和未发展BPD的婴儿。因此,机器学习模型的训练可能不需要胃抽吸物的相关分子和生物标志物的先验知识。
在本公开的实施方案中,GAS数据来自一个或多个吸收光谱和/或一个或多个透射光谱,例如包含一个或多个吸收光谱和/或一个或多个透射光谱或由其组成。GAS数据可以由来自单个光谱测量的数据组成,或者GAS数据可以包括来自多个光谱测量的数据。此外,可以已经对不同类型的体液进行了多次测量。在本公开的优选实施方案中,GAS数据来自GAS样品,例如预处理的GAS样品的测量。
光谱测量
在本公开的优选实施方案中,GAS数据来自光谱数据。光谱数据可以通过GAS样品的光谱分析获得。光谱数据可以反映GAS样品在中红外区域(3200-900cm-1)的吸收。
GAS数据优选地来自GAS样品的测量。GAS样品优选包括胃抽吸物或由其组成。可选地或另外,GAS样品可以包括其他体液,例如咽分泌物(例如,下咽分泌物或口咽分泌物)和羊水或其组合,或由其组成。优选地,GAS样品在分析/测量期间是基本上干燥的。
预处理
在本公开的实施方案中,在光谱分析之前对GAS样品进行预处理,优选非侵入性预处理。GAS样品的预处理可以例如包括以下或由以下组成:离心以形成沉淀,并丢弃上清液。可选地或另外,预处理可以包括储存,优选冷储存,例如约4℃。
在本公开的优选实施方案中,GAS数据和/或肺成熟度数据来自已经过预处理的体液,例如胃抽吸物(GAS)、咽分泌物(例如,下咽分泌物或口咽分泌物)、羊水或GAS的测量。
体液的预处理可以例如包括以下或由以下组成:细胞裂解,例如通过与低渗溶液混合,离心以形成沉淀,优选随后丢弃上清液。可选地或另外,预处理可以包括储存,优选冷储存,例如约4℃,或甚至低于融点。
红细胞和其他细胞通常存在于GAS中。为了减少来自这些来源的GAS污染以改善磷脂测量,早先的通常做法是将羊水或GAS离心,然后在L/S测量之前丢弃沉淀。然而,这种方法减少了表面活性物质的量,导致肺成熟度的测量较不准确。
相比之下,优选的是,肺成熟度数据来自体液(例如GAS)的测量,例如测量数据,其中体液的细胞已经被裂解,例如通过与低渗溶液混合被裂解。进一步优选的是,离心裂解后的体液,离心的旋转离心力(RCF)和时间被选择为使得体液样品的LB形成沉淀,而例如裂解的细胞的细胞碎片和其他较小的组分(例如盐)保留在上清液中。足够的RCF和时间可以例如为约4000g和4分钟。优选地,离心后丢弃上清液。进一步优选的是,(优选经过稀释和离心的)体液的测量包括FTIR测量。FTIR测量因此可以是LB沉淀的测量,例如干燥透射FTIR,用于评估肺成熟度。
鞘磷脂通常很少存在于红细胞的外膜中。因此,与不去除红细胞相比,在测量(例如,通过光谱法,例如FTIR)之前有效去除红细胞可能导致L/S值略微增加。因此,与不去除红细胞相比,相应的L/S截止值可能更高。
在本公开的优选实施方案中,体液的预处理包括用低渗液体,例如水溶液,例如淡水稀释。用低渗透压液体(如淡水)稀释,使体液暴露在低渗条件下,导致任何存在的细胞如红细胞爆裂。优选地,预处理进一步包括对稀释的体液进行离心。离心优选在使得裂解物(例如,破裂的红细胞膜)和溶液中其他小的组分(例如,蛋白和/或盐)最终在上清液中而LB形成沉淀的相对离心力和时间下进行,例如约4000g,4分钟。借此丢弃上清液。进一步优选的是,(优选经稀释和离心的)体液的测量包括FTIR测量。因此,FTIR测量可以是LB沉淀的测量,用于评估肺成熟度。
获得GAS样品
在本公开的优选实施方案中,已非侵入性地获得GAS样品。在本公开的另一个实施方案中,通过饲管与通过所述饲管转移GAS的装置(例如,注射器或抽吸导管)的组合,从婴儿收集GAS样品。例如,可以使用连接到注射器的饲管或连接到气管抽吸装置的抽吸导管来收集GAS。当建立用于呼吸稳定的nCPAP或用于复苏的插管时,可以按常规放置饲管或抽吸导管。
临床数据
在本公开的实施方案中,临床数据包括选自以下的数据或由选自以下的数据组成:出生体重、孕龄、性别、婴儿是否已被诊断患有RDS的指标、(在相关情况下)RDS的严重程度或其组合。极端早产和极低出生体重已被充分确定为BPD的风险因素。孕龄和出生体重与BPD的发病率以及疾病的严重程度成反比。已知与女性相比,男性婴儿发展BPD的风险更高。已知BPD的其他临床标志物,例如Trembath等人“Predictors of BronchopulmonaryDysplasia”,Clin.Perinatol.2013中概述的那些。
肺成熟度数据
在本公开的优选实施方案中,肺成熟度数据是表示婴儿是否已被给予或待被给予表面活性物质治疗的二进制值(+/-)。
如果婴儿待被给予表面活性物质治疗,理想的治疗是通过第一剂量施用尽快开始。优选地,剂量应在出生后1小时内给予,但必须在出生后2小时之前给予。如果婴儿仍在插管且需要大于30%至40%的氧气,则应在4至12小时内给予重复剂量。如果婴儿需要小于30%的氧气,通常会停止后续剂量。典型的表面活性物质包括守肺佳、考法克坦和固尔苏,与特定的给药指南相关。
在本公开的另一个实施方案中,肺成熟度数据是来自体液,例如胃抽吸物(GAS)、咽分泌物(例如下咽分泌物或口咽分泌物)和羊水或其组合的测量的数据。肺成熟度数据可来自于肺成熟度测试,例如微泡稳定性测试、板层小体计数和/或光谱测量。优选地,在本公开的实施方案中,肺成熟度数据是光谱数据或来自光谱数据。因此,体液的所述测量可以是光谱测量,优选是非侵入性的。
肺表面活性物质是肺泡中II型肺细胞中产生的一种表面活性脂蛋白复合物,其作为板层小体(LB)与肺液一起分泌至羊水和GAS中。肺表面活性物质的主要脂质内容物是DPPC。因此,肺成熟度数据可反映表面活性肺磷脂的含量或比率,所述表面活性肺磷脂例如卵磷脂,如二棕榈酰磷脂酰胆碱(DPPC)和/或鞘磷脂。肺成熟度数据可以例如反映卵磷脂/鞘磷脂比率(L/S)。
在本公开的实施方案中,肺成熟度数据来自以下,例如包含以下或由以下组成:光谱数据,例如中红外光谱数据,用于评估肺成熟度。例如,光谱数据可能已被记录在中红外区域(3400-900cm-1)。例如通过FTIR光谱仪。
在本公开的实施方案中,肺成熟度数据包括相对于截止值的与婴儿的胎儿肺成熟度相关的一个或多个测量值。例如,与婴儿的胎儿肺成熟度相关的测量值,即低于(或高于)所述截止值将与与胎儿肺不成熟有关的疾病(例如RDS)的较高风险相关,而高于(低于)所述截止值的测量值将与与胎儿肺不成熟有关的疾病的较低风险相关。因此,肺成熟度数据可以包括测量值与截止值之间的差异,或者有关测量值是否高于或低于所述截止值的信息。所述截止值可以是约3,优选约3.05,例如以适当单位(例如摩尔/摩尔)显示的3.05。所述截止值可以是L/S值。
卵磷脂-鞘磷脂比率(L/S或L/S比率)是用于评估胎儿肺不成熟的胎儿羊水测试。肺需要表面活性物质来降低肺中肺泡的表面压力。这对早产婴儿在出生后试图扩张其肺部是尤其重要的。
L/S是胎儿肺成熟度的标志物。肺分泌物从胎儿肺部向外流入羊水,使卵磷脂和鞘磷脂的水平保持不变,直到孕龄32至33周左右,此时卵磷脂浓度开始显著增加,而鞘磷脂几乎保持不变。因此,如果羊水样品具有较高的比率,则表明肺中的表面活性物质较多,从而婴儿出生时呼吸困难较小。
数学运算
在本公开的实施方案中,基于结果数据来训练AI模型以选择胃抽吸物测量的数据点或光谱线,其中选择数据点或光谱线以最准确地区分发展BPD的婴儿和未发展BPD的婴儿。因此,机器学习模型的训练可能不需要胃抽吸物的相关分子和生物标志物的先验知识。
在本公开的实施方案中,通过将数学运算应用于光谱数据获得GAS数据。GAS数据由此可以利用数学方法衍生自光谱数据。数学运算可以包括去噪、平滑、背景和基线校正、归一化(转换为相对强度的标度)、比对、散射(例如NIR中的散射)校正和/或过滤或其组合。GAS数据可以因此以任何方式被预处理。
通常,信号预处理用于校正和/或去除从随机测量噪声到各种系统误差源的不期望现象的影响:非线性仪器响应、移位问题以及不期望的化学和物理变化的干扰效应。这些运算也称为去噪、平滑、背景和基线校正、归一化(转换为相对强度的标度)、比对(去除水平偏移)和近红外散射校正。此外,例如,通过导数运算来转换信号可以隐含地完成归一化、基线去除和部分条带去卷积。就去除水平偏移而言,已经提出了数种有助于去除失准的算法。
已知各种过滤方法,其作用是将测量数据利用数学方法转换为相同数据的更好版本,排除一些不期望的变化类型,以及基于模型的方法,其中基于更明确的数学模型获得更好的版本,使得过滤出的信息不会丢失,因为还获得了过滤中涉及的数学参数的统计学估计。
在用于去噪/平滑(即去除无信息的高频变化)的最常用的过滤方法中,有移动平均和多项式Savitsky Golay过滤,其工作基于假设信号与噪声相比是平滑的(单调函数之和);噪声主要是不相关的,且其将被通过温和的方法消除。或者,可以在频率(傅里叶变换)或小波(小波变换)域中去除高频的影响。
因此,在本公开的实施方案中,数学运算包括一阶导数或由其组成。可选地或另外,数学运算可以包括基线校正算法,例如Savitzky-Golay算法,或由其组成。
在本公开的实施方案中,数学运算包括以下或由以下组成:选择测量光谱的预定波数处的测量数据。优选地,测量光谱的预定波数对于预测婴儿是否将发展BPD是重要的。借此,在预定波数处的测量数据可以指示婴儿是否将发展BPD(例如处于发展BPD的风险中)。优选地,预定波数被选择为使得与预定波数相对应的测量数据显示出发展BPD的婴儿与未发展BPD的婴儿之间的差异,优选是统计学上显著的差异。例如,统计学检验可应用于婴儿出生早期获得的数据,其中已知所述婴儿是否发展BPD,以获得与预测BPD在统计学上相关的波数、预定波数。借此,这可以被认为是结果已知的训练集,从而可以获得用于预测BPD的相关波数。优选地,这样的训练集足够大以确保差异是统计学显著的。这样的统计学检验可以是例如配对Cox-Wilcoxon检验,例如双尾p值<0.05。
在本公开的实施方案中,数学运算包括用于多变量数据分析的偏最小二乘分析或其他方法,或由其组成。PLS可以进一步与诸如线性判别分析等其他分类技术结合使用。
在本公开的实施方案中,GAS数据通过包括以下的过程获得:(非侵入性地)获得GAS样品;(可选地)储存GAS样品;(可选地)预处理GAS样品;和通过使用诸如中红外光谱法的光谱法分析/测量GAS样品来获得光谱数据;(可选地)将一种或多种数学运算应用于光谱数据。借此,从GAS样品的光谱测量中获得GAS数据。
疾病
在本公开的实施方案中,BPD被定义为出生后特定天数(例如出生后第28天)需要补充氧气支持。或者,BPD可以根据2000年6月的国家儿童健康与人类发展研究所(NICHD)定义来定义,包括基于严重程度的定义,其基于出生后年龄或PMA将BPD分类为轻度、中度或重度。借此,轻度BPD被定义为在最初28天内需要补充氧气(O2),但在PMA 36周或出院时不需要补充氧气(O2);中度BPD被定义为在前28天需要O2,以及在PMA 36周时需要使用<30% O2进行治疗;重度BPD被定义为在最初28天内需要O2,以及在PMA 36周时需要使用≥30% O2和/或正压进行治疗。存在其他定义,包括生理学定义。
无论使用哪种BPD定义,在进行BPD分类之前都需要一段时间。这使得确定对处于BPD风险中的早产婴儿的治疗具有挑战性。妊娠23周出生并在修正胎龄34周时需要机械通气的婴儿很可能在36周时发展BPD,即定义为氧气治疗。该婴儿可能受益于改善短期结果的策略,但其不会降低BPD发病率。
ML模型
在本公开的优选实施方案中,通过使用经训练的机器学习模型分析数据集来获得分析的数据结果。优选地,经训练的机器学习模型是受监督的经训练的模型,或者它可以是受监督的经训练的模型和未受监督的经训练的模型。
在本公开的实施方案中,经训练的模型选自支持向量机(SVM)、回归模型、人工神经网络、决策树、遗传算法、贝叶斯网络或其组合。
在本公开的实施方案中,预测包括婴儿发展BPD的风险百分比,例如根据BPD的任何定义的BPD发展,或由以上组成。或者,预测可进一步包括预测BPD的严重程度,例如轻度BPD、中度BPD或重度BPD。借此,所述模型可以预测婴儿的BPD发展,以及另外或可选地预测BPD的严重程度。预测BPD的严重程度可包括根据BPD的NICHD定义或任何其他基于严重程度的BPD分类系统来预测婴儿中BPD的严重程度。
在本公开的实施方案中,预测的灵敏度为至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%。
在本公开的实施方案中,预测的特异性为至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%。
在本公开的实施方案中,预测的特异性和灵敏度为至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%。
在本公开的实施方案中,评估经训练的机器学习模型。经训练的机器学习模型的评估可以通过与机器学习模型训练期间使用的那些不同的数据集和结果数据来执行。
本公开进一步涉及一种用于在出生后早期预测婴儿是否将发展BPD的系统,所述系统包括存储器和处理单元,其被配置为执行如本文别处所述的用于预测婴儿发展支气管肺发育不良(BPD)的风险的方法,和/或如本文别处所述的用于机器学习模型的受监督的训练的方法,所述机器学习模型用于在出生后早期预测婴儿是否患有或将发展支气管肺发育不良(BPD)。
在本公开的实施方案中,所述系统进一步包括至少一个用于获得光谱数据的光谱单元,例如光谱仪。优选地,所述光谱仪被配置为从GAS样品获得光谱数据,并将所述光谱数据提供给处理单元以处理所述光谱数据。因此,所述系统可以包括用于向处理单元和/或存储器提供所述光谱数据的装置。优选地,所述系统进一步包括电源。
实施例
实施例1:用于预测婴儿中的BPD发展的机器学习算法的训练
BPD定义
采用美国国立卫生研究院(NIH)的共识BPD(Consensus BPD)定义。对于在孕龄(GA)<32周出生的婴儿,BPD指的是至少28天(所有BPD严重程度)的氧气支持需求,并在36周(中度至重度BPD)和40周(重度BPD)进行补充评估。
参与者
在24至31个完全孕周之间出生的早产婴儿有资格参加。入选研究的婴儿按照Heiring等人,"Predicting respiratory distress syndrome at birth using a fasttest based on spectroscopy of gastric aspirates:2.Clinical part.”ActaPaediatr.2019中所述进行治疗,如果可能,使用产前类固醇和极早期经鼻CPAP。表面活性物质(固尔苏R)按照欧洲共识RDS管理指南(European Consensus Guidelines)作为INSURE(插管-表面活性物质-拔管)或经鼻CPAP和表面活性物质通过细导管施用。
GAS取样和光谱法
使用连接到注射器的饲管或连接到气管抽吸装置的抽吸导管来收集出生时的GAS样本(0.3-2.5mL)。在建立用于呼吸稳定的nCPAP或用于复苏的插管时,可以按常规放置饲管或抽吸导管。
将出生后立即获得的胃抽吸物储存在4-5℃,并在10天内通过FTIR光谱法进行分析。
FTIR光谱法通过干燥透射进行,并且通过浓缩表面活性物质增强光谱信号,从而避免蛋白、盐或絮状蛋白凝块(例如,粘液)的干扰。
将GAS(200μL)用水稀释四倍,并以4000g离心四分钟。去除上清液后,将样品悬于100μL水中,并分成50μL等分试样。通过在CaF2窗口(1mm厚和13mm直径,Chrystran.com)上通过干燥透射进行FTIR分析,以测量50μL样品。将样品(50μL)施加到CaF2上,并在加热板(90℃)上干燥。FTIR光谱由配备有DTGS检测器的Bruker Tensor 27测量(60次扫描,分辨率为4cm-1)。
基本方法开发原则
采用数据驱动方法开发能够预测BPD的软件算法。将在出生时间附近可获得的临床数据和肺成熟度数据(+/-表面活性物质治疗)与GAS的FTIR光谱数据相结合,从而创建了高度复杂的多变量数据集。使用AI分析这些数据集,并根据BPD的临床发展进行校正。
统计学分析
对于连续变量,通过t检验确定与BPD相关的临床数据点,而对于类别变量,使用卡方检验。配对Cox-Wilcoxon检验用于FTIR光谱数据分析。双尾p值<0.05被认为具有统计学意义。
FTIR光谱数据
FTIR光谱分析范围为900-3400cm-1。使用Savitzky Golay算法校正基线,并使用一阶导数进行光谱数据分析。Cox-Wilcoxon检验用于进一步选择最重要的变量,并从1.200中选择了43个波数。
模型开发
偏最小二乘(PLS)
所使用的PLS算法与“Common framework for linearregression”,Chemometrics and Intelligent Laboratory Systems,2015中所使用的算法相似。在许多情况下,证明了PLS与诸如线性判别分析等其他分类技术相结合所生成的得分图可以分离样品,以更好地确定。
软件
使用R studio(Microsoft R open)软件。使用R编程语言编写的Kernlab包构建了SVM模型。训练样品中模型性能的验证是重复500次的7倍交叉验证。选择最佳参数的标准是分类误差最小化。此外,计算了交叉验证的平均灵敏度和特异性。灵敏度定义为患有BPD的婴儿的正确预测百分比,特异性定义为未发展BPD的婴儿的正确预测。
后果
在72名符合条件的婴儿中,2名婴儿在出生后早期死亡,并且9例未获得父母批准。因此,如图1所示,研究纳入了61名极早产婴儿。纳入的婴儿的临床特征如表1所示。
a中值(范围)
b人数(%)
26例(43%)发展BPD,35例(57%)未发展BPD。10名患有BPD的婴儿在36周时也需要补充氧气,并且2名婴儿在40周时仍需要补充氧气。
纳入的61名婴儿中,大多数39名(64%)患有BPD合并RDS(n=22),或不患有BPD且不患有RDS(n=18)。然而,4名BPD婴儿不患有RDS,17名不患BPD的婴儿患有RDS(表2)。
26名患有BPD的婴儿的出生体重(BW)中值为850g,孕龄(GA)中值为27.3周,且20名(77%)接受了表面活性物质治疗。35名不患BPD的婴儿的BW中值为1,356g,GA中值为30.1周,且7名(20%)接受了表面活性物质治疗。患有BPD的婴儿的BW和GA显著低于不患BPD的婴儿,p<0.001,并且接受了表面活性物质治疗的患有BPD的婴儿比未患BPD的婴儿更多,p<0.001。表面活性物质在中值5.8小时后,最晚33小时后给予(表1)。BW、GA和表面活性物质治疗是与BPD发展相关的重要因素,通过使用逻辑回归模型分析它们,灵敏度和特异性分别为74%和82%。通过应用SVM获得了相似的数据,灵敏度为76%,特异性为82%。
GAS的FTIR光谱数据分析结果确定了最重要的用于分类的波数。为了揭示BPD和无BPD之间波数的显著差异,应用了配对Cox-Wilcoxon检验。从选定的FTIR光谱数据集中选择了总共43个波数。
图2显示了仅从GAS样品获得的FTIR光谱数据预测BPD,而图3显示了当FTIR光谱、临床数据(以出生体重和孕龄的形式)和肺成熟度数据(以是否进行表面活性物质治疗的形式)结合在分析中时,BPD的预测效果如何好。在重复交叉验证结果超过50%的样品中,预测被认为是准确的。从FTIR光谱数据、临床数据和肺成熟度数据的组合数据集中,很难对来自出生后早期用表面活性物质治疗的未患BPD的婴儿的五个样品(编号01、40、41、42、57)进行分类(图3)。PLS分析表明,这些样品的最佳预测仅通过FTIR光谱数据的分析获得。如图2所示,样本编号01、40和42在大于50%的交叉验证中得到了良好的预测,样本41的预测从2%提高至46%。来自患有BPD且未患RDS的婴儿的GAS样品编号04、10、11和35也难以分类。这些婴儿中的其中两名,编号10和11,仅能通过FTIR光谱数据进行分类(图2)。
通过将FTIR光谱数据分析与临床数据和肺成熟度数据(BW、GA和表面活性物质治疗)并入线性SVM分析中,交叉验证后,灵敏度从76%增加至86%,特异性从82%增加至85%。使用通过交叉验证选择的参数,最终计算了61个样品的拟合模型,其灵敏度和特异性分别为88%和91%。一个GAS样品被脓污染。然而,仍然可能使用FTIR测量样品并正确预测BPD。
结论
该研究表明,通过应用AI分析结合GAS的临床数据和FTIR光谱数据的独特多变量数据集,可以预测出生时的BPD。计划进一步开发和验证预测BPD算法,包括数据聚合、盲测和临床研究。
项
1.一种用于预测婴儿发展支气管肺发育不良(BPD)风险的计算机实施的方法,所述方法包括以下步骤:
-获得婴儿的数据集,包括
·临床数据;
·肺成熟度数据;和
·胃抽吸物(GAS)数据;
-分析所述数据集,从而获得分析的数据结果;和
-基于所述分析的数据结果预测婴儿发展BPD的风险。
2.根据前述项中任一项所述的计算机实施的方法,其中分析的数据结果通过使用经训练的机器学习模型分析数据集而获得。
3.根据前述项中任一项所述的计算机实施的方法,其中所述婴儿是早产婴儿,例如在妊娠37周完成之前出生的婴儿。
4.根据前述项中任一项所述的计算机实施的方法,其中数据集包括出生后48小时内、优选出生后36小时内获得的数据,或由其组成。
5.根据前述项中任一项所述的计算机实施的方法,其中如果所述婴儿已被诊断患有RDS和/或RDS的严重程度,则所述临床数据包括所述婴儿的数据或由所述婴儿的数据组成,所述数据选自出生体重、孕龄。
6.根据前述项中任一项所述的计算机实施的方法,其中肺成熟度数据是指示婴儿肺成熟度的数据,和/或代表婴儿是否已被给予或待被给予表面活性物质治疗的指标,或其组合。
7.根据前述项中任一项所述的计算机实施的方法,其中肺成熟度数据来自光谱数据如中红外光谱数据,例如包括光谱数据如中红外光谱数据或由其组成,用于评估肺成熟度。
8.根据前述项中任一项所述的计算机实施的方法,其中肺成熟度数据指示卵磷脂-鞘磷脂比率。
9.根据前述项中任一项所述的计算机实施的方法,其中通过对GAS样品进行光谱分析,例如中红外光谱分析,非侵入性地获得肺成熟度数据。
10.根据前述项中任一项所述的计算机实施的方法,其中肺成熟度数据来自体液样品的测量数据,所述体液包括GAS、咽分泌物和/或羊水。
11.根据第10项所述的计算机实施的方法,其中所述体液样品在测量之前已被预处理,所述预处理包括
a)裂解存在于体液样品中的细胞,例如通过与淡水混合;
b)离心裂解的GAS样品,所述离心的旋转离心力(RCF)和时间被选择为使得体液样品的LB形成沉淀,而例如裂解的细胞的细胞碎片和其他较小的组分(例如盐)保留在上清液中;
c)(可选地)丢弃所述上清液。
12.根据第11项所述的计算机实施的方法,其中肺成熟度数据来自沉淀的测量,例如干燥透射FTIR测量。
13.根据前述项中任一项所述的计算机实施的方法,其中GAS数据来自光谱数据如中红外光谱数据,例如包括光谱数据如中红外光谱数据或由其组成。
14.根据前述项中任一项所述的计算机实施的方法,其中GAS数据来自900-3400cm-1之间,例如900-1800cm-1之间和2800-3400cm-1之间的光谱的光谱数据。
15.根据前述项中任一项所述的计算机实施的方法,其中GAS数据来自一个或多个吸收和/或透射光谱,例如包括一个或多个吸收和/或透射光谱或由其组成。
16.根据前述项中任一项所述的计算机实施的方法,其中GAS数据来自通过对GAS样品进行光谱分析而获得的光谱数据。
17.根据前述项中任一项所述的计算机实施的方法,其中GAS样品在分析期间是基本上干燥的。
18.根据前述项中任一项所述的计算机实施的方法,其中在光谱分析之前对GAS样品进行预处理。
19.根据前述项中任一项所述的计算机实施的方法,其中所述预处理包以下或由以下组成:离心以形成沉淀,并丢弃上清液。
20.根据前述项中任一项所述的计算机实施的方法,其中通过饲管与通过所述饲管转移GAS的装置(例如注射器或抽吸导管)的组合,从婴儿收集GAS样品。
21.根据前述项中任一项所述的计算机实施的方法,其中GAS数据通过对光谱数据应用数学运算而获得。
22.根据前述项中任一项所述的计算机实施的方法,其中数学运算包括一阶导数或由其组成。
23.根据前述项中任一项所述的计算机实施的方法,其中数学运算包括基线校正算法,例如Savitzky-Golay算法,或由其组成。
24.根据前述项中任一项所述的计算机实施的方法,其中数学运算包括选择光谱的预定波数,或由其组成。
25.根据第24项所述的计算机实施的方法,其中预定波数显示发展BPD的婴儿和未发展BPD的婴儿之间的统计学显著差异。
26.根据第25项所述的计算机实施的方法,其中所述统计学显著差异基于统计学检验,例如配对Cox-Wilcoxon检验,其中双尾p值<0.05。
27.根据前述项中任一项所述的计算机实施的方法,其中数学运算包括偏最小二乘分析或由其组成。
28.根据前述项中任一项所述的计算机实施的方法,其中GAS数据通过包括以下步骤的过程获得:
a)(可选地)获得GAS样品;
b)(可选地)储存GAS样品;
c)(可选地)预处理GAS样品;和
d)通过使用光谱法,例如中红外光谱法分析GAS样品来获得光谱数据。
e)(可选地)将一种或多种数学运算应用于光谱数据。
29.根据前述项中任一项所述的计算机实施的方法,其中BPD被定义为在出生后特定天数,例如出生后第28天需要补充氧气支持。
30.根据前述项中任一项所述的计算机实施的方法,其中经训练的模型是受监督的经训练的模型或受监督和不受监督的经训练的模型。
31.根据前述项中任一项所述的计算机实施的方法,其中经训练的模型选自支持向量机(SVM)、回归模型、人工神经网络、决策树、遗传算法、贝叶斯网络或其组合。
32.根据前述项中任一项所述的计算机实施的方法,其中所述预测包括婴儿发展BPD的风险百分比或由其组成。
33.根据前述项中任一项所述的计算机实施的方法,其中所述预测的灵敏度为至少70%。
34.根据前述项中任一项所述的计算机实施的方法,其中所述预测的特异性为至少70%。
35.一种用于机器学习模型的受监督的训练的方法,所述机器学习模型用于在出生后早期预测受试者是否患有或将发展支气管肺发育不良(BPD),所述方法包括:
a)获得数据集,所述数据集包括刚出生不久的多个婴儿的信息,所述信息包括
-临床数据;
-肺成熟度数据;和
-胃抽吸物(GAS)数据;
b)获得结果数据,所述结果数据包括与婴儿是否患有或发展BPD相关的信息或由其组成;
c)基于婴儿的数据集和结果数据,通过受监督的训练来训练机器学习模型,以在出生后早期预测受试者是否患有和/或将发展BPD。
36.根据第35项所述的用于机器学习模型的受监督的训练的方法,其中所述受试者和/或所述婴儿是早产婴儿,例如在妊娠37周完成之前出生。
37.根据第35至36项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述数据集包括出生后24小时内,例如在出生时,获得的数据,或由其组成。
38.根据第35至37项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述临床数据包括选自以下的数据或由选自以下的数据组成:出生体重、孕龄、婴儿是否被诊断患有RDS、(在相关情况下)RDS的严重程度或其组合。
39.根据第35至38项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述肺成熟度数据是指示婴儿肺成熟度的数据,和/或代表婴儿是否已被给予或待被给予表面活性物质治疗的二进制值(+/-),或其组合。
40.根据第35至39项中任一项所述的用于机器学习模型的受监督的训练的方法,其中肺成熟度数据来自光谱数据如中红外光谱数据,例如包括光谱数据如中红外光谱数据或由其组成,用于评估肺成熟度。
41.根据第35至40项中任一项所述的用于机器学习模型的受监督的训练的方法,其中肺成熟度数据指示卵磷脂-鞘磷脂比率。
42.根据第35至41项中任一项所述的用于机器学习模型的受监督的训练的方法,其中通过对GAS样品的光谱分析,例如中红外光谱分析,非侵入性地获得肺成熟度数据。
43.根据第35至42项中任一项所述的用于机器学习模型的受监督的训练的方法,其中肺成熟度数据来自体液样品的测量数据,所述体液样品包括GAS、咽分泌物和/或羊水或其组合,或由以上组成。
44.根据第43项所述的用于机器学习模型的受监督的训练的方法,其中所述体液样品在测量之前已经被预处理,所述预处理包括
a)裂解存在于体液样品中的细胞,例如通过与淡水混合;
b)离心裂解的GAS样品,所述离心的旋转离心力(RCF)和时间被选择为使得体液样品的LB形成沉淀,而例如裂解的细胞的细胞碎片和其他较小的组分(例如盐)保留在上清液中;
c)(可选地)丢弃所述上清液。
45.根据第44项所述的用于机器学习模型的受监督的训练的方法,其中肺成熟度数据来自沉淀的测量,例如干燥透射FTIR测量。
46.根据第35至45项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述GAS数据来自光谱数据如中红外光谱数据,例如包含光谱数据如中红外光谱数据或由其组成。
47.根据第35至46项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述GAS数据来自900-3400cm-1之间,例如900-1800cm-1之间和2800-3400cm-1之间的光谱的光谱数据。
48.根据第35至47项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述GAS数据来自一个或多个吸收和/或透射光谱,例如包括一个或多个吸收和/或透射光谱或由其组成。
49.根据第35至48项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述GAS数据来自通过对GAS样品进行光谱分析获得的光谱数据。
50.根据第35至49项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述GAS样品在分析期间是基本上干燥的。
51.根据第35至50项中任一项所述的用于机器学习模型的受监督的训练的方法,其中在光谱分析之前对GAS样品进行预处理。
52.根据第51项所述的用于机器学习模型的受监督的训练的方法,其中所述预处理包括以下或由以下组成:离心以形成沉淀,并丢弃上清液。
53.根据第35至52项中任一项所述的用于机器学习模型的受监督的训练的方法,其中通过饲管与通过所述饲管转移GAS的装置(例如,注射器或抽吸导管)的组合,从婴儿收集GAS样品。
54.根据第35至53项中任一项所述的用于机器学习模型的受监督的训练的方法,其中GAS数据通过对光谱数据应用数学运算获得。
55.根据第54项中任一项所述的用于机器学习模型的受监督的训练的方法,其中数学运算包括一阶导数或由其组成。
56.根据第54至55项中任一项所述的用于机器学习模型的受监督的训练的方法,其中数学运算包括基线校正算法,例如Savitzky-Golay算法,或由其组成。
57.根据第54至56项中任一项所述的用于机器学习模型的受监督的训练的方法,其中数学运算包括选择光谱的预定波数,或由其组成。
58.根据第57项所述的用于机器学习模型的受监督的训练的方法,其中预定波数显示发展BPD的婴儿和未发展BPD的婴儿之间的统计学显著差异。
59.根据第58项所述的用于机器学习模型的受监督的训练的方法,其中所述统计学显著差异基于统计学检验,例如配对Cox-Wilcoxon检验,其中双尾p值<0.05。
60.根据第54至59项中任一项所述的用于机器学习模型的受监督的训练的方法,其中数学运算包括偏最小二乘分析或由其组成。
61.根据第35至60项中任一项所述的用于机器学习模型的受监督的训练的方法,其中GAS数据通过包括以下步骤的过程获得:
a)(可选地)获得GAS样品;
b)(可选地)储存GAS样品;
c)预处理GAS样品;和
d)通过使用光谱法,例如中红外光谱法分析GAS样品来获得光谱数据;
e)(可选地)将一种或多种数学运算应用于光谱数据。
62.根据第35至61项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述结果数据包括与婴儿是否患有或发展BPD相关的信息,例如在出生后第28天需要补充氧气,或由其组成。
63.根据第35至62项中任一项所述的用于机器学习模型的受监督的训练的方法,其中BPD被定义为在出生后特定天数,例如出生后第28天需要补充氧气支持。
64.根据第35至63项中任一项所述的用于机器学习模型的受监督的训练的方法,其中经训练的模型是受监督的经训练的模型或受监督的和未受监督的经训练的模型。
65.根据第35至64项中任一项所述的用于机器学习模型的受监督的训练的方法,其中经训练的模型选自支持向量机(SVM)、回归模型、人工神经网络、决策树、遗传算法、贝叶斯网络或其组合。
66.根据第35至65项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述预测包括婴儿发展BPD的风险百分比或由其组成。
67.根据第35至66项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述预测的灵敏度为至少70%。
68.根据第35至67项中任一项所述的用于机器学习模型的受监督的训练的方法,其中所述预测的特异性为至少70%。
69.一种用于在出生后早期预测受试者是否患有或将发展支气管肺发育不良(BPD)的机器学习模型,其中所述机器学习模型已经根据第35至68项中任一项所述进行了训练。
70.根据第69项所述的机器学习模型的用途。
71.一种系统,其用于在出生后早期预测婴儿是否将发展BPD,所述系统包括:
a)存储器,和
b)处理单元,其被配置为执行第1至68项中任一项所述的方法。
72.根据第71项所述的系统,其进一步包括用于获得光谱数据的至少一个光谱单元,例如FTIR光谱仪。
73.根据第71至72项中任一项所述的系统,其中所述系统是便携式和/或床边系统。
Claims (27)
1.一种计算机实施的方法,用于预测婴儿发展支气管肺发育不良(BPD)的风险,所述方法包括以下步骤:
a)获得所述婴儿的数据集,其包含:
·临床数据;
·肺成熟度数据;和
·胃抽吸物(GAS)数据;
b)分析所述数据集,从而获得分析的数据结果;和
c)基于所述分析的数据结果预测所述婴儿发展BPD的风险。
2.根据权利要求1所述的计算机实施的方法,其中所述数据集由出生后48小时内、优选出生后36小时内获得的数据组成。
3.根据前述权利要求中任一项所述的计算机实施的方法,其中所述临床数据由出生体重和孕龄组成。
4.根据前述权利要求中任一项所述的计算机实施的方法,其中所述肺成熟度数据来自体液样品的测量数据,所述体液样品包括GAS、咽分泌物和/或羊水,和/或其中所述肺部成熟度数据是所述婴儿是否已被给予表面活性物质治疗的指标。
5.根据前述权利要求中任一项所述的计算机实施的方法,其中所述GAS数据来自GAS样品的测量,例如来自测量数据。
6.根据权利要求5所述的计算机实施的方法,其中所述GAS数据来自所述GAS样品的光谱测量,例如来自光谱数据。
7.根据权利要求6所述的计算机实施的方法,其中所述GAS数据来自900-3400cm-1之间,例如900-1800cm-1之间和2800-3400cm-1之间的光谱中的光谱数据。
8.根据权利要求6至7中任一项所述的计算机实施的方法,其中所述GAS数据来自所述光谱数据的多个预定波数。
9.根据权利要求8所述的计算机实施的方法,其中所述预定波数被选择为使得它们显示出发展BPD的婴儿和不发展BPD的婴儿之间的统计学显著差异。
10.根据权利要求8至9中任一项所述的计算机实施的方法,其中所述GAS数据来自所述光谱数据的10-50个预定波数之间,例如其中所述光谱信息包括至少500个波数。
11.根据权利要求5至10中任一项所述的计算机实施的方法,其中所述GAS数据通过对所述测量数据应用数学运算而得到。
12.根据权利要求11所述的计算机实施的方法,其中所述数学运算包括一阶导数或由其组成。
13.根据权利要求11至12中任一项所述的计算机实施的方法,其中所述数学运算包括基线校正算法,例如Savitzky-Golay算法,或由其组成。
14.根据权利要求11至13中任一项所述的计算机实施的方法,其中所述数学运算包括偏最小二乘分析或由其组成。
15.根据权利要求5至14中任一项所述的计算机实施的方法,其中所述GAS样品在所述测量期间是基本上干燥的。
16.根据权利要求5至15中任一项所述的计算机实施的方法,其中所述GAS样品在所述测量之前被预处理。
17.根据权利要求16所述的计算机实施的方法,其中所述预处理包括以下或由以下组成:离心以形成沉淀,并丢弃上清液。
18.根据权利要求16至17中任一项所述的计算机实施的方法,其中所述预处理包括:
a)裂解存在于所述GAS样品中的细胞,例如通过与淡水混合;
b)离心裂解的GAS样品,离心的旋转离心力(RCF)和时间被选择为使得体液样品的LB形成沉淀,而如裂解的细胞的细胞碎片和其他较小的组分(例如盐)保留在上清液中;
c)丢弃所述上清液;
d)(可选地)将沉淀干燥。
19.根据权利要求5至18中任一项所述的计算机实施的方法,其中所述GAS数据通过包括以下步骤的过程获得:
a.预处理所述GAS样品;和
b.通过FTIR光谱法测量所述预处理的GAS样品,例如沉淀,获得测量数据,例如光谱数据;
c.将一种或多种数学运算应用于所述光谱数据。
20.根据前述权利要求中任一项所述的计算机实施的方法,其中BPD被定义为在出生后特定天数,优选28天时需要补充氧气支持。
21.根据前述权利要求中任一项所述的计算机实施的方法,其中所述预测包括婴儿发展BPD的风险百分比或由其组成。
22.根据前述权利要求中任一项所述的计算机实施的方法,其中分析的数据结果是通过使用经训练的机器学习模型来分析所述数据集而获得的。
23.根据权利要求22所述的计算机实施的方法,其中经训练的模型是通过受监督的学习而训练的支持向量机(SVM)。
24.一种用于机器学习模型的受监督的训练的方法,所述机器学习模型用于在出生后早期预测受试者是否患有或将发展支气管肺发育不良(BPD),所述方法包括:
a)获得数据集,所述数据集包括刚出生不久的多个婴儿的信息,所述信息包括
-临床数据,其由出生体重和孕龄组成;
-肺成熟度数据,其由婴儿是否已被给予表面活性物质治疗的指标组成;和
-胃抽吸物(GAS)数据;
b)获得结果数据,所述结果数据包括与婴儿是否患有或发展BPD相关的信息或由其组成;
c)基于婴儿的数据集和结果数据,通过监督训练来训练机器学习模型,以在出生后早期预测受试者是否患有和/或将发展BPD。
25.根据权利要求24所述的方法,其中所述机器学习模型被训练以执行权利要求1至23中任一项所述的方法。
26.一种系统,其用于预测婴儿出生后早期是否将发展BPD,所述系统包括:
a)存储器;
b)至少一个光谱单元,其被配置用于获得光谱数据,例如FTIR光谱仪;
c)处理单元,其被配置为执行权利要求1至25中任一项所述的方法。
27.根据权利要求26所述的系统,其中所述系统是便携式和/或床边系统。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20165923.2 | 2020-03-26 | ||
EP20165923 | 2020-03-26 | ||
PCT/EP2021/057944 WO2021191423A1 (en) | 2020-03-26 | 2021-03-26 | Systems and methods for predicting a risk of development of bronchopulmonary dysplasia |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115698711A true CN115698711A (zh) | 2023-02-03 |
Family
ID=70049891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180038062.XA Pending CN115698711A (zh) | 2020-03-26 | 2021-03-26 | 用于预测发展支气管肺发育不良的风险的系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230160818A1 (zh) |
EP (1) | EP4127712A1 (zh) |
JP (1) | JP2023519315A (zh) |
KR (1) | KR20220156608A (zh) |
CN (1) | CN115698711A (zh) |
WO (1) | WO2021191423A1 (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2729971T3 (es) * | 2013-05-27 | 2019-11-07 | Sime Diagnostics Ltd | Métodos y sistemas de uso en diagnósticos neonatales |
CN111465838B (zh) * | 2017-10-06 | 2024-05-28 | 西美诊断有限公司 | 胎儿肺成熟度测试 |
-
2021
- 2021-03-26 KR KR1020227036701A patent/KR20220156608A/ko unknown
- 2021-03-26 US US17/906,800 patent/US20230160818A1/en active Pending
- 2021-03-26 EP EP21713441.0A patent/EP4127712A1/en active Pending
- 2021-03-26 CN CN202180038062.XA patent/CN115698711A/zh active Pending
- 2021-03-26 JP JP2022558181A patent/JP2023519315A/ja active Pending
- 2021-03-26 WO PCT/EP2021/057944 patent/WO2021191423A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
JP2023519315A (ja) | 2023-05-10 |
WO2021191423A1 (en) | 2021-09-30 |
KR20220156608A (ko) | 2022-11-25 |
EP4127712A1 (en) | 2023-02-08 |
US20230160818A1 (en) | 2023-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sitnikova et al. | Breast cancer detection by ATR-FTIR spectroscopy of blood serum and multivariate data-analysis | |
Sauaia et al. | Early risk factors for postinjury multiple organ failure | |
Suliman et al. | Validity of ROX index in prediction of risk of intubation in patients with COVID-19 pneumonia | |
Bökenkamp et al. | Reference values for cystatin C serum concentrations in children | |
US20210349111A1 (en) | Methods and system for use in neonatal diagnostics | |
CN111602055A (zh) | 作为癌症生物标志物的挥发性有机化合物 | |
EP3152322B1 (en) | Estimating risk of death using the clearance volume of red blood cells as biomarker | |
Ricard et al. | Screening tool for early postnatal prediction of retinopathy of prematurity in preterm newborns (STEP-ROP) | |
Onland et al. | Precision medicine in neonates: future perspectives for the lung | |
Tokuriki et al. | Carboxyhemoglobin formation in preterm infants is related to the subsequent development of bronchopulmonary dysplasia | |
Lazzari et al. | End-tidal to arterial PCO2 ratio as guide to weaning from venovenous extracorporeal membrane oxygenation | |
CN115698711A (zh) | 用于预测发展支气管肺发育不良的风险的系统和方法 | |
Jimenez et al. | Arterial oxygenation does not predict the outcome of patients with acute respiratory failure needing mechanical ventilation | |
Tomotaki et al. | Association between cord blood cystatin C levels and early mortality of neonates with congenital abnormalities of the kidney and urinary tract: a single-center, retrospective cohort study | |
Wallace et al. | Nasal airway ion transport and lung function in young people with cystic fibrosis | |
Umut et al. | Prediction of sepsis disease by Artificial Neural Networks | |
US20230223150A1 (en) | Methods and systems for predicting ards | |
Ahmed et al. | Radiological and clinical perspectives to predict failure of non-invasive ventilation in acute respiratory failure | |
US20240268676A1 (en) | Method and device for determination of hypoxia | |
Alvandi et al. | Identifying survival predictive factors in patients with breast cancer: a 16-year cohort study using cox maximum penalized likelihood method | |
Elsetouhi et al. | Role of Spontaneous Breathing Trial as Predictors in Extubation Failure in Preterm Infants | |
RU2766302C1 (ru) | Способ прогнозирования риска развития летального исхода в течение 6 месяцев после перенесенной новой коронавирусной инфекции COVID-19 | |
Cioboata et al. | Effect of Nasal Continuous Positive Airway Pressure on Retinopathy of Prematurity in Preterm Newborns: A Comparative Analysis with Mechanical Ventilation and High-Flow Nasal Cannula Therapy | |
RU2770552C1 (ru) | Способ прогнозирования респираторных последствий бронхолегочной дисплазии у детей | |
Rajput et al. | Spectrum of respiratory distress and outcome in neonates admitted in National Institute of Child Health, Karachi, Pakistan. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |