CN112750532B - 特征识别方法与电子装置 - Google Patents
特征识别方法与电子装置 Download PDFInfo
- Publication number
- CN112750532B CN112750532B CN201911043954.XA CN201911043954A CN112750532B CN 112750532 B CN112750532 B CN 112750532B CN 201911043954 A CN201911043954 A CN 201911043954A CN 112750532 B CN112750532 B CN 112750532B
- Authority
- CN
- China
- Prior art keywords
- features
- risk prediction
- feature
- prediction models
- physiological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000013058 risk prediction model Methods 0.000 claims abstract description 103
- 201000010099 disease Diseases 0.000 claims abstract description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 15
- 230000036772 blood pressure Effects 0.000 claims description 63
- 238000012549 training Methods 0.000 claims description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 208000024172 Cardiovascular disease Diseases 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 claims 17
- 230000002596 correlated effect Effects 0.000 claims 10
- 238000011156 evaluation Methods 0.000 claims 2
- 230000035488 systolic blood pressure Effects 0.000 description 19
- 239000002131 composite material Substances 0.000 description 4
- 230000035487 diastolic blood pressure Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/02—Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
- A61B5/021—Measuring pressure in heart or blood vessels
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
- A61B5/7275—Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Molecular Biology (AREA)
- Heart & Thoracic Surgery (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Surgery (AREA)
- Physiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Cardiology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Vascular Medicine (AREA)
- Primary Health Care (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
Abstract
本发明提供一种特征识别方法与电子装置。所述方法包括:获得受测者在一日内的多个时间点被测量的多个生理信息;分别转换此些生理信息为多个相关特征;根据前述多个相关特征建立多个第一风险预测模型,并根据此些第一风险预测模型从前述多个相关特征中识别至少一第一相关特征;根据所述第一相关特征建立多个第二风险预测模型,并根据此些第二风险预测模型从所述第一相关特征中识别具有预测特定疾病的能力的至少一第二相关特征;以及输出所述第二相关特征。
Description
技术领域
本发明涉及一种特征识别方法与电子装置。
背景技术
一般来说,目前医学界是使用包括佛莱明风险分数(Framingham risk score)在内的风险预测方程式来预测心血管疾病的患病机率。然而,使用此些风险预测方程式的方法通常只使用单一一次对受测者测量而获得的收缩压与舒张压,其并没有考虑到如何综合一天内在多个不同时间点测量而获得的多个收缩压与多个舒张压来进行判断。
因此,如何利用根据受测者在24小时内的多个血压信息进行判断以辅助医生判定受测者发生或是死于心血管疾病的风险,是本领域技术人员欲解决的问题之一。此外,除了考量血压信息外,也可以同时考量生理与抽血等信息,来协助诊断风险大小,因此,若从受测者在24小时内的多个血压资中得到具有预测特定疾病的能力的特征,对于判断风险大小上有一定的助益,且能有利于医生精准地及有效地判断心血管疾病的患病风险。
发明内容
本发明提供的特征识别方法与电子装置可以从受测者在一日(24小时)内不同时间点测量而获得的生理信息(例如,血压信息)中找到具有预测特定疾病的能力的特征。
本发明提出一种特征识别方法,用于一电子装置,所述方法包括:获得分别在一日内的多个时间点对受测者进行测量所获得的多个生理信息;转换所述多个生理信息为分别对应于所述多个生理信息的多个相关特征;根据所述多个相关特征建立多个第一风险预测模型,并根据所述多个第一风险预测模型从所述多个相关特征中识别至少一第一相关特征;根据所述第一相关特征建立多个第二风险预测模型,并根据所述多个第二风险预测模型从所述第一相关特征中识别具有预测特定疾病的能力的至少一第二相关特征;以及输出所述第二相关特征。
本发明提出一种电子装置,其包括一处理器用以执行下述运作:获得分别在一日内的多个时间点对受测者进行测量所获得的多个生理信息;转换所述多个生理信息为分别对应于所述多个生理信息的多个相关特征;根据所述多个相关特征建立多个第一风险预测模型,并根据所述多个第一风险预测模型从所述多个相关特征中识别至少一第一相关特征;根据所述第一相关特征建立多个第二风险预测模型,并根据所述多个第二风险预测模型从所述第一相关特征中识别具有预测特定疾病的能力的至少一第二相关特征;以及输出所述第二相关特征。
基于上述,本发明的特征识别方法与电子装置是依据受测者在一日(24小时)内不同时间点测量而获得的生理信息(例如,血压信息),从生理信息中找到具有预测特定疾病的能力的特征,而此些特征可以用来协助医生作特定疾病的风险的判断依据,也可以作为其他后续的模型训练或医疗研究。
附图说明
图1是依照本发明的一实施例所示出的特征识别方法的流程图;
图2A与图2B是依照本发明的一实施例所示出的步骤S107的详细流程图;
图3A与图3B是依照本发明的一实施例所示出的步骤S109的详细流程图;
图4是依照本发明的一实施例所示出的步骤S3035的详细流程图。
附图标记说明
S101~S111、S201~S213、S206a、S206b、S301~S311、S3029~S3037、S401~S405:步骤
20a:不重复切分训练/预测数据的方法
20b:可重复抽取训练/预测数据的方法
21a~21c:模型
22a:逐步放入/剔除增益方法
22b:多分类器选择的次数/影响力/权重判断的方法
具体实施方式
现将详细参考本发明的示范性实施例,在附图中说明所述示范性实施例的实例。另外,凡可能之处,在附图及实施方式中使用相同标号的元件/构件代表相同或类似部分。
本发明所提出的特征识别方法适用于电子装置。电子装置包括处理器、输入输出电路以及存储电路。其中,输入输出电路以及存储电路分别耦接至处理器。电子装置例如是台式电脑、伺服器、手机、平板电脑、笔记本电脑等电子行动装置,在此不设限。
处理器可以是中央处理器(Central Processing Unit,CPU),或是其他可程序化的一般用途或特殊用途的微处理器(Microprocessor)、数字信号处理器(Digital SignalProcessor,DSP)、可程序化控制器、特殊应用集成电路(Application SpecificIntegrated Circuit,ASIC)或其他类似元件或上述元件的组合。
输入输出电路例如是用于从电子装置外部或其他来源取得相关数据的输入接口或电路。此外,输入输出电路也可以将电子装置产生的数据传送给其他电子装置的输出接口或电路,在此并不设限。
存储电路可以是任何型态的固定或可移动随机存取存储器(random accessmemory,RAM)、只读存储器(read-only memory,ROM)、快闪存储器(flash memory)或类似元件或上述元件的组合。
在本范例实施例中,电子装置的存储电路中存储有多个程序码片段,在上述程序码片段被安装后,会由处理器来执行。例如,存储电路中包括多个模块,通过这些模块来分别执行应用于电子装置的各个运作,其中各模块是由一或多个程序码片段所组成。然而本发明不限于此,电子装置的各个运作也可以是使用其他硬件形式的方式来实现。
图1是依照本发明的一实施例所示出的特征识别方法的流程图。
请参照图1,在步骤S101中,处理器获得分别在一日内的多个时间点对受测者进行测量所获得的多个生理信息。在本实施例中,生理信息例如是受测者的血压,然而本发明并不限于此。在其他实施例中,生理信息也可以是其他种类的生理信息。以下的范例以血压进行说明。
在步骤S103中,处理器执行特征工程以分别对前述的多个生理信息转换为多个转换后特征。更详细来说,在获得受测者的血压数据后,可以执行特征工程以获得血压数据的统计量(即,前述的转换后特征)。统计量可以是血压数据的平均数、斜率或震荡幅度等,在此不作限制。
之后,在步骤S105中,处理器根据线性转换算法以及非线性转换算法的至少其中之一分别将前述多个转换后特征转换为多个相关特征。在此,线性转换算法例如是先计算每个受测者一日内所测量到的多个收缩压的平均收缩压,并将多个受测者的平均收缩压进行标准化。更详细来说,请参照表1:
表1
以表1为例,假设目前有受测者U1~U5。在表1的第二行可以看到,受测者U1~U5在一日内的平均收缩压分别为120、125、119、128以及110。在线性转换方法中,处理器可以先计算受测者U1~U5的整体的平均收缩压,其值为120.4。此外,处理器还可以计算受测者U1~U5的标准差,其值为6.8775。以受测者U1为例,标准化后数值(即,标准化的平均收缩压)为 而其他受测者U2~U5的标准化的平均收缩压亦可以由上述方式得出,在此不再赘述。各个受测者的标准化的平均收缩压如表1的第三行所示。
此外,非线性转换算法例如是对平均收缩压取log(结果如表1第四行所示)、对平均收缩压取平方(结果如表1第五行所示)或对平均收缩压开根号(结果如表1第六行所示)。
特别是,在步骤S105中,处理器也可以同时根据线性转换算法以及非线性转换算法两者分别将前述多个转换后特征转换为多个相关特征。例如,可以先使用线性转换算法获得各个受测者的标准化的平均收缩压,之后再使用非线性转换算法对各个受测者的标准化的平均收缩压取平方,结果如表1的第7行所示。然而,本发明并不用于限定线性转换算法、非线性转换算法以及前述两者结合使用时的实际计算方式。
在获得多个相关特征后,在步骤S107中,处理器根据前述多个相关特征建立多个第一风险预测模型,并根据此些第一风险预测模型从前述多个相关特征中识别至少一第一相关特征。
图2A与图2B是依照本发明的一实施例所示出的步骤S107的详细流程图。
请同时参照图2A与图2B,在步骤S201中,处理器会将前述多个相关特征区分为第一训练数据以及第一预测数据。例如,如图2B所示,在步骤S201中,处理器可以使用不重复切分训练/预测数据的方法20a和/或可重复抽取训练/预测数据的方法20b来区分第一训练数据以及第一预测数据。不重复切分训练/预测数据的方法20a例如是K-fold CV算法,可重复抽取训练/预测数据的方法20b例如是Bootstrap算法,但本发明并不在此限。
在步骤S203中,处理器会根据第一训练数据建立分别对应于多个算法的多个第一风险预测模型。如图2B所示,步骤S203例如使用第一训练数据建立模型21a~21c。模型21a例如是结合多种分类器方法(例如Random Survival Forest)的模型。模型21b例如是使用传统统计方法(例如Cox proportional hazard)的模型。模型21c例如是使用其他方法(例如,Survival SVM)所产生的模型。
之后,在步骤S205中,处理器会根据前述多个第一风险预测模型从前述多个相关特征中识别至少一显著特征。需说明的是,显著特征可以让前述模型21a~21c拥有较高的预测准确度。如图2B所示,步骤S205例如使用逐步放入/剔除增益方法22a(例如,Stepwise(P-value/AIC)的方法)或者根据多分类器选择的次数/影响力/权重判断的方法22b(例如,特征的重要性或被选择的次数)从多个相关特征中识别出显著特征。如何使用逐步放入/剔除增益方法22a或者根据多分类器选择的次数/影响力/权重判断的方法22b识别出特征可以由现有技术所得知,在此不再赘述。
在识别出显著特征后,在步骤S206a中,处理器会记录模型21a~21c挑选的显著特征。此外,如图2B的步骤S206b所示,前述的步骤S201至步骤206a会反复地被执行以重复多次模型的建立与挑选显著特征,而此重复执行的过程例如可以执行一定的预设次数。
之后,在步骤S207中,处理器会获得每一个显著特征被每一个第一风险预测模型挑选的挑选信息。在此,挑选信息例如是被选择到的次数和/或比率。以表二为例:
表二
如表二所示,假设目前有血压特征F1~F5。假设模型21a~21c在执行步骤S201至步骤S206a两次且模型21a~21c所选到的显著特征如表二所示。在表二中,有被选到的血压特征是以“1”表示,而没有被选到的血压特征是以“0”表示)。
之后,处理器会根据各模型所选到的血压特征,计算特征F1~F5被每个模型所选到的次数与比率。如下表三所示:
表三
以特征F1为例,由于模型21a在执行重复两次的步骤S201至步骤S206a中皆有选到血压特征F1,因此可以在表三中将血压特征F1被模型21a选到的次数记录为“2”。且由于两次的选择中血压特征F1皆有被模型21a选到,因此可以将血压特征F1被模型21a选到的比率记录为“1”(即,2/2)。而其他的血压特征被模型21a~21c挑选到的次数与比率可以是以类似前述的方式所得出,在此不再赘述。
此外,在步骤S209中,处理器会根据分别对应于前述多个第一风险预测模型的多个第一权重以及前述的挑选信息,计算分别对应于显著特征的至少一排名指标。假设可以对每个模型设定一个权重(即,前述的第一权重),并根据所设定的权重与挑选信息来计算每个显著特征的分数(即,排名指标)。举例来说,假设模型21a~21c的权重皆为处理器例如可以使用此权重与每个模型选到的比率计算血压特征F1的排名指标,其值为1(即, )。而其他的血压特征的排名指标可以是以类似前述的方式所得出,在此不再赘述。特别是,本发明并不用于限定模型21a~21c所对应的权重的值。在一实施例中,模型21a的权重可以是0,模型21b的权重可以是0且模型21c的权重可以是1。
之后,在步骤S211中,处理器会设定第一门槛值,并且在步骤S213中根据前述的排名指标以及第一门槛值,从显著特征中识别第一相关特征。更详细来说,假设第一门槛值为处理器可以挑选排名指标大于/>的血压特征F1、F2、F3、F5作为前述的第一相关特征。特别是,本发明并不用于限定第一门槛值的数值。
请再次参照图1,在执行完步骤S107后,在步骤S109中,处理器会根据第一相关特征建立多个第二风险预测模型,并根据此些第二风险预测模型从第一相关特征中识别具有预测特定疾病的能力的至少一第二相关特征。最后在步骤S111中,处理器可以输出第二相关特征以作为后续的应用的输入(例如,用于其他模型的训练或其他应用)。特别是,前述步骤S109的详细流程可以由图3A与图3B进行描述。
图3A与图3B是依照本发明的一实施例所示出的步骤S109的详细流程图。
请同时参照图3A与图3B,在步骤S301中,处理器会将前述的第一相关特征区分为第二训练数据以及第二预测数据。将相关特征区分为训练数据与预测数据的方法可以类似于步骤S201所使用的方法,故在此不再赘述。之后,在步骤S303中,处理器根据第二训练数据建立多个第二风险预测模型。
更详细来说,请参照图3B,步骤S303是利用佛莱明(Framingham)心血管疾病风险预测方法(以下简称,佛莱明法)来建立风险预测模型。一般来说,佛莱明法是使用受测者在诊间测量的生理指标(例如,收缩压)搭配额外生理特征(例如,年龄、总/高密度胆固醇、有无抽烟和/或有无糖尿病等)来建立风险预测模型。而步骤S303主要建立多个模型,此些模型会包括传统使用由佛莱明法建立的特定风险预测模型。此外,前述模型还会从第二训练数据中提取至少一相关特征,使用此相关特征产生用于佛莱明法的生理指标并使用此生理指标搭配额外生理特征建立风险预测模型。最后可以依据前述特定风险预测模型的预测能力,从步骤S303所建立的其他风险预测模型中挑选具有预测能力大于特定风险预测模型的预测能力的风险预测模型。
例如,步骤S303又可以包括步骤S3029~步骤S3037。在步骤S3029中,处理器会使用佛莱明法作为验证方法。在步骤S3030中,处理器获得在诊间对受测者进行单一次测量所获得的生理信息所对应的第三生理指标。也就是说,步骤S3030中获得的第三生理指标是用于建立传统的风险预测模型(即,前述的特定风险预测模型)。此外,步骤S3031会使用特定方法产生的特征组合产生用于建立风险预测模型的生理指标。步骤S3031又可以分为步骤S3033与步骤S3035。在步骤S3033中,处理器会从前述第二训练数据中选择仅一个相关特征(亦称为,第三相关特征)作为用于建立风险预测模型的第一生理指标。前述的第三相关特征可以是一日中的平均收缩压取log或其他的相关特征,在此不作限制。而在步骤S3035中,处理器会从前述第二训练数据中选择多个相关特征(亦称为,第四相关特征),并根据此些第四相关特征的组合产生第二生理指标。而步骤S3035的详细执行过程请容后详述。
之后,在步骤S3037中,处理器会根据第一生理指标以及额外生理特征建立第二风险预测模型中的一模型、根据第二生理指标以及额外生理特征建立第二风险预测模型中的另一模型,以及根据第三生理指标以及额外生理特征建立第二风险预测模型中的特定风险预测模型。也就是说,处理器会分别使用步骤S3030、步骤S3033以及步骤S3035中所产生的生理指标搭配额外生理特征来建立多个第二风险预测模型。
在建立多个第二风险预测模型后,在步骤S305中,处理器会计算每一个第二风险预测模型的多个预测能力量值。更详细来说,风险预测模型的预测能力量值可以是通过预测能力量值C-index、AIC或BIC等方式来计算。以C-index为例,C-index是用于衡量风险预测模型与实际观察结果的一致性,其数值介于0至1。例如:有一风险预测模型预测三位受测者的心血管风险值分别为1、2与3(在此,数值愈大代表愈容易得心血管疾病),而假设受测者实际于观察期间内得到心血管疾病的时间分别为5年、3年与1年。对于第一位与第二位受测者来说,由于第二位受测者的风险值较高,其与第二位受测者较快得到心血管疾病的实际情况两者是一致的。因此,对于三位受测者比较结果,两两比较总共有3种组合,在此范例中,由于符合一致性的组合有三种,因此C-index可记为“1”。基于此方式,可以获得第二每一个第二风险预测模型的预测能力量值。此外,如图3B的步骤S306所示,处理器会重复多次模型建立与计算模型的预测能力量值。也就是说,步骤S303~S305可以重复多次(即,多个轮回),并且每执行一次就可以获得每一个模型的预测能力量值。以下表四为例:
表四
在表四的范例中,假设“使用步骤S3030的生理指标所建立的风险预测模型”是使用诊间对受测者进行单一次测量所获得的生理信息所对应的生理指标所建立的模型,假设“使用步骤S3033的生理指标所建立的风险预测模型”是仅使用血压特征F1产生的生理指标所建立的模型,且“使用步骤S3035的生理指标所建立的风险预测模型”是使用排名指标为前四大的血压特征F1、F2、F3、F5所产生的生理指标所建立的模型。处理器在参照佛莱明法分别建立前述三个模型后,例如可以重复执行步骤S303、S305两个轮回以获得每一个模型在每次轮回中所计算出的C-index。如表五所示,“使用步骤S3030的生理指标所建立的风险预测模型的C-index”在第一次轮回后获得值为“0.70”的C-index且在第二次轮回后获得值为“0.75”的C-index。而其他模型在每次轮回所获得的C-index可以记载如表四,在此不再赘述。
之后,在步骤S307中,处理器会根据多个第二权重以及前述多个预测能力量值,计算分别对应于前述多个第二风险预测模型的多个综合指标。例如,以延续表四的表五为例:
表五
例如,处理器可以设定每次获得的C-index的权重为0.5,再计算上述三个模型的综合指标。以“使用步骤S3030的生理指标所建立的风险预测模型的C-index”为例,其综合指标的值为0.725(即,(0.70*0.5)+(0.75*0.5))。而表五中其他模型的综合指标可以是以相类似的方式计算出,在此不再赘述。
之后,在步骤S309中,处理器会将第二风险预测模型中的特定风险预测模型的第一综合指标定义为第二门槛值。也就是说,处理器会将“使用步骤S3030的生理指标所建立的风险预测模型”的综合指标定义为第二门槛值。特别是,“使用步骤S3030的生理指标所建立的风险预测模型”即是传统使用诊间对受测者进行单一次测量所获得的生理指标所建立的风险预测模型,而当一风险预测模型的综合指标大于前述的第二门槛值时,即代表该风险预测模型的预测能力会优于使用传统方法建立的风险预测模型。
在定义第二门槛值后,在步骤S311中,处理器会根据前述多个综合指标以及第二门槛值,从前述多个第二风险预测模型中识别第三风险预测模型,并将用于建立此第三风险预测模型的相关特征识别为第二相关特征。详细来说,在表五的范例中,处理器会选择“使用步骤S3030的生理指标所建立的风险预测模型的C-index”的综合指标的值(即,0.725)作为第二门槛值,并且从剩余的两个模型中识别出具有综合指标大于第二门槛值的“使用步骤S3035的生理指标所建立的风险预测模型”作为前述的第三风险预测模型,并将建立此第三风险预测模型的相关特征识别为前述的第二相关特征。
特别是,虽然本发明的预测能力量值是以C-index为例进行说明,但本发明不限于此。在其他实施例中,可以将C-index换成AIC或BIC。在此情况下,前述步骤S311则是选择具有综合指标低于第二门槛值的模型为前述的第三风险预测模型。
此外,图4是依照本发明的一实施例所示出的步骤S3035的详细流程图。
请参照图4,在步骤S401中,处理器会获得多个第四相关特征的组合。例如,在一实施例中,处理器会从第二训练数据中选择多个第四相关特征,而此些第四相关特征被每一个第一风险预测模型挑选的挑选信息(即,次数和/或比率)是大于第二训练数据中其他的相关特征。举例来说,可以使用如表三的方式计算每个血压特征被模型挑选到的次数和/或比率,进而获得每个血压特征的排名指标,并挑选排名指标为最大的四个血压特征作为第四相关特征,并以此四个第四相关特征作为第四相关特征的组合。
此外,在另一实施例中,当处理器通过前述方式从第二训练数据中选择第四相关特征后,处理器还可以根据此些第四相关特征产生至少一特征交互项,并将所选择的第四相关特征以及所产生的特征交互项一同作为第四相关特征的组合。特别是,特征交互项可以是第四相关特征中任意两个相关特征的乘积。以血压特征F1~F5为例,假设处理器选择血压特征F1、F2、F3、F5作为第四相关特征,处理器还会将前述血压特征F1、F2、F3、F5中任意两个血压特征相乘以产生六个特征交互项,最后将血压特征F1、F2、F3、F5以及所产生的六个特征交互项作为第四相关特征的组合。
或者,在另一实施例中,处理器会根据生理信息(例如,血压)的类型(例如,收缩压、舒张压、心率)与前述第二训练数据中的相关特征的计算方式(例如,平均与最高/低、标准差与变动幅度、骤升斜率与不同时间区间差值等)对所述第二训练数据中的相关特征进行归类以获得多个类别,之后将每个类别中具有最大的排名指标的相关特征识别为前述的多个第四相关特征,并以此四个第四相关特征作为第四相关特征的组合。举例来说,如下表六所示:
表六
如表六所示,若一个血压特征的血压类型与血压特征的计算方式相同于另一个血压特征的血压类型与血压特征的计算方式时,则此两个血压特征可以归类为同一类。例如,血压特征F1与血压特征F5的血压类型皆为“收缩压”且血压特征F1与血压特征F5的计算方式皆为“平均与最高/低”,则血压特征F1与血压特征F5两者会被归类为同一类,表六中以类型标记“1”来标记血压特征F1与血压特征F5属于同一类。此外,由于剩余的血压特征F2与血压特征F3的血压类型与计算方式并不完全相同,且血压特征F2与血压特征F3的血压类型与计算方式也并不完全相同于血压特征F1与血压特征F5,故处理器会单独将血压特征F2归为一类(以类型标记“2”来标记)以及单独将血压特征F5归为一类(以类型标记“3”来标记)。之后,处理器会从每个类别中挑选具有最大的排名指标的相关特征。在本范例中,处理器会从类型标记为“1”的类别中挑选血压特征F1、从类型标记为“2”的类别中挑选血压特征F2以及从类型标记为“3”的类别中挑选血压特征F3,并将血压特征F1~F3识别为前述的多个第四相关特征,并以此三个第四相关特征作为第四相关特征的组合。
或者,在另一实施例中,处理器也可以使用主成分分析(Principal componentsanalysis,PCA)从第二训练数据中选择第四相关特征,并根据第四相关特征产生第四相关特征的组合。如何使用主成分分析来进行挑选可以由现有技术所得知,在此不再赘述。
之后,在步骤S403中,处理器会产生对应于前述多个第四相关特征的组合的风险值。例如,处理器会利用Coxph算法来计算前述多个第四相关特征的组合的风险值。风险值利如是患病的风险、机率和/或时间。
在获得风险值后,在步骤S405中,处理器会根据此风险值产生第二生理指标。例如,在一实施例中,处理器会直接使用风险值作为第二生理指标。或者,在另一实施例中,处理器也可以将标准化后的风险值作为第二生理指标。
综上所述,本发明的特征识别方法与电子装置是依据受测者在一日(24小时)内不同时间点测量而获得的生理信息(例如,血压信息),从生理信息中找到具有预测特定疾病的能力的特征,而此些特征可以用来协助医生作特定疾病的风险的判断依据,也可以作为其他后续的模型训练或医疗研究。特别是,本发明是利用长时间的生理信息进行分析,在考虑众多相关特征中,根据统计与机器学习方法获得具有预测特定疾病的能力的特征,且此特征会比传统的方法(例如,佛莱明法)具有较佳的预测结果,代表能提升患病风险的预估准确度,并协助减少医学上误判的可能性。在血压的范例中,未来患有心血管疾病的病患,除了监控收缩压与舒张压过高或过低为异常之外,亦可以此特征为重要因子,作二次确认异常与否,增加判定正确的可信度,藉此免于延误接受相关治疗的时机。
Claims (10)
1.一种特征识别方法,用于电子装置,所述方法包括:
获得分别在一日内的多个时间点对受测者进行测量所获得的多个生理信息,其中所述多个生理信息包括血压信息;
转换所述多个生理信息为分别对应于所述多个生理信息的多个相关特征;
根据所述多个相关特征建立对应于多个算法的多个第一风险预测模型,并根据所述多个第一风险预测模型从所述多个相关特征中识别至少一第一相关特征;
利用佛莱明心血管疾病风险预测方法根据所述第一相关特征建立多个第二风险预测模型,并根据所述多个第二风险预测模型的多个预测能力量值从所述第一相关特征中识别具有预测特定疾病的能力的至少一第二相关特征,其中所述多个第二风险预测模型的所述多个预测能力量值为多个模型评估指标;以及
输出所述第二相关特征,
其中根据所述多个相关特征建立对应于所述多个算法的所述多个第一风险预测模型,并根据所述多个第一风险预测模型从所述多个相关特征中识别所述第一相关特征的步骤包括:
根据对应于所述多个算法的所述多个第一风险预测模型对所述多个相关特征进行特征选择,而从所述多个相关特征中识别至少一显著特征;
获得每一所述显著特征被每一所述多个第一风险预测模型挑选的挑选信息,其中所述挑选信息包括所述显著特征被选择到的次数或比率;
根据分别对应于所述多个第一风险预测模型的多个第一权重以及所述挑选信息,计算分别对应于所述显著特征的至少一排名指标;以及
根据所述排名指标以及第一门槛值,从所述显著特征中识别所述第一相关特征,
其中转换所述多个生理信息为分别对应于所述多个生理信息的所述多个相关特征的步骤包括:
执行特征工程以分别对所述多个生理信息转换为多个转换后特征;以及
根据线性转换算法以及非线性转换算法的至少其中之一分别将所述多个转换后特征转换为所述多个相关特征。
2.根据权利要求1所述的特征识别方法,其中根据所述多个相关特征建立对应于多个算法的所述多个第一风险预测模型,并根据所述多个第一风险预测模型从所述多个相关特征中识别所述第一相关特征的步骤包括:
将所述多个相关特征区分为第一训练数据以及第一预测数据;
根据所述第一训练数据建立分别对应于所述多个算法的所述多个第一风险预测模型。
3.根据权利要求1所述的特征识别方法,其中根据所述第一相关特征建立所述多个第二风险预测模型,并根据所述多个第二风险预测模型的所述多个预测能力量值从所述第一相关特征中识别具有预测特定疾病的能力的所述第二相关特征的步骤包括:
将所述第一相关特征区分为第二训练数据以及第二预测数据;
根据所述第二训练数据建立所述多个第二风险预测模型;
计算每一所述多个第二风险预测模型的所述多个预测能力量值;
根据多个第二权重以及所述多个预测能力量值,计算分别对应于所述多个第二风险预测模型的多个综合指标;以及
将所述多个第二风险预测模型中的特定风险预测模型的第一综合指标定义为第二门槛值,并根据所述多个综合指标以及所述第二门槛值,从所述多个第二风险预测模型中识别第三风险预测模型,并将用于建立所述第三风险预测模型的相关特征识别为所述第二相关特征。
4.根据权利要求3所述的特征识别方法,其中根据所述第二训练数据建立所述多个第二风险预测模型的步骤包括:
从所述第二训练数据中选择仅一个第三相关特征作为第一生理指标,并根据所述第一生理指标以及额外生理特征建立所述多个第二风险预测模型的其中之一,其中所述第三相关特征为所述第一相关特征其中一者;
从所述第二训练数据中选择多个第四相关特征,根据所述多个第四相关特征的组合产生第二生理指标,并根据所述第二生理指标以及所述额外生理特征建立所述多个第二风险预测模型的其中之一,其中所述第四相关特征为所述第一相关特征其中多者;以及
根据对所述受测者进行单一次测量所获得的生理信息所对应的第三生理指标以及所述额外生理特征建立所述特定风险预测模型。
5.根据权利要求4所述的特征识别方法,其中从所述第二训练数据中选择所述多个第四相关特征,根据所述多个第四相关特征的组合产生所述第二生理指标的步骤包括:
从所述第二训练数据中选择所述多个第四相关特征,其中所述多个第四相关特征被每一所述多个第一风险预测模型挑选的挑选信息大于所述第二训练数据中其他的相关特征。
6.根据权利要求4所述的特征识别方法,其中从所述第二训练数据中选择所述多个第四相关特征,根据所述多个第四相关特征的组合产生所述第二生理指标的步骤包括:
从所述第二训练数据中选择所述多个第四相关特征,根据所述多个第四相关特征产生至少一特征交互项,并根据所述多个第四相关特征以及所述特征交互项产生所述多个特征的组合。
7.根据权利要求4所述的特征识别方法,其中从所述第二训练数据中选择所述多个第四相关特征,根据所述多个第四相关特征的组合产生所述第二生理指标的步骤包括:
根据所述生理信息的类型与所述第二训练数据中的相关特征的计算方式对所述第二训练数据中的相关特征进行归类以获得多个类别;以及
将每一所述多个类别中具有最大的排名指标的相关特征识别为所述多个第四相关特征。
8.根据权利要求4所述的特征识别方法,其中从所述第二训练数据中选择所述多个第四相关特征,根据所述多个第四相关特征的组合产生所述第二生理指标的步骤包括:
使用主成分分析从所述第二训练数据中选择所述多个第四相关特征。
9.根据权利要求4所述的特征识别方法,其中根据所述多个第四相关特征的组合产生第二生理指标的步骤包括:
产生对应于所述多个第四相关特征的组合的风险值;以及
根据所述风险值产生所述第二生理指标。
10.一种电子装置,包括:
处理器,其中
所述处理器获得分别在一日内的多个时间点对受测者进行测量所获得的多个生理信息,其中所述多个生理信息包括血压信息,
所述处理器转换所述多个生理信息为分别对应于所述多个生理信息的多个相关特征,
所述处理器根据所述多个相关特征建立对应于多个算法的多个第一风险预测模型,并根据所述多个第一风险预测模型从所述多个相关特征中识别至少一第一相关特征,
所述处理器利用佛莱明心血管疾病风险预测方法根据所述第一相关特征建立多个第二风险预测模型,并根据所述多个第二风险预测模型的多个预测能力量值从所述第一相关特征中识别具有预测特定疾病的能力的至少一第二相关特征,其中所述多个第二风险预测模型的所述多个预测能力量值为多个模型评估指标,
所述处理器输出所述第二相关特征,
其中所述处理器根据对应于所述多个算法的所述多个第一风险预测模型对所述多个相关特征进行特征选择,而从所述多个相关特征中识别至少一显著特征,并获得每一所述显著特征被每一所述多个第一风险预测模型挑选的挑选信息,其中所述挑选信息包括所述显著特征被选择到的次数或比率,
所述处理器根据分别对应于所述多个第一风险预测模型的多个第一权重以及所述挑选信息,计算分别对应于所述显著特征的至少一排名指标,并根据所述排名指标以及第一门槛值,从所述显著特征中识别所述第一相关特征,
所述处理器执行特征工程以分别对所述多个生理信息转换为多个转换后特征,根据线性转换算法以及非线性转换算法的至少其中之一分别将所述多个转换后特征转换为所述多个相关特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043954.XA CN112750532B (zh) | 2019-10-30 | 2019-10-30 | 特征识别方法与电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043954.XA CN112750532B (zh) | 2019-10-30 | 2019-10-30 | 特征识别方法与电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112750532A CN112750532A (zh) | 2021-05-04 |
CN112750532B true CN112750532B (zh) | 2024-01-19 |
Family
ID=75640505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911043954.XA Active CN112750532B (zh) | 2019-10-30 | 2019-10-30 | 特征识别方法与电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112750532B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113456033B (zh) * | 2021-06-24 | 2023-06-23 | 江西科莱富健康科技有限公司 | 生理指标特征值数据处理方法、系统及计算机设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108206058A (zh) * | 2016-12-19 | 2018-06-26 | 平安科技(深圳)有限公司 | 人体综合健康风险预测方法及系统 |
CN108257673A (zh) * | 2018-01-12 | 2018-07-06 | 南通大学 | 患病风险值预测方法及电子设备 |
CN110211690A (zh) * | 2019-04-19 | 2019-09-06 | 平安科技(深圳)有限公司 | 疾病风险预测方法、装置、计算机设备及计算机存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL155955A0 (en) * | 2003-05-15 | 2003-12-23 | Widemed Ltd | Adaptive prediction of changes of physiological/pathological states using processing of biomedical signal |
US20160283686A1 (en) * | 2015-03-23 | 2016-09-29 | International Business Machines Corporation | Identifying And Ranking Individual-Level Risk Factors Using Personalized Predictive Models |
-
2019
- 2019-10-30 CN CN201911043954.XA patent/CN112750532B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108206058A (zh) * | 2016-12-19 | 2018-06-26 | 平安科技(深圳)有限公司 | 人体综合健康风险预测方法及系统 |
CN108257673A (zh) * | 2018-01-12 | 2018-07-06 | 南通大学 | 患病风险值预测方法及电子设备 |
CN110211690A (zh) * | 2019-04-19 | 2019-09-06 | 平安科技(深圳)有限公司 | 疾病风险预测方法、装置、计算机设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112750532A (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Risk scoring for prediction of acute cardiac complications from imbalanced clinical data | |
Citi et al. | PhysioNet 2012 Challenge: Predicting mortality of ICU patients using a cascaded SVM-GLM paradigm | |
Pramanik et al. | Identifying disease and diagnosis in females using machine learning | |
CN111613335A (zh) | 一种健康预警系统及方法 | |
CN102831288B (zh) | 生理参数指标运算系统及方法 | |
US20140350967A1 (en) | System and method for prioritizing risk models and suggesting services based on a patient profile | |
Moses et al. | A survey of data mining algorithms used in cardiovascular disease diagnosis from multi-lead ECG data | |
CN114388135B (zh) | 一种孕妇指标数据分析方法、装置、设备及可读存储介质 | |
Thuraisingham | A Classification System to Detect Congestive Heart Failure Using Second‐Order Difference Plot of RR Intervals | |
Chen et al. | Edge2Analysis: a novel AIoT platform for atrial fibrillation recognition and detection | |
CN105574322A (zh) | 生理参数指标运算系统及方法 | |
KR20230166054A (ko) | 딥러닝 학습 모델을 이용한 당뇨병 발병 위험도 예측 시스템, 방법 및 프로그램 | |
Moreno-Sánchez | Data-driven early diagnosis of chronic kidney disease: development and evaluation of an explainable AI model | |
CN112750532B (zh) | 特征识别方法与电子装置 | |
Haugg et al. | Assessment of blood pressure using only a smartphone and machine learning techniques: A systematic review | |
TWI715250B (zh) | 特徵識別方法與電子裝置 | |
Ahammad | Risk factor identification for stroke prognosis using machine-learning algorithms | |
CN117158938A (zh) | 一种应用于智能手表的健康监测方法、装置及电子设备 | |
CN117116475A (zh) | 缺血性脑卒中的风险预测方法、系统、终端及存储介质 | |
Sideris et al. | A data-driven feature extraction framework for predicting the severity of condition of congestive heart failure patients | |
CN113052199A (zh) | 病情检测模型的训练方法、装置、设备及计算机存储介质 | |
Neelakandan et al. | Extreme Gradient Boosting based Fetal Health Classification | |
Ceh-Varela et al. | Machine learning analysis of factors contributing to Diabetes Development | |
US20240105344A1 (en) | System for constructing hyperkalemia prediction algorithm through electrocardiogram, method for constructing hyperkalemia prediction algorithm through electrocardiogram by using same, and hyperkalemia prediction system using electrocardiogram | |
Ullah et al. | Exploiting Machine Learning Models for Identification of Heart Diseases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |