CN110021426B - 一种不均衡数据下最优化学习样本合成算法选择及参数确定方法 - Google Patents

一种不均衡数据下最优化学习样本合成算法选择及参数确定方法 Download PDF

Info

Publication number
CN110021426B
CN110021426B CN201910187920.1A CN201910187920A CN110021426B CN 110021426 B CN110021426 B CN 110021426B CN 201910187920 A CN201910187920 A CN 201910187920A CN 110021426 B CN110021426 B CN 110021426B
Authority
CN
China
Prior art keywords
sample
alpha
samples
data
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910187920.1A
Other languages
English (en)
Other versions
CN110021426A (zh
Inventor
许金山
卢炎培
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910187920.1A priority Critical patent/CN110021426B/zh
Publication of CN110021426A publication Critical patent/CN110021426A/zh
Application granted granted Critical
Publication of CN110021426B publication Critical patent/CN110021426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/43Detecting, measuring or recording for evaluating the reproductive systems
    • A61B5/4306Detecting, measuring or recording for evaluating the reproductive systems for evaluating the female reproductive systems, e.g. gynaecological evaluations
    • A61B5/4343Pregnancy and labour monitoring, e.g. for labour onset detection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Mathematical Physics (AREA)
  • Physiology (AREA)
  • Pregnancy & Childbirth (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Reproductive Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Gynecology & Obstetrics (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种不均衡数据下最优化学习样本合成算法选择及参数确定方法,以数据特征对诊断结果的贡献能力为出发点,分析样本均衡度对其区分能力的影响,提出以最大化特征区分能力为指标来选择样本合成采样算法。同时,构建激活函数来描述样本数量对分类能力的影响。在此基础上,提出有效特征区分度指标,并通过对该指标的最大化来获得最优样本均衡度。本发明所涉及的过程均以特征对样本的正确分类为目标,且仅需要对原始数据进行操作,可以在不增加样本采集及引入新特征的情况下获得更高的诊断效果。另外,没有特征数量方面要求,不会因为数据特征数量多少影响最终计算的最优样本均衡度的准确率。

Description

一种不均衡数据下最优化学习样本合成算法选择及参数确定 方法
技术领域
本发明涉及基于机器学习的疾病检测领域,通过确定最优的样本合成采样方法及其采样率,解决机器在学习分类器由于疾病类样本数据匮乏而导致的检测精度低下问题。
背景技术
近年来,以机器学习算法为基础的人工智能(Artificial Intelligence,AI)越来越受人们关注,特别是伴随着大数据时代的到来,其应用范围也越来越广,基于机器学习的应用更是层出不穷。应用机器学习方法进行疾病筛查其中的热点研究问题之一,特别是对于那些目前还没有有效诊断方法的疾病。早产(Preterm Birth, 怀孕小于37周的新生儿)作为全球范围的公共健康问题之一,即使在欧洲和其他一些发达国家,早产也约占新生儿7%左右。据统计每年全球约有1500万早产儿出生,占全部新生儿的6%~10%,其中约100万早产儿死于早产并发症。此外,早产可导致严重的不良围产儿预后,比如生长发育迟缓、视力损害、听力障碍、慢性肺部疾病、脑瘫以及运动受限等,都已经对社会和家庭造成了巨大的负担。虽然围产监护水平取得了长足进步,但常归的检测手段如子宫分娩力计(TOCO),宫内压力计(Intra-uterine Pressure Catheter),胎儿纤连蛋白(fetal Fibronectin),宫颈长度测量(Cervical length measurement)都无法提供可靠的检测结果。
应用机器学习方法进行早产检测是目前的一个研究热点,其实质是通过分析样本病例的特征,学习这些特别在不同类之间的分布特性,然后利用这些分布特性判断未知病例归类于早产还是正常病例。因此,从本质上来说基于机器学习的早产检测是一个分类问题。类似于其他的应用,高效的早产诊断方法离不开学习样本量的充裕性及样本特征的有效性。
早产的发生从本质上来说是持续且强有力的宫缩过早地产生。生理学实验表明,宫缩是伴随着子宫肌细胞动作电位活动及其传播产生的,而子宫肌细胞的动作电位又可以通过置于孕妇腹部的电极采集并记录,形成子宫肌电 EHG(eletrohysterogram)信号。正因如此,EHG信号为早产诊断方法研究指明了新方向。目前世界上已经建立起了多个关于关于孕期子宫EHG信号的数据库: EPEHG数据库(THE TERM-PRETERM EHG DATABASE)和冰岛16电极EHG数据库(ICELANDIC 16-ELECTRODE ELECTOHYSTEROGRAM DATABASE)。
虽然这些开源的数据库为分类器训练提供了数据支撑,但由于EHG信号采集还没有普及,EHG数据资源极为有限。数据量最大的TPEHG库也只有300个有效样本,并且样本在类间的分布极不均匀:38个早产病例,262个正常分娩病例。虽然不段有新的特征被用于训练分类器,类似于大多数的医疗数据,患病样本数相对于非患病样本数较少,用这些这些类间分布不均衡的样本数据训练分类器,容易造成分类器对于少数类(患病样本)不敏感,分类精度无法满足要求。
解决训练样本数不均衡问题的方法有两种:1)对多数类样本进行下采样,即从多数类中随机选取一部分样本,然后和全部少数类样本组成新的训练集,训练分类器;2)对少数类进行合成采样,构建新的少数类样本。由于医疗数据有限,特别是用于早产诊断的EHG信号本身较少,对多数类进行下采样容易造成学习样本不足,出现欠拟合问题。少数类的合成采样方法利用已有的少数量样本,在其特征空间中随机构建新的样本,常用的合成采样算法包括:SMOTE和ADASYN。虽然这个算法以一定的方式模拟样本的随机采样过程,但是合成数据一方面会造成特征在不同类间的分布属性,降低特征用于区分不同类的能力(特征有效性);另一方面随着合成数据的增加,原有样本中特征的某些随机变化会被放大,被学习分类器当成有效特征,在真实应用中造成过拟合现象。除此之外,随着合成样本数的增加,分类器对少数类样本敏感性逐步提高的同时,对多数类样本的敏感度也随之降低。而疾病诊断应用中,我们既要求尽可能地检测出患病病例,也要求尽少的误检率。为了平衡实际应用于对检测精度和误检率的要求,需要确定最佳的合成样本数。
发明内容
为了克服基已有于机器学习的疾病诊断应用中存在的学习样本在类间不均匀分布导致的分类器精度低下不足,本发明提供一种少数类样本合成采样算法的选择办法,并在此基础上提出一种确定最佳合成样本数的方法。
本发明解决其技术问题所采用的技术方案是:
一种不均衡数据下最优化学习样本合成算法选择及参数确定方法,包括以下步骤:
S1、计算样本原始均衡度
Figure BDA0001993446930000031
以最终需要达到的样本均衡度α计算合成采样样本数N=(α-α1)·(#of Majority Smaples),α∈[α1,∞],利用 SMOTE和ADASYN采样N个新样本;
S2、在不同均衡度α下,计算各个特征xi对样本分类的区分能力
Figure BDA0001993446930000032
计算方程为:
Figure BDA0001993446930000033
其中,
Figure BDA0001993446930000034
分别表示特征i的平均值,多少数类样本的特征均值及少数类样本特征均值xk,i +,xk,i -分别表示少数类和多数类中的第k个样本的i特征值
S3、根据步骤S2中所求得的每个单一特征区分度
Figure BDA0001993446930000035
利用随机森林算法计算出的特征权重,计算特征的总体区分度Fscore
Figure BDA0001993446930000036
其中,wi是利用随机森林算法计算得到的每个特征的权重,n为样本特征的个数;
S4、对于不同合成采样算法下得到的特征总体区分度值Fscore,其值越高,表明合成样本数据越有利用样本分类,即通过Fscore确定合成采样算法;
S5、构造激活函数CMin(α)和CMaj(α),表征样本量对少数类(Min)和多数量 (Maj)的作用力,同时引入初始样本数均衡度α1来描述原有样本在类间的分布对分类结果的影响:
Figure BDA0001993446930000041
Figure BDA0001993446930000042
其中,α为经过合成采样后少数类样本数与多数类样本数间的比值,α1表示样本均的初始衡度。由函数定义可知,当α<<1时,即训练样本多数类样本占主导,对少数分的区分能力最小,对多数类样本的区分能力最大,当α>>1时,相反;
S6、结合激活函数CI(α),CII(α)及特征区分度Fscore,计算样本综合区分能力
Figure BDA0001993446930000043
为确定最佳的均衡度α提供了依据,计算方法为:
Figure BDA0001993446930000044
Figure BDA0001993446930000045
即,最大
Figure BDA0001993446930000046
值对于的α即为需要通过合成采样得到的最佳样本均衡度值。
本发明的有益效果主要表现在:针对基于机器学习的疾病诊断方法中,由于数据中疾病类与非疾病样本数量不均衡数据导致的诊断精度低下的问题,以数据特征对诊断结果的贡献能力为出发点,分析样本均衡度对其区分能力的影响,提出以最大化特征区分能力为指标来选择样本合成采样算法。同时,构建激活函数来描述样本数量对分类能力的影响。在此基础上,提出有效特征区分度指标,并通过对该指标的最大化来获得最优样本均衡度。本发明所涉及的过程均以特征对样本的正确分类为目标,且仅需要对原始数据进行操作,可以在不增加样本采集及引入新特征的情况下获得更高的诊断效果。另外,没有特征数量方面要求,不会因为数据特征数量多少影响最终计算的最优样本均衡度的准确率。
附图说明
图1为本发明实施流程图。
图2(a)为步骤7中均衡度α上升时每个特征的区分度的
Figure BDA0001993446930000051
变化关系图, (b)为总区分度Fscore变化关系图。
图3(a)为步骤8中激活函数CI(α),CII(α)图,图3(b)当均衡度α上升时,综合区分能力
Figure BDA0001993446930000052
的变化关系图,横坐标为均衡度α。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图3,一种不均衡数据下最优化学习样本合成算法选择及参数确定方法,包括以下步骤:
S1、计算样本原始均衡度
Figure BDA0001993446930000053
以最终需要达到的样本均衡度α计算合成采样样本数N=(α-α1)·(#of Majority Smaples),α∈[α1,∞],利用 SMOTE和ADASYN采样N个新样本;
S2、在不同均衡度α下,计算各个特征xi对样本分类的区分能力
Figure BDA0001993446930000054
计算方程为:
Figure BDA0001993446930000055
其中,
Figure BDA0001993446930000056
分别表示特征i的平均值,多少数类样本的特征均值及少数类样本特征均值xk,i +,xk,i -分别表示少数类和多数类中的第k个样本的i特征值
S3、根据步骤S2中所求得的每个单一特征区分度
Figure BDA0001993446930000057
利用随机森林算法计算出的特征权重,计算特征的总体区分度Fscore
Figure BDA0001993446930000061
其中,wi是利用随机森林算法计算得到的每个特征的权重,n为样本特征的个数;
S4、对于不同合成采样算法下得到的特征总体区分度值Fscore,其值越高,表明合成样本数据越有利用样本分类,即通过Fscore确定合成采样算法;
S5、构造激活函数CMin(α)和CMaj(α),表征样本量对少数类(Min)和多数量 (Maj)的作用力,同时引入初始样本数均衡度α1来描述原有样本在类间的分布对分类结果的影响:
Figure BDA0001993446930000062
Figure BDA0001993446930000063
其中,α为经过合成采样后少数类样本数与多数类样本数间的比值,α1表示样本均的初始衡度。由函数定义可知,当α<<1时,即训练样本多数类样本占主导,对少数分的区分能力最小,对多数类样本的区分能力最大,当α>>1时,相反;
S6、结合激活函数CI(α),CII(α)及特征区分度Fscore,计算样本综合区分能力
Figure BDA0001993446930000064
为确定最佳的均衡度α提供了依据,计算方法为:
Figure BDA0001993446930000065
Figure BDA0001993446930000066
即,最大
Figure BDA0001993446930000067
值对于的α即为需要通过合成采样得到的最佳样本均衡度值。
本实施例以基于TPEHG数据库早产检测方法为例,具体说明本发明的实施方式。开源数据库PhysioBank下的TPEHG记录了300孕妇孕早期的EHG信号,其中有262个正常分娩病例,38个早产病例,即样本间的初始均衡度为38/262。本实例应用数据库中已有的RMS,中值频率,峰值频率和样本熵等特征作来训练学习分类器,然后将其应用于早产检测。根据数据特征自身区分度与合成采样后样本的均衡度间的关系,找到最优均衡度,并根据此均衡度进行采样合成数据,最大化特征对样本分类的贡献能力,从而有效地预测早产。
所述方法包括以下步骤:
步骤1:对早产EHG信号进行特征提取包括RMS、中值频率、峰值频率、样本熵。特征可用很多备选的形式来应用本发明,并且不应当理解为本发明限制在本文阐述实施的特征中。
步骤2:根据孕妇的生育时间进行标记数据。如生育时间大于或等于37周,标记为早产,反之,为非早产数据。
步骤3:将特征RMS、中值频率、峰值频率、样本熵使用随机森林算法多次迭代,对特征进行评分,根据分类结果准确率计算特征的权重,即该特征对分类结果的影响大小。
步骤4:根据早产类与非早产类之间数量关系计算均衡度。即:α1=早产类数据数量/非早产数据数量。
步骤5:在α∈[α1,inf]进行试采样过程,采样方法包括不仅限于SMOTE、 ADASYN算法。
步骤6:将采样后的多组数据集根据式(1)计算早产类与非早产类中的RMS、中值频率、峰值频率、样本熵在均衡度α上升时的
Figure BDA0001993446930000071
值。
步骤7:计算试采样后不同均衡度α下,根据单个特征的
Figure BDA0001993446930000072
与该特征的权重ωi,由(2)式计算整个早产类与非早产的区分度Fscore(α)。
步骤8:将Fscore(α)与激活函数相乘得到的
Figure BDA0001993446930000073
即为最终的综合区分能力,当在
Figure BDA0001993446930000074
最大时,此时均衡度αe即为最佳采样均衡度。
步骤9:使用最佳均衡度进行采样增强数据。采样方法包括不仅限于SMOTE、ADASYN算法。
步骤10:使用增强后的数据进行早产地预测,结果优于原始数据以及未达到最佳均衡度采样的数据。
本发明通过分析孕妇的EHG数据中早产与非早产样本均衡度α对其区分度的影响,以确定最优的样本均衡度。同时,利用合成采样方法在最优的样本样本均衡度下采样合成数据,从而达到增强早产预测数据的效果。本发明计算最优均衡度准确,速度快,仅仅需要原始数据,即可计算最优样本均衡度。且最终使用增强后的数据进行早产地预测,结果优于原始数据以及未达到最佳均衡度采样的数据。本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。

Claims (1)

1.一种不均衡疾病数据下最优化学习样本合成算法选择及参数确定方法,其特征在于,所述方法包括以下步骤:
S1、计算疾病数据样本原始均衡度
Figure FDA0002980617650000011
以最终需要达到的样本均衡度α计算合成采样样本数N=(α-α1)·(#of Majority Smaples),α∈[α1,∞],利用SMOTE和ADASYN采样方法合成N个新样本;
S2、在不同均衡度α下,计算各个特征xi对样本分类的区分能力
Figure FDA00029806176500000112
计算方程为:
Figure FDA0002980617650000012
其中,
Figure FDA0002980617650000013
分别表示特征i的平均值,多数类样本的特征均值及少数类样本特征均值,xk,i +,xk,i -分别表示少数类和多数类中的第k个样本的i特征值;
S3、根据步骤S2中所求得的每个单一特征区分度
Figure FDA0002980617650000014
利用随机森林算法计算出的特征权重,计算特征的总体区分度Fscore
Figure FDA0002980617650000015
其中,wi是利用随机森林算法计算得到的每个特征的权重,n为样本特征的个数;
S4、对于不同合成采样算法下得到的特征总体区分度值Fscore,其值越高,表明合成样本数据越有利用样本分类,即通过Escore确定合成采样算法;
S5、构造激活函数CMin(α)和CMaj(α),表征样本量对少数类和多数类的作用力,同时引入初始样本数均衡度α1来描述原有样本在类间的分布对分类结果的影响:
Figure FDA0002980617650000016
Figure FDA0002980617650000017
其中,α为经过合成采样后少数类样本数与多数类样本数间的比值,α1表示样本均的初始衡度,由函数定义可知,当α<<1时,即训练样本多数类样本占主导,对少数类样本 的区分能力最小,对多数类样本的区分能力最大,当α>>1时,相反;
S6、结合激活函数CMin(α),CMaj(α)及特征区分度Fscore,计算样本综合区分能力
Figure FDA0002980617650000018
为确定最佳的均衡度α提供了依据,计算方法为:
Figure FDA0002980617650000019
Figure FDA00029806176500000110
即,最大
Figure FDA00029806176500000111
值对于的α即为需要通过合成采样得到的最佳样本均衡度值。
CN201910187920.1A 2019-03-13 2019-03-13 一种不均衡数据下最优化学习样本合成算法选择及参数确定方法 Active CN110021426B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910187920.1A CN110021426B (zh) 2019-03-13 2019-03-13 一种不均衡数据下最优化学习样本合成算法选择及参数确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910187920.1A CN110021426B (zh) 2019-03-13 2019-03-13 一种不均衡数据下最优化学习样本合成算法选择及参数确定方法

Publications (2)

Publication Number Publication Date
CN110021426A CN110021426A (zh) 2019-07-16
CN110021426B true CN110021426B (zh) 2021-10-15

Family

ID=67189540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910187920.1A Active CN110021426B (zh) 2019-03-13 2019-03-13 一种不均衡数据下最优化学习样本合成算法选择及参数确定方法

Country Status (1)

Country Link
CN (1) CN110021426B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113133771B (zh) * 2021-03-18 2022-10-28 浙江工业大学 基于时频域熵特征的子宫肌电信号分析及早产预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016233A (zh) * 2017-03-14 2017-08-04 中国科学院计算技术研究所 运动行为和认知能力的关联分析方法及系统
CN108231201A (zh) * 2018-01-25 2018-06-29 华中科技大学 一种疾病数据分析处理模型的构建方法、系统及应用
CN108596199A (zh) * 2017-12-29 2018-09-28 北京交通大学 基于EasyEnsemble算法和SMOTE算法的不均衡数据分类方法
CN108921208A (zh) * 2018-06-20 2018-11-30 天津大学 基于深度学习的不平衡数据的均衡采样及建模方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10748663B2 (en) * 2017-05-04 2020-08-18 Efthymios Kalafatis Machine learning, natural language processing and network analysis-guided discovery related to medical research

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016233A (zh) * 2017-03-14 2017-08-04 中国科学院计算技术研究所 运动行为和认知能力的关联分析方法及系统
CN108596199A (zh) * 2017-12-29 2018-09-28 北京交通大学 基于EasyEnsemble算法和SMOTE算法的不均衡数据分类方法
CN108231201A (zh) * 2018-01-25 2018-06-29 华中科技大学 一种疾病数据分析处理模型的构建方法、系统及应用
CN108921208A (zh) * 2018-06-20 2018-11-30 天津大学 基于深度学习的不平衡数据的均衡采样及建模方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
一种改进过采样的不平衡数据集成分类算法;张菲菲等;《小型微型计算机系统》;20181015(第10期);全文 *
基于密度敏感最大软间隔SVDD不均衡数据分类算法;陶新民等;《电子学报》;20181115(第11期);全文 *
基于样本权重更新的不平衡数据集成学习方法;陈圣灵等;《计算机科学》;20180715(第07期);全文 *
基于粒子群优化的不均衡数据学习;曹鹏等;《计算机应用》;20130301(第03期);全文 *
基于邻域混合抽样和动态集成的不平衡数据分类方法;高锋等;《计算机科学》;20170815(第08期);全文 *

Also Published As

Publication number Publication date
CN110021426A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
US5800347A (en) ROC method for early detection of disease
Jager et al. Characterization and automatic classification of preterm and term uterine records
Schatzkin et al. Comparing new and old screening tests when a reference procedure cannot be performed on all screenees: example of automated cytometry for early detection of cervical cancer
CN104008398B (zh) 一种基于多传感器信息融合的步态分类方法
WO2023138418A1 (zh) 女性盆底功能障碍性疾病风险预警模型及其构建方法和系统
CN117609813B (zh) 一种重症患者监护数据智能管理方法
CN105825076B (zh) 消除常染色体内和染色体间gc偏好的方法及检测系统
Borowska et al. Identification of preterm birth based on RQA analysis of electrohysterograms
Johnson et al. Combining humerus and femur length for improved ultrasonographic identification of pregnancies at increased risk for trisomy 21
Sultan et al. Machine learning to improve breast cancer diagnosis by multimodal ultrasound
CN110021426B (zh) 一种不均衡数据下最优化学习样本合成算法选择及参数确定方法
CN107595249A (zh) 基于脉搏波的怀孕女性筛查方法
CN104520437B (zh) 一种染色体非整倍性检测方法及装置
US6030341A (en) ROC method for early detection of disease
CN112233742B (zh) 一种基于聚类的病历文档分类系统、设备、存储介质
Vinothini et al. Automated detection of preterm condition using uterine electromyography based topological features
Arora et al. Perceiving placental ultrasound image texture evolution during pregnancy with normal and adverse outcome through machine learning prism
CN112017772A (zh) 一种基于妇女白带的疾病认知模型构建方法及系统
CN113545771B (zh) 一种基于足底压力的集成k近邻帕金森病定量诊断系统
Zaylaa et al. n-order and maximum fuzzy similarity entropy for discrimination of signals of different complexity: Application to fetal heart rate signals
CN110689961B (zh) 一种基于大数据分析技术的胃癌疾病风险检测装置
Muqni et al. Maternal preconception body mass index and gestational weight gain: A prospective cohort study potentially to prevent low birth weight
Tsipouras Uterine EMG Signals Spectral Analysis for Pre-Term Birth Prediction.
CN113921136A (zh) 一种融合多源数据智能评估预测慢性病风险的系统
Alamedine Selection of EHG parameter characteristics for the classification of uterine contractions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant