CN115620900A - 一种筛查多囊卵巢综合征的系统和方法 - Google Patents

一种筛查多囊卵巢综合征的系统和方法 Download PDF

Info

Publication number
CN115620900A
CN115620900A CN202211635867.5A CN202211635867A CN115620900A CN 115620900 A CN115620900 A CN 115620900A CN 202211635867 A CN202211635867 A CN 202211635867A CN 115620900 A CN115620900 A CN 115620900A
Authority
CN
China
Prior art keywords
subject
days
menstrual cycle
bmi
amh
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211635867.5A
Other languages
English (en)
Other versions
CN115620900B (zh
Inventor
徐慧玉
李蓉
乔杰
冯国双
韩勇
史莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Qingguo Medical Technology Co ltd
Peking University Third Hospital Peking University Third Clinical Medical College
Original Assignee
Hangzhou Qingguo Medical Technology Co ltd
Peking University Third Hospital Peking University Third Clinical Medical College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Qingguo Medical Technology Co ltd, Peking University Third Hospital Peking University Third Clinical Medical College filed Critical Hangzhou Qingguo Medical Technology Co ltd
Priority to CN202211635867.5A priority Critical patent/CN115620900B/zh
Publication of CN115620900A publication Critical patent/CN115620900A/zh
Priority to PCT/CN2023/075024 priority patent/WO2024124677A1/zh
Application granted granted Critical
Publication of CN115620900B publication Critical patent/CN115620900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请涉及一种筛查多囊卵巢综合征的系统和方法,其中系统包括:数据采集模块,其用于获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、以及收集受试者的BMI的数据;以及计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。本申请构建的系统仅使用AMH、月经周期天数和BMI三个参数,避免了免疫法雄激素检查的不准确性问题,从而进一步减少检测时间和检测成本,提高检测效率和准确性。其次,本申请的申请人采用的是真实世界研究,显示经过优化的三指标模型与之前的四指标模型具有相同的预测效果。

Description

一种筛查多囊卵巢综合征的系统和方法
技术领域
本申请涉及检测技术领域,具体涉及一种筛查多囊卵巢综合征的系统和方法。
背景技术
多囊卵巢综合征(PCOS)影响着全球10%以上的妇女,是最常见的内分泌和代谢疾病之一,需特别关注这一类人群的长期健康问题。PCOS患者只有一小部分因为不孕不育因素就诊,相当比例的PCOS患者未就诊,因此,相当多的PCOS患者不能对其未来的潜在代谢疾病发生风险进行有效管理。另外,由于PCOS发病机制未知,目前国际上常用的诊断标准也备受争议。
基于上述背景,在本领域中亟需与PCOS发病机制相关的新的筛查标准。另外,当前用于筛查和诊断PCOS的临床实践,对于普通妇科医生和初级保健医师而言并非易事,常常会造成漏诊。
发明内容
基于现有技术存在的问题,本申请人在之前的专利CN 113035354 B中提供了一种诊断多囊卵巢综合征的系统,其包括:数据采集模块,其用于获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、收集受试者的BMI、以及获取受试者的雄烯二酮(A4)水平的数据;以及计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。
由于临床常用的基于免疫的化学发光法的雄烯二酮(A4)检测准确性较差,即基于免疫的A4与金标准质谱法的相关性r 2 仅为0.285,相当于基于免疫化学发光法A4仅能解释质谱A4的28.5%。在本申请中,本申请的发明人尝试建立使用更少指标来筛查和预测PCOS的系统和方法,从而进一步减少检测时间和检测成本,提高检测效率和准确性。
具体来说,本申请涉及如下内容:
1. 一种筛查多囊卵巢综合征的系统,其包括:
数据采集模块,其用于获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、以及收集受试者的BMI的数据;以及
计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。
2.根据项1所述的系统,其还包括:
分组模块,在所述分组模块中预存有默认的多囊卵巢综合征分组参数,并且依据该分组参数,对所述计算得到的罹患多囊卵巢综合征的概率(p)进行分组,从而对受试者罹患多囊卵巢综合征的风险进行分组。
3. 根据项1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,利用将受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI的数据转换成的多分类变量来计算受试者罹患多囊卵巢综合征的概率(p)。
4. 根据项1或2所述的系统,其中,
所述抗缪勒氏管激素(AMH)水平是指女性受试者月经周期任何一天的静脉血中的抗缪勒氏管激素浓度。
5. 根据项1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将所述抗缪勒氏管激素(AMH)水平转换成五分类变量,
即将所述抗缪勒氏管激素(AMH)水平分为五组,分别为:受试者的抗缪勒氏管激素(AMH)水平小于2.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在2.5 ng/ml及以上且小于5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在5 ng/ml及以上且小于7.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在7.5 ng/ml及以上且小于10 ng/ml,以及受试者的抗缪勒氏管激素(AMH)水平大于等于10 ng/ml。
6. 根据项1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将所述受试者的月经周期天数上限转换成五分类变量,
即将受试者的月经周期天数上限分为五组,分别为受试者的月经周期天数上限小于35天,受试者的月经周期天数上限在35天及以上且小于45天,受试者的月经周期天数上限在45天及以上且小于60天,受试者的月经周期天数上限在60天及以上且小于90天,以及受试者的月经周期天数上限在90天及以上。
7. 根据项1或2所述的系统,其中,
在计算罹患多囊卵巢综合征概率的模块中,将受试者的BMI转换成四分类变量,
即将受试者的BMI分为四组,分别为受试者的BMI小于18.5,受试者的BMI在18.5及以上且小于24,受试者的BMI在24及以上且小于28,以及受试者的BMI在28及以上。
8. 根据项1或2所述的系统,其中,
在计算罹患多囊卵巢综合征概率的模块中,预先存储有基于现有数据库中受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI的数据转换成的多分类变量拟合而成的用于计算罹患多囊卵巢综合征的概率(p)的公式。
9. 根据项8所述的系统,其中,
所述公式为如下公式一:
p=1/[1+e-(i+a*AMH+b*月经周期天数上限+c*BMI) ](公式一)
其中,p为计算出的受试者罹患多囊卵巢综合征的概率,a、b、c、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的模块中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI来获取a、b、c的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、或BMI取值为0或1。
10. 根据项9所述的系统,其中,
i为选自-4.255406~-3.56205中的任意数值;
当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;
当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3982787~0.846642中的任意数值;
当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.3775495~1.8533111中的任意数值;
当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自2.0095086~2.5992375中的任意数值;
当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.4552789~3.0324161中的任意数值;
当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;
当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1836336~1.6602398中的任意数值;
当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.6734536~2.1734828中的任意数值;
当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.7119305~2.4218832中的任意数值-;
当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自2.0049859~2.682179中的任意数值,;
当受试者的BMI小于18.5时,BMI取值为0;
当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.306744~0.3390827中的任意数值,;
当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.1934385~0.8774874中的任意数值;
当受试者的BMI在28及以上时,BMI取值为1,c为选自0.5968209~1.3646449中的任意数值。
11. 根据项2所述的系统,其中,
在所述分组模块中预存的分组依据为:
当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低风险;
当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;
当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
12. 一种筛查多囊卵巢综合征的方法,其包括:
数据采集步骤,其获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、以及收集受试者的BMI的数据;以及
计算罹患多囊卵巢综合征的概率的步骤,其将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。
13.根据项12所述的方法,其还包括:
分组步骤,在所述分组步骤中预存有默认的多囊卵巢综合征分组参数,并且依据该分组参数,对所述计算得到的罹患多囊卵巢综合征的概率(p)进行分组,从而对受试者罹患多囊卵巢综合征的风险进行分组。
14. 根据项12或13所述的方法,其中,
在计算罹患多囊卵巢综合征的概率的步骤中,利用将受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI的数据转换成的多分类变量来计算受试者罹患多囊卵巢综合征的概率(p)。
15. 根据项12或13所述的方法,其中,
所述抗缪勒氏管激素(AMH)水平是指女性受试者月经周期任何一天的静脉血中的抗缪勒氏管激素浓度。
16. 根据项12或13所述的方法,其中,
在计算罹患多囊卵巢综合征的概率的步骤中,将所述抗缪勒氏管激素(AMH)水平转换成五分类变量,
即将所述抗缪勒氏管激素(AMH)水平分为五组,分别为:受试者的抗缪勒氏管激素(AMH)水平小于2.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在2.5 ng/ml及以上且小于5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在5 ng/ml及以上且小于7.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在7.5 ng/ml及以上且小于10 ng/ml,以及受试者的抗缪勒氏管激素(AMH)水平大于等于10 ng/ml。
17. 根据项12或13所述的方法,其中,
在计算罹患多囊卵巢综合征的概率的步骤中,将所述受试者的月经周期天数上限转换成五分类变量,
即将受试者的月经周期天数上限分为五组,分别为受试者的月经周期天数上限小于35天,受试者的月经周期天数上限在35天及以上且小于45天,受试者的月经周期天数上限在45天及以上且小于60天,受试者的月经周期天数上限在60天及以上且小于90天,以及受试者的月经周期天数上限在90天及以上。
18. 根据项12或13所述的方法,其中,
在计算罹患多囊卵巢综合征概率的步骤中,将受试者的BMI转换成四分类变量,
即将受试者的BMI分为四组,分别为受试者的BMI小于18.5,受试者的BMI在18.5及以上且小于24,受试者的BMI在24及以上且小于28,以及受试者的BMI在28及以上。
19. 根据项12或13所述的方法,其中,
在计算罹患多囊卵巢综合征概率的步骤中,预先存储有基于现有数据库中受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI的数据转换成的多分类变量拟合而成的用于计算罹患多囊卵巢综合征的概率(p)的公式。
20. 根据项19所述的方法,其中,
所述公式为如下公式一:
p=1/[1+e-(i+a*AMH+b*月经周期天数上限+c*BMI) ](公式一)
其中,p为计算出的受试者罹患多囊卵巢综合征的概率,a、b、c、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的步骤中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI来获取a、b、c的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、或BMI取值为0或1。
21. 根据项20所述的方法,其中,
i为选自-4.255406~-3.56205中的任意数值;
当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;
当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3982787~0.846642中的任意数值;
当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.3775495~1.8533111中的任意数值;
当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自2.0095086~2.5992375中的任意数值;
当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.4552789~3.0324161中的任意数值;
当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;
当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1836336~1.6602398中的任意数值;
当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.6734536~2.1734828中的任意数值;
当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.7119305~2.4218832中的任意数值-;
当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自2.0049859~2.682179中的任意数值,;
当受试者的BMI小于18.5时,BMI取值为0;
当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.306744~0.3390827中的任意数值,;
当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.1934385~0.8774874中的任意数值;
当受试者的BMI在28及以上时,BMI取值为1,c为选自0.5968209~1.3646449中的任意数值。
22. 根据项13所述的方法,其中,
在所述分组步骤中预存的分组依据为:
当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低风险;
当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;
当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
发明效果
虽然已经存在申请人自行开发的四指标的筛查多囊卵巢综合征的系统的方法和系统,但本领域仍然需要进一步开发出更为简便且准确的模型,为此本申请建立了一个具有3个参数的数学模型,即考虑AMH、月经周期天数和BMI的模型,从而避免了现有技术中需要使用基于免疫法的雄烯二酮水平来筛查多囊卵巢综合征的情况。
与现有技术相比,本申请具有以下有益效果:首先,本申请构建的系统仅使用AMH、月经周期天数和BMI三个参数,避免了免疫法雄激素检查的不准确性问题,从而进一步减少检测时间和检测成本,提高检测效率和准确性。其次,本申请的申请人采用的是真实世界研究,样本量大,并经过外部验证,显示经过优化的三指标PCOS模型与之前的四指标模型具有相同的预测效果。可见本申请人建立的多囊卵巢综合征筛查模型有助于在临床上更快捷简便地筛查和诊断多囊卵巢综合征,并且有可能进一步阐明多囊卵巢综合征的病因,即AMH位于雄激素信号通路上游,是比雄激素水平更关键的筛查PCOS的指标。利用本申请的系统,可以计算出受试者罹患多囊卵巢综合征的概率(p),并依据系统预存的默认的多囊卵巢综合征分组参数,对该受试者罹患多囊卵巢综合征的概率(p)进行分组,从而判断受试者罹患多囊卵巢综合征的风险。
具体实施方式
在本文中,月经期是指每次月经持续的天数,一般为3~7天。月经周期是指两次月经第1日的时间间隔,受试者月经周期天数上限是由受试者主动提供的,例如受试者基于过往的经验提供的其月经周期通常是30-90天,那么在本申请中获取的月经周期天数上限为90天。
抗缪勒氏管激素(AMH)是一种由卵巢小卵泡的颗粒层细胞所分泌的荷尔蒙,胎儿时期的女宝宝从36周开始制造AMH,卵巢内的小卵泡数量越多,AMH的浓度便越高;反之,当卵泡随着年龄及各种因素逐渐消耗,AMH浓度也会随之降低,越接近更年期,AMH便渐趋于0。
BMI(Body Mass Index)是体质指数又称体重指数的简称,是用体重公斤数除以身高米数平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准。主要用于统计用途,当我们需要比较及分析一个人的体重对于不同高度的人所带来的健康影响时,BMI值是一个中立而可靠的指标。
连续变量:在统计学中,变量按变量值是否连续可分为连续变量与分类变量两种。在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸,人体测量的身高、体重、胸围等为连续变量,其数值只能用测量或计量的方法取得。反之,其数值只能用自然数或整数单位计算的则为离散变量。例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。
分类变量是指地理位置、人口统计等方面的变量,其作用是将调查响应者分群。描述变量是描述某一个客户群与其他客户群的区别。大部分分类变量也就是描述变量。分类变量可以分为无序分类变量和有序分类变量两大类。其中,无序分类变量(unorderedcategorical variable)是指所分类别或属性之间无程度和顺序的差别。其又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。而有序分类变量(ordinal categorical variable)各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。
变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。
逻辑回归(logistics regression),是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过逻辑回归回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素。同时根据该权值可以根据危险因素预测一个人患癌症的可能性。逻辑回归的因变量可以是二分类的,也可以是多分类的。
在本文中使用的数据拟合模型是一个逻辑回归模型,它基于λ的值对回归模型的系数的绝对大小进行惩罚。惩罚越大,对较弱因素的估计就趋近于零,因此只有最强的预测变量保留在模型中。
最小绝对收缩和选择算子回归(通常简单地称为Lasso回归),是以缩小变量集(降阶)为思想的压缩估计方法。它通过构造一个惩罚函数,可以将变量的系数进行压缩并使某些回归系数变为0,进而达到变量选择的目的。它是一种利用罚函数来提高模型预测能力的算法, 该算法使用1-范数约束不仅能够解决高维度和共线性问题,还能使建立的模型具有“稀疏性”,即算法在建模中具有自动进行波长选择的效果。
10倍交叉验证(10-fold cross-validation),或称十折交叉验证,是常用的测试方法,用来测试算法准确性。在验证时将数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。十折交叉验证之所以选择将数据集分为10份,是因为通过利用大量数据集、使用不同学习技术进行的大量试验,表明10折是获得最好误差估计的恰当选择,而且也有一些理论根据可以证明这一点。
共线性,即同线性或同线型。统计学中,共线性即多重共线性。多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
过度拟合是“过于紧密或精确地对应于特定数据集的分析结果,因此可能无法拟合其他数据或可靠地预测未来的观察结果”。一种过度拟合模型是一个统计模型包含多个参数比可以由数据是合理的。过度拟合的本质是在不知不觉中提取了一些残余变化(即噪声),好像该变化代表了基础模型结构一样。换句话说,该模型记住了大量示例,而不是学习注意特征。过度拟合的可能性不仅取决于参数和数据的数量,还取决于模型结构与数据形状的一致性,以及与预期的噪声或数据误差水平相比模型误差的大小。即使拟合模型没有过多的参数,也可以预期,拟合关系在新数据集上的表现将比在拟合数据集上的表现差(有时会出现这种现象称为收缩)。
接收者操作特征曲线(receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚惊概率为横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。
本申请提供一种筛查多囊卵巢综合征的系统,其包括:
数据采集模块,其用于获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、以及收集受试者的BMI的数据;以及
计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。在计算罹患多囊卵巢综合征的概率的模块中,利用将受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI的数据转换成的多分类变量来计算受试者罹患多囊卵巢综合征的概率(p)。其中,所述抗缪勒氏管激素(AMH)水平是指女性受试者月经周期任何一天的静脉血中的抗缪勒氏管激素浓度。比如受试者的月经周期为28天,则所述抗缪勒氏管激素(AMH)水平可以是月经周期第1天的静脉血中的抗缪勒氏管激素浓度,可以是月经周期第10天的静脉血中的抗缪勒氏管激素浓度,也可以是月经周期第28天的静脉血中的抗缪勒氏管激素浓度。
在计算罹患多囊卵巢综合征的概率的模块中,本申请的发明人经过深入研究,通过探索自变量与结局变量的分布情况,将所述抗缪勒氏管激素(AMH)水平转换成五分类变量,即将所述抗缪勒氏管激素(AMH)水平分为五组,分别为:受试者的抗缪勒氏管激素(AMH)水平小于2.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在2.5 ng/ml及以上且小于5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在5 ng/ml及以上且小于7.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在7.5 ng/ml及以上且小于10 ng/ml,以及受试者的抗缪勒氏管激素(AMH)水平大于等于10 ng/ml。
在计算罹患多囊卵巢综合征的概率的模块中,本申请的发明人经过深入研究,通过探索自变量与结局变量的分布情况,将所述受试者的月经周期天数上限转换成五分类变量,即将受试者的月经周期天数上限分为五组,分别为受试者的月经周期天数上限小于35天,受试者的月经周期天数上限在35天及以上且小于45天,受试者的月经周期天数上限在45天及以上且小于60天,受试者的月经周期天数上限在60天及以上且小于90天,以及受试者的月经周期天数上限在90天及以上。
在计算罹患多囊卵巢综合征概率的模块中,本申请的发明人经过深入研究,通过探索自变量与结局变量的分布情况,将受试者的BMI转换成四分类变量,即将受试者的BMI分为四组,分别为受试者的BMI小于18.5,受试者的BMI在18.5及以上且小于24,受试者的BMI在24及以上且小于28,以及受试者的BMI在28及以上。
通过将上述三个变量变换成不同的多分类变量,利用这样的多分类变量来进行数据分析可以将自变量与结局变量的非线性关系转换为线性关系,更为准确地计算出受试者罹患多囊卵巢综合征的概率,且模型稳定性更好。
在计算罹患多囊卵巢综合征概率的模块中,预先存储有基于现有数据库中受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI的数据转换成的多分类变量拟合而成的用于计算罹患多囊卵巢综合征的概率(p)的公式。并根据分组标准对受试者罹患多囊卵巢综合征的概率(p)进行分组。
在本申请中,现有数据库是指能够获取的正在接受治疗或以前接受治疗满足下述纳入和排除标准的受试者组成的数据库,对于数据库的样本量没有任何约定,当然数据库的样本量越大越好,例如可以是利用100个受试者,200个受试者,300个受试者,优选为400个受试者以上,更优选为500个受试者以上。在一个具体的实施例中,采用的11720个样本组成的现有数据库。
分析数据:所有2019年一月至十二月来北京大学第三医院生殖医学中心就诊的合计21219个促排卵治疗周期,排除月经周期、BMI、睾酮、雄烯二酮、窦卵泡计数(AFC)等记录不全的周期,共11720个周期纳入最后的分析。本研究中的月经周期天数是指月经周期持续时间的上限。 例如,如果患者的月经周期为30-90天,则使用90天进行分析。对于我们分析中不明身份的数据,无需患者知情同意,这符合赫尔辛基的声明。
计算罹患多囊卵巢综合征概率的模块利用如下公式(一)计算出受试者罹患多囊卵巢综合征的概率(p):
p=1/1+e-(i+a*AMH+b*月经周期天数上限+c*BMI) (公式一)
其中,p为计算出的受试者罹患多囊卵巢综合征的概率,a、b、c、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的模块中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI来获取a、b、c的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、或BMI取值为0或1。
进一步地,i为选自-4.255406~-3.56205中的任意数值;当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3982787~0.846642中的任意数值;当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.3775495~1.8533111中的任意数值;当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自2.0095086~2.5992375中的任意数值;当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.4552789~3.0324161中的任意数值;当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1836336~1.6602398中的任意数值;当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.6734536~2.1734828中的任意数值;当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.7119305~2.4218832中的任意数值;当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自2.0049859~2.682179中的任意数值;当受试者的BMI小于18.5时,BMI取值为0;当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.306744~0.339082中的任意数值;当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.1934385~0.8774874中的任意数值;当受试者的BMI在28及以上时,BMI取值为1,c为选自0.5968209~1.3646449中的任意数值。
在本申请的分组模块中预存有默认的多囊卵巢综合征分组参数,在所述分组模块中预存的分组依据为:当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低风险;当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
在本申请的另外的一个具体的实施方式中,本申请还涉及一种筛查多囊卵巢综合征的方法,其包括:数据采集步骤,其获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、以及收集受试者的BMI的数据;以及计算罹患多囊卵巢综合征的概率的步骤,其将数据采集步骤中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。
如上所述,本申请的方法中所进行的步骤中的具体内容,对于受试者的抗缪勒氏管激素(AMH)水平、受试者主动提供的月经周期天数上限、受试者的BMI的数据的获取,分组以及处理方式均可以参照上述本申请涉及的系统的各模块进行的步骤。
实施例
实验数据的选定
在本实施例中采用了北京大学第三医院的病例数据,本申请的申请人收集在2019年1月至12月之间的21219个进行了促排卵周期的受试者的记录,并且经过筛选从中排除了无月经周期数据的3289个受试者的周期数据,无体重指数(BMI)信息的150个受试者的周期数据,无睾丸激素水平的3180个受试者的周期数据,无雄烯二酮水平的31个受试者的周期数据,以及无窦卵泡计数(AFC)信息的3849个受试者的周期数据。最后选定了11720个受试者的周期数据进行统计分析,并用于在本实施例中构建本申请的系统。
在本实施例中,月经周期天数上限是指月经周期持续时间的上限。例如,如果受试者在治疗期间提供的其过往的月经周期为30-90天,则使用90天作为月经周期天数上限。
对于本实施例进行的分析中不涉及患者身份信息,无需患者知情同意,这符合赫尔辛基声明。
PCOS的临床筛查
根据2003年鹿特丹标准(2003 Rotterdam criteria,Group, R.E.A.-S.P.c.w.Revised 2003 consensus on diagnostic criteria and long-term health risksrelated to polycystic ovary syndrome. Fertil Steril81, 19-25 (2004))诊断受试者是否罹患PCOS,该标准要求至少存在以下中的两项:(1)排卵功能障碍(即稀发排卵和/或无排卵);(2)高雄激素血症(血液测试中睾丸激素或雄烯二酮水平高)或雄激素过多的临床表现;(3)超声检查确定的多囊卵巢。同时排除表型相似的雄激素过多疾病(如先天性肾上腺增生,分泌雄激素的肿瘤、库欣综合征、甲状腺功能障碍和高泌乳素血症)之后,最终诊断是否罹患PCOS。
高雄激素临床表现是指痤疮、雄激素性脱发或多毛症;高雄激素血症指血清总睾丸激素或雄烯酮含量升高。在本实施例中,对多毛症的诊断采取如下标准,采用改良的Ferriman-Galwey评分> 4,或涉及上唇,大腿和小腹的毛发生长,且毛发生长评分> 2来诊断多毛症。在怀疑有雄激素分泌性肿瘤的罕见情况下(例如,当受试者出现明显的病毒感染或与PCOS有关的症状迅速发作时),测量雄激素水平会有所帮助。
其中,月经周期持续超过35天但少于6个月的月经周期诊断为月经稀发。闭经是指在形成周期性模式后超过6个月内没有月经。超声检查中的多囊卵巢定义为至少一侧卵巢包含12个或更多直径为2-9 mm的卵泡或卵巢体积大于10 mL。单个卵巢满足以上两个定义之一或全部两个定义即可以被诊断为多囊卵巢。高泌乳素血症是两次血清催乳素(PRL)含量超过25 ng/mL来诊断的。
窦卵泡计数和内分泌测定
在本实施例中,在月经周期或月经期第2天,通过经阴道超声扫描计数受试者两个卵巢中直径为2-10 mm的窦卵泡的数量。在同一天,收集受试者静脉血以测量催乳素(PRL)、促黄体生成素(LH)、睾丸激素、雄烯二酮和血清雌二醇(E2)的浓度。在月经期的任何一天都采集用于测量AMH的血样。收集血样并立即倒转五次并离心以进行进一步的内分泌评估。
使用Siemens Immulite 2000免疫测定系统(Siemens Healthcare Diagnostics,上海,中国)测试PRL、LH、睾丸激素,雄烯二酮和E2的血清水平。PRL、LH、睾丸激素、雄烯二酮和E2的质量控制由Bio-RAD实验室提供(美国加利福尼亚州赫尔克里士;Lyphochek免疫测定Plus对照,三级,目录号370,批号40370)。使用试剂盒随附的质量控制,使用超灵敏两点ELISA(Ansh Labs LLC; Webster,TX,USA)测量血清AMH浓度。对于三级质控、AMH、PRL和LH的测定变异系数小于6%,E2、雄烯二酮和睾丸激素的变异系数小于10%。
数据分析
本实施例中的所有分析均使用SAS JMP Pro(版本14.2;SAS Institute,Cary,NC,美国)来进行,并且在分析中如果p<0.05则被认为是具有统计学意义的。正态分布的变量显示为均值和标准差,而非正态分布的变量显示为中位数和四分位数。对于变量选择,将七个或八个变量输入到选择过程中。应用最小绝对收缩和选择算子回归(LASSO)来最小化从同一受试者测量的变量的潜在共线性和变量的过度拟合。
在本实施例中,发明人对多变量分析使用了L1最小化的最小绝对收缩和选择回归(L1-penalized least absolute shrinkage and selection regression),并使用10倍交叉验证进行了内部验证。这是一个逻辑回归模型,它基于λ的值对回归模型的系数的绝对大小进行惩罚。惩罚越大,对较弱因素的估计就趋近于零,因此只有最强的预测变量保留在模型中。预测性最强的协变量由最小值(λmin)选择。随后,将通过LASSO回归分析确定的变量输入到逻辑回归模型中,并将始终具有统计学意义的变量用于构建PCOS筛查模型。
在本实施例中,发明人使用接收者-操作者特征曲线(AUC),采用灵敏度和特异性下的面积评估了PCOS模型的性能。
变量选择
首先如下表1列出了实施例中收集的变量的基本特征。这些指标在筛查PCOS时在单变量分析中均具有重要意义。为了分析变量之间的相关性,将连续变量转换为分类变量。自变量的分组标准主要基于分析前的数据探索并结合本申请发明人的临床经验。在三个不同模型中,每个自变量的分组标准保持不变。
表1 变量特征
Figure 743160DEST_PATH_IMAGE001
其中,表1中BMI表示体重指数;AMH表示抗缪勒氏管激素水平;TES表示睾丸激素水平;AND表示雄烯二酮水平;AFC表示窦卵泡计数。
在整个模型的构建中,使用受试者的月经周期天数上限、AMH水平、和BMI来作为变量。
为此,首先发明人将所有11720个受试者的数据按70%:30%的比例分为内部验证组和外部验证数据组。在内部验证组中,将LASSO回归与10倍逻辑回归相结合来确定最佳模型(即PCOS-3模型)。计算了受试者罹患PCOS的概率的原始数据及其相应的预测数据。
表2中显示了PCOS-3模型中每个变量的贡献。其中,主效应是指单个指标自己对模型的贡献,总效应是单指标自己+单指标与其他指标相互作用对模型的贡献之和。表2的结果显示,每种预测因子对 PCOS-3模型的主效应是AMH 47.0%,月经周期天数上限34.5%,BMI4.3%。与本申请人之前的专利CN 113035354 B中构建的模型(PCOS-4)相比,本申请PCOS-3模型中AMH的贡献在主效应和总效应中都有所增加。PCOS-3中AMH的主效应超过了PCOS-4模型中A4的3.7%。
表2 实施例构建的PCOS-3模型和PCOS-4模型中每个预测变量的贡献
Figure 988197DEST_PATH_IMAGE002
表3显示了PCOS-3模型以及PCOS-4模型建模数据、内部验证数据和外部验证数据和中的AUC、敏感性和特异性。PCOS-3模型在建模数据集、内部验证数据集和外部验证集中,AUC分别为0.850、0.851、0.841。可以看到,两个模型在AUC、敏感性和特异性方面没有明显差异,表现为它们的95%置信区间重叠,表明两个模型的性能相似。
表3 PCOS-3模型以及PCOS-4模型的性能比较
Figure 33513DEST_PATH_IMAGE003
综上,基于本实施例中确认的PCOS-3模型,可以获得用于计算罹患多囊卵巢综合征的概率(p)的公式,即公式一,其能够基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI的数据来计算受试者罹患PCOS的概率(p)。
公式一:p=1/1+e-(i+a*AMH+b*月经周期天数上限+c*BMI)
其中,p为计算出的受试者罹患PCOS的概率,a、b、c、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的模块中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、以及BMI来获取a、b、c的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、BMI或AND取值为0或1。
i为选自-4.255406~-3.56205中的任意数值;当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3982787~0.846642中的任意数值;当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.3775495~1.8533111中的任意数值;当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自2.0095086~2.5992375中的任意数值;当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.4552789~3.0324161中的任意数值;当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1836336~1.6602398中的任意数值;当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.6734536~2.1734828中的任意数值;当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.7119305~2.4218832中的任意数值;当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自2.0049859~2.682179中的任意数值;当受试者的BMI小于18.5时,BMI取值为0;当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.306744~0.339082中的任意数值;当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.1934385~0.8774874中的任意数值;当受试者的BMI在28及以上时,BMI取值为1,c为选自0.5968209~1.3646449中的任意数值。
利用上述公式一计算出的预测概率与PCOS实际发生率之间的关系为,PCOS的实际发生率随着预测概率的增加而增加。当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低危;当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
虽然PCOS发病率高,但国际上对PCOS的诊断复杂,现在国际上最常用的是鹿特丹标准,它需要结合体格检查、病史、超声和验血以综合评判,对医生的诊断水平有较高的要求,很难大规模推广,因此造成了PCOS的大量漏诊。CN 113035354 B中涉及的四指标模型虽然较好的解决了一部分问题,但是该模型中的雄激素,即雄烯二酮的检测,国际范围内,临床常用基于免疫的检测方法,但是由于该技术本身存在技术瓶颈,导致基于免疫的女性雄激素的检测在国际范围一直是公认的难点,基于免疫的女性雄激素检测不准确的问题一直困扰临床,制约了女性雄激素相关疾病的诊断和治疗,这也是为什么世界范围内PCOS病因不明确且没有针对病因的治疗药物的重要原因。
本申请的三指标模型不使用雄激素,避免了因临床常用的基于免疫的雄激素检测不准导致的可能的错诊漏诊机会,且研究显示AMH与基于质谱的雄激素(质谱雄激素检测更准确,是国际公认的雄激素检测金标准)有很好的相关性。本申请的三指标模型中AMH所占权重是原有四指标模型AMH和雄烯二酮所占权重的总和,且模型效果无差别,提示新的三指标模型较旧的四指标模型不仅节省了成本,还很好的避免了因基于免疫的雄激素检测不准确的问题,具有很好的经济效益和现实意义,因此具有明显的创新性。
上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本申请权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本申请保护之列。

Claims (11)

1.一种筛查多囊卵巢综合征的系统,其包括:
数据采集模块,其用于获取受试者的抗缪勒氏管激素AMH水平、收集受试者主动提供的月经周期天数上限、以及收集受试者的BMI的数据;以及
计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率p。
2.根据权利要求1所述的系统,其还包括:
分组模块,在所述分组模块中预存有默认的多囊卵巢综合征分组参数,并且依据该分组参数,对所述计算得到的罹患多囊卵巢综合征的概率p进行分组,从而对受试者罹患多囊卵巢综合征的风险进行分组。
3.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,利用将受试者的抗缪勒氏管激素AMH水平、月经周期天数上限、以及BMI的数据转换成的多分类变量来计算受试者罹患多囊卵巢综合征的概率p。
4.根据权利要求1或2所述的系统,其中,
所述抗缪勒氏管激素AMH水平是指女性受试者月经周期任何一天的静脉血中的抗缪勒氏管激素浓度。
5.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将所述抗缪勒氏管激素AMH水平转换成五分类变量,
即将所述抗缪勒氏管激素AMH水平分为五组,分别为:受试者的抗缪勒氏管激素AMH水平小于2.5 ng/ml,受试者的抗缪勒氏管激素AMH水平在2.5 ng/ml及以上且小于5 ng/ml,受试者的抗缪勒氏管激素AMH水平在5 ng/ml及以上且小于7.5 ng/ml,受试者的抗缪勒氏管激素AMH水平在7.5 ng/ml及以上且小于10 ng/ml,以及受试者的抗缪勒氏管激素AMH水平大于等于10 ng/ml。
6.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将所述受试者的月经周期天数上限转换成五分类变量,
即将受试者的月经周期天数上限分为五组,分别为受试者的月经周期天数上限小于35天,受试者的月经周期天数上限在35天及以上且小于45天,受试者的月经周期天数上限在45天及以上且小于60天,受试者的月经周期天数上限在60天及以上且小于90天,以及受试者的月经周期天数上限在90天及以上。
7.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征概率的模块中,将受试者的BMI转换成四分类变量,
即将受试者的BMI分为四组,分别为受试者的BMI小于18.5,受试者的BMI在18.5及以上且小于24,受试者的BMI在24及以上且小于28,以及受试者的BMI在28及以上。
8.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征概率的模块中,预先存储有基于现有数据库中受试者的抗缪勒氏管激素AMH水平、月经周期天数上限、以及BMI的数据转换成的多分类变量拟合而成的用于计算罹患多囊卵巢综合征的概率p的公式。
9.根据权利要求8所述的系统,其中,
所述公式为如下公式一:
p=1/[1+e-(i+a*AMH+b*月经周期天数上限+c*BMI) ]公式一
其中,p为计算出的受试者罹患多囊卵巢综合征的概率,a、b、c、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的模块中,基于受试者的抗缪勒氏管激素AMH水平、月经周期天数上限、以及BMI来获取a、b、c的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、或BMI取值为0或1。
10.根据权利要求9所述的系统,其中,
i为选自-4.255406~-3.56205中的任意数值;
当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;
当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3982787~0.846642中的任意数值;
当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.3775495~1.8533111中的任意数值;
当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自2.0095086~2.5992375中的任意数值;
当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.4552789~3.0324161中的任意数值;
当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;
当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1836336~1.6602398中的任意数值;
当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.6734536~2.1734828中的任意数值;
当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.7119305~2.4218832中的任意数值-;
当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自2.0049859~2.682179中的任意数值;
当受试者的BMI小于18.5时,BMI取值为0;
当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.306744~0.3390827中的任意数值;
当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.1934385~0.8774874中的任意数值;
当受试者的BMI在28及以上时,BMI取值为1,c为选自0.5968209~1.3646449中的任意数值。
11.根据权利要求2所述的系统,其中,
在所述分组模块中预存的分组依据为:
当计算出的受试者罹患多囊卵巢综合征的概率p<10%时,受试者罹患多囊卵巢综合征的风险是低风险;
当10%≤计算出的受试者罹患多囊卵巢综合征的概率p<50%时,受试者罹患多囊卵巢综合征的风险是中风险;
当计算出的受试者罹患多囊卵巢综合征的概率p≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
CN202211635867.5A 2022-12-13 2022-12-13 一种筛查多囊卵巢综合征的系统和方法 Active CN115620900B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211635867.5A CN115620900B (zh) 2022-12-13 2022-12-13 一种筛查多囊卵巢综合征的系统和方法
PCT/CN2023/075024 WO2024124677A1 (zh) 2022-12-13 2023-02-08 一种筛查多囊卵巢综合征的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211635867.5A CN115620900B (zh) 2022-12-13 2022-12-13 一种筛查多囊卵巢综合征的系统和方法

Publications (2)

Publication Number Publication Date
CN115620900A true CN115620900A (zh) 2023-01-17
CN115620900B CN115620900B (zh) 2023-05-30

Family

ID=84879794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211635867.5A Active CN115620900B (zh) 2022-12-13 2022-12-13 一种筛查多囊卵巢综合征的系统和方法

Country Status (2)

Country Link
CN (1) CN115620900B (zh)
WO (1) WO2024124677A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116543905A (zh) * 2023-05-09 2023-08-04 北京大学第三医院(北京大学第三临床医学院) 预测卵巢多囊样改变(pcom)的系统和方法
WO2024124677A1 (zh) * 2022-12-13 2024-06-20 北京大学第三医院(北京大学第三临床医学院) 一种筛查多囊卵巢综合征的系统和方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570952A (zh) * 2018-06-05 2019-12-13 北京大学第三医院 预测拮抗剂方案下受试者卵巢低反应概率的系统及指导促性腺激素起始用药剂量选择的系统
CN113035354A (zh) * 2021-05-25 2021-06-25 北京大学第三医院(北京大学第三临床医学院) 一种诊断多囊卵巢综合征的系统和方法
WO2021198222A1 (en) * 2020-03-31 2021-10-07 F. Hoffmann-La Roche Ag A method of assessing a female's risk of having pcos as well as products and uses relating thereto
CN114913972A (zh) * 2021-12-10 2022-08-16 北京大学第三医院(北京大学第三临床医学院) 预测受试者卵巢刺激过程中获得的卵母细胞数量的系统
CN114936662A (zh) * 2022-02-18 2022-08-23 北京大学第三医院(北京大学第三临床医学院) 一种用于预测受试者的卵巢高反应的系统
CN115036030A (zh) * 2022-06-06 2022-09-09 东莞广济医院有限公司 一种ivf/icsi患者卵巢反应预测模型的建立验证装置及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109602394B (zh) * 2018-12-12 2020-01-17 北京大学第三医院 评估受试者卵巢储备功能的系统
CN113049838A (zh) * 2019-12-27 2021-06-29 山东大学 多囊卵巢形态阈值和其在诊断多囊卵巢综合征中的应用
CN115620900B (zh) * 2022-12-13 2023-05-30 北京大学第三医院(北京大学第三临床医学院) 一种筛查多囊卵巢综合征的系统和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570952A (zh) * 2018-06-05 2019-12-13 北京大学第三医院 预测拮抗剂方案下受试者卵巢低反应概率的系统及指导促性腺激素起始用药剂量选择的系统
WO2021198222A1 (en) * 2020-03-31 2021-10-07 F. Hoffmann-La Roche Ag A method of assessing a female's risk of having pcos as well as products and uses relating thereto
CN113035354A (zh) * 2021-05-25 2021-06-25 北京大学第三医院(北京大学第三临床医学院) 一种诊断多囊卵巢综合征的系统和方法
CN114913972A (zh) * 2021-12-10 2022-08-16 北京大学第三医院(北京大学第三临床医学院) 预测受试者卵巢刺激过程中获得的卵母细胞数量的系统
CN114936662A (zh) * 2022-02-18 2022-08-23 北京大学第三医院(北京大学第三临床医学院) 一种用于预测受试者的卵巢高反应的系统
CN115036030A (zh) * 2022-06-06 2022-09-09 东莞广济医院有限公司 一种ivf/icsi患者卵巢反应预测模型的建立验证装置及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李桦;周玉球;姜莹;满晏竭;熊永崂;徐隽颖;: "多囊卵巢综合征患者检测抗苗勒氏管激素的应用价值" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024124677A1 (zh) * 2022-12-13 2024-06-20 北京大学第三医院(北京大学第三临床医学院) 一种筛查多囊卵巢综合征的系统和方法
CN116543905A (zh) * 2023-05-09 2023-08-04 北京大学第三医院(北京大学第三临床医学院) 预测卵巢多囊样改变(pcom)的系统和方法
CN116543905B (zh) * 2023-05-09 2024-08-06 北京大学第三医院(北京大学第三临床医学院) 预测卵巢多囊样改变(pcom)的系统和方法

Also Published As

Publication number Publication date
WO2024124677A1 (zh) 2024-06-20
CN115620900B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN115620900B (zh) 一种筛查多囊卵巢综合征的系统和方法
Nicolaou et al. Allergy or tolerance in children sensitized to peanut: prevalence and differentiation using component-resolved diagnostics
CN109602394B (zh) 评估受试者卵巢储备功能的系统
Chu et al. Meta‐analysis of diagnostic accuracy studies accounting for disease prevalence: alternative parameterizations and model selection
Magadi et al. Factors associated with unfavourable birth outcomes in Kenya
Rowe et al. Quality of life among women undergoing hysterectomies
CN114464322B (zh) 女性盆底功能障碍性疾病风险预警模型及其构建方法和系统
CN111785389B (zh) 预测受试者出现卵巢储备新变化年限的系统和方法
CN113035354B (zh) 一种诊断多囊卵巢综合征的系统和方法
Martín‐Rodríguez et al. Accuracy of prehospital point‐of‐care lactate in early in‐hospital mortality
CN112786203A (zh) 一种机器学习糖尿病视网膜病变发病风险预测方法及应用
Janssens et al. A new logistic regression approach for the evaluation of diagnostic test results
CN111524604B (zh) 评估受试者卵巢储备功能的系统
Griffey et al. Performance in appropriate Rh testing and treatment with Rh immunoglobulin in the emergency department
Frank et al. Adolescent BMI trajectory and associations with adult metabolic syndrome and offspring obesity
Pokharel et al. Prevalence of gestational diabetes mellitus in Nepal: a systematic review and meta-analysis
Farhadi Hassankiadeh et al. Efficiency of zero-inflated generalized poisson regression model on hospital length of stay using real data and simulation study
CN115312196A (zh) 一种新型筛选压力性损伤危险因素的模型构建评价方法及其应用
Bashir et al. Correction of risk estimates for measurement error in epidemiology
CN116543905B (zh) 预测卵巢多囊样改变(pcom)的系统和方法
Kyriacou et al. Updating M6 pregnancy of unknown location risk‐prediction model including evaluation of clinical factors
Redondo-González et al. Impact of self-financed rotavirus vaccines on hospital stays and costs in Spain after a 3-year introductory period
Sakly et al. Epidemiological Study of Cardiopathies and Valvulopathies using Binary Logistic Regression
CN112908475A (zh) 用于评估受试者卵巢储备功能的系统
Koti et al. Data Analysis on the Risks of Obesity and Overweight in Women-A Study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant