CN119889552B - 医学检验项目参考区间适宜性评估系统 - Google Patents

医学检验项目参考区间适宜性评估系统 Download PDF

Info

Publication number
CN119889552B
CN119889552B CN202510348983.6A CN202510348983A CN119889552B CN 119889552 B CN119889552 B CN 119889552B CN 202510348983 A CN202510348983 A CN 202510348983A CN 119889552 B CN119889552 B CN 119889552B
Authority
CN
China
Prior art keywords
reference interval
data
test
test item
abnormal rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202510348983.6A
Other languages
English (en)
Other versions
CN119889552A (zh
Inventor
杨大干
赵敏
胡长爱
范利娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Hospital of China Medical University
First Affiliated Hospital of Zhejiang University School of Medicine
Original Assignee
First Hospital of China Medical University
First Affiliated Hospital of Zhejiang University School of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Hospital of China Medical University, First Affiliated Hospital of Zhejiang University School of Medicine filed Critical First Hospital of China Medical University
Priority to CN202510348983.6A priority Critical patent/CN119889552B/zh
Publication of CN119889552A publication Critical patent/CN119889552A/zh
Application granted granted Critical
Publication of CN119889552B publication Critical patent/CN119889552B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请公开了一种医学检验项目参考区间适宜性评估系统。所述医学检验项目参考区间适宜性评估系统通过预设参考区间和基于体检数据的集合计算获得的参考区间,评估参考区间的异常率和检验结果的异常等级分布,还评估预设参考区间与该检验项目的文献参考区间之间的一致性,进而生成每一项检验项目的预设参考区间的适宜性评估结果。这样,所述医学检验项目参考区间适宜性评估系统能够对预设的参考区间的适宜性进行评估,对价值医疗具有重要意义。所述医学检验项目参考区间适宜性评估系统提取的数据来自真实世界的检验数据,不需要额外招募受试者进行检测,能够较大程度地降低评估参考区间适宜性的成本。

Description

医学检验项目参考区间适宜性评估系统
技术领域
本申请涉及参考区间评估领域,具体涉及一种医学检验项目参考区间适宜性评估系统。
背景技术
医学实验室中使用的各项检验项目的参考区间主要来源于试剂说明书、卫生行业标准、权威文献或教材等。由于社会经济水平、区域生活环境和饮食习惯等存在着差异,现有的各项检测项目的参考区间可能存在不适用于实验室所服务的人群的情况。当参考区间过宽时会导致延误部分患者的治疗,参考区间过窄时会造成患者的过度检查,浪费医疗资源;因此,对参考区间是否适宜进行定期评估,对价值医疗具有重要意义。
目前,参考区间的适宜性评估:筛选至少20例或60例合格的参考个体,按照标准操作程序进行检测,以得到初步检测结果;检查并剔除初步检测结果中的离群值;剔除离群值后的初步检测结果在预设的参考区间内的参考个体的数量占比≥90%时视为对预设的参考区间的验证通过;对预设的参考区间的验证通过时,认为该预设的参考区间是适宜的。
然而,上述预设参考区间的适宜性评估方法成本较高、过程繁琐、数据量较少,存在参考个体选择偏离,且未结合真实世界的检验大数据,未结合最新的研究文献进展,评估的结果可靠性较差,迫切需要新的快速准确评估参考区间适宜性的评估方案。
发明内容
本申请的一优势在于提供了一种医学检验项目参考区间适宜性评估系统,其中,所述医学检验项目参考区间适宜性评估系统能够对预设的参考区间的适宜性进行评估,对价值医疗具有重要意义。
本申请的一优势在于提供了一种医学检验项目参考区间适宜性评估系统,其中,所述医学检验项目参考区间适宜性评估系统选取的数据来自真实世界的检验数据,不需要额外招募受试者进行检测,能够较大程度地降低评估参考区间适宜性的成本。
本申请的一优势在于提供了一种医学检验项目参考区间适宜性评估系统,其中,所述医学检验项目参考区间适宜性评估系统还能够对文献中的参考区间的适宜性进行评估。
根据本申请的一个方面,提供了一种医学检验项目参考区间适宜性评估系统,其包括:
预设参考区间提取模块,用于从检验项目参考区间数据库提取至少一项检验项目的预设参考区间;
体检数据采集与分析模块,用于获取体检数据的集合,并利用EP28非参法确定所述检验项目的重建参考区间;
检验数据采集模块,用于从实验室信息系统提取预定时间段内所述检验项目的检验数据集;
数据分组模块,用于根据体检、门诊和住院三种就诊类型对所述检验项目的检验数据集进行数据切分以得到第一检验数据子集、第二检验数据子集和第三检验数据子集;
参考区间异常率评估模块,用于分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集相对于所述预设参考区间和所述重建参考区间的上限异常率和下限异常率以得到参考区间异常率评估结果;
适宜性管理模块,用于基于所述参考区间异常率评估结果,生成所述检验项目的适宜性评估结果。
在根据本申请所述的医学检验项目参考区间适宜性评估系统中,所述参考区间异常率评估模块,包括:
预设参考区间异常率评估单元,用于分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集对应的预设参考区间的上限异常率和预设参考区间的下限异常率以得到预设参考区间异常率评估结果;
重建参考区间异常率评估单元,用于分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集对应的重建参考区间的上限异常率和重建参考区间的下限异常率以得到重建参考区间异常率评估结果。
在根据本申请所述的医学检验项目参考区间适宜性评估系统中,所述适宜性管理模块,包括:
一致性评估单元,用于对所述预设参考区间异常率评估结果和所述重建参考区间异常率评估结果进行一致性评估分析以得到一致性评估结果;
适宜性评估结果确定单元,用于基于所述一致性评估结果、所述预设和重建参考区间异常率评估结果,生成所述检验项目的适宜性评估结果。
在根据本申请所述的医学检验项目参考区间适宜性评估系统中,所述一致性评估单元,进一步用于:
计算所述重建参考区间的上限异常率与所述预设参考区间的上限异常率之间的差异度且计算所述重建参考区间的下限异常率与所述预设参考区间的下限异常率之间的差异度以得到第一差异度和第二差异度;
基于所述第一差异度和所述第二差异度与预设阈值之间的比较,生成所述一致性评估结果。
在根据本申请所述的医学检验项目参考区间适宜性评估系统中,所述一致性评估单元,进一步用于:计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集中任意两个检验数据子集的预设参考区间的上限异常率和参考区间下限异常率之间的比值以得到多个异常率比值;基于所述多个异常率比值中各个异常率比值与预设阈值之间的比较,生成所述一致性评估结果。
在根据本申请所述的医学检验项目参考区间适宜性评估系统中,其还包括:异常等级判断标准确定模块,用于基于所述体检数据的集合,确定异常等级判断标准;异常等级计算模块,用于基于所述异常等级标准对所述第二检验数据子集和所述第三检验数据子集进行分析以得到门诊患者检验结果的异常等级分布和住院患者检验结果的异常等级分布。
在根据本申请所述的医学检验项目参考区间适宜性评估系统中,所述异常等级判断标准确定模块,进一步用于:
基于所述体检数据的集合分布双侧大于2.5%或小于97.5%的等级划分条件或者所述体检数据的集合分布单侧小于95%的等级划分条件确定正常等级的上下限;
基于所述体检数据的集合分布双侧大于1.5%小于等于2.5%或大于等于97.5%小于98.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于95%小于97%的等级划分条件确定轻度等级的上下限;
基于所述体检数据的集合分布双侧大于1.0%小于等于1.5%或大于等于98.5%小于99.0%的等级划分条件或者所述体检数据的集合分布单侧大于等于97.0%小于98.0%的等级划分条件确定中度等级的上下限;
基于所述体检数据的集合分布双侧大于0.5%小于等于1.0%或大于等于99.0%小于99.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于98.0%小于99.0%的等级划分条件确定重度等级的上下限;
基于所述体检数据的集合分布双侧小于等于0.5%或大于等于99.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于99.0%的等级划分条件确定极度等级的上下限。
在根据本申请所述的医学检验项目参考区间适宜性评估系统中,其还包括:参考文献采集模块,用于搜索参考文献;参考文献等级评估模块,用于对参考文献进行质量评估以得到参考文献质量等级评估结果;以及,参考文献参考区间管理模块,用于基于大语言模型,从所述参考文献中提取关于所述检验项目的建议参考区间的相关数据并进行管理。
在根据本申请所述的医学检验项目参考区间适宜性评估系统中,所述参考文献参考区间管理模块,进一步用于:
计算所述检验项目的建议参考区间和所述重建参考区间之间的偏倚比;
当所述偏倚比大于预设阈值时,判定所述检验项目的建议参考区间与该项检验项目的重建参考区间之间的一致性不满足预设要求;
当所述偏倚比小于等于预设阈值时,判定所述检验项目的建议参考区间与该项检验项目的重建参考区间之间的一致性满足预设要求。
通过对随后的描述和附图的理解,本申请进一步的目的和优势将得以充分体现。
本申请的这些和其他目的、特点和优势,通过下述的详细说明,附图和权利要求得以充分体现。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件。
图1为根据本申请实施例的医学检验项目参考区间适宜性评估系统的框图。
图2为根据本申请实施例的医学检验项目参考区间适宜性评估系统的EP28非参数法计算的一个界面示意图。
图3图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的预设参考区间的一个界面示意图。
图4图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的预设参考区间的又一个界面示意图。
图5图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统中适应性管理模块的框图。
图6图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的异常率等级计算的一个界面示意图。
图7图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的异常率等级计算的又一个界面示意图。
图8图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的异常等级标准确定的一个界面示意图。
图9图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的异常等级标准确定的又一个界面示意图。
图10图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的参考区间文献列表的一个界面示意图。
图11图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的参考区间文献内容管理的又一个界面示意图。
图12图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的参考区间文献比较的界面示意图。
图13图示了根据本申请实施例的医学检验项目参考区间适宜性评估系统的参考区间文献比较的又一个界面示意图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。“多个”指大于等于两个。
虽然例如,“第一”、“第二”等的序数将用于描述各种组件,但是在这里不限制那些组件。该术语仅用于区分一个组件与另一组件。例如,第一组件可以被称为第二组件,且同样地,第二组件也可以被称为第一组件,而不脱离本申请构思的教导。在此使用的术语“和/或”包括一个或多个关联的列出的项目的任何和全部组合。
在这里使用的术语仅用于描述各种实施例的目的且不意在限制。如在此使用的,单数形式意也包括复数形式,除非上下文清楚地指示例外。另外将理解术语“包括”和/或“具有”当在该说明书中使用时指定所述的特征、数目、操作、组件、元件或其组合的存在,而不排除一个或多个其他特征、数目、操作、组件、元件或其组合的存在或者附加。
如图1至图13所示,根据本申请实施例的医学检验项目参考区间适宜性评估系统被阐明。所述医学检验项目参考区间适宜性评估系统1000能够对预设的参考区间的适宜性进行评估,对价值医疗具有重要意义。所述医学检验项目参考区间适宜性评估系统1000提取的数据来自真实世界的检验数据,不需要额外招募受试者进行检测,能够较大程度地降低评估参考区间适宜性的成本。所述医学检验项目参考区间适宜性评估系统1000还能够对文献中的参考区间的适宜性进行评估。
具体地,如图1所示,所述医学检验项目参考区间适宜性评估系统1000包括预设参考区间提取模块10、体检数据采集与分析模块20、检验数据采集模块30、数据分组模块40、参考区间异常率评估模块50和适宜性管理模块 60,其中,所述预设参考区间提取模块10用于从检验项目参考区间数据库提取至少一项检验项目的预设参考区间;所述体检数据采集与分析模块20用于获取体检数据的集合,并利用EP28非参数法确定所述检验项目的重建参考区间;所述检验数据采集模块30用于从实验室信息系统提取预定时间段内所述检验项目的检验数据集;所述数据分组模块40用于根据体检、门诊和住院三种就诊类型对所述检验项目的检验数据集进行数据切分以得到第一检验数据子集、第二检验数据子集和第三检验数据子集;所述参考区间异常率评估模块50用于分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集相对于所述预设参考区间和所述重建参考区间参考区间上限异常率和下限异常率以得到参考区间异常率评估结果;所述适宜性管理模块60,用于基于所述参考区间异常率评估结果,生成所述检验项目的适宜性评估结果。
具体地,在所述预设参考区间提取模块的运行过程中,即通过所述预设参考区间提取模块10从检验项目参考区间数据库提取至少一项检验项目的预设参考区间。所述至少一项检验项目的预设参考区间包括但不限于血小板计数的预设参考区间、总蛋白的预设参考区间、白蛋白的预设参考区间、谷丙转氨酶的预设参考区间、谷草转氨酶的预设参考区间等。
值得一提的是,各个所述项检验项目的预设参考区间还可以可被划分为多个分组,例如,血小板计数检验项目的预设参考区间包括第一分组的血小板计数检验项目的预设参考区间、第二分组的血小板计数检验项目的预设参考区间、第三分组的血小板计数检验项目的预设参考区间、第四分组的血小板计数检验项目的预设参考区间、第五分组的血小板计数检验项目的预设参考区间、第六分组的血小板计数检验项目的预设参考区间以及更多分组的血小板计数检验项目的预设参考区间。在一个具体示例中,每一分组的预设参考区间与一组检验对象相对应,检验对象是根据年龄和性别进行分组的;例如,第一分组的血小板计数检验项目的预设参考区间为检验对象是女性6月-<1岁分组的血小板计数检验项目的预设参考区间;第二分组的血小板计数检验项目的预设参考区间为检验对象是女性1岁-<2岁分组的血小板计数检验项目的预设参考区间;第三分组的血小板计数检验项目的预设参考区间为检验对象是女性2岁-<6岁分组的血小板计数检验项目的预设参考区间;第四分组的血小板计数检验项目的预设参考区间为检验对象是女性6岁-<12岁分组的血小板计数检验项目的预设参考区间;第五分组的血小板计数检验项目的预设参考区间为检验对象是女性12岁-<18岁分组的血小板计数检验项目的预设参考区间;第六分组的血小板计数检验项目的预设参考区间为检验对象是女性18岁-<53岁分组的血小板计数检验项目的预设参考区间;其他分组的血小板计数检验项目的预设参考区间为对应其他分组的试验对象。还值得一提的是,在其他示例中,可将检验项目参考区间数据库中的数据先按照检验对象进行分组,然后按照检验项目类型进行数据分组。
在所述体检数据采集与分析模块20的运行过程中,其首先获取体检数据的集合,并利用EP28非参数法对所述体检数据的集合进行处理以确定至少一项检验项目的重建参考区间,如图2所示。除EP28非参数法外,还可采用EP28参数法、refineR、TMC、Kosmic等其它适宜的建立参考区间方法。本领域普通技术人员应知晓EP28非参数法包括异常体检数据排除。具体地,所述异常体检数据排除过程包括:删除资料不全的数据、同一个体的多次检测结果只选取最近1次结果、删除阳性(胸部X光、超声、CT等)结果的数据、LAVE法排除(如WBC、Hb、MCV、MCHC、ALT、GGT、BUN、Cr、CEA、AFP、CA19-9等)超出参考区间的数据。在用Tukey法排除阈外值后,剩余的体检数据的集合包括n个检验数据。可将n个检验数据升序排列,升序排列后的n个检验数据可分别用,…,表示,为检验项目数据中的最小值,为检验项目数据中的最大值。将n个检验数据分为100等分,与r%秩次相对应的数即为第r个百分位数,以符号Pr表示。重建参考区间的参考下限值和重建参考区间的参考上限的秩次可以分别用P2.5和P97.5表示,其中,通过以下算式进行计算:。若计算值不是整数,可将它们四舍五入后取整。重建参考区间的下限值的置信区间为P1-P5,重建参考区间的上限的置信区间为P95-P99
相应地,利用EP28非参数法可得到体检类的每一项检验项目的重建参考区间,例如,体检类的血小板计数的重建参考区间、体检类的总蛋白的重建参考区间、体检类的白蛋白检验项目的重建参考区间、体检类的谷丙转氨酶检验项目的重建参考区间、体检类的谷草转氨酶检验项目的重建参考区间等。相应地,所述体检类的每一项检验项目的重建参考区间可被划分为多个分组的该项检验项目的重建参考区间,例如,体检类的血小板计数的重建参考区间包括体检类的第一分组的血小板计数的重建参考区间、体检类的第二分组的血小板计数的重建参考区间、体检类的第三分组的血小板计数的重建参考区间、体检类的第四分组的血小板计数的重建参考区间、体检类的第五分组的血小板计数的重建参考区间、体检类的第六分组的血小板计数的重建参考区间以及体检类的更多分组的血小板计数的重建参考区间。例如,体检类的每一分组的重建参考区间与一组检验对象相对应,检验对象是根据年龄和性别进行分组的;例如,体检类的第一分组的血小板计数的参考区间为检验对象是女性6月-<1岁;体检类的第二分组的血小板计数的参考区间为检验对象是女性1岁-<2岁;体检类的第三分组的血小板计数的参考区间为检验对象是女性2岁-<6岁;体检类的第四分组的血小板计数的参考区间为检验对象是女性6岁-<12岁;体检类的第五分组的血小板计数的参考区间为检验对象是女性12岁-<18岁;体检类的第六分组的血小板计数的参考区间为检验对象是女性18岁-<53岁;体检类的其他分组的血小板计数的参考区间对应其他分组的试验对象。
在所述检验数据采集模块的运行过程中,即通过所述检验数据采集模块30从实验室信息系统提取预定时间段内至少一项检验项目的检验数据集。特别地,相较于现有的参考区间适应性评估流程,从实验室信息系统可提取来自真实世界的检验数据,不需要额外招募受试者进行检测,以较大程度地降低评估参考区间适宜性的成本。
在一个具体实施中,所述检验数据采集模块30首先从实验室信息系统提取预定时间段内的检验数据集,然后将所述预定时间段内的检验数据集先按照检验对象进行数据分组(在一个具体示例中,检验对象是根据年龄和性别进行分组的),如图3和图4所示,接着按照就诊类别进行数据分组,再按照检验项目的类型进行数据分组。
同样地,所述预定时间段内的检验数据集可被切分为多个分组的检验数据子集,例如,第一分组的检验数据子集、第二分组的检验数据子集、第三分组的检验数据子集、第四分组的检验数据子集、第五分组的检验数据子集、第六分组的检验数据子集以及更多分组的检验数据子集。第一分组的检验数据子集为检验对象是女性6月-<1岁;第二分组的检验数据子集为检验对象是女性1岁-<2岁;第三分组的检验数据子集为检验对象是女性2岁-<6岁;第四分组的检验数据子集为检验对象是女性6岁-<12岁;第五分组的检验数据子集为检验对象是女性12岁-<18岁;第六分组的检验数据子集为检验对象是女性18岁-<53;其他分组的检验数据子集为检验对象是其他分组的检验数据子集。
每一分组的检验数据子集包括就诊类型为体检的第一类检验项目子集、就诊类型为门诊的第二类检验项目子集和就诊类型为住院的第三检验项目子集,例如,检验对象是女性12岁-<18岁分组的第一分组的检验数据子集包括一个第一类检验项目子集、一个第二类检验项目子集和一个第三检验项目子集;检验对象是女性18岁-<53岁分组的检验数据子集包括另一第一类检验项目子集、另一第二类检验项目子集和另一第三检验项目子集。
每一分组的检验数据子集中的每一类就诊类型的检验项目子集包括至少一项检验项目的检验数据。相应地,每一分组的检验数据子集的第一类检验项目子集包括至少一项体检类的单项检验项目数据子集;每一分组的检验数据子集的第二类检验项目子集包括至少一项门诊类的单项检验项目数据子集;每一分组的检验数据子集的第三类检验项目子集包括至少一项住院类的单项检验项目数据子集;例如,检验对象是女性18岁-<53岁分组的第一分组的检验数据子集中的就诊类型为体检的第一类检验项目子集包括检验对象是女性18岁-<53岁分组的体检类下的血小板计数检验项目检验数据等。应可以理解,也可将从实验室信息系统提取预定时间段内的检验数据集先按照检验对象的分组进行数据切分,检验对象是根据年龄和性别进行分组的,然后按照检验项目数据进行数据切分,再按照进行就诊类型切分。
相应地,在通过所述数据分组模块40根据体检、门诊和住院三种就诊类型对每一检验项目的检验数据集进行数据切分以得到第一检验数据子集、第二检验数据子集和第三检验数据子集的过程中,每一检验项目的检验数据集中所述第一检验数据子集为该项检验项目的就诊类型为体检的检验数据子集;每一项检验项目的检验数据集中所述第二检验数据子集为该项检验项目的就诊类型为门诊的检验数据子集;每一项检验项目的检验数据集中所述第三检验数据子集为该项检验项目的就诊类型为住院的检验数据子集。
具体地,在所述参考区间异常率评估模块50的运行过程中,即分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集相对于所述预设参考区间和所述重建参考区间参考区间上限异常率和下限异常率以得到参考区间异常率评估结果。为了便于说明,以某一项具体的检验项目为示例来进行示例性说明,例如,血小板计数。
在一个具体示例中,所述参考区间异常率评估模块,包括:预设参考区间异常率评估单元和重建参考区间异常率评估单元,其中,所述预设参考区间异常率评估单元,用于分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集对应的预设参考区间的上限异常率和参考区间下限异常率以得到预设参考区间异常率评估结果;所述重建参考区间异常率评估单元,用于分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集对应的重建参考区间的上限异常率和重建参考区间的下限异常率以得到重建参考区间异常率评估结果。
具体地,所述预设参考区间异常率评估单元进一步用于分别计算所述检验项目的所述第一检验数据子集、第二检验数据子集和第三检验数据子集中超出所述预设参考区间的上限值的检验数据的数量的比例以得到所述第一检验数据子集、第二检验数据子集和第三检验数据子集对应的预设参考区间的上限异常率。这里,所述比例为超出所述预设参考区间的上限值的检验数据的数量的比例除以所述各个检验数据子集的基数。相类似的,所述预设参考区间异常率评估单元进一步用于分别计算所述检验项目的所述第一检验数据子集、第二检验数据子集和第三检验数据子集中低于所述预设参考区间的下限值的检验数据的数量的比例以得到所述第一检验数据子集、第二检验数据子集和第三检验数据子集对应的预设参考区间的下限异常率。
相应地,所述重建参考区间异常率评估单元能够以类似于所述预设参考区间异常率评估单元的运行模式来计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集对应的重建参考区间的上限异常率和重建参考区间的下限异常率,为了文本简洁,在此不做展开。
如图5所示,在本申请实施例中,所述适宜性管理模块 60,包括一致性评估单元61和适宜性评估结果确定单元 62,其中,所述一致性评估单元 61用于对所述预设参考区间异常率评估结果和所述重建参考区间异常率评估结果进行一致性评估分析以得到一致性评估结果;且所述适宜性评估结果确定单元 62,用于基于所述一致性评估结果、所述预设和重建参考区间异常率评估结果,生成所述检验项目的适宜性评估结果。
在本申请实施例中,所述一致性评估单元 61的运行逻辑如下;计算所述重建参考区间的上限异常率与所述预设参考区间的上限异常率之间的差异度且计算所述重建参考区间的下限异常率与所述预设参考区间的下限异常率之间的差异度以得到第一差异度和第二差异度,以及,基于所述第一差异度和所述第二差异度与预设阈值之间的比较,生成所述一致性评估结果。
在一个具体示例中,计算所述计算所述重建参考区间的上限异常率与所述预设参考区间的上限异常率之间的差异度,也就是,将评估的与通过EP28非参数法的参考区间异常率比较,相差大于50%时不适宜,小于50%时可能适宜。
在本申请的另一实施例中,所述一致性评估单元 61的运行逻辑如下;首先计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集中任意两个检验数据子集的预设参考区间的上限异常率和参考区间下限异常率之间的比值以得到多个异常率比值;然后,基于所述多个异常率比值中各个异常率比值与预设阈值之间的比较,生成所述一致性评估结果。具体地,在一个具体示例中,门诊、住院的异常率与体检异常率相差过大或过小时,该参考区间可能不适宜。如门诊异常率高于体检的5倍时或住院异常率高于体检的20倍时,该参考区间可能不适宜。
值得一提的是,在具体实施中,可根据不同项目的特征、人群分布、医院专科特色设立判断范围,对此,并不为本申请所局限。
在一个具体示例中,按参考区间的年龄、性别等设置条件,查询实验室信息系统中2024年10月22日至2024年11月22日的数据,按照体检、门诊、住院三种不同就诊类型分别计算PLT参考区间(男性:83-303 ×109/L,女性:101-320×109/L)上限或下限的异常率,再利用体检数据通过EP28的非参数法重新计算的参考区间(男性:137-354×109/L,女性144-384×109/L)的上限或下限的异常率。
适宜性评估结果,PLT的预设参考区间明显低于EP28非参数法及参考文献中的参考区间,图7所示预设参考区间体检、门诊、住院的上下限异常率分别是15.75%、13.82%、10.56%和0.16%、2.71%、18.27%,异常异常等级分布住院患者极度率占20.51%,PLT的参考区间的适宜性需进一步研究。
如图1所示,在本申请的一个优选实施例中,所述医学检验项目参考区间适宜性评估系统1000还包括异常等级判断标准确定模块70和异常等级计算模块80。所述异常等级判断标准确定模块70用于基于所述体检数据的集合,确定异常等级判断标准。所述异常等级计算模块80用于基于所述异常等级判断标准对所述第二检验数据子集和所述第三检验数据子集进行分析以得到门诊患者检验结果异常等级分布和住院患者检验结果异常等级分布。
在一个具体示例中,所述异常等级判断标准确定模块70基于所述体检数据的集合,确定五个等级(如图6、图7、图8和图9所示)的上下限值,分别为正常、轻度异常、中度异常、重度异常和极度异常五个等级,其中,不属于正常等级的体检数据被认为是异常的体检数据,也就是,异常的体检数据包括轻度异常等级、中度异常等级、重度异常等级和极度异常等级的体检数据。
在该具体示例中,所述,所述异常等级判断标准确定模块,进一步用于:基于所述体检数据的集合分布双侧大于2.5%或小于97.5%的等级划分条件或者所述体检数据的集合分布单侧小于95%的等级划分条件确定正常等级的上下限;基于所述体检数据的集合分布双侧大于1.5%小于等于2.5%或大于等于97.5%小于98.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于95%小于97%的等级划分条件确定轻度等级的上下限;基于所述体检数据的集合分布双侧大于1.0%小于等于1.5%或大于等于98.5%小于99.0%的等级划分条件或者所述体检数据的集合分布单侧大于等于97.0%小于98.0%的等级划分条件确定中度等级的上下限;基于所述体检数据的集合分布双侧大于0.5%小于等于1.0%或大于等于99.0%小于99.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于98.0%小于99.0%的等级划分条件确定重度等级的上下限;以及,基于所述体检数据的集合分布双侧小于等于0.5%或大于等于99.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于99.0%的等级划分条件确定极度等级的上下限。
在该具体示例中,所述异常等级计算模块80的运行逻辑如下:以所述异常等级标准为基准,统计所述第二检验数据子集和所述第三检验数据子集中分别属于正常、轻度异常、中度异常、重度异常和极度异常的检验数据的比例,通过这样的方式,来确定门诊患者检验结果异常等级和住院患者检验结果异常等级。
在一个具体示例中,对于实验室某一时间段某一群检验项目的数据,筛选出就诊类型为体检的数据并基于体检大数据分布计算门诊及住院患者检验结果的异常等级。进而,以体检大数据分布作为异常等级的划分依据。正常,体检数据分布双侧范围是>2.5%或<97.5%,单向范围是<95%。轻度,体检数据分布双侧范围是1.5-2.5%或97.5-98.5%,单向范围是95-97%。中度,体检数据分布双侧范围是1.0-1.5%或98.5-99.0%,单向范围是97.0-98.0%。重度,体检数据分布双侧范围0.5-1.0%或99.0-99.5%,单向范围是98.0-99.0%。极度,体检数据分布双侧范围是≤0.5或≥99.5%,单向范围是≥99.0%。接着,通过循环算法每日定时更新前一天检验结果数量,结果值的累计百分率的计算是通过统计低于该结果值的数量占总数的比例,人群百分率按照0.5、1、1.5、2、2.5、3、4、5、6......95、96、97、97.5、98、98.5、99.5、100分类统计,得到每个体检项目的人群百分率后,即可从中获取用于划分异常等级的百分率对应的结果值。
实际示例如下:某一天血小板计数体检的检验结果为109×109/L共有5个,如果在之前统计的累计百分率中已经存在值109×109/L,则更新项目数量,加上累计数量27个,总共应为32个,结果为109×109/L及以下有104个,累计百分率0.501%。若不存在值109×109/L,则添加该结果值,数量为5个,再计算累计百分率。
值得一提的是,当对多项检验项目的预设参考区间进行适宜性管理时,可采用多线程通过上述医学检验项目参考区间适宜性评估系统1000分别对多项检验项目的预设参考区间的适宜性进行评估。还值得一提的是,在参考区间的适宜性评估的过程中,也可以将异常等级评估结果作为纳入指标来更为全面地评估参考区间的实际适宜性,对此并不为本申请所。
如图1所示,在本申请的该优选实施例中,所述医学检验项目参考区间适宜性评估系统1000还结合参考文献对参考区间进行适宜性管理。值得一提的是,结合参考文献对参考区间进行适宜性管理是可选项。
具体地,如图5所示,所述医学检验项目参考区间适宜性评估系统1000还包括参考文献采集模块 90、参考文献等级评估模块100和参考文献参考区间管理模块110。所述参考文献采集模块 90用于搜索参考文献。所述参考文献等级评估模块100用于对参考文献进行质量评估以得到参考文献质量等级评估结果。所述参考文献参考区间管理模块110用于基于大语言模型,提取所述参考文献中关于至少一项检验项目的建议参考区间的相关数据并进行管理。
相应地,所述医学检验项目参考区间适宜性评估系统1000还通过所述参考文献采集模块 90搜索参考文献,通过所述参考文献等级评估模块100对参考文献进行质量评估以得到参考文献质量等级评估结果,通过所述参考文献参考区间管理模块110基于大语言模型,提取所述参考文献中关于至少一项检验项目的建议参考区间的相关数据并进行管理。
在通过所述参考文献采集模块 90搜索参考文献的过程中,可通过链接链接到在线数据库和图书馆资源,从各大文献数据库中搜索参考文献,例如,中国知网文献数据库、万方数据库、Wiley数据库等;也可新增参考文献(如图11所示)。将关键词(检验项目名称、检测系统、参考区间等)转换为高维特征向量,通过这些向量来捕捉关键词中语义和句法信息,接着计算高维特征向量与每一个语料知识文本块对应的高维特征向量的相似度,检索出最相关的语料知识文本库,并根据相似度结果,将检索结果按照相似度进行排序得到若干初筛文献;进一步地,可根据分区、影响因子、被引次数、发表时间、文献类型对其进行筛选,得到若干目标文献。支持通过文件上传的方式将外部文献导入至文献库中。
也就是,在本申请的一个具体示例中,所述搜索参考文献的过程,包括步骤:
S1:输入参考文献搜索关键词;
S2:对所述参考文献搜索关键词进行语义嵌入编码以得到参考文献搜索关键词语义嵌入编码向量;
S3:从语料知识库提取语料知识文本块的集合;
S4:分别对所述语料知识文本块的集合中的各个语料知识文本块进行语义编码以得到语料知识文本块语义嵌入编码向量的集合;
S5:计算所述参考文献搜索关键词语义嵌入编码向量与所述语料知识文本块语义嵌入编码向量的集合中的各个语料知识文本块语义嵌入编码向量的相似度以得到相似度的集合;
S6:对所述相似度的集合进行排序以得到若干初筛文献。
在一个优选实施例中,为了提高相似度的计算精准度,计算所述参考文献搜索关键词语义嵌入编码向量与所述语料知识文本块语义嵌入编码向量的集合中的各个语料知识文本块语义嵌入编码向量的相似度的过程,包括如下步骤:
S51:对所述参考文献搜索关键词语义嵌入编码向量和所述语料知识文本块语义嵌入编码向量进行语义细粒度交互编码以得到搜索关键词-语料知识文本块双向细粒度语义关联编码向量;
S52:将所述搜索关键词-语料知识文本块双向细粒度语义关联编码向量输入基于解码器的相似度估计模块以得到所述相似度。
在该具体示例中,对所述参考文献搜索关键词语义嵌入编码向量和所述语料知识文本块语义嵌入编码向量进行语义细粒度交互编码,包括:
S511:对所述语料知识文本块语义嵌入编码向量进行主成分分析以得到语料知识文本块主成分特征编码向量的集合;该过程用公式表示为:
其中,表示所述语料知识文本块语义嵌入编码向量,表示向量的转置,表示所述语料知识文本块语义嵌入编码向量的长度,表示协方差矩阵,表示语料知识文本块主成分特征编码向量的集合的集合、分别表示第一个、第二个和第个语料知识文本块主成分特征编码向量,表示语料知识文本块主成分特征编码向量的总数,表示对角矩阵,表示对角线元素,表示对角矩阵的对角线上的第一个、第二个和第个特征值。
应可以理解,通过主成分分析首先将高维度的语料知识文本块语义嵌入编码向量转换成一个低维度但更为紧凑和信息丰富的表示形式——即语料知识文本块主成分特征编码向量的集合。这个过程不仅仅是简单的降维操作,它实际上是对原始数据进行了一次深度的信息提纯。在这个过程中,原本分散在高维度空间中的信息被重新组织并集中在一组有序的主成分轴上。这意味着,少量的头部主成分就能捕捉到数据中的大部分变异信息,而那些冗余或者噪声信息则被自然地过滤掉了。例如,在构建一个文献检索系统时,通过对语料库中每个文本块进行主成分分析,可以有效消除文本内部潜在的多重共线性问题,使得不同文本块之间的差异更加明显,进而提高了检索结果的相关性和精确度。此外,由于减少了特征维度,模型训练的时间成本也会大大降低,同时还能减少过拟合的风险,因为较少的特征意味着模型参数更少,从而降低了模型复杂度。
S512:对所述语料知识文本块主成分特征编码向量的集合中的各个语料知识文本块主成分特征编码向量进行线性变换以得到语料知识文本块主成分线性变换特征编码向量的集合,其中,所述语料知识文本块主成分线性变换特征编码向量的集合中的各个语料知识文本块主成分线性变换特征编码向量与所述参考文献搜索关键词语义嵌入编码向量具有相同的特征尺度;该过程用公式表示为:
其中,表示对进行线性变换,表示语料知识文本块主成分线性变换特征编码向量的集合,表示第一个、第二个和第个语料知识文本块主成分特征编码向量。
应可以理解,通过线性变换,能够调整每个语料知识文本块主成分特征编码向量的尺度,使得它们能够在相同的参考框架下进行比较和交互。这种尺度调整不仅仅是为了让不同模态的数据在数值上更接近,更重要的是为了确保在信息融合过程中,各个模态的数据能够公平地贡献其独特信息,而不是因为尺度差异导致某些模态的信息被过度放大或忽略。
S513:将所述参考文献搜索关键词语义嵌入编码向量和所述语料知识文本块主成分特征编码向量的集合中的各个语料知识文本块主成分特征编码向量进行模态间独立性编码以得到搜索关键词-语料知识文本块主成分模态间独立性编码矩阵的集合;该过程用公式表示为:
其中,表示第个语料知识文本块主成分特征编码向量,为特征映射函数,例如线性映射或非线性核函数,表示所述参考文献搜索关键词语义嵌入编码向量,表示参考文献搜索关键词语义嵌入编码向量的长度,表示第个搜索关键词-语料知识文本块主成分模态间独立性编码矩阵。
应可以理解,通过模态间独立性编码,能够创建一个优化的空间,在这个空间里,搜索关键词和语料库中的每一个文本块都以一种新的、更加精炼的方式被表示出来,即形成了搜索关键词-语料知识文本块主成分模态间独立性编码矩阵的集合。这种编码方式不仅仅是在形式上对两种类型的向量进行了组合,而是基于对它们之间关系的一种深刻理解,强调了两者在表达内容上的差异性和独特贡献。具体来说,当将搜索关键词与大量的语料知识文本块进行对比时,直接融合这些向量可能会导致一些问题,比如某些高维度特征可能在不同模态间存在高度相关性,这会导致信息重复并增加模型的复杂度。而通过模态间独立性编码,我们可以识别出那些真正具有独立性的特征,从而更有效地利用这些特征来增强模型的表现。这种方式鼓励模型去关注那些在不同模态间提供独特信息的部分,而不是简单地叠加所有可用的信息。通过模态间独立性编码,系统可以更好地识别哪些文档不仅包含与查询词直接相关的术语,还包含了能够补充和扩展查询词含义的独特信息。这种方法有助于提升检索结果的相关性,使得最终呈现给用户的文献不仅是表面上匹配的,更是深层次意义上与查询意图紧密相连的高质量资源。此外,这种编码策略还有助于平衡不同模态的重要性,确保没有哪个模态由于其内在特性(如尺度大小)而在最终决策中占据主导地位。这样一来,无论是搜索关键词还是语料库中的文本块,都能在其应有的范围内发挥最大作用,共同为用户提供更加精准和有价值的检索结果。
S514:基于所述搜索关键词-语料知识文本块主成分模态间独立性编码矩阵的集合,计算搜索关键词-语料知识文本块主成分模态间独立性软约束因子的集合;该过程用公式表示为:
其中,表示矩阵的F范数的平方,表示第个搜索关键词-语料知识文本块主成分模态间独立性软约束因子。
应可以理解,计算搜索关键词和每个语料知识文本块之间的模态间独立性软约束因子。这一过程实质上是创建了一种动态调整机制,它允许模型根据输入数据的具体情况自适应地权衡各模态的重要性。具体而言,软约束因子提供了一种柔性的方式,使得模型能够在强调模态间独立性的同时,也考虑到它们之间不可避免的相关性。这种灵活性对于处理真实世界中的复杂数据至关重要,因为实际的数据往往包含了既相互补充又存在某种程度重叠的信息。此外,软约束因子的动态性质意味着它可以随着输入的变化而调整自身的行为。如果某一特定查询词与某些类型的文献特别相关,软约束因子能够自动适应这种情况,确保那些最为相关的文献被优先考虑。这样一来,无论是在处理高度专业化的查询还是广泛的主题搜索时,系统都能够保持较高的准确性和相关性。
S515:将所述参考文献搜索关键词语义嵌入编码向量和所述语料知识文本块主成分特征编码向量的集合中的各个语料知识文本块主成分特征编码向量输入特征交互响应单元以得到搜索关键词-语料知识文本块主成分模态间细粒度响应交互编码向量的集合;该过程用公式表示为:
其中,表示按位置点乘,表示按位置向量,表示按位置相除,表示级联函数,表示第个权重矩阵,表示第个偏置向量,表示第个搜索关键词-语料知识文本块主成分模态间细粒度响应交互编码向量。
应可以理解,将这些向量输入到特征交互响应单元时,系统开始进行细粒度的特征交互。这不仅仅是简单的向量加法或点积运算,而是深入挖掘不同模态特征之间的复杂关系和潜在模式。具体来说,特征交互响应单元会探索搜索关键词与每个文本块之间的多层次关联,包括但不限于语义上的相似性、主题上的重叠以及上下文中的微妙联系。这种细粒度的交互不仅仅停留在表面层次,它还会深入到特征维度层面,挖掘非线性关系和层级结构。这意味着,系统能够捕捉到文献中更深层次的信息。最终,通过这一过程生成的搜索关键词-语料知识文本块主成分模态间细粒度响应交互编码向量集合,提供了一个更加全面且精细的表示形式。这些编码向量不仅反映了查询词与文献之间的直接匹配程度,还揭示了两者之间更为复杂的相互作用和补充关系。
S516:基于所述搜索关键词-语料知识文本块主成分模态间独立性软约束因子的集合,对所述搜索关键词-语料知识文本块主成分模态间细粒度响应交互编码向量的集合进行动态自适应聚合以得到所述交互响应编码向量;该过程用公式表示为:
其中,表示归一化指数函数,表示交互响应编码向量。
应可以理解,利用之前计算出的搜索关键词-语料知识文本块主成分模态间独立性软约束因子集合,系统开始对搜索关键词-语料知识文本块主成分模态间细粒度响应交互编码向量的进行动态自适应聚合。这一过程的核心在于根据软约束因子动态调整各细粒度响应的贡献权重,从而有选择性地融合最相关的特征信息。这种动态调整机制使得系统能够灵活应对不同输入数据的特点。例如,当某个查询词与特定类型的文献特别相关时,系统会自动增加该类文献在最终聚合结果中的权重。反之,如果某些文献虽然包含了部分查询词的相关信息,但整体上与查询意图偏离较大,则它们的权重会被相应降低。这确保了最终生成的交互响应编码向量不仅包含了查询词与文献之间的直接匹配信息,还反映了两者之间更为复杂的互补关系。此外,动态自适应聚合过程还能有效减少冗余信息的影响。由于软约束因子强调了模态间的独立性和互补性,系统倾向于保留那些提供独特视角和信息的部分,而抑制重复或无关的信息。这样一来,最终得到的交互响应编码向量不仅更加紧凑和精炼,还具有更高的区分度和表达力。
在通过所述参考文献等级评估模块100对参考文献进行质量评估以得到参考文献质量等级评估结果的过程中,可采用文献内容提取和翻译技术对文献的目标内容进行提取和/或翻译。可通过光学字符识别(OCR)技术扫描PDF文档将其转换为可编辑的文本。对于外文文献可通过借助深度学习模型使用编码器-解码器架构进行翻译,其中编码器将源语言文本转换为一种向量序列的中间文本,而解码器则是将这种中间文本翻译生成目标文本,同时模型通过注意力机制对语义理解更加准确进而生成与目标语言表达习惯更加相符的翻译结果。大语言模型通过大量医学文献的语料库训练,针对医学领域的专业优化增强了对医学术语的理解与翻译能力。利用大语言模型自动检索文献并提取其中参考区间相关数据,避免了手工查找文献以及人工查找文献中的内容,为研究人员节省了时间和精力。
进一步地,可利用页面布局检测模型确定文本的阅读顺序,使用清理和格式化算法对文本块进行处理,例如,摘要句功能分类、章节功能识别、引文功能识别等,即对一种或多种类型的知识单元进行属性或关系的判别,接着采用组合和后处理算法提高文本质量,最后通过PDF解析库中的自然语言处理(NLP)技术和机器学习提取出文献中的结构化信息,如:检测年份、区域、人群种族、检测仪器、检测方法、建立参考区间方法、参考区间以及置信区间等,提取这些字段后自动录入至系统中形成文献库进行管理。另外,由于医学文献中包含一些非结构化的信息,包括纳入标准、排除标准等,需要将这些信息提取并整理成结构化信息便于比较分析。
通过机器学习的分类模型将研究同一类检验项目的参考区间的文献归为一类,利用图神经网络分析文献引用网络和学术社交网络加强对文献之间关系和影响力的理解,使用预训练语言模型进行更深入的文本理解和分析,提高文献质量评估的准确性,如表1所示。
为了对文献质量进行更准确的评估,可以对照文献质量评价标准检查表将不同文献评为A、B、C、D四个等级,总体A级是指一篇文献所有的质量评价标准均达到了A级;B级是指在质量评价标准中达到的最低等级为B级;C级则是指在质量评价标准中达到的最低等级为C级;D级则是指在质量评价标准中达到的最低等级为D级。其中D等级说明该文献中评估的参考区间不应用于临床实践。
表 1 参考区间文献质量评价检查表
可针对参考文献质量等级较高的文献进行后续的数据处理。在通过所述参考文献参考区间管理模块110基于大语言模型,提取所述参考文献中关于至少一项检验项目的建议参考区间的相关数据并进行管理的过程中,在文献库中,可浏览文献名称、文献质量、影响因子、发表日期、期刊、作者、文献全文、摘要、引文等;可对项目名称、单位、民族、仪器(如图11所示)、试剂、检验方法、区域、参考区间建立方法、阈外值、纳入排除标准,以及,按照性别和年龄分组的参考区间等进行管理;另外,可关联文献库,文献与项目之间存在一对多的关系,按照相同项目名称归为一类;可将不同文献中的同一检验项目的建议参考区间通过生成图片的形式展示。可通过从实验室信息系统中导入数据分别分析在不同就诊类型(体检、门诊、住院)的真实世界数据中参考区间的异常率和异常等级,即,分析所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集对应的重建参考区间的异常率和异常等级,并以图片展示。
在一个具体示例中,通过所述参考文献参考区间管理模块110基于大语言模型,提取所述参考文献中关于至少一项检验项目的建议参考区间的相关数据并进行管理的过程,包括:评估检验项目与基于参考文献的建议参考期间的一致性。其运行逻辑如下:
通过计算参考文献的参考区间与检验项目的参考区间的偏倚比,自动评估参考区间的质量从而判断参考区间是否适宜并进行可视化展示。
其中LL0、UL0和Me0表示的是检验项目参考区间下限、上限和中位数,LL、UL和Me则是表示文献中参考区间的下限和上限和中位数。当BRLL或BRUL大于0.375则说明偏倚比较大,检验项目的参考区间与文献中的参考区间一致性较差,反之则说明偏倚比较小,检验项目的参考区间与文献中的参考区间一致性较好。以图形方式可视化显示参考文献比较结果,如图12、图13所示,图形左边显示参考文献列表,包括作者(英文)、年份、性别、年龄及妊娠周期等,将偏倚比大于0.375的参考区间以红色展示。BR Me 仅做参考,不设一致性判断标准。
依据文献参考区间研究的区域及种族、检测仪器及方法、建立参考区间方法、人群分组及样本量等资料,结合实验室的检验项目现况,某检验项目可选择或估算(中位数或众数)的建议参考区间的上、下限。
也就是,其技术逻辑抽象概括如下:根据以下公式计算每一项检验项目的每一类检验数据子集对应的每一分组的预设参考区间的上限值与该项检验项目的该类检验数据子集对应的该分组的建议参考区间的上限值之间的偏倚比:
其中,SD RI 表示基准值;UL 0表示基于一项检验项目的一类检验数据子集对应的一分组的建议参考区间的上限值;LL 0表示基于一项检验项目的一类检验数据子集对应的一分组的建议参考区间的下限值;BR UL 表示一项检验项目的一类检验数据子集对应的一分组的预设参考区间的上限值相对于该项检验项目的该类检验数据子集对应的该分组的建议参考区间的上限偏倚比;UL表示一项检验项目的一类检验数据子集对应的一分组的预设参考区间的上限值;
根据以下公式计算每一项检验项目的预设参考区间的下限值与该项检验项目的建议参考区间的下限值之间的偏倚比:
其中,BR LL 表示一项检验项目的一类检验数据子集对应的一分组的预设参考区间的下限值相对于该项检验项目的该类检验数据子集对应的该分组的建议参考区间的下限值的偏倚比;LL表示一项检验项目的一类检验数据子集对应的一分组的预设参考区间的下限值;BR Me 表示一项检验项目的一类检验数据子集对应的一分组的预设参考区间的中位数相对于该项检验项目的该类检验数据子集对应的该分组的建议参考区间的中位数的偏倚比;Me表示一项检验项目的一类检验数据子集对应的一分组的预设参考区间的中位数。
在一个具体示例中,所述预设阈值等于0.375,当大于0.375,则判定所述一致性评估结果为该项检验项目的建议参考区间与该项检验项目的重建参考区间之间的一致性不满足预设要求;当小于等于0.375,则判定所述一致性评估结果为该项检验项目的建议参考区间与该项检验项目的重建参考区间之间的一致性满足预设要求。BR Me 仅做参考,不设一致性判断标准。
综上,根据本申请实施例的医学检验项目参考区间适宜性评估系统1000被阐明。所述医学检验项目参考区间适宜性评估系统1000根据性别和年龄对检验数据做了分组,并建立了不同性别的各个年龄段相对应的参考区间,能够在一定程度上提高参考区间的准确性。所述医学检验项目参考区间适宜性评估系统1000中受试者对象检验数据的集合来自真实患者的真实病历资料,这样,一方面,数据来源可靠,另一方面,不需要为了进行参数区间实验专门招募受试者对象进行检测,能够在一定程度上提高可行性,降低成本。
以上对本申请及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本申请的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本申请创造宗旨的情况下,不经创造性地设计出与该技术方案相似的结构方式及实施例,均应属于本申请的保护范围。

Claims (9)

1.一种医学检验项目参考区间适宜性评估系统,其特征在于,包括:
预设参考区间提取模块,用于从检验项目参考区间数据库提取至少一项检验项目的预设参考区间;
体检数据采集与分析模块,用于获取体检数据的集合,并利用EP28非参数法对所述体检数据的集合进行处理以确定所述检验项目的重建参考区间;
检验数据采集模块,用于从实验室信息系统提取预定时间段内所述检验项目的检验数据集;
数据分组模块,用于根据体检、门诊和住院三种就诊类型对所述检验项目的检验数据集进行数据切分以得到第一检验数据子集、第二检验数据子集和第三检验数据子集;
参考区间异常率评估模块,用于计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集相对于预设参考区间的上限异常率和下限异常率,以得到预设参考区间异常率评估结果;计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集相对于重建参考区间的上限异常率和下限异常率,以得到重建参考区间异常率评估结果;
适宜性管理模块,用于对预设参考区间异常率评估结果和重建参考区间异常率评估结果进行一致性评估分析以得到一致性评估结果。
2.根据权利要求1所述的医学检验项目参考区间适宜性评估系统,其特征在于,所述参考区间异常率评估模块,包括:
预设参考区间异常率评估单元,用于分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集对应的预设参考区间的上限异常率和预设参考区间的下限异常率以得到预设参考区间异常率评估结果;
重建参考区间异常率评估单元,用于分别计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集对应的重建参考区间的上限异常率和重建参考区间的下限异常率以得到重建参考区间异常率评估结果。
3.根据权利要求2所述的医学检验项目参考区间适宜性评估系统,其特征在于,所述适宜性管理模块,包括:
一致性评估单元,用于对所述预设参考区间异常率评估结果和所述重建参考区间异常率评估结果进行一致性评估分析以得到一致性评估结果;
适宜性评估结果确定单元,用于基于所述一致性评估结果、所述预设参考区间异常率评估结果和所述重建参考区间异常率评估结果,生成所述检验项目的适宜性评估结果。
4.根据权利要求3所述的医学检验项目参考区间适宜性评估系统,其特征在于,所述一致性评估单元,进一步用于:
计算所述重建参考区间的上限异常率与所述预设参考区间的上限异常率之间的差异度且计算所述重建参考区间的下限异常率与所述预设参考区间的下限异常率之间的差异度以得到第一差异度和第二差异度;
基于所述第一差异度和所述第二差异度与预设阈值之间的比较,生成所述一致性评估结果。
5.根据权利要求3所述的医学检验项目参考区间适宜性评估系统,其特征在于,所述一致性评估单元,进一步用于:
计算所述第一检验数据子集、所述第二检验数据子集和所述第三检验数据子集中任意两个检验数据子集的预设参考区间的上限异常率或预设参考区间的下限异常率之间的比值以得到多个异常率比值;
基于所述多个异常率比值中各个异常率比值与预设阈值之间的比较,生成所述一致性评估结果。
6.如权利要求1所述的医学检验项目参考区间适宜性评估系统,其特征在于,还包括:
异常等级判断标准确定模块,用于基于所述体检数据的集合,确定异常等级判断标准;
异常等级计算模块,用于基于所述异常等级标准对所述第二检验数据子集和所述第三检验数据子集进行分析以得到门诊患者检验结果的异常等级分布和住院患者检验结果的异常等级分布。
7.根据权利要求6所述的医学检验项目参考区间适宜性评估系统,其特征在于,所述异常等级判断标准确定模块,进一步用于:
基于所述体检数据的集合分布双侧大于2.5%或小于97.5%的等级划分条件或者所述体检数据的集合分布单侧小于95%的等级划分条件确定正常等级的上下限;
基于所述体检数据的集合分布双侧大于1.5%小于等于2.5%或大于等于97.5%小于98.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于95%小于97%的等级划分条件确定轻度等级的上下限;
基于所述体检数据的集合分布双侧大于1.0%小于等于1.5%或大于等于98.5%小于99.0%的等级划分条件或者所述体检数据的集合分布单侧大于等于97.0%小于98.0%的等级划分条件确定中度等级的上下限;
基于所述体检数据的集合分布双侧大于0.5%小于等于1.0%或大于等于99.0%小于99.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于98.0%小于99.0%的等级划分条件确定重度等级的上下限;
基于所述体检数据的集合分布双侧小于等于0.5%或大于等于99.5%的等级划分条件或者所述体检数据的集合分布单侧大于等于99.0%的等级划分条件确定极度等级的上下限。
8.根据权利要求1所述的医学检验项目参考区间适宜性评估系统,其特征在于,还包括:
参考文献采集模块,用于搜索参考文献;
参考文献等级评估模块,用于对所述参考文献进行质量评估以得到参考文献质量等级评估结果;
参考文献参考区间管理模块,用于基于大语言模型,从所述参考文献中提取关于所述检验项目的建议参考区间的相关数据并进行管理。
9.根据权利要求8所述的医学检验项目参考区间适宜性评估系统,其特征在于,所述参考文献参考区间管理模块,进一步用于:
计算所述检验项目的建议参考区间和所述重建参考区间之间的偏倚比;
当所述偏倚比大于预设阈值时,判定所述检验项目的建议参考区间与该项检验项目的重建参考区间之间的一致性不满足预设要求;
当所述偏倚比小于等于预设阈值时,判定所述检验项目的建议参考区间与该项检验项目的重建参考区间之间的一致性满足预设要求。
CN202510348983.6A 2025-03-24 2025-03-24 医学检验项目参考区间适宜性评估系统 Active CN119889552B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202510348983.6A CN119889552B (zh) 2025-03-24 2025-03-24 医学检验项目参考区间适宜性评估系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202510348983.6A CN119889552B (zh) 2025-03-24 2025-03-24 医学检验项目参考区间适宜性评估系统

Publications (2)

Publication Number Publication Date
CN119889552A CN119889552A (zh) 2025-04-25
CN119889552B true CN119889552B (zh) 2025-05-27

Family

ID=95441963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202510348983.6A Active CN119889552B (zh) 2025-03-24 2025-03-24 医学检验项目参考区间适宜性评估系统

Country Status (1)

Country Link
CN (1) CN119889552B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114010173A (zh) * 2021-11-01 2022-02-08 暨南大学附属第一医院(广州华侨医院) 基于神经网络的非瓣膜性房颤心源性卒中评估系统和方法
CN116580800A (zh) * 2023-04-14 2023-08-11 太原金域临床检验所有限公司 一种参考区间构建方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4408720B2 (ja) * 2003-03-03 2010-02-03 富士フイルム株式会社 放射線撮影システムの検査方法及びそれを用いた医用画像処理装置
KR101546421B1 (ko) * 2015-02-16 2015-08-24 에스티엑스엔진 주식회사 적응 cfar 처리방법
CN116825339A (zh) * 2023-01-09 2023-09-29 中国医科大学附属第一医院 检验参考区间研究智能管理平台
CN118565560B (zh) * 2024-07-02 2024-12-24 广东汇锦科技有限公司 一种漆包线损伤的检测方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114010173A (zh) * 2021-11-01 2022-02-08 暨南大学附属第一医院(广州华侨医院) 基于神经网络的非瓣膜性房颤心源性卒中评估系统和方法
CN116580800A (zh) * 2023-04-14 2023-08-11 太原金域临床检验所有限公司 一种参考区间构建方法及装置

Also Published As

Publication number Publication date
CN119889552A (zh) 2025-04-25

Similar Documents

Publication Publication Date Title
US20250190497A1 (en) System and method for automated file reporting
Pezoulas et al. Medical data quality assessment: On the development of an automated framework for medical data curation
CN120687597B (zh) 基于生成式人工智能的科技文献智能检索方法及相关设备
EP3734604A1 (en) Method and system for supporting medical decision making
US8494987B2 (en) Semantic relationship extraction, text categorization and hypothesis generation
CN111373392B (zh) 文献分类装置
Zhang et al. VetTag: improving automated veterinary diagnosis coding via large-scale language modeling
EP4068121B1 (en) Method and apparatus for acquiring character, page processing method, method for constructing knowledge graph, and medium
Hase Automated content analysis
CN118297360B (zh) 一种胸痛中心建设智能匹配的方法
CN120951975B (zh) 基于知识检索增强的标准文档编写方法及系统
US20210209095A1 (en) Apparatus and Method for Combining Free-Text and Extracted Numerical Data for Predictive Modeling with Explanations
US20200293528A1 (en) Systems and methods for automatically generating structured output documents based on structural rules
CN113779179A (zh) 一种基于深度学习和知识图谱的icd智能编码的方法
Arumugham et al. An explainable deep learning model for prediction of early‐stage chronic kidney disease
CN112183104B (zh) 编码推荐方法、系统及相应设备和存储介质
CN118394944A (zh) 基于深度学习的主题建模与情感分析方法及系统
CN117556118A (zh) 基于科研大数据预测的可视化推荐系统及方法
KR20240110453A (ko) 비정형 데이터 내 개인정보 탐지 장치, 시스템, 방법 및 기록매체
CN120579548A (zh) 基于深度学习大模型的病历信息提取与分析方法、系统
CN118352015A (zh) 一种医学检验报告单综合理解与生成方法及装置
Agterberg et al. Cluster analysis application to identify groups of individuals with high health expenditures
CN119889552B (zh) 医学检验项目参考区间适宜性评估系统
CN119380163A (zh) 基于评论-上下文双协同掩码Transformer模型的假新闻检测方法
US20260011415A1 (en) System and method for automated file reporting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant