CN114446467B - 一种基于结构化报告模板的肺功能定量分析方法 - Google Patents

一种基于结构化报告模板的肺功能定量分析方法 Download PDF

Info

Publication number
CN114446467B
CN114446467B CN202111671240.0A CN202111671240A CN114446467B CN 114446467 B CN114446467 B CN 114446467B CN 202111671240 A CN202111671240 A CN 202111671240A CN 114446467 B CN114446467 B CN 114446467B
Authority
CN
China
Prior art keywords
analysis
main body
time sequence
lung function
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111671240.0A
Other languages
English (en)
Other versions
CN114446467A (zh
Inventor
杨帆
郑传胜
范文亮
聂壮
喻杰
张兰
孙文刚
金倩娜
吴绯红
陈乐庆
杨金荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji Medical College of Huazhong University of Science and Technology
Original Assignee
Tongji Medical College of Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji Medical College of Huazhong University of Science and Technology filed Critical Tongji Medical College of Huazhong University of Science and Technology
Priority to CN202111671240.0A priority Critical patent/CN114446467B/zh
Publication of CN114446467A publication Critical patent/CN114446467A/zh
Application granted granted Critical
Publication of CN114446467B publication Critical patent/CN114446467B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明公开了一种基于结构化报告模板的肺功能定量分析方法,包括以下步骤:步骤S1、在肺功能检测病例大数据中获取所述病例使用的多种结构化报告模板,并将在结构化报告模板中使用生理指标数据定量描述的多个器官组织进行第一主成分分析得到表征病例肺功能状态的主要影响元素的器官组织以作为中心分析主体;步骤S2、在目标对象的历史结构化报告中提取出使用生理指标数据定量描述的多个器官组织,以及依次将每个器官组织在历史结构化报告中的生理指标数据按历史结构化报告的时序链接构成多组器官组织的生理指标时序数据。本发明实现融合医学专家经验和医生个人经验对目标对象的肺功能波动趋势特征进行分析来提高分析准确度。

Description

一种基于结构化报告模板的肺功能定量分析方法
技术领域
本发明涉及医学报告分析技术领域,具体涉及一种基于结构化报告模板的肺功能定量分析方法。
背景技术
结构化报告相较于传统报告则在内容上进行了结构化的规范,传统报告多为根据医生个人习惯书写,内容逻辑复杂,用词多样,难以有效提取报告中的价值信息,便无法进行信息化的管理与利用。不仅浪费了大量宝贵的病历信息,还容易造成报告编写的疏漏与错误。当大数据、人工智能的时代来临时,结构化的病历信息则是最基础的数据。因此结构化报告的普及与应用已经迫在眉睫。
现有技术中通常基于结构化报告中的定量数据值来分析出肺功能波动趋势,虽然现有技术能够一定程度上实现肺功能波动趋势的分析,但是结构化报告中都是统一化的病理指标数据,不能更深程度的挖掘病理特征以提高分析准确度,灵活性差。
发明内容
本发明的目的在于提供一种基于结构化报告模板的肺功能定量分析方法,以解决现有技术中结构化报告中都是统一化的病理指标数据,不能更深程度的挖掘病理特征以提高分析准确度,灵活性差的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种基于结构化报告模板的肺功能定量分析方法,包括以下步骤:
步骤S1、在肺功能检测病例大数据中获取所述病例使用的多种结构化报告模板,并将在结构化报告模板中使用生理指标数据定量描述的多个器官组织进行第一主成分分析得到表征病例肺功能状态的主要影响元素的器官组织以作为中心分析主体,所述中心分析主体用于表征由医学专家经验得到的评价所述肺功能状态的器官组织;
步骤S2、在目标对象的历史结构化报告中提取出使用生理指标数据定量描述的多个器官组织,以及依次将每个器官组织在历史结构化报告中的生理指标数据按历史结构化报告的时序链接构成多组器官组织的生理指标时序数据,再基于生理指标时序数据对所述器官组织进行第二主成分分析得到表征目标对象肺功能状态的主要影响元素的器官组织,在表征目标对象肺功能状态的主要影响元素的器官组织中将所有不属于所述中心分析主体的器官组织作为边缘分析主体,所述边缘分析主体用于表征由医生个人经验得到的评价所述肺功能状态的器官组织;
步骤S3、基于第二主成分分析的分析结果确定出目标对象的器官组织中的中心分析主体和边缘分析主体的主体权重,并基于所述主体权重对所述中心分析主体和边缘分析主体对应的生理指标时序数据进行融合得到一组表征肺功能波动趋势特征的肺功能波动分析时序数据,以实现融合医学专家经验和医生个人经验对目标对象的肺功能波动趋势特征进行分析来提高分析准确度;
步骤S4、对所述肺功能波动分析时序数据进行时序波动分析,以得到目标对象肺功能的波动趋势特征。
作为本发明的一种优选方案,所述将在结构化报告模板中使用生理指标数据定量描述的多个器官组织进行第一主成分分析得到表征病例肺功能状态的主要影响元素的器官组织以作为中心分析主体,包括:
依次提取出每个器官组织在所有结构化报告模板中生理指标数据,并将每个器官组织的所有生理指标数据构成对应器官组织的第一特征向量;
将每个所述器官组织的第一特征向量依次进行均值化处理,对均值化处理后的第一特征向量进行协方差矩阵构建,以及对协方差矩阵进行特征值求解;
设定第一特征阈值,将每个器官组织对应的特征值与第一特征阈值比较,其中,
当器官组织对应的特征值大于或等于第一特征阈值,则将器官组织作为中心分析主体;
当器官组织对应的特征值小于第一特征阈值,则将器官组织不作为中心分析主体;
优选的,第一特征阈值的设定方法包括:
步骤一:获取器官组织中最大特征值和最小特征值,分别标记为Smax和Smin,设定初始的第一特征阈值为:
步骤二:根据第一特征阈值将器官组织分割为两组器官组织,其中,器官组织对应的特征值大于或等于第一特征阈值/>作为一组,器官组织对应的特征值小于第一特征阈值/>作为另一组,并分别求出两组器官组织的平均特征值So和Sb,以及更新第一特征阈值/>得到新第一特征阈值/>
步骤三:将新第一特征阈值与第一特征阈值/>比较,其中,
,则/>为第一特征阈值;
,则将/>赋值给/>,返回步骤二。
作为本发明的一种优选方案,在进行第一主成分分析前将病例的所述器官组织的语义名称进行归一化处理,以消除同一器官组织不同语义名称的量纲误差,所述将所述器官组织的语义名称进行归一化处理,包括:
将组织器官的术语设置为标准名称,并将器官组织的语义名称依次与所有表征名称计算语义相似度;
设定语义相似阈值,将语义相似度高于语义相似阈值的所有标准名称均选取出,并由人工在选取出的标准名称中标定出器官组织对应的正确标准名称以调整语义相似度的计算公式来实现将最高语义相似度与正确标准名称对应;
优选的,语义相似度的计算方法包括:
选取语义相似度算法,所述语义相似度算法包括:Jaccard系数算法,余弦相似度算法,LCS算法,距离相似度算法;
为所有语义相似度算法设定算法权重,并基于算法权重对所有语义相似度算法进行加权计算得到所述语义相似度的计算公式,所述语义相似度计算公式为:
式中,表征为第j个器官组织的语义名称与第k个标准名称的语义相似度,/>表征为第i个语义相似度算法的算法权重,/>表征为第i个语义相似度算法的计算第j个器官组织的语义名称与第k个标准名称的语义相似度的公式,i,j,k均为计量常数,无实质含义。
作为本发明的一种优选方案,所述基于生理指标时序数据对所述器官组织进行第二主成分分析得到表征目标对象肺功能状态的主要影响元素的器官组织,包括:
将每个器官组织的所有生理指标时序数据按时序构成对应器官组织的第二特征向量;
将每个所述器官组织的第二特征向量依次进行均值化处理,对均值化处理后的第二特征向量进行协方差矩阵构建,以及对协方差矩阵进行特征值求解;
设定第二特征阈值,将每个器官组织对应的特征值与第二特征阈值比较,其中,
当器官组织对应的特征值大于或等于第二特征阈值,则将器官组织作为表征目标对象肺功能状态的主要影响元素的器官组织;
当器官组织对应的特征值小于特征阈值,则将器官组织不作为表征目标对象肺功能状态的主要影响元素的器官组织。
作为本发明的一种优选方案,所述基于第二主成分分析的分析结果确定出目标对象的器官组织中的中心分析主体和边缘分析主体的主体权重,包括:
将每个所述中心分析主体的初始主体权重均设定为,R表征为中心分析主体的总数目,将每个所述边缘分析主体的初始主体权重均设定为/>,L表征为边缘分析主体的主体权重;
将所述中心分析主体和边缘分析主体的特征值进行归一化处理得到,设定第三特征阈值,并将中心分析主体和边缘分析主体归一化处理后的特征值与所述第三特征阈值比较,其中,
当中心分析主体归一化处理后的特征值大于或等于第三特征阈值,则将中心分析主体的主体权重更新为:
当中心分析主体归一化处理后的特征值小于第三特征阈值,则将中心分析主体的主体权重更新为:
当边缘分析主体归一化处理后的特征值大于或等于第三特征阈值,则将中心分析主体的主体权重更新为:
当中心分析主体归一化处理后的特征值小于第三特征阈值,则将中心分析主体的主体权重更新为:
式中,、/>分别表征为第H个中心分析主体、第h个边缘分析主体的主体权重,/>分别表征为第H个中心分析主体、第h个边缘分析主体归一化处理后的特征值;
优选的,第H个中心分析主体、第h个边缘分析主体归一化处理后的特征值的计算公式为:
式中,、/>分别表征为第H个中心分析主体、第h个边缘分析主体在第二主成分分析的分析结果中的特征值,/>、/>分别表征为中心分析主体、边缘分析主体的总数目,H、h为计量常数,无实质含义。
作为本发明的一种优选方案,所述基于所述主体权重对所述中心分析主体和边缘分析主体对应的生理指标时序数据进行融合得到一组表征肺功能波动趋势特征的肺功能波动分析时序数据,包括:
将所述中心分析主体和边缘分析主体对应的生理指标时序数据按主体权重进行加权融合得到所述肺功能波动分析时序数据,所述肺功能波动分析时序数据的构建公式为:
式中,表征为肺功能波动分析时序数据中第/>个时序的数据,/>表征为第h个边缘分析主体的生理指标时序数据中第t个时序的数据,/>表征为第H个中心分析主体的生理指标时序数据中第t个时序的数据,t表征为时序计量常数,无实质含义。
作为本发明的一种优选方案,所述对所述肺功能波动分析时序数据进行时序波动分析,包括:
在肺功能波动分析时序数据中依次计算相邻时序处的数据增长率,所述数据增长率的计算公式为:
式中,表征为肺功能波动分析时序数据中第t个和第t+1个时序处的数据增长率,/>、/>分别表征为肺功能波动分析时序数据中第t+1个、第t个时序处的数据,表征为第t+1个和第t个时序的时差;
将肺功能波动分析时序数据中的所有数据增长率进行方差作为肺功能波动分析时序数据的特征值的衡量指标,所述特征值的计算公式为:
式中,表征为所述特征值,m表征为肺功能波动分析时序数据中时序总数目。
作为本发明的一种优选方案,所述对所述肺功能波动分析时序数据进行时序波动分析前,还包括:
计算肺功能波动分析时序数据中相邻时序处的数据相似度,并将相似度高的数据进行删除以实现将肺功能波动分析时序数据中冗余数据进行去除;
所述数据相似度的计算公式为:
式中,表征为肺功能波动分析时序数据中第t个和第t+1个时序处的数据增长率;
高于或等于相似度阈值,则在肺功能波动分析时序数据中将/>进行剔除;
低于相似度阈值,则在肺功能波动分析时序数据中将/>、/>均予以保留。
作为本发明的一种优选方案,所述第二特征阈值的设定方法与第一特征阈值的设定方法一致。
作为本发明的一种优选方案,所述在进行第二主成分分析前将目标对象的所述器官组织的语义名称进行归一化处理,以消除同一器官组织不同语义名称的量纲误差,在进行第二主成分分析前所述目标对象的所述器官组织的语义名称的归一化处理方法与在进行第一主成分分析前目标对象的所述器官组织的语义名称的归一化处理方法一致。
本发明与现有技术相比较具有如下有益效果:
本发明通过病例的结构化报告中提取出中心分析主体,以及在目标对象的历史结构化报告中提取出边缘分析主体,再基于中心分析主体和边缘分析主体的主体权重对所述中心分析主体和边缘分析主体对应的生理指标时序数据进行融合得到一组表征肺功能波动趋势特征的肺功能波动分析时序数据,以实现融合医学专家经验和医生个人经验对目标对象的肺功能波动趋势特征进行分析来提高分析准确度。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的肺功能定量分析方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,结构化报告在构建时通常采用都是大多数医生均会关注(即专家经验)的器官组织,并记录这些器官组织的生理指标数据用于分析器官组织生理状况,这是一种对大多数医生的个人经验进行总结的结果,即形成专家经验,但是却忽略了目标对象的个体化差异,目标对象可能存在需要加以关注但并不属于报告模板中常用型的器官组织,因此若不将此类器官组织的生理指标数据考虑到分析数据范围内可能会导致医生对目标对象的疾病发展趋势出现误判,专家经验会出现用来分析疾病发展趋势的器官组织的中心化问题,变成只关注由专家经验总结出的常用型器官组织,而忽略其他的器官组织,因此,本发明提供了一种基于结构化报告模板的肺功能定量分析方法,可以有效的对专家经验进行去中心化处理,在专家经验中添加医生的个人经验,实现在对目标对象进行标准性诊治的同时添加灵活性,更为全面的分析目标对象的肺功能波动趋势,提高分析精度。
本发明提供了一种基于结构化报告模板的肺功能定量分析方法,包括以下步骤:
步骤S1、在肺功能检测病例大数据中获取病例使用的多种结构化报告模板,并将在结构化报告模板中使用生理指标数据定量描述的多个器官组织进行第一主成分分析得到表征病例肺功能状态的主要影响元素的器官组织以作为中心分析主体,中心分析主体用于表征由医学专家经验得到的评价肺功能状态的器官组织;
将在结构化报告模板中使用生理指标数据定量描述的多个器官组织进行第一主成分分析得到表征病例肺功能状态的主要影响元素的器官组织以作为中心分析主体,包括:
依次提取出每个器官组织在所有结构化报告模板中生理指标数据,并将每个器官组织的所有生理指标数据构成对应器官组织的第一特征向量;
将每个器官组织的第一特征向量依次进行均值化处理,对均值化处理后的第一特征向量进行协方差矩阵构建,以及对协方差矩阵进行特征值求解;
设定第一特征阈值,将每个器官组织对应的特征值与第一特征阈值比较,其中,
当器官组织对应的特征值大于或等于第一特征阈值,则将器官组织作为中心分析主体;
当器官组织对应的特征值小于第一特征阈值,则将器官组织不作为中心分析主体;
优选的,第一特征阈值的设定方法包括:
步骤一:获取器官组织中最大特征值和最小特征值,分别标记为Smax和Smin,设定初始的第一特征阈值为:
步骤二:根据第一特征阈值将器官组织分割为两组器官组织,其中,器官组织对应的特征值大于或等于第一特征阈值/>作为一组,器官组织对应的特征值小于第一特征阈值/>作为另一组,并分别求出两组器官组织的平均特征值So和Sb,以及更新第一特征阈值/>得到新第一特征阈值/>
步骤三:将新第一特征阈值与第一特征阈值/>比较,其中,
,则/>为第一特征阈值;
,则将/>赋值给/>,返回步骤二。
实现对结构化报告中关注度高的器官组织进行提取,即完成专家经验的总结,以得到对于该种病症需要予以关注的器官组织,比如,对于肺炎病症病例大数据的结构化报告,通过专家经验的提取,即对各种器官组织的生理指标数据进行主成分分析计算,得到第一特征阈值的器官组织分别为左上叶、右上叶、左下叶、右下叶、左肺、右肺、左胸腔和右胸腔,因此将左上叶、右上叶、左下叶、右下叶、左肺、右肺、左胸腔和右胸腔作为中心分析实体。
在进行第一主成分分析前将病例的器官组织的语义名称进行归一化处理,以消除同一器官组织不同语义名称的量纲误差,将器官组织的语义名称进行归一化处理,包括:
将组织器官的术语设置为标准名称,并将器官组织的语义名称依次与所有表征名称计算语义相似度;
设定语义相似阈值,将语义相似度高于语义相似阈值的所有标准名称均选取出,并由人工在选取出的标准名称中标定出器官组织对应的正确标准名称以调整语义相似度的计算公式来实现将最高语义相似度与正确标准名称对应;
优选的,语义相似度的计算方法包括:
选取语义相似度算法,语义相似度算法包括:Jaccard系数算法,余弦相似度算法,LCS算法,距离相似度算法;
为所有语义相似度算法设定算法权重,并基于算法权重对所有语义相似度算法进行加权计算得到语义相似度的计算公式,语义相似度计算公式为:
式中,表征为第j个器官组织的语义名称与第k个标准名称的语义相似度,/>表征为第i个语义相似度算法的算法权重,/>表征为第i个语义相似度算法的计算第j个器官组织的语义名称与第k个标准名称的语义相似度的公式,i,j,k均为计量常数,无实质含义。本实施例提高使用Jaccard系数算法,余弦相似度算法,LCS算法,距离相似度算法进行加权组合为一种精度更高的语义相似度算法,能够更精准的在医生不规范用语情况下匹配到器官组织的专业术语,避免语义量纲间的误差。
步骤S2、在目标对象的历史结构化报告中提取出使用生理指标数据定量描述的多个器官组织,以及依次将每个器官组织在历史结构化报告中的生理指标数据按历史结构化报告的时序链接构成多组器官组织的生理指标时序数据,再基于生理指标时序数据对器官组织进行第二主成分分析得到表征目标对象肺功能状态的主要影响元素的器官组织,在表征目标对象肺功能状态的主要影响元素的器官组织中将所有不属于中心分析主体的器官组织作为边缘分析主体,边缘分析主体用于表征由医生个人经验得到的评价肺功能状态的器官组织;
基于生理指标时序数据对器官组织进行第二主成分分析得到表征目标对象肺功能状态的主要影响元素的器官组织,包括:
将每个器官组织的所有生理指标时序数据按时序构成对应器官组织的第二特征向量;
将每个器官组织的第二特征向量依次进行均值化处理,对均值化处理后的第二特征向量进行协方差矩阵构建,以及对协方差矩阵进行特征值求解;
设定第二特征阈值,将每个器官组织对应的特征值与第二特征阈值比较,其中,
当器官组织对应的特征值大于或等于第二特征阈值,则将器官组织作为表征目标对象肺功能状态的主要影响元素的器官组织;
当器官组织对应的特征值小于特征阈值,则将器官组织不作为表征目标对象肺功能状态的主要影响元素的器官组织。
第二特征阈值的设定方法与第一特征阈值的设定方法一致。
在进行第二主成分分析前将目标对象的器官组织的语义名称进行归一化处理,以消除同一器官组织不同语义名称的量纲误差,在进行第二主成分分析前目标对象的所述器官组织的语义名称的归一化处理方法与在进行第一主成分分析前目标对象的器官组织的语义名称的归一化处理方法一致。
目标对象的主诊医生对目标对象依据自身个人经验进行结构化报告的书写,从而获得主诊医生感兴趣的器官组织,即主诊医生认为对分析目标对象肺功能波动趋势有助益的器官组织的生理指标时序数据,比如,左上叶、右上叶、左下叶、右下叶、左胸腔、右胸腔、气管、支气管和胸膜的生理指标时序数据进行主成分分析,并得到对应的器官组织包括:左上叶、右上叶、左下叶、右下叶、左胸腔、右胸腔、气管、支气管和胸膜,其中左上叶、右上叶、左下叶、右下叶、左胸腔、右胸腔属于中心分析主体,属于专家经验部分,气管、支气管和胸膜属于边缘分析主体,属于主诊医生的个人经验部分。
基于第二主成分分析的分析结果确定出目标对象的器官组织中的中心分析主体和边缘分析主体的主体权重,包括:
将每个中心分析主体的初始主体权重均设定为,/>表征为中心分析主体的总数目,将每个边缘分析主体的初始主体权重均设定为/>,/>表征为边缘分析主体的主体权重;
将中心分析主体和边缘分析主体的特征值进行归一化处理得到,设定第三特征阈值,并将中心分析主体和边缘分析主体归一化处理后的特征值与第三特征阈值比较,其中,
当中心分析主体归一化处理后的特征值大于或等于第三特征阈值,则将中心分析主体的主体权重更新为:
当中心分析主体归一化处理后的特征值小于第三特征阈值,则将中心分析主体的主体权重更新为:
当边缘分析主体归一化处理后的特征值大于或等于第三特征阈值,则将中心分析主体的主体权重更新为:
当中心分析主体归一化处理后的特征值小于第三特征阈值,则将中心分析主体的主体权重更新为:
式中,、/>分别表征为第/>个中心分析主体、第h个边缘分析主体的主体权重,、/>分别表征为第/>个中心分析主体、第h个边缘分析主体归一化处理后的特征值;
优选的,第个中心分析主体、第h个边缘分析主体归一化处理后的特征值的计算公式为:
式中,、/>分别表征为第/>个中心分析主体、第h个边缘分析主体在第二主成分分析的分析结果中的特征值,/>、/>分别表征为中心分析主体、边缘分析主体的总数目,/>为计量常数,无实质含义。
为了去除属于专家经验的中心分析主体的中心化问题,本实施例判定出中心分析主体和边缘分析主体的主体权重的更新增减方向,以实现对特征值低的中心分析主体,特征值低表示为该中心分析主体对于目标对象的肺功能波动趋势分析影响程度较低,不值得被关注,因此该中心分析主体的主体权重需要进行相应的减小,而特征值高的中心分析主体,特征值高表示为该中心分析主体对于目标对象的肺功能波动趋势分析影响程度较高,值得被关注,因此该中心分析主体的主体权重维持在初始主体权重上,同样的,对特征值低的边缘分析主体,特征值低表示为该边缘分析主体对于目标对象的肺功能波动趋势分析影响程度较低,不值得被关注,因此该边缘分析主体的主体权重维持在初始的主体权重,而特征值高的边缘分析主体,特征值高表示为该边缘分析主体对于目标对象的肺功能波动趋势分析影响程度较高,值得被关注,因此该边缘分析主体的主体权重进行相应的增加,从而实现将中心分析主体的主体权重转移至边缘分析主体的主体权重上,实现去中心化的目的。
步骤S3、基于第二主成分分析的分析结果确定出目标对象的器官组织中的中心分析主体和边缘分析主体的主体权重,并基于主体权重对中心分析主体和边缘分析主体对应的生理指标时序数据进行融合得到一组表征肺功能波动趋势特征的肺功能波动分析时序数据,以实现融合医学专家经验和医生个人经验对目标对象的肺功能波动趋势特征进行分析来提高分析准确度;
基于主体权重对中心分析主体和边缘分析主体对应的生理指标时序数据进行融合得到一组表征肺功能波动趋势特征的肺功能波动分析时序数据,包括:
将中心分析主体和边缘分析主体对应的生理指标时序数据按主体权重进行加权融合得到肺功能波动分析时序数据,肺功能波动分析时序数据的构建公式为:
式中,表征为肺功能波动分析时序数据中第t个时序的数据,/>表征为第h个边缘分析主体的生理指标时序数据中第t个时序的数据,/>表征为第H个中心分析主体的生理指标时序数据中第t个时序的数据,t表征为时序计量常数,无实质含义。主体权重高的中心分析主体和边缘分析主体对应的器官组织的生理指标时序数据在构建为肺功能波动分析时序数据时,加入了更高的信息量,更占据分析的主导地位,而主体权重低的中心分析主体和边缘分析主体对应的器官组织的生理指标时序数据在构建为肺功能波动分析时序数据时,加入了更少的信息量,更不占据主导地位,因此利用主体权重进行去中心化处理后,能够更均衡的兼顾专家经验和医生个人经验。
步骤S4、对肺功能波动分析时序数据进行时序波动分析,以得到目标对象肺功能的波动趋势特征。
对肺功能波动分析时序数据进行时序波动分析,包括:
在肺功能波动分析时序数据中依次计算相邻时序处的数据增长率,数据增长率的计算公式为:
式中,表征为肺功能波动分析时序数据中第t个和第t+1个时序处的数据增长率,/>、/>分别表征为肺功能波动分析时序数据中第t+1个、第t个时序处的数据,表征为第t+1个和第t个时序的时差;
将肺功能波动分析时序数据中的所有数据增长率进行方差作为肺功能波动分析时序数据的特征值的衡量指标,特征值的计算公式为:;式中,/>表征为特征值,m表征为肺功能波动分析时序数据中时序总数目。
对肺功能波动分析时序数据进行时序波动分析前,还包括:
计算肺功能波动分析时序数据中相邻时序处的数据相似度,并将相似度高的数据进行删除以实现将肺功能波动分析时序数据中冗余数据进行去除,压缩数据量,而后提高分析效率;
数据相似度的计算公式为:
式中,表征为肺功能波动分析时序数据中第t个和第t+1个时序处的数据增长率;
高于或等于相似度阈值,则在肺功能波动分析时序数据中将/>进行剔除;
低于相似度阈值,则在肺功能波动分析时序数据中将/>、/>均予以保留。/>
本发明通过病例的结构化报告中提取出中心分析主体,以及在目标对象的历史结构化报告中提取出边缘分析主体,再基于中心分析主体和边缘分析主体的主体权重对中心分析主体和边缘分析主体对应的生理指标时序数据进行融合得到一组表征肺功能波动趋势特征的肺功能波动分析时序数据,以实现融合医学专家经验和医生个人经验对目标对象的肺功能波动趋势特征进行分析来提高分析准确度。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (4)

1.一种基于结构化报告模板的肺功能定量分析方法,其特征在于,包括以下步骤:
步骤S1、在肺功能检测病例大数据中获取所述病例使用的多种结构化报告模板,并将在结构化报告模板中使用生理指标数据定量描述的多个器官组织进行第一主成分分析得到表征病例肺功能状态的主要影响元素的器官组织以作为中心分析主体,所述中心分析主体用于表征由医学专家经验得到的评价所述肺功能状态的器官组织;
步骤S2、在目标对象的历史结构化报告中提取出使用生理指标数据定量描述的多个器官组织,以及依次将每个器官组织在历史结构化报告中的生理指标数据按历史结构化报告的时序链接构成多组器官组织的生理指标时序数据,再基于生理指标时序数据对所述器官组织进行第二主成分分析得到表征目标对象肺功能状态的主要影响元素的器官组织,在表征目标对象肺功能状态的主要影响元素的器官组织中将所有不属于所述中心分析主体的器官组织作为边缘分析主体,所述边缘分析主体用于表征由医生个人经验得到的评价所述肺功能状态的器官组织;
步骤S3、基于第二主成分分析的分析结果确定出目标对象的器官组织中的中心分析主体和边缘分析主体的主体权重,并基于所述主体权重对所述中心分析主体和边缘分析主体对应的生理指标时序数据进行融合得到一组表征肺功能波动趋势特征的肺功能波动分析时序数据,以实现融合医学专家经验和医生个人经验对目标对象的肺功能波动趋势特征进行分析来提高分析准确度;
步骤S4、对所述肺功能波动分析时序数据进行时序波动分析,以得到目标对象肺功能的波动趋势特征;
将在结构化报告模板中使用生理指标数据定量描述的多个器官组织进行第一主成分分析得到表征病例肺功能状态的主要影响元素的器官组织以作为中心分析主体,包括:
依次提取出每个器官组织在所有结构化报告模板中生理指标数据,并将每个器官组织的所有生理指标数据构成对应器官组织的第一特征向量;
将每个器官组织的第一特征向量依次进行均值化处理,对均值化处理后的第一特征向量进行协方差矩阵构建,以及对协方差矩阵进行特征值求解;
设定第一特征阈值,将每个器官组织对应的特征值与第一特征阈值比较,其中,
当器官组织对应的特征值大于或等于第一特征阈值,则将器官组织作为中心分析主体;
当器官组织对应的特征值小于第一特征阈值,则将器官组织不作为中心分析主体;
第一特征阈值的设定方法包括:
步骤一:获取器官组织中最大特征值和最小特征值,分别标记为Smax和Smin,设定初始的第一特征阈值为:
步骤二:根据第一特征阈值将器官组织分割为两组器官组织,其中,器官组织对应的特征值大于或等于第一特征阈值/>作为一组,器官组织对应的特征值小于第一特征阈值作为另一组,并分别求出两组器官组织的平均特征值So和Sb,以及更新第一特征阈值/>得到新第一特征阈值/>
步骤三:将新第一特征阈值与第一特征阈值/>比较,其中,当/>,则/>为第一特征阈值;
,则将/>赋值给/>,返回步骤二;
基于生理指标时序数据对器官组织进行第二主成分分析得到表征目标对象肺功能状态的主要影响元素的器官组织,包括:
将每个器官组织的所有生理指标时序数据按时序构成对应器官组织的第二特征向量;
将每个器官组织的第二特征向量依次进行均值化处理,对均值化处理后的第二特征向量进行协方差矩阵构建,以及对协方差矩阵进行特征值求解;
设定第二特征阈值,将每个器官组织对应的特征值与第二特征阈值比较,其中,
当器官组织对应的特征值大于或等于第二特征阈值,则将器官组织作为表征目标对象肺功能状态的主要影响元素的器官组织;
当器官组织对应的特征值小于特征阈值,则将器官组织不作为表征目标对象肺功能状态的主要影响元素的器官组织;
第二特征阈值的设定方法与第一特征阈值的设定方法一致;
基于主体权重对中心分析主体和边缘分析主体对应的生理指标时序数据进行融合得到一组表征肺功能波动趋势特征的肺功能波动分析时序数据,包括:
将中心分析主体和边缘分析主体对应的生理指标时序数据按主体权重进行加权融合得到肺功能波动分析时序数据,肺功能波动分析时序数据的构建公式为:
式中,表征为肺功能波动分析时序数据中第t个时序的数据,/>表征为第h个边缘分析主体的生理指标时序数据中第t个时序的数据,/>表征为第H个中心分析主体的生理指标时序数据中第t个时序的数据,t表征为时序计量常数,无实质含义;
对肺功能波动分析时序数据进行时序波动分析,包括:
在肺功能波动分析时序数据中依次计算相邻时序处的数据增长率,数据增长率的计算公式为:
式中,表征为肺功能波动分析时序数据中第t个和第t+1个时序处的数据增长率,、/>分别表征为肺功能波动分析时序数据中第t+1个、第t个时序处的数据,/>表征为第t+1个和第t个时序的时差;将肺功能波动分析时序数据中的所有数据增长率进行方差作为肺功能波动分析时序数据的特征值的衡量指标,特征值的计算公式为:;式中,/>表征为特征值,m表征为肺功能波动分析时序数据中时序总数目;
所述基于第二主成分分析的分析结果确定出目标对象的器官组织中的中心分析主体和边缘分析主体的主体权重,包括:
将每个所述中心分析主体的初始主体权重均设定为,/>表征为中心分析主体的总数目,将每个所述边缘分析主体的初始主体权重均设定为/>,L表征为边缘分析主体的主体权重;
将所述中心分析主体和边缘分析主体的特征值进行归一化处理得到,设定第三特征阈值,并将中心分析主体和边缘分析主体归一化处理后的特征值与所述第三特征阈值比较,其中,
当中心分析主体归一化处理后的特征值大于或等于第三特征阈值,则将中心分析主体的主体权重更新为:
当中心分析主体归一化处理后的特征值小于第三特征阈值,则将中心分析主体的主体权重更新为:
当边缘分析主体归一化处理后的特征值大于或等于第三特征阈值,则将中心分析主体的主体权重更新为:
当中心分析主体归一化处理后的特征值小于第三特征阈值,则将中心分析主体的主体权重更新为:
式中,、/>分别表征为第H个中心分析主体、第h个边缘分析主体的主体权重,/>、/>分别表征为第H个中心分析主体、第h个边缘分析主体归一化处理后的特征值;
第H个中心分析主体、第h个边缘分析主体归一化处理后的特征值的计算公式为:;/>
式中,、/>分别表征为第H个中心分析主体、第h个边缘分析主体在第二主成分分析的分析结果中的特征值,/>、/>分别表征为中心分析主体、边缘分析主体的总数目,H、h为计量常数,无实质含义。
2.根据权利要求1所述的一种基于结构化报告模板的肺功能定量分析方法,其特征在于:在进行第一主成分分析前将病例的所述器官组织的语义名称进行归一化处理,以消除同一器官组织不同语义名称的量纲误差,所述将所述器官组织的语义名称进行归一化处理,包括:
将组织器官的术语设置为标准名称,并将器官组织的语义名称依次与所有表征名称计算语义相似度;
设定语义相似阈值,将语义相似度高于语义相似阈值的所有标准名称均选取出,并由人工在选取出的标准名称中标定出器官组织对应的正确标准名称以调整语义相似度的计算公式来实现将最高语义相似度与正确标准名称对应;
语义相似度的计算方法包括:
选取语义相似度算法,所述语义相似度算法包括:Jaccard系数算法,余弦相似度算法,LCS算法,距离相似度算法;
为所有语义相似度算法设定算法权重,并基于算法权重对所有语义相似度算法进行加权计算得到所述语义相似度的计算公式,所述语义相似度计算公式为:
式中,表征为第j个器官组织的语义名称与第k个标准名称的语义相似度,/>表征为第i个语义相似度算法的算法权重,/>表征为第i个语义相似度算法的计算第j个器官组织的语义名称与第k个标准名称的语义相似度的公式,i,j,k均为计量常数,无实质含义。
3.根据权利要求2所述的一种基于结构化报告模板的肺功能定量分析方法,其特征在于,所述对所述肺功能波动分析时序数据进行时序波动分析前,还包括:
计算肺功能波动分析时序数据中相邻时序处的数据相似度,并将相似度高的数据进行删除以实现将肺功能波动分析时序数据中冗余数据进行去除;
所述数据相似度的计算公式为:
式中,表征为肺功能波动分析时序数据中第t个和第t+1个时序处的数据增长率;当/>高于或等于相似度阈值,则在肺功能波动分析时序数据中将/>进行剔除;当/>低于相似度阈值,则在肺功能波动分析时序数据中将/>、/>均予以保留。
4.根据权利要求3所述的一种基于结构化报告模板的肺功能定量分析方法,其特征在于,所述在进行第二主成分分析前将目标对象的所述器官组织的语义名称进行归一化处理,以消除同一器官组织不同语义名称的量纲误差,在进行第二主成分分析前所述目标对象的所述器官组织的语义名称的归一化处理方法与在进行第一主成分分析前目标对象的所述器官组织的语义名称的归一化处理方法一致。
CN202111671240.0A 2021-12-31 2021-12-31 一种基于结构化报告模板的肺功能定量分析方法 Active CN114446467B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111671240.0A CN114446467B (zh) 2021-12-31 2021-12-31 一种基于结构化报告模板的肺功能定量分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111671240.0A CN114446467B (zh) 2021-12-31 2021-12-31 一种基于结构化报告模板的肺功能定量分析方法

Publications (2)

Publication Number Publication Date
CN114446467A CN114446467A (zh) 2022-05-06
CN114446467B true CN114446467B (zh) 2023-09-12

Family

ID=81365841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111671240.0A Active CN114446467B (zh) 2021-12-31 2021-12-31 一种基于结构化报告模板的肺功能定量分析方法

Country Status (1)

Country Link
CN (1) CN114446467B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463786A (zh) * 2017-08-17 2017-12-12 王卫鹏 基于结构化报告模板的医学影像知识库建立方法
CN109036502A (zh) * 2018-07-11 2018-12-18 董云鹏 一种体检报告健康管理方法及系统
CN109409416A (zh) * 2018-09-29 2019-03-01 上海联影智能医疗科技有限公司 特征向量降维方法和医学图像识别方法、装置及存储介质
CN111341408A (zh) * 2020-03-26 2020-06-26 联影智能医疗科技(北京)有限公司 影像报告模板的生成方法、计算机设备和存储介质
CN112712879A (zh) * 2021-01-18 2021-04-27 腾讯科技(深圳)有限公司 医学影像报告的信息提取方法、装置、设备及存储介质
CN112786162A (zh) * 2020-12-28 2021-05-11 北京赛迈特锐医疗科技有限公司 基于子模板语义学联系设计结构化报告模板的系统及方法
CN113707308A (zh) * 2021-08-31 2021-11-26 平安国际智慧城市科技股份有限公司 一种医疗数据的分析装置及计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100145720A1 (en) * 2008-12-05 2010-06-10 Bruce Reiner Method of extracting real-time structured data and performing data analysis and decision support in medical reporting
JP5945860B2 (ja) * 2011-08-08 2016-07-05 国立大学法人名古屋大学 医用レポート作成支援システム及び医用レポート作成支援プログラム
EP3511941A1 (en) * 2018-01-12 2019-07-17 Siemens Healthcare GmbH Method and system for evaluating medical examination results of a patient, computer program and electronically readable storage medium

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463786A (zh) * 2017-08-17 2017-12-12 王卫鹏 基于结构化报告模板的医学影像知识库建立方法
CN109036502A (zh) * 2018-07-11 2018-12-18 董云鹏 一种体检报告健康管理方法及系统
CN109409416A (zh) * 2018-09-29 2019-03-01 上海联影智能医疗科技有限公司 特征向量降维方法和医学图像识别方法、装置及存储介质
CN111341408A (zh) * 2020-03-26 2020-06-26 联影智能医疗科技(北京)有限公司 影像报告模板的生成方法、计算机设备和存储介质
CN112786162A (zh) * 2020-12-28 2021-05-11 北京赛迈特锐医疗科技有限公司 基于子模板语义学联系设计结构化报告模板的系统及方法
CN112712879A (zh) * 2021-01-18 2021-04-27 腾讯科技(深圳)有限公司 医学影像报告的信息提取方法、装置、设备及存储介质
CN113707308A (zh) * 2021-08-31 2021-11-26 平安国际智慧城市科技股份有限公司 一种医疗数据的分析装置及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于依存句法分析的超声检查报告结构化处理方法;田驰远;《中国优秀硕士学位论文全文数据库 信息科技辑》(第5期);第28页第1段至第35页最后1段 *

Also Published As

Publication number Publication date
CN114446467A (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN110680326B (zh) 基于深度卷积神经网络的尘肺病鉴别及分级判定方法
CN108763590B (zh) 一种基于双变加权核fcm算法的数据聚类方法
CN111430025B (zh) 一种基于医疗影像数据扩增的疾病诊断模型训练方法
CN103996193B (zh) 结合加权邻域信息与偏移场恢复的脑mr图像分割方法
Ma et al. A new classifier fusion method based on historical and on-line classification reliability for recognizing common CT imaging signs of lung diseases
CN111882538A (zh) 一种区分肺结核与肿瘤信息的处理系统及信息处理方法
CN111738997A (zh) 一种基于深度学习的计算新冠肺炎病变区域占比的方法
CN111191786A (zh) 一种基于主动学习的迁移学习算法
CN116523320A (zh) 基于互联网大数据的知识产权风险智能分析方法
CN113889192A (zh) 一种基于深层降噪自编码器的单细胞RNA-seq数据聚类方法
CN111524600A (zh) 基于neighbor2vec的肝癌术后复发风险预测系统
CN111986814A (zh) 一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法
CN114446467B (zh) 一种基于结构化报告模板的肺功能定量分析方法
Lu et al. Data enhancement and deep learning for bone age assessment using the standards of skeletal maturity of hand and wrist for chinese
CN117195027A (zh) 基于成员选择的簇加权聚类集成方法
CN116228759B (zh) 肾细胞癌类型的计算机辅助诊断系统及设备
CN113722306B (zh) 基于实体相似度的医疗数据修复方法、装置及计算机设备
AU2021102593A4 (en) A Method for Detection of a Disease
CN110020428B (zh) 一种基于半马尔可夫的联合识别和规范化中医症状名的方法
CN114141360A (zh) 基于惩罚cox回归的乳腺癌预测方法
Guogang et al. Primary liver cancer early screening based on gradient boosting decision tree and support vector machine
CN110033862B (zh) 一种基于加权有向图的中医量化诊断系统及存储介质
Rocha et al. Towards automatic clustering analysis using traces of information gain: the infoguide method
Theissen et al. Learning cellular phenotypes through supervision
Wang et al. Semisupervised Bacterial Heuristic Feature Selection Algorithm for High‐Dimensional Classification with Missing Labels

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant