CN115588476A

CN115588476A - 医疗数据处理方法、数据处理装置和电子设备

Info

Publication number: CN115588476A
Application number: CN202110756299.3A
Authority: CN
Inventors: 高力; 张路; 高文琪; 俞富裕; 陆晓筱
Original assignee: Hangzhou Meitong Technology Co ltd; Zhejiang University ZJU
Current assignee: Hangzhou Meitong Technology Co ltd; Zhejiang University ZJU
Priority date: 2021-07-05
Filing date: 2021-07-05
Publication date: 2023-01-10

Abstract

本申请涉及一种医疗数据处理方法、数据处理装置和电子设备。该医疗数据处理方法包括：获取与患者相关的检验报告；对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息；对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息；以及，对代码化后的源信息进行关联性分析，以获得关联性分析结果。通过这样的方式，基于特定领域的专业知识以特定数据处理流程对检验报告进行处理，以实现对检验报告的高效解读，以辅助医生做临床决策‑处置。

Description

医疗数据处理方法、数据处理装置和电子设备

技术领域

本发明总体地涉及数据处理领域，特别是涉及医疗数据处理方法、数据处理装置和电子设备。

背景技术

检验报告(包括检查报告和化验报告)的解读是临床诊疗过程中的一个基础环节。在诊疗过程中，医生主要通过看检验报告来了解与患者相关的疾病诊疗信息。因此，能否正确地了解检验报告中所蕴含的疾病相关信息，将直接关乎其对病情掌握的全面性和准确度，进而影响到随后的医疗决策-处置的合理性。然而，在实务中该项工作却远非理想，甚至经常出错。

比如，在时间极为有限的门诊场所，门诊医生依靠翻看患者所携带的纸质检验报告或通过医院信息平台调看电子检验报告。然而，一方面，要求患者携带纸质检验报告，粗心的患者往往会在不经意间少拿或者漏拿某张检验报告；同时，纸质检验报告的保存对于患者而言是额外的麻烦；另一方面，通过医院信息平台门诊医生只能一张张地调取、一张张地查看电子检验报告，效率低下。上述两种方式，都非常耗时费力。

并且，由于与疾病相关的信息散布于各个检查报告中，即使门诊医生浏览完了所有相关的检验报告，其也难以对内容涵义建立全面透彻地理解。在没有全面透彻理解检验报告内涵的前提下，也不可能留下高质量的分析结果和处置记录。这也是检验报告解读高度依赖于拥有丰富临床诊疗经验的医生的本质原因。然而，具有丰富临床诊疗经验的医生属于优质稀缺资源，并且，依赖于人工解读终究效率低下且在一定程度上容易出错。

因此，对于一种优化的用于检验报告解读的医疗数据处理方案的需求是存在的。

发明内容

本申请的主要目的在于提供一种医疗数据处理方法、数据处理装置和电子设备，其基于特定领域的专业知识以特定数据处理流程对获取的与患者所患疾病相关的检验报告进行处理，以从所述检验报告中获取与患者所患疾病相关的源信息，进而将源信息进行代码化处理，并对代码化后的源信息进行关联性分析，以获得关联性分析结果。通过这样的方式，实现对检验报告的高效解读，以辅助医生做临床决策-处置。

本申请的另一目的在于提供一种医疗数据处理方法、数据处理装置和电子设备，其中，对获取的检验报告进行数据处理的流程基于检验报告解读领域的专业知识结合信息处理一般规则进行设置。具体地，在本申请中，以从检验报告中提取源信息作为主线，对数据处理流程进行配置，以实现对检验报告的自动化解读。

本申请的另一目的在于提供一种医疗数据处理方法、处理装置和电子设备，其中，对获取的检验报告的数据处理流程基于解读报告时医生分析思辨的逻辑过程而设定，符合医生报告解读的作业习惯。

本申请的另一目的在于提供一种医疗数据处理方法、处理装置和电子设备，其中，在数据处理过程中以“四联窗口”的方式呈现报告解读结果，即符合疾病相关信息分析的一般规律，也便于信息处理高效能要求的编程实现。

本申请的另一目的在于提供一种医疗数据处理方法、处理装置和电子设备，其中，在源信息提取过程中，对源信息进行标准化处理以将源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以有效地克服检验报告中文字描述不规范和无统一格式对检验报告解读造成的不良影响。

本申请的另一目的在于提供一种医疗数据处理方法、处理装置和电子设备，其中，所述医疗处理处理方法能够有效地克服因检验报告中医学信息自身不确定所带来的不良影响。

通过下面的描述，本申请的其它优势和特征将会变得显而易见，并可以通过权利要求书中特别指出的手段和组合得到实现。

为实现上述至少一目的或优势，本申请提供一种医疗数据处理方法，其包括：

获取与患者相关的检验报告；

对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息，其中，提取源信息的过程，包括：基于所述检验报告中的检查项目、所见结果和诊断结果对所述检验报告中的内容进行归类；以及，对归类后的所述检验报告中的内容进行疾病相关性分析，以从归类后的所述检验报告中提取出与所述患者所患疾病相关的源信息；

对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息；以及

对代码化后的源信息进行关联性分析，以获得关联性分析结果。

在本申请一实施例中，在上述医疗数据处理方法中，提取源信息的过程，还包括：将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息。

在本申请一实施例中，在上述医疗数据处理方法中，将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息，包括：基于针对相同医学含义的标准描述与其他形式的描述所构建的词典，对经疾病相关性分析所获得的所述源信息进行处理，以将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

在本申请一实施例中，在上述医疗数据处理方法中，将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息，包括：基于语义分析模型，识别出所述源信息中具有相同医学含义但不同描述形式的内容；以及，将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

在本申请一实施例中，在上述医疗数据处理方法中，提取源信息的过程，还包括如下步骤至少之一：对标准化后的所述源信息中的数据项进行有效性验证；对标准化后的所述源信息中的数据项进行异常值处理；对标准化后的所述源信息中的至少部分数据项进行归一化处理；识别并消除标准化后的所述源信息中的离群值；以及，统一标准化后的所述源信息中的至少部分数据项的计量单位。

在本申请一实施例中，在上述医疗数据处理方法中，在获取与患者相关的检验报告之后，还包括：显示与患者相关的所述检验报告；其中，在对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息之后，还包括：显示与患者相关的源信息；其中，在对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息之后，还包括：显示代码化的所述源信息；以及，在对代码化后的源信息进行关联性分析，以获得关联性分析结果之后，还包括：显示所述关联性分析结果。

在本申请一实施例中，在上述医疗数据处理方法中，在显示与患者相关的所述检验报告之后，还包括：响应于接收到检验报告格式切换操作，在显示全图文格式的原始检验报告的界面内显示转化为文本格式的所述检验报告。

在本申请一实施例中，在上述医疗数据处理方法中，全图文格式的原始检验报告与转化为文本格式的所述检验报告在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理方法中，文本格式的所述检验报告与与患者相关的源信息在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理方法中，与患者相关的源信息与代码化后的所述源信息在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理方法中，代码化后的所述源信息与所述关联性分析结果在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理方法中，原始检验报告包括如下信息至少之一:报告单号、报告名称、患者基本信息、图像、检查项目、所见结果、诊断结果、报告医生、诊断医生和诊断信息；文本格式的所述检验报告包括如下信息至少之一：报告名称、报告单号、患者基本信息、检查项目、所见结果和诊断结果；其中，代码化的源信息包括如下信息至少之一：与患者相关的一般信息、腺叶检查结果、淋巴结检查结果，以及，汇总分析和待处理信息；其中，与患者相关的一般信息包括如下信息至少之一：检诊分类、首检启动日、选检体域、主查腺叶、主查AFT条块、检查医生、检查医院；其中，腺叶检查结果包括如下信息至少之一：可疑灶分布特征数据、其他发现、背景病、备忘，其中，可疑灶分布特征数据包括如下至少之一：灶位置、灶均径、Kwak分级、异常度、可疑度以及评估结论；其中，淋巴结检查结果包括如下信息至少之一：建议查LN侧别/区属、实际检查LN侧别/ 区属，以及，每一LN侧别的检查结果，其中，每一LN侧别的检查结果包括如下至少之一：LN个数、长横劲比、皮-髓质分界、特殊声像、结失常度、结转移危险度以及评估结论；其中，汇总分析和待处理信息包括如下信息至少之一：异常发现、可疑灶分布、可疑LN区属、可疑灶描述、可疑LN形态变化；其中，所述关联性分析结果，包括如下信息至少之一：灶基因对癌侧中颈区落脚转移的内在决定性信息、腺体自身的健康状况判定信息，以及，颈淋巴结的声像失常与癌落脚转移间关系分析结果；其中，所述灶基因对癌侧中颈区落脚转移的内在决定性信息，包括如下信息至少之一：灶在腺叶内的相对位置、灶位置的理论权重、灶均径大小、灶均径理论权重、一侧叶内的灶个数、灶数目的理论权重、灶三要素的理论综合权重、侧中颈区癌落脚理论可能评估结果；其中，腺体自身的健康状况判定信息，包括如下信息至少之一：左右两侧的腺体质地性变化、变化类型、变化程度、伴随性异常、异常类型以及异常程度、背景病和类别代码；其中，颈淋巴结的声像失常与癌落脚转移间关系分析结果，包括如下信息至少之一：声像异常LN所在区属，以及各区属的失常归类、高可疑性转移相关失常、失常度、落脚转移可能性、异常描述和结声像学检查结论。

根据本申请另一方面，还提供一种医疗数据处理装置，其包括：检验报告获取单元，用于获取与患者相关的检验报告；源信息提取单元，用于对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息，其中，提取所述源信息的过程，包括：基于所述检验报告中的检查项目、所见结果和诊断结果对所述检验报告中的内容进行归类；以及，对归类后的所述检验报告中的内容进行疾病相关性分析，以从归类后的所述检验报告中提取出与所述患者所患疾病相关的源信息；代码化单元，用于对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息；以及，关联性分析单元，用于对所述源信息进行关联性分析，以获得关联性分析结果。

在本申请一实施例中，在上述医疗数据处理装置中，所述源信息提取单元，还用于将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息。

在本申请一实施例中，在上述医疗数据处理装置中，所述源信息提取单元，还用于基于针对相同医学含义的标准描述与其他形式的描述所构建的词典，对经疾病相关性分析所获得的所述源信息进行处理，以将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

在本申请一实施例中，在上述医疗数据处理装置中，所述源信息提取单元，还用于基于语义分析模型，识别出所述源信息中具有相同医学含义但不同描述形式的内容；以及，将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

在本申请一实施例中，在上述医疗数据处理装置中，所述源信息提取单元，还用于执行如下步骤至少之一：对标准化后的所述源信息中的数据项进行有效性验证；对标准化后的所述源信息中的数据项进行异常值处理；对标准化后的所述源信息中的至少部分数据项进行归一化处理；识别并消除标准化后的所述源信息中的离群值；以及，统一标准化后的所述源信息中的至少部分数据项的计量单位。

在本申请一实施例中，在上述医疗数据处理装置中，还包括显示单元，用于在获取与患者相关的检验报告之后，显示与患者相关的所述检验报告。

在本申请一实施例中，在上述医疗数据处理装置中，所述显示单元，进一步用于在对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息之后，显示与患者相关的源信息。

在本申请一实施例中，在上述医疗数据处理装置中，所述显示单元，进一步用于在对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息之后，显示代码化的所述源信息。

在本申请一实施例中，在上述医疗数据处理装置中，所述显示单元，进一步用于在对代码化后的源信息进行关联性分析，以获得关联性分析结果之后，显示所述关联性分析结果。

在本申请一实施例中，在上述医疗数据处理装置中，所述显示单元，进一步用于响应于接收到检验报告格式切换操作，在显示全图文格式的原始检验报告的界面内显示转化为文本格式的所述检验报告。

在本申请一实施例中，在上述医疗数据处理装置中，全图文格式的原始检验报告与转化为文本格式的所述检验报告在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理装置中，文本格式的所述检验报告与与患者相关的源信息在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理装置中，与患者相关的源信息与代码化后的所述源信息在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理装置中，代码化后的所述源信息与所述关联性分析结果在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理装置中，原始检验报告包括如下信息至少之一:报告单号、报告名称、患者基本信息、图像、检查项目、所见结果、诊断结果、报告医生、诊断医生和诊断信息；文本格式的所述检验报告包括如下信息至少之一：报告名称、报告单号、患者基本信息、检查项目、所见结果和诊断结果；其中，代码化的源信息包括如下信息至少之一：与患者相关的一般信息、腺叶检查结果、淋巴结检查结果，以及，汇总分析和待处理信息；其中，与患者相关的一般信息包括如下信息至少之一：检诊分类、首检启动日、选检体域、主查腺叶、主查AFT条块、检查医生、检查医院；其中，腺叶检查结果包括如下信息至少之一：可疑灶分布特征数据、其他发现、背景病、备忘，其中，可疑灶分布特征数据包括如下至少之一：灶位置、灶均径、Kwak分级、异常度、可疑度以及评估结论；其中，淋巴结检查结果包括如下信息至少之一：建议查LN侧别/区属、实际检查LN侧别/ 区属，以及，每一LN侧别的检查结果，其中，每一LN侧别的检查结果包括如下至少之一：LN个数、长横劲比、皮-髓质分界、特殊声像、结失常度、结转移危险度以及评估结论；其中，汇总分析和待处理信息包括如下信息至少之一：异常发现、可疑灶分布、可疑LN区属、可疑灶描述、可疑LN形态变化；其中，所述关联性分析结果，包括如下信息至少之一：灶基因对癌侧中颈区落脚转移的内在决定性信息、腺体自身的健康状况判定信息，以及，颈淋巴结的声像失常与癌落脚转移间关系分析结果；其中，所述灶基因对癌侧中颈区落脚转移的内在决定性信息，包括如下信息至少之一：灶在腺叶内的相对位置、灶位置的理论权重、灶均径大小、灶均径理论权重、一侧叶内的灶个数、灶数目的理论权重、灶三要素的理论综合权重、侧中颈区癌落脚理论可能评估结果；其中，腺体自身的健康状况判定信息，包括如下信息至少之一：左右两侧的腺体质地性变化、变化类型、变化程度、伴随性异常、异常类型以及异常程度、背景病和类别代码；其中，颈淋巴结的声像失常与癌落脚转移间关系分析结果，包括如下信息至少之一：声像异常LN所在区属，以及各区属的失常归类、高可疑性转移相关失常、失常度、落脚转移可能性、异常描述和结声像学检查结论。

根据本申请的又一方面，还提供一种电子设备，包括：处理器和存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的医疗数据处理方法。

根据本申请的再一方面，还提供一种计算机可读存储介质，其上存储有计算机程序指令，当所述计算机程序指令被计算装置执行时，可操作来执行如上所述的医疗数据处理方法。

本申请提供的医疗数据处理方法、医疗数据处理装置和电子设备，可以有效地通过计算机处理结合特定领域的专业知识以特定数据处理流程对获取的与患者所患疾病相关的检验报告进行处理，以从所述检验报告中获取与患者所患疾病相关的源信息，进而将源信息进行代码化处理，并对代码化后的源信息进行关联性分析，以获得关联性分析结果，通过这样的方式，实现对检验报告的自动化高效解读，以辅助医生临床决策。

附图说明

从下面结合附图对本发明实施例的详细描述中，本发明的这些和/或其它方面和优点将变得更加清楚并更容易理解，其中：

图1图示了根据本申请实施例的医疗数据整理方法的流程图。

图2图示了根据本申请实施例的医疗数据处理方法中显示检验报告的示意图。

图3图示了根据本申请实施例的医疗数据处理方法中显示格式转化后的检验报告的示意图。

图4图示了根据本申请实施例的医疗数据处理方法中显示源信息提取结果的示意图。

图5图示了根据本申请实施例的医疗数据处理方法中显示代码化后的源信息提取结果的示意图。

图6图示了根据本申请实施例的医疗数据处理方法中显示关联性分析结果的示意图。

图7图示了根据本申请实施例的医疗数据处理装置的框图示意图。

图8图示了根据本申请实施例的电子设备的框图示意图。

具体实施方式

申请概述

如上所述，检验报告(包括检查报告和化验报告)的解读是临床诊疗过程中的一个基础环节。然而，在实务中该项工作却远非理想，甚至经常出错。利用计算机进行检验报告解读是一个值得尝试的技术方向，但如何通过软件编程实施繁复的报告解读过程，却一直是临床信息工程学一直未得到解决的难题(迄今为止，国内外未见有好的解决方案)。造成这一困境主要包括如下原因。

首先，利用计算机实现解读检验报告，不仅仅是单纯的数据科学的问题。由于缺乏相关领域的专业知识，仅单纯通过数据工程师无法开发出适配于实际应用场景的检验报告解读软件。

其次，即便在有相关领域的专家领导软件开发的前提下，由于相关领域的专家是医学领域的专家，其缺乏计算机软件编程思维，无法将其专业所学和实务经验转化为能够通过计算机编程实施的算法规则。

还有，相较于其他领域的信息，医学信息本身存在不确定性，这给检验报告解读的计算机化造成了巨大障碍。例如，文字描述类的检验报告中的内容及其内含信息多变，不仅质量参差不起，而且文字描述还五花八门。换言之，检验报告中的数据存在信息数多寡不一，客观性差，格式不规范等问题。

基于对利用计算机实现解读检验报告的技术难题的认知，本申请人发现未能够以一般规则来设置此类信息处理工作，是问题的症结所在。

针对上述技术问题，本申请的基本构思是基于特定领域的专业知识以特定数据处理流程对获取的与患者所患疾病相关的检验报告进行处理，以从所述检验报告中获取与患者所患疾病相关的源信息，进而将源信息进行代码化处理，并对代码化后的源信息进行关联性分析，以获得关联性分析结果，通过这样的方式，实现对检验报告的自动化高效解读，以辅助医生临床决策。也就是说，本申请的基本构思是基于检验报告解读的专业知识，以信息处理一般规则设置检验报告解读的数据处理流程：设定检验报告解读的数据处理过程过程以从检验报告中提取源信息作为主线，实现对检验报告高效解读。

更具体地，本申请旨为医学检查报告中文字描述疾病相关源信息的分析- 提取提供一种解决的技术方案，其主要包括如下几个技术点。

首先，源信息内涵的专业框定。有别于现有的基于智能语义分析的技术路线，本申请提出观测项概念并确定与观测项相关的单词或词组及其个数(以下简称要素)。接着，对同一要素的差异表述作半定量分级。最后，给出不同要素件内在的关联性的逻辑化解释。此数据处理思路和链路为由医方主导的前期研究结果，各个数据处理步骤均经过临床磨合实验验证。

其次，源信息基本分析-提取法的构建。既然要处理的对象是观测项相关要素，本申请的分析-提取方法是基于比对，而要作比对，就得先建立标准。为此，本申请构建了标准词库(确定符合专业指南或共识要求的用词)，然后以标准词库中收纳的系列规范化单词或词组来比对检查报告中所提取的各实际单词或词组(包括个数)，并经由表达差异区分和汇总权重法分析对具体观测项作出定性结论及其差异度的半定量判定。

还有，源信息可处理性管控机制的建立。可处理管控机制指对源信息本身可不可用和能不能被提取的考量。虽然文本类描述检查报告中实际用词复杂多变，但从信息处理角度来看，仅包括可处理和不可处理两类。在本申请中，不可处理是指要素个数严重不足和/或关键要素确实；可处理是指用词和要素个数符合预设标准。

而要判定具体单词或词组可否处理，还需对之作非标准程度分析。在本申请中，将具体单词或词组分为：全标准，欠标准和不标准。鉴于实际情况复杂，源信息可处理性管控机制分两步进行判断。首先，在判断具体的单词或词组为非标准(也就是，欠标准，或者，不标准)，进一步要区分其是欠标准还是不标准，其中，欠标准类需进行简单修改，不标准类为不可处理类需放弃解读。

还有，欠标准类源信息智能化处置能力的培养。为了提高工作效能，本申请还特别设计了一种自主学习器，用来避免处理欠标准类源信息时的弹框过多问题。具体地，其工作原理为：记录用户的每次修改，比较发现内容一致的修改并计算这些修改的重复发生次数。当此类重复修改的累计次数达到某一阈值，系统会认为此修改有规律，并自行关闭特定弹框，自动给出与欠标准源信息相对应的校正后源信息。

基于此，本申请提供一种医疗数据预处理方法，其首先获取与患者相关的检验报告；进而对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息，其中，提取源信息的过程，包括：基于所述检验报告中的检查项目、所见结果和诊断结果对所述检验报告中的内容进行归类；接着，对归类后的所述检验报告中的内容进行疾病相关性分析，以从归类后的所述检验报告中提取出与所述患者所患疾病相关的源信息；对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息；进而，对代码化后的源信息进行关联性分析，以获得关联性分析结果。这样，基于特定领域的专业知识以特定数据处理流程对获取的与患者所患疾病相关的检验报告进行处理，以实现对检验报告的自动化高效解读，以辅助医生临床决策。

值得一提的是，如何自动化分析-提取文描类检查报告中的与疾病相关的源信息一直是临床信息工程学的一道未解难题。之所以难，是因为不仅信息本身特殊(单个观测项常由多个表述性参数或要素构成，而要素又是以汉语单词或词组形式呈现)，而且其被提取时还具有高度不确定性，例如，表述是否正确，个数是否充足，这些既受报告者个人经验影响，亦与其用词规范性和语句通顺性等语文能力或用语习惯直接相关。相应地，采用本申请所提供的医疗数据处理方法，其能够解决自动化分析-提取文描类检查报告中的与疾病相关的源信息的难度。

该难题的破解也为后续临床决策支持系统的构建扫平了障碍。具体地，将分析-提取功能模块与报告抓获模块整合，即可自动执行从医学原始检查报告抓获开始，经个中疾病源信息分析-提取直到代码化为止全部工作。由此也可以构建能起“引擎”作用的核心功能模块——信息处理子系统。

进一步地凭借前窗工作界面设计再结合信息处理子系统，也就是，通过基于任务最佳实现考量的前窗显示设置及其后台程序编排配置极便于用户操作的应用软件。

本申请所揭露的技术为迄今医学信息工程学领域的前言探索。在理论上，它基于一些与CDSS(Clinical Decision Support System)构建有关的新设想和基本原则。例如，CDSS软件需由医方主导，医生-IT工程师协作的工作模式；需坚持软件“是助手，不是主人”的角色定位；应恪守“不生产水，只是大自然的搬运工”的信息处理原则。在实践上，它建立了开展此类工程的一般方法，如须以疾病相关源信息的专业框定为基础，针对此类疾病源信息的特殊性来设计功能机制，再如须经临床三期磨合试验来构建软件并完成可行性验证。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

下面，将参考附图详细描述根据本申请的示例实施例。显然，所描述的实施例仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解本申请不受这里描述的示例实施例的限制。

示意性医疗数据处理方法

图1图示了根据本申请实施例的医疗数据处理方法的流程图。如图1所示，根据本申请实施例的医疗数据处理方法，包括：S110，获取与患者相关的检验报告；S120，对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息，其中，提取源信息的过程，包括：基于所述检验报告中的检查项目、所见结果和诊断结果对所述检验报告中的内容进行归类；以及，对归类后的所述检验报告中的内容进行疾病相关性分析，以从归类后的所述检验报告中提取出与所述患者所患疾病相关的源信息；S130，对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息；以及，S140，对代码化后的源信息进行关联性分析，以获得关联性分析结果。

在步骤S110中，获取与患者相关的检验报告。这里，与患者相关的检验报告，包括与患者相关的体检报告与化验报告，更明确地包括与患者所患疾病相关的检验报告和化验报告。例如，如果患者不幸罹患了甲状腺肿瘤，在诊疗过程中，患者会基于医生的指示做各种化验和检查，生成相应的检验报告和化验报告(包括但不限于：甲状腺彩超检查，甲状腺功能化验报告、核素扫描报告、针吸涂片细胞学检查等)。通常，一份完整的原始检验报告，包括如下信息：报告单号、报告名称、患者基本信息、图像(如果有图像的话)、检查项目、所见结果、诊断结果、报告医生、诊断医生和诊断信息，其中，患者基本信息用于标识患者身份，其包括但不限于：姓名、性别、年龄、病历号、床号等。也就是说，原始检验报告包括两种数据格式：全图文格式和纯文本格式，其中全图文格式表示检验报告中既包括图片又包括文本描述，纯文本格式表示检验包括中仅包括文本数据。

在一种可能的实现方式中，获取与患者相关的检验报告可通过如下方式实现：首先，将与患者相关的各项检验报告加载到检验报告数据库中，并以患者的身份标识作为关联。进而，在接收到与患者相关的身份标识查询之后，搜索引擎返回与患者身份标识匹配的所有检验报告。

在具体实施中，可设定患者的某一项属性作为其身份标识(例如，病历号、姓名等)；或者以患者的某几项属性的组合作为其身份标识(例如，病历号+姓名，病历号+床号等)，对此并不为本申请所局限。并且，数据库搜索引擎能够以模糊查找或精确查找的方式运行，返回检索查询结果，对此并不为本申请所局限。并且，在本申请实施例中，可基于报告生成的时间对所抓取的报告进行排序归档，当然，本领域普通技术人员应可以理解，还可以采用其他方式对所抓取的报告进行排序归档，对此并不为本申请所局限。在归档后，用户便能够更为便利地查看与病人相关的检验报告信息。

为了确保检验报告数据的流通，各医院平台间端口需实现互联。经测试，在本申请实施例中，源信息载体(即与患者相关的检验报告)的正确截获率超过99％，效果优良。

值得一提的是，输入病人身份标识，将其名下的所有检验报告从院库自行拷贝到科库不难(也就是，从一个数据库拷贝到另一个数据库)，问题是经由院-科两级数据库抓来的所有报告，其中有些可能与本专科疾病无关(例如，涉及其他病种)，或者，即使相关其作用亦非本专科疾病诊疗必不可少的(例如，各种辅助性检查)。因此，在抓取过程中，进一步对各个检查报告进一步作专科病相关性及其诊疗支持度区分。

在获取到与患者相关的所有检验报告之后，可有选择地显示部分检验报告，以满足医生观察和人工校验检验报告的需求。在一种可能的实现方式中，可通过相关性分析从获取的所有检验报告中筛选出若干与患者所患疾病相关度较高(例如，超过预设阈值)的检验报告，并将其加载到检验报告显示列表中。相应地，医生可通过点击检验报告显示列表中的检验报告选项，以显示相应的检验报告。并且，在一些可能的实现方式中，还可以对待显示的检验报告进行分类，例如，基于术前、术后、随访三个时间节点对待显示的检验报告进行分类，以便于医生在调取报告时降低其筛选与甄别时间，提高效率。

图2图示了根据本申请实施例的医疗数据处理方法中显示检验报告的示意图。如图2所示，在该示例中，患者所罹患的疾病为甲状腺肿瘤，显示的检验报告为“甲状腺彩超检查/左侧颈部淋巴结彩超检查”，其中，该报告包括如下信息：报告单号、报告名称、患者基本信息(姓名、性别、年龄、病历号、床号)、图像、检查项目、所见结果、诊断结果、报告医生、诊断医生和诊断信息。应可以看出，在该示例中，所显示的报告为全图文格式的原始检查报告，包括图像和文字信息。

为了便于观察且利于计算机处理，可将全图文格式的原始检验报告转变为纯文本格式的检验报告。图3图示了根据本申请实施例的医疗数据处理方法中显示格式转化后的检验报告的示意图。如图3所示，在该示例中，图2 中所示意的全图文格式的检验报告已转化为图3中纯文本格式的检验报告，其包括如下信息：报告单号、报告名称、患者基本信息(姓名、性别、年龄、病历号、床号)、检查项目、所见结果、诊断结果。

在一种可能的实现方式中，可在显示界面配置格式转化控件。相应地，在接收到用户格式转化操作指令之后，响应于所述格式转化操作指令，将全图文格式的检验报告转化为纯文本格式的检验报告。在一种可能的实现方式中，用户的格式转化操作指令可通过“点击”格式转化控件触发，当然，在本申请其他示例中，用户的格式转化操作指令可配置为其他形式的控制指令，例如，语音控制，触摸控制，手势控制等，对此并不为本申请所局限。

优选地，在本申请实施例中，全图文格式的检验报告和对应的纯文本格式的检验报告可在同一显示界面内显示。也就是说，响应于用户的格式转化操作指令，在显示有全图文格式的检验报告的界面内，显示纯文本格式的检验报告。当然，本领域技术人员应可以理解，全图文格式的检验报告和对应的纯文本格式的检验报告也可在不同的显示界面内显示，例如，响应于用户的格式转化操作指令，弹出另一显示界面，并在该另一显示界面内显示纯文本格式的检验报告。

值得一提的是，当全图文格式的检验报告和对应的纯文本格式的检验报告在同一显示界面显示时，优选地，全图文格式的检验报告和对应的纯文本格式的检验报告被设置以并列的方式进行显示，例如，以左右并列的方式呈现于显示界面内。当然，本领域技术人员应可以理解，在本申请其他示例中，全图文格式的检验报告和对应的纯文本格式的检验报告能够以其他排布方式显示于同一界面内(例如，上下分布，对角分布)。对此，并不为本申请所局限。

如前所述，在本申请中，检验报告解读的关键在于从检验报告中提取出与患者所患疾病相关的源信息。源信息的提取方法和特征，具体描述如下。

在步骤S120中，对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息，其中，提取源信息的过程，包括：基于所述检验报告中的检查项目、所见结果和诊断结果对所述检验报告中的内容进行归类；以及，对归类后的所述检验报告中的内容进行疾病相关性分析，以从归类后的所述检验报告中提取出与所述患者所患疾病相关的源信息。

更具体地说，在本申请实施例中，在获取与患者相关的检验报告后，基于所述检验报告中的检查项目、所见结果和诊断结果将检验报告中所包含的信息进行“分类归框”，即将检验报告中的内容以解剖“方面属性”识别、“所见-结论”和“诊断结论”作为分类标准，将检验报告中的文本内容自动拆解并置入不同的框格中。在实现归类之后，进一步地对归类后的所述检验报告中的内容进行疾病相关性分析，以从归类后的所述检验报告中提取出与所述患者所患疾病相关的源信息。

应可以理解，在本申请实施例中，检验报告中的源信息表示与患者所患疾病相关的要素信息，这里，要素为基于诊疗专业知识拟定的观测项，因此，为了从检验报告中筛选出源信息，应将相关医学领域的专业知识结合到源信息的提取过程中。具体地，要解决如下几个关键技术点。

具体来说，从检验报告中提取源信息的过程，包括：首先将归类之后的检验报告中的内容进行分词；进而，基于疾病诊疗相关知识建立关键词词库，并以所述关键词词库对分词之后的所述检验报告进行处理，以从所述检验报告中提取出与患者所患疾病相关的词，即源信息。这里，与患者所患疾病相关的词表示与患者所患疾病相关的词语或者词组。

此外，相较于其他领域的信息，检验报告中所包含的信息还具有其他特性：首先，检验报告中所包含的医学信息本身存在不确定性；其次，文字描述类的检验报告中的内容及其内含信息多变，不仅质量参差不起，而且文字描述还五花八门。

为了解决上述问题，在本申请实施例中，提取源信息的过程，还包括：将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息。通过这样的方式，有效地克服检验报告中文字描述不规范和无统一格式对检验报告解读造成的不良影响。

在一种可能的实现方式中，可通过预制关键词比对的方式对源信息进行标准化处理。也就是，建立关键词词库。这里关键词词库是规范化的专业用词，是分析比对报告中实际用词标准与否的参照，也是判定其可处理性的标准。因此，关键词词库是处理文描类源信息的先决条件于基础。

具体来说，首先构建针对相同医学含义的标准描述与其他形式的描述所形成的词典；进而，通过将源信息中的描述与词典中的描述进行对比。如果源信息的描述为判定为标准描述，则保留源信息的描述形式；如果源信息的描述形式被判定为非标准描述，则转化为标准描述。通过这样的方式，可有效地应对歧义的汉文字内容，以从所述检验报告中提取出与疾病诊疗相关的源信息。

在另一种可能的实现方式中，可通过特定的语义模型对源信息进行标准化处理。具体来说，首先，构建能够识别语义信息的模型(例如RNN神经网络模型)；在通过已知训练数据集训练完成所述语义识别模型之后，将检验报告中的内容输入至所述语义识别模型中。相应地，所述语义模型能够识别出所述源信息中具有相同医学含义但不同描述形式的内容，进而，将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

本领域技术人员应可以理解，还可以采用其他数据处理方法对源信息进行标准化处理，或者选用其他语义识别模型对源信息进行标准化处理，对此并不为本申请所局限。

并且，为了提高对源信息是否可处理和如何处理的管控机制，在本申请的技术方案中，进一步提供一种“双门坎三通道”式源信息可处理性管控机制。

具体地，首先进行门坎设置，包括：第一门坎和第二门坎，其中，第一门坎定义欠标准类源信息，第二门坎定位不可处理的源信息。具体地，欠标准类源信息指的是要素的表述虽不标准和/或个数欠足，但尚不至于影响对观测项的定性和半定量分级。并且，可设置弹框提醒用户自行校验，其中，经用户分析修改后，此类源信息仍可被采用。

不可处理的源信息指的是有要素的表述极其费解和/或个数严重不足，以至于无法对观测项的定性和半定量分级。此时，须弹框提醒用户源信息或不可用。此类源信息用户常也无法分析，勉强揣摩修改，极易导致失真和误判。还不如重新检查或退回报告让检查者重新撰写)。

在实际实践中，欠标准类源信息的情况，包括：用词不规范(例如，各种非标准的单词和/或词组)、要素个数欠或严重缺失、所见与结论相矛盾(例如，有以所见要素权重法分析结果为主，基于比对及其差异程度的逻辑处置) 非常见语句(例如，特殊或罕见情况的说明)、赘语类重复(例如，含已提及过要素的总结概括性语句)、语义混乱类描述(例如，语句乱插或语序颠倒) 、标点符号错误(例如，各种非标准使用)

值得一提的是，可处理性分析和提醒很必要，至于修不修改和怎么修改，那是用户的事。作为“助手”，软件“不生产水，只是搬运工”。

在具体实施中，设管控机制，坚持“不生产水，只做搬运工”原则必要，但现实情况是，目前面对的非标准情况居多(计算撰写很规范，真正全负荷标准的观测项相关描述类参数也很少)，也就是，全标准和不可处理类反倒少。而且用户也认为经修改多次欠标准类源信息仍可被采纳。要是卡得太严，手工操作占比太高，会大大影响信息处理速度。

为了避免非必要的反复弹框，使信息处理操控更趋顺畅，可构建一用户信息修改经验为对象的软件学习器。藉由自主学习智能理解各种标准与非标准件对应关系，将此类人工手动修改快速转向机器自动修改。

也就是，在“双门槛三通道”的基础上再添加一个分析-控制机制，此机制的核心部分采用高级算法的特殊功用编程，用以测算用户同样修改的重复次数，然后经磨合试验确定合适的频次数N作为免弹框阈值。也就是，当累计次数等于N时，便将此修改视为规律并纳入描述行参数修改经验集，当然，也不再弹框提示，而是直接自动给出。

除了描述形式不一，无统一格式之外，在检验报告中还可能存在数据项缺失，数据项计量单位不一致，数据项中存在异常值，数据项中存在离群值，数据项中存在无效数据等现象。相应地，在本申请实施例中，提取源信息的过程，还包括如下步骤至少之一：对标准化后的所述源信息中的数据项进行有效性验证；对标准化后的所述源信息中的数据项进行异常值处理；对标准化后的所述源信息中的至少部分数据项进行归一化处理；识别并消除标准化后的所述源信息中的离群值；以及，统一标准化后的所述源信息中的至少部分数据项的计量单位。

在从所述检验报告中提取出源信息之后，可将源信息提取结果显示出来，以满足医生观察和人工校验源信息提取结果的需求。图4图示了根据本申请实施例的医疗数据处理方法中显示源信息提取结果的示意图，其中，所示意的源信息提取结果针对于图2和图3中所示意的检查报告。如图4所示，在该示例中，图3所示意的检验报告中的内容以“检查项目、所见结果和诊断结果”作为分类标准被分类归框，并且，应注意到在显示窗中被提取的源信息以特殊方式被标识出来。应可以理解，以特殊方式将源信息标识出来的原因利于引导医生将视线聚焦于源信息，以更为高效对源信息建立全面地了解。在具体实施中，特殊的标识方式包括但不限于高亮、以特殊颜色表示，下划线等，对此并不为本申请所局限。

在一种可能的实现方式中，可在显示界面配置源信息提取控件。相应地，在接收到用户源信息提取的操作指令之后，响应于所述源信息提取的操作指令，在显示界面显示源信息提取结果，其中，在显示界面中源信息以特定方式被标识出来。在一种可能的实现方式中，用户的源信息提取的操作指令可通过“点击”源信息提取控件触发，当然，在本申请其他示例中，用户的源信息提取的操作指令可配置为其他形式的控制指令，例如，语音控制，触摸控制，手势控制等，对此并不为本申请所局限。

优选地，在本申请实施例中，纯文本格式的检验报告和源信息提取结果可在同一显示界面内显示。也就是说，响应于用户的源信息提取的操作指令，在显示有纯文本格式的检验报告的界面内，显示源信息提取结果。应可以理解，当纯文本检验报告和源信息提取结果在同一显示界面内显示时，医生可在同一视野范围内同时观察到纯文本检验报告和源信息提取结果，以使其不仅能够全面地观察到源信息提取结果，而且能够观察到纯文本检验报告中的数据与源信息提取结果之间的关联，以进行人工校验，防止出错。当然，本领域技术人员应可以理解，纯文本格式的检验报告和源信息提取结果也可在不同的显示界面内显示。例如，响应于用户的源信息提取的操作指令，弹出另一显示界面，并在该另一显示界面内显示源信息提取结果。

值得一提的是，当纯文本格式的检验报告和源信息提取结果在同一显示界面显示时，优选地，纯文本格式的检验报告和源信息提取结果被设置以并列的方式进行显示，例如，以左右并列的方式呈现于显示界面内。当然，本领域技术人员应可以理解，在本申请其他示例中，纯文本格式的检验报告和源信息提取结果能够以其他排布方式显示于同一界面内(例如，上下分布，对角分布)。对此，并不为本申请所局限。

在步骤S130中，对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息。代码化处理的主要目的在于：将标准化源信息转化为计算机可计算的数据形式，包括但不限于数字符号，符号组或缩略语等。

相类似地，在将源信息代码化之后，同样可将代码化后的源信息提取结果显示出来，以满足医生观察和人工校验源信息提取结果的需求。图5图示了根据本申请实施例的医疗数据处理方法中显示代码化后的源信息提取结果的示意图，其中，所示意的代码化后的源信息提取结果针对于图4中所示意源信息提取结果。如图5所示，在该示例中，图4所示意的以特定方式标识的源信息被转化为计算机可运算的数据形式(特别地，表单地数据形式)。具体来说，如图5所示意的代码化后的源信息提取结果，包括如下信息：与患者相关的一般信息、腺叶检查结果、淋巴结检查结果，以及，汇总分析和待处理信息；其中，与患者相关的一般信息包括如下信息：检诊分类、首检启动日、选检体域、主查腺叶、主查AFT条块、检查医生、检查医院；其中，腺叶检查结果包括如下信息：可疑灶分布特征数据、其他发现、背景病、备忘，其中，可疑灶分布特征数据包括如下信息：灶位置、灶均径、Kwak分级、异常度、可疑度以及评估结论；其中，淋巴结检查结果包括如下信息：建议查LN侧别/区属、实际检查LN侧别/区属，以及，每一LN侧别的检查结果，其中，每一LN侧别的检查结果包括如下至少之一：LN个数、长横劲比、皮- 髓质分界、特殊声像、结失常度、结转移危险度以及评估结论；其中，汇总分析和待处理信息包括如下信息：异常发现、可疑灶分布、可疑LN区属、可疑灶描述、可疑LN形态变化。

在一种可能的实现方式中，可在显示界面配置代码化控件。相应地，在接收到代码化的操作指令之后，响应于代码化的操作指令，在显示界面显示代码化后的源信息提取结果。代码化操作指令可通过“点击”源信息提取控件触发，当然，在本申请其他示例中，代码化的操作指令可配置为其他形式的控制指令，例如，语音控制，触摸控制，手势控制等，对此并不为本申请所局限。

优选地，在本申请实施例中，源信息提取结果和代码化后的源信息提取结果可在同一显示界面内显示。也就是说，响应于代码化的操作指令，在显示有源信息提取结果的界面内，显示代码化后的源信息提取结果。应可以理解，当源信息提取结果和代码化后的源信息提取结果在同一显示界面内显示时，医生可在同一视野内同时观察到源信息提取结果和代码化后的源信息提取结果，以使其不仅能够观察到两种不同的形式的源信息提取结果，而且能够观察到源信息提取结果和代码化后的源信息提取结果之间的关联，以进行人工校验，防止出错。当然，本领域技术人员应可以理解，源信息提取结果和代码化后的源信息提取也可在不同的显示界面内显示。例如，响应于代码化的操作指令，弹出另一显示界面，并在该另一显示界面内显示代码化后的源信息提取结果。

值得一提的是，当源信息提取结果和代码化后的源信息提取结果在同一显示界面显示时，优选地，源信息提取结果和代码化后的源信息提取结果被设置以并列的方式进行显示，例如，以左右并列的方式呈现于显示界面内。当然，本领域技术人员应可以理解，在本申请其他示例中，源信息提取结果和代码化后的源信息提取结果能够以其他排布方式显示于同一界面内(例如，上下分布，对角分布)。对此，并不为本申请所局限。

在步骤S140中，对代码化后的源信息进行关联性分析，以获得关联性分析结果。步骤S120和步骤S130中的源信息为直接(部分通过标准化处理) 从校验报告中所提取的数据，即，源信息为一级数据。在报告解读过程中，还需从从一级数据中挖掘出其他有价值的信息。具体来说，在本申请实施例中，采用关联性分析作为数据挖掘手段，即对代码化后的源信息进行关联性分析，以从一级数据间的因果关系推断出发或通过多级数据间交错因果关系挖掘出其他有价值的信息。应可以理解，关联性分析中的因果关系的设定依托于医生基于专业知识和诊疗经验进行报告解读的因果逻辑。

相类似地，在获取关联性分析结果之后，同样可将关联性分析结果显示出来，以满足医生观察和人工校验检验报告解读结果的需求。图6图示了根据本申请实施例的医疗数据处理方法中显示关联性分析结果的示意图，其中，所示意的关联性分析结果针对于图5中所示意的代码化后的源信息提取结果。如图6所示，在该示例中，通过对图5中所包括的代码化后的源信息进行关联性分析，获得如图6所示意的关联性分析结果，其包括如下信息：灶基因对癌侧中颈区落脚转移的内在决定性信息、腺体自身的健康状况判定信息，以及，颈淋巴结的声像失常与癌落脚转移间关系分析结果；其中，所述灶基因对癌侧中颈区落脚转移的内在决定性信息，包括如下信息：灶在腺叶内的相对位置、灶位置的理论权重、灶均径大小、灶均径理论权重、一侧叶内的灶个数、灶数目的理论权重、灶三要素的理论综合权重、侧中颈区癌落脚理论可能评估结果；其中，腺体自身的健康状况判定信息，包括如下信息：左右两侧的腺体质地性变化、变化类型、变化程度、伴随性异常、异常类型以及异常程度、背景病和类别代码；其中，颈淋巴结的声像失常与癌落脚转移间关系分析结果，包括如下信息：声像异常LN所在区属，以及各区属的失常归类、高可疑性转移相关失常、失常度、落脚转移可能性、异常描述和结声像学检查结论。

在一种可能的实现方式中，可在显示界面配置关联性分析控件。相应地，在接收到关联性分析的操作指令之后，响应于关联性分析的操作指令，在显示界面显示关联性分析结果。关联性分析的操作指令可通过“点击”关联性分析控件触发，当然，在本申请其他示例中，关联性分析的操作指令可配置为其他形式的控制指令，例如，语音控制，触摸控制，手势控制等，对此并不为本申请所局限。

优选地，在本申请实施例中，代码化后的源信息提取结果和关联性分析结果可在同一显示界面内显示。也就是说，响应于关联性分析的操作指令，在显示有代码化后的源信息提取结果的界面内，显示关联性分析二级果。应可以理解，当代码化后的源信息提取结果和关联性分析结果在同一显示界面内显示时，医生可在同一视野内同时观察到代码化后的源信息提取结果和关联性分析结果，以使其能够观察到代码化后的源信息提取结果和关联性分析结果之间的关联，以进行人工校验，防止出错。当然，本领域技术人员应可以理解，代码化后的源信息提取结果和关联性分析结果也可在不同的显示界面内显示。例如，响应于关联性分析的操作指令，弹出另一显示界面，并在该另一显示界面内显示关联性分析结果。

值得一提的是，当代码化后的源信息提取结果和关联性分析结果在同一显示界面显示时，优选地，代码化后的源信息提取结果和关联性分析结果被设置以并列的方式进行显示，例如，以左右并列的方式呈现于显示界面内。当然，本领域技术人员应可以理解，在本申请其他示例中，代码化后的源信息提取结果和关联性分析结果能够以其他排布方式显示于同一界面内(例如，上下分布，对角分布)。对此，并不为本申请所局限。

综上，基于本申请实施例的用于检验报告解读的医疗数据处理方法被阐明，其基于特定领域的专业知识以特定数据处理流程对获取的与患者所患疾病相关的检验报告进行处理，以从所述检验报告中获取与患者所患疾病相关的源信息，进而将源信息进行代码化处理，并对代码化后的源信息进行关联性分析，以获得关联性分析结果，通过这样的方式，实现对检验报告的自动化高效解读，以辅助医生临床决策。

应特别指出，本申请所涉及的用于检验报告解读的医疗数据处理方法，抓住了解读检验报告时医生分析思辨过程的本质，将源信息的采集-处理的过程分解为“获取原始报告(并且可选择地呈现报告)”、“源信息提取(包括分类归框、数据预处理、标准化处理等过程)”、“代码化”和“关联性分析”四个主要步骤。

并且，在本申请实施例中，报告解读结果藉由“四联小窗”来呈现，其中，四联小窗包括“检验报告显示窗口”、“源信息提取结果显示窗口”、“代码化后的源信息提取结果显示窗口”和“关联性分析结果显示窗口”，其中，检验报告显示窗口用于显示原始检验报告和格式转化后的检验报告；源信息提取结果显示窗口用于显示格式转化后的检验报告和源信息提取结果；代码化后的源信息提取结果显示窗口用于显示源信息提取结果和代码化后的源信息提取结果；以及，关联性分析结果显示窗口用于显示代码化后的源信息提取结果和关联性分析结果。这样，后台的信息处理过程与前台的报告解读结果-下一步处置过程完全契合。也就是说，本申请所采用用于检验报告解读的医疗数据处理方法和显示控制过程，即顺应了疾病相关信息分析的一般规律，也便于信息处理高效能要求的编程实现。

从用户角度来看，“四联小窗”的显示控制设计利于医生辅助决策-处置。例如，看门诊时医生以之来解读检验报告，医生在做的是：眼看屏幕、手动鼠标、脑想着病情，口与患者交流。操作完了，处置就结束了，相关数据和处置记录也保留了下来。这有利于实现既快又准，还省时省力的无纸化门诊的工作变革。

值得一提的是，本申请所涉及的用于检验报告解读的医疗数据处理方法中所涉及的数据库可基于MySQL数据库、Access数据库、Oracle数据库或其他形式的数据库进行架构，对于数据库的选型并不为本申请所局限。

示意性医疗数据整理装置

图7图示了根据本申请实施例的医疗数据整理装置的框图。

如图7所示，根据本申请实施例的医疗数据整理装置700包括：检验报告获取单元710，用于获取与患者相关的检验报告；源信息提取单元720，用于对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息，其中，提取所述源信息的过程，包括：基于所述检验报告中的检查项目、所见结果和诊断结果对所述检验报告中的内容进行归类；以及，对归类后的所述检验报告中的内容进行疾病相关性分析，以从归类后的所述检验报告中提取出与所述患者所患疾病相关的源信息；代码化单元730，用于对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息；以及，关联性分析单元740，用于对所述源信息进行关联性分析，以获得关联性分析结果。

在本申请一实施例中，在上述医疗数据处理装置700中，所述源信息提取单元720，还用于将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息。

在本申请一实施例中，在上述医疗数据处理装置700中，所述源信息提取单元720，还用于基于针对相同医学含义的标准描述与其他形式的描述所构建的词典，对经疾病相关性分析所获得的所述源信息进行处理，以将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

在本申请一实施例中，在上述医疗数据处理装置700中，所述源信息提取单元720，还用于基于语义分析模型，识别出所述源信息中具有相同医学含义但不同描述形式的内容；以及，将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

在本申请一实施例中，在上述医疗数据处理装置700中，所述源信息提取单元720，还用于执行如下步骤至少之一：对标准化后的所述源信息中的数据项进行有效性验证；对标准化后的所述源信息中的数据项进行异常值处理；对标准化后的所述源信息中的至少部分数据项进行归一化处理；识别并消除标准化后的所述源信息中的离群值；以及，统一标准化后的所述源信息中的至少部分数据项的计量单位。

在本申请一实施例中，在上述医疗数据处理装置700中，还包括显示单元750，用于在获取与患者相关的检验报告之后，显示与患者相关的所述检验报告。

在本申请一实施例中，在上述医疗数据处理装置700中，还包括显示单元750，进一步用于在对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息之后，显示与患者相关的源信息。

在本申请一实施例中，在上述医疗数据处理装置700中，还包括显示单元750，进一步用于在对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息之后，显示代码化的所述源信息。

在本申请一实施例中，在上述医疗数据处理装置700中，还包括显示单元750，进一步用于响应于接收到检验报告格式切换操作，在显示全图文格式的原始检验报告的界面内显示转化为文本格式的所述检验报告。

在本申请一实施例中，在上述医疗数据处理装置700中，全图文格式的原始检验报告与转化为文本格式的所述检验报告在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理装置700中，文本格式的所述检验报告与与患者相关的源信息在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理装置700中，与患者相关的源信息与代码化后的所述源信息在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理装置700中，代码化后的所述源信息与所述关联性分析结果在同一显示界面内并列显示。

在本申请一实施例中，在上述医疗数据处理装置700中，原始检验报告包括如下信息至少之一：报告单号、报告名称、患者基本信息、图像、检查项目、所见结果、诊断结果、报告医生、诊断医生和诊断信息；文本格式的所述检验报告包括如下信息至少之一：报告名称、报告单号、患者基本信息、检查项目、所见结果和诊断结果；其中，代码化的源信息包括如下信息至少之一：与患者相关的一般信息、腺叶检查结果、淋巴结检查结果，以及，汇总分析和待处理信息；其中，与患者相关的一般信息包括如下信息至少之一：检诊分类、首检启动日、选检体域、主查腺叶、主查AFT条块、检查医生、检查医院；其中，腺叶检查结果包括如下信息至少之一：可疑灶分布特征数据、其他发现、背景病、备忘，其中，可疑灶分布特征数据包括如下至少之一：灶位置、灶均径、Kwak分级、异常度、可疑度以及评估结论；其中，淋巴结检查结果包括如下信息至少之一：建议查LN侧别/区属、实际检查LN侧别/区属，以及，每一LN侧别的检查结果，其中，每一LN侧别的检查结果包括如下至少之一：LN个数、长横劲比、皮-髓质分界、特殊声像、结失常度、结转移危险度以及评估结论；其中，汇总分析和待处理信息包括如下信息至少之一：异常发现、可疑灶分布、可疑LN区属、可疑灶描述、可疑LN形态变化；其中，所述关联性分析结果，包括如下信息至少之一：灶基因对癌侧中颈区落脚转移的内在决定性信息、腺体自身的健康状况判定信息，以及，颈淋巴结的声像失常与癌落脚转移间关系分析结果；其中，所述灶基因对癌侧中颈区落脚转移的内在决定性信息，包括如下信息至少之一：灶在腺叶内的相对位置、灶位置的理论权重、灶均径大小、灶均径理论权重、一侧叶内的灶个数、灶数目的理论权重、灶三要素的理论综合权重、侧中颈区癌落脚理论可能评估结果；其中，腺体自身的健康状况判定信息，包括如下信息至少之一：左右两侧的腺体质地性变化、变化类型、变化程度、伴随性异常、异常类型以及异常程度、背景病和类别代码；其中，颈淋巴结的声像失常与癌落脚转移间关系分析结果，包括如下信息至少之一：声像异常LN所在区属，以及各区属的失常归类、高可疑性转移相关失常、失常度、落脚转移可能性、异常描述和结声像学检查结论。

这里，本领域技术人员可以理解，上述医疗数据处理装置700中的各个单元和模块的具体功能和操作已经在上面参考图1到图6描述的医疗数据处理方法中详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的医疗数据整理装置可以实现在各种终端设备中，例如CDSS(Clinical Decision Support System，医疗决策辅助系统)服务器中。在一个示例中，根据本申请实施例的医疗数据处理装置可以作为一个软件模块和/或硬件模块而集成到所述终端设备中。例如，该医疗数据处理装置可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该医疗数据处理装置同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该医疗数据处理装置与该终端设备也可以是分立的终端设备，并且该医疗数据处理装置可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

示意性电子设备

下面，参考图8来描述根据本申请实施例的电子设备。

图8图示了根据本申请实施例的电子设备的框图。

如图8所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的医疗数据处理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以检验报告、源信息提取结果、代码化后的源信息提取结果、关联性分析结果等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如，该输入装置13可以是例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括检验报告、源信息提取结果、代码化后的源信息提取结果、关联性分析结果等。该输出设备14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图8中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示意性计算机程序产品

除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的医疗数据处理方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“，还语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的医疗数据处理方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或” 和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种医疗数据处理方法，其特征在于，包括：

获取与患者相关的检验报告；

2.根据权利要求1所述的医疗处理方法，其中，提取源信息的过程，还包括：

将所述源信息中具有相同医学含义但不同描述方式的内容转化为标准描述，以获得标准化后的所述源信息。

3.根据权利要求2所述的医疗数据处理方法，其中，将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息，包括：

基于针对相同医学含义的标准描述与其他形式的描述所构建的词典，对经疾病相关性分析获得的所述源信息进行处理，以将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

4.根据权利要求2所述的医疗数据处理方法，其中，将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息，包括：

基于语义分析模型，识别出所述源信息中具有相同医学含义但不同描述形式的内容；以及

将所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述。

5.根据权利要求2-4任一所述的医疗数据处理方法，其中，提取源信息的过程，还包括如下步骤至少之一：

对标准化后的所述源信息中的数据项进行有效性验证；

对标准化后的所述源信息中的数据项进行异常值处理；

对标准化后的所述源信息中的至少部分数据项进行归一化处理；

识别并消除标准化后的所述源信息中的离群值；以及

统一标准化后的所述源信息中的至少部分数据项的计量单位。

6.根据权利要求1或5所述的医疗数据处理方法，

其中，在获取与患者相关的检验报告之后，还包括：显示与患者相关的所述检验报告；

其中，在对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息之后，还包括：显示与患者相关的源信息；

其中，在对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息之后，还包括：显示代码化的所述源信息；以及

其中，在对代码化后的源信息进行关联性分析，以获得关联性分析结果之后，还包括：显示所述关联性分析结果。

7.根据权利要求6所述的医疗数据处理方法，其中，在显示与患者相关的所述检验报告之后，还包括：

响应于接收到检验报告格式切换操作，在显示全图文格式的检验报告的界面内显示转化为文本格式的所述检验报告。

8.根据权利要求7所述的医疗数据处理方法，其中，全图文格式的原始检验报告与转化为文本格式的所述检验报告在同一显示界面内并列显示。

9.根据权利要求7所述的医疗数据处理方法，其中，文本格式的所述检验报告与与患者相关的源信息在同一显示界面内并列显示。

10.根据权利要求8所述的医疗数据处理方法，其中，与患者相关的源信息与代码化后的所述源信息在同一显示界面内并列显示。

11.根据权利要求8所述的医疗数据处理方法，其中，代码化后的所述源信息与所述关联性分析结果在同一显示界面内并列显示。

12.根据权利要求1-11任一所述的医疗数据处理方法，其中，原始检验报告包括如下信息至少之一:报告单号、报告名称、患者基本信息、图像、检查项目、所见结果、诊断结果、报告医生、诊断医生和诊断信息；文本格式的所述检验报告包括如下信息至少之一：报告名称、报告单号、患者基本信息、检查项目、所见结果和诊断结果；

其中，代码化的源信息包括如下信息至少之一：与患者相关的一般信息、腺叶检查结果、淋巴结检查结果，以及，汇总分析和待处理信息；其中，与患者相关的一般信息包括如下信息至少之一：检诊分类、首检启动日、选检体域、主查腺叶、主查AFT条块、检查医生、检查医院；其中，腺叶检查结果包括如下信息至少之一：可疑灶分布特征数据、其他发现、背景病、备忘，其中，可疑灶分布特征数据包括如下至少之一：灶位置、灶均径、Kwak分级、异常度、可疑度以及评估结论；其中，淋巴结检查结果包括如下信息至少之一：建议查LN侧别/区属、实际检查LN侧别/区属，以及，每一LN侧别的检查结果，其中，每一LN侧别的检查结果包括如下至少之一：LN个数、长横劲比、皮-髓质分界、特殊声像、结失常度、结转移危险度以及评估结论；其中，汇总分析和待处理信息包括如下信息至少之一：异常发现、可疑灶分布、可疑LN区属、可疑灶描述、可疑LN形态变化；

其中，所述关联性分析结果，包括如下信息至少之一：灶基因对癌侧中颈区落脚转移的内在决定性信息、腺体自身的健康状况判定信息，以及，颈淋巴结的声像失常与癌落脚转移间关系分析结果；其中，所述灶基因对癌侧中颈区落脚转移的内在决定性信息，包括如下信息至少之一：灶在腺叶内的相对位置、灶位置的理论权重、灶均径大小、灶均径理论权重、一侧叶内的灶个数、灶数目的理论权重、灶三要素的理论综合权重、侧中颈区癌落脚理论可能评估结果；其中，腺体自身的健康状况判定信息，包括如下信息至少之一：左右两侧的腺体质地性变化、变化类型、变化程度、伴随性异常、异常类型以及异常程度、背景病和类别代码；其中，颈淋巴结的声像失常与癌落脚转移间关系分析结果，包括如下信息至少之一：声像异常LN所在区属，以及各区属的失常归类、高可疑性转移相关失常、失常度、落脚转移可能性、异常描述和结声像学检查结论。

13.一种医疗数据处理装置，其特征在于，包括：

检验报告获取单元，用于获取与患者相关的检验报告；

源信息提取单元，用于对获取的所述检验报告进行处理，以从所述检验报告中提取出与所述患者所患疾病相关的源信息，其中，提取所述源信息的过程，包括：基于所述检验报告中的检查项目、所见结果和诊断结果对所述检验报告中的内容进行归类；以及，对归类后的所述检验报告中的内容进行疾病相关性分析，以从归类后的所述检验报告中提取出与所述患者所患疾病相关的源信息；

代码化单元，用于对获取的与患者相关的源信息进行代码化处理，以获得代码化后的源信息；以及

关联性分析单元，用于对所述源信息进行关联性分析，以获得关联性分析结果。

14.根据权利要求13所述的医疗数据处理装置，其中，所述源信息提取单元，还用于将经疾病相关性分析后获得的所述源信息中具有相同医学含义但不同描述形式的内容转化为标准描述，以获得标准化后的所述源信息。

15.一种电子设备，包括：

处理器；以及

存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-12中任一项所述的医疗数据处理方法。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序指令，当所述计算机程序指令被计算装置执行时，可操作来执行如权利要求1-12中任一项所述的医疗数据处理方法。