CN111339076A - 肾脏病理报告镜检数据处理方法、装置及相关设备 - Google Patents

肾脏病理报告镜检数据处理方法、装置及相关设备 Download PDF

Info

Publication number
CN111339076A
CN111339076A CN202010181654.4A CN202010181654A CN111339076A CN 111339076 A CN111339076 A CN 111339076A CN 202010181654 A CN202010181654 A CN 202010181654A CN 111339076 A CN111339076 A CN 111339076A
Authority
CN
China
Prior art keywords
data
description
report
medical entity
kidney
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010181654.4A
Other languages
English (en)
Inventor
黄晓彦
熊祖应
周越
侯霜
徐盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Basebit Shanghai Information Technology Co ltd
Peking University Shenzhen Hospital
Original Assignee
Basebit Shanghai Information Technology Co ltd
Peking University Shenzhen Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basebit Shanghai Information Technology Co ltd, Peking University Shenzhen Hospital filed Critical Basebit Shanghai Information Technology Co ltd
Priority to CN202010181654.4A priority Critical patent/CN111339076A/zh
Publication of CN111339076A publication Critical patent/CN111339076A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Landscapes

  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种肾脏病理报告镜检数据处理方法、装置及相关设备,其中,肾脏病理报告镜检数据处理方法,包括:获取原始数据,所述原始数据为肾脏病理报告中的镜检数据;利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据;按照语言逻辑将所述医学实体数据处理形成描述事件;依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据;根据所述规范化数据生成多列值报表。根据本发明实施例提供的肾脏病理报告镜检数据处理方法、装置及相关设备,可以实现肾脏病理报告镜检数据的清洗处理,效率高,有利于大批量数据的清洗处理,并且,形成的多列值报表便于科学研究。

Description

肾脏病理报告镜检数据处理方法、装置及相关设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种肾脏病理报告镜检数据处理方法、装置及相关设备。
背景技术
肾脏病理报告数据通常作为科学研究的重要素材。肾脏病理报告的镜检部分内容为自然语言文本,其涉及的内容范围较广,且随着诊疗技术的发展,新名词频频出现,因此如何有效地提取和规范描述成为相关医学科研中的重要问题,长期未能得到解决。
通过人工完成对肾脏病理报告的镜检部分内容数据的清洗可以达成很好的效果,但耗时长、效率低,无法应对大批量数据的任务,因此,有必要提供一种能够实现对肾脏病理报告的镜检部分内容进行清洗的方法。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的目的在于提出一种肾脏病理报告镜检数据处理方法、装置及相关设备。
为实现上述目的,第一方面,根据本发明实施例的肾脏病理报告镜检数据处理方法,包括:
获取原始数据,所述原始数据为肾脏病理报告中的镜检数据;
利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据;
按照语言逻辑将所述医学实体数据处理形成描述事件;
依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据;
根据所述规范化数据生成多列值报表。
根据本发明的一个实施例,所述按照语言逻辑将所述医学实体数据处理形成描述事件之前还包括:
利用肾脏病理知识库对医学实体数据做增强检测和修正。
根据本发明的一个实施例,所述按照语言逻辑将所述医学实体数据处理形成描述事件包括:
按照语言逻辑将所述医学实体数据组成语段;
对所述语段进行内容分析,并组装成描述事件,所述描述事件包含部位、病灶、指标及描述。
根据本发明的一个实施例,所述依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据包括:
获取肾脏病理学文献中的标准化描述,所述标准化描述至少包括专业指标及指标专业描述;
接受人工对所述标准化描述的错误修订并保存为标准化参考数据;
根据所述标准化参考数据对所述描述事件中的指标及指标描述进行规范化修正,以形成规范化数据。
根据本发明的一个实施例,所述根据所述规范化数据生成多列值报表包括:
解析自定义字典,并转换为数据映射规则,所述自定义字典指定了指标描述转化为取值的方式和流程;
依据所述数据映射规则,对所述规范化数据进行数据映射及缺省值补充,以生成多列值报表。
第二方面,根据本发明实施例的肾脏病理报告镜检数据处理装置,包括:
获取单元,用于获取原始数据,所述原始数据为肾脏病理报告中的镜检数据;
标注单元,用于利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据;
描述单元,用于按照语言逻辑将所述医学实体数据处理形成描述事件;
规范化处理单元,用于依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据;
生成单元,用于根据所述规范化数据生成多列值报表。
根据本发明的一个实施例,还包括:
修正单元,用于利用肾脏病理知识库对医学实体数据做增强检测和修正。
根据本发明的一个实施例,所述描述模块包括:
语段生成模块,用于按照语言逻辑将所述医学实体数据组成语段;
事件组装模块,用于对所述语段进行内容分析,并组装成描述事件,所述描述事件包含部位、病灶、指标及描述。
第三方面,根据本发明实施例的计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的肾脏病理报告镜检数据处理装置。
第四方面,根据本发明实施例的计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的肾脏病理报告镜检数据处理装置。
根据本发明实施例提供的肾脏病理报告镜检数据处理方法、装置及相关设备,利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据,并按照语言逻辑将所述医学实体数据处理形成描述事件,再依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据,最后根据所述规范化数据生成多列值报表,如此,可以实现肾脏病理报告镜检数据的清洗处理,效率高,有利于大批量数据的清洗处理,并且,形成的多列值报表便于科学研究。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明肾脏病理报告镜检数据处理方法一个实施例的流程图;
图2是本发明肾脏病理报告镜检数据处理方法另一个实施例的流程图;
图3是本发明肾脏病理报告镜检数据处理方法又一个实施例的流程图;
图4是本发明肾脏病理报告镜检数据处理方法又一个实施例的流程图;
图5是本发明肾脏病理报告镜检数据处理方法又一个实施例的流程图;
图6是本发明肾脏病理报告镜检数据处理装置一个实施例的结构示意图;
图7是本发明肾脏病理报告镜检数据处理装置又一个实施例的结构示意图;
图8是本发明肾脏病理报告镜检数据处理装置中描述单元的结构示意图;
图9是本发明肾脏病理报告镜检数据处理装置中规范化处理单元的结构示意图;
图10是本发明肾脏病理报告镜检数据处理装置中生成单元的结构示意图;
图11是本发明计算机设备一个实施例的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
参照图1所示,图1示出了本发明实施例提供的肾脏病理报告镜检数据处理方法一个实施例的流程图,为了便于描述,仅示出了与本发明实施例相关的部分。具体的,该肾脏病理报告镜检数据处理方法包括:
S101、获取原始数据,所述原始数据为肾脏病理报告中的镜检数据。该原始数据一般来自HIS系统中肾脏病理报告中的镜检数据。
S102、利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据。
具体的,预先建立基于深度学习的肾脏病理医学实体标注模型,在获取原始数据之后,可以利用该肾脏病理医学实体标注模型对原始数据中的医学实体数据进行标注,进而提取原始数据中的医学实体数据。利用基于深度学习的肾脏病理医学实体标注模型实现医学实体数据,相比于传统分词提取方式,其泛化能力更强。
S103、按照语言逻辑将所述医学实体数据处理形成描述事件。
也就是说,利用标注的医学实体数据组装成描述事件,较佳的,描述事件为细粒度的描述事件,细粒度的意义在于可以保留完整的原始内容,有利于科研分析的各种应用场景。
S104、依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据。
由于目前大部分医院中,其肾脏病理报告中镜检部分内容为自然语言文本,医生按照自己的撰写习惯书写,其书写的镜检部分内容并不规范,可能不符合肾脏病理学的标准化描述,在这些数据纳入科研范围后,如果直接对这些数据进行分析研究,对于科研人员来说并不方便,所以,该步骤S104中,利用肾脏病理学的标准化描述方式,对描述事件进行规范化描述,使得描述事件的描述符合肾脏病理学的标准化描述,形成规范化数据,进而方便后续的科学研究。
S105、根据所述规范化数据生成多列值报表。
由于这些数据的数据量大,且来自不同的临床对象,所以,为了便于在后续科研中有序查看这些数据,该步骤S105可以将规范化数据进行处理,生成多列值报表,也即是,以列表方式展示这些数据。
根据本发明实施例提供的肾脏病理报告镜检数据处理方法,利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据,并按照语言逻辑将所述医学实体数据处理形成描述事件,再依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据,最后根据所述规范化数据生成多列值报表,如此,可以实现肾脏病理报告镜检数据的清洗处理,效率高,有利于大批量数据的清洗处理,并且,形成的多列值报表便于科学研究。
参照图2所示,在本发明的一个实施例中,步骤S103之前还包括:
S201、利用肾脏病理知识库对医学实体数据做增强检测和修正。
也就是说,在对医学实体数据处理为描述事件之前,可以先引入肾脏病理知识库中的知识对医学实体数据进行增强检测和修正,确保原始数据中的医学实体数据能够更全更准确地被提取出来,提高肾脏病理医学实体标注模型的准确率。
参照图3所示,在本发明的一个实施例中,步骤S103包括:
S301、按照语言逻辑将所述医学实体数据组成语段。
S302、对所述语段进行内容分析,并组装成描述事件,所述描述事件包含部位、病灶、指标及描述。
也就是说,先按照语言逻辑(例如中文逻辑)将医学实体数据进行组装,形成语段,再对语段进行分析,分析语段之间的语义关联性,将相关联的语段组装成描述事件,如此,可以确保描述事件更加的准确可靠。
参照图4所示,在本发明的一个实施例中,步骤S104包括:
S401、获取肾脏病理学文献中的标准化描述,所述标准化描述至少包括专业指标及指标专业描述。
S402、接受人工对所述标准化描述的错误修订并保存为标准化参考数据。
S403、根据所述标准化参考数据对所述描述事件中的指标及指标描述进行规范化修正,以形成规范化数据。
具体地,可以通过阅读肾脏病理文献,从肾脏病理文献中获取标准化描述,例如专业指标、专业描述文字和符号。由于获取的标准化描述可能存在错误,可以通过该领域专家对获取的标准化描述中存在的错误进行修正,以及按照标准的术语进一步规范,形成标准化参考数据,该标准化参考数据可以作为知识库。接着可以根据标准化参考数据对所述描述事件中的指标及指标描述等进行规范化修正,以形成规范化数据,例如,将标准化参考数据中的专业指标、指标专业描述、符号等与描述事件中的指标及指标描述进行相似匹配,匹配成功后,利用该指标专业描述对该指标进行规范描述,进而完成规范化处理。
本实施例中,依据专家修正后的标准化参考数据对描述事件进行规范化处理,可以使得得到的规范化数据符合肾脏病理学业内的专业描述,进而方便后续科研人员的研读分析。
参照图5所示,在本发明的一个实施例中,步骤S105包括:
S501、解析自定义字典,并转换为数据映射规则,所述自定义字典指定了指标描述转化为取值的方式和流程。
S502、依据所述数据映射规则,对所述规范化数据进行数据映射及缺省值补充,以生成多列值报表。
具体地,可以预先建立自定义字典,该自定义字典,指定了指标描述、符号转化为特定取值的方式和流程。在本发明的方法中,在得到规范化数据之后,可以解析自定义字典得到数据映射规则,再利用该数据映射规则,对规范化数据进行数据映射及缺省补充,使得各个指标对应的指标描述被赋值,最后,将这些数据生成多列值报表。
本实施例中,通过对指标描述等进行数据映射,使得各个指标描述能够对应一个特定的值,进而便于生成多列值报表。
参照图6所示,图6示出了本发明实施例提供的肾脏病理报告镜检数据处理装置一个实施例的结构示意图,为了便于描述,仅示出了与本发明实施例相关的部分。具体的,该肾脏病理报告镜检数据处理装置,包括:
获取单元601,用于获取原始数据,所述原始数据为肾脏病理报告中的镜检数据。
标注单元602,用于利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据。
描述单元603,用于按照语言逻辑将所述医学实体数据处理形成描述事件。
规范化处理单元604,用于依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据。
生成单元605,用于根据所述规范化数据生成多列值报表。
参照图7所示,在本发明的一个实施例中,还包括:
修正单元701,用于利用肾脏病理知识库对医学实体数据做增强检测和修正。
参照图8所示,在本发明的一个实施例中,所述描述单元603包括:
语段生成模块801,用于按照语言逻辑将所述医学实体数据组成语段;
事件组装模块802,用于对所述语段进行内容分析,并组装成描述事件,所述描述事件包含部位、病灶、指标及描述。
参照图9所示,在本发明的一个实施例中,所述规范化处理单元604包括:
获取模块901,用于获取肾脏病理学文献中的标准化描述,所述标准化描述至少包括专业指标及指标专业描述;
修订模块902,用于接受人工对所述标准化描述的错误修订并保存为标准化参考数据;
规范处理模块903,用于根据所述标准化参考数据对所述描述事件中的指标及指标描述进行规范化修正,以形成规范化数据。
参照图10所示,在本发明的一个实施例中,所述生成单元605包括:
解析模块1001,用于解析自定义字典,并转换为数据映射规则,所述自定义字典指定了指标描述转化为取值的方式和流程;
生成模块1002,用于依据所述数据映射规则,对所述规范化数据进行数据映射及缺省值补充,以生成多列值报表。
根据本发明实施例提供的肾脏病理报告镜检数据处理装置,利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据,并按照语言逻辑将所述医学实体数据处理形成描述事件,再依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据,最后根据所述规范化数据生成多列值报表,如此,可以实现肾脏病理报告镜检数据的清洗处理,效率高,有利于大批量数据的清洗处理,并且,形成的多列值报表便于科学研究。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置或系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图11所示,图11示出了本发明实施例提供的计算机设备100实施例的结构示意图,为了便于描述,仅示出了与本发明实施例相关的部分。具体的,该计算机设备100包括存储器102、处理器101以及存储在所述存储器102中并可在所述处理器101上运行的计算机程序1021,所述处理器101执行所述计算机程序时实现如上述实施例所述方法的步骤,例如图1所示的S101至S105的步骤。或者,所述处理器101执行所述计算机程序时实现上述实施例所述装置中的各模块/单元的功能,例如图6所示单元601至605的功能。
示例性的,所述计算机程序1021可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器102中,并由所述处理器101执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述计算机设备中的执行过程。
所述计算机设备100可包括,但不仅限于处理器101、存储器102。本领域技术人员可以理解,图仅仅是计算机设备的示例,并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器101可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立预设硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器102可以是所述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。所述存储器也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器还可以既包括所述计算机设备的内部存储单元也包括外部存储设备。所述存储器用于存储所述计算机程序以及所述计算机设备所需的其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器101执行时实现如上述实施例中所述方法中的步骤,例如图1所示的步骤S101至步骤S105。或者,所述计算机程序被处理器101执行时实现上述实施例中所述装置中的各模块/单元的功能,例如图6所示的模块501至505的功能。
所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器101执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例系统中的模块或单元可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子预设硬件、或者计算机软件和电子预设硬件的结合来实现。这些功能究竟以预设硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种肾脏病理报告镜检数据处理方法,其特征在于,包括:
获取原始数据,所述原始数据为肾脏病理报告中的镜检数据;
利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据;
按照语言逻辑将所述医学实体数据处理形成描述事件;
依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据;
根据所述规范化数据生成多列值报表。
2.根据权利要求1所述的肾脏病理报告镜检数据处理方法,其特征在于,所述按照语言逻辑将所述医学实体数据处理形成描述事件之前还包括:
利用肾脏病理知识库对医学实体数据做增强检测和修正。
3.根据权利要求2所述的肾脏病理报告镜检数据处理方法,其特征在于,所述按照语言逻辑将所述医学实体数据处理形成描述事件包括:
按照语言逻辑将所述医学实体数据组成语段;
对所述语段进行内容分析,并组装成描述事件,所述描述事件包含部位、病灶、指标及描述。
4.根据权利要求3所述的肾脏病理报告镜检数据处理方法,其特征在于,所述依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据包括:
获取肾脏病理学文献中的标准化描述,所述标准化描述至少包括专业指标及指标专业描述;
接受人工对所述标准化描述的错误修订并保存为标准化参考数据;
根据所述标准化参考数据对所述描述事件中的指标及指标描述进行规范化修正,以形成规范化数据。
5.根据权利要求1所述的肾脏病理报告镜检数据处理方法,其特征在于,所述根据所述规范化数据生成多列值报表包括:
解析自定义字典,并转换为数据映射规则,所述自定义字典指定了指标描述转化为取值的方式和流程;
依据所述数据映射规则,对所述规范化数据进行数据映射及缺省值补充,以生成多列值报表。
6.一种肾脏病理报告镜检数据处理装置,其特征在于,包括:
获取单元,用于获取原始数据,所述原始数据为肾脏病理报告中的镜检数据;
标注单元,用于利用肾脏病理医学实体标注模型标注出原始数据中的医学实体数据;
描述单元,用于按照语言逻辑将所述医学实体数据处理形成描述事件;
规范化处理单元,用于依据肾脏病理学的标准化描述对所述描述事件进行规范化处理以形成规范化数据;
生成单元,用于根据所述规范化数据生成多列值报表。
7.根据权利要求6所述的肾脏病理报告镜检数据处理装置,其特征在于,还包括:
修正单元,用于利用肾脏病理知识库对医学实体数据做增强检测和修正。
8.根据权利要求7所述的肾脏病理报告镜检数据处理装置,其特征在于,所述描述模块包括:
语段生成模块,用于按照语言逻辑将所述医学实体数据组成语段;
事件组装模块,用于对所述语段进行内容分析,并组装成描述事件,所述描述事件包含部位、病灶、指标及描述。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任意一项所述的肾脏病理报告镜检数据处理方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5任意一项所述的肾脏病理报告镜检数据处理方法。
CN202010181654.4A 2020-03-16 2020-03-16 肾脏病理报告镜检数据处理方法、装置及相关设备 Pending CN111339076A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010181654.4A CN111339076A (zh) 2020-03-16 2020-03-16 肾脏病理报告镜检数据处理方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010181654.4A CN111339076A (zh) 2020-03-16 2020-03-16 肾脏病理报告镜检数据处理方法、装置及相关设备

Publications (1)

Publication Number Publication Date
CN111339076A true CN111339076A (zh) 2020-06-26

Family

ID=71184142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010181654.4A Pending CN111339076A (zh) 2020-03-16 2020-03-16 肾脏病理报告镜检数据处理方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN111339076A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112185520A (zh) * 2020-09-27 2021-01-05 志诺维思(北京)基因科技有限公司 一种医疗病理报告图片的文本结构化处理系统和方法
CN112699669A (zh) * 2020-12-29 2021-04-23 医渡云(北京)技术有限公司 流性病学调查报告的自然语言处理、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319605A (zh) * 2017-01-16 2018-07-24 医渡云(北京)技术有限公司 医学检查数据的结构化处理方法及系统
CN109583440A (zh) * 2017-09-28 2019-04-05 北京西格码列顿信息技术有限公司 结合影像识别与报告编辑的医学影像辅助诊断方法及系统
CN109887577A (zh) * 2017-11-06 2019-06-14 北京昆仑医云科技有限公司 用于基于患者的医学图像生成报告的系统、方法和介质
CN110223742A (zh) * 2019-06-14 2019-09-10 中南大学 中文电子病历数据的临床表现信息抽取方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319605A (zh) * 2017-01-16 2018-07-24 医渡云(北京)技术有限公司 医学检查数据的结构化处理方法及系统
CN109583440A (zh) * 2017-09-28 2019-04-05 北京西格码列顿信息技术有限公司 结合影像识别与报告编辑的医学影像辅助诊断方法及系统
CN109887577A (zh) * 2017-11-06 2019-06-14 北京昆仑医云科技有限公司 用于基于患者的医学图像生成报告的系统、方法和介质
CN110223742A (zh) * 2019-06-14 2019-09-10 中南大学 中文电子病历数据的临床表现信息抽取方法和设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112185520A (zh) * 2020-09-27 2021-01-05 志诺维思(北京)基因科技有限公司 一种医疗病理报告图片的文本结构化处理系统和方法
CN112185520B (zh) * 2020-09-27 2024-06-07 志诺维思(北京)基因科技有限公司 一种医疗病理报告图片的文本结构化处理系统和方法
CN112699669A (zh) * 2020-12-29 2021-04-23 医渡云(北京)技术有限公司 流性病学调查报告的自然语言处理、装置及存储介质
CN112699669B (zh) * 2020-12-29 2022-11-11 医渡云(北京)技术有限公司 流行病学调查报告的自然语言处理方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN109117479B (zh) 一种金融文档智能核查方法、装置及存储介质
US20200257659A1 (en) Method and apparatus for determing description information, electronic device and computer storage medium
US8935155B2 (en) Method for processing medical reports
CN111144210B (zh) 图像的结构化处理方法及装置、存储介质及电子设备
CN110737689B (zh) 数据标准符合性检测方法、装置、系统及存储介质
CN113963770A (zh) 报告文件生成方法、装置、计算机设备及其存储介质
CN111339076A (zh) 肾脏病理报告镜检数据处理方法、装置及相关设备
CN113421657B (zh) 临床实践指南的知识表示模型的构建方法及装置
De la Hoz-M et al. LDAShiny: An R package for exploratory review of scientific literature based on a Bayesian probabilistic model and machine learning tools
US20210365487A1 (en) Word Library Management Method and Apparatus for input Method
KR20220058259A (ko) 논문의 메타데이터 추출 방법 및 장치
CN112883194B (zh) 一种症状信息抽取方法、装置、设备及存储介质
CN112614562B (zh) 基于电子病历的模型训练方法、装置、设备及存储介质
CN108008947B (zh) 一种编程语句的智能提示方法、装置、服务器及存储介质
CN117540757A (zh) 用于自动翻译的方法、电子设备及计算机可读存储介质
CN113111660A (zh) 数据处理方法、装置、设备和存储介质
CN111142871B (zh) 一种前端页面开发系统、方法、设备、介质
CN117010362A (zh) 病历书写方法、系统、终端及存储介质
CN110704635B (zh) 一种知识图谱中三元组数据的转换方法及装置
Böschen Software review: The JATSdecoder package—extract metadata, abstract and sectioned text from NISO-JATS coded XML documents; Insights to PubMed central’s open access database
CN111400296A (zh) 肾脏病理免疫荧光数据处理方法、装置及相关设备
CN115759040A (zh) 一种电子病历解析方法、装置、设备和存储介质
US20140304304A1 (en) Modularizing complex xml data for generation and extraction
CN114817131A (zh) 一种优化问题描述文件处理方法、系统、设备及存储介质
CN114974554A (zh) 融合图谱知识强化病历特征的方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination