CN113449492B - 将后处理生成的word数据转换成结构化数据的方法及系统 - Google Patents

将后处理生成的word数据转换成结构化数据的方法及系统 Download PDF

Info

Publication number
CN113449492B
CN113449492B CN202110615545.3A CN202110615545A CN113449492B CN 113449492 B CN113449492 B CN 113449492B CN 202110615545 A CN202110615545 A CN 202110615545A CN 113449492 B CN113449492 B CN 113449492B
Authority
CN
China
Prior art keywords
data
structured
module
post
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110615545.3A
Other languages
English (en)
Other versions
CN113449492A (zh
Inventor
杨旗
谢辉辉
贾秀琴
岳新
张虽虽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Smarttree Medical Technology Co Ltd
Original Assignee
Beijing Smarttree Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Smarttree Medical Technology Co Ltd filed Critical Beijing Smarttree Medical Technology Co Ltd
Priority to CN202110615545.3A priority Critical patent/CN113449492B/zh
Publication of CN113449492A publication Critical patent/CN113449492A/zh
Application granted granted Critical
Publication of CN113449492B publication Critical patent/CN113449492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种将后处理生成的word数据转换成结构化数据的方法,包括定时扫描后处理生成的word文件目录,将新word数据发送给解析模块;基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和病灶数据中的关键字,生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据;对每个病灶结构化数据进行标签化和编码化;当医生编辑结构化报告时,提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。本发明还公开了一种将后处理生成的word数据转换成结构化数据的系统。本发明能将影像后处理生成的word数据整合到结构化报告系统中,便于撰写报告及后期数据分析和科研教学。

Description

将后处理生成的word数据转换成结构化数据的方法及系统
技术领域
本发明涉及医疗信息领域,更具体地,涉及一种将后处理生成的word数据转换成结构化数据的方法及系统。
背景技术
针对一些影像的后处理软件,可在该软件中对检查的医学影像进行自动或者手工测量分析,测量分析结果并生成测量值表格数据及关键图像,后处理软件可以将结果生成一个Word格式的文档。
但医疗机构使用该软件面临的问题:生成的Word格式报告,一般HIS/EMR系统不支持该格式数据直接发布到临床;生成的测量数据没有结构标签化,不便于后期做数据分析和科研。
发明内容
有鉴于此,本发明的主要目的在于提供一种将后处理生成的word数据转换成结构化数据的方法及系统,能够解决现有技术中存在的不能将后处理软件生成的处理结果直接发送到临床、生成的文档不利于后期的数据分析和科研教学的问题。
为达到上述目的,本发明的技术方案是这样实现的:
一方面,本发明提供了一种将后处理生成的word数据转换成结构化数据的方法,包括基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将新word数据发送给解析模块;基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,调用相关函数,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据;其中,结构化数据分为患者基本信息结构化数据和病灶结构化数据;对每个病灶结构化数据进行标签化和编码化;当医生编辑结构化报告时,自动提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。
优选地,该方法还包括:预设的解析规则是基于新word数据中每个table类型来设置。
优选地,该方法还包括:预设的配置规则是基于结构化报告类型来设置。
优选地,该方法还包括:对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储。
优选地,该方法还包括:判断解析后的新word数据是否解析成功,将解析成功的新word数据和解析失败的新word数据进行单独存储。
另一方面,本发明还提供了一种将后处理生成的word数据转换成结构化数据的系统,包括:扫描模块、解析模块、数据转换模块、设置模块和提取模块,其中,扫描模块,与解析模块相连,用于基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将新word数据发送给解析模块;解析模块,分别与扫描模块和数据转换模块相连,用于基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;数据转换模块,分别与解析模块和设置模块相连,用于根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,调用相关函数,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据;其中,结构化数据分为患者基本信息结构化数据和病灶结构化数据;设置模块,分别与数据转换模块和提取模块相连,用于对每个病灶结构化数据进行标签化和编码化;提取模块,与设置模块相连,用于当医生编辑结构化报告时,自动提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。
优选地,该系统还包括:第一定义模块,与解析模块相连,用于基于新word数据中每个table类型设置预设的配置规则。
优选地,该系统还包括:第二定义模块,与数据转换模块相连,用于基于结构化报告类型设置预设的配置规则。
优选地,设置模块还包括存储单元,用于对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储。
优选地,解析模块还包括判断单元,用于判断解析后的新word数据是否解析成功,将解析成功的新word数据和解析失败的新word数据进行单独存储。
本发明的技术效果:
1.本发明的方法可以定时扫描医学影像后处理软件生成的word文件目录,当有新的word数据产生时,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据,并对结构化数据设置标签和编码,医生在编辑结构化报告时,可以自动提取该影像后处理软件生成的测量值等数据;本发明的方法可以将影像后处理软件生成的word数据整合到结构化报告系统中,可以将测量数据直接发布到临床,由于转换后的数据已经设置标签和编码,便于后期的统计分析和临床科研的使用;
2.本发明还可以对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储,便于不同的第三方系统对数据的提取和使用,支持HIS/EMR系统将该后处理软件生成的数据发布的临床;
3.本发明还可以判断解析后的新word数据是否成功,显示解析成功和解析失败的目录,以便于管理员及时处理解析失败的数据。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法流程图;
图2示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中接收到后处理软件生成的word数据界面示意图;
图3示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中基于新word数据中每个table类型设置预设的解析规则界面示意图;
图4示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中配置规则界面示意图;
图5示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中根据预设的配置规则生成结构化数据界面示意图;
图6示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据界面示意图;
图7示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据(关键图像)一一填入到结构化报告界面示意图;
图8示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据(测量值)一一填入到结构化报告界面示意图;
图9示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统结构示意图;
图10示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中接收到后处理软件生成的word数据界面示意图;
图11示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中根据预设的配置规则生成结构化数据界面示意图;
图12示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据界面示意图;
图13示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据(关键图像)一一填入到结构化报告界面示意图;
图14示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据(测量值)一一填入到结构化报告界面示意图;
图15示出了根据本发明实施例三的将后处理生成的word数据转换成结构化数据的系统结构示意图;
图16示出了根据本发明实施例三的将后处理生成的word数据转换成结构化数据的系统中基于新word数据中每个table类型设置预设的解析规则界面示意图;
图17示出了根据本发明实施例四的将后处理生成的word数据转换成结构化数据的系统结构示意图;
图18示出了根据本发明实施例四的将后处理生成的word数据转换成结构化数据的系统中配置规则界面示意图;
图19示出了根据本发明实施例五的将后处理生成的word数据转换成结构化数据的系统结构示意图;
图20示出了根据本发明实施例六的将后处理生成的word数据转换成结构化数据的系统结构示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
实施例一
图1示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法流程图,如图1所示,该方法包括以下步骤:
本发明主要构建一种将医学影像处理软件生成的word文档数据整合到结构化报告系统中的方法,该方法主要对word文档数据进行分析解析、对转换后的结构化数据进行标签化、编码化,整合到结构化报告系统中,结构化报告系统可以完成报告的书写、发布,对标签化、编码化的数据,后期可用于统计分析和临床科研。
步骤S101,基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将新word数据发送给解析模块;
其中,预设的时间可以依据医疗机构的需求,比如每分钟扫描一次。
后处理软件生成的word文档一般放在后处理系统的固定目录下,可以通过一个服务程序定时扫描该固定目录,查找是否有新word数据生成。
图2示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中接收到后处理软件生成的word数据界面示意图;如图2所示,在该word文档中显示有不同的表格,主要内容包括患者的基本信息、检查信息、测量表格数据和关键图像数据。
步骤S102,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;
其中,预设的解析规则是基于新word数据中每个table类型来设置。
对于word文档中数据的读取,采用MS Office提供的COM+接口方案进行读取。
图3示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中基于新word数据中每个table类型设置预设的解析规则界面示意图;如图3所示,对不同的table类型来设置解析规则,比如对序列的描述、关键图像的描述等。
步骤S103,根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,调用相关函数(dll函数),基于关键字生成与结构化报告格式相匹配的数据(中间变量),将与结构化报告格式相匹配的数据定义为结构化数据;其中,结构化数据分为患者基本信息结构化数据和病灶结构化数据;
图4示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中配置规则界面示意图;如图4所示,配置规则的设置,从word文档数据与结构化报告每个控件的对应,对高分辨磁共振血管成像的分析报告,规则1,层面是否连续;规则2,管腔面积/管壁面积等等。
图5示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中根据预设的配置规则生成结构化数据界面示意图;如图5所示,与结构化报告格式相匹配的中间变量。
步骤S104,对每个病灶结构化数据进行标签化和编码化;
图6示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据界面示意图;如图6所示,对每个病灶病结构化数据设置编码,编码使用radlex编码。
步骤S105,当医生编辑结构化报告时,自动提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。
图7示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据(关键图像)一一填入到结构化报告界面示意图;图8示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据(测量值)一一填入到结构化报告界面示意图;如图7、图8所示,将后处理生成的数据与结构化报告的标签一一对应填写到报告中,包括病灶的测量值和关键图像。
其中,该方法还包括:预设的配置规则是基于结构化报告类型来设置。
根据结构化报告的类型,比如肺结节的报告。
其中,该方法还包括:对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储。
其中,患者基本信息结构化数据存储于RIS系统,标签化和编码化的病灶结构化数据存储到结构化报告系统中,以便后期单独调用。
其中,该方法还包括:判断解析后的新word数据是否解析成功,将解析成功的新word数据和解析失败的新word数据进行单独存储。
本发明实施例可以定时扫描医学影像后处理软件生成的word文件目录,当有新的word数据产生时,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据,并对结构化数据设置标签和编码,医生在编辑结构化报告时,可以自动提取该影像后处理软件生成的测量值等数据;本发明的实施例可以将影像后处理软件生成的word数据整合到结构化报告系统中,可以将测量数据直接发布到临床,由于转换后的数据已经设置标签和编码,便于后期的统计分析和临床科研的使用;本发明的实施例还可以对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储,便于不同的第三方系统对数据的提取和使用,支持HIS/EMR系统将该后处理软件生成的数据发布的临床;本发明的实施例还可以判断解析后的新word数据是否成功,显示解析成功和解析失败的目录,以便于管理员及时处理解析失败的数据。
实施例二
图9示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统结构示意图,如图9所示,该系统包括:扫描模块10、解析模块20、数据转换模块30、设置模块40和提取模块50,其中,
扫描模块10,与解析模块20相连,用于于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将新word数据发送给解析模块20;
其中,预设的时间可以依据医疗机构的需求,比如每分钟扫描一次。
后处理软件生成的word文档一般放在后处理系统的固定目录下,可以通过一个服务程序定时扫描该固定目录,查找是否有新word数据生成。
图10示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中接收到后处理软件生成的word数据界面示意图;如图10所示,在该word文档中显示有不同的表格,主要内容包括患者的基本信息、检查信息、测量表格数据和关键图像数据。
解析模块20,分别与扫描模块10和数据转换模块30相连,用于基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;
对于word文档中数据的读取,采用MS Office提供的COM+接口方案进行读取。
数据转换模块30,分别与解析模块20和设置模块40相连,用于根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,调用相关函数(dll函数),基于关键字生成与结构化报告格式相匹配的数据(中间变量),将与结构化报告格式相匹配的数据定义为结构化数据;
其中,结构化数据分为患者基本信息结构化数据和病灶结构化数据;
图11示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中根据预设的配置规则生成结构化数据界面示意图;如图11所示,与结构化报告格式相匹配的中间变量。
设置模块40,分别与数据转换模块30和提取模块50相连,用于对每个病灶结构化数据进行标签化和编码化;
图12示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据界面示意图;如图12所示,对每个病灶病结构化数据设置编码,编码使用radlex编码。
提取模块50,与设置模块40相连,用于当医生编辑结构化报告时,自动提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。
图13示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据(关键图像)一一填入到结构化报告界面示意图;图14示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据(测量值)一一填入到结构化报告界面示意图;如图13、图14所示,将后处理生成的数据与结构化报告的标签一一对应填写到报告中,包括病灶的测量值和关键图像。
本发明实施例设置了扫描模块、解析模块、数据转换模块、设置模块和提取模块,可以定时扫描医学影像后处理软件生成的word文件目录,当有新的word数据产生时,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据,并对结构化数据设置标签和编码,医生在编辑结构化报告时,可以自动提取该影像后处理软件生成的测量值等数据;本发明的实施例可以将影像后处理软件生成的word数据整合到结构化报告系统中,可以将测量数据直接发布到临床,由于转换后的数据已经设置标签和编码,便于后期的统计分析和临床科研的使用。
实施例三
图15示出了根据本发明实施例三的将后处理生成的word数据转换成结构化数据的系统结构示意图;如图15所示,该系统还包括:第一定义模块60,与解析模块20相连,用于基于新word数据中每个table类型设置预设的配置规则。
图16示出了根据本发明实施例三的将后处理生成的word数据转换成结构化数据的系统中基于新word数据中每个table类型设置预设的解析规则界面示意图;如图16所示,对不同的table类型来设置解析规则,比如对序列的描述、关键图像的描述等。
实施例四
图17示出了根据本发明实施例四的将后处理生成的word数据转换成结构化数据的系统结构示意图;如图17所示,该系统还包括:第二定义模块70,与数据转换模块30相连,用于基于结构化报告类型设置预设的配置规则。
根据结构化报告的类型,比如肺结节的报告。
图18示出了根据本发明实施例四的将后处理生成的word数据转换成结构化数据的系统中配置规则界面示意图;如图18所示,配置规则的设置,从word文档数据与结构化报告每个控件的对应,对高分辨磁共振血管成像的分析报告,规则1,层面是否连续;规则2,管腔面积/管壁面积等等。
实施例五
图19示出了根据本发明实施例五的将后处理生成的word数据转换成结构化数据的系统结构示意图;如图19所示,设置模块40还包括存储单元402,用于对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储。
其中,患者基本信息结构化数据存储于RIS系统,标签化和编码化的病灶结构化数据存储到结构化报告系统中,以便后期单独调用。
本发明实施例中的存储单元,可以对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储,便于不同的第三方系统对数据的提取和使用,支持HIS/EMR系统将该后处理软件生成的数据发布的临床。
实施例六
图20示出了根据本发明实施例六的将后处理生成的word数据转换成结构化数据的系统结构示意图,如图20所示,解析模块20还包括判断单元202,用于判断解析后的新word数据是否解析成功,将解析成功的新word数据和解析失败的新word数据进行单独存储。
本发明实施例中的判断单元,可以判断解析后的新word数据是否成功,显示解析成功和解析失败的目录,以便于管理员及时处理解析失败的数据。
从以上描述中,可以看出,本发明的上述实施例实现了如下技术效果:本发明可以定时扫描医学影像后处理软件生成的word文件目录,当有新的word数据产生时,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据,并对结构化数据设置标签和编码,医生在编辑结构化报告时,可以自动提取该影像后处理软件生成的测量值等数据;本发明的实施例可以将影像后处理软件生成的word数据整合到结构化报告系统中,可以将测量数据直接发布到临床,由于转换后的数据已经设置标签和编码,便于后期的统计分析和临床科研的使用;本发明的实施例还可以对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储,便于不同的第三方系统对数据的提取和使用,支持HIS/EMR系统将该后处理软件生成的数据发布的临床;本发明的实施例还可以判断解析后的新word数据是否成功,显示解析成功和解析失败的目录,以便于管理员及时处理解析失败的数据。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种将后处理生成的word数据转换成结构化数据的方法,其特征在于,包括:
基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将所述新word数据发送给解析模块;
基于预设的解析规则,将所述新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;其中,所述预设的解析规则是基于所述新word数据中每个table类型来设置;其中,所述XML格式的病灶数据包括检查信息、测量表格数据、关键图像数据;
根据预设的配置规则,提取所述XML格式的患者基本信息和所述XML格式的病灶数据中的关键字,调用相关函数,基于所述关键字生成与结构化报告格式相匹配的数据,将所述与结构化报告格式相匹配的数据定义为结构化数据;其中,所述结构化数据分为患者基本信息结构化数据和病灶结构化数据;其中,所述预设的配置规则是基于所述结构化报告类型来设置;配置规则的设置,是将新word数据与结构化报告每个控件进行对应;
对每个所述病灶结构化数据进行标签化和编码化;
当医生编辑所述结构化报告时,自动提取所述患者基本信息结构化数据、标签化和编码化的所述病灶结构化数据。
2.根据权利要求1所述的将后处理生成的word数据转换成结构化数据的方法,其特征在于,该方法还包括:对所述患者基本信息结构化数据、所述标签化和编码化的病灶结构化数据进行单独存储。
3.根据权利要求1所述的将后处理生成的word数据转换成结构化数据的方法,其特征在于,该方法还包括:判断解析后的所述新word数据是否解析成功,将解析成功的所述新word数据和解析失败的所述新word数据进行单独存储。
4.一种将后处理生成的word数据转换成结构化数据的系统,其特征在于,该系统包括:扫描模块、解析模块、数据转换模块、设置模块和提取模块,其中,
所述扫描模块,与所述解析模块相连,用于基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将所述新word数据发送给所述解析模块;
所述解析模块,分别与所述扫描模块和所述数据转换模块相连,用于基于预设的解析规则,将所述新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;其中,该系统还包括:第一定义模块,与所述解析模块相连,用于基于所述新word数据中每个table类型设置所述预设的配置规则;其中,所述XML格式的病灶数据包括检查信息、测量表格数据、关键图像数据;
所述数据转换模块,分别与所述解析模块和所述设置模块相连,用于根据预设的配置规则,提取所述XML格式的患者基本信息和所述XML格式的病灶数据中的关键字,调用相关函数,基于所述关键字生成与结构化报告格式相匹配的数据,将所述与结构化报告格式相匹配的数据定义为结构化数据;其中,所述结构化数据分为患者基本信息结构化数据和病灶结构化数据;其中,该系统还包括:第二定义模块,与所述数据转换模块相连,用于基于所述结构化报告类型设置所述预设的配置规则;配置规则的设置,是将新word数据与结构化报告每个控件进行对应;
所述设置模块,分别与所述数据转换模块和所述提取模块相连,用于对每个所述病灶结构化数据进行标签化和编码化;
所述提取模块,与所述设置模块相连,用于当医生编辑所述结构化报告时,自动提取所述患者基本信息结构化数据、标签化和编码化的所述病灶结构化数据。
5.根据权利要求4所述的将后处理生成的word数据转换成结构化数据的系统,其特征在于,所述设置模块还包括存储单元,用于对所述患者基本信息结构化数据、所述标签化和编码化的病灶结构化数据进行单独存储。
6.根据权利要求4所述的将后处理生成的word数据转换成结构化数据的系统,其特征在于,所述解析模块还包括判断单元,用于判断解析后的所述新word数据是否解析成功,将解析成功的所述新word数据和解析失败的所述新word数据进行单独存储。
CN202110615545.3A 2021-06-02 2021-06-02 将后处理生成的word数据转换成结构化数据的方法及系统 Active CN113449492B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110615545.3A CN113449492B (zh) 2021-06-02 2021-06-02 将后处理生成的word数据转换成结构化数据的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110615545.3A CN113449492B (zh) 2021-06-02 2021-06-02 将后处理生成的word数据转换成结构化数据的方法及系统

Publications (2)

Publication Number Publication Date
CN113449492A CN113449492A (zh) 2021-09-28
CN113449492B true CN113449492B (zh) 2024-04-19

Family

ID=77810804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110615545.3A Active CN113449492B (zh) 2021-06-02 2021-06-02 将后处理生成的word数据转换成结构化数据的方法及系统

Country Status (1)

Country Link
CN (1) CN113449492B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010217972A (ja) * 2009-03-13 2010-09-30 Toshiba Corp 構造化文書生成装置及び構造化文書生成プログラム
CN110931095A (zh) * 2018-09-19 2020-03-27 北京赛迈特锐医疗科技有限公司 基于dicom图像标注与结构化报告关联的系统及方法
CN111161822A (zh) * 2018-11-08 2020-05-15 北京赛迈特锐医疗科技有限公司 医学影像人工智能诊断数据管理系统及其管理方法
CN112420147A (zh) * 2020-11-18 2021-02-26 孙应实 影像ai结果与结构化报告桌面实时通讯的系统及方法
CN112541066A (zh) * 2020-12-11 2021-03-23 清华大学 基于文本结构化的医技报告检测方法及相关设备
CN112562817A (zh) * 2020-12-02 2021-03-26 薛蕴菁 将影像结构化报告的标签反馈给影像ai的系统及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010217972A (ja) * 2009-03-13 2010-09-30 Toshiba Corp 構造化文書生成装置及び構造化文書生成プログラム
CN110931095A (zh) * 2018-09-19 2020-03-27 北京赛迈特锐医疗科技有限公司 基于dicom图像标注与结构化报告关联的系统及方法
CN111161822A (zh) * 2018-11-08 2020-05-15 北京赛迈特锐医疗科技有限公司 医学影像人工智能诊断数据管理系统及其管理方法
CN112420147A (zh) * 2020-11-18 2021-02-26 孙应实 影像ai结果与结构化报告桌面实时通讯的系统及方法
CN112562817A (zh) * 2020-12-02 2021-03-26 薛蕴菁 将影像结构化报告的标签反馈给影像ai的系统及方法
CN112541066A (zh) * 2020-12-11 2021-03-23 清华大学 基于文本结构化的医技报告检测方法及相关设备

Also Published As

Publication number Publication date
CN113449492A (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
US20200167881A1 (en) Automated clinical indicator recognition with natural language processing
US7580831B2 (en) Dynamic dictionary and term repository system
AU704804B2 (en) Computer based multimedia medical database management system and user interface
US20050010452A1 (en) System and method for processing transaction records suitable for healthcare and other industries
CN107818169B (zh) 电子病历检索、存储方法及装置、存储介质、电子终端
US20020038226A1 (en) System and method for capturing and archiving medical multimedia data
WO1996025719A9 (en) Computer based multimedia medical database management system and user interface
CN111081329A (zh) 临床数据自动录入方法及装置、电子设备、存储介质
CN102782690A (zh) 用于处理针对临床文档的不同语言的消费者查询的系统和方法
CN103577126A (zh) 集中打印方法、打印机控制器和系统
CN102043898A (zh) 用于基于患者偏好来定制医疗图像的方法和系统
CN113449492B (zh) 将后处理生成的word数据转换成结构化数据的方法及系统
CN106529153B (zh) 医学数字成像与通信文件的字符集匹配方法和装置
US20080294457A1 (en) Real-time medical records
CN113505270B (zh) 将后处理isp生成的数据与结构化报告整合的方法及系统
JP2002092166A (ja) 2次元コード付処方せんシステム
WO2007029625A1 (ja) 処方箋受付装置
Sokolowski Expressing health care objects in XML
US10867699B2 (en) Medication list generator
TWI333174B (zh)
WO2022163085A1 (ja) データ入力支援システム
CN115708167A (zh) 与pacs进行交互的方法和装置
CN117912620A (zh) 临床试验数据的采集方法、装置、系统及存储介质
Dimitrov et al. Generation of FHIR-Based International Patient Summaries from ELGA Data.
CN112271002A (zh) 一种集成不同医用系统病患数据的方法和智慧病区系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant