CN113449492A - 将后处理生成的word数据转换成结构化数据的方法及系统 - Google Patents
将后处理生成的word数据转换成结构化数据的方法及系统 Download PDFInfo
- Publication number
- CN113449492A CN113449492A CN202110615545.3A CN202110615545A CN113449492A CN 113449492 A CN113449492 A CN 113449492A CN 202110615545 A CN202110615545 A CN 202110615545A CN 113449492 A CN113449492 A CN 113449492A
- Authority
- CN
- China
- Prior art keywords
- data
- structured
- post
- module
- structured data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012805 post-processing Methods 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004458 analytical method Methods 0.000 claims abstract description 45
- 230000003902 lesion Effects 0.000 claims abstract description 41
- 238000002372 labelling Methods 0.000 claims abstract description 7
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 11
- 238000011160 research Methods 0.000 abstract description 8
- 238000007405 data analysis Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 34
- 238000005259 measurement Methods 0.000 description 8
- 238000007619 statistical method Methods 0.000 description 5
- 206010056342 Pulmonary mass Diseases 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种将后处理生成的word数据转换成结构化数据的方法,包括定时扫描后处理生成的word文件目录,将新word数据发送给解析模块;基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和病灶数据中的关键字,生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据;对每个病灶结构化数据进行标签化和编码化;当医生编辑结构化报告时,提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。本发明还公开了一种将后处理生成的word数据转换成结构化数据的系统。本发明能将影像后处理生成的word数据整合到结构化报告系统中,便于撰写报告及后期数据分析和科研教学。
Description
技术领域
本发明涉及医疗信息领域,更具体地,涉及一种将后处理生成的word数据转换成结构化数据的方法及系统。
背景技术
针对一些影像的后处理软件,可在该软件中对检查的医学影像进行自动或者手工测量分析,测量分析结果并生成测量值表格数据及关键图像,后处理软件可以将结果生成一个Word格式的文档。
但医疗机构使用该软件面临的问题:生成的Word格式报告,一般HIS/EMR系统不支持该格式数据直接发布到临床;生成的测量数据没有结构标签化,不便于后期做数据分析和科研。
发明内容
有鉴于此,本发明的主要目的在于提供一种将后处理生成的word数据转换成结构化数据的方法及系统,能够解决现有技术中存在的不能将后处理软件生成的处理结果直接发送到临床、生成的文档不利于后期的数据分析和科研教学的问题。
为达到上述目的,本发明的技术方案是这样实现的:
一方面,本发明提供了一种将后处理生成的word数据转换成结构化数据的方法,包括基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将新word数据发送给解析模块;基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,调用相关函数,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据;其中,结构化数据分为患者基本信息结构化数据和病灶结构化数据;对每个病灶结构化数据进行标签化和编码化;当医生编辑结构化报告时,自动提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。
优选地,该方法还包括:预设的解析规则是基于新word数据中每个table类型来设置。
优选地,该方法还包括:预设的配置规则是基于结构化报告类型来设置。
优选地,该方法还包括:对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储。
优选地,该方法还包括:判断解析后的新word数据是否解析成功,将解析成功的新word数据和解析失败的新word数据进行单独存储。
另一方面,本发明还提供了一种将后处理生成的word数据转换成结构化数据的系统,包括:扫描模块、解析模块、数据转换模块、设置模块和提取模块,其中,扫描模块,与解析模块相连,用于基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将新word数据发送给解析模块;解析模块,分别与扫描模块和数据转换模块相连,用于基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;数据转换模块,分别与解析模块和设置模块相连,用于根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,调用相关函数,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据;其中,结构化数据分为患者基本信息结构化数据和病灶结构化数据;设置模块,分别与数据转换模块和提取模块相连,用于对每个病灶结构化数据进行标签化和编码化;提取模块,与设置模块相连,用于当医生编辑结构化报告时,自动提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。
优选地,该系统还包括:第一定义模块,与解析模块相连,用于基于新word数据中每个table类型设置预设的配置规则。
优选地,该系统还包括:第二定义模块,与数据转换模块相连,用于基于结构化报告类型设置预设的配置规则。
优选地,设置模块还包括存储单元,用于对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储。
优选地,解析模块还包括判断单元,用于判断解析后的新word数据是否解析成功,将解析成功的新word数据和解析失败的新word数据进行单独存储。
本发明的技术效果:
1.本发明的方法可以定时扫描医学影像后处理软件生成的word文件目录,当有新的word数据产生时,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据,并对结构化数据设置标签和编码,医生在编辑结构化报告时,可以自动提取该影像后处理软件生成的测量值等数据;本发明的方法可以将影像后处理软件生成的word数据整合到结构化报告系统中,可以将测量数据直接发布到临床,由于转换后的数据已经设置标签和编码,便于后期的统计分析和临床科研的使用;
2.本发明还可以对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储,便于不同的第三方系统对数据的提取和使用,支持HIS/EMR系统将该后处理软件生成的数据发布的临床;
3.本发明还可以判断解析后的新word数据是否成功,显示解析成功和解析失败的目录,以便于管理员及时处理解析失败的数据。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法流程图;
图2示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中接收到后处理软件生成的word数据界面示意图;
图3示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中基于新word数据中每个table类型设置预设的解析规则界面示意图;
图4示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中配置规则界面示意图;
图5示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中根据预设的配置规则生成结构化数据界面示意图;
图6示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据界面示意图;
图7示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据(关键图像)一一填入到结构化报告界面示意图;
图8示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据(测量值)一一填入到结构化报告界面示意图;
图9示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统结构示意图;
图10示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中接收到后处理软件生成的word数据界面示意图;
图11示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中根据预设的配置规则生成结构化数据界面示意图;
图12示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据界面示意图;
图13示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据(关键图像)一一填入到结构化报告界面示意图;
图14示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据(测量值)一一填入到结构化报告界面示意图;
图15示出了根据本发明实施例三的将后处理生成的word数据转换成结构化数据的系统结构示意图;
图16示出了根据本发明实施例三的将后处理生成的word数据转换成结构化数据的系统中基于新word数据中每个table类型设置预设的解析规则界面示意图;
图17示出了根据本发明实施例四的将后处理生成的word数据转换成结构化数据的系统结构示意图;
图18示出了根据本发明实施例四的将后处理生成的word数据转换成结构化数据的系统中配置规则界面示意图;
图19示出了根据本发明实施例五的将后处理生成的word数据转换成结构化数据的系统结构示意图;
图20示出了根据本发明实施例六的将后处理生成的word数据转换成结构化数据的系统结构示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
实施例一
图1示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法流程图,如图1所示,该方法包括以下步骤:
本发明主要构建一种将医学影像处理软件生成的word文档数据整合到结构化报告系统中的方法,该方法主要对word文档数据进行分析解析、对转换后的结构化数据进行标签化、编码化,整合到结构化报告系统中,结构化报告系统可以完成报告的书写、发布,对标签化、编码化的数据,后期可用于统计分析和临床科研。
步骤S101,基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将新word数据发送给解析模块;
其中,预设的时间可以依据医疗机构的需求,比如每分钟扫描一次。
后处理软件生成的word文档一般放在后处理系统的固定目录下,可以通过一个服务程序定时扫描该固定目录,查找是否有新word数据生成。
图2示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中接收到后处理软件生成的word数据界面示意图;如图2所示,在该word文档中显示有不同的表格,主要内容包括患者的基本信息、检查信息、测量表格数据和关键图像数据。
步骤S102,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;
其中,预设的解析规则是基于新word数据中每个table类型来设置。
对于word文档中数据的读取,采用MS Office提供的COM+接口方案进行读取。
图3示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中基于新word数据中每个table类型设置预设的解析规则界面示意图;如图3所示,对不同的table类型来设置解析规则,比如对序列的描述、关键图像的描述等。
步骤S103,根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,调用相关函数(dll函数),基于关键字生成与结构化报告格式相匹配的数据(中间变量),将与结构化报告格式相匹配的数据定义为结构化数据;其中,结构化数据分为患者基本信息结构化数据和病灶结构化数据;
图4示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中配置规则界面示意图;如图4所示,配置规则的设置,从word文档数据与结构化报告每个控件的对应,对高分辨磁共振血管成像的分析报告,规则1,层面是否连续;规则2,管腔面积/管壁面积等等。
图5示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中根据预设的配置规则生成结构化数据界面示意图;如图5所示,与结构化报告格式相匹配的中间变量。
步骤S104,对每个病灶结构化数据进行标签化和编码化;
图6示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据界面示意图;如图6所示,对每个病灶病结构化数据设置编码,编码使用radlex编码。
步骤S105,当医生编辑结构化报告时,自动提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。
图7示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据(关键图像)一一填入到结构化报告界面示意图;图8示出了根据本发明实施例一的将后处理生成的word数据转换成结构化数据的方法中标签化和编码化的病灶结构化数据(测量值)一一填入到结构化报告界面示意图;如图7、图8所示,将后处理生成的数据与结构化报告的标签一一对应填写到报告中,包括病灶的测量值和关键图像。
其中,该方法还包括:预设的配置规则是基于结构化报告类型来设置。
根据结构化报告的类型,比如肺结节的报告。
其中,该方法还包括:对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储。
其中,患者基本信息结构化数据存储于RIS系统,标签化和编码化的病灶结构化数据存储到结构化报告系统中,以便后期单独调用。
其中,该方法还包括:判断解析后的新word数据是否解析成功,将解析成功的新word数据和解析失败的新word数据进行单独存储。
本发明实施例可以定时扫描医学影像后处理软件生成的word文件目录,当有新的word数据产生时,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据,并对结构化数据设置标签和编码,医生在编辑结构化报告时,可以自动提取该影像后处理软件生成的测量值等数据;本发明的实施例可以将影像后处理软件生成的word数据整合到结构化报告系统中,可以将测量数据直接发布到临床,由于转换后的数据已经设置标签和编码,便于后期的统计分析和临床科研的使用;本发明的实施例还可以对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储,便于不同的第三方系统对数据的提取和使用,支持HIS/EMR系统将该后处理软件生成的数据发布的临床;本发明的实施例还可以判断解析后的新word数据是否成功,显示解析成功和解析失败的目录,以便于管理员及时处理解析失败的数据。
实施例二
图9示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统结构示意图,如图9所示,该系统包括:扫描模块10、解析模块20、数据转换模块30、设置模块40和提取模块50,其中,
扫描模块10,与解析模块20相连,用于于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将新word数据发送给解析模块20;
其中,预设的时间可以依据医疗机构的需求,比如每分钟扫描一次。
后处理软件生成的word文档一般放在后处理系统的固定目录下,可以通过一个服务程序定时扫描该固定目录,查找是否有新word数据生成。
图10示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中接收到后处理软件生成的word数据界面示意图;如图10所示,在该word文档中显示有不同的表格,主要内容包括患者的基本信息、检查信息、测量表格数据和关键图像数据。
解析模块20,分别与扫描模块10和数据转换模块30相连,用于基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;
对于word文档中数据的读取,采用MS Office提供的COM+接口方案进行读取。
数据转换模块30,分别与解析模块20和设置模块40相连,用于根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,调用相关函数(dll函数),基于关键字生成与结构化报告格式相匹配的数据(中间变量),将与结构化报告格式相匹配的数据定义为结构化数据;
其中,结构化数据分为患者基本信息结构化数据和病灶结构化数据;
图11示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中根据预设的配置规则生成结构化数据界面示意图;如图11所示,与结构化报告格式相匹配的中间变量。
设置模块40,分别与数据转换模块30和提取模块50相连,用于对每个病灶结构化数据进行标签化和编码化;
图12示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据界面示意图;如图12所示,对每个病灶病结构化数据设置编码,编码使用radlex编码。
提取模块50,与设置模块40相连,用于当医生编辑结构化报告时,自动提取患者基本信息结构化数据、标签化和编码化的病灶结构化数据。
图13示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据(关键图像)一一填入到结构化报告界面示意图;图14示出了根据本发明实施例二的将后处理生成的word数据转换成结构化数据的系统中标签化和编码化的病灶结构化数据(测量值)一一填入到结构化报告界面示意图;如图13、图14所示,将后处理生成的数据与结构化报告的标签一一对应填写到报告中,包括病灶的测量值和关键图像。
本发明实施例设置了扫描模块、解析模块、数据转换模块、设置模块和提取模块,可以定时扫描医学影像后处理软件生成的word文件目录,当有新的word数据产生时,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据,并对结构化数据设置标签和编码,医生在编辑结构化报告时,可以自动提取该影像后处理软件生成的测量值等数据;本发明的实施例可以将影像后处理软件生成的word数据整合到结构化报告系统中,可以将测量数据直接发布到临床,由于转换后的数据已经设置标签和编码,便于后期的统计分析和临床科研的使用。
实施例三
图15示出了根据本发明实施例三的将后处理生成的word数据转换成结构化数据的系统结构示意图;如图15所示,该系统还包括:第一定义模块60,与解析模块20相连,用于基于新word数据中每个table类型设置预设的配置规则。
图16示出了根据本发明实施例三的将后处理生成的word数据转换成结构化数据的系统中基于新word数据中每个table类型设置预设的解析规则界面示意图;如图16所示,对不同的table类型来设置解析规则,比如对序列的描述、关键图像的描述等。
实施例四
图17示出了根据本发明实施例四的将后处理生成的word数据转换成结构化数据的系统结构示意图;如图17所示,该系统还包括:第二定义模块70,与数据转换模块30相连,用于基于结构化报告类型设置预设的配置规则。
根据结构化报告的类型,比如肺结节的报告。
图18示出了根据本发明实施例四的将后处理生成的word数据转换成结构化数据的系统中配置规则界面示意图;如图18所示,配置规则的设置,从word文档数据与结构化报告每个控件的对应,对高分辨磁共振血管成像的分析报告,规则1,层面是否连续;规则2,管腔面积/管壁面积等等。
实施例五
图19示出了根据本发明实施例五的将后处理生成的word数据转换成结构化数据的系统结构示意图;如图19所示,设置模块40还包括存储单元402,用于对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储。
其中,患者基本信息结构化数据存储于RIS系统,标签化和编码化的病灶结构化数据存储到结构化报告系统中,以便后期单独调用。
本发明实施例中的存储单元,可以对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储,便于不同的第三方系统对数据的提取和使用,支持HIS/EMR系统将该后处理软件生成的数据发布的临床。
实施例六
图20示出了根据本发明实施例六的将后处理生成的word数据转换成结构化数据的系统结构示意图,如图20所示,解析模块20还包括判断单元202,用于判断解析后的新word数据是否解析成功,将解析成功的新word数据和解析失败的新word数据进行单独存储。
本发明实施例中的判断单元,可以判断解析后的新word数据是否成功,显示解析成功和解析失败的目录,以便于管理员及时处理解析失败的数据。
从以上描述中,可以看出,本发明的上述实施例实现了如下技术效果:本发明可以定时扫描医学影像后处理软件生成的word文件目录,当有新的word数据产生时,基于预设的解析规则,将新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;根据预设的配置规则,提取XML格式的患者基本信息和XML格式的病灶数据中的关键字,基于关键字生成与结构化报告格式相匹配的数据,将与结构化报告格式相匹配的数据定义为结构化数据,并对结构化数据设置标签和编码,医生在编辑结构化报告时,可以自动提取该影像后处理软件生成的测量值等数据;本发明的实施例可以将影像后处理软件生成的word数据整合到结构化报告系统中,可以将测量数据直接发布到临床,由于转换后的数据已经设置标签和编码,便于后期的统计分析和临床科研的使用;本发明的实施例还可以对患者基本信息结构化数据、标签化和编码化的病灶结构化数据进行单独存储,便于不同的第三方系统对数据的提取和使用,支持HIS/EMR系统将该后处理软件生成的数据发布的临床;本发明的实施例还可以判断解析后的新word数据是否成功,显示解析成功和解析失败的目录,以便于管理员及时处理解析失败的数据。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种将后处理生成的word数据转换成结构化数据的方法,其特征在于,包括:
基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将所述新word数据发送给解析模块;
基于预设的解析规则,将所述新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;
根据预设的配置规则,提取所述XML格式的患者基本信息和所述XML格式的病灶数据中的关键字,调用相关函数,基于所述关键字生成与结构化报告格式相匹配的数据,将所述与结构化报告格式相匹配的数据定义为结构化数据;其中,所述结构化数据分为患者基本信息结构化数据和病灶结构化数据;
对每个所述病灶结构化数据进行标签化和编码化;
当医生编辑所述结构化报告时,自动提取所述患者基本信息结构化数据、标签化和编码化的所述病灶结构化数据。
2.根据权利要求1所述的将后处理生成的word数据转换成结构化数据的方法,其特征在于,该方法还包括:所述预设的解析规则是基于所述新word数据中每个table类型来设置。
3.根据权利要求1所述的将后处理生成的word数据转换成结构化数据的方法,其特征在于,该方法还包括:所述预设的配置规则是基于所述结构化报告类型来设置。
4.根据权利要求1所述的将后处理生成的word数据转换成结构化数据的方法,其特征在于,该方法还包括:对所述患者基本信息结构化数据、所述标签化和编码化的病灶结构化数据进行单独存储。
5.根据权利要求1所述的将后处理生成的word数据转换成结构化数据的方法,其特征在于,该方法还包括:判断解析后的所述新word数据是否解析成功,将解析成功的所述新word数据和解析失败的所述新word数据进行单独存储。
6.一种将后处理生成的word数据转换成结构化数据的系统,其特征在于,该系统包括:扫描模块、解析模块、数据转换模块、设置模块和提取模块,其中,
所述扫描模块,与所述解析模块相连,用于基于预设的时间,定时扫描后处理软件生成的word文件目录,当有新word数据生成时,通过预设接口将所述新word数据发送给所述解析模块;
所述解析模块,分别与所述扫描模块和所述数据转换模块相连,用于基于预设的解析规则,将所述新word数据解析成XML格式的患者基本信息和XML格式的病灶数据;
所述数据转换模块,分别与所述解析模块和所述设置模块相连,用于根据预设的配置规则,提取所述XML格式的患者基本信息和所述XML格式的病灶数据中的关键字,调用相关函数,基于所述关键字生成与结构化报告格式相匹配的数据,将所述与结构化报告格式相匹配的数据定义为结构化数据;其中,所述结构化数据分为患者基本信息结构化数据和病灶结构化数据;
所述设置模块,分别与所述数据转换模块和所述提取模块相连,用于对每个所述病灶结构化数据进行标签化和编码化;
所述提取模块,与所述设置模块相连,用于当医生编辑所述结构化报告时,自动提取所述患者基本信息结构化数据、标签化和编码化的所述病灶结构化数据。
7.根据权利要求6所述的将后处理生成的word数据转换成结构化数据的系统,其特征在于,该系统还包括:第一定义模块,与所述解析模块相连,用于基于所述新word数据中每个table类型设置所述预设的配置规则。
8.根据权利要求6所述的将后处理生成的word数据转换成结构化数据的系统,其特征在于,该系统还包括:第二定义模块,与所述数据转换模块相连,用于基于所述结构化报告类型设置所述预设的配置规则。
9.根据权利要求6所述的将后处理生成的word数据转换成结构化数据的系统,其特征在于,所述设置模块还包括存储单元,用于对所述患者基本信息结构化数据、所述标签化和编码化的病灶结构化数据进行单独存储。
10.根据权利要求6所述的将后处理生成的word数据转换成结构化数据的系统,其特征在于,所述解析模块还包括判断单元,用于判断解析后的所述新word数据是否解析成功,将解析成功的所述新word数据和解析失败的所述新word数据进行单独存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110615545.3A CN113449492B (zh) | 2021-06-02 | 2021-06-02 | 将后处理生成的word数据转换成结构化数据的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110615545.3A CN113449492B (zh) | 2021-06-02 | 2021-06-02 | 将后处理生成的word数据转换成结构化数据的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113449492A true CN113449492A (zh) | 2021-09-28 |
CN113449492B CN113449492B (zh) | 2024-04-19 |
Family
ID=77810804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110615545.3A Active CN113449492B (zh) | 2021-06-02 | 2021-06-02 | 将后处理生成的word数据转换成结构化数据的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113449492B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010217972A (ja) * | 2009-03-13 | 2010-09-30 | Toshiba Corp | 構造化文書生成装置及び構造化文書生成プログラム |
CN110931095A (zh) * | 2018-09-19 | 2020-03-27 | 北京赛迈特锐医疗科技有限公司 | 基于dicom图像标注与结构化报告关联的系统及方法 |
CN111161822A (zh) * | 2018-11-08 | 2020-05-15 | 北京赛迈特锐医疗科技有限公司 | 医学影像人工智能诊断数据管理系统及其管理方法 |
CN112420147A (zh) * | 2020-11-18 | 2021-02-26 | 孙应实 | 影像ai结果与结构化报告桌面实时通讯的系统及方法 |
CN112541066A (zh) * | 2020-12-11 | 2021-03-23 | 清华大学 | 基于文本结构化的医技报告检测方法及相关设备 |
CN112562817A (zh) * | 2020-12-02 | 2021-03-26 | 薛蕴菁 | 将影像结构化报告的标签反馈给影像ai的系统及方法 |
-
2021
- 2021-06-02 CN CN202110615545.3A patent/CN113449492B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010217972A (ja) * | 2009-03-13 | 2010-09-30 | Toshiba Corp | 構造化文書生成装置及び構造化文書生成プログラム |
CN110931095A (zh) * | 2018-09-19 | 2020-03-27 | 北京赛迈特锐医疗科技有限公司 | 基于dicom图像标注与结构化报告关联的系统及方法 |
CN111161822A (zh) * | 2018-11-08 | 2020-05-15 | 北京赛迈特锐医疗科技有限公司 | 医学影像人工智能诊断数据管理系统及其管理方法 |
CN112420147A (zh) * | 2020-11-18 | 2021-02-26 | 孙应实 | 影像ai结果与结构化报告桌面实时通讯的系统及方法 |
CN112562817A (zh) * | 2020-12-02 | 2021-03-26 | 薛蕴菁 | 将影像结构化报告的标签反馈给影像ai的系统及方法 |
CN112541066A (zh) * | 2020-12-11 | 2021-03-23 | 清华大学 | 基于文本结构化的医技报告检测方法及相关设备 |
Non-Patent Citations (1)
Title |
---|
小游甲鱼: "java中实现word(doc、docx)中完美提取文字、表格为结构化数据", Retrieved from the Internet <URL:CSDN> * |
Also Published As
Publication number | Publication date |
---|---|
CN113449492B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5740428A (en) | Computer based multimedia medical database management system and user interface | |
US20200167881A1 (en) | Automated clinical indicator recognition with natural language processing | |
US7580831B2 (en) | Dynamic dictionary and term repository system | |
CN107818169B (zh) | 电子病历检索、存储方法及装置、存储介质、电子终端 | |
JP4649405B2 (ja) | 構造化文書作成方法ならびに装置 | |
WO1996025719A9 (en) | Computer based multimedia medical database management system and user interface | |
US20040186747A1 (en) | Electronic report making supporting apparatus, method, and program | |
CN102612696A (zh) | 具有报告验证器和报告增强器的医学信息系统 | |
JP4719408B2 (ja) | 医療情報システム | |
CN111584043B (zh) | 影像学扫描方案智能提示系统及其方法 | |
CN1916924A (zh) | 增加应用程序特定整合中dicom标签管理灵活性的方法 | |
CN111916185B (zh) | 为ai诊断模型提供影像数据的管理系统及方法 | |
US20090287487A1 (en) | Systems and Methods for a Visual Indicator to Track Medical Report Dictation Progress | |
CN102043898A (zh) | 用于基于患者偏好来定制医疗图像的方法和系统 | |
CN115295111A (zh) | 一种结构化报告生成方法、系统及存储介质 | |
CN107330246A (zh) | 医学图像文件的导入方法、装置和计算机可读介质 | |
TW200949695A (en) | Dicom-based 12-lead ECG gateway and browser under the clinically-used information system | |
CN113449492A (zh) | 将后处理生成的word数据转换成结构化数据的方法及系统 | |
CN106529153A (zh) | 医学数字成像与通信文件的字符集匹配方法和装置 | |
CN109431529A (zh) | 一种心脏ct结构化报告系统 | |
CN113505270B (zh) | 将后处理isp生成的数据与结构化报告整合的方法及系统 | |
CN111475552A (zh) | 基于dicom的sr结构化报告生成方法、系统及设备 | |
TWM360398U (en) | DICOM-based 12-lead ECG gateway and browser under the clinically-used information system | |
CN101196962A (zh) | 一种医学成像系统的图像信息显示方法 | |
US20050114039A1 (en) | Interruption of batch processing for high priority processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |