CN105550524A - 一种新型临床病例数据采集系统及采集方法 - Google Patents
一种新型临床病例数据采集系统及采集方法 Download PDFInfo
- Publication number
- CN105550524A CN105550524A CN201511021528.8A CN201511021528A CN105550524A CN 105550524 A CN105550524 A CN 105550524A CN 201511021528 A CN201511021528 A CN 201511021528A CN 105550524 A CN105550524 A CN 105550524A
- Authority
- CN
- China
- Prior art keywords
- electronic medical
- medical records
- records account
- transient state
- account
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种新型临床病例数据采集系统及采集方法,所述识别装置的校验模块中进一步包括电子病例报告表对比单元,所述电子病例报告表对比单元接收所述第一OCR模块和所述第二OCR模块发送的第一电子病例报告表、第二电子病例报告表,对所述第一OCR模块和所述第二OCR模块发送的电子病例报告表进行比较校验,能够在提高纸质病例报告表转换为电子病例报告表的工作效率的同时,有效减少错误电子病例报告表的输出,提高了新型临床病例数据采集系统的准确性和速度。并且所述第一OCR模块和所述第二OCR模块分别根据不同算法对所述纸质病例报告表进行识别,能够增加所述电子病例报告表对比单元对所述第一电子病例报告表和所述第二电子病例报告表进行比较的准确性。
Description
本申请是申请号为201310300966.2的分案申请;
原申请的申请日为:2013年7月17日;
原申请的发明名称为:一种临床病例数据采集系统及采集方法。
技术领域
本发明涉及将纸质病例报告表转换成电子病例报告表的数据采集系统,具体是一种新型临床病例数据采集系统,属于电子病例报告表技术领域。
背景技术
在临床研究或药品临床试验中,往往要收集病患者的病例报告表,而临床研究或药品临床试验中所用于统计分析的病例报告表必须是电子病例报告表。目前,在大多数临床研究数据中心中,还是通过手工录入的方式将纸质病例报告表内容输入计算机中形成电子病例报告表,对临床数据进行统计分析。为了保证数据的准确性,通常需要经过两次录入甚至三次录入,并对各次录入的数据进行比较以期纠正因人工录入过程中引入的数据错误。由于数据管理中间过程有大量的人工干预,工作效率有限,数据发生错误的可能性也会成倍地增加,而为了消除这种错误,又不得不增加更多的人力。
中国专利CN102968572A公开了一种骨科病例信息采集系统及其采集方法,其中,所述骨科病例信息采集系统包括纸质病例扫描采集模块、电子病例自动转换模块、骨科影像采集模块和病例信息共享平台;其中,所述的纸质病例扫描采集模块包括:扫描模块、图像处理机文字识别模块、数据存数模块和数据传输接口,所述的扫描模块包括高速扫描仪,扫描模块将病人的纸质病例信息转换为图像信息,图像处理及文字识别模块为文档扫描软件,将扫描的图像信息转换成电子病例文本;所述的电子病例自动转换模块包括:HL7资源模块、HL7对照模块、HL7转换模块、HL7应用接口模块和HL7信息发送接受模块;所述的骨科影像采集模块包括:采集模块、存储模块和数据传输接口。所述的病例信息共享平台包括:纸质病例信息接口、电子病例信息接口、骨科影像信息数据接口、数据处理模块、数据存数模块和数据共享模块。所述骨科病例信息采集方法包括如下步骤:(1)通过纸质病例扫描采集模块采集纸质骨科病例信息;(2)通过电子病例自动转换模块采集骨科电子病例信息;(3)通过骨科影像采集模块采集骨科影像信息;(4)将上述步骤采集的信息通过互联网传输给病例信息共享平台;(5)数据共享平台收集、整理病例信息,并提供给医生和病人查询。上述技术方案虽然能够将纸质病例转换为电子病例,但是没有对转换后的电子病例进行校验,一旦所转换的电子病例中存在因转换而造成的信息错误,则该错误就不能被校验出来。当在治疗或研究过程中,若用于医生、病人以及研究人员所查询的电子病例中存在错误的信息,则会对病人在治疗过程中造成为误诊、对临床研究或药品临床试验造成试验数据不准确。
发明内容
本发明所要解决的技术问题是现有技术中,在纸质病例报告表转换为电子病例报告表的过程中,由于没有对转换后的电子病例报告表进行校验而导致的电子病例报告表中存在信息错误,从而提供一种对识别后的电子病例报告表进行校验的新型临床病例数据采集系统及采集方法。
为解决上述技术问题,本发明是通过以下技术方案实现的:
一种新型临床病例数据采集系统,包括扫描装置和识别装置,其中,
所述扫描装置,用于通过扫描纸质病例报告表生成病例报告表图像,并把所述病例报告表图像发送给所述识别装置;
所述识别装置,接收所述扫描装置发送的病例报告表图像,并对所述病例报告表图像进行图像、文字识别处理得到电子病例报告表;所述识别装置进一步包括第一OCR模块、第二OCR模块和校验模块,其中,
所述第一OCR模块,对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表传输给所述校验模块;
所述第二OCR模块,具有与所述第一OCR模块不同的识别算法,对所述第一OCR模块识别的所述病例报告表图像进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表传输给所述校验模块;
所述校验模块,用于对电子病例报告表进行校验,其进一步包括电子病例报告表对比单元和第一核对单元,
所述电子病例报告表对比单元,接收所述第一OCR模块和所述第二OCR模块发送的第一电子病例报告表、第二电子病例报告表,对所述第一OCR模块和所述第二OCR模块发送的电子病例报告表进行比较校验,经过比较校验后,若所述第一电子病例报告表和所述第二电子病例报告表一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表的形式输出;否则将所述第一电子病例报告表、所述第二电子病例报告表中不一致的内容进行标记后输出给所述第一核对单元;
所述第一核对单元,接收所述电子病例报告表对比单元标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出。
所述校验模块还包括语法检查单元和第二核对单元,
所述语法检查单元,接收所述第一暂态电子病例报告表,对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出;否则将所述电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出给所述第二核对单元;
所述第二核对单元,接收所述语法检查单元发送的经过语法错误标记的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。
所述校验模块还包括随机截取校验单元和第三核对单元,其中,
所述随机截取校验单元进一步包括随机截取模块和数据库,
所述随机截取模块,接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在所述数据库中进行查询,若所述随机短语为关键词语、关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则将所述电子病例报告表中截取的随机短语进行标记后输出;
所述数据库,用于接收关键词语及关键语句并将接到的所述关键词语及关键语句存储;
所述第三核对单元,接收所述随机截取模块发送的标记后的所述第二暂态电子病例报告表,并对其进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
所述数据库进一步包括存储模块、输入模块和自适应模块,其中,
所述存储模块,用于接收关键词语及关键语句并将接到的所述关键词语及关键语句存储;
所述输入模块,用于将预先确定的关键词语及关键语句输出到所述存储模块;
所述自适应模块,用于记录所述同一随机短语访问数据库的次数,若次数超过预定的n次,则将所述随机短语作为关键词语及关键语句发送到所述存储模块存储。
一种新型临床病例数据采集方法,包括如下步骤,
S0:扫描纸质病例报告表以生成病例报告表图像,并将所述病例报告表图像发送;
S1:接收病例报告表图像,并对所述对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表输出;
S2:接收步骤S1中识别的所述病例报告表图像,并对所述病例报告表图像用不同于步骤S1中的识别算法进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表输出;
S3:接收所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表进行比较校验;若所述第一电子病例报告表和所述第二电子病例报告表内容一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出;否则将所述第一电子病例报告表和所述第二电子病例报告表中不一致的内容进行标记后输出;
S4:接收标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出。
还包括以下语法检查的步骤:
S51:接收所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述暂态病例报告表作为第二暂态电子病例报告表输出;否则将所述第一暂态电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出;
S52:接收语法错误标记后输出的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表上语法错误标记的内容进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。
在所述语法检查步骤之后还包括短语核对的步骤:
S61:接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在预定的数据库中进行查询,若所述随机短语为所述数据库中存储的关键词语或关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则,对所述第二暂态电子病例报告表中截取的所述随机短语进行短语核对错误标记后输出;
S62:接收短语核对错误标记后输出的所述第二暂态电子病例报告表,并对所述第二暂态电子病例报告表中短语核对错误标记的所述随机短语进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
所述步骤S61中的数据库按照以下步骤生成:
S5’1:将预先确定的关键词语及关键语句存储到数据库;
S5’2:记录所述随机短语访问数据库的次数,若次数超过预定的n次,则将所述随机短语作为关键词语或者关键语句存储到所述数据库中。
本发明的上述技术方案相比现有技术具有以下优点:
(1)本发明所述的一种新型临床病例数据采集系统,校验模块中进一步包括电子病例报告表对比单元,所述电子病例报告表对比单元接收所述第一OCR模块和所述第二OCR模块发送的第一电子病例报告表、第二电子病例报告表,对所述第一OCR模块和所述第二OCR模块发送的电子病例报告表进行比较校验,经过比较校验后,若所述第一电子病例报告表和所述第二电子病例报告表准确,则将第一电子病例报告表或第二电子病例报告表作为第一暂态电子病例报告表输出,否则将所述第一电子病例报告表、所述第二电子病例报告表中不一致的内容进行标记并进行人工核对,将人工核对后的第一电子病例报告表、第二电子病例报告表以终态电子病例报表的形式输出。本发明能够在大大提高纸质病例报告表转换为电子病例报告表的工作效率的同时,有效减少错误电子病例报告表的输出,提高了新型临床病例数据采集系统的识别准确性和识别速度。并且所述第一OCR模块和所述第二OCR模块分别根据不同算法对所述纸质病例报告表进行识别,能使病例报告表图像在不同算法下得到所述第一电子病例报告表和所述第二电子病例报告表,能够增加所述电子病例报告表对比单元对所述第一电子病例报告表和所述第二电子病例报告表进行比较的准确性。
(2)本发明所述的一种新型临床病例数据采集系统,所述校验模块还包括语法检查单元,能够对所述第一暂态电子病例报告表中的语句进行语法检查,进一步增加了系统的识别精度。所述校验模块还包括随机截取校验单元,能够随机对所述第二暂态电子病例报告表中的语句进行截取得到随机短语,并将所述随机短语在所述数据库中进行查询,若所述随机短语为所述关键词语及关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则将所述电子病例报告表中截取的随机短语处标记并对其进行人工核对,将人工核对后的终态电子病例报告表输出。本发明能够对第二暂态电子病例报告表中语句的准确性进行校验,有效增加了系统的识别准确性。
(3)本发明所述的一种新型临床病例数据采集系统,所述数据库进一步包括存储模块、输入模块和自适应模块,能够根据人工输入和系统的自适应输入关键词语及关键语句,增加所述数据库数据量,能够加强系统在病例报告表识别过程中能够对不同项目中不同的关键词语及关键语句的准确识别及校验。
附图说明
为了使本发明的内容更容易被清楚的理解,下面结合附图,对本发明作进一步详细的说明,其中,
图1是本发明一个实施例的新型临床病例数据采集系统的框架图;
图2是本发明一个实施例的新型临床病例数据采集方法的流程图。
具体实施方式
实施例1
本发明所述的新型临床病例数据采集系统的结构,如图1所示,包括扫描装置和识别装置。其中,
所述扫描装置,用于通过扫描纸质病例报告表生成病例报告表图像,并把所述病例报告表图像发送给所述识别装置。所述扫描装置可以为扫描仪、照相机等电子设备,采用高速扫描仪或高速照相机时,可以提高系统整体的采集速度。
所述识别装置,接收所述扫描装置发送的病例报告表图像,并对所述病例报告表图像进行图像、文字识别处理得到电子病例报告表;所述识别装置进一步包括第一OCR模块、第二OCR模块和校验模块。其中,
所述第一OCR模块,采用第一OCR算法对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表传输给所述校验模块。所述的病例报告表为临床研究或药品临床试验中的原始数据在和法律文件,其具有一定的格式及项目,所述的项目中的全部或部分需要受试人员在纸质病例报告表中手工填写。本发明针对经过受试人员填写后的所述病例报告表图像进行OCR(OpticalCharacterRecognition光学字符识别)来得到电子病例报告表,完成纸质数据项电子数据的转化。所述OCR模块能够根据算法来分析文字的形态特征,判断文字的标准编码,并按照通用格式存储为计算机文本文件,现有的OCR技术已经能够处理印刷质量比较差的字符或较为一般的手写体字符。
所述第二OCR模块,采用第二OCR算法对所述第一OCR模块识别的所述病例报告表图像进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表传输给所述校验模块。所述第一OCR算法和第二OCR算法不同。所述第一OCR模块和第二OCR模块分别根据不同算法对同样的所述病例报告表图像进行识别,能够使病例报告表图像在不同算法下得到所述第一电子病例报告表和所述第二电子病例报告表,能够增加所述电子病例报告表对比单元对所述第一电子病例报告表和所述第二电子病例报告表进行比较的准确性。
所述校验模块,用于对电子病例报告表进行校验,其进一步包括电子病例报告表对比单元和第一核对单元。
所述电子病例报告表对比单元,接收所述第一OCR模块和所述第二OCR模块发送的第一电子病例报告表、第二电子病例报告表,对所述第一OCR模块和所述第二OCR模块发送的电子病例报告表进行比较校验,经过比较校验后,若所述第一电子病例报告表和所述第二电子病例报告表一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表的形式输出;否则将所述第一电子病例报告表、所述第二电子病例报告表中不一致的内容进行标记后输出给所述第一核对单元。
所述第一核对单元,接收所述电子病例报告表对比单元标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出。所述的暂态报告表既可以作为本发明最后的输出数据,也可以作为其他模块输入数据以进行进一步的数据校正。所述的终态报告表为最终输出系统的电子病例报告表。
本发明所述的新型临床病例数据采集系统能够在大大提高纸质病例报告表转换为电子病例报告表的工作效率的同时,有效减少错误电子病例报告表的输出,提高了新型临床病例数据采集系统的识别准确性和识别速度。
作为本发明的其他实施例,在上述实施例的基础上,所述校验模块还包括语法检查单元和第二核对单元。所述语法检查单元,接收所述电子病例报告表对比单元输出的第一暂态电子病例报告表,对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出;否则将所述电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出给所述第二核对单元。所述语法检查单元,能够对所述第一暂态电子病例报告表中的语句进行语法检查,进一步增加了系统的识别精度。
所述第二核对单元,接收所述语法检查单元发送的经过语法错误标记的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。
作为本发明的其他实施例,在上述任意一个实施例的基础上,所述校验模块还包括随机截取校验单元和第三核对单元。其中,所述随机截取校验单元进一步包括随机截取模块和数据库。
所述随机截取模块,接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语搜索的关键字在所述数据库中进行搜索查询,若所述随机短语为数据库中存储的关键词语、关键语句的全部或一部分,则认为随机截取校验正确,将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则将所述电子病例报告表中截取的随机短语进行标记后输出。
所述数据库,用于接收关键词语及关键语句并将接到的所述关键词语及关键语句存储,所述的关键词语及关键语句为中医药辞典、现代汉语辞典等专业工具书中的词语及语句。
所述第三核对单元,接收所述随机截取模块发送的标记后的所述第二暂态电子病例报告表,并对其进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
本发明能够对所述第二暂态电子病例报告表中词语及语句的准确性进行校验,有效增加了系统的识别准确性。
作为本发明上述包括用于存储关键词语和关键语句的数据库的实施例的具体实施方式,所述数据库进一步包括存储模块、输入模块和自适应模块。其中,
所述存储模块,用于接收关键词语及关键语句并将接到的所述关键词语及关键语句存储。
所述输入模块,用于将预先确定的关键词语及关键语句输出至所述存储模块,所述的中医药辞典、现代汉语辞典等工具书中的词语及语句通过所述输入模块输入到所述输入模块中。
所述自适应模块,用于记录所述同一随机短语访问数据库的次数,若次数超过预定的n次,则将所述随机短语作为关键词语及关键语句发送到所述存储模块存储。能够根据人工输入和系统的自适应输入关键词语及关键语句,增加所述数据库数据量,能够加强系统在病例报告表识别过程中能够对不同项目中不同的关键词语及关键语句的准确识别及校验。由于医学术语的数量及其庞大并且随着科技的发展医学术语也在不断的创造,因此本发明所述的数据库中不可能完整的存储所有的医学术语,采用所述自适应模块后,能够根据识别出的关键词语及关键语句及时的对所述数据库中的关键词语及关键语句进行系统的自动补充,具有实时更新适用性强的优点。
作为本发明的其他具体实施方式,所述语法检测模块还可以放在随机截取校验单元之后,用于接收随机校验模块发送的暂态电子病例报告表,并对其进行语法检测。
实施例2
作为本发明所述的一种新型临床病例数据采集方法,如图2所示,其包括如下步骤,
S0:扫描纸质病例报告表以生成病例报告表图像,并将所述病例报告表图像发送;
S1:接收病例报告表图像,并对所述对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表输出;
S2:接收步骤S1中识别的所述病例报告表图像,并对所述病例报告表图像用不同于步骤S1中的识别算法进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表输出;
S3:接收所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表进行比较校验;若所述第一电子病例报告表和所述第二电子病例报告表内容一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出;否则将所述第一电子病例报告表和所述第二电子病例报告表中不一致的内容进行标记后输出;
S4:接收标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为终态病例报告表输出。
本发明所述的数据采集方法能够在大大提高纸质病例报告表转换为电子病例报告表的工作效率的同时,有效减少错误电子病例报告表的输出,提高了新型临床病例数据采集系统的识别准确性和识别速度。所述步骤S1和步骤S2分别根据不同算法对所述纸质病例报告表进行识别,能够使病例报告表图像在不同算法下得到所述第一电子病例报告表和所述第二电子病例报告表,能够增加所述电子病例报告表对比单元对所述第一电子病例报告表和所述第二电子病例报告表进行比较的准确性。
作为本发明的其他实施方式,在所述步骤S4之后还包括语法检查的步骤。
S51:接收所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述暂态病例报告表作为第二暂态电子病例报告表输出;否则将所述第一暂态电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出;
S52:接收语法错误标记后输出的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表上语法错误标记的内容进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。所述语法检查步骤能够对所述第一电子病例报告表或所述第二电子病例报告表中的语句进行语法检查,进一步增加了系统的识别精度。
作为本发明的其他实施方式,在所述语法检查步骤之后还包括短语核对的步骤。
S61:接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在预定的数据库中进行查询,若所述随机短语为所述数据库中存储的关键词语或关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则,对所述第二暂态电子病例报告表中截取的所述随机短语进行短语核对错误标记后输出;
S62:接收短语核对错误标记后输出的所述第二暂态电子病例报告表,并对所述第二暂态电子病例报告表中短语核对错误标记的所述随机短语进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
本实施例能够对第二暂态电子病例报告表中语句的准确性进行校验,有效增加了系统的识别准确性。
作为关键词语及关键语句发送到所述存储模块存储上述包括短语核对的步骤的实施例的一种具体实施方式,在该实施例的,所述步骤S61中的数据库按照以下步骤生成。
S5’1:将关键词语及关键语句预先存储到数据库;
S5’2:记录所述随机短语访问数据库的次数,若次数超过预定的n次,则将所述随机短语作为关键词语或者关键语句存储到所述数据库中。该步骤能够根据识别出的关键词语及关键语句及时的对所述数据库中的关键词语及关键语句进行系统的自动补充,具有实时更新适用性强的优点。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (2)
1.一种新型临床病例数据采集系统,其特征在于,包括扫描装置和识别装置,其中,
所述扫描装置,用于通过扫描纸质病例报告表生成病例报告表图像,并把所述病例报告表图像发送给所述识别装置;
所述识别装置,接收所述扫描装置发送的病例报告表图像,并对所述病例报告表图像进行图像、文字识别处理得到电子病例报告表;所述识别装置进一步包括第一OCR模块、第二OCR模块和校验模块,其中,
所述第一OCR模块,对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表传输给所述校验模块;
所述第二OCR模块,具有与所述第一OCR模块不同的识别算法,对所述第一OCR模块识别的所述病例报告表图像进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表传输给所述校验模块;
所述校验模块,用于对电子病例报告表进行校验,其进一步包括电子病例报告表对比单元和第一核对单元,
所述电子病例报告表对比单元,接收所述第一OCR模块和所述第二OCR模块发送的第一电子病例报告表、第二电子病例报告表,对所述第一OCR模块和所述第二OCR模块发送的电子病例报告表进行比较校验,经过比较校验后,若所述第一电子病例报告表和所述第二电子病例报告表一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表的形式输出;否则将所述第一电子病例报告表、所述第二电子病例报告表中不一致的内容进行标记后输出给所述第一核对单元;
所述第一核对单元,接收所述电子病例报告表对比单元标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出;
所述校验模块还包括语法检查单元和第二核对单元,
所述语法检查单元,接收所述第一暂态电子病例报告表,对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出;否则将所述电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出给所述第二核对单元;
所述第二核对单元,接收所述语法检查单元发送的经过语法错误标记的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出;
所述校验模块还包括随机截取校验单元和第三核对单元,其中,
所述随机截取校验单元进一步包括随机截取模块和数据库,
所述随机截取模块,接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在所述数据库中进行查询,若所述随机短语为关键词语、关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则将所述电子病例报告表中截取的随机短语进行标记后输出;
所述数据库,用于接收关键词语及关键语句并将接到的所述关键词语及关键语句存储;
所述第三核对单元,接收所述随机截取模块发送的标记后的所述第二暂态电子病例报告表,并对其进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
2.一种新型临床病例数据采集方法,其特征在于,包括如下步骤,
S0:扫描纸质病例报告表以生成病例报告表图像,并将所述病例报告表图像发送;
S1:接收病例报告表图像,并对所述对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表输出;
S2:接收步骤S1中识别的所述病例报告表图像,并对所述病例报告表图像用不同于步骤S1中的识别算法进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表输出;
S3:接收所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表进行比较校验;若所述第一电子病例报告表和所述第二电子病例报告表内容一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出;否则将所述第一电子病例报告表和所述第二电子病例报告表中不一致的内容进行标记后输出;
S4:接收标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出;
还包括以下语法检查的步骤:
S51:接收所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述暂态病例报告表作为第二暂态电子病例报告表输出;否则将所述第一暂态电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出;
S52:接收语法错误标记后输出的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表上语法错误标记的内容进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出;
在所述语法检查步骤之后还包括短语核对的步骤:
S61:接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在预定的数据库中进行查询,若所述随机短语为所述数据库中存储的关键词语或关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则,对所述第二暂态电子病例报告表中截取的所述随机短语进行短语核对错误标记后输出;
S62:接收短语核对错误标记后输出的所述第二暂态电子病例报告表,并对所述第二暂态电子病例报告表中短语核对错误标记的所述随机短语进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511021528.8A CN105550524B (zh) | 2013-07-17 | 2013-07-17 | 一种临床病例数据采集系统及采集方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310300966.2A CN103425975B (zh) | 2013-07-17 | 2013-07-17 | 一种临床病例数据采集系统及采集方法 |
CN201511021528.8A CN105550524B (zh) | 2013-07-17 | 2013-07-17 | 一种临床病例数据采集系统及采集方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310300966.2A Division CN103425975B (zh) | 2013-07-17 | 2013-07-17 | 一种临床病例数据采集系统及采集方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105550524A true CN105550524A (zh) | 2016-05-04 |
CN105550524B CN105550524B (zh) | 2018-02-13 |
Family
ID=49650686
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511021528.8A Active CN105550524B (zh) | 2013-07-17 | 2013-07-17 | 一种临床病例数据采集系统及采集方法 |
CN201511026452.8A Active CN105608325B (zh) | 2013-07-17 | 2013-07-17 | 新型临床病例数据采集系统及采集方法 |
CN201511021525.4A Active CN105468929B (zh) | 2013-07-17 | 2013-07-17 | 临床病例数据采集系统及采集方法 |
CN201310300966.2A Active CN103425975B (zh) | 2013-07-17 | 2013-07-17 | 一种临床病例数据采集系统及采集方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511026452.8A Active CN105608325B (zh) | 2013-07-17 | 2013-07-17 | 新型临床病例数据采集系统及采集方法 |
CN201511021525.4A Active CN105468929B (zh) | 2013-07-17 | 2013-07-17 | 临床病例数据采集系统及采集方法 |
CN201310300966.2A Active CN103425975B (zh) | 2013-07-17 | 2013-07-17 | 一种临床病例数据采集系统及采集方法 |
Country Status (1)
Country | Link |
---|---|
CN (4) | CN105550524B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107833600A (zh) * | 2017-10-25 | 2018-03-23 | 医渡云(北京)技术有限公司 | 医疗数据录入核查方法及装置、存储介质、电子设备 |
CN110288052A (zh) * | 2019-03-27 | 2019-09-27 | 北京爱数智慧科技有限公司 | 字符识别方法、装置、设备及计算机可读介质 |
CN113724825A (zh) * | 2021-09-06 | 2021-11-30 | 浙江海心智惠科技有限公司 | 一种基于病历ocr的患教视频诊疗方案拣选匹配系统 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105786934B (zh) * | 2014-12-26 | 2020-06-12 | 北大医疗信息技术有限公司 | 病历文书缺陷处理方法及系统 |
CN104915668B (zh) * | 2015-05-29 | 2019-02-26 | 深圳市红源资产管理有限公司 | 医学影像中的文字信息识别方法及装置 |
CN107145734B (zh) * | 2017-05-04 | 2020-08-28 | 深圳市联新移动医疗科技有限公司 | 一种医疗数据的自动获取与录入方法及其系统 |
CN107609077A (zh) * | 2017-09-04 | 2018-01-19 | 中国核工业第五建设有限公司 | 焊材信息管理方法 |
CN107767929B (zh) * | 2017-11-13 | 2024-04-05 | 医渡云(北京)技术有限公司 | 病例报告表填写方法、装置、电子设备及存储介质 |
CN107767924A (zh) * | 2017-11-13 | 2018-03-06 | 医渡云(北京)技术有限公司 | 原始数据核对方法、装置、电子设备及存储介质 |
CN108597565B (zh) * | 2018-04-11 | 2021-07-02 | 浙江大学 | 一种基于ocr与命名实体提取技术的临床队列数据协同校验方法 |
CN109102844B (zh) * | 2018-08-24 | 2022-02-15 | 北京锐客科技有限公司 | 一种临床试验源数据自动校验方法 |
CN109616166B (zh) * | 2018-11-09 | 2021-02-26 | 金色熊猫有限公司 | 医疗数据登记管理方法及装置、电子设备、存储介质 |
CN109583358A (zh) * | 2018-11-26 | 2019-04-05 | 广东智源信息技术有限公司 | 一种医疗卫生监督快速精准执法方法 |
CN109979547A (zh) * | 2019-04-08 | 2019-07-05 | 皮敏 | 一种新型临床病例数据采集系统及采集方法 |
CN112116968A (zh) * | 2019-06-21 | 2020-12-22 | 上海交通大学医学院附属瑞金医院 | 一种医学检验报告的识别方法、装置、设备及存储介质 |
CN110675924B (zh) * | 2019-08-19 | 2023-03-10 | 医渡云(北京)技术有限公司 | 病例报告表自动生成的方法、装置、可读介质及电子设备 |
CN110490185A (zh) * | 2019-08-23 | 2019-11-22 | 北京工业大学 | 一种基于多次对比矫正ocr名片信息识别改进方法 |
CN112308070B (zh) * | 2020-10-30 | 2024-04-26 | 深圳前海微众银行股份有限公司 | 证件信息的识别方法及装置、设备和计算机可读存储介质 |
CN113052557A (zh) * | 2021-03-30 | 2021-06-29 | 贵州数智联云工程科技有限公司 | 用于审批的三维模型生成分析系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101236579A (zh) * | 2008-02-20 | 2008-08-06 | 杭州创业软件股份有限公司 | 一种动态结构化的电子病历 |
JP2009146340A (ja) * | 2007-12-18 | 2009-07-02 | Konica Minolta Medical & Graphic Inc | 医用画像システム、検査オーダ発生装置及びプログラム |
CN101615225A (zh) * | 2009-05-25 | 2009-12-30 | 刘晓峰 | 便携式个人电子病历及配套读写设备 |
CN101710369A (zh) * | 2009-12-18 | 2010-05-19 | 北京华大智宝电子系统有限公司 | 一种用于辅助诊疗的电子病历系统及其运行方法 |
CN101903887A (zh) * | 2007-12-21 | 2010-12-01 | 皇家飞利浦电子股份有限公司 | 临床决策支持系统的推理机的误差检测 |
CN101984448A (zh) * | 2010-12-24 | 2011-03-09 | 中山大学孙逸仙纪念医院 | 一种电子病历数据库系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1116342A (zh) * | 1994-07-08 | 1996-02-07 | 唐武 | 一种中文自动校对方法及其系统 |
JP2000132635A (ja) * | 1998-10-29 | 2000-05-12 | Hitachi Ltd | 認識データ確認方法 |
JP2002157545A (ja) * | 2000-11-22 | 2002-05-31 | Nippon Express Co Ltd | ドキュメント読取転送方法 |
FR2851357B1 (fr) * | 2003-02-19 | 2005-04-22 | Solystic | Procede pour la reconnaissance optique d'envois postaux utilisant plusieurs images |
CN100556062C (zh) * | 2007-01-10 | 2009-10-28 | 刘强 | 基于多种ocr方案组合校验以准确提取数字的方法 |
KR20100133663A (ko) * | 2009-06-12 | 2010-12-22 | 김혁만 | 전자 증례기록지 생성 장치 및 방법과 이를 이용한 임상시험 서비스 시스템 및 그 방법 |
CN101887519B (zh) * | 2010-08-16 | 2012-04-18 | 同方知网(北京)技术有限公司 | 文字识别、编改的方法 |
CN201996534U (zh) * | 2011-03-18 | 2011-10-05 | 车飞沦 | 临床医学智能诊疗系统 |
CN102999698A (zh) * | 2012-11-21 | 2013-03-27 | 无锡市妇幼保健院 | 潜在危重病管理系统及方法 |
-
2013
- 2013-07-17 CN CN201511021528.8A patent/CN105550524B/zh active Active
- 2013-07-17 CN CN201511026452.8A patent/CN105608325B/zh active Active
- 2013-07-17 CN CN201511021525.4A patent/CN105468929B/zh active Active
- 2013-07-17 CN CN201310300966.2A patent/CN103425975B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009146340A (ja) * | 2007-12-18 | 2009-07-02 | Konica Minolta Medical & Graphic Inc | 医用画像システム、検査オーダ発生装置及びプログラム |
CN101903887A (zh) * | 2007-12-21 | 2010-12-01 | 皇家飞利浦电子股份有限公司 | 临床决策支持系统的推理机的误差检测 |
CN101236579A (zh) * | 2008-02-20 | 2008-08-06 | 杭州创业软件股份有限公司 | 一种动态结构化的电子病历 |
CN101615225A (zh) * | 2009-05-25 | 2009-12-30 | 刘晓峰 | 便携式个人电子病历及配套读写设备 |
CN101710369A (zh) * | 2009-12-18 | 2010-05-19 | 北京华大智宝电子系统有限公司 | 一种用于辅助诊疗的电子病历系统及其运行方法 |
CN101984448A (zh) * | 2010-12-24 | 2011-03-09 | 中山大学孙逸仙纪念医院 | 一种电子病历数据库系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107833600A (zh) * | 2017-10-25 | 2018-03-23 | 医渡云(北京)技术有限公司 | 医疗数据录入核查方法及装置、存储介质、电子设备 |
CN110288052A (zh) * | 2019-03-27 | 2019-09-27 | 北京爱数智慧科技有限公司 | 字符识别方法、装置、设备及计算机可读介质 |
CN113724825A (zh) * | 2021-09-06 | 2021-11-30 | 浙江海心智惠科技有限公司 | 一种基于病历ocr的患教视频诊疗方案拣选匹配系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103425975B (zh) | 2016-05-18 |
CN105608325B (zh) | 2018-05-15 |
CN105550524B (zh) | 2018-02-13 |
CN105608325A (zh) | 2016-05-25 |
CN105468929A (zh) | 2016-04-06 |
CN105468929B (zh) | 2018-01-02 |
CN103425975A (zh) | 2013-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105550524A (zh) | 一种新型临床病例数据采集系统及采集方法 | |
CN103413261B (zh) | 一种通用型临床试验电子数据获取系统和获取方法 | |
Drobac et al. | Optical character recognition with neural networks and post-correction with finite state methods | |
US10482174B1 (en) | Systems and methods for identifying form fields | |
US20220004878A1 (en) | Systems and methods for synthetic document and data generation | |
US7310773B2 (en) | Removal of extraneous text from electronic documents | |
US11501549B2 (en) | Document processing using hybrid rule-based artificial intelligence (AI) mechanisms | |
US11816138B2 (en) | Systems and methods for parsing log files using classification and a plurality of neural networks | |
CN109949938A (zh) | 用于将医疗非标准名称标准化的方法及装置 | |
US20220414345A1 (en) | Official document processing method, device, computer equipment and storage medium | |
US9110852B1 (en) | Methods and systems for extracting information from text | |
AU2021212025A1 (en) | Intelligent question answering on tabular content | |
US20070150259A1 (en) | Apparatus, Method, and Program Product for Translation and Method of Providing Translation Support Service | |
CN107992306A (zh) | 一种航电软件接口实现一致性自动检查方法 | |
CN113241138B (zh) | 医疗事件信息的抽取方法、装置、计算机设备及存储介质 | |
CN103425976A (zh) | 一种临床病例报告表识别系统及识别方法 | |
CN113283231A (zh) | 获取签章位的方法、设置系统、签章系统及存储介质 | |
CN113642562A (zh) | 基于图像识别的数据解读方法、装置、设备及存储介质 | |
CN116958996A (zh) | Ocr信息提取方法、系统及设备 | |
CN113722421B (zh) | 一种合同审计方法和系统,及计算机可读存储介质 | |
CN114612919A (zh) | 一种票据信息处理系统及方法、装置 | |
CN100347702C (zh) | 基于结构分析的可扩展标记语言键约束验证方法 | |
EP3640861A1 (en) | Systems and methods for parsing log files using classification and a plurality of neural networks | |
CN110852359A (zh) | 基于深度学习的家谱识别方法及系统 | |
KR20140123647A (ko) | 지식재산권 분석 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |