CN113130023A - Edc系统中图文识别录入方法及系统 - Google Patents

Edc系统中图文识别录入方法及系统 Download PDF

Info

Publication number
CN113130023A
CN113130023A CN202110436784.2A CN202110436784A CN113130023A CN 113130023 A CN113130023 A CN 113130023A CN 202110436784 A CN202110436784 A CN 202110436784A CN 113130023 A CN113130023 A CN 113130023A
Authority
CN
China
Prior art keywords
picture
report
check
item
check item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110436784.2A
Other languages
English (en)
Other versions
CN113130023B (zh
Inventor
许海斌
管卫华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yidixi Pharmaceutical Technology Jiaxing Co ltd
Original Assignee
Jiaxing Yidixi Computer Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiaxing Yidixi Computer Technology Co ltd filed Critical Jiaxing Yidixi Computer Technology Co ltd
Priority to CN202110436784.2A priority Critical patent/CN113130023B/zh
Publication of CN113130023A publication Critical patent/CN113130023A/zh
Application granted granted Critical
Publication of CN113130023B publication Critical patent/CN113130023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供了一种EDC系统中图文识别录入方法及系统,包括以下步骤:S1.获取由纸质报告转换而成的报告图片;S2.根据报告图片获取每一检查项的图片切片;S3.在数据录入页面的各检查项处显示相应检查项的图片切片以供用户参考。将每个检查项的图片切片直接显示在数据录入页面的相应检查项处供参考,用户在录入数据时,直接查看图片切片即可,无需翻阅纸质报告,方便用户录入,大大提升数据录入效率。

Description

EDC系统中图文识别录入方法及系统
技术领域
本发明属于临床试验数据管理技术领域,尤其是涉及一种EDC系统中图文识别录入方法及系统。
背景技术
受试者数据的录入是临床试验EDC系统的基本步骤。目前在临床实验中,出于对数据的准确率要求,受试者数据录入采用的均为人工输入方式,系统用户通过对照受试者纸质报告上的数据,进行手工文字输入,将数据录入到对应的CRF中,从而完成纸质数据到电子数据的转换。但是这样的方式仍然存在一些缺点,如,每个数据点的数据都要查看纸质报告上对应的检查项,当检查项非常多的时候,容易看错,导致录入数据错误,所以人工输入并不能完全保证数据录入的准确性;需要人工查看纸质报告,然后输入对应数据,来回切换报告和录入页面,录入效率很低。
发明内容
本发明的目的是针对上述问题,提供一种EDC系统中图文识别录入方法及系统。
为达到上述目的,本发明采用了下列技术方案:
一种EDC系统中图文识别录入方法,包括以下步骤:
S1.获取由纸质报告转换而成的报告图片;
S2.根据报告图片获取每一检查项的图片切片;
S3.在数据录入页面的各检查项处显示相应检查项的图片切片以供用户参考。
在上述的EDC系统中图文识别录入方法中,在步骤S1中,所述的报告图片为通过拍摄或扫描纸质报告而获得的纸质报告照片或纸质报告扫描件。
在上述的EDC系统中图文识别录入方法中,在步骤S2中,识别报告图片中的各检查项,并依识别结果裁切报告图片以获取每一检查项的图片切片。
在上述的EDC系统中图文识别录入方法中,每片图片切片的内容包括相应检查项的检查项名称和检查结果;数据录入页面的每个检查项包括检查项名称和检查结果录入框。
在上述的EDC系统中图文识别录入方法中,所述检查项的检查结果为数值或文字描述,且当检查结果为数值时,相应图片切片的内容还包括检查项上限值,检查项下限值和单位。
在上述的EDC系统中图文识别录入方法中,步骤S2具体包括:
S21.识别各检查项,并分别获取各检查项在报告图片上的位置区域;
S22.按照每个检查项的位置区域将各检查项从报告图片中裁切出来以获得针对各检查项的图片切片。
在上述的EDC系统中图文识别录入方法中,在步骤S1中,获取所述的报告图片后将报告图片转换为Base64编码并存入Redis缓存。
在上述的EDC系统中图文识别录入方法中,在步骤S21中,通过以下方式获取各检查项在报告图片上的位置区域:
S211.对报告图片上的文字进行识别,并获取每个文字的坐标;
S212.将同属于一个检查项的文字区域进行拼接得到各检查项的坐标区域,并将各检查项的坐标区域存储至Redis缓存;
且步骤S22具体为,从Redis缓存获取报告图片和各检查项的坐标区域,然后根据各检查项的坐标区域对所述的报告图片进行裁切以获得针对各检查项的图片切片。
在上述的EDC系统中图文识别录入方法中,在步骤S3中,同时将对各检查项识别到的检查结果显示在数据录入页面中相应的检查项处,当用户点击选择检查结果时,直接将所述的检查结果填充至相应的检查结果录入框处。
一种EDC系统中图文识别录入系统,用于执行上述的EDC系统中图文识别录入方法。
本发明的优点在于:
将每个检查项的图片切片直接显示在数据录入页面的相应检查项处供参考,用户在录入数据时,直接查看图片切片即可,无需翻阅纸质报告,方便用户录入,大大提升数据录入效率;
不限制检查项的数量,能够自动匹配检查项到数据录入页面的相应位置,无需人工查找检查项,降低人工录入时因为看错数据而导致的录入错误问题;
将系统自动识别和人工输入两者结合,用户在对某个检查项进入录入时,可以核对相应的图片切片和检查结果内容,当一致时,直接点击检查结果内容填充即可,当不一致时,参考图片切片进行手工输入,大大减轻人工输入负担,同时保证数据录入准确率。
附图说明
图1为本发明实施例一中EDC系统中图文识别录入方法的方法流程图;
图2为本发明实施例二中EDC系统中图文识别录入方法的方法流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详细的说明。
如图1所示,本实施例公开了一种EDC系统中图文识别录入方法和系统,由系统执行方法,方法包括以下步骤:
S1.获取用户上传的由纸质报告转换而成的报告图片,并将报告图片以Base64编码后存入Redis缓存,报告图片为通过拍摄或扫描纸质报告而获得的纸质报告照片或纸质报告扫描件;
S2.识别报告图片中的各检查项,并依识别结果裁切报告图片以获取每一检查项的图片切片。
S3.在数据录入页面的各检查项处显示相应检查项的图片切片以供用户参考。
具体地,每片图片切片的内容包括相应检查项的检查项名称和检查结果;数据录入页面的每个检查项包括检查项名称和检查结果录入框,图片切片被显示在数据录入页面中相应检查项处检查结果录入框的下方、上方或左边、右边。用户在数据录入页面的检查项处直接就能看到包含相应检查项所有相关内容的图片切片,无需翻阅纸质报告就能够实现对照录入。
进一步地,检查项的检查结果为数值或文字描述,且当检查结果为数值时,相应图片切片的内容还包括检查项上限值,检查项下限值和单位。
进一步地,步骤S2具体包括:
S21.识别各检查项,并分别获取各检查项在报告图片上的位置区域;
S22.按照每个检查项的位置区域将各检查项从报告图片中裁切出来以获得针对各检查项的图片切片。
具体地,在步骤S21中,通过以下方式获取各检查项在报告图片上的位置区域:
S211.对报告图片上的文字进行识别,并获取每个文字的坐标;
S212.将同属于一个检查项的文字区域进行拼接得到各检查项的坐标区域,并将各检查项的坐标区域存储至Redis缓存;坐标区域便是检查项在报告图片上的位置区域。
本实施例中获取文字坐标采用的是图文识别api技术。且步骤S22具体为,从Redis缓存获取Base64编码和各检查项的坐标区域,并将Base64编码解码获得报告图片,然后根据各检查项的坐标区域对报告图片进行裁切以获得针对各检查项的图片切片。
通过本实施例的方法,将每个检查项的图片切片直接显示在数据录入页面的相应检查项处供参考,用户在录入数据时,直接查看图片切片即可,无需翻阅纸质报告,方便用户录入,大大提升数据录入效率。并且不限制检查项的数量,能够自动匹配检查项到数据录入页面的相应位置,无需人工查找检查项,降低人工录入时因为看错数据而导致的录入错误问题。
实施例二
如图2所示,本实施例与实施例一类似,不同之处在于,本实施例中,在步骤S3中,同时将对各检查项识别到的检查结果显示在数据录入页面中相应的检查项处,当用户点击选择检查结果时,直接将检查结果的内容填充至相应的检查结果录入框处。
通过本实施例的方法,系统自动识别报告纸质报告中各检查项的检查结果,检查结果和图片切片同时作为候选输入提供给用户,方便用户对照图片切片手动输入录入值或直接点击选择检查结果作为录入值,此时无需用户手工输入,大大提升效率。本方案将系统自动识别和人工输入两者结合,用户在对某检查项进行数据录入时,可以核对相应的图片切片和检查结果内容,当一致时,直接点击检查结果填充即可,当不一致时,参考图片切片进行手动输入,大大减轻人工输入负担,同时提高数据录入准确率,可以说,这样的双重录入方式能够保证数据的绝对准确率。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
尽管本文较多地使用了报告图片、检查项、识别结果、图片切片、检查项名称、检查结果等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。

Claims (10)

1.一种EDC系统中图文识别录入方法,其特征在于,包括以下步骤:
S1.获取由纸质报告转换而成的报告图片;
S2.根据报告图片获取每一检查项的图片切片;
S3.在数据录入页面的各检查项处显示相应检查项的图片切片以供用户参考。
2.根据权利要求1所述的EDC系统中图文识别录入方法,其特征在于,在步骤S1中,所述的报告图片为通过拍摄或扫描纸质报告而获得的纸质报告照片或纸质报告扫描件。
3.根据权利要求2所述的EDC系统中图文识别录入方法,其特征在于,在步骤S2中,识别报告图片中的各检查项,并依识别结果裁切报告图片以获取每一检查项的图片切片。
4.根据权利要求3所述的EDC系统中图文识别录入方法,其特征在于,每片图片切片的内容包括相应检查项的检查项名称和检查结果;数据录入页面的每个检查项包括检查项名称和检查结果录入框。
5.根据权利要求4所述的EDC系统中图文识别录入方法,其特征在于,所述检查项的检查结果为数值或文字描述,且当检查结果为数值时,相应图片切片的内容还包括检查项上限值,检查项下限值和单位。
6.根据权利要求3-5任意一项所述的EDC系统中图文识别录入方法,其特征在于,步骤S2具体包括:
S21.识别各检查项,并分别获取各检查项在报告图片上的位置区域;
S22.按照每个检查项的位置区域将各检查项从报告图片中裁切出来以获得针对各检查项的图片切片。
7.根据权利要求6所述的EDC系统中图文识别录入方法,其特征在于,在步骤S1中,获取所述的报告图片后将报告图片转换为Base64编码并存入Redis缓存。
8.根据权利要求7所述的EDC系统中图文识别录入方法,其特征在于,在步骤S21中,通过以下方式获取各检查项在报告图片上的位置区域:
S211.对报告图片上的文字进行识别,并获取每个文字的坐标;
S212.将同属于一个检查项的文字区域进行拼接得到各检查项的坐标区域,并将各检查项的坐标区域存储至Redis缓存;
且步骤S22具体为,从Redis缓存获取报告图片和各检查项的坐标区域,然后根据各检查项的坐标区域对所述的报告图片进行裁切以获得针对各检查项的图片切片。
9.根据权利要求8所述的EDC系统中图文识别录入方法,其特征在于,在步骤S3中,同时将对各检查项识别到的检查结果显示在数据录入页面中相应的检查项处,当用户点击选择检查结果时,直接将所述的检查结果填充至相应的检查结果录入框处。
10.一种EDC系统中图文识别录入系统,其特征在于,用于执行权利要求1-9任意一项所述的EDC系统中图文识别录入方法。
CN202110436784.2A 2021-04-22 2021-04-22 Edc系统中图文识别录入方法及系统 Active CN113130023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110436784.2A CN113130023B (zh) 2021-04-22 2021-04-22 Edc系统中图文识别录入方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110436784.2A CN113130023B (zh) 2021-04-22 2021-04-22 Edc系统中图文识别录入方法及系统

Publications (2)

Publication Number Publication Date
CN113130023A true CN113130023A (zh) 2021-07-16
CN113130023B CN113130023B (zh) 2023-04-07

Family

ID=76779091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110436784.2A Active CN113130023B (zh) 2021-04-22 2021-04-22 Edc系统中图文识别录入方法及系统

Country Status (1)

Country Link
CN (1) CN113130023B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593664A (zh) * 2021-07-30 2021-11-02 嘉兴易迪希计算机技术有限公司 Edc系统中基于电子日志的数据录入方法及其edc系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06124297A (ja) * 1991-12-02 1994-05-06 Tatemura:Kk 財務仕訳データの項目別分割入力方法
JP2006163445A (ja) * 2004-12-02 2006-06-22 Oki Electric Ind Co Ltd 帳票の読取装置および読取システム、それらを用いた読取方法
JP2006244315A (ja) * 2005-03-04 2006-09-14 Aidekku:Kk データエントリーシステム
CN105678612A (zh) * 2015-12-30 2016-06-15 远光软件股份有限公司 移动端原始凭证电子化智能填单系统及方法
CN107958249A (zh) * 2017-11-21 2018-04-24 众安信息技术服务有限公司 一种基于图像的文本录入方法
CN108509109A (zh) * 2018-03-30 2018-09-07 平安科技(深圳)有限公司 票据信息录入方法、装置、计算机设备和存储介质
WO2019019446A1 (zh) * 2017-07-25 2019-01-31 平安科技(深圳)有限公司 根据影像文件在录单模板中定位的方法、装置及相关设备
CN110008933A (zh) * 2019-04-18 2019-07-12 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法
CN111209418A (zh) * 2020-01-03 2020-05-29 北京字节跳动网络技术有限公司 一种数据录入方法、装置、电子设备及可读存储介质
WO2020143325A1 (zh) * 2019-01-08 2020-07-16 平安科技(深圳)有限公司 一种电子文档的生成方法及设备
CN111797729A (zh) * 2020-06-19 2020-10-20 翰博瑞强(上海)医药科技有限公司 一种化验报告单自动识别方法
CN112116968A (zh) * 2019-06-21 2020-12-22 上海交通大学医学院附属瑞金医院 一种医学检验报告的识别方法、装置、设备及存储介质
CN112135002A (zh) * 2020-07-31 2020-12-25 钱微 一种用于财务管理的票据填报系统及其工作方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06124297A (ja) * 1991-12-02 1994-05-06 Tatemura:Kk 財務仕訳データの項目別分割入力方法
JP2006163445A (ja) * 2004-12-02 2006-06-22 Oki Electric Ind Co Ltd 帳票の読取装置および読取システム、それらを用いた読取方法
JP2006244315A (ja) * 2005-03-04 2006-09-14 Aidekku:Kk データエントリーシステム
CN105678612A (zh) * 2015-12-30 2016-06-15 远光软件股份有限公司 移动端原始凭证电子化智能填单系统及方法
WO2019019446A1 (zh) * 2017-07-25 2019-01-31 平安科技(深圳)有限公司 根据影像文件在录单模板中定位的方法、装置及相关设备
CN107958249A (zh) * 2017-11-21 2018-04-24 众安信息技术服务有限公司 一种基于图像的文本录入方法
CN108509109A (zh) * 2018-03-30 2018-09-07 平安科技(深圳)有限公司 票据信息录入方法、装置、计算机设备和存储介质
WO2020143325A1 (zh) * 2019-01-08 2020-07-16 平安科技(深圳)有限公司 一种电子文档的生成方法及设备
CN110008933A (zh) * 2019-04-18 2019-07-12 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法
CN112116968A (zh) * 2019-06-21 2020-12-22 上海交通大学医学院附属瑞金医院 一种医学检验报告的识别方法、装置、设备及存储介质
CN111209418A (zh) * 2020-01-03 2020-05-29 北京字节跳动网络技术有限公司 一种数据录入方法、装置、电子设备及可读存储介质
CN111797729A (zh) * 2020-06-19 2020-10-20 翰博瑞强(上海)医药科技有限公司 一种化验报告单自动识别方法
CN112135002A (zh) * 2020-07-31 2020-12-25 钱微 一种用于财务管理的票据填报系统及其工作方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593664A (zh) * 2021-07-30 2021-11-02 嘉兴易迪希计算机技术有限公司 Edc系统中基于电子日志的数据录入方法及其edc系统
CN113593664B (zh) * 2021-07-30 2022-11-04 嘉兴易迪希计算机技术有限公司 Edc系统中基于电子日志的数据录入方法及其edc系统

Also Published As

Publication number Publication date
CN113130023B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
US10120537B2 (en) Page-independent multi-field validation in document capture
CN111144210B (zh) 图像的结构化处理方法及装置、存储介质及电子设备
CN111582169A (zh) 图像识别数据纠错方法、装置、计算机设备和存储介质
CN111753717B (zh) 用于提取文本的结构化信息的方法、装置、设备及介质
CN108763380B (zh) 商标识别检索方法、装置、计算机设备和存储介质
CN109658485B (zh) 网页动画绘制方法、装置、计算机设备和存储介质
CN111524582B (zh) 医学影像信息的加载方法、装置、系统和计算机可读介质
US11741735B2 (en) Automatically attaching optical character recognition data to images
CN112509661B (zh) 用于识别体检报告的方法、计算设备和介质
CN113536771B (zh) 基于文本识别的要素信息提取方法、装置、设备及介质
CN111144493A (zh) 一种自动识别算法指标测试的方法、存储介质及电子终端
CN116524527A (zh) 一种表格图像文本识别方法及系统
CN113130023B (zh) Edc系统中图文识别录入方法及系统
KR20170010753A (ko) 부호의 광학적 검출 방법
CN110162301B (zh) 一种表单渲染方法、装置和存储介质
CN117709317A (zh) 报表文件的处理方法、装置及电子设备
CN112364857B (zh) 基于数值抽取的图像识别方法、装置及存储介质
CN113642562A (zh) 基于图像识别的数据解读方法、装置、设备及存储介质
CN110134920A (zh) 绘文字兼容显示方法、装置、终端及计算机可读存储介质
CN115546824A (zh) 禁忌图片识别方法、设备及存储介质
CN111627511A (zh) 眼科报告内容识别方法及装置、可读存储介质
CN113535970A (zh) 信息处理方法和装置、电子设备以及计算机可读存储介质
CN110909098A (zh) 一种云端地理信息数据分析方法及系统
CN115497113B (zh) 信息生成方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 314006 3rd floor, building 1, No.28 Huixin Road, Nanhu District, Jiaxing City, Zhejiang Province

Patentee after: Yidixi Pharmaceutical Technology (Jiaxing) Co.,Ltd.

Address before: 314006 3rd floor, building 1, No.28 Huixin Road, Nanhu District, Jiaxing City, Zhejiang Province

Patentee before: Jiaxing yidixi Computer Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder