CN110147791A - 文字识别方法、装置、设备及存储介质 - Google Patents
文字识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110147791A CN110147791A CN201910419855.0A CN201910419855A CN110147791A CN 110147791 A CN110147791 A CN 110147791A CN 201910419855 A CN201910419855 A CN 201910419855A CN 110147791 A CN110147791 A CN 110147791A
- Authority
- CN
- China
- Prior art keywords
- information
- target
- identification text
- word
- target identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 26
- 230000015654 memory Effects 0.000 claims description 17
- 238000013135 deep learning Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 238000002604 ultrasonography Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例公开了一种文字识别方法、装置、设备及存储介质。该方法包括:获取第一信息系统中目标对象的目标信息,并对目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词;将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。本发明实施例的技术方案解决了无法针对于专业词进行精确匹配,造成识别到的文字精度低,实现更准确地识别出专业词汇。
Description
技术领域
本发明实施例涉及医学应用技术领域,尤其涉及一种文字识别方法、装置、设备及存储介质。
背景技术
目前医院往往需要使用多个厂家提供的医学系统(例如PACS/RIS系统)。不同的厂家提供的医学系统的功能不同,往往需要这些医学系统之间相互调用,以实现医学数据的共享和更高级的诊断内容。
现有技术中,为了实现不同医学系统之间的调用,可以对某一医学系统屏幕取词并通过光学字符识别(Optical Character Recognition,OCR)识别出文字,根据识别出的文字调用另一医学系统。由于有些医学系统的系统界面包含的内容复杂,此外有些文字不清楚,这一方法无法针对于医学专业词库与DICOM字段进行精确匹配,造成识别到的文字精度低,无法打开需要调用的更高级的诊断应用。
发明内容
本发明实施例提供了一种文字识别方法、装置、设备及存储介质,以实现更准确识别文字。
第一方面,本发明实施例提供了一种文字识别方法,该方法包括:
获取第一信息系统中目标对象的目标信息,并对所述目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词;
将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。
第二方面,本发明实施例还提供了一种文字识别装置,该装置包括:
取词模块,用于获取第一信息系统中目标对象的目标信息,并对所述目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词;
识别模块,用于将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。
第三方面,本发明实施例还提供了一种文字识别设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例中任一所述的文字识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例中任一所述的文字识别方法。
本发明实施例的技术方案通过获取第一信息系统中目标对象的所述目标信息,并对目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词,能够获取待识别的专业词汇。进而,将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。本发明实施例的技术方案解决了无法针对于专业词进行精确匹配,造成识别到的文字精度低,实现更准确地识别出专业词汇。
附图说明
图1a是本发明实施例一中提供的一种文字识别方法的流程图;
图1b是本发明实施例一中提供的一种医学知识模型的优化过程的流程图;
图2a是本发明实施例二中提供的一种文字识别方法的流程图;
图2b是本发明实施例二中提供的一种医学系统之间的调用的流程图;
图3是本发明实施例三中提供的一种文字识别装置的流程图;
图4是本发明实施例四中的提供的一种文字识别设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1a为本发明实施例一提供的文字识别方法的流程图,本实施例可适用于识别文字的情况,尤其适用于识别医学系统中的文字。该方法可以由文字识别装置来执行,该装置可以由硬件和/或软件来实现,该装置可集成于设备(例如计算机)中来执行,具体包括如下步骤:
步骤101、获取第一信息系统中目标对象的目标信息,并对目标信息进行屏幕取词得到目标图片。
其中,信息系统是指某些领域所使用的一些管理平台,这些平台上包含多个界面、窗口以及相关的各种信息,包括各种图片、文字等信息。例如信息系统可以是企业管理系统,也可以某些专用领域的信息系统例如影像归档和通信系统(PACS系统)、放射信息管理系统(RIS系统)等。
由于不同厂商提供的信息系统的界面标准不一,界面上包含的文字、图片等有些也会比较模糊,因此如果只采用传统的OCR识别效果往往识别出错率高。
目标对象包括待识别的对象。以医学信息系统为例,目标对象包括待识别的病人等。目标信息可以是指信息系统界面上出现的各类信息。以医学信息系统为例,当打开相关信息系统时,界面上会显示患者的各种诊断信息,例如一些诊断报告、诊断图像、相关字段(例如病人姓名、病人ID等)。
其中,屏幕取词包括通过鼠标、相关快捷键进行屏幕截图得到待识别的图片。
可选的,所述屏幕取词包括截图取词以及鼠标光标取词的至少一种。
其中,所述目标图片包括所述目标信息中的至少一个专业词。
目标图片即为通过屏幕取词得到的待识别的图片。其中,图片中可以直接包含相关的专业词的文字,例如“病人姓名”、“病人编号”等,也可以就是图片,图片可以表示某些专业的含义,例如超声图片,可以将超声图片理解成包含着“超声”这一专业词。
专业词包括相关领域的专业词汇,是目标图片包含的待识别的信息。
步骤102、将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。
其中,目标知识模型可以是通过一些传统的机器识别算法经过训练得到的机器学习模型,也可以是通过深度学习(例如神经网络)经过训练得到的深度学习模型。
目标标识文字是指专业词输入至所述训练完成的目标知识模型中识别出的对应的文字。
以采用深度学习模型为例,说明本实施例目标知识模型的训练方法。
可选的,获取所述第一信息系统中历史对象的历史信息,并对所述历史信息进行屏幕取词得到历史图片以及与所述历史专业词对应的目标标识文字,其中,所述历史图片包括所述历史信息中的至少一个历史专业词;
历史对象包括之前收集的对象(例如患者)。历史信息是指历史对象对应的第一信息系统显示的相关信息(例如诊断报告等)。同样,历史图片以及历史专业词同样表示用于训练的样本数据。与所述历史专业词对应的目标标识文字即为对应的标注数据。
其中,该过程表示收集训练数据将训练数据用于训练。训练数据包括通过截取信息系统得到的图片,图片中包括相关的专业词的文字,例如“病人姓名”、“病人编号”等以及这些图片对应的实际的文字作为标注文字,也可以是超声图片等不包含文字而有具体含义的图片,例如超声图像、磁共振图像等以及图片对应的标注文字。
根据所述历史图片和与所述历史专业词对应的目标标识文字对预先建立的原始深度学习网络进行训练;
其中,原始深度学习网络可以包括长短期记忆网络LSTM等常见的神经网络模型。
根据所述原始深度学习网络的输出结果对所述原始深度学习网络进行优化,将优化后的达到预设训练结束条件的所述原始深度学习网络作为目标知识模型。
其中,预设训练结束条件是指模型收敛或者识别准确率达到预设值,例如95%。目标知识模型是指经过训练网络参数得到优化后的深度学习网络。此时,将测试数据(例如图片)输入到优化后的深度学习网络,可以识别出文字。
示例性的,以目标知识模型为医学知识模型为例,医学知识模型的优化过程可以表示为如图1b所示。首先通过屏幕取词得到医学专业词数据集以及其对应的目标标识文字数据集,对原始的医学知识模型(如LSTM模型)进行优化,得到优化后的医学知识模型,优化后的医学知识模型中,网络参数(例如权重等)进行了调整和优化。
本发明实施例的技术方案通过获取第一信息系统中目标对象的目标信息,并对目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词,能够获取待识别的专业词汇。进而,将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。本发明实施例的技术方案解决了无法针对于专业词进行精确匹配,造成识别到的文字精度低,实现更准确地识别出专业词汇。
实施例二
图2a为本发明实施例二提供的一种文字识别方法的流程图,本实施例在上述实施例的基础上,可选的是还包括以下至少一项:将所述目标标识文字输入至预先建立的知识库中得到与所述目标标识文字对应的第一输出结果,根据所述第一输出结果更新所述目标标识文字;
将所述目标标识文字输入至预先建立的对应关系库中得到与所述目标标识文字对应的第二输出结果,根据所述第二输出结果更新所述目标标识文字。
在此基础上,进一步地,将所述得到的目标标识文字保存到第二信息系统;
所述保存到第二信息系统的目标标识文字与第一信息系统中目标对象的目标信息对应。
在此基础上,进一步地,根据所述目标标识文字以及预先建立的对应关系库确定所述第二信息系统中与所述目标标识文字对应的调用信息,其中,所述对应关系库用于存储所述第一信息系统的信息字段和所述第二信息系统的信息字段之间的对应关系,所述调用信息用于调用所述第二信息系统。
在此基础上,进一步地,根据所述第一信息系统显示的信息字段和所述第二信息系统中的信息字段建立所述对应关系库。
在此基础上,进一步地,
根据所述目标标识文字以及预先建立的对应关系库确定所述第二信息系统中与所述目标标识文字对应的调用信息,包括:
根据所述第一信息系统的目标标识文字,在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段;
根据所述信息字段确定所述第二信息系统中与所述目标标识文字对应的调用信息;
在此基础上,进一步地,
根据所述第一信息系统的目标标识文字,在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段,包括:
根据所述第一信息系统的目标标识文字确定所述第一信息系统的各信息字段与所述目标标识文字对应的相似度;
根据所述相似度在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段。
在此基础上,进一步地,所述专业词包括医学专业词和DICOM字段;所述目标标识文字包括对所述医学专业词和DICOM字段输入至所述训练完成的目标知识模型中识别出的对应的文字;所述知识库包括医学专业词和DICOM字段;所述信息系统包括医学信息系统;所述目标信息包括医学信息。
如图2a表示,本实施例的方法具体包括如下步骤:
步骤201、获取第一信息系统中目标对象的目标信息,并对目标信息进行屏幕取词得到目标图片。
其中,所述目标图片包括所述目标信息中的至少一个专业词。
步骤202、将所述目标图片输入至训练完成的目标知识模型中,得到与所述专业词对应的目标标识文字。
步骤203、将所述目标标识文字输入至预先建立的知识库中得到与所述目标标识文字对应的第一输出结果,根据所述第一输出结果更新所述目标标识文字。
可选的,将所述目标标识文字输入至预先建立的对应关系库中得到与所述目标标识文字对应的第二输出结果,根据所述第二输出结果更新所述目标标识文字。
在步骤203之后或者在步骤203之前,可以将所述目标标识文字输入至预先建立的对应关系库中得到与所述目标标识文字对应的第二输出结果,根据所述第二输出结果更新所述目标标识文字。或者只采用预先建立的知识库、预先建立的对应关系库中的任一一个对所述目标标识文字进行更新。
本实施中的“第一”、“第二”等词汇仅仅是为了区分,没有特殊含义。
其中,知识库是指预先存储的目标标识文字与实际的正确文字之间的映射关系。举例而言,如果通过目标知识模型识别出的目标标识文字是错误的,例如将“病人姓名”识别成了“病人生名”或“病大姓名”等错误的文字,而知识库中已经存储了“病人生名”与“病大姓名”对应的应该是“病人姓名”,则可以通过预先建立的知识库中对目标知识模型的识别结果进行进一步的纠错,通过建立的知识库进行更准确地识别。需要说明的是,知识库可以不断根据相关领域知识的积累进一步的扩充和完善,以进一步提高识别的精度。
其中,预先建立的对应关系库可以包含存储的不同的信息系统的信息字段之间的对应关系,由于不同信息系统之间采用的标准不同,所以可以采用不同的信息系统的信息字段之间的对应关系对目标标识文字进一步校正。
步骤204、将所述得到的目标标识文字保存到第二信息系统;所述保存到第二信息系统的目标标识文字与第一信息系统中目标对象的目标信息对应。
其中,第二信息系统可以是与第一信息系统不同的系统,第一信息系统通过屏幕取词识别到的目标标识文字可以实现信息的复制和传递,从而方便快捷的调用第二信息系统的用户所期望的应用。
步骤205、根据所述目标标识文字以及预先建立的对应关系库确定第二信息系统中与所述目标标识文字对应的调用信息。
其中,所述对应关系库用于存储所述第一信息系统的信息字段和所述第二信息系统的信息字段之间的对应关系,所述调用信息用于调用第二信息系统。
其中,第一信息系统的信息字段包括第一信息系统中包含的特有的专业词汇、专业领域的字段。以医学领域为例,可以包括DICOM字段。例如“病人姓名”“超声”等的字段。所述第二信息系统的信息字段包括第二信息系统中包含的特有的专业词汇、专业领域的字段。以医学领域为例,由于采用的DICOM标准或不同系统之间定义标准的不同,表示同一含义的字段两个信息系统的叫法不一致(例如“病人”和“患者”);或者一个信息系统的信息字段是中文,另一个信息系统的信息字段是英文(例如“病人”与“patient”),因此需要建立第一信息系统的信息字段与第二信息系统的信息字段的映射关系,得到第二信息系统的对应的信息字段,从而确定第二信息系统中与所述目标信息对应的调用信息。
该步骤中,根据识别出的目标标识文字(例如“超声”)首先从对应关系库中检索第二信息系统中的对应字段(例如“ultrasound”),然后根据第二信息系统中的对应字段直接对第二信息系统的相关应用(例如超声诊断应用)进行调用。
可选的,根据第一信息系统显示的信息字段和第二信息系统中的信息字段建立所述对应关系库。
可选的,
根据所述目标标识文字以及预先建立的对应关系库确定所述第二信息系统中与所述目标标识文字对应的调用信息,包括:
根据所述第一信息系统的目标标识文字,在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段;
根据所述信息字段确定所述第二信息系统中与所述目标标识文字对应的调用信息。
其中,该步骤中,根据识别出的目标标识文字(例如“超声”)首先从对应关系库中检索第二信息系统中的对应字段(例如“ultrasound”),然后根据第二信息系统中的对应字段直接对第二信息系统的相关应用(例如超声诊断应用)进行调用。
其中,第一信息系统与第二信息系统之间的调用可以采用提供的接口进行调用,也可以是其他常用的技术手段。
可选的,
根据所述第一信息系统的目标标识文字,在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段,包括:
根据所述第一信息系统的目标标识文字确定所述第一信息系统的各信息字段与所述目标标识文字对应的相似度;
根据所述相似度在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段。
根据所述第一信息系统的目标标识文字确定所述第一信息系统的各信息字段与所述目标标识文字对应的相似度中,相似度匹配的方法可以通过正则表达式等模糊匹配方法,计算出目标标识文字与第一信息系统的各信息字段的相似度。例如目标标识文字为“病大姓名”通过模糊匹配方法匹配到实际的第一信息系统的信息字段为“病人姓名”,再通过对应关系库检索第二信息系统的对应的信息字段,例如检索到了“patient name”,根据“patient name”调用相关的第二信息系统的应用。
可选的,所述专业词包括医学专业词和DICOM字段;所述目标标识文字包括对所述医学专业词和DICOM字段输入至所述训练完成的目标知识模型中识别出的对应的文字;所述知识库包括医学专业词和DICOM字段;所述信息系统包括医学信息系统;所述目标信息包括医学信息。
医学专业词包括医学领域常用的医学词汇,包括人体各种组织、器官、诊断内容、检验内容、各类检查项目等内容。
医学信息系统包括PACS、RIS、HIS等各类的常用的医学平台。
DICOM字段包括中英文字符,通过本实施例的方法能够有效识别中英文字符。
以医学信息系统为例,说明本实施例的方法,如图2b所示。首先通过屏幕取词对第一医学系统得到包含待识别专业词的图片,通过医学知识模型(深度学习模型)进行识别,然后利用知识库进行进一步纠错,得到识别出的目标标识文字,根据目标标识文字在对应关系库中检索第二医学系统对应的信息字段得到目标调用信息,根据目标调用信息调用第二医学系统。
本实施例的技术方案通过将所述目标标识文字输入至预先建立的知识库以及对应关系库的至少一种中得到与所述目标标识文字对应的输出结果,根据所述输出结果更新所述目标标识文字,进一步对识别出的文字进行纠错。进而,根据所述目标标识文字以及预先建立的对应关系库确定第二信息系统中与所述目标标识文字对应的调用信息,其中,所述对应关系库用于存储所述第一信息系统的信息字段和所述第二信息系统的信息字段之间的对应关系,所述调用信息用于调用第二信息系统,实现根据目标识别文字方便的调用第三方信息系统。进而,根据所述第一信息系统的目标标识文字确定所述第一信息系统的各信息字段与所述目标标识文字对应的相似度;根据所述相似度在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段,能够实现根据相似度确定信息字段,从而有利于调用第三方信息系统。进而,所述专业词包括医学专业词;所述目标标识文字包括对所述医学专业词和DICOM字段输入至所述训练完成的目标知识模型中识别出的对应的文字;所述知识库包括医学专业词和DICOM字段;所述信息系统包括医学信息系统;所述目标信息包括医学信息,能够提高对医学专业词和DICOM字段的字符识别精度。
实施例三
图3是本发明实施例三中提供的一种文字识别装置的结构示意图。本发明实施例所提供的文字识别装置可执行本发明任意实施例所提供的文字识别方法,该装置的具体结构如下:取词模块31和识别模块32。
其中,取词模块31,用于获取第一信息系统中目标对象的目标信息,并对目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词;
识别模块32,将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。
本发明实施例的技术方案通过获取第一信息系统中目标对象的目标信息,并对目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词,能够获取待识别的专业词汇。进而,将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。本发明实施例的技术方案解决了无法针对于专用词进行精确匹配,造成识别到的文字精度低,实现更准确地识别出专业词汇。
在上述技术方案的基础上,文字识别装置还可以包括:目标知识模型获取模块。
目标知识模型获取模块,用于获取所述第一信息系统中历史对象的历史信息,并对所述历史信息进行屏幕取词得到历史图片以及与所述历史专业词对应的目标标识文字,其中,所述历史图片包括所述历史信息中的至少一个历史专业词;
根据所述历史图片和与所述历史专业词对应的目标标识文字对预先建立的原始深度学习网络进行训练;
根据所述原始深度学习网络的输出结果对所述原始深度学习网络进行优化,将优化后的达到预设训练结束条件的所述原始深度学习网络作为目标知识模型。
在上述技术方案的基础上,文字识别装置还可以包括目标标识文字更新模块。
目标标识文字更新模块,还包括以下至少一项:将所述目标标识文字输入至预先建立的知识库中得到与所述目标标识文字对应的第一输出结果,根据所述第一输出结果更新所述目标标识文字;
将所述目标标识文字输入至预先建立的对应关系库中得到与所述目标标识文字对应的第二输出结果,根据所述第二输出结果更新所述目标标识文字。
在上述技术方案的基础上,文字识别装置还可以包括第二信息系统调用模块。
第二信息系统调用模块用于:
将所述得到的目标标识文字保存到第二信息系统;
所述保存到第二信息系统的目标标识文字与第一信息系统中目标对象的目标信息对应。
在上述技术方案的基础上,第二信息系统调用模块具体可用于:
根据所述目标标识文字以及预先建立的对应关系库确定第二信息系统中与所述目标标识文字对应的调用信息,其中,所述对应关系库用于存储所述第一信息系统的信息字段和所述第二信息系统的信息字段之间的对应关系,所述调用信息用于调用第二信息系统。
在上述技术方案的基础上,第二信息系统调用模块具体可用于:
根据第一信息系统显示的信息字段和第二信息系统中的信息字段建立所述对应关系库。
在上述技术方案的基础上,第二信息系统调用模块具体可用于:
根据所述第一信息系统的目标标识文字,在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段;
根据所述信息字段确定所述第二信息系统中与所述目标标识文字对应的调用信息
在上述技术方案的基础上,第二信息系统调用模块具体可用于:
根据所述第一信息系统的目标标识文字,在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段,包括:
根据所述第一信息系统的目标标识文字确定所述第一信息系统的各信息字段与所述目标标识文字对应的相似度;
根据所述相似度在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段。
示例性地,所述专业词包括医学专业词和DICOM字段;所述目标标识文字包括对所述医学专业词和DICOM字段输入至所述训练完成的目标知识模型中识别出的对应的文字;所述知识库包括医学专业词和DICOM字段;所述信息系统包括医学信息系统;所述目标信息包括医学信息。
示例性地,所述屏幕取词包括截图取词以及鼠标光标取词的至少一种。
示例性地,所述原始深度学习网络包括长短期记忆网络LSTM。
本发明实施例所提供的文字识别装置可执行本发明任意实施例所提供的文字识别方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种文字识别设备的结构示意图,如图4所示,该设备包括处理器40、存储器41、输入装置42和输出装置43;设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的文字识别方法对应的程序指令/模块(例如,文字识别装置中的取词模块31和识别模块32)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的文字识别方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收屏幕取词,以及产生与设备的用户设置以及功能控制有关的信号输入。输出装置43可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种文字识别方法,该方法包括:
获取第一信息系统中目标对象的目标信息,并对所述目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词;
将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的文字识别方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述文字识别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种文字识别方法,其特征在于,包括:
获取第一信息系统中目标对象的目标信息,并对所述目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词;
将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取所述第一信息系统中历史对象的历史信息,并对所述历史信息进行屏幕取词得到历史图片以及与所述历史专业词对应的目标标识文字,其中,所述历史图片包括所述历史信息中的至少一个历史专业词;
根据所述历史图片和与所述历史专业词对应的目标标识文字对预先建立的原始深度学习网络进行训练;
根据所述原始深度学习网络的输出结果对所述原始深度学习网络进行优化,将优化后的达到预设训练结束条件的所述原始深度学习网络作为目标知识模型。
3.根据权利要求1所述的方法,其特征在于,还包括以下至少一项:
将所述目标标识文字输入至预先建立的知识库中得到与所述目标标识文字对应的第一输出结果,根据所述第一输出结果更新所述目标标识文字;
将所述目标标识文字输入至预先建立的对应关系库中得到与所述目标标识文字对应的第二输出结果,根据所述第二输出结果更新所述目标标识文字。
4.根据权利要求1所述的方法,其特征在于,还包括:
将所述得到的目标标识文字保存到第二信息系统;
所述保存到所述第二信息系统的目标标识文字与所述第一信息系统中目标对象的目标信息对应。
5.根据权利要求4所述的方法,其特征在于,还包括:
根据所述目标标识文字以及预先建立的对应关系库确定所述第二信息系统中与所述目标标识文字对应的调用信息,其中,所述对应关系库用于存储所述第一信息系统的信息字段和所述第二信息系统的信息字段之间的对应关系,所述调用信息用于调用所述第二信息系统,根据所述第一信息系统显示的信息字段和所述第二信息系统中的信息字段建立所述对应关系库。
6.根据权利要求5所述的方法,其特征在于,根据所述目标标识文字以及预先建立的对应关系库确定所述第二信息系统中与所述目标标识文字对应的调用信息,包括:
根据所述第一信息系统的目标标识文字,在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段;
根据所述信息字段确定所述第二信息系统中与所述目标标识文字对应的调用信息;
其中,根据所述第一信息系统的目标标识文字,在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段,包括:
根据所述第一信息系统的目标标识文字确定所述第一信息系统的各信息字段与所述目标标识文字对应的相似度;
根据所述相似度在对应关系库中确定所述第二信息系统中与所述目标标识文字对应的信息字段。
7.根据权利要求3所述的方法,其特征在于,所述专业词包括医学专业词和DICOM字段;所述目标标识文字包括对所述医学专业词和DICOM字段输入至所述训练完成的目标知识模型中识别出的对应的文字;所述知识库包括医学专业词和DICOM字段;所述信息系统包括医学信息系统;所述目标信息包括医学信息。
8.一种文字识别装置,其特征在于,包括:
取词模块,用于获取第一信息系统中目标对象的目标信息,并对所述目标信息进行屏幕取词得到目标图片,其中,所述目标图片包括所述目标信息中的至少一个专业词;
识别模块,用于将所述目标图片输入至通过所述专业词训练得到的目标知识模型中,得到与所述专业词对应的目标标识文字。
9.一种文字识别设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的文字识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的文字识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910419855.0A CN110147791A (zh) | 2019-05-20 | 2019-05-20 | 文字识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910419855.0A CN110147791A (zh) | 2019-05-20 | 2019-05-20 | 文字识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110147791A true CN110147791A (zh) | 2019-08-20 |
Family
ID=67592254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910419855.0A Pending CN110147791A (zh) | 2019-05-20 | 2019-05-20 | 文字识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110147791A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274369A (zh) * | 2020-01-09 | 2020-06-12 | 广东小天才科技有限公司 | 一种英文单词的识别方法及装置 |
US11893776B2 (en) | 2020-10-30 | 2024-02-06 | Boe Technology Group Co., Ltd. | Image recognition method and apparatus, training method, electronic device, and storage medium |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100274589A1 (en) * | 2009-04-22 | 2010-10-28 | Gottfried Bauer | Method for outputting medical documents |
CN101980156A (zh) * | 2010-11-22 | 2011-02-23 | 上海合合信息科技发展有限公司 | 自动提取电子邮件地址并新建电子邮件的方法 |
CN105574130A (zh) * | 2015-12-14 | 2016-05-11 | 浪潮通用软件有限公司 | 一种数据传输方法及业务系统 |
CN108427953A (zh) * | 2018-02-26 | 2018-08-21 | 北京易达图灵科技有限公司 | 一种文字识别方法及装置 |
CN108664471A (zh) * | 2018-05-07 | 2018-10-16 | 平安普惠企业管理有限公司 | 文字识别纠错方法、装置、设备及计算机可读存储介质 |
CN109308475A (zh) * | 2018-07-26 | 2019-02-05 | 北京百悟科技有限公司 | 一种字体识别方法及装置 |
CN109343920A (zh) * | 2018-09-10 | 2019-02-15 | 深圳市腾讯网络信息技术有限公司 | 一种图像处理方法及其装置、设备和存储介质 |
CN109377401A (zh) * | 2018-08-24 | 2019-02-22 | 腾讯科技(武汉)有限公司 | 一种数据处理方法、装置、系统、服务器及存储介质 |
CN109461494A (zh) * | 2018-10-29 | 2019-03-12 | 北京青燕祥云科技有限公司 | 一种ris平台与影像辅助诊断系统例数据同步方法 |
CN109492644A (zh) * | 2018-10-16 | 2019-03-19 | 深圳壹账通智能科技有限公司 | 一种习题图像的匹配识别方法及终端设备 |
CN109510897A (zh) * | 2018-10-25 | 2019-03-22 | 维沃移动通信有限公司 | 一种表情图片管理方法及移动终端 |
WO2019071660A1 (zh) * | 2017-10-09 | 2019-04-18 | 平安科技(深圳)有限公司 | 票据信息识别方法、电子装置及可读存储介质 |
-
2019
- 2019-05-20 CN CN201910419855.0A patent/CN110147791A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100274589A1 (en) * | 2009-04-22 | 2010-10-28 | Gottfried Bauer | Method for outputting medical documents |
CN101980156A (zh) * | 2010-11-22 | 2011-02-23 | 上海合合信息科技发展有限公司 | 自动提取电子邮件地址并新建电子邮件的方法 |
CN105574130A (zh) * | 2015-12-14 | 2016-05-11 | 浪潮通用软件有限公司 | 一种数据传输方法及业务系统 |
WO2019071660A1 (zh) * | 2017-10-09 | 2019-04-18 | 平安科技(深圳)有限公司 | 票据信息识别方法、电子装置及可读存储介质 |
CN108427953A (zh) * | 2018-02-26 | 2018-08-21 | 北京易达图灵科技有限公司 | 一种文字识别方法及装置 |
CN108664471A (zh) * | 2018-05-07 | 2018-10-16 | 平安普惠企业管理有限公司 | 文字识别纠错方法、装置、设备及计算机可读存储介质 |
CN109308475A (zh) * | 2018-07-26 | 2019-02-05 | 北京百悟科技有限公司 | 一种字体识别方法及装置 |
CN109377401A (zh) * | 2018-08-24 | 2019-02-22 | 腾讯科技(武汉)有限公司 | 一种数据处理方法、装置、系统、服务器及存储介质 |
CN109343920A (zh) * | 2018-09-10 | 2019-02-15 | 深圳市腾讯网络信息技术有限公司 | 一种图像处理方法及其装置、设备和存储介质 |
CN109492644A (zh) * | 2018-10-16 | 2019-03-19 | 深圳壹账通智能科技有限公司 | 一种习题图像的匹配识别方法及终端设备 |
CN109510897A (zh) * | 2018-10-25 | 2019-03-22 | 维沃移动通信有限公司 | 一种表情图片管理方法及移动终端 |
CN109461494A (zh) * | 2018-10-29 | 2019-03-12 | 北京青燕祥云科技有限公司 | 一种ris平台与影像辅助诊断系统例数据同步方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274369A (zh) * | 2020-01-09 | 2020-06-12 | 广东小天才科技有限公司 | 一种英文单词的识别方法及装置 |
US11893776B2 (en) | 2020-10-30 | 2024-02-06 | Boe Technology Group Co., Ltd. | Image recognition method and apparatus, training method, electronic device, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102014385B1 (ko) | 수술영상 학습 및 학습 기반 수술동작 인식 방법 및 장치 | |
US10930386B2 (en) | Automated normality scoring of echocardiograms | |
EP3483895A1 (en) | Detecting and classifying medical images based on continuously-learning whole body landmarks detections | |
US11813113B2 (en) | Automated extraction of echocardiograph measurements from medical images | |
US20190347269A1 (en) | Structured report data from a medical text report | |
EP3246836A1 (en) | Automatic generation of radiology reports from images and automatic rule out of images without findings | |
EP3444824B1 (en) | Detecting and classifying medical images based on continuously-learning whole body landmarks detections | |
CN107784057B (zh) | 医疗数据匹配方法和装置 | |
JP4719408B2 (ja) | 医療情報システム | |
US20190370383A1 (en) | Automatic Processing of Ambiguously Labeled Data | |
US20200411150A1 (en) | Automatic diagnosis report preparation | |
CN110796180B (zh) | 一种基于人工智能的模型训练系统与方法 | |
CN113689951A (zh) | 一种智能导诊方法、系统和计算机可读存储介质 | |
CN112530550A (zh) | 影像报告生成方法、装置、计算机设备和存储介质 | |
CN110147791A (zh) | 文字识别方法、装置、设备及存储介质 | |
CN115631825A (zh) | 利用自然语言模型自动生成结构化报告的方法及相关设备 | |
US20230335261A1 (en) | Combining natural language understanding and image segmentation to intelligently populate text reports | |
EP4300505A1 (en) | Medical structured reporting workflow assisted by natural language processing techniques | |
CN116258136A (zh) | 检错模型训练方法、医学影像报告检测方法、系统及设备 | |
US20220147703A1 (en) | Voice activated clinical reporting systems and methods thereof | |
CN112700862B (zh) | 目标科室的确定方法、装置、电子设备及存储介质 | |
Bergström | Automated setup of display protocols | |
EP4354452A1 (en) | Medical image search and retrieval | |
US11990226B2 (en) | Advanced loop selection systems and methods for supporting efficient echo comparison | |
WO2023240584A1 (zh) | 一种跨媒体知识语义表达方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 201807 Shanghai City, north of the city of Jiading District Road No. 2258 Applicant after: Shanghai Lianying Medical Technology Co., Ltd Address before: 201807 Shanghai City, north of the city of Jiading District Road No. 2258 Applicant before: SHANGHAI UNITED IMAGING HEALTHCARE Co.,Ltd. |
|
CB02 | Change of applicant information |