CN112348023A - 背景与文字分离方法、装置、设备及存储介质 - Google Patents

背景与文字分离方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112348023A
CN112348023A CN202011168916.XA CN202011168916A CN112348023A CN 112348023 A CN112348023 A CN 112348023A CN 202011168916 A CN202011168916 A CN 202011168916A CN 112348023 A CN112348023 A CN 112348023A
Authority
CN
China
Prior art keywords
image
separated
target
characters
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011168916.XA
Other languages
English (en)
Inventor
方伟
吴桐
蓝菊芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanyang Clear Technology Co Ltd
Original Assignee
Nanyang Clear Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanyang Clear Technology Co Ltd filed Critical Nanyang Clear Technology Co Ltd
Priority to CN202011168916.XA priority Critical patent/CN112348023A/zh
Publication of CN112348023A publication Critical patent/CN112348023A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明实施例公开了一种背景与文字分离方法、装置、设备及存储介质,其中方法包括:获取待分离图像;根据所述待分离图像的板式得到至少两张目标图像,至少两张所述目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像。其中,叠加算法通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像,使背景与文字分离,生成的文字图像便于文字识别,使得文字识别精度提高,且极大程度降低了识别错误率。

Description

背景与文字分离方法、装置、设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种背景与文字分离方法、装置、设备及存储介质。
背景技术
现今图像处理技术的快速发展,图像处理逐渐智能化、科技化,图像处理技术是用计算机对图像信息进行处理的技术,主要包括图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等。
图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别,应用非常广泛。但是实际过程中,由于时代的发展,图像内容越来越丰富,当图中背景与文字存在重合部分,图中文字信息经常由于被背景所遮挡导致不便于文字的识别,甚至无法识别,使得文字识别精度下降或识别错误。
发明内容
本申请提供了一种背景与文字分离方法、装置、设备及存储介质。
第一方面提供了一种背景与文字分离方法,其特征在于,所述方法包括:
获取待分离图像;
根据所述待分离图像的板式得到至少两张目标图像,至少两张所述目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;
将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像。
在一种可选的实施方式中,所述将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像,包括:
获取至少两张所述目标图像,对比至少两张所述目标图像同一位置的像素点的像素值是否均一致;
根据对比结果,对所述文字及所述背景进行分离,得到包含所述文字的图像。
在一种可选的实施方式中,所述根据对比结果,对所述文字及所述背景进行分离,得到包含所述文字的图像,包括:
若至少两张所述目标图像同一位置的目标像素点的像素值均一致,则记录所述目标像素点的位置信息和实际像素值,所述目标像素点为任一目标图像中的任意一个像素点;
若至少两张所述目标图像同一位置的目标像素点的像素值不均一致,则记录所述目标像素点的位置信息及预设像素值,所述预设像素值区别于所述实际像素值;
利用记录的像素点的位置信息和实际像素值,及记录的像素点的位置信息和预设像素值得到分离后的包含所述文字的图像。
在一种可选的实施方式中,所述根据所述待分离图像的板式得到至少两张目标图像,包括:
若所述待分离图像为板式为1*1,则确定所述待分离图像为目标图像;
若所述待分离图像板式为非1*1,则分割所述待分离图像,获取目标图像。
在一种可选的实施方式中,所述若所述待分离图像板式为非1*1,则分割待分离图像,获取目标图像,包括:
若所述待分离图像板式为非1*1,对所述待分离图像进行边缘检测,获取所述待分离图像中每个板式1*1图像的区域信息;
根据所述区域信息,对所述待分离图像进行分割,获取目标图像。
在一种可行实施方式中,所述对所述待分离图像进行边缘检测,获取所述待分离图像中每个板式1*1图像的区域信息,包括:
检测待分割图像行、列像素特征,确定边缘分割线;
根据所述边缘分割线,获取所述待分离图像中每个板式1*1图像的区域信息。
在一种可行实施方式中,所述将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像之后,还包括:
采用光学字符识别算法对所述包含文字的图像进行文字识别,确定所述文字的内容。
第二方面提供了一种背景与文字分离的装置,包括:
获取模块:用于获取待分离图像;
提取模块:用于根据所述待分离图像的板式得到至少两张目标图像,至少两张所述目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;
分离模块:用于将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像。
第三方面提供了一种设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如第一方面及其任一种可能的实现方式的步骤。
第四方面提供了一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如第一方面及其任一种可能的实现方式的步骤。
采用本发明实施例,具有如下有益效果:
本发明实施例公开了一种背景与文字分离方法、装置、设备及存储介质,其中方法包括:获取待分离图像;根据所述待分离图像的板式得到至少两张目标图像,至少两张所述目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像。其中,叠加算法通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像,使背景与文字分离,生成的文字图像便于文字识别,使得文字识别精度提高,且极大程度降低了识别错误率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为本发明实施例中背景与文字分离方法的流程示意图;
图2为本发明实施例中背景与文字分离方法的另一流程示意图;
图3为本发明实施例中背景与文字分离方法的又一流程示意图;
图4为本发明实施例中背景与文字分离装置的结构框图;
图5为本发明实施例中计算机设备的结构框图;
图6为本发明实施例中为同一患者同一器官的5*4板式的BMP格式医学图像;
图7为本发明另一实施例中分割后的一张板式1*1目标图像;
图8为本发明又一实施例中通过叠加算法生成的包含文字的图像。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例中背景与文字分离方法的流程示意图,该方法包括:
101、获取待分离图像;
其中,待分离图像可以为一张n*n板式或至少两张1*1板式的图像。
在本发明实施例中,以同一患者同一部位的医学图像获取待分离图像为例进行阐述:
本发明实施例中涉及的DICOM(Digital Imaging and Communications inMedicine)即医学数字成像和通信,是医学图像和相关信息的国际标准(ISO12052),在数以万计的在用医学成像设备中,DICOM是部署最为广泛的医疗信息标准之一。它定义了质量能满足临床需要的可用于数据交换的医学图像格式,提供了应用于网络环境(OSI或TCP/IP)的服务支持。
在本发明实施例中,通过DICOM标准获取电脑断层扫描(CT,Computerizedtomography)、血管摄影(Angiography)、核磁共振成像(NMRI,Nuclear magneticresonance imaging)等任意一种医学影像进行电子流影像不同截面的截取获得20张DICOM格式医学图像,并将获得的DICOM格式医学图像通过虚拟胶片集中打印服务器以5*4板式打印为电子胶片,并将获得的5*4板式电子胶片转换成在Windows环境中运行的图形图像软件都支持的BMP格式,使得转换后的5*4板式的BMP格式医学图像作为待分离图像,如图6所示为同一患者同一器官的5*4板式的BMP格式医学图像。
其中,可以理解的是,上述板式只是板式中一种,只做举例不做具体限定,且针对不同的打印习惯还可以不对图像进行排版直接以1*1板式打印,在本发明实施例中,当获得20张DICOM格式医学图像后,还可以将获得的DICOM格式医学图像通过虚拟胶片集中打印服务器直接以1*1板式打印为20张电子胶片,并将获得的多张电子胶片转换成20张1*1板式的BMP格式医学图像。
在本发明实施例中,待分离图像可以是一张5*4板式的BMP格式医学图像或20张1*1板式的BMP格式医学图像。
可以理解的是将医学图像进行格式的转换,是由于DICOM格式的医学图像支持应用于网络环境(OSI或TCP/IP),因此转换图像格式以便于在Windows环境中对图像进行分离处理。
可以理解的是,虚拟胶片集中打印服务器为用来接收从不同检查设备发送来的经过排版调窗等处理操作后的待打印DICOM格式医学图像,生成电子胶片。
可以理解的是,对于不同的待分离图像可以采取不同的获取方式,在此举例不做具体限定。
102、根据待分离图像的板式得到至少两张目标图像,至少两张目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;
103、将至少两张目标图像进行叠加算法,通过同一位置的像素点的像素值对文字及背景进行分离,得到包含文字的图像。
可以理解的是,目标图像为执行叠加算法所需图像,叠加是将至少两张图像合成一张图像,为保证叠加效果,目标图像还要是板式1*1,这样通过同一位置的像素点的像素值对文字及背景进行分离,才可达到本发明实施效果即得到包含文字的图像。
其中可以理解的是,因此,目标图像的获得以待分离图像的背景、文字、尺寸和版式确定。
可以理解的是,医学图像为了准确、全面、直观的对患者进行疾病判断,通常截取患者检查部位的不同截面的影像生成医学图像来进行分析,使得医学图像是具有不同背景、相同尺寸的图像,且针对同一患者同一器官的医学图像中所体现的文字检测信息具有相同文字且文字位置相同。
本发明实施例中,获取待分离图像为同一患者同一器官的医学图像,只是存在两种板式,所以只需根据待分离图像的板式确定目标图像即可。
本发明通过获取待分离图像;根据待分离图像的板式得到至少两张目标图像,至少两张目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;将至少两张目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及背景进行分离,得到包含文字的图像。其中,叠加算法通过同一位置的像素点的像素值对文字及背景进行分离,得到包含文字的图像,使背景与文字分离,生成的文字图像便于文字识别,使得文字识别精度提高,且极大程度降低了识别错误率。
为了更好地理解本发明实施例中的技术方案,在图1所示实施例的基础上,请参阅图2,为本发明实施例中背景与文字分离方法的另一流程示意图,该方法包括:
201、获取待分离图像;
图2所示本发明实施例中涉及到的背景与文字分离方法中包含的步骤201的相关内容,与上述图1所示实施例中涉及到的背景与文字分离方法中101步骤的内容相似,具体可以参阅图1中101步骤中描述的内容,此处不做赘述。
在本发明实施例中,参考上述对101步骤的内容描述,获取到的待分离图像可以存在两种情况,因此要对目标图像的获取进行判断。
202、若待分离图像的板式为1*1,则确定待分离图像为目标图像;
在本发明实施例中,若将获得20张DICOM格式医学图像通过虚拟胶片集中打印服务器直接以1*1板式打印为20张电子胶片,并将获得的多张电子胶片转换成20张1*1板式的BMP格式医学图像作为待分离图像,则此时待分离图像板式为1*1,此时待分离图像即可作为目标图像。
203、若待分离图像的板式为非1*1,则分割待分离图像,获取目标图像;
在本发明实施例中,若将获得的DICOM格式医学图像通过虚拟胶片集中打印服务器以5*4板式打印为电子胶片,并将排版后的电子胶片转换成5*4板式的BMP格式医学图像作为待分离图像,则此时需要对待分离图像进行分割,以获得1*1板式的目标图像。
其中,若待分离图像板式为非1*1,对待分离图像进行边缘检测,获取待分离图像中每个板式1*1图像的区域信息;
其中,检测待分割图像行、列像素特征,确定边缘分割线;
根据边缘分割线,获取待分离图像中每个板式1*1图像的区域信息。
根据区域信息,对待分离图像进行分割,获取目标图像。
在本发明实施例中,对板式5*4的待分离图像进行边缘检测,通过检测该板式中5行4列的行列像素特征,确定该板式的边缘分割线,其中,5行4列式的边缘分割线会存在6行5列,根据边缘分割线构成的矩形区域,确定区域信息,根据区域信息,对待5*4分离图像进行分割,获取20张板式1*1目标图像如图7所示,图7为分割后的一张板式1*1目标图像。
其中,对图像的边缘检测,可以选择利用Prewitt算子、sobel算子、Canny边缘检测算法等边缘检测算法,具体在此举例不做具体限定。
204、将至少两张目标图像进行叠加算法,通过同一位置的像素点的像素值对文字及背景进行分离,得到包含文字的图像。
本发明实施例通过获取待分离图像;若待分离图像的板式为1*1,则确定待分离图像为目标图像;若待分离图像的板式为非1*1,则分割待分离图像,获取目标图像;将目标图像将至少两张目标图像进行叠加算法,通过同一位置的像素点的像素值对文字及背景进行分离,得到包含文字的图像。其中,通过判断待分离图像是否符合目标图像标准,对不符合标准的图像进行分割,通过行列的边缘检测来分割不符合标准的图像,可以对待分离图像进行准确分割以获得目标图像,以便于后续叠加算法的执行,最后实现背景与文字分离,得到包含文字的图像,生成的文字图像便于文字识别,使得文字识别精度提高,且极大程度降低了识别错误率。
为了更好地理解本发明实施例中的技术方案,在图2所示另一实施例的基础上,请参阅图3,为本发明实施例中背景与文字分离方法的又一流程示意图,该方法包括:
301、获取待分离图像;
302、若待分离图像的板式为1*1,则确定待分离图像为目标图像;
303、若待分离图像的板式为非1*1,则分割待分离图像,获取目标图像;
图3所示本发明实施例中涉及到的背景与文字分离方法中包含的步骤301、302、303的相关内容,与上述图1及图2所示实施例中涉及到的背景与文字分离方法中101及201、202、203步骤的内容相似,具体可以参阅图1及图2中101及201、202、203步骤中描述的内容,此处不做赘述。
304、获取至少两张目标图像,对比至少两张目标图像同一位置的像素点的像素值是否均一致;
其中,可以理解的是在内存中,每个像素点由4字节构成,这4个字节构成像素点的像素值,代表的含义如下:第一个字节决定像素的红色值;第二个字节决定像素的绿色值;第三个字节决定像素的蓝色值;第四个字节决定像素的透明度值。上述每一个字节的取值是从0到255,比如任一位置像素点为(255,0,0,255),其中0代表完全透明,255代表完全不透明,在内存中是用二进制表示,即它是一个32位的串:11111111 00000000 0000000011111111。因为红绿蓝是三原色,自然界的大多数颜色都是通过它们的不同比例混合而成因此以此代表像素点的像素值。
在本发明实施例中,对比20张目标图像同一位置的像素点的像素值是否均一致;
其中,均一致是指20张目标图像中每张目标图片的同一位置像素点的像素值完全一样且像素点位置信息也完全一样。
其中,可以理解的是,板式1*1目标图像具有不同背景,相同文字且文字位置相同,20张板式1*1目标图像通过同一位置的像素点的像素值的对比可以判断出图像中不同背景所在区域即同一位置的像素点的像素值不均一致区域及还可以判断出相同文字且相同文字位置即同一位置的像素点的像素值均一致区域。
305、根据对比结果,对文字及背景进行分离,得到包含文字的图像。
其中,305包括:若至少两张目标图像同一位置的目标像素点的像素值均一致,则记录目标像素点的位置信息和实际像素值,目标像素点为任一目标图像中的任意一个像素点;
若至少两张目标图像同一位置的目标像素点的像素值不均一致,则记录目标像素点的位置信息及预设像素值,预设像素值区别于实际像素值;
利用记录的像素点的位置信息和实际像素值,及记录的像素点的位置信息和预设像素值得到分离后的包含文字的图像。
在本发明实施例中,对20张板式1*1目标图像的叠加算法如下:
1)提取每张1*1目标图片中所有像素点的位置,并对每张1*1目标图片的同一位置进行编号:位置1、位置2……位置N。
2)根据位置编号,对位置信息进行分组,将同一位置编号放在一组,即:位置1分组,位置2分组,……位置N分组。
3)提取同一位置的目标像素点的像素值放入对应的分组中,由于有20张目标图像,因此每个分组将会存有20个同一位置的目标像素点的像素值:
位置1分组:{1.(255,12,23,200);2.(255,12,23,200);……20.(255,12,23,200)}
位置2分组:{1.(5,12,23,200);2.(255,12,23,200);……20.(255,12,23,200)}
……
位置N分组:{1.(255,12,23,200);2.(255,12,23,200);……20.(255,12,23,200)}
4)根据分组进行组内对比,判断同一位置的目标像素点的像素值是否均一致:
可以理解的是,分组的依据是同一位置的编号,相同编号放在一组,因此均一致的判断中,对位置的判断结果为一致。
其中,还需要对同一位置的目标像素点的像素值进行是否一致的判断,根据分组存有20个同一位置的目标像素点的像素值进行组内对比:
对于位置1分组,对比每张目标图像中构成像素值,结果像素值都一致为{(255,12,23,200)},因此,此时20张目标图像位置1的目标像素点的像素值均一致,此时会记录目标像素点的位置信息:位置1和实际像素值:(255,12,23,200)。同理,位置N分组也会被记录:位置N和实际像素值:(255,12,23,200)。
对于位置2分组,对比每张目标图像中构成像素值,结果像素值存在不一致,如例所示1与2和1与20存在不一致,2与20一致,因此,该位置像素值由于存在不一致因此不会被记录,则需对该位置的像素值进行赋值一个预设像素值,其中,预设像素值区别于记录下的实际像素值,例如,上述记录的实际像素值为(255,12,23,200),因此除该像素值,可以将预设像素值设为(5,12,23,200)等与记录的实际像素值不同的像素值。此时会记录目标像素点的位置信息:位置2和预设像素值:(5,12,23,200)。
其中,将对比结果不均一致的同一位置的目标像素点的像素值设置为除实际像素值外任一一致像素值使得预设像素值与实际像素值不一致,不会对目标图像中获取的实际像素值产生覆盖,
5)通过记录的像素点的位置信息和实际像素值,及记录的像素点的位置信息和预设像素值,会得到N个位置信息和对应的N个像素值,根据得到的N个位置信息和对应的N个像素值,生成与目标图像比例一致的只包含文字信息的图像。
在本发明实施例中,生成文字图像为同一患者同一器官的医学图像中患者信息文字图像如图8所示,图8为通过叠加算法生成的包含文字的图像。
可以理解的是,由于N个位置信息是目标图像的位置信息提取,因此,可以实现生成与目标图像比例一致的图像的效果。
可以理解的是,根据图6所示每个小图中同一位置的像素点像素值均一致的点即实际像素值为文字的像素值,同一位置的像素点像素值不均一致的点为背景的像素值,因此,通过预设像素值的替换,可以达到使背景被替换为颜色一致的底色且不覆盖文字,以达到最终成与目标图像比例一致的只包含文字信息的图像的效果。
其中,可以理解的是上述实施例的描述过程中所涉及的目标图像张数、以及叠加算法的实施过程中的编号、分组等步骤的描述。都只做举例,不做具体限定。
本发明实施例通过获取待分离图像;若所述待分离图像的板式为1*1,则确定所述待分离图像为目标图像;若所述待分离图像的板式为非1*1,则分割所述待分离图像,获取目标图像;获取至少两张所述目标图像,对比至少两张所述目标图像同一位置的像素点的像素值是否均一致;根据对比结果,对所述文字及所述背景进行分离,得到包含所述文字的图像。其中,叠加算法通过记录的像素点的位置信息和实际像素值,及记录的像素点的位置信息和预设像素值,实现目标图像中背景与文字的分离,并利用记录的信息生成包含文字的图像,生成的文字图像便于文字识别,使得文字识别精度提高,且极大程度降低了识别错误率。
其中,将至少两张目标图像进行叠加算法,通过同一位置的像素点的像素值对文字及背景进行分离,得到包含文字的图像之后,还包括:
采用光学字符识别算法对所述包含文字的图像进行文字识别,确定所述文字的内容。
在本发明实施例中,可以采用OCR对获得的如图8所示图像进行文字识别,提取患者文字信息。
可以理解的是,文字提取的所用方法只做举例不做具体限定。
本发明实施例,还提供一种背景与文字分离装置,如图4所示为该装置结构框图,包括:
获取模块401:用于获取待分离图像;
提取模块402:用于根据待分离图像的板式得到至少两张目标图像,至少两张目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;
分离模块403:用于将至少两张目标图像进行叠加算法,通过同一位置的像素点的像素值对文字及背景进行分离,得到包含文字的图像。
图4所示实施例中涉及到的背景与文字分离装置中包含的各个模块的相关内容,与上述图1、图2及图3所示实施例中涉及到的背景与文字分离方法中各个步骤的内容相似,具体可以参阅图1、图2及图3中各个步骤中描述的内容,此处不做赘述。
本发明通过获取待分离图像;根据待分离图像的板式得到至少两张目标图像,至少两张目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;将至少两张目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及背景进行分离,得到包含文字的图像。其中,叠加算法通过同一位置的像素点的像素值对文字及背景进行分离,得到包含文字的图像,使背景与文字分离,生成的文字图像便于文字识别,使得文字识别精度提高,且极大程度降低了识别错误率。
本发明实施例,还提供了一种设备,图5示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图5所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现背景与文字分离方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行背景与文字分离方法。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种背景与文字分离方法,其特征在于,所述方法包括:
获取待分离图像;
根据所述待分离图像的板式得到至少两张目标图像,至少两张所述目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;
将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像。
2.根据权利要求1所述方法,其特征在于,所述将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像,包括:
获取至少两张所述目标图像,对比至少两张所述目标图像同一位置的像素点的像素值是否均一致;
根据对比结果,对所述文字及所述背景进行分离,得到包含所述文字的图像。
3.根据权利要求2所述方法,其特征在于,所述根据对比结果,对所述文字及所述背景进行分离,得到包含所述文字的图像,包括:
若至少两张所述目标图像同一位置的目标像素点的像素值均一致,则记录所述目标像素点的位置信息和实际像素值,所述目标像素点为任一目标图像中的任意一个像素点;
若至少两张所述目标图像同一位置的目标像素点的像素值不均一致,则记录所述目标像素点的位置信息及预设像素值,所述预设像素值区别于所述实际像素值;
利用记录的像素点的位置信息和实际像素值,及记录的像素点的位置信息和预设像素值得到分离后的包含所述文字的图像。
4.根据权利要求1所述方法,其特征在于,所述根据所述待分离图像的板式得到至少两张目标图像,包括:
若所述待分离图像的板式为1*1,则确定所述待分离图像为目标图像;
若所述待分离图像的板式为非1*1,则分割所述待分离图像,获取目标图像。
5.根据权利要求4所述方法,其特征在于,所述若所述待分离图像板式为非1*1,则分割待分离图像,获取目标图像,包括:
若所述待分离图像板式为非1*1,对所述待分离图像进行边缘检测,获取所述待分离图像中每个板式1*1图像的区域信息;
根据所述区域信息,对所述待分离图像进行分割,获取目标图像。
6.根据权利要求5所述方法,其特征在于,所述对所述待分离图像进行边缘检测,获取所述待分离图像中每个板式1*1图像的区域信息,包括:
检测待分割图像行、列像素特征,确定边缘分割线;
根据所述边缘分割线,获取所述待分离图像中每个板式1*1图像的区域信息。
7.根据权利要求1所述方法,其特征在于,所述将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像之后,还包括:
采用光学字符识别算法对所述包含文字的图像进行文字识别,确定所述文字的内容。
8.一种背景与文字分离的装置,其特征在于,包括:
获取模块:用于获取待分离图像;
提取模块:用于根据所述待分离图像的板式得到至少两张目标图像,至少两张所述目标图像为具有不同背景、具有相同文字且文字位置相同的相同尺寸的图像;
分离模块:用于将至少两张所述目标图像进行叠加算法,通过同一位置的像素点的像素值对所述文字及所述背景进行分离,得到包含所述文字的图像。
9.一种设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的背景与文字分离的步骤。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的背景与文字分离的步骤。
CN202011168916.XA 2020-10-28 2020-10-28 背景与文字分离方法、装置、设备及存储介质 Pending CN112348023A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011168916.XA CN112348023A (zh) 2020-10-28 2020-10-28 背景与文字分离方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011168916.XA CN112348023A (zh) 2020-10-28 2020-10-28 背景与文字分离方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112348023A true CN112348023A (zh) 2021-02-09

Family

ID=74358420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011168916.XA Pending CN112348023A (zh) 2020-10-28 2020-10-28 背景与文字分离方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112348023A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006187022A (ja) * 2006-01-18 2006-07-13 Arei Kk 医用電子装置、および、その診断用属性情報の認識方法
CN104036292A (zh) * 2014-06-12 2014-09-10 西安华海盈泰医疗信息技术有限公司 一种医学影像数字胶片中文字区域提取方法及提取系统
CN104282013A (zh) * 2013-07-08 2015-01-14 浙江大华技术股份有限公司 一种用于前景目标检测的图像处理方法及装置
CN106156691A (zh) * 2015-03-25 2016-11-23 中测高科(北京)测绘工程技术有限责任公司 复杂背景图像的处理方法及其装置
CN107220646A (zh) * 2017-05-25 2017-09-29 杭州健培科技有限公司 一种去背景干扰的医学图像文字识别增强方法
CN109409377A (zh) * 2018-12-03 2019-03-01 龙马智芯(珠海横琴)科技有限公司 图像中文字的检测方法及装置
CN110059685A (zh) * 2019-04-26 2019-07-26 腾讯科技(深圳)有限公司 文字区域检测方法、装置及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006187022A (ja) * 2006-01-18 2006-07-13 Arei Kk 医用電子装置、および、その診断用属性情報の認識方法
CN104282013A (zh) * 2013-07-08 2015-01-14 浙江大华技术股份有限公司 一种用于前景目标检测的图像处理方法及装置
CN104036292A (zh) * 2014-06-12 2014-09-10 西安华海盈泰医疗信息技术有限公司 一种医学影像数字胶片中文字区域提取方法及提取系统
CN106156691A (zh) * 2015-03-25 2016-11-23 中测高科(北京)测绘工程技术有限责任公司 复杂背景图像的处理方法及其装置
CN107220646A (zh) * 2017-05-25 2017-09-29 杭州健培科技有限公司 一种去背景干扰的医学图像文字识别增强方法
CN109409377A (zh) * 2018-12-03 2019-03-01 龙马智芯(珠海横琴)科技有限公司 图像中文字的检测方法及装置
CN110059685A (zh) * 2019-04-26 2019-07-26 腾讯科技(深圳)有限公司 文字区域检测方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN109993112B (zh) 一种图片中表格的识别方法及装置
US9524559B2 (en) Image processing device and method
CN110569769A (zh) 图像识别方法、装置、计算机设备和存储介质
JP5559619B2 (ja) 画像比較解析を用いた印刷文書における変更の検出方法
CN110443140B (zh) 文本定位的方法、装置、计算机设备及存储介质
CN111680690B (zh) 一种文字识别方法及装置
JP2015065654A (ja) 自動修復を用いたカラー文書画像セグメンテーション及び二値化
CN110363774B (zh) 图像分割方法、装置、计算机设备和存储介质
CN110728687B (zh) 文件图像分割方法、装置、计算机设备和存储介质
CN111291741B (zh) 单据识别方法、装置、计算机设备和存储介质
CN113505781A (zh) 目标检测方法、装置、电子设备及可读存储介质
CN109785940B (zh) 一种医学图像胶片排版的方法
CN112308063A (zh) 文字识别装置、翻译笔、图像翻译方法及图像翻译装置
CN116311327B (zh) 处方图像检测方法
CN112348023A (zh) 背景与文字分离方法、装置、设备及存储介质
CN108388898A (zh) 基于连接体和模板的字符识别方法
CN113256644A (zh) 票据图像分割方法、装置、介质和设备
CN113870154A (zh) 图像数据处理方法、装置、计算机设备和存储介质
US20040213444A1 (en) Medical image processing system
CN113592831B (zh) 印刷误差的检测方法、装置和存储介质
CN115797939A (zh) 一种基于深度学习的两阶段斜体字符识别方法及装置
CN112257718A (zh) 一种关于放射科胶片的文本识别方法及装置
CN112434641A (zh) 一种试题图像处理方法、装置、设备和介质
CN112115422A (zh) 检测著作权文件修改的方法、装置及设备
CN114612915B (zh) 胶片图像的患者信息提取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination