CN113821673A - 一种图片处理方法、计算设备及可读存储介质 - Google Patents
一种图片处理方法、计算设备及可读存储介质 Download PDFInfo
- Publication number
- CN113821673A CN113821673A CN202111184323.7A CN202111184323A CN113821673A CN 113821673 A CN113821673 A CN 113821673A CN 202111184323 A CN202111184323 A CN 202111184323A CN 113821673 A CN113821673 A CN 113821673A
- Authority
- CN
- China
- Prior art keywords
- sub
- matrix
- matrices
- difference
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Library & Information Science (AREA)
- Mathematical Optimization (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种图片处理方法、计算设备及可读存储介质,该方法包括:对待处理图片进行识别,得到目标区域,目标区域为待处理图片中包括的待处理文本所在区域;将目标区域作为一个目标矩阵进行拆分处理,得到多个子矩阵以及多个子矩阵之间的方位关系;根据方位关系,将拆分后的多个子矩阵进行比对;根据比对结果,对待处理图片中的目标区域上的待处理文本进行处理。本发明通过对目标区域的子矩阵进行比对,识别目标区域上文本背景的差异,从而采用最优的方式对目标区域进行处理。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种图片处理方法、计算设备及可读存储介质。
背景技术
随着外文影视音像作品大量进入人们的日常生活,对这一类的外文图片、视频等信息载体进行处理的工作也逐渐增多,对后期处理人员提出了巨大挑战。通常,后期人员需要先对图片或视频中的文字信息进行提取,将其导出为一般文本,然后翻译人员对文本内容进行翻译,再通过Photoshop等图像/视频编辑工具将翻译后的文本增加到原来提取信息的位置上,整个处理流程周期长,需要花费大量人员的时间和精力,且需要后期处理人员具有一定的计算机技能。然而,现有的图片处理方式需要人工对每一张图片或每一帧视频进行检索、提取、翻译、再植回,工作量大、容易出现信息的遗漏、对处理人员的技术有一定的要求。
现有另一种方案,通过机器识别每一张图片或每一帧视频得到需要翻译的文本,采用单一颜色在图片或视频的外文原文区域进行覆盖,并在覆盖层上添加翻译后的文本。然而,由于外文原文的文本旁边的图像同样存在信息,采用单一颜色对原文区域进行覆盖会导致原有图片或视频信息的缺失。
为此,亟需一种新的图片处理方法以解决上述问题。
发明内容
为此,本发明提供了一种图片处理方法、计算设备及可读存储介质,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种图片处理方法,适于在计算设备中执行,方法包括:对待处理图片进行识别,得到目标区域,目标区域为待处理图片中包括的待处理文本所在区域;将目标区域作为一个目标矩阵进行拆分处理,得到多个子矩阵以及多个子矩阵之间的方位关系;根据方位关系,将拆分后的多个子矩阵进行比对;根据比对结果,对待处理图片中的目标区域上的待处理文本进行处理。
可选地,在根据本发明的图片处理方法中,方位关系包括横向方位关系、纵向方位关系和/或斜向方位关系,将拆分后的多个子矩阵进行比对的步骤,包括:对拆分后的多个子矩阵进行横向比对、纵向比对和/或斜向比对。
可选地,在根据本发明的图片处理方法中,对拆分后的多个子矩阵进行横向比对的步骤,包括:对于目标矩阵的每一行子矩阵,对该行的多个子矩阵两两进行差异计算;若该行的多个子矩阵中存在单个子矩阵与该行中其他的子矩阵之间的差异计算的值均超过预定值,则将该单个子矩阵中的每个元素替换为相邻的前后两个子矩阵元素的平均值;对每一行子矩阵进行差异计算,将计算得到的多个行的差异计算的值进行均值计算,得到第一差值作为比对结果。
可选地,在根据本发明的图片处理方法中,对拆分后的多个子矩阵进行纵向比对的步骤,包括:对于目标矩阵的每一列子矩阵,对该列的多个子矩阵两两进行差异计算;若该列的多个子矩阵中存在单个子矩阵与该列中其他的子矩阵之间的差异计算的值均超过预定值,则将该单个子矩阵中的每个元素替换为相邻的上下两个子矩阵元素的平均值;对每一列子矩阵进行差异计算,将计算得到的多个列的差异计算的值进行均值计算,得到第二差值作为比对结果。
可选地,在根据本发明的图片处理方法中,对拆分后的多个子矩阵进行斜向比对的步骤,包括:对于目标矩阵中每一斜排的子矩阵,对该斜排的多个子矩阵两两进行差异计算,若该斜排的多个子矩阵中存在单个子矩阵与该斜排中其他的子矩阵之间的差异计算的值均超过预定值,则将该单个子矩阵中的每个元素替换为相邻上下两个子矩阵元素的平均值;对每一斜排子矩阵进行差异计算,将计算得到的多个斜排的差异计算的值进行均值计算,得到第三差值作为比对结果。
可选地,在根据本发明的图片处理方法中,对待处理图片中的目标区域上的待处理文本进行处理的步骤,包括:若第一差值小于预定值,则对每一行目标矩阵中的子矩阵进行抹除处理。
可选地,在根据本发明的图片处理方法中,对待处理图片中的目标区域上的待处理文本进行处理的步骤,包括:若第二差值小于预定值,则对每一列目标矩阵中的子矩阵进行抹除处理。
可选地,在根据本发明的图片处理方法中,对待处理图片中的目标区域上的待处理文本进行处理的步骤,包括:若第三差值小于预定值,则对每一斜排目标矩阵中的子矩阵进行抹除处理。
可选地,在根据本发明的图片处理方法中,将横向比对的结果、纵向比对的结果和斜向比对的结果进行均值计算的结果作为比对结果,对待处理图片中的目标区域上的待处理文本进行处理的步骤,包括:将比对结果与预定值进行比对;若比对结果未超过预定值,则确定横向比对的结果、纵向比对的结果和斜向比对的结果中的最小值;若横向比对的结果最小,则对目标矩阵中每一行子矩阵进行抹除处理;若纵向比对的结果最小,则对目标矩阵中每一列子矩阵进行抹除处理;若斜向比对的结果最小,则对目标矩阵中每一斜排子矩阵进行抹除处理。
可选地,在根据本发明的图片处理方法中,在将比对结果与预定值进行比对的步骤之后,还包括:若比对结果超过预定值,则对待处理图片中的目标区域上的待处理文本不进行抹除处理。
可选地,在根据本发明的图片处理方法中,对目标矩阵中的子矩阵进行抹除处理的步骤,包括:将目标矩阵中当前子矩阵的元素与其相邻后一个子矩阵的元素进行均值计算的结果对当前子矩阵的元素进行替换。
可选地,在根据本发明的图片处理方法中,差异计算包括均方误差的计算。
可选地,在根据本发明的图片处理方法中,在对待处理图片进行识别后,还得到待处理文本。
可选地,在根据本发明的图片处理方法中,在得到待处理文本后的步骤之后,还包括:对待处理文本进行翻译,得到翻译后的文本。
可选地,在根据本发明的图片处理方法中,在对目标矩阵中的子矩阵进行抹除处理的步骤之后,还包括:将翻译后的文本添加到抹除处理后的目标区域上。
可选地,在根据本发明的图片处理方法中,在对待处理图片中的目标区域上的待处理文本不进行抹除处理的步骤,包括:在目标区域的附近添加翻译后的文本。
可选地,在根据本发明的图片处理方法中,识别包括光学字符识别。
根据本发明的另一个方面,提供了一种计算设备,包括:至少一个处理器;以及存储器,存储有程序指令,其中,程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行上述图片处理方法的指令。
根据本发明的还有一个方面,提供一种存储有程序指令的可读存储介质,当程序指令被计算设备读取并执行时,使得计算设备执行上述图片处理方法。
根据本发明的图片处理方法,获取待处理文本所在的目标区域,将目标区域作为一个矩阵拆分为多个子矩阵,然后对子矩阵进行比对,根据比对的结果对待处理文本进行相应处理。本发明通过对目标区域的子矩阵进行比对,识别目标区域上文本背景的差异,从而采用最优的方式对目标区域进行处理。
进一步地,根据比对的结果对目标区域添加翻译后的待处理文本,若比对结果超过预定值,则表示目标区域的像素值差异较大,那么不对待处理文本进行抹除处理,而在目标区域附近添加翻译后的文本。若比对结果不超过预定值,则表示目标区域的像素值差异较小,那么对待处理文本进行抹除处理,然后在目标区域上添加翻译后的文本。相比一律进行抹除处理的方式,本发明方案将差异较大的目标区域上待处理文本进行了保留,不会造成信息丢失的问题。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的计算设备100的结构框图;
图2示出了根据本发明一个实施例的图片处理方法200的流程图;
图3示出了根据本发明一个实施例的图片处理方法200所涉及的目标矩阵的示意图300;
图4示出了根据本发明一个实施例的图片处理方法200所涉及的横向比对的示意图400;以及
图5示出了根据本发明一个实施例的图片处理方法200所涉及的纵向比对的示意图500。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的计算设备100的结构框图。需要说明的是,图1所示的计算设备100仅为一个示例,在实践中,用于实施本发明的图片处理方法的计算设备可以是任意型号的设备,其硬件配置情况可以与图1所示的计算设备100相同,也可以与图1所示的计算设备100不同。实践中用于实施本发明的图片处理方法的计算设备可以对图1所示的计算设备100的硬件组件进行增加或删减,本发明对计算设备的具体硬件配置情况不做限制。
如图1所示,在基本配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器RAM,磁盘中的数据需要加载至物理内存中才能够被处理器104读取。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。操作系统120例如可以是Linux、Windows等,其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用122包括用于实现各种用户期望的功能的程序指令,应用122例如可以是浏览器、即时通讯软件、软件开发工具(例如集成开发环境IDE、编译器等)等,但不限于此。当应用122被安装到计算设备100中时,可以向操作系统120添加驱动模块。
在计算设备100启动运行时,处理器104会从系统存储器106中读取操作系统120的程序指令并执行。应用122运行在操作系统120之上,利用操作系统120以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用122时,应用122会加载至系统存储器106中,处理器104从系统存储器106中读取并执行应用122的程序指令。
计算设备100还包括储存设备132,储存设备132包括可移除储存器136和不可移除储存器138,可移除储存器136和不可移除储存器138均与储存接口总线134连接。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
在根据本发明的计算设备100中,应用122包括用于执行本发明的图片处理方法200的指令,该指令可以指示处理器104执行本发明的图片处理方法。本领域技术人员可以理解,除了用于执行图片处理方法200的指令之外,应用122还可以包括用于实现其他功能的其他应用126。
图2示出了根据本发明一个实施例的图片处理方法200的流程图,方法200适于在计算设备(例如图1所示的计算设备100)中执行。如图2所示,该方法200始于步骤S210。在步骤S210中,对待处理图片进行识别,得到目标区域。其中,目标区域表示待处理图片中包括的待处理文本所在的区域。
需要说明的是,这里也可以对视频进行识别。由于视频也是由每一帧图片构成,在对视频进行处理时,将视频中包含待处理文本的帧作为待处理图片进行识别。例如,在对影片进行译制时,对影片中带有外文字幕的一帧图片进行识别,识别得到图片中字幕所在的区域,如将字幕框选出来的区域。
在本发明的实施例中,目标区域可以通过光学字符识别(Optical CharacterRecognition,OCR)对图片进行识别得到。
根据本发明的一个实施例,在对待处理图片进行识别后,还得到待处理文本。其中,待处理文本例如是图片或视频当中待翻译的外文。
随后,在步骤S220中,将图片中的目标区域作为一个矩阵(目标矩阵)进行拆分处理,得到多个子矩阵以及多个子矩阵之间的方位关系。
具体地,图片是一个由像素组成的矩阵,而目标区域是图片中包含待处理文本的部分,因此目标区域也可以作为一个由像素构成的矩阵,称之为目标矩阵。根据需要选取预定大小的矩阵作为拆分的粒度(本发明对预定大小的矩阵的具体大小不做限定,本领域技术人员可以根据需要自行设定),然后将目标矩阵拆分为多个子矩阵,即拆分后的目标矩阵由多个预定大小的子矩阵构成,例如,目标矩阵为一个大小为16x16的矩阵,选取大小为4x4的矩阵作为拆分的粒度,将目标矩阵拆分为多个大小为4x4的子矩阵,拆分后目标矩阵的每一行包含4个4x4的子矩阵,每一列包含4个4x4的矩阵。其中,每一行的子矩阵之间具有横向的方位关系,表示这一行的子矩阵都处于同一行或同一横排。每一列的子矩阵之间则具有纵向的方位关系,表示这一列的子矩阵都处于同一列或同一纵排。而矩阵除了包含每一行、每一列,还包含由子矩阵组成的多个斜排,每一斜排的子矩阵之间则具有斜向的方位关系,表示这一斜排的子矩阵都处于同一斜排。
下面以图3为例对子矩阵之间的方位关系进行说明,图3示出了根据本发明一个实施例的图片处理方法200所涉及的目标矩阵的示意图300,如图3所示的一个大小为16x16的目标矩阵,选取大小为4x4的矩阵作为拆分的粒度,将该目标矩阵进行拆分处理后,拆分后的每个子矩阵的大小均为4x4,即图3的每个小方格代表一个4x4的子矩阵,图中标注的子矩阵中的数字例如1.1表示第一行第一列的子矩阵,从图中可以看出,子矩阵1.1、1.2、1.3、1.4处于同一行,四个子矩阵之间具有横向的方位关系;子矩阵1.2、2.1、3.1、4.1处于同一列,这四个子矩阵之间具有纵向的方位关系;而子矩阵1.1、2.2、3.3、4.4处于同一斜排,这四个子矩阵之间具有斜向的方位关系。从第一行和第一列上的子矩阵作为起点,子矩阵2.1、3,2、4.3也处于同一斜排,这三个矩阵之间也具有斜向的方位关系,子矩阵3.1和4.2也处于同一斜排,两个矩阵之间也具有斜向关系。
根据本发明的实施例,所选取的拆分粒度的大小要保证拆分后的目标矩阵的每一行或每一列的子矩阵的数量至少为2,以便在后续步骤中对子矩阵进行比对,每一行的子矩阵数量至少为2,方可对每一行的子矩阵进行横向比对,每一列的子矩阵数量至少为2,方可对每一列的子矩阵进行纵向比对,每一行和每一列的子矩阵数量都满足至少为2,方可对每一斜排的子矩阵进行斜向比对。
根据本发明的一个实施例,若在对目标矩阵进行拆分处理后,还剩余不规则的子矩阵,例如,一个18x16的目标矩阵按照4x4大小的粒度进行拆分后,在目标矩阵位于最右侧将产生一列2x4的子矩阵,而多出的这一列4个2x4的子矩阵无法进行后续的比对处理,因此,可以采用平均法对这一列多出来的子矩阵进行处理。具体地,对多出来的子矩阵中的每一个子矩阵进行处理,对于其中一个子矩阵,将该子矩阵所包含的元素(即像素值)进行取平均的计算,然后将计算得到的结果填充到该子矩阵的每一个元素中,以一个2x4的子矩阵为例,2x4的子矩阵共包含8个像素,图像的一个像素有四个通道,即R、G、B、A,这里以R1~R8、G1~G8、B1~B8、A1~A8来表示这八个像素的四个通道,然后分别计算每个通道的均值,其中,子矩阵R通道均值为:
子矩阵G通道均值、B通道均值以及A通道均值的计算方式与R通道均值计算同理,然后将计算得出的四个通道的均值赋值到2x4的子矩阵中每一个像素点上,即每个像素点的RGBA值均与其他像素点的RGBA值一致。另外,若图片为黑白图片,则图片的像素可以为单通道,每个元素仅有一个值。
随后,在步骤S230中,根据子矩阵之间的方位关系,将拆分后的多个子矩阵进行比对处理。
根据本发明的实施例,可以对拆分后的多个子矩阵进行横向比对、纵向比对和/或斜向比对。
下面对拆分后的多个子矩阵进行横向比对的步骤进行具体说明。首先,对目标矩阵的每一行子矩阵,对该行的多个子矩阵两两进行差异计算。若该行的多个子矩阵中存在单个子矩阵与该行中其他的子矩阵之间的差异均超过预定值,即单个子矩阵存在差异过大的情况,则将该单个子矩阵中的每个元素替换为相邻的前后两个子矩阵的平均值。单个子矩阵差异过大的情况,可能发生在一个图片中某个像素块的颜色与背景差异较大时,例如白色背景上出现的一小块黑色区域。
其中,求两个子矩阵之间的差异的计算方式可以采用均方误差(Mean SquareError,MSE)来计算。预定值的大小可以根据需要由本领域技术人员自行设定,本发明在此不做限制。下面以两个子矩阵为例对差异计算进行说明,在本例子当中两个子矩阵分别为,一个大小为4x4的矩阵1:[[a1,a2,a3,a4],[a5,a6,a7,a8],[a9,a10,a11,a12],[a13,a14,a15,a16]],和一个大小为4x4的矩阵2:[[b1,b2,b3,b4],[b5,b6,b7,b8],[b9,b10,b11,b12],[b13,b14,b15,b16]],采用如下的对图像矩阵进行均方误差MSE计算的公式对这两个矩阵进行差异计算:
其中,M为两个进行比对的矩阵的长,N为两个进行比对的矩阵的宽。
图4示出了根据本发明一个实施例的图片处理方法200所涉及的横向比对的示意图400,如图4所示的目标矩阵当中的一行子矩阵,其中每个小方框表示一个子矩阵,横向比对即在这一行当中,对每两个子矩阵进行比对,这里图4仅示出了第一个子矩阵与其余三个子矩阵进行比对,未示出第二个子矩阵与第三、第四个子矩阵进行比对以及第三个子矩阵与第四个子矩阵进行比对的示意。
关于横向比对,以一行四个子矩阵xs1、xs2、xs3、xs4为例进行说明,若xs1与xs2对比得到的差异的值超过预定值,则接着对xs1与xs3进行对比,如果xs1与xs3差异的值未超过预定值,则接着对xs1与xs4进行对比,如果xs1与xs4差异的值同样未超过阀值,说明xs1与其他子矩阵相比差异都比较小,仅与xs2相比差异较大,则认定xs2子矩阵为单个异常的矩阵。在确认出单个子矩阵与该行中其他的子矩阵之间的差异计算的值均超过预定值后,将该单个子矩阵(上述例子中的xs2矩阵)中的每个元素替换为相邻的前后两个子矩阵的平均值。具体地,将当前子矩阵xs的前一个子矩阵xs-1与xs的后一个子矩阵xs+1的像素取平均值,生成一个新的大小相同的矩阵xns,并将取平均后得到的矩阵xns替换原有的子矩阵xs。在上述例子中,子矩阵xs2中的每个元素将替换为子矩阵xs1和xs3相应位置上元素的平均值。在某些极端情况中,若当前子矩阵不存在前一个子矩阵时,则将当前子矩阵中元素的值修改为与后一个子矩阵相同,例如,子矩阵xs1是该行中的第一个子矩阵,该行中不存在xs1的前一个子矩阵,则将子矩阵xs1改为与其后一个子矩阵(即xs2)相同;若当前子矩阵不存在后一个子矩阵时,则将当前子矩阵中元素的值修改为与前一个子矩阵相同,例如,子矩阵xs4是该行中的最后一个子矩阵,该行中不存在xs4的后一个子矩阵,则将子矩阵xs4改为与其相邻的前面一个子矩阵(即xs3)相同。
若该行的多个子矩阵中存在不止一个子矩阵与该行中其他的子矩阵之间的差异超过预定值,即多个子矩阵存在差异过大的情况,则认为该行的差异超过预定值,即该行整体视为差异过大。根据本发明的一个实施例,排除掉该行所有的子矩阵与该行中其他的子矩阵之间的差异均未超过预定值的情况,以及排除掉单个子矩阵存在差异过大的情况,其余的情况即认为该行的差异超过预定值。
接下来,对目标矩阵的每一行子矩阵进行差异计算,得到每一行的差异计算的值。若一行当中包含两个子矩阵,这一行的差异计算的值则直接采用上文所述的对两个子矩阵进行差异计算的方式生成,这里差异计算可以选择矩阵的均方误差的计算方式。根据一种实施例,若一行当中的子矩阵数量超过两个,则可以将这一行中的子矩阵两两之间进行差异计算,得到的多个差异计算的值再进行均值计算,得到均值计算的结果作为该行的差异计算的值。
然后,将得到的每一个行的差异计算的值进行均值计算,将均值计算的结果,称为第一差值,作为横向比对的结果。根据本发明的一种实施例,将横向比对的结果与预定值进行比对,来确定是否对目标区域(具体指目标区域上的待处理文本)进行抹除处理。具体地,若第一差值低于预定值,则对每一行目标矩阵中的子矩阵进行抹除处理,若第一差值超过预定值,则不进行抹除处理。
下面对拆分后的多个子矩阵进行纵向比对的步骤进行具体说明。首先,对目标矩阵的每一列子矩阵,对该列的多个子矩阵两两进行差异计算。若该列的多个子矩阵中存在单个子矩阵与该列中其他的子矩阵之间的差异均超过预定值,即单个子矩阵存在差异过大的情况,则将该单个子矩阵中的每个元素替换为相邻的上下两个子矩阵的平均值。单个子矩阵差异过大的情况,可能发生在一个图片中某个像素块的颜色与背景差异较大时,例如白色背景上出现的一小块黑色区域。
其中,该列的多个子矩阵两两进行差异计算即对该列的多个子矩阵每两个子矩阵之间进行差异计算,具体的求两个子矩阵之间的差异的计算方式可以采用如上文所述的计算两个矩阵之间的均方误差的方式来计算,在此不做赘述。这里预定值的大小可以根据需要由本领域技术人员自行设定,本发明在此不做限制。
图5示出了根据本发明一个实施例的图片处理方法200所涉及的纵向比对的示意图500,如图5所示的目标矩阵当中的一列子矩阵,其中每个小方框表示一个子矩阵,纵向比对即在这一列当中,对每两个子矩阵进行比对,这里图5仅示出了第一个子矩阵与其余三个子矩阵进行比对,未示出第二个子矩阵与第三、第四个子矩阵进行比对以及第三个子矩阵与第四个子矩阵进行比对的示意。
关于纵向比对,以一列四个子矩阵xs1、xs2、xs3、xs4为例进行说明,若xs1与xs2对比得到的差异的值超过预定值,则接着对xs1与xs3进行对比,如果xs1与xs3差异的值未超过预定值,则接着对xs1与xs4进行对比,如果xs1与xs4差异的值同样未超过阀值,说明xs1与其他子矩阵相比差异都比较小,仅与xs2相比差异较大,则认定xs2子矩阵为单个异常的矩阵。在确认出单个子矩阵与该列中其他的子矩阵之间的差异计算的值均超过预定值后,将该单个子矩阵(上述例子中的xs2矩阵)中的每个元素替换为相邻的上下两个子矩阵的平均值。具体地,将当前子矩阵xs的上一个子矩阵xs-1与xs的下一个子矩阵xs+1的像素取平均值,生成一个新的大小相同的矩阵xns,并将取平均后得到的矩阵xns替换原有的子矩阵xs。在上述例子中,子矩阵xs2中的每个元素将替换为子矩阵xs1和xs3相应位置上元素的平均值。在某些极端情况中,若当前子矩阵不存在上一个子矩阵时,则将当前子矩阵中元素的值修改为与下一个子矩阵相同,例如,子矩阵xs1是该列中的第一个子矩阵,该列中不存在xs1的上一个子矩阵,则将子矩阵xs1改为与其下一个子矩阵(即xs2)相同;若当前子矩阵不存在下一个子矩阵时,则将当前子矩阵中元素的值修改为与前一个子矩阵相同,例如,子矩阵xs4是该列中的最后一个子矩阵,该列中不存在xs4的下一个子矩阵,则将子矩阵xs4改为与其相邻的上面一个子矩阵(即xs3)相同。
若该列的多个子矩阵中存在不止一个子矩阵与该列中其他的子矩阵之间的差异超过预定值,即多个子矩阵存在差异过大的情况,则认为该列的差异超过预定值,即该列整体视为差异过大。根据本发明的一个实施例,排除掉该列所有的子矩阵与该列中其他的子矩阵之间的差异均未超过预定值的情况,以及排除掉该列单个子矩阵存在差异过大的情况,其余的情况即认为该列的差异超过预定值。
接下来,对目标矩阵的每一列子矩阵进行差异计算,得到每一列的差异计算的值。若一列当中包含两个子矩阵,这一列的差异计算的值则直接采用上文所述的对两个子矩阵进行差异计算的方式生成,这里差异计算可以选择矩阵的均方误差的计算方式。根据一种实施例,若一列当中的子矩阵数量超过两个,则可以将这一列中的子矩阵两两之间进行差异计算,得到的多个差异计算的值再进行均值计算,得到均值计算的结果作为该列的差异计算的值。
然后,将得到的每一个列的差异计算的值进行均值计算,将均值计算的结果,称为第二差值,作为纵向比对的结果。根据本发明的一种实施例,将纵向比对的结果与预定值进行比对,来确定是否对目标区域(具体指目标区域上的待处理文本)进行抹除处理。具体地,若第二差值低于预定值,则对每一列目标矩阵中的子矩阵进行抹除处理,若第二差值超过预定值,则不进行抹除处理。
接下来,对拆分后的多个子矩阵进行斜向比对的步骤进行具体说明。首先,对目标矩阵的每一斜排子矩阵,对该斜排的多个子矩阵两两进行差异计算。若该斜排的多个子矩阵中存在单个子矩阵与该斜排中其他的子矩阵之间的差异均超过预定值,即单个子矩阵存在差异过大的情况,则将该单个子矩阵中的每个元素替换为相邻的上下两个子矩阵的平均值。单个子矩阵差异过大的情况,可能发生在一个图片中某个像素块的颜色与背景差异较大时,例如白色背景上出现的一小块黑色区域。
其中,该斜排的多个子矩阵两两进行差异计算即对该斜排的多个子矩阵每两个子矩阵之间进行差异计算,具体的求两个子矩阵之间的差异的计算方式可以采用如上文所述的计算两个矩阵之间的均方误差的方式来计算,在此不做赘述。这里预定值的大小可以根据需要由本领域技术人员自行设定,本发明在此不做限制。
下面以图3为列对斜向比对进行说明,如图3所示的目标矩阵当中斜排包括有斜排1:1.1、2.2、3.3、4.4,斜排2:1.2、2.3、3.4,斜排3:1.3、2.4.斜排4:2.1、3.2、4.3,以及斜排5:3.1、4.2。对目标矩阵的每一个斜排的多个子矩阵两两进行差异计算。
关于斜向比对,以一斜排的四个子矩阵xs1、xs2、xs3、xs4为例进行说明,若xs1与xs2对比得到的差异的值超过预定值,则接着对xs1与xs3进行对比,如果xs1与xs3差异的值未超过预定值,则接着对xs1与xs4进行对比,如果xs1与xs4差异的值同样未超过阀值,说明xs1与其他子矩阵相比差异都比较小,仅与xs2相比差异较大,则认定xs2子矩阵为单个异常的矩阵。在确认出单个子矩阵与该斜排中其他的子矩阵之间的差异计算的值均超过预定值后,将该单个子矩阵(上述例子中的xs2矩阵)中的每个元素替换为相邻的上下(图中的斜上与斜下)两个子矩阵的平均值。具体地,将当前子矩阵xs的上一个子矩阵xs-1与xs的下一个子矩阵xs+1的像素取平均值,生成一个新的大小相同的矩阵xns,并将取平均后得到的矩阵xns替换原有的子矩阵xs。在上述例子中,子矩阵xs2中的每个元素将替换为子矩阵xs1和xs3相应位置上元素的平均值。在某些极端情况中,若当前子矩阵不存在上一个子矩阵时,则将当前子矩阵中元素的值修改为与下一个子矩阵相同,例如,子矩阵xs1是该斜排中的第一个子矩阵,该斜排中不存在xs1的上一个子矩阵,则将子矩阵xs1改为与其下一个子矩阵(即xs2)相同;若当前子矩阵不存在下一个子矩阵时,则将当前子矩阵中元素的值修改为与前一个子矩阵相同,例如,子矩阵xs4是该斜排中的最后一个子矩阵,该斜排中不存在xs4的下一个子矩阵,则将子矩阵xs4改为与其相邻的上面一个子矩阵(即xs3)相同。
若该斜排的多个子矩阵中存在不止一个子矩阵与该斜排中其他的子矩阵之间的差异超过预定值,即多个子矩阵存在差异过大的情况,则认为该斜排的差异超过预定值,即该斜排整体视为差异过大。根据本发明的一个实施例,排除掉该斜排所有的子矩阵与该斜排中其他的子矩阵之间的差异均未超过预定值的情况,以及排除掉该斜排单个子矩阵存在差异过大的情况,其余的情况即认为该斜排的差异超过预定值。
接下来,对目标矩阵的每一斜排子矩阵进行差异计算,得到每一斜排的差异计算的值。若一斜排当中包含两个子矩阵,这一斜排的差异计算的值则直接采用上文所述的对两个子矩阵进行差异计算的方式生成,这里差异计算可以选择矩阵的均方误差的计算方式。根据一种实施例,若一斜排当中的子矩阵数量超过两个,则可以将这一斜排中的子矩阵两两之间进行差异计算,得到的多个差异计算的值再进行均值计算,得到均值计算的结果作为该斜排的差异计算的值。
然后,将得到的每一个斜排的差异计算的值进行均值计算,将均值计算的结果,称为第三差值,作为斜向比对的结果。根据本发明的一种实施例,将斜向比对的结果与预定值进行比对,来确定是否对目标区域(具体指目标区域上的待处理文本)进行抹除处理。具体地,若第三差值低于预定值,则对每一斜排目标矩阵中的子矩阵进行抹除处理,若第三差值超过预定值,则不进行抹除处理。
随后,在步骤S240中,根据比对结果,对待处理图片中的目标区域上的待处理文本进行处理。
其中,比对结果包括在步骤S230中得到的横向比对结果(第一差值)、纵向比对结果(第二差值)、斜向比对结果(第三差值)。
根据本发明的实施例,根据第一差值、第二差值和/或第三差值对待处理图片中的目标区域上的待处理文本进行处理。
具体地,可以根据第一差值、第二差值、第三差值当中的任一值对待处理图片进行处理。根据一种实施例,若第一差值低于预定值,则对每一行目标矩阵中的子矩阵进行抹除处理,若第一差值超过预定值,则不进行抹除处理。根据另一种实施例,若第二差值低于预定值,则对每一列目标矩阵中的子矩阵进行抹除处理,若第二差值超过预定值,则不进行抹除处理。根据再一种实施例,若第三差值低于预定值,则对每一斜排目标矩阵中的子矩阵进行抹除处理,若第三差值超过预定值,则不进行抹除处理。
根据本发明还有一个实施例,将第一差值、第二差值和第三差值的均值作为比对结果,与预定值进行比对。若比对结果超过预定值,则对待处理图片中的目标区域上的待处理文本不进行抹除处理。若比对结果未超过预定值,则确定第一差值、第二差值和第三差值中的最小值。若第一差值最小,则对目标矩阵中每一行的子矩阵进行抹除处理;若第二差值最小,则对目标矩阵中每一列的子矩阵进行抹除处理;若第三差值最小,则对目标矩阵中每一斜排的子矩阵进行抹除处理。
接下来对本发明涉及的抹除处理进行说明,具体地,在抹除处理中,将目标矩阵中当前子矩阵的元素与其相邻后一个子矩阵(或相邻下一个子矩阵)的元素进行均值计算的结果对当前子矩阵的元素进行替换。以图3所示的目标矩阵为例,若该矩阵的第一差值、第二差值和第三差值的均值未超过预定值,且第一差值是三个差值中的最小值,则对目标矩阵中每一行的子矩阵进行抹除处理,图3的目标矩阵的第一行子矩阵即1.1、1.2、1.3和1.4。将子矩阵1.1和1.2的元素进行均值计算的结果对子矩阵1.1进行替换,同理将子矩阵1.2和1.3的元素进行均值计算的结果对子矩阵1.2进行替换,其余同理。当抹除处理到最后一个子矩阵时,最后一个子矩阵仅与自身平均计算出新的像素块进行替换,即最后一个子矩阵全部元素求平均值来替换原来的元素。完成所有替换后,替换后的矩阵生成了新的图片,覆盖在原来的图片上即完成了抹除操作。
根据本发明的一个实施例,对待处理文本进行翻译,将翻译后的文本添加到抹除处理后的目标区域上。对于上述对待处理图片中的目标区域上的待处理文本不进行抹除处理的情况,在目标区域的待处理文本的附近添加翻译后的文本,这样不会丢失目标区域的重要信息,添加在目标区域的待处理文本附近的具体位置可以根据本领域技术人员的需要进行设置,例如待处理文本的下方,在此不做限制。
根据本发明的图片处理方法,获取待处理文本所在的目标区域,将目标区域作为一个矩阵拆分为多个子矩阵,然后对子矩阵进行比对,根据比对的结果对待处理文本进行相应处理。本发明通过对目标区域的子矩阵进行比对,识别目标区域上文本背景的差异,从而采用最优的方式对目标区域进行处理。
进一步地,根据比对的结果对目标区域添加翻译后的待处理文本,若比对结果超过预定值,则表示目标区域的像素值差异较大,那么不对待处理文本进行抹除处理,而在目标区域附近添加翻译后的文本。若比对结果不超过预定值,则表示目标区域的像素值差异较小,那么对待处理文本进行抹除处理,然后在目标区域上添加翻译后的文本。相比一律进行抹除处理的方式,本发明方案将差异较大的目标区域上待处理文本进行了保留,不会造成信息丢失的问题。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的文档加载方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。
Claims (10)
1.一种图片处理方法,适于在计算设备中执行,所述方法包括:
对待处理图片进行识别,得到目标区域,所述目标区域为待处理图片中包括的待处理文本所在区域;
将所述目标区域作为一个目标矩阵进行拆分处理,得到多个子矩阵以及多个子矩阵之间的方位关系;
根据所述方位关系,将拆分后的多个子矩阵进行比对;
根据比对结果,对待处理图片中的所述目标区域上的待处理文本进行处理。
2.根据权利要求1所述的方法,其中,所述方位关系包括横向方位关系、纵向方位关系和/或斜向方位关系,所述将拆分后的多个子矩阵进行比对的步骤,包括:
对所述拆分后的多个子矩阵进行横向比对、纵向比对和/或斜向比对。
3.根据权利要求2所述的方法,其中,对所述拆分后的多个子矩阵进行横向比对的步骤,包括:
对于所述目标矩阵的每一行子矩阵,对该行的多个子矩阵两两进行差异计算;
若该行的多个子矩阵中存在单个子矩阵与该行中其他的子矩阵之间的差异计算的值均超过预定值,则将该单个子矩阵中的每个元素替换为相邻的前后两个子矩阵元素的平均值;
对每一行子矩阵进行差异计算,将计算得到的多个行的差异计算的值进行均值计算,得到第一差值作为所述比对结果。
4.根据权利要求2所述的方法,其中,对所述拆分后的多个子矩阵进行纵向比对的步骤,包括:
对于所述目标矩阵的每一列子矩阵,对该列的多个子矩阵两两进行差异计算;
若该列的多个子矩阵中存在单个子矩阵与该列中其他的子矩阵之间的差异计算的值均超过预定值,则将该单个子矩阵中的每个元素替换为相邻的上下两个子矩阵元素的平均值;
对每一列子矩阵进行差异计算,将计算得到的多个列的差异计算的值进行均值计算,得到第二差值作为所述比对结果。
5.根据权利要求2所述的方法,其中,对所述拆分后的多个子矩阵进行斜向比对的步骤,包括:
对于所述目标矩阵中每一斜排的子矩阵,对该斜排的多个子矩阵两两进行差异计算,
若该斜排的多个子矩阵中存在单个子矩阵与该斜排中其他的子矩阵之间的差异计算的值均超过预定值,则将该单个子矩阵中的每个元素替换为相邻上下两个子矩阵元素的平均值;
对每一斜排子矩阵进行差异计算,将计算得到的多个斜排的差异计算的值进行均值计算,得到第三差值作为所述比对结果。
6.根据权利要求3所述的方法,所述对待处理图片中的所述目标区域上的待处理文本进行处理的步骤,包括:
若所述第一差值小于预定值,则对每一行所述目标矩阵中的子矩阵进行抹除处理。
7.根据权利要求4所述的方法,所述对待处理图片中的所述目标区域上的待处理文本进行处理的步骤,包括:
若所述第二差值小于预定值,则对每一列所述目标矩阵中的子矩阵进行抹除处理。
8.根据权利要求5所述的方法,所述对待处理图片中的所述目标区域上的待处理文本进行处理的步骤,包括:
若所述第三差值小于预定值,则对每一斜排所述目标矩阵中的子矩阵进行抹除处理。
9.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行根据权利要求1至8中任一项所述方法的指令。
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行根据权利要求1至8中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111184323.7A CN113821673B (zh) | 2021-10-09 | 2021-10-09 | 一种图片处理方法、计算设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111184323.7A CN113821673B (zh) | 2021-10-09 | 2021-10-09 | 一种图片处理方法、计算设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113821673A true CN113821673A (zh) | 2021-12-21 |
CN113821673B CN113821673B (zh) | 2023-05-05 |
Family
ID=78916386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111184323.7A Active CN113821673B (zh) | 2021-10-09 | 2021-10-09 | 一种图片处理方法、计算设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113821673B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070222775A1 (en) * | 2006-03-27 | 2007-09-27 | Epson Imaging Devices Corporation | Display device |
US20110234772A1 (en) * | 2008-12-12 | 2011-09-29 | Sony Corporation | Stereoscopic picture display, method of manufacturing the same and stereoscopic picture display method |
CN110020678A (zh) * | 2019-03-25 | 2019-07-16 | 联想(北京)有限公司 | 一种数据处理方法、电子设备及计算机存储介质 |
CN111199188A (zh) * | 2019-12-18 | 2020-05-26 | 星际空间(天津)科技发展有限公司 | 遥感影像差异图的像素处理方法、装置、存储介质及设备 |
CN111476852A (zh) * | 2020-04-10 | 2020-07-31 | 掌阅科技股份有限公司 | 阅读器刷新方法、计算设备及计算机存储介质 |
CN112528894A (zh) * | 2020-12-17 | 2021-03-19 | 科大讯飞股份有限公司 | 一种差异项判别方法及装置 |
CN112967191A (zh) * | 2021-02-19 | 2021-06-15 | 泰康保险集团股份有限公司 | 图像处理方法、装置、电子设备和存储介质 |
CN113011562A (zh) * | 2021-03-18 | 2021-06-22 | 华为技术有限公司 | 一种模型训练方法及装置 |
CN113792741A (zh) * | 2021-09-17 | 2021-12-14 | 平安普惠企业管理有限公司 | 文字识别方法、装置、设备及存储介质 |
-
2021
- 2021-10-09 CN CN202111184323.7A patent/CN113821673B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070222775A1 (en) * | 2006-03-27 | 2007-09-27 | Epson Imaging Devices Corporation | Display device |
US20110234772A1 (en) * | 2008-12-12 | 2011-09-29 | Sony Corporation | Stereoscopic picture display, method of manufacturing the same and stereoscopic picture display method |
CN110020678A (zh) * | 2019-03-25 | 2019-07-16 | 联想(北京)有限公司 | 一种数据处理方法、电子设备及计算机存储介质 |
CN111199188A (zh) * | 2019-12-18 | 2020-05-26 | 星际空间(天津)科技发展有限公司 | 遥感影像差异图的像素处理方法、装置、存储介质及设备 |
CN111476852A (zh) * | 2020-04-10 | 2020-07-31 | 掌阅科技股份有限公司 | 阅读器刷新方法、计算设备及计算机存储介质 |
CN112528894A (zh) * | 2020-12-17 | 2021-03-19 | 科大讯飞股份有限公司 | 一种差异项判别方法及装置 |
CN112967191A (zh) * | 2021-02-19 | 2021-06-15 | 泰康保险集团股份有限公司 | 图像处理方法、装置、电子设备和存储介质 |
CN113011562A (zh) * | 2021-03-18 | 2021-06-22 | 华为技术有限公司 | 一种模型训练方法及装置 |
CN113792741A (zh) * | 2021-09-17 | 2021-12-14 | 平安普惠企业管理有限公司 | 文字识别方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
CHONG-YA LI ET AL.: "Convex local sensitive low rank matrix approximation", 《2017 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS》 * |
谢远辉: "基于数字图像处理的试卷识别研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113821673B (zh) | 2023-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8107766B2 (en) | Method and system for straightening out distorted text-lines on images | |
US20190304066A1 (en) | Synthesis method of chinese printed character images and device thereof | |
JP4676225B2 (ja) | スキャン・ドキュメントから電子フォームに取り込むための方法および装置 | |
CN114820398B (zh) | 基于扩散模型的图片字体替换方法、系统、设备和介质 | |
CN110222598B (zh) | 一种视频行为识别方法、装置、存储介质和服务器 | |
CN109829453A (zh) | 一种卡证中文字的识别方法、装置以及计算设备 | |
JP4694613B2 (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
CN106991422B (zh) | 字符切割方法、装置及计算机可读存储介质和电子设备 | |
US20180232888A1 (en) | Removal of background information from digital images | |
CN109840912B (zh) | 一种图像中异常像素的修正方法及计算设备 | |
CN111368638A (zh) | 电子表格的创建方法、装置、计算机设备和存储介质 | |
CN113449724B (zh) | 一种图像文本校正方法、装置、设备及存储介质 | |
CN110766068B (zh) | 一种验证码识别方法及计算设备 | |
US8773733B2 (en) | Image capture device for extracting textual information | |
US8848984B2 (en) | Dynamic thresholds for document tamper detection | |
CN112115811A (zh) | 基于隐私保护的图像处理方法、装置和电子设备 | |
RU2633182C1 (ru) | Определение направления строк текста | |
CN112949649B (zh) | 一种文本图像的识别方法、装置及计算设备 | |
US20130315485A1 (en) | Textual information extraction method using multiple images | |
JP4460368B2 (ja) | 画像補正装置および方法,ならびに画像補正プログラム | |
CN113821673B (zh) | 一种图片处理方法、计算设备及可读存储介质 | |
CN114187598A (zh) | 手写数字识别方法、系统、设备及计算机可读存储介质 | |
CN116342973A (zh) | 一种基于半监督学习的数据标注方法和系统 | |
US20120099791A1 (en) | Straightening Out Distorted Text Lines of Images | |
US8488886B2 (en) | Font matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |