CN109670507B - 图片处理方法、装置及移动终端 - Google Patents

图片处理方法、装置及移动终端 Download PDF

Info

Publication number
CN109670507B
CN109670507B CN201811428141.8A CN201811428141A CN109670507B CN 109670507 B CN109670507 B CN 109670507B CN 201811428141 A CN201811428141 A CN 201811428141A CN 109670507 B CN109670507 B CN 109670507B
Authority
CN
China
Prior art keywords
recognition
area
areas
identification
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811428141.8A
Other languages
English (en)
Other versions
CN109670507A (zh
Inventor
巨鹏飞
朱宗伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201811428141.8A priority Critical patent/CN109670507B/zh
Publication of CN109670507A publication Critical patent/CN109670507A/zh
Application granted granted Critical
Publication of CN109670507B publication Critical patent/CN109670507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明实施例提供了一种图片处理方法装置及移动终端,其中的方法包括:根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域;对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符。本发明实施例可以减少不相关内容之间的干扰,避免将不相关的字符提取到一起,以提高字符提取的准确率。

Description

图片处理方法、装置及移动终端
技术领域
本发明涉及移动终端技术领域,特别是涉及图片处理方法、装置及移动终端。
背景技术
随着移动终端技术的发展,通过手机可以实现对图片中的文字进行识别,并且提取得到图片中的文字。
目前的文字识别技术,可以准确地识别内容较为单一的图片中的文字。例如,对于仅包含文字的图片、或者对于商标等主题较为单一的图片,识别图片中的文字的准确率较高。
然而,对于同时包含文字和图像,特别是文字和图像内容较多、且较为复杂的情况下,可能会由于受到其它内容的干扰,导致文字识别出现错误,或者把不相关的文字提取到一起,导致文字提取的准确率较低。
发明内容
本发明实施例提供图片处理方法、装置及移动终端,以解决文字提取的准确率较低的问题。
为了解决上述技术问题,第一方面,本发明实施例提供了一种图片处理方法,包括:
根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域;
对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符。
第二方面,本发明实施例还提供了一种图片处理装置,所述装置包括:
第一划分模块,用于根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域;
识别模块,用于对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符。
第三方面,本发明实施例另外还提供了一种移动终端,包括任一上述的图片处理装置。
第四方面,本发明实施例另外还提供了一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现前述的图片处理方法的步骤。
第五方面,本发明实施例另外还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现前述的图片处理方法的步骤。
本发明实施例中,本发明实施例根据背景像素之间的颜色差异,将所述图片划分为多个区域,并且分别对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符。。由于所述多个识别区域为根据背景像素之间的颜色差异划分得到,因此,每一个识别区域中的背景像素之间可以具有相同或者相似的颜色,也即每个识别区域中的字符之间具有较高的相关性,由此可以减少不相关内容之间的干扰,避免将不相关的字符提取到一起,以提高字符提取的准确率。
附图说明
图1是本发明实施例一的一种图片处理方法的步骤流程图;
图2是本发明实施例的一种包含识别区域以及子区域的图片示意图;
图3是本发明实施例二的一种图片处理方法的步骤流程图;
图4是本发明实施例三的一种图片处理装置的结构框图;
图5是本发明实施例的一种移动终端的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例可适用于通过移动终端对图片进行文字识别的应用场景。所述移动终端具体可以为智能手机、平板电脑、笔记本电脑等任意移动终端,本发明实施例对于具体的移动终端不加以限制。为便于描述,本发明实施例主要以智能手机为例进行说明,其它移动终端的应用场景相互参照即可。
【实施例一】
参照图1,示出了本发明实施例中的一种图片处理方法的步骤流程图,所述方法包括:
步骤101、根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域;
步骤102、对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符。
在实际应用中,对于包含文字的图片,图片中内容相关的文字通常位于比较相近的位置,此外,对于背景颜色较为丰富的图片,内容相关的文字区域通常具有相同或者相似的背景,相同或者相似的背景往往具有相同的背景颜色。
因此,本发明实施例可以根据图片中的背景颜色将图片划分为多个识别区域,使得每个识别区域具有相同或者相似的背景颜色,也即每个识别区域中的文字可能具有较高的相关性。本发明实施例分别对每个识别区域进行文字识别,可以减少不相关内容之间的干扰,避免将不相关的文字提取到一起,以提高文字提取的准确率。
可以理解,本发明实施例对所述图片的格式、以及大小不加以限制,所述图片可以为任意格式、任意大小的图片。
可选地,所述颜色差异具体可以包括RGB(Red、Green、Blue,红、绿、蓝)值和/或HSV(Hue,Saturation,Value,色调、饱和度、明度)值的差异,其中,RGB值指的是颜色的红(R)、绿(G)、蓝(B)三原色值,HSV值指的是颜色的色调(H)、饱和度(S)和明度(V)。
在本发明实施例中,所述背景像素是指文字显示区域所对应的背景图案中的像素。本发明实施例首先可以利用字符识别技术,识别图片中的字符,进而可以确定字符的颜色;然后,将颜色为非字符颜色的像素作为背景像素,根据背景像素的梯度确定背景像素之间的颜色差异,根据背景像素的颜色差异,将图片划分为多个识别区域,可选地,本发明实施例可以将颜色差异满足预设条件的相邻背景像素划分在不同的识别区域,以及将颜色差异不满足预设条件的相邻背景像素划分在同一个识别区域。例如,可以将颜色差异较大的相邻背景像素标记为识别区域的边界,根据标记的边界对图片进行划分。
可以理解,本领域技术人员可以根据实际情况设置所述预设条件,例如,可以设置差异值,若颜色差异超过该差异值,则确定颜色差异满足预设条件,若颜色差异不超过该差异值,则确定颜色差异不满足预设条件。
由此划分得到的多个识别区域,每一个识别区域中的背景像素之间具有相同或者相似的颜色,也即每个识别区域中文字具有相关性的概率较高。
在将图片划分为多个识别区域之后,可以分别对所述多个识别区域中的每一个识别区域进行字符识别,以提取各识别区域中的字符。其中,所述字符具体可以包括:文字、标点符号、数字、字母等任意字符。
具体地,可以采用现有的字符识别方法,如OCR(Optical CharacterRecognition,光学字符识别)方法对各识别区域进行字符识别。
在本发明的一种可选实施例中,在根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域之后,以及在对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符之前,所述方法还可以包括:
步骤S11、根据所述各识别区域中的段落信息,将所述各识别区域划分为至少一个子区域;
步骤S12、若相邻识别区域中的相邻子区域包括同一个段落的字符,则将所述相邻子区域合并为一个子区域;
所述对所述多个识别区域中的各识别区域进行字符识别,以提取各识别区域中的字符,具体可以包括:
对合并后的各识别区域中的各子区域进行字符识别,以提取各子区域中的字符。
在具体应用中,同一个段落中的内容通常具有较高的相关性,因此,为了进一步提高各识别区域中字符内容的相关性,本发明实施例在将所述图片划分为多个区域之后,以及在对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符之前,可以根据每一个区域中的段落信息,对所述各识别区域中的每一个识别区域进一步细分,将每一个识别区域划分为至少一个子区域。
可以理解,本发明实施例对所述子区域中包含段落的数量不加以限制,例如,可以以段落为单位划分子区域,使得每一个子区域中包含一个段落。具体地,本发明实施例可以针对每一个识别区域,依据段落的缩进特征、按垂直方向将识别区域划分为至少一个子区域,使得每一个子区域中包含一个段落。
在实际应用中,可能会出现同一个段落中的字符位于背景差异较大的两个识别区域的情况,这样,根据背景像素的颜色差异对图片进行划分,可能会将某一个段落的字符划分到两个识别区域中。在这种情况下,对识别区域中的字符进行识别时,可能会导致这两个识别区域中的内容都不完整。
因此,为了进一步保证段落的完整性,本发明实施例在对图片进行识别区域划分的过程中,可以记录每一个识别区域的位置信息以及与该识别区域相邻的识别区域;在对每一个识别区域进行子区域划分的过程中,可以记录每一个子区域的位置信息以及与该子区域相邻的子区域。如果确定相邻识别区域中的相邻子区域包含同一个段落的字符,则将该相邻子区域合并为一个子区域,例如,可以将位于下方的子区域合并到上方的子区域中。
参照图2,示出了本发明实施例的一种包含识别区域以及子区域的图片示意图。如图2所示,将图片划分为如下三个识别区域:识别区域1、识别区域2和识别区域3,以及根据各识别区域中的段落信息,将识别区域1划分为子区域11一个子区域,将识别区域2划分为子区域21和子区域22两个子区域,将识别区域3划分为子区域31和子区域32两个子区域。
其中,子区域11和子区域21为相邻识别区域中的相邻子区域,子区域22和子区域31为相邻识别区域中的相邻子区域,假设经过段落识别,可以确定子区域22和子区域31中包含同一个段落的字符,则可以将子区域31合并到子区域22中,则识别区域3仅包含子区域32。
可以理解,图2所示的识别区域和子区域仅作为本发明的一种应用示例,在实际应用中,本发明实施例对所述识别区域以及子区域的形状、大小等不加以限制。
通过本发明实施例,可以提高子区域中段落的完整性,进而在对各子区域进行字符识别的过程中,可以提高识别的字符的相关性和完整性,进而可以提高提取字符的准确率。
在本发明的一种可选实施例中,在对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符之后,所述方法还可以包括:
在第一显示界面,显示所述图片;
在第二显示界面,显示与所述图片的各识别区域一一对应的各展示区域,以及在所述各展示区域中,显示与展示区域相对应的识别区域中的字符;其中,所述一一对应包括:对应的识别区域和展示区域具有相同的背景颜色、以及相同的位置关系。
在本发明实施例中,在提取各识别区域中的字符之后,还可以在移动终端中对提取的字符和所述图片进行对照显示,具体地,所述移动终端的显示界面可以包括第一显示界面和第二显示界面,所述第一显示界面可用于显示所述图片,所述第二显示界面可用于显示提取的字符。例如,可以将移动终端屏幕的显示区域划分为两部分,分别作为第一显示界面和第二显示界面,以便于用户对图片以及图片中提取的字符进行对照查看。
进一步地,为了提高用户对照查看图片和字符的便利性,本发明实施例可以在第二显示界面,显示与所述图片的各识别区域一一对应的各展示区域,并且在所述各展示区域中,显示与展示区域相对应的识别区域中的字符;其中,所述一一对应具体可以包括:对应的识别区域和展示区域具有相同的背景颜色、以及相同的位置关系。
由此,用户根据展示区域与识别区域之间一一对应的关系,可以直观地得知展示区域中的字符来自于图片中的哪个识别区域,为用户查看提取结果提供更大的便利。
可选地,本发明实施例还可以在第一显示界面的图片中,用不同的颜色标识不同的子区域,以及在第二显示界面根据子区域的颜色,对相对应的展示区域进行标识,以提高子区域与展示区域的可辨识性。
需要说明的是,在实际应用中,如果图片的尺寸较大,在一个屏幕的显示界面中显示所述第一显示区域和第二显示区域,可能导致第一显示区域中的图片以及第二显示区域中的字符显示的尺寸较小,进而影响显示的清晰程度,并且为用户操作带来不便。在这种情况下,可以在单屏移动终端的屏幕中仅显示提取的字符,不显示所述图片。
在本发明的一种可选实施例中,所述方法还可以包括:响应于针对所述展示区域的移动指令,对所述展示区域的位置进行移动。
在本发明实施例中,用户还可以改变展示区域在第二显示界面中的位置。可以理解,本发明实施例对触发所述移动指令的具体方式不加以限制。例如,用户可以通过按压以及滑动展示区域的方式,触发针对该展示区域的移动指令,移动终端响应于用户针对该展示区域的移动指令,将该展示区域拖动到用户滑动的位置。
通过本发明实施例,可以在与识别区域相对应的展示区域中显示识别区域中的字符,方便用户对照查看字符提取结果,此外,本发明实施例还可以响应于用户针对展示区域触发的移动指令,调整展示区域的位置,以向用户提供文档结构的调整功能,不仅可以提高转换文档的效率,而且可以为用户提供更多的便利。
在本发明的一种可选实施例中,所述移动终端可以包括多个屏幕,所述第一显示界面和所述第二显示界面可以分别位于不同的屏幕中。
在本发明实施例中,对于单屏移动终端,可以在一个屏幕中显示第一显示界面和第二显示界面。对于多屏移动终端,可以分别在不同的屏幕中显示第一显示界面和第二显示界面,以使用户可以在不同的屏幕中查看图片以及图片中提取的字符,可以提高图片以及字符的显示效果。此外,在多屏终端中,用户可以在单独的屏幕中对展示区域的位置进行调整,可以提高用户的可操作性。
在本发明的一种可选实施例中,在对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符之后,所述方法还可以包括:在显示界面,按照所述各识别区域中的文本格式,显示所述各识别区域中的字符;其中,所述文本格式至少包括如下任意一种:段落的缩进格式、字符的大小、字符的字体、字符的颜色。
本发明实施例还可以对各识别区域中的文本格式进行识别,以在展示区域中按照对应识别区域中的文本格式,展示该识别区域中的字符,使得展示区域中展示的字符与对应识别区域中的字符具有相同的段落缩进格式、字符大小、字符字体、字符颜色等,以提高显示字符的还原度。
在本发明的一种可选实施例中,所述方法还可以包括:
步骤S31、对提取的字符进行语义分析,以确定目标字符;
步骤S32、在显示界面,对所述目标字符进行标注。
其中,所述目标字符指经过语义分析,确定可能存在错误的字符。在具体应用中,图片中的字符可能本身存在错误,导致提取出的字符也存在错误,为了提高字符提取的准确率,以及为用户后期使用提取的字符带来便利,本发明实施例可以对提取的字符进行语义分析,以检查出图片中的错误字符,并且在字符的显示界面中,对错误字符进行标注,以提醒用户该字符可能为错误字符。
可选地,所述对所述目标字符进行标注具体可以包括:在第一显示界面的所述图片中,标注所述目标字符;和/或,在第二显示界面的展示区域中,标注所述目标字符。
可以理解,本发明实施例对所述标注方式不加以限制,例如可以对目标字符进行高亮显示,或者在目标字符的旁边添加标记等。
在本发明的一种可选实施例中,所述方法还可以包括:响应于针对所述目标字符的编辑指令,对所述目标字符进行编辑。
本发明实施例还可以向用户提供目标字符的编辑功能,以使用户可以对目标字符进行编辑,将目标字符修改为正确字符。
可以理解,本发明实施例对触发所述编辑指令的具体方式不加以限制。例如,用户可以通过点击目标字符、或者长按目标字符等方式触发针对该目标字符的编辑指令。
在本发明实施例中,用户可以对目标字符执行修改、删除等编辑操作。可选地,本发明实施例还可以向用户提供可选择的正确字符。
在本发明的一种应用示例中,在对图片的各识别区域进行文字识别之后,可以在第二显示界面显示各展示区域,以及在各展示区域中显示对应识别区域中的字符,并且在目标字符的下方标注下划线,例如,经过语义分析,可以确定“百步串杨”中的“串”为错误字符,则可以在“串”字下方标注下划线,以提示用户该字符为错误字符,在接收到用户针对该错误字符的点击操作时,可以认为接收到用户触发针对该错误字符的编辑指令,则可以向用户提供正确的字符,例如可以显示如下提示消息:是否将“串”替换为“穿”?,若接收到用户的同意响应消息,则可以自动将第二显示界面中显示的“百步串杨”更新为“百步穿杨”,以实现对错误字符进行自动修改,提高编辑效率。
综上,本发明实施例根据背景像素之间的颜色差异,将所述图片划分为多个区域,并且分别对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符。。由于所述多个识别区域为根据背景像素之间的颜色差异划分得到,因此,每一个识别区域中的背景像素之间可以具有相同或者相似的颜色,也即每个识别区域中的字符之间具有较高的相关性,由此可以减少不相关内容之间的干扰,避免将不相关的文字提取到一起,以提高文字提取的准确率。
【实施例二】
参照图3,示出了本发明实施例中的另一种图片处理方法的步骤流程图,所述方法包括:
步骤301、接收待识别的图片;
步骤302、识别所述图片中的文字颜色;
具体地,本发明实施例可以利用已有的字符识别技术,识别图片中的字符,进而可以确定字符的颜色。
步骤303、根据背景像素之间的颜色差异,将所述图片划分为多个识别区域;
具体地,可以将颜色为非字符颜色的像素作为背景像素,根据背景像素的梯度确定背景像素之间的颜色差异;根据背景像素的颜色差异,将图片划分为多个识别区域,使得颜色差异满足预设条件的相邻背景像素位于不同的识别区域,以及颜色差异不满足预设条件的相邻背景像素位于同一个识别区域。
步骤304、记录每一个识别区域的位置信息以及与该识别区域相邻的识别区域;
步骤305、根据段落信息,将所述各识别区域划分为至少一个子区域;
具体地,针对每一个识别区域,依据段落的缩进特征、按垂直方向将识别区域划分为至少一个子区域;
步骤306、合并包含同一个段落字符的相邻子区域;
具体地,可以遍历所有的识别区域,针对上下相邻的识别区域,找到相邻子区域,若相邻子区域包含同一个段落的字符,则合并相邻子区域,例如,针对上下相邻的两个子区域,可以将下方的子区域合并到上方的子区域中。
步骤307、对每一个识别区域中的各子区域进行字符识别,以提取各子区域中的字符;
具体地,可以采用现有的字符识别方法,如OCR光学字符识别方法对各识别区域中的各子区域进行字符识别,以提取各子区域中的字符,并且记录提取的字符与子区域之间的对应关系。
步骤308、对每一个子区域中的字符进行语义分析,确定目标字符;
具体地,可以对每一个子区域中的字符进行语义分析,找到可能错误的目标字符,并记录目标字符的位置信息。
步骤309、根据各子区域中字符的文本格式,设置提取的字符对应的文本格式;
为了使得显示的字符和原始的图片中的字符具有相同的文本格式,本发明实施例可以识别提取的各子区域中字符的文本格式,并且设置提取的字符与所述子区域中字符的文本格式相同。
步骤310、判断移动终端的屏幕数量;若所述移动终端是单屏移动终端,则执行步骤311,若所述移动终端是多屏移动终端,则执行步骤313;
步骤311、在显示界面,按照所述文本格式显示提取的字符,下划线标注目标字符;执行步骤316;
其中,所述各识别区域和各展示区域具有一一对应的关系,也即对应的识别区域和展示区域具有相同的背景颜色、以及相同的位置关系。
本发明实施例可以根据记录的目标字符的位置,在展示区域找到所述目标字符,并且对目标字符进行标注。
具体地,用户可以手动对所述目标字符进行编辑,可选地,本发明实施例可以向用户提供可选择的正确字符。
步骤312、在多屏移动终端的第一屏幕显示所述图片,并且用不同的颜色标识不同的子区域;
步骤313、在多屏终端的第二屏幕显示各展示区域,以及在展示区域中,按照所述文本格式,显示对应识别区域中的字符,标注目标字符;
所述各展示区域中显示有与展示区域相对应的识别区域中的字符;其中,所述各识别区域和各展示区域具有一一对应的关系,也即对应的识别区域和展示区域具有相同的背景颜色、以及相同的位置关系。
本发明实施例可以根据记录的目标字符的位置,在展示区域找到所述目标字符,并且对目标字符进行标注。
步骤314、响应于针对所述展示区域的移动指令,对所述展示区域的位置进行移动;
步骤315、响应于针对所述目标字符的编辑指令,对所述目标字符进行编辑。
综上,本发明实施例根据背景像素之间的颜色差异,将所述图片划分为多个区域,并且分别对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符,以及在显示界面,显示提取的字符。其中,颜色差异满足预设条件的相邻背景像素位于不同的识别区域,以及颜色差异不满足预设条件的相邻背景像素位于同一个识别区域。由此划分得到的多个识别区域,每一个识别区域中的背景像素之间具有相同或者相似的颜色,也即每个识别区域中的字符之间具有较高的相关性,由此可以减少不相关内容之间的干扰,避免将不相关的文字提取到一起,以提高文字提取的准确率。
需要说明的是,对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明所必需的。
【实施例三】
参照图4,示出了本发明实施例中的一种图片处理装置的结构框图,所述装置包括:
第一划分模块401,用于根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域;
识别模块402,用于对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符。
可选地,所述装置还可以包括:
第二划分模块,用于根据所述各识别区域中的段落信息,将所述各识别区域划分为至少一个子区域;
合并模块,用于若相邻识别区域中的相邻子区域包括同一个段落的字符,则将所述相邻子区域合并为一个子区域;
所述识别模块,具体用于对合并后的各识别区域中的各子区域进行字符识别,以提取各子区域中的字符。
可选地,所述装置还可以包括:
第一显示模块,用于在第一显示界面,显示所述图片;
第二显示模块,用于在第二显示界面,显示与所述图片的各识别区域一一对应的各展示区域,以及在所述各展示区域中,显示与展示区域相对应的识别区域中的字符;其中,所述一一对应包括:对应的识别区域和展示区域具有相同的背景颜色、以及相同的位置关系。
可选地,所述移动终端可以包括多个屏幕,所述第一显示界面和所述第二显示界面分别位于不同的屏幕中。
可选地,所述装置还可以包括:第三显示模块,用于在显示界面,按照所述各识别区域中的文本格式,显示所述各识别区域中的字符;其中,所述文本格式至少包括如下任意一种:段落的缩进格式、字符的大小、字符的字体、字符的颜色。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5为实现本发明各个实施例的一种移动终端的硬件结构示意图。
该移动终端500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510,用于根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域;其中,颜色差异满足预设条件的相邻背景像素位于不同的识别区域,以及颜色差异不满足预设条件的相邻背景像素位于同一个识别区域;对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符;在显示界面,显示提取的字符。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他设备通信。
移动终端通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与移动终端500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获移动终端(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
移动终端500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在移动终端500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测移动终端和触摸控制器两个部分。其中,触摸检测移动终端检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测移动终端上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元508为外部移动终端与移动终端500连接的接口。例如,外部移动终端可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的移动终端的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部移动终端的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端500内的一个或多个元件或者可以用于在移动终端500和外部移动终端之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
移动终端500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,移动终端500包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种移动终端,包括处理器510,存储器509,存储在存储器509上并可在所述处理器510上运行的计算机程序,该计算机程序被处理器510执行时实现上述图片处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述图片处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者移动终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者移动终端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者移动终端中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (10)

1.一种图片处理方法,应用于移动终端,其特征在于,所述方法包括:
根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域;
对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符;
在根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域之后,以及在对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符之前,所述方法还包括:
根据所述各识别区域中的段落信息,将所述各识别区域划分为至少一个子区域;
若相邻识别区域中的相邻子区域包括同一个段落的字符,则将所述相邻子区域合并为一个子区域;
所述对所述多个识别区域中的各识别区域进行字符识别,以提取各识别区域中的字符,包括:
对合并后的各识别区域中的各子区域进行字符识别,以提取各子区域中的字符。
2.根据权利要求1所述的方法,其特征在于,在对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符之后,所述方法还包括:
在第一显示界面,显示所述图片;
在第二显示界面,显示与所述图片的各识别区域一一对应的各展示区域,以及在所述各展示区域中,显示与展示区域相对应的识别区域中的字符;其中,所述一一对应包括:对应的识别区域和展示区域具有相同的背景颜色、以及相同的位置关系。
3.根据权利要求2所述的方法,其特征在于,所述移动终端包括多个屏幕,所述第一显示界面和所述第二显示界面分别位于不同的屏幕中。
4.根据权利要求1所述的方法,其特征在于,在对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符之后,所述方法还包括:
在显示界面,按照所述各识别区域中的文本格式,显示所述各识别区域中的字符;其中,所述文本格式至少包括如下任意一种:段落的缩进格式、字符的大小、字符的字体、字符的颜色。
5.一种图片处理装置,应用于移动终端,其特征在于,所述装置包括:
第一划分模块,用于根据图片中背景像素之间的颜色差异,将所述图片划分为多个识别区域;
识别模块,用于对所述多个识别区域的各识别区域进行字符识别,以提取各识别区域中的字符;
所述装置还包括:
第二划分模块,用于根据所述各识别区域中的段落信息,将所述各识别区域划分为至少一个子区域;
合并模块,用于若相邻识别区域中的相邻子区域包括同一个段落的字符,则将所述相邻子区域合并为一个子区域;
所述识别模块,具体用于对合并后的各识别区域中的各子区域进行字符识别,以提取各子区域中的字符。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第一显示模块,用于在第一显示界面,显示所述图片;
第二显示模块,用于在第二显示界面,显示与所述图片的各识别区域一一对应的各展示区域,以及在所述各展示区域中,显示与展示区域相对应的识别区域中的字符;其中,所述一一对应包括:对应的识别区域和展示区域具有相同的背景颜色、以及相同的位置关系。
7.根据权利要求6所述的装置,其特征在于,所述移动终端包括多个屏幕,所述第一显示界面和所述第二显示界面分别位于不同的屏幕中。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:第三显示模块,用于在显示界面,按照所述各识别区域中的文本格式,显示所述各识别区域中的字符;其中,所述文本格式至少包括如下任意一种:段落的缩进格式、字符的大小、字符的字体、字符的颜色。
9.一种移动终端,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4中任一项所述图片处理方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至4中任一项所述图片处理方法的步骤。
CN201811428141.8A 2018-11-27 2018-11-27 图片处理方法、装置及移动终端 Active CN109670507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811428141.8A CN109670507B (zh) 2018-11-27 2018-11-27 图片处理方法、装置及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811428141.8A CN109670507B (zh) 2018-11-27 2018-11-27 图片处理方法、装置及移动终端

Publications (2)

Publication Number Publication Date
CN109670507A CN109670507A (zh) 2019-04-23
CN109670507B true CN109670507B (zh) 2020-11-06

Family

ID=66143245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811428141.8A Active CN109670507B (zh) 2018-11-27 2018-11-27 图片处理方法、装置及移动终端

Country Status (1)

Country Link
CN (1) CN109670507B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112764599B (zh) * 2019-11-01 2023-03-10 北京搜狗科技发展有限公司 一种数据处理方法、装置和介质
CN112053203A (zh) * 2020-08-14 2020-12-08 中国物品编码中心 商品图片的显示方法、装置及存储介质
CN112990022A (zh) * 2021-03-18 2021-06-18 广州伟宏智能科技有限公司 一种ocr文字识别提取方法
CN113282211A (zh) * 2021-04-29 2021-08-20 维沃移动通信有限公司 内容显示方法、装置、电子设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845480A (zh) * 2017-01-13 2017-06-13 河海大学 一种从图片中识别车牌的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006072744A (ja) * 2004-09-02 2006-03-16 Canon Inc 文書処理装置、その制御方法、プログラム、及び記憶媒体
JP5335574B2 (ja) * 2009-06-18 2013-11-06 キヤノン株式会社 画像処理装置及びその制御方法
US9311531B2 (en) * 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
KR102390809B1 (ko) * 2015-08-12 2022-04-26 삼성전자주식회사 영상을 제공하기 위한 방법, 전자 장치 및 저장 매체
CN108764352B (zh) * 2018-05-25 2022-09-27 百度在线网络技术(北京)有限公司 重复页面内容检测方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845480A (zh) * 2017-01-13 2017-06-13 河海大学 一种从图片中识别车牌的方法

Also Published As

Publication number Publication date
CN109670507A (zh) 2019-04-23

Similar Documents

Publication Publication Date Title
CN109670507B (zh) 图片处理方法、装置及移动终端
CN111158540B (zh) 一种应用图标的位置调整方法及电子设备
CN111586237B (zh) 一种图像显示方法及电子设备
CN107943390B (zh) 一种文字复制方法及移动终端
US11340777B2 (en) Method for editing text and mobile terminal
CN107977652B (zh) 一种屏幕显示内容的提取方法及移动终端
CN111338530B (zh) 应用程序图标的控制方法和电子设备
CN109240577B (zh) 一种截屏方法及终端
CN110196668B (zh) 信息处理方法和终端设备
US11250046B2 (en) Image viewing method and mobile terminal
US11861158B2 (en) Message processing method and electronic device
CN110913067A (zh) 一种信息发送方法及电子设备
CN110618969B (zh) 一种图标显示方法及电子设备
CN108646960B (zh) 一种文件处理方法及柔性屏终端
CN110096203B (zh) 一种截图方法及移动终端
CN110703972B (zh) 一种文件控制方法及电子设备
CN108563392B (zh) 一种图标显示控制方法及移动终端
CN110750368A (zh) 一种复制粘贴方法及终端
CN110908554A (zh) 长截图的方法及终端设备
CN111176526B (zh) 图片显示方法和电子设备
CN109669710B (zh) 便签处理方法及终端
CN111596819A (zh) 未读消息的处理方法及电子设备
CN110909776A (zh) 一种图像识别方法及电子设备
CN111274842A (zh) 编码图像的识别方法及电子设备
CN110944113A (zh) 对象显示方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant