WO2019227300A1 - 版面元素的处理方法、装置、存储介质及电子设备/终端/服务器 - Google Patents

版面元素的处理方法、装置、存储介质及电子设备/终端/服务器 Download PDF

Info

Publication number
WO2019227300A1
WO2019227300A1 PCT/CN2018/088805 CN2018088805W WO2019227300A1 WO 2019227300 A1 WO2019227300 A1 WO 2019227300A1 CN 2018088805 W CN2018088805 W CN 2018088805W WO 2019227300 A1 WO2019227300 A1 WO 2019227300A1
Authority
WO
WIPO (PCT)
Prior art keywords
layout
boundary diffusion
boundary
pixels
processed
Prior art date
Application number
PCT/CN2018/088805
Other languages
English (en)
French (fr)
Inventor
黄龙飞
Original Assignee
优视科技新加坡有限公司
优视科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 优视科技新加坡有限公司, 优视科技有限公司 filed Critical 优视科技新加坡有限公司
Priority to PCT/CN2018/088805 priority Critical patent/WO2019227300A1/zh
Priority to CN201880001163.8A priority patent/CN109643222B/zh
Publication of WO2019227300A1 publication Critical patent/WO2019227300A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1242Image or content composition onto a page

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Processing (AREA)

Abstract

本申请公开了一种版面元素的处理方法、装置、存储介质及电子设备/终端/服务器,该方法的一具体实施方式包括:根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。该实施方式避免了定界模型的建立,从而降低了实现版面元素的定界的难度,且提高了使用的便捷性,最终保证了内容消费类产品的高效发布。

Description

版面元素的处理方法、装置、存储介质及电子设备/终端/服务器 技术领域
本申请实施例涉及信息处理技术领域,尤其涉及一种版面元素的处理方法、装置、存储介质及电子设备/终端/服务器。
背景技术
包括丰富图文信息的信息内容分发载体通常称之为内容消费类产品。内容消费类产品包括但不限于传统的书籍(纸质、电子),以及电子网站、应用程序APP等。
内容消费类产品在发布前或上线之前或线上使用中,均需要对版面进行相应的元素定界,以保证按设计正常呈现。比如,对于传统印刷行业,有严格的印前对版工序以保证按设计正常发布。而对于网站、应用程序APP等,由于软件设计不可避免的设计缺陷、网络故障等原因也会造成版面错位、溢出、缺失等现象,需要在上线之前甚至在线上也要不定期对版面元素的进行定界,进一步保证了内容消费类产品对内容的正常呈现。
但是,目前的定界方案需要进行大量的数据分析并进一步建立定界模型,从而导致实现版面元素的定界的难度较大,且其使用的便捷性较差。
发明内容
有鉴于此,本申请实施例所解决的技术问题之一在于提供一种版面元素的处理方法、装置、存储介质及电子设备/终端/服务器,用以克服或者缓解现有技术中的上述技术缺陷。
本申请实施例提供了一种版面元素的处理方法,其包括:
根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;
根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
本申请实施例还提供一种版面元素的处理装置,其包括:
第一程序单元,配置用于根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;
第二程序单元,配置用于根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
本申请实施例还提供一种存储介质,其上存储上计算机可执行指令存储计算机程序,所述程序被处理器执行时实现上述任一实施例中所述的方法。
本申请实施例还提供一种电子设备/终端/服务器,其包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例中所述的方法。
本申请实施例的提供的技术方案中,根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;以及根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界,避免了定界模型的建立,从而降低了实现版面元素的定界的难度,且提高了使用的便捷性,最终保证了内容消费类产品的高效发布
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本申请实施例的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
图1为本申请实施例一中终端的结构示意图;
图2为本申请实施例二中版面元素的处理方法流程示意图;
图3为本申请实施例三中版面元素的处理方法流程示意图;
图4为本实施例四中扩散方向的示意图;
图5为本实施例五中进行了沿着右下顶点方向进行扩散后的边界示意图;
图6为本申请实施例六中版面元素的处理方法流程示意图;
图7为本申请实施例七中版面元素合并方法流程示意图;
图8为本申请实施例八中版面元素类别识别方法流程示意图;
图9为本申请实施例九中版面元素的处理装置的结构示意图;
图10为本申请实施例十中版面元素的处理装置结构示意图;
图11为本申请实施例十一中版面元素的处理装置结构示意图。
具体实施方式
实施本申请实施例的任一技术方案必不一定需要同时达到以上的所有优点。
本申请实施例所提供的方法及装置可应用于电子设备/终端/服务器,其包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如下述任一实施例中所述的方法。
如图1所示本申请实施例一中的终端的结构示意图。于本申请实施例中,终端优选为移动终端设备,例如可以包括智能手机、平板电脑、电子书阅读器、MP3播放器 (Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机、穿戴式移动终端、E_ink电纸书等等。
如图1所示,以实现终端为例,终端包括存储器101(或又称之为存储介质)、存储控制器102,一个或多个(图中仅示出一个)处理器103、外设接口104、射频模块105、音频模块106、显示屏幕107、传感器108如加速度传感器、距离传感器等。这些组件通过一条或多条通讯总线/信号线116相互通讯。
存储器101可用于存储软件程序以及模块,如本申请实施例中的显示处理方法及装置对应的程序指令/模块,处理器103通过运行存储在存储器101内的软件程序以及模块,从而执行各种功能应用以及数据处理,如本申请实施例提供的显示处理方法。
存储器101可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器103以及其他可能的组件对存储器101的访问可在存储控制器102的控制下进行。
外设接口104将各种输入/输入装置耦合至处理器103以及存储器101。在一些实施例中,外设接口104,处理器103以及存储控制器102可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
射频模块105用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。
音频模块106向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示屏幕107在电子终端与用户之间同时提供一个输出及输入界面。具体地,显示屏幕107向用户显示内容输出,这些输出的内容可包括文字、图形、视频及其任意组合。
当电子设备为便携式终端时,传感器108中的距离传感器用于感应电子终端与人体距离,例如在通话过程中,当电子终端的屏幕贴近用户脸部时,就会自动感应出电子终端与人体距离是多少,当小于某个值时,就会熄灭屏幕,不再接收用户触摸屏幕事件,从而防止通话过程中的误操作。该距离传感器还可以用于实现悬浮等控制。传感器108中的加速度传感器是能感受加速度并转换成可用输出信号的传感器。
可以理解,图1所示的结构仅为示意,电子终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
于本申请实施例中,电子终端中安装有客户端,该客户端可以是浏览器也可以是第三方应用软件,与服务器(Server)端相对应,为用户提供服务,例如电子阅读服务,配置用于播放本地或在线的各种可视化文本文件。
于本申请实施例中,显示界面可以包括电子终端中的客户端的显示界面,包括实际显示内文的界面,以及用于显示当前所显示内文的浏览进度的进度标签。显示界面的大小与客户端对显示界面的设置有关,如果客户端设置的显示界面可以是全屏模式, 那么显示界面的大小与电子终端显示屏(如显示屏幕107)的显示区域大小可以相同,如果客户端设置的显示界面小于电子终端的显示屏,那么显示界面的大小就是实际所设置的显示界面的大小。
为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
下面结合本申请实施例附图进一步说明本申请实施例具体实现。
图2为本申请实施例二中版面元素的处理方法流程示意图;如图2所示,本实施例,所述版面元素的处理方法也可以称之为版面元素的定界方法,其目的主要进行版面元素的分割定界。具体地,本实施例中的方法包括如下步骤:
201、根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;
具体地,步骤201中在根据版面灰度图像中像素的灰度值从版面灰度图像中筛选出待处理的像素点时,可以根据版面灰度图像中像素的灰度值与设定的色值阈值,从版面灰度图像中筛选出待处理的像素点。
具体地,若版面灰度图像中像素的灰度值与设定的色值阈值小于0,则对应的像素作为待处理的像素点。
在一具体场景中,版面灰度图像为黑白图像的话,设定的色值阈值优选为255。因此,对于白色像素点来说,其灰度值本来就是255,对应地,白色像素点的灰度值与设定的色值阈值之间的差值(或又称之为颜色值)为0。而对于黑色像素点来说,其灰度值为0,对应地,黑丝像素点的灰度值与设定的色值阈值之间的差值为-255。而对于色值介于0到255之间的像素点来说,假如这些像素点的灰度值用C来表示,则其对应的灰度值与设定的色值阈值之间的差值为C-255,其小于0,而这些像素点则可能构成了版面元素,因此作为待处理的像素点。
需要说明的是,此处设定的色值阈值为255仅仅是示例,并非是特别限定。
202、根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
本实施例中,版面的延展方向具体可以是内容分发载体在排版内容的规则,比如对于传统的纸质印刷或者网站或者应用程序APP来说,内容的排版规则一般是从左到右、从上到下的方向进行内容的排版。比如,从左到右的方向排版完第一行后,接着按照从上到下的排版第二行,以此类推。当然,该版面的延展方向并非只有从左到右、从上到下的方向,也可能存在从右到左、从上到下的方向。
本实施例中,边界的扩散方向具体可以是版面元素的边界的可能外延方向。该边界的扩散方向可以根据需要灵活定义或者配置。
具体地,比如如果版面元素的边界要用矩形框来定义,那扩散方向可以有四个顶点方向以及四条边方向,即左上顶点方向、右上顶点方向、左下顶点方向、右下顶点 方向、左边方向、右边方向、上边方向、下边方向。左上顶点方向、右上顶点方向、左下顶点方向、右下顶点方向、左边方向、右边方向、上边方向、下边方向具体可以在进行界限扩散操作时以某一个待处理像素点为参考分别实现向左边和/或上边方向进行边界扩散、向右边和/或上边方向进行边界扩散、向左边和/或下边方向进行边界扩散、向右边和/或下边方向进行边界扩散、向左边方向进行边界扩散、向右边方向进行边界扩散、向上边方向进行边界扩散、向下边方向进行边界扩散,直至扩散方向上连续多个或者所有像素点的灰度值为255,或者连续多个或者所有像素点的灰度值与设定的色值阈值之间的差值为0,或者到达整个版面灰度图像的边界,则停止沿着该扩散方向继续进行边界扩散,从而先后完成沿着版面延展方向中从左到右行方向上的边界扩散、沿着版面延展方向中从上到下方向上的边界扩散,直至最终完成版面灰度图像上所有版面元素的定界。
当然,如果版面元素的边界用其他形状来定义,可以引入中心角的概念进行扩散方向的定义。
图3为本申请实施例三中版面元素的处理方法流程示意图;本实施例,所述版面元素的处理方法也可以称之为版面元素的定界方法,其目的主要进行版面元素的分割定界。如图3所示,其包括如下步骤:
301、定义一标志,所述标志中配置有至少一个边界扩散方向,一个扩散边界扩散方向关联与一次边界扩散操作。
本实施例中,每一所述边界扩散方向具有对应的扩展方向增量。每一所述边界扩散方向具有匹配于对应扩展方向增量的优先级。比如沿着顶点方向扩散的话,可以同时实现行和列方向上的扩散,则顶点方向扩散的扩展方向增量要大于沿着边方向扩散的扩展方向增量。
具体地,比如在一具体应用场景中,所述边界扩散方向包括边界扩散优先方向,以在边界扩散操作时确定出边界扩散的方向并最终确定出各个版面元素的边界。
比如,定义边界扩散优先方向的标志为A,其包括八个扩散优先方向:A={右下顶点,左下顶点,右上顶点,左上顶点,右边,左边,下边,上边},在该标志A中的扩散方向实际上同时定义了扩散方向的先后顺序,即依次进行右下顶点方向、左下顶点方向、右上顶点方向、左上顶点方向、右边方向、左边方向、下边方向,上边方向进行扩散,或者又称之为扩散方向的优先级排序为:右下顶点,左下顶点,右上顶点,左上顶点,右边,底边,下边,上边,以快速的进行边界的扩散。
当然,此处对其中扩散方向优先级的排序仅仅是示例并非特别限定。而实际上,对于版面的延展方向为从右到左、从上到下的话,优选上述标志A具体定义的扩散方向顺序或者优先级。
具体地,图4为本实施例四中扩散方向的示意图;如图4所示,为了从扩散的完整性考虑,其实际上有八个扩散方向,而对于其中八个扩散方向并非都要进行。
图5为本实施例五中进行了沿着右下顶点方向进行扩散后的边界示意图;图5对应沿着图4所示右下顶点方向进行了边界扩散后的示意。具体地,在图5所示,沿着右下顶点方向扩散时可以实现一对行列的扩展,比如沿着同时沿着行和列的方向上各 自前进一个像素,或者相当于实现了同时实现了沿着右边和下边的扩散方向。而沿着左边方向扩散时则向左前进了一个像素。
当然,需要说明的是,在图5中在扩散时以前进一个像素为例,但在实际应用场景中,可以同时前景多个像素。
另外,处于对边界扩散对邻域的影响,所述边界扩散方向包括边界扩散关联方向,边界扩散关联方可关联于所述边界扩散优先方向,以应对在对边界扩散对邻域的影响。比如,如果沿着行数右下顶点方向进行边界扩散的话,直接会影响到右边界和下边界,因此,为了在沿着右下顶点方向完成边界扩散后紧接着沿着右边和下边方向扩散,定义了边界扩散关联方向:右边和下边。该边界关联方向具体可以通过一标志B来表示,比如B[右下顶点]=[右边,下边]。其他扩散方向的关联方向依次类推。比如左边方向的边界关联方向为左边和下边。
302、令边界扩散方向为允许状态,以在所述边界扩散操作时使得所述边界扩散方向有效。
本实施例中,令边界扩散方向为允许状态具体为仅仅令多个边界扩散方向中的某一个边界扩散方向为允许状态,以在边界扩散操作时,只沿着具有允许状态的边界扩散方向进行边界扩散。当然,也可以所有的边界扩散方向为允许状态。
在一具体应用场景中,可以通过对标志A、标志B的边界扩散方向进行打标记处理以将其设置为允许状态,或者又称之令边界扩散方向为真。
303、根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;
本实施例中,步骤S303类似上述步骤201。
在一具体应用场景中,沿着版面的从左到右的延展方向、从上到下的沿着方向,进行灰度值的扫描,比如从第一行第一个像素点开始直至最后一行的最后一个像素点结束,确定出版面灰度图像上所有待处理的像素点。
304、根据边界扩散方向以及版面的延展方向,对待处理的像素点进行当前边界扩散操作以确定出各个版面元素的边界。
具体地,本实施例中,步骤S304具体可以包括如下步骤:
314、根据当前边界扩散方向以及版面的延展方向,对待处理的像素点进行第一边界扩散操作直至不能沿着所述当前边界扩散方向继续对所述待处理的像素点进行第一边界扩散操作;
324、根据所述当前边界扩散方向确定下一边界扩散方向;
334、根据所述下一边界扩散方向以及版面的延展方向,对进行了所述第一边界操作后的对待处理的像素点进行第二边界扩散操作。
在一具体应用场景中,在不能沿着所述当前边界扩散方向继续对所述待处理的像素点进行第一边界扩散操作后,可以对令第一边界扩散方向为禁用状态,以在所述边界扩散操作结束后使得所述当前边界扩散方向失效。
具体地,可以通过消除对第一边界扩散方向的标记,从而令第一边界扩散方向为禁用状态,或者又称之为使得第一边界扩散方向为假。
而在下一边界扩散方向时,优选将与当前边界扩散方向有关联关系的扩散关联方向作为下一边界扩散方向,直至标志A中的所有边界扩散方向均被执行过边界扩散操作,从而实现快速地进行边界的扩散并最终确定出版面元素的边界。
对每一个待处理像素点重复上述步骤314-334,直至每一行所有待处理像素点均被处理完毕,从而最终得到版面元素的最小边界,即每个版面元素所占据的最小空间,换言之,即确定出了版面元素的边界。
图6为本申请实施例六中版面元素的处理方法流程示意图;本实施例,所述版面元素的处理方法也可以称之为版面元素的定界方法,其目的主要进行版面元素的分割定界。如图6所示,其包括如下步骤:
601、定义边界扩散方向,其包括边界扩散优先方向以及在边界扩散时可关联于所述边界扩散优先方向的边界扩散关联方向;
本实施例中,参见上述图5中相关记载,边界扩散优先方向的作用在于基于扩散的完整性考虑多扩散方向进行定义,而边界扩散关联方向基于使用边界扩散优先方向进行边界扩散时对邻域的影响,以快速进行边界的扩散,从而最终确定出各个版面元素的边界。
602、根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;
本实施例中,步骤602类似步骤201。
在一具体应用场景中,若存在多个待处理像素点,则将多个待处理像素点保存到一数组中,以在所述边界扩散操作时,从所述数组中获取所述边界扩散操作针对的待处理像素点。
具体地,该数组可以为一临时数组,其对从版面灰度图像一行中选出的待处理像素点进行存储。比如,第一行中筛选出的若干个待处理像素点。当针对这若干个待处理像素点完成界限确定后,又将第二行中筛选出的若干个待处理像素点存入该临时数组中,以此类推,直至处理完版面灰度图像上所有行中的待处理像素点。
603、根据边界扩散方向以及版面的延展方向,对待处理的像素点的初始边界进行边界扩散操作以确定出各个版面元素的边界。
本实施例中,为了快速实现边界的扩散,给每个待处理的像素点配置了一个初始边界,在该初始边界的基础上进行边界的扩散从而最终确定每个版面元素的边界。比如,初始边界可以为1个像素点面积的矩形边框,在这个矩形边框的外围进行边界扩散。当然,需要说明的是,初始边界可以根据需求灵活配置。
具体地,本实施例中,在对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界时以像素为单位对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。即如前所述,在边界扩散时,沿着边界扩散方向每次只前进一个像素点。当然,需要说明的是,也可以根据需要,前景多个像素点。
具体地,本实施例中,如前所述,版面的延展方向为从左到右、从上到下,则根据边界扩散方向以及版面的自左向右或自上而下的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
当然,需要说明的,版面的延展方向并非特定为从左到右、从上到下,在一些场景下,其也可以为从右到左、从上到下,或者,呈现中心辐射状。
图7为本申请实施例七中版面元素合并方法流程示意图;所谓版面元素合并具体根据对版面元素的定界对版面元素进行同类项合并。
701、根据版面元素的边界以及版面元素的邻近性,对版面元素进行初步同类项合并。
本实施例中,步骤701中具体根据版面元素的边界以及设定的合并顺序范围对合并顺序范围内所有的版面元素进行同类项合并。所述设定的合并顺序用于保证所述邻近性。
在一具体应用场景中,版面元素的边界以及版面的邻近性均与元素的高度、边界的整体大小、边界所围成区域的颜色统计相关。比如属于如同一行的文字形成的多个版面元素在元素高度、整体大小、颜色统计具有一定的相近性。
Figure PCTCN2018088805-appb-000001
对于待合并的多个版面元素来说,其均满足上述公式(1)其中变量的下标n表示其中表示待合并的第n个版面元素,w为未经过任何合并处理前版面元素的宽度,h为未经过任何合并处理前版面元素的高度,S为面积,C为所有非零色值数即上述灰度值与设定的色值阈值的差值非0,t1、t2、t3为相应近似判断阀值。
另外上述公式(1)也可以理解为用来判断需要进行合并的多个版面元素的规则或者标准。
本实施例中,步骤701的合并顺序范围可以是对同一行中的版面元素按照从左到右的方向依次进行合并。
702、将已合并的版面元素按照合并的先后顺序放入到一有序队列中,根据已合并版面元素的边界以及设定的合并顺序范围对所述有序队列中的版面元素进行再次同类项合并。
本实施例中,步骤702中在再次同类项合并时,从有序队列从头到尾的顺序进行已合并版面元素的边界的再次合并。
比如在一具体场景中,假如有序队列中的靠近队首的一个待合并版面素位置为K,则对[K+1,N]顺序范围的其他多个版面元素进行合并,并将合并后的版面元素填入位置K,同时删除被合并的版面元素N表示待合并版权元素的个数。可以采用剪树加速元素的合并,其具体原理是:当两个矩形(版权元素的占位)竖直距离大于一定距离值(比如两个版权元素的高度+合适的阀值)即忽略(剪枝),因为它们不可能是相邻行的。
需要说明的是,在版面像素的合并时,根据需要也可以仅执行其中之一步骤。如 果在某个场景中已经完成了步骤701的执行,那在本实施例中,直接省去步骤701,而直接执行步骤702即可。
图8为本申请实施例八中版面元素类别识别方法流程示意图;如图8所示,其对主要用于根据所述版面元素的边界,对所述版面元素进行类别识别。
801、根据所述版面元素的边界以及所述版面元素的颜色值,确定所述版面元素的相近性;
本实施例中,步骤801中具体根据所述版面元素的边界统计参数以及所述版面元素的颜色值,确定所述版面元素的相近性,以对所述版面元素进行类别识别。
802、根据所述版面元素的相近性对所述版面元素进行类别识别。
假如对于电子网页或者应用程序APP来说,其版面一般包括文字和图像。在经过上述边界分割的方法得到多个版面元素之后进行类别识别。比如文字来说,包括文字的版面元素在长、宽、面积上具有一定的规律,考虑到每行文字个数由此导致对应该行的版面元素边界大小不一,本实施例中,设定一个判断阈值,通过下述公式(1)得到经过了至少一次合并后的每个版面元素边界(由多个版面子元素或者称为合并前的版面元素)的边界统计参数VAL,当该边界统计参数VAL小于设定的类别判定阀值时,则这些版面元素具有文字相近性,对应的版面元素由文字组成,按照此方法识别出所有由文字组成的版面元素后,剩余的则为由具有满足图像相近性的图像组成的版面元素,或者又称之为非文字型组成的版面元素由图像组成。
类型判断可分为两个子步骤进行:
812、对于没有进行过任何合并的版面元素(即完成了上述定界方法得到的版面元素)的类型识别来说,于某一个矩形区域(即关联版面元素的边界),从统计学分析来看,具有突出的颜色分布的不均匀。比如,对于版面上有文字、有图像的话,对于文字,该矩形区域内的所有像素点,统计上大部分分颜色值或者灰度值都相同或相近,一般为纯色(黑色、偏黑色的灰色之类)加上背景的白色,即存在一个合理的假定:80%的像素是由20%的颜色值或者灰度值构成。因此颜色统计值或者灰度统计值排前K个颜色值或者灰度统计值的占所有颜色值或者灰度值数量的大于设定的比例ɑ(ɑ为阀值,K为较小的整数),因此通过这种方式对没有进行过任何合并的版面元素进行识别。
822、对于由多个版面子元素(即完成了上述定界方法得到的版面元素)合成得到的版面元素来说:
Figure PCTCN2018088805-appb-000002
w为版面子元素的宽度,h为版面子元素的高度,L为版面元素的宽高和,D(L)表示版面子元素L值的方差,
Figure PCTCN2018088805-appb-000003
表示版面子元素的宽高之和的均值,即一个合成后版面元素包括的多个版面子元素的宽高之和的均值。
当该边界统计参数VAL小于设定的类别判定阀值时,则这些版面元素具有文字相 近性,对应的版面元素由文字组成,按照此方法识别出所有由文字组成的版面元素后,剩余的则为由具有满足图像相近性的图像组成的版面元素,或者又称之为非文字型组成的版面元素由图像组成。
需要说明的是,在上述实施例中,如果版面原始图像为非灰度图像,则优选对版面原始图像进行二值化处理得到所述版面灰度图像,以基于版面灰度图像进行后续待处理像素点的确定以及边界确定。
当然,如果版面原始图像本来就为灰度图像,则就不需要上述二值化处理的步骤。
需要说明的是,上述图2-图6的方法可以与图7和/或图8组成一种版面元素的处理方法。
图9为本申请实施例九中版面元素的处理装置的结构示意图;本实施例中,版面元素的处理装置实质上相当于版面元素定界装置,具体可以配置在处理器上。具体地,如图9所示,其包括:
第一程序单元901,配置用于根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;
第二程序单元902,配置用于根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
可选地,在本申请的一实施例中,所述第一程序单元进一步配置用于根据版面灰度图像中像素的灰度值与设定的色值阈值,从版面灰度图像中筛选出待处理的像素点。
可选地,在本申请的一实施例中,所述第一程序单元进一步配置用于若版面灰度图像中像素的灰度值与设定的色值阈值小于0,则对应的像素作为待处理的像素点。
可选地,在本申请的一实施例中,还包括第三程序单元,所述第三程序单元用于定义一标志,所述标志中配置有至少一个边界扩散方向,一个扩散边界扩散方向关联与一次边界扩散操作。
可选地,在本申请的一实施例中,还包括第四程序单元,配置用于令边界扩散方向为允许状态,以在所述边界扩散操作时使得所述边界扩散方向有效。
可选地,在本申请的一实施例中,还包括第五程序单元,配置用于令边界扩散方向为禁用状态,以在所述边界扩散操作结束后使得所述当前边界扩散方向失效。
可选地,在本申请的一实施例中,所述边界扩散方向包括边界扩散优先方向以及在边界扩散时可关联于所述边界扩散优先方向的边界扩散关联方向,以在所述第二程序单元进行边界扩散操作时确定出边界扩散的方向并最终确定出各个版面元素的边界。
可选地,在本申请的一实施例中,所述第二程序单元进一步配置用于根据边界扩散方向以及版面的延展方向,对待处理的像素点的初始边界进行边界扩散操作以确定出各个版面元素的边界。
可选地,在本申请的一实施例中,所述第二程序单元进一步配置用于根据边界扩散方向以及版面的延展方向,以像素为单位对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
可选地,在本申请的一实施例中,所述第二程序单元进一步配置用于根据边界扩散方向以及版面的自左向右或自上而下的延展方向,对待处理的像素点进行边界扩散 操作以确定出各个版面元素的边界。
可选地,在本申请的一实施例中,所述第二程序单元进一步配置用于:
根据当前边界扩散方向以及版面的延展方向,对待处理的像素点进行第一边界扩散操作直至不能沿着所述当前边界扩散方向继续对所述待处理的像素点进行第一边界扩散操作;
根据所述当前边界扩散方向确定下一边界扩散方向;
根据所述下一边界扩散方向以及版面的延展方向,对进行了所述第一边界操作后的对待处理的像素点进行第二边界扩散操作。
可选地,在本申请的一实施例中,若存在多个待处理像素点,则还包括第六程序单元,所述第六程序单元进一步配置用于将多个待处理像素点保存到一数组中,以在所述第二程序单元进行所述边界扩散操作时,从所述数组中获取所述边界扩散操作针对的待处理像素点。
图10为本申请实施例十中版面元素的处理装置结构示意图;本实施例中,版面元素的处理装置实质上相当于版面元素的合并装置,具体可以配置在处理器上。具体地,其包括:第七程序单元1001,配置用于根据版面元素的边界,对版面元素进行同类项合并。可选地,在本实施例中,所述第七程序单元进一步配置用于根据版面元素的边界以及版面元素的邻近性,对版面元素进行同类项合并。可选地,在本实施例中,所述第七程序单元进一步配置用于根据版面元素的边界以及设定的合并顺序范围对合并顺序范围内所有的版面元素进行同类项合并。
可选地,在本实施例中,还包括:第八程序单元1002,配置用于将已合并的版面元素按照合并的先后顺序放入到一有序队列中,以由所述第七程序单元根据版面元素的边界以及设定的合并顺序范围对所述有序队列中的版面元素进行同类项合并。
图11为本申请实施例十一中版面元素的处理装置结构示意图;本实施例中,版面元素处理装置实质上相当于版面元素的类别识别装置,具体可以配置在处理器上。具体地,其包括:第九程序单元,配置用于根据所述版面元素的边界,对所述版面元素进行类别识别。所述第九程序单元进一步配置用于根据所述版面元素的边界以及所述版面元素的颜色值,对所述版面元素进行类别识别。所述第九程序单元进一步配置用于根据所述版面元素的边界统计参数以及所述版面元素的颜色值,对所述版面元素进行类别识别。
具体地,所述第九程序单元可以包括:
相近性确定单元1101,配置用于根据所述版面元素的边界以及所述版面元素的颜色值,确定所述版面元素的相近性;
类别识别单元1102,配置用于根据所述版面元素的相近性对所述版面元素进行类别识别。
需要说明的是,上述实施例中,第一、第二、第三、第四、第五、第六、第七、第八、第九的描述并非对程序单元的数据限制,上述程序单元实际相互之间可以复用。
需要说说明的是,上述技术方案可以运用与传统纸质印刷领域,也可以应用网站、 应用程序APP技术领域。因此,上述版面泛指广义上的版面,并非特别限定于某一特定场景中的版面。
本申请上述实施例的提供的技术方案中,根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;以及根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界,避免了定界模型的建立,从而降低了实现版面元素的定界的难度,且提高了使用的便捷性,最终保证了内容消费类产品的高效发布。
另外,当通过矩形区域界定版面元素的边界时,由于边界扩散方向的定义保证了边界扩散的快速性,从而改进了边界搜索的效率,且提高了对类似上述字符的覆盖准确率。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部 计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一程序单元、第二程序单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请实施例还提供一种存储介质,其上存储计算机程序,该程序被处理器执行时实现如上述任一实施例中所述的方法。
作为上述存储介质的具体实现,本申请实施例提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个计算机程序,当上述一个或者多个计算机程序被该装置执行时,使得该装置实现如上述任一实施例中所述的方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (45)

  1. 一种版面元素的处理方法,其特征在于,包括:
    根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点;
    根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
  2. 根据权利要求1所述的处理方法,其特征在于,根据版面灰度图像中像素的灰度值,从版面灰度图像中筛选出待处理的像素点,包括:
    根据版面灰度图像中像素的灰度值与设定的色值阈值,从版面灰度图像中筛选出待处理的像素点。
  3. 根据权利要求1所述的处理方法,其特征在于,若版面灰度图像中像素的灰度值与设定的色值阈值小于0,则对应的像素作为待处理的像素点。
  4. 根据权利要求1所述的处理方法,其特征在于,还包括:定义一标志,所述标志中配置有至少一个边界扩散方向,一个扩散边界扩散方向关联与一次边界扩散操作。
  5. 根据权利要求1所述的处理方法,其特征在于,每一所述边界扩散方向具有对应的扩展方向增量。
  6. 根据权利要求5所述的处理方法,其特征在于,每一所述边界扩散方向具有匹配于对应扩展方向增量的优先级。
  7. 根据权利要求5所述的处理方法,其特征在于,还包括:令边界扩散方向为允许状态,以在所述边界扩散操作时使得所述边界扩散方向有效。
  8. 根据权利要求5所述的处理方法,其特征在于,还包括:令边界扩散方向为禁用状态,以在所述边界扩散操作结束后使得所述当前边界扩散方向失效。
  9. 根据权利要求1所述的处理方法,其特征在于,所述边界扩散方向包括边界扩散优先方向以及在边界扩散时可关联于所述边界扩散优先方向的边界扩散关联方向,以在边界扩散操作时确定出边界扩散的方向并最终确定出各个版面元素的边界。
  10. 根据权利要求1所述的处理方法,其特征在于,根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界,包括:根据边界扩散方向以及版面的延展方向,对待处理的像素点的初始边界进行边界扩散操作以确定出各个版面元素的边界。
  11. 根据权利要求1所述的处理方法,其特征在于,根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界,包括:根据边界扩散方向以及版面的延展方向,以像素为单位对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
  12. 根据权利要求1所述的处理方法,其特征在于,根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界,包括:根据边界扩散方向以及版面的自左向右或自上而下的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
  13. 根据权利要求1所述的处理方法,其特征在于,根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界,包括:
    根据当前边界扩散方向以及版面的延展方向,对待处理的像素点进行第一边界扩散操作直至不能沿着所述当前边界扩散方向继续对所述待处理的像素点进行第一边界扩散操作;
    根据所述当前边界扩散方向确定下一边界扩散方向;
    根据所述下一边界扩散方向以及版面的延展方向,对进行了所述第一边界操作后的对待处理的像素点进行第二边界扩散操作。
  14. 根据权利要求1所述的处理方法,其特征在于,若存在多个待处理像素点,则将多个待处理像素点保存到一数组中,以在所述边界扩散操作时,从所述数组中获取所述边界扩散操作针对的待处理像素点。
  15. 根据权利要求1-14任一项所述的处理方法,其特征在于,还包括:根据版面元素的边界,对版面元素进行同类项合并。
  16. 根据权利要求15所述的处理方法,其特征在于,根据版面元素的边界,对版面元素进行同类项合并,包括:根据版面元素的边界以及版面元素的邻近性,对版面元素进行同类项合并。
  17. 根据权利要求15所述的处理方法,其特征在于,根据版面元素的边界,对版面元素进行同类项合并,包括:根据版面元素的边界以及设定的合并顺序范围对合并顺序范围内所有的版面元素进行同类项合并。
  18. 根据权利要求15所述的处理方法,其特征在于,还包括:根据版面元素的边界以及设定的合并顺序范围对合并顺序范围内所有的版面元素进行同类项合并,包括:
    将已合并的版面元素按照合并的先后顺序放入到一有序队列中,根据已合并版面元素的边界以及设定的合并顺序范围对所述有序队列中的版面元素进行同类项合并。
  19. 根据权利要求1-18任一项所述的处理方法,其特征在于,还包括:根据所述版面元素的边界,对所述版面元素进行类别识别。
  20. 根据权利要求19所述的处理方法,其特征在于,根据所述版面元素的边界,对所述版面元素进行类别识别包括:根据所述版面元素的边界以及所述版面元素的颜色值,对所述版面元素进行类别识别。
  21. 根据权利要求20所述的处理方法,其特征在于,根据所述版面元素的边界以及所述版面元素的颜色值,对所述版面元素进行类别识别,包括:根据所述版面元素的边界统计参数以及所述版面元素的颜色值,对所述版面元素进行类别识别。
  22. 根据权利要求1-21任一项所述的处理方法,其特征在于,还包括:对版面原始图像进行二值化处理得到所述版面灰度图像。
  23. 一种版面元素的处理装置,其特征在于,包括:
    第一程序单元,配置用于根据版面灰度图像中像素的灰度值,从版面灰度图像中 筛选出待处理的像素点;
    第二程序单元,配置用于根据边界扩散方向以及版面的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
  24. 根据权利要求23所述的处理装置,其特征在于,所述第一程序单元进一步配置用于根据版面灰度图像中像素的灰度值与设定的色值阈值,从版面灰度图像中筛选出待处理的像素点。
  25. 根据权利要求23所述的处理装置,其特征在于,所述第一程序单元进一步配置用于若版面灰度图像中像素的灰度值与设定的色值阈值小于0,则对应的像素作为待处理的像素点。
  26. 根据权利要求23所述的处理装置,其特征在于,还包括第三程序单元,所述第三程序单元用于定义一标志,所述标志中配置有至少一个边界扩散方向,一个扩散边界扩散方向关联与一次边界扩散操作。
  27. 根据权利要求23所述的处理装置,其特征在于,每一所述边界扩散方向具有对应的扩展方向增量。
  28. 根据权利要求27所述的处理装置,其特征在于,每一所述边界扩散方向具有匹配于对应扩展方向增量的优先级。
  29. 根据权利要求27所述的处理装置,其特征在于,还包括第四程序单元,配置用于令边界扩散方向为允许状态,以在所述边界扩散操作时使得所述边界扩散方向有效。
  30. 根据权利要求27所述的处理装置,其特征在于,还包括第四程序单元,配置用于令边界扩散方向为禁用状态,以在所述边界扩散操作结束后使得所述当前边界扩散方向失效。
  31. 根据权利要求23所述的处理装置,其特征在于,所述边界扩散方向包括边界扩散优先方向以及在边界扩散时可关联于所述边界扩散优先方向的边界扩散关联方向,以在所述第二程序单元进行边界扩散操作时确定出边界扩散的方向并最终确定出各个版面元素的边界。
  32. 根据权利要求23所述的处理装置,其特征在于,所述第二程序单元进一步配置用于根据边界扩散方向以及版面的延展方向,对待处理的像素点的初始边界进行边界扩散操作以确定出各个版面元素的边界。
  33. 根据权利要求23所述的处理装置,其特征在于,所述第二程序单元进一步配置用于根据边界扩散方向以及版面的延展方向,以像素为单位对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
  34. 根据权利要求23所述的处理装置,其特征在于,所述第二程序单元进一步配置用于根据边界扩散方向以及版面的自左向右或自上而下的延展方向,对待处理的像素点进行边界扩散操作以确定出各个版面元素的边界。
  35. 根据权利要求23所述的处理装置,其特征在于,所述第二程序单元进一步配置用于:
    根据当前边界扩散方向以及版面的延展方向,对待处理的像素点进行第一边界扩散操作直至不能沿着所述当前边界扩散方向继续对所述待处理的像素点进行第一边界扩散操作;
    根据所述当前边界扩散方向确定下一边界扩散方向;
    根据所述下一边界扩散方向以及版面的延展方向,对进行了所述第一边界操作后的对待处理的像素点进行第二边界扩散操作。
  36. 根据权利要求23所述的处理装置,其特征在于,若存在多个待处理像素点,则还包括第六程序单元,所述第六程序单元进一步配置用于将多个待处理像素点保存到一数组中,以在所述第二程序单元进行所述边界扩散操作时,从所述数组中获取所述边界扩散操作针对的待处理像素点。
  37. 根据权利要求23-36任一项所述的处理装置,其特征在于,还包括:第七程序单元,配置用于根据版面元素的边界,对版面元素进行同类项合并。
  38. 根据权利要求37所述的处理装置,其特征在于,所述第七程序单元进一步配置用于根据版面元素的边界以及版面元素的邻近性,对版面元素进行同类项合并。
  39. 根据权利要求37所述的处理装置,其特征在于,所述第七程序单元进一步配置用于根据版面元素的边界以及设定的合并顺序范围对合并顺序范围内所有的版面元素进行同类项合并。
  40. 根据权利要求37所述的处理装置,其特征在于,还包括第八程序单元,配置用于将已合并的版面元素按照合并的先后顺序放入到一有序队列中,以由所述第七程序单元根据版面元素的边界以及设定的合并顺序范围对所述有序队列中的版面元素进行同类项合并。
  41. 根据权利要求23-40任一项所述的处理装置,其特征在于,还包括:第九程序单元,配置用于根据所述版面元素的边界,对所述版面元素进行类别识别。
  42. 根据权利要求41所述的处理装置,其特征在于,所述第九程序单元进一步配置用于根据所述版面元素的边界以及所述版面元素的颜色值,对所述版面元素进行类别识别。
  43. 根据权利要求42所述的处理装置,其特征在于,所述第九程序单元进一步配置用于根据所述版面元素的边界统计参数以及所述版面元素的颜色值,对所述版面元素进行类别识别。
  44. 一种存储介质,其特征在于,其上存储计算机程序,所述程序被处理器执行时实现如权利要求1-22中任一所述的处理方法。
  45. 一种电子设备/终端/服务器,其特征在于,包括
    一个或多个处理器;
    存储装置,用于存储一个或多个程序;
    当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-22中任一所述的处理方法。
PCT/CN2018/088805 2018-05-29 2018-05-29 版面元素的处理方法、装置、存储介质及电子设备/终端/服务器 WO2019227300A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/CN2018/088805 WO2019227300A1 (zh) 2018-05-29 2018-05-29 版面元素的处理方法、装置、存储介质及电子设备/终端/服务器
CN201880001163.8A CN109643222B (zh) 2018-05-29 2018-05-29 版面元素的处理方法、装置、存储介质及电子设备/终端/服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/088805 WO2019227300A1 (zh) 2018-05-29 2018-05-29 版面元素的处理方法、装置、存储介质及电子设备/终端/服务器

Publications (1)

Publication Number Publication Date
WO2019227300A1 true WO2019227300A1 (zh) 2019-12-05

Family

ID=66060209

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/088805 WO2019227300A1 (zh) 2018-05-29 2018-05-29 版面元素的处理方法、装置、存储介质及电子设备/终端/服务器

Country Status (2)

Country Link
CN (1) CN109643222B (zh)
WO (1) WO2019227300A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110706310B (zh) * 2019-08-23 2021-10-22 华为技术有限公司 一种图文融合方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797428A (zh) * 2004-12-23 2006-07-05 佳能株式会社 用于文档的自适应二值化的方法、设备和存储介质
US8249356B1 (en) * 2009-01-21 2012-08-21 Google Inc. Physical page layout analysis via tab-stop detection for optical character recognition
CN105260351A (zh) * 2015-09-10 2016-01-20 武汉改图网技术有限公司 一种基于自适应模版的印刷品在线自助设计方法
CN105373790A (zh) * 2015-10-23 2016-03-02 北京汉王数字科技有限公司 版面分析方法和装置
CN107301418A (zh) * 2017-06-28 2017-10-27 江南大学 光学字符识别中的版面分析
CN107784301A (zh) * 2016-08-31 2018-03-09 百度在线网络技术(北京)有限公司 用于识别图像中文字区域的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239909B (zh) * 2014-08-11 2018-03-16 北京捷通华声语音技术有限公司 一种图像的识别方法和装置
CN107705417A (zh) * 2017-10-10 2018-02-16 深圳怡化电脑股份有限公司 纸币版本的识别方法、装置、金融设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797428A (zh) * 2004-12-23 2006-07-05 佳能株式会社 用于文档的自适应二值化的方法、设备和存储介质
US8249356B1 (en) * 2009-01-21 2012-08-21 Google Inc. Physical page layout analysis via tab-stop detection for optical character recognition
CN105260351A (zh) * 2015-09-10 2016-01-20 武汉改图网技术有限公司 一种基于自适应模版的印刷品在线自助设计方法
CN105373790A (zh) * 2015-10-23 2016-03-02 北京汉王数字科技有限公司 版面分析方法和装置
CN107784301A (zh) * 2016-08-31 2018-03-09 百度在线网络技术(北京)有限公司 用于识别图像中文字区域的方法和装置
CN107301418A (zh) * 2017-06-28 2017-10-27 江南大学 光学字符识别中的版面分析

Also Published As

Publication number Publication date
CN109643222B (zh) 2022-05-06
CN109643222A (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
CN109978972B (zh) 一种图片中的文字编辑的方法及装置
JP6705912B2 (ja) 画像内の文字領域を認識するための方法及び装置
US8819545B2 (en) Digital comic editor, method and non-transitory computer-readable medium
US9658991B2 (en) Reordering text from unstructured sources to intended reading flow
CN112163577B (zh) 游戏画面中的文字识别方法、装置、电子设备和存储介质
US20140321770A1 (en) System, method, and computer program product for generating an image thumbnail
US20200005659A1 (en) Intelligent voice interaction method, device and computer readable storage medium
WO2019041442A1 (zh) 图表数据结构化提取方法、系统、电子设备及计算机可读存储介质
US20220172501A1 (en) Asides detection in documents
WO2022213784A1 (zh) 图像处理方法及装置、电子设备和存储介质
WO2015163118A1 (ja) 文字特定装置、および制御プログラム
WO2019227300A1 (zh) 版面元素的处理方法、装置、存储介质及电子设备/终端/服务器
CN106201255B (zh) 一种信息处理方法及电子设备
CN112070708B (zh) 图像处理方法、图像处理装置、电子设备、存储介质
CN110705653A (zh) 图像分类方法、图像分类装置及终端设备
CN110996026B (zh) 一种osd显示方法、装置、设备及存储介质
CN109214977A (zh) 图像处理装置及其控制方法
CN111127310B (zh) 一种图像处理方法、装置、电子设备及存储介质
JP5528410B2 (ja) ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム
CN114140805A (zh) 图像处理方法、装置、电子设备及存储介质
CN114118029A (zh) 图像处理方法、装置、设备和存储介质
CN113448470B (zh) 一种网页长截图方法、装置、设备和存储介质
CN109636724A (zh) 一种列表界面的显示方法、装置、设备及存储介质
CN115147856B (zh) 一种表格信息提取的方法及电子设备
CN110109729B (zh) 一种界面的布局调整方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18920817

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18920817

Country of ref document: EP

Kind code of ref document: A1