CN115830600B - 一种图文设计页面识别整理方法 - Google Patents

一种图文设计页面识别整理方法 Download PDF

Info

Publication number
CN115830600B
CN115830600B CN202310150272.9A CN202310150272A CN115830600B CN 115830600 B CN115830600 B CN 115830600B CN 202310150272 A CN202310150272 A CN 202310150272A CN 115830600 B CN115830600 B CN 115830600B
Authority
CN
China
Prior art keywords
text
design page
identification
image
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310150272.9A
Other languages
English (en)
Other versions
CN115830600A (zh
Inventor
李璐昆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Jincheng Information Security Technology Co ltd
Original Assignee
Hangzhou Jincheng Information Security Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Jincheng Information Security Technology Co ltd filed Critical Hangzhou Jincheng Information Security Technology Co ltd
Priority to CN202310150272.9A priority Critical patent/CN115830600B/zh
Publication of CN115830600A publication Critical patent/CN115830600A/zh
Application granted granted Critical
Publication of CN115830600B publication Critical patent/CN115830600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明适用于图文数据识别技术领域,提供了一种图文设计页面识别整理方法,包括以下步骤:对图文设计页面进行网格划分,形成第一网格坐标系;对图文设计页面进行文字识别,得到识别文字;将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标,并得到每个识别文字的文字字号;新建空白设计页面,所述空白设计页面的页面尺寸与图文设计页面的页面尺寸完全相同,对空白设计页面进行网格划分,形成第二网格坐标系,第二网格坐标系与第一网格坐标系相对应;根据所述位置坐标将识别文字移动至空白设计页面上。本发明保留了文字的排版特征,且通过文字的位置和文字的字号大小,能够直观的反映出文字的侧重点。

Description

一种图文设计页面识别整理方法
技术领域
本发明涉及图文数据识别技术领域,具体是涉及一种图文设计页面识别整理方法。
背景技术
图文设计是指通过计算机技术,将图形与文字等设计元素相结合而形成的凝结设计。一般来说平面设计涉及的范围很广,因为平面设计的基本元素是色彩,图片,文字和版本的组合。图文设计又称版式设计,在艺术中它是一门非常重要的学科,应用范围很广,实用性很强,适用于报刊、杂志、书籍、插图等等。为了提高工作效率,经常需要对图文设计页面进行识别,提取其中的文字元素,对文字元素进行再次加工与利用,目前对图片中文字进行识别时,仅仅能够将文字识别出来,并不能够保留文字的特征,进而无法保留文字的侧重点、排版等元素。因此,需要提供一种图文设计页面识别整理方法,旨在解决上述问题。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种图文设计页面识别整理方法,以解决上述背景技术中存在的问题。
本发明是这样实现的,一种图文设计页面识别整理方法,所述方法包括以下步骤:
对图文设计页面进行网格划分,形成第一网格坐标系;
对图文设计页面进行文字识别,得到识别文字;
将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标,并得到每个识别文字的文字字号;
新建空白设计页面,所述空白设计页面的页面尺寸与图文设计页面的页面尺寸完全相同,对空白设计页面进行网格划分,形成第二网格坐标系,第二网格坐标系与第一网格坐标系相对应;
根据所述位置坐标将识别文字移动至空白设计页面上。
作为本发明进一步的方案:所述将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标的步骤,具体包括:
根据识别文字的来源将每个识别文字与图文设计页面中的文字区块进行对应;
为图文设计页面中的每个文字区块添加方框,得到第一文字框;
得到每个第一文字框中心处的位置坐标,根据第一文字框中心处的位置坐标确定每个识别文字的位置坐标。
作为本发明进一步的方案:所述第一文字框的四个边框线均与图文设计页面中的文字相接触。
作为本发明进一步的方案:所述得到每个识别文字的文字字号的步骤,具体包括:
确定每个第一文字框的高度值;
将第一文字框的高度值与所有文字字号进行匹配,确定第一文字框所对应的文字字号,进而得到每个识别文字的文字字号。
作为本发明进一步的方案:位置坐标将识别文字移动至空白设计页面上的步骤,具体包括:
为每个识别文字添加方框,得到第二文字框;
以第二文字框的中心处为基点将识别文字移动至空白设计页面上;
将识别文字周围的方框删除。
作为本发明进一步的方案:所述方法还包括:
提取图文设计页面中每个文字区块的颜色;
根据提取的颜色确定每个识别文字的颜色;
将确定的颜色添加至空白设计页面中的识别文字上,使得每个识别文字的颜色与文字区块的颜色相对应。
作为本发明进一步的方案:所述方法还包括对图文设计页面中的文字区块进行抠图处理,得到图文设计页面中的背景图片。
作为本发明进一步的方案:所述对图文设计页面中的文字区块进行抠图处理,得到图文设计页面中的背景图片的步骤,具体包括:
根据提取的颜色以及识别文字的字形确定图文设计页面中对应文字的轮廓;
扣除轮廓中的所有内容,得到空白轮廓,图文设计页面中的文字被删除;
根据空白轮廓周围的颜色特征对空白轮廓进行自动填充,得到图文设计页面中的背景图片。
作为本发明进一步的方案:所述根据空白轮廓周围的颜色特征对空白轮廓进行自动填充的步骤,具体包括:
按照像素点沿着轮廓依次提取识别空白轮廓外围的颜色,使得轮廓上的每个像素点对应一个颜色;
使得轮廓上每个像素点所对应的颜色向内侧延伸填充,直至空白轮廓的内部被填满,停止延伸填充。
作为本发明进一步的方案:所述方法还包括:
新建一个图层,将背景图片复制到新建图层中;
将新建的图层添加至空白设计页面,并使得识别文字位于新建图层的上层,所述识别文字能够进行文字编辑。
本发明的另一目的在于提供一种图文设计页面识别整理系统,所述系统包括:
坐标系建立模块,用于对图文设计页面进行网格划分,形成第一网格坐标系;
页面文字识别模块,用于对图文设计页面进行文字识别,得到识别文字;
位置坐标确定模块,用于将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标,并得到每个识别文字的文字字号;
空白页面新建模块,用于新建空白设计页面,所述空白设计页面的页面尺寸与图文设计页面的页面尺寸完全相同,对空白设计页面进行网格划分,形成第二网格坐标系,第二网格坐标系与第一网格坐标系相对应;
识别文字移动模块,用于根据所述位置坐标将识别文字移动至空白设计页面上。
与现有技术相比,本发明的有益效果是:
本发明能够将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标,并得到每个识别文字的文字字号;接着新建空白设计页面,所述空白设计页面的页面尺寸与图文设计页面的页面尺寸完全相同;最后根据所述位置坐标将识别文字移动至空白设计页面上。
如此,保留了文字的排版特征,且通过文字的位置和文字的字号大小,能够直观的反映出文字的侧重点,尽可能保留了文字的原始特征。
附图说明
图1为一种图文设计页面识别整理方法的流程图。
图2为一种图文设计页面识别整理方法中得到每个识别文字的位置坐标的流程图。
图3为一种图文设计页面识别整理方法中得到每个识别文字的文字字号的流程图。
图4为一种图文设计页面识别整理方法中根据所述位置坐标将识别文字移动至空白设计页面上的流程图。
图5为一种图文设计页面识别整理方法中使得每个识别文字的颜色与文字区块的颜色相对应的流程图。
图6为一种图文设计页面识别整理方法中对图文设计页面中的文字区块进行抠图处理,得到图文设计页面中的背景图片的流程图。
图7为一种图文设计页面识别整理系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清晰,以下结合附图及具体实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,本发明实施例提供了一种图文设计页面识别整理方法,所述方法包括以下步骤:
S100,对图文设计页面进行网格划分,形成第一网格坐标系;
S200,对图文设计页面进行文字识别,得到识别文字;
S300,将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标,并得到每个识别文字的文字字号;
S400,新建空白设计页面,所述空白设计页面的页面尺寸与图文设计页面的页面尺寸完全相同,对空白设计页面进行网格划分,形成第二网格坐标系,第二网格坐标系与第一网格坐标系相对应;
S500,根据所述位置坐标将识别文字移动至空白设计页面上。
需要说明的是,为了提高工作效率,经常需要对图文设计页面进行识别,提取其中的文字元素,对文字元素进行再次加工与利用,目前对图片中文字进行识别时,仅仅能够将文字识别出来,并不能够保留文字的特征,进而无法保留文字的侧重点、排版等元素,本发明实施例旨在解决上述问题。
本发明实施例中,首先会自动对图文设计页面进行网格划分,建立起第一网格坐标系,接着对图文设计页面进行文字识别,得到识别文字,对图片中的文字进行自动识别为现有的成熟技术手段,这里不再赘述,然后将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标,并得到每个识别文字的文字字号,这样就保留了文字排版特征,且通过文字的位置和文字的字号大小,能够直观的反映出文字的侧重点。接着新建空白设计页面,所述空白设计页面的页面尺寸与图文设计页面的页面尺寸完全相同,对空白设计页面进行网格划分,形成第二网格坐标系,根据所述位置坐标将识别文字移动至空白设计页面上,如此,对识别出的文字进行了整理,尽可能保留了文字的原始特征。
如图2所示,作为本发明一个优选的实施例,所述将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标的步骤,具体包括:
S301,根据识别文字的来源将每个识别文字与图文设计页面中的文字区块进行对应;
S302,为图文设计页面中的每个文字区块添加方框,得到第一文字框;
S303,得到每个第一文字框中心处的位置坐标,根据第一文字框中心处的位置坐标确定每个识别文字的位置坐标。
本发明实施例中,为了精准的确定位置坐标,需要为图文设计页面中的每个文字区块添加方框,得到第一文字框,所述第一文字框的四个边框线均与图文设计页面中的文字相接触。接着得到每个第一文字框中心处的位置坐标,根据第一文字框中心处的位置坐标确定每个识别文字的位置坐标。
如图3所示,作为本发明一个优选的实施例,所述得到每个识别文字的文字字号的步骤,具体包括:
S304,确定每个第一文字框的高度值;
S305,将第一文字框的高度值与所有的文字字号进行匹配,确定第一文字框所对应的文字字号,进而得到每个识别文字的文字字号。
本发明实施例中,为了确定识别文字的大小,需要得到每个第一文字框的高度值,将第一文字框的高度值与所有的文字字号进行匹配,文字字号所表达的也是文字高度,本发明实施例通过匹配确定最接近的文字字号,进而得到每个识别文字的文字字号。
如图4所示,作为本发明一个优选的实施例,位置坐标将识别文字移动至空白设计页面上的步骤,具体包括:
S501,为每个识别文字添加方框,得到第二文字框;
S502,以第二文字框的中心处为基点将识别文字移动至空白设计页面上;
S503,将识别文字周围的方框删除。
本发明实施例中,移动识别文字时,需要确定一个移动基点,本发明实施例会为每个识别文字添加方框,得到第二文字框,这样就能够以第二文字框的中心处为基点将识别文字移动至空白设计页面上,最后需要将识别文字周围的方框删除。
如图5所示,作为本发明一个优选的实施例,所述方法还包括:
S601,提取图文设计页面中每个文字区块的颜色;
S602,根据提取的颜色确定每个识别文字的颜色;
S603,将确定的颜色添加至空白设计页面中的识别文字上,使得每个识别文字的颜色与文字区块的颜色相对应。
本发明实施例中,进一步的,还可以保留文字的颜色特征,本发明实施例会自动提取图文设计页面中每个文字区块的颜色,然后根据提取的颜色确定每个识别文字的颜色,最后将确定的颜色添加至空白设计页面中的识别文字上。
如图6所示,作为本发明一个优选的实施例,所述方法还包括对图文设计页面中的文字区块进行抠图处理,得到图文设计页面中的背景图片,具体步骤为:
S701,根据提取的颜色以及识别文字的字形确定图文设计页面中对应文字的轮廓;
S702,扣除轮廓中的所有内容,得到空白轮廓,图文设计页面中的文字被删除;
S703,根据空白轮廓周围的颜色特征对空白轮廓进行自动填充,得到图文设计页面中的背景图片。
本发明实施例中,为了得到图文设计页面中的背景图片,首先需要根据提取的颜色以及识别文字的形状去确定图文设计页面中对应文字的轮廓,然后自动扣除轮廓中的所有内容,得到空白轮廓,图文设计页面中的文字就会被删除;接着按照像素点沿着轮廓依次提取识别空白轮廓外围的颜色,使得轮廓上的每个像素点对应一个颜色;使得轮廓上每个像素点所对应的颜色向内侧延伸填充,直至空白轮廓的内部被填满,停止延伸填充,如此,就能够得到不含文字的背景图片。
进一步的,本发明实施例会自动新建一个图层,将背景图片复制到新建图层中,然后将新建的图层添加至空白设计页面,并使得识别文字位于新建图层的上层,所述识别文字能够进行文字编辑,如此,直接利用原来的背景图片,且方便对识别文字进行修改。
如图7所示,本发明实施例还提供了一种图文设计页面识别整理系统,所述系统包括:
坐标系建立模块100,用于对图文设计页面进行网格划分,形成第一网格坐标系;
页面文字识别模块200,用于对图文设计页面进行文字识别,得到识别文字;
位置坐标确定模块300,用于将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标,并得到每个识别文字的文字字号;
空白页面新建模块400,用于新建空白设计页面,所述空白设计页面的页面尺寸与图文设计页面的页面尺寸完全相同,对空白设计页面进行网格划分,形成第二网格坐标系,第二网格坐标系与第一网格坐标系相对应;
识别文字移动模块500,用于根据所述位置坐标将识别文字移动至空白设计页面上。
作为本发明一个优选的实施例,所述位置坐标确定模块300包括:
文字区块对应单元,用于根据识别文字的来源将每个识别文字与图文设计页面中的文字区块进行对应;
第一文字框确定单元,用于为图文设计页面中的每个文字区块添加方框,得到第一文字框;
位置坐标确定单元,用于得到每个第一文字框中心处的位置坐标,根据第一文字框中心处的位置坐标确定每个识别文字的位置坐标。
作为本发明一个优选的实施例,所述位置坐标确定模块300还包括:
高度值确定单元,用于确定每个第一文字框的高度值;
文字字号匹配单元,用于将第一文字框的高度值与所有的文字字号进行匹配,确定第一文字框所对应的文字字号,进而得到每个识别文字的文字字号。
作为本发明一个优选的实施例,所述识别文字移动模块500包括:
第二文字框确定单元,用于为每个识别文字添加方框,得到第二文字框;
识别文字移动单元,用于以第二文字框的中心处为基点将识别文字移动至空白设计页面上;
文字框删除单元,用于将识别文字周围的方框删除。
作为本发明一个优选的实施例,所述系统还包括识别文字上色模块,识别文字上色模块具体包括:
文字区块颜色识别单元,用于提取图文设计页面中每个文字区块的颜色;
识别文字颜色确定单元,用于根据提取的颜色确定每个识别文字的颜色;
识别文字颜色添加单元,用于将确定的颜色添加至空白设计页面中的识别文字上,使得每个识别文字的颜色与文字区块的颜色相对应。
作为本发明一个优选的实施例,所述系统还包括空白轮廓填充模块,空白轮廓填充模块具体包括:
文字轮廓确定单元,用于根据提取的颜色以及识别文字的字形确定图文设计页面中对应文字的轮廓;
空白轮廓获取单元,用于扣除轮廓中的所有内容,得到空白轮廓,图文设计页面中的文字被删除;
空白轮廓填充单元,用于根据空白轮廓周围的颜色特征对空白轮廓进行自动填充,得到图文设计页面中的背景图片。
以上仅对本发明的较佳实施例进行了详细叙述,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实施例处的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (6)

1.一种图文设计页面识别整理方法,其特征在于,所述方法包括以下步骤:
对图文设计页面进行网格划分,形成第一网格坐标系;
对图文设计页面进行文字识别,得到识别文字;
将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标,并得到每个识别文字的文字字号;
新建空白设计页面,所述空白设计页面的页面尺寸与图文设计页面的页面尺寸完全相同,对空白设计页面进行网格划分,形成第二网格坐标系,第二网格坐标系与第一网格坐标系相对应;
根据所述位置坐标将识别文字移动至空白设计页面上;
所述将每个识别文字与图文设计页面中的文字区块进行对应,得到每个识别文字的位置坐标的步骤,具体包括:
根据识别文字的来源将每个识别文字与图文设计页面中的文字区块进行对应;
为图文设计页面中的每个文字区块添加方框,得到第一文字框;
得到每个第一文字框中心处的位置坐标,根据第一文字框中心处的位置坐标确定每个识别文字的位置坐标;
所述得到每个识别文字的文字字号的步骤,具体包括:
确定每个第一文字框的高度值;
将第一文字框的高度值与所有文字字号进行匹配,确定第一文字框所对应的文字字号,进而得到每个识别文字的文字字号;
所述方法还包括对图文设计页面中的文字区块进行抠图处理,得到图文设计页面中的背景图片;
所述对图文设计页面中的文字区块进行抠图处理,得到图文设计页面中的背景图片的步骤,具体包括:
根据提取的颜色以及识别文字的字形确定图文设计页面中对应文字的轮廓;
扣除轮廓中的所有内容,得到空白轮廓,图文设计页面中的文字被删除;
根据空白轮廓周围的颜色特征对空白轮廓进行自动填充,得到图文设计页面中的背景图片。
2.根据权利要求1所述一种图文设计页面识别整理方法,其特征在于,所述第一文字框的四个边框线均与图文设计页面中的文字相接触。
3.根据权利要求1所述一种图文设计页面识别整理方法,其特征在于,位置坐标将识别文字移动至空白设计页面上的步骤,具体包括:
为每个识别文字添加方框,得到第二文字框;
以第二文字框的中心处为基点将识别文字移动至空白设计页面上;
将识别文字周围的方框删除。
4.根据权利要求1所述一种图文设计页面识别整理方法,其特征在于,所述方法还包括:
提取图文设计页面中每个文字区块的颜色;
根据提取的颜色确定每个识别文字的颜色;
将确定的颜色添加至空白设计页面中的识别文字上,使得每个识别文字的颜色与文字区块的颜色相对应。
5.根据权利要求1所述一种图文设计页面识别整理方法,其特征在于,所述根据空白轮廓周围的颜色特征对空白轮廓进行自动填充的步骤,具体包括:
按照像素点沿着轮廓依次提取识别空白轮廓外围的颜色,使得轮廓上的每个像素点对应一个颜色;
使得轮廓上每个像素点所对应的颜色向内侧延伸填充,直至空白轮廓的内部被填满,停止延伸填充。
6.根据权利要求4所述一种图文设计页面识别整理方法,其特征在于,所述方法还包括:
新建一个图层,将背景图片复制到新建图层中;
将新建的图层添加至空白设计页面,并使得识别文字位于新建图层的上层,所述识别文字能够进行文字编辑。
CN202310150272.9A 2023-02-22 2023-02-22 一种图文设计页面识别整理方法 Active CN115830600B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310150272.9A CN115830600B (zh) 2023-02-22 2023-02-22 一种图文设计页面识别整理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310150272.9A CN115830600B (zh) 2023-02-22 2023-02-22 一种图文设计页面识别整理方法

Publications (2)

Publication Number Publication Date
CN115830600A CN115830600A (zh) 2023-03-21
CN115830600B true CN115830600B (zh) 2023-05-26

Family

ID=85522114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310150272.9A Active CN115830600B (zh) 2023-02-22 2023-02-22 一种图文设计页面识别整理方法

Country Status (1)

Country Link
CN (1) CN115830600B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114463734A (zh) * 2022-02-15 2022-05-10 北京百度网讯科技有限公司 文字识别方法、装置、电子设备及存储介质
CN115188006A (zh) * 2022-06-17 2022-10-14 平安银行股份有限公司 从图像中提取文本的方法、装置、存储介质及电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06225053A (ja) * 1992-02-26 1994-08-12 Ricoh Co Ltd 白紙対応の画像形成方法および画像形成装置
US7181054B2 (en) * 2001-08-31 2007-02-20 Siemens Medical Solutions Health Services Corporation System for processing image representative data
CN103678260A (zh) * 2013-12-25 2014-03-26 南通大学 一种便携式电子名片簿及处理方法
CN108960054A (zh) * 2018-05-29 2018-12-07 昆山双叶软件科技有限公司 一种基于图文识别的通关数据生成系统及方法
CN112528604A (zh) * 2019-09-04 2021-03-19 珠海金山办公软件有限公司 一种自动图文排版的方法、系统、存储介质和终端
CN112183250A (zh) * 2020-09-14 2021-01-05 北京三快在线科技有限公司 文字识别方法、装置、存储介质及电子设备
CN115131803A (zh) * 2022-04-20 2022-09-30 腾讯科技(深圳)有限公司 文档字号的识别方法、装置、计算机设备和存储介质
CN114937270A (zh) * 2022-05-05 2022-08-23 上海迥灵信息技术有限公司 古籍文字处理方法、装置及计算机可读存储介质
CN115618847B (zh) * 2022-12-20 2023-03-14 浙江保融科技股份有限公司 一种解析pdf文档的方法、装置和可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114463734A (zh) * 2022-02-15 2022-05-10 北京百度网讯科技有限公司 文字识别方法、装置、电子设备及存储介质
CN115188006A (zh) * 2022-06-17 2022-10-14 平安银行股份有限公司 从图像中提取文本的方法、装置、存储介质及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Integrated natural scene text localization and recognition;Kakade S. S. 等;2017 International conference of Electronics, Communication and Aerospace Technology (ICECA);371-374 *
基于Tesseract的文字识别研究;章安;中国优秀硕士学位论文全文数据库;I138-2015 *

Also Published As

Publication number Publication date
CN115830600A (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
CN112528863A (zh) 表格结构的识别方法、装置、电子设备及存储介质
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US20060197999A1 (en) Image processing apparatus, image processing method, and image processing program
CN110163030B (zh) 一种基于图像信息的pdf有边框表格抽取方法
CN112115774A (zh) 结合rpa和ai的文字识别方法、装置、电子设备和存储介质
CN111881659B (zh) 表格图片的处理方法、系统、可读存储介质及计算机设备
CN115618847B (zh) 一种解析pdf文档的方法、装置和可读存储介质
CN113920038A (zh) 一种割轮廓提取方法、装置系统及介质
CN110728687A (zh) 文件图像分割方法、装置、计算机设备和存储介质
CN115223172A (zh) 文本提取方法、装置及设备
CN115830600B (zh) 一种图文设计页面识别整理方法
CN112906532B (zh) 图像处理方法和装置、电子设备和存储介质
CN114419632A (zh) 一种ocr训练样本生成方法、装置及系统
CN113255289A (zh) 一种文案排版布局的方法及系统
JP2008108114A (ja) 文書処理装置および文書処理方法
CN111709293A (zh) 一种基于ResUNet神经网络的化学结构式分割方法
CN112767424B (zh) 一种基于室内三维点云空间自动剖分方法
CN114694159A (zh) 一种工程图bom识别方法、装置、电子设备和存储介质
CN113901950A (zh) 一种高准确率的表格ocr识别方法及系统
CN114663414B (zh) 一种基于unet卷积神经网络的岩矿识别提取系统及方法
TWI536317B (zh) 立體圖文產生方法
JP7402931B2 (ja) 方法、コンピュータ可読プログラムおよびシステム
CN114581739B (zh) 一种基于特征识别的点云标注方法、装置及电子设备
CN113144615B (zh) 一种从单张设计图片建模3d场景系统
CN116823807B (zh) 一种桥梁上部结构现浇梁识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant