CN110728129A - 对图片中的文本内容进行排版的方法、装置、介质和设备 - Google Patents

对图片中的文本内容进行排版的方法、装置、介质和设备 Download PDF

Info

Publication number
CN110728129A
CN110728129A CN201910829016.6A CN201910829016A CN110728129A CN 110728129 A CN110728129 A CN 110728129A CN 201910829016 A CN201910829016 A CN 201910829016A CN 110728129 A CN110728129 A CN 110728129A
Authority
CN
China
Prior art keywords
text
line
character
picture
cutting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910829016.6A
Other languages
English (en)
Other versions
CN110728129B (zh
Inventor
苗广艺
祝斌
黄灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910829016.6A priority Critical patent/CN110728129B/zh
Publication of CN110728129A publication Critical patent/CN110728129A/zh
Application granted granted Critical
Publication of CN110728129B publication Critical patent/CN110728129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供了一种对图片中的文本内容进行排版的方法、装置、介质和电子设备,该排版方法按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;针对每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;根据预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。本公开提供的排版方法,只需要人工批量配置一些参数即可,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。

Description

对图片中的文本内容进行排版的方法、装置、介质和设备
技术领域
本发明涉及计算机技术领域,具体而言,涉及对图片中的文本内容进行排版的方法、装置、介质和设备。
背景技术
教育培训市场规模一直在扩大,最近几年,在线教育也在快速发展。这些教育公司都需要建立自己的题库,将纸质的试卷和教辅书通过扫描成图片然后录入到系统中,是一个有效的建立题库的方法。将题目图片录入为文本,需要大量的人力工作,特别是公式的编辑录入部分,需要一些公式排版的专业知识,这样会导致题目录入的成本非常高。
为了节省题目录入的成本,一个简单方案是只将题目对应的图片切割出来,一道题目对应一张或几张图片,不再做后续的文本录入工作。这样截图格式的题目,在电子设备上使用的时候,会不太美观,主要原因是字体大小难以控制。如果题目本身一行字比较多,在一个屏幕宽度有限的设备上展示,需要将图片缩放到字体比较小,才能完整展示一道题的全部图片,这样会导致阅读起来很不舒适。另外,对于不同的教辅书和试卷,排版格式和字体都不一样,会导致不同切图题目的一行字数各不相同,进而导致在同一台设备上展示多个题目的时候,每个题目图片上的字体大小都不一样。
综上所述,题目录入成文本会导致录入成本非常高,题目切割为图片虽然成本低,会导致在电子终端屏幕上展示非常不美观。
因此,在长期的研发当中,发明人对如何对图片中的文本内容进行排版进行了大量的研究,提出了一种对图片中的文本内容进行排版的方法,以解决上述技术问题之一。
发明内容
本发明的目的在于提供一种对图片中的文本内容进行排版的方法、装置、介质和电子设备,能够解决上述提到的至少一个技术问题。具体方案如下:
根据本发明的具体实施方式,第一方面,本公开提供一种对图片中的文本内容进行排版的方法,包括:
按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;
针对每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;
根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
可选的,所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符包括:
按照所述预设版面分析模型,对所述原始文本图片中的每行文本进行切割,得到切割后的每行文本图像;
对每行文本图像进行字符切割,得到切割后的每一个字符。
可选的,在所述对每行文本图像进行字符切割,得到切割后的每一个字符之前,所述方法还包括:
对每行文本图像中的每一行文本进行垂直方向的投影,得到对应的投影,根据对应的投影得到多个待切割的字符切割候选点,并从所述字符切割候选点中选取对每行文本图像进行字符切割的字符切割点。
可选的,在所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割之前,所述方法还包括:
按照预设版面分析模型,对所述原始文本图片中的每行文本进行定位,定位出每行文本图像。
可选的,
根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度的公式为:
Wb﹦(H+D)*K,其中,Wb为预设每一行文本的宽度、H为所述字符的高度平均值、D为所述相邻字符间距离的平均值、K为所述用户设置的配置参数。
可选的,根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版包括:
选取当前待重新排版的所述原始文本图片的当前原始行文本图像,其中,所述目标文本图片的初始宽度为0,所述目标文本图片的初始位置为第一行;
比较Wb与LINEa+LINEb的宽度和的大小,得到相应的比较结果,其中,所述当前原始行以LINEa表示,所述原始文本图片的所述当前原始行对应的所述目标文本图片的排版调整行以LINEb表示,Wb为所述预设每一行文本的宽度;
根据比较结果对所述原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行;
针对所述原始文本图片,选取出新的一行文本图像,并根据所述预设每一行文本的宽度,对选取出的新的一行文本图像进行重新排版,得到相应的排版调整行,直至遍历所述原始文本图片的每一行文本图像,并对每一行文本图像均进行重新排版,得到相应的排版调整行。
可选的,所述比较结果对所述原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行包括:
若LINEa+LINEb的宽度和大于Wb,则将LINEa切割为LINEa1和LINEa2,使得LINEa1+LINEb的宽度和小于或等于Wb,将LINEa1合并到LINEb的后面;将LINEb的行数+1,并变成所述目标文本图片的下一行,LINEb的宽度更新为0;将LINEa2赋给LINEa;或者,
若LINEa+LINEb的宽度和小于等于Wb,则直接将LINEa合并到LINEb的后面;更新LINEb的宽度;或者,
若LINEb的宽度等于Wb,则LINEb的行数+1,变成所述目标文本图片的下一行,LINEb的宽度更新为0;其中,所述当前原始行以LINEa表示,所述原始文本图片的所述当前原始行对应的所述目标文本图片的排版调整行以LINEb表示,Wb为所述预设每一行文本的宽度。
根据本发明的具体实施方式,第二方面,本发明提供一种对图片中的文本内容进行排版的装置,包括:
切割单元,用于按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;
计算单元,用于针对所述切割单元切割出的每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;
排版单元,用于根据所述计算单元计算出的所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
根据本发明的具体实施方式,第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上任一项所述的对图片中的文本内容进行排版的方法。
根据本发明的具体实施方式,第四方面,本发明提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上任一项所述的对图片中的文本内容进行排版的方法。
本发明实施例的上述方案与现有技术相比,至少具有以下有益效果:本公开通过提供一种对图片中的文本内容进行排版的方法、装置、介质和电子设备,通过字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;根据预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。本公开提供的排版方法,只需要人工批量配置一些参数即可,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明实施例的对图片中的文本内容进行排版的方法流程图;
图2示出了根据本发明实施例的具体应用场景下的输入的原始文本图片的示意图;
图3示出了根据本发明实施例的具体应用场景下的切割出的每行文本图像的示意图;
图4示出了根据本发明实施例的具体应用场景下的切割出的当前行文本的每一个字符的示意图;
图5示出了根据本发明实施例的具体应用场景下的最终得到的目标文本图片的示意图;
图6示出了根据本发明的实施例的对图片中的文本内容进行排版的装置结构示意图;
图7示出了根据本发明的实施例的电子设备连接结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述……,但这些……不应限于这些术语。这些术语仅用来将……区分开。例如,在不脱离本发明实施例范围的情况下,第一……也可以被称为第二……,类似地,第二……也可以被称为第一……。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者装置中还存在另外的相同要素。
下面结合附图详细说明本发明的可选实施例。
实施例1
如图1所示,根据本公开的具体实施方式,第一方面,本公开提供一种对图片中的文本内容进行排版的方法,具体包括如下方法步骤:
S102:按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符。
在此步骤中,预设切割模型是根据切割算法建立起来的。通过预设切割模型,能够精准地对原始文本图片中的每一行文本中的每一个字符进行精准切割,得到切割后的每一个字符。
在实际应用中,不断地对预设切割模型进行训练,得到不断优化的预设切割模型。
针对本公开提供的排版方法中,对原始文本图片中的字符进行切割的过程列举如下实例:
步骤a:输入原始文本图片;输入的原始文本图片如图2所示。
步骤b:利用“版面分析”算法对应的预设版面分析模型,在上述原始文本图片上定位出每一行文本,进而把每行图像切割出来;切割出的每行文本图像如图3所示。
步骤c:对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;切割出的当前行文本的每一个字符如图4所示。
上述仅仅列举了通过本公开提供的排版方法对原始文本图片中的每一个字符进行切割的过程,具体对其它文本图片进行字符切割的过程烦请参见上述列举的实例,在此不再赘述。
S104:针对每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度。
在此步骤中,通过对不同原始文本图片中的所有字符的高度进行统计,并计算出对应的所有字符的高度平均值;以及通过对不同原始文本图片中的所有相邻字符间距离进行统计,并计算出对应的所有相邻字符间距离平均值。
在不同的应用场景中,用户通过设置不同的配置参数,对预设每一行文本的宽度进行调整,以得到符合用户需求的每一行文本的宽度,更加贴合于用户的观看习惯。
在本公开提供的排版方法的技术方案中,根据字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度的公式为:
Wb﹦(H+D)*K,其中,Wb为预设每一行文本的宽度、H为字符的高度平均值、D为相邻字符间距离的平均值、K为用户设置的配置参数。
如上所述,仅仅列举了一种配置参数,例如:K,除了该配置参数之外,还可以引入其它配置参数,以对排版方法使用的算法不断优化,得到更加智能化的排版方法。
在某一具体应用场景下,根据大量训练模型的训练结果,当K取20时,通过本公开提供的排版方法排版出的目标文本图片更加符合用户的观看习惯,画面也更加美观。
需要说明的是,用户设置的配置参数可以根据用户的观看习惯,预先进行设置,并将设置好的配置参数设置为默认配置参数,这样,就避免每次都要调整,简化了自动重新排版的过程。
S106:根据预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
在此步骤中,首先,根据对原始文本图片的每一行文本图像进行重新排版,根据预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版包括:
选取当前待重新排版的原始文本图片的当前原始行文本图像,其中,目标文本图片的初始宽度为0,目标文本图片的初始位置为第一行;
比较Wb与LINEa+LINEb的宽度和的大小,得到相应的比较结果,其中,当前原始行以LINEa表示,原始文本图片的当前原始行对应的目标文本图片的排版调整行以LINEb表示,Wb为预设每一行文本的宽度;
根据比较结果对原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行;
针对原始文本图片,选取出新的一行文本图像,并根据预设每一行文本的宽度,对选取出的新的一行文本图像进行重新排版,得到相应的排版调整行,直至遍历原始文本图片的每一行文本图像,并对每一行文本图像均进行重新排版,得到相应的排版调整行。
在此步骤中,比较结果对原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行包括:
若LINEa+LINEb的宽度和大于Wb,则将LINEa切割为LINEa1和LINEa2,使得LINEa1+LINEb的宽度和小于或等于Wb,将LINEa1合并到LINEb的后面;将LINEb的行数+1,并变成目标文本图片的下一行,LINEb的宽度更新为0;将LINEa2赋给LINEa;或者,
若LINEa+LINEb的宽度和小于等于Wb,则直接将LINEa合并到LINEb的后面;更新LINEb的宽度;或者,
若LINEb的宽度等于Wb,则LINEb的行数+1,变成目标文本图片的下一行,LINEb的宽度更新为0;其中,当前原始行以LINEa表示,原始文本图片的当前原始行对应的目标文本图片的排版调整行以LINEb表示,Wb为预设每一行文本的宽度。
上述列举了三种情况,根据不同的情况,执行相应的操作,就可以对原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
如上列举的实例,
在此步骤中,根据本公开提供的排版方法,最终得到的目标文本图片具体如图5所示。
通过比较上述实例的对比原始文本图片和目标文本图片可知:通过本公开提供的排版方法,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。
可选的,按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符包括:
按照预设版面分析模型,对原始文本图片中的每行文本进行切割,得到切割后的每行文本图像;
对每行文本图像进行字符切割,得到切割后的每一个字符。
可选的,在对每行文本图像进行字符切割,得到切割后的每一个字符之前,所述方法还包括:
对每行文本图像中的每一行文本进行垂直方向的投影,得到对应的投影,根据对应的投影得到多个待切割的字符切割候选点,并从字符切割候选点中选取对每行文本图像进行字符切割的字符切割点。
可选的,在按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割之前,所述方法还包括:
按照预设版面分析模型,对原始文本图片中的每行文本进行定位,定位出每行文本图像。
可选的,根据字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度的公式为:
Wb﹦(H+D)*K,其中,Wb为预设每一行文本的宽度、H为字符的高度平均值、D为相邻字符间距离的平均值、K为用户设置的配置参数。
可选的,根据预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版包括:
选取当前待重新排版的原始文本图片的当前原始行文本图像,其中,目标文本图片的初始宽度为0,目标文本图片的初始位置为第一行;
比较Wb与LINEa+LINEb的宽度和的大小,得到相应的比较结果,其中,当前原始行以LINEa表示,原始文本图片的当前原始行对应的目标文本图片的排版调整行以LINEb表示,Wb为预设每一行文本的宽度;
根据比较结果对原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行;
针对原始文本图片,选取出新的一行文本图像,并根据预设每一行文本的宽度,对选取出的新的一行文本图像进行重新排版,得到相应的排版调整行,直至遍历原始文本图片的每一行文本图像,并对每一行文本图像均进行重新排版,得到相应的排版调整行。
可选的,比较结果对原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行包括:
若LINEa+LINEb的宽度和大于Wb,则将LINEa切割为LINEa1和LINEa2,使得LINEa1+LINEb的宽度和小于或等于Wb,将LINEa1合并到LINEb的后面;将LINEb的行数+1,并变成目标文本图片的下一行,LINEb的宽度更新为0;将LINEa2赋给LINEa;或者,
若LINEa+LINEb的宽度和小于等于Wb,则直接将LINEa合并到LINEb的后面;更新LINEb的宽度;或者,
若LINEb的宽度等于Wb,则LINEb的行数+1,变成目标文本图片的下一行,LINEb的宽度更新为0;其中,当前原始行以LINEa表示,原始文本图片的当前原始行对应的目标文本图片的排版调整行以LINEb表示,Wb为预设每一行文本的宽度。
可选的,在按照预设的版面分析模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符之前,所述方法还包括:获取包含文本内容的原始文本图片。
本公开通过提供一种对图片中的文本内容进行排版的方法、装置、介质和电子设备,通过字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;根据预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。本公开提供的排版方法,只需要人工批量配置一些参数即可,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。
实施例2
如图6所示,根据本公开的具体实施方式,第二方面,本公开提供一种对图片中的文本内容进行排版的装置,
排版装置包括切割单元601、计算单元602和排版单元603等,具体如下所述:
切割单元601,用于按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;
计算单元602,用于针对切割单元601切割出的每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;
排版单元603,用于根据计算单元602计算出的预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
可选的,切割单元601具体用于:
按照预设版面分析模型,对原始文本图片中的每行文本进行切割,得到切割后的每行文本图像;
对每行文本图像进行字符切割,得到切割后的每一个字符。
可选的,所述装置还包括:
投影单元(在图6中未示出),用于在切割单元601对每行文本图像进行字符切割,得到切割后的每一个字符之前,对每行文本图像中的每一行文本进行垂直方向的投影,得到对应的投影;
字符切割候选点确定单元(在图6中未示出),用于根据投影单元投影出的对应的投影得到多个待切割的字符切割候选点;
字符切割点选取单元(在图6中未示出),用于从字符切割候选点确定单元确定出的字符切割候选点中选取对每行文本图像进行字符切割的字符切割点。
可选的,所述装置还包括:
定位单元(在图6中未示出),用于切割单元601在按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割之前,按照预设版面分析模型,对原始文本图片中的每行文本进行定位,定位出每行文本图像。
可选的,根据字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度的公式为:
Wb﹦(H+D)*K,其中,Wb为预设每一行文本的宽度、H为字符的高度平均值、D为相邻字符间距离的平均值、K为用户设置的配置参数。
可选的,排版单元603包括:
选取子单元,用于选取当前待重新排版的原始文本图片的当前原始行文本图像,其中,目标文本图片的初始宽度为0,目标文本图片的初始位置为第一行;
比较子单元,用于比较Wb与LINEa+LINEb的宽度和的大小,得到相应的比较结果,其中,当前原始行以LINEa表示,原始文本图片的当前原始行对应的目标文本图片的排版调整行以LINEb表示,Wb为预设每一行文本的宽度;
排版子单元,用于根据比较子单元确定出的比较结果对原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行;
循环子单元,用于针对原始文本图片,选取出新的一行文本图像,并根据预设每一行文本的宽度,对选取出的新的一行文本图像进行重新排版,得到相应的排版调整行,直至遍历原始文本图片的每一行文本图像,并对每一行文本图像均进行重新排版,得到相应的排版调整行。
可选的,比较子单元具体用于:
比较结果对原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行包括:
若LINEa+LINEb的宽度和大于Wb,则将LINEa切割为LINEa1和LINEa2,使得LINEa1+LINEb的宽度和小于或等于Wb,将LINEa1合并到LINEb的后面;将LINEb的行数+1,并变成目标文本图片的下一行,LINEb的宽度更新为0;将LINEa2赋给LINEa;或者,
若LINEa+LINEb的宽度和小于等于Wb,则直接将LINEa合并到LINEb的后面;更新LINEb的宽度;或者,
若LINEb的宽度等于Wb,则LINEb的行数+1,变成目标文本图片的下一行,LINEb的宽度更新为0;其中,当前原始行以LINEa表示,原始文本图片的当前原始行对应的目标文本图片的排版调整行以LINEb表示,Wb为预设每一行文本的宽度。
可选的,所述装置还包括:
获取单元(在图6中未示出),用于在切割单元601按照预设的版面分析模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符之前,获取包含文本内容的原始文本图片。
本公开通过提供一种对图片中的文本内容进行排版的方法、装置、介质和电子设备,通过字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;根据预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。本公开提供的排版方法,只需要人工批量配置一些参数即可,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。
实施例3
如图7所示,本实施例提供一种电子设备,该设备用于对图片中的文本内容进行排版的方法,所述电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:只需要人工批量配置一些参数即可,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。
实施例4
本公开实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的对图片中的文本内容进行排版的方法。
实施例5
下面参考图7,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700可以包括处理装置(例如中央处理器、图形处理器等)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储装置708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM703中,还存储有电子设备700操作所需的各种程序和数据。处理装置701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
通常,以下装置可以连接至I/O接口705:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置706;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置707;包括例如磁带、硬盘等的存储装置708;以及通信装置709。通信装置709可以允许电子设备700与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备700,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置709从网络上被下载和安装,或者从存储装置708被安装,或者从ROM702被安装。在该计算机程序被处理装置701执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:只需要人工批量配置一些参数即可,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:只需要人工批量配置一些参数即可,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

Claims (10)

1.一种对图片中的文本内容进行排版的方法,其特征在于,包括:
按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;
针对每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;
根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
2.根据权利要求1所述的方法,其特征在于,所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符包括:
按照所述预设版面分析模型,对所述原始文本图片中的每行文本进行切割,得到切割后的每行文本图像;
对每行文本图像进行字符切割,得到切割后的每一个字符。
3.根据权利要求2所述的方法,其特征在于,在所述对每行文本图像进行字符切割,得到切割后的每一个字符之前,所述方法还包括:
对每行文本图像中的每一行文本进行垂直方向的投影,得到对应的投影;根据对应的投影得到多个待切割的字符切割候选点,并从所述字符切割候选点中选取对每行文本图像进行字符切割的字符切割点。
4.根据权利要求2所述的方法,其特征在于,在所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割之前,所述方法还包括:
按照预设版面分析模型,对所述原始文本图片中的每行文本进行定位,定位出每行文本图像。
5.根据权利要求1所述的方法,其特征在于,
根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度的公式为:
Wb﹦(H+D)*K,其中,Wb为预设每一行文本的宽度、H为所述字符的高度平均值、D为所述相邻字符间距离的平均值、K为所述用户设置的配置参数。
6.根据权利要求5所述的方法,其特征在于,根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版包括:
选取当前待重新排版的所述原始文本图片的当前原始行文本图像,其中,所述目标文本图片的初始宽度为0,所述目标文本图片的初始位置为第一行;
比较Wb与LINEa+LINEb的宽度和的大小,得到相应的比较结果,其中,所述当前原始行以LINEa表示,所述原始文本图片的所述当前原始行对应的所述目标文本图片的排版调整行以LINEb表示,Wb为所述预设每一行文本的宽度;
根据比较结果对所述原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行;
针对所述原始文本图片,选取出新的一行文本图像,并根据所述预设每一行文本的宽度,对选取出的新的一行文本图像进行重新排版,得到相应的排版调整行,直至遍历所述原始文本图片的每一行文本图像,并对每一行文本图像均进行重新排版,得到相应的排版调整行。
7.根据权利要求6所述的方法,其特征在于,所述比较结果对所述原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行包括:
若LINEa+LINEb的宽度和大于Wb,则将LINEa切割为LINEa1和LINEa2,使得LINEa1+LINEb的宽度和小于或等于Wb,将LINEa1合并到LINEb的后面;将LINEb的行数+1,并变成所述目标文本图片的下一行,LINEb的宽度更新为0;将LINEa2赋给LINEa;或者,
若LINEa+LINEb的宽度和小于等于Wb,则直接将LINEa合并到LINEb的后面;更新LINEb的宽度;或者,
若LINEb的宽度等于Wb,则LINEb的行数+1,变成所述目标文本图片的下一行,LINEb的宽度更新为0;其中,所述当前原始行以LINEa表示,所述原始文本图片的所述当前原始行对应的所述目标文本图片的排版调整行以LINEb表示,Wb为所述预设每一行文本的宽度。
8.一种对图片中的文本内容进行排版的装置,其特征在于,包括:
切割单元,用于按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;
计算单元,用于针对所述切割单元切割出的每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;
排版单元,用于根据所述计算单元计算出的所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的方法。
CN201910829016.6A 2019-09-03 2019-09-03 对图片中的文本内容进行排版的方法、装置、介质和设备 Active CN110728129B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910829016.6A CN110728129B (zh) 2019-09-03 2019-09-03 对图片中的文本内容进行排版的方法、装置、介质和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910829016.6A CN110728129B (zh) 2019-09-03 2019-09-03 对图片中的文本内容进行排版的方法、装置、介质和设备

Publications (2)

Publication Number Publication Date
CN110728129A true CN110728129A (zh) 2020-01-24
CN110728129B CN110728129B (zh) 2023-06-23

Family

ID=69217781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910829016.6A Active CN110728129B (zh) 2019-09-03 2019-09-03 对图片中的文本内容进行排版的方法、装置、介质和设备

Country Status (1)

Country Link
CN (1) CN110728129B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626036A (zh) * 2020-05-27 2020-09-04 南京蓝鲸人网络科技有限公司 一种新型的图文排版处理方法
CN112785516A (zh) * 2021-01-05 2021-05-11 大陆汽车车身电子系统(芜湖)有限公司 基于数字图片的数值显示方法及车速显示方法
CN115470753A (zh) * 2022-09-27 2022-12-13 广州优谷信息技术有限公司 导读文本显示方法、系统、装置及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890826A (zh) * 2011-08-12 2013-01-23 北京多看科技有限公司 一种扫描版文档重排版的方法
JP2013101616A (ja) * 2011-11-09 2013-05-23 Canon Inc 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
CN103870444A (zh) * 2012-12-12 2014-06-18 腾讯科技(深圳)有限公司 一种图片式文本的切图方法和系统
WO2014180387A1 (zh) * 2013-12-05 2014-11-13 中兴通讯股份有限公司 一种信息输入方法及装置
CN104346156A (zh) * 2013-08-05 2015-02-11 北大方正集团有限公司 显示文本块、文本块处理的方法和装置
US20150067456A1 (en) * 2013-08-28 2015-03-05 Canon Kabushiki Kaisha Image display apparatus, control method therefor, and storage medium
CN104915332A (zh) * 2015-06-15 2015-09-16 广东欧珀移动通信有限公司 一种生成排版模板的方法及装置
CN106445904A (zh) * 2016-09-30 2017-02-22 乐视控股(北京)有限公司 一种页面排版方法及装置
US20180053048A1 (en) * 2016-01-05 2018-02-22 Tencent Technology (Shenzhen) Company Limited Text image processing method and apparatus
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
WO2018196607A1 (zh) * 2017-04-24 2018-11-01 北京金山办公软件股份有限公司 一种文本信息展示方法及装置
CN110069767A (zh) * 2019-04-23 2019-07-30 掌阅科技股份有限公司 基于电子书的排版方法、电子设备及计算机存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890826A (zh) * 2011-08-12 2013-01-23 北京多看科技有限公司 一种扫描版文档重排版的方法
JP2013101616A (ja) * 2011-11-09 2013-05-23 Canon Inc 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
CN103870444A (zh) * 2012-12-12 2014-06-18 腾讯科技(深圳)有限公司 一种图片式文本的切图方法和系统
CN104346156A (zh) * 2013-08-05 2015-02-11 北大方正集团有限公司 显示文本块、文本块处理的方法和装置
US20150067456A1 (en) * 2013-08-28 2015-03-05 Canon Kabushiki Kaisha Image display apparatus, control method therefor, and storage medium
WO2014180387A1 (zh) * 2013-12-05 2014-11-13 中兴通讯股份有限公司 一种信息输入方法及装置
CN104915332A (zh) * 2015-06-15 2015-09-16 广东欧珀移动通信有限公司 一种生成排版模板的方法及装置
US20180053048A1 (en) * 2016-01-05 2018-02-22 Tencent Technology (Shenzhen) Company Limited Text image processing method and apparatus
CN106445904A (zh) * 2016-09-30 2017-02-22 乐视控股(北京)有限公司 一种页面排版方法及装置
WO2018196607A1 (zh) * 2017-04-24 2018-11-01 北京金山办公软件股份有限公司 一种文本信息展示方法及装置
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN110069767A (zh) * 2019-04-23 2019-07-30 掌阅科技股份有限公司 基于电子书的排版方法、电子设备及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈明,丁晓青,梁健: "复杂中文报纸的版面分析、理解和重构", no. 01 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626036A (zh) * 2020-05-27 2020-09-04 南京蓝鲸人网络科技有限公司 一种新型的图文排版处理方法
CN112785516A (zh) * 2021-01-05 2021-05-11 大陆汽车车身电子系统(芜湖)有限公司 基于数字图片的数值显示方法及车速显示方法
CN115470753A (zh) * 2022-09-27 2022-12-13 广州优谷信息技术有限公司 导读文本显示方法、系统、装置及存储介质
CN115470753B (zh) * 2022-09-27 2024-01-02 广州优谷信息技术有限公司 导读文本显示方法、系统、装置及存储介质

Also Published As

Publication number Publication date
CN110728129B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN109688463B (zh) 一种剪辑视频生成方法、装置、终端设备及存储介质
CN110264545A (zh) 图片生成方法、装置、电子设备及存储介质
CN110728129B (zh) 对图片中的文本内容进行排版的方法、装置、介质和设备
CN109710865B (zh) 开放式自动布局方法、装置、电子设备和存储介质
CN111131876B (zh) 视频直播的控制方法、装置、终端及计算机可读存储介质
CN110568982B (zh) 在线演示文稿中的图片裁剪方法、装置、存储介质及设备
CN109389365B (zh) 多人协作式文档的处理方法、装置和电子设备
CN110177295B (zh) 字幕越界的处理方法、装置和电子设备
CN111783508A (zh) 用于处理图像的方法和装置
CN110188299B (zh) 响应式页面处理方法、装置及电子设备
CN111459601A (zh) 数据处理方法、装置、电子设备及计算机可读介质
CN113741773A (zh) 一种信息展示方法、装置、设备及介质
CN110443772B (zh) 图片处理方法、装置、计算机设备和存储介质
CN110069547B (zh) 在线数据库表格数据统计方法、装置、介质和电子设备
CN111199136A (zh) 文档内容的展示方法、装置及设备
CN112492399B (zh) 信息显示方法、装置及电子设备
CN111507123B (zh) 点读材料的放置方法、装置、点读设备、电子设备及介质
CN115619904A (zh) 图像处理方法、装置及设备
CN115599276A (zh) 基于人工智能ai三维模型展示方法及系统
CN117319736A (zh) 视频处理方法、装置、电子设备及存储介质
CN111709342B (zh) 字幕分割方法、装置、设备及存储介质
CN116137662A (zh) 页面展示方法及装置、电子设备、存储介质和程序产品
CN110929571B (zh) 一种笔迹拟合的方法、装置、介质和电子设备
CN113467681A (zh) 图片的翻转和显示方法、装置、电子设备及可读介质
CN111104026A (zh) 推荐服务的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant