CN111191580B - 合成渲染方法、装置、电子设备及介质 - Google Patents

合成渲染方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN111191580B
CN111191580B CN201911381881.5A CN201911381881A CN111191580B CN 111191580 B CN111191580 B CN 111191580B CN 201911381881 A CN201911381881 A CN 201911381881A CN 111191580 B CN111191580 B CN 111191580B
Authority
CN
China
Prior art keywords
area
color
information
original
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911381881.5A
Other languages
English (en)
Other versions
CN111191580A (zh
Inventor
刘欢
赵许星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911381881.5A priority Critical patent/CN111191580B/zh
Publication of CN111191580A publication Critical patent/CN111191580A/zh
Application granted granted Critical
Publication of CN111191580B publication Critical patent/CN111191580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本说明书实施例提供了一种合成渲染方法、装置、电子设备及介质,根据对象展示区域的多维信息,对原始展示对象与对象展示区域中相对于原始展示对象的背景区域进行色彩融合处理并进行模糊处理,得到第二空白区域;将第二空白区域与新的展示对象进行合成渲染。

Description

合成渲染方法、装置、电子设备及介质
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种合成渲染方法、装置、电子设备及介质。
背景技术
拍照翻译是一种新的翻译产品形态,将机器翻译技术应用到移动端设备,拍照翻译的基本流程是:对包含文字的场景进行拍照获取图像,然后对获取的图像中的文本行,识别出文本行的文字内容;再对文字内容进行机器翻译,得到翻译后的文字内容;将翻译后的文字内容展示给用户。目前是将翻译后的文字内容在其他区域呈现出来。
发明内容
本说明书实施例提供了一种合成渲染方法、装置、电子设备及介质,以提高了合成渲染后,原背景与新的展示对象之间的融合效果。
第一方面,本说明书实施例提供一种合成渲染方法,包括:提取对象展示区域的多维信息,其中,所述对象展示区域是原始图片中展示有原始展示对象的有效区域,所述多维信息包含多维颜色信息和多维定位信息;根据所述多维颜色信息,对所述原始展示对象与背景区域进行色彩融合处理,得到第一空白区域,所述背景区域为所述对象展示区域中除所述原始展示对象之外的区域;通过对所述第一空白区域进行模糊处理,消除所述第一空白区域内的噪点像素,得到第二空白区域;根据所述多维定位信息,将所述第二空白区域与新的展示对象进行合成渲染。
第二方面,本说明书实施例提供一种合成渲染装置,包括:信息提取单元,用于提取对象展示区域的多维信息,其中,所述对象展示区域是原始图片中展示有原始展示对象的有效区域,所述多维信息包含多维颜色信息和多维定位信息;色彩融合单元,用于根据所述多维颜色信息,对所述原始展示对象与背景区域进行色彩融合处理,得到第一空白区域,所述背景区域为所述对象展示区域中除所述原始展示对象之外的区域;模糊处理单元,用于通过对所述第一空白区域进行模糊处理,消除所述第一空白区域内的噪点像素,得到第二空白区域;合成单元,用于根据所述多维定位信息,将所述第二空白区域与新的展示对象进行合成渲染。
第三方面,本说明书实施例提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面提供的合成渲染方法的步骤。
第四方面,本说明书实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面提供的合成渲染方法的步骤。
本说明书实施例提供的一个或者多个技术方案,至少实现了如下技术效果或者优点:
根据对象展示区域的多维颜色信息,对原始展示对象与对象展示区域中相对于原始展示对象的背景区域进行色彩融合处理并进行模糊处理,得到第二空白区域;再根据对象展示区域的多维定位信息,将第二空白区域与新的展示对象进行合成渲染。在上述技术方案中,由于是先基于色彩融合和模糊处理对原始图片的对象展示区域内的原始展示对象进行了抹除,最大限度的保留了原始图片中的背景区域,再根据多维定位信息进行合成渲染,实现在原位置渲染新的展示对象,因此,提升了新的展示对象与原背景区域之间的融合准确度,使结果图片中新的展示对象与背景更加协调统一,从而提升了显示效果。
附图说明
图1为本说明书实施例第一方面提供的合成渲染方法的流程图;
图2为本说明书实施例第一方面提供的对象展示区域对应的第一旋转矩形区域、第二旋转矩形区域以及外接矩形框区域的关系示意图;
图3为本说明书实施例第一方面基于聚类提取主颜色的效果图;
图4为本说明书实施例第一方面翻译前后的对比图;
图5为本说明书实施例第二方面提供的合成渲染装置的模块框图;
图6为本说明书实施例第五方面提供的电子设备的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。
第一方面,本说明书实施例提供一种合成渲染方式,本说明书实施例中合成渲染方法应用于终端设备或者服务器。终端设备上配置有摄像头和显示屏,摄像头用于对包含字符、图形标识等展示对象的场景进行拍照,获取包含字符、图形标识等展示对象的照片。然后,由终端设备或者服务器执行如下步骤:对获取的照片进行如缩放、去噪等预处理;提取照片中的对象展示区域,返回对象展示区域列表,对象展示区域列表中包含多个对象展示区域;将对象展示区域中的原始展示对象进行处理,得到对应的新的展示对象;提取对象展示区域的多维信息,其中,对象展示区域是原始图片中展示有原始展示对象的有效区域;根据多维颜色信息,对原始展示对象与对象展示区域中相对于原始展示对象的背景区域进行色彩融合处理,得到第一空白区域;通过对第一空白区域进行模糊处理,消除第一空白区域内的噪点像素,得到第二空白区域;根据多维定位信息,将第二空白区域与新的展示对象进行合成渲染。从而使得终端设备在照片图像上的原位置展示新的展示对象。实现将新的展示对象渲染到原照片图像中,提升新的展示对象与背景之间的融合效果。
下面,参考图1,对本说明书实施例第一方面提供的合成渲染方法进行详细的描述:
S101、提取对象展示区域的多维信息,其中,对象展示区域是原始图片中展示有原始展示对象的有效区域,多维信息包含多维颜色信息和多维定位信息。
下面,从如下多个方面对步骤S101进行详细说明:
一、对象展示区域:
在本说明实施例中,通过从原始图片中提取对象展示区域。从原始图片上提取的对象展示区域包含一个以上。其中,原始图片可以是其他设备传递过来的图片,或者是本地存储的图片,或者设备当前通过摄像头采集的原始照片。具体来讲,通过摄像头对包含文字、图形标识等原始展示对象的场景进行拍照,获取包含文字、图形标识等原始展示对象的照片。提取原始图片中的对象展示区域,返回包含一个以上对象展示区域的对象展示区域列表。
在更好的实现方式下,在同一原始图片下提取的多个对象展示区域互不重叠,即相邻两个对象展示区域中不包含相同的像素点。
本说明书实施例中的有效区域指的是能够容纳原始展示对象的最小区域,或者可以为略大于最小区域的一个区域。比如,有效区域可以是在最小区域的边缘像素点向外扩展一个或者多个像素点后所形成的区域。
二、原始展示对象:
在本说明书实施例中,原始展示对象可以为原始图片上展示的字符、图形标识等对象。不同的应用场景,原始展示对象则相应不同,同一对象展示区域内所展示的原始展示对象包含一个以上字符和/或一个以上图形标识。比如,原始展示对象是一行字符,或者是一行图形标识,或者是由字符与图形标识混合组成的一行混合内容。
下面,以某一图片文字翻译场景,比如:拍照翻译场景为例,进行对象展示区域和原始展示对象的举例说明:
在图片文字翻译场景下,原始展示对象包括在对象展示区域中顺序排列在一行的多个翻译目标,对象展示区域是展示有一行翻译目标的矩形行区域,则新的展示对象包含一一对应多个翻译目标的多个翻译后对象。其中,一个翻译目标,具体可以是:英文单词、英文词组、中文文字、中文词汇、或者其他语言的词组、单词、数字、标点符号等等。从而在原位置用翻译后对象一一替换翻译目标,在原位置展示翻译后对象。
当然,在其他场景下,原始展示对象包括在对象展示区域中顺序排列的多个替换目标,新的展示对象包含用于一一对应对替换目标的多个新对象。比如,原始展示对象与新的展示对象是新旧图形标识的关系。比如:原始展示对象与新的展示对象是尺寸不同的图形标识。
在本说明书实施例中,从对象展示区域中提取多维定位信息,具体包括:提取所述对象展示区域在所述原始图片中的位置信息;以及所述对象展示区域中的原始展示对象的尺寸信息;
在本说明书实施例中,从对象展示区域中提取多维颜色信息,具体包括:提取原始展示对象的颜色信息,以及背景区域的背景颜色信息。
具体来讲,为了提高计算效果,先进行对象展示区域的角度转换,形成第一旋转矩形区域,根据第一旋转矩形区域进行提取对象展示区域的多维定位信息和多维颜色信息。
其中,多维定位信息包括:
第一种:对象展示区域在原始图片中的位置信息。具体的,对象展示区域在原始图片中的位置信息,包括:对象展示区域的起点坐标、中心点坐标、尺寸大小、以及旋转角度。
第二种:对象展示区域中的原始展示对象的尺寸信息。具体的,原始展示对象的尺寸信息为对象展示区域的短边作为原始展示对象的尺寸。以字符为例,提取的原始展示对象的尺寸信息作为字体大小。参考图2所示,将第一旋转矩形区域bx_2的短边作为字体大小。
其中,多维颜色信息包括:原始展示对象的颜色信息以及背景区域的背景颜色信息。
具体来讲,对于原始展示对象的颜色信息和背景区域的背景颜色信息的提取,可以包含两个子步骤1、2:
子步骤1、根据第一旋转矩形区域进行主颜色的提取,得到对象展示区域的两个主颜色。其中一个主颜色为前景颜色,即:原始展示对象的颜色信息;另一个主颜色为背景颜色,即:背景区域的背景颜色信息。
子步骤2、对提取的两个主颜色进行前景颜色与背景颜色的判别,确定出原始展示对象的颜色信息以及背景区域的背景颜色信息。
其中,子步骤1具体可以通过步骤S1011实现:对对象展示区域内像素点的颜色进行聚类,得到对象展示区域的两个主颜色。
具体来讲,参考图2所示,基于对象展示区域进行角度转换后得到的第一旋转矩形bx_2内颜色进行聚类,并设分类数为2。在RGB三个颜色通道上基于L2距离进行聚类迭代,得到两个聚类中心。在RGB三个颜色通道上基于L2距离进行聚类迭代,即为:基于第一旋转矩形bx_2内每两个像素点在RGB三个颜色通道上的欧式距离进行聚类。
如图3所示的两个大圆点即为两个聚类中心,两个聚类中心对应为对象展示区域的两个主颜色。在具体实施时,可以使用kmeans(k均值聚类算法)、mean-shift(均值漂移算法)聚类算法、或者DBSCAN(Density-Based Spatial Clustering of Application withNoise,具有噪声的基于密度的聚类方法)聚类算法均可以实现。因采用聚类算法进行主颜色提取,对噪声不敏感,能适应绝大部分文字场景。
其中,子步骤2具体可以通过S1012实现:基于对象展示区域之外的边缘区域的像素点的颜色分布,对对象展示区域的两个主颜色进行前景颜色(原始展示对象的颜色信息)与背景颜色(背景区域的背景颜色信息)的判定。其中,边缘区域是不属于对象展示区域,且与对象展示区域相邻的区域。
具体来讲,S1012可以包括如下步骤A~C:
步骤A、获取对象展示区域的边缘区域,边缘区域为基于对象展示区域向外扩展出的区域。在一可选的实施方式下,获取对象展示区域的边缘区域,具体包括如下步骤A1~A3:
A1、将对象展示区域进行角度转换,形成第一旋转矩形区域。
A2、对第一旋转矩形区域进行长宽扩展,形成第二旋转矩形区域,其中,第二旋转矩形区域的中心点与第一旋转矩形区域的中心点相同。并且,第一旋转矩形区域与第二旋转矩形区域,相对于未进行角度转换前的对象展示区域的旋转角度是相同的。具体参见图2可以看出。
A3、将第二旋转矩形区域与第一旋转矩形区域的不重叠区域,作为边缘区域。
结合图2对步骤A1~A3进行举例说明,在第一旋转矩形区域bx_2的长、宽方向分别向外扩展d个像素点,d为正整数。比如,向外扩展5个像素点后成为第二旋转矩形区域bx_1,bx_1相对于bx_2的旋转角度与中心点不变,第一旋转矩形区域bx_1与第二旋转矩形区域bx_2的差集部分即为边缘区域。
在另一可选的实施方式下,可以将相邻的两个对象展示区域之间,且不属于任一对象展示区域的外部区域,作为这两个对象展示区域的边缘区域。
步骤B、确定边缘区域的颜色与两个主颜色之间的差异。
具体来讲,边缘区域中所有像素点的颜色平均值与两个主颜色之间的颜色差值,具体可以基于如下计算公式计算颜色平均值与两个主颜色之间的颜色差值:
Figure BDA0002342461930000061
其中,pi为边缘区域内第i像素点的颜色值,c为待判定的主颜色,d即为该主颜色与边缘的颜色差值,L2为边缘区域内第i像素点的颜色值与待判定的主颜色之间的距离,从而基于上述计算公式能够得到两个主颜色与边缘区域之间的颜色差值d1,d2。
步骤C、将两个主颜色中,与边缘区域的颜色差异小的主颜色判定为背景颜色信息,与边缘区域的颜色差异大的主颜色判定为原始展示对象的颜色信息。
在原始展示对象为一行翻译目标,对象展示区域为矩形行区域的翻译场景而言,针对原始图片上的每行翻译目标,基于OCR(Optical Character Recognition),光学字符识别)确定出展示有一行翻译目标的有效区域为一个矩形行区域,从而确定出每个矩形行区域。再将每个矩形行区域进行角度转换为对应的第一旋转矩形区域。根据每个第一旋转矩形区域,对应进行每个矩形行区域的如下多维信息的提取:提取该矩形行区域在原始图片中的起点坐标、中心点坐标、尺寸大小以及旋转角度,提取该矩形行区域中每个翻译目标的字体大小、提取每个翻译目标的颜色信息,矩形行区域中除翻译目标之外的区域,即背景区域的颜色(即背景颜色信息)。
通过上述实施方式,实现了基于几何约束(即边缘像素颜色相似性)来判定前背景颜色,因此不受文字线条粗细的影响,能够更加准确判定出翻译目标的颜色、背景区域的背景颜色信息。
参考图2所示意的第一旋转矩形区域bx_2为例,第一旋转矩形区域bx_2包含的位置信息为:中心点坐标center(x,y)、起点坐标P(x,y)、尺寸大小size(w,h)以及旋转角度θ。
S102、根据多维颜色信息,对原始展示对象与背景区域进行色彩融合处理,得到第一空白区域。
具体的,色彩融合处理限定在包含第二旋转矩形区域的外接矩形区域内,则步骤S102具体包括:
S1021、生成包含第二旋转矩形区域的外接矩形区域,具体的,根据第二旋转矩形区域的尺寸信息,生成该外接矩形区域,而第二旋转矩形区域的尺寸信息根据第一旋转矩形区域的尺寸信息以及向外扩展的像素点数量确定。
S1022、判断外接矩形区域内每个像素点的颜色与原始展示对象的颜色信息之间差异是否小于预设差异阈值,并将与原始展示对象之间颜色差异小于预设差异阈值的外接矩形区域内像素点,判定为待抹除像素点;将每个待抹除像素点的颜色以及待抹除像素点的邻域像素点的颜色,均修改为背景颜色信息对应颜色。
遍历外接矩形区域内的每一个像素点,计算遍历到的第i个像素点的颜色与原始展示对象的颜色信息之间的颜色差值,判断该颜色差值是否小于预设差异阈值T;如果是,将第i个像素点的颜色以及第i个像素点的8邻域像素点的颜色均修改为背景颜色信息对应的颜色,再继续遍历第i+1个像素点。否则,不对第i个像素点作任何处理,并继续遍历第i+1个像素点。直至遍历完外接区域内的所有像素点,以完成了对原始展示对象的初步抹除效果。
在本实施方式下,通过在生成的外接矩形区域内进行色彩融合,使得所有计算都限定于该外接矩形区域,以提升渲染效率。
下面结合图3所示,根据第二旋转矩形区域bx_1计算一个外接矩形区域bx_0,遍历外接矩形区域bx_0中所有的像素点,外接矩形区域bx_0内的像素点的颜色与原始展示对象的颜色信息相近(小于阈值T),即为需要抹除颜色的像素点。
S103、通过对第一空白区域进行模糊处理,消除第一空白区域内的噪点像素,得到第二空白区域。
对经过步骤S1022抹除原始展示对象后得到的第一空白区域进行模糊处理,以消除第一空白区域内的部分噪点,使抹除结果更加平滑。具体而言,可以是针对第一旋转矩形区域,或者第二旋转矩形区域、或者外接矩形框进行的模糊处理,模糊处理的方式具体可以是均值模糊、高斯模糊、线性滤波、中值滤波等等。
以均值模糊为例,对第一旋转矩形区域,或者第二旋转矩形区域、或者外接矩形框中的每个像素点,取其周边8邻域或者4邻域或者更多相邻像素点的均值,作为该像素点的颜色值。
以高斯模糊为例,对第一旋转矩形区域,或者第二旋转矩形区域、或者外接矩形框中的每个像素点,取其自身的颜色值与周边8邻域像素点的颜色进行求加权平均值,作为该像素点的颜色值。其中,各个像素点的权重分配符合正态分布,越接近中心,权重取值越大,越远离中心,权重取值越小。
S104、根据多维定位信息,将第二空白区域与新的展示对象进行合成渲染。
具体的,是根据对象展示区域在原始图片中的位置信息,以及原始展示对象的尺寸信息在第二空白区域绘制新的展示对象。具体来讲,根据对象展示区域在原始图片中的位置信息,确定新的展示对象的绘制位置;根据原始展示对象的尺寸信息,确定新的展示对象的绘制尺寸;根据绘制位置和绘制尺寸,在第二空白区域上绘制新的展示对象。
在具体实施过程中,新的展示对象的绘制位置与对象展示区域内,新的展示对象的绘制尺寸与原始展示对象的尺寸相同。
具体来讲,使用绘图API(Application Programming Interface,应用程序接口)接口,在第一旋转矩形区域的起点坐标、中心点坐标、尺寸大小、以及旋转角度所限定的位置内,对新的展示对象进行绘制。还可以在此基础上,对新的对象的绘制采用原始展示对象的颜色信息。
下面,结合图4以拍照翻译场景为例,对本说明书实施例第一方面提供的合成渲染方法进行举例说明:
1、用户对包含文字“image processing”的场景进行拍照,获取原始图片,参考图4中的上方图像:为带有文字“image processing”的原始图片;2、进行原始图片上的文本行提取:即检测照片中的文本行位置,返回文本行矩形框列表;3、字符切割和字符识别:将文本行中的各个字符切割出来后进行OCR,识别出文本行的文本内容“image processing”;4、文本翻译:将识别出的文本内容“image processing”进行机器翻译,得到翻译后的文本内容“图像处理”;5、基于前述步骤S101~S103得到第二空白区域,如图4中的中间图像为第二空白区域的效果。最后,将翻译后的文本内容“图像处理”绘制在第二空白区域上。如图4中的下方图像即为重新绘制翻译后文本内容“图像处理”的效果。
通过步骤S101~S104,实现了先进行文字抹除,再重新在原位置绘制翻译后内容,综合了前、背景色信息,使原始图片的背景区域得到最大程度的保留,提升了融合准确度,使结果图片中,翻译后文本内容与背景更加协调统一。
第二方面,本说明书实施例提供一种合成渲染装置,参考图5所示,包括:
信息提取单元501,用于提取对象展示区域的多维信息,其中,对象展示区域是原始图片中展示有原始展示对象的有效区域,多维信息包含多维颜色信息和多维定位信息;
色彩融合单元502,用于根据多维颜色信息,对原始展示对象与背景区域进行色彩融合处理,得到第一空白区域,背景区域为对象展示区域中除原始展示对象之外的区域;
模糊处理单元503,用于通过对第一空白区域进行模糊处理,消除第一空白区域内的噪点像素,得到第二空白区域;
合成单元504,用于根据多维定位信息,将第二空白区域与新的展示对象进行合成渲染。
在一可选的实施方式下,信息提取单元501包括:
定位提取子单元,用于提取对象展示区域的多维定位信息,包括:提取对象展示区域在原始图片中的位置信息;以及对象展示区域中的原始展示对象的尺寸信息;以及
颜色提取子单元,用于提取对象展示区域的多维颜色信息,包括:提取原始展示对象的颜色信息以及背景区域的背景颜色信息。
在一可选的实施方式下,颜色提取子单元,具体用于:
对对象展示区域内像素点的颜色进行聚类,聚类得到对象展示区域的两个主颜色;
获取对象展示区域的边缘区域,边缘区域为基于对象展示区域向外扩展出的区域;
确定边缘区域的颜色与两个主颜色之间的差异;
将两个主颜色中,与边缘区域的颜色差异小的主颜色判定为背景颜色信息,与边缘区域的颜色差异大的主颜色判定为原始展示对象的颜色信息。
在一可选的实施方式下,颜色提取子单元,具体用于:
将对象展示区域进行角度转换,形成第一旋转矩形区域;
对第一旋转矩形区域进行长宽扩展,形成第二旋转矩形区域,其中,第二旋转矩形区域的中心点与第一旋转矩形区域的中心点相同;
将第二旋转矩形区域与第一旋转矩形区域的不重叠区域,作为边缘区域。
在一可选的实施方式下,色彩融合单元502,包括:
矩形生成子单元,用于生成包含第二旋转矩形区域的外接矩形区域;
色差判断子单元,用于判断外接矩形区域内每个像素点与原始展示对象之间颜色差异是否小于预设差异阈值,并将与原始展示对象之间颜色差异小于预设差异阈值的外接矩形区域内像素点,判定为待抹除像素点;
颜色修改子单元,用于将每个待抹除像素点的颜色,以及待抹除像素点的邻域像素点的颜色,均修改为背景颜色信息对应的颜色。
在一可选的实施方式下,合成单元504,具体用于:
根据对象展示区域在原始图片中的位置信息,确定新的展示对象的绘制位置;
根据原始展示对象的尺寸信息,确定新的展示对象的绘制尺寸;
根据绘制位置和绘制尺寸,在第二空白区域上绘制新的展示对象。
在一可选的实施方式下,原始展示对象包括在对象展示区域中顺序排列在一行的多个翻译目标,对象展示区域是展示一行翻译目标的矩形行区域,新的展示对象包含对应多个翻译目标的翻译后对象。
需要说明的是,本说明书实施例所提供的合成渲染装置中各个单元执行操作的具体方式已经在上述第一方面提供的合成渲染方法实施例中进行了详细描述,具体实施过程可以参照上述第一方面提供的方法实施例,此处将不做详细阐述说明。
第三方面,基于与前述实施例提供的合成渲染方法同样的发明构思,本说明书实施例还提供了一种电子设备,具体可以为终端设备或者服务器。如图6所示,包括存储器604、一个或多个处理器602及存储在存储器604上并可在处理器602上运行的计算机程序,处理器602执行该程序时实现前文第一方面提供的合成渲染方法的任一实施方式的实施步骤。
其中,在图6中,总线架构(用总线600来代表),总线600可以包括任意数量的互联的总线和桥,总线600将包括由处理器602代表的一个或多个处理器和存储器604代表的存储器的各种电路链接在一起。总线600还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口605在总线600和接收器601和发送器603之间提供接口。接收器601和发送器603可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器602负责管理总线600和通常的处理,而存储器604可以被用于存储处理器602在执行操作时所使用的数据。
可以理解的是,图6所示的结构仅为示意,本说明书实施例提供的电子设备还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。图6中所示的各组件可以采用硬件、软件或其组合实现。
第四方面,基于与前述实施例中提供的合成渲染方法同样的发明构思,本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文第一方面提供的合成渲染方法的任一实施方式的实施步骤。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

Claims (14)

1.一种合成渲染方法,包括:
提取对象展示区域的多维信息,其中,所述对象展示区域是原始图片中展示有原始展示对象的有效区域,所述多维信息包含多维颜色信息和多维定位信息;
根据所述多维颜色信息,对所述原始展示对象与背景区域进行色彩融合处理,得到第一空白区域,包括:生成包含第二旋转矩形区域的外接矩形区域;判断所述外接矩形区域内每个像素点与所述原始展示对象之间颜色差异是否小于预设差异阈值,并将与所述原始展示对象之间颜色差异小于所述预设差异阈值的所述外接矩形区域内像素点,判定为待抹除像素点;将每个所述待抹除像素点的颜色,以及所述待抹除像素点的邻域像素点的颜色,均修改为所述背景颜色信息对应的颜色,以得到所述第一空白区域,其中,所述第二旋转矩形区域是将所述对象展示区域进行角度转换后进行长宽扩展所得到,所述背景区域为所述对象展示区域中除所述原始展示对象之外的区域;
通过对所述第一空白区域进行模糊处理,消除所述第一空白区域内的噪点像素,得到第二空白区域;
根据所述多维定位信息,将所述第二空白区域与新的展示对象进行合成渲染。
2.如权利要求1所述的方法,所述提取对象展示区域的多维信息,包括:
提取所述对象展示区域的多维定位信息,包括:提取所述对象展示区域在所述原始图片中的位置信息;以及所述对象展示区域中的原始展示对象的尺寸信息;以及
提取所述对象展示区域的多维颜色信息,包括:提取所述原始展示对象的颜色信息以及所述背景区域的背景颜色信息。
3.如权利要求2所述的方法,所述提取所述对象展示区域的多维颜色信息,包括:
对所述对象展示区域内像素点的颜色进行聚类,聚类得到所述对象展示区域的两个主颜色;
获取所述对象展示区域的边缘区域,所述边缘区域为基于所述对象展示区域向外扩展出的区域;
确定所述边缘区域的颜色与所述两个主颜色之间的差异;
将所述两个主颜色中,与所述边缘区域的颜色差异小的主颜色判定为所述背景颜色信息,与所述边缘区域的颜色差异大的主颜色判定为所述原始展示对象的颜色信息。
4.如权利要求3所述的方法,所述获取所述对象展示区域的边缘区域,包括:
将所述对象展示区域进行角度转换,形成第一旋转矩形区域;
对所述第一旋转矩形区域进行长宽扩展,形成第二旋转矩形区域,其中,所述第二旋转矩形区域的中心点与所述第一旋转矩形区域的中心点相同;
将所述第二旋转矩形区域与所述第一旋转矩形区域的不重叠区域,作为所述边缘区域。
5.如权利要求2所述的方法,所述根据所述多维定位信息,将所述第二空白区域与新的展示对象进行合成渲染,包括:
根据所述对象展示区域在所述原始图片中的位置信息,确定所述新的展示对象的绘制位置;
根据所述原始展示对象的尺寸信息,确定所述新的展示对象的绘制尺寸;
根据所述绘制位置和所述绘制尺寸,在所述第二空白区域上绘制所述新的展示对象。
6.如权利要求1-5中任一项所述的方法,所述原始展示对象包括在所述对象展示区域中顺序排列在一行的多个翻译目标,所述对象展示区域是展示一行翻译目标的矩形行区域,所述新的展示对象包含对应所述多个翻译目标的翻译后对象。
7.一种合成渲染装置,包括:
信息提取单元,用于提取对象展示区域的多维信息,其中,所述对象展示区域是原始图片中展示有原始展示对象的有效区域,所述多维信息包含多维颜色信息和多维定位信息;
色彩融合单元,用于根据所述多维颜色信息,对所述原始展示对象与背景区域进行色彩融合处理,得到第一空白区域,包括:生成包含第二旋转矩形区域的外接矩形区域;判断所述外接矩形区域内每个像素点与所述原始展示对象之间颜色差异是否小于预设差异阈值,并将与所述原始展示对象之间颜色差异小于所述预设差异阈值的所述外接矩形区域内像素点,判定为待抹除像素点;将每个所述待抹除像素点的颜色,以及所述待抹除像素点的邻域像素点的颜色,均修改为所述背景颜色信息对应的颜色,以得到所述第一空白区域,其中,所述第二旋转矩形区域是将所述对象展示区域进行角度转换后进行长宽扩展所得到,所述背景区域为所述对象展示区域中除所述原始展示对象之外的区域;
模糊处理单元,用于通过对所述第一空白区域进行模糊处理,消除所述第一空白区域内的噪点像素,得到第二空白区域;
合成单元,用于根据所述多维定位信息,将所述第二空白区域与新的展示对象进行合成渲染。
8.如权利要求7所述的装置,所述信息提取单元,包括:
定位提取子单元,用于提取所述对象展示区域的多维定位信息,包括:提取所述对象展示区域在所述原始图片中的位置信息;以及所述对象展示区域中的原始展示对象的尺寸信息;以及
颜色提取子单元,用于提取所述对象展示区域的多维颜色信息,包括:提取所述原始展示对象的颜色信息以及所述背景区域的背景颜色信息。
9.如权利要求8所述的装置,所述颜色提取子单元,具体用于:
对所述对象展示区域内像素点的颜色进行聚类,聚类得到所述对象展示区域的两个主颜色;
获取所述对象展示区域的边缘区域,所述边缘区域为基于所述对象展示区域向外扩展出的区域;
确定所述边缘区域的颜色与所述两个主颜色之间的差异;
将所述两个主颜色中,与所述边缘区域的颜色差异小的主颜色判定为所述背景颜色信息,与所述边缘区域的颜色差异大的主颜色判定为所述原始展示对象的颜色信息。
10.如权利要求9所述的装置,所述颜色提取子单元,具体用于:
将所述对象展示区域进行角度转换,形成第一旋转矩形区域;
对所述第一旋转矩形区域进行长宽扩展,形成第二旋转矩形区域,其中,所述第二旋转矩形区域的中心点与所述第一旋转矩形区域的中心点相同;
将所述第二旋转矩形区域与所述第一旋转矩形区域的不重叠区域,作为所述边缘区域。
11.如权利要求8所述的装置,所述合成单元,具体用于:
根据所述对象展示区域在所述原始图片中的位置信息,确定所述新的展示对象的绘制位置;
根据所述原始展示对象的尺寸信息,确定所述新的展示对象的绘制尺寸;
根据所述绘制位置和所述绘制尺寸,在所述第二空白区域上绘制所述新的展示对象。
12.如权利要求7-11中任一项所述的装置,所述原始展示对象包括在所述对象展示区域中顺序排列在一行的多个翻译目标,所述对象展示区域是展示一行翻译目标的矩形行区域,所述新的展示对象包含对应所述多个翻译目标的翻译后对象。
13.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-6中任一项所述方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。
CN201911381881.5A 2019-12-27 2019-12-27 合成渲染方法、装置、电子设备及介质 Active CN111191580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911381881.5A CN111191580B (zh) 2019-12-27 2019-12-27 合成渲染方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911381881.5A CN111191580B (zh) 2019-12-27 2019-12-27 合成渲染方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN111191580A CN111191580A (zh) 2020-05-22
CN111191580B true CN111191580B (zh) 2022-03-29

Family

ID=70707858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911381881.5A Active CN111191580B (zh) 2019-12-27 2019-12-27 合成渲染方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN111191580B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783007B (zh) * 2020-07-31 2022-05-24 迈普通信技术股份有限公司 一种显示渲染方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567727B (zh) * 2010-12-13 2014-01-01 中兴通讯股份有限公司 一种背景目标替换方法和装置
CN104320583B (zh) * 2014-11-03 2018-12-14 联想(北京)有限公司 图像处理方法、图像处理装置及电子设备
CN106126140B (zh) * 2016-06-16 2019-07-23 珠海豹趣科技有限公司 一种渲染文字的方法、装置及电子设备
CN107123088B (zh) * 2017-04-21 2019-09-13 山东大学 一种自动更换证件照背景颜色的方法
EP3422203A1 (en) * 2017-06-29 2019-01-02 Vestel Elektronik Sanayi ve Ticaret A.S. Computer implemented simultaneous translation method simultaneous translation device
CN107958449A (zh) * 2017-12-13 2018-04-24 北京奇虎科技有限公司 一种图像合成方法及装置

Also Published As

Publication number Publication date
CN111191580A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
US10152655B2 (en) Deep-learning network architecture for object detection
CN108304835B (zh) 文字检测方法和装置
US9607391B2 (en) Image object segmentation using examples
CN109753953B (zh) 图像中定位文本的方法、装置、电子设备和存储介质
CN109635718B (zh) 一种文本区域划分方法、装置、设备及存储介质
US10824910B2 (en) Image processing method, non-transitory computer readable storage medium and image processing system
JP5713790B2 (ja) 画像処理装置、画像処理方法、及びプログラム
CN110443140B (zh) 文本定位的方法、装置、计算机设备及存储介质
CN113160257A (zh) 图像数据标注方法、装置、电子设备及存储介质
CN111223065A (zh) 图像矫正方法、不规则文本识别方法、装置、存储介质和设备
CN111553923B (zh) 一种图像处理方法、电子设备及计算机可读存储介质
CN108830780A (zh) 图像处理方法及装置、电子设备、存储介质
CN105701489A (zh) 一种新型的数字提取和识别的方法及系统
CN114648756B (zh) 一种基于指向向量的书本文字识别指读方法和系统
CN111091167A (zh) 标志识别训练数据合成方法、装置、电子设备及存储介质
CN111462164A (zh) 一种前景分割方法以及基于图像合成的数据增强方法
CN112651953A (zh) 图片相似度计算方法、装置、计算机设备及存储介质
CN112016545A (zh) 一种包含文本的图像生成方法及装置
CN113506305B (zh) 三维点云数据的图像增强方法、语义分割方法及装置
CN111191580B (zh) 合成渲染方法、装置、电子设备及介质
EP4075381B1 (en) Image processing method and system
CN112966687B (zh) 图像分割模型训练方法、装置及通信设备
CN106056575B (zh) 一种基于似物性推荐算法的图像匹配方法
CN114494929A (zh) 视频处理方法及装置
US20220277540A1 (en) System and method for generating an optimized image with scribble-based annotation of images using a machine learning model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant