CN107424137B - 一种文本增强方法及装置、计算机装置、可读存储介质 - Google Patents

一种文本增强方法及装置、计算机装置、可读存储介质 Download PDF

Info

Publication number
CN107424137B
CN107424137B CN201710648152.6A CN201710648152A CN107424137B CN 107424137 B CN107424137 B CN 107424137B CN 201710648152 A CN201710648152 A CN 201710648152A CN 107424137 B CN107424137 B CN 107424137B
Authority
CN
China
Prior art keywords
value
pixel point
tristimulus
pixel
pixel information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710648152.6A
Other languages
English (en)
Other versions
CN107424137A (zh
Inventor
黄忠强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN201710648152.6A priority Critical patent/CN107424137B/zh
Publication of CN107424137A publication Critical patent/CN107424137A/zh
Application granted granted Critical
Publication of CN107424137B publication Critical patent/CN107424137B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Control Of Indicators Other Than Cathode Ray Tubes (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种文本增强方法及装置、计算机装置、可读存储介质,用于改善图像上文本的显示效果的同时,可以减小图像的画面失真。本发明实施例方法包括:提取当前帧图像的文字区域;确定文字区域的第一像素点的第一像素信息;获取在第一像素点的预设范围内的第二像素点的第二像素信息;根据第二像素信息对第一像素信息进行调整。

Description

一种文本增强方法及装置、计算机装置、可读存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种文本增强方法及装置、计算机装置、可读存储介质。
背景技术
传统视频编码技术主要针对自然图像设计,并不适用于屏幕内容编码。这主要体现在以下两点上:
1、人眼对亮度和色度的感受程度不同,对自然图像来说,一定的色度信息丢失对视觉影响并不大。而且还能够减小待编码的数据量。因此,视频编码多采用YUV420格式。但屏幕内容是干净且没有噪声的,YUV420格式的色度丢失会严重损害屏幕的画质,引起文字之类的模糊。
2、视频编码技术如H.264编码等,多采用变换操作将图像从空间域变换到频域,然后进行量化来削弱高频信号,但由于文字边缘锐利,高频信号较多。因此,这些操作会引起文字模糊。
文本增强技术是通过对图片进行处理来增强文本的显示效果,可以用来解决视频编码所导致的模糊。传统的文本增强方法主要有二值化处理、图像锐化、图像去噪、对比度增强等,这些方法主要针对扫描图像或者带文本的视频图像,增强后的图像与原始图像差距太大,但无法应用到屏幕内容的文本增强上。
发明内容
本发明实施例提供了一种文本增强方法及装置、计算机装置、可读存储介质,用于改善图像上文本的显示效果的同时,可以减小图像的画面失真。
有鉴于此,本发明第一方面提供一种文本增强方法,可包括:
提取当前帧图像的文字区域;
确定文字区域的第一像素点的第一像素信息;
获取在第一像素点的预设范围内的第二像素点的第二像素信息;
根据第二像素信息对第一像素信息进行调整。
进一步的,第一像素信息包括第一像素点的第一三色值,第二像素信息包括第二像素点的第二三色值。
进一步的,在获取在第一像素点的预设范围内的第二像素点的第二像素信息之前,方法还包括:
检测第一三色值中的至少两个值是否位于同一阈值范围;
若否,则触发获取在第一像素点的预设范围内的第二像素点的第二像素信息。
进一步的,获取第一像素点的预设范围内的第二像素点的第二三色值包括:
获取在第一像素点的邻域范围内的第二像素点的第二像素信息。
进一步的,根据第二像素信息对第一像素信息进行调整包括:
分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整。
进一步的,根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整包括:
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,将第一三色值按照线性插值算法进行计算,得到第三三色值;
将第一像素点的第一三色值更新为第三三色值,得到新文字区域。
进一步的,在将第一像素点的第一三色值更新为第三三色值,得到新文字区域之后,方法还包括:
根据新文字区域和当前帧图像的非文字区域,生成新图像;
输出新图像;或,
将新文字区域对当前帧图像的文字区域进行覆盖;
输出覆盖后的当前帧图像。
本发明第二方面提供一种文本增强装置,可包括:
提取单元,用于提取当前帧图像的文字区域;
确定单元,用于确定文字区域的第一像素点的第一像素信息;
获取单元,用于获取在第一像素点的预设范围内的第二像素点的第二像素信息;
调整单元,用于根据第二像素信息对第一像素信息进行调整。
进一步的,第一像素信息包括第一像素点的第一三色值,第二像素信息包括第二像素点的第二三色值。
进一步的,装置还包括:
检测单元,用于检测第一三色值中的至少两个值是否位于同一阈值范围;
触发单元,用于当至少两个值不位于同一阈值范围时,则触发获取单元获取在第一像素点的预设范围内的第二像素点的第二像素信息。
进一步的,获取单元,具体用于:
获取在第一像素点的邻域范围内的第二像素点的第二像素信息。
进一步的,调整单元,具体用于:
分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整。
进一步的,调整单元,具体用于:
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,将第一三色值按照线性插值算法进行计算,得到第三三色值;
将第一像素点的第一三色值更新为第三三色值,得到新文字区域。
进一步的,装置还包括:
生成单元,用于根据新文字区域和当前帧图像的非文字区域,生成新图像;
输出单元,用于输出新图像;或,
覆盖单元,用于将新文字区域对当前帧图像的文字区域进行覆盖;
输出单元,还用于输出覆盖后的当前帧图像。
本发明第三方面提供一种计算机装置,计算机装置包括处理器,处理器用于执行存储器中存储的计算机程序时,实现如下步骤:
提取当前帧图像的文字区域;
确定文字区域的第一像素点的第一像素信息;
获取在第一像素点的预设范围内的第二像素点的第二像素信息;
根据第二像素信息对第一像素信息进行调整。
本发明第四方面提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,处理器,用于执行如下步骤:
提取当前帧图像的文字区域;
确定文字区域的第一像素点的第一像素信息;
获取在第一像素点的预设范围内的第二像素点的第二像素信息;
根据第二像素信息对第一像素信息进行调整。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明提供了一种文本增强方法,该方法通过提取当前帧图像的文字区域,可以单独对文字区域的第一像素点进行调整,以达到文本增强的效果,相对现有技术而言,由于不是对整张当前帧图像进行相应的增强,可以提高处理效率,且减小当前帧图像增强后的变化差异,同时,使用第一像素点的预设范围内的第二像素点的第二像素信息对第一像素点的第一像素信息进行调整,有利于减小当前帧图像的画面失真。
附图说明
图1为本发明实施例中文本增强方法一个实施例示意图;
图2为本发明实施例中文本增强方法另一实施例示意图;
图3为本发明实施例中第一像素点的邻域范围的位置说明示意图;
图4为本发明实施例中文本增强装置一个实施例示意图;
图5为本发明实施例中文本增强装置另一实施例示意图;
图6为本发明实施例中文本增强装置另一实施例示意图。
具体实施方式
本发明实施例提供了一种文本增强方法及装置、计算机装置、可读存储介质,用于改善图像上文本的显示效果的同时,可以减小图像的画面失真。
为了使本技术领域的人员更好地理解本发明方案,下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例中的具体流程进行描述,请参阅图1,本发明实施例中文本增强方法一个实施例包括:
101、提取当前帧图像的文字区域;
本实施例中,屏幕内容是指由电子设备生成的图像/视频,例如漫画、3D游戏、捕获的计算机屏幕或有文字覆盖的视频等,该屏幕内容是干净的、无噪声的。屏幕内容可以包括多帧图像,屏幕内容在编码后可以引起文字的模糊,在对屏幕内容进行解码后进行输出时,为了改善文本显示效果,可以对解码后的每一帧图像进行相应的增强。由此,在屏幕内容解码后,可以获取需要进行调整的屏幕内容的当前帧图像,并提取当前帧图像的文字区域。
具体的,为了防止对整个当前帧图像进行相应的增强,而导致文本增强后的当前帧图像与原始的当前帧图像的差距过大,可以对当前帧图像进行图文分割,即分为文字区域和非文字区域,并提取当前帧图像的文字区域,同时,由于当前帧图像只需要对文字区域进行相应的增强,则可以减少当前帧图像所需要进行增强的像素个数。其中,非文字区域可以不进行任何操作。
本实施例中,对当前帧图像可采用的图文分割方法可以包括但不限于X-Y cut,渐进性得分判断,颜色直方图阈值等,具体可以参照现有技术,此处不再赘述。
可以理解的是,本实施例中当前帧图像除了为了上述经屏幕内容编码后文字区域模糊的图像,也可以为经屏幕内容编码时文字区域模糊的图像,本实施例仅以编码后的屏幕内容进行举例说明。其中,对于编码后的屏幕内容而言,进行文本增强无需改动编码和解码过程,有利于视频内容的编码和解码操作。
102、确定文字区域的第一像素点的第一像素信息;
本实施例中,对于文字区域,每个像素点都需要进行调整,那么在提取当前帧图像的文字区域后,可以确定文字区域的第一像素点的第一像素信息。其中,第一像素点可以为文字区域的任意一个像素点。
可以理解的是,本实施例中,文字区域的各个像素点的增强可以轮流进行,也可以同时进行,增强时的时序以及位置均不做限定。
103、获取在第一像素点的预设范围内的第二像素点的第二像素信息;
本实施例中,确定文字区域的第一像素点的第一像素信息后,可以获取在第一像素点的预设范围内的第二像素点的第二像素信息。
具体的,为了较大程度地保留当前帧图像的局部信息,减小当前帧图像的失真,可以在第一像素点的预设范围内确定第二像素点,如第一像素点的左上方,并可以获取第二像素点的第二像素信息。
本实施例中,第二像素点可以一个或以上,具体可以根据实际需要进行设置,此处不做限定。
104、根据第二像素信息对第一像素信息进行调整。
本实施例中,获取在第一像素点的预设范围内的第二像素点的第二像素信息后,可以根据第二像素信息对第二像素信息进行调整。
具体的,获取第二像素点的第二像素信息和第一像素点的第一像素信息后,可以根据第二像素信息和第一像素信息分别确定各个颜色的分量,从而可以根据第二像素点的各个颜色的分量对第一像素点的各个颜色的分量进行调整,以使得在第一像素点中,由高分量的颜色对应的颜色的分量更高,而由低分量的颜色对应的颜色的分量更低,通过上述对相应颜色的增强和减弱操作,可以突出文字的显示效果而达到增强文本的目的。
需要说明的是,本实施例中根据第二像素信息对第一像素信息进行调整时,除了对各个像素点的相应颜色的分量进行调整之外,在实际应用中,基于颜色的不同表达方式以及计算方式,还可以对其它相应的变量进行调整,如饱和度,具体此处不做限定。
可以理解的是,像素信息可以包括但不限于颜色这一参数,在实际应用中,根据第二像素信息对第一像素点的第一像素信息进行调整,以增强第一像素点的显示时,除了对颜色进行相应的调整外,还可以对其它参数进行调整,只要与当前帧图像的文字区域的显示效果有关即可,具体此处不做限定。
本实施例中,通过提取当前帧图像的文字区域,可以单独对文字区域的第一像素点进行调整,以达到文本增强的效果,相对现有技术而言,由于不是对整张当前帧图像进行相应的增强,可以提高锐化效率,且减小当前帧图像增强后的变化差异,同时,使用第一像素点的预设范围内的第二像素点的第二像素信息对第一像素点的第一像素信息进行调整,有利于减小当前帧图像的画面失真。
可以理解的是,颜色可以由三色值进行表示,本实施例中的第一像素信息可以包括第一像素点的第一三色值,第二像素信息可以包括第二像素点的第二三色值,下面将基于三色值的调整实现对当前帧图像的文字区域的增强进行具体说明:
请参阅图2,本发明实施例中文本增强方法另一实施例包括:
201、提取当前帧图像的文字区域;
本实施例中的步骤201与图1所示实施例中的步骤101相同,此处不再赘述。
202、确定文字区域的第一像素点的第一三色值;
本实施例中,提取当前帧图像的文字区域后,可以确定文字区域的第一像素点的第一三色值。
具体的,RGB颜色空间由R、G和B这三个颜色分量构成。R、G、B各有256级,取值范围可以为诸如0至1,通过对R、G、B三个颜色分量的变化以及它们相互之间按不同比例的叠加可以产生不同的颜色。其中,第一三色值即R、G、B这三个颜色分量的值,可以分别表示为R(红色)值、G(绿色)值、B(蓝色)值。
本实施例中,关于第一像素点的R值、G值、B值可以直接进行获取,也可以通过其它参数进行相应的换算后得到,具体确定方式可以参照现有技术,此处不再赘述。
203、检测第一三色值中的至少两个值是否位于同一阈值范围,若否,则执行步骤204,若是,则执行步骤207;
本实施例中,确定文字区域的第一像素点的第一三色值后,可以检测第一三色值中的至少两个值是否位于同一阈值范围。
具体的,确定第一像素点的R值、G值、B值后,可以将R值、G值、B值进行对比,以确定红、绿、蓝三个颜色通道中哪个颜色通道占优,占优即意味着该颜色通道对应的颜色分量值要远远超过其他通道对应的颜色分量值。在实际应用中,可以预先设置多个阈值范围,以作为将R值、G值、B值进行对比并确定占优颜色通道的判断标准。
例如,假设R值、G值、B值的取值范围为0至1,若将该取值范围按照0.1的间隔进行划分,则可以得到0至0.1、0.1至0.2、0.2至0.3、0.3至0.4、0.4至0.5、0.5至0.6、0.6至0.7、0.7至0.8、0.8至0.9、0.9至1这10个阈值范围。确定第一像素点的R值、G值、B值后,可以进一步确定第一像素点的R值、G值、B值分别所属的阈值范围,并比较R值、G值、B值对应的三个阈值范围是否一致,若其中至少有两个值对应的阈值范围不一致,则可以认为至少有一个颜色通道占优,反之,若三个值对应的阈值范围均一致,那么R值、G值、B值相差不大,没有颜色通道占优。需要说明的是,本实施例中的阈值范围的划分标准除了以0.1为间隔,还可以为其它,同时,本实施例R值、G值、B值对应的取值范围也可以按照需要进行其它设定,上述内容仅为举例说明。
可以理解的是,本实施例中的阈值范围除了为上述说明的一段数值取值范围,在实际应用中,也可以为具体的一个数值,诸如0.1、0.2之类,以更好地确定占优颜色通道,具体此处不做限定。
204、获取在第一像素点的邻域范围内的第二像素点的第二三色值;
本实施例中,若第一三色值中的至少两个值不位于同一阈值范围内,则可以获取在第一像素点的领域范围内的第二像素点的第二三色值。
具体的,当第一三色值中的至少两个值不位于相同的阈值范围内时,意味着至少有一个颜色通道占优,那么意味着至少有一个颜色分量值需要增强,且至少有一个颜色分量值需要减弱。为了最大程度地保留当前帧图像的局部信息,减小失真,可以将预设范围设为邻域范围,即获取在第一像素点的邻域范围内的第二像素点的第二三色值。其中,可选的,该领域范围可以包括第一像素点所在的范围,即第二像素点可以包括第一像素点。
例如,假设该邻域范围为第一像素点的四周,那么如图3所示,在第一像素点的上下左右以及四个对角位置的8个像素点以及第一像素点,即可以为在第一像素点的邻域范围内的第二像素点,由于每一个第二像素点均有对应的R值、G值、B值,则可以获取到相应的9个R值、9个G值、9个B值。需要说明的是,本实施例中领域范围的具体位置以及领域范围内第二像素点的数量可以根据实际需要进行设定,本实施例仅为举例说明。
本实施例中,关于各个第二像素点的R值、G值、B值可以直接进行获取,也可以通过其它参数进行相应的换算后得到,具体确定方式可以参照现有技术,此处不再赘述。
205、分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
本实施例中,获取在第一像素点的领域范围内的第二像素点的第二三色值后,可以分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值。
例如,沿用步骤204说明的内容,获取邻域范围内9个第二像素点的第二三色值后,可以将这9个第二像素点的9个R值、9个G值、9个B值分别进行对比,即确定9个R值中的最大值MR、最小值mR,9个G值中的最大值MG、最小值mG,9个B值中的最大值MB、最小值mB。
206、根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整;
本实施例中,分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值后,可以根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整。
本实施例中,根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整的具体方式可以为:
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,将第一三色值按照线性插值算法进行计算,得到第三三色值;
将第一像素点的第一三色值更新为第三三色值,得到新文字区域。
具体的,对第一像素点进行调整,即通过增强主通道对应的颜色分量值、减弱副通道对应的颜色分量值来对第一像素点进行锐化。在确定第一像素点的第一三色值后,当其中存在至少两个值不位于同一阈值范围时,即可确定占优颜色通道,本实施例即以占优颜色通道为主通道,非占优颜色通道为副通道。确定主、副通道后,可以从R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值中筛选出主通道对应的颜色分量的最大值,以及副通道对应的颜色分量的最小值,并利用三个相应的R值、G值、B值对第一三色值按照线性插值算法进行计算并更新。
例如,以R颜色分量对应的通道是主通道为例进行说明,若R颜色分量对应的通道为主通道,则可以从R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值中筛选出R值的最大值MR、G值的最小值mG、B值的最小值mB,并可以利用线性插值算法来执行对第一像素点对应的颜色分量值的相应增强、减弱操作,即将原有的R值、G值、B值更新为R1值、G1值、B1值,以达到对第一像素点的第一三色值进行调整的目的,具体如下:
R1=R+α(MR-R);
G1=G+α(mG-G);
B1=B+α(mB-B);
其中,α为插值系数,取值范围可以为0至1。
需要说明的是,在实际应用中,当第二像素点不包括第一像素点时,在分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值后,可以将第一像素点的R值与第二三色值中R值的最大值与最小值再进行对比,将第一像素点的G值与第二三色值中G值的最大值与最小值再进行对比、将第一像素点的B值与第二三色值中B值的最大值与最小值再进行对比,以在第一像素点的R值、G值、B值不位于相应的最大值与最小值形成的范围内时,可以对上述算法进行条件调整,如若mG小于或等于原有的G值时,可以不改变原有的G值,即G1=G,以减小图像失真,又或者,可以按照上述对比结果重新调整R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,只要能够在减小图像失真的情况下,可以达到对第一像素点的第一三色值进行调整的目的,具体实现方式此处不做限定
可以理解的是,本实施例中得到第二三色值的方式除了采样上述说明的线性插值算法,在实际应用中,还可以采用其它算法,只要得到的第二三色值可以使得第一像素点得到相应的增强即可,具体此处不做限定。
在实际应用中,当文字区域中需要调整的各个第一像素点的第一三色值得到调整后,可以得到增强后的新文字区域。得到新文字区域后,可以将当前帧图像按照新文字区域进行输出,以输出文本得到增强的当前帧图像,解决屏幕内容的文字模糊的问题。
其中,在对文字区域进行调整后的当前帧图像进行输出时,可以如下方式:
根据新文字区域和当前帧图像的非文字区域,生成新图像;
输出新图像;或,
将新文字区域对当前帧图像的文字区域进行覆盖;
输出覆盖后的当前帧图像。
具体的,在当前帧图像进行图文分割时,由于非文字区域没有进行任何操作,那么可以直接进行输出,则在其中一种方式中,可以将分割出来的非文字区域与新文字区域按照原有的相对位置重新进行结合,以生成一张新图像,并进行新图像的输出,而原有的当前帧图像可以删除或存储后留作备用数据。在另一种方式中,则可以在原有的当前帧图像的基础上,将新文字区域覆盖于原有文字区域的上方,以隐藏原有文字区域,使得新文字区域得到相应的显示,并输出文字区域被新文字区域覆盖后的当前帧图像。
需要说明的是,本实施例仅以上述几个例子说明了第一像素点的第一三色值进行调整后当前帧图像的输出方式,在实际应用中,还可以采用其它方式,例如,在原有的当前帧图像的基础上,将原有的文字区域删除,再将新文字区域对原有的文字区域进行填充后再进行输出,具体方式此处不做限定。
207、结束流程。
本实施例中,若第一三色值中的三个值均位于同一阈值范围内,那么意味着在R、G、B中没有占优颜色通道,即不存在主副通道之分,则当前的第一像素点可以不进行相应的调整,那么可以不执行其它操作,即结束流程。
可以理解的是,文字区域可以包括多个第一像素点,在当前第一像素点不需要进行调整的情况下,可以跳过当前第一像素点,进行下一个第一像素点的第一三色值的检测与相应的调整。
上面对本发明实施例中的文本增强方法进行了描述,下面对本发明实施例中的文本增强装置进行描述,请参阅图4,本发明实施例中文本增强装置一个实施例包括:
提取单元401,用于提取当前帧图像的文字区域;
确定单元402,用于确定文字区域的第一像素点的第一像素信息;
获取单元403,用于获取在第一像素点的预设范围内的第二像素点的第二像素信息;
调整单元404,用于根据第二像素信息对第一像素信息进行调整。
请参阅图5,本发明实施例中文本增强装置另一实施例包括:
本实施例中,第一像素信息可以包括第一像素点的第一三色值,第二像素信息可以包括第二像素点的第二三色值。
本实施例中的单元501与图4所示实施例中的单元401相同,单元502与图4所示实施例中的单元402相同,此处不再赘述。
检测单元503,用于检测第一三色值中的至少两个值是否位于同一阈值范围;
本实施例中的单元504与图4所示实施例中的单元403相同,此处不再赘述。
触发单元505,用于当至少两个值不位于同一阈值范围时,则触发获取单元获取在第一像素点的预设范围内的第二像素点的第二像素信息;
本实施例中的单元506与图4所示实施例中的单元404相同,此处不再赘述。
生成单元507,用于根据新文字区域和当前帧图像的非文字区域,生成新图像;
输出单元508,用于输出新图像。
可选的,在本发明的一些实施例中,获取单元504,可以进一步具体用于:
获取在第一像素点的邻域范围内的第二像素点的第二像素信息。
可选的,在本发明的一些实施例中,调整单元506,可以进一步具体用于:
分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整。
可选的,在本发明的一些实施例中,调整单元506,具体用于:
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,将第一三色值按照线性插值算法进行计算,得到第三三色值;
将第一像素点的第一三色值更新为第三三色值,得到新文字区域。
请参阅图6,本发明实施例中文本增强装置另一实施例包括:
本实施例中的单元601与图5所示实施例中的单元501相同,单元602与图5所示实施例中的单元502相同,单元603与图5所示实施例中的单元503相同,单元604与图5所示实施例中的单元504相同,单元605与图5所示实施例中的单元505相同,单元606与图5所示实施例中的单元506相同,此处不再赘述。
覆盖单元607,用于将新文字区域对当前帧图像的文字区域进行覆盖;
输出单元608,用于输出覆盖后的当前帧图像。
上面从模块化功能实体的角度对本发明实施例中的文本增强装置进行了描述,下面从硬件处理的角度对本发明实施例中的计算机装置进行描述:
本发明实施例中计算机装置一个实施例包括:
处理器以及存储器;
存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序时,可以实现如下步骤:
提取当前帧图像的文字区域;
确定文字区域的第一像素点的第一像素信息;
获取在第一像素点的预设范围内的第二像素点的第二像素信息;
根据第二像素信息对第一像素信息进行调整。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
检测第一三色值中的至少两个值是否位于同一阈值范围;
若否,则触发获取在第一像素点的预设范围内的第二像素点的第二像素信息。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
获取在第一像素点的邻域范围内的第二像素点的第二像素信息。
在本发明的一些实施例中,基于第一像素信息包括第一像素点的第一三色值,第二像素信息包括第二像素点的第二三色值,处理器,还可以用于实现如下步骤:
分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整。
在本发明的一些实施例中,基于第一像素信息包括第一像素点的第一三色值,第二像素信息包括第二像素点的第二三色值,处理器,还可以用于实现如下步骤:
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,将第一三色值按照线性插值算法进行计算,得到第三三色值;
将第一像素点的第一三色值更新为第三三色值,得到新文字区域。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
根据新文字区域和当前帧图像的非文字区域,生成新图像;
输出新图像;或,
将新文字区域对当前帧图像的文字区域进行覆盖;
输出覆盖后的当前帧图像。
可以理解的是,上述说明的计算机装置中的处理器执行所述计算机程序时,也可以实现上述对应的各装置实施例中各单元的功能,此处不再赘述。示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述文本增强装置中的执行过程。例如,所述计算机程序可以被分割成上述文本增强装置中的各单元,各单元可以实现如上述相应文本增强装置说明的具体功能。
所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可包括但不仅限于处理器、存储器。本领域技术人员可以理解,处理器、存储器仅仅是计算机装置的示例,并不构成对计算机装置的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置还可以包括输入输出设备、网络接入设备、总线等。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,处理器,可以用于执行如下步骤:
提取当前帧图像的文字区域;
确定文字区域的第一像素点的第一像素信息;
获取在第一像素点的预设范围内的第二像素点的第二像素信息;
根据第二像素信息对第一像素信息进行调整。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
检测第一三色值中的至少两个值是否位于同一阈值范围;
若否,则触发获取在第一像素点的预设范围内的第二像素点的第二像素信息。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
获取在第一像素点的邻域范围内的第二像素点的第二像素信息。
在本发明的一些实施例中,基于第一像素信息包括第一像素点的第一三色值,第二像素信息包括第二像素点的第二三色值,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整。
在本发明的一些实施例中,基于第一像素信息包括第一像素点的第一三色值,第二像素信息包括第二像素点的第二三色值,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,将第一三色值按照线性插值算法进行计算,得到第三三色值;
将第一像素点的第一三色值更新为第三三色值,得到新文字区域。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
根据新文字区域和当前帧图像的非文字区域,生成新图像;
输出新图像;或,
将新文字区域对当前帧图像的文字区域进行覆盖;
输出覆盖后的当前帧图像。
可以理解的是,所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在相应的一个计算机可读取存储介质中。基于这样的理解,本发明实现上述相应的实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种文本增强方法,其特征在于,包括:
提取当前帧图像的文字区域;
确定所述文字区域的第一像素点的第一像素信息;
获取在所述第一像素点的预设范围内的第二像素点的第二像素信息;
根据所述第二像素信息对所述第一像素信息进行调整;
所述第一像素信息包括所述第一像素点的第一三色值,所述第二像素信息包括所述第二像素点的第二三色值;
所述根据所述第二像素信息对所述第一像素信息进行调整包括:
分别确定所述第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
根据所述R值的最大值与最小值、所述G值的最大值与最小值、所述B值的最大值与最小值,对所述第一三色值进行调整。
2.根据权利要求1所述的方法,其特征在于,在所述获取在所述第一像素点的预设范围内的第二像素点的第二像素信息之前,所述方法还包括:
检测所述第一三色值中的至少两个值是否位于同一阈值范围;
若否,则触发所述获取在所述第一像素点的预设范围内的第二像素点的第二像素信息。
3.根据权利要求1至2中任一项所述的方法,其特征在于,所述获取所述第一像素点的预设范围内的第二像素点的第二三色值包括:
获取在所述第一像素点的邻域范围内的第二像素点的第二像素信息。
4.根据权利要求2所述的方法,其特征在于,所述根据所述R值的最大值与最小值、所述G值的最大值与最小值、所述B值的最大值与最小值,对所述第一三色值进行调整包括:
根据所述R值的最大值与最小值、所述G值的最大值与最小值、所述B值的最大值与最小值,将所述第一三色值按照线性插值算法进行计算,得到第三三色值;
将所述第一像素点的所述第一三色值更新为所述第三三色值,得到新文字区域。
5.根据权利要求4所述的方法,其特征在于,在所述将所述第一像素点的所述第一三色值更新为所述第三三色值,得到新文字区域之后,所述方法还包括:
根据所述新文字区域和所述当前帧图像的非文字区域,生成新图像;
输出所述新图像;或,
将所述新文字区域对所述当前帧图像的所述文字区域进行覆盖;
输出覆盖后的当前帧图像。
6.一种文本增强装置,其特征在于,包括:
提取单元,用于提取当前帧图像的文字区域;
确定单元,用于确定所述文字区域的第一像素点的第一像素信息;
获取单元,用于获取在所述第一像素点的预设范围内的第二像素点的第二像素信息;
调整单元,用于根据所述第二像素信息对所述第一像素信息进行调整;
所述第一像素信息包括所述第一像素点的第一三色值,所述第二像素信息包括所述第二像素点的第二三色值;
所述调整单元,具体用于:
分别确定所述第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
根据所述R值的最大值与最小值、所述G值的最大值与最小值、所述B值的最大值与最小值,对所述第一三色值进行调整。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
检测单元,用于检测所述第一三色值中的至少两个值是否位于同一阈值范围;
触发单元,用于当所述至少两个值不位于所述同一阈值范围时,则触发所述获取单元获取在所述第一像素点的预设范围内的第二像素点的第二像素信息。
8.根据权利要求5至6中任一项所述的装置,其特征在于,所述获取单元,具体用于:
获取在所述第一像素点的邻域范围内的第二像素点的第二像素信息。
9.根据权利要求8所述的装置,其特征在于,所述调整单元,具体用于:
根据所述R值的最大值与最小值、所述G值的最大值与最小值、所述B值的最大值与最小值,将所述第一三色值按照线性插值算法进行计算,得到第三三色值;
将所述第一像素点的所述第一三色值更新为所述第三三色值,得到新文字区域。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
生成单元,用于根据所述新文字区域和所述当前帧图像的非文字区域,生成新图像;
输出单元,用于输出所述新图像;或,
覆盖单元,用于将所述新文字区域对所述当前帧图像的所述文字区域进行覆盖;
所述输出单元,还用于输出覆盖后的当前帧图像。
11.一种计算机装置,其特征在于:所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至5中任意一项所述文本增强方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1至5中任意一项所述文本增强方法的步骤。
CN201710648152.6A 2017-08-01 2017-08-01 一种文本增强方法及装置、计算机装置、可读存储介质 Active CN107424137B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710648152.6A CN107424137B (zh) 2017-08-01 2017-08-01 一种文本增强方法及装置、计算机装置、可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710648152.6A CN107424137B (zh) 2017-08-01 2017-08-01 一种文本增强方法及装置、计算机装置、可读存储介质

Publications (2)

Publication Number Publication Date
CN107424137A CN107424137A (zh) 2017-12-01
CN107424137B true CN107424137B (zh) 2020-06-19

Family

ID=60436456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710648152.6A Active CN107424137B (zh) 2017-08-01 2017-08-01 一种文本增强方法及装置、计算机装置、可读存储介质

Country Status (1)

Country Link
CN (1) CN107424137B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053383A (zh) * 2017-12-28 2018-05-18 努比亚技术有限公司 一种降噪方法、设备和计算机可读存储介质
CN108765520B (zh) * 2018-05-18 2020-07-28 腾讯科技(深圳)有限公司 文本信息的渲染方法和装置、存储介质、电子装置
CN109635409B (zh) * 2018-12-05 2022-11-29 广州通泽机械有限公司 复合过程中基材图文长度控制方法、装置及可读存储介质
CN110782854B (zh) * 2019-10-08 2020-09-08 深圳市华星光电半导体显示技术有限公司 电子设备及其阅读模式的识别方法
CN111414218A (zh) * 2020-03-18 2020-07-14 合肥讯飞读写科技有限公司 针对显示页面中字符对比度的调整方法、装置以及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104333758A (zh) * 2014-10-11 2015-02-04 华为技术有限公司 深度图的预测方法和检测像素点的方法及相关装置
CN104835128A (zh) * 2015-04-17 2015-08-12 南京大学 一种用于模糊视频文本信息增强的多光谱融合方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831579B (zh) * 2011-06-16 2015-06-17 富士通株式会社 文本增强方法及装置、文本提取方法及装置
CN103425973B (zh) * 2012-05-25 2019-05-31 夏普株式会社 对含有文本的图像进行增强处理的方法、装置和视频显示设备
US9576210B1 (en) * 2014-09-29 2017-02-21 Amazon Technologies, Inc. Sharpness-based frame selection for OCR
CN104680490B (zh) * 2015-02-13 2018-08-10 中科创达软件股份有限公司 一种增强文本图像可视性的方法
CN106254933B (zh) * 2016-08-08 2020-02-18 腾讯科技(深圳)有限公司 字幕提取方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104333758A (zh) * 2014-10-11 2015-02-04 华为技术有限公司 深度图的预测方法和检测像素点的方法及相关装置
CN104835128A (zh) * 2015-04-17 2015-08-12 南京大学 一种用于模糊视频文本信息增强的多光谱融合方法

Also Published As

Publication number Publication date
CN107424137A (zh) 2017-12-01

Similar Documents

Publication Publication Date Title
CN107424137B (zh) 一种文本增强方法及装置、计算机装置、可读存储介质
US8644602B2 (en) Colour correcting foreground colours for visual quality improvement
EP1107580B1 (en) Gamut mapping using local area information
US11138695B2 (en) Method and device for video processing, electronic device, and storage medium
US9478017B2 (en) Guided image filtering for image content
US20150071530A1 (en) Image processing apparatus and method, and program
US8180153B2 (en) 3+1 layer mixed raster content (MRC) images having a black text layer
US8285035B2 (en) 3+1 layer mixed raster content (MRC) images having a text layer and processing thereof
JP2016505186A (ja) エッジ保存・ノイズ抑制機能を有するイメージプロセッサ
JP2007507802A (ja) デジタル画像におけるテキスト状エッジの強調
US8306345B2 (en) 3+N layer mixed raster content (MRC) images and processing thereof
US9734585B2 (en) Image processing apparatus, image processing method, and storage medium for determining whether a target pixel is a character
CN109214996B (zh) 一种图像处理方法及装置
CN108737875B (zh) 图像处理方法及装置
KR101531966B1 (ko) 화상 처리장치, 화상 처리프로그램을 기록한 컴퓨터-리더블 기록매체, 및 화상 처리방법
CN111402165A (zh) 图像处理方法、装置、设备及存储介质
CN105335933A (zh) 一种图像对比度增强方法和装置
US10650499B1 (en) Fast and effective image inpainting for reticle removal
CN107256539B (zh) 一种基于局部对比度的图像锐化方法
TW202046698A (zh) 影像調整方法以及相關的影像處理電路
JP2016177500A (ja) 画像処理装置、画像処理システムおよびプログラム
KR20110117474A (ko) 공간 주파수 상에서 인간 시각 특성이 반영된 텍스처 향상 방법 및 장치
CN110298812B (zh) 一种图像融合处理的方法及装置
JP5286215B2 (ja) 輪郭抽出装置、輪郭抽出方法、および輪郭抽出プログラム
CN110751603A (zh) 一种图像对比度的增强方法、系统及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant