CN111080554A - 一种投影内容中字幕区域增强方法、装置及可读存储介质 - Google Patents
一种投影内容中字幕区域增强方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN111080554A CN111080554A CN201911325757.7A CN201911325757A CN111080554A CN 111080554 A CN111080554 A CN 111080554A CN 201911325757 A CN201911325757 A CN 201911325757A CN 111080554 A CN111080554 A CN 111080554A
- Authority
- CN
- China
- Prior art keywords
- edge
- image
- region
- area
- pixel points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000002708 enhancing effect Effects 0.000 title claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 18
- 230000004927 fusion Effects 0.000 claims abstract description 11
- 238000001914 filtration Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 8
- 238000003706 image smoothing Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/181—Segmentation; Edge detection involving edge growing; involving edge linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Studio Circuits (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种投影内容中字幕区域增强方法、装置及可读存储介质,属于图像处理的技术领域,该方法包括预处理:对字幕区域作预处理以形成连通区域;前景区域定位:通过连通区域提取前景区域和背景区域,定位前景区域中字符笔画所在的所有像素点;前景区域亮度统计:统计所有像素点的亮度信息,根据亮度信息在亮度值超过预设阈值的像素点中提取部分或全部的像素点,并根据所提取的像素点计算亮度均值;前景区域亮度填充:通过亮度均值对所有像素点填充以生成增强的前景区域;字幕融合:将增强的前景区域与背景区域融合,以达到能够对投影的字幕区域作增强处理并能良好的融入至原始图像中的目的。
Description
技术领域
本发明属于图像处理的技术领域,涉及图像纹理,视频文字增强的技术领域,具体而言,涉及一种投影内容中字幕区域增强方法、装置及可读存储介质。
背景技术
图像增强是计算机的一种术语,是将原来不清晰的图像变得清晰或强调某些感兴趣的特征,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果的图像处理方法。
图像增强可分成两大类:频率域法和空间域法。前者把图像看成一种二维信号,对其进行基于二维傅里叶变换的信号增强,采用低通滤波法,即只让低频信号通过,可去掉图中的噪声;采用高通滤波法,则可增强边缘等高频信号,使模糊的图片变得清晰。后者空间域法中具有代表性的算法有局部求平均值法和中值滤波法等,中值滤波法取局部邻域中的中间像素值,它们可用于去除或减弱噪声。
现有技术中的图像增强主要是对图像区域或者特定物体区域作增强,但是现有技术缺乏对图像中的文字增强处理主要存在基于传统的直方图,具有效果差且深度学习方法计算量大的缺陷。
发明内容
鉴于此,为了解决现有技术存在的上述问题,本发明的目的在于提供一种投影内容中字幕区域增强方法、装置及可读存储介质以达到能够对投影的字幕区域作增强处理并能良好的融入至原始图像中的目的。
本发明所采用的技术方案为:一种投影内容中字幕区域增强方法,该方法包括:
预处理:对字幕区域作预处理以形成连通区域;
前景区域定位:通过连通区域提取前景区域和背景区域,定位前景区域中字符笔画所在的所有像素点;
前景区域亮度统计:统计所述所有像素点的亮度信息,根据亮度信息在亮度值超过预设阈值的像素点中提取部分或全部的像素点,并根据所提取的像素点计算亮度均值;
前景区域亮度填充:通过亮度均值对所有像素点填充以生成增强的前景区域;
字幕融合:将增强的前景区域与背景区域融合。
进一步地,所述预处理包括:
字幕区域去噪:对字幕区域进行滤波处理以生成图像A;
边缘提取:计算图像A的边缘梯度并得到边缘强度图,对边缘强度图作二值化以生成图像B;
边缘处理:对图像B进行边缘去噪和边缘连接,以对图像B中的噪点进行移除。
进一步地,所述边缘强度图的计算包括canny边缘算法。
进一步地,所述二值化的具体方法为:设定一个固定阈值Th,对边缘强度图中小于Th的像素点标记为0,对边缘强度图中大于Th的像素点命为边缘像素点并标记为1,以此生成图像B。
进一步地,对图像B进行边缘去噪和边缘连接的具体方法如下:
筛选图像B中各个独立的单个像素点并对其移除;
连接图像B中标记为1的像素点以形成闭合的连通区域;
对未形成闭合的连通区域的像素点移除。
进一步地,定位所述前景区域中字符笔画所在的所有像素点采用如下方法:
根据图像B,计算每个边缘像素点沿梯度方向距离另一边缘像素点的长度L,将该梯度方向上所有像素点的宽度均标记为L,将其余像素点的宽度均标记为0,以计算得到代表每个像素点的宽度的图像W;
判断图像W中的每个像素点的宽度是否满足预先设定的阈值范围,若为是,则为字符笔画所在的像素点。
进一步地,对增强的前景区域与背景区域融合后的边缘区域进行图像平滑处理,以实现前景区域与背景区域的边缘区域进行平滑过渡,达到感观自然的效果。
本发明还提供了一种投影内容中字幕区域增强装置,该装置包括:预处理模块、前景区域定位模块、前景区域亮度统计模块、前景区域亮度填充模块以及字幕融合模块;
所述预处理模块用于对字幕区域作预处理以形成连通区域;
所述前景区域定位模块用于通过连通区域提取前景区域和背景区域,定位前景区域中字符笔画所在的所有像素点;
所述前景区域亮度统计模块用于统计所有像素点的亮度信息,提取亮度值相对较大的像素点并计算亮度均值;
所述前景区域亮度填充模块用于通过亮度均值对所有像素点填充以生成增强的前景区域;
所述字幕融合模块用于将增强的前景区域与背景区域融合。
进一步地,所述预处理模块包括字幕区域去噪单元、边缘提取单元以及边缘处理单元;
字幕区域去噪单元用于对字幕区域进行滤波处理以生成图像A;
边缘提取单元用于计算图像A的边缘梯度并边缘强度图,对边缘强度图作二值化以生成图像B;
边缘处理单元用于对图像B进行边缘去噪和边缘连接。
本发明还提供了一种可读存储介质,所述可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述任一项所述的投影内容中字幕区域增强方法。
本发明的有益效果为:
1.采用本发明公开的投影内容中字幕区域增强方法、装置及可读存储介质,通过预处理获取连通区域,在连通区域中区分出前景区域和背景区域,以亮度均值对前景区域所在的所有像素点进行填充,以实现让字符笔画的亮度统一且边缘明显,同时,在对前景区域进行增强亮度之后,对前景区域和背景区域进行自然融合过渡,能够达到感观自然的效果,相较于传统的文字处理方法,本技术的增强方法效果更好;且仅需提取像素点,对像素点计算均值后进行所有像素点填充即可,其计算复杂度更低。
附图说明
图1是本发明提供的投影内容中字幕区域增强方法的方法流程图;
图2是本发明提供的投影内容中字幕区域增强装置的架构图;
图3是本发明提供的投影内容中字幕区域增强方法在实际应用中所呈现的效果图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
实施例1
如图1所示,在本实施例中具体提供了一种投影内容中字幕区域增强方法,该方法主要是针对字幕区域进行增强,并自然过渡融入至原始图像中,该方法包括:
(1)字幕区域去噪:对字幕区域进行滤波处理以生成图像A,在本实施例中,使用3*3的窗口做中值滤波去噪,用中值滤波器去除图像中的噪声是指:以当前像素点为中心,求窗口中所有像素点的灰度值的中值,以中值作为中心像素点的值。
(2)边缘提取:通过边缘梯度计算函数实现对图像A的边缘梯度计算,并通过canny边缘算法计算边缘强度,以得到边缘强度图且该边缘强度图中每一个像素点代表该像素点的边缘梯度值以及梯度方向,对边缘强度图作二值化以生成图像B,具体为:设定一个固定阈值Th,对边缘强度图中梯度值大于Th的像素点命为边缘像素点并标记为1,对边缘强度图中梯度值小于Th的像素点标记为0,以此生成图像B。其中,字符笔画的边缘就在标记为1的的像素点中。
(3)边缘处理:由于图像A中存在一些边缘强度高于文字边缘,造成图B中会有很多噪点,需要对噪点移除;因此,对图像B进行边缘去噪和边缘连接以形成连通区域;具体采用如下方法:
1)筛选图像B中各个独立的单个像素点并对这些像素点进行移除;
2)连接图像B中标记为非0的像素点以形成闭合的连通区域,连通区域是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域;
3)对未形成闭合的连通区域的像素点移除。
(4)前景区域定位:通过连通区域提取前景区域和背景区域,前景区域即为文字笔画区域,背景区域即为视频的内容,定位前景区域中字符笔画所在的所有像素点并把位置记录,此处,字符笔画包括但不限于计算机中使用的字母、数字、字和符号。从连通区域的定义可以知道,一个连通区域是由具有相同像素值的相邻像素组成像素集合,因此,基于上述我们就可以通过连接具有相同标记的像素点以形成闭合的连通区域,对于找到的每个连通区域,我们赋予其一个唯一的标识(Label),以区别其他连通区域。连通区域分析有基本的算法,也有其改进算法,在本实施例中采用Two-Pass法和Seed-Filling种子填充法两种基本的算法进行区分前景区域和背景区域。
在本实施例中,定位所述前景区域中字符笔画所在的所有像素点采用如下方法:
根据图像B,计算每个边缘像素点沿梯度方向距离另一边缘像素点的长度L,将该梯度方向上所有像素点的宽度均标记为L,将其余像素点的宽度均标记为0,对所有的边缘像素点进行遍历计算;以计算得到代表每个像素点的宽度的图像W;
判断图像W中的每个像素点的宽度是否满足预先设定的阈值范围,令阈值范围为[l1,l2],其中,l1和l2是根据字幕区域图像A的范围大小所设定的,若为是,则为字符笔画所在的像素点;若为否,则不为字符笔画所在的像素点。
(5)前景区域亮度统计:统计所有像素点的亮度信息,根据所述亮度信息对亮度值进行重新排序或者比较,在亮度值超过预设阈值的像素点中提取部分或全部的像素点,并根据所提取的像素点计算亮度均值;在本实施例中,提取亮度值前1/3的像素点并计算亮度均值,以计算的亮度均值为G为例,当然,提取亮度值前1/3的像素点仅为本实施例的优选,也提取亮度值前1/4的像素点或者其他,主要是根据总的亮度信息进行适应性的选取。
(6)前景区域亮度填充:由于像素点是能被独立赋予颜色和亮度的,通过亮度均值对所有像素点填充以生成增强的前景区域,即将所有像素点的亮度值均填充为G;以达到字幕增强效果,让字幕笔画的亮度统一和边缘明显,整个文字笔画区域的亮度一致且对比度非常强。
(7)字幕融合:将增强的前景区域与背景区域融合,对增强的前景区域与背景区域融合后的边缘区域进行3*3的图像平滑处理,以实现边缘自然过渡。
基于上述所提供的投影内容中字幕区域增强方法,在实际应用中的效果呈现如图3所示,在该效果图中,图片1所展示的为原图;图片2为执行“去噪”后,其噪点亮度变浅、淡化的效果;图片3中展示的为边缘噪点的效果;图片4中展示的为边缘去噪并进行文字区域定位的效果;图片5展示的为对文字区域的像素点进行亮度填充的效果且文字区域的边缘与背景不平滑;图片6展示的为将填充后的文字区域与背景融合后并进行平滑过渡的效果。
实施例2
如图2所示,基于实施例1中所提供的投影内容中字幕区域增强方法,在本实施例中还提供了一种投影内容中字幕区域增强装置,该装置包括:预处理模块、前景区域定位模块、前景区域亮度统计模块、前景区域亮度填充模块以及字幕融合模块;
所述预处理模块用于对字幕区域作预处理以形成连通区域;所述预处理模块包括字幕区域去噪单元、边缘提取单元以及边缘处理单元;
字幕区域去噪单元用于对字幕区域进行滤波处理以生成图像A;
边缘提取单元用于计算图像A的边缘梯度并边缘强度图,对边缘强度图作二值化以生成图像B,该边缘提取单元安装有canny边缘算法;
边缘处理单元用于对图像B进行边缘去噪和边缘连接;
所述前景区域定位用于通过连通区域提取前景区域和背景区域,定位前景区域中字符笔画所在的所有像素点;
所述前景区域亮度统计模块用于统计所有像素点的亮度信息,提取亮度值相对较大的像素点并计算亮度均值,优选的,提取亮度值前1/3的像素点;
所述前景区域亮度填充模块用于通过亮度均值对所有像素点填充以生成增强的前景区域;
所述字幕融合模块用于将增强的前景区域与背景区域融合,字幕融合模块安装有图像平滑处理算法。
实施例3
本发明还提供了一种可读存储介质,所述可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述实施例1中所述的投影内容中字幕区域增强方法,以实现对文字增强处理。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种投影内容中字幕区域增强方法,其特征在于,该方法包括:
预处理:对字幕区域作预处理以形成连通区域;
前景区域定位:通过所述连通区域提取前景区域和背景区域,定位所述前景区域中字符笔画所在的所有像素点;
前景区域亮度统计:统计所述所有像素点的亮度信息,根据亮度信息在亮度值超过预设阈值的像素点中提取部分或全部的像素点,并根据所提取的像素点计算亮度均值;
前景区域亮度填充:通过所述亮度均值对所述所有像素点填充以生成增强的前景区域;
字幕融合:将所述增强的前景区域与所述背景区域融合。
2.根据权利要求1所述的投影内容中字幕区域增强方法,其特征在于,所述预处理包括:
字幕区域去噪:对字幕区域进行滤波以生成图像A;
边缘提取:计算图像A的边缘梯度并得到边缘强度图,对边缘强度图作二值化以生成图像B;
边缘处理:对图像B进行边缘去噪和边缘连接。
3.根据权利要求2所述的投影内容中字幕区域增强方法,其特征在于,所述边缘强度图的计算包括canny边缘算法。
4.根据权利要求2所述的投影内容中字幕区域增强方法,其特征在于,所述二值化的具体方法为:设定一个固定阈值Th,对边缘强度图中小于Th的像素点标记为0,对边缘强度图中大于Th的像素点命为边缘像素点并标记为1,以此生成图像B。
5.根据权利要求2所述的投影内容中字幕区域增强方法,其特征在于,对图像B进行边缘去噪和边缘连接的具体方法如下:
筛选图像B中各个独立的单个像素点并对其移除;
连接图像B中标记为1的像素点以形成闭合的连通区域;
对未形成闭合的连通区域的像素点移除。
6.根据权利要求2所述的投影内容中字幕区域增强方法,其特征在于,定位所述前景区域中字符笔画所在的所有像素点采用如下方法:
根据图像B,计算每个边缘像素点沿梯度方向距离另一边缘像素点的长度L,将该梯度方向上所有像素点的宽度均标记为L,将其余像素点的宽度均标记为0,以此遍历,计算得到代表每个像素点的宽度的图像W;
判断图像W中的每个像素点的宽度是否满足预先设定的阈值范围,若为是,则为字符笔画所在的像素点。
7.根据权利要求1所述的投影内容中字幕区域增强方法,其特征在于,对增强的前景区域与背景区域融合后的边缘区域进行图像平滑处理。
8.一种投影内容中字幕区域增强装置,其特征在于,该装置包括:预处理模块、前景区域定位模块、前景区域亮度统计模块、前景区域亮度填充模块以及字幕融合模块;
所述预处理模块用于对字幕区域作预处理以形成连通区域;
所述前景区域定位模块用于通过连通区域提取前景区域和背景区域,定位前景区域中字符笔画所在的所有像素点;
所述前景区域亮度统计模块用于统计所有像素点的亮度信息,提取亮度值相对较大的像素点并计算亮度均值;
所述前景区域亮度填充模块用于通过亮度均值对所有像素点填充以生成增强的前景区域;
所述字幕融合模块用于将增强的前景区域与背景区域融合。
9.根据权利要求8所述的投影内容中字幕区域增强装置,其特征在于,所述预处理模块包括字幕区域去噪单元、边缘提取单元以及边缘处理单元;
字幕区域去噪单元用于对字幕区域进行滤波处理以生成图像A;
边缘提取单元用于计算图像A的边缘梯度并边缘强度图,对边缘强度图作二值化以生成图像B;
边缘处理单元用于对图像B进行边缘去噪和边缘连接。
10.一种可读存储介质,其特征在于,所述可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-7任一项所述的投影内容中字幕区域增强方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911325757.7A CN111080554B (zh) | 2019-12-20 | 2019-12-20 | 一种投影内容中字幕区域增强方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911325757.7A CN111080554B (zh) | 2019-12-20 | 2019-12-20 | 一种投影内容中字幕区域增强方法、装置及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111080554A true CN111080554A (zh) | 2020-04-28 |
CN111080554B CN111080554B (zh) | 2023-08-04 |
Family
ID=70316227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911325757.7A Active CN111080554B (zh) | 2019-12-20 | 2019-12-20 | 一种投影内容中字幕区域增强方法、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111080554B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111950523A (zh) * | 2020-08-28 | 2020-11-17 | 珠海大横琴科技发展有限公司 | 基于航拍的船只检测优化方法、装置、电子设备及介质 |
CN114079815A (zh) * | 2020-08-11 | 2022-02-22 | 武汉Tcl集团工业研究院有限公司 | 字幕保护方法、系统、终端设备及存储介质 |
CN115834972A (zh) * | 2022-12-20 | 2023-03-21 | 安徽听见科技有限公司 | 字幕颜色调整方法、装置、电子设备和存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02153487A (ja) * | 1988-12-05 | 1990-06-13 | Hitachi Ltd | 文字・写真領域判定装置およびそれを用いた画像入力装置ならびに光学文字認識装置 |
US20040240737A1 (en) * | 2003-03-15 | 2004-12-02 | Chae-Whan Lim | Preprocessing device and method for recognizing image characters |
CN101408942A (zh) * | 2008-04-17 | 2009-04-15 | 浙江师范大学 | 一种复杂背景下的车牌定位方法 |
CN102136064A (zh) * | 2011-03-24 | 2011-07-27 | 成都四方信息技术有限公司 | 一种图像文字识别系统 |
CA2797054A1 (en) * | 2010-04-23 | 2011-10-27 | Flir Systems Ab | Infrared resolution and contrast enhancement with fusion |
US20120206567A1 (en) * | 2010-09-13 | 2012-08-16 | Trident Microsystems (Far East) Ltd. | Subtitle detection system and method to television video |
CN102782706A (zh) * | 2010-03-10 | 2012-11-14 | 微软公司 | 经历光学字符识别的文本图像的文本增强 |
CN102915438A (zh) * | 2012-08-21 | 2013-02-06 | 北京捷成世纪科技股份有限公司 | 一种视频字幕的提取方法及装置 |
US20130088461A1 (en) * | 2011-10-07 | 2013-04-11 | Qualcomm Incorporated | Vision-based interactive projection system |
CN104967923A (zh) * | 2015-06-30 | 2015-10-07 | 北京奇艺世纪科技有限公司 | 一种设置字幕颜色的方法及装置 |
CN106254933A (zh) * | 2016-08-08 | 2016-12-21 | 腾讯科技(深圳)有限公司 | 字幕提取方法及装置 |
CN107146210A (zh) * | 2017-05-05 | 2017-09-08 | 南京大学 | 一种基于图像处理的检测去除阴影方法 |
CN108256493A (zh) * | 2018-01-26 | 2018-07-06 | 中国电子科技集团公司第三十八研究所 | 一种基于车载视频的交通场景文字识别系统及识别方法 |
CN110008954A (zh) * | 2019-03-29 | 2019-07-12 | 重庆大学 | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 |
CN110084160A (zh) * | 2019-04-16 | 2019-08-02 | 东南大学 | 一种基于运动和亮度显著性特征的视频森林烟火检测方法 |
CN110490204A (zh) * | 2019-07-11 | 2019-11-22 | 深圳怡化电脑股份有限公司 | 图像处理方法、图像处理装置及终端 |
-
2019
- 2019-12-20 CN CN201911325757.7A patent/CN111080554B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02153487A (ja) * | 1988-12-05 | 1990-06-13 | Hitachi Ltd | 文字・写真領域判定装置およびそれを用いた画像入力装置ならびに光学文字認識装置 |
US20040240737A1 (en) * | 2003-03-15 | 2004-12-02 | Chae-Whan Lim | Preprocessing device and method for recognizing image characters |
CN101408942A (zh) * | 2008-04-17 | 2009-04-15 | 浙江师范大学 | 一种复杂背景下的车牌定位方法 |
CN102782706A (zh) * | 2010-03-10 | 2012-11-14 | 微软公司 | 经历光学字符识别的文本图像的文本增强 |
CA2797054A1 (en) * | 2010-04-23 | 2011-10-27 | Flir Systems Ab | Infrared resolution and contrast enhancement with fusion |
US20120206567A1 (en) * | 2010-09-13 | 2012-08-16 | Trident Microsystems (Far East) Ltd. | Subtitle detection system and method to television video |
CN102136064A (zh) * | 2011-03-24 | 2011-07-27 | 成都四方信息技术有限公司 | 一种图像文字识别系统 |
US20130088461A1 (en) * | 2011-10-07 | 2013-04-11 | Qualcomm Incorporated | Vision-based interactive projection system |
CN102915438A (zh) * | 2012-08-21 | 2013-02-06 | 北京捷成世纪科技股份有限公司 | 一种视频字幕的提取方法及装置 |
CN104967923A (zh) * | 2015-06-30 | 2015-10-07 | 北京奇艺世纪科技有限公司 | 一种设置字幕颜色的方法及装置 |
CN106254933A (zh) * | 2016-08-08 | 2016-12-21 | 腾讯科技(深圳)有限公司 | 字幕提取方法及装置 |
CN107146210A (zh) * | 2017-05-05 | 2017-09-08 | 南京大学 | 一种基于图像处理的检测去除阴影方法 |
CN108256493A (zh) * | 2018-01-26 | 2018-07-06 | 中国电子科技集团公司第三十八研究所 | 一种基于车载视频的交通场景文字识别系统及识别方法 |
CN110008954A (zh) * | 2019-03-29 | 2019-07-12 | 重庆大学 | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 |
CN110084160A (zh) * | 2019-04-16 | 2019-08-02 | 东南大学 | 一种基于运动和亮度显著性特征的视频森林烟火检测方法 |
CN110490204A (zh) * | 2019-07-11 | 2019-11-22 | 深圳怡化电脑股份有限公司 | 图像处理方法、图像处理装置及终端 |
Non-Patent Citations (2)
Title |
---|
吴海兵;陶声祥;顾国华;王书宇;: "基于四波段图像融合的彩色夜视方法研究", 光子学报, no. 05, pages 175 - 184 * |
唐思源;苗;王晓琴;: "视频帧中改进的字幕检测定位方法", 科技传播, no. 05, pages 237 - 238 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114079815A (zh) * | 2020-08-11 | 2022-02-22 | 武汉Tcl集团工业研究院有限公司 | 字幕保护方法、系统、终端设备及存储介质 |
CN114079815B (zh) * | 2020-08-11 | 2024-03-15 | 武汉Tcl集团工业研究院有限公司 | 字幕保护方法、系统、终端设备及存储介质 |
CN111950523A (zh) * | 2020-08-28 | 2020-11-17 | 珠海大横琴科技发展有限公司 | 基于航拍的船只检测优化方法、装置、电子设备及介质 |
CN115834972A (zh) * | 2022-12-20 | 2023-03-21 | 安徽听见科技有限公司 | 字幕颜色调整方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111080554B (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111080554B (zh) | 一种投影内容中字幕区域增强方法、装置及可读存储介质 | |
CN108830873B (zh) | 深度图像物体边缘提取方法、装置、介质及计算机设备 | |
US7742650B2 (en) | Object detection in images | |
CN110008954B (zh) | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 | |
CN113610774B (zh) | 一种玻璃划痕缺陷检测方法、系统、装置及存储介质 | |
EP4071665A1 (en) | Character segmentation method and apparatus, and computer-readable storage medium | |
CN115063421B (zh) | 极片区域检测方法及系统及装置及介质及缺陷检测方法 | |
CN111046862B (zh) | 一种字符分割方法、装置以及计算机可读存储介质 | |
CN107633253B (zh) | 基于含噪图像中矩形包围框的精确提取和定位方法 | |
CN106096491B (zh) | 一种眼底彩色照相图像中微动脉瘤自动化识别方法 | |
CN104751422B (zh) | 一种影印文档图像增强及二值化方法 | |
CN101742292B (zh) | 基于图像内容信息的环路滤波方法和滤波器 | |
CN105719275A (zh) | 一种并行组合的图像缺陷分割方法 | |
CN111192241B (zh) | 一种人脸图像的质量评估方法、装置及计算机存储介质 | |
CN110136079A (zh) | 基于场景深度分割的图像去雾方法 | |
CN112330544A (zh) | 图像拖影的处理方法、装置、设备及介质 | |
CN113505702A (zh) | 基于双神经网络优化的路面病害识别方法及系统 | |
CN111144419A (zh) | 基于分块自适应同态滤波的历史文档图像二值化方法 | |
CN109448010B (zh) | 一种基于内容特征的四方连续纹样自动生成方法 | |
Roy et al. | A scheme for edge-based multi-focus color image fusion | |
CN114913099A (zh) | 视频文件处理的方法和系统 | |
CN105354823A (zh) | 树木年轮图像边缘提取与分割的系统 | |
JP2012065230A (ja) | 画像2値化方法および画像2値化装置 | |
CN112465835A (zh) | 用于翡翠图像分割的方法及模型训练方法 | |
Zhang et al. | Automatic video object segmentation using wavelet transform and moving edge detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |