CN108307245B - 一种基于背景感知技术的字幕字体颜色获取方法、显示器 - Google Patents

一种基于背景感知技术的字幕字体颜色获取方法、显示器 Download PDF

Info

Publication number
CN108307245B
CN108307245B CN201810120739.4A CN201810120739A CN108307245B CN 108307245 B CN108307245 B CN 108307245B CN 201810120739 A CN201810120739 A CN 201810120739A CN 108307245 B CN108307245 B CN 108307245B
Authority
CN
China
Prior art keywords
color
subtitle
background
perception technology
caption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810120739.4A
Other languages
English (en)
Other versions
CN108307245A (zh
Inventor
武寨青
程国艮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Tone Communication Technology Co ltd
Original Assignee
Global Tone Communication Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Global Tone Communication Technology Co ltd filed Critical Global Tone Communication Technology Co ltd
Priority to CN201810120739.4A priority Critical patent/CN108307245B/zh
Publication of CN108307245A publication Critical patent/CN108307245A/zh
Application granted granted Critical
Publication of CN108307245B publication Critical patent/CN108307245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Image Generation (AREA)

Abstract

本发明属于配制说明字幕技术领域,公开了一种基于背景感知技术的字幕字体颜色获取方法、显示器,所述基于背景感知技术的字幕字体颜色获取方法将背景颜色与字幕颜色明显的区分开,以获得清晰的字幕观感。背景感知技术的原理是通过将每个像素点用空间三维表示,通过计算平均像素的方式,确定背景的色深,再根据色深计算对应的灰度,根据灰度的不同,选择字幕颜色为白色或黑色。本发明利用背景感知技术,动态的将字体颜色调整为黑色或者白色,以保证在不同视频背景下,字幕依然清晰可见。

Description

一种基于背景感知技术的字幕字体颜色获取方法、显示器
技术领域
本发明属于配制说明字幕技术领域,尤其涉及一种基于背景感知技术的字幕字体颜色获取方法、显示器。
背景技术
目前,业内常用的现有技术是这样的:随着互联网带宽的迅速增长和费用的不断降低,在线视频成为用户观看视频的主要方式。为了帮助用户更好的理解视频中的内容,视频制作者通常会在视频上叠加字幕。由于视频画面颜色丰富且变化很快,为了保证字幕清晰可见,通常有以下两种字幕处理方法:1.字幕字体颜色为白色,同时为字幕添加黑色阴影;2.字幕字体颜色为白色,阴影颜色为黑色,同时为字幕文本框添加黑色的底色。第二种方式适用于在所有视频上叠加字幕,如YouTube为视频自动添加的字幕。但是对于第二种方式,黑色的背景虽然能够凸显白色的字幕文字,让字幕清晰可读,但同时却遮挡了视频内容区域,形成视觉死角,对于观众来说并非最好的观赏体验。第一种方式对视频背景无遮挡,因此,在实际使用中,第一种方法较为常见。但是第一种方法也有弊端,当背景颜色趋于白色时,字幕的清晰度会明显减弱。如前所述,当字幕字体颜色为白色,同时为字幕添加黑色阴影时,虽然在大多数场景都表现不错,但当背景颜色也趋于白色时,字幕的清晰度会显著下降。
综上所述,现有技术存在的问题是:当字幕字体颜色为白色,同时为字幕添加黑色阴影时,虽然在大多数场景都表现不错,但当背景颜色也趋于白色时,字幕的清晰度会显著下降。
解决上述技术问题的难度和意义:原因在于背景颜色与字幕的颜色相同或十分接近。
发明内容
针对现有技术存在的问题,本发明提供了一种基于背景感知技术的字幕字体颜色获取方法、显示器。
本发明是这样实现的,一种基于背景感知技术的字幕字体颜色获取方法,所述基于背景感知技术的字幕字体颜色获取方法将背景颜色与字幕颜色明显的区分开,以获得清晰的字幕观感;背景感知技术的原理是通过将每个像素点用空间三维表示,通过计算平均像素的方式,确定背景的色深,再根据色深计算对应的灰度,根据灰度的不同,选择字幕颜色为白色或黑色。
进一步,所述基于背景感知技术的字幕字体颜色获取方法不可以在步骤:
步骤一,对于字幕区域A,计算得到区域像素均值;
步骤二,计算得到区域A的色深DA
步骤三,计算得到字幕字体颜色Tcolor
进一步,所述区域A中所有像素的均值向量
Figure BDA0001571987000000021
为:
Figure BDA0001571987000000022
其中
Figure BDA0001571987000000023
表示第i个像素点的红色色值。
进一步,定义
Figure BDA0001571987000000024
为从(0,0,0)点到(255,255,255)的对角向量,则区域A的色深DA计算公式为:
Figure BDA0001571987000000025
色深DA表示均值向量
Figure BDA0001571987000000026
在对角向量
Figure BDA0001571987000000027
上的投影,并做归一化处理,使得色深DA∈[0,1],趋近于0时表示颜色加深,趋近于1时表示颜色变浅。
进一步,所述字体颜色Tcolor的计算公式如下:
Figure BDA0001571987000000028
本发明的另一目的在于提供一种应用所述基于背景感知技术的字幕字体颜色获取方法的显示器。
综上所述,本发明的优点及积极效果为:利用背景感知技术,动态的将字体颜色调整为黑色或者白色,以保证在不同视频背景下,字幕依然清晰可见。
为了验证本专利所提出技术方案的优越性,我们以字幕字体颜色的RGB向量x与字幕所在矩形区域的均值像素向量
Figure BDA0001571987000000031
之间的欧几里得距离
Figure BDA0001571987000000032
作为评价标准,定义如下:
Figure BDA0001571987000000033
Figure BDA0001571987000000034
值越小,字幕颜色与周围底色越接近,字幕越不清晰;值越大,字幕颜色与周围底色区分越明显,字幕越清晰。其中,当字幕字体颜色为白色(255,255,255),背景为纯黑色(0,0,0)时,
Figure BDA0001571987000000035
取得最大值441.673。
我们从百度图片搜索(https://image.baidu.com/)随机选取了1000张1080p分辨率以上的图片作为验证数据集,分别使用传统的字幕颜色处理方法和本专利提出的字幕颜色处理方法,为测试数据集中的每一张图片添加字幕,并计算
Figure BDA0001571987000000036
值。实验结果如下表所示,采用本专利提出的方法得到的平均
Figure BDA0001571987000000037
值,与传统的字幕颜色处理方法相比提升了31%,提升效果明显。
Figure BDA0001571987000000038
附图说明
图1是本发明实施例提供的基于背景感知技术的字幕字体颜色获取方法流程图。
图2是本发明实施例提供的字幕区域示意图。
图3是本发明实施例提供的三维向量示意图。
图4是本发明实施例提供的字体颜色vs区域色深计算曲线示意图。
图5是本发明实施例提供的字幕1对比示意图;
图中:(a)白色背景时的字幕;(b)经过背景感知技术计算后的字幕。
图6是本发明实施例提供的字幕2对比示意图;
图中:(a)传统字幕处理方法;(b)本发明计算后的字幕。
图7是本发明实施例提供的字幕3对比示意图;
图中:(a)传统字幕处理方法;(b)本发明计算后的字幕。
图8是本发明实施例提供的字幕4对比示意图;
图中:(a)传统字幕处理方法;(b)本发明计算后的字幕。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明是一种基于背景感知技术的字幕颜色计算方法,将背景颜色与字幕颜色明显的区分开,以获得清晰的字幕观感。背景感知技术的原理是通过将每个像素点用空间三维表示,通过计算平均像素的方式,确定背景的色深,再根据色深计算对应的灰度,根据灰度的不同,选择字幕颜色为白色或黑色。
如图1所示,本发明实施例提供的基于背景感知技术的字幕字体颜色获取方法包括以下步骤:
S101:对于字幕区域A,计算得到区域像素均值;
S102:计算得到区域A的色深DA
S103:计算得到字幕字体颜色Tcolor
下面结合附图对本发明的应用原理作进一步的描述。
如图2所示,假设字幕所对应的视频区域A为m像素宽,n像素高,则区域A共有m*n个像素点。每个像素点x由一个三元组(r,g,b)表示。其中,r,g,b分别表示红、绿、蓝三原色的值,取值范围为[0,255]。因此,每一个像素点都是一个三维向量,如图3所示。其中(0,0,0)表示该像素为黑色,(255,255,255)表示该像素为白色。
定义区域A中所有像素的均值向量
Figure BDA0001571987000000051
为:
Figure BDA0001571987000000052
其中
Figure BDA0001571987000000053
表示第i个像素点的红色色值。
定义
Figure BDA0001571987000000054
为从(0,0,0)点到(255,255,255)的对角向量,则区域A的色深DA计算公式为:
Figure BDA0001571987000000055
色深DA表示均值向量
Figure BDA0001571987000000056
在对角向量
Figure BDA0001571987000000057
上的投影,并做了归一化处理,使得色深DA∈[0,1],趋近于0时表示颜色加深,而趋近于1时表示颜色变浅。
有了色深DA之后,字体颜色Tcolor的计算公式如下:
Figure BDA0001571987000000058
字体颜色与色深DA之间的计算关系如图4所示。
下面结合对比实验对本发明的应用效果作详细的描述。
当字幕字体颜色为白色,同时为字幕添加黑色阴影时,虽然在大多数场景都表现不错,但当背景颜色也趋于白色时,字幕的清晰度会显著下降,如图5(a)所示。
如图5(a)所示原因在于背景颜色与字幕的颜色相同或十分接近,因此本发明的基于背景感知技术的字幕颜色计算方法,将背景颜色与字幕颜色明显的区分开,以获得清晰的字幕观感。背景感知技术的原理是通过将每个像素点用空间三维表示,通过计算平均像素的方式,确定背景的色深,再根据色深计算对应的灰度,根据灰度的不同,选择字幕颜色为白色或黑色。
对于图5(a)所示的问题,使用本发明提出的方法后,达到图5(b)所示的效果。本发明的字幕字体颜色计算方法,利用背景感知技术,动态的将字体颜色调整为黑色或者白色,以保证在不同视频背景下,字幕依然清晰可见。本发明提出的方法与传统的字幕方法对比效果如图6-图8所示,其中图6(a)-图8(a)左侧图片使用了传统字幕处理方法,图6(b)-图8(b)图片字幕使用了本发明提出的方法。从以上的对比图片中可以看到,与传统的字幕颜色处理方法相比,本发明提出的字幕颜色处理方法让字幕更加清晰。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于背景感知技术的字幕字体颜色获取方法,其特征在于,所述基于背景感知技术的字幕字体颜色获取方法将背景颜色与字幕颜色明显的区分开,获得清晰的字幕观感;背景感知技术的原理是通过将每个像素点用空间三维表示,通过计算平均像素的方式,确定背景的色深,再根据色深计算对应的灰度,根据灰度的不同,选择字幕颜色为白色或黑色;
所述基于背景感知技术的字幕字体颜色获取方法包括以下步骤:
步骤一,对于字幕区域A,计算得到区域像素均值;
步骤二,计算得到字幕区域A的色深DA
步骤三,计算得到字幕字体颜色Tcolor
定义
Figure FDA0002362307880000011
为从(0,0,0)点到(255,255,255)的对角向量,则字幕区域A的色深DA计算公式为:
Figure FDA0002362307880000012
色深DA表示均值向量
Figure FDA0002362307880000013
在对角向量
Figure FDA0002362307880000014
上的投影,并做归一化处理,使得色深DA∈[0,1],趋近于0时表示颜色加深,趋近于1时表示颜色变浅;所述区域A中所有像素的均值向量
Figure FDA0002362307880000015
为:
Figure FDA0002362307880000016
其中
Figure FDA0002362307880000017
表示在字幕区域中第i个像素点的红色色值;
Figure FDA0002362307880000018
表示在字幕区域中,第i个像素的绿色色值;
Figure FDA0002362307880000019
表示在字幕区域中,第i个像素的蓝色的值;m表示字幕区域的宽度,单位为像素;n表示字幕区域的高度,单位为像素;
Figure FDA00023623078800000110
表示在字幕区域中所有像素点红色色值的均值,
Figure FDA00023623078800000111
表示在字幕区域中所有像素点绿色色值的均值,
Figure FDA00023623078800000112
表示在字幕区域中所有像素点蓝色色值的均值;
所述字体颜色Tcolor的计算公式如下:
Figure FDA0002362307880000021
2.一种应用权利要求1所述基于背景感知技术的字幕字体颜色获取方法的显示器。
CN201810120739.4A 2018-02-07 2018-02-07 一种基于背景感知技术的字幕字体颜色获取方法、显示器 Active CN108307245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810120739.4A CN108307245B (zh) 2018-02-07 2018-02-07 一种基于背景感知技术的字幕字体颜色获取方法、显示器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810120739.4A CN108307245B (zh) 2018-02-07 2018-02-07 一种基于背景感知技术的字幕字体颜色获取方法、显示器

Publications (2)

Publication Number Publication Date
CN108307245A CN108307245A (zh) 2018-07-20
CN108307245B true CN108307245B (zh) 2020-04-28

Family

ID=62864541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810120739.4A Active CN108307245B (zh) 2018-02-07 2018-02-07 一种基于背景感知技术的字幕字体颜色获取方法、显示器

Country Status (1)

Country Link
CN (1) CN108307245B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111614993B (zh) * 2020-04-30 2021-05-25 腾讯科技(深圳)有限公司 弹幕展示方法、装置、计算机设备及存储介质
CN112230790A (zh) * 2020-09-08 2021-01-15 盐城华旭光电技术有限公司 一种触摸屏显示装置
CN112312196A (zh) * 2020-11-13 2021-02-02 深圳市前海手绘科技文化有限公司 一种视频字幕制作方法
CN115834972B (zh) * 2022-12-20 2024-10-18 安徽听见科技有限公司 字幕颜色调整方法、装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7064759B1 (en) * 2003-05-29 2006-06-20 Apple Computer, Inc. Methods and apparatus for displaying a frame with contrasting text
CN102547147A (zh) * 2011-12-28 2012-07-04 上海聚力传媒技术有限公司 用于对视频图像中的字幕文本进行增强处理的方法与装置
CN104104990A (zh) * 2014-07-29 2014-10-15 小米科技有限责任公司 调整视频中字幕的方法及装置
CN104967923A (zh) * 2015-06-30 2015-10-07 北京奇艺世纪科技有限公司 一种设置字幕颜色的方法及装置
CN105451094A (zh) * 2014-08-20 2016-03-30 深圳Tcl新技术有限公司 字幕颜色调整方法及装置
CN106791493A (zh) * 2016-11-17 2017-05-31 天津大学 基于模糊控制的颜色协调立体字幕制作方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130094044A (ko) * 2012-02-15 2013-08-23 삼성전자주식회사 영상 표시 장치에서 자막 속성을 변경하기 위한 장치 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7064759B1 (en) * 2003-05-29 2006-06-20 Apple Computer, Inc. Methods and apparatus for displaying a frame with contrasting text
CN102547147A (zh) * 2011-12-28 2012-07-04 上海聚力传媒技术有限公司 用于对视频图像中的字幕文本进行增强处理的方法与装置
CN104104990A (zh) * 2014-07-29 2014-10-15 小米科技有限责任公司 调整视频中字幕的方法及装置
CN105451094A (zh) * 2014-08-20 2016-03-30 深圳Tcl新技术有限公司 字幕颜色调整方法及装置
CN104967923A (zh) * 2015-06-30 2015-10-07 北京奇艺世纪科技有限公司 一种设置字幕颜色的方法及装置
CN106791493A (zh) * 2016-11-17 2017-05-31 天津大学 基于模糊控制的颜色协调立体字幕制作方法

Also Published As

Publication number Publication date
CN108307245A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN108307245B (zh) 一种基于背景感知技术的字幕字体颜色获取方法、显示器
US8488868B2 (en) Generation of a depth map from a monoscopic color image for rendering stereoscopic still and video images
US7054478B2 (en) Image conversion and encoding techniques
US8610758B2 (en) Depth map generation for a video conversion system
US7869649B2 (en) Image processing device, image processing method, program, storage medium and integrated circuit
US8131098B2 (en) Image processing device, image processing method, image processing system, program, storage medium, and integrated circuit
CN103366364B (zh) 一种基于颜色差异的抠图方法
CN103581648B (zh) 绘制新视点中的空洞填补方法
US20190356895A1 (en) Method and apparatus for processing an image property map
CN107636728B (zh) 用于确定图像的深度图的方法和装置
US8428299B2 (en) Method of processing images to combat copying
KR101985880B1 (ko) 디스플레이 장치 및 이의 제어 방법
KR20110138733A (ko) 2차원에서 3차원으로의 영상 변환 방법 및 장치
US20140064608A1 (en) Method of transforming stereoscopic image and recording medium storing the same
US10074209B2 (en) Method for processing a current image of an image sequence, and corresponding computer program and processing device
US20140093158A1 (en) Apparatus and method for generating a multi-viewpoint image
CN115035147A (zh) 基于虚拟拍摄的抠图方法、装置、系统及图像融合方法
US9319656B2 (en) Apparatus and method for processing 3D video data
CN108833879A (zh) 具有时空连续性的虚拟视点合成方法
TWI758630B (zh) 圖像縮放方法和裝置
CN108200361B (zh) 一种基于环境感知技术的字幕背景处理方法、显示器
WO2016199418A1 (en) Frame rate conversion system
CN106028018B (zh) 面向裸眼3d显示的实拍双视点3d视频优化方法及系统
CN107203979A (zh) 一种低照度图像增强的方法
US8295539B2 (en) Method and system of immersive sensation enhancement for video sequence displaying

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant