CN108881744A - 一种视频新闻演播室自动识别方法 - Google Patents
一种视频新闻演播室自动识别方法 Download PDFInfo
- Publication number
- CN108881744A CN108881744A CN201810858257.9A CN201810858257A CN108881744A CN 108881744 A CN108881744 A CN 108881744A CN 201810858257 A CN201810858257 A CN 201810858257A CN 108881744 A CN108881744 A CN 108881744A
- Authority
- CN
- China
- Prior art keywords
- image
- news
- studio
- color
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种视频新闻演播室自动识别方法,利用现代计算机视频图像处理技术以及人工智能技术,对视频新闻节目进行自动分析,能够快速并精确地识别出新闻演播室时间点,解决以人工方式对视频新闻节目拆条中的低效率问题,为视频新闻资源的二次加工利用提供有效的技术手段。
Description
技术领域
本发明涉及媒体加工领域,具体涉及一种视频新闻演播室自动识别方法。
背景技术
新媒体节目生产通常需要对传统媒体节目进行二次加工过程,广播电视行业中大量的多媒体数据中具有重要价值的新闻节目需要深度开发利用,来源不同的成品新闻节目视频。内容拆条是对传统媒体节目的二次加工过程,其内容来源主要有传统媒体媒资中心或影视公司成品素材,基于用户思维开展视音频内容研究和切分著录,立足广播电视特点,用广播电视语言和视角,揭示素材的内容要素和信息,深度挖掘有价值信息,在拆条和编目后用于IPTV、OTT、手机电视等全媒体应用,满足新媒体视听节目碎片化要求。
新闻节目数据的大量涌现,民众对新闻时效性要求不断提高,现行主要依靠人工逐帧检视新闻视频进行新闻拆条的方式,已经不能适应上述发展,根本无法在规定时间内完成新闻节目的制作。
发明内容
本发明的目的在于克服现有技术的不足,提供一种视频新闻演播室自动识别方法,利用现代计算机图像内容自动识别算法和人工智能策略,对电视新闻节目中新闻演播室进行高效的识别提供有效技术方案,而新闻演播室画面在新闻视频中出现和结束的时间点可直接用于新闻拆条。
本发明的目的是通过以下技术方案来实现的:
一种视频新闻演播室自动识别方法,其步骤如下:
S1:抽取视频帧:定时抽取新闻节目视频的图像帧作为新闻演播室检测对象;
S2:视频图像帧人脸提取:对抽取的图像帧逐一进行人脸识别并提取人脸特征值,同时定位出每一帧图像中的人脸位置;
S3:图像按人脸聚类,获得候选新闻演播室图像集合:对包含人脸的图像帧,按人脸特征值做无监督聚类,根据聚类得到的类别,选取其中属于新闻主持人类别的图像,作为候选新闻演播室图像集合;
S4:根据图像背景颜色风格和人物外套颜色风格剔除非演播室图像:
S5:精确定位新闻演播室边界时间点。
进一步的,所述人脸位置检测以及人脸特征值提取使用开源人脸识别库dlib获得,人脸位置由一个对角点确定的矩形表示,矩形的左上顶点坐标为(left,top),右下顶点坐标为(right,bottom),人脸特征值由一个128维向量表示。
进一步的,所述图像背景颜色风格剔除非演播室图像的步骤如下:
S01:图像预处理:对候选图像去黑边,图像做高斯模糊预处理,降低图像噪声的干扰;
S02:背景区域选取:选择图像中人脸两侧背景区域作为颜色分析的区域;
S03:背景主颜色提取:对选定区域内图像的每个像素点提取HSV颜色空间中的颜色表示,即颜色按色相,对比度,明度三个分量的形式表示,对所有像素点颜色统计每种色相值出现的次数,以计数最多的色相值描述该图像的背景颜色风格;
S04:像按背景颜色风格聚类:对候选新闻演播室图像集合中的图像,按图像背景的颜色风格进行无监督聚类,聚类完成后筛选出包含图像成员最多的类别,将属于其他类别的图像剔除出候选新闻演播室图像集合。
进一步的,所述人物外套颜色风格剔除非演播室图像的步骤如下:
S11:图像预处理:对候选图像做高斯模糊预处理,降低图像噪声的干扰;
S12:外套颜色提取:通过和人脸的相对位置关系,确定人物外套颜色拾取点,像素点的颜色表示选择HSV颜色空间,将颜色的色相分量值作为衣服的颜色风格;
S13:图像按人物外套颜色风格聚类:对候选新闻演播室图像集合中的图像,按图像中人物外套颜色风格进行无监督聚类,聚类完成后筛选出包含图像成员最多的类别,将属于其他类别的图像剔除出候选新闻演播室图像集合。
进一步的,所述精确检测新闻演播室边界时间点步骤如下:
S21:按照新闻演播室图像对应的时间点,将时间上连续的图像进行分组,取每组图像对应时间段的起点和终点时间,从而得到一组新闻演播室图像初略的持续时间区间;
S22:将相互交叠、连续、临近的时间区间合并;
S23:对每一个合并后的初略的时间段,在起、始时间点附近搜索视频转场时间点,将转场时间点作为新闻演播室持续的精确边界时间点,从而得到一组新闻演播室的精确起始时间。
进一步的,通过搜索检测起始时间点前后1秒范围内的所有视频帧,检测到图像帧剧烈变化的时间点,作为转场时间点。
本发明的有益效果是:本发明所提出的视频新闻演播室自动识别方法,利用现代计算机视频图像处理技术以及人工智能技术,对视频新闻节目进行自动分析,能够快速并精确地识别出新闻演播室时间点,解决以人工方式对视频新闻节目拆条中的低效率问题,为视频新闻资源的二次加工利用提供有效的技术手段。
附图说明
图1是本发明的流程图。
具体实施方式
下面结合具体实施例进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种视频新闻演播室自动识别方法,其具体实现步骤如下:
S1,抽取视频帧:对新闻节目视频以固定的间隔抽取图像帧,得到的一组图像帧作为新闻演播室初略检测对象,所述固定的间隔可以为25帧(1秒),即每秒提取一张图片,由于目前电视标准是25FPS,所以每间隔25帧提取一张;固定间隔抽帧图像作为初略检查对象,可以极大降低数据处理量,显著提高检测的效率。
S2,视频图像帧人脸提取:对S1中抽取图像帧逐一进行人脸识别,包含人脸的图像定位出每个图像中的人脸位置,并提取人脸特征值;人脸位置检测以及人脸特征值提取使用开源人脸识别库dlib获得。人脸位置由一个对角点确定的矩形表示,矩形的左上顶点坐标为(left,top),右下顶点坐标为(right,bottom)。人脸特征值由一个128维向量表示。
S3,图像按人脸聚类,获得候选新闻演播室图像集合:对包含人脸的图像帧,使用Mean Shift 聚类算法按人脸特征值做无监督聚类,再根据聚类得到的类别,选取其中属于新闻主持人类别图像,作为候选新闻演播室图像集合;上述主持人类别的判断,可将包含图像成员数最多的类别Gmax作为主持人图像组。由于同一新闻中,主持人人数可能为2,因此需要检查其他类别图像组中是否与包与分组Gmax中相同的图像成员,若有,则也将该分组认定为主持人类别图像分组。
S4,根据图像背景颜色风格剔除非演播室图像:
S01,图像预处理:对候选图像去黑边;对图像做高斯模糊预处理,降低图像噪声的干扰;
S02,背景区域选取:选择图像中人脸两侧背景区域作为颜色分析的区域;以图像中包含两个人脸为例,人脸矩形框按S2所述方法分别表示(left1,top1,right1,bottom1)和(left2,top2,right2,bottom2),若图像宽度为w,则选取的背景区域为3个部分,分别表示为(0,topmin,left1,bottommax),(right1,topmin,left2,bottommax),(right2,topmin,w,bottommax),其中的topmin表示top1和top2中的较小者,而bottommax表示bottom1和bottom2中的较大者。
S03,背景主颜色提取:对选定区域内图像的每个像素点的提取HSV颜色空间中的颜色表示,即颜色按色相,对比度,明度三个分量的形式表示,对所有像素点颜色统计每种色相值出现的次数,以计数最多的色相值hb描述该图像的背景颜色风格;
S04,图像按背景颜色风格聚类:对候选新闻演播室图像集合中的图像,使用MeanShift 聚类算法按图像背景的颜色风格,即色相值hb对候选图像进行无监督聚类,聚类完成后筛选出包含图像成员最多的类别,将属于其他类别的图像剔除出候选新闻演播室图像集合;
S5,根据人物外套颜色风格剔除非演播室图像:
S11,图像预处理:对候选图像做高斯模糊预处理,降低图像噪声的干扰;
S12,外套颜色提取:通过和人脸的相对位置关系,确定人物外套颜色拾取点,像素点的颜色表示选择HSV颜色空间,将颜色的色相分量值hc作为衣服的颜色风格;颜色拾取点可以选择人脸位置矩形框下侧两个顶点向下移动一倍矩形框高度对应的两个点的坐标位置。在颜色拾取点分别取得两点的颜色数值,并做算术平均,得到外套颜色。
S13,图像按人物外套颜色风格聚类:对候选新闻演播室图像集合中的图像,使用Mean Shift 聚类算法按图像中人物外套颜色风格,即色相值hc对候选图像进行无监督聚类,聚类完成后筛选出包含图像成员最多的类别,将属于其他类别的图像剔除出候选新闻演播室图像集合;
S6,精确检测新闻演播室边界时间点:
S21,按照新闻演播室图像对应的时间点,将时间上连续的图像进行分组,取每组图像对应时间段的起点和终点时间,从而得到一组新闻演播室图像初略的持续时间区间;
S22,时间区间合并:将相互交叠,连续,临近的时间区间合并;例如时间区间[10,15]、[15,25]将被合并为[10,25]。
S23,对每一个合并后得到的初略的时间段,在起、始时间点附近搜索视频转场时间点,将转场时间点作为新闻演播室持续的精确边界时间点,从而得到一组新闻演播室的精确起始时间,通过搜索检测时间点前后1秒范围内的所有视频帧,检测到图像帧剧烈变化的时间点,作为转场时间点。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (6)
1.一种视频新闻演播室自动识别方法,其特征在于,其步骤如下:
S1:抽取视频帧:定时抽取新闻节目视频的图像帧作为新闻演播室检测对象;
S2:视频图像帧人脸提取:对抽取的图像帧逐一进行人脸识别并提取人脸特征值,同时定位出每一帧图像中的人脸位置;
S3:图像按人脸聚类,获得候选新闻演播室图像集合:对包含人脸的图像帧,按人脸特征值做无监督聚类,根据聚类得到的类别,选取其中属于新闻主持人类别的图像,作为候选新闻演播室图像集合;
S4:根据图像背景颜色风格和人物外套颜色风格剔除非演播室图像:
S5:精确定位新闻演播室边界时间点。
2.根据权利要求1所述的一种视频新闻演播室自动识别方法,其特征在于,所述人脸位置检测以及人脸特征值提取使用开源人脸识别库dlib获得,人脸位置由一个对角点确定的矩形表示,矩形的左上顶点坐标为(left,top),右下顶点坐标为(right,bottom),人脸特征值由一个128维向量表示。
3.根据权利要求2所述的一种视频新闻演播室自动识别方法,其特征在于,所述图像背景颜色风格剔除非演播室图像的步骤如下:
S01:图像预处理:对候选图像去黑边,图像做高斯模糊预处理,降低图像噪声的干扰;
S02:背景区域选取:选择图像中人脸两侧背景区域作为颜色分析的区域;
S03:背景主颜色提取:对选定区域内图像的每个像素点提取HSV颜色空间中的颜色表示,即颜色按色相,对比度,明度三个分量的形式表示,对所有像素点颜色统计每种色相值出现的次数,以计数最多的色相值描述该图像的背景颜色风格;
S04:像按背景颜色风格聚类:对候选新闻演播室图像集合中的图像,按图像背景的颜色风格进行无监督聚类,聚类完成后筛选出包含图像成员最多的类别,将属于其他类别的图像剔除出候选新闻演播室图像集合。
4.根据权利要求3所述的一种视频新闻演播室自动识别方法,其特征在于,所述人物外套颜色风格剔除非演播室图像的步骤如下:
S11:图像预处理:对候选图像做高斯模糊预处理,降低图像噪声的干扰;
S12:外套颜色提取:通过和人脸的相对位置关系,确定人物外套颜色拾取点,像素点的颜色表示选择HSV颜色空间,将颜色的色相分量值作为衣服的颜色风格;
S13:图像按人物外套颜色风格聚类:对候选新闻演播室图像集合中的图像,按图像中人物外套颜色风格进行无监督聚类,聚类完成后筛选出包含图像成员最多的类别,将属于其他类别的图像剔除出候选新闻演播室图像集合。
5.根据权利要求4所述的一种视频新闻演播室自动识别方法,其特征在于,所述精确检测新闻演播室边界时间点步骤如下:
S21:按照新闻演播室图像对应的时间点,将时间上连续的图像进行分组,取每组图像对应时间段的起点和终点时间,从而得到一组新闻演播室图像初略的持续时间区间;
S22:将相互交叠、连续、临近的时间区间合并;
S23:对每一个合并后的初略的时间段,在起、始时间点附近搜索视频转场时间点,将转场时间点作为新闻演播室持续的精确边界时间点,从而得到一组新闻演播室的精确起始时间。
6.根据权利要求5所述的一种视频新闻演播室自动识别方法,其特征在于,通过搜索检测起始时间点前后1秒范围内的所有视频帧,检测到图像帧剧烈变化的时间点,作为转场时间点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810858257.9A CN108881744A (zh) | 2018-07-31 | 2018-07-31 | 一种视频新闻演播室自动识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810858257.9A CN108881744A (zh) | 2018-07-31 | 2018-07-31 | 一种视频新闻演播室自动识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108881744A true CN108881744A (zh) | 2018-11-23 |
Family
ID=64306465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810858257.9A Pending CN108881744A (zh) | 2018-07-31 | 2018-07-31 | 一种视频新闻演播室自动识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108881744A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000045604A1 (en) * | 1999-01-29 | 2000-08-03 | Sony Corporation | Signal processing method and video/voice processing device |
CN1862487A (zh) * | 2006-06-15 | 2006-11-15 | 北京中星微电子有限公司 | 基于人脸认证的屏幕保护方法及装置 |
CN103856689A (zh) * | 2013-10-31 | 2014-06-11 | 北京中科模识科技有限公司 | 面向新闻视频的人物对话字幕提取方法 |
CN104506934A (zh) * | 2014-12-25 | 2015-04-08 | 合肥寰景信息技术有限公司 | 一种节省存储空间的视频处理方法 |
CN104618662A (zh) * | 2013-11-05 | 2015-05-13 | 富泰华工业(深圳)有限公司 | 视频播放系统及方法 |
CN105120335A (zh) * | 2015-08-17 | 2015-12-02 | 无锡天脉聚源传媒科技有限公司 | 一种处理电视节目图片的方法和装置 |
CN105718871A (zh) * | 2016-01-18 | 2016-06-29 | 成都索贝数码科技股份有限公司 | 一种基于统计的视频主持人识别方法 |
CN107977645A (zh) * | 2017-12-19 | 2018-05-01 | 北京奇艺世纪科技有限公司 | 一种视频新闻海报图的生成方法及装置 |
-
2018
- 2018-07-31 CN CN201810858257.9A patent/CN108881744A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000045604A1 (en) * | 1999-01-29 | 2000-08-03 | Sony Corporation | Signal processing method and video/voice processing device |
CN1862487A (zh) * | 2006-06-15 | 2006-11-15 | 北京中星微电子有限公司 | 基于人脸认证的屏幕保护方法及装置 |
CN103856689A (zh) * | 2013-10-31 | 2014-06-11 | 北京中科模识科技有限公司 | 面向新闻视频的人物对话字幕提取方法 |
CN104618662A (zh) * | 2013-11-05 | 2015-05-13 | 富泰华工业(深圳)有限公司 | 视频播放系统及方法 |
CN104506934A (zh) * | 2014-12-25 | 2015-04-08 | 合肥寰景信息技术有限公司 | 一种节省存储空间的视频处理方法 |
CN105120335A (zh) * | 2015-08-17 | 2015-12-02 | 无锡天脉聚源传媒科技有限公司 | 一种处理电视节目图片的方法和装置 |
CN105718871A (zh) * | 2016-01-18 | 2016-06-29 | 成都索贝数码科技股份有限公司 | 一种基于统计的视频主持人识别方法 |
CN107977645A (zh) * | 2017-12-19 | 2018-05-01 | 北京奇艺世纪科技有限公司 | 一种视频新闻海报图的生成方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Can micro-expression be recognized based on single apex frame? | |
CN103020650B (zh) | 一种台标识别方法及装置 | |
CN111881913A (zh) | 图像识别方法及装置、存储介质和处理器 | |
CN101599179B (zh) | 场地运动精彩镜头集锦自动生成方法 | |
CN103996046B (zh) | 基于多视觉特征融合的人员识别方法 | |
US7305128B2 (en) | Anchor person detection for television news segmentation based on audiovisual features | |
US20020172420A1 (en) | Image processing apparatus for and method of improving an image and an image display apparatus comprising the image processing apparatus | |
CN108769731A (zh) | 一种检测视频中目标视频片段的方法、装置及电子设备 | |
Ren et al. | Fusion of intensity and inter-component chromatic difference for effective and robust colour edge detection | |
US20070286499A1 (en) | Method for Classifying Digital Image Data | |
CN102521564A (zh) | 基于颜色和形状识别茶叶的方法 | |
CN103309449A (zh) | 基于面部表情识别自动切换壁纸的移动终端及其方法 | |
CN102436575A (zh) | 一种台标的自动检测和分类方法 | |
CN115330795B (zh) | 布匹毛刺缺陷检测方法 | |
CN114926436A (zh) | 一种用于周期性花纹织物的缺陷检测方法 | |
WO2017166597A1 (zh) | 一种卡通视频识别方法、装置和电子设备 | |
CN110007493A (zh) | 液晶显示屏中碎亮点检测方法 | |
CN107346417B (zh) | 人脸检测方法及装置 | |
CN106066887A (zh) | 一种广告序列图像快速检索和分析方法 | |
CN105095838B (zh) | 一种目标检测方法及装置 | |
CN108881744A (zh) | 一种视频新闻演播室自动识别方法 | |
CN106204889B (zh) | 一种纸币荧光区域的定位方法和装置 | |
Zhang et al. | Video text extraction using the fusion of color gradient and Log-Gabor filter | |
CN110866917A (zh) | 一种基于机器视觉的药片类型及排列方式识别方法 | |
CN110458012A (zh) | 多角度人脸识别方法及装置、存储介质和终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181123 |