WO2017076171A1

WO2017076171A1 - 一种在视频图像上显示信息的方法和装置

Info

Publication number: WO2017076171A1
Application number: PCT/CN2016/102640
Authority: WO
Inventors: 黄利华
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2015-11-06
Filing date: 2016-10-20
Publication date: 2017-05-11
Also published as: JP6438598B2; JP2018519727A; US20180041796A1; US10425679B2; CN105430512A

Abstract

本申请提供了一种在视频图像上显示信息的方法和装置，应用于播放设备上，该播放设备接收信息播放请求；解析当前播放视频的图像帧；在解析获得的图像帧中识别出面部特征；确定识别出的面部特征在该图像帧中的位置；将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。

Description

一种在视频图像上显示信息的方法和装置

本申请要求于2015年11月16日提交中国专利局、申请号为201510751308.4、发明名称为“一种在视频图像上显示信息的方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及视频技术领域，特别涉及一种在视频图像上显示信息的方法和装置。

发明背景

弹幕指直接显现在视频上的评论，可以以滚动、停留甚至更多动作特效方式出现在视频上，是观看视频的人发送的简短评论。弹幕视频即带有“弹幕”的视频。目前很多网站提供视频发送弹幕的功能，如niconico、acfun、bilibili、dilili、tucao、爆点TV等。

一般情况，该类网站能允许观看视频者发表评论或感想，但与普通视频分享网站只在播放器下专用点评区显示不同，其会以滑动字幕的方式实时出现在视频画面上，保证所有观看者都能注意到，从而实现观看者间的互动，甚至可以一起表达对作品的赞叹或批评，增加观看乐趣。

现有技术中，由于弹幕信息随机出现在视频画面上，即会出现在视频画面的任意位置，这样会存在弹幕遮挡视频重要播放内容的弊病，如遮挡视频图像中的人脸等关键信息。

发明内容

有鉴于此，本申请提供一种在视频图像上显示信息的方法和装置，能够避开视频图像上的面部特征显示信息，提高了播放设备视频图像处理功能。

为解决上述技术问题，本申请的技术方案是这样实现的：

一种在视频图像上显示信息的方法，应用于播放设备上，该方法包括：

该播放设备接收信息播放请求；

解析当前播放视频的图像帧；

在解析获得的图像帧中识别出面部特征；

确定识别出的面部特征在该图像帧中的位置；

将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。

一种在视频图像上显示信息的装置，应用于播放设备上，该装置至少包括处理器和存储器，其中所述存储器中存储接收单元、解析单元、获取单元、确定单元和显示单元，当被所述处理器执行时，

所述接收单元用于接收信息播放请求；

所述解析单元用于解析当前播放视频的图像帧；

所述识别单元用于在解析获得的图像帧中识别出面部特征；

所述确定单元用于确定识别出的面部特征在该图像帧中的位置；

所述显示单元用于将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。

一种非易失性计算机存储介质，其中存储有计算机程序，该计算机程序用于执行上述的方法。

附图简要说明

图1为本申请一个实施例中在视频图像上显示信息的流程示意图；

图2为本申请一个实施例中在视频图像上显示信息的流程示意图；

图3为本申请一个实施例中在视频图像上显示信息的流程示意图；

图4为本申请一个实施例中在视频图像上显示信息的流程示意图；

图5为本申请实施例中视频播放系统示意图；

图6为现有实现中在视频图像中显示弹幕信息的示意图；

图7为本申请实施例中在视频图像中显示弹幕信息的示意图。

图8为本申请应用于上述技术的装置结构示意图；

图9为本申请具体实施例中在视频图像上显示信息的硬件架构组成示意图。

实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，下面结合附图并举实施例，对本申请的技术方案进行详细说明。

本申请实施例中提供一种在视频图像上显示信息的方法，应用于播放设备上，如应用于诸如手机、个人电脑等用户终端上运行的用于播放媒体文件的应用(也叫媒体播放器)；该播放设备在接收到信息播放请求时，在当前播放的视频中解析出图像帧，并识别出该帧图像的面部特征，将接收到的信息显示在除面部特征的位置之外的位置上。能够避开视频图像上的面部特征显示信息，提高了播放设备视频图像处理功能。

本申请实施例中的面部特征可以为人脸，也可以为动物的头部等，具体实现时，可以根据实际需要预先设置该面部特征为关键信息，如希望不遮挡字幕信息，则可以将字幕信息设置为对应的关键信息。上述只是一种举例，并不限于上述提到的面部特征。

播放设备接收到的信息可以为下述之一或任意组合：字幕信息、广告信息、弹幕信息、图片信息。本申请实施例具体实现时，不限于上述列举信息。

下面结合附图，详细说明本申请实施例中在视频图像上显示信息的过程。

参见图1，图1为本申请一个实施例中在视频图像上显示信息的流程示意图。具体步骤为：

步骤101，播放设备接收到信息播放请求时，解析当前播放视频的图像帧。

步骤102，该播放设备在解析获得的图像帧中识别出面部特征。

本申请实施例中根据要识别的面部特征的特点预先配置图像识别方法，如面部特征为人脸时，则使用人脸识别方法进行面部特征的识别。

步骤103，该播放设备确定识别出的面部特征在该图像帧中的位置。

本步骤中识别出的面部特征在帧图像中的位置使用该帧图像中所述面部特征的边缘位置的像素点所对应的区域标识。

如针对x轴为第n像素到第m像素，针对y轴为第p像素到第q像素，这一区间的图像对应面部特征。这里位置的表示方式只是一种举例，具体实现时，对位置方式的标识不作限制。在具体实现时，为了更准确确定面部特征的位置，可以使用横纵坐标多个像素点所对应的区域标识。

本申请在具体实现时，步骤102和步骤103的实现可以在播放设备上，也可以增加一台服务器实现该功能，还可以在已有的服务器上增加该功能的实现。

步骤104，该播放设备将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。

该播放设备将接收到的信息显示在图像帧中的具体方式，可以根据所述信息的特点进行显示，如接收到的信息为弹幕信息，则可以将弹幕信息绘制在除面部特征的位置之外的位置上。

播放设备在视频图像上显示接收到的信息时，同现有实现不一致的地方，即为避开识别出的面部特征的位置，显示接收到的信息。至于接收到的信息的具体显示方式，本申请实施例不作限制，可以横向显示，纵向显示等，根据实际需要，或者美观来显示。

参见图2，图2为本申请一个实施例中在视频图像上显示信息的流程示意图。具体步骤为：

步骤201，播放设备接收到信息播放请求时，解析当前播放视频的图像帧。

步骤202，该播放设备确定本地是否记录该图像帧的面部特征的位置，如果是，执行步骤205；否则，执行步骤203。

步骤203，该播放设备在解析获得的图像帧中识别出面部特征。

在具体实现时，若在解析获得的图像中未识别出面部特征，则针对该图像帧记录无面部特征，则在显示接收到的信息可以在该帧图像上任意位置显示，即可和现有实现方式相同的方式显示接收到的信息。

步骤204，该播放设备确定识别出的面部特征在该图像帧中的位置，并记录该图像帧的面部特征的位置。

步骤205，该播放设备将接收到的信息显示在该图像帧中除面部特征的位置之外的位置。

本实施例中，在首次针对一图像帧进行面部特征识别时，将识别出的面部特征在该图像帧中的位置进行记录，当播放该帧图像时，再次接收到其他信息时，不需要再次进行面部特征识别，直接获取针对该图像帧的面部特征的位置，即可，能够节省时间，以及设备资源。

参见图3，图3为本申请一个实施例中在视频图像上显示信息的流程示意图。具体步骤为：

步骤301，播放设备接收到信息播放请求时，解析当前播放视频的图像帧，并针对该图像帧记录所述信息。

步骤302，该播放设备在解析获得的图像帧中识别出面部特征。

步骤303，该播放设备确定识别出的面部特征在该图像帧中的位置。

步骤304，该播放设备确定针对该图像帧是否记录接收的信息之外的信息，如果是，执行步骤305；否则，执行步骤306。

步骤305，该播放设备将针对该图像帧的所有信息显示在该图像帧中除确定出的面部特征的位置之外的位置。

步骤306，该播放设备将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。

本实施例中，针对一图像帧记录接收到的信息，再次在播放该图像帧时，若再次接收到信息播放请求，则将针对该图像帧记录的所有信息都显示在该图像帧上除面部特征的位置之外的位置。这样的技术方案，能够增加用户体验，如针对一个视频上的弹幕信息，不同的用户在观看过程中针对某一帧图像播放时，显示在该帧图像发送的所有弹幕。

参见图4，图4为本申请一个实施例中在视频图像上显示信息的流程示意图。具体步骤为：

步骤401，播放设备接收到信息播放请求时，解析当前播放视频的图像帧，并针对该图像帧记录所述信息。

步骤402，该播放设备确定本地是否记录该图像帧的面部特征的位置，如果是，执行步骤405；否则，执行步骤403。

步骤403，该播放设备在解析获得的图像帧中识别出面部特征。

步骤404，该播放设备确定识别出的面部特征在该图像帧中的位置，并记录该图像帧的面部特征的位置。

步骤405，该播放设备确定针对该图像帧是否记录接收的信息之外的信息，如果是，执行步骤406；否则，执行步骤407。

步骤406，该播放设备将针对该图像帧的所有信息显示在该图像帧中除确定出的面部特征的位置之外的位置，结束本流程。

步骤407，该播放设备将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。

本实施例既节省面部特征识别时间，设备资源，又能增加用户体验。

下面以接收到的信息为弹幕信息为例，结合附图详细说明在视频图像上显示信息的过程。

参见图5，图5为本申请实施例中视频播放系统示意图。图5中视频存储服务器为播放设备提供视频数据；信息服务器为播放设备提供请求播放的信息。在具体实现时，视频存储服务器和信息服务器可以为一台服务器，也可以为多台服务器，本申请实施例具体实现时，对此不作限制，按现有实现即可。

视频存储服务器将要播放的视频发送给播放设备。

播放设备接收到视频存储服务器发送的视频时，若确定该视频为音视频，需先将接收到的视频对应的视频数据分离为音频数据和视频数据，对音频数据解码后输出声音；对视频数据解码后，输出视频图像。无论是否显示接收到的信息，声音和图像的同步这里不作改变，按现有实现方式即可。

本申请实施例中，信息服务器接收到用户通过客户端发送的弹幕信息时，将该弹幕信息发送给播放设备。

播放设备接收到弹幕服务器发送的弹幕信息时，解析当前播放视频的图像帧；并针对该图像帧记录接收到的弹幕信息。

播放设备确定针对该图像帧是否记录该图像帧上的面部特征的位置，如果是，则该播放设备确定针对该图像帧是否记录接收的信息之外的信息。

当播放设备记录该图像帧上的面部特征的位置，则将针对该图像帧将记录的对应弹幕信息都显示在除面部特征的位置之外的位置。

当播放设备未记录该图像帧上的面部特征的位置，则在解析获得的图像帧中识别出面部特征；确定识别出的面部特征在该图像帧中的位置；并记录该图像帧上面部特征的位置。然后将针对该图像帧将记录的对应弹幕信息都显示在除面部特征的位置之外的位置。

这只是列举的一个在准备播放的视频图像上显示弹幕信息的例子，本申请具体实现时，对此不作限制，按现有方式实现确定在准备播放的视频图像帧上是否需要显示弹幕信息。

参见图6，图6为现有实现中在视频图像中显示弹幕信息的示意图。

参见图7，图7为本申请实施例中在视频图像中显示弹幕信息的示意图。

图6和图7为针对同一帧视频图像显示相同的弹幕信息的示意图。面部特征为人脸信息为例。

由图6和图7可见，现有实现过程中，图6中的弹幕信息(战争一触即发、国产大英雄和666666666666)会显示在人脸上，不利于用户对视频的观看；而通过本申请实施例的实现方式处理后，图7中的上述弹幕信息不会显示在人脸上，提高了用户观看视频的体验；因此，本申请提供的技术方案实现了不影响用户观影体验的信息显示，提高了播放设备视频图像处理功能。

基于同样的发明构思，本申请还提出一种在视频图像上显示信息的装置，应用于播放设备上。参见图8，图8为本申请应用于上述技术的装置结构示意图。该装置包括：接收单元801、解析单元802、识别单元803、确定单元804和显示单元805；

接收单元801，用于接收信息播放请求；

解析单元802，用于当接收单元801接收到信息播放请求时，解析当前播放视频的图像帧；

识别单元803，用于在解析单元802解析获得的图像帧中识别出面部特征；

确定单元804，用于确定识别单元803识别出的面部特征在该图像帧中的位置；

显示单元805，用于将接收单元801接收到的信息显示在该图像帧中除确定单元804确定出的面部特征的位置之外的位置。

较佳地，该装置进一步包括：记录单元806；

记录单元806，用于当确定单元804确定识别出的面部特征在该图像帧中的位置时，记录该图像帧的面部特征的位置；

确定单元804，进一步用于当解析单元802解析当前播放视频的图像帧之后，确定所述记录单元是否记录该图像帧的面部特征的位置，如果是，触发显示单元805将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置；否则，触发识别单元803在解析获得的图像帧中识别出面部特征。

该装置进一步包括：记录单元806；

记录单元806，进一步用于当解析单元802解析当前播放视频的图像帧时，针对该图像帧记录所述信息；

显示单元805，进一步用于当将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置之前，确定所述记录单元中针对该图像帧是否记录接收的信息之外的信息，如果是，触发显示单元805将针对该图像帧的所有信息显示在该图像帧中除确定出的面部特征的位置之外的位置；否则，触发显示单元805将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。

所述面部特征在帧图像中的位置使用该帧图像中所述面部特征的边缘位置的像素点所对应的区域标识。

所述接收到的信息为下述之一或任意组合：字幕信息、广告信息、弹幕信息、图片信息。

上述实施例的单元可以集成于一体，也可以分离部署；可以合并为一个单元，也可以进一步拆分成多个子单元。

本申请各实施例中的各单元可以以机械方式或电子方式实现。例如，一个硬件模块可以包括专门设计的永久性电路或逻辑器件(如专用处理器，如FPGA或ASIC)用于完成特定的操作。硬件模块也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。至于具体采用机械方式，或是采用专用的永久性电路，或是采用临时配置的电路(如由软件进行配置)来实现硬件模块，可以根据成本和时间上的考虑来决定。

以上对本申请具体实施例中的在视频图像上显示弹幕的装置进行了说明，下面给出本申请具体实施例中播放设备的硬件架构组成，该设备是可以软硬件结合的可编程设备，具体参见图9，图9为本申请具体实施例中在视频图像上显示信息的硬件架构组成示意图。该播放设备可包括：处理器910，存储器920，端口930以及总线940。处理器910和存储器920通过总线940互联。处理器910可通过端口1130获取和输出数据；其中，

接收单元801被处理器910执行时可以为：接收信息播放请求；

解析单元802被处理器910执行时可以为：解析当前播放视频的图像帧；

识别单元803被处理器910执行时可以为：在图像帧中识别出面部特征；

确定单元804被处理器910执行时可以为：确定识别出的面部特征在该图像帧中的位置；

显示单元805被处理器910执行时可以为：将接收到的信息显示在该图像帧中除确定单元804确定出的面部特征的位置之外的位置。

记录单元806被处理器910执行时可以为：记录接收到的信息，记录图像帧中面部特征的位置。

由此可以看出，当存储在存储器920中的指令模块被处理器910执行时，可实现前述技术方案中接收单元、解析单元、识别单元、确定单元、显示单元和记录单元的各种功能。

另外，本申请的实施例中可以通过由设备如计算机执行的数据处理程序来实现。显然，数据处理程序构成了本申请。此外，通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和/或内存)中执行。因此，这样的存储介质也构成了本申请。存储介质可以使用任何类型的记录方式，例如纸张存储介质(如纸带等)、磁存储介质(如软盘、硬盘、闪存等)、光存储介质(如CD-ROM等)、磁光存储介质(如MO等)等。

因此，本申请还公开了一种存储介质，比如非易失性计算机存储介质，其中存储有数据处理程序，该数据处理程序用于执行本申请上述技术方案。

需要说明的是，图9所示的播放设备只是一个具体的例子，也可以通过其他的与本实施例描述不同的结构实现，例如，执行上述指令代码时所完成的操作，也可以由特定应用专用集成电路(ASIC)实现。另外，上述的处理器910可以是一个或多个，如果是多个，则由多个处理器共同负责读取和执行所述指令代码。因此，本申请对测试设备的具体结构不作具体限定。

综上所述，本申请通过播放设备在接收到信息播放请求时，在当前播放的图像帧上避开面部特征显示接收到的信息。该方案的实现，能够避开视频图像上的面部特征显示信息，提高了播放设备视频图像处理功能。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种在视频图像上显示信息的方法，应用于播放设备上，其特征在于，该方法包括：

该播放设备接收信息播放请求；

解析当前播放视频的图像帧；

在解析获得的图像帧中识别出面部特征；

确定识别出的面部特征在该图像帧中的位置；

将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。
根据权利要求1所述的方法，其特征在于，所述确定识别出的面部特征在该图像帧中的位置时，所述方法进一步包括：记录该图像帧的面部特征的位置；

所述解析当前播放视频的图像帧之后，所述在解析获得的图像帧中识别出面部特征之前，所述方法进一步包括：

确定本地是否记录该图像帧的面部特征的位置，如果是，将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置；否则，执行所述在解析获得的图像帧中识别出面部特征步骤。
根据权利要求1或2所述的方法，其特征在于，所述解析当前播放视频的图像帧时，所述方法进一步包括：针对该图像帧记录所述信息；

所述将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置之前，所述方法进一步包括：

确定针对该图像帧是否记录接收的信息之外的信息，如果是，将针对该图像帧的所有信息显示在该图像帧中除确定出的面部特征的位置之外的位置；否则，将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。
根据权利要求1或2所述的方法，其特征在于，

所述面部特征在帧图像中的位置使用该帧图像中所述面部特征的边缘位置的像素点所对应的区域标识。
根据权利要求1或2所述的方法，其特征在于，

所述接收到的信息为下述之一或任意组合：字幕信息、广告信息、弹幕信息、图片信息。
一种在视频图像上显示信息的装置，应用于播放设备上，其特征在于，该装置至少包括处理器和存储器，其中所述存储器中存储接收单元、解析单元、识别单元、确定单元和显示单元，当被所述处理器执行时，

所述接收单元用于接收信息播放请求；

所述解析单元用于解析当前播放视频的图像帧；

所述识别单元用于在所述图像帧中识别出面部特征；

所述确定单元用于确定所述识别出的面部特征在该图像帧中的位置；

所述显示单元用于将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。
根据权利要求6所述的装置，其特征在于，该存储器中进一步存储记录单元，当被所述处理器执行时，

所述记录单元用于根据确定识别出的面部特征在该图像帧中的位置，记录该图像帧的面部特征的位置；

所述确定单元进一步用于当解析当前播放视频的图像帧之后，确定是否已经记录该图像帧的面部特征的位置，如果是，触发将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置；否则，触发在解析获得的图像帧中识别出面部特征。
根据权利要求6或7所述的装置，其特征在于，该存储器中进一步存储记录单元，当被所述处理器执行时，

所述记录单元进一步用于当解析当前播放视频的图像帧时，针对该图像帧记录所述信息；

所述显示单元进一步用于将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置之前，确定针对该图像帧是否记录接收的信息之外的信息，如果是，触发将针对该图像帧的所有信息显示在该图像帧中除确定出的面部特征的位置之外的位置；否则，触发将接收到的信息显示在该图像帧中除确定出的面部特征的位置之外的位置。
根据权利要求6或7所述的装置，其特征在于，

所述面部特征在帧图像中的位置使用该帧图像中所述面部特征的边缘位置的像素点所对应的区域标识。
根据权利要求6或7所述的装置，其特征在于，

所述接收到的信息为下述之一或任意组合：字幕信息、广告信息、弹幕信息、图片信息。
一种非易失性计算机存储介质，其特征在于，其中存储有计算机程序，该计算机程序用于执行所述权利要求1至5任一项所述的方法。