CN111669497A

CN111669497A - 一种移动端自拍时音量驱动贴纸效果的方法

Info

Publication number: CN111669497A
Application number: CN202010534368.1A
Authority: CN
Inventors: 程龙; 冯一飞; 熊永春
Original assignee: Hangzhou Quwei Science & Technology Co ltd
Current assignee: Hangzhou Quwei Science & Technology Co ltd
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2020-09-15

Abstract

本发明公开了一种移动端自拍时音量驱动贴纸效果的方法。它具体包括如下步骤：将输入的音频数据解码，读取PCM数据；处理PCM数据解析音量相关信息；应用音量驱动贴纸；读取相机录制的一帧画面，并识别人脸，如果存在人脸，则进入到下一步；否则直接显示该画面；获得人脸特征点，并计算出贴纸原始的旋转、位移、缩放特征；通过解析的音量信息计算出系数k，根据系数k重新计算贴纸的旋转、位移、缩放，用新计算出来的旋转、位移、缩放更新显示效果；绘制并显示画面，循环上述来处理录制的视频。本发明的有益效果是：可以使得人脸贴纸的效果更佳丰富，随着背景音乐节律运动；不同的音乐带来不同的效果，有区分度。

Description

一种移动端自拍时音量驱动贴纸效果的方法

技术领域

本发明涉及图像处理相关技术领域，尤其是指一种移动端自拍时音量驱动贴纸效果的方法。

背景技术

现有人脸贴纸渲染一般流程：1.读取出相机采集的画面A；2.识别出人脸特征点位置；3.根据特征点位置和模板信息计算人脸贴纸图像的旋转平移缩放等参数；4.绘制贴纸到画面A，并显示；5.如录制则对画面进行编码，输出到文件。现有的人脸贴纸，动态效果固定，某些变化不能和背景音乐形成良好共振。

发明内容

本发明是为了克服现有技术中存在上述的不足，提供了一种根据音乐区分不同动作的移动端自拍时音量驱动贴纸效果的方法。

为了实现上述目的，本发明采用以下技术方案：

一种移动端自拍时音量驱动贴纸效果的方法，具体包括如下步骤：

(1)将输入的音频数据解码，读取PCM数据；

(2)处理PCM数据解析音量相关信息；

(3)应用音量驱动贴纸，其中贴纸是设计师根据人脸设计的一组贴在人脸上的效果的集合；

(4)读取相机录制的一帧画面，并识别人脸，如果存在人脸，则进入到下一步；否则直接显示该画面；

(5)获得人脸特征点，并计算出贴纸原始的旋转、位移、缩放特征；

(6)通过步骤(2)解析的音量信息计算出系数k，根据系数k重新计算步骤(5)中贴纸的旋转、位移、缩放，用新计算出来的旋转、位移、缩放更新显示效果；

(7)绘制并显示画面，循环步骤(3)到步骤(7)来处理录制的视频。

本发明中当用户选择音频文件之后，APP后台就开始解析其音量相关特性，并保存到一个临时文件中；当绑定的贴纸模板存在相关音量驱动的配置的时候，进行线性映射，改变相关贴纸显示参数的数值，实现变化；随着音乐播放时间的推移，更新这些值。这样可以使得人脸贴纸的效果更佳丰富，随着背景音乐节律运动；不同的音乐带来不同的效果，有区分度。

作为优选，在步骤(1)中，读取单通道PCM数据，如果双通道需要提取其中的一个通道作为计算。

作为优选，在步骤(2)中，具体操作方法为：按固定某个步长读取PCM数据，比较每个采样的数据的大小，获取平均值，代表这一段的音量，将解析成的音量数据保存在本地，并记录平均值。

作为优选，在步骤(5)中，具体操作方法为：获得人脸101个特征点，特征点是描述人脸在相关的位置的数据，每隔固定步长节点，读取音量均值amp_value。

作为优选，在步骤(6)中，具体操作方法为：按照配置文件中的映射相关信息，计算出最终值，假设某个系数的值域为[a,b]，最终系数k＝(b-a)*amp_value+a，利用最终系数k对贴纸的绘制参数进行更新。

本发明的有益效果是：可以使得人脸贴纸的效果更佳丰富，随着背景音乐节律运动；不同的音乐带来不同的效果，有区分度。

附图说明

图1是本发明的方法流程图。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步的描述。

如图1所述的实施例中，一种移动端自拍时音量驱动贴纸效果的方法，具体包括如下步骤：

(1)将输入的音频数据解码，读取PCM数据；读取单通道PCM数据，如果双通道需要提取其中的一个通道作为计算。

(2)处理PCM数据解析音量相关信息；具体操作方法为：按固定某个步长读取PCM数据，比如10ms一个单位；比较每个采样的数据的大小，获取平均值，代表这一段的音量，将解析成的音量数据保存在本地，并记录平均值。如果PCM数据是双声道，需要进行分离操作，假如左声道buf为A，比较A中每个采样的数据的大小，获取最大值，代表这一段的音量。

(5)获得人脸特征点，并计算出贴纸原始的旋转、位移、缩放特征；具体操作方法为：获得人脸101个特征点，特征点是描述人脸在相关的位置的数据，每隔固定步长10ms节点，读取音量均值amp_value。

(6)通过步骤(2)解析的音量信息计算出系数k，根据系数k重新计算步骤(5)中贴纸的旋转、位移、缩放，用新计算出来的旋转、位移、缩放更新显示效果；具体操作方法为：按照配置文件中的映射相关信息，计算出最终值，假设某个系数的值域为[a,b]，最终系数k＝(b-a)*amp_value+a，利用最终系数k对贴纸的绘制参数进行更新。例如缩放系数的值域为[1,2]，amp_value的值为0.5，那么最终的缩放系数就是1.5。

Claims

1.一种移动端自拍时音量驱动贴纸效果的方法，其特征是，具体包括如下步骤：

(1)将输入的音频数据解码，读取PCM数据；

(2)处理PCM数据解析音量相关信息；

2.根据权利要求1所述的一种移动端自拍时音量驱动贴纸效果的方法，其特征是，在步骤(1)中，读取单通道PCM数据，如果双通道需要提取其中的一个通道作为计算。

3.根据权利要求1或2所述的一种移动端自拍时音量驱动贴纸效果的方法，其特征是，在步骤(2)中，具体操作方法为：按固定某个步长读取PCM数据，比较每个采样的数据的大小，获取平均值，代表这一段的音量，将解析成的音量数据保存在本地，并记录平均值。

4.根据权利要求3所述的一种移动端自拍时音量驱动贴纸效果的方法，其特征是，在步骤(5)中，具体操作方法为：获得人脸101个特征点，特征点是描述人脸在相关的位置的数据，每隔固定步长节点，读取音量均值amp_value。

5.根据权利要求4所述的一种移动端自拍时音量驱动贴纸效果的方法，其特征是，在步骤(6)中，具体操作方法为：按照配置文件中的映射相关信息，计算出最终值，假设某个系数的值域为[a,b]，最终系数k＝(b-a)*amp_value+a，利用最终系数k对贴纸的绘制参数进行更新。