CN107678828A

CN107678828A - 一种基于图像追踪技术实现的声音音量控制方法

Info

Publication number: CN107678828A
Application number: CN201711014780.5A
Authority: CN
Inventors: 陈更; 史凌波
Original assignee: Beijing Hieason Idea Technology Co Ltd
Current assignee: Beijing Hieason Idea Technology Co Ltd
Priority date: 2017-10-26
Filing date: 2017-10-26
Publication date: 2018-02-09

Abstract

本发明公开了一种基于图像追踪技术实现声音音量控制方法，包括：步骤1）在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置；步骤2）计算场景中终端设备到现实目标物体marker的距离；步骤3）根据场景中终端设备到现实目标物体marker的距离大小，由此控制声音音量的大小控制。本发明使用图像追踪技术计算的相对与真实物体的位置结果，相应的改变音频、视频等播放的音量大小，使增强现实应用多了声音增强维度。

Description

一种基于图像追踪技术实现的声音音量控制方法

技术领域

本发明属于一种基于图像追踪技术实现的声音音量控制方法。

背景技术

增强现实（简称AR）：通过实时计算摄像头影像的位置及角度并加上相应图像，视频，3D模型等虚拟信息达到与现实世界进行融合互动的场景效果。

图像追踪技术：把摄像头捕获到的图像数据作为输入源，运用相关算法追踪输入源中某个指定的区域的图像，并计算出该区域想对输入源的旋转和位移。

Marker————现实目标物体。

现有技术在增强现实应用时，可以播放视频或音频，视频或音频的音量固定，音量不能随着用户终端设备的位置移动而发生变化。不能增强用户的真实感。

发明内容

本发明所要解决的技术问题是提供一种基于图像追踪技术实现声音音量控制方法。

本发明解决上述技术问题所采取的技术方案如下：

一种基于图像追踪技术实现声音音量控制方法，包括：

步骤1）在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置；

步骤2）计算场景中终端设备到现实目标物体marker的距离；

步骤3）根据场景中终端设备到现实目标物体marker的距离大小，由此实现声音音量的大小控制。

优选的是，步骤1）中，具体包括：

把摄像头捕获到的图像数据作为输入源，追踪输入源中某个指定的区域的图像，并计算出该区域想对输入源的旋转和位移，由此得到旋转的一个3*4 矩阵；

其中，该矩阵表示终端设备在当前画面中的相对marker的位置和旋转，其中 R 表示旋转，T表示了位移。

优选的是，步骤2）中，具体包括:

通过下面的算法得到两点间的距离；

float dx = t1 - 0;

float dy = t2 - 0;

float dz = t3 - 0;

float d = sqrt (dx•dx + dy•dy + dz•dz);

d = abs(d);

其中，sqrt为开平方根，abs 为取绝对值；

当d为0时，场景中，终端设备和marker完全重合，d值越大代表终端设备和marker距离越远。

优选的是，步骤3）中，具体包括：

设音量的范围为0到vMax，0为静音，vMax为最大音量，d值的范围为0到dMax，当d值为dMax时音量为0，通过下面的公式计算出最终输出的音量值：

float volume = vMax - d*(vMax/dMax);

其中，通过volume值来控制音频输出音量，达到在增强现实场景中音量随终端设备的移动而发生大小变化。

步骤3）中，用户的终端设备离现实目标物体越近，听到的声音音量越大，反之越小。

本发明使用图像追踪技术计算的相对与真实物体的位置结果，相应的改变音频、视频等播放的音量大小，使增强现实应用多了声音增强维度。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

下面结合附图对本发明进行详细的描述，以使得本发明的上述优点更加明确。其中，

图1是本发明基于图像追踪技术实现声音音量控制方法的流程示意图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式，借此对本发明如何应用技术手段来解决技术问题，并达成技术效果的实现过程能充分理解并据以实施。需要说明的是，只要不构成冲突，本发明中的各个实施例以及各实施例中的各个特征可以相互结合，所形成的技术方案均在本发明的保护范围之内。

另外，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

如图1所示，一种基于图像追踪技术实现声音音量控制方法，包括：

步骤2）计算场景中终端设备到现实目标物体marker的距离；

优选的是，步骤1）中，具体包括：

优选的是，步骤2）中，具体包括:

通过下面的算法得到两点间的距离；

float dx = t1 - 0;

float dy = t2 - 0;

float dz = t3 - 0;

float d = sqrt (dx•dx + dy•dy + dz•dz);

d = abs(d);

其中，sqrt为开平方根，abs 为取绝对值；

优选的是，步骤3）中，具体包括：

float volume = vMax - d*(vMax/dMax);

其中，更具体地说，本发明的目的在于解决现有增强现实应用中缺少的声音维度的增强现实。其中，3D引擎中存在x,y,z三个坐标的三维空间坐标系：

其中，通过图像追踪技术算法可以得到当前场景中终端设备相对于的marker的位置和旋转的一个3*4 矩阵。

如：这个矩阵表示了终端设备在当前画面中的相对marker的位置和旋转，其中 R 表示旋转，T表示了位移。

为了计算场景中终端设备到marker的距离，这里只取矩阵中最后一列 t1,t2,t3的值，它代表在当前坐标系中终端设备中心点的x、y、z 的值。

通过下面的算法可以得到两点间的距离。

float dx = t1 - 0;

float dy = t2 - 0;

float dz = t3 - 0;

float d = sqrt (dx•dx + dy•dy + dz•dz);

d = abs(d);

解释：sqrt为开平方根，abs 为取绝对值；

设音量的范围为0到vMax，0为静音，vMax为最大音量。

d值的范围为0到dMax，我们设定当d值为dMax时音量为0，

可以通过下面的公式计算出最终输出的音量值：

float volume = vMax - d*(vMax/dMax);

最终使用volume值来控制音频输出音量，达到在增强现实场景中音量随终端设备的移动而发生大小变化。

其中，该发明使增强现实应用多了声音增强维度，试想在一个增强现实场景中存在一个人物模型在唱歌，用户的终端设备离现实物体越近，听到的歌声越大，反之越小，就仿佛置身于真实环境一样。

需要说明的是，对于上述方法实施例而言，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。

而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于图像追踪技术实现声音音量控制方法，包括：

步骤2）计算场景中终端设备到现实目标物体marker的距离；

2.根据权利要求1所述的基于图像追踪技术实现声音音量控制方法，其特征在于，步骤1）中，具体包括：

../../Desktop/Screen%20Shot%202017-09-14%20at%2011.31.23%20AM.

3.根据权利要求2所述的基于图像追踪技术实现声音音量控制方法，其特征在于，步骤2）中，具体包括:

通过下面的算法得到两点间的距离；

float dx = t1 - 0;

float dy = t2 - 0;

float dz = t3 - 0;

float d = sqrt (dx•dx + dy•dy + dz•dz);

d = abs(d);

其中，sqrt为开平方根，abs 为取绝对值；

4.根据权利要求3所述的基于图像追踪技术实现声音音量控制方法，其特征在于，步骤3）中，具体包括：

float volume = vMax - d*(vMax/dMax);

5.根据权利要求1所述的基于图像追踪技术实现声音音量控制方法，其特征在于，步骤3）中，用户的终端设备离现实目标物体越近，听到的声音音量越大，反之越小。