CN107678828A - 一种基于图像追踪技术实现的声音音量控制方法 - Google Patents

一种基于图像追踪技术实现的声音音量控制方法 Download PDF

Info

Publication number
CN107678828A
CN107678828A CN201711014780.5A CN201711014780A CN107678828A CN 107678828 A CN107678828 A CN 107678828A CN 201711014780 A CN201711014780 A CN 201711014780A CN 107678828 A CN107678828 A CN 107678828A
Authority
CN
China
Prior art keywords
volume
terminal device
charge pattern
pattern technology
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711014780.5A
Other languages
English (en)
Inventor
陈更
史凌波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hieason Idea Technology Co Ltd
Original Assignee
Beijing Hieason Idea Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hieason Idea Technology Co Ltd filed Critical Beijing Hieason Idea Technology Co Ltd
Priority to CN201711014780.5A priority Critical patent/CN107678828A/zh
Publication of CN107678828A publication Critical patent/CN107678828A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Abstract

本发明公开了一种基于图像追踪技术实现声音音量控制方法,包括:步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;步骤2)计算场景中终端设备到现实目标物体marker的距离;步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此控制声音音量的大小控制。本发明使用图像追踪技术计算的相对与真实物体的位置结果,相应的改变音频、视频等播放的音量大小,使增强现实应用多了声音增强维度。

Description

一种基于图像追踪技术实现的声音音量控制方法
技术领域
本发明属于一种基于图像追踪技术实现的声音音量控制方法。
背景技术
增强现实(简称AR):通过实时计算摄像头影像的位置及角度并加上相应图像,视频,3D模型等虚拟信息达到与现实世界进行融合互动的场景效果。
图像追踪技术:把摄像头捕获到的图像数据作为输入源,运用相关算法追踪输入源中某个指定的区域的图像,并计算出该区域想对输入源的旋转和位移。
Marker————现实目标物体。
现有技术在增强现实应用时,可以播放视频或音频,视频或音频的音量固定,音量不能随着用户终端设备的位置移动而发生变化。不能增强用户的真实感。
发明内容
本发明所要解决的技术问题是提供一种基于图像追踪技术实现声音音量控制方法。
本发明解决上述技术问题所采取的技术方案如下:
一种基于图像追踪技术实现声音音量控制方法,包括:
步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;
步骤2)计算场景中终端设备到现实目标物体marker的距离;
步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此实现声音音量的大小控制。
优选的是,步骤1)中,具体包括:
把摄像头捕获到的图像数据作为输入源,追踪输入源中某个指定的区域的图像,并计算出该区域想对输入源的旋转和位移,由此得到旋转的一个3*4 矩阵;
其中,该矩阵表示终端设备在当前画面中的相对marker的位置和旋转,其中 R 表示旋转,T表示了位移。
优选的是,步骤2)中,具体包括:
通过下面的算法得到两点间的距离;
float dx = t1 - 0;
float dy = t2 - 0;
float dz = t3 - 0;
float d = sqrt (dx•dx + dy•dy + dz•dz);
d = abs(d);
其中,sqrt为开平方根,abs 为取绝对值;
当d为0时,场景中,终端设备和marker完全重合,d值越大代表终端设备和marker距离越远。
优选的是,步骤3)中,具体包括:
设音量的范围为0到vMax,0为静音,vMax为最大音量,d值的范围为0到dMax,当d值为dMax时音量为0,通过下面的公式计算出最终输出的音量值:
float volume = vMax - d*(vMax/dMax);
其中,通过volume值来控制音频输出音量,达到在增强现实场景中音量随终端设备的移动而发生大小变化。
步骤3)中,用户的终端设备离现实目标物体越近,听到的声音音量越大,反之越小。
本发明使用图像追踪技术计算的相对与真实物体的位置结果,相应的改变音频、视频等播放的音量大小,使增强现实应用多了声音增强维度。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
下面结合附图对本发明进行详细的描述,以使得本发明的上述优点更加明确。其中,
图1是本发明基于图像追踪技术实现声音音量控制方法的流程示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
如图1所示,一种基于图像追踪技术实现声音音量控制方法,包括:
步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;
步骤2)计算场景中终端设备到现实目标物体marker的距离;
步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此实现声音音量的大小控制。
优选的是,步骤1)中,具体包括:
把摄像头捕获到的图像数据作为输入源,追踪输入源中某个指定的区域的图像,并计算出该区域想对输入源的旋转和位移,由此得到旋转的一个3*4 矩阵;
其中,该矩阵表示终端设备在当前画面中的相对marker的位置和旋转,其中 R 表示旋转,T表示了位移。
优选的是,步骤2)中,具体包括:
通过下面的算法得到两点间的距离;
float dx = t1 - 0;
float dy = t2 - 0;
float dz = t3 - 0;
float d = sqrt (dx•dx + dy•dy + dz•dz);
d = abs(d);
其中,sqrt为开平方根,abs 为取绝对值;
当d为0时,场景中,终端设备和marker完全重合,d值越大代表终端设备和marker距离越远。
优选的是,步骤3)中,具体包括:
设音量的范围为0到vMax,0为静音,vMax为最大音量,d值的范围为0到dMax,当d值为dMax时音量为0,通过下面的公式计算出最终输出的音量值:
float volume = vMax - d*(vMax/dMax);
其中,通过volume值来控制音频输出音量,达到在增强现实场景中音量随终端设备的移动而发生大小变化。
步骤3)中,用户的终端设备离现实目标物体越近,听到的声音音量越大,反之越小。
其中,更具体地说,本发明的目的在于解决现有增强现实应用中缺少的声音维度的增强现实。其中,3D引擎中存在x,y,z三个坐标的三维空间坐标系:
其中, 通过图像追踪技术算法可以得到当前场景中终端设备相对于的marker的位置和旋转的一个3*4 矩阵。
如:这个矩阵表示了终端设备在当前画面中的相对marker的位置和旋转,其中 R 表示旋转,T表示了位移。
为了计算场景中终端设备到marker的距离,这里只取矩阵中最后一列 t1,t2,t3的值,它代表在当前坐标系中终端设备中心点的x、y、z 的值。
通过下面的算法可以得到两点间的距离。
float dx = t1 - 0;
float dy = t2 - 0;
float dz = t3 - 0;
float d = sqrt (dx•dx + dy•dy + dz•dz);
d = abs(d);
解释:sqrt为开平方根,abs 为取绝对值;
解释:sqrt为开平方根,abs 为取绝对值;
当d为0时,场景中,终端设备和marker完全重合,d值越大代表终端设备和marker距离越远。
设音量的范围为0到vMax,0为静音,vMax为最大音量。
d值的范围为0到dMax,我们设定当d值为dMax时音量为0,
可以通过下面的公式计算出最终输出的音量值:
float volume = vMax - d*(vMax/dMax);
最终使用volume值来控制音频输出音量,达到在增强现实场景中音量随终端设备的移动而发生大小变化。
本发明使用图像追踪技术计算的相对与真实物体的位置结果,相应的改变音频、视频等播放的音量大小,使增强现实应用多了声音增强维度。
其中,该发明使增强现实应用多了声音增强维度,试想在一个增强现实场景中存在一个人物模型在唱歌,用户的终端设备离现实物体越近,听到的歌声越大,反之越小,就仿佛置身于真实环境一样。
需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于图像追踪技术实现声音音量控制方法,包括:
步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;
步骤2)计算场景中终端设备到现实目标物体marker的距离;
步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此实现声音音量的大小控制。
2.根据权利要求1所述的基于图像追踪技术实现声音音量控制方法,其特征在于,步骤1)中,具体包括:
把摄像头捕获到的图像数据作为输入源,追踪输入源中某个指定的区域的图像,并计算出该区域想对输入源的旋转和位移,由此得到旋转的一个3*4 矩阵;
../../Desktop/Screen%20Shot%202017-09-14%20at%2011.31.23%20AM.
其中,该矩阵表示终端设备在当前画面中的相对marker的位置和旋转,其中 R 表示旋转,T表示了位移。
3.根据权利要求2所述的基于图像追踪技术实现声音音量控制方法,其特征在于,步骤2)中,具体包括:
通过下面的算法得到两点间的距离;
float dx = t1 - 0;
float dy = t2 - 0;
float dz = t3 - 0;
float d = sqrt (dx•dx + dy•dy + dz•dz);
d = abs(d);
其中,sqrt为开平方根,abs 为取绝对值;
当d为0时,场景中,终端设备和marker完全重合,d值越大代表终端设备和marker距离越远。
4.根据权利要求3所述的基于图像追踪技术实现声音音量控制方法,其特征在于,步骤3)中,具体包括:
设音量的范围为0到vMax,0为静音,vMax为最大音量,d值的范围为0到dMax,当d值为dMax时音量为0,通过下面的公式计算出最终输出的音量值:
float volume = vMax - d*(vMax/dMax);
其中,通过volume值来控制音频输出音量,达到在增强现实场景中音量随终端设备的移动而发生大小变化。
5.根据权利要求1所述的基于图像追踪技术实现声音音量控制方法,其特征在于,步骤3)中,用户的终端设备离现实目标物体越近,听到的声音音量越大,反之越小。
CN201711014780.5A 2017-10-26 2017-10-26 一种基于图像追踪技术实现的声音音量控制方法 Pending CN107678828A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711014780.5A CN107678828A (zh) 2017-10-26 2017-10-26 一种基于图像追踪技术实现的声音音量控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711014780.5A CN107678828A (zh) 2017-10-26 2017-10-26 一种基于图像追踪技术实现的声音音量控制方法

Publications (1)

Publication Number Publication Date
CN107678828A true CN107678828A (zh) 2018-02-09

Family

ID=61143093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711014780.5A Pending CN107678828A (zh) 2017-10-26 2017-10-26 一种基于图像追踪技术实现的声音音量控制方法

Country Status (1)

Country Link
CN (1) CN107678828A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110286773A (zh) * 2019-07-01 2019-09-27 腾讯科技(深圳)有限公司 基于增强现实的信息提供方法、装置、设备及存储介质
CN110970057A (zh) * 2018-09-29 2020-04-07 华为技术有限公司 一种声音处理方法、装置与设备
CN111756616A (zh) * 2019-03-28 2020-10-09 南宁富桂精密工业有限公司 设定多用户虚拟现实聊天环境的方法与装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103096134A (zh) * 2013-02-08 2013-05-08 广州博冠信息科技有限公司 一种基于视频直播和游戏的数据处理方法和设备
CN104054039A (zh) * 2012-01-12 2014-09-17 高通股份有限公司 具有声音和几何分析的扩增现实
US20150362998A1 (en) * 2014-06-17 2015-12-17 Amazon Technologies, Inc. Motion control for managing content
US9367942B2 (en) * 2011-11-29 2016-06-14 Inria Institut National De Recherche En Informatique Et En Automatique Method, system and software program for shooting and editing a film comprising at least one image of a 3D computer-generated animation
CN106296598A (zh) * 2016-07-29 2017-01-04 厦门美图之家科技有限公司 三维姿态处理方法、系统及拍摄终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9367942B2 (en) * 2011-11-29 2016-06-14 Inria Institut National De Recherche En Informatique Et En Automatique Method, system and software program for shooting and editing a film comprising at least one image of a 3D computer-generated animation
CN104054039A (zh) * 2012-01-12 2014-09-17 高通股份有限公司 具有声音和几何分析的扩增现实
CN103096134A (zh) * 2013-02-08 2013-05-08 广州博冠信息科技有限公司 一种基于视频直播和游戏的数据处理方法和设备
US20150362998A1 (en) * 2014-06-17 2015-12-17 Amazon Technologies, Inc. Motion control for managing content
CN106296598A (zh) * 2016-07-29 2017-01-04 厦门美图之家科技有限公司 三维姿态处理方法、系统及拍摄终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
佚名: ""ARKit全局追踪/距离感应/AR尺子"", 《WWW.COCOACHINA.COM/ARTICLES/20615》 *
常勇: "《基于空间数据的户外增强现实技术研究》", 28 February 2015 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110970057A (zh) * 2018-09-29 2020-04-07 华为技术有限公司 一种声音处理方法、装置与设备
CN110970057B (zh) * 2018-09-29 2022-10-28 华为技术有限公司 一种声音处理方法、装置与设备
CN111756616A (zh) * 2019-03-28 2020-10-09 南宁富桂精密工业有限公司 设定多用户虚拟现实聊天环境的方法与装置
CN110286773A (zh) * 2019-07-01 2019-09-27 腾讯科技(深圳)有限公司 基于增强现实的信息提供方法、装置、设备及存储介质
CN110286773B (zh) * 2019-07-01 2023-09-19 腾讯科技(深圳)有限公司 基于增强现实的信息提供方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US20190342536A1 (en) Augmented reality based user interfacing
CN109564504A (zh) 用于基于移动处理空间化音频的多媒体装置
TW202220438A (zh) 擴增實境場景下的展示方法、電子設備及電腦可讀儲存介質
CN108597530A (zh) 声音再现方法和装置、存储介质及电子装置
CN107678828A (zh) 一种基于图像追踪技术实现的声音音量控制方法
US11048464B2 (en) Synchronization and streaming of workspace contents with audio for collaborative virtual, augmented, and mixed reality (xR) applications
CN112035041B (zh) 一种图像处理方法、装置、电子设备和存储介质
CN106648098A (zh) 一种自定义场景的ar投影方法及系统
JP7392105B2 (ja) 没入型ビデオコンテンツをフォービエイテッドメッシュを用いてレンダリングするための方法、システム、および媒体
KR20200009594A (ko) 파노라마 형식의 이미지를 이용한 가상현실 만화 서비스 제공 방법
CN109819316A (zh) 处理视频中人脸贴纸的方法、装置、存储介质及电子设备
US20230396923A1 (en) Index scheming for filter parameters
CN104935866B (zh) 实现视频会议的方法、合成设备和系统
CN113806306A (zh) 媒体文件处理方法、装置、设备、可读存储介质及产品
CN116977531A (zh) 三维纹理图像的生成方法、装置、计算机设备和存储介质
US9922408B2 (en) Image filter
GB2566006A (en) Three-dimensional video processing
CN107885331A (zh) 一种基于增强现实技术实现音频切换的交互方法
JP6892557B2 (ja) 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム
JP6967150B2 (ja) 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム
CN110620917A (zh) 一种虚拟现实跨屏立体显示的方法
US20240112394A1 (en) AI Methods for Transforming a Text Prompt into an Immersive Volumetric Photo or Video
Kim et al. Real-Time Joint Animation Production and Expression System using Deep Learning Model and Kinect Camera
WO2023116145A1 (zh) 表情模型确定方法、装置、设备及计算机可读存储介质
KR20200041548A (ko) 모바일 장치 및 모바일 장치의 제어 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180209

WD01 Invention patent application deemed withdrawn after publication