CN109144271B - 三维空间音频关注度分析方法、系统、服务器及存储介质 - Google Patents

三维空间音频关注度分析方法、系统、服务器及存储介质 Download PDF

Info

Publication number
CN109144271B
CN109144271B CN201811049576.1A CN201811049576A CN109144271B CN 109144271 B CN109144271 B CN 109144271B CN 201811049576 A CN201811049576 A CN 201811049576A CN 109144271 B CN109144271 B CN 109144271B
Authority
CN
China
Prior art keywords
audio
attention
parameter
sample
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811049576.1A
Other languages
English (en)
Other versions
CN109144271A (zh
Inventor
张聪
朱华东
李云裳
阳傲傲
刘宇
王松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Polytechnic University
Original Assignee
Wuhan Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Polytechnic University filed Critical Wuhan Polytechnic University
Priority to CN201811049576.1A priority Critical patent/CN109144271B/zh
Publication of CN109144271A publication Critical patent/CN109144271A/zh
Application granted granted Critical
Publication of CN109144271B publication Critical patent/CN109144271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/015Input arrangements based on nervous system activity detection, e.g. brain waves [EEG] detection, electromyograms [EMG] detection, electrodermal response detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/01Indexing scheme relating to G06F3/01
    • G06F2203/012Walk-in-place systems for allowing a user to walk in a virtual environment while constraining him to a given position in the physical environment

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Dermatology (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开了一种三维空间音频关注度分析方法、系统、服务器及存储介质,所述方法通过将预设三维音频测试序列的测试音频帧依次发送至目标音频设备;获得被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;将音频关注度与预设关注度阈值比较,在音频关注度大于预设关注度阈值时,判定当前测试音频帧为音频关注帧,通过被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,提升了用户体验。

Description

三维空间音频关注度分析方法、系统、服务器及存储介质
技术领域
本发明涉及虚拟现实技术领域,尤其涉及一种三维空间音频关注度分析方法、系统、服务器及存储介质。
背景技术
人类的神经关注机制可以通过听觉触发对目标音频对象的关注,音频关注度的基本原理是从生理学和心理学的角度模仿人类对声音的理解和处理过程,在音频流中检测出能够吸引听者关注的感兴趣部分,并进一步对感兴趣的部分进行分析和处理,在音频编码、音频监控、虚拟现实等领域中有着广泛应用前景。
目前的音频关注度模型主要提取音频的时域特征、频域特征和空间参数。基于时频域音频特征的关注度模型研究较为成熟,但是基于空间音频参数的关注度模型目前主要的研究仅限于音频对象水平面方位角发生变化的情况,没有考虑到在日常生活中,关注的声音可能来自三维空间中的各个方向,因此现有的音频关注度模型评估出的音频关注度并不符合实际生活的真实场景,准确度较低,无法为各种应用提供良好的参数参考。
发明内容
本发明的主要目的在于提供一种三维空间音频关注度分析方法、系统、服务器及存储介质,旨在解决现有技术中音频关注度模型评估出的音频关注度并不符合实际生活的真实场景,准确度较低,无法为各种应用提供良好的参数参考的技术问题。
为实现上述目的,本发明提供一种三维空间音频关注度分析方法,所述三维空间音频关注度分析方法包括以下步骤:
一种三维空间音频关注度分析方法,其特征在于,所述三维空间音频关注度分析方法包括:
服务器将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;
获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;
将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧。
优选地,所述获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度,具体包括:
接收通过所述目标音频设备中人头转向检测器采集所述被测试对象的人头转向空间参数及转向持续时间,并接收通过所述目标音频设备中脑电波监测器采集所述被测试对象的脑电波参数,其中,所述人头转向空间参数包括空间位置参数和角度参数;
将所述人头转向空间参数、转向持续时间及脑电波参数代入至预设关注度计算公式中,获得当前测试音频帧的音频关注度。
优选地,所述将所述人头转向空间参数、转向持续时间及脑电波参数代入至预设关注度计算公式中,获得当前测试音频帧的音频关注度,具体包括:
将所述人头转向空间参数中的角度参数、转向持续时间及脑电波参数代入至如下预设关注度计算公式中,获得当前测试音频帧的音频关注度:
ak=λ1(Dr+Dp+Dy)+λ2Dt3(Dδ+Dθ+Dα+Dβ+Dγ)
其中,ak为当前测试音频帧的音频关注度,λ1、λ2、λ3为权重调整因子,且λ123=1,Dr为所述角度参数中的滚转角参数,Dp为所述角度参数中的俯仰角参数,Dy为所述角度参数中的偏航角参数,Dδ、Dθ、Dα、Dβ、Dγ为脑电波参数,Dt为转向持续时间。
优选地,所述将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧之前,所述三维空间音频关注度分析方法还包括:
从预设样本三维音频训练序列中依次输入样本音频帧至所述目标音频设备,获得样本人头转向空间参数、样本转向持续时间及样本脑电波参数;
将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果;
根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值。
优选地,所述将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果,具体包括:
将预设样本空间阈值与所述样本人头转向空间参数进行比较,获得第一比较差值结果;
将预设样本时间阈值与所述样本转向持续时间进行比较,获得第二比较差值结果;
将预设样本脑电波阈值与所述样本脑电波参数进行比较,获得第三比较差值结果;
根据所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果确定比较结果。
优选地,所述根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值,具体包括:
根据所述比较结果中的所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果结合预设关注度运算因子确定目标关注度;
将所述目标关注度作为预设关注度阈值。
优选地,所述将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果之前,所述三维空间音频关注度分析方法还包括:
接收通过音频信号接收器采集所述被测试对象的空间音频参数,所述空间音频参数包括双耳强度差、双耳时间差及双耳相关度;
对所述空间音频参数、所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数进行分析,获得所述空间音频参数与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数的目标映射关系;
根据所述目标映射关系确定预设样本阈值。
此外,为实现上述目的,本发明还提出一种服务器,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的三维空间音频关注度分析程序,所述三维空间音频关注度分析程序配置为实现如上文所述的三维空间音频关注度分析方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有三维空间音频关注度分析程序,所述三维空间音频关注度分析程序被处理器执行时实现如上文所述的三维空间音频关注度分析方法的步骤。
此外,为实现上述目的,本发明还提供一种三维空间音频关注度分析系统,所述三维空间音频关注度分析系统包括:
音频帧输入模块,用于将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;
关注度获取模块,用于获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;
关注帧确定模块,用于将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧。
本发明提出的三维空间音频关注度分析方法,通过将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,使应用音频关注度参数的场景更加符合实际生活,提升了用户体验。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的服务器结构示意图;
图2为本发明三维空间音频关注度分析方法第一实施例的流程示意图;
图3为本发明三维空间音频关注度分析方法第二实施例的流程示意图;
图4为本发明三维空间音频关注度分析方法第三实施例的流程示意图;
图5为本发明三维空间音频关注度分析系统第一实施例的功能模块图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的解决方案主要是:通过将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,使应用音频关注度参数的场景更加符合实际生活,提升了用户体验,解决了现有技术中音频关注度模型评估出的音频关注度并不符合实际生活的真实场景,准确度较低,无法为各种应用提供良好的参数参考的技术问题。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的服务器结构示意图。
如图1所示,该服务器可以包括:处理器1001,例如CPU,通信总线1002、用户端接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户端接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户端接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的服务器结构并不构成对该服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户端接口模块以及三维空间音频关注度分析程序。
本发明服务器通过处理器1001调用存储器1005中存储的三维空间音频关注度分析程序,并执行以下操作:
将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;
获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;
将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧。
进一步地,处理器1001可以调用存储器1005中存储的三维空间音频关注度分析程序,还执行以下操作:
接收通过所述目标音频设备中人头转向检测器采集所述被测试对象的人头转向空间参数及转向持续时间,并接收通过所述目标音频设备中脑电波监测器采集所述被测试对象的脑电波参数,其中,所述人头转向空间参数包括空间位置参数和角度参数;
将所述人头转向空间参数、转向持续时间及脑电波参数代入至预设关注度计算公式中,获得当前测试音频帧的音频关注度。
进一步地,处理器1001可以调用存储器1005中存储的三维空间音频关注度分析程序,还执行以下操作:
将所述人头转向空间参数中的角度参数、转向持续时间及脑电波参数代入至如下预设关注度计算公式中,获得当前测试音频帧的音频关注度:
ak=λ1(Dr+Dp+Dy)+λ2Dt3(Dδ+Dθ+Dα+Dβ+Dγ)
其中,ak为当前测试音频帧的音频关注度,λ1、λ2、λ3为权重调整因子,且λ123=1,Dr为所述角度参数中的滚转角参数,Dp为所述角度参数中的俯仰角参数,Dy为所述角度参数中的偏航角参数,Dδ、Dθ、Dα、Dβ、Dγ为脑电波参数,Dt为转向持续时间。
进一步地,处理器1001可以调用存储器1005中存储的三维空间音频关注度分析程序,还执行以下操作:
从预设样本三维音频训练序列中依次输入样本音频帧至所述目标音频设备,获得样本人头转向空间参数、样本转向持续时间及样本脑电波参数;
将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果;
根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值。
进一步地,处理器1001可以调用存储器1005中存储的三维空间音频关注度分析程序,还执行以下操作:
将预设样本空间阈值与所述样本人头转向空间参数进行比较,获得第一比较差值结果;
将预设样本时间阈值与所述样本转向持续时间进行比较,获得第二比较差值结果;
将预设样本脑电波阈值与所述样本脑电波参数进行比较,获得第三比较差值结果;
根据所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果确定比较结果。
进一步地,处理器1001可以调用存储器1005中存储的三维空间音频关注度分析程序,还执行以下操作:
根据所述比较结果中的所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果结合预设关注度运算因子确定目标关注度;
将所述目标关注度作为预设关注度阈值。
进一步地,处理器1001可以调用存储器1005中存储的三维空间音频关注度分析程序,还执行以下操作:
接收通过音频信号接收器采集所述被测试对象的空间音频参数,所述空间音频参数包括双耳强度差、双耳时间差及双耳相关度;
对所述空间音频参数、所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数进行分析,获得所述空间音频参数与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数的目标映射关系;
根据所述目标映射关系确定预设样本阈值。
本实施例通过上述方案,通过将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,使应用音频关注度参数的场景更加符合实际生活,提升了用户体验。
基于上述硬件结构,提出本发明三维空间音频关注度分析方法实施例。
参照图2,图2为本发明三维空间音频关注度分析方法第一实施例的流程示意图。
在第一实施例中,所述三维空间音频关注度分析方法包括以下步骤:
步骤S10、服务器将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备。
需要说明的是,所述预设三维音频测试序列为预先设置的音频训练序列,音频训练序列的排序情况可以根据实际情况进行调整,所述音频训练序列可以是通过大量实验数据或训练确定的合适的音频训练序列,也可以是技术人员根据实际操作情况确定的合适的音频训练序列,也可以是用户自行拟定的音频训练序列,当然还可以是通过其他方式确定的音频训练序列,本实施例对此不加以限制。
可以理解的是,所述测试音频帧为测试音频中采样的音频码流单位,所述测试音频帧的数量和长度可以是自行拟定的,可以将测试音频分段为多个测试音频帧,通过按照所述预设三维音频测试序列,可以依次向所述目标音频设备输入测试音频的不同测试音频帧,从而根据不同的测试音频帧获得不同的测试数据,通过大量的测试生成的测试数据可以确定哪些声音是人类比较关注的声音,哪些为不是很关注的声音,从而可以将这些数据应用在不同的场景里,例如虚拟现实的应用中,如果使用更多的人类比较关注的声音,则可以使虚拟现实的场景更加真实,有效提升用户体验。
应当理解的是,所述目标音频设备为用于测试所述被测试对象的各种测试参数的设备,即所述被测试对象通过所述目标音频设备接收到所述测试音频帧后,通过所述目标音频设备收集所述被测试对象的各种测试参数,例如人头转向的测试参数,以及被测试对象的脑电波测试参数,所述目标音频设备除了可以是人头转向监测器、脑电波监测器及音频信号接收器的结合体外,还可以是包括更多部件或更少部件用于测试所述被测试对象的各种测试参数的设备,本实施例对此不加以限制。
步骤S20、获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度。
可以理解的是,通过所述目标音频测试,可以获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,所述人头转向空间参数为在测试过程中以被测试对象的人头中心点为原点,所述被测试对象的人头位移参数,所述被测试对象在听到不同的测试音频帧会有不同的反应,这些反应会以人头转向的位置、角度、转动持续时间及脑电波的波动等参数体现,通过所述人头转向空间参数、转向持续时间及脑电波参数可以实时获得被测试人员在听到当前测试音频帧的音频关注度,通过所述音频关注度可以分析出哪些声音是人体感兴趣的,而哪些声音不是人体感兴趣的;另外,所述被测试对象也不局限于一个,可以是不同性别、不同年龄、不同职业、不同人种中挑选出的合适的实验测试对象,通过对不同实验测试对象的测试,可以获得大量的测试数据,从中可以挑选出较为合适的实验测试对象作为所述被测试对象,所述被测试对象当然也可以为多个,本实施例对此不加以限制。
步骤S30、将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧。
应当理解的是,所述音频关注帧为所述被测试对象关注的声音对应的音频帧,所述预设关注度阈值为预先设置的阈值,用来判断所述当前测试音频帧是否为真正被测试人员感兴趣的声音的判定值,所述预设关注度阈值可以是通过大量实验数据或训练确定的合适的关注度阈值,也可以是技术人员根据实际操作情况确定的合适的关注度阈值,也可以是用户自行拟定的关注度阈值,当然还可以是通过其他方式确定的关注度阈值,本实施例对此不加以限制。
在具体实现中,所述音频关注度的高低由所述人头转向空间参数、转向持续时间及脑电波参数决定,一般的,所述人头转向空间参数对应的空间位移越大,和/或所述转向持续时间对应的时间越长,和/或所述脑电波参数对应的脑电波波动幅度越大,则决定所述音频关注度越高,所述当前测试音频帧越有可能是所述被测试对象感兴趣的声音;反之,所述人头转向空间参数对应的空间位移越小,和/或所述转向持续时间对应的时间越短,和/或所述脑电波参数对应的脑电波波动幅度越小,则决定所述音频关注度越低,所述当前测试音频帧越有可能是所述被测试对象不感兴趣的声音;通过将所述音频关注度与预设关注度阈值比较能够更好的获得哪些音频帧是被测试对象关注的音频帧,从而快速获得测试结果,并且保证测试结果的精确度。
本实施例通过上述方案,通过将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,使应用音频关注度参数的场景更加符合实际生活,提升了用户体验。
进一步地,图3为本发明三维空间音频关注度分析方法第二实施例的流程示意图,如图3所示,基于第一实施例提出本发明三维空间音频关注度分析方法第二实施例,在本实施例中,所述步骤S20具体包括以下步骤:
步骤S21、接收通过所述目标音频设备中人头转向检测器采集所述被测试对象的人头转向空间参数及转向持续时间,并接收通过所述目标音频设备中脑电波监测器采集所述被测试对象的脑电波参数,其中,所述人头转向空间参数包括空间位置参数和角度参数。
可以理解的是,人类在听到关注的声音时会自动调整人头的方向,如果不是关注的声音则不会,同时,人脑对关注音频的反应也会体现在脑电波的变化上;其中,所述人头转向空间参数及转向持续时间可以通过人头转向检测器采集,所述人头转向检测器可以采集所述被测试对象在听到所述测试音频帧对应的声音后所表现出来的人头转动动作对应的人头转向空间参数和转向持续时间,所述人头转向空间参数包括空间位置参数和角度参数。
在具体实现中,所述人头转向空间参数包括空间位置参数和角度参数。这里的空间位置参数包括X、Y、Z三个方向,角度参数包括滚转角,俯仰角和偏航角,一般是以人头中心点为原点O,人脸正面面对前方时,左耳和右耳的连线为X轴坐标线,头部围绕X轴方向做抬头或者低头运动所转动的角度为俯仰角,垂直正交于X轴并垂直于地面的轴定义为Y轴,头部围绕Y轴方向向左或向右转动的角度为偏航角,垂直正交于XOY平面的坐标轴为Z轴,头部围绕Z轴方向逆时针或者顺时针转动的角度为滚转角;可以通过传感器或者摄像设备获得转向持续时间,当然也可以通过其他方式获得,本实施例对此不加以限制。
应当理解的是,所述脑电波参数可以是通过脑电波监测器采集,一般的,通过脑电波监测器对所述被测试对象的脑电波进行追踪和监测,脑电波可以划分为四个波段δ(1-3Hz),θ(4-7Hz),α(8-13Hz),β(14-30Hz),除此之外,人在专注于某一事时,常可见一种频率较β波更高的γ波,其频率为30~80Hz,波幅范围不定。
步骤S22、将所述人头转向空间参数、转向持续时间及脑电波参数代入至预设关注度计算公式中,获得当前测试音频帧的音频关注度。
需要说明的是,所述预设关注度计算公式为预先设置的用于计算各个音频帧对应的音频关注度,通过所述人头转向空间参数、转向持续时间及脑电波参数以及预设关注度计算公式,可以快速获得当前测试音频帧的音频关注度。
进一步地,所述步骤S22具体包括以下步骤:
将所述人头转向空间参数中的角度参数、转向持续时间及脑电波参数代入至如下预设关注度计算公式中,获得当前测试音频帧的音频关注度:
ak=λ1(Dr+Dp+Dy)+λ2Dt3(Dδ+Dθ+Dα+Dβ+Dγ)
其中,ak为当前测试音频帧的音频关注度,λ1、λ2、λ3为权重调整因子,且λ123=1,Dr为所述角度参数中的滚转角参数,Dp为所述角度参数中的俯仰角参数,Dy为所述角度参数中的偏航角参数,Dδ、Dθ、Dα、Dβ、Dγ为脑电波参数,Dt为转向持续时间。
可以理解的是,通过将所述人头转向空间参数中的角度参数、转向持续时间及脑电波参数代入至所述预设关注度计算公式中,可以快速获得比较准确的当前测试音频帧对应的音频关注度,通过所述音频关注度可以分析出哪些声音是人体感兴趣的,而哪些声音不是人体感兴趣的,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,例如虚拟现实应用中,使虚拟的场景更加逼真,带给用户更好的视听感受。
本实施例通过上述方案,通过接收通过所述目标音频设备中人头转向检测器采集所述被测试对象的人头转向空间参数及转向持续时间,并接收通过所述目标音频设备中脑电波监测器采集所述被测试对象的脑电波参数,其中,所述人头转向空间参数包括空间位置参数和角度参数;将所述人头转向空间参数、转向持续时间及脑电波参数代入至预设关注度计算公式中,获得当前测试音频帧的音频关注度,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,使应用音频关注度参数的场景更加符合实际生活,提升了用户体验。
进一步地,图4为本发明三维空间音频关注度分析方法第三实施例的流程示意图,如图4所示,基于第二实施例提出本发明三维空间音频关注度分析方法第三实施例,在本实施例中,所述步骤S30之前,所述三维空间音频关注度分析方法还包括以下步骤:
步骤S301、从预设样本三维音频训练序列中依次输入样本音频帧至所述目标音频设备,获得样本人头转向空间参数、样本转向持续时间及样本脑电波参数。
需要说明的是,所述样本音频帧为进行实验训练的音频帧,所述预设样本三维音频训练序列为预先设置的训练序列,用于将样本音频帧依次输入至目标音频设备,获得样本参数,即获得样本人头转向空间参数、样本转向持续时间及样本脑电波参数,同样也可以通过人头转向检测器采集所述被测试对象的样本人头转向空间参数及样本转向持续时间,通过脑电波监测器采集所述被测试对象的样本脑电波参数。
步骤S302、将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果。
可以理解的是,所述预设样本阈值为预先设置的阈值,用于判断所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数是否为判断所述当前测试音频帧为音频关注帧的参考参数,通过与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,可以获得对应的比较结果。
进一步地,所述步骤S302具体包括以下步骤:
将预设样本空间阈值与所述样本人头转向空间参数进行比较,获得第一比较差值结果;
将预设样本时间阈值与所述样本转向持续时间进行比较,获得第二比较差值结果;
将预设样本脑电波阈值与所述样本脑电波参数进行比较,获得第三比较差值结果;
根据所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果确定比较结果。
应当理解的是,所述预设样本空间阈值、预设样本时间阈值和预设样本脑电波阈值为与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数一一对应的阈值,通过阈值与这些参数的比较可以为确定所述当前测试音频帧是否为音频关注帧做参考,在实际操作中,因为被测试对象在听到关注声音时,人头转向空间参数可能只有一个角度参数发生变化,因此,人头转向空间参数中的角度参数只设定同一个阈值,并且只要有角度参数中的滚转角,俯仰角和偏航角一个达到阈值,则认为满足条件。
需要说明的是,所述第一比较差值结果为所述预设样本空间阈值与所述样本人头转向空间参数的差值,所述第二比较差值结果为所述预设样本时间阈值与所述样本转向持续时间的差值,所述第三比较差值结果为所述预设样本脑电波阈值与所述样本脑电波参数的差值,所述比较结果为所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果的集合。
进一步地,所述步骤S302之前,所述三维空间音频关注度分析方法还包括以下步骤:
接收通过音频信号接收器采集所述被测试对象的空间音频参数,所述空间音频参数包括双耳强度差、双耳时间差及双耳相关度;
对所述空间音频参数、所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数进行分析,获得所述空间音频参数与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数的目标映射关系;
根据所述目标映射关系确定预设样本阈值。
需要说明的是,所述音频信号接收器可以采集到所述被测试对象的空间音频参数,一般可以设置在被测试对象的左右耳朵处,所述音频信号接收器要求进行高精度的音频信号进行接收,接收到相应的音频信号后进行计算获得相应的空间音频参数,所述空间音频参数包括双耳强度差(Interaural LevelDifference,ILD)、双耳时间差(InterauralTime Difference,ITD)及双耳相关度(Interaural Correlation,IC),通过将所述空间音频参数中的双耳强度差、双耳时间差及双耳相关度与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数进行分析,可以获得所述双耳强度差、双耳时间差及双耳相关度与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数的目标映射关系,根据所述目标映射关系可以设置所述预设样本阈值,从而保证了音频关注度的精确度,使音频关注帧的确定更加准确,在虚拟现实的应用中能够有效提升虚拟现实中的用户体验,更加符合实际生活的真实场景。
步骤S303、根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值。
可以理解的是,根据所述比较结果可以确定目标关注度,所述目标关注度即作为所述预设关注度阈值,用于判断所述当前测试音频帧是否为音频关注帧。
进一步地,所述步骤S303具体包括以下步骤:
根据所述比较结果中的所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果结合预设关注度运算因子确定目标关注度;
将所述目标关注度作为预设关注度阈值。
应当理解的是,所述预设关注度运算因子为用于计算目标关注度预先设置的计算因子,通过所述预设关注度运算因子对所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果进行计算,可以确定目标关注度,所述目标关注度即作为所述预设关注度阈值,用于判断所述当前测试音频帧是否为音频关注帧。
本实施例通过上述方案,从预设样本三维音频训练序列中依次输入样本音频帧至所述目标音频设备,获得样本人头转向空间参数、样本转向持续时间及样本脑电波参数;将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果;根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,保证了音频关注度的精确度,使音频关注帧的确定更加准确,为各种应用提供良好的参数参考,使应用音频关注度参数的场景更加符合实际生活,提升了用户体验。
基于本发明三维空间音频关注度分析方法的上述实施例,本发明进一步提供一种三维空间音频关注度分析系统。
参照图5,图5为本发明三维空间音频关注度分析系统第一实施例的功能模块图。
本发明三维空间音频关注度分析系统第一实施例中,该三维空间音频关注度分析系统包括:
音频帧输入模块10,用于将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备。
需要说明的是,所述预设三维音频测试序列为预先设置的音频训练序列,音频训练序列的排序情况可以根据实际情况进行调整,所述音频训练序列可以是通过大量实验数据或训练确定的合适的音频训练序列,也可以是技术人员根据实际操作情况确定的合适的音频训练序列,也可以是用户自行拟定的音频训练序列,当然还可以是通过其他方式确定的音频训练序列,本实施例对此不加以限制。
可以理解的是,所述测试音频帧为测试音频中采样的音频码流单位,所述测试音频帧的数量和长度可以是自行拟定的,可以将测试音频分段为多个测试音频帧,通过按照所述预设三维音频测试序列,可以依次向所述目标音频设备输入测试音频的不同测试音频帧,从而根据不同的测试音频帧获得不同的测试数据,通过大量的测试生成的测试数据可以确定哪些声音是人类比较关注的声音,哪些为不是很关注的声音,从而可以将这些数据应用在不同的场景里,例如虚拟现实的应用中,如果使用更多的人类比较关注的声音,则可以使虚拟现实的场景更加真实,有效提升用户体验。
应当理解的是,所述目标音频设备为用于测试所述被测试对象的各种测试参数的设备,即所述被测试对象通过所述目标音频设备接收到所述测试音频帧后,通过所述目标音频设备收集所述被测试对象的各种测试参数,例如人头转向的测试参数,以及被测试对象的脑电波测试参数,所述目标音频设备还可以是包括更多部件或更少部件用于测试所述被测试对象的各种测试参数的设备,本实施例对此不加以限制。
关注度获取模块20,用于获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度。
可以理解的是,通过所述目标音频测试,可以获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,所述人头转向空间参数为在测试过程中以被测试对象的人头中心点为原点,所述被测试对象的人头位移参数,所述被测试对象在听到不同的测试音频帧会有不同的反应,这些反应会以人头转向的位置、角度、转动持续时间及脑电波的波动等参数体现,通过所述人头转向空间参数、转向持续时间及脑电波参数可以实时获得被测试人员在听到当前测试音频帧的音频关注度,通过所述音频关注度可以分析出哪些声音是人体感兴趣的,而哪些声音不是人体感兴趣的;另外,所述被测试对象也不局限于一个,可以是不同性别、不同年龄、不同职业、不同人种中挑选出的合适的实验测试对象,通过对不同实验测试对象的测试,可以获得大量的测试数据,从中可以挑选出较为合适的实验测试对象作为所述被测试对象,所述被测试对象当然也可以为多个,本实施例对此不加以限制。
关注帧确定模块30,用于将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧。
应当理解的是,所述音频关注帧为所述被测试对象关注的声音对应的音频帧,所述预设关注度阈值为预先设置的阈值,用来判断所述当前测试音频帧是否为真正被测试人员感兴趣的声音的判定值,所述预设关注度阈值可以是通过大量实验数据或训练确定的合适的关注度阈值,也可以是技术人员根据实际操作情况确定的合适的关注度阈值,也可以是用户自行拟定的关注度阈值,当然还可以是通过其他方式确定的关注度阈值,本实施例对此不加以限制。
在具体实现中,所述音频关注度的高低由所述人头转向空间参数、转向持续时间及脑电波参数决定,一般的,所述人头转向空间参数对应的空间位移越大,和/或所述转向持续时间对应的时间越长,和/或所述脑电波参数对应的脑电波波动幅度越大,则决定所述音频关注度越高,所述当前测试音频帧越有可能是所述被测试对象感兴趣的声音;反之,所述人头转向空间参数对应的空间位移越小,和/或所述转向持续时间对应的时间越短,和/或所述脑电波参数对应的脑电波波动幅度越小,则决定所述音频关注度越低,所述当前测试音频帧越有可能是所述被测试对象不感兴趣的声音;通过将所述音频关注度与预设关注度阈值比较能够更好的获得哪些音频帧是被测试对象关注的音频帧,从而快速获得测试结果,并且保证测试结果的精确度。
本实施例通过上述方案,通过将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,使应用音频关注度参数的场景更加符合实际生活,提升了用户体验。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有三维空间音频关注度分析程序,所述三维空间音频关注度分析程序被处理器执行时实现如下操作:
将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;
获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;
将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧。
进一步地,所述三维空间音频关注度分析程序被处理器执行时还实现如下操作:
接收通过所述目标音频设备中人头转向检测器采集所述被测试对象的人头转向空间参数及转向持续时间,并接收通过所述目标音频设备中脑电波监测器采集所述被测试对象的脑电波参数,其中,所述人头转向空间参数包括空间位置参数和角度参数;
将所述人头转向空间参数、转向持续时间及脑电波参数代入至预设关注度计算公式中,获得当前测试音频帧的音频关注度。
进一步地,所述三维空间音频关注度分析程序被处理器执行时还实现如下操作:
将所述人头转向空间参数中的角度参数、转向持续时间及脑电波参数代入至如下预设关注度计算公式中,获得当前测试音频帧的音频关注度:
ak=λ1(Dr+Dp+Dy)+λ2Dt3(Dδ+Dθ+Dα+Dβ+Dγ)
其中,ak为当前测试音频帧的音频关注度,λ1、λ2、λ3为权重调整因子,且λ123=1,Dr为所述角度参数中的滚转角参数,Dp为所述角度参数中的俯仰角参数,Dy为所述角度参数中的偏航角参数,Dδ、Dθ、Dα、Dβ、Dγ为脑电波参数,Dt为转向持续时间。
进一步地,所述三维空间音频关注度分析程序被处理器执行时还实现如下操作:
从预设样本三维音频训练序列中依次输入样本音频帧至所述目标音频设备,获得样本人头转向空间参数、样本转向持续时间及样本脑电波参数;
将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果;
根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值。
进一步地,所述三维空间音频关注度分析程序被处理器执行时还实现如下操作:
将预设样本空间阈值与所述样本人头转向空间参数进行比较,获得第一比较差值结果;
将预设样本时间阈值与所述样本转向持续时间进行比较,获得第二比较差值结果;
将预设样本脑电波阈值与所述样本脑电波参数进行比较,获得第三比较差值结果;
根据所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果确定比较结果。
进一步地,所述三维空间音频关注度分析程序被处理器执行时还实现如下操作:
根据所述比较结果中的所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果结合预设关注度运算因子确定目标关注度;
将所述目标关注度作为预设关注度阈值。
进一步地,所述三维空间音频关注度分析程序被处理器执行时还实现如下操作:
接收通过音频信号接收器采集所述被测试对象的空间音频参数,所述空间音频参数包括双耳强度差、双耳时间差及双耳相关度;
对所述空间音频参数、所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数进行分析,获得所述空间音频参数与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数的目标映射关系;
根据所述目标映射关系确定预设样本阈值。
本实施例通过上述方案,通过将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧,通过所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数获得的关注度更符合人脑关注的声音到达人耳的实际情况,提高了音频关注度的准确性,为各种应用提供良好的参数参考,使应用音频关注度参数的场景更加符合实际生活,提升了用户体验。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种三维空间音频关注度分析方法,其特征在于,所述三维空间音频关注度分析方法包括:
服务器将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;
获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;
将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧;
所述将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧之前,还包括:
从预设样本三维音频训练序列中依次输入样本音频帧至所述目标音频设备,获得样本人头转向空间参数、样本转向持续时间及样本脑电波参数;
将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果;
根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值;
所述根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度的步骤,包括:
将所述人头转向空间参数中的角度参数、转向持续时间及脑电波参数代入至如下预设关注度计算公式中,获得当前测试音频帧的音频关注度:
ak=λ1(Dr+Dp+Dy)+λ2Dt3(Dδ+Dθ+Dα+Dβ+Dγ)
其中,ak为当前测试音频帧的音频关注度,λ1、λ2、λ3为权重调整因子,且λ123=1,Dr为所述角度参数中的滚转角参数,Dp为所述角度参数中的俯仰角参数,Dy为所述角度参数中的偏航角参数,Dδ、Dθ、Dα、Dβ、Dγ为脑电波参数,Dt为转向持续时间。
2.如权利要求1所述的三维空间音频关注度分析方法,其特征在于,所述获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度,具体包括:
接收通过所述目标音频设备中人头转向检测器采集所述被测试对象的人头转向空间参数及转向持续时间,并接收通过所述目标音频设备中脑电波监测器采集所述被测试对象的脑电波参数,其中,所述人头转向空间参数包括空间位置参数和角度参数;
将所述人头转向空间参数、转向持续时间及脑电波参数代入至预设关注度计算公式中,获得当前测试音频帧的音频关注度。
3.如权利要求2所述的三维空间音频关注度分析方法,其特征在于,所述将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果,具体包括:
将预设样本空间阈值与所述样本人头转向空间参数进行比较,获得第一比较差值结果;
将预设样本时间阈值与所述样本转向持续时间进行比较,获得第二比较差值结果;
将预设样本脑电波阈值与所述样本脑电波参数进行比较,获得第三比较差值结果;
根据所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果确定比较结果。
4.如权利要求3所述的三维空间音频关注度分析方法,其特征在于,所述根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值,具体包括:
根据所述比较结果中的所述第一比较差值结果、所述第二比较差值结果和所述第三比较差值结果结合预设关注度运算因子确定目标关注度;
将所述目标关注度作为预设关注度阈值。
5.如权利要求1-4中任一项所述的三维空间音频关注度分析方法,其特征在于,所述将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果之前,所述三维空间音频关注度分析方法还包括:
接收通过音频信号接收器采集所述被测试对象的空间音频参数,所述空间音频参数包括双耳强度差、双耳时间差及双耳相关度;
对所述空间音频参数、所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数进行分析,获得所述空间音频参数与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数的目标映射关系;
根据所述目标映射关系确定预设样本阈值。
6.一种三维空间音频关注度分析系统,其特征在于,所述三维空间音频关注度分析系统包括:
音频帧输入模块,用于将预设三维音频测试序列的测试音频帧依次发送至目标音频设备,所述目标音频设备为被测试对象接收所述测试音频帧的设备;
关注度获取模块,用于获得所述目标音频设备上传的所述被测试对象的人头转向空间参数、转向持续时间及脑电波参数,根据所述人头转向空间参数、转向持续时间及脑电波参数获得当前测试音频帧的音频关注度;
关注帧确定模块,用于将所述音频关注度与预设关注度阈值比较,在所述音频关注度大于所述预设关注度阈值时,判定所述当前测试音频帧为音频关注帧;
所述关注帧确定模块,还用于从预设样本三维音频训练序列中依次输入样本音频帧至所述目标音频设备,获得样本人头转向空间参数、样本转向持续时间及样本脑电波参数,将预设样本阈值与所述样本人头转向空间参数、样本转向持续时间及样本脑电波参数分别比较,获得比较结果,根据所述比较结果确定目标关注度,将所述目标关注度作为预设关注度阈值;
所述关注度获取模块,还用于将所述人头转向空间参数中的角度参数、转向持续时间及脑电波参数代入至如下预设关注度计算公式中,获得当前测试音频帧的音频关注度:
ak=λ1(Dr+Dp+Dy)+λ2Dt3(Dδ+Dθ+Dα+Dβ+Dγ)
其中,ak为当前测试音频帧的音频关注度,λ1、λ2、λ3为权重调整因子,且λ123=1,Dr为所述角度参数中的滚转角参数,Dp为所述角度参数中的俯仰角参数,Dy为所述角度参数中的偏航角参数,Dδ、Dθ、Dα、Dβ、Dγ为脑电波参数,Dt为转向持续时间。
7.一种服务器,其特征在于,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的三维空间音频关注度分析程序,所述三维空间音频关注度分析程序配置为实现如权利要求1至5中任一项所述的三维空间音频关注度分析方法的步骤。
8.一种存储介质,其特征在于,所述存储介质上存储有三维空间音频关注度分析程序,所述三维空间音频关注度分析程序被处理器执行时实现如权利要求1至5中任一项所述的三维空间音频关注度分析方法的步骤。
CN201811049576.1A 2018-09-07 2018-09-07 三维空间音频关注度分析方法、系统、服务器及存储介质 Active CN109144271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811049576.1A CN109144271B (zh) 2018-09-07 2018-09-07 三维空间音频关注度分析方法、系统、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811049576.1A CN109144271B (zh) 2018-09-07 2018-09-07 三维空间音频关注度分析方法、系统、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN109144271A CN109144271A (zh) 2019-01-04
CN109144271B true CN109144271B (zh) 2021-07-20

Family

ID=64823994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811049576.1A Active CN109144271B (zh) 2018-09-07 2018-09-07 三维空间音频关注度分析方法、系统、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN109144271B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245326B (zh) * 2019-06-13 2023-10-24 武汉轻工大学 基于神经网络的数据估算方法、设备、存储介质及装置
CN113040757B (zh) * 2021-03-02 2022-12-20 江西台德智慧科技有限公司 头部姿态监测方法、装置、头部智能穿戴设备及存储介质
CN113641246A (zh) * 2021-08-25 2021-11-12 兰州乐智教育科技有限责任公司 用户专注度的确定方法、装置、vr设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171133A (ja) * 2004-12-14 2006-06-29 Sony Corp 楽曲データ再構成装置、楽曲データ再構成方法、音楽コンテンツ再生装置および音楽コンテンツ再生方法
JP4626376B2 (ja) * 2005-04-25 2011-02-09 ソニー株式会社 音楽コンテンツの再生装置および音楽コンテンツ再生方法
CN101499300B (zh) * 2009-03-06 2011-08-17 武汉大学 一种基于空间音频参数的音频关注度分析装置
CN102426768B (zh) * 2011-08-16 2016-02-10 海尔集团公司 基于体电波控制电子设备的系统及方法
US20160284363A1 (en) * 2015-03-24 2016-09-29 Intel Corporation Voice activity detection technologies, systems and methods employing the same

Also Published As

Publication number Publication date
CN109144271A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN109144271B (zh) 三维空间音频关注度分析方法、系统、服务器及存储介质
Baumgartner et al. Modeling sound-source localization in sagittal planes for human listeners
Carlile et al. The nature and distribution of errors in sound localization by human listeners
CN107968689B (zh) 基于无线通信信号的感知识别方法及装置
CN108596016B (zh) 一种基于深度神经网络的个性化头相关传输函数建模方法
US10963741B2 (en) Control device, system and method for determining the perceptual load of a visual and dynamic driving scene
CN112346050B (zh) 基于Wi-Fi设备的跌倒检测方法及系统
CN111417342B (zh) 脑网络的活动估计系统、方法和存储介质
Schönstein et al. HRTF selection for binaural synthesis from a database using morphological parameters
JP2010011433A (ja) 音源分離及び表示方法並びにシステム
US20200143183A1 (en) Control device, system and method for determining the perceptual load of a visual and dynamic driving scene
CN107811652B (zh) 自动调整参数的超声成像方法及系统
Zhang et al. Statistical method to identify key anthropometric parameters in HRTF individualization
JP2022547525A (ja) 音声信号を生成するためのシステム及び方法
GB2584152A (en) Method and system for generating an HRTF for a user
JP2016212066A (ja) 移動体端末、センサ値補間方法、センサ値補間プログラム、行動認識装置および行動認識システム
KR20210068409A (ko) 정보 처리 장치, 정보 처리 방법 및 정보 처리 프로그램
JP2014191616A (ja) 独居高齢者の見守り方法、装置およびサービス提供システム
CN110868912A (zh) 神经生理信号中的伪影的移除
Narayanan et al. EEG miniaturization limits for stimulus decoding with EEG sensor networks
CN112863533A (zh) 医疗成像设备中语音信号获取方法、装置、设备和介质
Chung et al. A performance adequate computational model for auditory localization
Battista et al. Calibration and uncertainty evaluation using Monte Carlo method of a simple 2D sound localization system
CN115396769A (zh) 无线耳机及其音量调节方法
CN105786336A (zh) 一种终端触摸屏流畅度评定方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant