CN117880732A - 一种空间音频录制方法、装置及存储介质 - Google Patents

一种空间音频录制方法、装置及存储介质 Download PDF

Info

Publication number
CN117880732A
CN117880732A CN202211250667.8A CN202211250667A CN117880732A CN 117880732 A CN117880732 A CN 117880732A CN 202211250667 A CN202211250667 A CN 202211250667A CN 117880732 A CN117880732 A CN 117880732A
Authority
CN
China
Prior art keywords
audio data
audio
sound source
spatial
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211250667.8A
Other languages
English (en)
Inventor
余俊飞
史润宇
刘念
吕雪洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN202211250667.8A priority Critical patent/CN117880732A/zh
Publication of CN117880732A publication Critical patent/CN117880732A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本公开是关于一种空间音频录制方法、装置及存储介质。空间音频录制装置包括:包括:音频数据采集模块,用于获取音频数据;音频信号滤波模块,用于对音频数据进行滤波处理;声源角度测算模块,用于对音频数据采集模块获取的音频数据进行预处理,并基于预处理后的音频数据确定音频数据的声源角度;空间音频渲染模块,用于通过声源角度测算模块确定的音频数据的声源角度和音频信号滤波模块滤波处理后的音频数据,进行空间音频渲染,得到空间音频数据。通过本公开能够使音响在录制空间音频的过程中实时录制音频并获取声源的空间角度信息,从而提升智能音响在空间音频录制过程中的环境适应性,大幅增强空间音频的立体感,最终使用户获得逼真的环绕式聆听体验。

Description

一种空间音频录制方法、装置及存储介质
技术领域
本公开涉及空间音频录制领域,尤其涉及一种空间音频录制方法、装置及存储介质。
背景技术
目前的智能音响等音频播放设备播放的空间音频通常由人工与专业设备搭配进行录制。
相关技术中,通过人为主观预测空间信息并使用专业音效控制软件获取空间音频信息,通过单个或多个麦克风获取音频文件,通过空间音频信息对音频文件进行渲染得到空间音频。
但是在这种空间音频制作过程中,需要面对多种多样的应用场景和使用环境,操作复杂且全程需要人工参与,效率低、制作成本高昂且不能对空间音频进行有效的自适应调整。
发明内容
为克服相关技术中存在的问题,本公开提供一种空间音频录制方法、装置及存储介质。
根据本公开实施例的第一方面,提供一种空间音频录制装置,包括:音频数据采集模块,用于获取音频数据;音频信号滤波模块,用于对所述音频数据进行滤波处理;声源角度测算模块,用于对所述音频数据采集模块获取的音频数据进行预处理,并基于预处理后的音频数据确定音频数据的声源角度;空间音频渲染模块,用于通过所述声源角度测算模块确定的音频数据的声源角度和所述音频信号滤波模块滤波处理后的音频数据,进行空间音频渲染,得到空间音频数据。
一种实施方式中,所述声源角度测算模块采用如下方式对所述音频数据采集模块获取的音频数据进行预处理:对所述音频数据采集模块获取的音频数据进行降噪处理;和/或对所述音频数据采集模块获取的音频数据进行分帧处理。
一种实施方式中,所述声源角度测算模块采用如下方式基于预处理后的音频数据确定所述音频数据的声源角度:确定所述预处理后的音频数据对应每一帧音频数据的信号协方差矩阵;对所述信号协方差矩阵进行特征值分解,得到信号特征值与噪声特征值;基于所述信号特征值与所述噪声特征值,确定每一帧音频数据的角度谱函数;将所述每一帧音频数据的角度谱函数最大值对应的角度,确定为声源在所述每一帧音频数据的声源角度。
一种实施方式中,所述声源角度测算模块采用如下方式基于所述信号特征值与所述噪声特征值,确定每一帧音频数据的角度谱函数:基于所述信号特征值和所述噪声特征值,确定信号子空间和噪声子空间;基于所述信号子空间和所述噪声子空间,确定每一帧音频数据的角度谱函数。
根据本公开实施例的第二方面,提供一种空间音频录制方法,包括:获取音频数据;对所述音频数据进行滤波处理:对所述音频数据采集模块获取的音频数据进行预处理,并基于预处理后的音频数据确定音频数据的声源角度;通过所述声源角度测算模块确定的音频数据的声源角度和所述音频信号滤波模块滤波处理后的音频数据,进行空间音频渲染,得到空间音频数据。
一种实施方式中,所述对所述音频数据采集模块获取的音频数据进行预处理,包括:对所述音频数据采集模块获取的音频数据进行降噪处理;和/或对所述音频数据采集模块获取的音频数据进行分帧处理。
一种实施方式中,所述基于预处理后的音频数据确定所述音频数据的声源角度,包括:确定所述预处理后的音频数据对应每一帧音频数据的信号协方差矩阵;对所述信号协方差矩阵进行特征值分解,得到信号特征值与噪声特征值;基于所述信号特征值与所述噪声特征值,确定每一帧音频数据的角度谱函数;将所述每一帧音频数据的角度谱函数最大值对应的角度,确定为声源在所述每一帧音频数据的声源角度。
一种实施方式中,所述基于所述信号特征值与所述噪声特征值,确定每一帧音频数据的角度谱函数,包括:基于所述信号特征值和所述噪声特征值,确定信号子空间和噪声子空间;基于所述信号子空间和所述噪声子空间,确定每一帧音频数据的角度谱函数。
根据本公开实施例的第三方面,提供一种空间音频录制装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行前述任意一项所述的空间音频录制方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行前述任意一项所述的空间音频录制方法。
本公开的实施例提供的技术方案可以包括以下有益效果:通过获取到的音频数据的声源角度和滤波处理后的音频数据,进行空间音频渲染,能够使音响在录制空间音频的过程中实时录制音频并获取声源的空间角度信息,从而提升智能音响在空间音频录制过程中的环境适应性,能够增强空间音频的立体感,最终使用户获得逼真的环绕式聆听体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种空间音频录制方法的流程图。
图2是根据一示例性实施例示出的一种空间音频录制装置100的框图。
图3是根据一示例性实施例示出的一种空间音频录制方法的流程图。
图4是根据一示例性实施例示出的一种空间音频录制方法的流程图。
图5是根据一示例性实施例示出的一种空间音频录制方法的流程图。
图6是根据本公开一示例性实施例示出的一种对音频数据进行优化处理的方法流程图。
图7示出了本公开一示例性实施例中示出的空间音频录制方法的流程图。
图8是根据一示例性实施例示出的一种空间音频录制装置200的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。
本公开应用于空间音频录制领域,能够根据所处环境进行自适应实时进行声源角度测量。
本公开实施例提供一种空间音频录制装置,空间音频录制装置能够在录制空间音频的过程中实时录制音频并获取音频数据的声源角度即声源与麦克风等音频录制设备的相对角度,以确定声源的空间角度信息。基于声源角度以及滤波处理后的音频数据进行空间渲染,得到空间音频数据。通过本公开,能够提升智能音响在空间音频录制过程中的环境适应性,增强空间音频的立体感,最终使用户获得逼真的环绕式聆听体验。
本公开实施例中,使用音频录制设备录制环境音以及该环境中的人或物等声源发出的声音。其中,音频录制设备包括但不限于麦克风,还可以是录音棒、录音笔、微型录音器、平面录音板、网络摄像录音头和专业录音设备等可以录制并储存音频数据的设备。
图1是相关技术中空间音频录制方法流程图。如图1所示,相关技术中通过人为预测空间信息并使用专业音效控制软件获取空间音频信息。通过单个或多个麦克风获取音频文件,通过人工方式为多个声音设定音源(将发声的人或物编号为1、2、3…),确定音源相对麦克风的相对角度信息即空间音频信息,通过空间音频信息对经过预处理(滤波降噪、分帧等)的音频文件进行渲染得到空间音频。但是在这种空间音频制作过程中,需要面对多种多样的应用场景和使用环境,通过人工确定音源并为音源编号操作复杂效率低、制作成本高昂,且不能对空间音频进行有效的自适应调整。
可以理解的是,本公开实施例提供的空间音频录制装置为了实现功能,其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤,本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本公开实施例的技术方案的范围。
图2是根据一示例性实施例示出的一种空间音频录制装置100的框图。该空间音频录制装置100应用于终端,装置100包括音频数据采集模块101、音频信号滤波模块102、声源角度测算模块103和空间音频渲染模块104。
音频数据采集模块101,用于获取音频数据;
其中,用于获取音频数据的音频数据采集设备(一般为多个麦克风,也可以是其他可以录制并储存音频数据的设备)设置为常开模式,持续的获取所处环境内的环境音和人/物等声源发出的声音,作为初始音频数据,经过滤波处理后再经过声源角度的渲染得到空间音频数据。例如,采集会议室中每个成员的声音;又例如,采集行人与过往车辆的声音。
音频信号滤波模块102,用于对音频数据采集模块101获取的音频数据进行滤波处理;
声源角度测算模块103,用于对音频数据采集模块101获取的音频数据进行预处理,并基于预处理后的音频数据确定音频数据的声源角度;
其中,音频数据的声源角度为声源与音频数据采集设备的相对位置信息。
本公开实施例中,声源角度为声源与音频数据采集设备的相对角度,确定音源角度时需要对每帧的音频数据都进行相应的处理,便于后续得到空间音频数据。
空间音频渲染模块104,用于通过声源角度测算模块103确定的音频数据的声源角度和音频信号滤波模块102滤波处理后的音频数据,进行空间音频渲染,得到空间音频数据。
本公开实施例中,通过音频采集设备持续地采集音频数据。从采集到的音频数据中获取音频数据的空间信息,使用空间信息对滤波后的音频数据进行空间渲染,得到空间音频数据。能够提升音频设备在空间音频录制过程中的适应性,增强空间音频的立体感,提高用户体验。
一种实施方式中,所述声源角度测算模块103采用如下方式对所述音频数据采集模块获取的音频数据进行预处理:
对所述音频数据采集模块获取的音频数据进行降噪处理;
本公开实施例中,对音频数据采集到的音频数据进行预处理,使采集到的音频数据平稳化,便于空间信息的提取。其中,对音频数据进行降噪处理可以是基于自适应滤波器对音频数据进行降噪处理,以提高音频信号的信噪比。
一种实施方式中,本公开实施例中可以采用FIR滤波器和时域自适应滤波方法设置对音频数据进行降噪处理的自适应滤波器。
和/或对所述音频数据采集模块获取的音频数据进行分帧处理。
其中,音频信号是一个非平稳态过程,不能用处理平稳信号的数字信号处理技术对其进行分析处理,整体来看其特性及表征其本质特征的参数均是随时间而变化的。但从另一方面看,虽然音频具有时变特性,但在一个短时间范围内(认为在10-30ms的短时间内),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。故,本公开实施例中通过对音频数据进行分帧处理能够对整体上特征参数时刻变化(即整体上不稳定)的音频信号进行分割,分割为多个特性不变保持稳定的音频信号,以便于空间信息的获取。
一种实施方式中,声源角度测算模块103采用以如方式基于预处理后的音频数据确定音频数据的声源角度:
确定音频数据对应每一帧音频数据的信号协方差矩阵;
本公开实施例中,对麦克风等音频采集设备采集到的一帧信号设定为X,其采样点数设定为L,通过计算得到协方差矩阵R,可以用公式表达为:
对信号协方差矩阵进行特征值分解,得到信号特征值与噪声特征值;
本公开实施例中,对上述协方差矩阵进行特征值分解,即得到US与UN、A与B的值。其中,US为信号子空间,UN为噪声子空间,A和B为信号特征值和噪声特征值,信号子空间、噪声子空间、信号特征值和噪声特征值是确定声源角度的重要参数,基于以上参数可以构建角度谱函数,进而确定声源角度。
基于信号特征值与噪声特征值,确定每一帧音频数据的角度谱函数;
其中,基于信号特征值与噪声特征值得到的角度谱函数的公式为
将每一帧音频数据的角度谱函数最大值对应的角度,确定为声源在每一帧音频数据的声源角度。
本公开实施例一种实施方式中,利用谱峰搜索手段处理角度谱函数,得到角度谱函数中所有谱峰的值,对所有谱峰的值进行筛选比较,得到角度谱函数最大值对应的角度,即声源角度。声源角度能够反映声源与音频数据采集设备的相对位置信息即声源的空间信息。
例如,采用MUSIC(Multiple Signal Classification、多重信号分类)获取声源角度信息,MUSIC是一类空间谱估计算法。其思想是利用接收数据的协方差矩阵(Rx)进行特征分解,分离出信号子空间和噪声子空间,利用信号方向向量与噪声子空间的正交性来构成空间扫描谱,进行全域搜索谱峰,从而实现信号的参数估计。
本公开实施例中,通过构建协方差公式的方式提取音频信号的特征值,利用特征值构建空间谱函数,进而获取音频信号的空间信息。
一种实施方式中,声源角度测算模块103采用如下方式基于信号特征值与噪声特征值,确定每一帧音频数据的角度谱函数:
基于信号特征值和噪声特征值,确定信号子空间和噪声子空间;
其中,信号子空间、噪声子空间、信号特征值和噪声特征值是确定声源角度的重要参数,基于以上参数可以构建角度谱函数,进而确定声源角度。
基于所述信号子空间和和所述噪声子空间,确定每一帧音频数据的角度谱函数。
其中,音频数据的声源角度信息为声源与音频采集设备的相对位置信息。
基于相同的构思,本公开还提供一种空间音频录制方法。
图3是根据一示例性实施例示出的一种空间音频录制方法的流程图,如图2所示,该方法包括步骤S101至步骤S103。
在步骤S101中,获取音频数据。
在步骤S102中,对音频数据采集模块获取的音频数据进行滤波处理。
在步骤S103中,对音频数据采集模块获取的音频数据进行预处理,并基于预处理后的音频数据确定音频数据的声源角度。
在步骤S104中,通过声源角度测算模块确定的音频数据的声源角度和音频信号滤波模块滤波处理后的音频数据,进行空间音频渲染,得到空间音频数据。
一种实施方式中对音频数据采集模块获取的音频数据进行预处理,包括:对所述音频数据采集模块获取的音频数据进行降噪处理;和/或对所述音频数据采集模块获取的音频数据进行分帧处理。
本公开实施例以下对上述实施例中涉及的音频数据的声源角度的确定过程进行说明。
图4是根据一示例性实施例示出的一种空间音频录制方法的流程图,如图3所示,该方法包括步骤S201至步骤S204。
在步骤S201中,确定预处理后的音频数据对应每一帧音频数据的信号协方差矩阵。
在步骤S202中,对信号协方差矩阵进行特征值分解,得到信号特征值与噪声特征值。
在步骤S203中,基于信号特征值与噪声特征值,确定每一帧音频数据的角度谱函数。
在步骤S204中,将每一帧音频数据的角度谱函数最大值对应的角度,确定为声源在每一帧音频数据的声源角度。
本公开实施例以下对上述实施例中涉及的确定角度谱函数的过程进行说明。
图5是根据一示例性实施例示出的一种空间音频录制方法的流程图,如图5所示,该方法包括步骤S301至步骤S302。
在步骤S301中,基于信号特征值和噪声特征值,确定信号子空间和噪声子空间。
在步骤S302中,基于信号子空间和噪声子空间,确定每一帧音频数据的角度谱函数。
图6是根据本公开一示例性实施例示出的一种对音频数据进行优化处理的方法流程图。参阅图6所示,包括如下步骤。
在步骤S401中,对获取的音频数据进行自适应降噪处理。
在步骤S402中,对自适应降噪处理的音频数据进行分帧处理。
一示例中,本公开实施例中,将音频数据送入自适应滤波器,得到滤波处理后的音频数据。该滤波器主要用于提升音频数据的信噪比,降低音频数据中噪声的影响。滤波器通过迭代计算得到降噪后的音频数据,降噪的计算公式可以表示为:S_denoise=Ada_Filter(S)。其中,S表示初始音频数据,S_denoise表示降噪后的音频数据。此外,本公开所用滤波器Ada_Filter可以采用FIR滤波器和时域自适应滤波方法自行设计。
进一步的,将降噪后的信号S_denoise进行分帧,其中音频帧的时长为1秒,步长为0.5秒,这样就得到处理后信号S_pre。其中,S表示初始音频数据,S_denoise表示降噪后的音频数据,S_pre表示经过降噪与分帧处理后的音频数据即预处理后的音频数据。
本公开实施例中,将音频数据采集设备采集到的音频数据进行处理,获取到滤除噪声后的音频数据,并将滤除噪声后的音频数据划分为多个特性保持稳定的短时音频信号,以获取音频信号的空间信息。
其中,进行空间音频渲染时,需要使用每一帧的时刻音频数据的角度信息对滤波处理后的音频数据进行渲染。故,本公开实施例中,可以采用上述方式得到每一帧优化处理后的音频信号,并确定优化处理后的每一帧音频信号的声源角度。针对每一帧音频信号,基于确定的声源角度以及滤波处理后的音频信号进行空间音频渲染,得到空间音频数据。
本公开一示例性实施例中,以音频录制设备中可包括音频数据采集模块、角度测算模块、音频滤波模块和空间音频渲染模块为例进行说明
本公开实施例中,音频数据采集模块、角度测算模块、音频滤波模块和空间音频渲染模块在智能录音模式下为常开装置,设备运行期间持续录制环境音频并分析音视频内容及环境信息,并据此不断地计算、更新声源角度信息并渲染、保存空间音频信号。
图7示出了本公开一示例性实施例中示出的空间音频录制方法的流程图,如图6所示,
获取空间音频数据的流程为:对于角度测算模块,利用多个麦克风录制的环境声音S,并送入音频信号预处理模块;音频信号预处理模块将S按帧进行信号预处理后得到处理后的音频信号S_pre,并送入声源角度测算模块;声源角度测算模块对预处理后的多麦克风音频信号S_pre进行处理,得到声源在每帧时的角度信息;在音频滤波模块,利用自适应降噪模块对采集的音频信号进行降噪,得到滤波后的信号S_denoise;在空间音频渲染模块,利用每一帧时刻的角度信息Ang和滤波后的信号S_denoise进行空间音频渲染,最终得到空间音频数据SA。
本公开一示例性实施例中,音频数据采集模块、角度测算模块、音频滤波模块和空间音频渲染模块在智能录音模式下为常开装置,持续获取音频数据并处理音频数据,并不断地计算、获取声源角度并渲染、保存空间音频数据。对于角度测算模块,利用音频数据采集设备获取音频数据S,并将采集到的音频数据S送入音频信号预处理模块。
音频信号预处理模块将采集到的音频数据S按帧进行信号预处理后得到处理后的音频数据S_pre,并将处理后的音频数据S_pre送入声源角度测算模块。其中,音频预处理模块对音频数据进行处理,主要是降低信号中噪声的影响。具体为:首先将音频数据送入自适应滤波器,该滤波器以提升音频信号的信噪比为目标,通过迭代计算得到降噪后的音频数据S_denoise,其计算公式可表示为:S_denoise=Ada_Filter(S)该自适应滤波器Ada_Filter可以采用FIR滤波器和时域自适应滤波方法进行设计。然后将降噪后的音频数据S_denoise进行分帧,其中音频帧的时长为1秒,步长为0.5秒,这样就得到处理后的音频数据S_pre。
声源角度测算模块对预处理后的音频数据S_pre进行处理,得到声源在每帧时的声源角度。具体步骤为:对于音频数据采集设备采集到的的一帧音频数据X,其采样点数为L,计算得到信号协方差矩阵R,即然后对信号协方差矩阵R进行特征值分解,即/>其中,US为信号子空间,UN为噪声子空间,A和B为信号特征值和噪声特征值;进一步构造角度谱函数,即/>找到角度谱函数最大值对应的角度即为所求的声源角度。对每帧音频数据都采用上述进行处理,得到每一帧时刻音频数据的声源角度。
在音频滤波模块,利用自适应降噪模块对采集的音频数据进行降噪,过程与上述降噪流程相同,得到滤波后的音频数据S_denoise。
在空间音频渲染模块,利用每一帧时刻的声源角度和滤波后的音频数据S_denoise进行空间音频渲染,最终得到空间音频数据。
通过本公开一示例性实施例,能够使音频设备在录制空间音频的过程中实时录制音频并获取声源的空间角度信息,从而提升音频设备在空间音频录制过程中的环境适应性,大幅增强空间音频的立体感,最终使用户获得逼真的环绕式聆听体验。
根据本公开实施例的第三方面,提供一种空间音频录制装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为:执行前述任意一项的空间音频录制方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行前述任意一项的空间音频录制方法。
图8是根据一示例性实施例示出的一种用于拍照的装置200的框图。例如,装置200可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,装置200可以包括以下一个或多个组件:处理组件202,存储器204,电力组件206,多媒体组件208,音频组件210,输入/输出(I/O)的接口212,传感器组件214,以及通信组件216。
处理组件202通常控制装置200的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件202可以包括一个或多个处理器220来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件202可以包括一个或多个模块,便于处理组件202和其他组件之间的交互。例如,处理组件202可以包括多媒体模块,以方便多媒体组件208和处理组件202之间的交互。
存储器204被配置为存储各种类型的数据以支持在装置200的操作。这些数据的示例包括用于在装置200上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件206为装置200的各种组件提供电力。电力组件206可以包括电源管理系统,一个或多个电源,及其他与为装置200生成、管理和分配电力相关联的组件。
多媒体组件208包括在所述装置200和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件208包括一个前置摄像头和/或后置摄像头。当装置200处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件210被配置为输出和/或输入音频信号。例如,音频组件210包括一个麦克风(MIC),当装置200处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器204或经由通信组件216发送。在一些实施例中,音频组件210还包括一个扬声器,用于输出音频信号。
I/O接口212为处理组件202和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件214包括一个或多个传感器,用于为装置200提供各个方面的状态评估。例如,传感器组件214可以检测到装置200的打开/关闭状态,组件的相对定位,例如所述组件为装置200的显示器和小键盘,传感器组件214还可以检测装置200或装置200一个组件的位置改变,用户与装置200接触的存在或不存在,装置200方位或加速/减速和装置200的温度变化。传感器组件214可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件214还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件214还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件216被配置为便于装置200和其他设备之间有线或无线方式的通信。装置200可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件216还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器204,上述指令可由装置200的处理器220执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
可以理解的是,本公开中“多个”是指两个或两个以上,其它量词与之类似。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
进一步可以理解的是,术语“第一”、“第二”等用于描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开,并不表示特定的顺序或者重要程度。实际上,“第一”、“第二”等表述完全可以互换使用。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。
进一步可以理解的是,除非有特殊说明,“连接”包括两者之间不存在其他构件的直接连接,也包括两者之间存在其他元件的间接连接。
进一步可以理解的是,本公开实施例中尽管在附图中以特定的顺序描述操作,但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作,或是要求执行全部所示的操作以得到期望的结果。在特定环境中,多任务和并行处理可能是有利的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利范围来限制。

Claims (10)

1.一种空间音频录制装置,其特征在于,包括:
音频数据采集模块,用于获取音频数据;
音频信号滤波模块,用于对所述音频数据采集模块获取的音频数据进行滤波处理;
声源角度测算模块,用于对所述音频数据采集模块获取的音频数据进行预处理,并基于预处理后的音频数据确定音频数据的声源角度;
空间音频渲染模块,用于通过所述声源角度测算模块确定的音频数据的声源角度和所述音频信号滤波模块滤波处理后的音频数据,进行空间音频渲染,得到空间音频数据。
2.根据权利要求1所述的空间音频录制装置,其特征在于,所述声源角度测算模块采用如下方式对所述音频数据采集模块获取的音频数据进行预处理:
对所述音频数据采集模块获取的音频数据进行降噪处理;和/或
对所述音频数据采集模块获取的音频数据进行分帧处理。
3.根据权利要求1所述的空间音频录制装置,其特征在于,所述声源角度测算模块采用如下方式基于预处理后的音频数据确定所述音频数据的声源角度:
确定所述预处理后的音频数据对应每一帧音频数据的信号协方差矩阵;
对所述信号协方差矩阵进行特征值分解,得到信号特征值与噪声特征值;
基于所述信号特征值与所述噪声特征值,确定每一帧音频数据的角度谱函数;
将所述每一帧音频数据的角度谱函数最大值对应的角度,确定为声源在所述每一帧音频数据的声源角度。
4.根据权利要求3所述的空间音频录制装置,其特征在于,所述声源角度测算模块采用如下方式基于所述信号特征值与所述噪声特征值,确定每一帧音频数据的角度谱函数:
基于所述信号特征值和所述噪声特征值,确定信号子空间和噪声子空间;
基于所述信号子空间和所述噪声子空间,确定每一帧音频数据的角度谱函数。
5.一种空间音频录制方法,其特征在于,包括:
获取音频数据;
对所述音频数据进行滤波处理:
对所述音频数据采集模块获取的音频数据进行预处理,并基于预处理后的音频数据确定音频数据的声源角度;
通过所述声源角度测算模块确定的音频数据的声源角度和所述音频信号滤波模块滤波处理后的音频数据,进行空间音频渲染,得到空间音频数据。
6.根据权利要求5所述的空间音频录制方法,其特征在于,所述对所述音频数据采集模块获取的音频数据进行预处理,包括:
对所述音频数据采集模块获取的音频数据进行降噪处理;和/或
对所述音频数据采集模块获取的音频数据进行分帧处理。
7.根据权利要求5所述的空间音频录制方法,其特征在于,所述基于预处理后的音频数据确定所述音频数据的声源角度,包括:
确定所述预处理后的音频数据对应每一帧音频数据的信号协方差矩阵;
对所述信号协方差矩阵进行特征值分解,得到信号特征值与噪声特征值;
基于所述信号特征值与所述噪声特征值,确定每一帧音频数据的角度谱函数;
将所述每一帧音频数据的角度谱函数最大值对应的角度,确定为声源在所述每一帧音频数据的声源角度。
8.根据权利要求7所述的空间音频录制方法,其特征在于,所述基于所述信号特征值与所述噪声特征值,确定每一帧音频数据的角度谱函数,包括:
基于所述信号特征值和所述噪声特征值,确定信号子空间和噪声子空间;
基于所述信号子空间和所述噪声子空间,确定每一帧音频数据的角度谱函数。
9.一种空间音频录制装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行权利要求5至8中任意一项所述的空间音频录制方法。
10.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行权利要求5至8中任意一项所述的空间音频录制方法。
CN202211250667.8A 2022-10-12 2022-10-12 一种空间音频录制方法、装置及存储介质 Pending CN117880732A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211250667.8A CN117880732A (zh) 2022-10-12 2022-10-12 一种空间音频录制方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211250667.8A CN117880732A (zh) 2022-10-12 2022-10-12 一种空间音频录制方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN117880732A true CN117880732A (zh) 2024-04-12

Family

ID=90583430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211250667.8A Pending CN117880732A (zh) 2022-10-12 2022-10-12 一种空间音频录制方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN117880732A (zh)

Similar Documents

Publication Publication Date Title
CN111128221B (zh) 一种音频信号处理方法、装置、终端及存储介质
CN110808063A (zh) 一种语音处理方法、装置和用于处理语音的装置
CN110970057B (zh) 一种声音处理方法、装置与设备
WO2016176951A1 (zh) 声音信号优化方法及装置
CN107833579B (zh) 噪声消除方法、装置及计算机可读存储介质
CN109360549B (zh) 一种数据处理方法、穿戴设备和用于数据处理的装置
CN104991754A (zh) 录音方法及装置
CN111883164B (zh) 模型训练方法、装置、电子设备及存储介质
CN111968662A (zh) 音频信号的处理方法及装置、存储介质
CN114363770B (zh) 通透模式下的滤波方法、装置、耳机以及可读存储介质
CN110931028B (zh) 一种语音处理方法、装置和电子设备
CN111009257A (zh) 一种音频信号处理方法、装置、终端及存储介质
CN111986693A (zh) 音频信号的处理方法及装置、终端设备和存储介质
CN112447184A (zh) 语音信号处理方法及装置、电子设备、存储介质
CN112201267A (zh) 一种音频处理方法、装置、电子设备及存储介质
CN111292761B (zh) 语音增强方法及装置
CN110459236B (zh) 音频信号的噪声估计方法、装置及存储介质
CN105244037B (zh) 语音信号处理方法及装置
CN111667842B (zh) 音频信号处理方法及装置
CN113077808B (zh) 一种语音处理方法、装置和用于语音处理的装置
CN113489854B (zh) 声音处理方法、装置、电子设备和存储介质
CN110580910A (zh) 一种音频处理方法、装置、设备及可读存储介质
CN117880732A (zh) 一种空间音频录制方法、装置及存储介质
CN113113036B (zh) 音频信号处理方法及装置、终端及存储介质
CN113345461A (zh) 一种语音处理方法、装置和用于语音处理的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination