CN107154266B - 一种实现音频录制的方法及终端 - Google Patents

一种实现音频录制的方法及终端 Download PDF

Info

Publication number
CN107154266B
CN107154266B CN201610125482.2A CN201610125482A CN107154266B CN 107154266 B CN107154266 B CN 107154266B CN 201610125482 A CN201610125482 A CN 201610125482A CN 107154266 B CN107154266 B CN 107154266B
Authority
CN
China
Prior art keywords
audio recording
microphone
audio
recording object
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610125482.2A
Other languages
English (en)
Other versions
CN107154266A (zh
Inventor
黄图斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610125482.2A priority Critical patent/CN107154266B/zh
Priority to PCT/CN2016/080780 priority patent/WO2016197745A2/zh
Publication of CN107154266A publication Critical patent/CN107154266A/zh
Application granted granted Critical
Publication of CN107154266B publication Critical patent/CN107154266B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/16Storage of analogue signals in digital stores using an arrangement comprising analogue/digital [A/D] converters, digital memories and digital/analogue [D/A] converters 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10592Audio or video recording specifically adapted for recording or reproducing multichannel signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种实现音频录制的方法及装置,包括:确定音频录制对象与麦克阵列的位置关系;根据确定的音频录制对象与麦克阵列的位置关系调整录制的音频文件的增益,获得录音文件;麦克阵列为在终端上预先设置的由三个或三个以上麦克组成的阵列。本发明实施例方法,通过根据音频录制对象与麦克阵列的位置关系对录制的音频文件进行增益调整,降低了录音文件中噪声,提高了录音文件的音频质量。

Description

一种实现音频录制的方法及终端
技术领域
本发明涉及音频处理技术,尤指一种实现音频录制的方法及终端。
背景技术
在参加会议时,一般会对参会内容进行音频录制。
为了提高音频录制的质量,相关技术中,进行音频录制主要通过双麦克设置进行降噪处理,完成指向性录音。
双麦克设置虽然可以到达一定的降噪效果,但会议备忘一般有多个发言者,对来自不同角度的声音信号进行音频录制,双麦克设置方法无法实现对各个不同角度的声音信号都进行降低噪声处理,录音文件的音频质量需要进一步提高。
发明内容
为了解决上述技术问题,本发明实施例提供一种实现音频录制的方法及装置,能够降低不同角度录制的声音信号的噪声。
本发明实施例提供了一种实现音频录制的方法,包括:
确定音频录制对象与麦克阵列的位置关系;
根据确定的音频录制对象与麦克阵列的位置关系调整录制的音频文件的增益,获得录音文件;
所述麦克阵列为在终端上预先设置的由三个或三个以上麦克组成的阵列。
可选的,确定音频录制对象与麦克阵列的位置关系具体包括:
确定所述麦克阵列中与所述音频录制对象距离最近的麦克;
通过在所述麦克阵列中预先建立的坐标轴,确定所述音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ;
所述预先建立的坐标轴为以所述麦克阵列的几何中心作为圆心,以对称轴作为纵轴建立的坐标轴。
可选的,调整录制的音频文件的增益具体包括:
通过下述公式调整音频文件中与音频录制对象距离最近的麦克的增益:
Figure BDA0000935321160000021
其中,δ为偏置系数,ε为增益调整参数。
可选的,音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ为:
计算所述音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度;
确定所述麦克阵列中各麦克与建立的坐标轴构成的麦克角度;
分别计算所述音频录制角度与各个麦克角度的差并求绝对值后,确定绝对值最小的数值为所述夹角Δ。
可选的,该方法还包括:以所述麦克阵列的几何中心作为圆心,将所述麦克阵列组成的平面划分为预设个数的扇区;
设置各扇区相应的音轨;
根据所述音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度确定音频录制对象所在扇区,将录制的所述录音文件存储到该扇区对应的音轨中,用于根据存储的音轨进行录音文件的播放。
另一方面,本申请实施例还提供一种实现音频录制的装置,包括:确定单元和调整单元;其中,
确定单元,用于确定音频录制对象与麦克阵列的位置关系;
调整单元,用于根据确定的音频录制对象与麦克阵列的位置关系调整录制的音频文件的增益,获得录音文件;
所述麦克阵列为在终端上预先设置的由三个或三个以上麦克组成的阵列。
可选的,确定单元具体用于,
确定所述麦克阵列中与所述音频录制对象距离最近的麦克;
通过在所述麦克阵列中预先建立的坐标轴,确定所述音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ;
所述预先建立的坐标轴为以所述麦克阵列的几何中心作为圆心,以对称轴作为纵轴建立的坐标轴。
可选的,调整单元具体用于,
根据确定的音频录制对象与麦克阵列的位置关系,通过下述公式调整音频文件中与音频录制对象距离最近的麦克的增益:
Figure BDA0000935321160000031
其中,δ为偏置系数,ε为增益调整参数。
可选的,确定单元具体用于,
确定所述麦克阵列中与所述音频录制对象距离最近的麦克;
计算音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度;
确定麦克阵列中各麦克与建立的坐标轴构成的麦克角度;
分别计算音频录制角度与各麦克角度的差并求绝对值后,确定绝对值最小的数值为所述夹角Δ;
所述调整单元具体用于,根据夹角Δ调整录制的音频文件的增益,获得录音文件。
可选的,该装置还包括音轨单元,用于以麦克阵列的几何中心作为圆心,将麦克阵列组成的平面划分为预设个数的扇区;
设置各扇区相应的音轨;
根据音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度确定音频录制对象所在扇区,将录制的录音文件存储到该扇区对应的音轨中,用于根据存储的音轨进行录音文件的播放。
与现有技术相比,本申请技术方案包括:确定音频录制对象与麦克阵列的位置关系;根据确定的音频录制对象与麦克阵列的位置关系调整录制的音频文件的增益,获得录音文件;麦克阵列为在终端上预先设置的由三个或三个以上麦克组成的阵列。本发明方法通过根据音频录制对象与麦克阵列的位置关系对各位置音频录制对象录制的音频文件进行增益调整,降低了录音文件中的噪声,提高了录音文件的音频质量。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实现音频录制的方法的流程图;
图2为本发明实现音频录制的装置的结构框图;
图3为本发明实施例麦克阵列的几何分布示意图;
图4为本发明实施例扇区的分布示意图;
图5为本发明实施例的方法流程图;
图6为本发明实施例音频录制对象在麦克阵列中构成角度示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
图1为本发明实现音频录制的方法的流程图,如图1所示,包括:
步骤100、确定音频录制对象与麦克阵列的位置关系;这里,麦克阵列为在终端上预先设置的由三个或三个以上麦克组成的阵列。
本步骤中,确定音频录制对象与麦克阵列的位置关系具体包括:
确定麦克阵列中与音频录制对象距离最近的麦克;
通过在麦克阵列中预先建立的坐标轴,确定音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ。
预先建立的坐标轴为以麦克阵列的几何中心作为圆心,以对称轴作为纵轴建立的坐标轴。
优选的,音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ为:
计算音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度;
确定麦克阵列中各麦克与建立的坐标轴构成的麦克角度;
分别计算音频录制角度与各麦克角度的差并求绝对值后,确定绝对值最小的数值为夹角Δ。
需要说明的是,计算音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度可以采用波达方向角度估计公式(DOA)计算获得,具体的,计算音频录制角度包括以下过程:
把观测到的语音片段再分成L个相邻的子段,把每一个子段称作快拍,把子段总数称为快拍数;
根据L个快拍的频域阵列输出矢量Xl(fj),l=1,2,...,L,可以得到阵列输出在频率fj处的协方差矩阵估计
Figure BDA0000935321160000051
Figure BDA0000935321160000052
根据fj频率处的协方差矩阵估计值
Figure BDA0000935321160000053
和阵列的导向矢量
Figure BDA0000935321160000054
就可以得到宽带波束形成算法的代价函数为:
Figure BDA0000935321160000055
通过对上式进行一维搜索就可以获得音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度θ。
步骤101、根据确定的音频录制对象与麦克阵列的位置关系调整录制的音频文件的增益,获得录音文件。
本步骤中,调整录制的音频文件的增益具体包括:
通过下述公式调整音频文件中与音频录制对象距离最近的麦克的增益:
Figure BDA0000935321160000056
其中,δ为偏置系数,ε为增益调整参数。
需要说明的是,偏置系数主要根据本领域技术人员的经验值进行设定,一般的,偏置系数取值为0~0.5之间;增益调整参数主要根据本领域技术人员的经验值进行设定,一般的,增益调整参数取值为0~1之间,具体数值大小可以根据麦克阵列中麦克个数,音频录制要求等进行调整。
本发明方法还包括:以麦克阵列的几何中心作为圆心,将麦克阵列组成的平面划分为预设个数的扇区;
设置各扇区相应的音轨;
根据音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度确定音频录制对象所在扇区,将录制的录音文件存储到该扇区对应的音轨中,用于根据存储的音轨进行录音文件的播放。
本发明方法通过根据音频录制对象与麦克阵列的位置关系对各位置音频录制对象录制的音频文件进行增益调整,降低了录音文件中的噪声,提高了录音文件的音频质量。
图2为本发明实现音频录制的装置的结构框图,如图2所示,包括:确定单元和调整单元;其中,
确定单元,用于确定音频录制对象与麦克阵列的位置关系;
确定单元具体用于,
确定麦克阵列中与音频录制对象距离最近的麦克;
通过在麦克阵列中预先建立的坐标轴,确定音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ;
预先建立的坐标轴为以麦克阵列的几何中心作为圆心,以对称轴作为纵轴建立的坐标轴。
调整单元,用于根据确定的音频录制对象与麦克阵列的位置关系调整录制的音频文件的增益,获得录音文件。
调整单元具体用于,
根据确定的音频录制对象与麦克阵列的位置关系,通过下述公式调整音频文件中与音频录制对象距离最近的麦克的增益:
Figure BDA0000935321160000071
其中,δ为偏置系数,ε为增益调整参数。
麦克阵列为在终端上预先设置的由三个或三个以上麦克组成的阵列。
本发明装置还包括音轨单元,用于以麦克阵列的几何中心作为圆心,将麦克阵列组成的平面划分为预设个数的扇区;
设置各扇区相应的音轨;
根据音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度确定音频录制对象所在扇区,将录制的录音文件存储到该扇区对应的音轨中,用于根据存储的音轨进行录音文件的播放。
确定单元具体用于,
确定麦克阵列中与音频录制对象距离最近的麦克;
计算音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度;
确定麦克阵列中各麦克与建立的坐标轴构成的麦克角度;
分别计算音频录制角度与各麦克角度的差并求绝对值后,确定绝对值最小的数值为夹角Δ。
调整单元具体用于,根据夹角Δ调整录制的音频文件的增益,获得录音文件。
以下通过具体实施例对本发明方法进行清楚详细的说明,实施例仅用于陈述本发明,并不用于限定本发明方法的保护范围。
实施例
本实施例麦克阵列是以四个麦克构成的阵列,麦克阵列被设置在录音笔或手机等可以实现录音的设备上,图3为本发明实施例麦克阵列的几何分布示意图,如图3所示,图中的四个圆圈表示四个麦克,本实施例将手机的四个麦克以理想的正方形构建麦克阵列,分布设置在手机上。为了对本发明录制的录音文件进行合理播放,本实施例以麦克阵列的几何中心作为圆心,将麦克阵列组成的平面划分为预设个数的扇区,本实施例可以设置扇区个数为6~8个,人数多时,可以增加扇区个数,人数少时,可以做减少扇区个数的处理,图4为本发明实施例扇区的分布示意图,如图4所示,以麦克阵列中心作为圆心,将麦克阵列组成的平面按照平均角度划分为8个扇区;设置各扇区相应的音轨;根据音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度确定音频录制对象所在扇区,将录制的录音文件存储到该扇区对应的音轨中,用于根据存储的音轨进行录音文件的播放。
图5为本发明实施例的方法流程图,如图5所示,包括:
步骤500、确定音频录制对象与麦克阵列的位置关系;
本步骤具体包括:预先建立的坐标轴为以麦克阵列的几何中心作为圆心,以对称轴作为纵轴建立的坐标轴。
计算音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度;
确定麦克阵列中各麦克与建立的坐标轴构成的麦克角度;
分别计算音频录制角度与各麦克角度的差并求绝对值后,确定绝对值最小的数值为音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ。
计算音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度采用以下方法计算获得:
通常把观测到的语音片段再分成L个相邻的子段,把每一个子段称作快拍,把子段总数称为快拍数。因此在宽带阵列信号处理中快拍的概念与窄带阵列信号处理是不同的。根据L个快拍的频域阵列输出矢量Xl(fj),l=1,2,...,L,可以得到阵列输出在频率fj处的协方差矩阵估计
Figure BDA0000935321160000081
Figure BDA0000935321160000082
根据fj频率处的协方差矩阵估计值
Figure BDA0000935321160000083
和阵列的导向矢量
Figure BDA0000935321160000084
就可以得到宽带波束形成算法的代价函数为
Figure BDA0000935321160000085
通过对上式进行一维搜索就可以获得音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度θ。
图6为本发明实施例音频录制对象在麦克阵列中构成角度示意图,如图6所示,音频录制对象在最接近麦克1的位置,音频录制角度为θ。
麦克阵列为在终端上预先设置的由三个或三个以上麦克组成的阵列。
步骤501、根据确定的音频录制对象与麦克阵列的位置关系调整录制的音频文件的增益,获得录音文件;
调整录制的音频文件的增益具体包括:
通过下述公式调整音频文件中与音频录制对象距离最近的麦克的增益:
Figure BDA0000935321160000091
其中,δ为偏置系数,ε为增益调整参数。
本实施例偏置系数可以取值为0.25之间;增益调整参数可以取值为0.75。
本实施例通过与音频录制对象距离最近的麦克的增益的调整,可以增强录音文件中音频录制对象的音频增益,使录音效果更为明显,噪声影响降低。
本实施例对多个音频录制对象同时发言的情况,只需要分别增强音频文件中音频录制对象的音频增益即可,通过对音频文件按照音频录制对象的位置分别进行增益调整获得各音频录制对象相应的录音文件。
步骤502、根据音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度确定音频录制对象所在扇区,将录制的录音文件存储到该扇区对应的音轨中。
步骤503、根据存储的音轨进行录音文件的播放。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (4)

1.一种实现音频录制的方法,其特征在于,包括:
确定麦克阵列中与音频录制对象距离最近的麦克;
通过在所述麦克阵列中预先建立的坐标轴,确定所述音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ;
根据确定的音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ调整录制音频文件中与音频录制对象距离最近的麦克的增益,获得录音文件;
其中,通过下述公式调整音频文件中与音频录制对象距离最近的麦克的增益:
Figure FDA0002974447320000011
其中,П为圆周率,δ为偏置系数,ε为增益调整参数。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:以所述麦克阵列的几何中心作为圆心,将所述麦克阵列组成的平面划分为预设个数的扇区;
设置各扇区相应的音轨;
根据所述音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度确定音频录制对象所在扇区,将录制的所述录音文件存储到该扇区对应的音轨中,用于根据存储的音轨进行录音文件的播放。
3.一种实现音频录制的装置,其特征在于,包括:确定单元和调整单元;其中,
确定单元,用于确定麦克阵列中与音频录制对象距离最近的麦克,以及通过在所述麦克阵列中预先建立的坐标轴,确定所述音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ;
调整单元,用于根据确定的音频录制对象与确定的距离音频录制对象最近的麦克的夹角Δ调整录制音频文件中与音频录制对象距离最近的麦克的增益,获得录音文件;
其中,通过下述公式调整音频文件中与音频录制对象距离最近的麦克的增益:
Figure FDA0002974447320000021
其中,∏为圆周率,δ为偏置系数,ε为增益调整参数。
4.根据权利要求3所述的装置,其特征在于,该装置还包括音轨单元,用于以麦克阵列的几何中心作为圆心,将麦克阵列组成的平面划分为预设个数的扇区;
设置各扇区相应的音轨;
根据音频录制对象与根据麦克阵列建立的坐标轴构成的音频录制角度确定音频录制对象所在扇区,将录制的录音文件存储到该扇区对应的音轨中,用于根据存储的音轨进行录音文件的播放。
CN201610125482.2A 2016-03-04 2016-03-04 一种实现音频录制的方法及终端 Active CN107154266B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610125482.2A CN107154266B (zh) 2016-03-04 2016-03-04 一种实现音频录制的方法及终端
PCT/CN2016/080780 WO2016197745A2 (zh) 2016-03-04 2016-04-29 一种实现音频录制的方法、终端和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610125482.2A CN107154266B (zh) 2016-03-04 2016-03-04 一种实现音频录制的方法及终端

Publications (2)

Publication Number Publication Date
CN107154266A CN107154266A (zh) 2017-09-12
CN107154266B true CN107154266B (zh) 2021-04-30

Family

ID=57503059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610125482.2A Active CN107154266B (zh) 2016-03-04 2016-03-04 一种实现音频录制的方法及终端

Country Status (2)

Country Link
CN (1) CN107154266B (zh)
WO (1) WO2016197745A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109712629B (zh) * 2017-10-25 2021-05-14 北京小米移动软件有限公司 音频文件的合成方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7483540B2 (en) * 2002-03-25 2009-01-27 Bose Corporation Automatic audio system equalizing
JP2004213767A (ja) * 2002-12-27 2004-07-29 Toshiba Corp データ変換装置及びデータ変換方法
US20040170289A1 (en) * 2003-02-27 2004-09-02 Whan Wen Jea Audio conference system with quality-improving features by compensating sensitivities microphones and the method thereof
CN1534973A (zh) * 2003-04-01 2004-10-06 黄文义 可补偿麦克风灵敏度的音讯会议系统及其方法
CN100571451C (zh) * 2004-01-19 2009-12-16 宏碁股份有限公司 结合定位技术的麦克风阵列收音方法及其系统
US7565288B2 (en) * 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
CN101656908A (zh) * 2008-08-19 2010-02-24 深圳华为通信技术有限公司 控制声音聚焦的方法、通讯设备及通讯系统
CN101478711B (zh) * 2008-12-29 2013-07-31 无锡中星微电子有限公司 控制麦克风录音的方法、数字化音频信号处理方法及装置
US9456289B2 (en) * 2010-11-19 2016-09-27 Nokia Technologies Oy Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof
CN102707262A (zh) * 2012-06-20 2012-10-03 太仓博天网络科技有限公司 一种基于麦克风阵列的声源定位系统
US9210499B2 (en) * 2012-12-13 2015-12-08 Cisco Technology, Inc. Spatial interference suppression using dual-microphone arrays
WO2014167165A1 (en) * 2013-04-08 2014-10-16 Nokia Corporation Audio apparatus
CN105070304B (zh) * 2015-08-11 2018-09-04 小米科技有限责任公司 实现对象音频录音的方法及装置、电子设备

Also Published As

Publication number Publication date
WO2016197745A2 (zh) 2016-12-15
CN107154266A (zh) 2017-09-12
WO2016197745A3 (zh) 2017-02-02

Similar Documents

Publication Publication Date Title
US10979805B2 (en) Microphone array auto-directive adaptive wideband beamforming using orientation information from MEMS sensors
US11172122B2 (en) User identification based on voice and face
CN110121129B (zh) 耳机的麦克风阵列降噪方法、装置、耳机及tws耳机
US9031256B2 (en) Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US10522167B1 (en) Multichannel noise cancellation using deep neural network masking
KR101468343B1 (ko) 공간에서의 음향 이미지의 향상된 생성을 위한 시스템, 방법 및 장치
US9578439B2 (en) Method, system and article of manufacture for processing spatial audio
CN105794231B (zh) 免提波束方向图配置
CN108475511A (zh) 用于创建参考信道的自适应波束形成
US9552840B2 (en) Three-dimensional sound capturing and reproducing with multi-microphones
DE102019129330A1 (de) Konferenzsystem mit einem Mikrofonarray-System und Verfahren zur Spracherfassung in einem Konferenzsystem
US11240621B2 (en) Three-dimensional audio systems
US20240163628A1 (en) Apparatus, method or computer program for processing a sound field representation in a spatial transform domain
US11496830B2 (en) Methods and systems for recording mixed audio signal and reproducing directional audio
Horiguchi et al. Multi-channel end-to-end neural diarization with distributed microphones
Ochi et al. Multi-Talker Speech Recognition Based on Blind Source Separation with ad hoc Microphone Array Using Smartphones and Cloud Storage.
CN107154266B (zh) 一种实现音频录制的方法及终端
Araki et al. Comparison of reference microphone selection algorithms for distributed microphone array based speech enhancement in meeting recognition scenarios
Choi et al. Convolutional neural network-based direction-of-arrival estimation using stereo microphones for drone
TW201835900A (zh) 訊號處理裝置
WO2023249957A1 (en) Speech enhancement and interference suppression
Liao et al. Subband minimum classification error beamforming for speech recognition in reverberant environments
KR101600195B1 (ko) 초지향성 빔포머식을 이용한 빔포밍 시스템 및 방법
Habib et al. Experimental evaluation of multi-band position-pitch estimation (m-popi) algorithm for multi-speaker localization.
CN113709653A (zh) 定向定位听音方法、听力装置、程序产品及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant