CN105355213A - 一种定向录音的方法及装置 - Google Patents

一种定向录音的方法及装置 Download PDF

Info

Publication number
CN105355213A
CN105355213A CN201510768323.XA CN201510768323A CN105355213A CN 105355213 A CN105355213 A CN 105355213A CN 201510768323 A CN201510768323 A CN 201510768323A CN 105355213 A CN105355213 A CN 105355213A
Authority
CN
China
Prior art keywords
audio signals
recorded audio
microphones
spectrum data
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510768323.XA
Other languages
English (en)
Other versions
CN105355213B (zh
Inventor
王英茂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201510768323.XA priority Critical patent/CN105355213B/zh
Publication of CN105355213A publication Critical patent/CN105355213A/zh
Application granted granted Critical
Publication of CN105355213B publication Critical patent/CN105355213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种定向录音的方法及装置。该方法包括:获取至少三个麦克风的录音信号;根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;对所述目标录音信号进行处理,并生成录音文件。本发明实施例通过采用上述技术方案,根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号,该目标录音信号对应于预设录音方向,通过对目标录音信号进行处理,可生成录音文件,从而实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。

Description

一种定向录音的方法及装置
技术领域
本发明实施例涉及录音技术领域,尤其涉及一种定向录音的方法及装置。
背景技术
为了满足用户在生活以及工作中的录音需求,多数移动终端都具备录音功能,如手机、平板电脑、音乐播放器以及专业的录音笔等。
用户在使用移动终端的录音功能时,录音环境往往会存在多个人物说话的声音以及各种环境噪音,所以对于用于实现录音功能的麦克风来说,其四周存在多个声源,麦克风会将这些声源的声音都记录下来形成录音文件。然而,用户所感兴趣的往往只有一个方向上的声源的声音,在听取包含所有声源的声音的录音文件时,会由于其他声源的声音的干扰而无法听清自己感兴趣的声音。
现有技术中存在一种录音方式,选择一段本底噪音文件,并以该本底噪音文件为样本进行参考,将整个录音文件中符合该样本的频率去除,从而消除录音文件中的环境噪音,但此种方式仍然无法仅录取特定方向上的声音,依然无法满足用户需求。
发明内容
本发明实施例的目的是提供一种定向录音的方法及装置,以解决现有的录音方式缺乏针对性的问题。
一方面,本发明实施例提供了一种定向录音的方法,包括:
获取至少三个麦克风的录音信号;
根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;
对所述目标录音信号进行处理,并生成录音文件。
另一方面,本发明实施例提供了一种定向录音的装置,包括:
录音信号获取模块,用于获取至少三个麦克风的录音信号;
目标录音信号确定模块,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;
录音文件生成模块,用于对所述目标录音信号进行处理,并生成录音文件。
本发明实施例中提供的定向录音的方案,获取至少三个麦克风的录音信号,根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号,对目标录音信号进行处理,并生成录音文件。通过采用上述技术方案,根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号,该目标录音信号对应于预设录音方向,通过对目标录音信号进行处理,可生成录音文件,从而实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
附图说明
图1为本发明实施例一提供的一种定向录音的方法的流程示意图;
图2为本发明实施例二提供的一种定向录音的方法的流程示意图;
图3为本发明实施例三提供的一种优选的定向录音的方法的流程示意图;
图4为本发明实施例三提供的一种移动终端中麦克风的排布示意图;
图5为本发明实施例四提供的一种定向录音的装置的结构框图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种定向录音的方法的流程示意图,该方法可以由定向录音的装置执行,其中该装置可由软件和/或硬件实现,一般可集成在移动终端中。如图1所示,该方法包括:
步骤101、获取至少三个麦克风的录音信号。
示例性的,本实施例中的移动终端具体可为手机、平板电脑和录音笔等终端设备。所述移动终端中配置有至少三个麦克风。
示例性的,当用户操作移动终端开始录音时,可自动开启移动终端中的全部或者部分麦克风(麦克风的开启数量不少于三个),并控制开启的麦克风录音,获取所开启的麦克风中的至少三个麦克风的录音信号。例如,移动终端中配置有6个麦克风,可自动开启其中的5个麦克风,并控制该5个麦克风开始录音,获取其中的4个麦克风的录音信号;又如,移动终端中配置有3个麦克风,可自动开启该3个麦克风,并控制该3个麦克风开始录音,获取该3个麦克风的录音信号。
步骤102、根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号。
示例性的,所述预设录音方向可由系统默认设置,也可由用户自行设置。例如,系统可默认将移动终端长度方向上指向移动终端顶部的方向设置为所述预设录音方向,用户在进行定向录音时,可直接将移动终端的顶部指向自己感兴趣的声源的所在方向;又如,移动终端可提供方向选取界面,根据用户的选择操作确定所述预设录音方向。
示例性的,移动终端上的所述至少三个麦克风的排布方式直接决定了每个麦克风在移动终端上的位置,以及每两个麦克风之间的相对位置关系。对于一个方向上声源来说,其发出的声音到达每个麦克风的时间会有所区别,麦克风所采集到的声音信号的强度也不同。当声源与麦克风的直线距离相对较近时,声音到达该麦克风的时间会相对较早,声音信号的强度也相对较强;当声源与麦克风的直线距离相对较远时,声音到达该麦克风的时间会相对较晚,声音信号的强度也相对较弱。因此,可根据上述原理对步骤101中所获取的至少三个麦克风的录音信号进行分析,将预设录音方向上的声源所对应的声音信号筛选出来,作为目标录音信号。
步骤103、对目标录音信号进行处理,并生成录音文件。
示例性的,所述目标录音信号对应于用户感兴趣的声源,所以对目标录音信号进行处理,并生成录音文件。这样,用户在收听录音文件时,便能够听清自己感兴趣的声源的声音。
本实施例中,对目标录音信号的处理方式以及生成录音文件的方式可以有多种,此处不作具体限定。以下提供几种可选的方式作为举例说明:
1、可对目标录音信号进行保留,去掉除目标录音信号以外的其他录音信号,并生成录音文件。
这样做可去掉除预设录音方向以外的其他录音方向上声源的声音,即相当于滤除了用户不感兴趣的声音,可保证用户能够清晰的听到自己感兴趣的声音。
2、可对目标录音信号进行保留,并提升目标录音信号的增益,去掉除目标录音信号以外的其他录音信号,并生成录音文件。
这样做的好处在于,在第一种方式的基础上,可提高录音文件中声音的声音强度以及响度等属性,进一步方便用户听清自己感兴趣的声音。
3、可提升目标录音信号的增益,得到第一录音信号;降低录音信号中除目标录音信号以外的其他录音信号的增益,得到第二录音信号;最后根据第一录音信号和第二录音信号生成录音文件。
其中,增益提升或降低的幅度可由系统默认设置,也可由用户自行设置。例如,可设置提升系数和降低系数,通过对两个系数的配合调节,可实现根据具体情况保留除预设录音方向以外的其他录音方向上的声音的比重,进而避免一些失真声音的产生。
本发明实施例一提供的定向录音的方法,获取至少三个麦克风的录音信号,根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号,对目标录音信号进行处理,并生成录音文件。通过采用上述技术方案,根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号,该目标录音信号对应于预设录音方向,通过对目标录音信号进行处理,可生成录音文件,从而实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
实施例二
图2为本发明实施例二提供的一种定向录音的方法的流程示意图,本实施例以上述实施例为基础进行优化,在本实施例中,将步骤“根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号”优化为:分别对至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据;根据预设录音方向以及至少三个麦克风的排布方式确定频谱数据中的目标频谱数据;根据目标频谱数据确定录音信号中的目标录音信号。
相应的,本实施例的方法包括如下步骤:
步骤201、获取至少三个麦克风的录音信号。
步骤202、分别对至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据。
示例性的,对录音信号进行傅立叶变换是为了将不同频率的声音进行分离,所得到的频谱数据中,每个不同的频率分别对应一个声源的频谱数据。
步骤203、根据预设录音方向以及至少三个麦克风的排布方式确定频谱数据中的目标频谱数据。
具体的,本步骤可包括:根据预设录音方向以及至少三个麦克风的排布方式确定幅值差筛选条件;针对每个频率,计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差;将计算出的幅值的差与幅值差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
示例性的,当移动终端上的至少三个麦克风的排布方式确定之后,可在录音环境中的相对于移动终端的一个方向上放置一个固定声源,而其他方向上没有声源,通过移动终端上的至少三个麦克风获取固定声源的录音信号,分别对至少三个麦克风中的每个麦克风对应的固定声源的录音信号进行傅立叶变换,得到相应的频谱数据,计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差。之后,沿该方向移动所述固定声源,再次计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差。以此类推,可得到至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差的规律或者所处范围,以该幅值差的规律或者所处范围作为幅值差筛选条件。
在本步骤中,可针对每个频率,计算每两个麦克风对应的频谱数据中对应的幅值的差,并判断计算出的幅值的差是否处于上述幅值的差的范围内(或者是否符合幅值的差的规律),若在该范围内(或者符合规律),则说明匹配成功,则确定当前频率对应的频谱数据为目标频谱数据,也相当于确定当前频率所对应的声源为预设录音方向上的声源。
作为另一种实现方式,本步骤可包括:根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件;针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差;将计算出的相位的差与所述相位差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
示例性的,同理,当移动终端上的至少三个麦克风的排布方式确定之后,可在录音环境中的相对于移动终端的一个方向上放置一个固定声源,而其他方向上没有声源,通过移动终端上的至少三个麦克风获取固定声源的录音信号,分别对至少三个麦克风中的每个麦克风对应的固定声源的录音信号进行傅立叶变换,得到相应的频谱数据,计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差。之后,沿该方向移动所述固定声源,再次计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差。以此类推,可得到至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差的规律或者所处范围,以该相位差的规律或者所处范围作为相位差筛选条件。
在本步骤中,可针对每个频率,计算每两个麦克风对应的频谱数据中对应的相位的差,并判断计算出的相位的差是否处于上述相位的差的范围内(或者是否符合幅值的差的规律),若在该范围内(或者符合规律),则说明匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
优选的,可将上述两种实现方式结合起来确定目标频谱数据。例如,当对定向录音性能要求较高时,可将既匹配幅值差筛选条件又匹配相位差范围的频率对应的频谱数据确定为目标频谱数据;当对定向录音性能要求较低时,可将匹配幅值差筛选条件或者匹配相位差筛选条件的频率对应的频谱数据均确定为目标频谱数据。
步骤204、根据目标频谱数据确定录音信号中的目标录音信号。
示例性的,对所有频率进行上述步骤的筛选后,根据匹配成功的频率所对应的频谱数据来确定录音信号中的目标录音信号。可以理解的是,在预设录音方向上可能存在多个用户感兴趣的声源,所以可能存在多个匹配成功的频率,可根据所有匹配成功的频率所对应的频谱数据的集合来确定录音信号中的目标录音信号。
步骤205、提升目标录音信号的增益,得到第一录音信号。
步骤206、降低录音信号中除目标录音信号以外的其他录音信号的增益,得到第二录音信号。
步骤207、根据第一录音信号和第二录音信号生成录音文件。
本发明实施例二在实施例一的基础上,对确定目标录音信号的步骤进行了优化,根据幅值差筛选条件或者相位差筛选条件将经过傅里叶变换后的声音信号进行筛选,得到用户感兴趣的目标录音信号,可提高筛选的准确度,从而提升定向录音性能。随后,通过提升目标录音信号的增益并降低其他录音信号的增益来生成录音文件,实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
实施例三
图3为本发明实施例三提供的一种优选的定向录音的方法的流程示意图,本实施例以移动终端中配置三个麦克风为例进行说明,具体的,该方法包括如下步骤:
步骤301、获取三个麦克风的录音信号。
示例性的,图4为本发明实施例三提供的一种移动终端中麦克风的排布示意图,如图4所示,该移动终端上设置有三个麦克风,分别记为a、b、和c,为了描述方便,此处假设三个麦克风构成等腰三角形,a为等腰三角形的顶点。
步骤302、分别对三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到三组频谱数据。
步骤303、根据预设录音方向以及三个麦克风的排布方式确定频谱数据中的目标频谱数据。
具体的,本步骤可包括:根据预设录音方向以及三个麦克风的排布方式确定幅值差筛选条件和/或相位差筛选条件;针对每个频率,计算三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差和/或相位的差;将计算出的幅值的差和/或相位的差与幅值差筛选条件和/或相位差筛选条件进行匹配,根据匹配情况确定当前频率对应的频谱数据是否为目标频谱数据。
上述幅值差筛选条件和相位差筛选条件的确定方式可参照本发明实施例二中的相关描述。
示例性的,假设移动终端长度方向上指向移动终端顶部的麦克风a的方向为预设录音方向。在频谱数据中,针对某一频率,三组频谱数据中对应的幅值分别记为Aa,Ab和Ac,在预设录音方向上的声源距离a比较近,声音强度较高,所以对应的幅值Aa较大,在预设录音方向上的声源距离b和c比较远,且与b的距离和与c的距离近似相等,那么预设录音方向对应的幅值差筛选条件可为:(Aa-Ab)以及(Aa-Ac)为正值,且(Ab-Ac)或(Ac-Ab)的绝对值很小。如果当前频率满足上述幅值筛选条件,那么该频率对应的频谱数据即为目标频谱数据。如果计算得到的幅值差(Aa-Ab)或(Aa-Ac)为负值,或(Ab-Ac)的绝对值较大,则当前频率不满足幅值筛选条件。同理,在预设录音方向上的声源距离a比较近,声音会先传播到a,在预设录音方向上的声源距离b和c比较远,且与b的距离和与c的距离近似相等,声音会延后同时传播到b和c,由于时间与相位相对应,所以可根据相位差对频谱数据进行筛选。
步骤304、根据目标频谱数据确定录音信号中的目标录音信号。
步骤305、提升目标录音信号的增益,得到第一录音信号。
步骤306、降低录音信号中除目标录音信号以外的其他录音信号的增益,得到第二录音信号。
步骤307、根据第一录音信号和第二录音信号生成录音文件。
示例性的,执行步骤305-步骤307后,加强了移动终端中顶端a麦克风方向的录音效果,削弱了其他方向上的录音效果,从而实现定向录音。同理,也可将预设录音方向设定为上述方向的反方向,即移动终端的底端方向。
本发明实施例三在上述实施例的基础上进行优化,移动终端中配置有三个麦克风,这样可不必改变现有移动终端的硬件配置,还可简化筛选条件,提升运算速度,使用户能够更快的收听到定向录音文件中感兴趣的声音,提升用户体验。
实施例四
图5为本发明实施例四提供的一种定向录音的装置的结构框图,该装置可由软件和/或硬件实现,一般集成在移动终端中,可通过执行定向录音的方法来实现定向录音。如图5所示,该装置包括录音信号获取模块501、目标录音信号确定模块502和录音文件生成模块503。
其中,录音信号获取模块501,用于获取至少三个麦克风的录音信号;目标录音信号确定模块502,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;录音文件生成模块503,用于对所述目标录音信号进行处理,并生成录音文件。
本发明实施例四提供的定向录音的装置,录音信号获取模块501获取至少三个麦克风的录音信号,目标录音信号确定模块502根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号,最后由录音文件生成模块503对目标录音信号进行处理,并生成录音文件。通过采用上述技术方案,可实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
在上述实施例的基础上,所述目标录音信号确定模块可包括变换单元、目标频谱数据确定单元和目标录音信号确定单元。其中,变换单元,用于分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据;目标频谱数据确定单元,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据;目标录音信号确定单元,用于根据所述目标频谱数据确定所述录音信号中的目标录音信号。
在上述实施例的基础上,所述目标频谱数据确定单元具体可用于:根据预设录音方向以及所述至少三个麦克风的排布方式确定幅值差筛选条件;针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差;将计算出的幅值的差与所述幅值差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
在上述实施例的基础上,所述目标频谱数据确定单元具体用于:根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件;针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差;将计算出的相位的差与所述相位差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
在上述实施例的基础上,所述录音文件生成模块可包括增益提升单元、增益减低单元和录音文件生成单元。其中,增益提升单元,用于提升所述目标录音信号的增益,得到第一录音信号;增益减低单元,用于降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益,得到第二录音信号;录音文件生成单元,用于根据所述第一录音信号和所述第二录音信号生成录音文件。
上述实施例中提供的定向录音的装置可执行本发明任意实施例所提供的定向录音的方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的定向录音的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种定向录音的方法,其特征在于,包括:
获取至少三个麦克风的录音信号;
根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;
对所述目标录音信号进行处理,并生成录音文件。
2.根据权利要求1所述的方法,其特征在于,根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号,包括:
分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据;
根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据;
根据所述目标频谱数据确定所述录音信号中的目标录音信号。
3.根据权利要求2所述的方法,其特征在于,根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据,包括:
根据预设录音方向以及所述至少三个麦克风的排布方式确定幅值差筛选条件;
针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差;将计算出的幅值的差与所述幅值差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
4.根据权利要求2所述的方法,其特征在于,根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据,包括:
根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件;
针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差;将计算出的相位的差与所述相位差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
5.根据权利要求1-4中任一项所述的方法,其特征在于,对所述目标录音信号进行处理,并生成录音文件,包括:
提升所述目标录音信号的增益,得到第一录音信号;
降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益,得到第二录音信号;
根据所述第一录音信号和所述第二录音信号生成录音文件。
6.一种定向录音的装置,其特征在于,包括:
录音信号获取模块,用于获取至少三个麦克风的录音信号;
目标录音信号确定模块,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;
录音文件生成模块,用于对所述目标录音信号进行处理,并生成录音文件。
7.根据权利要求6所述的装置,其特征在于,所述目标录音信号确定模块包括:
变换单元,用于分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据;
目标频谱数据确定单元,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据;
目标录音信号确定单元,用于根据所述目标频谱数据确定所述录音信号中的目标录音信号。
8.根据权利要求7所述的装置,其特征在于,所述目标频谱数据确定单元具体用于:
根据预设录音方向以及所述至少三个麦克风的排布方式确定幅值差筛选条件;
针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差;将计算出的幅值的差与所述幅值差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
9.根据权利要求7所述的装置,其特征在于,所述目标频谱数据确定单元具体用于:
根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件;
针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差;将计算出的相位的差与所述相位差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述录音文件生成模块包括:
增益提升单元,用于提升所述目标录音信号的增益,得到第一录音信号;
增益减低单元,用于降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益,得到第二录音信号;
录音文件生成单元,用于根据所述第一录音信号和所述第二录音信号生成录音文件。
CN201510768323.XA 2015-11-11 2015-11-11 一种定向录音的方法及装置 Active CN105355213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510768323.XA CN105355213B (zh) 2015-11-11 2015-11-11 一种定向录音的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510768323.XA CN105355213B (zh) 2015-11-11 2015-11-11 一种定向录音的方法及装置

Publications (2)

Publication Number Publication Date
CN105355213A true CN105355213A (zh) 2016-02-24
CN105355213B CN105355213B (zh) 2019-09-24

Family

ID=55331174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510768323.XA Active CN105355213B (zh) 2015-11-11 2015-11-11 一种定向录音的方法及装置

Country Status (1)

Country Link
CN (1) CN105355213B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106448693A (zh) * 2016-09-05 2017-02-22 华为技术有限公司 一种语音信号处理方法及装置
CN106960670A (zh) * 2017-03-27 2017-07-18 联想(北京)有限公司 一种录音方法和电子设备
CN107360387A (zh) * 2017-07-13 2017-11-17 广东小天才科技有限公司 一种视频录制的方法、装置及终端设备
WO2017197867A1 (zh) * 2016-05-19 2017-11-23 华为技术有限公司 一种采集声音信号的方法和装置
CN107393579A (zh) * 2017-08-02 2017-11-24 深圳传音控股有限公司 录音方法、录音设备
WO2018076387A1 (zh) * 2016-10-31 2018-05-03 华为技术有限公司 一种定向录音方法及电子设备
CN108447497A (zh) * 2018-03-07 2018-08-24 陈勇 一种在有干扰的环境中独立出自己发声的方法
CN109565629A (zh) * 2016-06-20 2019-04-02 诺基亚技术有限公司 分布式音频捕获和混合控制
CN109817214A (zh) * 2019-03-12 2019-05-28 百度在线网络技术(北京)有限公司 应用于车辆的交互方法和装置
CN111077496A (zh) * 2019-12-06 2020-04-28 深圳市优必选科技股份有限公司 一种基于麦克风阵列的语音处理方法、装置及终端设备
CN111145793A (zh) * 2018-11-02 2020-05-12 北京微播视界科技有限公司 音频处理方法和装置
CN113014844A (zh) * 2021-02-08 2021-06-22 Oppo广东移动通信有限公司 一种音频处理方法、装置、存储介质及电子设备
CN115101102A (zh) * 2022-06-23 2022-09-23 歌尔股份有限公司 一种录音设备、定向录音的方法、装置、智能手表及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090285423A1 (en) * 2004-03-05 2009-11-19 Eghart Fischer Method and device for matching the phases of microphone signals of a directional microphone of a hearing aid
CN103731768A (zh) * 2013-12-25 2014-04-16 深圳Tcl新技术有限公司 一种声音拾取方法及装置
WO2014161309A1 (zh) * 2013-08-19 2014-10-09 中兴通讯股份有限公司 一种移动终端实现声源定位的方法及装置
CN104378570A (zh) * 2014-09-28 2015-02-25 小米科技有限责任公司 录音方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090285423A1 (en) * 2004-03-05 2009-11-19 Eghart Fischer Method and device for matching the phases of microphone signals of a directional microphone of a hearing aid
WO2014161309A1 (zh) * 2013-08-19 2014-10-09 中兴通讯股份有限公司 一种移动终端实现声源定位的方法及装置
CN103731768A (zh) * 2013-12-25 2014-04-16 深圳Tcl新技术有限公司 一种声音拾取方法及装置
CN104378570A (zh) * 2014-09-28 2015-02-25 小米科技有限责任公司 录音方法及装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017197867A1 (zh) * 2016-05-19 2017-11-23 华为技术有限公司 一种采集声音信号的方法和装置
CN107404684A (zh) * 2016-05-19 2017-11-28 华为终端(东莞)有限公司 一种采集声音信号的方法和装置
CN109565629A (zh) * 2016-06-20 2019-04-02 诺基亚技术有限公司 分布式音频捕获和混合控制
US11812235B2 (en) 2016-06-20 2023-11-07 Nokia Technologies Oy Distributed audio capture and mixing controlling
CN106448693A (zh) * 2016-09-05 2017-02-22 华为技术有限公司 一种语音信号处理方法及装置
CN106448693B (zh) * 2016-09-05 2019-11-29 华为技术有限公司 一种语音信号处理方法及装置
WO2018076387A1 (zh) * 2016-10-31 2018-05-03 华为技术有限公司 一种定向录音方法及电子设备
CN108604453A (zh) * 2016-10-31 2018-09-28 华为技术有限公司 一种定向录音方法及电子设备
CN106960670A (zh) * 2017-03-27 2017-07-18 联想(北京)有限公司 一种录音方法和电子设备
CN106960670B (zh) * 2017-03-27 2020-06-23 联想(北京)有限公司 一种录音方法和电子设备
CN107360387A (zh) * 2017-07-13 2017-11-17 广东小天才科技有限公司 一种视频录制的方法、装置及终端设备
CN107393579A (zh) * 2017-08-02 2017-11-24 深圳传音控股有限公司 录音方法、录音设备
CN108447497A (zh) * 2018-03-07 2018-08-24 陈勇 一种在有干扰的环境中独立出自己发声的方法
CN111145793B (zh) * 2018-11-02 2022-04-26 北京微播视界科技有限公司 音频处理方法和装置
CN111145793A (zh) * 2018-11-02 2020-05-12 北京微播视界科技有限公司 音频处理方法和装置
CN109817214A (zh) * 2019-03-12 2019-05-28 百度在线网络技术(北京)有限公司 应用于车辆的交互方法和装置
CN111077496B (zh) * 2019-12-06 2022-04-15 深圳市优必选科技股份有限公司 一种基于麦克风阵列的语音处理方法、装置及终端设备
CN111077496A (zh) * 2019-12-06 2020-04-28 深圳市优必选科技股份有限公司 一种基于麦克风阵列的语音处理方法、装置及终端设备
CN113014844A (zh) * 2021-02-08 2021-06-22 Oppo广东移动通信有限公司 一种音频处理方法、装置、存储介质及电子设备
CN115101102A (zh) * 2022-06-23 2022-09-23 歌尔股份有限公司 一种录音设备、定向录音的方法、装置、智能手表及介质

Also Published As

Publication number Publication date
CN105355213B (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
CN105355213A (zh) 一种定向录音的方法及装置
US10123140B2 (en) Dynamic calibration of an audio system
US9913056B2 (en) System and method to enhance speakers connected to devices with microphones
JP6400566B2 (ja) ユーザインターフェースを表示するためのシステムおよび方法
CN110970057B (zh) 一种声音处理方法、装置与设备
US20180269841A1 (en) Method and apparatus for processing an audio signal based on an estimated loudness
CN106465004B (zh) 动态声音调节
CN105632508B (zh) 音频处理方法及音频处理装置
US20160157013A1 (en) Listen to people you recognize
JP6306713B2 (ja) 再生ラウドネス調整方法及び装置
CN103828232A (zh) 动态范围控制
US8848941B2 (en) Information processing apparatus, information processing method, and program
CN105611458A (zh) 一种移动终端的定向录音控制方法及装置
US20220345817A1 (en) Audio processing method and device, terminal, and computer-readable storage medium
CN109819375A (zh) 调节音量的方法与装置、存储介质、电子设备
CN110221944A (zh) 利用待测音频设备本身进行自测的方法及系统
CN103677714A (zh) 一种信息处理方法及电子设备
JP5703807B2 (ja) 信号処理装置
CN113553022A (zh) 设备调整方法、装置、移动终端及存储介质
WO2019200996A1 (zh) 多声道音频处理方法、装置和计算机可读存储介质
US10186279B2 (en) Device for detecting, monitoring, and cancelling ghost echoes in an audio signal
CN112738692B (zh) 滤波器设计方法、装置、耳机、电子设备和存储介质
US20150341008A1 (en) Variable equalization
CN106205629A (zh) 一种声音制作方法及装置
CN106101405B (zh) 在移动终端上对音频数据进行编辑或修改的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Applicant after: OPPO Guangdong Mobile Communications Co., Ltd.

Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Applicant before: Guangdong OPPO Mobile Communications Co., Ltd.

GR01 Patent grant
GR01 Patent grant