CN110351629A - 一种收音方法、收音装置及终端 - Google Patents

一种收音方法、收音装置及终端 Download PDF

Info

Publication number
CN110351629A
CN110351629A CN201910641453.5A CN201910641453A CN110351629A CN 110351629 A CN110351629 A CN 110351629A CN 201910641453 A CN201910641453 A CN 201910641453A CN 110351629 A CN110351629 A CN 110351629A
Authority
CN
China
Prior art keywords
reception device
radio reception
target
target object
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910641453.5A
Other languages
English (en)
Other versions
CN110351629B (zh
Inventor
张国梁
汤林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou National Acoustic Intelligent Technology Co Ltd
Original Assignee
Guangzhou National Acoustic Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou National Acoustic Intelligent Technology Co Ltd filed Critical Guangzhou National Acoustic Intelligent Technology Co Ltd
Priority to CN201910641453.5A priority Critical patent/CN110351629B/zh
Publication of CN110351629A publication Critical patent/CN110351629A/zh
Application granted granted Critical
Publication of CN110351629B publication Critical patent/CN110351629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Toys (AREA)

Abstract

本发明提供一种收音方法、收音装置及终端,适用于收音装置,通过在语音收录的过程中,控制各个TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息;并针对每一收音器,根据目标对象的位置信息调整对应目标对象对应的收音器的指向方向,使收音器指向对应的目标对象;从而确定收录到最大声音音量的目标收音器,关闭其他收音器;再控制目标收音器收音,得到目标语音。本方案中,根据目标对象的位置,调整收音器的指向方向,使得所述收音器指向对应的目标对象,确定收录到最大声音音量的目标收音器,从而控制目标收音器收音。能够提高收音器的语音收录效果及语音收录的准确性,从而保证语音收录的质量。

Description

一种收音方法、收音装置及终端
技术领域
本发明涉语音拾音识别技术领域,尤其涉及一种收音方法、收音装置及终端。
背景技术
随着科学技术的发展,人们常通过欣赏语音作品来陶冶情操,如人们常欣赏通过播放器播放的音乐。该语音作品是通过收音器对目标对象的语音进行收录的,语音作品的收录效果决定了播放器播放的效果。
目前,人们常用收音范围类别为心形方向、超心形方向及全向型的收音器对目标对象的语音进行收录,由于上述收音器的收音范围小,当目标对象的位置发送变化时,目标对象的位置在收音范围外,使得收音器的语音收录效果差,且不准确。
因此,如何提供一种收音方法、收音装置及终端,以提高收音器的语音收录效果及语音收录的准确性,是亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种收音方法、收音装置及终端,以解决现有技术中收音不准确及收音效果差,且不准确的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种收音方法,适用于收音装置,所述收音装置包括N个收音器,所述N个收音器上设置有TOF识别器,所述TOF识别器由TOF发射器和TOF接收器构成,所述N为大于等于1的整数,所述方法包括:
在语音收录的过程中,控制各个所述TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息;
针对每一所述收音器,根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象;
确定收录到最大声音音量的目标收音器,关闭其他收音器;
控制所述目标收音器收音,得到目标语音。
优选的,所述收音装置还包括热红外感应器,所述在语音收录的过程中,控制各个所述TOF识别器识别预设区域内的对象之后,所述方法还包括:
控制所述热红外感应器对所述TOF识别器识别到的对象进行检测,确定满足真人红外感应要求的对象为目标对象。
优选的,所述控制各个所述TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息,包括:
控制各个所述TOF识别器识别预设区域内出现的对象,并获取相应的对象参数;
基于所述对象参数进行计算,得到各个对象对应的形状数据;
确定满足真人形状数据的形状数据对应的对象为目标对象;
基于所述TOF识别器获取各个所述目标对象的位置信息。
优选的,所述根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象,包括:
确定当前对应所述目标对象的收音器的指向方向;
若所述收音器的指向方向未指向所述目标对象,根据所述目标对象的位置信息,调整所述收音器的指向方向,使所述收音器指向对应的所述目标对象。
优选的,所述确定收录的最大声音音量的目标收音器,关闭其他收音器,包括:
判断当前是否存在同时收录声音的收音器;
若否,确定当前收录声音音量最大的收音器为目标收音器,关闭其他收音器;
若是,比对同时收录到的声音的音量大小,确定当前收录声音音量最大的收音器为目标收音器,关闭其他收音器。
优选的,若确定的目标收音器为多个,所述控制所述目标收音器收音,得到目标语音,包括:
控制各个所述目标收音器进行收音,得到对应各个所述目标收音器收录的语音;
基于人声分离技术,对当前收录到的语音进行人声分离,得到目标语音。
本发明实施例第二方面提供了一种收音装置,所述装置包括:
控制器、N个收音器、N个TOF识别器、电源模块和信号传输模块,所述N为大于等于1的整数;
每一所述收音器上设置有一TOF识别器,所述TOF识别器由TOF发射器和TOF接收器构成;
所述控制器,用于在语音收录的过程中,控制各个所述TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息,针对每一所述收音器,根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象,确定收录到最大声音音量的目标收音器,关闭其他收音器,控制所述目标收音器收音,得到目标语音。
优选的,所述收音装置还包括:热红外感应器;
相应地,所述控制器,还用于控制所述热红外感应器对所述TOF识别器识别到的对象进行检测,确定满足真人红外感应要求的对象为目标对象。
优选的,所述收音器包括麦克风,所述麦克风包括单麦克风或麦克风阵列。
本发明实施例第三方面公开一种终端,所述终端包括本发明实施例第二方面公开的收音装置,所述收音装置用于执行本发明实施例第一方面公开的收音方法。
基于上述本发明实施例提供的收音方法、收音装置及终端,收音装置包括N个收音器,N个收音器上设置有TOF识别器,TOF识别器由TOF发射器和TOF接收器构成。通过在语音收录的过程中,控制各个TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息;并针对每一收音器,根据目标对象的位置信息调整对应目标对象对应的收音器的指向方向,使收音器指向对应的目标对象;从而确定收录到最大声音音量的目标收音器,关闭其他收音器;再控制目标收音器收音,得到目标语音。本方案中,根据目标对象的位置,调整收音器的指向方向,使得所述收音器指向对应的目标对象,确定收录到最大声音音量的目标收音器,从而控制目标收音器收音。能够提高收音器的语音收录效果及语音收录的准确性,从而保证语音收录的质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种收音方法的流程示意图;
图2为本发明实施例公开的一种收音装置的结构框图;
图3为本发明实施例公开的一种收音装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,目前人们常用收音范围为心形方向、超心形方向及全向型的收音器对目标对象的语音进行收录,由于该收音器的收音范围小,当目标对象的位置发送变化时,目标对象的位置在收音范围外,使得收音器的语音收录效果差,且不准确。
因此,本发明实施例提供一种收音方法、收音装置及终端,控制器根据目标对象的位置,调整收音器的指向方向,使得所述收音器指向对应的目标对象,确定收录到最大声音音量的目标收音器,从而控制目标收音器收音。能够提高收音器的语音收录效果及语音收录的准确性,从而保证语音收录的质量。
为了更好的提高语音收录的质量,在本发明实施例公开的收音装置上设置有N个收音器,所述N个收音器上设置有TOF识别器,所述TOF识别器由TOF发射器和TOF接收器构成,所述N为大于等于1的整数。
TOF识别器是通过给对象连续发送光脉冲,然后接收从所述对象返回的光信号,并识别预设范围内的对象,通过探测光脉冲的飞行时间来确定对象的位置及通过对象参数来确定可识别对象形状。
在语音收录的过程中,所述TOF发射器发射光脉冲信号至预设区域内对象,并接收所述对象反射的光脉冲信号,基于所述发射脉冲信号至所述接收光脉冲信号的时间,确定对象的位置信息,并基于所述对象参数,确定预设范围内可识别对象的形状,由此确定符合要求的目标对象。
所述收音器采集目标对象的声音,并将所述目标对象的语音转化成不同频率的信号,进行存储,即得到目标语音。
在本发明实施例中,通过收音装置上设置的N个收音器,及N个收音器上设置有TOF识别器,从而识别所述对象的形状,由此确定符合要求的目标对象。可以提高收音器的语音收录效果及语音收录的准确性,且能够降低其他对象语音的干扰。
下面将详细介绍收音装置的收音过程:
请参见图1,为本发明实施例提供的一种收音方法的流程示意图,该方法适用于收音装置,该方法包括以下步骤:
步骤S101:在语音收录的过程中,控制各个所述TOF识别器识别预设区域内对象,并获取识别的目标对象的位置信息。
在具体实现步骤S101的过程中,在目标对象语音收录时,控制各个所述TOF识别器识别预设区域内对象的形状,并确定符合要求的对象为目标对象,然后确定所述目标对象的位置信息,并获取所述目标对象的位置信息。
其中,所述对象至少包括真人、动物、人的模型及玩偶等,对于对象的类型并不仅限于此,还可以包括其他影响所述TOF识别器识别的对象。
需要说明的,所述预设区域为所述收音器检测目标对象的音频信号的范围。
步骤S102:针对每一所述收音器,根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象。
在具体实现步骤S102的过程中,针对每一所述收音器,根据所述目标对象的位置信息,按照所述目标对象与所述收音器的距离,确定预设范围内与所述目标对象对应的收音器,调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象。
比如,假设一个目标对象的位置信息在A点,收音器的数量为3个,具体为收音器1,收音器2和收音器3。根据目标对象的位置信息,确定所述目标对象与所述收音器1的距离为1.6米,所述目标对象与所述收音器2的距离为0.5米,所述目标对象与所述收音器3的距离为0.8米,确定与所述目标对象对应的收音器为收音器2和收音器3,调整对应所述目标对象对应的收音器2和收音器3的指向方向,使所述收音器2和收音器3指向对应的所述目标对象。
需要说明的是,所述收音器可为微系统(Micro Electro Mechanical Systems,MEMS)的单麦克风或麦克风阵列等,可根据实际情况而定,本发明不加以限制。
步骤S103:确定收录到最大声音音量的目标收音器,关闭其他收音器。
在具体实现步骤S103的过程中,确定N个所述收录声音的收音器中收录到最大声音音量的收音器为目标收音器,并关闭其他收录声音的收音器。
比如,假设所述收录声音收音器的数量为3个,具体为收音器1,收音器2和收音器3。收音器1的分贝为90,收音器2的分贝为50,收音器3的分贝为40,确定收录到最大声音音量的收音器为收音器1,并关闭收音器2和收音器3的收录。
步骤S104:控制所述目标收音器收音,得到目标语音。
在具体实现步骤S104的过程中,通过控制所述收音器采集目标对象的声音,所述收音器将所述目标对象的语音转化成不同频率的信号,进行存储,即得到目标语音。
在本发明实施例中,在目标语音收录时,控制各个所述TOF识别器识别预设区域内对象,并获取识别的目标对象的位置信息。并针对每一收音器,根据目标对象的位置信息调整对应目标对象对应的收音器的指向方向,使收音器指向对应的目标对象;从而确定收录到最大声音音量的目标收音器,关闭其他收音器;再控制目标收音器收音,得到目标语音。本方案中,根据目标对象的位置,调整收音器的指向方向,使得所述收音器指向对应的目标对象,确定收录到最大声音音量的目标收音器,从而控制目标收音器收音。能够提高收音器的语音收录效果及语音收录的准确性,从而保证语音收录的质量。
上述图1示出的步骤S101中具体控制各个所述TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息的过程,包括以下步骤:
步骤S11:控制各个所述TOF识别器识别预设区域内出现的对象,并获取相应的对象参数。
在具体实现步骤S11的过程中,控制各个所述TOF识别器识别预设区域内出现的对象,获取相应的对象参数。其中,所述对象参数至少包括视觉参数、像素统计参数、图像变换系数和图像代数,在本发明实施例中,对于对象参数并不仅限于此,还可以包括其他影响对象识别的数据。
需要说明的,所述视觉参数为所述TOF识别器识别到的对象的图片视觉信息转化的计算机能够识别和处理的数据。所述像素统计参数为所述TOF识别器识别到的对象的图片的像素的红绿蓝(red green blue,RGB)值的统计数据。所述图像变换系数为所述TOF识别器识别到的对象的各个频率点上的幅值。所述图像代数为所述TOF识别器识别到的同一对象的多张图片对应的像素点进行运算的数据。
步骤S12:基于所述对象参数进行计算,得到各个对象对应的形状数据。
在具体实现步骤S12的过程中,基于所述视觉参数、所述像素统计参数、所述图像变换系数和所述图像代数进行计算,得到各个对象对应的形状数据。
步骤S13:确定满足真人形状数据的形状数据对应的对象为目标对象。
在步骤S13中,所述真人形状数据为经过多次试验得到的经验值。
在具体实现步骤S13的过程中,将满足真人形状数据的形状数据对应的对象,确定为目标对象。
步骤S14:基于所述TOF识别器获取各个所述目标对象的位置信息。
在具体实现步骤S14的过程中,所述TOF识别器通过光脉冲的飞行距离,确定所述对象的位置信息。所述控制器基于所述TOF识别器获取各个所述目标对象的位置信息。
在本发明实施例中,通过所述TOF识别器识别预设区域内对象的形状,并确定满足真人形状数据的形状数据对应的对象,并获取满足真人形状数据的形状数据对应的对象的位置信息。能够确定真人的位置信息。
上述图1示出的步骤S102中具体根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象的过程,包括以下步骤:
步骤S21:确定当前对应所述目标对象的收音器的指向方向。
在具体实现步骤S21的过程中,判断所述当前对应所述目标对象的收音器的指向方向与所述目标对象的关系,若所述收音器的指向方向未指向所述目标对象时,则执行步骤S22。
步骤S22:根据所述目标对象的位置信息,调整所述收音器的指向方向,使所述收音器指向对应的所述目标对象。
在具体实现步骤S22的过程中,根据所述目标对象的位置信息,调整所述收音器的指向方向,使所述收音器的正方指向对应的所述目标对象。
比如,假设确定当前对应所述目标对象的收音器的指向方向在所述目标对象的反向45度角。确定所述收音器的指向方向未指向所述目标对象。根据所述目标对象的位置信息,将所述收音器的指向方向逆时针转145度,使所述收音器指向对应的所述目标对象。
在本发明实施例中,根据目标对象的位置信息,调整所述收音器的指向方向,使得所述收音器指向对应的所述目标对象。以便于收音器更准确的收录目标对象的语音,进而提供收录语音的质量。
上述图1示出的步骤S103中具体确定收录的最大声音音量的目标收音器,关闭其他收音器的过程,包括以下步骤:
步骤S31:判断当前是否存在同时收录语音的收音器。若当前不存在同时收录声音的收音器,则执行步骤S32,若当前存在同时收录语音的收音器,则执行步骤S33。
在具体实现步骤S31的过程中,判断当前是否存在同时收录语音的收音器,即多个收音器是否同时接收到该语音的频率信号,从而确定多个收音器的收录情况。
步骤S32:确定当前收录声音音量最大的收音器为目标收音器,关闭其他收音器。
在具体实现步骤S32的过程中,根据所述收音器收录语音的声音分贝,确定当前收录声音最大分贝的收音器为目标收音器,关闭其他收音器。其中,所述收音器的数量可为1个或多个。
步骤S33:比对同时收录到的声音的音量大小,确定当前收录声音音量最大的收音器为目标收音器,关闭其他收音器。
在具体实现步骤S33的过程中,获取多个收音器同时收录语音的声音分贝,比对所述收录语音的声音分贝的大小,确定当前收录声音最大分贝的收音器为目标收音器,关闭其他收音器。
本发明实施例中,通过确定当前收录声音最大分贝的收音器为目标收音器,关闭其他收音器。进而能够降低外界噪声对所述收音器收录的语音过程的干扰,从而能够提高语音收录质量。
基于上述本发明实施例图1示出的收音方法,若确定的目标收音器为多个,步骤S104控制所述目标收音器收音,得到目标语音的具体实现过程包括以下步骤:
步骤S41:控制各个所述目标收音器进行收音,得到对应各个所述目标收音器收录的语音。
在具体实现步骤S41的过程中,若当前有多条语音需要同时被收录,控制每一目标收音器以接收最大频率信号为主要信号,即每一目标收音器对最大分贝的目标对象的语音进行收音。得到对应各个所述目标收音器收录的语音。
需要说明的是,所述目标收音器收录的语音中存在多个干扰声音。
比如,有2个目标收音器和2个目标对象,具体为目标收音器1,目标收音器2,目标对象1和目标对象2,若当前有2条语音需要同时被收录,目标收音器1和目标收音器2同时对目标对象1和目标对象2的语音进行收录,目标收音器1主要接收到的最大分贝对应的目标对象为目标对象1,目标收音器2主要接收到的最大分贝对应的目标对象为目标对象2。得到对应目标收音器1收录的语音和目标收音器2收录的语音。所述目标收音器1收录的语音包含有目标对象2的干扰声音,所述目标收音器2收录的语音包含有目标对象1的干扰声音。
步骤S42:基于人声分离技术,对当前收录到的语音进行人声分离,得到目标语音。
在具体实现步骤S41的过程中,基于人声分离技术,将当前收录到的语音信号进行分离,得到各个目标对象语音对应的不同频率的语音信号,即得到各个目标对象对应的目标语音。
比如,基于人声分离技术,对上述所述目标收音器1收录的语音包含有目标对象2的干扰声音进行分离,得到目标对象1语音对应的频率的语音信号,对上述所述目标收音器2收录的语音包含有目标对象1的干扰声音,进行分离,得到目标对象2语音对应的频率的语音信号,
在本发明实施例中,基于人声分离技术,对当前收录到的语音进行人声分离,得到目标语音。能够降低其他语音对所述目标对象的语音收录过程的干扰,从而能够提高声语音收录的质量。
基于上述本发明实施例公开的图1示出的收音装置,该收音装置上还可以设置热红外感应器。
因此,在上述本发明实施例示出的步骤S201中具体在语音收录的过程中,控制各个所述TOF识别器识别预设区域内的对象的过程之后,该收音方法还包括以下步骤:
步骤S51:控制所述热红外感应器对所述TOF识别器识别到的对象进行检测,确定满足真人红外感应要求的对象为目标对象。
在具体实现步骤S51的过程中,控制所述热红外感应器对所述TOF识别器识别到的对象再次进行检测,确定所述满足真人红外感应要求的对象为目标对象,或者,控制所述热红外感应器对所述TOF识别器识别到的目标对象进行再次检测,确定满足真人红外感应要求的目标对象。
在本发明实施例中,通过热红外感应器和TOF识别器的配合,能够避免环境光的影响,且进一步提高识别结果的准确性。
与上述本发明实施例公开的一种收音方法相对应,本发明实施例还公开了一种收音装置,如图2所示,为本发明实施例公开的一种收音装置的结构框图。
所述收音装置包括:控制器201、N个收音器202、N个TOF识别器203、电源模块204和信号传输模块205。
每一所述收音器202上设置有一TOF识别器203,所述TOF识别器203由TOF发射器和TOF接收器构成;
所述控制器201,用于在语音收录的过程中,控制各个所述TOF识别器203识别预设区域内的对象,并获取识别的目标对象的位置信息,针对每一所述收音器202,根据所述目标对象的位置信息调整对应所述目标对象对应的收音器202的指向方向,使所述收音器202指向对应的所述目标对象,确定收录到最大声音音量的目标收音器202,关闭其他收音器202,控制所述目标收音器收音,得到目标语音。
所述电源模块204,用于为所述控制器201、所述N个收音器202、所述N个TOF识别器203和所述信号传输模块205提供电能。
所述信号传输模块205,用于传输所述控制器201、所述N个收音器202、所述N个TOF识别器203和所述电源模块204所产生的信号。
需要说明的是,所述收音器包括麦克风,所述麦克风包括单麦克风或麦克风阵列。
需要说明的是,所述麦克风阵列按照预设规则排列的多个麦克风。
其中,所述预设规则是根据实际经验设定的。
需要说明的是,上述本发明实施例公开的收音装置中的各个单元具体的原理和执行过程,与上述本发明实施收音方法相同,可参见上述本发明实施例公开的收音方法中相应的部分,这里不再进行赘述。
本发明实施例中,控制器在语音收录的过程中,控制各个TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息,针对每一收音器,根据目标对象的位置信息调整对应目标对象对应的收音器的指向方向,使收音器指向对应的目标对象,确定收录到最大声音音量的目标收音器,关闭其他收音器,控制目标收音器收音,得到目标语音。通过电源模块为控制器、收音器、TOF识别器和信号传输模块提供电能。本方案中,根据目标对象的位置,调整收音器的指向性,使得所述收音器指向对应的目标对象,确定收录到最大声音音量的目标收音器,从而控制目标收音器收音。能够提高收音器的语音收录效果及语音收录的准确性,从而保证语音收录的质量。
基于上述图2示出的收音装置,结合图2,参见图3,为本发明实施例提供的另一种收音装置的结构框图,该收音装置还包括:热红外感应器206。
相应地,所述控制器201,还用于控制所述热红外感应器206对所述TOF识别器203识别到的对象进行检测,确定满足真人红外感应要求的对象为目标对象。
本发明实施例中,通过热红外感应器和TOF识别器的配合,能够进一步的提高识别结果的准确性。
基于上述本发明实施例公开的一种收音装置,上述本发明实施例示出的收音方法可以通过一种包含收音装置的终端设备实现。具体为:上述各个单元和模块作为程序单元存储于收音装置中,由收音装置中的控制器执行上述程序单元来实现收音的处理。
所述收音装置中的控制器执行的具体过程如下:在语音收录的过程中,控制各个所述TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息,针对每一所述收音器,根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象,确定收录到最大声音音量的目标收音器,关闭其他收音器,控制所述目标收音器收音,得到目标语音。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种收音方法,其特征在于,适用于收音装置,所述收音装置包括N个收音器,所述N个收音器上设置有TOF识别器,所述TOF识别器由TOF发射器和TOF接收器构成,所述N为大于等于1的整数,所述方法包括:
在语音收录的过程中,控制各个所述TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息;
针对每一所述收音器,根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象;
确定收录到最大声音音量的目标收音器,关闭其他收音器;
控制所述目标收音器收音,得到目标语音。
2.根据权利要求1所述的方法,其特征在于,所述收音装置还包括热红外感应器,所述在语音收录的过程中,控制各个所述TOF识别器识别预设区域内的对象之后,所述方法还包括:
控制所述热红外感应器对所述TOF识别器识别到的对象进行检测,确定满足真人红外感应要求的对象为目标对象。
3.根据权利要求1所述的方法,其特征在于,所述控制各个所述TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息,包括:
控制各个所述TOF识别器识别预设区域内出现的对象,并获取相应的对象参数;
基于所述对象参数进行计算,得到各个对象对应的形状数据;
确定满足真人形状数据的形状数据对应的对象为目标对象;
基于所述TOF识别器获取各个所述目标对象的位置信息。
4.根据权利1所述的方法,其特征在于,所述根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象,包括:
确定当前对应所述目标对象的收音器的指向方向;
若所述收音器的指向方向未指向所述目标对象,根据所述目标对象的位置信息,调整所述收音器的指向方向,使所述收音器指向对应的所述目标对象。
5.根据权利要求1所述的方法,其特征在于,所述确定收录的最大声音音量的目标收音器,关闭其他收音器,包括:
判断当前是否存在同时收录声音的收音器;
若否,确定当前收录声音音量最大的收音器为目标收音器,关闭其他收音器;
若是,比对同时收录到的声音的音量大小,确定当前收录声音音量最大的收音器为目标收音器,关闭其他收音器。
6.根据权利要求1-4中任一项所述的方法,其特征在于,若确定的目标收音器为多个,所述控制所述目标收音器收音,得到目标语音,包括:
控制各个所述目标收音器进行收音,得到对应各个所述目标收音器收录的语音;
基于人声分离技术,对当前收录到的语音进行人声分离,得到目标语音。
7.一种收音装置,其特征在于,所述装置包括:
控制器、N个收音器、N个TOF识别器、电源模块和信号传输模块,所述N为大于等于1的整数;
每一所述收音器上设置有一TOF识别器,所述TOF识别器由TOF发射器和TOF接收器构成;
所述控制器,用于在语音收录的过程中,控制各个所述TOF识别器识别预设区域内的对象,并获取识别的目标对象的位置信息,针对每一所述收音器,根据所述目标对象的位置信息调整对应所述目标对象对应的收音器的指向方向,使所述收音器指向对应的所述目标对象,确定收录到最大声音音量的目标收音器,关闭其他收音器,控制所述目标收音器收音,得到目标语音。
8.根据权利要求7所述的收音装置,其特征在于,所述收音装置还包括:热红外感应器;
相应地,所述控制器,还用于控制所述热红外感应器对所述TOF识别器识别到的对象进行检测,确定满足真人红外感应要求的对象为目标对象。
9.根据权利要求7所述的收音装置,其特征在于,所述收音器包括麦克风,所述麦克风包括单麦克风或麦克风阵列。
10.一种终端,其特征在于,所述终端包括权利要求7-8中任一项所述的收音装置,所述收音装置用于执行权利要求1-6中任一项所述的收音方法。
CN201910641453.5A 2019-07-16 2019-07-16 一种收音方法、收音装置及终端 Active CN110351629B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910641453.5A CN110351629B (zh) 2019-07-16 2019-07-16 一种收音方法、收音装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910641453.5A CN110351629B (zh) 2019-07-16 2019-07-16 一种收音方法、收音装置及终端

Publications (2)

Publication Number Publication Date
CN110351629A true CN110351629A (zh) 2019-10-18
CN110351629B CN110351629B (zh) 2021-01-19

Family

ID=68175444

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910641453.5A Active CN110351629B (zh) 2019-07-16 2019-07-16 一种收音方法、收音装置及终端

Country Status (1)

Country Link
CN (1) CN110351629B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111161768A (zh) * 2019-12-23 2020-05-15 秒针信息技术有限公司 录音设备
CN113539249A (zh) * 2021-06-08 2021-10-22 安徽沐峰数据科技有限公司 一种基于人工智能的语音处理设备及方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265422A (ja) * 2008-04-25 2009-11-12 Sony Corp 情報処理装置及び情報処理方法
CN102378097A (zh) * 2010-08-25 2012-03-14 鸿富锦精密工业(深圳)有限公司 麦克风控制系统及方法
CN103841360A (zh) * 2013-12-11 2014-06-04 三亚中兴软件有限责任公司 分布式视频会议的实现方法及系统、终端、音视频一体化设备
CN203851275U (zh) * 2013-12-05 2014-09-24 北京东方正龙数字技术有限公司 一种基于人脸识别的自动调节拾音设备
US20150117833A1 (en) * 2013-09-03 2015-04-30 Huawei Technologies Co., Ltd. Recording Method, Apparatus, and Terminal
CN204539315U (zh) * 2015-04-02 2015-08-05 尹煜敏 一种声源定位的视频会议机
CN105657356A (zh) * 2015-12-30 2016-06-08 广州励丰文化科技股份有限公司 在多摄像头多麦克风场景下的监控系统及方法
CN107580785A (zh) * 2015-06-30 2018-01-12 埃西勒国际通用光学公司 头戴式音频采集模块
CN108460395A (zh) * 2017-02-17 2018-08-28 北京三星通信技术研究有限公司 目标检测方法和装置以及模糊处理方法和装置
CN109257558A (zh) * 2017-07-12 2019-01-22 中兴通讯股份有限公司 会议电视的音视频采集方法、装置和终端设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265422A (ja) * 2008-04-25 2009-11-12 Sony Corp 情報処理装置及び情報処理方法
CN102378097A (zh) * 2010-08-25 2012-03-14 鸿富锦精密工业(深圳)有限公司 麦克风控制系统及方法
US20150117833A1 (en) * 2013-09-03 2015-04-30 Huawei Technologies Co., Ltd. Recording Method, Apparatus, and Terminal
CN203851275U (zh) * 2013-12-05 2014-09-24 北京东方正龙数字技术有限公司 一种基于人脸识别的自动调节拾音设备
CN103841360A (zh) * 2013-12-11 2014-06-04 三亚中兴软件有限责任公司 分布式视频会议的实现方法及系统、终端、音视频一体化设备
CN204539315U (zh) * 2015-04-02 2015-08-05 尹煜敏 一种声源定位的视频会议机
CN107580785A (zh) * 2015-06-30 2018-01-12 埃西勒国际通用光学公司 头戴式音频采集模块
CN105657356A (zh) * 2015-12-30 2016-06-08 广州励丰文化科技股份有限公司 在多摄像头多麦克风场景下的监控系统及方法
CN108460395A (zh) * 2017-02-17 2018-08-28 北京三星通信技术研究有限公司 目标检测方法和装置以及模糊处理方法和装置
CN109257558A (zh) * 2017-07-12 2019-01-22 中兴通讯股份有限公司 会议电视的音视频采集方法、装置和终端设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111161768A (zh) * 2019-12-23 2020-05-15 秒针信息技术有限公司 录音设备
CN113539249A (zh) * 2021-06-08 2021-10-22 安徽沐峰数据科技有限公司 一种基于人工智能的语音处理设备及方法
CN113539249B (zh) * 2021-06-08 2023-12-26 安徽沐峰数据科技有限公司 一种基于人工智能的语音处理设备及方法

Also Published As

Publication number Publication date
CN110351629B (zh) 2021-01-19

Similar Documents

Publication Publication Date Title
CN112020864B (zh) 麦克风阵列中的智能波束控制
CN104412616B (zh) 基于麦克风阵列中的声音的相关性的噪声抑制
CN104246531B (zh) 用于显示用户接口的系统和方法
CN104216351B (zh) 家用电器语音控制方法及系统
US8229145B2 (en) Method and apparatus for configuring a handheld audio device using ear biometrics
CN104756526B (zh) 信号处理装置、信号处理方法、测量方法及测量装置
CN104240606B (zh) 显示装置及显示装置观看角度的调节方法
Brinkløv et al. Echolocation call intensity and directionality in flying short-tailed fruit bats, Carollia perspicillata (Phyllostomidae)
CN110351629A (zh) 一种收音方法、收音装置及终端
CN105307063B (zh) 声速校正系统
CN105301594B (zh) 距离测量
CN107113527A (zh) 确定扬声器位置变化的方法
US7957224B2 (en) Human echolocation system
CN105277921B (zh) 一种基于智能手机的被动声源定位方法
EP3186599B1 (en) Feedback provision system
CN103118321A (zh) 适于实时通信从而在音频流中提供空间信息的听音系统
CN109672966A (zh) 一种语音拾取方法、装置和系统
KR100996920B1 (ko) 휴대 단말기 및 그의 주변기기 제어방법
JP2008113431A (ja) 超音波カメラトラッキングシステム及びそれに関連する方法
WO2016175922A1 (en) Magic wand methods, apparatuses and systems
CN111930336A (zh) 音频设备的音量调节方法、设备及存储介质
CN109212534A (zh) 移动终端的握持姿态检测方法、装置、设备及存储介质
EP4097992A1 (en) Use of a camera for hearing device algorithm training
WO2018098716A1 (zh) 听诊器数据处理方法、装置、电子设备及云服务器
KR20170054752A (ko) 음향 수신부를 이용한 음원 추적 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant