CN104410778A - 一种终端 - Google Patents

一种终端 Download PDF

Info

Publication number
CN104410778A
CN104410778A CN201410528655.6A CN201410528655A CN104410778A CN 104410778 A CN104410778 A CN 104410778A CN 201410528655 A CN201410528655 A CN 201410528655A CN 104410778 A CN104410778 A CN 104410778A
Authority
CN
China
Prior art keywords
equipment
sound pick
head portrait
image information
target person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410528655.6A
Other languages
English (en)
Inventor
尚岸奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jinli Communication Equipment Co Ltd
Original Assignee
Shenzhen Jinli Communication Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jinli Communication Equipment Co Ltd filed Critical Shenzhen Jinli Communication Equipment Co Ltd
Priority to CN201410528655.6A priority Critical patent/CN104410778A/zh
Publication of CN104410778A publication Critical patent/CN104410778A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)

Abstract

本发明实施例公开了一种终端,包括:信息获取单元,用于获取捕捉到的图像信息;人物头像获取单元,用于在图像信息中获取目标人物头像;拾音控制单元,用于根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制;音频信号获取单元,用于获取拾音控制后的拾音装置拾音得到的音频信号。采用本发明实施例,可根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,可提高拾音的效果,并提升用户体验。

Description

一种终端
技术领域
本发明涉及电子技术领域,尤其涉及一种终端。
背景技术
拾音就是收集声音的过程,而在拾音过程中麦克风通常收集到不必要的声音,以摄影拾音为例,终端捕捉图像信息过程中通常会出现目标音源对应的用户以外的陌生人说话的声音,或者所处环境中噪声源发出的干扰声等等,将弱化目标音源发送的声音,导致摄影效果较差,现有技术无法在拾音的过程中避开噪声源,则拾取的音频信号的音质较低。
发明内容
本发明实施例提供一种终端,可提高拾音的效果,并提升用户体验。
本发明实施例提供了一种终端,包括:
信息获取单元,用于获取终端捕捉的图像信息;
人物头像获取单元,用于在所述图像信息中获取目标人物头像;
拾音控制单元,用于根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制;
音频信号获取单元,用于获取通过拾音控制后的拾音装置拾音得到的音频信号。
实施本发明实施例,信息获取单元可获取图像信息,人物头像获取单元在图像信息中获取目标人物头像,拾音控制单元根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,音频信号获取单元获取通过拾音控制后的拾音装置拾音得到的音频信号,现有技术中终端不能对拾音装置进行拾音控制,则终端在拾音过程中会接收到目标音源以外的其他音源发送的音频信号,音频信号的音质较差,本发明实施例可根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,可提高拾音的效果,并提升用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例中提供的一种拾音方法的流程示意图;
图2是本发明第二实施例中提供的一种拾音方法的流程示意图;
图3是本发明第三实施例中提供的一种拾音方法的流程示意图;
图4是本发明第一实施例中提供的一种终端的结构示意图;
图5是本发明实施例中图4的一种人物头像获取单元的结构示意图;
图6是本发明实施例中图4的另一种人物头像获取单元的结构示意图;
图7是本发明实施例中图4的一种拾音控制单元的结构示意图;
图8是本发明实施例中图4的另一种拾音控制单元的结构示意图;
图9是本发明第二实施例中提供的一种终端的结构示意图;
图10是本发明实施例中提供的一种控制拾音装置进行拾音的效果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种终端,拾音即采集声音的过程,信息获取单元可以获取捕捉到的图像信息,人物头像获取单元在图像信息中获取目标人物头像,拾音控制单元根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,音频信号获取单元获取通过拾音控制后的拾音装置拾音得到的音频信号,本发明实施例可提高拾音的效果,并提升用户体验。
本发明实施例提及到的终端可以包括手机、平板电脑、PC(personalcomputer,个人计算机)或者佩戴式智能设备等具有拾音功能的终端。拾音装置可以包括麦克风或者话筒等,其中麦克风可以内置放大器。
请参见图1,图1是本发明实施例中提供的一种拾音方法的流程示意图,如图所示本发明实施例中的拾音方法可以包括:
S101,获取终端捕捉到的图像信息。
终端可以获取捕捉到的图像信息,以图10所示的控制拾音装置进行拾音的效果示意图为例,终端可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括至少一个人物头像。
在可选实施例中,终端获取到图像信息之后,可以获取用户设置的配置信息,检测该配置信息是否用于指示对拾音装置进行拾音控制,若该配置信息用于指示对拾音装置进行拾音控制,则进一步执行S102;若该配置信息用于指示不对拾音装置进行拾音控制,则对获取到的图像信息不进行处理。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,终端获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
S102,在图像信息中获取目标人物头像。
终端获取到图像信息之后,可以在图像信息中获取目标人物头像。
在可选实施例中,若图像信息包括一个人物头像,则终端可以识别图像信息中的人物头像,并将识别到的人物头像设定为目标人物头像。
在可选实施例中,若图像信息包括至少两个人物头像,则终端可以接收用户对图像信息提交的目标人物头像确认指令,根据目标人物头像确认指令识别图像信息中的目标人物头像,其中目标人物头像可以包括图像信息中的部分或全部人物头像。例如,终端检测到图像信息包括至少两个人物头像时,可以生成人物头像提示信息,并在终端的显示界面中显示该人物头像提示信息,用户可以根据该人物头像提示信息向终端提交目标人物头像确认指令,终端根据目标人物头像确认指令识别图像信息中的目标人物头像。
S103,根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制。
终端可以根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图为例,若检测到目标人物头像在图像信息中的位置位于右方,则终端可以对至少一个拾音装置进行拾音控制,示例性的,终端可以根据目标人物头像在图像信息中的位置,对拾音装置C进行拾音控制。
在可选实施例中,终端可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,并对确定的目标拾音装置进行拾音控制。确定目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作,也可以是选择其中几个(至少两个)的组合。另一种可选的方案,确定目标拾音装置,可以是调整终端已有的拾音装置的功能。进一步可选的,终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾音,并控制目标拾音装置中的其它拾音装置对目标人物头像对应的目标音源以外的其它音源进行噪声抑制。以图10为例,终端可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,以调整终端已有的拾音装置的功能为例:其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C,控制拾音装置C对目标人物头像进行拾音,并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
在可选实施例中,终端可以根据目标人物头像在图像信息中的位置,调整拾音装置的音频参数,进一步可选的,拾音装置的音频参数可以包括拾音装置的幅度,拾音装置可以包括第一拾音装置和第二拾音装置,则终端可以根据目标人物头像在图像信息中的位置,确定与目标人物头像匹配的第一拾音装置,并增大第一拾音装置的幅度,减小第二拾音装置的幅度。以图10为例,终端中的拾音装置包括拾音装置A、拾音装置B和拾音装置C,目标人物头像在图像信息中的位置位于右方,则终端可以确定与目标人物头像匹配的第一拾音装置为拾音装置C,进而增大拾音装置C的幅度,减小拾音装置A和拾音装置B的幅度,本发明实施例可增强目标人物头像对应的目标音源发送的音频信号,并抑制目标音源以外的其他音源发送的音频信号。
需要指出的是,本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置,还可以包括其他拾音装置,其中第一拾音装置可以包括至少一个拾音装置,第二拾音装置可以包括至少一个拾音装置,本发明实施例中的音频参数包含但不局限于幅度,还可以包括频率或者相位等,具体不受本发明实施例限制。
S104,获取通过拾音控制后的拾音装置拾音得到的音频信号。
终端对拾音装置进行拾音控制后,可以获取通过拾音控制后的拾音装置拾音得到的音频信号,具体的,若终端对目标拾音装置进行拾音控制,则可以获取通过拾音控制后的目标拾音装置拾音得到的音频信号;若终端对拾音装置的音频参数进行调整,则可以获取通过音频参数调整后的拾音装置拾音得到的音频信号。
在可选实施例中,终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号,以图10所示的控制拾音装置进行拾音的效果示意图为例,目标人物头像在图像信息中的位置位于右方,目标人物头像与拾音装置C之间的距离较短,则终端可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制,获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号,将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号,进而减去拾音装置B拾音得到的音频信号,以获取目标人物头像对应的目标音源发送的音频信号,并滤除目标音源以外的其他音源发送的音频信号。
在图1所示的拾音方法中,终端获取捕捉到的图像信息,在图像信息中获取目标人物头像,根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,获取通过拾音控制后的拾音装置拾音得到的音频信号,本发明实施例可提高拾音的效果,并提升用户体验。
请参见图2,图2是本发明第二实施例中提供的一种拾音方法的流程示意图,如图所示本发明实施例中的拾音方法可以包括:
S201,获取终端捕捉到的图像信息,其中图像信息包括一个人物头像。
终端可以获取捕捉到的图像信息,例如终端可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括一个人物头像。
在可选实施例中,终端获取到图像信息之后,可以获取用户设置的配置信息,检测该配置信息是否用于指示对拾音装置进行拾音控制,若该配置信息用于指示对拾音装置进行拾音控制,则进一步执行S202;若该配置信息用于指示不对拾音装置进行拾音控制,则对获取到的图像信息不进行处理。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,终端获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则可以识别图像信息中的人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
S202,识别图像信息中的人物头像。
终端获取到图像信息后,可以识别图像信息中的人物头像。以图10所示的控制拾音装置进行拾音的效果示意图为例,终端可以通过图像处理技术对图像信息进行分析,进而识别图像信息中的人物头像。
S203,将识别到的人物头像设定为目标人物头像。
终端识别到图像信息中的人物头像后,可以将识别到的人物头像设定为目标人物头像。
S204,根据目标人物头像在图像信息中的位置,确定目标拾音装置。
终端识别到目标人物头像后,可以根据目标人物头像在图像信息中的位置,确定目标拾音装置。确定目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作,也可以是选择其中几个(至少两个)的组合。以图10为例,若终端检测到目标人物头像在图像信息中的位置位于右方,则可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,其中目标拾音装置可以包括拾音装置C。
S205,对目标拾音装置进行拾音控制。
终端可以对确定的目标拾音装置进行拾音控制,具体的,终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾音,例如终端确定的目标拾音装置包括拾音装置C时,可以控制拾音装置C对目标人物头像进行拾音。
S206,获取通过拾音控制后的目标拾音装置拾音得到的音频信号。
终端对目标拾音装置进行拾音控制后,可以获取通过拾音控制后的目标拾音装置拾音得到的音频信号,具体的,终端可以获取通过拾音控制后的拾音装置C拾音得到的音频信号。
在图2所示的拾音方法中,终端将识别到的图像信息中的人物头像设定为目标人物头像,根据目标人物头像在图像信息中的位置确定目标拾音装置,对确定的目标拾音装置进行拾音控制,并获取通过拾音控制后的目标拾音装置拾音得到的音频信号,可提高拾音的效果,并提升用户体验。
请参见图3,图3是本发明第三实施例中提供的一种拾音方法的流程示意图,如图所示本发明实施例中的拾音方法可以包括:
S301,获取终端捕捉到的图像信息,其中图像信息包括至少两个人物头像。
终端可以获取捕捉到的图像信息,例如终端可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括至少两个人物头像。
在可选实施例中,终端获取到图像信息之后,可以获取用户设置的配置信息,检测该配置信息是否用于指示对拾音装置进行拾音控制,若该配置信息用于指示对拾音装置进行拾音控制,则进一步执行S302;若该配置信息用于指示不对拾音装置进行拾音控制,则对获取到的图像信息不进行处理。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,终端获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则可以接收用户对图像信息提交的目标人物头像确认指令。其中配置信息用于指示是否对拾音装置进行拾音控制。
S302,接收用户对图像信息提交的目标人物头像确认指令。
终端获取到的图像信息包括至少两个人物头像时,可以接收用户对图像信息提交的目标人物头像确认指令,其中目标人物头像可以包括图像信息中的部分或全部人物头像。例如,终端检测到图像信息包括至少两个人物头像时,可以生成人物头像提示信息,并在终端的显示界面中显示该人物头像提示信息,用户可以根据该人物头像提示信息向终端提交目标人物头像确认指令。
S303,根据目标人物头像确认指令,识别图像信息中的目标人物头像。
S304,根据目标人物头像在图像信息中的位置,调整拾音装置的音频参数。
终端识别到目标人物头像后,可以根据目标人物头像在图像信息中的位置,调整拾音装置的音频参数。可选的,拾音装置的音频参数可以包括拾音装置的幅度,拾音装置可以包括第一拾音装置和第二拾音装置,则终端可以根据目标人物头像在图像信息中的位置,确定与目标人物头像匹配的第一拾音装置,并增大第一拾音装置的幅度,减小第二拾音装置的幅度。以图10为例,终端中的拾音装置包括拾音装置A和拾音装置C,目标人物头像在图像信息中的位置位于右方,则终端可以确定与目标人物头像匹配的第一拾音装置为拾音装置C,进而增大拾音装置C的幅度,减小拾音装置A的幅度,本发明实施例可增强目标人物头像对应的目标音源发送的音频信号,并抑制目标音源以外的其他音源发送的音频信号。
需要指出的是,本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置,还可以包括其他拾音装置,例如拾音装置B,本发明实施例中的音频参数包含但不局限于幅度,还可以包括频率或者相位等,具体不受本发明实施例限制。
S305,获取通过音频参数调整后的拾音装置拾音得到的音频信号。
终端对拾音装置进行音频参数调整后,可以获取通过音频参数调整后的拾音装置拾音得到的音频信号,具体的,终端可以获取通过音频参数调整后的第一拾音装置拾音得到的音频信号,并获取通过音频参数调整后的第二拾音装置拾音得到的音频信号。
在可选实施例中,终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号,以图10所示的控制拾音装置进行拾音的效果示意图为例,目标人物头像在图像信息中的位置位于右方,目标人物头像与拾音装置C之间的距离较短,则终端可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制,获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号,将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号,进而减去拾音装置B拾音得到的音频信号,以获取目标人物头像对应的目标音源发送的音频信号,并滤除目标音源以外的其他音源发送的音频信号。
在图3所示的拾音方法中,终端根据用户对图像信息提交的目标人物头像确认指令,识别图像信息中的目标人物头像,根据目标人物头像在图像信息中的位置,调整拾音装置的音频参数,获取通过音频参数调整后的拾音装置拾音得到的音频信号,可提高拾音的效果,并提升用户体验。
请参见图4,图4是本发明第一实施例中提供的一种终端的结构示意图,如图所示本发明实施例中的终端400至少可以包括信息获取单元410、人物头像获取单元420、拾音控制单元430以及音频信号获取单元440,其中:
信息获取单元410,用于获取捕捉到的图像信息,以图10所示的控制拾音装置进行拾音的效果示意图为例,信息获取单元410可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括至少一个人物头像。
人物头像获取单元420,用于在所述图像信息中获取目标人物头像。
拾音控制单元430,用于根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图为例,若检测到目标人物头像在图像信息中的位置位于右方,则拾音控制单元430可以对至少一个拾音装置进行拾音控制,示例性的,终端可以根据目标人物头像在图像信息中的位置,对拾音装置C进行拾音控制。
音频信号获取单元440,用于获取拾音控制后的拾音装置拾音得到的音频信号。
作为一种可选的实施方式,信息获取单元410,还用于获取到所述图像信息之后,获取用户设置的配置信息,所述配置信息用于指示是否对所述拾音装置进行拾音控制,若检测到所述配置信息用于指示对所述拾音装置进行拾音控制,则触发所述人物头像获取单元420在所述图像信息中获取目标人物头像。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,信息获取单元410获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则人物头像获取单元420可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
作为一种可选的实施方式,图像信息可以包括一个人物头像,则本发明实施例中的人物头像获取单元420可以如图5所示,进一步包括:
第一识别单元510,用于识别所述图像信息中的人物头像。
设定单元520,用于将所述识别到的人物头像设定为目标人物头像。
作为一种可选的实施方式,图像信息可以包括至少两个人物头像,则本发明实施例中的人物头像获取单元420可以如图6所示,进一步包括:
指令接收单元610,用于接收用户对所述图像信息提交的目标人物头像确认指令。
第二识别单元620,用于根据所述目标人物头像确认指令,识别所述图像信息中的目标人物头像,其中目标人物头像可以包括图像信息中的部分或全部人物头像。
作为一种可选的实施方式,本发明实施例中的拾音控制单元430可以如图7所示,进一步包括:
第一确定单元710,用于根据所述目标人物头像在所述图像信息中的位置,确定目标拾音装置。第一确定单元710可以在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作,也可以是选择其中几个(至少两个)的组合。另一种可选的方案,第一确定单元710可以调整终端已有的拾音装置的功能。
第一控制单元720,用于对所述第一确定单元710确定的目标拾音装置进行拾音控制。
进一步可选的,第一控制单元720,用于控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。
第一控制单元720,还用于控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。
以图10为例,第一确定单元710可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,以调整终端已有的拾音装置的功能为例:其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C,第一控制单元720可以控制拾音装置C对目标人物头像进行拾音,并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
作为一种可选的实施方式,拾音控制单元430,用于根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数。
进一步可选的,音频参数可以包括拾音装置的幅度,拾音装置可以包括第一拾音装置和第二拾音装置,则本发明实施例中的拾音控制单元430可以如图8所示,进一步包括:
第二确定单元810,用于根据所述目标人物头像在所述图像信息中的位置,确定与所述目标人物头像匹配的第一拾音装置。
第二控制单元820,用于增大所述第一拾音装置的幅度,并减小所述第二拾音装置的幅度。
以图10为例,拾音装置包括拾音装置A和拾音装置C,目标人物头像在图像信息中的位置位于右方,则第二确定单元810可以确定与目标人物头像匹配的第一拾音装置为拾音装置C,第二控制单元820增大拾音装置C的幅度,减小拾音装置A的幅度。
需要指出的是,本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置,还可以包括其他拾音装置,例如拾音装置B,本发明实施例中的音频参数包含但不局限于幅度,还可以包括频率或者相位等,具体不受本发明实施例限制。
作为一种可选的实施方式,音频信号获取单元440,用于通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号。
以图10所示的控制拾音装置进行拾音的效果示意图为例,目标人物头像在图像信息中的位置位于右方,目标人物头像与拾音装置C之间的距离较短,则拾音控制单元430可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制,音频信号获取单元440获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号,并将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号,进而减去拾音装置B拾音得到的音频信号,以获取目标人物头像对应的目标音源发送的音频信号,并滤除目标音源以外的其他音源发送的音频信号。
在图4所示的终端中,人物头像获取单元420在信息获取单元410获取到的图像信息中获取目标人物头像,拾音控制单元430根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,音频信号获取单元440获取通过拾音控制后的拾音装置拾音得到的音频信号,可提高拾音的效果,并提升用户体验。
请参见图9,图9是本发明第二实施例中提供的一种终端的结构示意图,如图9所示,该终端900包括:至少一个处理器910,例如CPU,至少一个输入装置930,至少一个输出装置940,存储器950,至少一个总线920。其中,通信总线920用于实现这些组件之间的连接通信。例如,输入装置930可以包括触控板或者摄像头等,输出装置940可以包括显示屏。存储器950可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器950可选的还可以是至少一个位于远离前述处理器910的存储终端。其中处理器910可以结合图4~图8所示的终端,其中:
输入装置930,用于获取捕捉到的图像信息,以图10所示的控制拾音装置进行拾音的效果示意图为例,输入装置930可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括至少一个人物头像。
存储器950中存储一组程序代码,且处理器910调用存储器950中存储的程序代码,用于执行以下操作:
在所述图像信息中获取目标人物头像。
根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图为例,若检测到目标人物头像在图像信息中的位置位于右方,则处理器910可以对至少一个拾音装置进行拾音控制,示例性的,终端可以根据目标人物头像在图像信息中的位置,对拾音装置C进行拾音控制。
获取通过拾音控制后的拾音装置拾音得到的音频信号。
作为一种可选的实施方式,输入装置930获取到所述图像信息之后,处理器910可以获取用户设置的配置信息,所述配置信息用于指示是否对所述拾音装置进行拾音控制,若检测到所述配置信息用于指示对所述拾音装置进行拾音控制,则触发处理器910在所述图像信息中获取目标人物头像。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则处理器910可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
作为一种可选的实施方式,图像信息可以包括一个人物头像,则处理器910获取图像信息中的目标人物头像具体可以为:
识别所述图像信息中的人物头像。
将所述识别到的人物头像设定为目标人物头像。
作为一种可选的实施方式,图像信息可以包括至少两个人物头像,则处理器910获取图像信息中的目标人物头像具体可以为:
接收用户对所述图像信息提交的目标人物头像确认指令。
根据所述目标人物头像确认指令,识别所述图像信息中的目标人物头像,其中目标人物头像可以包括图像信息中的部分或全部人物头像。
作为一种可选的实施方式,处理器910根据目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制具体可以为:
根据所述目标人物头像在所述图像信息中的位置,确定目标拾音装置。确定的目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作,也可以是选择其中几个(至少两个)的组合。另一种可选的方案,确定目标拾音装置,可以是调整终端已有的拾音装置的功能。
对所述确定的目标拾音装置进行拾音控制。
进一步可选的,处理器910对所述确定的目标拾音装置进行拾音控制具体可以为:
控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。
控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。
以图10为例,可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,以调整终端已有的拾音装置的功能为例:其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C,处理器910可以控制拾音装置C对目标人物头像进行拾音,并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
作为一种可选的实施方式,处理器910根据目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制具体可以为:
根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数。
进一步可选的,音频参数可以包括拾音装置的幅度,拾音装置可以包括第一拾音装置和第二拾音装置,则处理器910根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数具体可以为:
根据所述目标人物头像在所述图像信息中的位置,确定与所述目标人物头像匹配的第一拾音装置。
增大所述第一拾音装置的幅度,并减小所述第二拾音装置的幅度。
以图10为例,拾音装置包括拾音装置A和拾音装置C,目标人物头像在图像信息中的位置位于右方,则处理器910可以确定与目标人物头像匹配的第一拾音装置为拾音装置C,增大拾音装置C的幅度,减小拾音装置A的幅度,本发明实施例可增强目标人物头像对应的目标音源发送的音频信号,并抑制目标音源以外的其他音源发送的音频信号。
需要指出的是,本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置,还可以包括其他拾音装置,例如拾音装置B,本发明实施例中的音频参数包含但不局限于幅度,还可以包括频率或者相位等,具体不受本发明实施例限制。
作为一种可选的实施方式,处理器910获取通过拾音控制后的拾音装置拾音得到的音频信号具体可以为:
通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号。以图10所示的控制拾音装置进行拾音的效果示意图为例,目标人物头像在图像信息中的位置位于右方,目标人物头像与拾音装置C之间的距离较短,则处理器910可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制,获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号,将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号,进而减去拾音装置B拾音得到的音频信号,以获取目标人物头像对应的目标音源发送的音频信号,并滤除目标音源以外的其他音源发送的音频信号。
具体的,本发明实施例中介绍的终端900可以用以实施本发明结合图1、图2或者图3介绍的拾音方法实施例中的部分或全部流程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明实施例所必须的。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
本发明实施例中所述单元,可以通过通用集成电路,例如CPU(CentralProcessing Unit,中央处理器),或通过ASIC(Application Specific IntegratedCircuit,专用集成电路)来实现。
以上对本发明实施例所提供的终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种终端,其特征在于,所述终端包括:
信息获取单元,用于获取捕捉到的图像信息;
人物头像获取单元,用于在所述图像信息中获取目标人物头像;
拾音控制单元,用于根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制;
音频信号获取单元,用于获取拾音控制后的拾音装置拾音得到的音频信号。
2.如权利要求1所述的终端,其特征在于,
所述信息获取单元,还用于获取到所述图像信息之后,获取用户设置的配置信息,所述配置信息用于指示是否对所述拾音装置进行拾音控制,若检测到所述配置信息用于指示对所述拾音装置进行拾音控制,则触发所述人物头像获取单元在所述图像信息中获取目标人物头像。
3.如权利要求1所述的终端,其特征在于,所述图像信息包括一个人物头像;
所述人物头像获取单元包括:
第一识别单元,用于识别所述图像信息中的人物头像;
设定单元,用于将所述识别到的人物头像设定为目标人物头像。
4.如权利要求1所述的终端,其特征在于,所述图像信息包括至少两个人物头像;
所述人物头像获取单元包括:
指令接收单元,用于接收用户对所述图像信息提交的目标人物头像确认指令;
第二识别单元,用于根据所述目标人物头像确认指令,识别所述图像信息中的目标人物头像。
5.如权利要求1所述的终端,其特征在于,所述拾音控制单元包括:
第一确定单元,用于根据所述目标人物头像在所述图像信息中的位置,确定目标拾音装置;
第一控制单元,用于对所述第一确定单元确定的目标拾音装置进行拾音控制。
6.如权利要求5所述的终端,其特征在于,
所述第一控制单元,用于控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音;
所述第一控制单元,还用于控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。
7.如权利要求1所述的终端,其特征在于,
所述拾音控制单元,用于根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数。
8.如权利要求7所述的终端,其特征在于,所述音频参数包括所述拾音装置的幅度,所述拾音装置包括第一拾音装置和第二拾音装置;
所述拾音控制单元包括:
第二确定单元,用于根据所述目标人物头像在所述图像信息中的位置,确定与所述目标人物头像匹配的第一拾音装置;
第二控制单元,用于增大所述第一拾音装置的幅度,并减小所述第二拾音装置的幅度。
9.如权利要求1所述的终端,其特征在于,
所述音频信号获取单元,用于通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号。
CN201410528655.6A 2014-10-09 2014-10-09 一种终端 Pending CN104410778A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410528655.6A CN104410778A (zh) 2014-10-09 2014-10-09 一种终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410528655.6A CN104410778A (zh) 2014-10-09 2014-10-09 一种终端

Publications (1)

Publication Number Publication Date
CN104410778A true CN104410778A (zh) 2015-03-11

Family

ID=52648369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410528655.6A Pending CN104410778A (zh) 2014-10-09 2014-10-09 一种终端

Country Status (1)

Country Link
CN (1) CN104410778A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101518049A (zh) * 2006-12-19 2009-08-26 雅马哈株式会社 视频会议装置
US20100159430A1 (en) * 2008-12-22 2010-06-24 Electronics And Telecommunications Research Institute Educational system and method using virtual reality
CN102625129A (zh) * 2012-03-31 2012-08-01 福州一点通广告装饰有限公司 远程真人三维虚拟仿场景互动的实现方法
CN103716446A (zh) * 2012-10-09 2014-04-09 中兴通讯股份有限公司 一种提高移动终端通话音质的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101518049A (zh) * 2006-12-19 2009-08-26 雅马哈株式会社 视频会议装置
US20100159430A1 (en) * 2008-12-22 2010-06-24 Electronics And Telecommunications Research Institute Educational system and method using virtual reality
CN102625129A (zh) * 2012-03-31 2012-08-01 福州一点通广告装饰有限公司 远程真人三维虚拟仿场景互动的实现方法
CN103716446A (zh) * 2012-10-09 2014-04-09 中兴通讯股份有限公司 一种提高移动终端通话音质的方法及装置

Similar Documents

Publication Publication Date Title
CN110970057B (zh) 一种声音处理方法、装置与设备
US11277686B2 (en) Electronic device with audio zoom and operating method thereof
CN107004426B (zh) 录取录像对象的声音的方法和移动终端
CN108377342A (zh) 双摄像头拍照方法、装置、存储介质及终端
CN104883497A (zh) 一种定位拍摄方法及移动终端
KR20210042952A (ko) 이미지 처리 방법 및 장치, 전자 기기 및 저장 매체
CN104506769A (zh) 一种拍摄方法及终端
US11720814B2 (en) Method and system for classifying time-series data
CN104580147A (zh) 一种语音回复方法、装置及系统
CN104424073A (zh) 一种信息处理的方法及电子设备
CN113676592B (zh) 录音方法、装置、电子设备及计算机可读介质
CN105139378A (zh) 卡片边界检测方法及装置
CN103826065A (zh) 一种图像处理方法和装置
KR20140145401A (ko) 전자 장치에서 노이즈를 제거하기 위한 장치 및 방법
CN105045846A (zh) 一种图像的存储方法及终端
CN105357444A (zh) 对焦方法和装置
CN104320729A (zh) 一种拾音方法
CN111742543A (zh) 电子设备及其记录方法
CN109561255B (zh) 终端拍照方法、装置及存储介质
CN107800961A (zh) 一种无损放大图片方法及装置、终端及可读存储介质
CN112423176A (zh) 耳机降噪方法、装置、存储介质及降噪耳机
CN105430259A (zh) 压力控制对焦拍照的装置、方法及移动终端
CN104410778A (zh) 一种终端
CN114659450B (zh) 机器人跟随方法、装置、机器人及存储介质
CN105812664A (zh) 移动终端拍照方法及移动终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150311