CN106157986B - 一种信息处理方法及装置、电子设备 - Google Patents

一种信息处理方法及装置、电子设备 Download PDF

Info

Publication number
CN106157986B
CN106157986B CN201610187393.0A CN201610187393A CN106157986B CN 106157986 B CN106157986 B CN 106157986B CN 201610187393 A CN201610187393 A CN 201610187393A CN 106157986 B CN106157986 B CN 106157986B
Authority
CN
China
Prior art keywords
real
time
camera
sound
focal length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610187393.0A
Other languages
English (en)
Other versions
CN106157986A (zh
Inventor
袁斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201610187393.0A priority Critical patent/CN106157986B/zh
Priority to CN202010508051.0A priority patent/CN111724823B/zh
Publication of CN106157986A publication Critical patent/CN106157986A/zh
Priority to DE102017106670.5A priority patent/DE102017106670B4/de
Priority to US15/472,605 priority patent/US20170289681A1/en
Application granted granted Critical
Publication of CN106157986B publication Critical patent/CN106157986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/802Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving processing of the sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • H04N23/675Focus control based on electronic image sensor signals comprising setting of focusing regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Abstract

本发明公开了一种信息处理方法及装置、电子设备,其中所述方法包括:通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;通过所述电子设备的摄像头的图像采集区域实时采集实时图像;基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。

Description

一种信息处理方法及装置、电子设备
技术领域
本发明涉及电子技术,尤其涉及一种信息处理方法及装置、电子设备。
背景技术
使用手机进行录像、录音的应用场合非常广泛,但录像之后再进行播放,录像中的音频也往往差强人意。录像的场合一般较为复杂,录音的质量由很多因素决定,除去周围环境噪声的变化之外,手机的麦克风数量、摆放位置以及算法息息相关。现在录像中有这样的需求,比如一个人在吵杂的环境中说话,用手机对这个人进行录像录音,能不能随着手机摄像头的推进(Zoom in)功能,音频消噪效果也随着变好?又比如用手机在录一群人在一起说话,除了周围的环境噪声之外,每个人的说话人都可以认为成其他人的干扰噪声,当集中一个人录像。随着整个录像的推进,能否对处于焦点之内的人说话人进行降噪处理,使他的说话声变得更清晰,声音更明显于其他说话者,而他周围的人和环境噪声被抑止掉。
一般的市面录像方法不和声音绑定在一起,录像的同时,对录音没有做很特别的处理。这种录像中的录音一般会调用手机的多麦克风消噪算法,对录音中的噪声有一定的消除作用。该方案的缺点在于:1)对单人录音的时候,当焦距发生变化比如人像被Zoom in拉近了,但声音依旧很小或者质量没法提高,这和一般人的感受违背(例如你走近一个人,除了面貌看的更清楚,他的声音也应该变大变清晰了)。2)录像中调节焦距录音的质量依旧没有发声任何变化,你比如在对多人录像,有些人已经在镜头之外了,但他的声音依旧会被采集到。 3)多麦克风形成的波束成形和摄像没有绑定在一起,比如要转移摄像的焦点,必须也得转动手机正对被摄像的目标人物。
发明内容
有鉴于此,本发明实施例为解决现有技术中存在的问题而提供一种信息处理方法及装置、电子设备,能够根据实时采集的图像调整麦克风的录音效果,从而提升用户体验。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供一种信息处理方法,所述方法包括:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
第二方面,本发明实施例提供一种信息处理方法,所述方法包括:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
获取输入操作,所述输入操作为用户对所述实时声音的操作;
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
第三方面,本发明实施例提供一种信息处理装置,所述装置包括第一采集单元、第二采集单元和调整单元,其中:
所述第一采集单元,用于通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
所述第二采集单元,用于通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
所述调整单元,用于基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
第四方面,本发明实施例提供一种信息处理装置,所述装置包括第三采集单元、获得单元、确定单元和执行单元,其中:
所述第三采集单元,用于通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
所述获得单元,用于获得输入操作,所述输入操作为用户对所述实时声音的操作;
所述确定单元,用于根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
所述执行单元,用于执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
第五方面,本发明实施例提供一种电子设备,所述电子设备包括麦克风、摄像头和处理器,其中所述处理器用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
第六方面,本发明实施例提供一种电子设备,所述电子设备包括麦克风和处理器,所述处理器,还用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
获取输入操作,所述输入操作为用户对所述实时声音的操作;
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
本发明实施例提供一种信息处理方法及装置、电子设备,其中,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;通过所述电子设备的摄像头的图像采集区域实时采集实时图像;基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同;如此,能够根据实时采集的图像调整麦克风的录音效果,从而提升用户体验。
附图说明
图1为本发明实施例一信息处理方法的实现流程示意图;
图2为本发明实施例二信息处理方法的实现流程示意图;
图3为本发明实施例降噪的流程示意图;
图4为本发明实施例的场景示意图一;
图5为本发明实施例的场景示意图二;
图6为本发明实施例六信息处理方法的实现流程示意图;
图7为本发明实施例七信息处理方法的实现流程示意图;
图8为本发明实施例八信息处理装置的组成结构示意图;
图9为本发明实施例九信息处理装置的组成结构示意图;
图10为本发明实施例十电子设备的组成结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
实施例一
为了解决背景技术存在的技术问题,本发明实施例提供一种信息处理方法,应用于电子设备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。
图1为本发明实施例一信息处理方法的实现流程示意图,如图1所示,该信息处理方法包括:
步骤S101,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
这里,所述电子设备在具体实施例的过程中可以为各种类型的具有信息处理能力的设备,例如所述电子设备可以包括手机、平板电脑、台式机、个人数字助理、导航仪、数字电话、视频电话、电视机等。为了实现录音功能,在本发明的实施例中,所述电子设备需要具有麦克风。另外,因为需要对实时采集 (或拾取)的声音进行缓存,因此所述电子设备还需要具有存储介质。作为一种实施例,所述进行实时缓存包括:将缓存的所有的实时声音作为一音频文件存储到存储介质上。
这里,所述电子设备上的麦克风可以是单个麦克风,也可以是麦克风阵列。一般来说,麦克风具有一个音频采集区域或范围,即麦克风的波束成形(beam forming)区域。
步骤S102,通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
步骤S103,基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
这里,在具体实现的过程中,所述步骤S101与步骤S102之间并无严格的先后执行顺序,可以先执行步骤S101再执行步骤S102,也可以先执行步骤S102 再执行步骤S101。
这里,所述预设的条件可以是音频采集区域与所述图像采集区域满足一定的预设关系,例如,音频采集区域与所述图像采集区域基本重合或者重合,或者音频采集区域的波束成形方向与图像采集区域的对焦方向具有一致性,或者音频采集区域的波束成形方向包括图像采集区域的对焦方向等。
在本发明的其他的实施例中,所述方法还包括:步骤S104,将所述实时图像显示在显示屏幕上。
本发明实施例中,所述进行实时缓存包括:将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
本发明实施例中至少对应有两种场景:第一种场景是,纯粹为了录音,在进行录音的过程中引入摄像头的图像采集区域对麦克风的控制参数进行控制,换句话说,在该场景下可以只存储实时录音而并不对存储实时图像,因此,输出的文件可以只包括录音文件而不包括图像文件。第二中场景是,录视频,即既需要存储实时声音,也需要存储实时图像,并且要将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上,这样,在录制完成后,当焦距发生变化比如人像被Zoom in拉近了,那么声音也会做出相应的变化如声音也被拉近了(即使在音量保持一致的情况下,这种声音拉近可能体现为声音变大了),所以能够使得用户看得体验和听得体验是一致的。
本发明实施例中,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;通过所述电子设备的摄像头的图像采集区域实时采集实时图像;基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同;如此,能够根据实时采集的图像调整麦克风的录音效果,从而提升用户体验。
实施例二
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。
图2为本发明实施例二信息处理方法的实现流程示意图,如图2所示,该信息处理方法包括:
步骤S201,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
步骤S202,通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
步骤S203,获得所述摄像头的焦距的变化参数;
这里,所述摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所实时采集的实时图像中对象与所述摄像头的焦距变化前所实时采集的实时图像中所述对象大小不同;在具体实现的过程中,所述摄像头的焦距的变化参数可以是用来体现摄像头推远和拉近的参数。
步骤S204,基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,所述第一控制参数用于降低所述实时声音中环境噪声或/和增强所述实时声音中目标声音。
其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
这里,在具体实现的过程中,所述第一控制参数可以采用信噪比或声音密度来体现。
这里,上述的步骤S203和步骤S204实际上提供一种实现实施例一中步骤 S103的实现方式。
这里,上述的步骤S201至步骤S202分别对应于实施例一中的步骤S101 至步骤S102,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤 S201至步骤S202,为节约篇幅,这里不再赘述。
本发明实施例中,如果是通过摄像头的焦距变化拉近了实时图像中对象,第一控制参数为增强实时声音中目标对象的声音,降低背景/环境音,以使得用户在最后播放音频文件或者视频文件时候,感觉上目标对象在近处说话。如果是通过摄像头的焦距变化推远了实时图像中对象,第一控制参数为将实时声音中目标对象的声音与背景/环境音混在一起,以使得用户在最后播放音频文件或者视频文件时候,感觉上目标对象在远处说话。
本发明实施例中,所述进行实时缓存,包括:将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
实施例三
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。该信息处理方法包括:
步骤S201,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
步骤S202,通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
步骤S203,获得所述摄像头的焦距的变化参数;
这里,所述摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所实时采集的实时图像中对象与所述摄像头的焦距变化前所实时采集的实时图像中所述对象大小不同;在具体实现的过程中,所述摄像头的焦距的变化参数可以是用来体现摄像头推远和拉近的参数。
步骤S241,根据所述摄像头的焦距参数和预设的规则确定调整后的信噪比;
这里,所述预设的规则用于体现焦距参数和信噪比之间的映射关系,例如映射关系列表,一般来说,焦距参数变大时信噪比应该提高,即在zoom in时,应该增加降噪的力度。
步骤S242,按照所述调整后的信噪比调整所述麦克风的信噪比。
其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
本实施例中,如果能从带噪语音的短时谱中估计出“纯净”语音的短时谱,即可达到语音增强的目的。这个过程需要信噪比估计,在原有一般算法给出的基础上通过人为在屏幕中选择的信息(Zoom in和Zoom out)传递给语音降噪算法,降噪算法对传递过来信息进行的两方面增益:一个增益为噪声特征增益,用于表征要消除多少噪声的力度;另一个增益为消除噪声之后,用于表征要对降噪之后要音量方面提升多少力度。本发明实施例中的降噪包括以下步骤:如图3所示,1)输入含有噪声的语音(含噪语音),对含噪语音进行时频域变换以及噪声特征估计,2)根据录像Zoom传递的参数确定改变后的增益,然后将噪声增益与噪声特征估计后的结果进行叠加;3)将含噪语音的特征值减去噪声的特征值的结果进行时频域变换,然后4)根据确定的增益对3)中的结果进行叠加,最后输出清晰的语音。
这里,上述的步骤S241和步骤S242实际上提供一种实现实施例一中步骤 S204的实现方式。在实施例二中,所述第一控制参数用于降低所述实时声音中环境噪声或/和增强所述实时声音中目标声音。具体地,在本实施例中,所述第一控制参数采用信噪比来体现。
这里,本实施例中的步骤S201至步骤S203分别对应于实施例二中的步骤 S201至步骤S203,因此,本领域的技术人员可以参阅实施例二而理解上述的步骤S201至步骤S203,为节约篇幅,这里不再赘述。
本发明实施例中,所述进行实时缓存,包括:将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
实施例四
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。该信息处理方法包括:
步骤S401,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
步骤S402,通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
步骤S403,获得所述摄像头的焦距方向的变化参数;
这里,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;
步骤S404,基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数;
这里,所述第二控制参数用于调整所述麦克风的音频采集区域;在具体实现的过程中,所述第二控制参数可以是波束成形的方向。
这里,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。在本实施例中,将根据焦距方向调整音频采集区域(beamforming的方向),即:基于所述摄像头的焦距方向信息确定波束成形的方向信息;按照波束成形的方向信息调整所述麦克风的音频采集区域。
这里,上述的步骤S401至步骤S402分别对应于实施例一中的步骤S101 至步骤S102,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤 S401至步骤S402,为节约篇幅,这里不再赘述。上述的步骤S403和步骤S404 实际上提供一种实现实施例一中步骤S103的实现方式。
本发明实施例中,所述进行实时缓存,包括:将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
实施例五
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。该信息处理方法包括:
步骤S501,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
步骤S502,通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
步骤S503,获得所述实时图像中的多个对象中目标对象;
这里,参见图4,在图4中的实时图像具有多个对象41至43,如果用户通过第一操作确定对象43,例如电子设备的屏幕是触摸屏,用户可以在电子设备的触摸屏上点击一下,那么电子设备就从实时图像中的多个对象中确定一个目标对象。再如,如果用户移动电子设备的摄像头对准对象43,那么电子设备就从实时图像中的多个对象中确定一个目标对象。
步骤S504,根据所述目标对象改变所述摄像头的对焦的目标参数;
这里,参见图4,在图4中的实时图像具有多个对象41至43,如果用户对焦的对象从对象41改变为对象43,那么电子设备根据用户的对焦操作获得所述实时图像中的目标对象为对象43,进而将对象43作为目标参数,所述目标参数可以采用一维参数来表示,例如用于表示左右的参数,所述目标参数还可以采用二维参数例如电子设备上触摸屏的位置坐标来表示。
步骤S505,基于所述摄像头的对焦的目标参数,调整所述麦克风的第一控制参数。
其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
这里,上述的步骤S501至步骤S502分别对应于实施例一中的步骤S101 至步骤S102,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤 S501至步骤S502,为节约篇幅,这里不再赘述。上述的步骤S503和步骤S505 实际上提供一种实现实施例一中步骤S103的实现方式。即在图像中具有多个对象时,当用户对焦于某个对象(目标对象)时,那么采集的声音应该就是目标对象的声音,而周围其他人的声音应该成为环境噪声而变小。
实施例六
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。
图6为本发明实施例六信息处理方法的实现流程示意图,如图6所示,该信息处理方法包括:
步骤S601,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
步骤S602,通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
步骤S603,获得所述实时图像中的多个对象中目标对象;
步骤S604,根据所述目标对象改变所述摄像头的对焦的目标参数;其中,所述摄像头的对焦的目标参数用于使得所述摄像头的对焦变化后所实时采集的实时图像中目标对象与所述摄像头的对焦变化前所实时采集的实时图像中的目标对象不同;
步骤S605,基于所述摄像头的对焦的目标参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
这里,上述的步骤S601至步骤S603分别对应于实施例一中的步骤S501 至步骤S503,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤 S601至步骤S603,为节约篇幅,这里不再赘述。上述的步骤S603至步骤S65 实际上提供一种实现实施例一中步骤S103的实现方式。即在图像中具有多个对象时,当用户对焦于某个对象(目标对象)时,那么麦克风采集的声音应该就是对焦方向的声音,而周围其他人的声音应该成为环境噪声而变小。
在以上的实施例都是基于多麦克风的波束成形的降噪方案,其原理是:在手机录像调节焦距的过程中,将调节焦距的信息(拉近拉远焦距或者转移录像焦点)传递给波束成形算法,综合了摄像焦点的方向和波束成形的指向方向这两种信息,对降噪力度和拾音指向性给与实时调节。当单个人录像录音时,如图5所示,如果调节焦距拉近人物,此时对比焦距方向和波束成形方向,二者方向应该大致吻合,传给降噪算法的信息只是焦距远近发生变化,那么对应的去调节降噪力度,使得说话人的声音清晰度对应发生变化。如图4所示,当多个人录像录音时,如果调节焦点发生移动,此时对比焦距方向和波束成形反向,二者方向应该差别很大,此时调节波束成形方向,使得波束成形方向变换到焦点转移后的方向。
下面是两种场景:第一个场景是:单个人录像录音时调节焦距(如图5 所示);使用的过程包括如下的流程,1)录像中的目标在说话;2)录像手机的摄像头的对焦方向与波束成形的方向一致;3)麦克风阵列形成波束成形的方向指向,audio zoom in的同时,增加降噪力度,使得声音更清晰。第二个场景是:多个人录像录音,多人说话调节对焦方向,使得波束成形的指向性对准目标人物。使用的过程包括如下流程:1)录像录音多个目标,多个人物在同时说话; 2)在屏幕中选择对焦某个人,那么调整波束成形的指向对准这个说话人;3)麦克风阵列形成波束成形的方向指向,audio zoom in的同时,增加降噪力度,使得声音更清晰。
采用本发明实施例之后的优势在于:1)录像和录音结合在一起,和人的贴身感官保持一致;当录像中调节焦距时,录音的音质也发生变化,而不是像业内常见的效果依旧保持没有任何变化。2)当单个人录像录音中,如果调节焦距拉近或拉远人物,那么将听到此人物的说话声的清晰度也随之发生变化。3)当多人录像录音中,如果转移焦点到其他说话人身上,那么将听到其他的说话人声变大或者变清晰,周围的人声音将会被消除掉。
实施例七
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。
图7为本发明实施例七信息处理方法的实现流程示意图,如图7所示,该信息处理方法包括:
步骤S701,通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
步骤S702,获取输入操作,所述输入操作为用户对所述实时声音的操作;
这里,所述输入操作可以是对软件上的界面的操作,也可以是物理按键,例如,本发明实施例提供的技术方案可以以录音软件的形式来体现,那么在该录音软件上可以有一个控制按钮,当用户点击这个控制按钮的时候,用户即输入了输入操作;再如,电子设备有一个物理按键如声音按键,如果在录音的过程中,当用户按下声音按键的时候,那么用户即输入了输入操作。
步骤S703,根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
步骤S704,执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
在本发明实施例中,所述控制指令至少包括第一控制指令和第二控制指令,其中所述第一控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离远一些(可以设置一个距离阈值),所述第二控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离近一些(可以设置一个距离阈值)。为了更好地理解本实施例的技术方案,下面举例来说明,例如电子设备上的麦克风具有一个机械结构,该机械结构能够调整麦克风与声音的音源之间的距离,如果用户的输入操作对应于第一控制指令时,那么可以通过控制机械结构使得麦克风与声音的音源之间的距离远一些,如果用户的输入操作对应于第二控制指令时,那么可以通过控制机械结构使得麦克风与声音的音源之间的距离近一些。
实施例八
基于前述的实施例,本发明实施例提供一种信息处理装置,该装置所包括的各单元,都可以通过电子设备中的处理器来实现,当然也可通过具体的逻辑电路实现;在具体实施例的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图8为本发明实施例八信息处理装置的组成结构示意图,如图8所示,该装置800包括第一采集单元801、第二采集单元802和调整单元803,其中:
所述第一采集单元,用于通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
所述第二采集单元,用于通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
所述调整单元,用于基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
在发明的其他实施例中,所述装置还包括显示单元,用于将所述实时图像显示在显示屏幕上。
在发明的其他实施例中,下面将提供几种实现所述调整单元的方式:
方式一:所述调整单元包括第一获得模块和第一调整模块,其中:
所述第一获得模块,用于获得所述摄像头的焦距的变化参数;其中,所述摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所实时采集的实时图像中对象与所述摄像头的焦距变化前所实时采集的实时图像中所述对象大小不同;
所述第一调整模块,用于基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,所述第一控制参数用于降低所述实时声音中环境噪声或/ 和增强所述实时声音中目标声音。
这里,所述第一调整模块包括确定子模块和调整子模块,其中:所述确定子模块,用于根据所述摄像头的焦距参数和预设的规则确定调整后的信噪比;所述调整子模块,用于按照所述调整后的信噪比调整所述麦克风的信噪比。
方式二:所述调整单元包括第三获得模块和第二调整模块,其中:
所述第三获得模块,用于获得所述摄像头的焦距方向的变化参数;其中,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;
所述第二调整模块,用于基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
方式三:所述调整单元包括第四获得模块、改变模块和第三调整模块,其中:所述第四获得模块,用于获得所述实时图像中的多个对象中目标对象;所述第一改变模块,用于根据所述目标对象改变所述摄像头的对焦的目标参数;所述第三调整模块,用于基于所述摄像头的对焦的目标参数,调整所述麦克风的第一控制参数。
方式四:所述调整单元包括第五获得模块、第二改变模块和第四调整模块,其中:
所述第五获得模块,用于获得所述实时图像中的多个对象中目标对象;
所述第二改变模块,用于根据所述目标对象改变所述摄像头的对焦的目标参数;其中,所述摄像头的对焦的目标参数用于使得所述摄像头的对焦变化后所实时采集的实时图像中目标对象与所述摄像头的对焦变化前所实时采集的实时图像中的目标对象不同;
所述第四调整模块,用于基于所述摄像头的对焦的目标参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
在本发明的其他实施例中,所述装置还包括存储单元,用于将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
实施例九
基于前述的实施例,本发明实施例提供一种信息处理装置,该装置所包括的各单元,都可以通过电子设备中的处理器来实现,当然也可通过具体的逻辑电路实现;在具体实施例的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图9为本发明实施例九信息处理装置的组成结构示意图,如图9所示,该装置900包括第三采集单元901、获得单元902、确定单元903和执行单元904,其中:
所述第三采集单元901,用于通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
所述获得单元902,用于获得输入操作,所述输入操作为用户对所述实时声音的操作;
所述确定单元903,用于根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
所述执行单元904,用于执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
实施例十
基于前述的实施例,本发明实施例提供一种电子设备,图10为本发明实施例十电子设备的组成结构示意图,如图10所示,所述电子设备1000包括麦克风1001、摄像头1002和处理器1003,其中所述处理器用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
本发明的其他实施例中,所述处理器还用于将所述实时图像显示在显示屏幕上。
本发明的其他实施例中,所述基于所述实时图像,调整所述麦克风的控制参数包括:
获得所述摄像头的焦距的变化参数;其中,所述摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所实时采集的实时图像中对象与所述摄像头的焦距变化前所实时采集的实时图像中所述对象大小不同;
基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,所述第一控制参数用于降低所述实时声音中环境噪声或/和增强所述实时声音中目标声音。
本发明的其他实施例中,所述基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,包括:
根据所述摄像头的焦距参数和预设的规则确定调整后的信噪比;
按照所述调整后的信噪比调整所述麦克风的信噪比。
本发明的其他实施例中,所述基于所述实时图像,调整所述麦克风的控制参数,包括:
获得所述摄像头的焦距方向的变化参数;其中,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;
基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
本发明的其他实施例中,所述基于所述实时图像,调整所述麦克风的控制参数包括:
获得所述实时图像中的多个对象中目标对象;
根据所述目标对象改变所述摄像头的对焦的目标参数;
基于所述摄像头的对焦的目标参数,调整所述麦克风的第一控制参数。
本发明的其他实施例中,所述基于所述实时图像,调整所述麦克风的控制参数包括:
获得所述实时图像中的多个对象中目标对象;
根据所述目标对象改变所述摄像头的对焦的目标参数;其中,所述摄像头的对焦的目标参数用于使得所述摄像头的对焦变化后所实时采集的实时图像中目标对象与所述摄像头的对焦变化前所实时采集的实时图像中的目标对象不同;
基于所述摄像头的对焦的目标参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
本发明的其他实施例中,所述处理器还包括:
将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,
将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
这里需要指出的是:以上电子设备实施例项的描述,与上述方法描述是类似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明电子设备实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的描述而理解,为节约篇幅,这里不再赘述。
实施例十一
基于前述的实施例,本发明实施例提供一种电子设备,所述电子设备包括麦克风和处理器,所述处理器,还用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
获取输入操作,所述输入操作为用户对所述实时声音的操作;
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
例如,输入操作可以为可以通过机械结构的方式将麦克风的拾音部分伸出靠近目标对象(例如,目标用户A)以达到所实时采集的声音以音频文件在保存存储在非易失的存储介质上后该音频文件通过喇叭等声音输出装置输出时该声音的效果为靠近用户A的效果,同样的原理,输入操作也可以通过机械结构的方式将麦克风的拾音部分回收远离目标对象(例如,目标用户A)以达到所实时采集的声音以音频文件在保存存储在非易失的存储介质上后该音频文件通过喇叭等声音输出装置输出时该声音的效果为远离用户A的效果。
当然,该实施例也可以通过上述实施例的方式通过软件调整采集参数的方法达到本实施例所要达到的效果。例如,输入操作可以为第一滑动操作,该第一滑动操作的方向可以为向着(靠近)需要采集的目标对象(例如,目标用户 A)的方向,该电子设备根据所述第一滑动操作产生第一控制参数,所述电子设备响应所述第一控制参数,增强实时声音中目标对象的目标声音,降低背景/ 环境音等噪音。以使得用户在播放音频文件(已经针对实时缓存的实时声音存储完成的)或者视频文件(已经针对实时缓存的实时声音存储完成的)时候,感觉上目标对象在近处说话。即,通过软件实现的技术手段模拟麦克风的拾音部分伸出去靠近目标对象的效果;同样的原理,输入操作可以为第二滑动操作,该第二滑动操作的方向可以为远离需要采集的目标对象(例如,目标用户A) 的方向,该电子设备根据所述第二滑动操作产生第二控制参数,所述电子设备响应所述第二控制参数,将实时声音中目标对象的声音与背景/环境音混在一起,以使得用户在播放音频文件(已经针对实时缓存的实时声音存储完成的)或者视频文件(已经针对实时缓存的实时声音存储完成的)时候,感觉上目标对象在远处说话;即,通过软件实现的技术手段模拟麦克风的拾音部分回收回来远离目标对象的效果。
这里需要指出的是:以上电子设备实施例项的描述,与上述方法描述是类似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明电子设备实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的描述而理解,为节约篇幅,这里不再赘述。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种信息处理方法,其特征在于,所述方法包括:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同;
其中,所述基于所述实时图像,调整所述麦克风的控制参数,包括:
获得所述摄像头的焦距方向的变化参数;其中,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中的对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;
基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述实时图像显示在显示屏幕上。
3.根据权利要求1所述的方法,其特征在于,所述基于所述实时图像,调整所述麦克风的控制参数还包括:
获得所述摄像头的焦距的变化参数;其中,所述摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所实时采集的实时图像中对象与所述摄像头的焦距变化前所实时采集的实时图像中所述对象大小不同;
基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,所述第一控制参数用于降低所述实时声音中环境噪声或/和增强所述实时声音中目标声音。
4.根据权利要求3所述的方法,其特征在于,所述基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,包括:
根据所述摄像头的焦距参数和预设的规则确定调整后的信噪比;
按照所述调整后的信噪比调整所述麦克风的信噪比。
5.根据权利要求1所述的方法,其特征在于,所述基于所述实时图像,调整所述麦克风的控制参数包括:
获得所述实时图像中的多个对象中目标对象;
根据所述目标对象改变所述摄像头的对焦的目标参数;
基于所述摄像头的对焦的目标参数,调整所述麦克风的第一控制参数,所述第一控制参数用于降低所述实时声音中环境噪声或/和增强所述实时声音中目标声音。
6.根据权利要求2所述的方法,其特征在于,所述基于所述实时图像,调整所述麦克风的控制参数包括:
获得所述实时图像中的多个对象中目标对象;
根据所述目标对象改变所述摄像头的对焦的目标参数;其中,所述摄像头的对焦的目标参数用于使得所述摄像头的对焦变化后所实时采集的实时图像中目标对象与所述摄像头的对焦变化前所实时采集的实时图像中的目标对象不同;
基于所述摄像头的对焦的目标参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
7.根据权利要求1或3所述的方法,其特征在于,所述方法还包括:
将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,
将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
8.一种信息处理方法,其特征在于,所述方法包括:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
获得所述摄像头的焦距方向的变化参数;其中,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中的对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;
基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域;
根据所述摄像头的焦距方向的变化参数获取输入操作,所述输入操作为用户对所述实时声音的操作;
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
9.一种信息处理装置,其特征在于,所述装置包括第一采集单元、第二采集单元和调整单元,其中:
所述第一采集单元,用于通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
所述第二采集单元,用于通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
所述调整单元,用于基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同;
其中,所述调整单元包括:第一获得模块,用于获得所述摄像头的焦距方向的变化参数,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中的对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;第一调整模块,用于基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
10.一种信息处理装置,其特征在于,所述装置包括第三采集单元、第四采集单元、获得单元、确定单元和执行单元,其中:
所述第三采集单元,用于通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
所述第四采集单元,用于通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
所述获得单元,用于获得所述摄像头的焦距方向的变化参数;所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中的对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域;根据所述摄像头的焦距方向的变化参数获得输入操作,所述输入操作为用户对所述实时声音的操作;
所述确定单元,用于根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
所述执行单元,用于执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
11.一种电子设备,其特征在于,所述电子设备包括麦克风、摄像头和处理器,其中所述处理器用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同;
其中,所述基于所述实时图像,调整所述麦克风的控制参数,包括:
获得所述摄像头的焦距方向的变化参数;其中,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中的对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;
基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
12.一种电子设备,其特征在于,所述电子设备包括麦克风和处理器,所述处理器,还用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
获得所述摄像头的焦距方向的变化参数;其中,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中的对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;
基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域;
根据所述摄像头的焦距方向的变化参数获取输入操作,所述输入操作为用户对所述实时声音的操作;
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
CN201610187393.0A 2016-03-29 2016-03-29 一种信息处理方法及装置、电子设备 Active CN106157986B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201610187393.0A CN106157986B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置、电子设备
CN202010508051.0A CN111724823B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置
DE102017106670.5A DE102017106670B4 (de) 2016-03-29 2017-03-28 Verfahren und Vorrichtung für Audioaufnahmen
US15/472,605 US20170289681A1 (en) 2016-03-29 2017-03-29 Method, apparatus and computer program product for audio capture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610187393.0A CN106157986B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置、电子设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010508051.0A Division CN111724823B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN106157986A CN106157986A (zh) 2016-11-23
CN106157986B true CN106157986B (zh) 2020-05-26

Family

ID=57353711

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010508051.0A Active CN111724823B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置
CN201610187393.0A Active CN106157986B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置、电子设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010508051.0A Active CN111724823B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置

Country Status (3)

Country Link
US (1) US20170289681A1 (zh)
CN (2) CN111724823B (zh)
DE (1) DE102017106670B4 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106817653B (zh) * 2017-02-17 2020-01-14 Oppo广东移动通信有限公司 音频设定方法及装置
CN106803910A (zh) * 2017-02-28 2017-06-06 努比亚技术有限公司 一种音频处理装置及方法
CN107105183A (zh) * 2017-04-28 2017-08-29 宇龙计算机通信科技(深圳)有限公司 录音音量调节方法及装置
CN107274910A (zh) * 2017-05-17 2017-10-20 宁波桑德纳电子科技有限公司 一种音视频联动的监控装置及音视频联动方法
CN107197187A (zh) * 2017-05-27 2017-09-22 维沃移动通信有限公司 一种视频的拍摄方法及移动终端
CN108965757B (zh) * 2018-08-02 2021-04-06 广州酷狗计算机科技有限公司 视频录制方法、装置、终端及存储介质
CN108682161B (zh) * 2018-08-10 2023-09-15 东方智测(北京)科技有限公司 确认车辆鸣笛的方法和系统
US11463615B2 (en) * 2019-03-13 2022-10-04 Panasonic Intellectual Property Management Co., Ltd. Imaging apparatus
CN110175013A (zh) * 2019-05-20 2019-08-27 北京声智科技有限公司 语音录入方法、装置、电子设备及存储介质
CN112073663B (zh) * 2019-06-10 2023-08-11 海信视像科技股份有限公司 音频增益调节方法、视频聊天方法及显示设备
CN113132863B (zh) * 2020-01-16 2022-05-24 华为技术有限公司 立体声拾音方法、装置、终端设备和计算机可读存储介质
CN111863002A (zh) * 2020-07-06 2020-10-30 Oppo广东移动通信有限公司 处理方法、处理装置、电子设备
CN113992836A (zh) * 2020-07-27 2022-01-28 中兴通讯股份有限公司 变焦视频的音量调节方法、装置和视频拍摄设备
CN112565973B (zh) * 2020-12-21 2023-08-01 Oppo广东移动通信有限公司 终端、终端控制方法、装置及存储介质
CN114827448A (zh) * 2021-01-29 2022-07-29 华为技术有限公司 视频录制方法及电子设备
CN113225646B (zh) * 2021-04-28 2022-09-20 世邦通信股份有限公司 音视频监控方法、装置、电子设备及存储介质
CN115942108A (zh) * 2021-08-12 2023-04-07 北京荣耀终端有限公司 一种视频处理方法及电子设备
CN113676687A (zh) * 2021-08-30 2021-11-19 联想(北京)有限公司 一种信息处理方法及电子设备
CN113689873A (zh) * 2021-09-07 2021-11-23 联想(北京)有限公司 噪声抑制方法、装置及电子设备和存储介质
CN113840087B (zh) * 2021-09-09 2023-06-16 Oppo广东移动通信有限公司 声音处理方法、装置、电子设备和计算机可读存储介质
CN115134499B (zh) * 2022-06-28 2024-02-02 世邦通信股份有限公司 一种音视频监控方法及系统
CN116705047B (zh) * 2023-07-31 2023-11-14 北京小米移动软件有限公司 音频采集方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045618A (zh) * 2009-10-19 2011-05-04 联想(北京)有限公司 自动调整的麦克风阵列、方法和携带麦克风阵列的装置
CN103916723A (zh) * 2013-01-08 2014-07-09 联想(北京)有限公司 一种声音采集方法以及一种电子设备
CN104320729A (zh) * 2014-10-09 2015-01-28 深圳市金立通信设备有限公司 一种拾音方法
CN104376247A (zh) * 2014-11-17 2015-02-25 联想(北京)有限公司 一种信息处理方法及电子设备
CN105357560A (zh) * 2015-09-28 2016-02-24 努比亚技术有限公司 缓存处理方法和装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931138B2 (en) 2000-10-25 2005-08-16 Matsushita Electric Industrial Co., Ltd Zoom microphone device
US7627139B2 (en) * 2002-07-27 2009-12-01 Sony Computer Entertainment Inc. Computer image and audio processing of intensity and input devices for interfacing with a computer program
JP4507281B2 (ja) * 2006-03-30 2010-07-21 富士フイルム株式会社 画像表示装置、撮像装置および画像表示方法
CN100442837C (zh) * 2006-07-25 2008-12-10 华为技术有限公司 一种具有声音位置信息的视频通讯系统及其获取方法
US8094202B2 (en) * 2007-05-17 2012-01-10 Canon Kabushiki Kaisha Moving image capture apparatus and moving image capture method
US8319858B2 (en) * 2008-10-31 2012-11-27 Fortemedia, Inc. Electronic apparatus and method for receiving sounds with auxiliary information from camera system
US8184180B2 (en) * 2009-03-25 2012-05-22 Broadcom Corporation Spatially synchronized audio and video capture
KR20110038313A (ko) * 2009-10-08 2011-04-14 삼성전자주식회사 영상촬영장치 및 그 제어방법
CN102860041A (zh) * 2010-04-26 2013-01-02 剑桥机电有限公司 对收听者进行位置跟踪的扬声器
JP5722007B2 (ja) * 2010-11-24 2015-05-20 ルネサスエレクトロニクス株式会社 音声処理装置および音声処理方法並びにプログラム
US8761412B2 (en) * 2010-12-16 2014-06-24 Sony Computer Entertainment Inc. Microphone array steering with image-based source location
KR20150068112A (ko) * 2013-12-11 2015-06-19 삼성전자주식회사 오디오를 추적하기 위한 방법 및 전자 장치
CN103888703B (zh) * 2014-03-28 2015-11-25 努比亚技术有限公司 增强录音的拍摄方法和摄像装置
WO2015168901A1 (en) * 2014-05-08 2015-11-12 Intel Corporation Audio signal beam forming
CN105245811B (zh) * 2015-10-16 2018-03-27 广东欧珀移动通信有限公司 一种录像方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045618A (zh) * 2009-10-19 2011-05-04 联想(北京)有限公司 自动调整的麦克风阵列、方法和携带麦克风阵列的装置
CN103916723A (zh) * 2013-01-08 2014-07-09 联想(北京)有限公司 一种声音采集方法以及一种电子设备
CN104320729A (zh) * 2014-10-09 2015-01-28 深圳市金立通信设备有限公司 一种拾音方法
CN104376247A (zh) * 2014-11-17 2015-02-25 联想(北京)有限公司 一种信息处理方法及电子设备
CN105357560A (zh) * 2015-09-28 2016-02-24 努比亚技术有限公司 缓存处理方法和装置

Also Published As

Publication number Publication date
CN106157986A (zh) 2016-11-23
CN111724823A (zh) 2020-09-29
US20170289681A1 (en) 2017-10-05
DE102017106670B4 (de) 2023-12-21
DE102017106670A1 (de) 2017-10-05
CN111724823B (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN106157986B (zh) 一种信息处理方法及装置、电子设备
JP6023779B2 (ja) オーディオ情報処理の方法及び装置
RU2663343C2 (ru) Система, устройство и способ для совместимого воспроизведения акустической сцены на основе адаптивных функций
JP6703525B2 (ja) 音源を強調するための方法及び機器
JP4539385B2 (ja) 撮像装置、撮像制御プログラム
CN106960670B (zh) 一种录音方法和电子设备
Donley et al. Easycom: An augmented reality dataset to support algorithms for easy communication in noisy environments
CN111128221B (zh) 一种音频信号处理方法、装置、终端及存储介质
JP6125457B2 (ja) 収音システム及び放音システム
US20140241702A1 (en) Dynamic audio perspective change during video playback
US11863952B2 (en) Sound capture for mobile devices
US9756421B2 (en) Audio refocusing methods and electronic devices utilizing the same
JP7439131B2 (ja) 空間オーディオをキャプチャする装置および関連する方法
CN116055869B (zh) 一种视频处理方法和终端
US20220337945A1 (en) Selective sound modification for video communication
CN115942108A (zh) 一种视频处理方法及电子设备
CN113223543B (zh) 语音增强方法、装置和存储介质
CN114449341B (zh) 音频处理方法、装置、可读介质及电子设备
CN117636928A (zh) 一种拾音装置及相关音频增强方法
CN116634319A (zh) 音频处理方法、装置、电子设备和存储介质
WO2024036113A1 (en) Spatial enhancement for user-generated content
EP3706432A1 (en) Processing multiple spatial audio signals which have a spatial overlap
CN114630240A (zh) 方向滤波器的生成方法、音频处理方法、装置及存储介质
CN117880731A (zh) 一种音视频录制方法、装置及储存介质
CN115314653A (zh) 图像和音频装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant