CN111724823A - 一种信息处理方法及装置、电子设备 - Google Patents

一种信息处理方法及装置、电子设备 Download PDF

Info

Publication number
CN111724823A
CN111724823A CN202010508051.0A CN202010508051A CN111724823A CN 111724823 A CN111724823 A CN 111724823A CN 202010508051 A CN202010508051 A CN 202010508051A CN 111724823 A CN111724823 A CN 111724823A
Authority
CN
China
Prior art keywords
real
time
sound
camera
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010508051.0A
Other languages
English (en)
Other versions
CN111724823B (zh
Inventor
袁斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202010508051.0A priority Critical patent/CN111724823B/zh
Publication of CN111724823A publication Critical patent/CN111724823A/zh
Application granted granted Critical
Publication of CN111724823B publication Critical patent/CN111724823B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/802Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving processing of the sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • H04N23/675Focus control based on electronic image sensor signals comprising setting of focusing regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Abstract

本发明公开了一种信息处理方法及装置、电子设备,其中所述方法包括:通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;通过所述电子设备的摄像头的图像采集区域实时采集实时图像;基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。

Description

一种信息处理方法及装置、电子设备
技术领域
本发明涉及电子技术,尤其涉及一种信息处理方法及装置、电子设备。
背景技术
使用手机进行录像、录音的应用场合非常广泛,但录像之后再进行播放, 录像中的音频也往往差强人意。录像的场合一般较为复杂,录音的质量由很多 因素决定,除去周围环境噪声的变化之外,手机的麦克风数量、摆放位置以及 算法息息相关。现在录像中有这样的需求,比如一个人在吵杂的环境中说话, 用手机对这个人进行录像录音,能不能随着手机摄像头的推进(Zoom in)功能, 音频消噪效果也随着变好?又比如用手机在录一群人在一起说话,除了周围的 环境噪声之外,每个人的说话人都可以认为成其他人的干扰噪声,当集中一个 人录像。随着整个录像的推进,能否对处于焦点之内的人说话人进行降噪处理, 使他的说话声变得更清晰,声音更明显于其他说话者,而他周围的人和环境噪 声被抑止掉。
一般的市面录像方法不和声音绑定在一起,录像的同时,对录音没有做很 特别的处理。这种录像中的录音一般会调用手机的多麦克风消噪算法,对录音 中的噪声有一定的消除作用。该方案的缺点在于:1)对单人录音的时候,当焦 距发生变化比如人像被Zoom in拉近了,但声音依旧很小或者质量没法提高, 这和一般人的感受违背(例如你走近一个人,除了面貌看的更清楚,他的声音 也应该变大变清晰了)。2)录像中调节焦距录音的质量依旧没有发声任何变化, 你比如在对多人录像,有些人已经在镜头之外了,但他的声音依旧会被采集到。 3)多麦克风形成的波束成形和摄像没有绑定在一起,比如要转移摄像的焦点, 必须也得转动手机正对被摄像的目标人物。
发明内容
有鉴于此,本发明实施例为解决现有技术中存在的问题而提供一种信息处 理方法及装置、电子设备,能够根据实时采集的图像调整麦克风的录音效果, 从而提升用户体验。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供一种信息处理方法,所述方法包括:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓 存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区 域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音 进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的 声音效果不同。
第二方面,本发明实施例提供一种信息处理方法,所述方法包括:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓 存;
获取输入操作,所述输入操作为用户对所述实时声音的操作;
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采 集的声音的音源相对于所述电子设备之间的距离的远近;
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进 行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时 声音进行音频输出时的声音的远近效果不同。
第三方面,本发明实施例提供一种信息处理装置,所述装置包括第一采集 单元、第二采集单元和调整单元,其中:
所述第一采集单元,用于通过电子设备的麦克风的音频采集区域实时采集 实时声音并进行实时缓存;
所述第二采集单元,用于通过所述电子设备的摄像头的图像采集区域实时 采集实时图像;
所述调整单元,用于基于所述实时图像,调整所述麦克风的控制参数,其 中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所 实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声 音进行音频输出时的声音效果不同。
第四方面,本发明实施例提供一种信息处理装置,所述装置包括第三采集 单元、获得单元、确定单元和执行单元,其中:
所述第三采集单元,用于通过电子设备的麦克风的音频采集区域实时采集 实时声音并进行实时缓存;
所述获得单元,用于获得输入操作,所述输入操作为用户对所述实时声音 的操作;
所述确定单元,用于根据所述输入操作确定控制指令,所述控制指令用于 控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
所述执行单元,用于执行所述控制指令,以使得执行所述控制指令后所实 时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令 前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
第五方面,本发明实施例提供一种电子设备,所述电子设备包括麦克风、 摄像头和处理器,其中所述处理器用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓 存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区 域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音 进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的 声音效果不同。
第六方面,本发明实施例提供一种电子设备,所述电子设备包括麦克风和 处理器,所述处理器,还用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓 存;
获取输入操作,所述输入操作为用户对所述实时声音的操作;
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采 集的声音的音源相对于所述电子设备之间的距离的远近;
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进 行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时 声音进行音频输出时的声音的远近效果不同。
本发明实施例提供一种信息处理方法及装置、电子设备,其中,通过电子 设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;通过所述电 子设备的摄像头的图像采集区域实时采集实时图像;基于所述实时图像,调整 所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预 设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与 调整前所实时采集的实时声音进行音频输出时的声音效果不同;如此,能够根 据实时采集的图像调整麦克风的录音效果,从而提升用户体验。
附图说明
图1为本发明实施例一信息处理方法的实现流程示意图;
图2为本发明实施例二信息处理方法的实现流程示意图;
图3为本发明实施例降噪的流程示意图;
图4为本发明实施例的场景示意图一;
图5为本发明实施例的场景示意图二;
图6为本发明实施例六信息处理方法的实现流程示意图;
图7为本发明实施例七信息处理方法的实现流程示意图;
图8为本发明实施例八信息处理装置的组成结构示意图;
图9为本发明实施例九信息处理装置的组成结构示意图;
图10为本发明实施例十电子设备的组成结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
实施例一
为了解决背景技术存在的技术问题,本发明实施例提供一种信息处理方法, 应用于电子设备,该信息处理方法所实现的功能可以通过电子设备中的处理器 调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该 电子设备至少包括处理器和存储介质。
图1为本发明实施例一信息处理方法的实现流程示意图,如图1所示,该 信息处理方法包括:
步骤S101,通过电子设备的麦克风的音频采集区域实时采集实时声音并进 行实时缓存。
这里,所述电子设备在具体实施例的过程中可以为各种类型的具有信息处 理能力的设备,例如所述电子设备可以包括手机、平板电脑、台式机、个人数 字助理、导航仪、数字电话、视频电话、电视机等。为了实现录音功能,在本 发明的实施例中,所述电子设备需要具有麦克风。另外,因为需要对实时采集 (或拾取)的声音进行缓存,因此所述电子设备还需要具有存储介质。作为一 种实施例,所述进行实时缓存包括:将缓存的所有的实时声音作为一音频文件 存储到存储介质上。
这里,所述电子设备上的麦克风可以是单个麦克风,也可以是麦克风阵列。 一般来说,麦克风具有一个音频采集区域或范围,即麦克风的波束成形(beam forming)区域。
步骤S102,通过所述电子设备的摄像头的图像采集区域实时采集实时图 像。
步骤S103,基于所述实时图像,调整所述麦克风的控制参数,其中,所述 音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集 的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音 频输出时的声音效果不同。
这里,在具体实现的过程中,所述步骤S101与步骤S102之间并无严格的 先后执行顺序,可以先执行步骤S101再执行步骤S102,也可以先执行步骤S102 再执行步骤S101。
这里,所述预设的条件可以是音频采集区域与所述图像采集区域满足一定 的预设关系,例如,音频采集区域与所述图像采集区域基本重合或者重合,或 者音频采集区域的波束成形方向与图像采集区域的对焦方向具有一致性,或者 音频采集区域的波束成形方向包括图像采集区域的对焦方向等。
在本发明的其他的实施例中,所述方法还包括:步骤S104,将所述实时图 像显示在显示屏幕上。
本发明实施例中,所述进行实时缓存包括:将缓存的所有的实时声音作为 一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的所 有的实时图像一起作为一视频文件存储在存储介质上。
本发明实施例中至少对应有两种场景:第一种场景是,纯粹为了录音,在 进行录音的过程中引入摄像头的图像采集区域对麦克风的控制参数进行控制, 换句话说,在该场景下可以只存储实时录音而并不对存储实时图像,因此,输 出的文件可以只包括录音文件而不包括图像文件。第二中场景是,录视频,即 既需要存储实时声音,也需要存储实时图像,并且要将缓存的所有的实时声音 以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上,这样,在 录制完成后,当焦距发生变化比如人像被Zoom in拉近了,那么声音也会做出 相应的变化如声音也被拉近了(即使在音量保持一致的情况下,这种声音拉近 可能体现为声音变大了),所以能够使得用户看得体验和听得体验是一致的。
本发明实施例中,通过电子设备的麦克风的音频采集区域实时采集实时声 音并进行实时缓存;通过所述电子设备的摄像头的图像采集区域实时采集实时 图像;基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集 区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声 音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时 的声音效果不同;如此,能够根据实时采集的图像调整麦克风的录音效果,从 而提升用户体验。
实施例二
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设 备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码 来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少 包括处理器和存储介质。
图2为本发明实施例二信息处理方法的实现流程示意图,如图2所示,该 信息处理方法包括:
步骤S201,通过电子设备的麦克风的音频采集区域实时采集实时声音并进 行实时缓存。
步骤S202,通过所述电子设备的摄像头的图像采集区域实时采集实时图 像。
步骤S203,获得所述摄像头的焦距的变化参数。
这里,所述摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所 实时采集的实时图像中对象与所述摄像头的焦距变化前所实时采集的实时图像 中所述对象大小不同;在具体实现的过程中,所述摄像头的焦距的变化参数可 以是用来体现摄像头推远和拉近的参数。
步骤S204,基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控 制参数,所述第一控制参数用于降低所述实时声音中环境噪声或/和增强所述实 时声音中目标声音。
其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调 整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的 实时声音进行音频输出时的声音效果不同。
这里,在具体实现的过程中,所述第一控制参数可以采用信噪比或声音密 度来体现。
这里,上述的步骤S203和步骤S204实际上提供一种实现实施例一中步骤 S103的实现方式。
这里,上述的步骤S201至步骤S202分别对应于实施例一中的步骤S101 至步骤S102,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤 S201至步骤S202,为节约篇幅,这里不再赘述。
本发明实施例中,如果是通过摄像头的焦距变化拉近了实时图像中对象, 第一控制参数为增强实时声音中目标对象的声音,降低背景/环境音,以使得用 户在最后播放音频文件或者视频文件时候,感觉上目标对象在近处说话。如果 是通过摄像头的焦距变化推远了实时图像中对象,第一控制参数为将实时声音 中目标对象的声音与背景/环境音混在一起,以使得用户在最后播放音频文件或 者视频文件时候,感觉上目标对象在远处说话。
本发明实施例中,所述进行实时缓存,包括:将缓存的所有的实时声音作 为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的 所有的实时图像一起作为一视频文件存储在存储介质上。
实施例三
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设 备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码 来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少 包括处理器和存储介质。该信息处理方法包括:
步骤S201,通过电子设备的麦克风的音频采集区域实时采集实时声音并进 行实时缓存。
步骤S202,通过所述电子设备的摄像头的图像采集区域实时采集实时图 像。
步骤S203,获得所述摄像头的焦距的变化参数。
这里,所述摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所 实时采集的实时图像中对象与所述摄像头的焦距变化前所实时采集的实时图像 中所述对象大小不同;在具体实现的过程中,所述摄像头的焦距的变化参数可 以是用来体现摄像头推远和拉近的参数。
步骤S241,根据所述摄像头的焦距参数和预设的规则确定调整后的信噪 比。
这里,所述预设的规则用于体现焦距参数和信噪比之间的映射关系,例如 映射关系列表,一般来说,焦距参数变大时信噪比应该提高,即在zoom in时, 应该增加降噪的力度。
步骤S242,按照所述调整后的信噪比调整所述麦克风的信噪比。
其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调 整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的 实时声音进行音频输出时的声音效果不同。
本实施例中,如果能从带噪语音的短时谱中估计出“纯净”语音的短时谱, 即可达到语音增强的目的。这个过程需要信噪比估计,在原有一般算法给出的 基础上通过人为在屏幕中选择的信息(Zoom in和Zoom out)传递给语音降噪 算法,降噪算法对传递过来信息进行的两方面增益:一个增益为噪声特征增益, 用于表征要消除多少噪声的力度;另一个增益为消除噪声之后,用于表征要对 降噪之后要音量方面提升多少力度。本发明实施例中的降噪包括以下步骤:如 图3所示,1)输入含有噪声的语音(含噪语音),对含噪语音进行时频域变换 以及噪声特征估计,2)根据录像Zoom传递的参数确定改变后的增益,然后将 噪声增益与噪声特征估计后的结果进行叠加;3)将含噪语音的特征值减去噪声 的特征值的结果进行时频域变换,然后4)根据确定的增益对3)中的结果进行 叠加,最后输出清晰的语音。
这里,上述的步骤S241和步骤S242实际上提供一种实现实施例一中步骤 S204的实现方式。在实施例二中,所述第一控制参数用于降低所述实时声音中 环境噪声或/和增强所述实时声音中目标声音。具体地,在本实施例中,所述第 一控制参数采用信噪比来体现。
这里,本实施例中的步骤S201至步骤S203分别对应于实施例二中的步骤 S201至步骤S203,因此,本领域的技术人员可以参阅实施例二而理解上述的 步骤S201至步骤S203,为节约篇幅,这里不再赘述。
本发明实施例中,所述进行实时缓存,包括:将缓存的所有的实时声音作 为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的 所有的实时图像一起作为一视频文件存储在存储介质上。
实施例四
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设 备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码 来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少 包括处理器和存储介质。该信息处理方法包括:
步骤S401,通过电子设备的麦克风的音频采集区域实时采集实时声音并进 行实时缓存。
步骤S402,通过所述电子设备的摄像头的图像采集区域实时采集实时图 像。
步骤S403,获得所述摄像头的焦距方向的变化参数。
这里,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向 变化后所实时采集的实时图像中对象与所述摄像头的焦距方向变化前所实时采 集的实时图像中的对象不同。
步骤S404,基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第 二控制参数。
这里,所述第二控制参数用于调整所述麦克风的音频采集区域;在具体实 现的过程中,所述第二控制参数可以是波束成形的方向。
这里,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调 整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的 实时声音进行音频输出时的声音效果不同。在本实施例中,将根据焦距方向调 整音频采集区域(beamforming的方向),即:基于所述摄像头的焦距方向信息 确定波束成形的方向信息;按照波束成形的方向信息调整所述麦克风的音频采 集区域。
这里,上述的步骤S401至步骤S402分别对应于实施例一中的步骤S101 至步骤S102,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤 S401至步骤S402,为节约篇幅,这里不再赘述。上述的步骤S403和步骤S404 实际上提供一种实现实施例一中步骤S103的实现方式。
本发明实施例中,所述进行实时缓存,包括:将缓存的所有的实时声音作 为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的 所有的实时图像一起作为一视频文件存储在存储介质上。
实施例五
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设 备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码 来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少 包括处理器和存储介质。该信息处理方法包括:
步骤S501,通过电子设备的麦克风的音频采集区域实时采集实时声音并进 行实时缓存。
步骤S502,通过所述电子设备的摄像头的图像采集区域实时采集实时图 像。
步骤S503,获得所述实时图像中的多个对象中目标对象。
这里,参见图4,在图4中的实时图像具有多个对象41至43,如果用户通 过第一操作确定对象43,例如电子设备的屏幕是触摸屏,用户可以在电子设备 的触摸屏上点击一下,那么电子设备就从实时图像中的多个对象中确定一个目 标对象。再如,如果用户移动电子设备的摄像头对准对象43,那么电子设备就 从实时图像中的多个对象中确定一个目标对象。
步骤S504,根据所述目标对象改变所述摄像头的对焦的目标参数。
这里,参见图4,在图4中的实时图像具有多个对象41至43,如果用户对 焦的对象从对象41改变为对象43,那么电子设备根据用户的对焦操作获得所 述实时图像中的目标对象为对象43,进而将对象43作为目标参数,所述目标 参数可以采用一维参数来表示,例如用于表示左右的参数,所述目标参数还可 以采用二维参数例如电子设备上触摸屏的位置坐标来表示。
步骤S505,基于所述摄像头的对焦的目标参数,调整所述麦克风的第一控 制参数。
其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调 整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的 实时声音进行音频输出时的声音效果不同。
这里,上述的步骤S501至步骤S502分别对应于实施例一中的步骤S101 至步骤S102,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤 S501至步骤S502,为节约篇幅,这里不再赘述。上述的步骤S503和步骤S505 实际上提供一种实现实施例一中步骤S103的实现方式。即在图像中具有多个对 象时,当用户对焦于某个对象(目标对象)时,那么采集的声音应该就是目标 对象的声音,而周围其他人的声音应该成为环境噪声而变小。
实施例六
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设 备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码 来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少 包括处理器和存储介质。
图6为本发明实施例六信息处理方法的实现流程示意图,如图6所示,该 信息处理方法包括:
步骤S601,通过电子设备的麦克风的音频采集区域实时采集实时声音并进 行实时缓存。
步骤S602,通过所述电子设备的摄像头的图像采集区域实时采集实时图 像。
步骤S603,获得所述实时图像中的多个对象中目标对象。
步骤S604,根据所述目标对象改变所述摄像头的对焦的目标参数;其中, 所述摄像头的对焦的目标参数用于使得所述摄像头的对焦变化后所实时采集的 实时图像中目标对象与所述摄像头的对焦变化前所实时采集的实时图像中的目 标对象不同。
步骤S605,基于所述摄像头的对焦的目标参数,调整所述麦克风的第二控 制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调 整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的 实时声音进行音频输出时的声音效果不同。
这里,上述的步骤S601至步骤S603分别对应于实施例一中的步骤S501 至步骤S503,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤 S601至步骤S603,为节约篇幅,这里不再赘述。上述的步骤S603至步骤S65 实际上提供一种实现实施例一中步骤S103的实现方式。即在图像中具有多个对 象时,当用户对焦于某个对象(目标对象)时,那么麦克风采集的声音应该就 是对焦方向的声音,而周围其他人的声音应该成为环境噪声而变小。
在以上的实施例都是基于多麦克风的波束成形的降噪方案,其原理是:在 手机录像调节焦距的过程中,将调节焦距的信息(拉近拉远焦距或者转移录像 焦点)传递给波束成形算法,综合了摄像焦点的方向和波束成形的指向方向这 两种信息,对降噪力度和拾音指向性给与实时调节。当单个人录像录音时,如 图5所示,如果调节焦距拉近人物,此时对比焦距方向和波束成形方向,二者 方向应该大致吻合,传给降噪算法的信息只是焦距远近发生变化,那么对应的 去调节降噪力度,使得说话人的声音清晰度对应发生变化。如图4所示,当多 个人录像录音时,如果调节焦点发生移动,此时对比焦距方向和波束成形反向,二者方向应该差别很大,此时调节波束成形方向,使得波束成形方向变换到焦 点转移后的方向。
下面是两种场景:第一个场景是:单个人录像录音时调节焦距(如图5所 示);使用的过程包括如下的流程,1)录像中的目标在说话;2)录像手机的摄 像头的对焦方向与波束成形的方向一致;3)麦克风阵列形成波束成形的方向指 向,audio zoom in的同时,增加降噪力度,使得声音更清晰。第二个场景是: 多个人录像录音,多人说话调节对焦方向,使得波束成形的指向性对准目标人 物。使用的过程包括如下流程:1)录像录音多个目标,多个人物在同时说话; 2)在屏幕中选择对焦某个人,那么调整波束成形的指向对准这个说话人;3) 麦克风阵列形成波束成形的方向指向,audio zoom in的同时,增加降噪力度, 使得声音更清晰。
采用本发明实施例之后的优势在于:1)录像和录音结合在一起,和人的贴 身感官保持一致;当录像中调节焦距时,录音的音质也发生变化,而不是像业 内常见的效果依旧保持没有任何变化。2)当单个人录像录音中,如果调节焦距 拉近或拉远人物,那么将听到此人物的说话声的清晰度也随之发生变化。3)当 多人录像录音中,如果转移焦点到其他说话人身上,那么将听到其他的说话人 声变大或者变清晰,周围的人声音将会被消除掉。
实施例七
基于前述实施例一,本发明实施例提供一种信息处理方法,应用于电子设 备,该信息处理方法所实现的功能可以通过电子设备中的处理器调用程序代码 来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少 包括处理器和存储介质。
图7为本发明实施例七信息处理方法的实现流程示意图,如图7所示,该 信息处理方法包括:
步骤S701,通过电子设备的麦克风的音频采集区域实时采集实时声音并进 行实时缓存。
步骤S702,获取输入操作,所述输入操作为用户对所述实时声音的操作。
这里,所述输入操作可以是对软件上的界面的操作,也可以是物理按键, 例如,本发明实施例提供的技术方案可以以录音软件的形式来体现,那么在该 录音软件上可以有一个控制按钮,当用户点击这个控制按钮的时候,用户即输 入了输入操作;再如,电子设备有一个物理按键如声音按键,如果在录音的过 程中,当用户按下声音按键的时候,那么用户即输入了输入操作。
步骤S703,根据所述输入操作确定控制指令,所述控制指令用于控制所述 麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近。
步骤S704,执行所述控制指令,以使得执行所述控制指令后所实时采集的 实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时 采集的实时声音进行音频输出时的声音的远近效果不同。
在本发明实施例中,所述控制指令至少包括第一控制指令和第二控制指令, 其中所述第一控制指令用于控制所述麦克风所采集的声音的音源相对于所述电 子设备之间的距离远一些(可以设置一个距离阈值),所述第二控制指令用于控 制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离近一些(可 以设置一个距离阈值)。为了更好地理解本实施例的技术方案,下面举例来说明, 例如电子设备上的麦克风具有一个机械结构,该机械结构能够调整麦克风与声 音的音源之间的距离,如果用户的输入操作对应于第一控制指令时,那么可以 通过控制机械结构使得麦克风与声音的音源之间的距离远一些,如果用户的输 入操作对应于第二控制指令时,那么可以通过控制机械结构使得麦克风与声音 的音源之间的距离近一些。
实施例八
基于前述的实施例,本发明实施例提供一种信息处理装置,该装置所包括 的各单元,都可以通过电子设备中的处理器来实现,当然也可通过具体的逻辑 电路实现;在具体实施例的过程中,处理器可以为中央处理器(CPU)、微处理 器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图8为本发明实施例八信息处理装置的组成结构示意图,如图8所示,该 装置800包括第一采集单元801、第二采集单元802和调整单元803,其中:
所述第一采集单元,用于通过电子设备的麦克风的音频采集区域实时采集 实时声音并进行实时缓存。
所述第二采集单元,用于通过所述电子设备的摄像头的图像采集区域实时 采集实时图像。
所述调整单元,用于基于所述实时图像,调整所述麦克风的控制参数,其 中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所 实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声 音进行音频输出时的声音效果不同。
在发明的其他实施例中,所述装置还包括显示单元,用于将所述实时图像 显示在显示屏幕上。
在发明的其他实施例中,下面将提供几种实现所述调整单元的方式:
方式一:所述调整单元包括第一获得模块和第一调整模块,其中:
所述第一获得模块,用于获得所述摄像头的焦距的变化参数;其中,所述 摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所实时采集的实时 图像中对象与所述摄像头的焦距变化前所实时采集的实时图像中所述对象大小 不同。
所述第一调整模块,用于基于所述摄像头的焦距的变化参数,调整所述麦 克风的第一控制参数,所述第一控制参数用于降低所述实时声音中环境噪声或/ 和增强所述实时声音中目标声音。
这里,所述第一调整模块包括确定子模块和调整子模块,其中:所述确定 子模块,用于根据所述摄像头的焦距参数和预设的规则确定调整后的信噪比; 所述调整子模块,用于按照所述调整后的信噪比调整所述麦克风的信噪比。
方式二:所述调整单元包括第三获得模块和第二调整模块,其中:
所述第三获得模块,用于获得所述摄像头的焦距方向的变化参数;其中, 所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实 时采集的实时图像中对象与所述摄像头的焦距方向变化前所实时采集的实时图 像中的对象不同。
所述第二调整模块,用于基于所述摄像头的焦距方向的变化参数,调整所 述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集 区域。
方式三:所述调整单元包括第四获得模块、改变模块和第三调整模块,其 中:所述第四获得模块,用于获得所述实时图像中的多个对象中目标对象;所 述第一改变模块,用于根据所述目标对象改变所述摄像头的对焦的目标参数; 所述第三调整模块,用于基于所述摄像头的对焦的目标参数,调整所述麦克风 的第一控制参数。
方式四:所述调整单元包括第五获得模块、第二改变模块和第四调整模块, 其中:
所述第五获得模块,用于获得所述实时图像中的多个对象中目标对象。
所述第二改变模块,用于根据所述目标对象改变所述摄像头的对焦的目标 参数;其中,所述摄像头的对焦的目标参数用于使得所述摄像头的对焦变化后 所实时采集的实时图像中目标对象与所述摄像头的对焦变化前所实时采集的实 时图像中的目标对象不同。
所述第四调整模块,用于基于所述摄像头的对焦的目标参数,调整所述麦 克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
在本发明的其他实施例中,所述装置还包括存储单元,用于将缓存的所有 的实时声音作为一音频文件存储到存储介质上;或者,将缓存的所有的实时声 音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是 类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置 实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约 篇幅,因此不再赘述。
实施例九
基于前述的实施例,本发明实施例提供一种信息处理装置,该装置所包括 的各单元,都可以通过电子设备中的处理器来实现,当然也可通过具体的逻辑 电路实现;在具体实施例的过程中,处理器可以为中央处理器(CPU)、微处理 器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图9为本发明实施例九信息处理装置的组成结构示意图,如图9所示,该 装置900包括第三采集单元901、获得单元902、确定单元903和执行单元904, 其中:
所述第三采集单元901,用于通过电子设备的麦克风的音频采集区域实时 采集实时声音并进行实时缓存。
所述获得单元902,用于获得输入操作,所述输入操作为用户对所述实时 声音的操作。
所述确定单元903,用于根据所述输入操作确定控制指令,所述控制指令 用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远 近。
所述执行单元904,用于执行所述控制指令,以使得执行所述控制指令后 所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制 指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是 类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置 实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约 篇幅,因此不再赘述。
实施例十
基于前述的实施例,本发明实施例提供一种电子设备,图10为本发明实施 例十电子设备的组成结构示意图,如图10所示,所述电子设备1000包括麦克 风1001、摄像头1002和处理器1003,其中所述处理器用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓 存。
通过所述电子设备的摄像头的图像采集区域实时采集实时图像。
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区 域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音 进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的 声音效果不同。
本发明的其他实施例中,所述处理器还用于将所述实时图像显示在显示屏 幕上。
本发明的其他实施例中,所述基于所述实时图像,调整所述麦克风的控制 参数包括:
获得所述摄像头的焦距的变化参数;其中,所述摄像头的焦距的变化参数 用于使得所述摄像头的焦距变化后所实时采集的实时图像中对象与所述摄像头 的焦距变化前所实时采集的实时图像中所述对象大小不同。
基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,所 述第一控制参数用于降低所述实时声音中环境噪声或/和增强所述实时声音中 目标声音。
本发明的其他实施例中,所述基于所述摄像头的焦距的变化参数,调整所 述麦克风的第一控制参数,包括:
根据所述摄像头的焦距参数和预设的规则确定调整后的信噪比。
按照所述调整后的信噪比调整所述麦克风的信噪比。
本发明的其他实施例中,所述基于所述实时图像,调整所述麦克风的控制 参数,包括:
获得所述摄像头的焦距方向的变化参数;其中,所述摄像头的焦距方向的 变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中对象 与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同。
基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数, 所述第二控制参数用于调整所述麦克风的音频采集区域。
本发明的其他实施例中,所述基于所述实时图像,调整所述麦克风的控制 参数包括:
获得所述实时图像中的多个对象中目标对象。
根据所述目标对象改变所述摄像头的对焦的目标参数。
基于所述摄像头的对焦的目标参数,调整所述麦克风的第一控制参数。
本发明的其他实施例中,所述基于所述实时图像,调整所述麦克风的控制 参数包括:
获得所述实时图像中的多个对象中目标对象。
根据所述目标对象改变所述摄像头的对焦的目标参数;其中,所述摄像头 的对焦的目标参数用于使得所述摄像头的对焦变化后所实时采集的实时图像中 目标对象与所述摄像头的对焦变化前所实时采集的实时图像中的目标对象不 同。
基于所述摄像头的对焦的目标参数,调整所述麦克风的第二控制参数,所 述第二控制参数用于调整所述麦克风的音频采集区域。
本发明的其他实施例中,所述处理器还包括:
将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,将缓 存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存 储介质上。
这里需要指出的是:以上电子设备实施例项的描述,与上述方法描述是类 似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明电子设 备实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的 描述而理解,为节约篇幅,这里不再赘述。
实施例十一
基于前述的实施例,本发明实施例提供一种电子设备,所述电子设备包括 麦克风和处理器,所述处理器,还用于:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓 存。
获取输入操作,所述输入操作为用户对所述实时声音的操作。
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采 集的声音的音源相对于所述电子设备之间的距离的远近。
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进 行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时 声音进行音频输出时的声音的远近效果不同。
例如,输入操作可以为可以通过机械结构的方式将麦克风的拾音部分伸出 靠近目标对象(例如,目标用户A)以达到所实时采集的声音以音频文件在保 存存储在非易失的存储介质上后该音频文件通过喇叭等声音输出装置输出时该 声音的效果为靠近用户A的效果,同样的原理,输入操作也可以通过机械结构 的方式将麦克风的拾音部分回收远离目标对象(例如,目标用户A)以达到所 实时采集的声音以音频文件在保存存储在非易失的存储介质上后该音频文件通 过喇叭等声音输出装置输出时该声音的效果为远离用户A的效果。
当然,该实施例也可以通过上述实施例的方式通过软件调整采集参数的方 法达到本实施例所要达到的效果。例如,输入操作可以为第一滑动操作,该第 一滑动操作的方向可以为向着(靠近)需要采集的目标对象(例如,目标用户 A)的方向,该电子设备根据所述第一滑动操作产生第一控制参数,所述电子 设备响应所述第一控制参数,增强实时声音中目标对象的目标声音,降低背景/ 环境音等噪音。以使得用户在播放音频文件(已经针对实时缓存的实时声音存 储完成的)或者视频文件(已经针对实时缓存的实时声音存储完成的)时候, 感觉上目标对象在近处说话。即,通过软件实现的技术手段模拟麦克风的拾音部分伸出去靠近目标对象的效果;同样的原理,输入操作可以为第二滑动操作, 该第二滑动操作的方向可以为远离需要采集的目标对象(例如,目标用户A) 的方向,该电子设备根据所述第二滑动操作产生第二控制参数,所述电子设备 响应所述第二控制参数,将实时声音中目标对象的声音与背景/环境音混在一 起,以使得用户在播放音频文件(已经针对实时缓存的实时声音存储完成的) 或者视频文件(已经针对实时缓存的实时声音存储完成的)时候,感觉上目标 对象在远处说话;即,通过软件实现的技术手段模拟麦克风的拾音部分回收回 来远离目标对象的效果。
这里需要指出的是:以上电子设备实施例项的描述,与上述方法描述是类 似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明电子设 备实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的 描述而理解,为节约篇幅,这里不再赘述。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实 施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此, 在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指 相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合 在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序 号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻 辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例 序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意 在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装 置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为 这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由 语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物 品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可 以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所 述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式, 如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽 略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦 合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可 以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为 单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可 以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来 实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中, 也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一 个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软 件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可 以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储 介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介 质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者 光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立 的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样 的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可 以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包 括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络 设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包 括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到 变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应 以所述权利要求的保护范围为准。

Claims (10)

1.一种信息处理方法,其特征在于,所述方法包括:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
2.根据权利要求1所述的方法,其特征在于,所述基于所述实时图像,调整所述麦克风的控制参数包括:
获得所述摄像头的焦距的变化参数;其中,所述摄像头的焦距的变化参数用于使得所述摄像头的焦距变化后所实时采集的实时图像中对象与所述摄像头的焦距变化前所实时采集的实时图像中所述对象大小不同;
基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,所述第一控制参数用于降低所述实时声音中环境噪声或/和增强所述实时声音中目标声音。
3.根据权利要求2所述的方法,其特征在于,所述基于所述摄像头的焦距的变化参数,调整所述麦克风的第一控制参数,包括:
根据所述摄像头的焦距参数和预设的规则确定调整后的信噪比;
按照所述调整后的信噪比调整所述麦克风的信噪比。
4.根据权利要求1所述的方法,其特征在于,所述基于所述实时图像,调整所述麦克风的控制参数,包括:
获得所述摄像头的焦距方向的变化参数;其中,所述摄像头的焦距方向的变化参数用于使得所述摄像头的焦距方向变化后所实时采集的实时图像中对象与所述摄像头的焦距方向变化前所实时采集的实时图像中的对象不同;
基于所述摄像头的焦距方向的变化参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
5.根据权利要求1所述的方法,其特征在于,所述基于所述实时图像,调整所述麦克风的控制参数包括:
获得所述实时图像中的多个对象中目标对象;
根据所述目标对象改变所述摄像头的对焦的目标参数;
基于所述摄像头的对焦的目标参数,调整所述麦克风的第一控制参数。
6.根据权利要求1所述的方法,其特征在于,所述基于所述实时图像,调整所述麦克风的控制参数包括:
获得所述实时图像中的多个对象中目标对象;
根据所述目标对象改变所述摄像头的对焦的目标参数;其中,所述摄像头的对焦的目标参数用于使得所述摄像头的对焦变化后所实时采集的实时图像中目标对象与所述摄像头的对焦变化前所实时采集的实时图像中的目标对象不同;
基于所述摄像头的对焦的目标参数,调整所述麦克风的第二控制参数,所述第二控制参数用于调整所述麦克风的音频采集区域。
7.根据权利要求2或4所述的方法,其特征在于,所述方法还包括:
将缓存的所有的实时声音作为一音频文件存储到存储介质上;或者,将缓存的所有的实时声音以及缓存的所有的实时图像一起作为一视频文件存储在存储介质上。
8.一种信息处理方法,其特征在于,所述方法包括:
通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
获取输入操作,所述输入操作为用户对所述实时声音的操作;
根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
9.一种信息处理装置,其特征在于,所述装置包括第一采集单元、第二采集单元和调整单元,其中:
所述第一采集单元,用于通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
所述第二采集单元,用于通过所述电子设备的摄像头的图像采集区域实时采集实时图像;
所述调整单元,用于基于所述实时图像,调整所述麦克风的控制参数,其中,所述音频采集区域与所述图像采集区域满足预设的条件,以使得调整后所实时采集的实时声音进行音频输出时的声音效果与调整前所实时采集的实时声音进行音频输出时的声音效果不同。
10.一种信息处理装置,其特征在于,所述装置包括第三采集单元、获得单元、确定单元和执行单元,其中:
所述第三采集单元,用于通过电子设备的麦克风的音频采集区域实时采集实时声音并进行实时缓存;
所述获得单元,用于获得输入操作,所述输入操作为用户对所述实时声音的操作;
所述确定单元,用于根据所述输入操作确定控制指令,所述控制指令用于控制所述麦克风所采集的声音的音源相对于所述电子设备之间的距离的远近;
所述执行单元,用于执行所述控制指令,以使得执行所述控制指令后所实时采集的实时声音进行音频输出时的声音的远近效果与执行所述第一控制指令前所实时采集的实时声音进行音频输出时的声音的远近效果不同。
CN202010508051.0A 2016-03-29 2016-03-29 一种信息处理方法及装置 Active CN111724823B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010508051.0A CN111724823B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010508051.0A CN111724823B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置
CN201610187393.0A CN106157986B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置、电子设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201610187393.0A Division CN106157986B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置、电子设备

Publications (2)

Publication Number Publication Date
CN111724823A true CN111724823A (zh) 2020-09-29
CN111724823B CN111724823B (zh) 2021-11-16

Family

ID=57353711

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010508051.0A Active CN111724823B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置
CN201610187393.0A Active CN106157986B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置、电子设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201610187393.0A Active CN106157986B (zh) 2016-03-29 2016-03-29 一种信息处理方法及装置、电子设备

Country Status (3)

Country Link
US (1) US20170289681A1 (zh)
CN (2) CN111724823B (zh)
DE (1) DE102017106670B4 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112565973A (zh) * 2020-12-21 2021-03-26 Oppo广东移动通信有限公司 终端、终端控制方法、装置及存储介质
CN113689873A (zh) * 2021-09-07 2021-11-23 联想(北京)有限公司 噪声抑制方法、装置及电子设备和存储介质
CN113840087A (zh) * 2021-09-09 2021-12-24 Oppo广东移动通信有限公司 声音处理方法、装置、电子设备和计算机可读存储介质
CN115134499A (zh) * 2022-06-28 2022-09-30 世邦通信股份有限公司 一种音视频监控方法及系统
CN116705047A (zh) * 2023-07-31 2023-09-05 北京小米移动软件有限公司 音频采集方法、装置及存储介质

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106817653B (zh) * 2017-02-17 2020-01-14 Oppo广东移动通信有限公司 音频设定方法及装置
CN106803910A (zh) * 2017-02-28 2017-06-06 努比亚技术有限公司 一种音频处理装置及方法
CN107105183A (zh) * 2017-04-28 2017-08-29 宇龙计算机通信科技(深圳)有限公司 录音音量调节方法及装置
CN107274910A (zh) * 2017-05-17 2017-10-20 宁波桑德纳电子科技有限公司 一种音视频联动的监控装置及音视频联动方法
CN107197187A (zh) * 2017-05-27 2017-09-22 维沃移动通信有限公司 一种视频的拍摄方法及移动终端
CN108965757B (zh) * 2018-08-02 2021-04-06 广州酷狗计算机科技有限公司 视频录制方法、装置、终端及存储介质
CN108682161B (zh) * 2018-08-10 2023-09-15 东方智测(北京)科技有限公司 确认车辆鸣笛的方法和系统
US11463615B2 (en) * 2019-03-13 2022-10-04 Panasonic Intellectual Property Management Co., Ltd. Imaging apparatus
CN110175013A (zh) * 2019-05-20 2019-08-27 北京声智科技有限公司 语音录入方法、装置、电子设备及存储介质
CN112073663B (zh) * 2019-06-10 2023-08-11 海信视像科技股份有限公司 音频增益调节方法、视频聊天方法及显示设备
CN113132863B (zh) * 2020-01-16 2022-05-24 华为技术有限公司 立体声拾音方法、装置、终端设备和计算机可读存储介质
CN111863002A (zh) * 2020-07-06 2020-10-30 Oppo广东移动通信有限公司 处理方法、处理装置、电子设备
CN113992836A (zh) * 2020-07-27 2022-01-28 中兴通讯股份有限公司 变焦视频的音量调节方法、装置和视频拍摄设备
CN114827448A (zh) * 2021-01-29 2022-07-29 华为技术有限公司 视频录制方法及电子设备
CN113225646B (zh) * 2021-04-28 2022-09-20 世邦通信股份有限公司 音视频监控方法、装置、电子设备及存储介质
CN115942108A (zh) * 2021-08-12 2023-04-07 北京荣耀终端有限公司 一种视频处理方法及电子设备
CN113676687A (zh) * 2021-08-30 2021-11-19 联想(北京)有限公司 一种信息处理方法及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277571A1 (en) * 2002-07-27 2006-12-07 Sony Computer Entertainment Inc. Computer image and audio processing of intensity and input devices for interfacing with a computer program
CN1901663A (zh) * 2006-07-25 2007-01-24 华为技术有限公司 一种具有声音位置信息的视频通讯系统及其获取方法
US20080284863A1 (en) * 2007-05-17 2008-11-20 Canon Kabushiki Kaisha Moving image capture apparatus and moving image capture method
US20100245624A1 (en) * 2009-03-25 2010-09-30 Broadcom Corporation Spatially synchronized audio and video capture
US20110085061A1 (en) * 2009-10-08 2011-04-14 Samsung Electronics Co., Ltd. Image photographing apparatus and method of controlling the same
CN102860041A (zh) * 2010-04-26 2013-01-02 剑桥机电有限公司 对收听者进行位置跟踪的扬声器
CN103404169A (zh) * 2010-12-16 2013-11-20 索尼电脑娱乐公司 采用基于图像的源位置的麦克风阵列转向
CN103888703A (zh) * 2014-03-28 2014-06-25 深圳市中兴移动通信有限公司 增强录音的拍摄方法和摄像装置
CN105245811A (zh) * 2015-10-16 2016-01-13 广东欧珀移动通信有限公司 一种录像方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931138B2 (en) 2000-10-25 2005-08-16 Matsushita Electric Industrial Co., Ltd Zoom microphone device
JP4507281B2 (ja) * 2006-03-30 2010-07-21 富士フイルム株式会社 画像表示装置、撮像装置および画像表示方法
US8319858B2 (en) * 2008-10-31 2012-11-27 Fortemedia, Inc. Electronic apparatus and method for receiving sounds with auxiliary information from camera system
CN102045618B (zh) * 2009-10-19 2015-03-04 联想(北京)有限公司 自动调整的麦克风阵列、方法和携带麦克风阵列的装置
JP5722007B2 (ja) * 2010-11-24 2015-05-20 ルネサスエレクトロニクス株式会社 音声処理装置および音声処理方法並びにプログラム
CN103916723B (zh) * 2013-01-08 2018-08-10 联想(北京)有限公司 一种声音采集方法以及一种电子设备
KR20150068112A (ko) * 2013-12-11 2015-06-19 삼성전자주식회사 오디오를 추적하기 위한 방법 및 전자 장치
WO2015168901A1 (en) * 2014-05-08 2015-11-12 Intel Corporation Audio signal beam forming
CN104320729A (zh) * 2014-10-09 2015-01-28 深圳市金立通信设备有限公司 一种拾音方法
CN104376247B (zh) * 2014-11-17 2018-01-23 联想(北京)有限公司 一种信息处理方法及电子设备
CN105357560A (zh) * 2015-09-28 2016-02-24 努比亚技术有限公司 缓存处理方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277571A1 (en) * 2002-07-27 2006-12-07 Sony Computer Entertainment Inc. Computer image and audio processing of intensity and input devices for interfacing with a computer program
CN1901663A (zh) * 2006-07-25 2007-01-24 华为技术有限公司 一种具有声音位置信息的视频通讯系统及其获取方法
US20080284863A1 (en) * 2007-05-17 2008-11-20 Canon Kabushiki Kaisha Moving image capture apparatus and moving image capture method
US20100245624A1 (en) * 2009-03-25 2010-09-30 Broadcom Corporation Spatially synchronized audio and video capture
US20110085061A1 (en) * 2009-10-08 2011-04-14 Samsung Electronics Co., Ltd. Image photographing apparatus and method of controlling the same
CN102860041A (zh) * 2010-04-26 2013-01-02 剑桥机电有限公司 对收听者进行位置跟踪的扬声器
CN103404169A (zh) * 2010-12-16 2013-11-20 索尼电脑娱乐公司 采用基于图像的源位置的麦克风阵列转向
CN103888703A (zh) * 2014-03-28 2014-06-25 深圳市中兴移动通信有限公司 增强录音的拍摄方法和摄像装置
CN105245811A (zh) * 2015-10-16 2016-01-13 广东欧珀移动通信有限公司 一种录像方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112565973A (zh) * 2020-12-21 2021-03-26 Oppo广东移动通信有限公司 终端、终端控制方法、装置及存储介质
CN113689873A (zh) * 2021-09-07 2021-11-23 联想(北京)有限公司 噪声抑制方法、装置及电子设备和存储介质
CN113840087A (zh) * 2021-09-09 2021-12-24 Oppo广东移动通信有限公司 声音处理方法、装置、电子设备和计算机可读存储介质
CN115134499A (zh) * 2022-06-28 2022-09-30 世邦通信股份有限公司 一种音视频监控方法及系统
CN115134499B (zh) * 2022-06-28 2024-02-02 世邦通信股份有限公司 一种音视频监控方法及系统
CN116705047A (zh) * 2023-07-31 2023-09-05 北京小米移动软件有限公司 音频采集方法、装置及存储介质
CN116705047B (zh) * 2023-07-31 2023-11-14 北京小米移动软件有限公司 音频采集方法、装置及存储介质

Also Published As

Publication number Publication date
CN106157986B (zh) 2020-05-26
CN111724823B (zh) 2021-11-16
DE102017106670A1 (de) 2017-10-05
CN106157986A (zh) 2016-11-23
US20170289681A1 (en) 2017-10-05
DE102017106670B4 (de) 2023-12-21

Similar Documents

Publication Publication Date Title
CN106157986B (zh) 一种信息处理方法及装置、电子设备
CN106664501B (zh) 基于所通知的空间滤波的一致声学场景再现的系统、装置和方法
JP6023779B2 (ja) オーディオ情報処理の方法及び装置
JP6703525B2 (ja) 音源を強調するための方法及び機器
JP4539385B2 (ja) 撮像装置、撮像制御プログラム
CN106960670B (zh) 一种录音方法和电子设备
CN111128221B (zh) 一种音频信号处理方法、装置、终端及存储介质
Donley et al. Easycom: An augmented reality dataset to support algorithms for easy communication in noisy environments
JP6125457B2 (ja) 収音システム及び放音システム
KR20140144410A (ko) 음향신호를 위한 빔포밍 방법 및 장치
US11863952B2 (en) Sound capture for mobile devices
US9756421B2 (en) Audio refocusing methods and electronic devices utilizing the same
JP7439131B2 (ja) 空間オーディオをキャプチャする装置および関連する方法
CN116055869B (zh) 一种视频处理方法和终端
US20220337945A1 (en) Selective sound modification for video communication
CN115942108A (zh) 一种视频处理方法及电子设备
CN113488066A (zh) 音频信号处理方法、音频信号处理装置及存储介质
CN113223543B (zh) 语音增强方法、装置和存储介质
CN114449341B (zh) 音频处理方法、装置、可读介质及电子设备
CN117636928A (zh) 一种拾音装置及相关音频增强方法
CN116634319A (zh) 音频处理方法、装置、电子设备和存储介质
WO2024036113A1 (en) Spatial enhancement for user-generated content
CN114630240A (zh) 方向滤波器的生成方法、音频处理方法、装置及存储介质
CN117880731A (zh) 一种音视频录制方法、装置及储存介质
CN116364104A (zh) 音频传输方法、装置、芯片、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant