CN105763956B - 视频聊天中录音的方法和终端 - Google Patents

视频聊天中录音的方法和终端 Download PDF

Info

Publication number
CN105763956B
CN105763956B CN201410779109.XA CN201410779109A CN105763956B CN 105763956 B CN105763956 B CN 105763956B CN 201410779109 A CN201410779109 A CN 201410779109A CN 105763956 B CN105763956 B CN 105763956B
Authority
CN
China
Prior art keywords
terminal
angular domain
configuration information
voice signal
video calling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410779109.XA
Other languages
English (en)
Other versions
CN105763956A (zh
Inventor
康俊腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Co Ltd
Original Assignee
Huawei Device Dongguan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Dongguan Co Ltd filed Critical Huawei Device Dongguan Co Ltd
Priority to CN201410779109.XA priority Critical patent/CN105763956B/zh
Priority to US15/536,550 priority patent/US10152985B2/en
Priority to EP15869280.6A priority patent/EP3226574B1/en
Priority to JP2017549576A priority patent/JP6368055B2/ja
Priority to KR1020177019539A priority patent/KR101946434B1/ko
Priority to PCT/CN2015/097250 priority patent/WO2016095773A1/zh
Publication of CN105763956A publication Critical patent/CN105763956A/zh
Application granted granted Critical
Publication of CN105763956B publication Critical patent/CN105763956B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/155Conference systems involving storage of or access to video conference sessions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former

Abstract

本发明实施例公开了视频聊天中录音的方法和终端,用于降低视频聊天过程中的背景噪声和多人嘈杂声,提高视频聊天的语音质量。第一终端将视频通话界面划分为多个角域,确定各角域的波束配置信息后,将第一终端的选定角域的波束配置信息发送给第二终端,第二终端根据该波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减。

Description

视频聊天中录音的方法和终端
技术领域
本发明涉及通信技术领域,尤其涉及视频聊天中录音的方法和终端。
背景技术
网络的发展促进了通讯手段的变化,传统的交流方式已经不能满足人们的要求。从E-mai到视频电话,网络带来了通讯速度的提升,更降低了通讯成本。而随着宽带网络的普及,人们对网络通讯也有了进一步的要求。宽带网络的发展,改变了传统网络通讯的质量和形式,使交流不再只是局限于普通语言文字,利用视频聊天让天各一方的朋友能够彼此相见,或者进行多人会议等已经成为一种普及的方式。
在视频聊天中,有多个终端,称当前拾取声音(或称录音)并发送出去的终端为第二终端,称当前等待接收该第二终端发送的声音的终端为第一终端,在视频聊天场景中,特别是在多人会议中,第二终端前参与视频聊天的人员可能是多个,第二终端为了能拾取到该第二终端前每个人的声音,一般采用全指向录音,即声音从0至360度进入麦克风而输出不会有明显的变化。
然而在实际应用中,采用全指向录音,一方面第二终端会拾取到过多的背景噪声,另一方面,当第一终端前参与视频聊天的人员需要与第二终端前参与视频聊天的多人中的其中一个进行聊天时,第二终端也会同时拾取其他人发出的嘈杂的声音,严重影响了视频聊天的语音质量。
发明内容
本发明实施例提供了视频聊天中录音的方法和终端,用于降低视频聊天过程中的背景噪声和多人嘈杂声,提高视频聊天的语音质量。
本发明实施例第一方面提供了一种视频聊天中录音的方法,包括:
第一终端将视频通话界面划分成多个角域,所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面;
所述第一终端根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息,所述波束配置为波束赋形技术的输入参数;
当所述第一终端确定选定角域时,所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端,所述选定角域包括所述多个角域中的至少一个角域;
所述第二终端接收所述第一终端发送的所述选定角域对应的波束配置信息;
所述第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
所述第二终端将所述处理后的声音信号传输给所述第一终端。
结合本发明实施例的第一方面,本发明实施例第一方面的第一种实现方式中,所述第二终端中包括至少两个麦克风;
所述第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理具体包括:
所述第二终端根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号。
结合本发明实施例的第一方面,本发明实施例第一方面的第二种实现方式中,所述第一终端将视频通话界面划分成多个角域包括:
所述第一终端根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域,使得每个参与人员占据一块区域;
或,
所述第一终端将所述视频通话界面等分成多个角域。
结合本发明实施例的第一方面至第一方面的第二种实现方式,本发明实施例第一方面的第三种实现方式中,,所述波束配置信息包括声源方位角度,波束方向和波束宽度;
所述第一终端根据各角域在所述视频通话界面中的位置,确定所述各角域对应的波束配置信息包括:
所述第一终端根据各角域在所述视频通话界面中的位置,计算所述各角域对应的声源方位角度,波束方向和波束宽度;
或,
所述第一终端根据各角域在所述视频通话界面中的位置和预置配置信息,匹配得到所述所述各角域对应的声源方位角度,波束方向和波束宽度。
本发明实施例第二方面提供了一种视频聊天中录音的方法,包括:
第一终端将视频通话界面划分成多个角域,所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面;
所述第一终端根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息,所述波束配置为波束赋形技术的输入参数;
当所述第一终端确定选定角域时,所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端,使得所述第二终端根据所述选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,所述选定角域包括所述多个角域中的至少一个角域。
结合本发明实施例的第二方面,本发明实施例第二方面的第一种实现方式中,所述第一终端将视频通话界面划分成多个角域包括:
所述第一终端根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域,使得每个参与人员占据一块区域;
或,
所述第一终端将所述视频通话界面等分成多个角域。
结合本发明实施例的第二方面或第二方面的第一种实现方式,本发明实施例第二方面的第二种实现方式中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;
所述第一终端根据各角域在所述视频通话界面中的位置,确定所述各角域对应的波束配置信息包括:
所述第一终端根据各角域在所述视频通话界面中的位置,计算所述各角域对应的声源方位角度,波束方向和波束宽度;
或,
所述第一终端根据各角域在所述视频通话界面中的位置和预置配置信息,匹配得到所述所述各角域对应的声源方位角度,波束方向和波束宽度。
结合本发明实施例的第二方面至第二方面的第二种实现方式,本发明实施例第二方面的第三种实现方式中,所述当所述第一终端确定选定角域时的步骤之前还包括:
所述第一终端接收用户选择所述多块角域中至少一块角域的信息,确定被选择的角域为所述选定角域。
本发明实施例第三方面提供了一种视频聊天中录音的方法,包括:
第二终端接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息,所述波束配置信息为波束赋形技术的输入参数,所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面,所述选定角域包括所述视频通话界面中多个角域中的至少一个角域;
所述第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
所述第二终端将所述处理后的声音信号传输给所述第一终端。
结合本发明实施例的第三方面,本发明实施例第三方面的第一种实现方式中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;
所述第二终端中包括至少两个麦克风;
所述第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理具体包括:
所述第二终端根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号。
本发明实施例第四方面提供了一种终端,作为第一终端使用,用于在视频聊天中录音,包括:
划分模块,用于将视频通话界面划分成多个角域,所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面;
配置确定模块,用于根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息,所述波束配置为波束赋形技术的输入参数;
配置发送模块,用于当确定选定角域时,将所述选定角域对应的波束配置信息发送给所述第二终端,使得所述第二终端根据所述选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,所述选定角域包括所述多个角域中的至少一个角域。
结合本发明实施例的第四方面,本发明实施例第四方面的第一种实现方式中,划分模块具体用于,根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域,使得每个参与人员占据一块区域,或,将所述视频通话界面等分成多个角域。
结合本发明实施例的第四方面或第四方面的第一种实现方式,本发明实施例第四方面的第二种实现方式中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;
所述配置确定模块具体用于,根据各角域在所述视频通话界面中的位置,计算所述各角域对应的声源方位角度,波束方向和波束宽度,或,根据各角域在所述视频通话界面中的位置和预置配置信息,匹配得到所述所述各角域对应的声源方位角度,波束方向和波束宽度。
结合本发明实施例的第四方面或第四方面的第二种实现方式中任一种实现方式,本发明实施例第四方面的第三种实现方式中,所述终端还包括:
角域接收模块,用于接收用户选择所述多块角域中至少一块角域的信息;
角域确定模块,用于根据所述角域接收模块接收到的信息,确定被选择的角域为所述选定角域。
本发明实施例第五方面提供了一种终端,作为第二终端使用,用于在视频聊天中录音,包括:
配置接收模块,用于接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息,所述波束配置信息为波束赋形技术的输入参数,所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面,所述选定角域包括所述视频通话界面中多个角域中的至少一个角域;
处理模块,用于根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
传输模块,用于将所述处理模块处理后的声音信号传输给所述第一终端。
结合本发明实施例的第五方面,本发明实施例第五方面的第一种实现方式中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;
所述终端中包括至少两个麦克风;
所述处理模块具体用于,根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,得到处理后的声音信号。
从以上技术方案可以看出,本发明实施例具有以下优点:本发明实施例中,第一终端将视频通话界面划分为多个角域,确定各角域的波束配置信息后,将第一终端的选定角域的波束配置信息发送给第二终端,第二终端根据该波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,避免了其它角域的声音对选定角域的声音的影响,降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量。
附图说明
图1为本发明实施例中视频聊天中录音的方法一个流程示意图;
图2为本发明实施例中视频聊天中录音的方法另一个流程示意图;
图3为本发明实施例中视频聊天中录音的方法另一个流程示意图;
图4为本发明实施例中视频聊天中录音的方法另一个流程示意图;
图5为本发明实施例中视频聊天中录音的方法另一个流程示意图;
图6为本发明实施例中视频聊天中录音的方法另一个流程示意图;
图7为本发明实施例中终端一个结构示意图;
图8为本发明实施例中终端另一个结构示意图;
图9为本发明实施例中终端另一个结构示意图;
图10为本发明实施例中终端另一个结构示意图;
图11为本发明实施例中录音系统一个结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述各个终端,但终端不应限于这些术语。这些术语仅用来将终端彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一终端也可以被称为第二终端,类似地,第二终端也可以被称为第一终端;同样的,第二终端也可以被称为第三终端等等,本发明实施例对此不做限制。
术语“波束赋形”又可称为空域滤波,是一种使用传感器阵列定向发送和接收信号的信号处理技术。波束赋形技术通过调整相位阵列的基本单元的参数,使得某些角度的信号获得相长干涉,而另一些角度的信号获得相消干涉。波束赋形既可以用于信号发射端,又可以用于信号接收端。在发射端,波束赋形器控制每一个发射装置的相位和信号幅度,从而在发射出的信号波阵中获得需要相长和相消干涉模式。在接收端,不同接收器接收到的信号被以一种恰当的方式组合起来,从而获得期盼中的信号辐射模式。
可以理解的是,视频聊天中录音的方法包括两类执行主体,设定其中一类是用于控制录音方位的第一终端,另一类是用于录音的第二终端。
请参阅图1,本发明实施例中视频聊天中录音的方法一个实施例包括:
101、第一终端将视频通话界面划分成多个角域;
当第一终端与第二终端进行视频通话时,该第一终端将视频通话界面划分成多个角域,该视频通话界面为该第一终端上显示的与该第二终端前参与人员进行视频聊天的界面。
102、所述第一终端根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息;
第一终端将视频通话界面划分成多个角域后,根据各角域在该视频通话界面中的位置,确定各角域对应的波束配置信息,该波束配置信息为波束赋形技术的输入参数。
103、当所述第一终端确定选定角域时,所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端;
在视频通话过程中,第一终端可以在该多个角域中确定选定角域,当该第一终端确定选定角域时,该第一终端将该选定角域对应的波束配置信息发送给第二终端,该选定角域可以包括多个角域中的至少一个角域。
104、第二终端接收所述第一终端发送的所述选定角域对应的波束配置信息;
第一终端将选定角域对应的波束配置信息发送给第二终端时,第二终端接收该第一终端发送的选定角域对应的波束配置信息。
105、第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
第二终端接收到该波束配置信息后,根据该波束配置信息,对录取到的声音信号进行波束赋形处理,使得该选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
106、第二终端将所述处理后的声音信号传输给所述第一终端。
第二终端得到该处理后的声音信号后,将该处理后的声音信号传输给第一终端,则第一终端得到了选定角域的声音信号的信号轻度被增强,其他角域的声音信号的信号强度被衰减的声音信号。
本发明实施例中,第一终端将视频通话界面划分为多个角域,确定各角域的波束配置信息后,将第一终端的选定角域的波束配置信息发送给第二终端,第二终端根据该波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,避免了其它角域的声音对选定角域的声音的影响,降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量。
下面对本发明实施例中视频聊天中录音的方法进行详细描述,请参阅图2,本发明实施例中视频聊天中录音的方法另一个实施例包括:
201、第一终端将视频通话界面划分成多个角域;
当第一终端与第二终端进行视频通话时,该第一终端将视频通话界面划分成多个角域,该视频通话界面为该第一终端上显示的与该第二终端前参与人员进行视频聊天的界面。
可以理解的是,该第一终端将该视频通话界面划分成多个角域的方式有很多,例如,第一终端可以根据视频通话界面中参与人员的位置,将该视频通话界面划分成多块区域,使得每个参与人员占据一块区域,这样可以更准确的控制录音得到各个参与人员对应方位的声音;此外,第一终端也可以将该视频通话界面等分成多个角域,等分的份数可以根据参与人员的数目也可以根据视频通话界面的分辨率等,这样更方便对各个角域的波束配置信息的计算,还可以有其他的划分方式,此处不作限定。
202、所述第一终端根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息;
第一终端将视频通话界面划分成多个角域后,根据各角域在该视频通话界面中的位置,确定各角域对应的波束配置信息,该波束配置信息为波束赋形技术的输入参数。
该波束配置信息包括声源方位角域,波束方向和波束宽度,进一步的,该波束配置信息中还可以包括采样率,麦克风间距,最大降噪量等参数,此处不作限定。
可以理解的是,确定各角域对应的波束配置信息的方式可以有很多种,得到各角域在该视频通话界面中的位置后,该第一终端可以根据各角域在该视频通话界面终端的位置,计算得到各角域对应的声源方位角域,波束方向和波束宽度;在实际应用中,还可以存在预置配置信息,该预置配置信息中存储有视频通话界面中各位置与波束配置信息之间的对应关系,该第一终端可以直接根据各角域在该视频通话界面中的位置和预置配置信息,匹配得到各角域对应的声源方位角域,波束方向和波束宽度,等其他波束配置信息中的参数,还可以有另外的确定各角域对应的波束配置信息的方式,此处不作限定。
203、所述第一终端接收用户选择所述多块角域中至少一块角域的信息,确定被选择的角域为所述选定角域;
用户可以选择视频通话界面中划分出的至少一块角域,此时,该第一终端接收用户选择该多块角域中至少一块角域的信息,确定被选择的角域为选定角域。
可以理解的是,选择角域时,可以通过手指触控,也可以通过按键输入,还可以通过悬浮触控等,此处不作限定。
204、当所述第一终端确定选定角域时,所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端;
当该第一终端确定选定角域时,该第一终端将该选定角域对应的波束配置信息发送给第二终端。
205、第二终端接收第一终端发送的所述选定角域对应的波束配置信息;
在视频通话过程中,该第二终端接收第一终端发送的选定角域对应的波束配置信息。
206、所述第二终端根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,得到处理后的声音信号;
该第二终端中包括至少两个麦克风,该第二终端接收到波束配置信息后,根据该波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,得到处理后的声音信号。
可以理解的是,该处理后的声音信号中仅存在该选定角域的声音信号,其他角域的声音信号都被衰减到一定阈值以下,可以认为不存在。
207、第二终端将所述处理后的声音信号传输给所述第一终端。
第二终端得到该处理后的声音信号后,将该处理后的声音信号传输给第一终端,则第一终端得到了选定角域的声音信号,其他角域的声音信号均为衰减到难以辨别。
本发明实施例中,第一终端可以根据视频通话界面中参与人员的位置,将该视频通话界面划分成多块区域,使得每个参与人员占据一块区域,这样可以更准确的得到参与人员对应方位的波束配置信息,将其发送给第二终端,从而可以更准确的得到各参与人员对应方位的声音,进一步的降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量。
为便于理解,下面以一具体应用场景对本发明实施例中视频聊天中录音的方法进行具体描述:
终端A前面试官通过该终端A,对终端B前的三个求职者(按从左至右顺序为:求职者1,求职者2,求职者3)进行面试,
终端A与终端B之间接通视频聊天,终端A的视频通话界面上显示有三个求职者的画面;
终端A根据三个求职者在画面中的位置,将该视频通话界面划分成3个角域,每个求职者占据其中一个角域;
终端A根据划分出的三个角域的信息,计算出三个角域对应的波束配置信息;
用户用鼠标点击中间的一个角域,终端A接收到该操作,将被点击的这个角域确定为选定角域,将该选定角域对应的波束配置信息发送到终端B;
终端B根据该波束配置信息,调整麦克风采集的声音信号的参数,使得终端B录取的声音合成后,最终仅存在该选定角域的声音,终端B将处理后的声音传输到终端A;
此时终端A仅会接收到该选定角域所在方位(即求职者2)发出的声音。下面分别从第一终端和第二终端这两类执行主体的角度对本发明实施例中视频聊天中录音的方法进行描述。
一、从第一终端的角度对本发明实施例视频聊天中录音的方法进行描述。
请参阅图3,本发明实施例中视频聊天中录音的方法一个实施例包括:
301、第一终端将视频通话界面划分成多个角域;
当第一终端与第二终端进行视频通话时,该第一终端将视频通话界面划分成多个角域,该视频通话界面为该第一终端上显示的与该第二终端前参与人员进行视频聊天的界面。
302、所述第一终端根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息;
第一终端将视频通话界面划分成多个角域后,根据各角域在该视频通话界面中的位置,确定各角域对应的波束配置信息,该波束配置信息为波束赋形技术的输入参数。
303、当所述第一终端确定选定角域时,所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端,使得所述第二终端根据所述选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,所述选定角域包括所述多个角域中的至少一个角域。
在视频通话过程中,第一终端可以在该多个角域中确定选定角域,当该第一终端确定选定角域时,该第一终端将该选定角域对应的波束配置信息发送给第二终端,使得该第二终端根据该选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度。
本发明实施例中,第一终端将视频通话界面划分为多个角域,确定各角域的波束配置信息后,将第一终端的选定角域的波束配置信息发送给第二终端,使得第二终端根据该选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,避免了其它角域的声音对选定角域的声音的影响,降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量。
下面对本发明实施例中视频聊天中录音的方法进行具体描述,请参阅图4,本发明实施例中视频聊天中录音的方法另一个实施例包括:
201、第一终端将视频通话界面划分成多个角域;
当第一终端与第二终端进行视频通话时,该第一终端将视频通话界面划分成多个角域,该视频通话界面为该第一终端上显示的与该第二终端前参与人员进行视频聊天的界面。
可以理解的是,该第一终端将该视频通话界面划分成多个角域的方式有很多,例如,第一终端可以根据视频通话界面中参与人员的位置,将该视频通话界面划分成多块区域,使得每个参与人员占据一块区域,这样可以更准确的控制录音得到各个参与人员对应方位的声音;此外,第一终端也可以将该视频通话界面等分成多个角域,等分的份数可以根据参与人员的数目也可以根据视频通话界面的分辨率等,这样更方便对各个角域的波束配置信息的计算,还可以有其他的划分方式,此处不作限定。
202、所述第一终端根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息;
第一终端将视频通话界面划分成多个角域后,根据各角域在该视频通话界面中的位置,确定各角域对应的波束配置信息,该波束配置信息为波束赋形技术的输入参数。
该波束配置信息包括声源方位角域,波束方向和波束宽度,进一步的,该波束配置信息中还可以包括采样率,麦克风间距,最大降噪量等参数,此处不作限定。
可以理解的是,确定各角域对应的波束配置信息的方式可以有很多种,得到各角域在该视频通话界面中的位置后,该第一终端可以根据各角域在该视频通话界面终端的位置,计算得到各角域对应的声源方位角域,波束方向和波束宽度;在实际应用中,还可以存在预置配置信息,该预置配置信息中存储有视频通话界面中各位置与波束配置信息之间的对应关系,该第一终端可以直接根据各角域在该视频通话界面中的位置和预置配置信息,匹配得到各角域对应的声源方位角域,波束方向和波束宽度,等其他波束配置信息中的参数,还可以有另外的确定各角域对应的波束配置信息的方式,此处不作限定。
203、所述第一终端接收用户选择所述多块角域中至少一块角域的信息,确定被选择的角域为所述选定角域;
用户可以选择视频通话界面中划分出的至少一块角域,此时,该第一终端接收用户选择该多块角域中至少一块角域的信息,确定被选择的角域为选定角域。
可以理解的是,选择角域时,可以通过手指触控,也可以通过按键输入,还可以通过悬浮触控等,此处不作限定。
404、当所述第一终端确定选定角域时,所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端,使得所述第二终端根据所述选定角域对应的波束配置信息,调整每个麦克风采集的声音信号的参数,将各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号。
本发明实施例中,第一终端可以根据视频通话界面中参与人员的位置,将该视频通话界面划分成多块区域,使得每个参与人员占据一块区域,这样可以更准确的得到参与人员对应方位的波束配置信息,将其发送给第二终端,从而可以更准确的得到各参与人员对应方位的声音,进一步的降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量。
二、从第二终端的角度对本发明实施例视频聊天中录音的方法进行描述。
请参阅图5,本发明实施例中视频聊天中录音的方法另一个实施例包括:
501、第二终端接收第一终端发送的选定角域对应的波束配置信息;
502、第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
503、第二终端将所述处理后的声音信号传输给所述第一终端。
上述步骤501至503与步骤104至106类似,此处不作赘述。
本发明实施例中,第二终端根据接收到的第一终端发送选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量。
下面对本发明实施例中视频聊天中录音的方法进行具体描述,请参阅图6,本发明实施例中视频聊天中录音的方法另一个实施例包括:
601、第二终端接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息;
602、第二终端根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,得到处理后的声音信号;
603、第二终端将所述处理后的声音信号传输给所述第一终端。
上述步骤601至603与步骤205至步骤207类似,此处不作赘述。
本发明实施例中,该第二终端能根据波束配置信息,利用波束赋形技术调整每个麦克风采集声音信号的参数,使得该第二终端中各麦克风录取到的声音信号合成后,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,准确的实现了降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量的效果。
下面对本发明实施例中作为第一终端使用的终端进行描述。
请参阅图7,本发明实施例中终端一个实施例包括:
划分模块701,用于将视频通话界面划分成多个角域,所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面;
配置确定模块702,用于根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息,所述波束配置为波束赋形技术的输入参数;
配置发送模块703,用于当确定选定角域时,将所述选定角域对应的波束配置信息发送给所述第二终端,使得所述第二终端根据所述选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,所述选定角域包括所述多个角域中的至少一个角域。
本发明实施例中,划分模块701将视频通话界面划分为多个角域,配置确定模块702确定各角域的波束配置信息后配置发送模块703将第一终端的选定角域的波束配置信息发送给第二终端,使得第二终端根据所述选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,避免了其它角域的声音对选定角域的声音的影响,降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量。
上面实施例中,划分模块701将视频通话界面划分为多个角域,在实际应用中,划分模块701将视频通话界面划分为多个角域的方式有很多:
可选的,作为本发明终端的另一个实施例,上述终端中划分模块701具体可以用于,根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域,使得每个参与人员占据一块区域。
本实施例中,划分模块701按照参与人员的位置对视频通话界面进行划分,可以使得最终录音选定的方位对应于参与人员的实际位置,能更好的达到降低视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量的效果。
可选的,作为本发明终端的另一个实施例,上述终端中划分模块701具体可以用于,将所述视频通话界面等分成多个角域。
本实施例中,划分模块701将视频通话界面等分,可以减少终端需要进行的计算量,提高终端的处理效率。
可以理解的是,划分模块701还可以采用其他的方式对该视频通话界面进行划分,此处不作限定。
上面实施例中,配置确定模块702确定各角域对应的波束配置信息,在实际应用中,该波束配置信息包括声源方位角域,波束方向和波束宽度,进一步的,该波束配置信息中还可以包括采样率,麦克风间距,最大降噪量等参数,此处不作限定。
配置确定模块702确定波束配置信息的方式也有很多种:
可选的,作为本发明终端的另一个实施例,上述终端中配置确定模块702具体可以用于,根据各角域在所述视频通话界面中的位置,计算所述各角域对应的声源方位角度,波束方向和波束宽度。
本实施例中,配置确定模块702直接根据角域的位置,计算波束配置信息,能使得到的波束配置信息更加准确。
可选的,作为本发明终端的另一个实施例,上述终端中配置确定模块702具体可以用于,根据各角域在所述视频通话界面中的位置和预置配置信息,匹配得到所述所述各角域对应的声源方位角度,波束方向和波束宽度。
本实施例中,配置确定模块702根据各角域的位置和预置配置信息,匹配得到各角域的波束配置信息,进一步的减少终端需要进行的计算量,提高终端的处理效率。
上面实施例中,当确定选定角域时,配置发送模块703将配置确定模块702确定的选定角域对应的波束配置信息发送给所述第二终端,在实际应用中,该移动终端还可以接受用户选择角域的信息,请参阅图8,作为本发明另一个实施例,上述终端中还包括:
角域接收模块801,用于接收用户选择所述多块角域中至少一块角域的信息;
角域确定模块802,用于根据所述角域接收模块801接收到的信息,确定被选择的角域为所述选定角域。
本实施例中,角域接收模块801可以接收用户选择角域的信息,角域确定模块802确定其为选定角域,这样可以根据用户需求,仅录取用户需求角域对应方位的声音。
可以理解的是,在实际应用中,角域接收模块801还可以用于接收第二终端发送的选定信息,该选定信息中包含需要被录音的方位的角域信息,再由角域确定模块802确定该角域为选定角域,还可以有其它确定选定角域的方式,此处不作限定。
下面对本发明实施例中作为第二终端使用的终端进行描述。
请参阅图9,本发明实施例中终端另一个实施例包括:
配置接收模块901,用于接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息,所述波束配置信息为波束赋形技术的输入参数,所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面,所述选定角域包括所述视频通话界面中多个角域中的至少一个角域;
处理模块902,用于根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
传输模块903,用于将所述处理模块902处理后的声音信号传输给所述第一终端。
本发明实施例中,处理模块902根据配置接收模块901接收到的第一终端发送的视频通话界面上选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量。
上面实施例中,配置接收模块901接收波束配置信息,在实际应用中,该波束配置信息包括声源方位角域,波束方向和波束宽度,进一步的,该波束配置信息中还可以包括采样率,麦克风间距,最大降噪量等参数,此处不作限定。
上面实施例中,处理模块902对录取到的声音信号进行波束赋形处理,在实际应用中,具体的处理方式可以有多种。
可选的,作为本发明终端的另一个实施例,该终端中可以包含有至少两个麦克风,该处理模块902具体用于,根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,得到处理后的声音信号。
本实施例中,处理模块902能根据波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,准确的实现了降低了视频聊天过程中的背景噪声和多人嘈杂声,提高了视频聊天的语音质量的效果。
可以理解的是,本发明中的第一终端与第二终端可以为相同的终端,也可以为不同的终端,即一个终端中可以同时包含有上述第一终端与第二终端中的所有模块,两个该终端在不同的应用场景或应用需求下分别作为第一终端和第二终端使用。
请参阅图10,为本发明实施例中终端1000另一个结构示意图,包括:
输入装置1001、输出装置1002、处理器1003和存储器1004(其中终端1000中的处理器1003的数量可以一个或多个,图10中以一个处理器1003为例)。在本发明的一些实施例中,输入装置1001、输出装置1002、处理器1003和存储器1004可通过总线或其它方式连接,其中,图8中以通过总线连接为例。
可以理解的是,该终端1000既可以作为第一终端使用,也可以作为第二终端使用。
结合图10所示终端1000,作为本发明实施例中终端另一个实施例,当其作为第一终端使用时,通过调用存储器1004存储的操作指令,处理器1003,用于执行如下步骤:
将视频通话界面划分成多个角域,所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面;
根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息,所述波束配置为波束赋形技术的输入参数;
当确定选定角域时,将所述选定角域对应的波束配置信息发送给所述第二终端,使得所述第二终端根据所述选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,所述选定角域包括所述多个角域中的至少一个角域;
本发明的一些实施例中,该处理器1003具体用于执行如下步骤:
根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域,使得每个参与人员占据一块区域,或,将所述视频通话界面等分成多个角域;
本发明的一些实施例中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;
该处理器1003具体用于执行如下步骤:
根据各角域在所述视频通话界面中的位置,计算所述各角域对应的声源方位角度,波束方向和波束宽度,或,根据各角域在所述视频通话界面中的位置和预置配置信息,匹配得到所述所述各角域对应的声源方位角度,波束方向和波束宽度;
本发明的一些实施例中,该处理器1003还用于执行如下步骤:
接收用户选择所述多块角域中至少一块角域的信息,确定被选择的角域为所述选定角域。
结合图10所示终端1000,作为本发明实施例中终端另一个实施例,当其作为第二终端使用时,通过调用存储器1004存储的操作指令,处理器1003,用于执行如下步骤:
接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息,所述波束配置信息为波束赋形技术的输入参数,所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面,所述选定角域包括所述视频通话界面中多个角域中的至少一个角域;
根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
将所述处理模块处理后的声音信号传输给所述第一终端;
本发明的一些实施例中,所述输入装置1001中包括至少两个麦克风;
该处理器1003具体用于执行如下步骤:
根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,得到处理后的声音信号。
如图11所示,本发明实施例还提供了一种录音系统,用于在视频聊天中录音,包括:
图7、图8或图10对应实施例中作为第一终端1101使用的终端,和图9或图10对应实施例中作为第二终端1102使用的终端。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (13)

1.一种视频聊天中录音的方法,其特征在于,包括:
第一终端与第二终端视频通话;
所述第一终端将视频通话界面划分成多个角域,所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面;
所述第一终端根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息,所述波束配置为波束赋形技术的输入参数;其中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;所述第一终端根据各角域在所述视频通话界面中的位置,确定所述各角域对应的波束配置信息包括:所述第一终端根据各角域在所述视频通话界面中的位置,计算所述各角域对应的声源方位角度,波束方向和波束宽度;
当所述第一终端确定选定角域时,所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端,所述选定角域包括所述多个角域中的至少一个角域;
所述第二终端接收所述第一终端发送的所述选定角域对应的波束配置信息;
所述第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;
所述第二终端将所述处理后的声音信号传输给所述第一终端。
2.根据权利要求1所述的方法,其特征在于,所述第二终端中包括至少两个麦克风;
所述第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理具体包括:
所述第二终端根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号。
3.根据权利要求1所述的方法,其特征在于,所述第一终端将视频通话界面划分成多个角域包括:
所述第一终端根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域,使得每个参与人员占据一块区域。
4.一种视频聊天中录音的方法,其特征在于,包括:
第一终端与第二终端视频通话;
所述第一终端将视频通话界面划分成多个角域,所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面;
所述第一终端根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息,所述波束配置为波束赋形技术的输入参数;其中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;所述第一终端根据各角域在所述视频通话界面中的位置,确定所述各角域对应的波束配置信息包括:所述第一终端根据各角域在所述视频通话界面中的位置,计算所述各角域对应的声源方位角度,波束方向和波束宽度;当所述第一终端确定选定角域时,所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端,使得所述第二终端根据所述选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,所述选定角域包括所述多个角域中的至少一个角域。
5.根据权利要求4所述的方法,其特征在于,所述第一终端将视频通话界面划分成多个角域包括:
所述第一终端根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域,使得每个参与人员占据一块区域。
6.根据权利要求4或5所述的方法,其特征在于,所述当所述第一终端确定选定角域时的步骤之前还包括:
所述第一终端接收用户选择所述多块角域中至少一块角域的信息,确定被选择的角域为所述选定角域。
7.一种视频聊天中录音的方法,其特征在于,包括:
第一终端与第二终端视频通话;
所述第二终端接收所述第一终端发送的视频通话界面上的选定角域对应的波束配置信息,所述波束配置信息为波束赋形技术的输入参数,所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面,所述选定角域包括所述视频通话界面中多个角域中的至少一个角域;
所述第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;其中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;所述波束配置信息是所述第一终端根据各角域在所述视频通话界面中的位置进行计算得到的;
所述第二终端将所述处理后的声音信号传输给所述第一终端。
8.根据权利要求7所述的方法,其特征在于,所述第二终端中包括至少两个麦克风;
所述第二终端根据所述波束配置信息,对录取到的声音信号进行波束赋形处理具体包括:
所述第二终端根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号。
9.一种终端,作为第一终端使用,用于在视频聊天中录音,其特征在于,包括:
划分模块,用于将视频通话界面划分成多个角域,所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面,所述第一终端与所述第二终端视频通话;
配置确定模块,用于根据各角域在所述视频通话界面中的位置,确定各角域对应的波束配置信息,所述波束配置为波束赋形技术的输入参数;其中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;所述第一终端根据各角域在所述视频通话界面中的位置,确定所述各角域对应的波束配置信息包括:所述第一终端根据各角域在所述视频通话界面中的位置,计算所述各角域对应的声源方位角度,波束方向和波束宽度;配置发送模块,用于当确定选定角域时,将所述选定角域对应的波束配置信息发送给所述第二终端,使得所述第二终端根据所述选定角域对应的波束配置信息,对录取到的声音信号进行波束赋形处理,增强所述选定角域的声音信号的信号强度,衰减其他角域的声音信号的信号强度,所述选定角域包括所述多个角域中的至少一个角域。
10.根据权利要求9所述的终端,其特征在于,划分模块具体用于,根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域,使得每个参与人员占据一块区域。
11.根据权利要求9或10所述的终端,其特征在于,所述终端还包括:
角域接收模块,用于接收用户选择所述多块角域中至少一块角域的信息;
角域确定模块,用于根据所述角域接收模块接收到的信息,确定被选择的角域为所述选定角域。
12.一种终端,作为第二终端使用,用于在视频聊天中录音,其特征在于,包括:
配置接收模块,用于接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息,所述波束配置信息为波束赋形技术的输入参数,所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面,所述选定角域包括所述视频通话界面中多个角域中的至少一个角域;所述第一终端与所述第二终端视频通话;
处理模块,用于根据所述波束配置信息,对录取到的声音信号进行波束赋形处理,使得所述选定角域的声音信号的信号强度被增强,其他角域的声音信号的信号强度被衰减,得到处理后的声音信号;其中,所述波束配置信息包括声源方位角度,波束方向和波束宽度;所述波束配置信息是所述第一终端根据各角域在所述视频通话界面中的位置进行计算得到的;
传输模块,用于将所述处理模块处理后的声音信号传输给所述第一终端。
13.根据权利要求12所述的终端,其特征在于,所述终端中包括至少两个麦克风;
所述处理模块具体用于,根据所述波束配置信息,调整每个麦克风采集的声音信号的参数,使得所述第二终端中各麦克风采集到的声音信号合成后,仅存在所述选定角域的声音信号,得到处理后的声音信号。
CN201410779109.XA 2014-12-15 2014-12-15 视频聊天中录音的方法和终端 Active CN105763956B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201410779109.XA CN105763956B (zh) 2014-12-15 2014-12-15 视频聊天中录音的方法和终端
US15/536,550 US10152985B2 (en) 2014-12-15 2015-12-14 Method for recording in video chat, and terminal
EP15869280.6A EP3226574B1 (en) 2014-12-15 2015-12-14 Recording method and terminal in video chat
JP2017549576A JP6368055B2 (ja) 2014-12-15 2015-12-14 ビデオチャットにおける録音方法、および端末
KR1020177019539A KR101946434B1 (ko) 2014-12-15 2015-12-14 화상 채팅의 녹화 방법 및 단말
PCT/CN2015/097250 WO2016095773A1 (zh) 2014-12-15 2015-12-14 视频聊天中录音的方法和终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410779109.XA CN105763956B (zh) 2014-12-15 2014-12-15 视频聊天中录音的方法和终端

Publications (2)

Publication Number Publication Date
CN105763956A CN105763956A (zh) 2016-07-13
CN105763956B true CN105763956B (zh) 2018-12-14

Family

ID=56125924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410779109.XA Active CN105763956B (zh) 2014-12-15 2014-12-15 视频聊天中录音的方法和终端

Country Status (6)

Country Link
US (1) US10152985B2 (zh)
EP (1) EP3226574B1 (zh)
JP (1) JP6368055B2 (zh)
KR (1) KR101946434B1 (zh)
CN (1) CN105763956B (zh)
WO (1) WO2016095773A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920433B (zh) * 2019-03-19 2021-08-20 上海华镇电子科技有限公司 嘈杂环境下电子设备的语音唤醒方法
CN112261335B (zh) * 2019-07-22 2021-10-29 大唐移动通信设备有限公司 一种视频通话过程中的设备控制方法及通信装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5335011A (en) * 1993-01-12 1994-08-02 Bell Communications Research, Inc. Sound localization system for teleconferencing using self-steering microphone arrays
US7559026B2 (en) 2003-06-20 2009-07-07 Apple Inc. Video conferencing system having focus control
JP2007329753A (ja) 2006-06-08 2007-12-20 Yamaha Corp 音声通信装置および音声通信システム
US8040856B2 (en) * 2006-12-04 2011-10-18 Samsung Electronics Co., Ltd. System and method for wireless communication of uncompressed high definition video data using a beamforming acquisition protocol
US20080259731A1 (en) * 2007-04-17 2008-10-23 Happonen Aki P Methods and apparatuses for user controlled beamforming
US20100254543A1 (en) * 2009-02-03 2010-10-07 Squarehead Technology As Conference microphone system
EP3550853A1 (en) * 2009-11-24 2019-10-09 Nokia Technologies Oy An apparatus
EP3217653B1 (en) * 2009-12-24 2023-12-27 Nokia Technologies Oy An apparatus
US8558894B2 (en) * 2010-11-16 2013-10-15 Hewlett-Packard Development Company, L.P. Support for audience interaction in presentations
US9226088B2 (en) 2011-06-11 2015-12-29 Clearone Communications, Inc. Methods and apparatuses for multiple configurations of beamforming microphone arrays
GB2493327B (en) * 2011-07-05 2018-06-06 Skype Processing audio signals
US20130028443A1 (en) * 2011-07-28 2013-01-31 Apple Inc. Devices with enhanced audio
US9729115B2 (en) * 2012-04-27 2017-08-08 Sonos, Inc. Intelligently increasing the sound level of player
US20130329908A1 (en) * 2012-06-08 2013-12-12 Apple Inc. Adjusting audio beamforming settings based on system state
CN102830964B (zh) 2012-07-24 2016-04-13 华为技术有限公司 一种显示多任务界面的方法及装置
US9258644B2 (en) * 2012-07-27 2016-02-09 Nokia Technologies Oy Method and apparatus for microphone beamforming
US9007524B2 (en) * 2012-09-25 2015-04-14 Intel Corporation Techniques and apparatus for audio isolation in video processing
US9860439B2 (en) 2013-02-15 2018-01-02 Panasonic Intellectual Property Management Co., Ltd. Directionality control system, calibration method, horizontal deviation angle computation method, and directionality control method
CN103414988B (zh) 2013-05-21 2016-11-23 杭州联汇科技股份有限公司 一种室内扩声录音设备及语音追踪调整方法
CN104008753B (zh) * 2014-05-19 2017-12-29 联想(北京)有限公司 一种信息处理方法和电子设备

Also Published As

Publication number Publication date
US20170330581A1 (en) 2017-11-16
JP2018506243A (ja) 2018-03-01
KR101946434B1 (ko) 2019-02-11
JP6368055B2 (ja) 2018-08-01
WO2016095773A1 (zh) 2016-06-23
KR20170094440A (ko) 2017-08-17
EP3226574B1 (en) 2019-03-20
US10152985B2 (en) 2018-12-11
EP3226574A4 (en) 2017-11-22
EP3226574A1 (en) 2017-10-04
CN105763956A (zh) 2016-07-13

Similar Documents

Publication Publication Date Title
CN101132839B (zh) 结合计算机交互处理的选择性声源监听
US9554091B1 (en) Identifying conference participants and active talkers at a video conference endpoint using user devices
US11197116B2 (en) Method, apparatus, and computer-readable media for focussing sound signals in a shared 3D space
US10110994B1 (en) Method and apparatus for providing voice communication with spatial audio
CN104412616B (zh) 基于麦克风阵列中的声音的相关性的噪声抑制
CN103827966A (zh) 处理音频信号
CN108683937A (zh) 智能电视的语音交互反馈方法、系统及计算机可读介质
WO2019022830A1 (en) SOUND SOUND LOCATION TRUST ESTIMATION USING AUTOMATIC APPRENTICESHIP
CN103368816A (zh) 基于虚拟人物形象的即时通讯方法及系统
CN108781273B (zh) 基于自动参与者标识的动作
CN108513088B (zh) 群组视频会话的方法及装置
CN109841217A (zh) 一种基于语音识别的ar交互系统和方法
CN103270738A (zh) 用于在多个音频或视频传感器可得到时处理语音和/或视频呼叫的通信系统和方法
JP2022545924A (ja) 人工知能(ai)を用いたノイズキャンセレーション
CN109543633A (zh) 一种人脸识别方法、装置、机器人和存储介质
CN105763956B (zh) 视频聊天中录音的方法和终端
CN105657253B (zh) 一种对焦方法及电子设备
CN106303361A (zh) 视频通话中的图像处理方法、装置、系统及图形处理器
CN107332678A (zh) 阅读页面语音互动的方法及系统
CN112148182B (zh) 一种交互控制方法、终端以及存储介质
CN109447852A (zh) 点餐信息的处理方法和装置、以及存储介质和电子装置
CN106656726B (zh) 一种业务处理方法和装置
CN106165376B (zh) 一种应用交互方法、装置及终端
CN114425162A (zh) 一种视频处理方法和相关装置
CN112714925A (zh) 图像处理方法、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee after: Huawei Device Co., Ltd.

Address before: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee before: HUAWEI terminal (Dongguan) Co., Ltd.