CN101510988B - 一种语音信号的处理、播放方法和装置 - Google Patents

一种语音信号的处理、播放方法和装置 Download PDF

Info

Publication number
CN101510988B
CN101510988B CN200910005681XA CN200910005681A CN101510988B CN 101510988 B CN101510988 B CN 101510988B CN 200910005681X A CN200910005681X A CN 200910005681XA CN 200910005681 A CN200910005681 A CN 200910005681A CN 101510988 B CN101510988 B CN 101510988B
Authority
CN
China
Prior art keywords
meeting
place
maximum
azimuth information
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200910005681XA
Other languages
English (en)
Other versions
CN101510988A (zh
Inventor
梁丽燕
刘智辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Co Ltd
Huawei Device Shenzhen Co Ltd
Original Assignee
Huawei Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Co Ltd filed Critical Huawei Device Co Ltd
Priority to CN200910005681XA priority Critical patent/CN101510988B/zh
Publication of CN101510988A publication Critical patent/CN101510988A/zh
Priority to PCT/CN2010/070491 priority patent/WO2010094219A1/zh
Application granted granted Critical
Publication of CN101510988B publication Critical patent/CN101510988B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting

Abstract

本发明实施例公开了一种语音信号的处理、播放方法和装置。其中,所述处理方法包括:根据为参加会议的会场所设置的方位信息,在最大N方会场中,确定每个时刻每个频段上能量最大的会场的方位信息;将最大N方会场的混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行发送。播放方法包括:获取混音信号和每个频段上能量最大的会场的方位信息;根据播放设备的听觉空间参数与方位信息之间的对应关系,获得与每个频段上所述能量最大的会场的方位信息相对应的播放设备的听觉空间参数;利用所述播放设备的听觉空间参数调整所述混音信号,以便对调整后的混音信号进行播放。根据本发明实施例,可以提高视讯会议的空间听觉效果。

Description

一种语音信号的处理、播放方法和装置
技术领域
本发明涉及视频通信技术领域,特别是涉及一种语音信号的处理、播放方法和装置。
背景技术
在视频通信系统中,参加会议的各个会场把本地的语音信号和图像信号编码后发送给MCU(Multipoint Control Unit,多点控制单元),MCU对接收的语音信号和图像信号进行处理,并把处理后的语音信号和图像信号发送至各个会场终端,由会场在对语音信号和图像信号解码后播放,由此实现视频通信。其中,在MCU对语音信号进行处理时,先计算解码后的每个会场的语音信号的包络,通过比较语音信号的包络将包络最大的N个会场作为最大N方会场,然后把最大N方会场的语音信号进行混音处理后发送给会议中最大N方会场以外的其它会场,而最大N方会场接收的语音信号是除自身所在会场以外的其它最大N-1方会场的语音信号的混音信号。因此,会议中各会场在对接收到的混音信号解码后,最大N方会场外的其他会场能听到最大N方会场的语音,而最大N方会场之间能听到其他最大N-1方会场的语音。
但是,发明人在研究中发现,现有技术中,在MCU对最大N方会场的语音信号进行混音处理时,只是将最大N方会场的语音信号做简单的线性叠加。当出现最大N方会场同时说话的情况时,各个入会会场的输出设备播放的声音为各个最大N方会场的声音混杂和重叠在一起的语音,使参加会议的用户无法听清楚每个最大N方会场的声音,从而影响了视讯会议的视听效果。
发明内容
本发明实施例提供了一种语音信号的混音、播放方法和装置,以提高视讯会议的空间听觉效果。
本发明实施例公开了一种语音信号的处理方法,包括:根据为参加会议的会场所设置的方位信息,在最大N方会场中,确定每个时刻每个频段上能量最大的会场的方位信息;将最大N方会场的混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行发送。
本发明实施例还公开了一种语音信号的播放方法,包括:获取最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息;根据播放设备的听觉空间参数与方位信息之间的对应关系,获得与每个时刻每个频段上所述能量最大的会场的方位信息相对应的播放设备的听觉空间参数;利用所述播放设备的听觉空间参数调整所述混音信号,以便对调整后的混音信号进行播放。
本发明实施例还公开了一种语音信号的处理装置,包括:方位确定单元,用于根据为参加会议的会场所设置的方位信息,在最大N方会场中,确定每个时刻每个频段上能量最大的会场的方位信息;发送单元,用于将最大N方会场的混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行发送。
本发明实施例还公开了一种语音信号的播放装置,包括:获取单元,用于获取最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息;空间参数获得单元,用于根据播放设备的听觉空间参数与方位信息之间的对应关系,获得与每个时刻每个频段上所述能量最大的会场的方位信息相对应的播放设备的听觉空间参数;调整单元,用于利用所述播放设备的听觉空间参数调整所述混音信号,以便对调整后的混音信号进行播放。
由上述实施例可以看出,在对语音信号进行处理时,预先为参加会议的所有会场设置方位信息,并在最大N方会场中,确定在每个时刻每个频段上能量最大的会场的方位信息,将所述方位信息与最大N方会场的混音信号一起发送。在对语音信号进行播放时,根据接收的方位信息以及方位信息的播放设备空间参数之间的对应关系,得到播放端每个播放设备的空间参数,利用播放设备的空间参数来调整混音信号,在将调整后的混音信号播放时,可以在会场重构音源的听觉空间,使最大N方会场的声音在播放时具有空间的立体感觉,用户能够听清楚每个最大N方会场的声音,更增加了用户的临场体验感觉。
附图说明
图1为本发明实施例一揭示的一种语音信号的处理方法的流程图;
图2-a为10个入会会场的方位示意图;
图2-b为多画面中4个会场的方位示意图;
图3-a为4个最大4方会场的方位示意图;
图3-b为多画面中4个会场的方位示意图;
图4为多画面个数为16,方位个数为4时方位的设置方法;
图5为本发明中语音信号的处理示意图;
图6为本发明实施例二揭示的一种语音信号的处理装置的结构图;
图7为本发明实施例三揭示的一种语音信号的播放方法的流程图;
图8为本发明各频段下播放设备的听觉空间参数调整示意图;
图9为本发明实施例四揭示的一种语音信号的播放装置的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例进行详细描述。
实施例一
请参阅图1,图1为本发明一种语音信号的处理方法的流程图,该方法包括以下步骤:
步骤101:根据为参加会议的会场所设置的方位信息,在最大N方会场中,确定每个时刻每个频段上能量最大的会场的方位信息;
上述步骤中,需要先将最大N方会场的语音信号进行时频变换,将时域下的语音信号转换为频域下的语音信号,然后计算每个时刻每个频段上的能量值,获得每个时刻每个频段上能量最大的会场,最后根据为参加会议的会场所设置的方位信息,确定每个频段上能量最大的会场的方位信息。其中,可以通过两种方法确定每个时刻每个频段上,最大N方会场中能量最大的会场的方位信息。其中,一种确定方法为:根据参加会议的各个会场的入会顺序,预先为入会的会场设置方位。当通过比较最大N方会场的语音信号在每个频段的能量值而获得每个时刻每个频段上最大N方会场中能量最大的会场后,判断所述能量最大的会场是否在多画面中,如果是,将所述能量最大的会场的方位信息设置为多画面方位信息,如果否,将所述能量最大的会场的方位信息设置为所述预设方位信息。例如,在一个视讯系统中,参加会议的会场有十个,第一个入会的会场编号为1,第二入会的会场的编号为2,依次类推,第十个入会的会场编号为10。根据十个会场的入会顺序,将会场1-3的方位设置为左上方,将会场4-6的方位设置为右上方,将会场7-8的方位设置为左下方,将会场9-10的方位设置为右下方,请参阅图2-a,图2-a为10个入会会场的方位示意图。其中,会场1-4为最大4方会场,并且,在某一时刻的某一个频段下,会场1为最大4方会场中能量最大的会场,则判断会场1是否在多画面中,当会场1在多画面中时,将会场1在多画面中的方位信息设置为会场1的方位信息,例如,会场1在多画面中的右下方,请参阅图2-b,图2-b为多画面中4个会场的方位示意图,则会场1的方位信息为右下方;当会场1不在多画面中时,根据对入会会场方位的设定可以获得,会场1的方位信息为左上方。
另一种确定方法为:在确定最大N方会场后,根据最大N方会场的入会顺序,预先为最大N方会场设置方位,得到最大N方会场的方位信息。当通过比较最大N方会场的语音信号在每个时刻每个频段的能量值而获得每个时刻每个频段上最大N方会场中能量最大的会场后,判断所述能量最大的会场是否在多画面中,当能量最大的会场在多画面中时,将所述能量最大的会场的方位信息设置为所述能量最大的会场在多画面中的方位信息,如果否,将所述能量最大的会场的方位信息设置为所述预设的最大N方会场的方位信息。以上述十个会场之间进行视讯通信为例,其中,会场1-4为最大4方会场,根据会场1-4的入会顺序,将会场1的方位设置为左上方,将会场2的方位设置为右上方,将会场3的方位设置为左下方,将会场4的方位设置为右下方,请参阅图3-a,图3-a为4个最大4方会场的方位示意图。当通过比较能量值得知,在某一个时刻某一个频段下,会场1为最大4方会场中能量最大的会场时,则判断会场1是否在多画面中,当会场1在多画面中时,将会场1在多画面中的方位信息设置为会场1的方位信息,例如,会场1在多画面中的右下方,请参阅图3-b,图3-b为多画面中4个会场的方位示意图,则会场1的方位信息为右下方;当会场1不在多画面中时,根据对最大4方会场预先设置的方位可以获得,会场1的方位信息为左上方。
上述两种确定方法中,当能量最大的会场在多画面中的方位发生变化时,能量最大的会场的方位信息也会随着方位的变化而相应地发生变化。
仍然以上述是个会场之间进行视讯通信为例,其中,会场1-4为最大4方会场,根据会场1-4的入会顺序,将会场1的方位设置为左上方,将会场2的方位设置为右上方,将会场3的方位设置为左下方,将会场4的方位设置为右下方。并且,在某个时刻的某一个频段下,会场1即是最大4方会场中能量最大的会场,也在多画面中,则会场1的方位信息为会场1在多画面中的方位信息,假设会场1在多画面中的方位为左上方,则会场1的方位信息为左上方,当会场1在多画面中的方位被切换为右上方时,且此时会场1仍然为最大4方会场中能量最大的会场时,则会场1的方位信息也就相应地变化为右上方。需要说明的是,本实施例并不限定对最大N方会场中能量最大的会场的方位信息的设置方法,方位信息也不限定为左上方、右上方、左下方和右下方四种方位。
当多画面的画面个数大于方位个数时,多画面中的会场不能够完全对应任何一个方位。例如,多画面的个数为16,方位的个数为4,多画面中的会场不能够完全对应任何一个方位,则为多画面中的会场取一个最近似的方位,请参阅图4,图4为多画面个数为16,方位个数为4时方位的设置方法,根据近似原则,将图中会场7的方位设置为右上方。
步骤102:将最大N方会场的混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行发送。
上述步骤中,可以先将最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息进行编码,分别得到混音码流和方位信息码流,然后将混音码流和方位信息码流发送给参加会议的会场终端;或者,也可以只将最大N方会场的混音信号进行编码,得到混音码流,然后将混音码流和每个时刻每个频段上能量最大的会场的方位信息发送给参加会议的会场终端。例如,目的会场属于最大N方会场,则发送给该会场的混音信号是除了该会场以外的最大N-1会场的混音信号。
其中,在将所述能量最大的会场的方位信息进行编码时,以不同于混音信号的编码方式进行编码。例如,当混音信号按照传统的编码协议G.722进行编码时,则所述最大N方会场中能量最大的会场的方位信息可以采用Huffman的方式接进行编码。请参阅图5,图5为本发明中语音信号的处理示意图。
当将每个时刻每个频段上能量最大的会场的方位信息进行发送时,一个优选的方式是:
将最大N方会场中能量最大的会场的会场编号和最大N方会场的方位信息一并进行发送,从而由接收端根据会场编号从最大N方会场的方位信息中确定最大N方会场中能量最大的会场的方位信息。
实施例二
与上述一种语音信号的处理方法相对应,本发明实施例还提供了一种语音信号的处理装置。请参阅图6,图6为本发明一种语音信号的处理装置的结构图,该装置包括方位确定单元601和发送单元602。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。
方位确定单元601,用于根据为参加会议的会场所设置的方位信息,在最大N方会场中,确定每个时刻每个频段上能量最大的会场的方位信息;
发送单元602,用于将最大N方会场的混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行发送。
其中,所述方位确定单元601包括:第一方位预设单元603,用于根据入会顺序,依次为所述参加会议的会场预先设置方位,得到预设方位信息;比较单元604,用于比较最大N方会场的语音信号在每个频段的能量值,获得每个时刻每个频段上能量最大的会场;第一设置单元605,用于当所述能量最大的会场不在多画面中时,根据预设方位信息设置能量最大的会场的方位信息;第二设置单元606,用于当所述能量最大的会场在多画面中时,根据多画面方位信息设置能量最大的会场的方位信息。
所述方位确定单元601还可以包括:第二方位预设单元,用于根据入会顺序,依次为最大N方会场预先设置方位,得到最大N方会场的预设方位信息;比较单元,用于比较最大N方会场的语音信号在每个时刻每个频段的能量值,获得每个时刻每个频段上能量最大的会场;第三设置单元,用于当所述能量最大的会场不在多画面中时,根据预设方位信息设置能量最大的会场的方位信息;第四设置单元,用于当所述能量最大的会场在多画面中时,根据多画面方位信息设置能量最大的会场的方位信息。
所述发送单元602包括:第一发送单元607和/或第二发送单元608,
第一发送单元607,用于将所述混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行编码,分别得到混音码流和方位信息码流,将所述混音码流和方位信息码流发送给参加会议的会场终端;
第二发送单元608,用于将所述混音信号进行编码,得到混音码流,将所述混音码流和所述每个时刻每个频段上能量最大的会场的方位信息发送给参加会议的会场终端。
实施例三
请参阅图7,图7为本发明一种语音信号的播放方法的流程图,该方法包括以下步骤:
步骤701:获取最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息;
上述步骤中若接收到最大N方会场中能量最大的会场的会场编号和最大N方会场的方位信息,则首先根据会场编号从最大N方会场的方位信息中确定最大N方会场中能量最大的会场的方位信息。
上述步骤中,当接收到的数据为混音码流和方位信息码流时,通过对所述混音码流和方位信息码流进行解码,得到所述混音信号和每个时刻每个频段上能量最大的会场的方位信息;当接收到的数据为混音信号码流和每个时刻每个频段上能量最大的会场的方位信息时,通过对所述混音码流进行解码,得到所述混音信号,最终获得混音信号和每个频段上能量最大的会场的方位信息。
步骤702:根据播放设备的听觉空间参数与方位信息之间的对应关系,获得与每个时刻每个频段上所述能量最大的会场的方位信息相对应的播放设备的听觉空间参数;
上述步骤中,播放设备的听觉空间参数包括电平参数和延时参数。步骤902的具体实现过程可以为:首先为播放设备预先设置与方位信息相对应的电平参数和延时参数,当在步骤701中获取到每个时刻每个频段上能量最大的会场的方位信息后,查询预先为播放设备设置的方位信息与电平参数和延时参数之间的对应关系,得到与每个时刻每个频段上能量最大的会场的方位信息相对应的播放设备的电平参数和延时参数。
例如,在会场由两个扬声器作为播放设备,所获取的某个频段上能量最大的会场的方位信息为左上方,则可以得到两个扬声器的电平参数和延时参数为:1)扬声器1左上方的电平参数;2)扬声器2左上方的电平参数;3)扬声器1左上方的延时参数;4)扬声器2左上方的延时参数。
步骤703:利用所述播放设备的听觉空间参数调整所述混音信号,以便对调整后的混音信号进行播放。
其中,需要先将混音信号进行时频变换,将时域下的混音信号转换为频域下的混音信号,当获得与每个频段上所述能量最大的会场的方位信息相对应的播放设备的听觉空间参数后,分别在每个频段上,利用播放设备的听觉空间参数对频域下的混音信号的电平和延时进行调整。请参阅图8,图8为各频段下播放设备的听觉空间参数调整示意图。当对每个频段上的混音信号进行调整后,将调整后的混音信号进行时频反变换,把频域下的混音信号转换为时域下的混音信号,最后将时域下的混音信号通过播放设备进行播放。
实施例四
与上述一种语音信号的播放方法相对应,本发明实施例还提供了一种语音信号的播放装置。请参阅图9,图9为本发明一种语音信号的播放装置的结构图,该装置包括获取单元901、空间参数获得单元902和调整单元903。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。
获取单元901,用于获取最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息;
空间参数获得单元902,用于根据播放设备的听觉空间参数与方位信息之间的对应关系,获得与每个时刻每个频段上所述能量最大的会场的方位信息相对应的播放设备的听觉空间参数;
调整单元903,用于利用所述播放设备的听觉空间参数调整所述混音信号,以便对调整后的混音信号进行播放。
其中,获取单元901包括:
第一接收单元904,用于接收混音码流和方位信息码流;
第一解码单元905,用于对所述混音码流和方位信息码流进行解码,得到所述混音信号和每个时刻每个频段上能量最大的会场的方位信息。
上述第一接收单元904可以替换为第二接收单元,用于接收混音码流和所述每个时刻每个频段上能量最大的会场的方位信息;第一解码单元905可以替换为第二解码单元,用于对所述混音码流进行解码,得到所述混音信号。
在本实施例中,获取单元901还可以同时包括第一接收单元、第一解码单元和第二接收单元、第二解码单元。
空间参数获得单元902包括:
听觉空间参数预设单元906,用于为播放设备预先设置与方位信息相对应的电平参数和延时参数;
查询单元907,用于查询所述方位信息与电平参数和延时参数之间的对应关系,得到与所述每个时刻每个频段上能量最大的会场的方位信息相对应的电平参数和延时参数。
由上述本发明的实施例可以看出,在对语音信号进行处理时,预先为参加会议的所有会场设置方位信息,并在最大N方会场中,确定在每个频段上能量最大的会场的方位信息,将所述方位信息与混音信号一起发送。在对语音信号进行播放时,根据接收的方位信息以及方位信息的播放设备空间参数之间的对应关系,得到播放端每个播放设备的空间参数,利用播放设备的空间参数来调整混音信号,在将调整后的混音信号播放时,可以在会场重构音源的听觉空间,使最大N方会场的声音在播放时具有空间的立体感觉,用户能够听清楚每个最大N方会场的声音,更增加了用户的临场体验感觉。
此外,当能量最大的会场在多画面中时,能量最大的会场的方位信息会随着它在多画面中方位的变化而相应地发生变化,从而在对语音信号播放时,使音源的方位与图像的方位相一致,进一步增加了用户的临场体验感觉。
以上对本发明所提供的一种语音信号的处理、播放方法和装置进行了详细介绍,本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (21)

1.一种语音信号的处理方法,其特征在于,所述方法包括:
根据为参加会议的会场所设置的方位信息,在最大N方会场中,确定每个时刻每个频段上能量最大的会场的方位信息,其中,确定每个时刻每个频段上能量最大的会场的方位信息的具体方法为:当通过比较最大N方会场的语音信号在每个频段的能量值而获得每个时刻每个频段上最大N方会场中能量最大的会场后,判断所述能量最大的会场是否在多画面中,如果是,所述能量最大的会场的方位信息为多画面方位信息,如果否,所述能量最大的会场的方位信息为预设的方位信息;
将最大N方会场的混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行发送。
2.根据权利要求1所述的方法,其特征在于,为参加会议的会场设置方位信息包括:
根据入会顺序,依次为所述参加会议的会场预先设置方位,得到预设方位信息。
3.根据权利要求1所述的方法,其特征在于,为参加会议的会场设置方位信息包括:
根据入会顺序,依次为最大N方会场预先设置方位,得到最大N方会场的预设方位信息。
4.根据权利要求1所述的方法,其特征在于,所述将最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息进行发送包括:
将所述混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行编码,分别得到混音码流和方位信息码流,将所述混音码流和方位信息码流发送给参加会议的会场终端。
5.根据权利要求4所述的方法,其特征在于,所述将最大N方会场的混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行编码包括:
将所述每个时刻每个频段上能量最大的会场的方位信息以不同于混音信号的编码方式进行编码。 
6.根据权利要求1所述的方法,其特征在于,所述将最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息进行发送包括:
将所述混音信号进行编码,得到混音码流,将所述混音码流和所述每个时刻每个频段上能量最大的会场的方位信息发送给参加会议的会场终端。
7.根据权利要求1所述的方法,其特征在于,所述将最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息进行发送包括:
将所述混音信号进行编码,得到混音码流,将所述混音码流和所述每个时刻每个频段上能量最大的会场的编号以及最大N方会场的方位信息发送给参加会议的会场终端。
8.一种基于权利要求1所述的语音信号的处理方法实施语音信号播放的方法,其特征在于,所述方法包括:
获取最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息;
根据播放设备的听觉空间参数与方位信息之间的对应关系,获得与每个时刻每个频段上所述能量最大的会场的方位信息相对应的播放设备的听觉空间参数;
利用所述播放设备的听觉空间参数调整所述混音信号,以便对调整后的混音信号进行播放。
9.根据权利要求8所述的方法,其特征在于,所述获取最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息包括:
接收混音码流和方位信息码流;
对所述混音码流和方位信息码流进行解码,得到所述混音信号和每个时刻每个频段上能量最大的会场的方位信息。
10.根据权利要求8所述的方法,其特征在于,所述获取混音信号和每个时刻每个频段上能量最大的会场的方位信息包括:
接收混音码流和所述每个频段上能量最大的会场的方位信息;
对所述混音码流进行解码,得到所述混音信号。
11.根据权利要求8所述的方法,其特征在于,所述播放设备的听觉空间参数包括:电平参数和延时参数。 
12.根据权利要求11所述的方法,其特征在于,所述根据播放设备的听觉空间参数与方位信息之间的对应关系,获得播放设备的听觉空间参数包括:
为播放设备预先设置与方位信息相对应的电平参数和延时参数;
查询所述方位信息与电平参数和延时参数之间的对应关系,得到与所述每个时刻每个频段上能量最大的会场的方位信息相对应的电平参数和延时参数。
13.根据权利要求8所述的方法,其特征在于,所述获取最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息包括:
接收混音码流和每个时刻每个频段上能量最大的会场的编号以及最大N方会场的方位信息;
对所述混音码流和方位信息码流进行解码,得到所述混音信号;
根据每个时刻每个频段上能量最大的会场的编号以及最大N方会场的方位信息,获取每个时刻每个频段上能量最大的会场的方位信息。
14.一种语音信号的处理装置,其特征在于,所述装置包括:
方位确定单元,用于根据为参加会议的会场所设置的方位信息,在最大N方会场中,确定每个时刻每个频段上能量最大的会场的方位信息,其中,确定每个时刻每个频段上能量最大的会场的方位信息的具体方法为:当通过比较最大N方会场的语音信号在每个频段的能量值而获得每个时刻每个频段上最大N方会场中能量最大的会场后,判断所述能量最大的会场是否在多画面中,如果是,所述能量最大的会场的方位信息为多画面方位信息,如果否,所述能量最大的会场的方位信息为预设的方位信息;
发送单元,用于将最大N方会场的混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行发送。
15.根据权利要求14所述的装置,其特征在于,所述方位确定单元包括:
第一方位预设单元,用于根据入会顺序,依次为所述参加会议的会场预先设置方位,得到预设方位信息。
16.根据权利要求14所述的装置,其特征在于,所述方位确定单元包括:
第二方位预设单元,用于根据入会顺序,依次为最大N方会场预先设置方位,得到最大N方会场的预设方位信息。 
17.根据权利要求14所述的装置,其特征在于,所述发送单元包括:
第一发送单元,用于将所述混音信号和所述每个时刻每个频段上能量最大的会场的方位信息进行编码,分别得到混音码流和方位信息码流,将所述混音码流和方位信息码流发送给参加会议的会场终端;
和/或,
第二发送单元,用于将所述混音信号进行编码,得到混音码流,将所述混音码流和所述每个时刻每个频段上能量最大的会场的方位信息发送给参加会议的会场终端。
18.一种基于权利要求14所述的语音信号的处理装置实施语音信号播放的装置,其特征在于,所述装置包括:
获取单元,用于获取最大N方会场的混音信号和每个时刻每个频段上能量最大的会场的方位信息;
空间参数获得单元,用于根据播放设备的听觉空间参数与方位信息之间的对应关系,获得与每个时刻每个频段上所述能量最大的会场的方位信息相对应的播放设备的听觉空间参数;
调整单元,用于利用所述播放设备的听觉空间参数调整所述混音信号,以便对调整后的混音信号进行播放。
19.根据权利要求18所述的装置,其特征在于,所述获取单元包括:
第一接收单元,用于接收混音码流和方位信息码流;
第一解码单元,用于对所述混音码流和方位信息码流进行解码,得到所述混音信号和每个时刻每个频段上能量最大的会场的方位信息。
20.根据权利要求18所述的装置,其特征在于,所述获取单元包括:
第二接收单元,用于接收混音码流和所述每个时刻每个频段上能量最大的会场的方位信息;
第二解码单元,用于对所述混音码流进行解码,得到所述混音信号。
21.根据权利要求18所述的装置,其特征在于,所述空间参数获得单元包括:
听觉空间参数预设单元,用于为播放设备预先设置与方位信息相对应的电平参数和延时参数; 
查询单元,用于查询所述方位信息与电平参数和延时参数之间的对应关系,得到与所述每个时刻每个频段上能量最大的会场的方位信息相对应的电平参数和延时参数。 
CN200910005681XA 2009-02-19 2009-02-19 一种语音信号的处理、播放方法和装置 Active CN101510988B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200910005681XA CN101510988B (zh) 2009-02-19 2009-02-19 一种语音信号的处理、播放方法和装置
PCT/CN2010/070491 WO2010094219A1 (zh) 2009-02-19 2010-02-03 一种语音信号的处理、播放方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910005681XA CN101510988B (zh) 2009-02-19 2009-02-19 一种语音信号的处理、播放方法和装置

Publications (2)

Publication Number Publication Date
CN101510988A CN101510988A (zh) 2009-08-19
CN101510988B true CN101510988B (zh) 2012-03-21

Family

ID=41003219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910005681XA Active CN101510988B (zh) 2009-02-19 2009-02-19 一种语音信号的处理、播放方法和装置

Country Status (2)

Country Link
CN (1) CN101510988B (zh)
WO (1) WO2010094219A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510988B (zh) * 2009-02-19 2012-03-21 华为终端有限公司 一种语音信号的处理、播放方法和装置
CN102222503B (zh) * 2010-04-14 2013-08-28 华为终端有限公司 一种音频信号的混音处理方法、装置及系统
CN102270456B (zh) * 2010-06-07 2012-11-21 华为终端有限公司 一种音频信号的混音处理方法及装置
CN101877643B (zh) * 2010-06-29 2014-12-10 中兴通讯股份有限公司 多点混音远景呈现方法、装置及系统
CN101951492A (zh) * 2010-09-15 2011-01-19 中兴通讯股份有限公司 视频通话中视频录制的方法及装置
CN102436818A (zh) * 2011-10-25 2012-05-02 浙江万朋网络技术有限公司 一种基于能量优先的服务器端选路混音方法
CN103794216B (zh) * 2014-02-12 2016-08-24 能力天空科技(北京)有限公司 一种语音混音处理方法及装置
CN103870234B (zh) * 2014-02-27 2017-03-15 北京六间房科技有限公司 一种混音方法及其装置
CN104167210A (zh) * 2014-08-21 2014-11-26 华侨大学 一种轻量级的多方会议混音方法和装置
CN115065571B (zh) * 2022-06-14 2023-10-27 南昌职业大学 一种用于大会场的语音设备
CN116403589A (zh) * 2023-03-01 2023-07-07 天地阳光通信科技(北京)有限公司 一种音频处理方法、单元及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1937664A (zh) * 2006-09-30 2007-03-28 华为技术有限公司 一种实现多语言会议的系统及方法
CN101179693A (zh) * 2007-09-26 2008-05-14 深圳市丽视视讯科技有限公司 一种会议电视系统的混音处理方法
CN101268715A (zh) * 2005-11-02 2008-09-17 雅马哈株式会社 电话会议装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
JP2005110103A (ja) * 2003-10-01 2005-04-21 Kyushu Electronics Systems Inc テレビ会議における音声の定位方法
US7460656B2 (en) * 2003-12-18 2008-12-02 Intel Corporation Distributed processing in conference call systems
CN101510988B (zh) * 2009-02-19 2012-03-21 华为终端有限公司 一种语音信号的处理、播放方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101268715A (zh) * 2005-11-02 2008-09-17 雅马哈株式会社 电话会议装置
CN1937664A (zh) * 2006-09-30 2007-03-28 华为技术有限公司 一种实现多语言会议的系统及方法
CN101179693A (zh) * 2007-09-26 2008-05-14 深圳市丽视视讯科技有限公司 一种会议电视系统的混音处理方法

Also Published As

Publication number Publication date
CN101510988A (zh) 2009-08-19
WO2010094219A1 (zh) 2010-08-26

Similar Documents

Publication Publication Date Title
CN101510988B (zh) 一种语音信号的处理、播放方法和装置
CN101132516B (zh) 一种视频通讯的方法、系统及用于视频通讯的装置
CN112135285B (zh) 多蓝牙音频设备的实时音频交互方法
US9113034B2 (en) Method and apparatus for processing audio in video communication
CN101960865A (zh) 用于捕获和呈现多个音频声道的装置
TW200611242A (en) Coding reverberant sound signals
WO2013053336A1 (zh) 混音方法、装置及系统
EP2574050A1 (en) Method, apparatus and remote video conference system for playing audio of remote participator
WO2005115051A1 (en) Wireless device for capturing multiple channel audio
CN105828235B (zh) 一种播放音频的方法及电子设备
CN114067810A (zh) 音频信号渲染方法和装置
CN105163233A (zh) 一种智能云音箱与智能终端交互方法及系统
CN108718361A (zh) 一种音频文件播放方法及无线接听设备
CN104410946A (zh) 一种无线多设备组合实现多声道输出音频的方法及系统
CN101600060B (zh) 蓝牙子母立体双声道的数字电视
CN102457700B (zh) 音频数据传输方法及系统
EA013670B1 (ru) Способ и устройство для приема, передачи и воспроизведения звуковых событий для приложений связи
EP2702775A1 (en) Processing stereophonic audio signals
KR102637876B1 (ko) 메타데이터를 이용하는 오디오 신호 처리 방법 및 장치
CN1322958A (zh) 带有动态范围控制的用于数字音频的双条音频电平计
JP2011193374A (ja) 遠隔会議装置及び遠隔会議方法
CN104464707A (zh) 一种安装在汽车内部的互联网卡拉ok装置
CN102957893A (zh) 用于在连续呈现会议中的视频流之间切换的方法和系统
CN203014945U (zh) 移动终端
CN104867359B (zh) 一种直录播系统中的音频处理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee after: Huawei terminal (Shenzhen) Co.,Ltd.

Address before: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee before: HUAWEI DEVICE Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20181224

Address after: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee after: HUAWEI DEVICE Co.,Ltd.

Address before: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee before: Huawei terminal (Shenzhen) Co.,Ltd.

TR01 Transfer of patent right