CN113259059B - 用于在无线通信系统中发射和接收语音数据的装置和方法 - Google Patents

用于在无线通信系统中发射和接收语音数据的装置和方法 Download PDF

Info

Publication number
CN113259059B
CN113259059B CN202110762752.1A CN202110762752A CN113259059B CN 113259059 B CN113259059 B CN 113259059B CN 202110762752 A CN202110762752 A CN 202110762752A CN 113259059 B CN113259059 B CN 113259059B
Authority
CN
China
Prior art keywords
bit rate
information
range
rate
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110762752.1A
Other languages
English (en)
Other versions
CN113259059A (zh
Inventor
郑庚训
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020140153191A external-priority patent/KR102244612B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to CN202110762752.1A priority Critical patent/CN113259059B/zh
Publication of CN113259059A publication Critical patent/CN113259059A/zh
Application granted granted Critical
Publication of CN113259059B publication Critical patent/CN113259059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/24Negotiation of communication capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • H04L5/14Two-way operation using the same type of signal, i.e. duplex
    • H04L5/1438Negotiation of transmission parameters prior to communication

Abstract

本发明提供了一种用于在无线通信系统中发射和接收语音数据的设备和方法。一种用于发射语音信号的发射终端的操作方法包括:生成采样率和比特率请求信息,其包括用于确定语音信号的采样率的采样信息、以及用于确定所述语音信号的比特率的比特率信息,并将所生成的采样率和比特率请求信息发射到接收终端;从所述接收终端接收根据基于所述采样信息确定的采样率以及基于所述比特率信息确定的比特率的至少一个组合得到的组合确定信息;并且根据所接收的组合确定信息压缩所述语音信号,并且将所压缩的语音信号发射到所述接收终端。

Description

用于在无线通信系统中发射和接收语音数据的装置和方法
本申请是申请日为2015年6月22日、申请号为201580072483.9、题为“用于在无线通信系统中发射和接收语音数据的装置和方法”的中国专利申请的分案申请。
技术领域
示例性实施方式涉及用于在无线通信系统中发射和接收语音数据的设备和方法。
背景技术
通过发射终端的语言编解码器(编码器)来压缩语言,将各种类型的报头(诸如实时发射协议(RTP)、用户数据报协议(UDP)和互联网协议(IP)报头)附加到压缩语言,并且通过通信调制解调器(诸如长期演进(LTE)调制解调器)来发射附加报头的压缩语言。接收终端顺序地移除RTP、UDP和IP报头,并且检查是否存在丢失的语言帧。在没有任何损失下恢复的语言帧通过语言编解码器(解码器)从压缩状态解压缩,被转换成脉冲编码调制(PCM)信号,并且递送到扬声器。
在恢复语言帧期间发现信息丢失时,通过使用有关先前帧的信息来执行用于减少音质损坏的误差掩蔽。如果由于发射路径的拥塞而引起在发射期间丢失了语言帧并因此呼叫不是顺利的,则可以通过向对方终端发射编解码器模式请求(CMR)消息来调整语言比特率,以使得当存在拥塞状态时,比特率暂时降低,并且随着拥塞状态被解决而逐渐增加。
根据诸如自适应多速率(AMR)和宽带自适应多速率(AMR-WB)技术的常规语音压缩技术,将语音带宽固定到窄带或宽带,这表示模拟语音信号以8,000或16,000个样本/秒转换成数字信号并被压缩,并且此转换速度在通话过程中不改变。AMR编解码器可以将以8,000个样本/秒数字化的语音信号压缩成4.75Kbps至12.2Kbps的八种类型的比特率,并且处理300Hz到3,400Hz的频带的语音信号。AMR-WB编解码器可以将以16,000个样本/秒数字化的语音信号压缩为6.6Kbps至23.85Kbps的九种类型的比特率,并且处理50Hz至7,000Hz的频带的语音信号。
最近,对于LTE语音(VoLTE)服务中商业化的AMR-WB语音编解码器的呼叫质量,大多数收听者认为通话质量有所改善,但是一些收听者不喜欢高频语音的呼叫质量,并且倾向于认为常规AMR语音编解码器的质量更好。这表示取决于收听者或与语音一起压缩的背景噪声,高频语音分量可能是或可能不是优选的。
发明内容
技术问题
本发明提供了一种用于发射/接收语音信号的发射终端和接收终端的操作方法和设备,考虑到即使以相同的语音比特率也可以根据情况通过使用另一采样率来实现最佳呼叫质量的事实,在呼叫期间在终端之间相互调整所述语音信号的采样率和/或比特率。
本发明提供了一种用于在两个终端之间有效地协商语音编解码器的比特率和/或采样率的方法和设备,所述语音编解码器支持比现有技术更宽范围的比特率以及比现有技术更宽范围的采样率。
技术解决方案
根据示例性实施方式的方面,用于发射语音信号的发射终端的操作方法包括:生成采样率和比特率请求信息,所述采样率和比特率请求信息包括用于确定语音信号的采样率的采样信息、以及用于确定语音信号的比特率的比特率信息,并将所生成的采样率和比特率请求信息发射到接收终端;从接收终端接收通过基于采样信息确定的采样率以及基于比特率信息确定的比特率的至少一个组合得到的组合确定信息;以及根据所接收的组合确定信息压缩语音信号,并且将所压缩的语音信号发射到接收终端。
根据另一个示例性实施方式的方面,用于发射语音信号的发射终端的操作设备包括:请求信息生成单元,其被配置成生成采样率和比特率请求信息,所述采样率和比特率请求信息包括用于确定语音信号的采样率的采样信息、以及用于确定语音信号的比特率的比特率信息;控制单元,其被配置成控制待发射到接收终端的所生成的采样率和比特率请求信息;接口单元,其被配置成在控制单元的控制下将采样率和比特率请求信息发射到接收终端;以及语音压缩单元,其被配置成:如果接口单元从接收终端接收到通过基于采样信息确定的采样率和基于比特率信息确定的比特率的至少一个组合得到的组合确定信息,则根据所接收的组合确定信息来压缩语音信号,其中接口单元在控制单元的控制下将压缩的语音信号发射到接收终端。
根据另一个示例性实施方式的方面,用于接收语音信号的接收终端的操作方法包括:从发射终端接收采样率和比特率请求信息,所述采样率和比特率请求信息包括用于确定语音信号的采样率的采样信息以及用于确定语音信号的比特率的比特率信息;根据采样率和比特率请求信息,确定基于采样信息确定的采样率和基于比特率信息确定的比特率的至少一个组合;以及将所确定的组合确定信息发射到发射终端。
根据另一个实施方式的方面,用于接收语音信号的接收终端的操作设备包括:接口单元,其被配置成从发射终端接收采样率和比特率请求信息,所述采样率和比特率请求消息包括用于确定语音信号的采样率的采样信息以及用于确定语音信号的比特率的比特率信息;组合确定单元,其被配置成根据采样率和比特率请求信息,确定基于采样信息确定的采样率和基于比特率信息确定的比特率的至少一个组合;以及控制单元,其被配置成控制待发射到发射终端的所确定的组合确定信息,其中接口单元在控制单元的控制下将组合确定信息发射到发射终端。
发明有益效果
根据示例性实施方式,在使用语音编解码器(诸如能够以多个采样率和比特率压缩语音的增强语音服务(EVS))的网络语音协议(VoIP)系统中,可以适当地协商用于支持多个采样率和比特率的语音编解码器中的服务的采样率和比特率,并且可以根据接收者的品味、语音内容和背景噪声动态地调整对方终端的压缩方案。
附图说明
图1是根据示例性实施方式的用于发射语音信号的发射终端的操作方法的流程图。
图2是示出有效载荷报头的示例的参考图。
图3是示出包括有效载荷报头的VoIP分组的示例的参考图。
图4是示出从发射终端向接收终端发射的信息、以及从接收终端向发射终端发射的信息的示例的参考图。
图5是用于描述接收终端确定组合确定信息的说明性参考图。
图6是根据示例性实施方式的用于发射语音信号的发射终端的操作设备的框图。
图7是根据示例性实施方式的用于接收语音信号的接收终端的操作方法的流程图。
图8是根据示例性实施方式的用于接收语音信号的接收终端的操作设备的框图。
图9是用于描述两个终端以范围单位协商用于呼叫的比特率的说明性参考图。
图10是用于描述两个终端以范围单位协商用于呼叫的采样率的说明性参考图。
图11是示出以范围单位协商比特率的两个终端之间的从发射终端向接收终端发射的信息、以及从接收终端向发射终端发射的信息的示例的参考图。
图12是示出以范围单位协商采样率的两个终端之间的从发射终端向接收终端发射的信息、以及从接收终端向发射终端发射的信息的示例的参考图。
图13是示出以范围单位协商比特率和采样率的两个终端之间的从发射终端向接收终端发射的信息、以及从接收终端向发射终端发射的信息的示例的参考图。
图14是示出以范围单位协商比特率和采样率的两个终端之间的从发射终端向接收终端发射的信息、以及从接收终端向发射终端发射的信息的示例的参考图。
具体实施方式
图1至图14仅是说明性的,并且因此不应被分析作为对本发明范围的限制。本领域普通技术人员将会理解,即使在包括与实施方式相关的适当操作原理的随机通信系统中,也可以实现本公开。
图1是根据示例性实施方式的用于发射语音信号的发射终端的操作方法的流程图。
参考图1,在操作S100中,发射终端可以生成采样率和比特率请求信息,其包括用于确定采样率的采样信息和用于确定语音信号的比特率的比特率信息,并且将所生成的采样率和比特率请求信息发射到接收终端。采样信息可以包括采样列表信息,其具有相对于特定范围确定的至少一个采样类型或采样率范围信息;并且比特率信息可以包括比特率列表信息,其具有相对于特定范围确定的至少一个比特率类型或比特率范围信息。
一般来说,根据频带的语音编解码器的类型的示例如表1所示。
[表1]
根据表1,对应于100Hz至3,500Hz的NB的语音编解码器具有8000个样本/秒的采样率,并且选择性地使用7.2、8、9.6、13.2、16.4、24.4、32、48、64、96和128中的一个作为比特率。此外,对应于50Hz至7000Hz的WB的语音编解码器具有16,000个样本/秒的采样率,并且选择性地使用上述11个比特率中的一个。此外,对应于50Hz至16,000Hz的SWB的语音编解码器具有32,000个样本/秒的采样率,并且选择性地使用上述11个比特率中的一个。此外,对应于50Hz至20,000Hz的FB的语音编解码器具有48,000个样本/秒的采样率,并且选择性地使用上述11个比特率中的一个。也就是说,取决于频带的语音编解码器选择性地使用各种比特率,但相应地使用固定的采样率。与此相比,如下所述,本示例性实施方式不仅允许根据语音编解码器的类型选择性地使用比特率,而且还允许选择性地使用采样率。
根据语音压缩技术,在呼叫期间可用的比特率的数量为8、9或更小,并且最小值与最大值之间的差异不大,如10-20Kbps或更小。例如,在AMR技术中可以使用4.75Kbps与12.2Kbps之间的8个比特率,并且在AMR-WB技术中可以使用6.6Kbps与23.85Kbps之间的9个比特率。
根据示例性实施方式,发射终端可以生成例如对应于采样率类型的8,000、16,000、32000和48,000个样本/秒列表信息,作为对应于采样率和比特率请求信息的采样列表信息。此外,发射终端可以生成例如7.2、8、9.6、13.2、16.4、24.4、32、48、64、96和128的列表信息,作为比特率列表信息。
包括在采样率和比特率请求信息中的采样列表信息可以包括对应于每个采样类型的采样识别信息,并且比特率列表信息可以包括对应于每个比特率类型的比特率识别信息。
表2示出了根据采样率的识别信息。
[表2]
根据表2,将识别信息Id分配给每个采样率。
表3示出了根据比特率的识别信息。
[表3]
根据表3,将识别信息Id分配给每个比特率。
发射终端可以将所生成的采样率和比特率请求信息插入有效载荷报头中。也就是说,对应于采样率和比特率请求信息的采样列表信息和比特率列表信息可以被添加到有效载荷报头。
有效载荷报头包括:当前使用的采样类型的采样类型确认信息、当前使用的比特率类型的比特率类型确认信息、以及采样列表信息和比特率列表信息等。
图2是示出有效载荷报头的示例的参考图。在图2中,“编解码器模式请求”表示比特率列表信息,“BW请求”表示采样列表信息,“所使用的编解码器模式”指示当前使用的比特率类型的比特率类型确认信息,并且“所使用的BW”指示当前使用的采样类型的采样类型确认信息。此外,“F”指示了指示是否连续发射语音帧的信息,并且“Q”指示了指示语音帧中是否存在错误的信息。
图2的有效载荷报头的每个字段的功能可以如下表4所示。如在用于多个比特率/多个带宽的增强语音服务(EVS)中,语音编解码器的有效载荷报头包括2个字节,并且每个字段的功能和长度如下。
[表4]
也就是说,包括以下作为比特率列表信息:比特率类型的列表信息(例如,7.2、8、9.6、13.2、16.4、24.4、32、48、64、96和128)、以及对应于列表信息的相应识别信息片段0000至1010。此外,包括以下作为采样率列表信息:例如,8,000、16,000、32,000和48,000的列表信息、以及对应于列表信息的各个识别信息片段00至11。此外,包括以下作为比特率类型确认信息:用于当前帧的比特率的列表信息、以及对应于列表信息的识别信息。此外,包括以下作为采样类型确认信息:有关用于当前帧的的采样率的信息、以及对应于所述信息的识别信息。
发射终端可以生成网络语音协议(VoIP)分组,其中除了具有采样率和比特率请求信息的有效载荷报头之外,按顺序添加实时传输协议(RTP)报头、用户数据报协议(UDP)报头和互联网协议(IP)报头),并且将所生成的VoIP分组发射到接收终端。
图3是示出包括有效载荷报头的VoIP分组的示例的参考图。有效载荷报头被添加到语音帧,其中可以填充“0”以便以字节为单位调整有效载荷长度。如上所述,在有效载荷报头中包括采样率列表信息和比特率列表信息,并且可以包括当前使用的采样率信息和比特率信息。在这种情况下,有效载荷报头、EVS帧和填充比特的总和被命名为RTP有效载荷。除了RTP有效载荷之外,具有RTP报头、UDP报头和IP报头的VoIP分组可以通过调制解调器发射到对方终端。
返回参考图1,在操作S100之后,在操作S102中,发射终端可以从接收终端接收通过基于采样信息确定的采样率以及基于比特率信息确定的比特率的至少一个组合得到的组合确定信息。可以通过从采样信息选择的采样类型和从比特率信息选择的比特率类型的至少一个组合,或通过在采样率范围信息的范围内确定的采样率范围和在比特率范围信息的范围内确定的比特率范围的至少一个组合,确定组合确定信息。可以在发送方向和接收方向上不同地确定采样率范围信息,并且可以在发送方向和接收方向上不同地确定比特率范围信息。
图4是示出从发射终端向接收终端发射的信息、以及从接收终端向发射终端发射的信息的示例的参考图。图4(a)示出了用于向接收终端通知以下的信息:发射终端可以使用EVS、AMR-WB和AMR的三种类型的语音代码以用于语音通信。信息指示,EVS支持高达FB(48,000个样本/秒),AMR-WB支持16,000个样本/秒,并且AMR支持8,000个样本/秒。也就是说,EVS/48000、AMR-WB/16000和AMR/8000指示可以由接收终端组合的采样率类型的列表信息。此外,b=AS:160指示应用程序特定的最大比特率,并且具有通过将RTP/UDP/IP报头加上最大语音比特率而获得的整数值。也就是说,b=AS:160指示通过将32(RTP/UDP/IP报头)加上EVS的128Kbps而获得的值。因此,应用程序特定的最大比特率是比特率的最大值,并且指示可由接收终端组合的比特率类型的列表信息。
当从发射终端接收到包括采样率列表信息和比特率列表信息的采样率和比特率请求信息时,接收终端从采样率列表信息选择EVS,并且确定如图4(b)所示的任何一个采样率(例如,32,000样本/秒)。此外,接收终端确定使用来自比特率列表信息的最大24.4Kbps的比特率。也就是说,配置集指示了组合确定信息,将所述组合确定信息作为{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}发射到发射终端。每个组合确定信息片段指示(采样率识别信息、比特率识别信息)。也就是说,(0,0)是采样率识别信息“0”和比特率识别信息“0”的组合,其中与识别信息相对应的采样率类型对应于8,000(NB),并且与识别信息相对应的比特率类型对应于7.2。因此,作为组合确定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}分别指示7.2(NB)、8(WB)、9.6(WB)、13.2(SWB)、16.4(SWB)和24.4(SWB)的采样率类型和比特率类型的组合信息。
这个组合确定信息对应于通过使用包括语音信号的音频信号的背景噪声、音频质量、音频音调中的至少一个确定的采样率类型和比特率类型的组合信息。
图5是用于描述接收终端确定组合确定信息的说明性参考图。图5(a)示出了基于低频带的语音信号,并且图5(b)示出了基于高频带的语音信号。例如,用于接收语音信号的接收终端的用户可能不希望听到高频音频或尖锐的声音。在这种情况下,接收终端可以分析所接收的语音帧和确定信息,即组合确定信息,以用于当如图5(b)所示,高于特定频率或更高频率的高频分量的能量比是特定水平或更高的时,使对方终端将采样率从超宽带(SWB)降低到宽带(WB)或窄带(NB)。这种情况可能在其中生成金属噪声的工厂内部发生,或在与具有高音调的人交谈的情况下发生。相反,在连接到安全摄像机等的情况下,使得有必要甚至发射细声的改变,可以对其进行调整以便尽可能地提高采样率。
因此,考虑到从对方终端提供的语音信号的背景噪声、音频质量、呼叫者的音调等,接收终端确定用于语音信号的适当组合确定信息,并且将所确定的组合确定信息发射到对方终端(发射终端),以及对方终端(发射终端)接收组合确定信息。
在操作S102之后,在操作S104中,发射终端可以根据所接收的组合确定信息压缩语音信号,并且将所压缩的语音信号发射到接收终端。例如,当接收图4(b)所示的作为组合确定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)时,发射终端可以以对应于组合确定信息的采样率和比特率压缩待发射到接收终端的语音信号。也就是说,如果确定以对应于组合确定信息的(0,0)来压缩语音信号,则发射终端可以根据对应于识别信息“0”的采样率类型8,000(NB)以及对应于识别信息“0”的比特率类型7.2来压缩语音信号,并且将压缩的语音信号发射到接收终端。
图6是根据示例性实施方式的用于发射语音信号的发射终端的操作设备的框图,并且所述设备可以包括请求信息生成单元200、控制单元210、接口单元230和语音压缩单元240。
参考图6,请求信息生成单元200可以生成采样率和比特率请求信息,其包括:具有用于确定语音信号的采样率的至少一个采样类型的采样列表信息、以及具有用于确定语音信号的比特率的至少一个比特率类型的比特率列表信息。包括在采样率和比特率请求信息中的采样列表信息可以包括对应于相应采样类型的采样识别信息,并且比特率列表信息可以包括对应于相应比特率类型的比特率识别信息。
请求信息生成单元200可以将所生成的采样率和比特率请求信息插入有效载荷报头中。也就是说,对应于采样率和比特率请求信息的采样列表信息和比特率列表信息可以被添加到有效载荷报头。有效载荷报头包括:当前使用的采样类型的采样类型确认信息、当前使用的比特率类型的比特率类型确认信息、以及采样列表信息和比特率列表信息等。
请求信息生成单元200可以生成VoIP分组,其中除了具有采样率和比特率请求信息的有效载荷报头之外,还添加了RTP报头、UDP报头和IP报头中的至少一个。如图3所示,请求信息生成单元200将采样率列表信息和比特率列表信息插入有效载荷报头中,并且可以将当前使用的采样率信息和比特率信息插入有效载荷报头中。请求信息生成单元200可以生成VoIP分组,其中除了包括有效载荷报头、EVS帧和填充比特的RTP有效载荷之外,还添加了RTP报头、UDP报头和IP报头。
控制单元210可以控制采样率和比特率请求信息,其包括待发射到接收终端的采样率列表信息和比特率列表信息。
接口单元230可在控制单元210的控制下将采样率和比特率请求信息发射到接收终端。此后,接口单元230可以从接收终端接收通过从采样列表信息选择的采样类型以及从比特率列表信息选择的比特率类型的至少一个组合得到的组合确定信息。
例如,如图4(b)所示,可以从接收终端接收{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}作为组合确定信息。每个组合确定信息片段可以指示(采样率识别信息、比特率识别信息)。因此,作为组合确定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}分别指示7.2(NB)、8(WB)、9.6(WB)、13.2(SWB)、16.4(SWB)和24.4(SWB)的采样率类型和比特率类型的组合信息。可以通过使用语音信号的背景噪声、语音质量、语音音调中的至少一个来确定此组合确定信息。
语音压缩单元240可以根据所接收的组合确定信息来压缩语音信号。例如,当接收图4(b)所示的作为组合确定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)时,语音压缩单元240可以以对应于组合确定信息的采样率和比特率压缩待发射到接收终端的语音信号。也就是说,如果确定以对应于组合确定信息的(0,0)来压缩语音信号,则语音压缩单元240可以根据对应于识别信息“0”的采样率类型8,000(NB)以及对应于识别信息“0”的比特率类型7.2来压缩语音信号,并且将压缩的语音信号输出到接口单元230。
接口单元230可以在控制单元210的控制下将压缩语音信号发射到接收终端。
图7是根据示例性实施方式的用于接收语音信号的接收终端的操作方法的流程图。
参考图7,在操作S300中,接收终端可以从发射终端接收采样率和比特率请求信息,其包括用于确定语音信号的采样率的采样信息、以及用于确定语音信号的比特率的比特率信息。采样信息可以包括采样列表信息,其具有对于特定范围确定的至少一个采样类型或采样率范围信息;并且比特率信息可以包括比特率列表信息,其具有对于特定范围确定的至少一个比特率类型或比特率范围信息。采样列表信息可以包括对应于相应采样类型的采样识别信息,并且比特率列表信息可以包括对应于相应比特率类型的比特率识别信息。
采样率和比特率请求信息可以通过插入有效载荷报头中而被接收。也就是说,对应于采样率和比特率请求信息的采样列表信息和比特率列表信息可以被添加到有效载荷报头,并且有效载荷报头包括:当前使用的采样类型的采样类型确认信息,当前使用的比特率类型的比特率类型确认信息、以及采样列表信息和比特率列表信息等。
可能以VoIP分组的形式接收具有采样率和比特率请求信息的有效载荷报头,在所述VoIP分组中添加了RTP报头、UDP报头和IP报头中的至少一个。如图3所示,接收终端可以接收VoIP分组,其中除了包括有效载荷报头、EVS帧和填充比特的RTP有效载荷之外,还添加了RTP报头、UDP报头和IP报头。
在操作S300之后,在操作S302中,接收终端可以确定基于采样信息确定的采样率和基于比特率信息确定的比特率的至少一个组合。可以通过从采样信息选择的采样类型和从比特率信息选择的比特率类型的至少一个组合,或通过在采样率范围信息的范围内确定的采样率范围和在比特率范围信息的范围内确定的比特率范围的至少一个组合,确定组合确定信息。可以在发送方向和接收方向上不同地确定采样率范围信息,并且可以在发送方向和接收方向上不同地确定比特率范围信息。
接收终端可以将有效载荷报报头、RTP报头、UDP报头和IP报头从所接收的VoIP分组中分离,从分离的有效载荷报头提取采样列表信息和比特率列表信息,并且通过使用所提取的采样列表信息和比特率列表信息来确定所述至少一个组合。
如图4(b)所示,接收终端可以从采样率列表信息选择EVS,并且确定任何一个采样率(例如,32,000个样本/秒)。此外,接收终端可以确定使用来自比特率列表信息的最大24.4Kbps的比特率。也就是说,可以将配置集确定为{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}作为组合确定信息。每个组合确定信息片段可以指示(采样率识别信息、比特率识别信息)。也就是说,(0,0)是采样率识别信息“0”和比特率识别信息“0”的组合,其中与识别信息相对应的采样率类型对应于8,000(NB),并且与识别信息相对应的比特率类型对应于7.2。因此,作为组合确定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}分别指示7.2(NB)、8(WB)、9.6(WB)、13.2(SWB)、16.4(SWB)和24.4(SWB)的采样率类型和比特率类型的组合信息。
接收终端可以通过使用包括语音信号的音频信号的背景噪声、音频质量、音频音调中的至少一个来确定采样率类型和比特率类型的组合信息。
如图5所示,接收终端可能不希望听到高频音频或尖锐声音。在这种情况下,通过在特定频率或更高频率的高频分量的能量比是特定水平或更高(如图5(b)所示)时包括从SWB的采样率降低到WB或NB的采样率;并且通过匹配可与采样率组合的比特率类型,接收终端分析接收的语音帧并且确定组合确定信息。相反,在连接到安全摄像机等使得甚至需要发射细声改变的情况下,接收终端可以通过将NB的采样率调整到WB、SWB等的采样率以便尽可能地提高采样率、以及匹配可以与采样率组合的比特率类型,来确定组合确定信息。
在操作S302之后,在操作S304中,接收终端可以将所确定的组合确定信息发射到发射终端。此后,当发射终端发射根据组合确定信息压缩的语音信号时,接收终端可以接收压缩的语音信号并且恢复和输出语音号。
图8是根据示例性实施方式的用于接收语音信号的接收终端的操作设备的框图,并且所述设备可以包括接口单元400、控制单元410和组合确定单元420。
参考图8,接口单元400可以从发射终端接收采样率和比特率请求信息,其包括:具有用于确定语音信号的采样率的至少一个采样类型的采样列表信息、以及具有用于确定语音信号的比特率的至少一个比特率类型的比特率列表信息。接口单元400可以接收插入采样率和比特率请求信息插入其中的有效载荷报头。接口单元400可以接收有效载荷报头,其包括:当前使用的采样类型的采样类型确认信息、当前使用的比特率类型的比特率类型确认信息、以及采样列表信息和比特率列表信息等。
可能以VoIP分组的形式接收有效载荷报头,在所述VoIP分组中添加了RTP报头、UDP报头和IP报头中的至少一个。如图8所示,接口单元400可以接收VoIP分组,其中除了包括有效载荷报头、EVS帧和填充比特的RTP有效载荷之外,还添加了RTP报头、UDP报头和IP报头。
控制单元410可以根据采样率和比特率请求信息的接收来控制组合确定单元420,以便确定采样率类型和比特率类型的组合。
组合确定单元420可以根据采样率和比特率请求信息确定从采样列表信息确定的采样类型以及从比特率列表信息确定的比特率类型的至少一个组合。
组合确定单元420可以将有效载荷报报头、RTP报头、UDP报头和IP报头从所接收的VoIP分组中分离,从分离的有效载荷报头提取采样列表信息和比特率列表信息,并且通过使用所提取的采样列表信息和比特率列表信息来确定所述至少一个组合。
如图4(b)所示,组合确定单元420可以从采样率列表信息选择EVS,并且确定任何一个采样率(例如,32,000个样本/秒)。此外,组合确定单元420可以确定使用来自比特率列表信息的最大24.4Kbps的比特率。每个组合确定信息片段可以指示(采样率识别信息、比特率识别信息)。作为组合确定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}分别指示7.2(NB)、8(WB)、9.6(WB)、13.2(SWB)、16.4(SWB)和24.4(SWB)的采样率类型和比特率类型的组合信息。
组合确定单元420可以通过使用包括语音信号的音频信号的背景噪声、音频质量、音频音调中的至少一个来确定采样率类型和比特率类型的至少一个组合。
如图5所示,接收终端的用户可能不希望听到高频音频或尖锐声音。在这种情况下,通过在特定频率或更高频率的高频分量的能量比是特定水平或更高(如图5(b)所示)时包括从SWB的采样率降低到WB或NB的采样率;并且通过匹配可与采样率组合的比特率类型,接收终端可以分析接收的语音帧并且确定组合确定信息,接收终端可以分析接收的语音帧并且确定组合确定信息。相反,在连接到安全摄像机等使得甚至需要发射细声改变的情况下,接收终端可以通过将NB的采样率调整到WB、SWB等的采样率以便尽可能地提高采样率、以及匹配可以与采样率组合的比特率类型,来确定组合确定信息。
控制单元410可以控制待发射到发射终端的所确定的组合确定信息。据此,接口单元400可以向发射终端发射组合确定信息。
发射终端与接收终端之间的这种协商方法在选择要用于呼叫的比特率和采样率时向发射终端提供最大的灵活性,但具有若干重要的限制。
首先,用于呼叫服务的比特率受费用系统的影响,并且通常被分配给一组邻近比特率(诸如13.2Kbps、16.4Kbps和24.4Kbps)而不是分成例如7.2Kbps、24.4Kbps和48Kbps。也就是说,可以以特定范围单位分配比特率,并且可以在此范围内调整比特率并且根据发射条件使用比特率。在这种情况下,并非逐个协商单独比特率,协商用于呼叫的最小比特率与最大比特率的范围可以是有效的。
图9示出了一个过程,其中发射终端通过使用br-send消息和br-recv消息向接收终端提供分别用于发送方向和接收方向的比特率,并且接收终端从所提供的比特率中选择部分范围并且应答所选择的范围。
这里,br-send消息和br-recv消息指示考虑发射终端和接收终端的互相相反的方向。为了使呼叫协商根据消息交换逐渐聚集,由接收终端发射的br-send消息的比特率范围应当是由发射终端发射的br-recv消息中提供的比特率范围的子集。此外,由接收终端发射的br-recv消息的比特率范围应当是由发射终端发射的br-send消息中提供的比特率范围的子集。
基本协商方法的另一个限制是这样一个问题,即当已经协商了采样率,但由于输入信号或背景噪声的不可预测特性发射终端需要调整采样率时,应当通过与对方终端交换信息来重新协商调整。如果输入信号或背景噪声的特性以高速度改变,即使发射终端连续尝试重新协商,发射终端也可能不满足当前输入信号的特性。即使在这种情况下,在呼叫协商步骤中马上协商用于呼叫的最小采样率与最大采样率的范围也可以是有效的。
图10示出了一个过程,其中发射终端通过使用bw-send消息和bw-recv消息向接收终端提供分别用于发射方向和接收方向的采样率范围,并且接收终端从所提供的采样率中选择部分范围并且应答所选择的范围。这里,bw-send消息和bw-recv消息指示考虑发射终端和接收终端的相互相反的方向。为了使呼叫协商收敛,由接收终端发射的bw-send消息的采样率范围应当是由发射终端发射的bw-recv消息中提供的采样率范围的子集。此外,由接收终端发射的bw-recv消息的采样率范围应当是由发射终端发射的bw-send消息中提供的采样率范围的子集。如上所述,以范围单位协商比特率和采样率的方法可能比协商单独比特率和单独采样率的方法更不灵活,但具有满足现实服务状况并且简化待交换消息的优点。此外,由于两个方向是独立协商的,即使发射终端和接收终端的音频处理能力彼此不同,以范围单位协调比特率和采样率的方法也可以比协商单独比特率和单独采样率的方法更有效地处理这种情况。当相同的比特率或采样率用于两个方向时,用诸如br和bw的缩写符号代替br-send/br-recv和bw-send/bw-recv来指示消息。
表5包括这些消息的定义。除了以范围单位的采样率之外,bw、bw-send和bw-recv可以用于单个采样率的协商,诸如NB、WB、SWB和FB。
[表5]
/>
/>
/>
在图11中,发射终端向接收终端提供:EVS编解码器使用5.9Kbps至64Kbps范围内的比特率,并且接收终端调整范围的上限和下限,修改范围,以使得在13.2Kbps至24.4Kbps范围内的比特率用于呼叫,并且将修改的范围应答回发射终端。
在图12中,发射终端向接收终端提供:EVS编解码器使用NB至SWB范围内的采样率,并且接收终端调整范围的上限和下限,修改范围,以使得使用NB至WB范围内的采样率,并且将修改的范围应答回发射终端。
在图13中,发射终端向接收终端提供:EVS编解码器使用5.9Kbps至64Kbps范围内的比特率以及NB至SWB范围内的采样率,并且接收终端调整比特率范围的上限和下限以及采样率范围的上限,修改范围,以使得使用在13.2Kbps至24.4Kbps范围内的比特率以及NB至WB范围内的采样率,并且将修改的范围应答回发射终端。
在图14中,发射终端向接收终端提供:EVS编解码器使用5.9Kbps至24.4Kbps范围内的比特率以及NB至SWB范围内的采样率,并且接收终端修改范围,以使得在接收方向上使用13.2Kbps的比特率以及NB至WB范围内的采样率,并且在发送方向上按照请求使用在5.9Kbps至24.4Kbps的范围内的比特率以及NB至SWB范围内的采样率,并将修改的范围应答回发射终端。
根据示例性实施方式的方法可以被实现为硬件或软件、或者作为硬件和软件的组合。当这些方法被实现为软件时,可以提供用于存储一个或多个程序(软件模块)的计算机可读存储介质。存储在计算机可读存储介质中的一个或多个程序被配置成由电子装置中的一个或多个处理器执行。一个或多个程序包括命令电子装置执行根据实施方式的方法的指令。
这些程序(软件模块或软件)可以存储在非易失性存储器中,所述非易失性存储器包括随机存取存储器(RAM)和闪存、只读存储器(ROM)、电可擦除可编程ROM(EEPROM)、磁盘存储装置、光盘ROM(CD-ROM)、数字通用盘(DVD)、另一种类型的光学存储装置、或磁带盒。可替代地,程序可以存储在包括其中的一些或全部的存储器中。此外,上述每个存储器在数量上可以是多个。
可替代地,程序可以存储在可附接存储装置中,其可以通过通信网络访问电子装置,所述通信网络包括单独或组合的互联网、内联网、局域网(LAN)、宽LAN(WLAN)和存储区域网络(SAN)。该存储装置可以通过外部端口访问电子装置。或者,通信网络上的单独的存储装置可以访问便携式电子装置。

Claims (7)

1.一种由发射终端执行的用于协商呼叫条件的方法,所述方法包括:
生成指示第一带宽范围的带宽信息和指示第一比特率范围的比特率信息;
将所述带宽信息和所述比特率信息发送至接收终端;
接收来自所述接收终端的组合确定信息;以及
根据接收到的组合确定信息压缩音频信号;
其中,所述组合确定信息是由所述接收终端基于第二带宽范围和第二比特率范围确定的,
其中,所述第二带宽范围包含在所述第一带宽范围中,并且所述第二比特率范围包含在所述第一比特率范围中,
其中,所述第一带宽范围和所述第一比特率范围是基于发送方向和接收方向中的每一者而确定的,并且
其中,当用于发送方向的第一比特率范围和用于接收方向的第一比特率范围相同时,将指示用于所述发送方向的第一比特率范围和用于所述接收方向的第一比特率范围的单个比特率信息发送至所述接收终端。
2.根据权利要求1所述的方法,其中,当用于所述发送方向的第一比特率范围和用于所述接收方向的第一比特率范围彼此不同时,将指示用于所述发送方向的第一比特率范围的比特率信息和指示用于所述接收方向的第一比特率范围的比特率信息分别发送至所述接收终端。
3.根据权利要求1所述的方法,其中,指示第一带宽范围的所述带宽信息和指示第一比特率范围的所述比特率信息被包括在有效载荷报头中。
4.一种非暂存性存储介质,嵌入有用于执行权利要求1至3中任一项所述的方法的程序。
5.一种用于处理发射终端中的音频信号的装置,所述装置包括至少一个处理器,所述处理器被配置为:
生成指示第一带宽范围的带宽信息和指示第一比特率范围的比特率信息;
将所述带宽信息和所述比特率信息发送至接收终端;
接收来自所述接收终端的组合确定信息;以及
根据接收到的组合确定信息压缩音频信号;
其中,所述组合确定信息是由所述接收终端基于第二带宽范围和第二比特率范围确定的,
其中,所述第二带宽范围包含在所述第一带宽范围中,并且所述第二比特率范围包含在所述第一比特率范围中,
其中,所述第一带宽范围和所述第一比特率范围是基于发送方向和接收方向中的每一者而确定的,并且
其中,当用于发送方向的第一比特率范围和用于接收方向的第一比特率范围相同时,将指示用于所述发送方向的第一比特率范围和用于所述接收方向的第一比特率范围的单个比特率信息发送至所述接收终端。
6.根据权利要求5所述的装置,其中,当用于所述发送方向的第一比特率范围和用于所述接收方向的第一比特率范围彼此不同时,通过不同的消息将指示用于所述发送方向的第一比特率范围的比特率信息和指示用于所述接收方向的第一比特率范围的比特率信息分别发送至所述接收终端。
7.根据权利要求5所述的装置,其中,指示第一带宽范围的所述带宽信息和指示第一比特率范围的所述比特率信息被包括在有效载荷报头中。
CN202110762752.1A 2014-04-21 2015-06-22 用于在无线通信系统中发射和接收语音数据的装置和方法 Active CN113259059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110762752.1A CN113259059B (zh) 2014-04-21 2015-06-22 用于在无线通信系统中发射和接收语音数据的装置和方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR20140047492 2014-04-21
KR1020140153191A KR102244612B1 (ko) 2014-04-21 2014-11-05 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
KR10-2014-0153191 2014-11-05
CN202110762752.1A CN113259059B (zh) 2014-04-21 2015-06-22 用于在无线通信系统中发射和接收语音数据的装置和方法
PCT/KR2015/006330 WO2015163750A2 (ko) 2014-04-21 2015-06-22 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
CN201580072483.9A CN107210968B (zh) 2014-04-21 2015-06-22 用于在无线通信系统中发射和接收语音数据的装置和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580072483.9A Division CN107210968B (zh) 2014-04-21 2015-06-22 用于在无线通信系统中发射和接收语音数据的装置和方法

Publications (2)

Publication Number Publication Date
CN113259059A CN113259059A (zh) 2021-08-13
CN113259059B true CN113259059B (zh) 2024-02-09

Family

ID=54333387

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580072483.9A Active CN107210968B (zh) 2014-04-21 2015-06-22 用于在无线通信系统中发射和接收语音数据的装置和方法
CN202110762752.1A Active CN113259059B (zh) 2014-04-21 2015-06-22 用于在无线通信系统中发射和接收语音数据的装置和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201580072483.9A Active CN107210968B (zh) 2014-04-21 2015-06-22 用于在无线通信系统中发射和接收语音数据的装置和方法

Country Status (3)

Country Link
EP (1) EP3217612A4 (zh)
CN (2) CN107210968B (zh)
WO (1) WO2015163750A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10057393B2 (en) * 2016-04-05 2018-08-21 T-Mobile Usa, Inc. Codec-specific radio link adaptation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101263554A (zh) * 2005-07-22 2008-09-10 法国电信公司 在比特率分级和带宽分级的音频解码中的比特率切换方法
CN102150204A (zh) * 2008-07-14 2011-08-10 韩国电子通信研究院 编码和解码语音与音频统合信号的设备
CN102985968A (zh) * 2010-07-01 2013-03-20 Lg电子株式会社 处理音频信号的方法和装置
CN103477650A (zh) * 2011-04-18 2013-12-25 思科技术公司 用于计算机网络中的数据流送的系统和方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4580622B2 (ja) * 2003-04-04 2010-11-17 株式会社東芝 広帯域音声符号化方法及び広帯域音声符号化装置
JP2008139781A (ja) * 2006-12-05 2008-06-19 Rohm Co Ltd 音声符号化方法および装置
WO2008108379A1 (ja) * 2007-02-28 2008-09-12 Nec Corporation メディア配信システム、配信サーバ装置及びそれらに用いるメディア配信方法並びにそのプログラム
JP2008233436A (ja) * 2007-03-19 2008-10-02 Fujitsu Ltd 符号化装置、符号化プログラムおよび符号化方法
JP2012523199A (ja) * 2009-04-07 2012-09-27 テレフオンアクチーボラゲット エル エム エリクソン(パブル) セッションネゴシエーションのための方法及び装置
CN102985969B (zh) * 2010-12-14 2014-12-10 松下电器(美国)知识产权公司 编码装置、解码装置和编码方法、解码方法
US9338580B2 (en) * 2011-10-21 2016-05-10 Qualcomm Incorporated Method and apparatus for packet loss rate-based codec adaptation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101263554A (zh) * 2005-07-22 2008-09-10 法国电信公司 在比特率分级和带宽分级的音频解码中的比特率切换方法
CN102150204A (zh) * 2008-07-14 2011-08-10 韩国电子通信研究院 编码和解码语音与音频统合信号的设备
CN102985968A (zh) * 2010-07-01 2013-03-20 Lg电子株式会社 处理音频信号的方法和装置
CN103477650A (zh) * 2011-04-18 2013-12-25 思科技术公司 用于计算机网络中的数据流送的系统和方法

Also Published As

Publication number Publication date
WO2015163750A3 (ko) 2015-12-23
CN107210968A (zh) 2017-09-26
CN113259059A (zh) 2021-08-13
WO2015163750A2 (ko) 2015-10-29
EP3217612A2 (en) 2017-09-13
EP3217612A4 (en) 2017-11-22
CN107210968B (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
US11887614B2 (en) Device and method for transmitting and receiving voice data in wireless communication system
US9525569B2 (en) Enhanced circuit-switched calls
CN110945494A (zh) 向客户端提供媒体内容的方法和系统
US8386266B2 (en) Full-band scalable audio codec
JP2008517560A (ja) 端末間のボイスオーバインターネットプロトコルのメディアの待ち時間を管理する方法および装置
EP3252767A1 (en) Voice signal processing method, related apparatus, and system
CN111164946B (zh) 用于适配互联网协议语音通信会话的请求的信令
WO1995031055A1 (en) Method and apparatus for inserting signaling in a communication system
JP2019501404A (ja) パケットの1次コーディングを復号すべきか冗長コーディングを復号すべきかを示すシグナリング情報を運ぶパケット
US7986634B2 (en) Apparatus and method for measuring quality of sound encoded with a variable band multi-codec
CN113259059B (zh) 用于在无线通信系统中发射和接收语音数据的装置和方法
JP4218456B2 (ja) 通話装置、通話方法及び通話システム
EP3649643A1 (en) Normalization of high band signals in network telephony communications
CN113259058A (zh) 用于在无线通信系统中发射和接收语音数据的装置和方法
JP2005045739A (ja) 通話装置、通話方法及び通話システム
US8117029B2 (en) Method and apparatus for matching sound quality measurement sections of variable bandwidth multi-codec
KR100875936B1 (ko) 가변대역 멀티코덱 음성 품질 측정 구간 일치를 위한 방법및 그 장치
JP2004080625A (ja) パケット型音声通信端末
US20230047127A1 (en) Method and system for providing media content to a client
JP4004431B2 (ja) パケット送出装置、及びこれらに用いる優先度に関する指標値の算出方法とそのプログラム
WO2019131498A1 (ja) 端末装置、方法、および、集積回路
JP4823754B2 (ja) 送信装置及び送信方法
WO2013127086A1 (zh) Sdp中标识、获取ambe编解码速率信息方法及设备
JP2008113151A (ja) 通信方法及び装置
JP2005045740A (ja) 通話装置、通話方法及び通話システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant