WO2018103661A1 - 一种传输语音数据的方法、设备和装置 - Google Patents

一种传输语音数据的方法、设备和装置 Download PDF

Info

Publication number
WO2018103661A1
WO2018103661A1 PCT/CN2017/114804 CN2017114804W WO2018103661A1 WO 2018103661 A1 WO2018103661 A1 WO 2018103661A1 CN 2017114804 W CN2017114804 W CN 2017114804W WO 2018103661 A1 WO2018103661 A1 WO 2018103661A1
Authority
WO
WIPO (PCT)
Prior art keywords
network device
voice data
voice
access network
codec mode
Prior art date
Application number
PCT/CN2017/114804
Other languages
English (en)
French (fr)
Inventor
惠庆华
李明
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2018103661A1 publication Critical patent/WO2018103661A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1069Session establishment or de-establishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • H04M7/0072Speech codec negotiation

Definitions

  • the present application relates to the field of wireless network communication technologies, and in particular, to a method, device, and apparatus for transmitting voice data.
  • Voice session service is one of the basic services of wireless networks.
  • multiple voice codecs are widely used to improve the quality of voice sessions and meet the needs of users for high-quality voice conversations.
  • currently used voice codec modes include, but are not limited to,: Adaptive Multi-Rate Narrowband (AMR-NB), Adaptive Multi-Rate Wideband (AMR-WB), and enhanced voice.
  • EVS-FB Enhanced Voice Services Narrowband
  • EVS-WB Enhanced Voice Services Wideband
  • EVS-SWB Enhanced Voice Services Super Wideband
  • EVS-FB Enhanced voice service Fullband
  • the process of transmitting voice data in the existing voice session service is as follows: calling voice data: calling terminal ⁇ access network device ⁇ core network device ⁇ access network device ⁇ called terminal; called voice data: called terminal ⁇ Access network equipment ⁇ core network equipment ⁇ access network equipment ⁇ calling terminal.
  • voice data calling terminal ⁇ access network device ⁇ core network device ⁇ access network device ⁇ called terminal
  • voice data called terminal ⁇ Access network equipment ⁇ core network equipment ⁇ access network equipment ⁇ calling terminal.
  • the operator often fails to update and upgrade the core network device due to the update fee or other reasons, and the voice codec capability corresponding to the core network device cannot be updated and upgraded, and the core network device cannot be upgraded. Supports voice codec for some or all voice quality levels.
  • the core network device When the core network device only supports the voice codec mode with low voice quality level (for example, AMR-NB), even if the calling terminal and the called terminal can support the voice codec mode with better quality of other voice sessions, only the voice codec mode can be selected.
  • the voice codec mode of the low voice quality level transmits voice data, which reduces the quality of the voice session.
  • a method of transmitting voice data comprising:
  • the calling terminal may encode the calling voice data according to the first voice codec manner to generate the first voice data, and then send the first voice data to the access network device.
  • the access network device may decode the first voice data.
  • the second voice data is generated according to the second voice codec mode, and then sent to the core network device.
  • the third voice data may be encoded according to the third voice codec mode, and then sent to the called terminal.
  • the first language At least two of the audio codec mode, the second voice codec mode, and the third voice codec mode are different.
  • the method further includes: the called terminal may encode the called voice data according to the third voice codec manner to generate the fourth voice data, and then send the fourth voice data to the access network device, and access the network device.
  • the fourth voice data may be decoded, and then the fifth voice data is encoded according to the second voice codec mode, and then sent to the core network device.
  • the voice code may be encoded according to the first voice codec mode. The sixth voice data is generated, and then the sixth voice data is sent to the called terminal.
  • the process in which the called terminal sends the called voice data to the calling terminal is basically the same as the process of the calling voice data, and the voice network decoding mode is converted and voiced by the access network device. Forwarding of data.
  • the method further includes: the voice codec used by the access network device according to the voice codec mode supported by the calling and the calling terminal, and the voice codec used in the voice data transmission link between the two The mode is determined as the first voice codec mode.
  • the access network device can determine the voice codec mode used by the voice data transmission link between the core network device and the called terminal terminal respectively. Two voice codec mode and third voice codec mode.
  • the voice codec mode between the access network device and each of the other devices may be determined by using a voice codec negotiation manner to ensure that the access network device and other devices are used.
  • the voice codec mode is the voice codec mode with the highest voice quality level supported by the two parties, which ensures the high voice session quality in the process of voice data transmission.
  • the voice quality level of the second voice codec mode is lower than or equal to the voice quality level of the first voice codec mode and the third voice codec mode.
  • the solution shown in the embodiment of the present application can implement the transmission of the voice data between the access network device and the core network device without changing the existing communication architecture, and ensures the solution and the current solution in the embodiment of the present application.
  • the compatibility of the communication architecture ensures the normal execution of various other services based on the device side of the core network, such as session timing, session charging, and session traffic monitoring based on the core network device side. Additional business.
  • the second voice codec mode selected between the access network device and the core network device does not affect the voice session quality during the voice data transmission process between the master/called terminal, so a voice codec with a lower voice quality level can be selected. In the mode, most of the core network devices and the access network devices satisfy the voice codec mode with a lower voice quality level.
  • the second voice codec mode can be specified in advance as the voice data transmission chain between the access network device and the core network device.
  • the voice codec mode of the road The voice session quality in the voice data transmission process depends on the first voice codec mode and the third voice codec mode. Therefore, the voice quality level of the first voice codec mode and the third voice codec mode are higher.
  • the access network device may determine whether the called terminal establishes a voice data transmission link with the local device, and if yes, may send the third voice data encoded according to the third voice codec manner. Giving Calling the terminal, if the called terminal establishes a voice data transmission link with other access network devices (ie, the target access network device), the access network device may use the first voice data encoded according to the first voice codec mode. Sending to the target access network device, and then the target access network device can decode the first voice data, and then encode the voice data according to the fourth voice codec manner negotiated with the called terminal to obtain the seventh voice data, and then The seventh voice data is sent to the called terminal. Alternatively, the access network device may first encode the calling voice data according to the fourth voice codec mode, and then send the calling voice data to the called terminal through the target access network device.
  • the access network device may determine whether the called terminal establishes a voice data transmission link with the local device, and if yes, may send the third voice data encoded according to the third voice codec manner.
  • the access network device may negotiate with the called terminal based on the target access network device.
  • the fourth voice codec mode, the seventh voice data obtained by encoding the calling voice data, and then sending the seventh voice data to the target access network device, and the target access network device can send the seventh voice data to the called terminal. .
  • the solution shown in this embodiment of the present application can be applied to an environment including one access network device, and can also be applied to an environment including multiple access network devices.
  • the voice data may be transmitted to a target access network device, and the voice data is transmitted to the called terminal by the target access network device.
  • the access network device/target access network device can convert the voice codec mode, and can be applied to the first voice codec mode and the fourth voice codec mode being consistent and inconsistent, the first voice codec mode and the first
  • the four voice codec modes do not affect each other, that is, the independence of the voice codec mode selection during voice data transmission is ensured, and the best voice codec mode is always selected for voice data transmission, thereby ensuring the voice session service. quality.
  • an access network device in a second aspect, includes a receiver and a transmitter, and the method for transmitting voice data provided by the foregoing first aspect is implemented by executing an instruction.
  • an apparatus for transmitting voice data comprising at least one module for implementing the method of transmitting voice data provided by the first aspect above.
  • the access network device can directly send the voice data reported by the calling terminal to the called terminal, and complete the voice data from the calling terminal to the called terminal without first passing through the core network device.
  • the transmitting end of the voice data may encode the voice data based on the voice codec mode negotiated by the receiver and the receiving end, and then the device at both ends of the voice data transmission may be independently selected at each stage of the voice data transmission.
  • the best voice codec mode that can be supported for session message transmission is not affected by the voice codec capability of other third party devices (especially not affected by the voice codec capability of the core network device), and the voice is guaranteed.
  • the consistency of the session service quality and the capabilities of the devices at both ends can effectively improve the quality of voice sessions.
  • FIG. 1 is a schematic diagram of a system framework for transmitting voice data in an embodiment of the present application
  • FIG. 2 is a schematic structural diagram of an access network device in an embodiment of the present application.
  • FIG. 3 is a flow chart showing the steps of a method for transmitting calling voice data in the embodiment of the present application
  • FIG. 4 is a flow chart showing the steps of a method for transmitting called voice data in the embodiment of the present application.
  • FIG. 5 is a schematic diagram of a system framework for transmitting voice data according to an embodiment of the present application.
  • FIG. 6 is a structural block diagram of an apparatus for transmitting voice data in an embodiment of the present application.
  • the system for transmitting voice data may include at least: a core network device, an access network device (including a base station), a calling terminal, and a called terminal.
  • the access network device can be connected to the core network device and connected to the calling terminal and the called terminal.
  • the access network device may be, but is not limited to, an access network device supporting a single wireless network standard or an access network device supporting a hybrid wireless network standard.
  • the access network device can include a receiver 110 and a transmitter 120, and further includes a processor 130, and the receiver 110 and the transmitter 120 can be coupled to the processor 130, respectively.
  • the receiver 110 can be used to receive signals, and the receiver 110 can include, but is not limited to, an antenna, one or more oscillators, a coupler, a low noise amplifier (LNA), a duplexer, an analog to digital converter, and a frequency conversion.
  • LNA low noise amplifier
  • the transmitter 120 can be used to transmit signals, and the transmitter 120 can include, but is not limited to, an antenna, one or more oscillators, a coupler, a power amplifier (PA), a duplexer, a digital to analog converter, a frequency converter, etc.
  • PA power amplifier
  • the method for transmitting voice data may be applied to various communication systems, and various communication systems may include, but are not limited to, one of the following systems: Global System for Mobile Communication (Global System for Mobile Communication, GSM), Wideband Code Division Multiple Access (WCDMA) system, Time Division-Synchronous Code Division Multiple Access (TD-SCDMA) system, Code Division Multiple Access (Code Division Multiple Access) , CDMA) system, Long Term Evolution (LTE).
  • GSM Global System for Mobile Communication
  • WCDMA Wideband Code Division Multiple Access
  • TD-SCDMA Time Division-Synchronous Code Division Multiple Access
  • CDMA Code Division Multiple Access
  • LTE Long Term Evolution
  • the access network device may at least include: a receiver, a transmitter, and a processor.
  • the receiver and the transmitter can be used together for the transmission of voice data; the processor can be used to implement the conversion process of the voice codec mode.
  • the access network device may be a specific hardware device, a functional module implemented based on software, or a device implemented based on a hardware device and a functional module.
  • the access network device may at least include: a gateway device.
  • the gateway device may include: a transceiver and a processor.
  • the transceiver can be used to implement transceiving and processing of voice data; It can be used to implement conversion processing of voice codec mode.
  • the gateway device may be a specific hardware device, or may be a software-implemented function module, or a device based on a hardware device and a function module.
  • the method for transmitting voice data may be, but is not limited to, implemented based on the foregoing access network device or gateway device.
  • FIG. 3 a flow chart of steps of a method for transmitting voice data in an embodiment of the present application is shown.
  • the access network device in the system for transmitting voice data is one (the calling terminal and the called terminal are connected to the same access network device), the method for transmitting voice data is specific.
  • the process flow may include the following steps (this embodiment uses the execution flow of the access network device as an example):
  • Step 301 The access network device receives the first voice data.
  • the first voice data is called calling voice data encoded by the first voice codec mode sent by the calling terminal.
  • the session device corresponding to the calling user may be regarded as the calling terminal, and the session device corresponding to the called user may be regarded as the called terminal.
  • the session between the calling user and the called user can be easily divided into two major processes: the session request establishment process and the voice data transmission process.
  • the specific implementation of the session request establishment process can be as follows:
  • the calling terminal When the calling user needs to conduct a session with other called users, the calling terminal (such as a mobile phone) can dial the session number corresponding to the called terminal to initiate a voice session request.
  • the called terminal may notify the called user by any appropriate notification manner such as ringing.
  • the called user After receiving the ringing notification sent by the called terminal, the called user can realize the confirmation of the voice session request by the called terminal by triggering the confirmation option (or confirmation button) on the called terminal.
  • the calling terminal completes the establishment of the session link with the called terminal, and thus can perform the session based on the session link.
  • the session link may refer to: a calling terminal ⁇ access network device ⁇ core network device.
  • the specific implementation of the voice data transmission process can be as follows:
  • the calling terminal and the called terminal are in a connected state, and the calling user can speak through the calling terminal to complete the input of the calling voice data.
  • the calling terminal can report the voice data input by the calling user to the access network device.
  • the first voice data may be encoded in the first voice codec manner to obtain the first voice data, and then the first voice data is reported to the access network device.
  • Step 302 The access network device sends the second voice data to the core network device, and sends the third voice data to the called terminal.
  • the second voice data is caller voice data encoded based on the second voice codec mode
  • the third voice data is caller voice data encoded by the third voice codec mode, the first voice codec mode and the second voice. At least two of the codec mode and the third voice codec mode are different.
  • the access network device may encode the calling voice data according to the second voice codec manner to obtain the second voice.
  • the data is then reported to the core network device to ensure normal execution of other additional services related to the voice session, such as session timing, session charging, and session traffic monitoring implemented on the core network device side.
  • the core network device may return the second voice data to the access network device after performing the processing of other additional services.
  • the access network device After receiving the calling voice data sent by the calling terminal, the calling voice data can be directly forwarded to the called terminal without forwarding the voice data returned by the core network device after the voice data is sent to the core network device.
  • the access network device may first decode the voice data, and then encode the voice data according to another voice codec mode and then send the voice data to other devices.
  • the voice data may not be decoded, the current voice codec mode of the voice data is directly transcoded into another voice codec mode, and then the transcoded voice data is sent to other devices.
  • the access network device may be used. Realize the conversion process of voice codec mode. Considering that the speed of the device update is different, the first voice codec mode and the second voice codec mode are different.
  • the third voice codec mode is consistent with the first voice codec mode; 2.
  • the third voice codec mode is inconsistent with the first voice codec mode.
  • the third voice codec mode is a voice codec mode used between the access network device and the called terminal.
  • the first voice codec mode is a voice codec mode between the access network device and the called terminal.
  • the access network device can directly forward the voice data to the called terminal, that is, send the first (third) voice data to the called terminal. .
  • the access network device when the third voice codec mode is inconsistent with the first voice codec mode, when the access network device sends the voice data to the called terminal, the access network device may include: the access network device encodes the voice data according to the third voice code. The method re-encodes the third voice data, and then sends the third voice data to the called terminal.
  • This step can be specifically implemented by the transmitter 120.
  • the transmission process of the called voice is basically consistent with the transmission process of the calling voice, and the corresponding processing procedure can be as shown in FIG. 4:
  • Step 401 The access network device receives the fourth voice data.
  • the fourth voice data is the called voice data that is encoded by the called terminal and encoded according to the third voice codec mode.
  • Step 402 The access network device sends fifth voice data to the core network device, and sends sixth voice data to the calling terminal.
  • the fifth voice data is called voice data encoded based on the second voice codec mode
  • the sixth voice data is called voice data encoded based on the first voice codec mode.
  • the called terminal encodes the called voice data according to the third voice codec method to obtain the fourth voice data, and then reports the fourth voice data to the access network device, and the access network device can press the called voice data according to the first
  • the second voice codec method obtains the fifth voice data, and reports the fifth voice data to the core network device.
  • the access network device can directly encode the called voice data according to the first voice codec method to obtain the sixth. The voice data is then sent to the calling terminal, and then the calling user can hear the called voice data through the calling terminal.
  • This step can be specifically implemented by the transmitter 120.
  • the voice codec mode used between the calling terminal, the called terminal, the core network device, and the access network device is independently negotiated by the foregoing device, and the corresponding processing may be as follows: the access network device is according to the main The voice codec mode supported by the terminal and the access network device determines the first voice codec mode as the voice codec mode used by the voice data transmission link between the access network device and the calling terminal; The device determines, according to the voice codec mode supported by the core network device and the access network device, the second voice codec mode as a voice codec mode used by the voice data transmission link between the access network device and the core network device; The access network device determines, according to the voice codec mode supported by the called terminal and the access network device, the third voice codec mode as the voice code used by the voice data transmission link between the access network device and the called terminal. Decoding method.
  • the calling terminal may, when requesting to establish a voice session service, carry the voice codec mode supported by the calling terminal in the voice session service establishment request, and report the voice message to the access network device. Then, the access network device can determine the intersection of the voice codec modes supported by the two according to the voice codec mode supported by the voice codec mode and the voice codec mode supported by the calling terminal.
  • the intersection group can have multiple intersection results. In an optional embodiment of the present application, an intersection result with a corresponding highest voice quality level may be selected from the plurality of intersection results as the third first voice coding and decoding mode.
  • This step can be specifically implemented by the processor 130.
  • AMR-NB, AMR-WB, EVS-NB, etc. can all be a type of speech codec, and each type of speech codec can be a sub-mode set, including multiple sub-modes divided according to data transmission speed.
  • AMR-NB includes: 8 seed mode: 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15, 4.75
  • AMR-WB includes 23.85, 23.05, 19.85, 18.25, 9 seed mode: 15,85, 14.25, 12.65, 8.85, 6.60
  • EVS-NB includes 6 modes: 24.4, 13.2, 9.6, 8, 7.2, 5.9
  • EVS-WB includes 128.0, 96.0, 64.0, 48.0, 32.0, 12 seed methods such as 24.4, 16.4, 13.2, 9.6, 8.0, 7.2, and 5.9
  • EVS-SWB includes 12 seed modes such as 128.0, 96.0, 64.0, 48.0, 32.0, 24.4, 16.4, 13.2, and 9.6;
  • the core network device only supports some of the sub-modes.
  • the core network device only supports a partial sub-mode of 12.65-6.6 in the AMR-WB
  • the access network device and the calling/called terminal support a partial sub-mode of 23.85-6.6 in the AMR-WB.
  • the second voice coding mode may be AMR-WB 12.65 kbps
  • the first and third voice codec modes adopt AMR-WB 23.85 kbps.
  • the voice codec mode with a lower voice quality level may be selected as the second voice code.
  • the decoding mode correspondingly, the voice quality level of the second voice codec mode is lower than or equal to the voice quality level of the first voice codec mode and the third voice codec mode.
  • the calling terminal and the called terminal can respectively connect the access network devices under different serving cells.
  • the calling terminal and the called terminal may also respectively connect the access network devices corresponding to different wireless communication systems.
  • commonly used wireless communication systems include but are not limited to: second generation mobile telephone technology (2G), third generation mobile communication technology (3G), fourth generation mobile communication 4th-Generation mobile communication (4G) and 5th-Generation mobile communication (5G).
  • two access network devices may be used to connect with the calling terminal and the called terminal respectively, or the same type supporting the hybrid system may be adopted.
  • the access network device connects the calling terminal and the called terminal.
  • the specific process of the corresponding voice data processing method can be referred to the description of the foregoing embodiment, and details are not described herein again.
  • the following describes the scenario in which the calling terminal and the called terminal are respectively connected to different access network devices.
  • the voice data processing system may include at least the following devices: a core network device, an access network device, and a target access network. Equipment, calling terminal, called terminal, and base station.
  • the core network device is respectively connected to the access network device and the target access network device, and the access network device is connected to the calling terminal through the base station, and is connected to the target access network device, and the target access network device passes the base station and the called party. Terminal connection.
  • the step of sending the voice data to the called terminal may be specifically as follows: if the called terminal is connected The access network device establishes a voice data transmission link, and the access network device sends the third voice data to the called terminal. If the called terminal establishes a voice data transmission link with the target access network device, the access network device The target access network device sends the first voice data, where the first voice data is used to indicate that the target access network device sends the seventh voice data to the called terminal.
  • the seventh voice data is caller voice data encoded according to the fourth voice codec mode
  • the fourth voice codec mode is a voice codec mode supported by the target access network device according to the called terminal and the target access network device. Determining, the voice codec mode adopted by the voice data transmission link between the target access network device and the called terminal.
  • the access network device may determine whether a voice data transmission link is established between the access network device and the called terminal, if the voice data transmission chain If the path exists, the access network device may decode the first voice data, and then encode the calling voice data according to the third voice codec manner to obtain the third voice data, and then send the third voice data to the called terminal. If the voice data transmission link does not exist, that is, the called terminal establishes a voice data transmission link with other access network devices (ie, the target access network device), the received first voice data can be directly sent to the target. Access network equipment. After receiving the first voice data, the target access network device can decode the first voice data, then encode the seventh voice data according to the fourth voice codec mode, and send the seventh voice data to the called terminal.
  • the calling voice data may be first encoded according to the fourth voice encoding and decoding method to obtain the seventh voice data, so that the target is connected. After receiving the seventh voice data, the network access device may directly send the seventh voice data to the called terminal.
  • the process of the voice network data sent by the access network device to the called terminal in the application scenario corresponding to the foregoing FIG. 1 is not described herein.
  • the first voice codec mode is consistent with the fourth voice codec mode.
  • the first speech codec mode is inconsistent with the fourth speech codec mode.
  • the first voice codec mode is: a voice codec mode between the access network device and the calling terminal; and the fourth voice codec mode is: a voice codec mode between the target access network device and the called terminal.
  • the access network device can directly send the voice data to the called terminal through the target access network device, without performing the conversion of the voice codec mode.
  • the voice codec mode may be converted by the access network device or the target access network device.
  • the transmission process of the called voice data may be as follows: the called terminal sends the called voice data encoded according to the fourth voice codec mode to the target access network device, and the target access network device sends the voice data to the access network device.
  • a voice data encoded by a voice codec mode/fourth voice codec mode, and the called voice data encoded by the fifth voice codec mode is sent to the core network device, and the access network device sends the called voice data to the calling terminal.
  • the fifth voice codec mode is determined by the target access network device according to the voice codec mode supported by the core network device, and the voice data transmission link between the target access network device and the core network device is used. Compilation Code method.
  • the core network device may encode the calling voice data according to the fifth voice codec mode after performing other additional services. And then sent to the target access network device, similarly, the called voice data can be encoded according to the second voice codec mode, and then sent to the access network device.
  • the above steps may be specifically implemented by the processor 130 and the transmitter 120.
  • the access network device may directly send the calling voice data reported by the calling terminal to the called terminal, avoiding the core network device, and completing the calling voice data from the calling terminal to the called party. Transmission between terminals.
  • the transmission of the voice data in each stage of the voice session service is relatively independent: the voice data is used when transmitting between the access network device and the calling terminal.
  • the voice codec mode depends on the voice codec mode determined by the access network device and the calling terminal.
  • the voice codec mode used when the voice data is transmitted between the access network device and the called terminal depends on the voice codec mode.
  • the voice codec mode determined by the network access device and the called terminal is negotiated.
  • the voice session service implemented by the voice data processing method in the embodiment of the present application can independently select the best voice codec mode supported by the terminal for voice data transmission at various stages of voice data transmission, and is not subject to other
  • the influence of the voice codec capability of the three-party device ensures the consistency of the voice session service quality and the terminal capability, and effectively improves the session quality of the voice session service.
  • the access network device may encode the voice data according to the set second voice codec mode and report the voice data to the core network device.
  • the second voice codec mode can be regarded as a voice codec mode of a low voice quality level supported by any existing device. It can be seen that, in the embodiment of the present application, the access network device can re-encode the voice data according to the second voice codec mode, and further, the voice codec can be passed between the access network device and the core network device by using a low voice quality level.
  • the method for transmitting the voice data in the embodiment of the present application can implement the transmission of the voice data between the access network device and the core network device without changing the existing communication architecture, and ensures the embodiment of the present application.
  • the compatibility of the method for transmitting voice data with the existing communication architecture ensures the normal execution of other services based on the device side of the core network, such as session timing, session charging, and session traffic monitoring based on the core network device side. Other additional services related to voice conversations.
  • the voice codec mode between the devices can be determined based on the device capability information (voice codec capability) carried in the existing communication process, and no additional process is needed, which is simple and convenient.
  • FIG. 6 is a block diagram of an apparatus for transmitting voice data according to an embodiment of the present invention.
  • the means for transmitting voice data may be implemented as part or all of the device by software, hardware or a combination of both.
  • the apparatus for transmitting voice data provided by the embodiment of the present invention may implement the process described in FIG. 3 of the embodiment of the present invention.
  • the apparatus for transmitting voice data includes a first receiving module 601, a first sending module 602, a second receiving module 603, and a first Two sending module 604, determining module 605:
  • the first receiving module 601 is configured to receive first voice data, where the first voice data is called calling voice data that is encoded by the first voice codec mode and sent by the calling terminal.
  • the first sending module 602 is configured to send second voice data to the core network device, where the second voice data is the calling voice data encoded according to the second voice codec mode, and send the third voice data to the called terminal.
  • the third language The voice data is the caller voice data encoded according to the third voice codec mode, wherein at least one of the first voice codec mode, the second voice codec mode, and the third voice codec mode The two are not the same.
  • the device further includes:
  • the second receiving module 603 is configured to receive fourth voice data, where the fourth voice data is the called voice data that is sent by the called terminal and is encoded according to the third voice codec mode;
  • a second sending module 604 configured to send fifth voice data to the core network device, where the fifth voice data is the called voice data encoded according to the second voice codec mode, to the calling party
  • the terminal sends the sixth voice data, where the sixth voice data is the called voice data encoded based on the first voice codec mode.
  • the device further includes a determining module 605, configured to:
  • the second voice codec mode as voice data transmission between the access network device and the core network device
  • the voice codec mode used by the link
  • the voice quality level of the second voice codec mode is lower than or equal to the voice quality level of the first voice codec mode and the third voice codec mode.
  • the access network device further includes a determining module 605, where:
  • the determining module 605 is configured to determine that the voice data transmission link is established with the called terminal is the access network device or the target access network device, and when the determining module 605 determines that the called terminal and the access are
  • the network device is configured to have a voice data transmission link
  • the first sending module 602 is configured to send third voice data to the called terminal.
  • the first sending module 602 is configured to send the first voice to the target access network device.
  • the first voice data is used to indicate that the target access network device sends seventh voice data to the called terminal, and the seventh voice data is the calling party coded based on a fourth voice codec mode.
  • Voice data wherein the fourth voice codec mode is determined by the target access network device according to a voice codec mode supported by the called terminal and the target access network device, and the target access The voice codec mode adopted by the voice data transmission link between the network device and the called terminal.
  • the access network device further includes a determining module 605, where:
  • the determining module is configured to determine, when the voice data transmission link is established with the called terminal, the access network device or the target access network device, where the determining module determines that the called terminal and the access network device Establishing a voice data transmission link, where the first sending module is configured to send third voice data to the called terminal;
  • the first sending module is configured to send seventh voice data to the target access network device, where The seventh voice data is used to instruct the target access network device to send the seventh voice data to the called terminal, where the seventh voice data is the calling voice data encoded according to a fourth voice codec mode.
  • the fourth speech codec mode is the target a voice data transmission link between the target access network device and the called terminal, determined by a voice access code mode supported by the called terminal and the target access network device The voice codec method used.
  • the foregoing determining module 605 can be implemented by the processor 130, and the first receiving module 601 and the second receiving module 603 can be implemented by the receiver 110 or implemented in conjunction with the processor 130.
  • the first sending module 602, The second transmitting module 604 can be implemented by the transmitter 120 or in conjunction with the processor 130.
  • the access network device can avoid the core network device, and directly send the voice data reported by the calling terminal to the called terminal to complete the transmission of the voice data.
  • the transmission of the voice data is not limited by the voice codec capability of the core network device, ensuring the independence of the voice data transmission process, and the voice coding data can be transmitted by selecting the best voice codec mode supported by the terminal to ensure the transmission of the voice data. The consistency of the selected speech codec mode and the corresponding speech codec capability of the terminal ensures the quality of the voice session.
  • the apparatus for transmitting voice data provided by the foregoing embodiment implements the transmission of the voice data
  • only the division of the foregoing functional modules is illustrated. In actual applications, the functions may be allocated differently according to requirements.
  • the function module is completed, that is, the internal structure of the device is divided into different functional modules to complete all or part of the functions described above.
  • the device for transmitting voice data provided by the foregoing embodiment is the same as the method for transmitting the voice data. For the specific implementation process, refer to the method embodiment, and details are not described herein again.
  • a person skilled in the art may understand that all or part of the steps of implementing the above embodiments may be completed by hardware, or may be instructed by a program to execute related hardware, and the program may be stored in a computer readable storage medium.
  • the storage medium mentioned may be a read only memory, a magnetic disk or an optical disk or the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种传输语音数据的方法、设备和装置,属于无线通信技术领域。所述方法包括:接入网设备接收第一语音数据,第一语音数据为主叫终端发送的基于第一语音编解码方式编码的主叫语音数据;接入网设备向核心网设备发送第二语音数据,第二语音数据为基于第二语音编解码方式编码的主叫语音数据;接入网设备向被叫终端发送第三语音数据,第三语音数据为基于第三语音编解码方式编码的主叫语音数据,其中,第一语音编解码方式、第二语音编解码方式和第三语音编解码方式中至少有两个不相同。采用本申请,可以解决现有技术中由于语音会话业务受某一逻辑功能实体的语音编解码能力限制而导致的语音会话质量降低的问题。

Description

一种传输语音数据的方法、设备和装置
本申请要求于2016年12月09日提交国家知识产权局、申请号为201611128953.1、发明名称为“一种传输语音数据的方法、设备和装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及无线网络通信技术领域,特别涉及一种传输语音数据的方法、设备和装置。
背景技术
语音会话业务是无线网络的基本业务之一,随着通信技术的发展,多种语音编解码方式被广泛应用,以提升语音会话质量,满足用户对高质量语音会话的需求。例如,目前常用的语音编解码方式包括但不仅限于:窄带自适应速率语音(Adaptive Multi-Rate Narrowband,AMR-NB)、宽带自适应速率语音(Adaptive Multi-Rate Wideband,AMR-WB)、增强语音业务窄带编解码(Enhanced Voice Services Narrowband,EVS-NB)、增强语音业务宽带编解码(Enhanced Voice Services Wideband,EVS-WB)、增强语音业务超宽频带编解码(Enhanced Voice Services Super Wideband,EVS-SWB)、增强语音业务全频带编解码(Enhanced Voice Services Fullband,EVS-FB),按照对应提供的语音质量等级由高到低,顺序依次为:EVS-FB>EVS-SWB>EVS-WB>EVS-NB>AMR-WB>AMR-NB。
目前,现有语音会话业务中传输语音数据的流程如下:主叫语音数据:主叫终端→接入网设备→核心网设备→接入网设备→被叫终端;被叫语音数据:被叫终端→接入网设备→核心网设备→接入网设备→主叫终端。在语音数据传输的具体实现过程中,通常要求端到端链路中的所有逻辑功能实体(核心网设备、接入网设备、主叫终端和被叫终端)支持相同的语音编解码方式,基于所述相同的语音编解码方式进而执行相应的语音数据的传输。
然而,在实际应用中,运营商经常会因更新费用或其他原因而未能对核心网设备进行更新升级,进而导致核心网设备所对应的语音编解码能力也无法得到更新升级,核心网设备无法支持部分或所有语音质量等级的语音编解码方式。
当核心网设备只支持低语音质量等级的语音编解码方式(如,AMR-NB)时,即使主叫终端和被叫终端能支持其他语音会话质量更佳的语音编解码方式,也只能选择低语音质量等级的语音编解码方式传输语音数据,这样,会降低语音会话质量。
发明内容
为了解决现有技术的问题,本申请实施例提供了一种传输语音数据的方法、设备和装置。该技术方案如下:
第一方面,提供了一种传输语音数据的方法,所述方法包括:
主叫终端可以将主叫语音数据按照第一语音编解码方式编码生成第一语音数据,然后发送给接入网设备,接入网设备接收到第一语音数据以后,可以对第一语音数据解码,然后按照第二语音编解码方式编码生成第二语音数据,然后发送给核心网设备,此外,还可以按照第三语音编解码方式编码生成第三语音数据,然后发送给被叫终端。其中,第一语 音编解码方式、第二语音编解码方式和第三语音编解码方式中至少有两个不相同。
本申请实施例所示的方案,接入网设备可以直接将主叫终端上报的主叫语音数据发送给被叫终端,传输路径无需经过核心网设备,即可完成语音数据从主叫终端到被叫终端之间的传输。换而言之,在本申请实施例所述的方案中,语音数据在传输的各个阶段中的传输相对独立。可见,通过本申请实施例所述的方案实现的语音会话业务,在语音数据传输的各个阶段可以独立的选择终端所能支持的最佳语音编解码方式,不受其他第三者设备的语音编解码能力的影响(特别是不受核心网设备的语音编解码能力的影响),保证了语音会话业务质量与终端能力的一致性,有效提高了语音会话质量。
在一种可能的实现方式中,所述方法还包括:被叫终端可以将被叫语音数据按照第三语音编解码方式编码生成第四语音数据,然后发送给接入网设备,接入网设备接收到第四语音数据以后,可以对第四语音数据解码,然后按照第二语音编解码方式编码生成第五语音数据,然后发送给核心网设备,此外,还可以按照第一语音编解码方式编码生成第六语音数据,然后将第六语音数据发送给被叫终端。
本申请实施例所示的方案,被叫终端在向主叫终端发送被叫语音数据的过程与主叫语音数据的传输过程基本相同,均由接入网设备实现语音编解码方式的转换和语音数据的转发。
在一种可能的实现方式中,所述方法还包括:接入网设备可以根据自身和主叫终端共同支持的语音编解码方式,将两者之间的语音数据传输链路采用的语音编解码方式确定为第一语音编解码方式,同理,接入网设备可以分别将其与核心网设备之间以及其与被叫终端之间的语音数据传输链路采用的语音编解码方式确定为第二语音编解码方式和第三语音编解码方式。
本申请实施例所示的方案,可以通过语音编解码方式协商的方式来确定接入网设备与其他各个设备之间的语音编解码方式,确保了接入网设备与其他各个设备之间所采用的语音编解码方式为交互双方共同支持的语音质量等级最高的语音编解码方式,保证了语音数据传输的过程中较高语音会话质量。
在一种可能的实现方式中,第二语音编解码方式的语音质量等级低于或等于第一语音编解码方式和第三语音编解码方式的语音质量等级。
本申请实施例所示的方案,可以在不改变现有通信架构的基础上实现了接入网设备与核心网设备之间的语音数据的传输,确保了本申请实施例所述的方案与现有通信架构的兼容性,保证了基于核心网设备侧实现的各项其他业务的正常执行,如:基于核心网设备侧实现的会话计时、会话计费和会话流量监控等与语音会话相关的其他附加业务。而接入网设备与核心网设备之间选用的第二语音编解码方式不会影响主/被叫终端间语音数据传输过程中的语音会话质量,故而可以选用语音质量等级较低的语音编解码方式,而大部分核心网设备和接入网设备均满足语音质量等级较低的语音编解码方式,故而可以预先指定第二语音编解码方式为接入网设备和核心网设备间语音数据传输链路的语音编解码方式。而语音数据传输过程中语音会话质量更多的取决于第一语音编解码方式和第三语音编解码方式,故而第一语音编解码方式和第三语音编解码方式的语音质量等级较高。
在一种可能的实现方式中,接入网设备可以判断被叫终端是否与本地建立有语音数据传输链路,如果有,则可以将按照第三语音编解码方式编码得到的第三语音数据发送给被 叫终端,如果被叫终端与其它接入网设备(即目标接入网设备)建立有语音数据传输链路,则接入网设备可以将按照第一语音编解码方式编码得到的第一语音数据发送给目标接入网设备,然后目标接入网设备可以对第一语音数据进行解码,再基于其与被叫终端协商的第四语音编解码方式对语音数据进行编码得到第七语音数据,然后将第七语音数据发送给被叫终端。或者也可以由接入网设备先按照第四语音编解码方式对主叫语音数据编码,然后通过目标接入网设备将主叫语音数据发送给被叫终端。
在一种可能的实现方式中,接入网设备可以判断被叫终端是否与本地建立有语音数据传输链路,如果有,则可以将按照第三语音编解码方式编码得到的第三语音数据发送给被叫终端,如果被叫终端与其它接入网设备(即目标接入网设备)建立有语音数据传输链路,则接入网设备可以基于目标接入网设备与被叫终端协商的第四语音编解码方式,对主叫语音数据编码得到的第七语音数据,然后将第七语音数据发送给目标接入网设备,进而目标接入网设备可以将第七语音数据发送给被叫终端。
本申请实施例所示的方案,可以应用于包括一个接入网设备的环境中,也可以应用于包括多个接入网设备的环境中。当应用于包括多个接入网设备的环境中时,可以将所述语音数据发送至目标接入网设备,通过所述目标接入网设备将所述语音数据发送至所述被叫终端。接入网设备/目标接入网设备可以对语音编解码方式进行转换,可以适用于第一语音编解码方式与第四语音编解码方式一致和不一致两种情况,第一语音编解码方式与第四语音编解码方式之间互不影响,也即确保了语音数据传输过程中语音编解码方式选择的独立性,始终选择最佳的语音编解码方式进行语音数据的传输,保证了语音会话业务的质量。
第二方面,提供了一种接入网设备,该接入网设备包括接收器、发送器,通过执行指令来实现上述第一方面所提供的传输语音数据的方法。
第三方面,提供了一种传输语音数据的装置,该装置包括至少一个模块,该至少一个模块用于实现上述第一方面所提供的传输语音数据的方法。
上述本申请实施例第二到第三方面所获得的技术效果与第一方面中对应的技术手段获得的技术效果近似,在这里不再赘述。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例所示的方案,首先,接入网设备可以直接将主叫终端上报的语音数据发送给被叫终端,无需先经过核心网设备即可完成语音数据从主叫终端到被叫终端之间的传输。另外,语音数据传输的过程中,语音数据的发送端可以基于其与接收端两者协商的语音编解码方式对语音数据进行编码,进而在语音数据传输的各个阶段可以独立的选择收发两端设备所能支持的最佳语音编解码方式进行会话消息的传输,不受其他第三者设备的语音编解码能力的影响(特别是不受核心网设备的语音编解码能力的影响),保证了语音会话业务质量与收发两端设备能力的一致性,可以有效提高语音会话质量。
附图说明
图1是本申请实施例中一种传输语音数据的系统框架示意图;
图2是本申请实施例中一种接入网设备的结构示意图;
图3是本申请实施例中一种传输主叫语音数据的方法的步骤流程图;
图4是本申请实施例中一种传输被叫语音数据的方法的步骤流程图;
图5是本申请实施例中一种传输语音数据的系统框架示意图;
图6是本申请实施例中一种传输语音数据的装置的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参照图1,示出了本申请实施例中一种传输语音数据的系统的结构示意图。在本申请实施例的一种应用场景中,传输语音数据的系统至少可以包括如下设备:核心网设备、接入网设备(包括基站)、主叫终端、被叫终端。其中,接入网设备可以与核心网设备连接,并与主叫终端、被叫终端连接。其中,接入网设备可以但不仅限于是:支持单一无线网络制式的接入网设备、或支持混合无线网络制式的接入网设备。如图2所示,接入网设备可以包括接收器110和发射器120,还包括处理器130,接收器110和发射器120可以分别与处理器130连接。接收器110可以用于接收信号,接收器110可以包括但不限于天线、一个或多个振荡器、耦合器、低噪声放大器(low noise amplifier,LNA)、双工器、模数转换器、变频器等硬件中的一项或多项。发射器120可以用于发送信号,发射器120可以包括但不限于天线、一个或多个振荡器、耦合器、功率放大器(power amplifier,PA)、双工器、数模转换器、变频器等硬件中的一项或多项。在本申请中,接收器110和发射器120可以用于传输语音数据的相关处理,处理器130可以包括一个或多个处理单元;处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件等。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
本申请所有实施例提供的传输语音数据的方法,可以应用于各种通信制式中,各种通信制式可以包括但不限于下述制式中的一种:全球移动通信系统(Global System for Mobile Communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)系统、时分同步码分多址(Time Division-Synchronous Code Division Multiple Access,TD-SCDMA)系统、码分多址(Code Division Multiple Access,CDMA)系统、长期演进(Long Term Evolution,LTE)。
在本申请的一可选实施例中,接入网设备至少可以包括:接收器、发送器和处理器。其中,接收器、发送器可以共同用于语音数据的传输;处理器可以用于实现语音编解码方式的转换处理。需要说明的是,接入网设备可以是一个具体的硬件设备,也可以是基于软件实现的功能模块,或者,基于硬件设备和功能模块共同实现的设备。
在本申请的一可选实施例中,接入网设备至少可以包括:网关设备。其中,网关设备中可以包括:收发器和处理器。其中,收发器可以用于实现语音数据的收发处理;处理器 可以用于实现语音编解码方式的转换处理。需要说明的是,网关设备可以是一个具体的硬件设备,也可以是基于软件实现的功能模块,或者,基于硬件设备和功能模块共同实现的设备。
在本申请的一可选实施例中,传输语音数据的方法可以但不仅限于基于上述接入网设备或网关设备实现。
参照图3,示出了本申请实施例中一种传输语音数据的方法的步骤流程图。在本申请实施例中,结合上述图1,当传输语音数据的系统中的接入网设备为一个(主叫终端与被叫终端连接同一接入网设备)时,传输语音数据的方法的具体处理流程可以包括如下的步骤(本实施例以接入网设备的执行流程为例进行说明):
步骤301,接入网设备接收第一语音数据。
其中,第一语音数据为主叫终端发送的基于第一语音编解码方式编码的主叫语音数据。
在本申请实施例中,主叫用户对应使用的会话设备可以视为是主叫终端,被叫用户对应使用的会话设备可以视为是被叫终端。主叫用户与被叫用户之间的会话可以简单的分为两个大的流程:会话请求建立流程和语音数据传输流程。
其中,会话请求建立流程的具体实现可以如下:
当主叫用户需要与其他被叫用户进行会话时,可以通过主叫终端(如手机)拨打被叫终端对应的会话号码,发起语音会话请求。被叫终端在接收到语音会话请求之后,可以通过响铃等任意一种适当通知方式通知被叫用户。被叫用户在接收到被叫终端发送的响铃通知后,可以通过触发被叫终端上的确认选项(或确认按键),实现被叫终端对语音会话请求的确认。当被叫终端完成对语音会话请求的确认之后,主叫终端与被叫终端完成会话链路的建立,进而可以基于会话链路进行会话。结合上述图1,在本申请实施例中,会话链路可以是指:主叫终端→接入网设备→核心网设备。
其中,语音数据传输流程的具体实现可以如下:
当被叫终端完成对会话请求的确认之后,主叫终端与被叫终端之间处于连接状态,主叫用户可以通过主叫终端说话,完成主叫语音数据的输入。主叫终端可以将主叫用户输入的语音数据上报给接入网设备。例如,可以按照第一语音编解码方式对主叫语音数据进行编码,从而得到第一语音数据,然后将第一语音数据上报给接入网设备。
该步骤具体可以由接收器110来实现。
步骤302,接入网设备向核心网设备发送第二语音数据,向被叫终端发送第三语音数据。
其中,第二语音数据为基于第二语音编解码方式编码的主叫语音数据,第三语音数据为基于第三语音编解码方式编码的主叫语音数据,第一语音编解码方式、第二语音编解码方式和第三语音编解码方式中至少有两个不相同。
在本申请实施例中,为了保证本申请实施例的传输语音数据方案与现有的通信架构的兼容性,接入网设备可以将主叫语音数据按照第二语音编解码方式编码得到第二语音数据,然后将第二语音数据上报至核心网设备,确保基于核心网设备侧实现的会话计时、会话计费和会话流量监控等与语音会话相关的其它附加业务的正常执行。另外,由于核心网设备处未进行任何改动,基于现有处理,核心网设备在进行完其它附加业务的处理后,可以将基于第二语音数据返回至接入网设备。
如前,传输语音数据的流程还可以包括如下步骤:在主叫终端将第一语音数据上报给接入网设备之后,接入网设备可以基于第三语音编解码方式对主叫语音数据进行编码得到第三语音数据,然后将第三语音数据发送至被叫终端,进而,被叫用户可以通过被叫终端接听到上述主叫语音数据,实现了一次完整的主叫语音数据的传输。
可见,相较于现有技术采用的语音数据的传输流程(主叫终端→接入网设备→核心网设备→接入网设备→被叫终端),在本申请实施例中,接入网设备在接收到主叫终端发送的主叫语音数据后可以将其直接转发至被叫终端,而不需要在语音数据发送给核心网设备,并接收到核心网设备返回的语音数据之后再进行转发。
接入网设备在接收到基于某一种语音编解码方式编码的语音数据后,可以先对语音数据进行译码,然后将语音数据按照另一种语音编解码方式编码后发送给其它设备,也可以不对语音数据进行译码,直接将语音数据当前的语音编解码方式转码成另一种语音编解码方式,然后将转码后的语音数据发送给其它设备。
需要说明的是,上述第一语音编解码方式、第二语音编解码方式和第三语音编解码方式中至少有两个不相同,其中,在接收到语音设备后,可以由接入网设备来实现语音编解码方式的转换处理。考虑到设备更新升级的快慢不同,一般情况下第一语音编解码方式和第二语音编解码方式不同,而接入网设备将语音数据发送至被叫终端时,至少包括如下两种情况:1、第三语音编解码方式与第一语音编解码方式一致;2、第三语音编解码方式与第一语音编解码方式不一致。其中,第三语音编解码方式为接入网设备与被叫终端之间采用的语音编解码方式;第一语音编解码方式为接入网设备与被叫终端之间的语音编解码方式。
其一,第三语音编解码方式与第一语音编解码方式一致时,接入网设备可以直接将语音数据转发至被叫终端,也即,向被叫终端发送第一(第三)语音数据。
其二,当第三语音编解码方式与第一语音编解码方式不一致时,接入网设备将语音数据发送至被叫终端时具体可以包括:接入网设备将语音数据按照第三语音编解码方式重新编码得到第三语音数据,然后向被叫终端发送第三语音数据。
进一步的,在本申请实施例中,接入网设备支持实现语音编解码方式的转换:接入网设备可以接收任意一种语音编解码方式编码的语音数据,同时,可以将接收到的任意一种语音编解码方式编码的语音数据转换为任意一种其他语音编解码方式编码的语音数据。可见,在本申请实施例中,由于接入网设备可以实现对语音编解码方式的转换,因此,即使主叫终端和被叫终端所支持的语音编解码方式不同,也可以通过接入网设备对语音编解码方式进行转换,进而保证语音会话业务的正常执行,语音数据的在主叫终端和被叫终端之间的传输不再受语音编解码方式的限制。特别是,由于语音数据从主叫终端传输到被叫终端的过程避开了核心网设备,故而核心网设备的语音编解码能力不会对语音会话业务造成任何影响和限制。
该步骤具体可以由发射器120来实现。
可选的,被叫语音的传输过程与主叫语音的传输过程原理基本一致,相应的处理流程可以如图4所示:
步骤401,接入网设备接收第四语音数据。
其中,第四语音数据为被叫终端发送的基于第三语音编解码方式编码的被叫语音数据。
其中,在主叫终端和被叫终端间建立了会话连接后,被叫用户可以通过被叫终端说话,完成被叫语音数据的输入。被叫终端可以将被叫用户输入的被叫语音数据上报给接入网设备。具体的,可以按照第三语音编解码方式对被叫语音数据进行编码得到第四语音数据,然后将第四语音数据上报给接入网设备。
该步骤具体可以由接收器110来实现。
步骤402,接入网设备向核心网设备发送第五语音数据,向主叫终端发送第六语音数据。
其中,第五语音数据为基于第二语音编解码方式编码的被叫语音数据,第六语音数据为基于第一语音编解码方式编码的被叫语音数据。
其中,被叫终端将被叫语音数据按照第三语音编解码方式编码得到第四语音数据,然后将第四语音数据上报给接入网设备之后,接入网设备可以将被叫语音数据按照第二语音编解码方式编码得到第五语音数据,并将第五语音数据上报至核心网设备,另外,接入网设备还可以直接基于第一语音编解码方式对被叫语音数据进行编码得到第六语音数据,然后将其发送至主叫终端,进而,主叫用户可以通过主叫终端接听到上述被叫语音数据。
该步骤具体可以由发射器120来实现。
可选的,主叫终端、被叫终端、核心网设备与接入网设备之间采用的语音编解码方式是由上述设备两两自行协商的,相应的处理可以如下:接入网设备根据主叫终端和接入网设备共同支持的语音编解码方式,将第一语音编解码方式确定为接入网设备和主叫终端之间的语音数据传输链路采用的语音编解码方式;接入网设备根据核心网设备和接入网设备共同支持的语音编解码方式,将第二语音编解码方式确定为接入网设备和核心网设备之间的语音数据传输链路采用的语音编解码方式;接入网设备根据被叫终端和接入网设备共同支持的语音编解码方式,将第三语音编解码方式确定为接入网设备和被叫终端之间的语音数据传输链路采用的语音编解码方式。
在本申请实施例中,主叫终端可以在请求建立语音会话业务时,将自身所支持的语音编解码方式携带在语音会话业务建立请求中,主动上报给接入网设备。之后接入网设备可以根据自身支持的语音编解码方式和主叫终端支持的语音编解码方式确定出二者共同支持的语音编解码方式的交集,该交集中可以存在多个交集结果。在本申请的一可选实施例中,可以从上述多个交集结果中选择一个对应的语音质量等级最高的的交集结果作为第三第一语音编解码方式。当然,也可以根据实际需求选择其他满足实际需求条件的交集结果作为第一语音编解码方式,本实施例对此不作限制。同理,与第一语音编解码方式的确定流程相似,接入网设备可以分别和核心网设备、被叫终端进行协商,确定第二语音编解码方式和第三语音编解码方式,在此不再详细说明。
该步骤具体可以由处理器130来实现。
具体来说,AMR-NB、AMR-WB、EVS-NB等都可以是一类语音编解码方式,每类语音编解码方式可以是一个子方式集合,包括根据数据传输速度划分的多种子方式,例如(如下单位均为kbps或kBit/s):AMR-NB包括:12.2、10.2、7.95、7.40、6.70、5.90、5.15、4.75等8种子方式;AMR-WB包括23.85、23.05、19.85、18.25、15,85、14.25、12.65、8.85、6.60等9种子方式;EVS-NB包括24.4、13.2、9.6、8、7.2、5.9等6种方式;EVS-WB包括128.0、96.0、64.0、48.0、32.0、24.4、16.4、13.2、9.6、8.0、7.2、5.9等12种子方式,EVS-SWB包括128.0、96.0、64.0、48.0、32.0、24.4、16.4、13.2、9.6等9种子方式;EVS-FB 包括128.0、96.0、64.0、48.0、32.0、24.4、16.4等7种子方式。
在本申请实施例中,如果接入网设备和主/被叫终端支持某一类语音编解码方式的全部子方式,但核心网设备仅支持其中部分子方式。例如,核心网设备仅支持AMR-WB中的12.65~6.6的部分子方式,接入网设备和主/被叫终端支持AMR-WB中的23.85~6.6的部分子方式,此时本申请实施例依然适用,即第二语音编码方式可以为AMR-WB 12.65kbps,第一和第三语音编解码方式采用AMR-WB 23.85kbps。
基于上述对语音编解码方式的介绍可知,在从多个交集结果中选择一个对应的语音会话业务质量最优的交集结果时,可以但不仅限于基于EVS-FB>EVS-SWB>EVS-WB>EVS-NB>AMR-WB>AMR-NB的排序进行选择,例如,当交集结果分别为:EVS-FB和AMR-WB两种方式时,可以基于EVS-FB>AMR-WB的排序规则,选择EVS-FB方式作为协商的语音编解码方式,以确保协商的语音编解码方式是传输语音数据过程中设备所能支持的语音质量等级最高的语音编解码方式。
可选的,考虑到核心网设备与接入网设备之间的语音编解码方式不影响整个语音会话业务中语音质量的高低,可以选择语音质量等级较低的语音编解码方式作为第二语音编解码方式,相应的,第二语音编解码方式的语音质量等级低于或等于第一语音编解码方式和第三语音编解码方式的语音质量等级。
进一步的,可以直接指定接入网设备与核心网设备之间的语音编解码方式为第二语音编解码方式。其中,第二语音编解码方式的选择可以基于如下原则确定:第二语音编解码方式为目前任意核心网设备都支持的低语音质量等级的语音编解码方式,例如,第一语音编解码方式可以为目前最基本的AMR-NB语音编解码方式。
在上述应用场景中,主要针对图1所示的、主叫终端和被叫终端与同一接入网设备连接的场景进行了说明。在本申请实施例的另一应用场景中,主叫终端和被叫终端还可以连接不同的接入网设备。
例如,当主叫终端和被叫终端分别处于不同的服务小区时,主叫终端和被叫终端可以分别连接不同服务小区下的接入网设备。
又例如,当主叫终端和被叫终端分别采用不同的无线通信制式时,主叫终端和被叫终端也可以分别连接不同的无线通信制式对应的接入网设备。其中,常用的无线通信制式包括但不仅限于:第二代移动通信技术(2-Generation wireless telephone technology,2G)、第三代移动通信技术(3rd-Generation mobile communication,3G)、第四代移动通信技术(4th-Generation mobile communication,4G)和第五代移动通信技术(5th-Generation mobile communication,5G)等。
需要说明的是,针对主叫终端与被叫终端分别采用不同的通信制式的情况,可以采用两个接入网设备来分别与主叫终端和被叫终端连接,也可以采用支持混合制式的同一接入网设备来连接主叫终端和被叫终端。针对采用支持混合制式的同一接入网设备的情况,对应的语音数据处理方法的具体流程可以参照上述实施例的描述,在此不再赘述。
下面,针对主叫终端和被叫终端分别连接不同的接入网设备的场景进行详细说明。
参照图5,示出了本申请实施例中另一种语音数据处理系统的结构示意图。在本应用场景下,语音数据处理系统至少可以包括如下设备:核心网设备、接入网设备、目标接入网 设备、主叫终端、被叫终端和基站。其中,核心网设备分别与接入网设备和目标接入网设备连接,接入网设备通过基站与主叫终端连接、且与目标接入网设备连接,目标接入网设备通过基站与被叫终端连接。
在本申请的一可选实施例中,当主叫终端和被叫终端分别连接不同的接入网设备时,上述将语音数据发送至被叫终端的步骤具体可以如下:如果被叫终端与接入网设备建立有语音数据传输链路,接入网设备则向被叫终端发送第三语音数据,如果被叫终端与目标接入网设备建立有语音数据传输链路,接入网设备则向目标接入网设备发送第一语音数据,第一语音数据用于指示目标接入网设备向被叫终端发送第七语音数据。
其中,第七语音数据为基于第四语音编解码方式编码的主叫语音数据,第四语音编解码方式为目标接入网设备根据被叫终端和目标接入网设备共同支持的语音编解码方式确定的,目标接入网设备和被叫终端之间的语音数据传输链路采用的语音编解码方式。
在本申请实施例中,接入网设备在接收到主叫终端上传的第一语音数据后,可以判断接入网设备与被叫终端间是否建立有语音数据传输链路,如果语音数据传输链路存在,则接入网设备可以对第一语音数据解码,然后将主叫语音数据按照第三语音编解码方式进行编码得到第三语音数据,然后发送给被叫终端。而如果语音数据传输链路不存在,即被叫终端与其它接入网设备(即目标接入网设备)建立有语音数据传输链路,则可以将接收到的第一语音数据直接发送给目标接入网设备。之后目标接入网设备在接收到第一语音数据后,可以对其进行解码,然后按照第四语音编解码方式编码得到第七语音数据,并将第七语音数据发送给被叫终端。
另外,可以理解,在接入网设备向目标接入网设备发送主叫语音数据前,也可以先按照第四语音编解码方式对主叫语音数据进行编码得到第七语音数据,这样,目标接入网设备在接收到第七语音数据后,可以直接将第七语音数据发送给被叫终端。其中,目标接入网设备向被叫终端发送语音数据的流程可以参照上述图1对应的应用场景下接入网设备向被叫终端发送语音数据的流程,本实施例在此不再赘述。
需要说明的是,在实际应用中,接入网设备将语音数据发送至目标接入网设备时,至少可以包括如下两种情况:1、第一语音编解码方式与第四语音编解码方式一致;2、第一语音编解码方式与第四语音编解码方式不一致。其中,第一语音编解码方式为:接入网设备与主叫终端之间的语音编解码方式;第四语音编解码方式为:目标接入网设备与被叫终端之间的语音编解码方式。当第一语音编解码方式与第四语音编解码方式一致时,接入网设备可以直接通过目标接入网设备将语音数据发送给被叫终端,无需再进行语音编解码方式的转换,而当第一语音编解码方式与第四语音编解码方式不一致时,可以由接入网设备或者目标接入网设备来完成语音编解码方式的转换。
同理,被叫语音数据的传输流程可以如下:被叫终端向目标接入网设备发送基于第四语音编解码方式编码的被叫语音数据,目标接入网设备向接入网设备发送基于第一语音编解码方式/第四语音编解码方式编码的被叫语音数据,并向核心网设备发送基于第五语音编解码方式编码的被叫语音数据,接入网设备向主叫终端发送基于第一语音编解码方式编码的被叫语音数据。
其中,第五语音编解码方式为目标接入网设备根据其与核心网设备共同支持的语音编解码方式确定的,目标接入网设备和核心网设备之间的语音数据传输链路采用的语音编解 码方式。
另外,在上述过程中,由于核心网设备处未进行任何改动,基于现有处理,核心网设备在进行完其它附加业务的处理后,可以将主叫语音数据按照第五语音编解码方式进行编码,然后发送至目标接入网设备,同理,可以将被叫语音数据按照第二语音编解码方式进行编码,然后发送至接入网设备。
上述步骤具体可以由处理器130和发射器120共同来实现。
本申请实施例的语音数据处理方法,接入网设备可以直接将主叫终端上报的主叫语音数据发送给被叫终端,避开核心网设备,完成主叫语音数据从主叫终端到被叫终端之间的传输。换而言之,在本申请实施例的传输语音数据的方法中,语音数据在语音会话业务的各个阶段中的传输相对独立:语音数据在接入网设备和主叫终端之间传输时所采用的语音编解码方式取决于接入网设备与主叫终端之间协商确定的语音编解码方式;语音数据在接入网设备和被叫终端之间传输时所采用的语音编解码方式取决于接入网设备与被叫终端之间协商确定的语音编解码方式。可见,通过本申请实施例的语音数据处理方法实现的语音会话业务,在语音数据传输的各个阶段可以独立的选择终端所能支持的最佳语音编解码方式进行语音数据的传输,不受其他第三方设备的语音编解码能力的影响(特别是不受核心网设备的语音编解码能力的影响),保证了语音会话业务质量与终端能力的一致性,有效提高了语音会话业务的会话质量。
进一步的,本申请实施例的传输语音数据的方法,接入网设备可以将语音数据按照设定的第二语音编解码方式编码后上报至核心网设备。其中,一般的,可以将第二语音编解码方式视为是现有的任意设备都支持的低语音质量等级的语音编解码方式。可见,在本申请实施例中,接入网设备可以按照第二语音编解码方式对语音数据进行重编码,进而,接入网设备和核心网设备之间可以通过低语音质量等级的语音编解码方式进行交互,本申请实施例的传输语音数据的方法可以在不改变现有通信架构的基础上实现了接入网设备与核心网设备之间的语音数据的传输,确保了本申请实施例的传输语音数据的方法与现有通信架构的兼容性,保证了基于核心网设备侧实现的各项其他业务的正常执行,如:基于核心网设备侧实现的会话计时、会话计费和会话流量监控等与语音会话相关的其他附加业务。
此外,各个设备之间的语音编解码方式可以基于现有的通信流程中携带的设备能力信息(语音编解码能力)来确定,不需要增加额外的流程,实现简单方便。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
图6是本发明实施例提供的传输语音数据的装置的框图。该传输语音数据的装置可以通过软件、硬件或者两者的结合实现成为装置中的部分或者全部。本发明实施例提供的传输语音数据的装置可以实现本发明实施例图3所述的流程,该传输语音数据的装置包括第一接收模块601、第一发送模块602、第二接收模块603、第二发送模块604、确定模块605:
第一接收模块601,用于接收第一语音数据,所述第一语音数据为主叫终端发送的基于第一语音编解码方式编码的主叫语音数据;
第一发送模块602,用于向核心网设备发送第二语音数据,所述第二语音数据为基于第二语音编解码方式编码的所述主叫语音数据,向被叫终端发送第三语音数据,所述第三语 音数据为基于第三语音编解码方式编码的所述主叫语音数据,其中,所述第一语音编解码方式、所述第二语音编解码方式和所述第三语音编解码方式中至少有两个不相同。
可选的,所述装置还包括:
第二接收模块603,用于接收第四语音数据,所述第四语音数据为所述被叫终端发送的基于所述第三语音编解码方式编码的被叫语音数据;
第二发送模块604,用于向所述核心网设备发送第五语音数据,所述第五语音数据为基于所述第二语音编解码方式编码的所述被叫语音数据,向所述主叫终端发送第六语音数据,所述第六语音数据为基于所述第一语音编解码方式编码的所述被叫语音数据。
可选的,所述装置还包括确定模块605,用于:
根据所述主叫终端和所述接入网设备共同支持的语音编解码方式,将所述第一语音编解码方式确定为所述接入网设备和所述主叫终端之间的语音数据传输链路采用的语音编解码方式;
根据所述核心网设备和所述接入网设备共同支持的语音编解码方式,将所述第二语音编解码方式确定为所述接入网设备和所述核心网设备之间的语音数据传输链路采用的语音编解码方式;
根据所述被叫终端和所述接入网设备共同支持的语音编解码方式,将所述第三语音编解码方式确定为所述接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
可选的,所述第二语音编解码方式的语音质量等级低于或等于第一语音编解码方式和第三语音编解码方式的语音质量等级。
可选的,所述接入网设备还包括确定模块605,其中:
所述确定模块605用于判断与被叫终端建立有语音数据传输链路的是所述接入网设备或目标接入网设备,当所述确定模块605判断为被叫终端与所述接入网设备建立有语音数据传输链路,所述第一发送模块602用于向所述被叫终端发送第三语音数据;
当所述确定模块605判断为被叫终端与所述目标接入网设备建立有语音数据传输链路,所述第一发送模块602用于向所述目标接入网设备发送所述第一语音数据,所述第一语音数据用于指示所述目标接入网设备向所述被叫终端发送第七语音数据,所述第七语音数据为基于第四语音编解码方式编码的所述主叫语音数据,其中,所述第四语音编解码方式为所述目标接入网设备根据所述被叫终端和所述目标接入网设备共同支持的语音编解码方式确定的,所述目标接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
可选的,所述接入网设备还包括确定模块605,其中:
所述确定模块用于判断与被叫终端建立有语音数据传输链路的是所述接入网设备或目标接入网设备,当所述确定模块判断为被叫终端与所述接入网设备建立有语音数据传输链路,所述第一发送模块用于向所述被叫终端发送第三语音数据;
当所述确定模块判断为被叫终端与所述目标接入网设备建立有语音数据传输链路,所述第一发送模块用于向所述目标接入网设备发送第七语音数据,所述第七语音数据用于指示所述目标接入网设备向所述被叫终端发送所述第七语音数据,所述第七语音数据为基于第四语音编解码方式编码的所述主叫语音数据,其中,所述第四语音编解码方式为所述目 标接入网设备根据所述被叫终端和所述目标接入网设备共同支持的语音编解码方式确定的,所述目标接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
需要说明的是,上述确定模块605可以由处理器130来实现,第一接收模块601、第二接收模块603可以由接收器110实现,或者,结合处理器130来实现,第一发送模块602、第二发送模块604可以由发射器120来实现,或者,结合处理器130来实现。
本申请实施例中,接入网设备可以避开核心网设备,将主叫终端上报的语音数据直接发送给被叫终端,完成语音数据的传输。进而可以使得语音数据的传输不受核心网设备的语音编解码能力的限制,确保了语音数据传输过程中的独立性,可以选择终端对应支持的最佳语音编解码方式进行语音数据的传输,保证了选择的语音编解码方式与终端对应的语音编解码能力的一致性,确保了语音会话质量。
需要说明的是:上述实施例提供的传输语音数据的装置在实现语音数据的传输时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的传输语音数据的装置与传输语音数据的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的一种实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (18)

  1. 一种传输语音数据的方法,其特征在于,所述方法包括:
    接入网设备接收第一语音数据,所述第一语音数据为主叫终端发送的基于第一语音编解码方式编码的主叫语音数据;
    所述接入网设备向核心网设备发送第二语音数据,所述第二语音数据为基于第二语音编解码方式编码的所述主叫语音数据;
    所述接入网设备向被叫终端发送第三语音数据,所述第三语音数据为基于第三语音编解码方式编码的所述主叫语音数据,其中,所述第一语音编解码方式、所述第二语音编解码方式和所述第三语音编解码方式中至少有两个不相同。
  2. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    所述接入网设备接收第四语音数据,所述第四语音数据为所述被叫终端发送的基于所述第三语音编解码方式编码的被叫语音数据;
    所述接入网设备向所述核心网设备发送第五语音数据,所述第五语音数据为基于所述第二语音编解码方式编码的所述被叫语音数据;
    所述接入网设备向所述主叫终端发送第六语音数据,所述第六语音数据为基于所述第一语音编解码方式编码的所述被叫语音数据。
  3. 根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
    所述接入网设备根据所述主叫终端和所述接入网设备共同支持的语音编解码方式,将所述第一语音编解码方式确定为所述接入网设备和所述主叫终端之间的语音数据传输链路采用的语音编解码方式;
    所述接入网设备根据所述核心网设备和所述接入网设备共同支持的语音编解码方式,将所述第二语音编解码方式确定为所述接入网设备和所述核心网设备之间的语音数据传输链路采用的语音编解码方式;
    所述接入网设备根据所述被叫终端和所述接入网设备共同支持的语音编解码方式,将所述第三语音编解码方式确定为所述接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
  4. 根据权利要求1至3任一项所述的方法,其特征在于,所述第二语音编解码方式的语音质量等级低于或等于第一语音编解码方式和第三语音编解码方式的语音质量等级。
  5. 根据权利要求1至4任一项所述的方法,其特征在于,所述接入网设备向被叫终端发送第三语音数据,包括:
    如果被叫终端与所述接入网设备建立有语音数据传输链路,所述接入网设备则向所述被叫终端发送第三语音数据;
    所述方法还包括:
    如果被叫终端与目标接入网设备建立有语音数据传输链路,所述接入网设备则向所述目 标接入网设备发送所述第一语音数据,所述第一语音数据用于指示所述目标接入网设备向所述被叫终端发送第七语音数据,所述第七语音数据为基于第四语音编解码方式编码的所述主叫语音数据,其中,所述第四语音编解码方式为所述目标接入网设备根据所述被叫终端和所述目标接入网设备共同支持的语音编解码方式确定的,所述目标接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
  6. 根据权利要求1至4任一项所述的方法,其特征在于,所述接入网设备向被叫终端发送第三语音数据,包括:
    如果被叫终端与所述接入网设备建立有语音数据传输链路,所述接入网设备则向所述被叫终端发送第三语音数据;
    所述方法还包括:
    如果被叫终端与目标接入网设备建立有语音数据传输链路,所述接入网设备则向所述目标接入网设备发送第七语音数据,所述第七语音数据用于指示所述目标接入网设备向所述被叫终端发送所述第七语音数据,所述第七语音数据为基于第四语音编解码方式编码的所述主叫语音数据,其中,所述第四语音编解码方式为所述目标接入网设备根据所述被叫终端和所述目标接入网设备共同支持的语音编解码方式确定的,所述目标接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
  7. 一种接入网设备,其特征在于,所述接入网设备包括接收器、发射器,其中:
    所述接收器,用于接收第一语音数据,所述第一语音数据为主叫终端发送的基于第一语音编解码方式编码的主叫语音数据;
    所述发射器,用于向核心网设备发送第二语音数据,所述第二语音数据为基于第二语音编解码方式编码的所述主叫语音数据,向被叫终端发送第三语音数据,所述第三语音数据为基于第三语音编解码方式编码的所述主叫语音数据,其中,所述第一语音编解码方式、所述第二语音编解码方式和所述第三语音编解码方式中至少有两个不相同。
  8. 根据权利要求7所述的接入网设备,其特征在于,所述接收器,还用于接收第四语音数据,所述第四语音数据为所述被叫终端发送的基于所述第三语音编解码方式编码的被叫语音数据;
    所述发射器,还用于向所述核心网设备发送第五语音数据,所述第五语音数据为基于所述第二语音编解码方式编码的所述被叫语音数据,向所述主叫终端发送第六语音数据,所述第六语音数据为基于所述第一语音编解码方式编码的所述被叫语音数据。
  9. 根据权利要求7或8所述的接入网设备,其特征在于,所述接入网设备还包括处理器,用于:
    根据所述主叫终端和所述接入网设备共同支持的语音编解码方式,将所述第一语音编解码方式确定为所述接入网设备和所述主叫终端之间的语音数据传输链路采用的语音编解码方式;
    根据所述核心网设备和所述接入网设备共同支持的语音编解码方式,将所述第二语音编 解码方式确定为所述接入网设备和所述核心网设备之间的语音数据传输链路采用的语音编解码方式;
    根据所述被叫终端和所述接入网设备共同支持的语音编解码方式,将所述第三语音编解码方式确定为所述接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
  10. 根据权利要求7至9任一项所述的接入网设备,其特征在于,所述第二语音编解码方式的语音质量等级低于或等于第一语音编解码方式和第三语音编解码方式的语音质量等级。
  11. 根据权利要求7至10任一项所述的接入网设备,其特征在于,所述接入网设备还包括处理器,其中:
    所述处理器用于判断与被叫终端建立有语音数据传输链路的是所述接入网设备或目标接入网设备,当所述处理器判断为被叫终端与所述接入网设备建立有语音数据传输链路,所述发送器用于向所述被叫终端发送第三语音数据;
    当所述处理器判断为被叫终端与所述目标接入网设备建立有语音数据传输链路,所述发送器用于向所述目标接入网设备发送所述第一语音数据,所述第一语音数据用于指示所述目标接入网设备向所述被叫终端发送第七语音数据,所述第七语音数据为基于第四语音编解码方式编码的所述主叫语音数据,其中,所述第四语音编解码方式为所述目标接入网设备根据所述被叫终端和所述目标接入网设备共同支持的语音编解码方式确定的,所述目标接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
  12. 根据权利要求7至10任一项所述的方法,其特征在于,所述接入网设备还包括处理器,其中:
    所述处理器用于判断与被叫终端建立有语音数据传输链路的是所述接入网设备或目标接入网设备,当所述处理器判断为被叫终端与所述接入网设备建立有语音数据传输链路,所述发送器用于向所述被叫终端发送第三语音数据;
    当所述处理器判断为被叫终端与所述目标接入网设备建立有语音数据传输链路,所述发送器用于向所述目标接入网设备发送第七语音数据,所述第七语音数据用于指示所述目标接入网设备向所述被叫终端发送所述第七语音数据,所述第七语音数据为基于第四语音编解码方式编码的所述主叫语音数据,其中,所述第四语音编解码方式为所述目标接入网设备根据所述被叫终端和所述目标接入网设备共同支持的语音编解码方式确定的,所述目标接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
  13. 一种传输语音数据的装置,其特征在于,所述装置包括:
    第一接收模块,用于接收第一语音数据,所述第一语音数据为主叫终端发送的基于第一语音编解码方式编码的主叫语音数据;
    第一发送模块,用于向核心网设备发送第二语音数据,所述第二语音数据为基于第二语音编解码方式编码的所述主叫语音数据,向被叫终端发送第三语音数据,所述第三语音数据 为基于第三语音编解码方式编码的所述主叫语音数据,其中,所述第一语音编解码方式、所述第二语音编解码方式和所述第三语音编解码方式中至少有两个不相同。
  14. 根据权利要求13所述的装置,其特征在于,所述装置还包括:
    第二接收模块,用于接收第四语音数据,所述第四语音数据为所述被叫终端发送的基于所述第三语音编解码方式编码的被叫语音数据;
    第二发送模块,用于向所述核心网设备发送第五语音数据,所述第五语音数据为基于所述第二语音编解码方式编码的所述被叫语音数据,向所述主叫终端发送第六语音数据,所述第六语音数据为基于所述第一语音编解码方式编码的所述被叫语音数据。
  15. 根据权利要求13或14所述的装置,其特征在于,所述装置还包括确定模块,用于:
    根据所述主叫终端和所述接入网设备共同支持的语音编解码方式,将所述第一语音编解码方式确定为所述接入网设备和所述主叫终端之间的语音数据传输链路采用的语音编解码方式;
    根据所述核心网设备和所述接入网设备共同支持的语音编解码方式,将所述第二语音编解码方式确定为所述接入网设备和所述核心网设备之间的语音数据传输链路采用的语音编解码方式;
    根据所述被叫终端和所述接入网设备共同支持的语音编解码方式,将所述第三语音编解码方式确定为所述接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
  16. 根据权利要求13至15任一项所述的装置,其特征在于,所述第二语音编解码方式的语音质量等级低于或等于第一语音编解码方式和第三语音编解码方式的语音质量等级。
  17. 根据权利要求13至16任一项所述的装置,其特征在于,所述接入网设备还包括确定模块,其中:
    所述确定模块用于判断与被叫终端建立有语音数据传输链路的是所述接入网设备或目标接入网设备,当所述确定模块判断为被叫终端与所述接入网设备建立有语音数据传输链路,所述第一发送模块用于向所述被叫终端发送第三语音数据;
    当所述确定模块判断为被叫终端与所述目标接入网设备建立有语音数据传输链路,所述第一发送模块用于向所述目标接入网设备发送所述第一语音数据,所述第一语音数据用于指示所述目标接入网设备向所述被叫终端发送第七语音数据,所述第七语音数据为基于第四语音编解码方式编码的所述主叫语音数据,其中,所述第四语音编解码方式为所述目标接入网设备根据所述被叫终端和所述目标接入网设备共同支持的语音编解码方式确定的,所述目标接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
  18. 根据权利要求13至16任一项所述的方法,其特征在于,所述接入网设备还包括确定模块,其中:
    所述确定模块用于判断与被叫终端建立有语音数据传输链路的是所述接入网设备或目标 接入网设备,当所述确定模块判断为被叫终端与所述接入网设备建立有语音数据传输链路,所述第一发送模块用于向所述被叫终端发送第三语音数据;
    当所述确定模块判断为被叫终端与所述目标接入网设备建立有语音数据传输链路,所述第一发送模块用于向所述目标接入网设备发送第七语音数据,所述第七语音数据用于指示所述目标接入网设备向所述被叫终端发送所述第七语音数据,所述第七语音数据为基于第四语音编解码方式编码的所述主叫语音数据,其中,所述第四语音编解码方式为所述目标接入网设备根据所述被叫终端和所述目标接入网设备共同支持的语音编解码方式确定的,所述目标接入网设备和所述被叫终端之间的语音数据传输链路采用的语音编解码方式。
PCT/CN2017/114804 2016-12-09 2017-12-06 一种传输语音数据的方法、设备和装置 WO2018103661A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201611128953.1A CN107070854A (zh) 2016-12-09 2016-12-09 一种传输语音数据的方法、设备和装置
CN201611128953.1 2016-12-09

Publications (1)

Publication Number Publication Date
WO2018103661A1 true WO2018103661A1 (zh) 2018-06-14

Family

ID=59618684

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/114804 WO2018103661A1 (zh) 2016-12-09 2017-12-06 一种传输语音数据的方法、设备和装置

Country Status (2)

Country Link
CN (1) CN107070854A (zh)
WO (1) WO2018103661A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107070854A (zh) * 2016-12-09 2017-08-18 西安华为技术有限公司 一种传输语音数据的方法、设备和装置
CN110234141B (zh) * 2018-03-06 2022-01-04 中国移动通信集团终端有限公司 保持语音通话连续性的方法、装置、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1756128A (zh) * 2004-09-30 2006-04-05 北京信威通信技术股份有限公司 提高通信终端互通的语音质量的方法及通信系统
CN101562910A (zh) * 2008-04-18 2009-10-21 中国移动通信集团公司 语音数据的传输方法、系统及媒体网关
WO2011047560A1 (zh) * 2009-10-23 2011-04-28 中兴通讯股份有限公司 本地交换通信方法和系统
CN105869653A (zh) * 2016-05-31 2016-08-17 华为技术有限公司 话音信号处理方法和相关装置和系统
CN107070854A (zh) * 2016-12-09 2017-08-18 西安华为技术有限公司 一种传输语音数据的方法、设备和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
ES2317837T3 (es) * 1999-05-17 2009-05-01 Telefonaktiebolaget Lm Ericsson (Publ) Negociacion de capacidad en una red de telecomunicaciones.
CN100442939C (zh) * 2006-06-20 2008-12-10 华为技术有限公司 基于蜂窝网络的一键通业务呼叫建立时延的优化方法
CN101212459B (zh) * 2006-12-28 2012-08-08 华为技术有限公司 控制媒体编码速率的方法、系统和设备
CN104424951B (zh) * 2013-08-19 2018-03-20 中国电信股份有限公司 一种异系统间TFO和TrFO互通转换的方法和装置
CN104994054A (zh) * 2015-03-19 2015-10-21 数据通信科学技术研究所 基于td-scdma透传语音信道传输分组数据的方法、移动终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1756128A (zh) * 2004-09-30 2006-04-05 北京信威通信技术股份有限公司 提高通信终端互通的语音质量的方法及通信系统
CN101562910A (zh) * 2008-04-18 2009-10-21 中国移动通信集团公司 语音数据的传输方法、系统及媒体网关
WO2011047560A1 (zh) * 2009-10-23 2011-04-28 中兴通讯股份有限公司 本地交换通信方法和系统
CN105869653A (zh) * 2016-05-31 2016-08-17 华为技术有限公司 话音信号处理方法和相关装置和系统
CN107070854A (zh) * 2016-12-09 2017-08-18 西安华为技术有限公司 一种传输语音数据的方法、设备和装置

Also Published As

Publication number Publication date
CN107070854A (zh) 2017-08-18

Similar Documents

Publication Publication Date Title
US10362514B2 (en) Network node and communication method
JP4782847B2 (ja) 広帯域コーデック・ネゴシエーション
CN101427551B (zh) 会议端点的系统和方法
CN101313525B (zh) 启用高质量实时音频的基础结构
JP5852104B2 (ja) 帯域内信号を使用するコーデック展開
JP2006295931A (ja) 移動通信端末機における音声コーデックのスイッチング装置及びスイッチング方法
WO2012063889A1 (ja) コアネットワークおよび通信システム
CN100579105C (zh) 一种数据流处理的方法和装置
WO2018103661A1 (zh) 一种传输语音数据的方法、设备和装置
US8209187B2 (en) Speech coding arrangement for communication networks
CN110753021B (zh) 数据传输方法、装置及存储介质
CN101622711B (zh) 用于无声插入描述符(sid)转换的方法、系统
WO2014166366A1 (zh) 一种在长期演进集群网络中进行能力协商的方法及装置
KR100659197B1 (ko) 통합 인터넷 프로토콜 망에서의 보코딩 방법
US8515769B2 (en) Single channel EVRCx, ISLP and G.711 transcoding in packet networks
WO2003081888A1 (fr) Appareil relais, procede et logiciel de commande des communications, et systeme de communication
CN102484851B (zh) 由呼叫发起和端接控制节点使用公共媒体网关节点和协同编解码
CN102474908B (zh) 移动通信系统、基站、上位装置、网关装置、通信方法
CN104424951A (zh) 一种异系统间TFO和TrFO互通转换的方法和装置
JP6378987B2 (ja) 無線通信システム
KR101765895B1 (ko) 링백톤 서비스 제공 장치 및 방법, 링백톤 서버 및 그 서버의 구동 방법
JP2018056904A (ja) Ip電話サーバ装置、そのプログラム及びip電話システム
JP2016163307A (ja) 無線通信システム
TW201023612A (en) Mobile communication method and application thereof

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17877904

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17877904

Country of ref document: EP

Kind code of ref document: A1