KR20080095514A - Method and apparatus for transmitting and receiving voice packet - Google Patents

Method and apparatus for transmitting and receiving voice packet Download PDF

Info

Publication number
KR20080095514A
KR20080095514A KR1020070040087A KR20070040087A KR20080095514A KR 20080095514 A KR20080095514 A KR 20080095514A KR 1020070040087 A KR1020070040087 A KR 1020070040087A KR 20070040087 A KR20070040087 A KR 20070040087A KR 20080095514 A KR20080095514 A KR 20080095514A
Authority
KR
South Korea
Prior art keywords
auxiliary information
voice
packet
speech
noise
Prior art date
Application number
KR1020070040087A
Other languages
Korean (ko)
Other versions
KR101350599B1 (en
Inventor
송근배
김재범
안철용
김석호
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070040087A priority Critical patent/KR101350599B1/en
Publication of KR20080095514A publication Critical patent/KR20080095514A/en
Application granted granted Critical
Publication of KR101350599B1 publication Critical patent/KR101350599B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • H04M7/0072Speech codec negotiation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • H04M11/06Simultaneous speech and data transmission, e.g. telegraphic transmission over the same conductors
    • H04M11/064Data transmission during pauses in telephone conversation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

A method and an apparatus for transmitting and receiving voice packet are provided to transceive auxiliary information bit for extending the artificial bandwidth of voice signal and decode improved signal by using auxiliary information bit and transceive supplementary information about audio signal in voice channel information without additional channel. A vocoder(310) and an adaptive equalizer(330) of a modem on a transmission side receives a digital voice or an audio input signal. The adaptive equalizer transmits filter factor to the auxiliary information bit inserter(320) as converting into auxiliary information bit. The auxiliary information bit inserter transmits voice packet to the modem on the transmission side by inserting auxiliary information bit into specific parameter voice packet. The adaptive equalizer calculates the filter factor necessary to correct coding distortion from the auxiliary information bit and outputs corrected signal by filtering decoded signal through the filter factor by a voice decoder.

Description

음성패킷 송수신 방법 및 장치{Method and apparatus for Transmitting and Receiving Voice Packet}Method and apparatus for transmitting and receiving voice packet {Method and apparatus for Transmitting and Receiving Voice Packet}

도 1은 종래기술에 따른 음성패킷 송수신측 모뎀의 블록도1 is a block diagram of a voice packet transmission and reception side modem according to the prior art

도 2는 본 발명의 바람직한 실시예에 따른 음성패킷의 구조도2 is a structural diagram of a voice packet according to a preferred embodiment of the present invention

도 3은 본 발명의 바람직한 실시예에 따른 음성패킷 송수신측 모뎀의 블록도3 is a block diagram of a voice packet transceiver side modem according to a preferred embodiment of the present invention.

도 4는 본 발명의 바람직한 실시예에 따른 음성패킷 송수신의 흐름도4 is a flow chart of voice packet transmission and reception according to a preferred embodiment of the present invention.

본 발명은 음성 부호화기의 성능향상을 위한 보조정보의 송신과 수신에 관한 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for transmitting and receiving auxiliary information for improving the performance of a speech encoder.

휴대폰 장치에서 음성 부호화 동작을 하는 수단은 대표적으로 QCELP(Qualcomm Code Excited Linear Prediction), EVRC(Enhanced Variable Rate Codec), AMR(Adaptive Multirate)등이 있으며 모두 음성을 위주로 부호화하는 수단들이다. 즉, 사람의 음성을 부호화하는 데 있어서는 최적의 성능을 나타내지만 상기 음성 이외의 소리들인 음악을 부호화하는데 있어서는 성능열화가 생긴다.The means for performing the speech encoding operation in the mobile phone device are representatively known as Qualcomm Code Excited Linear Prediction (QCELP), Enhanced Variable Rate Codec (EVRC), Adaptive Multirate (AMR), and the like. In other words, performance is optimal in encoding human speech, but performance degradation occurs in encoding music that is sounds other than the voice.

다른예로 음성신호의 송신및 수신은 대역폭이 제한되어 이루어지는데 약 20Hz ~ 20KHz의 주파수 범위를 가지는 인간의 음성은 디지털 전화기 또는 휴대폰이 사용하는 통신망에서 통상 300Hz ~ 3.4KHz로 대역폭으로 제한되어 송신 및 수신된다. 음성대역에서 하위대역(20Hz - 300Hz)및 상위대역(3.4KHz - 20KHz)의 손실은 음성품질의 열화를 가져오므로 이 문제를 해결하기 위하여 인공적인 대역폭 확장(Artificial Bandwidth Expansion)이라 불리는 기술을 사용한다. 상기 인공적인 대역폭 확장은 수신측에서 협대역 신호의 정보만으로 손실된 하위대역 혹은 상위대역 신호를 추정하여 상기 협대역 음성신호와 합성하는 것으로, 상기 수신된 협대역 음성신호만으로 손실된 하위대역 혹은 상위대역 신호를 정확히 추정하기란 한계가 있다.As another example, transmission and reception of voice signals are limited in bandwidth. Human voices having a frequency range of about 20 Hz to 20 KHz are limited to bandwidth of 300 Hz to 3.4 KHz in a communication network used by a digital telephone or a mobile phone. Is received. The loss of the lower band (20Hz-300Hz) and upper band (3.4KHz-20KHz) in the voice band leads to deterioration of the voice quality, so a technique called artificial bandwidth expansion is used to solve this problem. do. The artificial bandwidth extension is to estimate a lower band or higher band signal lost by only the information of the narrowband signal at the receiving side and synthesize the narrowband voice signal, and the lower band or higher band lost only by the received narrowband voice signal. There is a limit to accurately estimate the band signal.

따라서 상기 음악 신호를 음성 부호화하거나 인공적인 대역폭 확장을 함에 있어 음질저하를 막기 위해서는 소량의 정보일지라도 별도로 상대방 휴대폰에 전송하여 주는 것이 필요하다.Therefore, in order to prevent the sound quality deterioration in voice encoding or artificial bandwidth expansion of the music signal, it is necessary to transmit a small amount of information to the other party's mobile phone separately.

도 1은 종래기술에 따른 음성패킷 송수신측 모뎀의 블록도이다.1 is a block diagram of a voice packet transceiver side modem according to the prior art.

송신측 모뎀(100)의 음성 부호화기(110)와 적응형 등화기(Adaptive Equalizer)(120)는 디지털 음성 혹은 오디오 입력신호를 받는다. 상기 음성 부호화기(110)는 부호화를 진행하여 음성패킷을 생성하고 안테나(ANT)를 이용하여 음성채널을 통해 수신측 모뎀(130)으로 송신하며, 상기 부호화된 음성패킷을 복호한 신호를 상기 적응형 등화기(120)로 전달한다. 상기 적응형 등화기(120)는 상기 입력신호를 받고, 상기 음성 부호화기(110)로부터 부호화된 후 복호된 신호와 비교하여 상기 부호화되어 복호된 신호가 상기 입력신호로부터 얼마나 왜곡이 되었는지를 나 타낸 필터계수를 계산한다. The speech encoder 110 and the adaptive equalizer 120 of the transmitting modem 100 receive a digital voice or audio input signal. The speech encoder 110 performs encoding to generate a speech packet, transmits the speech packet to the receiving modem 130 through the speech channel using an antenna ANT, and decodes the encoded speech packet. Pass to equalizer 120. The adaptive equalizer 120 receives the input signal and compares the decoded signal after being encoded by the speech coder 110 to show how distorted the decoded signal is from the input signal. Calculate the coefficients.

상기 적응형 등화기(120)는 상기 계산된 필터계수를 상기 음성채널과는 다른, 상기 안테나(ANT)를 이용하여 별도의 채널을 통해 상기 수신측 모뎀(130)으로 전송한다. The adaptive equalizer 120 transmits the calculated filter coefficient to the receiving side modem 130 through a separate channel using the antenna ANT, which is different from the voice channel.

상기 수신측 모뎀(130)의 음성 부호화기(140)는 안테나(ANT)를 이용하여 상기 음성패킷을 수신받아 복호하고 적응형 등화기(150)로 전달하며, 상기 적응형 등화기(150)는 상기 별도의 채널을 통해 상기 수신측 모뎀(100)으로부터 상기 필터계수를 수신한다. 상기 적응형 등화기(150)는 상기 필터계수를 받아, 상기 복호된 신호에 상기 필터계수의 수치를 적용하여, 상기 원신호의 주변신호를 복원할 만큼 상기 복호신호를 보정하여 출력한다. The voice coder 140 of the receiving modem 130 receives and decodes the voice packet using an antenna ANT and transmits the received voice packet to the adaptive equalizer 150. The adaptive equalizer 150 is The filter coefficient is received from the receiving modem 100 through a separate channel. The adaptive equalizer 150 receives the filter coefficient, applies the numerical value of the filter coefficient to the decoded signal, and corrects and outputs the decoded signal to restore the peripheral signal of the original signal.

상기 별도의 필터계수를 상대방 휴대폰에 전송하기 위해서는 음성채널 이외의 별도채널이 필요하지만 현실적인 대안이 되지는 못한다.In order to transmit the separate filter coefficient to the other's mobile phone, a separate channel other than the voice channel is required, but it is not a realistic alternative.

따라서 본 발명의 목적은 음성신호 이외의 음악신호를 부호화하거나 음성신호의 인공적인 대역폭 확장을 위한 보조정보 비트를 송수신하는 것을 목적으로 한다.Accordingly, an object of the present invention is to encode and transmit a music signal other than a voice signal or to transmit and receive auxiliary information bits for artificial bandwidth extension of the voice signal.

본 발명의 바람직한 실시예에 따른 방법은, 음성신호로 이루어진 음성패킷 송수신방법에 있어서, 입력된 음성신호를 부호화하여 비잡음성을 모델링한 파라미터와 잡음성을 모델링한 파라미터로 이루어진 음성패킷을 생성하는 과정과, 부호화시 왜곡된 음성패킷을 상기 입력된 음성신호와 비교하여, 왜곡 보상값을 계산하는 과정과, 상기 왜곡 보상값에 대한 보조정보를 생성하고 상기 잡음성을 모델링한 파라미터중 일부를 제거한 후 상기 보조정보를 삽입하여 송신하는 과정과, 상기 보조정보가 삽입된 상기 음성패킷을 수신하는 과정과, 상기 음성패킷에서 상기 보조정보를 추출하여 왜곡 보상값을 계산하는 과정과, 상기 음성패킷을 음성신호로 복호하는 과정과, 부호화되어 왜곡된 상기 수신된 음성패킷을 상기 왜곡 보상값으로 보정해 출력하는 과정을 포함한다.According to a preferred embodiment of the present invention, in the method for transmitting and receiving a voice packet consisting of a voice signal, a method of generating a voice packet comprising a parameter for modeling a non-noise and a parameter for modeling a noise by encoding an input voice signal And calculating a distortion compensation value by comparing the distorted voice packet with the input voice signal, generating auxiliary information for the distortion compensation value, and removing some of the parameters modeling the noise. Inserting and transmitting the supplementary information, receiving the speech packet into which the supplementary information is inserted, extracting the supplemental information from the speech packet, calculating a distortion compensation value, and speeching the speech packet Decoding the signal, and correcting and receiving the encoded and distorted speech packet with the distortion compensation value. Process.

본 발명의 바람직한 실시예에 따른 장치는, 음성신호로 이루어진 음성패킷 송수신장치에 있어서, 입력된 신호를 부호화하여 비잡음성을 모델링한 파라미터와 잡음성을 모델링한 파라미터로 이루어진 음성패킷을 생성하는 음성 부호화기와, 부호화시 왜곡된 상기 음성패킷을 상기 입력된 음성신호와 비교하여, 왜곡 보상값을 계산하여 상기 보조정보를 생성하는 적응형 등화기와, 상기 잡음성을 모델링한 파라미터 중 일부를 제거한 후 상기 보조정보를 삽입하여 송신하는 보조정보 비트 삽입기와, 보조정보가 삽입된 상기 음성패킷을 수신하고 상기 음성패킷에서 상기 보조정보를 추출하여 왜곡 보상값을 계산하는 보조정보 비트 추출기와, 상기 음성패킷을 복호화하는 음성 복호화기와, 상기 왜곡 보상값을 상기 보조정보 추출기로부터 받아 상기 수신된 음성패킷의 왜곡된 신호를 상기 왜곡 보상값으로 보정해 출력하는 적응형 등화기를 포함한다.In accordance with a preferred embodiment of the present invention, an apparatus for transmitting and receiving a speech packet comprising a speech signal may include: a speech encoder configured to generate a speech packet including a parameter for modeling non-noise and a parameter for modeling noise by encoding an input signal. And an adaptive equalizer for generating the auxiliary information by calculating a distortion compensation value by comparing the distorted voice packet with the input voice signal during encoding, and removing some of the parameterized noise model. An auxiliary information bit inserter for inserting and transmitting information, an auxiliary information bit extractor for receiving the voice packet into which the auxiliary information is inserted, extracting the auxiliary information from the voice packet, and calculating a distortion compensation value, and decoding the voice packet A voice decoder and the distortion compensation value from the auxiliary information extractor A distorted signal of the voice packet includes an adaptive equalizer for correcting the output by the distortion compensation value.

이하 본 발명의 바람직한 실시예들을 첨부한 도면을 참조하여 상세히 설명한다. 또한 본 발명의 요지를 흐릴 수 있는 공지기능 및 구성에 대한 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In addition, detailed descriptions of well-known functions and configurations that may obscure the gist of the present invention will be omitted.

본 발명에서는 음성채널로 전송되는 음성패킷 내의 파라미터에 보조정보 비트를 삽입하여 송수신하는 방법 및 장치를 제공한다.The present invention provides a method and apparatus for transmitting and receiving by inserting an auxiliary information bit into a parameter in a voice packet transmitted through a voice channel.

도 2는 본 발명의 바람직한 실시예에 따른 음성패킷의 구조도이다.2 is a structural diagram of a voice packet according to a preferred embodiment of the present invention.

이동 통신망에서 사용하는 음성 부호화기는 인간의 음성생성 모델에 기초하여 입력된 음성의 정보만을 취하여 부호화하고 전송하는데 상기 도 2에 상기 음성생성 모델에 기초한 LPC 필터(210), 피치필터 이득(220), 피치(230), 코드북 이득(240), 코드북 벡터(250)의 파라미터로 이루어진 음성패킷(200)을 도시하고 있다.The speech coder used in the mobile communication network takes only the information of the input speech based on the human speech generation model, encodes and transmits the information, and the LPC filter 210, the pitch filter gain 220, A voice packet 200 composed of the pitch 230, the codebook gain 240, and the parameters of the codebook vector 250 is shown.

상기 LPC(Linear Predictive Coding) 필터(210)는 인간의 성도(Vocal Tract) 특성을 나타내는 파라미터이고, 상기 피치필터 이득(220) 및 상기 피치(230) 파라미터는 성대(Vocal Cords)의 진동특성을 나타내며, 상기 코드북 이득(240)은 폐에서 뿜어져 나오는 공기압의 세기를 나타내는 파라미터로서 전체적인 음의 세기를 결정짓는다. 상기 파라미터들은 모두 음성을 구성하는 중요한 구성요소들로, 만일 왜곡이 발생하면 부호화기에 의해 재생되는 음성패킷 자체의 음질에 큰 영향을 미친다. 상기 파라미터들은 비잡음성을 모델링한 파라미터라 칭한다. The linear predictive coding (LPC) filter 210 is a parameter representing a human vocal characteristic, and the pitch filter gain 220 and the pitch 230 parameter represent a vibration characteristic of vocal cords. The codebook gain 240 is a parameter representing the strength of air pressure emitted from the lungs and determines the overall sound intensity. All of the above parameters are important components of speech, and if distortion occurs, it greatly affects the sound quality of the speech packet itself reproduced by the encoder. The parameters are called parameters that model non-noise.

그러나 상기 파라미터들 중 상기 코드북 벡터(250)는 주로 폐에서 뿜어져 나오는 공기압의 음색을 나타내는 파라미터이지만, 상기 공기압의 신호적 특징이 모든 주파수 대역의 출력을 가지는 백색잡음과 유사한 성질이므로, 상기 코드북 벡터로 모델링 한 음성신호는 상기 백색잡음과 유사한 신호적 특징을 갖는다. 따라서 상기 코드북 벡터의 경우 다른 파라미터에 비해 음성을 구성하는데 있어서 덜 중요한 파라미터이며, 부호화 혹은 송신 및 수신에서 어느 정도의 왜곡이 생기더라도 복호화기에 의해 복호되어 재생되는 상기 음성의 음질에는 큰 영향을 미치지 않는다. 상기 파라미터는 잡음성을 모델링한 파라미터라 칭한다.However, the codebook vector 250 of the parameters is a parameter representing the tone of the air pressure mainly emitted from the lungs, but since the signal characteristic of the air pressure is similar to the white noise having the output of all frequency bands, the codebook vector The speech signal modeled as has a signal characteristic similar to that of the white noise. Therefore, the codebook vector is a less important parameter in constructing speech than other parameters, and even if some distortion occurs in encoding or transmitting and receiving, the quality of the speech decoded and reproduced by the decoder does not have a significant effect. . The parameter is referred to as a model for modeling noise.

즉, 상기 코드북 벡터(250)의 파라미터는 음질에 관해서는 덜 중요하므로 상기 음질을 향상시키는 보조정보 비트를 생성하여, 상기 보조정보 비트가 상기 코드북 벡터의 정보를 전송하는데 필요한 비트를 넘지 않는다면, 상기 코드북 벡터내 정보비트의 일부를 음질향상을 위한 상기 보조정보 비트를 송신하는데 활용하는 것이 전체적인 음성의 질을 향상시키는데 있어서 효율적인 선택이라 할 수 있다. That is, since the parameters of the codebook vector 250 are less important with respect to sound quality, the auxiliary information bits for improving the sound quality are generated so that the auxiliary information bits do not exceed the bits necessary for transmitting the information of the codebook vector. The use of a part of the information bits in the codebook vector to transmit the auxiliary information bits for improving the sound quality is an efficient choice for improving the overall voice quality.

상기 음성패킷(200)은 일예를 든 것으로, 상기 파라미터들의 순서와 위치는 이동통신망의 설계에 따라 달라진다.The voice packet 200 is an example, and the order and location of the parameters depend on the design of the mobile communication network.

보조정보 비트(270)를 음성패킷에 삽입하는 일예로서, 코드북 벡터 (260)내에서 상기 코드북 벡터의 정보비트를 상기 보조정보 비트(270)만큼 빼내고, 최하위 비트(Least Significant Bit; LSB)부터 최상위 비트(Most Significant Bit; MSB)까지 차례로 채워나가는 것이 상기 최상위 비트부터 상기 최하위 비트까지 차례로 채워나가는 것에 비해 상기 보조정보 비트를 상기 코드북 벡터에 삽입하는 데 따른 상기 코드북 벡터 자체비트의 오차를 줄일 수 있다. 또 다른 예로 코드북 벡터(280)내에 일정한 간격 또는 임의적인 간격으로 코드북 벡터(280)에서 상기 코드북 벡터의 정보비트를 빼내고 상기 보조정보 비트(270)를 삽입하는데, 상기 코드북 벡터(280)에서 상기 일정한 간격 또는 상기 임의적인 간격을 저장하여 상기 코드북 벡터의 정보비트를 복호할 때 오류가 나지 않도록 한다.As an example of inserting the auxiliary information bit 270 into the voice packet, the information bit of the codebook vector is subtracted by the auxiliary information bit 270 in the codebook vector 260, and the least significant bit (LSB) to the most significant bit are extracted. Filling up to the Most Significant Bit (MSB) in turn may reduce the error of the codebook vector itself bits due to inserting the auxiliary information bits into the codebook vector as compared to filling up from the most significant bit to the least significant bit. . As another example, the information bits of the codebook vector are extracted from the codebook vector 280 and the auxiliary information bits 270 are inserted into the codebook vector 280 at regular intervals or at random intervals. The interval or the arbitrary interval is stored so that no error occurs when decoding the information bits of the codebook vector.

상기 보조정보 비트가 삽입되는 음성패킷내의 잡음성을 모델링한 파리미터는 송신측과 수신측 사이에 서로 약속이 되어 있으므로 상기 보조정보 비트의 위치 또한 상기 송신측과 상기 수신측이 인식하고 있다. 보조정보 비트의 수는 코드북 벡터의 정보비트에 비해 아주 작으므로 코드북 벡터정보 자체의 왜곡에 크게 기여하지 않는다. Since the parameters modeling the noise in the voice packet into which the auxiliary information bits are inserted are promised between the transmitting side and the receiving side, the positions of the auxiliary information bits are also recognized by the transmitting side and the receiving side. Since the number of auxiliary information bits is very small compared to the information bits of the codebook vector, it does not contribute significantly to the distortion of the codebook vector information itself.

예를들어, 보통 10 비트 미만의 보조정보로도 좋은 성능을 기대할 수 있는데 비해EVRC(Enhanced Variable Rate Codec), QCELP(Qualcomm Code Excited Linear Prediction), AMR(Adaptive Multi Rate) 등의 코드북 벡터정보 비트 수(최대 전송율의 경우)는 각각 프레임 당 105 비트, 188 비트, 140 비트 이다. 따라서 상대적으로 상기 보조정보 비트보다 큰 비트를 가지는 상기 각각의 코드북 벡터정보의 하위비트 일부만을 상기 보조정보 비트에 할당하여도 충분히 전송할 수 있으며, 이로 인해 생기는 코드북 벡터정보의 왜곡은 크지 않다. 더욱이 각 보조정보 비트의 값이 '0' 아니면 '1'인 이진수라는 점을 고려할 때, 확률적으로 원래의 코드북 벡터 정보 비트의 값을 변화시킬 가능성은 50% 이므로 보조 정보 비트에 의해 생길 수 있는 코드북 벡터 정보의 왜곡 가능성은 그만큼 더 줄어들게 된다. For example, you can expect good performance even with auxiliary information of less than 10 bits, whereas the number of bits of codebook vector information such as Enhanced Variable Rate Codec (EVRC), Qualcomm Code Excited Linear Prediction (QCELP), and Adaptive Multi Rate (AMR) The maximum bit rate is 105 bits, 188 bits and 140 bits per frame, respectively. Therefore, even if only a part of the lower bit of each codebook vector information having a bit larger than the auxiliary information bit is allocated to the auxiliary information bit, it can be sufficiently transmitted, and the resulting distortion of the codebook vector information is not large. Furthermore, given that the value of each auxiliary information bit is '0' or '1' binary, there is a 50% chance of changing the value of the original codebook vector information bit. The possibility of distortion of codebook vector information is further reduced.

도 3은 본 발명의 바람직한 실시예에 따른 음성패킷 송수신측 모뎀의 블록도이다.3 is a block diagram of a voice packet transceiver side modem according to a preferred embodiment of the present invention.

송신측 모뎀(300)의 음성 부호화기(310)와 적응형 등화기(Adaptive Equalizer)(320)는 디지털 음성 혹은 오디오 입력신호를 받는다. 상기 음성 부호화 기(310)는 음성신호에 대해 부호화를 진행하여 음성패킷을 생성하고 보조정보 비트 삽입기(320)로 전달하며, 상기 부호화된 음성패킷을 복호한 신호를 상기 적응형 등화기(330)로 전달한다. 상기 적응형 등화기(330)는 상기 입력신호를 받고, 상기 음성 부호화기(310)로부터 부호화된 후 복호된 신호와 비교하여 상기 부호화어 복호된 신호가 상기 입력신호로부터 얼마나 왜곡이 되었는지를 나타낸 필터계수를 계산한다. The speech encoder 310 and the adaptive equalizer 320 of the transmitting modem 300 receive a digital voice or audio input signal. The speech encoder 310 encodes a speech signal to generate a speech packet and transmits the speech packet to the auxiliary information bit inserter 320. The speech equalizer 330 decodes the encoded speech packet. To pass). The adaptive equalizer 330 receives the input signal and compares the decoded signal after being encoded by the speech coder 310 with a filter coefficient indicating how distorted the coded decoded signal is from the input signal. Calculate

즉, 원신호 인 입력신호와 부호화되어 복호된 신호와 비교하여, 부호화 과정에서 생긴 왜곡을 보정해주는 보상값인 필터계수를 계산한다.That is, a filter coefficient, which is a compensation value for correcting the distortion generated in the encoding process, is compared with the input signal, which is the original signal, and the encoded and decoded signal.

상기 적응형 등화기(330)는 상기 계산된 필터계수를 보조정보 비트로 변환하여 상기 보조정보 비트 삽입기(320)로 전달한다.The adaptive equalizer 330 converts the calculated filter coefficient into auxiliary information bits and transmits them to the auxiliary information bit inserter 320.

상기 보조정보 비트 삽입기(320)는 상기 음성패킷의 특정 파라미터에 상기 보조정보 비트를 삽입하여 음성채널로 안테나(ANT)를 이용하여 수신측 모뎀(340)으로 송신한다. The auxiliary information bit inserter 320 inserts the auxiliary information bits into a specific parameter of the voice packet and transmits the auxiliary information bits to the receiving side modem 340 using an antenna ANT in a voice channel.

상기 수신측 모뎀(340)의 보조정보 비트 추출기(350)는 안테나(ANT)를 이용하여 상기 보조정보 비트가 삽입된 음성패킷을 수신받아 보조정보 비트를 추출하여 적응형 등화기(370)로 전달하고 상기 보조정보 비트를 추출한 음성패킷을 음성 복호화기(360)로 전달한다.The auxiliary information bit extractor 350 of the receiving modem 340 receives a voice packet into which the auxiliary information bits are inserted using an antenna ANT, extracts the auxiliary information bits, and transfers the auxiliary information bits to the adaptive equalizer 370. The voice packet from which the auxiliary information bit is extracted is transferred to the voice decoder 360.

상기 적응형 등화기(370)는 상기 보조정보 비트로부터 부호화 왜곡을 보정하는데 필요한 필터계수를 계산하여 음성 복호화기(360)에 의해 복호화된 신호를 상기 필터계수를 이용하여 필터처리하여 부호화 왜곡이 보정된 신호를 출력한다.The adaptive equalizer 370 calculates a filter coefficient necessary to correct the encoding distortion from the auxiliary information bits, and filters the signal decoded by the speech decoder 360 using the filter coefficient to correct the encoding distortion. Output the generated signal.

상기 송신측 모뎀(300)부터 안테나(ANT)까지의 부분은 이동통신 휴대폰에서 공지된 것이기 때문에 생략한다. 또한 안테나(ANT)부터 상기 수신측 모뎀(340)까지의 부분은 상기 마찬가지로 공지된 것이기 때문에 생략한다.The part from the transmitting side modem 300 to the antenna ANT is omitted since it is known in the mobile communication cellular phone. In addition, since the part from the antenna ANT to the receiving side modem 340 is similarly well-known, it abbreviate | omits.

도 4는 본 발명의 바람직한 실시예에 따른 음성패킷 송수신의 흐름도이다.4 is a flowchart of voice packet transmission and reception according to a preferred embodiment of the present invention.

400단계에서 송신측 모뎀(300)의 적응형 등화기(300)는 입력신호와, 음성 부호화기(310)에서 부호화되어 복호된 신호를 받아 얼마나 왜곡이 되었는지를 비교하여 상기 부호화되어 복호된 신호가 상기 입력신호로부터 왜곡된 정도를 보정해주는 필터계수를 계산하여 보조정보 비트를 생성한다.In operation 400, the adaptive equalizer 300 of the modem 300 of the transmitting side compares an input signal with a signal that is encoded and decoded by the speech encoder 310 and compares the distortion to the signal. Auxiliary information bits are generated by calculating a filter coefficient that corrects the amount of distortion from the input signal.

410단계에서 보조정보 비트 삽입기(320)는 상기 음성부호화기(310)에서 상기 부호화된 음성패킷을 받아 특정 파라미터의 위치를 검색하고 상기 특정 파라미터에 상기 적응형 등화기(330)에서 받은 보조정보 비트를 삽입한다.In step 410, the auxiliary information bit inserter 320 receives the encoded voice packet from the voice encoder 310, searches for the position of a specific parameter, and receives the auxiliary information bit received from the adaptive equalizer 330 in the specific parameter. Insert

420단계에서 상기 보조정보 비트 삽입기(330)는 상기 보조정보 비트가 삽입된 음성패킷을 안테나(ANT)를 이용하여 음성채널을 통해 수신측 모뎀(340)으로 송신한다.In step 420, the auxiliary information bit inserter 330 transmits the voice packet into which the auxiliary information bit is inserted to the receiving side modem 340 through the voice channel using the antenna ANT.

430단계에서 수신측 모뎀(340)의 보조정보 비트 추출기(350)는 수신된 상기 보조정보 비트가 삽입된 음성패킷에서 보조정보 비트를 추출하여 적응형 등화기(370)로 전달하고 상기 보조정보 비트를 추출한 음성패킷을 음성 복호화기(360)로 전달한다.In step 430, the auxiliary information bit extractor 350 of the receiving modem 340 extracts the auxiliary information bits from the received voice packet into which the auxiliary information bits are inserted, and transmits the auxiliary information bits to the adaptive equalizer 370. The extracted voice packet is transferred to the voice decoder 360.

440단계에서 상기 음성 복호화기(360)는 상기 보조정보 비트를 추출한 음성패킷을 복호화하여 상기 복호화된 신호를 상기 적응형 등화기(370)로 전달한다. In operation 440, the voice decoder 360 decodes the voice packet from which the auxiliary information bit is extracted and transmits the decoded signal to the adaptive equalizer 370.

450단계에서 상기 적응형 등화기(370)는 상기 보조정보 비트로부터 필터계수를 계산하고 상기 음성 복호화기(360)로부터 전달받은 복호화된 신호에 상기 필터계수를 적용하여 상기 부호화 과정에서 왜곡된 신호를 보정하여 출력한다.In operation 450, the adaptive equalizer 370 calculates a filter coefficient from the auxiliary information bits and applies the filter coefficient to the decoded signal received from the speech decoder 360 to correct the distorted signal in the encoding process. Correct and output.

이상에서 설명된 본 발명의 범위는 상술한 실시예에 국한되어 정해져서는 아니되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다. The scope of the present invention described above should not be limited to the above-described embodiments, but should be determined not only by the scope of the following claims, but also by those equivalent to the scope of the claims.

이상에서 상술한 본 발명은 오디오 신호에 관련된 부가적인 신호를 송수신할 때 별도의 채널을 이용하지 않고 음성채널에 정보를 실어 송수신 할 수 있는 이점이 있다.The present invention described above has the advantage that the information can be transmitted and received in the voice channel without using a separate channel when transmitting and receiving additional signals related to the audio signal.

Claims (12)

음성신호로 이루어진 음성패킷 송신방법에 있어서,In the voice packet transmission method consisting of a voice signal, 입력된 음성신호를 부호화하여 비잡음성을 모델링한 파라미터와 잡음성을 모델링한 파라미터로 이루어진 음성패킷을 생성하는 과정과,Encoding a voice signal to generate a voice packet including a parameter for modeling non-noise and a parameter for modeling noise; 부호화시 왜곡된 음성패킷을 상기 입력된 음성신호와 비교하여, 왜곡 보상값을 계산하는 과정과,Calculating a distortion compensation value by comparing the distorted speech packet with the input speech signal during encoding; 상기 왜곡 보상값에 대한 보조정보를 생성하고 상기 잡음성을 모델링한 파라미터중 일부를 제거한 후 상기 보조정보를 삽입하여 송신하는 과정을 포함하는 음성패킷 송신방법.Generating auxiliary information on the distortion compensation value, removing some of the parameters modeling the noise, and transmitting the auxiliary information by inserting the auxiliary information. 제1항에 있어서, 상기 왜곡 보상값은,The method of claim 1, wherein the distortion compensation value, 상기 부호화시 왜곡된 음성패킷과 상기 음성신호를 입력하여 적응등화 과정을 통해 출력된 적응 등화 필터 계수값임을 특징으로 하는 음성패킷 송신방법.And an adaptive equalization filter coefficient value outputted through an adaptive equalization process by inputting a distorted speech packet and the speech signal during the encoding. 제1항에 있어서, 상기 잡음성을 모델링한 파라미터는,The method of claim 1, wherein the parameter modeling the noise, 일정간격 또는 임의적인 간격으로 상기 잡음성을 모델링한 파라미터의 일부를 제거하고, 상기 보조정보 비트를 삽입하여 한쪽으로 정렬한 것을 특징으로 하는 음성패킷 송신방법.A method of transmitting a voice packet according to claim 1, wherein a part of the parameters of the noise modeling model is removed at a predetermined interval or at an arbitrary interval, and the auxiliary information bits are inserted and aligned. 음성신호로 이루어진 음성패킷 송신장치에 있어서,In the voice packet transmission device consisting of a voice signal, 입력된 신호를 부호화하여 비잡음성을 모델링한 파라미터와 잡음성을 모델링한 파라미터로 이루어진 음성패킷을 생성하는 음성 부호화기와,A speech encoder configured to generate a speech packet including a parameter for modeling non-noise and a parameter for modeling noise by encoding an input signal; 부호화시 왜곡된 상기 음성패킷을 상기 입력된 음성신호와 비교하여, 왜곡 보상값을 계산하여 상기 보조정보를 생성하는 적응형 등화기와, An adaptive equalizer configured to generate the auxiliary information by calculating a distortion compensation value by comparing the distorted speech packet with the input speech signal during encoding; 상기 잡음성을 모델링한 파라미터 중 일부를 제거한 후 상기 보조정보를 삽입하여 송신하는 보조정보 비트 삽입기를 포함하는 보조정보 송신장치.And an auxiliary information bit inserter for inserting and transmitting the auxiliary information after removing some of the parameters of the noise modeling. 제4항에 있어서, 상기 왜곡 보상값은,The method of claim 4, wherein the distortion compensation value, 상기 부호화시 왜곡된 음성패킷과 상기 음성신호를 입력하여 적응등화 과정을 통해 출력된 적응 등화 필터 계수값임을 특징으로 하는 보조정보 송신장치.And an adaptive equalization filter coefficient value output through the adaptive equalization process by inputting the distorted speech packet and the speech signal during the encoding. 제4항에 있어서, 상기 잡음성을 모델링한 파라미터는,The method of claim 4, wherein the parameter modeling the noise is, 일정간격 또는 임의적인 간격으로 상기 잡음성을 모델링한 파라미터의 일부를 제거하고, 상기 보조정보를 삽입하여 한쪽으로 정렬한 것을 특징으로 하는 음성패킷 송신장치.And a part of the parameters for modeling the noise at a predetermined interval or at an arbitrary interval, and inserting the auxiliary information to align them to one side. 음성신호로 이루어진 음성패킷 수신방법에 있어서,In the voice packet receiving method consisting of a voice signal, 보조정보가 삽입된 음성패킷을 수신하는 과정과,Receiving a voice packet in which auxiliary information is inserted; 상기 음성패킷의 잡음성을 모델링한 파라미터에서 상기 보조정보를 추출하여 왜곡 보상값을 계산하는 과정과,Calculating a distortion compensation value by extracting the auxiliary information from a parameter modeling the noise of the speech packet; 상기 음성패킷을 음성신호로 복호하는 과정과,Decoding the voice packet into a voice signal; 부호화시 왜곡된 상기 수신된 음성패킷을 상기 왜곡 보상값으로 보정해 출력하는 과정을 포함하는 음성패킷 수신방법.And correcting the received speech packet distorted during the encoding process using the distortion compensation value. 제7항에 있어서, 상기 왜곡 보상값은,The method of claim 7, wherein the distortion compensation value, 상기 부호화시 왜곡된 음성패킷과 상기 음성신호를 입력하여 적응등화 과정을 통해 출력된 적응 등화 필터 계수값임을 특징으로 하는 음성패킷 수신방법.And a speech equalization filter coefficient value outputted through an adaptive equalization process by inputting a distorted speech packet and the speech signal during the encoding. 제7항에 있어서, 상기 잡음성을 모델링한 파라미터는,The method of claim 7, wherein the parameter modeling the noise is, 일정간격 또는 임의적인 간격으로 상기 잠음성을 모델링한 파라미터의 일부를 제거하고, 상기 보조정보 비트를 삽입하여 한쪽으로 정렬한 것을 특징으로 하는 음성패킷 수신방법.The voice packet receiving method of claim 1, wherein a part of the parameters modeling the latentness is removed at a predetermined interval or at an arbitrary interval, and aligned to one side by inserting the auxiliary information bits. 음성신호로 이루어진 음성패킷 수신장치에 있어서,In the voice packet receiver comprising a voice signal, 보조정보가 삽입된 부호화시 왜곡된 음성패킷을 수신하고 상기 음성패킷의 잡음성을 모델링한 파라미터에서 상기 보조정보를 추출하여 왜곡 보상값을 계산하는 보조정보 비트 추출기와,An auxiliary information bit extractor configured to receive a distorted speech packet during encoding with an auxiliary information inserted therein and extract the auxiliary information from a parameter for modeling the noise of the speech packet to calculate a distortion compensation value; 상기 음성패킷을 복호화하는 음성 복호화기와,A voice decoder for decoding the voice packet; 상기 왜곡 보상값을 상기 보조정보 추출기로부터 받아 상기 부호화시 왜곡된 음성패킷의 신호를 상기 왜곡 보상값으로 보정해 출력하는 적응형 등화기를 포함하는 음성패킷 수신장치.And an adaptive equalizer for receiving the distortion compensation value from the auxiliary information extractor and correcting and outputting a signal of the distorted voice packet during the encoding to the distortion compensation value. 제10항에 있어서, 상기 왜곡 보상값은,The method of claim 10, wherein the distortion compensation value, 상기 부호화시 왜곡된 음성패킷과 상기 음성신호를 입력하여 적응등화 과정을 통해 출력된 적응 등화 필터 계수값임을 특징으로 하는 음성패킷 수신장치.And an adaptive equalization filter coefficient value output through the adaptive equalization process by inputting the distorted speech packet and the speech signal during the encoding. 제10항에 있어서, 상기 잡음성을 모델링한 파라미터는,The method of claim 10, wherein the parameter modeling the noise, 일정간격 또는 임의적인 간격으로 상기 잡음성을 모델링한 파라미터의 일부를 제거하고, 상기 보조정보 비트를 삽입하여 한쪽으로 정렬한 것을 특징으로 하는 음성패킷 수신장치.And a part of the parameters for modeling the noise at a predetermined interval or at an arbitrary interval, and inserting the auxiliary information bits and aligning them to one side.
KR1020070040087A 2007-04-24 2007-04-24 Method and apparatus for Transmitting and Receiving Voice Packet KR101350599B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070040087A KR101350599B1 (en) 2007-04-24 2007-04-24 Method and apparatus for Transmitting and Receiving Voice Packet

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070040087A KR101350599B1 (en) 2007-04-24 2007-04-24 Method and apparatus for Transmitting and Receiving Voice Packet

Publications (2)

Publication Number Publication Date
KR20080095514A true KR20080095514A (en) 2008-10-29
KR101350599B1 KR101350599B1 (en) 2014-01-13

Family

ID=40155161

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070040087A KR101350599B1 (en) 2007-04-24 2007-04-24 Method and apparatus for Transmitting and Receiving Voice Packet

Country Status (1)

Country Link
KR (1) KR101350599B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200141812A (en) 2019-06-11 2020-12-21 삼성전자주식회사 Method and apparatus for anomaly detection using neural network

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1197619A (en) 1982-12-24 1985-12-03 Kazunori Ozawa Voice encoding systems
JPH0661950A (en) * 1992-08-13 1994-03-04 Nec Corp Voice coding/decoding device
JP3179641B2 (en) * 1993-11-19 2001-06-25 株式会社日立製作所 Loop type audio conference circuit
JP4789430B2 (en) * 2004-06-25 2011-10-12 パナソニック株式会社 Speech coding apparatus, speech decoding apparatus, and methods thereof

Also Published As

Publication number Publication date
KR101350599B1 (en) 2014-01-13

Similar Documents

Publication Publication Date Title
RU2469422C2 (en) Method and apparatus for generating enhancement layer in audio encoding system
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP4218134B2 (en) Decoding apparatus and method, and program providing medium
CN111145767B (en) Decoder and system for generating and processing coded frequency bit stream
US7590532B2 (en) Voice code conversion method and apparatus
JP2009541797A (en) Vocoder and associated method for transcoding between mixed excitation linear prediction (MELP) vocoders of various speech frame rates
KR19990037152A (en) Encoding Method and Apparatus and Decoding Method and Apparatus
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
EP1190495A1 (en) Coded domain echo control
JP2003533902A5 (en)
JP2002108400A (en) Method and device for vocoding input signal, and manufactured product including medium having computer readable signal for the same
EP1020848A2 (en) Method for transmitting auxiliary information in a vocoder stream
KR101610765B1 (en) Method and apparatus for encoding/decoding speech signal
JP3964144B2 (en) Method and apparatus for vocoding an input signal
KR101350599B1 (en) Method and apparatus for Transmitting and Receiving Voice Packet
CN110415713B (en) Encoding method and device of DMR system, storage medium and digital interphone
Ding Wideband audio over narrowband low-resolution media
US7584096B2 (en) Method and apparatus for encoding speech
Bhatt Implementation and Overall Performance Evaluation of CELP based GSM AMR NB coder over ABE
JP4373693B2 (en) Hierarchical encoding method and hierarchical decoding method for acoustic signals
Nishimura Steganographic band width extension for the AMR codec of low-bit-rate modes
CN114863942B (en) Model training method for voice quality conversion, method and device for improving voice quality
JP3508850B2 (en) Pseudo background noise generation method
US20040019480A1 (en) Speech encoding device having TFO function and method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161228

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171228

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee