KR20110086919A - Transcoding method and transcoding apparatus for smv and amr speech coding schemes - Google Patents

Transcoding method and transcoding apparatus for smv and amr speech coding schemes Download PDF

Info

Publication number
KR20110086919A
KR20110086919A KR1020100006314A KR20100006314A KR20110086919A KR 20110086919 A KR20110086919 A KR 20110086919A KR 1020100006314 A KR1020100006314 A KR 1020100006314A KR 20100006314 A KR20100006314 A KR 20100006314A KR 20110086919 A KR20110086919 A KR 20110086919A
Authority
KR
South Korea
Prior art keywords
smv
amr
pitch delay
lsp
adaptive codebook
Prior art date
Application number
KR1020100006314A
Other languages
Korean (ko)
Inventor
이인성
김영준
이덕종
정규혁
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020100006314A priority Critical patent/KR20110086919A/en
Publication of KR20110086919A publication Critical patent/KR20110086919A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook

Abstract

PURPOSE: A mutual encoding method for applying the encoder of an SMV and AMR is provided to maintain the voice quality by a delay time and a small amount of calculation in using a difference communication network. CONSTITUTION: An encoding device generates a SMV parameter by encoding a received SMV(Selectable Mode Vocoder) bit stream(S320). The encoding device performs an LSP(Line Spectral Pairs) conversion(S330). If a transmission rate is set to 1/4 or 1/8, the encoding device sets a pitch delay as 0(S340,S3350). If the transmission rate is set to 1 or 1/2, the encoding device performs a pitch delay and ACB(Adaptive Code Book) conversion(S360). The encoding device performs a fixing code book conversion(S370).

Description

에스엠브이 및 에이엠알 음성 부호화 기법을 위한 상호부호화 방법 및 장치{Transcoding method and transcoding apparatus for SMV and AMR speech coding schemes}Transcoding method and transcoding apparatus for SMV and AMR speech coding schemes

본 발명은 서로 다른 통신을 이용하는 데이터 통신망간의 통합과 효율적인 연동 방법에 관한 것으로, 특히, SMV(Selectable Mode Vocoder) 및 AMR(Adaptive Multi-Rate) 음성 부호화 기법들 상호간의 효과적인 상호부호화를 통하여 SMV와 AMR을 연동하기 위한 방법 및 장치에 관한 것이다.The present invention relates to a method of integration and efficient interworking between data networks using different communications. In particular, the present invention relates to SMV and AMR through effective mutual coding between Selectable Mode Vocoder (SMV) and Adaptive Multi-Rate (AMR) speech coding techniques. It relates to a method and apparatus for interworking.

다양한 통신망들은 각각의 통신망에 따라 적합한 음성부호화 방법을 표준으로 정하여 사용하고 있다. 예를 들어, 일반 유선 전화망은 펄스 부호 변조(Pulse Code Modulation, PCM) 방식의 ITU G.711 음성 부호화기를 사용하고, VoIP 망에서는 CELP(Code Excited Linear Prediction) 방식의 ITU G.723과 ITU G.729.A 음성부호화기가 사용되고 있으며, 이동 통신망에서는 CELP 방식인 AMR(Adaptive Multi Rate)와 EVRC(Enhanced Variable Rate Codec) 음성 부호화기 등이 표준으로 사용되고 있다.Various communication networks use a standard voice coding method according to each communication network. For example, a general wired telephone network uses an ITU G.711 speech coder of a pulse code modulation (PCM) method, and an ITU G.723 and an ITU G. CCE of a Code Excited Linear Prediction (CELP) method in a VoIP network. 729.A speech encoders are used, and CELP-based adaptive multi rate (AMR) and enhanced variable rate codec (EVRC) speech encoders are used as standards.

기본적인 SMV와 AMR 음성부호화기에 대해서 소개하면 다음과 같다.The basic SMV and AMR voice encoders are as follows.

도 1은 종래 기술에 의한 SMV 음성부호화기를 개념적으로 나타내는 블록도이다.1 is a block diagram conceptually illustrating a conventional SMV voice encoder.

도 1에 도시된 SMV 음성부호화기(100)는 8.55 kbps(Rate 1), 4.0 kbps(Rate 1/2), 2.0kbps (Rate 1/4) 그리고 0.8 kbps(Rate 1/8)의 전송률을 가지는 다중 전송률 모드의 부호화기이다. 이들 모드는 네트워크 상황에 의해 결정되며, 프레임마다 다른 모드를 선택할 수 있기 때문에 평균 전송률과 음질의 균형을 적절히 조절할 수 있다. 각 프레임에 대한 전송률은 전송률 결정 알고리즘(Rate Decision Algorithm, RDA)에 의해 결정되며, 결정된 전송률에 따라 서로 다른 방식으로 LPC 합성 필터를 위한 여기 신호(excitation signal)를 계산한다. Rate 1과 Rate 1/2의 여기 신호 계산은 eX-CELP 방식으로 이루어지며, Rate 1/4의 여기 신호는 난수 발생기(Random Number Generator)에 의해 생성된 후, 2ms의 부프레임마다 이득을 곱하고 주파수 변형 필터(Frequency Shaping Filter)를 통과시켜 얻어진다. Rate 1/8은 난수 발생기에서 얻어진 신호에 하나의 이득 값을 곱하여 여기 신호가 생성된다.The SMV voice encoder 100 shown in FIG. 1 has multiple transmission rates of 8.55 kbps (Rate 1), 4.0 kbps (Rate 1/2), 2.0 kbps (Rate 1/4), and 0.8 kbps (Rate 1/8). Coder in bitrate mode. These modes are determined by network conditions, and different modes can be selected for each frame, so that the average transmission rate and sound quality can be properly balanced. The rate for each frame is determined by a Rate Decision Algorithm (RDA), and the excitation signal for the LPC synthesis filter is calculated in different ways according to the determined rate. Excitation signal calculation of Rate 1 and Rate 1/2 is done by eX-CELP method, and rate 1/4 excitation signal is generated by Random Number Generator, and then multiplies the gain every 2ms subframe and frequency Obtained by passing through a Frequency Shaping Filter. The rate 1/8 multiplies the signal obtained by the random number generator with one gain value to generate the excitation signal.

도 2는 종래 기술에 의한 AMR 음성부호화기를 개념적으로 나타내는 블록도이다.2 is a block diagram conceptually illustrating a conventional AMR speech encoder.

AMR 음성부호화기(200)는 4.75 kbps에서 12.2 kbps까지 8개의 모드를 지원하며, 모든 모드에서 공통적으로 선형 예측 분석이 수행된다. 그러면, 여기 신호는 적응 코드북 벡터와 고정 코드북 벡터에 각 코드북의 이득을 곱하여 더한 형태로 모델링 되며, ACELP(Algebraic Code Excited Linear Prediction) 방식을 사용한다.The AMR speech encoder 200 supports eight modes from 4.75 kbps to 12.2 kbps, and linear prediction analysis is performed in common in all modes. Then, the excitation signal is modeled by adding the adaptive codebook vector and the fixed codebook vector by the gain of each codebook, and using the ACELP (Algebraic Code Excited Linear Prediction) method.

그런데, 이와 같이 음성 부호화 기법이 다양하게 존재하기 때문에, 서로 다른 통신망의 효율적인 연동이 중요한 과제로 제기되고 있다. 그러나, 서로 다른 음성부호화기 표준은 서로 호환이 되지 않기 때문에, A라는 음성부호화기로 부호화된 패킷을 B라는 음성부호화기에 맞도록 복호화하는 과정이 필요하다.However, since there are various voice coding techniques as described above, efficient interworking of different communication networks has been an important issue. However, since different voice coder standards are not compatible with each other, a process of decoding a packet coded by the voice coder A to match the voice coder B is necessary.

이를 위한 방법에는 tandem 방식과 상호부호화 방식이 있다. tandem 방식은 연속적으로 부/복호화 과정을 반복하기 때문에 지연 시간이 길고 계산량이 많으며, 음질이 저하된다. 상호부호화 방법의 목적은 tandem 방식을 사용한 경우와 비슷한 음질을 유지하면서 계산량과 지연 시간을 감소시키는 것이다.There are two methods for doing this, tandem and mutual encoding. The tandem method continuously repeats the decoding / decoding process, so the delay time is long, the calculation amount is high, and the sound quality is degraded. The purpose of the inter-coding method is to reduce computation and latency by maintaining sound quality similar to that of the tandem method.

그런데, SMV 기법은 CDMA 2000 시스템을 위한 음성부호화기로 eX-CELP(extended Code Excited Linear Prediction) 방법을 기반으로 하며, AMR 기법은 GSM 과 WCDMA 이동통신에서 널리 사용되는 음성부호화기로 ACELP(Algebraic Code-Excited Linear Prediction) 방법을 기반으로 한다. 그러므로, AMR 기법을 지원하는 단말기를 이용해서는 SMV 기법을 지원하는 네트워크를 이용할 수 없다. 그런데, 최근 세계 어느 곳에서도 자신의 단말기를 이용하여 통화할 수 있는 로밍(roaming) 기술에 각광이 받고 있다. 이러한 로밍 기술을 구현하기 위해서는 서로 다른 통신 네트워크에서 이용되는 음성 부호화 기법 상호간의 호환성을 보장하는 것이 필요하다.However, SMV is based on eX-CELP (Extended Code Excited Linear Prediction) as a voice coder for CDMA 2000 systems, and AMR is an ACELP (Algebraic Code-Excited) as a voice coder widely used in GSM and WCDMA mobile communications. Based on the Linear Prediction method. Therefore, a terminal supporting the AMR technique cannot use a network supporting the SMV technique. However, in recent years, the roaming (roaming) technology that can be used anywhere in the world by using their own terminal has been in the spotlight. In order to implement such a roaming technique, it is necessary to ensure compatibility between voice encoding techniques used in different communication networks.

그러므로, SMV 및 AMR 기법을 모두 지원하는 단말기 등에서는 연산량을 증가시키지 않으면서도 음질을 유지한 채 AMR 및 SMV 기법 간의 상호부호화를 가능하게 하는 방법 및 장치가 절실히 요구된다.Therefore, a terminal and the like that support both the SMV and AMR techniques are required a method and apparatus that enables mutual encoding between the AMR and SMV techniques while maintaining the sound quality without increasing the amount of computation.

본 발명의 목적은 AMR 및 SMV 간의 상호부호화 방법에서 음질 저하를 최소화하면서 계산량과 지연 시간을 감소시키기 위한 상호부호화 방법을 제공하는 것이다.It is an object of the present invention to provide an intercoding method for reducing computation and delay time while minimizing sound degradation in the intercoding method between AMR and SMV.

본 발명의 다른 목적은 LSP(Line Spectral Pairs) 변환, 피치 지연 변환, 펄스 재검색을 위한 고속 고정 코드북 벡터 탐색, 전송률 결정 방법을 적용하는, SMV 및 AMR 음성부호화기 간의 상호부호화 장치를 제공하는 것이다.It is another object of the present invention to provide an apparatus for mutual encoding between an SMV and an AMR speech encoder, which applies a line spectral pairs (LSP) transform, a pitch delay transform, a fast fixed codebook vector search for pulse rescanning, and a rate determination method.

상기와 같은 목적들을 달성하기 위한 본 발명의 제1측면은, SMV(Selectable Mode Vocoder) 음성 부호화 기법으로 부호화된 비트스트림을 AMR(Adaptive Multi-Rate) 음성 부호화 기법으로 부호화된 비트스트림으로 변환하기 위한 방법에 관한 것이다. 본 발명에 따른 방법은 SMV 음성 부호화 기법으로 부호화된 비트스트림을 복호화하여 SMV LSP(Line Spectral Pairs), SMV 피치 지연, 전송률(SMV rate), 적응 코드북 이득, 및 고정 코드북 이득을 포함하는 SMV 파라미터들을 생성하기 위한 SMV 파라미터 복호화 단계, SMV LSP를 AMR 음성 부호화 기법에서 이용될 AMR LSP로 변환하는 LSP 변환 단계, 전송률이 1 또는 1/2인지 판단하고, 긍정일 경우 SMV 피치 지연 및 적응 코드북 이득을 각각 AMR 피치 지연 및 적응 코드북 이득으로 변환하고, 부정일 경우 AMR 피치 지연을 0으로 설정하는 피치 지연/적응 코드북 변환 단계, SMV 적응 코드북 벡터 및 적응 코드북 이득을 이용하여 SMV 고정 코드북 벡터를 AMR 고정 코드북 벡터로 변환하는 고정 코드북 변환 단계, 및 AMR LSP, AMR 피치 지연, 코드북 이득, 및 AMR 고정 코드북 벡터를 포함하는 AMR 파라미터들을 이용하여 SMV 음성 부호화 기법으로 부호화된 비트스트림을 AMR 음성 부호화 기법으로 인코딩하는 AMR 파라미터 부호화 단계를 포함한다. 특히, LSP 변환 단계는 복호화된 패킷 중 n번째 프레임의 네 번째 부프레임에 해당하는 SMV LSP를 그대로 AMR LSP의 n번째 프레임의 네 번째 부프레임으로서 이용하는 단계, 및 SMV LSP 중 (n-1)번째 프레임 및 n번째 프레임 각각의 네 번째 부프레임에 해당하는 SMV LSP를 보간하여 AMR LSP의 n번째 프레임의 두 번째 부프레임에 해당하는 AMR LSP로서 이용하는 단계를 포함한다. 또한, 피치 지연/적응 코드북 변환 단계는 전송률이 1 또는 1/2일 경우, 피치 지연의 개회로 피치 지연 과거값을 AMR의 피치 지연 PAMR로 예측하는 단계, PAMR 및 SMV의 폐회로 피치 지연 PSMV의 차이가 소정 문턱값보다 큰지 판단하고, 긍정일 경우 AMR의 피치 지연을 다시 검색하고, 부정일 경우 폐회로 피치 지연 PSMV을 피치 지연 PAMR로 설정하는 단계, 및 피치 지연 PAMR을 이용하여 적응 코드북(Adaptive Code Book, ACB)을 검색하는 ACB 검색 단계를 포함한다. 더 나아가, 고정 코드북 변환 단계는 SMV 적응 코드북 벡터 및 적응 코드북 이득으로부터 고정 코드북 검색을 위한 목적 신호를 생성하는 단계, 장구간 예측 잔여 신호 res LTP (n) 및 목적 신호 및 임펄스 응답 간의 상관도 d(n)을 이용하여 레퍼런스 벡터 b(n)를 연산하는 단계, 레퍼런스 벡터의 큰 값으로부터 선택하여 위치 검색을 위한 초기 펄스 배열을 추출하는 단계, 목적 신호 및 임펄스 응답 간의 상관도 d(n) 및 임펄스 응답 간의 자기상관행렬 Φ(i,j)을 이용하여 초기 펄스 배열들의 검색 기준 Q k 를 연산하는 단계, 펄스 배열에 속하는 펄스들 중에서 인접한 두 트랙당 하나의 펄스를 제거하는 동작을 수행하여 두 개의 펄스를 제거하고, 제거된 펄스들을 반영하여 검색 기준 Q k 를 변경하며, 변경된 검색 기준 Q k 를 최대화하는 펄스를 제거된 펄스가 속해있는 트랙에서 선택하는 2펄스 재검색 단계, 및 2펄스 재검색 단계에서 얻어진 펄스 배열로부터 한 개씩 펄스를 제거하면서 제거된 펄스들을 반영하여 검색 기준 Q k 를 변경하며, 변경된 검색 기준 Q k 를 최대화하는 펄스를 선택하는 단일 펄스 재검색 단계를 포함한다. 특히, 2펄스 재검색 단계는 목적 신호 및 임펄스 응답 간의 상관도 d(n) 및 임펄스 응답 간의 자기상관행렬 Φ(i,j)은 사전 선택된 부호를 포함하도록 수정하여 검색을 단순화하는 단계를 더 포함한다.A first aspect of the present invention for achieving the above object is, for converting a bitstream coded by the Selectable Mode Vocoder (SMV) speech coding scheme to a bitstream coded by the Adaptive Multi-Rate (AMR) speech coding technique It is about a method. The method according to the present invention decodes a bitstream encoded by the SMV speech coding scheme to determine SMV parameters including SMV LSP (Line Spectral Pairs), SMV pitch delay, SMV rate, adaptive codebook gain, and fixed codebook gain. SMV parameter decoding step for generating, LSP conversion step for converting SMV LSP into AMR LSP to be used in AMR speech coding, determining whether the transmission rate is 1 or 1/2, and if positive, SMV pitch delay and adaptive codebook gain, respectively Convert the SMV fixed codebook vector to the AMR fixed codebook vector using a pitch delay / adaptive codebook transform step that transforms the AMR pitch delay and adaptive codebook gain and sets the AMR pitch delay to zero, the SMV adaptive codebook vector and the adaptive codebook gain. A fixed codebook transform step, and AMR including AMR LSP, AMR pitch delay, codebook gain, and AMR fixed codebook vector A bit stream encoded by an audio encoding method using SMV la meter includes AMR parameter coding step of encoding the AMR speech coding scheme. In particular, the LSP conversion step uses the SMV LSP corresponding to the fourth subframe of the nth frame of the decoded packet as it is as the fourth subframe of the nth frame of the AMR LSP, and the (n-1) th of the SMV LSPs. Interpolating the SMV LSPs corresponding to the fourth subframe of each of the frame and the n th frame and using the AMR LSPs corresponding to the second subframe of the n th frame of the AMR LSP. In addition, the pitch delay / adaptive codebook conversion step includes predicting the open loop pitch delay past value of the pitch delay with the pitch delay P AMR of the AMR when the transmission rate is 1 or 1/2, and the closed loop pitch delay P of the P AMR and SMV. Determining whether the difference of SMV is greater than a predetermined threshold, retrieving the pitch delay of AMR if positive, and setting closed loop pitch delay P SMV to pitch delay P AMR if negative, and pitch delay P AMR An ACB search step for searching an Adaptive Code Book (ACB). Further, the fixed codebook conversion step may include generating an object signal for fixed codebook retrieval from the SMV adaptive codebook vector and the adaptive codebook gain, the long term prediction residual signal res LTP (n), and the correlation between the object signal and the impulse response d ( correlation between n) for use by the reference vector b (n) the operating step, the step of selecting from a large value of the reference vector to extract the initial pulse array for the location search, the object signal and the impulse response of FIG d (n) and the impulse Computing the search criteria Q k of the initial pulse arrays using the autocorrelation matrix Φ ( i , j ) between the responses, and removing one pulse per two adjacent tracks among the pulses belonging to the pulse array. removing pulses, change the items Q k reflects the removed pulse, and a removing pulse to maximize the search criterion Q k is changed pulse To 2 pulses of selecting the track with re-search step, and a second pulse from the pulse array obtained by the re-search step reflect the pulse removed while removing one by one pulse, and change the items Q k, the pulse that maximizes the modified search criterion Q k A single pulse rescan step of selecting. In particular, the two-pulse rescanning step further includes the step of simplifying the retrieval by modifying the correlation d (n) between the target signal and the impulse response and the autocorrelation matrix Φ ( i , j ) between the impulse responses to include a preselected sign. .

상기와 같은 목적들을 달성하기 위한 본 발명의 제2 측면은, AMR 음성 부호화 기법으로 부호화된 비트스트림을 SMV 음성 부호화 기법으로 부호화된 비트스트림으로 변환하기 위한 방법에 관한 것이다. 본 발명의 제2측면에 의한 방법은 AMR 음성 부호화 기법으로 부호화된 비트스트림을 복호화하여 AMR LSP, AMR 피치 지연, 적응 코드북 이득, 및 고정 코드북 이득을 포함하는 AMR 파라미터들을 생성하기 위한 AMR 파라미터 복호화 단계, AMR LSP를 SMV 음성 부호화 기법에서 이용될 SMV LSP로 변환하는 LSP 변환 단계, 적응 코드북 이득, 고정 코드북 이득, 잡음-신호비(Noise to Signal Ratio, NSR), 및 AMR 파라미터 복호화 단계에서 복원된 음성 신호를 이용하여 SMV 부호화에 이용될 전송률이 1, 1/2, 1/4 및 1/8 중 어느 것인지 결정하는 전송률 결정 단계, 전송률이 1/4 또는 1/8이면, 난수 발생기를 이용하여 여기 신호(excitation signal)를 생성하는 단계, 전송률이 1 또는 1/2이면, AMR 피치 지연 및 적응 코드북 이득을 각각 SMV 피치 지연 및 적응 코드북 이득으로 변환하는 피치 지연/적응 코드북 변환 동작 및 AMR 적응 코드북 벡터 및 적응 코드북 이득을 이용하여 AMR 고정 코드북 벡터를 SMV 고정 코드북 벡터로 변환하는 고정 코드북 변환 동작을 수행하는 단계, 및 SMV LSP, SMV 피치 지연, 코드북 이득, 및 SMV 고정 코드북 벡터를 포함하는 SMV 파라미터들을 이용하여 AMR 음성 부호화 기법으로 부호화된 비트스트림을 SMV 음성 부호화 기법으로 인코딩하는 SMV 파라미터 부호화 단계를 포함한다. 특히, LSP 변환 단계는 복호화된 패킷 중 n번째 프레임의 네 번째 부프레임에 해당하는 AMR LSP를 그대로 SMV LSP의 n번째 프레임의 네 번째 부프레임으로서 이용하는 단계를 포함한다. 또한, 전송률 결정 단계는 적응 코드북 이득과 고정 코드북 이득을 참고하여 현재 프레임의 잡음 대 신호비(NSR)가 소정 문턱값 이상이거나, AMR 피치 지연의 편차가 크다면 묵음으로 분류하는 제1 분류 단계, 묵음이 아닌 현재 프레임을 적응 코드북 이득의 크기를 이용하여 무성음과 유성음을 분류하는 제2 분류 단계, 유성음으로 분류된 프레임의 과거 프레임의 클래스가 무성음이었는지 여부에 따라 변화 여부를 판단하는 제3 분류 단계, 변화가 일어나지 않은 프레임의 경우 적응 코드북 이득 및 피치 지연의 변화에 따라 정상 상태인지 비정상상태인지 여부를 판단하는 제4 분류 단계, 및 분류 단계들의 분류 결과에 따라 차등적으로 프레임의 전송률을 선택하는 단계를 포함한다. 더 나아가, 피치 지연/적응 코드북 변환 동작은, 피치 지연의 개회로 피치 지연 과거값을 SMV 피치 지연으로 예측하는 단계, SMV 피치 지연 및 AMR의 폐회로 피치 지연의 차이가 소정 문턱값보다 큰지 판단하고, 긍정일 경우 SMV의 피치 지연을 다시 검색하고, 부정일 경우 폐회로 피치 지연을 피치 지연으로 설정하는 단계, 및 피치 지연을 이용하여 적응 코드북을 검색하는 ACB 검색 단계를 포함한다.A second aspect of the present invention for achieving the above object relates to a method for converting a bitstream encoded by the AMR speech encoding technique into a bitstream encoded by the SMV speech encoding technique. According to a second aspect of the present invention, there is provided a method of decoding an AMR parameter to generate AMR parameters including an AMR LSP, an AMR pitch delay, an adaptive codebook gain, and a fixed codebook gain by decoding a bitstream encoded by an AMR speech coding technique. LSP conversion step for converting AMR LSP into SMV LSP for use in SMV speech coding, adaptive codebook gain, fixed codebook gain, noise to signal ratio (NSR), and AMR parameter decoding A rate determining step of determining whether the transmission rate to be used for SMV encoding using a signal is 1, 1/2, 1/4, or 1/8, and if the transmission rate is 1/4 or 1/8, excitation is performed using a random number generator. Generating an excitation signal, if the rate is 1 or 1/2, pitch delay / adaptation to convert the AMR pitch delay and adaptive codebook gain to SMV pitch delay and adaptive codebook gain, respectively Performing a fixed codebook transform operation that converts the AMR fixed codebook vector to an SMV fixed codebook vector using the drainbook transform operation and the AMR adaptive codebook vector and adaptive codebook gain, and SMV LSP, SMV pitch delay, codebook gain, and SMV fixed And an SMV parameter encoding step of encoding a bitstream encoded by the AMR speech encoding technique using the SMV parameters including the codebook vector. In particular, the LSP conversion step includes using the AMR LSP corresponding to the fourth subframe of the nth frame of the decoded packet as it is as the fourth subframe of the nth frame of the SMV LSP. In addition, the rate determining step may be performed by referring to the adaptive codebook gain and the fixed codebook gain. A second classification step of classifying the unvoiced and the voiced sound using the magnitude of the adaptive codebook gain for the current frame that is not silent, and a third classification step of determining whether the previous frame class of the frame classified as the voiced sound has been unvoiced In the case where the frame does not change, the fourth classification step for determining whether the normal state or abnormal state according to the change of the adaptive codebook gain and the pitch delay, and the transmission rate of the frame differentially selected according to the classification result of the classification steps Steps. Further, the pitch delay / adaptive codebook conversion operation may include predicting the open loop pitch delay past value of the pitch delay as the SMV pitch delay, determining whether the difference between the SMV pitch delay and the closed loop pitch delay of the AMR is greater than a predetermined threshold value, Retrieving the pitch delay of the SMV if positive, setting the closed loop pitch delay to the pitch delay if negative, and ACB retrieving to retrieve the adaptive codebook using the pitch delay.

상기와 같은 목적들을 달성하기 위한 본 발명의 제3 측면은 SMV 음성 부호화 기법으로 부호화된 비트스트림을 AMR 음성 부호화 기법으로 부호화된 비트스트림으로 변환하기 위한 장치에 관한 것이다. 본 발명의 제3 측면에 의한 장치는 컴퓨터에 의하여 실행될 수 있는 명령들을 실행하기 위한 프로세서, 및 프로세서에 연결되며, 컴퓨터에 의하여 실행될 수 있는 명령들을 저장하기 위한 메모리를 포함하며, 컴퓨터에 의하여 실행될 수 있는 명령들은, 본 발명의 제1 측면에 의한 방법을 실행하도록 적응된다.A third aspect of the present invention for achieving the above object relates to an apparatus for converting a bitstream encoded by the SMV speech encoding technique to a bitstream encoded by the AMR speech encoding technique. An apparatus according to a third aspect of the present invention includes a processor for executing instructions that can be executed by a computer, and a memory coupled to the processor, the memory for storing instructions that can be executed by the computer, and can be executed by the computer. Instructions are adapted to execute the method according to the first aspect of the invention.

상기와 같은 목적들을 달성하기 위한 본 발명의 제4 측면은 AMR 음성 부호화 기법으로 부호화된 비트스트림을 SMV 음성 부호화 기법으로 부호화된 비트스트림으로 변환하기 위한 장치에 관한 것이다. 본 발명의 제4 측면에 의한 장치는 컴퓨터에 의하여 실행될 수 있는 명령들을 실행하기 위한 프로세서, 및 프로세서에 연결되며, 컴퓨터에 의하여 실행될 수 있는 명령들을 저장하기 위한 메모리를 포함하며, 컴퓨터에 의하여 실행될 수 있는 명령들은, 본 발명의 제2 측면에 의한 방법을 실행하도록 적응된다.A fourth aspect of the present invention for achieving the above object relates to an apparatus for converting a bitstream encoded by the AMR speech encoding technique to a bitstream encoded by the SMV speech encoding technique. An apparatus according to the fourth aspect of the present invention includes a processor for executing instructions executable by a computer, and a memory coupled to the processor, the memory for storing instructions executable by the computer, and executable by the computer. Instructions are adapted to execute the method according to the second aspect of the invention.

본 발명에 의하여, SMV에서 AMR로의 부호화함에 있어서 LSP 변환 방법과 피치 지연 및 적응 코드북 변환 방법, 고정 코드북 변환 방법을 적용하여 추출한 파라미터를 AMR 부호화기에 전송한다. 또한 AMR에서 SMV로의 부호화함에 있어서, SMV의 모드에 적용할 수 있도록 AMR 복호화된 신호의 전송률과 타입 결정 방법 및 여기 신호 변환 방법을 적용하여 추출한 파라미터를 SMV 부호화기에 전송한다. 그러므로, 본 발명을 이용하면 SMV와 AMR의 상호부호화기를 적용하여 서로 다른 통신망을 사용하는데 있어서 적은 계산량과 지연 시간으로 음질 성능을 유지할 수 있다.According to the present invention, parameters extracted by applying the LSP transform method, the pitch delay, the adaptive codebook transform method, and the fixed codebook transform method in encoding from SMV to AMR are transmitted to the AMR encoder. In encoding from AMR to SMV, parameters extracted by applying a transmission rate, a type determination method, and an excitation signal conversion method of the AMR decoded signal are transmitted to the SMV encoder so as to be applicable to the mode of the SMV. Therefore, by using the present invention, the SMV and AMR mutual encoders can be used to maintain sound quality performance with a small amount of computation and delay time in using different communication networks.

도 1은 종래 기술에 의한 SMV 음성부호화기를 개념적으로 나타내는 블록도이다.
도 2는 종래 기술에 의한 AMR 음성부호화기를 개념적으로 나타내는 블록도이다.
도 3은 본 발명의 제1 측면에 따른 SMV에서 AMR로의 상호부호화 방법을 나타내는 흐름도이다.
도 4는 본 발명의 제1 및 제3 측면에 따른 상호부호화 방법 및 장치에서 수행되는 LSP 변환 동작을 설명하는 도면이다.
도 5는 본 발명의 제1 및 제3 측면에 따른 상호부호화 방법 및 장치에서 수행되는 SMV에서 AMR로의 피치 지연 변환 동작을 나타내는 흐름도이다.
도 6은 본 발명의 제3 측면에 따르는 SMV에서 AMR로의 상호부호화 장치를 개념적으로 나타내는 블록도이다.
도 7은 본 발명의 제2 측면에 따르는 AMR로부터 SMV로의 상호부호화 방법을 나타내는 흐름도이다.
도 8은 본 발명의 제4 측면에 따르는 AMR로부터 SMV로의 상호부호화 장치를 개념적으로 나타내는 블록도이다.
도 9는 도 7에 도시된 상호부호화 방법에 포함되는 전송률 결정 과정을 설명하기 위한 도면이다.
1 is a block diagram conceptually illustrating a conventional SMV voice encoder.
2 is a block diagram conceptually illustrating a conventional AMR speech encoder.
3 is a flowchart illustrating a method of mutual encoding from SMV to AMR according to a first aspect of the present invention.
4 is a diagram illustrating an LSP conversion operation performed in the mutual encoding method and apparatus according to the first and third aspects of the present invention.
5 is a flowchart illustrating a pitch delay conversion operation from SMV to AMR performed in the mutual encoding method and apparatus according to the first and third aspects of the present invention.
6 is a block diagram conceptually illustrating an apparatus for SM-to-AMR encoding according to a third aspect of the present invention.
7 is a flow diagram illustrating a method of intercoding from AMR to SMV in accordance with a second aspect of the present invention.
8 is a block diagram conceptually illustrating an apparatus for mutual encoding from AMR to SMV according to a fourth aspect of the present invention.
FIG. 9 is a diagram for describing a rate determining process included in the mutual encoding method illustrated in FIG. 7.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다.In order to fully understand the present invention, the operational advantages of the present invention, and the objects achieved by the practice of the present invention, reference should be made to the accompanying drawings which illustrate preferred embodiments of the present invention and the contents described in the accompanying drawings.

이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로서, 본 발명을 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. As those skilled in the art would realize, the described embodiments may be modified in various different ways, all without departing from the spirit or scope of the present invention. In addition, in order to clearly describe the present invention, parts irrelevant to the description are omitted, and the same reference numerals in the drawings indicate the same members.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈", "블록" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.Throughout the specification, when a part is said to "include" a certain component, it means that it may further include other components, without excluding the other components unless otherwise stated. In addition, the terms "... unit", "... unit", "module", "block", etc. described in the specification mean a unit for processing at least one function or operation, which means hardware, software, or hardware. And software.

도 3은 본 발명의 제1 측면에 따른 SMV에서 AMR로의 상호부호화 방법을 나타내는 흐름도이다.3 is a flowchart illustrating a method of mutual encoding from SMV to AMR according to a first aspect of the present invention.

우선, SMV 비트스트림을 수신한다(S310). 그러면, 수신된 SMV 비트스트림을 복호화하여 부호화 과정에서 이용된 SMV 파라미터를 생성한다(S320). 이 때, SMV의 여기 신호(excitation signal)는 AMR 코드북 검색 과정에서 사용될 목적 신호를 계산하는데 이용된다.First, the SMV bitstream is received (S310). Then, the received SMV bitstream is decoded to generate an SMV parameter used in the encoding process (S320). At this time, an excitation signal of the SMV is used to calculate an object signal to be used in the AMR codebook search.

LSP 변환 단계(S330)는 전송률과 무관하게 동일하게 수행된다. LSP 변환이 수행되면, SMV의 전송률이 1 또는 1/2인지 여부가 판단된다(S340). SMV의 전송률을 확인하는 이유는, SMV의 4 개의 전송률에 따라 서로 다른 상호부호화 과정이 수행되어야 하기 때문이다.LSP conversion step (S330) is performed the same regardless of the rate. When the LSP conversion is performed, it is determined whether the transmission rate of the SMV is 1 or 1/2 (S340). The reason for confirming the transmission rate of the SMV is that different mutual encoding processes should be performed according to the four transmission rates of the SMV.

만일, 전송률이 1/4 또는 1/8이라면, 피치 지연을 0으로 설정한다(S350). 반면에, 전송률이 1 또는 1/2이라면, 피치 지연 및 적응 코드북 변환 동작이 수행된다(S360). 이와 같이 피치 지연과 적응 코드북이 변환되면 고정 코드북 변환 동작(S370)이 수행된다. 이와 같이 AMR 음성부호화를 위한 모든 AMR 파라미터들이 결정되면, 결정된 AMR 파라미터들을 이용하여 AMR 음성부호화를 수행하여 AMR 비트스트림을 생성한다.If the transmission rate is 1/4 or 1/8, the pitch delay is set to 0 (S350). On the other hand, if the transmission rate is 1 or 1/2, the pitch delay and adaptive codebook conversion operation is performed (S360). As such, when the pitch delay and the adaptive codebook are converted, a fixed codebook conversion operation (S370) is performed. When all AMR parameters for AMR speech encoding are determined as described above, AMR speech encoding is performed using the determined AMR parameters to generate an AMR bitstream.

도 3에 도시된 상호부호화 방법을 구현하기 위한 장치가 도 6에 도시된다.An apparatus for implementing the mutual encoding method shown in FIG. 3 is shown in FIG. 6.

도 6은 본 발명의 제3 측면에 따르는 SMV에서 AMR로의 상호부호화 장치를 개념적으로 나타내는 블록도이다.6 is a block diagram conceptually illustrating an apparatus for SM-to-AMR encoding according to a third aspect of the present invention.

도 6에 도시된 상호부호화 장치(600)는 SMV 파라미터 복호화기(610), LSP 변환기(620), 전송률 결정기(630), 피치 지연 및 적응 코드북 변환기(640), 고정 코드북 변환기(650), 및 AMR 파라미터 부호화기를 포함한다(660).The mutual encoding apparatus 600 shown in FIG. 6 includes an SMV parameter decoder 610, an LSP converter 620, a rate determiner 630, a pitch delay and adaptive codebook converter 640, a fixed codebook converter 650, and An AMR parameter encoder is included (660).

SMV 파라미터 복호기(610)는 SMV의 부호화된 패킷에 파라미터 복호화 과정을 수행하여, 상호부호화 과정에서 변환되어야하는 파라미터들을 선택한다. 그 후, SMV 파라미터 복호기(610)는 SMV의 여기 신호를 이용하여 AMR 코드북 검색 과정에서 사용될 목적 신호를 계산한다. SMV의 4개의 전송률에 따라 다른 상호부호화 과정이 이루어지지만, LSP 변환 과정은 전송률과 관계없이 동일하게 수행된다. 피치 지연 및 적응 코드북 변환기(640)는 SMV의 Rate 1과 Rate 1/2일 경우에만 동작한다. 그 이유는 Rate 1/4와 Rate 1/8은 피치에 대한 정보가 없기 때문에 피치 지연 및 적응 코드북 변환 과정이 실행되지 않기 때문이다. 또한, 고정 코드북 변환기(650)는 모든 전송률에서 동작한다. AMR 파라미터 부호화기(660)는 LSP 변환기(620) 및 고정 코드북 변환기(650)의 출력을 이용하여 AMR 비트스트림을 생성한다.The SMV parameter decoder 610 performs a parameter decoding process on the encoded packet of the SMV, and selects parameters to be converted during the mutual encoding process. Thereafter, the SMV parameter decoder 610 calculates an object signal to be used in the AMR codebook search process using the excitation signal of the SMV. Different intercoding processes are performed according to the four data rates of the SMV, but the LSP conversion process is performed the same regardless of the data rates. The pitch delay and adaptive codebook converter 640 only operates when Rate 1 and Rate 1/2 of the SMV. The reason is that the rate delay and the adaptive codebook conversion process are not performed because Rate 1/4 and Rate 1/8 have no information about the pitch. In addition, the fixed codebook converter 650 operates at all rates. The AMR parameter encoder 660 generates an AMR bitstream using the outputs of the LSP converter 620 and the fixed codebook converter 650.

도 4는 본 발명의 제1 및 제3 측면에 따른 상호부호화 방법 및 장치에서 수행되는 LSP 변환 동작을 설명하는 도면이다. 도 4에서 진한 부분은 윈도우 가중치를 나타낸다.4 is a diagram illustrating an LSP conversion operation performed in the mutual encoding method and apparatus according to the first and third aspects of the present invention. In Fig. 4, the thick parts represent the window weights.

도 4에서 SMV와 AMR은 프레임 크기 및 부프레임 개수가 같으며, SMV의 4번째 부프레임과 AMR의 2번째와 4번째 부프레임은 가중치된 윈도우가 사용되었다. 또한 AMR의 12.2 kbps 모드에서 2번째와 4번째 부프레임의 LSP를 전송하는 것만 다를 뿐, 그 외의 모든 SMV와 AMR의 모드에서 4번째 부프레임에 해당하는 LSP만 양자화하여 전송한다. 따라서 AMR 음성부호화기에서 사용될 LSP는 SMV의 LSP를 그대로 사용하거나 간단한 선형 보간(Linear Interpolation)을 통하여 변환될 수 있다. 수학식 1은 AMR의 12.2 kbps에서만 사용되며, 수학식 2는 모든 전송률에서 사용된다.In FIG. 4, the SMV and the AMR have the same frame size and the number of subframes. A weighted window is used for the fourth subframe of the SMV and the second and fourth subframes of the AMR. In addition, only the LSPs of the second and fourth subframes are transmitted in the 12.2 kbps mode of AMR, and only the LSPs corresponding to the fourth subframe are quantized and transmitted in all other SMV and AMR modes. Therefore, the LSP to be used in the AMR speech encoder can be converted using the LSP of the SMV as it is or through simple linear interpolation. Equation 1 is used only at 12.2 kbps of AMR, and Equation 2 is used at all data rates.

Figure pat00001
Figure pat00001

Figure pat00002
Figure pat00002

도 5는 본 발명의 제1 및 제3 측면에 따른 상호부호화 방법 및 장치에서 수행되는 SMV에서 AMR로의 피치 지연 변환 동작을 나타내는 흐름도이다.5 is a flowchart illustrating a pitch delay conversion operation from SMV to AMR performed in the mutual encoding method and apparatus according to the first and third aspects of the present invention.

피치 지연은 CELP 방식에서 적응 코드북 검색에 중요한 역할을 하기 때문에 작은 오차도 음질에 큰 영향을 미친다. 따라서 SMV 패킷에서의 복호화된 피치 지연을 AMR 복호화 과정에서 그대로 사용할 경우 음질 저하가 발생한다.Pitch delay plays an important role in adaptive codebook retrieval in CELP, so even small errors have a big impact on sound quality. Therefore, when the decoded pitch delay in the SMV packet is used as it is in the AMR decoding process, sound quality deterioration occurs.

피치 지연 변환기(도 6의 640 참조)는 피치 지연을 개회로 피치 지연 과거값을 이용하여 예측한다(S510). 그러면, 예측된 피치 지연은 파라미터 복호화 과정을 통하여 복호화된 SMV의 피치 지연과 비교된다(S520). 만일 P SMV P AMR 의 차이가 문턱 값보다 크면, 좀 더 정확한 피치 지연을 얻기 위해 AMR의 개회로 피치 지연 검색을 수행한다(S540). 반면에, P SMV P AMR 의 차이가 문턱 값보다 작으면 SMV의 폐회로 피치 지연이 AMR의 개회로 피치 지연으로 선택되어 개회로 피치 지연 검색 과정을 생략한다(S530).The pitch delay converter (see 640 of FIG. 6) predicts the pitch delay using the open loop pitch delay past value (S510). Then, the predicted pitch delay is compared with the pitch delay of the decoded SMV through the parameter decoding process (S520). If the difference between P SMV and P AMR is greater than the threshold, an open loop pitch delay search of the AMR is performed to obtain a more accurate pitch delay (S540). On the other hand, if the difference between P SMV and P AMR is smaller than the threshold value, the closed loop pitch delay of the SMV is selected as the open loop pitch delay of the AMR, and thus the open loop pitch delay search process is omitted (S530).

다시 도 6을 참조하면, 고정 코드북 벡터 변환기(650)는 두 음성부호화기의 부호화 과정에서 가장 큰 계산량이 요구되는 동작을 수행한다. 본 발명에서 사용된 고속 고정 코드북 검색 장치는 레퍼런스 벡터를 이용하는 반복 펄스 위치 재검색 장치이다. 즉, 본 발명에 의한 고정 코드북 벡터 변환기(650)는 레퍼런스 벡터로부터 추출해낸 펄스 배열을 사용하여 2 펄스 재검색을 먼저 수행한 뒤 단일 펄스 재검색을 수행한다.Referring back to FIG. 6, the fixed codebook vector converter 650 performs an operation requiring the largest amount of computation in the encoding process of the two speech encoders. The fast fixed codebook retrieval apparatus used in the present invention is a repetitive pulse position retrieval apparatus using a reference vector. That is, the fixed codebook vector converter 650 according to the present invention first performs two-pulse rescan using a pulse array extracted from a reference vector and then performs a single pulse rescan.

수학식 3은 고정 코드북 목적 신호를 나타낸다.Equation 3 shows a fixed codebook object signal.

Figure pat00003
Figure pat00003

수학식 3에서 x(n)은 적응 코드북 목적 신호이며, y(n)은 필터링 된 적응 코드북 벡터, g p 는 양자화 되지 않은 적응 코드북 이득이다. g p 는 적응 코드북 벡터가 얼마나 여기 신호를 잘 모델링하는지에 대한 척도이다. 그러므로, g p 가 높은 프레임은 고정 코드북의 기여도가 상대적으로 낮고, 반대로 g p 가 낮은 프레임은 고정 코드북에 의한 기여가 상대적으로 중요해진다.In Equation 3, x ( n ) is an adaptive codebook object signal, y ( n ) is a filtered adaptive codebook vector, and g p is an unquantized adaptive codebook gain. g p is a measure of how well the adaptive codebook vector models the excitation signal. Therefore, a frame with a high g p has a relatively low contribution of the fixed codebook, whereas a frame with a low g p has a relatively important contribution with a fixed codebook.

또한, 다음 수학식 4 및 5를 참조한다.See also the following equations (4) and (5).

Figure pat00004
Figure pat00004

Figure pat00005
Figure pat00005

수학식 4 및 5에서 d(n)은 목적 신호인 x 2(n)와 임펄스 응답인 h(n) 간의 상관도이며, Φ(i,j)는 h(n) 간의 자기상관행렬이다.In Equations 4 and 5, d ( n ) is a correlation between the target signal x 2 ( n ) and the impulse response h ( n ), and Φ ( i , j ) is an autocorrelation matrix between h ( n ).

그러면, 고정 코드북은 검색 기준식인 다음 수학식 6을 최대화하는 펄스 위치들을 선택한다.The fixed codebook then selects pulse positions that maximize the following equation (6), which is a search reference.

Figure pat00006
Figure pat00006

검색의 목적은 최적화된 펄스 위치를 가지고 코드 벡터를 결정하는 것이다. 최적화된 펄스 위치를 구하기 위해서는 우선 레퍼런스 벡터를 나타내는 다음 수학식 7을 이용하여 초기 검색을 위한 펄스들의 위치를 얻어낸다.The purpose of the search is to determine the code vector with the optimized pulse position. To obtain the optimized pulse position, first, the position of the pulses for the initial search is obtained by using Equation 7, which represents the reference vector.

Figure pat00007
Figure pat00007

수학식 7에서, res LTP (n)은 장구간 예측 잔여 신호이다.In Equation 7, res LTP ( n ) is a long term prediction residual signal.

그러면, 각 트랙에 위치할 수 있는 펄스들은 b(n)에서 큰 값부터 선택하여 위치 검색을 위한 초기 펄스 배열을 만들어낸다. 2펄스 재검색과 단일 펄스 재검색을 위해서는 초기화된 펄스들의 검색 기준 Q k 가 계산되어 있어야 된다.Then, the pulses that can be placed in each track are selected from the larger values in b ( n ) to produce an initial pulse array for position search. For 2 pulse rescan and single pulse rescan, the search criteria Q k of the initialized pulses must be calculated.

검색을 단순화하기 위해서 신호 d(n)과 행렬 Φ(i,j)는 미리 선택된 부호를 포함하기 위해 수정된다. 수정된 신호 d'(n)과 Φ'(i,j)는 수학식 8 및 9로 정의되며, s b (n)은 b(n)의 부호이다.To simplify the search, the signal d ( n ) and the matrix Φ ( i , j ) are modified to include a preselected sign. The modified signals d ' ( n ) and Φ' ( i , j ) are defined by Equations 8 and 9, where s b ( n ) is the sign of b ( n ).

Figure pat00008
Figure pat00008

Figure pat00009
Figure pat00009

그러면, 수학식 8 및 9를 이용하여 수학식 6의 분자의 RE를 구하면 다음 수학식 10 및 11과 같다.Then, R and E of the molecules of Equation 6 are obtained using Equations 8 and 9 as shown in Equations 10 and 11.

Figure pat00034
Figure pat00034

Figure pat00011
Figure pat00011

R과 E가 구해지면, 먼저 2펄스 재검색이 수행된다. 즉, 인접한 두 트랙에서 하나의 펄스씩 두 개의 펄스를 제거한 후, 펄스가 제거된 트랙에서 새로운 펄스 조합을 검색한다. 이는 검색 기준 Q k 를 최대화하는 것을 선택함으로써 인접한 두 개의 트랙에서 기존에 검색된 펄스를 검색하게 된다. 두 펄스가 제거된 뒤 펄스가 제거된 후의 검색 기준 Q k ''의 분자와 분모는 수학식 12 및 13을 이용하여 다시 계산된다.Once R and E are found, two-pulse rescan is performed first. That is, after removing two pulses by one pulse from two adjacent tracks, a new pulse combination is searched for in the track from which the pulses are removed. This selects to maximize the search criterion Q k to search for previously searched pulses in two adjacent tracks. After two pulses are removed, the numerator and denominator of the search criterion Q k '' after the pulse is removed are recalculated using Equations 12 and 13.

Figure pat00012
Figure pat00012

Figure pat00033
Figure pat00033

그러면, 다음 단계에서 분자와 분모는 새로 추가된 펄스의 변화량만큼 더해져 수정된다. 제거된 펄스가 속해 있는 트랙에서 새로운 Q k 을 최대화하는 펄스를 선택하며, RE는 수학식 14 및 15로 수정된다.Then, in the next step, the numerator and denominator are corrected by adding the amount of change in the newly added pulse. Select the pulse that maximizes the new Q k in the track to which the removed pulse belongs, and R and E are modified by equations (14) and (15).

Figure pat00014
Figure pat00014

Figure pat00015
Figure pat00015

새로운 펄스를 검색하는데 있어서 v h (n)과 R hv (m)은 해당 트랙에서 선택 가능한 모든 경우에 대하여 실행 중에 수학식 16 및 17에 의하여 계산된다.In searching for a new pulse, v h ( n ) and R hv ( m ) are calculated by Equations 16 and 17 during execution for all selectable cases in the track.

Figure pat00016
Figure pat00016

Figure pat00017
Figure pat00017

상기 2펄스 재검색을 통해 얻어진 펄스 배열을 가지고 단일 펄스 재검색을 수행한다. 각각의 반복에서 트랙 내 각 펄스의 가장 적절한 위치는 트랙 내에서 이전에 검색되어 있는 다른 펄스들의 위치를 유지하면서 검색한다. 새로운 펄스를 검색하기 위해 먼저 한 개의 펄스 위치를 제거한 뒤 제거된 후의 Q k 값을 계산한다. 한 개의 펄스 위치가 제거된 후의 검색 기준 Q k '의 분자와 분모는 다음 수학식 18 및 19에 의해 계산된다.A single pulse rescan is performed with the pulse array obtained through the two pulse rescan. At each iteration, the most appropriate position of each pulse in the track is retrieved while maintaining the position of other pulses previously searched in the track. To find a new pulse, first remove one pulse position and then calculate the Q k value after it has been removed. The numerator and denominator of the search criterion Q k ' after one pulse position is removed are calculated by the following equations (18) and (19).

Figure pat00018
Figure pat00018

Figure pat00019
Figure pat00019

다음 단계에서 분자와 분모는 새로 추가된 펄스의 변화량만큼 더해져 수정된다. 제거된 펄스가 속해 있는 트랙에서 새로운 Q k 를 최대화하는 펄스를 선택한다. RE는 수학식 20 및 21에 의해 수정된다.In the next step, the numerator and denominator are modified by adding the amount of change in the newly added pulse. Select the pulse that maximizes the new Q k in the track to which the removed pulse belongs. R and E are modified by equations (20) and (21).

Figure pat00020
Figure pat00020

Figure pat00021
Figure pat00021

이하, AMR에서 SMV 음성부호화기로의 상호부호화 기술에 대하여 설명된다.Hereinafter, a description will be given of a technique of mutual encoding from AMR to SMV voice encoder.

도 7은 본 발명의 제2 측면에 따르는 AMR로부터 SMV로의 상호부호화 방법을 나타내는 흐름도이다.7 is a flow diagram illustrating a method of intercoding from AMR to SMV in accordance with a second aspect of the present invention.

AMR 비트스트림이 수신되면(S700), AMR 비트스트림을 복호화하여 AMR LSP, AMR 피치 지연, 적응 코드북 이득, 및 고정 코드북 이득을 포함하는 AMR 파라미터들을 생성한다(S710). 그러면, AMR 파라미터 중에서 AMR LSP를 SMV 음성 부호화 기법에서 이용될 SMV LSP로 변환한다(S720). 그러면, 적응 코드북 이득, 고정 코드북 이득, 잡음-신호비(Noise to Signal Ratio, NSR), 및 AMR 파라미터 복호화 단계에서 복원된 음성 신호를 이용하여 SMV 부호화에 이용될 전송률이 1, 1/2, 1/4 및 1/8 중 어느 것인지 결정한다(S730). 전송률 결정 방법에 대해서는 도 9를 이용하여 상세히 후술된다.When the AMR bitstream is received (S700), the AMR bitstream is decoded to generate AMR parameters including AMR LSP, AMR pitch delay, adaptive codebook gain, and fixed codebook gain (S710). Then, the AMR LSP is converted into the SMV LSP to be used in the SMV speech coding technique among the AMR parameters (S720). Then, using the adaptive codebook gain, the fixed codebook gain, the noise to signal ratio (NSR), and the speech signal reconstructed in the AMR parameter decoding step, the transmission rates for the SMV encoding are 1, 1/2, 1 One of / 4 and 1/8 is determined (S730). The transmission rate determination method will be described later in detail with reference to FIG.

전송률이 결정되면, 해당 결정률이 1 또는 1/2인지, 아니면 1/4 또는 1/8인지 여부를 판단한다(S740). 만일 전송률이 1/4 또는 1/8이라면, 난수 발생기를 이용하여 여기 신호를 생성한다(S750). 반면에, 전송률이 1 또는 1/2이면, AMR 피치 지연 및 적응 코드북 이득을 각각 SMV 피치 지연 및 적응 코드북 이득으로 변환한다(S760).When the transmission rate is determined, it is determined whether the corresponding determination rate is 1 or 1/2 or 1/4 or 1/8 (S740). If the transmission rate is 1/4 or 1/8, an excitation signal is generated using a random number generator (S750). On the other hand, if the data rate is 1 or 1/2, the AMR pitch delay and the adaptive codebook gain are converted into the SMV pitch delay and the adaptive codebook gain, respectively (S760).

또한, AMR 적응 코드북 벡터 및 적응 코드북 이득을 이용하여 AMR 고정 코드북 벡터를 SMV 고정 코드북 벡터로 변환한다(S770). 이와 같이 SMV 파라미터가 구해지면, 구해진 SMV 파라미터를 부호화하여 SMV 비트스트림을 생성한다(S780).In addition, the AMR fixed codebook vector is converted into an SMV fixed codebook vector using the AMR adaptive codebook vector and the adaptive codebook gain (S770). When the SMV parameter is obtained in this manner, the obtained SMV parameter is encoded to generate an SMV bitstream (S780).

도 8은 본 발명의 제4 측면에 따르는 AMR로부터 SMV로의 상호부호화 장치를 개념적으로 나타내는 블록도이다.8 is a block diagram conceptually illustrating an apparatus for mutual encoding from AMR to SMV according to a fourth aspect of the present invention.

도 8에 도시된 상호부호화 장치(800)는 AMR 파라미터 복호화기(810), LSP 변환기(820), 전송률 결정기(830), 피치 지연 및 적응 코드북 변환기(840), 고정 코드북 변환기(950), 여기 신호 변환기(860), 및 SMV 파라미터 부호화기(870)를 포함한다(660).The mutual encoding apparatus 800 shown in FIG. 8 includes an AMR parameter decoder 810, an LSP converter 820, a rate determiner 830, a pitch delay and adaptive codebook converter 840, a fixed codebook converter 950, A signal converter 860, and an SMV parameter encoder 870 (660).

AMR 파라미터 복호화기(810)는 AMR 부호화된 패킷에 파라미터 복호화 과정을 수행하여, 상호부호화 과정에서 변환되어야하는 파라미터들을 선택한다. 그러면, LSP 변환기(820)는 복호화된 신호를 LSP로 변환하여 SMV 파라미터 부호화기(870)로 전달한다. 전송률 결정기(830)에서는 클래스 분류를 통하여 전송률을 결정하며, 전송률에 따라 피치 지연 및 적응 코드북 변환기(840)와 여기 신호 변환기(860)로 전송한다. 피치 지연 및 적응 코드북 변환기(804)와 고정 코드북 변환기(805)의 구성 및 동작은 SMV에서 AMR 음성부호화기로의 피지 지연 및 적응 코드북 변환기(640)와 고정 코드북 변환기(650)와 유사하므로 명세서의 간략화를 위하여 중복 설명이 생략된다.The AMR parameter decoder 810 performs a parameter decoding process on the AMR encoded packet to select the parameters to be transformed in the inter-encoding process. Then, the LSP converter 820 converts the decoded signal into an LSP and delivers it to the SMV parameter encoder 870. The rate determiner 830 determines the rate through class classification, and transmits it to the pitch delay and the adaptive codebook converter 840 and the excitation signal converter 860 according to the rate. The configuration and operation of pitch delay and adaptive codebook converter 804 and fixed codebook converter 805 are similar to sebum delay from SMV to AMR speech coder and adaptive codebook converter 640 and fixed codebook converter 650, thus simplifying the specification. Duplicate description is omitted for the sake of brevity.

AMR에서 SMV 음성부호화기로의 상호부호화기는 AMR에서 복호화된 LSP를 가지고 직접적인 변환을 통하여 얻을 수 있으며, SMV의 모든 전송률에서 변환된다. 그러나 AMR과는 달리 SMV는 각 프레임마다 전송률과 타입을 결정하고 이에 따른 여기 신호 및 양자화 과정이 필요하다. 전송률과 타입을 구하기 위하여 AMR의 여기 신호에 관한 정보와 AMR 복호화 과정으로 복원된 음성 신호를 이용한다. Rate 1과 Rate 1/2는 피치 변환을 통해 얻어진 개회로 피치 지연을 바탕으로 SMV의 적응 코드북 검색 방식을 통하여 폐회로 피치 지연과 적응 코드북 이득을 구한 후 고정 코드북 검색을 수행한다. Rate 1/4과 Rate 1/8 일 때는 여기 신호 변환기(860)가 난수 발생기를 사용하여 여기 신호를 생성한다.The intercoder from AMR to SMV speech coder can be obtained by direct conversion with the LSP decoded in AMR and is converted at all transmission rates of SMV. Unlike AMR, however, SMV determines the data rate and type for each frame, and requires an excitation signal and a quantization process. In order to obtain the data rate and type, information on the excitation signal of the AMR and the speech signal reconstructed by the AMR decoding process are used. Rate 1 and Rate 1/2 perform fixed codebook search after obtaining the closed loop pitch delay and adaptive codebook gain through the adaptive codebook search method of SMV based on the open loop pitch delay obtained through pitch conversion. At rates 1/4 and Rate 1/8, the excitation signal converter 860 generates an excitation signal using a random number generator.

AMR과 SMV 음성부호화기에서 LSP 변환은 프레임 및 부프레임 크기가 동일하고, 부프레임 수도 같다. 그러므로, LSP 변환기(820)는 AMR에서 복호화된 4번째 부프레임을 다음 수학식 22와 같이 그대로 적용한다.In AMR and SMV speech encoders, LSP conversion has the same frame and subframe size and the same number of subframes. Therefore, the LSP converter 820 applies the fourth subframe decoded in the AMR as shown in Equation 22 below.

Figure pat00022
Figure pat00022

도 9는 도 7에 도시된 상호부호화 방법에 포함되는 전송률 결정 과정을 설명하기 위한 도면이다.FIG. 9 is a diagram for describing a rate determining process included in the mutual encoding method illustrated in FIG. 7.

SMV의 전송률을 결정하기 위해 AMR 패킷에서 CELP 파라미터(적응 코드북 이득, 고정 코드북 이득, NSR(Noise to Signal Ratio))와 AMR 패킷으로 복호화된 복원 음성신호를 이용한다. SMV에서는 묵음(Silence), 잡음(Noise-like), 무성음(Unvoiced), 변화(Onset), 비정상적인 유성음(Unstationary Voiced), 정상적인 유성음(Stationary Voiced)의 6종류로 분류하지만, 상호부호화기에서는 잡음을 제외한 5가지 프레임 클래스로 분류된다.In order to determine the transmission rate of the SMV, a reconstructed speech signal decoded into a CELP parameter (adaptive codebook gain, fixed codebook gain, noise to signal ratio (NSR)) and AMR packet is used in the AMR packet. In SMV, it is classified into six types of silence, noise-like, unvoiced, onset, abnormal voiced, normal voiced, but mutual encoder except noise. It is classified into five frame classes.

1차 분류 단계(901)에서는 AMR 패킷에서 필요한 정보(피치 지연, NSR, 적응 코드북 이득, 고정 코드북 이득)를 이용하여 음성(Speech)과 묵음을 1차 분류한다. 이때, 보통 무성음이나 묵음의 피치 지연이 큰 경향을 가지기 때문에 적절한 선형 과정을 거친 적응 코드북 이득과 고정 코드북 이득을 참고하여 잡음 대 신호비(NSR)가 일정 값 이상이거나, 피치 지연이 편차가 큰 경우 묵음으로 분류한다. 그 이유는 보통 무성음이나 묵음의 피치 지연이 큰 경향을 가지기 때문이다.In the primary classification step 901, speech and silence are first classified using information required in the AMR packet (pitch delay, NSR, adaptive codebook gain, fixed codebook gain). In this case, since the pitch delay of unvoiced or unvoiced sound tends to be large, the noise-to-signal ratio (NSR) is more than a predetermined value or the pitch delay is large by referring to the adaptive codebook gain and the fixed codebook gain which have been subjected to appropriate linear processes. Classify as silent. This is because the pitch delay of unvoiced or silent sounds tends to be large.

2차 분류 단계(902)에서는 음성 구간에서는 적응 코드북 이득의 크기를 이용하여 무성음과 유성음으로 분류한다.In the second classification step 902, the speech section is classified into an unvoiced sound and a voiced sound using the magnitude of the adaptive codebook gain.

3차 분류 단계(903)에서는 유성음 구간에서 지난 프레임의 프레임 클래스가 무성음인 경우는 변화(Onset)로 분류하고, 그렇지 않을 경우 유성음으로 분류한다.In the third classification step 903, when the frame class of the last frame in the voiced sound section is an unvoiced sound, it is classified as an onset. Otherwise, it is classified as a voiced sound.

4차 분류 단계(904)에서는 유성음은 적응 코드북 이득과 피치 지연의 변화에 의해 정상 상태의 유성음과 비정상 상태의 유성음으로 프레임 안에서 분류한다. 최종적으로 평균 전송률 대 음성 품질이 가장 좋은 것으로 클래스 분류를 결정한다.In the fourth classification step 904, the voiced sound is classified into the normal voiced sound and the abnormal voiced sound in the frame by the adaptive codebook gain and the pitch delay change. Finally, the class classification is determined as the best average transmission rate versus voice quality.

이와 같이 전송률과 클래스가 결정되면, SMV 개회로 피치 값은 AMR 패킷에서 복호화된 피치 지연으로 대치하고, 도 5에 도시된 방법과 비슷한 과정을 거친다. 즉, 직전의 과거 피치 지연 값과 비교를 통해 문턱값보다 작은 경우 개회로 분석을 생략하고 문턱값보다 큰 경우 좀 더 정확한 개회로 피치 지연 값을 얻기 위해 개회로 분석 과정이 수행된다. 결정된 개회로 피치 지연은 SMV의 폐회로 탐색에 이용된다.As such, when the transmission rate and the class are determined, the SMV open loop pitch value is replaced with the pitch delay decoded in the AMR packet, and is similar to the method shown in FIG. 5. In other words, the open circuit analysis process is omitted to obtain a more accurate open circuit pitch delay value when it is smaller than the threshold value when the value is smaller than the threshold value by comparing with the previous past pitch delay value. The determined open circuit pitch delay is used for the closed loop search of the SMV.

본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.Although the present invention has been described with reference to the embodiments shown in the drawings, this is merely exemplary, and it will be understood by those skilled in the art that various modifications and equivalent other embodiments are possible.

따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.Therefore, the true technical protection scope of the present invention will be defined by the technical spirit of the appended claims.

본 발명에 의하여, SMV와 AMR의 상호부호화기를 적용하여 서로 다른 통신망을 사용하는데 있어서 적은 계산량과 지연 시간으로 음질 성능을 유지할 수 있다.According to the present invention, it is possible to maintain the sound quality performance by using the SMV and AMR mutual encoder with a small amount of computation and delay time in using different communication networks.

100: SMV 음성부호화기
200: AMR 음성부호화기
400: SMV에서 AMR로의 LSP 변환
500: SMV에서 AMR로의 피치 지연 변환부
600: SMV에서 AMR로의 음성부호화기
610: SMV 파라미터 복호화기
620: LSP 변환기
640: 피치 지연 및 적응 코드북 변환기
650: 고정 코드북 변환기
660: AMR 파라미터 부호화기
800: AMR에서 SMV로의 상호부호화기
810: AMR 파라미터 복호화기
820: LSP 변환기
830: 전송률 결정기
840: 피치 지연 및 적응 코드북 변환기
850: 고정 코드북 검색기
860: 여기 신호 변환부
870: SMV 파라미터 부호화기
100: SMV voice encoder
200: AMR voice encoder
400: SMV to AMR LSP Conversion
500: pitch delay conversion unit from SMV to AMR
600: SMV to AMR Voice Encoder
610: SMV parameter decoder
620: LSP Converter
640: pitch delay and adaptive codebook converter
650: fixed codebook converter
660: AMR parameter encoder
800: AMR to SMV Encoder
810: AMR Parameter Decoder
820: LSP Converter
830: rate determiner
840: pitch delay and adaptive codebook converter
850: Fixed Codebook Finder
860: excitation signal converter
870: SMV parameter encoder

Claims (18)

SMV(Selectable Mode Vocoder) 음성 부호화 기법으로 부호화된 비트스트림을 AMR(Adaptive Multi-Rate) 음성 부호화 기법으로 부호화된 비트스트림으로 변환하기 위한 방법에 있어서,
SMV 음성 부호화 기법으로 부호화된 비트스트림을 복호화하여 SMV LSP(Line Spectral Pairs), SMV 피치 지연, 전송률(SMV rate), 적응 코드북 이득, 및 고정 코드북 이득을 포함하는 SMV 파라미터들을 생성하기 위한 SMV 파라미터 복호화 단계;
상기 SMV LSP를 AMR 음성 부호화 기법에서 이용될 AMR LSP로 변환하는 LSP 변환 단계;
상기 전송률이 1 또는 1/2인지 판단하고, 긍정일 경우 상기 SMV 피치 지연 및 상기 적응 코드북 이득을 각각 AMR 피치 지연 및 적응 코드북 이득으로 변환하고, 부정일 경우 AMR 피치 지연을 0으로 설정하는 피치 지연/적응 코드북 변환 단계;
SMV 적응 코드북 벡터 및 상기 적응 코드북 이득을 이용하여 SMV 고정 코드북 벡터를 AMR 고정 코드북 벡터로 변환하는 고정 코드북 변환 단계; 및
상기 AMR LSP, 상기 AMR 피치 지연, 상기 코드북 이득, 및 상기 AMR 고정 코드북 벡터를 포함하는 AMR 파라미터들을 이용하여 SMV 음성 부호화 기법으로 부호화된 비트스트림을 AMR 음성 부호화 기법으로 인코딩하는 AMR 파라미터 부호화 단계를 포함하는 것을 특징으로 하는 방법.
A method for converting a bitstream encoded by a Selectable Mode Vocoder (SMV) speech encoding technique into a bitstream encoded by an Adaptive Multi-Rate (AMR) speech encoding technique,
SMV parameter decoding for generating SMV parameters including SMV Line Spectral Pairs (SMV LSP), SMV pitch delay, SMV rate, adaptive codebook gain, and fixed codebook gain by decoding the bitstream encoded by the SMV speech coding technique. step;
An LSP conversion step of converting the SMV LSP into an AMR LSP to be used in an AMR speech coding technique;
Determine whether the transmission rate is 1 or 1/2, and if it is positive, convert the SMV pitch delay and the adaptive codebook gain into an AMR pitch delay and an adaptive codebook gain, respectively, and if negative, a pitch delay that sets the AMR pitch delay to zero. Adaptive codebook conversion step;
A fixed codebook conversion step of converting an SMV fixed codebook vector into an AMR fixed codebook vector using an SMV adaptive codebook vector and the adaptive codebook gain; And
AMR parameter encoding step of encoding a bitstream encoded by SMV speech coding using the AMR parameters including the AMR LSP, the AMR pitch delay, the codebook gain, and the AMR fixed codebook vector. Characterized in that.
제1항에 있어서, 상기 LSP 변환 단계는,
상기 복호화된 패킷 중 n번째 프레임의 네 번째 부프레임에 해당하는 SMV LSP를 그대로 AMR LSP의 n번째 프레임의 네 번째 부프레임으로서 이용하는 단계; 및
상기 SMV LSP 중 (n-1)번째 프레임 및 n번째 프레임 각각의 네 번째 부프레임에 해당하는 SMV LSP를 보간하여 AMR LSP의 n번째 프레임의 두 번째 부프레임에 해당하는 AMR LSP로서 이용하는 단계를 포함하는 것을 특징으로 하는 방법.
The method of claim 1, wherein the LSP conversion step,
Using the SMV LSP corresponding to the fourth subframe of the n th frame among the decoded packets as it is as the fourth subframe of the n th frame of the AMR LSP; And
Interpolating the SMV LSP corresponding to the (n-1) th frame and the fourth subframe of each of the nth frame of the SMV LSP and using the AMR LSP corresponding to the second subframe of the nth frame of the AMR LSP. Characterized in that.
제1항에 있어서, 상기 피치 지연/적응 코드북 변환 단계는 상기 전송률이 1 또는 1/2일 경우,
피치 지연의 개회로 피치 지연 과거값을 AMR의 피치 지연 PAMR로 예측하는 단계;
상기 PAMR 및 SMV의 폐회로 피치 지연 PSMV의 차이가 소정 문턱값보다 큰지 판단하고, 긍정일 경우 AMR의 피치 지연을 다시 검색하고, 부정일 경우 상기 폐회로 피치 지연 PSMV을 상기 피치 지연 PAMR로 설정하는 단계; 및
상기 피치 지연 PAMR을 이용하여 적응 코드북(Adaptive Code Book, ACB)을 검색하는 ACB 검색 단계를 포함하는 것을 특징으로 하는 방법.
The method of claim 1, wherein the pitch delay / adaptive codebook conversion step is performed when the transmission rate is 1 or 1/2,
Predicting the open loop pitch delay past value of the pitch delay by the pitch delay PAMR of the AMR;
Determining whether the difference between the closed loop pitch delay PSMV of the PAMR and SMV is greater than a predetermined threshold, retrieving the pitch delay of AMR if positive, and setting the closed loop pitch delay PSMV to the pitch delay PAMR if negative; And
And searching for an adaptive code book (ACB) using the pitch delay PAMR.
제1항에 있어서, 상기 고정 코드북 변환 단계는,
상기 SMV 적응 코드북 벡터 및 적응 코드북 이득으로부터 고정 코드북 검색을 위한 목적 신호를 생성하는 단계;
장구간 예측 잔여 신호 res LTP (n) 및 상기 목적 신호 및 임펄스 응답 간의 상관도 d(n)을 이용하여 레퍼런스 벡터 b(n)를 연산하는 단계;
상기 레퍼런스 벡터의 큰 값으로부터 선택하여 위치 검색을 위한 초기 펄스 배열을 추출하는 단계;
상기 목적 신호 및 임펄스 응답 간의 상관도 d(n) 및 임펄스 응답 간의 자기상관행렬 Φ(i,j)을 이용하여 상기 초기 펄스 배열들의 검색 기준 Q k 를 연산하는 단계;
상기 펄스 배열에 속하는 펄스들 중에서 인접한 두 트랙당 하나의 펄스를 제거하는 동작을 수행하여 두 개의 펄스를 제거하고, 제거된 펄스들을 반영하여 검색 기준 Q k 를 변경하며, 변경된 검색 기준 Q k 를 최대화하는 펄스를 제거된 펄스가 속해있는 트랙에서 선택하는 2펄스 재검색 단계; 및
상기 2펄스 재검색 단계에서 얻어진 펄스 배열로부터 한 개씩 펄스를 제거하면서 제거된 펄스들을 반영하여 검색 기준 Q k 를 변경하며, 변경된 검색 기준 Q k 를 최대화하는 펄스를 선택하는 단일 펄스 재검색 단계를 포함하는 것을 특징으로 하는 방법.
The method of claim 1, wherein the fixed codebook conversion step,
Generating an object signal for fixed codebook retrieval from the SMV adaptive codebook vector and adaptive codebook gain;
Calculating a reference vector b (n) using a long term prediction residual signal res LTP (n) and a correlation d (n) between the target signal and an impulse response;
Extracting an initial pulse array for position search by selecting from a large value of the reference vector;
Calculating a search criterion Q k of the initial pulse arrays using the correlation d (n) between the target signal and the impulse response and the autocorrelation matrix Φ ( i , j ) between the impulse response;
The operation of removing one pulse per two adjacent tracks among the pulses belonging to the pulse array is performed to remove two pulses, change the search criteria Q k to reflect the removed pulses, and maximize the changed search criteria Q k . A two-pulse rescan step of selecting a pulse from the track to which the removed pulse belongs; And
And a single pulse rescan step of changing a search criterion Q k by reflecting the removed pulses while removing pulses one by one from the pulse array obtained in the two pulse rescan step, and selecting a pulse that maximizes the changed search criterion Q k . How to feature.
제4항에 있어서, 상기 2펄스 재검색 단계는,
상기 목적 신호 및 임펄스 응답 간의 상관도 d(n) 및 상기 임펄스 응답 간의 자기상관행렬 Φ(i,j)은 사전 선택된 부호를 포함하도록 수정하여 검색을 단순화하는 단계를 더 포함하는 것을 특징으로 하는 방법.
The method of claim 4, wherein the two-pulse rescan step,
The correlation d (n) between the target signal and the impulse response and the autocorrelation matrix Φ ( i , j ) between the impulse response further comprises modifying to include a preselected code to simplify the search. .
AMR 음성 부호화 기법으로 부호화된 비트스트림을 SMV 음성 부호화 기법으로 부호화된 비트스트림으로 변환하기 위한 방법에 있어서,
AMR 음성 부호화 기법으로 부호화된 비트스트림을 복호화하여 AMR LSP, AMR 피치 지연, 적응 코드북 이득, 및 고정 코드북 이득을 포함하는 AMR 파라미터들을 생성하기 위한 AMR 파라미터 복호화 단계;
상기 AMR LSP를 SMV 음성 부호화 기법에서 이용될 SMV LSP로 변환하는 LSP 변환 단계;
상기 적응 코드북 이득, 고정 코드북 이득, 잡음-신호비(Noise to Signal Ratio, NSR), 및 상기 AMR 파라미터 복호화 단계에서 복원된 음성 신호를 이용하여 SMV 부호화에 이용될 전송률이 1, 1/2, 1/4 및 1/8 중 어느 것인지 결정하는 전송률 결정 단계;
상기 전송률이 1/4 또는 1/8이면, 난수 발생기를 이용하여 여기 신호(excitation signal)를 생성하는 단계;
상기 전송률이 1 또는 1/2이면, 상기 AMR 피치 지연 및 적응 코드북 이득을 각각 SMV 피치 지연 및 적응 코드북 이득으로 변환하는 피치 지연/적응 코드북 변환 동작 및 AMR 적응 코드북 벡터 및 상기 적응 코드북 이득을 이용하여 AMR 고정 코드북 벡터를 SMV 고정 코드북 벡터로 변환하는 고정 코드북 변환 동작을 수행하는 단계; 및
상기 SMV LSP, 상기 SMV 피치 지연, 상기 코드북 이득, 및 상기 SMV 고정 코드북 벡터를 포함하는 SMV 파라미터들을 이용하여 AMR 음성 부호화 기법으로 부호화된 비트스트림을 SMV 음성 부호화 기법으로 인코딩하는 SMV 파라미터 부호화 단계를 포함하는 것을 특징으로 하는 방법.
A method for converting a bitstream encoded by AMR speech encoding into a bitstream encoded by SMV speech encoding,
An AMR parameter decoding step of decoding the bitstream encoded by the AMR speech coding technique to generate AMR parameters including AMR LSP, AMR pitch delay, adaptive codebook gain, and fixed codebook gain;
An LSP conversion step of converting the AMR LSP into an SMV LSP to be used in an SMV speech coding technique;
By using the adaptive codebook gain, the fixed codebook gain, the noise to signal ratio (NSR), and the speech signal reconstructed in the AMR parameter decoding step, the transmission rate to be used for SMV encoding is 1, 1/2, 1 A rate determining step of determining which of / 4 and 1/8;
Generating an excitation signal using a random number generator when the data rate is 1/4 or 1/8;
If the transmission rate is 1 or 1/2, using the pitch delay / adaptive codebook transform operation of converting the AMR pitch delay and the adaptive codebook gain into the SMV pitch delay and the adaptive codebook gain, and the AMR adaptive codebook vector and the adaptive codebook gain, respectively, Performing a fixed codebook transform operation for converting the AMR fixed codebook vector to an SMV fixed codebook vector; And
A SMV parameter encoding step of encoding a bitstream encoded by an AMR speech encoding scheme using an SMV speech encoding scheme using SMV parameters including the SMV LSP, the SMV pitch delay, the codebook gain, and the SMV fixed codebook vector. Characterized in that.
제6항에 있어서, 상기 LSP 변환 단계는,
상기 복호화된 패킷 중 n번째 프레임의 네 번째 부프레임에 해당하는 AMR LSP를 그대로 SMV LSP의 n번째 프레임의 네 번째 부프레임으로서 이용하는 단계를 포함하는 것을 특징으로 하는 방법.
The method of claim 6, wherein the LSP conversion step,
And using the AMR LSP corresponding to the fourth subframe of the nth frame among the decoded packets as it is as the fourth subframe of the nth frame of the SMV LSP.
제6항에 있어서, 상기 전송률 결정 단계는,
상기 적응 코드북 이득과 상기 고정 코드북 이득을 참고하여 현재 프레임의 잡음 대 신호비(NSR)가 소정 문턱값 이상이거나, AMR 피치 지연의 편차가 크다면 묵음으로 분류하는 제1 분류 단계;
묵음이 아닌 현재 프레임을 적응 코드북 이득의 크기를 이용하여 무성음과 유성음을 분류하는 제2 분류 단계;
유성음으로 분류된 프레임의 과거 프레임의 클래스가 무성음이었는지 여부에 따라 변화 여부를 판단하는 제3 분류 단계;
변화가 일어나지 않은 프레임의 경우 상기 적응 코드북 이득 및 상기 피치 지연의 변화에 따라 정상 상태인지 비정상상태인지 여부를 판단하는 제4 분류 단계; 및
상기 분류 단계들의 분류 결과에 따라 차등적으로 상기 프레임의 전송률을 선택하는 단계를 포함하는 것을 특징으로 하는 방법.
The method of claim 6, wherein the rate determination step,
A first classification step of classifying as silence if the noise-to-signal ratio (NSR) of the current frame is greater than or equal to a predetermined threshold or the deviation of the AMR pitch delay is large by referring to the adaptive codebook gain and the fixed codebook gain;
A second classification step of classifying the unvoiced and the voiced sound using the magnitude of the adaptive codebook gain for the current frame that is not silence;
A third classification step of determining whether the class of the previous frame of the frame classified as the voiced sound is unvoiced;
A fourth classification step of determining whether the frame is in a normal state or an abnormal state according to the change of the adaptive codebook gain and the pitch delay in the case where the frame does not change; And
And selecting a transmission rate of the frame differentially according to a classification result of the classification steps.
제6항에 있어서, 상기 피치 지연/적응 코드북 변환 동작은,
피치 지연의 개회로 피치 지연 과거값을 SMV 피치 지연으로 예측하는 단계;
상기 SMV 피치 지연 및 AMR의 폐회로 피치 지연의 차이가 소정 문턱값보다 큰지 판단하고, 긍정일 경우 SMV의 피치 지연을 다시 검색하고, 부정일 경우 상기 폐회로 피치 지연을 상기 피치 지연으로 설정하는 단계; 및
상기 피치 지연을 이용하여 적응 코드북을 검색하는 ACB 검색 단계를 포함하는 것을 특징으로 하는 방법.
The method of claim 6, wherein the pitch delay / adaptive codebook conversion operation is performed by:
Predicting the open loop pitch delay past value of the pitch delay as the SMV pitch delay;
Determining whether the difference between the SMV pitch delay and the closed loop pitch delay of the AMR is greater than a predetermined threshold, retrieving the pitch delay of the SMV if positive, and setting the closed loop pitch delay to the pitch delay if negative; And
And searching for an adaptive codebook using the pitch delay.
SMV 음성 부호화 기법으로 부호화된 비트스트림을 AMR 음성 부호화 기법으로 부호화된 비트스트림으로 변환하기 위한 장치에 있어서,
컴퓨터에 의하여 실행될 수 있는 명령들을 실행하기 위한 프로세서; 및
상기 프로세서에 연결되며, 상기 컴퓨터에 의하여 실행될 수 있는 명령들을 저장하기 위한 메모리를 포함하며, 상기 컴퓨터에 의하여 실행될 수 있는 명령들은,
SMV 음성 부호화 기법으로 부호화된 비트스트림을 복호화하여 SMV LSP, SMV 피치 지연, 전송률, 적응 코드북 이득, 및 고정 코드북 이득을 포함하는 SMV 파라미터들을 생성하기 위한 SMV 파라미터 복호화 동작;
상기 SMV LSP를 AMR 음성 부호화 기법에서 이용될 AMR LSP로 변환하는 LSP 변환 동작;
상기 전송률이 1 또는 1/2인지 판단하고, 긍정일 경우 상기 SMV 피치 지연 및 상기 적응 코드북 이득을 각각 AMR 피치 지연 및 적응 코드북 이득으로 변환하고, 부정일 경우 AMR 피치 지연을 0으로 설정하는 피치 지연/적응 코드북 변환 동작;
SMV 적응 코드북 벡터 및 상기 적응 코드북 이득을 이용하여 SMV 고정 코드북 벡터를 AMR 고정 코드북 벡터로 변환하는 고정 코드북 변환 동작; 및
상기 AMR LSP, 상기 AMR 피치 지연, 상기 코드북 이득, 및 상기 AMR 고정 코드북 벡터를 포함하는 AMR 파라미터들을 이용하여 SMV 음성 부호화 기법으로 부호화된 비트스트림을 AMR 음성 부호화 기법으로 인코딩하는 AMR 파라미터 부호화 동작을 수행하도록 적응되는 것을 특징으로 하는 장치.
An apparatus for converting a bitstream encoded by the SMV speech encoding technique into a bitstream encoded by the AMR speech encoding technique,
A processor for executing instructions executable by a computer; And
Instructions coupled to the processor, including a memory for storing instructions executable by the computer, the instructions executable by the computer,
An SMV parameter decoding operation for decoding the bitstream encoded by the SMV speech coding technique to generate SMV parameters including an SMV LSP, an SMV pitch delay, a transmission rate, an adaptive codebook gain, and a fixed codebook gain;
An LSP conversion operation of converting the SMV LSP into an AMR LSP to be used in an AMR speech coding technique;
Determine whether the transmission rate is 1 or 1/2, and if it is positive, convert the SMV pitch delay and the adaptive codebook gain into an AMR pitch delay and an adaptive codebook gain, respectively, and if negative, a pitch delay that sets the AMR pitch delay to zero. Adaptive codebook conversion operation;
A fixed codebook transform operation of converting an SMV fixed codebook vector into an AMR fixed codebook vector using an SMV adaptive codebook vector and the adaptive codebook gain; And
Perform an AMR parameter encoding operation of encoding a bitstream encoded by an SMV speech encoding technique using AMR parameters including the AMR LSP, the AMR pitch delay, the codebook gain, and the AMR fixed codebook vector; Apparatus characterized in that it is adapted to.
제10항에 있어서, 상기 LSP 변환 동작은,
상기 복호화된 패킷 중 n번째 프레임의 네 번째 부프레임에 해당하는 SMV LSP를 그대로 AMR LSP의 n번째 프레임의 네 번째 부프레임으로서 이용하는 동작; 및
상기 SMV LSP 중 (n-1)번째 프레임 및 n번째 프레임 각각의 네 번째 부프레임에 해당하는 SMV LSP를 보간하여 AMR LSP의 n번째 프레임의 두 번째 부프레임에 해당하는 AMR LSP로서 이용하는 동작을 포함하는 것을 특징으로 하는 장치.
The method of claim 10, wherein the LSP conversion operation,
Using the SMV LSP corresponding to the fourth subframe of the nth frame among the decoded packets as it is as the fourth subframe of the nth frame of the AMR LSP; And
Interpolating the SMV LSP corresponding to the (n-1) th frame and the fourth subframe of each of the nth frame of the SMV LSP and using the AMR LSP corresponding to the second subframe of the nth frame of the AMR LSP. Device characterized in that.
제10항에 있어서, 상기 피치 지연/적응 코드북 변환 동작은 상기 전송률이 1 또는 1/2일 경우,
피치 지연의 개회로 피치 지연 과거값을 AMR의 피치 지연 PAMR로 예측하는 동작;
상기 PAMR 및 SMV의 폐회로 피치 지연 PSMV의 차이가 소정 문턱값보다 큰지 판단하고, 긍정일 경우 AMR의 피치 지연을 다시 검색하고, 부정일 경우 상기 폐회로 피치 지연 PSMV을 상기 피치 지연 PAMR로 설정하는 동작; 및
상기 피치 지연 PAMR을 이용하여 적응 코드북을 검색하는 ACB 검색 동작을 포함하는 것을 특징으로 하는 장치.
The method of claim 10, wherein the pitch delay / adaptive codebook conversion operation is performed when the transmission rate is 1 or 1/2,
Predicting the open loop pitch delay past value of the pitch delay by the pitch delay PAMR of the AMR;
Determining whether the difference between the closed loop pitch delay PSMV of the PAMR and the SMV is greater than a predetermined threshold, retrieving the pitch delay of the AMR if positive, and setting the closed loop pitch delay PSMV to the pitch delay PAMR if negative; And
And an ACB search operation for searching an adaptive codebook using the pitch delay PAMR.
제10항에 있어서, 상기 고정 코드북 변환 동작은,
상기 SMV 적응 코드북 벡터 및 적응 코드북 이득으로부터 고정 코드북 검색을 위한 목적 신호를 생성하는 동작;
장구간 예측 잔여 신호 res LTP (n) 및 상기 목적 신호 및 임펄스 응답 간의 상관도 d(n)을 이용하여 레퍼런스 벡터 b(n)를 연산하는 동작;
상기 레퍼런스 벡터의 큰 값으로부터 선택하여 위치 검색을 위한 초기 펄스 배열을 추출하는 동작;
상기 목적 신호 및 임펄스 응답 간의 상관도 d(n) 및 임펄스 응답 간의 자기상관행렬 Φ(i,j)을 이용하여 상기 초기 펄스 배열들의 검색 기준 Q k 를 연산하는 동작;
상기 펄스 배열에 속하는 펄스들 중에서 인접한 두 트랙당 하나의 펄스를 제거하는 동작을 수행하여 두 개의 펄스를 제거하고, 제거된 펄스들을 반영하여 검색 기준 Q k 를 변경하며, 변경된 검색 기준 Q k 를 최대화하는 펄스를 제거된 펄스가 속해있는 트랙에서 선택하는 2펄스 재검색 동작; 및
상기 2펄스 재검색 동작에서 얻어진 펄스 배열로부터 한 개씩 펄스를 제거하면서 제거된 펄스들을 반영하여 검색 기준 Q k 를 변경하며, 변경된 검색 기준 Q k 를 최대화하는 펄스를 선택하는 단일 펄스 재검색 동작을 포함하는 것을 특징으로 하는 장치.
The method of claim 10, wherein the fixed codebook conversion operation,
Generating an object signal for fixed codebook retrieval from the SMV adaptive codebook vector and the adaptive codebook gain;
Calculating a reference vector b (n) using a long term prediction residual signal res LTP (n) and a correlation d (n) between the target signal and an impulse response;
Extracting an initial pulse array for position search by selecting from a large value of the reference vector;
Calculating a search criterion Q k of the initial pulse arrays using the correlation d (n) between the target signal and the impulse response and the autocorrelation matrix Φ ( i , j ) between the impulse response;
The operation of removing one pulse per two adjacent tracks among the pulses belonging to the pulse array is performed to remove two pulses, change the search criteria Q k to reflect the removed pulses, and maximize the changed search criteria Q k . A two-pulse rescan operation for selecting a pulse from the track to which the removed pulse belongs; And
And a single pulse rescan operation to change the search criterion Q k by reflecting the removed pulses while removing pulses one by one from the pulse array obtained in the two-pulse rescan operation, and selecting a pulse that maximizes the changed search criterion Q k . Characterized in that the device.
제13항에 있어서, 상기 2펄스 재검색 동작은,
상기 목적 신호 및 임펄스 응답 간의 상관도 d(n) 및 상기 임펄스 응답 간의 자기상관행렬 Φ(i,j)은 사전 선택된 부호를 포함하도록 수정하여 검색을 단순화하는 동작을 더 포함하는 것을 특징으로 하는 장치.
The method of claim 13, wherein the two-pulse rescan operation,
The correlation d (n) between the target signal and the impulse response and the autocorrelation matrix Φ ( i , j ) between the impulse response further comprises modifying to include a preselected code to simplify the search. .
AMR 음성 부호화 기법으로 부호화된 비트스트림을 SMV 음성 부호화 기법으로 부호화된 비트스트림으로 변환하기 위한 장치에 있어서,
컴퓨터에 의하여 실행될 수 있는 명령들을 실행하기 위한 프로세서; 및
상기 프로세서에 연결되며, 상기 컴퓨터에 의하여 실행될 수 있는 명령들을 저장하기 위한 메모리를 포함하며, 상기 컴퓨터에 의하여 실행될 수 있는 명령들은,
AMR 음성 부호화 기법으로 부호화된 비트스트림을 복호화하여 AMR LSP, AMR 피치 지연, 적응 코드북 이득, 및 고정 코드북 이득을 포함하는 AMR 파라미터들을 생성하기 위한 AMR 파라미터 복호화 동작;
상기 AMR LSP를 SMV 음성 부호화 기법에서 이용될 SMV LSP로 변환하는 LSP 변환 동작;
상기 적응 코드북 이득, 고정 코드북 이득, 잡음-신호비(NSR), 및 상기 AMR 파라미터 복호화 동작에서 복원된 음성 신호를 이용하여 SMV 부호화에 이용될 전송률이 1, 1/2, 1/4 및 1/8 중 어느 것인지 결정하는 전송률 결정 동작;
상기 전송률이 1/4 또는 1/8이면, 난수 발생기를 이용하여 여기 신호를 생성하는 동작;
상기 전송률이 1 또는 1/2이면, 상기 AMR 피치 지연 및 적응 코드북 이득을 각각 SMV 피치 지연 및 적응 코드북 이득으로 변환하는 피치 지연/적응 코드북 변환 작업 및 AMR 적응 코드북 벡터 및 상기 적응 코드북 이득을 이용하여 AMR 고정 코드북 벡터를 SMV 고정 코드북 벡터로 변환하는 고정 코드북 변환 작업을 수행하는 동작; 및
상기 SMV LSP, 상기 SMV 피치 지연, 상기 코드북 이득, 및 상기 SMV 고정 코드북 벡터를 포함하는 SMV 파라미터들을 이용하여 AMR 음성 부호화 기법로 부호화된 비트스트림을 SMV 음성 부호화 기법으로 인코딩하는 SMV 파라미터 부호화 동작을 수행하도록 적응되는 것을 특징으로 하는 장치.
An apparatus for converting a bitstream encoded by AMR speech encoding into a bitstream encoded by SMV speech encoding,
A processor for executing instructions executable by a computer; And
Instructions coupled to the processor, including a memory for storing instructions executable by the computer, the instructions executable by the computer,
An AMR parameter decoding operation for decoding the bitstream encoded by the AMR speech coding technique to generate AMR parameters including AMR LSP, AMR pitch delay, adaptive codebook gain, and fixed codebook gain;
An LSP conversion operation of converting the AMR LSP into an SMV LSP to be used in an SMV speech coding technique;
By using the adaptive codebook gain, the fixed codebook gain, the noise-to-signal ratio (NSR), and the speech signal reconstructed in the AMR parameter decoding operation, the transmission rates to be used for SMV encoding are 1, 1/2, 1/4, and 1 /. A rate determining operation of determining which of eight;
Generating an excitation signal using a random number generator when the data rate is 1/4 or 1/8;
When the transmission rate is 1 or 1/2, using a pitch delay / adaptive codebook conversion operation and an AMR adaptive codebook vector and the adaptive codebook gain, which convert the AMR pitch delay and adaptive codebook gains into SMV pitch delay and adaptive codebook gains, respectively. Performing a fixed codebook conversion operation of converting the AMR fixed codebook vector into an SMV fixed codebook vector; And
Performing an SMV parameter encoding operation for encoding a bitstream encoded by an AMR speech encoding scheme using an SMV speech encoding scheme using SMV parameters including the SMV LSP, the SMV pitch delay, the codebook gain, and the SMV fixed codebook vector Apparatus characterized in that it is adapted to.
제15항에 있어서, 상기 LSP 변환 동작은,
상기 복호화된 패킷 중 n번째 프레임의 네 번째 부프레임에 해당하는 AMR LSP를 그대로 SMV LSP의 n번째 프레임의 네 번째 부프레임으로서 이용하는 동작을 포함하는 것을 특징으로 하는 장치.
The method of claim 15, wherein the LSP conversion operation,
And using the AMR LSP corresponding to the fourth subframe of the nth frame among the decoded packets as it is as the fourth subframe of the nth frame of the SMV LSP.
제15항에 있어서, 상기 전송률 결정 동작은,
상기 적응 코드북 이득과 상기 고정 코드북 이득을 참고하여 현재 프레임의 잡음 대 신호비(NSR)가 소정 문턱값 이상이거나, AMR 피치 지연의 편차가 크다면 묵음으로 분류하는 제1 분류 동작;
묵음이 아닌 현재 프레임을 적응 코드북 이득의 크기를 이용하여 무성음과 유성음을 분류하는 제2 분류 동작;
유성음으로 분류된 프레임의 과거 프레임의 클래스가 무성음이었는지 여부에 따라 변화 여부를 판단하는 제3 분류 동작;
변화가 일어나지 않은 프레임의 경우 상기 적응 코드북 이득 및 상기 피치 지연의 변화에 따라 정상 상태인지 비정상상태인지 여부를 판단하는 제4 분류 동작; 및
상기 분류 동작들의 분류 결과에 따라 차등적으로 상기 프레임의 전송률을 선택하는 동작을 포함하는 것을 특징으로 하는 장치.
The method of claim 15, wherein the rate determining operation,
A first classification operation of classifying as silence if the noise-to-signal ratio (NSR) of the current frame is greater than or equal to a predetermined threshold or the deviation of the AMR pitch delay is large with reference to the adaptive codebook gain and the fixed codebook gain;
A second classification operation of classifying the unvoiced and the voiced sound using the magnitude of the adaptive codebook gain for the current frame that is not silent;
A third classification operation of determining whether the class of the previous frame of the frame classified as the voiced sound is unvoiced;
A fourth classification operation of determining whether the frame is in a normal state or an abnormal state according to the change of the adaptive codebook gain and the pitch delay in the case of a frame in which no change occurs; And
And selecting a transmission rate of the frame differentially according to a classification result of the classification operations.
제15항에 있어서, 상기 피치 지연/적응 코드북 변환 작업은,
피치 지연의 개회로 피치 지연 과거값을 SMV 피치 지연으로 예측하는 동작;
상기 SMV 피치 지연 및 AMR의 폐회로 피치 지연의 차이가 소정 문턱값보다 큰지 판단하고, 긍정일 경우 SMV의 피치 지연을 다시 검색하고, 부정일 경우 상기 폐회로 피치 지연을 상기 피치 지연으로 설정하는 동작; 및
상기 피치 지연을 이용하여 적응 코드북을 검색하는 ACB 검색 동작을 포함하는 것을 특징으로 하는 장치.
The method of claim 15, wherein the pitch delay / adaptive codebook conversion operation,
Predicting the open loop pitch delay past value of the pitch delay as the SMV pitch delay;
Determining whether the difference between the SMV pitch delay and the closed loop pitch delay of the AMR is greater than a predetermined threshold, retrieving the pitch delay of the SMV if positive, and setting the closed loop pitch delay to the pitch delay if negative; And
And an ACB search operation for searching for an adaptive codebook using the pitch delay.
KR1020100006314A 2010-01-25 2010-01-25 Transcoding method and transcoding apparatus for smv and amr speech coding schemes KR20110086919A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100006314A KR20110086919A (en) 2010-01-25 2010-01-25 Transcoding method and transcoding apparatus for smv and amr speech coding schemes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100006314A KR20110086919A (en) 2010-01-25 2010-01-25 Transcoding method and transcoding apparatus for smv and amr speech coding schemes

Publications (1)

Publication Number Publication Date
KR20110086919A true KR20110086919A (en) 2011-08-02

Family

ID=44925835

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100006314A KR20110086919A (en) 2010-01-25 2010-01-25 Transcoding method and transcoding apparatus for smv and amr speech coding schemes

Country Status (1)

Country Link
KR (1) KR20110086919A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013062370A1 (en) * 2011-10-28 2013-05-02 한국전자통신연구원 Signal codec device and method in communication system
US9704501B2 (en) 2011-10-28 2017-07-11 Electronics And Telecommunications Research Institute Signal codec device and method in communication system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013062370A1 (en) * 2011-10-28 2013-05-02 한국전자통신연구원 Signal codec device and method in communication system
US9704501B2 (en) 2011-10-28 2017-07-11 Electronics And Telecommunications Research Institute Signal codec device and method in communication system
US10199050B2 (en) 2011-10-28 2019-02-05 Electronics And Telecommunications Research Institute Signal codec device and method in communication system
US10607624B2 (en) 2011-10-28 2020-03-31 Electronics And Telecommunications Research Institute Signal codec device and method in communication system

Similar Documents

Publication Publication Date Title
US8346544B2 (en) Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision
US7433815B2 (en) Method and apparatus for voice transcoding between variable rate coders
JP5373217B2 (en) Variable rate speech coding
EP2176860B1 (en) Processing of frames of an audio signal
DK2102619T3 (en) METHOD AND DEVICE FOR CODING TRANSITION FRAMEWORK IN SPEECH SIGNALS
US7877253B2 (en) Systems, methods, and apparatus for frame erasure recovery
US9418666B2 (en) Method and apparatus for encoding and decoding audio/speech signal
US8090573B2 (en) Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision
JP4907826B2 (en) Closed-loop multimode mixed-domain linear predictive speech coder
JP4270866B2 (en) High performance low bit rate coding method and apparatus for non-speech speech
US20050261897A1 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
JP2007538282A (en) Audio encoding with various encoding frame lengths
CN101180676A (en) Methods and apparatus for quantization of spectral envelope representation
KR20020052191A (en) Variable bit-rate celp coding of speech with phonetic classification
KR20070112832A (en) Time warping frames inside the vocoder by modifying the residual
JP6174266B2 (en) Blind bandwidth extension system and method
KR20220058657A (en) Method and apparatus for quantizing linear predictive coding coefficients and method and apparatus for dequantizing linear predictive coding coefficients
KR20230129581A (en) Improved frame loss correction with voice information
KR20110086919A (en) Transcoding method and transcoding apparatus for smv and amr speech coding schemes
KR100711040B1 (en) Method and apparatus for tracking the phase of a quasi-periodic signal
US8762136B2 (en) System and method of speech compression using an inter frame parameter correlation
Eksler et al. Efficient handling of mode switching and speech transitions in the EVS codec
KR100757366B1 (en) Device for coding/decoding voice using zinc function and method for extracting prototype of the same
JP2011090311A (en) Linear prediction voice coder in mixed domain of multimode of closed loop
Lin et al. AN EFFICIENT TRANSCODING SCHEME FOR G. 729 AND G. 723.1 SPEECH CODECS: INTEROPERABILITY OVER THE INTERNET

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application