KR20030025092A - 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 - Google Patents
음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 Download PDFInfo
- Publication number
- KR20030025092A KR20030025092A KR1020010058029A KR20010058029A KR20030025092A KR 20030025092 A KR20030025092 A KR 20030025092A KR 1020010058029 A KR1020010058029 A KR 1020010058029A KR 20010058029 A KR20010058029 A KR 20010058029A KR 20030025092 A KR20030025092 A KR 20030025092A
- Authority
- KR
- South Korea
- Prior art keywords
- lsp
- encoder
- parameter
- packet
- lsp parameter
- Prior art date
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000001228 spectrum Methods 0.000 title abstract description 4
- 238000013139 quantization Methods 0.000 claims description 25
- 238000012856 packing Methods 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 14
- 238000009499 grossing Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/54—Store-and-forward switching systems
- H04L12/56—Packet switching systems
- H04L12/5601—Transfer mode dependent, e.g. ATM
- H04L2012/5603—Access techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 통신 시스템 상호간의 음성패킷 변환장치는, 네트워크를 통해 송수신되는 음성패킷을 상호 변환하는 음성패킷 장치에 있어, 타 부호화기로 부호화된 패킷을 비트 언패킹하고 역양자화하여 타 부호화기의 LSP 파라미터를 얻고, 이를 이용하여 G.723.1 부호화기의 LSP 파라미터로 직접 변환한 후 양자화하여 비트 언패킹하는 제 1트랜스 코더와; G.723.1 부호화기로부터 부호화된 패킷을 비트 언 패킹 및 역양자화하여 G.723.1 부호화기의 LSP 파라미터를 얻고 이를 이용하여 상기 G.723.1 부호화기의 LSP 파라미터를 목적하는 타 부호화기의 패킷으로 직접 변환한 후 양자화하여 비트 언패킹하는 제 2트랜스 코더를 포함하는 것을 특징으로 한다.
이 같은 본 발명에 의하면, G.723.1과 타 부호화기의 상호 부호화시의 LSP 변환시, 부호화된 패킷으로부터 LSP 정보를 직접 추출하고 512를 곱하거나 나누어서 수신측 코덱의 LSP 파라미터로 변환할 수 있도록 함에 있다.
Description
본 발명은 통신 시스템 상호간의 음성패킷 변환장치에 있어서, 특히 서로 다른 음성 부호하기를 사용하는 통신 시스템 상호간에 서로 다른 형태의 음성패킷을 서로 대응하는 LSP 파라미터를 상호 변환하여 원하는 음성패킷을 출력할 수 있도록 한 음성패킷 변환을 위한 LSP 파라미터 변환장치 및 방법에 관한 것이다.
상세하게는, 서로 다른 부호화기를 사용하는 통신 시스템에서, 전송측 부호화기로부터 부호화된 패킷으로부터 LSP 정보를 직접 추출하고, 프레임 보간으로 수신측 부호화기의 프레임 LSP 파라미터로 변환한 후, 양자화하고 비트패킹함으로써,원하는 음성패킷으로 변환할 수 있도록 한 음성패킷 변환을 위한 LSP 파라미터 변환장치 및 방법에 관한 것이다.
보다 상세하게는, G.723.1부호화기와 이종 부호화기 상호간의 패킷 변환을 LSP 파라미터에 512를 곱하거나 나눔으로써, 음성 파라미터를 변환할 수 있도록 한 음성패킷 변환을 위한 LSP 파라미터 변환장치 및 방법에 관한 것이다.
정보 및 통신 문화가 급속하게 발전함에 따라 의사 전달의 중요한 수단인 음성 처리에 관한 연구가 활발히 진행되고 있다. 음성 처리에 관한 연구는 크게 음성 부호화, 음성 인식, 음성 변환으로 나눌 수 있다. 이 중, 음성 부호화는 최근의 멀티 미디어 환경에서 크게 부각되는 기술 분야 중 하나이다.
이러한 멀티미디어와 이동 통신의 발달로 인해 특정 집단이나 개인에게 제공되었던 서비스들이 이제는 다수의 대중에게도 제공되었고 그 숫자 역시 기하 급수적으로 늘어나게 되었다. 그로 인해 지금까지 적용되어왔던 전송률로는 사용자 집단의 숫자를 충족시킬 수 없게 되었고 전송률을 저하시켜 동일 채널 상에 사용자 수를 증가시킬 경우에 음질 열화문제가 발생하게 된다. 이와 같은 배경하에서 음성 부호화기, 즉 보코더(Vocoder : coder/decoder)의 개발이 이루어지게 된 것이다.
현재 보편화되고 있는 이동통신 망과 데이터 망을 이용한 음성 통신 서비스에서는 목적과 용도에 따라서 서로 다른 종류의 음성 부호화기가 사용되고 있다. 이동통신 시스템에서는 QCELP, QCELP, EVRC, GSM-EFR, GSM-AMR 등이 사용되고 있으며, 데이터 망을 이용한 통신에서는 G.723, G.729 등이 사용되고 있으며, PSTN 에서는 G.726이 사용되고 있다.
따라서, 서로 다른 종류의 음성 부호화기를 사용하는 통신 시스템들 간에는 서로 다른 형태의 음성패킷을 변환해 주는 장치가 필요하다. 이러한 미디어 변환은 미디어 게이트웨이(media gateway)에서 이루어진다.
도 1은 일반적인 유무선 통신망 구성도이다.
도 1을 참조하면, 서로 다른 네트워크(Mobile Network, PSTN, IP Network)(104,105,106)를 통해서 서로 다른 음성 부호화기(EVRC/AMR, G.711, G.723.1/G.729)(101,102,103)로부터 전달되는 음성패킷을 미디어 게이트웨이(Midea gateway, 이하 "패킷 변환부"로 함)(107)에서 목적 부호화기로의 음성패킷으로 변화해 주는 기능을 수행하게 된다.
이러한 유무선 통신망에서 사용하고 있는 표준 음성부호화기들은 기본 구조로 도 2와 같은 CELP(Code Excited Linear Prediction) 형태의 부호화 방식을 사용하고 있으며, 세부 구현에 있어서, 다소 차이를 갖고 있다. CELP 부호화기는 음성신호의 특징 파라미터를 추출하는 구조로 되어 있다.
도 3은 종래 일반적인 음성 부호화기의 패킷 변환장치를 나타낸 구성도이다.
음성 신호를 음성패킷 A로 엔코딩하는 제 1엔코더(Encoder A, 111) 및 음성패킷 A를 음성신호로 디코딩하는 제 1디코더(Decoder A, 112)로 구성된 제 1음성 부호화기(110)와, 서로 다른 부호화기로 패킷을 전달해 주는 네트워크(120,140)와, 음성 신호를 음성패킷 B로 엔코딩하는 제 2엔코더(Encoder B, 151) 및 음성패킷 B를 음성신호로 디코딩하는 제 2디코더(Decoder B, 152)로 구성된 제 2음성 부호화기(150)와, 제 1음성부호화기(110)와 제 2음성부호화기(150) 상호간에 전달되는 패킷을 원하는 패킷으로 상호 변환해 주는 패킷 변환부(130)로 구성된다.
상기 패킷 변환부(130)는 음성패킷 A를 동일 코딩방식으로 디코딩하는 제 3디코더(Encoder A, 131)와, 제 3디코더(131)의 디코딩된 음성신호를 수신지 코딩방식으로 엔코딩하여 패킷 B를 출력하는 제 3엔코더(Encoder B, 132)와, 음성패킷 B를 동일 코딩방식으로 엔코딩하는 제 4디코더(Decoder B, 133)와, 제 4디코더(133)로부터 엔코딩된 음성신호를 수신지 코딩방식으로 엔코딩하여 패킷 A를 출력하는 제 4엔코더(Encoder A, 134)로 구성된다.
이러한 통신 시스템 상호간의 패킷 변환장치에 대하여 도 3을 참조하여 설명하면 다음과 같다.
제 1음성 부호화기(110)로 입력되는 음성 신호(PCM)는 제 1엔코더(Encoder A, 111)의 엔코딩에 의해 음성패킷 A(Packet A)로 변환되고, 그 음성패킷 A는 접속된 네트워크(120)를 통해서 패킷 변환부(130)에 전달된다. 패킷 변환부(130)는 음성패킷 A를 수신지의 패킷으로 변환하기 위해 제 3디코더(131)로 디코딩하여 음성신호(PCM)로 만들고, 디코딩된 음성신호를 제 3엔코더(132)로 엔코딩하여 목적 부호화기의 음성패킷 B로 변환하여 출력한다.
패킷 변환부(130)로부터 변환된 음성패킷 B(Packet B)는 접속 네트워크(140)를 통해 목적지 제 2디코더(151)로 전달된다. 이로써, 제 2디코더(151)는 전달되는 음성패킷 B를 엔코딩하여 음성신호(PCM)로 출력하게 된다.
반대로, 제 2음성 부호화기(150)로 입력되는 음성 신호(PCM)는 제 2엔코더(152)의 엔코딩에 의해 음성패킷 B(Packet B)로 변환되고, 그 음성패킷 B는접속된 네트워크(140)를 통해서 패킷 변환부(130)에 전달된다. 패킷 변환부(130)는 음성패킷 B를 수신지의 패킷으로 변환하기 위해 제 4디코더(141)로 디코딩하여 음성신호(PCM)로 만들고, 디코딩된 음성신호를 제 4엔코더(134)로 엔코딩하여 목적 부호화기의 음성패킷 A(Packet A)로 변환하여 출력한다.
패킷 변환부(130)로부터 변환된 음성패킷 A(Packet A)는 접속 네트워크(120)를 통해 목적지 제 2디코더(112)로 전달된다. 이로써, 제 2디코더(112)는 전달되는 음성패킷 B를 엔코딩하여 음성신호(PCM)로 출력하게 된다.
상기와 같은 패킷 변환방식은 탄뎀(Tandem) 부호화 방식을 이용한 것으로, 이는 패킷 변환을 위해 복호화된 PCM 신호를 복잡한 분석 과정을 거쳐 부호화 파라미터들을 얻은 후, 이를 다시 양자화하고 패킹하여, 네트워크를 통하여 수신단으로 전송한다. 이것은 PCM 신호를 이용하여 파라미터를 간접적으로 변환하여 패킷을 변환하는 방법이다.
또한, VoIP(Voice of IP)와 같은 데이터망을 이용한 음성 통신에서 많이 사용되고 있는 CELP형 부호화기 중 G.723.1은 많은 경우에 상호 부호화(Transcoding, packet conversion) 대상이 된다.
도 4 및 도 5는 타 부호화기와 G.723.1 상호간의 패킷 변환장치에서의 패킷 변환 흐름도이다.
도 4는 타 부호화기(X)에 의해 부호화된 패킷을 G.723.1 패킷으로 변환하고자 하는 것으로, 디코더 X(210)에서는 부호화된 패킷(X)이 입력되면 비트 언패킹(Unpacking)하고(211), 비트 언패킹된 데이터를 역양자화하여 부호화기 X의LSP(Line Spectrum Pair) 파라미터(LSPx)를 얻는다(212). 그리고, LSP 음성 파라미터와 기타 파라미터를 이용하여 PCM 형태의 음성신호를 합성한다(213).
엔코더 G.723.1(220)은 상기 PCM 음성신호를 입력받아, PCM 음성신호로부터 자기 상관법을 이용하여 선형 예측 파라미터(LPCG.723.1(i), 0≤i≤9)를 구하며(221), 구해진 선형 예측 파라미터(LPCG.723.1(i))를 다항식 평가와 512개의 값을 갖는 코사인(Cosine) 표를 이용하여 LSP(Line Spectrum Pair) 파라미터로 변환하며(222), 상기 구해진 LSP 파라미터를 부호화기 G.723.1의 LSP 파라미터(LSPG.723.1(i), 0≤i≤9)로 양자화하고(223), LSP 이외의 기타 양자화된 데이터를 비트패킹(bit packing)하여 부호화기 G.723.1의 음성패킷으로 출력한다(224).
이러한 음성패킷 변환에 따른 CELP형 음성 부호화기는 음성 신호의 특징 파라미터를 추출하고 구조로 되어 있으며, 부호화 파라미터로는 LSP 파라미터, Pitch, ACB(Adaptive CodeBook), ACB 인덱스, FCB(Fixed CodeBook) 이득, FCB 인덱스 값들을 갖는다. LSP 파라미터는 음성 신호의 스펙트럼 포락선(envelope)을 나타내며, Pitch와 ACB 인덱스는 기본 주파수를 나타내며, ACB 이득은 피치성분의 에너지를 나타내고, FCB 이득과 인덱스는 그 외의 잔여 성분을 나타낸다. 이러한 부호화 파라미터는 표준 부호화기마다 그 표현 단위나 범위, 양자화 방법, 그리고 전송율에 따른 비트 할당에 다소 차이가 있으나 그 파라미터가 갖고 있는 정보의 의미는 서로 동일하다. 이러한 음성 파라미터는 패킷 또는 PCM 신호로부터 얻은 다음 다시 원하는 패킷으로 복원시 이용하게 된다.
도 5는 G.723.1 부호화기에서 타 부호화기로의 패킷 변환을 나타낸 것으로, G.723.1 디코더(230)는 G.723.1 부호화기에서 부호화된 패킷을 동일한 부호화기(즉, G.723.1)를 이용하여 비트 언패킹하고(231), 언패킹된 데이터를 역양자화하여 부호화기 G.723.1의 LSP 음성 파라미터를 얻는다(232). 그리고 음성 파라미터를 이용하여 PCM 형태의 음성신호를 합성한다(233).
타 엔코더(X)(240)는 상기 PCM 음성신호를 타 부호화기(X)의 입력으로 받아 PCM 입력 신호로부터 자기 상관법을 이용하여 선형 예측 파라미터(LPCX(i), 0≤i≤9)를 구하고(241), 상기 구해진 선형 예측 파라미터(LPCX(i))를 다항식 평가와 512개(2π)의 양자화 테이블을 갖는 코사인 표를 이용하여 LSP 파라미터(LSPX(i))로 변환하며(242), LSP 파라미터를 타 부화화된 패킷으로 만들기 위해 LSP 파라미터를 양자화하고(243), 기타 파라미터와 함께 비트패킹하여 타 부호화기의 음성패킷으로 출력한다(244).
즉, G.723.1과 타 부호화기 간의 상호 부호화의 변환의 경우, G.723.1의 패킷을 비트 언 패킹 및 역양자화(즉, 복호화)를 통해서 PCM 신호를 얻고 이를 자기 상관법을 이용하여 수신측의 LPC 파라미터를 구한다. 여기서, LPC는 체비쉐프(chebyshev) 다항식 평가와 코사인 표 검색을 통하여 LSP로 변환된다. 이때 코사인 표는 360도(2π)를 512등분하여 각 각도에 대한 코사인 값, 즉, COS(360/512*n)(n=0~511)에 해당하는 값을 저장하고 있다.
이와 같이, 종래에는 G.723.1과 타 부호화기간의 상호 부호화를 위해서는 첫째 PCM 신호를 얻는 복호화 과정과, 둘째 자기 상관법을 이용한 LPC 분석 과정과, 셋째 chebyshev 다항식 평가와 코사인 표 검색을 통한 LSP 변환 과정을 거치면서 수신측에서 복호화할 수 있는 부호화된 패킷으로 변환하여 출력해 준다.
그러나, 종래에는 비트 언패킹하고 역양자화한 다음 구해진 음성 파라미터를 이용하여 PCM 형태의 음성 신호를 합성하여 PCM신호를 얻은 후, 이를 다시 분석하여 LSP를 계산하므로, 연산량이 많아지는 문제가 있다. 즉, PCM 신호를 얻기 위한 복호화 과정과, 자기 상관법을 이용한 LPC 분석 과정, chebyshev 다항식 평가와 코사인 표 검색을 통환 LSP 변환과정 등에 많은 계산량이 요구되는 문제가 있다.
일반적으로 엔코딩할 때 90%의 계산량이 소모되고 나머지 10%가 디코딩하는데 소모되는데, LSP 변환시 상기와 같은 인코딩 및 디코딩으로 인한 계산량 또한 많이 소요되는 문제가 있다.
또한, LPC 분석을 위해서 부가적인 지연(7.5ms)이 발생함과 아울러, 다항식 평가와 코사인 표 검색을 통한 LSP 변환 과정에서 512개의 값으로 구성된 코사인 표 검색을 수행하여야 함과 아울러, 상기 코사인 표를 저장하기 위한 메모리를 필요로 하는 문제가 있다.
본 발명은 상기한 종래의 문제점을 해결하기 위해 안출된 것으로서, 송신측 부호화기로 부호화된 패킷으로부터 LSP 정보를 추출하고, 체비세프 다항식 평가와 코사인 표 검색을 하지 않고 직접 수신측 코덱의 LSP 파라미터로 직접 변환하고자 한 음성패킷 변환을 위한 LSP 파라미터 변환장치 및 방법을 제공함에 그 목적이 있다.
또한, 타 부호화기의 프레임 LSP 파라미터를 보간한 후 512를 곱해서 G.723.1의 LSP 파라미터를 구하고, 반대로 G.723.1로 부호화된 패킷에서 LSP를 보간한 후 512로 나누어서 타 부호화기의 LSP 파라미터를 각각 구할 수 있도록 한 음성패킷 변환을 위한 LSP 파라미터 변환장치 및 방법을 제공함에 그 목적이 있다.
또한, 타 부호화기로 부호화된 이전 프레임의 LSP 파라미터에는 임의의 보간 상수를 곱하고, 현재 프레임의 LSP 파라미터에는 최대 보간 상수 값에서 상기의 보간 상수 값을 뺀 값으로 곱하여, 상기 현재 프레임과 이전 프레임을 더한 후 512에 해당하는 비트씩 쉬프트시켜 구현함으로써, 체비쉐프 다항식 평가와 코사인 표를 검색하지 않아도 되므로 보다 빠른 연산이 수행할 수 있도록 한 음성패킷 변환을 위한 LSP 파라미터 변환장치 및 방법을 제공함에 그 목적이 있다.
도 1은 일반적인 유/무선 통신망 구성도.
도 2는 CELP형 음성 부호화기의 구조를 나타낸 도면.
도 3은 종래 일반적인 통신 시스템의 음성패킷 변환장치를 나타낸 구성도.
도 4는 종래 통신 시스템의 음성패킷 변환장치에 있어, 타 부호화기의 음성패킷을 G.723.1 부호화기의 음성패킷 변환을 나타낸 흐름도.
도 5는 종래 통신 시스템의 음성패킷 변환장치에 있어, LSP 파라미터 변환을 중심으로 살펴본 G.723.1부호화기의 음성패킷에서 타 부호화기의 음성패킷 변환을 나타낸 흐름도.
도 6은 본 발명 실시 예에 따른 음성패킷 변환을 위한 LSP 파라미터 변환장치를 나타낸 구성도.
도 7 및 도 8은 본 발명 실시 예에 따른 타 부호화기와 G.723.1 부호화기의 음성패킷 변환을 위한 LSP 파라미터 변환장치의 상세 구성도.
도 9 및 도 10은 본 발명 실시 예에 따른 타 부호화기와 G.723.1 부호화기의 음성패킷 변환을 위한 LSP 파라미터 변환방법을 나타낸 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
310...타 부호화기311, X-엔코더
312...X-디코더320,340...네트워크
330...패킷변환장치331...제 1트랜스 코더
332...제 2트랜스 코더350...G.723.1 부호화기
351...G.723.1 디코더352...G.723.1엔코더
401,411...비트 언패킹부402,412...역양자화부
403,413...LSP 파라미터 변환부404,414...LSP 보간부
405...승산기415...제산기
406,416...파라미터 양자화부407,417...비트 패킹부
상기한 목적 달성을 위한, 본 발명에 따른 음성패킷 변환을 위한 LSP 파라미터 변환장치는,
네트워크를 통해 송수신되는 음성패킷을 목적하는 음성패킷으로 변환하기 위해, 타 부호화기로 부호화된 패킷을 비트 언패킹하고 역양자화하여 타 부호화기의 LSP 파라미터를 얻고, 목적하는 G.723.1 패킷의 LSP 파라미터로 직접 변환한 후 양자화하여 비트 언패킹하는 제 1트랜스 코더와, G.723부호화기로부터 부호화된 패킷을 비트 언 패킹 및 역양자화하여 G.723.1 부호화기의 LSP 파라미터를 얻고, 상기 G.723.1 부호화기의 LSP 파라미터를 목적하는 타 부호화기의 패킷으로 직접 변환한후 양자화하여 비트 언패킹하는 제 2트랜스 코더를 포함하는 것을 특징으로 한다.
바람직하게, 상기 제 1트랜스 코더는 타 부호화기로 부호화된 패킷을 비트 언 패킹하는 비트 언패킹부와, 타 부호화기의 파라미터를 얻기 위해 상기 비트 언패킹된 데이터를 역양자화하는 역양자화부와, 타 부호화기의 음성 파라미터를 G.723.1 부호화기의 LSP 파라미터로 변환하는 LSP 파라미터 변환부와, 변환된 파라미터를 양자화하는 파라미터 양자화부 및, 양자화된 파라미터를 비트 패킹하여 G.723.1 패킷으로 출력하는 비트 패킹부를 포함하는 것을 특징으로 한다.
바람직하게, 제 1트랜스 코더의 LSP 파라미터 변환부는 타 부호화기의 LSP 파라미터를 프레임간 보간을 행하는 LSP 보간부와, 상기 보간된 LSP 파라미터에 512를 승산하여 G.723.1 부호화기의 LSP 파라미터로 출력하는 승산기로 구성된 것을 특징으로 한다.
또한, 제 2트랜스 코더는 G.723.1 부호화기로 부호화된 패킷을 비트 언 패킹하는 비트 언패킹부와, G.723.1 부호화기의 파라미터를 추출하기 위해 비트 언패킹된 데이터를 역양자화하는 역양자화부와, 상기 G.723.1 부호화기의 LSP 파라미터를 타 부호화기의 LSP 파라미터로 직접 변환하는 LSP 파라미터 변환부와, 변환된 파라미터를 이용하여 타 부호화기로 양자화하는 파라미터 양자화부와, 상기 양자화된 데이터를 비트 패킹하는 비트 패킹부로 구성된다.
그리고, 제 2트랜스 코더의 LSP 파라미터 변환부는 G.723.1 부호화기의 프레임간 LSP 보간하는 LSP 보간부와, LSP 보간된 파라미터에 512를 제산하여 타 부호화기의 LSP 파라미터로 변환하는 제산기로 구성된다.
본 발명의 다른 특징에 따른 음성패킷 변환을 위한 LSP 파라미터 변환방법은,
타 부호화기로 부호화된 패킷을 비트 언 패킹 및 역양자화하여 10차 벡터의 LSP 파라미터를 구하는 단계; 상기 타 부호화기의 LSP 파라미터를 G.723.1의 LSP 파라미터로 직접 변환하는 단계; 상기 G.723.1의 LSP 파라미터를 양자화시키고 양자화된 데이터를 비트 패킹하여 G.723.1의 음성패킷을 출력하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 또 다른 특징에 따른 음성패킷 변환을 위한 음성패킷 변환방법은,
G.723.1 부호화기로 부호화된 패킷을 비트 언 패킹 및 역양자화하여 LSP 파라미터를 구하는 단계; 상기 G.723.1의 LSP 파라미터를 타 부호화기의 LSP 파라미터로 직접 변환하는 단계; 상기 타 부호화기의 LSP 파라미터를 양자화시키고 양자화된 데이터를 비트 패킹하여 G.723.1의 음성패킷을 출력하는 단계를 포함하는 것을 특징으로 한다.
이하 첨부된 도면을 참조하여 설명하면 다음과 같다.
도 6은 본 발명 실시 예에 따른 음성패킷 변환을 위한 LSP 파라미터 변환장치를 나타낸 구성도이고, 도 7 및 도 8은 본 발명 실시 예에 따른 타 부호화기와 G.723.1 부호화기의 음성패킷 변환을 위한 LSP 파라미터 변환장치의 상세 구성도이며, 도 9 및 도 10은 본 발명 실시 예에 따른 타 부호화기와 G.723.1 부호화기의 음성패킷 변환을 위한 LSP 파라미터 변환방법을 나타낸 흐름도이다.
도 6을 참조하면, 제 1 엔코더(311) 및 제 1디코더(312)를 갖고 엔코딩 및디코딩하는 타 부호화기(310)와; 제 2디코더(351) 및 제 2엔코더(352)를 갖고 G.723.1 부호화를 위해 엔코딩 및 디코딩하는 G.723.1 부호화기(350)와; 부호화기(310,350)에 접속되어 패킷 전달을 위한 네트워크(320,340)와; 타 부호화기(310)의 음성패킷의 LSP 파라미터를 얻고 이를 G.723.1부호화기의 LSP 파라미터로 변환한 후 G.723.1 패킷으로 출력하는 제 1트랜스 코더(Trans-coder)(331) 및, G.723.1 부호화기(350)의 음성패킷을 이용하여 해당 G.723.1의 LSP 파라미터를 얻고 이를 타 부호화기(310)의 LSP 파라미터로 변환한 후 G.723.1의 부호화기(310)의 패킷으로 출력하는 제 2트랜스 코더(332)를 포함한 패킷 변환부(330)로 구성된다.
도 7은 타 부호화기의 LSP 파라미터를 G.723.1 부호화기의 LSP 파라미터로 변환하는 제 1트랜스코더의 구성도로서, 타 부호화기(X)의 음성패킷을 비트 언 패킹하는 비트 언패킹부(401)와, 비트 언패킹된 데이터를 역양자화하여 10차 벡터의 LSP 파라미터를 얻는 역양자화부(402)와, 타 부호화기의 LSP 파라미터를 프레임간 보간을 통하는 LSP 보간부(404) 및 보간된 LSP 파라미터에 512를 승산하여 G.723.1의 LSP 파라미터를 구하는 승산기(405)로 구성된 LSP 파라미터 변환부(403)와, G.723.1 파라미터를 이용하여 양자화하는 파라미터 양자화부(406)와, 상기 양자화된 데이터를 G.723.1 음성패킷으로 비트 패킹하는 비트 패킹부(407)로 구성된다.
도 8은 G.723.1 부호화기의 LSP 파라미터를 타 부호화기의 LSP 파라미터로 변환하는 제 2트랜스 코더(332)의 구성으로서, 타 부호화기의 음성패킷을 비트 언패킹하는 비트 언패킹부(411)와, 비트 언패킹된 데이터를 역양자화하여 10차 벡터의 LSP 파라미터를 얻는 역양자화부(412)와, 타 부호화기의 LSP 파라미터의 프레임간 보간하는 LSP 보간부(414) 및 보간된 LSP 파라미터에 512를 제산하여 G.723.1 부호화기 LSP 파라미터를 구하는 승산기(415)로 구성된 LSP 파라미터 변환부(413)와, G.723.1 파라미터를 이용하여 양자화하는 파라미터 양자화부(416)와, 상기 양자화된 데이터를 G.723.1 음성패킷으로 비트 패킹하는 비트 패킹부(417)로 구성된다.
상기와 같이 구성되는 본 발명에 따른 음성패킷 변환을 위한 LSP 변환장치 및 방법에 대하여 첨부된 도면을 참조하여 설명하면 다음과 같다.
도 6을 참조하면, 타 부호화기(X)(310)로 입력되는 음성신호는 제 1엔코더에서 음성패킷으로 엔코딩되고, 접속된 네트워크(320)를 통해서 패킷 변환부(330)로 입력된다.
패킷 변환부(330)의 제 1트랜스 코더(331)는 상기 타 부호화기(310)의 음성패킷을 G.723.1 패킷으로 변환하기 위해서 타 부호화기(310)의 음성패킷을 이용하여 해당 LSP 파라미터를 추출한 후 이를 G.723.1의 LSP 파라미터로 변환하고 그 파라미터를 이용하여 G.723.1 패킷으로 변환 출력하게 된다.
패킷 변환부(330)로부터 출력되는 G.723.1 패킷은 G.723.1 부호화기(350)의 제 2디코더(351)에 의해 음성 신호로 디코딩되어 출력된다.
반대로, G,723.1 부호화기(350)로 입력되는 음성신호(PCM)는 제 2엔코더(352)에서 엔코딩되어 G.723.1 패킷으로 출력되고, G.723.1 패킷은 접속된 네트워크(240)를 통해 패킷 변환부(330)로 입력된다.
패킷 변환부(330)의 제 2트랜스 코더(332)는 G.723.1 패킷을 타 부호화기의음성패킷으로 변환하기 위해, G.723.1의 음성패킷으로부터 LSP 파라미터를 추출한 후 이를 목적하는 타 부호화기의 LSP 파라미터로 변환하고, 양자화 및 비트 패킹하여 타 부호화기의 음성패킷으로 출력한다.
타 부호화기의 음성패킷은 네트워크(320)를 통해 타 부호화기의 제 1디코더(312)에 의해 디코딩되어 PCM 음성신호로 출력된다.
이러한 패킷 변환을 위한 LSP 변환장치에 대하여 도 7 및 도 8를 참조하면 상세하게 설명하며 다음과 같다. 도 7은 상기 제 1트랜스 코더의 상세 구성도이고, 도 8은 제 2트랜스 코더의 상세 구성도이다.
도 7을 참조하면, 제 1트랜스 코더는 비트 언패킹부(401), 역양자화부(402), LSP 파라미터 변환부(403), 파라미터 양자화부(406), 비트패킹부(407)로 구성된다.
비트 언 패킹부(Bit Unpacking)(401)는 타 부호화기(X)에서 부호화된 음성패킷(Packet X)이 입력되면 비트 언 패킹한다.
그리고, 역양자화부(402)는 역양자화하여 타 부호화기의 파라미터(LSP, Pitch, ACB 이득 및 인덱스, FCB 이득 및 인덱스 등)를 얻게 되는데, 이때 비트 언 패킹된 데이터를 프레임당 10차 벡터(0≤i≤9)로 비트 해제하고, 부호화된 패킷의 현재 프레임에 대한 LSP 파라미터(LSPX (0)(i))를 구한다. 즉 한 프레임당 10차의 양자화되지 않은 파라미터로서 256개(2π)의 값을 가질 수 있다.
LSP 파라미터 변환부(403)는 타 부호화기의 LSP 파라미터를 G.723.1의 LSP 파라미터로 고속 변환하게 되는데, 내부의 LSP 보간부(404)는 이전 프레임의 LSP파라미터(LSPX (-1)(i))와 현재 프레임의 LSP 파라미터(LSPX (0)(i))를 보간한다.
이때, 이전 프레임의 LSP 파라미터에는 보간 상수(α)를 곱해주고, 현재 프레임의 LSP 파라미터에는 최대 보간 상수값에서 상기 보간 상수(α)를 뺀 값(1-α)을 곱해준다. 여기에서 보간 상수(α)는 0에서 1 이내의 범위에 있으며, 그 상수 값은 프레임내에서의 서브 프레임이 증가할수록 단계적으로 증가시켜 준다. 이는 타 부호화기와 G.723.1는 서로 다른 양자화 테이블을 갖고 있기 때문에 보간 상수로 완만화(smoothing)시켜 보간해 준다.
그리고, 승산기(405)는 상기 보간된 현재 프레임과 이전 프레임을 더한 후 512를 곱해준다. 여기에서 프레임에 512를 곱하는 것은 9비트(29)를 라이트 쉬프트(Right shift) 동작으로 구현할 수 있는데, 쉬프트 동작은 디지털 신호 프로세스에서 한 번에 1사이클씩 이동시켜 실제 구현한다. 즉, G.723.1은 0~1 사이의 값을 갖는 512 표의 인덱스(Index)로 표현되기 때문에 그 표현 특성을 이용하여 LSP 변환을 수행한다. 예컨대, G.729에 512를 승산할 경우 G.723.1 LSP 파라미터(LSPG.723.1)로 변환된다.
이러한 파라미터 변환시 LSP 파라미터와 함께 변환되는 기타 파라미터의 동작 설명은 생략하기로 한다.
타 부호화기의 LSP 파라미터를 G.723.1의 LSP 파라미터 변환을 수식으로 표현하면 수학식 1과 같다.
여기에서 LSPX (0)(i)은 제 1부호화기(X)로 부호화된 패킷을 언 패킹한 프레임으로, (i)는 0에서 9까지의 범위에 존재하며, (-1)는 현재 프레임이고, (0)는 이전 프레임이며, α는 보간상수이다. 보간상수는 0≤α≤1을 만족하여야 하고 서브 프레임이 증가할수록 단계적으로 증가한다.
그러면, LSP 파라미터가 구해지면 파라미터 양자화부(406)는 상기 구해진 LSPX (0)(i)을 양자화하고, 비트 패킹부(407)는 G.723.1의 LSP 인덱스 값으로 비트 패킹하여 G.723.1 음성패킷을 출력한다.
이렇게 얻어진 G.723.1 음성패킷은 수신지 채널을 통해 수신측 G.723.1 부호화기로 전송된다. 여기에서 LSPG.723.1을 구하기 위해서는 기존에 수행하던 체비쉐프 다항식 평가와 코사인 표 검색을 수행하지 않아 계산량을 크게 줄일 수 있다.
도 8을 참조하면, G.723.1에서 타 부호화기로의 음성패킷 변환하는 제 2트랜스 코더는 비트 언패킹부(411), 역양자화부(412), LSP 파라미터 변환부(413), 파라미터 양자화부(416), 비트 패킹부(417)로 구성된다.
G.723.1 부호화기로 부호화된 음성패킷이 제 2트랜스코더의 비트 언 패킹부(411)에 입력되면, 비트 언패킹부(331)는 상기 G.723.1 음성패킷을 비트 언 패킹하고, 역양자화부(412)는 언 패킹된 G.723.1 데이터를 10차 벡터의 LSP 파라미터(LSPG.723.1 (0)(i))를 추출한다.
그리고, LSP 파라미터 변환부(413)는 G.723.1의 LSP 파라미터를 타 부호화기의 LSP 파라미터로 변환하게 되는데, 내부의 LSP 보간부(414)는 언 패킹된 G.723.1 부호화기의 이전 프레임의 LSP 파라미터(LSPG.723.1 (-1)(i))에 보간 상수(β)를 승산해 주고, 현재 프레임의 LSP 파라미터(LSPG.723.1 (0)(i))에 상기 보간 상수를 최대 보간 상수 값으로 감산(1-β)한 후 얻어진 상수 값으로 곱해준다. 여기에서 보간 상수(β)는 0에서 1사이의 범위에 있으며 한 프레임 내에서 서브 프레임(sub-frame)이 증가할수록 단계적으로 증가한다.
제산기(415)는 보간 상수로 보간된 현재 프레임과 이전 프레임의 LSP 파라미터를 더하여 512로 나누어, 타 부호화기의 현재 프레임 LSP 파라미터(LSPX (0)(i))를 구한다. 이런 방법은 LSP 파라미터를 512로 나누는 것은 9비트(29)의 레프트 쉬프트(Left shift) 동작으로 구현할 수 있는데, 쉬프트 동작은 디지털 신호 프로세스(DSP)에 의해 한 번에 1사이클씩 이동시켜 실제 구현한다. 즉, G.723.1은 512개로 나누어진 양자화 테이블을 갖기 때문에 그 표현 형태의 차이 만큼 512로 나누어 보상하여 줄 수 있다. 예컨대, G.723.1의 LSP 파라미터에 512를 승산할 경우 G.729 부호화기의 LSP 파라미터로 변환된다.
이를 수식으로 표현하면 수학식 2와 같다.
여기에서 LSPG.723.1 (0)(i)은 타 부호화기(X)로 부호화된 패킷을 언 패킹하여 10차 벡터로 표현된 현재 프레임의 LSP 파라미터이고, LSPG.723.1 (-1)(i)는 타 부호화기(X)로 부호화된 패킷을 언 패킹하여 10차 벡터로 표현한 이전 프레임의 LSP 파라미터이다.
수학식 2에서 (i)는 0에서 9까지인 10차 벡터 사이의 범위에 존재하며, (-1)는 현재 프레임이고, (0)는 이전 프레임이며, β는 보간상수이다. 보간상수는 0≤ β≤1을 만족하여야 하고 서브 프레임이 증가할수록 단계적으로 증가한다.
그러면, LSP 파라미터가 구해지면 파라미터 양자화부(Linear Spectrum Pair Quantizer)(416)에서 LSPG.723.1 (0)(i)을 양자화하고, 비트 패킹부(417)에서 양자화된 데이터를 비트 패킹함으로써, 타 부호화기의 음성패킷(Packet-X)으로 출력한다.
이렇게 얻어진 타 부호화기의 음성패킷은 채널을 통해 수신측 코덱으로 전송된다. 여기에서 LSPX을 구하기 위해서는 기존에 수행하던 체비쉐프 다항식 평가와 코사인 표 검색을 수행하지 않고, 계산량을 크게 줄일 수 있다.
수학식 1 및 2에서 LSPX는 0과 0.5 사이의 값이며, LSPG.723.1은 0과 256 사이의 값(0~2π)이다.
상기와 같이 트랜스 코더에서 구한 LSP 파라미터는 기존에 코사인 표를 이용해서 구한 LSP에 상응하는 결과를 가지며, 양자화 과정을 거친 비트 패킷은 정확하게 동일한 값을 갖는다.
도 9 및 도 10은 본 발명 실시 예에 따른 타 부호화기와 G.723.1 부호화기의 음성패킷 변환을 위한 LSP 파라미터 변환방법을 나타낸 흐름도이다.
도 9는 타 부호화기(X)에서 G.723.1 부호화기의 음성 패킷 변환을 위한 LSP 파라미터 변환과정을 나타낸 흐름도이다.
도 9를 참조하면, 타 부호화기(X)로 부호화된 음성패킷이 입력되면, 상기 음성패킷을 비트 언패킹하고(S410), 비트 언패킹된 데이터를 역양자화하여 10차 벡터로 표현하는 현재 프레임의 LSP 파라미터(LSPx)를 추출한다(S420). 즉, LSPX (0)(i) , 0≤i≤9로 LSP 파라미터를 추출한다.
그리고, 타 부호화기의 LSP 파라미터를 G.723.1의 LSP 파라미터로 고속 변환하게 되는데(S440), 타 부호화기의 LSP 파라미터의 프레임간 보간하고(S441), 상기 보간된 LSP 파라미터에 512를 승산하여 G.723.1의 LSP 파라미터(LSPG.723.1 (0)(i))를 구한다(S442). 즉, 이전 프레임의 LSPX (-1)(i)와 현재 프레임의 LSPX (0)(i)를 각각 보간하여 G.723.1의 LSPG.723.1 (0)(i)를 구한다.
그리고, G.723.1의 현재 프레임 LSP파라미터를 양자화한 후(S450), 비트 패킹을 하고(S460), G.723.1의 음성패킷을 출력한다(S470).
도 10은 G.723.1 부호화기의 LSP 파라미터를 타 부호화기(X)의 음성패킷 변환을 위한 LSP 파라미터로 변환하기 위한 흐름도이다.
이에 도시된 바와 같이, G.723.1로 부호화된 음성패킷이 입력되면(S510), G.723.1의 부호화된 음성패킷을 비트 언 패킹하고(S520), 역양자화하여 해당 부호화기의 LSP 파라미터인 LSPG.723.1 (0)(i)를 10차 벡터로 표현하여 구한다(S530).
그리고, 수학식 2와 같이, 이전 프레임의 LSP 파라미터와 현재 프레임의 LSP 파라미터를 각각 보간하고(S541), 보간된 프레임 더한 후 512로 나누어 줌으로써(S542), 타 부호화기의 LSP 파라미터인 LSPX (0)(i)로 파라미터를 변환한다(S540).
타 부호화기의 현재 프레임에 대한 LSP 파라미터가 구해지면 LSP 파라미터를 이용하여 양자화한 후(S550), 양자화된 데이터를 여타 파라미터와 함께 비트 패킹하여 G.723.1 음성패킷을 만들고(S560), G.723.1의 음성패킷을 출력하게 된다(S570).
이와 같이, LSPG.723.1의 상호 부호화를 위해서, 체비쉐프 다항식 평가와 코사인 표를 검색하지 않고, 단지 LSP 파라미터에 512를 곱하거나 나눔으로써 종래에 비해 연산량이 크게 줄일 수 있다.
즉, [LSPX(0), LSPX(1),...,LSPX(9)]에 512를 곱하면 [ LSPG.723.1(0),LSPG.723.1(1),...,LSPG.723.1(9)]를 구하고,
반대로, [LSPG.723.1(0), LSPG.723.1(1),...,LSPG.723.1(9)]에 512를 나눌 경우 [LSPX(0), LSPX(1),...,LSPX(9)]를 구하게 된다.
또한, 정수 연산(fixed-point operation) 구현에서는 512 곱하기/나누기는 9비트 라이트/레프트 이동으로 구현될 수 있다. 따라서, LSP 변환 파라미터는 기존에 코사인 표를 이용해서 구한 LSP 파라미터에 상응하는 결과를 가지며, 양자화 과정을 거친 비트 패킷은 정확하게 동일한 결과를 갖는다.
이상에서 설명한 바와 같이, 본 발명에 따른 음성패킷 변환을 위한 LSP 파라미터 변환장치 및 방법에 의하면, 기존의 탄뎀 방식에 비교하여 LSP를 계산하기 위한 과정이 PCM 신호를 얻는 과정이 생략되어 계산 량이 크게 줄일 수 있을 뿐만 아니라, LSP 변환을 위해 코사인 표를 검색하지 않아도 되므로 코사인 표를 저장할 메모리가 필요하지 않고 LPC 분석을 위한 부가적인 지연도 발생하지 않는 효과가 있다.
또한, PCM 신호로 복호화 하지 않고 512개의 코사인 표를 검색하지 않아 LSP 정보를 추출한 후 LSP 파라미터를 검출함으로써, 계산량과 메모리 면에서 매우 효율적으로 다채널 구현시에 동일한 자원으로 보다 많은 채널을 수용할 수 있는 효과가 있다.
Claims (15)
- 네트워크를 통해 송수신되는 음성패킷을 상호 변환하는 음성패킷 장치에 있어서,타 부호화기로 부호화된 패킷을 비트 언패킹하고 역양자화하여 타 부호화기의 LSP 파라미터를 얻고, 이를 이용하여 G.723.1 부호화기의 LSP 파라미터로 직접 변환한 후 양자화하여 비트 언패킹하는 제 1트랜스 코더와;G.723.1 부호화기로부터 부호화된 패킷을 비트 언 패킹 및 역양자화하여 G.723.1 부호화기의 LSP 파라미터를 얻고 이를 이용하여 상기 G.723.1 부호화기의 LSP 파라미터를 목적하는 타 부호화기의 패킷으로 직접 변환한 후 양자화하여 비트 언패킹하는 제 2트랜스 코더를 포함하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환장치.
- 제 1항에 있어서,상기 제 1트랜스 코더는 타 부호화기로 부호화된 패킷을 비트 언 패킹하는 비트 언패킹부와, 타 부호화기의 LSP 파라미터를 얻기 위해 상기 비트 언패킹된 데이터를 역양자화하는 역양자화부와, 타 부호화기의 음성 파라미터를 G.723.1 부호화기의 LSP 파라미터로 변환하는 LSP 파라미터 변환부와, 변환된 파라미터를 양자화하는 파라미터 양자화부 및, 양자화된 파라미터를 비트 패킹하여 G.723.1 패킷으로 출력하는 비트 패킹부를 포함하는 것을 특징으로 하는 음성패킷 변환을 위한LSP 파라미터 변환장치.
- 제 1항에 있어서,상기 제 2트랜스 코더는 G.723.1 부호화기로 부호화된 패킷을 비트 언 패킹하는 비트 언패킹부와, G.723.1 부호화기의 파라미터를 추출하기 위해 비트 언패킹된 데이터를 역양자화하는 역양자화부와, 상기 G.723.1 부호화기의 LSP 파라미터를 타 부호화기의 파라미터로 직접 변환하는 LSP 파라미터 변환부와, 변환된 파라미터를 이용하여 타 부호화기로 양자화하는 파라미터 양자화부와, 상기 양자화된 데이터를 비트 패킹하는 비트 패킹부를 포함하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환장치.
- 제 2항에 있어서,상기 제 2트랜스 코더의 LSP 파라미터 변환부는 타 부호화기의 LSP 파라미터를 프레임간 보간을 행하는 LSP 보간부와, 상기 보간된 LSP 파리미터에 512를 승산하여 G.723.1의 LSP 파라미터로 출력하는 승산기로 구성된 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환장치.
- 제 3항에 있어서,상기 제 2트랜스 코더의 LSP 파라미터 변환부는 G.723.1 부호화기의 프레임간 LSP 보간하는 LSP 보간부와, 보간된 LSP 파라미터에 512를 제산하여 타 부호화기의 LSP 파라미터로 변환하는 제산기를 포함하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환장치.
- 제 4항 또는 제 5항에 있어서,상기 LSP 보간부는 추출된 이전 프레임의 LSP 파라미터에 보간 상수를 곱하고, 현재 프레임의 LSP 파라미터에 최대 보간 상수 값으로 상기 보간 상수를 뺀 값을 곱해주는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환장치.
- 제 6항에 있어서,상기 보간 상수는 프레임의 스무딩을 위해, 0에서 1 사이의 범위 값으로 이종 부호화 파라미터에 서로 다른 값을 적용하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환장치.
- 제 4항에 있어서,상기 승산기는 타 부호화기의 프레임 LSP 파라미터를 G.723.1의 프레임 LSP 파라미터로 변환시 타 부호화기의 이전 프레임과 현재 프레임의 LSP 파라미터를 더한 값에 512를 승산하고 이를 비트 쉬프트로 구현하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환장치.
- 제 5항에 있어서,상기 제산기는 G.723.1의 프레임 LSP 파라미터를 타 부호화기의 프레임 LSP 파라미터로 변환시 G.723.1의 이전 프레임과 현재 프레임의 LSP 파라미터를 더한 값에 512로 제산하고 이를 비트 쉬프트로 구현하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환장치 및 방법.
- 타 부호화기로 부호화된 패킷을 비트 언 패킹 및 역양자화하여 10차 벡터의 LSP 파라미터를 구하는 단계;상기 타 부호화기의 LSP 파라미터를 G.723.1의 LSP 파라미터로 직접 변환하는 단계;상기 G.723.1의 LSP 파라미터를 양자화시키고 양자화된 데이터를 비트 패킹하여 G.723.1의 음성패킷을 출력하는 단계를 포함하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환방법.
- 제 10항에 있어서,상기 파라미터 변환 단계는, 타 부호화기의 LSP 파라미터로부터 이전 프레임과 현재 프레임을 각각 보간하는 단계;상기 보간된 이전 프레임과 현재 프레임을 더하고 그 더한 값에 9비트씩 쉬프트하여 G.723.1의 현재 프레임 LSP 파라미터를 구하는 단계를 포함하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환방법.
- 제 11항에 있어서,상기 G.723.1의 현재 프레임 LSP 파라미터는,로 구하는 것을 특징으로 하며,여기에서 LSPX (0)(i) 및 LSPX (-1)(i)은 타 부호화기로 부호화된 패킷을 10차 벡터로 각각 표현한 현재 프레임 LSP 파라미터 및 이전 프레임의 LSP 파라미터이고, (i)는 0에서 9까지의 10차 벡터이며, α 는 0≤α≤1을 만족하는 보간 상수임을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환방법.
- G.723.1 부호화기로 부호화된 패킷을 비트 언 패킹 및 역양자화하여 LSP 파라미터를구하는 단계;상기 G.723.1의 LSP 파라미터를 타 부호화기의 LSP 파라미터로 직접 변환하는 단계;상기 타 부호화기의 LSP 파라미터를 양자화시키고 양자화된 데이터를 비트 패킹하여 G.723.1의 음성패킷을 출력하는 단계를 포함하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환방법.
- 제 13항에 있어서,상기 파라미터 변환단계는 G.723.1 부호화기의 LSP 파라미터로부터 이전 프레임과 현재 프레임을 각각 보간하는 단계; 상기 보간된 이전 프레임과 현재 프레임을 더하고 그 더한 값에 타 부호화기의 LSP 파라미터를 구하기 위해 512를 제산하여 타 부호화기의 현재 프레임 LSP 파라미터를 구하는 단계를 포함하는 것을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환방법.
- 제 14항에 있어서,상기 타 부화기의 현재 프레임 LSP 파라미터는,를 이용하여 구하는 것을 특징으로 하며,여기에서 LSPG.723.1 (0)(i) 및 LSPG.723.1 (-1)(i)은 G.723.1로 부호화된 패킷을 언 패킹하여 10차 벡터로 각각 표현된 현재 프레임 LSP 파라미터 및 이전 프레임 LSP 파라미터이고, (i)는 0에서 9까지인 10차 벡터이며, β 는 0≤β≤1을 만족하는 보간 상수임을 특징으로 하는 음성패킷 변환을 위한 LSP 파라미터 변환방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2001-0058029A KR100460109B1 (ko) | 2001-09-19 | 2001-09-19 | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 |
US10/246,539 US7307981B2 (en) | 2001-09-19 | 2002-09-19 | Apparatus and method for converting LSP parameter for voice packet conversion |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2001-0058029A KR100460109B1 (ko) | 2001-09-19 | 2001-09-19 | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030025092A true KR20030025092A (ko) | 2003-03-28 |
KR100460109B1 KR100460109B1 (ko) | 2004-12-03 |
Family
ID=19714432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2001-0058029A KR100460109B1 (ko) | 2001-09-19 | 2001-09-19 | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7307981B2 (ko) |
KR (1) | KR100460109B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101039741B1 (ko) * | 2011-01-07 | 2011-06-09 | 주식회사 한솔환경산업 | 기계적 교반형 혐기성 소화조 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7023880B2 (en) * | 2002-10-28 | 2006-04-04 | Qualcomm Incorporated | Re-formatting variable-rate vocoder frames for inter-system transmissions |
KR100451622B1 (ko) * | 2002-11-11 | 2004-10-08 | 한국전자통신연구원 | 통신용 보코더 및 이를 이용한 통신 방법 |
US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
US7433815B2 (en) * | 2003-09-10 | 2008-10-07 | Dilithium Networks Pty Ltd. | Method and apparatus for voice transcoding between variable rate coders |
US7519532B2 (en) * | 2003-09-29 | 2009-04-14 | Texas Instruments Incorporated | Transcoding EVRC to G.729ab |
US20050258983A1 (en) * | 2004-05-11 | 2005-11-24 | Dilithium Holdings Pty Ltd. (An Australian Corporation) | Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications |
KR100703325B1 (ko) * | 2005-01-14 | 2007-04-03 | 삼성전자주식회사 | 음성패킷 전송율 변환 장치 및 방법 |
US20070047544A1 (en) * | 2005-08-25 | 2007-03-01 | Griffin Craig T | Method and system for conducting a group call |
WO2007083931A1 (en) * | 2006-01-18 | 2007-07-26 | Lg Electronics Inc. | Apparatus and method for encoding and decoding signal |
US7805292B2 (en) * | 2006-04-21 | 2010-09-28 | Dilithium Holdings, Inc. | Method and apparatus for audio transcoding |
US20080259800A1 (en) * | 2007-04-16 | 2008-10-23 | Alan Clark | Method and System for Correlating Streams within a Packet Network |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5903862A (en) * | 1995-01-25 | 1999-05-11 | Weaver, Jr.; Lindsay A. | Method and apparatus for detection of tandem vocoding to modify vocoder filtering |
FI101439B1 (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
JP2861889B2 (ja) * | 1995-10-18 | 1999-02-24 | 日本電気株式会社 | 音声パケット伝送システム |
US5995923A (en) * | 1997-06-26 | 1999-11-30 | Nortel Networks Corporation | Method and apparatus for improving the voice quality of tandemed vocoders |
KR100429180B1 (ko) * | 1998-08-08 | 2004-06-16 | 엘지전자 주식회사 | 음성 패킷의 파라미터 특성을 이용한 오류 검사 방법 |
KR100667522B1 (ko) * | 1998-12-18 | 2007-05-17 | 주식회사 현대오토넷 | Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 |
US6260009B1 (en) * | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
JP3287328B2 (ja) * | 1999-03-09 | 2002-06-04 | 日本電気株式会社 | 半導体装置及び半導体装置の製造方法 |
KR100300964B1 (ko) * | 1999-05-18 | 2001-09-26 | 윤종용 | 음성 코딩/디코딩 장치 및 그 방법 |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
KR100434275B1 (ko) * | 2001-07-23 | 2004-06-05 | 엘지전자 주식회사 | 패킷 변환 장치 및 그를 이용한 패킷 변환 방법 |
KR100513901B1 (ko) * | 2001-08-07 | 2005-09-07 | 엘지전자 주식회사 | 패킷데이터 처리를 위한 이동통신시스템 |
US6829579B2 (en) * | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
-
2001
- 2001-09-19 KR KR10-2001-0058029A patent/KR100460109B1/ko not_active IP Right Cessation
-
2002
- 2002-09-19 US US10/246,539 patent/US7307981B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101039741B1 (ko) * | 2011-01-07 | 2011-06-09 | 주식회사 한솔환경산업 | 기계적 교반형 혐기성 소화조 |
Also Published As
Publication number | Publication date |
---|---|
US20030055629A1 (en) | 2003-03-20 |
US7307981B2 (en) | 2007-12-11 |
KR100460109B1 (ko) | 2004-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW519616B (en) | Method and apparatus for predictively quantizing voiced speech | |
US5995923A (en) | Method and apparatus for improving the voice quality of tandemed vocoders | |
KR100788706B1 (ko) | 광대역 음성 신호의 부호화/복호화 방법 | |
KR20070038041A (ko) | 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치 | |
KR20090035728A (ko) | 음성 믹싱 방법 및 그 방법을 이용하는 다지점 회의 서버와 컴퓨터 판독가능 기록 매체 | |
KR100434275B1 (ko) | 패킷 변환 장치 및 그를 이용한 패킷 변환 방법 | |
KR20050091082A (ko) | 향상된 품질의 음성 변환부호화를 위한 방법 및 장치 | |
JP2010170142A (ja) | ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置 | |
KR100460109B1 (ko) | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 | |
JP2004509367A (ja) | 複数チャネル信号の符号化及び復号化 | |
FI119576B (fi) | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
JP2005515486A (ja) | Celpによる音声符号間のトランスコーディング・スキーム | |
US20080162124A1 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
CN100585700C (zh) | 语音编码装置及其方法 | |
US7684978B2 (en) | Apparatus and method for transcoding between CELP type codecs having different bandwidths | |
KR100451622B1 (ko) | 통신용 보코더 및 이를 이용한 통신 방법 | |
JP3453116B2 (ja) | 音声符号化方法及び装置 | |
CN1135529C (zh) | 传送语音信号的通信网络 | |
Bakır | Compressing English Speech Data with Hybrid Methods without Data Loss | |
KR0135907B1 (ko) | 선스펙트럼쌍주파수의 벡터-스칼라 결합 양자화기(Vector and Scalar Quantizer of LSP Frequency) | |
Kwon et al. | A novel transcoding technique between EVRC and G. 729A for mobile multimedia devices | |
Shevchuk | Method of converting speech codec formats between G. 723.1 and G. 729A | |
Moriya | Technologies for speech and audio coding | |
Kart | Speaker-Dependent Speech Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121015 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20131016 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20141021 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20151020 Year of fee payment: 12 |
|
LAPS | Lapse due to unpaid annual fee |