KR100315692B1 - 가변 비율 음성부호화기의 음성 부호화 비율 결정장치 및방법 - Google Patents
가변 비율 음성부호화기의 음성 부호화 비율 결정장치 및방법 Download PDFInfo
- Publication number
- KR100315692B1 KR100315692B1 KR1019990052580A KR19990052580A KR100315692B1 KR 100315692 B1 KR100315692 B1 KR 100315692B1 KR 1019990052580 A KR1019990052580 A KR 1019990052580A KR 19990052580 A KR19990052580 A KR 19990052580A KR 100315692 B1 KR100315692 B1 KR 100315692B1
- Authority
- KR
- South Korea
- Prior art keywords
- rate
- energy
- signal energy
- signal
- log
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 27
- 230000007774 longterm Effects 0.000 claims abstract description 28
- 206010019133 Hangover Diseases 0.000 claims description 20
- 230000007423 decrease Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 8
- 230000007704 transition Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/69—Spread spectrum techniques
- H04B1/707—Spread spectrum techniques using direct sequence modulation
- H04B1/7097—Interference-related aspects
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
입 력 | |
롱-텀 예측 이득 | β |
제 1 자기상관계수(신호 에너지) | R[0] |
최대 비율 구속장 | rmax |
최소 비율 구속장 | rmin |
출 력 | |
결정된 음성 부호화 비율 | r |
상 태 변 수 | |
이전 프레임의 비율 결정치 | rlast |
평균 로그 신호 에너지(신호에너지의 로그치 평균) | |
평균 로그 잡음 에너지(잡음에너지의 로그치 평균) | |
평활화 최소 트래킹 신호 에너지 | Et |
이전프레임의 로그치 신호에너지 | Elast |
로그 잡음 에너지의 변동량 | σn |
신호의 평균 교차율 | |
듀얼-타임-콘스턴트 필터에 사용된 임계치 | T3 |
이전 주변 잡음 갱신 결정치 | dlast |
신호 에너지의 급격한 강하를 나타내는 플래그 | fd |
행오버 프레임들의 남은 개수 | h |
중 간 변 수 | |
주변 잡음 갱신 결정치 | d |
교차 신호 | x[n] |
Claims (19)
- 가변 비율 음성부호화기의 음성 부호화 비율 결정장치에 있어서,주변 잡음 에너지와 그 변동량을 참조하여 소정의 임계치를 설정하는 임계치 설정부와,신호 에너지와 롱-텀 예측 이득을 입력하고 상기 신호 에너지의 로그치를 계산하는 로그치 신호 에너지 계산부와,상기 계산된 로그치 신호 에너지를 상기 임계치 설정부에서 설정된 임계치와 비교하여 음성부호화 비율을 결정하는 비율 결정부로 구성됨을 특징으로 하는 장치.
- 가변 비율 음성부호화기의 음성 부호화 비율 결정장치에 있어서,신호 에너지와 롱-텀 예측 이득을 입력하고 상기 로그치 신호 에너지를 계산하는 로그치 신호 에너지 계산부와,주변 잡음 에너지와 그 변동량을 참조하여 적어도 두 개 이상의 임계치를 설정하는 임계치 설정부와,상기 계산된 로그치 신호 에너지를 상기 임계치 설정부에서 설정된 임계치들과 비교하여 예비 비율과 행오버 간격을 결정하는 예비 비율 결정부와,행오버 구속장들, 낮은 롱-텀 예측 이득 그리고 최소 및 최대 비율 구속장들을 고려하여 상기 예비 비율을 수정하고, 그 수정된 비율을 최종적으로 결정된 음성부호화 비율로서 출력하는 예비 비율 수정부로 구성됨을 특징으로 하는 장치.
- 제2항에 있어서,상기 예비 비율 수정부는 미리 정한 제1특정 롱-텀 예측 이득의 범위 (β<0.2)를 고려하여 하기 식과 같이 예비 비율(r)을 수정하여 최종적인 음성 부호화 비율을 결정하며,제2특정 롱-텀 예측 이득의 범위(β<0.1)를 고려하여 하기 식과 같이 행오버 간격(h)을 수정하여 최종적인 행오버 간격을 결정함을 특징으로 하는 장치.
- 제2항에 있어서,상기 로그치 신호 에너지 계산부에서 출력되는 로그치 신호 에너지(E)는 다음 식과 같이 계산함을 특징으로 하는 장치.
- 제4항에 있어서,상기 임계치 결정부는 제1 및 제2 임계치(T1, T2)를 하기 식과 같이 계산함을 특징으로 하는 장치.T1=+ 6T2=+ 3: 평균 로그 잡음 에너지: 로그 잡음 에너지의 변동량
- 제5항에 있어서,상기 예비 비율 결정부는 예비 비율(r)과 행오버 간격(h)을 하기 식과 같이 계산함을 특징으로 하는 장치.
- 제6항에 있어서,상기 예비 비율 수정부는 미리 정한 제1특정 롱-텀 예측 이득(β)의 범위를 고려하여 하기 식과 같이 예비 비율(r)을 수정하여 최종적인 음성 부호화 비율을 결정하며,제2특정 롱-텀 예측 이득(β)의 범위를 고려하여 하기 식과 같이 행오버 간격(h)을 수정하여 최종적인 행오버 간격을 결정함을 특징으로 하는 장치.
- 제7항에 있어서,미리 정한 소정 값은 0.35임을 특징으로 하는 장치.
- 제2항에 있어서,음성부호화 비율(r)을 결정한 다음, 상기 임계치 설정부에서 임계치들(T1, T2)을 계산하는 데 이용되는 변수를 갱신하기 위한 변수 갱신부를 더 구비함을 특징으로 하는 장치.
- 제9항에 있어서,상기 임계치들(T1, T2)은 잡음 레벨 및 그 변동량의 추정치들과 평균 신호 에너지 추정치들에 의해 차례로 결정됨을 특징으로 하는 장치.
- 제9항에 있어서,상기 변수 갱신부는 현재의 신호가 주변 잡음만으로 이루어진 경우 잡음에너지와 그 변동량을 갱신하는 잡음변수 갱신부분과,신호 에너지가 증가할 때는 롱-텀 평균치를, 신호 에너지가 감소할 때 쇼트-텀 평균치를 다음 수학식과 같이 계산하는 신호변수 갱신부분으로 구성됨을 특징으로 하는 장치.
- 제11항에 있어서,상기 신호변수 갱신부분은 듀얼-타임 콘스턴트 필터를 구비하며,신호 에너지의 급강하 여부를 판단하기 위해 상기 듀얼-타임 콘스턴트 필터에서 사용되는 임계치(T3)는 다음 수학식에 따라 계산되는 값임을 특징으로 하는 장치.
- 제11항에 있어서,상기 신호변수 갱신부분은 최소 트래킹 신호에너지(Et)를 다음 수학식과 같이 계산함을 특징으로 하는 장치.
- 제11항 내지 제13항중 어느 하나의 항에 있어서,평균교차율([n])이 미리 정한 특정 값 보다 높을 때 신호가 주변 잡음만으로 이루어진 것으로 판단하기 위해, 교차 신호 x[n]을 다음과 같이 n번째 음성 프레임내의 신호 에너지가 평균 로그 신호에너지()와 교차할 때 1로 발생하고, 그렇지 않을 때에는 0으로 발생하는 변수 추정 결정부분을 더 구비함을 특징으로 하는 장치.
- 제14항에 있어서,상기 평균교차율([n])은 시상수 0.98을 가지며, 입력 신호 x[n]에 대하여 다음과 같이 나타내어지는 단일 폴 필터의 출력임을 특징으로 하는 장치.[n] = 0.98[n-1] + 0.02x[n]
- 제14항에 있어서,상기 평균교차율([n])이 미리 정한 소정 값보다 높으면,평균 로그 잡음 에너지()는 평균 로그 신호 에너지()로,로그 잡음 에너지의 변동량()은 평균 로그 신호 에너지에 최종 프레임에너지의 로그를 뺀 값()으로,듀얼-타임-콘스턴트 필터에 사용된 임계치(T3)는 1로,이전 백그라운드 잡음 갱신 결정자(dlast)는 1로,신호의 평균 교차율([n])은 0으로 초기화하는 리셋 로직을 더 구비함을 특징으로 하는 장치.
- 가변 비율 음성부호화기의 음성 부호화 비율 결정방법에 있어서,로그치 신호 에너지를 계산하는 제1과정과,상기 로그치 신호 에너지를 미리 설정된 임계치들과 비교하여 예비 비율 결정치와 행오버 값을 결정하는 제2과정과,행오버 구속장들, 롱-텀 예측 이득 그리고 최소 및 최대 비율 구속장들을 고려하여 상기 예비 비율 결정치를 수정하여 음성부호화 비율을 결정하는 제3과정으로 이루어짐을 특징으로 하는 방법.
- 제17항에 있어서,상기 제3과정 수행후, 프레임이 주변 잡음만으로 이루어졌는지 여부를 체크하여 주변 잡음만으로 이루어진 경우에는 잡음변수들과 신호변수들을 갱신하는 제4과정을 더 포함함을 특징으로 하는 방법.
- 제17항에 있어서,상기 제1과정에서, 해당 프레임이 첫 번째 프레임인 경우에는 변수들을 초기화하는 제1-1단계를 더 포함함을 특징으로 하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/265,455 US6397177B1 (en) | 1999-03-10 | 1999-03-10 | Speech-encoding rate decision apparatus and method in a variable rate |
US09/265,455 | 1999-03-10 | ||
US9/265,455 | 1999-03-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000062171A KR20000062171A (ko) | 2000-10-25 |
KR100315692B1 true KR100315692B1 (ko) | 2001-12-13 |
Family
ID=23010518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990052580A KR100315692B1 (ko) | 1999-03-10 | 1999-11-25 | 가변 비율 음성부호화기의 음성 부호화 비율 결정장치 및방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6397177B1 (ko) |
KR (1) | KR100315692B1 (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1177668A2 (en) * | 1999-05-10 | 2002-02-06 | Nokia Corporation | Header compression |
US7080009B2 (en) * | 2000-05-01 | 2006-07-18 | Motorola, Inc. | Method and apparatus for reducing rate determination errors and their artifacts |
US6745012B1 (en) * | 2000-11-17 | 2004-06-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive data compression in a wireless telecommunications system |
TW200409454A (en) * | 2002-11-18 | 2004-06-01 | Winbond Electronics Corp | Automatic gain controller and its controlling method |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
US20070160154A1 (en) * | 2005-03-28 | 2007-07-12 | Sukkar Rafid A | Method and apparatus for injecting comfort noise in a communications signal |
US20070061727A1 (en) * | 2005-09-15 | 2007-03-15 | Honeywell International Inc. | Adaptive key frame extraction from video data |
KR100883656B1 (ko) * | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN102610234B (zh) * | 2012-04-09 | 2013-10-30 | 河海大学 | 信号复杂度和编码速率选择的映射实现方法 |
CN105023579A (zh) * | 2014-04-30 | 2015-11-04 | 中国电信股份有限公司 | 语音通信中语音编码实现方法、装置和通信终端 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU671952B2 (en) * | 1991-06-11 | 1996-09-19 | Qualcomm Incorporated | Variable rate vocoder |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6104993A (en) * | 1997-02-26 | 2000-08-15 | Motorola, Inc. | Apparatus and method for rate determination in a communication system |
US6122610A (en) * | 1998-09-23 | 2000-09-19 | Verance Corporation | Noise suppression for low bitrate speech coder |
-
1999
- 1999-03-10 US US09/265,455 patent/US6397177B1/en not_active Expired - Lifetime
- 1999-11-25 KR KR1019990052580A patent/KR100315692B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US6397177B1 (en) | 2002-05-28 |
KR20000062171A (ko) | 2000-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7983906B2 (en) | Adaptive voice mode extension for a voice activity detector | |
EP1340223B1 (en) | Method and apparatus for robust speech classification | |
KR100581413B1 (ko) | 음성 복호기에서 프레임 오류 은폐를 위한 개선된스펙트럼 매개변수 대체 | |
KR100742443B1 (ko) | 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법 | |
KR101158291B1 (ko) | 음성 활동 검출 디바이스 및 방법 | |
US5341456A (en) | Method for determining speech encoding rate in a variable rate vocoder | |
US6275794B1 (en) | System for detecting voice activity and background noise/silence in a speech signal using pitch and signal to noise ratio information | |
US20120215536A1 (en) | Methods and Voice Activity Detectors for Speech Encoders | |
MXPA04011751A (es) | Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal. | |
KR100315692B1 (ko) | 가변 비율 음성부호화기의 음성 부호화 비율 결정장치 및방법 | |
US9443526B2 (en) | Generation of comfort noise | |
WO2012161881A1 (en) | Noise-robust speech coding mode classification | |
US7231348B1 (en) | Tone detection algorithm for a voice activity detector | |
US20100106490A1 (en) | Method and Speech Encoder with Length Adjustment of DTX Hangover Period | |
US6226607B1 (en) | Method and apparatus for eighth-rate random number generation for speech coders | |
US6564182B1 (en) | Look-ahead pitch determination | |
US9208796B2 (en) | Estimation of speech energy based on code excited linear prediction (CELP) parameters extracted from a partially-decoded CELP-encoded bit stream and applications of same | |
JPH10207491A (ja) | 背景音/音声分類方法、有声/無声分類方法および背景音復号方法 | |
EP1129451A1 (en) | Closed-loop variable-rate multimode predictive speech coder | |
WO2001003114A1 (en) | Location and coding of unvoiced plosives in linear predictive coding of speech | |
Oh et al. | Output Recursively Adaptive (ORA) Tree Coding of Speech with VAD/CNG | |
KR20160065054A (ko) | 부호화 방식 결정 방법 및 장치 | |
KR20150053891A (ko) | 부호화 방식 결정 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121030 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20131030 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20141030 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20150930 Year of fee payment: 15 |
|
FPAY | Annual fee payment |
Payment date: 20161028 Year of fee payment: 16 |
|
FPAY | Annual fee payment |
Payment date: 20170929 Year of fee payment: 17 |
|
LAPS | Lapse due to unpaid annual fee |