KR100338211B1 - 음성의 부호화 및 복호화 방법 및 장치 - Google Patents
음성의 부호화 및 복호화 방법 및 장치 Download PDFInfo
- Publication number
- KR100338211B1 KR100338211B1 KR1019990019136A KR19990019136A KR100338211B1 KR 100338211 B1 KR100338211 B1 KR 100338211B1 KR 1019990019136 A KR1019990019136 A KR 1019990019136A KR 19990019136 A KR19990019136 A KR 19990019136A KR 100338211 B1 KR100338211 B1 KR 100338211B1
- Authority
- KR
- South Korea
- Prior art keywords
- finite length
- repetition
- unvoiced
- speech
- bits
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000005284 excitation Effects 0.000 claims description 18
- 230000000737 periodic effect Effects 0.000 claims description 4
- 238000007796 conventional method Methods 0.000 abstract 1
- 239000011159 matrix material Substances 0.000 description 15
- 239000013598 vector Substances 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- MECHNRXZTMCUDQ-RKHKHRCZSA-N vitamin D2 Chemical compound C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)/C=C/[C@H](C)C(C)C)=C\C=C1\C[C@@H](O)CCC1=C MECHNRXZTMCUDQ-RKHKHRCZSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (10)
- 무작위성(random properties)을 갖는 신호를 부호화하는 방법에 있어서,상기 신호를 유한 길이 블록들(finite length blocks)로 분할하는 단계와,상기 유한 길이 블록들을 단기 주기성(short term periodic properties)에 대해 해석하여 반복 계수(repetition factor)를 생성하는 단계와,각 유한 길이 블록을 부호화하여 순열(sequence)-상기 순열은 유한 길이 블록보다 상당히 작음-을 표시하는 코드북 인덱스(codebook index)를 생성하는 단계와,상기 코드북 인덱스와 반복 계수를 목적지(destination)로 전송하는 단계를 포함하는 것을 특징으로 하는 신호 부호화 방법.
- 제1항에 있어서, 상기 유한 길이 블록이 서브프레임(subframe)을 더 포함하는 것을 특징으로 하는 신호 부호화 방법.
- 제1항에 있어서, 상기 유한 길이 블록들을 단기 주기성에 대해 해석하여 각 프레임에 대한 반복 계수를 생성하는 단계는, 상기 유한 길이 블록들을 단기 주기성에 대해 해석하여 각 프레임에 대한 독립 반복 계수(independent repetition factor)를 제공하는 단계를 더 포함하는 것을 특징으로 하는 신호 부호화 방법.
- 제1항에 있어서, 상기 코드북 인덱스와 반복 계수는 CELP 음성 부호화기(CEKP speech coder)에서 여기 순열(excitation sequence)을 표시하는 신호 부호화 방법.
- 음성 부호화 방법에 있어서,입력 신호의 적어도 하나의 특성에 기초하여 상기 입력 신호의 성음 모드(voicing mode)를 결정하는 단계와,상기 성음 모드가 무성음일 때 상기 입력 신호를 해석하여 자기상관관계 순열(autocorrelation sequence)을 생성하는 단계와,상기 자기상관관계 순열의 최대치에 기초하여 단기 반복 계수들을 생성하는 단계와,상기 성음 모드가 무성음일 때 상기 단기 반복 계수들에 코드워드(codeword) 내의 비트들을 할당하는 단계를 포함하는 것을 특징으로 하는 음성 부호화 방법.
- 제5항에 있어서, 성음 모드가 무성음일 때 4 kbps 음성 부호화기에서 반복 계수 τs에 대해 12 비트가 할당되고, 코드북 인덱스 k에 대해 36 비트가 할당되는 음성 부호화 방법.
- 제5항에 있어서, 성음 모드가 무성음일 때 5.5 kbps 음성 부호화기에서 반복 계수 τs에 대해 12 비트가 할당되고, 코드북 인덱스 k에 대해 60 비트가 할당되는 음성 부호화 방법.
- 무작위성을 갖는 신호를 부호화하기 위한 장치에 있어서,상기 신호를 유한 길이 블록들로 분할하는 수단과,상기 유한 길이 블록들을 단기 주기성에 대해 해석하여 반복 계수를 생성하는 수단과,각 유한 길이 블록을 부호화하여 유한 길이 블럭보다 작은 순열을 표시하는 코드북 인덱스(codebook index)를 생성하는 수단과,상기 코드북 인덱스와 반복 계수를 목적지로 전송하는 수단을 포함하는 것을 특징으로 하는 신호 부호화 장치.
- 제8항에 있어서, 상기 유한 길이 블록이 서브프레임을 더 포함하는 것을 특징으로 하는 신호 부호화 장치.
- 제8항에 있어서, 상기 코드북 인덱스와 반복 계수는 CELP 음성 부호화기에서 여기 순열(excitation sequence)을 표시하는 신호 부호화 장치.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/086,396 US6415252B1 (en) | 1998-05-28 | 1998-05-28 | Method and apparatus for coding and decoding speech |
US9/086,396 | 1998-05-28 | ||
US09/086,396 | 1998-05-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990088578A KR19990088578A (ko) | 1999-12-27 |
KR100338211B1 true KR100338211B1 (ko) | 2002-05-27 |
Family
ID=22198309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990019136A KR100338211B1 (ko) | 1998-05-28 | 1999-05-27 | 음성의 부호화 및 복호화 방법 및 장치 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6415252B1 (ko) |
KR (1) | KR100338211B1 (ko) |
BR (1) | BRPI9902603B1 (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69708693C5 (de) * | 1996-11-07 | 2021-10-28 | Godo Kaisha Ip Bridge 1 | Verfahren und Vorrichtung für CELP Sprachcodierung oder -decodierung |
CN1494055A (zh) | 1997-12-24 | 2004-05-05 | ������������ʽ���� | 声音编码方法和声音译码方法以及声音编码装置和声音译码装置 |
CN1335980A (zh) * | 1999-11-10 | 2002-02-13 | 皇家菲利浦电子有限公司 | 借助于映射矩阵的宽频带语音合成 |
US6980948B2 (en) * | 2000-09-15 | 2005-12-27 | Mindspeed Technologies, Inc. | System of dynamic pulse position tracks for pulse-like excitation in speech coding |
KR100463417B1 (ko) * | 2002-10-10 | 2004-12-23 | 한국전자통신연구원 | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
KR101610765B1 (ko) | 2008-10-31 | 2016-04-11 | 삼성전자주식회사 | 음성 신호의 부호화/복호화 방법 및 장치 |
US8670990B2 (en) * | 2009-08-03 | 2014-03-11 | Broadcom Corporation | Dynamic time scale modification for reduced bit rate audio coding |
CN111370009B (zh) | 2013-10-18 | 2023-12-22 | 弗朗霍夫应用科学研究促进协会 | 使用语音相关的频谱整形信息编码音频信号和解码音频信号的概念 |
EP3058569B1 (en) * | 2013-10-18 | 2020-12-09 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5138661A (en) * | 1990-11-13 | 1992-08-11 | General Electric Company | Linear predictive codeword excited speech synthesizer |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
IT1270438B (it) * | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
JP3840684B2 (ja) * | 1996-02-01 | 2006-11-01 | ソニー株式会社 | ピッチ抽出装置及びピッチ抽出方法 |
FI113903B (fi) * | 1997-05-07 | 2004-06-30 | Nokia Corp | Puheen koodaus |
-
1998
- 1998-05-28 US US09/086,396 patent/US6415252B1/en not_active Expired - Lifetime
-
1999
- 1999-05-27 KR KR1019990019136A patent/KR100338211B1/ko not_active IP Right Cessation
- 1999-05-27 BR BRPI9902603A patent/BRPI9902603B1/pt active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
BR9902603A (pt) | 2000-01-18 |
KR19990088578A (ko) | 1999-12-27 |
BRPI9902603B1 (pt) | 2016-11-16 |
US6415252B1 (en) | 2002-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2102619T3 (en) | METHOD AND DEVICE FOR CODING TRANSITION FRAMEWORK IN SPEECH SIGNALS | |
Salami et al. | Design and description of CS-ACELP: A toll quality 8 kb/s speech coder | |
US7433815B2 (en) | Method and apparatus for voice transcoding between variable rate coders | |
EP1235203B1 (en) | Method for concealing erased speech frames and decoder therefor | |
US6556966B1 (en) | Codebook structure for changeable pulse multimode speech coding | |
US6141638A (en) | Method and apparatus for coding an information signal | |
EP3352169B1 (en) | Unvoiced decision for speech processing | |
Hasegawa-Johnson et al. | Speech coding: Fundamentals and applications | |
KR20020052191A (ko) | 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법 | |
KR20010024935A (ko) | 음성 코딩 | |
US6678651B2 (en) | Short-term enhancement in CELP speech coding | |
KR100338211B1 (ko) | 음성의 부호화 및 복호화 방법 및 장치 | |
US6826527B1 (en) | Concealment of frame erasures and method | |
US7596491B1 (en) | Layered CELP system and method | |
Jelinek et al. | Wideband speech coding advances in VMR-WB standard | |
Paksoy et al. | A variable rate multimodal speech coder with gain-matched analysis-by-synthesis | |
EP2951824B1 (en) | Adaptive high-pass post-filter | |
EP1103953B1 (en) | Method for concealing erased speech frames | |
Bergstrom et al. | Code-book driven glottal pulse analysis | |
Bessette et al. | Techniques for high-quality ACELP coding of wideband speech | |
KR100409167B1 (ko) | 정보 신호를 부호화하는 방법 및 장치 | |
KR100540707B1 (ko) | 저비트율 씨이엘피용 펄스여기에 고주파 노이즈를도입하는 시스템 및 방법 | |
McCree | Low-bit-rate speech coding | |
Hagen et al. | An 8 kbit/s ACELP coder with improved background noise performance | |
EP1212750A1 (en) | Multimode vselp speech coder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130429 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20140430 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20150428 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20160427 Year of fee payment: 15 |
|
FPAY | Annual fee payment |
Payment date: 20170428 Year of fee payment: 16 |
|
FPAY | Annual fee payment |
Payment date: 20180430 Year of fee payment: 17 |
|
LAPS | Lapse due to unpaid annual fee |