KR20080032240A - 오디오 부호화 장치 및 오디오 부호화 방법 - Google Patents
오디오 부호화 장치 및 오디오 부호화 방법 Download PDFInfo
- Publication number
- KR20080032240A KR20080032240A KR1020087004552A KR20087004552A KR20080032240A KR 20080032240 A KR20080032240 A KR 20080032240A KR 1020087004552 A KR1020087004552 A KR 1020087004552A KR 20087004552 A KR20087004552 A KR 20087004552A KR 20080032240 A KR20080032240 A KR 20080032240A
- Authority
- KR
- South Korea
- Prior art keywords
- bits
- frame
- audio signal
- block length
- divisions
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Abstract
Description
Claims (10)
- 오디오 신호의 부호화를 행하는 오디오 부호화 장치에 있어서,상기 오디오 신호를 분석하여, 양자화하는 데에 필요한 비트수를 나타내는 파라미터인 지각 엔트로피를 구하는 음향 분석부와,상기 오디오 신호를 부호화했을 때의 부호화 비트수를 감시하여, 현 프레임에서 사용가능한 비트수인 잉여 비트수를 구하는 부호화 비트수 감시부와,상기 지각 엔트로피와 상기 잉여 비트수와의 조합에 기초하여, 프리에코 및 비트 부족으로부터 생기는 음질 열화를 억제하는 부호화 블록 길이로 되도록, 상기 오디오 신호의 1 프레임을, 1부터 N까지 N 분할하기 위한 분할수를 결정하는 프레임 분할수 결정부와,결정된 상기 분할수에 의해 1 프레임을 분할하고, 분할된 블록 길이 단위로 상기 오디오 신호의 직교 변환을 행하여 직교 변환 계수를 구하는 직교 변환부와,상기 블록 길이 단위로 상기 직교 변환 계수의 양자화를 행하는 양자화부를 갖는 것을 특징으로 하는 오디오 부호화 장치.
- 제1항에 있어서,상기 프레임 분할수 결정부는, 상기 지각 엔트로피가 큰 값을 취하는 경우에는, 프리에코에 의한 음질 열화를 억제하기 위해 상기 분할수를 많게 하여 블록 길이가 작아지도록, 상기 잉여 비트수가 적은 경우에는, 비트 부족으로부터 생기는 음질 열화를 억제하기 위해 상기 분할수를 적게 하여 블록 길이가 커지도록, 상기 지각 엔트로피와 상기 잉여 비트수에 대한 상기 분할수의 관계를 정한 변환 맵을 갖는 것을 특징으로 하는 오디오 부호화 장치.
- 오디오 신호의 부호화를 행하는 오디오 부호화 장치에 있어서,상기 오디오 신호를 분석하여, 양자화하는 데에 필요한 비트수를 나타내는 파라미터인 지각 엔트로피를 구하는 음향 분석부와,상기 오디오 신호를 부호화했을 때의 부호화 비트수를 감시하여, 현 프레임에서 사용 가능한 비트수인 잉여 비트수를 구하는 부호화 비트수 감시부와,상기 지각 엔트로피와 상기 잉여 비트수와의 조합에 기초하여, 프리에코 및 비트 부족으로부터 생기는 음질 열화를 억제하는 부호화 블록 길이로 되도록, 상기 오디오 신호의 1 프레임을 분할하는 분할수를 결정하는 프레임 분할수 결정부와,상기 분할수를 N으로 했을 때에, N=1의 경우에는, 1 프레임 단위로 직교 변환을 행하여 제1 직교 변환 계수를 구하고, 최대 분할수를 Nmax로 했을 때에, N=Nmax의 경우에는, 상기 최대 분할수에 의해 1 프레임을 분할하고, 최대 분할된 블록 길이 단위로 상기 오디오 신호의 직교 변환을 행하여 제2 직교 변환 계수를 구하고, 1<N<Nmax의 경우에는, 상기 최대 분할수에 의해 1 프레임을 분할하여 상기 제2 직교 변환 계수를 구하고, 분할수 N에 의해 상기 제2 직교 변환 계수를 그룹화하는 직교 변환부와,N=1의 경우에는, 상기 제1 직교 변환 계수를 1 프레임 단위로 양자화하고, N=Nmax의 경우에는, 상기 제2 직교 변환 계수를 최대 분할된 블록 길이 단위로 양자화하고, 1<N<Nmax의 경우에는, 상기 제2 직교 변환 계수를 그룹화 단위로 양자화하는 양자화부를 갖는 것을 특징으로 하는 오디오 부호화 장치.
- 제3항에 있어서,상기 프레임 분할수 결정부는, 상기 지각 엔트로피가 큰 값을 취하는 경우에는, 프리에코에 의한 음질 열화를 억제하기 위해 상기 분할수를 많게 하여 블록 길이가 작아지도록, 상기 잉여 비트수가 적은 경우에는, 비트 부족으로부터 생기는 음질 열화를 억제하기 위해 상기 분할수를 적게 하여 블록 길이가 크게 되도록, 상기 지각 엔트로피와 상기 잉여 비트수에 대한 상기 분할수의 관계를 정한 변환 맵을 갖는 것을 특징으로 하는 오디오 부호화 장치.
- 제3항에 있어서,상기 직교 변환부는, 상기 오디오 신호의 변화점 근방의 블록 길이가 짧아지도록 그룹화의 경계를 설정하는 것을 특징으로 하는 오디오 부호화 장치.
- 오디오 신호의 부호화를 행하는 오디오 부호화 방법에 있어서,상기 오디오 신호를 분석하여, 양자화하는 데에 필요한 비트수를 나타내는 파라미터인 지각 엔트로피를 구하고,상기 오디오 신호를 부호화했을 때의 부호화 비트수를 감시하여, 현 프레임에서 사용 가능한 비트수인 잉여 비트수를 구하고,상기 지각 엔트로피와 상기 잉여 비트수와의 조합에 기초하여, 프리에코 및 비트 부족으로부터 생기는 음질 열화를 억제하는 부호화 블록 길이로 되도록, 상기 오디오 신호의 1 프레임을, 1부터 N까지 N 분할하기 위한 분할수를 결정하고,결정된 상기 분할수에 의해 1 프레임을 분할하고, 분할된 블록 길이 단위로 상기 오디오 신호의 직교 변환을 행하여 직교 변환 계수를 구하고,상기 블록 길이 단위로 상기 직교 변환 계수의 양자화를 행하는 것을 특징으로 하는 오디오 부호화 방법.
- 제6항에 있어서,상기 지각 엔트로피가 큰 값을 취하는 경우에는, 프리에코에 의한 음질 열화를 억제하기 위해 상기 분할수를 많게 하여 블록 길이가 작아지도록, 상기 잉여 비트수가 적은 경우에는, 비트 부족으로부터 생기는 음질 열화를 억제하기 위해 상기 분할수를 적게 하여 블록 길이가 크게 되도록, 상기 지각 엔트로피와 상기 잉여 비트수에 대한 상기 분할수의 관계를 정한 변환 맵을 갖는 것을 특징으로 하는 오디오 부호화 방법.
- 오디오 신호의 부호화를 행하는 오디오 부호화 방법에 있어서,상기 오디오 신호를 분석하여, 양자화하는 데에 필요한 비트수를 나타내는 파라미터인 지각 엔트로피를 구하고,상기 오디오 신호를 부호화했을 때의 부호화 비트수를 감시하여, 현 프레임에서 사용가능한 비트수인 잉여 비트수를 구하고,상기 지각 엔트로피와 상기 잉여 비트수와의 조합에 기초하여, 프리에코 및 비트 부족으로부터 생기는 음질 열화를 억제하는 부호화 블록 길이로 되도록, 상기 오디오 신호의 1 프레임을 분할하는 분할수를 결정하고,상기 분할수를 N으로 했을 때에, N=1의 경우에는, 1 프레임 단위로 직교 변환을 행하여 제1 직교 변환 계수를 구하고,최대 분할수를 Nmax로 했을 때에, N=Nmax의 경우에는, 상기 최대 분할수에 의해 1 프레임을 분할하고, 최대 분할된 블록 길이 단위로 상기 오디오 신호의 직교 변환을 행하여 제2 직교 변환 계수를 구하고,1<N<Nmax의 경우에는, 상기 최대 분할수에 의해 1 프레임을 분할하여 상기 제2 직교 변환 계수를 구하고, 분할수 N에 의해 상기 제2 직교 변환 계수를 그룹화하고,N=1의 경우에는, 상기 제1 직교 변환 계수를 1 프레임 단위로 양자화하고,N=Nmax의 경우에는, 상기 제2 직교 변환 계수를 최대 분할된 블록 길이 단위로 양자화하고,1<N<Nmax의 경우에는, 상기 제2 직교 변환 계수를 그룹화 단위로 양자화하는 것을 특징으로 하는 오디오 부호화 방법.
- 제8항에 있어서,상기 지각 엔트로피가 큰 값을 취하는 경우에는, 프리에코에 의한 음질 열화를 억제하기 위해 상기 분할수를 많게 하여 블록 길이가 작아지도록, 상기 잉여 비트수가 적은 경우에는, 비트 부족으로부터 생기는 음질 열화를 억제하기 위해 상기 분할수를 적게 하여 블록 길이가 크게 되도록, 상기 지각 엔트로피와 상기 잉여 비트수에 대한 상기 분할수의 관계를 정한 변환 맵을 갖는 것을 특징으로 하는 오디오 부호화 방법.
- 제8항에 있어서,상기 오디오 신호의 변화점 근방의 블록 길이가 짧아지도록 그룹화의 경계를 설정하는 것을 특징으로 하는 오디오 부호화 방법.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2005/016271 WO2007029304A1 (ja) | 2005-09-05 | 2005-09-05 | オーディオ符号化装置及びオーディオ符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080032240A true KR20080032240A (ko) | 2008-04-14 |
KR100979624B1 KR100979624B1 (ko) | 2010-09-01 |
Family
ID=37835441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087004552A KR100979624B1 (ko) | 2005-09-05 | 2005-09-05 | 오디오 부호화 장치 및 오디오 부호화 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7930185B2 (ko) |
EP (1) | EP1933305B1 (ko) |
JP (1) | JP4454664B2 (ko) |
KR (1) | KR100979624B1 (ko) |
WO (1) | WO2007029304A1 (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5182792B2 (ja) * | 2007-10-07 | 2013-04-17 | アルパイン株式会社 | マルチコアプロセッサ制御方法及び装置 |
US20090144054A1 (en) * | 2007-11-30 | 2009-06-04 | Kabushiki Kaisha Toshiba | Embedded system to perform frame switching |
US9245529B2 (en) * | 2009-06-18 | 2016-01-26 | Texas Instruments Incorporated | Adaptive encoding of a digital signal with one or more missing values |
JP5287546B2 (ja) * | 2009-06-29 | 2013-09-11 | 富士通株式会社 | 情報処理装置およびプログラム |
US9672840B2 (en) | 2011-10-27 | 2017-06-06 | Lg Electronics Inc. | Method for encoding voice signal, method for decoding voice signal, and apparatus using same |
CN103325373A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
JP5738480B2 (ja) * | 2012-04-02 | 2015-06-24 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置及びプログラム |
JP5734519B2 (ja) * | 2012-06-15 | 2015-06-17 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
US10210854B2 (en) * | 2015-09-15 | 2019-02-19 | Casio Computer Co., Ltd. | Waveform data structure, waveform data storage device, waveform data storing method, waveform data extracting device, waveform data extracting method and electronic musical instrument |
JP6146686B2 (ja) * | 2015-09-15 | 2017-06-14 | カシオ計算機株式会社 | データ構造、データ格納装置、データ取り出し装置および電子楽器 |
CN117746872A (zh) * | 2022-09-15 | 2024-03-22 | 抖音视界有限公司 | 音频编码方法、装置、设备及存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62139089A (ja) * | 1985-12-13 | 1987-06-22 | Nippon Telegr & Teleph Corp <Ntt> | ベクトル量子化方式 |
JP3010637B2 (ja) * | 1989-07-29 | 2000-02-21 | ソニー株式会社 | 量子化装置及び量子化方法 |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
JP3252005B2 (ja) | 1993-03-08 | 2002-01-28 | パイオニア株式会社 | 適応ブロック長変換符号化のブロック長選択装置 |
JPH09232964A (ja) * | 1996-02-20 | 1997-09-05 | Nippon Steel Corp | ブロック長可変型変換符号化装置および過渡状態検出装置 |
JP4499197B2 (ja) | 1997-07-03 | 2010-07-07 | ソニー株式会社 | ディジタル信号符号化装置及び方法、復号化装置及び方法、並びに伝送方法 |
US6499010B1 (en) * | 2000-01-04 | 2002-12-24 | Agere Systems Inc. | Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency |
US7930170B2 (en) * | 2001-01-11 | 2011-04-19 | Sasken Communication Technologies Limited | Computationally efficient audio coder |
JP4062971B2 (ja) * | 2002-05-27 | 2008-03-19 | 松下電器産業株式会社 | オーディオ信号符号化方法 |
JP2005003835A (ja) | 2003-06-11 | 2005-01-06 | Canon Inc | オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム |
WO2005004113A1 (ja) * | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
SG120118A1 (en) * | 2003-09-15 | 2006-03-28 | St Microelectronics Asia | A device and process for encoding audio data |
JP2005165056A (ja) * | 2003-12-03 | 2005-06-23 | Canon Inc | オーディオ信号符号化装置及び方法 |
US7627481B1 (en) * | 2005-04-19 | 2009-12-01 | Apple Inc. | Adapting masking thresholds for encoding a low frequency transient signal in audio data |
-
2005
- 2005-09-05 EP EP05776793A patent/EP1933305B1/en not_active Expired - Fee Related
- 2005-09-05 JP JP2007534206A patent/JP4454664B2/ja not_active Expired - Fee Related
- 2005-09-05 KR KR1020087004552A patent/KR100979624B1/ko active IP Right Grant
- 2005-09-05 WO PCT/JP2005/016271 patent/WO2007029304A1/ja active Application Filing
-
2008
- 2008-03-03 US US12/073,276 patent/US7930185B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7930185B2 (en) | 2011-04-19 |
KR100979624B1 (ko) | 2010-09-01 |
US20080154589A1 (en) | 2008-06-26 |
EP1933305A1 (en) | 2008-06-18 |
EP1933305B1 (en) | 2011-12-21 |
JPWO2007029304A1 (ja) | 2009-03-12 |
JP4454664B2 (ja) | 2010-04-21 |
EP1933305A4 (en) | 2009-08-26 |
WO2007029304A1 (ja) | 2007-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100979624B1 (ko) | 오디오 부호화 장치 및 오디오 부호화 방법 | |
JP6592148B2 (ja) | 高周波数の再構成方法を使用するコーディング・システムの性能拡大方法 | |
US7613603B2 (en) | Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model | |
US7460993B2 (en) | Adaptive window-size selection in transform coding | |
FI84538B (fi) | Foerfarande foer transmission av digitaliska audiosignaler. | |
EP1483759B1 (en) | Scalable audio coding | |
US6122618A (en) | Scalable audio coding/decoding method and apparatus | |
KR100871999B1 (ko) | 오디오 코딩 | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
US20080312759A1 (en) | Flexible frequency and time partitioning in perceptual transform coding of audio | |
US20140257824A1 (en) | Apparatus and a method for encoding an input signal | |
EP2202724B1 (en) | Audio encoding apparatus and method | |
JP4021124B2 (ja) | デジタル音響信号符号化装置、方法及び記録媒体 | |
EP1187101B1 (en) | Method and apparatus for preclassification of audio material in digital audio compression applications | |
JP2008158301A (ja) | 信号処理装置、信号処理方法、再生装置、再生方法、電子機器 | |
JP2000151413A (ja) | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 | |
KR960012477B1 (ko) | 인지 정보량을 이용한 적응적 스테레오 디지탈 오디오 부호화 및 복호화장치 | |
KR20050040441A (ko) | 스케일러블 오디오 복/부호화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130801 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140808 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150730 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160727 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170804 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180730 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20190729 Year of fee payment: 10 |