RU2004138088A - Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник - Google Patents
Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник Download PDFInfo
- Publication number
- RU2004138088A RU2004138088A RU2004138088/09A RU2004138088A RU2004138088A RU 2004138088 A RU2004138088 A RU 2004138088A RU 2004138088/09 A RU2004138088/09 A RU 2004138088/09A RU 2004138088 A RU2004138088 A RU 2004138088A RU 2004138088 A RU2004138088 A RU 2004138088A
- Authority
- RU
- Russia
- Prior art keywords
- audio data
- pcm audio
- harmonic components
- data
- pcm
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims 12
- 238000000034 method Methods 0.000 title claims 8
- 238000000605 extraction Methods 0.000 title claims 5
- 238000013139 quantization Methods 0.000 claims 4
- 238000004590 computer program Methods 0.000 claims 2
- 239000000470 constituent Substances 0.000 claims 1
- 238000013500 data storage Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Claims (10)
1. Способ кодирования аудиосигнала с использованием гармонических составляющих, содержащий
(a) прием аудиоданных импульсно-кодовой модуляции (ИКМ) и извлечение гармонических составляющих из принятых аудиоданных ИКМ, с использованием психоакустической модели 2,
(b) выполнение модифицированного дискретного косинусного преобразования (МДКП) на принятых аудиоданных ИКМ, из которых удалены извлеченные гармонические составляющие, и
(c) квантование подвергнутых МДКП аудиоданных и формирование пакета аудиосигналов из квантованных аудиоданных и извлеченных гармонических составляющих.
2. Способ кодирования аудиосигнала с использованием гармонических составляющих, содержащий
(a) прием и сохранение аудиоданных ИКМ и использование психоакустической модели 2 на основании характеристик пределов слышимости человека к сохраненным данным для получения результата быстрого преобразования Фурье (БПФ), информации о перцепционной энергии относительно принятых данных и информации о распределении битов, используемую для квантования,
(b) извлечение гармонических составляющих из принятых аудиоданных ИКМ с использованием информации результата БПФ,
(c) кодирование извлеченных гармонических составляющих, выведение кодированных гармонических составляющих и декодирование кодированных гармонических составляющих,
(d) выполнение МДКП на некотором количестве выборок принятых аудиоданных ИКМ, из которых удалены извлеченные гармонические составляющие, зависящем от значения информации о перцепционной энергии,
(e) квантование подвергнутых МДКП аудиоданных посредством распределения битов в соответствии с информацией о распределении битов, и
(f) формирование пакета аудиосигналов из квантованных, подвергнутых МДКП аудиоданных и кодированных гармонических составляющих.
3. Способ кодирования аудиосигнала по п.2, в котором этап (b) содержит
(b1) получение звуковых давлений для множества принятых аудиоданных ИКМ с использованием информации результата БПФ,
(b2) выбор значения данных из множества аудиоданных ИКМ, для которых получено звуковое давление, и сначала извлечение только выбранного элемента данных аудиосигнала ИКМ, если значение аудиоданных ИКМ с правой и с левой сторон от выбранного значения аудиоданных ИКМ меньше, чем выбранное значение аудиоданных ИКМ,
(b3) применение этапа (b2) для всех принятых аудиоданных ИКМ,
(b4) затем извлечение только аудиоданных ИКМ, звуковые давления которых больше, чем предварительно определенное звуковое давление, из извлеченных первыми аудиоданных ИКМ, и
(b5) отсутствие выбора аудиоданных PCM, которые существуют в пределах предварительно определенного частотного диапазона, в зависимости от частотного расположения, среди аудиоданных ИКМ, извлеченных вторыми на этапе (b4).
4. Способ кодирования аудиосигнала по п.3, в котором предварительно определенное звуковое давление на этапе b5 составляет 7,0 дБ.
5. Способ кодирования аудиосигнала по п.2, в котором на этапе (d), если значение информации о перцепционной энергии больше, чем предварительно определенное пороговое значение, МДКП одновременно выполняется на 18 выборках, или если значение информации о перцепционной энергии меньше, чем предварительно определенное пороговое значение, МДКП одновременно выполняется на 36 выборках.
6. Устройство кодирования аудиосигнала с использованием гармонических составляющих, содержащее модуль хранения аудиоданных ИКМ, принимающий и сохраняющий аудиоданные ИКМ, модуль выполнения психоакустической модели 2, принимающий аудиоданные ИКМ от модуля хранения аудиоданных ИКМ и выполняющий психоакустическую модель 2 для получения информации результата БПФ, информации о перцепционной энергии относительно принятых данных и информацию о распределении битов, используемую для квантования, модуль извлечения гармоник, извлекающий гармонические составляющие из принятых аудиоданных ИКМ с использованием информации результата БПФ, модуль кодирования гармоник, кодирующий извлеченные гармонические составляющие и выводящий кодированные гармонические составляющие, модуль декодирования гармоник, декодирующий кодированные гармонические составляющие, модуль МДКП, выполняющий МДКП на сохраненных аудиоданных ИКМ, из которых удалены декодированные гармонические составляющие, в соответствии с информацией о перцепционной энергии, модуль квантования, квантующий подвергнутые МДКП аудиоданные в соответствии с информацией о распределении битов, и модуль формирования битового потока уровня III стандарта MPEG, преобразующий квантованные, подвергнутые МДКП аудиоданные и кодированные гармонические составляющие, полученные от модуля кодирования гармоник, в пакет аудиосигналов уровня III стандарта MPEG.
7. Устройство кодирования аудиосигнала по п.6, в котором модуль извлечения гармоник выполняет извлечение гармоник посредством следующих этапов: получение звуковых давлений для множества принятых аудиоданных ИКМ с использованием информации результата БПФ, выбор элемента данных из множества аудиоданных ИКМ, для которых получены звуковые давления, и сначала извлечение только выбранного элемента данных аудиосигнала ИКМ, если значение аудиоданных ИКМ с правой и с левой сторон от выбранного элемента данных аудиосигнала ИКМ меньше, чем значение выбранного элемента данных аудиосигнала ИКМ, применение выполненного первым извлечения ко всем принятым аудиоданным ИКМ и затем извлечение только аудиоданных ИКМ, звуковые давления которых больше предварительно определенного звукового давления, из извлеченных первыми аудиоданных ИКМ, и оставление аудиоданных ИКМ, которые существуют в пределах предварительно определенного частотного диапазона, в зависимости от частотного расположения, из извлеченных вторыми аудиоданных ИКМ.
8. Устройство кодирования аудиосигнала по п.6, в котором модуль МДКП выполняет МДКП одновременно на 18 выборках, если значение информации о перцепционной энергии больше, чем предварительно определенное пороговое значение, или выполняет МДКП одновременно на 36 выборках, если значение информации о перцепционной энергии меньше, чем предварительно определенное пороговое значение.
9. Машиночитаемый носитель записи, предназначенный для сохранения компьютерной программы для выполнения способа по п.1.
10. Машиночитаемый носитель записи, предназначенный для сохранения компьютерной программы для выполнения способа по п.2.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0036310A KR100462611B1 (ko) | 2002-06-27 | 2002-06-27 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
KR2002/36310 | 2002-06-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2004138088A true RU2004138088A (ru) | 2005-06-27 |
RU2289858C2 RU2289858C2 (ru) | 2006-12-20 |
Family
ID=27607091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2004138088/09A RU2289858C2 (ru) | 2002-06-27 | 2002-12-12 | Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник |
Country Status (9)
Country | Link |
---|---|
US (1) | US20040002854A1 (ru) |
JP (1) | JP2005531014A (ru) |
KR (1) | KR100462611B1 (ru) |
CN (1) | CN1262990C (ru) |
CA (1) | CA2490064A1 (ru) |
DE (1) | DE10297751B4 (ru) |
GB (1) | GB2408184B (ru) |
RU (1) | RU2289858C2 (ru) |
WO (1) | WO2003063135A1 (ru) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080120097A1 (en) * | 2004-03-30 | 2008-05-22 | Guy Fleishman | Apparatus and Method for Digital Coding of Sound |
US8209579B2 (en) | 2004-03-31 | 2012-06-26 | Intel Corporation | Generalized multi-threshold decoder for low-density parity check codes |
WO2005096509A1 (en) | 2004-03-31 | 2005-10-13 | Intel Corporation | Multi-threshold message passing decoding of low-density parity check codes |
US8019597B2 (en) | 2004-10-28 | 2011-09-13 | Panasonic Corporation | Scalable encoding apparatus, scalable decoding apparatus, and methods thereof |
WO2006073324A1 (en) | 2004-12-29 | 2006-07-13 | Intel Corporation | Channel estimation and fixed thresholds for multi-threshold decoding of low-density parity check codes |
KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
JP4720302B2 (ja) * | 2005-06-07 | 2011-07-13 | トヨタ自動車株式会社 | 自動変速機のクラッチ装置 |
KR100684029B1 (ko) * | 2005-09-13 | 2007-02-20 | 엘지전자 주식회사 | 푸리에 변환을 이용한 배음 생성 방법 및 이를 위한 장치,다운 샘플링에 의한 배음 생성 방법 및 이를 위한 장치와소리 보정 방법 및 이를 위한 장치 |
KR100788706B1 (ko) * | 2006-11-28 | 2007-12-26 | 삼성전자주식회사 | 광대역 음성 신호의 부호화/복호화 방법 |
MX2009013519A (es) | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada. |
US8631060B2 (en) | 2007-12-13 | 2014-01-14 | Qualcomm Incorporated | Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures |
RU2464540C2 (ru) * | 2007-12-13 | 2012-10-20 | Квэлкомм Инкорпорейтед | Быстрые алгоритмы для вычисления 5-точечного dct-ii, dct-iv и dst-iv, и архитектуры |
CN101552005A (zh) * | 2008-04-03 | 2009-10-07 | 华为技术有限公司 | 编码方法、解码方法、系统及装置 |
FI3573056T3 (fi) | 2008-07-11 | 2022-11-30 | Audiokooderi ja audiodekooderi | |
EP2304719B1 (en) | 2008-07-11 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, methods for providing an audio stream and computer program |
CN101751928B (zh) * | 2008-12-08 | 2012-06-13 | 扬智科技股份有限公司 | 应用音频帧频谱平坦度简化声学模型分析的方法及其装置 |
WO2011048099A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
AU2012217216B2 (en) * | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
KR102053900B1 (ko) * | 2011-05-13 | 2019-12-09 | 삼성전자주식회사 | 노이즈 필링방법, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기 |
RU2464649C1 (ru) * | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
JPH0364800A (ja) * | 1989-08-03 | 1991-03-20 | Ricoh Co Ltd | 音声符号化及び復号化方式 |
JP3266920B2 (ja) * | 1991-09-25 | 2002-03-18 | 三菱電機株式会社 | 音声符号化装置及び音声復号化装置並びに音声符号化復号化装置 |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
KR100458969B1 (ko) * | 1993-05-31 | 2005-04-06 | 소니 가부시끼 가이샤 | 신호부호화또는복호화장치,및신호부호화또는복호화방법 |
PL173718B1 (pl) * | 1993-06-30 | 1998-04-30 | Sony Corp | Sposób i urządzenie do kodowania sygnałów cyfrowych |
JPH0736486A (ja) * | 1993-07-22 | 1995-02-07 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JP3131542B2 (ja) * | 1993-11-25 | 2001-02-05 | シャープ株式会社 | 符号化復号化装置 |
TW321810B (ru) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP2778567B2 (ja) * | 1995-12-23 | 1998-07-23 | 日本電気株式会社 | 信号符号化装置及び方法 |
JPH09246983A (ja) * | 1996-03-08 | 1997-09-19 | Nec Eng Ltd | ディジタル信号処理装置 |
JPH10178349A (ja) * | 1996-12-19 | 1998-06-30 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化方法および復号方法 |
KR19980072457A (ko) * | 1997-03-05 | 1998-11-05 | 이준우 | 오디오 신호의 압축시 심리음향에서의 신호처리방법 및 그 장치 |
US5930373A (en) * | 1997-04-04 | 1999-07-27 | K.S. Waves Ltd. | Method and system for enhancing quality of sound signal |
DE19742201C1 (de) * | 1997-09-24 | 1999-02-04 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren von Audiosignalen |
US6704705B1 (en) * | 1998-09-04 | 2004-03-09 | Nortel Networks Limited | Perceptual audio coding |
KR100300887B1 (ko) * | 1999-02-24 | 2001-09-26 | 유수근 | 디지털 오디오 데이터의 역방향 디코딩 방법 |
JP2000267700A (ja) * | 1999-03-17 | 2000-09-29 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
JP2000276194A (ja) * | 1999-03-25 | 2000-10-06 | Yamaha Corp | 波形圧縮方法及び波形生成方法 |
US6377916B1 (en) * | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
DE10000934C1 (de) * | 2000-01-12 | 2001-09-27 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals |
JP4055336B2 (ja) * | 2000-07-05 | 2008-03-05 | 日本電気株式会社 | 音声符号化装置及びそれに用いる音声符号化方法 |
KR100348899B1 (ko) * | 2000-09-19 | 2002-08-14 | 한국전자통신연구원 | 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법 |
KR100378796B1 (ko) * | 2001-04-03 | 2003-04-03 | 엘지전자 주식회사 | 디지탈 오디오 부호화기 및 복호화 방법 |
US6732071B2 (en) * | 2001-09-27 | 2004-05-04 | Intel Corporation | Method, apparatus, and system for efficient rate control in audio encoding |
KR100472442B1 (ko) * | 2002-02-16 | 2005-03-08 | 삼성전자주식회사 | 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템 |
-
2002
- 2002-06-27 KR KR10-2002-0036310A patent/KR100462611B1/ko not_active IP Right Cessation
- 2002-12-12 DE DE10297751T patent/DE10297751B4/de not_active Expired - Fee Related
- 2002-12-12 GB GB0427660A patent/GB2408184B/en not_active Expired - Fee Related
- 2002-12-12 CN CNB028293487A patent/CN1262990C/zh not_active Expired - Fee Related
- 2002-12-12 JP JP2003562916A patent/JP2005531014A/ja active Pending
- 2002-12-12 WO PCT/KR2002/002348 patent/WO2003063135A1/en active Application Filing
- 2002-12-12 CA CA002490064A patent/CA2490064A1/en not_active Abandoned
- 2002-12-12 RU RU2004138088/09A patent/RU2289858C2/ru not_active IP Right Cessation
-
2003
- 2003-01-13 US US10/340,828 patent/US20040002854A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CA2490064A1 (en) | 2003-07-31 |
GB2408184B (en) | 2006-01-04 |
DE10297751B4 (de) | 2005-12-22 |
GB0427660D0 (en) | 2005-01-19 |
RU2289858C2 (ru) | 2006-12-20 |
KR20040001184A (ko) | 2004-01-07 |
CN1262990C (zh) | 2006-07-05 |
KR100462611B1 (ko) | 2004-12-20 |
WO2003063135A1 (en) | 2003-07-31 |
DE10297751T5 (de) | 2005-07-07 |
CN1639769A (zh) | 2005-07-13 |
US20040002854A1 (en) | 2004-01-01 |
GB2408184A (en) | 2005-05-18 |
JP2005531014A (ja) | 2005-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2004138088A (ru) | Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник | |
JP5107916B2 (ja) | オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置 | |
CN103258541B (zh) | 音频解码方法 | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
KR100571824B1 (ko) | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 | |
US7835907B2 (en) | Method and apparatus for low bit rate encoding and decoding | |
US20080133223A1 (en) | Method and apparatus to extract important frequency component of audio signal and method and apparatus to encode and/or decode audio signal using the same | |
JP2006011456A (ja) | 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体 | |
CA2717584A1 (en) | Method and apparatus for processing an audio signal | |
CN101583994A (zh) | 对音频和/或语音信号进行编码和/或解码的方法和设备 | |
JP2005531014A5 (ru) | ||
KR20100089772A (ko) | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 | |
JP5587599B2 (ja) | 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置 | |
KR20090013571A (ko) | 변환 부호화 방법 및 장치 | |
KR101261524B1 (ko) | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 | |
Wei et al. | Controlling bitrate steganography on AAC audio | |
KR100911994B1 (ko) | Hht를 이용한 음성 및 오디오 신호의 부호화/복호화장치 및 방법 | |
KR100754389B1 (ko) | 음성 및 오디오 신호 부호화 장치 및 방법 | |
JP3348759B2 (ja) | 変換符号化方法および変換復号化方法 | |
KR100928966B1 (ko) | 저비트율 부호화/복호화방법 및 장치 | |
KR20070050035A (ko) | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 | |
KR100940532B1 (ko) | 저비트율 복호화방법 및 장치 | |
Deepak et al. | Trajectory and surface modeling of LSF for low rate speech coding | |
KR101325760B1 (ko) | 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법 | |
WO2009136872A1 (en) | Method and device for encoding an audio signal, method and device for generating encoded audio data and method and device for determining a bit-rate of an encoded audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20191213 |