RU2007111717A - Устройство масштабируемого кодирования, устройство масштабируемого декодирования и его способ - Google Patents
Устройство масштабируемого кодирования, устройство масштабируемого декодирования и его способ Download PDFInfo
- Publication number
- RU2007111717A RU2007111717A RU2007111717/09A RU2007111717A RU2007111717A RU 2007111717 A RU2007111717 A RU 2007111717A RU 2007111717/09 A RU2007111717/09 A RU 2007111717/09A RU 2007111717 A RU2007111717 A RU 2007111717A RU 2007111717 A RU2007111717 A RU 2007111717A
- Authority
- RU
- Russia
- Prior art keywords
- channel
- signal
- monophonic
- coding
- unit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 11
- 230000005284 excitation Effects 0.000 claims 6
- 230000003044 adaptive effect Effects 0.000 claims 2
- 230000005236 sound signal Effects 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Stereo-Broadcasting Methods (AREA)
Claims (18)
1. Устройство масштабируемого кодирования, содержащее:
блок генерирования, который генерирует монофонический речевой сигнал из стереофонического речевого сигнала, который включает в себя сигнал первого канала и сигнал второго канала;
блок монофонического кодирования, который кодирует монофонический речевой сигнал, используя способ CELP;
блок расчета, который рассчитывает искажения кодирования сигнала второго канала, которые возникают при кодировании CELP; и
блок кодирования первого канала, который кодирует сигнал первого канала, используя способ CELP, и получает кодированный параметр сигнала первого канала для минимизации суммы искажений кодирования сигнала первого канала, которые происходят при кодировании, и искажений кодирования сигнала второго канала, рассчитанных блоком расчета.
2. Устройство масштабируемого кодирования по п.1, в котором:
блок монофонического кодирования генерирует синтезированный монофонический сигнал, применяя кодированный параметр, полученный путем кодирования монофонического речевого сигнала, с использованием способа CELP;
блок кодирования первого канала генерирует синтезированный сигнал первого канала, используя кодированный параметр, полученный путем кодирования сигнала первого канала, с использованием способа CELP; и
блок расчета генерирует синтезированный сигнал второго канала, используя синтезированный монофонический сигнал и синтезированный сигнал первого канала, рассчитывает разность между сигналом второго канала и синтезированным сигналом второго канала, и, таким образом, рассчитывает искажения кодирования сигнала второго канала, которые возникают при кодировании CELP.
3. Устройство масштабируемого кодирования по п.1, в котором кодирование не выполняют для сигнала второго канала.
4. Устройство масштабируемого кодирования по п.1, в котором сумма представляет собой сумму взвешенных искажений для искажений кодирования сигнала первого канала и искажений кодирования сигнала второго канала.
5. Устройство масштабируемого кодирования по п.1, в котором:
блок монофонического кодирования выводит кодированный параметр, полученный путем выполнения анализа линейного прогнозирования для монофонического речевого сигнала, в блок кодирования первого канала; и
блок кодирования первого канала кодирует разность между кодированным параметром, полученным путем выполнения анализа линейного прогнозирования для сигнала первого канала, и кодированным параметром, выводимым из блока монофонического кодирования.
6. Устройство масштабируемого кодирования по п.1, в котором:
блок монофонического кодирования выводит кодированный параметр, полученный в результате поиска в кодовой книге адаптивного возбуждения для монофонического речевого сигнала, в блок кодирования первого канала; и
блок кодирования первого канала кодирует разность между параметром, полученным путем поиска в кодовой книге адаптивного возбуждения для сигнала первого канала, и кодированным параметром, выводимым из блока монофонического кодирования.
7. Устройство масштабируемого кодирования по п.1, в котором:
блок монофонического кодирования выводит индекс кодовой книги фиксированного возбуждения, полученный в результате поиска в кодовой книге фиксированного возбуждения для монофонического речевого сигнала, в блок кодирования первого канала; и
блок кодирования первого канала использует индекс кодовой книги фиксированного возбуждения, выводимый из блока кодирования первого канала, как индекс кодовой книги фиксированного возбуждения сигнала первого канала.
8. Устройство масштабируемого кодирования по п.1, в котором блок генерирования получает среднее значение сигнала первого канала и сигнала второго канала, и устанавливает это среднее значение как монофонический речевой сигнал.
9. Устройство масштабируемого декодирования, которое соответствует устройству масштабируемого кодирования по п.1, причем устройство масштабируемого декодирования содержит:
блок монофонического декодирования, который декодирует монофонический речевой сигнал, используя кодированный параметр, выводимый из блока монофонического кодирования;
блок декодирования первого канала, который декодирует сигнал первого канала стереофонического речевого сигнала, используя кодированный параметр, выводимый из блока кодирования первого канала; и
блок декодирования второго канала, который декодирует сигнал второго канала стереофонического речевого сигнала, используя монофонический речевой сигнал и сигнал первого канала стереофонического речевого сигнала.
10. Устройство масштабируемого декодирования, которое соответствует устройству масштабируемого кодирования по п.5, причем устройство масштабируемого декодирования содержит:
блок монофонического декодирования, который декодирует монофонический речевой сигнал, используя кодированный параметр, выводимый из блока монофонического кодирования;
блок декодирования первого канала, который декодирует сигнал первого канала стереофонического речевого сигнала, используя кодированный параметр, выводимый из блока монофонического кодирования, и кодированный параметр, поступающий с выхода блока кодирования первого канала; и
блок декодирования второго канала, который декодирует сигнал второго канала стереофонического речевого сигнала, используя монофонический речевой сигнал и сигнал первого канала стереофонического речевого сигнала.
11. Устройство масштабируемого декодирования, которое соответствует устройству масштабируемого кодирования по п.6, причем устройство масштабируемого декодирования содержит:
блок монофонического декодирования, который декодирует монофонический речевой сигнал, используя кодированный параметр, выводимый из блока монофонического кодирования;
блок декодирования первого канала, который декодирует сигнал первого канала стереофонического речевого сигнала, используя кодированный параметр, выводимый из блока монофонического кодирования, и кодированный параметр, выводимый из блока кодирования первого канала; и
блок декодирования второго канала, который декодирует сигнал второго канала стереофонического речевого сигнала, используя монофонический речевой сигнал и сигнал первого канала стереофонического речевого сигнала.
12. Устройство масштабируемого декодирования, которое соответствует устройству масштабируемого кодирования по п.7, причем устройство масштабируемого декодирования содержит:
блок монофонического декодирования, который декодирует монофонический речевой сигнал, используя кодированный параметр, выводимый из блока монофонического кодирования;
блок декодирования первого канала, который декодирует сигнал первого канала стереофонического речевого сигнала, используя кодированный параметр, выводимый из блока монофонического кодирования, и кодированный параметр, выводимый из блока кодирования первого канала; и
блок декодирования второго канала, который декодирует сигнал второго канала стереофонического речевого сигнала, используя монофонический речевой сигнал и сигнал первого канала стереофонического речевого сигнала.
13. Устройство терминала связи, содержащее устройство масштабируемого кодирования по п.1.
14. Устройство терминала связи, содержащее устройство масштабируемого декодирования по п.9.
15. Устройство базовой станции, содержащее устройство масштабируемого кодирования по п.1.
16. Устройство базовой станции, содержащее устройство масштабируемого декодирования по п.9.
17. Способ масштабируемого кодирования, содержащий:
этап генерирования, состоящий в генерировании монофонического речевого сигнала из стереофонического речевого сигнала, который включает в себя сигнал первого канала и сигнал второго канала;
этап монофонического кодирования, состоящий в кодировании монофонического речевого сигнала, используя способ CELP;
этап расчета, состоящий в расчете искажений кодирования сигнала второго канала, которые возникают при кодировании CELP; и
этап первого кодирования, состоящий в кодировании сигнала первого канала, используя способ CELP, и получении кодированного параметра сигнала первого канала для минимизации суммы искажений кодирования сигнала первого канала, которые возникают при кодировании, и искажений кодирования сигнала второго канала, рассчитанных блоком расчета.
18. Способ масштабируемого декодирования, который соответствует способу масштабируемого кодирования по п.17, причем способ масштабируемого декодирования содержит:
этап монофонического декодирования, состоящий в декодировании монофонического речевого сигнала, используя кодированный параметр, генерируемый на этапе монофонического кодирования;
этап декодирования первого канала, состоящий в декодировании сигнала первого канала стереофонического речевого сигнала, используя кодированный параметр, сгенерированный на этапе кодирования первого канала; и
этап декодирования второго канала, состоящий в декодировании сигнала второго канала стереофонического речевого сигнала, используя монофонический речевой сигнал и сигнал первого канала стереофонического речевого сигнала.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004288327 | 2004-09-30 | ||
JP2004-288327 | 2004-09-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2007111717A true RU2007111717A (ru) | 2008-10-10 |
Family
ID=36118956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007111717/09A RU2007111717A (ru) | 2004-09-30 | 2005-09-28 | Устройство масштабируемого кодирования, устройство масштабируемого декодирования и его способ |
Country Status (10)
Country | Link |
---|---|
US (1) | US7904292B2 (ru) |
EP (1) | EP1801783B1 (ru) |
JP (1) | JP4963965B2 (ru) |
KR (1) | KR20070061847A (ru) |
CN (1) | CN101031960A (ru) |
AT (1) | ATE440361T1 (ru) |
BR (1) | BRPI0516739A (ru) |
DE (1) | DE602005016130D1 (ru) |
RU (1) | RU2007111717A (ru) |
WO (1) | WO2006035810A1 (ru) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7848925B2 (en) * | 2004-09-17 | 2010-12-07 | Panasonic Corporation | Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus |
US20080255832A1 (en) * | 2004-09-28 | 2008-10-16 | Matsushita Electric Industrial Co., Ltd. | Scalable Encoding Apparatus and Scalable Encoding Method |
EP1818911B1 (en) * | 2004-12-27 | 2012-02-08 | Panasonic Corporation | Sound coding device and sound coding method |
BRPI0519454A2 (pt) * | 2004-12-28 | 2009-01-27 | Matsushita Electric Ind Co Ltd | aparelho de codificaÇço reescalonÁvel e mÉtodo de codificaÇço reescalonÁvel |
WO2006118179A1 (ja) * | 2005-04-28 | 2006-11-09 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
JP4850827B2 (ja) * | 2005-04-28 | 2012-01-11 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
JPWO2008084688A1 (ja) * | 2006-12-27 | 2010-04-30 | パナソニック株式会社 | 符号化装置、復号装置及びこれらの方法 |
US8364472B2 (en) * | 2007-03-02 | 2013-01-29 | Panasonic Corporation | Voice encoding device and voice encoding method |
JP5377287B2 (ja) * | 2007-03-02 | 2013-12-25 | パナソニック株式会社 | ポストフィルタ、復号装置およびポストフィルタ処理方法 |
CN102576539B (zh) | 2009-10-20 | 2016-08-03 | 松下电器(美国)知识产权公司 | 编码装置、通信终端装置、基站装置以及编码方法 |
US9779739B2 (en) * | 2014-03-20 | 2017-10-03 | Dts, Inc. | Residual encoding in an object-based audio system |
JP7092047B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 符号化復号方法、復号方法、これらの装置及びプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4815132A (en) * | 1985-08-30 | 1989-03-21 | Kabushiki Kaisha Toshiba | Stereophonic voice signal transmission system |
JP2746039B2 (ja) * | 1993-01-22 | 1998-04-28 | 日本電気株式会社 | 音声符号化方式 |
JPH06259097A (ja) | 1993-03-09 | 1994-09-16 | Olympus Optical Co Ltd | コード駆動音源音声符号化装置 |
JPH09261065A (ja) | 1996-03-25 | 1997-10-03 | Mitsubishi Electric Corp | 量子化装置及び逆量子化装置及び量子化逆量子化システム |
JP3622365B2 (ja) | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JP3531780B2 (ja) | 1996-11-15 | 2004-05-31 | 日本電信電話株式会社 | 音声符号化方法および復号化方法 |
US6345246B1 (en) * | 1997-02-05 | 2002-02-05 | Nippon Telegraph And Telephone Corporation | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates |
JP3134817B2 (ja) * | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
DE19742655C2 (de) | 1997-09-26 | 1999-08-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
US6973184B1 (en) * | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
JP2003099095A (ja) | 2001-09-20 | 2003-04-04 | Canon Inc | オーディオ符号化装置、方法、記録媒体及びプログラム |
WO2003091989A1 (en) | 2002-04-26 | 2003-11-06 | Matsushita Electric Industrial Co., Ltd. | Coding device, decoding device, coding method, and decoding method |
JP2003323199A (ja) * | 2002-04-26 | 2003-11-14 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置及び符号化方法、復号化方法 |
KR100528325B1 (ko) * | 2002-12-18 | 2005-11-15 | 삼성전자주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치 |
US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
-
2005
- 2005-09-28 DE DE602005016130T patent/DE602005016130D1/de active Active
- 2005-09-28 BR BRPI0516739-6A patent/BRPI0516739A/pt not_active Application Discontinuation
- 2005-09-28 JP JP2006537770A patent/JP4963965B2/ja not_active Expired - Fee Related
- 2005-09-28 KR KR1020077007252A patent/KR20070061847A/ko not_active Application Discontinuation
- 2005-09-28 EP EP05787917A patent/EP1801783B1/en not_active Not-in-force
- 2005-09-28 RU RU2007111717/09A patent/RU2007111717A/ru not_active Application Discontinuation
- 2005-09-28 US US11/576,264 patent/US7904292B2/en not_active Expired - Fee Related
- 2005-09-28 AT AT05787917T patent/ATE440361T1/de not_active IP Right Cessation
- 2005-09-28 WO PCT/JP2005/017838 patent/WO2006035810A1/ja active Application Filing
- 2005-09-28 CN CNA2005800332307A patent/CN101031960A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
DE602005016130D1 (de) | 2009-10-01 |
US7904292B2 (en) | 2011-03-08 |
ATE440361T1 (de) | 2009-09-15 |
JPWO2006035810A1 (ja) | 2008-05-15 |
EP1801783A1 (en) | 2007-06-27 |
US20080255833A1 (en) | 2008-10-16 |
EP1801783A4 (en) | 2007-12-05 |
KR20070061847A (ko) | 2007-06-14 |
JP4963965B2 (ja) | 2012-06-27 |
EP1801783B1 (en) | 2009-08-19 |
CN101031960A (zh) | 2007-09-05 |
BRPI0516739A (pt) | 2008-09-23 |
WO2006035810A1 (ja) | 2006-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2007111717A (ru) | Устройство масштабируемого кодирования, устройство масштабируемого декодирования и его способ | |
US11978460B2 (en) | Truncateable predictive coding | |
KR102636424B1 (ko) | 스테레오 사운드 신호의 좌측 및 우측 채널들을 디코딩하는 방법 및 시스템 | |
TW580691B (en) | Method and apparatus for interoperability between voice transmission systems during speech inactivity | |
KR101000345B1 (ko) | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 | |
US8374883B2 (en) | Encoder and decoder using inter channel prediction based on optimally determined signals | |
JP5753540B2 (ja) | ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法 | |
RU2007139784A (ru) | Устройство кодирования звука и способ кодирования звука | |
KR20060131851A (ko) | 통신 장치 및 신호 부호화/복호화 방법 | |
KR20070092240A (ko) | 음성 부호화 장치 및 음성 부호화 방법 | |
WO2011029984A1 (en) | Method, apparatus and computer program product for audio coding | |
KR20070085532A (ko) | 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법 | |
JP2013050540A (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JPWO2006080358A1 (ja) | 音声符号化装置および音声符号化方法 | |
JP2003223189A (ja) | 音声符号変換方法及び装置 | |
KR20070061843A (ko) | 스케일러블 부호화 장치 및 스케일러블 부호화 방법 | |
JPWO2010016270A1 (ja) | 量子化装置、符号化装置、量子化方法及び符号化方法 | |
JP2004138756A (ja) | 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム | |
KR20020013966A (ko) | 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치 | |
CN101981616A (zh) | 立体声信号变换装置、立体声信号逆变换装置及其方法 | |
JP2006350373A (ja) | 音声符号変換方法および装置 | |
CN112119457B (zh) | 可截断的预测编码 | |
Taleb et al. | G. 719: The first ITU-T standard for high-quality conversational fullband audio coding | |
JPH07199994A (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA93 | Acknowledgement of application withdrawn (no request for examination) |
Effective date: 20100728 |