RU2007116804A - Устройство векторного преобразования и способ векторного преобразования - Google Patents
Устройство векторного преобразования и способ векторного преобразования Download PDFInfo
- Publication number
- RU2007116804A RU2007116804A RU2007116804/09A RU2007116804A RU2007116804A RU 2007116804 A RU2007116804 A RU 2007116804A RU 2007116804/09 A RU2007116804/09 A RU 2007116804/09A RU 2007116804 A RU2007116804 A RU 2007116804A RU 2007116804 A RU2007116804 A RU 2007116804A
- Authority
- RU
- Russia
- Prior art keywords
- vectors
- code
- vector
- basis
- codebook
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims 62
- 238000006243 chemical reaction Methods 0.000 title claims 7
- 238000000034 method Methods 0.000 title 1
- 238000013139 quantization Methods 0.000 claims 11
- 230000009466 transformation Effects 0.000 claims 4
- 230000001131 transforming effect Effects 0.000 claims 2
- 238000012935 Averaging Methods 0.000 claims 1
- 238000011426 transformation method Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (7)
1. Устройство векторного преобразования для преобразования базисных векторов, используемых при квантовании входных векторов, содержащее первую кодовую книгу, в которой хранится совокупность первых кодовых векторов, полученных кластеризацией векторного пространства, блок векторного квантования, который получает номера векторов, соответствующих базисным векторам, среди первых кодовых векторов, хранящихся в первой кодовой книге, вторую кодовую книгу, в которой хранятся вторые кодовые векторы, полученные путем осуществления статистической обработки совокупности базисных векторов для обучающего использования, соответствующие совокупности входных векторов для обучающего использования для каждого номера, блок инверсного векторного квантования, который получает векторы, соответствующие номерам, полученным в блоке векторного квантования, среди вторых кодовых векторов, хранящихся во второй кодовой книге, и блок обработки преобразованием, который преобразует вторые кодовые векторы, полученный в блоке инверсного векторного квантования, и получает преобразованные базисные векторы.
2. Устройство векторного преобразования по п. 1, в котором во второй кодовой книге хранятся дифференциальные векторы, полученные путем осуществления статистической обработки для каждого номера такой, чтобы полная разность между входными векторами для обучающего использования и базисными векторами для обучающего использования стала минимальной, и блок обработки преобразованием суммирует вторые кодовые векторы, полученные в блоке инверсного векторного квантования, и базисные векторы и получает преобразованные базисные векторы.
3. Устройство векторного преобразования по п. 1, дополнительно содержащее блок обработки повышающей дискретизации, который осуществляет повышающую дискретизацию базисных векторов, при этом блок обработки преобразованием суммирует вторые кодовые векторы, полученные в блоке инверсного векторного квантования, и дискретизированные с повышением базисные векторы и получает преобразованные базисные векторы.
4. Устройство векторного преобразования по п. 2, в котором вторые кодовые векторы и базисные векторы снабжаются весовыми коэффициентами, суммируются и получаются преобразованные базисные векторы.
5. Устройство векторного преобразования по п. 1, в котором статистическая обработка содержит усреднение.
6. Устройство квантования, которое квантует входные векторы с использованием преобразованных базисных векторов, полученных устройством векторного преобразования по п. 1.
7. Способ векторного преобразования для преобразования базисных векторов, используемых при квантовании входных векторов, содержащий
первый этап сохранения, на котором сохраняют совокупность первых кодовых векторов, полученных кластеризацией векторного пространства, в первой кодовой книге,
этап векторного квантования, на котором получают номера векторов, соответствующих базисным векторам, среди первых кодовых векторов, хранящихся в первой кодовой книге,
второй этап сохранения, на котором сохраняют вторые кодовые векторы, полученные путем осуществления статистической обработки совокупности базисных векторов для обучающего использования, соответствующие входным векторам для обучающего использования во второй кодовой книге для каждого номера,
этап инверсного векторного квантования, на котором получают векторы, соответствующие номерам, полученным на этапе векторного квантования, из вторых кодовых векторов, хранящихся во второй кодовой книге, и
этап обработки преобразованием, на котором преобразуют вторые кодовые векторы, полученные на этапе инверсного векторного квантования, и получают преобразованные базисные векторы.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004321248A JP4871501B2 (ja) | 2004-11-04 | 2004-11-04 | ベクトル変換装置及びベクトル変換方法 |
JP2004-321248 | 2004-11-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2007116804A true RU2007116804A (ru) | 2008-11-20 |
Family
ID=36319184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007116804/09A RU2007116804A (ru) | 2004-11-04 | 2005-11-01 | Устройство векторного преобразования и способ векторного преобразования |
Country Status (9)
Country | Link |
---|---|
US (1) | US7809558B2 (ru) |
EP (1) | EP1796084B1 (ru) |
JP (1) | JP4871501B2 (ru) |
KR (1) | KR20070083957A (ru) |
CN (1) | CN101057275B (ru) |
BR (1) | BRPI0517778A (ru) |
CA (1) | CA2586251A1 (ru) |
RU (1) | RU2007116804A (ru) |
WO (1) | WO2006049179A1 (ru) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7610195B2 (en) * | 2006-06-01 | 2009-10-27 | Nokia Corporation | Decoding of predictively coded data using buffer adaptation |
JP4871894B2 (ja) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
US8620648B2 (en) * | 2007-07-27 | 2013-12-31 | Panasonic Corporation | Audio encoding device and audio encoding method |
EP2045800A1 (en) * | 2007-10-05 | 2009-04-08 | Nokia Siemens Networks Oy | Method and apparatus for transcoding |
CA2972812C (en) | 2008-07-10 | 2018-07-24 | Voiceage Corporation | Device and method for quantizing and inverse quantizing lpc filters in a super-frame |
KR101261677B1 (ko) * | 2008-07-14 | 2013-05-06 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
WO2011048810A1 (ja) * | 2009-10-20 | 2011-04-28 | パナソニック株式会社 | ベクトル量子化装置及びベクトル量子化方法 |
US9153242B2 (en) * | 2009-11-13 | 2015-10-06 | Panasonic Intellectual Property Corporation Of America | Encoder apparatus, decoder apparatus, and related methods that use plural coding layers |
PT2515299T (pt) | 2009-12-14 | 2018-10-10 | Fraunhofer Ges Forschung | Dispositivo de quantificação vetorial, dispositivo de codificação de voz, método de quantificação vetorial e método de codificação de voz |
CA2789107C (en) * | 2010-04-14 | 2017-08-15 | Voiceage Corporation | Flexible and scalable combined innovation codebook for use in celp coder and decoder |
EP2581904B1 (en) * | 2010-06-11 | 2015-10-07 | Panasonic Intellectual Property Corporation of America | Audio (de)coding apparatus and method |
US8868432B2 (en) * | 2010-10-15 | 2014-10-21 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
CN102783034B (zh) * | 2011-02-01 | 2014-12-17 | 华为技术有限公司 | 用于提供信号处理系数的方法和设备 |
JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
US20150170655A1 (en) * | 2013-12-15 | 2015-06-18 | Qualcomm Incorporated | Systems and methods of blind bandwidth extension |
CN114171035B (zh) * | 2020-09-11 | 2024-10-15 | 海能达通信股份有限公司 | 抗干扰方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4926488A (en) * | 1987-07-09 | 1990-05-15 | International Business Machines Corporation | Normalization of speech by adaptive labelling |
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3483958B2 (ja) * | 1994-10-28 | 2004-01-06 | 三菱電機株式会社 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
JP2003323199A (ja) | 2002-04-26 | 2003-11-14 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置及び符号化方法、復号化方法 |
AU2003234763A1 (en) | 2002-04-26 | 2003-11-10 | Matsushita Electric Industrial Co., Ltd. | Coding device, decoding device, coding method, and decoding method |
-
2004
- 2004-11-04 JP JP2004321248A patent/JP4871501B2/ja not_active Expired - Fee Related
-
2005
- 2005-11-01 US US11/718,555 patent/US7809558B2/en not_active Expired - Fee Related
- 2005-11-01 KR KR1020077010121A patent/KR20070083957A/ko not_active Application Discontinuation
- 2005-11-01 CA CA002586251A patent/CA2586251A1/en not_active Abandoned
- 2005-11-01 CN CN2005800380550A patent/CN101057275B/zh not_active Expired - Fee Related
- 2005-11-01 WO PCT/JP2005/020129 patent/WO2006049179A1/ja active Application Filing
- 2005-11-01 RU RU2007116804/09A patent/RU2007116804A/ru not_active Application Discontinuation
- 2005-11-01 EP EP05805483.4A patent/EP1796084B1/en not_active Not-in-force
- 2005-11-01 BR BRPI0517778-2A patent/BRPI0517778A/pt not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
EP1796084A4 (en) | 2008-07-02 |
BRPI0517778A (pt) | 2008-10-21 |
US7809558B2 (en) | 2010-10-05 |
CN101057275A (zh) | 2007-10-17 |
US20080126085A1 (en) | 2008-05-29 |
EP1796084A1 (en) | 2007-06-13 |
CN101057275B (zh) | 2011-06-15 |
JP4871501B2 (ja) | 2012-02-08 |
CA2586251A1 (en) | 2006-05-11 |
KR20070083957A (ko) | 2007-08-24 |
JP2006133423A (ja) | 2006-05-25 |
EP1796084B1 (en) | 2014-06-04 |
WO2006049179A1 (ja) | 2006-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2007116804A (ru) | Устройство векторного преобразования и способ векторного преобразования | |
JP4942793B2 (ja) | 時間ドメインから周波数ドメインへ及びそれとは逆にデジタル信号を変換する方法 | |
Gao et al. | On factorization of M-channel paraunitary filterbanks | |
CN103426437B (zh) | 使用利用混合多元概率密度函数的独立分量分析的源分离 | |
CN101335004B (zh) | 一种多级量化的方法及装置 | |
RU2391715C2 (ru) | Векторное квантование с использованием единой кодовой книги для многоскоростных применений | |
CN109359309A (zh) | 一种翻译方法及装置、翻译模型的训练方法及装置 | |
JP5241701B2 (ja) | 符号化装置および符号化方法 | |
RU2458412C1 (ru) | Устройство поиска фиксированных таблиц кодирования и способ поиска фиксированных таблиц кодирования | |
CN1805548A (zh) | 用于重叠双正交变换的可逆二维前置/后置滤波 | |
Zhou et al. | Image compression based on discrete cosine transform and multistage vector quantization | |
US9318106B2 (en) | Joint sound model generation techniques | |
Stoeva et al. | On the dual frame induced by an invertible frame multiplier | |
RU2011134054A (ru) | Устройство векторного квантования, устройство векторного обратного квантования и способы для этого | |
CN108431891A (zh) | 基于通知源分离的音频对象编码的方法和装置 | |
Ejbali et al. | Intelligent approach to train wavelet networks for Recognition System of Arabic Words | |
JP2010509647A (ja) | ベクトル量子化方法および装置 | |
JP2007033898A5 (ru) | ||
EP1361567A3 (en) | Vector quantization for a speech transform coder | |
Pati et al. | An approach to image compression by using sparse approximation technique | |
ATE464635T1 (de) | Verfahren zum erzeugen und verwenden eines vektorcodebuchs, verfahren und einrichtung zum komprimieren von daten und verteiltes spracherkennungssystem | |
KR100847179B1 (ko) | 데이터 처리 장치, 방법 및 기록 매체 | |
TW200714077A (en) | Image processing method and a 2-D discrete cosine transformation device thereof | |
JPH10260698A (ja) | 信号符号化装置 | |
JP4748113B2 (ja) | 学習装置および学習方法、並びにプログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA93 | Acknowledgement of application withdrawn (no request for examination) |
Effective date: 20081103 |