JPWO2006121101A1 - 音声符号化装置およびスペクトル変形方法 - Google Patents
音声符号化装置およびスペクトル変形方法 Download PDFInfo
- Publication number
- JPWO2006121101A1 JPWO2006121101A1 JP2007528311A JP2007528311A JPWO2006121101A1 JP WO2006121101 A1 JPWO2006121101 A1 JP WO2006121101A1 JP 2007528311 A JP2007528311 A JP 2007528311A JP 2007528311 A JP2007528311 A JP 2007528311A JP WO2006121101 A1 JPWO2006121101 A1 JP WO2006121101A1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- spectrum
- interleaving
- channel
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 145
- 238000011426 transformation method Methods 0.000 title description 15
- 230000003595 spectral effect Effects 0.000 claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 69
- 230000005236 sound signal Effects 0.000 claims description 19
- 230000003252 repetitive effect Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 abstract description 16
- 230000009466 transformation Effects 0.000 abstract description 5
- 238000002715 modification method Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 36
- 230000005284 excitation Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 26
- 238000013139 quantization Methods 0.000 description 24
- 238000000638 solvent extraction Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 16
- 238000012986 modification Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000000737 periodic effect Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 238000010295 mobile communication Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
図5は、本実施の形態に係る符号化装置100および復号装置150の基本的な構成を示すブロック図である。
図9は、実施の形態1に係る符号化装置100を、典型的な音声符号化システム(符号化側)1000に適用した例を示す図である。
ファクタを用いて参照信号がスケーリングされ、各周波数帯域に対しての変換された領域における推定信号が得られる。その後、逆周波数変換処理が施され、推定変換領域スペクトルデータに相当する時間領域信号が得られる。
ラグと共に復号装置に送信される。
図5は、本実施の形態に係る符号化装置100および復号装置150の基本的な構成を示すブロック図である。
を示すブロック図である。
ルは、次式(2a)に従って割り当て、残りのサンプルは、次式(2b)に従って最後の帯域(b=B−1)に割り当てる。
形によるものが参照信号に可能な限り近いものとなるように、この差がターゲット信号に対して、適用される。
ル係数のうちの類似したものをグループ化するので、音声符号化装置の符号化効率を向上させることができる。
図9は、実施の形態1に係る符号化装置100を、典型的な音声符号化システム(符号化側)1000に適用した例を示す図である。
ネル信号Lが参照チャネルとして用いられている。
Claims (6)
- 音声信号の周波数スペクトルのピッチ周波数または繰り返しパターンを取得する取得手段と、
前記周波数スペクトルの複数のスペクトル係数が、類似するスペクトル係数同士で密集するように、前記ピッチ周波数または繰り返しパターンに基づいて前記複数のスペクトル係数をインターリーブするインターリーブ手段と、
インターリーブされた前記スペクトル係数を符号化する符号化手段と、
を具備する音声符号化装置。 - インターリーブされた前記スペクトル係数を複数の帯域に分割する分割手段と、
前記複数の帯域のエネルギーと参照信号のエネルギーとの比を算出する算出手段と、
前記エネルギーの比を符号化するゲイン符号化手段と、
をさらに具備する請求項1記載の音声符号化装置。 - 前記音声信号において前記ピッチ周波数または繰り返しパターンが存在する区間を検出する検出手段をさらに具備し、
前記インターリーブ手段は、
検出された前記区間にインターリーブ処理を施す、
請求項1記載の音声符号化装置。 - 請求項1記載の音声符号化装置を具備する通信端末装置。
- 請求項1記載の音声符号化装置を具備する基地局装置。
- 音声信号の周波数スペクトルのピッチ周波数または繰り返しパターンを取得するステップと、
前記ピッチ周波数または繰り返しパターンに基づいて、前記周波数スペクトルの複数のスペクトル係数のうち、類似するスペクトル係数同士を複数のグループに分類するステップと、
前記各グループで前記複数のスペクトル係数同士が密集するように、前記複数のスペクトル係数をインターリーブするステップと、
を具備するスペクトル変形方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007528311A JP4982374B2 (ja) | 2005-05-13 | 2006-05-11 | 音声符号化装置およびスペクトル変形方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005141343 | 2005-05-13 | ||
JP2005141343 | 2005-05-13 | ||
JP2007528311A JP4982374B2 (ja) | 2005-05-13 | 2006-05-11 | 音声符号化装置およびスペクトル変形方法 |
PCT/JP2006/309453 WO2006121101A1 (ja) | 2005-05-13 | 2006-05-11 | 音声符号化装置およびスペクトル変形方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006121101A1 true JPWO2006121101A1 (ja) | 2008-12-18 |
JP4982374B2 JP4982374B2 (ja) | 2012-07-25 |
Family
ID=37396609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007528311A Expired - Fee Related JP4982374B2 (ja) | 2005-05-13 | 2006-05-11 | 音声符号化装置およびスペクトル変形方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8296134B2 (ja) |
EP (1) | EP1881487B1 (ja) |
JP (1) | JP4982374B2 (ja) |
CN (1) | CN101176147B (ja) |
DE (1) | DE602006010687D1 (ja) |
WO (1) | WO2006121101A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0607303A2 (pt) * | 2005-01-26 | 2009-08-25 | Matsushita Electric Ind Co Ltd | dispositivo de codificação de voz e método de codificar voz |
JPWO2007088853A1 (ja) * | 2006-01-31 | 2009-06-25 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
US20090276210A1 (en) * | 2006-03-31 | 2009-11-05 | Panasonic Corporation | Stereo audio encoding apparatus, stereo audio decoding apparatus, and method thereof |
WO2008016097A1 (fr) * | 2006-08-04 | 2008-02-07 | Panasonic Corporation | dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci |
JP4960791B2 (ja) * | 2007-07-26 | 2012-06-27 | 日本電信電話株式会社 | ベクトル量子化符号化装置、ベクトル量子化復号化装置、それらの方法、それらのプログラム、及びそれらの記録媒体 |
US8352249B2 (en) * | 2007-11-01 | 2013-01-08 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
EP2144228A1 (en) * | 2008-07-08 | 2010-01-13 | Siemens Medical Instruments Pte. Ltd. | Method and device for low-delay joint-stereo coding |
CN102131081A (zh) * | 2010-01-13 | 2011-07-20 | 华为技术有限公司 | 混合维度编解码方法和装置 |
US8633370B1 (en) * | 2011-06-04 | 2014-01-21 | PRA Audio Systems, LLC | Circuits to process music digitally with high fidelity |
RU2554554C2 (ru) * | 2011-01-25 | 2015-06-27 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи |
US9672833B2 (en) * | 2014-02-28 | 2017-06-06 | Google Inc. | Sinusoidal interpolation across missing data |
CN107317657A (zh) * | 2017-07-28 | 2017-11-03 | 中国电子科技集团公司第五十四研究所 | 一种无线通信频谱交织共用传输装置 |
CN112420060A (zh) * | 2020-11-20 | 2021-02-26 | 上海复旦通讯股份有限公司 | 一种基于频域交织的独立于通信网络的端到端语音加密方法 |
DE102022114404A1 (de) | 2021-06-10 | 2022-12-15 | Harald Fischer | Reinigungsmittel |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4351216A (en) * | 1979-08-22 | 1982-09-28 | Hamm Russell O | Electronic pitch detection for musical instruments |
US5680508A (en) * | 1991-05-03 | 1997-10-21 | Itt Corporation | Enhancement of speech coding in background noise for low-rate speech coder |
TW224191B (ja) * | 1992-01-28 | 1994-05-21 | Qualcomm Inc | |
JPH07104793A (ja) * | 1993-09-30 | 1995-04-21 | Sony Corp | 音声信号の符号化装置及び復号化装置 |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5663517A (en) * | 1995-09-01 | 1997-09-02 | International Business Machines Corporation | Interactive system for compositional morphing of music in real-time |
US5737716A (en) * | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
JP3328532B2 (ja) * | 1997-01-22 | 2002-09-24 | シャープ株式会社 | デジタルデータの符号化方法 |
US6345246B1 (en) * | 1997-02-05 | 2002-02-05 | Nippon Telegraph And Telephone Corporation | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates |
CN1737903A (zh) * | 1997-12-24 | 2006-02-22 | 三菱电机株式会社 | 声音译码方法以及声音译码装置 |
US6353807B1 (en) * | 1998-05-15 | 2002-03-05 | Sony Corporation | Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium |
JP3434260B2 (ja) * | 1999-03-23 | 2003-08-04 | 日本電信電話株式会社 | オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体 |
US6658382B1 (en) * | 1999-03-23 | 2003-12-02 | Nippon Telegraph And Telephone Corporation | Audio signal coding and decoding methods and apparatus and recording media with programs therefor |
US6704701B1 (en) * | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
US7092881B1 (en) * | 1999-07-26 | 2006-08-15 | Lucent Technologies Inc. | Parametric speech codec for representing synthetic speech in the presence of background noise |
US6377916B1 (en) * | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
JP2002312000A (ja) * | 2001-04-16 | 2002-10-25 | Sakai Yasue | 圧縮方法及び装置、伸長方法及び装置、圧縮伸長システム、ピーク検出方法、プログラム、記録媒体 |
EP1701340B1 (en) * | 2001-11-14 | 2012-08-29 | Panasonic Corporation | Decoding device, method and program |
CN1288625C (zh) * | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
EP1500084B1 (en) * | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
GB2388502A (en) * | 2002-05-10 | 2003-11-12 | Chris Dunn | Compression of frequency domain audio signals |
US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
JP3944188B2 (ja) * | 2004-05-21 | 2007-07-11 | 株式会社東芝 | 立体画像表示方法、立体画像撮像方法及び立体画像表示装置 |
US7630396B2 (en) | 2004-08-26 | 2009-12-08 | Panasonic Corporation | Multichannel signal coding equipment and multichannel signal decoding equipment |
JP2006126592A (ja) * | 2004-10-29 | 2006-05-18 | Casio Comput Co Ltd | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
-
2006
- 2006-05-11 DE DE602006010687T patent/DE602006010687D1/de active Active
- 2006-05-11 CN CN2006800164325A patent/CN101176147B/zh not_active Expired - Fee Related
- 2006-05-11 EP EP06746262A patent/EP1881487B1/en not_active Ceased
- 2006-05-11 JP JP2007528311A patent/JP4982374B2/ja not_active Expired - Fee Related
- 2006-05-11 WO PCT/JP2006/309453 patent/WO2006121101A1/ja active Application Filing
- 2006-05-11 US US11/914,296 patent/US8296134B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8296134B2 (en) | 2012-10-23 |
US20080177533A1 (en) | 2008-07-24 |
JP4982374B2 (ja) | 2012-07-25 |
EP1881487A4 (en) | 2008-11-12 |
CN101176147A (zh) | 2008-05-07 |
EP1881487A1 (en) | 2008-01-23 |
DE602006010687D1 (de) | 2010-01-07 |
CN101176147B (zh) | 2011-05-18 |
EP1881487B1 (en) | 2009-11-25 |
WO2006121101A1 (ja) | 2006-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4982374B2 (ja) | 音声符号化装置およびスペクトル変形方法 | |
KR102232486B1 (ko) | 고차 앰비소닉스 표현을 압축 및 압축해제하기 위한 방법 및 장치 | |
RU2500043C2 (ru) | Кодер, декодер, способ кодирования и способ декодирования | |
US20090018824A1 (en) | Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method | |
JP5340261B2 (ja) | ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 | |
JP4606418B2 (ja) | スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法 | |
EP2492911B1 (en) | Audio encoding apparatus, decoding apparatus, method, circuit and program | |
JP6285939B2 (ja) | 後方互換性のある多重分解能空間オーディオオブジェクト符号化のためのエンコーダ、デコーダおよび方法 | |
KR101414341B1 (ko) | 부호화 장치 및 부호화 방법 | |
US20100332223A1 (en) | Audio decoding device and power adjusting method | |
CN106463130B (zh) | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 | |
EP2626856B1 (en) | Encoding device, decoding device, encoding method, and decoding method | |
CN106471579A (zh) | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 | |
EP2264698A1 (en) | Stereo signal converter, stereo signal reverse converter, and methods for both | |
EP1497631B1 (en) | Generating lsf vectors | |
JPWO2007037359A1 (ja) | 音声符号化装置および音声符号化方法 | |
KR0155315B1 (ko) | Lsp를 이용한 celp보코더의 피치 검색방법 | |
CN106463131B (zh) | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 | |
JP4354561B2 (ja) | オーディオ信号符号化装置及び復号化装置 | |
WO2019173195A1 (en) | Signals in transform-based audio codecs | |
RU2809646C1 (ru) | Генератор многоканальных сигналов, аудиокодер и соответствующие способы, основанные на шумовом сигнале микширования | |
KR0138878B1 (ko) | 보코더용 피치검색 처리시간 단축법 | |
JP2004069906A (ja) | オーディオ符号化装置 | |
Mahalingam et al. | On a real time implementation of LPC speech coder on a bit-slice microprocessor based digital signal processor | |
JPH0235997B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120423 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150427 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4982374 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |