JP2010522346A - 音声コード化の方法および装置 - Google Patents
音声コード化の方法および装置 Download PDFInfo
- Publication number
- JP2010522346A JP2010522346A JP2009543395A JP2009543395A JP2010522346A JP 2010522346 A JP2010522346 A JP 2010522346A JP 2009543395 A JP2009543395 A JP 2009543395A JP 2009543395 A JP2009543395 A JP 2009543395A JP 2010522346 A JP2010522346 A JP 2010522346A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel
- filter
- generated
- audio stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000005540 biological transmission Effects 0.000 claims abstract description 10
- 238000001228 spectrum Methods 0.000 claims description 27
- 239000002131 composite material Substances 0.000 claims description 22
- 230000003595 spectral effect Effects 0.000 claims description 14
- 230000001629 suppression Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 claims 9
- 230000002596 correlated effect Effects 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 abstract description 6
- 230000003190 augmentative effect Effects 0.000 abstract description 2
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 230000006837 decompression Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (17)
- マルチチャネル音声ストリームのすべて、またはその一部分をコード化する方法であって、
前記マルチチャネル音声ストリームの各チャネルに対応する信号の合成によって生成された合成信号を得る工程と、
周波数が限定された合成信号を生成する工程であって、元の合成信号の周波数が、高周波の抑制によって低減される、工程と、
時間フィルタをチャネル毎に1つ生成する工程であって、前記時間フィルタは、前記限定された合成信号のスペクトルのブロード化によって生成された信号に適用されたとき、対応するチャネルの前記元の信号にスペクトル的に近い信号の発見を可能にする、工程とを少なくとも含むことを特徴とする、方法。 - 所与の元の信号の一部分に対して、および所与のチャネルに対して、このチャネルに対応するフィルタは、前記元の信号の一部分に、および前記限定された信号のスペクトルのブロード化によって生成された信号の対応する部分に適用されたフーリエ変換の係数の関数の要素対要素除算によって生成されることを特徴とする、請求項1に記載の方法。
- 異なるサイズのフーリエ変換が、使用される各サイズに対応する複数のフィルタを生成するために使用され、生成されたフィルタは、前記元の信号と、前記限定された信号のスペクトルをブロード化して生成された信号に前記フィルタを適用して生成された信号とを比較することによってなされた前記複数のフィルタからの選択に対応することを特徴とする、請求項2に記載の方法。
- 前記時間フィルタの選択は、所定の時間フィルタの集合体から行うことができることを特徴とする、請求項1に記載の方法。
- 前記周波数が限定された合成信号は、その送信を目的としてコード化され、前記フィルタは、前記コード化され限定された合成信号のスペクトルを復号しブロード化して生成された信号と、前記元の信号とを使用して生成されることを特徴とする、請求項1に記載の方法。
- マルチチャネル音声ストリームのチャネルの1つを基準チャネルとして定める工程と、
各チャネルについてオフセット値を定める、前記基準チャネルに対するその他のチャネルのそれぞれの時間相関の工程とをさらに含み、
前記各チャネルの信号を構成する工程が、前記基準チャネルの信号と、その他のチャネルについての時間的に相関性がある信号とを用いて実施されることを特徴とする、請求項1に記載の方法。 - 前記基準チャネル以外の各チャネルについて、前記チャネルの時間相関によって定められた前記オフセット値は、前記生成されたフィルタと関連付けられることを特徴とする、請求項6に記載の方法。
- 前記マルチチャネル音声ストリームのチャネルの1つを基準チャネルとして定める工程と、
前記基準チャネルに対してその他のチャネルのそれぞれを等化して、各チャネルについて倍率値を定める工程とをさらに含み、
前記各チャネルの信号を構成する工程は、前記基準チャネルの信号と、その他のチャネルについての前記等化された信号とを用いて実施されることを特徴とする、請求項1に記載の方法。 - 前記基準チャネル以外の各チャネルについて、前記チャネルの時間相関によって定められた前記倍率値は、前記生成されたフィルタと関連付けられることを特徴とする、請求項8に記載の方法。
- マルチチャネル音声ストリームのすべて、またはその一部分を復号する方法であって、
送信された信号を受信する工程と、
前記マルチチャネル音声ストリームの各チャネルについて受信された信号に関する時間フィルタを受信する工程と、
前記受信された信号を復号することによって、復号された信号を生成する工程と、
復号信号のスペクトルをブロード化することによって拡張された信号を生成する工程と、
前記マルチチャネル音声ストリームの各チャネルについて受信された前記時間フィルタによる、前記拡張された信号の畳み込みによって、再構成された信号を生成する工程とを少なくとも含む
ことを特徴とする、方法。 - 前記生成されたフィルタからサイズが減少されたフィルタが、前記各チャネルについて再構成された信号を生成する工程で、この生成されたフィルタの代わりに使用されることを特徴とする、請求項10に記載の方法。
- 各チャネルについて前記生成されたフィルタの代わりにサイズが減少されたフィルタを使用するという選択は、デコーダの能力に従って行われることを特徴とする、請求項11に記載の方法。
- 前記マルチチャネル・ストリームのチャネルの1つが基準チャネルとして定められ、オフセット値が前記基準チャネル以外のチャネルについて受信された各フィルタと関連付けられており、
元のマルチチャネル音声ストリーム中の各チャネルと前記基準チャネルの間の時間位相差と同様の時間位相差を生成することを可能にする、前記基準チャネル以外の各チャネルに対応する信号をオフセットさせる工程も含むことを特徴とする、請求項10に記載の方法。 - 前記基準チャネル以外の各チャネルについて前記オフセット値の急な変化を避けるために、フレーム間の境界で前記オフセット値をスムージングする工程をさらに含むことを特徴とする、請求項13に記載の方法。
- 前記マルチチャネル・ストリームのチャネルの1つが、基準チャネルとして定められ、倍率値が、前記基準チャネル以外のチャネルについて受信された各フィルタと関連付けられており、
元のマルチチャネル音声ストリーム中の各チャネルと前記基準チャネルの間の利得の差と同様の利得の差を生成することを可能にする、前記基準チャネル以外の各チャネルに対応する信号を増幅する工程も含むことを特徴とする、請求項10に記載の方法。 - マルチチャネル音声ストリームをコード化するための装置であって、
前記マルチチャネル音声ストリームの各チャネルに対応する信号の合成によって生成された合成信号を得る手段と、
周波数が限定された合成信号を生成する手段であって、元の合成信号のスペクトルが、高周波の抑制によって減少される、手段と、
前記時間フィルタをチャネル毎に1つ生成する手段であって、前記時間フィルタは、前記限定された信号のスペクトルをブロード化することによって生成された信号に適用されたとき、対応するチャネルの前記元の信号にスペクトル的に近い信号を見出すことを可能にする、手段とを少なくとも含むことを特徴とする、装置。 - マルチチャネル音声ストリームを復号するための装置であって、
送信された信号を受信する手段と、
前記マルチチャネル音声ストリームの各チャネルについて受信された信号に関する時間フィルタを受信する手段と、
前記受信された信号を復号することによって、復号された信号を生成する手段と、
復号信号のスペクトルをブロード化することによって、拡張された信号を生成する手段と、
前記マルチチャネル音声ストリームの各チャネルについて受信された前記時間フィルタによる、前記拡張された信号の畳み込みによって、再構成された信号を生成する手段とを少なくとも含む
ことを特徴とする、装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR06/11481 | 2006-12-28 | ||
FR0611481A FR2911031B1 (fr) | 2006-12-28 | 2006-12-28 | Procede et dispositif de codage audio |
FR07/08067 | 2007-11-16 | ||
FR0708067A FR2911020B1 (fr) | 2006-12-28 | 2007-11-16 | Procede et dispositif de codage audio |
PCT/EP2007/011442 WO2008080609A1 (fr) | 2006-12-28 | 2007-12-28 | Procede et dispositif de codage audio |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010522346A true JP2010522346A (ja) | 2010-07-01 |
JP5491194B2 JP5491194B2 (ja) | 2014-05-14 |
Family
ID=39083245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009543395A Active JP5491194B2 (ja) | 2006-12-28 | 2007-12-28 | 音声コード化の方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8340305B2 (ja) |
EP (1) | EP2126905B1 (ja) |
JP (1) | JP5491194B2 (ja) |
FR (1) | FR2911020B1 (ja) |
WO (1) | WO2008080609A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
US8666752B2 (en) | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
CN112954581B (zh) * | 2021-02-04 | 2022-07-01 | 广州橙行智动汽车科技有限公司 | 一种音频播放方法、系统及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003140696A (ja) * | 2001-08-23 | 2003-05-16 | Matsushita Electric Ind Co Ltd | 音声処理装置 |
WO2006049205A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル符号化装置 |
WO2006049204A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、符号化方法及び復号化方法 |
JP2008535026A (ja) * | 2005-04-01 | 2008-08-28 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符合化及び復号する方法及び装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62234435A (ja) * | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
US6674862B1 (en) * | 1999-12-03 | 2004-01-06 | Gilbert Magilen | Method and apparatus for testing hearing and fitting hearing aids |
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
KR20050121733A (ko) * | 2003-04-17 | 2005-12-27 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호 발생 |
US7725324B2 (en) * | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
KR20070056081A (ko) * | 2004-08-31 | 2007-05-31 | 마츠시타 덴끼 산교 가부시키가이샤 | 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법 |
JP5046652B2 (ja) * | 2004-12-27 | 2012-10-10 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
US7716043B2 (en) * | 2005-10-24 | 2010-05-11 | Lg Electronics Inc. | Removing time delays in signal paths |
ES2362920T3 (es) * | 2006-03-28 | 2011-07-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Método mejorado para la conformación de señales en reconstrucción de audio multicanal. |
-
2007
- 2007-11-16 FR FR0708067A patent/FR2911020B1/fr active Active
- 2007-12-28 EP EP07866272A patent/EP2126905B1/fr active Active
- 2007-12-28 US US12/521,076 patent/US8340305B2/en active Active
- 2007-12-28 JP JP2009543395A patent/JP5491194B2/ja active Active
- 2007-12-28 WO PCT/EP2007/011442 patent/WO2008080609A1/fr active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003140696A (ja) * | 2001-08-23 | 2003-05-16 | Matsushita Electric Ind Co Ltd | 音声処理装置 |
WO2006049205A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル符号化装置 |
WO2006049204A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、符号化方法及び復号化方法 |
JP2008535026A (ja) * | 2005-04-01 | 2008-08-28 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符合化及び復号する方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5491194B2 (ja) | 2014-05-14 |
US20100046760A1 (en) | 2010-02-25 |
US8340305B2 (en) | 2012-12-25 |
WO2008080609A1 (fr) | 2008-07-10 |
EP2126905B1 (fr) | 2012-05-30 |
FR2911020A1 (fr) | 2008-07-04 |
EP2126905A1 (fr) | 2009-12-02 |
FR2911020B1 (fr) | 2009-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2381571C2 (ru) | Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала | |
RU2625444C2 (ru) | Система обработки аудио | |
CN109509477B (zh) | 元数据驱动的动态范围控制 | |
JP4809370B2 (ja) | マルチチャネル音声符号化における適応ビット割り当て | |
AU2007212845B2 (en) | Apparatus and method for encoding/decoding signal | |
AU2006222285B2 (en) | Device and method for generating an encoded stereo signal of an audio piece or audio data stream | |
JP5455647B2 (ja) | オーディオデコーダ | |
JP4700467B2 (ja) | 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化 | |
CN1327409C (zh) | 提供信号重建的宽带音频信号发送机、接收机、系统和方法 | |
JP6490068B2 (ja) | Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置 | |
JP7201721B2 (ja) | 相関分離フィルタの適応制御のための方法および装置 | |
US9111529B2 (en) | Method for encoding/decoding an improved stereo digital stream and associated encoding/decoding device | |
US8744088B2 (en) | Method, medium, and apparatus decoding an input signal including compressed multi-channel signals as a mono or stereo signal into 2-channel binaural signals | |
US8665914B2 (en) | Signal analysis/control system and method, signal control apparatus and method, and program | |
JP5491194B2 (ja) | 音声コード化の方法および装置 | |
JP5491193B2 (ja) | 音声コード化の方法および装置 | |
US6012025A (en) | Audio coding method and apparatus using backward adaptive prediction | |
RU2809977C1 (ru) | Кодек с малой задержкой и низкочастотными эффектами | |
JPH10143197A (ja) | 再生装置 | |
EP4320614A1 (en) | Multi-band ducking of audio signals technical field | |
JP2007110565A (ja) | マルチチャンネル音響復号化装置及び方法 | |
JPH07225597A (ja) | 音響信号符号化、復号化方法及び装置 | |
MX2008009565A (en) | Apparatus and method for encoding/decoding signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130404 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130411 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130507 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130805 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131101 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131111 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131204 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5491194 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |