JP6721977B2 - 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 - Google Patents
音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 Download PDFInfo
- Publication number
- JP6721977B2 JP6721977B2 JP2015244243A JP2015244243A JP6721977B2 JP 6721977 B2 JP6721977 B2 JP 6721977B2 JP 2015244243 A JP2015244243 A JP 2015244243A JP 2015244243 A JP2015244243 A JP 2015244243A JP 6721977 B2 JP6721977 B2 JP 6721977B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio
- encoding
- channel
- addition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 description 27
- 230000006866 deterioration Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Otolaryngology (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
[システム構成]
図1は、本実施の形態に係るシステムの構成例を示す。図1に示すシステム1は、少なくとも、音声音響信号の符号化を行う符号化装置10(マルチチャネルエンコーダ)及び音声音響信号の復号を行う復号装置20(マルチチャネルデコーダ)を備える。
符号化装置10は、変換器11(変換部に相当する)及びエンコーダ12を含む構成を採る。
復号装置20は、デコーダ21及び逆変換器22(逆変換部に相当する)を含む構成を採る。
ch1’=0.25×(S’+3X’+2Y’+ Z)
ch2’=0.25×(S’− X’+2Y’+ Z)
ch3’=0.25×(S’− X’−2Y’+ Z)
ch4’=0.25×(S’− X’−2Y’−3Z)
以上のように、本実施の形態では、符号化装置10は、マルチチャネル信号を、全てのチャネルの加算信号と、チャネル間の差分信号とにミキシングして符号化する。この際、符号化装置10は、加算信号の符号化において判定された符号化モードを、差分信号の符号化にも用いる。また、復号装置20は、加算信号及び差分信号の各々に対応するモノラル符号化データを、符号化装置10で用いた符号化モードに従って復号する。
本実施の形態では、マルチチャネル音響信号に対してビームフォーミング処理(収音処理)を行う収音システムについて説明する。
S=0.25×(ch1+ch2+ch3+ch4)
X=0.25×(ch1−ch2)
Y=0.25×(ch2−ch3)
Z=0.25×(ch3−ch4)
ch1’=S’+3X’+2Y’+ Z
ch2’=S’− X’+2Y’+ Z
ch3’=S’− X’−2Y’+ Z
ch4’=S’− X’−2Y’−3Z
X=(ch1+ch2)−(ch3+ch4)
Y=(ch1+ch3)−(ch2+ch4)
Z=(ch1+ch4)−(ch2+ch3)
これに対応するための各復号チャネル信号ch1’〜ch4’も導出可能である。
1a 収音システム
10 符号化装置
11 変換器
12 エンコーダ
20 復号装置
21 デコーダ
22 逆変換器
30 マイクロホンアレーユニット
40 収音処理部
41 位相補正部
42 加算部
43 減算部
44 サイドローブキャンセラ
45 サイドローブサプレッサ
111,222 加算器
112 減算器
121,122,123,124 モノラルマルチモードエンコーダ
125 多重化部
211 逆多重化部
212,213,214,215 モノラルマルチモードデコーダ
221 増幅器
Claims (10)
- マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を生成する変換部と、
前記加算信号の特徴に応じた符号化モードで前記加算信号を符号化して第1符号化データを生成する第1符号化部と、
前記加算信号の符号化に用いられた符号化モードで前記差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、
前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、
を具備する音声音響信号符号化装置。 - 少なくとも3チャネルのマルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して1チャネルの加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を少なくとも2チャネル生成する、変換部と、
前記1チャネルの加算信号を符号化して第1符号化データを生成する第1符号化部と、
前記少なくとも2チャネルの差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、
前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、
を具備する音声音響信号符号化装置。 - 前記音声音響入力信号は、マイクロホンアレーユニットから出力される信号である、
請求項1または2に記載の音声音響信号符号化装置。 - 前記差分信号は、4チャネルの前記音声音響入力信号の差分信号であり、以下の数式に基づいて計算される、
請求項1または2に記載の音声音響信号符号化装置。
X=(ch1+ch2)−(ch3+ch4)
Y=(ch1+ch3)−(ch2+ch4)
Z=(ch1+ch4)−(ch2+ch3)
ch1〜ch4は前記複数のチャネル信号であり、X,Y,Zは前記チャネル間の差分信号である。 - 前記第1符号化データには、前記加算信号の符号化に用いられた符号化モードを示すモード情報が含まれる、
請求項1に記載の音声音響信号符号化装置。 - 音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、前記第1符号化データは、前記音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、前記加算信号の特徴に応じた符号化モードで符号化して生成され、前記第2符号化データは、前記音声音響信号符号化装置において、前記複数のチャネル信号のチャネル間の差分信号を前記加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成される、逆多重化部と、
前記加算信号の符号化に用いられた符号化モードで前記第1符号化データを復号して復号加算信号を得る第1復号部と、
前記加算信号の符号化に用いられた符号化モードで前記第2符号化データを復号して復号差分信号を得る第2復号部と、
前記復号加算信号及び前記復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する逆変換部と、
を具備する音声音響信号復号装置。 - 前記差分信号は、4チャネルの前記音声音響入力信号の差分信号であり、以下の数式に基づいて計算される、
請求項6に記載の音声音響信号復号装置。
X=(ch1+ch2)−(ch3+ch4)
Y=(ch1+ch3)−(ch2+ch4)
Z=(ch1+ch4)−(ch2+ch3)
ch1〜ch4は前記複数のチャネル信号であり、X,Y,Zは前記チャネル間の差分信号である。 - 前記第1符号化データには、前記加算信号の符号化に用いられた符号化モードを示すモード情報が含まれる、
請求項6に記載の音声音響信号復号装置。 - マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を生成し、
前記加算信号の特徴に応じた符号化モードで前記加算信号を符号化して第1符号化データを生成し、
前記加算信号の符号化に用いられた符号化モードで前記差分信号をそれぞれ符号化して第2符号化データを生成し、
前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する、
音声音響信号符号化方法。 - 音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、前記第1符号化データは、前記音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、前記加算信号の特徴に応じた符号化モードで符号化して生成され、前記第2符号化データは、前記音声音響信号符号化装置において、前記複数のチャネル信号のチャネル間の差分信号を前記加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成され、
前記加算信号の符号化に用いられた符号化モードで前記第1符号化データを復号して復号加算信号を得て、
前記加算信号の符号化に用いられた符号化モードで前記第2符号化データを復号して復号差分信号を得て、
前記復号加算信号及び前記復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する、
音声音響信号復号方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015244243A JP6721977B2 (ja) | 2015-12-15 | 2015-12-15 | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
CN201680059429.5A CN108140394B (zh) | 2015-12-15 | 2016-11-16 | 语音音频信号编码装置及其方法、解码装置及其方法 |
PCT/JP2016/004891 WO2017104105A1 (ja) | 2015-12-15 | 2016-11-16 | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
EP16875095.8A EP3392881B1 (en) | 2015-12-15 | 2016-11-16 | Audio acoustics signal encoding apparatus, audio acoustics signal decoding apparatus, audio acoustics signal encoding method, and audio acoustics signal decoding method |
US15/976,987 US10424308B2 (en) | 2015-12-15 | 2018-05-11 | Audio sound signal encoding device, audio sound signal decoding device, audio sound signal encoding method, and audio sound signal decoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015244243A JP6721977B2 (ja) | 2015-12-15 | 2015-12-15 | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017111230A JP2017111230A (ja) | 2017-06-22 |
JP2017111230A5 JP2017111230A5 (ja) | 2018-12-20 |
JP6721977B2 true JP6721977B2 (ja) | 2020-07-15 |
Family
ID=59056323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015244243A Active JP6721977B2 (ja) | 2015-12-15 | 2015-12-15 | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10424308B2 (ja) |
EP (1) | EP3392881B1 (ja) |
JP (1) | JP6721977B2 (ja) |
CN (1) | CN108140394B (ja) |
WO (1) | WO2017104105A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN106710600B (zh) * | 2016-12-16 | 2020-02-04 | 广州广晟数码技术有限公司 | 多声道音频信号的去相关编码方法和装置 |
SG11202012936VA (en) * | 2018-07-04 | 2021-01-28 | Fraunhofer Ges Forschung | Multisignal audio coding using signal whitening as preprocessing |
JP7176418B2 (ja) * | 2019-01-17 | 2022-11-22 | 日本電信電話株式会社 | 多地点制御方法、装置及びプログラム |
CN113259083B (zh) * | 2021-07-13 | 2021-09-28 | 成都德芯数字科技股份有限公司 | 一种调频同步网相位同步方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3175446B2 (ja) * | 1993-11-29 | 2001-06-11 | ソニー株式会社 | 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体 |
US5619524A (en) * | 1994-10-04 | 1997-04-08 | Motorola, Inc. | Method and apparatus for coherent communication reception in a spread-spectrum communication system |
WO1999014866A2 (en) * | 1997-09-12 | 1999-03-25 | Koninklijke Philips Electronics N.V. | Transmission system with improved reconstruction of missing parts |
JP4163294B2 (ja) * | 1998-07-31 | 2008-10-08 | 株式会社東芝 | 雑音抑圧処理装置および雑音抑圧処理方法 |
HUP0301368A3 (en) * | 2003-05-20 | 2005-09-28 | Amt Advanced Multimedia Techno | Method and equipment for compressing motion picture data |
WO2006091139A1 (en) * | 2005-02-23 | 2006-08-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
US8386267B2 (en) * | 2008-03-19 | 2013-02-26 | Panasonic Corporation | Stereo signal encoding device, stereo signal decoding device and methods for them |
US8620008B2 (en) * | 2009-01-20 | 2013-12-31 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
KR101756838B1 (ko) * | 2010-10-13 | 2017-07-11 | 삼성전자주식회사 | 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 |
JP2015011076A (ja) * | 2013-06-26 | 2015-01-19 | 日本放送協会 | 音響信号符号化装置、音響信号符号化方法、および音響信号復号化装置 |
-
2015
- 2015-12-15 JP JP2015244243A patent/JP6721977B2/ja active Active
-
2016
- 2016-11-16 WO PCT/JP2016/004891 patent/WO2017104105A1/ja unknown
- 2016-11-16 EP EP16875095.8A patent/EP3392881B1/en active Active
- 2016-11-16 CN CN201680059429.5A patent/CN108140394B/zh active Active
-
2018
- 2018-05-11 US US15/976,987 patent/US10424308B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3392881A4 (en) | 2018-10-24 |
CN108140394A (zh) | 2018-06-08 |
EP3392881B1 (en) | 2020-05-06 |
WO2017104105A1 (ja) | 2017-06-22 |
CN108140394B (zh) | 2022-03-25 |
JP2017111230A (ja) | 2017-06-22 |
US10424308B2 (en) | 2019-09-24 |
EP3392881A1 (en) | 2018-10-24 |
US20180261233A1 (en) | 2018-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6721977B2 (ja) | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 | |
US11011179B2 (en) | Signal processing apparatus and method, and program | |
KR101117336B1 (ko) | 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치 | |
RU2640647C2 (ru) | Устройство и способ преобразования первого и второго входных каналов, по меньшей мере, в один выходной канал | |
JP4456601B2 (ja) | 音声データ受信装置および音声データ受信方法 | |
JP5533502B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JP5163545B2 (ja) | オーディオ復号装置及びオーディオ復号方法 | |
EP2285139A3 (en) | Device and method for converting spatial audio signal | |
WO2009084226A1 (ja) | ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法 | |
US20110112843A1 (en) | Signal analyzing device, signal control device, and method and program therefor | |
WO2015140293A1 (en) | Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal | |
KR101926209B1 (ko) | 입체음향 오디오 신호의 프로세싱 | |
JP2015528925A (ja) | オーディオ信号処理装置および方法 | |
KR20230165855A (ko) | 공간 오디오 객체 분리 | |
JP2017111230A5 (ja) | ||
CA3212985A1 (en) | Combining spatial audio streams | |
GB2574667A (en) | Spatial audio capture, transmission and reproduction | |
JP2007187749A (ja) | マルチチャンネル符号化における頭部伝達関数をサポートするための新装置 | |
JPWO2008132826A1 (ja) | ステレオ音声符号化装置およびステレオ音声符号化方法 | |
JP5340378B2 (ja) | チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法 | |
US10553230B2 (en) | Decoding apparatus, decoding method, and program | |
WO2009142017A1 (ja) | ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 | |
JP2006270649A (ja) | 音声・音響信号処理装置およびその方法 | |
CN114270432A (zh) | 声学回声消除单元 | |
JP2010107821A (ja) | マルチチャンネルオーディオ復号装置、マルチチャンネルオーディオ復号方法、プログラム及び集積回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181105 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181105 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190717 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20191114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6721977 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |