JPWO2016038876A1 - 符号化装置、復号化装置及び音声信号処理装置 - Google Patents
符号化装置、復号化装置及び音声信号処理装置 Download PDFInfo
- Publication number
- JPWO2016038876A1 JPWO2016038876A1 JP2016547697A JP2016547697A JPWO2016038876A1 JP WO2016038876 A1 JPWO2016038876 A1 JP WO2016038876A1 JP 2016547697 A JP2016547697 A JP 2016547697A JP 2016547697 A JP2016547697 A JP 2016547697A JP WO2016038876 A1 JPWO2016038876 A1 JP WO2016038876A1
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- dialog
- control
- signal processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 141
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000000926 separation method Methods 0.000 claims description 16
- 230000006835 compression Effects 0.000 claims description 10
- 238000007906 compression Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 1
- 101100018996 Caenorhabditis elegans lfe-2 gene Proteins 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Stereophonic System (AREA)
Abstract
Description
入力された音声信号を符号化する符号化装置であって、
前記音声信号を圧縮符号化して圧縮音声信号として出力する圧縮符号化部と、
入力されたダイアログ制御用メタデータを前記圧縮音声信号と多重化して出力する多重化部と、
を備えるものである。
ダイアログ制御用メタデータ及び圧縮音声信号が多重化された入力信号を前記ダイアログ制御用メタデータと、前記圧縮音声信号とに分離する分離部と、
前記圧縮音声信号を復号化する復号化部と、
を備えるものである。
復号化装置において分離されたダイアログ制御用メタデータ及び前記復号化装置において復号化された音声信号又は復号化されなかった圧縮音声信号を用いて音声信号処理を行う音声信号処理装置であって、
ダイアログ制御機能に対応した番組か否かのフラグに基づいてダイアログ制御の可否を判定するダイアログ制御可否判定部と、
ダイアログ専用チャンネル信号を特定するダイアログ専用チャンネル信号特定部と、
ダイアログ専用チャンネル信号の利得制御量の上限値及び下限値を、ダイアログの制御情報として取得し、前記ダイアログ専用チャンネル信号とそれ以外の任意の数のチャンネル信号とに対してそれぞれ異なる信号処理を行って音声信号として出力する制御部と、
を備えるものである。
前記制御部は、前記制御情報に基づいて前記音声信号を調節して出力してもよい。
前記制御部は、前記調節情報に基づいて音声信号を調節して出力してもよい。
ダイアログ音量を増加させる調節情報を取得したとき、前記ダイアログ専用チャンネル信号以外のチャンネル信号の利得を低減させ、
ダイアログ音量を低減させる調節情報を取得したとき、前記ダイアログ専用チャンネル信号の利得のみを低減させてもよい。
11 圧縮符号化部
12 多重化部
2 復号化装置
21 分離部
22 メタデータ分離部
23 復号化部
3 音声信号処理装置
31 ダイアログ制御可否判定部
32 ダイアログ専用チャンネル信号特定部
33 音声信号分離部
34 制御部
35 制御情報取得部
36 記憶部
4 制御情報入力装置
Claims (16)
- 入力された音声信号を符号化する符号化装置であって、
前記音声信号を圧縮符号化して圧縮音声信号として出力する圧縮符号化部と、
入力されたダイアログ制御用メタデータを前記圧縮音声信号と多重化して出力する多重化部と、
を備える符号化装置。 - 前記ダイアログ制御用メタデータは、ダイアログ制御機能に対応した番組か否かのフラグ並びに受信機又は当該受信機に接続された再生装置での利得制御の上限値及び下限値を含む、請求項1に記載の符号化装置。
- 前記多重化部は、前記上限値及び前記下限値の情報を符号化する、請求項2に記載の符号化装置。
- ダイアログ制御用メタデータ及び圧縮音声信号が多重化された入力信号を前記ダイアログ制御用メタデータと、前記圧縮音声信号とに分離する分離部と、
前記圧縮音声信号を復号化する復号化部と、
を備える復号化装置。 - 復号化装置において分離されたダイアログ制御用メタデータ及び前記復号化装置において復号化された音声信号又は復号化されなかった圧縮音声信号を用いて音声信号処理を行う音声信号処理装置であって、
ダイアログ制御機能に対応した番組か否かのフラグに基づいてダイアログ制御の可否を判定するダイアログ制御可否判定部と、
ダイアログ専用チャンネル信号を特定するダイアログ専用チャンネル信号特定部と、
ダイアログ専用チャンネル信号の利得制御量の上限値及び下限値を、ダイアログの制御情報として取得し、前記ダイアログ専用チャンネル信号とそれ以外の任意の数のチャンネル信号とに対してそれぞれ異なる信号処理を行って音声信号として出力する制御部と、
を備える音声信号処理装置。 - 前記ダイアログの制御情報を外部の制御情報入力装置から取得する制御情報取得部を更に備え、
前記制御部は、前記制御情報に基づいて前記音声信号を調節して出力する、請求項5に記載の音声信号処理装置。 - 前記制御情報取得部は、前記ダイアログの制御情報としてダイアログ音量の調節情報を取得し、
前記制御部は、前記調節情報に基づいて音声信号を調節して出力する、請求項6に記載の音声信号処理装置。 - 前記ダイアログ専用チャンネル信号特定部は、ダイアログ専用チャンネルの信号を、前記復号化装置から取得した音声方式メタデータに基づいて特定する、請求項5〜7のいずれか1項に記載の音声信号処理装置。
- 前記ダイアログ専用チャンネル信号特定部は、ダイアログ専用チャンネルの信号を、前記復号化装置以外の外部装置から取得した情報を用いて特定する、請求項5〜7のいずれか1項に記載の音声信号処理装置。
- 前記制御部は更に、ダイアログに話速変換処理を行う、請求項5〜9のいずれか1項に記載の音声信号処理装置。
- 前記制御部は、前記利得制御量の上限値よりも高い又は下限値よりも低いダイアログ音量の調節情報を取得したとき、前記利得制御量の上限値又は下限値により調節を制限する、請求項5〜10のいずれか1項に記載の音声信号処理装置。
- 前記制御部は、
ダイアログ音量を増加させる調節情報を取得したとき、前記ダイアログ専用チャンネル信号以外のチャンネル信号の利得を低減させ、
ダイアログ音量を低減させる調節情報を取得したとき、前記ダイアログ専用チャンネル信号の利得のみを低減させる、請求項5〜11のいずれか1項に記載の音声信号処理装置。 - 前記制御部は、ダイアログの制御を行った後にダウンミックスを含む変換手段によりチャンネル数を変換する、請求項5〜12のいずれか1項に記載の音声信号処理装置。
- 前記制御部は、前記ダイアログ専用チャンネル信号とそれ以外の任意の数のチャンネル信号との双方又はどちらか一方に、それぞれ周波数補正処理を含む信号処理を行う、請求項5〜13のいずれか1項に記載の音声信号処理装置。
- 前記制御部は、前記復号化装置においてビットストリームから分離された前記圧縮音声信号を復号化せずにそのまま前記音声信号処理を行ってから、復号化して音声信号として出力するか、復号化せずに圧縮音声信号として出力する、請求項5〜14のいずれか1項に記載の音声信号処理装置。
- 前記制御部は、前記音声信号処理後に前記ダイアログ制御用メタデータと音声方式メタデータの双方またはどちらか一方と、前記圧縮音声信号を多重化してビットストリームとして出力する、請求項5〜15のいずれか1項に記載の音声信号処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020056071A JP6924862B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
JP2020056076A JP6924863B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014182695 | 2014-09-08 | ||
JP2014182695 | 2014-09-08 | ||
PCT/JP2015/004534 WO2016038876A1 (ja) | 2014-09-08 | 2015-09-07 | 符号化装置、復号化装置及び音声信号処理装置 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020056076A Division JP6924863B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
JP2020056071A Division JP6924862B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016038876A1 true JPWO2016038876A1 (ja) | 2017-06-15 |
JP6683618B2 JP6683618B2 (ja) | 2020-04-22 |
Family
ID=55458647
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016547697A Active JP6683618B2 (ja) | 2014-09-08 | 2015-09-07 | 音声信号処理装置 |
JP2020056076A Active JP6924863B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
JP2020056071A Active JP6924862B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020056076A Active JP6924863B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
JP2020056071A Active JP6924862B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
Country Status (2)
Country | Link |
---|---|
JP (3) | JP6683618B2 (ja) |
WO (1) | WO2016038876A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001245237A (ja) * | 2000-02-28 | 2001-09-07 | Victor Co Of Japan Ltd | 放送受信装置 |
JP2010518460A (ja) * | 2007-02-13 | 2010-05-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
JP2011172235A (ja) * | 2008-04-18 | 2011-09-01 | Dolby Lab Licensing Corp | サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置 |
JP2012527021A (ja) * | 2010-02-18 | 2012-11-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 |
US20140294200A1 (en) * | 2013-03-29 | 2014-10-02 | Apple Inc. | Metadata for loudness and dynamic range control |
JPWO2016039150A1 (ja) * | 2014-09-08 | 2017-06-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2064915B1 (en) * | 2006-09-14 | 2014-08-27 | LG Electronics Inc. | Controller and user interface for dialogue enhancement techniques |
JP5241865B2 (ja) * | 2011-01-21 | 2013-07-17 | 日立コンシューマエレクトロニクス株式会社 | ビデオカメラ |
-
2015
- 2015-09-07 WO PCT/JP2015/004534 patent/WO2016038876A1/ja active Application Filing
- 2015-09-07 JP JP2016547697A patent/JP6683618B2/ja active Active
-
2020
- 2020-03-26 JP JP2020056076A patent/JP6924863B2/ja active Active
- 2020-03-26 JP JP2020056071A patent/JP6924862B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001245237A (ja) * | 2000-02-28 | 2001-09-07 | Victor Co Of Japan Ltd | 放送受信装置 |
JP2010518460A (ja) * | 2007-02-13 | 2010-05-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
JP2011172235A (ja) * | 2008-04-18 | 2011-09-01 | Dolby Lab Licensing Corp | サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置 |
JP2012527021A (ja) * | 2010-02-18 | 2012-11-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 |
US20140294200A1 (en) * | 2013-03-29 | 2014-10-02 | Apple Inc. | Metadata for loudness and dynamic range control |
JPWO2016039150A1 (ja) * | 2014-09-08 | 2017-06-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2016038876A1 (ja) | 2016-03-17 |
JP2020101837A (ja) | 2020-07-02 |
JP2020101836A (ja) | 2020-07-02 |
JP6924862B2 (ja) | 2021-08-25 |
JP6924863B2 (ja) | 2021-08-25 |
JP6683618B2 (ja) | 2020-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10958229B2 (en) | Metadata for loudness and dynamic range control | |
US10854213B2 (en) | Apparatus and method for screen related audio object remapping | |
CN111492427B (zh) | 高阶立体混响音频数据的优先级信息 | |
KR101759005B1 (ko) | 3d 오디오 계층적 코딩을 이용한 라우드스피커 포지션 보상 | |
US20100324915A1 (en) | Encoding and decoding apparatuses for high quality multi-channel audio codec | |
US8446533B2 (en) | Television apparatus and method for controlling the same | |
CN110603585A (zh) | 用于高阶立体环绕声的音频数据的分层中间压缩 | |
US10446160B2 (en) | Coding device and method, decoding device and method, and program | |
JP6924862B2 (ja) | 音声信号処理装置 | |
JP2014204320A (ja) | 音響信号再生装置、音響信号作成装置 | |
EP2175643A1 (en) | Personal recording apparatus and control method thereof | |
JP6137755B2 (ja) | 受信装置、受信方法及びプログラム | |
KR101516968B1 (ko) | 오디오 신호 처리 방법 및 이를 이용한 방송 출력 장치 | |
US20230232182A1 (en) | Spatial Audio Capture, Transmission and Reproduction | |
JP6436573B2 (ja) | 受信装置、受信方法、及びプログラム | |
JP6327711B2 (ja) | 受信装置、放送システム、受信方法及びプログラム | |
JP2016092696A (ja) | 受信装置、放送システム、受信方法及びプログラム | |
KR101432054B1 (ko) | 다중 음성출력 영상표시장치 | |
WO2017022461A1 (ja) | 受信装置、送信装置、及び、データ処理方法 | |
JP2018033159A (ja) | 受信装置 | |
US20110054917A1 (en) | Apparatus and method for structuring bitstream for object-based audio service, and apparatus for encoding the bitstream | |
JP2017069705A (ja) | 受信装置、受信方法、放送システムおよびプログラム | |
JP2011158694A (ja) | 音声信号処理装置 | |
JP2010098522A (ja) | デジタル放送受信機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200326 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6683618 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |