JP6924862B2 - 音声信号処理装置 - Google Patents
音声信号処理装置 Download PDFInfo
- Publication number
- JP6924862B2 JP6924862B2 JP2020056071A JP2020056071A JP6924862B2 JP 6924862 B2 JP6924862 B2 JP 6924862B2 JP 2020056071 A JP2020056071 A JP 2020056071A JP 2020056071 A JP2020056071 A JP 2020056071A JP 6924862 B2 JP6924862 B2 JP 6924862B2
- Authority
- JP
- Japan
- Prior art keywords
- dialog
- audio signal
- control
- unit
- channel signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 100
- 238000000034 method Methods 0.000 claims description 25
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000000926 separation method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 1
- 101100018996 Caenorhabditis elegans lfe-2 gene Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Stereophonic System (AREA)
Description
11 圧縮符号化部
12 多重化部
2 復号化装置
21 分離部
22 メタデータ分離部
23 復号化部
3 音声信号処理装置
31 ダイアログ制御可否判定部
32 ダイアログ専用チャンネル信号特定部
33 音声信号分離部
34 制御部
35 制御情報取得部
36 記憶部
4 制御情報入力装置
Claims (5)
- 各チャンネルに対応する音声信号に対して、チャンネルベース方式に基づいて音声信号処理を行う音声信号処理装置であって、
ダイアログ制御機能に対応した番組か否かのフラグに基づいてダイアログ制御の可否を判定するダイアログ制御可否判定部と、
前記ダイアログ制御可否判定部によりダイアログ制御可能と判定された場合に、ダイアログ専用チャンネル信号を特定するダイアログ専用チャンネル信号特定部と、
前記音声信号を、前記ダイアログ専用チャンネル信号特定部の特定に基づいて、前記ダイアログ専用チャンネル信号と、前記ダイアログ専用チャンネル信号以外のチャンネル信号とに分離する音声信号分離部と、
ダイアログ専用チャンネル信号の利得制御量の上限値及び下限値を、ダイアログ制御用メタデータとして取得し、前記ダイアログ専用チャンネル信号と、前記ダイアログ専用チャンネル信号以外のチャンネル信号とに対してそれぞれ異なる信号処理を行う制御部と、
前記ダイアログの制御情報を制御情報入力装置から取得する制御情報取得部と、を備え、
前記制御部は、前記ダイアログ制御用メタデータと前記制御情報とに基づいて前記音声信号を調節して出力する音声信号処理装置。 - 前記制御情報取得部は、前記制御情報としてダイアログ音量の調節情報を取得し、
前記制御部は、前記調節情報に基づいて音声信号を調節して出力する、請求項1に記載の音声信号処理装置。 - 前記制御部は、ダイアログの制御を行った後にダウンミックスを含む変換手段によりチャンネル数を変換する、請求項1又は2に記載の音声信号処理装置。
- 前記制御部は、前記ダイアログ専用チャンネル信号と前記ダイアログ専用チャンネル信号以外のチャンネル信号との双方又はどちらか一方に、それぞれ周波数補正処理を含む信号処理を行う、請求項1から3のいずれか1項に記載の音声信号処理装置。
- 前記制御部は、前記音声信号がビットストリームから分離された圧縮音声信号である場合、該圧縮音声信号を復号化せずにそのまま前記信号処理を行う、請求項1から4のいずれか1項に記載の音声信号処理装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014182695 | 2014-09-08 | ||
JP2014182695 | 2014-09-08 | ||
JP2016547697A JP6683618B2 (ja) | 2014-09-08 | 2015-09-07 | 音声信号処理装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016547697A Division JP6683618B2 (ja) | 2014-09-08 | 2015-09-07 | 音声信号処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020101836A JP2020101836A (ja) | 2020-07-02 |
JP6924862B2 true JP6924862B2 (ja) | 2021-08-25 |
Family
ID=55458647
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016547697A Active JP6683618B2 (ja) | 2014-09-08 | 2015-09-07 | 音声信号処理装置 |
JP2020056071A Active JP6924862B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
JP2020056076A Active JP6924863B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016547697A Active JP6683618B2 (ja) | 2014-09-08 | 2015-09-07 | 音声信号処理装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020056076A Active JP6924863B2 (ja) | 2014-09-08 | 2020-03-26 | 音声信号処理装置 |
Country Status (2)
Country | Link |
---|---|
JP (3) | JP6683618B2 (ja) |
WO (1) | WO2016038876A1 (ja) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001245237A (ja) * | 2000-02-28 | 2001-09-07 | Victor Co Of Japan Ltd | 放送受信装置 |
WO2008035227A2 (en) * | 2006-09-14 | 2008-03-27 | Lg Electronics Inc. | Dialogue enhancement techniques |
KR20090115200A (ko) * | 2007-02-13 | 2009-11-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
MY179314A (en) * | 2008-04-18 | 2020-11-04 | Dolby Laboratories Licensing Corp | Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience |
TWI557723B (zh) * | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
JP5241865B2 (ja) * | 2011-01-21 | 2013-07-17 | 日立コンシューマエレクトロニクス株式会社 | ビデオカメラ |
US9559651B2 (en) * | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
EP3196877A4 (en) * | 2014-09-08 | 2018-02-28 | Sony Corporation | Coding device and method, decoding device and method, and program |
-
2015
- 2015-09-07 WO PCT/JP2015/004534 patent/WO2016038876A1/ja active Application Filing
- 2015-09-07 JP JP2016547697A patent/JP6683618B2/ja active Active
-
2020
- 2020-03-26 JP JP2020056071A patent/JP6924862B2/ja active Active
- 2020-03-26 JP JP2020056076A patent/JP6924863B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020101836A (ja) | 2020-07-02 |
JP2020101837A (ja) | 2020-07-02 |
WO2016038876A1 (ja) | 2016-03-17 |
JPWO2016038876A1 (ja) | 2017-06-15 |
JP6683618B2 (ja) | 2020-04-22 |
JP6924863B2 (ja) | 2021-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111492427B (zh) | 高阶立体混响音频数据的优先级信息 | |
EP3329489B1 (en) | Encoded audio metadata-based equalization | |
EP3540733B1 (en) | Metadata for loudness and dynamic range control | |
US20100324915A1 (en) | Encoding and decoding apparatuses for high quality multi-channel audio codec | |
KR101759005B1 (ko) | 3d 오디오 계층적 코딩을 이용한 라우드스피커 포지션 보상 | |
US20230232182A1 (en) | Spatial Audio Capture, Transmission and Reproduction | |
US10446160B2 (en) | Coding device and method, decoding device and method, and program | |
JP6924862B2 (ja) | 音声信号処理装置 | |
EP2175643A1 (en) | Personal recording apparatus and control method thereof | |
JP4616155B2 (ja) | テレビジョン受信装置 | |
KR20230153402A (ko) | 다운믹스 신호들의 적응형 이득 제어를 갖는 오디오 코덱 | |
JP2008301149A (ja) | 音場制御方法、音場制御プログラム、音声再生装置 | |
JP6137755B2 (ja) | 受信装置、受信方法及びプログラム | |
JP5042182B2 (ja) | 要約コンテンツ生成装置およびコンピュータプログラム | |
JP2007142865A (ja) | テレビジョン受信装置 | |
JP4167346B2 (ja) | ディジタル放送用聴覚補償方法およびそれに用いる受信装置 | |
KR101516968B1 (ko) | 오디오 신호 처리 방법 및 이를 이용한 방송 출력 장치 | |
JP6137754B2 (ja) | 受信装置、受信方法及びプログラム | |
JP6099250B2 (ja) | 放送送出装置、及び受信機 | |
JP2017069705A (ja) | 受信装置、受信方法、放送システムおよびプログラム | |
KR101432054B1 (ko) | 다중 음성출력 영상표시장치 | |
JP6327711B2 (ja) | 受信装置、放送システム、受信方法及びプログラム | |
WO2024074285A1 (en) | Method, apparatus, and medium for encoding and decoding of audio bitstreams with flexible block-based syntax | |
JP4795783B2 (ja) | テレビジョン受信装置 | |
US20110054917A1 (en) | Apparatus and method for structuring bitstream for object-based audio service, and apparatus for encoding the bitstream |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200326 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6924862 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |