JP2019118038A - オーディオデータ処理装置、及びオーディオデータ処理装置の制御方法。 - Google Patents
オーディオデータ処理装置、及びオーディオデータ処理装置の制御方法。 Download PDFInfo
- Publication number
- JP2019118038A JP2019118038A JP2017251461A JP2017251461A JP2019118038A JP 2019118038 A JP2019118038 A JP 2019118038A JP 2017251461 A JP2017251461 A JP 2017251461A JP 2017251461 A JP2017251461 A JP 2017251461A JP 2019118038 A JP2019118038 A JP 2019118038A
- Authority
- JP
- Japan
- Prior art keywords
- scene
- audio data
- gain
- switching
- field effect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000005669 field effect Effects 0.000 claims abstract description 66
- 238000004458 analytical method Methods 0.000 claims abstract description 41
- 230000003247 decreasing effect Effects 0.000 claims description 12
- 230000007423 decrease Effects 0.000 abstract description 5
- 230000007704 transition Effects 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007562 laser obscuration time method Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
Abstract
Description
第1の実施形態について、図面を用いて以下に説明する。
図1は、本実施形態におけるオーディオデータ処理装置1を含む聴取環境の模式図である。図1に示すように、本実施形態では、聴取位置Uの周囲に、フロント・レフトスピーカ21L、フロント・ライトスピーカ21R、センタースピーカ21C、サラウンド・レフトスピーカ21SL、およびサラウンド・ライトスピーカ21SRが設置されている。フロント・レフトスピーカ21Lは、聴取位置Uの前方左側、フロント・ライトスピーカ21Rは、聴取位置Uの前方右側、センタースピーカ21Cは、聴取位置Uの前方中央、サラウンド・レフトスピーカ21SLは、聴取位置Uの後方左側、サラウンド・ライトスピーカ21SRは、聴取位置Uの後方右側に設置されている。フロント・レフトスピーカ21L、フロント・ライトスピーカ21R、センタースピーカ21C、サラウンド・レフトスピーカ21SL、およびサラウンド・ライトスピーカ21SRは、それぞれオーディオデータ処理装置1に、無線又は有線により接続されている。なお、本実施形態においては、5chのサラウンドシステムを例に挙げて説明するが、本開示は、その他、2.0ch、5.1ch、7.1ch、11.2chなど、様々なチャンネル数のサラウンドシステムにおいても用いることができる。
図4は、本実施形態におけるオーディオデータ処理装置1の制御方法を示すフローチャートである。以下、図4を用いて、本実施形態におけるオーディオデータ処理装置1の制御方法について説明する。
チャンネル拡張部13から、各チャンネルのオーディオデータが出力されると、シーン解析部20が、このオーディオデータが、どのようなシーンかについて解析する。シーン解析部20によるシーン解析は、上述したとおり、機械学習を用いて行うことができる。本実施形態に含まれるシーンとしては、例えば「映画シーン」、「音楽シーン」、「静かなシーン」、「セリフ重視のシーン」、「BGM重視のシーン」、「効果音重視のシーン」、及び「低域重視のシーン」などが含まれる。
第1の時点T1において、制御部17は、シーン解析部20から、第1の時点T1におけるシーンが「音楽シーン」である旨の判定結果を受け取っている。制御部17は、第2の時点T2においても、この判定結果を記憶している。
制御部17は、第1の加算処理部141、及び第2の加算処理部143における通常状態のゲインG1を、例えば−60dBのような非常に低い所定のゲインG0に、段階的に減少させる。その際、制御部17は、例えば50msecなど、所定の時間(第1の時間)をかけて、第1の加算処理部141、及び第2の加算処理部143における通常状態のゲインG1を、所定のゲインG0にまで、段階的に減少させる。なお、通常状態のゲインG1から、所定のゲインG0までの遷移は、時間の推移に比例してゲインを変化させる直線的な遷移であってもよく、時間の推移にゲインの変化が比例しない曲線的な遷移であってもよい。
第1の加算処理部141、及び第2の加算処理部143のゲインが、所定のゲインG0まで減少したことを制御部17が認識すると、制御部17は、音場効果データ生成部142に対し、各種パラメータの変更を指示するコマンド信号を送信する。
音場効果データ生成部142が、各種パラメータの変更を完了すると、制御部17は、第1の加算処理部141、及び第2の加算処理部143におけるゲインを、所定のゲインG0から、通常状態のゲインG1にまで段階的に増加させる。
バッファ、T1 第1の時点、T2 第2の時点、U 聴取位置、G0 ゲイン、G1 ゲイン、R1 第1の比率、R2 第2の比率、F1 第1のフィルタ係数、F2 第2のフィルタ係数、D1 第1のディレイタイム、D2 第2のディレイタイム、S001 シーン解析ステップ、S002 切り替え認識ステップ、S003 フェードアウトステップ、S004 パラメータ変更ステップ、S005 フェードインステップ。
Claims (14)
- パラメータを用いた演算処理により、オーディオデータに音場効果データを付与する音場効果データ生成部と、
前記オーディオデータにつきシーンの解析を行うシーン解析部と、
前記シーン解析部による解析結果に基づきシーンの切り替えを認識すると、前記音場効果データ生成部の入力ゲインと出力ゲインの双方を段階的に減少させ、前記パラメータを変化させた後、前記入力ゲインと前記出力ゲインの双方を段階的に増加させる制御部と、
を含む、オーディオデータ処理装置。 - 前記オーディオデータは複数のチャンネルを含み、
前記音場効果データ生成部は、前記複数のチャンネルに対して前記パラメータを用いた演算処理を行い、
前記制御部は、前記複数のチャンネルについての前記入力ゲインと、前記複数のチャンネルについての前記出力ゲインについて制御する、
請求項1に記載のオーディオデータ処理装置。 - 前記パラメータは、ゲイン比率、フィルタ係数、ディレイタイムを含み、
前記シーンの切り替えにおいて、前記ゲイン比率、前記フィルタ係数、及びディレイタイムの内のいずれか二つ以上を変化させる、
請求項1又は2に記載のオーディオデータ処理装置。 - 前記制御部が、前記切り替え後のシーンの種類に応じて、前記入力ゲインと前記出力ゲインとの段階的減少に要する時間を決定する、
請求項1乃至3のいずれか一つに記載のオーディオデータ処理装置。 - 前記制御部が、前記切り替え後のシーンの種類に応じて、前記入力ゲインと前記出力ゲインとの段階的増加に要する時間を決定する、
請求項1乃至4のいずれか一つに記載のオーディオデータ処理装置。 - 前記制御部が、通常パターンの前記シーンの切り替えにおいて、第1の時間をかけて前記入力ゲインと前記出力ゲインとを段階的に減少させ、第2の時間をかけて前記入力ゲインと前記出力ゲインとを段階的に増加させる、
請求項1乃至5のいずれか一つに記載のオーディオデータ処理装置。 - 前記切り替え後のシーンにおいて200Hz以下の音が所定の割合以上である場合、前記制御部は、前記入力ゲインと前記出力ゲインとの段階的増加に要する時間を、前記第2の時間よりも長い時間とする、
請求項6に記載のオーディオデータ処理装置。 - 前記切り替え後のシーンにおいて200Hz以下の音が所定の割合以上である場合、前記制御部は、前記入力ゲインと前記出力ゲインとの段階的減少に要する時間を、前記第1の時間よりも短い時間とする、
請求項6に記載のオーディオデータ処理装置。 - 前記切り替え後のシーンにおいて音楽の信号成分が所定の割合以上である場合、前記制御部は、前記入力ゲインと前記出力ゲインとの段階的減少に要する時間を、前記第1の時間よりも短い時間とする、
請求項6に記載のオーディオデータ処理装置。 - 前記切り替え後のシーンにおいて音楽の信号成分が所定の割合以上である場合、前記制御部は、前記入力ゲインと前記出力ゲインとの段階的増加に要する時間を、前記第2の時間よりも短い時間とする、
請求項6に記載のオーディオデータ処理装置。 - 前記切り替え後のシーンがセリフ成分を含む場合、前記制御部は、前記セリフ成分の前記入力ゲインと前記出力ゲインとの段階的減少に要する時間を、前記セリフ成分以外の成分の前記入力ゲインと前記出力ゲインとの段階的減少に要する時間よりも長い時間とする、
請求項4に記載のオーディオデータ処理装置。 - 前記切り替え後のシーンがセリフ成分を含む場合、前記制御部は、前記セリフ成分の前記入力ゲインと前記出力ゲインとの段階的増加に要する時間を、前記セリフ成分以外の成分の前記入力ゲインと前記出力ゲインとの段階的増加に要する時間よりも長い時間とする、
請求項5に記載のオーディオデータ処理装置。 - 前記音場効果データ生成部の入力ゲインを調整する第1の加算処理部と、
前記第1の加算処理部の前段に設けられたバッファと、を更に含む、
請求項1乃至12のいずれか一つに記載のオーディオデータ処理装置。 - パラメータを用いた演算処理により、オーディオデータに音場効果データを付与する音場効果データ生成部を含む、オーディオデータ処理装置の制御方法であって、
前記オーディオデータにつきシーンの解析を行う第1のステップと、
前記シーンの解析結果に基づき前記シーンの切り替えを認識する第2のステップと、
前記音場効果データ生成部の入力ゲインと出力ゲインの双方を段階的に減少させる第3のステップと、
前記演算処理に用いられるパラメータを変化させる第4のステップと、
前記音場効果データ生成部の前記入力ゲインと前記出力ゲインの双方を段階的に増加させる第5のステップと、
を含む、オーディオデータ処理装置の制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017251461A JP6969368B2 (ja) | 2017-12-27 | 2017-12-27 | オーディオデータ処理装置、及びオーディオデータ処理装置の制御方法。 |
US16/233,523 US10848888B2 (en) | 2017-12-27 | 2018-12-27 | Audio data processing device and control method for an audio data processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017251461A JP6969368B2 (ja) | 2017-12-27 | 2017-12-27 | オーディオデータ処理装置、及びオーディオデータ処理装置の制御方法。 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019118038A true JP2019118038A (ja) | 2019-07-18 |
JP6969368B2 JP6969368B2 (ja) | 2021-11-24 |
Family
ID=66950839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017251461A Active JP6969368B2 (ja) | 2017-12-27 | 2017-12-27 | オーディオデータ処理装置、及びオーディオデータ処理装置の制御方法。 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10848888B2 (ja) |
JP (1) | JP6969368B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113113046A (zh) * | 2021-04-14 | 2021-07-13 | 杭州朗和科技有限公司 | 音频处理的性能检测方法、装置、存储介质及电子设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114501125B (zh) * | 2021-12-21 | 2023-09-12 | 广州番禺巨大汽车音响设备有限公司 | 一种自动匹配支持杜比全景声音频的方法及系统 |
CN114598917B (zh) * | 2022-01-27 | 2024-03-29 | 海信视像科技股份有限公司 | 显示设备及音频处理方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7003467B1 (en) | 2000-10-06 | 2006-02-21 | Digital Theater Systems, Inc. | Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio |
US6816599B2 (en) * | 2000-11-14 | 2004-11-09 | Topholm & Westermann Aps | Ear level device for synthesizing music |
JP2010098460A (ja) | 2008-10-15 | 2010-04-30 | Yamaha Corp | オーディオ信号処理装置 |
JP5577787B2 (ja) * | 2009-05-14 | 2014-08-27 | ヤマハ株式会社 | 信号処理装置 |
EP3048818B1 (en) * | 2015-01-20 | 2018-10-10 | Yamaha Corporation | Audio signal processing apparatus |
-
2017
- 2017-12-27 JP JP2017251461A patent/JP6969368B2/ja active Active
-
2018
- 2018-12-27 US US16/233,523 patent/US10848888B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113113046A (zh) * | 2021-04-14 | 2021-07-13 | 杭州朗和科技有限公司 | 音频处理的性能检测方法、装置、存储介质及电子设备 |
CN113113046B (zh) * | 2021-04-14 | 2024-01-19 | 杭州网易智企科技有限公司 | 音频处理的性能检测方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6969368B2 (ja) | 2021-11-24 |
US10848888B2 (en) | 2020-11-24 |
US20190200151A1 (en) | 2019-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5674827B2 (ja) | 多重チャネル音声信号中の発話に関連したチャネルのダッキングをスケーリングするための方法およびシステム | |
US8121307B2 (en) | In-vehicle sound control system | |
JP6323089B2 (ja) | レベル調整方法およびレベル調整装置 | |
US10848888B2 (en) | Audio data processing device and control method for an audio data processing device | |
JP4792086B2 (ja) | 2つの入力チャンネルを使用して3つの出力チャンネルを合成させる装置および方法 | |
CN114830687B (zh) | 多频带限制器模式和噪声补偿方法 | |
US8750529B2 (en) | Signal processing apparatus | |
US12033660B2 (en) | Data processing device and data processing method | |
JP6067391B2 (ja) | 信号音量に基いた信号利得の適合時のピーク検出 | |
JP2015087686A (ja) | 音響装置 | |
JP5062055B2 (ja) | 音声信号処理装置及び方法 | |
JP2007033507A (ja) | 音響再生装置 | |
US9653065B2 (en) | Audio processing device, method, and program | |
RU2384973C1 (ru) | Устройство и способ синтезирования трех выходных каналов, используя два входных канала | |
JP2013114242A (ja) | 音響処理装置 | |
Chang et al. | Audio dynamic range control for set-top box | |
JP2005328114A (ja) | 音声回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201023 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210928 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211011 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6969368 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |