JP2016072890A - 音声処理装置、および、音声出力装置 - Google Patents

音声処理装置、および、音声出力装置 Download PDF

Info

Publication number
JP2016072890A
JP2016072890A JP2014202226A JP2014202226A JP2016072890A JP 2016072890 A JP2016072890 A JP 2016072890A JP 2014202226 A JP2014202226 A JP 2014202226A JP 2014202226 A JP2014202226 A JP 2014202226A JP 2016072890 A JP2016072890 A JP 2016072890A
Authority
JP
Japan
Prior art keywords
channel
audio
gain
unit
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014202226A
Other languages
English (en)
Inventor
永雄 服部
Nagao Hattori
永雄 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2014202226A priority Critical patent/JP2016072890A/ja
Publication of JP2016072890A publication Critical patent/JP2016072890A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】複数チャンネルの音声がミックスされた音声の再生において、重要なチャンネルの音声が聴き取りづらくなることを抑制する技術を提供する。【解決手段】出力される音声の音量を適正に保持するように、チャンネルごとの音声信号のゲインを動的に調整するゲイン調整部(4)と、上記ゲイン調整部によりゲインが調整された、チャンネルごとの音声信号を、当該チャンネルの係数に応じて重み付け加算する加算部(5)と、を備え、上記ゲイン調整部が、上記チャンネルごとの音声信号のゲインを、当該チャンネルの重要度に応じて調整する音声処理装置。【選択図】図1

Description

本発明は、チャンネルごとの音声信号のゲインを調整する音声処理装置、および、音声出力装置に関する。
オーディオシステムにおいて、スピーカの出力音圧およびアンプの出力電力にはハードウェア上の限界があり、合計出力の制限範囲が設けられている。そして、各チャンネルの音声出力信号の合計出力が当該制限範囲を逸脱して、音声出力が歪まないように、音声出力信号のゲインを動的に変化させる手法が採られている。例えば、従来、音声出力信号のピークレベルが所定値以下に収まるように、コンプレッサやリミッタを用いて、音声出力信号の振幅を圧縮する処理が知られている。この場合、瞬間的に大きくなる音声出力信号が存在したときに、当該大きくなる音声出力信号およびその他の音声出力信号を一括して音声出力ごとに同じ比率で圧縮する。
なお、関連技術として、特許文献1には、音源の種別に応じて、コンプレッサにおける、音源の音響信号の圧縮特性を調整する音響再生装置が開示されており、特許文献2には、音響信号の優先度に応じて仮想音源を配置する復号化装置が開示されている。
特開2001−52444号公報(2001年2月23日公開) 特許第5340296号公報(2010年9月30日国際公開)
上記のような従来の処理においては、上記大きくなる音声信号およびその他の音声信号を音声出力ごとに一括して同じ比率で圧縮するので、ユーザにとって重要な音声信号(例えば、主として人の声に係る音声など)であっても、上記大きくなる音声信号と比して音量が相対的に小さくなり過ぎてしまい、ユーザの利便性が損なわれるという問題がある。
ところで、複数のチャンネル音声を再生する際に、当該チャンネルの個数よりも少ないスピーカで行う場合がある。この場合に、例えば、5.1チャンネルの音声信号のうち、センタ信号およびサラウンド信号をフロントの2チャンネルに加算して再生する処理があり、ダウンミックスと呼ばれる。このダウンミックスにおいても、上記現象と同様の問題が発生する。
すなわち、ダウンミックスして出力する場合、主に人の声に係る音声が伝送されるチャンネルの音声信号と、主に背景音が伝送されるチャンネルの音声信号とを加算すると、人の声に係る音声が背景音に消される場合がある。これは、大きい背景音および小さい音声を加算した後に、一括して同じ比率で圧縮するため、大きい背景音を上限値に抑えると、小さい音声が小さくなり過ぎて聴こえなくなる現象である。
本発明は、上記課題に鑑みてなされたものであり、その目的は、複数チャンネルの音声がミックスされた音声の再生において、重要なチャンネルの音声が聴き取りづらくなることを抑制する技術を提供することにある。
上記課題を解決するために、本発明の態様1に係る音声処理装置は、出力される音声の音量を適正に保持するように、チャンネルごとの音声信号のゲインを動的に調整するゲイン調整部と、上記ゲイン調整部によりゲインが調整された、チャンネルごとの音声信号を、当該チャンネルの係数に応じて重み付け加算する加算部と、を備え、上記ゲイン調整部は、上記チャンネルごとの音声信号のゲインを、当該チャンネルの重要度に応じて調整することを特徴とする。
上記の構成によれば、チャンネルごとの音声信号のゲインを、当該チャンネルの重要度に応じて調整した後に、当該チャンネルの係数に応じて重み付け加算する。上記によれば、複数チャンネルの音声がミックスされた音声の再生において、重要なチャンネルの音声が聴き取りづらくなることを抑制することができる。
本発明の態様2に係る音声処理装置は、上記態様1において、上記加算部により重み付け加算された、チャンネルごとの音声信号の加算値を取得し、当該加算値およびチャンネルごとの重要度に応じて、上記ゲイン調整部に上記ゲインの調整を指示する制御部をさらに備え、上記ゲイン調整部が、上記制御部からの指示に従って、上記ゲインを調整することとしてもよい。
上記の構成によれば、重み付け加算された、チャンネルごとの音声信号の加算値およびチャンネルごとの重要度に応じて、チャンネルごとの音声信号のゲインを調整する。上記によれば、チャンネルごとの音声信号のゲインを調整する際に、チャンネルごとの音声信号の加算値をフィードバックするので、出力される音声の音量に応じたゲイン調整が可能になる。
本発明の態様3に係る音声処理装置は、上記態様2において、上記制御部が、上記加算値が出力音量の上限値より大きい場合、上記加算部による重み付け加算の対象となるチャンネルのうち、重要度の低いチャンネルの音声信号のゲインを下げるように、上記ゲイン調整部に指示することとしてもよい。
上記の構成によれば、当所の音声信号の加算値が出力音量の上限値より大きい場合、重要度の低いチャンネルの音声信号のゲインを下げる。これにより、相対的に、重要度の高いチャンネルの出力音量が上がるので、重要度の高い音声が聴きやすくなる。
本発明の態様4に係る音声処理装置は、上記態様3において、上記制御部が、上記加算値と、上記ゲインを下げた後の加算値との差分を、他のチャンネルの出力音量に割り振ることとしてもよい。
上記の構成によれば、当所の音声信号の加算値と、ゲインを下げた後の加算値との差分を、他のチャンネルに係る出力音量の上限値に割り振る。これにより、所定の出力音量を維持することができる。
本発明の態様5に係る音声処理装置は、上記態様2において、上記制御部が、上記加算値が音声信号の下限値より小さい場合、上記加算部による重み付け加算の対象となるチャンネルのうち、重要度の高いチャンネルの音声信号のゲインを上げるように、上記ゲイン調整部に指示することとしてもよい。
上記の構成によれば、当所の音声信号の加算値が出力音量の下限値より小さい場合、重要度の高いチャンネルの音声信号のゲインを上げる。これにより、相対的に、重要度の高いチャンネルの出力音量が上がるので、重要度の高い音声が聴きやすくなる。
本発明の態様6に係る音声処理装置は、上記態様1から4において、上記チャンネルの重要度が、上記チャンネルの標準位置と視聴者の正面位置との間の距離、頂点となる視聴者から見た上記チャンネルの標準位置と当該視聴者の正面位置とのなす角度、および、上記チャンネルの係数の少なくとも何れかに応じて設定されることとしてもよい。
本発明の態様7に係る音声出力装置は、上記態様1から6における音声処理装置と、上記加算部により重み付け加算された、チャンネルごとの音声信号を出力する出力部と、を備えている。
本発明の一態様によれば、複数チャンネルの音声がミックスされた音声の再生において、重要なチャンネルの音声が聴き取りづらくなることを抑制することができるという効果を奏する。
実施形態1に係る音声出力装置の構成を示すブロック図である。 実施形態4に係る22.2chの各チャンネルの標準配置を示す図であり、(a)は三層構造のチャンネル配置を示し、(b)はミドル層のチャンネル配置を示し、(c)はトップ層のチャンネル配置を示し、(d)はボトム層のチャンネル配置を示す。 実施形態1に係るチャンネルごとの重要度のテーブル構成例を示す図である。 実施形態2に係る音声出力装置の構成を示すブロック図である。 実施形態3に係る音声出力装置の構成を示すブロック図である。 実施形態5に係る制御部の処理を示すフローチャートである。 実施形態6に係る制御部の処理を示すフローチャートである。
以下、本発明の実施の形態について、詳細に説明する。ただし、この実施形態に記載されている構成は、特に特定的な記載がない限り、この発明の範囲をそれのみに限定する趣旨ではなく、単なる説明例に過ぎない。なお、下記の説明において、「音声」とは、オーディオシステムで取り扱われる音声全般であり、人の声および背景音を含む。また、「チャンネルの重要度」とは、チャンネルの標準位置などに応じて適宜設定され得るものである。
〔実施形態1〕
まず、本発明の実施形態1に係る音声出力装置について、図1を参照して説明する。図1は、本実施形態に係る音声出力装置1の構成を示すブロック図である。図1に示すように、音声出力装置1は、5.1chのうちの前3ch(音声出力システム)の音声信号をダウンミックスして2個の出力部(例えば、スピーカ)から音声再生出力する装置であり、通信部2、処理部3、ゲイン調整部4、加算部5、出力部6および制御部7を備える。なお、処理部3、ゲイン調整部4、加算部5および制御部7をまとめて音声処理装置と呼ぶ。
通信部2は、外部から無線または有線により音声信号を受信し、処理部3に出力する。処理部3は、通信部2から音声信号を取得し、当該音声信号をチャンネル(入力チャンネル)ごとに分離し、各チャンネルの音声信号を個別にゲイン調整部4に出力する。図1に示すように、処理部3は、チャンネルLの音声信号をゲイン調整部4Lに出力し、チャンネルCの音声信号をゲイン調整部4C1および4C2に出力し、チャンネルRの音声信号をゲイン調整部4Rに出力する。
ゲイン調整部4は、処理部3からチャンネルの音声信号を取得し、当該音声信号のゲインを調整して、加算部5に出力する。音声信号のゲイン調整は、制御部7の指示に従って行われる。これにより、出力される音声の音量を適正に保持するように、チャンネルごとの音声信号のゲインを動的に調整する。図1に示すように、ゲイン調整部4には、4L、4C1、4C2および4Rの各部がある。ゲイン調整部4Lは、チャンネルLの音声信号を取得し、ゲイン調整後、加算部5LCに出力する。ゲイン調整部4C1は、チャンネルCの音声信号を取得し、ゲイン調整後、加算部5LCに出力する。ゲイン調整部4C2は、チャンネルCの音声信号を取得し、ゲイン調整後、加算部5RCに出力する。ゲイン調整部4Rは、チャンネルRの音声信号を取得し、ゲイン調整後、加算部5RCに出力する。これによれば、多チャンネル音声の再生時において、ダウンミックスの前に各チャンネルの混合比を調整することができる。
加算部5は、2以上のゲイン調整部4からチャンネルの音声信号を取得し、各音声信号を重み付け加算し、加算した音声信号を出力部6に出力するものであり、ダウンミックスの機能を果たす。図1に示すように、加算部5には、5LCおよび5RCの各部がある。加算部5LCは、ゲイン調整部4LからチャンネルLの音声信号を取得し、ゲイン調整部4C1からチャンネルCの音声信号を取得し、当該2つの音声信号を重み付け加算し、当該重み付け加算された音声信号をスピーカLの音声出力信号として出力部6Lに出力する。加算部5RCは、ゲイン調整部4C2からチャンネルCの音声信号を取得し、ゲイン調整部4RからチャンネルRの音声信号を取得し、当該2つの音声信号を重み付け加算し、当該重み付け加算された音声信号をスピーカRの音声出力信号として出力部6Rに出力する。なお、加算部5が重み付け加算する際に、各チャンネルの音声信号に重み付けするための係数が用いられる。この係数に応じて、各音声信号のゲインの上げ下げが行われた上で、当該各音声信号が加算される。ダウンミックスの際に用いられる係数は、ダウンミックス係数と呼ばれる。
出力部6は、加算部5から音声出力信号を取得し、外部に再生出力するものであり、具体的にはスピーカなどである。図1に示すように、出力部6には、6Lおよび6Rの各部がある。出力部6Lは、加算部5LCからスピーカLの音声出力信号を取得し、外部に再生出力する。出力部6Rは、加算部5RCからスピーカRの音声出力信号を取得し、外部に再生出力する。
制御部7は、出力部6(6Lおよび6R)から各音声出力信号のレベル(出力音量)を取得し、当該レベルおよび各チャンネルの重要度に応じて、各チャンネルの音声信号に施すゲインを決定し、当該ゲインの調整を各チャンネルに対応するゲイン調整部4(4L、4C1、4C2および4R)に指示する。なお、制御部7は、出力部6Lおよび6Rからではなく、加算部5LCおよび5RCの出力から各音声出力信号のレベル(加算値)を取得してもよい。
上記によれば、音声出力装置1は、前3ch(5.1ch)をデコードし、2chにダウンミックスするとともに、当該ダウンミックスした後の音声出力信号のレベルを評価し、レベルが所定値よりも高い場合には、ダウンミックス前の音声信号のうち、重要度の低いチャンネルの音声信号(例えば、背景音など)のゲインを下げる。
なお、各チャンネルの重要度は、制御部7内部のメモリまたは外部の記憶部に記憶される。各チャンネルの重要度について、図3を参照して説明する。図3は、チャンネルごとの重要度のテーブル構成例を示す図である。図3に示すように、チャンネルIDと、当該チャンネルの重要度とが対応付けられており、この例では、チャンネルLおよびRの重要度が1であり、チャンネルCの重要度が2である。重要度の設定値が大きいほど、重要度が高いので、この例では、チャンネルCの重要度がチャンネルLおよびRの重要度よりも高いことになる。例えば、人のセリフがチャンネルCに設定されるとすれば、他の音声(背景音など)よりも人のセリフが重要になる。
この場合、各音声出力信号のレベルから判断して、音声信号のゲインを下げる必要があるとき、制御部7は、重要度が低いチャンネルLおよびRのゲインを下げるようにゲイン調整部4Lおよび4Rに指示する。すなわち、重要度の高いチャンネルの音声信号をできる限り残すように処理する。これにより、例えば、セリフのレベルを維持したままで、背景音のレベルを下げることができる。一方、各音声出力信号のレベルから判断して、音声信号のゲインを上げる必要があるとき、制御部7は、重要度が高いチャンネルCのゲインを上げるようにゲイン調整部4C1および4C2に指示する。上記の処理の具体例は、後述する。なお、再生出力するコンテンツによっては、人のセリフ(チャンネルC)ではなく、背景音(チャンネルLおよびR)が重要になることもある。
〈チャンネルの重要度〉
各チャンネルの重要度を決める際の基準について、以下に説明する。なお、各基準のうち、何れか1つを用いてもよいし、何れか2つ以上を組み合わせて用いてもよい。
[基準1]
チャンネルの標準位置が視聴者の正面位置に近いほど、当該チャンネルの重要度が高いとみなす。「正面位置に近い」とは、視聴者の正面位置からの距離が短いこと、または、視聴者からの見開きの角度(すなわち、頂点となる視聴者から見た、チャンネルの標準位置と当該視聴者の正面位置とのなす角度)が小さいことなどを示す。例えば、5.1chの場合には、チャンネルの重要度が高い順に、C>L/R>Ls/Rsとなる。7.1ch以下の音声出力システムでは、各チャンネルの高さが同じなので、視聴者の正面位置に近いほど、チャンネルの重要度が高いという基準を適用することができる。
[基準2]
チャンネルごとのダウンミックス係数のデフォルト値が大きいほど、当該チャンネルの重要度が高いとみなす。このとき、定義されたダウンミックス係数そのものを参照するのではなく、ダウンミックス係数の値が大きいほど、当該チャンネルの重要度を高く設定したテーブルを作成し、当該テーブルを参照する。ダウンミックス係数のデフォルト値は、予め設定されていてもよいし、MPEG−4 AAC(Advanced Audio Coding)のDSE(Data Stream Element)で伝送されたものを用いてもよい。なお、ダウンミックス係数が同じ場合には、チャンネルの重要度が同じとしてもよいし、さらに基準1によりチャンネルの重要度を決定してもよい。また、チャンネルの重要度が同じ場合には、同じダウンミックス係数を適応してもよい。
[基準3]
放送事業者がチャンネルの重要度を定義して伝送する。具体的には、チャンネルごとの重要度を記載されたテーブルを作成し、所定の規格に新たに定義した上で、放送信号とともに送信する。例えば、チャンネルごとに、重要度が高い順に0、1、2、3、4・・・などと記載してもよいし、設定値の大きさが重要度を示すものとし、重要度が高い順に5、4、3、2、1・・・などと記載してもよい。チャンネルの重要度を定義するための規格は、例えば、MPEG−4 AACのPCE(Program Configuration Element)でもよいし、MPEG−4 AACの DSEでもよいし、MMT(MPEG Media Transport)のMMT−SIでもよい。伝送経路は、電波による放送であってもよいし、ネットワークを経由したものであってもよく、どのような経路でもかまわない。
〔実施形態2〕
本発明の実施形態2に係る音声出力装置1aについて、図4を参照して説明する。図4は、本実施形態に係る音声出力装置1aの構成を示すブロック図である。図4に示すように、音声出力装置1aは、5.1chの音声信号をダウンミックスして2個の出力部から再生出力する装置であり、通信部2、処理部3a、ゲイン調整部4、加算部5、出力部6および制御部7aを備える。なお、実施形態1の音声出力装置1と同様の部分については、説明を割愛する。
処理部3aは、通信部2から音声信号を取得し、当該音声信号をチャンネル(入力チャンネル)ごとに分離し、各チャンネルの音声信号を個別にゲイン調整部4に出力する。図4に示すように、処理部3aは、チャンネルLsの音声信号をゲイン調整部4Lsに出力し、チャンネルLの音声信号をゲイン調整部4Lに出力し、チャンネルCの音声信号をゲイン調整部4C1および4C2に出力し、チャンネルRの音声信号をゲイン調整部4Rに出力し、チャンネルRsの音声信号をゲイン調整部4Rsに出力する。
ゲイン調整部4には、4Ls、4L、4C1、4C2、4Rおよび4Rsの各部がある。ゲイン調整部4Lsは、チャンネルLsの音声信号を取得し、ゲイン調整後、加算部5LsLCに出力する。ゲイン調整部4Rsは、チャンネルRsの音声信号を取得し、ゲイン調整後、加算部5RsRCに出力する。
加算部5には、5LsLCおよび5RsRCの各部がある。加算部5LsLCは、ゲイン調整部4LsからチャンネルLsの音声信号を取得し、ゲイン調整部4LからチャンネルLの音声信号を取得し、ゲイン調整部4C1からチャンネルCの音声信号を取得し、当該3つの音声信号を重み付け加算し、当該重み付け加算された音声信号をスピーカLの音声出力信号として出力部6Lに出力する。加算部5RsRCは、ゲイン調整部4C2からチャンネルCの音声信号を取得し、ゲイン調整部4RからチャンネルRの音声信号を取得し、ゲイン調整部4RsからチャンネルRsの音声信号を取得し、当該3つの音声信号を重み付け加算し、当該重み付け加算された音声信号をスピーカRの音声出力信号として出力部6Rに出力する。
出力部6には、6Lおよび6Rの各部がある。出力部6Lは、加算部5LsLCからスピーカLの音声出力信号を取得し、外部に再生出力する。出力部6Rは、加算部5RsRCからスピーカRの音声出力信号を取得し、外部に再生出力する。
制御部7aは、出力部6(6Lおよび6R)から各音声出力信号のレベルを取得し、当該レベルおよび各チャンネルの重要度に応じて、各チャンネルの音声信号に施すゲインを決定し、当該ゲインの調整を各チャンネルに対応するゲイン調整部4(4Ls、4L、4C1、4C2、4Rおよび4Rs)に指示する。なお、制御部7は、出力部6Lおよび6Rからではなく、加算部5LsLCおよび5RsRCの出力から各音声出力信号のレベルを取得してもよい。
〔実施形態3〕
本発明の実施形態3に係る音声出力装置1bについて、図5を参照して説明する。図5は、本実施形態に係る音声出力装置1bの構成を示すブロック図である。図5に示すように、音声出力装置1bは、5.1chの音声信号をダウンミックスして4個の出力部から再生出力する装置であり、通信部2、処理部3b、ゲイン調整部4、加算部5、出力部6および制御部7bを備える。なお、実施形態1の音声出力装置1および実施形態2の音声出力装置1aと同様の部分については、説明を割愛する。
処理部3bは、通信部2から音声信号を取得し、当該音声信号をチャンネル(入力チャンネル)ごとに分離し、各チャンネルの音声信号を個別にゲイン調整部4に出力する。図4に示すように、処理部3bは、チャンネルLsの音声信号をゲイン調整部4Lsに出力し、チャンネルLの音声信号をゲイン調整部4L1および4L2に出力し、チャンネルCの音声信号をゲイン調整部4C1および4C2に出力し、チャンネルRの音声信号をゲイン調整部4R1および4R2に出力し、チャンネルRsの音声信号をゲイン調整部4Rsに出力する。
ゲイン調整部4には、4Ls、4L1、4L2、4C1、4C2、4R1、4R2および4Rsの各部がある。ゲイン調整部4Lsは、チャンネルLsの音声信号を取得し、ゲイン調整後、加算部5LsLに出力する。ゲイン調整部4L1は、チャンネルLの音声信号を取得し、ゲイン調整後、加算部5LsLに出力する。ゲイン調整部4L2は、チャンネルLの音声信号を取得し、ゲイン調整後、加算部5LC1に出力する。ゲイン調整部4C1は、チャンネルCの音声信号を取得し、ゲイン調整後、加算部5LC1に出力する。ゲイン調整部4C2は、チャンネルCの音声信号を取得し、ゲイン調整後、加算部5RC2に出力する。ゲイン調整部4R1は、チャンネルRの音声信号を取得し、ゲイン調整後、加算部5RC2に出力する。ゲイン調整部4R2は、チャンネルRの音声信号を取得し、ゲイン調整後、加算部5RsRに出力する。ゲイン調整部4Rsは、チャンネルRsの音声信号を取得し、ゲイン調整後、加算部5RsRに出力する。
加算部5には、5LsL、5LC1、5RC2および5RsRの各部がある。加算部5LsLは、ゲイン調整部4LsからチャンネルLsの音声信号を取得し、ゲイン調整部4L1からチャンネルLの音声信号を取得し、当該2つの音声信号を重み付け加算し、当該重み付け加算された音声信号をスピーカLsの音声出力信号として出力部6Lsに出力する。加算部5LC1は、ゲイン調整部4L2からチャンネルLの音声信号を取得し、ゲイン調整部4C1からチャンネルCの音声信号を取得し、当該2つの音声信号を重み付け加算し、当該重み付け加算された音声信号をスピーカLの音声出力信号として出力部6Lに出力する。加算部5RC2は、ゲイン調整部4C2からチャンネルCの音声信号を取得し、ゲイン調整部4R1からチャンネルRの音声信号を取得し、当該2つの音声信号を重み付け加算し、当該重み付け加算された音声信号をスピーカRの音声出力信号として出力部6Rに出力する。加算部5RsRは、ゲイン調整部4R2からチャンネルRの音声信号を取得し、ゲイン調整部4RsからチャンネルRsの音声信号を取得し、当該2つの音声信号を重み付け加算し、当該重み付け加算された音声信号をスピーカRsの音声出力信号として出力部6Rsに出力する。
出力部6には、6Ls、6L、6Rおよび6Rsの各部がある。出力部6Lsは、加算部5LsLからスピーカLsの音声出力信号を取得し、外部に再生出力する。出力部6Lは、加算部5LC1からスピーカLの音声出力信号を取得し、外部に再生出力する。出力部6Rは、加算部5RC2からスピーカRの音声出力信号を取得し、外部に再生出力する。出力部6Rsは、加算部5RsRからスピーカRsの音声出力信号を取得し、外部に再生出力する。
制御部7bは、出力部6(6Ls、6L、6Rおよび6Rs)から各音声出力信号のレベルを取得し、当該レベルおよび各チャンネルの重要度に応じて、各チャンネルの音声信号に施すゲインを決定し、当該ゲインの調整を各チャンネルに対応するゲイン調整部4(4Ls、4L1、4L2、4C1、4C2、4R1、4R2および4Rs)に指示する。なお、制御部7bは、出力部6Ls、6L、6Rおよび6Rsからではなく、加算部5LsL、5LC1、5RC2および5RsRの出力から各音声出力信号のレベルを取得してもよい。
上記によれば、音声出力装置1bは、5.1chをデコードし、4chにダウンミックスするとともに、ダウンミックス後の音声出力信号のレベルを評価し、レベルが所定値よりも高い場合には、ダウンミックス前の音声信号に係るチャンネルの重要度に応じて、音声信号のレベルを変更する。そして、このような処理を順次繰り返す。
〔実施形態4〕
本発明の実施形態4に係る音声出力装置について説明する。本実施形態に係る音声出力装置は、22.2chをデコードし、ダウンミックスするとともに、ダウンミックス後の音声出力信号のレベルを評価し、レベルが所定値よりも高い場合には、ダウンミックス前の音声信号に係るチャンネルの重要度に応じて、音声信号のレベルを変更する。すなわち、ダウンミックス前の音声信号のうち、重要度の低いチャンネルに係る音声信号のゲインを下げることにより、ダウンミックス後の音声出力信号のレベルを下げる。そして、当該音声出力信号のレベルを再度評価する。このような処理を順次繰り返して、上記音声出力信号のレベルが所定値以下になったとき、当該処理を終了する。
22.2chの音声信号を2個のスピーカL、Rで再生出力する場合の、ダウンミックス係数の例を、下記の式1および式2に示す。
Figure 2016072890
Figure 2016072890
上記の式1および式2における、FL、FLcなどは、各チャンネルの音声信号のレベル(音量)を示し、ダウンミックス係数は、1、2/√5などである。
続いて、各チャンネルの位置について、図2を参照して説明する。図2は、本実施形態に係る22.2chの各チャンネルの標準配置を示す図である。図2(a)は、三層構造のチャンネル配置を示す。図2(b)は、ミドル層のチャンネル配置を示す。図2(c)は、トップ層のチャンネル配置を示す。図2(d)は、ボトム層のチャンネル配置を示す。図2(a)に示すように、22.2chの各チャンネルの標準配置は、聴取者の聴取高さに位置するミドル層、聴取者の上方(天井面)に位置するトップ層、および、下方(床面)に位置するボトム層の三層からなるチャンネル配置により構成される。図2(b)に示すように、ミドル層は、FL、FLc、FC、FRc、FR、SiR、BR、BC、BLおよびSiLの各チャンネルからなる。図2(c)に示すように、トップ層は、TpC、TpFL、TpFC、TpFR、TpSiR、TpBR、TpBC、TpBLおよびTpSiLの各チャンネルからなる。図2(d)に示すように、ボトム層は、BtFL、BtFCおよびBtFRの各チャンネルからなる。
各チャンネルの重要度に関しては、22.2chには高さの異なるチャンネルが存在するので、チャンネルの空間的配置を考慮することとし、高さの違いを含めて重要度を決定できる基準が適用される。例えば、視聴者の正面に近い位置にあるチャンネルの重要度を高くしてもよい。また、チャンネルの標準位置が視聴者の正面位置に近いほど、かつ、視聴者の耳の高さに近いほど、チャンネルの重要度が高いとみなしてもよい。
具体的な例としては、正面位置であって耳の高さにある点を原点とする3次元座標を設定した場合に、チャンネルの標準位置の座標(x、y、z)に対して、下記の式3を正面位置からの距離Dとして定義する。
Figure 2016072890
aは補正係数であり、小さくすれば、耳との高さの違い(すなわち、zの絶対値)を評価しない設定になる。例えば、チャンネルの重要度が高い順に、FC>FLc/FRc>BtFC>TpFC>FL/FR・・・となる。
なお、チャンネルごとのダウンミックス係数のデフォルト値が大きいほど、当該チャンネルの重要度が高いとみなし、ダウンミックス係数が同じ場合には、チャンネルの重要度が同じとしてもよいし、さらに上記の基準(チャンネルの空間的配置)によりチャンネルの重要度を決定してもよい。
〔実施形態5〕
本発明の実施形態5に係る制御部7の処理について、図6を参照して説明する。図6は、本実施形態に係る制御部7の処理を示すフローチャートであり、音声出力信号のレベルに上限値がある場合の処理を示す。この処理は、加算部5または出力部6が出力する3個の音声出力信号のレベルを、ゲイン調整部4が3個のチャンネル(入力チャンネル)A、B、Cの音声信号に施すゲインにフィードバックするものである。すなわち、ダウンミックスした後の、音声出力信号のレベルが上限値を超えた場合に、重要度に応じてレベルを下げて、音声出力信号のレベルが上限値以下になるようにする。なお、音声出力信号の個数および音声信号のチャンネル数は、3個に限ることなく、別の個数であってもよい。また、フィードバック制御以外の方法を用いてもよい。
まず、制御部7は、加算部5または出力部6の音声出力信号のレベルを取得し、各レベルを加算し、加算値Sに代入する(S601)。次に、加算値Sは音声出力信号の上限値である閾値L以下か否かを判定する(S602)。加算値Sが閾値L以下である場合(S602のYes)、加算値S、すなわち、S601で取得したレベルの3個の音声出力信号を出力部6から出力させる(S603)。具体的には、制御部7は、3個のチャンネルの音声信号に対応するゲイン調整部4に対して、現状のゲインによる調整を指示する。
S602において、加算値Sが閾値L以下でない、すなわち、閾値Lより大きい場合(S602のNo)、制御部7は、チャンネルAがチャンネルBよりも重要度が高いか否かを判定する(S604)。チャンネルAがチャンネルBよりも重要度が高い場合に(S604のYes)、制御部7は、さらに、チャンネルBがチャンネルCよりも重要度が低いか否かを判定する(S605)。
チャンネルBがチャンネルCよりも重要度が低い場合に(S605のYes)、チャンネルBの重要度が最も低いことになるので、制御部7は、加算値S’にA+αB+C(αは、1以下の圧縮係数。以下同様)を代入する(S606)。一方、チャンネルBがチャンネルCよりも重要度が低くない場合、すなわち、重要度が同じかまたは高い場合に(S605のNo)、チャンネルCの重要度が最も低いことになるので、制御部7は、加算値S’にA+B+αCを代入する(S606)。
S604において、チャンネルAがチャンネルBよりも重要度が高くない場合、すなわち、重要度が同じかまたは低い場合に(S604のNo)、制御部7は、さらに、チャンネルAがチャンネルCよりも重要度が低いか否かを判定する(S608)。チャンネルAがチャンネルCよりも重要度が低い場合に(S608のYes)、チャンネルAの重要度が最も低いことになるので、制御部7は、加算値S’にαA+B+Cを代入する(S609)。一方、チャンネルAがチャンネルCよりも重要度が低くない場合、すなわち、重要度が同じかまたは高い場合に(S608のNo)、チャンネルCの重要度が最も低いことになるので、制御部7は、加算値S’にA+B+αCを代入する(S607)。
S606、S607、または、S609において、加算値S’が確定した後に、制御部7は、加算値S’が音声出力信号の上限値である閾値L以下か否かを判定する(S610)。加算値S’が閾値L以下である場合には(S610のYes)、加算値S’、すなわち、音声出力信号のA、B、Cのうち、いずれか1つは圧縮係数αをかけたレベル、他の2つはS601で取得したレベルの音声出力信号を出力部6から出力させ、差分Dを近接音声出力(他のチャンネルの音声出力)に割り振る(S611)。
具体的には、制御部7は、3個のチャンネルの音声信号に対応するゲイン調整部4のうち、いずれか1つに対して現状のゲインに圧縮係数αをかけて調整するように指示し、他の2つに対して現状のゲインによる調整を指示する。さらに、加算値Sと、加算値S’との差分Dを近接音声出力に割り振る。これによれば、チャンネルA、B、C以外の近接音声出力に差分Dを割り振ることにより、近接音声出力において当該チャンネルの音量が増加するので、音声出力装置全体として所定の音量を維持することが可能になる。例えば、チャンネルA、B、CをL側とすれば、近接音声出力に係るチャンネルはR側から選択される。
一方、加算値S’が閾値L以下でない場合、すなわち、閾値Lよりも大きい場合には(S610のNo)、L=βS’となるβ(1以下の圧縮係数。以下同様)を計算して、加算値βS’、すなわち、音声出力信号のA、B、Cのうち、いずれか1つは圧縮係数αおよびβをかけたレベル、他の2つは圧縮係数βをかけたレベルの音声出力信号を出力部6から出力させる(S612)。
具体的には、制御部7は、3個のチャンネルの音声信号に対応するゲイン調整部4のうち、いずれか1つに対して現状のゲインに圧縮係数αおよびβをかけて調整するように指示し、他の2つに対して現状のゲインに圧縮係数βをかけて調整するように指示する。さらに、加算値Sと、加算値βS’との差分Dを近接音声出力に割り振る。これによれば、チャンネルA、B、C以外の近接音声出力に差分Dを割り振ることにより、近接音声出力において当該チャンネルの音量が増加するので、音声出力装置全体として所定の音量を維持することが可能になる。
上記によれば、ダウンミックス時の再生音声出力の最大出力および上限値から判断して、クリップ(音声信号の所定値以上を切り捨てる操作)が発生するときには、重要度の低いチャンネルの音量を下げて、その下げた分の音量を他のチャンネルの音声出力に割り振る。これによれば、重要度の高いチャンネルの音声出力の音量を維持できるので、重要な音声が聴き取りやすくなる。なお、それでも音声出力信号が上限値以下にならない場合には、重要度の高いチャンネルの音声出力の音量も下げることになる。
〔実施形態6〕
本発明の実施形態6に係る制御部7の処理について、図7を参照して説明する。図7は、本実施形態に係る制御部7の処理を示すフローチャートであり、音声出力信号のレベルに上限値および下限値がある場合の処理を示す。この処理は、加算部5または出力部6が出力する3個の音声出力信号のレベルを、ゲイン調整部4が3個のチャンネル(入力チャンネル)A、B、Cの音声信号に施すゲインにフィードバックするものである。なお、音声出力信号の個数および音声信号のチャンネル数は、3個に限ることなく、別の個数であってもよい。
まず、制御部7は、加算部5または出力部6の音声出力信号のレベルを取得し、各レベルを加算し、加算値Sに代入する(S701)。次に、加算値Sは音声出力信号の上限値である閾値L以下か否かを判定する(S702)。加算値Sが閾値L以下である場合(S702のYes)、加算値Sが音声出力信号の下限値である閾値H以上か否かを判定する(S703)。加算値Sが閾値H以上である場合(S703のYes)、加算値Sが閾値Hから閾値Lまでの間にあるため、音声出力信号をそのまま出力可能なので、加算値S、すなわち、S701で取得したレベルの3個の音声出力信号を出力部6から出力させる(S704)。具体的には、制御部7は、3個のチャンネルの音声信号に対応するゲイン調整部4に対して、現状のゲインによる調整を指示する。
S702において、加算値Sが閾値L以下でない、すなわち、閾値Lより大きい場合(S702のNo)、制御部7は、チャンネルAがチャンネルBよりも重要度が高いか否かを判定する(S705)。S705〜S713の処理は、図6のS604〜S612の処理と同様であるので、説明を割愛する。
S703において、加算値Sが閾値H以上でない場合、すなわち、閾値Hより小さい場合(S703のNo)、制御部7は、チャンネルAがチャンネルBよりも重要度が高いか否かを判定する(S721)。チャンネルAがチャンネルBよりも重要度が高い場合に(S721のYes)、制御部7は、さらに、チャンネルAがチャンネルCよりも重要度が高いか否かを判定する(S722)。
チャンネルAがチャンネルCよりも重要度が高い場合(S722のYes)、チャンネルAの重要度が最も高いことになるので、制御部7は、加算値S’にγA+B+C(γは、1以上の伸長係数。以下同様)を代入する(S723)。一方、チャンネルAがチャンネルCよりも重要度が高くない場合、すなわち、重要度が同じかまたは低い場合(S722のNo)、チャンネルCの重要度が最も高いことになるので、制御部7は、加算値S’にA+B+γCを代入する(S724)。
S721において、チャンネルAがチャンネルBよりも重要度が高くない場合、すなわち、重要度が同じかまたは低い場合(S721のNo)、制御部7は、さらに、チャンネルBがチャンネルCよりも重要度が高いか否かを判定する(S725)。チャンネルBがチャンネルCよりも重要度が高い場合に(S725のYes)、チャンネルBの重要度が最も高いことになるので、制御部7は、加算値S’にA+γB+Cを代入する(S726)。一方、チャンネルBがチャンネルCよりも重要度が高くない場合、すなわち、重要度が同じかまたは低い場合に(S725のNo)、チャンネルCの重要度が最も高いことになるので、制御部7は、加算値S’にA+B+γCを代入する(S724)。
S723、S724、または、S726において、加算値S’が確定した後に、加算値S’、すなわち、音声出力信号のA、B、Cのうち、いずれか1つは伸長係数γをかけたレベル、他の2つはS701で取得したレベルの音声出力信号を出力部6から出力させる(S727)。具体的には、制御部7は、3個のチャンネルの音声信号に対応するゲイン調整部4のうち、いずれか1つに対して現状のゲインに伸長係数γをかけて調整するように指示し、他の2つに対して現状のゲインによる調整を指示する。
上記によれば、例えば、背景音のレベルが小さく、人のセリフがさらに小さい場合に、人のセリフを引き上げることにより、聴き取りやすくすることができる。
〔実施形態7〕
以上の実施形態では、チャンネルの重要度に応じて、当該チャンネルの音声信号のゲインを調整するように説明したが、例えば、特定のチャンネルの音声信号を優先させるために、その他のチャンネルの音量を下げるようにしてもよい。例えば、人の声を優先させるために、背景音の音量を下げてもよいし、逆に、背景音を優先させるために、人の声の音量を下げてもよい。
〔ソフトウェアによる実現例〕
図1、4、5に示す音声出力装置1、1a、1bの各機能ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア、デジタル回路)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、音声出力装置1、1a、1bは、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラム及び各種データがコンピュータ(又はCPU)で読み取り可能に記録されたROM(Read Only Memory)又は記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)等を備えている。そして、コンピュータ(又はCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路等を用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
本発明は、複数チャンネルの音声信号に対してダウンミックスを行う音声処理装置、および、マルチチャンネルの音声出力を行う音声出力装置に利用することができる。
1、1a、1b 音声出力装置
3 処理部
4 ゲイン調整部
5 加算部
6 出力部
7 制御部

Claims (7)

  1. 出力される音声の音量を適正に保持するように、チャンネルごとの音声信号のゲインを動的に調整するゲイン調整部と、
    上記ゲイン調整部によりゲインが調整された、チャンネルごとの音声信号を、当該チャンネルの係数に応じて重み付け加算する加算部と、
    を備え、
    上記ゲイン調整部は、上記チャンネルごとの音声信号のゲインを、当該チャンネルの重要度に応じて調整する
    ことを特徴とする音声処理装置。
  2. 上記加算部により重み付け加算された、チャンネルごとの音声信号の加算値を取得し、当該加算値およびチャンネルごとの重要度に応じて、上記ゲイン調整部に上記ゲインの調整を指示する制御部
    をさらに備え、
    上記ゲイン調整部は、上記制御部からの指示に従って、上記ゲインを調整する
    ことを特徴とする請求項1に記載の音声処理装置。
  3. 上記制御部は、
    上記加算値が出力音量の上限値より大きい場合、上記加算部による重み付け加算の対象となるチャンネルのうち、重要度の低いチャンネルの音声信号のゲインを下げるように、上記ゲイン調整部に指示する
    ことを特徴とする請求項2に記載の音声処理装置。
  4. 上記制御部は、
    上記加算値と、上記ゲインを下げた後の加算値との差分を、他のチャンネルの出力音量に割り振る
    ことを特徴とする請求項3に記載の音声処理装置。
  5. 上記制御部は、
    上記加算値が音声信号の下限値より小さい場合、上記加算部による重み付け加算の対象となるチャンネルのうち、重要度の高いチャンネルの音声信号のゲインを上げるように、上記ゲイン調整部に指示する
    ことを特徴とする請求項2に記載の音声処理装置。
  6. 上記チャンネルの重要度は、
    上記チャンネルの標準位置と視聴者の正面位置との間の距離、
    頂点となる視聴者から見た上記チャンネルの標準位置と当該視聴者の正面位置とのなす角度、および、
    上記チャンネルの係数
    の少なくとも何れかに応じて設定される
    ことを特徴とする請求項1から4のいずれか一項に記載の音声処理装置。
  7. 請求項1から6のいずれか一項に記載の音声処理装置と、
    上記加算部により重み付け加算された、チャンネルごとの音声信号を出力する出力部と、
    を備えたことを特徴とする音声出力装置。
JP2014202226A 2014-09-30 2014-09-30 音声処理装置、および、音声出力装置 Pending JP2016072890A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014202226A JP2016072890A (ja) 2014-09-30 2014-09-30 音声処理装置、および、音声出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014202226A JP2016072890A (ja) 2014-09-30 2014-09-30 音声処理装置、および、音声出力装置

Publications (1)

Publication Number Publication Date
JP2016072890A true JP2016072890A (ja) 2016-05-09

Family

ID=55867516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014202226A Pending JP2016072890A (ja) 2014-09-30 2014-09-30 音声処理装置、および、音声出力装置

Country Status (1)

Country Link
JP (1) JP2016072890A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017212556A (ja) * 2016-05-24 2017-11-30 日本放送協会 音響処理装置、音響処理方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010076850A1 (ja) * 2009-01-05 2010-07-08 パナソニック株式会社 音場制御装置及び音場制御方法
JP2011135600A (ja) * 2011-02-07 2011-07-07 Sony Corp 音量補正装置、音量補正方法および音量補正プログラム
JP2011205687A (ja) * 2011-06-09 2011-10-13 Pioneer Electronic Corp 音声調整装置
JP2012034295A (ja) * 2010-08-02 2012-02-16 Nippon Hoso Kyokai <Nhk> 音響信号変換装置及び音響信号変換プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010076850A1 (ja) * 2009-01-05 2010-07-08 パナソニック株式会社 音場制御装置及び音場制御方法
JP2012034295A (ja) * 2010-08-02 2012-02-16 Nippon Hoso Kyokai <Nhk> 音響信号変換装置及び音響信号変換プログラム
JP2011135600A (ja) * 2011-02-07 2011-07-07 Sony Corp 音量補正装置、音量補正方法および音量補正プログラム
JP2011205687A (ja) * 2011-06-09 2011-10-13 Pioneer Electronic Corp 音声調整装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017212556A (ja) * 2016-05-24 2017-11-30 日本放送協会 音響処理装置、音響処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
US8284960B2 (en) User adjustable volume control that accommodates hearing
US7415120B1 (en) User adjustable volume control that accommodates hearing
AU761690B2 (en) Voice-to-remaining audio (VRA) interactive center channel downmix
JP5254951B2 (ja) データ処理装置及び方法
EP3613219B1 (en) Stereo virtual bass enhancement
JP5266995B2 (ja) 放音装置
JP5118267B2 (ja) 音声信号再生装置、音声信号再生方法
US11109155B2 (en) Bass enhancement
EP3811515B1 (en) Multichannel audio enhancement, decoding, and rendering in response to feedback
US9832590B2 (en) Audio program playback calibration based on content creation environment
JP4686684B1 (ja) 音声処理装置
WO2016183379A2 (en) Generation and playback of near-field audio content
US8787598B2 (en) Dynamic contoured-sound/subwoofer-synthesis audio system
EP3408851A1 (en) Adaptive quantization
EP4035264A1 (en) Audio data processing method and system
JP4706666B2 (ja) 音量制御装置及びコンピュータプログラム
JP2016072890A (ja) 音声処理装置、および、音声出力装置
JP2021528909A (ja) 圧縮フィードバックに応答するオーディオ増強
CN113645531A (zh) 一种耳机虚拟空间声回放方法、装置、存储介质及耳机
JP2023521849A (ja) オーディオディスクリプションの自動ミキシング
TW201828712A (zh) 根據單聲道音訊資料提供立體聲效果的影音處理方法及影音處理裝置
JP2020537470A (ja) オーディオ信号の個人適用のためのパラメータを設定するための方法
JP6285790B2 (ja) チャンネル数変換装置
JPWO2019203126A1 (ja) ミキシング装置、ミキシング方法、及びミキシングプログラム
JP2018133660A (ja) 音声信号補償装置、音声信号補償方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20181113