JP7657579B2

JP7657579B2 - 音声信号処理装置、音声信号処理プログラム

Info

Publication number: JP7657579B2
Application number: JP2020203197A
Authority: JP
Inventors: 渉波多野
Original assignee: Tamura Corp
Current assignee: Tamura Corp
Priority date: 2020-12-08
Filing date: 2020-12-08
Publication date: 2025-04-07
Anticipated expiration: 2040-12-08
Also published as: JP2022090727A

Description

本発明は、音質の低下を抑制しつつ音声信号をダウンミックスする音声信号処理装置、音声信号処理プログラムに関する。

近年、８Ｋ放送や４Ｋ放送の実現に伴い、２２．２ｃｈサラウンドや５．１ｃｈサラウンドの音声フォーマットが用いられている。生放送では、これらの音声フォーマットに加え、従来のステレオ（２ｃｈ）の音声フォーマットを用いて、８Ｋ放送や４Ｋ放送と同時に２Ｋ放送を行うことがある。この場合、ステレオの音声フォーマットは、２２．２ｃｈサラウンドや５．１ｃｈサラウンドの音声フォーマットをダウンミックスすることによりリアルタイムで生成される。また、コンテンツのＤＶＤ制作などにおいても、２２．２ｃｈサラウンドの音源を用いたコンテンツをステレオの音声フォーマットをダウンミックスすることがある。

ダウンミックスの具体的な手法としては、ＡＲＩＢＳＴＤ－Ｂ３２（２２．２ｃｈサラウンド）やＡＲＩＢＳＴＤ－Ｂ２１（５．１ｃｈサラウンド）といった規格に規定されているダウンミックス係数を用いることが出来る。２２．２ｃｈサラウンドや５．１ｃｈサラウンドの音声フォーマットに対してダウンミックス係数による音声信号処理を行うことにより、ステレオの音声フォーマットが生成される。

しかしながら、ＡＲＩＢの規格に規定されているダウンミックス係数を用いてダウンミックスを行うと、元の音声フォーマットに比較して音が平面的に聞こえるという問題があった。そこで、ＨＲＩＲ（頭部インパルス応答）を用いたフィルタにより音声信号を処理する方法が提案されているが、この方法では演算量が大きくなるため、大規模なハードウェアリソースが要求される。また、演算量の増大に伴い遅延量も大きくなるため、リアルタイムの生放送には適していない。さらに、この方法においては、フィルタリングに伴い音声信号にひずみが生じるといった問題があった。

特許文献１には、ＨＲＩＲを用いたフィルタにより音声信号を処理する方法に代えて、ＨＲＩＲを用いてダウンミックス係数を生成し、そのダウンミックス係数により音声信号を処理するアルゴリズムが記載されている。このアルゴリズムにおいては、ＨＲＩＲを使用しつつ、しかもフィルタではなくダウンミックス係数で音声信号を処理するので、ダウンミックスに伴う音声信号の変質を最小限にとどめることが出来る。

国際公開第２０１７／１８８１４１号

ところで、ダウンミックスにおいては、優れたアルゴリズムを用いて音声信号の変質を抑えても、センターに定位されたコメントや音源が小さくなってしまい、他の音源に埋もれて聞こえづらくなるという問題があった。そこで、例えばＤＶＤ制作においては、音のバランス調整に加え、センターに定位されたコメントや音源が聴き易くなるような調整がなされる。しかしながら、このような調整においては、熟練のミキシングエンジニアがＡＲＩＢ規格のダウンミックス係数を手動で調整する手間と時間がかかっていた。そのため、ＤＶＤ制作のように制作時間を確保できない生放送においては、センターに定位されたコメントや音源が聴き易くなるような調整を行うことは困難であった。また、ＤＶＤ制作においても、熟練のミキシングエンジニアが現役を引退する場合に備えて、より容易なダウンミックス手法が要求されている。

また、他の音源に埋もれて聞こえづらくなるという現象は、センターに定位されたコメントや音源に限らず、ＬｃｈまたはＲｃｈに定位された音源など、いわゆる直接音の音源に共通する問題であった。

本発明は、上記課題を解決すべく、ダウンミックス時にもセンターに定位される音源など直接音の音源が聴き易くなるような調整を容易に行うことの出来る音声信号処理装置を提供することを目的とする。

本発明の音声信号処理装置は、次のような構成を備える。
（１）サラウンドの音源をダウンミックスする音声信号処理装置である。
（２）直接音の音源のミキシング量が増加させる操作子を有し、前記サラウンドの音源を調整する調整部。
（３）前記調整部の調整に基づいてダウンミックス係数を生成する係数生成部。
（４）前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する演算部。
（５）前記操作子をミキシングエンジニアが操作することで所定のミキシング量に設定される。
（６）前記調整部は、前記サラウンドの音源の調整において、設定された前記所定のミキシング量に基づいて間接音の音源に比して直接音の音源を強調するとともに、Ｌｃｈ音源とＲｃｈ音源とのミキシング量を調整してファンタムセンターの音像を強調することにより、センター音源を補強する。

また、本発明の音声信号処理装置は、次のような構成を更に備えてもよい。
（１）前記調整部は、前記サラウンドの音源の調整において、センター音源以外の音源に比して前記センター音源を強調する。
（２）前記調整部は、前記サラウンドの音源の調整において、Ｌｃｈ音源とＲｃｈ音源とのミキシング量を調整してファンタムセンターの音像を強調することにより、センター音源を補強する。
（３）所定の周期に基づいて、前記係数生成部に前記ダウンミックス係数を生成させることにより、前記ダウンミックス係数を随時更新する係数更新部。
（４）前記サラウンドの音源に関する情報である付帯情報に紐付けて前記ダウンミックス係数を予め複数記憶する記憶部と、前記付帯情報に基づいて、前記ダウンミックス係数を選択する選択部と、を更に備え、前記演算部は、前記選択部が選択した前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する。

本発明の音声信号処理プログラムは、次のような構成を備える。
（１）コンピュータにサラウンドの音源をダウンミックスする処理を実行させる音声信号処理プログラムである。
（２）直接音の音源のミキシング量が増加させる操作子を有し、前記サラウンドの音源を調整する調整手順。
（３）前記調整手順における調整に基づいてダウンミックス係数を生成する係数生成手順。
（４）前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する演算手順。
（５）前記調整手順は、前記操作子をミキシングエンジニアが操作することで所定のミキシング量に設定され、前記サラウンドの音源の調整において、設定された前記所定のミキシング量に基づいて間接音の音源に比して直接音の音源を強調するとともに、Ｌｃｈ音源とＲｃｈ音源とのミキシング量を調整してファンタムセンターの音像を強調することにより、センター音源を補強する。

本発明によれば、ダウンミックス時にもセンターに定位される音源など直接音の音源が聴き易くなるような調整を容易に行うことが出来る。

第１の実施形態の音声信号処理装置の構成を示すブロック図。第１の実施形態の調整部の構成を示すブロック図。第１の実施形態の強調部における作用を示す図。第１の実施形態の補間部における作用を示す図。第１の実施形態のバランス調整部における作用を示す図。第１の実施形態の係数生成部における作用を示す図。第１の実施形態の音声信号処理装置の作用を示すフローチャート。第２の実施形態の音声信号処理装置の構成を示すブロック図。第２の実施形態の音声信号処理装置の作用を示すフローチャート。他の実施形態の係数生成部における作用を示す図。

［第１の実施形態］
［構成］
図１に示す本実施形態の音声信号処理装置１００は、例えば、音声調整卓あるいはミキサーとして知られているものである。以下では説明を容易にするために、５．１ｃｈサラウンドからステレオへのダウンミックスを例に挙げ、音声信号処理装置１００に入力される音声信号は、５．１ｃｈサラウンドの音源のものとする。５．１ｃｈサラウンドは、センターに定位された音源を出力するスピーカと、Ｌｃｈに定位された音源を出力するスピーカと、Ｒｃｈに定位された音源を出力するスピーカと、後方Ｌｃｈに定位された音源を出力するスピーカと、後方Ｒｃｈに定位された音源を出力するスピーカと、低音を出力するサブウーファとにより構成される。以下では、センターに定位された音源をセンター音源、ＬｃｈとＲｃｈに定位された音源をそれぞれＬｃｈ音源、Ｒｃｈ音源、後方Ｌｃｈと後方Ｒｃｈに定位された音源をそれぞれ後方Ｌｃｈ音源、後方Ｒｃｈ音源ということもある。

音声信号処理装置１００は、入力された音声信号からダウンミックス係数を生成する生成部１０と、入力された音声信号に対してダウンミックス係数によるダウンミックスを行い、ダウンミックスされた音声信号を生成する演算部２０と、を備える。

生成部１０は、ＤＳＰなどにより構成され、入力された音声信号を調整する調整部１１と、調整した音声信号のダウンミックス係数を生成し、さらに演算部２０に出力する係数生成部１２と、係数生成部１２に再度係数を生成させる係数更新部１３と、を備える。

図２に示すように、調整部１１は、５．１ｃｈサラウンドの音源のうちセンター音源を強調する強調部１１１と、５．１ｃｈサラウンドの音源のうちＬｃｈ音源及びＲｃｈ音源によりセンター音源を補完する補間部１１２と、５．１ｃｈサラウンドの音源のうち直接音と間接音とのバランスを調整するバランス調整部１１３と、を備える。調整部１１においては、強調部１１１と補間部１１２とが並列して設けられ、その後段にバランス調整部１１３が設けられる。本実施形態においては、５．１ｃｈサラウンドの音源は、強調部１１１と補間部１１２のいずれか一方に入力されるものとする。いずれに入力されるかの設定は、例えば音声信号処理装置１００に設けられたパネルなどの図示しない入力手段により行われる。

図３に示すように、強調部１１１には、５．１ｃｈサラウンドの音源のうち、センター音源と、その他の音源とが識別可能に入力される。強調部１１１は、例えば１つの操作子を備え、この操作子を左に回転させるとセンター音源のミキシング量が増加し、右に回転させるとセンター音源以外の音源のミキシング量が増加する。ミキシングエンジニアは、この操作子を左に回転させることにより、他の音源に比してセンター音源を強調する。

図４に示すように、補間部１１２には、５．１ｃｈサラウンドの音源のうち、Ｌｃｈ音源と、Ｒｃｈ音源と、その他の音源とが識別可能に入力される。補間部１１２においては、Ｌｃｈ音源に対するＲｃｈ音源のミキシング比率、及びＲｃｈ音源に対するＬｃｈ音源のミキシング比率が調整される。このために、補間部１１２は、例えば主操作子Ａと副操作子Ｂとを備える。

主操作子Ａは、Ｌｃｈ音源とＲｃｈ音源とのバランスを調整する。例えば、主操作子Ａを左に回転させるとＬｃｈ音源及びＲｃｈ音源のミキシング量が減少し、右に回転させるとＬｃｈ音源及びＲｃｈ音源のミキシング量が増加する。一方で、副操作子Ｂは、Ｒｃｈ音源に対してＬｃｈ音源をミキシングする量と、Ｌｃｈ音源に対してＲｃｈ音源をミキシングする量とを調整する。例えば、副操作子Ｂを左に回転させるとＲｃｈ音源に対してミキシングするＬｃｈ音源の量及びＬｃｈ音源に対してミキシングするＲｃｈ音源の量が減少し、右に回転させるとＲｃｈ音源に対してミキシングするＬｃｈ音源の量及びＬｃｈ音源に対してミキシングするＲｃｈ音源の量が増加する。ミキシングエンジニアは、主操作子Ａと副操作子Ｂとを回転させることにより、Ｌｃｈ音源に対するＲｃｈ音源のミキシング比率、及びＲｃｈ音源に対するＬｃｈ音源のミキシング比率を調整する。これにより、ファンタムセンターの音像が強調されるので、センター音源を補強することが出来る。なお、主操作子Ａと副操作子Ｂは連動するようにしても良いし、主操作子Ａは固定して副操作子Ｂだけが回転するようにしても良い。連動させる場合は、主操作子Ａの回転方向と反対方向に副操作子Ｂが回転するようにすると良い。

図５に示すように、バランス調整部１１３には、５．１ｃｈサラウンドの音源のうち、直接音の音源と、間接音の音源とが識別可能に入力される。ここで、直接音とは、直接耳に届く音であり、間接音とは、壁などに反射して耳に届く音である。本実施形態において、直接音の音源は、センター音源、Ｌｃｈ音源、Ｒｃｈ音源であり、間接音の音源は、これら以外の音源である。バランス調整部１１３は、例えば１つの操作子を備え、この操作子を左に回転させると直接音の音源のミキシング量が増加し、右に回転させると間接音の音源のミキシング量が増加する。ミキシングエンジニアは、この操作子を左に回転させることにより、間接音の音源に比して直接音の音源を強調する。

係数生成部１２は、調整部１１の後段に設けられ、調整部１１において調整された音声信号から、元の音声信号である５．１ｃｈサラウンドの音源をステレオの音源にダウンミックスするためのダウンミックス係数を生成する。係数生成部１２は、生成したダウンミックス係数を演算部２０に出力する。ミキシングエンジニアは、図示しない入力手段により手動で、または放送スケジュールがデータ化された番組キューシートを読み込ませることによりこの放送スケジュールに従い自動で、所望のタイミングで係数生成部１２にダウンミックス係数を生成させることが出来る。所望のタイミングは、例えば、現在放送中の番組が次の番組に切り替わるタイミングである。また、後述の係数更新部１３により、所定の周期で係数生成部１２にダウンミックス係数を生成させることも出来る。

ダウンミックス係数を生成するアルゴリズムとしては、例えば、背景技術で説明した特許文献１の技術を用いることが出来る。図６に示すように、特許文献１の技術では、調整部１１において調整された音声信号から直接ダウンミックス係数を生成する。なお、特許文献１の技術は例に過ぎず、ダウンミックスに係る他の周知技術の係数を取り出して使用してもよい。

係数更新部１３は、所定の周期で係数生成部１２にダウンミックス係数を生成させる。例えば、係数生成部１２がダウンミックス係数を生成してから５分が経過すると、係数更新部１３は、係数生成部１２に対して、再度ダウンミックス係数を生成するように要求する。この所定の周期は、ミキシングエンジニアにより図示しない入力手段を介して予め設定しておくことが出来る。

演算部２０は、ＦＰＧＡなどにより構成され、入力された音声信号に対して、係数生成部１２から入力されたダウンミックス係数を乗算する。これにより、演算部２０は、ダウンミックスされた音声信号を生成する。なお、ダウンミックスされた音声信号は、図示しないスピーカなどの出力装置から外部に出力される。

［作用］
図７を参照しつつ、本実施形態における音声信号処理装置１００の作用について説明する。まず、元の音声信号である５．１ｃｈサラウンドの音源が、調整部１１と、演算部２０とに入力される。調整部１１において、５．１ｃｈサラウンドの音源は、強調部１１１または補間部１１２のいずれか一方に入力されるが、ここでは強調部１１１に入力されるものとして説明する。

強調部１１１において、５．１ｃｈサラウンドの音源は、センター音源とそれ以外の音源とが識別可能となっている。ここで、ミキシングエンジニアは、強調部１１１が備える操作子を回転させることにより、センター音源を強調する（ステップＳ０１）。強調部１１１は、センター音源が強調された５．１ｃｈサラウンドの音源を後段のバランス調整部１１３に出力する。

バランス調整部１１３において、センター音源が強調された５．１ｃｈサラウンドの音源は、直接音の音源と、間接音の音源とが識別可能となっている。ここで、ミキシングエンジニアは、バランス調整部１１３が備える操作子を回転させることにより、直接音を強調する（ステップＳ０２）。バランス調整部１１３は、直接音が強調された５．１ｃｈサラウンドの音源を後段の係数生成部１２に出力する。

係数生成部１２は、特許文献１の技術を用いる場合、調整部１１が調整した５．１ｃｈサラウンドの音源からダウンミックス係数を生成する（ステップＳ０３）。係数生成部１２は、生成したダウンミックス係数を演算部２０に出力する。

演算部２０は、入力された元の音声信号である５．１ｃｈサラウンドの音源に対して、係数生成部１２から入力されたダウンミックス係数を乗算する（ステップＳ０４）。これにより、５．１ｃｈサラウンドの音源をダウンミックスしたステレオの音源が生成される。また、係数更新部１３からの要求により、係数生成部１２は、所定の周期でダウンミックス係数を再度生成することも出来る。ダウンミックス対象となる音源が現在放送中のものであるのに対し、ダウンミックス係数は過去の音源から生成されたものである。そのため、所定の周期でダウンミックス係数を更新することにより、現在放送中の音源に適したダウンミックス係数を使い続けることが出来る。

［効果］
（１）本実施形態の音声信号処理装置１００の調整部１１は、バランス調整部１１３を備える。これにより、サラウンドの音源を直接調整して間接音の音源に比して直接音の音源を強調することが出来るので、この調整されたサラウンドの音源から生成されるダウンミックス係数を用いてダウンミックスすることにより、ダウンミックスされた音源においても直接音の音源が間接音の音源に埋もれて聞こえづらくなるという事態を回避することが出来る。また、従来技術のように、ＡＲＩＢ規格のダウンミックス係数を手動で調整する必要もないため、熟練のミキシングエンジニアでなくとも容易に調整を行うことが出来る。

（２）本実施形態の音声信号処理装置１００の調整部１１は、バランス調整部１１３の前段に強調部１１１を備える。これにより、センター音源だけを他の音源に比較して強調することが出来るので、センター音源が他の音源に埋もれて聞こえづらくなるという事態を回避することが出来る。特に、センター音源にコメントなどの重要な情報が含まれている場合に、コメントが聞こえないという事態を回避することが出来る。

（３）本実施形態の音声信号処理装置１００の調整部１１は、バランス調整部１１３の前段に補間部１１２を備える。これにより、センター音源が他の音源に比較して弱々しい場合であっても、Ｌｃｈ音源とＲｃｈ音源とのミックスにより、センター音源を補強することが出来る。特に、センター音源にコメントなどの視聴者が認識し易い情報が含まれない場合に、音源が中抜けしているような印象を与えることがない。

（４）本実施形態の音声信号処理装置１００は、係数更新部１３を備える。これにより、係数生成部１２は、所定の周期でダウンミックス係数を再度生成することが出来るので、例えば番組の進行に伴う音源の変化に合わせてダウンミックス係数を随時更新することが出来るので、音源とダウンミックス係数のミスマッチがおきにくい。

［第２の実施形態］
第２の実施形態は、第１の実施形態と基本構成が同じである。以下では、第１の実施形態と異なる点のみを説明し、第１の実施形態と同じ部分については同じ符号を付して詳細な説明は省略する。

［構成］
図８に示すように、音声信号処理装置１００は、ダウンミックス係数とダウンミックス係数に紐付けられている付帯情報とを記憶する記憶部３０と、付帯情報に基づいて記憶部３０に記憶されているダウンミックス係数を選択する選択部４０と、を更に備える。

記憶部３０は、ストレージなどにより構成され、予め係数生成部１２が生成しておいたダウンミックス係数を複数記憶する。記憶されたダウンミックス係数には、付帯情報が紐付けられる。付帯情報は、例えば、ダウンミックスされる元の音声信号に関する情報であって、放送される番組の名称やジャンル、出演者名、スタジオの場所、放送時の天候などである。付帯情報は、例えば図示しない記憶装置に予め記憶されており、元の音声信号からダウンミックス係数を生成する過程と並行して、記憶部３０に入力される。記憶部３０において、この付帯情報と同じ音声信号から生成されたダウンミックス係数とが紐付けられて記憶される。換言すると、記憶部３０は、ダウンミックス係数とその付帯情報のデータベースである。

選択部４０は、メモリ及びＣＰＵなどにより構成され、記憶部３０に記憶されている付帯情報に基づいて、放送中の番組に最適なダウンミックス係数を選択する。例えば、選択部４０に人工知能が搭載され、人工知能が現在放送中の番組の音声信号に関する付帯情報と記憶部３０に記憶されている付帯情報とを照合することにより、このような選択が実行される。選択部４０は、選択したダウンミックス係数を演算部２０に出力する。なお、元の音声信号に関する付帯情報は、例えば番組の放送開始とともに選択部４０に入力される。

［作用］
図９を参照しつつ、本実施形態における音声信号処理装置１００の作用について説明する。本実施形態の前提として、係数生成部１２が生成したダウンミックス係数は、記憶部３０に入力され、記憶部３０に記憶されている（ステップＳ１１）。また、このダウンミックス係数には、同じ元の音声信号に関する付帯情報が紐付けられている（ステップＳ１２）。記憶部３０には、このダウンミックス係数と付帯情報との組が複数記憶され、ダウンミックス係数のデータベースを構成している。

本実施形態においては、選択部４０が、元の音声信号に関する付帯情報と、記憶部３０に記憶されている付帯情報とを照合する。これにより、選択部４０は、元の音声信号に適したダウンミックス係数を選択し、選択したダウンミックス係数を演算部２０に出力する（ステップＳ１３）。演算部２０は、入力された元の音声信号である５．１ｃｈサラウンドの音源に対して、選択部４０が選択したダウンミックス係数を乗算する（ステップＳ１４）。これにより、５．１ｃｈサラウンドの音源をダウンミックスしたステレオの音源が生成される。

［効果］
本実施形態の音声信号処理装置１００は、記憶部３０と、選択部４０と、を備える。これにより、予め係数生成部１２が生成しておいたダウンミックス係数から、放送中の番組に適したものを選択することが出来る。このような選択は、ダウンミックス係数の生成よりも短い時間で行うことが出来るので、迅速にダウンミックスを行うことが出来る。また、係数生成部１２がダウンミックス係数を生成した後は、このダウンミックス係数が演算部２０に出力されることで、第１の実施形態と同様の効果を奏することが出来る。

［他の実施形態］
本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。具体的には、次のような他の実施形態も包含する。

（１）上記の実施形態においては、センター音源を聞こえ易くしたが、他の音源を聞こえ易くしてもよい。例えば、Ｌｃｈ音源を聞こえ易くしてもよい。

（２）上記の実施形態においては、５．１ｃｈサラウンドからステレオへのダウンミックスについて説明したが、例えば２２．２ｃｈサラウンドからステレオへのダウンミックスや、２２．２ｃｈサラウンドから５．１ｃｈサラウンドへのダウンミックスについても本発明を適用することが出来る。

（３）上記の実施形態の調整部１１は、強調部１１１と、補間部１１２と、バランス調整部１１３と、を備えるようにしたが、これらのうち少なくとも１つの構成を備えればよい。また、強調部１１１と補間部１１２とは代替的に機能することとしたが、例えば強調部１１１の後段に補間部１１２を設けることにより、両方が機能するようにしても良い。

（４）上記の実施形態の調整部１１においては、ミキシングエンジニアが各構成に設けられた操作子を操作することによってパラメータを生成したが、音声信号処理装置１００に設けられたＧＵＩを操作することによってパラメータを生成してもよい。

（５）上記の実施形態の係数更新部１３は、所定の周期で係数生成部１２にダウンミックス係数を再度生成させることとした。この方法であれば、最新のダウンミックス係数によりダウンミックスすることになるが、例えば前回のダウンミックス係数と最新のダウンミックス係数との差分を一定の時定数で変化させ、連続的にダウンミックス係数を更新することも出来る。

（６）上記の実施形態の係数更新部１３は、所定の周期で係数生成部１２にダウンミックス係数を再度生成させることとした。これと同様に、係数更新部１３は、所定の周期で選択部４０に再度ダウンミックス係数を選択させることも出来る。さらに、並行して所定の周期で係数生成部１２に生成させたダウンミックス係数を記憶部３０に出力させ続けることにより、選択部４０が選択するダウンミックス係数の選択肢を増やすことも出来る。

（７）上記の実施形態においては、係数更新部１３を備えることとしたが、図示しない入力手段により係数生成部１２にダウンミックス係数を生成させるのであれば、係数更新部１３を省略することも出来る。

（８）上記の実施形態の強調部１１１においては、センター音源とその他の音源とのバランスを調整するものとしたが、例えば、センター音源とＬｃｈ音源、Ｒｃｈ音源とのバランスを調整するようにしてもよい。センター音源に含まれるコメントがＬｃｈ音源、Ｒｃｈ音源にも含まれる場合、コメントの聞こえ方を細かく調整することが出来る。

（９）上記の実施形態の補間部１１２においては、Ｌｃｈ音源とＲｃｈ音源とのミキシングバランスを調整するものとしたが、例えば、元の音声信号が２２．２ｃｈの音源である場合、上層の音源と下層の音源とのミキシングバランスを調整するものとしてもよい。

（１０）上記の実施形態においては、直接音の音源を、センター音源、Ｌｃｈ音源、Ｒｃｈ音源としたが、これに限られない。図示しない入力手段により、どの音源を直接音の音源とするかを任意に設定することが出来る。

（１１）上記の実施形態においては、特許文献１の技術を用いてダウンミックス係数を生成したが、ＡＲＩＢ規格のダウンミックス係数を用いて、係数生成部１２が演算部２０に出力するためのダウンミックス係数を生成することも出来る。この場合、調整部１１の作用も上記実施形態とは異なるので、以下に説明する。

図１０に示すように、ＡＲＩＢの規格を用いる場合には、サラウンドの音源は調整部１１に入力されない。ミキシングエンジニアは、調整部１１の各構成が備える操作子を回転させることにより、サラウンドの音源を直接調整するのではなく、サラウンドの音源を調整するための係数を生成する。例えば、バランス調整部１１３は、センター音源をどの程度強調するかを定める係数を生成する。このように、調整部１１が生成した係数は、後段に設けられた係数生成部１２に入力される。本実施形態の係数生成部１２は、係数乗算部１２１を備える。係数乗算部１２１は、調整部１１が生成した係数にＡＲＩＢ規格のダウンミックス係数を乗算することにより、演算部２０に出力するダウンミックス係数を生成する。なお、特許請求の範囲におけるサラウンドの音源を調整するという記載は、サラウンドの音源を直接調整することだけでなく、サラウンドの音源を調整するための係数を生成することも含むものとする。

（１２）上記の実施形態においては、音声信号処理装置１００というハードウェアについて説明したが、コンピュータに音声信号処理装置１００の各構成の作用を手順として実行させるプログラムなどのソフトウェアによっても同様の効果を奏することが出来る。例えば、調整部１１のバランス調整部１１３と、係数生成部１２と、演算部２０と、を構成として備える音声信号処理装置１００の代わりに、サラウンドの音源の調整において、間接音の音源に比して直接音の音源を強調する調整手順と、調整手順における調整に基づいてダウンミックス係数を生成する係数生成手順と、ダウンミックス係数により、サラウンドの音源からダウンミックスされた音源を生成する演算手順と、をコンピュータに実行させる音声信号処理プログラムによっても、同様の効果を奏することが出来る。この手順は、例えば図７の説明と同様に行われる。

１００…音声信号処理装置
１０…生成部
１１…調整部
１１１…強調部
１１２…補間部
１１３…バランス調整部
１２…係数生成部
１２１…係数乗算部
１３…係数更新部
２０…演算部
３０…記憶部
４０…選択部
Ａ…主操作子
Ｂ…副操作子

Claims

サラウンドの音源をダウンミックスする音声信号処理装置であって、
直接音の音源のミキシング量が増加させる操作子を有し、前記サラウンドの音源を調整する調整部と、
前記調整部の調整に基づいてダウンミックス係数を生成する係数生成部と、
前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する演算部と、
を備え、
前記操作子をミキシングエンジニアが操作することで所定のミキシング量に設定され、
前記調整部は、前記サラウンドの音源の調整において、設定された前記所定のミキシング量に基づいて間接音の音源に比して直接音の音源を強調するとともに、Ｌｃｈ音源とＲｃｈ音源とのミキシング量を調整してファンタムセンターの音像を強調することにより、センター音源を補強する、
音声信号処理装置。
所定の周期に基づいて、前記係数生成部に前記ダウンミックス係数を生成させることにより、前記ダウンミックス係数を随時更新する係数更新部を更に備える、
請求項１に記載の音声信号処理装置。
前記サラウンドの音源に関する情報である付帯情報に紐付けて前記ダウンミックス係数を予め複数記憶する記憶部と、
前記付帯情報に基づいて、前記ダウンミックス係数を選択する選択部と、
を更に備え、
前記演算部は、前記選択部が選択した前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する、
請求項１又は２に記載の音声信号処理装置。
コンピュータにサラウンドの音源をダウンミックスする処理を実行させる音声信号処理プログラムであって、
直接音の音源のミキシング量が増加させる操作子を有し、前記サラウンドの音源を調整する調整手順と、
前記調整手順における調整に基づいてダウンミックス係数を生成する係数生成手順と、
前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する演算手順と、
をコンピュータに実行させ、
前記調整手順は、前記操作子をミキシングエンジニアが操作することで所定のミキシング量に設定され、前記サラウンドの音源の調整において、設定された前記所定のミキシング量に基づいて間接音の音源に比して直接音の音源を強調するとともに、Ｌｃｈ音源とＲｃｈ音源とのミキシング量を調整してファンタムセンターの音像を強調することにより、センター音源を補強する、
音声信号処理プログラム。