JP2013055439A - 音声信号変換装置、方法、プログラム、及び記録媒体 - Google Patents
音声信号変換装置、方法、プログラム、及び記録媒体 Download PDFInfo
- Publication number
- JP2013055439A JP2013055439A JP2011191263A JP2011191263A JP2013055439A JP 2013055439 A JP2013055439 A JP 2013055439A JP 2011191263 A JP2011191263 A JP 2011191263A JP 2011191263 A JP2011191263 A JP 2011191263A JP 2013055439 A JP2013055439 A JP 2013055439A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio signal
- unit
- correlation
- discrete fourier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Abstract
【課題】マルチチャネル方式用の音声信号を、不連続点に起因するノイズを発生させることなく変換することが可能な音声信号変換装置を提供する。
【解決手段】音声信号変換装置(音声信号処理部113で例示)は、2つのチャネルの入力音声信号に離散フーリエ変換を施す変換部と、変換部で離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する相関信号抽出部と、相関信号抽出部で抽出された相関信号またはその相関信号及び無相関信号に対して、もしくはその相関信号またはその相関信号及びその無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換部と、離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、該処理セグメント内の各値から減算することで、離散フーリエ逆変換後の音声信号から波形の不連続点を除去する雑音除去部122とを備える。
【選択図】図12
【解決手段】音声信号変換装置(音声信号処理部113で例示)は、2つのチャネルの入力音声信号に離散フーリエ変換を施す変換部と、変換部で離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する相関信号抽出部と、相関信号抽出部で抽出された相関信号またはその相関信号及び無相関信号に対して、もしくはその相関信号またはその相関信号及びその無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換部と、離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、該処理セグメント内の各値から減算することで、離散フーリエ逆変換後の音声信号から波形の不連続点を除去する雑音除去部122とを備える。
【選択図】図12
Description
本発明は、マルチチャネル再生方式用の音声信号を変換するための音声信号変換装置、方法、プログラム、及び記録媒体に関する。
従来から提案されている音響再生方式には、ステレオ(2ch)方式、5.1chサラウンド方式(ITU−R BS.775−1)などがあり広く民生用として普及している。2ch方式とは、図1で模式的に図示したように、左スピーカ11Lと右スピーカ11Rから異なる音声データを発生させる方式である。5.1chサラウンド方式とは、図2で模式的に図示したように、左フロントスピーカ21L、右フロントスピーカ21R、それらの間に配置するセンタースピーカ22C、左リアスピーカ23L、右リアスピーカ23R、及び図示しない低音域(一般的に20Hz〜100Hz)専用のサブウーファーに対し、それぞれ異なる音声データを入力して出力する方式である。
また、2ch方式や5.1chサラウンド方式の他にも、7.1ch、9.1ch、22.2chなどさまざまな音響再生方式が提案されている。上述した方式はいずれも、聴取者(受聴者)を中心とする円周上または球面上に各スピーカを配置し、理想的には各スピーカから等距離にある聴取位置(受聴位置)、いわゆるスイートスポットで聴くことが好ましいとされている。例えば2ch方式ではスイートスポット12で、5.1chサラウンド方式ではスイートスポット24で聴くことが好ましい。スイートスポットで聴くと、音圧のバランスによる合成音像が製作者の意図するところに定位する。逆に、スイートスポット以外の位置で聴くと、一般的に、音像・音質が劣化する。以下、これらの方式を総称してマルチチャネル再生方式と呼ぶ。
一方、マルチチャネル再生方式とは別に、音源オブジェクト指向再生方式もある。この方式は、全ての音が、いずれかの音源オブジェクトが発する音であるとする方式であり、各音源オブジェクト(以下、「仮想音源」と呼ぶ。)が自身の位置情報と音声信号とを含んでいる。音楽コンテンツを例にとると、各仮想音源は、それぞれの楽器の音と楽器が配置されている位置情報とを含む。
そして、音源オブジェクト指向再生方式は、通常、直線状あるいは面状に並べたスピーカ群によって音の波面を合成する再生方式(すなわち波面合成再生方式)により再生される。このような波面合成再生方式のうち、非特許文献1に記載のWave Field Synthesis(WFS)方式は、直線状に並べたスピーカ群(以下、スピーカアレイという)を用いる現実的な実装方法の1つとして近年盛んに研究されている。
そして、音源オブジェクト指向再生方式は、通常、直線状あるいは面状に並べたスピーカ群によって音の波面を合成する再生方式(すなわち波面合成再生方式)により再生される。このような波面合成再生方式のうち、非特許文献1に記載のWave Field Synthesis(WFS)方式は、直線状に並べたスピーカ群(以下、スピーカアレイという)を用いる現実的な実装方法の1つとして近年盛んに研究されている。
このような波面合成再生方式は、上述のマルチチャネル再生方式とは異なり、図3で模式的に図示したように、並べられたスピーカ群31の前のどの位置で聴いている受聴者に対しても、良好な音像と音質を両方同時に提示することができるという特長を持つ。つまり、波面合成再生方式でのスイートスポット32は図示するように幅広くなっている。
また、WFS方式によって提供される音響空間内においてスピーカアレイと対面して音を聴いている受聴者は、実際にはスピーカアレイから放射される音が、スピーカアレイの後方に仮想的に存在する音源(仮想音源)から放射されているかのような感覚を受ける。
また、WFS方式によって提供される音響空間内においてスピーカアレイと対面して音を聴いている受聴者は、実際にはスピーカアレイから放射される音が、スピーカアレイの後方に仮想的に存在する音源(仮想音源)から放射されているかのような感覚を受ける。
この波面合成再生方式では、仮想音源を表す入力信号を必要とする。そして、一般的に、1つの仮想音源には1チャネル分の音声信号とその仮想音源の位置情報が含まれることを必要とする。上述の音楽コンテンツを例にとると、例えば楽器毎に録音された音声信号とその楽器の位置情報ということになる。ただし、仮想音源それぞれの音声信号は必ずしも楽器毎である必要はないが、コンテンツ製作者が意図するそれぞれの音の到来方向と大きさが、仮想音源という概念を用いて表現されている必要がある。
ここで、前述のマルチチャンネル方式の中でも最も広く普及している方式はステレオ(2ch)方式であるため、ステレオ方式の音楽コンテンツについて考察する。図4に示すように2つのスピーカ41L,41Rを用いて、ステレオ方式の音楽コンテンツにおけるL(左)チャネルとR(右)チャネルの音声信号を、それぞれ左に設置したスピーカ41L、右に設置したスピーカ41Rで再生する。このような再生を行うと、図4に示すように、各スピーカ41L,41Rから等距離の地点、すなわちスイートスポット43で聴く場合にのみ、ボーカルの声とベースの音が真ん中の位置42bから聞こえ、ピアノの音が左側の位置42a、ドラムの音が右側の位置42cなど、製作者が意図したように音像が定位して聞こえる。
このようなコンテンツを波面合成再生方式で再生し、波面合成再生方式の特長である、どの位置の受聴者に対してもコンテンツ製作者の意図通りの音像定位を提供することを考える。そのためには、図5で示すスイートスポット53のように、どの視聴位置からでも図4のスイートスポット43内で聴いたときの音像が知覚できなければならない。つまり、直線状あるいは面状に並べられたスピーカ群51によって、広いスイートスポット53で、ボーカルの声とベースの音が真ん中の位置52bから聞こえ、ピアノの音が左側の位置52a、ドラムの音が右側の位置52cなど、製作者が意図したように音像が定位して聞こえなければならない。
このようなコンテンツを波面合成再生方式で再生し、波面合成再生方式の特長である、どの位置の受聴者に対してもコンテンツ製作者の意図通りの音像定位を提供することを考える。そのためには、図5で示すスイートスポット53のように、どの視聴位置からでも図4のスイートスポット43内で聴いたときの音像が知覚できなければならない。つまり、直線状あるいは面状に並べられたスピーカ群51によって、広いスイートスポット53で、ボーカルの声とベースの音が真ん中の位置52bから聞こえ、ピアノの音が左側の位置52a、ドラムの音が右側の位置52cなど、製作者が意図したように音像が定位して聞こえなければならない。
その課題に対し、例えば、図6のようにLチャネルの音、Rチャネルの音をそれぞれ仮想音源62a,62bとして配置した場合を考える。この場合、L/Rチャネルそれぞれが単体で1つの音源を表すのではなく2つのチャンネルによって合成音像を生成するものであるから、それを波面合成再生方式で再生したとしても、やはりスイートスポット63が生成されてしまい、スイートスポット63の位置でしか、図4のような音像定位はしない。つまり、そのような音像定位を実現するには、2chのステレオデータから、何らかの手段によって音像毎の音声に分離し、各音声から仮想音源データを生成することが必要となる。
この課題に対し、特許文献1に記載の方法では、2chステレオデータを周波数帯域毎に信号のパワーの相関係数を基に相関信号と無相関信号とに分離し、相関信号については合成音像方向を推定し、それらの結果から仮想音源を生成している。
A. J. Berkhout, D. de Vries, and P. Vogel, "Acoustic control by wave field synthesis", J. Acoust. Soc. Am. Volume 93(5), アメリカ合衆国、Acoustical Society of America, May 1993, pp. 2764-2778
しかしながら、特許文献1に記載の方法では、元の音声信号の分析の際、離散フーリエ変換後の左右チャネルの直流成分を無視している。図7は、音声信号を離散フーリエ変換したときの結果の一例を示す模式図である。図7において、鉛直方向の軸は実部、手前方向の軸は虚部を表しており、符号71は直流成分を示している。特許文献1に記載の方法では、この直流成分71を無視するため、フーリエ逆変換後のセグメント間の波形の連続性が保証されず、セグメントの境界では波形が不連続となる。低い帯域の信号が多く含まれるコンテンツでは特に、生成した音声信号波形には不連続点が多く含まれ、それらはノイズとして知覚されてしまう。
図8に示す音楽コンテンツ80の例で、このノイズについて説明する。音楽コンテンツ80における左チャネルの音声信号81及び右チャネルの音声信号82を、特許文献1に記載の方法を用いて例えば5つのチャネルに変換すると、図9に示す音楽コンテンツ90のような結果になる。音楽コンテンツ90は、5つのチャネルの音声信号91〜95を有することになる。そして、図10は、図9の上から3番目のチャネルの音声信号93における9秒付近を拡大したものであるが、図10に示す音声信号100では、中央付近101にあるように不連続点が生じている。このような不連続点が多数含まれてしまうため、耳障りなノイズとして知覚されてしまう。
このような問題は、マルチチャネル方式用の音声信号に対して、波面合成再生方式で再生させるための音声信号に変換する場合に限ったものではなく、同じくマルチチャネル方式用(チャネル数は同じでも異なってもよい)の音声信号に変換する場合にも生じ得る。それは、このような変換の場合にも上述のような離散フーリエ変換・逆変換を施し且つ左右チャネルの直流成分を無視することがあるためである。
本発明は、上述のような実状に鑑みてなされたものであり、その目的は、2chや5.1ch等のマルチチャネル方式用の音声信号を、不連続点に起因するノイズを発生させることなく変換することが可能な音声信号変換装置、方法、プログラム、及び記録媒体を提供することにある。
上述したような課題を解決するために、本発明の第1の技術手段は、マルチチャネルの入力音声信号を、スピーカ群によって再生させるための音声信号に変換する音声信号変換装置であって、2つのチャネルの入力音声信号に離散フーリエ変換を施す変換部と、該変換部で離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する相関信号抽出部と、該相関信号抽出部で抽出された相関信号または該相関信号及び無相関信号に対して、もしくは前記相関信号から生成された音声信号に対して、もしくは前記相関信号及び前記無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換部と、該逆変換部で離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、該処理セグメント内の各値から減算することで、前記離散フーリエ逆変換後の音声信号から波形の不連続点を除去する除去部と、を備えたことを特徴としたものである。
第2の技術手段は、第1の技術手段において、前記平均値は、前記処理セグメントの少なくとも両端点の値を平均した値であることを特徴としたものである。
第3の技術手段は、第1または第2の技術手段において、前記マルチチャネルの入力音声信号は3つ以上のチャネルの入力音声信号とし、前記マルチチャネルの入力音声信号のうちいずれか2つの入力音声信号に対して、前記変換部、前記相関信号抽出部、前記逆変換部、及び前記除去部により前記不連続点の除去を行って、前記スピーカ群によって再生させるための音声信号を生成し、前記音声信号変換装置は、生成された音声信号に残りのチャネルの入力音声信号を加算する加算部をさらに備えたことを特徴としたものである。
第4の技術手段は、第1〜第3のいずれか1の技術手段において、前記マルチチャネルの入力音声信号を含むディジタルコンテンツを入力するディジタルコンテンツ入力部と、ディジタルコンテンツを復号化するデコーダ部と、該デコーダ部で復号化したディジタルコンテンツから音声信号を分離する音声信号抽出部と、該音声信号抽出部で抽出した音声信号から、3チャネル以上で且つ前記入力音声信号とは異なるマルチチャネルの音声信号に変換する音声信号処理部とをさらに備え、該音声信号処理部は、前記変換部、前記相関信号抽出部、前記逆変換部、及び前記除去部を備えることを特徴としたものである。
第5の技術手段は、第4の技術手段において、前記ディジタルコンテンツ入力部は、ディジタルコンテンツを格納する記録媒体、ネットワークを介してディジタルコンテンツを配信するサーバまたはディジタルコンテンツを放送する放送局からディジタルコンテンツを入力することを特徴としたものである。
第6の技術手段は、第1〜第5のいずれか1の技術手段において、前記変換部、前記相関信号抽出部、前記逆変換部、及び前記除去部を備えた音声信号処理部における処理を実行するか否かを、ユーザ操作に応じて切り替える切替部をさらに備えたことを特徴としたものである。
第7の技術手段は、マルチチャネルの入力音声信号を、スピーカ群によって再生させるための音声信号に変換する音声信号変換方法であって、変換部が、2つのチャネルの入力音声信号に離散フーリエ変換を施す変換ステップと、相関信号抽出部が、前記変換ステップで離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する抽出ステップと、逆変換部が、前記抽出ステップで抽出された相関信号または該相関信号及び無相関信号に対して、もしくは前記相関信号から生成された音声信号に対して、もしくは前記相関信号及び前記無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換ステップと、除去部が、前記逆変換ステップで離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、該処理セグメント内の各値から減算することで、前記離散フーリエ逆変換後の音声信号から波形の不連続点を除去する除去ステップと、を有することを特徴としたものである。
第8の技術手段は、コンピュータに、2つのチャネルの入力音声信号に離散フーリエ変換を施す変換ステップと、該変換ステップで離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する抽出ステップと、該抽出ステップで抽出された相関信号または該相関信号及び無相関信号に対して、もしくは前記相関信号から生成された音声信号に対して、もしくは前記相関信号及び前記無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換ステップと、該逆変換ステップで離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、該処理セグメント内の各値から減算することで、前記離散フーリエ逆変換後の音声信号から波形の不連続点を除去する除去ステップと、を実行させるためのプログラムである。
第9の技術手段は、第8の技術手段におけるプログラムを記録したコンピュータ読み取り可能な記録媒体である。
第9の技術手段は、第8の技術手段におけるプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、2chや5.1ch等のマルチチャネル方式用の音声信号を、不連続点に起因するノイズを発生させることなく変換することが可能になる。
本発明に係る音声信号変換装置は、マルチチャネル再生方式用の音声信号を、チャネル数の同じまたは異なるスピーカ群で再生するための音声信号や波面合成再生方式用の音声信号などに変換する装置であって、音声信号処理装置、音声データ変換装置などとも呼べ、音声データ再生装置に組み込むことができる。なお、音声信号とは、当然、いわゆる音声を記録した信号に限ったものではなく、音響信号とも呼べる。また、波面合成再生方式とは、上述したように直線状または面状に並べたスピーカ群によって音の波面を合成する再生方式である。
以下、図面を参照しながら、本発明に係る音声信号変換装置の構成例及び処理例について説明する。また、以下の説明では、まず、本発明に係る音声信号変換装置が、変換により波面合成再生方式用の音声信号を生成する例を挙げる。
図11は、本発明に係る音声信号変換装置を備えた音声データ再生装置の一構成例を示すブロック図で、図12は、図11の音声データ再生装置における音声信号処理部(本発明に係る音声信号変換装置)の一構成例を示すブロック図である。
図11は、本発明に係る音声信号変換装置を備えた音声データ再生装置の一構成例を示すブロック図で、図12は、図11の音声データ再生装置における音声信号処理部(本発明に係る音声信号変換装置)の一構成例を示すブロック図である。
図11で例示する音声データ再生装置110は、デコーダ111、音声信号抽出部112、音声信号処理部113、D/Aコンバータ114、増幅器群115、そしてスピーカ群116から構成される。デコーダ111は、音声のみあるいは音声付き映像のコンテンツを復号化し、信号処理可能な形式に変換し音声信号抽出部112に出力する。そのコンテンツは、放送局から送信されたデジタル放送のコンテンツや、ネットワークを介してディジタルコンテンツを配信するサーバからインターネットからダウンロードしたり、あるいは外部記憶装置等の記録媒体から読み込んだりすることによって取得する。このように、図11では図示しないが、音声データ再生装置110は、マルチチャネルの入力音声信号を含むディジタルコンテンツを入力するディジタルコンテンツ入力部を備える。デコーダ111は、ここで入力されたディジタルコンテンツを復号化することになる。音声信号抽出部112では、得られた信号から音声信号を分離、抽出する。ここではそれは2chステレオ信号とする。その2チャネル分の信号を音声信号処理部113に出力する。
音声信号処理部113では、得られた2チャネル信号から、3チャネル以上で且つ入力音声信号とは異なるマルチチャネルの音声信号(以下の例では、仮想音源数分の信号として説明する)を生成する。つまり入力音声信号を別のマルチチャネルの音声信号に変換する。音声信号処理部113は、その音声信号をD/Aコンバータ114に出力する。仮想音源の数は、ある一定以上の数があれば予め決めておいても性能上差し支えはないが、仮想音源数が多くなるほど演算量も多くなる。そのため実装する装置の性能を考慮してその数を決定することが望ましい。ここの例では、その数を5として説明する。
D/Aコンバータ114では得られた信号をアナログ信号に変換し、それぞれの信号を増幅器115に出力する。各増幅器115では入力されたアナログ信号を拡声し各スピーカ116に伝送し、各スピーカ116から空間中に音として出力される。
この図における音声信号処理部の詳細な構成を図12に示す。音声信号処理部113は、音声信号分離抽出部121、雑音除去部122、そして、音声出力信号生成部123から構成される。
音声信号分離抽出部121は2チャネルの信号から各仮想音源に対応する音声信号を生成し、それを雑音除去部122に出力する。雑音除去部122では、得られた音声信号波形から知覚上ノイズとなる部分を除去し、ノイズ除去後の音声信号を音声出力信号生成部123に出力する。音声出力信号生成部123では、得られた音声信号から各スピーカに対応するそれぞれの出力音声信号波形を生成する。音声出力信号生成部123では、波面合成再生処理などの処理が施され、例えば、得られた各仮想音源用の音声信号を各スピーカに割り当て、スピーカ毎の音声信号を生成する。波面合成再生処理の一部は音声信号分離抽出部121で担ってもよい。
次に、図13に従って、音声信号分離抽出部121及び雑音除去部122での音声信号処理例を説明する。図13は、図12の音声信号処理部における音声信号分離抽出部及び雑音除去部での音声信号処理の一例を説明するためのフロー図で、図14は、図12の音声信号処理部において音声データをバッファに蓄える様子を示す図である。
まず、音声信号分離抽出部121は、1セグメントの半分の長さの音声データを、図11における音声信号抽出部112での抽出結果から読み出す(ステップS131)。ここで、音声データとは、例えば48kHzなどの標本化周波数で標本化された離散音声信号波形を指すものとする。そして、セグメントとは、ある一定の長さの標本点群からなる音声データ区間であり、ここでは後ほど離散フーリエ変換の対象となる区間長を指すものとし、処理セグメントとも呼ぶ。その値は例えば1024とする。この例では、1セグメントの半分の長さである512点の音声データが読み出し対象となる。
読み出した512点の音声データは図14で例示するようなバッファ140に蓄えられる。このバッファは、直前の1セグメント分の音声信号波形を保持しておけるようになっており、それより過去のセグメントは捨てていく。直前の半セグメント分のデータと最新の半セグメント分のデータを繋げて1セグメント分の音声データを作成し、窓関数演算(ステップS132)に進む。すなわち、全ての標本データは窓関数演算に2回読み込まれることになる。
ステップS132における窓関数演算では、従来提案されている次のHann窓を1セグメント分の音声データに乗算する。
ここで、mは自然数、Mは1セグメント長で偶数とする。ステレオの入力信号をそれぞれxL(m)、xR(m)とすると、窓関数乗算後の音声信号x′L(m)、x′R(m)は、
x′L(m)=w(m)xL(m) 、
x′R(m)=w(m)xR(m) (2)
と計算される。このHann窓を用いると、例えば標本点m0(ただし、M/2≦m0<M)の入力信号xL(m0)にはsin2((m0/M)π)が乗算される。そして、その次の回の読み込みではその同じ標本点がm0−M/2として読み込まれるので、
x′R(m)=w(m)xR(m) (2)
と計算される。このHann窓を用いると、例えば標本点m0(ただし、M/2≦m0<M)の入力信号xL(m0)にはsin2((m0/M)π)が乗算される。そして、その次の回の読み込みではその同じ標本点がm0−M/2として読み込まれるので、
そうして得られた音声データを、次の数式(3)のように離散フーリエ変換し、周波数領域の音声データを得る(ステップS133)。ここで、DFTは離散フーリエ変換を表し、kは自然数で、0≦k<Mである。XL(k)、XR(k)は複素数となる。
XL(k)=DFT(x′L(n)) 、
XR(k)=DFT(x′R(n)) (3)
XL(k)=DFT(x′L(n)) 、
XR(k)=DFT(x′R(n)) (3)
次に、得られた周波数領域の音声データを小さい帯域に分割し、分割した各帯域についてステップS135〜S138の処理を実行する(ステップS134a,S134b)。具体的に個々の処理について説明する。
まず、分割方法についてはEquivalent Rectangular Band(ERB)を用い、ERBの帯域幅で0Hzから標本化周波数の1/2の周波数までの間を分割する。ここで、ERBにより、与えられた周波数の上限fmax[Hz]までをいくつに分割するか、すなわちERBで分割した各帯域の索引の最大値Iは次式によって与えられる。
I=floor(21.4log10(0.00437fmax+1)) (4)
ただし、floor(a)はフロア関数で、実数aを越えない整数の最大値を表す。
I=floor(21.4log10(0.00437fmax+1)) (4)
ただし、floor(a)はフロア関数で、実数aを越えない整数の最大値を表す。
そして、それぞれのERB幅の帯域(以下、小帯域)の中心周波数Fc (i)(1≦i≦I)[Hz]は次式によって与えられる。
また、その時のERBの帯域幅b(i)[Hz]は次式によって求められる。
b(i)=24.7(0.00437Fc (i)+1) (6)
よって、その中心周波数から低域側と高域側にそれぞれERB/2の周波数幅だけシフトすることによりi番目の小帯域の両側の境界周波数FL (i)、FU (i)を求めることができる。したがって、i番目の小帯域には、KL (i)番目の線スペクトルからKU (i)番目の線スペクトルが含まれる。ここで、KL (i)、KU (i)はそれぞれ次の数式(7)、(8)で表される。
KL (i)=ceil(21.4log10(0.00437FL (i)+1)) (7)
KU (i)=floor(21.4log10(0.00437FU (i)+1)) (8)
ただし、ceil(a)は天井関数で、実数aより小さくならない整数の最小値を表す。また、離散フーリエ変換した後の線スペクトルは、直流成分すなわち例えばXL(0)を除いて、M/2(ただし、Mは偶数)を境に対称となっている。すなわち、XL(k)とXL(M−k)は0<k<M/2の範囲で複素共役の関係になる。したがって、以下ではKU (i)≦M/2の範囲を分析の対象として考え、k>M/2の範囲については複素共役の関係にある対称の線スペクトルと同じ扱いとする。
b(i)=24.7(0.00437Fc (i)+1) (6)
よって、その中心周波数から低域側と高域側にそれぞれERB/2の周波数幅だけシフトすることによりi番目の小帯域の両側の境界周波数FL (i)、FU (i)を求めることができる。したがって、i番目の小帯域には、KL (i)番目の線スペクトルからKU (i)番目の線スペクトルが含まれる。ここで、KL (i)、KU (i)はそれぞれ次の数式(7)、(8)で表される。
KL (i)=ceil(21.4log10(0.00437FL (i)+1)) (7)
KU (i)=floor(21.4log10(0.00437FU (i)+1)) (8)
ただし、ceil(a)は天井関数で、実数aより小さくならない整数の最小値を表す。また、離散フーリエ変換した後の線スペクトルは、直流成分すなわち例えばXL(0)を除いて、M/2(ただし、Mは偶数)を境に対称となっている。すなわち、XL(k)とXL(M−k)は0<k<M/2の範囲で複素共役の関係になる。したがって、以下ではKU (i)≦M/2の範囲を分析の対象として考え、k>M/2の範囲については複素共役の関係にある対称の線スペクトルと同じ扱いとする。
これらの具体例を示す。例えば、標本化周波数が48000Hzの場合、I=44となり、44の小帯域に分割することとなる。ただし、最も高い小帯域区間よりもさらに上の周波数に相当する線スペクトル成分も存在するが、それらは聴感上の影響も殆ど無く、さらに通常は値が微小であるため、それらは最も高い小帯域区間に含めることとして差し支えない。
次に、このようにして決定される各小帯域において、左チャネルと右チャネルの正規化相関係数を次式で求めることで、相関係数を取得する(ステップS135)。
この正規化相関係数d(i)は左右のチャネルの音声信号にどれだけ相関があるかを表すものであり、0から1の間の実数の値をとる。全く同じ信号同士であれば1、そして全く無相関の信号同士であれば0となる。ここで、左右のチャネルの音声信号の電力PL (i)とPR (i)の両方が0である場合、その小帯域に関して相関信号と無相関信号の抽出は不可能とし、処理を行わず次の小帯域の処理に移ることとする。また、PL (i)とPR (i)のいずれか片方が0である場合、数式(9)では演算不可能であるが、正規化相関係数d(i)=0とし、その小帯域の処理を続行する。
次に、この正規化相関係数d(i)を用いて、左右チャネルの音声信号から相関信号と無相関信号をそれぞれ分離抽出するための変換係数を求め(ステップS136)、ステップS136で取得したそれぞれの変換係数を用いて、左右チャネルの音声信号から相関信号と無相関信号を分離抽出する(ステップS137)。相関信号及び無相関信号は、いずれも推定した音声信号として抽出すればよい。
ステップS136,S137の処理例を説明する。ここで、特許文献1と同様、左右チャネルそれぞれの信号は、無相関信号と相関信号から構成され、相関信号については左右から同じ信号が出力されるものとするモデルを採用する。そして、左右から出力される相関信号によって合成される音像は、その相関信号の左右それぞれの音圧のバランスによって方向が決定されるものとする。そのモデルに従うと、入力信号xL(n)、xR(n)は、
xL(m)= s(m)+nL(m)、
xR(m)=αs(m)+nR(m) (13)
と表される。ここで、s(m)は左右の相関信号、nL(m)は左チャネルの音声信号から相関信号s(m)を減算したものであって(左チャネルの)無相関信号として定義できるもの、nR(m)は右チャネルの音声信号から相関信号s(m)にαを乗算したものを減算したものであって(右チャネルの)無相関信号として定義できるものである。また、αは相関信号の左右音圧バランスの程度を表す正の実数である。
xL(m)= s(m)+nL(m)、
xR(m)=αs(m)+nR(m) (13)
と表される。ここで、s(m)は左右の相関信号、nL(m)は左チャネルの音声信号から相関信号s(m)を減算したものであって(左チャネルの)無相関信号として定義できるもの、nR(m)は右チャネルの音声信号から相関信号s(m)にαを乗算したものを減算したものであって(右チャネルの)無相関信号として定義できるものである。また、αは相関信号の左右音圧バランスの程度を表す正の実数である。
数式(13)により、数式(2)で前述した窓関数乗算後の音声信号x′L(m)、x′R(m)は、次の数式(14)で表される。ただし、s′(m)、n′L(m)、n′R(m)はそれぞれs(m)、nL(m)、nR(m)に窓関数を乗算したものである。
x′L(m)=w(m){ s(m)+nL(m)}= s′(m)+n′L(m)、
x′R(m)=w(m){αs(m)+nR(m)}=αs′(m)+n′R(m)
(14)
x′L(m)=w(m){ s(m)+nL(m)}= s′(m)+n′L(m)、
x′R(m)=w(m){αs(m)+nR(m)}=αs′(m)+n′R(m)
(14)
数式(14)を離散フーリエ変換することによって、次の数式(15)を得る。ただし、S(k)、NL(k)、NR(k)はそれぞれs′(m)、n′L(m)、n′R(m)を離散フーリエ変換したものである。
XL(k)= S(k)+NL(k)、
XR(k)=αS(k)+NR(k) (15)
XL(k)= S(k)+NL(k)、
XR(k)=αS(k)+NR(k) (15)
したがって、i番目の小帯域における音声信号XL (i)(k)、XR (i)(k)は、
XL (i)(k)= S(i)(k)+NL (i)(k)、
XR (i)(k)=α(i)S(i)(k)+NR (i)(k)
ただし、KL (i)≦k≦KU (i) (16)
と表現される。ここで、α(i)はi番目の小帯域におけるαを表す。以後、i番目の小帯域における相関信号S(i)(k)、無相関信号NL (i)(k)、NR (i)(k)をそれぞれ、
S(i)(k)=S(k)、
NL (i)(k)=NL(k)、
NR (i)(k)=NR(k)
ただし、KL (i)≦k≦KU (i) (17)
とおくこととする。
XL (i)(k)= S(i)(k)+NL (i)(k)、
XR (i)(k)=α(i)S(i)(k)+NR (i)(k)
ただし、KL (i)≦k≦KU (i) (16)
と表現される。ここで、α(i)はi番目の小帯域におけるαを表す。以後、i番目の小帯域における相関信号S(i)(k)、無相関信号NL (i)(k)、NR (i)(k)をそれぞれ、
S(i)(k)=S(k)、
NL (i)(k)=NL(k)、
NR (i)(k)=NR(k)
ただし、KL (i)≦k≦KU (i) (17)
とおくこととする。
数式(16)から、数式(12)の音圧PL (i)とPR (i)は、
PL (i)=PS (i)+PN (i)、
PR (i)=[α(i)]2PS (i)+PN (i) (18)
と表される。ここで、PS (i)、PN (i)はi番目の小帯域におけるそれぞれ相関信号、無相関信号の電力であり、
と表される。ここで、左右の無相関信号の音圧は等しいと仮定している。
PL (i)=PS (i)+PN (i)、
PR (i)=[α(i)]2PS (i)+PN (i) (18)
と表される。ここで、PS (i)、PN (i)はi番目の小帯域におけるそれぞれ相関信号、無相関信号の電力であり、
また、数式(10)〜(12)より、数式(9)は、
と表すことができる。ただし、この算出においてはS(k)、NL(k)、NR(k)が互いに直交し、かけ合わされたときの電力は0と仮定している。
数式(18)と数式(20)を解くことにより、次の式が得られる。
これらの値を用いて、各小帯域における相関信号と無相関信号を推定する。i番目の小帯域における相関信号S(i)(k)の推定値est(S(i)(k))を、媒介変数μ1、μ2を用いて、
est(S(i)(k))=μ1XL (i)(k)+μ2XR (i)(k) (23)
とおくと、推定誤差εは、
ε=est(S(i)(k))−S(i)(k) (24)
と表される。ここで、est(A)はAの推定値を表すものとする。そして二乗誤差ε2が最少になるとき、εとXL (i)(k)、XR (i)(k)はそれぞれ直交するという性質を利用すると、
E[ε・XL (i)(k)]=0 、 E[ε・XR (i)(k)]=0 (25)
という関係が成り立つ。数式(16)、(19)、(21)〜(24)を利用すると、数式(25)から次の連立方程式が導出できる。
(1−μ1−μ2α(i))PS (i)−μ1PN (i)=0
α(i)(1−μ1−μ2α(i))PS (i)−μ2PN (i)=0
(26)
est(S(i)(k))=μ1XL (i)(k)+μ2XR (i)(k) (23)
とおくと、推定誤差εは、
ε=est(S(i)(k))−S(i)(k) (24)
と表される。ここで、est(A)はAの推定値を表すものとする。そして二乗誤差ε2が最少になるとき、εとXL (i)(k)、XR (i)(k)はそれぞれ直交するという性質を利用すると、
E[ε・XL (i)(k)]=0 、 E[ε・XR (i)(k)]=0 (25)
という関係が成り立つ。数式(16)、(19)、(21)〜(24)を利用すると、数式(25)から次の連立方程式が導出できる。
(1−μ1−μ2α(i))PS (i)−μ1PN (i)=0
α(i)(1−μ1−μ2α(i))PS (i)−μ2PN (i)=0
(26)
この数式(26)を解くことによって、各媒介変数が次のように求まる。
ここで、このようにして求まる推定値est(S(i)(k))の電力Pest(S) (i)が、数式(23)の両辺を二乗して求まる次の式
Pest(S) (i)=(μ1+α(i)μ2)2PS (i)+(μ1 2+μ2 2)PN (i) (28)
を満たす必要があるため、この式から推定値を次式のようにスケーリングする。なお、est′(A)はAの推定値をスケーリングしたものを表す。
Pest(S) (i)=(μ1+α(i)μ2)2PS (i)+(μ1 2+μ2 2)PN (i) (28)
を満たす必要があるため、この式から推定値を次式のようにスケーリングする。なお、est′(A)はAの推定値をスケーリングしたものを表す。
そして、i番目の小帯域における左右チャネルの無相関信号NL (i)(k)、NR (i)(k)に対する推定値est(NL (i)(k))、est(NR (i)(k))はそれぞれ、
est(NL (i)(k))=μ3XL (i)(k)+μ4XR (i)(k) (30)
est(NR (i)(k))=μ5XL (i)(k)+μ6XR (i)(k) (31)
とおくことにより、上述の求め方と同様にして、媒介変数μ3〜μ6は、
est(NL (i)(k))=μ3XL (i)(k)+μ4XR (i)(k) (30)
est(NR (i)(k))=μ5XL (i)(k)+μ6XR (i)(k) (31)
とおくことにより、上述の求め方と同様にして、媒介変数μ3〜μ6は、
数式(27)、(32)、(33)で示した各媒介変数μ1〜μ6及び数式(29)、(34)、(35)で示したスケーリングの係数が、ステップS136で求める変換係数に該当する。そして、ステップS137では、これらの変換係数を用いた演算(数式(23)、(30)、(31))により推定することで、相関信号と無相関信号(右チャネルの無相関信号、左チャネルの無相関信号)とを分離抽出する。
次に、仮想音源への割り当て処理を行う(ステップS138)。まず、この割り当て処理では前処理として、小帯域毎に推定した相関信号によって生成される合成音像の方向を推定する。この推定処理について、図15〜図17に基づき説明する。図15は、受聴者と左右のスピーカと合成音像との位置関係の例を説明するための模式図、図16は、波面合成再生方式で使用するスピーカ群と仮想音源との位置関係の例を説明するための模式図、図17は、図16の仮想音源と受聴者及び合成音像との位置関係の例を説明するための模式図である。
いま、図15に示す位置関係150のように、受聴者から左右のスピーカ151L,151Rの中点にひいた線と、同じく受聴者153からいずれかのスピーカ151L/151Rの中心までひいた線がなす見開き角をθ0、受聴者153から推定合成音像152の位置までひいた線がなす見開き角をθとする。ここで、左右のスピーカ151L,151Rから同じ音声信号を、音圧バランスを変えて出力した場合、その出力音声によって生じる合成音像152の方向は、音圧バランスを表す前述のパラメータαを用いて次の式で近似できることが一般的に知られている(以下、立体音響におけるサインの法則と呼ぶ)。
ここで、2chステレオの音声信号を波面合成再生方式で再生できるようにするために、図12に示す音声信号分離抽出部121が2chの信号を複数チャネルの信号に変換する。例えば変換後のチャネル数を5つとした場合、それを図16で示す位置関係160のように、波面合成再生方式における仮想音源162a〜162eと見做し、スピーカ群(スピーカアレイ)161の後方に配置する。なお、仮想音源162a〜162eにおける隣り合う仮想音源との間隔は均等とする。したがって、ここでの変換は、2chの音声信号を仮想音源数の音声信号に変換することになる。既に説明したように、音声信号分離抽出部121は、まず2chの音声信号を、小帯域毎に1つの相関信号と2つの無相関信号に分離する。音声信号分離抽出部121では、さらにそれらの信号をどのように仮想音源数の仮想音源(ここでは5つの仮想音源)に割り当てるかを事前に決めておかなければならない。なお、割り当ての方法については複数の方法の中からユーザ設定可能にしておいてもよいし、仮想音源数に応じて選択可能な方法を変えてユーザに提示するようにしてもよい。
割り当て方法の1つの例として、次のような方法を採る。それは、まず、左右の無相関信号については、5つの仮想音源の両端(仮想音源162a,162e)にそれぞれ割り当てる。次に、相関信号によって生じる合成音像については、5つのうちの隣接する2つの仮想音源に割り当てる。隣接するどの2つの仮想音源に割り当てるかについては、まず、前提として、相関信号によって生じる合成音像が5つの仮想音源の両端(仮想音源162a,162e)より内側になるものとし、すなわち、2chステレオ再生時の2つのスピーカによってなす見開き角内におさまるように5つの仮想音源162a〜162eを配置するものとする。そして、合成音像の推定方向から、その合成音像を挟むような隣接する2つの仮想音源を決定し、その2つの仮想音源への音圧バランスの割り当てを調整して、その2つの仮想音源によって合成音像を生じさせるように再生する、という割り当て方法を採る。
そこで、図17で示す位置関係170のように、受聴者173から両端の仮想音源162a,162eの中点にひいた線と、端の仮想音源162eにひいた線とがなす見開き角をθ′0、受聴者173から合成音像171にひいた線とがなす見開き角をθ′とする。さらに、受聴者173から合成音像171を挟む2つの仮想音源162c,162dの中点にひいた線と、受聴者173から両端の仮想音源162a,162eの中点にひいた線(受聴者173から仮想音源162cにひいた線)とがなす見開き角をφ0、受聴者173から合成音像171にひいた線とがなす見開き角をφとする。ここで、φ0は正の実数である。数式(36)で説明したようにして方向を推定した図15の合成音像152(図17における合成音像171に対応)を、これらの変数を用いて仮想音源に割り当てる方法について説明する。
まず、見開き角の差によるスケーリングを次の式のように行う。
θ′=(θ′0/θ0)θ (37)
これにより、仮想音源の配置による見開き角の差異が考慮されることになる。ただし、θ′0とθ0の値は、音声データ再生装置のシステム実装時に調整すればよく、またθ′0とθ0の値を等しくしなくても特に問題は生じないため、この例では、θ0=π/6[rad]、θ′0=π/4[rad]として説明する。
θ′=(θ′0/θ0)θ (37)
これにより、仮想音源の配置による見開き角の差異が考慮されることになる。ただし、θ′0とθ0の値は、音声データ再生装置のシステム実装時に調整すればよく、またθ′0とθ0の値を等しくしなくても特に問題は生じないため、この例では、θ0=π/6[rad]、θ′0=π/4[rad]として説明する。
次に、i番目の合成音像の方向θ(i)が数式(36)によって推定され、例えばθ(i)=π/15[rad]であったとすると、数式(37)よりθ′(i)=π/10[rad]となる。そして、仮想音源が5つの場合、図17に示すように合成音像171は左から数えて3番目の仮想音源162cと4番目の仮想音源162dの間に位置することになる。また、仮想音源が5つである場合、3番目の仮想音源162cと4番目の仮想音源162dの間について、θ′0=π/4[rad]より、φ0≒0.078[rad]となり、i番目の小帯域におけるφをφ(i)とすると、φ(i)=θ′(i)−φ0≒0.022π[rad]となる。このようにして、各小帯域における相関信号によって生じる合成音像の方向を、それを挟む2つの仮想音源の方向からの相対的な角度で表す。そして上述したように、その2つの仮想音源162c,162dでその合成音像を生じさせることを考える。そのためには、2つの仮想音源162c,162dからの出力音声信号の音圧バランスを調整すればよく、その調整方法については、再び数式(36)として利用した立体音響におけるサインの法則を用いる。
ここで、i番目の小帯域における相関信号によって生じる合成音像を挟む2つの仮想音源162c,162dのうち、3番目の仮想音源162cに対するスケーリング係数をg1、4番目の仮想音源162dに対するスケーリング係数をg2とすると、3番目の仮想音源162cからはg1・est′(S(i)(k))、4番目の仮想音源162dからはg2・est′(S(i)(k))の音声信号を出力することになる。そして、g1、g2は立体音響におけるサインの法則により、
を満たせばよい。
一方、3番目の仮想音源162cと4番目の仮想音源162dからの電力の合計が、元の2chステレオの相関信号の電力と等しくなるようにg1、g2を正規化すると、
g1 2+g2 2=1+[α(i)]2 (39)
となる。
g1 2+g2 2=1+[α(i)]2 (39)
となる。
これらを連立させることで、
と求められる。この数式(40)に上述のφ(i)、φ0を代入することによって、g1、g2を算出する。このようにして算出したスケーリング係数に基づき、上述したように3番目の仮想音源162cにはg1・est′(S(i)(k))の音声信号を、4番目の仮想音源162dからはg2・est′(S(i)(k))の音声信号を割り当てる。そして、これも上述したように、無相関信号は両端の仮想音源162a,162eに割り当てられる。すなわち、1番目の仮想音源162aにはest′(NL (i)(k))を、5番目の仮想音源162eにはest′(NR (i)(k))を割り当てる。
この例とは異なり、もし合成音像の推定方向が1番目と2番目の仮想音源の間であった場合には、1番目の仮想音源にはg1・est′(S(i)(k))とest′(NL (i)(k))の両方が割り当てられることになる。また、もし合成音像の推定方向が4番目と5番目の仮想音源の間であった場合には、5番目の仮想音源にはg2・est′(S(i)(k))とest′(NR (i)(k))の両方が割り当てられることになる。
以上のようにして、ステップS138における、i番目の小帯域についての左右チャネルの相関信号と無相関信号の割り当てが行われる。これをステップS134a,S134bのループにより全ての小帯域について行う。その結果、仮想音源の数をJとすると、各仮想音源(出力チャネル)に対する周波数領域の出力音声信号Y1(k),・・・,YJ(k)が求まる。
そして、得られた各出力チャネルについて、ステップS140〜S142の処理を実行する(ステップS139a,S139b)。以下、ステップS140〜S142の処理について説明する。
まず、各出力チャネルを離散フーリエ逆変換することによって、時間領域の出力音声信号y′j(m)を求める(ステップS140)。ここで、DFT−1は離散フーリエ逆変換を表す。
y′j(m)=DFT−1(Yj(k)) (1≦j≦J) (41)
ここで、数式(3)で説明したように、離散フーリエ変換した信号は、窓関数乗算後の信号であったため、逆変換して得られた信号y′j(m)も窓関数が乗算された状態となっている。窓関数は数式(1)に示すような関数であり、読み込みは半セグメント長ずつずらしながら行ったため、前述した通り、1つ前に処理したセグメントの先頭から半セグメント長ずつずらしながら出力バッファに加算していくことにより変換後のデータを得る。
y′j(m)=DFT−1(Yj(k)) (1≦j≦J) (41)
ここで、数式(3)で説明したように、離散フーリエ変換した信号は、窓関数乗算後の信号であったため、逆変換して得られた信号y′j(m)も窓関数が乗算された状態となっている。窓関数は数式(1)に示すような関数であり、読み込みは半セグメント長ずつずらしながら行ったため、前述した通り、1つ前に処理したセグメントの先頭から半セグメント長ずつずらしながら出力バッファに加算していくことにより変換後のデータを得る。
しかし、このままでは、従来技術として上述した通り、図10の中央付近101で示すような不連続点が変換後のデータに多数含まれてしまい、それらが再生時にノイズとなって知覚される。このような不連続点は、直流成分の線スペクトルを考慮しないことによるものであることは前述した通りである。図18はそれを模式的に示した波形のグラフである。より詳細には、図18は、左右チャネルの音声信号を離散フーリエ変換し左右チャネルの直流成分を無視した場合に、離散フーリエ逆変換後のセグメント境界に生じる波形の不連続点を説明するための模式図である。図18に示すグラフ180において、横軸は時間を表しており、例えば(0)(l)という記号は、l番目のセグメントの1番目の標本点であることを示し、(M−1)(l)という記号は、l番目のセグメントのM番目の標本点であることを示している。グラフ180の縦軸は、それらの標本点に対する出力信号の値である。このグラフ180から分かるように、(l−1)番目のセグメントの最後からl番目のセグメントの最初にかけての部分で不連続点が生じてしまう。
図18で説明したような問題を解決するために、本発明に係る音声信号変換装置は、次のように構成する。すなわち、本発明に係る音声信号変換装置は、変換部、相関信号抽出部、逆変換部、及び除去部を備える。変換部は、2つのチャネルの入力音声信号に離散フーリエ変換を施す。相関信号抽出部は、変換部で離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する。つまり、抽出部は、2つのチャネルの入力音声信号の相関信号を抽出する。逆変換部は、(a1)相関信号抽出部で抽出された相関信号に対して、または(a2)その相関信号及び無相関信号(その相関信号を除く信号)に対して、もしくは(b1)その相関信号から生成された音声信号、または(b2)その相関信号及びその無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す。なお、ここでの例では、逆変換部が上記(b2)の音声信号の例である、波面合成再生方式用の仮想音源への割り当て後の音声信号に対して、不連続点を除去した例を挙げているが、これに限らない。例えば、上記(a1)または(a2)の例である仮想音源への割り当て前の音声信号に対して、すなわち抽出された相関信号または抽出された相関信号及び無相関信号に対して、不連続点を除去し、その後、割り当てを行うようにしてもよい。
そして、除去部は、逆変換部で離散フーリエ逆変換後の音声信号から波形の不連続点を除去する。つまり、除去部では、相関信号またはそれから生成された音声信号について、離散フーリエ逆変換した後の信号から波形の不連続点を除去する。
図12における音声信号処理部113の例では、上述の変換部、相関信号抽出部、及び逆変換部は音声信号分離抽出部121に含まれることになり、上述の除去部は雑音除去部122で例示できる。
図12における音声信号処理部113の例では、上述の変換部、相関信号抽出部、及び逆変換部は音声信号分離抽出部121に含まれることになり、上述の除去部は雑音除去部122で例示できる。
図19及び図20を併せて参照し、図18で説明したような問題を解決するための、このような不連続点除去処理について具体的に説明する。図19は、本発明に係る不連続点除去処理を施す離散フーリエ逆変換後のセグメントを示す図である。また、図20は、本発明に係る不連続点除去処理の一例を説明するための模式図で、左右チャネルの音声信号を離散フーリエ変換し左右チャネルの直流成分を無視した場合に、離散フーリエ逆変換後のセグメント境界に生じる波形の不連続点を除去する方法を説明するための模式図である。
本発明における不連続点除去処理では、離散フーリエ逆変換後のセグメント(処理セグメント)の波形の最初の値と、波形の最後の値との平均値を、波形の各値から減算する。これは、前述した通り、離散フーリエ変換を行う前にHann窓を演算していることに起因している。すなわち、Hann窓の両端点の値は0であるため、もし離散フーリエ変換後、どのスペクトル成分も値を変更せず、再び離散フーリエ逆変換を行えば、そのセグメントの両端点は0となり、セグメント間の不連続点は発生しない。しかし実際は、離散フーリエ変換後の周波数領域において、上述したように各スペクトル成分を変更するため、離散フーリエ逆変換後のセグメントの両端点は0とならず、セグメント間の不連続点が発生する。
したがって、その両端点を0に近づけるため、それら両端点の値の平均値を直流成分(バイアス成分)として、セグメント内の全ての値から減算することにより、不連続点の発生を抑制する。図20で示す出力音声信号y′j(0),・・・,y′j(M−1)でなるセグメント200で説明すると、両端点は出力音声信号y′j(0),y′j(M−1)であるため、そのような減算の結果、処理後の出力音声信号y″j(m)は、下の数式(42)のようになる。
y″j(m)=y′j(m)−(y′j(0)+y′j(M−1))/2 (42)
y″j(m)=y′j(m)−(y′j(0)+y′j(M−1))/2 (42)
このような処理を行うことにより、不連続点に伴うノイズが発生しないようになり、高品質な音声再生が可能となる。図18のグラフ180に対する除去例で説明すると、グラフ180におけるl番目のセグメントについて、両端点の平均値は{ol(0)+ol(M−1)}/2であり、数式(42)に基づきこの平均値だけl番目のセグメントの各値から減算すると、グラフ200で示すようになる。グラフ200では、(M−1)(l−1)と(0)(l)との境界のノイズが除去されている(傾き[微分値]が一致するようになる)のが分かる。
なお、グラフ180,200では、l番目のセグメントについて説明したような処理が(l−1)番目のセグメントについても既に施された結果を示している。また、図示しない(l+1)番目のセグメントについても同様の不連続点除去処理を施す。このように、本発明に係る不連続点除去処理では、全てのセグメントに対して、セグメント毎に、セグメントから算出した平均値をセグメントの各値から減算する。
また、数式(42)では、バイアスを両端点の平均値としたが、数式(43)のようにバイアスを両端n点ずつの平均値としてもよい。
y″j(m)=y′j(m)−(Σny′j(n)+Σny′j(M−n))/2n
(43)
あるいは、セグメント内の任意の複数点の平均値でもよい。あるいは、セグメント内の任意の1点の値そのものでもよい。なお、その1点は右端点から何番目の点であるなどと予め決めておけばよい。さらには、全点の値の平均値を採用することもできる。また、いずれの応用例についても、図18のグラフ180に対しては図20のグラフ200と類似したノイズ除去結果が得られる。
y″j(m)=y′j(m)−(Σny′j(n)+Σny′j(M−n))/2n
(43)
あるいは、セグメント内の任意の複数点の平均値でもよい。あるいは、セグメント内の任意の1点の値そのものでもよい。なお、その1点は右端点から何番目の点であるなどと予め決めておけばよい。さらには、全点の値の平均値を採用することもできる。また、いずれの応用例についても、図18のグラフ180に対しては図20のグラフ200と類似したノイズ除去結果が得られる。
このように、本発明に係る不連続点除去処理では、離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、その処理セグメント内の各値から減算することで、離散フーリエ逆変換後の音声信号から波形の不連続点を除去する。そのため、本発明によれば、2chや5.1ch等のマルチチャネル方式用の音声信号を、不連続点に起因するノイズを発生させることなく、波面合成再生方式で再生させるための音声信号に変換することが可能になる。そして、それにより、波面合成再生方式の特長である、どの位置の受聴者に対してもコンテンツ製作者の意図通りの音像定位を提供するという効果を享受できる。
また、雑音除去部122で処理対象となる離散フーリエ逆変換後の音声信号は、各数式で例示したように、相関信号または相関信号及び無相関信号に対して、時間領域あるいは周波数領域においてスケーリング処理を行い、そのスケーリング処理後の音声信号としてもよい。つまり、相関信号や無相関信号に対しスケーリング処理を施し、スケーリング処理後の相関信号や無相関信号に対し、不連続点の除去を行うようにしてもよい。
数式(42)で説明した不連続点除去処理の効果について図9と比較しながら説明する。図21は、図9の音楽コンテンツ(変換後)のうち1つのチャネルの音声信号の一部を拡大した図で、図10の音声信号に本発明に係る不連続点除去処理を施した例を説明するための図である。
図8に示す音楽コンテンツ80が入力音声信号である場合、数式(42)で示す不連続点除去処理(ノイズ除去処理)により、図10のチャネルの音声信号の不連続点の箇所(中央付近101)は、図21の音声信号210で示すように、不連続点が解消され連続になる。本発明の不連続点除去処理を施すことで、このようにして、不連続点を無くしノイズを除去することができる。無論、他のチャネルについても不連続点の箇所を同様に処理できる。なお、図21は数式(42)で説明した好ましい不連続点除去処理を適用した場合の結果として説明したが、数式(43)のような処理や他の例として説明した処理も、多少の違いはあるものの同様に音声信号210で示すように連続な音声信号になる。
以上、本発明に係る音声信号変換処理について、入力音声信号が2chの音声信号である例を挙げて説明したが、次に他のマルチチャネルの音声信号であっても適用可能であることを説明する。ここでは、図22を参照しながら5.1chの入力音声信号を例に挙げるが、他のマルチチャネルの入力音声信号についても同様に適用できる。
図22は、5.1chの音声信号を波面合成再生方式で再生する際に、使用するスピーカ群と仮想音源との位置関係の例を説明するための模式図である。5.1chの入力音声に本発明に係る音声信号変換処理を適用することを考える。5.1chのスピーカの配置方法については一般的に図2のように配置されることが多く、受聴者の前方には3つのスピーカ21L、22C,21Rが並んでいる。そして、映画などのコンテンツでは特に、前方中央のいわゆるセンターチャネルは人の台詞音声などの用途で使用されることが多い。つまり、センターチャネルと左チャネル、あるいはセンターチャネルと右チャネルの間で合成音像を生じさせるような音圧制御がされている箇所はあまり多くない。
この性質を利用して、図22で示す位置関係220のように、5.1chの前方左右のスピーカ222a,222cへの入力音声信号を本方式(本発明に係る音声信号変換処理)によって変換し、例えば5つの仮想音源223a〜223eに割り当てた後、真ん中の仮想音源223cにセンターチャネル(センタースピーカ用のチャネル)の音声信号を加算する。そのようにして、出力音声信号を仮想音源に対する音像として波面合成再生方式でスピーカアレイ221により再生する。そして後方左右のチャネル用の入力音声信号については、後方に5.1chと同じくスピーカ222d,222eを設置し、そこから何も手を加えずに出力するなどすればよい。
このように、マルチチャネルの入力音声信号が3つ以上のチャネルの入力音声信号であることを前提とし、マルチチャネルの入力音声信号のうちいずれか2つの入力音声信号に対して、本発明に係る上述のような音声信号変換処理を行って、波面合成再生方式で再生させるための音声信号を生成し、生成された音声信号に残りのチャネルの入力音声信号を加算して出力するようにしてもよい。この加算は、例えば音声出力信号生成部123において加算部を設けておけば済む。
次に、本発明の実装について簡単に説明する。本発明は、例えばテレビなど映像の伴う装置に利用できる。本発明を適用可能な装置の様々な例について、図23〜図29を参照しながら説明する。図23〜図25は、それぞれ図11の音声データ再生装置を備えたテレビ装置の構成例を示す図で、図26及び図27は、それぞれ図11の音声データ再生装置を備えた映像投影システムの構成例を示す図、図28は、図11の音声データ再生装置を備えたテレビボードとテレビ装置とでなるシステムの構成例を示す図、図29は、図11の音声データ再生装置を備えた自動車の例を示す図である。なお、図23〜図29のいずれにおいても、スピーカアレイとしてLSP1〜LSP8で示す8個のスピーカを配列した例を挙げているが、スピーカの数は複数であればよい。
本発明に係る音声信号変換装置やそれを備えた音声データ再生装置はテレビ装置に利用できる。テレビ装置におけるこれらの装置の配置は自由に決めればよい。図23で示すテレビ装置230のように、テレビ画面231の下方に、音声データ再生装置におけるスピーカLSP1〜LSP8を直線状に並べたスピーカ群232を設けてもよい。図24で示すテレビ装置240のように、テレビ画面241の上方に、音声データ再生装置におけるスピーカLSP1〜LSP8を直線状に並べたスピーカ群242を設けてもよい。図25で示すテレビ装置250のように、テレビ画面251に、音声データ再生装置における透明のフィルム型スピーカLSP1〜LSP8を直線状に並べたスピーカ群252を埋め込んでもよい。
また、本発明に係る音声信号変換装置やそれを備えた音声データ再生装置は、映像投影システムに利用できる。図26で示す映像投影システム260のように、映像投射装置261aで映像を投射する投射用スクリーン261bに、スピーカLSP1〜LSP8のスピーカ群262を埋め込むようにしてもよい。図27で示す映像投影システム270のように、映像投射装置271aで映像を投射する音透過型のスクリーン271bの後ろに、スピーカLSP1〜LSP8を並べたスピーカ群272を配置してもよい。そのほか、本発明に係る音声信号変換装置やそれを備えた音声データ再生装置は、テレビ台(テレビボード)に埋め込むこともできる。図28で示すシステム(ホームシアターシステム)280のように、テレビ装置281を搭載するためのテレビ台282aにスピーカLSP1〜LSP8を並べたスピーカ群282bを埋め込むようにしてもよい。さらに、本発明に係る音声信号変換装置やそれを備えた音声データ再生装置は、カーオーディオに適用することもできる。図29で示す自動車290のように、車内のダッシュボードにスピーカLSP1〜LSP8を曲線状に並べたスピーカ群292を埋め込むようにしてもよい。
また、図23〜図29を参照して説明したような装置などに本発明に係る音声信号変換処理を適用した際、受聴者はこの変換処理(図11や図12の音声信号処理部113における処理)を行うか行わないかについて、装置本体に備えられたボタン操作やあるいはリモートコントローラ操作などでなされたユーザ操作により切り替える切替部を設けることもできる。この変換処理を行わない場合、2ch音声データの再生には、図6に示したように仮想音源を配置して波面合成再生方式で再生してもよい。あるいは図30に示す位置関係300のように、アレイスピーカ301の両端のスピーカ301L,301Rのみを用いて再生してもよい。5.1ch音声データについても同様に、3つの仮想音源に割り当ててもよいし、あるいは両端と真ん中の1つか2つのスピーカのみを用いて再生してもよい。
また、本発明で適用可能な波面合成再生方式としては、上述したようにスピーカアレイ(複数のスピーカ)を備えて仮想音源に対する音像としてそれらのスピーカから出力するようにする方式であればよく、非特許文献1に記載のWFS方式の他、人間の音像知覚に関する現象としての先行音効果(ハース効果)を利用した方式など様々な方式が挙げられる。ここで、先行音効果とは、同一の音声を複数の音源から再生し、音源それぞれから聴取者に到達する各音声に小さな時間差がある場合、先行して到達した音声の音源方向に音像が定位する効果を指し示したものである。この効果を利用すれば、仮想音源位置に音像を知覚させることが可能となる。ただし、その効果だけで音像を明確に知覚させることは難しい。ここで、人間は音圧を最も高く感じる方向に音像を知覚するという性質も持ち合わせている。したがって、音声データ再生装置において、上述の先行音効果と、この最大音圧方向知覚の効果とを組み合わせ、これにより、少ない数のスピーカでも仮想音源の方向に音像を知覚させることが可能になる。
以上、本発明に係る音声信号変換装置が、マルチチャネル方式用の音声信号に対して波面合成再生方式で再生させるための音声信号に変換することを前提にして説明したが、本発明は、同じくマルチチャネル方式用(チャネル数は同じでも異なってもよい)の音声信号に変換する場合などにも同様に適用できる。変換後の音声信号としては、配置は問わないが少なくとも複数のスピーカからなるスピーカ群によって再生させるための音声信号であればよい。それは、このような変換の場合にも上述のような離散フーリエ変換・逆変換を施し且つ相関信号を得るために直流成分を無視することがあるためである。このように変換された音声信号の再生方法としては、例えば1つ1つの仮想音源用に抽出した信号に対し、それぞれ1つずつスピーカを対応させて波面合成再生方式ではなく普通に出力再生させることが考えられる。さらに、両側の無相関信号はそれぞれ別の、側方や後方に設置するスピーカに割り当てるような再生方法など、様々な再生方法が考えられる。
また、例えば図12で例示した音声信号処理部113における各構成要素など、本発明に係る音声信号変換装置の各構成要素やその装置を備えた音声データ再生装置の各構成要素は、例えばマイクロプロセッサ(またはDSP:Digital Signal Processor)、メモリ、バス、インターフェイス、周辺装置などのハードウェアと、これらのハードウェア上にて実行可能なソフトウェアとにより実現できる。上記ハードウェアの一部または全部は集積回路/IC(Integrated Circuit)チップセットとして搭載することができ、その場合、上記ソフトウェアは上記メモリに記憶しておければよい。また、本発明の各構成要素の全てをハードウェアで構成してもよく、その場合についても同様に、そのハードウェアの一部または全部を集積回路/ICチップセットとして搭載することも可能である。
また、上述した様々な構成例における機能を実現するためのソフトウェアのプログラムコードを記録した記録媒体を、音声信号変換装置となる汎用コンピュータ等の装置に供給し、その装置内のマイクロプロセッサまたはDSPによりプログラムコードが実行されることによっても、本発明の目的が達成される。この場合、ソフトウェアのプログラムコード自体が上述した様々な構成例の機能を実現することになり、このプログラムコード自体や、プログラムコードを記録した記録媒体(外部記録媒体や内部記憶装置)であっても、そのコードを制御側が読み出して実行することで、本発明を構成することができる。外部記録媒体としては、例えばCD−ROMまたはDVD−ROMなどの光ディスクやメモリカード等の不揮発性の半導体メモリなど、様々なものがが挙げられる。内部記憶装置としては、ハードディスクや半導体メモリなど様々なものが挙げられる。また、プログラムコードはインターネットからダウンロードして実行することや、放送波から受信して実行することもできる。
以上、本発明に係る音声信号変換装置について説明したが、処理の流れをフロー図で例示したように、本発明は、マルチチャネルの入力音声信号をスピーカ群によって再生させるための音声信号に変換する音声信号変換方法としての形態も採り得る。
この音声信号変換方法は、次の変換ステップ、抽出ステップ、逆変換ステップ、及び除去ステップを有する。変換ステップは、変換部が、2つのチャネルの入力音声信号に離散フーリエ変換を施すステップである。抽出ステップは、相関信号抽出部が、変換ステップで離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出するステップである。逆変換ステップは、逆変換部が、抽出ステップで抽出された相関信号または相関信号及び無相関信号に対して、もしくは相関信号から生成された音声信号に対して、もしくは相関信号及び無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施すステップである。除去ステップは、除去部が、逆変換ステップで離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、その処理セグメント内の各値から減算することで、離散フーリエ逆変換後の音声信号から波形の不連続点を除去するステップである。その他の応用例については、音声信号変換装置について説明した通りであり、その説明を省略する。
なお、上記プログラムコード自体は、換言すると、この音声信号変換方法をコンピュータに実行させるためのプログラムである。すなわち、このプログラムは、コンピュータに、2つのチャネルの入力音声信号に離散フーリエ変換を施す変換ステップと、変換ステップで離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する抽出ステップと、抽出ステップで抽出された相関信号または相関信号及び無相関信号に対して、もしくは相関信号から生成された音声信号に対して、もしくは相関信号及び無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換ステップと、逆変換ステップで離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、その処理セグメント内の各値から減算することで、離散フーリエ逆変換後の音声信号から波形の不連続点を除去する除去ステップと、を実行させるためのプログラムである。
110…音声データ再生装置、111…デコーダ、112…音声信号抽出部、113…音声信号処理部、114…D/Aコンバータ、115…増幅器、116…スピーカ、121…音声信号分離抽出部、122…雑音除去部、123…音声出力信号生成部。
Claims (9)
- マルチチャネルの入力音声信号を、スピーカ群によって再生させるための音声信号に変換する音声信号変換装置であって、
2つのチャネルの入力音声信号に離散フーリエ変換を施す変換部と、
該変換部で離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する相関信号抽出部と、
該相関信号抽出部で抽出された相関信号または該相関信号及び無相関信号に対して、もしくは前記相関信号から生成された音声信号に対して、もしくは前記相関信号及び前記無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換部と、
該逆変換部で離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、該処理セグメント内の各値から減算することで、前記離散フーリエ逆変換後の音声信号から波形の不連続点を除去する除去部と、
を備えたことを特徴とする音声信号変換装置。 - 前記平均値は、前記処理セグメントの少なくとも両端点の値を平均した値であることを特徴とする請求項1に記載の音声信号変換装置。
- 前記マルチチャネルの入力音声信号は3つ以上のチャネルの入力音声信号とし、前記マルチチャネルの入力音声信号のうちいずれか2つの入力音声信号に対して、前記変換部、前記相関信号抽出部、前記逆変換部、及び前記除去部により前記不連続点の除去を行って、前記スピーカ群によって再生させるための音声信号を生成し、
前記音声信号変換装置は、生成された音声信号に残りのチャネルの入力音声信号を加算する加算部をさらに備えたことを特徴とする請求項1または2に記載の音声信号変換装置。 - 前記マルチチャネルの入力音声信号を含むディジタルコンテンツを入力するディジタルコンテンツ入力部と、ディジタルコンテンツを復号化するデコーダ部と、該デコーダ部で復号化したディジタルコンテンツから音声信号を分離する音声信号抽出部と、該音声信号抽出部で抽出した音声信号から、3チャネル以上で且つ前記入力音声信号とは異なるマルチチャネルの音声信号に変換する音声信号処理部とをさらに備え、該音声信号処理部は、前記変換部、前記相関信号抽出部、前記逆変換部、及び前記除去部を備えることを特徴とする請求項1〜3のいずれか1項に記載の音声信号変換装置。
- 前記ディジタルコンテンツ入力部は、ディジタルコンテンツを格納する記録媒体、ネットワークを介してディジタルコンテンツを配信するサーバまたはディジタルコンテンツを放送する放送局からディジタルコンテンツを入力することを特徴とする請求項4に記載の音声信号変換装置。
- 前記変換部、前記相関信号抽出部、前記逆変換部、及び前記除去部を備えた音声信号処理部における処理を実行するか否かを、ユーザ操作に応じて切り替える切替部をさらに備えたことを特徴とする請求項1〜5のいずれか1項に記載の音声信号変換装置。
- マルチチャネルの入力音声信号を、スピーカ群によって再生させるための音声信号に変換する音声信号変換方法であって、
変換部が、2つのチャネルの入力音声信号に離散フーリエ変換を施す変換ステップと、
相関信号抽出部が、前記変換ステップで離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する抽出ステップと、
逆変換部が、前記抽出ステップで抽出された相関信号または該相関信号及び無相関信号に対して、もしくは前記相関信号から生成された音声信号に対して、もしくは前記相関信号及び前記無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換ステップと、
除去部が、前記逆変換ステップで離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、該処理セグメント内の各値から減算することで、前記離散フーリエ逆変換後の音声信号から波形の不連続点を除去する除去ステップと、
を有することを特徴とする音声信号変換方法。 - コンピュータに、
2つのチャネルの入力音声信号に離散フーリエ変換を施す変換ステップと、
該変換ステップで離散フーリエ変換後の2つのチャネルの音声信号について、直流成分を無視して相関信号を抽出する抽出ステップと、
該抽出ステップで抽出された相関信号または該相関信号及び無相関信号に対して、もしくは前記相関信号から生成された音声信号に対して、もしくは前記相関信号及び前記無相関信号から生成された音声信号に対して、離散フーリエ逆変換を施す逆変換ステップと、
該逆変換ステップで離散フーリエ逆変換後の音声信号における処理セグメント内の1点の値または複数点の値の平均値を、該処理セグメント内の各値から減算することで、前記離散フーリエ逆変換後の音声信号から波形の不連続点を除去する除去ステップと、を実行させるためのプログラム。 - 請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011191263A JP2013055439A (ja) | 2011-09-02 | 2011-09-02 | 音声信号変換装置、方法、プログラム、及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011191263A JP2013055439A (ja) | 2011-09-02 | 2011-09-02 | 音声信号変換装置、方法、プログラム、及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013055439A true JP2013055439A (ja) | 2013-03-21 |
Family
ID=48132079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011191263A Withdrawn JP2013055439A (ja) | 2011-09-02 | 2011-09-02 | 音声信号変換装置、方法、プログラム、及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013055439A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10547962B2 (en) | 2015-12-21 | 2020-01-28 | Sharp Kabushiki Kaisha | Speaker arranged position presenting apparatus |
US10869151B2 (en) | 2016-05-31 | 2020-12-15 | Sharp Kabushiki Kaisha | Speaker system, audio signal rendering apparatus, and program |
US10999678B2 (en) | 2017-03-24 | 2021-05-04 | Sharp Kabushiki Kaisha | Audio signal processing device and audio signal processing system |
-
2011
- 2011-09-02 JP JP2011191263A patent/JP2013055439A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10547962B2 (en) | 2015-12-21 | 2020-01-28 | Sharp Kabushiki Kaisha | Speaker arranged position presenting apparatus |
US10869151B2 (en) | 2016-05-31 | 2020-12-15 | Sharp Kabushiki Kaisha | Speaker system, audio signal rendering apparatus, and program |
US10999678B2 (en) | 2017-03-24 | 2021-05-04 | Sharp Kabushiki Kaisha | Audio signal processing device and audio signal processing system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5149968B2 (ja) | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 | |
JP6198800B2 (ja) | 少なくとも2つの出力チャネルを有する出力信号を生成するための装置および方法 | |
US8019093B2 (en) | Stream segregation for stereo signals | |
KR101341523B1 (ko) | 스테레오 신호들로부터 멀티 채널 오디오 신호들을생성하는 방법 | |
US7567845B1 (en) | Ambience generation for stereo signals | |
JP5957446B2 (ja) | 音響処理システム及び方法 | |
JP6377249B2 (ja) | オーディオ信号の強化のための装置と方法及び音響強化システム | |
US20040212320A1 (en) | Systems and methods of generating control signals | |
JP6284480B2 (ja) | 音声信号再生装置、方法、プログラム、及び記録媒体 | |
EP2484127B1 (en) | Method, computer program and apparatus for processing audio signals | |
JP4810621B1 (ja) | 音声信号変換装置、方法、プログラム、及び記録媒体 | |
JP5307770B2 (ja) | 音声信号処理装置、方法、プログラム、及び記録媒体 | |
JP2013055439A (ja) | 音声信号変換装置、方法、プログラム、及び記録媒体 | |
Gribben et al. | The perception of band-limited decorrelation between vertically oriented loudspeakers | |
JP2011239036A (ja) | 音声信号変換装置、方法、プログラム、及び記録媒体 | |
EP4252432A1 (en) | Systems and methods for audio upmixing | |
WO2013176073A1 (ja) | 音声信号変換装置、方法、プログラム、及び記録媒体 | |
JP6017352B2 (ja) | 音声信号変換装置及び方法 | |
JP2014239269A (ja) | 音声信号再生装置及び方法 | |
US11470438B2 (en) | Audio signal processor, system and methods distributing an ambient signal to a plurality of ambient signal channels | |
JP2015065551A (ja) | 音声再生システム | |
JP2023548570A (ja) | オーディオシステムの高さチャネルアップミキシング |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20141104 |