JP2008219562A - 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム - Google Patents

音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム Download PDF

Info

Publication number
JP2008219562A
JP2008219562A JP2007055426A JP2007055426A JP2008219562A JP 2008219562 A JP2008219562 A JP 2008219562A JP 2007055426 A JP2007055426 A JP 2007055426A JP 2007055426 A JP2007055426 A JP 2007055426A JP 2008219562 A JP2008219562 A JP 2008219562A
Authority
JP
Japan
Prior art keywords
sound source
virtual
sound
straight line
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007055426A
Other languages
English (en)
Inventor
Masami Miura
雅美 三浦
Susumu Yabe
進 矢部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007055426A priority Critical patent/JP2008219562A/ja
Publication of JP2008219562A publication Critical patent/JP2008219562A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 最適な音場を形成することが可能な音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラムを提供すること。
【解決手段】 音声情報および音源位置情報から波面合成によって形成される仮想音源の中に、仮想音源と前記想定受聴領域とを結んだ直線状にアレイスピーカが存在しない陰になる仮想音源が存在するときに、変換後の変換仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように前記陰になる仮想音源の変換処理を行う変換部140と;音声情報および音源位置情報と、変換部140での変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成部130と;を含むことを特徴とする、音声信号生成装置115が提供される。
【選択図】図1

Description

本発明は、音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラムに関する。
臨場感のある音を再生するために、複数のスピーカを用いて多チャンネルの音声信号を再生するステレオ再生システムが広く知られている。例えば、5.1チャンネルサラウンドシステムは、5つのスピーカと1つのサブウーファースピーカを用いて音の再生を行う。ITU−R BS775(International Telecommunication Union Radiocommunications Sector)の規定に従ってスピーカを配置し、それぞれのチャンネルに対応するスピーカから異なる音波が出力され、それを受聴者が耳にすることによって、受聴者は臨場感のある音を楽しむことができる。
5.1チャンネルサラウンドシステムのようなステレオ再生システムは、所定の受聴位置においては、目的となる音像定位を得ることができる。しかし、このようなステレオ再生システムは、目的となる音像定位を得られる範囲が狭いため、所定の受聴位置以外の場所においては、受聴者が耳にする再生音が、所定の受聴位置で耳にする再生音と比較して大きく異なってしまう。
そこで、本来の音源が存在した音場そのものを、空間に物理的に再現することを目的とするマルチチャンネルオーディオシステムがある。マルチチャンネルオーディオシステムは、音場合成技術である波面合成技術を用いるものであり、複数のスピーカからなるアレイスピーカから音波が出力される。出力される音波は、干渉のない波となって受聴者に伝わる。その音波を受聴者が耳にすることによって、受聴者は臨場感のある音を楽しむことができる。
図23は、音源からの波面を模式的に表している説明図である。図23の(a)は1つの音源(スピーカ)から音声を出力する際の波面を模式的に表し、図23の(b)はマルチチャンネルオーディオシステムで音声を出力する際の波面を模式的に表している。図23の(b)に示したように、個々のスピーカから放射される音声のタイミングとレベルを制御することにより、あたかも1つの音源から音声が発せられているかのような波面を生成することができる。
また、マルチチャンネルオーディオシステムは仮想的に音源を配置し、その配置した音源から音が発せられているものとするように波面を合成することで、受聴者はあたかもその場所から音が発せられているかのように臨場感のある音を楽しむことができる。
このようなマルチチャンネルオーディオシステムは、ステレオ再生システムに比べて目的となる音像定位を得られる範囲が広い。そのため、広い室内において、より多くの受聴者が臨場感のある音を楽しむことができる。
図24は、波面合成によって2つの音源からの波面を再現する場合について説明する説明図である。図24に示したように、波面合成技術を用いることによって音場の任意の位置から発せられる波面を、アレイスピーカから発する音声によって再現することができる。
波面合成技術を用いれば、上述のように音場の任意の位置から発せられる波面を再現することができるため、受聴者はより臨場感のある音場を楽しむことができる。図25は、ステレオ方式とマルチチャンネルオーディオシステムとによる受聴イメージの違いについて説明する説明図である。図25の(a)はステレオ方式による5つの音源の受聴イメージを示しており、図25の(b)はマルチチャンネルオーディオシステムによる5つの音源の受聴イメージを示している。
図25の(a)に示したように、ステレオ方式によれば、受聴者が左右のスピーカSPL、SPRの中央に位置した場合でなければ所望の音場を再現することができず、しかも音像を左右のスピーカSPL、SPR間のライン上に配置されたものとしてしか音像を得ることができなかった。一方、図25の(b)に示したように、マルチチャンネルオーディオシステムによれば、m個のスピーカSP1、SP2・・・SPmから発せられる音声によって形成される音場は、ステレオ方式の場合よりも広い範囲で所望の音場を再現することができ、さらに、音源を奥行き方向も含めた任意の位置に配置し、音像もそのように知覚させることができる。従って、モニタMOで表示する映像に合わせて音源を任意の位置に配置することで、受聴者はより臨場感のある音場を楽しむことができる。
マルチチャンネルオーディオシステムを用いて音を再生する際には、再生音の基となる音源データに、仮想的に音源を配置する位置情報と、想定しているシステムの構成、例えばアレイスピーカを構成するスピーカの数や想定する受聴者の受聴位置の情報を予め含めておく。そして、マルチチャンネルオーディオシステムにおいて音源データに含まれるそれらの情報に基づいて音の再生を行うことで、臨場感のある音を表現することができる(特許文献1参照)。
特開2006−279555号公報
しかし、マルチチャンネルオーディオシステムにおいては、必ずしも想定しているシステムで音声が再生されるとは限らない。システムによってはアレイスピーカを構成するスピーカの数や、想定する受聴者の受聴位置が異なっている。そのような異なるシステムで音を再生すると、映像や音声(以下、映像や音声を総称して「コンテンツ」とも称する)を制作した制作者の想定通りに音が再生されず、臨場感のある音を再現できないという問題があった。
例えば、コンテンツ制作者が16個のスピーカからなるアレイスピーカで音声を出力することを想定して作られたコンテンツを、12個のスピーカからなるアレイスピーカを有するシステムで再生した場合に、スピーカ4個分の音声が出力されないおそれがある。
想定しているシステムでしか臨場感を再現できないのであれば、互換性が非常に悪くなってしまう。従って、どのような構成のマルチチャンネルオーディオシステムであっても、コンテンツ制作者の想定通りまたは想定したものに近い、臨場感のある音が再現される必要がある。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、マルチチャンネルオーディオシステムがどのような構成を有していても最適な音場を形成することが可能な、新規かつ改良された音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラムを提供することにある。
上記課題を解決するために、本発明のある観点によれば、音声情報および音源位置情報が含まれる音声データを入力し、アレイ状に配されたm個のスピーカからなるアレイスピーカから音を出力することで、仮想空間内に配された仮想音源からなる音場を現実空間の想定受聴者位置が含まれる想定受聴領域に再生するための音声信号を生成する音声信号生成装置であって:音声情報および音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と想定受聴領域とを結んだ直線状にアレイスピーカが存在しない陰になる仮想音源が存在するときに、変換後の仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように陰になる仮想音源の変換処理を行う変換部と;音声情報および音源位置情報と、変換部での変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成部と;を含むことを特徴とする、音声信号生成装置が提供される。
かかる構成によれば、変換部は音声情報および音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と想定受聴領域とを結んだ直線状にアレイスピーカが存在しない陰になる仮想音源が存在するときに、変換後の仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように陰になる仮想音源の変換処理を行い、音声信号生成部は、音声情報および音源位置情報と、変換部での変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成する。その結果、想定受聴領域で聴くことができない仮想音源が含まれるコンテンツを再生する際に、アレイスピーカを窓とみなして、想定受聴領域からその窓を通して仮想音源を見渡せるように仮想音源の変換処理を行うことで、想定受聴領域で仮想音源による音声を聴くことができる。
音声データから音声情報および音源位置情報を抽出する音場情報抽出部をさらに含んでいてもよい。かかる構成によれば、音場情報抽出部は音声データから音声情報および音源位置情報を抽出する。その結果、音声情報および音源位置情報が含まれる音声データを、ネットワークや記録媒体から読み込むことによって、想定受聴領域で仮想音源による音声を聴くことができる。
変換部における変換処理は、仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように、陰になる仮想音源の音声情報および音源位置情報を変換して変換音声情報および変換音源位置情報を生成する処理であり、音声信号生成部は、音源信号抽出部で算出した音声情報および音源位置情報と、変換部で生成した変換音声情報および変換音源位置情報から、仮想音源を形成するためのmチャネルの音声信号を生成してもよい。かかる構成によれば、音声信号生成部は、音源信号抽出部で算出した音声情報および音源位置情報と、変換部で生成した変換音声情報および変換音源位置情報から、仮想音源を形成するためのmチャネルの音声信号を生成する。その結果、アレイスピーカを窓とみなして、想定受聴領域からその窓を通して見渡せる位置に存在しないような仮想音源を、想定受聴領域から見渡すことができるような位置に再配置することによって、想定受聴領域で仮想音源による音声を聴くことができる。
変換部は、陰になる仮想音源に近いアレイスピーカの一番端のスピーカと想定受聴領域とを結んだ直線上に陰になる仮想音源を再配置するように、変換音声情報および変換音源位置情報を生成してもよい。
変換部は、想定スピーカ情報に基づく想定アレイスピーカの、陰になる仮想音源に近い側の一番端のスピーカと想定受聴領域とを結んだ直線を第1の直線、陰になる仮想音源の位置を含みアレイスピーカに平行な直線を第2の直線、アレイスピーカの中心を含むと共にアレイスピーカに対して垂直な直線を第3の直線、アレイスピーカの、変換仮想音源に近い側の一番端のスピーカと想定受聴領域とを結んだ直線を第4の直線としたときに、第1の直線と第2の直線の交点を第1の交点、第2の直線と第3の直線の交点を第2の交点、第2の直線と第4の直線の交点を第3の交点とし、第1の交点と陰になる仮想音源との距離と陰になる仮想音源と第2の交点との距離の比が、第3の交点と変換仮想音源との距離と変換仮想音源と第2の交点との距離の比と等しくなるように、変換音声情報および変換音源位置情報を生成してもよい。
また、上記課題を解決するために、本発明の別の観点によれば、音声情報および音源位置情報が含まれる音声データを入力し、アレイ状に配されたm個のスピーカからなるアレイスピーカから音を出力することで、仮想空間内に配された仮想音源からなる音場を現実空間の想定受聴者位置が含まれる想定受聴領域に対して再生する音場再生装置であって:音声情報および音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在しない陰になる仮想音源が存在するときに、変換後の仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように、陰になる仮想音源の変換処理を行う変換部と;音声情報および音源位置情報と、変換部での変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成部と;mチャネルの音声信号を波面合成し、mチャネルの音声を出力することで、想定受聴領域に音場を再生する音声出力部と;を含むことを特徴とする、音場再生装置が提供される。
かかる構成によれば、変換部は音声情報および音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と想定受聴領域とを結んだ直線状にアレイスピーカが存在しない陰になる仮想音源が存在するときに、変換後の仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように陰になる仮想音源の変換処理を行い、音声信号生成部は、音声情報および音源位置情報と、変換部での変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成し、音声出力部はmチャネルの音声信号を波面合成し、mチャネルの音声を出力することで、想定受聴領域に音場を再生する。その結果、その結果、想定受聴領域で聴くことができない仮想音源が含まれるコンテンツを再生する際に、アレイスピーカを窓とみなして、想定受聴領域からその窓を通して仮想音源を見渡せるように仮想音源の変換処理を行って、アレイスピーカからmチャネルの音声信号を出力することで、想定受聴領域で仮想音源による音声を聴くことができる。
音声データから音声情報および音源位置情報を抽出する音場情報抽出部をさらに含んでいてもよい。
変換部における変換処理は、仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように、陰になる仮想音源の音声情報および音源位置情報を変換して変換音声情報および変換音源位置情報を生成する処理であり、音声信号生成部は、音源信号抽出部で算出した音声情報および音源位置情報と、変換部で生成した変換音声情報および変換音源位置情報から、仮想音源を形成するためのmチャネルの音声信号を生成してもよい。
変換部は、陰になる仮想音源に近いアレイスピーカの一番端のスピーカと想定受聴領域とを結んだ直線上に陰になる仮想音源を再配置するように、変換音声情報および変換音源位置情報を生成してもよい。
変換部は、想定スピーカ情報に基づく想定アレイスピーカの、陰になる仮想音源に近い側の一番端のスピーカと想定受聴領域とを結んだ直線を第1の直線、陰になる仮想音源の位置を含みアレイスピーカに平行な直線を第2の直線、アレイスピーカの中心を含むと共にアレイスピーカに対して垂直な直線を第3の直線、アレイスピーカの、変換仮想音源に近い側の一番端のスピーカと想定受聴領域とを結んだ直線を第4の直線としたときに、第1の直線と第2の直線の交点を第1の交点、第2の直線と第3の直線の交点を第2の交点、第2の直線と第4の直線の交点を第3の交点とし、第1の交点と陰になる仮想音源との距離と陰になる仮想音源と第2の交点との距離の比が、第3の交点と変換仮想音源との距離と変換仮想音源と第2の交点との距離の比と等しくなるように、変換音声情報および変換音源位置情報を生成してもよい。
また、上記課題を解決するために、本発明の別の観点によれば、音声情報および音源位置情報が含まれる音声データを入力し、アレイ状に配されたm個のスピーカからなるアレイスピーカから音を出力することで、仮想空間内に配された仮想音源からなる音場を現実空間の想定受聴者位置が含まれる想定受聴領域に再生するための音声信号を生成する音声信号生成方法であって:音声情報および音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在しない陰になる仮想音源が存在するかを判断する判断ステップと;判断ステップにおける判断で陰になる仮想音源が存在するときに、変換後の仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように、陰になる仮想音源の変換処理を行う変換ステップと;音声情報および音源位置情報と、変換ステップでの変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成ステップと;を含むことを特徴とする、音声信号生成方法が提供される。
かかる構成によれば、判断ステップは音声情報および音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在しない陰になる仮想音源が存在するかを判断し、変換ステップは判断ステップにおける判断で陰になる仮想音源が存在するときに、変換後の仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように、陰になる仮想音源の変換処理を行い、音声信号生成ステップは、音声情報および音源位置情報と、変換ステップでの変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成する。その結果、想定受聴領域で聴くことができない仮想音源が含まれるコンテンツを再生する際に、アレイスピーカを窓とみなして、想定受聴領域からその窓を通して仮想音源を見渡せるように仮想音源の変換を行うことで、想定受聴領域で仮想音源による音声を聴くことができる。
また、上記課題を解決するために、本発明の別の観点によれば、音声情報および音源位置情報が含まれる音声データを入力し、アレイ状に配されたm個のスピーカからなるアレイスピーカから音を出力することで、仮想空間内に配された仮想音源からなる音場を現実空間の想定受聴者位置が含まれる想定受聴領域に再生するための音声信号を生成するためのコンピュータプログラムであって、コンピュータに:音声情報および音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在しない陰になる仮想音源が存在するかを判断する判断ステップと;判断ステップにおける判断で陰になる仮想音源が存在するときに、変換後の仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように、陰になる仮想音源の変換処理を行う変換ステップと;音声情報および音源位置情報と、変換ステップでの変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成ステップと;を含む処理を実行させることを特徴とする、コンピュータプログラムが提供される。
かかる構成によれば、判断ステップは音声情報および音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在しない陰になる仮想音源が存在するかを判断し、変換ステップは判断ステップにおける判断で陰になる仮想音源が存在するときに、変換後の仮想音源と想定受聴領域とを結んだ直線上にアレイスピーカが存在するように、陰になる仮想音源の変換処理を行い、音声信号生成ステップは、音声情報および音源位置情報と、変換ステップでの変換結果とを用いて、仮想音源を形成するためのmチャネルの音声信号を生成する。その結果、想定受聴領域で聴くことができない仮想音源が含まれるコンテンツを再生する際に、アレイスピーカを窓とみなして、想定受聴領域からその窓を通して仮想音源を見渡せるように仮想音源の変換を行うことで、想定受聴領域で仮想音源による音声を聴くことができる。
以上説明したように本発明によれば、マルチチャンネルオーディオシステムがどのような構成を有していても最適な音場を形成することが可能な、新規かつ改良された音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラムを提供することができる。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
(第1の実施形態)
まず、本発明の第1の実施形態にかかる音声信号生成装置、音場再生装置および音声信号生成方法について説明する。図1は、本発明の第1の実施形態にかかる音場再生装置について説明する説明図である。以下、図1を用いて本発明の第1の実施形態にかかる音場再生装置の構成について説明する。
図1に示したように、本発明の第1の実施形態にかかる音場再生装置10は、光ディスク再生装置110と、逆多重化部114と、音声信号生成装置115と、アンプ150と、アレイスピーカ160と、字幕データ抽出部170と、字幕データ再生部172と、映像データ抽出部180と、映像再生部182と、字幕スーパーインポーズ部190と、表示部192と、を含んで構成される。そして、音声信号生成装置115は、音場情報抽出部120と、音声信号生成部130と、変換部140と、を含んで構成される。
光ディスク再生装置110は、光ディスク(図示せず)から信号を読み込むものである。逆多重化部114は、光ディスク再生装置110で読み取った信号に対して逆多重化処理を施し、映像データや音声データを抽出するものである。本発明の第1の実施形態にかかる光ディスク再生装置で読み込む光ディスクは、CD−ROM、DVD−ROM、その他の数百メガバイト以上の大容量を有する光ディスクである。
音場情報抽出部120は、逆多重化部114で抽出した音声データから、仮想音源を形成するための音声情報および音源位置情報を抽出するものである。音声情報には、各仮想音源の種類や出力レベル、音の持続時間等の情報を含めることができる。音声信号生成部130は、音場情報抽出部120で抽出した音声情報および音源位置情報から、波面合成によって仮想音源を形成するための音声信号を生成するものである。
変換部140は、音場再生装置10の環境が、音場情報抽出部120で抽出した音声情報および音源位置情報に含まれる、予め想定された再生条件を満たさないものである場合に、再生条件を満たすように音声情報や音源位置情報の変換を行うものである。音場再生装置10の環境が再生条件を満たさない場合とは、例えばアレイスピーカ160を構成するスピーカの数がコンテンツに含まれる音声を出力するために必要なスピーカの数と合わない場合や、音場再生装置10の再生能力が、コンテンツ制作者が想定した再生能力より劣っている場合、コンテンツ制作者が想定する受聴者の位置が音場再生装置10の想定受聴者位置と異なっている場合などを指す。音声情報や音源位置情報の変換方法については後に詳述する。
アンプ150は、音声信号生成部130で生成された音声信号を、アレイスピーカ160での再生のために増幅するものである。アレイスピーカ160は、本発明の音声出力部の一例であり、m個のスピーカユニット(図示せず)から音声を出力するものである。アレイスピーカ160から出力される音声は、波面合成されて干渉のない波面を形成する。また、アレイスピーカ160からは面合成によって音声を出力することで、空間上に仮想的に音源を配し、その音源から音声が発せられているような音場を再生することができる。
字幕データ抽出部170は、逆多重化部114で逆多重化した信号から字幕データを抽出する。字幕データ再生部172は、字幕データ抽出部170で抽出した字幕データの再生を行う。映像データ抽出部180は、逆多重化部114で逆多重化した信号から映像データを抽出する。映像再生部182は、映像データ抽出部180で抽出した映像データの再生を行う。字幕スーパーインポーズ部190は、映像データに字幕データを重ね合わせる処理を行う。表示部192は、字幕データが重ね合わされた映像データを表示する。
以上、本発明の第1の実施形態にかかる音場再生装置の構成について説明した。次に、本発明の第1の実施形態にかかる音場再生装置の動作について説明する。
光ディスク再生装置110に光ディスクが挿入されると、光ディスク再生装置110で光ディスクから信号を読み取る。読み取った信号データは逆多重化部114に送られ、逆多重化処理が行われて複数の信号となる。逆多重化部114で逆多重化された信号は、音場情報抽出部120、字幕データ抽出部170および映像データ抽出部180に送られる。そして音場情報抽出部120では、アレイスピーカ160から音声を再生することで再現する音場に関する情報の抽出を行い、字幕データ抽出部170では字幕データの抽出を行い、映像データ抽出部180は映像データの抽出を行う。
音場情報抽出部120で抽出する音場に関する情報とは、例えば波面合成によって仮想音源を形成する際の仮想音源の位置情報や、仮想音源が出力する音声に関する音声情報などが含まれる。音場情報抽出部120で抽出した情報は音声信号生成部130に送られ、音声信号生成部130において波面合成によって仮想音源を形成するための音声信号が生成される。
ここで、音声信号を生成する際に、コンテンツ制作者が想定した音場に関する条件と、音場再生装置10が有する条件が異なる場合には、コンテンツ制作者が想定した条件に一致する、またはなるべく近くなるように、変換部140において音声信号の変換処理を行う。音声信号の変換処理を含めた音声信号生成方法については後述する。
音声信号生成部130で生成された音声信号は、アンプ150に送られる。アンプ150に送られた音声信号は、アンプ150において増幅処理が行われ、アレイスピーカ160に送られる。アレイスピーカ160は、アンプ150から送られた音声信号を基に音声を出力する。アレイスピーカ160から出力される音声は、波面合成によって干渉の無い波面が形成され、受聴者は、あたかも空間内に音源が仮想的に配されているような音声を楽しむことができる。
また、字幕データ抽出部170で抽出した字幕データは、字幕データ再生部172に送られて字幕の再生が行われ、映像データ抽出部180で抽出した映像データは、映像再生部182で映像の再生が行われる。そして、字幕スーパーインポーズ部190において映像に字幕データが重ね合わされ、表示部192に字幕データが重ね合わされた映像が表示される。もちろん、字幕データが存在しないコンテンツであれば、字幕データを重ね合わせずに映像を表示してもよい。
以上、本発明の第1の実施形態にかかる音場再生装置の動作について説明した。次に、本発明の第1の実施形態にかかる音声信号生成方法について説明する。
光ディスク再生装置110で読み込む光ディスクには、少なくとも複数の音源の位置情報と音声情報とが音声データとして多重化されて記録されている。図2は、本発明の第1の実施形態にかかる音声データの構成例について説明する説明図である。図2に示したように、本発明の第1の実施形態にかかる音声データは、1つの波面合成データセル31、32・・・という単位で、音場を再生するためのデータが含まれている。音場再生装置10は、光ディスク再生装置110でセルを順次読み込むことで映像や音声を再生する。
第1波面合成データセル31は、標準再生配置条件情報310と、音源数312と、音源1情報ヘッダ314aと、音源1データ314bと、・・・、音源n情報ヘッダ316aと、音源nデータ316bと、を含んで構成される。
標準再生配置条件情報310には、例えばアレイスピーカの条件(標準アレイスピーカ条件)や、想定する受聴者位置等が含まれる。アレイスピーカの条件には、例えばアレイスピーカを構成するための条件が含まれ、アレイスピーカの条件としては、例えばアレイスピーカを構成するスピーカの数や、スピーカ間の間隔等の情報が含まれる。音源数312には音源の数が含まれる。例えば音源の数が3つであれば「3」という値が含まれる。
各音源のヘッダには、音源ID、音源位置とその更新情報、音源の指向特性とその更新情報、音源のレベル、音源の開始時刻と終了時刻、音源のデータ種別等が含まれる。音源IDは、それぞれの音源を識別するIDコードである。例えば、次に再生するセルである第2波面合成データセル32に、同じ音源IDが含まれていたら、それは続きのデータであることを示している。また、音源が移動したり、向きを変えたりするときは、その変化するタイミングの時刻や、変化する量、方向などをデータに含めることで、音源の変化を表すことができる。
音源のレベルには、レベルの単位種別(dB/リニア)とその値が含まれる。また、音源データ種別には、出力する音源の種別、例えばPCM(Pulse Code Modulation)、MIDI(Musical Instrument Digital Interface)。MP3(MPEG−1 Audio Layer−3)、AAC(Advanced Audio Coding)などが含まれる。
音場再生装置10は、光ディスクからこのようなセルに格納されたデータを順次読み取り、波面合成によってアレイスピーカ160から音声を出力することで、空間内に仮想音源からなる音場を再現する。
波面合成によって仮想音源を形成するには、アレイスピーカ160を構成するスピーカの数だけ波面合成を行うための畳み込み演算を行わなければならない。従って、再現する音源の数が増えれば増えるほど、演算量も増えていくことになる。
しかし、音場再生装置の構成が、コンテンツを制作したコンテンツ制作者が想定する構成とは異なる場合が十分考えられる。音場再生装置10の構成によっては、光ディスクで読み取った音声データに基づいて音場を再生するだけの演算能力が十分でない場合や、アレイスピーカ160を構成するスピーカの数が合わない場合がある。このような場合で無理に音場を再生しようとすると、コンテンツ制作者の想定通りの音場が再生されないおそれがある。
そこで、本発明の第1の実施形態においては、音場再生装置の構成がコンテンツ制作者の想定とは異なる場合に、音声信号を変換してアレイスピーカから音声を出力することで、コンテンツ制作者の想定に近い音場を再現する音場再生装置について説明する。
(1)高周波成分の付加
最初に、本発明の第1の実施形態においては、音場再生装置の構成がコンテンツ制作者の想定とは異なる場合に、スピーカから高周波の音声を出力することでコンテンツ制作者の想定に近い音場を再現する音場再生装置について説明する。
波面合成によって音場を生成できる周波数には上限が存在する。この上限周波数をf[Hz]とする。上限周波数fは、アレイスピーカと仮想音源からの波面のなす角度によって変化する。図3を用いてこれを説明する。アレイスピーカと仮想音源からの波面のなす角度をθ[度]とすると、θ=90度の場合には、受聴位置がアレイスピーカから十分離れているとみなすと、上限周波数fh90={音速/(スピーカユニット間隔×2)}[Hz]であり、それ以外の場合の上限周波数は、fh90の1/sinθ倍となる。
仮想音源からの波面とアレイスピーカとのなす角度θおよび上限周波数fの関係により、仮想音源の位置、アレイスピーカの位置および受聴位置の関係で、波面合成によって音場を生成できる上限周波数が変化する。図4および図5は、仮想音源の位置と波面の様子について説明する説明図である。図4は、仮想音源の位置がアレイスピーカに近い場合と遠い場合における、仮想音源位置、アレイスピーカ位置および受聴者位置と波面の様子について示したものであり、図5は、仮想音源の位置がアレイスピーカの中央と端に配置された場合における、仮想音源位置、アレイスピーカ位置および受聴者位置と波面の様子について示したものである。
図4に示したように、仮想音源Aのように仮想音源の位置がアレイスピーカから近い場合でも、仮想音源Bのように仮想音源の位置がアレイスピーカから遠い場合でも、想定受聴者位置が各仮想音源の正面であれば、アレイスピーカと仮想音源からの波面のなす角度が小さいので、波面合成できる上限周波数fは高くなる。一方、図5に示したように、仮想音源Bのように仮想音源がアレイスピーカの端の位置に存在する場合には、仮想音源Aのように仮想音源がアレイスピーカの端の位置に存在する場合に比べて、波面合成できる上限周波数fは低くなる。
ここで、受聴者の位置が仮想音源の正面から左右のどちらかにずれればずれる程、アレイスピーカと仮想音源からの波面とのなす角は大きくなる。従って、受聴者の位置が仮想音源の正面から左右のどちらかにずれればずれる程、波面合成の精度が高域の周波数帯で落ちてしまう問題が生じる。精度の低下は、図4に示したような仮想音源の位置がアレイスピーカに近い場合に特に問題となり、仮想音源Bの正面から左右のどちらかに少しずれただけでもアレイスピーカと仮想音源からの波面とのなす角は大きくなり、波面合成の精度が高域の周波数帯で低下してしまう問題が生じる。
そこで、本実施形態においては、変換部140において高域の周波数を付加して出力することで、波面合成の精度を補うことによって、波面合成によって臨場感のある音場の再生を行うことを目的とする。
図6は、本発明の第1の実施形態にかかる高域周波数成分付加方法について説明する流れ図である。まず、再生系のアレイスピーカの仕様と、想定受聴者位置とから、各仮想音源位置での波面合成周波数帯域と高域周波数付加処理とのクロス周波数を設定する(ステップS112)。
次に、音声信号生成部130において、各仮想音源について音源位置に対応する波面合成フィルタの畳み込み演算を行って音声信号を生成する(ステップS114)。波面合成フィルタの畳み込み演算を行うことで、波面合成によって仮想音源を形成するための音声信号が生成される。
次に、上記ステップS112で設定した各仮想音源位置でのクロス周波数に従って、変換部140において上記ステップS114で生成した音声信号にローパスフィルタをかけて(ステップS116)、ローパスフィルタをかけられた音声信号に、上記ステップS112で設定した各仮想音源位置でのクロス周波数に従って高域周波数成分を付加する(ステップS118)。
このように、音声信号生成部130で生成した音声信号に変換部140で高域周波数成分を付加することによって、高域周波数成分が含まれる仮想音源による音場を再生する場合であっても、波面合成の精度を補って波面合成による音場の再生を行うことができる。
ここで、高域周波数成分を出力するスピーカユニットを、所望する音場に応じて変えてもよい。図7および図8は、高域周波数成分を出力するスピーカユニットについて説明する説明図である。図7は、仮想音源の位置がアレイスピーカ160から離れている場合について説明する説明図であり、図8は、図7に比べて仮想音源の位置がアレイスピーカ160に近い場合について説明する説明図である。
高域周波数成分を出力するスピーカユニットは、図7の(a)のように、仮想音源と想定受聴者位置の中央に位置する受聴者とを結んだ直線上に位置するスピーカユニットとしてもよく、図7の(b)のように、仮想音源と想定受聴者位置の中央に位置する受聴者とを結んだ直線上に位置するスピーカユニットから左右に所定数だけ離れたスピーカユニットとしてもよい。図7の(b)のように、左右のスピーカユニットから高周波成分を出力することで左右(L、R)の虚音像を生成して音場を再生することができる。所定数は、仮想音源とアレイスピーカとの距離に応じて変えてもよい。図8に示した例においては、図7に比べて仮想音源の位置がアレイスピーカ160に近いため、高域周波数成分を出力するスピーカユニットは、仮想音源と想定受聴者位置の中央に位置する受聴者とを結んだ直線上に位置するスピーカユニットから、図7の(b)に比べて少ない所定数だけ左右に離れたスピーカユニットとしてもよい。
なお、上述した上限周波数は、受聴者の位置がアレイスピーカから十分離れており、個々のスピーカユニットから発せされる波面が空間内で合成できているとみなせる場合である。図9に示したように、アレイスピーカに近接した位置では、個々のスピーカユニットからの音波の影響が残っており、書くスピーカユニットの正面の音圧分布に乱れが生じている。
以上、スピーカユニットから高周波成分の音声を付加することによって波面合成の精度を上げて、より臨場感のある音場を再生する方法について説明した。
(2)仮想音源の再配置
次に、仮想音源の位置を、再生する環境に応じて変換して変換仮想音源として再配置することで、コンテンツ制作者の想定に近い音場を再現する音場再生装置について説明する。
アレイスピーカの長さによって、仮想音源位置からの波面が精度よく届く受聴領域が変化する。アレイスピーカを用いて仮想音源が作る波面を合成する場合、あたかもアレイスピーカが窓になっていて、受聴者はその窓を通して音声を聞くような波面が受聴領域に形成される。従って、アレイスピーカという窓を通して受聴者から音源位置が見渡せる場合と、音源位置が見渡せない場合とでは、受聴者への波面の伝わり方が異なる。受聴者から音源位置が見渡せる場合には、受聴者は仮想音源から直接伝播する音声を聴くようになり、音源位置が見渡せない場合には、受聴者はアレイスピーカという窓の窓枠で回折された音を聴くようになる。
図10および図11は、仮想音源位置と受聴者位置との関係について説明する説明図である。図10に示した例では、アレイスピーカ160の長さが十分長く、受聴者位置から仮想音源位置を見渡せるので、受聴者は想定受聴者位置から端のほうにずれていても、仮想音源から音波が到達しているように音声を聴くことができる。しかし、図11に示した例では、アレイスピーカ160の長さが図10に示したものより短い。そのため、図10と同じ仮想音源位置であっても、受聴者が想定受聴者位置から端のほうにずれてしまうと、仮想音源からの音波はアレイスピーカの端を回折して受聴者に届く。
図12は、仮想音源位置と受聴者位置との関係について説明する説明図である。図12の(a)は、想定受聴者位置から仮想音源A、仮想音源Bともにアレイスピーカを通して見渡せることができるが、図12の(b)では、想定受聴者位置から仮想音源Bはアレイスピーカを通して見渡せることができるが、仮想音源Aはアレイスピーカを通して見渡すことができない。そのため、図12の(b)においては、想定受聴者位置から仮想音源Aを知覚する場所は、本来の仮想音源Aの配置場所ではなく、アレイスピーカの一番端となってしまう。そのため、仮想音源の位置が想定した場所と異なって再生されてしまう。
このため、コンテンツを制作するコンテンツ制作者は、音場再生装置10のアレイスピーカ160の長さや想定受聴者位置を考慮してコンテンツを制作する必要がある。
しかし、全ての音場再生装置がコンテンツ制作者の想定通りの環境で構成されているとは限らない。コンテンツ制作者の想定と異なる環境でコンテンツの再生を行うと、コンテンツ制作者の想定した音場を再生することが困難となる。
そこで、コンテンツ制作者は、図2に示したように音声データに想定する再生環境の情報を含めるようにコンテンツを制作することで、音場再生装置では、その情報を基にして仮想音源の位置を音場再生装置の環境に合わせて変換して再配置することができる。特に、映像を伴った音声を再生する場合には、画面の大きさとアレイスピーカの長さを考慮して仮想音源を再配置することで、音の位置と映像とが一致してより自然な音場の再生が可能となる。逆に、仮想音源の再配置を行わないと、音の位置と映像とが一致せず、不自然な音場を再生することになってしまう。
以下、本発明の一実施形態にかかる仮想音源の再配置方法についていくつか例を挙げて説明する。
(2−1)比率を保った変換
図13は、本発明の第1の実施形態にかかる仮想音源の再配置について説明する説明図である。図13の(a)は、アレイスピーカ160を構成するスピーカユニットの数が12個である場合について示してあり、図13の(b)は、アレイスピーカを構成するスピーカユニットの数が8個である場合について示してある。
図13の(a)においては、想定受聴者位置からアレイスピーカ160を通して仮想音源を見渡せるので、仮想音源の配置位置を変換する必要はない。しかし、図13の(b)においては、想定受聴者位置からアレイスピーカ160を通して仮想音源を見渡すことができないため、このままではアレイスピーカ160の一番端に仮想音源を知覚することになる。そこで、a:b=a´:b´となるように、仮想音源の配置位置を変換する。このように仮想音源の配置位置を変換することで、コンテンツ制作者の想定に近い音場を再生することができ、また映像を伴うコンテンツであった場合には、映像と音声とが一致するように音場を再生することができる。
なお、映像を伴っていた場合であっても、例えば音源が映像に映っておらず、画面外に音源が存在するというような設定である場合には、仮想音源の再配置を行わずに、サラウンド音像再生方法による再生を行ってもよい。サラウンド音像再生方法を用いた場合では、受聴可能範囲をあまり広く取ることが出来ないが、例えば仮想音源を形成する音声信号を、パンポットを通して2チャネルのステレオに変換し、さらにR−LおよびL−Rの信号を生成して、その信号をアレイスピーカ160の左右両端のスピーカユニットに入力し、ステレオ音声を出力することによって、音場を再生してもよい。
図14は、本発明の第1の実施形態にかかる再生方法の選択について説明する流れ図である。まず、想定受聴者位置からアレイスピーカ160を通して仮想音源の配置位置を見渡すことができるかどうか判断する(ステップS212)。見渡すことができるならば、波面合成による処理を行う(ステップS218)。一方、見渡すことができないならば、次に想定受聴者位置から見てアレイスピーカ160の外側に音像を知覚させるかどうか判断する(ステップS214)。アレイスピーカ160の外側に音像を知覚させるのであれば、サラウンド方式による処理を行い(ステップS216)、アレイスピーカ160の内側に音像を知覚させるのであれば、波面合成による処理を行う(ステップS218)。波面合成による処理を行う際には、上述したような仮想音源の配置位置の変換処理を行う。
(2−2)アレイスピーカ原点を考慮した変換
想定受聴者位置は、アレイスピーカ160の長さ(アレイスピーカ長)に応じて設定することが望ましい。アレイスピーカ長が長ければ長いほど、想定受聴者位置はアレイスピーカ160から離れた位置になり、アレイスピーカ長が短ければ短いほど、想定受聴者位置はアレイスピーカに近づいた位置に設定することが望ましい。アレイスピーカ長が長くなればアレイスピーカを構成するスピーカユニットの数も多くなり、アレイスピーカから出力される音声の出力強度も強くなるからである。
図15は、アレイスピーカと想定受聴者位置の例について説明する説明図である。図15に示した例はアレイスピーカ160を構成するスピーカユニットが12個の場合である。図15のように、スピーカユニットの数が多くアレイスピーカ長が長い場合には、想定受聴者位置は比較的アレイスピーカ160から離れた位置に設定することが望ましい。
もし、コンテンツ制作者が図15のような環境を想定してコンテンツを制作していたときに、図15に示したような環境でコンテンツを再生した場合には問題なく音場が再生されるが、それ以外の場合には音場が正しく再生されない。例えば、図16に示したようにアレイスピーカ160を構成するスピーカユニットの数が6個の場合、想定受聴者位置は図15に示したものよりアレイスピーカ160に近い場所に設定される。このような場合には、仮想音源の位置を変換するように、アレイスピーカ160から音声を出力するための音声信号を変換部140で変換することによって、コンテンツ制作者の想定したものに近い音場を再生することができる。
(2−2−1)相似的な変換
図17は、本発明の第1の実施形態にかかる仮想音源位置の変換の一例について説明する説明図である。図17に示した仮想音源位置の変換例は、仮想音源の位置を相似的に変換することでコンテンツ制作者の想定したものに近い音場を再生することを目的としている。
相似的に変換する際には、変換部140において想定受聴者位置と、アレイスピーカの中心(以後「アレイスピーカ原点」とも称する)と、仮想音源位置とを結ぶ三角形が、コンテンツ制作者が想定した環境における、想定受聴者位置と、アレイスピーカ原点と、仮想音源位置とを結ぶ三角形と相似の関係を有するように、仮想音源位置の変換を行う。ここで、相似の比率は、コンテンツ制作者がコンテンツ制作時に想定したアレイスピーカ長と、実際に再生を行うアレイスピーカ長との比率である。
このように仮想音源の位置を変換するように、音声信号を変換部140で変換することによって、コンテンツ制作者の想定したものに近い音場を再生することができる。
図18は、本発明の第1の実施形態にかかる、相似的な変換を行うことによる仮想音源位置の変換方法について説明する流れ図である。最初に、コンテンツ制作者がコンテンツ制作時に想定したアレイスピーカ長と、実際に再生を行うアレイスピーカ長との比率を算出し、その比率を変換倍率として決定する(ステップS312)。
次に、アレイスピーカ原点を基準とした座標系で、コンテンツ制作時に設定した各仮想音源の座標位置に上記ステップS312で決定した変換倍率を乗じる(ステップS314)。
このように、仮想音源の位置を相似的に変換するように、変換部140で音声信号を変換することで、コンテンツ制作者の想定したものに近い音場を再生することができる。
(2−2−2)絶対値的な変換
(2−1)では仮想音源の位置を相似的に変換することでコンテンツ制作者の想定したものに近い音場を再生することができる仮想音源位置の変換方法について説明した。次に、仮想音源の位置を絶対値的に変換する方法について説明する。この方法では、アレイスピーカの構成に拘らず、想定受聴者位置と仮想音源位置との距離(想定受聴者位置から見た仮想音源位置の奥行き)がコンテンツ制作者の想定したものと一致するように、仮想音源位置の変換を行う。
図19は、本発明の第1の実施形態にかかる仮想音源位置の変換部140での変換処理の別の例について説明する説明図である。図19に示したように、アレイスピーカ160を構成するスピーカユニットの数がコンテンツ制作者の想定と異なる場合に、アレイスピーカの位置および仮想音源の位置をコンテンツ制作者が想定したものと同じになるように音声信号を変換する。しかし、アレイスピーカの位置は変換することができないので、あたかもコンテンツ制作者が想定したアレイスピーカ位置から音声が発せられるように音声信号の変換を行う。
図20および図21は、本発明の第1の実施形態にかかる、絶対値的な変換を行うことによる仮想音源位置の変換方法について説明する流れ図である。
図20は、仮想音源位置と想定受聴者位置の距離関係を保つように変換する場合の流れについて説明する流れ図である。まず、コンテンツ制作時に想定したアレイスピーカ原点と基準とした各仮想音源位置の座標を、コンテンツ制作時に想定した想定受聴者位置を原点とした座標系に変換する(ステップS412)。
次に、コンテンツ制作時に想定した想定受聴者位置を座標の原点とした各仮想音源位置の座標を、それぞれ再生時の想定受聴者位置座標とする(ステップS414)。そして、再生時のアレイスピーカ原点を座標の原点とするために、再生時のアレイスピーカ160のアレイスピーカ原点と想定受聴者位置との距離を用いて、各仮想音源位置の座標を変換する(ステップS416)。
図21は、コンテンツ制作時のアレイスピーカと想定受聴者位置との関係が、再生時のアレイスピーカと想定受聴者位置との関係と相似である場合における、仮想音源位置と想定受聴者位置の距離関係を保つように変換する場合の流れについて説明する流れ図である。この場合においては、まず、コンテンツ制作時に想定したアレイスピーカ原点と基準とした各仮想音源位置の座標を、コンテンツ制作時に想定した想定受聴者位置を原点とした座標系に変換する(ステップS422)。そして、再生時のアレイスピーカ原点を座標の原点とするために、再生時のアレイスピーカ160のアレイスピーカ原点と想定受聴者位置との距離を用いて、各仮想音源位置の座標を変換する(ステップS424)。
このように、変換部140において、各仮想音源の位置がアレイスピーカの位置および仮想音源の位置をコンテンツ制作者が想定したものと同じになるように、音声信号を変換する。こうして音声信号の変換を行うことで、音場再生装置100の環境がコンテンツ制作者の想定と異なる場合であっても、コンテンツ制作者の意図したものに近い音場を再生することができる。
以上説明したように、本発明の第1の実施形態によれば、仮想音源を形成するための音声信号を変換部140で変換することで、コンテンツ制作者の意図通り、または意図したものに近い音場を再生することができる。そして、音声信号の変換には、高周波帯域の付加や仮想音源の再配置といった方法を用いることができる。
(第2の実施形態)
本発明の第1の実施形態では、光ディスクから音源データを読み込んで、読み込んだ音源データが音場再生装置の条件と合致しない場合に、所定の範囲内に含まれる仮想音源を集約することでコンテンツ制作者の想定に近い音場を再現することができる音場再生装置について説明した。
しかし、音源データの提供は光ディスクからに限られない。本発明の第2の実施形態では、インターネットなどのネットワークから音源データを受信して音場を再現する音場再生装置において本発明を適用した場合について説明する。
図22は、本発明の第2の実施形態にかかる音場再生装置について説明する説明図である。以下、図22を用いて本発明の第2の実施形態にかかる音場再生装置について説明する。
図22に示したように、本発明の第2の実施形態にかかる音場再生装置20は、データ受信部210と、受信データ復号部212と、逆多重化部214と、アンプ250と、アレイスピーカ260と、字幕データ抽出部270と、字幕データ再生部272と、映像データ抽出部280と、映像再生部282と、字幕スーパーインポーズ部290と、表示部292と、を含んで構成される。そして、音声信号生成装置215は、音場情報抽出部220と、音声信号生成部230と、変換部240と、を含んで構成される。
ここで、逆多重化部214と、音場情報抽出部220と、音声信号生成部230と、変換部240と、アンプ250と、アレイスピーカ260と、字幕データ抽出部270と、字幕データ再生部272と、映像データ抽出部280と、映像再生部282と、字幕スーパーインポーズ部290と、表示部292と、は本発明の第1の実施形態にかかる音場再生装置の各部と同一の機能を有するので、詳細な説明は省略する。
データ受信部210は、インターネットなどのネットワークを介してデータの受信を行うものであり、本実施形態にかかるデータ受信部210は、外部から映像データや音声データが含まれるコンテンツの受信を行う機能を有する。
受信データ復号部212は、データ受信部210で受信したデータの復号処理を行うものである。ネットワークを介して送信されるコンテンツは、安全性を高めるためにデータの暗号化が施されている場合がある。そのような場合にはデータの復号処理を行うことで、音場再生装置20は受信したデータの処理を行うことができる。
以上、本発明の第2の実施形態にかかる音場再生装置の構成について説明した。次に、本発明の第2の実施形態にかかる音場再生装置の動作について説明する。
まず、データ受信部210がネットワーク経由で映像データや音声データが含まれるコンテンツを受信する。ネットワーク経由で送られてくるコンテンツは暗号化が施されている場合があり、その場合には受信データ復号部212で受信したコンテンツの復号化処理を行う。
復号化されたコンテンツは、逆多重化部214に送られて逆多重化処理が行われる。以後の処理は、本発明の第1の実施形態にかかる音場再生装置の動作と同一であるため、詳細な説明は省略する。
以上、本発明の第2の実施形態にかかる音場再生装置の動作について説明した。
以上説明したように、本発明の第2の実施形態によれば、ネットワーク経由でコンテンツが送信されてきた場合に、音場再生装置の構成がコンテンツ制作者の想定とは異なる場合であっても、音声信号を変換することによってコンテンツ制作者の想定に近い音場を再現することができる。
なお、上述した処理は、音場再生装置または音声信号生成装置の内部に記憶部を設け、記憶部に記憶されたコンピュータプログラムを順次呼び出して実行されるようにしてもよい。記憶部として、各種のROM(Read Only Memory)を用いてもよい。
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
本発明の第1の実施形態にかかる音場再生装置について説明する説明図である。 本発明の第1の実施形態にかかる音声データの構成例について説明する説明図である。 波面合成によって音場を生成できる上限周波数fについて説明する説明図である。 仮想音源の位置と波面の様子について説明する説明図である。 仮想音源の位置と波面の様子について説明する説明図である。 本発明の第1の実施形態にかかる高域周波数成分付加方法について説明する流れ図である。 高域周波数成分を出力するスピーカユニットについて説明する説明図である。 高域周波数成分を出力するスピーカユニットについて説明する説明図である。 アレイスピーカに近接した位置における個々のスピーカユニットからの音波の影響について説明する説明図である。 仮想音源位置と受聴者位置との関係について説明する説明図である。 仮想音源位置と受聴者位置との関係について説明する説明図である。 仮想音源位置と受聴者位置との関係について説明する説明図である。 本発明の第1の実施形態にかかる仮想音源の再配置について説明する説明図である。 本発明の第1の実施形態にかかる再生方法の選択について説明する流れ図である。 アレイスピーカと想定受聴者位置の例について説明する説明図である。 アレイスピーカと想定受聴者位置の例について説明する説明図である。 本発明の第1の実施形態にかかる仮想音源位置の変換の一例について説明する説明図である。 本発明の第1の実施形態にかかる、相似的な変換を行うことによる仮想音源位置の変換方法について説明する流れ図である。 本発明の第1の実施形態にかかる仮想音源位置の変換部140での変換処理の別の例について説明する説明図である。 本発明の第1の実施形態にかかる、絶対値的な変換を行うことによる仮想音源位置の変換方法について説明する流れ図である。 本発明の第1の実施形態にかかる、絶対値的な変換を行うことによる仮想音源位置の変換方法について説明する流れ図である。 本発明の第2の実施形態にかかる音場再生装置について説明する説明図である。 音源からの波面を模式的に表している説明図である。 波面合成によって2つの音源からの波面を再現する場合について説明する説明図である。 ステレオ方式とマルチチャンネルオーディオシステムとによる受聴イメージの違いについて説明する説明図である。
符号の説明
10、20 音場再生装置
110 光ディスク再生装置
114、214 逆多重化部
115、215 音声信号生成装置
120、220 音場情報抽出部
130、230 音声信号生成部
140、240 変換部
150、250 アンプ
160、260 アレイスピーカ
170、270 字幕データ抽出部
172、272 字幕データ再生部
180、280 映像データ抽出部
182、282 映像再生部
190、290 字幕スーパーインポーズ部
192、292 表示部
212 受信データ復号部

Claims (12)

  1. 音声情報および音源位置情報が含まれる音声データを入力し、アレイ状に配されたm個のスピーカからなるアレイスピーカから音を出力することで、仮想空間内に配された仮想音源からなる音場を現実空間の想定受聴者位置が含まれる想定受聴領域に再生するための音声信号を生成する音声信号生成装置であって:
    前記音声情報および前記音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と前記想定受聴領域とを結んだ直線状に前記アレイスピーカが存在しない陰になる仮想音源が存在するときに、変換後の変換仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在するように前記陰になる仮想音源の変換処理を行う変換部と;
    前記音声情報および前記音源位置情報と、前記変換部での変換結果とを用いて、前記仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成部と;
    を含むことを特徴とする、音声信号生成装置。
  2. 前記音声データから前記音声情報および前記音源位置情報を抽出する音場情報抽出部をさらに含むことを特徴とする、請求項1に記載の音声信号生成装置。
  3. 前記変換部における前記変換処理は、仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在するように、前記陰になる仮想音源の前記音声情報および前記音源位置情報を変換して変換音声情報および変換音源位置情報を生成する処理であり、
    前記音声信号生成部は、前記音源信号抽出部で算出した前記音声情報および前記音源位置情報と、前記変換部で生成した前記変換音声情報および前記変換音源位置情報から、前記仮想音源を形成するためのmチャネルの音声信号を生成することを特徴とする、請求項1に記載の音声信号生成装置。
  4. 前記変換部は、前記陰になる仮想音源に近い前記アレイスピーカの一番端の前記スピーカと前記想定受聴領域とを結んだ直線上に前記陰になる仮想音源を再配置するように、前記変換音声情報および前記変換音源位置情報を生成することを特徴とする、請求項3に記載の音声信号生成装置。
  5. 前記変換部は、想定スピーカ情報に基づく想定アレイスピーカの、前記陰になる仮想音源に近い側の一番端のスピーカと前記想定受聴領域とを結んだ直線を第1の直線、前記陰になる仮想音源の位置を含み前記アレイスピーカに平行な直線を第2の直線、前記アレイスピーカの中心を含むと共に前記アレイスピーカに対して垂直な直線を第3の直線、前記アレイスピーカの、前記変換仮想音源に近い側の一番端のスピーカと前記想定受聴領域とを結んだ直線を第4の直線としたときに、前記第1の直線と第2の直線の交点を第1の交点、前記第2の直線と前記第3の直線の交点を第2の交点、前記第2の直線と前記第4の直線の交点を第3の交点とし、前記第1の交点と前記陰になる仮想音源との距離と前記陰になる仮想音源と前記第2の交点との距離の比が、前記第3の交点と前記変換仮想音源との距離と前記変換仮想音源と前記第2の交点との距離の比と等しくなるように、前記変換音声情報および前記変換音源位置情報を生成することを特徴とする、請求項3に記載の音声信号生成装置。
  6. 音声情報および音源位置情報が含まれる音声データを入力し、アレイ状に配されたm個のスピーカからなるアレイスピーカから音を出力することで、仮想空間内に配された仮想音源からなる音場を現実空間の想定受聴者位置が含まれる想定受聴領域に対して再生する音場再生装置であって:
    前記音声情報および前記音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在しない陰になる仮想音源が存在するときに、変換後の変換仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在するように、前記陰になる仮想音源の変換処理を行う変換部と;
    前記音声情報および前記音源位置情報と、前記変換部での変換結果とを用いて、前記仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成部と;
    前記mチャネルの音声信号を波面合成し、mチャネルの音声を出力することで、前記想定受聴領域に音場を再生する音声出力部と;
    を含むことを特徴とする、音場再生装置。
  7. 前記音声データから前記音声情報および前記音源位置情報を抽出する音場情報抽出部をさらに含むことを特徴とする、請求項6に記載の音場再生装置。
  8. 前記変換部における前記変換処理は、仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在するように、前記陰になる仮想音源の前記音声情報および前記音源位置情報を変換して変換音声情報および変換音源位置情報を生成する処理であり、
    前記音声信号生成部は、前記音源信号抽出部で算出した前記音声情報および前記音源位置情報と、前記変換部で生成した前記変換音声情報および前記変換音源位置情報から、前記仮想音源を形成するためのmチャネルの音声信号を生成することを特徴とする、請求項6に記載の音場再生装置。
  9. 前記変換部は、前記陰になる仮想音源に近い前記アレイスピーカの一番端の前記スピーカと前記想定受聴領域とを結んだ直線上に前記陰になる仮想音源を再配置するように、前記変換音声情報および前記変換音源位置情報を生成することを特徴とする請求項8に記載の音場再生装置。
  10. 前記変換部は、想定スピーカ情報に基づく想定アレイスピーカの、前記陰になる仮想音源に近い側の一番端のスピーカと前記想定受聴領域とを結んだ直線を第1の直線、前記陰になる仮想音源の位置を含み前記アレイスピーカに平行な直線を第2の直線、前記アレイスピーカの中心を含むと共に前記アレイスピーカに対して垂直な直線を第3の直線、前記アレイスピーカの、前記変換仮想音源に近い側の一番端のスピーカと前記想定受聴領域とを結んだ直線を第4の直線としたときに、前記第1の直線と第2の直線の交点を第1の交点、前記第2の直線と前記第3の直線の交点を第2の交点、前記第2の直線と前記第4の直線の交点を第3の交点とし、前記第1の交点と前記陰になる仮想音源との距離と前記陰になる仮想音源と前記第2の交点との距離の比が、前記第3の交点と前記変換仮想音源との距離と前記変換仮想音源と前記第2の交点との距離の比と等しくなるように、前記変換音声情報および前記変換音源位置情報を生成することを特徴とする、請求項8に記載の音場再生装置。
  11. 音声情報および音源位置情報が含まれる音声データを入力し、アレイ状に配されたm個のスピーカからなるアレイスピーカから音を出力することで、仮想空間内に配された仮想音源からなる音場を現実空間の想定受聴者位置が含まれる想定受聴領域に再生するための音声信号を生成する音声信号生成方法であって:
    前記音声情報および前記音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在しない陰になる仮想音源が存在するかを判断する判断ステップと;
    前記判断ステップにおける判断で前記陰になる仮想音源が存在するときに、変換後の変換仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在するように、前記陰になる仮想音源の変換処理を行う変換ステップと;
    前記音声情報および前記音源位置情報と、前記変換ステップでの変換結果とを用いて、前記仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成ステップと;
    を含むことを特徴とする、音声信号生成方法。
  12. 音声情報および音源位置情報が含まれる音声データを入力し、アレイ状に配されたm個のスピーカからなるアレイスピーカから音を出力することで、仮想空間内に配された仮想音源からなる音場を現実空間の想定受聴者位置が含まれる想定受聴領域に再生するための音声信号を生成するためのコンピュータプログラムであって、コンピュータに:
    前記音声情報および前記音源位置情報に基づいて波面合成によって形成される仮想音源の中に、仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在しない陰になる仮想音源が存在するかを判断する判断ステップと;
    前記判断ステップにおける判断で前記陰になる仮想音源が存在するときに、変換後の変換仮想音源と前記想定受聴領域とを結んだ直線上に前記アレイスピーカが存在するように、前記陰になる仮想音源の変換処理を行う変換ステップと;
    前記音声情報および前記音源位置情報と、前記変換ステップでの変換結果とを用いて、前記仮想音源を形成するためのmチャネルの音声信号を生成する音声信号生成ステップと;
    を含む処理を実行させることを特徴とする、コンピュータプログラム。
JP2007055426A 2007-03-06 2007-03-06 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム Withdrawn JP2008219562A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007055426A JP2008219562A (ja) 2007-03-06 2007-03-06 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007055426A JP2008219562A (ja) 2007-03-06 2007-03-06 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2008219562A true JP2008219562A (ja) 2008-09-18

Family

ID=39839053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007055426A Withdrawn JP2008219562A (ja) 2007-03-06 2007-03-06 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2008219562A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018008395A1 (ja) * 2016-07-05 2018-01-11 ソニー株式会社 音場形成装置および方法、並びにプログラム
WO2020100670A1 (ja) * 2018-11-15 2020-05-22 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN117156348A (zh) * 2023-06-30 2023-12-01 惠州中哲尚蓝柏科技有限公司 一种用于家庭影院的立体声组合音箱及其控制方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018008395A1 (ja) * 2016-07-05 2018-01-11 ソニー株式会社 音場形成装置および方法、並びにプログラム
US11310617B2 (en) 2016-07-05 2022-04-19 Sony Corporation Sound field forming apparatus and method
WO2020100670A1 (ja) * 2018-11-15 2020-05-22 ソニー株式会社 信号処理装置および方法、並びにプログラム
US20220014864A1 (en) * 2018-11-15 2022-01-13 Sony Group Corporation Signal processing apparatus, signal processing method, and program
CN117156348A (zh) * 2023-06-30 2023-12-01 惠州中哲尚蓝柏科技有限公司 一种用于家庭影院的立体声组合音箱及其控制方法
CN117156348B (zh) * 2023-06-30 2024-02-09 惠州中哲尚蓝柏科技有限公司 一种用于家庭影院的立体声组合音箱及其控制方法

Similar Documents

Publication Publication Date Title
TWI489887B (zh) 用於喇叭或耳機播放之虛擬音訊處理技術
JP5956994B2 (ja) 拡散音の空間的オーディオの符号化及び再生
JP4273343B2 (ja) 再生装置および再生方法
JP5174527B2 (ja) 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
JP2022009071A (ja) 情報処理装置、情報処理方法、およびプログラム
JP5496235B2 (ja) 多重オーディオチャンネル群の再現の向上
KR20200112774A (ko) 사운드 바를 위한 오디오 신호 처리 장치 및 방법
KR20060041735A (ko) 음향 수음 장치, 음향 수음 방법, 기록 매체
KR102160248B1 (ko) 다채널 음향 신호의 정위 방법 및 장치
JP2005080079A (ja) 音声再生装置及び音声再生方法
JP2005223713A (ja) 音響再生装置、音響再生方法
KR20220062131A (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
JPWO2019078034A1 (ja) 信号処理装置および方法、並びにプログラム
JP4297077B2 (ja) 仮想音像定位処理装置、仮想音像定位処理方法およびプログラム並びに音響信号再生方式
JP5338053B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
JP2005157278A (ja) 全周囲音場創生装置、全周囲音場創生方法、及び全周囲音場創生プログラム
JP2008219562A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム
JP2008219563A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム
KR101725952B1 (ko) 사용자의 hrtf 정보를 이용하여 n채널의 음원을 사용자에 최적화된 바이노럴 음원으로 다운 믹스하는 방법 및 시스템
CN105163239B (zh) 4d裸耳全息立体声实现方法
JP2008147840A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム
JP5743003B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
JP5590169B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
JP2008147839A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム
KR20140025268A (ko) 사운드 바를 이용한 음장 재현 시스템 및 방법

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100511