JP7248913B2 - 音声情報生成プログラム、音声再生プログラム、および音声再生装置 - Google Patents

音声情報生成プログラム、音声再生プログラム、および音声再生装置 Download PDF

Info

Publication number
JP7248913B2
JP7248913B2 JP2020137506A JP2020137506A JP7248913B2 JP 7248913 B2 JP7248913 B2 JP 7248913B2 JP 2020137506 A JP2020137506 A JP 2020137506A JP 2020137506 A JP2020137506 A JP 2020137506A JP 7248913 B2 JP7248913 B2 JP 7248913B2
Authority
JP
Japan
Prior art keywords
unit
search data
audio
sound
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020137506A
Other languages
English (en)
Other versions
JP2022033546A (ja
Inventor
健二 小島
翔 松下
赳 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capcom Co Ltd
Original Assignee
Capcom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capcom Co Ltd filed Critical Capcom Co Ltd
Priority to JP2020137506A priority Critical patent/JP7248913B2/ja
Publication of JP2022033546A publication Critical patent/JP2022033546A/ja
Application granted granted Critical
Publication of JP7248913B2 publication Critical patent/JP7248913B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声情報生成プログラム、音声再生プログラム、および音声再生装置に関する。
ゲームソフトウェアには、説得力のある音を生成するために、仮想空間について、シミュレーションを行うものがある(例えば特許文献1を参照)。特許文献1の例では、散乱する音のシミュレーションを行うとされている。
米国特許第10,602,298号明細書
シミュレーションは、リアルな音を生成するには有効な手段である。しかしながら、シミュレーションの結果は、一般的には容量が大きいので、コンピュータの資源(メモリなど)の消費量が大きくなりがちである。
本発明の目的は、必要なデータ容量を抑えつつ音場を再現できるようにすることにある。
第1の発明は、コンピュータを、
画像で示された空間における音圧と粒子速度を、シミュレーションによって、前記空間の複数箇所について算出し、前記粒子速度と前記音圧の組の複数から、時系列の複数のベクトルを求める算出部と、
前記算出部が求めたベクトルの数を減らす圧縮処理を行う第1圧縮部と、
して機能させることを特徴とする音声情報生成プログラムである。
また、第1発明において、前記第1圧縮部は、前記算出部が求めたベクトルの一部または全部を、時間軸上で複数の時間領域に区分し、前記時間領域毎に前記圧縮処理を行ようにしてもよい。
また、前記発明においては、前記第1圧縮部は、前記音圧と閾値との比較結果に基づいて、前記区分を行うようにしてもよい。
また、前記発明においては、前記第1圧縮部は、各時間領域における所定数のベクトルについて、前記音圧の合計値、および音の伝播方向を示す角度の平均値を算出し、算出した合計値および平均値を用いて、前記時間領域に対応する1つまたは複数のベクトルを生成してもよい。
また、前記発明においては、前記第1圧縮部は、音の伝播方向毎に前記音圧の合算値を求めることによって、前記伝播方向に対応するベクトルを生成してもよい。
また、前記発明においては、前記第1圧縮部は、時系列で並んだ所定数のベクトルを用いて、球面調和関数を生成してもよい。
また、前記発明においては、前記コンピュータを、前記第1圧縮部が生成したデータを、前記画像における位置によって探索するための探索データを生成する探索データ生成部として機能させてもよい。
また、前記発明においては、前記コンピュータを、前記探索データを、前記画像における位置を基準にグループ化し、前記グループ内において互いに類似する探索データを間引く第2圧縮部として機能させてもよい。
また、第2の発明は、コンピュータを、
与えられた再生情報にしたがって音声を再生する再生部と、
前記再生情報を、画像で示された空間における位置によって探索するための探索データを保持する探索データ保持部と、
前記位置と前記探索データに基づいて前記再生情報を探索して前記再生部に与える探索部と、
して機能させ、
前記再生情報は、前記空間における音圧と粒子速度の組に基づいて生成されたベクトルであり、
前記音圧と前記粒子速度の組は、予め求められたものであり、
前記探索データは、時間軸において圧縮された前記ベクトルに基づいて生成されたものである
ことを特徴とする音声再生プログラムである。
また、第3の発明は、前記音声再生プログラムを記憶した記憶部と、
前記音声再生プログラムを実行する制御部と、
を備えたことを特徴とする音声再生装置である。
本発明によれば、必要なデータ容量を抑えつつ音場を再現できる。
音声情報生成装置の構成を示すブロック図である。 圧縮処理の概念を説明する図である。 探索データと仮想空間との関係を例示する図である。 空間圧縮後の探索データと仮想空間との関係を例示する図である。 音声情報生成装置の動作例を示すフローチャートである。 ゲーム装置の構成を示すブロック図である。 ドロネー図情報で規定された三角形とプレイヤキャラクタとの位置関係を例示する図である。 ゲーム装置の動作例を示すフローチャートである。 実施形態2における、時間圧縮処理の概念を説明する図である。
本発明の実施形態にかかる音声情報生成プログラム、音声再生プログラム、および音声再生装置について、図面を参照して説明する。本発明の音声情報生成プログラムは、音声情報生成装置10(後述)を動作させるプログラムとして実装されている。音声再生プログラムは、ゲームプログラムとして実装されている。音声再生装置は、ゲーム装置5(後述)として実現されている。
[実施形態1]
《概要》
このゲームプログラムによるゲームでは、ユーザの操作を受けて、プレイヤキャラクタを仮想ゲーム空間(以下、単に仮想空間という)で活動させたり、プレイヤキャラクタ同士でグループを編成して様々なアクションを行わせたりする。以下の説明では、仮想空間は三次元である。
このゲームでは、種々のゲーム音声が再生される。この明細書における、ゲーム音声とは、ゲーム中にスピーカ62(後述)から流れる音声である。例えば、仮想空間内に配置された種々のオブジェクト(例えば電話機を示すオブジェクトなど)が発する音や人の話し声などがゲーム音声の一例である。
また、機械の動作音、洞窟において入口から出口に向かう風の音、町の雑踏の音(通行人の声や付近を通過する自動車の音等)、森や草原に吹く風の音等の環境音もゲーム音声の一例である。
《音声情報生成装置10》
〈ハードウェアの構成〉
音声情報生成装置10は、3次元的な音の再生を行うための情報を生成する装置である。音声情報生成装置10は、例えば、パーソナルコンピュータに所定のソフトウェアをインストールすることによって構成できる。音声情報生成装置10には、音声情報生成プログラムがインストールされる。
図1は、音声情報生成装置10の構成を示すブロック図である。図1に示すように、音声情報生成装置10には、ディスプレイ91、スピーカ92、およびキーボード93が接続されている。
音声情報生成装置10は、ネットワークインターフェース81、グラフィック処理部82、オーディオ処理部83、操作部84、記憶部85、および制御部86を有する。グラフィック処理部82、オーディオ処理部83、操作部84、および記憶部85は、バス87を介して制御部86と電気的に接続されている。
ネットワークインターフェース81は、例えば、他のゲーム開発装置や外部のサーバ装置(何れも図示を省略)との間で各種データを送受信するために、前記通信ネットワークに通信可能に接続される。
グラフィック処理部82は、ディスプレイ91(例えば液晶ディスプレイ)と接続されている。グラフィック処理部82は、制御部86から出力される画像情報に従って、ディスプレイ91に各種画像を表示する。
オーディオ処理部83は、スピーカ92と接続されている。オーディオ処理部83は、制御部86から出力される音声情報に従って、音声をスピーカ92から出力(再生)させる。
オーディオ処理部83は、3次元的な音の再生を行うために、多チャンネルの音声出力ができるように構成されている。それに合わせて、音声情報生成装置10には、複数のスピーカ92が接続されている。これらのスピーカ92は、3次元的な音の再生ができるように、聴取者の左右、前後、上方などに配置される。聴取者は、例えば、音声情報生成装置10を使用するゲーム開発者である。
操作部84は、キーボード93と接続されている。操作部84には、使用者(例えばゲーム開発者)によるキーボード93の操作に応じて、操作信号が入力される。例えば、使用者は、キーボード93を操作することにより、記憶部85に記憶された各種プログラムを実行させることができる。使用者は、キーボード93を操作することで、種々の情報を入力することができる。
記憶部85は、HDD、SSD、RAMおよびROMなどで構成される。記憶部85には、各種プログラムなどが格納されている。
制御部86は、音声情報生成装置10を制御する。制御部86は、CPU(マイクロコンピュータ)および半導体メモリを備えている(図示は省略)。半導体メモリには、CPUを動作させるためのプログラムなどが格納されている。例えば、半導体メモリには、音声情報生成プログラムが格納される。
〈音声情報生成装置10における制御部86の機能的構成〉
音声情報生成装置10の制御部86は、そのCPUが音声情報生成プログラムを実行することによって、算出部861、第1圧縮部862、探索データ生成部863、第2圧縮部864、およびドロネー図生成部865として機能する。
算出部861は、画像で示された空間(ここでは、仮想空間)における音圧と粒子速度を、シミュレーションによって、この空間の複数箇所(離散的な点)について算出する。以下では、シミュレーションが行われた空間内の点を計算点と呼ぶ。
本実施形態では、シミュレーションの手法として、有限差分時間領域(Finite Difference Time Domain; FDTD)法を採用している。FDTD法によって、各計算点について、粒子速度と音圧の組を複数組求めることができる。FDTD法による音場解析では、原理上、計算点は等間隔(グリッド状)に配置される。
算出部861は、粒子速度と音圧の組から、時系列のベクトル(以下、インテンシティベクトルI)を求める。インテンシティベクトルIは、次の式で表せる。
Figure 0007248913000001
式(1)において、p(t)は音圧(スカラー)であり、u(t)は粒子速度(ベクトル)である。インテンシティベクトルIは、瞬時音響インテンシティと呼ばれることがある。各計算点では、時系列で、粒子速度と音圧の組が複数求められる。したがって、算出部861は、ひとつの計算点に対して、複数のインテンシティベクトルIを求める。
第1圧縮部862は、計算点毎に次の処理を行う。
(1)算出部861が求めたインテンシティベクトルIの数を減らす圧縮処理。
(2)圧縮処理で得たデータ(後述の方向ベクトルV)を球面調和関数で表す処理。
図2は、圧縮処理の概念を説明する図である。図2の(A)は、ある計算点における、インテンシティベクトルIの絶対値の時間推移を示している。
まず、第1圧縮部862は、インテンシティベクトルI(瞬時音響インテンシティ)の大きさの時間平均を求めることによって、波形を平滑化する。図2の(B)に、ある計算点における、インテンシティベクトルIを平滑化した波形を例示する。
第1圧縮部862は、圧縮処理の過程において、着目している計算点におけるインテンシティベクトルIの一部または全部(以下、ベクトル集合と呼ぶ)を、時間軸上で複数の時間領域に区分する。具体的に、第1圧縮部862は、音圧pと閾値λとを比較し、閾値λを超える音圧pが連続している時間範囲をひとつの区分とする。
図2では、ハッチングで示した区間が、閾値λを超える音圧pが連続している時間範囲である。この区分の手法は、ある点で観測される音波が、反射波毎に分かれて到来することに着目した手法である。
第1圧縮部862は、ひとつの区間に対して、ひとつまたは複数の方向ベクトルVを対応付ける。方向ベクトルVは、所定数のインテンシティベクトルIから生成したベクトルである。方向ベクトルVの生成方法は、次の通りである。
第1圧縮部862は、区間毎(換言すると到来波毎)のインテンシティベクトルIの大きさの合計値と、進行方向(角度)の平均値とを求める。図2の(C)に、ある計算点における、インテンシティベクトルIの進行方向の時間推移を例示する。
次に、第1圧縮部862は、1つの区間あたりの音波の大きさと進行方向を示すベクトル量として、合計値と、進行方向(角度)の平均値とを要素とする新たな方向ベクトルVを作る。本実施形態では、複数のインテンシティベクトルIを含んだひとつの区間(ひとつの到来波)が、ひとつの方向ベクトルVで表される。
第1圧縮部862によって生成された方向ベクトルVの数は、その元になるインテンシティベクトルIの数よりも少なくなる。つまり、本実施形態では、所定の計算点に対応した複数のインテンシティベクトルI(ベクトル集合)が、時間軸上で圧縮される。以下では、第1圧縮部862が、時間軸上で行うベクトル集合の圧縮を時間圧縮と呼ぶ。
3次元空間における球面座標の表現方法の一つとして球面調和関数がある。第1圧縮部862は、計算点毎に、方向ベクトルVを用いて球面調和関数を作成する。
ある方向(θ,φ)におけるm次n番目の球面調和関数は、次の式で一意に定まることが知られている。
Figure 0007248913000002
Figure 0007248913000003
上式において、m,nは整数であり、m≧|n|である。
ここで、計算点に対応するK個の方向ベクトルVの集合をQとする。集合Qは、極座標系を用いると、次のように表すことができる。
Figure 0007248913000004
また、集合Qのm次n番目の球面調和関数Qmnは、次の式で表すことができる。
Figure 0007248913000005
式(5)から分かるように、N次までの球面調和関数を用いることによって、方向ベクトルの数Kが大きくても、方向ベクトルの集合Qを、(N+1)個の係数(Qmn)によって表現することができる。以下では、集合Qを表現する(N+1)個の係数を係数群Cという。
探索データ生成部863は、第1圧縮部862が生成したデータを、画像における位置(ここでは仮想空間における位置)によって探索するためのデータ(以下、探索データという)を生成する。探索データは、計算点の位置情報と、その計算点に対応する係数群Cとを対にしたデータである。
図3は、探索データと仮想空間VSとの関係を例示している。図3では、仮想空間VS内には、壁W、音源S(オブジェクト)が存在する。探索データは、仮想空間VS内の計算点に対応する。すなわち、探索データは、仮想空間VS内の点と考えて差し支えない。この時点では、探索データは、仮想空間VSにおいて、等間隔に配置される。
以下では、探索データに対応する仮想空間VS内の点をサウンドプローブSPとよぶ。探索データ生成部863は、仮想空間VSに配置されたサウンドプローブSPを、グラフィック処理部82を介して、ディスプレイ91に表示するように構成してもよい。
探索データ生成部863は、計算点の数だけ、係数群Cを第1圧縮部862から受け取る。探索データ生成部863は、一旦、計算点の数と同数の探索データを生成する。これらの探索データは、位置情報をキーとして係数群Cを探索可能な構造のデータ(例えば、連想配列)として、音声情報生成装置10の記憶部85に格納される。
第2圧縮部864は、探索データを間引く処理を行う。以下では、説明の便宜のため、探索データを間引く処理を空間圧縮という。具体的に、第2圧縮部864は、間引くことができる探索データが無くなるまで、次の(1)~(2)の処理を行う。
(1)近傍の探索データをグループ化する処理
(2)類似する探索データを間引く処理
近傍の探索データのグループ化を行うために、まず、第2圧縮部864は、何れかひとつの探索データ(ここでは着目データという)を選択する。着目データと、着目データの近傍にある探索データとをグループ化する。
第2圧縮部864は、「近傍にある探索データ」か否かを、計算点の位置情報に応じて判断している。具体的に、第2圧縮部864では、計算点同士の距離が、予め定めた閾値(距離閾値という)よりも小さい探索データ同士は、互いに近傍にあると判断している。
次に、第2圧縮部864は、グループ内において互いに類似する探索データを間引く処理を行う。探索データ同士が類似するか否かは、例えば、探索データの係数群Cを比較することで判断できる。
本実施形態では、第2圧縮部864は、着目データが持つ係数と、比較対象の検索データの係数との差分を合計する。これにより、着目データとその周囲の探索データとの間における音の変化量の大きさが数値化される。換言すると、第2圧縮部864は、探索点が音場へ与える影響力の大きさを数値化している。第2圧縮部864は、差分の合計値が予め定めた閾値(以下、影響度閾値という)よりも小さい探索データを削除する。
以上の処理により、探索データの数を減らすことが可能になる。図4は、空間圧縮後の探索データ(サウンドプローブSP)と仮想空間VSとの関係を例示している。図4に示すように、空間圧縮の後(間引き後)は、サウンドプローブSP(探索データ)同士の間隔が一定ではない。第2圧縮部864は、間引かれずに残った探索データ(空間圧縮後の探索データ)をドロネー図生成部865に送る。
ドロネー図生成部865は、第2圧縮部864から受け取った探索データの位置情報に基づいて、ドロネー図を作成する。すなわち、ドロネー図生成部865は、各サウンドプローブSPを頂点とした三角形によって仮想空間VSを分割する(図4参照)。
ドロネー図生成部865は、ドロネー図を構成する各三角形の頂点を特定する情報(以下、ドロネー図情報という)を生成する。ドロネー図情報は、例えばサウンドプローブSPのID番号の組で表すことができる。
ドロネー図生成部865は、ドロネー図情報を、他のプログラム(例えばゲームプログラム)で利用できるフォーマットのデータとして出力する。なお、ドロネー図生成部865は、ディスプレイ91に、グラフィック処理部82を介して、ドロネー図を表示するように構成してもよい。
〈音声情報生成装置10の動作例〉
図5は、音声情報生成装置10の動作例を示すフローチャートである。図5は、探索データと、ドロネー図情報の生成手順を示している。
探索データを生成するには、仮想空間VSの構成(オブジェクトの形状や位置など)を示すデータ(以下、背景データ)を、音声情報生成装置10内に準備する。この背景データに基づいて、算出部861が、数値シミュレーションを行って、仮想空間VS内の離散的な計算点における音圧と粒子速度を計算する(ステップS11)。ここでは、算出部861は、FDTD法によって、各計算点における音圧と粒子速度を求める。
算出部861は、音圧と粒子速度から、インテンシティベクトルI(瞬時音響インテンシティ)を算出する(ステップS12)。複数のインテンシティベクトルIからは、各計算点における音の大きさと進行方向の時間推移が分かる。
第1圧縮部862は、計算点毎に、インテンシティベクトルIを時間圧縮して、方向ベクトルVを生成する(ステップS13)。また、第1圧縮部862は、計算点毎に、方向ベクトルVを用いて球面調和関数を作成する(ステップS14)。
探索データ生成部863は、第1圧縮部862が生成したデータを、画像における位置(ここでは仮想空間における位置)によって探索するための探索データ(サウンドプローブSP)を生成する(ステップS15)。
第2圧縮部864は、探索データ生成部863が生成した探索データ(サウンドプローブSP)の中から余分な探索データを判別し、余分なものを間引く処理(空間圧縮)を行う(ステップS16)。
ドロネー図生成部865は、間引かれずに残った探索データに基づいてドロネー図を作成する(ステップS17)。探索データとドロネー図情報とは、ゲーム装置5等において、後述するように、音声の再生に利用できる。探索データとドロネー図情報は、ゲームプログラムなどに組み込まれる。
ドロネー図生成部865は、ドロネー図情報を、所定フォーマットのデータとして出力する。ドロネー図情報の出力先は、例えば、自身の記憶部85や、他のゲーム開発装置である。
《ゲーム装置5の構成》
〈ハードウェアの構成〉
ゲーム装置5は、ユーザの操作に基づいて所定のゲームを実行する。図6は、ゲーム装置5の構成を示すブロック図である。ゲーム装置5には、ディスプレイ61、スピーカ62およびコントローラ63が外部接続または内蔵される。
ゲーム装置5には、例えば、パーソナルコンピュータ、プレイステーション(登録商標)、XBox(登録商標)、PlayStation Vita(登録商標)、Nintendo Switch(登録商標)などの、市販の装置を利用できる。
ゲーム装置5では、例えば、インストールされたゲームプログラムおよびゲームデータに基づいてゲームが進行する。なお、ゲーム装置5同士も、通信ネットワーク(図示を省略)または近距離無線通信装置(図示せず)を用いて、互いにデータ通信を行うことができる。
ゲーム装置5は、ネットワークインターフェース51、グラフィック処理部52、オーディオ処理部53、操作部54、記憶部55および制御部56を有する。ネットワークインターフェース51、グラフィック処理部52、オーディオ処理部53、操作部54および記憶部55は、バス59を介して制御部56と電気的に接続されている。
ネットワークインターフェース51は、例えばゲーム装置5や外部のサーバ装置(図示を省略)との間で各種データを送受信するために、前記通信ネットワークに通信可能に接続される。
グラフィック処理部52は、制御部56から出力されるゲーム画像情報に従って、プレイヤキャラクタおよびゲーム空間に関する各種オブジェクトを含むゲーム画像を、動画形式で描画する。グラフィック処理部52はディスプレイ61(例えば液晶ディスプレイ)と接続されている。動画形式に描画されたゲーム画像は、ゲーム画面としてディスプレイ61上に表示される。
オーディオ処理部53は、制御部56の指示に従ってデジタルのゲーム音声を再生および合成する。オーディオ処理部53はスピーカ62と接続されている。オーディオ処理部53によって再生および合成されたゲーム音声は、スピーカ62から出力される。
オーディオ処理部53は、3次元的な音の再生を行うために、多チャンネルの音声出力ができるように構成されている。それに合わせて、ゲーム装置5には、複数のスピーカ62が接続されている。これらのスピーカ62は、3次元的な音の再生ができるように、聴取者(例えばゲームのプレイヤ)の左右、前後、上方などに配置される。
操作部54は、コントローラ63と接続されている。操作部54は、操作入力に関するデータをコントローラ63との間で送受信する。ゲームのプレイヤは、コントローラ63のボタン等の各種操作子を操作することで、ゲーム装置5に操作信号を入力する。
記憶部55は、HDD、SSD、RAMおよびROMなどで構成される。記憶部55には、サーバ装置2からダウンロードされたゲームデータ、ゲームプログラムの一部を含む各種プログラムなどが格納されている。
制御部56は、ゲーム装置5の動作を制御する。制御部56は、CPU(マイクロコンピュータ)および半導体メモリを備えている(図示は省略)。半導体メモリには、CPUを動作させるためのプログラムなどが格納されている。
〈ゲーム装置5における制御部56の機能的構成〉
ゲーム装置5における制御部56は、そのCPUがゲームプログラムを実行することによって、探索データ保持部561、および再生部562として機能する。このゲームプログラムには、音声情報生成装置10が生成した、探索データとドロネー図情報とが組み込まれている。
探索データ保持部561は、複数の探索データを保持している。探索データ保持部561が保持する探索データは、空間圧縮後の探索データである。探索データ保持部561は、これらの探索データを、位置情報をキーとして係数群Cを探索可能な構造のデータ(例えば、連想配列)として保持している。なお、ゲーム装置5におけるゲームでは、探索データ(サウンドプローブSP)は、画面(ディスプレイ61)には表示されない。
探索データ保持部561は、更に、ドロネー図情報も保持している。この例では、探索データ保持部561は、ドロネー図を構成する各三角形の頂点の情報を、サウンドプローブSPのID番号によって定めている。
再生部562は、与えられた再生情報に従って音声を再生する。再生部562は、音声の再生において、音像定位を行う。再生部562は、音像定位を行うため、音声が聴取される仮想の受音点(以下、仮想マイクL)を仮想空間に設定する。この例では仮想マイクLは、プレイヤキャラクタの近傍に設定されている。仮想マイクLは、プレイヤキャラクタの移動にともなって移動する。
このゲームでは、仮想空間内に配置された音源(仮想の音源)から音声が発せられたように、音響的な演出が行われる。再生部562は、仮想の音源(オブジェクトなど)から発せられた音声を、あたかも仮想マイクLで集音したかのような音響表現で、スピーカ62に出力する。すなわち、仮想マイクLは、仮想の聴取者であり、オーディオ処理部53による音像定位の基準点である。
再生部562は、音声を再生する場合に、探索データを用いる。具体的には、再生部562は、次の処理を行う。
図7は、ドロネー図情報で規定された三角形と、プレイヤキャラクタPCとの位置関係を例示する図である。図7に示すように、プレイヤキャラクタPC(すなわち仮想マイクL)は、ドロネー図内の所定の三角形に内包される。再生部562は、ドロネー図情報を用いて、プレイヤキャラクタPCが、ドロネー図内の何れの三角形に内包されるかを判定する。
次に、再生部562は、プレイヤキャラクタPCを内包する三角形の頂点に対応したサウンドプローブSPがそれぞれ備える情報を取得する。具体的には、再生部562は、球面調和関数を特定する情報(係数群C)を取得する。
再生部562は、取得した情報を用いて各頂点の球面調和関数を合成することによって、仮想マイクLにおける球面調和関数を生成する。ここで、球面調和関数の合成を説明するにあたり、3つのサウンドプローブA、B、CがプレイヤキャラクタPCを囲んでいると仮定する(図7参照)。
また、仮想マイクL、サウンドプローブA,B,Cによって形成される三角形の面積を、それぞれ、SABC,SLAB,SLBC,SLCAとする(図7参照)。サウンドプローブA、B、Cが持つm次n番目の球面調和関数をそれぞれYmn,Ymn,Ymnとする。また、Ymn,Ymn,Ymnを合成した球面調和関数をYmnとする。
本実施形態では、仮想マイクLにおける球面調和関数Ymnを、次の式で表す。
Figure 0007248913000006
仮想マイクLにおける球面調和関数Ymnが定まると、仮想マイクLに到来する音波を再現できる。本実施形態では、再生部562は、球面調和関数を用いて、高次のAmbisonics(High Order Ambisonics:HOA)と呼ばれるフォーマット(以下、HOAフォーマットという)のデータを生成する。HOAフォーマットは、オーディオ処理部53の各チャンネルから出力する音に容易にデコードできる。
〈ゲーム装置5の動作例〉
図8は、ゲーム装置5の動作例を示すフローチャートである。図8に示すように、再生部562は、プレイヤキャラクタPCの現在の位置を特定する(ステップS21)。次に、再生部562は、プレイヤキャラクタPCを囲む、ドロネー図の三角形を探索する。再生部562は、この探索において、探索データ保持部561が備える探索データを用いる。
再生部562は、見つかった三角形の各頂点に対応する探索データが持っている係数群Cを用いて、仮想マイクLにおける球面調和関数を合成する(ステップS22)。再生部562は、合成して得た球面調和関数を用いて、スピーカ62から出力する音声信号を生成する(ステップS23)。
具体的には、再生部562は、球面調和関数を用いて、HOAフォーマットのデータを生成する。更に、再生部562は、HOAフォーマットを、オーディオ処理部53の各チャンネルから出力する音声信号にデコードする。以上の動作により、スピーカ62からは、3次元的な音声が出力される。
以上をまとめると、本件発明は、コンピュータを、画像で示された空間における音圧と粒子速度を、シミュレーションによって、前記空間の複数箇所について算出し、前記粒子速度と前記音圧の組の複数から、時系列の複数のベクトルを求める算出部861と、前記算出部861が求めたベクトルの数を減らす圧縮処理を行う第1圧縮部862と、して機能させることを特徴とする音声情報生成プログラムである。
《本実施形態における効果》
本実施形態では、シミュレーションで得たデータが時間圧縮される。これにより、本実施形態では、音声の再生に必要なデータ容量を抑えつつ音場を再現できる。
更に、本実施形態では、探索データが空間圧縮される。この点においても、音声の再生に必要なデータ容量を抑えつつ音場を再現できる。
本実施形態では、圧縮したデータを、球面調和関数の係数として保持している。球面調和関数を用いたことによって、分解能(換言するとデータ容量)の調整が容易になる。
[実施形態1の変形例]
探索テータには、球面調和関数を示す係数群Cに代えて、方向ベクトルVを用いてもよい。この場合には、ドロネー図を用いた情報の合成法も実施形態1とは異なる。
ここで、仮想マイクL、サウンドプローブA,B,Cによって形成される三角形の面積を、SABC,SLAB,SLBC,SLCAとする(図7参照)。また、サウンドプローブA、B、Cにおける方向ベクトルをそれぞれv,v,vとする。本変形例では、仮想マイクLにおける方向ベクトルVを次の式によって表す。
Figure 0007248913000007
方向ベクトルVが定まると、方向ベクトルVの大きさを音量、方向を到来方向と解釈することで、音声を再生することができる。
[実施形態2]
実施形態2では、時間圧縮の他の例を説明する。本実施形態では、第1圧縮部862の構成が、実施形態1と異なっている。図9に、実施形態2における、時間圧縮処理の概念を説明する図を示す。
図9の(A)は、ある計算点における、インテンシティベクトルIの絶対値の時間推移を例示している。また、図9の(B)は、ある計算点における、インテンシティベクトルIの方向(θ)(音の伝播方向)の時間推移を例示している。
本実施形態の第1圧縮部862は、音の伝播方向毎に音圧の合算値を求めることによって、伝播方向に対応する方向ベクトルVを生成する。図9の(C)に、音の伝播方向毎の、音圧の合算値を例示する。
例えば、複雑な音場では、音の反射や回折が多重に発生する場合がある。この場合、インテンシティベクトルIと閾値λとの比較によっては、到来波(インテンシティベクトルI)の波形を到来波毎に分割することが困難になる。本実施形態では、到来波を区分せずに、算出されたインテンシティベクトルIを、所望の全範囲に対して時間圧縮を行っている。そのため、本実施形態では、反射や回折が多重に発生する状況下でも容易に時間圧縮を行うことが可能になる。
[その他の実施形態]
仮想ゲーム空間は、3次元には限定されない。仮想ゲーム空間は、2次元でもよい。
音声情報生成プログラム(音声情報生成装置)、および音声再生プログラムの用途は、ゲームには限定されない。音声情報生成プログラム(音声情報生成装置)、および音声再生プログラムは、例えば、映画、アニメーションなど、空間が画像で表現されたものであれば適用できる。
探索データの類似度の判断には、係数の差分合計値とは異なる指標を用いてもよい。例えば、各探索データの係数群Cをベクトルと見なして、探索データの類似度判定において、2つのベクトルのコサイン類似度を指標としたり、2つのベクトルのユークリッド距離を指標にしたりできる。
実施形態1における、インテンシティベクトルIの平滑化は必須ではない。一方、実施形態2において、時間圧縮の際にインテンシティベクトルIを平滑化してもよい。
実施形態2においても、探索テータとして、球面調和関数の代わりに方向ベクトルVを用いてもよい。
ゲームプログラムは、いわゆるオンラインゲーム用のゲームプログラムとして実装してもよい。ゲームプログラムがオンラインゲーム用である場合には、制御部56で行っていた処理をそれに代わってサーバ側で行ってもよいし、サーバ側とクライアント(ゲーム装置5)側とで分担してもよい。
これらの他の実施形態を採用した場合においても、本発明の作用効果は発揮される。また、本実施形態と他の実施形態、および他の実施形態同士を適宜組み合わせることも可能である。
5 ゲーム装置
10 音声情報生成装置
55 記憶部
56 制御部
561 探索データ保持部
562 再生部
861 算出部
862 第1圧縮部
863 探索データ生成部
864 第2圧縮部

Claims (10)

  1. コンピュータを、
    画像で示された空間における音圧と粒子速度を、シミュレーションによって、前記空間の複数箇所について算出し、前記粒子速度と前記音圧の組の複数から、時系列の複数のベクトルを求める算出部と、
    前記算出部が求めたベクトルの数を減らす圧縮処理を行う第1圧縮部と、
    して機能させることを特徴とする音声情報生成プログラム。
  2. 請求項1において、
    前記第1圧縮部は、前記算出部が求めたベクトルの一部または全部を、時間軸上で複数の時間領域に区分し、前記時間領域毎に前記圧縮処理を行う
    ことを特徴とする音声情報生成プログラム。
  3. 請求項2において、
    前記第1圧縮部は、前記音圧と閾値との比較結果に基づいて、前記区分を行う
    ことを特徴とする音声情報生成プログラム。
  4. 請求項2または請求項3において、
    前記第1圧縮部は、各時間領域における所定数のベクトルについて、前記音圧の合計値、および音の伝播方向を示す角度の平均値を算出し、算出した合計値および平均値を用いて、前記時間領域に対応する1つまたは複数のベクトルを生成する
    ことを特徴とする音声情報生成プログラム。
  5. 請求項1において、
    前記第1圧縮部は、音の伝播方向毎に前記音圧の合算値を求めることによって、前記伝播方向に対応するベクトルを生成する
    ことを特徴とする音声情報生成プログラム。
  6. 請求項1から請求項5の何れかにおいて、
    前記第1圧縮部は、時系列で並んだ所定数のベクトルを用いて、球面調和関数を生成する
    ことを特徴とする音声情報生成プログラム。
  7. 請求項1から請求項6の何れかにおいて、
    前記コンピュータを、
    記画像における位置によって前記第1圧縮部が生成したデータを探索するための探索データを生成する探索データ生成部として機能させる
    ことを特徴とする音声情報生成プログラム。
  8. 請求項7において、
    前記コンピュータを、
    前記探索データを、前記画像における位置を基準にグループ化し、前記グループ内において互いに類似する探索データを間引く第2圧縮部として機能させる
    ことを特徴とする音声情報生成プログラム。
  9. コンピュータを、
    与えられた再生情報にしたがって音声を再生する再生部と、
    像で示された空間における位置によって前記再生情報を探索するための探索データを保持する探索データ保持部と、
    前記位置と前記探索データに基づいて前記再生情報を探索して前記再生部に与える探索部と、
    して機能させ、
    前記再生情報は、前記空間における音圧と粒子速度の組に基づいて生成されたベクトルであり、
    前記音圧と前記粒子速度の組は、予め求められたものであり、
    前記探索データは、時間軸において圧縮された前記ベクトルに基づいて生成されたものである
    ことを特徴とする音声再生プログラム。
  10. 請求項9の音声再生プログラムを記憶した記憶部と、
    前記音声再生プログラムを実行する制御部と、
    を備えたことを特徴とする音声再生装置。
JP2020137506A 2020-08-17 2020-08-17 音声情報生成プログラム、音声再生プログラム、および音声再生装置 Active JP7248913B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020137506A JP7248913B2 (ja) 2020-08-17 2020-08-17 音声情報生成プログラム、音声再生プログラム、および音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020137506A JP7248913B2 (ja) 2020-08-17 2020-08-17 音声情報生成プログラム、音声再生プログラム、および音声再生装置

Publications (2)

Publication Number Publication Date
JP2022033546A JP2022033546A (ja) 2022-03-02
JP7248913B2 true JP7248913B2 (ja) 2023-03-30

Family

ID=80375281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020137506A Active JP7248913B2 (ja) 2020-08-17 2020-08-17 音声情報生成プログラム、音声再生プログラム、および音声再生装置

Country Status (1)

Country Link
JP (1) JP7248913B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002159097A (ja) 2000-11-22 2002-05-31 Univ Tokyo 音場シミュレーション装置および音場シミュレーション方法
US20180027350A1 (en) 2015-04-08 2018-01-25 Huawei Technologies Co., Ltd. Apparatus and method for driving an array of loudspeakers

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002159097A (ja) 2000-11-22 2002-05-31 Univ Tokyo 音場シミュレーション装置および音場シミュレーション方法
US20180027350A1 (en) 2015-04-08 2018-01-25 Huawei Technologies Co., Ltd. Apparatus and method for driving an array of loudspeakers

Also Published As

Publication number Publication date
JP2022033546A (ja) 2022-03-02

Similar Documents

Publication Publication Date Title
Raghuvanshi et al. Parametric directional coding for precomputed sound propagation
Tsingos et al. Perceptual audio rendering of complex virtual environments
WO2017047309A1 (ja) 耳形状解析方法、耳形状解析装置および耳形状モデル生成方法
CN112669417B (zh) 虚拟形象的生成方法、装置、存储介质及电子设备
WO2018019181A1 (zh) 确定音频延迟的方法及设备
CN113299312B (zh) 一种图像生成方法、装置、设备以及存储介质
US10911885B1 (en) Augmented reality virtual audio source enhancement
CN111986295A (zh) 舞蹈合成方法、装置及电子设备
JP2023059937A (ja) データインタラクション方法、装置、電子機器、記憶媒体、および、プログラム
Ehret et al. Evaluating the influence of phoneme-dependent dynamic speaker directivity of embodied conversational agents' speech
JP3617839B2 (ja) ゲームサウンド制御プログラム、ゲームサウンド制御方法およびゲーム装置
EP3699751A1 (en) Virtual scene
JP7248913B2 (ja) 音声情報生成プログラム、音声再生プログラム、および音声再生装置
CN113035164A (zh) 歌声生成方法和装置、电子设备及存储介质
Noufi et al. Reconstructing the dynamic directivity of unconstrained speech
JP6614241B2 (ja) 耳形状解析装置、情報処理装置、耳形状解析方法、および情報処理方法
CN109302668B (zh) 基于非中心点的声场重建方法、设备、存储介质及装置
JP6882785B2 (ja) 空間音響生成装置、空間音響生成システム、空間音響生成方法、および、空間音響生成プログラム
Garg et al. Visually-Guided Audio Spatialization in Video with Geometry-Aware Multi-task Learning
JP7458127B2 (ja) 処理システム、音響システム及びプログラム
CN114051105B (zh) 多媒体数据处理方法、装置、电子设备及存储介质
Martin et al. 3D audiovisual rendering and real-time interactive control of expressivity in a talking head
JP2012150278A (ja) 仮想空間のビジュアル変化に対応した音響効果の自動生成システム
CN109348398B (zh) 基于非中心点的声场重建方法、设备、存储介质及装置
JP2022182625A (ja) 音響可聴化装置及び音響可聴化プログラム

Legal Events

Date Code Title Description
A625 Written request for application examination (by other person)

Free format text: JAPANESE INTERMEDIATE CODE: A625

Effective date: 20220118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230227

R150 Certificate of patent or registration of utility model

Ref document number: 7248913

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150