JPH11143462A - 音響生成方法および音響生成装置および記録媒体 - Google Patents

音響生成方法および音響生成装置および記録媒体

Info

Publication number
JPH11143462A
JPH11143462A JP9312351A JP31235197A JPH11143462A JP H11143462 A JPH11143462 A JP H11143462A JP 9312351 A JP9312351 A JP 9312351A JP 31235197 A JP31235197 A JP 31235197A JP H11143462 A JPH11143462 A JP H11143462A
Authority
JP
Japan
Prior art keywords
sound
image
phoneme
power spectrum
arrangement position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9312351A
Other languages
English (en)
Other versions
JP3535360B2 (ja
Inventor
Miwako Doi
美和子 土井
Katsuyuki Murata
克之 村田
Akira Morishita
明 森下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP31235197A priority Critical patent/JP3535360B2/ja
Publication of JPH11143462A publication Critical patent/JPH11143462A/ja
Application granted granted Critical
Publication of JP3535360B2 publication Critical patent/JP3535360B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】単純な操作で所望の音響を容易に生成すること
ができる音響生成装置を提供する。 【解決手段】音響素の2次元あるいは3次元配置位置を
記憶する音響素記憶手段と、画像を取得する画像取得手
段と、この画像取得手段で取得した画像の前記音響素記
憶手段に記憶された音響素の配置位置に対する位置関係
と該画像の奥行き情報とに基づき前記音響素のパワース
ペクトルを算出する算出手段と、この算出手段で算出さ
れたパワースペクトルと前記音響素とに基づき音響を生
成する生成手段とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、取得した画像と音
響素の3次元配置位置とに基づき音響を生成する音響生
成装置に関する。
【0002】
【従来の技術】音楽を演奏するには、通常ピアノあるは
ギターなど、何らかの楽器を用いる。ピアノであれば、
鍵盤(キーボード)を楽譜に従って弾いていくことによ
り、楽曲となる。ギターであれば、弦を爪あるいはピッ
クアップではじくことにより、音楽を奏でることができ
る。このように従来の楽器では、楽器ごとに演奏方法も
奏でられる音も異なる。
【0003】シンセサイザーなどの電子楽器はこのよう
な難点を克服するために、作られたもので、キーボード
を弾くことにより演奏することはピアノと同一である
が、どのような音で演奏するか、音色などを選択できる
ようになっている。音色などが選択されると、内蔵のマ
イクロコンピュータの制御により、音色などのパラメー
タが変更され、音が生成される。
【0004】シンセサイザーにより、確かにいろいろな
音色などで楽曲を演奏し、楽しむことが可能になった。
が、キーボードを弾きながら、かつ音色の変更まで行っ
て、思うように楽しめるようになるには、かなりの訓練
を必要とするのも実状である。また、画面上に表示され
たシンセサイザーのキーボードやスライドバーなどをマ
ウスにより選択して、楽曲を演奏するような音楽ソフト
も販売されている。確かに大きなキーボードは不要にな
るので、狭い場所でもパソコン1台あれば、音楽の演奏
ができるというメリットはある。一方、キーボードを弾
く代わりに、マウスで一つ一つ選択していくので、手間
がかかるという問題がある。
【0005】このような従来の電子楽器の限界を打ち破
る新しい楽器Hyper Instruments(以
下、超楽器と呼ぶ)の研究がMITメディアラボのTo
mMachoverらにより行われている。例えば、デ
ータグローブ(手袋状で、指の部分に光ファイバーが配
線されており、この光ファイバーの導通により、指の関
節の曲がり角を計測する)を用いて、ジェスチャを入力
して、仮想的にギターなどを演奏するBug−Mudr
aの開発をおこなった。が、データグローブを装着する
のが負担となる他、データグローブの装着時にキャリブ
レーションを行っても、演奏していると手袋がずれるな
どして、ローバストに指関節の角度を計測することが難
しい。
【0006】また、同じくMachoverらは、電場
を形成する椅子に人間が座り、人間が動くと電場が変化
することを利用して、人間の身体の動きを計測し、その
結果に従って、音を生成するSensor Chair
というものの開発も行った。同様に空中にぶら下がる四
角い枠の中に電場を形成し、そこに差し込まれた手の動
きを電場の変化により計測し、音を生成するFrame
sの開発も行った。しかし、これらで奏でられる音は、
従来の楽曲の音とかなり異なったものであり、音楽らし
く演奏するには、従来の古典的な楽器以上の技術を要す
るという問題がある。
【0007】一方、画面上のマウスポインタの指し示す
位置にある色を音に変換することで、音を生成するよう
なプログラムが存在する。この場合、色と音の対応はあ
らかじめ決まっており、また、マウスポインタの位置に
ある色は一色なので、同時に一音しか生成されない。こ
れを利用して、マウスのボタンをクリックし続け、上手
にメロディラインを生成することは大変難しく、また、
単音のみなので、メロディライン以上の音楽を生成する
ことは困難である。
【0008】
【発明が解決しようとする課題】キーボードを弾く、あ
るいはギターを弾くというような従来の古典的な楽器の
演奏法によらず、より直感的な演奏方法の実現では、T
od MachoverらのSensor Chair
や、Framesのように、あまりにも前衛的な音にな
り、音楽らしく演奏するためには、それなりの訓練を必
要とする。
【0009】マウスポインタの指し示す位置にある表示
色を単純に色に変換する方法は、単純すぎて、音楽とし
てふくらみのある音にならない、また、マウスポインタ
を押し続けるのは、困難であるという問題がある。そこ
で、本発明は、単純な操作で所望の音響を容易に生成す
ることが可能な音響生成方法およびそれを用いた音響生
成装置を提供することを目的とする。
【0010】
【課題を解決するための手段】(1)本発明の音響生成
方法(請求項1)は、取得した画像の奥行き情報と、該
画像の音響素の2次元配置位置に対する位置関係とに基
づき該音響素のパワースペクトルを算出し、この算出さ
れたパワースペクトルと該音響素とに基づき音響を生成
することにより、単純な操作で所望の音響を容易に生成
することができる。
【0011】本発明の音響生成装置(請求項3)は、音
響素の2次元配置位置を記憶する音響素記憶手段と、画
像を取得する画像取得手段と、この画像取得手段で取得
した画像の前記音響素記憶手段に記憶された音響素の配
置位置に対する位置関係と該画像の奥行き情報とに基づ
き前記音響素のパワースペクトルを算出する算出手段
と、この算出手段で算出されたパワースペクトルと前記
音響素とに基づき音響を生成する生成手段と、を具備す
る。 (2)本発明の音響生成方法(請求項2)は、取得した
画像の奥行き情報と、該画像の音響素の3次元配置位置
に対する位置関係とに基づき該音響素のパワースペクト
ルを算出し、この算出されたパワースペクトルと該音響
素とに基づき音響を生成することにより、単純な操作で
所望の音響を容易に生成することができる。
【0012】また、本発明の音響生成装置(請求項4)
は、音響素の3次元配置位置を記憶する音響素記憶手段
と、画像を取得する画像取得手段と、この画像取得手段
で取得した画像の前記音響素記憶手段に記憶された音響
素の配置位置に対する位置関係と該画像の奥行き情報と
に基づき前記音響素のパワースペクトルを算出する算出
手段と、この算出手段で算出されたパワースペクトルと
前記音響素とに基づき音響を生成する生成手段と、を具
備する。 (3)また、本発明の音響生成装置(請求項5)は、前
記画像取得手段で取得された画像を記憶する画像記憶手
段を具備し、前記算出手段は、前記画像記憶手段に記憶
された画像の前記音響素の配置位置に対する位置関係と
該画像の奥行き情報とに基づき前記音響素のパワースペ
クトルを算出することにより、音響素の配列が不変のと
きには同一の音響を何度も生成することができる。
【0013】また、本発明の音響生成装置(請求項6)
は、前記音響素の配置位置を変更する変更手段を具備し
たことにより、単純な操作で所望の音響を容易に生成す
ることができる。例えば、取得した身振りや手振りの画
像に合わせるように、生成された音響をさらに変更する
ことができる。
【0014】また、本発明の音響生成装置(請求項7)
は、前記音響素のパワースペクトルおよび配置位置のう
ちの少なくとも1つを予め定められた規則に従って変更
する変更手段を具備することにより、単純な操作で所望
の音響を容易に生成することができる。例えば、取得し
た身振りや手振りの画像の動きが単調なときも、変化あ
る音響を生成することができる。
【0015】本発明の音響生成装置(請求項8)は、前
記音響素のパワースペクトルおよび配置位置のうちの少
なくとも1つを与えられた音楽ファイルから抽出される
情報に基づき変更する変更手段を具備することにより、
単純な操作で所望の音響を容易に生成することができ
る。例えば、BGM(バックグランドミュージック)に
合わせた音響の生成が可能となる。
【0016】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。 (第1の実施形態)図1は、第1の実施形態に係る音響
生成装置の構成を概略的に示したものである。図1に示
すように、音響生成装置は、手振りや身振りなどの画像
で、奥行き値の判別可能な画像(以下、奥行き画像と呼
ぶ)を取得するためのカメラなどの撮像手段から構成さ
れる画像取得部1と、例えば周波数がそれぞれ異なる複
数の音響素の2次元的あるいは3次元的な配置位置を記
憶する音響素記憶部2と、画像取得部1が取得した手振
りや身振りの奥行き画像から抽出されるxy平面の画像
と音響素記憶部2に記憶された音響素の配置位置とから
該xy平面の画像と重なる位置に配置された音響素を選
択し、この選択された音響素と、奥行き画像から判別さ
れるz値(奥行き情報)を基に算出された該選択された
各音響素のパワースペクトルとから音響を生成する音響
素演算部4と、3次元音響素演算部4で用いるパワース
ペクトルを算出するパワースペクトル算出部5と、音響
素演算部4の演算結果を音として提示する音響生成部7
と、音響素記憶部2に記憶された音響素の配置位置、画
像取得部1にて取得された手振りや身振りなどの奥行き
画像、音響素演算部4の演算結果を表示する表示部6
と、上記各部の間で各種情報をやり取りを制御する情報
管理部3から構成されている。
【0017】図2は、音響素記憶部2に記憶されている
音響素の配置位置の記憶形式の一例を示したもので、音
響素の種別とその種別の音響素が配置される位置が複数
格納されている。
【0018】ここで、音響素の種別とは、例えば、周波
数の違いによる種別を用いることにする。また、図2に
示した記憶形式によれば、ある1つの周波数の音響素を
1カ所のみに配置するだけでなく、あちこちに散在させ
ることもできる。
【0019】図2の場合は、音響素を2次元的に配置す
る場合の例を示しているので、それぞれの位置座標に
は、x座標とy座標の組み合わせが格納されている。各
アドレスの最終セルには、続きのアドレスが格納されて
れている。この部分に「NULL」が書き込まれれば、
次データがないことを示す。
【0020】図3は、図2の記憶形式で記憶されている
音響素を表示部6に表示する際の画面表示例を示したも
のである。図3では、100Hzから4.0KHzの周
波数の音響素が配列されている。参考のために、オーケ
ストラの調音に使われる「A(アー)」(「ラ」にあた
る)の音が440Hzである。
【0021】なお、どの周波数の音響素をどのように配
置するかは、例えば、本発明の音響生成装置の用途に応
じて任意に設定することができる。図2には音響素を2
次元的に配置する場合の音響素の記憶例を示したが、必
ずしも、これに限定されるものではない。例えば、3次
元的に配置する場合も可能である。
【0022】図4は、音響素記憶部2に記憶されている
音響素の配置位置の他の記憶例で、音響素を3次元的に
配置する場合を示している。図4では記憶されている各
音響素の位置座標は、 x座標、y座標、 z座標の3つの
座標の組になっている。
【0023】図5は、図4の記憶形式で記憶されている
音響素を表示部6に表示する際の画面表示例を示したも
ので、各音響素が3次元的に配置されている。図5で
は、各音響素は円柱の形状で表示されているが、これに
限定されるものではない。球でも、円錐でも、立方体で
も、あるいはもっと複雑な形でもよい。
【0024】図6は、画像取得部1で取得した画像の一
例として、手の画像を示している。この手の画像は、x
座標、y座標、z座標を有する3次元画像になってい
る。取得方法に関しては、従来の画像処理によりビデオ
カメラで取得した動画を解析し、エッジなどの切りだし
を行って形状を切り出す方法がある。が、従来の画像処
理では、奥行き値までは切り出せないので、ここでは、
特願平第9−299648号に記載の画像取得方法によ
り、奥行き値(z座標値)の判別できる画像(奥行き画
像)が取得できていると想定し、本発明の動作を説明す
る。すなわち、奥行き値は、画素の濃淡による階調度に
基づく値であるとする。
【0025】図7は、図6で示した手の奥行き画像を用
いて、例えば図3に示したような2次元的に配置された
音響素から音を発生させている(奏でている)ところの
様子を示したもので、例えば、表示部6に既に表示され
ている図3の2次元的に配列された音響素のイメージに
画像取得部1で取得された手の画像をオーバーラップす
ることにより、表示部6に図7に示したように表示され
ていてもよい。
【0026】同様に、図8は、図6で示した手の奥行き
画像を用いて、例えば図5に示したような3次元的に配
置された音響素から音を発生させている(奏でている)
ところの様子を示したものである。
【0027】以下、説明を簡単にするため、図7の2次
元的に配置された音響素を奏でる場合を例にとり図1の
音響生成装置の動作を説明する。図9は、図1の音響生
成装置の動作を説明するためのフローチャートで、情報
管理部3の制御の下、図1の各部が以下の動作を実行す
るようになっている。
【0028】まず、情報管理部3は、音響素記憶部2に
予め記憶されている、例えば、図2に示したような形式
で記憶されている音響素データを読み込み(ステップS
1)、その読み込んだ音響素データを表示部6に送り、
例えば、図3に示したように表示する(ステップS
2)。その後、画像取得部1からの画像の入力待ち状態
となる。
【0029】情報管理部3は、画像取得部1での画像取
得が開始されると、画像取得部1から画像取得終了の指
示がない限り、例えば毎秒30フレームで、図6に示し
たような画像を取得する(ステップS3〜ステップS
4)。終了の指示があった場合には(ステップS3)、
処理を終了する。
【0030】画像取得部1が取得した画像は、例えば、
図10に示すような形式の奥行き画像になっている。図
10は、たとえば、x軸(横)方向16画素、y軸
(縦)方向16画素、z軸(奥行き)方向256階調の
画像になっている。つまり、縦横16x16の行列に、
奥行き方向の値(奥行き値)が格納されている。図10
に示した例では、奥行き値は大きいほど音響素の配置位
置から近いことを示している。つまり、奥行き値「0」
は、撮像物体がない、あるいはあっても遠方でないのと
同じであり、奥行き値「255」は、最も近い場所に撮
像物体があることを示す。
【0031】すでに表示部6に図3に示したように音響
素が表示されているところに、取得した奥行き画像のう
ち、ある閾値以上の奥行き値を有する画素を抽出してな
る画像をオーバーラップさせて、例えば、図7に示した
ように表示する(ステップS5)。
【0032】次に、ステップS6において、パワースペ
クトル算出部5は、画像取得部1にて取得された図10
に示したような画像の奥行き値を用いて、パワースペク
トルの算出を行う。パワースペクトルの算出方法として
は、例えば、手の画像が干渉している音響素に対し、干
渉部分の奥行き値を、その音響素のパワー値として換算
するようにしてもよい。
【0033】音響素演算部4では、例えば、手の画像が
干渉している音響素と、その音響素の算出されたパワー
スペクトルに基づき、3次元的な(奥行きのある)音を
生成するための演算を行い、その演算結果に基づき音響
生成部7で実際の音を生成する(ステップS7)。
【0034】次に、音響素演算部4とパワースペクトル
算出部5におけるパワースペクトルの算出方法につい
て、図11に示すフローチャートを参照して説明する。
また、図12は、算出された各音響素毎のパワースペク
トルの一例をグラフにて示したものである。
【0035】まず、初期化を行う(ステップS11)。
すなわち、算出結果としての各音響素ごとのパワースペ
クトルを格納する行列Xij(以下、簡単にパワー行列
と呼ぶ)と、パワー行列Xijに音響素の種別(例え
ば、種別として周波数)毎に各音響素のパワー値が格納
できるように、その種別を識別するための変数iとをク
リアし、音響素記憶部2に格納されている音響素の配置
位置を読み出すためのアドレスSに先頭のアドレス(図
2の場合、「p1」)をセットする。
【0036】次に、アドレスSに格納されている音響素
の位置(座標値)から、奥行き画像(図10参照)との
干渉の有無(配置位置に基づく音響素の存在位置範囲に
奥行き画像の画素と重なり合う部分があるか否か)をチ
ェックする(ステップS12)。
【0037】その音響素が奥行き画像の1または複数の
画素とが干渉していれば、まず、アドレスSの音響素の
種別(図2の場合、S=p1のとき音響素の種別は「音
1」)を、行列Xi1に格納する。そして、干渉してい
る画素の奥行き値をXi2に順次重畳する(ステップS
13)。
【0038】図2に示したように、音響素記憶部2に
は、同一のアドレス「p1」(すなわち、同一の種別、
この場合、同一の周波数の音響素)に対し、複数の位置
が記憶されているので、異なる位置に配置されている音
響素があるかどうか調べる(ステップS14)。あれ
ば、ステップS12に戻り、その位置にある音響素と画
素との干渉の有無を調べ、干渉していれば、ステップS
13にて、上記パワー行列Xi2に、その干渉している
画素の奥行き値を重畳(例えば、加算)していく。同様
に、ステップS12において、その音響素の位置と干渉
している画素がない場合も、それとは異なる位置に配置
されている同一種別の音響素が干渉しているかもしれな
いので、それを調べられるように、ステップS14に進
む。
【0039】ステップS14において、同一種別(すな
わち、同一アドレスに記憶されている、例えば同一の周
波数)の全ての音響素に対し、干渉の有無をチェックし
終わると、ステップS15に進み、次の種別の音響素
(すなわち、例えば、アドレス「p2」)に対して、上
記同様の処理(ステップS12〜ステップS14)を行
うため、アドレス変数Sと、変数iのインクリメントを
行う。図2に示したような記憶形式の場合、各種別の音
響素の記憶領域の最終セルに他の種別の音響素の配置位
置を記憶している記憶領域のアドレスが格納されている
ので、それをアドレス変数Sに格納する。このとき、最
終セルに格納されているアドレスが「NULL」のとき
は(ステップS16)、全ての音響素に対する演算を終
了したことになるので処理を終了する。
【0040】ステップS15でアドレス変数Sと変数i
が更新され、ステップS16でアドレス変数Sが「NU
LL」でないとき、再びステップS12に戻り、上記処
理を繰り返す。
【0041】このようにして算出されたパワースペクト
ルの一例を図12に示す。図12では、取得画像と干渉
する各周波数の音響素毎(Xi1)に対し、そのパワー
行列Xi2の値を棒グラフの長さで示している。
【0042】図12に示したようなパワースペクトルの
算出結果は、そのまま表示部6に表示されてもよい。図
12の100Hzの音響素のパワー値を算出する場合を
例にとり、図11の処理の流れを具体的に説明する。図
7では、100Hzの音響素のところに、画像中の人差
し指の部分が干渉している。従って、ステップS12で
は干渉ありと判定され、その干渉している画素(例えば
2つ)の奥行き値が、例えば、図10より「33」、
「74」であるとする。ステップS13では、この2つ
の画素の奥行き値がパワー行列に重畳され、結果とし
て、100Hzの音響素のパワー値が33+74=10
7と算出される。音響素100Hzが配置されているの
は、この1カ所だけなので、この「107」がそのまま
100Hzのパワー値となる。
【0043】なお、上記説明では、各周波数毎の音響素
のパワー値として、その音響素に干渉する画素の奥行き
値の和をそのまま用いているが、必ずしも、パワー値=
奥行き値とする必要はなく、例えば、干渉する画素の奥
行き値を重畳する際に、その画素の奥行き値に対し、以
下のような操作を行ってもよい。
【0044】 1)パワー値=奥行き値×α (α:任意の値) 2)パワー値=(奥行き値) 3)パワー値=k×奥行き値 4)パワー値=F(x、y)×奥行き値(F(x、
y):奥行き値のxy平面上の分布に依存する重み値) 5)パワー値=F(x)×奥行き値(F(x):奥行き
値のx軸上の分布に依存する重み値) 6)パワー値=F(y)×奥行き値(F(y):奥行き
値のy軸上の分布に依存する重み値) 図5に示したように、各音響素が3次元的に配置されて
いる場合、図11のステップS12では、画素の奥行き
値も使って干渉チェックをおこなう。例えば、画素のx
y平面上の座標値および奥行き値と、音響素の座標値と
から、該画素と該音響素との間の距離を求め、その距離
が予め定められた閾値より小さい場合に、該画素と該音
響素間とが干渉していると判断する。そして、図11の
ステップS13で音響素のパワー値を求める際には、前
述同様な操作にて行ってもよいが、必ずしも奥行き値に
限定される必要はない。例えば、単純に、その音響素の
位置に干渉している画像の面積(画素の数)をそのま
ま、あるいは、その画像の面積に対し、上記1)〜6)
の操作を行ってパワー値を算出するようにしてもよい。
【0045】さて、図12に示したようなパワースペク
トルにて各音響素を発音させれば手の動きに沿った音響
は発生することができる。ただし、単に図12のような
パワーで各音響素を発音しただけでは、連続的な音にな
らない。
【0046】そこで、音響素演算部4では、フーリエ逆
変換により、パワースペクトル算出部5にて算出された
図12に示したような周波数軸上のスペクトルを、時間
軸上で変位する波形に変化させる。すなわち、算出され
た各音響素のパワーを振幅とした、その各音響素の周波
数の正弦波を発生させ(例えば、各音響素に種別に対応
した波形を記憶する波形テーブルを具備してもよい)、
これを畳み込み積分することで、最終的な全体の波形を
生成する。
【0047】図12に基づき具体的に説明すると、ま
ず、図12に示したパワーを振幅として、それぞれの周
波数で正弦波を発生させる。例えば、図12の100H
zの音響素のパワー値は107dBなので、図13に示
すように、これを振幅とした100Hzの正弦波を生成
する。また、図12の200Hzの音響素に対しても同
様に、図14に示すように、そのパワー値を振幅とした
200Hzの正弦波を生成する。このようにして、図1
2の各周波数に対し算出された正弦波(三角関数)を全
ての周波数について積分することにより、図15に示す
ような波形が得られる。
【0048】音響生成部7では、図15に示した波形の
音響を発生する。画像取得部1で取得される画像が毎秒
30フレームであるとすると、図15に示した波形の音
響が1/30秒毎に発生する。すなわち、毎秒30種の
音響が生成されることになる。(第1の実施形態の効
果)以上説明したように、上記第1の実施形態によれ
ば、音響素の2次元あるいは3次元配置位置を記憶する
音響素記憶部2と、画像取得部1で所望の対象物の画像
(奥行き画像)を取得したら、パワースペクトル算出部
5で、その画像の奥行き情報とと音響素記憶部2に記憶
された音響素の2次元あるいは3次元配置位置に対する
位置関係とに基づき音響素のパワースペクトルを算出
し、音響素演算部4ではこの算出されたパワースペクト
ルと該音響素とに基づき音響を生成することにより、単
純な操作(例えば、手や体を動かすこと)で膨らみのあ
る音色を生成することが容易に行える。
【0049】奥行き画像を用いて、大変安価にかつ、小
さな計算負荷でリアルタイムに音響素を発音できるの
で、小さい子供から高齢者まで、誰もが、ほとんど練習
などしたりせずに、直感的に、演奏を楽しむことがで
き、その効果は大きい。 (第1の実施形態の変形例)なお、上記第1の実施形態
では、人間の手振りや身振りなどの奥行き画像を取得
し、音響素と演算する場合について説明したが、本発明
は、必ずしもこれに限定されるものではない。例えば、
人間の手振りや身振りのかわりに、金魚や小鳥などのペ
ットの画像を撮像し、これらの奥行き画像と音響素とを
演算し、ペットによる環境音楽(BGM)を生成するこ
とも可能である。
【0050】この場合、例えば、各種ペットの特性に応
じて異なる音響素の種別、配列を適用できるよう、音響
素記憶部2に、図2に示したような各種ペットの特性に
応じた音響素の配列テーブルを複数個記憶しておく。ユ
ーザから情報管理装置3に対し、ペットの種類が指定さ
れると、そのペットの種類に応じて、音響素の配列テー
ブルを切り替えるようにしてもよい。
【0051】また、上記第1の実施形態では、まったく
無音の状態で、距離画像と音響素の干渉から得られたパ
ワーで発音することを想定しているが、必ずしもこれに
限定されるものではない。例えば、いくつかの音響素が
あるパワー値を有し、発音させた状態(アクティブ)
で、それに、例えば図12のパワーを重畳させた演奏も
可能である。 (第2の実施形態)図16は、本発明の第2の実施形態
に係る音響生成装置の構成を概略的に示したものであ
る。なお、図16において、図1と同一部分には同一符
号を付し、異なる部分についてのみ説明する。すなわ
ち、図16では、図1の構成にさらに、音響素編集部8
が追加されている。
【0052】音響素編集部8は、音響素記憶部2に予め
記憶されている音響素の配置位置を変更するためのもの
である。これにより、例えば、取得した身振りや手振り
にあわせて生成される音響を変更することができる。
【0053】図17は、表示部6に表示された音響素の
配列を変更する際の編集中の画面表示例を示したもので
ある。例えば、表示部6に図3に示したように表示され
ている音響素のうちの1つを選択して、その音響素を表
示画面中の所望の位置にコピーあるいは移動したり、ま
た、配列から削除したりする編集を行う、さらに、編集
結果を音響素編集部8から音響素記憶部2に保存するよ
うにしてもよい。
【0054】図17では、中央右上の400Hzの音響
素が選択されて(反転表示になっている)、中央左下へ
コピーしているところを示している。図18は、図16
に示した音響生成装置の動作を説明するためのフローチ
ャートで、図9と異なる部分は、ステップS3とステッ
プS4の間にステップS21、ステップS22が追加さ
れている。すなわち、ステップS3で画像取得が終了し
たら、ステップS21に進み、情報管理部3は、まず、
音響素の編集指示があるか否かチェックする。音響素の
編集指示があったときは、ステップS22に進み、例え
ば、図17を参照して説明したような音響素の編集処理
を実行する。
【0055】図16に示した音響生成装置を用いて、あ
る音響素の配列に対し、一度演奏を行い、その後、音響
素編集部8を用いて音響素の配列を変更したとする。こ
の場合、編集の効果が自分が満足いくものかどうか、音
響素の編集を行う前の演奏に対して確認したいものであ
る。が、通常、前回と全く同じ動きを再現することは難
しい。このような欠点を補うために、例えば、図19に
示すような先に画像取得部1で取得された画像(奥行き
画像)を記憶するための画像記憶部9を、図16の構成
部に追加してもよい。
【0056】画像記憶部9は、画像取得部1で取得され
た一連の奥行き画像を圧縮などして記憶し、音響素の編
集後に、その記憶された奥行き画像を呼び出して、その
奥行き画像と音響素の配置位置に基づき、パワースペク
トル算出部5、音響素演算部4にて上記同様の処理を実
行することにより、編集前と比較して編集した音響素の
配列が満足のいく音響を生成するものとなったかどうか
を確認することが容易に行える。
【0057】この画像記憶部9に記憶された一連の奥行
き画像を、表示部6に表示して確認すると、奥行き画像
をアニメーションとして確認できる。具体的には、例え
ば、図6に示したような手の動く様子を確認することが
できる。あるいは、図3に示す音響素の配列の表示に画
像記憶部9に記憶された一連の奥行き画像を重ねて表示
することにより、図7に示したように、手の動きに合わ
せて、演奏される音を確認することができる。
【0058】このように、画像記憶部9に奥行き画像を
記憶して、その記憶された奥行き画像を呼び出すこと
で、音響素の配列が不変のときには同一の音響を何度も
生成することができる。なお、この場合でも音響素の配
列を変えれば音響も変わる。(第2の実施形態の効果)
以上説明したように、上記第2の実施形態によれば、音
響素編集部8で音響素の配置位置を変更(コピー、移
動、削除)することにより、ユーザは自分の好みにあわ
せた演奏(音響生成)を容易に行うことができる。
【0059】また、画像取得部1で取得された画像を記
憶する画像記憶部9を具備し、この画像記憶部9から所
望の画像を呼び出して、パワースペクトル算出部5、音
響素演算部4で、この呼び出した画像と音響素の配置位
置とから音響を生成することにより、音響素の配列が不
変のときには同一の音響を何度も生成することができ
る。 (第3の実施形態)図20は、第3の実施形態に係る音
響生成装置の構成を概略的に示したものである。なお、
図20において、図1と同一部分には同一符号を付し、
異なる部分についてのみ説明する。すなわち、図20で
は、図1の構成にさらに、音響素の配置位置、パワース
ペクトルを時系列的に変化させるための時系列変形部1
0が追加されている。
【0060】第1の実施形態で、いくつかの音響素があ
るパワー値を有し、発音させた状態(アクティブ)で、
それに、例えば図12のパワーを重畳させた演奏も可能
であることを述べたが、ここでは、それを応用して、時
系列変形部10が、音響素のパワースペクトルを時系列
に変化させるようになっている。すなわち、時系列変形
部10は、例えばsin、cosなどの三角関数等、何
らかの関数を用いて、各音響素のパワー値を時系列的に
変化させるようになっている。
【0061】例えば、時系列変形部10でいくつかの任
意の音響素のパワーを時系列的に変化させながら、音響
素が発音されている状態(例えば、図12のようなグラ
フ中の各音響素(周波数)のパワー値が1/K秒毎に上
下に変化している状態)で、その各音響素のパワー行列
に、画像取得部1で例えば1/30秒毎に取得される画
像に基づくパワー値(例えば、図12の各音響素のパワ
ー値)を、取得する度に重畳していくこともできる。
【0062】時系列変形部10は、音響素のパワー値の
みに限らず、上記同様にして、時系列変形部10のもつ
三角関数等に応じて音響素の配置位置自体を変化させる
こともできる。例えば、図5のような音響素が3次元的
に配置されているときには、音響素のz軸方向(奥行き
方向)の長さを変化させて、その形状を変形するように
してもよい。
【0063】時系列変形部10が音響素のパワースペク
トル、配置位置等を時系列に変形するのに、例えば、M
IDI(Music Instrument Digi
tal Information)ファイルなどのよう
に、音楽情報が格納されているファイルから、格納され
ている音楽情報を用いて、時系列に変形させることも可
能である。
【0064】このように音楽ファイルにあわせた時系列
の変形を行うには、例えば、図21のように、図20の
構成にさらに、音楽情報入力部11を追加して、ここ
で、与えられた音楽ファイルから音楽情報(たとえば、
音の高さ、大きさ)を抽出して、それに基づき時系列変
形部10が音響素の周波数、パワー値等を変化させるよ
うにしてもよい。 (第3の実施形態の効果)以上説明したように、上記第
3の実施形態によれば、時系列変形部10で、音響素の
パワースペクトルおよび配置位置のうちの少なくとも1
つを予め定められた規則(例えば、時間を変数とする三
角関数)に従って変更することにより、例えば、画像を
取得する対象に大きな動きがない場合、例えば、金魚な
どのようなペットの場合でも、時系列に音響素のパワー
スペクトルや配置位置が変化しているので、単調な演奏
になるのを防ぐことができる。
【0065】また、音楽情報入力部11で音楽ファイル
(例えばMIDIファイル)から抽出された情報に基づ
き、時系列変形部10で音響素のパワースペクトルおよ
び配置位置のうちの少なくとも変更する変更ことによ
り、BGM(バックグラウンドミュージック)にあわせ
た音響を生成することができる。
【0066】なお、上記第1から第3の実施形態で説明
した手法は、コンピュータに実行させることのできるプ
ログラムとして、磁気ディスク(フロッピーディスク、
ハードディスクなど)、光ディスク(CD−ROM、D
VDなど)、半導体メモリなどの記録媒体に格納して頒
布することもできる。すなわち、図9、図18に示した
フローチャートの従った処理を記述したプログラムを格
納した所定の記録媒体をパーソナルコンピュータ等に実
行させた場合も、上記第1〜第3の実施形態の説明と同
様である。
【0067】
【発明の効果】以上説明したように、本発明によれば、
単純な操作で所望の音響を容易に生成することができ
る。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る音響生成装置の
構成例を示した図。
【図2】音響素記憶部に記憶されている音響素の配置位
置の記憶例で、音響素を2次元的に配置する場合を示し
た図。
【図3】図2の記憶形式で記憶されている音響素を表示
部に表示する際の画面表示例を示した図。
【図4】音響素記憶部に記憶されている音響素の配置位
置の他の記憶例で、音響素を3次元的に配置する場合を
示した図。
【図5】図4の記憶形式で記憶されている音響素を表示
部に表示する際の画面表示例を示した図。
【図6】画像取得部で取得した画像の一例として、手の
画像を示した図。
【図7】図6で示した手の奥行き画像を用いて、図3の
2次元的に配置された音響素から音を発生させる場合に
ついて説明するための図。
【図8】図6で示した手の奥行き画像を用いて、図5の
3次元的に配置された音響素から音を発生させる場合に
ついて説明するための図。
【図9】図1の音響生成装置の動作を説明するためのフ
ローチャート。
【図10】画像取得部で取得される画像(奥行き画像)
の奥行き値について説明するための図。
【図11】パワースペクトル算出処理を説明するための
フローチャート。
【図12】算出された各音響素毎のパワースペクトルの
一例を示したグラフ。
【図13】図12の100Hzの音響素の正弦波(振幅
がパワー値)の一例を示した図。
【図14】図12の200Hzの音響素の正弦波(振幅
がパワー値)の一例を示した図。
【図15】算出された各音響素のパワー値を振幅とした
各音響素の正弦波を重畳して生成された正弦波の一例を
示した図。
【図16】本発明の第2の実施形態に係る音響生成装置
の構成例を示した図。
【図17】表示部に表示された音響素の配列を変更する
際の編集中の画面表示例を示した図。
【図18】図16の音響生成装置の動作を説明するため
のフローチャート。
【図19】本発明の第2の実施形態に係る音響生成装置
の他の構成例で、画像記憶部を具備している場合を示し
た図。
【図20】本発明の第2の実施形態に係る音響生成装置
のさらに他の構成例で、時系列変形部を具備している場
合を示した図。
【図21】本発明の第2の実施形態に係る音響生成装置
のさらに他の構成例、音楽情報入力部を具備している場
合を示した図。
【符号の説明】
1…画像取得部 2…音響素記憶部 3…情報管理部 4…音響素演算部 5…パワースペクトル算出部 6…表示部 7…音響生成部 8…音響編集部 9…画像記憶部 10…時系列変形部 11…音楽情報入力部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 取得した画像の奥行き情報と、該画像の
    音響素の2次元配置位置に対する位置関係とに基づき該
    音響素のパワースペクトルを算出し、この算出されたパ
    ワースペクトルと該音響素とに基づき音響を生成するこ
    とを特徴とする音響生成方法。
  2. 【請求項2】 取得した画像の奥行き情報と、該画像の
    音響素の3次元配置位置に対する位置関係とに基づき該
    音響素のパワースペクトルを算出し、この算出されたパ
    ワースペクトルと該音響素とに基づき音響を生成するこ
    とを特徴とする音響生成方法。
  3. 【請求項3】 音響素の2次元配置位置を記憶する音響
    素記憶手段と、 画像を取得する画像取得手段と、 この画像取得手段で取得した画像の前記音響素記憶手段
    に記憶された音響素の配置位置に対する位置関係と該画
    像の奥行き情報とに基づき前記音響素のパワースペクト
    ルを算出する算出手段と、 この算出手段で算出されたパワースペクトルと前記音響
    素とに基づき音響を生成する生成手段と、 を具備したことを特徴とする音響生成装置。
  4. 【請求項4】 音響素の3次元配置位置を記憶する音響
    素記憶手段と、 画像を取得する画像取得手段と、 この画像取得手段で取得した画像の前記音響素記憶手段
    に記憶された音響素の配置位置に対する位置関係と該画
    像の奥行き情報とに基づき前記音響素のパワースペクト
    ルを算出する算出手段と、 この算出手段で算出されたパワースペクトルと前記音響
    素とに基づき音響を生成する生成手段と、 を具備したことを特徴とする音響生成装置。
  5. 【請求項5】 前記画像取得手段で取得された画像を記
    憶する画像記憶手段を具備し、前記算出手段は、前記画
    像記憶手段に記憶された画像の前記音響素の配置位置に
    対する位置関係と該画像の奥行き情報とに基づき前記音
    響素のパワースペクトルを算出することを特徴とする請
    求項3または4記載の音響生成装置。
  6. 【請求項6】 前記音響素の配置位置を変更する変更手
    段を具備したことを特徴とする請求項3または4記載の
    音響生成装置。
  7. 【請求項7】 前記音響素のパワースペクトルおよび配
    置位置のうちの少なくとも1つを予め定められた規則に
    従って変更する変更手段を具備したことを特徴とする請
    求項3または請求項4記載の音響生成装置。
  8. 【請求項8】 前記音響素のパワースペクトルおよび配
    置位置のうちの少なくとも1つを与えられた音楽ファイ
    ルから抽出される情報に基づき変更する変更手段を具備
    したことを特徴とする請求項3または請求項4記載の音
    響生成装置。
  9. 【請求項9】 取得した画像と音響素の2次元配置位置
    とに基づき音響を生成するためのプログラムを記録した
    機械読み取り可能な記録媒体であって、 音響素の2次元配置位置を記憶させる音響素記憶手段
    と、 画像を取得させる画像取得手段と、 この画像取得手段で取得された画像の前記音響素記憶手
    段で記憶された音響素の配置位置に対する位置関係と該
    画像の奥行き情報とに基づき前記音響素のパワースペク
    トルを算出させる算出手段と、 この算出手段で算出されたパワースペクトルと前記音響
    素とに基づき音響を生成させる生成手段と、 を実行するプログラムを記憶した記憶媒体。
  10. 【請求項10】 取得した画像と音響素の3次元配置位
    置とに基づき音響を生成するためのプログラムを記録し
    た機械読み取り可能な記録媒体であって、 音響素の3次元配置位置を記憶させる音響素記憶手段
    と、 画像を取得させる画像取得手段と、 この画像取得手段で取得された画像の前記音響素記憶手
    段で記憶された音響素の配置位置に対する位置関係と該
    画像の奥行き情報とに基づき前記音響素のパワースペク
    トルを算出させる算出手段と、 この算出手段で算出されたパワースペクトルと前記音響
    素とに基づき音響を生成させる生成手段と、 を実行するプログラムを記憶した記憶媒体。
JP31235197A 1997-11-13 1997-11-13 音響生成方法および音響生成装置および記録媒体 Expired - Fee Related JP3535360B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31235197A JP3535360B2 (ja) 1997-11-13 1997-11-13 音響生成方法および音響生成装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31235197A JP3535360B2 (ja) 1997-11-13 1997-11-13 音響生成方法および音響生成装置および記録媒体

Publications (2)

Publication Number Publication Date
JPH11143462A true JPH11143462A (ja) 1999-05-28
JP3535360B2 JP3535360B2 (ja) 2004-06-07

Family

ID=18028209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31235197A Expired - Fee Related JP3535360B2 (ja) 1997-11-13 1997-11-13 音響生成方法および音響生成装置および記録媒体

Country Status (1)

Country Link
JP (1) JP3535360B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2629740B2 (ja) 1987-10-02 1997-07-16 ヤマハ株式会社 音響処理装置

Also Published As

Publication number Publication date
JP3535360B2 (ja) 2004-06-07

Similar Documents

Publication Publication Date Title
Wanderley et al. Gestural control of sound synthesis
Hunt et al. Mapping performer parameters to synthesis engines
JP3601350B2 (ja) 演奏画像情報作成装置および再生装置
Momeni et al. Characterizing and controlling musical material intuitively with geometric models
Egges et al. Personalised real-time idle motion synthesis
US9123318B2 (en) Object based musical composition performance apparatus and program
JP6699677B2 (ja) 情報処理方法、情報処理装置およびプログラム
TW558715B (en) Music and image generating device
JP2022115956A (ja) 情報処理方法、情報処理装置およびプログラム
JP5408205B2 (ja) 制御点設定方法、制御点設定装置及びプログラム
JP3978506B2 (ja) 楽音生成方法
Lin et al. An intelligent virtual piano tutor
Zlatintsi et al. A web-based real-time kinect application for gestural interaction with virtual musical instruments
Willemsen et al. Resurrecting the tromba marina: A bowed virtual reality instrument using haptic feedback and accurate physical modelling
Borchers et al. MICON: a music stand for interactive conducting
JP3535360B2 (ja) 音響生成方法および音響生成装置および記録媒体
JPH09160575A (ja) カラオケ表示装置
Mandanici et al. A conceptual framework for motion based music applications
Ren et al. Interactive virtual percussion instruments on mobile devices
Frisson et al. Multimodal guitar: Performance toolbox and study workbench
Martin Touchless gestural control of concatenative sound synthesis
JP4337288B2 (ja) 演奏動作表示装置、及びプログラム
Valbom et al. An immersive musical instrument prototype
Stockmann et al. A musical instrument based on 3d data and volume sonification techniques
Ning et al. The music pattern: A creative tabletop music creation platform

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040311

LAPS Cancellation because of no payment of annual fees