JP2000330600A - 音声可視化方法、可視化された音声情報の操作方法、これらの装置、及び、これらの方法を記録した記憶媒体 - Google Patents

音声可視化方法、可視化された音声情報の操作方法、これらの装置、及び、これらの方法を記録した記憶媒体

Info

Publication number
JP2000330600A
JP2000330600A JP11139429A JP13942999A JP2000330600A JP 2000330600 A JP2000330600 A JP 2000330600A JP 11139429 A JP11139429 A JP 11139429A JP 13942999 A JP13942999 A JP 13942999A JP 2000330600 A JP2000330600 A JP 2000330600A
Authority
JP
Japan
Prior art keywords
audio signal
color information
shape
audio
time axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11139429A
Other languages
English (en)
Inventor
Ken Tsutsuguchi
けん 筒口
Masakatsu Aoki
政勝 青木
Kazuhiro Sugiyama
和弘 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11139429A priority Critical patent/JP2000330600A/ja
Publication of JP2000330600A publication Critical patent/JP2000330600A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 ディジタル化音声情報の計算機内仮想空間へ
の表示と、その仮想空間での音声編集を可能とする音声
可視化方法、操作方法、装置を提供する。 【解決手段】 まず音声信号解釈手段1100により、
入力音声信号の持続時間等の値を取得し、座標決定手段
1200により、それらの値を空間形状の座標値に対応
させる。区間分割手段1400は音声信号を時間軸方向
にある区間幅で分割する。次に形状決定手段1600に
より、区間毎の音声信号の代表特徴量を区間毎に幾何的
形状を対応づけ、形状サイズ決定手段1700により、
その幾何的形状の大きさを決定する。時間軸配置手段1
800は前記区間毎の形状を時間軸方向に対応した座標
軸に沿って配置し、表示する。このように表示された空
間形状への図形的な操作、例えば、位置や大きさ、色指
定の変更を入力として、逆に音声情報を変化させること
で、音声編集したディジタルデータを生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ディジタル化され
た音データを、計算機で可視化表示する際に、音データ
の有するディジタル音声信号を色情報や空間形状に変換
するための音声可視化方法とその可視化された音声情報
を利用して元の音声信号を編集可能とする操作方法、及
びそれらの装置に関するものである。
【0002】
【従来の技術】従来、計算機に入力・記録されたディジ
タル音声情報を可視化して表示する場合、例えば音声デ
ータであることを示すアイコン画像で表示したり、ある
いは音声データを編集する際に、縦軸に振幅を、横軸に
時間を取ってグラフ表示することがほとんどであり、実
際にどのような音声信号が含まれているかは何らかの手
段で音声信号を再生して聴くか、ファイル名から判断す
るしかないという問題があった。例えば、前記アイコン
に、任意な色を付けて他と区別することは可能である
が、内容(音声情報)とは無関係な色であった。
【0003】また、例えばコンピュータ・グラフィック
スで作成された仮想空間に形状を有するデータを表示す
ることは可能であるが、音声データを表示することは困
難であるという問題があった。
【0004】また、音声信号を編集する場合、時間軸に
沿った波形信号を編集する手段のみ存在し、空間図形や
空間形状のように、編集者が直感的に理解しやすい大域
的な編集作業が困難である、という問題があった。
【0005】
【発明が解決しようとする課題】本発明の課題は、前記
問題点を解決した、ディジタル化された音声情報を、そ
のデータが有する音声信号の特徴を反映した色や形状に
変換する音声可視化方法とその操作方法、及び、それら
の装置を提供することにより、計算機内の仮想空間への
表示、計算機内の仮想空間での音声編集、を可能とする
ことにある。
【0006】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は、ディジタル化された音声信号を可視化す
る方法において、前記音声信号の特徴を色情報または計
算機内の仮想的な空間における空間形状に対応づける段
階と、前記対応づけに基づいて前記音声信号を色情報ま
たは空間形状に変換する段階とを有することを特徴とす
る。
【0007】あるいは、前記音声信号の特徴を色情報ま
たは空間形状に対応づける段階では、前記音声信号の振
幅に対して色情報を対応づけるか、または、前記音声信
号を周波数展開し、最も寄与の大きな有限個の周波数成
分の種類に対して色情報を対応づけるか、または、前記
音声信号の持続時間と前記音声信号のサンプル値とを、
前記空間形状を特徴づける幾何形状と大きさとに対応づ
けることを特徴とする。
【0008】あるいは、前記音声信号の特徴を色情報ま
たは空間形状に対応づける段階では、前記音声信号を時
間軸方向のある区間に分割し、前記分割した各区間毎に
前記対応づけを行うことを特徴とする。
【0009】あるいは、前記対応づけに基づいて前記音
声信号を色情報または空間形状に変換する段階では、前
記変換された各区間毎の色情報または空間形状を時間軸
方向に配置する段階を有することを特徴とする。
【0010】あるいは、前記各区間毎の色情報または空
間形状を時間軸方向に配置する段階では、前記時間軸方
向に配置された色情報または空間形状を、該時間軸方向
に連続した色情報または空間形状に近似することを特徴
とする。
【0011】また、以上の音声可視化方法のいずれかに
より、可視化された音声信号を操作する方法であって、
前記音声可視化方法における音声信号の特徴を色情報ま
たは空間形状に変換する段階において、前記変換の対象
となる音声信号と該変換された色情報または空間形状と
の対応関係を記憶する段階と、前記記憶された色情報ま
たは空間形状を変化させることにより、前記対応関係に
ある音声信号を変化させる段階とを有することを特徴と
する。
【0012】また、同じく本発明は、ディジタル化され
た音声信号を可視化する装置において、前記音声信号の
特徴を色情報または計算機内の仮想的な空間における空
間形状に対応づける手段と、前記対応づけに基づいて前
記音声信号を色情報または空間形状に変換する手段とを
有することを特徴とする。
【0013】あるいは、前記音声信号の特徴を色情報ま
たは空間形状に対応づける手段は、前記音声信号の振幅
に対して色情報を対応づける手段か、または前記音声信
号を周波数展開し、最も寄与の大きな有限個の周波数成
分の種類に対して色情報を対応づける手段か、または前
記音声信号の持続時間と前記音声信号のサンプル値と
を、前記空間形状を特徴づける幾何形状と大きさとに対
応づける手段であることを特徴とする。
【0014】あるいは、前記音声信号の特徴を色情報ま
たは空間形状に対応づける手段は、前記音声信号を時間
軸方向のある区間に分割する手段と、前記分割した各区
間毎に前記対応づけを行う手段とを有することを特徴と
する。
【0015】あるいは、前記対応づけに基づいて前記音
声信号を色情報または空間形状に変換する手段は、前記
変換された各区間毎の色情報または空間形状を時間軸方
向に配置する手段を有することを特徴とする。
【0016】あるいは、前記各区間毎の色情報または空
間形状を時間軸方向に配置する手段は、前記時間軸方向
に配置された色情報または空間形状を、該時間軸方向に
連続した色情報または空間形状に近似することを特徴と
する。
【0017】また、以上の音声可視化装置のいずれかを
有し、前記音声可視化装置における音声信号の特徴を色
情報または空間形状に変換する手段において、前記変換
の対象となる音声信号と該変換された色情報または空間
形状との対応関係を記憶する手段と、前記記憶された色
情報または空間形状を変化させることにより、前記対応
関係にある音声信号を変化させる手段とを有することを
特徴とする。
【0018】さらには、上記の音声可視化方法を計算機
に実行させるためのプログラムを、該計算機が読取可能
な記憶媒体に記録したことを特徴とする。
【0019】また、上記の音声情報の操作方法を計算機
に実行させるためのプログラムを、該計算機が読取可能
な記憶媒体に記録したことを特徴とする。
【0020】本発明では、音の持つ各種の情報(継続時
間、残響時間、周波数成分、各周波数成分ごとの強度、
エネルギー比、ps時間(最初の音波が到着してから次
の音波が到着するまでの時間)など)をその音の特徴と
して識別し、識別された音声情報の特徴量を入力として
色情報や図形的な情報(多面体か球、表示位置、大き
さ、角度など)に写像演算し、この写像演算により得ら
れた図形的な情報を表示することにより、 (1)音声情報、特に効果音や音片をサンプリングした
ディジタルデータを入力として、2次元または3次元の
表示装置上に色情報あるいは、多面体や球などの空間形
状として音声情報を表示させる機能。 (2)表示された色情報あるいは、多面体や球などの空
間形状への操作、例えば、位置や大きさ、色指定の変更
を入力として、逆に音声情報、例えば効果音の心理的印
象を変化させたディジタルデータを生成する機能。を実
現する。
【0021】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を用いて詳細に説明する。
【0022】[音・色変換の基本構成]図1は音・色変
換を行う場合の本発明の最も基本となる構成図である。
図1において、100は音・色対応決定手段であり、本
発明の特徴である音声信号と色情報との対応を決定する
手段である。200は音・色変換手段であり、音・色対
応決定手段100で決定された対応に基づいて入力され
た音声信号から色への変換を実行する手段である。以
下、実施形態例にて詳しく説明する。
【0023】以下の実施形態例において、色情報は赤、
緑、青の三原色で表示するRGBを用い、透過率を表す
アルファ値を含む場合はRGBAで表す。もちろん、他
の表色法、例えばCMYやHSVなどを用いても良い。
また、ディジタル化された音声データは、ある離散化さ
れた時刻での音の値を、ある階調値で表現する。例え
ば、44.1KHzのサンプリング・レートで階調値を
16ビットでサンプリングする、などである。以下、離
散化された時刻のことを単に「時刻」、その時刻におけ
るサンプル値を「サンプル値」と称する。
【0024】[実施形態例1]図2は本発明の第1の実
施形態例を示す構成図であり、音・色変換する場合の一
実施形態例を示すものである。
【0025】100は音・色対応決定手段であり、20
0は音・色変換手段である。
【0026】001は音声情報入力手段であり、ディジ
タル化音声情報を入力する。
【0027】音・色対応決定手段100において、11
0は表色系選択手段であり、音声信号をどのような表色
系、例えばRGB表色系やCMY表色系、HSV表色系
などを選択する手段である。以下、説明では最も一般的
であるRGB表色系を用いるが、どの表色系を用いても
本質的に変りはない。もちろん、音声信号を色情報に変
換した後に、他の表色系に変換してもかまわない。もち
ろん他の表色系でもよい。
【0028】111は非透過率変換選択手段であり、音
声信号の非透過率(以下、アルファ値と称する)への変
換を行うか行わないかを選択する手段である。
【0029】120は階調数正規化手段である。音声信
号を色情報に対応づける際に、音声信号の階調数と色情
報の階調数が一致していれば1対1の対応が可能である
が、そうでない場合はどちらかの階調数(例えば階調数
の少ない方)で正規化することにより、1対1の対応づ
けを可能とする。
【0030】130は対応付与手段であり、音声信号の
各離散化時刻でのサンプル値を色情報即ちRGBあるい
はアルファ値にどう対応づけるかを決定する。
【0031】この時、例えばRGBと音声信号を対応づ
ける場合、図3(a)に示すように直線的に対応づける
方法でもよいし、図3(b)に示すようにサンプル値の
大きさに従って、RGBそれぞれに分配して対応づける
方法でもよい。その際、RGBでの増加率を変化させて
も良い。
【0032】また、図3(c)に示すように、RGBと
の対応と独立に、各離散時刻のサンプル値と非透過率と
を対応づけてもよい。この対応によって、例えば大きな
音は不透明に、小さな音は透明で表現できる。
【0033】また、音声信号のサンプル値と色情報の階
調値とを線形に対応づけても良いし、他の手法、例え
ば、それぞれの階調値範囲を[0,Smax],[0,C
max]としたときに、あるサンプル値sと対応づける色
の階調数cとの関係を、 c=Cmax√(s/Smax) …(1) としてもよいし、他の対応づけ手法を用いても良い。
【0034】次に、音・色変換手段200において、2
10は音声情報解釈手段であり、入力された音声情報の
各難敵化時刻でのサンプル値や、音声情報の長さ(持続
時間)を解釈する手段である。
【0035】220は音声情報を時間軸方向に分割する
区間分割手段である。例えば、音声信号の時間軸方向の
長さをTとし、TをN個の適当な時間幅に分割し、各区
間を時間軸方向に並べたものをt1,t2,…tNとす
る。即ち、Σi=1 Ni=Tである。各区間は同じだけの
幅でもよいし、各区間幅で異なっていてもよい。また、
区間数を1(N=1)に取れば音声情報全体をひとつの
色情報に変換する実施形態例となり、区間数を複数に取
れば音声情報を分割区間毎に音・色変換する実施形態例
となる。
【0036】区間でまとめず、音声信号の離散化数をそ
のままNとしてもよいが、例えばサンプリング・レート
R(Hz)が大きい場合のように、全離散化時刻でのサ
ンプル値を色に変換しても可視化しにくい場合や、変換
後のデータの数が大きくなってしまうことがあるため、
あらかじめ離散化時刻をいくつかまとめて、代表値を決
定してから変換したり、あるいは一度各離散化時刻のサ
ンプル値を色情報に変換してから区間内の色情報の代表
値を決定することなどが有効となる。
【0037】221は区間代表値決定手段であり、各区
間ti(i=1,2,…,N)内の離散化サンプル値の
代表値を決定する。例えば、サンプル値の区間内の平均
値などである。
【0038】230は変換手段であり、130の対応付
与手段に基づいて実際の変換を行う。
【0039】231は区間代表色決定手段であり、離散
化時刻でのサンプル値を色に変換した後に、各区間ti
(i=1,2,…,N)の色データの代表値を決定す
る。例えば、データ値の平均などである。その際、区間
代表決定手段221で一度サンプル値の区間代表値を決
定した後、変換手段230で変換し、さらに新たな区間
を設けて新たにti(i=1,2,…,N)とし、代表
色を決定しても良い。区間ごとの変換例を図4に示す。
【0040】002は色情報出力手段であり、変換され
た色情報を出力する。
【0041】以上の処理の流れを図5に示す。
【0042】本実施形態例により、ディジタル化された
音声情報を、音声情報の内容に応じた色情報で表現する
ことが可能となる。
【0043】[実施形態例2]図6は本発明の第2の実
施形態例を示す構成図であり、同様に音・色変換する場
合の別の実施形態例である。
【0044】003,004の意味は実施形態例1の0
01,002と同様である。また、300は音・色対応
決定手段であり、400は音・色変換手段であり、それ
ぞれ実施形態例1では100,200に対応する。
【0045】音・色対応決定手段300において、31
0は表色系選択手段、311は非透過率変換選択手段で
あり、実施形態例1の同名の手段と同様の機能を有する
手段である。
【0046】320は階調数正規化手段であり、音声信
号を色情報に対応づける際に、音声信号を周波数展開し
た場合の周波数の数と色情報の階調数が一致していれば
1対1の対応が可能であるが、そうでない場合はどちら
かの階調数(例えば階調数の少ない方)で正規化するこ
とにより、1対1の対応づけを可能とする。
【0047】330は対応付与手段であり、音声信号の
各周波数成分に色情報即ちRGBあるいはアルファ値に
どう対応づけるかを決定する。
【0048】この時、例えば音声信号Fをある周波数関
数fkを用いて、 F=Σk=1 Kkk …(2) のように展開する。wiは係数である。本実施形態例で
は、各周波数関数fkを色と対応づける。この周波数展
開は、例えばフーリエ展開でも良いし、ウェーブレット
展開でも良い。いずれにせよ展開の基底関数と色とを対
応づける。対応づけは実施形態例1と同様に、線形な対
応でもよいし非線型な対応でも良い。図7(b)は対応
の一例を示している。
【0049】次に、音・色変換手段400において、4
10は音声情報解釈手段であり、入力された音声信号の
持続時間や離散化時刻でのサンプル値を解釈する手段で
ある。
【0050】420は音声情報を時間軸方向に分割する
区間分割手段であり、実施形態例1と同様の機能を有す
る。ここで、区間数Nを1に取れば音声情報全体をひと
つの色情報に変換する実施形態例となり、区間数を複数
に取れば音声情報を分割区間毎に音・色変換する実施形
態例となる。
【0051】430は周波数展開手段であり、各区間ご
とに音声信号を周波数展開する。この時、有限個の基底
関数で展開して良い。
【0052】440は変換成分決定手段であり、前記周
波数展開手段430で音声信号を展開した後、寄与の大
きい、即ち展開係数の絶対値の大きい周波数成分をある
有限な個数Mだけ選択する手段である。例えば、図7
(a)に示すような展開係数が得られてM=3とした場
合、寄与の大きい順にf1,f2,f3を選択する。それ
ぞれの周波数成分は、例えば図7(b)に示すように対
応付与手段330において色に対応づけられている。
【0053】441は区間代表値決定手段であり、前記
M個の周波数成分から1個の代表値を計算する手段であ
る。M=1であればそのまま代表値となるし、あるいは
M個重み付け平均を取り、例えば f=Σk=1 M|wk|fk/Σk=1 M|wk| …(3) で表しても良い。
【0054】450は変換手段であり、330の対応付
与手段に基づいて実際の変換を行う。例えば区間代表値
決定手段441において代表周波数成分が決定されてい
る場合は対応付与手段330の対応付けにより色を対応
づけ、そうでない場合はM個の周波数成分に色を対応づ
ける。
【0055】451は区間代表色決定手段であり、前記
変換手段450により区間に複数の色が対応づけられた
際に、区間の代表色を決定する手段である。また、区間
分割手段420で決定された区間を変更し、新しい区間
での代表色を決定しても良い。
【0056】004は色情報出力手段であり、変換され
た色情報を出力する。
【0057】以上の処理の流れを図8、図9に示す。な
お、図8中の○印aは図9中の○印aに処理の流れが続
いていることを示している。
【0058】本実施形態例により、ディジタル化された
音声情報を、音声情報の内容に応じた色情報で表現する
ことが可能となる。
【0059】[音・形状変換の基本構成]図10は音・
形状変換する場合の本発明の最も基本となる構成図であ
る。
【0060】図10において、1100は音声信号解釈
手段であり、入力された音声信号の持続時間、サンプリ
ング・レート、離散化されたサンプル値などを取得する
手段である。
【0061】1200は座標決定手段であり、音声信号
の持続時間およびサンプル値を空間形状のどの座標値に
対応させるかを決定する手段である。
【0062】1300は単位決定手段であり、空間形状
の単位長さが音声信号のある情報量のどれだけの量に対
応するかを決定する。
【0063】1400は区間分割手段であり、音声信号
を時間軸方向にある区間幅で分割する。
【0064】1500は区間特徴量決定手段であり、前
記区間ごとの音声信号の特徴量をひとつの量で代表させ
る手段である。
【0065】1600は形状決定手段であり、前記区間
ごとに幾何的形状を対応づける手段である。
【0066】1700は形状サイズ決定手段であり、単
位決定手段1300で決定された単位および区間特徴量
決定手段1500で決定された特徴量に基づき、幾何的
形状の大きさを対応づける手段である。
【0067】1800は時間軸配置手段であり、前記区
間ごとの形状を時間軸方向に対応した座標軸に沿って配
置する手段である。
【0068】また、1010は座標・単位記憶手段であ
り、必要に応じて座標決定手段1200、単位決定手段
1300の変換座標、および単位を記憶する手段であ
る。
【0069】1020は区間形状・音声信号対応記憶手
段であり、必要に応じて区間毎の音声信号と、変換後の
空間形状との対応づけを行う。
【0070】なお、1010,1020のブロックは、
元の音声情報に対し編集操作する場合(実施形態例5)
を考慮しないときは必ずしも必要ではない。以下、実施
形態例にて詳しく説明する。
【0071】以下の実施形態例において、空間形状は3
次元空間での形状を仮定しているが、容易に推察され得
るように、2次元空間への射影を考慮すれば2次元空間
での形状への変換も可能である。
【0072】[実施形態例3]以下は本発明の第3の実
施形態例であり、音・形状変換する場合の一実施形態例
である。本実施形態例は図10の基本構成図と同様の構
成であり、本実施形態例のブロック番号は図10に対応
している。
【0073】まず、音声信号解釈手段1100は入力さ
れた音声信号の持続時間T、入力された音声信号の持続
時間、サンプリング・レートR、離散化されたサンプル
値を取得する。
【0074】次に、座標決定手段1200によって、例
えば音声信号の時間軸を空間座標のX軸に、離散化時刻
における音声信号のサンプル値をYZ平面に対応づけ
る。
【0075】次に、単位決定手段1300によって、例
えばT秒をX方向の長さTcmに対応づける。また、音
声信号のサンプル値をYZ平面における長さに対応づけ
るが、例えばサンプル値が階調数16ビットで表現され
ている場合、最大の216を例えば空間の10cmに対応
づける、などである。この対応づけは、絶対長さではな
く仮想空間の相対的な長さを用いて良いことはもちろん
である。
【0076】ここで、例えば実施形態例5に示すよう
に、後にこれらの対応情報を用いて元の音声情報を操作
する際には、座標・単位記憶手段1010によって座標
決定手段1200、単位決定手段1300で決定され
た、音声信号と空間形状の座標および単位の変換を記憶
し、必要に応じて記憶装置へ出力する。
【0077】次に、区間分割手段1400によって、音
声信号を時間軸方向にある区間幅で分割する。即ち、時
間[0,T]で表される音声信号の長さをt1,t2,…
NにN分割する。各時間幅は同一でもよいし、異って
いても良い。また、N=R×Tとすれば分割を行わない
ことと同一であり、音声情報全体をひとつの色情報に変
換する実施形態例となり、複数の場合は音声情報を分割
区毎に音・色変換する実施形態例となる。
【0078】次に、区間特徴量決定手段1500は、各
区間ti(i=1,2,…,N)ごとの音声信号サンプ
ル値の特徴量をひとつの量で代表させる。この時、例え
ば、 1)区間内のサンプル値の平均を取る。
【0079】2)区間内のサンプル値の微分の平均を取
る。
【0080】3)区間内のサンプル値を周波数展開し、
最も寄与の大きい周波数値で代表させる。などの方法に
よって代表値を決定する。
【0081】次に、形状決定手段1600において、区
間tiの幾何的形状を決定する。この時、例えば、区間
内において、時間軸(X軸)に垂直な断面図が全く同一
であるような柱状の形状としてもよい。また、断面図が
X軸を中心とする円でもよいし、X軸との交点を重心と
する矩形でもよいし、三角形でもよいし、その他任意の
多角形としてよい。この時、例えば、音声信号の表す意
味に応じて形状をあらかじめ決定しておいても良い。例
えば、自然音は円、ことばの音素(例えば「あ」や
「さ」)は正方形、音楽は六角形などである。
【0082】また、区間特徴量決定手段1500におけ
る区間特徴量を反映したものでもよい。以下では、正方
形で表すものとして説明を進めていく。
【0083】次に、形状サイズ決定手段1700におい
て、単位決定手段1300で決定された単位、および区
間特徴量決定手段1500で決定された特徴量に基づ
き、幾何的形状の大きさを対応づける。例えば、正方形
の一辺の長さなどである。
【0084】次に、時間軸配置手段1800は、前記区
間ごとの形状を時間軸方向に対応した座標軸に沿って配
置する。図11に、変換例を示す。
【0085】記憶手段1020は、区間分割された音声
信号と、前記区間を近似した形状との対応を記憶する。
例えば、図11のように、(a)の音声信号を(b)の
ように区分量子化し、(c)のように空間形状に変換し
たような場合、区間分割手段、空間配置手段および実施
形態例4における形状近似化手段によって、空間形状に
属するある部分が、音声信号のどこからどこまでの区間
を表現しているかが特定できるため、本対応を記憶する
ものである。
【0086】対応の付け方としては、例えば、音声信号
の区間分割した区間、前記区間を近似した形状にそれぞ
れ一意的な識別子を付与し、それぞれの識別子を対応づ
ける、などである。
【0087】以上の処理の流れを図12、図13に示
す。
【0088】本実施形態例により、音声信号を音声信号
の特徴を有する空間形状に変換することが可能となる。
【0089】[実施形態例4]図14は本発明の第4の
実施形態例を示す構成図であり、色・形状変換する別の
実施形態例である。以下の説明では、実施形態例3との
差異のみ示す。
【0090】本実施形態例の特徴は、実施形態例3によ
って出力された形状を、図14の1900の形状近似化
手段により、空間的に連続な形状に近似することであ
る。あるいは、原音声信号(区分数RTで表される)ま
たは区分分割された信号から、直接近似形状を生成して
も良い。
【0091】形状近似の手法としては、例えば以下の処
理を行う。
【0092】1)区間ごとに変換された形状を全て含む
ような形状で近似する。
【0093】2)区間ごとに変換された形状を全て含
み、なめらかな曲面で構成される閉曲面で近似する。
【0094】3)区間ごとに変換された形状を全て含
み、なめらかな曲面で構成される凸閉曲面で近似する。
【0095】4)音声信号の区間代表値を連結して近似
し、時間軸(x軸)の回りに回転体を生成する。
【0096】5)音声信号の区間代表値を連結して近似
し、実施形態例1の形状を適用して形状を生成する。
【0097】図15(a),(b1),(c1)は、前
記4)の近似例を示し、また、図15(a),(b
2),(c2)は、前記5)の近似例を示す。
【0098】また、本実施形態例においては、1020
の区間形状・音声信号対応記憶手段では、近似後の空間
形状の、どの部分が音声信号の区間に相当するかを記憶
する。この場合、例えば変換図形のX座標値が、もとの
音声信号のどの時間幅に対応しているかによって決定づ
けられる。
【0099】以上の処理の流れを図16に示す。
【0100】本実施形態例により、ディジタル化された
音声信号を、音声情報の内容に応じた空間形状で近似す
ることが可能となる。
【0101】[実施形態例5]図17は本発明の第5の
実施形態例を示す構成図であり、以上のように可視化さ
れた音声情報を操作して元の音声情報を変更する実施形
態例である。なお、図17では、空間形状に変換する手
段と、空間形状を編集して音声信号を修正する手段とを
結合する形でブロック図を示しているが、この結合はフ
ァイルやネットワークなどを介したものでもよい。
【0102】2010は、音声信号を入力する音声信号
入力手段である。
【0103】2020は、前記音声信号を表現する空間
形状を入力する空間形状入力手段である。
【0104】2030は、座標・単位情報入力手段であ
り、実施形態例3または実施形態例4で決定された音声
信号の時間軸と変換空間図形の座標軸との対応、および
変換単位の情報を入力する座標・単位変換情報入力手段
である。
【0105】2040は、区間形状・音声信号対応情報
を入力する区間形状・音声信号対応情報入力手段であ
り、空間図形あるいは空間図形の時間軸に相当する座標
軸の座標値と、音声信号の時間軸方向の変数との対応を
得る手段である。
【0106】2050は、入力された前記空間形状を変
形する空間形状変形手段である。空間形状の変形は、一
般によく知られたCGソフトウエア等で用いられている
変形を用いて良い。
【0107】2060は、形状・音声対応手段であり、
前記変形された部分が音声信号のどの区間に対応するか
を判定する手段であり、区間形状・音声信号対応情報入
力手段2040によって入力された対応情報を用いる。
【0108】2070は変位変換手段であり、前記空間
形状変形手段2050によって行われた空間形状の変位
を、前記形状・音声対応手段2060によって得られた
対応によって対応づけられた音声信号の区間における音
声信号の変化に変換する手段である。
【0109】例えば、図18(a)に示すように、ある
音声信号を変換した空間形状の一部を変形したような場
合、この変形に相当する空間位置を図18(b)に示す
ように対応する音声信号の区間へと変換し、図18
(c)に示すように対応する区間の音声信号の修正を行
う。
【0110】空間図形の変形が複数区間にまたがる場合
も、例えば音声信号の区間の境界で連続性を保つように
変形しても良い。また、同一区間内で、空間変位の意味
に応じて、区間内の音声信号を全て同じ割合で増加・減
少するなど、一様に変化させても良いし、例えば区間の
境界付近の音声信号は隣接する前後の区間との連続性を
保つように変化させ、区間の中央では区間全体の平均が
変形の度合いに対応するように調整して修正しても良
い。
【0111】以上の処理の流れを図19に示す。
【0112】本発明により、変換された形状を変化させ
ることによって、対応づけられた音声信号を編集するこ
とが可能となる。
【0113】[音声・色、形状変換の詳細な処理手順の
実施形態例における全般的な処理]まず、以下の音声・
色または形状変換処理の説明で用いる記号について説明
する。
【0114】ディジタル化されたある音声信号は1トラ
ックあたり、以下のフォーマットで記述される。・サン
プル周波数R、即ち単位時間(1秒間)あたりのサンプ
ル数。例えばCD−ROM程度の音質であれば、44.
1KHzであり、1秒間を44100の区間に離散化
し、各離散時間毎に音声信号を量子化することになる。
・サンプル信号の階調数5。例えばCD−ROM程度の
音質であれば、16ビット即ち216階調である。
【0115】以上のフォーマットの基に、各サンプル時
刻におけるサンプル信号の階調値fを記述することによ
り、音声信号が記録される。このとき、音声信号の長さ
Tは時間軸方向の総サンプル数でも表現でき、その場合
はRTで表される。
【0116】なお、音の大きさは正規化されているもの
とし、音の大きさを増幅する際の倍率をBとする。
【0117】以下、各サンプル時刻をτi,i=1,
2,…,で表し、サンプル時刻τiでのサンプル信号値
をf(τi)などと表すものとする。
【0118】また、音声信号を変換したものを配置する
仮想的な3次元空間(ユークリッド座標系x,y,zで
表す)において、色はRGB表色系で表すものとし、変
換後の色を(R,G,B)、変換後の色の非透過率をA
で表す。もちろん他の表色系でも良い。
【0119】本発明の特徴は、音声信号を表す、時間を
変数とする値f=f(t)を3次元空間における、ひと
つの座標軸を変数とする形状および色に変換することで
ある。即ち、以下のような対応を付ける。
【0120】1)時間変数と、空間の一座標との対応。
【0121】この一座標はx,y,zのどれでもよい
が、一般性を失わないので以下の説明ではx軸とする。
【0122】t←→x 2)サンプル値と、yz平面(即ち、1)で選択した残
りの二座標で表される平面)上で表される空間図形との
対応。
【0123】ここでは、x軸を重心とし、1つのパラメ
ータrで表される図形に変換されるものとし、この図形
をF(y,z;r)とする。例えば、半径rの円でもよ
いし、一辺の長さがrであるような正方形でも正六角形
でも良い。半径rの円の場合、F(y,z;r)はy2
+z2=r2で表される。
【0124】f←→F(y,z;r) 3)サンプル値と、色または非透過率との対応。
【0125】f←→R,G,B,A 以下、一般性を失わないので、変換後の3次元空間の座
標のスケールは正規化されているものとし、同じく変換
後の色および非透過率のスケールも正規化されているも
のとする。即ち、 ・時間t(0≦t≦T)はx軸方向の長さ0≦x≦T)
に変換され、 ・サンプル値f(0≦f≦2S)は0≦r≦1.0)に
変換され、 ・サンプル値f(0≦f≦2S)はRGB表色系のR値
またはG値またはB値の、0≦R,G,B≦1.0)に
変換され、また、非透過率0≦A≦1.0)に変換され
る。ただし、非透過率0は完全な透明を表し、非透過率
1は完全な非透明を表す。
【0126】上記の変換後であれば、3次元空間内にお
いて変換後の形状に通常のアフィン変換を施すことによ
り、任意の位置に任意のスケールで配置することが可能
である。
【0127】また、もとの音声信号は1秒あたりのサン
プル数が多いため、離散化されたサンプリング区間τi
を新たなN個の区間tiに分割するのが効果的である。
新たな区間幅は一定でもよいし、等間隔でも良いが、以
下では簡単のため一定の区間幅Δtを取る。即ち、T=
N×Δt,ti+1=ti+Δtとなる.特殊な場合とし
て、N=1のときは、全区間を1区間とみなすことにな
る。結局、新たな区間[t i,ti+1]の代表値f^
(t)を決定し、そのf^(t)と上記のrあるいはR
GBAとを対応づけることになる。
【0128】新たな区間分割の区間幅や区間代表値の決
定方法は、形状への変換と色への変換で同一にしてもよ
いし、異っていてもよいが、一般性を失わないので以下
の説明では特に明記しない限り、区別しない。
【0129】[音声信号を3次元空間内の形状又は色に
変換する処理手順1の詳細な実施形態例]以下は、図2
0で示す処理の説明であり、音声信号を空間の形状また
は色に変換する省略できない処理手順である。
【0130】まず、A100において、音声信号を入力
し、R、T、各サンプル時刻τiでのサンプル値f
(τi)を得る。
【0131】次に、A110において、Tを新たにN区
間に分割する。特別な場合としてN=1も含む。
【0132】次に、A120において、区間Ti=[t
i+ti+1]の代表値f^(ti)を決定する。Tiに含ま
れるサンプル値の数はRΔtであるから、例えばサンプ
ル値の平均
【0133】
【数1】
【0134】で代表して良い。
【0135】次に、A130において、(ti,f^
(ti))を空間のパラメータに変換する。
【0136】xi=ti r(xi)=f^(ti) R(xi)=wrf^(ti) G(xi)=wgf^(ti) B(xi)=wbf^(ti) A(xi)=f^(ti) ただし、wr,wg,wbは重み付けパラメータであり、
(0≦wr,wg,wb≦1.0)である適当な値であ
る。
【0137】次に、A140において、区間[xi,x
i+1]に以下の立体を生成する。
【0138】 Vi:F(y,z;r(xi),xi≦x≦xi+1 次に、A150において、Viの色を(R(xi)、G
(xi)、B(xi))とする。
【0139】以上のA120からA150までをi=1
からNまで繰り返し処理する。
【0140】次に、A160において、x軸にVi(i
=1,2,…,N)を配置し、立体Vとする。
【0141】最後に、A170において、3次元仮想空
間内の指定された位置にVを表示する。
【0142】[音声信号を変換した3次元空間内の物体
の形状および色を変更した際に、もとの音声信号に変更
を加える処理手順2の詳細な実施形態例]以下は図21
で示す処理の説明であり、音声信号を変換した3次元空
間内の物体Vの、形状および色を変更した際に もとの
音声信号に変更を加えるための省略できない処理手順で
ある。
【0143】なお、図21において、A100〜A17
0は処理手順1と同様の処理内容である。ただし、A1
20〜A150のi=1からNまで繰り返し処理手順の
後に、A200の区間代表値f^(ti)の最大値f^
maxを求める処理手順を実行し、その後にA160〜A
170の処理手順を実行する。
【0144】A170の処理手順に続いて、B100に
おいては、変更を加えた部位の、正規化された座標系に
おける区間を計算する。即ち、A170で表示されてい
るVに対して、形状あるいは色に何らかの変更を加えた
際に、変更を加えた部位の、A160の立体における該
当部位Viを見つけることに相当する。通常、これは使
用するコンピュータグラフィックス装置内の変換処理に
よって容易に可能である。
【0145】次に、B110において、立体Viが立体
V′iに変更されたものとして、ViとV′iとの差分を
計算する。差分の内容に応じて、aを実数値とし、ca
se文による条件分岐などによりB100〜B170の
いずれかを実行する。
【0146】r(xi)がr′(xi)に変更された場合
には、B120において、ti=xiとし、 a=r′(xi)/r(xi),(r(xi)≠0) a=r′(xi)/f^max,(r(xi)=0) とし、B180を実行する。
【0147】R(xi)がR′(xi)に変更された場合
には、B130において、ti=xiとし、 a=R′(xi)/R(xi),(R(xi)≠0) a=R′(xi)/f^max,(R(xi)=0) とし、B180を実行する。
【0148】G(xi)がG′(xi)に変更された場合
には、B140において、ti=xiとし、 a=G′(xi)/G(xi),(G(xi)≠0) a=G′(xi)/f^max,(G(xi)=0) とし、B180を実行する。
【0149】B(xi)がB′(xi)に変更された場合
には、B150において、ti=xiとし、 a=B′(xi)/B(xi),(B(xi)≠0) a=B′(xi)/f^max,(B(xi)=0) とし、B180を実行する。
【0150】A(xi)がA′(xi)に変更された場合
には、B160において、ti=xiとし、 a=A′(xi)/A(xi),(A(xi)≠0) a=A′(xi)/f^max,(A(xi)=0) とし、B180を実行する。
【0151】[xi,xi+1]が[x′i,x′i+1]に変
更された場合には、B170において、t′i=x′i
t′i+1=x′i+1,Δt′=ti+1−tiとし、τ′j
[t′i,t′i+1]である全てのτ′jにわたり、τ′j
=t′i+wΔt′となるwを計算し、 f(τ′j)=f(ti+wΔt) …(5) とし、B190を実行する。
【0152】以上でのB180においては、τj
[ti,ti+1]である全てのτjにわたり、 f(τj)=af(τj) …(6) を実行し、続いてB190を実行する。
【0153】B190では、変更されたf(τ)を、新
たな音声ファイルとして出力する。
【0154】[本発明の方法を記録した記録媒体の実施
形態例]図1、図2、図6、図10、図14、図17で
示した装置各部の一部もしくは全部の機能は、計算機を
用いて実現することができること、あるいは、図5、図
8、図9、図12、図13、図16、図19、図20で
示した処理手順を、計算機に実行させることができるこ
とはいうまでもなく、計算機でその各部の機能を実現す
るためのプログラム、あるいは、計算機にその処理手順
を実行させるためのプログラムを、その計算機が読み取
り可能な記憶媒体、例えば、FD(フロッピー(登録商
標)ディスク)や、MO、ROM、メモリカード、C
D、DVD(登録商標)、リムーバブルディスクなどに
記録し、提供し、配布することが可能である。
【0155】
【発明の効果】以上説明したように、本発明は、音声情
報を、その音声情報が有する音声信号の特徴を反映した
色情報や空間形状に変換することが可能となる、といっ
た効果があり、また、変換することによって音声情報を
計算機などの画面に表示することが可能となる。さら
に、変換された色情報や空間形状を変化させることによ
って元の音声信号を編集することが可能になる、という
効果がある。
【図面の簡単な説明】
【図1】本発明の基本構成図である。
【図2】本発明の実施形態例1の構成図である。
【図3】(a),(b),(c)は、実施形態例1にお
ける変換例を示す図である。
【図4】(a),(b),(c)は、実施形態例1にお
ける区間ごとの変換例を示す図である。
【図5】実施形態例1の処理の流れ図である。
【図6】本発明の実施形態例2の構成図である。
【図7】(a),(b)は、実施形態例2における変換
例を示す図である。
【図8】実施形態例2の処理の流れ図である。
【図9】実施形態例2の処理の流れの続きを示す図であ
る。
【図10】本発明の別の基本構成図である。
【図11】(a),(b),(c)は、本発明の実施形
態例3の変換例を示す図である。
【図12】実施形態例3の処理の流れ図である。
【図13】実施形態例3の処理の流れの続きを示す図で
ある。
【図14】本発明の実施形態例4の構成図である。
【図15】実施形態例4の近似例を示す図である。
【図16】実施形態例4の処理の流れ図である。
【図17】本発明の実施形態例5の構成図である。
【図18】(a),(b),(c)は、実施形態例5の
編集例を示す図である。
【図19】実施形態例5の処理の流れ図である。
【図20】本発明の音・色、形状変換方法の詳細な実施
形態例を示す処理手順1の流れ図である。
【図21】本発明の編集操作方法の詳細な実施形態例を
示す処理手順2の流れ図である。
【符号の説明】
001,003…音声情報入力手段 002,004…色情報出力手段 100…音・色対応決定手段 110…表色系選択手段 111…非透過率変換選択手段 120…階調数正規化手段 130…対応付与手段 200…音・色変換手段 210…音声情報解釈手段 220…区間分割手段 221…、区間代表値決定手段 230…変換手段 231…区間代表色決定手段 300…音・色対応決定手段 310…表色系選択手段 320…階調数正規化手段 330…対応付与手段 400…音・色変換手段 410…音声情報解釈手段 420…区間分割手段 430…周波数展開手段 440…変換成分決定手段 441…区間代表値決定手段 450…変換手段 451…区間代表色決定手段 1010…座標・単位記憶手段 1100…音声信号解釈手段 1020…区間形状・音声信号対応記憶手段 1200…座標決定手段 1300…単位決定手段 1400…区間分割手段 1500…区間特徴量決定手段 1600…形状決定手段 1700…形状サイズ決定手段 1800…時間軸配置手段 1900…形状近似化手段 2010…音声信号入力手段 2020…空間形状入力手段 2030…座標・単位情報入力手段 2040…区間形状・音声信号対応情報入力手段 2050…空間形状変形手段 2060…形状・音声対応手段 2070…変位変換手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 杉山 和弘 東京都新宿区西新宿3丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5D015 CC01 5D045 AB01

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 ディジタル化された音声信号を可視化す
    る方法において、 前記音声信号の特徴を色情報または計算機内の仮想的な
    空間における空間形状に対応づける段階と、 前記対応づけに基づいて前記音声信号を色情報または空
    間形状に変換する段階とを有することを特徴とする音声
    可視化方法。
  2. 【請求項2】 前記音声信号の特徴を色情報または空間
    形状に対応づける段階では、 前記音声信号の振幅に対して色情報を対応づけるか、 または、前記音声信号を周波数展開し、最も寄与の大き
    な有限個の周波数成分の種類に対して色情報を対応づけ
    るか、 または、前記音声信号の持続時間と前記音声信号のサン
    プル値とを、前記空間形状を特徴づける幾何形状と大き
    さとに対応づけることを特徴とする請求項1記載の音声
    可視化方法。
  3. 【請求項3】 前記音声信号の特徴を色情報または空間
    形状に対応づける段階では、 前記音声信号を時間軸方向のある区間に分割し、 前記分割した各区間毎に前記対応づけを行うことを特徴
    とする請求項1または2記載の音声可視化方法。
  4. 【請求項4】 前記対応づけに基づいて前記音声信号を
    色情報または空間形状に変換する段階では、 前記変換された各区間毎の色情報または空間形状を時間
    軸方向に配置する段階を有することを特徴とする請求項
    3記載の音声可視化方法。
  5. 【請求項5】 前記各区間毎の色情報または空間形状を
    時間軸方向に配置する段階では、 前記時間軸方向に配置された色情報または空間形状を、
    該時間軸方向に連続した色情報または空間形状に近似す
    ることを特徴とする請求項4記載の音声可視化方法。
  6. 【請求項6】 請求項1〜5のいずれか1項記載の音声
    可視化方法により、可視化された音声信号を操作する方
    法であって、 前記音声可視化方法における音声信号の特徴を色情報ま
    たは空間形状に変換する段階において、前記変換の対象
    となる音声信号と該変換された色情報または空間形状と
    の対応関係を記憶する段階と、 前記記憶された色情報または空間形状を変化させること
    により、前記対応関係にある音声信号を変化させる段階
    とを有することを特徴とする可視化された音声情報の操
    作方法。
  7. 【請求項7】 ディジタル化された音声信号を可視化す
    る装置において、 前記音声信号の特徴を色情報または計算機内の仮想的な
    空間における空間形状に対応づける手段と、 前記対応づけに基づいて前記音声信号を色情報または空
    間形状に変換する手段とを有することを特徴とする音声
    可視化装置。
  8. 【請求項8】 前記音声信号の特徴を色情報または空間
    形状に対応づける手段は、 前記音声信号の振幅に対して色情報を対応づける手段
    か、 または前記音声信号を周波数展開し、最も寄与の大きな
    有限個の周波数成分の種類に対して色情報を対応づける
    手段か、 または前記音声信号の持続時間と前記音声信号のサンプ
    ル値とを、前記空間形状を特徴づける幾何形状と大きさ
    とに対応づける手段であることを特徴とする請求項7記
    載の音声可視化装置。
  9. 【請求項9】 前記音声信号の特徴を色情報または空間
    形状に対応づける手段は、 前記音声信号を時間軸方向のある区間に分割する手段
    と、 前記分割した各区間毎に前記対応づけを行う手段とを有
    することを特徴とする請求項7または8記載の音声可視
    化装置。
  10. 【請求項10】 前記対応づけに基づいて前記音声信号
    を色情報または空間形状に変換する手段は、 前記変換された各区間毎の色情報または空間形状を時間
    軸方向に配置する手段を有することを特徴とする請求項
    7〜9のいずれか1項記載の音声可視化装置。
  11. 【請求項11】 前記各区間毎の色情報または空間形状
    を時間軸方向に配置する手段は、 前記時間軸方向に配置された色情報または空間形状を、
    該時間軸方向に連続した色情報または空間形状に近似す
    ることを特徴とする請求項10記載の音声可視化装置。
  12. 【請求項12】 請求項7〜11のいずれか1項記載の
    音声可視化装置を有し、 前記音声可視化装置における音声信号の特徴を色情報ま
    たは空間形状に変換する手段において、前記変換の対象
    となる音声信号と該変換された色情報または空間形状と
    の対応関係を記憶する手段と、 前記記憶された色情報または空間形状を変化させること
    により、前記対応関係にある音声信号を変化させる手段
    とを有することを特徴とする可視化された音声情報の操
    作装置。
  13. 【請求項13】 請求項1〜5のいずれか1項記載の音
    声可視化方法を計算機に実行させるためのプログラム
    を、該計算機が読取可能な記憶媒体に記録したことを特
    徴とする音声可視化方法を記録した記憶媒体。
  14. 【請求項14】 請求項6記載の可視化された音声情報
    の操作方法を計算機に実行させるためのプログラムを、
    該計算機が読取可能な記憶媒体に記録したことを特徴と
    する可視化された音声情報の操作方法を記録した記憶媒
    体。
JP11139429A 1999-05-20 1999-05-20 音声可視化方法、可視化された音声情報の操作方法、これらの装置、及び、これらの方法を記録した記憶媒体 Pending JP2000330600A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11139429A JP2000330600A (ja) 1999-05-20 1999-05-20 音声可視化方法、可視化された音声情報の操作方法、これらの装置、及び、これらの方法を記録した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11139429A JP2000330600A (ja) 1999-05-20 1999-05-20 音声可視化方法、可視化された音声情報の操作方法、これらの装置、及び、これらの方法を記録した記憶媒体

Publications (1)

Publication Number Publication Date
JP2000330600A true JP2000330600A (ja) 2000-11-30

Family

ID=15245002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11139429A Pending JP2000330600A (ja) 1999-05-20 1999-05-20 音声可視化方法、可視化された音声情報の操作方法、これらの装置、及び、これらの方法を記録した記憶媒体

Country Status (1)

Country Link
JP (1) JP2000330600A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006182170A (ja) * 2004-12-27 2006-07-13 Clarion Co Ltd 表示制御装置、及び、表示制御方法
US8744244B2 (en) 2005-09-28 2014-06-03 The University Of Electro-Communications Reproducing apparatus, reproducing method, and storage medium
CN106531178A (zh) * 2016-11-14 2017-03-22 浪潮(苏州)金融技术服务有限公司 一种音频处理方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006182170A (ja) * 2004-12-27 2006-07-13 Clarion Co Ltd 表示制御装置、及び、表示制御方法
US8744244B2 (en) 2005-09-28 2014-06-03 The University Of Electro-Communications Reproducing apparatus, reproducing method, and storage medium
CN106531178A (zh) * 2016-11-14 2017-03-22 浪潮(苏州)金融技术服务有限公司 一种音频处理方法及装置

Similar Documents

Publication Publication Date Title
US7356465B2 (en) Perfected device and method for the spatialization of sound
US6826282B1 (en) Music spatialisation system and method
US20060191399A1 (en) Fingering guidance apparatus and program
KR101657975B1 (ko) 모바일 앱 기반의 실시간 영상의 배경음악 생성방법
JP2019159145A (ja) 情報処理方法、電子機器及びプログラム
de Carvalho Influence of architectural features and styles on various acoustical measures in churches
CN112967705A (zh) 一种混音歌曲生成方法、装置、设备及存储介质
EP4101182A1 (en) Augmented reality virtual audio source enhancement
Blauert Conceptual aspects regarding the qualification of spaces for aural performances
D’Agostino Reclaiming and preserving traditional music: aesthetics, ethics and technology
JP2000330600A (ja) 音声可視化方法、可視化された音声情報の操作方法、これらの装置、及び、これらの方法を記録した記憶媒体
Vigeant et al. Objective and subjective evaluations of the multi-channel auralization technique as applied to solo instruments
CN113035164A (zh) 歌声生成方法和装置、电子设备及存储介质
Chowning Digital sound synthesis, acoustics and perception: A rich intersection
US9445210B1 (en) Waveform display control of visual characteristics
Noble et al. Semantic dimensions of sound mass music: mappings between perceptual and acoustic domains
Toiviainen Visualization of tonal content with self-organizing maps and self-similarity matrices
Pan et al. Musical instruments simulation on mobile platform
Johannsen Numerical simulation of voice directivity patterns for different phonemes
Nicol et al. Designing Sound: Towards a System for Designing Audio Interfaces using Timbre Spaces.
JP2000338965A (ja) Midiデータの表示方法および表示装置ならびにmidiデータを表示した楽譜
Choi et al. Sounds shadowing agents generating audible features from emergent behaviors
Marentakis et al. The timbre engine-progress report
JP3258148B2 (ja) 音響シミュレーション装置
WO2023182024A1 (ja) 音響信号制御方法、学習モデル生成方法および音響信号制御プログラム