JPH06186958A - サウンドデータ生成システム - Google Patents

サウンドデータ生成システム

Info

Publication number
JPH06186958A
JPH06186958A JP4339984A JP33998492A JPH06186958A JP H06186958 A JPH06186958 A JP H06186958A JP 4339984 A JP4339984 A JP 4339984A JP 33998492 A JP33998492 A JP 33998492A JP H06186958 A JPH06186958 A JP H06186958A
Authority
JP
Japan
Prior art keywords
attribute
sound data
image data
sound
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4339984A
Other languages
English (en)
Inventor
Minako Nishino
美奈子 西野
Hirohide Haga
博英 芳賀
Hiroyuki Kojima
弘行 小嶋
Takaaki Yamada
隆亮 山田
Yukinori Terahama
幸徳 寺濱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4339984A priority Critical patent/JPH06186958A/ja
Publication of JPH06186958A publication Critical patent/JPH06186958A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

(57)【要約】 【目的】 入力した画像データに適したサウンドデータ
を生成するサウンドデータ生成システムを提供する。 【構成】 画像データ入力装置101から、表示装置1
02から、入力装置103と、画像データ属性解析処理
部104と、中央処理装置105と、サウンドデータベ
ース106と、サウンドデータ検索処理部107と、サ
ウンドデータ格納処理部108と、サウンドデータを生
成するのに必要なサウンドデータの属性を格納したサウ
ンドデータ属性格納部109と、属性変換処理部110
と、サウンドデータ生成処理部111と、記憶装置11
2と、音源合成装置113と、中央処理装置105と音
源合成装置113のインタフェース装置114と、スピ
ーカ115とからなる。 【効果】 入力した画像データに適したサウンドデータ
を生成することが可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マルチメディアシステ
ムなどに用いるサウンドデータの自動生成システムに関
する。
【0002】
【従来の技術】コンピュータを利用した(1)作曲シス
テム、(2)編曲システム、(3)音楽データベース作
成及び検索システムの従来技術を以下にそれぞれ記載す
る。 (1)作曲システム コンピュータ上での作曲に関する手段、技術は大きく2
つに分かれる。1つは、ユーザ自身が作曲するために必
要な音楽のパラメータや作曲手段をハード又はアプリケ
ーションで提供する技術である。例えばパーソナルコン
ピュータ上でユーザが楽譜を編集する手段、編集した楽
譜を演奏する手段、パーソナルコンピュータ内蔵のF
M,PCM音源音色を編集する手段が必要である。F
M,PCM音源音色の合成装置として、コンピュータ制
御可能な音源合成装置がある。コンピュータを利用した
従来の作曲、編曲システムは、コンピュータとコンピュ
ータ制御可能な音源合成装置を接続し、音楽ソフトを使
用して作曲、編曲を行うシステムである。一方、作曲の
従来技術は、自動作曲技術である。これは、ユーザに記
譜を要求することなくシステムが作曲する技術である。
情報処理学会第37回(昭和63年後期)全国大会に
て、リズム、和声、調性を考慮した「自動作曲システム
−MAGIC」が発表されている。このシステムは対位
法、和声学、楽式論のような音楽理論体系により部分的
にルールを形式化し、モチーフ(動機、2小節程度のメ
ロディー)と1曲分のコード(和声)進行を与えてモチ
ーフに続いて小節毎にメロディーを生成するタイプの自
動作曲システムである。このシステムを発展させた自動
作曲システムとして情報処理学会第38回(昭和64年
前期)全国大会にて「構造、楽式を考慮した自動作曲シ
ステム−MAGIC」が発表されている。
【0003】(2)編曲システム 主旋律を引き立て、装飾し、イメージを発展させていく
うえで重要な役割を果たす副旋律を創作するのが編曲で
ある。副旋律は、主旋律よりも和声学、対位法、楽式論
などの音楽理論上の制限が厳密である。作曲者の感性や
知識に対する依存が少なくなり、計算機で扱いやすい。
情報処理学会第38回(昭和64年前期)全国大会に
て、「対位法による編曲システムの開発」が発表されて
いる。このシステムは、主旋律(単旋律)と和音進行を
与え、対位法によって副旋律を生成する手続きを明示
し、編曲システムを開発している。この編曲システム
は、主旋律と和音進行を同時に入力し、リズムと音高を
生成し、主旋律と副旋律と和音進行を出力するようにな
っている。このシステムで、1つの主旋律から4つの曲
を生成することが可能となる。また、他の編曲支援シス
テムとして、情報処理学会第38回(昭和64年前期)
全国大会にて、「メロディ構造を利用した編曲支援シス
テム」が発表されている。編曲作業を音楽の専門家でな
い人を対象として支援することを目的にしたこのシステ
ムは、以下の2つの特徴を持つ。1つは1コーラス分の
メロディ(曲の1番にあたる)を入力すると、出力とし
てイントロ、間奏、エンディング付きの編曲された”
曲”を演奏するという特徴である。2つめの特徴は、入
力メロディの構造を利用して、適切な位置で伴奏や音色
などを変化させ、メリハリのある演奏を実現することが
可能である。前記の「対位法による編曲システムの開
発」が副旋律の生成に重点を置いているのに対し、「メ
ロディ構造を利用した編曲支援システム」は副旋律も含
んだ曲構成を生成することに重点を置いている。
【0004】(3)音楽データベース作成及び検索シス
テム 情報処理学会第38回(昭和64年前期)全国大会にお
いて「ファジー理論を使ったデータベース」が発表され
ている。このシステムでは音楽を五線譜に書かれたテン
ポや音程を表す記号データ、数的データと演奏された音
楽に対して人が感じる感性情報の2つの情報を利用して
いる。テンポ、音の割合、音のばらつき、音符の4つの
データを分析要素とする。データとして幾つかのサンプ
ルを入力し、そのサンプルに対するイメージのアンケー
トをとる。次に分析要素の4つのデータの多変量抽出を
行い相関係数を求める。このようにして求めたイメージ
のレベルの統計を縦軸に、相関係数を横軸に対応づけ、
それを幾つか繰返しメンバーシップ関数を決定する。こ
の方法で求めたイメージから曲を幾つかのレベルに分類
しておき、検索はこのレベルにより行うデータベースで
ある。
【0005】
【発明が解決しようとする課題】上記のシステムはいず
れも純粋に音楽の構成要素を分類、分析したデータを利
用したシステムである。音楽データを単独で生成する場
合は上記のシステム等で対応するのも可能だが、最近の
マルチメディア技術の発展は、画像データと音楽データ
の両方を必要する。特に画像データの表示時にその画像
データに適した音楽データの提示が要求されることが多
い。上記の従来技術では、 (1)予めユーザが画像データに適すると思う音楽デー
タを自ら作曲し、その作曲した音楽データと画像データ
を結び付け、画像データの表示時に結び付けた音楽デー
タを提示するという方法しかとれない。これでは、画像
データに適した音楽データを作成するという高度な技術
をユーザは要求される (2)作曲を支援するソフトを利用した場合でも、新た
に曲を作成する為には、ソフトが提供する機能の理解に
時間がかかる、最低限の機能の利用しての作曲では、高
品質のサウンドデータを生成することができない、機能
を理解しても、ユーザがサウンドデータを生成するの
で、サウンドデータの構成を決定するのに時間がかか
る、さらにサウンドデータの品質は最終的にはユーザの
技術、感性に左右される等の問題を有する。
【0006】(3)データベースに予め格納した音楽デ
ータを利用するにしても、検索キーを音楽の構成要素、
作曲家や音楽のタイトルといった音楽の属性に基づいて
作成するので、画像データとの適合度を測るのが困難と
いう問題点を有する。
【0007】本発明の目的は、画像データを入力するこ
とによって、その画像データに適したサウンドデータを
生成するサウンドデータ生成システムを提供することに
ある。 本発明の他の目的は、画像データに適したサウ
ンドデータを容易かつ高速に生成するサウンドデータ生
成システムを提供することにある。本発明のさらに他の
目的は、画像データの入力によって、その入力した画像
データに適したサウンドデータをサウンドデータベース
から検索可能となるサウンドデータ生成システムを提供
することにある。
【0008】
【課題を解決するための手段】上記目的は、画像データ
の属性抽出処理で抽出した画像データ属性をサウンドデ
ータの属性に変換処理を行い、変換後のサウンドデータ
の属性を利用し、自動作曲を行うことによって達成され
る。
【0009】発明の望ましい実施形態において、サウン
ドデータ生成システムは、 (1)画像データ入力装置 (2)表示装置 (3)入力装置 (4)記憶装置又は記憶媒体 (5)中央処理装置 (6)コンピュータ制御可能な音源合成装置 (7)中央処理装置とコンピュータ制御可能な音源合成
装置を接続するインタフェース (8)スピーカ (9)画像データ属性抽出処理部 (10)属性変換処理部 (11)サウンドデータ生成処理部 (12)サウンドデータ格納処理部 (13)サウンドデータベース (14)サウンドデータ属性格納部 から構成される。
【0010】(9)画像データ属性抽出処理部は (a)画像データ入力装置を用いて、画像データの全画
素のRGB値を取り込む第1のステップ; (b)取り込んだ全画素のRGB値を輝度信号と色信号
に分離する第2のステップ; (c)分離した色信号から色差信号を求める第3のステ
ップ; (d)色差信号から色相と彩度を各々求める第4のステ
ップ; (e)各画素の輝度信号から輝度の平均値を求める第5
のステップ; (f)各画素の色相のうち最も出現率が高い色相を求め
る第6のステップ; (g)各画素の彩度から彩度の平均値を求める第7のス
テップ; (h)画像データの周波数の平均値を求める第8のステ
ップ; から構成される。
【0011】(10)属性変換処理部は (a)画像データ属性を入力層に入力する第1のステッ
プ; (b)入力データを中間層で重み付けを行う第2のステ
ップ; (c)中間層で重み付けを行った該データを出力層のサ
ウンド属性に出力する第3のステップ; から成る階層型ニューラル・ネットワークを利用した画
像データの属性とサウンドデータの属性の変換システム
で構成される。
【0012】(10)属性変換処理部の異なる構成は (a)画像データから抽出した輝度を調性を付加した和
声モデルに変換する属性変換テーブル; (b)該画像データから抽出した色層を音色モデルに変
換する属性変換テーブル; (c)該画像データから抽出した彩度を強弱変化モデル
に変換する属性変換テーブル; (d)該画像データから抽出した周波数をリズムパター
ンモデルに変換する属性変換テーブル; (e)該画像データから抽出した該彩度と該周波数を拍
子に変換する属性変換テーブル; (f)該画像データから抽出した該輝度と該周波数を速
度に変換する属性変換テーブル; から構成される。
【0013】(12)サウンドデータ格納処理部は (a)サウンドデータの属性をサウンドデータに付加す
る第1のステップ; (b)属性付加処理を行った該サウンドデータをサウン
ドデータベースに格納する第2のステップ; から構成される。
【0014】(12)サウンドデータ格納処理部の異な
る構成は (a)サウンドデータ生成時に利用した画像データの属
性をサウンドデータに付加する第1のステップ; (b)属性付加処理を行った該サウンドデータをサウン
ドデータベースに格納する第2のステップ; から構成される。
【0015】(14)サウンドデータ属性格納部は、 (a)和声モデルデータ; (b)音色モデルデータ; (c)リズムパターンデータ; (d)強弱変化パターンデータ; (e)拍子情報; (f)速度情報; から構成される。
【0016】発明の異なる望ましい実施形態において、
サウンドデータ生成システムは、 (1)画像データ入力装置 (2)表示装置 (3)入力装置 (4)記憶装置又は記憶媒体 (5)中央処理装置 (6)コンピュータ制御可能な音源合成装置 (7)中央処理装置とコンピュータ制御可能な音源合成
装置を接続するインタフェース (8)スピーカ (9)画像データ属性抽出処理部 (10)属性変換処理部 (11)サウンドデータ生成処理部 (12)サウンドデータ格納処理部 (13)サウンドデータベース (14)サウンドデータ属性格納部 (15)サウンドデータ検索処理部 から構成される。
【0017】(9)画像データ属性抽出処理部と(1
0)属性変換処理部と(12)サウンドデータ格納処理
部部と(14)サウンドデータ属性格納部の構成は前述
の構成と同様である。 (15)サウンドデータ検索処理部は (a)画像データの属性をサウンドデータ属性に変換す
る第1のステップ; (b)サウンドデータの属性を検索キーにして検索する
第2のステップ; から構成される。
【0018】(15)サウンドデータ検索処理部の異な
る構成は (a)画像データの属性を検索キーにして検索する第1
のステップ; から構成される。
【0019】
【作用】本発明は、本発明が有する属性変換処理部で、
画像データの属性をサウンドデータの属性に変換、変換
したサウンドデータの属性を用いて自動作曲処理を行う
ので、ユーザに作曲に要する高度な技術や作業を要求す
ることなく、画像データに適したサウンドデータを容易
かつ高速に生成することが可能となる。
【0020】本発明の他の作用として、本発明が有する
属性変換処理部により、画像データの属性をサウンドデ
ータの属性に変換し検索キーに利用ので、画像データに
適したサウンドデータをサウンドデータの属性を付加し
たサウンドデータベースから検索することが可能とな
る。
【0021】本発明のさらに他の作用として、本発明が
有する属性変換処理部により、サウンドデータに対応す
る画像データの属性をサウンドデータに付加するので、
画像データの属性をサウンドデータベースへの検索キー
として利用することが可能となる。
【0022】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図1は、サウンドデータ生成システムのシス
テム構成図である。図1において101は画像データを
中央処理装置に入力する画像データ入力装置、102は
表示装置、103は入力装置、104は画像データ属性
抽出処理部、105は中央処理装置、106は検索キー
を付加したサウンドデータと本システムにより生成した
サウンドデータを格納したサウンドデータベース、10
7はサウンドデータベース106に格納したサウンドデ
ータの検索処理を行う検索処理部、108はサウンドデ
ータをサウンドデータベース106に格納処理を行う格
納処理部、109はサウンドデータを生成するのに必要
な属性を格納したサウンドデータ属性格納部、110は
画像データの属性とサウンドデータの属性の変換処理
部、111はサウンドデータ生成処理部、112は記憶
装置、113はコンピュータ制御可能な音源合成装置、
114は中央処理装置105とコンピュータ制御可能な
音源合成装置113のインタフェース装置、115はス
ピーカである。
【0023】図2はサウンドデータ生成システムのメイ
ンルーチンのフローチャートである。まず画像データの
属性を求め(ステップ201)、ステップ201の処理
により求めた画像データの属性をサウンドデータの属性
に変換する(ステップ202)。次に、ステップ202
の処理で変換したサウンドデータの属性を用いてサウン
ドデータを生成し(ステップ203)、スピーカ115
からサウンドデータを出力する(ステップ204)。
【0024】図3は図2の画像データの属性を求める処
理(ステップ201)のフローチャートである。この処
理では画像データの属性に輝度と色相と彩度と周波数を
利用する。まず、スキャナ等の画像データ入力装置10
1から画像データの全画素のRGB値を取り込む(ステ
ップ301)。次に画像データの全画素に対して以下の
処理を行う。1画素分のRGB値を輝度信号と色信号に
分離する処理を行う(ステップ302)。ステップ30
2の処理で分離した色信号から色差信号を求める処理を
行う(ステップ303)。ステップ303の処理で求め
た色差信号から色相と彩度を各々求める処理を行う(ス
テップ304、ステップ305)。ステップ302、ス
テップ303、ステップ304、ステップ305の処理
を画像データの全画素に対して行った後、ステップ30
2で求めた各画素の輝度信号から輝度の平均値を求める
処理と(ステップ306)、ステップ304で求めた各
画素の色相のうち最も出現率が高い色相を求める処理と
(ステップ307)、ステップ305で求めた各画素の
彩度から彩度の平均値を求める処理を行う(ステップ3
08)。そして画像データの周波数の平均値を求める処
理を行う(ステップ309)。
【0025】図4は階層型ニューラル・ネットワークを
利用した画像データの属性とサウンドデータの属性の変
換処理である。この階層型ニューラル・ネットワーク
は、少なくとも1つのノードから成る入力層401と、
少なくとも1つのノードからなる出力層402で構成す
る。ステップ201で求めたn(n>=1,nは整数)
個の画像データの属性403を入力値とし、その入力値
をノード間を結合するシナプスの重み404に応じて重
み付けを行い、m(m>=1,mは整数)個のサウンド
データの属性405を出力層に出力する変換処理を行
う。
【0026】図5は画像データの属性とサウンドデータ
の属性の変換処理の異なる実施例である。画像データの
属性に輝度と色相と彩度と周波数を、サウンドデータの
属性に調性を付加した和性、音色、強弱変化、リズム、
拍子、速度を利用する。ステップ306で求めた画像デ
ータの各画素の輝度の平均値を調性を付加した和声モデ
ルに変換する(ステップ501)。ステップ307で求
めた画像データの各画素の色相のうち最も出現率が高い
色相を音色モデルに変換する(ステップ502)。ステ
ップ308で求めた画像データの各画素の彩度の平均値
を強弱変化パターンに変換する(ステップ503)。ス
テップ309で求めた画像データの周波数の平均値をリ
ズムパターンに変換する(ステップ504)。つづいて
ステップ308で求めた画像データの各画素の彩度の平
均値とステップ309で求めた画像データの周波数の平
均値を拍子に変換する(ステップ505)。ステップ3
06で求めた画像データの各画素の輝度の平均値とステ
ップ309で求めた画像データの周波数の平均値を速度
に変換する(ステップ506)。以上の手続きにより求
めたサウンドデータの属性を利用し、コンピュータ制御
可能な音源合成装置113を用いてサウンドデータを生
成する(ステップ507)。画像データの各属性とサウ
ンドデータの属性の変換処理は、後述する属性変換テー
ブルで行う。
【0027】図6は画像データの各画素の輝度の平均値
と調性を付加した和声モデルの変換テーブルである。6
01は画像データの各画素の輝度の平均値である。白の
輝度を1、黒の輝度を8として8段階に分類している。
分類の段階は任意である。1つの欄に複数の画像データ
の各画素の輝度の平均値をあてはめることも可能であ
る。602はヘ長調、ハ長調、ホ短調等の調性を付加し
た和性モデルが持つ調インデクスである。調インデクス
は利用する調性の数だけ必要である。この実施例では2
4の調性を利用している。調インデクスの内容は任意で
ある。603は調性である。この変換テーブルにより、
画像データの各画素の輝度の平均値を調性を付加した和
声モデルに変換する。画像データの各画素の輝度の平均
値が1のとき、ヘ調長で調インデクス1の和声モデルに
変換される。和声モデルは音楽での和声に準じる。
【0028】図7は画像データの各画素の色相のうち最
も出現率が高い色相と音色モデルの変換テーブルであ
る。701は画像データの各画素の色相のうち最も出現
率が高い色相である。1つの欄に複数の画像データの各
画素のうち最も出現率が高い色相をあてはめることも可
能である。702は音色モデルが持つ音色インデクスで
ある。音色インデクスの数はサウンドデータ生成装置1
13が内蔵する音色の種類と同じである。音色インデク
スの内容は任意である。この実施例ではサウンドデータ
生成装置113が24種類の音色を内蔵する。703は
サウンドデータ生成装置113が持つ音色モデルの種類
である。この変換テーブルにより、画像データの各画素
の色相のうち最も出現率の高い色相を音色モデルに変換
する。画像データの各画素の色相のうち最も出現率の高
い色相が113.2度のとき、音色インデクスが1のクラリ
ネットの音色モデルに変換される。
【0029】図8は画像データの各画素の彩度の平均値
と強弱変化パターンの変換テーブルである。801は画
像データの各画素の彩度の平均値である。1つの欄に複
数の画像データの各画素の彩度の平均値をあてはめるこ
とも可能である。802は強弱変化パターンインデクス
である。強弱変化パターンインデクスの数はサウンドデ
ータ属性格納部109に格納した強弱変化パターンの種
類と同じである。強弱変化パターンインデクスの内容は
任意である。この実施例では強弱変化パターンが24種
類、用意されている。この変換テーブルにより、画像デ
ータの各画素の平均値を強弱変化パターンに変換する。
画像データの各画素の彩度の平均値が0.76のとき、強弱
変化パターンインデクスが1の強弱変化パターンに変換
される。強弱変化パターンについては後述する。
【0030】図9は画像データの周波数の平均値とリズ
ムパターンの変換テーブルである。901は画像データ
の周波数の平均値である。1つの欄に複数の画像データ
の周波数の平均値をあてはめることも可能である。90
2はリズムパターンインデクスである。リズムパターン
インデクスの数はサウンドデータ属性格納部109に格
納したリズムパターンの種類と同じである。リズムパタ
ーンインデクスの内容は任意である。この実施例ではリ
ズムパターンが24種類、用意されている。この変換テ
ーブルにより、画像データの周波数の平均値をリズムパ
ターンに変換する。画像データの周波数の平均値が50Hz
のとき、リズムパターンインデクスが1のリズムパター
ンに変換される。リズムパターンについては後述する。
【0031】図10は画像データの各画素の彩度の平均
値及び周波数の平均値と拍子の変換テーブルである。1
001は各画素の彩度の平均値である。1つの欄に複数
の各画素の彩度の平均値をあてはめることも可能であ
る。1002は画像データの周波数の平均値である。1
つの欄に複数の周波数の平均値をあてはめることも可能
である。1003は拍子である。拍子の種類はサウンド
データ属性格納部109に格納した拍子の種類と同じで
ある。この変換テーブルにより、画像データの各画素の
彩度の平均値及び周波数の平均値を拍子に変換する。画
像データの各画素の彩度の平均値が0.76で、周波数の平
均値が50Hzのとき、拍子が2/2拍子に変換される。
【0032】図11は画像データの各画素の輝度の平均
値及び周波数の平均値と速度の変換テーブルである。1
101は各画素の輝度の平均値である。1つの欄に複数
の各画素の輝度の平均値をあてはめることも可能であ
る。1102は画像データの周波数の平均値である。1
つの欄に複数の周波数の平均値をあてはめることも可能
である。1103は速度である。速度の種類はサウンド
データ属性格納部109に格納した速度の種類と同じで
ある。この変換テーブルにより、画像データの各画素の
輝度の平均値及び周波数の平均値を速度に変換する。画
像データの各画素の輝度の平均値が1で、周波数の平均
値が50Hzのとき、「1分間に4分音符1拍をが60拍分
とることができる」速度に変換される。
【0033】図12は強弱変化パターンである。ユーザ
が設定したfff(フォルテッシシシモ/極々強く)からp
pp(ピアニッシシシモ/極々弱く)を縦軸に、時間を横
軸にとっている。このグラフ中に記述されたのが強弱変
化パターン1201である。強弱パターン1201は強
弱パターンインデクス802と対応した強弱パターンイ
ンデクス1202が付加されている。強弱パターン12
01はn種類(n>=1,nは整数)用意している。
【0034】図13はリズムパターンである。1301
は902のリズムパターンインデクスと対応したリズム
パターンインデクスである。1302はリズムパターン
を記譜したものである。リズムパターンはn種類(n>
=1,nは整数)用意している。
【0035】図14は生成後のサウンドデータの格納処
理のフローチャートである。生成したサウンドデータに
属性変換処理で利用した画像データの属性の情報をサウ
ンドデータに付加する(ステップ1401)。付加した
後、サウンドデータと画像データの属性情報をサウンド
データベース106に格納する。
【0036】図15はサウンドデータベースの検索処理
のフローチャートである。この検索処理は画像データの
属性をそのまま検索キーとして利用するので、データベ
ースの格納処理は図14で記載した格納処理に準じた処
理でなければならない。まず画像データの属性を求める
(ステップ1501)。この処理はステップ201と同
じ処理である。次にサウンドデータに付加した画像デー
タの属性情報を検索キーにして検索処理を行う。そして
検索したサウンドデータを出力する。
【0037】図16は生成後のサウンドデータの異なる
格納処理のフローチャートである。生成したサウンドデ
ータに利用したサウンドデータの属性の情報を付加する
(ステップ1601)。付加した後、サウンドデータと
サウンドデータの属性情報をサウンドデータベース10
6に格納する。
【0038】図17はサウンドデータベースの異なる検
索処理のフローチャートである。この検索処理はサウン
ドデータの属性を検索キーとして利用するので、データ
ベースの格納処理は図16で記載した格納処理に準じた
処理でなければならない。まず画像データの属性を求め
る(ステップ1701)。この処理はステップ201と
同じ処理である。次に画像データの属性をサウンドデー
タの属性に変換する(ステップ1702)。この処理は
ステップ202と同じ処理である。変換処理は、前述の
サウンドデータを生成するときに利用した階層型ネット
ワークや変換テーブルを用いる。そしてサウンドデータ
の属性情報を検索キーにして検索処理を行い(ステップ
1703)、出力する。
【0039】
【発明の効果】以上説明したように、本発明によれば (1)入力した画像データの属性をサウンドデータの属
性に変換し、その属性を用いて作曲するので、入力した
画像データに適したサウンドデータを生成することが可
能となる。 (2)画像データに適したサウンドデータを容易かつ高
速に生成するすることが可能となる。 (3)画像データの入力によって、その入力した画像デ
ータに適したサウンドデータをサウンドデータベースか
ら検索することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施例であるサウンドデータ生成シス
テムのシステム構成図である。
【図2】サウンドデータ生成システムのメインルーチン
のフローチャートである。
【図3】画像データの属性を求める処理のフローチャー
トである。
【図4】階層型ニューラル・ネットワークを利用した画
像データの属性とサウンドデータの属性の変換処理であ
る。
【図5】画像データとサウンドデータの属性を変換する
処理である。
【図6】画像データの各画素の平均値と調性を付加した
和声モデルの変換テーブルである。
【図7】画像データの各画素の色相のうち最も出現率の
高い色相と音色モデルの変換テーブルである。
【図8】画像データの各画素の彩度の平均値と強弱変化
パターンの変換テーブルである。
【図9】画像データの周波数の平均値とリズムパターン
の変換テーブルである。
【図10】画像データの各画素の彩度の平均値及び周波
数の平均値と拍子の変換テーブルである。
【図11】画像データの各画素の輝度の平均値及び周波
数の平均値と速度の変換テーブルである。
【図12】強弱変化パターンである。
【図13】リズムパターンである。
【図14】生成後のサウンドデータの格納処理のフロー
チャートである。
【図15】サウンドデータベースの検索処理のフローチ
ャートである。
【図16】生成後のサウンドデータの異なる格納処理の
フローチャートである。
【図17】サウンドデータベースの異なる検索処理のフ
ローチャートである。
【符号の説明】
101…画像データ入力装置、102…表示装置、10
3…入力装置、104…画像データ属性解析処理部、1
05…中央処理装置、106…サウンドデータベース、
107…サウンドデータ検索処理部、108…サウンド
データ格納処理部、109…サウンドデータ属性格納
部、110…属性変換処理部、111…サウンドデータ
生成処理部、112…記憶装置、113…音源合成装
置、114…中央処理装置105と音源合成装置113
のインタフェース装置、115…スピーカ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山田 隆亮 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (72)発明者 寺濱 幸徳 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】画像データ入力装置と、表示装置と、入力
    装置と、記憶装置又は記憶媒体と、中央処理装置と、シ
    ンセサイザと、中央処理装置とコンピュータ制御可能な
    音源合成装置を接続するインタフェースと、スピーカか
    ら成る計算機システムにおいて、(1)画像データ属性
    抽出処理部と、(2)属性変換処理部と、(3)サウン
    ドデータ生成処理部と、(4)サウンドデータ格納処理
    部と、(5)サウンドデータベースと、(6)サウンド
    データ属性格納部を具備したことを特徴とするサウンド
    データ生成システム。
  2. 【請求項2】特許請求項1のサウンドデータ生成システ
    ムにおいて、画像データ属性を利用したサウンドデータ
    検索処理部を有することを特徴とするサウンドデータ生
    成システム。
  3. 【請求項3】特許請求項1のサウンドデータ生成システ
    ムにおいて、(1)画像データ属性抽出処理部が (a)画像データ入力装置を用いて、画像データの全画
    素のRGB値を取り込む第1のステップ; (b)取り込んだ全画素の該RGB値を輝度信号と色信
    号に分離する第2のステップ; (c)分離した該色信号から色差信号を求める第3のス
    テップ; (d)該色差信号から色相と彩度を各々求める第4のス
    テップ; (e)該輝度信号から輝度の平均値を求める第5のステ
    ップ; (f)該色相のうち最も出現率が高い色相を求める第6
    のステップ; (g)該彩度から彩度の平均値を求める第7のステッ
    プ; (h)該画像データの周波数の平均値を求める第8のス
    テップ; を具備し、(5)属性変換処理部が (a)該画像データ属性を入力層に入力する第1のステ
    ップ; (b)入力データを中間層で重み付けを行う第2のステ
    ップ; (c)該中間層で重み付けを行った該データを出力層の
    サウンド属性に出力する第3のステップ; から成る階層型ニューラル・ネットワークを具備し、
    (6)サウンドデータ属性格納部が (a)和声モデルデータ; (b)音色モデルデータ; (c)リズムパターンデータ; (d)強弱変化パターンデータ; (e)拍子情報; (f)速度情報; を具備したことを特徴とするサウンドデータ生成システ
    ム。
  4. 【請求項4】特許請求項1のサウンドデータ生成システ
    ムの(5)属性変換処理部が、 (a)画像データから抽出した輝度を調性を付加した和
    声モデルに変換する属性変換テーブル; (b)該画像データから抽出した色層を音色モデルに変
    換する属性変換テーブル; (c)該画像データから抽出した彩度を強弱変化モデル
    に変換する属性変換テーブル; (d)該画像データから抽出した周波数をリズムパター
    ンモデルに変換する属性変換テーブル; (e)該画像データから抽出した該彩度と該周波数を拍
    子に変換する属性変換テーブル; (f)該画像データから抽出した該輝度と該周波数を速
    度に変換する属性変換テーブル; を具備したことを特徴とするサウンドデータ生成システ
    ム。
  5. 【請求項5】特許請求項1のサウンドデータ生成システ
    ムにおいて、(4)サウンドデータ格納処理部が (a)サウンドデータの属性を該サウンドデータに付加
    する第1のステップ; (b)該属性付加処理を行った該サウンドデータをサウ
    ンドデータベースに格納する第2のステップ; を具備し、特許請求項2のサウンドデータ生成システム
    のサウンドデータ検索処理部が (c)画像データの属性をサウンドデータ属性に変換す
    る第1のステップ; (d)該サウンドデータの属性を検索キーにして検索す
    る第2のステップ; を具備したことを特徴とするサウンドデータ生成システ
    ム。
  6. 【請求項6】特許請求項1のサウンドデータ生成システ
    ムにおいて、(4)サウンドデータ格納処理部が (a)サウンドデータ生成時に利用した画像データの属
    性を該サウンドデータに付加する第1のステップ; (b)該属性付加処理を行った該サウンドデータをサウ
    ンドデータベースに格納する第2のステップ; を具備し、特許請求項2のサウンドデータ生成システム
    のサウンドデータ検索処理部が (c)該画像データの属性を検索キーにして検索する第
    1のステップ; を具備したことを特徴とするサウンドデータ生成システ
    ム。
JP4339984A 1992-12-21 1992-12-21 サウンドデータ生成システム Pending JPH06186958A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4339984A JPH06186958A (ja) 1992-12-21 1992-12-21 サウンドデータ生成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4339984A JPH06186958A (ja) 1992-12-21 1992-12-21 サウンドデータ生成システム

Publications (1)

Publication Number Publication Date
JPH06186958A true JPH06186958A (ja) 1994-07-08

Family

ID=18332636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4339984A Pending JPH06186958A (ja) 1992-12-21 1992-12-21 サウンドデータ生成システム

Country Status (1)

Country Link
JP (1) JPH06186958A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998011529A1 (fr) * 1996-09-13 1998-03-19 Hitachi, Ltd. Procede automatique de composition musicale
JPH11308513A (ja) * 1998-04-17 1999-11-05 Casio Comput Co Ltd 画像再生装置及び画像再生方法
JP2005242833A (ja) * 2004-02-27 2005-09-08 Dainippon Printing Co Ltd Web画面解析装置、web画面解析方法、web解析型音楽装置、及びweb監視装置
DE19983916B4 (de) * 1999-01-28 2010-02-18 Intel Corporation, Santa Clara Verfahren und Einrichtung zum Bearbeiten einer Videoaufzeichnung mit einer Audio-Auswahl
JP2014504924A (ja) * 2011-01-07 2014-02-27 コーニンクレッカ フィリップス エヌ ヴェ 個人化されたヒーリングサウンドデータベース
US11748594B2 (en) 2019-10-23 2023-09-05 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998011529A1 (fr) * 1996-09-13 1998-03-19 Hitachi, Ltd. Procede automatique de composition musicale
US6084169A (en) * 1996-09-13 2000-07-04 Hitachi, Ltd. Automatically composing background music for an image by extracting a feature thereof
EP1020843A1 (en) * 1996-09-13 2000-07-19 Hitachi, Ltd. Automatic musical composition method
EP1020843A4 (en) * 1996-09-13 2006-06-14 Hitachi Ltd AUTOMATIC MUSIC COMPONENT PROCESS
JPH11308513A (ja) * 1998-04-17 1999-11-05 Casio Comput Co Ltd 画像再生装置及び画像再生方法
DE19983916B4 (de) * 1999-01-28 2010-02-18 Intel Corporation, Santa Clara Verfahren und Einrichtung zum Bearbeiten einer Videoaufzeichnung mit einer Audio-Auswahl
JP2005242833A (ja) * 2004-02-27 2005-09-08 Dainippon Printing Co Ltd Web画面解析装置、web画面解析方法、web解析型音楽装置、及びweb監視装置
JP4611649B2 (ja) * 2004-02-27 2011-01-12 大日本印刷株式会社 Web解析型音楽装置
JP2014504924A (ja) * 2011-01-07 2014-02-27 コーニンクレッカ フィリップス エヌ ヴェ 個人化されたヒーリングサウンドデータベース
US9710551B2 (en) 2011-01-07 2017-07-18 Koninklijke Philips N.V. Personalized healing sounds database
US11748594B2 (en) 2019-10-23 2023-09-05 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Similar Documents

Publication Publication Date Title
Rahn Turning the analysis around: Africa-derived rhythms and Europe-derived music theory
JP4199097B2 (ja) 楽曲自動分類装置及び方法
Pressnitzer et al. Perception of musical tension for nontonal orchestral timbres and its relation to psychoacoustic roughness
Kendall et al. Identification and blend of timbres as a basis for orchestration
Schwarz Process vs. intuition in the recent works of Steve Reich and John Adams
JPH06290574A (ja) 楽曲検索装置
Johnston " Maximum Clarity" and Other Writings on Music
Tenney From Scratch: Writings in Music Theory
Carpentier et al. Automatic orchestration in practice
JPH06186958A (ja) サウンドデータ生成システム
JP3419278B2 (ja) 演奏設定データ選択装置、演奏設定データ選択方法及び記録媒体
Teodorescu-Ciocanea Timbre versus spectralism
JP4202964B2 (ja) 映像データへの楽曲データ付加装置
JP3623557B2 (ja) 自動作曲システムおよび自動作曲方法
Carreras et al. Automatic harmonic description of musical signals using schema-based chord decomposition
Balsach Application of virtual pitch theory in music analysis
Heetderks What Happens after the Primal Burn? Dissonance in Sonic Youth's Middle Period
Carter-Enyi et al. Visualizing Intertextual Form with Arc Diagrams: Contour and Schema-based Methods.
WO2021179206A1 (zh) 自动混音装置
Quintas et al. Music Creation from Found Sounds
Warnaby The music of Nicolaus A. Huber
Brook Investigating Symbolic Meaning in Partch’s Delusion of the Fury
MUSIC ISTANBUL TECHNICAL UNIVERSITY★ GRADUATE SCHOOL
JP2003302971A (ja) 映像データ処理装置及び映像データ処理プログラム
Hutton-DeWys " Toccatas and Arias": Analysis and Historical Context of Vivian Fine's Last Work for Solo Piano