JP6058192B1 - 音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体 - Google Patents
音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP6058192B1 JP6058192B1 JP2016114123A JP2016114123A JP6058192B1 JP 6058192 B1 JP6058192 B1 JP 6058192B1 JP 2016114123 A JP2016114123 A JP 2016114123A JP 2016114123 A JP2016114123 A JP 2016114123A JP 6058192 B1 JP6058192 B1 JP 6058192B1
- Authority
- JP
- Japan
- Prior art keywords
- image
- block
- color
- music
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 53
- 230000006870 function Effects 0.000 claims description 46
- 238000012937 correction Methods 0.000 claims description 22
- 238000010586 diagram Methods 0.000 claims description 20
- 230000001360 synchronised effect Effects 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 abstract 1
- 239000011295 pitch Substances 0.000 description 30
- 238000013500 data storage Methods 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000000007 visual effect Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 239000003086 colorant Substances 0.000 description 5
- 230000000638 stimulation Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 241001347978 Major minor Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000004456 color vision Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 241000405217 Viola <butterfly> Species 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004800 psychological effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
- G10H1/0025—Automatic or semi-automatic music composition, e.g. producing random music, applying rules from music theory or modifying a musical piece
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/38—Chord
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/101—Music Composition or musical creation; Tools or processes therefor
- G10H2210/111—Automatic composing, i.e. using predefined musical rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/005—Non-interactive screen display of musical or status data
- G10H2220/015—Musical staff, tablature or score displays, e.g. for score reading during a performance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/091—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith
- G10H2220/101—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith for graphical creation, edition or control of musical data or parameters
- G10H2220/126—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith for graphical creation, edition or control of musical data or parameters for graphical editing of individual notes, parts or phrases represented as variable length segments on a 2D or 3D representation, e.g. graphical edition of musical collage, remix files or pianoroll representations of MIDI-like files
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/155—User input interfaces for electrophonic musical instruments
- G10H2220/441—Image sensing, i.e. capturing images or optical patterns for musical purposes or musical control purposes
- G10H2220/455—Camera input, e.g. analyzing pictures from a video camera and using the analysis results as control data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
【課題】 画像によりふさわしい音楽を自動的に生成することが、望ましい。【解決手段】 複数の音源名称を格納する音源記憶部15と、音の高さに対応する縦軸、および音の進行時間に対応する横軸で画像を格子状に配列されたブロックに分割し、各々のブロックの代表色を決定するブロック代表色決定部19と、あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、ブロックの代表色が対応する色名をブロックのブロック色名として決定するブロック色名識別部21と、格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成するブロック選別部25および図形楽譜生成部27と、を備える画像音楽生成装置1である。【選択図】 図2
Description
本発明は、画像から音楽を生成・再生する画像音楽の生成・再生装置とその画像音楽の生成・再生方法などの、音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体に関するものである。
近年、画像に含まれる画素色の物理レベルを意味するRGB値から音楽を生成する方法が提案されている。例えばRGB値によって音符の種類を作成したり(たとえば、非特許文献1参照)、RGB値から長調短調の調と和音を作成したり(たとえば、非特許文献2参照)、或はRGB値を音の高さ、和音、楽器の種類に対応させたりする(たとえば、非特許文献3参照)などの方法が提案されている。
一般に音楽は、音楽を構成する以下の音楽要素、即ち音の高さ(音高)、音の長さ(音価)、音の拍(リズム)、調(長調短調)、和音、使用する複数種類の楽器、などを表わす楽譜により演奏される。
ところが、これらの提案は、これらの音楽要素の一部しか使っておらず、生成される音楽はあまりにも未完成であり、例えば複数の楽器によるオーケストラのような編成の音楽を生成することができない。また楽譜を生成することができないため、生成された音楽は、聴覚のみで評価しなければならない。従って楽譜による客観的な評価や、生成された音楽に修正をすることができない。
画像から生成される音楽の視覚的特性は、画像の視覚的特性と、類似性や相関性があることが望ましい。
しかしこれら上記の提案はすべて知覚とは関連性の低い物理レベルのRGB値から各音楽要素への変換であるため、人間の知覚レベルでの類似性が悪いという問題があった。また、これらの提案は1枚の画像のみから音楽を生成することを目的としており、複数の画像を連続してスライドショーのように1曲の音楽を作ることは出来ないという問題があった。また、画像から自動的に音楽と楽譜を生成し、かつ簡単な操作で再生することが出来ないという問題があった。
若林努、小林孝浩、平林真美、「画像の特徴を用いたメロディ自動生成システムの提案」、情報処理学会インタラクション2011
藤田雅也、「画像情報による楽曲自動生成システムの検討」、東京都市大学 2012年度 卒業研究概要
小島健治、「画像の色情報を音楽へ変換する『RGB MusicLab』」V34,(2010)、[online]、インターネット<URL:http://www.forest.impress.co.jp/docs/review/20100421_362686.html>
しかしながら、画像によりふさわしい音楽を自動的に生成することが、望ましい。
本発明は、前述された従来の課題を考慮し、画像によりふさわしい音楽を自動的に生成することができる、音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体を提供することを目的とする。
第1の本発明は、画像を入力する画像入力部と、
複数の音源名称を格納する音源名称記憶部と、
音の高さに対応する縦軸、および音の進行時間に対応する横軸で前記画像を格子状に配列されたブロックに分割し、各々の前記ブロックの代表色を決定するブロック代表色決定部と、
あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、前記格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、前記ブロックの前記代表色が対応する色名を前記ブロックのブロック色名として決定するブロック色名識別部と、
前記格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成する図形楽譜生成ユニットと、
を備えることを特徴とする音楽情報生成装置である。
複数の音源名称を格納する音源名称記憶部と、
音の高さに対応する縦軸、および音の進行時間に対応する横軸で前記画像を格子状に配列されたブロックに分割し、各々の前記ブロックの代表色を決定するブロック代表色決定部と、
あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、前記格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、前記ブロックの前記代表色が対応する色名を前記ブロックのブロック色名として決定するブロック色名識別部と、
前記格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成する図形楽譜生成ユニットと、
を備えることを特徴とする音楽情報生成装置である。
第2の本発明は、前記画像入力部から前記入力された画像を格納する画像記憶部と、
少なくとも前記画像を表示する表示部と、
前記複数の色名と、前記複数の音源名称と、を対応付ける音源名称設定部と、
前記生成された図形楽譜から音楽データを生成する音楽データ生成部と、
を備え、
前記表示部は、前記格子状に配列されたブロックが前記代表色で塗り潰されたモザイク画像、および前記選別された所定のブロックが前記ブロック色名の色で塗り潰されたモザイク画像の内の少なくとも一つを表示することを特徴とする、第1の本発明の音楽情報生成装置である。
少なくとも前記画像を表示する表示部と、
前記複数の色名と、前記複数の音源名称と、を対応付ける音源名称設定部と、
前記生成された図形楽譜から音楽データを生成する音楽データ生成部と、
を備え、
前記表示部は、前記格子状に配列されたブロックが前記代表色で塗り潰されたモザイク画像、および前記選別された所定のブロックが前記ブロック色名の色で塗り潰されたモザイク画像の内の少なくとも一つを表示することを特徴とする、第1の本発明の音楽情報生成装置である。
第3の本発明は、前記図形楽譜生成ユニットは、前記ブロックの色属性、および前記画像における前記ブロックの位置属性の内の少なくとも一つに関する除去パラメータを利用して、前記所定のブロックを選別する第1の本発明の音楽情報生成装置である。
第4の本発明は、前記生成された音楽データを再生する音声出力部を備え、
前記表示部は、前記生成された音楽データの再生が同期するように、前記格納された画像および前記生成された図形楽譜の内の少なくとも一つを表示することを特徴とする、第2の本発明の音楽情報生成装置である。
前記表示部は、前記生成された音楽データの再生が同期するように、前記格納された画像および前記生成された図形楽譜の内の少なくとも一つを表示することを特徴とする、第2の本発明の音楽情報生成装置である。
第5の本発明は、前記生成された音楽データを再生する音声出力部と、
前記画像入力部に入力された複数の画像からそれぞれ前記生成された音楽データの再生が同期するように、前記複数の画像のスライドショーを行うスライドショー生成部と、
を備えることを特徴とする、第2の本発明の音楽情報生成装置である。
前記画像入力部に入力された複数の画像からそれぞれ前記生成された音楽データの再生が同期するように、前記複数の画像のスライドショーを行うスライドショー生成部と、
を備えることを特徴とする、第2の本発明の音楽情報生成装置である。
第6の本発明は、前記画像入力部に入力された複数の画像からそれぞれ前記生成された音楽データと、前記複数の画像のデータと、を統合して、動画ファイルを作成する動画ファイル作成部を備えることを特徴とする、第2の本発明の音楽情報生成装置である。
第7の本発明は、前記音楽データ生成部は、前記横軸の方向に連続した、複数の同じ前記ブロック色名のブロックを一つの音符に対応させて、前記音楽データを生成することを特徴とする、第2の本発明の音楽情報生成装置である。
第8の本発明は、前記表示部は、前記色属性値の前記範囲の設定、前記所定のブロックの選別のためのパラメータの設定、および前記音源名称の設定を行うための図を表示することを特徴とする、第2の本発明の音楽情報生成装置である。
第9の本発明は、前記図形楽譜生成ユニットは、和音を発生するための和音補正を利用して、前記図形楽譜を生成することを特徴とする、第1の本発明の音楽情報生成装置である。
第10の本発明は、前記生成された音楽データ、又は前記生成された図形楽譜は、所定の端末、および所定のサーバーの内の少なくとも一つに対して、送信されることを特徴とする、第2の本発明の音楽情報生成装置である。
第11の本発明は、前記画像入力部に前記入力された画像は、前記所定の端末から送信され受信された画像であることを特徴とする、第10の本発明の音楽情報生成装置である。
第12の本発明は、前記所定の端末は、前記画像入力部に前記入力された画像を送信した端末ではない別の端末であり、
前記生成された音楽データ、又は前記生成された図形楽譜は、前記別の端末、および前記所定のサーバーの内の少なくとも一つに対して、前記画像入力部に前記入力された画像とともに送信されることを特徴とする、第10の本発明の音楽情報生成装置である。
前記生成された音楽データ、又は前記生成された図形楽譜は、前記別の端末、および前記所定のサーバーの内の少なくとも一つに対して、前記画像入力部に前記入力された画像とともに送信されることを特徴とする、第10の本発明の音楽情報生成装置である。
第13の本発明は、前記画像入力部に前記入力された複数の画像は、所定の端末から送信され受信された複数の画像であり、
前記作成された動画ファイルは、前記所定の端末、前記所定の端末とは異なる端末、および所定のサーバーの内の少なくとも一つに対して、送信されることを特徴とする、第6の本発明の音楽情報生成装置である。
前記作成された動画ファイルは、前記所定の端末、前記所定の端末とは異なる端末、および所定のサーバーの内の少なくとも一つに対して、送信されることを特徴とする、第6の本発明の音楽情報生成装置である。
第14の本発明は、音楽情報生成装置にて実行される音楽情報生成方法であって、
画像を入力する画像入力ステップと、
複数の音源名称を格納する音源名称記憶ステップと、
音の高さに対応する縦軸、および音の進行時間に対応する横軸で前記画像を格子状に配列されたブロックに分割し、各々の前記ブロックの代表色を決定するブロック代表色決定ステップと、
あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、前記格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、前記ブロックの前記代表色が対応する色名を前記ブロックのブロック色名として決定するブロック色名識別ステップと、
前記格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成する図形楽譜生成ステップと、
を備えることを特徴とする音楽情報生成方法である。
画像を入力する画像入力ステップと、
複数の音源名称を格納する音源名称記憶ステップと、
音の高さに対応する縦軸、および音の進行時間に対応する横軸で前記画像を格子状に配列されたブロックに分割し、各々の前記ブロックの代表色を決定するブロック代表色決定ステップと、
あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、前記格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、前記ブロックの前記代表色が対応する色名を前記ブロックのブロック色名として決定するブロック色名識別ステップと、
前記格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成する図形楽譜生成ステップと、
を備えることを特徴とする音楽情報生成方法である。
第15の本発明は、第14の本発明の音楽情報生成方法の、音の高さに対応する縦軸、および音の進行時間に対応する横軸で前記画像を格子状に配列されたブロックに分割し、各々の前記ブロックの代表色を決定するブロック代表色決定ステップ、あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、前記格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、前記ブロックの前記代表色が対応する色名を前記ブロックのブロック色名として決定するブロック色名識別ステップ、および前記格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成する図形楽譜生成ステップとしてコンピュータを機能させるための、コンピュータ読み取り可能な媒体に記録されたプログラムである。
第16の本発明は、第15の本発明のプログラムを記録した、コンピュータ読み取り可能な記録媒体である。
本発明により、画像によりふさわしい音楽を自動的に生成することが可能な音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体を提供することができる。
以下、本発明の第1の実施形態にかかる画像音楽生成装置1について、図面を参照して説明する。図1は、本発明にかかる画像音楽生成装置1のハードウェア構成を示す。
本実施の形態の画像音楽生成装置1の動作について説明しながら、本発明の音楽情報生成方法の一実施の形態についても説明する。
なお、画像音楽生成装置1は、本発明の音楽情報生成装置の一例である。
また、ブロック選別部25および図形楽譜生成部27を含む手段は、本発明の図形楽譜生成ユニットの一例である。
また、音源記憶部15は、本発明の音源名称記憶部の一例である。また、音源設定部26は、本発明の音源名称設定部の一例である。
また、スマートフォン105、パソコン107、デジタルカメラ106、デジタルフォトフレーム103、インターネット対応テレビ104は、本発明の端末の一例である。また、画像音楽サーバー102は、本発明のサーバーの一例である。
(画像音楽生成装置1の基本的な構成および動作)
主として図1および2を参照しながら、説明を行う。ここに、図1は、本発明における実施の形態の画像音楽生成装置1の構成図であり、図2は、本発明における実施の形態の画像音楽生成再生相関の説明図である。
主として図1および2を参照しながら、説明を行う。ここに、図1は、本発明における実施の形態の画像音楽生成装置1の構成図であり、図2は、本発明における実施の形態の画像音楽生成再生相関の説明図である。
画像音楽生成装置1は、操作命令が入力される操作入力部2と、カメラなど撮影素子を含む画像入力部3と、画像又は文字、図形などを表示する表示部4と、スピーカーを含む声や音楽などを出力する音声出力部5と、データを外部装置に送受信するための無線又は有線の外部通信部6と、装置全体を制御するCPU7(制御部)と、データ処理プログラム11を記憶する主記憶部8と、データ記憶部9とを備え、これらはバス10に接続されている。ここにデータ処理プログラム11には、データ生成部12とデータ再生部13が含まれ、データ記憶部9には、デジタル画像51を記憶する画像記憶部14、音源データ52を記憶する音源記憶部15、図形楽譜データ53を記憶する図形楽譜記憶部16、音楽データ54を記憶する音楽データ記憶部17とが含まれる。
なお、ここで操作入力部2は、キーボード、タッチ入力パネル、音声入力、リモコンなど、操作入力であれば、種類を問わない。また画像入力部3は、カメラやスキャナーなど撮像するデバイス、或はメモリーカード、USBメモリー、HDDメモリー、光ディスクメモリーなど画像を取得できるデバイスであれば、種類を問わない。ここでは撮像素子を持ったカメラとし、入力する画像はデジタル画像51として説明する。また、この画像音楽生成装置1の構成がネットワークサーバーとして組み込まれる場合には、必ずしも音声出力部5や、表示部4を必要としないが、ここでは、説明を容易にするために、スピーカーを含む音声出力部5と表示デバイスを含む表示部4を持つものとする。また、音楽データ54は曲全体の音に関する、音高、音価、強さ、テンポ、調、和音、音源などを含む音楽要素や楽譜の情報を持つものとする。
図1の画像音楽生成装置1のようなハードウェア構成を使用して、画像入力部3から入力されるデジタル画像51を、CPU7と、データ生成部12とデータ再生部13とを有するデータ処理プログラム11によりデータ処理をして、音楽データ54を生成して音声出力部5に出力する機能を、図2の画像音楽生成再生相関図に従って説明する。
代表色モザイク画像生成部20として、ブロック分割機能、ブロック代表色の決定機能、代表色モザイク画像の生成機能、の順で説明する。
なお、格子状に配列されたブロックが代表色で塗り潰されたモザイク画像、および選別された所定のブロックがブロック色名の色で塗り潰されたモザイク画像は、表示部4に表示されてもよいし、表示されなくてもよい。
(ブロック分割機能)
主として図3および4を参照しながら、説明を行う。ここに、図3は、本発明における実施の形態のデジタル画像の説明図であり、図4は、本発明における実施の形態の代表色モザイク画像の説明図である。
主として図3および4を参照しながら、説明を行う。ここに、図3は、本発明における実施の形態のデジタル画像の説明図であり、図4は、本発明における実施の形態の代表色モザイク画像の説明図である。
ブロック分割部18として、図3に示すデジタル画像51を、図4に示すように格子状に縦横で区切ってブロック化する機能手段について説明する。縦軸の全長を整数オクターブ(ここでは2オクターブ)として、1オクターブを、ド、ド#、レ、レ#、ミ、ファ、ファ#、ソ、ソ#、ラ、ラ#、シの12平均律で表した時の24音階の尺度の音程に対応して、縦に24分割されるようにブロック分割部18のプログラムに従ってCPU7で実行させる。また、横軸の全長を整数小節(ここでは4小節)として、ここでは4分音符を拍(BEAT)の単位として、16分割させる。つまり、2オクターブの音高数24と、16音符(Note)の拍数16に対応するように、1枚のデジタル画像51が24×16のブロックに分割される。
(ブロック代表色の決定機能)
ブロックには、解像度に応じて多数の画素が含まれるので、ブロック代表色決定部19で、そのブロックの代表画素及び代表色を決める計算方法を説明する。各画素は通常RGBカラーモデルのRGB値で表現される。RGB値は、多くの場合カメラやスキャナーなど入力デバイスで取得されたデジタル画像の色再現情報であり、物理レベルの表色値である。RGB値は色光の三原色であるR(赤)、G(緑)、(青)の混色比率で表され、人間の知覚とは対応していない。しかし、本実施の形態ではデジタル画像から人間の視覚特性を取得することが前提となる。例えば、色名の色範囲を設定したり、ブロックから色名を識別したりする処理プロセスにおいて、心理レベルに近い表色値が必要となる。心理レベルの表色方法には、色知覚の三属性である色相(Hue)、明度(Value)、彩度(Chroma)に基づくマンセル表色系などがあるが、ここではRGB値からの変換式がありデジタル表現が比較的容易な上、心理レベルに近い色相(Hue)、彩度(Saturation)、明度(Value)から構成されるHSVカラーモデルを使用する。RGB値からHSV値への変換式はよく知られているので省略する。ここではブロック内の画素のRGB値の最頻値をCPU7によって計算した後、HSV値に変換してブロックの代表画素における色属性の代表値とし、それをブロックの代表色とする。計算の方法は、最頻値ではなく平均値であっても構わない。
ブロックには、解像度に応じて多数の画素が含まれるので、ブロック代表色決定部19で、そのブロックの代表画素及び代表色を決める計算方法を説明する。各画素は通常RGBカラーモデルのRGB値で表現される。RGB値は、多くの場合カメラやスキャナーなど入力デバイスで取得されたデジタル画像の色再現情報であり、物理レベルの表色値である。RGB値は色光の三原色であるR(赤)、G(緑)、(青)の混色比率で表され、人間の知覚とは対応していない。しかし、本実施の形態ではデジタル画像から人間の視覚特性を取得することが前提となる。例えば、色名の色範囲を設定したり、ブロックから色名を識別したりする処理プロセスにおいて、心理レベルに近い表色値が必要となる。心理レベルの表色方法には、色知覚の三属性である色相(Hue)、明度(Value)、彩度(Chroma)に基づくマンセル表色系などがあるが、ここではRGB値からの変換式がありデジタル表現が比較的容易な上、心理レベルに近い色相(Hue)、彩度(Saturation)、明度(Value)から構成されるHSVカラーモデルを使用する。RGB値からHSV値への変換式はよく知られているので省略する。ここではブロック内の画素のRGB値の最頻値をCPU7によって計算した後、HSV値に変換してブロックの代表画素における色属性の代表値とし、それをブロックの代表色とする。計算の方法は、最頻値ではなく平均値であっても構わない。
(代表色モザイク画像生成機能)
代表色モザイク画像生成部20において、ブロック内は代表色で塗りつぶされ、図4に示す24×16のブロックの代表色によるモザイク画像(以下、代表色モザイク画像)がCPU7によって生成される。即ち各ブロックは単色の色属性を持ち、モザイク画像の位置座標で同定される。
代表色モザイク画像生成部20において、ブロック内は代表色で塗りつぶされ、図4に示す24×16のブロックの代表色によるモザイク画像(以下、代表色モザイク画像)がCPU7によって生成される。即ち各ブロックは単色の色属性を持ち、モザイク画像の位置座標で同定される。
(音源色名・色範囲設定機能)
主として図5(a)を参照しながら、説明を行う。ここに、図5(a)は、本発明における実施の形態の音源色名範囲設定操作画面の説明図である。
主として図5(a)を参照しながら、説明を行う。ここに、図5(a)は、本発明における実施の形態の音源色名範囲設定操作画面の説明図である。
一旦モザイク画像生成の説明から離れ、ブロック色名識別部21の中の音源色名設定部22の、音源色名と色範囲設定機能を説明する。ブロックにはそれに対応する音源を示す色名(以下、音源色名)が割り当てられる。音源色名は、各々色空間の中の色範囲と対応している。音源色名の数や、音源色名の色範囲は任意であるが、ここでは赤色、橙色、黄色、緑色、青色、紫色、灰色の7色の音源色名と色範囲を設定する。通常、色名と対応する色空間は、マンセル表色系のように、色相、明度、彩度の3次元の色属性を持つ。ここでは、3次元属性を持つHSV色空間で色範囲を設定する。音源色名はその3つの次元のそれぞれに範囲を定め、その色範囲内にある色はその音源色名と識別する。ここでは各音源色名が、系統色名のように、色空間がすべていずれかの色名の色範囲に属し、重なりが無いように定める。しかし、慣用色名のように、色空間の中に色名の色範囲に属さない色が存在する方法でもかまわない。その場合はどの音源色名でもないと識別される。ユーザーが容易に音源色名の色範囲を変更・設定できるように、ここでは図5(a)のような2次元図がCPU7によって表示部4に表示される。これは外周が色相軸で、中心から外周までの半径が彩度軸となる、2次元のカラー円グラフである。音源色名は扇形の角度による色相範囲と、割合による彩度範囲で指定できるようになっている。なおこの例では音源色名の明度範囲の指定は用いない。後述するように音源色は音源の種類に割り当てられる。
(音源色名識別機能)
ブロック色名識別部21の中の、音源色名識別部23を説明する。
ブロック色名識別部21の中の、音源色名識別部23を説明する。
上記の代表色モザイク画像のすべてのブロックは、各ブロックが代表色で均一となっており、音源色名識別部23で各ブロックの代表色がどの音源色名の色範囲に入っているかが識別される。例えば、もし赤色(扇形の角度321度から15度、彩度20パーセント以上)の色範囲以内であれば、そのブロックの音源色名は赤色と認定される。このようにモザイク画像のすべてのブロックの音源対応の色名が識別される。
色属性値の範囲に対応付けられた、赤色、橙色、および黄色などのような色名(図5(a)参照)は、遅くとも音楽データ生成部28が実行するステップにおいてはヴィオラ、シンセサイザーストリングズ1、およびストリングアンサンブル1などのような音源名称(図5(b)参照)に対応付けられていなければならないが、音源色名識別部23が実行するステップにおいてはまだ音源名称に対応付けられていなくてもよい。
(音源色モザイク画像生成機能)
音源色モザイク画像生成部24で、ブロックは識別された音源色名の色値(音源色)で塗りつぶされ、代表色モザイク画像から音源色によるモザイク画像(以下、音源色モザイク画像)ができる(音源色モザイク画像は図示せず)。
音源色モザイク画像生成部24で、ブロックは識別された音源色名の色値(音源色)で塗りつぶされ、代表色モザイク画像から音源色によるモザイク画像(以下、音源色モザイク画像)ができる(音源色モザイク画像は図示せず)。
(ブロック除去機能と音符候補抽出機能)
ブロック選別部25における、音源色モザイク画像の中で必要なブロックをCPU7により選別させて、音符候補を抽出する機能を説明する。一般に、ある拍で一度に鳴る音源が多すぎると騒がしくて心地良くない。例えば画像を24×16にブロック分割した場合、そのまま全てのブロックに音を割り当てると、全ての拍で24音高(2オクターブ)の音が鳴ることになり、大変騒がしい音楽になる。そうした理由により、画像から適切にブロックを間引いて残ったブロックから音楽を生成することが必要になるが、画像全体の視覚特性に相応しい聴覚特性を持った音楽を生成することを考慮して、音源色モザイク画像から色属性と位置属性の「除去パラメータ」に従ってブロックを除去する。
ブロック選別部25における、音源色モザイク画像の中で必要なブロックをCPU7により選別させて、音符候補を抽出する機能を説明する。一般に、ある拍で一度に鳴る音源が多すぎると騒がしくて心地良くない。例えば画像を24×16にブロック分割した場合、そのまま全てのブロックに音を割り当てると、全ての拍で24音高(2オクターブ)の音が鳴ることになり、大変騒がしい音楽になる。そうした理由により、画像から適切にブロックを間引いて残ったブロックから音楽を生成することが必要になるが、画像全体の視覚特性に相応しい聴覚特性を持った音楽を生成することを考慮して、音源色モザイク画像から色属性と位置属性の「除去パラメータ」に従ってブロックを除去する。
視覚特性における色知覚の観点から考えると、彩度が一定以上ではないと特定の色として知覚されにくい。従って、「除去パラメータ」として、彩度パラメータを設定し、ある閾値以下はブロックを除去する。例えば、HSV色空間の彩度(Saturation)が30%以下は除去するという設定を行う。
さらに、明度に関して言えば、人間は画像が明るすぎる場合は、光と認識するため物体色として知覚されにくい。同様に暗すぎる場合も陰影として認識するため物体色として知覚されにくい。したがって、明度パラメータを設定し、高明度のある閾値以上と、低明度のある閾値以下のブロックを除去する。例えば、HSV色空間の明度(Value)が70%以上、20%以下は除去するという設定を行う。
さらに、人間の注意は画像の中央部やカメラのフォーカス部分、人物の顔や体に集中するため、画像位置パラメータを設定し、それ以外のブロックを除去する。必然的に画像の中でもっとも知覚されやすく、特徴的な物体の形状などを残すブロックが残ることになる。このようにしてブロックを除去して残ったブロックを音符候補ブロックとする。
(音源の設定機能)
主として図5(b)を参照しながら、説明を行う。ここに、図5(b)は、本発明における実施の形態の音源設定操作画面の説明図である。
主として図5(b)を参照しながら、説明を行う。ここに、図5(b)は、本発明における実施の形態の音源設定操作画面の説明図である。
音源設定部26で、音符候補ブロックの音源を決定する。上述のように音源色名と色範囲が音源の種類に割り当てに用いられる。音源色から音源への割り当ては固定でもよいが、図5(b)のように音源設定画面を表示部4に表示させ、ユーザーに音源色名に対応する音源を設定させてもよい。オーケストラのように、楽器編成の多い楽曲でも複数の音源を容易に設定することができる。また、画像の中で最も刺激量が強い色は赤、無彩色を除いて最も刺激量の弱い色は青である。例えばそのような画像の色の刺激量に比例させて、音の刺激の強い弦楽器音源を赤色とし、音の刺激量の弱い木管楽器音源を青色に設定させることができる。このように色と音源から画像と音楽の相関を容易に作ることができる。因みに画像の配色においては、絵画などでは色の刺激量の強い赤が進出し、刺激量の弱い青が後退するように心理的に感じる効果を使った色彩遠近法が知られている。また、音源の配置においては、オーケストラの楽器編成では、舞台前面に刺激量の強いヴァイオリンのような弦楽器を配置し、刺激量の弱いフルートのような木管楽器を後部に配置することで、音の遠近感を強めている。このように色と音の刺激量の強弱を対応させることで、音によって画像の遠近感が強化される心理的効果が期待できる。このようにして、すべての音符候補ブロックに音源が割り当てられる。
次に、図形楽譜生成部27において、ブロック図形総譜を生成する方法を説明する。
(音符候補の音符化機能)
上記の音符候補ブロックから、音符を作成する方法を説明する。一般に、音符は音の長さ(音価)と時間的な位置、および高さ(音高)を表す。本実施の形態において、時間的な位置と音高は、代表色モザイク画像の中のブロックの位置から一意に決まる。例えば図4の24×16に分割された代表色モザイク画像において、左から3番目、上から6番目のブロックAは、4分の4拍子で1小節目の3拍目で、音高はソとなる。一方、音の長さ(音価)は他の音符候補ブロックとの関係から定まる。例えば横軸のスケールを4小節とし4分の4拍子で曲を作る場合、画像は16分割されるので1ブロックの横幅は4分音符相当になる。
上記の音符候補ブロックから、音符を作成する方法を説明する。一般に、音符は音の長さ(音価)と時間的な位置、および高さ(音高)を表す。本実施の形態において、時間的な位置と音高は、代表色モザイク画像の中のブロックの位置から一意に決まる。例えば図4の24×16に分割された代表色モザイク画像において、左から3番目、上から6番目のブロックAは、4分の4拍子で1小節目の3拍目で、音高はソとなる。一方、音の長さ(音価)は他の音符候補ブロックとの関係から定まる。例えば横軸のスケールを4小節とし4分の4拍子で曲を作る場合、画像は16分割されるので1ブロックの横幅は4分音符相当になる。
この場合孤立した音符候補ブロックは4分音符となるが、音符候補ブロックが横に連続して2つあれば2分音符とし、3つあれば付点2分音符、4つあれば全音符とするようにCPU7に決定させる。たとえば、小節線を挟んで横に連続して2つある音符候補ブロックに対応する2つの4分音符は、タイで結ばれてもよいし、結ばれなくてもよい。もし8分の4拍子で作曲したい場合は、画像を32分割して同様の処理をさせればよい。
ここでは音符候補ブロックの横位置関係から音価を決定させたが、斜め横位置関係にあり、音高が変化してもかまわない。たとえば、近接して斜め横位置関係にある音符候補ブロックに対応する音符は、スラーで結ばれてもよいし、結ばれなくてもよい。
このようにして、音符候補ブロックから、音の長さ(音価)、高さ(音高)、拍から構成される音符が生成される。
(ブロック図形総譜生成機能)
主として図6を参照しながら、説明を行う。ここに、図6は、本発明における実施の形態のブロック図形総譜の説明図である。
主として図6を参照しながら、説明を行う。ここに、図6は、本発明における実施の形態のブロック図形総譜の説明図である。
上述のように音符候補ブロックから生成された音符を2次元に配置することにより、デジタル画像51から自動的にブロック図形総譜を生成することができる。ブロック図形総譜の例を図6に示す。なお、図形楽譜生成部27では上記のブロック図形総譜だけではなく、後に述べる和音補正図形総譜やパート譜も必要に応じて生成される(以下、これらを合わせて図形楽譜と呼ぶ)。
続いて、音楽データ生成部28を説明する。音楽データ生成部28では、ユーザーの設定に応じて和音の補正、調性の設定、および音の強さの設定を行ない、音楽データ54を生成する。
(調性設定機能)
音楽に調性を設定するには、例えば図6のブロック図形楽譜において、ブロックが多い音高を主音とする。この場合、G(ト)が主音となる。長調か短調かを判定するには、聴覚的な印象と視覚的な印象が類似するように、画像が明るく、鮮やかならば長調、暗く、くすんでいるならば短調とする。例えば、予め明度、彩度のパラメータを設定し、画像全体の平均明度が50%以上、平均彩度が50%以上ならば長調、未満ならば短調と判定する。もちろん人によって感覚が違うのでパラメータは変更してもかまわない。長調の場合は、主音を基にした長音階のみを有効とし、その他の音高は鳴らさない。この場合、ソ、ラ、シ、ド、レ、ミ、ファ#となり、ト長調ということになる。もし短調の場合であるなら主音を基にした短音階のみを有効とし、その他の音高を鳴らさない。この場合、短音階のソ、ラ、シ♭、ド、レ、ミ♭、ファ#(和声的短音階)となり、ト短調ということになる。
音楽に調性を設定するには、例えば図6のブロック図形楽譜において、ブロックが多い音高を主音とする。この場合、G(ト)が主音となる。長調か短調かを判定するには、聴覚的な印象と視覚的な印象が類似するように、画像が明るく、鮮やかならば長調、暗く、くすんでいるならば短調とする。例えば、予め明度、彩度のパラメータを設定し、画像全体の平均明度が50%以上、平均彩度が50%以上ならば長調、未満ならば短調と判定する。もちろん人によって感覚が違うのでパラメータは変更してもかまわない。長調の場合は、主音を基にした長音階のみを有効とし、その他の音高は鳴らさない。この場合、ソ、ラ、シ、ド、レ、ミ、ファ#となり、ト長調ということになる。もし短調の場合であるなら主音を基にした短音階のみを有効とし、その他の音高を鳴らさない。この場合、短音階のソ、ラ、シ♭、ド、レ、ミ♭、ファ#(和声的短音階)となり、ト短調ということになる。
(和音補正機能)
主として図7を参照しながら、説明を行う。ここに、図7は、本発明における実施の形態の和音補正図形総譜の説明図である。
主として図7を参照しながら、説明を行う。ここに、図7は、本発明における実施の形態の和音補正図形総譜の説明図である。
上述の方法は、12音高の中の7つの音高のみを有効にすることによって、音楽に調性を与えるものであるが、そこに含まれる不協和音を除き、協和音に補正することで、さらに音楽的に聴きやすくする方法を説明する。図6のブロック図形楽譜から、図7の和音補正図形楽譜に変換するにあたり、拍にあたる、各列で和音を決定してブロックを再配列する。和音は、1度、3度、5度を中心とした3和音を基本とするが、7度を加えてもかまわない。各列の和音は、ブロック図形楽譜において判定された、調の7音高に含まれる、特定の音高の多さや、調の7音高から外れている場合はいずれかの音高との近さなどによって根音を決定し、3和音のコードが判定される。図7の和音補正図形楽譜の場合、左から4列目、5列目のコードはGと判定され、ブロックは、ソ、シ、レに移動される。ただし、ブロック数が増えると印象が大きく変わるので、ブロック数は変更しない。またフロック数が3和音に満たないときも、根音及びコードが判定されるが、1音または2音のみで設定される。例えば、図6の1列目にはファ#とファのブロックが上下に並んでいるが、ト長調の主音であるソに移動され、Gのコードが設定されている。このように音数が少ない場合などにおいて、コードの決定は、主和音、属和音、下属和音など主要なコードを重視する。ただし、和声の方法は無数にあるため、和音補正は上述のような方法の限りではない。
もちろん、図形楽譜は、和音を発生するための和音補正を利用して生成されてもよいし、和音補正を利用せずに生成されてもよい。たとえば、図形楽譜は、所定のブロックを選別することによって和音補正なしに直ちに完成してもよい。そして、デジタル画像51の縦軸(図4参照)のスケールが、和音補正が不要になるようにあらかじめ設定されていてもよい。さらに、音楽データ生成部28が、和音補正を行う機能をもっていてもよい。
(音の強さ設定機能)
各音符の音の強さは、例えばブロックの明度に比例させて強弱を決めることができる。
各音符の音の強さは、例えばブロックの明度に比例させて強弱を決めることができる。
(図形楽譜の生成)
主として図8を参照しながら、説明を行う。ここに、図8は、本発明における実施の形態の和音補正パート譜の説明図である。
主として図8を参照しながら、説明を行う。ここに、図8は、本発明における実施の形態の和音補正パート譜の説明図である。
図形楽譜生成部27について説明する。
このブロック図形総譜及び和音補正図形総譜は、後に、音楽の演奏のために必要となる音楽基本要素の音高、音価、拍、和音、強さ、調、楽器などを含んだ音楽データ54を生成するために用いられる。また、和音補正図形総譜を音源色名の色値ごと分解させれば、図8のように和音補正パート譜が作成される。以降、ブロック図形総譜と和音補正図形総譜を合わせて総譜と呼び、和音補正パート譜を単にパート譜と呼ぶ。また、総譜とパート譜を合わせて図形楽譜データと呼ぶ。図形楽譜データは、図形楽譜記憶部16に記憶される。パート譜は、一部のパートの音源だけで生成された音楽を再生する場合や、生成された音楽の内容を、パートごとに検討する場合などに用いられる。
図6のブロック図形総譜、図7の和音補正図形総譜、及び図8のパート譜は、音符を色分けされた四角のブロック形の音符で表示されているが、勿論、従来の五線記譜法の音符で表示することができるのは言うまでもない。
上記のような図形楽譜(総譜またはパート譜)は表示部4に提示してユーザーに示しても良い。これにより、生成された音楽の評価を客観的に行うことができ、また部分的な修正も容易に行うことができる。
(音楽データ生成)
主として図9を参照しながら、説明を行う。ここに、図9は、本発明における実施の形態のパート譜の説明図である。
主として図9を参照しながら、説明を行う。ここに、図9は、本発明における実施の形態のパート譜の説明図である。
総譜又はパート譜から、音楽データを生成する処理を説明する。音楽データ54は、発音のタイミング、音の高さ、強さ、長さ、楽器などの音楽の演奏情報をCPU7で扱いやすい記号情報で表したものである。例えばMIDIが音楽データ54に用いられる。図9のピアノのパート譜を例にとって説明する。たとえば、図5(b)の音源設定の画面からユーザーによって音源色名が灰色である音源がピアノ(アコースティックピアノ)に設定されると、CPU7によって図9のピアノのパート譜の指示に従ってピアノの音源データ52の情報(音源データアドレス情報という)を含んだ音楽データ54が生成される。そして残りの色も設定された音源色とそれぞれのパート譜から音楽データ54が生成され、それらが組み合わされて最終的に演奏される音楽データ54が出来上がる。生成された音楽データ54は音楽データ記憶部17に記録される。
(音楽の再生)
音楽再生部33を説明する。音楽データ54はMIDIなどの記号データなので、スピーカーなどで音として鳴らすためには音の波形に変換する必要がある。音楽再生部33では、音楽データ54の中にある音源データアドレス情報を使って、音源データ記憶部にある音源データ52の音源波形データを読み込んで音楽データ54を波形に変換する。例えば、音楽データ54がMIDIの場合は、MIDIシーケンサー、MIDIシンセサイザーなどを使って波形情報に変換される。
音楽再生部33を説明する。音楽データ54はMIDIなどの記号データなので、スピーカーなどで音として鳴らすためには音の波形に変換する必要がある。音楽再生部33では、音楽データ54の中にある音源データアドレス情報を使って、音源データ記憶部にある音源データ52の音源波形データを読み込んで音楽データ54を波形に変換する。例えば、音楽データ54がMIDIの場合は、MIDIシーケンサー、MIDIシンセサイザーなどを使って波形情報に変換される。
(画像と音楽の再生)
上述のように生成された音楽波形は音声出力部5を通して音が流れる。勿論、CPU7によって、画像再生部31でデジタル画像51の表示と同期させることが可能である。
上述のように生成された音楽波形は音声出力部5を通して音が流れる。勿論、CPU7によって、画像再生部31でデジタル画像51の表示と同期させることが可能である。
(操作画面表示機能)
主として図5(a)〜(c)を参照しながら、説明を行う。ここに、図5(c)は、本発明における実施の形態の画像音楽変換調整設定操作画面の説明図である。
主として図5(a)〜(c)を参照しながら、説明を行う。ここに、図5(c)は、本発明における実施の形態の画像音楽変換調整設定操作画面の説明図である。
画像から音楽生成する際、ユーザーに設定させる操作項目を表示部4に表示させる機能を図5(a)〜(c)のユーザー設定画面の例に従って説明する。音源色名設定画面(図5(a)参照)では各色名の色相の扇形の角度数値、かつ彩度の割合を各調整窓の操作に従ってユーザーは設定すればよく、簡単な設定である。またその調整値に従って右図のカラー円グラフにある角度線と、内側の円の大きさが動くことにより、ユーザーは直感的に色範囲を知ることができる。音源設定画面(図5(b)参照)では、色名と楽器を並べて表示し、音源設定ではメニュー画面方式としたのでユーザーは容易に設定できる。画像音楽変換調整画面(図5(c)参照)では、上述の色属性と位置属性の除去パラメータ等によって、主要な調整機能をスライドバー操作により、ユーザーは容易に調整することができる。
これまでは、1枚の画像から楽譜を作成し、音楽が生成されることを説明したが、次に複数の画像を連続して表示するスライドショーのための、画像、楽譜及び音楽を生成・再生する場合を説明する。
(スライドショー作成機能)
まず、スライドショー生成部29において、操作入力部2からデータ記憶部9に記憶されたデジタル画像51の中からスライドショーの対象とする複数のデジタル画像51を選択する。そして次に、選択された各デジタル画像51に対して上記のような処理を行って対応する音楽データ54を生成する。音楽データ54はスライドショーの入力として音楽データ記憶部17に記憶される。その時に、それぞれのデジタル画像51とそこから生成された音楽データ54を関係付けた情報も主記憶部8に記憶される。
まず、スライドショー生成部29において、操作入力部2からデータ記憶部9に記憶されたデジタル画像51の中からスライドショーの対象とする複数のデジタル画像51を選択する。そして次に、選択された各デジタル画像51に対して上記のような処理を行って対応する音楽データ54を生成する。音楽データ54はスライドショーの入力として音楽データ記憶部17に記憶される。その時に、それぞれのデジタル画像51とそこから生成された音楽データ54を関係付けた情報も主記憶部8に記憶される。
(スライショー再生機能)
主として図10を参照しながら、説明を行う。ここに、図10は、本発明における実施の形態のスライドショー再生操作画面の説明図である。
主として図10を参照しながら、説明を行う。ここに、図10は、本発明における実施の形態のスライドショー再生操作画面の説明図である。
スライドショーの再生のためには、スライドショー再生部34によって、図10のスライドショー操作画面が表示部4に表示され、ユーザーは「プレイ/ストップ」のアイコン1001、「送り」のアイコン1002、「戻し」のアイコン1003などにタッチして、スライドショーの再生を制御する。例えば、最初に「プレイ」が指示されると、画像記憶部14に記憶していたデジタル画像51から最初のデジタル画像を取り出し、同時に音楽データ記憶部17からそれに関連付けられた音楽データ54を取り出して、両方を同期して画像を表示部4に、音楽を音声出力部5に出力する。デジタル画像51は静止画なので表示部4は表示された画像は変化しないが、対応した音楽データ54の演奏が終了すれば、次のデジタル画像51と音楽データ54を取り出して、それらのデータが無くなるまで次々と画像と音楽を順番に再生する。なお、ディソルブやパンなどの画面効果で画面を変化させてもよい。「送り」、「戻し」なども同じようにデジタル画像51と関連付けられた音楽データ54を取り出してスライドショーを行う。
また、複数の画像からそれぞれの画像の特徴を活かして、1つの曲を持ったスライドショー作品を作成したい場合がある。例えば、明るい音楽で曲を始めて、暗い音楽に移り、最後に明るい音楽で曲を終える、などの例である。また、ある条件を満たす画像だけを選んでスライドショーとして1つの曲を作曲したい場合もある。例えば、スライドショーの対象として一旦選ばれた画像の中から、明るい音楽を生成する画像だけが自動的に選ばれてスライドショーになる、などの例である。
そのために、スライドショーのデジタル画像51と音楽データ54を生成して記憶する際に、それぞれの画像の上述の総譜のパターンを測定しそれを数値化する。そしてその数値を利用して、デジタル画像51と音楽データ54の順番を入れ替えてスライドショーの順番とする。例えば、前述の明るい音楽、暗い音楽、明るい音楽の順に移り変わる曲を生成する場合、総譜の明度に着目して、測定したパターンから生成される数値の閾値を「高」、「中」、「低」の3つに分け、数値が「高」の画像は最後の明るい音楽のパートに、「中」の画像は最初の明るい音楽のパートに、「低」の画像は暗い音楽のパートに位置するように順番を並べ替える。こうすることで、明るい音楽で始まり、暗い音楽に移り、最後に非常に明るい音楽で終わるような曲の順番でスライドショーを再生できる。
また、明るい音楽だけを選ぶ場合、総譜のパターンから生成される数値が「高」または「中」だけを残し、「低」のものは一時記憶から削除するようにすれば、明るい曲だけのスライドショーが再生できる。
(動画データの作成と再生機能)
スライドショーを再生する時に、上記の方法ではデジタル画像と音楽データを順次解釈して再生したが、さらにデジタル画像51と音楽データ54から一旦MP4やMOVなどの業界標準として定まった動画ファイル形式の動画データを作成する方法がある。この方法では、上記の方法で順番が決定されたデジタル画像51と音楽データ54から、同期情報を含んだ動画データを動画ファイルとして作成する。動画ファイル形式の動画データ作成に関しては様々な方法が知られているのでここでは触れない。
スライドショーを再生する時に、上記の方法ではデジタル画像と音楽データを順次解釈して再生したが、さらにデジタル画像51と音楽データ54から一旦MP4やMOVなどの業界標準として定まった動画ファイル形式の動画データを作成する方法がある。この方法では、上記の方法で順番が決定されたデジタル画像51と音楽データ54から、同期情報を含んだ動画データを動画ファイルとして作成する。動画ファイル形式の動画データ作成に関しては様々な方法が知られているのでここでは触れない。
なお、ここでいう動画とは、1秒間に24枚、30枚、60枚など、異なる画像フレームを連続して表示することにより動きを表現するものではなく、同じ静止画像を任意の時間表示し、表示時間に同期して音楽が再生されるものをいう。
たとえば、1枚の静止画像を用いて7秒間の音楽が生成された場合には、同じ静止画像が7秒間にわたって表示され、生成された7秒間の音楽が画像表示に同期して再生される。このとき、動画ファイルとして作成された動画データが再生されるが、同じ画像フレームが所定のフレームレートで繰り返し表示されるにすぎないので、動きの表現はもちろんともなわない。
つまり、動画ファイル作成部30は多くの再生装置で再生可能な業界標準の動画ファイル形式で動画データを作成するので、前述された静止画像のスライショー再生機能と同様な機能が動画データ再生機能として実現される。
静止画像は1枚でも複数枚でもよい。また、静止画像には表示の切り替え時のタイミングや、音楽に合わせたエフェクトを加えてもかまわない。
動画ファイル形式の動画データは様々なメディア・プレーヤーやブラウザなどで、そのまま再生することが出来るので、この方法で作成されたスライドショーを多くの機器やソフトウェアで再生できるようになる。
(画像音楽の通信機能)
これまでは、1台の機器で画像から音楽を生成し、それを同じ機器で再生する状況を説明してきたが、次にある機器で画像から音楽を生成し、それを別の機器に送って画像とともに再生する方法を説明する。
これまでは、1台の機器で画像から音楽を生成し、それを同じ機器で再生する状況を説明してきたが、次にある機器で画像から音楽を生成し、それを別の機器に送って画像とともに再生する方法を説明する。
まず、送信側の機器で、上述の方法で1枚または複数枚の画像から音楽を生成する。そして、画像と音楽を、外部通信部6から相手の受信側の機器に送信する。ここで、送信の方法は、宅内でのローカルネットワーク、公衆回線経由のインターネットなどを用いた相手側のアドレスを指定したネットワーク通信や、USBメモリーなどの可搬型の一時蓄積装置を経由した方法など、様々な方法のどれでも構わないが、ここではインターネットを用いた通信で説明する。この時に送信される画像や音楽に関するデータは、動画データを利用する第一のタイプ、画像と音楽データを利用する第二のタイプ、画像と総譜又はパート譜を利用する第三のタイプに分類される。
第一のタイプでは、上述の方法で、送信側で画像と音楽を含んだスライドショーの動画データが生成され、その動画データが受信側に送信される。受信側では受信した動画データを再生することで、送信側の意図したスライドショーを見ることが出来る。この時、動画データはMP4やMOVなどの業界標準の動画ファイル形式で作成されるので、受信側では本実施の形態の装置やソフトウェアが無くても、メディア・プレーヤーやブラウザなどの標準的なソフトウェアを使ってスライドショーを見ることが出来る。しかしこの方法では、スライドショーの内容を変更したり、楽譜を評価したり、修正したり、編曲することなどは出来ない。
第二のタイプでは、上述の方法で、送信側でデジタル画像51からそれに対応した音楽データ54が生成され、そのデジタル画像51と音楽データ54を組にして受信側に送信する。受信側では受信した音楽データ54から、受信側の機器の音源記憶部15にある音源データ52を使って音楽を生成し、受信したデジタル画像51と組み合わせてスライドショーを再生する。この方法では、受信側で音源データ52を入れ替えて、同じ音源であっても送信側とは違う波形の音で音楽を再生することが出来る。また、受信側でスライドショーの順番を入れ替えたり、楽譜を評価したりすることはできるが、楽譜を修正したり、編曲することなどは出来ない。
第三のタイプでは、上述の方法で、送信側でデジタル画像51から音楽データ54を生成する過程で作成する総譜又はパート譜を、デジタル画像51と組にして受信側に送信する。受信側では受信した総譜(パート譜)から、受信側の機器の音源記憶部15にある音源データ52を使って音楽を生成し、受信したデジタル画像51と組み合わせてスライドショーを再生する。この方法では、受信側でスライドショーの順番や音源を入れ替えられるだけでなく、楽譜を修正したり、編曲または新たにバンドを編成したりすることなどが出来る。
上述のように、動画データを送受信する第一のタイプの場合は、送信側の意図する動画をそのまま再生することができ、画像と音楽データを送受信する第二のタイプの場合は、受信側で音源や画像の順番を入れ替えることができ、また画像と総譜またはパート譜を送受信する第三のタイプの場合には、楽譜の修正、編曲、新たなバンド編成まで受信側で行うことができる。
(各機能のフローチャートによる説明)
主として図11を参照しながら、説明を行う。ここに、図11は、本発明における実施の形態の制御部内機能順序を示すフローチャートである。
主として図11を参照しながら、説明を行う。ここに、図11は、本発明における実施の形態の制御部内機能順序を示すフローチャートである。
上述のデジタル画像51から音楽データ54を生成・再生する各プロセスを、CPU7とデータ処理プログラム11を使用して実現した各機能を、順序に従って示す図11の機能型フローチャートによって説明する。
まず、画像入力部3にあるデジタル画像51を、データ記憶部9に入力する(S1)。このデジタル画像51を縦が音高に対応し、横が拍に対応するユーザー希望の数の格子状ブロックに分割する(S2)。
各ブロック内の多数のRGB画素を計算して代表値を求めそれをRGB→HSV変換して色属性値の代表色モザイク画像を作成する(S3)。
各ブロックの代表色を音源色名の色値(音源色)に当てはめ、音源色モザイク画像を作成する(S4)。
音源色モザイク画像のブロックを、色属性とブロック位置のブロック除去パラメータにより評価関数により評価して、その関数値によりブロックを除去して音符候補ブロックを選別する(S5)。
この色名音符候補ブロックから、各種音楽要素値(音高、音価、拍、楽器、調性、和音など)が決められて、色分けされたブロック図形音符及び図形楽譜(総譜とパート譜)が生成される(S6)。
この図形楽譜から各種音楽要素値を持った音楽データを生成する(S7)。音楽データの再生と同期する画像及び/又は図形楽譜を表示しながら(S8)、ユーザーの希望する設定画面の操作に従い、スライドショーや動画などによる、画像及び/又は図形楽譜の表示に伴う音楽データを再生する(S9)。
ユーザーは、操作入力部2の操作により、この画像と音楽を再生して、音声出力部5のスピーカーを通じて聞くことができる。また、図1のような画像音楽の生成・再生装置の構成を内蔵するスマホなど携帯機器、パソコン、タブレットであれば、外部通信部6を通じて音楽データ送受信することができる。また、上記図11のフローチャート構成を持つソフトウェアを、記録媒体に記録したり、他の応用ソフトと結合したりすることが出来る。
(画像音楽生成・再生クラウドシステム100の構成および動作)
主として図12を参照しながら、説明を行う。ここに、図12は、本発明における実施の形態の画像音楽生成・再生クラウドシステム100の構成図である。
主として図12を参照しながら、説明を行う。ここに、図12は、本発明における実施の形態の画像音楽生成・再生クラウドシステム100の構成図である。
画像音楽生成・再生クラウドシステム100を図12に従って説明する。無線或は有線のインターネット網101に、画像音楽サーバー102、デジタルフォトフレーム103、インターネット対応テレビ104、スマートフォン105、デジタルカメラ106、パソコン107など各種の端末が接続されている。
これらの端末は図1の画像音楽生成装置の構成をしている。その中には、カメラ機能を内蔵して、それで撮影した画像を画像音楽サーバー102にアップロードすることが出来る種類のものがある。一方、カメラ機能を内蔵していない端末(すなわち画像入力部3を持たない端末)もある。また、画面やスピーカーを装備して、生成された音楽やスライドショーをサーバーからダウンロードして再生できる端末と、そうではない端末(すなわち、表示部4又は/及び音声出力部5を持たない端末)がある。ここでは、カメラ機能を持った端末を入力端末と呼び、画面やスピーカーで音楽やスライドショーを再生できる機能を持った端末を出力端末と呼ぶ。またその両方の機能を持った端末を入出力端末と呼ぶ。例えばデジタルフォトフレーム103、インターネット対応テレビ104は出力端末であり、デジタルカメラ106は入力端末、スマートフォン105、パソコン107は入出力端末である。
入力端末または入出力端末で撮影・記録されたデジタル画像は、インターネット網101を経由して、画像音楽サーバー102に送られる。画像音楽サーバー102は、図1の画像音楽生成装置の構成を内蔵しており、端末側から送られてきたデジタル画像51から上記図形楽譜データ53及び/又は音楽データ54を生成する。
生成された図形楽譜データ53及び/又は音楽データ54は端末側から送られてきたデジタル画像51と共に、画像音楽サーバー102のデータベースに格納される。データベースには、デジタル画像を送ってきたユーザーのユーザー名、端末IDなどの識別情報も共に記録される。勿論、1枚のデジタル画像と図形楽譜データや音楽データだけではなく、前述のように複数のデジタル画像と図形楽譜データ/音楽データから構成されるスライドショーもデータベースに記録することが出来る。
一方、出力端末あるいは入出力端末を使って、ユーザーはデータベース上の、デジタル画像と図形楽譜データ/音楽データ、またはスライドショーを検索することができる。デジタル画像をアップロードしたユーザーと、検索したユーザーが異なっている場合は、通常アクセス制限が掛かり、アクセスが許可されたユーザーだけがこれらのデータにアクセスできる。
アクセスが許可されたリクエストの場合は、画像音楽サーバー102は、リクエストを発生した端末(通常は出力端末または入出力端末)にデジタル画像と図形楽譜データ/音楽データ、またはスライドショーを送信する。端末側は、図1の画像音楽生成装置の全体あるいは一部を装備し、画像音楽サーバー102から受信したデータをデータ記憶部9に記憶する。具体的には、デジタル画像を画像記憶部14にデジタル画像51として記憶し、図形楽譜データを図形楽譜記憶部16に図形楽譜データ53として記憶し、音楽データを音楽データ記憶部17に音楽データ54として記憶する。
受信した端末のデータ処理プログラム11は、これらのデータを用いて前述の処理を行うが、画像音楽サーバー102で処理したデータを利用することにより端末側での処理を省ける。例えば、図形楽譜データを受信した場合は、図2のブロック分割部18から図形楽譜生成部27までの処理を省ける。また、音楽データを受信した場合は、図2のブロック分割部18から音楽データ生成部28までの処理を省ける。また、スライドショーのデータを受信した場合は、スライドショー生成部29の処理を省くことができる。
なお、ここでは音楽データ54の生成に用いたデジタル画像51を画像音楽サーバー102から端末に送るようにしたが、必ずしもそうする必要はない。例えば、端末に記憶されているデジタル画像を使ったり、別の画像サーバーのデジタル画像を用いたりしても構わない。また、画像音楽サーバー102が音楽データ54の生成に用いたデジタル画像51とは異なるデジタル画像を送っても構わない。そうすることによって、サービスのレベルに応じてデジタル画像の画質を変えるような画像音楽変換サービスができる。
また、ここでは画像音楽サーバー102は生成したデータを端末に送るようにしたが、別のサーバーに送っても構わない。そうすることによって、別のサーバーが提供するサービスと画像音楽変換サービスを組合せたインターネットサービスができるようになる。
また、ここでは画像音楽サーバー102は、リクエストを発行したユーザーの端末にデジタル画像と図形楽譜データ/音楽データ、またはスライドショーを送信するとしたが、動画データであっても構わない。
以上で説明されたように、画像の画素ブロックの持つ色属性値から、音楽を構成する多様な音楽要素、即ち音の高さ(音高)、音の長さ(音価)、音の拍、調(長調短調)、和音、使用する楽器の種類、などが記述された演奏のための図形楽譜を自動的に作成することにより、この図形楽譜に基づいて音楽を演奏する画像音楽の生成・再生装置とその画像音楽の生成・再生方法を提供する。
そして、画像から音楽を生成又は/及び再生する画像音楽の生成・再生装置において、画像入力部と、前記画像入力部から入力された複数の画像を格納した画像記憶部と、文字又は図形又は画像を表示する表示部と、複数の音源を格納した音源記憶部と、色属性値の範囲が設定された色名ごとに、音源を設定する音源設定部と、
前記画像を、縦軸を音高、横軸を拍として任意に分割した格子状のブロックごとに、代表色を決定し、その代表色でブロックを塗り潰してモザイク画像にするモザイク画像生成部と、各ブロックの代表色がいずれの色名の範囲に属しているか識別するブロック色名識別部と、上記モザイク画像の中のブロックを選別するブロック選別部、上記選別されたブロックを音符とし、各ブロックを音源に対応した色名に色分けされた図形楽譜を生成する図形楽譜生成部と、上記図形楽譜から音楽データを生成する音楽生成部と、を備え音楽の再生に同期して、前記画像を表示させて上記音楽を生成・再生させる。
前記画像を、縦軸を音高、横軸を拍として任意に分割した格子状のブロックごとに、代表色を決定し、その代表色でブロックを塗り潰してモザイク画像にするモザイク画像生成部と、各ブロックの代表色がいずれの色名の範囲に属しているか識別するブロック色名識別部と、上記モザイク画像の中のブロックを選別するブロック選別部、上記選別されたブロックを音符とし、各ブロックを音源に対応した色名に色分けされた図形楽譜を生成する図形楽譜生成部と、上記図形楽譜から音楽データを生成する音楽生成部と、を備え音楽の再生に同期して、前記画像を表示させて上記音楽を生成・再生させる。
モザイク画像のブロックの代表色から、色属性値の範囲を決められた色名を自動的に識別することにより、それに相応しい楽器などの音源が選ばれ、多様な音楽的要素を含んだ色分けされた図形楽譜が作成される。この図形楽譜に従って画像に対応した音楽を演奏させることができる。
また、色属性値及び位置属性値のパラメータにより該ブロックを選別させる。
画像全体の視覚情報を聴覚情報に反映させて、画像ブロックを選別することができるため、画像に相応しい音楽が生成される。
また、前記音楽の再生に同期させて、前記画像と前記図形楽譜を前記表示部に表示させる。
楽譜と画像を見ながら同時に音楽を再生することができる。また音楽を聴きながら、画像と演奏楽譜を同時に表示させ、画像とそれに相応しい音楽かどうか評価し、かつ楽譜を修正または編曲することができる。
また、スライドショー生成部を備え、複数枚の画像を順番に切り替え、前記音楽の再生に同期させて、スライドショーを再生させる。
連続した画像からバックグラウンド・ミュージック(BGM)付きのスライドショーを生成できる。しかもそのBGMは音楽の選定に煩わされること無く、また、音楽の自動生成に発生する権利を除けば、第三者の音楽を利用することに伴う著作権の利用許諾や侵害の問題が発生しないものである。
また、動画ファイル作成部を備え、スライドショーの画像、音楽を統合して、動画ファイル形式の動画データを作成させる。
作成された動画ファイルは業界標準の動画ファイル形式に則っているので、特別なプレーヤーソフトを必要とせず、ブラウザやマルチメディアプレーヤーなどの一般的なソフトウェアを使って画像と生成された音楽が同期した動画を見ることができる。
また、横軸に連続した複数の上記ブロックを一つの音符として音楽を再生させる。
上記選別されたブロックが横方向に繋がった場合、その繋がりの長さを音符の長さ(音価)に反映した図形楽譜を生成することができるので、特に弦楽器などで滑らかな音楽を作成することができる。
また、ブロックに対応した音符から和音を発生させる。
美しい和音を演奏できる図形楽譜を作成して、複数楽器による調和性と表現力を兼ねた、オーケストラの楽器編成のような音楽を演奏させることができる。
また、表示部に色属性値の範囲、又は/及びブロック選別のパラメータ、又は/及び音源の設定を行うための図を表示させる。
本発明によれば、ユーザーが表示された色属性値の範囲やブロック選別のパラメータや音源の設定を操作することにより、容易に生成される音楽を修正、変更することができる。
また、送信側で音楽データ付き画像、又は図形楽譜付き画像を送信し、受信側で画像に同期した音楽を再生させる。
離れた位置にある端末において、音楽データ付き画像や図形楽譜付き画像を送受信して、他方が作成した画像と音楽を再生することができる。また、受信側で容易に生成された音楽を修正、変更することができる。
また、端末側から送信されてきた前記画像を受信し、それに対応した音楽データ又は上記音楽データ付き上記画像、又は図形楽譜付き上記画像、又は動画データを生成し、送信した端末または別途指定された端末またはサーバーに送信する、画像音楽の生成サーバー機能を持つ。
インターネットなどで接続された端末から画像をサーバーに送り、サーバー側で画像から音楽、または画像付き音楽、または動画を作成して、それらを蓄積、配信して多数の人が楽しめるようにすることができる。
また、画像入力部と、前記画像入力部から入力された複数の画像を格納した画像記憶部と、文字又は図形又は画像を表示する表示部と、複数の音源を格納した音源記憶部と、を用いて画像音楽を再生する画像音楽再生方法又はプログラムであって、色属性値の範囲が設定された複数の色名ごとに、音源を設定し前記画像を、縦軸を音高、横軸を拍として任意に分割された格子状のブロックごとに、代表色を抽出してモザイク画像を生成し、各ブロックの代表色がいずれの色名の範囲に属しているかを識別し、上記モザイク画像の中のブロックを選別し、上記選別されたブロックを音符とし、各ブロックを夫々音源に対応した色名の代表色に色分けされた図形楽譜を生成し、上記図形楽譜から音楽データと音楽を生成させ、音楽の再生及び再生時間に同期させて、前記画像と音楽を再生させる。
モザイク画像のブロックの代表色が、色属性値の範囲を決められた色名を自動的に識別することにより、それに相応しい楽器音源が選ばれ、多様な音楽要素を含んだ色分けされた図形楽譜が作成される。この図形楽譜に従って画像に対応した音楽を演奏させることができる。
上述のような画像音楽生成装置又は方法又はプログラムによれば、1枚の画像又は複数画像の分割されたブロックの色属性値や画像位置属性値から、多種類の音楽要素が記載された図形楽譜を自動的に生成することによって、複数の楽器をもつ音楽を演奏させることができる。また、画像、図形楽譜、音楽データを送受信して、スライドショーや動画を遠隔地でも再生することができる。またユーザーは、画面から簡単な操作で音楽データを修正することができ、スライドショー、動画の創作、修正などを容易にすることができる。
なお、本発明のプログラムは、上述した本発明の音楽情報生成方法の全部または一部のステップ(または、工程、動作、作用等)の動作をコンピュータにより実行させるためのプログラムであって、コンピュータと協働して動作するプログラムである。
また、本発明の記録媒体は、上述した本発明の音楽情報生成方法の全部または一部のステップ(または、工程、動作、作用等)の全部または一部の動作をコンピュータにより実行させるためのプログラムを記録した記録媒体であり、コンピュータにより読み取り可能かつ、読み取られた前記プログラムが前記コンピュータと協働して利用される記録媒体である。
なお、上記「一部のステップ(または、工程、動作、作用等)」とは、それらの複数のステップの内の、一つまたは幾つかのステップを意味する。
また、上記「ステップ(または、工程、動作、作用等)の動作」とは、前記ステップの全部または一部の動作を意味する。
また、本発明のプログラムの一利用形態は、インターネット等の伝送媒体、光・電波・音波等の伝送媒体中を伝送し、コンピュータにより読みとられ、コンピュータと協働して動作する態様であっても良い。
また、記録媒体としては、ROM等が含まれる。
また、上述した本発明のコンピュータは、CPU等の純然たるハードウェアに限らず、ファームウェアや、OS、更に周辺機器を含むものであっても良い。
なお、以上説明した様に、本発明の構成は、ソフトウェア的に実現しても良いし、ハードウェア的に実現しても良い。
本発明における音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体は、画像によりふさわしい音楽を自動的に生成することができ、画像から音楽を生成・再生する画像音楽の生成・再生装置とその画像音楽の生成・再生方法などの、音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体に利用する目的に有用である。
1 画像音楽生成装置
3 画像入力部
15 音源記憶部
19 ブロック代表色決定部
21 ブロック色名識別部
25 ブロック選別部
27 図形楽譜生成部
3 画像入力部
15 音源記憶部
19 ブロック代表色決定部
21 ブロック色名識別部
25 ブロック選別部
27 図形楽譜生成部
Claims (16)
- 画像を入力する画像入力部と、
複数の音源名称を格納する音源名称記憶部と、
音の高さに対応する縦軸、および音の進行時間に対応する横軸で前記画像を格子状に配列されたブロックに分割し、各々の前記ブロックの代表色を決定するブロック代表色決定部と、
あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、前記格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、前記ブロックの前記代表色が対応する色名を前記ブロックのブロック色名として決定するブロック色名識別部と、
前記格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成する図形楽譜生成ユニットと、
を備えることを特徴とする音楽情報生成装置。 - 前記画像入力部から前記入力された画像を格納する画像記憶部と、
少なくとも前記画像を表示する表示部と、
前記複数の色名と、前記複数の音源名称と、を対応付ける音源名称設定部と、
前記生成された図形楽譜から音楽データを生成する音楽データ生成部と、
を備え、
前記表示部は、前記格子状に配列されたブロックが前記代表色で塗り潰されたモザイク画像、および前記選別された所定のブロックが前記ブロック色名の色で塗り潰されたモザイク画像の内の少なくとも一つを表示することを特徴とする、請求項1記載の音楽情報生成装置。 - 前記図形楽譜生成ユニットは、前記ブロックの色属性、および前記画像における前記ブロックの位置属性の内の少なくとも一つに関する除去パラメータを利用して、前記所定のブロックを選別する請求項1記載の音楽情報生成装置。
- 前記生成された音楽データを再生する音声出力部を備え、
前記表示部は、前記生成された音楽データの再生が同期するように、前記格納された画像および前記生成された図形楽譜の内の少なくとも一つを表示することを特徴とする、請求項2記載の音楽情報生成装置。 - 前記生成された音楽データを再生する音声出力部と、
前記画像入力部に入力された複数の画像からそれぞれ前記生成された音楽データの再生が同期するように、前記複数の画像のスライドショーを行うスライドショー生成部と、
を備えることを特徴とする、請求項2記載の音楽情報生成装置。 - 前記画像入力部に入力された複数の画像からそれぞれ前記生成された音楽データと、前記複数の画像のデータと、を統合して、動画ファイルを作成する動画ファイル作成部を備えることを特徴とする、請求項2記載の音楽情報生成装置。
- 前記音楽データ生成部は、前記横軸の方向に連続した、複数の同じ前記ブロック色名のブロックを一つの音符に対応させて、前記音楽データを生成することを特徴とする、請求項2記載の音楽情報生成装置。
- 前記表示部は、前記色属性値の前記範囲の設定、前記所定のブロックの選別のためのパラメータの設定、および前記音源名称の設定を行うための図を表示することを特徴とする、請求項2記載の音楽情報生成装置。
- 前記図形楽譜生成ユニットは、和音を発生するための和音補正を利用して、前記図形楽譜を生成することを特徴とする、請求項1記載の音楽情報生成装置。
- 前記生成された音楽データ、又は前記生成された図形楽譜は、所定の端末、および所定のサーバーの内の少なくとも一つに対して、送信されることを特徴とする、請求項2記載の音楽情報生成装置。
- 前記画像入力部に前記入力された画像は、前記所定の端末から送信され受信された画像であることを特徴とする、請求項10記載の音楽情報生成装置。
- 前記所定の端末は、前記画像入力部に前記入力された画像を送信した端末ではない別の端末であり、
前記生成された音楽データ、又は前記生成された図形楽譜は、前記別の端末、および前記所定のサーバーの内の少なくとも一つに対して、前記画像入力部に前記入力された画像とともに送信されることを特徴とする、請求項10記載の音楽情報生成装置。 - 前記画像入力部に前記入力された複数の画像は、所定の端末から送信され受信された複数の画像であり、
前記作成された動画ファイルは、前記所定の端末、前記所定の端末とは異なる端末、および所定のサーバーの内の少なくとも一つに対して、送信されることを特徴とする、請求項6記載の音楽情報生成装置。 - 音楽情報生成装置にて実行される音楽情報生成方法であって、
画像を入力する画像入力ステップと、
複数の音源名称を格納する音源名称記憶ステップと、
音の高さに対応する縦軸、および音の進行時間に対応する横軸で前記画像を格子状に配列されたブロックに分割し、各々の前記ブロックの代表色を決定するブロック代表色決定ステップと、
あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、前記格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、前記ブロックの前記代表色が対応する色名を前記ブロックのブロック色名として決定するブロック色名識別ステップと、
前記格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成する図形楽譜生成ステップと、
を備えることを特徴とする音楽情報生成方法。 - 請求項14記載の音楽情報生成方法の、音の高さに対応する縦軸、および音の進行時間に対応する横軸で前記画像を格子状に配列されたブロックに分割し、各々の前記ブロックの代表色を決定するブロック代表色決定ステップ、あらかじめ設定された複数の色属性値の範囲にそれぞれ対応付けられるとともに、前記格納された複数の音源名称にそれぞれ対応付けられた、または対応付けられる予定の複数の色名の内から、前記ブロックの前記代表色が対応する色名を前記ブロックのブロック色名として決定するブロック色名識別ステップ、および前記格子状に配列されたブロックの内からあらかじめ設定された基準に基づいて所定のブロックを選別することによって、図形楽譜を生成する図形楽譜生成ステップとしてコンピュータを機能させるための、コンピュータ読み取り可能な媒体に記録されたプログラム。
- 請求項15記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016114123A JP6058192B1 (ja) | 2016-06-08 | 2016-06-08 | 音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体 |
US15/612,417 US10170090B2 (en) | 2016-06-08 | 2017-06-02 | Music information generating device, music information generating method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016114123A JP6058192B1 (ja) | 2016-06-08 | 2016-06-08 | 音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6058192B1 true JP6058192B1 (ja) | 2017-01-11 |
JP2017219699A JP2017219699A (ja) | 2017-12-14 |
Family
ID=57756227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016114123A Expired - Fee Related JP6058192B1 (ja) | 2016-06-08 | 2016-06-08 | 音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10170090B2 (ja) |
JP (1) | JP6058192B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101896193B1 (ko) * | 2017-08-28 | 2018-09-07 | 한양대학교 산학협력단 | 이미지를 음악으로 변환하는 방법 |
CN112218167A (zh) * | 2019-07-10 | 2021-01-12 | 腾讯科技(深圳)有限公司 | 多媒体信息播放方法、服务器、终端及存储介质 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190088237A1 (en) * | 2017-09-10 | 2019-03-21 | Rocco Anthony DePietro, III | System and Method of Generating Signals from Images |
CN108805171B (zh) * | 2018-05-07 | 2020-11-06 | 广东数相智能科技有限公司 | 图像至音乐旋律的转换方法、装置与计算机可读存储介质 |
US11087728B1 (en) * | 2019-12-21 | 2021-08-10 | Snap Inc. | Computer vision and mapping for audio applications |
US11798523B2 (en) * | 2020-01-31 | 2023-10-24 | Soundtrap Ab | Systems and methods for generating audio content in a digital audio workstation |
US11532293B2 (en) * | 2020-02-06 | 2022-12-20 | James K. Beasley | System and method for generating harmonious color sets from musical interval data |
IT202000022453A1 (it) * | 2020-09-23 | 2022-03-23 | Andrea Vitaletti | Sistema di conversione di immagini in spettro sonoro; |
CN115687668A (zh) * | 2021-07-23 | 2023-02-03 | 北京字跳网络技术有限公司 | 音乐文件的生成方法、生成装置、电子设备和存储介质 |
JP7166481B1 (ja) * | 2022-07-20 | 2022-11-07 | 株式会社ディンプス | 音データ生成プログラム、音データ生成装置およびその方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0773320A (ja) * | 1993-06-30 | 1995-03-17 | Matsushita Electric Ind Co Ltd | イメージ音楽生成装置 |
JP2007219393A (ja) * | 2006-02-20 | 2007-08-30 | Doshisha | 画像から音楽を生成する音楽生成装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6542869B1 (en) * | 2000-05-11 | 2003-04-01 | Fuji Xerox Co., Ltd. | Method for automatic analysis of audio including music and speech |
-
2016
- 2016-06-08 JP JP2016114123A patent/JP6058192B1/ja not_active Expired - Fee Related
-
2017
- 2017-06-02 US US15/612,417 patent/US10170090B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0773320A (ja) * | 1993-06-30 | 1995-03-17 | Matsushita Electric Ind Co Ltd | イメージ音楽生成装置 |
JP2007219393A (ja) * | 2006-02-20 | 2007-08-30 | Doshisha | 画像から音楽を生成する音楽生成装置 |
Non-Patent Citations (1)
Title |
---|
JPN6016034541; 若林 努: '画像の特徴を用いたメロディ自動生成システムの提案' 情報処理学会 インタラクション2011予稿集 , 2011 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101896193B1 (ko) * | 2017-08-28 | 2018-09-07 | 한양대학교 산학협력단 | 이미지를 음악으로 변환하는 방법 |
CN112218167A (zh) * | 2019-07-10 | 2021-01-12 | 腾讯科技(深圳)有限公司 | 多媒体信息播放方法、服务器、终端及存储介质 |
CN112218167B (zh) * | 2019-07-10 | 2022-04-15 | 腾讯科技(深圳)有限公司 | 多媒体信息播放方法、服务器、终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2017219699A (ja) | 2017-12-14 |
US20170358284A1 (en) | 2017-12-14 |
US10170090B2 (en) | 2019-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6058192B1 (ja) | 音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体 | |
EP1020843B1 (en) | Automatic musical composition method | |
CN101103386A (zh) | 用于乐谱捕捉和带同步呈现的合成音频演奏的系统与方法 | |
JP4755672B2 (ja) | コンテンツ編集装置、方法及びプログラム | |
CN103198442B (zh) | 图像生成方法、图像生成装置 | |
JP2013197981A (ja) | 動画再生方法、動画再生装置及びプログラム | |
JP5498341B2 (ja) | カラオケシステム | |
JP2020021098A (ja) | 情報処理装置、電子機器及びプログラム | |
JP5803956B2 (ja) | カラオケシステム及びカラオケ装置 | |
JP2011053276A (ja) | 背景映像可変表示機能を備えるカラオケシステム | |
JP2014123085A (ja) | カラオケにおいて歌唱に合わせて視聴者が行う身体動作等をより有効に演出し提供する装置、方法、およびプログラム | |
JP5800247B2 (ja) | カラオケシステム及びカラオケ装置 | |
JP7254290B2 (ja) | 演奏支援装置、演奏支援方法、コンピュータプログラム | |
JP2011053345A (ja) | 歌詞文字の立体表示機能を有するカラオケシステム | |
JP2005321460A (ja) | 映像データへの楽曲データ付加装置 | |
KR102089207B1 (ko) | 이미지에 기초한 음악 재생 방법 및 이를 수행하기 위한 프로그램을 제공하는 서버 | |
JP5789477B2 (ja) | 画像再生装置及び画像再生システム | |
KR102524870B1 (ko) | 미디 음악 기반의 안무 영상 콘텐츠 서비스 장치 및 방법과, 이를 기록한 컴퓨팅 장치에 의해 판독 가능한 기록매체 | |
JP5566512B2 (ja) | カラオケシステム、中央装置及びコンテンツデータ生成方法 | |
JP5803955B2 (ja) | カラオケシステム及びカラオケ装置 | |
JP6502728B2 (ja) | カラオケシステム及びプログラム | |
CN108847207B (zh) | 交互智能设备及其编曲方法和装置 | |
JP5754449B2 (ja) | 楽曲コード譜生成装置 | |
JP2021015220A (ja) | 演奏支援装置、演奏支援方法、コンピュータプログラム | |
JPH0773320A (ja) | イメージ音楽生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6058192 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |