JP4738203B2 - 画像から音楽を生成する音楽生成装置 - Google Patents

画像から音楽を生成する音楽生成装置 Download PDF

Info

Publication number
JP4738203B2
JP4738203B2 JP2006042494A JP2006042494A JP4738203B2 JP 4738203 B2 JP4738203 B2 JP 4738203B2 JP 2006042494 A JP2006042494 A JP 2006042494A JP 2006042494 A JP2006042494 A JP 2006042494A JP 4738203 B2 JP4738203 B2 JP 4738203B2
Authority
JP
Japan
Prior art keywords
image
music
music data
face
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006042494A
Other languages
English (en)
Other versions
JP2007219393A (ja
Inventor
光範 三木
益造 柳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Doshisha
Original Assignee
Doshisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Doshisha filed Critical Doshisha
Priority to JP2006042494A priority Critical patent/JP4738203B2/ja
Publication of JP2007219393A publication Critical patent/JP2007219393A/ja
Application granted granted Critical
Publication of JP4738203B2 publication Critical patent/JP4738203B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、カメラなどによって撮影された画像に含まれる顔や景色などに基づいて、自動的にその画像のイメージに適合した音楽を生成することのできる装置に関するものである。
近年、携帯電話を用いたメールサービスなどとして、メール本文の内容に基づいた音楽を生成し、これを第三者に送信できるようにしたサービスなどが存在している。また、これ以外にも、画像を相手に送信する際、その画像に基づいて独自の音楽を生成して、メール本文とともに送信できるようにしたシステムも提案されている。
例えば、下記の特許文献1には、カメラで撮影された画像から独自の音楽データを生成するようにしたシステムが提案されている。このシステムの詳細について説明すると、カメラによって取得された画像を256階調に量子化する手段と、その解析された結果に基づいて音楽データを生成する手段とを備えている。この量子化された情報から音楽データを生成する場合は、あらかじめ各画素の輝度に対応した音声情報をテンプレートとして保持しておき、このテンプレートを参照して各画素の輝度に対応する音高を当てはめていく。具体的には、解析された画素の輝度が「0〜10」であった場合は、基準となるオクターブから1オクターブ上の「A」の音高を当てはめ、また、ある画素の輝度が「247〜255」であった場合には、基準となるオクターブから1オクターブ下の「H」の音を当てはめる。そして、これらの音高を画像の縦軸方向、あるいは、横軸方向に並べていき音楽データを生成するようにしたものである。
特開2001−350473号公報
しかしながら、このような方法で音楽データを生成する場合においては、次のような問題を生ずる。すなわち、上記特許文献1のように、単に256階調に量子化された情報から音楽データを生成する方法では、画像から受けるイメージと実際に出力される音楽のイメージが異なる場合がある。例えば、被写体として笑顔を有する人間が写っていたとしても、景色や照明などが暗かったために基準オクターブから下の低い音高が当てはめられたり、暗いイメージを有する音楽が生成されたりすることがある。また、一般に、携帯電話を用いて被写体を撮影する際、人間を被写体とすることが多いが、上記特許文献1では、人間の顔の表情などに特化して音楽を生成するものではないため、顔の表情や性別、年齢層などの属性に応じた音楽を生成することができない。
さらには、撮影された画像が都会などの人工的な景色や、山や海などの自然の景色であった場合、それぞれの画像から受けるイメージが異なり、例えば、オフィスビルの建ち並んだ人工的な景色からは比較的緊張感のある堅いイメージを受け、また、森や林などの山の画像からは、癒しの雰囲気を有する柔らかなイメージを受けることが多い。また、海の画像からは、爽やかなイメージを受けることが多い。従って、これらの景色から音楽を生成する場合においても、同様に、その景色のイメージに適合した音楽を生成できるようにすることが好ましい。
そこで、本発明は、上記課題を解決するために、顔の表情や景色などのイメージに適合した音楽を生成することのできる音楽データ生成装置を提供することを目的とするものである。
すなわち、本発明は上記課題を解決するために、画像から音楽データを生成する音楽データ生成装置において、画像中に顔が含まれているか否かを検出する顔検出手段と、当該顔検出手段によって画像中に顔が含まれていることが検出された場合、当該顔の表情を解析する顔属性解析手段と、当該顔属性解析手段によって解析された顔の表情に基づいて音楽データを生成する音楽データ生成手段とを備えるようにしたものである。
そして、このような発明において、顔領域内における唇の領域を抽出し、当該唇領域の大きさ、もしくは、唇領域の中央部分における白い色相の有無によって、顔が明るい表情であるか否かを解析する。
また、明るい表情であると解析された場合、長調の音楽を生成するようにする。
このようにすれば、顔の表情に応じて音楽を生成することができるため、その画像のイメージに適合した音楽を生成することができる。すなわち、笑顔を有する被写体の画像からは明るいイメージを有する音楽を生成することができ、また、男性の画像からは男性的なイメージ、女性の画像からは女性的なイメージを有する音楽を生成することができるようになる。
本発明は、画像から音楽データを生成する音楽データ生成装置において、画像中に顔が含まれているか否かを検出する顔検出手段と、当該顔検出手段によって画像中に顔が含まれていることが検出された場合、当該顔の表情を解析する顔属性解析手段と、当該顔属性解析手段によって解析された顔の表情に基づいて音楽データを生成する音楽データ生成手段とを備えるようにしたので、例えば、笑顔を有する被写体の画像からは明るいイメージを有する音楽を生成することができ、また、男性の画像からは男性的なイメージを、女性の画像からは女性的なイメージを有する音楽を生成することができるようになる。
以下、本発明の一実施の形態について図面を参照して説明する。
本実施の形態における音楽データ生成システム100は、図1に示すように、画像付きのメールを第三者に送信する第一の端末装置1と、この第一の端末装置1にネットワーク4を介して接続される音楽データ生成装置2と、この音楽データ生成装置2によって生成された音楽をメール本文や画像とともに受信する第二の端末装置3とを少なくとも備えて構成される。
まず、第一の端末装置1の構成について説明すると、第一の端末装置1は、カメラ付き携帯電話などで構成され、図2に示すように、データを送受信する送受信手段11と、カメラなどの画像取得手段12と、テンキーなどの入力手段13と、文字や画像などを表示する表示手段14と、音楽データなどを出力するための音声出力手段15とを備えている。この第一の端末装置1の作用について説明すると、第一の端末装置1は、画像取得手段12によって取得した画像を送受信手段11を介して音楽データ生成装置2に送信し、そこで生成された音楽データを受信するとともに、その受信した音楽データを画像とともに第二の端末装置3に送信する。
一方、第二の端末装置3は、同様に携帯電話などによって構成されるもので、少なくとも、第一の端末装置1から送信されてきたメール本文・画像・音楽データを受信するための送受信手段31と、これら送信されてきたメール本文や画像を表示出力する表示手段32と、音楽データを音声出力するための音声出力手段33とを備えている。この第二の端末装置3は、第一の端末装置1からメールを受信すると、ディスプレイなどの表示手段32にメール本文や画像などを表示するとともに、その画像の表示に同期して音楽を出力する。
なお、この実施の形態では、第一の端末装置1や第二の端末装置3として、携帯電話を例に挙げて説明するが、必ずしも携帯電話である必要はなく、パーソナルコンピュータやPDAなどのようにメールの送受信機能や音声出力機能を有する端末装置であればよい。また、画像取得手段についても、端末装置に付属するカメラによって画像を取得するようにしてもよく、もしくは、LANやUSBケーブル、もしくは、カードリーダーやスキャナなどよって外部の端末装置に格納されている画像を用いるようにしてもよい。
一方、音楽データ生成装置2は、これらの第一の端末装置1や第二の端末装置3にインターネットなどのネットワーク4を介して接続されるもので、第一の端末装置1から送信されてきた画像に基づいて、その画像のイメージに適合した音楽を生成する。この音楽データ生成装置2の機能ブロックについて説明すると、音楽データ生成装置2は、まず、第一の端末装置1や第二の端末装置3とデータを送受信するための送受信手段21を備えている。この送受信手段21は第一の端末装置1から画像のデータを受信し、また、その受信した画像から生成した音楽を第一の端末装置1に送信する。ここで生成された音楽については、この実施の形態では第一の端末装置1に返信されるが、音楽データ生成装置2から直接第二の端末装置3に送信するようにしてもよい。
また、この音楽データ生成装置2は、第一の端末装置1から送信されてきた画像のイメージに適合した音楽を生成する画像解析手段22や音楽データ生成手段23を備えている。この画像解析手段22や音楽データ生成手段23について詳細に説明する。
まず、画像解析手段22は、顔検出手段221と景色解析手段223を備えており、顔検出手段221によって、画像中に人物の顔が含まれているか否かを検出し、画像中に顔が含まれていると判定された場合は、その人間の数を把握する。そして、顔属性解析手段222によってその顔の表情や性別、年齢層などを解析する。
まず、この顔検出手段221について説明すると、顔検出手段221は、送信されてきた画像を量子化し、図3(a)に示すような画像について5ピクセル×5ピクセル程度の領域ごとのRGB値を見ていき、肌色の領域を検出する。連結した肌色領域の周囲形状の複雑さを領域重心から周囲までの距離のばらつき(標準偏差)などで表し、閾値以内ならその周囲にそれと見合う程度の広さの黒領域があれば顔と判定する。ただし、見落としを救済するために、逆に黒領域の下に肌色領域が少しでもあれば、それも顔と判定する。そして、この顔の検出を、画像中のすべての領域について行い、これによって画像中に含まれる人間の数を推定する。なお、顔の検出方法に関しては、上記方法以外にも種々の方法を採用することができる。例えば、種々の顔の標準パターン(正面、斜め横、横)を持っておき、その拡大・縮小と微少回転によって整合のとれる部分の画像があるかどうかを判定することによって顔を検出するようにしてもよい。
また、顔属性解析手段222は、このように検出された顔の領域の画像に基づいて、次のようにして顔の表情や性別、年齢層などを解析する。
まず、顔の表情を解析する場合は、可能であれば(ほぼ正面を向いて、顔がある程度の大きさに写っている場合)顔領域内における色相などから唇の領域を抽出し、その唇領域の外径、内径、口領域の面積、歯領域の面積などを求める。そして、その唇の領域が大きい場合や、もしくは、その領域の中央部分に歯の白い色相が存在している場合は、笑顔を持った明るい表情の画像であると判定する。一方、唇の面積が小さく、しかも、中央部分に歯の白い色相が存在しない場合や、唇の形状が「への字形状」をしている場合は、暗い表情の画像であると判定する。
また、性別は、髪の毛の長さ、髭部分の濃さ、唇の色などに基づいて判定する。例えば、輝度の低い画素数が少ない場合(すなわち、髪の毛が少ない場合)や髭の存在位置に輝度の低い画素が存在している場合(すなわち、髭が存在する場合)は男性的な顔であると判定する。一方、唇周辺に赤に近い画素が集中している場合(すなわち、口紅を塗っている場合)は女性的な顔であると判定する。これらの髪の毛の長さや、髭の有無、唇の色などを総合的に勘案して男性的であるか女性的であるかを判定する。
一方、年齢層(幼児/成人/老人)については、目が検出できれば、目の位置(上・下の肌色境界までの距離比)で判定し、額のしわ(検出できれば40歳以上)、髪の毛の量(極端に少なければ老人男性)などを用いて判定する。この年齢の判定方法に関しては、種々の方法を用いることができ、例えば、特許出願2003−381989号公報に記載される方法や、特許公開2002−330943号公報に記載される方法などを用いることができる。
景色解析手段223は、画像中に含まれる景色の種別を判定する。景色の種別としては、例えば、オフィスビルなどの建ち並んだ人工的な景色や、木々の生い茂った森や林などの山の景色、大きな湖や海などの景色などがある。これらの景色の種別は次のようにして判定する。例えば、オフィスビルや道路、自動車などを有する人工的な景色であれば比較的直線的な要素を多く含むため、情報量を落とすために、まず画像を2値化し、Hough変換を用いて画像中に明瞭な直線が1本でも検出できる場合は人工的な景色であると判定する。直線の判定にはHough変換を用いる。これによっていかなる方向の線があっても、また、途中で直線が途切れていても検出することができる。また、直線がなく、輪郭が不規則な緑の領域がある場合には、木々の生い茂った森や林など、背景に木があると判定する。一方、図3(b)に示すように、ほぼ水平な一本の直線が存在し、その下方に短い水平成分が多数存在する場合は、波の存在する海や湖、あるいは大きな川の景色であると判定する。
そして、このように解析された人間の数や、顔の表情や性別、年齢層、景色の種別などに基づいて、その画像のイメージに適合した音楽を生成する。音楽データ生成手段23は、これらの人間の数や、顔の表情や性別、年齢層、景色の種別などに基づいて、次のようにして音楽データを生成する。
まず、一般的に、画像中に女性が多く含まれる場合は、その画像からは、比較的高い音域で構成された音楽やテンポのゆっくりした音楽、あるいは、オルゴールなどの比較的音色の柔らかな音楽をイメージすることが多い。一方、画像中に男性が多く含まれている場合は、その画像からは、比較的低い音域で構成された音楽や、テンポの速い音楽、あるいは、煩雑な音楽をイメージすることが多い。また、画像中に老人が多く含まれている場合は、軍歌や50年以上昔に流行した歌をイメージし、男女が写っている場合は甘い旋律がふさわしく、また、画像中に幼児が含まれている場合は、その画像からは童謡などの音楽をイメージするのが自然である。一方、人物像の背景や風景写真については、人工的な画像からは、比較的テンポの速い都会的な音楽をイメージすることが多く、また、山の景色からは、クラシックなどのように比較的穏やかな音楽をイメージすることが多い。また、海の景色からは、爽やかな音楽をイメージすることが多い。そこで、このように画像のイメージに適合した音楽を生成すべく、一つの実施例として、例えば、図4に示すように、既存の音楽デーデータベースを作っておき、タイトルの他に歌詞を音符と対応させて格納しておく。図4は、ジャンル毎に分類された音楽a、b…音楽m、音楽n…について男性的、女性的などの属性を割り当てたものである。さらに、曲のイメージをマニュアルで言語表現しておいてもよい。そして、人間によって「男性的/女性的、幼児/成人/老人、人工/自然、山/海」などの属性を音楽に割り当てて音楽データベース230に検索語彙として格納しておく。なお、これらの属性は、人間が実際にその音楽を視聴することによって割り当てておくようにしてもよく、あるいは、歌手が男性である場合は「男性的」、女性である場合は「女性的」であるというように自動的に属性を割り当てておくようにしてもよい。また年齢層の属性については、その音楽が作曲された年代に応じて図4のようなテーブルをあらかじめ用意しておき、その年代に応じた属性を自動的に割り当てるようにしてもよい。さらには、その音楽に歌詞や曲名が含まれている場合は、その歌詞や曲名を、例えば、「オフィス」や「山」や「海」などのキーワードで検索を行い、そのキーワードにヒットする音楽に「人工的」「山」「海」などの属性を割り当てるようにしてもよい。そして、音楽データベース230は、このように属性の割り当てられた音楽のメロディを一小節毎もしくは数小節毎に分割してメロディ素片として格納しておく。
音楽データ生成手段23は、メロディ素片連結手段231と伴奏付与手段232を備えて構成されるもので、メロディ素片連結手段231は、画像解析手段22によって解析された画像の属性に基づき、その属性を有するメロディ素片をランダムに連結して数小節からなるメロディを生成する。ただし、メロディ素片を連結する場合は、あらかじめ調や旋法を統一させておく必要があるため、前述の音楽データベース230の中では、調や旋法を統一しておくものとする。また、生成された音楽の最終音はトニック(主音)である必要があるため、連結に際しては、最終音がトニックとなっている小節を選択する。そして、このようにしてメロディ素片を連結することによってメロディを生成するとともに、伴奏付与手段232によって伴奏を付与していく。伴奏付与手段232によって伴奏を付与する場合、あらかじめ定められたコード進行に従い、複数の和音を適宜組み合わせながら伴奏を付与していく。
次に、このように構成された音楽データ生成システム100を用いて音楽データを生成する場合のフローチャートについて図6および図7を用いて説明する。
まず、画像に基づいて音楽データを生成する場合、第一の端末装置1のユーザは、カメラなどの画像取得手段12を介して被写体を撮影し(ステップS1)、その画像をメモリに格納しておく。そして、その端末装置を音楽データ生成装置2にアクセスして(ステップS2)、図8や図9に示すような画面を表示する(ステップS3)。図9に示す画面には、音楽生成もととなる画像を選択する画面と、生成される音楽のジャンルを選択する画面が含まれている。そして、ユーザはこの画面に従って所望の画像を選択するとともに、音楽のジャンルを選択して(ステップS4)、その選択された画像や音楽のジャンルを音楽データ生成装置2に送信する(ステップS5)。
音楽データ生成装置2は、第一の端末装置1からその選択された画像やジャンルに関するデータを受信すると(図7、ステップT1)まず、その画像中に人間の顔が存在するか否かを判定する(ステップT2)。この判定に際しては、画像中における肌色領域を探索し、その肌色領域の大きさに見合う程度の黒領域の存在を上と左で確認するなどの手段を用いて行う。そこで、人間の顔が存在すると判定された場合(ステップT3)、次に、その顔から人間の数を推定するとともに(ステップT4)、画像中に含まれる顔の属性を解析する(ステップT5)。次いで、各顔の年齢層を推定して「幼児/成人/老人」という属性を付与し(ステップT6)、各顔が明るい表情を有しているか、あるいは、暗い表情を有しているかを解析して(ステップT7)、画像中に含まれるすべての顔の雰囲気についての総合的な判定を行う(ステップT8)。そして、この判定された顔の雰囲気(平均値)に基づいて、顔の表情が明るい場合は「長調」、暗い場合は「短調」と決定する(ステップT9)。また、画像中に含まれる人間の数に応じて、図5に示す人数に応じたテンポである参照テーブルを参照して、音楽のテンポを指定し(ステップT10)、例えば、人数が多いほど音楽のテンポを速くする。
このように人間の数や顔の年齢層や表情などを解析すると、音楽データ生成手段23は、その算出された属性を用いて図4の音楽データベース230を参照し、年齢層に応じた音楽のメロディ素片を抽出する(ステップT11)。また、平均的な顔の表情が明るい場合は「長調」の音楽のメロディ素片を抽出し、平均的な顔の表情が暗い場合は「短調」の音楽のメロディ素片を抽出する(ステップT11)。そして、このように抽出されたメロディ素片をランダムに連結するとともに、最後にトニックを有するメロディ素片を連結する(ステップT12)。そして、この連結されたメロディに対して所定のコード進行に従った伴奏付けを行い(ステップT13)、最終的に生成された音楽データを第一の端末装置1に送信する(ステップT14)。
一方、画像中に顔が存在しない場合は(ステップT3:No)、画像中に含まれる背景の種類を判別し(ステップT15)、縦横斜めの直線量が多く白系統の色相が多い場合は「人工的」な音楽のメロディ素片を抽出する。また、直線量が少なく薄い青や緑系統の色相が多い場合は、「山」の属性が付与された音楽のメロディ素片を抽出し、水平な長い直線と平行な短い直線が多く濃紺系統の色相が多い場合は「海」の属性が付与されたメロディ素片を抽出する(ステップT11)。
そして、このように抽出されたメロディ素片をランダムに連結するとともに、最後にトニックを有するメロディ素片を連結して(ステップT12)伴奏付けを行い(ステップT13)、このように生成された音楽データを第一の端末装置1に送信する(ステップT14)。
第一の端末装置1では、このように生成された音楽データを受信すると(ステップS6)、図10に示すメロディ作成完了を知らせる画面を表示して、専用のアプリケーションによってユーザの視聴を受け付ける。そして、視聴の結果、やり直しが必要であれば、ユーザによって「やり直し」ボタンの入力を受け付け(ステップS7)、その情報を音楽データ生成装置2に送信し(ステップS8)、新たな音楽データの生成を指示する。一方、この音楽データでよいと判断された場合は、ユーザによるダウンロードボタンの入力を受け付け(ステップS9)、生成された音楽データをメモリに格納するとともに、第二の端末装置3にメール本文や画像などとともに送信する(ステップS10)。
このメールを受信した第二の端末装置3側では(ステップU1)、メールの受信に伴って図11に示す専用のアプリケーションを起動し(ステップU2)、メール本文を表示するとともに画像の表示に同期させ音楽データを出力する(ステップU3)。
このように上記実施の形態によれば、人間の数、顔の表情や性別、年齢層、景色などに基づいて音楽データを生成するようにしたので、その画像のイメージに適合した音楽を生成することができるようになる。
しかも、画像のイメージに適合させた音楽を生成する場合、あらかじめ、音楽データベース230に各音楽のイメージに適合する属性を割り当てておき、この音楽を小節毎に分割して他のメロディ素片と連結するようにしたので、確実に画像のイメージに適合した音楽を生成することができるようになる。しかも、メロディ素片の組み合わせを変えることによって毎回異なった音楽を生成することができるようになる。
なお、本発明は上記実施の形態に限定されることなく、種々の形態で実施することができる。
例えば、上記実施の形態では、第一の端末装置1から画像を送信し、音楽データ生成装置2で音楽を生成するようにしているが、音楽データ生成装置2を用いて音楽を生成させる場合に限らず、一台の端末装置によって画像の取得と音楽の生成を行うようにしてもよい。また、上記実施の形態のように、第一の端末装置1から音楽データ生成装置2に画像を送信して音楽データを生成させるのではなく、別途新たに画像の解析装置を設けておき、一旦そこに画像を送信して画像を解析させた後、その解析結果を音楽データ生成装置2に送信し、そこで音楽データを生成させるようにしてもよい。この場合、本発明との関係において、他の解析装置と音楽データ生成装置2が、本発明における音楽データ生成装置2を構成することとなる。
また、上記実施の形態では、音楽データベース230に既存の音楽を分割して格納しておき、この音楽を数小節ずつ連結して音楽データを生成するようにしているが、解析された人間の数、顔の表情や性別、年齢層などによって独自のアルゴリズムを用いて一から音楽データを生成するようにしてもよい。
さらには、上記実施の形態では、画像中に顔が含まれていない場合は景色の種別によって音楽データを生成するようにしているが、必ずしも顔が含まれていない場合にのみ景色の種別を用いる必要はなく、顔の属性と景色の属性の両方を考慮して音楽データを生成するようにしてもよい。
本発明の一実施の形態を示す音楽データ生成システムの概略図 同形態における音楽データ生成システムの機能ブロック図 同形態における音楽生成もととなる画像を示す図 同形態における音楽データ生成装置の音楽データベースの例 同形態における音楽データ生成装置の音楽データベースの例 同形態における音楽データ生成システムにおける第一の端末装置と第二の端末装置のフローチャート 同形態における音楽データ生成システムにおける音楽データ生成装置のフローチャート 同形態における第一の端末装置の表示例 同形態における第一の端末装置の表示例 同形態における第一の端末装置の表示例 同形態における第一の端末装置の表示例
100・・・音楽データ生成システム
1・・・第一の端末装置
2・・・音楽データ生成装置
3・・・第二の端末装置
4・・・ネットワーク
11・・・送受信手段
12・・・画像取得手段
13・・・入力手段
14・・・表示手段
15・・・音声出力手段
31・・・送受信手段
32・・・表示手段
33・・・音声出力手段
21・・・送受信手段
22・・・画像解析手段
221・・・顔検出手段
222・・・顔属性解析手段
223・・・景色解析手段
23・・・音楽データ生成手段
230・・・音楽データベース
231・・・メロディ素片連結手段
232・・・伴奏付与手段

Claims (3)

  1. 画像から音楽データを生成する音楽データ生成装置において、
    画像中に顔が含まれているか否かを検出する顔検出手段と、
    当該顔検出手段によって画像中に顔が含まれていることが検出された場合、当該顔の表情を解析する顔属性解析手段と、
    当該顔属性解析手段によって解析された顔の表情に基づいて音楽データを生成する音楽データ生成手段と、
    を備えたことを特徴とする音楽データ生成装置。
  2. 前記顔属性解析手段が、顔領域内における唇の領域を抽出し、当該唇領域の大きさ、もしくは、唇領域の中央部分における白い色相の有無によって、顔が明るい表情であるか否かを解析するものである請求項1に記載の音楽データ生成装置。
  3. 前記顔属性解析手段によって、明るい表情であると解析された場合、長調の音楽を生成するようにした請求項2に記載の音楽データ生成装置。
JP2006042494A 2006-02-20 2006-02-20 画像から音楽を生成する音楽生成装置 Expired - Fee Related JP4738203B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006042494A JP4738203B2 (ja) 2006-02-20 2006-02-20 画像から音楽を生成する音楽生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006042494A JP4738203B2 (ja) 2006-02-20 2006-02-20 画像から音楽を生成する音楽生成装置

Publications (2)

Publication Number Publication Date
JP2007219393A JP2007219393A (ja) 2007-08-30
JP4738203B2 true JP4738203B2 (ja) 2011-08-03

Family

ID=38496739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006042494A Expired - Fee Related JP4738203B2 (ja) 2006-02-20 2006-02-20 画像から音楽を生成する音楽生成装置

Country Status (1)

Country Link
JP (1) JP4738203B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10628121B2 (en) 2015-10-01 2020-04-21 Samsung Electronics Co., Ltd. Electronic device and method for controlling the same

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101007227B1 (ko) * 2009-03-06 2011-01-12 (주)세가인정보기술 이미지를 이용한 음원 생성 시스템 및 방법
KR20110121049A (ko) * 2010-04-30 2011-11-07 주식회사 지육공팔컨설팅그룹 이미지를 이용한 음원 생성 시스템 및 방법
JP5663953B2 (ja) * 2010-05-26 2015-02-04 ヤマハ株式会社 音楽生成装置
KR101738580B1 (ko) * 2010-12-30 2017-06-08 에스케이플래닛 주식회사 표정 인식 기반 음원 제공 시스템 및 서비스
EP2843615B1 (en) 2012-04-16 2016-12-07 Nissan Motor Co., Ltd. Device for detecting three-dimensional object and method for detecting three-dimensional object
JP2014013340A (ja) * 2012-07-05 2014-01-23 Pioneer Electronic Corp 作曲支援装置、作曲支援方法、作曲支援プログラム、作曲支援プログラムを格納した記録媒体およびメロディ検索装置
JP6575101B2 (ja) * 2015-03-25 2019-09-18 株式会社豊田中央研究所 音楽生成装置
WO2017195616A1 (ja) 2016-05-11 2017-11-16 ソニー株式会社 情報処理装置および方法
JP6058192B1 (ja) * 2016-06-08 2017-01-11 株式会社ビジョナリスト 音楽情報生成装置、音楽情報生成方法、プログラム、および記録媒体
CN106663127A (zh) * 2016-07-07 2017-05-10 深圳狗尾草智能科技有限公司 一种虚拟机器人的交互方法、系统及机器人
KR102241864B1 (ko) * 2019-04-25 2021-04-16 경북대학교 산학협력단 이미지 분석에 기반한 콘텐츠 제공 장치, 이를 포함하는 콘텐츠 제공 시스템 및 이의 콘텐츠 제공 방법

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3744608B2 (ja) * 1996-07-10 2006-02-15 芳彦 佐野 楽音自動発生装置
DE69637504T2 (de) * 1996-09-13 2009-06-25 Hitachi, Ltd. Automatisches musikkomponierverfahren
JP2001188551A (ja) * 1999-12-28 2001-07-10 Sony Corp 情報処理装置および方法、並びに記録媒体
JP2001350472A (ja) * 2000-06-05 2001-12-21 Anekkusu Joho Kenkyusho:Kk 自動作曲方法及び自動作曲システム並びに記憶媒体
JP2003158643A (ja) * 2001-11-20 2003-05-30 Shibasoku:Kk 信号処理方法及び信号処理装置
JP4032727B2 (ja) * 2001-12-12 2008-01-16 アイシン精機株式会社 車線境界検出装置
JP2003204541A (ja) * 2001-12-28 2003-07-18 Nippon Signal Co Ltd:The 映像処理方法及び映像処理装置
JP2005037751A (ja) * 2003-07-17 2005-02-10 Hitachi Denshi Technosystem Kk 多機能型電子譜面台
JP4412929B2 (ja) * 2003-07-30 2010-02-10 セコム株式会社 顔検知装置
JP2005094133A (ja) * 2003-09-12 2005-04-07 Fuji Photo Film Co Ltd 撮影装置
JP2005099068A (ja) * 2003-09-22 2005-04-14 Takuya Shinkawa 楽器および楽音制御方法
JP2005227628A (ja) * 2004-02-13 2005-08-25 Matsushita Electric Ind Co Ltd リズムパターンを用いた制御システム、方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10628121B2 (en) 2015-10-01 2020-04-21 Samsung Electronics Co., Ltd. Electronic device and method for controlling the same

Also Published As

Publication number Publication date
JP2007219393A (ja) 2007-08-30

Similar Documents

Publication Publication Date Title
JP4738203B2 (ja) 画像から音楽を生成する音楽生成装置
US8588463B2 (en) Method of facial image reproduction and related device
US9467673B2 (en) Method, system, and computer-readable memory for rhythm visualization
US10170090B2 (en) Music information generating device, music information generating method, and recording medium
KR101657975B1 (ko) 모바일 앱 기반의 실시간 영상의 배경음악 생성방법
CN110214343B (zh) 信息处理装置、信息处理方法及其程序
CN106383676A (zh) 用于声音的即时光色渲染系统及其应用
WO2023116122A1 (zh) 一种字幕生成方法、电子设备及计算机可读存储介质
CN113538628A (zh) 表情包生成方法、装置、电子设备及计算机可读存储介质
JP4971023B2 (ja) 音楽生成方法,音楽生成装置,音楽生成システム
US20130250077A1 (en) Image processing apparatus, image processing method and computer program
CN111666445A (zh) 一种情景歌词的显示方法、装置及音箱设备
CN114928755B (zh) 一种视频制作方法、电子设备及计算机可读存储介质
JP5498341B2 (ja) カラオケシステム
Kawakatsu Fluctuation analysis for photographs of tourist spots and music extraction from photographs
CN105027552B (zh) 图像处理设备和图像处理方法
KR102462685B1 (ko) 웹툰 제작 보조 장치
CN112235516B (zh) 视频生成方法、装置、服务器及存储介质
Wu et al. A study of image-based music composition
JP2015176592A (ja) アニメーション生成装置、アニメーション生成方法およびプログラム
EP4339809A1 (en) Method and apparatus for generating music file, and electronic device and storage medium
Sappa et al. Coloresia: An Interactive Colour Perception Device for the Visually Impaired
KR100758940B1 (ko) 미술 학습 관리 시스템
Lawrance Atlantique dir. by Mati Diop
Saito et al. Semi-automatic music piece creation based on impression words extracted from object and background in color image

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090216

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110426

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees