JP2013200750A - Image processing apparatus, image processing method and computer program - Google Patents

Image processing apparatus, image processing method and computer program Download PDF

Info

Publication number
JP2013200750A
JP2013200750A JP2012069102A JP2012069102A JP2013200750A JP 2013200750 A JP2013200750 A JP 2013200750A JP 2012069102 A JP2012069102 A JP 2012069102A JP 2012069102 A JP2012069102 A JP 2012069102A JP 2013200750 A JP2013200750 A JP 2013200750A
Authority
JP
Japan
Prior art keywords
effect
section
image
unit
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012069102A
Other languages
Japanese (ja)
Inventor
Takaomi Kimura
隆臣 木村
Daisuke Mochizuki
大介 望月
Junko Fukuda
純子 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2012069102A priority Critical patent/JP2013200750A/en
Priority to US13/753,947 priority patent/US20130250077A1/en
Priority to CN201310088704.4A priority patent/CN103369254A/en
Publication of JP2013200750A publication Critical patent/JP2013200750A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an image processing apparatus that can recursively determine an optimal combination of music and images at the time of automatic creation of a slide show and improve the quality of the slide show.SOLUTION: There is provided an image processing apparatus including: an effect interval setting unit setting multiple effect intervals; an image assigning unit assigning the image data to each of the multiple effect intervals; an effect setting unit setting an effect to each of the multiple effect intervals; an effect resetting deciding unit deciding whether an effect interval satisfies a condition for realizing its effect, and causing the effect to be reset if the effect interval thereof does not satisfy the condition; and a consistency deciding unit deciding, if the effect is reset, consistency between the effect interval in which the effect is reset and other effect intervals.

Description

本開示は、画像処理装置、画像処理方法およびコンピュータプログラムに関する。   The present disclosure relates to an image processing device, an image processing method, and a computer program.

楽曲を流しながら複数の写真を順次切り替えて表示する、スライドショーと呼ばれるコンテンツを生成するための技術が開示されている。スライドショーを自動的に作成する場合、あらかじめ用意されたテンプレートに画像を当てはめる技術が主流であったが、画像によってはテンプレートで決められた画像表示効果(画像エフェクト)にそぐわなかったり、画像に最適な画像エフェクトを選択できなかったりという問題があった。そのような問題を解決する為の技術が開示されている(特許文献1〜3等参照)。   A technique for generating a content called a slide show that sequentially switches and displays a plurality of photos while playing music is disclosed. When creating a slide show automatically, the mainstream technique is to apply an image to a template prepared in advance. However, depending on the image, the image display effect (image effect) determined by the template may not be suitable, or it may be optimal for the image. There was a problem that image effects could not be selected. Techniques for solving such problems have been disclosed (see Patent Documents 1 to 3, etc.).

特許文献1には、楽曲解析に基づいた表示テンプレートを作成し、割り当てられた画像や切り出し領域を最適に選択することによって、より品質の高い音楽同期したスライドショーを自動作成する技術が開示されている。特許文献2には、スライドショーのテンプレートに画像を当てはめる際に、画像内の領域抽出情報を用いることによって、より最適な画像や領域を選択する技術が開示されている。また特許文献3には、画像と画像エフェクトの組み合わせから必要な再生音楽長を決定し、画像エフェクトを音楽に同期させたスライドショーを自動作成する技術が開示されている。   Patent Document 1 discloses a technique for automatically creating a slide show synchronized with music of higher quality by creating a display template based on music analysis and optimally selecting assigned images and cutout areas. . Patent Document 2 discloses a technique for selecting a more optimal image or region by using region extraction information in an image when applying an image to a slide show template. Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for automatically creating a slide show in which a necessary reproduction music length is determined from a combination of an image and an image effect, and the image effect is synchronized with the music.

特開2008−084021号公報JP 2008-084021 A 特開2007−243411号公報JP 2007-243411 A 特開2005−210350号公報JP 2005-210350 A

しかし、特許文献1の技術では、使用したい画像エフェクトに合致した画像が存在しない場合には効果を発揮できず、スライドショーとしての完成度が低くなってしまう。特許文献2の技術では、選択された画像や画像エフェクトの前後関係によってはちぐはぐになってしまい、スライドショー全体としての品質が低下してしまう。そして特許文献3の技術では、音楽的に本来画像エフェクトを切り替えたいタイミングとは違うタイミングで画像エフェクトが切り替わってしまい、例えばBメロからサビに移る瞬間にも同じ画像エフェクトが続いてしまう。   However, in the technique of Patent Document 1, when there is no image that matches the image effect that is desired to be used, the effect cannot be exhibited, and the completeness as a slide show is lowered. In the technique of Patent Document 2, the quality of the entire slide show is deteriorated depending on the context of the selected image or image effect. In the technique of Patent Document 3, the image effect is switched at a timing that is musically different from the timing at which the image effect is originally intended to be switched. For example, the same image effect continues at the moment of transition from B melody to rust.

そこで、本開示は、スライドショーの自動作成時に、楽曲と画像の最適な組み合わせを再帰的に決定してスライドショーの品質を向上させることが可能な、新規かつ改良された画像処理装置、画像処理方法およびコンピュータプログラムを提供することにある。   Accordingly, the present disclosure provides a new and improved image processing apparatus, image processing method, and image processing apparatus capable of recursively determining an optimal combination of music and images when automatically creating a slide show to improve the quality of the slide show. To provide a computer program.

本開示によれば、画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定部と、前記エフェクト区間設定部が設定した前記複数のエフェクト区間のそれぞれに対して前記画像データを割り当てる画像割り当て部と、前記エフェクト区間設定部が設定した前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定部と、前記エフェクト設定部が前記複数のエフェクト区間のそれぞれに対して設定したエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当て部が割り当てた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、前記エフェクト設定部に当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別部と、前記エフェクト再設定判別部により前記エフェクト設定部がエフェクトを再設定すると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断部と、を備える、画像処理装置が提供される。   According to the present disclosure, for each of the effect section setting unit that sets a plurality of effect sections from a predetermined section that continuously displays image data, and each of the plurality of effect sections set by the effect section setting unit An image allocating section for allocating the image data, an effect setting section for setting an effect for each of the plurality of effect sections set by the effect section setting section, and the effect setting section for each of the plurality of effect sections. It is determined whether or not the effect set for each of the conditions satisfies the conditions for realizing each effect using image metadata corresponding to the image data allocated by the image allocation unit. If there is, the effect setting section has an effect section. When the effect setting section resets the effect by the effect reset determining section and the effect reset determining section, the consistency between the effect section in which the effect is reset and another effect section is set. An image processing apparatus is provided that includes a consistency determination unit for determining.

かかる構成によれば、エフェクト区間設定部は画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定し、画像割り当て部はエフェクト区間設定部が設定した複数のエフェクト区間のそれぞれに対して画像データを割り当てる。エフェクト設定部は、エフェクト区間設定部が設定した複数のエフェクト区間のそれぞれに対してエフェクトを設定し、エフェクト再設定判別部は、エフェクト設定部が複数のエフェクト区間のそれぞれに対して設定したエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、画像割り当て部が割り当てた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、エフェクト設定部に当該エフェクト区間のエフェクトを再設定させる。そして整合性判断部は、エフェクト再設定判別部によりエフェクト設定部がエフェクトを再設定すると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する。その結果、かかる画像処理装置は、スライドショーの自動作成時に、楽曲と画像の最適な組み合わせを再帰的に決定してスライドショーの品質を向上させることが可能となる。   According to such a configuration, the effect section setting unit sets a plurality of effect sections from the predetermined section for continuously displaying the image data, and the image assignment unit sets each of the plurality of effect sections set by the effect section setting unit. Assign image data to. The effect setting section sets an effect for each of the plurality of effect sections set by the effect section setting section, and the effect resetting determination section displays the effect set by the effect setting section for each of the plurality of effect sections. Whether or not the conditions for realizing each effect are satisfied is determined using image metadata corresponding to the image data allocated by the image allocation unit, and if there is an effect section that does not satisfy the conditions, the effect setting unit Reset the effect in the effect section. When the effect setting unit resets the effect by the effect reset determining unit, the consistency determining unit determines the consistency between the effect section in which the effect is reset and another effect section. As a result, such an image processing apparatus can recursively determine the optimal combination of music and images when automatically creating a slide show, thereby improving the quality of the slide show.

また本開示によれば、画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定ステップと、前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対して画像データを割り当てる画像割り当てステップと、前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定ステップと、前記エフェクト設定ステップで前記複数のエフェクト区間のそれぞれに対して設定されたエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当てステップで割り当てられた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別ステップと、前記エフェクト再設定判別ステップにより前記エフェクト設定ステップでエフェクトが再設定されると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断ステップと、を備える、画像処理方法が提供される。   According to the present disclosure, each of the effect section setting step for setting a plurality of effect sections from the predetermined section for continuously displaying image data, and each of the plurality of effect sections set in the effect section setting step. An image assigning step for assigning image data to an effect, an effect setting step for setting an effect for each of the plurality of effect sections set in the effect section setting step, and the plurality of effect sections in the effect setting step Whether or not the effect set for each of the images satisfies the conditions for realizing each effect is determined using image metadata corresponding to the image data allocated in the image allocation step, and the conditions are satisfied. There is no effect section The effect reset determining step for resetting the effect in the effect section, and when the effect is reset in the effect setting step by the effect reset determining step, the effect section in which the effect is reset and another effect section A consistency determination step of determining consistency between the image processing method and the image processing method.

また本開示によれば、コンピュータに、画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定ステップと、前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定ステップと、前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対して画像データを割り当てる画像割り当てステップと、前記エフェクト設定ステップで前記複数のエフェクト区間のそれぞれに対して設定されたエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当てステップで割り当てられた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別ステップと、前記エフェクト再設定判別ステップにより前記エフェクト設定ステップでエフェクトが再設定されると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断ステップと、を実行させる、コンピュータプログラム。が提供される。   According to the present disclosure, the effect section setting step for setting a plurality of effect sections from the predetermined section for continuously displaying the image data on the computer, and the plurality of effects set in the effect section setting step. An effect setting step for setting an effect for each of the sections, an image assigning step for assigning image data to each of the plurality of effect sections set in the effect section setting step, and the plurality of the plurality of effects in the effect setting step It is determined using the image metadata corresponding to the image data allocated in the image allocation step whether the effects set for each of the effect sections satisfy the conditions for realizing each effect, and the conditions Does not meet F If there is an effect section, an effect reset determining step for resetting the effect in the effect section and an effect section in which the effect is reset when the effect is reset in the effect setting step by the effect reset determining step. And a consistency determination step of determining consistency between the program and other effect sections. Is provided.

以上説明したように本開示によれば、スライドショーの自動作成時に、楽曲と画像の最適な組み合わせを再帰的に決定してスライドショーの品質を向上させることが可能な、新規かつ改良された画像処理装置、画像処理方法およびコンピュータプログラムを提供するこができる。   As described above, according to the present disclosure, a new and improved image processing apparatus capable of recursively determining an optimal combination of music and images and improving the quality of a slide show when automatically creating a slide show. An image processing method and a computer program can be provided.

本開示の一実施形態にかかる画像処理装置100の機能構成を示す説明図である。2 is an explanatory diagram illustrating a functional configuration of an image processing apparatus 100 according to an embodiment of the present disclosure. FIG. 12音解析技術を用いて、音楽特徴量を取得する様子を示す説明図である。It is explanatory drawing which shows a mode that a music feature-value is acquired using 12 sound analysis technology. 音楽理論とコード進行の関係例を示す説明図である。It is explanatory drawing which shows the example of a relationship between a music theory and chord progression. スライドショーのテーマの例を示す説明図である。It is explanatory drawing which shows the example of the theme of a slide show. スライドショーのエフェクト区間を設定した例を示す説明図である。It is explanatory drawing which shows the example which set the effect area of the slide show. イベントクラスタリングと類似解析結果によって構成されたツリー構造の例を示す説明図である。It is explanatory drawing which shows the example of the tree structure comprised by event clustering and the similar analysis result. スライドショーの自動作成時に、楽曲と画像の最適な組み合わせを再帰的に決定してスライドショーの品質を向上させることが可能When creating a slideshow automatically, the optimal combination of music and images can be recursively determined to improve the quality of the slideshow エフェクト区間への画像の割り当て処理の例を示す説明図である。It is explanatory drawing which shows the example of the allocation process of the image to an effect area. エフェクトの再設定の例を示す説明図である。It is explanatory drawing which shows the example of the reset of an effect. 再設定されたエフェクトの例を示す説明図である。It is explanatory drawing which shows the example of the effect reset. 候補画像の中から画像を選択した例を示す説明図である。It is explanatory drawing which shows the example which selected the image from the candidate images. 表示範囲切り出し部124による表示範囲の切り出し例を示す説明図である。It is explanatory drawing which shows the example of cut-out of the display range by the display range cut-out part 124. FIG. 一枚の画像から複数枚の画像を使用するエフェクトを実現した例を示す説明図である。It is explanatory drawing which shows the example which implement | achieved the effect which uses several images from one image. パラメータが設定されたアニメーションの例を示す説明図である。It is explanatory drawing which shows the example of the animation to which the parameter was set. キーフレームのパラメータが設定されたアニメーションの例を示す説明図である。It is explanatory drawing which shows the example of the animation by which the parameter of the key frame was set. スライドショーを装飾する情報の設定例を示す説明図である。It is explanatory drawing which shows the example of a setting of the information which decorates a slide show. 本開示の一実施形態にかかる画像処理装置100の動作を示す流れ図である。5 is a flowchart showing an operation of the image processing apparatus 100 according to an embodiment of the present disclosure. 楽曲に合わせたエフェクトを選択する例を示す説明図である。It is explanatory drawing which shows the example which selects the effect match | combined with the music. 楽曲に合わせたエフェクトを選択する例を示す説明図である。It is explanatory drawing which shows the example which selects the effect match | combined with the music. 曲調とエフェクトとの対応関係の一例を示す説明図である。It is explanatory drawing which shows an example of the correspondence of a music tone and an effect. 部分転調の検出例を示す説明図である。It is explanatory drawing which shows the example of a detection of partial modulation. 部分転調の別の検出例を示す説明図である。It is explanatory drawing which shows another example of a detection of partial modulation.

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。   Hereinafter, preferred embodiments of the present disclosure will be described in detail with reference to the accompanying drawings. In addition, in this specification and drawing, about the component which has the substantially same function structure, duplication description is abbreviate | omitted by attaching | subjecting the same code | symbol.

なお、説明は以下の順序で行うものとする。
<1.本開示の一実施形態>
[画像処理装置の機能構成]
The description will be made in the following order.
<1. One Embodiment of the Present Disclosure>
[Functional configuration of image processing apparatus]

<1.本開示の一実施形態>
[画像処理装置の機能構成]
まず、図面を参照しながら本開示の一実施形態にかかる画像処理装置の機能構成について説明する。図1は、本開示の一実施形態にかかる画像処理装置100の機能構成を示す説明図である。以下、図1を用いて本開示の一実施形態にかかる画像処理装置100の機能構成について説明する。
<1. One Embodiment of the Present Disclosure>
[Functional configuration of image processing apparatus]
First, a functional configuration of an image processing apparatus according to an embodiment of the present disclosure will be described with reference to the drawings. FIG. 1 is an explanatory diagram illustrating a functional configuration of the image processing apparatus 100 according to an embodiment of the present disclosure. Hereinafter, the functional configuration of the image processing apparatus 100 according to an embodiment of the present disclosure will be described with reference to FIG.

図1に示した画像処理装置100は、画像データおよび楽曲データから、スライドショーを自動的に生成する機能を有する装置である。なお、「スライドショー」とは楽曲を流しながら複数の写真を順次切り替えて表示するコンテンツを指す。   The image processing apparatus 100 illustrated in FIG. 1 is an apparatus having a function of automatically generating a slide show from image data and music data. Note that “slide show” refers to content that sequentially switches and displays a plurality of photos while playing music.

図1に示したように、本開示の一実施形態にかかる画像処理装置100は、楽曲解析部102と、楽曲メタデータ保持部104と、再生区間選択部106と、エフェクト区間設定部108と、画像候補割り当て部110と、画像解析部112と、画像メタデータ保持部114と、エフェクト設定部116と、画像選択部118と、エフェクト再設定判別部120と、スライドショー品質判定部122と、表示範囲切り出し部124と、タイミング調整部126と、スライドショー出力部128と、を含んで構成される。   As illustrated in FIG. 1, the image processing apparatus 100 according to an embodiment of the present disclosure includes a music analysis unit 102, a music metadata holding unit 104, a playback segment selection unit 106, an effect segment setting unit 108, Image candidate assignment unit 110, image analysis unit 112, image metadata holding unit 114, effect setting unit 116, image selection unit 118, effect resetting determination unit 120, slide show quality determination unit 122, display range A cutout unit 124, a timing adjustment unit 126, and a slide show output unit 128 are included.

楽曲解析部102は、楽曲データを解析し、解析結果をメタデータとして出力する。スライドショーにおいて再生される楽曲データを解析して出力されるメタデータは、後述の再生区間選択部106による再生区間の切り出しや、エフェクト区間設定部108による、楽曲に合わせた画像エフェクトの設定に用いられる。楽曲解析部102は、楽曲データを解析して得られるメタデータを楽曲メタデータ保持部104に出力する。楽曲メタデータ保持部104は、楽曲解析部102による楽曲データの解析で得られる楽曲メタデータを保持する。楽曲メタデータ保持部104に保持された楽曲メタデータは、再生区間選択部106やエフェクト区間設定部108から参照される。   The music analysis unit 102 analyzes the music data and outputs the analysis result as metadata. The metadata output by analyzing the music data to be played back in the slide show is used to cut out a playback section by a playback section selection unit 106, which will be described later, and to set an image effect according to the music by the effect section setting unit 108. . The music analysis unit 102 outputs metadata obtained by analyzing the music data to the music metadata holding unit 104. The music metadata holding unit 104 holds music metadata obtained by analyzing music data by the music analysis unit 102. The music metadata held in the music metadata holding unit 104 is referred to by the playback section selection unit 106 and the effect section setting unit 108.

本実施形態では、音楽と同期したスライドショーを作成する為に、曲調解析アルゴリズムの12音解析技術を利用する。図2は、12音解析技術を用いて、音楽特徴量を取得する様子を示す説明図である。図2に示したように、12音解析技術によって、サビやAメロといった楽曲構成、音程を表すキー、和音を表すコード、拍子や拍の位置、ビートの強さ等の音楽特徴量を取得することが可能である。後にエフェクトの切替りタイミングなどを決定する為に、楽曲解析部102はこれらの音楽特徴量を抽出して取得する。   In this embodiment, in order to create a slide show synchronized with music, a 12-tone analysis technique of a music tone analysis algorithm is used. FIG. 2 is an explanatory diagram showing a state in which music feature values are acquired using a twelve-tone analysis technique. As shown in FIG. 2, music features such as chorus, key for chord, chord for chord, time signature, beat position, beat strength, etc. are acquired by 12-tone analysis technology. It is possible. The music analysis unit 102 extracts and acquires these music feature amounts in order to determine effect switching timing and the like later.

再生区間選択部106は、楽曲メタデータ保持部104が保持している、スライドショーにおいて再生される楽曲データの楽曲メタデータを用いて、再生される楽曲データにおける再生区間を選択する。再生区間選択部106は、選択した再生区間の情報をエフェクト区間設定部108に供給する。   The playback section selection unit 106 selects the playback section in the music data to be played back using the music metadata of the music data played back in the slide show, which is held by the music metadata holding unit 104. The playback section selection unit 106 supplies information on the selected playback section to the effect section setting unit 108.

音楽と同期したスライドショーでは、1曲に合わせて写真を再生したり、複数の曲にまたがって写真を再生する場合もあるが、逆に写真の枚数が少なかったり、動画として携帯電話などで親や友人に送りたい場合には、1曲の中の一部分で短いスライドショーを作成したい場合もある。このような場合には、再生区間選択部106は、12音解析技術によって得られた音楽特徴量を用いて、楽曲データの一部分、例えばサビ位置の少し前から30秒間をスライドショーの再生区間として切り出してもよい。図2では、楽曲の一部分をスライドショーの再生区間として設定する場合を示している。   In a slide show that is synchronized with music, you may play a photo along with a single song, or you may play a photo across multiple songs. If you want to send it to a friend, you may want to create a short slideshow with a portion of a song. In such a case, the playback section selection unit 106 cuts out a part of the music data, for example, 30 seconds just before the chorus position as a slide show playback section, using the music feature amount obtained by the 12 sound analysis technique. May be. FIG. 2 shows a case where a part of music is set as a slideshow playback section.

また、楽曲解析部102の12音解析によって得られたコード情報やそのコード進行に、音楽理論的に特徴的なものが存在する場合がある。例えば、音楽理論ではサブドミナントと呼ばれるやや不安定な和音、ドミナントと呼ばれる不安定な和音、トニックと呼ばれる安定した和音が存在する。図3は、音楽理論とコード進行の関係例を示す説明図である。   In addition, there are cases where there is a characteristic in music theory in the chord information obtained by the twelve-tone analysis of the music analysis unit 102 and the chord progression. For example, in music theory, there are somewhat unstable chords called subdominants, unstable chords called dominants, and stable chords called tonics. FIG. 3 is an explanatory diagram showing an example of the relationship between music theory and chord progression.

これらの和音のうち、ドミナントからトニックにコードが遷移するような進行では、聞いている人に不安から安定を感じさせる印象的なパターンとなるので、スライドショーでエフェクトと組み合わせることで表現力を向上させる効果を期待できる。上述のもの以外にも、コードが頻繁に切り替わるエリアや、曲の中で聴取者の気を惹くような個性的な和音、ビートが集中しているエリアなども、スライドショーを自動作成する際に有効に利用できる。従って、再生区間選択部106は、それらのエリア情報を保持し、エフェクト区間設定部108に供給してもよい。   Of these chords, the chord transitions from dominant to tonic makes an impressive pattern that makes the listener feel stable from anxiety, so combining them with effects in a slideshow improves expression The effect can be expected. In addition to the above, areas where chords change frequently, unique chords that attract the listener's attention, areas where beats are concentrated, etc. are also effective when creating slideshows automatically Available to: Therefore, the playback section selection unit 106 may hold the area information and supply it to the effect section setting unit 108.

エフェクト区間設定部108は、スライドショーとして画像データを連続して表示させる所定の区間の中から、複数のエフェクト区間を設定する。エフェクト区間設定部108は、例えば、楽曲メタデータ保持部104が保持している、スライドショーにおいて再生される楽曲データの楽曲メタデータを用いて、再生区間選択部106から供給される楽曲データの再生区間における画像エフェクトの区間を設定する。エフェクト区間設定部108は、設定したエフェクト区間の情報を画像候補割り当て部110へ供給する。   The effect section setting unit 108 sets a plurality of effect sections from predetermined sections in which image data is continuously displayed as a slide show. The effect section setting unit 108 uses, for example, music metadata of music data to be played back in a slide show, which is held by the music metadata holding unit 104, and a playback section of music data supplied from the playback section selection unit 106. Sets the image effect interval at. The effect section setting unit 108 supplies information on the set effect section to the image candidate assignment unit 110.

本実施形態では、エフェクト区間設定部108は、エフェクト区間を決定する主な要因を、優先度順に以下の4つとする。   In the present embodiment, the effect section setting unit 108 sets the following four main factors for determining the effect section in order of priority.

(1)テーマ毎に必須なエフェクト区間
エフェクト区間設定部108は、エフェクト区間を決定する際に、まず、設定されるテーマ毎に必須なエフェクト区間を優先する。ここでいうテーマとは、スライドショーの世界観的なものをいい、例えばユーザがスライドショーの自動作成を指示するにあたって設定するものである。
(1) Essential effect section for each theme When the effect section is determined, the effect section setting unit 108 first prioritizes the required effect section for each set theme. The theme here refers to a world view of a slide show, and is set, for example, when the user instructs to automatically create a slide show.

図4は、スライドショーのテーマの例を示す説明図である。図4で示されているのは、シンプルなスライドショー、モノクロ画像のスライドショー、フィルムに写真が写し出されるようなスライドショー、人の顔に注目した画像エフェクトがメインのスライドショー、宇宙を写真がふわふわと漂うようなスライドショー、3Dを駆使したスライドショーなどが存在し、テーマが異なるとスライドショーの雰囲気も大きく変化する。なお、これらのスライドショーは、単なるテンプレートとは異なり、テーマ自体がエフェクトの切り替えタイミングを持っているわけではない。   FIG. 4 is an explanatory diagram illustrating an example of a slide show theme. Figure 4 shows a simple slideshow, a monochrome slideshow, a slideshow in which photos are projected on film, a main slideshow with image effects focused on human faces, and photos drifting through the universe Slideshows that make full use of 3D, etc. exist, and if the theme is different, the atmosphere of the slideshow changes greatly. Note that these slide shows are different from simple templates in that the theme itself does not have an effect switching timing.

テーマによっては、イントロやエンディングといった特定の画像エフェクトを用意しており、それらのエフェクト区間は何よりも優先されて決定される。それらの特定の画像エフェクトは、一定秒数の場合もあれば、最初の1小節等という場合もあり、テーマやエフェクトの種類によって異なる。   Depending on the theme, specific image effects such as intro and ending are prepared, and those effect sections are determined with priority over anything. These specific image effects may be a fixed number of seconds or the first one measure, etc., and vary depending on the theme and effect type.

(2)楽曲構成が切り替わるタイミング
次に、エフェクト区間設定部108は、エフェクト区間を決定する際に、音楽メタデータの中で楽曲構成が切り替わるタイミングを優先する。楽曲構成が切り替わるタイミングの例には、拍子が切り替わる(4/4→3/4)、キーが変化する(C→G)、メロディが切り替わる(Bメロ→サビ)などが存在する。これらのタイミングでは、音楽的な雰囲気が大きく変わるので、そのタイミングで画像エフェクトを切り替えると効果的である。
(2) Timing at which the music composition is switched Next, the effect section setting unit 108 prioritizes the timing at which the music composition is switched in the music metadata when determining the effect section. Examples of the timing at which the music composition is switched include time signature switching (4/4 → 3/4), key changing (C → G), and melody switching (B melody → rust). At these timings, the musical atmosphere changes greatly, so it is effective to switch image effects at that timing.

エフェクト区間設定部108は、楽曲構成が切り替わるタイミングを用いる際には、エフェクト区間そのものは決定せず、後にそのタイミングをまたぐようなエフェクト区間の設定が行われようとした際に、優先してこの楽曲構成が切り替わるタイミングでエフェクトを区切るようにする。   The effect section setting unit 108 does not determine the effect section itself when using the timing at which the music composition is switched, but prioritizes the setting of the effect section that crosses the timing later. The effect is divided at the timing when the music composition is switched.

(3)コード進行的に印象的なエリア
上述した音楽メタデータの説明で、印象的なコード進行パターンや、特徴的な和音などを抽出したが、次に、エフェクト区間設定部108は、エフェクト区間を決定する際に、それらコード進行パターンや特徴的な和音を有するエリアをエフェクト区間として優先して利用する。エフェクト区間設定部108は、コード進行パターンや特徴的な和音の適用に際して、テーマやその時点での楽曲構成(サビ、Aメロ等)によって異ならせるようにしてもよい。
(3) Areas that are impressive in terms of chord progression In the description of the music metadata described above, an impressive chord progression pattern, a characteristic chord, and the like have been extracted. Are determined, the areas having these chord progression patterns and characteristic chords are used preferentially as effect sections. The effect section setting unit 108 may change the chord progression pattern and the characteristic chord depending on the theme and the music composition (such as rust and A melody) at that time.

(4)ベースとなるテーマ毎の切り替えパターン
(1)〜(3)の要因は、テーマや音楽によってはほとんど存在しない可能性もある。そのような場合には、エフェクト区間設定部108が一定の間隔(例えば1小節単位など)でエフェクト区間を設定してしまうと、スライドショーとして単調なものになってしまう可能性がある。
(4) Switching pattern for each base theme The factors (1) to (3) may hardly exist depending on the theme or music. In such a case, if the effect section setting unit 108 sets the effect section at a constant interval (for example, in units of one measure), there is a possibility that the slide show becomes monotonous.

そこで、エフェクト区間設定部108は、エフェクト区間を決定する際に、ベースとなるエフェクト区間を様々な間隔や、タイミングで設定する。この間隔やタイミングは、スライドショーに設定されたテーマによって異なり、楽曲データの解析によって得られる楽曲のムード特徴量などを参考に設定してもよい。例えばエフェクト区間設定部108は、楽曲のサビの部分ではエフェクト区間の間隔を短く設定し、間奏部分ではエフェクト区間を長めに設定する等、楽曲構成に応じてエフェクト区間やエフェクトの切り替えタイミングを変化させてもよい。このように楽曲構成に応じてエフェクト区間やエフェクトの切り替えタイミングを変化させることで、スライドショーを単調にしない効果が現れる。   Therefore, the effect section setting unit 108 sets the base effect section at various intervals and timings when determining the effect section. The interval and timing differ depending on the theme set for the slide show, and may be set with reference to the mood feature amount of the music obtained by analyzing the music data. For example, the effect section setting unit 108 changes the effect section and the effect switching timing according to the music composition, such as setting the effect section interval short in the chorus portion of the music and setting the effect section longer in the interlude section. May be. In this way, by changing the effect section and the effect switching timing according to the music composition, an effect that does not make the slide show monotonous appears.

また音楽は、一般的に4小節、8小節、16小節といった単位で構成を繰り返したり変化させたりすることが多いので、そのような知識をエフェクト区間設定部108によるエフェクト区間の設定に反映するとより効果的である。   In general, music is often repeated or changed in units of four measures, eight measures, and sixteen measures, so that such knowledge is reflected in the setting of the effect section by the effect section setting unit 108. It is effective.

図5は、エフェクト区間設定部108が、上述の(1)から(4)の優先度でスライドショーのエフェクト区間を設定した例を示す説明図である。図5に示したこれらのエフェクト区間は、後に再設定される可能性もあるが、まずはここで設定されたエフェクト区間を枠組みとして、その後の画像の割り当てやエフェクトの設定を行なっていく。   FIG. 5 is an explanatory diagram showing an example in which the effect section setting unit 108 sets the effect section of the slide show with the priorities (1) to (4) described above. These effect sections shown in FIG. 5 may be reset later, but first, with the effect section set here as a framework, subsequent image assignment and effect settings are performed.

画像候補割り当て部110は、スライドショーで表示するために用意された画像群の中から、エフェクト区間設定部108が設定した各エフェクト区間へ画像を割り当てる。画像候補割り当て部110による各エフェクト区間への画像の割り当てについては後に詳述する。   The image candidate assigning unit 110 assigns an image to each effect section set by the effect section setting unit 108 from among a group of images prepared for display in a slide show. The image assignment to each effect section by the image candidate assigning unit 110 will be described in detail later.

画像解析部112は、スライドショーを表示するために用意された画像群に対して画像解析処理を実行する。画像解析部112は、スライドショーを表示するために用意された画像群に対して、顔や類似、色に関する解析特徴量や一般的なExif情報などの特徴量を取得し、画像候補割り当て部110がスライドショーで使用する画像を各エフェクト区間へ割り当てる際に使いやすいように様々な粒度でグループを生成し保持する。画像解析部112は、画像解析処理の結果得られる画像メタデータを画像メタデータ保持部114に出力する。画像メタデータ保持部114は、画像解析部112が出力した画像メタデータを保持する。画像メタデータ保持部114が保持した画像メタデータは、エフェクト設定部116、画像選択部118、表示範囲切り出し部124などから参照される。   The image analysis unit 112 performs image analysis processing on the image group prepared for displaying the slide show. The image analysis unit 112 acquires feature amounts such as analysis feature amounts related to faces, similarities, and colors and general Exif information for the image group prepared for displaying the slide show. Groups are generated and stored with various granularities so that they can be easily used when assigning images used in a slide show to each effect section. The image analysis unit 112 outputs image metadata obtained as a result of the image analysis processing to the image metadata holding unit 114. The image metadata holding unit 114 holds the image metadata output from the image analysis unit 112. The image metadata held by the image metadata holding unit 114 is referred to by the effect setting unit 116, the image selection unit 118, the display range cutout unit 124, and the like.

スライドショーでは撮影日時順に画像を表示するケースが多いので、例えば、特開2007−94762号公報で示されるイベントクラスタリングや類似解析結果を用いたツリーを構築しておくと後々の処理において画像の使用が容易となる。図6は、画像群に対する、イベントクラスタリングと類似解析結果によって構成されたツリー構造の例を示す説明図である。類似解析には、画像URLや画像の大きさ、撮影日時、撮影画像の緯度経度、顔特徴量、類似特徴量、構図特徴量、色特徴量等の情報が用いられても良い。   Since there are many cases in which images are displayed in the order of shooting date and time in a slide show, for example, if a tree using event clustering or similar analysis results disclosed in Japanese Patent Application Laid-Open No. 2007-94762 is constructed, the images are used in later processing. It becomes easy. FIG. 6 is an explanatory diagram illustrating an example of a tree structure configured by event clustering and a similar analysis result for an image group. For the similarity analysis, information such as the image URL, the size of the image, the shooting date and time, the latitude and longitude of the captured image, the face feature amount, the similar feature amount, the composition feature amount, and the color feature amount may be used.

また撮影日時順ではなく、顔検出や顔識別技術を用いてグループ生成を行ってもよい。例えば、特開2011−133988号公報には、人物のグループ化や人間関係を元にグループ生成を行う技術が開示されている。   Further, group generation may be performed using face detection or face identification technology instead of shooting date order. For example, Japanese Patent Application Laid-Open No. 2011-133888 discloses a technique for performing group generation based on grouping of persons and human relationships.

エフェクト設定部116は、エフェクト区間設定部108が設定した各エフェクト区間に対してエフェクトを設定する。エフェクト設定部116は、エフェクト区間設定部108が設定した各エフェクト区間に対して、まずは期待されるエフェクトを設定する。ここで「期待される」と表現しているのは、指定されたテーマや楽曲の盛り上がりを表現するのに最適なエフェクトではあるが、画像が割り当てられた際にその画像にそぐわないエフェクトだったり、前後のエフェクトが再設定された場合にエフェクト同士のつながりが悪かったりする場合は、後に変更される可能性があるからである。まずは、エフェクト設定部116に、スライドショーとして最適と思われるエフェクトを設定させ、変更の必要があればエフェクト設定部116にエフェクトを最設定させる。エフェクトの種類を選択する条件は、上記のエフェクト区間の設定方法に準ずる。   The effect setting unit 116 sets an effect for each effect section set by the effect section setting unit 108. The effect setting unit 116 first sets an expected effect for each effect section set by the effect section setting unit 108. The expression “expected” here is the best effect to express the excitement of the specified theme or song, but when the image is assigned, it is an effect that does not match that image, This is because if the effects before and after are reset, if the connection between the effects is bad, there is a possibility that it will be changed later. First, the effect setting unit 116 is caused to set an effect that seems to be optimal as a slide show, and if there is a need to change, the effect setting unit 116 is set to the highest effect. The condition for selecting the effect type is in accordance with the effect section setting method described above.

(1)テーマ毎に必須なエフェクト区間
テーマ毎に決められたエフェクト区間では無条件に対応するエフェクトを設定する。テーマ毎に決められたエフェクト区間とは、例えばスライドショーのイントロ部分やエンディング部分などである。
(1) Essential effect section for each theme In the effect section determined for each theme, an effect corresponding to the uncondition is set. The effect section determined for each theme is, for example, an intro part or an ending part of a slide show.

(2)楽曲構成が切り替わるタイミング
この楽曲構成が切り替わるタイミングでは、エフェクト区間設定部108でエフェクト区間が設定されているわけではないが、楽曲構成が切り替わった直後に割り当てられたエフェクトの種類を設定する役割を持つ。エフェクト設定部116は、このタイミングに、例えばBメロからサビに切り替わった直後に派手なエフェクトを割り当てたり、画面全体をフラッシュさせるエフェクトを割り当てたりして、盛り上がりを目立たせるといった使い方をする。
(2) Timing at which the music composition is switched At the timing at which the music composition is switched, the effect section is not set by the effect section setting unit 108, but the effect type assigned immediately after the music composition is switched is set. Have a role. At this timing, the effect setting unit 116 assigns a flashy effect immediately after switching from B melody to rust, or assigns an effect that causes the entire screen to flash, thereby making the excitement stand out.

(3)コード進行的に印象的なエリア
このコード進行的に印象的なエリアには、エフェクト設定部116は、音楽理論的に意味のあるエフェクトの割り当てを行う。エフェクト設定部116は、例えば、聴取者の気を惹くような特殊な和音には装飾的なエフェクトを、不安定な和音にはその後を期待させるような繋ぎのエフェクトを、安定した和音にはスライドショーにおいて決めとなるような派手なエフェクトを、コードが頻繁に切り替わる区間では動きのあるエフェクトを選択する。このように、コード進行に応じてエフェクトを設定することによって、本実施形態にかかる画像処理装置100は、音楽的な印象と視覚的な印象を重ね合わせて、より音楽と合った魅力的なスライドショーを実現することが可能である。
(3) Area that is impressive in terms of chord progression In this area that is impressive in terms of chord progression, the effect setting unit 116 assigns effects that are meaningful in terms of music theory. The effect setting unit 116, for example, provides a decorative effect for a special chord that attracts the listener's attention, a connecting effect that causes the unstable chord to be expected later, and a slide show for a stable chord. Select a flashy effect that will be decided in step 1, and a moving effect in a section where chords change frequently. As described above, by setting the effect according to the chord progression, the image processing apparatus 100 according to the present embodiment superimposes the musical impression and the visual impression, and makes an attractive slide show that is more suitable for music. Can be realized.

(4)ベースとなるテーマ毎の切り替えパターン
このベースとなるパターンでは、エフェクト設定部116は、様々なエフェクトが出現し、同じエフェクトが連続しないように、また繋がりの良いエフェクト同士を並べるといったことを考慮してエフェクトを設定する。またエフェクト設定部116は、楽曲構成に応じて、例えばサビでは派手なエフェクトを、通常のメロディでは普通のエフェクトを、間奏では大人しめのエフェクトを選択するなどの変化を持たせてエフェクトを設定する。
(4) Switching pattern for each base theme In this base pattern, the effect setting unit 116 indicates that various effects appear, and the same effects are not consecutively arranged, and effects that are well connected are arranged. Set the effect in consideration. Further, the effect setting unit 116 sets the effect according to the composition of the music, for example, by selecting a flashy effect for chorus, a normal effect for a normal melody, and an adult effect for an interlude. .

エフェクト設定部116は、これらの期待されるエフェクトを設定する際に、同じ条件であれば必ず同じエフェクトを選択するのではなく、同じ条件であっても複数のエフェクトの中からランダムで選択するといった幅を持たせるようにしてもよい。ユーザがスライドショーを何度も作成した場合に、常に同じスライドショーが作成されるのではなく、毎回異なるスライドショーが作成された方が良い場合も少なくないからである。   When setting these expected effects, the effect setting unit 116 does not always select the same effect if the conditions are the same, but randomly selects from a plurality of effects even if the conditions are the same. You may make it give width. This is because when the user creates a slide show many times, it is not always the same slide show, but it is often better to create a different slide show each time.

図7は、エフェクト設定部116が期待されるエフェクトを設定した例を示す説明図である。図7には、エフェクト区間設定部108が期待区間、キメ区間、エンディングの3つのエフェクト区間を設定し、エフェクト設定部116が、各エフェクト区間に対して、それぞれ顔に向かってズームするエフェクト、3枚の写真をタイミング良く表示するエフェクト、集合写真やコラージュを表示するエフェクトを設定した状態を図示している。   FIG. 7 is an explanatory diagram illustrating an example in which the effect setting unit 116 sets expected effects. In FIG. 7, the effect interval setting unit 108 sets three effect intervals, an expected interval, a texture interval, and an ending, and the effect setting unit 116 zooms toward each face with respect to each effect interval. The figure shows a state in which an effect for displaying a single photo in a timely manner and an effect for displaying a group photo or a collage are set.

ここで、スライドショーで再生する楽曲の1曲分や、その一部分の30秒である等のスライドショーの再生時間に対して、画像処理装置100に入力された全ての画像を表示することは困難な場合がある。そのような場合には入力された画像群から必要な枚数を選択することが求められる。   Here, when it is difficult to display all the images input to the image processing apparatus 100 with respect to the playback time of the slide show such as one piece of music to be played back in the slide show or a part of the music for 30 seconds. There is. In such a case, it is required to select a necessary number of images from the input image group.

さらにスライドショーには、多くの場合に、撮影日時順で画像を表示して欲しいというユーザの要求があり、そのような要求に対して先頭から必要な枚数だけを取り出して表示してしまっては、入力された画像群の最後の方の写真は全く出てこなくなってしまう場合がある。   Furthermore, in many cases, there are user requests to display images in order of shooting date and time in a slide show. If such a request requires only the required number of images to be displayed from the beginning, The last photo in the input image group may not come out at all.

そこで、画像候補割り当て部110は、エフェクト区間設定部108で設定されたエフェクト区間にどの画像を割り当てるかを決定する処理を実行しても良い。図8は、画像候補割り当て部110による、エフェクト区間への画像の割り当て処理の例を示す説明図である。図8は、図6のように構築されたツリーを用いて、エフェクト区間へ画像を割り当てる例を示している。   Therefore, the image candidate assigning unit 110 may execute processing for determining which image is assigned to the effect section set by the effect section setting unit 108. FIG. 8 is an explanatory diagram showing an example of image allocation processing to the effect section by the image candidate allocation unit 110. FIG. 8 shows an example in which an image is assigned to an effect section using the tree constructed as shown in FIG.

画像候補割り当て部110は、図8に示すように、あらかじめ準備した画像群のツリーをスライドショー全体と対比して、どのエフェクト区間にどこからどこまでの画像を割り当てるかという処理を行う。この割り当てられた画像群を、あるエフェクト区間において「選択可能な画像候補」と呼ぶことにする。   As shown in FIG. 8, the image candidate assigning unit 110 compares the tree of images prepared in advance with the entire slide show, and performs processing of assigning images from which to where in which effect section. This assigned image group is referred to as a “selectable image candidate” in a certain effect section.

画像候補割り当て部110は、画像候補をエフェクト区間へ割り当てる際に、各々のエフェクト区間に対して撮影日時順に均等に割り当ててもよいし、エフェクト区間の秒数の比率で割り当ててもよい。また画像候補割り当て部110は、エフェクト区間に設定された期待されるエフェクトに必要な枚数を満たすように割り当ててもよい。ただし、イントロやエンディングなどで撮影日時の時系列に関係なく全体から画像を選択するようなエフェクトの区間に関しては、画像候補割り当て部110は、特別に全ての画像を画像候補にすることが望ましい。   When assigning image candidates to the effect sections, the image candidate assigning unit 110 may assign the effect sections equally to the effect sections in the order of the shooting date and time, or may assign the effect sections in the ratio of the number of seconds of the effect sections. Further, the image candidate assigning unit 110 may assign the image candidate so as to satisfy the required number of expected effects set in the effect section. However, regarding an effect section in which an image is selected from the whole regardless of the time series of shooting date and time, such as intro or ending, it is desirable that the image candidate assigning unit 110 specially set all images as image candidates.

また画像候補割り当て部110は、様々な方法でエフェクト区間に画像候補を割り当てる際に、ツリー構成の中でなるべく大きなまとまりをエフェクト区間に割り当てることが望ましい。例えば画像候補割り当て部110は、類似グループの数がエフェクト区間数よりも大きい場合は類似グループ単位で画像候補を割り当て、さらに大きいグループで割り当てが可能な場合はそのグループで割り当てるというように割り当てを行う。これは、後にスライドショーで実際に表示する画像を決定する際に、あまり関係のない写真が同時に表示することを避けたり、あえて似たような写真を連続して表示したりしたい場合に、そのような画像が選ばれやすくするためである。   In addition, when assigning image candidates to the effect section by various methods, the image candidate assigning unit 110 preferably assigns as large a group as possible to the effect section in the tree configuration. For example, the image candidate assigning unit 110 assigns image candidates in units of similar groups when the number of similar groups is larger than the number of effect sections, and assigns in such groups when assignment is possible in a larger group. . This is useful when you decide which images to display in a slide show later, and you want to avoid displaying unrelated photos at the same time or want to display similar photos in a row. This is to make it easy to select a correct image.

逆に、曲の長さに対して入力画像の枚数が少ない場合、同一の画像を複数のエフェクト区間に重複して割り当てることも可能である。しかしこの場合、エフェクトは異なるが同じ写真ばかりが出現してしまい、結果としてスライドショーとしての品質が下がってしまう可能性がある。その場合は、後述のスライドショー品質判定部122によって、エフェクト区間設定部108にエフェクト区間を設定させて、例えばエフェクト区間を長めに(エフェクト区間数を少なめに)設定し直させたり、または再生区間選択部106によって、再生する楽曲の再生区間を短くしたりするといった処理が行われるようにしても良い。   Conversely, if the number of input images is small with respect to the length of the song, the same image can be assigned to a plurality of effect sections in an overlapping manner. However, in this case, only the same photograph appears with different effects, and as a result, the quality of the slide show may be lowered. In such a case, the slide show quality determination unit 122 (described later) causes the effect section setting unit 108 to set an effect section, for example, to set a longer effect section (with a smaller number of effect sections), or to select a playback section. The unit 106 may perform processing such as shortening the playback section of the music to be played back.

画像選択部118は、エフェクト設定部116で各エフェクト区間に設定されたエフェクトで表示する画像を、画像候補割り当て部110で各エフェクト区間に割り当てられた画像の中から選択する。   The image selection unit 118 selects an image to be displayed with the effect set in each effect section by the effect setting unit 116 from the images assigned to each effect section by the image candidate assignment unit 110.

エフェクト再設定判別部120は、画像選択部118が選択した画像によって期待されるエフェクトが実現できるかどうかを判別する。エフェクト再設定判別部120は、期待されるエフェクトが実現できるかどうかを、例えば、写真の枚数が足りているかどうか、必要な数の顔が存在するか、必要な枚数の類似画像が存在するか、を満たすかどうかで決定する。   The effect resetting determination unit 120 determines whether or not the effect expected by the image selected by the image selection unit 118 can be realized. The effect resetting determination unit 120 determines whether or not the expected effect can be realized, for example, whether the number of photographs is sufficient, whether a necessary number of faces exist, or a necessary number of similar images exist. , Decide whether to meet.

図9は、エフェクトの再設定の例を示す説明図である。ある盛り上がり区間では、顔をズームするエフェクトを期待してエフェクト設定部116はそのエフェクトを設定したが、画像候補割り当て部110が割り当てた候補画像の中に顔の入った写真が存在しなかったので、エフェクト再設定判別部120は、エフェクト設定部116に別のエフェクトを再設定させる。また、あるキメの区間では、類似する3枚の画像が必要なエフェクトをエフェクト設定部116が設定したが、候補画像の中には2枚の類似画像しか存在しなかったので、エフェクト再設定判別部120は、エフェクト設定部116に、代替として2枚の類似画像を使用するエフェクトを再設定させる。   FIG. 9 is an explanatory diagram showing an example of effect resetting. In a certain excitement section, the effect setting unit 116 sets the effect in anticipation of the effect of zooming the face, but there is no photograph with a face in the candidate images assigned by the image candidate assigning unit 110. The effect resetting determination unit 120 causes the effect setting unit 116 to reset another effect. Also, in a certain section, the effect setting unit 116 has set an effect that requires three similar images. However, only two similar images exist in the candidate image, so the effect resetting determination is made. The unit 120 causes the effect setting unit 116 to reset an effect that uses two similar images instead.

後者の例のように、エフェクト再設定判別部120が、エフェクト設定部116にエフェクトを再設定させる場合には、なるべく元のエフェクトに近いエフェクトを再設定するようにルールを設けてもよい。これは、スライドショー全体としてなるべく最初に期待された雰囲気に近づける為である。   As in the latter example, when the effect resetting determination unit 120 causes the effect setting unit 116 to reset the effect, a rule may be provided to reset the effect as close to the original effect as possible. This is to make the entire slide show as close as possible to the initially expected atmosphere.

図10は、再設定されたエフェクトの例を示す説明図である。再設定するエフェクトは、写真の枚数、必要な顔の数、必要な類似画像の枚数を減少する方向に、顔が存在するか、類似画像が存在するかという条件を緩和する方向に決めておくようにする。図10には、まずは3枚の類似する画像を表示するエフェクトが設定されたが、条件を満たさないので、次に2枚の類似する画像を表示するエフェクトが設定され、さらに条件を満たさないので、シンプルな1枚の画像を表示するエフェクトを設定する例が示されている。   FIG. 10 is an explanatory diagram showing an example of the reset effect. The effect to be reset is determined in a direction that reduces the number of photos, the number of necessary faces, and the number of necessary similar images in a direction that reduces the condition of whether there are faces or similar images. Like that. In FIG. 10, the effect of displaying three similar images is set first, but the condition is not satisfied. Therefore, the effect of displaying two similar images is set next, and further, the condition is not satisfied. An example of setting an effect for displaying a simple image is shown.

ただし、候補画像が期待されるエフェクトに必要な枚数に満たなかった場合にも、あえてエフェクトの再設定を行わないようにしてもよい。例えば、構図解析技術を用いて、実際にスライドショーで再生する際に、1枚の写真から、あたかも複数枚の写真が存在するかのように表現することも可能だからである。従って、必要な画像枚数に満たなくても、期待されるエフェクトを実現できるかどうかは画像特徴量を参照することによって調べることが可能である。構図解析技術を用いた表示範囲の切り出し方に関しては後述する。   However, even if the number of candidate images is less than the number required for the expected effect, the effect may not be reset. For example, using a composition analysis technique, it is possible to express as if there are a plurality of photos from one photo when actually reproducing in a slide show. Therefore, whether or not the expected effect can be realized even if the required number of images is not reached can be checked by referring to the image feature amount. A method of extracting the display range using the composition analysis technique will be described later.

スライドショー品質判定部122は、エフェクト設定部116で設定されたエフェクトや、画像選択部118で選択された画像から、スライドショー全体の品質を判定する。特に、エフェクト再設定判別部120でエフェクトが再設定させられると、スライドショー品質判定部122は、再設定されたエフェクトや、画像選択部118で選択された画像から、スライドショー全体の品質を再度判定する。   The slide show quality determination unit 122 determines the quality of the entire slide show from the effect set by the effect setting unit 116 and the image selected by the image selection unit 118. In particular, when the effect reset determination unit 120 resets the effect, the slide show quality determination unit 122 determines again the quality of the entire slide show from the reset effect and the image selected by the image selection unit 118. .

エフェクト再設定判別部120によって、上述したように個々のエフェクト区間のエフェクトを再設定した結果、前後のエフェクトの繋がりが悪くなったり、スライドショー全体で使用されるエフェクトに偏りが出てしまったり、使用される画像が少なくなりすぎてしまったりする可能性がある。その為、ひとつでもエフェクトの再設定を行った場合は、スライドショー品質判定部122は、例えば前後のエフェクトの繋がり、使用されるエフェクトの偏り、使用される画像枚数の母数に対する割合をチェックする。   As a result of the effect resetting determination unit 120 resetting the effects in the individual effect sections as described above, the effect of the connection between the previous and next effects becomes worse, and the effects used in the entire slide show are biased. There is a possibility that too few images will be displayed. Therefore, when at least one effect is reset, the slide show quality determination unit 122 checks, for example, the connection of the previous and subsequent effects, the bias of the used effect, and the ratio of the number of used images to the population.

スライドショー品質判定部122によって、前後のエフェクトのつながりが悪くなったと判定された場合は、エフェクトを再設定させることが可能だが、エフェクトを再設定させた場合は、再度同じチェックを行う。その結果、再設定されたエフェクトではスライドショーの品質を保てない(例えば、エフェクトが偏り過ぎている、使用される画像が母数に対して少なすぎる等)とスライドショー品質判定部122が判断した場合は、画像候補割り当て部110が割り当てた画像の割り当てを変更したり、さらにエフェクト区間設定部108にエフェクト区間の設定を変更させたりといった処理に戻させる。このように再帰的にスライドショーの作成を実行することで、画像処理装置100は楽曲と画像の最適な組み合わせを再帰的に決定してスライドショーの品質を向上させることができる。   If the slide show quality determination unit 122 determines that the connection between the previous and next effects has deteriorated, the effect can be reset, but if the effect is reset, the same check is performed again. As a result, when the slide show quality determination unit 122 determines that the slide show quality cannot be maintained with the reset effect (for example, the effect is too biased or the number of images used is too small with respect to the parameter). The process returns to the process of changing the image assignment assigned by the image candidate assignment unit 110 or causing the effect interval setting unit 108 to change the setting of the effect interval. By recursively creating a slide show in this way, the image processing apparatus 100 can recursively determine the optimal combination of music and images and improve the quality of the slide show.

画像選択部118は、再帰的に設定された、スライドショーにおけるエフェクト区間、適用される画像エフェクト、表示する画像の候補に基づいて、候補画像の中から画像エフェクトに応じて実際に表示される画像を選択する。   Based on the effect section in the slide show, the applied image effect, and the candidate for the image to be displayed, the image selection unit 118 selects an image actually displayed according to the image effect from the candidate images. select.

画像選択部118は、候補画像の中から必要な枚数の画像を選択する際に、エフェクトに応じて以下のような方法を用いても良い。
(1)候補画像内からランダム選択
(2)候補画像内から時系列に選択
(3)顔が存在する画像を優先して選択
(4)類似した画像を選択
The image selection unit 118 may use the following method according to the effect when selecting a required number of images from the candidate images.
(1) Random selection from candidate images (2) Select from candidate images in time series (3) Select images with faces preferentially (4) Select similar images

(1)候補画像内からランダム選択
この方法は、エフェクト内で複数枚の画像を表示する際に、選択された画像同士に特に関連性を持たせる必要がない場合に使用される。例えば、イントロやエンディングなどで、入力された全画像の中で多くの枚数を表示したい場合などに用いられる。
(1) Random selection from candidate images This method is used when a plurality of images are displayed in an effect and the selected images do not need to be particularly related to each other. For example, it is used when it is desired to display a large number of images among all input images by intro or ending.

(2)候補画像内から時系列に選択
この方法は、エフェクト内で複数枚の画像を表示する際に、なるべく撮影日時の離れた画像が選択したい場合に使用される。例えば画像選択部118は、候補画像の中から3枚の画像を選択したい場合、まず候補画像を撮影日時によって3分割し、それぞれの分割された画像群から1枚ずつ選択する。これにより、なるべく似たような場面が表示されないような画像を選択することが可能である。なお、画像を選択する際には、最も撮影日時の離れた画像を選択してもよいし、分割された画像群の中からランダムに選択してもよい。
(2) Selection in Time Series from Candidate Images This method is used when it is desired to select images that are as distant as possible when displaying a plurality of images in the effect. For example, when selecting three images from candidate images, the image selection unit 118 first divides the candidate image into three according to the shooting date and time, and selects one image from each of the divided image groups. As a result, it is possible to select an image in which a similar scene is not displayed as much as possible. When selecting an image, an image with the longest shooting date and time may be selected, or may be selected at random from the divided image group.

(3)顔が存在する画像を優先して選択
この方法は、顔にフォーカスしたエフェクトなどを利用する場合に用いられる。候補画像の中に必要な枚数の顔の存在する画像があった場合には、画像選択部118は、その中から必要な枚数だけ選択し、顔の存在する画像が必要な枚数に満たない場合は、顔の存在する画像に加えて、足りない枚数の画像を残りの画像から選択する。なお、画像選択部118は、画像を選択する際に、なるべく大きく顔の映った画像を選択してもよいし、顔の存在する画像の中から必要な枚数をランダムに選択してもよい。
(3) Preferentially selecting an image with a face This method is used when an effect focused on a face is used. When there is an image having a required number of faces in the candidate image, the image selection unit 118 selects only the required number from the images, and the image having the face is less than the required number Selects an insufficient number of images from the remaining images in addition to the image having the face. Note that when selecting an image, the image selection unit 118 may select an image with a face as large as possible, or may randomly select a required number of images from which a face exists.

(4)類似グループ内の連続した画像を選択
この方法は、あえて似た画像を表示したい場合に用いられる。例えばパラパラ漫画のように複数枚の画像が次々とめくられていくようなエフェクトがあった場合、カメラの連射機能などで撮影された画像を連続で表示すると効果的である。このようなエフェクトを実現する為に、画像選択部118は、画像解析結果により同じ類似グループに指定された画像群から、必要な枚数の撮影日時の連続した画像を選択する。もし必要な枚数以上の類似グループが存在しなかった場合には、画像選択部118は、画像候補の中で連続した画像を必要な枚数だけ選択してもよい。なお、どの類似グループを選択するかは、最も枚数の多い類似グループを使用してもよいし、ランダムな類似グループを選択してもよい
(4) Selecting consecutive images in similar group This method is used when it is desired to display similar images. For example, when there is an effect in which a plurality of images are flipped one after another like a flip book, it is effective to continuously display images taken by the continuous shooting function of the camera. In order to realize such an effect, the image selection unit 118 selects a necessary number of consecutive images with shooting dates and times from an image group designated as the same similar group based on the image analysis result. If there are no more similar groups than the required number, the image selection unit 118 may select the required number of consecutive images from among the image candidates. As for which similar group is selected, the similar group having the largest number of sheets may be used, or a random similar group may be selected.

図11は、画像選択部118が、上述の選択方法を用いて候補画像の中から画像を選択した例を示す説明図である。図11には2つの例が図示されている。1つ目の例は、画像選択対象のエフェクト区間で設定されたエフェクトが、画像から顔部分を切り出して表示する顔切り出しエフェクトである場合に、画像選択部118が、与えられた画像群から、顔の入った画像を選択し、その中で最も大きい顔をエフェクトで切り出すものである。また2つ目の例は、画像選択対象のエフェクト区間で設定されたエフェクトが、3枚の画像を連続して表示する3枚エフェクトである場合に、画像選択部118が、与えられた画像群から、最も似ている3枚の画像を選んで時系列順に表示するものである。   FIG. 11 is an explanatory diagram illustrating an example in which the image selection unit 118 selects an image from candidate images using the above-described selection method. FIG. 11 shows two examples. In the first example, when the effect set in the effect section of the image selection target is a face cutout effect that cuts out and displays a face part from an image, the image selection unit 118 performs the following operation from the given image group: It selects an image with a face and cuts out the largest face using an effect. In the second example, when the effect set in the effect section for image selection is a three-effect that displays three images in succession, the image selection unit 118 gives the given image group. The three most similar images are selected and displayed in chronological order.

このように画像選択部118は、候補画像の中から、画像選択対象のエフェクト区間において設定された画像エフェクトに適した画像を選択する。   As described above, the image selection unit 118 selects an image suitable for the image effect set in the image selection target effect section from the candidate images.

上述の、エフェクト設定部116による期待されるエフェクトの設定でも述べたが、画像選択部118、それぞれの画像選択方法を用いる際に、何らかのランダム要素を入れてもよい。ランダム要素が含まれることで、ユーザが何度もスライドショーを作成した場合に毎回違う写真が出現して、違った印象を与えることが可能になる。   As described above in the setting of the expected effect by the effect setting unit 116, some random elements may be inserted when using the image selection unit 118 and the respective image selection methods. By including a random element, when a user creates a slide show many times, a different photo appears each time and a different impression can be given.

表示範囲切り出し部124は、画像選択部118が選択した画像の表示範囲を切り出す。上述してきたように、それぞれのエフェクト区間において、表示したい画像と適用する画像エフェクトが決定したが、画像エフェクトの中には画像を一枚そのまま表示するだけでなく、特定のアスペクト比の領域に表示しなければならないケースがある。例えば、オリジナルでは4:3のアスペクト比の画像に対して、スライドショー再生時には16:9に表示しなければならない、もしくは4:3と3:4のアスペクト比で表示したい、といったような場合に、何らかの方法で元画像から必要な表示範囲を切り出す必要がある。   The display range cutout unit 124 cuts out the display range of the image selected by the image selection unit 118. As described above, in each effect section, the image to be displayed and the image effect to be applied have been determined. In the image effect, not only the image is displayed as it is, but also in the area of a specific aspect ratio. There are cases that must be done. For example, when the original 4: 3 aspect ratio image must be displayed at 16: 9 during slideshow playback, or you want to display 4: 3 and 3: 4 aspect ratios, It is necessary to cut out a necessary display range from the original image by some method.

特定のアスペクト比の領域に画像を表示しなければならない場合には、表示範囲切り出し部124は、構図解析技術を用いることによって、様々な条件で任意のアスペクト比の領域を切り出すことが可能である。図12は、表示範囲切り出し部124による表示範囲の切り出し例を示す説明図である。例えば図12に示すように、横長画像から縦長のアスペクト比の表示領域が必要になった場合、表示範囲切り出し部124は、選択された画像に顔が検出されている場合は、顔の位置や向きの情報を利用して最適な領域を切り出し、顔が検出されなかった場合は注目物体情報を利用して、同じく最適な領域を切り出すことができる。   When it is necessary to display an image in a specific aspect ratio region, the display range cutout unit 124 can cut out an arbitrary aspect ratio region under various conditions by using a composition analysis technique. . FIG. 12 is an explanatory diagram illustrating an example of the display range cutout by the display range cutout unit 124. For example, as illustrated in FIG. 12, when a display area having a vertically long aspect ratio is required from a horizontally long image, the display range clipping unit 124 determines the position of the face or the like when the face is detected in the selected image. The optimum area can be cut out using the orientation information, and when the face is not detected, the optimum area can be cut out using the target object information.

構図解析を利用した表示領域の切り出し方には、顔や注目領域を中心に切り出した日の丸構図、写真として一般的に美しい構図とされる3分割構図、顔や注目領域をなるべく大きく切り取るズームアップ、親子写真をきれいに見せる対角構図などがある。表示範囲切り出し部124は、これらの表示領域の切り出し方を用いて、テーマやエフェクトの種類に応じて様々な構図で切り出すことが可能である。   To cut out the display area using composition analysis, the Hinomaru composition cut out mainly on the face and the attention area, the three-part composition that is generally beautiful as a photograph, the zoom-up that cuts out the face and the attention area as much as possible, There is a diagonal composition that makes parent and child photos look beautiful. The display range cutout unit 124 can cut out with various compositions according to the theme and the type of effect, using the cutout method of these display areas.

また、上述したエフェクトの再設定において、候補画像の枚数が期待されるエフェクトに必要な枚数に満たない場合でも、あえてエフェクトの再設定を行わない場合があると述べた。この、候補画像の枚数が期待されるエフェクトに必要な枚数に満たない場合には、表示範囲切り出し部124が、構図解析技術を用いて画像を切り出すことによって、あたかも複数枚の写真が存在するかのようなエフェクトを実現することもできる。   Further, in the effect resetting described above, it has been stated that the effect resetting may not be performed even if the number of candidate images is less than the number required for the expected effect. If the number of candidate images is less than the number required for the expected effect, the display range cutout unit 124 cuts out the image using the composition analysis technique, so that it is as if there are a plurality of photos. It is also possible to achieve effects such as

図13は、表示範囲切り出し部124が、構図解析技術を用いて画像を切り出すことで、一枚の画像から複数枚の画像を使用するエフェクトを実現した例を示す説明図である。図13には、ある表示したいエフェクトには写真が2枚必要であるが、画像選択部118によって選択された画像は1枚だけである場合が例示されている。このような場合では、表示範囲切り出し部124は、構図解析技術を用いて1枚の画像から、子供が写っている部分と、両親が写っている部分とを切り出して、エフェクトに当てはめる。これにより、あたかも複数枚の写真が存在するかのようなエフェクトを実現することもできる。   FIG. 13 is an explanatory diagram illustrating an example in which the display range cutout unit 124 realizes an effect that uses a plurality of images from one image by cutting out an image using a composition analysis technique. FIG. 13 illustrates a case where two photos are required for an effect to be displayed, but only one image is selected by the image selection unit 118. In such a case, the display range cutout unit 124 uses a composition analysis technique to cut out a part in which a child is shown and a part in which parents are shown from one image and apply them to the effect. As a result, it is possible to realize an effect as if there are a plurality of photographs.

もちろん、特定のアスペクト比の領域に表示する必要が無いエフェクトである場合には、表示範囲切り出し部124による切り出し処理はスキップしてもよい。   Of course, in the case of an effect that does not need to be displayed in an area having a specific aspect ratio, the clipping process by the display range clipping unit 124 may be skipped.

タイミング調整部126は、エフェクトの表示タイミングを調整する。上述の説明で、各々のエフェクト区間において表示する画像と画像エフェクトが決定したので、タイミング調整部126は、その決定されたエフェクトの表示タイミングを調整する。各エフェクトは、例えば、特開2011−181103号公報において示されている、“show”、“start”、“end”、“hide”のパラメータを持っている。それぞれのパラメータの意味は以下の通りである。
・show…エフェクトの生存期間が開始し、初期状態を表示するタイミング
・start…主にエフェクトがアニメーションを開始するタイミング
・end…主にエフェクトがアニメーションを終了するタイミング
・hide…エフェクトの生存期間が終了し、破棄されるタイミング
The timing adjustment unit 126 adjusts the display timing of the effect. In the above description, since the image to be displayed and the image effect are determined in each effect section, the timing adjustment unit 126 adjusts the display timing of the determined effect. Each effect has parameters of “show”, “start”, “end”, and “hide” disclosed in Japanese Patent Application Laid-Open No. 2011-181103, for example. The meaning of each parameter is as follows.
・ Show… The timing when the effect lifetime starts and the initial state is displayed ・ start… The timing when the effect starts mainly animation ・ end… The timing when the effect ends animation ・ hid… The lifetime of the effect ends And when it is discarded

例えばタイミング調整部126は、start及びendをエフェクト区間の開始と終了に一致させ、showをstartの1拍前、hideをendの1拍後に設定することによって、それぞれのエフェクトが1拍分オーバーラップしながらアニメーションを行うような設定が可能である。   For example, the timing adjustment unit 126 sets start and end to coincide with the start and end of the effect section, sets the show one beat before the start, and sets the hide one beat after the end, so that each effect overlaps by one beat. It is possible to make settings such as animation.

図14は、タイミング調整部126によってパラメータが設定されたアニメーションの例を示す説明図である。図14に示した台形は、設定されたエフェクトにより画像が表示される様子を表している。つまり、showの時点で写真が出現し始め、startの時点で写真がはっきり表示され、startからendの間でエフェクトによるアニメーションが行われ、endからhideの間で写真が徐々に消え始め、hideの時点で写真が完全に消滅することを表している。   FIG. 14 is an explanatory diagram illustrating an example of an animation in which parameters are set by the timing adjustment unit 126. The trapezoid shown in FIG. 14 represents a state in which an image is displayed by a set effect. In other words, the photo starts to appear at the time of the show, the photo is clearly displayed at the time of the start, the animation with the effect is performed from the start to the end, the photo starts to gradually disappear from the end to the hide, It means that the photo disappears completely at that time.

また、エフェクトによっては(例えば、一つのエフェクト内で写真が次々とスライドしていくようなエフェクトでは)アニメーションのタイミングを任意に設定したいケースが存在する。タイミング調整部126は、このようなエフェクトに、キーフレームと呼ばれるパラメータを設定することができ、エフェクトにおけるアニメーションの細かいタイミング調整を行うことができる。   In addition, depending on the effect (for example, an effect in which photographs slide one after another in one effect), there are cases where it is desired to arbitrarily set the timing of the animation. The timing adjustment unit 126 can set a parameter called a key frame for such an effect, and can perform fine timing adjustment of the animation in the effect.

図15は、タイミング調整部126によってキーフレームのパラメータが設定されたアニメーションの例を示す説明図である。図15には、“keyframe1”の時点で写真のスライドを開始し、“keyframe2”の時点で写真のスライドを終了するよう設定されたエフェクトが示されている。   FIG. 15 is an explanatory diagram illustrating an example of an animation in which key frame parameters are set by the timing adjustment unit 126. FIG. 15 shows the effect set to start the slide of the photograph at the time “keyframe1” and to end the slide of the photograph at the time “keyframe2”.

スライドショー出力部128は、タイミング調整部126によってエフェクトの表示タイミングが調整されたスライドショーを1つのファイルに出力する。   The slide show output unit 128 outputs the slide show whose effect display timing is adjusted by the timing adjustment unit 126 to one file.

タイミング調整部126までで、スライドショーを実現するための基本的な情報は全て準備が完了したが、画像処理装置100は、スライドショー出力部128でスライドショーを1つのファイルに出力する前に、スライドショーを装飾する情報の設定を行ってもよい。例えば、スライドショーで使用されている写真の主要色を検出することによって、設定されたテーマによっては独特の表現を行うことができる。この色検出はスライドショー出力部128で行なっても良い。   All the basic information for realizing the slide show has been prepared up to the timing adjustment unit 126, but the image processing apparatus 100 decorates the slide show before outputting the slide show to one file by the slide show output unit 128. Information to be set may be set. For example, by detecting the main colors of the photos used in the slide show, a unique expression can be performed depending on the set theme. This color detection may be performed by the slide show output unit 128.

図16は、スライドショーを装飾する情報の設定例を示す説明図である。図16に示した例は、各エフェクト区間で使用されている写真群の主要色を推定し、その主要色に合わせて光源の色合いを変化させることで、スライドショーの見栄えを向上させることを実現している。例えば、図16の左側の写真では、主に赤色が多く使われているので、スライドショー出力部128は、当該区間においては赤色を代表色として検出し、赤色を光源とするようなエフェクトとする。また例えば、図16の右側の写真では、主に緑色が多く使われているので、スライドショー出力部128は、当該区間においては緑色を代表色として検出し、緑色を光源とするようなエフェクトとする。   FIG. 16 is an explanatory diagram illustrating an example of setting information for decorating a slide show. In the example shown in FIG. 16, it is possible to improve the appearance of the slide show by estimating the main colors of the photo group used in each effect section and changing the color of the light source according to the main colors. ing. For example, in the photograph on the left side of FIG. 16, since red is mainly used, the slide show output unit 128 detects red as a representative color and uses red as a light source in the section. Further, for example, in the photograph on the right side of FIG. 16, since green is mainly used, the slide show output unit 128 detects the green color as a representative color in the section and uses green as the light source. .

以上、本開示の一実施形態にかかる画像処理装置100の構成について説明した。次に、本開示の一実施形態にかかる画像処理装置100の動作について説明する。   The configuration of the image processing apparatus 100 according to an embodiment of the present disclosure has been described above. Next, the operation of the image processing apparatus 100 according to an embodiment of the present disclosure will be described.

[画像処理装置の動作]
図17は、本開示の一実施形態にかかる画像処理装置100の動作を示す流れ図である。図17に示した流れ図は、本開示の一実施形態にかかる画像処理装置100がスライドショーを生成する際の動作を示したものである。以下、図17を用いて本開示の一実施形態にかかる画像処理装置100の動作について説明する。
[Operation of image processing apparatus]
FIG. 17 is a flowchart illustrating an operation of the image processing apparatus 100 according to an embodiment of the present disclosure. The flowchart illustrated in FIG. 17 illustrates an operation when the image processing apparatus 100 according to an embodiment of the present disclosure generates a slide show. Hereinafter, the operation of the image processing apparatus 100 according to an embodiment of the present disclosure will be described with reference to FIG.

画像処理装置100がスライドショーを生成する際には、画像処理装置100は、まず楽曲メタデータ保持部104に保存されている楽曲メタデータを用いて、スライドショーの表示の際に再生される楽曲の再生区間の切り出しを行う(ステップS101)。再生区間の切り出しは再生区間選択部106が実行する。   When the image processing apparatus 100 generates a slide show, the image processing apparatus 100 first uses the music metadata stored in the music metadata holding unit 104 to reproduce the music that is reproduced when the slide show is displayed. A section is cut out (step S101). The playback segment selection unit 106 executes the segmentation of the playback segment.

上記ステップS101で楽曲の再生区間の切り出しを行うと、続いて画像処理装置100は、楽曲の再生区間からエフェクト区間を設定する(ステップS102)。エフェクト区間の設定はエフェクト区間設定部108が実行する。   When the music playback section is cut out in step S101, the image processing apparatus 100 subsequently sets an effect section from the music playback section (step S102). The effect section setting unit 108 executes setting of the effect section.

上記ステップS102でエフェクト区間の設定を行うと、続いて画像処理装置100は、上記ステップS102で設定したエフェクト区間の数が足りているかどうかを判断する(ステップS103)。この処理はエフェクト区間設定部108が実行し、エフェクト区間の数が足りているかどうかは、エフェクト区間の数が、画像総数に対して一定の割合以上であるかどうかで判断しても良い。   When the effect section is set in step S102, the image processing apparatus 100 determines whether the number of effect sections set in step S102 is sufficient (step S103). This process is executed by the effect section setting unit 108, and whether or not the number of effect sections is sufficient may be determined by whether or not the number of effect sections is equal to or greater than a certain ratio with respect to the total number of images.

上記ステップS103の判断の結果、エフェクト区間の数が足りている場合には、続いて画像処理装置100は、上記ステップS102で設定したエフェクト区間に対して画像候補を割り当てる(ステップS104)。画像候補の割り当ては画像候補割り当て部110が行い、画像メタデータ保持部114に保持されている画像メタデータを用いて、エフェクト区間に対して画像候補を割り当てる。   If the result of determination in step S103 is that the number of effect sections is sufficient, then the image processing apparatus 100 assigns image candidates to the effect sections set in step S102 (step S104). The image candidate assignment is performed by the image candidate assignment unit 110, and the image candidate is assigned to the effect section using the image metadata held in the image metadata holding unit 114.

上記ステップS104でエフェクト区間に対して画像候補を割り当てると、続いて画像処理装置100は、設定された個々のエフェクト区間に対して期待されるエフェクト(期待エフェクト)を設定する(ステップS105)。個々のエフェクト区間への期待エフェクトの設定はエフェクト設定部116が実行する。   When image candidates are assigned to the effect sections in step S104, the image processing apparatus 100 subsequently sets expected effects (expected effects) for the set individual effect sections (step S105). The effect setting unit 116 executes setting of an expected effect for each effect section.

上記ステップS105で個々のエフェクト区間へ期待エフェクトを設定すると、続いて画像処理装置100は、全てのエフェクト区間に対して、設定された期待エフェクトを割り当てられた画像で実現可能かどうかを判断する(ステップS106)。この実現可能かどうかの判断はエフェクト再設定判別部120が実行する。   When the expected effect is set for each effect section in step S105, the image processing apparatus 100 determines whether or not the set expected effect can be realized for all the effect sections with the assigned image (see FIG. Step S106). The effect reset determination unit 120 determines whether this can be realized.

上記ステップS106の判断の結果、実現可能でないエフェクトが存在していれば、画像処理装置100はその実現可能でないエフェクトが設定されたエフェクト区間に対してエフェクトの再設定を行う(ステップS107)。このエフェクトの再設定はエフェクト設定部116が実行する。   If it is determined in step S106 that there is an effect that cannot be realized, the image processing apparatus 100 resets the effect for the effect section in which the effect that cannot be realized is set (step S107). This effect resetting is executed by the effect setting unit 116.

全てのエフェクト区間に対して実現可能でないエフェクトが存在しなくなれば、続いて画像処理装置100は、上記ステップS107のエフェクトの再設定をしたかどうかを判断する(ステップS108)。このエフェクトの再設定をしたかどうかの判断はスライドショー品質判定部122が実行する。   If there are no unrealizable effects for all effect sections, the image processing apparatus 100 subsequently determines whether or not the effects have been reset in step S107 (step S108). The slide show quality judgment unit 122 determines whether or not the effect has been reset.

上記ステップS108の判断の結果、上記ステップS107のエフェクトの再設定をしていなければ、続いて画像処理装置100は、各エフェクト区間で設定されたエフェクトにより表示される画像を選択する(ステップS109)。この表示画像の選択は画像選択部118が実行する。   If it is determined in step S108 that the effect in step S107 has not been reset, the image processing apparatus 100 subsequently selects an image displayed by the effect set in each effect section (step S109). . This display image selection is executed by the image selection unit 118.

上記ステップS109で、各エフェクト区間で設定されたエフェクトにより表示される画像を選択すると、続いて画像処理装置100は、上記ステップS109で選択した画像の切り出し領域を設定する(ステップS110)。選択した画像の切り出し領域の設定は表示範囲切り出し部124が実行する。なお、上記ステップS109で選択した画像の表示範囲を切り出す必要がなければ、ステップS110の処理はスキップしてもよい。   When the image displayed by the effect set in each effect section is selected in step S109, the image processing apparatus 100 subsequently sets the cutout area of the image selected in step S109 (step S110). The display range cutout unit 124 sets the cutout area of the selected image. If it is not necessary to cut out the display range of the image selected in step S109, the process in step S110 may be skipped.

上記ステップS110で画像の切り出し領域を設定すると、続いて画像処理装置100は、設定されたエフェクト区間、各エフェクト区間において設定されたエフェクト、各エフェクトで選択された画像を用いて、スライドショーを生成する(ステップS111)。スライドショーの生成はスライドショー出力部128が実行し、スライドショーとして出力するファイル形式は任意のファイル形式を用いることができる。なお画像処理装置100は、ステップS111のスライドショーの生成処理の前に、エフェクトの表示タイミングの調整を行なっても良い。このエフェクトの表示タイミングの調整はタイミング調整部126が実行する。   When the image clipping region is set in step S110, the image processing apparatus 100 subsequently generates a slide show using the set effect sections, the effects set in each effect section, and the images selected in each effect. (Step S111). The slide show is generated by the slide show output unit 128, and any file format can be used as the file format to be output as the slide show. Note that the image processing apparatus 100 may adjust the display timing of the effect before the slide show generation process in step S111. The adjustment of the display timing of this effect is executed by the timing adjustment unit 126.

一方、上記ステップS108の判断の結果、上記ステップS107のエフェクトの再設定を一度でも実行していれば、続いて画像処理装置100は、前後関係によるエフェクトの再設定を実行する(ステップS112)。具体的には、スライドショー品質判定部122がスライドショー全体を見て、再生区間選択部106、エフェクト区間設定部108、画像候補割り当て部110,エフェクト設定部116に再設定を指示する。   On the other hand, as a result of the determination in step S108, if the effect resetting in step S107 has been executed even once, the image processing apparatus 100 subsequently executes effect resetting according to the context (step S112). Specifically, the slide show quality determination unit 122 looks at the entire slide show and instructs the playback section selection unit 106, the effect section setting unit 108, the image candidate assignment unit 110, and the effect setting unit 116 to perform resetting.

上記ステップS112で前後関係によるエフェクトの再設定を実行すると、続いて画像処理装置100は、使用しているエフェクトに偏りがあるかどうかを判断する(ステップS113)。このエフェクトに偏りがあるかどうかの判断はスライドショー品質判定部122が実行し、例えば類似の効果を出すようなエフェクトが連続して使用されているか、顔をクローズアップするようなエフェクトが連続して使用されているか、等の判断基準を用いてエフェクトに偏りがあるかどうかを判断する。   When the effect resetting according to the context is executed in step S112, the image processing apparatus 100 subsequently determines whether the effect being used is biased (step S113). The slide show quality determination unit 122 determines whether or not the effect is biased. For example, an effect that produces a similar effect is continuously used, or an effect that closes up the face is continuously used. It is determined whether the effect is biased by using a criterion such as whether it is used.

上記ステップS113の判断の結果、使用しているエフェクトに偏りがないと判断すると、続いて画像処理装置100は、スライドショーの作成のために画像処理装置100に入力された画像をある一定の割合以上使用出来ているかどうかを判断する(ステップS114)。この判断はスライドショー品質判定部122が実行する。なお本開示では、このステップS114の判断処理はスキップしても良い。   As a result of the determination in step S113, when it is determined that there is no bias in the effect being used, the image processing apparatus 100 subsequently determines that the images input to the image processing apparatus 100 for creating a slide show have a certain ratio or more. It is determined whether it can be used (step S114). This determination is performed by the slide show quality determination unit 122. In the present disclosure, the determination process in step S114 may be skipped.

上記ステップS114の判断の結果、画像をある一定の割合以上使用出来ていると判断すると、画像処理装置100はステップS109の表示画像選択処理に移行する。一方、上記ステップS113の判断の結果、使用しているエフェクトに偏りがあると判断した場合、または、上記ステップS114の判断の結果、画像をある一定の割合以上使用出来ていないと判断した場合は、画像処理装置100は、画像候補をエフェクト区間に再割り当て済みかどうかを判断する(ステップS115)。画像候補をエフェクト区間に再割り当て済みでなければ、画像処理装置100は、ステップS104の画像候補割り当て処理以降の処理を実行する。一方、画像候補をエフェクト区間に再割り当て済みであれば、画像処理装置100は、エフェクト区間が再設定済みかどうかを判断する(ステップS116)。エフェクト区間が再設定済みであれば、画像処理装置100はステップS101の再生区間の切り出し処理以降の処理を、再設定済みでなければ、ステップS102のエフェクト区間の設定処理以降の処理を、それぞれ実行する。   As a result of the determination in step S114, if it is determined that the image can be used more than a certain ratio, the image processing apparatus 100 proceeds to the display image selection process in step S109. On the other hand, if it is determined that the effect being used is biased as a result of the determination in step S113, or if it is determined that the image cannot be used more than a certain percentage as a result of the determination in step S114. The image processing apparatus 100 determines whether the image candidate has been reassigned to the effect section (step S115). If the image candidate has not been reassigned to the effect section, the image processing apparatus 100 executes processing subsequent to the image candidate assignment processing in step S104. On the other hand, if the image candidate has been reassigned to the effect section, the image processing apparatus 100 determines whether or not the effect section has been reset (step S116). If the effect section has been reset, the image processing apparatus 100 executes the processing after the playback section cut-out processing in step S101. If the effect section has not been reset, the image processing apparatus 100 executes the processing after the effect section setting processing in step S102. To do.

このように、本開示の一実施形態にかかる画像処理装置100は、スライドショーにあわせて再生する楽曲の再生区間の選択、エフェクト区間の設定、画像候補の割り当て、エフェクトの設定、エフェクトで表示する画像の選択を再帰的に自動実行することで、スライドショーの品質を向上させることが可能になる。   As described above, the image processing apparatus 100 according to the embodiment of the present disclosure selects a playback section of music to be played in accordance with a slide show, sets an effect section, assigns image candidates, sets an effect, and displays an image with an effect. It is possible to improve the quality of the slide show by recursively executing the selection.

[楽曲解析の結果を用いたエフェクト区間やエフェクトの設定]
ここで、楽曲解析の結果を用いたエフェクト区間やエフェクトの設定処理について、さらに例を挙げて説明する。本実施形態にかかる画像処理装置100は、上述したように楽曲解析の結果を用いてエフェクト区間の設定やエフェクトの設定を行なっている。
[Effect section and effect settings using music analysis results]
Here, an effect section and effect setting processing using the result of music analysis will be described with further examples. As described above, the image processing apparatus 100 according to the present embodiment performs setting of effect sections and effects using the result of music analysis.

エフェクト区間設定部108は、楽曲解析の結果得られる、楽曲のキーとコード進行から、ノンダイアトニックコード、ドミナント終止、コードが頻繁に切り替わる位置を検出し、その時間情報を取得する。またエフェクト区間設定部108は、楽曲解析の結果から部分転調位置や転調位置についても取得する。   The effect section setting unit 108 detects a non-diatonic chord, a dominant end, and a position where chords are frequently switched from the music key and chord progression obtained as a result of the music analysis, and acquires time information thereof. The effect section setting unit 108 also acquires a partial modulation position and a modulation position from the result of music analysis.

エフェクト設定部116は、楽曲解析の結果から、スライドショーに合わせて再生される楽曲が長調か短調かを判別し、テーマを選択する。エフェクト設定部116は、その曲調の判別結果から、複数のエフェクトからなるエフェクト候補を選択する。例えばエフェクト設定部116は、長調の楽曲であれば明るいエフェクト群を、短調の楽曲であれば暗いエフェクト群を選択する。なお画像処理装置100は、各エフェクトに対し、予めどの特徴に似合うものかどうかをパラメータとして付与し、そのパラメータを保持しておく。   The effect setting unit 116 determines whether the music to be played in accordance with the slide show is major or minor from the result of the music analysis, and selects a theme. The effect setting unit 116 selects an effect candidate including a plurality of effects from the determination result of the music tone. For example, the effect setting unit 116 selects a bright effect group for major music and a dark effect group for minor music. Note the image processing apparatus 100, for each effect, impart whether the look in advance which feature as a parameter, holds the parameters.

そしてエフェクト設定部116は、特徴に似合うエフェクトを、エフェクト候補の中から選択し、適切な時間やタイミングでそのエフェクトが実行されるように設定する。   Then, the effect setting unit 116 selects an effect suitable for the feature from the effect candidates, and sets the effect to be executed at an appropriate time and timing.

図18は、本実施形態にかかる画像処理装置100が、楽曲に合わせたエフェクトを選択する例を示す説明図である。図18では、スライドショーに合わせて再生される楽曲を解析した結果、キーがCメジャーコードであり、コードがF→G7→Gsus4→G7→Cと変化していることが分かった場合について示している。   FIG. 18 is an explanatory diagram illustrating an example in which the image processing apparatus 100 according to the present embodiment selects an effect according to music. FIG. 18 shows a case where, as a result of analyzing the music reproduced in accordance with the slide show, it is found that the key is the C major code and the code changes from F → G7 → Gsus4 → G7 → C. .

図18に示した楽曲例では、珍しいGsus4がノンダイアトニックコードとして使用されており、このコードが使われる小節は印象的なフレーズを持つ小節である。従って画像処理装置100は、このGsus4が使われているエフェクト区間では、スライドショーを見る人の印象に残りやすいエフェクト選択する。   In the example of music shown in FIG. 18, an unusual Gsus4 is used as a non-diatonic chord, and a measure in which this chord is used is a measure having an impressive phrase. Therefore, the image processing apparatus 100 selects an effect that is likely to remain in the impression of the person who sees the slide show in the effect section in which the Gsus 4 is used.

また図18に示した楽曲例では、ノンダイアトニックコードの後、G7(V)→C(I)とコードが4度進行して終止形となるドミナント終止が使われている。ドミナント終止は、終止感を視聴者に与えるコード進行なので、スライドショーでも決めとなるエフェクトを用いると効果的である。従って画像処理装置100は、G7が使われているエフェクト区間では3枚の写真を使用するエフェクトを用いて、Cが使われているエフェクト区間では1枚の写真をしっかり見せるエフェクトを用いる。   In the example of music shown in FIG. 18, after a non-diatonic chord, a dominant end is used in which the chord advances four times from G7 (V) → C (I) and ends. Dominant termination is a chord progression that gives viewers a sense of termination, so it is effective to use a definite effect in a slideshow. Accordingly, the image processing apparatus 100 uses an effect that uses three photographs in the effect section in which G7 is used, and uses an effect that firmly shows one photograph in the effect section in which C is used.

別の例を示す。図19は、本実施形態にかかる画像処理装置100が、楽曲に合わせたエフェクトを選択する例を示す説明図である。図19では、スライドショーに合わせて再生される楽曲を解析した結果、キーがCメジャーコードであり、コードがF→G7→C→Bm7b5→E7→Am→Cと変化していることが分かった場合について示している。   Another example is shown. FIG. 19 is an explanatory diagram illustrating an example in which the image processing apparatus 100 according to the present embodiment selects an effect according to music. In FIG. 19, as a result of analyzing the music to be played back in accordance with the slide show, it is found that the key is the C major code and the code changes from F → G7 → C → Bm7b5 → E7 → Am → C. Shows about.

図19に示した楽曲例では、Amに部分転調している。Amは切ない印象を与えるコードであるので、画像処理装置100は、このBm7b5→E7→Am→Cとコードが進行するエフェクト区間にモノクロームで表示するエフェクトを設定する。これにより、Amに部分転調している部分において、スライドショーに切ないイメージを割り当てることができる。   In the example of music shown in FIG. 19, partial modulation is made to Am. Since Am is a code that gives an inseparable impression, the image processing apparatus 100 sets an effect to be displayed in monochrome in an effect section in which the code advances in the order Bm7b5 → E7 → Am → C. As a result, it is possible to assign an unsatisfactory image to the slide show in the part that is partially modulated to Am.

このように、コード進行に応じて適切なエフェクトを設定することで、本実施形態にかかる画像処理装置100は、曲調に合ったエフェクトで写真が表示されるスライドショーを作成することができる。なお、上述したように、コード進行に応じて適切なエフェクトを設定するためには、画像処理装置100は、各エフェクトに対し、予めどの特徴に似合うものかどうかをパラメータとして付与し、そのパラメータを保持しておく。   Thus, by setting an appropriate effect according to the chord progression, the image processing apparatus 100 according to the present embodiment can create a slide show in which photos are displayed with an effect that matches the tune. As described above, in order to set the appropriate effect in accordance with the chord progression, the image processing apparatus 100, for each effect, impart whether the look in advance which feature as a parameter, the parameter Keep it.

図20は、曲調とエフェクトとの対応関係の一例を示す説明図である。このように、楽曲の特徴と、エフェクトとの対応関係をパラメータとして付与し、そのパラメータを保持しておくことで、画像処理装置100は、曲調に合ったエフェクトで写真が表示されるスライドショーを作成することができる。   FIG. 20 is an explanatory diagram illustrating an example of a correspondence relationship between a tune and an effect. Thus, by assigning the correspondence between music features and effects as parameters and holding the parameters, the image processing apparatus 100 creates a slide show in which photos are displayed with effects that match the music. can do.

例えば、短いタイミングで(小節単位等で)コードが頻繁に切り替わるような部分には、興味を引き付けるエフェクトが用いられるように、パラメータがエフェクトに付与される。また例えば、ドミナント終止となる部分には、動きのあるエフェクト、及び1枚をしっかり見せる決めのエフェクト動きのあるエフェクト、及び1枚をしっかり見せる決めのエフェクトが用いられるように、パラメータがエフェクトに付与される。   For example, a parameter is given to an effect so that an effect that attracts interest is used in a portion where a chord frequently switches at a short timing (eg, in bar units). Also, for example, in the part where the dominant ends, a parameter is given to the effect so that a moving effect, an effect that makes it possible to see one piece firmly, and an effect that makes one piece look good are used. Is done.

次に、部分転調の検出例を説明する。図21は、画像処理装置100による部分転調の検出例を示す説明図である。コードは通常、トニック、サブドミナント、ドミナントを循環し、キーがCメジャーコードであれば、トニックはC、Em、Am、サブドミナントはDm、F、ドミナントはG7、Bm(−5)である。またキーがAm(Aマイナーコード)であれば、トニックはAm、C、サブドミナントはDm、Bm(−5)、F、G7、ドミナントはEmである。   Next, a detection example of partial modulation will be described. FIG. 21 is an explanatory diagram illustrating an example of partial modulation detected by the image processing apparatus 100. If the code normally circulates tonic, subdominant, dominant, and the key is a C major chord, then the tonic is C, Em, Am, the subdominant is Dm, F, and the dominant is G7, Bm (−5). If the key is Am (A minor code), the tonic is Am, C, the sub-dominant is Dm, Bm (−5), F, G7, and the dominant is Em.

ここで、F→G7→C→Bm(−5)→Em→Am→Cと変化すると、C→Bm(−5)のところでAmに部分転調していることが分かる。キーがCメジャーコードであれば、サブドミナントはFなのでFに進行するはずが、キーがAmのときのサブドミナントであるBm(−5)に進行しているからである。   Here, when F → G7 → C → Bm (−5) → Em → Am → C, it can be seen that partial modulation of Am occurs at C → Bm (−5). If the key is a C major chord, since the subdominant is F, it should proceed to F, but proceed to Bm (−5), which is a subdominant when the key is Am.

図22は、画像処理装置100による部分転調の別の検出例を示す説明図である。キーがAm(Aマイナーコード)で、メロディックマイナースケールの場合では、トニックはAm、C(+5)、F#m(−5)、サブドミナントはDm、Bm、ドミナントはEm,G#m(−5)である。   FIG. 22 is an explanatory diagram illustrating another detection example of partial modulation by the image processing apparatus 100. If the key is Am (A minor code) and the melodic minor scale, the tonic is Am, C (+5), F # m (-5), the subdominant is Dm, Bm, the dominant is Em, G # m ( -5).

ここで、F→G7→C→E7→Amと変化すると、C→E7のところでAmに部分転調していることが分かる。そして、図22に示した例では、画像処理装置100は切ないイメージとなる部分転調を検出できる。   Here, when F → G7 → C → E7 → Am, it can be seen that partial modulation is performed to Am at C → E7. In the example illustrated in FIG. 22, the image processing apparatus 100 can detect partial modulation that results in a cut image.

本実施形態にかかる画像処理装置100は、自動的に、明るい曲にはポップなエフェクト、暗い曲にはノスタルジックなエフェクトなど、任意の曲の曲調でエフェクトを選択することができる。例えば画像処理装置100は、曲を聴いていて印象的な旋律となるノンダイアトニックコードを使用したビート間では、印象的なエフェクトを選択することができ、その後はサビの区間になりやすいので、サビの区間になるようであれば、期待感を煽って、サビの区間で終止するような映像演出効果を選択することができる。   The image processing apparatus 100 according to the present embodiment can automatically select an effect based on the tone of an arbitrary song, such as a pop effect for a bright song and a nostalgic effect for a dark song. For example, the image processing apparatus 100 can select an impressive effect between beats using a non-diatonic chord that is an impressive melody while listening to a song, and after that it tends to be a chorus section. If it becomes a chorus section, it is possible to select a video effect that ends in the chorus section with expectation.

本実施形態にかかる画像処理装置100は、楽曲解析によって終止感のある部分を検出できるので、落ち着く和音の小節では、動きが少なく、写真一枚をじっくりと見せる、決めとなるようなエフェクトを割り当てて引き締めるなど、スライドショーにメリハリを出すことができる。   Since the image processing apparatus 100 according to the present embodiment can detect a part with a sense of end by music analysis, a definite effect that assigns a certain amount of chords with less movement and a single photo is assigned. You can make the slide show sharper.

本実施形態にかかる画像処理装置100は、楽曲解析によって部分転調や転調といった、感動的に盛り上げている曲の部分が検出できるため、楽曲の盛り上がりに合わせて映像も同時に盛り上げたり、スライドショーの一番の見せ場になったりするエフェクトを選択することができる。   Since the image processing apparatus 100 according to the present embodiment can detect a part of a song that is moving up, such as partial modulation or modulation, by music analysis, the video can be excited at the same time as the music swells. You can select an effect that will be used as a showcase.

また、本実施形態にかかる画像処理装置100は、楽曲解析によってビート単位でコードが頻繁に変化する小節も検出できるので、そのような小節では、次々と写真が切り替わるような切り替わりの激しいエフェクトをつけて、曲と映像効果をマッチさせることができる。   In addition, the image processing apparatus 100 according to the present embodiment can detect bars in which chords frequently change in units of beats by music analysis. Therefore, in such a bar, an effect of intense switching such that photographs are switched one after another is applied. Can match music and video effects.

<2.まとめ>
以上説明したように本開示の一実施形態にかかる画像処理装置100は、楽曲を解析して得られる楽曲メタデータからエフェクト区間及びそのエフェクト区間に適したエフェクトを設定する。そのエフェクト区間の設定に際しては、画像処理装置100は、楽曲中の特徴的な箇所を抽出する。そして画像処理装置100は、それぞれのエフェクト区間に画像データを割り当てると共に、割り当てた画像データがエフェクトの条件を満たしているかどうかを判断し、満たしていればエフェクトで表示する画像を決定し、満たしていなければ、画像データの割り当て、エフェクトの設定、エフェクト区間の設定と再帰的に最設定する。
<2. Summary>
As described above, the image processing apparatus 100 according to an embodiment of the present disclosure sets an effect section and an effect suitable for the effect section from music metadata obtained by analyzing the music. When setting the effect section, the image processing apparatus 100 extracts a characteristic portion in the music. Then, the image processing apparatus 100 assigns image data to each effect section, determines whether the assigned image data satisfies the effect condition, and determines an image to be displayed by the effect if it satisfies the condition. If not, it is recursively set with image data assignment, effect setting, and effect section setting.

またエフェクトの設定をやり直すと、画像処理装置100は、エフェクトを再設定したエフェクト区間と、エフェクトを再設定していない他のエフェクト区間との間で、エフェクトの整合性を判断する。画像処理装置100は、エフェクトの整合性の判断の結果、整合が取れていないエフェクト区間があれば、整合が取れるようにエフェクトをさらに最設定する。   When the effect setting is performed again, the image processing apparatus 100 determines the consistency of the effect between the effect section in which the effect is reset and another effect section in which the effect is not reset. If there is an effect section that is not matched as a result of determining the consistency of the effect, the image processing apparatus 100 further sets the effect so that the matching is achieved.

これにより、本開示の一実施形態にかかる画像処理装置100は、楽曲を解析して得られる楽曲メタデータと、画像データを解析してられる画像メタデータとからスライドショーを自動生成することが出来ると共に、生成されるスライドショーの品質を向上させることができる。   Accordingly, the image processing apparatus 100 according to an embodiment of the present disclosure can automatically generate a slide show from music metadata obtained by analyzing music and image metadata obtained by analyzing image data. The quality of the generated slide show can be improved.

なお、上述した本開示の一実施形態にかかる画像処理装置100の動作は、ハードウェアによって行われてもよく、ソフトウェアによって行われてもよい。ソフトウェアによって行われる場合には、例えば画像処理装置100に設けられるCPUその他の制御装置が、画像処理装置100の内部に設けられたROM等の記録媒体に保存されたコンピュータプログラムを読み出して順次実行することによって行われるようにしても良い。   Note that the operation of the image processing apparatus 100 according to the embodiment of the present disclosure described above may be performed by hardware or software. When performed by software, for example, a CPU or other control device provided in the image processing apparatus 100 reads out and sequentially executes computer programs stored in a recording medium such as a ROM provided in the image processing apparatus 100. It may be performed depending on the situation.

また、上述した本開示の一実施形態にかかる画像処理装置100の各構成要素は、それぞれのハードウェアがネットワークを介して互いに情報を送受信できるならば、いずれのハードウェアに実装されてもよい。また、ある処理部により実施される処理が、1つのハードウェアにより実現されてもよいし、複数のハードウェアによる分散処理により実現されてもよい。   In addition, each component of the image processing apparatus 100 according to the embodiment of the present disclosure described above may be mounted on any hardware as long as each hardware can transmit and receive information to and from each other via a network. Further, a process performed by a certain processing unit may be realized by a single piece of hardware, or may be realized by a distributed process using a plurality of pieces of hardware.

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。   The preferred embodiments of the present disclosure have been described in detail above with reference to the accompanying drawings, but the present disclosure is not limited to such examples. It is obvious that a person having ordinary knowledge in the technical field to which the present disclosure belongs can come up with various changes or modifications within the scope of the technical idea described in the claims. Of course, it is understood that these also belong to the technical scope of the present disclosure.

なお、本技術は以下のような構成も取ることができる。
(1)
画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定部と、
前記エフェクト区間設定部が設定した前記複数のエフェクト区間のそれぞれに対して前記画像データを割り当てる画像割り当て部と、
前記エフェクト区間設定部が設定した前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定部と、
前記エフェクト設定部が前記複数のエフェクト区間のそれぞれに対して設定したエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当て部が割り当てた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、前記エフェクト設定部に当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別部と、
前記エフェクト再設定判別部により前記エフェクト設定部がエフェクトを再設定すると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断部と、
を備える、画像処理装置。
(2)
前記エフェクト区間設定部は、前記画像データの表示の際に再生される楽曲データを解析して得られる楽曲メタデータを用いてエフェクト区間を設定する、前記(1)に記載の画像処理装置。
(3)
前記エフェクト区間設定部は、前記楽曲メタデータから特徴的な区間を抽出し、当該区間をエフェクト区間として設定する、前記(2)に記載の画像処理装置。
(4)
前記エフェクト設定部は、前記画像データの表示の際に再生される楽曲データを解析して得られる楽曲メタデータを用いてエフェクトを設定する、前記(1)から(3)のいずれかに記載の情報処理装置。
(5)
前記エフェクト設定部は、前記エフェクト区間設定部が設定したエフェクト区間で再生される前記楽曲データの特徴に合わせたエフェクトを選択する、前記(4)に記載の画像処理装置。
(6)
前記整合性判断部は、エフェクトが再設定されたエフェクト区間と他の前記エフェクト区間との間の整合性が取れていない場合は、前記エフェクト設定部にエフェクトを再設定させる、前記(1)から(5)に記載の画像処理装置。
(7)
前記整合性判断部は、前記エフェクト設定部にエフェクトを再設定させても全てのエフェクト区間において整合性が取れない場合は、前記画像割り当て部に画像データを割り当て直させる、前記(6)に記載の画像処理装置。
(8)
前記整合性判断部は、前記エフェクト設定部にエフェクトを再設定させても全てのエフェクト区間において整合性が取れない場合は、前記エフェクト区間設定部にエフェクト区間を再設定させる、前記(6)または(7)に記載の画像処理装置。
(9)
前記画像データの表示の際に再生される楽曲データの再生区間を選択する再生区間選択部をさらに備え、
前記整合性判断部は、前記エフェクト設定部にエフェクトを再設定させても全てのエフェクト区間において整合性が取れない場合は、前記画像データの表示の際に再生される楽曲データの再生区間を前記再生区間選択部に変更させる、前記(6)から(8)のいずれかに記載の画像処理装置。
(10)
前記エフェクト設定部が設定したエフェクトにより当該エフェクト区間に表示させる画像を、前記画像割り当て部が当該エフェクト区間に割り当てた画像の中から選択する画像選択部をさらに備える、前記(1)から(9)のいずれかに記載の画像処理装置。
(11)
前記画像データを解析して得られる画像メタデータを保持する画像メタデータ保持部をさらに備える、前記(1)から(10)のいずれかに記載の画像処理装置。
(12)
前記画像データの表示の際に再生される楽曲データを解析して得られる楽曲メタデータを保持する楽曲メタデータ保持部をさらに備える、前記(1)から(11)のいずれかに記載の画像処理装置。
(13)
画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定ステップと、
前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対して画像データを割り当てる画像割り当てステップと、
前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定ステップと、
前記エフェクト設定ステップで前記複数のエフェクト区間のそれぞれに対して設定されたエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当てステップで割り当てられた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別ステップと、
前記エフェクト再設定判別ステップにより前記エフェクト設定ステップでエフェクトが再設定されると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断ステップと、
を備える、画像処理方法。
(14)
コンピュータに、
画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定ステップと、
前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定ステップと、
前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対して画像データを割り当てる画像割り当てステップと、
前記エフェクト設定ステップで前記複数のエフェクト区間のそれぞれに対して設定されたエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当てステップで割り当てられた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別ステップと、
前記エフェクト再設定判別ステップにより前記エフェクト設定ステップでエフェクトが再設定されると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断ステップと、
を実行させる、コンピュータプログラム。
In addition, this technique can also take the following structures.
(1)
An effect section setting section for setting a plurality of effect sections from a predetermined section for continuously displaying image data;
An image assigning unit that assigns the image data to each of the plurality of effect sections set by the effect section setting unit;
An effect setting section for setting an effect for each of the plurality of effect sections set by the effect section setting section;
Whether or not the effect set by the effect setting unit for each of the plurality of effect sections satisfies a condition for realizing each effect is determined using image metadata corresponding to the image data allocated by the image allocation unit. If there is an effect section that does not satisfy the condition, an effect reset determination unit that resets the effect of the effect section to the effect setting unit,
When the effect setting unit resets the effect by the effect reset determining unit, a consistency determining unit that determines the consistency between the effect section in which the effect is reset and another effect section,
An image processing apparatus comprising:
(2)
The image processing apparatus according to (1), wherein the effect section setting unit sets an effect section using music metadata obtained by analyzing music data reproduced when the image data is displayed.
(3)
The image processing device according to (2), wherein the effect section setting unit extracts a characteristic section from the music metadata and sets the section as an effect section.
(4)
The effect setting unit according to any one of (1) to (3), wherein the effect setting unit sets an effect using music metadata obtained by analyzing music data reproduced when the image data is displayed. Information processing device.
(5)
The image processing apparatus according to (4), wherein the effect setting unit selects an effect that matches the characteristics of the music data played in the effect section set by the effect section setting unit.
(6)
The consistency determining unit causes the effect setting unit to reset the effect when the consistency between the effect segment for which the effect has been reset and another effect segment is not achieved, from (1) above The image processing apparatus according to (5).
(7)
The consistency determining unit causes the image allocation unit to reallocate image data if consistency cannot be obtained in all effect sections even if the effect setting unit resets the effect, the image allocation unit reallocates image data. Image processing apparatus.
(8)
The consistency determining unit causes the effect interval setting unit to reset the effect interval if the consistency cannot be obtained in all the effect intervals even if the effect setting unit resets the effect, (6) or The image processing apparatus according to (7).
(9)
A playback section selection unit that selects a playback section of music data that is played back when the image data is displayed;
If the consistency determination unit does not achieve consistency in all effect sections even if the effect setting unit resets the effect, the consistency determination section sets the playback section of the music data to be played back when the image data is displayed. The image processing apparatus according to any one of (6) to (8), wherein the reproduction section selection unit is changed.
(10)
(1) to (9), further comprising an image selection unit that selects an image to be displayed in the effect section by the effect set by the effect setting unit from among images allocated to the effect section by the image allocation unit. An image processing apparatus according to any one of the above.
(11)
The image processing apparatus according to any one of (1) to (10), further including an image metadata holding unit that holds image metadata obtained by analyzing the image data.
(12)
The image processing according to any one of (1) to (11), further including a music metadata holding unit that holds music metadata obtained by analyzing music data reproduced when the image data is displayed. apparatus.
(13)
An effect section setting step for setting a plurality of effect sections from a predetermined section for continuously displaying image data;
An image assignment step for assigning image data to each of the plurality of effect sections set in the effect section setting step;
An effect setting step for setting an effect for each of the plurality of effect sections set in the effect section setting step;
The image metadata corresponding to the image data assigned in the image assignment step is used to determine whether the effect set for each of the plurality of effect sections in the effect setting step satisfies a condition for realizing each effect. If there is an effect section that does not satisfy the condition, an effect reset determination step for resetting the effect in the effect section,
When the effect is reset in the effect setting step by the effect reset determination step, a consistency determination step of determining consistency between the effect interval in which the effect is reset and another effect interval;
An image processing method comprising:
(14)
On the computer,
An effect section setting step for setting a plurality of effect sections from a predetermined section for continuously displaying image data;
An effect setting step for setting an effect for each of the plurality of effect sections set in the effect section setting step;
An image assignment step for assigning image data to each of the plurality of effect sections set in the effect section setting step;
The image metadata corresponding to the image data assigned in the image assignment step is used to determine whether the effect set for each of the plurality of effect sections in the effect setting step satisfies a condition for realizing each effect. If there is an effect section that does not satisfy the condition, an effect reset determination step for resetting the effect in the effect section,
When the effect is reset in the effect setting step by the effect reset determination step, a consistency determination step of determining consistency between the effect interval in which the effect is reset and another effect interval;
A computer program that executes

100 画像処理装置
102 楽曲解析部
104 楽曲メタデータ保持部
106 再生区間選択部
108 エフェクト区間設定部
110 画像候補割り当て部
112 画像解析部
114 画像メタデータ保持部
116 エフェクト設定部
118 画像選択部
120 エフェクト再設定判別部
122 スライドショー品質判定部
124 表示範囲切り出し部
126 タイミング調整部
128 スライドショー出力部
DESCRIPTION OF SYMBOLS 100 Image processing apparatus 102 Music analysis part 104 Music metadata holding part 106 Playback area selection part 108 Effect area setting part 110 Image candidate assignment part 112 Image analysis part 114 Image metadata holding part 116 Effect setting part 118 Image selection part 120 Effect re-playing Setting determination unit 122 Slide show quality determination unit 124 Display range cutout unit 126 Timing adjustment unit 128 Slide show output unit

Claims (14)

画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定部と、
前記エフェクト区間設定部が設定した前記複数のエフェクト区間のそれぞれに対して前記画像データを割り当てる画像割り当て部と、
前記エフェクト区間設定部が設定した前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定部と、
前記エフェクト設定部が前記複数のエフェクト区間のそれぞれに対して設定したエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当て部が割り当てた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、前記エフェクト設定部に当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別部と、
前記エフェクト再設定判別部により前記エフェクト設定部がエフェクトを再設定すると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断部と、
を備える、画像処理装置。
An effect section setting section for setting a plurality of effect sections from a predetermined section for continuously displaying image data;
An image assigning unit that assigns the image data to each of the plurality of effect sections set by the effect section setting unit;
An effect setting section for setting an effect for each of the plurality of effect sections set by the effect section setting section;
Whether or not the effect set by the effect setting unit for each of the plurality of effect sections satisfies a condition for realizing each effect is determined using image metadata corresponding to the image data allocated by the image allocation unit. If there is an effect section that does not satisfy the condition, an effect reset determination unit that resets the effect of the effect section to the effect setting unit,
When the effect setting unit resets the effect by the effect reset determining unit, a consistency determining unit that determines the consistency between the effect section in which the effect is reset and another effect section,
An image processing apparatus comprising:
前記エフェクト区間設定部は、前記画像データの表示の際に再生される楽曲データを解析して得られる楽曲メタデータを用いてエフェクト区間を設定する、請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the effect section setting unit sets an effect section using music metadata obtained by analyzing music data reproduced when the image data is displayed. 前記エフェクト区間設定部は、前記楽曲メタデータから特徴的な区間を抽出し、当該区間をエフェクト区間として設定する、請求項2に記載の画像処理装置。   The image processing apparatus according to claim 2, wherein the effect section setting unit extracts a characteristic section from the music metadata and sets the section as an effect section. 前記エフェクト設定部は、前記画像データの表示の際に再生される楽曲データを解析して得られる楽曲メタデータを用いてエフェクトを設定する、請求項1に記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the effect setting unit sets an effect using music metadata obtained by analyzing music data reproduced when the image data is displayed. 前記エフェクト設定部は、前記エフェクト区間設定部が設定したエフェクト区間で再生される前記楽曲データの特徴に合わせたエフェクトを選択する、請求項4に記載の画像処理装置。   The image processing apparatus according to claim 4, wherein the effect setting unit selects an effect that matches the characteristics of the music data reproduced in the effect section set by the effect section setting unit. 前記整合性判断部は、エフェクトが再設定されたエフェクト区間と他の前記エフェクト区間との間の整合性が取れていない場合は、前記エフェクト設定部にエフェクトを再設定させる、請求項1に記載の画像処理装置。   2. The consistency determination unit according to claim 1, wherein when the consistency between an effect section in which an effect is reset and another effect section is not consistent, the effect setting unit resets the effect. Image processing apparatus. 前記整合性判断部は、前記エフェクト設定部にエフェクトを再設定させても全てのエフェクト区間において整合性が取れない場合は、前記画像割り当て部に画像データを割り当て直させる、請求項6に記載の画像処理装置。   7. The consistency determination unit according to claim 6, wherein if the consistency is not obtained in all effect sections even if the effect setting unit resets the effect, the image allocation unit reassigns the image data. Image processing device. 前記整合性判断部は、前記エフェクト設定部にエフェクトを再設定させても全てのエフェクト区間において整合性が取れない場合は、前記エフェクト区間設定部にエフェクト区間を再設定させる、請求項6に記載の画像処理装置。   The consistency determination unit causes the effect section setting unit to reset an effect section when consistency cannot be obtained in all effect sections even if the effect setting section resets the effect. Image processing apparatus. 前記画像データの表示の際に再生される楽曲データの再生区間を選択する再生区間選択部をさらに備え、
前記整合性判断部は、前記エフェクト設定部にエフェクトを再設定させても全てのエフェクト区間において整合性が取れない場合は、前記画像データの表示の際に再生される楽曲データの再生区間を前記再生区間選択部に変更させる、請求項6に記載の画像処理装置。
A playback section selection unit that selects a playback section of music data that is played back when the image data is displayed;
If the consistency determination unit does not achieve consistency in all effect sections even if the effect setting unit resets the effect, the consistency determination section sets the playback section of the music data to be played back when the image data is displayed. The image processing apparatus according to claim 6, wherein the image processing apparatus is changed by a reproduction section selection unit.
前記エフェクト設定部が設定したエフェクトにより当該エフェクト区間に表示させる画像を、前記画像割り当て部が当該エフェクト区間に割り当てた画像の中から選択する画像選択部をさらに備える、請求項1に記載の画像処理装置。   The image processing according to claim 1, further comprising: an image selection unit that selects an image to be displayed in the effect section by the effect set by the effect setting unit from images assigned by the image assignment unit to the effect section. apparatus. 前記画像データを解析して得られる画像メタデータを保持する画像メタデータ保持部をさらに備える、請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, further comprising an image metadata holding unit that holds image metadata obtained by analyzing the image data. 前記画像データの表示の際に再生される楽曲データを解析して得られる楽曲メタデータを保持する楽曲メタデータ保持部をさらに備える、請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, further comprising: a music metadata holding unit that holds music metadata obtained by analyzing music data that is reproduced when the image data is displayed. 画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定ステップと、
前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対して画像データを割り当てる画像割り当てステップと、
前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定ステップと、
前記エフェクト設定ステップで前記複数のエフェクト区間のそれぞれに対して設定されたエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当てステップで割り当てられた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別ステップと、
前記エフェクト再設定判別ステップにより前記エフェクト設定ステップでエフェクトが再設定されると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断ステップと、
を備える、画像処理方法。
An effect section setting step for setting a plurality of effect sections from a predetermined section for continuously displaying image data;
An image assignment step for assigning image data to each of the plurality of effect sections set in the effect section setting step;
An effect setting step for setting an effect for each of the plurality of effect sections set in the effect section setting step;
The image metadata corresponding to the image data assigned in the image assignment step is used to determine whether the effect set for each of the plurality of effect sections in the effect setting step satisfies a condition for realizing each effect. If there is an effect section that does not satisfy the condition, an effect reset determination step for resetting the effect in the effect section,
When the effect is reset in the effect setting step by the effect reset determination step, a consistency determination step of determining consistency between the effect interval in which the effect is reset and another effect interval;
An image processing method comprising:
コンピュータに、
画像データを連続して表示させる所定の区間の中から複数のエフェクト区間を設定するエフェクト区間設定ステップと、
前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対してエフェクトを設定するエフェクト設定ステップと、
前記エフェクト区間設定ステップで設定された前記複数のエフェクト区間のそれぞれに対して画像データを割り当てる画像割り当てステップと、
前記エフェクト設定ステップで前記複数のエフェクト区間のそれぞれに対して設定されたエフェクトが、各エフェクトを実現できる条件を満たしているかどうかを、前記画像割り当てステップで割り当てられた画像データに対応する画像メタデータを用いて判断し、条件を満たしていないエフェクト区間があれば、当該エフェクト区間のエフェクトを再設定させるエフェクト再設定判別ステップと、
前記エフェクト再設定判別ステップにより前記エフェクト設定ステップでエフェクトが再設定されると、エフェクトが再設定されたエフェクト区間と他のエフェクト区間との間の整合性を判断する整合性判断ステップと、
を実行させる、コンピュータプログラム。
On the computer,
An effect section setting step for setting a plurality of effect sections from a predetermined section for continuously displaying image data;
An effect setting step for setting an effect for each of the plurality of effect sections set in the effect section setting step;
An image assignment step for assigning image data to each of the plurality of effect sections set in the effect section setting step;
The image metadata corresponding to the image data assigned in the image assignment step is used to determine whether the effect set for each of the plurality of effect sections in the effect setting step satisfies a condition for realizing each effect. If there is an effect section that does not satisfy the condition, an effect reset determination step for resetting the effect in the effect section,
When the effect is reset in the effect setting step by the effect reset determination step, a consistency determination step of determining consistency between the effect interval in which the effect is reset and another effect interval;
A computer program that executes
JP2012069102A 2012-03-26 2012-03-26 Image processing apparatus, image processing method and computer program Pending JP2013200750A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012069102A JP2013200750A (en) 2012-03-26 2012-03-26 Image processing apparatus, image processing method and computer program
US13/753,947 US20130250077A1 (en) 2012-03-26 2013-01-30 Image processing apparatus, image processing method and computer program
CN201310088704.4A CN103369254A (en) 2012-03-26 2013-03-19 Image processing apparatus, image processing method and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012069102A JP2013200750A (en) 2012-03-26 2012-03-26 Image processing apparatus, image processing method and computer program

Publications (1)

Publication Number Publication Date
JP2013200750A true JP2013200750A (en) 2013-10-03

Family

ID=49211424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012069102A Pending JP2013200750A (en) 2012-03-26 2012-03-26 Image processing apparatus, image processing method and computer program

Country Status (3)

Country Link
US (1) US20130250077A1 (en)
JP (1) JP2013200750A (en)
CN (1) CN103369254A (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9589321B2 (en) * 2014-04-24 2017-03-07 Google Inc. Systems and methods for animating a view of a composite image
WO2016098430A1 (en) * 2014-12-15 2016-06-23 ソニー株式会社 Information processing method, video processing device and program
JP6704694B2 (en) * 2015-08-28 2020-06-03 シャープ株式会社 Image adjusting device, image display device, image adjusting method, and image adjusting program
CN111124579B (en) * 2019-12-24 2023-12-19 北京金山安全软件有限公司 Special effect rendering method and device, electronic equipment and storage medium

Also Published As

Publication number Publication date
US20130250077A1 (en) 2013-09-26
CN103369254A (en) 2013-10-23

Similar Documents

Publication Publication Date Title
JP4811433B2 (en) Image selection apparatus, image selection method, and program
JP3578464B2 (en) Automatic composition method
US10681408B2 (en) Systems and methods for creating composite videos
US7383509B2 (en) Automatic generation of multimedia presentation
US8891909B2 (en) Information processing apparatus capable of modifying images based on audio data, program and information processing method
US20050123886A1 (en) Systems and methods for personalized karaoke
US20160336039A1 (en) Systems and methods for creating music videos synchronized with an audio track
KR102161080B1 (en) Device, method and program of generating background music of video
JP2008066956A (en) Method, program, and apparatus for generating music image synchronized moving image scenario
Allan Musical cinema, music video, music television
JP2013200750A (en) Image processing apparatus, image processing method and computer program
US20190214054A1 (en) System and Method for Automated Video Editing
TW200540628A (en) Slideshow composition method
Li et al. Emotion-based impressionism slideshow with automatic music accompaniment
KR20180080642A (en) Video editing method with music source
KR101970383B1 (en) Device and method for contents production
FR3039349A1 (en) METHOD FOR SYNCHRONIZING AN IMAGE STREAM WITH AUDIO EVENTS
KR20140037439A (en) Slideshow created method and device using mood of music
Payling Visual music composition with electronic sound and video
JP2011082689A (en) Moving picture creation apparatus, computer program, and storage medium
Fetveit Mutable temporality in and beyond the music video: an aesthetic of post-production
JP2015211338A (en) Image processing apparatus, imaging apparatus with the same, image processing method, and image processing program
Jost CHAPTER ONE POPULAR MUSIC AND TRANSMEDIA AESTHETICS: ON THE CONCEPTUAL RELATION OF SOUND, AUDIO-VISION AND LIVE PERFORMANCE
JP2004354583A (en) Device and method to generate music
Caston The dancing eyes of the director: choreographers, dance cultures, and film genres in British music video 1979–2016