JP4687297B2 - Image processing apparatus and program - Google Patents
Image processing apparatus and program Download PDFInfo
- Publication number
- JP4687297B2 JP4687297B2 JP2005207110A JP2005207110A JP4687297B2 JP 4687297 B2 JP4687297 B2 JP 4687297B2 JP 2005207110 A JP2005207110 A JP 2005207110A JP 2005207110 A JP2005207110 A JP 2005207110A JP 4687297 B2 JP4687297 B2 JP 4687297B2
- Authority
- JP
- Japan
- Prior art keywords
- reliability
- music data
- data
- rhythm
- switching display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、音楽データを再生した音楽に同期した画像データの切り換え表示を行う画像処理装置等に関する。 The present invention relates to an image processing apparatus and the like for performing switching display of image data synchronized with music reproduced from music data.
音楽データの再生に同期して画像データ(映像データ)を切り換え表示する、いわゆる「スライドショー」と呼ばれる技術がある。このスライドショーに関する技術として、例えば次が知られている。 There is a so-called “slide show” technique in which image data (video data) is switched and displayed in synchronization with reproduction of music data. As a technique related to this slide show, for example, the following is known.
特許文献1には、周波数解析やパターン解析を含む音楽データのリズム解析処理を行って画像切り換えや画像処理を行うタイミングの情報を含むタイミング情報を生成し、次いで、解析した音楽データの各タイミングと一連の画像データとをリンクさせたリンク情報を生成して、その生成したリンク情報を参照することにより、音楽のリズムに合った画像の再生を行う技術が開示されている。
In
また、特許文献2には、音楽データ(楽曲音声データ)の強弱や周波数等からテンポを抽出し、抽出したテンポに合わせて、画像表示のフェードイン/フェードアウトといったスライド効果の時間を設定する技術が開示されている。かかる技術の場合、テンポの速い音楽(楽曲)の場合にはスライド効果の時間を早くし、逆にテンポの遅い楽曲の場合にはスライド効果の時間を長くすることで、音楽のテンポとスライド効果との整合が図られる。
また、特許文献3には、音楽データの内容から、フェードイン/フェードアウト、テンポの変化といった所定の音楽変化を検出し、その検出した音楽変化に基づいて、フェードイン、フェードアウト、クロスフェード、モザイク、ワイプ、フラッシュ、色調の変更といった所定の映像効果を画像データ(映像データ)に対して付与する技術が開示されている。
このように、従来のスライドショーでは、再生する音楽データのリズムを解析し、解析したリズムに基づいて画像データの表示制御を行っている。しかし、音楽データによっては、リズム解析が困難となる部分があった。このようなリズムが正確に解析されない部分では、画像データの再生が音楽のテンポやタイミングに合わないといった不自然な再生となってしまうという問題があった。 As described above, in the conventional slide show, the rhythm of the music data to be reproduced is analyzed, and display control of the image data is performed based on the analyzed rhythm. However, depending on the music data, there is a part that makes rhythm analysis difficult. In such a portion where the rhythm is not accurately analyzed, there is a problem that the reproduction of the image data becomes unnatural reproduction that does not match the tempo and timing of the music.
上記事情に鑑み、本発明は、適確なリズム解析ができない部分においても、画像データの自然な切り換え表示を行えるようにすること目的としている。 In view of the above circumstances, an object of the present invention is to enable natural switching display of image data even in a portion where accurate rhythm analysis cannot be performed.
上記課題を解決するために、請求項1に記載の発明は、
画像データを記憶する画像データ記憶手段(例えば、図1のRAM60)と、
音楽データを記憶する音楽データ記憶手段(例えば、図1のROM50)と、
この音楽データ記憶手段に記憶された音楽データを再生した音楽のリズムを検出する検出手段(例えば、図1のCPU10)と、
この検出手段により検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度を判定する判定手段(例えば、図1のCPU10)と、
前記画像データ記憶手段に記憶された画像データを前記検出手段により検出されたリズムに基づいて切り換え表示していくことにより、前記音楽データ記憶手段に記憶された音楽データの再生に同期した切り換え表示を行うとともに、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分と満たさない部分では該切り換え表示の態様を異なるものとなるよう制御する切換表示制御手段(例えば、図1のCPU10)と、
を備えることを特徴とする画像処理装置(例えば、図1の画像処理装置1)である。
In order to solve the above-mentioned problem, the invention described in
Image data storage means for storing image data (for example, the
Music data storage means for storing music data (for example,
Detection means (for example, the
A determination means (for example, the
By switching and displaying the image data stored in the image data storage means based on the rhythm detected by the detection means, a switching display synchronized with the reproduction of the music data stored in the music data storage means is performed. And a switching display control means for controlling the switching display mode to be different between a portion in which the reliability determined by the determination means in the music data satisfies a predetermined low reliability condition and a portion that does not satisfy the predetermined low reliability condition. (For example,
An image processing apparatus (for example, the
請求項2に記載の発明は、請求項1に記載の画像処理装置において、
前記判定手段は、各タイミングにおける音楽データの自己相関値に基づいて定まる値を信頼度として判定することを特徴とする。
The invention according to
The determining means determines a value determined based on an autocorrelation value of music data at each timing as a reliability.
請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画面書き換え速度の遅い切り換え表示を行うことを特徴とする。
The invention according to
The switching display control means performs switching display with a slow screen rewriting speed when reproducing a portion of the music data in which the reliability determined by the determination means satisfies a predetermined low reliability condition. And
請求項4に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画像データの切り換え表示頻度を低下させることを特徴とする。
The invention according to
The switching display control means reduces the switching display frequency of image data during reproduction of a portion of the music data in which the reliability determined by the determination means satisfies a predetermined low reliability condition. And
請求項5に記載の発明は、請求項3に記載の画像処理装置において、
前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が前記低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、画面書き換え速度の遅い切り換え表示を行うことを特徴とする。
The invention according to claim 5 is the image processing apparatus according to
The switching display control unit is configured to display a screen for a portion of the music data in which the reliability determined by the determination unit does not satisfy the low reliability condition and the sound pressure level satisfies a predetermined low level condition. It is characterized by switching display with a slow rewrite speed.
請求項6に記載の発明は、請求項4に記載の画像処理装置において、
前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が前記低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、切り換え表示頻度を低下させることを特徴とする。
The invention according to claim 6 is the image processing apparatus according to
The switching display control means switches the portion of the music data in which the reliability determined by the determination means does not satisfy the low reliability condition and the sound pressure level satisfies a predetermined low level condition. The display frequency is reduced.
請求項7に記載の発明は、
コンピュータに、音楽データを再生した音楽に同期した画像データの切り換え表示を行わせるためのプログラム(例えば、図1の同期再生プログラム51)であって、
前記音楽データを再生した音楽のリズムを検出する検出機能(例えば、図11のステップS33〜S41)と、
この検出機能により検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度を判定する判定機能(例えば、図11のステップS43)と、
前記画像データを前記検出機能により検出されたリズムに基づいて切り換え表示していくことにより、前記音楽データの再生に同期した切り換え表示を行うとともに、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分と満たさない部分では該切り換え表示の態様を異なるものとなるよう制御する切換表示制御機能(例えば、図10のステップS9〜S15)と、
を前記コンピュータに実現させるためのプログラムである。
The invention described in
A program for causing a computer to switch and display image data synchronized with music that has been reproduced from music data (for example, the
A detection function (for example, steps S33 to S41 in FIG. 11) for detecting the rhythm of the music from which the music data is reproduced;
A determination function (for example, step S43 in FIG. 11) for determining reliability indicating the rhythm accuracy at each timing based on the rhythm detected by the detection function;
By switching and displaying the image data based on the rhythm detected by the detection function, switching display synchronized with the reproduction of the music data is performed, and among the music data, the determination unit determines A switching display control function (for example, steps S9 to S15 in FIG. 10) for controlling the switching display mode to be different between a portion where reliability satisfies a predetermined low reliability condition and a portion where reliability is not satisfied ;
Is a program for causing the computer to realize the above.
請求項1又は7に記載の発明によれば、音楽データを再生した音楽のリズムが検出され、検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度が判定される。そして、検出されたリズムに基づくことで音楽データの再生に同期した切り換え表示が行われるとともに、判定された信頼度に基づいて切り換え表示の態様が制御される。即ち、検出されたリズムの信頼度に基づいて画像データの切り換え表示の態様が制御されるので、音楽データにリズムが適確に検出されない部分が含まれる場合であっても、自然な画像データの切り換え表示を実現し得る。 According to the first or seventh aspect of the invention, the rhythm of the music from which the music data is reproduced is detected, and the reliability indicating the rhythm accuracy at each timing based on the detected rhythm is determined. Then, based on the detected rhythm, switching display synchronized with music data reproduction is performed, and the mode of switching display is controlled based on the determined reliability. That is, since the image data switching display mode is controlled based on the reliability of the detected rhythm, even if the music data includes a portion where the rhythm is not properly detected, the natural image data A switching display can be realized.
請求項2に記載の発明によれば、信頼度は、検出されたリズムに基づく各タイミングにおける音楽データの自己相関値に基づいて定められる。
According to the invention described in
請求項3に記載の発明によれば、音楽データのうち、判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画面書き換え速度の遅い切り換え表示が行われる。従って、例えば検出されたリズムが本来のリズムからずれている場合、このずれによって画像データの切り換え表示が本来のリズムからずれたものとなるが、信頼度が低信頼度条件を満たす、即ちリズムが適確に検出されていないと判定された部分については画面書き換えが他の部分と比較してゆっくり行われることで、検出されたリズムのずれによる画像データの書き換え表示のずれをユーザに感じさせること無く、自然な切り換え表示が実現され得る。 According to the third aspect of the present invention, when the portion of the music data in which the determined reliability satisfies the predetermined low reliability condition is reproduced, switching display with a slow screen rewriting speed is performed. Therefore, for example, when the detected rhythm deviates from the original rhythm, this deviation causes the image data switching display to deviate from the original rhythm, but the reliability satisfies the low reliability condition, that is, the rhythm is For parts that are determined not to be detected properly, screen rewriting is performed more slowly than other parts, making the user feel the image data rewriting display shift due to the detected rhythm shift. And a natural switching display can be realized.
請求項4に記載の発明によれば、音楽データのうち、判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画像データの切り換え表示頻度が低下される。従って、例えばテンポの遅い音楽での画像データの頻繁な切り換えはユーザに違和感を与えることになるが、リズムが適確に検出されていないと判定された部分については、画像データの切り換え頻度が低下される、即ち他の部分に比較して頻繁な画像データの切り換えが行われないことで、テンポの遅い音楽なのに画像データが頻繁に切り換えられるといった違和感をユーザに与えることなく、自然な画像データの切り換え表示が実現される。 According to the fourth aspect of the present invention, when reproducing a portion of the music data in which the determined reliability satisfies the predetermined low reliability condition, the switching display frequency of the image data is reduced. Therefore, for example, frequent switching of image data in music with a slow tempo will give the user a sense of incongruity, but the switching frequency of the image data is reduced for portions where the rhythm is determined not to be detected properly. In other words, since the image data is not frequently switched compared to other parts, the natural image data can be reproduced without giving the user a sense of incongruity that the image data is frequently switched even though the music is slow in tempo. Switching display is realized.
請求項5に記載の発明によれば、音楽データのうち、判定された信頼度が所定の低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、画面書き換え速度の遅い切り換え表示が行われる。従って、リズムが適確に検出されていると判定されている部分であっても、音圧レベルが低レベル条件を満たす、即ち音圧レベルが低い部分については、画面書き換えがゆっくり行われることで、例えば音量が小さな部分から大きな音量へ大きく変化する部分で、ゆっくりであった画面の書き換えが素早い書き換えに変化するといった、より自然な画像データの切り換え表示が実現される。 According to the fifth aspect of the present invention, a portion of the music data in which the determined reliability does not satisfy the predetermined low reliability condition and the sound pressure level satisfies the predetermined low level condition is displayed on the screen. Switching display with slow rewriting speed is performed. Therefore, even if it is determined that the rhythm is accurately detected, the sound pressure level satisfies the low level condition, that is, the portion where the sound pressure level is low, the screen rewriting is performed slowly. For example, a more natural image data switching display is realized in which a slow screen rewrite changes to a quick rewrite in a portion where the volume greatly changes from a low volume to a high volume.
請求項6に記載の発明によれば、音楽データのうち、判定された信頼度が所定の低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、画像データの切り換え表示頻度が低下される。従って、リズムが適確に検出されていると判定されている部分であっても音圧レベルが低い部分については、他の部分に比較して頻繁な画像データの切り換えが行われないことで、音量が小さい部分で頻繁に画像データが切り換えられるといった違和感をユーザに与えることなく、自然な画像データの切り換え表示が実現される。 According to the invention described in claim 6, a portion of the music data in which the determined reliability does not satisfy the predetermined low reliability condition and the sound pressure level satisfies the predetermined low level condition, Data switching display frequency is reduced. Therefore, even if it is determined that the rhythm is properly detected, the image data is not frequently switched compared to the other portions for the portion where the sound pressure level is low. Natural image data switching display is realized without giving the user a sense of incongruity that the image data is frequently switched at a low volume.
以下、図面を参照して、本発明に好適な実施形態を説明する。 Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings.
[画像処理装置の構成]
図1は、本実施形態における画像処理装置1のブロック構成図である。この画像処理装置1は、音楽データの再生に同期して画像データの切り換え表示を行うものであり、同図によれば、CPU10と、入力部20と、表示部30と、音声出力部40と、ROM50と、RAM60とを備えて構成される。
[Configuration of image processing apparatus]
FIG. 1 is a block diagram of an
CPU10は、所定のタイミングでROM50に記憶されているプログラムを読み出してRAM60内に展開し、当該プログラムに基づいて画像処理装置1を構成する各部への指示やデータ転送等を行う。特に、本実施形態では、同期再生プログラム51に従った同期再生処理(図10参照)を実行する。
The
具体的には、同期再生処理において、CPU10は、先ず、RAM60に記憶されている音楽データ62を対象とするリズム検出処理を行って、該音楽データ62の検出したリズム及びその信頼度に関するデータであるリズムデータ67を生成する。
Specifically, in the synchronous playback process, the
詳細には、リズム検出処理において、CPU10は、図2に示すように、音楽データ62を複数のフレームに分割する。図2は、音楽データ62に基づく音声波形の一部を示す図である。同図に示すように、CPU10は、音楽データ62に基づく音声波形を、その先頭から、時間Mずつずらした長さNの複数のフレームF1,F2,・・、に分割する。ここで、時間M及びフレームの長さNは適当に設定して良く、例えば、M=0.5[秒]、N=4[秒]、程度に設定する。但し、M<N、とする。
Specifically, in the rhythm detection process, the
次いで、CPU10は、分割した各フレームの音声信号の自己相関関数を導出する。具体的には、各フレームについて、その音声信号をローパスフィルタに通過させて高域成分を遮断し、低域成分を抽出する。次に、抽出した低域成分の信号に対するFFT(Fast Fourier Transform)演算を行ってフーリエスペクトラムを算出し、更に二乗してパワースペクトルを算出する。そして、算出したパワースペクトルに対する逆FTT演算を行って、該フレームの音声信号の自己相関関数を導出する。
Next, the
図3は、1つのフレームについての自己相関関数の一例を示すグラフである。同図において、横軸はサンプル数即ち時間であり、縦軸は相関関数値である。 FIG. 3 is a graph showing an example of the autocorrelation function for one frame. In the figure, the horizontal axis represents the number of samples, that is, time, and the vertical axis represents the correlation function value.
そして更に、図4に示すように、このグラフの横軸を、曲のテンポを表す単位であるBPM(Beat Per Minute)に変換する。図4は、自己相関関数のグラフの横軸を、サンプル数からBPMに変換した一例を示すグラフである。サンプル数からBPMへの変換は、次のように行う。即ち、1フレームの長さNを「N[秒]」とし、自己相関関数を導出する際のサンプル数を「X」とした場合、1サンプルは、時間t=M/X[秒]、に相当する。つまり、xサンプル目は、時間T=t×x[秒]、に相当し、これをBPMで表現すると、60/T=60/(t×x)、となる。例えば、N=4[秒]、X=2052、とした場合、1サンプルは、時間t=0.001949[秒](=4/2052)に相当する。横軸をBPMとしたフレーム毎の自己相関関数は、フレーム自己相関データ63としてRAM60に記憶される。
Further, as shown in FIG. 4, the horizontal axis of this graph is converted into BPM (Beat Per Minute) which is a unit representing the tempo of the music. FIG. 4 is a graph showing an example in which the horizontal axis of the autocorrelation function graph is converted from the number of samples into BPM. Conversion from the number of samples to BPM is performed as follows. That is, assuming that the length N of one frame is “N [seconds]” and the number of samples in deriving the autocorrelation function is “X”, one sample is at time t = M / X [seconds]. Equivalent to. That is, the x-th sample corresponds to time T = t × x [seconds], which is expressed as BPM as 60 / T = 60 / (t × x). For example, when N = 4 [seconds] and X = 2052, one sample corresponds to time t = 0.0001949 [seconds] (= 4/2052). The autocorrelation function for each frame with the horizontal axis as BPM is stored in the
続いて、CPU10は、導出したフレーム毎の自己相関関数を基に、各フレームのBPM候補値を算出する。具体的には、各フレームについて、導出した自己相関関数の所定のBPM範囲内において、自己相関値のピーク値のうち、その値が最大のものから順に所定数(例えば、5個)選択する。そして、これら選択した各ピーク値に対応するBPMの値を、当該フレームにおけるBPM候補値とする。尚、上記所定のBPM範囲は、例えば一般的な音楽のBPMの範囲である「50〜200」程度に設定される。
Subsequently, the
算出したBPM候補値は、対応するピーク値とともに、フレーム解析データ64としてRAM60に記憶される。図5に、フレーム解析データ64のデータ構成の一例を示す。同図によれば、フレーム解析データ64は、音楽データ62を分割したフレーム64a毎に、複数(同図では、5)のBPM候補値64bとピーク値64cとを対応付けて格納している。
The calculated BPM candidate value is stored in the
各フレームについてBPM候補値を算出すると、CPU10は、近似する値同士のグループとなるように、算出した各BPM候補値をグループ化する。そして、各グループについて、BPM候補値の平均値と、ピーク値の累積値とを算出する。
When the BPM candidate values are calculated for each frame, the
ここでグループ化したBPM候補値は、BPM決定用データ65としてRAM60に記憶される。図6に、BPM決定用データ65のデータ構成の一例を示す。同図によれば、BPM決定用データ65は、グループ65a毎に、属するBPM候補値665とピーク値65cとを対応付けて格納しているとともに、BPM候補値65bの平均65dと、ピーク値65cの累積65eとを格納している。
The BPM candidate values grouped here are stored in the
また同図は、図5に示したフレーム解析データ64に基づく場合を示しており、「62」に近いBPM候補値をグループ化した第1グループ、「123」に近いBPM候補値をグループ化した第2グループ、「246」に近いBPM値をグループ化した第3グループ、・・、にグループ化されている。
This figure also shows a case based on the
次いで、CPU10は、これら複数のグループのうち、ピーク値の累積値が最も大きいグループを判定し、その判定したグループのBPM候補値の平均値を、音楽データ62のBPMとして決定する。例えば図6の場合、ピーク値の累積値が「287.1」で最も大きい第2グループが判定され、この第2グループのBPM候補値の平均値「123.8」が音楽データ62のBPMとして決定される。ここで決定したBPMは、BPM決定値データ66としてRAM60に記憶される。
Next, the
音楽データ62のBPMを決定すると、CPU10は、続いて、その決定したBPMを基に拍の間隔Lを算出する。拍の間隔LはBPMの逆数で与えられ、例えばBPMが「120」の場合、拍の間隔Lは、L=0.5(=60[s]/120)、となる。
When the BPM of the
続いて、CPU10は、音楽データ62における拍の位置Rを決定する。具体的には、フレーム自己相関データ63を参照して、音楽データ62を分割した複数のフレームのうちから、全フレームを通して音圧レベル(音声波形の振幅)が最大のピーク値を含む1つのフレームを選択する。次いで、図7に示すように、その選択したフレームにおける音圧レベルが最大の位置を、当該音楽データ62における拍の基準位置とする。図7は、音楽データ62に基づく、最大のピーク値の位置を含む複数フレーム分の音声波形を示している。
Subsequently, the
そして、CPU10は、音楽データ62に基づく音声波形全体に対して、決定した拍の基準位置を基準として、算出した拍の間隔Lで拍の位置Rを決定する。
Then, the
その後、CPU10は、決定した各拍の位置Rにおけるリズムの適確性を示す信頼度を算出する。具体的には、各拍の位置Rについて、図8に示すように、音楽データ62を分割した複数のフレームのうちから、当該拍の位置Rを含むフレームを選択する。図8は、音楽データ62に基づく音声波形の一部を示している。ここで、フレームは時間Mずつずらして生成されているので、ある拍の位置Rを含むフレームとして複数のフレームが存在する。例えば同図の場合、拍の位置Rを含むフレームとして、フレームFn+1,Fn+2,Fn+3の3つのフレームが選択される。
Thereafter, the
そして、CPU10は、これら選択した各フレームについて、決定した当該音楽データ62のBPMに対応する自己相関値を算出し、算出した自己相関値の平均値に所定係数を乗じた値を、当該拍の位置Rにおける信頼度とする。
Then, the
このように算出した各拍の位置Rについての信頼度は、該拍の位置Rと対応付けられ、当該音楽データ62に対応するリズムデータ67としてRAM60に記憶される。図9は、リズムデータ67のデータ構成の一例を示す図である。同図に示すように、リズムデータ67は、拍の位置67aと信頼度67bとを対応付けて格納している。ここで、拍の位置67aは、該当する音楽データ62の先頭位置(再生開始位置)をゼロとした値で表現されている。
The reliability of the beat position R calculated in this way is associated with the beat position R and stored in the
リズム検出処理を終了すると、CPU10は、音楽データ62の再生を開始し、該音楽データ62に基づく音楽を音声出力部40から出力させるとともに、生成したリズムデータ67を参照して、音楽に同期させて画像データ61に基づく画像を表示部30に切り換え表示させる。
When the rhythm detection process is finished, the
具体的には、リズムデータ67で指定される拍の位置Rが到来する毎に、当該到来した拍の位置Rに対応する信頼度が、信頼度閾値データ68で指定される、低信頼度条件である閾値を超えたか否かを判断し、判断結果に応じた画面書き換え速度で次の画像への切り換え表示を行う。画面書き換え速度とは、短時間当たりに画面を書き換える量を指し、画面書き換え速度が速い程、より短時間で次の画像に書き換わることになる。本実施形態では、画面書き換え速度として、通常の速度と、この通常の速度より遅い速度との2つの速度があるとする。即ち、信頼度が閾値を超えた場合には、画面書き換え速度を通常の速度として画面の表示を切り換える。また、信頼度が閾値を超えない場合には、画面書き換え速度を遅い速度として画面の表示を切り換える。
Specifically, each time the beat position R specified by the
ここで、通常の画面書き換え速度による画面書き換えと、通常より遅い速度による画面書き換えとの組み合わせの例としては、例えば全画面書き換えとフェードイン/フェードアウトの組み合わせがある。また、双方において、例えばディゾルブやワイプといった同じ画面書き換え技法を用い、その完了までに要する時間を異ならせることによって、通常の書き換え速度と遅い書き換え速度とを実現することとしても良い。 Here, as an example of a combination of screen rewriting at a normal screen rewriting speed and screen rewriting at a slower speed than normal, for example, there is a combination of full screen rewriting and fade-in / fade-out. Moreover, it is good also as implement | achieving normal rewriting speed and slow rewriting speed | velocity | rate by using the same screen rewriting technique, such as a dissolve and a wipe, and making time required for the completion differ in both.
図1において、入力部20は、例えばスイッチやキーボード、マウス、各種センサ等を有して構成され、ユーザによる操作に応じた操作信号をCPU10に出力する。
In FIG. 1, the
表示部30は、LCD(Liquid Crystal Display)やELD(Electro Luminescence Display)、PDP(Plasma Display Panel)等のモニタを有して構成され、CPU10から入力される画像信号に従った画像、特に、本実施形態では、CPU10の制御に従って画像データ61に基づく画像を切り換え表示する。
The
音声出力部40は、D/A変換器や増幅器、スピーカ等を有して構成され、CPU10から入力される音声信号に従った音声、特に本実施形態では、音楽データ62に基づく音楽を出力する。
The
ROM50は、画像処理装置1にかかるシステムプログラムやアプリケーションプログラム、本実施形態を実現するためのプログラムやデータ等を記憶する。特に、本実施形態では、同期再生処理(図10参照)を実現するための同期再生プログラム51を記憶している。
The
RAM60は、CPU10の作業領域として用いられ、ROM50から読み出されたプログラムやデータ、CPU10で処理されたデータを一時的に記憶する。特に、本実施形態では、画像データ61と、音楽データ62と、フレーム自己相関データ63と、フレーム解析データ64と、BPM決定用データ65と、BPM決定値データ66と、リズムデータ67と、信頼度閾値データ68とを記憶する。
The
画像データ61は、複数の画像群からなるデータであり、例えばメモリカード等の外部情報記憶媒体から読み出されたデータ、或いは、インターネット等の通信回線を介して他装置から取り込んだデータ等である。また、音楽データ62は、CD等の外部情報記憶媒体から読み込んだデータ、或いは、上述の通信回線を介して他装置から取り込んだデータ等である。
The
[処理の流れ]
次に、画像処理装置1における処理の流れを説明する。
図10は、同期再生処理の流れを説明するためのフローチャートである。この処理は、例えば入力部20から再生指示が入力された場合に、CPU10が同期再生プログラム51に従った処理を実行することで実現される。
[Process flow]
Next, the flow of processing in the
FIG. 10 is a flowchart for explaining the flow of the synchronous reproduction process. This process is realized by the
同図によれば、CPU10は、先ず、入力部20からの入力指示等に従って、再生する音楽データ62及び画像データ61を指定する(ステップS1)。そして、指定された音楽データ62を対象とするリズム検出処理を実行し、当該音楽データ62に対応するリズムデータ67を生成する(ステップS3)。
According to the figure, the
図11は、リズム検出処理の流れを説明するためのフローチャートである。同図によれば、CPU10は、対象としている音楽データ62を、時間Mづつずらした長さNの複数のフレームに分割する(ステップS31)。
FIG. 11 is a flowchart for explaining the flow of the rhythm detection process. According to the figure, the
次いで、分割した各フレームの音声信号について自己相関関数を導出する(ステップS33)。そして、各フレームについて、導出した自己相関関数における所定のBPM範囲内で、BPM候補値とそのピーク値とを算出する(ステップS35)。即ち、上述のように、各フレームの自己相関関数における所定のBPM範囲内で、ピーク値が最大となる所定数のBPMの値をBPM候補値とする。 Next, an autocorrelation function is derived for the audio signal of each divided frame (step S33). Then, for each frame, a BPM candidate value and its peak value are calculated within a predetermined BPM range in the derived autocorrelation function (step S35). That is, as described above, a predetermined number of BPM values having a maximum peak value within a predetermined BPM range in the autocorrelation function of each frame are set as BPM candidate values.
続いて、CPU10は、算出した各フレームのBPM候補値及びそのピーク値を基に、音楽データ62のBPMを決定する(ステップS37)。即ち、上述のように、算出した各フレームのBPM候補値を近似する値同士でグループ化し、これら複数のグループのうちから、ピーク値の累積値が最大となるグループを選択する。そして、その選択したグループのBPM候補値の平均値を、該音楽データ62のBPMとして決定する。
Subsequently, the
その後、CPU10は、決定したBPMの逆数を演算することで拍の間隔Lを算出する(ステップS39)。そして、ピーク値の最大値を含むフレームにおいて音圧レベルが最大となる位置を、音楽データ62における拍の基準位置として算出し、この拍の基準位置を基準として、拍の間隔Lで各拍の位置Rを算出する(ステップS41)。
Thereafter, the
続いて、CPU10は、算出した各拍の位置Rにおける信頼度を算出する(ステップS43)。即ち、上述のように、各拍の位置Rについて、該拍の位置Rを含む各フレームにおける当該音楽データ62のBPMに対応する自己相関値の平均値に所定の係数を乗じた値を、当該拍の位置Rの信頼度とする。そして、各拍の位置Rと算出した信頼度とを対応付けて、リズムデータ67を生成する。
以上の処理を行うと、このリズム検出処理は終了となる。
Subsequently, the
When the above processing is performed, this rhythm detection processing is completed.
リズム検出処理を終了すると、CPU10は、指定された音楽データ62の再生を開始する(ステップS5)。そして、音楽再生が終了するまでの間(ステップS7:NO)、次の処理を繰り返す。
When the rhythm detection process ends, the
即ち、リズムデータ67で指定される拍の位置Rのタイミングが到来すると(ステップS9:YES)、CPU10は、リズムデータ67において該拍の位置Rに対応付けられている信頼度が、信頼度閾値データ68で指定される閾値を超えるか否かを判断する。
That is, when the timing of the beat position R specified by the
信頼度が閾値を超える場合(ステップS11:YES)、CPU10は、通常の書き換え速度で、表示部30に表示されている現在の表示画像から次の画像に切り換える(ステップS13)。また、信頼度が所定の閾値を超えない場合には(ステップS11:NO)、上記通常の速度より遅い画面書き換え速度で、次の画像に切り換える(ステップS15)。
そして、音楽データ62の再生が終了すると(ステップS7:YES)、この同期再生処理は終了となる。
When the reliability exceeds the threshold (step S11: YES), the
Then, when the reproduction of the
[具体例]
ここで、本実施形態における具体的な実施例を説明する。
図12は、ある音楽データ62を基に生成されたリズムデータを表すグラフであり、横軸を当該音楽データ62の再生開始からの経過時間[秒]、縦軸を信頼度として、各拍の位置Rでの信頼度をプロットしている。同図において、信頼度の閾値を「80」とすると、再生される音楽の前半部分の「40〜100[秒]」の範囲、後半部分の「310[秒]」付近、及び、終了直前の「430[秒]」付近において、信頼度がこの閾値より小さくなり、画像の書き換え速度がゆっくりとなる。
[Concrete example]
Here, a specific example in the present embodiment will be described.
FIG. 12 is a graph showing rhythm data generated based on
[作用・効果]
以上、本実施形態によれば、リズム検出処理により、音楽データ62を再生した音楽のリズムのタイミングである拍の位置Rが算出され、これら各拍の位置Rにおける検出したリズムの適確性を示す信頼度が算出されて、拍の位置Rと信頼度とを対応付けたリズムデータ67が生成される。そして、音楽データ62の再生時には、このリズムデータ67で指定される各拍の位置Rの到来毎に、該拍の位置Rに対応する信頼度が信頼度閾値データ68で指定される閾値を超えるか否かが判断され、超える場合には通常の画面書き換え速度で、超えない場合には上記通常の速度より遅い画面書き換え速度で、次の画像に切り換え表示される。
[Action / Effect]
As described above, according to the present embodiment, the beat position R that is the timing of the rhythm of the music from which the
従って、検出されたリズムが本来のリズムからずれる部分も有り得るが、信頼度が低く閾値を超えない部分については画面書き換え速度を遅くすることで、検出されたリズムのずれによる切り換え表示の違和感をユーザに与えることを防止できる。即ち、音楽データ62にリズムが適確に検出されない部分が含まれる場合であっても、自然な画像データ61の切り換え表示が実現され得る。
Therefore, although the detected rhythm may deviate from the original rhythm, the screen rewriting speed is slowed for the portion where the reliability is low and the threshold is not exceeded, so that the user feels uncomfortable in the switching display due to the detected rhythm shift. Can be prevented. That is, even when the
[変形例]
尚、本発明の適用可能な実施形態は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
[Modification]
The applicable embodiments of the present invention are not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention.
(A)信頼度
例えば上述した実施形態では、各拍の位置Rにおける信頼度として、当該拍の位置Rを含む各フレームのBPMに対応する自己相関値に基づく値としたが、これを、この自己相関値に基づく値に、更に、当該拍の位置Rでの音圧レベルに基づく値を加算した値を用いることとしても良い。
(A) Reliability In the above-described embodiment, for example, the reliability at each beat position R is a value based on the autocorrelation value corresponding to the BPM of each frame including the beat position R. A value obtained by adding a value based on the sound pressure level at the position R of the beat to the value based on the autocorrelation value may be used.
図13は、この場合のリズムデータ67Aの一例を示す図である。同図に示すように、リズムデータ67Aは、拍の位置67aと、自己相関値に基づく値67cと、音圧レベル67dと、信頼度67eとを対応付けて格納している。信頼度67eは、自己相関値に基づく値67cと、音圧レベル67dとの和である。
FIG. 13 is a diagram showing an example of the
また、図14は、リズムデータ67Aに基づくグラフの一例を示す図である。同図では、横軸を音楽データ62の再生開始からの経過時間とし、縦軸に、各拍の位置Rでの自己相関値に基づく値、音圧レベル及び信頼度の値をプロットしている。
FIG. 14 is a diagram illustrating an example of a graph based on the
図14では、90[秒]付近において音量が一瞬ほぼゼロになるとともにリズムが中断し、その後再度リズムが再開されて音量が一気に回復している。この場合、導出される自己相関値は、その部分において一旦低下した後、徐々に回復する。このため、信頼度を、自己相関値だけではなく、更に音圧レベルにも基づいて算出することで、一旦減少した音量が再度回復する時点で、ゆっくりであった画像書き換え速度が通常の速度に変化するといった、より自然な画像データ61の切り替え表示が実現される。
In FIG. 14, near 90 [seconds], the sound volume becomes almost zero for a moment and the rhythm is interrupted. Then, the rhythm is resumed and the sound volume is recovered at once. In this case, the derived autocorrelation value once decreases at that portion and then gradually recovers. For this reason, by calculating the reliability based not only on the autocorrelation value but also on the sound pressure level, the slow image rewriting speed is restored to the normal speed when the once reduced volume is restored again. A more natural switching display of the
また、音声信号のスペクトログラムにおいて、ある周波数の値が急に大きくなり、且つその状態が所定時間継続する場合、その位置はコードの変化点であると推測することができる。また、コードが変化する位置は拍の位置である可能性が高い。従って、自己相関関数から算出した拍の位置Rと、スペクトログラムから推測したコード変化位置との一致度を信頼度としても良い。 Further, in the spectrogram of the audio signal, when the value of a certain frequency suddenly increases and the state continues for a predetermined time, it can be estimated that the position is a code change point. Also, the position where the chord changes is likely to be the beat position. Therefore, the degree of coincidence between the beat position R calculated from the autocorrelation function and the chord change position estimated from the spectrogram may be used as the reliability.
(B)リズム検出処理
また、上述した実施形態では、音楽データ62の再生時に、当該音楽データ62を対象としたリズム検出処理を実行して対応するリズムデータ67を生成することとしたが、これを予め生成しておくこととしても良い。具体的には、例えば音楽データ62の再生前、該音楽データ62が読み込まれた際にリズム検出処理を行って対応するリズムデータ67を生成し、その音楽データ62の再生時に、この予め生成したリズムデータ67を読み出して用いることとする。
(B) Rhythm detection processing In the above-described embodiment, when the
(C)画像の切り換え表示のタイミング
また、上述した実施形態では、音楽データ62を再生する際には、拍の位置Rが到来する毎に画像データ61の切り換え表示を行うこととしたが、複数回の拍の位置Rの到来毎(例えば、10拍毎)に切り換え表示を行うこととしても良い。
(C) Image switching display timing In the above-described embodiment, when the
(D)切り換え表示の態様
また、上述した実施形態では、画像データ61の切り換え表示の態様の制御として、画面書き換え速度を通常の速度とこの通常の速度より遅い速度との2つとして2段階で切り換えることとしたが、画面書き換え速度を3つ以上として3段階以上の多段階に切り換えることとしても良い。この場合、画面書き換え速度の数に応じた複数の閾値を設け、信頼度が何れの閾値の間であるかに応じて画面書き換え速度を決定する。
(D) Mode of Switching Display In the above-described embodiment, the screen rewriting speed is controlled in two stages, that is, a normal speed and a speed slower than the normal speed, as control of the switching display mode of the
また、画像データ61の切り換え表示の態様の制御として、画像書き換え速度を変化させることとしたが、切り換え表示の頻度を変化させることとしても良い。具体的には、例えば、音楽データ62の再生の際、拍の位置Rの到来毎に画像の切り換えを行っていたものを、到来した拍の位置Rにおける信頼度が所定の閾値を超えない場合には、以降の連続する複数回の拍の位置Rが到来する間(例えば、10拍の間)、画像の切り換え表示を行わないといったことにより、信頼度が低い部分では画像の切り換え頻度を低下させる。
Further, although the image rewriting speed is changed as the control of the switching display mode of the
1 画像処理装置
10 CPU
20 入力部
30 表示部
40 音声出力部
50 ROM
51 同期再生プログラム
52 リズム検出プログラム
60 RAM
61 画像データ
62 音楽データ
63 フレーム自己相関データ
64 フレーム解析データ
65 BPM決定用データ
66 BPM決定値データ
67 リズムデータ
68 信頼度閾値データ
1
20
51
61
Claims (7)
音楽データを記憶する音楽データ記憶手段と、
この音楽データ記憶手段に記憶された音楽データを再生した音楽のリズムを検出する検出手段と、
この検出手段により検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度を判定する判定手段と、
前記画像データ記憶手段に記憶された画像データを前記検出手段により検出されたリズムに基づいて切り換え表示していくことにより、前記音楽データ記憶手段に記憶された音楽データの再生に同期した切り換え表示を行うとともに、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分と満たさない部分では該切り換え表示の態様を異なるものとなるよう制御する切換表示制御手段と、
を備えることを特徴とする画像処理装置。 Image data storage means for storing image data;
Music data storage means for storing music data;
Detecting means for detecting the rhythm of the music reproduced from the music data stored in the music data storage means;
Determination means for determining reliability indicating the rhythm accuracy at each timing based on the rhythm detected by the detection means;
By switching and displaying the image data stored in the image data storage means based on the rhythm detected by the detection means, a switching display synchronized with the reproduction of the music data stored in the music data storage means is performed. And a switching display control means for controlling the switching display mode to be different between a portion in which the reliability determined by the determination means in the music data satisfies a predetermined low reliability condition and a portion that does not satisfy the predetermined low reliability condition. When,
An image processing apparatus comprising:
前記音楽データを再生した音楽のリズムを検出する検出機能と、
この検出機能により検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度を判定する判定機能と、
前記画像データを前記検出機能により検出されたリズムに基づいて切り換え表示していくことにより、前記音楽データの再生に同期した切り換え表示を行うとともに、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分と満たさない部分では該切り換え表示の態様を異なるものとなるよう制御する切換表示制御機能と、
を前記コンピュータに実現させるためのプログラム。 A program for causing a computer to perform switching display of image data synchronized with music that has been reproduced.
A detection function for detecting a rhythm of music obtained by playing the music data;
A determination function for determining reliability indicating the rhythm accuracy at each timing based on the rhythm detected by the detection function;
By switching and displaying the image data based on the rhythm detected by the detection function, switching display synchronized with the reproduction of the music data is performed, and among the music data, the determination unit determines A switching display control function for controlling the state of the switching display to be different between a portion where the reliability satisfies a predetermined low reliability condition and a portion where the reliability does not satisfy ,
A program for causing the computer to realize the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005207110A JP4687297B2 (en) | 2005-07-15 | 2005-07-15 | Image processing apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005207110A JP4687297B2 (en) | 2005-07-15 | 2005-07-15 | Image processing apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007025242A JP2007025242A (en) | 2007-02-01 |
JP4687297B2 true JP4687297B2 (en) | 2011-05-25 |
Family
ID=37786097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005207110A Expired - Fee Related JP4687297B2 (en) | 2005-07-15 | 2005-07-15 | Image processing apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4687297B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5104709B2 (en) * | 2008-10-10 | 2012-12-19 | ソニー株式会社 | Information processing apparatus, program, and information processing method |
US9378752B2 (en) * | 2012-09-05 | 2016-06-28 | Honda Motor Co., Ltd. | Sound processing device, sound processing method, and sound processing program |
JP2018170678A (en) * | 2017-03-30 | 2018-11-01 | 株式会社ライブ・アース | Live video processing system, live video processing method, and program |
CN113411663B (en) * | 2021-04-30 | 2023-02-21 | 成都东方盛行电子有限责任公司 | Music beat extraction method for non-woven engineering |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001339682A (en) * | 2000-05-30 | 2001-12-07 | Fuji Photo Film Co Ltd | Digital camera with music reproduction function |
-
2005
- 2005-07-15 JP JP2005207110A patent/JP4687297B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001339682A (en) * | 2000-05-30 | 2001-12-07 | Fuji Photo Film Co Ltd | Digital camera with music reproduction function |
Also Published As
Publication number | Publication date |
---|---|
JP2007025242A (en) | 2007-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3399297B2 (en) | Electronic musical instrument | |
JP6011064B2 (en) | Automatic performance device and program | |
EP1892717A1 (en) | Content tag attachment support device and content tag attachment support method | |
EP2911147B1 (en) | Multifunctional audio signal generation apparatus | |
JP4687297B2 (en) | Image processing apparatus and program | |
US7446252B2 (en) | Music information calculation apparatus and music reproduction apparatus | |
JP4300641B2 (en) | Time axis companding method and apparatus for multitrack sound source signal | |
US7511214B2 (en) | Automatic performance apparatus for reproducing music piece | |
US8761567B2 (en) | Moving image reproducer reproducing moving image in synchronization with musical piece | |
JP3645716B2 (en) | Animation creating method, animation creating apparatus, and computer-readable recording medium recording animation creating program | |
US10937404B2 (en) | Electronic keyboard instrument, method, and storage medium | |
EP3373289B1 (en) | Electronic musical instrument, musical sound generating method, and storage medium | |
JP6350692B2 (en) | Acoustic signal generator | |
WO2017145800A1 (en) | Voice analysis apparatus, voice analysis method, and program | |
JP2008268368A (en) | Evaluation device | |
JP2003273677A (en) | Equalizer and program therefor | |
US6362410B1 (en) | Electronic musical instrument | |
JP2010032809A (en) | Automatic musical performance device and computer program for automatic musical performance | |
JP6350693B2 (en) | Acoustic signal generator | |
JP6114492B2 (en) | Data processing apparatus and program | |
JP5509961B2 (en) | Phrase data extraction device and program | |
JP2000276185A (en) | Device and method for sound processing | |
JP3797356B2 (en) | Electronic musical instruments | |
JP4246160B2 (en) | Music search apparatus and music search method | |
JP2014056485A (en) | Display control device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080708 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101102 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101214 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110131 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4687297 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140225 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |