JP4687297B2 - Image processing apparatus and program - Google Patents

Image processing apparatus and program Download PDF

Info

Publication number
JP4687297B2
JP4687297B2 JP2005207110A JP2005207110A JP4687297B2 JP 4687297 B2 JP4687297 B2 JP 4687297B2 JP 2005207110 A JP2005207110 A JP 2005207110A JP 2005207110 A JP2005207110 A JP 2005207110A JP 4687297 B2 JP4687297 B2 JP 4687297B2
Authority
JP
Japan
Prior art keywords
reliability
music data
data
rhythm
switching display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005207110A
Other languages
Japanese (ja)
Other versions
JP2007025242A (en
Inventor
滋 加福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2005207110A priority Critical patent/JP4687297B2/en
Publication of JP2007025242A publication Critical patent/JP2007025242A/en
Application granted granted Critical
Publication of JP4687297B2 publication Critical patent/JP4687297B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音楽データを再生した音楽に同期した画像データの切り換え表示を行う画像処理装置等に関する。   The present invention relates to an image processing apparatus and the like for performing switching display of image data synchronized with music reproduced from music data.

音楽データの再生に同期して画像データ(映像データ)を切り換え表示する、いわゆる「スライドショー」と呼ばれる技術がある。このスライドショーに関する技術として、例えば次が知られている。   There is a so-called “slide show” technique in which image data (video data) is switched and displayed in synchronization with reproduction of music data. As a technique related to this slide show, for example, the following is known.

特許文献1には、周波数解析やパターン解析を含む音楽データのリズム解析処理を行って画像切り換えや画像処理を行うタイミングの情報を含むタイミング情報を生成し、次いで、解析した音楽データの各タイミングと一連の画像データとをリンクさせたリンク情報を生成して、その生成したリンク情報を参照することにより、音楽のリズムに合った画像の再生を行う技術が開示されている。   In Patent Literature 1, rhythm analysis processing of music data including frequency analysis and pattern analysis is performed to generate timing information including timing information for performing image switching and image processing, and then each timing of the analyzed music data A technique is disclosed in which link information obtained by linking a series of image data is generated and an image that matches the rhythm of the music is reproduced by referring to the generated link information.

また、特許文献2には、音楽データ(楽曲音声データ)の強弱や周波数等からテンポを抽出し、抽出したテンポに合わせて、画像表示のフェードイン/フェードアウトといったスライド効果の時間を設定する技術が開示されている。かかる技術の場合、テンポの速い音楽(楽曲)の場合にはスライド効果の時間を早くし、逆にテンポの遅い楽曲の場合にはスライド効果の時間を長くすることで、音楽のテンポとスライド効果との整合が図られる。   Patent Document 2 discloses a technique for extracting a tempo based on the strength and frequency of music data (musical sound data) and setting a slide effect time such as fade-in / fade-out of image display in accordance with the extracted tempo. It is disclosed. In the case of such technology, the tempo of music and the slide effect are increased by increasing the slide effect time for fast-tempo music (music) and conversely for the slow-tempo music. And consistency.

また、特許文献3には、音楽データの内容から、フェードイン/フェードアウト、テンポの変化といった所定の音楽変化を検出し、その検出した音楽変化に基づいて、フェードイン、フェードアウト、クロスフェード、モザイク、ワイプ、フラッシュ、色調の変更といった所定の映像効果を画像データ(映像データ)に対して付与する技術が開示されている。
特開2000−148107号公報 特開2003−249051号公報 特開2004−240077号公報
In Patent Document 3, predetermined music changes such as fade-in / fade-out and tempo change are detected from the contents of music data, and based on the detected music changes, fade-in, fade-out, cross-fade, mosaic, A technique is disclosed in which predetermined video effects such as wipe, flash, and color tone change are added to image data (video data).
JP 2000-148107 A JP 2003-249051 A JP 2004-240077 A

このように、従来のスライドショーでは、再生する音楽データのリズムを解析し、解析したリズムに基づいて画像データの表示制御を行っている。しかし、音楽データによっては、リズム解析が困難となる部分があった。このようなリズムが正確に解析されない部分では、画像データの再生が音楽のテンポやタイミングに合わないといった不自然な再生となってしまうという問題があった。   As described above, in the conventional slide show, the rhythm of the music data to be reproduced is analyzed, and display control of the image data is performed based on the analyzed rhythm. However, depending on the music data, there is a part that makes rhythm analysis difficult. In such a portion where the rhythm is not accurately analyzed, there is a problem that the reproduction of the image data becomes unnatural reproduction that does not match the tempo and timing of the music.

上記事情に鑑み、本発明は、適確なリズム解析ができない部分においても、画像データの自然な切り換え表示を行えるようにすること目的としている。   In view of the above circumstances, an object of the present invention is to enable natural switching display of image data even in a portion where accurate rhythm analysis cannot be performed.

上記課題を解決するために、請求項1に記載の発明は、
画像データを記憶する画像データ記憶手段(例えば、図1のRAM60)と、
音楽データを記憶する音楽データ記憶手段(例えば、図1のROM50)と、
この音楽データ記憶手段に記憶された音楽データを再生した音楽のリズムを検出する検出手段(例えば、図1のCPU10)と、
この検出手段により検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度を判定する判定手段(例えば、図1のCPU10)と、
前記画像データ記憶手段に記憶された画像データを前記検出手段により検出されたリズムに基づいて切り換え表示していくことにより、前記音楽データ記憶手段に記憶された音楽データの再生に同期した切り換え表示を行うとともに、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分と満たさない部分では該切り換え表示の態様を異なるものとなるよう制御する切換表示制御手段(例えば、図1のCPU10)と、
を備えることを特徴とする画像処理装置(例えば、図1の画像処理装置1)である。
In order to solve the above-mentioned problem, the invention described in claim 1
Image data storage means for storing image data (for example, the RAM 60 of FIG. 1);
Music data storage means for storing music data (for example, ROM 50 in FIG. 1);
Detection means (for example, the CPU 10 in FIG. 1) for detecting the rhythm of the music reproduced from the music data stored in the music data storage means;
A determination means (for example, the CPU 10 in FIG. 1) for determining reliability indicating the appropriateness of the rhythm at each timing based on the rhythm detected by the detection means;
By switching and displaying the image data stored in the image data storage means based on the rhythm detected by the detection means, a switching display synchronized with the reproduction of the music data stored in the music data storage means is performed. And a switching display control means for controlling the switching display mode to be different between a portion in which the reliability determined by the determination means in the music data satisfies a predetermined low reliability condition and a portion that does not satisfy the predetermined low reliability condition. (For example, CPU 10 in FIG. 1);
An image processing apparatus (for example, the image processing apparatus 1 in FIG. 1).

請求項2に記載の発明は、請求項1に記載の画像処理装置において、
前記判定手段は、各タイミングにおける音楽データの自己相関値に基づいて定まる値を信頼度として判定することを特徴とする。
The invention according to claim 2 is the image processing apparatus according to claim 1,
The determining means determines a value determined based on an autocorrelation value of music data at each timing as a reliability.

請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画面書き換え速度の遅い切り換え表示を行うことを特徴とする。
The invention according to claim 3 is the image processing apparatus according to claim 1 or 2,
The switching display control means performs switching display with a slow screen rewriting speed when reproducing a portion of the music data in which the reliability determined by the determination means satisfies a predetermined low reliability condition. And

請求項4に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画像データの切り換え表示頻度を低下させることを特徴とする。
The invention according to claim 4 is the image processing apparatus according to claim 1 or 2,
The switching display control means reduces the switching display frequency of image data during reproduction of a portion of the music data in which the reliability determined by the determination means satisfies a predetermined low reliability condition. And

請求項5に記載の発明は、請求項3に記載の画像処理装置において、
前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が前記低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、画面書き換え速度の遅い切り換え表示を行うことを特徴とする。
The invention according to claim 5 is the image processing apparatus according to claim 3,
The switching display control unit is configured to display a screen for a portion of the music data in which the reliability determined by the determination unit does not satisfy the low reliability condition and the sound pressure level satisfies a predetermined low level condition. It is characterized by switching display with a slow rewrite speed.

請求項6に記載の発明は、請求項4に記載の画像処理装置において、
前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が前記低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、切り換え表示頻度を低下させることを特徴とする。
The invention according to claim 6 is the image processing apparatus according to claim 4,
The switching display control means switches the portion of the music data in which the reliability determined by the determination means does not satisfy the low reliability condition and the sound pressure level satisfies a predetermined low level condition. The display frequency is reduced.

請求項7に記載の発明は、
コンピュータに、音楽データを再生した音楽に同期した画像データの切り換え表示を行わせるためのプログラム(例えば、図1の同期再生プログラム51)であって、
前記音楽データを再生した音楽のリズムを検出する検出機能(例えば、図11のステップS33〜S41)と、
この検出機能により検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度を判定する判定機能(例えば、図11のステップS43)と、
前記画像データを前記検出機能により検出されたリズムに基づいて切り換え表示していくことにより、前記音楽データの再生に同期した切り換え表示を行うとともに、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分と満たさない部分では該切り換え表示の態様を異なるものとなるよう制御する切換表示制御機能(例えば、図10のステップS9〜S15)と、
を前記コンピュータに実現させるためのプログラムである。
The invention described in claim 7
A program for causing a computer to switch and display image data synchronized with music that has been reproduced from music data (for example, the synchronous reproduction program 51 in FIG. 1),
A detection function (for example, steps S33 to S41 in FIG. 11) for detecting the rhythm of the music from which the music data is reproduced;
A determination function (for example, step S43 in FIG. 11) for determining reliability indicating the rhythm accuracy at each timing based on the rhythm detected by the detection function;
By switching and displaying the image data based on the rhythm detected by the detection function, switching display synchronized with the reproduction of the music data is performed, and among the music data, the determination unit determines A switching display control function (for example, steps S9 to S15 in FIG. 10) for controlling the switching display mode to be different between a portion where reliability satisfies a predetermined low reliability condition and a portion where reliability is not satisfied ;
Is a program for causing the computer to realize the above.

請求項1又は7に記載の発明によれば、音楽データを再生した音楽のリズムが検出され、検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度が判定される。そして、検出されたリズムに基づくことで音楽データの再生に同期した切り換え表示が行われるとともに、判定された信頼度に基づいて切り換え表示の態様が制御される。即ち、検出されたリズムの信頼度に基づいて画像データの切り換え表示の態様が制御されるので、音楽データにリズムが適確に検出されない部分が含まれる場合であっても、自然な画像データの切り換え表示を実現し得る。   According to the first or seventh aspect of the invention, the rhythm of the music from which the music data is reproduced is detected, and the reliability indicating the rhythm accuracy at each timing based on the detected rhythm is determined. Then, based on the detected rhythm, switching display synchronized with music data reproduction is performed, and the mode of switching display is controlled based on the determined reliability. That is, since the image data switching display mode is controlled based on the reliability of the detected rhythm, even if the music data includes a portion where the rhythm is not properly detected, the natural image data A switching display can be realized.

請求項2に記載の発明によれば、信頼度は、検出されたリズムに基づく各タイミングにおける音楽データの自己相関値に基づいて定められる。   According to the invention described in claim 2, the reliability is determined based on the autocorrelation value of the music data at each timing based on the detected rhythm.

請求項3に記載の発明によれば、音楽データのうち、判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画面書き換え速度の遅い切り換え表示が行われる。従って、例えば検出されたリズムが本来のリズムからずれている場合、このずれによって画像データの切り換え表示が本来のリズムからずれたものとなるが、信頼度が低信頼度条件を満たす、即ちリズムが適確に検出されていないと判定された部分については画面書き換えが他の部分と比較してゆっくり行われることで、検出されたリズムのずれによる画像データの書き換え表示のずれをユーザに感じさせること無く、自然な切り換え表示が実現され得る。   According to the third aspect of the present invention, when the portion of the music data in which the determined reliability satisfies the predetermined low reliability condition is reproduced, switching display with a slow screen rewriting speed is performed. Therefore, for example, when the detected rhythm deviates from the original rhythm, this deviation causes the image data switching display to deviate from the original rhythm, but the reliability satisfies the low reliability condition, that is, the rhythm is For parts that are determined not to be detected properly, screen rewriting is performed more slowly than other parts, making the user feel the image data rewriting display shift due to the detected rhythm shift. And a natural switching display can be realized.

請求項4に記載の発明によれば、音楽データのうち、判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画像データの切り換え表示頻度が低下される。従って、例えばテンポの遅い音楽での画像データの頻繁な切り換えはユーザに違和感を与えることになるが、リズムが適確に検出されていないと判定された部分については、画像データの切り換え頻度が低下される、即ち他の部分に比較して頻繁な画像データの切り換えが行われないことで、テンポの遅い音楽なのに画像データが頻繁に切り換えられるといった違和感をユーザに与えることなく、自然な画像データの切り換え表示が実現される。   According to the fourth aspect of the present invention, when reproducing a portion of the music data in which the determined reliability satisfies the predetermined low reliability condition, the switching display frequency of the image data is reduced. Therefore, for example, frequent switching of image data in music with a slow tempo will give the user a sense of incongruity, but the switching frequency of the image data is reduced for portions where the rhythm is determined not to be detected properly. In other words, since the image data is not frequently switched compared to other parts, the natural image data can be reproduced without giving the user a sense of incongruity that the image data is frequently switched even though the music is slow in tempo. Switching display is realized.

請求項5に記載の発明によれば、音楽データのうち、判定された信頼度が所定の低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、画面書き換え速度の遅い切り換え表示が行われる。従って、リズムが適確に検出されていると判定されている部分であっても、音圧レベルが低レベル条件を満たす、即ち音圧レベルが低い部分については、画面書き換えがゆっくり行われることで、例えば音量が小さな部分から大きな音量へ大きく変化する部分で、ゆっくりであった画面の書き換えが素早い書き換えに変化するといった、より自然な画像データの切り換え表示が実現される。   According to the fifth aspect of the present invention, a portion of the music data in which the determined reliability does not satisfy the predetermined low reliability condition and the sound pressure level satisfies the predetermined low level condition is displayed on the screen. Switching display with slow rewriting speed is performed. Therefore, even if it is determined that the rhythm is accurately detected, the sound pressure level satisfies the low level condition, that is, the portion where the sound pressure level is low, the screen rewriting is performed slowly. For example, a more natural image data switching display is realized in which a slow screen rewrite changes to a quick rewrite in a portion where the volume greatly changes from a low volume to a high volume.

請求項6に記載の発明によれば、音楽データのうち、判定された信頼度が所定の低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、画像データの切り換え表示頻度が低下される。従って、リズムが適確に検出されていると判定されている部分であっても音圧レベルが低い部分については、他の部分に比較して頻繁な画像データの切り換えが行われないことで、音量が小さい部分で頻繁に画像データが切り換えられるといった違和感をユーザに与えることなく、自然な画像データの切り換え表示が実現される。   According to the invention described in claim 6, a portion of the music data in which the determined reliability does not satisfy the predetermined low reliability condition and the sound pressure level satisfies the predetermined low level condition, Data switching display frequency is reduced. Therefore, even if it is determined that the rhythm is properly detected, the image data is not frequently switched compared to the other portions for the portion where the sound pressure level is low. Natural image data switching display is realized without giving the user a sense of incongruity that the image data is frequently switched at a low volume.

以下、図面を参照して、本発明に好適な実施形態を説明する。   Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings.

[画像処理装置の構成]
図1は、本実施形態における画像処理装置1のブロック構成図である。この画像処理装置1は、音楽データの再生に同期して画像データの切り換え表示を行うものであり、同図によれば、CPU10と、入力部20と、表示部30と、音声出力部40と、ROM50と、RAM60とを備えて構成される。
[Configuration of image processing apparatus]
FIG. 1 is a block diagram of an image processing apparatus 1 according to this embodiment. The image processing apparatus 1 performs switching display of image data in synchronization with the reproduction of music data. According to the figure, the CPU 10, the input unit 20, the display unit 30, and the audio output unit 40 are displayed. The ROM 50 and the RAM 60 are provided.

CPU10は、所定のタイミングでROM50に記憶されているプログラムを読み出してRAM60内に展開し、当該プログラムに基づいて画像処理装置1を構成する各部への指示やデータ転送等を行う。特に、本実施形態では、同期再生プログラム51に従った同期再生処理(図10参照)を実行する。   The CPU 10 reads out a program stored in the ROM 50 at a predetermined timing and develops it in the RAM 60, and performs instructions, data transfer, and the like to each unit constituting the image processing apparatus 1 based on the program. In particular, in the present embodiment, a synchronized playback process (see FIG. 10) according to the synchronized playback program 51 is executed.

具体的には、同期再生処理において、CPU10は、先ず、RAM60に記憶されている音楽データ62を対象とするリズム検出処理を行って、該音楽データ62の検出したリズム及びその信頼度に関するデータであるリズムデータ67を生成する。   Specifically, in the synchronous playback process, the CPU 10 first performs a rhythm detection process on the music data 62 stored in the RAM 60, and uses the data relating to the detected rhythm and its reliability. A certain rhythm data 67 is generated.

詳細には、リズム検出処理において、CPU10は、図2に示すように、音楽データ62を複数のフレームに分割する。図2は、音楽データ62に基づく音声波形の一部を示す図である。同図に示すように、CPU10は、音楽データ62に基づく音声波形を、その先頭から、時間Mずつずらした長さNの複数のフレームF1,F2,・・、に分割する。ここで、時間M及びフレームの長さNは適当に設定して良く、例えば、M=0.5[秒]、N=4[秒]、程度に設定する。但し、M<N、とする。   Specifically, in the rhythm detection process, the CPU 10 divides the music data 62 into a plurality of frames as shown in FIG. FIG. 2 is a diagram showing a part of a speech waveform based on the music data 62. As shown in the figure, the CPU 10 divides the audio waveform based on the music data 62 into a plurality of frames F1, F2,... Here, the time M and the frame length N may be set appropriately. For example, M = 0.5 [seconds] and N = 4 [seconds] are set. However, M <N.

次いで、CPU10は、分割した各フレームの音声信号の自己相関関数を導出する。具体的には、各フレームについて、その音声信号をローパスフィルタに通過させて高域成分を遮断し、低域成分を抽出する。次に、抽出した低域成分の信号に対するFFT(Fast Fourier Transform)演算を行ってフーリエスペクトラムを算出し、更に二乗してパワースペクトルを算出する。そして、算出したパワースペクトルに対する逆FTT演算を行って、該フレームの音声信号の自己相関関数を導出する。   Next, the CPU 10 derives an autocorrelation function of the audio signal of each divided frame. Specifically, for each frame, the audio signal is passed through a low-pass filter to block high-frequency components and extract low-frequency components. Next, an FFT (Fast Fourier Transform) operation is performed on the extracted low-frequency component signal to calculate a Fourier spectrum, and further squared to calculate a power spectrum. Then, an inverse FTT operation is performed on the calculated power spectrum to derive an autocorrelation function of the audio signal of the frame.

図3は、1つのフレームについての自己相関関数の一例を示すグラフである。同図において、横軸はサンプル数即ち時間であり、縦軸は相関関数値である。   FIG. 3 is a graph showing an example of the autocorrelation function for one frame. In the figure, the horizontal axis represents the number of samples, that is, time, and the vertical axis represents the correlation function value.

そして更に、図4に示すように、このグラフの横軸を、曲のテンポを表す単位であるBPM(Beat Per Minute)に変換する。図4は、自己相関関数のグラフの横軸を、サンプル数からBPMに変換した一例を示すグラフである。サンプル数からBPMへの変換は、次のように行う。即ち、1フレームの長さNを「N[秒]」とし、自己相関関数を導出する際のサンプル数を「X」とした場合、1サンプルは、時間t=M/X[秒]、に相当する。つまり、xサンプル目は、時間T=t×x[秒]、に相当し、これをBPMで表現すると、60/T=60/(t×x)、となる。例えば、N=4[秒]、X=2052、とした場合、1サンプルは、時間t=0.001949[秒](=4/2052)に相当する。横軸をBPMとしたフレーム毎の自己相関関数は、フレーム自己相関データ63としてRAM60に記憶される。   Further, as shown in FIG. 4, the horizontal axis of this graph is converted into BPM (Beat Per Minute) which is a unit representing the tempo of the music. FIG. 4 is a graph showing an example in which the horizontal axis of the autocorrelation function graph is converted from the number of samples into BPM. Conversion from the number of samples to BPM is performed as follows. That is, assuming that the length N of one frame is “N [seconds]” and the number of samples in deriving the autocorrelation function is “X”, one sample is at time t = M / X [seconds]. Equivalent to. That is, the x-th sample corresponds to time T = t × x [seconds], which is expressed as BPM as 60 / T = 60 / (t × x). For example, when N = 4 [seconds] and X = 2052, one sample corresponds to time t = 0.0001949 [seconds] (= 4/2052). The autocorrelation function for each frame with the horizontal axis as BPM is stored in the RAM 60 as frame autocorrelation data 63.

続いて、CPU10は、導出したフレーム毎の自己相関関数を基に、各フレームのBPM候補値を算出する。具体的には、各フレームについて、導出した自己相関関数の所定のBPM範囲内において、自己相関値のピーク値のうち、その値が最大のものから順に所定数(例えば、5個)選択する。そして、これら選択した各ピーク値に対応するBPMの値を、当該フレームにおけるBPM候補値とする。尚、上記所定のBPM範囲は、例えば一般的な音楽のBPMの範囲である「50〜200」程度に設定される。   Subsequently, the CPU 10 calculates a BPM candidate value for each frame based on the derived autocorrelation function for each frame. Specifically, for each frame, within a predetermined BPM range of the derived autocorrelation function, a predetermined number (for example, 5) is selected in order from the peak value of the autocorrelation value in the maximum. Then, the BPM value corresponding to each selected peak value is set as the BPM candidate value in the frame. The predetermined BPM range is set to, for example, about “50 to 200” which is a BPM range of general music.

算出したBPM候補値は、対応するピーク値とともに、フレーム解析データ64としてRAM60に記憶される。図5に、フレーム解析データ64のデータ構成の一例を示す。同図によれば、フレーム解析データ64は、音楽データ62を分割したフレーム64a毎に、複数(同図では、5)のBPM候補値64bとピーク値64cとを対応付けて格納している。   The calculated BPM candidate value is stored in the RAM 60 as frame analysis data 64 together with the corresponding peak value. FIG. 5 shows an example of the data structure of the frame analysis data 64. According to the figure, the frame analysis data 64 stores a plurality of (5 in the figure) BPM candidate values 64b and peak values 64c in association with each frame 64a obtained by dividing the music data 62.

各フレームについてBPM候補値を算出すると、CPU10は、近似する値同士のグループとなるように、算出した各BPM候補値をグループ化する。そして、各グループについて、BPM候補値の平均値と、ピーク値の累積値とを算出する。   When the BPM candidate values are calculated for each frame, the CPU 10 groups the calculated BPM candidate values so as to form a group of approximate values. Then, for each group, an average value of BPM candidate values and a cumulative value of peak values are calculated.

ここでグループ化したBPM候補値は、BPM決定用データ65としてRAM60に記憶される。図6に、BPM決定用データ65のデータ構成の一例を示す。同図によれば、BPM決定用データ65は、グループ65a毎に、属するBPM候補値665とピーク値65cとを対応付けて格納しているとともに、BPM候補値65bの平均65dと、ピーク値65cの累積65eとを格納している。   The BPM candidate values grouped here are stored in the RAM 60 as BPM determination data 65. FIG. 6 shows an example of the data configuration of the BPM determination data 65. According to the figure, the BPM determination data 65 stores the BPM candidate value 665 and the peak value 65c belonging to each group 65a in association with each other, and the average 65d of the BPM candidate value 65b and the peak value 65c. Is stored.

また同図は、図5に示したフレーム解析データ64に基づく場合を示しており、「62」に近いBPM候補値をグループ化した第1グループ、「123」に近いBPM候補値をグループ化した第2グループ、「246」に近いBPM値をグループ化した第3グループ、・・、にグループ化されている。   This figure also shows a case based on the frame analysis data 64 shown in FIG. 5, in which a BPM candidate value close to “62” is grouped, and a BPM candidate value close to “123” is grouped. The second group is grouped into a third group obtained by grouping BPM values close to “246”.

次いで、CPU10は、これら複数のグループのうち、ピーク値の累積値が最も大きいグループを判定し、その判定したグループのBPM候補値の平均値を、音楽データ62のBPMとして決定する。例えば図6の場合、ピーク値の累積値が「287.1」で最も大きい第2グループが判定され、この第2グループのBPM候補値の平均値「123.8」が音楽データ62のBPMとして決定される。ここで決定したBPMは、BPM決定値データ66としてRAM60に記憶される。   Next, the CPU 10 determines a group having the largest accumulated peak value from among the plurality of groups, and determines an average value of BPM candidate values of the determined group as the BPM of the music data 62. For example, in the case of FIG. 6, the second group having the largest accumulated peak value “287.1” is determined, and the average value “123.8” of the BPM candidate values of the second group is determined as the BPM of the music data 62. It is determined. The BPM determined here is stored in the RAM 60 as BPM determined value data 66.

音楽データ62のBPMを決定すると、CPU10は、続いて、その決定したBPMを基に拍の間隔Lを算出する。拍の間隔LはBPMの逆数で与えられ、例えばBPMが「120」の場合、拍の間隔Lは、L=0.5(=60[s]/120)、となる。   When the BPM of the music data 62 is determined, the CPU 10 subsequently calculates the beat interval L based on the determined BPM. The beat interval L is given by the reciprocal of BPM. For example, when BPM is “120”, the beat interval L is L = 0.5 (= 60 [s] / 120).

続いて、CPU10は、音楽データ62における拍の位置Rを決定する。具体的には、フレーム自己相関データ63を参照して、音楽データ62を分割した複数のフレームのうちから、全フレームを通して音圧レベル(音声波形の振幅)が最大のピーク値を含む1つのフレームを選択する。次いで、図7に示すように、その選択したフレームにおける音圧レベルが最大の位置を、当該音楽データ62における拍の基準位置とする。図7は、音楽データ62に基づく、最大のピーク値の位置を含む複数フレーム分の音声波形を示している。   Subsequently, the CPU 10 determines the beat position R in the music data 62. Specifically, with reference to the frame autocorrelation data 63, one frame including a peak value having the maximum sound pressure level (amplitude of the speech waveform) through all the frames among a plurality of frames obtained by dividing the music data 62. Select. Next, as shown in FIG. 7, the position with the maximum sound pressure level in the selected frame is set as the reference position of the beat in the music data 62. FIG. 7 shows audio waveforms for a plurality of frames including the position of the maximum peak value based on the music data 62.

そして、CPU10は、音楽データ62に基づく音声波形全体に対して、決定した拍の基準位置を基準として、算出した拍の間隔Lで拍の位置Rを決定する。   Then, the CPU 10 determines the beat position R at the calculated beat interval L with respect to the determined beat reference position for the entire speech waveform based on the music data 62.

その後、CPU10は、決定した各拍の位置Rにおけるリズムの適確性を示す信頼度を算出する。具体的には、各拍の位置Rについて、図8に示すように、音楽データ62を分割した複数のフレームのうちから、当該拍の位置Rを含むフレームを選択する。図8は、音楽データ62に基づく音声波形の一部を示している。ここで、フレームは時間Mずつずらして生成されているので、ある拍の位置Rを含むフレームとして複数のフレームが存在する。例えば同図の場合、拍の位置Rを含むフレームとして、フレームFn+1,Fn+2,Fn+3の3つのフレームが選択される。   Thereafter, the CPU 10 calculates a reliability indicating the accuracy of the rhythm at the determined position R of each beat. Specifically, for each beat position R, a frame including the beat position R is selected from a plurality of frames obtained by dividing the music data 62 as shown in FIG. FIG. 8 shows a part of a speech waveform based on the music data 62. Here, since the frames are generated while being shifted by time M, there are a plurality of frames as frames including the position R of a certain beat. For example, in the case of the figure, three frames Fn + 1, Fn + 2, and Fn + 3 are selected as frames including the beat position R.

そして、CPU10は、これら選択した各フレームについて、決定した当該音楽データ62のBPMに対応する自己相関値を算出し、算出した自己相関値の平均値に所定係数を乗じた値を、当該拍の位置Rにおける信頼度とする。   Then, the CPU 10 calculates an autocorrelation value corresponding to the determined BPM of the music data 62 for each selected frame, and multiplies the average value of the calculated autocorrelation values by a predetermined coefficient, The reliability at the position R is assumed.

このように算出した各拍の位置Rについての信頼度は、該拍の位置Rと対応付けられ、当該音楽データ62に対応するリズムデータ67としてRAM60に記憶される。図9は、リズムデータ67のデータ構成の一例を示す図である。同図に示すように、リズムデータ67は、拍の位置67aと信頼度67bとを対応付けて格納している。ここで、拍の位置67aは、該当する音楽データ62の先頭位置(再生開始位置)をゼロとした値で表現されている。   The reliability of the beat position R calculated in this way is associated with the beat position R and stored in the RAM 60 as rhythm data 67 corresponding to the music data 62. FIG. 9 is a diagram illustrating an example of the data configuration of the rhythm data 67. As shown in the figure, the rhythm data 67 stores a beat position 67a and a reliability 67b in association with each other. Here, the beat position 67a is expressed by a value in which the head position (reproduction start position) of the corresponding music data 62 is zero.

リズム検出処理を終了すると、CPU10は、音楽データ62の再生を開始し、該音楽データ62に基づく音楽を音声出力部40から出力させるとともに、生成したリズムデータ67を参照して、音楽に同期させて画像データ61に基づく画像を表示部30に切り換え表示させる。   When the rhythm detection process is finished, the CPU 10 starts to reproduce the music data 62, and outputs music based on the music data 62 from the audio output unit 40, and synchronizes with the music by referring to the generated rhythm data 67. Thus, an image based on the image data 61 is switched and displayed on the display unit 30.

具体的には、リズムデータ67で指定される拍の位置Rが到来する毎に、当該到来した拍の位置Rに対応する信頼度が、信頼度閾値データ68で指定される、低信頼度条件である閾値を超えたか否かを判断し、判断結果に応じた画面書き換え速度で次の画像への切り換え表示を行う。画面書き換え速度とは、短時間当たりに画面を書き換える量を指し、画面書き換え速度が速い程、より短時間で次の画像に書き換わることになる。本実施形態では、画面書き換え速度として、通常の速度と、この通常の速度より遅い速度との2つの速度があるとする。即ち、信頼度が閾値を超えた場合には、画面書き換え速度を通常の速度として画面の表示を切り換える。また、信頼度が閾値を超えない場合には、画面書き換え速度を遅い速度として画面の表示を切り換える。   Specifically, each time the beat position R specified by the rhythm data 67 arrives, the reliability corresponding to the arrived beat position R is specified by the reliability threshold data 68. It is determined whether or not a certain threshold value is exceeded, and switching to the next image is displayed at a screen rewriting speed according to the determination result. The screen rewriting speed refers to the amount of screen rewriting per short time, and the faster the screen rewriting speed, the faster the next image is rewritten. In this embodiment, it is assumed that there are two screen rewriting speeds: a normal speed and a speed slower than the normal speed. That is, when the reliability exceeds the threshold, the screen display is switched with the screen rewriting speed set to the normal speed. When the reliability does not exceed the threshold value, the screen display is switched with the screen rewriting speed set as a slow speed.

ここで、通常の画面書き換え速度による画面書き換えと、通常より遅い速度による画面書き換えとの組み合わせの例としては、例えば全画面書き換えとフェードイン/フェードアウトの組み合わせがある。また、双方において、例えばディゾルブやワイプといった同じ画面書き換え技法を用い、その完了までに要する時間を異ならせることによって、通常の書き換え速度と遅い書き換え速度とを実現することとしても良い。   Here, as an example of a combination of screen rewriting at a normal screen rewriting speed and screen rewriting at a slower speed than normal, for example, there is a combination of full screen rewriting and fade-in / fade-out. Moreover, it is good also as implement | achieving normal rewriting speed and slow rewriting speed | velocity | rate by using the same screen rewriting technique, such as a dissolve and a wipe, and making time required for the completion differ in both.

図1において、入力部20は、例えばスイッチやキーボード、マウス、各種センサ等を有して構成され、ユーザによる操作に応じた操作信号をCPU10に出力する。   In FIG. 1, the input unit 20 includes, for example, a switch, a keyboard, a mouse, various sensors, and the like, and outputs an operation signal corresponding to an operation by a user to the CPU 10.

表示部30は、LCD(Liquid Crystal Display)やELD(Electro Luminescence Display)、PDP(Plasma Display Panel)等のモニタを有して構成され、CPU10から入力される画像信号に従った画像、特に、本実施形態では、CPU10の制御に従って画像データ61に基づく画像を切り換え表示する。   The display unit 30 includes a monitor such as an LCD (Liquid Crystal Display), an ELD (Electro Luminescence Display), or a PDP (Plasma Display Panel), and an image according to an image signal input from the CPU 10, In the embodiment, images based on the image data 61 are switched and displayed according to the control of the CPU 10.

音声出力部40は、D/A変換器や増幅器、スピーカ等を有して構成され、CPU10から入力される音声信号に従った音声、特に本実施形態では、音楽データ62に基づく音楽を出力する。   The audio output unit 40 includes a D / A converter, an amplifier, a speaker, and the like, and outputs audio according to an audio signal input from the CPU 10, particularly music based on the music data 62 in the present embodiment. .

ROM50は、画像処理装置1にかかるシステムプログラムやアプリケーションプログラム、本実施形態を実現するためのプログラムやデータ等を記憶する。特に、本実施形態では、同期再生処理(図10参照)を実現するための同期再生プログラム51を記憶している。   The ROM 50 stores system programs and application programs for the image processing apparatus 1, programs and data for realizing the present embodiment, and the like. In particular, in this embodiment, a synchronized playback program 51 for realizing synchronized playback processing (see FIG. 10) is stored.

RAM60は、CPU10の作業領域として用いられ、ROM50から読み出されたプログラムやデータ、CPU10で処理されたデータを一時的に記憶する。特に、本実施形態では、画像データ61と、音楽データ62と、フレーム自己相関データ63と、フレーム解析データ64と、BPM決定用データ65と、BPM決定値データ66と、リズムデータ67と、信頼度閾値データ68とを記憶する。   The RAM 60 is used as a work area of the CPU 10 and temporarily stores programs and data read from the ROM 50 and data processed by the CPU 10. In particular, in the present embodiment, the image data 61, the music data 62, the frame autocorrelation data 63, the frame analysis data 64, the BPM determination data 65, the BPM determination value data 66, the rhythm data 67, the reliability Degree threshold data 68 is stored.

画像データ61は、複数の画像群からなるデータであり、例えばメモリカード等の外部情報記憶媒体から読み出されたデータ、或いは、インターネット等の通信回線を介して他装置から取り込んだデータ等である。また、音楽データ62は、CD等の外部情報記憶媒体から読み込んだデータ、或いは、上述の通信回線を介して他装置から取り込んだデータ等である。   The image data 61 is data composed of a plurality of image groups, for example, data read from an external information storage medium such as a memory card, or data taken from another device via a communication line such as the Internet. . The music data 62 is data read from an external information storage medium such as a CD, or data read from another device via the communication line described above.

[処理の流れ]
次に、画像処理装置1における処理の流れを説明する。
図10は、同期再生処理の流れを説明するためのフローチャートである。この処理は、例えば入力部20から再生指示が入力された場合に、CPU10が同期再生プログラム51に従った処理を実行することで実現される。
[Process flow]
Next, the flow of processing in the image processing apparatus 1 will be described.
FIG. 10 is a flowchart for explaining the flow of the synchronous reproduction process. This process is realized by the CPU 10 executing a process according to the synchronized playback program 51 when a playback instruction is input from the input unit 20, for example.

同図によれば、CPU10は、先ず、入力部20からの入力指示等に従って、再生する音楽データ62及び画像データ61を指定する(ステップS1)。そして、指定された音楽データ62を対象とするリズム検出処理を実行し、当該音楽データ62に対応するリズムデータ67を生成する(ステップS3)。   According to the figure, the CPU 10 first designates music data 62 and image data 61 to be reproduced in accordance with an input instruction from the input unit 20 (step S1). Then, rhythm detection processing for the designated music data 62 is executed to generate rhythm data 67 corresponding to the music data 62 (step S3).

図11は、リズム検出処理の流れを説明するためのフローチャートである。同図によれば、CPU10は、対象としている音楽データ62を、時間Mづつずらした長さNの複数のフレームに分割する(ステップS31)。   FIG. 11 is a flowchart for explaining the flow of the rhythm detection process. According to the figure, the CPU 10 divides the target music data 62 into a plurality of frames of length N shifted by time M (step S31).

次いで、分割した各フレームの音声信号について自己相関関数を導出する(ステップS33)。そして、各フレームについて、導出した自己相関関数における所定のBPM範囲内で、BPM候補値とそのピーク値とを算出する(ステップS35)。即ち、上述のように、各フレームの自己相関関数における所定のBPM範囲内で、ピーク値が最大となる所定数のBPMの値をBPM候補値とする。   Next, an autocorrelation function is derived for the audio signal of each divided frame (step S33). Then, for each frame, a BPM candidate value and its peak value are calculated within a predetermined BPM range in the derived autocorrelation function (step S35). That is, as described above, a predetermined number of BPM values having a maximum peak value within a predetermined BPM range in the autocorrelation function of each frame are set as BPM candidate values.

続いて、CPU10は、算出した各フレームのBPM候補値及びそのピーク値を基に、音楽データ62のBPMを決定する(ステップS37)。即ち、上述のように、算出した各フレームのBPM候補値を近似する値同士でグループ化し、これら複数のグループのうちから、ピーク値の累積値が最大となるグループを選択する。そして、その選択したグループのBPM候補値の平均値を、該音楽データ62のBPMとして決定する。   Subsequently, the CPU 10 determines the BPM of the music data 62 based on the calculated BPM candidate value and peak value of each frame (step S37). That is, as described above, the calculated BPM candidate values of each frame are grouped together to approximate each other, and a group having the maximum peak value is selected from the plurality of groups. Then, the average value of the BPM candidate values of the selected group is determined as the BPM of the music data 62.

その後、CPU10は、決定したBPMの逆数を演算することで拍の間隔Lを算出する(ステップS39)。そして、ピーク値の最大値を含むフレームにおいて音圧レベルが最大となる位置を、音楽データ62における拍の基準位置として算出し、この拍の基準位置を基準として、拍の間隔Lで各拍の位置Rを算出する(ステップS41)。   Thereafter, the CPU 10 calculates the beat interval L by calculating the reciprocal of the determined BPM (step S39). Then, the position where the sound pressure level is maximized in the frame including the maximum peak value is calculated as the reference position of the beat in the music data 62, and each beat has an interval L of beats with the reference position of the beat as a reference. The position R is calculated (step S41).

続いて、CPU10は、算出した各拍の位置Rにおける信頼度を算出する(ステップS43)。即ち、上述のように、各拍の位置Rについて、該拍の位置Rを含む各フレームにおける当該音楽データ62のBPMに対応する自己相関値の平均値に所定の係数を乗じた値を、当該拍の位置Rの信頼度とする。そして、各拍の位置Rと算出した信頼度とを対応付けて、リズムデータ67を生成する。
以上の処理を行うと、このリズム検出処理は終了となる。
Subsequently, the CPU 10 calculates the reliability at the calculated position R of each beat (step S43). That is, as described above, for each beat position R, an average value of autocorrelation values corresponding to the BPM of the music data 62 in each frame including the beat position R is multiplied by a predetermined coefficient, The reliability of the beat position R is used. Then, the rhythm data 67 is generated by associating the position R of each beat with the calculated reliability.
When the above processing is performed, this rhythm detection processing is completed.

リズム検出処理を終了すると、CPU10は、指定された音楽データ62の再生を開始する(ステップS5)。そして、音楽再生が終了するまでの間(ステップS7:NO)、次の処理を繰り返す。   When the rhythm detection process ends, the CPU 10 starts playing the designated music data 62 (step S5). Then, the next process is repeated until the music reproduction ends (step S7: NO).

即ち、リズムデータ67で指定される拍の位置Rのタイミングが到来すると(ステップS9:YES)、CPU10は、リズムデータ67において該拍の位置Rに対応付けられている信頼度が、信頼度閾値データ68で指定される閾値を超えるか否かを判断する。   That is, when the timing of the beat position R specified by the rhythm data 67 arrives (step S9: YES), the CPU 10 determines that the reliability associated with the beat position R in the rhythm data 67 is the reliability threshold value. It is determined whether or not a threshold value specified by the data 68 is exceeded.

信頼度が閾値を超える場合(ステップS11:YES)、CPU10は、通常の書き換え速度で、表示部30に表示されている現在の表示画像から次の画像に切り換える(ステップS13)。また、信頼度が所定の閾値を超えない場合には(ステップS11:NO)、上記通常の速度より遅い画面書き換え速度で、次の画像に切り換える(ステップS15)。
そして、音楽データ62の再生が終了すると(ステップS7:YES)、この同期再生処理は終了となる。
When the reliability exceeds the threshold (step S11: YES), the CPU 10 switches from the current display image displayed on the display unit 30 to the next image at a normal rewriting speed (step S13). If the reliability does not exceed the predetermined threshold (step S11: NO), the screen is switched to the next image at a screen rewriting speed slower than the normal speed (step S15).
Then, when the reproduction of the music data 62 is finished (step S7: YES), this synchronous reproduction process is finished.

[具体例]
ここで、本実施形態における具体的な実施例を説明する。
図12は、ある音楽データ62を基に生成されたリズムデータを表すグラフであり、横軸を当該音楽データ62の再生開始からの経過時間[秒]、縦軸を信頼度として、各拍の位置Rでの信頼度をプロットしている。同図において、信頼度の閾値を「80」とすると、再生される音楽の前半部分の「40〜100[秒]」の範囲、後半部分の「310[秒]」付近、及び、終了直前の「430[秒]」付近において、信頼度がこの閾値より小さくなり、画像の書き換え速度がゆっくりとなる。
[Concrete example]
Here, a specific example in the present embodiment will be described.
FIG. 12 is a graph showing rhythm data generated based on certain music data 62. The horizontal axis represents the elapsed time [seconds] from the start of reproduction of the music data 62, and the vertical axis represents the reliability. The reliability at the position R is plotted. In the figure, when the reliability threshold is “80”, the range of “40 to 100 [seconds]” in the first half of the music to be played, the vicinity of “310 [seconds]” in the second half, and just before the end In the vicinity of “430 [seconds]”, the reliability becomes smaller than this threshold value, and the image rewriting speed becomes slow.

[作用・効果]
以上、本実施形態によれば、リズム検出処理により、音楽データ62を再生した音楽のリズムのタイミングである拍の位置Rが算出され、これら各拍の位置Rにおける検出したリズムの適確性を示す信頼度が算出されて、拍の位置Rと信頼度とを対応付けたリズムデータ67が生成される。そして、音楽データ62の再生時には、このリズムデータ67で指定される各拍の位置Rの到来毎に、該拍の位置Rに対応する信頼度が信頼度閾値データ68で指定される閾値を超えるか否かが判断され、超える場合には通常の画面書き換え速度で、超えない場合には上記通常の速度より遅い画面書き換え速度で、次の画像に切り換え表示される。
[Action / Effect]
As described above, according to the present embodiment, the beat position R that is the timing of the rhythm of the music from which the music data 62 is reproduced is calculated by the rhythm detection process, and the accuracy of the detected rhythm at each beat position R is shown. The reliability is calculated, and rhythm data 67 in which the beat position R is associated with the reliability is generated. When the music data 62 is reproduced, every time the beat position R specified by the rhythm data 67 arrives, the reliability corresponding to the beat position R exceeds the threshold specified by the reliability threshold data 68. If it exceeds, the screen is switched to the next image at a normal screen rewriting speed, and if not, the screen is switched at a screen rewriting speed slower than the normal speed.

従って、検出されたリズムが本来のリズムからずれる部分も有り得るが、信頼度が低く閾値を超えない部分については画面書き換え速度を遅くすることで、検出されたリズムのずれによる切り換え表示の違和感をユーザに与えることを防止できる。即ち、音楽データ62にリズムが適確に検出されない部分が含まれる場合であっても、自然な画像データ61の切り換え表示が実現され得る。   Therefore, although the detected rhythm may deviate from the original rhythm, the screen rewriting speed is slowed for the portion where the reliability is low and the threshold is not exceeded, so that the user feels uncomfortable in the switching display due to the detected rhythm shift. Can be prevented. That is, even when the music data 62 includes a portion in which the rhythm is not properly detected, natural switching display of the image data 61 can be realized.

[変形例]
尚、本発明の適用可能な実施形態は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
[Modification]
The applicable embodiments of the present invention are not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention.

(A)信頼度
例えば上述した実施形態では、各拍の位置Rにおける信頼度として、当該拍の位置Rを含む各フレームのBPMに対応する自己相関値に基づく値としたが、これを、この自己相関値に基づく値に、更に、当該拍の位置Rでの音圧レベルに基づく値を加算した値を用いることとしても良い。
(A) Reliability In the above-described embodiment, for example, the reliability at each beat position R is a value based on the autocorrelation value corresponding to the BPM of each frame including the beat position R. A value obtained by adding a value based on the sound pressure level at the position R of the beat to the value based on the autocorrelation value may be used.

図13は、この場合のリズムデータ67Aの一例を示す図である。同図に示すように、リズムデータ67Aは、拍の位置67aと、自己相関値に基づく値67cと、音圧レベル67dと、信頼度67eとを対応付けて格納している。信頼度67eは、自己相関値に基づく値67cと、音圧レベル67dとの和である。   FIG. 13 is a diagram showing an example of the rhythm data 67A in this case. As shown in the figure, the rhythm data 67A stores a beat position 67a, a value 67c based on an autocorrelation value, a sound pressure level 67d, and a reliability 67e in association with each other. The reliability 67e is the sum of the value 67c based on the autocorrelation value and the sound pressure level 67d.

また、図14は、リズムデータ67Aに基づくグラフの一例を示す図である。同図では、横軸を音楽データ62の再生開始からの経過時間とし、縦軸に、各拍の位置Rでの自己相関値に基づく値、音圧レベル及び信頼度の値をプロットしている。   FIG. 14 is a diagram illustrating an example of a graph based on the rhythm data 67A. In the figure, the horizontal axis is the elapsed time from the start of reproduction of the music data 62, and the vertical axis is plotted with values based on autocorrelation values at each beat position R, sound pressure levels, and reliability values. .

図14では、90[秒]付近において音量が一瞬ほぼゼロになるとともにリズムが中断し、その後再度リズムが再開されて音量が一気に回復している。この場合、導出される自己相関値は、その部分において一旦低下した後、徐々に回復する。このため、信頼度を、自己相関値だけではなく、更に音圧レベルにも基づいて算出することで、一旦減少した音量が再度回復する時点で、ゆっくりであった画像書き換え速度が通常の速度に変化するといった、より自然な画像データ61の切り替え表示が実現される。   In FIG. 14, near 90 [seconds], the sound volume becomes almost zero for a moment and the rhythm is interrupted. Then, the rhythm is resumed and the sound volume is recovered at once. In this case, the derived autocorrelation value once decreases at that portion and then gradually recovers. For this reason, by calculating the reliability based not only on the autocorrelation value but also on the sound pressure level, the slow image rewriting speed is restored to the normal speed when the once reduced volume is restored again. A more natural switching display of the image data 61 such as a change is realized.

また、音声信号のスペクトログラムにおいて、ある周波数の値が急に大きくなり、且つその状態が所定時間継続する場合、その位置はコードの変化点であると推測することができる。また、コードが変化する位置は拍の位置である可能性が高い。従って、自己相関関数から算出した拍の位置Rと、スペクトログラムから推測したコード変化位置との一致度を信頼度としても良い。   Further, in the spectrogram of the audio signal, when the value of a certain frequency suddenly increases and the state continues for a predetermined time, it can be estimated that the position is a code change point. Also, the position where the chord changes is likely to be the beat position. Therefore, the degree of coincidence between the beat position R calculated from the autocorrelation function and the chord change position estimated from the spectrogram may be used as the reliability.

(B)リズム検出処理
また、上述した実施形態では、音楽データ62の再生時に、当該音楽データ62を対象としたリズム検出処理を実行して対応するリズムデータ67を生成することとしたが、これを予め生成しておくこととしても良い。具体的には、例えば音楽データ62の再生前、該音楽データ62が読み込まれた際にリズム検出処理を行って対応するリズムデータ67を生成し、その音楽データ62の再生時に、この予め生成したリズムデータ67を読み出して用いることとする。
(B) Rhythm detection processing In the above-described embodiment, when the music data 62 is reproduced, the rhythm detection processing for the music data 62 is executed to generate the corresponding rhythm data 67. May be generated in advance. Specifically, for example, before the music data 62 is reproduced, when the music data 62 is read, a rhythm detection process is performed to generate the corresponding rhythm data 67. When the music data 62 is reproduced, the rhythm data 67 is generated in advance. The rhythm data 67 is read out and used.

(C)画像の切り換え表示のタイミング
また、上述した実施形態では、音楽データ62を再生する際には、拍の位置Rが到来する毎に画像データ61の切り換え表示を行うこととしたが、複数回の拍の位置Rの到来毎(例えば、10拍毎)に切り換え表示を行うこととしても良い。
(C) Image switching display timing In the above-described embodiment, when the music data 62 is reproduced, the switching display of the image data 61 is performed every time the beat position R arrives. Switching display may be performed every time the position R of beats arrives (for example, every 10 beats).

(D)切り換え表示の態様
また、上述した実施形態では、画像データ61の切り換え表示の態様の制御として、画面書き換え速度を通常の速度とこの通常の速度より遅い速度との2つとして2段階で切り換えることとしたが、画面書き換え速度を3つ以上として3段階以上の多段階に切り換えることとしても良い。この場合、画面書き換え速度の数に応じた複数の閾値を設け、信頼度が何れの閾値の間であるかに応じて画面書き換え速度を決定する。
(D) Mode of Switching Display In the above-described embodiment, the screen rewriting speed is controlled in two stages, that is, a normal speed and a speed slower than the normal speed, as control of the switching display mode of the image data 61. However, the screen rewriting speed may be set to three or more and may be switched to three or more stages. In this case, a plurality of threshold values corresponding to the number of screen rewriting speeds are provided, and the screen rewriting speed is determined according to which threshold value the reliability is between.

また、画像データ61の切り換え表示の態様の制御として、画像書き換え速度を変化させることとしたが、切り換え表示の頻度を変化させることとしても良い。具体的には、例えば、音楽データ62の再生の際、拍の位置Rの到来毎に画像の切り換えを行っていたものを、到来した拍の位置Rにおける信頼度が所定の閾値を超えない場合には、以降の連続する複数回の拍の位置Rが到来する間(例えば、10拍の間)、画像の切り換え表示を行わないといったことにより、信頼度が低い部分では画像の切り換え頻度を低下させる。   Further, although the image rewriting speed is changed as the control of the switching display mode of the image data 61, the switching display frequency may be changed. Specifically, for example, when the music data 62 is reproduced, when the image is switched every time the beat position R arrives, the reliability at the arrived beat position R does not exceed a predetermined threshold. During the subsequent multiple beat positions R (for example, between 10 beats), the image switching frequency is not displayed, so that the image switching frequency is lowered in the low reliability portion. Let

画像処理装置のブロック構成図。1 is a block configuration diagram of an image processing apparatus. フレーム分割の説明図。Explanatory drawing of a frame division | segmentation. 自己相関関数のグラフの一例。An example of the graph of an autocorrelation function. 自己相関関数のグラフの一例。An example of the graph of an autocorrelation function. フレーム解析データのデータ構成例。Data structure example of frame analysis data. BPM決定用データのデータ構成例。The data structural example of the data for BPM determination. 拍の位置Rの決定の説明図。Explanatory drawing of determination of the position R of a beat. 拍の位置Rにおける信頼度決定の説明図。Explanatory drawing of the reliability determination in the position R of a beat. リズムデータのデータ構成例。Data configuration example of rhythm data. 同期再生処理の流れ図。The flowchart of a synchronous reproduction process. 同期再生処理中に実行されるリズム検出処理の流れ図。The flowchart of the rhythm detection process performed during a synchronous reproduction process. リズムデータに基づくグラフの一例。An example of a graph based on rhythm data. 変形例におけるリズムデータのデータ構成例。The data structural example of the rhythm data in a modification. 変形例におけるリズムデータに基づくグラフの一例。An example of the graph based on the rhythm data in a modification.

符号の説明Explanation of symbols

1 画像処理装置
10 CPU
20 入力部
30 表示部
40 音声出力部
50 ROM
51 同期再生プログラム
52 リズム検出プログラム
60 RAM
61 画像データ
62 音楽データ
63 フレーム自己相関データ
64 フレーム解析データ
65 BPM決定用データ
66 BPM決定値データ
67 リズムデータ
68 信頼度閾値データ
1 Image processing apparatus 10 CPU
20 Input unit 30 Display unit 40 Audio output unit 50 ROM
51 Synchronous playback program 52 Rhythm detection program 60 RAM
61 Image data 62 Music data 63 Frame autocorrelation data 64 Frame analysis data 65 BPM determination data 66 BPM determination value data 67 Rhythm data 68 Reliability threshold data

Claims (7)

画像データを記憶する画像データ記憶手段と、
音楽データを記憶する音楽データ記憶手段と、
この音楽データ記憶手段に記憶された音楽データを再生した音楽のリズムを検出する検出手段と、
この検出手段により検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度を判定する判定手段と、
前記画像データ記憶手段に記憶された画像データを前記検出手段により検出されたリズムに基づいて切り換え表示していくことにより、前記音楽データ記憶手段に記憶された音楽データの再生に同期した切り換え表示を行うとともに、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分と満たさない部分では該切り換え表示の態様を異なるものとなるよう制御する切換表示制御手段と、
を備えることを特徴とする画像処理装置。
Image data storage means for storing image data;
Music data storage means for storing music data;
Detecting means for detecting the rhythm of the music reproduced from the music data stored in the music data storage means;
Determination means for determining reliability indicating the rhythm accuracy at each timing based on the rhythm detected by the detection means;
By switching and displaying the image data stored in the image data storage means based on the rhythm detected by the detection means, a switching display synchronized with the reproduction of the music data stored in the music data storage means is performed. And a switching display control means for controlling the switching display mode to be different between a portion in which the reliability determined by the determination means in the music data satisfies a predetermined low reliability condition and a portion that does not satisfy the predetermined low reliability condition. When,
An image processing apparatus comprising:
前記判定手段は、各タイミングにおける音楽データの自己相関値に基づいて定まる値を信頼度として判定することを特徴とする請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the determination unit determines a value determined based on an autocorrelation value of music data at each timing as the reliability. 前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画面書き換え速度の遅い切り換え表示を行うことを特徴とする請求項1又は2に記載の画像処理装置。   The switching display control means performs switching display with a slow screen rewriting speed when reproducing a portion of the music data in which the reliability determined by the determination means satisfies a predetermined low reliability condition. The image processing apparatus according to claim 1 or 2. 前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分の再生時においては、画像データの切り換え表示頻度を低下させることを特徴とする請求項1又は2に記載の画像処理装置。   The switching display control means reduces the switching display frequency of image data during reproduction of a portion of the music data in which the reliability determined by the determination means satisfies a predetermined low reliability condition. The image processing apparatus according to claim 1 or 2. 前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が前記低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、画面書き換え速度の遅い切り換え表示を行うことを特徴とする請求項3に記載の画像処理装置。   The switching display control unit is configured to display a screen for a portion of the music data in which the reliability determined by the determination unit does not satisfy the low reliability condition and the sound pressure level satisfies a predetermined low level condition. The image processing apparatus according to claim 3, wherein switching display with a slow rewriting speed is performed. 前記切換表示制御手段は、前記音楽データのうち、前記判定手段により判定された信頼度が前記低信頼度条件を満たさず、且つ、音圧レベルが所定の低レベル条件を満たす部分については、画像データの切り換え表示頻度を低下させることを特徴とする請求項4に記載の画像処理装置。   The switching display control means includes an image for a portion of the music data in which the reliability determined by the determination means does not satisfy the low reliability condition and the sound pressure level satisfies a predetermined low level condition. The image processing apparatus according to claim 4, wherein the data switching display frequency is reduced. コンピュータに、音楽データを再生した音楽に同期した画像データの切り換え表示を行わせるためのプログラムであって、
前記音楽データを再生した音楽のリズムを検出する検出機能と、
この検出機能により検出されたリズムに基づく各タイミングそれぞれにおけるリズムの適確性を示す信頼度を判定する判定機能と、
前記画像データを前記検出機能により検出されたリズムに基づいて切り換え表示していくことにより、前記音楽データの再生に同期した切り換え表示を行うとともに、前記音楽データのうち、前記判定手段により判定された信頼度が所定の低信頼度条件を満たす部分と満たさない部分では該切り換え表示の態様を異なるものとなるよう制御する切換表示制御機能と、
を前記コンピュータに実現させるためのプログラム。
A program for causing a computer to perform switching display of image data synchronized with music that has been reproduced.
A detection function for detecting a rhythm of music obtained by playing the music data;
A determination function for determining reliability indicating the rhythm accuracy at each timing based on the rhythm detected by the detection function;
By switching and displaying the image data based on the rhythm detected by the detection function, switching display synchronized with the reproduction of the music data is performed, and among the music data, the determination unit determines A switching display control function for controlling the state of the switching display to be different between a portion where the reliability satisfies a predetermined low reliability condition and a portion where the reliability does not satisfy ,
A program for causing the computer to realize the above.
JP2005207110A 2005-07-15 2005-07-15 Image processing apparatus and program Expired - Fee Related JP4687297B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005207110A JP4687297B2 (en) 2005-07-15 2005-07-15 Image processing apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005207110A JP4687297B2 (en) 2005-07-15 2005-07-15 Image processing apparatus and program

Publications (2)

Publication Number Publication Date
JP2007025242A JP2007025242A (en) 2007-02-01
JP4687297B2 true JP4687297B2 (en) 2011-05-25

Family

ID=37786097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005207110A Expired - Fee Related JP4687297B2 (en) 2005-07-15 2005-07-15 Image processing apparatus and program

Country Status (1)

Country Link
JP (1) JP4687297B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5104709B2 (en) * 2008-10-10 2012-12-19 ソニー株式会社 Information processing apparatus, program, and information processing method
US9378752B2 (en) * 2012-09-05 2016-06-28 Honda Motor Co., Ltd. Sound processing device, sound processing method, and sound processing program
JP2018170678A (en) * 2017-03-30 2018-11-01 株式会社ライブ・アース Live video processing system, live video processing method, and program
CN113411663B (en) * 2021-04-30 2023-02-21 成都东方盛行电子有限责任公司 Music beat extraction method for non-woven engineering

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339682A (en) * 2000-05-30 2001-12-07 Fuji Photo Film Co Ltd Digital camera with music reproduction function

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339682A (en) * 2000-05-30 2001-12-07 Fuji Photo Film Co Ltd Digital camera with music reproduction function

Also Published As

Publication number Publication date
JP2007025242A (en) 2007-02-01

Similar Documents

Publication Publication Date Title
JP3399297B2 (en) Electronic musical instrument
JP6011064B2 (en) Automatic performance device and program
EP1892717A1 (en) Content tag attachment support device and content tag attachment support method
EP2911147B1 (en) Multifunctional audio signal generation apparatus
JP4687297B2 (en) Image processing apparatus and program
US7446252B2 (en) Music information calculation apparatus and music reproduction apparatus
JP4300641B2 (en) Time axis companding method and apparatus for multitrack sound source signal
US7511214B2 (en) Automatic performance apparatus for reproducing music piece
US8761567B2 (en) Moving image reproducer reproducing moving image in synchronization with musical piece
JP3645716B2 (en) Animation creating method, animation creating apparatus, and computer-readable recording medium recording animation creating program
US10937404B2 (en) Electronic keyboard instrument, method, and storage medium
EP3373289B1 (en) Electronic musical instrument, musical sound generating method, and storage medium
JP6350692B2 (en) Acoustic signal generator
WO2017145800A1 (en) Voice analysis apparatus, voice analysis method, and program
JP2008268368A (en) Evaluation device
JP2003273677A (en) Equalizer and program therefor
US6362410B1 (en) Electronic musical instrument
JP2010032809A (en) Automatic musical performance device and computer program for automatic musical performance
JP6350693B2 (en) Acoustic signal generator
JP6114492B2 (en) Data processing apparatus and program
JP5509961B2 (en) Phrase data extraction device and program
JP2000276185A (en) Device and method for sound processing
JP3797356B2 (en) Electronic musical instruments
JP4246160B2 (en) Music search apparatus and music search method
JP2014056485A (en) Display control device and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101214

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110131

R150 Certificate of patent or registration of utility model

Ref document number: 4687297

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140225

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees