JP3982443B2 - テンポ解析装置およびテンポ解析方法 - Google Patents
テンポ解析装置およびテンポ解析方法 Download PDFInfo
- Publication number
- JP3982443B2 JP3982443B2 JP2003094100A JP2003094100A JP3982443B2 JP 3982443 B2 JP3982443 B2 JP 3982443B2 JP 2003094100 A JP2003094100 A JP 2003094100A JP 2003094100 A JP2003094100 A JP 2003094100A JP 3982443 B2 JP3982443 B2 JP 3982443B2
- Authority
- JP
- Japan
- Prior art keywords
- tempo
- unit
- volume
- peak
- tempo analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004458 analytical method Methods 0.000 title claims description 66
- 230000005236 sound signal Effects 0.000 claims description 60
- 238000000034 method Methods 0.000 claims description 55
- 238000001514 detection method Methods 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000000926 separation method Methods 0.000 claims description 10
- 238000013075 data extraction Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 13
- 230000000737 periodic effect Effects 0.000 description 13
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 239000000872 buffer Substances 0.000 description 8
- 238000005070 sampling Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000012536 storage buffer Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000005415 magnetization Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/40—Rhythm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/076—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/005—Non-interactive screen display of musical or status data
Description
【発明の属する技術分野】
この発明は、例えば、楽曲などの音声信号からテンポ(楽曲が演奏される速さ)を抽出して利用できるようにする装置、方法に関する。
【0002】
【従来の技術】
例えば、楽曲の音声データを解析することにより、その楽曲のテンポを自動的に抽出し、この抽出したテンポを、例えば、譜面を起こす際に利用したり、編曲をする際に利用したりするなどのことが行われている。そして、楽曲のテンポを抽出する技術の1つとして、特許文献1(特開2002−116754号公報)に記載された技術がある。
【0003】
この特許文献1に記載された技術は、楽曲の音声データを時系列データとして取り込み、この音声データの自己相関を算出することにより当該音声データのピーク位置を検出して、テンポの候補を取得するようにし、一方で、自己相関パターンのピーク位置とそのレベルから当該楽曲のビート構造を解析し、テンポの候補とビート構造の解析結果とに基づいて、最も適切と思われるテンポを推定するものである。
【0004】
この特許文献1に記載された技術を利用することにより、音楽に対する先見的な知識を持っていなくても、誰でもが比較的に簡単に、しかも正確に、目的とする楽曲のテンポを抽出し、これを利用することができるようにされる。
【0005】
【特許文献1】
特開2002−116754号公報
【0006】
【発明が解決しようとする課題】
ところで、最近、例えば車載用オーディオシステム(カーステレオシステム)や家庭用オーディオシステムにおいても、再生する楽曲のテンポを検出し、そのテンポに応じた情報を提供したり、あるいは、検出したテンポに応じて、種々の制御を行うようにすることが考えられている。
【0007】
しかしながら、上述した特許文献1に記載の技術の場合には、音声データについて自己相関を算出したり、ビート構造を解析したりするなど、演算処理が複雑かつ膨大となり、実際に演算処理を行うCPU(Central Processing Unit)にかかる負担が大きくなる。
【0008】
このため、上述した特許文献1に記載の技術は、規模の比較的に小さな車載用オーディオシステムや家庭用オーディオシステムに適用するには不向きな場合がある。また、上述した特許文献1に記載の技術を用いようとする場合には、処理能力の高いCPUを用いたり、メモリー容量を大きくしたりする必要が生じるなど、オーディオシステムのコストアップにつながる可能性がある。
【0009】
以上のことにかんがみ、この発明は、CPUに大きな負荷をかけることもなく、また、コストアップも生じさせないようにして、楽曲等の音声のテンポを簡単かつ正確に検出して利用できるようにする装置、方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
上記課題を解決するため、請求項1に記載の発明のテンポ解析装置は、
入力音声信号を複数の周波数帯域に分割する帯域分離手段と、
前記帯域分離手段により分離された複数の周波数帯域毎に、各周波数帯域の入力音声信号のレベル変化のピークのうち、所定の閾値より大きい複数のピークの位置を検出するピーク検出手段と、
所定の単位時間区間において、前記複数の周波数帯域毎に前記ピーク検出手段により検出される前記ピーク位置の間の時間間隔を検出する間隔検出手段と、
前記間隔検出手段により前記複数の周波数帯域毎に検出される前記時間間隔を1つのリストにまとめ、前記時間間隔のうち、発生頻度の多い前記時間間隔に基づいて、前記入力音声信号により再生される音声のテンポを特定する特定手段と
を備えることを特徴とする。
【0011】
この請求項1に記載の発明のテンポ解析装置によれば、入力音声が帯域分離手段により、複数の周波数帯域に分割され、ピーク検出手段により、分割された複数の周波数帯域のそてぞれの音声信号のレベルについて、閾値より大きく、かつ、上昇から下降に転じる直前のピーク位置(レベル変化の頂点)が順次に検出される。そして、時間間隔検出手段により、所定の単位時間区間において、前記複数の周波数帯域毎に、一般的には複数個のピーク位置について、少なくとも所定の1つのピーク位置を基準とし、このピーク位置とその他のピーク位置との時間間隔(ピーク間隔)が検出される。
【0012】
この後、特定手段により、時間間隔検出手段により複数の周波数毎に検出されるピーク位置の時間間隔が1つのリストにまとめられ、この1つのリストにまとめられた時間間隔の内、発生頻度の多い時間間隔に基づいて、処理対象の音声信号により再生される楽曲などの音声のテンポが特定される。これにより、自己相関演算などの複雑な演算処理を行うことなく、簡単かつ正確に楽曲などの音声のテンポを特定することができる。
【0013】
なお、ピーク位置間の時間間隔を求める場合に基準とするピーク位置は、1つだけでなく、単位時間区間に属するすべてのピーク位置を基準として用いてピーク位置間の時間間隔を検出するようにしてもよい。この場合、例えば、ピーク位置Aとピーク位置Bとがある場合に、AB間、BA間は、基準とするピーク位置が異なるだけで、時間間隔は同じであるので、いずれか一方だけを用いるようにすればよい。そして、発生頻度の高い時間間隔を求めるようにすることにより、特定したテンポの正確性を向上させることができる。
【0014】
【発明の実施の形態】
以下、図を参照しながら、この発明による装置、方法について説明する。以下に説明する実施の形態においては、この発明による装置、方法をカーステレオ装置(カーオーディオシステム)に適用した場合を例にして説明する。
【0015】
[カーステレオ装置の構成]
図1は、この発明による装置、方法を適用したカーステレオ装置を説明するためのブロック図である。図1に示すように、この実施の形態のカーステレオ装置は、ラジオ放送の受信アンテナANT、AM/FMチューナ部1、CD(Compact Disc)再生部2、MD(Mini Disc)再生部3、外部接続端子4、入力セレクタ5、オーディオアンプ部6、左右のスピーカ7L、7R、制御部9、LCD(Liquid Crystal Display)10、キー操作部11を備えたものである。
【0016】
制御部9は、図1に示すように、CPU(Central Processing Unit)91、ROM(Read Only Memory)92、RAM(Random Access Memory)93、不揮発性メモリー94がCPUバス95により接続されて形成されたマイクロコンピュータであり、この実施の形態のカーステレオ装置の各部を制御することができるものである。
【0017】
ここで、ROM92は、CPU91によって実行されるプログラムや処理に必要になるデータ、表示に用いる画像データや文字フォントデータなどが記憶されたものである。また、RAM93は、主に作業領域として用いられるものである。また、不揮発性メモリー94は、例えば、EEPROM(Electrically Erasable and Programmable ROM)やフラッシュメモリーであり、当該カーステレオ装置の電源が落とされても保持しておく必要のあるデータ、例えば、各種の設定パラメータなどを記憶保持するものである。
【0018】
また、制御部9には、図1に示すように、LCD10と、キー操作部11とが接続されている。LCD10は、比較的に大きな表示画面を有するものであり、この実施の形態のカーステレオ装置の状態や操作ガイダンスなどを表示することができるとともに、例えば、外部入力端子を通じて、GPS(Global Positioning System)やDVD(Digital Versatile Disc)の再生装置が接続された場合には、制御部9の制御によって、地図情報や動画情報等を表示することができるものである。
【0019】
また、キー操作部11は、各種の操作キーやファンクションキー、操作ダイヤルなどを備えたものであり、ユーザからの操作入力を受け付けて、これを電気信号に変換し、制御部9に通知することができるものである。これにより、制御部9は、ユーザからの指示に応じて、このカーシステム装置の各部を制御することができるようにしている。
【0020】
そして、図1に示したように、この実施の形態のカーステレオ装置は、音声信号(音声データ)等の供給端として、AM/FMチューナ部1、CD再生部2、MD再生部3、外部入力端子4を備えたものである。AM/FMチューナ部1は、制御部9からの選局制御信号に基づいて、AMラジオ放送またはFMラジオ放送のうちの目的とする放送チャンネルを受信、選局し、この受信、選局したラジオ放送信号を復調して、復調後の音声信号をセレクタ5に供給する。
【0021】
CD再生部2は、スピンドルモータ、光学ヘッド部などを備え、これに装填されたCDを回転駆動し、当該CDにレーザー光を照射して、その反射光を受光することにより、当該CDにピット(孔)として記録されている音声データを読み出す。そして、読み出した音声データを電気信号に変換し、復調して再生用の音声信号を形成し、これをセレクタ5に供給する。
【0022】
MD再生部3は、CD再生部2の場合と同様に、スピンドルモータ、光学ヘッド部などを備え、これに装填されたMDを回転駆動し、当該MDにレーザー光を照射して、その反射光を受光することにより、当該MDに磁化変化として記録されている音声データを読み出し、これを電気信号に変換する。読み出された音声データは、通常、データ圧縮されているので、これをデータ伸張処理(圧縮解凍処理)して再生用の音声信号を形成し、これをセレクタ5に供給する。
【0023】
また、外部接続端子4には、上述もしたように、例えばGPSやDVD再生装置などの外部機器が接続され、それらの機器からの音声信号が、セレクタ5に供給するようにされる。
【0024】
そして、セレクタ5は、制御部9により切り換え制御がなされ、AM/FMチューナ1、CD再生部2、MD再生部3、外部入力端子4のうちのいずれの部分からの音声信号を出力するかを切り換える。これにより、AM/FMチューナ1、CD再生部2、MD再生部3、外部入力端子4のうちの目的とする部分からの音声信号がオーディオアンプ部6に供給される。
【0025】
オーディオアンプ部6は、大きく分けると、出力信号処理部61と解析データ処理部62とからなっている。出力信号処理部61は、制御部9からの制御信号に基づいて、出力しようとする音声信号についての音量調整、音質調整等の各種の調整処理を行って、出力用の音声信号を形成し、これをスピーカ7L、7Rに供給する。
【0026】
これにより、図1において参照符号1から4で示した部分の内の目的とする供給部分からの音声信号に応じた音声をスピーカ7L、7Rから放音することができるようにされる。
【0027】
一方、解析データ抽出部62は、これに供給された音声信号を複数の周波数帯域に分割し、各周波数帯域の音声信号のレベルを示す情報を制御部9に供給する。制御部9は、詳しくは後述するが、解析データ抽出部62からの解析データに基づいて、音声信号のピーク位置を検出し、所定単位時間におけるピーク位置間の時間間隔を算出して、この算出結果に基づいて、出力する音声のテンポを特定する。
【0028】
そして、この実施の形態の制御部9は、例えば、ROM92、あるいは、不揮発性メモリー94に記憶されている静止画像データの中から、上述のようにして特定したテンポに応じたものを選択し、それをLCD10に表示するようにしている。また、制御部9は、LCD10に表示するようにした静止画像に重ねて、例えば、図形やキャラクタなどの画像を、特定したテンポに応じて動くような態様で表示することも行うようにしている。
【0029】
このように、この実施の形態のカーステレオ装置においては、オーディオアンプ部6の解析データ抽出部62と制御部9とによりテンポ解析装置を構成し、これらが協働することによって、再生する楽曲などの音声のテンポを特定して、これを利用することができるようにしている。
【0030】
つまり、解析データ抽出部62と制御部9とにより構成されるテンポ解析装置部が、この発明によるテンポ解析装置の一実施の形態が適用されたものであり、ここで用いられる方法が、この発明によるテンポ解析方法の一実施の形態が適用されたものである。
【0031】
そして、この実施の形態においては、以下に詳述するように、再生しようとする楽曲などの音声のテンポを特定する際には、従来のように自己相関算出等の複雑な演算処理を行うことはなく、簡単な処理で、しかも正確に目的とする音声のテンポを特定するようにしている。
【0032】
[テンポ解析装置部の構成と処理内容]
次に、この実施の形態のカーステレオ装置に搭載するようにされたテンポ解析装置部について説明する。図2は、この実施の形態のカーステレオ装置に搭載するようにされたテンポ解析装置部を説明するためのブロック図である。上述もしたように、この実施の形態のテンポ解析装置は、カーステレオ装置のオーディオアンプ部6に設けられる解析データ抽出部62と、制御部9とにより構成される。
【0033】
図2に示すように、解析データ抽出部62と制御部9との間には、A/D変換部12が設けられる。このA/D変換部12は、解析データ抽出部62から出力される音声信号のレベルを示す情報(例えば電圧値)を例えば、0〜1023までの1024ステップのデジタルデータに変換して制御部9に供給するようにするものである。
【0034】
このA/D変換部12は、図2に示したように、解析データ抽出部62と制御部9との間に設けることも可能であるが、解析データ抽出部62の機能として設けるようにすることもできるし、また、制御部9の機能として設けるようにすることもできる。
【0035】
そして、この実施の形態において、解析データ抽出部62は、これに供給された音声信号を複数の周波数帯域に分離する帯域分離部621と、複数の周波数帯域に分離された音声信号のそれぞれのレベルを検出し、これをレベル情報として出力するレベル検出部622とからなっている。
【0036】
この実施の形態において、帯域分離部621は、図2にも示したように、中心周波数が、62Hz、157Hz、396Hz、1kHz、2.51kHz、6.34kHz、16kHzの7つの周波数帯域(7バンド)に分離するようにしている。
【0037】
帯域分離部621において、各周波数帯域に分離された音声信号のそれぞれは、図2に示したように、レベル検出部622に供給され、そのそれぞれごとにレベルが検出される。レベル検出部622において検出された各周波数帯域の音声信号のレベルを示す情報は、A/D変換部12を通じて制御部9に供給される。すなわち、帯域分割された各帯域の音声信号のレベル波形(音声レベル波形)がデジタルデータとして制御部9に供給するようにされる。
【0038】
なお、解析データ抽出部62は、汎用の集積回路、例えば、IC A633AB(STMicroelectronics)等を用いて実現することが可能である。また、解析データ抽出部62をマイクロコンピュータで構成するようにし、ここで実行されるソフトウエアによって音声信号の帯域分割や信号レベルの検出を行うようにすることもできる。
【0039】
そして、制御部9は、解析データ抽出部62からの各周波数帯域の音声信号のレベル(音声レベル波形)を用い、ごく簡単な比較処理を中心とする処理により、処理対象の音声のテンポを特定する。そして、特定したテンポに基づいて、制御部9は、例えばROM92に用意された静止画像データの中からそのテンポに応じた静止画像を形成する画像データを抽出し、それをLCD10の表示画面に表示するようにする。
【0040】
同時に、制御部9は、所定の図形やキャラクタなどをLCD10の表示画面に表示するようにするとともに、その図形やキャラクタを、特定したテンポに応じて移動させるようにしたりするなどのことを行うようにしている。
【0041】
[テンポ特定処理について]
[メインルーチン]
次に、上述したように、制御部9の機能として行われる処理対象の音声信号により再生される音声のテンポを特定する処理について具体的に説明する。図3は、この実施の形態のカーステレオ装置において行われる処理対象の音声信号により再生される音声のテンポを特定する場合の処理について説明するためのフローチャートである。
【0042】
この実施の形態のカーステレオ装置においては、制御部9は、まず、最終的に特定されたテンポとともに画像データの表示のためのパラメータとなる入力音声信号の音量レベル(総音量)の計算処理を行う(ステップS1)。
【0043】
次に、制御部9は、処理対象の音声についてのテンポの抽出および特定のための処理を行う(ステップS2)。このステップS1、ステップS2の処理によって求められたパラメータ(総音量とテンポ)により、表示する画像データや表示内容が決定される。
【0044】
そして、この実施の形態のカーステレオ装置においては、上述もしたように処理対象の音声信号を7つの周波数帯域(7バンド)に分割し、所定の時間単位区間(1フレーム)を処理単位として処理を行うようにしている。この実施の形態において、時間単位区間(1フレーム)は、連続する例えば4秒間の区間である。
【0045】
そして、この実施の形態においては、1フレーム(4秒間)の区間をサンプリング周波数が20Hzのクロック信号を用いてサンプリングすることにより、1フレームに80サンプルを得るようにしている。さらに、例えば、10フレーム、20フレームなどのように、所定のフレーム数分の情報を累積し、この累積した情報に基づいて、総音量の算出やテンポの決定(特定)を行うようにしている。
【0046】
[総音量の計算処理について]
次に、図3に示した処理のステップS1の処理、および、ステップS2の処理の詳細について説明する。まず、ステップS1の総音量の計算処理について説明する。図4は、図3に示したステップS1において行われる処理を説明するためのフローチャートである。
【0047】
ここでは、図4にも示すように、処理結果を累積する連続した複数フレームの各フレームにおける7バンドの合計音量のデータバッファをVolData[Frame]とし、各バンド毎の音量データ(レベルデータ)の格納バッファをdata[band]とし、総音量の値の格納バッファをTotalVolとする。
【0048】
また、[Frame]は、総音量の計算対象となるフレーム数であり、[Frame]番目に相当するフレームは、処理結果を累積する連続した複数フレームの内の最古のフレームである。また、[band]は、どのバンド(周波数帯域)かを示すバンド番号でもある。
【0049】
そして、現在処理の対象となっている最新のフレームの音量バッファをVolData[1]とし、処理結果を累積する連続した複数フレームの内の最古のフレームの音量バッファをVolData[Frame]とすると、図4に示すように、制御部9のCPU91は、まず、総音量TotalVolから、最古のフレームの音量を減算する(ステップS11)。
【0050】
次に、バッファVolData[1]〜VolData[Frame]に格納データを、1バッファずつシフトする(ステップS12)。例えば、VolData[Frame]=VolData[5]である場合を例にすると、
VolData[4]のデータをVolData[5]にシフトし、
VolData[3]のデータをVolData[4]にシフトし、
VolData[2]のデータをVolData[3]にシフトし、
VolData[1]のデータをVolData[2]にシフトすることになる。
【0051】
そして、解析データ抽出部62からの最新のフレームの各バンド(周波数帯域)のレベルデータdata[1]、data[2]、data[3]、data[4]、data[5]、data[6]、data[7]を合算し、この合算結果を最新のフレームの音量を示すデータとして、バッファVolData[1]にセットする(ステップS13)。
【0052】
そして、ステップS13において求めた、最新の処理対象のフレームの音量の値を総音量の値を保持するTotalVolの値に加算することにより、最新のフレームから過去にさかのぼる方向に総音量を計算する[Frame]分のフレームを対象とした総音量が求められる(ステップS14)。
【0053】
このようにして、処理対象の音声信号の総音量が算出され、この算出された総音量をパラメータのひとつとして用いることにより、画像データを選択・表示することができるようにされる。
【0054】
なお、上述した総音量の計算処理は、複数の周波数帯域に分割された音声レベル波形から求めるようにしたが、これ以外に、供給された音声信号に対する音声レベル波形から求めてもよいし、例えば中音域のような特定の周波数帯域成分を取り出すフィルタを用意してその帯域の音声信号に対する音声レベル波形から求めるようにしてもよい。
【0055】
[テンポ抽出処理(テンポ決定(特定)処理)について]
次に、図3に示したステップS2において行われるテンポ抽出処理について具体的に説明する。図5は、図3に示したステップS2において行われるテンポ抽出処理を説明するためのフローチャートである。図5に示すように、ステップS21からステップS24までの各処理は、帯域分割された各バンド毎の音声信号を対象として行われる。
【0056】
すなわち、制御部9のCPU91は、各バンド毎に、スレッショルドを設定する処理を行い(ステップS21)、例えばRAM93、あるいは、不揮発性メモリー94に設けられるピーク位置検出用のバッファであるピークバッファの内容のシフト処理を実行する(ステップS22)。そして、ステップS21で設定したスレッショルド以上のレベルのピーク位置(レベル変化の頂点)を抽出する処理を行い(ステップS23)、抽出したピーク位置に基づいて、各ピーク位置間のピーク間隔(ピーク位置間の時間間隔)を求める(ステップS24)。
【0057】
各バンド(帯域)毎に行なわれるステップS21〜ステップS24までの処理の後、制御部9のCPU91は、各バンド毎のピーク間隔を1つのリストにまとめる処理を行い、検出頻度(発生頻度)の最も高いピーク間隔(ピーク周期)を再生している音声のテンポとして特定する(ステップS25)。
【0058】
次に、図5に示したテンポ抽出処理のステップS21のスレッショルド処理、ステップS23のピーク抽出処理、ステップS25のテンポを特定する処理のそれぞれについてより詳細に説明する。
【0059】
図6は、図5に示したテンポ抽出処理のステップS21において行われるスレッショルド処理を説明するためのフローチャートである。この実施の形態においては、図3に示したステップS1において実行される処理に類似する処理であって、帯域分割された各バンド毎に1フレーム(4秒間)の区間にわたりそれぞれの最大音量レベルを求め、その値をMaxVol[band]として保持しておく。次の1フレーム(4秒間)の区間に対してスレッショルド処理を行う際に、保持されてあるMaxVol[band]を呼び出して、この値に、例えば0.8を掛け算することにより、最大音量MaxVol[band]の80パーセントのレベルを求め、この求めたレベルが前の1フレーム(4秒間)の区間に対して求められたスレッショルドThresより大きいか否かを判断する(ステップS211)。
【0060】
ステップS211の判断処理において、スレッショルドThresが、最大音量MaxVol[band]の80パーセントのレベルよりも大きいと判断した場合には、音量が低下していると判断し、スレッショルドThresに、当該スレッショルドThresの90パーセントのレベルを設定するようにする(ステップS212)。
【0061】
ステップS211の判断処理において、スレッショルドThresが、音量MaxVol[band]の80パーセントのレベルよりも小さいと判断したときには、音量が上がっていると判断し、今回の新たな最大音量MaxVol[band]の80パーセントのレベルをスレッショルドThres に設定するようにする(ステップS213)。
【0062】
このように、この実施の形態のカーステレオ装置においては、各バンド毎に音量が低下した場合と上昇した場合との両方において、スレッショルドThresを適切に変更することができるようにしている。このスレッショルドThresを、音声信号のピーク位置を検出する場合の基準として用いることによって、音声のテンポを正確に特定することができるようにしている。
【0063】
次に、図5に示したテンポ抽出処理のステップS23において行われるピーク位置の抽出処理について説明する。図7は、図5に示したステップS23において実行されるピーク位置の抽出処理を説明するためのフローチャートである。上述もしたように、この実施の形態においては、サンプリング周波数が20Hzのクロック信号を用い、音声信号は、1フレームである4秒間に80回サンプリングされて、そのレベルが検出するようにされる。そして、各サンプルについて、図7に示す処理が行われることになる。
【0064】
まず、制御部9は、現在のサンプルのレベルが、図6を用いて説明したようにして設定されるスレッショルドThresを下回っているか否かを判断する(ステップS231)。このステップS231の判断処理において、現在のサンプルのレベルが、スレッショルドThresを下回っていないと判断したときには、現在のサンプルのレベルが最大値である可能性があるので、既に最大値の候補として仮登録されているレベルと現在のサンプルのレベルとを比較し、現在のサンプルのレベルの方が高いか否かを判断する(ステップS232)。
【0065】
ステップS232の判断処理において、現在のサンプルのレベルよりも、既に登録されている最大値の候補のレベルの方が高ければ、何もすることなく、この図7に示す処理を抜ける。ステップS232の判断処理において、現在のサンプルのレベルの方が、仮登録されている最大値の候補のレベルよりも高い場合には、現在のサンプルのレベルと当該サンプルの位置を仮登録し(ステップS233)、この図7に示す処理を抜ける。なお、仮登録は、例えば、RAM93、あるいは、不揮発性メモリー94の仮登録エリアにするようにされる。
【0066】
また、ステップS231の判断処理において、現在のサンプルのレベルが、スレッショルドThresを下回っていると判断したときには、ステップS233において仮登録したレベルのサンプル位置は、現在の処理対象のフレーム内か否かを判断する(ステップS234)。
【0067】
ステップS234の判断処理において、仮登録したレベルのサンプル位置は、現在の処理対象のフレーム内ではないと判断したときには、処理の対象となっているフレームが次のフレームに移っているので、何もすることなく、この図7に示す処理を抜けるようにする。
【0068】
ステップS234の判断処理において、仮登録したレベルのサンプル位置は、現在の処理対象のフレーム内であると判断したときには、ピークの候補として仮登録したレベルとそのサンプリング位置とを、ピークレベルおよびピーク位置として、所定のエリア(最大値位置情報エリア)に追加記録するとともに、ピークの数を1カウントし、この図7に示す処理を抜ける。
【0069】
このように、この実施の形態のカーステレオ装置においては、自己相関の算出を行うことなく、比較的に簡単な比較処理だけで、ピークレベルを検出し、そのピークレベルの位置(ピーク位置)を抽出することができるようにしている。
【0070】
そして、この実施の形態のカーステレオ装置においては、図7に示した処理が、図5に示した処理のステップS23において行われることにより得られるピーク位置に基づいて、図5に示したステップS24においては、ピーク間隔(ピーク位置間の時間間隔)が求められる。
【0071】
図8は、この実施の形態において行われるピーク間隔の検出処理を説明するための図である。図8に示すように、1フレーム内において、スレッショルドThres以上のピーク位置(ピーク点)が4つ存在する場合を例にして、ピーク間隔を求める処理について説明する。
【0072】
制御部9は、例えば、RAM93あるいは不揮発性メモリー94に記憶保持されたピーク位置を示す情報に基づいて、図8において、アルファベットA、B、C、D、E、Fが示すように、同じ区間が重複することがないように、ピーク間隔を求める。
【0073】
つまり、図8に示した例の場合には、4つのピーク位置のそれぞれを基準にして、他のピーク位置との間隔を求めるようにする。しかし、基準となるピーク位置と他のピーク位置とが逆になるだけの区間は、区間の重複となるので、実質的に区間が重複する場合には、その一方だけを生かすように処理する。
【0074】
したがって、図8に示した例の場合には、4つのピーク位置のそれぞれについて、他の3つのピーク位置との間でピーク間隔が求められるので、12個のピーク間隔を検出することができるが、重複する区間については、そのうちの1つしか生かさないようにすることによって、図8に示すように、6つのピーク間隔A、B、C、D、E、Fが検出できる。
【0075】
この処理は、処理対象のフレーム区間の各バンドのレベルデータを対象として行われる。そして、当該処理対象のフレーム区間の各バンドにおける求められたピーク間隔をピーク間隔(周期)リスト(以下、周期リストという。)に展開し、この周期リストに基づいて、再生するようにしている楽曲のテンポが決定(特定)するようにされる。
【0076】
図9は、図5に示したステップS25において実行される周期リスト作成およびテンポ決定処理を説明するためのフローチャートである。図9に示すフローチャートの処理は、制御部9において実行される処理である。
【0077】
まず、制御部9は、現在、音量がゼロであるか否かを判断する(ステップS251)。この判断は、前述した総音量TotalVolをチェックすることにより行うこともできるし、また、別途に、入力音声信号についての音量レベルを検出し、これをチェックするようにしてもよい。
【0078】
なお、音量が完全にゼロにならない場合もあることを想定し、ステップS251の処理においては、例えば、規定スレッショルド以下の音声レベルの音声信号が規定サンプル以上続いた場合には、音量がゼロになった、すなわち、楽曲の再生が終了したと判断するようにしてもよい。
【0079】
ステップS251の判断処理において、音量がゼロでないと判断したときには、制御部9は、図7を用いて前述したようにして求められるすべてのピーク間隔をスコアに重み付けをしながら周期リストに展開する(ステップS252)。周期リストは、例えば、図10に示すように、横軸をピーク間隔、縦軸をスコア(検出数)として、処理対象のフレーム区間における各バンドにおいて検出した各ピーク間隔について、その検出回数を累積するようにするものである。
【0080】
ここで、重み付けは、各バンド毎、ピーク間隔の大小により所定の値を予め設定しておく。例えば、高音域のバンドに対する重み付けを、中音域のバンドに対する重み付けよりも小さい値とするようにしてもよい。あるいは、各バンドに対する重み付けを同一の値とするようにしてもよい。
【0081】
なお、この例においては、図10に示したように、各バンド毎の重み付けをW1、W2、W3、…で示し、ピーク間隔毎の重み付けをAA、BBで示している。そして、図10にスコアの計算一例を示したように、この例においては、ピーク間隔毎の重み付けと各バンド毎の重み付けとを行うことにより、各ピーク間隔のスコアを得るようにしている。
【0082】
そして、図9に示した周期リストにおいては、図8を用いて説明したように検出されるピーク間隔の内、同じ間隔であるピーク間隔B、Eの検出回数が最も多く検出されていることがわかる。制御部9は、作成した周期リストから、検出回数、すなわち積み上げられたスコアの最も高いピーク間隔をテンポとして決定(特定)する(ステップS253)。
【0083】
次に、制御部9は、周期リストのスコアの最大値が予め決められた規定値を超えているか否かを判断する(ステップS254)。テンポの決定は、周期リストに基づいて迅速に行わなければならないので、周期リストに必要以上のデータを蓄積することは、処理の遅延、メモリーの無駄使い等につながる可能性があるため望ましくない。
【0084】
ステップS254の判断処理において、周期リストのスコアの最大値が予め決められた規定値を超えていない場合には、図9に示す処理を終了する。また、ステップS254の判断処理において、周期リストのスコアの最大値が予め決められた規定値を超えていると判断した場合には、周期リストのデータについての足切り処理を行い(ステップS255)、この後、この図9に示す処理を終了する。
【0085】
ステップS255において行われる周期リストの足切りは、上述もし、また、図11にも示すように、累積されていく各ピーク間隔のスコアが、規定値を超えた場合に行われる。具体的には、周期リストの各ピーク間隔のスコアから所定スコア分を減算するようにしたり、あるいは、周期リストに展開したデータのうち、例えば、一番古いフレームの各ピーク間隔のスコアを差し引くようにしたり、あるいは、一番古いフレームから新しいフレーム方向に複数フレーム分のピーク間隔のスコアを差し引くようにすることにより行われる。
【0086】
また、図9に示したステップS251の判断処理において、音量がゼロであると判断したときには、楽曲の再生が終わったと判断することができるので、図10に示したように作成される周期リストをリセットし(ステップS256)、新たに再生される楽曲のテンポの解析処理に備えるようにして、この図9に示す処理を終了する。
【0087】
なお、この実施の形態のカーステレオ装置において、制御部9は、各フレームにおいて検出されるそのフレームにおける検出頻度の最も高いピーク間隔を示す情報が、複数フレーム分、例えば1000フレーム分蓄積するようにされる。例えば、図12に示すように、各フレームの検出頻度の最も高いピーク間隔を示すデータが保持するようにされる。
【0088】
このように、処理対象となった過去のフレームについても、ピーク間隔を示す情報を保持しておくことにより、例えば、あるフレームで突然ピーク間隔が大きく変わったような場合であっても、その前後のフレームのピーク間隔を示す情報を参照することによって、ピーク間隔の突然の変動に大きな影響を受けることなく、適正に再生対象の楽曲のテンポを決定することができるようにされる。
【0089】
そして、この実施の形態のカーステレオ装置において、制御部9は、上述のようにして、再生対象の楽曲のテンポを決定すると、その決定したテンポに応じて、ROM92に保持されている例えば静止画像の画像データを読み出し、この読み出した画像データによる静止画像をLCD10に表示するようにしている。
【0090】
この実施の形態のカーステレオ装置において、LCD10に表示される静止画像は、再生している楽曲のテンポと音量とに基づいて決められる。すなわち、図13に示すように、横軸をテンポとし、縦軸を音量とする座標平面を想定し、この平面上に9ブロック×9ブロックの領域を設けるようにする。
【0091】
そして、テンポと音量とにより決まるブロックに対応して、画像を形成する画像データが一意に決まるようにしている。つまり、図13に示した81個のブロックのそれぞれに対して、所定の画像を形成する画像データが決まるようにされている。
【0092】
したがって、例えば、図13に示したように、テンポTPと、音量Vがわかれば、これで示される座標(TP,V)が属するブロックに割り当てられた画像データがROM92から読み出され、この読み出された画像データによる静止画像が、制御部9の制御によって、LCD10の表示画面に表示するようにされる。
【0093】
なお、ここでは、例えば、ROM92には、少なくとも図13に示したように設定される81ブロックのそれぞれに対応する81枚の静止画像を形成する画像データが記憶保持される。しかし、実際には、図13に示したいずれのブロックにも属さない場合も生じる可能性があるので、どのブロックにも属さない場合に用いる静止画像を形成する複数の画像データをも記憶保持し、これを利用することもできるようにされる。したがって、例えばROM92は、この実施の形態の場合、100枚前後の静止画像の画像データが記憶保持されている。
【0094】
また、この実施の形態のカーステレオ装置においては、LCD10の表示画面に、テンポと音量とに応じた静止画像を表示するものとして説明したが、所定時間分の動画像を表示したり、所定時間分の動画を繰り返し表示するなど、動画像の表示を行うようにすることももちろん可能である。
【0095】
さらに、この実施の形態のカーステレオ装置においては、楽曲の再生時において、上述したようにテンポと音量とに応じた画像をLCD10の表示画面に表示するだけでなく、例えば、図14において、オブジェクトObが示すように、予め決められた図形やキャラクタなどの表示オブジェクトをLCD10の表示画面に表示させ、これを移動させるようにしている。
【0096】
この場合、オブジェクトObの移動パターンや移動速度などは、例えば、決定されたテンポに応じて決められ、テンポが速ければ、激しく動かし、テンポが遅ければ、ゆっくりと動かすなどというように制御することになる。もちろん、テンポと音量とにより、移動パターンや移動速度を選択するようにしてもよい。また、表示して移動させるようにする表示オブジェクト自体についても複数個用意しておき、決定したテンポ、あるいは、決定したテンポと音量とによって、用いる表示オブジェクトを選択するようにすることもできる。
【0097】
このように、この実施の形態のカーステレオ装置においては、自己相関演算などの複雑な演算処理を行うことなく、再生する楽曲などの音声のテンポを簡単に、しかも迅速かつ正確に特定することができるようにされる。したがって、カーステレオ装置の制御部に大きな負荷をかけることなく、再生する音声のテンポを特定することができる。
【0098】
そして、特定したテンポに応じてLCD10に表示する画像を特定し、これを表示してユーザに提供することができるようにされる。また、特定したテンポに応じて、表示オブジェクトをLCDの表示画面に表示させ、これをテンポに応じて移動させるなどのことができるようにされる。つまり、物理的な情報を利用するグラフィックイコライザとは異なり、音楽的な情報である特定したテンポに応じて、画像情報を提供することができるという、新たな態様での情報の提供ができるようにされる。
【0099】
[他の例について]
なお、上述した実施の形態においては、再生する音声信号を7つの周波数帯域に分割して、各帯域毎に処理するものとして説明したが、これに限るものではない。分割する周波数帯域数は、いくつでもよい。つまり、必ずしも周波数帯域を分割する必要はなく、全周波数帯域を有する音声信号に対して上述した処理を行うようにしてももちろんよい。
【0100】
また、処理対象の音声信号を複数の周波数帯域に分割するようにした場合であっても、その分割されたすべての周波数帯域の音声信号を処理対象とする必要はなく、分割した周波数帯域の1つ以上の帯域を選択して処理対象とするようにしてもよい。あるいは、バンドパスフィルタにより処理対象とする周波数帯域の音声信号を抽出して上述した処理を行うようにしてもよい。
【0101】
また、ピーク位置の検出に際しては、音声波形のレベルについてのスレッショルドを、前フレーム区間の最大音量に基づいて算出するようにしたが、これに限るものではない。音声波形についてのスレッショルドは、所定の値を用いるように予め設定しておくことも可能である。また、選択された音量レベルなどに応じて、予め決められた複数の値の中から所定の値を選択してこれを用いるようにしてもよい。
【0102】
また、前述した実施の形態においては、ピーク間隔の検出は、すべてのピーク位置を基準にして、実質的に重複する間隔は除外するようにして行うようにしたが、これに限るものではない。例えば、各フレームの任意の1つ以上のピーク位置を基準にしてピーク間隔を検出するようにし、このようにして求めたピーク期間を用いるようにしてもよい。すなわち、すべてのピーク位置を基準位置として用いて、ピーク間隔を検出する必要は必ずしもない。
【0103】
また、上述した実施の形態においては、1フレームは4秒の期間であって、20Hzのサンプリング周波数のクロック信号を用いるものとして説明したが、これに限るものではない。フレームの時間長、サンプリング周波数は、カーステレオ装置などの機器に搭載されたCPUの性能などに応じて、適宜のものを選択するようにすればよい。
【0104】
また、上述した実施の形態においては、特定したテンポと総音量に応じて、LCDに例えば静止画像を表示するとともに、表示オブジェクトをも表示させて、この表示オブジェクトを移動させるようにしたが、特定したテンポに応じた処理は、これに限るものではない。
【0105】
例えば、テンポが速い楽曲が再生されている場合には、低域と高域との音域を強調するようにしたり、また、テンポが遅い楽曲が再生されている場合には、サラウンドモードにしたり、リバーブを強めにかけたりするなどの種々の調整を行うようにしてもよい。
【0106】
つまり、特定したテンポに応じて、イコライザの調整、サラウンドモードの切り換え、音量(ボリューム)の調整等の種々の制御を行うことが可能である。
【0107】
また、上述した実施の形態においては、この発明をカーステレオ装置に適用した場合を例にして説明したが、これに限るものではない。家庭用ステレオ装置、CDプレーヤ、MDプレーヤ、DVDプレーヤ、パーソナルコンピュータなどの音声信号を再生して出力するようにする種々のオーディオ装置、オーディオ/ビジュアル装置にこの発明を適用することができる。
【0108】
この発明を例えば家庭用ステレオ装置に適用した場合には、特定したテンポに応じて、室内の照明の明るさや室温の調整などを行うようにすることも可能である。
【0109】
また、上述の実施の形態においては、音声信号の帯域分割は、既存の集積回路(IC)を用いて行うものとして説明したが、これに限るものではない。音声信号の帯域分割も例えば、制御部9において実行されるプログラムによって行うようにすることもできる。
【0110】
つまり、この発明は、ソフトウエアによっても十分に実現することができる。これを具体的に示せば、第1番目のプログラムとして、
音声信号を処理する装置のコンピュータに、
入力音声信号を複数の周波数帯域に分割する帯域分離ステップと、
前記帯域分離ステップにおいて分離した複数の周波数帯域毎に、各周波数帯域の入力音声信号のレベル変化のピークのうち、所定の閾値より大きい複数のピークの位置を検出するピーク検出ステップと、
所定の単位時間区間において、前記複数の周波数帯域毎に前記ピーク検出ステップにおいて検出する前記ピーク位置の間の時間間隔を検出する間隔検出ステップと、
前記間隔検出ステップにおいて前記複数の周波数帯域毎に検出する前記時間間隔を1つのリストにまとめ、前記時間間隔のうち、発生頻度の多い前記時間間隔に基づいて、前記入力音声信号により再生される音声のテンポを特定する特定ステップと
を実行させるプログラム。を作成し、これを有線、無線、あるいは、記録媒体を介して、オーディオ機器やオーディオ/ビジュアル機器に供給し、実行できるようにすることによって、この発明による装置、方法を実現することもできる。
【0111】
また、第2番目のプログラムとして、上述の第1番目のプログラムにおいて、前記特定ステップにおいては、複数の前記単位時間区間において検出される前記ピーク位置間の前記時間間隔の発生頻度を累積し、この累積した発生頻度に基づいて、再生される音声の前記テンポを特定するようにするプログラムを作成することもできる。
【0113】
また、第3のプログラムとして、
出力しようとする音声信号に基づいて、出力しようとする音声の音量を算出する音量算出ステップと、
算出した前記音量を基準として、前記ピーク位置を検出する場合に用いる前記閾値を設定する閾値設定ステップと
を設けたプログラムを作成することも可能である。
【0114】
また、第4のプログラムとして、
特定された前記テンポに基づいて、メモリーに記憶されている画像データの中から画像表示素子に表示する画像の画像データを抽出する画像抽出ステップと、
抽出した前記画像データに応じた画像を前記画像表示素子に表示する表示ステップと
を設けたプログラムを作成することも可能である。
【0115】
また、第5のプログラムとして、
特定された前記テンポに基づいて、画像表示素子に表示する画像の大きさ、移動速度、移動パターンを制御するステップを備えたプログラムを作成することも可能である。
【0116】
このように、この発明による装置、方法の実現は、プログラムによっても可能であり、作成したプログラムは、インターネットや電話網などの種々の電気通信回線やデータ放送によってユーザに提供することが可能であり、また、上述したステップを有するプログラムを記録した記録媒体を配布することによってもユーザに提供することができる。
【0117】
【発明の効果】
以上説明したように、この発明によれば、自己相関演算などの複雑な演算処理を行うことなく、楽曲などの音声のテンポを簡単かつ正確に検出することができる。また、検出したテンポに応じて情報を提供したり、種々の制御を行ったりするなどのことができるようにされる。
【図面の簡単な説明】
【図1】この発明による装置、方法の一実施の形態が適用されたカーステレオ装置を説明するためのブロック図である。
【図2】図1に示したカーステレオ装置に搭載されたテンポ分析装置の実現例を説明するためのブロック図である。
【図3】制御部で実行されるメイン処理を説明するためのフローチャートである。
【図4】図3のステップS1において実効される総音量計算処理を説明するためのフローチャートである。
【図5】図3のステップS2において実効されるテンポ抽出処理を説明するためのフローチャートである。
【図6】図5のステップS21において実行されるスレッショルド処理を説明するためのフローチャートである。
【図7】図5のステップS23において実行されるピーク位置抽出処理を説明するためのフローチャートである。
【図8】ピーク位置抽出処理を説明するための図である。
【図9】図5のステップS25において実行されるピーク間隔(周期)リスト作成およびテンポ決定処理を説明するためのフローチャートである。
【図10】周期リスト(ピーク間隔リスト)を説明するための図である。
【図11】周期リストの足切り処理を説明するための図である。
【図12】各フレーム毎の発生頻度が最も高いピーク間隔の保持と利用について説明するための図である。
【図13】決定されたテンポと音量とにより利用可能な画像データが特定される構造について説明するための図である。
【図14】決定されたテンポを用いて選択され表示するようにされる画像の表示例を示す図である。
【符号の説明】
ANT…受信アンテナ、1…AM/FMチューナ、2…CD再生部、3…MD再生部、4…外部入力端子、5…セレクタ、6…オーディオアンプ部、61…出力信号処理部、62…解析データ抽出部、7L、7R…スピーカ、9…制御部、91…CPU、92…ROM、93…RAM、94…不揮発性メモリー、10LCD、11…キー操作部
Claims (14)
- 入力音声信号を複数の周波数帯域に分割する帯域分離手段と、
前記帯域分離手段により分離された複数の周波数帯域毎に、各周波数帯域の入力音声信号のレベル変化のピークのうち、所定の閾値より大きい複数のピークの位置を検出するピーク検出手段と、
所定の単位時間区間において、前記複数の周波数帯域毎に前記ピーク検出手段により検出される前記ピーク位置の間の時間間隔を検出する間隔検出手段と、
前記間隔検出手段により前記複数の周波数帯域毎に検出される前記時間間隔を1つのリストにまとめ、前記時間間隔のうち、発生頻度の多い前記時間間隔に基づいて、前記入力音声信号により再生される音声のテンポを特定する特定手段と
を備えることを特徴とするテンポ解析装置。 - 請求項1に記載のテンポ解析装置であって、
前記特定手段は、複数の前記単位時間区間において検出されるピーク位置間の前記時間間隔の発生頻度を累積し、この累積した発生頻度に基づいて、再生される音声の前記テンポを特定することを特徴とするテンポ解析装置。 - 請求項1〜2のいずれかに記載のテンポ解析装置であって、
前記入力音声信号の音量を算出する音量算出手段と、
前記音量算出手段により算出された音量を基準として、前記ピーク位置を検出する場合に用いる前記閾値を設定するようにする閾値設定手段と
を備えることを特徴とするテンポ解析装置。 - 請求項1に記載のテンポ解析装置であって、
前記帯域分離手段により分割された前記複数の周波数帯域毎の音声信号の音量を算出する音量算出手段と、
前記音量算出手段により算出された音量を基準として、前記ピーク位置を検出する場合に用いる前記閾値を設定するようにする閾値設定手段と
を備えることを特徴とするテンポ解析装置。 - 請求項1〜4のいずれかに記載のテンポ解析装置であって、
画像表示素子と、
前記画像表示素子に表示可能な複数の画像データを記憶する記憶手段と、
前記特定手段により特定される前記テンポに基づいて、前記記憶手段から画像データを選択して読み出し、読み出した前記画像データに応じた画像を前記画像表示素子に表示するようにする表示制御手段と
を備えたことを特徴とするテンポ解析装置。 - 請求項5に記載のテンポ解析装置であって、
前記表示制御手段は、
前記記憶手段から読み出す前記画像データに応じた画像を前記画像表示素子に表示するとき、前記特定手段により特定される前記テンポに基づいて、前記画像表示素子に表示する前記画像の大きさ、移動速度、移動パターンの少なくとも1つを制御することを特徴とするテンポ解析装置。 - 請求項3〜4のいずれかに記載のテンポ解析装置であって、
画像表示素子と、
前記画像表示素子に表示可能な複数の画像データを記憶する記憶手段と、
前記特定手段により特定される前記テンポに基づいて、前記記憶手段から画像データを 選択して読み出し、読み出した前記画像データに応じた画像を前記画像表示素子に表示するようにする表示制御手段と、
を備え、
前記表示制御手段は、
前記特定手段により特定される前記テンポと前記音量算出手段により算出された音量とに基づいて、前記記憶手段から画像データを選択して読み出すことを特徴とするテンポ解析装置。 - 帯域分離手段と、ピーク検出手段と、間隔検出手段と、テンポを特定する特定手段とを備えたテンポ解析装置が行うテンポ解析方法であって、
前記帯域分離手段が、入力音声信号を複数の周波数帯域に分割する帯域分離工程と、
前記ピーク検出手段が、前記帯域分離手段により分離された複数の周波数帯域毎に、各周波数帯域の入力音声信号のレベル変化のピークのうち、所定の閾値より大きい複数のピークの位置を検出するピーク検出工程と、
前記間隔検出手段が、所定の単位時間区間において、前記複数の周波数帯域毎に前記ピーク検出工程において前記ピーク検出手段が検出した前記ピーク位置の間の時間間隔を検出する間隔検出工程と、
前記特定手段が、前記間隔検出工程において前記間隔検出手段が前記複数の周波数帯域毎に検出した前記時間間隔を1つのリストにまとめ、前記時間間隔のうち、発生頻度の多い時間間隔に基づいて、前記入力音声信号により再生される音声のテンポを特定する特定工程と
を有することを特徴とするテンポ解析方法。 - 請求項8に記載のテンポ解析方法であって、
前記特定工程において、前記テンポの特定に際しては、複数の前記単位時間区間において検出される前記ピーク位置間の前記時間間隔の発生頻度を累積し、この累積した発生頻度に基づいて、再生される音声の前記テンポを特定することを特徴とするテンポ解析方法。 - 請求項8〜9のいずれかに記載のテンポ解析方法であって、
前記テンポ解析装置が備える音量算出手段が、前記入力音声信号の音量を算出する音量算出工程と、
前記テンポ解析装置が備える閾値設定手段が、前記音量算出工程において前記音量算出手段が算出した前記音量を基準として、前記ピーク位置を検出する場合に用いる前記閾値を設定する閾値設定工程と
を有することを特徴とするテンポ解析方法。 - 請求項8〜9のいずれかに記載のテンポ解析方法であって、
前記テンポ解析装置が備える音量算出手段が、前記帯域分離工程において前記帯域分離手段により分割した前記複数の周波数帯域毎の音声信号の音量を算出する音量算出工程と、
前記テンポ解析装置が備える閾値設定手段が、前記音量算出工程において前記音量算出手段が算出した前記音量を基準として、前記ピーク位置を検出する場合に用いる前記閾値を設定する閾値設定工程と
を有することを特徴とするテンポ解析方法。 - 請求項8〜11のいずれかに記載のテンポ解析方法であって、
前記テンポ解析装置が備える表示制御手段が、前記特定工程において前記特定手段が特定した前記テンポに基づいて、記憶手段に記憶されている複数の画像データの中から画像データを選択して読み出し、読み出した前記画像データに応じた画像を画像表示素子に表示する表示制御工程を有することを特徴とするテンポ解析方法。 - 請求項8に記載のテンポ解析方法であって、
前記テンポ解析装置が備える表示制御手段が、前記特定工程において前記特定手段が特定した前記テンポに基づいて、画像表示素子に表示する画像の大きさ、移動速度、移動パターンの少なくとも1つを制御する表示制御工程を有することを特徴とするテンポ解析方法。 - 請求項10〜11のいずれかに記載のテンポ解析方法であって、
前記テンポ解析装置が備える表示制御手段が、前記特定工程において前記特定手段が特定した前記テンポに基づいて、記憶手段に記憶されている複数の画像データの中から画像データを選択して読み出し、読み出した前記画像データに応じた画像を画像表示素子に表示する表示制御工程を有し、
前記表示制御工程においては、前記テンポ解析装置が備える表示制御手段が、特定された前記テンポと算出された前記音量とに基づいて、前記記憶手段に記憶されている複数の画像データの中から画像データを選択して読み出すことを特徴とするテンポ解析方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003094100A JP3982443B2 (ja) | 2003-03-31 | 2003-03-31 | テンポ解析装置およびテンポ解析方法 |
PCT/JP2004/003010 WO2004088631A1 (ja) | 2003-03-31 | 2004-03-09 | テンポ解析装置及びテンポ解析方法 |
KR1020057018634A KR101005255B1 (ko) | 2003-03-31 | 2004-03-09 | 템포 해석 장치 |
CN2004800082260A CN1764940B (zh) | 2003-03-31 | 2004-03-09 | 拍子分析装置和拍子分析方法 |
EP04718756.2A EP1610299B1 (en) | 2003-03-31 | 2004-03-09 | Tempo analysis device and tempo analysis method |
US10/551,403 US7923621B2 (en) | 2003-03-31 | 2004-03-09 | Tempo analysis device and tempo analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003094100A JP3982443B2 (ja) | 2003-03-31 | 2003-03-31 | テンポ解析装置およびテンポ解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004302053A JP2004302053A (ja) | 2004-10-28 |
JP3982443B2 true JP3982443B2 (ja) | 2007-09-26 |
Family
ID=33127380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003094100A Expired - Lifetime JP3982443B2 (ja) | 2003-03-31 | 2003-03-31 | テンポ解析装置およびテンポ解析方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7923621B2 (ja) |
EP (1) | EP1610299B1 (ja) |
JP (1) | JP3982443B2 (ja) |
KR (1) | KR101005255B1 (ja) |
CN (1) | CN1764940B (ja) |
WO (1) | WO2004088631A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4632678B2 (ja) * | 2004-03-11 | 2011-02-16 | 日本電気株式会社 | 音のチューニング機能を備えた移動通信端末 |
JP4650662B2 (ja) * | 2004-03-23 | 2011-03-16 | ソニー株式会社 | 信号処理装置および信号処理方法、プログラム、並びに記録媒体 |
JP4940588B2 (ja) | 2005-07-27 | 2012-05-30 | ソニー株式会社 | ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法 |
KR101215937B1 (ko) * | 2006-02-07 | 2012-12-27 | 엘지전자 주식회사 | IOI 카운트(inter onset intervalcount) 기반 템포 추정 방법 및 이를 위한 템포 추정장치 |
JP4632136B2 (ja) * | 2006-03-31 | 2011-02-16 | 富士フイルム株式会社 | 楽曲テンポ抽出方法、装置及びプログラム |
JP4301270B2 (ja) | 2006-09-07 | 2009-07-22 | ヤマハ株式会社 | オーディオ再生装置およびオーディオ再生方法 |
JP2008065905A (ja) | 2006-09-07 | 2008-03-21 | Sony Corp | 再生装置、再生方法及び再生プログラム |
US7645929B2 (en) * | 2006-09-11 | 2010-01-12 | Hewlett-Packard Development Company, L.P. | Computational music-tempo estimation |
US7659471B2 (en) * | 2007-03-28 | 2010-02-09 | Nokia Corporation | System and method for music data repetition functionality |
JP2009015119A (ja) * | 2007-07-06 | 2009-01-22 | Sanyo Electric Co Ltd | サビ位置検出装置 |
US8344234B2 (en) * | 2008-04-11 | 2013-01-01 | Pioneer Corporation | Tempo detecting device and tempo detecting program |
JP4725646B2 (ja) * | 2008-12-26 | 2011-07-13 | ヤマハ株式会社 | オーディオ再生装置及びオーディオ再生方法 |
JP5569228B2 (ja) * | 2010-08-02 | 2014-08-13 | ソニー株式会社 | テンポ検出装置、テンポ検出方法およびプログラム |
CN102543052B (zh) * | 2011-12-13 | 2015-08-05 | 北京百度网讯科技有限公司 | 一种分析音乐bpm的方法和装置 |
CN104395953B (zh) | 2012-04-30 | 2017-07-21 | 诺基亚技术有限公司 | 来自音乐音频信号的拍子、和弦和强拍的评估 |
US9418643B2 (en) | 2012-06-29 | 2016-08-16 | Nokia Technologies Oy | Audio signal analysis |
US8952233B1 (en) | 2012-08-16 | 2015-02-10 | Simon B. Johnson | System for calculating the tempo of music |
CN103839538B (zh) * | 2012-11-22 | 2016-01-20 | 腾讯科技(深圳)有限公司 | 音乐节奏检测方法及检测装置 |
US9704350B1 (en) | 2013-03-14 | 2017-07-11 | Harmonix Music Systems, Inc. | Musical combat game |
US10395669B2 (en) * | 2016-02-25 | 2019-08-27 | Sony Interactive Entertainment Inc. | Voice analysis apparatus, voice analysis method, and program |
JP6693189B2 (ja) * | 2016-03-11 | 2020-05-13 | ヤマハ株式会社 | 音信号処理方法 |
CN106503127B (zh) * | 2016-10-19 | 2019-09-27 | 竹间智能科技(上海)有限公司 | 基于脸部动作识别的音乐数据处理方法及系统 |
CN106652981B (zh) * | 2016-12-28 | 2019-09-13 | 广州酷狗计算机科技有限公司 | Bpm检测方法及装置 |
WO2018129382A1 (en) * | 2017-01-09 | 2018-07-12 | Inmusic Brands, Inc. | Systems and methods for displaying graphics about a control wheel's center |
US11749240B2 (en) | 2018-05-24 | 2023-09-05 | Roland Corporation | Beat timing generation device and method thereof |
JP7226709B2 (ja) * | 2019-01-07 | 2023-02-21 | ヤマハ株式会社 | 映像制御システム、及び映像制御方法 |
CN111128232B (zh) * | 2019-12-26 | 2022-11-15 | 广州酷狗计算机科技有限公司 | 音乐的小节信息确定方法、装置、存储介质及设备 |
CN113497970B (zh) * | 2020-03-19 | 2023-04-11 | 字节跳动有限公司 | 视频处理方法、装置、电子设备及存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5005459A (en) * | 1987-08-14 | 1991-04-09 | Yamaha Corporation | Musical tone visualizing apparatus which displays an image of an animated object in accordance with a musical performance |
JP3564753B2 (ja) | 1994-09-05 | 2004-09-15 | ヤマハ株式会社 | 歌唱用伴奏装置 |
US5614687A (en) * | 1995-02-20 | 1997-03-25 | Pioneer Electronic Corporation | Apparatus for detecting the number of beats |
JPH10319957A (ja) | 1997-05-23 | 1998-12-04 | Enix:Kk | キャラクタ舞踏動作表示装置、方法および記録媒体 |
US6140565A (en) * | 1998-06-08 | 2000-10-31 | Yamaha Corporation | Method of visualizing music system by combination of scenery picture and player icons |
JP3066528B1 (ja) * | 1999-02-26 | 2000-07-17 | コナミ株式会社 | 楽曲再生システム、リズム解析方法及び記録媒体 |
JP2000311251A (ja) * | 1999-02-26 | 2000-11-07 | Toshiba Corp | アニメーション作成装置および方法、記憶媒体 |
JP4214606B2 (ja) * | 1999-03-17 | 2009-01-28 | ソニー株式会社 | テンポ算出方法及びテンポ算出装置 |
JP3724246B2 (ja) * | 1999-03-23 | 2005-12-07 | ヤマハ株式会社 | 音楽画像表示装置 |
US6323412B1 (en) * | 2000-08-03 | 2001-11-27 | Mediadome, Inc. | Method and apparatus for real time tempo detection |
JP2002207482A (ja) * | 2000-11-07 | 2002-07-26 | Matsushita Electric Ind Co Ltd | 自動演奏装置、及び自動演奏方法 |
WO2002052565A1 (en) * | 2000-12-22 | 2002-07-04 | Muvee Technologies Pte Ltd | System and method for media production |
DE10164686B4 (de) * | 2001-01-13 | 2007-05-31 | Native Instruments Software Synthesis Gmbh | Automatische Erkennung und Anpassung von Tempo und Phase von Musikstücken und darauf aufbauender interaktiver Musik-Abspieler |
US6518492B2 (en) * | 2001-04-13 | 2003-02-11 | Magix Entertainment Products, Gmbh | System and method of BPM determination |
JP4263382B2 (ja) * | 2001-05-22 | 2009-05-13 | パイオニア株式会社 | 情報再生装置 |
JP4646099B2 (ja) * | 2001-09-28 | 2011-03-09 | パイオニア株式会社 | オーディオ情報再生装置及びオーディオ情報再生システム |
-
2003
- 2003-03-31 JP JP2003094100A patent/JP3982443B2/ja not_active Expired - Lifetime
-
2004
- 2004-03-09 US US10/551,403 patent/US7923621B2/en not_active Expired - Lifetime
- 2004-03-09 KR KR1020057018634A patent/KR101005255B1/ko not_active IP Right Cessation
- 2004-03-09 WO PCT/JP2004/003010 patent/WO2004088631A1/ja active Application Filing
- 2004-03-09 CN CN2004800082260A patent/CN1764940B/zh not_active Expired - Lifetime
- 2004-03-09 EP EP04718756.2A patent/EP1610299B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US7923621B2 (en) | 2011-04-12 |
CN1764940A (zh) | 2006-04-26 |
EP1610299B1 (en) | 2015-09-09 |
EP1610299A4 (en) | 2011-04-27 |
US20060185501A1 (en) | 2006-08-24 |
CN1764940B (zh) | 2012-03-21 |
WO2004088631A1 (ja) | 2004-10-14 |
KR20060002907A (ko) | 2006-01-09 |
EP1610299A1 (en) | 2005-12-28 |
KR101005255B1 (ko) | 2011-01-04 |
JP2004302053A (ja) | 2004-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3982443B2 (ja) | テンポ解析装置およびテンポ解析方法 | |
JP4640463B2 (ja) | 再生装置、表示方法および表示プログラム | |
JP3512098B2 (ja) | 情報記録装置および方法、並びに情報再生装置および方法 | |
US20090047003A1 (en) | Playback apparatus and method | |
CN101582274A (zh) | 内容再现设备、状态栏显示方法以及状态栏显示程序 | |
EP1132890B1 (en) | Information retrieving/processing method, retrieving/processing device, storing method and storing device | |
JP4491700B2 (ja) | 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置 | |
JP4568506B2 (ja) | 再生制御装置 | |
JP2002344268A (ja) | 音声再生装置 | |
JP2005252372A (ja) | ダイジェスト映像作成装置及びダイジェスト映像作成方法 | |
JP2007257162A (ja) | 楽曲検索装置、楽曲検索方法及び車載音響機器 | |
JP3047768B2 (ja) | 歌唱練習装置 | |
US20040252616A1 (en) | Data accumulating method and apparatus | |
JP2012098100A (ja) | 誘導経路音声案内出力オーディオ制御装置 | |
JP4264566B2 (ja) | 楽曲データ格納装置および楽曲再生順序設定方法 | |
JP2004354583A (ja) | 音楽生成装置および音楽生成方法 | |
JP2002287744A (ja) | 波形データ分析方法、波形データ分析装置およびプログラム | |
JP3823945B2 (ja) | 音声入力機能付き演奏ガイド装置および演奏ガイド方法 | |
JP5028321B2 (ja) | 音楽記録再生装置およびナビゲーション機能を有する音楽記録再生装置 | |
KR20120048153A (ko) | 네비게이션 시스템에서 멀티미디어 데이터를 재생하기 위한 장치 및 방법 | |
JP2009134786A (ja) | 音声再生装置、音声再生制御装置、音声再生装置の制御方法および制御プログラム | |
JP2005311518A (ja) | 移動体用音楽再生装置 | |
JP2006221314A (ja) | 再生制御装置及び再生制御方法等 | |
JP3886175B2 (ja) | オーディオ装置のゲイン測定装置 | |
KR19980049327A (ko) | 씨디(cd) 플레이어의 고속탐색방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070612 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070625 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100713 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3982443 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100713 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100713 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110713 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120713 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130713 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |