JP2009015119A - サビ位置検出装置 - Google Patents

サビ位置検出装置 Download PDF

Info

Publication number
JP2009015119A
JP2009015119A JP2007178222A JP2007178222A JP2009015119A JP 2009015119 A JP2009015119 A JP 2009015119A JP 2007178222 A JP2007178222 A JP 2007178222A JP 2007178222 A JP2007178222 A JP 2007178222A JP 2009015119 A JP2009015119 A JP 2009015119A
Authority
JP
Japan
Prior art keywords
rust
music
chorus
detecting
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007178222A
Other languages
English (en)
Inventor
Tatsuo Koga
達雄 古賀
Tomoji Yamamoto
友二 山本
Satoru Matsumoto
悟 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2007178222A priority Critical patent/JP2009015119A/ja
Priority to US12/139,728 priority patent/US20090012637A1/en
Publication of JP2009015119A publication Critical patent/JP2009015119A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/061Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of musical phrases, isolation of musically relevant segments, e.g. musical thumbnail generation, or for temporal structure analysis of a musical piece, e.g. determination of the movement sequence of a musical work
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/221Cosine transform; DCT [discrete cosine transform], e.g. for use in lossy audio compression such as MP3
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • G11B2020/10574Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account volume or amplitude

Abstract

【課題】この発明は、楽曲のサビ位置を検出することができるサビ位置検出装置を提供することを目的とする。
【解決手段】楽曲データの音声パワーの変化量を算出する手段、楽曲データの周波数領域における特徴量を算出する手段、音声パワーの変化量が最大となる位置をサビ位置候補として検出する手段、検出されたサビ位置候補近傍の楽曲データの周波数領域における特徴量に基づいて、当該サビ位置候補近傍が楽曲である確率が高いか否かを判別する手段、当該サビ位置候補近傍が楽曲である確率が高い場合には当該サビ位置候補をサビ位置として決定する手段、ならびに当該サビ位置候補近傍が楽曲である確率が低い場合には、音声パワーの変化量が次に最大となる位置をサビ位置候補として検出し、検出したサビ位置候補に基づいて同様な処理を行なう手段を備えている。
【選択図】図1

Description

この発明は、楽曲中のサビ部分の開始位置(サビ位置)を検出するサビ位置検出装置に関する。
近年、記憶メディアの大容量化により音楽ファイルを大量に記録する楽曲記録再生機器が普及している。楽曲記録再生機器に記録されている大量の音楽ファイルからユーザに再生させたい曲を選択させる方法として、再生リスト(タイトル名やアーチスト名)を表示する方法や、各曲の冒頭部分(イントロ部分)だけを順次再生していく方法がある。しかしながら、これらの方法では、ユーザが再生させたい曲のタイトル名を知らない場合、ユーザが再生させたい曲のイントロを聞いたことがない場合等には、ユーザが再生させたい曲を選択することができない。
特開2003−177784号公報
ところで、楽曲中のサビ部分は、曲中で最も盛り上がる部分なので、ユーザに強く印象が残る部分である。そこで、楽曲記録再生機器に記録されている大量の音楽ファイルからユーザに再生させたい曲を選択させる場合に、各曲のサビ部分のみを順次再生できれば、再生させたい曲をユーザが選択しやすくなると考えられる。
この発明は、楽曲のサビ位置を検出することができるサビ位置検出装置を提供することを目的とする。
また、この発明は、ラジオ番組の司会者等の会話が重なっている可能性のある楽曲からその楽曲のサビ位置を検出する場合に、司会者等の会話部分がサビ位置として誤検出されにくくなるサビ位置検出装置を提供することを目的とする。
請求項1に記載の発明は、楽曲データの特徴量に基づいて楽曲のサビ位置を検出するサビ位置検出装置において、楽曲データの音声パワーの変化量を算出する手段、および音声パワーの変化量が最大となる位置をサビ位置として検出する手段を備えていることを特徴とする。
請求項2に記載の発明は、楽曲データの特徴量に基づいて楽曲のサビ位置を検出するサビ位置検出装置において、楽曲データの音声パワーの変化量を算出する手段、楽曲データの周波数領域における特徴量を算出する手段、音声パワーの変化量が最大となる位置をサビ位置候補として検出する手段、検出されたサビ位置候補近傍の楽曲データの周波数領域における特徴量に基づいて、当該サビ位置候補近傍が楽曲である確率が高いか否かを判別する手段、当該サビ位置候補近傍が楽曲である確率が高い場合には当該サビ位置候補をサビ位置として決定する手段、ならびに当該サビ位置候補近傍が楽曲である確率が低い場合には、音声パワーの変化量が次に最大となる位置をサビ位置候補として検出し、検出したサビ位置候補に基づいて同様な処理を行なう手段を備えていることを特徴とする。
請求項3に記載の発明は、楽曲データの特徴量に基づいて楽曲のサビ位置を検出するためのサビ位置検出処理を行なうサビ位置検出手段、ならびに楽曲データのうち、楽曲先頭の所定長さ部分および/または楽曲末尾の所定長さ部分を除いた範囲を検出範囲とし、当該検出範囲内においてサビ位置検出手段によるサビ位置検出処理を実行させる手段を備えていることを特徴とする。
請求項4に記載の発明は、請求項3に記載のサビ位置検出装置において、サビ位置検出手段は、楽曲データの音声パワーの変化量を算出する手段、および音声パワーの変化量が最大となる位置をサビ位置として検出する手段を備えていることを特徴とする。
請求項5に記載の発明は、請求項3に記載のサビ位置検出装置において、サビ位置検出手段は、楽曲データの音声パワーの変化量を算出する手段、楽曲データの周波数領域における特徴量を算出する手段、音声パワーの変化量が最大となる位置をサビ位置候補として検出する手段、検出されたサビ位置候補近傍の楽曲データの周波数領域における特徴量に基づいて、当該サビ位置候補近傍が楽曲である確率が高いか否かを判別する手段、当該サビ位置候補近傍が楽曲である確率が高い場合には当該サビ位置候補をサビ位置として決定する手段、ならびに当該サビ位置候補近傍が楽曲である確率が低い場合には、音声パワーの変化量が次に最大となる位置をサビ位置候補として検出し、検出したサビ位置候補に基づいて同様な処理を行なう手段を備えていることを特徴とする。
この発明によれば、楽曲のサビ位置を検出することができるようになる。
また、この発明によれば、ラジオ番組の司会者等の会話が重なっている可能性のある楽曲からその楽曲のサビ位置を検出する場合に、司会者等の会話部分がサビ位置として誤検出されにくくなる。
以下、図面を参照して、この発明の実施例について説明する。
〔1〕楽曲記録再生装置の構成
図1は、楽曲記録再生装置の構成を示している。
楽曲記録再生装置は、FMチューナ部1、A/D変換部2、DSP3、MP3(MPEG Audio Layer-3)エンコード部4、記録媒体5、MP3デコード部6、D/A変換部7、スピーカ8、メモリ9およびCPU10を備えている。
FMチューナ部1は、FM放送波を復調してアナログ音声信号を出力する。A/D変換部2は、FMチューナ部1で得られたアナログ音声信号をデジタル音声信号に変換する。DSP3は、入力されるデジタル音声信号から音声パワーの変化量、周波数領域における特徴量を抽出する。
MP3エンコード部4は、デジタル音声信号をMP3圧縮データにエンコードする。記録媒体5は、MP3エンコード部4によって得られたMP3圧縮データを記録する。MP3デコード部6は、MP3圧縮データを元のデジタル音声信号にデコードする。D/A変換部7は、MP3デコード部6で得られたデジタル音声信号をアナログ音声信号に変換する。スピーカ8は、D/A変換部7によって得られたアナログ音声信号を音声出力する。CPU10は、楽曲記録再生装置の各部を制御する。
この実施例では、記録モードとして、受信した音声信号を記録する通常記録モードと、受信した音声信号から楽曲部分のみを抽出して記録する楽曲記録モードとがある。楽曲記録モードによる楽曲記録中において楽曲が記録された場合には、その楽曲のサビ部分の開始位置(サビ位置)が検出されて記録される。再生モードとしては、ユーザによって選択された楽曲を再生する通常再生モードと、記録されている各楽曲のサビ部分のみを順次再生するサビ部分再生モードとがある。サビ部分再生モード中に通常再生指令が入力された場合には、現在、サビ部分が再生されている楽曲が先頭から通常再生される。
以下、楽曲記録モードによる楽曲記録処理、通常再生モードによる通常再生処理およびサビ部分再生モードによるサビ部分再生処理手順について説明する。
〔2〕楽曲記録処理
〔2−1〕楽曲部分の抽出方法
楽曲記録処理では、受信した音声信号のうち、楽曲部分のみを抽出して記録する。楽曲部分の抽出方法について説明する。まず、音声パワーの変化量が所定の閾値以上となるタイミングを変化点として検出する。音声パワーとしては、たとえば、音声信号の振幅を二乗したものが用いられる。そして、変化点近傍の音声信号の周波数領域における特徴量を検出し、検出した特徴量に基づいて、変化点近傍が楽曲であるかラジオ番組の司会者(ディスクジョッキー)による会話部分(トーク部分)であるかを判別する。周波数領域における特徴量としては、たとえば、メルケプストラム( MFCC:Mel Frequency Cepstral Coefficients)が用いられる。より具体的には、検出されたMFCCと予め作成されている楽曲に対する基準データ(MFCC)との間の尤度を算出し、尤度が所定の閾値αより大きい場合に変化点近傍が楽曲であると判別する。あるいは、変化点近傍のMFCCを予め作成した評価関数に代入することにより評価値を算出し、得られた評価値に基づいて変化点近傍が楽曲であるか会話部分であるかを判別するようにしてもよい。
変化点近傍が楽曲であるとの判定が、所定時間(T1秒)より長い時間、継続した場合には、T1秒前の時点から楽曲区間が開始されたと判別し、T1秒前の位置から音声信号の記録を開始させる。この後において、変化点近傍が楽曲でないと判定されたときには、音声信号の記録位置はT1秒分遅れているので、その時点からT1秒経過したときに、音声信号の記録を停止させる。T1は、例えば、30〜120秒の範囲内の値に設定される。
〔2−2〕サビ部分の位置の検出方法
1つの楽曲が記録されたときには、その楽曲のサビ部分の開始位置(サビ位置)を検出する。サビ位置の検出方法について説明する。基本的には、サビ部分の直前の”間”をサビ位置として検出する。サビ部分の直前の”間”は、図2に示すように、音声パワーの変化量が大きいため、音声パワーの変化量が最大となる位置を検出するにより、サビ部分の直前の”間”を検出できる。
しかしながら、ラジオ放送から楽曲を記録した場合、楽曲と重なって記録された司会者(ディスクジョッキー)の曲紹介等の会話部分(トーク部分)は、音声パワーの変化量が大きいため、司会者の会話部分をサビ部分の直前の”間”と誤検出するおそれがある。
そこで、司会者の会話が楽曲と重なる可能性が高い、楽曲の冒頭部分(図2に符号M1で示す斜線部分)や楽曲の末尾部分(図2に符号M2で示す斜線部分)を除いた部分を、サビ部分の検出対象範囲とする。さらに、音声パワーの変化量に基づいて検出されたサビ位置候補近傍の音声信号の周波数の特徴量に基づいて、サビ位置候補近傍が楽曲である確率が高いか否かを判別し、高い場合には、当該サビ位置候補をサビ位置と決定する。サビ位置候補近傍が楽曲である確率が低い場合には、音声パワーの変化量が次に最大となる位置をサビ位置候補として検出する。そして、同様な処理を行なう。
サビ位置の検出方法についてより具体的に説明する。まず、検出対象範囲を決定する。つまり、記録媒体に記録された楽曲の開始位置からT2秒後の位置を第1位置とし、楽曲の終了位置からT3秒前の位置を第2位置として、検出対象範囲を第1位置から第2位置までの範囲に決定する。T2またはT3は、例えば、15〜30秒の範囲内の値に設定される。次に、検出対象範囲内において、音声パワーの変化量が最大となる位置をサビ位置候補とて検出する。検出したサビ位置候補近傍での音声信号の周波数領域における特徴量に基づいて、当該サビ位置候補近傍が楽曲である確立が高いか低いかを判別する。周波数領域における特徴量としては、たとえば、MFCCが用いられる。より具体的には、サビ位置候補近傍のMFCCと予め作成されている楽曲に対する基準データ(MFCC)との間の尤度を算出し、尤度が所定の閾値βより大きいか否かを判別する。尤度が所定の閾値β以上の場合には、当該サビ位置候補をサビ位置と決定する。尤度が所定の閾値βより小さい場合には、検出対象範囲において、音声パワーの変化量が次に最大となる位置をサビ位置候補として検出する。そして、同様な処理行なう。
〔2−3〕楽曲記録処理手順
図3は、楽曲記録処理手順を示している。
FMチューナ1を起動させる(ステップS1)。そして、DSP3による特徴抽出処理を起動させる(ステップS2)。これにより、DSP3は、入力されるデジタル音声信号から音声パワーの変化量、周波数領域における特徴量を算出して、CPU10に与える。音声パワーとしては、たとえば、音声信号の振幅を二乗したものが用いられる。周波数領域における特徴量としては、たとえば、メルケプストラム( MFCC:Mel Frequency Cepstral Coefficients)が用いられる。
CPU10は、音声パワーの変化量に基づいて変化点であるか否かの判別を行なう(ステップS3)。変化点でなければ、ステップS3に戻る。変化点であると判別した場合、つまり、音声パワーの変化量が所定の閾値より大きい場合には、(ステップS3でYES)、当該変化点近傍の音声信号の周波数領域における特徴量(この例ではMFCC)に基づいて、変化点近傍が楽曲であるか否かを判別する(ステップS4)。変化点近傍が楽曲でなければ、ステップS3に戻る。
上記ステップS4において、変化点近傍が楽曲であると判別した場合には、第1タイマによる計時を開始させる(ステップS5)。そして、第1タイマによる計時時間(Timer1) がT1秒を超えたか否かを判別する(ステップS6)。第1タイマによる計時時間(Timer1) がT1秒以下である場合には、音声パワーの変化量に基づいて変化点であるか否かの判別を行なう(ステップS7)。変化点でなければ、ステツプS6に戻る。上記ステップS7で変化点であると判別した場合は、当該変化点近傍の音声信号の周波数領域における特徴量(この例ではMFCC)に基づいて、変化点近傍が楽曲であるか否かを判別する(ステップS8)。変化点近傍が楽曲であると判別した場合には、ステップS6に戻る。
上記ステップS8において、変化点近傍が楽曲でないと判別した場合には、ステップS5に戻り、第1タイマによる計時を開始させる。この場合には、第1タイマによる計時が再スタートされることになる。
上記ステップS6で、第1タイマによる計時時間(Timer1) がT1秒を超えたと判別した場合には、T1秒前から楽曲が開始されていると判断し、T1秒前の位置から音声信号のエンコードおよび記録媒体5への保存を開始させる(ステップS9)。
次に、後述するサビ位置検出処理を行なうために、音声パワーの変化量および周波数領域における特徴量(この例ではMFCC)を保存する(ステップS10)。また、音声パワーの変化量に基づいて変化点であるか否かの判別を行なう(ステップS11)。変化点でなければ、ステツプS10に戻る。変化点であると判別した場合、つまり、音声パワーの変化量が所定の閾値より大きい場合には、(ステップS11でYES)、当該変化点近傍の音声信号の周波数領域における特徴量(この例ではMFCC)に基づいて、変化点近傍が楽曲であるか否かを判別する(ステップS12)。変化点近傍が楽曲であると判別した場合には、ステップS10に戻る。
上記ステップS12において、変化点近傍が楽曲でないと判別した場合には、第2タイマによる計時を開始させる(ステップS13)。そして、第2タイマによる計時時間(Timer2) がT1秒に到達すると(ステップS14)、音声信号のエンコードおよび記録媒体5への保存を停止させる(ステップS15)。
この後、保存した楽曲のサビ位置検出処理を行なう(ステップS16)。そして、ステップS3に戻る。
図4は、図3のステップS16のサビ位置検出処理の詳細な手順を示している。
まず、サビ位置検出範囲を決定する(ステップS21)。具体的には、楽曲の開始位置からT2秒後の位置を第1位置とし、楽曲の終了位置からT3秒前までの位置を第2位置として、第1位置から第2位置までの範囲をサビ位置検出範囲として決定する。
次に、サビ位置検出範囲内において、音声パワーの変化量が最大となる位置をサビ位置候補として検出する(ステップS22)。そして、サビ位置候補近傍の音声信号の周波数領域における特徴量(この例ではMFCC)と、予め作成されている楽曲に対する基準データ(MFCC)との間の尤度を算出し、尤度が所定の閾値βより大きいか否かを判別する(ステップS23)。
上記ステップS23において、尤度が所定の閾値β以下である場合には、現在のサビ位置候補の次に音声パワーの変化量が最大となる位置を、新たなサビ位置候補として検出した後(ステップS24)、ステップS23に戻る。
上記ステップS23において、尤度が所定の閾値βより大きいと判別した場合には、現在のサビ位置候補を、今回記録した楽曲のサビ位置として記録媒体5に記録する(ステップS25)。そして、図3のステップS3に戻る。
〔3〕通常再生処理
図5は、通常再生処理手順を示している。
ユーザによって再生したい楽曲が選曲された後に通常再生指示が入力されると、記録媒体5から選曲された楽曲データを読み出していく(ステップS32)。記録媒体5から読み出された楽曲データをMP3デコード部6によってデコードさせることにより、スピーカ8から出力させる(ステップS33)。これにより、ユーザによって選択された楽曲が再生される。
楽曲再生中においては、再生停止指示が入力されたか否かが監視される。楽曲再生中において、再生停止指示が入力されると(ステップS34)、記録媒体5からの楽曲データの読み出し処理およびMP3デコード部6によるデコード処理を停止させる(ステップS35)。
〔4〕サビ部分再生処理
図6は、サビ部分再生処理の手順を示している。
サビ部分再生指示が入力されると、記録媒体5から全ての楽曲データのサビ位置を読み出す(ステップS41)。そして、最初の楽曲データを再生対象曲として設定する(ステップS42)。記録媒体から再生対象曲の楽曲データを当該楽曲のサビ位置から読み出していく(ステップS43)。記録媒体5から読み出された楽曲データをMP3デコード部6によってデコードさせることにより、スピーカ8から出力させる(ステップS44)。これにより、再生対象曲のサビ部分が再生される。再生対象曲のサビ部分の再生が開始されてから所定時間が経過したか否かを判別する(ステップS45)。
所定時間が経過していない場合には、通常再生指示が入力されたか否かを判別する(ステップS46)。通常再生指示が入力されていない場合には、再生停止指示が入力されたか否かを判別する(ステップS47)。再生停止指示が入力されていない場合には、ステップS44に戻る。
上記ステップS45において、再生対象曲のサビ部分の再生が開始されてから所定時間が経過したと判別した場合には、次の楽曲データを再生対象曲として設定した後(ステップS48)、ステップS43に戻る。これにより、次の楽曲データのサビ部分の再生が開始される。
上記ステップS46において、通常再生指示が入力されたと判別した場合には、現在の再生対象曲に対して、通常再生処理を行なう(ステップS49)。つまり、現在の再生対象曲をその先頭から再生する。
上記ステップS47において、再生停止指示が入力されたと判別した場合には、記録媒体5からの楽曲データの読み出し処理およびMP3デコード部6によるデコード処理を停止させる(ステップS50)。
上記実施例では、楽曲データの圧縮方式としては、MP3が用いられているが、MP3以外の方式を用いてもよい。また、FMラジオ放送から楽曲を録音(記録)する例について説明したが、インターネットで配信される楽曲を録音する場合等にもこの発明を適用するとこができる。
楽曲記録再生装置の構成を示すブロック図である。 サビ位置の検出方法の説明するための模式図である。 楽曲記録処理手順を示すフローチャートである。 図3のステップS16のサビ位置検出処理の詳細な手順を示すフローチャートである。 通常再生処理手順を示すフローチャートである。 サビ部分再生処理の手順を示すフローチャートである。
符号の説明
1 FMチューナ部
2 A/D変換部
3 DSP
4 MP3エンコード部
5 記録媒体
6 MP3デコード部
7 D/A変換部
8 スピーカ
9 メモリ
10 CPU

Claims (5)

  1. 楽曲データの特徴量に基づいて楽曲のサビ位置を検出するサビ位置検出装置において、
    楽曲データの音声パワーの変化量を算出する手段、および
    音声パワーの変化量が最大となる位置をサビ位置として検出する手段、
    を備えていることを特徴とするサビ位置検出装置。
  2. 楽曲データの特徴量に基づいて楽曲のサビ位置を検出するサビ位置検出装置において、
    楽曲データの音声パワーの変化量を算出する手段、
    楽曲データの周波数領域における特徴量を算出する手段、
    音声パワーの変化量が最大となる位置をサビ位置候補として検出する手段、
    検出されたサビ位置候補近傍の楽曲データの周波数領域における特徴量に基づいて、当該サビ位置候補近傍が楽曲である確率が高いか否かを判別する手段、
    当該サビ位置候補近傍が楽曲である確率が高い場合には当該サビ位置候補をサビ位置として決定する手段、ならびに
    当該サビ位置候補近傍が楽曲である確率が低い場合には、音声パワーの変化量が次に最大となる位置をサビ位置候補として検出し、検出したサビ位置候補に基づいて同様な処理を行なう手段、
    を備えていることを特徴とするサビ位置検出装置。
  3. 楽曲データの特徴量に基づいて楽曲のサビ位置を検出するためのサビ位置検出処理を行なうサビ位置検出手段、ならびに楽曲データのうち、楽曲先頭の所定長さ部分および/または楽曲末尾の所定長さ部分を除いた範囲を検出範囲とし、当該検出範囲内においてサビ位置検出手段によるサビ位置検出処理を実行させる手段を備えていることを特徴とするサビ位置検出装置。
  4. サビ位置検出手段は、楽曲データの音声パワーの変化量を算出する手段、および音声パワーの変化量が最大となる位置をサビ位置として検出する手段を備えていることを特徴とする請求項3に記載のサビ位置検出装置。
  5. サビ位置検出手段は、楽曲データの音声パワーの変化量を算出する手段、楽曲データの周波数領域における特徴量を算出する手段、音声パワーの変化量が最大となる位置をサビ位置候補として検出する手段、検出されたサビ位置候補近傍の楽曲データの周波数領域における特徴量に基づいて、当該サビ位置候補近傍が楽曲である確率が高いか否かを判別する手段、当該サビ位置候補近傍が楽曲である確率が高い場合には当該サビ位置候補をサビ位置として決定する手段、ならびに当該サビ位置候補近傍が楽曲である確率が低い場合には、音声パワーの変化量が次に最大となる位置をサビ位置候補として検出し、検出したサビ位置候補に基づいて同様な処理を行なう手段を備えていることを特徴とする請求項3に記載のサビ位置検出装置。
JP2007178222A 2007-07-06 2007-07-06 サビ位置検出装置 Pending JP2009015119A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007178222A JP2009015119A (ja) 2007-07-06 2007-07-06 サビ位置検出装置
US12/139,728 US20090012637A1 (en) 2007-07-06 2008-06-16 Chorus position detection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007178222A JP2009015119A (ja) 2007-07-06 2007-07-06 サビ位置検出装置

Publications (1)

Publication Number Publication Date
JP2009015119A true JP2009015119A (ja) 2009-01-22

Family

ID=40222101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007178222A Pending JP2009015119A (ja) 2007-07-06 2007-07-06 サビ位置検出装置

Country Status (2)

Country Link
US (1) US20090012637A1 (ja)
JP (1) JP2009015119A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009177329A (ja) * 2008-01-22 2009-08-06 Sanyo Electric Co Ltd 楽曲メタ情報配信システムにおけるクライアント側装置および音声データ出力装置
WO2012176667A1 (ja) 2011-06-23 2012-12-27 オリンパスメディカルシステムズ株式会社 内視鏡用対物光学系
WO2013021896A1 (ja) * 2011-08-10 2013-02-14 ソニー株式会社 信号処理装置および方法、信号処理システム、並びにプログラム
JPWO2017168694A1 (ja) * 2016-03-31 2018-12-27 Pioneer DJ株式会社 楽曲構造解析装置、楽曲構造解析方法および楽曲構造解析プログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2493652B (en) * 2010-06-01 2018-07-04 Halliburton Energy Services Inc Spectroscopic nanosensor logging systems and methods
CN106409311B (zh) * 2015-07-31 2019-11-19 阿里巴巴集团控股有限公司 副歌提取装置和方法
CN105280196B (zh) * 2015-11-19 2019-03-19 科大讯飞股份有限公司 副歌检测方法及系统
CN113035160B (zh) * 2021-02-26 2022-08-02 成都潜在人工智能科技有限公司 基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质
CN113345470B (zh) * 2021-06-17 2022-10-18 青岛聚看云科技有限公司 一种k歌内容审核方法、显示设备及服务器

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0832866A (ja) * 1994-07-18 1996-02-02 Canon Inc 自動露光制御装置
JPH1169290A (ja) * 1997-08-15 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 映像制作方法及び装置及びこの方法を記録した記録媒体
JPH1173193A (ja) * 1997-08-29 1999-03-16 Brother Ind Ltd カラオケ装置
JP2001283569A (ja) * 2000-03-30 2001-10-12 Seiko Epson Corp さびサーチ装置
JP2004120553A (ja) * 2002-09-27 2004-04-15 Clarion Co Ltd 記録再生装置、記録装置、それらの制御方法、制御プログラム及び記録媒体
JP2004233965A (ja) * 2002-10-24 2004-08-19 National Institute Of Advanced Industrial & Technology 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム
JP2004302053A (ja) * 2003-03-31 2004-10-28 Sony Corp テンポ解析装置およびテンポ解析方法
JP2006129363A (ja) * 2004-11-01 2006-05-18 Casio Comput Co Ltd 番組要約装置および番組要約処理プログラム
JP2007080304A (ja) * 2005-09-09 2007-03-29 Sharp Corp オーディオ装置及び楽曲再生方法
JP2007156434A (ja) * 2005-11-08 2007-06-21 Sony Corp 情報処理装置および方法、並びにプログラム
JP2007171267A (ja) * 2005-12-19 2007-07-05 Nippon Telegr & Teleph Corp <Ntt> 連続メディアデータ短縮再生方法、複合メディアデータ短縮再生方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7386357B2 (en) * 2002-09-30 2008-06-10 Hewlett-Packard Development Company, L.P. System and method for generating an audio thumbnail of an audio track
US7953504B2 (en) * 2004-05-14 2011-05-31 Synaptics Incorporated Method and apparatus for selecting an audio track based upon audio excerpts

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0832866A (ja) * 1994-07-18 1996-02-02 Canon Inc 自動露光制御装置
JPH1169290A (ja) * 1997-08-15 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 映像制作方法及び装置及びこの方法を記録した記録媒体
JPH1173193A (ja) * 1997-08-29 1999-03-16 Brother Ind Ltd カラオケ装置
JP2001283569A (ja) * 2000-03-30 2001-10-12 Seiko Epson Corp さびサーチ装置
JP2004120553A (ja) * 2002-09-27 2004-04-15 Clarion Co Ltd 記録再生装置、記録装置、それらの制御方法、制御プログラム及び記録媒体
JP2004233965A (ja) * 2002-10-24 2004-08-19 National Institute Of Advanced Industrial & Technology 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム
JP2004302053A (ja) * 2003-03-31 2004-10-28 Sony Corp テンポ解析装置およびテンポ解析方法
JP2006129363A (ja) * 2004-11-01 2006-05-18 Casio Comput Co Ltd 番組要約装置および番組要約処理プログラム
JP2007080304A (ja) * 2005-09-09 2007-03-29 Sharp Corp オーディオ装置及び楽曲再生方法
JP2007156434A (ja) * 2005-11-08 2007-06-21 Sony Corp 情報処理装置および方法、並びにプログラム
JP2007171267A (ja) * 2005-12-19 2007-07-05 Nippon Telegr & Teleph Corp <Ntt> 連続メディアデータ短縮再生方法、複合メディアデータ短縮再生方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009177329A (ja) * 2008-01-22 2009-08-06 Sanyo Electric Co Ltd 楽曲メタ情報配信システムにおけるクライアント側装置および音声データ出力装置
WO2012176667A1 (ja) 2011-06-23 2012-12-27 オリンパスメディカルシステムズ株式会社 内視鏡用対物光学系
US8715170B2 (en) 2011-06-23 2014-05-06 Olympus Medical Systems Corp. Objective optical system for endoscope
US8976468B2 (en) 2011-06-23 2015-03-10 Olympus Medical Systems Corp. Endoscope objective optical system
WO2013021896A1 (ja) * 2011-08-10 2013-02-14 ソニー株式会社 信号処理装置および方法、信号処理システム、並びにプログラム
JP2013037274A (ja) * 2011-08-10 2013-02-21 Sony Corp 信号処理装置および方法、信号処理システム、並びにプログラム
CN103733255A (zh) * 2011-08-10 2014-04-16 索尼公司 信号处理装置和方法、信号处理系统以及程序
JPWO2017168694A1 (ja) * 2016-03-31 2018-12-27 Pioneer DJ株式会社 楽曲構造解析装置、楽曲構造解析方法および楽曲構造解析プログラム

Also Published As

Publication number Publication date
US20090012637A1 (en) 2009-01-08

Similar Documents

Publication Publication Date Title
JP2009015119A (ja) サビ位置検出装置
JP2008076776A (ja) データ記録装置、データ記録方法及びデータ記録プログラム
JP4973492B2 (ja) 再生装置、再生方法及び再生プログラム
KR101424974B1 (ko) 복수의 반복되는 부분들을 가진 음악 데이터의 첫 번째부분만을 재생하는 방법 및 장치
JP4877811B2 (ja) 特定区間抽出装置、音楽記録再生装置、音楽配信システム
JP2008241850A (ja) 録音または再生装置
JP2011090290A (ja) 楽曲抽出装置および楽曲録音装置
JP4990375B2 (ja) 記録再生装置
JP2010078984A (ja) 楽曲抽出装置および楽曲記録装置
CN115731943A (zh) 一种爆音检测方法、爆音检测系统、存储介质和电子设备
JP4278667B2 (ja) 楽曲結合装置、楽曲結合方法、及び楽曲結合プログラム
JP4408288B2 (ja) ディジタルダビング装置
JP4934990B2 (ja) 音声信号記録再生装置
JP2006268936A (ja) オーディオ信号再生装置
JP2005274991A (ja) 楽曲データ格納装置および重複楽曲削除方法
WO2009101808A1 (ja) 楽曲記録装置
JP2008079047A (ja) データ再生装置、データ再生方法及びデータ再生プログラム
JP2010027115A (ja) 音楽記録再生装置
JP2005266571A (ja) 変速再生方法及び装置、並びにプログラム
JP2009053297A (ja) 楽曲記録装置
JP4264670B2 (ja) 記憶再生装置及び記憶再生方法
JP4961300B2 (ja) 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム
JP2011090082A (ja) 楽曲抽出装置
JP4633022B2 (ja) 楽曲編集装置、及び楽曲編集プログラム。
JP2003249027A (ja) 記録再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111006

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120301