JP4961300B2 - 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム - Google Patents

楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム Download PDF

Info

Publication number
JP4961300B2
JP4961300B2 JP2007210839A JP2007210839A JP4961300B2 JP 4961300 B2 JP4961300 B2 JP 4961300B2 JP 2007210839 A JP2007210839 A JP 2007210839A JP 2007210839 A JP2007210839 A JP 2007210839A JP 4961300 B2 JP4961300 B2 JP 4961300B2
Authority
JP
Japan
Prior art keywords
music
variable
music content
procedure
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007210839A
Other languages
English (en)
Other versions
JP2008070868A (ja
Inventor
悟 松本
友二 山本
達雄 古賀
良輔 大槻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2007210839A priority Critical patent/JP4961300B2/ja
Priority to US12/029,643 priority patent/US7985915B2/en
Publication of JP2008070868A publication Critical patent/JP2008070868A/ja
Application granted granted Critical
Publication of JP4961300B2 publication Critical patent/JP4961300B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は楽曲コンテンツ処理技術に関し、特に、複数の楽曲コンテンツに対して一致判定を行う楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラムに関する。
テレビ放送又はラジオ放送等を受信し、楽曲コンテンツを自動的に収集(記録)する楽曲記録装置が知られている。また、テレビ放送又はラジオ放送から楽曲コンテンツを取得することに加え、CDなどの記録媒体から楽曲コンテンツを取得したり、楽曲コンテンツを配信する配信サーバから通信ネットワークを介して楽曲コンテンツを取得したりする楽曲記録装置も知られている。
このような楽曲記録装置においては、ユーザが気付かないうちに、同一の楽曲コンテンツが複数記録され、HDDなどの楽曲コンテンツ記録部の記録容量が無駄に消費されてしまうことがある。
記録された楽曲コンテンツに楽曲情報が付加されていれば、その楽曲情報によって同一の楽曲コンテンツを検索し、不要な(品質の低い)楽曲コンテンツを削除可能である。しかし、記録された楽曲コンテンツに楽曲情報が付加されていない場合に、同一の楽曲コンテンツを検索するためには、記録された楽曲コンテンツを再生し、実際にユーザが各楽曲コンテンツを聴くことを要する。
一方、同一の楽曲コンテンツを自動的に検索する技術としては、各楽曲コンテンツの音声波形のマッチング演算を行うことで、同一の楽曲コンテンツを検索する手法が知られている(例えば、特許文献1参照)。
特表2004−537760号公報
しかしながら、音声波形のマッチング演算を行う場合、複雑な演算を必要とするために、CPU等の処理負担が増大するという問題がある。また、複数の楽曲コンテンツが圧縮符号化された状態で記録されている場合、音声波形のマッチング演算を行うためには各楽曲コンテンツを復号化することが必要であり、演算量が更に増大する。
上記問題点に鑑み、本発明は、楽曲コンテンツの一致判定に要する処理負荷を削減可能な楽曲一致判定装置、楽曲一致判定方法、及び楽曲一致判定プログラムを提供することを目的とする。
また、本発明は、楽曲コンテンツの一致判定に要する処理負荷を削減しつつ、複数の一致する楽曲コンテンツの中から品質の低い楽曲コンテンツを削除することによって、楽曲コンテンツ記録部の記録容量を有効活用できる楽曲記録装置、楽曲記録方法、及び楽曲記録プログラムを提供することを目的とする。
本発明の第1の特徴は、複数の楽曲コンテンツのそれぞれから特徴量を算出し、特徴量が閾値を超えた時点をカット点として検出するカット点検出部(カット点検出部71)と、複数の楽曲コンテンツのそれぞれについて、カット点に関する情報を記憶するカット点情報記憶部(カット点情報記憶部92)と、記憶されたカット点に関する情報に基づき、複数の楽曲コンテンツが一致するか否かを判定する一致判定部(一致判定部81)とを備えることを要旨とする。ここで、「楽曲コンテンツ」とは、音楽(楽曲)が含まれるコンテンツを意味する。
この特徴によれば、楽曲で特徴量の変化が大きい時点をカット点として記憶し、このカット点に関する情報によって楽曲の一致判定を行うので、少ない演算量で楽曲の一致判定を行うことができる。
本発明の第2の特徴は、第1の特徴に係る楽曲一致判定装置において、カット点検出部は、特徴量として、音声信号のパワー又は周波数の単位時間当たりの変化量を算出することを要旨とする。「音声信号のパワー」とは、例えば、フーリエ変換などにより音声信号から振幅スペクトルを算出し、この振幅スペクトルの2乗和を求めたものを意味する。
この特徴によれば、楽曲コンテンツから音声信号のパワー又は周波数の単位時間当たりの変化量を特徴量として算出するので、楽曲コンテンツについて好ましい特徴量を得ることができ、精度の良いカット点を検出することができる。
本発明の第3の特徴は、第1又は第2の特徴に係る楽曲一致判定装置において、一致判定部は、各楽曲コンテンツのカット点の個数に基づいて、複数の楽曲コンテンツが一致するか否かを判定することを要旨とする。
この特徴によれば、一致判定部が、各楽曲コンテンツのカット点の個数に基づいて、複数の楽曲コンテンツが一致するか否かを判定することによって、楽曲の一致判定を容易に実行可能となり、演算量を削減することができる。
本発明の第4の特徴は、第1〜第3のいずれかの特徴に係る楽曲一致判定装置において、一致判定部は、各楽曲コンテンツのカット点間の時間間隔に基づいて、複数の楽曲コンテンツが一致するか否かを判定することを要旨とする。
この特徴によれば、一致判定部が、各楽曲コンテンツのカット点間の時間間隔に基づいて、複数の楽曲コンテンツが一致するか否かを判定することによって、楽曲の一致判定を容易に実行可能となり、演算量を削減することができる。
本発明の第5の特徴は、楽曲コンテンツを取得する第1取得部(第1楽曲コンテンツ取得部21)と、前記第1取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第2取得部(第2楽曲コンテンツ取得部22)と、前記第1取得部によって取得された楽曲コンテンツ、及び前記第2取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部(楽曲コンテンツ記憶部91)とを備える楽曲記録装置(楽曲記録再生装置200)であって、前記第1取得部によって取得された楽曲コンテンツに第1識別情報(FM録音フラグ)を付加し、前記第2取得部によって取得された楽曲コンテンツに第2識別情報(購入フラグ)を付加する識別情報付加部(識別情報付加部86)と、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出するカット点検出部(カット点検出部71)と、前記カット点検出部によって検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する一致検出部(一致判定部81)と、前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されているか否かを判定する識別情報判定部(識別情報判定部87)と、前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第1識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除する楽曲コンテンツ削除部(制御部80)とを備えることを要旨とする。
この特徴によれば、楽曲記録装置は、一致する複数の楽曲コンテンツに第1識別情報及び第2識別情報が付加されていると判定された場合、第1識別情報が付加されている楽曲コンテンツを楽曲コンテンツ記憶部から削除する。すなわち、複数の同一楽曲コンテンツが録音されている場合において、品質(音質)が低い楽曲コンテンツを削除することによって、楽曲コンテンツ記録部(例えば、HDD)の記録容量を有効活用できる。また、特徴量の変化が大きい時点をカット点として、このカット点に基づいて楽曲コンテンツの一致判定を行うので、少ない演算量で楽曲コンテンツの一致判定を行うことができる。
本発明の第6の特徴は、本発明の第5の特徴に係る楽曲記録装置において、前記第1取得部は、放送局(FM放送局101)から無線で送信される放送信号を受信し、受信した前記放送信号から楽曲コンテンツを取得し、前記第2取得部は、楽曲コンテンツを記録する記録媒体(CD/DVD104、メモリカード105)から楽曲コンテンツを取得する、又は楽曲コンテンツを配信する配信サーバ(楽曲コンテンツ配信サーバ102)から通信ネットワーク(通信NW103)を介して楽曲コンテンツを取得することを要旨とする。
この特徴によれば、楽曲記録装置は、同一の楽曲コンテンツであれば、記録媒体や配信サーバから取得した楽曲コンテンツを放送信号から取得した楽曲コンテンツよりも優先して楽曲コンテンツ記録部に残すことができるので、高品質な楽曲コンテンツを楽曲コンテンツ記録部に残すことができる。
本発明の第7の特徴は、本発明の第5の特徴に係る楽曲記録装置において、前記一致する複数の楽曲コンテンツに同一の識別情報が付加されている場合、前記一致する複数の楽曲コンテンツに含まれるノイズを検出するノイズ検出部(品質判定部72)をさらに備え、前記楽曲コンテンツ削除部は、前記ノイズ検出部による検出結果に基づき、前記一致する複数の楽曲コンテンツのうちノイズが最も多い楽曲コンテンツを削除することを要旨とする。
この特徴によれば、楽曲記録装置は、同様の取得経路で取得した楽曲コンテンツについては、ノイズが少ない楽曲コンテンツを楽曲コンテンツ記録部に残すことができるので、高品質な楽曲コンテンツを楽曲コンテンツ記録部に残すことができる。
本発明の第8の特徴は、本発明の第5〜7のいずれか1つの特徴に係る楽曲記録装置において、前記カット点検出部は、前記特徴量として、音声信号のパワー又は周波数の単位時間当たりの変化量を算出することを要旨とする。
この特徴によれば、楽曲コンテンツから音声信号のパワー又は周波数の単位時間当たりの変化量を特徴量として算出するので、楽曲コンテンツについて好ましい特徴量を得ることができ、精度の良いカット点を検出することができる。
本発明の第9の特徴は、本発明の第5〜8のいずれか1つの特徴に係る楽曲記録装置において、前記一致検出部は、前記楽曲コンテンツ記憶部に記憶された楽曲コンテンツのカット点の個数に基づいて、前記一致する複数の楽曲コンテンツを検出することを要旨とする。
この特徴によれば、一致検出部が、各楽曲コンテンツのカット点の個数に基づいて、一致する複数の楽曲コンテンツを検出することによって、少ない演算量で、一致する複数の楽曲コンテンツを容易に検出可能となる。
本発明の第10の特徴は、本発明の第5〜8のいずれか1つの特徴に係る楽曲記録装置において、前記一致検出部は、前記楽曲コンテンツ記憶部に記憶された楽曲コンテンツのカット点間の時間間隔に基づいて、前記一致する複数の楽曲コンテンツを検出することを要旨とする。
この特徴によれば、一致検出部が、各楽曲コンテンツのカット点間の時間間隔に基づいて、一致する複数の楽曲コンテンツを検出することによって、少ない演算量で、一致する複数の楽曲コンテンツを容易に検出可能となる。
本発明の第11の特徴は、複数の楽曲コンテンツのそれぞれから特徴量を算出し、特徴量が閾値を超えた時点をカット点として検出するステップと、複数の楽曲コンテンツのそれぞれについて、カット点に関する情報を記憶するステップと、記憶されたカット点に関する情報に基づき、複数の楽曲コンテンツが一致するか否かを判定するステップとを含むことを要旨とする。
本発明の第12の特徴は、楽曲コンテンツを取得する第1取得部と、前記第1取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第2取得部と、前記第1取得部によって取得された楽曲コンテンツ、及び前記第2取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部とを用いた楽曲記録方法であって、前記第1取得部によって取得された楽曲コンテンツに第1識別情報を付加し、前記第2取得部によって取得された楽曲コンテンツに第2識別情報を付加するステップと、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出するとともに、前記特徴量が閾値を超えた時点をカット点として検出するステップと、前記検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出するステップと、前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されているか否かを判定するステップと、前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第1識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除するステップとを備えることを要旨とする。
本発明の第13の特徴は、コンピュータに、複数の楽曲コンテンツのそれぞれから特徴量を算出し、特徴量が閾値を超えた時点をカット点として検出する手順と、複数の楽曲コンテンツのそれぞれについて、カット点に関する情報を記憶する手順と、記憶されたカット点に関する情報に基づき、複数の楽曲コンテンツが一致するか否かを判定する手順とを実行させることを要旨とする。
本発明の第14の特徴は、楽曲コンテンツを取得する第1取得部と、前記第1取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第2取得部と、前記第1取得部によって取得された楽曲コンテンツ、及び前記第2取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部とを備える楽曲記録装置として機能するコンピュータに、前記第1取得部によって取得された楽曲コンテンツに第1識別情報を付加し、前記第2取得部によって取得された楽曲コンテンツに第2識別情報を付加する手順と、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出するとともに、前記特徴量が閾値を超えた時点をカット点として検出する手順と、前記検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する手順と、前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されているか否かを判定する手順と、前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第1識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除する手順とを実行させることを要旨とする。
本発明によれば、楽曲コンテンツの一致判定に要する処理負荷を削減可能な楽曲一致判定装置、楽曲一致判定方法、及び楽曲一致判定プログラムを提供できる。
また、本発明によれば、楽曲コンテンツの一致判定に要する処理負荷を削減しつつ、複数の一致する楽曲コンテンツの中から品質の低い楽曲コンテンツを削除することによって、楽曲コンテンツ記録部の記録容量を有効活用できる楽曲記録装置、楽曲記録方法、及び楽曲記録プログラムを提供できる。
次に、図面を参照して、本発明の実施形態を説明する。以下の実施形態における図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
[第1実施形態]
(楽曲記録再生装置のハードウェア構成例)
図1は、本実施形態に係る楽曲記録再生装置のハードウェア構成図である。楽曲記録再生装置は、チューナ1と、A/D(Analog to Digital)変換器2と、MP3(MPEG Audio Layer-3)コーデック3と、D/A(Digital to Analog)変換器4と、スピーカ5と、バス6と、DSP(Digital Signal Processor)7と、CPU(Central Processing Unit)8と、HDD(Hard Disk Drive)9と、メモリ10とを備える。
A/D変換器2、MP3コーデック3、D/A変換器4、DSP7、CPU8、HDD9、及びメモリ10は、バス6を介して各種のデータを授受する。
チューナ1は例えばラジオ放送等の放送信号を受信し、放送信号から音声信号を復調する。
A/D変換器2は、チューナ1からの音声信号をデジタル信号データに変換する。
MP3コーデック3は、デジタル音声データを圧縮符号化して符号化音声データを得るエンコーダの機能と、符号化音声データを復号化するデコーダの機能とを有する。
HDD9は、主に、符号化音声データを記憶する。
DSP7は、入力された音声信号を解析する。CPU8は、楽曲記録再生装置全体の制御を実行する。
D/A変換器4は、MP3コーデック3によって復号化されたデジタル音声データをアナログ信号に変換してスピーカ5に供給する。
メモリ10は、DSP7及びCPU8で実行されるプログラムを記憶するとともに、DSP7及びCPU8のプログラム実行中に作業領域として利用される。
(楽曲記録再生装置の機能構成例)
図2は、本実施形態に係る楽曲記録再生装置の機能ブロック図である。図2の楽曲記録再生装置は、図1に示したチューナ1、A/D変換器2、MP3コーデック3、D/A変換器4、及びスピーカ5に加えて、楽曲コンテンツ抽出部70と、カット点検出部71と、品質判定部72と、カット点情報記憶部92と、品質情報記憶部93と、一致判定部81と、セグメント化部82と、位置合わせ処理部83と、セグメント選択部84と、セグメント結合部85と、制御部80と、楽曲コンテンツ記憶部91とを備えている。ここで、カット点検出部71と、カット点情報記憶部92と、一致判定部81と、制御部80とによって、楽曲一致判定装置100が構成されている。
楽曲コンテンツ抽出部70、カット点検出部71、及び品質判定部72のそれぞれの機能は、図1のDSP7により実現される。一致判定部81、セグメント化部82、位置合わせ処理部83、セグメント選択部84、セグメント結合部85、及び制御部80のそれぞれの機能は、図1のCPU8により実現される。カット点情報記憶部92、品質情報記憶部93、及び楽曲コンテンツ記憶部91は、図1のHDD9内に構成される。
楽曲コンテンツ抽出部70は、A/D変換器2からのデジタル音声データから楽曲コンテンツを抽出する。制御部80は、楽曲コンテンツ抽出部70が抽出した楽曲コンテンツをMP3コーデック3に供給する。MP3コーデック3は、楽曲コンテンツを圧縮符号化する。圧縮符号化された楽曲コンテンツは、楽曲コンテンツ記憶部91に記録される。なお、楽曲コンテンツ抽出部70は、後述するカット点を利用して楽曲コンテンツを抽出してもよい。
カット点検出部71は、楽曲コンテンツ抽出部70が抽出した楽曲コンテンツから特徴量を算出し、特徴量が閾値を超えた時点をカット点として検出する。ここで「特徴量」としては、例えば音声信号のパワーの単位時間当たりの変化量が利用できる。なお、音声信号のパワーは、上述したように、フーリエ変換などにより音声信号から振幅スペクトルを算出し、この振幅スペクトルの2乗和を求めることで得ることができる。カット点検出部71の詳細については後述する。
カット点情報記憶部92は、カット点検出部71が検出したカット点に関する情報を記憶する。具体的には、カット点情報記憶部92は、各楽曲コンテンツを識別する楽曲コンテンツ識別子と、各楽曲コンテンツのカット点数とを対応付けたカット点数情報を記憶するとともに、各カット点を識別するカット点識別子と、各カット点の検出時間(楽曲コンテンツの開始時間からの経過時間)とを対応付けたカット点時間情報を記憶する。以下、上記カット点数情報とカット点時間情報とを併せて「カット点情報」と呼ぶ。
このように、新たな楽曲コンテンツが楽曲コンテンツ記憶部91に記録される際には、その新たな楽曲コンテンツのカット点情報も同時にカット点情報記憶部92に記録される。
品質判定部72は、楽曲コンテンツの品質を判定する。楽曲コンテンツの品質判定基準としては、雑音のレベル(振幅)又はトークの尤度の少なくとも一方が利用できる。以下では、楽曲コンテンツの品質判定基準として、雑音のレベル及びトークの尤度の両方を利用する場合について説明する。
品質判定部72は、隣接する2つのカット点により区分される「セグメント」毎に品質を判定しても良く、楽曲コンテンツの所定時間毎の品質を判定しても良い。ここでは品質判定部72が、セグメント毎に楽曲コンテンツの品質を判定する場合について説明する。
楽曲コンテンツの品質判定基準としてトークの尤度を利用する場合、音声認識技術を使用したクラスタリングにより、楽曲コンテンツとトークとを区別することが可能である。具体的には、分類するクラスごとのモデルをガウス混合分布(GMM)を用いてモデル化し、このモデルごとに似ているかどうかを示す尤度関数が用意されており、入力した音声とトークについての尤度関数を用いて算出された確率(尤度)を用いて、トークが検出される。なお、「トーク」とは、楽曲コンテンツに付加されている音声信号であり、例えば、DJによる曲紹介等がこれに該当する。
品質情報記憶部93は、品質判定部72が判定した各セグメントの品質を品質情報として記憶する。具体的には、各セグメントを識別するセグメント識別子と、各セグメントの品質情報(雑音レベル、トークの尤度)とを対応付けて記憶する。
一致判定部81は、カット点情報記憶部92に記憶されたカット点情報に基づき、新たに記録された楽曲コンテンツと過去に記録された楽曲コンテンツとの重複を検出する。一例として、一致判定部81は、上記カット点情報に基づき、各楽曲コンテンツのカット点の数が同じであるか否かを判定する。各楽曲コンテンツのカット点の数が同じであれば、上記カット点時間情報に基づき、各楽曲コンテンツにおいて、1つ目のカット点と2つ目のカット点の時間を計算する。このカット点区間の時間が2つの楽曲コンテンツの間で同じであれば、一致判定部81は、次のカット点間の時間を計算し、最後のカット点まで繰り返す。2つの楽曲コンテンツにおいてすべてのカット点間の時間が同じであれば楽曲コンテンツが重複していると判定される。
一致判定部81によって重複する2つの楽曲コンテンツが検出された場合、制御部80は、重複する2つの楽曲コンテンツを楽曲コンテンツ記憶部91から取得し、MP3コーデック3により各楽曲コンテンツを復号化する。復号化された各楽曲コンテンツは、セグメント化部82に供給される。
セグメント化部82は、上記カット点情報を用いて、各楽曲コンテンツを複数のセグメントに分割する。詳細には、セグメント化部82は、新たに記録された楽曲コンテンツのカット点情報を用いて、新たに記録された楽曲コンテンツをセグメント化するとともに、過去に記録された楽曲コンテンツのカット点情報を用いて、過去に記録された楽曲コンテンツをセグメント化する。セグメント化された各楽曲コンテンツは、位置合わせ処理部83に供給される。
位置合わせ処理部83は、各楽曲コンテンツにおける相対位置を一致させるため、各楽曲コンテンツの最初のカット点の位置を一致させる。相対位置を一致させることで、対応するセグメントを明らかにする。なお、セグメントとは、上述したように、隣り合う2つカット点で挟まれた楽曲コンテンツの一部である。位置合わせ処理後の各楽曲コンテンツは、セグメント選択部84に供給される。
セグメント選択部84は、品質情報記憶部93に記憶された各楽曲コンテンツの品質情報に基づき、各楽曲コンテンツにおいて時間的位置の等しい各セグメント間で、最も品質の高いセグメントを選択する。つまり、セグメント選択部84は、各楽曲コンテンツの各セグメントの雑音レベルやトークの尤度を品質情報記憶部93から読み出し、より低雑音であるセグメント、もしくは、より低いトークの尤度をもつセグメントを選択する。セグメント選択部84によって選択されたセグメントは、セグメント結合部85に供給される。
セグメント結合部85は、セグメント選択部84によって選択されたセグメントを順次結合して1つの楽曲コンテンツを得る。ここで、各セグメントは、カット点を接点にして結合される。セグメント結合部85が作成した楽曲コンテンツは、制御部80に供給される。
制御部80は、セグメント結合部85から供給される楽曲コンテンツを、MP3コーデック3を用いて圧縮符号化し、圧縮符号化後の楽曲コンテンツを楽曲コンテンツ記憶部91に記憶する。その際、制御部80は、結合対象となった元の各楽曲コンテンツを楽曲コンテンツ記憶部91から削除する。
(カット点検出部の構成例)
次に、カット点検出部71の機能ブロック図を図3に示す。カット点検出部71は、パワー算出部711と、微分演算部712と、閾値比較部713と、カット点記録処理部714とを備えている。
パワー算出部711は、図4に示すように、時間領域において、楽曲コンテンツから音声信号のパワーを算出する。
微分演算部712は、音声信号のパワーの変化を検知するため、特徴量として音声信号のパワーを微分する。図5に示すように、時刻T前後の所定の期間W1における平均パワーの差の絶対値が、微分値として算出される。微分された結果、パワーの変化が大きい期間は微分値が大きくなる。
閾値比較部713は、微分演算部712が算出した所定の期間での微分値(特徴量)が所定の閾値以上であれば、その期間は音声信号の変化が大きいことを意味し、図4に示すように、その期間の始点又は終点をカット点として検出する。なお、所定の閾値は、楽曲の種類(ジャンル、曲調等)によって変更しても良い。
カット点記録処理部714は、閾値比較部713によって検出されたカット点に関する情報をカット点情報記憶部92に記録する。
なお、図3の構成に限らず、周波数領域において周波数分析を行い、特定の周波数帯域でのパワーが閾値を越え、ある時間その状態が続いたときに、音声の変化が大きいとして、カット点として検出する構成でも良い。
(カット点情報例)
図6(a)は、カット点情報記憶部92に記憶されるカット点数情報の一例を示す図である。図6(a)の例においては、楽曲コンテンツ識別子“#1”と、カット点数“16”とが対応付けられている。また、楽曲コンテンツ識別子“#2”と、カット点数“23”とが対応付けられている。楽曲コンテンツ識別子“#3”と、カット点数“16”とが対応付けられている。この場合、楽曲コンテンツ識別子“#1”及び楽曲コンテンツ識別子“#3”は、同一の楽曲コンテンツであると考えることができる。
図6(b)は、カット点情報記憶部92に記憶されるカット点時間情報の一例を示す図である。図6(a)の例においては、楽曲コンテンツ識別子“#1”〜“#3”のそれぞれについて、カット点識別子と、各カット点の検出時間(楽曲コンテンツの開始時間からの経過時間)とが対応付けられている。一致判定部81は、上述したように、各楽曲コンテンツにおいて、1つ目のカット点と2つ目のカット点の時間間隔を計算し、このカット点間の時間間隔が2つの楽曲コンテンツの間で同じであれば、次のカット点間の時間間隔を計算し、最後のカット点まで繰り返すことによって、楽曲の一致判定を行う。
(セグメント選択部及びセグメント結合部の動作例)
次に、図7の波形図を用いて、セグメント選択部84及びセグメント結合部85の動作を説明する。
図7(a)及び(b)は、異なる時刻に記録された、同一の楽曲コンテンツの音声波形を示している。図7(a)及び(b)に示す音声波形においては、カット点#1〜#3の合計3つのカット点が検出されている。
図7(a)のカット点#1及び#2で区分されるセグメントは、雑音及びトークの少ないセグメントである。図7(a)のカット点#2及び#3で区分されるセグメントは、雑音が多いセグメントである。
また、図7(b)のカット点#1及び#2で区分されるセグメントは、トークの多いセグメントである。図7(b)のカット点#2及び#3で区分されるセグメントは、雑音の少ないセグメントである。
セグメント選択部84は、図7(a)のカット点#1及び#2で区分されるセグメントと、図7(b)のカット点#1及び#2で区分されるセグメントとを比較評価し、図7(a)のカット点#1及び#2で区分されるセグメントを選択する。
セグメント選択部84は、図7(a)のカット点#2及び#3で区分されるセグメントと、図7(b)のカット点#2及び#3で区分されるセグメントとを比較評価し、図7(b)のカット点#2及び#3で区分されるセグメントを選択する。
この結果、セグメント結合部85は、図7(c)に示すように、図7(a)のカット点#1及び#2で区分されるセグメントと、図7(b)のカット点#2及び#3で区分されるセグメントとを、カット点#2を接点として結合する。このようにして、雑音及びトークの少ない楽曲コンテンツが作成される。
(楽曲記録処理フロー例)
次に、図8に示すフローチャートを参照して、本実施形態に係る楽曲記録処理フローの一例について説明する。
図8のステップS101において、図2に示すチューナ1は、例えばラジオ放送等の放送信号を受信し、放送信号から音声信号を復調する。
ステップS102において、A/D変換器2は、ステップS101で得られた音声信号をデジタル信号データに変換する。
ステップS103において、楽曲コンテンツ抽出部70は、ステップS102で得られたデジタル音声データから、楽曲コンテンツを抽出する。
ステップS104において、MP3コーデック3は、ステップS103で得られた楽曲コンテンツを圧縮符号化する。
ステップS105において、制御部80は、ステップS104で圧縮符号化された楽曲コンテンツを楽曲コンテンツ記憶部91に記憶する。
一方、ステップS106において、図3に示すパワー算出部711は、ステップS103で得られた楽曲コンテンツから音声信号のパワーを算出する。更に、微分演算部712は、パワー算出部711が算出した音声信号のパワーを微分する。
ステップS107において、閾値比較部713は、ステップS106で算出された微分値がある閾値以上であれば、その時刻をカット点として検出する。閾値比較部713が検出したカット点の情報は、図1のカット点情報記憶部92に記録される。
ステップS108において、図1に示す品質判定部72は、ステップS103で抽出された楽曲コンテンツの雑音レベルをセグメント単位で判定する。
ステップS109において、品質判定部72は、ステップS103で抽出された楽曲コンテンツのトークの尤度をセグメント単位で判定する。ステップS108及びステップS109で判定された雑音レベル及びトークの尤度の情報は、品質情報記憶部93に記録される。
(楽曲再生処理フロー例)
次に、図9に示すフローチャートを参照して、本実施形態に係る楽曲再生処理フローの一例について説明する。
図8のステップS201において、制御部80は、楽曲コンテンツ記憶部91から、圧縮符号化された楽曲コンテンツ(符号化音声データ)を読み出す。
ステップS202において、MP3コーデック3は、ステップS201で読み出された符号化音声データを復号化してデジタル音声データを得る。
ステップS203において、D/A変換器4は、ステップS202で得られたデジタル音声データをアナログ信号に変換して音声信号を得る。
ステップS204において、スピーカ5は、ステップS203で得られた音声信号を出力する。
(楽曲結合処理フロー例)
次に、図10に示すフローチャートを参照して、本実施形態に係る楽曲結合処理フローの一例について説明する。
図10のステップS301において、図2に示す一致判定部81は、カット点情報記憶部92に記憶されたカット点情報に基づき、カット点情報の一致判定を実行し、新たに記録された楽曲コンテンツと過去に記録された楽曲コンテンツとの重複を検出する。なお、ステップS301の詳細については後述する。
ステップS302において、位置合わせ処理部83は、楽曲コンテンツの相対位置を一致させるため、各楽曲コンテンツの最初のカット点の位置を一致させる。ステップS302の詳細については後述する。
ステップS303において、セグメント選択部84は、各楽曲コンテンツにて時間的位置の等しい各セグメントを、MP3コーデック3及び制御部80を介して楽曲コンテンツ記憶部91から取得する。
ステップS304において、セグメント選択部84は、各楽曲コンテンツにて時間的位置の等しい各セグメントについての品質情報(雑音レベル、トークの尤度)を、品質情報記憶部93から取得する。セグメント選択部84は、より低雑音であるセグメント、もしくは、より低いトークの尤度を有するセグメントを選択する。
ステップS305において、セグメント結合部85は、ステップS304で選択されたセグメントを、カット点を接点として結合する。
ステップS306において、制御部80は、各楽曲コンテンツの各セグメントのうち、最後のセグメントまで楽曲一致判定処理が完了したか否かを判定する。最後のセグメントまで楽曲一致判定処理が完了したと判定された場合、楽曲一致判定処理が完了する。最後のセグメントまで楽曲一致判定処理が完了していないと判定された場合、ステップS303に処理が戻る。
(一致判定処理フロー例)
次に、図11に示すフローチャートを参照して、一致判定処理、すなわち図10のステップS301の詳細について説明する。ただし、一致判定対象の一方の(1曲目の)楽曲コンテンツのカット点の位置をT0〜TNとし、他方の(2曲目の)楽曲コンテンツのカット点の位置をS0〜SNとする(N;1以上の整数)。
図11のステップS401において、一致判定部81は、変数“n”を0に初期化する。
ステップS402において、一致判定部81は、各楽曲コンテンツの最後のカット点まで一致判定処理が完了したか否かを判定するため、変数“n”が“N+1”よりも小さいか否か判定する。変数“n”が“N+1”よりも小さい場合、ステップS403に移行する。変数“n”が“N+1”以上である場合、ステップS405に移行する。
ステップS403において、一致判定部81は、隣接する2つのカット点により区分されるセグメントの期間が、各楽曲コンテンツ間で等しいか否かを判定するため、|T(n+1)−Tn|と、|S(n+1)−Sn|とが、等しいか否かを判定する。|T(n+1)−Tn|と、|S(n+1)−Sn|とが等しいと判定された場合、ステップS404に移行する。|T(n+1)−Tn|と、|S(n+1)−Sn|とが等しくないと判定された場合、ステップS406に移行する。
ステップS404において、一致判定部81は、変数“n”をインクリメントし、その後ステップS402に処理が戻る。
一方、ステップS405において、一致判定部81は、各楽曲コンテンツの各セグメントの期間がすべて一致しているため、各楽曲コンテンツが一致すると判定する。
これに対してステップS406において、一致判定部81は、各楽曲コンテンツの各セグメントの期間が一致しないため、各楽曲コンテンツが一致しないと判定する。
(位置合わせ処理フロー例)
次に、図12に示すフローチャートを参照して、楽曲位置合わせ処理、すなわち図10のステップS302の詳細について説明する。ただし、一致判定対象の一方の(1曲目の)楽曲コンテンツのカット点の位置をT0〜TNとし、他方の(2曲目の)楽曲コンテンツのカット点の位置をS0〜SNとする(N;1以上の整数)。
図12のステップS501において、位置合わせ処理部83は、2つの楽曲コンテンツの最初のカット点S0,T0の時間的位置を一致させる。
ステップS502において、位置合わせ処理部83は、変数“n”を0に初期化する。
ステップS503において、位置合わせ処理部83は、各楽曲コンテンツの最後のカット点まで位置合わせ処理が完了したか否かを判定するため、変数“n”が“N+1”よりも小さいか否か判定する。変数“n”が“N+1”よりも小さい場合、ステップS504に移行する。変数“n”が“N+1”以上である場合、ステップS506に移行する。
ステップS504において、位置合わせ処理部83は、隣接する2つのカット点により区分されるセグメントの期間が、各楽曲コンテンツ間で等しいか否かを判定するため、|T(n+1)−Tn|と、|S(n+1)−Sn|とが、等しいか否かを判定する。|T(n+1)−Tn|と、|S(n+1)−Sn|とが等しいと判定された場合、ステップS505に移行する。|T(n+1)−Tn|と、|S(n+1)−Sn|とが等しくないと判定された場合、位置合わせ処理が終了する。
ステップS505において、位置合わせ処理部83は、変数“n”をインクリメントし、その後ステップS503に処理が戻る。
ステップS506において、位置合わせ処理部83は、2つの楽曲コンテンツの最初のカット点S0,T0の時間的位置の差を記録する。
(作用及び効果)
以上詳細に説明したように、本実施形態によれば、楽曲で特徴量の変化が大きい時点をカット点として記憶し、このカット点に関する情報によって楽曲の一致判定を行うので、少ない演算量で楽曲の一致判定を行うことができる。
また、本実施形態によれば、カット点検出部71が、楽曲コンテンツから音声信号のパワー又は周波数の単位時間当たりの変化量を特徴量として算出するので、楽曲コンテンツについて好ましい特徴量を得ることができ、精度の良いカット点を検出することができる。
更に、本実施形態によれば、一致判定部81が、各楽曲コンテンツのカット点の個数に基づいて、複数の楽曲コンテンツが一致するか否かを判定することによって、楽曲の一致判定を容易に実行可能となり、演算量を削減することができる。
本実施形態によれば、一致判定部81が、各楽曲コンテンツのカット点間の時間間隔に基づいて、複数の楽曲コンテンツが一致するか否かを判定することによって、楽曲の一致判定を容易に実行可能となり、演算量を削減することができる。
(第1変形例)
上述した実施形態に係る一致判定処理においては、隣接する2つのカット点により区分されるセグメントの期間が、各楽曲コンテンツ間で等しいか否かを判定する場合について説明した。
しかし、カット点の検出位置は、各楽曲コンテンツの状態によって異なる可能性があるため、若干の位置ずれを許容しつつ、一致判定を行うことが好ましい。
そこで、本変形例では、図13に示すフローチャートを参照して、若干の位置ずれを許容した一致判定処理について説明する。図13において、一致判定対象の一方の(1曲目の)楽曲コンテンツのカット点の位置をT0〜TNとし、他方の(2曲目の)楽曲コンテンツのカット点の位置をS0〜SNとする(N;1以上の整数)。ただし、図11と同様の処理については、重複する説明を省略する。
図13のステップS601において、一致判定部81は、変数“n”を0に初期化する。
ステップS602において、一致判定部81は、各楽曲コンテンツの最後のカット点まで一致判定処理が完了したか否かを判定するため、変数“n”が“N+1”よりも小さいか否か判定する。変数“n”が“N+1”よりも小さい場合、ステップS603に移行する。変数“n”が“N+1”以上である場合、ステップS605に移行する。
ステップS603において、一致判定部81は、各楽曲コンテンツにおける時間的位置の等しい各セグメントの期間の差分が、所定の閾値σよりも小さいか否かを判定する。各楽曲コンテンツにおける時間的位置の等しい各セグメントの期間の差分が、所定の閾値σよりも小さいと判定された場合、ステップS604に移行する。一方、各楽曲コンテンツにおける時間的位置の等しい各セグメントの期間の差分が、所定の閾値σ以上であると判定された場合、ステップS606に移行する。
ステップS604において、一致判定部81は、変数“n”をインクリメントし、その後ステップS602に処理が戻る。
一方、ステップS605において、一致判定部81は、各楽曲コンテンツの各セグメントの期間がすべて一致又は略一致しているため、各楽曲コンテンツが一致すると判定する。
これに対してステップS606において、一致判定部81は、各楽曲コンテンツの各セグメントの期間が一致又は略一致しないため、各楽曲コンテンツが一致しないと判定する。
このように、本変形例によれば、カット点の検出位置における若干の位置ずれを許容しつつ、一致判定を行うことができる。
(第2変形例)
上述した実施形態においては、各楽曲コンテンツのカット点数が等しい場合に図11に示す一致判定処理を実行する場合について説明した。
しかし、同一楽曲であっても、一方の楽曲コンテンツの先頭部分が欠けていること等により、カット点数が異なる可能性がある。具体的には、テレビ放送やラジオ放送から抽出して得られた楽曲コンテンツの場合、コンテンツの先頭部分が欠けていることがある。
そこで、本変形例では、図14に示すフローチャートを参照して、カット点数が異なっている場合であっても、同一楽曲を検知可能な一致判定処理について説明する。図14において、一致判定対象の一方の(1曲目の)楽曲コンテンツのカット点の位置をT0〜TNとし、他方の(2曲目の)楽曲コンテンツのカット点の位置をS0〜SMとする(N,M;1以上の整数)。ただし、図11及び図13と同様の処理については、重複する説明を省略する。
図14のステップS701において、一致判定部81は、変数“n”を0に初期化する。変数“n”は、図15に示すように、1曲目の楽曲コンテンツ#1のカット点を先頭から順次指定するためのものである。
ステップS702において、一致判定部81は、変数“m”を0に初期化する。変数“m”は、図15に示すように、2曲目の楽曲コンテンツ#2のカット点を先頭から順次指定するためのものである。
ステップS703において、一致判定部81は、各セグメントの期間の差分が、所定の閾値σよりも小さいか否かを判定する。図15の例では、楽曲コンテンツ#1及び#2のセグメント1の期間の差分が、所定の閾値σよりも小さいか判定される。各セグメントの期間の差分が、所定の閾値σよりも小さいと判定された場合、ステップS708に移行する。一方、各セグメントの期間の差分が、所定の閾値σ以上であると判定された場合、ステップS704に移行する。
ステップS704において、一致判定部81は、変数“m”をインクリメントする。
ステップS704において、一致判定部81は、変数“m”が、“M”よりも大きいか否かを判定する。変数“m”が“M”よりも大きいと判定された場合、ステップS706に移行する。一方、変数“m”が“M”以下であると判定された場合、ステップS703に処理が戻る。
ステップS706において、一致判定部81は、変数“n”をインクリメントする。
ステップS707において、一致判定部81は、変数“n”が、“N”よりも大きいか否かを判定する。変数“n”が“N”よりも大きいと判定された場合、ステップS711に移行する。一方、変数“n”が“N”以下であると判定された場合、ステップS702に処理が戻る。
この結果、変数“m”が0に初期化されることによって、図4の例では、楽曲コンテンツ#1のカット点#1と、楽曲コンテンツ#2のカット点#0とが変数“n”及び“m”によってそれぞれ指定されることになる。よって、ステップS703にて、楽曲コンテンツ#1のセグメント2と、楽曲コンテンツ#2のセグメント1とが比較され、互いに一致又は略一致と判定される。
ステップS708においては、一致判定部81は、変数“n”又は“m”が、“N”又は“M”のいずれか小さい方よりも小さいか否かを判定する。変数“n”又は“m”が、“N”又は“M”のいずれか小さい方よりも小さいと判定された場合、ステップS709に移行する。一方、変数“n”又は“m”が、“N”又は“M”のいずれか小さい方以上であると判定された場合、ステップS712に移行する。
ステップS709において、一致判定部81は、変数“n”及び“m”をインクリメントする。
ステップS710において、一致判定部81は、各セグメントの期間の差分が、所定の閾値σよりも小さいか否かを判定する。図15の例では、楽曲コンテンツ#1のセグメント3の期間と、楽曲コンテンツ#2のセグメント2の期間との差分が、所定の閾値σよりも小さいか判定される。各セグメントの期間の差分が、所定の閾値σよりも小さいと判定された場合、ステップS708に処理が戻る。一方、各セグメントの期間の差分が、所定の閾値σ以上であると判定された場合、ステップS711に移行する。
ステップS711においては、一致判定部81は、各楽曲コンテンツの各セグメントの期間が一致又は略一致しないため、各楽曲コンテンツが一致しないと判定する。
一方、ステップS712において、一致判定部81は、各楽曲コンテンツの各セグメントの期間が一致又は略一致しているため、各楽曲コンテンツが一致すると判定する。
このように、本変形例によれば、カット点数が異なっている場合であっても、セグメントの特徴を利用することで、同一楽曲を検知することができる。
なお、本変形例に係る一致判定処理では、カット点数が異なる2つの楽曲コンテンツのうち、カット点数が多い方の楽曲コンテンツのカット点が、変数“n”で指定されるようにしておくことが必要である。
[第2実施形態]
次に、本発明の第2実施形態について説明する。なお、本実施形態では、上述した第1実施形態と異なる点を主に説明し、重複する説明を省略する。
(楽曲記録再生装置の概略構成)
図16は、本実施形態に係る楽曲記録再生装置200の概略構成を示す図である。図16に示すように、楽曲記録再生装置200は、楽曲コンテンツを複数の取得経路によって取得可能な構成を有している。
具体的には、楽曲記録再生装置200は、FM放送局(FMラジオ放送局)101によって無線で送信されるFM放送信号を受信し、受信したFM放送信号から楽曲コンテンツを取得する。
また、楽曲記録再生装置200は、楽曲コンテンツを記録する記録媒体、具体的には、CD/DVD104又はメモリカード105から楽曲コンテンツを取得する。
さらに、楽曲記録再生装置200は、楽曲コンテンツを配信する楽曲コンテンツ配信サーバ102から通信NW103を介して楽曲コンテンツを取得する。
楽曲記録再生装置200は、FM放送信号から取得される楽曲コンテンツを自動録音することに加え、楽曲コンテンツ配信サーバ102からダウンロードした楽曲コンテンツを記録したり、記録媒体(CD/DVD104又はメモリカード105)から読み出した楽曲コンテンツを記録したりする。この結果、楽曲記録再生装置200には、複数の同一楽曲コンテンツが記録されることがあり、HDD9の記録容量が無駄に消費されることになる。
そこで、楽曲記録再生装置200は、複数の同一楽曲コンテンツが録音された場合に、当該複数の同一楽曲コンテンツのうち不要な楽曲コンテンツ、すなわち品質(音質)が低い楽曲コンテンツを削除する。
ここで、FM放送信号から取得される楽曲コンテンツには、ノイズが多く含まれている。このようなノイズには、トーク(曲紹介など)も含まれる。つまり、FM放送信号から取得される楽曲コンテンツは、品質(音質)が低い。一方、記録媒体(CD/DVD104又はメモリカード105)、楽曲コンテンツ配信サーバ102から取得される楽曲コンテンツは、ノイズも少なく高品質である。
したがって、楽曲記録再生装置200は、例えば、CD/DVD104から録音された楽曲コンテンツと、FM放送信号から録音された楽曲コンテンツとが同一である場合には、FM放送信号から録音された楽曲コンテンツを削除する。
(楽曲記録再生装置のハードウェア構成)
図17は、本実施形態に係る楽曲記録再生装置200のハードウェア構成例を示すブロック図である。
図17に示すように、楽曲記録再生装置200は、図1の構成に加え、通信インターフェース(以下、「通信I/F」)11、CD/DVDドライブ12、メモリカードインターフェース(以下、「メモリカードI/F」)13を備えている。
通信I/F11は、通信NW103とのインターフェースとして機能し、通信NW103を介して楽曲コンテンツ配信サーバ102と通信する。そして、通信I/F11は、楽曲コンテンツ配信サーバ102から通信NW103を介して楽曲コンテンツをダウンロードする。
CD/DVDドライブ12は、CD/DVDを回転駆動するとともに、CD/DVDに書き込まれている楽曲コンテンツを光学的に読み取る。メモリカードI/F13は、メモリカード105にアクセスし、メモリカード105に格納されている楽曲コンテンツを読み出す。
(楽曲記録再生装置の機能ブロック構成)
図18は、楽曲記録再生装置200の記録系統の機能構成例を示す機能ブロック図である。
図18に示すように、楽曲記録再生装置200は、第1楽曲コンテンツ取得部21、第2楽曲コンテンツ取得部22、識別情報付加部86、楽曲コンテンツ記憶部91、カット点検出部71、カット点情報記憶部92、一致判定部81、識別情報判定部87、品質判定部72、制御部80、及びMP3コーデック3を備える。
第1楽曲コンテンツ取得部21は、FM放送局101から無線で送信されるFM放送信号を受信し、受信したFM放送信号から楽曲コンテンツを取得する。第1楽曲コンテンツ取得部21を構成するチューナ1、A/D変換器2及び楽曲コンテンツ抽出部70は、上述した第1実施形態と同様に構成される。
第2楽曲コンテンツ取得部22は、上述した通信I/F11、CD/DVDドライブ12及びメモリカードI/F13によって構成される。
識別情報付加部86は、識別情報付加部86は、第1楽曲コンテンツ取得部21によって取得された楽曲コンテンツにFM録音フラグを付加し、第2楽曲コンテンツ取得部22によって取得された楽曲コンテンツに購入フラグを付加する。
ここで、FM録音フラグは、楽曲コンテンツがFM録音(自動録音)されたものであることを示すフラグである。また、購入フラグは、楽曲コンテンツが購入されたもの、すなわち、記録媒体(CD/DVD104、メモリカード105)又は楽曲コンテンツ配信サーバ102から取得されたものであることを示すフラグである。
楽曲コンテンツ記憶部91、カット点検出部71、カット点情報記憶部92、一致判定部81は、上述した第1実施形態と同様に構成される。ただし、本実施形態では、一致判定部81は、カット点情報に基づいて、楽曲コンテンツ記憶部91に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する。
識別情報判定部87は、一致する複数の楽曲コンテンツにFM録音フラグ及び購入フラグが付加されているか否かを判定する。
制御部80は、一致する複数の楽曲コンテンツにFM録音フラグ及び購入フラグが付加されていると判定された場合、一致する複数の楽曲コンテンツのうちFM録音フラグが付加されている楽曲コンテンツを、楽曲コンテンツ記憶部91から削除する。
また、品質判定部72は、一致する複数の楽曲コンテンツに同一の識別情報が付加されている場合、一致する複数の楽曲コンテンツに含まれるノイズを検出する。
なお、上述した第1実施形態では、品質判定部72は、品質情報をセグメント毎に生成していたが、本実施形態では、品質判定部72は、楽曲コンテンツ全体に対する品質情報を生成すればよい。
制御部80は、ノイズ検出部による検出結果に基づき、一致する複数の楽曲コンテンツのうちノイズが最も多い楽曲コンテンツを楽曲コンテンツ記憶部91から削除する。
(楽曲コンテンツ削除処理の概要)
図19は、楽曲コンテンツ記憶部91に記録される楽曲コンテンツの一例を示す図である。以下においては、楽曲コンテンツ記憶部91に記録される楽曲コンテンツは、FMラジオ放送から自動で抽出された楽曲コンテンツ、又はCD/DVD104から取得された楽曲コンテンツであるものとする。
図19の例では、楽曲コンテンツ記憶部91において、FMラジオ放送から自動で抽出された楽曲コンテンツA,B,Cと、CD/DVD104から取得された楽曲コンテンツA,D,Eとが記録されている。
FMラジオ放送から自動で抽出された楽曲コンテンツA,B,Cには、FM録音フラグF1がヘッダに付加されている。また、CD/DVD104から取得された楽曲コンテンツA,D,Eには、購入フラグF2がヘッダに付加されている。
この場合、一致判定部81は、FMラジオ放送から自動で抽出された楽曲コンテンツAと、CD/DVD104から取得された楽曲コンテンツAとの重複を検出する。そして、識別情報判定部87は、重複する楽曲コンテンツAに対してFM録音フラグF1及び購入フラグF2が付加されていると判定する。
上述したように、FMラジオ放送から自動で抽出された楽曲コンテンツAよりも、CD/DVD104から取得された楽曲コンテンツAが高品質である。したがって、図11の例では、制御部80は、FMラジオ放送から自動で抽出された楽曲コンテンツAを、楽曲コンテンツ記憶部91から削除する。
(楽曲コンテンツ削除処理フロー例)
図20は、楽曲コンテンツ削除処理の処理フローを示すフローチャートである。
ステップS801において、一致判定部81は、カット点情報に基づき、楽曲コンテンツ記憶部91に記録されている複数の楽曲コンテンツが一致するか否かを判定する。ここでは、一致判定部81は、互いに一致する2つの楽曲コンテンツを検出する。
ステップS802において、識別情報判定部87は、一致判定部81によって検出された各楽曲コンテンツに付加されている識別情報(フラグ)が同一であるか否かを判定する。
一致判定部81によって検出された各楽曲コンテンツに付加されている識別情報(フラグ)が異なる場合、処理がステップS803に進む。
ステップS803において、制御部80は、一致判定部81によって検出された各楽曲コンテンツのうち、FM録音フラグが付加されている楽曲コンテンツを楽曲コンテンツ記憶部91から削除する。
一方、一致判定部81によって検出された各楽曲コンテンツに付加されている識別情報が同一である場合、処理がステップS804に進む。
ステップS804において、品質判定部72は、一致判定部81によって検出された各楽曲コンテンツに含まれるノイズを検出する。
ステップS805において、制御部80は、一致する2つの楽曲コンテンツのうち、品質が低い方、すなわちノイズが多い方の楽曲コンテンツを楽曲コンテンツ記憶部91から削除する。
(作用・効果)
本実施形態によれば、楽曲記録再生装置200は、複数の同一楽曲コンテンツが録音されている場合において、記録媒体(CD/DVD104、メモリカード105)や楽曲コンテンツ配信サーバ102から取得した楽曲コンテンツを、FM放送信号から取得した楽曲コンテンツよりも優先して楽曲コンテンツ記録部91(HDD9)に残すことができる。
すなわち、品質(音質)が低い楽曲コンテンツを削除することによって、高品質な楽曲コンテンツを楽曲コンテンツ記録部91(HDD9)に残すことができる。このため、楽曲コンテンツ記憶部91(HDD9)の記録容量を有効活用できる。
本実施形態によれば、品質判定部72は、一致する複数の楽曲コンテンツに同一のフラグが付加されている場合、一致する複数の楽曲コンテンツに含まれるノイズを検出する。制御部80は、ノイズの検出結果に基づき、一致する複数の楽曲コンテンツのうちノイズが多い楽曲コンテンツを削除する。
したがって、楽曲記録再生装置200は、同様の取得経路で取得した楽曲コンテンツについては、ノイズが少ない楽曲コンテンツを楽曲コンテンツ記憶部91(HDD9)に残すことができるので、高品質な楽曲コンテンツを楽曲コンテンツ記録部91(HDD9)に残すことができる。
[その他の実施形態]
上記のように、本発明は実施形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施形態、実施例及び運用技術が明らかとなる。
上述した第1実施形態及び第2実施形態においては、楽曲コンテンツの特徴量として、音声信号のパワーの単位時間当たりの変化量を使用する場合について説明した。その他の実施形態として、図21に示すように、楽曲コンテンツの特徴量として、音声信号の周波数の単位時間当たりの変化量を使用しても良い。
また、上述した第1実施形態においては、ラジオ放送を受信して、楽曲コンテンツを記録する楽曲記録再生装置の例について説明した。しかしながら、インターネット網等の通信網を利用した放送を受信しても良く、CD等から読み出された楽曲コンテンツを記録・再生しても良い。
更に、上述した第1実施形態においては、2つの楽曲コンテンツを結合する一例について説明した。しかしながら、3つ以上の楽曲コンテンツを結合する場合に適用可能である。3つ以上の楽曲コンテンツを結合する場合、2つの楽曲コンテンツを結合する場合よりも高品質な楽曲コンテンツを作成可能となる。
上述した第2実施形態では、カット点検出部71は、楽曲コンテンツ記憶部91に記憶された各楽曲コンテンツからカット点を検出していた。しかしながら、第1実施形態において述べたように、FM放送信号から抽出された楽曲コンテンツについては、楽曲コンテンツ抽出時にカット点が検出され、検出されたカット点に関する情報がカット点情報記憶部92に既に記憶されている。したがって、カット点検出部71は、FM放送信号から抽出された楽曲コンテンツ、すなわちFM録音フラグが付加されている楽曲コンテンツについては、カット点の検出を省略し、カット点情報記憶部92に記憶されているカット点に関する情報を取得してもよい。 また、楽曲コンテンツ抽出部70は、カット点を用いて楽曲コンテンツを抽出する場合、カット点検出部71と同様に特徴量を閾値と比較することによってカット点を検出する。ここで、楽曲コンテンツ抽出部70においては、楽曲コンテンツを抽出するための最小限のカット点が検出できればよい。このため、楽曲コンテンツ抽出部70において用いられる閾値は、カット点検出部71において用いられる閾値よりも大きくてもよい。
上述した実施形態においては、楽曲コンテンツ等を記憶するためにHDDを用いる一例を説明したが、HDDに限らず、フラッシュメモリ等の半導体記憶装置を用いてもかまわない。
また、楽曲コンテンツの圧縮符号化方式としてMP3を利用する場合について説明したが、他の圧縮符号化方式を採用してもかまわない。
更に、上述した第1実施形態及び第2実施形態で説明した各処理フローをコンピュータプログラムとして実装し、パーソナルコンピュータ(PC)等に実行させることが可能である。
このように本発明は、ここでは記載していない様々な実施形態等を包含するということを理解すべきである。したがって、本発明はこの開示から妥当な特許請求の範囲の発明特定事項によってのみ限定されるものである。
本発明の第1実施形態に係る楽曲記録再生装置のハードウェア構成例を示すブロック図である。 本発明の第1実施形態に係る楽曲一致判定装置の機能構成例を示す機能ブロック図である。 本発明の第1実施形態に係るカット点検出部の機能構成例を示す機能ブロック図である。 本発明の第1実施形態に係るパワー算出部の動作を説明するための波形図である。 本発明の第1実施形態に係る微分演算部の動作を説明するための波形図である。 図6(a)は本発明の第1実施形態に係るカット点数情報の一例を示す図であり、図6(b)は本発明の第1実施形態に係るカット点時間情報の一例を示す図である。 本発明の第1実施形態に係るセグメント選択部及びセグメント結合部の動作を説明するための波形図である。 本発明の第1実施形態に係る楽曲記録処理フロー例を示すフローチャートである。 本発明の第1実施形態に係る楽曲再生処理フロー例を示すフローチャートである。 本発明の第1実施形態に係る楽曲一致判定処理フロー例を示すフローチャートである。 本発明の第1実施形態に係る楽曲一致判定処理における一致判定処理フロー例を示すフローチャートである。 本発明の第1実施形態に係る楽曲一致判定処理における位置合わせ処理フロー例を示すフローチャートである。 本発明の第1実施形態の第1変形例に係る楽曲一致判定処理フロー例を示すフローチャートである。 本発明の第1実施形態の第2変形例に係る楽曲一致判定処理フロー例を示すフローチャートである。 本発明の第1実施形態の第2変形例に係る楽曲一致判定処理を説明するためのタイムチャートである。 本発明の第2実施形態に係る楽曲記録再生装置の概略構成を示す図である。 本発明の第2実施形態に係る楽曲記録再生装置のハードウェア構成例を示すブロック図である。 本発明の第2実施形態に係る楽曲記録再生装置の記録系統の機能構成例を示す機能ブロック図である。 本発明の第2実施形態に係る楽曲コンテンツ記憶部に記録される楽曲コンテンツの一例を示す図である。 本発明の第2実施形態に係る楽曲記録再生装置によって実行される楽曲コンテンツ削除処理の処理フローを示すフローチャートである。 その他の実施形態に係るカット点検出動作を説明するための波形図である。
符号の説明
1…チューナ、2…A/D変換器、3…MP3コーデック、4…D/A変換器、5…スピーカ、6…バス、7…DSP、8…CPU、9…HDD、10…メモリ、12…CD/DVDドライブ、21…第1楽曲コンテンツ取得部、22…第2楽曲コンテンツ取得部、70…楽曲コンテンツ抽出部、71…カット点検出部、72…品質判定部、80…制御部、81…一致判定部、82…セグメント化部、83…位置合わせ処理部、84…セグメント選択部、85…セグメント結合部、86…識別情報付加部、87…識別情報判定部、91…楽曲コンテンツ記憶部、92…カット点情報記憶部、93…品質情報記憶部、100…楽曲一致判定装置、101…FM放送局、102…楽曲コンテンツ配信サーバ、103…通信NW、104…CD/DVD、105…メモリカード、200…楽曲記録再生装置、711…パワー算出部、712…微分演算部、713…閾値比較部、714…カット点記録処理部

Claims (14)

  1. 複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出するカット点検出部と、
    前記複数の楽曲コンテンツのそれぞれについて、前記カット点に関する情報を記憶するカット点情報記憶部と、
    前記記憶されたカット点に関する情報に基づき、前記複数の楽曲コンテンツが一致するか否かを判定する一致判定部と
    を備え
    前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
    前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
    前記一方の楽曲コンテンツのカット点の位置をT0〜TNとし、前記他方の楽曲コンテンツのカット点の位置をS0〜SMとし、
    前記TNのN及び前記SMのMは、1以上の整数であり、
    前記一致判定部は、変数nを0に初期化する第1ステップを実行し、
    前記第1ステップの後に、前記一致判定部は、変数mを0に初期化する第2ステップを実行し、
    前記第2ステップの後に、前記一致判定部は、||T(n+1)−Tn|−|S(m+1)−Sm||が所定の閾値であるσよりも小さいか判定する第3ステップを実行し、
    前記第3ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合、前記一致判定部は、前記変数mをインクリメントする第4ステップを実行し、
    前記第4ステップの後に、前記一致判定部は、前記変数mが前記Mよりも大きいか否かを判定する第5ステップを実行し、
    前記第5ステップにおいて、前記変数mが前記M以下であると判定した場合、前記一致判定部は、前記第3ステップを実行し、
    前記第5ステップにおいて、前記変数mが前記Mよりも大きいと判定した場合、前記一致判定部は、前記変数nをインクリメントする第6ステップを実行し、
    前記第6ステップの後に、前記一致判定部は、前記変数nが前記Nよりも大きいか否かを判定する第7ステップを実行し、
    前記第7ステップにおいて、前記変数nが前記変数N以下であると判定した場合、前記一致判定部は、前記第2ステップを実行し、
    前記第3ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合、前記一致判定部は、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいか否かを判定する第8ステップを実行し、
    前記第8ステップにおいて、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいと判定した場合、前記一致判定部は、前記変数n及び前記変数mをインクリメントする第9ステップを実行し、
    前記第9ステップの後に、前記一致判定部は、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいか判定する第10ステップを実行し、
    前記第10ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合、前記一致判定部は、前記第8ステップを実行し、
    前記第10ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合、前記一致判定部は、前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第11ステップを実行し、
    前記第7ステップにおいて、前記変数nが前記Nよりも大きいと判定した場合、前記一致判定部は、前記第11ステップを実行し、
    前記第8ステップにおいて、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方以上であると判定した場合、前記一致判定部は、前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第12ステップを実行することを特徴とする楽曲一致判定装置。
  2. 前記カット点検出部は、前記特徴量として、音声信号のパワー又は周波数の単位時間当たりの変化量を算出することを特徴とする請求項1に記載の楽曲一致判定装置。
  3. 前記一致判定部は、各楽曲コンテンツのカット点の個数に基づいて、前記複数の楽曲コンテンツが一致するか否かを判定することを特徴とする請求項1又は2に記載の楽曲一致判定装置。
  4. 前記一致判定部は、各楽曲コンテンツのカット点間の時間間隔に基づいて、前記複数の楽曲コンテンツが一致するか否かを判定することを特徴とする請求項1〜3のいずれか1項に記載の楽曲一致判定装置。
  5. 楽曲コンテンツを取得する第1取得部と、
    前記第1取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第2取得部と、
    前記第1取得部によって取得された楽曲コンテンツ、及び前記第2取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部と
    を備える楽曲記録装置であって、
    前記第1取得部によって取得された楽曲コンテンツに第1識別情報を付加し、前記第2取得部によって取得された楽曲コンテンツに第2識別情報を付加する識別情報付加部と、
    前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出するカット点検出部と、
    前記カット点検出部によって検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する一致検出部と、
    前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されているか否かを判定する識別情報判定部と、
    前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第1識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除する楽曲コンテンツ削除部と
    を備え
    前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
    前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
    前記一方の楽曲コンテンツのカット点の位置をT0〜TNとし、前記他方の楽曲コンテンツのカット点の位置をS0〜SMとし、
    前記TNのN及び前記SMのMは、1以上の整数であり、
    前記一致検出部は、変数nを0に初期化する第1ステップを実行し、
    前記第1ステップの後に、前記一致検出部は、変数mを0に初期化する第2ステップを実行し、
    前記第2ステップの後に、前記一致検出部は、||T(n+1)−Tn|−|S(m+1)−Sm||が所定の閾値であるσよりも小さいか判定する第3ステップを実行し、
    前記第3ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合、前記一致検出部は、前記変数mをインクリメントする第4ステップを実行し、
    前記第4ステップの後に、前記一致検出部は、前記変数mが前記Mよりも大きいか否かを判定する第5ステップを実行し、
    前記第5ステップにおいて、前記変数mが前記M以下であると判定した場合、前記一致検出部は、前記第3ステップを実行し、
    前記第5ステップにおいて、前記変数mが前記Mよりも大きいと判定した場合、前記一致検出部は、前記変数nをインクリメントする第6ステップを実行し、
    前記第6ステップの後に、前記一致検出部は、前記変数nが前記Nよりも大きいか否かを判定する第7ステップを実行し、
    前記第7ステップにおいて、前記変数nが前記変数N以下であると判定した場合、前記一致検出部は、前記第2ステップを実行し、
    前記第3ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合、前記一致検出部は、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいか否かを判定する第8ステップを実行し、
    前記第8ステップにおいて、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいと判定した場合、前記一致検出部は、前記変数n及び前記変数mをインクリメントする第9ステップを実行し、
    前記第9ステップの後に、前記一致検出部は、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいか判定する第10ステップを実行し、
    前記第10ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合、前記一致検出部は、前記第8ステップを実行し、
    前記第10ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合、前記一致検出部は、前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第11ステップを実行し、
    前記第7ステップにおいて、前記変数nが前記Nよりも大きいと判定した場合、前記一致検出部は、前記第11ステップを実行し、
    前記第8ステップにおいて、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方以上であると判定した場合、前記一致検出部は、前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第12ステップを実行することを特徴とする楽曲記録装置。
  6. 前記第1取得部は、放送局から無線で送信される放送信号を受信し、受信した前記放送信号から楽曲コンテンツを取得し、
    前記第2取得部は、楽曲コンテンツを記録する記録媒体から楽曲コンテンツを取得する、又は楽曲コンテンツを配信する配信サーバから通信ネットワークを介して楽曲コンテンツを取得する
    ことを特徴とする請求項5に記載の楽曲記録装置。
  7. 前記一致する複数の楽曲コンテンツに同一の識別情報が付加されている場合、前記一致する複数の楽曲コンテンツに含まれるノイズを検出するノイズ検出部をさらに備え、
    前記楽曲コンテンツ削除部は、前記ノイズ検出部による検出結果に基づき、前記一致する複数の楽曲コンテンツのうちノイズが最も多い楽曲コンテンツを削除することを特徴とする請求項5に記載の楽曲記録装置。
  8. 前記カット点検出部は、前記特徴量として、音声信号のパワー又は周波数の単位時間当たりの変化量を算出することを特徴とする請求項5〜7のいずれか1項に記載の楽曲記録装置。
  9. 前記一致検出部は、前記楽曲コンテンツ記憶部に記憶された楽曲コンテンツのカット点の個数に基づいて、前記一致する複数の楽曲コンテンツを検出することを特徴とする請求項5〜8のいずれか1項に記載の楽曲記録装置。
  10. 前記一致検出部は、前記楽曲コンテンツ記憶部に記憶された楽曲コンテンツのカット点間の時間間隔に基づいて、前記一致する複数の楽曲コンテンツを検出することを特徴とする請求項5〜8のいずれか1項に記載の楽曲記録装置。
  11. 複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出するステップと、
    前記複数の楽曲コンテンツのそれぞれについて、前記カット点に関する情報を記憶するステップと、
    前記記憶されたカット点に関する情報に基づき、前記複数の楽曲コンテンツが一致するか否かを判定するステップと
    を含み、
    前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
    前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
    前記一方の楽曲コンテンツのカット点の位置をT0〜TNとし、前記他方の楽曲コンテンツのカット点の位置をS0〜SMとし、
    前記TNのN及び前記SMのMは、1以上の整数であり、
    前記複数の楽曲コンテンツが一致するか否かを判定するステップは、
    変数nを0に初期化する第1ステップと、
    変数mを0に初期化する第2ステップと、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が所定の閾値であるσよりも小さいか判定する第3ステップと、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合、前記変数mをインクリメントする第4ステップと、
    前記変数mが前記Mよりも大きいか否かを判定する第5ステップと、
    前記変数nをインクリメントする第6ステップと、
    前記変数nが前記Nよりも大きいか否かを判定する第7ステップと、
    前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいか否かを判定する第8ステップと、
    前記変数n及び前記変数mをインクリメントする第9ステップと、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいか判定する第10ステップと、
    前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第11ステップと、
    前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第12ステップと、を含み、
    前記第2ステップは、前記第1ステップの後、及び、前記第7ステップにおいて、前記変数nが前記変数N以下であると判定した場合に行われ、
    前記第3ステップは、前記第2ステップの後、及び、前記第5ステップにおいて、前記変数mが前記M以下であると判定した場合に行われ、
    前記第4ステップは、前記第3ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合に行われ、
    前記第5ステップは、前記第4ステップの後に行われ、
    前記第6ステップは、前記第5ステップにおいて、前記変数mが前記Mよりも大きいと判定した場合に行われ、
    前記第7ステップは、前記第6ステップの後に行われ、
    前記第8ステップは、前記第3ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合、及び、前記第10ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合に行われ、
    前記第9ステップは、前記第8ステップにおいて、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいと判定した場合に行われ、
    前記第10ステップは、前記第9ステップの後に行われ、
    前記第11ステップは、前記第7ステップにおいて、前記変数nが前記Nよりも大きいと判定した場合、及び、前記第10ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合に行われ、
    前記第12ステップは、前記第8ステップにおいて、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方以上であると判定した場合に行われることを特徴とする楽曲一致判定方法。
  12. 楽曲コンテンツを取得する第1取得部と、
    前記第1取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第2取得部と、
    前記第1取得部によって取得された楽曲コンテンツ、及び前記第2取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部と
    を用いた楽曲記録方法であって、
    前記第1取得部によって取得された楽曲コンテンツに第1識別情報を付加し、前記第2取得部によって取得された楽曲コンテンツに第2識別情報を付加するステップと、
    前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出するとともに、前記特徴量が閾値を超えた時点をカット点として検出するステップと、
    前記検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出するステップと、
    前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されているか否かを判定するステップと、
    前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第1識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除するステップと
    を備え
    前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
    前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
    前記一方の楽曲コンテンツのカット点の位置をT0〜TNとし、前記他方の楽曲コンテンツのカット点の位置をS0〜SMとし、
    前記TNのN及び前記SMのMは、1以上の整数であり、
    前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出するステップは、
    変数nを0に初期化する第1ステップと、
    変数mを0に初期化する第2ステップと、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が所定の閾値であるσよりも小さいか判定する第3ステップと、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合、前記変数mをインクリメントする第4ステップと、
    前記変数mが前記Mよりも大きいか否かを判定する第5ステップと、
    前記変数nをインクリメントする第6ステップと、
    前記変数nが前記Nよりも大きいか否かを判定する第7ステップと、
    前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいか否かを判定する第8ステップと、
    前記変数n及び前記変数mをインクリメントする第9ステップと、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいか判定する第10ステップと、
    前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第11ステップと、
    前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第12ステップと、を含み、
    前記第2ステップは、前記第1ステップの後、及び、前記第7ステップにおいて、前記変数nが前記変数N以下であると判定した場合に行われ、
    前記第3ステップは、前記第2ステップの後、及び、前記第5ステップにおいて、前記変数mが前記M以下であると判定した場合に行われ、
    前記第4ステップは、前記第3ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合に行われ、
    前記第5ステップは、前記第4ステップの後に行われ、
    前記第6ステップは、前記第5ステップにおいて、前記変数mが前記Mよりも大きいと判定した場合に行われ、
    前記第7ステップは、前記第6ステップの後に行われ、
    前記第8ステップは、前記第3ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合、及び、前記第10ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合に行われ、
    前記第9ステップは、前記第8ステップにおいて、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいと判定した場合に行われ、
    前記第10ステップは、前記第9ステップの後に行われ、
    前記第11ステップは、前記第7ステップにおいて、前記変数nが前記Nよりも大きいと判定した場合、及び、前記第10ステップにおいて、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合に行われ、
    前記第12ステップは、前記第8ステップにおいて、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方以上であると判定した場合に行われることを特徴とする楽曲記録方法。
  13. コンピュータに、
    複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出する手順と、
    前記複数の楽曲コンテンツのそれぞれについて、前記カット点に関する情報を記憶する手順と、
    前記記憶されたカット点に関する情報に基づき、前記複数の楽曲コンテンツが一致するか否かを判定する手順と
    を実行させ
    前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
    前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
    前記一方の楽曲コンテンツのカット点の位置をT0〜TNとし、前記他方の楽曲コンテンツのカット点の位置をS0〜SMとし、
    前記TNのN及び前記SMのMは、1以上の整数であり、
    前記複数の楽曲コンテンツが一致するか否かを判定する手順は、
    変数nを0に初期化する第1手順と、
    変数mを0に初期化する第2手順と、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が所定の閾値であるσよりも小さいか判定する第3手順と、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合、前記変数mをインクリメントする第4手順と、
    前記変数mが前記Mよりも大きいか否かを判定する第5手順と、
    前記変数nをインクリメントする第6手順と、
    前記変数nが前記Nよりも大きいか否かを判定する第7手順と、
    前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいか否かを判定する第8手順と、
    前記変数n及び前記変数mをインクリメントする第9手順と、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいか判定する第10手順と、
    前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第11手順と、
    前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第12手順と、を含み、
    前記第2手順を、前記第1手順の後、及び、前記第7手順において、前記変数nが前記変数N以下であると判定した場合に実行させ、
    前記第3手順を、前記第2手順の後、及び、前記第5手順において、前記変数mが前記M以下であると判定した場合に実行させ、
    前記第4手順を、前記第3手順において、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合に実行させ、
    前記第5手順を、前記第4手順の後に実行させ、
    前記第6手順を、前記第5手順において、前記変数mが前記Mよりも大きいと判定した場合に実行させ、
    前記第7手順を、前記第6手順の後に実行させ、
    前記第8手順を、前記第3手順において、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合、及び、前記第10手順において、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合に実行させ、
    前記第9手順を、前記第8手順において、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいと判定した場合に実行させ、
    前記第10手順を、前記第9手順の後に実行させ、
    前記第11手順を、前記第7手順において、前記変数nが前記Nよりも大きいと判定した場合、及び、前記第10手順において、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合に実行させ、
    前記第12手順を、前記第8手順において、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方以上であると判定した場合に実行させることを特徴とする楽曲一致判定プログラム。
  14. 楽曲コンテンツを取得する第1取得部と、
    前記第1取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第2取得部と、
    前記第1取得部によって取得された楽曲コンテンツ、及び前記第2取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部と
    を備える楽曲記録装置として機能するコンピュータに、
    前記第1取得部によって取得された楽曲コンテンツに第1識別情報を付加し、前記第2取得部によって取得された楽曲コンテンツに第2識別情報を付加する手順と、
    前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出するとともに、前記特徴量が閾値を超えた時点をカット点として検出する手順と、
    前記検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する手順と、
    前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されているか否かを判定する手順と、
    前記一致する複数の楽曲コンテンツに前記第1識別情報及び前記第2識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第1識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除する手順と
    を実行させ
    前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
    前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
    前記一方の楽曲コンテンツのカット点の位置をT0〜TNとし、前記他方の楽曲コンテンツのカット点の位置をS0〜SMとし、
    前記TNのN及び前記SMのMは、1以上の整数であり、
    前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する手順は、
    変数nを0に初期化する第1手順と、
    変数mを0に初期化する第2手順と、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が所定の閾値であるσよりも小さいか判定する第3手順と、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合、前記変数mをインクリメントする第4手順と、
    前記変数mが前記Mよりも大きいか否かを判定する第5手順と、
    前記変数nをインクリメントする第6手順と、
    前記変数nが前記Nよりも大きいか否かを判定する第7手順と、
    前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいか否かを判定する第8手順と、
    前記変数n及び前記変数mをインクリメントする第9手順と、
    ||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいか判定する第10手順と、
    前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第11手順と、
    前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第12手順と、を含み、
    前記第2手順を、前記第1手順の後、及び、前記第7手順において、前記変数nが前記変数N以下であると判定した場合に実行させ、
    前記第3手順を、前記第2手順の後、及び、前記第5手順において、前記変数mが前記M以下であると判定した場合に実行させ、
    前記第4手順を、前記第3手順において、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合に実行させ、
    前記第5手順を、前記第4手順の後に実行させ、
    前記第6手順を、前記第5手順において、前記変数mが前記Mよりも大きいと判定した場合に実行させ、
    前記第7手順を、前記第6手順の後に実行させ、
    前記第8手順を、前記第3手順において、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合、及び、前記第10手順において、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σよりも小さいと判定した場合に実行させ、
    前記第9手順を、前記第8手順において、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方よりも小さいと判定した場合に実行させ、
    前記第10手順を、前記第9手順の後に実行させ、
    前記第11手順を、前記第7手順において、前記変数nが前記Nよりも大きいと判定した場合、及び、前記第10手順において、||T(n+1)−Tn|−|S(m+1)−Sm||が前記σ以上であると判定した場合に実行させ、
    前記第12手順を、前記第8手順において、前記変数n又は前記変数mが、前記N又は前記Mのいずれか小さい方以上であると判定した場合に実行させることを特徴とする楽曲記録プログラム。
JP2007210839A 2006-08-14 2007-08-13 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム Expired - Fee Related JP4961300B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007210839A JP4961300B2 (ja) 2006-08-14 2007-08-13 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム
US12/029,643 US7985915B2 (en) 2007-08-13 2008-02-12 Musical piece matching judging device, musical piece recording device, musical piece matching judging method, musical piece recording method, musical piece matching judging program, and musical piece recording program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006221138 2006-08-14
JP2006221138 2006-08-14
JP2007210839A JP4961300B2 (ja) 2006-08-14 2007-08-13 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム

Publications (2)

Publication Number Publication Date
JP2008070868A JP2008070868A (ja) 2008-03-27
JP4961300B2 true JP4961300B2 (ja) 2012-06-27

Family

ID=39292443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007210839A Expired - Fee Related JP4961300B2 (ja) 2006-08-14 2007-08-13 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム

Country Status (1)

Country Link
JP (1) JP4961300B2 (ja)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3433818B2 (ja) * 1993-03-31 2003-08-04 日本ビクター株式会社 楽曲検索装置
JP3388481B2 (ja) * 1995-09-25 2003-03-24 日本電信電話株式会社 音楽情報の曲構成自動抽出方法
US6990453B2 (en) * 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
JP2002271741A (ja) * 2001-03-13 2002-09-20 Matsushita Electric Ind Co Ltd 映像音響コンテンツ編集装置および映像音響コンテンツのインデックス付与方法
US7046914B2 (en) * 2001-05-01 2006-05-16 Koninklijke Philips Electronics N.V. Automatic content analysis and representation of multimedia presentations
JP4398242B2 (ja) * 2001-07-31 2010-01-13 グレースノート インコーポレイテッド 録音の多段階識別方法
JP3886372B2 (ja) * 2001-12-13 2007-02-28 松下電器産業株式会社 音響変節点抽出装置及びその方法、音響再生装置及びその方法、音響信号編集装置、音響変節点抽出方法プログラム記録媒体、音響再生方法プログラム記録媒体、音響信号編集方法プログラム記録媒体、音響変節点抽出方法プログラム、音響再生方法プログラム、音響信号編集方法プログラム
JP4633345B2 (ja) * 2003-07-16 2011-02-16 富士通テン株式会社 音響データ記録方法
JP2005077865A (ja) * 2003-09-02 2005-03-24 Sony Corp 音楽検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体
WO2005101998A2 (en) * 2004-04-19 2005-11-03 Landmark Digital Services Llc Content sampling and identification
US7446252B2 (en) * 2004-06-30 2008-11-04 Matsushita Electric Industrial Co., Ltd. Music information calculation apparatus and music reproduction apparatus
JP2006185575A (ja) * 2004-11-30 2006-07-13 Matsushita Electric Ind Co Ltd コンテンツ記録装置

Also Published As

Publication number Publication date
JP2008070868A (ja) 2008-03-27

Similar Documents

Publication Publication Date Title
US8426715B2 (en) Client-side audio signal mixing on low computational power player using beat metadata
US7531735B2 (en) Musical piece extraction program, apparatus, and method
JP2005322401A (ja) メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム
US8682132B2 (en) Method and device for detecting music segment, and method and device for recording data
US8190441B2 (en) Playback of compressed media files without quantization gaps
US20060285818A1 (en) Information processing apparatus, method, and program
JP2004191780A (ja) 音響信号処理装置及び方法、信号記録装置及び方法、並びにプログラム
JP2009015119A (ja) サビ位置検出装置
US7714223B2 (en) Reproduction device, reproduction method and computer usable medium having computer readable reproduction program emodied therein
CN101540184B (zh) 数据再现方法及其设备
JP4877811B2 (ja) 特定区間抽出装置、音楽記録再生装置、音楽配信システム
US7985915B2 (en) Musical piece matching judging device, musical piece recording device, musical piece matching judging method, musical piece recording method, musical piece matching judging program, and musical piece recording program
JP4278667B2 (ja) 楽曲結合装置、楽曲結合方法、及び楽曲結合プログラム
JP2011090290A (ja) 楽曲抽出装置および楽曲録音装置
JP4990375B2 (ja) 記録再生装置
JP4961300B2 (ja) 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム
US8374712B2 (en) Gapless audio playback
JP2006270233A (ja) 信号処理方法及び信号記録再生装置
JP2004334160A (ja) 特徴量抽出装置
JP2010078984A (ja) 楽曲抽出装置および楽曲記録装置
KR102431737B1 (ko) 멀티미디어 데이터에서 하이라이트를 찾는 방법 및 그를 이용한 장치
JP2005274991A (ja) 楽曲データ格納装置および重複楽曲削除方法
JP2004134010A (ja) 音楽情報記録再生装置
JP2007279241A (ja) 復号処理装置
US20230197114A1 (en) Storage apparatus, playback apparatus, storage method, playback method, and medium

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080118

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20080201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120326

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees